Control - Estado TiempO cOntinuO

Depto.
de Ingenier de Sistemas y Automtica a a
APUNTES DE INGENIER DE CONTROL IA
ANALISIS Y CONTROL DE SISTEMAS EN ESPACIO DE ESTADO IDENTIFICACION DE SISTEMAS CONTROL ADAPTATIVO CONTROL PREDICTIVO
Daniel Rodr guez Ram rez Carlos Bordns Alba o
Rev. 5/05/2005
Indice general
Lista de guras
IX
1. Control de sistemas discretos en el espacio de estados 1.1. Representacin de sistemas discretos en el espacio de estados . . . . . . o 1.2. Obtencin de la representacin de en espacio de estados de sistemas o o discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1. Mtodo de programacin directa . . . . . . . . . . . . . . . . . . e o 1.2.2. Mtodo de programacin anidada . . . . . . . . . . . . . . . . . e o 1.3. La representacin en espacio de estados de un sistema no es unica . . . o 1.4. Resolucin de las ecuaciones del espacio de estados . . . . . . . . . . . o 1.4.1. Procedimiento recursivo . . . . . . . . . . . . . . . . . . . . . . 1.4.2. Matriz de transicin de estados . . . . . . . . . . . . . . . . . . o 1.4.3. Mtodo basado en la transformada Z . . . . . . . . . . . . . . . e 1.4.3.1. Procedimiento alternativo para calcular (zI G)1 . . 1.5. Discretizacin de las ecuaciones de estado continuas . . . . . . . . . . . o 1.6. Controlabilidad y Observabilidad . . . . . . . . . . . . . . . . . . . . . i
1 1
2 3 5 6 7 7 8 9 10 12 15
ii
INDICE GENERAL
1.6.1. Controlabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.2. Controlabilidad de la salida completa . . . . . . . . . . . . . . . 1.6.3. Observabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6.4. Principio de Dualidad . . . . . . . . . . . . . . . . . . . . . . . 1.7. Transformacin de un sistema en formas cannicas o o . . . . . . . . . . .
15 17 17 19 19 20 20 21
1.7.1. Obtencin de la forma cannica controlable . . . . . . . . . . . o o 1.7.2. Obtencin de la forma cannica observable . . . . . . . . . . . . o o 1.8. Colocacin de polos mediante realimentacin del vector de estados . . . o o 1.8.1. Condicin necesaria y suciente para la colocacin arbitraria de o o polos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.8.2. Procedimientos para calcular K . . . . . . . . . . . . . . . . . . 1.8.2.1. Procedimiento alternativo: la frmula de Ackermann . o 1.8.3. Control Dead-Beat . . . . . . . . . . . . . . . . . . . . . . . . . 1.9. Observadores del estado . . . . . . . . . . . . . . . . . . . . . . . . . . 1.9.1. Procedimiento iterativo para la estimacin del estado . . . . . . o 1.9.2. Observador del estado completo . . . . . . . . . . . . . . . . . . 1.9.2.1. Clculo de Ke . . . . . . . . . . . . . . . . . . . . . . . a 1.9.2.2. Comentarios acerca del papel de Ke . . . . . . . . . .
21 22 24 24 27 28 30 32 34 35 36 41
1.9.2.3. Efectos de la adicin del observador . . . . . . . . . . . o 1.9.3. Observador de orden m nimo . . . . . . . . . . . . . . . . . . . . 1.10. Control optimo LQR . . . . . . . . . . . . . . . . . . . . . . . . . . . .
INDICE GENERAL
iii
1.10.1. Solucin de la ecuacin de Riccatti . . . . . . . . . . . . . . . . o o 1.11. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
43 43
2. Modelos de procesos y perturbaciones 2.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 2.2. Perturbaciones deterministas a trozos . . . . . . . . . . . . . . . . . . . 2.3. Procesos estocsticos . . . . . . . . . . . . . . . . . . . . . . . . . . . . a 2.4. Modelos de procesos con ruidos . . . . . . . . . . . . . . . . . . . . . .
45 45 46 46 48
3. Introduccin a la identicacin de sistemas o o 3.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . o 3.2. Ideas bsicas sobre identicacin de sistemas . . . . . . . . . . . . . . . a o 3.2.1. Planicacin de los experimentos . . . . . . . . . . . . . . . . . o 3.2.2. Seleccin del tipo de modelo . . . . . . . . . . . . . . . . . . . . o 3.2.3. Eleccin de un criterio . . . . . . . . . . . . . . . . . . . . . . . o 3.2.4. Estimacin de los parmetros . . . . . . . . . . . . . . . . . . . o a 3.2.4.1. Identicacin en l o nea . . . . . . . . . . . . . . . . . . 3.2.4.2. Identicacin fuera de l o nea . . . . . . . . . . . . . . . 3.2.5. Validacin del modelo . . . . . . . . . . . . . . . . . . . . . . . o 3.2.6. Resumen del proceso de identicacin . . . . . . . . . . . . . . . o 3.3. Algunas propiedades . . . . . . . . . . . . . . . . . . . . . . . . . . . .
51 51 52 52 53 54 54 54 55 55 57 58
iv
INDICE GENERAL
3.3.1. Excitacin persistente . . . . . . . . . . . . . . . . . . . . . . . o 3.3.2. Convergencia e identicabilidad . . . . . . . . . . . . . . . . . . 3.3.2.1. Identicacin en bucle cerrado . . . . . . . . . . . . . . o 3.3.3. Niveles de supervisin y acondicionamiento . . . . . . . . . . . . o
58 59 60 62
4. Identicacin por m o nimos cuadrados 4.1. El mtodo de los m e nimos cuadrados . . . . . . . . . . . . . . . . . . . 4.2. Algoritmo recursivo para identicacin en linea . . . . . . . . . . . . . o 4.3. Interpretacin estad o stica . . . . . . . . . . . . . . . . . . . . . . . . . . 4.4. M nimos cuadrados ponderados . . . . . . . . . . . . . . . . . . . . . . 4.5. M nimos cuadrados extendidos y generalizados . . . . . . . . . . . . . . 4.6. Estimacin de los valores de continua . . . . . . . . . . . . . . . . . . . o 4.6.1. Utilizacin de los incrementos de las variables . . . . . . . . . . o 4.6.2. Clculo de los valores medios . . . . . . . . . . . . . . . . . . . a 4.6.3. Estimacin de una constante . . . . . . . . . . . . . . . . . . . . o 4.7. Importancia del orden del modelo . . . . . . . . . . . . . . . . . . . . . 4.8. Identicacin de sistemas con retardo o no lineales . . . . . . . . . . . . o 4.9. Consideraciones nales . . . . . . . . . . . . . . . . . . . . . . . . . . .
63 63 65 67 70 71 72 73 73 73 74 77 78
5. Introduccin al control adaptativo o 5.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . .
81 81
INDICE GENERAL
5.1.1. Clasicacin grosso modo de los sistemas de control adaptativo . o 5.2. Justicacin del uso de control adaptativo . . . . . . . . . . . . . . . . o 5.3. Control adaptativo por modelo de referencia (MRAC) . . . . . . . . . . 5.3.1. La regla del MIT . . . . . . . . . . . . . . . . . . . . . . . . . .
82 84 87 89
6. Reguladores Autoajustables (STR) 6.1. Introduccin. Estructura general de los STR . . . . . . . . . . . . . . . o 6.1.1. Algoritmos con estructura impl cita y expl cita . . . . . . . . . . 6.2. Control por M nima Varianza . . . . . . . . . . . . . . . . . . . . . . . 6.2.1. El regulador de m nima varianza generalizado . . . . . . . . . .
93 93 95 96 99
6.3. Asignacin de polos y ceros . . . . . . . . . . . . . . . . . . . . . . . . 100 o 6.3.1. Algoritmo con estructura impl cita. . . . . . . . . . . . . . . . . 103 6.3.2. Algoritmo con estructura expl cita . . . . . . . . . . . . . . . . . 104
7. Controladores PID con autoajuste y Ajuste por tabla
105
7.1. Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 o 7.2. Funcin de autoajuste (autotuning) . . . . . . . . . . . . . . . . . . . . 105 o 7.3. Funciones de autoajuste para PIDs . . . . . . . . . . . . . . . . . . . . 107 7.3.1. Tcnicas de ajuste basadas en la respuesta transitoria . . . . . . 108 e 7.3.2. Mtodos basados en las oscilaciones producidas al realimentar e con un rel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 e 7.4. La tcnica de ajuste por tabla o gain scheduling . . . . . . . . . . . . . 110 e
vi
INDICE GENERAL
7.5. Controladores adaptativos industriales . . . . . . . . . . . . . . . . . . 113 7.5.1. SattControl ECA40 y Fisher-Rosemount DPR900 . . . . . . . . 115 7.5.2. Foxboro EXACT . . . . . . . . . . . . . . . . . . . . . . . . . . 115 7.5.3. ABB Novatune . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
8. Control Predictivo Basado en Modelo (MPC)
117
8.1. Perspectiva histrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 o 8.2. Conceptos bsicos de control predictivo . . . . . . . . . . . . . . . . . . 118 a 8.3. Estrategia de los controladores predictivos . . . . . . . . . . . . . . . . 119 8.4. Elementos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121 a 8.4.1. Modelo de prediccin . . . . . . . . . . . . . . . . . . . . . . . . 122 o 8.4.1.1. Respuestas libre y forzada . . . . . . . . . . . . . . . . 125 8.4.2. Funcin objetivo . . . . . . . . . . . . . . . . . . . . . . . . . . 126 o 8.4.3. Obtencin de la ley de control . . . . . . . . . . . . . . . . . . . 129 o 8.5. Revisin de los principales algoritmos . . . . . . . . . . . . . . . . . . . 130 o 8.5.0.1. Dynamic Matrix Control . . . . . . . . . . . . . . . . . 130 8.5.0.2. Model Algorithmic Control . . . . . . . . . . . . . . . 131 8.5.0.3. Predictive Functional Control . . . . . . . . . . . . . . 131 8.5.0.4. Extended Prediction Self Adaptive Control . . . . . . 132
8.5.0.5. Extended Horizon Adaptive Control . . . . . . . . . . 133 8.5.0.6. Generalized Predictive Control . . . . . . . . . . . . . 134
INDICE GENERAL
vii
9. Controladores predictivos
135
9.1. Dynamic Matrix Control . . . . . . . . . . . . . . . . . . . . . . . . . . 135 9.1.1. Prediccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135 o 9.1.2. Perturbaciones medibles . . . . . . . . . . . . . . . . . . . . . . 137 9.1.3. Algoritmo de control . . . . . . . . . . . . . . . . . . . . . . . . 138 9.1.3.1. El caso con restricciones . . . . . . . . . . . . . . . . . 140 9.1.3.2. Extensin al caso multivariable . . . . . . . . . . . . . 141 o 9.2. Control Predictivo Generalizado . . . . . . . . . . . . . . . . . . . . . . 141 9.2.1. Formulacin del Control Predictivo Generalizado . . . . . . . . 142 o 9.2.1.1. Prediccin optima . . . . . . . . . . . . . . . . . . . . 143 o 9.2.1.2. Obtencin de la ley de control . . . . . . . . . . . . . . 146 o 9.2.2. Ejemplo de clculo . . . . . . . . . . . . . . . . . . . . . . . . . 147 a 9.2.3. Caso multivariable . . . . . . . . . . . . . . . . . . . . . . . . . 149
10.Otros aspectos del Control Predictivo
151
10.1. Restricciones en Control Predictivo . . . . . . . . . . . . . . . . . . . . 151 10.1.1. Tratamiento convencional de restricciones . . . . . . . . . . . . 151 10.1.2. Restricciones en Control Predictivo . . . . . . . . . . . . . . . . 153 10.1.3. Resolucin del problema . . . . . . . . . . . . . . . . . . . . . . 155 o 10.1.4. Gestin de restricciones o . . . . . . . . . . . . . . . . . . . . . . 156
10.1.4.1. Tcnicas de bsqueda de soluciones factibles . . . . . . 157 e u
viii
INDICE GENERAL
Indice de guras
1.1. Diagrama de bloques de la representacin en espacio de estados de un o sistema LTI. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Diagrama de bloques de un sistema controlado por una realimentacin o del vector de estados. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
21
1.3. Diagrama de bloques de un sistema LTI controlado mediante una realimentacin del vector de estados que estima el estado con un observador. 31 o 1.4. Diagrama de bloques de un observador de orden completo. . . . . . . . 31
2.1. Procesos estocsticos: realizaciones y variables aleatorias. a
. . . . . . .
47 48
2.2. Modelo de Box-Jenkins. . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1. Esquema de la identicacin en l o nea.
. . . . . . . . . . . . . . . . . .
55 57 59
3.2. Diagrama de ujo del proceso de identicacin. . . . . . . . . . . . . . o 3.3. Ejemplo de seal de entrada del tipo PRBSS. . . . . . . . . . . . . . . n
4.1. Diagrama de ujo del proceso de identicacin mediante m o nimos cuadrados recursivos. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2. Diagrama de Bode de un sistema de segundo orden (linea continua) y de un modelo de primer orden estimado para una entrada senoidal de frecuencia = 0,2 rad s1 . . . . . . . . . . . . . . . . . . . . . . . . ix
67
75
INDICE DE FIGURAS
4.3. Misma situacin que en la gura 4.2 pero con una seal de entrada o n 1 senoidal de frecuencia = 1 rad s . . . . . . . . . . . . . . . . . . .
75
4.4. Evolucin de los parmetros identicados en un caso de sobreparametrizacin. o a o 76 4.5. Evolucin de unos parmetros frente a otros para el modelo sobreparametrizao a do. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.1. Conguracin genrica de un controlador adaptativo. . . . . . . . . . . o e 5.2. Sistema realimentado con actuador con caracter stica v = f (u). 5.3. Sistema realimentado con actuador con caracter stica v = f (u). . . . . . . . .
82 84 85
5.4. Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.1). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.5. Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.2). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.6. Conguracin genrica de un controlador adaptativo por modelo de reo e ferencia (MRAC). . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
86
87
88
6.1. Conguracin genrica de un regulador o controlador autoajustable. o e 6.2. Conguracin genrica de un regulador o controlador autoajustable. o e 6.3. Divisin de polinomios para el ejemplo 6.2. o
. .
94 95 99
. . . . . . . . . . . . . . .
6.4. Estructura para la asignacin de polos y ceros. o
. . . . . . . . . . . . . 101
7.1. PID industrial moderno con funcin de autoajuste (ABB modelo ECA). 107 o 7.2. Determinacin de T y L por areas. . . . . . . . . . . . . . . . . . . . . 109 o 7.3. Estructura usada en el mtodo basado en oscilaciones de rel. . . . . . 110 e e
INDICE DE FIGURAS
xi
7.4. Conguracin genrica de un controlador adaptativo con adaptacin en o e o bucle abierto. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 7.5. Curva de pH para una solucin de HCl 0.001 M y NaOH 0.001 M. o 7.6. Caracter stica aproximada de una sonda lambda . . 112
. . . . . . . . . . . . 113
7.7. La herramienta Novatune se comercializa actualmente con el sistema Advant 410 de ABB. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
8.1. Estrategia del Control Predictivo . . . . . . . . . . . . . . . . . . . . . 120 8.2. Estructura bsica del MPC . . . . . . . . . . . . . . . . . . . . . . . . . 121 a 8.3. Respuesta impulsional y ante escaln . . . . . . . . . . . . . . . . . . . 123 o 8.4. Respuestas libre y forzada . . . . . . . . . . . . . . . . . . . . . . . . . 126 8.5. Trayectoria de referencia . . . . . . . . . . . . . . . . . . . . . . . . . . 128 8.6. Puntos de coincidencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.1. Ley de control . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139 9.2. Punto de operacin optimo de un proceso t o pico . . . . . . . . . . . . . 140
10.1. Restricciones y punto de operacin optimo . . . . . . . . . . . . . . . . 152 o 10.2. Restricciones en la seal de control . . . . . . . . . . . . . . . . . . . . 153 n 10.3. Gestin de restricciones . . . . . . . . . . . . . . . . . . . . . . . . . . . 157 o
xii
INDICE DE FIGURAS
Cap tulo 1 Control de sistemas discretos en el espacio de estados

1.1. Representacin de sistemas discretos en el eso pacio de estados
El mtodo de espacio de estados est basado en la descripcin del sistema mediante e a o n ecuaciones en diferencias, que se agrupan en una ecuacin vectorial matricial en o diferencias.
Denicin 1.1 Concepto de estado: El estado de un sistema dinmico es el cono a junto ms pequeo de variables (llamadas variables de estado) tal que, el conocimiento a n de esas variables en un determinado instante t0 junto con el conocimiento de los valores de la seal de entrada para los instantes t t0 , permite determinar el comportamiento n y evolucin del sistema para cualquier instante de tiempo t t0 . o
Las variables de estado se agrupan en el llamado vector de estado y el espacio ndimensional que determinan los posibles valores de esas variables, se denomina espacio de estados. La dinmica de un sistema se puede describir en funcin del valor del vector de a o estados y de la seal de entrada (asumiendo que el sistema es no autnomo mediante n o 1
2OBTENCION DE LA REPRESENTACION DE EN ESPACIO DE ESTADOS DE SISTEMAS DISCRETOS
unas ecuaciones que tendrn la forma: a x(k + 1) = f (x(k), u(k), k) y(k) = g(x(k), u(k), k) donde la notacin (k) indica el valor tomado por en el instante de tiempo tk y f y g o pueden ser cualquier tipo de funcin. No obstante en esta asignatura nos centraremos o en los Sistemas Lineales e Invariantes en el tiempo (LTI). Este tipo de sistemas son descritos mediante las siguientes ecuaciones: x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k) + Du(k) que corresponder al diagrama de bloques: an (1.1)
u(k)
x(k+1) +
z-1
x(k)
G
Figura 1.1: Diagrama de bloques de la representacin en espacio de estados de un sistema LTI. o
1.2.
Obtencin de la representacin de en espacio o o de estados de sistemas discretos
Partiremos de un sistema discreto descrito por: y(k)+a1 y(k1)+a2 y(k2)+ +an y(kn) = b0 u(k)+b1 u(k1)+ +bn u(kn) (1.2) Es bien conocido de anteriores temas de la asignatura que este sistema puede ser descrito por la siguiente funcin de transferencia: o G(z) = Y (z) b0 + b1 z 1 + b2 z 2 + + bn z n = U (z) 1 + a1 z 1 + a2 z 2 + + an z n (1.3)
A continuacin se expondrn dos de los mtodos disponibles para obtener la repreo a e sentacin en espacio de estados del sistema descrito por (1.3). o
CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS
1.2.1.
Mtodo de programacin directa e o
Parte de la premisa que la funcin de transferencia (1.3) puede reescribirse como: o G(z) = b0 + (b1 a1 b0 )z 1 + (b2 a2 b0 )z 2 + + (bn an b0 )z n 1 + a1 z 1 + a2 z 2 + + an z n
Y (z) U (z)
(1.4)
teniendo en cuenta que G(z) = Y (z) = b0 U (z) +
se obtiene: (1.5)
(b1 a1 b0 )z 1 + (b2 a2 b0 )z 2 + + (bn an b0 )z n U (z) 1 + a1 z 1 + a2 z 2 + + an z n
que a su vez se puede expresar como: Y (z) = b0 U (z) + Y (z)U (z) con: (1.6)
(b1 a1 b0 )z 1 + (b2 a2 b0 )z 2 + + (bn an b0 )z n (1.7) Y (z) = 1 + a1 z 1 + a2 z 2 + + an z n Por otra parte, teniendo en cuenta la expresin de Y (z) se puede denir un Q(z) que o cumple que: Q(z) = Y (z) U (z) = 1 + + (b a b )z n 1 + + a z n (b1 a1 b0 )z 1 + a1 z n n 0 n (1.8)
De ah se obtiene que: Q(z) = a1 z 1 Q(z) a2 z 2 Q(z) an z n Q(z) + U (z) (1.9)
Y (z) = (b1 a1 b0 )z 1 Q(z) + (b2 a2 b0 )z 2 Q(z) + + (bn an b0 )z n Q(z) (1.10) A continuacin se eligen las variables de estado como: o X1 (z) = z n Q(z) X2 (z) = z Xn (z) = z 1 Q(z) lo que teniendo en cuenta las propiedades de la transformada Z, implica que: zX1 (z) = X2 (z) zX2 (z) = X3 (z) zXn1 (z) = Xn (z)
(n1)
(1.11)
Q(z)
4OBTENCION DE LA REPRESENTACION DE EN ESPACIO DE ESTADOS DE SISTEMAS DISCRETOS
lo que a su vez equivale a: x1 (k + 1) = x2 (k) x2 (k + 1) = x3 (k) xn1 (k + 1) = xn (k) Ntese que segn la ultima igualdad de (1.11) se tiene que Q(z) = zXn (z), luego o u teniendo en cuenta esto y el resto de las igualdades de (1.11) podemos reescribir la expresin de Q(z) en (1.9) como: o zXn (z) = a1 Xn (z) a2 Xn1 (z) an X1 (z) + U (z) o lo que es lo mismo: xn (k + 1) = an x1 (k) an1 x2 (k) a1 xn (k) + u(k) (1.14) (1.13) (1.12)
De esta manera y si tenemos en cuenta (1.12) obtenemos la siguiente expresin de la o ecuacin de estado: o x1 (k + 1) 0 1 0 0 x1 (k) 0 x2 (k + 1) 0 0 1 0 x2 (k) 0 . . . . . . . . . . . . . = . + . u(k) . . . . . . xn1 (k + 1) 0 0 0 1 xn1 (k) 0 xn (k + 1) an an1 an2 a1 xn (k) 1 (1.15) Por otra parte, podemos reescribir tambin (1.10) teniendo en cuenta las igualdades e de (1.11) de manera que: Y (z) = (b1 a1 b0 )Xn (z) + (b2 a2 b0 )Xn1 (z) + + (bn an b0 )X1 (z) (1.16)
Esto se puede llevar a la ecuacin (1.6) de manera que antitransformando se obtiene: o y(k) = (bn an b0 )x1 (k) + (bn1 an1 b0 )x2 (k) + + (b1 a1 b0 )xn (k) + b0 u(k) (1.17) lo cual se puede escribir como: xn1 (k) xn (k) x1 (k) x2 (k) . . . + b0 u(k)
y(k) =
bn an b0 bn1 an1 b0 b1 a1 b0
(1.18)
Las ecuaciones (1.15) y (1.18) forman una representacin en espacio de estados del o sistema descrito por la funcin de transferencia (1.3) que se denomina forma cannica o o controlable.
1.2.2.
Mtodo de programacin anidada e o
En este caso se parte de que de la funcin de transferencia (1.3) se obtiene la o siguiente ecuacin: o Y (z) b0 U (z) + z 1 (a1 Y (z) b1 U (z)) + + z n (an Y (z) bn U (z)) = 0 que a su vez se puede reescribir como: Y (z) = b0 U (z) + z 1 b1 U (z) a1 Y (z) + z 1 (b2 U (z) a2 Y (z) +z 1 (b3 U (z) a3 Y (z) + ) Teniendo en cuenta esto se denen las siguientes variables de estado: Xn (z) = z 1 (b1 U (z) a1 Y (z) + Xn1 (z)) Xn1 (z) = z 1 (b2 U (z) a2 Y (z) + Xn2 (z)) . . . X2 (z) = z 1 (bn1 U (z) an1 Y (z) + X1 (z)) X1 (z) = z 1 (bn U (z) an Y (z)) Ntese que segn esta denicin de las variables de estado la expresin (1.20) se puede o u o o reescribir en forma condensada como: Y (z) = b0 U (z) + Xn (z) (1.22) (1.21) (1.20) (1.19)
Sustituyendo esta expresin en la denicin de las variables de estado (1.21) y multio o plicando por z en ambos lados de cada igualdad se obtiene: zXn (z) = Xn1 (z) a1 Xn (z) + (b1 a1 b0 )U (z) zXn1 (z) = Xn2 (z) a2 Xn (z) + (b2 a2 b0 )U (z) . . . zX2 (z) = X1 (z) an1 Xn (z) + (bn1 an1 b0 )U (z) zX1 (z) = an Xn (z) + (bn an b0 )U (z) Antitransformando lo anterior: x1 (k + 1) = an xn (k) + (bn an b0 )u(k) x2 (k + 1) = x1 (k) an1 xn (k) + (bn1 an1 b0 )u(k) . . . xn1 (k + 1) = xn2 (k) a2 xn (k) + (b2 a2 b0 )u(k) xn (k + 1) = xn1 (k) a1 xn (k) + (b1 a1 b0 )u(k) (1.23)
LA REPRESENTACION EN ESPACIO DE ESTADOS DE UN SISTEMA NO ES UNICA
Antitransformando tambin la expresin (1.22) se obtiene: e o y(k) = xn (k) + b0 u(k) Finalmente, agrupando las 0 x1 (k + 1) 1 x2 (k + 1) . . . = . . . 0 xn1 (k + 1) xn (k + 1) y(k) = (1.24)
A esta representacin en espacio de estados del sistema descrito por la funcin de o o transferencia (1.3) se la denomina forma cannica observable. o
dos expresiones anteriores se obtiene: bn a n b0 x1 (k) 0 0 0 an x2 (k) bn1 an1 b0 0 0 0 an1 . . . . . . . . . . . . + . . . . . . 0 1 0 a2 xn1 (k) b2 a2 b0 b1 a 1 b0 xn (k) 0 0 0 1 a1 x1 (k) x2 (k) . . 0 0 0 1 + b0 u(k) . xn1 (k) xn (k)
u(k) (1.25)
1.3.
La representacin en espacio de estados de un o sistema no es unica
Se ha comprobado que a un mismo sistema descrito por su funcin de transferencia o le corresponden, al menos, dos representaciones en espacio de estado distintas. De hecho, la representacin en espacio de estados de un sistema no es unica. Por ejemplo, o podemos tomar otras variables de estado que describan la dinmica del sistema que a sean a su vez combinaciones lineales de las variables de estado originales, o considerar que stas son a su vez combinaciones lineales de otras. Dicho de otro modo, dado un e sistema LTI como el descrito en (1.1) podemos considerar que el vector de estado x(k) est relacionado con otro vector x(k) con variables de estado distintas mediante una a transformacin: o x(k) = P x(k) (1.26) donde P es una matriz invertible. Esto se puede llevar a la ecuacin de estado del o sistema de manera que obtendr amos: P x(k + 1) = GP x(k) + Hu(k) Premultiplicando por P 1 : x(k + 1) = P 1 GP x(k) + P 1 Hu(k)
por lo que la ecuacin de estado se puede expresar como: o x x(k + 1) = G(k) + Hu(k) (1.27)
con G = P 1 GP y H = P 1 H. De la misma manera la ecuacin, de la salida del o sistema se puede expresar como: y(k) = C x(k) + Du(k) (1.28)
con C = CP y D = D. As pues, las ecuaciones (1.27) y (1.28) describen una repre sentacin del sistema en espacio de estados que es diferente de la original pero equivao lente a ella1 .
1.4.
Resolucin de las ecuaciones del espacio de eso tados
En esta seccin se trata el tema de la resolucin de las ecuaciones de estado. Es o o decir, se presentarn procedimientos para obtener el valor del vector de estado para a un determinado instante de tiempo k > 0 a partir del valor de x(0), es decir, del valor inicial del vector de estados.
1.4.1.
Procedimiento recursivo
Iterando las ecuaciones del estado para un sistema LTI como (1.1) a partir de k = 0: x(1) = Gx(0) + Hu(0) x(2) = Gx(1) + Hu(1) = G2 x(0) + GHu(0) + Hu(1) x(3) = Gx(2) + Hu(2) = G3 x(0) + G2 Hu(0) + GHu(1) + Hu(2) . . . generalizando para cualquier k > 0:
k1
x(k) = G x(0) +
j=0
1
Gkj1 Hu(j)
(1.29)
Obsrvese que en la ecuacin (1.28) el estado aparece con indicando que el vector de estados e o , es diferente al original. La salida sin embargo si coincide con la del sistema original pues ambas representaciones son equivalentes.
RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS
Obsrvese que x(k) depende del estado inicial y de los valores de la entrada. Por otra e parte, la salida se puede expresar como:
k1
y(k) = CG x(0) + C
j=0
Gkj1 Hu(j) + Du(k)
(1.30)
1.4.2.
Matriz de transicin de estados o
Considrese la ecuacin: e o x(k + 1) = Gx(k) (1.31)
En este caso, al no tener seal de entrada la solucin de la ecuacin viene dada por: n o o x(k) = (k)x(0) con: (k + 1) = G(k) es decir: (k) = Gk A (k) se le llama la matriz de transicin de estados y contiene toda la informacin o o sobre los movimientos libres del sistema descrito por (1.31). Estos movimientos libres se reeren a los cambios de estado o evolucin del estado del sistema en ausencia de o entrada. En trminos de (k) la solucin de la ecuacin de estados para el sistema (1.1) e o o viene dada por:
k1
(0) = I
x(k) = (k)x(0) +
j=0 k1
(k j 1)Hu(j)
(1.32)
= (k)x(0) +
j=0
(j)Hu(k j 1)
lo que lleva a:
k1
y(k) = C(k)x(0) + C
j=0
(j)Hu(k j 1) + Du(k)
(1.33)
1.4.3.
Mtodo basado en la transformada Z e
Aplicando la transformada Z a ambos lados de la ecuacin de estados del sistema o (1.1) se obtiene: zX(z) zx(0) = GX(z) + HU (z) y de ah : (zI G)X(z) = zx(0) + HU (Z) Premultiplicando por (zI G)1 : X(z) = (zI G)1 zx(0) + (zI G)1 HU (Z) y antitransformando: x(k) = Z1 (zI G)1 z x(0) + Z1 (zI G)1 HU (z) Esta ecuacin la podemos comparar con la solucin mediante el procedimiento recursivo o o indicado en la ecuacin (1.29), e identicando trminos tenemos que: o e
k1
G =Z
(zI G) z
y
j=0
Gkj1 Hu(j) = Z1 (zI G)1 HU (z)
(1.34)
La dicultad de este mtodo consiste en realizar la transformada Z de las expresiones e anteriores. Para ilustrar el procedimiento considrese el siguiente ejemplo: e Ejemplo 1.1 Dado un sistema LTI como (1.1) con: G= 0 1 0,16 1 H= 1 1 C= 1 0
Se pide calcular (k) = GK = Z1 {(zI G)1 z}. En primer lugar calculamos: (zI G)1 = = = z 1 0,16 z + 1
z+1 (z+0,2)(z+0,8) 0,16 (z+0,2)(z+0,8) 1 (z+0,2)(z+0,8) z (z+0,2)(z+0,8) 5 1 5 1 3 z+0,8 3 z+0,2 1 4 1 1 z+0,2 + 3 z+0,8 3
1 1 4 1 3 z+0,8 3 z+0,2 1 1 0,8 z+0,2 + 0,8 z+0,8 3 3
(1.35)
10
RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS
Multiplicando lo anterior por z y antitransformando se obtiene: (k) = Gk = Z1 (zI G)1 z =

4 (0,2)k 1 (0,8)k 3 3 0,8 3 (0,2)k + 0,8 (0,8)k 3 5 (0,2)k 5 (0,8)k 3 3 1 3 (0,2)k + 4 (0,8)k 3
(1.36) El ejemplo se puede completar resolviendo completamente la ecuacin de estado y la o de la salida para una seal de entrada dada por: n u(k) = 1 k = 0, 1, 2, x(0) = 1 1
Teniendo en cuenta la transformada Z de la entrada (escaln unitario) y que se sabe o que: X(z) = (zI G)1 [zx(0) + HU (z)] se calcula: zx(0) + HU (z) = z z +
z z1 z z1 z2 z1 z 2 +2z z1
que premultiplicado por el resultado de la ecuacin (1.35) lleva a: o X(z) = y de ahi, antitransformando: x(k) = 17 (0,2)k + 22 (0,8)k + 6 9 3,4 (0,2)k 17,6 (0,8)k + 6 9
25 18 7 18
22 25 z z 17 z 6 9 18 + z+0,8 + z1 z+0,2 3,4 7 z z 17,6 z 6 9 18 + z+0,8 + z1 z+0,2
Finalmente la ecuacin de salida ser: o a y(k) = 1 0 x(k) 17 22 25 = (0,2)k + (0,8)k + 6 9 18
1.4.3.1.
Procedimiento alternativo para calcular (zI G)1
Se observa en el ejemplo 1.1 que gran parte del clculo se emplea en calcular (zI a G) . Esto puede ser muy engorroso cuando el orden de las matrices involucradas es superior a 3. A continuacin se detalla un procedimiento alternativo para esos casos. o En primer lugar es conocido que, por denicin de matriz inversa: o
1
(zI G)1 =
Adj(zI G) |zI G|
11
donde ((Adj)) indica la matriz adjunta. El determinante |zI G| se puede expresar como: |zI G| = z n + a1 z n1 + a2 z n2 + + an Por otra parte se puede demostrar que: Adj(zI G) = Iz n1 + H1 z n2 + H2 z n3 + + Hn1 donde las matrices Hi se calculan mediante: H1 = G + a 1 I H2 = GH1 + a2 I . . . Hn1 = GHn1 + an1 I Hn = GHn1 + an I = 0 y los ai se calculan a su vez como: a1 = traza(G) 1 a2 = traza(GH1 ) 2 1 a3 = traza(GH2 ) 3 . . . 1 an = traza(GHn1 ) n Ejemplo 1.2 A continuacin se calcular la inversa de (zI G) para el ejemplo 1.1 mediante este o a procedimiento alternativo. Dado que el orden de la matriz es n = 2, se tiene que: |zI G| = z 2 + a1 z + a2 Adj(zI G) = Iz + H1 donde: a1 = traza(G) a2 = 1 traza(GH1 ) 2
H1 = G + a 1 I
La traza de G es igual a 1, luego a1 = 1 y de ah se obtiene que H1 = G + I, con lo que se puede calcular: 1 a2 = traza 2 0 1 0,16 1 1 1 0,16 0 = 0,16
12
DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS
con lo que se obtiene: Adj(zI G) = Iz + = Finalmente: (zI G)1 z+1 1 0,16 z = (z + 0,2)(z + 0,8) 1 1 0,16 0 z+1 1 0,16 z
|zI G| = z 2 +z +0,16 = (z +0,2)(z +0,8)
que evidentemente es el mismo resultado obtenido en el ejemplo 1.1.
1.5.
Discretizacin de las ecuaciones de estado cono tinuas
En esta seccin veremos cmo se puede pasar de un modelo en espacio de estado o o continuo a discreto. Se partir de un sistema lineal e invariante en el tiempo continuo: a x = Ax + Bu y = Cx + Du (1.37)
Supondremos que la entrada slo cambia en ciertos instantes igualmente espaciados en o el tiempo, es decir, slo puede cambiar en t = kT , para k = 0, 1, 2, . Al discretizar o la ecuacin de estado sta tomar la forma: o e a x((k + 1)T ) = G(T )x(kT ) + H(T )u(kT ) (1.38)
donde puede observarse que las matrices G y H dependen del tiempo de muestreo T . Para determinar el valor de G(T ) y H(T ) usaremos la solucin de la ecuacin de estado o o en tiempo continuo:
t
x(t) = eAt x(0) + eAt

0
eA Bu( )d
(1.39)
Supondremos que la entrada u(t) es muestreada mediante un mantenedor de orden cero, por lo que se cumple que: u(t) = u(kT ) para kT t kT + T (1.40)
13
Se tiene que:
(k+1)T
x((k + 1)T ) = eA(k+1)T x(0) + eA(k+1)T

0 kT
eA Bu( )d
(1.41) (1.42)
x(kT ) = e
AkT
x(0) + e
AkT 0
eA Bu( )d
Mutiplicando la ecuacin (1.42) por eAT y restndola de la ecuacin (1.41) se obtiene: o a o

(k+1)T
x((k + 1)T ) = eAT x(kT ) + eA(k+1)T

kT
eA Bu( )d
(1.43)
Teniendo en cuenta la suposicin de que u(t) es constante en el intervalo de integracin o o (ver (1.40)) se puede sustituir u( ) por u(kT ). Aplicando esto y operando se llega a:
T
x((k + 1)T ) = eAT x(kT ) + eAT

0 T
eA Bu(kT )d eA Bu(kT )d (1.44)
= eAT x(kT ) +
0
donde = T . Sea:
G(T ) = eAT H(T ) =

T 0
eA d B
(1.45)
entonces la ecuacin (1.44) queda: o x((k + 1)T ) = G(T )x(kT ) + H(T )u(kT ) (1.46)
que es la ecuacin a la que ten o amos que llegar y por tanto se ha obtenido la ecuacin o de estado continuo discretizada. En el caso particular (aunque muy comn, y por tanto interesante) de que A sea u una matriz invertible se tiene que: H(T ) = eAT I A1 B Por otra parte, la ecuacin de la salida al ser discretizada queda: o y(kT ) = Cx(kT ) + Du(kT ) con C, D matrices constantes e iguales a la de la ecuacin en tiempo continuo. o Existen diferentes mtodos para calcular eAT . Quizs el ms sencillo de aplicar e a a cuando se trata de calcular la exponencial con papel y lpiz sea utilizar la equivalencia: a eAt = L1 (sI A)1 (1.48) (1.47)
14
DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS
donde L1 indica la transformada de Laplace inversa. Desde el punto de vista prctico a 1 el mtodo consistir en calcular (sI A) (ntese que puede emplearse el mtodo para e a o e 1 calcular (zI G) dado en la seccin 1.4.3.1) y aplicar a posteriori la transformada o de Laplace inversa a cada elemento de la matriz. Ejemplo 1.3 Se ilustrar en este ejemplo el clculo de eAt siendo: a a A= Para ello se calcula: (sI A) = s 0 0 s 0 1 0 2 = s 1 0 s+2 0 1 0 2
y aplicando los mtodos vistos en la seccin 1.5 y subsiguientes se calcula la inversa: e o (sI A)
1
1 s
1 s(s+2) 1 (s+2)
Finalmente se aplica la transformada inversa de Laplace a cada elemento de la matriz anterior de manera que se obtiene: eAt = L1 (sI A)1 = 1 0
1 (1 2
e2t ) e2t
Ejemplo 1.4 Como ejemplo de discretizacin de las ecuaciones de estado en tiempo continuo, cono sidrese el siguiente sistema: e x = ax + u y = x Usando las expresiones de (1.45) se obtiene: G(T ) = eAT = eaT y H(T ) = = =
T A e d 0 T a e d 0 aT 1e a
15
Luego: x(k + 1) = eaT x(k) + y(k) = x(k)

1eaT a
u(k)
1.6.
Controlabilidad y Observabilidad
En esta seccin se pasan a tratar dos conceptos clave en el estudio de sistemas o dinmicos, la controlabilidad y la observabilidad. El primero se reere a la existencia a de una secuencia de actuaciones para llevar el sistema a un estado arbitrario. Por otro lado, la observabilidad tiene que ver con la posibilidad de determinar el valor del vector de estados de un sistema a partir de observaciones de las salidas y la entradas de dicho sistema. Ambos conceptos se deben a Kalman y son claves en estrategias de control como la colocacin de polos por realimentacin del vector de estados o el control o o optimo.
1.6.1.
Controlabilidad
Denicin 1.2 Un sistema de control es completamente controlable o de estado como pletamente controlable, si es posible transferir al sistema desde un estado inicial arbitrario a cualquier estado deseado en un tiempo nito. Tambin puede decirse que e ser completamente controlable, si cada variable de estado se puede controlar en un a tiempo nito por una seal de control que no est sujeta a ningn tipo de restriccin. n e u o
Como es habitual nos centraremos en el estudio de la controlabilidad de sistemas LTI: x((k + 1)T ) = Gx(kT ) + Hu(kT ) (1.49) siendo la seal u(kT ) constante en el intervalo de tiempo kT t (k + 1)T . En este n caso, la controlabilidad de estado completo implica que existe una seal de control n constante entre cada tiempo de muestreo que transere al sistema, desde un estado x(kT ) cualquiera a un estado deseado xf en como mucho n periodos de muestreo, donde n es el tamao del vector de estados. n Recordemos que la solucin de la ecuacin de estados es: o o
n1
x(nT ) = G x(0) +
j=0
Gnj1 Hu(jT )
16
CONTROLABILIDAD Y OBSERVABILIDAD
= Gn x(0) + Gn1 Hu(0) + Gn2 Hu(T ) + + Hu((n 1)T ) de ah se obtiene: . . . H . GH . . Gn1 H . . . u((n 1)T ) u((n 2)T ) . . . u(0)
x(nT ) Gn x(0) =
(1.50)
donde la matriz Mc =
. . . H . GH . . Gn1 H . . .
(1.51)
es la llamada matriz de controlabilidad . Supngase un estado nal arbitrario x(nT ) = xf . Si el sistema fuera controlable o deber existir un vector de actuaciones que al multiplicarlo por la matriz de controlaa bilidad (1.51) diese como resultado xf Gn x(0). Como xf y x(0) pueden ser cualquier par de valores del vector de estado, es fcil entender que xf Gn x(0) puede ser cualquier a n vector de R . De esto se desprende que para que el sistema sea controlable, el espacio de vectores generado por los vectores que forman la matriz de controlabilidad (es decir, sus columnas) debe ser todo Rn . La condicin necesaria y suciente para que o se cumpla esto es que el rango de la matriz de controlabilidad sea n. Este resultado permite enunciar el siguiente lema. Lema 1.1 Dado un sistema LTI de orden n representado por (1.49), es condicin o necesaria y suciente para que el sistema sea completamente controlable que el rango de la matriz de controlabilidad (1.51) sea igual a n. Comentario 1.1 El sistema que cumpla la condicin establecida en el lema 1.1 poo dr alcanzar cualquier estado como mximo en n periodos de muestreo, pero slo si no a a o existen restricciones sobre la seal de control. En caso contrario, se tardara ms. n a Si el sistema es controlable, se podr determinar la secuencia de valores de la entrada a necesaria para llevar al sistema a xf resolviendo el sistema de ecuaciones (1.50). Por otra parte, la controlabilidad se puede comprobar a partir de la funcin de o transferencia de un sistema observando si hay cancelaciones de polos y ceros. En el caso de que las hubiese, el sistema no ser controlable. Por tanto, el sistema a Y (z) z + 0,2 = U (z) (z + 0,8)(z + 0,2) no ser controlable pues existe una cancelacin de un polo con un cero. a o
17
1.6.2.
Controlabilidad de la salida completa
En control automtico el objetivo ms comn es controlar la evolucin de la salida a a u o del sistema. Se puede demostrar que la controlabilidad del estado no implica la controlabilidad de la salida. Sin embargo, podemos comprobar dicha controlabilidad de una manera anloga a la de la controlabilidad del estado completo. Sea un sistema cuya a ecuacin de estado es (1.49) y la ecuacin de la salida es: o o y(kT ) = Cx(kT ) La condicin para comprobar la controlabilidad de la salida completa ser que o a Rango . . . CH . CGH . . CGn1 H . . . =m (1.53) (1.52)
donde m es el nmero de salidas. Por otra parte, si la ecuacin de la salida es: u o y(kT ) = Cx(kT ) + Du(kT ) la condicin a comprobar ser o a: Rango . . . . D . CH . CGH . . CGn1 H . . . . =m (1.55) (1.54)
Ntese que en esta segunda forma de la ecuacin de salida, la presencia del trmino o o e Du(kT ) no empeora la controlabidad del sistema, sino justo lo contrario. De hecho, al introducirse una columna extra en la matriz de controlabilidad (la correspondiente a D), se puede dar el caso que se pase de tener m1 columnas linealmente independientes a tener m, por lo que se lograr la controlabilidad de la salida. Dicho de otra manera, a encontrar m vectores linealmente independientes siempre ser igual o ms fcil entre a a a n + 1 vectores que entre slo n de esos vectores. o
1.6.3.
Observabilidad
Considrese un sistema autnomo: e o x((k + 1)T ) = Gx(kT ) y(kT ) = Cx(kT ) (1.56)
Denicin 1.3 El sistema autnomo (1.56) es completamente observable si todo eso o tado inicial x(0) se puede determinar de la observacin de y(kT ) durante un nmero o u nito de intervalos de muestreo. Para que ello ocurra, cada transicin del estado debe o afectar a todos los elementos del vector de salida.
18
CONTROLABILIDAD Y OBSERVABILIDAD
La observabilidad juega un papel esencial en el control de aquellos sistemas en los que algunas de las variables de estado no son accesibles, es decir, no son medibles directamente. Ntese que se ha considerado un sistema autnomo. La razn de esto es o o o que la observabilidad de un sistema no autnomo se reduce a la del sistema autnomo o o equivalente. Se sabe que la solucin de la ecuacin de estado para el sistema autnomo (1.56) o o o es: x(kT ) = Gk x(0) y de ah y(kT ) = CGk x(0) La observabilidad completa implica que usando y(0), y(T ), y(2T ), , y((n 1)T ) se pueden determinar x1 (0), x2 (0), , xn (0) donde xi (0) indica la isima componente de x(0). Es decir el sistema es completamente e observable si las ecuaciones: y(0) = Cx(0) y(T ) = CGx(0) . . . y((n 1)T ) = CGn1 x(0) permiten determinar x1 (0), x2 (0), , xn (0). Como y(kT ) es un m-vector (asumiendo que el sistema tiene m salidas) el sistema de ecuaciones anterior es en realidad un sistema de n m ecuaciones, en las que las incgnitas son las n componentes de x(0). o Para que la solucin de este sistema sea unica debe haber entre ellas n ecuaciones o linealmente independientes. Esto se traduce en la siguiente condicin de observabilidad o completa: . . . Rango =n (1.57) C . G C . . (G )n1 C . . . donde indica la conjugada traspuesta de una matriz y a la matriz que aparece en la condicin se la llama matriz de observabilidad. o Por otra parte, de una manera anloga a la de la controlabilidad, la observabilidad a de un sistema a partir de su funcin de transferencia se puede asegurar si sta no o e presenta cancelaciones de polos y ceros.
19
Finalmente, se enuncia a continuacin una propiedad que ser util para poder obte o a ner la representacin de un sistema en forma cannica, sin que por ello pueda arguo o mentarse que existe la posibilidad de variar la controlabilidad u observabilidad del mismo. Propiedad 1.1 Sea un sistema LTI dado en la forma usual (1.1), cuya matriz de controlabilidad es M y la de observabilidad es N . Si se dene una transformacin o como (1.26) con: G = P 1 GP H = P 1 H C = CP siendo P una matriz invertible, entonces las matrices de controlabilidad y observabilidad del sistema equivalente tienen el mismo rango que M y N .
1.6.4.
Principio de Dualidad
Este principio, que es debido a Kalman, relaciona la controlabilidad y observabilidad de un sistema con la de otro sistema llamado dual del primero. Sea un sistema S1 : S1 : x((k + 1)T ) = Gx(kT ) + Hu(kT ) y(kT ) = Cx(kT ) x((k + 1)T ) = G x(kT ) + C u(kT ) y (kT ) = H x(kT ) (1.58)
Sea S2 el sistema dual de S1 : S2 : (1.59)
Entonces se puede armar que2 : SI S1 CONTROLABLE OBSERVABLE ENTONCES S2 OBSERVABLE CONTROLABLE
1.7.
Transformacin de un sistema en formas cannicas o o
Sea un sistema controlable y observable: x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k) + Du(k)
2
(1.60)
Ntese que los sistemas S1 y S2 son diferentes, es decir, S2 no es una representacin alternativa o o de S1 .
20
TRANSFORMACION DE UN SISTEMA EN FORMAS CANONICAS
A continuacin, se ver el procedimiento para obtener las formas cannicas a partir de o a o ese sistema.
1.7.1.
Obtencin de la forma cannica controlable o o
Sea una matriz de transformacin T = M W con: o an1 an2 an2 an3 . . . . . . a1 1 1 0 a1 1 . . . 0 0 1 0 . . .
M=
. . . H . GH . . Gn1 H . . .
W =
0 0
donde los coecientes ai son los coecientes de la ecuacin caracter o stica del sistema, es decir: |zI G| = z n + a1 z n1 + + an1 z + an = 0 Se dene el estado x(k) en funcin de la transformacin de otro vector de estados x(k): o o x(k) = T x(k) Entonces el sistema: x x(k + 1) = G(k) + Hu(k) y(k) = Cx(k) + Du(k)
(1.61)
con G = T 1 GT , H = T 1 H, C = CT , D = D est en forma cannica controlable. a o
1.7.2.
Obtencin de la forma cannica observable o o
En este caso la matriz de transformacin es: o Q = (W N )1 con N= . . . C . G C . . (G )n1 C . . .
Sea G = Q1 GQ, H = Q1 H, C = CQ, D = D y def nase el estado x(k) como x(k) = Q(k). Entonces el sistema (1.61) est en forma cannica observable. x a o
21
1.8.
Colocacin de polos mediante realimentacin o o del vector de estados
En esta seccin se presentar una estrategia de control que permite elegir la situacin o a o de los polos de bucle cerrado del sistema, mediante la realimentacin lineal del vector o de estados. Se ver que la condicin necesaria para que esto se pueda conseguir es que a o el sistema sea controlable. Por otra parte, se asumir que todas las variables de estados a son accesibles, es decir, podemos medirlas directamente sin tener que estimarlas por otros procedimientos.
1.8.1.
Condicin necesaria y suciente para la colocacin aro o bitraria de polos
Sea un sistema LTI: x(k + 1) = Gx(k) + Hu(k) Se escoge una ley de control que tiene la forma: u(k) = Kx(k) es decir, la seal de control se obtiene de la realimentacin negativa del vector de n o estados multiplicado por una cierta matriz de ganancias K. Este tipo de ley de control se la denomina usualmente realimentacin del vector de estados. Con esta ley de control o el sistema en bucle cerrado quedar a:
G
u(k)
Figura 1.2: Diagrama de bloques de un sistema controlado por una realimentacin del vector de o estados.
y la ecuacin de estado del sistema en bucle cerrado resultar ser: o a x(k + 1) = (G HK)x(k)
-K
x(k+1)
z-1
x(k)
22 COLOCACION DE POLOS MEDIANTE REALIMENTACION DEL VECTOR DE ESTADOS
De manera anloga a lo que se da en sistemas continuos, los autovalores de (G HK) a son (o coinciden con) los polos de bucle cerrado del sistema. Por tanto, lo que buscamos es ver que condicin es necesario cumplir para que exista una matriz de ganancias K o determinada, que nos permita colocar los autovalores de (G HK) en unos valores elegidos a voluntad.
Lema 1.2 Se demuestra que la condicin necesaria y suciente para que por medio de o una realimentacin del vector de estados puedan escogerse los polos de bucle cerrado o (es decir, los autovalores de (G HK)) es que el sistema en bucle abierto sea de estado completamente controlable. Si esta condicin no se cumple, no se podrn elegir todos o a los polos de bucle cerrado.
1.8.2.
Procedimientos para calcular K
Sean 1 ,2 , ,n los valores deseados para los polos de bucle cerrado, es decir, para los autovalores de (G HK). Aquellos que sean complejos siempre irn por pares a conjugados. La ecuacin caracter o stica del sistema en bucle abierto es: |zI G| = z n + a1 z n1 + + an = 0 Se dene una matriz de transformacin T = M W exactamente igual que la matriz o de transformacin necesaria para obtener la forma cannica controlable descrita en la o o seccin 1.7.1. Se obtiene: o 0 1 0 0 0 0 0 0 1 0 . . . . 1 . . . . T GT = G = . T 1 H = H = . . . . . . 0 0 0 0 1 an an1 an2 a1 1 K = KT = Entonces: 0 0 . . . 1 = 0 0 0 n n1 1 0 0 . . . 0 0 . . . 0 0 . . . n n1 1
Se dene a continuacin: o
HK =
n n1 1
23
Por otra parte, la ecuacin caracter o stica del sistema en B.C. es: |zI G HK| = |zI G + HK| 1 0 0 0 1 0 . . . . = z . . . . . 0 0 0 + = 0 0 0 0 0 0 . . . . . . 0 0 n n1 z 0 . . .
0 1 1 z . . .
0 0 . . .
0 0 . . .
1 0 . . .
0 1 . . .
0 0 . . .
0 0 0 1 an an1 an2 a1
0 0 . . .
0 0 1 an + n an1 + n1 z + a1 + 1 n = z + (a1 + 1 )z n1 + + (an1 + n1 )z + (an + n ) = 0 A su vez, la ecuacin caracter o stica correspondiente a los autovalores deseados ser: a (z 1 )(z 2 ) (z n ) = z n + 1 z n1 + 2 z n2 + + n1 + n = 0 Igualando los coecientes de ambas ecuaciones caracter sticas: 1 = a 1 + 1 2 = a 2 + 2 . . . n = a n + n se obtiene la siguiente expresin para K: o K = KT 1 = n n1 1 T 1 . . . = . . . n an . n1 an1 . . 1 a1
(1.62) T
1
que coloca los polos de bucle cerrado del sistema en los valores deseados. Ntese o que si el sistema en bucle abierto viene dado en forma cannica controlable, se verica o que T = I = T 1 .
1.8.2.1.
Procedimiento alternativo: la frmula de Ackermann o
Existen otros procedimientos alternativos para el clculo de la matriz K. Aqu mena cionaremos uno muy conocido, el que emplea la frmula de Ackermann. Segn esto, la o u expresin para K tomar la forma: o a K= donde: (G) = Gn + 1 Gn1 + + n1 G + n I Los coecientes i se calcularn como en el apartado anterior. a Finalmente, otro procedimiento que puede ser util para sistemas de bajo orden consiste en tomar K = k1 k2 k n plantear la ecuacin caracter o stica en funcin de los ki : o |zI G + HK| = 0 e igualar a los coecientes de z n + 1 z n1 + 2 z n2 + + n1 + n = 0 0 0 0 1 . . . H . GH . . Gn1 H . . .
1
(G)
1.8.3.
Control Dead-Beat
Este es un tipo de control que resulta ser un caso particular del control por colocacin de polos. o Denicin 1.4 Dado un sistema LTI, entenderemos como control dead-beat aquel que o consigue llevar el estado a cero en como mximo n intervalos de muestreo, donde n es a el orden del sistema. Para obtener este tipo de control se deben especicar los polos de bucle cerrado conforme a lo que se establece en el siguiente lema. Lema 1.3 Se demuestra que si se escogen los polos de bucle cerrado de manera que estn todos en el origen (es decir, todos los autovalores de (G HK) igual a cero) se e consigue un control dead-beat.
25
Esto se lleva a la prctica con una matriz de realimentacin del vector de estados a o calculada mediante: K = an an1 a1 T 1 Este tipo de control no goza de una reputacin excesivamente favorable porque habito ualmente se precisa de una seal de control de amplitud muy grande para obtener la n respuesta dead-beat. De hecho en este tipo de control, el unico parmetro de diseo a n que se ha de elegir es el tiempo de muestreo. Si ste es muy pequeo, los n intervalos e n de muestreo supondrn un tiempo total muy corto, de manera que para llevar el estado a a cero partiendo de un estado inicial arbitrario se precisar un valor muy alto de la a seal. n Ejemplo 1.5 Sea un sistema x(k + 1) = Gx(k) + Hu(k) con G= 0 1 0,16 1 0 1
Se desea determinar una matriz K, tal que los polos de bucle cerrado sean el par complejo conjugado z = 0,5 j0,5. En primer lugar hay que determinar la controlabilidad del sistema. Para ello, se forma la matriz de controlabilidad: . . H . GH = 0 1 1 1
cuyo rango es igual a dos (basta comprobar que su determinante es distinto de cero), por lo que el sistema es controlable y se puede proceder a calcular K. La ecuacin o caracter stica de bucle cerrado deseada es: |zI G + HK| = (z 0,5 j0,5)(z 0,5 + j0,5) = z 2 z + 0,5 = 0 (1.63)
por tanto, los coecientes i son en este caso 1 = 1 y 2 = 0,5. Por otra parte, la ecuacin caracter o stica de bucle abierto del sistema es: |zI G| = z 1 0,16 z + 1
por lo que los coecientes ai son a1 = 1 y a2 = 0,16. A partir de aqu se puede aplicar cualquiera de los mtodos explicados anteriormente. e
Mtodo 1 e . 2 a 2 . 1 a 1 .
K=
T 1
Obsrvese que el sistema viene dado en forma cannica controlable, por lo que T = I e o y por tanto: K = 0,34 2 Mtodo 2 (frmula de Ackermann) e o En este caso la frmula de Ackermann ser o a: K= donde (G) es (G) = G2 G + 0,5I 0,16 1 = 0,16 0,84 0,34 2 = 0,32 2,34 por lo que K = = Mtodo 3 e Este procedimiento es apropiado para sistemas de bajo orden como el que nos ocupa. En primer lugar, se toma K = [k1 k2 ] y se formula la ecuacin caracter o stica de bucle cerrado en funcin de K: o |zI G + HK| = 0 1 z 0 + 0,16 1 0 z z 1 = 0,16 + k1 z + 1 + k2 2 = z + (1 + k2 )z + k1 + 0,16 = 0 0 1 k1 k2 0 1 0 1 1 1 0,34 2
1
0 1
. H . GH .
(G)
0 1 0,16 1
0,5 0 0 0,5
0,34 2 0,32 2,34
la comparamos con la ecuacin caracter o stica deseada (1.63) e identicamos coecientes: 1 + k2 = 1 k1 + 0,16 = 0,5
27
de donde se obtiene que k1 = 0,34 y k2 = 2, por lo que se tiene ya el valor de K, que evidentemente coincide con el obtenido mediante los dos mtodos anteriores. e Ejemplo 1.6 Calcular para el mismo sistema del ejemplo anterior la matriz K que conlleva un control dead-beat, y comprobarlo calculando la evolucin del sistema a partir de un o estado inicial arbitrario. En este caso: K= a2 a1 T 1 = 0,16 1 Vamos a vericar que el control es dead-beat. Para ello, obtenemos la ecuacin de o estado del sistema en bucle cerrado: x1 (k + 1) x2 (k + 1) = = 0 1 0,16 1 x1 (k) 0 1 x2 (k) 0 0 x1 (k) x2 (k) + 0 1 0,16 1 x1 (k) x2 (k)
Supongamos ahora que el estado inicial es x1 (0) x2 (0) entonces se tiene que: x1 (1) x2 (1) e iterando una vez ms: a x1 (2) x2 (2) = 0 1 0 0 b 0 = 0 0 = 0 1 0 0 a b = b 0 = a b
luego este control lleva al estado a cero en 2 pasos y es efectivamente un control deadbeat.
1.9.
Observadores del estado
En el control por colocacin de polos se asume que el estado se puede medir direco tamente. En ocasiones, sin embargo, puede que esta suposicin no se cumpla y todas o
28
OBSERVADORES DEL ESTADO
o algunas de las variables de estado no puedan ser medidas. Es decir, puede que haya variables de estado no accesibles. En cualquier caso, para poder controlar el sistema se debern estimar los valores de esas variables de estado no accesibles. Este proceso de a estimacin es lo que se conoce como observacin. o o Un observador del estado es un subsistema del sistema de control, que realiza la estimacin de las variables de estado basndose en los valores medidos (observados) de o a las salidas y la seal de control. Se distinguen tres tipos de observadores, en funcin n o de las variables de estado que se estimen: 1. Observador del estado completo. Es aqul que estima todas las variables de estae do. 2. Observador de orden m nimo. En este caso slo se estiman aquellas variables de o estado que no son accesibles. 3. Observador de orden reducido. Este tipo de observador estima todas las variables no accesibles y algunas de las accesibles. En esta asignatura nos centraremos en los dos primeros tipos de observadores. Como en el caso de la colocacin de polos, formularemos en primer lugar las condiciones para o que se pueda llevar a cabo la observacin. o Lema 1.4 Condicin necesaria y suciente para la observacin del estado. Dado un o o sistema LTI, se puede determinar x(k + 1) a partir de y(k), y(k 1), ,y(k n + 1) y u(k),u(k 1), ,u(k n + 1), donde n es el orden del sistema, s y slo s, el sistema o es completamente observable. Por tanto x(k + 1) se puede determinar, si el sistema es observable, en n pasos. Sin embargo, no debe olvidarse que sobre el sistema actan ruidos y perturbaciones. Por u esta razn no es posible utilizar un procedimiento algebraico para determinar el estado, o sino que se ha de acudir a un procedimiento iterativo para estimarlo.
1.9.1.
Procedimiento iterativo para la estimacin del estado o
Sea un sistema LTI x(k + 1) = Gx(k) + Hu(k) y(k) = Cx(k) (1.64)
29
Si se dispone de una aproximacin del estado en k, que denotaremos x(k), sta evoluo e cionar segn la dinmica del sistema a u a x(k + 1) = G(k) + Hu(k) x y (k) = C x(k) (1.65)
Si las condiciones iniciales son las mismas, es decir, si x(0) = x(0) entonces se verica que x(k) = x(k). Sin embargo, si las condiciones iniciales son diferentes entonces, de manera general, x(k) = x(k). Podemos pues, denir el error de estimacin en k como: o e(k) = x(k) x(k) Restando la ecuacin de estado aproximada (1.65) de la real (1.64): o x(k + 1) x(k + 1) = G (x(k) x(k)) que teniendo en cuenta la denicin del error de aproximacin es equivalente a: o o e(k + 1) = Ge(k) que se puede considerar como un sistema dinmico autnomo. Si G es una matriz a o estable (es decir, si sus autovalores estn dentro del c a rculo unidad) el ((estado)) de este sistema tiende a cero, es decir: e(k) 0 x(k) x(k) Por tanto, si el sistema es estable, la propia dinmica del sistema hace que la aproxia macin del estado tienda al valor real del mismo. Esto quiere decir que podr o amos usar la propia ecuacin del sistema para obtener en cualquier instante k una aproximacin o o del estado, cuyo error ir decayendo a lo largo del tiempo. Esta convergencia al valor a real, sin embargo, puede ser muy lenta, y por otra parte no siempre se tratar con a sistemas estables. Por tanto, esta estrategia no es muy aconsejable. Ntese que en el esquema que se ha presentado, no se hace uso de la salida del siso tema, que siempre ser accesible. Esto puede ser aprovechado para mejorar el rendimiena to del observador introducindose un trmino corrector, de manera que la ecuacin para e e o obtener la aproximacin del estado para el instante k + 1 ser o a: x(k + 1) = G(k) + Hu(k) + Ke (y(k) C x(k)) x donde Ke es una matriz de ponderacin o ganancia. Este trmino se puede elegir de o e manera que se mejore el rendimiento, incluso si existen discrepancias entre las matrices del sistema y las del proceso real al que dicho sistema representa.
30
1.9.2.
Observador del estado completo
Sea un sistema LTI observable (1.64) con una ley de control por realimentacin o negativa del vector de estados, u(k) = Kx(k) siendo el estado del sistema x(k) no accesible pero s observable. Por tanto, podemos sustituir el valor del estado por una aproximacin de manera que o u(k) = K x(k) y de ah aplicando las consideraciones de la seccin 1.9.1 se obtiene , o x(k + 1) = G(k) + Hu(k) + Ke (y(k) y (k)) x = (G Ke C)(k) + Hu(k) + Ke y(k) x = (G Ke C HK)(k) + Ke y(k) x
(1.66)
Esta es la llamada ecuacin del observador predictivo. La palabra predictivo se utiliza o para indicar que la estimacin del valor futuro del estado en k + 1, se realiza utilizando o informacin disponible en el instante k. A los autovalores de la matriz (G K e C) o se les suele denominar polos del observador, y como se hizo en la seccin 1.9.1, se o ver a continuacin que marcan la dinmica de la evolucin del error de observacin. a o a o o En efecto, si se resta la ecuacin del observador de la del sistema real (1.64) se llega a o que e(k + 1) = (G Ke C)e(k) de lo que puede observarse que los polos del observador determinan la dinmica del a error. Si G Ke C es estable, el error converger a cero independientemente de la a estimacin del estado inicial x(0). o La ecuacin del observador y del propio sistema en espacio de estados controlado o por la realimentacin lineal del vector de estados, pueden representarse mediante un o diagrama de bloques que se ilustra en las guras 1.3 y 1.4. Finalmente, es evidente que interesa que la estimacin del estado converja rpidao a mente al valor real de dicho estado. Una manera evidente de lograr esto es colocar todos los polos del observador en cero, de manera que se consiga que el error de aproximacin o muestre una respuesta dead-beat. Esto se consigue eligiendo de manera apropiada Ke .
31
G
u(k)
x(k)
y(k)
u(k)
OBSERVADOR
Figura 1.3: Diagrama de bloques de un sistema LTI controlado mediante una realimentacin del vector o de estados que estima el estado con un observador.
x(k)
u(k)
y(k)
Ke
Figura 1.4: Diagrama de bloques de un observador de orden completo.
z-1
x(k+1)
x(k)
-K
u(k)
x(k+1)
z-1
x(k)
y(k)
y(k)
32
1.9.2.1.
Clculo de Ke a
El procedimiento para elegir Ke de manera que se coloquen los polos del observador en unos valores especicados es anlogo al de la colocacin de polos vista en la seccin a o o 1.8. Si la ecuacin caracter o stica deseada del observador es: z n + 1 z n1 + + n1 z + n = 0 y la del sistema es z n + +a1 z n1 + + an1 z + an = 0 entonces n a n n1 an1 . . . 1 a 1
donde W = an1 an2 an2 an3 . . . . . . a1 1 1 0
Ke = (W N )1 a1 1 . . . 0 0 0 0 1 0 . . .
(1.67)
N=
. . . C . G C . . (G )n1 C . . .
donde
es decir, la misma matriz W empleada en la colocacin de polos y la matriz de obo 3 servabilidad . Ntese que si el sistema viene indicado en forma cannica observable o o 1 (W N ) = I. Tambin puede emplearse la frmula de Ackermann, que para este caso e o es: 1 0 C CG 0 Ke = (G) . . . . . . CGn1 1 (G) = Gn + 1 Gn1 + + n1 G + n I = 0 Ejemplo 1.7 Considrese un sistema como (1.64) con e G=
3
1 1 0 1
H=
0,5 1
C=
1 0
A n de obtener un texto ms legible se evita en lo posible hacer referencias a material anterior, a an a pesar de que esto pueda alargar la exposicin del tema al repetirse ecuaciones y expresiones. u o
33
disearemos un observador del estado. En primer lugar, se ha de comprobar que el n sistema es observable. Para ello se comprueba que rango . C . G C . = rango 1 1 0 1 =2
luego el sistema es completamente observable. El siguiente paso es hallar la ecuacin o caracter stica del sistema en bucle abierto: |zI G| = z 0 1 1 0 z 0 1 = z 2 2z + 1 = 0
luego a1 = 2 y a2 = 1. Deseamos que el observador tenga una respuesta dead-beat, luego la ecuacin caracter o stica deseada del observador ser: a z 2 = 0 1 = 2 = 0 A continuacin se calcular Ke : o a Ke = (W N )1 con N= resultando Ke = 1 2 2 1 1 0
1 1 0 1
W =
a1 1 1 0 2 1
Clculo de Ke mediante la frmula de Ackermann a o En este caso la frmula de Ackermann es: o Ke = (G) con (G) = G2 + 1 G + 2 I = G2 resultando Ke = 1 1 0 1
2
C CG
0 1
1 0 1 1
0 1
2 1
que evidentemente es el mismo resultado que el obtenido con el procedimiento anterior.
34
Estudio de la evolucin del error de estimacin o o Vamos a comprobar que el error cae a cero segn una respuesta dead-beat. Sea u x(0) = entonces e(0) = x(0) x(0) = adems se tiene que a G Ke C = el error evoluciona, por tanto, segn u e1 (k + 1) e2 (k + 1) = 1 1 1 1 e1 (k) e2 (k) 1 1 1 1 a1 b1 x(0) = a2 b2 = a b
a1 a 2 b1 b 2
por lo que se calcula la evolucin de este error: o e1 (1) e2 (1) = = e1 (2) e2 (2) = = 1 1 1 1 a + b a + b 1 1 1 1 0 0 a b
a + b a + b
luego, tal y como se pretend la estimacin del vector de estados coincide con el a, o valor real de dicho vector dos tiempos de muestreo despus de iniciarse la estimacin. e o Finalmente, la ecuacin del observador es: o x1 (k + 1) x1 (k + 1) = 1 1 1 1 x1 (k) x1 (k) + 0,5 1 u(k) + 2 1 y(k)
1.9.2.2.
Comentarios acerca del papel de Ke
Se ha visto que Ke se utiliza para corregir la estimacin, disminuyendo el efecto de o las incertidumbres que se tengan sobre la dinmica real de la planta. Si estas incera tidumbres son importantes (es decir, si se tiene poca conanza en que el modelo de la
35
planta coincida con la dinmica real de la misma) este trmino corrector deber tomar a e a un valor alto. Sin embargo, si la seal de salida est contaminada por perturbaciones y n a ruido en general procedente, por ejemplo, de los sensores de medida, entonces la seal n de salida no es able en el sentido de que no proviene unicamente de la dinmica real de a la planta. Por tanto, en estas situaciones el trmino corrector deber ser ms pequeo. e a a n Al seleccionar Ke se debe pensar no slo en reducir el error en base a una correccin o o enrgica, sino que hay que tener en cuenta que cuando hay ruidos o perturbaciones, e una ganancia Ke alta no contribuir a reducir el error, porque las correcciones no ir a an en la ((direccin)) correcta. Es decir, hay que llegar a un compromiso entre la velocidad o de respuesta y la sensibilidad a ruidos y perturbaciones.
1.9.2.3.
Efectos de la adicin del observador o
Hemos supuesto que al no disponerse de x(k) para calcular la seal de control, se n usa el observador para producir una estimacin x(k), de manera que o u(k) = K x(k) (1.68)
Cabe preguntarse si al usar el observador, se colocan los polos del sistema en el sitio que se pretende al calcularse la ganancia de realimentacin del vector de estado K. o Que efectos tiene el observador sobre los polos de bucle cerrado? Para estudiar esto, se analizar el efecto que tiene la adicin del observador sobre la ecuacin caracter a o o stica del sistema en bucle cerrado. Sea el sistema (1.64) controlado mediante (1.68). La ecuacin de estado puede o reescribirse como: x(k + 1) = Gx(k) HK x(k) = (G HK)x(k) + HK(x(k) x(k)) = (G HK)x(k) + HKe(k) donde e(k) es el error de observacin en el instante k. Recordemos que el error de o observacin viene dado por: o e(k + 1) = (G Ke C)e(k) La ecuacin de estado y la del error, se pueden combinar en la ecuacin de un sistema o o autnomo aumentado que describe la dinmica del sistema observado (es decir, de todo o a el conjunto sistema-controlador-observador): x(k + 1) e(k + 1) = G HK HK 0 G Ke C x(k) e(k)
36
La ecuacin caracter o stica de este sistema es zI G + HK HK 0 zI G + Ke C es decir, |zI G + HK||zI G + Ke C| = 0 Dado que las ra de esta ecuacin son las ra de cada uno de los dos determinantes ces o ces que aparecen, esto implica que los polos del sistema completo son los polos del sistema en bucle cerrado, tal y como se han colocado mediante el diseo de K junto con los n polos del observador. Por tanto, la colocacin de polos y la observacin son dos cosas o o independientes, porque la adicin del observador no modica los polos de bucle cerrado o del sistema tal y como se eligieron al disear K. Por tanto: n =0
Los polos del sistema se eligen para que se cumplan las especicaciones del sistema de control. Los polos del observador se escogen de manera que la respuesta del observador sea ms rpida que la del sistema (para que esta ultima resulte dominante), a a t picamente 4 o 5 veces ms rpida. a a
1.9.3.
Observador de orden m nimo
Supngase que x(k) es un n-vector y que y(k) es un m-vector. Como las m salidas o son combinaciones lineales del estado, hay m variables que no necesitan ser estimadas. El observador de orden m nimo ser el que estime las n m restantes. a Para disear el observador de orden m n nimo estableceremos una particin del vector o de estados: xa (k) x(k) = xb (k) donde el m-vector xa (k) son las variables medibles (accesibles) y el n m-vector xb (k) son las variables no medibles (no accesibles). Esta particin del vector de estados o
37
donde Gaa Rmm , Gab Rm(nm) , Gba R(nm)m , Gbb R(nm)(nm) , Ha Rm1 , Hb R(nm)1 . La ecuacin de la parte del estado que es accesible (medible) o ser a: xa (k + 1) = Gaa xa (k) + Gab xb (k) + Ha u(k) Ntese que en esta ecuacin hay trminos que no son medibles, por lo tanto la podemos o o e reescribir agrupando los trminos medibles a la izquierda y los no medibles a la derecha: e xa (k + 1) Gaa xa (k) Ha u(k) = Gab xb (k) (1.69)
determina una particin en la ecuacin de estados: o o . Gaa . Gab . xa (k + 1) Ha xa (k) = . + u(k) . . . xb (k + 1) xb (k) Hb . Gbb Gba . xa (k) . . 0 y(k) = I . xb (k)
Por otro lado, la parte del vector de estados que no se puede medir se puede escribir como: xb (k + 1) = Gba xa (k) + Gbb xb (k) + Hb u(k) Obsrvese que en esta ecuacin, los trminos que dependen de xa (k) y u(k) son conoe o e cidos mientras que el trmino que depende de xb (k) es desconocido. Esta ecuacin la e o podemos reescribir como xb (k + 1) = Gbb xb (k) + [Gba xa (k) + Hb u(k)] (1.70)
El diseo del observador de orden m n nimo se realiza tomando como referencia el del observador de orden completo, cuya ecuacin de estados es o x(k + 1) = Gx(k) + Hu(k) En el caso del observador de orden m nimo, la ecuacin (1.70), es decir, la ecuacin o o que describe la evolucin de la parte del estado no medible, es la que hace el papel o de ecuacin de estado. Por otra parte, se conoce que la ecuacin de salida para el o o observador de orden completo es: y(k) = Cx(k) donde y(k) es medible y Cx(k) es no medible (por serlo x(k)). Obsrvese que se puede e establecer un paralelismo entre los trminos de esta ecuacin y los de la ecuacin (1.69). e o o En el caso del observador de orden m nimo, por tanto, se considera como ecuacin de o salida la ecuacin (1.69). o
38
Recordemos que la ecuacin del observador de orden completo es o x(k + 1) = (G Ke C)(k) + Hu(k) + Ke y(k) x Comparando las ecuaciones de estado y salida del observador de orden completo y las del observador de orden m nimo, se establecen las siguientes analog as: Observador de orden completo Observador de orden m nimo x(k) G Hu(k) y(k) C Ke Rnm Teniendo en cuenta esto, se obtiene xb (k+1) = (Gbb Ke Gab )b (k)+Gba xa (k)+Hb u(k)+Ke [xa (k + 1) Gaa xa (k) Ha u(k)] x (1.71) Adems, de la ecuacin del sistema sabemos que a o y(k) = xa (k) luego, aplicando esto en la ecuacin (1.71) se obtiene o xb (k + 1) = (Gbb Ke Gab )b (k) + Ke y(k + 1) + (Gba Ke Gaa )y(k) + (Hb Ke Ha )u(k) x que ser la ecuacin del observador de orden m a o nimo. Los polos del observador de orden m nimo ser los autovalores de (Gbb Ke Gab ). Obsrvese, sin embargo, que en an e esta ecuacin aparece un trmino que multiplica a y(k + 1). Como es lgico el valor o e o de la salida en k + 1 no est disponible en el instante k, por lo que esta ecuacin ha a o de ser modicada. Se puede demostrar (no se har aqu que esta ecuacin se puede a ), o reescribir como: xb (k) = (k) + Ke xa (k) (k + 1) = (Gbb Ke Gab )(k) + [(Gbb Ke Gab )Ke + Gba Ke Gaa ] y(k) +(Hb Ke Ha )u(k) La ecuacin caracter o stica del observador de orden m nimo es: |zI Gbb + Ke Gab | = 0 y como en el caso del observador de orden completo, Ke se puede elegir para colocar los polos del observador donde se desee mediante los mtodos indicados en la seccin e o (1.72) xb (k) Gbb Gba xa (k) + Hb u(k) xa (k + 1) Gaa xa (k) Ha u(k) Gab Ke R(nm)m
39
1.9.2.1. Por ejemplo, si la salida y(k) es un escalar, es decir m = 1, se tienen que estimar n 1 variables. La frmula de Ackermann, por ejemplo, quedar o a: 1 Gab 0 Gab Gbb 0 Ke = (Gbb ) . . . . . . Gab Gn2 bb 1 donde (Gbb ) = Gn1 + 1 Gn2 + + n1 I bb bb De manera anloga a la del observador de orden completo, se comprueba que la ecuacin a o caracter stica del conjunto formado por el observador de orden m nimo y el sistema controlado por una realimentacin lineal del vector de estados es: o |zI G + HK||zI Gbb + Ke Gab | = 0 por lo que, nuevamente se ve que los problemas de diseo del controlador y del obsern vador son independientes. Ejemplo 1.8 Sea un sistema LTI cuyas matrices son G= se pide 1. Disear un controlador que coloque los polos de bucle cerrado en z = 0,6 j0,4. n 2. Asumiendo que y(k) = x1 (k) es el unico estado accesible, disear un observador n de orden m nimo con respuesta dead-beat. En primer lugar, se ha de comprobar la controlabilidad y observabilidad del sistema: rango rango . H . GH . . . C . G C = rango = rango 0,02 0,06 =2 0,2 0,2 1 1 =2 0 0,2 1 0,2 0 1 H= 0,02 0,2 C= 1 0
Luego el sistema cumple ambas condiciones. La ecuacin caracter o stica del controlador es: z 1 0,2 |zI G| = = z 2 2z + 1 0 z1
40
luego a1 = 2 y a2 = 1. La ecuacin caracter o stica de bucle cerrado deseada es: (z 0,6 j0,4)(z 0,6 + j0,4) = z 2 1,2z + 0,52 luego 1 = 1,2 y 2 = 0,52. Por tanto, K= 2 a 2 1 a 1 T 1 = a1 1 1 0 0,48 0,8 0,02 0,02 0,2 0,2 T 1
donde la matriz T se calcula como T = y T 1 = lo que lleva a K= u(k) = K x(k) = 8 3,2 x1 (k) x2 (k) = 8 3,2 y(k) x2 (k) 8 3,2 la ley de control se formular por tanto, como a 25 2,5 25 2,5 . H . GH . =
En cuanto al observador de que es de orden 1. La particin o . Gaa . Gab . . = . . . . Gbb Gba .
orden m nimo, ste estimar una sola variable, por lo e a de la ecuacin de estado en este caso ser: o a . 1 . 0,2 . 0,02 Ha . = . . . 0,2 Hb 0 . 1 .
La ecuacin caracter o stica deseada del observador es (z) = z = 0 luego Ke = (Gbb )[Gab ]1 [1] = (1)(0,2)1 (1) = 5 Las ecuaciones del observador ser an (k + 1) = (Gbb Ke Gab )(k) + [(Gbb Ke Gab )Ke + Gba Ke Gaa ] y(k) +(Hb Ke Ha )u(k) = (1 5 0,2)(k) + [(1 5 0,2) 5 + 0 5 1] y(k) + (0,2 5 0,02)u(k) = 5y(k) + 0,1u(k) x2 (k) = Ke y(k) + (k) = 5y(k) + (k)
41
y la ley de control ser por tanto, a u(k) = = = = K x(k) 8y(k) 3,22 (k) x 8y(k) 3,2(5y(k) + (k)) 24y(k) 3,2(k)
1.10.
Control optimo LQR
Las tcnicas de control optimo conforman una de las ramas del control automtico e a ms importantes en el desarrollo de las estrategias modernas de control ms utilizadas a a hoy en d Se han escrito numerosas monograf dedicadas a su estudio, y se ha a. as publicado una ingente cantidad de art culos en revistas especializadas. No obstante, en estos apuntes slo se dar una pincelada sobre este particular, centrndonos en el o a a caso particular del control LQR con horizonte innito, tambin conocido como LQR e de rgimen permanente. e Las estrategias de control optimo calculan la ley de control de manera que se opti miza una cierta medida del rendimiento del controlador. Se parte de un sistema descrito por x(k + 1) = Gx(k) + Hu(k) El objetivo es calcular una ley de control u(k) = Kx(k) de tal manera que se minimiza el funcional (que expresa un ndice de funcionamiento) 1 J= 2
(x (k)Qx(k) + u (k)Ru(k))
k=0
(1.73)
siendo Q y R matrices de ponderacin que cumplen que Q = Q > 0, R = R > 0. o Ntese que este o ndice de funcionamiento pondera la diferencia entre el estado y el origen el instante inicial, hasta un tiempo innito. Por tanto, cuanto ms rpido se llegue a a al origen menor valor de J se tendr. Esto implica que al minimizarse J, se encona trar la ley de control que lleva el estado al origen ms rpidamente y mantenindolo a a a e
42
CONTROL OPTIMO LQR
siempre lo ms cerca posible del origen4 . Por otra parte, se observa que en el funcional a hay otro trmino que pondera el valor de la secuencia de seales de actuacin. Este e n o trmino impide que se obtenga una ley de control que lleve el estado al origen a expene sas de una actuacin muy grande. Al minimizarse J, por tanto, se conseguir una ley de o a control que por una parte acerque el estado al origen lo mas rpido posible, pero mana teniendo un nivel de actuaciones moderado, encontrndose por tanto, una solucin de a o compromiso entre el rendimiento del controlador y su nivel de actuacin. El sentido de o este compromiso puede venir dictado por diferentes razones, como por ejemplo moderar el gasto de energ o combustible necesario para proporcionar la seal de actuacin. a n o Existen razones ms sutiles pero no por ello menos importantes para incorporar esta a ponderacin del esfuerzo de control. Por ejemplo, cuando existen discrepancias entre o el modelo del sistema y su dinmica real (algo que ocurre casi siempre, pues los modea los matemticos no pueden recoger todas las complejidades de los sistemas o procesos a reales) esta ponderacin del esfuerzo de control resulta en un sistema ms estable. o a Para calcular la ley de control que minimiza el ndice (1.73) se dene una matriz P que satisface la siguiente ecuacin de Riccatti: o P = Q + G P G G P H(R + H P H)1 H P G (1.74)
La solucin de esta ecuacin es una matriz P que es herm o o tica y denida positiva. Se demuestra que la matriz K = (R + H P H)1 H P G es la que minimiza el ndice (1.73) mediante la ley de control u(k) = (R + H P H)1 H P Gx(k) La ecuacin de estado del sistema en bucle cerrado ser por tanto: o a x(k + 1) = (G H(R + H P H)1 H P G) x(k) = (I + HR1 H P )1 Gx(k) Para este desarrollo se ha empleado el lema de inversin o (A + BC)1 = A1 A1 B(I + CA1 B)1 CA con A = I, B = H y C = R1 H P .
Esta es una interpretacin que hay que tomar con cierto cuidado, pues puede que se obtenga una o ley de control que provoque que el estado no se acerque al origen todo lo posible al principio pero que lo lleve a dicho origen muy rpidamente en los instantes siguientes, manteniendo pues el valor de J a muy bajo.
4
43
1.10.1.
Solucin de la ecuacin de Riccatti o o
Para calcular la ley de control optima LQR en rgimen permanente es necesario e resolver la ecuacin de Riccatti (1.74). Esto no es algo trivial en general, pero si podeo mos resolverla fcilmente si se dispone de un computador. Para ello formularemos un a proceso iterativo en que tomando como valor inicial de P = 0 (es decir una matriz de ceros) se calcular el valor de la matriz P en el paso i + 1 como a Pi+1 = Q + G Pi G G Pi H (R + H Pi H)1 H Pi G La condicin de parada del bucle o proceso iterativo ser que Pi+1 Pi 0, esto es, o a que la diferencia entre Pi+1 y Pi sea una matriz cuyos elementos estn todos cerca del e cero.
1.11.
Filtro de Kalman
El ltro de Kalman es un estimador del estado (en realidad tambin se puede e interpretar como ltro y como predictor), que tiene en cuenta la presencia de ruidos en la ecuacin de estados y la salida. En este sentido es un estimador optimo, pues o la estimacin obtenida tiene el menor error posible teniendo en cuenta que al haber o ruidos actuando, nunca se podr obtener una estimacin perfecta. Al igual que en el a o caso del control LQR no se entrar en profundidad en el estudio de este estimador, sino a que slo se presentar la formulacin de un caso particular, el ltro de Kalman para o a o rgimen permanente. e Sea un sistema:
x(k + 1) = Gx(k) + Hu(k) + (k) y(k) = Cx(k) + (k)
donde (k) y (k) son variables aleatorios que actan como ruidos aditivos. Se deu muestra que se puede obtener una estimacin optima del vector de estados mediante o el siguiente esquema: x(k + 1) = G(k) + Hu(k) + Ke (k) (y(k) C x(k)) x 1 Ke (k) = GPk C (R + CPk C ) Pk+1 = Q + (G Ke (k)C) Pk G donde R = E { (k) (k)} Q = E {(k) (k)} P0 = E { (0) (0)} (1.75)
44
FILTRO DE KALMAN
donde E {} denota la esperanza matemtica y R,Q se asumen constantes. Se demuestra a que conforme k : Pk+1 P Ke (k) Ke donde P y Ke son matrices constantes y adems P es semidenida positiva. Usando a esto, las ecuaciones de estimacin (1.75) se pueden reescribir como: o x(k + 1) = G(k) + Hu(k) + Ke (y(k) C x(k)) x 1 Ke = GP C (R + CP C ) P = Q + GP G GP C (R + CP C )1 CP G
(1.76)
que son las ecuaciones del ltro de Kalman de rgimen permanente. Ntese que para e o resolver la ecuacin de Riccatti se puede usar el mismo mtodo usado en el LQR. o e
Cap tulo 2 Modelos de procesos y perturbaciones

2.1. Introduccin o
En este cap tulo se expondrn diversos tipos de formas de modelar perturbaciones a y procesos cuya evolucin se ve afectada por perturbaciones. Es importante tener en o cuenta que los modelos de procesos con perturbaciones tienen su origen en el modelado de perturbaciones y no al revs. e En la teor clsica del control automtico siempre se ha tenido en cuenta el coma a a portamiento de los sistemas frente a perturbaciones a la hora de disear sistemas de n control. Dichas perturbaciones se modelaban siempre de manera muy simplicada. Es por tanto comn en esta teor el considerar que las perturbaciones van a tener la u a forma de Pulsos. Escalones. Rampas. Sinusoides. Todos estos modelos tienen en comn que son absolutamente predecibles en su evoluu cin en funcin de las condiciones iniciales. Es decir, en cuanto la perturbacin aparece o o o 45
46
PERTURBACIONES DETERMINISTAS A TROZOS
podemos predecir su evolucin futura. Es una suposicin comn en estos casos, consi o o u derar que estas perturbaciones vienen generadas por sistemas dinmicos. a
2.2.
Perturbaciones deterministas a trozos
Como fuente de perturbaciones con una mayor variabilidad que los modelos clsicos a antes comentados, se pueden considerar las perturbaciones deterministas a trozos. Surgen de la necesidad de estudiar el efecto de perturbaciones ms realistas en sistemas a de control que se basan en algn tipo de esquema predictivo para calcular la seal u n de control. En este tipo de sistemas, el considerar una perturbacin absolutamente o predecible (como en el caso de los modelos clsicos) no tiene utilidad alguna, pues se a pueden considerar directamente en el clculo de la ley de control. a Los modelos de perturbaciones deterministas a trozos parten de la suposicin de o que son generados por un sistema lineal, en el que la entrada es cero excepto en ciertos instantes de tiempo separados por ms de n tiempos de muestreo, donde n es el orden a del sistema: C(z 1 ) w(k) y(k) = A(z 1 ) suponindose que el grado de C(z 1 ) es igual al grado de A(z 1 ). Si la entrada es e cero excepto en ciertos instantes de tiempo que estn separados, quiere decir que la a seal w(k) es un tren de pulsos. La amplitud y momento de aparicin de esos pulsos n o son desconocidos. Esto es lo que le da variabilidad a la fuente de perturbaciones. Sin embargo, una vez que aparecen y se conoce la amplitud del pulso, la evolucin de la o salida y(k) es perfectamente predecible pues la dinmica del sistema es conocida. De a ah el nombre de determinista a trozos.
2.3.
Procesos estocsticos a
Es natural utilizar el concepto de aleatorio o estocstico1 para describir una amplia a clase de perturbaciones, sucientemente realistas para formular problemas de prediccin con postulados cercanos a la realidad. o
Estocstico: relativo a una variable aleatoria; algo que sigue una determinada distribucin de a o probabilidad, usualmente con varianza nita.
1
CAP ITULO 2. MODELOS DE PROCESOS Y PERTURBACIONES
47
El concepto de proceso estocstico es complejo y alcanza su madurez en los trabajos a de Kolmogorov (1930). Aqu presentaremos slo algunas ideas bsicas. Un proceso o a estocstico puede ser considerado como una funcin de dos variables a o X(t, w) donde t es la variable tiempo con su signicado habitual y w es una variable aleatoria. Si consideramos un valor jo de w, esto es w = w0 y dejamos la variable t libre, lo que denotaremos como X(:, w0 ) estaremos hablando de una ((realizacin)) del proceso. Esta realizacin es una funcin o o o temporal comn sin ningn tipo de carcter aleatorio una vez que se conoce que w = u u a w0 . Si por otra parte se considera un instante de tiempo jo, es decir t = t0 , que denotaremos como X(t0 , :) X(t0 ) tendremos una variable aleatoria. Se puede considerar por tanto, que la evolucin del o proceso est dictada por un generador de seales aleatorias. En la gura 2.1 se ilustran a n estos conceptos. Puede observarse que el valor de la funcin en cada instante es un o valor aleatorio que en la gura se considera variable en un determinado rango. Por otra parte, cuando se habla de una realizacin no es ms que una funcin comn que o a o u depende de t.
w=w0
t0
t1
t2
t3
t4
......
Figura 2.1: Procesos estocsticos: realizaciones y variables aleatorias. a
Denicin 2.1 Se denomina proceso estocstico determinista, a aqul cuya evolucin o a e o 2 puede ser predicha exactamente con un predictor lineal en base a medidas pasadas. En estos procesos, el carcter estocstico slo se maniesta en la aleatoriedad de las a a o condiciones iniciales. Para aplicaciones basadas en prediccin no son muy interesantes. o
2
Es decir, haciendo evolucionar hacia delante un modelo lineal.
48
MODELOS DE PROCESOS CON RUIDOS
Denicin 2.2 Se denomina proceso estocstico estacionario, a aqul cuya distribuo a e cin estadstica para X(t1 ), X(t2 ),. . . ,X(tn ) es la misma que para X(t1 + ), X(t2 + o ),. . . ,X(tn + ). Es decir, su distribucin no vara con el tiempo. o
Denicin 2.3 Se denomina ruido blanco discreto, a un proceso aleatorio que se puede o considerar como una secuencia cuyos elementos son variables aleatorias independientes entre s cuya distribucin es idntica. Se suele suponer que o e E {x(k)} = 0 es decir, que el valor esperado es cero y adems a E {x(i)x(j)} = 0 si i = j (por ser variables independientes) 2 si i = j
Al ruido blanco se le suele considerar prototipo de una seal impredecible. n
2.4.
Modelos de procesos con ruidos
En esta seccin veremos cmo se pueden generar diversos tipos de procesos eso o tocsticos, cuando a un sistema lineal se le inyecta un ruido blanco v(k) adems de a a una entrada externa u(k) a travs de sendas funciones de transferencia. e El caso ms general es el llamado modelo de Box-Jenkins, el cual se ilustra en la a gura 2.2. Esta estructura es demasiado general, y normalmente se utilizan diversas
v(k)
u(k)
Figura 2.2: Modelo de Box-Jenkins.
simplicaciones de las cuales veremos a continuacin las ms comunes: o a
"

y(k)
!
CAP ITULO 2. MODELOS DE PROCESOS Y PERTURBACIONES
49
Modelo de Media Mvil (MA : Moving Average). Es el caso ms sencillo y viene o a descrito por y(k) = v(k) + c1 v(k 1) + c2 v(k 2) + + cn v(k n) Con este modelo se pueden describir muchos tipos de perturbaciones aleatorias. Sin embargo, no incluye a los valores pasados de la salida por lo que no servir para modelar procesos que tengan dinmica. a a Modelo Autoregresivo (AR). Viene descrito por y(k) + d1 y(k 1) + d2 y(k 2) + + dn y(k n) = v(k) En este caso, la parte aleatoria correspondiente a la perturbacin tiene una eso tructura muy simple porque no depende de los valores pasados. Modelo Autoregresivo de Media Mvil (ARMA). Es la combinacin de los dos o o anteriores, por lo que tomar la forma a y(k) + d1 y(k 1) + + dn y(k n) = v(k) + c1 v(k 1) +c2 v(k 2) + + cn v(k n) Este modelo permite describir procesos ms ricos que los anteriores. Sin embargo, a desde el punto de vista del control es interesante poder considerar el efecto de una entrada externa, por lo que se considera el siguiente tipo de modelos de procesos con ruidos. Modelo Autoregresivo de Media Mvil con una entrada exgena (ARMAX). Tamo o bin llamado modelo CARMA (Controlled ARMA). Viene descrito por e y(k) + a1 y(k 1) + + an y(k n) = b1 u(k 1) + + bn u(k n) +v(k) + c1 v(k 1) + + cn v(k n) Modelo Autoregresivo con entrada exgena para m o nimos cuadrados (ARX-LS ). Este modelo surge como versin simplicada del anterior, para el caso en el que o no se necesita que la fuente de perturbaciones tenga una estructura tan compleja. Viene descrito por y(k) + a1 y(k 1) + + an y(k n) = b1 u(k 1) + + bn u(k n) + v(k) Como su nombre indica se utiliza en la identicacin por el mtodo de los m o e nimos cuadrados (vase el tema 4). e
50
MODELOS DE PROCESOS CON RUIDOS
Modelo Autoregresivo de Media Mvil integrada y con una entrada exgena o o (ARIMAX o CARIMA). Este modelo incorpora un integrador en la fuente de perturbaciones, por lo que viene descrito por y(k) + a1 y(k 1) + + an y(k n) = b1 u(k 1) + + bn u(k n) v(k) + c1 v(k 1) + + cn v(k n) + donde = 1z 1 . Este tipo de modelos es util en esquemas de control predictivo para formular leyes de control que incorporen un efecto integral, de manera que sean capaces de rechazar perturbaciones en escaln. o
Los modelos anteriores pueden escribirse en forma condensada utilizando polinomios en z 1 tal y como se muestra en la siguiente tabla resumen: Modelo Expresin o MA AR ARMA ARMAX ARX-LS ARIMAX y(k) = C(z 1 )v(k) D(z 1 )y(k) = v(k) D(z 1 )y(k) = C(z 1 )v(k) A(z 1 )y(k) = B(z 1 )u(k 1) + C(z 1 )v(k) A(z 1 )y(k) = B(z 1 )u(k 1) + v(k) 1 A(z 1 )y(k) = B(z 1 )u(k 1) + C(z )v(k)
Cuando en los modelos anteriores el polinomio que convoluciona con la seal v(k) es n distinto de la unidad se habla de ruido coloreado, y en caso contrario, de ruido blanco.
Cap tulo 3 Introduccin a la identicacin de o o sistemas

3.1. Introduccin o
Un modelo de un proceso es una forma de resumir el conocimiento que se tiene sobre su dinmica, y por tanto es una herramienta importante en el diseo y anlisis a n a de sistemas de control. Sin embargo, al construir modelos estamos obteniendo representaciones simplicadas de la dinmica real del proceso. Un solo modelo no suele ser a suciente para describir un proceso. Por otra parte, segn sea el uso destinado al modu elo este deber ser mas o menos detallado. Por tanto, se establece una jerarqu de a a modelos que describe al proceso con mayor o menor detalle. Hay dos maneras de abordar la construccin de un modelo: obtenerlo mediante o principios y leyes f sicas que describan la dinmica del proceso, o bien obtenerlo mea diante experimentacin sobre el proceso que se quiere modelar. La primera opcin o o requiere un conocimiento muy preciso del proceso que se quiere modelar. Por ejemplo, hay que elegir las variables que vayan a ser los estados del sistema, y esto puede ser un problema. Es, en general un proceso complicado y muy arduo, excepto en casos muy simples. Normalmente, se debe combinar con la otra estrategia que es la denominada identicacin de sistemas. Esta estrategia ser el objeto de este tema. o a 51
52
IDEAS BASICAS SOBRE IDENTIFICACION DE SISTEMAS
3.2.
Ideas bsicas sobre identicacin de sistemas a o
La identicacin de sistemas es la aproximacin experimental al modelado de siso o temas. Consiste en obtener un modelo a partir de observaciones obtenidas directamente del propio sistema que se pretende modelar. La identicacin de un sistema conlleva o una serie de actividades y herramientas, de las que podemos destacar:
Planicacin de los experimentos. o Seleccin del tipo de modelo. o Eleccin de un criterio para expresar la bondad del modelo que se va a obtener. o Estimacin de los parmetros del modelo. o a Validacin del modelo obtenido. o
A continuacin, se irn desglosando las principales ideas de cada uno de estos aspectos. o a
3.2.1.
Planicacin de los experimentos o
Dado que la identicacin de sistemas involucra experimentar con el proceso a modo elar, es necesario tener en cuenta que, en general, es muy costoso experimentar con procesos industriales. Por tanto, es necesario elegir una tcnica que nos sea lo ms rentable e a desde el punto de vista del tipo de experimentos necesarios. Algunas tcnicas son muy e sencillas, en el sentido de que una vez hecho el experimento es fcil obtener el modelo. a Estas tcnicas, sin embargo, requieren que en los experimentos se utilicen seales de e n entradas preestablecidas de manera muy precisa: pulsos, sinusoides, etc. . . Puede que el proceso a modelar no pueda ser sometido a este tipo de entradas por consideraciones de seguridad o motivos econmicos. Otras tcnicas de identicacin pueden emplear o e o casi cualquier tipo de seal de entrada (es decir, son menos exigentes en el tipo de n experimentos necesarios), pero una vez realizado el experimento es ms complicado a obtener el modelo. Como comentario general, es necesario que en el experimento se utilicen seales de entrada que exciten todos los modos del sistema. Ms all de eso, n a a un buen mtodo de identicacin debe ser insensible a las caracter e o sticas de la entrada. Otro aspecto es que a veces no se puede identicar en bucle abierto y hay que hacerlo en bucle cerrado. Esto no es siempre posible, pues aunque el sistema sea identicable en
CAP ITULO 3. INTRODUCCION A LA IDENTIFICACION DE SISTEMAS
53
bucle abierto esta propiedad puede perderse en bucle cerrado. Esto ocurre, por ejemplo, si los perles de la consigna o referencia que se usan son muy simples. Tambin, si los e lazos de control son demasiado simples. En general, cuanto ms complejos sean los a lazos de control y ms se mueva la consigna, ms fcil ser la identicacin en bucle a a a a o cerrado.
3.2.2.
Seleccin del tipo de modelo o
En teor la seleccin del tipo de modelo deber venir dada por un conocimiento a, o a del proceso y de las perturbaciones que deban ser tenidas en cuenta. Dependiendo de si conocemos mucho o poco la estructura del proceso elegiremos entre uno u otro tipo de modelo. En general, los modelos los clasicaremos como:
Modelos de Caja Blanca. Son los obtenidos a partir de leyes f sicas (esto no ser a realmente identicacin porque no se estar haciendo experimentos). o an Modelos de Caja Negra. En estos modelos se postula una estructura matematica con una serie de parmetros libres, a los cuales se les da valor a partir de los a datos obtenidos en los experimentos. Modelos de Caja Gris. Corresponden a un tipo intermedio entre los dos anteriores. Parte del modelo se obtiene mediante leyes f sicas y otra parte, se ajusta usando medidas experimentales. Por ejemplo, mediante leyes f sicas podemos determinar la estructura del modelo (o de parte de l) y usar experimentos para terminar de e caracterizar el modelo.
Tambin se pueden clasicar los tipos de modelos en paramtricos y no paramtrie e e cos. En los primeros se tienen una serie de parmetros que hay que ajustar. Por ejemplo, a en una funcin de transferencia se tendr que ajustar el orden y los coecientes de o an los polinomios. En modelos de espacio de estados tendr amos la misma situacin pero o con las matrices del sistema. En los modelos no paramtricos, el modelo no tiene una e serie de parmetros que denen la dinmica sino que se compone de una cantidad de a a informacin sobre la misma, por ejemplo los modelos basados en la respuesta en freo cuencia de un sistema. En el caso que aqu nos ocupa los modelos que emplearemos sern de caja negra y paramtricos. a e
54
3.2.3.
Eleccin de un criterio o
En el proceso de estimacin del modelo y su subsiguiente validacin es necesario o o contar con un criterio que exprese la bondad del ajuste del modelo a los datos, es decir, que exprese la calidad del modelo obtenido. Normalmente, se utilizan criterios que toman la forma:
N
J() =
k=1
g(e(k))
donde es el vector de parmetros que se trata de ajustar, e(k) es el error de estimacin a o para la medida k, N es el nmero de observaciones o medidas disponibles y g() es una u funcin usualmente cuadrtica. o a Usualmente, el proceso de ajuste del modelo se realiza de manera que se busca el valor del vector de parmetros que hace m a nimo al ndice o criterio J(). El mtodo e ms antiguo que emplea esta estrategia es el de los m a nimos cuadrados, debido a Gauss. Por otra parte, cuando los procesos se describen mediante modelos estocsticos, el a problema es de estimacin estad o stica. Un mtodo muy popular en este caso, es el del e estimador de mxima verosimilitud. a
3.2.4.
Estimacin de los parmetros o a
Para resolver el problema de estimacin de los parmetros del modelo se requiere o a de los elementos comentados anteriormente: datos experimentales, un tipo de modelo y un criterio. Estimar los parmetros es resolver un problema de optimizacin en el a o cual, el mejor modelo es el que hace m nimo el criterio. Es necesario tener en cuenta que el modelo obtenido depender de los elementos anteriores, como por ejemplo de la a amplitud y contenido frecuencial de la seal de entrada. Hay diversas formas de llevar n a cabo el proceso de estimacin. Una distincin amplia, es aquella que distingue entre o o identicacin en l o nea e identicacin fuera de l o nea.
3.2.4.1.
Identicacin en l o nea
En los mtodos de identicacin en l e o nea la estimacin se efecta usando medidas o u que se van obteniendo en tiempo real, y normalmente se usan clculos recursivos. a El esquema de este tipo de identicacin ser el mostrado en la gura 3.1. En este o a esquema aparece un nivel de supervisin que es necesario para evitar, por ejemplo, que o
55
u(k)
PLANTA
y(k)
IDENTIFICACIN
MODELO ACTUALIZADO
SUPERVISIN
MODELO CORREGIDO
Figura 3.1: Esquema de la identicacin en l o nea.
el modelo actualizado se salga de ciertos l mites o cambie bruscamente (esto no ser a bueno para ciertas leyes de control basadas en modelos). Este mtodo suele ser el unico e apropiado cuando se pretende usar una estrategia de control adaptativo, o el proceso var su dinmica con el tiempo. a a
3.2.4.2.
Identicacin fuera de l o nea
En este caso se toman los datos del experimento (es decir, series de medidas) y posteriormente, se ajusta el modelo usando para ello todo el conjunto de datos. Este tipo de procedimientos suelen obtener modelos ms precisos y son ms ables en cuanto a a a la convergencia de los parmetros estimados a los parmetros reales del proceso1 . En a a cualquier caso, existe un consenso general en que no existe un mtodo universalmente e bueno, por tanto, dependiendo de la situacin unos funcionarn mejor que otros. o a
3.2.5.
Validacin del modelo o
La validacin del modelo consiste en comprobar la bondad del modelo que se ha o obtenido por el proceso de identicacin. Una tcnica muy comn para comprobar la o e u bondad de un modelo identicado es la validacin cruzada. o
Ntese que aunque el proceso real no corresponder en general exactamente con el modelo (pues o a todo modelo implica un cierto grado de simplicacin de la realidad) se asume que existe un valor del o vector de parmetros que es el que mejor describe al proceso. a
1
56
La idea del mtodo de validacin cruzada es dividir el conjunto de datos disponible e o en dos partes o subconjuntos: Conjunto de estimacin. Es usado para estimar el modelo mediante la resolucin o o de un problema de optimizacin, de tal manera que el vector de parmetros o a CE ser estimados sobre el conjunto de estimacin o a CE = arg m VCE (, CE) n
donde VCE es el criterio de estimacin. o Conjunto de prueba o validacin. Con este modelo se evala el estimador obtenido o u mediante un criterio de prueba, que puede ser el mismo que el usado en la estimacin u otro distinto: o FCE = VCP (CE , CP) La idea tras el concepto de validacin del modelo es estimar distintos tipos de modelos o (por ejemplo con distintos ordenes) y quedarse con el que mejor ajusta (es decir, el que CE ). Mediante esta tcnica de validacin cruzada, lo que se trata de ver es d menor F e e o si el modelo es capaz de reproducir los datos de salida para entradas que no se han empleado en la estimacin. o Como se ha comentado anteriormente, el criterio VCP no tiene por qu ser el mismo e que el VCE . Por ejemplo, se puede usar como criterio para validacin el conocido criterio o de Akaike o criterio AIC (Akaikes Information Criterion), el cual asumiendo que las perturbaciones siguen una distribucin gaussiana se calcula mediante la frmula o o VCP (, CP) = 2dimensin() o 1+ N 1 N
N
e2 (t, )
t=1
donde e(t, ) = y(t) y (t, ) es el error de estimacin para los datos obtenidos en el o instante t. Tampoco puede descartarse la posibilidad de no usar criterio de validacin alguno y o efectuar una inspeccin visual sobre una simulacin, en la que se usa el modelo estimado o o para predecir la salida en base a datos de entradas experimentales. Finalmente, la tcnica de validacin cruzada, aunque muy popular no es la unica. e o Otra tcnica que a veces se utiliza es el anlisis de residuos. Se entiende por residuos e a los errores que comete el modelo una vez ajustado, es decir e(t) = y(t) y (t, ). Si el modelo estimado es sucientemente bueno, estos residuos tienen que ser independientes
57
de la informacin disponible en el instante anterior (es decir, el residuo en t tiene que o ser incorrelado con las medidas obtenidas en los instantes anteriores). Esto es as por que si existe correlacin entre e(t) y alguna entrada pasada u(t ), quiere decir que o una parte del valor de y(t), que depende de u(t ) no ha sido reproducida por el modelo en y (t, ). Por tanto, el modelo no estar reproduciendo toda la dinmica del a a proceso.
3.2.6.
Resumen del proceso de identicacin o
El proceso de identicacin de un sistema rara vez se concluye con la sola ejecucin o o de los pasos anteriormente descritos. En lugar de esto, se realizan numerosas repeticiones de esta secuencia de pasos, a veces varindose el tipo de modelo, o repitindose a e los experimentos hasta que se obtenga un buen modelo. Por tanto, podemos ver el proceso de identicacin como un mtodo iterativo que se puede describir mediante o e el diagrama de ujo mostrado en la gura 3.2. En esa gura el hecho de que el ujo
INICIO
TOMA DE DATOS
ACONDICIONAMIENTO DE DATOS
ELEGIR ESTRUCTURA DEL MODELO
AJUSTAR MODELO
VALIDAR MODELO
NO
VALIDO ? SI USAR MODELO
Figura 3.2: Diagrama de ujo del proceso de identicacin. o
pueda retornar a cualquiera de las pasos intermedios, indica que puede que en cada
58
ALGUNAS PROPIEDADES
iteracin no se realicen todos los pasos. Por otra parte, aparece un paso sobre el que no o se ha comentado nada, el acondicionamiento de datos. Esta tarea consiste en manipular los datos de manera que sean apropiados para el mtodo de ajuste elegido. Es algo e que es espec co para cada procedimiento. As por ejemplo, una tarea muy comn de u acondicionamiento de datos es la eliminacin de los valores de continua de las seales o n de entrada y salida. Esto ser tratado en mayor profundidad en el tema 4. Finalmente, a en el caso de la identicacin en linea el proceso es ms simple, ya que por ejemplo o a no es posible cambiar la estructura del modelo sin descartar el resultado que se ha obtenido hasta ese momento. Adems, los datos se toman segn van llegando, pues a u recordemos que en este tipo de identicacin la identicacin se hace como su propio o o nombre indica en tiempo real, es decir, ((en l nea)).
3.3.
Algunas propiedades
En esta seccin, veremos algunas propiedades relacionadas con la identicacin de o o sistemas. Concretamente se tratarn los conceptos de excitacin persistente, convergena o cia e identicabilidad. Adems, se vern las tareas de supervisin y acondicionamiento a a o que aparecen en las guras 3.1 y 3.2.
3.3.1.
Excitacin persistente o
Se ha comentado en la seccin 3.2.1, que para poder identicar correctamente un o sistema la seal de entrada debe excitar (es decir, poner de maniesto) todos los modos n del sistema (toda su dinmica). Formalmente, se dice que si el sistema es de orden n a se deber contar con una seal persistentemente excitadora de orden n. a n Se puede probar que una seal de entrada u(k) es persistentemente excitadora de n orden n, s y slo s se cumple que o 1 l m N N
N 2
A(z )u(k)
k=1
>0
para todo polinomio A(z 1 ) no nulo de grado inferior a n. Usando este resultado se pueden caracterizar las seales ms comunes: n a
Pulso: no excita persistentemente para ningn orden n. u
59
Escaln: excita persistentemente para orden 1. o Ruido blanco: excita persistentemente para todo orden n.
Esto quiere decir que el ruido blanco ser una seal de entrada muy buena para identia n car sistemas. En la prctica, sin embargo, es muy dif obtener una seal de entrada a cil n que se comporte como un ruido blanco ideal, porque es muy dif obtener una secil cuencia de valores puramente aleatorios. Es posible obtener sin embargo, secuencias de valores seudoaleatorios, por lo que en la prctica se recurre a secuencias seudoaleatorias a de escalores binarios (PRBSS: Pseudo Random Binary Step Sequence). En la gura 3.3 se muestra una de esas secuencias. Ntese que los escalones no tienen por qu tener o e amplitud unitaria, el concepto de binario se reere solamente a dos niveles de entrada distintos. Por otra parte, la aleatoriedad est en la duracin de los escalones y en el a o momento de aparicin de los mismos. o
6.5
5.5
voltaje
4.5
3.5
20
40
60
intervalos de muestreo
80
100
120
140
160
180
200
Figura 3.3: Ejemplo de seal de entrada del tipo PRBSS. n
3.3.2.
Convergencia e identicabilidad
Se dice que un sistema es identicable cuando usando un mtodo de identicacin e o adecuado se tiene que l E()) = 0 m
N
y adems la salida obtenida mediante el modelo estimado es posible. Es decir, para a un sistema identicable el valor del vector de parmetros estimado converger con un a a nmero de observaciones sucientes al valor real de esos parmetros. No obstante, esta u a
60
ALGUNAS PROPIEDADES
convergencia tiene a su vez una serie de requisitos o condiciones que se pueden resumir en:
El orden del modelo y el retardo deben ser conocidos. Los valores de continua de la seal de entrada y la de salida deben ser conocidos. n Si el sistema es de orden n, la seal de entrada debe ser persistentemente excitan dora de orden n o mayor. Las perturbaciones sobre la salida deben ser ruidos estacionarios. El error en el instante k debe ser incorrelado con los elementos de los que depende la salida en el instante k (es decir, de los valores pasados de la entrada y la salida). El valor esperado (esperanza matemtica) del error en k debe ser cero, es decir a E{e(k)} = 0. Finalmente, la convergencia tambin depende de los valores iniciales del estie mador.
3.3.2.1.
Identicacin en bucle cerrado o
Como se coment en la seccin 3.2.1, a veces resulta bastante dif identicar en o o cil bucle cerrado. Esto es especialmente cierto cuando el lazo de control es simple, el regulador lineal y adems no se emplean seales externas (a modo de perturbaciones) para a n excitar toda la dinmica del sistema. Existen una serie de condiciones para establecer a la identicabilidad de un sistema en bucle cerrado. Supngase que se parte del siguiente o modelo para identicar un sistema: A(z 1 )y(k + d) = B(z 1 )u(k) + C(z 1 )e(k + d) donde d es el retraso del proceso, y los grados de los polinomios A(z 1 ), B(z 1 ), C(z 1 ) son ma , mb , mc respectivamente. Supngase adems que el sistema est gobernado por o a a un regulador que toma la expresin: o u(t) = Q(z 1 ) y(t) P (z 1 )
donde los grados de Q y P son v y w respectivamente. Teniendo en cuenta todo esto, se formulan las siguientes condiciones de identicabilidad en bucle cerrado.
61
Primera condicin de identicabilidad en bucle cerrado o Los ordenes del modelo del proceso y de las perturbaciones deben ser conocidos con exactitud. Segunda condicin de identicabilidad en bucle cerrado o Si los polinomios A(z 1 ) y C(z 1 ) tienen p ceros comunes (en caso de que sean primos entre si, p = 0) se ha de cumplir que mx(w mb , d + v ma ) p a Si esto no se cumpliese, la solucin pasa por jar alguno de los parmetros del modelo o a a n de bajar los grados ma o mb . Si fuera factible aumentar el retraso, tambin e podr usarse esto para lograr la identicabilidad en bucle cerrado. Ntese que por a o estos procedimientos lo que se consigue es que el proceso de identicacin converja a o un valor del vector de parmetros que corresponde con el que da un menor error. No a quiere decir que el sistema real se describa mejor por ese modelo. Es decir, puede que exista otro modelo del mismo orden mejor, pero si no se toman las medidas indicadas no se llegar a ese modelo ni probablemente se converger a ningn otro. a a u Un caso comn es que p = 0 y ma = mb = n, por lo que esta condicin se puede u o expresar como mx(w, v + d) n a Ejemplo 3.1 Supongamos que ma = mb = n y que u(k) = G(z 1 ) y(k) zB(z 1 )F (z 1 )
y que los ordenes de G(z 1 ) y F (z 1 ) son n 1 y d respectivamente. Entonces se cumple que v =n1 w =n+d1 por lo que la condicin de identicabilidad ser que o a mx(n + d 1, n 1 + d) n a Esto implica que para que el sistema sea identicable en bucle cerrado, d 1. Otra solucin ser jar un parmetro. o a a
62
ALGUNAS PROPIEDADES
3.3.3.
Niveles de supervisin y acondicionamiento o
En la identicacin en l o nea es habitual introducir un nivel de supervisin y tratamieno to de las seales a n de evitar que se produzcan situaciones que desestabilicen la n identicacin, es decir, que el valor del vector de parmetros identicado no converja o a o converja a un valor incorrecto. Las tareas que se pueden realizar en estos niveles incluyen:
Filtrado de datos a la entrada del identicador para evitar cambios bruscos en los parmetros estimados. a Acondicionamiento de seales: eliminacin de los valores de continua y escalado n o de las variables. Supervisar que la evolucin de los parmetros est dentro de unos rangos detero a e minados. Monitorizar otros elementos del algoritmo de identicacin. o Monitorizar la introduccin de riqueza dinmica al sistema: paradas temporales o a del identicador e inyeccin de perturbaciones. o
Cap tulo 4 Identicacin por m o nimos cuadrados

4.1. El mtodo de los m e nimos cuadrados
Este mtodo permite la identicacin en tiempo real de modelos con el unico reqe o uisito de que estos sean lineales en los parmetros. Esto incluye, por tanto, a modelos a lineales y no lineales que sean lineales en los parmetros. El mayor interes prctico rea a side, sin embargo, en la identicacin de los primeros, dado que son los ms utilizados o a en control. Considerse el siguiente modelo paramtrico lineal monovariable1 : e e y(k) + a1 y(k 1) + + an y(k n) = b1 u(k 1) + + bn u(k n) (4.1)
Ntese que este modelo es determinista en el sentido de que no considera ruidos aleatoo rios como en los modelos vistos en el tema 2. Es inmediato comprobar que este modelo corresponde a la siguiente funcin de transferencia: o G(z 1 ) = b1 z 1 + + bn z n 1 + a1 z 1 + + an z n
El modelo (4.1) se puede reescribir como: y(k) = m(k)

1
(4.2)
Este mtodo se puede aplicar sin cambios conceptuales a modelos multivariables. Sin embargo por e simplicidad nos ceiremos al caso de modelos monovariables. n
63
64
EL METODO DE LOS M INIMOS CUADRADOS
donde el vector m(k) = y(k 1) y(k n) u(k 1) u(k n) = a1 a n b 1 b n

T
(4.3)
es llamado regresor y
es el vector de parmetros. Dado un valor del vector de parmetros , el error de a a prediccin para el instante k ser o a e(k, ) = y(k) y (k) = y(k) m(k) Ntese que conocido el valor de los valores presentes y pasados de la salida y la entrada, o la expresin (4.2) es una ecuacin en las que las 2n incognitas son los parmetros que o o a forman . Si el proceso a identicar correspondiese exactamente con un modelo como (4.1) se podr determinar el valor del vector de parmetros a partir de 2n medidas u a a observaciones de la salida para una serie de entradas conocidas. Es decir, se formar a un sistema de 2n ecuaciones con el que se podr determinar el valor ((real)) de . a El mtodo de los m e nimos cuadrados parte de N pares (y(k), m(k)) donde N es generalmente mucho mayor de 2n (este ser el conjunto de estimacin) y permite a o ajustar un modelo del tipo (4.1). En el supuesto poco realista de que el proceso coincida con un modelo como el que se intenta ajustar, se tendr un sistema de ecuaciones a sobredeterminado compatible, de manera que tendr solucin y el error de prediccin a o o alcanzado ser cero para todas las medidas del conjunto de estimacin. Sin embargo, a o en la prctica el proceso no se puede describir a la perfeccin mediante un modelo lineal a o del tipo (4.1) por lo que el sistema de ecuaciones no tiene solucin en el sentido de que o no existe un valor del vector de parmetros que haga que el error de prediccin sea cero a o para todas las medidas del conjunto de estimacin. Es decir, el sistema de ecuaciones o es incompatible. Sin embargo si se puede encontrar un valor del vector de parmetros a que haga m nimo el error de prediccin, de manera ms precisa que haga m o a nima la suma de los cuadrados de los errores de prediccin del conjunto de estimacin. Esta es o o 2 precisamente la estrategia del mtodo de m e nimos cuadrados . Las medidas obtenidas desde k = n hasta k = N se agrupan en vectores de manera que se obtiene: E(N, ) = Y (N ) M (N ) donde los vectores E(N ) e Y (N ) son E(N, ) = Y (N ) =
2
e(n, ) e(N, ) T y(n) y(N )
En un contexto matemtico se dir que el vector de parmetros que se calcula es la pseudosolucin a a a o en el sentido de los m nimos cuadrados de un sistema sobredeterminado incompatible.
CAP ITULO 4. IDENTIFICACION POR M INIMOS CUADRADOS
65
Se dene el ndice de bondad de ajuste como J() = E(N, ) Este ndice lo podemos reescribir como
y la matriz M (N ) est formada por los regresores correspondientes, es decir a m(n) . . M (N ) = . m(N )
N 2
=
k=n
e2 (k, )
J() = (Y (N ) M (N ))T (Y (N ) M (N )) El m nimo valor de J() se dar en el valor del vector de parmetros que cumpla que a a dJ() =0 d es decir, 2(M (N ) Y (N ))T M (N ) = 0 de donde se obtiene que el valor del vector de parmetros que hace m a nimo el ndice de bondad de ajuste es = [M T (N )M (N )]1 M T (N )Y (N ) y ese es por tanto el valor del vector de parmetros del modelo identicado. a Ntese que para que el problema de identicacin tenga solucin la matriz [M T (N )M (N )] o o o tiene que ser invertible al igual que M (N ). Sin entrar en demasiados detalles, tal condicin se verica cuando la entrada cumple las condiciones de excitacin persistente del o o sistema. Se deber acudir por tanto a seales de entrada parecidas al ruido blanco (ver a n tema 3). (4.4)
4.2.
Algoritmo recursivo para identicacin en lino ea
La expresin (4.4) implica la inversin de una matriz que puede tener unas dimeno o siones apreciables, tanto ms si se tiene en cuenta que para identicar correctamente a
66
ALGORITMO RECURSIVO PARA IDENTIFICACION EN LINEA
un sistema se deben tener sucientes medidas para eliminar el efecto de ruidos y perturbaciones ajenas a la dinmica del sistema. Intentar efectuar estos clculos en linea a a 3 es bastante ambicioso para el hardware de control habitual . Por tanto este algoritmo se destina a la identicacin fuera de linea. En linea se emplea otro procedimiento que o se muestra a continuacin. o La estimacin para el instante k usando las medidas obtenidas desde el instante n o vendr dada por a (k) = [M T (k)M (k)]1 M T (k)Y (k) = P (k)M T (k)Y (k) = P (k)(M T (k 1)Y (k 1) + mT (k)y(k)) donde
k 1
(4.5)
P (k) = [M (k)M (k)]
=
i=n
m (i)m(i)
es la llamada matriz de covarianza. Se puede comprobar que P 1 (k 1) = P 1 (k) mT (k)m(k) Por otra parte tambien se puede obtener que M T (k 1)Y (k 1) = P 1 (k 1)(k 1) = P 1 (k)(k 1) mT (k)m(k)(k 1) Combinando las dos ultimas expresiones con (4.5) se obtiene (k) = = = (k 1) P (k)mT (k)m(k)(k 1) + P (k)mT (k)y(k) T (k 1) + P (k)m (k)(y(k) m(k)(k 1)) (k 1) + K(k)(y(k) m(k)(k 1))
(4.6)
donde K(k) = P (k)mT (k). Por tanto (k) se puede expresar en forma recursiva, es decir en funcin del valor del estimador en el instante anterior ms un trmino corrector o a e que consiste en el error de prediccin en el instante actual cometido por el estimador o calculado en el instante anterior multiplicado por una ganancia de adaptacin K(k). o Esta formula da lugar al llamado algoritmo de minimos cuadrados recursivos, que consiste en 1. Dar valores iniciales a la matriz P y al vector de parmetros . a
Tngase en cuenta que el hardware industrial no se renueva tan rpidamente como el usado e a en informtica personal y que adems tampoco se incorporan las ultimas tecnologias con la misma a a rapidez.
3
67
2. En cada instante k a) Leer los valores de y(k) y u(k). b) Formar el vector regresor m(k) segn la expresin (4.3). u o c) Calcular P (k) mediante P (k) = P (k 1) P (k 1)mT (k)m(k)P (k 1) 1 + m(k)P (k 1)mT (k)
d ) Calcular K(k) segun la expresin o K(k) = P (k)mT (k) e) Calcular (k): (k) = (k 1) + K(k)[y(k) m(k)(k 1)] Este algoritmo puede intepretarse grcamente como se ilustra en la gura 4.1. a
PLANTA + FORMAR REGRESOR -
ALGORITMO RECURSIVO
Z-1
Figura 4.1: Diagrama de ujo del proceso de identicacin mediante m o nimos cuadrados recursivos.
4.3.
Interpretacin estad o stica
En esta seccin se presentan las propiedades estad o sticas del estimador obtenido por el mtodo de m e nimos cuadrados en funcin de las caracter o sticas del proceso que se trata de identicar.
AGF EDC &% #$ ( '
A@9 86 7 10) 23 5 4
ARQ PH ARSQI VQ IUT I R
A@9 78B
68
INTERPRETACION ESTAD ISTICA
Supongase que el proceso que se pretende modelar responde bien a un modelo ARMAX o bien a un modelo ARX-LS (vease la seccin 2.4). Considerese que la variable o aleatoria v(k) corresponde a un ruido blanco. La diferencia entre estos dos tipos de modelos es el grado del polinomio coloreador del ruido C(z 1 ) que denotaremos por cn . En el ARMAX cn > 0 por lo que la variable aleatoria v(k) y sus valores pasados hasta el instante k cn afectan al valor de la salida en k. En el caso del ARX LS el grado de C(z 1 ) es cero, por lo que la salida en k viene afectada por el valor de la seal n de ruido en el instante k exclusivamente. Esto implica que en el caso del ARMAX la salida depende de los valores pasados de v(k) mientras que en el caso del ARX-LS esta dependencia es exclusivamente con el valor actual de v(k). Un hecho a tener en cuenta es que al ser v(k) una variable aleatoria, y(k) es a su vez una variable aleatoria al ser el ruido aditivo. Esto implica a su vez que el valor del vector de parametros estimado tambien es una variable aleatoria que se puede estudiar desde un punto de vista estad stico. Por responder el proceso exactamente a uno de los dos tipos de modelos considerados existe un valor del vector de parmetros a que consideraremos como verdadero. Es decir y(k) = mT (k) + C(z 1 )v(k) Resulta muy interesante saber si al aplicar el mtodo de los m e nimos cuadrados, el vector de parmetros estimados (k) coincide con . Dado que (k) es una variable a aleatoria estudiaremos su valor esperado, es decir su esperanza matemtica. Se dene a el sesgo de la estimacin como o = E (k) es decir como la diferencia entre el valor esperado de (k) y el valor ((verdadero)) . Se comprueba que = E [M T (k)M (k)]1 M T (k)V (k) (4.7) donde V (K) es una matriz donde la la correspondiente al instante k est formada por a los valores v(k), ,v(k cn ). Ntese adems que la la de M (k) correspondiente al o a instante k contiene los valores de la salida y de la entrada en los instantes k 1, ,k n pero no los del instante k (ver expresin (4.3)). o Considerese el caso del modelo ARMAX. Claramente existe relacin entre los como ponentes de la matriz M (k) y V (k). En efecto, la matriz de regresores est formada por a valores de la salida y la entrada. Los primeros dependen de los valores de la seal de n ruido y los segundos son deterministas, por lo que existe una correlacin entre la matriz o T M (k) y V (K). Por lo tanto tambien existe esa correlacin entre [M (k)M (k)]1 M T (k) o es distinto de cero. Por tanto no y V (k). Eso implica que segn la expresin (4.7) u o est garantizada la convergencia del vector de parmetros estimados con el ((real)). a a
69
La situacin es diferente con el modelo ARX-LS. En este caso los valores de M (k) o no pueden estar relacionados con V (k) (que, al ser cn = 0, solo est formada por los a valores presentes de v(k) para cada instante k). Por tanto, el estimador por m nimos = 0 y por tanto el valor esperado del estimador cuadrados es insesgado, es decir coincide con el valor real del vector de parmetros, es decir a E (k) =
Por otra parte, el hecho que de que el proceso responda a uno u otro tipo de modelo tiene una interpretacin f o sica inmediata. En el caso del proceso ARMAX el ruido presenta una cierta dinmica , mientras que en el caso del ARX-LS el ruido no a presenta dinmica alguna y responde unicamente a un ruido proveniente del sensor a de medida. Es en este ultimo caso cuando el mtodo de m e nimos cuadrados produce estimaciones consistentes. Otra propiedad que resulta interesante conocer es la varianza del estimador. Claramente interesa que esta varianza sea pequea o por lo menos que disminuya conforme n se acumulan medidas disponibles para usarlas en la estimacin. De esa manera, el veco tor de parmetros estimados estar con seguridad cerca del vector real. La varianza del a a estimador se puede calcular como varianza((k)) = E ((k) )T ((k) ) = 2 P (k) donde = E{v(i)v(j)} para i = j. Ntese que para que la varianza sea pequea o n interesa que P (k) sea ((pequea)) o que al menos decrezca a medida de que k aumenta. n Una medida del tamao de P (k) es su traza, por lo que se usa como una medida de la n exactitud de la estimacin, de manera que se busca que la traza vaya decreciendo. o Esta interpretacin estadistica del tamao de P (k) tambien proporciona una regla o n para dar un valor inicial a la matriz P (k). En efecto, en general no se tendr demasiada a conanza en que el valor inicial del vector de parmetros estimados, por lo que se a escoger una matriz P (0) ((grande)) para reejar esa desconanza, por ejemplo P (0) = a pI donde p es un nmero muy alto (por ejemplo 10000). Este nmero ser mas pequeo u u a n si se sabe que el valor inicial del vector de parmetros est cerca de . a a Por otra parte, es evidente que a medida que el numero de observaciones N crece la suma
N
mT (k)m(k)
k=n
70
M INIMOS CUADRADOS PONDERADOS
crece. Recuerdese que, segun se deni en la seccin 4.2 o o

k 1
P (k) =
i=n
mT (i)m(i)
lo que implica que a medida que N crece P decrece. Se puede demostrar que si el 1 tamao del regresor no cambia demasiado P decrece como N . Esto quiere decir que la n incertidumbre en la estimacin decrece, es decir, que cada vez se obtiene un estimador o ms cercano al valor real. Adems la ganacia de adaptacin K(k) tambien decrece a a o (vease su denicin en la seccin 4.2) lo cual es congruente con el hecho de que cuanto o o ms exacta es la estimacin menos correccin de su valor se necesita. Esto es bueno a o o si la dinmica del proceso no cambia con el tiempo, pero si esto no es as habr que a a modicar este esquema.
4.4.
M nimos cuadrados ponderados
A veces es conveniente dar ms peso a algunas medidas que a otras en la estia macin. Por ejemplo si se identica un proceso cuya dinmica cambia con el tiempo o a interesar dar mas peso a las medidas ms recientes, pues estas sern las que reejen la a a a dinmica ms actualizada. Para conseguir esto hay que modicar el a a ndice de bondad de ajuste, de manera que se use
N
J() = E(N, ) W (N )E(N, ) siendo W (N ) la matriz diagonal de pesos w(n) ... W (N ) =
=
k=n
w(k)e2 (k, )
w(N ) (4.8)
La solucin del problema de ajuste es en este caso o
= [M T (N )W (N )M (N )]1 M T (N )W (N )Y (N )
El esquema de ponderacin ms habitual es el llamado olvido exponencial . En este o a caso w(k) = N K
71
, donde (0, 1) es el llamado factor de olvido. Es fcil entender por que se le llama a olvido exponencial: el peso dado a la medida disminuye exponencialmente cuanto ms a antigua sea. De esta manera las medidas muy antiguas se olvidan, pues su peso es tan pequeo que es como si no se contribuyesen a la estimacin. Habitualmente se usa n o [0,98, 1). Por ejemplo, si = 0,99 el estimador tendr una ((memoria)) de unas 100 a muestras. En aquellos casos que la dinmica del proceso cambie muy rpidamente se a a puede optar por valores ms bajos (por ejemplo, = 0,95). a En el caso de la tcnica de olvido la formulacin recursiva puede aplicarse modie o cando las expresiones para el calculo de P (k) de manera que: P (k) = P (k 1) P (k 1)mT (k)m(k)P (k 1) + m(k)P (k 1)mT (k)
Puede observarse que, dado que K(k) = P (k)mT (k), la ganancia de adaptacin K(k) o depende de y a menor mayor ganancia de adaptacin. Esto quiere decir que a menor o mejor se adaptar la identicacin a una dinmica cambiante, ya que se considerar a o a a en la optimizacin solo la informacin ms reciente. o o a Sin embargo si en el sistema o en las medidas hay mucho ruido, es conveniente que la dinmica se identique sobre un conjunto amplio de medidas ya que si no se a identicar el ruido ms que la dinmica del proceso. Por tanto en estos casos conviene a a a que no sea muy pequeo. Por tanto hay que llegar a un compromiso entre la capacidad n de seguir una dinmica cambiante y el rechazo del ruido en la identicacin. a o
4.5.
M nimos cuadrados extendidos y generalizados
Segn se explic en la seccin 4.3 el estimador obtenido mediante m u o o nimos cuadrados es insesgado si el proceso responde a un modelo ARX-LS, pero no si responde a un modelo ARMAX. En la prctica, si la relacin seal-ruido es baja el proceso ha de a o n modelarse con un modelo de perturbaciones ms complejo que el del ARX-LS ya que a la seal de ruido y su inuencia sobre la dinmica son importantes. En estos casos se n a debe recurrir a un modelo ARMAX. El mtodo de los m e nimos cuadrados extendidos trata de resolver el problema del sesgo en la estimacin de modelos ARMAX. La solucin es incluir los coecientes del o o 1 polinomio C(z ) en el vector de parmetros del estimador, es decir a = a1 a n b 1 b n c 1 c n
T
72
ESTIMACION DE LOS VALORES DE CONTINUA
Sin embargo, los valores pasados de la seal de ruido v(k) no son medibles, por lo que n no se pueden incluir en el regresor. Lo que se hace es aproximarlos por los errores de prediccin, es decir o e(k) = y(k) m(k)(k 1) Si el proceso coincidiera exactamente con el modelo para algun valor del vector de parmetros, entonces si los parametros evolucionasen en la direccin correcta la aproxa o imacin de los valores de los ruidos por los errores cada vez ser ms correcta y o a a eventualmente se igualar an, es decir v(k) = e(k). El regresor se formar entonces a como, m(k) = y(k 1) y(k n) u(k 1) u(k n) e(k 1) e(k n)
El resto del procedimiento es exactamente igual, tanto en las formulaciones fuera de linea como en linea. Con este mtodo se consiguen estimaciones insesgadas y consistentes e para procesos que respondan como un modelo ARMAX. Los problemas son un aumento de la carga de calculo y una menor velocidad de convergencia en los parmetros ci a debido a que la seal de ruido no es la ms preponderante. n a Finalmente, existe otra variante de los m nimos cuadrados que son los m nimos cuadrados generalizados. Sin entrar en demasiados detalles, esta formulacin se usa o 1 cuando se tiene algn conocimiento del valor real del polinomio C(z ) o de la matriz u P (matriz de covarianza). En este caso si la matriz N denida como N = E vv T es distinta de la matriz identidad se obtienen mejores resultados si el criterio que se utiliza es J() = eT (k, )N 1 e(k, )
4.6.
Estimacin de los valores de continua o
Una de las condiciones necesarias para asegurar la convergencia que se mencionaron en el tema 3 era que es necesario conocer los valores de continua de la seal y eliminarlos n de las medidas usadas en la identicacin. Es decir para identicar un proceso hay que o utilizar seales sin componente continua: n u(k) = U (k) U y(k) = Y (k) Y
donde U (k) e Y (k) son los valores reales de la salida y la entrada y U e Y son los valores de continua de ambas seales. Para estimar dichos valores existen diversas n opciones.
73
4.6.1.
Utilizacin de los incrementos de las variables o
En este caso se toman los incrementos de las seales, es decir n uID (k) = u(k) u(k 1) = (U (k) U ) (U (k 1) U ) = U (k) U (k 1) donde la seal uID (k) es la seal de entrada que se utiliza en la identicacin. Como n n o se puede observar, al usarse el incremento, se resta de manera implicita la componente continua. Lo mismo se hace con la salida yID (k) = y(k) y(k 1) = (Y (k) Y ) (Y (k 1) Y ) = Y (k) Y (k 1) Evidentemente, lo que se obtiene al identicar es un modelo incremental, es decir formulado en incrementos de y(k) y u(k) y este incremento se tendr que deshacer si a lo que se quiere son los valores no incrementales de dichas seales. n
4.6.2.
Clculo de los valores medios a
La idea es aproximar los valores de continua por los valores medios de las seales. n En el caso de la formulacin fuera de linea estos valores medios se calculan mediante o las expresiones tradicionales, es decir U = 1 N
N
u(i)
i=1
Y =
1 N
y(i)
i=1
para la identicacin en linea, es decir mediante algoritmos recursivos, se emplean las o siguientes expresiones U (k) = U (k 1) + Y (k) = Y (k 1) + 1 (U (k) U (k 1)) k 1 (Y (k) Y (k 1)) k
4.6.3.
Estimacin de una constante o
La idea en este caso es que el modelo que se pretende identicar puede reescribirse como Y (k) Y = a1 (Y (k 1) Y ) a2 (Y (k 1) Y ) an (Y (k n) Y ) +b1 (U (k d 1) U ) + + bn (U (k d n) U )
74
IMPORTANCIA DEL ORDEN DEL MODELO
lo cual a su vez se puede poner como Y (k) = a1 Y (k 1) an Y (k n) +b1 U (k d 1) + + bn U (k d n) + K siendo K una constante que vale K = (1 + a1 + + an )Y (b1 + + bn )U (4.9)
Para estimar la componente continua se modica el algoritmo de manera que en el vector de parmetros se incluye K a = a1 a n b 1 b n K
T
y en el regresor se incluye un 1 m(k) = y(k 1) y(k n) u(k 1) u(k n) 1
Una vez estimado el valor de K, lo que se hace es dar un valor arbitrario a Y , por ejemplo igual al valor de la referencia o consigna. Con ese valor se calcula U mediante la expresin (4.9). o
4.7.
Importancia del orden del modelo
El orden del sistema a identicar es algo que debe ser conocido para asegurar la convergencia e identicabilidad (ver tema 3). En la prctica esto no es sencillo, y se a debe recurrir a probar con varios modelos de ordenes y estructuras distintas a ver cual resulta mejor. Esto quiere decir que se pueden dar situaciones de mala estimacin del o orden del modelo por defecto (incurriendose en lo que se llama infraparametrizacin) o o por exceso (sobreparametrizacin). o Veamos que ocurre cuando se intenta aproximar un sistema por un modelo de orden inferior. Si esto sucede se llega a una situacin en la que el modelo solo puede o aproximar al sistema real en una banda de frecuencia relativamente estrecha. Si durante el transcurso del proceso de identicacin la seal de entrada cambia su contenido o n frecuencial, el modelo estimado (es decir su vector de parmetros) evoluciona hasta a aproximar al sistema en torno a la nueva banda de frecuencias. Todo esto implica que se obtendr un modelo distinto dependiendo de la seal de entrada. Este problema se a n ilustra en las guras 4.2 y 4.3. En ambas se muestra el diagrama de bode de un sistema de segundo orden sobre el que ha sido identicado un modelo de primer orden mediante dos entradas senoidales de distinta frecuencia. Puede observarse en ambas guras que
75
20 10
amplitud dB
0 10 20 30 40 1 10 10
0
10
0 50
desfase (grados)
100 150 200 250 1 10
10 frecuencia rad/s
10
Figura 4.2: Diagrama de Bode de un sistema de segundo orden (linea continua) y de un modelo de primer orden estimado para una entrada senoidal de frecuencia = 0,2 rad s 1 .
20 10
amplitud dB
0 10 20 30 40 1 10 10
0
10
0 50
desfase (grados)
100 150 200 250 1 10
10 frecuencia rad/s
10
Figura 4.3: Misma situacin que en la gura 4.2 pero con una seal de entrada senoidal de frecuencia o n 1 = 1 rad s .
76
IMPORTANCIA DEL ORDEN DEL MODELO
el modelo obtenido no es sino una aproximacin del sistema original en el entorno de o la frecuencia de la entrada. Esto ocasiona por tanto que ambos modelos sean distintos.
A la vista de lo que ocurre cuando existe infraparametrizacin, parecer lgico que o a o resulte mejor sobreestimar el orden del modelo para evitar el continuo cambio de los parmetros del modelo estimado. Sin embargo esto no es una buena idea, pues puede a ocurrir que haya parmetros del modelo estimado que puedan tomar cualquier valor sin a que cambie la relacin que liga las entradas del modelo con las salidas. Esto se maniesta o en que algunos parmetros experimentan una deriva tomando valores arbitrarios muy a altos o muy bajos. Esto ocasionar problemas numricos. Esta situacin se ilustra a e o en la gura 4.4. En ella se muestra la evolucin de los parmetros de un modelo de o a cuarto orden identicado sobre el sistema de segundo orden utilizado en las guras 4.2 y 4.3. Puede observarse que algunos de los ocho parmetros identicados convergen y a permanecen estables a lo largo del proceso de identicacion. Sin embargo otros no solo no convergen sino que derivan hacia valores muy altos o muy bajos.
1.5 1 0.5
uey
0 0.5 1 1.5 0 5 10 15 20 25 30 35 40
1.5 1
a , b estimados
0.5 0 0.5 1
1.5 2 0 5 10 15 20 tiempo (s) 25 30 35 40
Figura 4.4: Evolucin de los parmetros identicados en un caso de sobreparametrizacin. o a o
Matemticamente el exceso de parmetros conduce a una situacin en la que ms a a o a de una combinacin de los valores del vector de parmetros producen la misma relacin o a o entre la entrada y la salida. Por tanto la sobreparametrizacin se maniesta tambin si o e se traza la grca de un parmetro del modelo frente a otros por que aparecen relaciones a a lineales. Esta situacin se ilustra en la gura 4.5. En ella se muestran dos ejemplos en o los que se presentan los valores de un parmetro en funcin del otro a medida que a o el proceso de identicacin avanza. Puede observarse que existe un marcado patron o lineal, que indica una dependencia lineal entre ambos parmetros. a

0.025 0.02 0.015 0.01 0.005 0 0.005 2 1.8 k=180 1.6 1.4 1.2 1 0.8 0.6 k=100 k=30
77
a1
1.5 1 0.5 0 0.5 2 k=30 1.8 1.6 1.4 a1 1.2 1 0.8 0.6 k=180 k=100
Figura 4.5: Evolucin de unos parmetros frente a otros para el modelo sobreparametrizado. o a
4.8.
Identicacin de sistemas con retardo o no lio neales
El mtodo de los m e nimos cuadrados puede aplicarse a procesos con retardo, siempre que se tengan en cuenta algunas cuestiones. El modelo determinista de un sistema con retardo puro de d periodos de muestreo se puede poner como A(z 1 )y(k) = B(z 1 )u(k d 1) Eso quiere decir que el regresor en el instante k debe contener valores pasados de la entrada desde k d 1 a k d n donde n es el grado del polinomio B(z 1 ). Por tanto el regresor queda m(k) = y(k 1) y(k n) u(k d 1) u(k d n)
Con esta modicacin cualquiera de los algoritmos de m o nimos cuadrados vistos anteriormente se puede aplicar a procesos con retardo. El problema estriba en que se ha de conocer exactamente el retardo (vease tema 3). El mtodo usual para conocer este e dato es provocar un cambio en la entrada y observar cuando se maniesta dicho cambio en la salida (ha de tenerse en cuenta que en todo sistema muestreado los cambios en la entrada se manifestarn como mucho en el siguiente periodo de muestreo). Este a sencillo esquema se puede complicar por ejemplo si el retardo es variable. Esto es ms a comn de lo que se cree, pues el retardo as como el resto de parmetros de un sistema u a suele depender del punto de funcionamiento (por ejemplo, los retardos de transporte ocasionados por tuberias dependen del caudal de material que se transporta). El problema es que, aunque los mtodos de identicacin propuestos puedan seguir cambios e o
78
CONSIDERACIONES FINALES
en los parametros del modelo (se adaptan a esos cambios) no recogen la posibilidad de un retardo variable (existen remedios a este problema, pero no se tratarn aqu a ). Otro problema que puede suceder es que el retardo no sea multiplo exacto del tiempo de muestreo. Aunque existen formas para describir retardos no enteros (por ejemplo, el uso de una expansin de Pad) es mas sencillo y menos problemtico emplear si es o e a posible otro tiempo de muestreo para hacer que el retardo sea entero. Finalmente se coment al principio del tema que el mtodo de m o e nimos cuadrados tambien permite la identicacin de sistemas no lineales con la limitacin de que el o o modelo a identicar sea lineal en los parmetros. De este modo, si el sistema se pretende a identicar con un modelo que por ejemplo podr ser a y(k) + ay(k 1) = bu2 (k 1) el regresor y el vector de parmetros ser a an m(k) = respectivamente. y(k 1) u2 (k 1) y (k) = a b
T
4.9.
Consideraciones nales
En esta seccin se enunciarn algunas cuestiones prcticas a tener en cuenta cuando o a a se implementa alguno de los algoritmos presentados en este tema. En primer lugar si no se emplea la tcnica de factor de olvido, la ganancia de adaptacin K(k) decrece e o hasta hacerse casi cero, por lo que cuando eso ocurre ya no se pueden seguir cambios posteriores de la dinmica. Por tanto para identicar sistemas cuya dinmica var a a a lentamente se ha de emplear m nimos cuadrados ponderados. Por otra parte, existen situaciones en las que la matriz de covarianzas P puede crecer demasiado, por lo que el identicador se har muy sensible a cualquier pequeo cambio de la dinmica o al a n a ruido. Esto ocurre por ejemplo cuando el punto de funcionamiento no var Lo que se a. puede hacer en este caso es utilizar un factor de olvido variable, de manera que si la traza de P crece demasiado se toma = 1. Si la traza de P baja mucho se va bajando , pero sin sobrepasar un cierto l mite que evita que el proceso de identicacin se haga o demasiado sensible al ruido. Otro aspecto es la eleccin del valor inicial de P . Se ha comentado que en el caso de o que no se tenga mucha conanza en el valor del vector de parmetros inicial, se propone a elegir P como una matriz diagonal pI siendo p un nmero arbitrariamente alto. Por u
79
otra parte si antes de comenzar la identicacin ya se dispone de 2n observaciones, o donde 2n es el nmero de parmetros a estimar, es posible tomar como valor inicial u a P (0) = M T (2n)M (2n)
1
y como valor inicial del vector de parmetros se puede usar = P (0)M (2n)Y (2n). a
80
CONSIDERACIONES FINALES
Cap tulo 5 Introduccin al control adaptativo o

5.1. Planteamiento del problema
En el contexto del control automtico el trmino adaptativo se reere a la facultad a e de cambiar el comportamiento o parmetros del control en respuesta a cambios en las a circunstancias del sistema controlado. Un regulador adaptativo ser aquel que pueda a modicar su comportamiento en respuesta a cambios en la dinmica del sistema y/o en a las perturbaciones a las que se ve sometido dicho sistema. En realidad esto es tambin e lo que se persigue cuando se introduce la realimentacin en un sistema de control. En o efecto, el control realimentado fundamenta su efectividad en el hecho de que es capaz de reaccionar a los cambios del estado o salida del proceso (los cuales pueden venir motivados por perturbaciones o tambin cambios en la dinmica del proceso) actuando e a de manera que dicho estado o salida se mantenga controlado. En general se acepta que el control adaptativo es un tipo de control no lineal en el que el estado del proceso puede ser separado en dos escalas de tiempo que evolucionan a diferente velocidad. La escala lenta corresponde a los cambios en los parmetros del a regulador y la escala rpida a la dinmica del bucle ordinario de realimentacin. a a o La conguracin t o pica de un controlador adaptativo es la que se ilustra en la gura 5.1. Como se puede observar hay un bucle principal de realimentacin negativa en el que o aparece un regulador ajustable y otro bucle que se utiliza para ajustar los parmetros de a dicho regulador. Para ello, se obtiene un cierto ndice de actuacin en el cual se expresa o la bondad o comportamiento del controlador. Dicho ndice de actuacin se compara con o un cierto comportamiento deseado y segn el resultado de dicha comparacin se ajustan u o 81
82
PLANTEAMIENTO DEL PROBLEMA
REFERENCIA
COMPORTAMIENTO DESEADO
Figura 5.1: Conguracin genrica de un controlador adaptativo. o e
los parmetros del regulador. Para ello se utiliza un mecanismo de adaptacin que en a o algunos casos (no siempre) tambin puede actuar directamente sobre la actuacin o e o seal de control que recibe el proceso. En algunos casos se aade un tercer bucle que n n tiene como tarea la supervisin del sistema de manera que, por ejemplo, se garantice la o estabilidad del sistema en bucle cerrado o se eviten ciertos comportamientos indeseados tales como cambios demasiado abruptos en los parmetros del regulador ajustable. a Es fcil ver que en el esquema anterior el mecanismo de adaptacin realiza la tarea a o de resolver en tiempo real el problema de disear un regulador apropiado (en el caso n ms sencillo con una estructura predenida) para un sistema dado de manera que se a cumplan unas determinadas especicaciones de diseo (dadas por el ((comportamiento n deseado))). Existen otros controladores que proporcionan una cierta capacidad de adaptacin o pero que no encajan en la denicin anterior ya que la adaptacin se realiza en bucle o o abierto, es decir, para adaptar la ley de control no se usan las medidas de la salida o estado de la planta. Este es el caso de los controladores gain scheduling los cuales se tratarn en la seccin 7.4. a o
5.1.1.
Clasicacin grosso modo de los sistemas de control o adaptativo
De una manera general los sistemas de control adaptativo se pueden clasicar en dos grandes grupos:
`YUyrebYyi Wiv W q sWuq ` grrqs q i q
bfpg i `i
`YWyeb uri i iq sX xyfiW q `
egrexywvui ib t dX igXdb hsqrphfec`aXYW
` W hxYrq
CAP ITULO 5. INTRODUCCION AL CONTROL ADAPTATIVO
83
Controladores adaptativos por modelo de referencia (MRAC). Reguladores autoajustables (STR).
Ambas estrategias suponen que para cualquier juego de valores de los parmetros del a sistema y las perturbaciones, existe un controlador lineal que hace que el sistema en bucle cerrado cumpla los requisitos de diseo. n Los MRAC intentan alcanzar un comportamiento en bucle cerrado deseado que viene especicado por un modelo de referencia. Por otra parte, los STR intentan alcanzar un control lo mejor posible (ptimo) a partir de un tipo de controlador prejado y o la informacin obtenida del proceso (seales de entrada, salida, etc. . . ). o n Las dos tcnicas tienen sus ventajas e inconvenientes. Las ventajas del MRAC pasan e por una rpida adaptacin y la posibilidad de utilizar formulaciones que garanticen a o estabilidad (usando mtodos de Lyapunov). Sin embargo, la capacidad de adaptacin e o de estas estrategias dependen en gran medida de la riqueza dinmica de la seal de a n control (esto es anlogo a lo que ocurre en la identicacin de sistemas, vase el tema a o e 3). Por otra parte, los STR se adaptan bien en casi todas las situaciones y son fciles de a implementar pues admiten tcnicas de programacin modular. Sin embargo, tambin e o e presentan sus propios inconvenientes como se ver ms adelante. a a Otra posible clasicacin de los sistemas de control adaptativos es aquella que o atiende a la forma de obtener los parmetros del controlador. En este esquema podemos a encontrarnos:
Controladores adaptativos con diseo mediante criterio optimo. n Controladores adaptativos con diseo mediante criterio no optimo. n
En los primeros el valor de los parmetros se obtiene buscando entre los posibles valores a aquellos que hacen optimo un cierto criterio de comportamiento del sistema. Es decir, optimizan un criterio de comportamiento o funcionamiento. En este grupo estudiaremos los controladores de m nima varianza y m nima varianza generalizado. Tambin e se puede considerar en este grupo el control predictivo basado en modelo (al que dedicaremos un amplio cap tulo ms adelante) cuando este tipo de control se utiliza como a controlador ajustable en alguno de los esquemas de control adaptativo referidos al principio del tema.
84
JUSTIFICACION DEL USO DE CONTROL ADAPTATIVO
Los controladores adaptativos sin criterio optimo buscan los parmetros del contro a lador no mediante la optimizacin de un criterio de funcionamiento sino entre aquellos o que cumplen unas ciertas especicaciones, por ejemplo, la colocacin de los ceros y los o polos de bucle cerrado. En estos esquemas el controlador ajustable puede ser por ejemplo un regulador PID, un controlador dead-beat como los estudiados anteriormente o un controlador por asignacin de polos o de ceros y polos. En tiempo real se resolver el o a problema de disear dichos controladores, de manera que a pesar de los cambios en el n proceso se sigan cumpliendo las especicaciones de diseo. n
5.2.
Justicacin del uso de control adaptativo o
El control adaptativo conlleva una serie de inconvenientes que pueden hacernos cuestionar su uso. Por ejemplo, su sinton no suele ser tan sencilla como la de los clsicos a a controladores PID. Por tanto, hay que ver en que situaciones puede ser ventajoso su uso y en que situaciones es mejor quedarse con controladores ms sencillos. a En general un controlador convencional est pensando para controlar sistemas cuyos a parmetros permanecen constantes (es decir, su dinmica no var Esta suposicin se a a a). o corresponde ms o menos con la de un sistema que suele operar siempre cerca de un a determinado punto de operacin y cuyas perturbaciones no son grandes (en relacin a o o la variable controlada) y no var demasiado. Sin embargo, puede suceder que el punto an de trabajo var frecuentemente y en algunos sistemas puede suponer una variacin de e o su dinmica lo sucientemente importante para afectar al rendimiento del controlador. a Por ejemplo, supongamos un sistema realimentado en el que el actuador presenta una caracter stica de transferencia no lineal (gura 5.2). Esta situacin corresponde por o
+ u
f(u)
G(s)
Figura 5.2: Sistema realimentado con actuador con caracter stica v = f (u).
ejemplo a la caracter stica instalada de un vlvula que usualmente suele ser no lineal. a Supongamos que el caudal de salida de la vlvula viene dado por una expresin C = a o 4 A , donde es una cierta constante y A la apertura porcentual de la vlvula. En la a gura 5.3 se muestra dicha caracter stica instalada (trazo slido). A la hora de disear o n el sistema de control se intentar obtener un modelo linealizado del actuador, que a
85
evidentemente saldr diferente en funcin del punto de operacin. Si el controlador a o o se ve forzado a trabajar en distintos puntos de operacin su rendimiento no podr ser o a igual de bueno en todos, de manera que este esquema ir bien si el punto de operacin a o no se mueve demasiado. Una solucin ser trabajar con un modelo linealizado a tramos o a de la caracter stica de la vlvula (gura 5.3 trazo discontinuo), de manera que en cada a punto de funcionamiento el controlador adaptar su comportamiento (variando sus a parmetros de diseo) de acuerdo al modelo linealizado que se tenga en cada caso. En a n
16
14
12
10
caudal (m /h)
10
20
30
40
apertura (%)
50
60
70
80
90
100
Figura 5.3: Sistema realimentado con actuador con caracter stica v = f (u).
general, cuando la variacin en los parmetros del sistema o los actuadores se conoce o a de antemano y adems se puede establecer una dependencia entre dichos parmetros a a y el punto de operacin (o una variable auxiliar) se puede recurrir a tcnicas sencillas o e de control adaptativo como el gain scheduling (vase la seccin 7.4). En caso contrario e o tendr amos que recurrir a tcnicas ms sosticadas. e a Otro hecho a tener en cuenta es que no siempre es fcil juzgar la necesidad o a no de utilizar el control adaptativo. Considrese el sistema dado por la funcin de e o transferencia G(s) = 1 (s + 1)(s + a) donde a = 0,01, 0, 0,01 (5.1)
La primera aproximacin a este sistema ser hallar su respuesta ante escaln, para o a o los diversos valores de a. Como se ilustra en la gura 5.4 (izquierda), dicha respuesta var mucho en funcin de los valores del parmetro a, pasando de hecho de ser un a o a sistema estable a otro inestable. Parecer que el sistema var lo suciente como para a a justicar el uso del control adaptativo. Sin embargo, la conguracin que realmente o nos interesa es la del sistema realimentado. En la gura 5.4 (derecha) se muestra la
86
JUSTIFICACION DEL USO DE CONTROL ADAPTATIVO
respuesta del sistema en bucle cerrado (realimentacin unitaria). En contra de lo que o podr amos suponer la respuesta en bucle cerrado es ms o menos la misma, por lo que, a siendo esta la conguracin en la que se va a trabajar, no ser necesario usar control o a adaptativo.
Step Response
Step Response
700
1.4
600
1.2
500
Amplitude
Amplitude
400
0.8
300
0.6
200
0.4
100
0.2
20
40
60
80
100
Time (sec)
120
140
160
180
200
6
Time (sec)
10
12
Figura 5.4: Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.1).
Es fcil poner un ejemplo en el que la situacin sea la inversa de la anterior. Cona o sidrese el sistema dado por la funcin de transferencia e o
G(s) =
20(1 T s) (s + 1)(s + 20)(T s + 1)
donde T = 0, 0,015, 0,03
(5.2)
En este caso la respuesta en bucle abierto del sistema es muy parecida independientemente de los valores de T (gura 5.5 izquierda). Cuando se le realimenta usando como entrada u = 15(ref y) se obtienen, sin embargo, comportamientos muy diferentes en funcin del valor de T (gura 5.5 derecha). Es por tanto que en este caso s estar o a justicado el uso de tcnicas de control adaptativo. El lector puede comprobar adems e a que no slo hay que juzgar en funcin del comportamiento en bucle cerrado en general, o o sino que hay que tener en cuenta cules van a ser las condiciones de operacin particua o lares en las que se va a trabajar. En efecto, si se obtiene la respuesta en bucle cerrado para el sistema (5.2) pero utilizando una realimentacin unitaria (esto es, u = (ref y)) o entonces las respuestas son esencialmente iguales independientemente del valor de T .

Step Response Step Response
87
1.5 0.9 0.8 0.7 1 0.6

Amplitude
0.5 0.4
Amplitude
0.5 0.3 0.2 0.1 0 0 0 1 2 3

Time (sec)
0.5
1.5
Time (sec)
2.5
Figura 5.5: Respuestas en bucle abierto (izquierda) y cerrado (derecha) del sistema dado en (5.2).
5.3.
Control adaptativo por modelo de referencia (MRAC)
Es una de las tcnicas ms antiguas de control adaptativo y se basa, como su nombre e a indica, en disponer de un modelo de bucle cerrado que es el que se desea que describa al conjunto controlador-planta. Es decir, se debe partir de un conjunto de especicaciones deseadas de bucle cerrado que se expresan mediante el modelo de referencia. El controlador ajustable deber adaptar sus parmetros para que el modelo de bucle cerrado a a del conjunto coincida o se acerque lo ms posible al modelo de referencia. La gura a 5.6 muestra la conguracin ms popular (no es la unica sin embargo) para este tipo o a de controladores. En dicha gura puede observarse un controlador primario ajustable que en principio puede ser cualqier tipo de controlador. El mecanismo de adaptacin o es el que se va a encargar de ajustar los parmetros del control primario para que la a diferencia entre la salida de la planta y el modelo de referencia sea lo ms pequea a n posible (es decir, que independientemente del valor inicial de esa diferencia, sta vaya e tendiendo a cero progresivamente). Adems de utilizar las seales tomadas de las salidas de la planta y el modelo, a n el mecanismo de adaptacin puede utilizar las seales de entrada, de referencia y si o n estuviesen disponible las variables de estado. En suma, toda la informacin disponible o sobre la planta y el comportamiento del sistema en bucle cerrado. Para disear un MRAC se ha de denir el modelo de referencia, el controlador y n la ley de adaptacin. En cuanto al modelo de referencia, sabemos que ste especica o e el comportamiento en bucle cerrado deseado. Por tanto, el modelo ha de ser tal que
88
CONTROL ADAPTATIVO POR MODELO DE REFERENCIA (MRAC)

ym + -
REFERENCIA
Figura 5.6: Conguracin genrica de un controlador adaptativo por modelo de referencia (MRAC). o e
el conjunto controlador ajustable-planta pueda reproducir dicho modelo. Es decir, no se puede escoger el comportamiento deseado de bucle cerrado sin pensar si el controlador ajustable es capaz de lograr (para alguna combinacin de sus parmetros) dicho o a comportamiento. Esto impone una serie de requisitos sobre el modelo, principalmente sobre el orden del mismo. Tampoco es realista escoger un modelo de referencia con una dinmica muy rpida en comparacin con la de la planta en bucle abierto. Por a a o supuesto es normal escoger la dinmica de bucle cerrado ms rpida que la de bua a a cle abierto, pero no se puede escoger de manera arbitrariamente rpida, ya que ello a desembocar en problemas de convergencia en los parmetros del controlador. a a Por otra parte para el controlador primario se puede pensar en casi cualquier estructura de control lineal, incluyendo los populares PI, PID, etc. . . Se deben cumplir sin embargo varios requisitos, entre ellos que la seal de control debe ser una funcin n o lineal de los parmetros. Tambin (suponindose jado el modelo) se debe escoger un a e e controlador ajustable que permita reproducir el modelo. Finalmente, para la ley de adaptacin existen diferentes estrategias en la literatura o de las cuales nombraremos el mtodo de hiperestabilidad y la estrategia basada en la e teor de estabilidad de Lyapunov (ambas estrategias aseguran la estabilidad de bucle a cerrado del sistema) y la primera y ms popular, el enfoque de sensibilidad o regla del a MIT.
toeUi s jg j
e s rxydfhwnoeUefk Yr j u k p v u j v g j j
ri jgh h d fjqYi pdPn d phkYoflgmafje p
SjYf{ezrYPzd|kr pu h erh r v k fdtipz r

u
yp
89
5.3.1.
La regla del MIT
Se basa en un ndice de actuacin, usualmente cuadrtico, que mide la bondad de o a la adaptacin en base a las discrepancias entre las salidas del modelo y la planta a lo o largo de un intervalo de tiempo:
t+T
J(t + T ) =
t
e2 ( )d
con e(t) = yproceso (t) ymodelo (t)
(5.3)
donde T es un periodo jo de tiempo. La idea de la regla del MIT es ajustar el vector de parmetros del controlador en el instante t + T , de manera que haga decrecer J. Es a decir, t+T J e( ) (t + T ) = (t) = (t) d (5.4) 2e( ) t donde Rnn es una matriz denida positiva que acta como ganancia de adaptacin. u o Es fcil entender que el controlador slo tiene inuencia sobre la salida de la planta, a o no sobre la del modelo. Por tanto ymodelo (t) no depende de y al variar ste tampoco e lo hace ymodelo (t), luego yproceso ( ) e( ) = Finalmente, podemos conocer la variacin instantnea de los parmetros del controo a a lador tomando T 0 en el segundo miembro de (5.4) y teniendo en cuenta lo anterior se llega a d yproceso = 2e(t) (5.5) dt Ntese que yproceso representa cmo var la salida del proceso frente a variaciones del o o a vector de parmetros, es decir la sensibilidad de yproceso (t) frente a variaciones de , de a ah el nombre alternativo de ((enfoque de sensibilidad)). En la prctica la sensibilidad de la salida del proceso puede ser dif de conocer. a cil Por tanto, se la suele sustituir por la del modelo de referencia (que s es conocido). Este esquema funciona porque despus de un tiempo el comportamiento en bucle cerrado del e sistema acaba convergiendo al del modelo de referencia. En cualquier caso, la ganancia de adaptacin no debe ser muy grande pues si no puede aparecer un comportamiento o inestable (especialmente si hay discrepancias iniciales fuertes entre la sensibilidad del proceso y la del modelo, porque las correcciones al valor de sern muy enrgicas y en a e la direccin equivocada). o Finalmente hay que decir que esta regla presenta diversas formulaciones alternativas. De hecho la formulacin original del MIT se basaba en el o ndice 1 J(t) = e2 (T ) 2
90
que resulta en la regla d e(t) = e(t) dt y hay otras posibilidades como J(t) = |e(t)| que resulta en d e(t) = signo(e(t)) dt
o directamente ajustar mediante d = signo dt e(t) signo(e(t))
Ejemplo 5.1 Supongamos que tenemos un proceso cuya funcin de transferencia viene dada por o G(s) = kF (s) donde k es ganancia desconocida y F (s) es perfectamente conocida. Se pretende que el sistema en bucle cerrado se comporte acorde al modelo de referencia GM (s) = k0 F (s) (5.6)
donde k0 es una ganancia conocida (es un dato de entrada del problema). El controlador ajustable del que se dispone tiene la estructura u = uc donde u es la entrada que se aplica a la planta y uc es la entrada al controlador (es decir el parmetro que se ha de ajustar es simplemente una ganancia). Se supone una a conguracin del sistema de control tal que es una ganancia feed-forward , es decir, o la funcin de transferencia desde uc a la salida del proceso yp es o Y (s) = kF (s) UC (s) Como se pretende que la funcin de transferencia sea como en (5.6), lo lgico ser o o a tomar k0 = k pero es evidente que esto no se puede hacer, porque se desconoce el valor de k. Se propone ajustar mediante la regla del MIT en el contexto de un control adaptativo MRAC. El error es en este caso e(t) = yp (t) ym (t) = kF (s)uc (t) k0 F (s)uc (t) (5.7)
91
La sensibilidad1 vendr dada por a e(t) = kF (s)uc (t) ahora bien, de (5.7) se obtiene que ym (t) = k0 F (s)uc (t) luego, F (s)uc (t) = por lo que llevando esto a (5.8) se obtiene e(t) k = ym (t) k0 La variacin de los parmetros segn la regla del MIT ser o a u a k d = ym (t)e(t) dt k0 Ntese que se sigue desconociendo el valor de k0 , sin embargo esto no plantea problema o alguno, pues como es una constante cualquiera podemos agrupar las constantes que aparecen en una sola , de manera que la regla ser a d = ym (t)e(t) dt ym (t) k0 (5.8)
Con el objeto de simplicar las cosas en la ecuacin (5.7) se ha abusado notablemente de la o notacin pues se estn incluyendo simultneamente funciones en el dominio s (de la transformada de o a a Laplace) y seales en el dominio temporal. Esto no es correcto y quizs ser mejor utilizar la notacin n a a o d F (p) donde p = dt , es decir, sustituir las funciones en s por su equivalente en el operador derivada.
92
Cap tulo 6 Reguladores Autoajustables (STR)

6.1. Introduccin. Estructura general de los STR o
Los reguladores autoajustables (del ingls Self Tuning Regulator) constituyen un e tipo de control adaptativo muy popular en el que en funcin del conocimiento que se o tiene de la dinmica del proceso a controlar son capaces de ajustarse a si mismos. Este a conocimiento se va actualizando en tiempo real de manera que el ajuste se mantiene lo ms cercano posible al optimo. a Los STR se basan en el principio de equivalencia cierta que consiste en suponer que los parmetros del proceso coinciden con los que se obtienen por identicacin a o de manera que se disea el controlador usando esos parmetros. Como el controlador n a se recalcula en cada paso, y los parmetros se actualizan tambin en cada paso, el a e principio de equivalencia cierta no es una suposicin demasiado arriesgada. o La estructura general de un STR se ilustra en la gura 6.1. En esta se observa que hay tres partes diferenciadas:
Algoritmo recursivo de identicacin. Al tener que actualizarse los parmetros o a en tiempo real es evidente que se debe utilizar un algoritmo recursivo (vase el e cap tulo 4). Mecanismo de adaptacin que desarrolla la tarea de diseo del regulador. Para o n ello se utilizar el modelo actualizado que se tenga de la planta. Ntese que al a o ser la estructura del controlador ja, ((disear)) el controlador es equivalente a n 93
94
INTRODUCCION. ESTRUCTURA GENERAL DE LOS STR
obtener los mejores valores de los parmetros de sinton en base al modelo. a a Regulador con parmetros ajustables. Por lo general la estructura es ja y puede a ser cualquier tipo de controlador lineal en el que los parmetros se puedan ajustar. a
Figura 6.1: Conguracin genrica de un regulador o controlador autoajustable. o e
En los STR clsicos se suele suponer que los procesos son deterministas (es decir no a se consideran fuentes de perturbaciones estocsticas como las vistas en el cap a tulo 2). Por otra parte es comn que el controlador ajustable sea del tipo PID. En realidad, u como es la estructura de un STR es modular, se puede usar cualquier combinacin de o controlador/mtodo de identicacin. e o Tambin se pueden considerar procesos estocsticos en los STR. Es comn entonces e a u que la estructura escogida para el modelo sea la de tipo ARMAX (vase el cap e tulo 2). El diseo se podr hacer, por tanto, utilizando un criterio estocstico o no estocstico. n a a a En el caso de que sea un criterio estocstico normalmente se obtienen los parmetros a a del regulador mediante la minimizacin de un cierto o ndice de funcionamiento. Por ejemplo en el regulador de m nima varianza (el cual se ver en la seccin 6.2) se intentan a o minimizar las variaciones con respecto a cero de la salida (se considera un problema de regulacin con referencia nula), que al ser una seal ruidosa se consigue minimizando o n la esperanza matemtica de la salida en k + d, es decir a J = E y 2 (k + d) siendo d el retraso. Cuando el diseo ser realiza usando un planteamiento no estocstico, se est conn a a siderando que las perturbaciones que inciden sobre el sistema son conocidas con exactitud de antemano, de tal manera que podemos usar modelos deterministas (vase el e cap tulo 2). En este caso el ndice de actuacin se da en funcin de unas especicao o ciones que debe cumplir la salida del sistema, como por ejemplo el tiempo de subida y
U{PSft} u A z p
Pp
REFERENCIA
~ ~V ~ ePppfep } ~pp ~ ef~ eA~ p }
CAP ITULO 6. REGULADORES AUTOAJUSTABLES (STR)
95
establecimiento, etc. . . Tambin se emplear especicaciones que denan la dinmica e an a resultante como la colocacin de los polos de bucle cerrado. o
6.1.1.
Algoritmos con estructura impl cita y expl cita
Entre los STR podemos distinguir dos tipos de algoritmos, unos que identican directamente los parmetros de la planta y luego disean el controlador para cumplir con a n los requisitos (estructura expl cita) y otros que lo que hacen es estimar el controlador directamente sin pasar por la estimacin previa de la planta (estructura impl o cita). Un algoritmo con estructura expl cita constar de los siguientes pasos: a 1. Estimar los parmetros del modelo mediante un algoritmo de identicacin rea o cursivo. 2. Calcular los parmetros del controlador. a 3. Calcular la seal de control y aplicarla. n Estos pasos se repetir en cada tiempo de muestreo. an Los algoritmos de estructura impl cita son ms complicados desde el punto de vista a conceptual. Lo que se hace en ellos es reparametrizar el modelo de la planta y el controlador en funcin de los parmetros del controlador. El esquema ser el mostrado o a a en la gura 6.2. Obsrvese en esta gura que no se est pasando por la fase de diseo del e a n
-
Figura 6.2: Conguracin genrica de un regulador o controlador autoajustable. o e
controlador sino que este se identica, de manera que cumpla con las especicaciones de diseo. Por eso en la gura 6.2 como la identicacin toma como datos de entrada las n o
e VPhzz pzp oYf8
Vz8
REFERENCIA
tVz8t8 pet p z w 8
96
CONTROL POR M INIMA VARIANZA
medidas de la planta y adems las especicaciones de diseo. En este tipo de algoritmo a n los pasos suelen ser: 1. Estimar los parmetros del modelo reparametrizado. a 2. Calcular y aplicar la seal de control. n Al igual que en caso anterior estos pasos se repiten cada tiempo de muestreo. Ambos tipos tienen ventajas e inconvenientes. En el caso de los de estructura expl cita, la carga computacional suele ser mayor pero a cambio, se obtiene un modelo de la planta que puede ser utilizado para otras tareas diferentes de la de control, por ejemplo para simulacin o supervisin. Tambin se puede tener un banco de controladores o o e seleccionables en funcin del modelo obtenido. En el caso de los de estructura impl o cita se necesitan menos clculos, pero la identicacin es ms dif (pueden aparecer proba o a cil lemas de convergencia con ms facilidad). Por otra parte no siempre es posible obtener a el modelo reparametrizado.
6.2.
Control por M nima Varianza
El regulador de m nima varianza es un regulador optimo que pretende reducir el efecto de las perturbaciones sobre la salida, minimizndose para ello un cierto a ndice de funcionamiento. Efectivamente, la seal de control que se aplica en el instante k, es n decir u(k), se calcula como una funcin de u(k1) . . . u(knb ) y(k)y(k1) . . . y(kna ), o de manera que se minimice J = E y 2 (k + d|k) donde E{} es el operador esperanza matemtica, y la notacin y(k + d|k) indica la a o prediccin del valor de y en el instante k + d hecha en base a la informacin disponible o o en el instante k. El modelo del proceso que se considera es del tipo ARMAX, el cual se indica a continuacin o A(z 1 )y(k + d) = B(z 1 )u(k) + C(z 1 )v(k + d) donde A(z 1 ) = 1 + a1 z 1 + + an z n B(z 1 ) = b1 z 1 + b2 z 2 + + bn z n C(z 1 ) = 1 + c1 z 1 + + cn z n (6.1)
97
y d es el retraso puro1 . Supngase que se desea dividir C(z 1 ) entre A(z 1 ). Dicha divisin de polinomios o o producir en general un polinomio cociente y un polinomio resto. El cociente lo denoa taremos por F (z 1 ) y el resto se factoriza de manera que se denote por z (d+1) G(z 1 ). Por tanto podremos reescribir la conocida expresin dividendo igual a divisor por coo ciente ms resto as a C(z 1 ) = A(z 1 )F (z 1 ) + z (d+1) G(z 1 ) donde F (z 1 ) = 1 + f1 z 1 + + fd z d G(z 1 ) = g0 + g1 z 1 + + gn1 z (n1) Ntese que el grado de F (z 1 ) es d y el de G(z 1 ) es n 1. A continuacin dividiremos o o 1 ambos miembros de la ecuacin (6.1) por A(z ) y usaremos (6.2) de manera que se o obtiene B(z 1 ) z 1 G(z 1 ) y(k + d) = u(k) + F (z 1 )v(k + d) + v(k) (6.3) A(z 1 ) A(z 1 ) en donde adems se ha tenido en cuenta que z d v(k + d) = v(k). Veamos el signicado a de algunos de los trminos de (6.3). El trmino F (z 1 )v(k + d) es una combinacin e e o lineal de los valores de v(k) a v(k + d) cuyo efecto sobre y(k + d) no depende de u(k). Por otra parte el termino z 1 G(z 1 ) v(k) A(z 1 ) representa el efecto sobre la salida de las perturbaciones en instantes anteriores a k. Por otra parte si dividimos por C(z 1 ) la expresin (6.2) se obtiene o 1= que se puede reescribir como 1 A(z 1 )F (z 1 ) z (d+1) G(z 1 ) = C(z 1 ) C(z 1 ) (6.4) A(z 1 )F (z 1 ) z (d+1) G(z 1 ) + C(z 1 ) C(z 1 ) (6.2)
Por otra parte segn el modelo ARMAX u v(k) =

1
A(z 1 ) B(z 1 ) d y(k) z u(k) C(z 1 ) C(z 1 )
Ntese que el polinomio B(z 1 ) no tiene trmino independiente, lo que se reeja en la forma de o e describir el proceso ARMAX en la ecuacin (6.1). o
98
CONTROL POR M INIMA VARIANZA
Esto se puede sustituir en la ecuacin (6.3) de manera que se obtiene o y(k + d) = operando y(k + d) = B(z 1 ) z 1 G(z 1 ) G(z 1 )B(z 1 ) (d+1) u(k) + F (z 1 )v(k + d) + y(k) z u(k) A(z 1 ) C(z 1 ) A(z 1 )C(z 1 ) B(z 1 ) z 1 G(z 1 ) A(z 1 ) B(z 1 ) d u(k) + F (z 1 )v(k + d) + y(k) z u(k) A(z 1 ) A(z 1 ) C(z 1 ) C(z 1 )
que, agrupando los trminos que contienen u(k), es a su vez es igual a e 1 z 1 G(z 1 ) G(z 1 )z (d+1) y(k) + y(k + d) = F (z )v(k + d) + 1 B(z 1 )u(k) 1 ) 1 ) 1 ) C(z A(z C(z
1
Recurdese ahora la ecuacin (6.4) y sustityase en la anterior para obtener e o u y(k + d) = F (z 1 )v(k + d) + z 1 G(z 1 ) F (z 1 )B(z 1 ) y(k) + u(k) C(z 1 ) C(z 1 )
A partir de esta ecuacin podemos calcular J y ver que valor de u(k) hace m o nimo J: E y 2 (k + d) = E F (z 1 )v(k + d)
2
+E
+2E F (z 1 )v(k + d)
z 1 G(z 1 ) F (z 1 )B(z 1 ) u(k) + y(k) C(z 1 ) C(z 1 ) F (z 1 )B(z 1 ) z 1 G(z 1 ) u(k) + y(k) C(z 1 ) C(z 1 )
Si se intenta minimizar la expresin anterior se tiene que el primer trmino no depende o e de u(k), por lo que no inuye a la hora de calcular el valor de u(k) que hace m nimo J. Por tanto, ese trmino puede ser descartado. Por otra parte, el tercer trmino es la e e esperanza matemtica de una expresin la que aparece trminos en los que los valores a o e de la perturbacin v(k + i) i = 0 . . . d multiplican valores actuales y pasados de y(k) o y u(k). Como los valores de v(k + i) i = 0 . . . d son independientes (incorrelados) de los de y(k) y u(k) la esperanza matemtica que aparece en ese tercer trmino es a e cero. Por tanto, nos queda slo el segundo trmino que es el que hay que minimizar. o e Para ello basta con calcular el valor que hace cero lo que est dentro de las llaves y a as el cuadrado ser cero (que es el m a nimo valor posible de una funcin cuadrtica). o a El resultado es z 1 G(z 1 ) u(k) = y(k) (6.5) F (z 1 )B(z 1 ) que se puede reescribir tambin como (y as aparece en algunos textos) e u(k) = G(z 1 ) y(k) zB(z 1 )F (z 1 ) (6.6)
99
Ejemplo 6.1 Considrese el siguiente sistema lineal e yk = ayk1 + buk2 Se pide encontrar la expresin del regulador de m o nima varianza. En este caso es fcil ver que a A(z 1 ) = 1 az 1 B(z 1 ) = bz 1 C(z 1 ) = 1 y por otra parte d = 1. Recordemos que se ha de dividir C(z 1 ) entre A(z 1 ) hasta que el grado del cociente F (z 1 ) sea d, o sea en este caso F (z 1 ) tiene la forma F (z 1 ) = 1+ f1 z 1 . La gura 6.3 nos muestra la divisin hecha paso a paso a la manera tradicional. o Por tanto F (z 1 ) = 1 + az 1 . El resto que en este caso es a2 z 2 debe identicarse con
Figura 6.3: Divisin de polinomios para el ejemplo 6.2. o
la expresin z 2 G(z 1 ), por lo que es evidente que en este caso G(z 1 ) = a2 . Luego o recordando la expresin (6.5) obtenemos que el regulador de m o nima varianza para este caso es z 1 a2 a2 uk = yk = yk (1 + az 1 )bz 1 (1 + az 1 )b
6.2.1.
El regulador de m nima varianza generalizado
El control por m nima varianza tal y como se ha presentado aqu presenta problemas cuando el sistema es de fase no m nima ya que al tener ceros inestables estos se cancelarn mediante polos inestables. Esta situacin no es deseable, por que en la prctica a o a puede que los ceros cambien de posicin, bien por imprecisin en el modelo del sistema o o o por variaciones de la dinmica del sistema. En este caso los ceros no se cancelar a an con los polos con lo cual aadir n amos polos inestables al sistema. Evidentemente esto ultimo llevar a la inestabilidad del sistema. Existen variaciones del regulador de m a nima varianza que tratan este problema y adems incorporan seguimiento de referencias a y ponderacin del esfuerzo de control (es decir, que adems de perseguir el objetivo de o a
8 8Sw
A 8 8 8 8Sw
100
ASIGNACION DE POLOS Y CEROS
m nimizar las variaciones de la salida con respecto a la referencia se intenta hacer esto usando el menor esfuerzo de control posible). La ms conocida es la del regulador de a m nima varianza generalizado. La idea de este regulador es la de considerar el siguiente ndice de funcionamiento J =E Q(z 1 )y(k + d) + R(z 1 )u(t) P (z 1 )ref(t + d)
2
donde Q(z 1 ), R(z 1 ) y P (z 1 ) son funciones de ponderacin estables que tienen la o forma Rd (z 1 ) Pn (z 1 ) Qn (z 1 ) R(z 1 ) = P (z 1 ) = Q(z 1 ) = Qd (z 1 ) Rd (z 1 ) Pd (z 1 ) Bajo estas condiciones la seal de control que minimiza J es n u(k) = Rd (z 1 ) (C(z 1 )P (z 1 )ref(t) G(z 1 )y(t)) Qd (z 1 )(Rd (z 1 )F (z 1 )zB(z 1 ) + C(z 1 )Rd (z 1 )) (6.7)
En las expresiones anterior R(z 1 ) se utiliza para ajustar la velocidad de la respuesta del controlador, con el objeto por ejemplo de prevenir la saturacin de los actuadores. o 1 1 Por otra parte se suele tomar Qd (z ) = 1 z de manera que la ley de control resultante tiene un integrador por lo que se rechazan perturbaciones constantes. Finalmente existen otras variaciones de la formulacin presentada aqu Por ejemplo o . una versin del regulador de m o nima varianza que slo soluciona el seguimiento de o referencia (no ir bien con sistemas de fase no m a nima) resulta en la expresin o u(t) = C(z 1 ) G(z 1 ) y(t) ref(t + d) zB(z 1 )F (z 1 ) zB(z 1 )F (z 1 ) (6.8)
6.3.
Asignacin de polos y ceros o
De entre los mtodos basados en criterios no estocsticos se recoge aqu el mtodo e a e de asignacin de polos y ceros debido a Astrm y Wittenmark. En el cap o o tulo 1 ya se trat el problema de la asignacin de polos mediante realimentacin lineal del vector o o o de estados. Es conocido que con un slo controlador no se pueden asignar polos y ceros o arbitrariamente, por lo que usualmente se preere asignar los polos. El mtodo que e aqu se presenta se basa por tanto en una estructura ms compleja que permite colocar a los polos y los ceros en las posiciones deseadas. Dicha estructura se presenta en la gura 6.4. El objetivo del procedimiento es que la funcin de transferencia de bucle cerrado o
101
Figura 6.4: Estructura para la asignacin de polos y ceros. o
sea igual a una dada, que supondremos denotada por y(k) = Rm (z 1 ) d z w(k) Pm (z 1 ) (6.9)
donde se asume que Rm (z 1 ) y Pm (z 1 ) no tienen factores comunes y adems el sistema a 1 1 es causal por lo que el grado de Pm (z ) es mayor o igual al de Rm (z ). A partir de la gura 6.4 y aplicando el algebra de bloques se llega a la conclusin o de que la funcin de transferencia entre w(k) (la referencia a seguir) y y(k) es o y(k) = S(z 1 )B(z 1 )z d w(k) A(z 1 )M (z 1 ) + B(z 1 )G(z 1 )z d
Igualando esta expresin con la funcin de transferencia deseada (6.9) se llega a o o (A(z 1 )M (z 1 ) + B(z 1 )G(z 1 )z d )Rm (z 1 ) = S(z 1 )B(z 1 )Pm (z 1 ) (6.10)
Como se ha comentado en la seccin 6.2.1 no es conveniente que se cancelen ceros o inestables con polos inestables, por lo que se imponen que las ra ces inestables de B(z 1 ) formen parte tambin de Rm (z 1 ). Por tanto lo que se hace es que se factoriza e B(z 1 ) como B(z 1 ) = B (z 1 )B + (z 1 ) donde B (z 1 ) contiene las ra inestables de B(z 1 ) y B + (z 1 ) las estables. Como ces las primeras deben estar en Rm (z 1 ) factorizamos este ultimo polinomio como Rm (z 1 ) = B (z 1 )Rm1 (z 1 ) Impondremos adems que las ra a ces estables de B(z 1 ) estn en M (z 1 ), de manera e que tendremos M (z 1 ) = M1 (z 1 )B + (z 1 )
c 1{
&
102
Por otra parte se asume que, adems de especicarse el retraso y los polinomios que a denen la funcin de transferencia deseada, como parte de los datos de entrada del o problema, se tiene un polinomio A0 (z 1 ) que se utiliza para denir S(z 1 ) mediante la expresin o S(z 1 ) = A0 (z 1 )Rm1 (z 1 ) Con todo lo anterior y la ecuacin (6.10) se llega a o A(z 1 )M1 (z 1 ) + B (z 1 )G(z 1 )z d = A0 (z 1 )Pm (z 1 ) (6.11)
Esto es una ecuacin polinomial, donde las incgnitas son M1 (z 1 ) y G(z 1 ), que o o 2 puede resolverse mediante diferentes mtodos . Quizs el ms simple (pero no ms e a a a eciente) sea plantear un sistema de ecuaciones lineales donde las incgnitas sean los o 1 1 coecientes de los polinomios M1 (z ) y G(z ). En cualquier caso se deben imponer condiciones sobre los grados de dichos polinomios para que la ecuacin tenga solucin o o unica. Aplicando consideraciones algebraicas que no mostraremos aqu se llega a que , 1 1 existen dos posibles opciones para los grados de M1 (z ) y G(z ), 1. grado(G(z 1 )) = grado(A(z 1 )) 1 grado(M1 (z 1 )) = grado(A0 (z 1 )) + grado(Pm (z 1 )) grado(A(z 1 )) 2. grado(G(z 1 )) = grado(A0 (z 1 )) + grado(Pm (z 1 )) grado(B (z 1 )) d grado(M1 (z 1 )) = grado(B (z 1 )) + d 1 Se puede demostrar que el control por asignacin de polos y ceros es equivalente al o MRAC. Por otra parte segn el sistema podemos tener casos simplicados: u 1. Cancelacin de todos los ceros. Esto se puede hacer si el sistema es de fase m o nima. En este caso B + (z 1 ) = B(z 1 ) B (z 1 ) = 1 Rm (z 1 ) = Rm1 (z 1 ) = K S(z 1 ) = KA0 (z 1 )
M (z 1 ) = M1 (z 1 )B(z 1 ) por lo que la ecuacin quedar como o a
A(z 1 )M1 (z 1 ) + G(z 1 )z d = A0 (z 1 )Pm (z 1 )

De hecho es una ecuacin polinomial diofntica. Este tipo de ecuaciones las encontraremos de o a nuevo en el cap tulo 9, donde se vern otros mtodos para resolverla. a e
2
103
2. No se cancela ningn cero. Esto ocurre si todos las ra de B(z 1 ) son inestables. u ces En este caso B + (z 1 ) = 1 B (z 1 ) = B(z 1 ) S(z 1 ) = KA0 (z 1 )
M (z 1 ) = M1 (z 1 )
Rm (z 1 ) = KB(z 1 )
por lo que ahora la ecuacin quedar como o a A(z 1 )M (z 1 ) + B(z 1 )G(z 1 )z d = A0 (z 1 )Pm (z 1 ) Con este tipo de control se puede ilustrar la diferencia entre algoritmo con estructura impl cita y expl cita. Comenzaremos derivando un algoritmo con estructura impl cita, para ver despus el de estructura expl e cita.
6.3.1.
Algoritmo con estructura impl cita.
Ntese que multiplicando ambos miembros de la ecuacin (6.11) por y(k) se obtiene o o A(z 1 )M1 (z 1 )y(k) + B (z 1 )G(z 1 )z d y(k) = A0 (z 1 )Pm (z 1 )y(k) que dado que A(z 1 )y(k) = B(z 1 )z d u(k) es equivalente a M1 (z 1 )B(z 1 )z d u(k) + B (z 1 )G(z 1 )y(k) = A0 (z 1 )Pm (z 1 )y(k) Por otra parte sabemos que M (z 1 ) = M1 (z 1 )B + (z 1 ) y B(z 1 ) = B + (z 1 )B (z 1 ), por lo que se llega a A0 (z 1 )Pm (z 1 )y(k) = B (z 1 )z d M (z 1 )u(k) + G(z 1 )y(k) (6.12)
La ecuacin (6.12) expresa una relacin entre la entrada y la salida que constituye o o un modelo reparametrizado del sistema en bucle cerrado. En dicho modelo aparecen polinomios conocidos de antemano (A0 (z 1 ), Pm (z 1 )), el retraso d que se supone conocido, y tres polinomios (B (z 1 ) , M (z 1 ), G(z 1 )) que son los que deben ser identicados (ajustados mediante un mtodo de identicacin recursivo), usando los e o valores experimentales de la entrada y la salida. Obsrvese que al identicarse dicho e modelo reparametrizado se estarn identicando los parmetros del controlador adems a a a de parte de los parmetros de la planta. Estos ultimos no son sin embargo necesarios, a se pueden considerar un ((subproducto)) del proceso de identicacin del controlador. o El algoritmo de control en s tomar como datos de entrada A0 (z 1 ), Pm (z 1 ), el , a 1 retraso d y Rm1 (z ). Los pasos de los que constar en cada instante de muestreo son a los siguientes
104
1. Obtener una estimacin actualizada de M (z 1 ), G(z 1 ), B (z 1 ) mediante la o identicacin del modelo reparametrizado (6.12). o 2. Calcular y aplicar u(k) = 1 S(z 1 )w(k) G(z 1 )y(k) 1 ) M (z
donde S(z 1 ) = A0 (z 1 )Rm1 (z 1 ). Este procedimiento puede presentar problemas para aquellos sistemas que sean de fase no m nima. Esta mayor dicultad es inherente a los algoritmos con estructura impl cita, tal y como se ha comentado al comienzo del cap tulo.
6.3.2.
Algoritmo con estructura expl cita
En este caso los datos de entradas al algoritmo ser A0 (z 1 ), Pm (z 1 ), el retraso an 1 d y Rm (z ). Los pasos de los que constar en cada instante de muestreo son los a siguientes 1. Obtener una estimacin actualizada de A(z 1 ) y B(z 1 ) mediante la identio cacin del modelo o B(z 1 ) d y(k) = z u(k) A(z 1 ) 2. Factorizar B(z 1 ) = B + (z 1 )B (z 1 ). 3. Resolver la ecuacin (6.11). o 4. Calcular y aplicar u(k) = 1 S(z 1 )w(k) G(z 1 )y(k) M (z 1 )
donde S(z 1 ) = A0 (z 1 )Rm1 (z 1 ) y M (z 1 ) = M1 (z 1 )B + (z 1 ). Es fcil ver que este algoritmo tiene ms clculos que el anterior, en particular la a a a 1 factorizacin de B(z ) y la resolucin de la ecuacin polinomial (6.11), tareas ambas o o o que pueden ser costosas en un hardware industrial no muy potente (adems de ms a a complicadas de implementar). Sin embargo desde el punto de vista prctico suele tener a menos problemas.
Cap tulo 7 Controladores PID con autoajuste y Ajuste por tabla

7.1. Introduccin o
En este cap tulo se revisaran algunas de las tcnicas de control adaptativo con mayor e aplicacin en la industria. Estas no son tan ambiciosas como algunas de las presentadas o hasta ahora y sin embargo son denitivamente estrategias de control avanzado que han demostrado ser utiles en la prctica. Adems de las tcnicas referidas en el t a a e tulo del cap tulo se concluir el temario relativo a control adaptativo con un breve repaso a a algunos sistemas comerciales.
7.2.
Funcin de autoajuste (autotuning ) o
Los reguladores adaptativos vistos hasta ahora, es decir los MRAC y STR, necesitan para poder funcionar correctamente un conocimiento bsico a priori de la planta. A n a de poder obtener esa informacin lo mas fcilmente posible, los fabricantes introdujeron o a en los controladores adaptativos comerciales un modo de sinton previa (pre-tune), que a obten dicha informacin bsica. a o a Paralelamente, se estaban desarrollando tcnicas para poder ajustar automticae a mente controladores de tipo PID sin necesidad de intervencin del operario. Lo que o 105
106
FUNCION DE AUTOAJUSTE (AUTOTUNING)
ocurri, es que se vio que para poder ajustar un PID automticamente bastaba con la o a informacin bsica que proporcionaban los modos pre-tune de los controladores adapo a tativos. Por otra parte, desde el mundo industrial una de las caracter sticas ms demandadas a era una funcin de autoajuste inicial. Al instalarse el controlador se activar dicha o a funcin (apretando un botn en el panel de control) a lo que el controlador responder o o a realizando una bater de tests pre-programados que dar como resultado el ajuste a an automtico del controlador. Esta demanda surge de la dicultad y el engorro de ajustar a un controlador inicialmente. Lo que hicieron los fabricantes de PID fue aprovechar los resultados obtenidos en el desarrollo de funciones pre-tune en controladores adaptativos para dotar a sus PID de una funcin de autoajuste como la que demandaban los o usuarios. Para conseguir el autoajuste se puede utilizar cualquier tcnica de control adape tativo que permita estimar los parmetros adecuados, con el unico requisito de que a los ensayos requeridos sean sencillos, a n de poderse realizar de manera automtica. a Desde el punto de vista prctico, los controladores con autoajuste tendrn dos modos a a de funcionamiento, el modo normal en el cual funcionan como cualquier controlador y el de ajuste. En el modo de ajuste el control se desconecta, se realizan los ensayos necesarios y despus se vuelve al modo normal con el controlador ajustado. e Por tanto un controlador con autoajuste realiza tareas de modelado (identicacin), o y diseo del controlador, de manera transparente al usuario, por lo que se simplican n mucho las tareas de instalacin y puesta en marcha de los controladores. Por otra parte o no incrementan en mucho el coste nal del controlador y son una manera de introducir tcnicas de control adaptativo en la industria. e Finalmente hay que hacer notar la diferencia fundamental entre un controlador autoajustable del tipo STR y un controlador con autoajuste. En los primeros el controlador de manera autnoma va adaptndose de una manera ms o menos continuada. o a a En un controlador con funcin de autoajuste, dicho autoajuste slo se realiza bajo deo o manda del operador, y usualmente slo cuando se instala o se cambia sustancialmente o las condiciones del equipo a controlar.
CAP ITULO 7. CONTROLADORES PID CON AUTOAJUSTE Y AJUSTE POR TABLA
107
7.3.
Funciones de autoajuste para PIDs
Antes de tratar las distintas tcnicas existentes para ajustar automticamente PIDs e a es importante hacer notar que los PIDs industriales (gura 7.1) no son exactamente iguales a las formulaciones acadmicas que se ensean en cursos bsicos de control. Por e n a
Figura 7.1: PID industrial moderno con funcin de autoajuste (ABB modelo ECA). o
ejemplo, en lugar de considerarse la derivada del error se suele usar la derivada de la salida y adems a veces ni siquiera se emplea la derivada exacta de la salida, sino que se a usa una aproximacin de la misma que reduce la ganancia en altas frecuencias, a n de o minimizar los efectos del ruido. As mismo a la hora de calcular la parte proporcional de la accin de control no se suele usar el valor exacto de la referencia a seguir, sino o una fraccin del mismo, a n de evitar cambios bruscos en la salida del proceso. Otro o detalle muy importante es que se suele incorporar una funcin de anti-windup que, o bsicamente, consiste en que cuando el actuador se satura (alcanza su l a mite f sico de operacin), se deja de integrar el error. Con esto se consigue que, cuando empieza a o disminuir el error, el actuador deja de estar saturado, es decir que se consigue que el descenso del error se manieste en un decremento de la seal de actuacin. n o Sin entrar en demasiados detalles un PID ms realista que la versin acadmica a o e vendr dado por la siguiente expresin: a o u(t) = f (v(t)) donde u(t) es la seal de actuacin que se aplica, f () es una posible (se suele dar casi n o siempre) no-linealidad debida al actuador y v(t) = P (t) + I(t) + D(t)
108
FUNCIONES DE AUTOAJUSTE PARA PIDS
donde P (t) es la accin proporcional que se calcula mediante o P (t) = Kc (ref(t) y(t)) I(t) es la accin integral que se calcula mediante o dI Kc 1 = (ref(t) y(t)) + (u(t) v(t)) dt Ti Tt En la expresin anterior el ultimo trmino que se suma se usan para lograr el efecto o e anti-windup de manera que la accin integral se mantenga acotada cuando el actuador o se sature. El parmetro Tt es una constante de tiempo para reinicializar la accin a o integral cuando aparezca la saturacin y suele ser una fraccin del tiempo integral T i . o o Por otra parte la accin derivativa se calcula usando o dy Td dD = D Kc Td N dt dt donde el parmetro N es jo y suele tomarse igual a 10. a En cuanto a las tcnicas para sintonizar automticamente PIDs, la gran mayor e a a estn basadas en experimentos simples que el PID puede llevar a cabo por si solo. Estos a experimentos podrn ser en bucle abierto o cerrado, de ah que luego distingamos dos a tipos de tcnicas. Hay que mencionar que en los PID industriales el ajuste automtico e a viene realizado por el propio PID, o por un mdulo separado que se coloca en lugar del o PID para realizar los experimentos, y que devuelve los valores de los parmetros del a PID. Este mdulo deber ser compatible con los distintos modelos de PID que se usen en o a la planta, ya que para calcular los parmetros deben conocerse todas las peculiaridades a de los algoritmos usados por cada PID. Otros mtodos ms sosticados son los que e a se basan en tcnicas de inteligencia articial principalmente sistemas expertos. Estos e programas monitorizan en paralelo el funcionamiento de la planta y cuando se producen cambios de referencia o perturbaciones importantes los aprovechan para analizar la dinmica de la planta, estimndose valores para parmetros como ganancias, factores de a a a amortiguamiento, etc . . . Estos parmetros son los que luego se usarn para sintonizar a a el PID. Esta tcnica se utiliza por ejemplo en controladores de las marcas Foxboro o e Fenwal. 0,7 1
7.3.1.
Tcnicas de ajuste basadas en la respuesta transitoria e
Estas son tcnicas de ajuste en bucle abierto que se basan en aplicar un escaln en e o la seal de entrada del lazo que se quiere sintonizar y ajustar un modelo simple del n tipo k esL (7.1) G(s) = 1 + sT
109
Conocidos los parmetros del modelo el PID se puede ajustar usando tcnicas del a e tipo Ziegler-Nichols de bucle abierto. Otros mtodos estn basados en medida de areas e a como la que se describe a continuacin. Considrese la gura 7.2. El procedimiento o e para calcular T y L comienza por el clculo de A0 . De ah se determina a L+T = A0 k
y de ah se puede medir A1 , la cual se usa para obtener T mediante T = eA1 k
donde e es la base de los logaritmos neperianos. Una vez que se conoce L + T y T se puede obtener L y con eso ya estn estimados todos los parmetros. a a
k A0
A1
L+T
Figura 7.2: Determinacin de T y L por areas. o
7.3.2.
Mtodos basados en las oscilaciones producidas al reale imentar con un rel e
Los mtodos de ajuste basados en la respuesta transitoria son simples, pero muy e sensibles a las perturbaciones, ya que las pruebas se realizan en bucle abierto. Las tcnicas basadas en experimentos en bucle cerrado no tienen este problema. De estas e tcnicas veremos la que est basada en las oscilaciones producidas al realimentar con e a un rel. La estructura para realizar el ajuste es la que se muestra en la gura 7.3. e La idea clave es que la mayor de los procesos exhiben oscilaciones autosostenidas a 1 (conocidas como ciclos lmite ) cuando son realimentados con un rel en la cadena e
El estudio de los ciclos l mite no pertenece a esta asignatura. Baste saber que son oscilaciones con entrada nula o referencia constante que aparecen en ciertos sistemas y que pueden provocarse con la estructura presentada aqu .
1
110
LA TECNICA DE AJUSTE POR TABLA O GAIN SCHEDULING
PID r + REL u y PROCESO
Figura 7.3: Estructura usada en el mtodo basado en oscilaciones de rel. e e
directa. Los parmetros del ciclo l a mite contienen informacin suciente para calcular o los parmetros de ajuste del PID. a El procedimiento consiste en desconectar el controlador a la hora de hacer el ajuste y sustituirlo por el rel. En la salida comenzarn a aparecer oscilaciones que se eme a pezarn a repetir peridicamente cuando el ciclo l a o mite aparezca. Una vez que se han determinado los parmetros del ciclo l a mite se calculan los del PID y se vuelve a conectar el controlador. El mtodo ms conocido para calcular los parmetros del PID es el e a a mtodo de Ziegler-Nichols de bucle cerrado. Suponiendo una referencia nula, si el ciclo e l mite resultante tiene amplitud a y frecuencia u entonces los parmetros del mtodo a e de Ziegler-Nichols de bucle cerrado, es decir, la ganancia cr tica Ku y el periodo cr tico Tu son iguales a 4d 2 Ku = Tu = a u donde d es la amplitud del rel. e
7.4.
La tcnica de ajuste por tabla o gain schedule ing
Existen otros controladores que proporcionan una cierta capacidad de adaptacin o pero que no encajan en el esquema t pico discutido en el cap tulo 5 ya que la adaptacin o se realiza en bucle abierto. Este esquema, ms limitado se ilustra en la gura 7.4. Puede a observarse que en este caso, el ajuste de los parmetros no se realiza en funcin del a o comportamiento del sistema, sino que se utilizan los valores de una variable auxiliar para decidir cuales son los mejores valores de los parmetros del regulador. De ah que a se diga que la adaptacin es en bucle abierto. o Un esquema de control t pico que utiliza la estructura de la gura 7.4 es el popular gain scheduling o ajuste por tabla. En este esquema, los parmetros del controlador que a
111
REFERENCIA
MEDIO AMBIENTE
Figura 7.4: Conguracin genrica de un controlador adaptativo con adaptacin en bucle abierto. o e o
se usan en cada instante vienen determinados por una tabla precalculada para varios puntos de funcionamiento o valores de la variable auxiliar. Este tipo de control es muy popular, por ejemplo, en sistemas de control de vuelo, en los que los parmetros del a controlador se seleccionan de un conjunto de parmetros precalculados en funcin de a o la altura de vuelo. Por supuesto, este tipo de control funciona bien si entre la variable auxiliar y la dinmica del sistema existe una fuerte relacin, que permite determinar a o el valor de los parmetros en funcin del valor observado de la variable auxiliar. Una a o ventaja que tiene este esquema es que los parmetros del control se pueden cambiar a (adaptar) a la misma velocidad a la que cambia la dinmica del sistema pues estos a cambios se reejan sobre la variable auxiliar a la vez que se producen. Esta rapidez en el cambio de los parmetros puede ser, sin embargo, contraproducente. Por otra parte la a construccin de la tabla puede ser muy complicada. De hecho no existe una metodolog o a universal, sino que para cada aplicacin ha de verse como llevar a la prctica las ideas o a del gain scheduling. Por ultimo encontrar la variable auxiliar apropiada no siempre es posible. Estos controladores, sin embargo, se pueden encontrar en diversos sistemas t picos de control, principalmente debido a su sencillez y efectividad cuando estn bien a diseados. Algunas de las aplicaciones t n picas son:
Linealizacin de la caracter o stica de ciertos actuadores. Tal y como se vio en la seccin 5.2 la caracter o stica no lineal de un actuador se puede aproximar por un modelo linealizado a trozos, de manera que en funcin del punto de operacin del o o actuador se escogern unos valores u otros para el controlador. a Control de pH. En estos sistemas se presentan no linealidades originadas tanto por los elementos de control (vlvulas, bombas, sensores) como por las reacciones a
py
ffU yoo
oUe{A uyyU{uu
a fu Y
112
LA TECNICA DE AJUSTE POR TABLA O GAIN SCHEDULING
qu micas propias del proceso. La no linealidad principal proviene de la relacin o entre las concentraciones de los reactivos y el pH de la solucin resultante. Dicha o 2 relacin se representa en la llamada curva de pH . En dicha curva se representa o el pH en funcin de las diferencias en las concentraciones de los reactivos. En la o gura 7.5 se muestra dicha curva para una solucin acuosa de acido clorh o drico y sosa custica (es decir un par acido-base). Puede observarse que en este caso a la no linealidad tambin se puede aproximar bien por un modelo linealizado a e tramos.
12 11 10 9 8
pH
7 6 5 4 3 2 1
0.8
0.6
Diferencia entre las concentraciones acidobase
0.4
0.2
0.2
0.4
0.6
0.8 x 10
1
3
Figura 7.5: Curva de pH para una solucin de HCl 0.001 M y NaOH 0.001 M. o
Control de la mezcla aire combustible en un motor de combustin. En este caso se o utilizan como variables para decidir el ajuste del controlador (un PI usualmente) la velocidad del motor y la cantidad de aire que entra. Usando dichas variables se busca en una tabla (usualmente de 16x16 entradas) en la que se obtienen los valores de los parmetros del controlador (si los valores de las variables no coina ciden con los de ninguna entrada se interpola con las ms prximas). La variable a o de control es el tiempo de apertura de la vlvula de inyeccin de combustible. a o En este caso se presenta otra no linealidad debida al sensor utilizado para medir la proporcin de aire y combustible. Este sensor denominado sonda lambda tiene o una caracter stica que de manera aproximada viene representada por la gura 7.6. De hecho la seal de error que se env al PI se genera mediante la expresin n a o e=
2
1 si V > 0,5 1 si V 0,5
En realidad el nombre tcnico es curva de titracin, aunque tales detalles no son relevantes en e o esta asignatura

1 0.9 0.8 0.7
113
Voltaje de salida (V)
0.6 0.5 0.4 0.3 0.2 0.1 0 0.5
0.6
0.7
0.8
Relacin combustible aire ()
0.9
1.1
1.2
1.3
1.4
1.5
Figura 7.6: Caracter stica aproximada de una sonda lambda
Control de vuelo. Es el ejemplo clsico, en este caso, se puede encontrar una a relacin entre los parmetros optimos del controlador y la altura, la velocidad y o a el nmero de Mach. u Control de la direccin de un barco. En este caso la dinmica considerada para o a el control de la direccin depende de la velocidad del barco y de ciertas variables o relacionadas con el tiempo atmosfrico, como la fuerza y direccin del viento (en e o realidad dichas variables atmosfricas no afectan a la dinmica del barco en si, e a sino a la de las perturbaciones que este sufre). A modo de conclusin, podemos decir que la tcnica de gain scheduling se puede o e usar con xito cuando las no linealidades que se pretendan compensar se conocen bien e a priori. Por otra parte como la adaptacin es en bucle abierto, es necesario conocer o bien tanto la dinmica del proceso como la de las perturbaciones. a
7.5.
Controladores adaptativos industriales
Las tcnicas de control adaptativo han llegado al mundo industrial en distintas e formas y capacidades, entre las cuales podemos distinguir las siguientes. Herramientas para sintonizar controladores. Estn basadas en experimentos como a los que se han descrito en la seccin 7.3. A veces se encuentran como componentes o
114
CONTROLADORES ADAPTATIVOS INDUSTRIALES
opcionales del controlador como en el caso de los sistemas Protonic (Hartman & Braun) o UDC 6000 (Honeywell). Estos combinan reglas emp ricas y tcnicas e de colocacin de polos usando experimentos en bucle abierto. Las estrategias de o oscilaciones mediante rel tambin son comunes como por ejemplo en el SattCone e 3 trol ECA40 y en el DPR900 (Fisher-Rosemount). Otra posibilidad es que estas herramientas para sintonizar controladores sean mdulos independientes, como patibles con determinadas familias de controladores. En este tipo encontramos ejemplo como SIEPID (Siemens), Supertuner (Toyo), Protuner (Techmation) o PIDWIZ (BST Control). Una tercera posibilidad es que estas herramientas formen parte de sistemas de control distribuido como en el caso de Looptune (Honeywell) e Intelligent Tuner (Fisher-Rosemount). Controladores adaptativos estandar. Estos controladores ajustan los parmetros a de manera ms o menos continua. Los hay que estn basados en la identicacin a a o de un modelo mediante m nimos cuadrados recursivos como los CLC04 (Bailey Controls) y SLPC-181/281 (Yokogawa) que adems utilizan una estrategia de a control por colocacin de polos. Algunos, como el SattControl ECA40, no identio can un modelo paramtrico sino que usan reglas del tipo Ziegler-Nichols de bucle e cerrado, a partir de experimentos de realimentacin con rel. Por otra parte exiso e ten otros ms ambiciosos que estn basados en sistemas expertos y en tcnicas de a a e reconocimiento de patrones como EXACT (Foxboro), SLPC-171/271 (Yokogawa) o UDC 6000 de Honeywell. Estos sistemas utilizan una base de reglas (100-200) con las que se pretende reproducir el conocimiento de un experto (humano) en sintonizar controladores. Finalmente, las capacidades de gain scheduling tambin estn presentes en ciertos controladores como el SattControl ECA 400 o el e a DPR910 (Fisher-Rosemount). Controladores adaptativos basados en autmatas programables. Los autmatas o o programables ganan terreno d a d en cualquier aplicacin industrial de control. a a o 3M y General Electric tienen en su catlogo aplicaciones de control adaptativo a basados en sus autmatas. o Soluciones a medida. A veces en determinadas aplicaciones se encuentran controladores adaptativos a medida y que por tanto son exclusivos de cada sistema. Se encuentran en barcos, aviones, automocin, y ciertas industrias. o
A continuacin se analizarn en mayor detalle algunos controladores especialmente o a interesantes.

3
Mas tarde Alfa-Laval y actualmente ABB.
115
7.5.1.
SattControl ECA40 y Fisher-Rosemount DPR900
Estos controladores estn basados en oscilaciones inducidas mediante realimentacin a o con un rel. Incluyen una funcin de sinton pulsando un botn. Adems tiene cae o a o a pacidades limitadas de gain scheduling con una tabla de tres entradas. Previamente al ajuste el proceso se deja evolucionar con una entrada constante. El procedimiento de ajuste comienza con la deteccin del ciclo l o mite. En cuanto se observa que las oscilaciones comienzan a repetirse, se calcula la amplitud y periodo de las mismas y a partir de ah se calculan los parmetros. Para ello se utilizan una versin modicada del a o mtodo de Ziegler-Nichols. Una vez se calculan los parmetros el controlador conmuta e a a modo automtico. El ajuste ofrece tres perles diferentes: control normal, lento o a rpido. La reaccin de la comunidad industrial a estos productos ha sido muy buena, a o encontrndose particularmente util en industrias que no tienen personal especializado a en todos los turnos.
7.5.2.
Foxboro EXACT
Este sistema est basado en la respuesta transitoria de bucle cerrado, es decir es a de bucle cerrado pero no usa las oscilaciones inducidas por un rel. Lo que se emplea e es un escaln o perturbacin aplicada al sistema y de la evolucin de la salida a paro o o tir de ese instante se obtiene informacin que permite ajustar el controlador usando o Ziegler-Nichols. Este controlador requiere informacin previa para poder sintonizar auo tomticamente, concretamente una estimacin previa de Kc , Ti y Td , as como de la a o escala de tiempos del proceso. Si esta informacin se desconoce se puede usar el modo o de pre-tune incorporado que la obtiene mediante la aplicacin de un escaln. Es neceo o sario sin embargo que el proceso est en regimen permanente. La aceptacin comercial e o de este producto ha sido excelente y se han vendido miles de unidades. A modo de ancdota la planta de Atlantic Copper en Huelva utiliza este controlador en algunos e de sus procesos. El controlador adaptativo multivariable EXACT MV se distribuye actualmente en forma de software de control avanzado como parte del sistema I/A Series de Foxboro.
7.5.3.
ABB Novatune
Esta herramienta de control STR (gura 7.7) est basada entre otras cosas en el a control de m nima varianza y ofrece la capacidad de especicar la posicin de 1 de los o
116
CONTROLADORES ADAPTATIVOS INDUSTRIALES
polos de bucle cerrado. Utiliza m nimos cuadrados recursivos con factor de olvido para
Figura 7.7: La herramienta Novatune se comercializa actualmente con el sistema Advant 410 de ABB.
identicar un modelo que tiene la estructura (1 Pl z 1 )y(t + kd ) (1 Pl )y(t) = A(z 1 )y(t) + B(z 1 )u(t) + C(z 1 )v(t) donde Pl es el polo que se puede especicar y kd es el horizonte de prediccin. Por otra o parte la ley de control tiene la forma ( + B (z 1 ))u(t) = (1 Pl )(ref(t) y(t)) A(z 1 )y(t) C(z 1 )v(t) donde es un factor de ponderacin. La experiencia en el uso de esta herramienta o demuestra que da mejores resultados que el control PID convencional.
Cap tulo 8 Control Predictivo Basado en Modelo (MPC)

8.1. Perspectiva histrica o
El Control Predictivo se desarroll en base a dos l o neas bsicas. Por un lado, a nales a de los aos setenta surgieron diversos algoritmos que usaban expl n citamente un modelo dinmico del proceso para predecir el efecto de las acciones de control futuras en la a salida, las cuales eran determinadas minimizando el error predicho sujeto a restricciones de operacin. La optimizacin se repet en cada instante de muestreo con informacin o o a o actualizada del proceso. Estas formulaciones eran de naturaleza heur stica y algor tmica e intentaban aprovechar el creciente potencial de los computadores digitales por aqulla e poca. e Rpidamente el mpc adquiri gran popularidad en las industrias de procesos qu a o micos principalmente debido a la simplicidad del algoritmo y al uso del modelo de respuesta impulsional o en escaln, que aunque posea muchos ms parmetros que las o a a formulaciones en el espacio de estados o funcin de transferencia suele ser preferido o por ser intuitivo y necesitar menos informacin a priori para identicar. La mayor o a de las aplicaciones fueron llevadas a cabo sobre sistemas multivariables incluyendo restricciones. Los algoritmos utilizados fueron principalmente el idcom (IdenticationCommand) y el dmc (Control con Matriz Dinmica, Dynamic Matrix Control). a Independientemente fue surgiendo otra l nea de trabajo en torno a las ideas del control adaptativo, desarrollando estrategias esencialmente para procesos monovariables 117
118
CONCEPTOS BASICOS DE CONTROL PREDICTIVO
formuladas con modelos entrada/salida. En este contexto se extendieron las ideas del Controlador de M nima Varianza y se desarroll el Control Predictivo Generalizado o (Generalized Predictive Control gpc) que es uno de los mtodos ms populares en la e a actualidad.
8.2.
Conceptos bsicos de control predictivo a
El Control Predictivo Basado en Modelo, Model (Based) Predictive Control (mbpc o mpc) constituye un campo muy amplio de mtodos de control desarrollados en torno e a ciertas ideas comunes e integra diversas disciplinas como control optimo, control estocstico, control de procesos con tiempos muertos, control multivariable o control a con restricciones. El Control Predictivo no es una estrategia de control espec ca, sino que se trata ms bien de un campo muy amplio de mtodos de control desarrollados en torno a a e ciertas ideas comunes. Estos mtodos de diseo conducen a controladores lineales que e n poseen prcticamente la misma estructura y presentan sucientes grados de libertad. a Las ideas que aparecen en mayor o menor medida en toda la familia de controladores predictivos son bsicamente: a Uso expl cito de un modelo para predecir la salida del proceso en futuros instantes de tiempo (horizonte). Clculo de las seales de control minimizando una cierta funcin objetivo. a n o Estrategia deslizante, de forma que en cada instante el horizonte se va desplazando hacia el futuro, lo que implica aplicar la primera seal de control en cada n instante y desechar el resto, repitiendo el clculo en cada instante de muestreo. a Los distintos algoritmos de mpc dieren entre s casi exclusivamente en el modelo usado para representar el proceso y los ruidos y en la funcin de coste a minimizar. o Aunque las diferencias puedan parecer pequeas a priori, pueden provocar distintos n comportamientos en bucle cerrado, siendo cr ticas para el xito de un determinado e algoritmo en una determinada aplicacin. o El Control Predictivo es un tipo de control de naturaleza abierta dentro del cual se han desarrollado muchas realizaciones, encontrando gran aceptacin tanto en aplicao ciones industriales como en el mundo acadmico. En la actualidad existen numerosas e
CAP ITULO 8. CONTROL PREDICTIVO BASADO EN MODELO (MPC)
119
aplicaciones de controladores predictivos funcionando con xito, tanto en la industria e de procesos como en control de motores o Robtica. El buen funcionamiento de estas o aplicaciones muestra la capacidad del mpc para conseguir sistemas de control de elevadas prestaciones capaces de operar sin apenas intervencin durante largos per o odos de tiempo. El mpc presenta una serie de ventajas sobre otros mtodos, entre las que destacan: e Resulta particularmente atractivo para personal sin un conocimiento profundo de control, puesto que los conceptos resultan muy intuitivos, a la vez que la sintonizacin es relativamente fcil. o a Puede ser usado para controlar una gran variedad de procesos, desde aqullos con e dinmica relativamente simple hasta otros ms complejos incluyendo sistemas con a a grandes retardos, de fase no m nima o inestables. Permite tratar con facilidad el caso multivariable. Posee intr nsecamente compensacin del retardo. o Resulta conceptualmente simple la extensin al tratamiento de restricciones, que o pueden ser incluidas de forma sistemtica durante el proceso de diseo. a n Es muy util cuando se conocen las futuras referencias (robtica o procesos en o batch). Es una metodolog completamente abierta basada en algunos principios bsicos a a que permite futuras extensiones. Pero, lgicamente, tambin presenta inconvenientes. Unos de ellos es la carga de o e clculo necesaria para la resolucin de algunos algoritmos. Pero quizs el mayor ina o a conveniente venga marcado por la necesidad de disponer de un modelo apropiado del proceso. El algoritmo de diseo est basado en el conocimiento previo del modelo y es n a independiente de ste, pero resulta evidente que las prestaciones obtenidas dependern e a de las discrepancias existentes entre el proceso real y el modelo usado.
8.3.
Estrategia de los controladores predictivos
La metodolog de todos los controladores pertenecientes a la familia del mpc se a caracteriza por la estrategia siguiente, representada en la gura 8.1:
120
ESTRATEGIA DE LOS CONTROLADORES PREDICTIVOS
u(t+k|t) u(t)
^ y(t+k|t) y(t) N
t-1
t+1
...
t+k
...
t+N
Figura 8.1: Estrategia del Control Predictivo
1. En cada instante t y haciendo uso del modelo del proceso se predicen las futuras salidas para un determinado horizonte N , llamado horizonte de prediccin. Estas o 1 salidas predichas, y (t + k | t) para k = 1 . . . N dependen de los valores conocidos hasta el instante t (entradas y salidas pasadas) y de las seales de control futuras n u(t + k | t), k = 0 . . . N 1 que se pretenden mandar al sistema y que son las que se quieren calcular. 2. El conjunto de seales de control futuras se calcula optimizando un determinado n criterio en el que se pretende mantener el proceso lo ms prximo posible a la a o trayectoria de referencia w(t + k) (que puede ser directamente el setpoint o una suave aproximacin a ste). Este criterio suele tomar la forma de una funcin o e o cuadrtica de los errores entre la salida predicha y la trayectoria de referencia a tambin predicha, incluyendo en muchos casos el esfuerzo de control. Si el criterio e es cuadrtico, el modelo lineal y no existen restricciones se puede obtener una a solucin expl o cita, en otro caso se debe usar un mtodo iterativo de optimizacin. e o Adicionalmente se hace alguna suposicin sobre la estructura de la ley de control o futura, como por ejemplo que va a ser constante a partir de cierto instante. 3. La seal de control u(t | t) es enviada al proceso mientras que las siguientes n seales de control calculadas son desechadas, puesto que en el siguiente instante n de muestreo ya se conoce y(t + 1) y se repite el paso 1 con este nuevo valor y todas las secuencias son actualizadas. Se calcula por tanto u(t + 1 | t + 1) (que en
1
la notacin indica el valor de la variable en el instante t + k calculado en el instante t. o
121
Entradas y salidas pasadas
Salidas predichas
Modelo
Controles futuros
+ -
Trayectoria de referencia
Optimizador
Errores futuros Funcion de coste Restricciones
Figura 8.2: Estructura bsica del MPC a
principio ser diferente al u(t + 1 | t) al disponer de nueva informacin), haciendo a o uso del concepto de horizonte deslizante. Para llevar a cabo esta estrategia, se usa una estructura como la mostrada en la gura 8.2. Se hace uso de un modelo para predecir las salidas futuras del proceso, basndose en las futuras seales de control propuestas. Estas seales son calculadas a n n por el optimizador teniendo en cuenta la funcin de coste (donde aparece el futuro o error de seguimiento) as como las restricciones. Por tanto el modelo juega un papel decisivo en el controlador. El modelo elegido debe ser capaz de capturar la dinmica del a proceso para poder predecir las salidas futuras al mismo tiempo que debe ser sencillo de usar y de comprender. El optimizador es otra parte fundamental de la estrategia pues proporciona las acciones de control. Si la funcin de coste es cuadrtica, el m o a nimo se puede obtener como una funcin expl o cita de las entradas y salidas pasadas y de la trayectoria de referencia. Sin embargo, cuando existen restricciones de desigualdad la solucin debe o ser calculada por mtodos numricos con ms carga de clculo. e e a a
8.4.
Elementos bsicos a
Todos los controladores predictivos poseen elementos comunes y para cada uno de estos elementos se pueden elegir diversas opciones, dando lugar a distintos algoritmos.
122
ELEMENTOS BASICOS
Estos elementos son:
Modelo de prediccin o Funcin objetivo o Obtencin de la ley de control o
8.4.1.
Modelo de prediccin o
La piedra angular del mpc es el modelo; un diseo completo debe incluir los mecann ismos necesarios para la obtencin del mejor modelo posible, el cual debe ser lo suo cientemente rico para capturar al maximo la dinmica del proceso y debe ser capaz de a permitir el clculo de las predicciones a la vez que sea intuitivo y permita un anlisis a a terico. El uso del modelo del proceso viene determinado por la necesidad del clcuo a lo de la salida predicha en instantes futuros y (t + k | t). Las diferentes estrategias de mpc pueden usar distintos modelos para representar la relacin de las salidas con o las entradas medibles, algunas de las cuales sern variables manipuladas y otras se a pueden considerar como perturbaciones medibles, que pueden ser compensadas por accin feedforward. Adems se tendr en cuenta un modelo de las perturbaciones, para o a a intentar describir el comportamiento que no aparece reejado en el modelo del proceso, englobndose aqu el efecto de las entradas no medibles, el ruido y los errores de a modelado. Para el estudio se puede separar el modelo en dos partes: el modelo del proceso propiamente dicho y el modelo de las perturbaciones. Cualquier mtodo usar ambas e a partes para la prediccin. o Modelo del Proceso Casi todas las formas posibles de modelar un proceso aparecen en alguna formulacin de mpc siendo las ms usadas las siguientes: o a
Respuesta impulsional. Tambin conocida por secuencia de ponderacin o modelo e o de convolucin. La salida viene relacionada con la entrada por la ecuacin o o
y(t) =
i=1
hi u(t i)
123
h2
hi
y(t) t
hN
y(t)
g1
t+1 t+2
a)
...
g2
h1
t+N
t+1 t+2
b)
...
Figura 8.3: Respuesta impulsional y ante escaln o
donde hi son los valores muestreados obtenidos al someter al proceso a un impulso unitario de amplitud igual al per odo de muestreo (ver gura 8.3a). Esta suma es truncada y slo se consideran N valores (por tanto slo permite representar o o procesos estables y sin integradores), teniendo
N
y(t) =
i=1 1 1 2
hi u(t i) = H(z 1 )u(t)
t+N
(8.1)
donde H(z ) = h1 z + h2 z + + hN z N . Un inconveniente de este mtodo e es el gran nmero de parmetros que necesita, ya que N suele ser un valor elevado u a (del orden de 40-50). La prediccin vendr dada por: o a
N
y (t + k | t) =
i=1
hi u(t + k i | t) = H(z 1 )u(t + k | t)
Este mtodo es ampliamente aceptado en la prctica industrial debido a que e a es muy intuitivo y no requiere informacin previa sobre el proceso, con lo que o el procedimiento de identicacin se simplica, a la vez que permite describir o fcilmente dinmicas complejas como fase no m a a nima o retardos. Respuesta ante escaln. Es muy similar al anterior slo que ahora la seal de o o n entrada es un escaln. Para sistemas estables se tiene la respuesta truncada que o ser a
N
y(t) = y0 +
i=1
gi
u(t i) = y0 + G(z 1 )(1 z 1 )u(t)
(8.2)
124
ELEMENTOS BASICOS
donde las gi son los valores muestreados ante la entrada en escaln y u(t) = o u(t) u(t 1), segn se muestra en la gura 8.3b. El valor de y0 puede tomarse u 0 sin prdida de generalidad, con lo cual el predictor ser: e a
N
y (t + k | t) =
i=1
gi
u(t + k i | t)
Este mtodo presenta las mismas ventajas e inconvenientes que el anterior. e Funcin de transferencia. Se utiliza el concepto de funcin de transferencia G = o o B/A con lo que la salida viene dada por: A(z 1 )y(t) = B(z 1 )u(t) A(z 1 ) = 1 + a1 z 1 + a2 z 2 + + ana z na B(z 1 ) = b1 z 1 + b2 z 2 + + bnb z nb Por tanto la prediccin vendr dada por o a y (t + k | t) = B(z 1 ) u(t + k | k) A(z 1 )
Esta representacin es vlida tambin para procesos inestables y posee la ventaja o a e de necesitar pocos parmetros, aunque es fundamental un conocimiento a priori a del proceso sobre todo en cuanto al orden de los polinomios A y B. Espacio de estados. Tiene la siguiente representacin: o x(t) = Ax(t 1) + Bu(t 1) y(t) = Cx(t) siendo x el estado y A, B y C las matrices del sistema, de entrada y de salida respectivamente. Para este modelo la prediccin viene dada por o
k
y (t + k | t) = C x(t + k | t) = C[Ak x(t) +

i=1
Ai1 Bu(t + k i | t)]
Posee la ventaja de que sirve tambin para sistemas multivariables a la vez que e permite analizar la estructura interna del proceso (aunque a veces los estados obtenidos al discretizar no tienen ningn signicado f u sico). Los clculos pueden a ser complicados, con la necesidad adicional de incluir un observador si los estados no son accesibles.
125
Modelo de las perturbaciones De tanta importancia como la eleccin de un determinado modelo del proceso es la o eleccin del modelo utilizado para representar la perturbaciones. Un modelo bastante o extendido es el Autorregresivo Integrado de Media Mvil (Auto-Regressive and Inteo grated Moving Average, arima), en el que las perturbaciones, es decir, las diferencias entre la salida medida y la calculada por el modelo vienen dadas por n(t) = C(z 1 )e(t) D(z 1 )
donde el polinomio D(z 1 ) incluye expl citamente el integrador = 1 z 1 , e(t) es un ruido de media cero y normalmente el polinomio C se considera igual a uno. Este modelo se considera apropiado para dos tipos de perturbaciones: cambios aleatorios ocurridos en instantes aleatorios (por ejemplo cambio en la calidad del material) y movimiento browniano (en procesos con balance de energ y es usado en varios mtodos. Ntese a) e o que al incluir un integrador se consigue un control con error nulo en rgimen permanente e (oset-free). Como caso particular del arima se puede incluir la perturbacin constante o n(t) = e(t) 1 z 1
cuya mejor prediccin ser n(t + k | t) = n(t). o a
8.4.1.1.
Respuestas libre y forzada
Una caracter stica t pica de la mayor de los controladores mpc es el empleo de los a conceptos de repuesta libre y forzada. La idea es expresar la secuencia de acciones de control como la suma de dos seales: n u(t) = uf (t) + uc (t) La seal uf (t) corresponde a las entradas pasadas (anteriores al instante t) y en el n futuro se mantiene constante e igual al ultimo valor de la variable manipulada. Es decir, uf (t j) = u(t j) para j = 1, 2, uf (t + j) = u(t 1) para j = 0, 1, 2,
126
ELEMENTOS BASICOS
La seal uc (t) vale cero en el pasado y corresponde a las seales de control en los n n instantes futuros: uc (t j) = 0 para j = 1, 2, uc (t + j) = u(t + j) u(t 1) para j = 0, 1, 2, La prediccin de la secuencia se salida se separa en dos partes, como se ve en o la gura 8.4. Una de ellas (yf (t)), la respuesta libre, corresponde a la prediccin de o la salida cuando la variable manipulada se hace igual a uf (t), y la otra, la repuesta forzada (yc (t)), corresponde a la prediccin de la salida cuando la seal de control es o n uc (t). La respuesta libre corresponde a la evolucin del proceso debido a su estado o actual (incluido por tanto el efecto de acciones pasadas) mientras que la respuesta forzada es la debida a las acciones de control futuras.
u y
Process
uc
y f
yc
Figura 8.4: Respuestas libre y forzada
8.4.2.
Funcin objetivo o
Los diversos algoritmos de mpc proponen distintas funciones de coste para la obtencin de la ley de control. En general se persigue que la salida futura en el horizonte o considerado siga a una determinada seal de referencia al mismo tiempo que se puede n penalizar el esfuerzo de control requerido para hacerlo. La expresin general de tal o funcin objetivo ser: o a
N2 Nu
J(N1 , N2 , N u) =
j=N1
(j)[(t + j | t) w(t + j)]2 + y

j=1
(j)[ u(t + j 1)]2
(8.3)
En algunos mtodos el segundo sumando, que considera el esfuerzo de control, no e
127
se tiene en cuenta, mientras que en otros tambin aparecen directamente los valores de e la seal de control (no sus incrementos). En la funcin de coste se pueden considerar: n o
Parmetros: N1 y N2 son los horizontes m a nimo y mximo de coste (o de predica cin) y N u es el horizonte de control, que no tiene por qu coincidir con el o e horizonte mximo, como se ver posteriormente. El signicado de N1 y N2 rea a sulta bastante intuitivo: marcan los l mites de los instantes en que se desea que la salida siga a la referencia. As si se toma un valor grande de N1 es porque , no importa que haya errores en los primeros instantes, lo cual provocar una rea spuesta suave del proceso. Ntese que para procesos con tiempo muerto d no tiene o sentido que N1 sea menor que dicho valor puesto que la salida no empezar a a evolucionar hasta el instante t + d. Adems, si el proceso es de fase no m a nima, este parmetro permite eliminar de la funcin objetivo los primeros instantes de a o respuesta inversa. Los coecientes (j) y (j) son secuencias que ponderan el comportamiento futuro. Usualmente se consideran valores constantes o secuencias exponenciales. Por ejemplo se puede conseguir un peso exponencial de (j) a lo largo del horizonte usando: (j) = N2 j Si est comprendido entre 0 y 1 indica que se penaliza ms a los errores ms a a a alejados del instante t que a los ms prximos, dando lugar a un control ms a o a suave y con menor esfuerzo. Si, por el contrario, > 1 es que se penalizan ms a los primeros errores, provocando un control ms brusco. a Todos estos valores pueden ser usados como parmetros de sintonizacin, obtea o niendo un abanico muy amplio de posibilidades con las que se puede cubrir una extensa gama de opciones, desde un control estndar hasta una estrategia diseada a n a medida para un proceso en particular. Trayectoria de referencia: Una de las ventajas del control predictivo es que si se conoce a priori la evolucin futura de la referencia, el sistema puede empezar o a reaccionar antes de que el cambio se haya efectivamente realizado, evitando los efectos del retardo en la respuesta del proceso. En muchas aplicaciones la evolucin futura de la referencia r(t + k) es conocida de antemano, como en o Robtica, servos o procesos en batch; en otras aplicaciones aunque la referencia sea o constante, se puede conseguir una sensible mejora de prestaciones simplemente conociendo el instante de cambio de valor y adelantndose a esa circunstancia. a En el criterio de minimizacin (8.3), la mayor de los mtodos suelen usar una o a e trayectoria de referencia w(t + k) que no tiene por qu coincidir con la referencia e real. Normalmente ser una suave aproximacin desde el valor actual de la salida a o
128
ELEMENTOS BASICOS
y(t) a la referencia conocida mediante un sistema de primer orden: w(t) = y(t) w(t + k) = w(t + k 1) + (1 )r(t + k) k = 1 . . . N (8.4)
es un parmetro comprendido entre 0 y 1 (mientras ms prximo a 1 ms a a o a suave ser la aproximacin) que constituye un valor ajustable que inuir en a o a la respuesta dinmica del sistema. En la gura 8.5 se muestra la forma de la a trayectoria cuando la referencia r(t + k) es constante y para dos valores distintos de ; para valores pequeos de este parmetro se tiene un seguimiento rpido n a a (w1 ) mientras que si aumenta, la trayectoria de referencia ser w2 dando lugar a a una respuesta ms suave. a
r(t+k) w1(t+k) y(t) w2 (t+k)
t
Figura 8.5: Trayectoria de referencia
Restricciones: En la prctica, todos los procesos estn sujetos a restricciones. Los a a actuadores tienen un campo limitado de accin as como una determinada velocio dad de cambio (slew rate), como es el caso de las vlvulas, limitadas por las posia ciones de totalmente abierta o cerrada y por la velocidad de respuesta. Razones constructivas, de seguridad o medioambientales o bien los propios alcances de los sensores pueden causar l mites en las variables de proceso, tales como niveles en depsitos, caudales en tuber o temperaturas y presiones mximas. Adems, o as a a normalmente las condiciones de operacin vienen denidas por la interseccin o o de ciertas restricciones por motivos fundamentalmente econmicos, con lo que el o sistema de control operar cerca de los l a mites. Todo lo expuesto anteriormente hace necesaria la introduccin de restricciones en la funcin a minimizar. o o Muchos algoritmos predictivos tienen en cuenta el tema de las restricciones por lo cual han tenido gran xito en la industria. Normalmente se considerarn l e a mites en la amplitud y el slew rate de la seal de control y l n mites en las salidas: umin u(t) umax t
129
dumin u(t) u(t 1) dumax ymin y(t) ymax
t t
con la adicin de estas restricciones a la funcin objetivo, la minimizacin resulta o o o ms compleja, no pudiendo obtenerse la solucin anal a o ticamente como en el caso sin restringir.
8.4.3.
Obtencin de la ley de control o
Para obtener los valores u(t + k | t) ser necesario minimizar la funcional J de la a ecuacin (8.3). Para ello se calculan los valores de las salidas predichas y (t + k | t) o en funcin de valores pasados de entradas y salidas y de seales de control futuras, o n haciendo uso del modelo que se haya elegido y se sustituyen en la funcin de coste, o obteniendo una expresin cuya minimizacin conduce a los valores buscados. Para el o o criterio cuadrtico si el modelo es lineal y no existen restricciones se puede obtener una a solucin anal o tica, en otro caso se debe usar un mtodo iterativo de optimizacin. e o De cualquiera de las maneras la obtencin de la solucin no resulta trivial pues o o existirn N2 N1 + 1 variables independientes, valor que puede ser elevado (del orden a de 10 a 30). Con la idea de reducir estos grados de libertad se puede proponer cierta estructura a la ley de control. Adems se ha encontrado que esta estructuracin de a o la ley de control produce una mejora en la robustez y en el comportamiento general del sistema, debido fundamentalmente a que el hecho de permitir la libre evolucin de o las variables manipuladas (sin estructurar) puede conducir a seales de control de alta n frecuencia no deseables y que en el peor de los casos podr conducir a la inestabilidad. an Esta estructura de la ley de control se plasma en el uso del concepto de horizonte de control (N u), que consiste en considerar que tras un cierto intervalo N u < N2 no hay variacin en las seales de control propuestas, es decir: o n u(t + j 1) = 0 j > Nu
lo cual es equivalente a dar pesos innitos a las cambios en el control a partir de cierto instante. El caso l mite ser considerar N u igual a 1 con lo que todas las acciones a futuras ser iguales a u(t)2 . an
Recurdese que debido al horizonte deslizante, la seal de control se recalcula en el siguiente e n muestreo.
2
130
REVISION DE LOS PRINCIPALES ALGORITMOS
8.5.
Revisin de los principales algoritmos o
Se presentan a continuacin los principales algoritmos de control predictivo, mostrano do sus principales caracter sticas pero sin entrar en detalles. En el tema siguiente se estudiarn en detalle los dos mtodos considerados ms representativos: dmc y gpc. a e a
8.5.0.1.
Dynamic Matrix Control
Este mtodo usa la respuesta ante escaln (8.2) para modelar el proceso, considerane o do slo los N primeros trminos, asumiendo por tanto que el proceso es estable. En o e cuanto a las perturbaciones, se considera que su valor permanence constante e igual al existente en el instante actual durante todo el horizonte, es decir, igual al valor medido de la salida (ym ) menos el estimado por el modelo y (t | t)). n(t + k | t) = n(t | t) = ym (t) y (t | t) y por tanto el valor predicho de la salida ser: a
k N
y (t + k | t) =
i=1
gi
u(t + k i) +
i=k+1
gi
u(t + k i) + n(t + k | t)
donde el primer trmino contiene las acciones de control futuras (que sern calculadas), e a el segundo los valores pasados de las acciones de control (conocidas) y el ultimo rep resenta las perturbaciones. La funcin de coste puede considerar slo errores futuros o o o incluir tambin el esfuerzo de control, en cuyo caso toma la forma genrica (8.3). e e Una de las caracter sticas de este mtodo que lo ha hecho muy popular en la ine dustria es la inclusin de restricciones, que se traduce en inecuaciones de la forma o genrica: e
N j j Cyi y (t + k | t) + Cui u(t + k i) + cj 0 i=1
j = 1 . . . Nc
En este caso la optimizacin debe ser numrica y se lleva a cabo en cada periodo de o e muestreo, envindose la seal u(t) y recalculando todo en el nuevo periodo de muestreo, a n como en todos los mtodos mpc. Los principales inconvenientes de este mtodo son el e e tamao del modelo empleado y la imposibilidad de tratar procesos inestables. n
131
8.5.0.2.
Model Algorithmic Control
Este mtodo se conoce tambin como Model Predictive Heuristic Control y el proe e ducto comercial se llama idcom (Identication-Command). Es muy similar al dmc con la diferencia principal de usar un modelo de respuesta impulsional (8.1). Introduce el concepto de trayectoria de referencia como un sistema de primer orden que evoluciona desde la salida actual al setpoint segn una determinada constante de tiempo. La varu ianza del error entre esta trayectoria y la salida es lo que marca la minimizacin de la o funcin objetivo. Las perturbaciones se pueden tratar como en el mtodo anterior o se o e pueden estimar segn la siguiente expresin: u o n(t + k | t) = (t + k 1 | t) + (1 )(ym (t) y (t | t)) n con n(t | t) = 0. es un parmetro ajustable (0 < 1) relacionado con el tiempo a de respuesta, el ancho de banda y la robustez del bucle cerrado. El mtodo tambin e e considera restricciones en los actuadores, en las variables internas o en salidas secundarias.
8.5.0.3.
Predictive Functional Control
Este controlador fue desarrollado por Richalet para procesos rpidos. Emplea un a modelo en el espacio de estados, por lo que permite el manejo de procesos inestables, y tambin la extensin al caso no lineal. Este esquema de control tiene dos carace o ter sticas que lo distinguen del resto de controladores de la familia: el uso de puntos de coincidencia y de funciones base. El concepto de puntos de coincidencia (ver gura 8.6) se emplea para simplicar los clculos considerando slo un subconjunto de puntos en el horizonte de prediccin hj , a o o j = 1, . . . , nH . La salida deseada y la predicha deben coincidir en dichos puntos, no en todo el horizonte de prediccin. o La otra idea innovadora de este mtodo es la parametrizacin de la seal de cone o n trol como una combinacin lineal de ciertas funciones base, que son elegidas segn la o u naturaleza del proceso y la referencia:
nB
u(t + k) =
i=1
i (t)Bi (k)
Normalmente estas funciones son de tipo polinmico: escalones (B1 (k) = 1), rampas o 2 (B2 (k) = k) o parbolas (B3 (k) = k ), ya que la mayor de referencias se pueden esa a pecicar como combinacin de estas funciones. Con esta estrategia, un perl de entrada o
132
Puntos de coincidencia
Figura 8.6: Puntos de coincidencia
complejo se puede especicar usando un pequeo nmero de parmetros desconocidos n u a i que son las incgnitas del problema de minimizacin. o o La funcin a minimizar es: o
nH
J=
j=1
[(t + hj ) w(t + hj )]2 y
El algoritmo pfc tambin puede manejar restricciones de mximo y m e a nimo en la aceleracin, que son prcticas en aplicaciones de servocontrol. o a
8.5.0.4.
Extended Prediction Self Adaptive Control
El algoritmo epsac usa un modelo de funcin de transferencia o A(z 1 )y(t) = B(z 1 )u(t d) + v(t) donde d es el retardo y v(t) la perturbacin. Este modelo puede ampliarse para tratar o perturbaciones medibles aadiendo un trmino D(z 1 )d(t) para incluir efecto feedforn e ward. La estructura de la ley de control es muy simple, ya que se considera que la seal n de control permanecer constante a partir del instante t (es decir, horizonte de control a igual a 1): u(t + k) = 0 para k > 0. Para obtener la seal de control de minimiza una n funcin de coste de la forma: o
N
(k)[w(t + k) P (z 1 )(t + k | t)]2 y

k=d
133
donde P (z 1 ) es un polinomio de diseo con ganancia unitaria y (k) es una secuencia n de ponderacin. La seal de control se puede calcular anal o n ticamente de la forma:
N
hk (k)[w(t + k) P (z 1 )(t + k | t)] y u(t) =

k=d N k=d
(k)h2 k
siendo hk los coecientes de la respuesta impulsional del sistema.
8.5.0.5.
Extended Horizon Adaptive Control
Esta formulacin tambin emplea un modelo de funcin de transferencia y pretende o e o minimizar la discrepancia entre la salida calculada y la referencia en el instante t + N : y (t + N | t) w(t + N ), con N d. La solucin a este problema no es unica (a menos o que N = d); una posible estrategia es considerar horizonte de control igual a 1: u(t + k 1) = 0 o minimizar el esfuerzo de control
N d
1<k N d
J=
k=0
u2 (t + k)
Este mtodo utiliza un predictor de N pasos de la forma e y (t + N | t) = y(t) + F (z 1 ) y(t) + E(z 1 )B(z 1 ) u(t + N d)
donde E(z 1 ) y F (z 1 ) son polinomios que satisfacen la relacin o (1 z 1 ) = A(z 1 )E(z 1 )(1 z 1 ) + z N F (z 1 )(1 z 1 ) con el grado de E igual a N 1. Una ventaja de este mtodo es que se puede encontrar e fcilmente una solucin expl a o cita, dada por u(t) = u(t 1) + 0 (w(t + N ) y (t + N | t))
N d k=0 2 i
siendo k el coeciente correspondiente a u(t + k) en la ecuacin de prediccin. Por o o tanto la ley de control depende slo de los parmetros del proceso y puede hacerse o a fcilmente adaptativa si se emplea un identicador en l a nea. El unico coeciente de ajuste es el horizonte de prediccin N , lo cual simplica el uso pero proporciona poca o libertad para el diseo. Obsrvese que no puede usarse trayectoria de referencia porque n e el error se considera slo en un instante (t+N ), ni tampoco la ponderacin del esfuerzo o o de control.
134
8.5.0.6.
Generalized Predictive Control
Este mtodo propuesto por Clarke et al. emplea un modelo carima (Controlled e Auto-Regressive Integrated Moving Average) para la prediccin de la salida: o e(t)
A(z 1 )y(t) = B(z 1 )z d u(t 1) + C(z 1 )
donde la perturbacin viene dada por un ruido blanco coloreado por el polinomio o 1 C(z ). Como en la prctica es dif encontrar el verdadero valor de este polinomio, a cil se puede emplear como parmetro de diseo para rechazo de perturbaciones o mejora de a n la robustez. La prediccin optima se lleva a cabo resolviendo una ecuacin diofntica, o o a lo cual puede hacerse ecazmente de forma recursiva. Este algoritmo, al igual que otros que usan el modelo de funcin de transferencia, o se puede implementar fcilmente en forma adaptativa usando un algoritmo de identia cacin en l o nea como los m nimos cuadrados recursivos. gpc usa una funcin de coste cuadrtica de la forma o a
N2 Nu
J(N1 , N2 , Nu ) =
j=N1
(j)[(t + j | t) w(t + j)] + y

j=1
(j)[ u(t + j 1)]2
donde las secuencia de ponderacin (j) y (j) se eligen normalmente constantes o o exponenciales y la trayectoria de referencia w(t+j) se puede generar como una secuencia que empieza en el valor actual de la salida y tiende exponencialmente al setpoint. Las bases tericas del algoritmo gpc has sido ampliamente estudiadas y se puede o demostrar que, para distintos conjuntos de parmetros, el algoritmo es estable y que a otros controladores como por ejemplo el dead beat son casos incluidos en ste. e
Cap tulo 9 Controladores predictivos

9.1. Dynamic Matrix Control
El mtodo Dmc se desarroll a nales de los setenta por Cutler y Ramaker de Shell e o Oil Co. y ha sido aceptado ampliamente en el mundo industrial, principalmente por las industrias petroqu micas. Actualmente dmc es algo ms que un algoritmo y parte a de su xito se debe al hecho de que el producto comercial resuelve otros temas como e identicacin u optimizacin global de la planta. En esta seccin slo se analiza el o o o o algoritmo standard sin abordar detalles tcnicos propios del producto de mercado que e no son de dominio pblico. u Pero a pesar de este xito en la prctica, este mtodo adolece quizs de la ausencia e a e a de un anlisis terico ma completo que estudie la inuencia de los parmetros de a o s a diseo (horizontes, secuencias de ponderacin) sobre la estabilidad del bucle cerrado n o as como de resultados de robustez.
9.1.1.
Prediccin o
El modelo de proceso que se emplea es el de respuesta temporal, considerando la perturbacin como constante a lo largo del horizonte. El procedimiento para obtener o la prediccin se describe a continuacin. o o 135
136
DYNAMIC MATRIX CONTROL
Como se emplea un modelo de respuesta ante escaln: o
y(t) =
i=1
gi
u(t i)
los valores predichos a lo largo del horizonte sern: a
y (t + k | t) =
i=1 k
gi
u(t + k i) + n(t + k | t) =
=
i=1
gi
u(t + k i) +
i=k+1
gi
u(t + k i) + n(t + k | t)
Las perturbaciones se consideran constantes, n(t+k | t) = n(t | t) = ym (t) y (t | t), por lo que se puede escribir:
k
y (t + k | t) =
i=1
gi
u(t + k i) +
i=k+1 k
gi
u(t + k i) + ym (t)
i=1
gi
u(t i) =
i=1
gi
u(t + k i) + f (t + k)
donde f (t + k) es la respuesta libre del proceso, es decir, la parte de la respuesta que no depende de las acciones de control futuras, y viene dada por:
f (t + k) = ym (t) +
i=1
(gk+i gi )
u(t i)
(9.1)
Si el proceso es asintticamente estable, los coecientes gi de la respuesta ante o escaln tienden a un valor constante despus de N periodos de muestreo, por lo que se o e puede considerar que gk+i gi 0, i>N y por tanto la respuesta libre se puede calcular como
N
f (t + k) = ym (t) +
i=1
(gk+i gi )
u(t i)
Ntese que si el proceso no es estable, entonces no existe N y no se puede calcuo lar f (t + k) (aunque existe una generalizacin en el caso de que la inestabilidad sea o producida por integradores puros).
CAP ITULO 9. CONTROLADORES PREDICTIVOS
137
Ahora las predicciones se pueden calcular a lo largo del horizonte de prediccin o (k = 1, . . . , p), considerando m acciones de control. y (t + 1 | t) = g1 y (t + 2 | t) = g2 . . . y (t + p | t) =
i=pm+1
u(t) + f (t + 1) u(t) + g1
p
u(t + 1) + f (t + 2)
gi
u(t + p i) + f (t + p)
Si se dene la matriz dinmica G como: a g1 0 g g1 2 . . . . . . G = gm gm1 . . . . . . gp gp1 se puede escribir que:
... ...
0 0 . . . g1 . . .
gpm+1
y = Gu + f
(9.2)
Obsrvese que G est formada por m (horizonte de control) columnas de la respuesta e a ante escaln apropiadamente desplazadas hacia abajo. y es un vector de dimensin p o o que contiene las predicciones de la salida, u representa el vector de incrementos de control y f es el vector de respuestas libres. Esta es la expresin que relaciona las o respuestas futuras con los incrementos en las seales de control, por lo que usar para n a calcular las acciones necesarias para conseguir el comportamiento deseado del sistema.
9.1.2.
Perturbaciones medibles
El efecto de las perturbaciones medibles se puede aadir fcilmente a las anteriores n a ecuaciones de prediccin, ya que stas se pueden tratar como entradas al sistema. La o e expresin (9.2) se puede usar para calcular la prediccin del efecto de las perturbaciones o o en la salida de la siguiente forma: yd = D d + f d
138
donde yd es la contribucin de las perturbaciones medibles a la salida, D es una matriz o similar a G que contiene los coecientes de la respuesta del sistema a un escaln en la o perturbacin, d es el vector de incrementos en la perturbacin y fd es la parte de la o o respuesta que no depende de la perturbacin. o En el caso ms general de perturbaciones medibles y no medibles, la respuesta libre a completa del sistema (la fraccin de la salida que no depende de la variable manipulada) o se puede considerar como la suma de cuatro efectos: la respuesta a la entrada u(t), a la perturbacin medible d(t), a la perturbacin no medible y al estado actual del proceso: o o f = fu + D d + f d + fn Por tanto la prediccin se puede expresar en la forma general o y = Gu + f
9.1.3.
Algoritmo de control
El xito en la industria del dmc se ha debido principalmente a su aplicacin a e o sistemas multivariables de gran dimensin con la consideracin de restricciones. En o o esta seccin se describe el algoritmo de control comenzando por el caso ms simple o a de un sistema monovariable sin restricciones y extendindolo posteriormente al caso e general multivariable con restricciones. El objetivo del controlador dmc es llevar el proceso los ms cerca posible al setpoint a en el sentido de m nimos cuadrados con la posibilidad de incluir una penalizacin en los o movimientos de la seal de control. Por ello se seleccionan las variables manipuladas de n forma que minimicen un objetivo cuadrtico que puede incluir slo los errores futuros a o
p
J=
j=1
[(t + j | t) w(t + j)]2 y
o tambin el esfuerzo de control, presentando la forma genrica e e

p m
J=
j=1
[(t + j | t) w(t + j)] + y

j=1
[ u(t + j 1)]2
Si no existen restricciones, la minimizacin de la funcin de coste J = eeT + uuT , o o donde e es el vector de errores futuros a lo largo del horizonte de prediccin y u es el o
139
+ K
-
Proceso
f Calculo Resp. libre
Figura 9.1: Ley de control
vector de futuros incrementos en la seal de control u(t), . . . , u(t + m), se puede n hacer de forma anal tica calculando la derivada de J y hacindola igual a 0, lo que e proporciona el resultado general:
u = (GT G + I)1 GT (w f )
(9.3)
Recurdese que, como en todas las estrategias predictivas, slo se env al proceso e o a el primer elemento del vector u ( u(t)). No es aconsejable implementar la secuencia completa sobre los siguientes m intervalos, ya que al ser imposible estimar de forma exacta las perturbaciones, no es posible anticiparse a las perturbaciones inevitables que provocan que la salida real diera de las predicciones que se emplean para calcular la secuencia futura de acciones de control. Adems, el setpoint puede cambiar durante los a prximos m intervalos. o Resulta interesante analizar en qu consiste realmente la ley de control. Analizane do la expresin 9.3 se observa que el primer elemento del vector u, que es la seal o n que efectivamente se env a la planta, es el producto de la primera la de la matriz a T 1 T (G G+I) G (llammosle K) por la diferencia entre la trayectoria de referencia y la e respuesta libre, que es el error futuro si no hubiera incrementos en la seal de control. n Se puede decir por tanto que el incremento de la seal de control es proporcional (por n medio de K) a los errores futuros y por tanto habr cambios en la seal de control a n siempre que el controlador detecte que va a haber una discrepancia en el futuro entre el objetivo deseado y el comportamiento esperado del sistema. Esta idea queda reejada en la gura 9.1.
140

P. operacion optimo
Zona segura 1
Punto operacion 1 Restriccion zona segura 2 Restriccion Punto operacion 2
Figura 9.2: Punto de operacin optimo de un proceso t o pico
9.1.3.1.
El caso con restricciones
Aunque computacionalmente ms complicado que otros algoritmos ms simples, la a a capacidad de manejar restricciones que posee este mtodo (y mpc en general) lo hace e muy atractivo para aplicaciones prcticas, ya que en general el punto de operacin a o optimo segn criterios econmicos se encuentra normalmente en la interseccin de las u o o restricciones, como se muestra en la gura 9.2. Por razones de seguridad, es necesario mantener una zona segura alrededor del punto de operacin, ya que el efecto de las o perturbaciones puede hacer que la salida del proceso viole las restricciones. Esta zona se puede reducir (y por tanto aumentar los benecios econmicos) si el controlador es o capaz de manejar restricciones (punto de operacin 1). o Las restricciones tanto en entrada como en salida se pueden reducir a desigualdades de forma genrica e
N j j Cyi y (t + k | t) + Cui u(t + k i) + cj 0 i=1
j = 1 . . . Nc
que deben tenerse en cuenta para la minimizacin. Como se ha visto, las salidas se o pueden expresar en funcin del vector de incrementos de control a travs de la matriz o e dinmica, por que las restricciones tanto en la entrada como en la salida se pueden a recoger en una desigualdad matricial de la forma Ru c, como se ver con ms a a detalle en el tema dedicado a restricciones. Ahora la minimizacin es un problema de o Programacin Cuadrtica qp, cuya solucin es numrica. o a o e Todo lo relacionado con las restricciones ser abordado con mayor grado de detalle a en el tema dedicado a ello.
141
9.1.3.2.
Extensin al caso multivariable o
El esquema previo se puede extender fcilmente al caso de sistemas con varias a entradas y varias salidas. Las ecuaciones bsicas se mantienen igual a excepcin de que a o las matrices y vectores cambian de dimensin para poder incluir todas las entradas y o salidas. Al tratarse de modelos lineales, se puede aplicar el principio de superposicin para o obtener el valor de las salidas ante las diversas entradas. Para ello se dene el vector de salidas futuras como: y = [y1 (t + 1 | t), . . . , y1 (t + p1 | t), . . . , yny (t + 1 | t), . . . , yny (t + pny | t)]T y el de seales de control de la forma: n u = [ u1 (t), . . . , u1 (t + m1 1), . . . , unu (t), . . . , unu (t + mnu 1)]T
as como la respuesta libre: f = [f1 (t + 1 | t), . . . , f1 (t + p1 | t), . . . , fny (t + 1 | t), . . . , fny (t + pny | t)]T teniendo en cuenta que la respuesta libre de la salida i depende tanto de valores pasados de yi como de valores pasados de todas las seales de control. n Con estas deniciones, la ecuacin de prediccin es igual que en el caso monovariable o o simplemente considerando que la matriz G toma la forma: G11 G12 G1nu G21 G22 G2nu G = . . . ... . . . . . . Gny1 Gny2 Gnynu Cada submatriz Gij contiene los coecientes de la respuesta ante escaln i-sima o e correspondiente a la entrada j-sima. El proceso de minimizacin es anlogo slo que la e o a o ponderacin tanto de los errores como de los esfuerzos de control se realiza con matrices o de peso.
9.2.
Control Predictivo Generalizado
El Control Predictivo Generalizado gpc fue propuesto por Clarke et al. en 1987 y se ha convertido en uno de los mtodos ms populares en el ambito del Control e a
142
CONTROL PREDICTIVO GENERALIZADO
Predictivo tanto en el mundo industrial como en el acadmico. Se ha empleado con e xito en numerosas aplicaciones industriales, mostrando buenas prestaciones a la vez e que un cierto grado de robustez respecto a sobreparametrizacin o retardos mal conoo cidos. Puede resolver muchos problemas de control diferentes para un amplio campo de procesos con un nmero razonable de variables de diseo, que son especicadas por el u n operario dependiendo del conocimiento previo del proceso y de los objetivos de control. La idea bsica del gpc es calcular una secuencia de futuras acciones de control a de tal forma que minimice una funcin de coste multipaso. El o ndice a minimizar es una funcin cuadrtica que mide por un lado la distancia entre la salida predicha del o a sistema y una cierta trayectoria de referencia hasta el horizonte de prediccin, y por o otro el esfuerzo de control necesario para obtener dicha salida. El Control Predictivo Generalizado tiene muchas ideas en comn con otros conu troladores predictivos previamente mencionados ya que est basado en las mismas a ideas pero posee a su vez algunas diferencias. Como se ver ms adelante, es capaz de a a proporcionar una solucin expl o cita (en ausencia de restricciones), puede trabajar con procesos inestables o de fase no m nima e incorpora el concepto de horizonte de control as como la consideracin en la funcin de coste de ponderacin de los incrementos en o o o las acciones de control. Las diversas posibilidades disponibles para el gpc conducen a una gran variedad de objetivos de control comparado con otras realizaciones, algunas de las cuales pueden ser consideradas como subconjuntos o casos l mites del gpc.
9.2.1.
Formulacin del Control Predictivo Generalizado o
La mayor de los procesos de una sola entrada y una sola salida (single-input singlea output, siso), al ser considerados en torno a un determinado punto de trabajo y tras ser linealizados, pueden ser descritos de la siguiente forma: A(z 1 )y(t) = z d B(z 1 )u(t 1) + C(z 1 )e(t) donde u(t) y y(t) son respectivamente la seal de control y la salida del proceso y e(t) n es un ruido blanco de media cero. A, B y C son los siguientes polinomios en el operador de desplazamiento hacia atrs z 1 : a A(z 1 ) = 1 + a1 z 1 + a2 z 2 + ... + ana z na B(z 1 ) = b0 + b1 z 1 + b2 z 2 + ... + bnb z nb C(z 1 ) = 1 + c1 z 1 + a2 z 2 + ... + cnc z nc donde d es el tiempo muerto del sistema.
143
Este modelo es conocido como Autorregresivo de Media Mvil (Controller Autoo Regressive Moving-Average carma). En muchas aplicaciones industriales en las que las perturbaciones son no-estacionarias resulta ms conveniente el uso de un modelo a carma integrado, dando lugar al carima, que viene descrito por: A(z 1 )y(t) = B(z 1 )z d u(t 1) + C(z 1 ) e(t) con = 1 z 1 (9.4)
Por simplicidad, a partir de ahora el polinomio C se va a tomar igual a 1. Ntese o 1 que en el caso de que C pueda ser truncado se puede absorber en A y B. El algoritmo del Control Predictivo Generalizado consiste en aplicar una secuencia de seales de control que minimice una funcin de coste de la forma: n o
N2 Nu
J(N1 , N2 , N u) =
j=N1
(j)[(t + j | t) w(t + j)] + y

j=1
(j)[ u(t + j 1)]2
(9.5)
donde y (t + j | t) es la prediccin optima j pasos hacia delante de la salida del proceso o con datos conocidos hasta el instante t, N1 y N2 son los horizontes m nimo y mximo a de coste, N u es el horizonte de control y (j) y (j) son las secuencias de ponderacin o mientras que w(t + j) es la futura trayectoria de referencia, que se puede calcular segn u se muestra en la gura 8.5. En muchas situaciones se considera (j) igual a 1 y (j) constante. El objetivo es pues el clculo de la futura secuencia de control u(t), u(t + 1),... de a tal manera que la salida futura del proceso y(t + j) permanezca prxima a w(t + j). o Esto se logra minimizando J(N1 , N2 , N u).
9.2.1.1.
Prediccin optima o
Con la intencin de minimizar la funcin de coste, se obtendr previamente la o o a prediccin optima de y(t + j) para j N1 y j N2 . Considrese la siguiente ecuacin o e o diofntica: a 1 = Ej (z 1 ) A + z j Fj (z 1 ) 1 = Ej (z 1 )A + z j Fj (z 1 ) (9.6)
Los polinomios Ej y Fj estn unicamente denidos con grados j 1 y na respectia vamente. Se pueden obtener dividiendo 1 entre A(z 1 ) hasta que el resto pueda ser facj 1 torizado como z Fj (z ). El cociente de la divisin es entonces el polinomio Ej (z 1 ). o
144
Si se multiplica la ecuacin (9.4) por Ej (z 1 ) z j o A(z 1 )Ej (z 1 )y(t + j) = Ej (z 1 )B(z 1 ) u(t + j d 1) + Ej (z 1 )e(t + j) (9.7)
Teniendo en cuenta (9.6), la ecuacin (9.7) queda: o (1 z j Fj (z 1 ))y(t + j) = Ej (z 1 )B(z 1 ) u(t + j d 1) + Ej (z 1 )e(t + j)
La cual se puede escribir como y(t + j) = Fj (z 1 )y(t) + Ej (z 1 )B(z 1 ) u(t + j d 1) + Ej (z 1 )e(t + j) (9.8)
Al ser el grado del polinomio Ej (z 1 ) igual a j 1 los trminos del ruido en la e ecuacin (9.8) estn todos en el futuro. La mejor prediccin de y(t + j) ser por cono a o a siguiente: y (t + j | t) = Gj (z 1 ) u(t + j d 1) + Fj (z 1 )y(t) donde Gj (z 1 ) = Ej (z 1 )B(z 1 ) Resulta simple demostrar que los polinomios Ej y Fj se pueden obtener recursivamente, de forma que los nuevos valores en el paso j + 1 (Ej+1 y Fj+1 ) sean funcin de o los del paso j. A continuacin se muestra una demostracin simple de la recursividad o o de la ecuacin diofntica. Existen otras formulaciones del gpc que no estn basadas o a a en la recursividad de esta ecuacin. o Considrense que los polinomios Ej y Fj se han obtenido dividiendo 1 entre A(z 1 ) e hasta que el resto haya sido factorizado como z j Fj (z 1 ) . Con: Fj (z 1 ) = fj,0 + fj,1 z 1 + + fj,na z na Ej (z 1 ) = ej,0 + ej,1 z 1 + + ej,j1 z (j1)
Supngase que se utiliza el mismo procedimiento para obtener Ej+1 y Fj+1 , es decir, o dividir 1 entre A(z 1 ) hasta que el resto se pueda factorizar como z (j+1) Fj+1 (z 1 ) con Fj+1 (z 1 ) = fj+1,0 + fj+1,1 z 1 + + fj+1,na z na
Est claro que solamente es necesario dar un paso ms en la divisin para obtener a a o los polinomios Ej+1 y Fj+1 . Al ser Ej+1 el nuevo cociente de la divisin, ser igual al o a
145
cociente que hab hasta el momento (Ej ) ms un nuevo trmino, que ser el fj,0 pues a a e a es mnico. Por tanto: el divisor (A) o Ej+1 (z 1 ) = Ej (z 1 ) + ej+1,j z j con ej+1,j = fj,0
Teniendo en cuenta que el nuevo resto ser el resto anterior menos el producto del a cociente por el divisor, los coecientes del polinomio Fj+1 se pueden expresar como: fj+1,i = fj,i+1 fj,0 ai+1 i = 0 na En resumen, la forma de obtener los polinmios Ej y Fj es la siguiente: 1. Comenzar con E1 = 1, F1 = z(1 A) 2. Ir aadiendo nuevos trminos a Ej con ej+1,j = fj,0 n e 3. Calcular fj+1,i = fj,i+1 fj,0 ai+1 i = 0 na, (siendo fj,na+1 = 0). El polinomio Gj+1 puede ser obtenido recursivamente como sigue: Gj+1 = Ej+1 B = (Ej + fj,0 z j )B = Gj + fj,0 z j B Es decir, los primeros j coecientes de Gj+1 sern idnticos a los de Gj mientras a e que el resto viene dado por: gj+1,j+i = gj,j+i + fj,0 bi para i = 0 nb
Para resolver el gpc es necesario obtener el conjunto de seales de control u(t), n u(t + 1), ...,u(t + N ) que minimizan la ecuacin (9.5). Al tener el proceso un retardo de o d per odos de muestreo, la salida slo se ver inuenciada por la seal u(t) despus del o a n e instante d + 1. Los valores N1 , N2 y N u que marcan los horizontes pueden ser denidos como N1 = d + 1, N2 = d + N y N u = N . No tiene sentido hacer N1 < d + 1 ya que los trminos de (9.5) slo dependern de las seales de control pasadas. Por otro lado, e o a n haciendo N1 > d + 1 los primeros puntos de la secuencia de salida, que sern los mejor a estimados, no se tendrn en cuenta. a El conjunto de las j predicciones optimas: y (t + d + 1 | t) = Gd+1 y (t + d + 2 | t) = Gd+2 . . . y (t + d + N | t) = Gd+N u(t) + Fd+1 y(t) u(t + 1) + Fd+2 y(t) u(t + N 1) + Fd+N y(t)
146
puede ser escrito en forma matricial como: y = Gu + F(z 1 )y(t) + G (z 1 ) Donde y = G = G (z 1 ) = F(z ) =
1
u(t 1)
(9.9)
y (t + d + 1 | t) y (t + d + 2 | t) . . . y (t + d + N | t) g0 g1 . . . 0 g0 . . . ... ... . . .
0 0 . . .
u=
u(t) u(t + 1) . . . u(t + N 1)
gN 1 gN 2 ... g0
z(Gd+1 (z 1 ) g0 ) 2 z (Gd+2 (z 1 ) g0 g1 z 1 ) . . . z N (Gd+N (z 1 ) g0 g1 z 1 gN 1 z (N 1) ) Fd+1 (z 1 ) Fd+2 (z 1 ) . . . Fd+N (z 1 )
Al depender los ultimos trminos de la ecuacin (9.9) slo del pasado, pueden e o o agruparse en f, dando lugar a: y = Gu + f (9.10) Obsrvese que es la misma expresin que se obtuvo para el dmc, aunque en este e o caso la respuesta libre es distinta.
9.2.1.2.
Obtencin de la ley de control o
Entonces la ecuacin (9.5) puede escribirse como: o J = (Gu + f w)T (Gu + f w) + uT u donde: w= w(t + d + 1) w(t + d + 2) w(t + d + N )
T
(9.11)
(9.12)
147
La ecuacin (9.11) se puede poner como: o 1 J = uT Hu + bu + f0 2 donde: H = 2(GT G + I) b = 2(f w)T G f0 = (f w)T (f w) El m nimo de J, siempre que no existan restricciones en la seal de control, puede n ser calculado igualando a cero el gradiente de J, lo cual conduce a: u = H1 bT (9.14) (9.13)
Debido al uso de la estrategia deslizante, slo se aplica realmente el primer elemento del o vector u, repitiendo de nuevo el mismo procedimiento al siguiente instante de muestreo. La solucin propuesta involucra la inversin (o al menos la triangularizacin) de una o o o matriz de dimensin N N , lo cual conlleva una gran carga de clculo. El concepto ya o a usado en otros mtodos de horizonte de control se emplea con la nalidad de reducir e la cantidad de clculo, asumiendo que las seales de control permanecern en un valor a n a constante a partir del intervalo N u < N . Por tanto la dimensin de la matriz que hay o que invertir queda reducida a N u N u, quedando la carga de clculo reducida (en el a caso l mite de N u = 1, se reduce al caso escalar) aunque restringiendo la optimalidad.
9.2.2.
Ejemplo de clculo a
Se presenta a continuacin un ejemplo de clculo de un Controlador Predictivo o a Generalizado en un caso sencillo. Se disear el controlador para un sistema de primer n a orden. Al discretizar el proceso continuo se obtiene el siguiente equivalente discreto: (1 + az 1 )y(t) = (b0 + b1 z 1 )u(t 1) + e(t)
Se va a considerar un retardo d igual a 0 y un polinomio de ruido C(z 1 ) igual a 1. Se usar el algoritmo descrito previamente para obtener la ley de control, obteniendo a resultados numricos para valores de los pametros a = 0,8, b0 = 0,4 y b1 = 0,6, siendo e a
148
los horizontes N1 = 1 y N = Nu = 3. Como se ha mostrado, se calcularn los valores a predichos de la salida del proceso en el horizonte haciendo uso de la ecuacin (9.9), o obteniendo la ley de control de la expresin (9.14). o Resolviendo la ecuacin (9.6) se obtienen los polinomios del predictor Ej (z 1 ), o 1 Fj (z ) desde j = 1 hasta j = 3, con A(z 1 ) = A(z 1 )(1 z 1 ) = 1 1,8z 1 + 0,8z 2 En este caso sencillo donde el horizonte no es demasiado largo, estos polinomios se pueden obtener directamente dividiendo 1 por A(z 1 ). Como se ha explicado antes, tambin se pueden calcular recursivamente, comenzando con los valores obtenidos en e el primer paso de la divisin, es decir: o E1 (z 1 ) = 1 F1 (z 1 ) = 1,8 0,8z 1
Cualquiera que sea el mtodo empleado, los valores obtenidos son: e E2 = 1 + 1,8z 1 F2 = 2,44 1,44z 1
E3 = 1 + 1,8z 1 + 2,44z 2 F3 = 2,952 1,952z 1 Con estos valores y el polinomio B(z 1 ) = 0,4 + 0,6z 1 , los elementos Gi (z 1 ) resultan ser: G1 = 0,4+0,6z 1 G2 = 0,4+1,32z 1 +1,08z 2 G3 = 0,4+1,32z 1 +2,056z 2 +1,464z 3 y por tanto se pueden escribir las salidas predichas como: y (t + 1 | t) 0,4 y (t + 2 | t) = 1,32 y (t + 3 | t) 2,056 0,6 + 1,08 1,464 0 0 0,4 0 1,32 0,4 u(t) u(t + 1) + u(t + 2)
u(t 1) + 1,8y(t) 0,8y(t 1) u(t 1) + 2,44y(t) 1,44y(t 1) u(t 1) + 2,952y(t) 1,952y(t 1)

f
El paso siguiente es el clculo de H1 b. Tomando igual a 0,8 se tiene que: a 0,133 0,286 0,147 (GT G + I)1 GT = 0,154 0,165 0,286 0,029 0,154 0,1334
149
Como slo se necesita el valor de u(t) para los clculos, slo se emplea realmente la o a o primera la de la matriz, con lo que resulta la siguiente expresin para la ley de control: o u(t) = 0,6042 u(t 1) 1,371y(t) + 0,805y(t 1) +
+ 0,133w(t + 1) + 0,286w(t + 2) + 0,147w(t + 3) donde w(t + i) es la trayectoria de referencia que se puede considerar bien constante e igual a la referencia actual o bien una suave aproximacin de primer orden a sta. o e Entonces la seal de control resulta ser una funcin de la referencia deseada y de n o entradas y salidas pasadas, dada por:
u(t) = 0,3958u(t 1) + 0,6042u(t 2) 1,371y(t) + 0,805y(t 1) + + 0,133w(t + 1) + 0,286w(t + 2) + 0,147w(t + 3)
Al mismo resultado se puede llegar sin emplear la ecuacin diofntica, calculando o a G en base a los coecientes de la respuesta ante escaln (que se pueden calcular en o funcin de los coecientes de la funcin de transferencia) y calculando la respuesta o o libre haciendo evolucionar hacia delante el modelo mientras la entrada se mantiene constante.
9.2.3.
Caso multivariable
Al igual que en el dmc todo lo visto para el caso de sistemas con una sola entrada y una sola salida se puede extender al caso multivariable, aunque los clculos son ms a a complejos. En este caso el modelo carima para un sistema de m entradas y n salidas se puede expresar como: 1 A(z 1 )y(t) = B(z 1 )u(t 1) + C(z 1 )e(t) (9.15) donde A(z 1 ) y C(z 1 ) son matrices polinomiales mnicas de dimensin nn y B(z 1 ) o o es una matriz polinomial de dimensin n m, denidos como: o A(z 1 ) = Inn + A1 z 1 + A2 z 2 + + Ana z na B(z 1 ) = B0 + B1 z 1 + B2 z 2 + + Bnb z nb C(z 1 ) = Inn + C1 z 1 + C2 z 2 + + Cnc z nc
150
Las variablesy(t), u(t) y e(t) son de dimensin n 1, m 1 y n 1 respectivamente. o La prediccin conlleva la resolucin de una ecuacin diofantica matricial, que tambin o o o e puede calcularse de forma recursiva. En muchas ocasiones el problema radica en la obtencin adecuada del modelo en o esta forma a partir de una matriz de transferencia en continuo que puede haberse obtenido a partir de la curva de reaccin. o Una vez obtenido el modelo, el criterio a minimizar tendr la forma general a
N2 N3
J(N1 , N2 , N3 ) =
j=N1
y (t + j | t) w(t + j)
2 R
+
j=1
u(t + j 1)
2 Q
donde R y Q son matrices de ponderacin denidas positivas que normalmente se eligen o diagonales. La minimizacin se realiza igual que en el caso monovariable dando como o resultado un vector de seales de control a enviar a la planta en el instante actual: n u1 (t), u2 (t) . . . um (t).
Cap tulo 10 Otros aspectos del Control Predictivo

10.1. Restricciones en Control Predictivo
En la prctica todos los procesos estn sujetos a restricciones. Los actuadores tienen a a un campo limitado de accin impuesto por l o mites f sicos (por ejemplo una vlvula no a puede abrir ms de un 100 % o un calentador no puede aportar ms de su potencia a a mxima. Tambin existen l a e mites de seguridad (por ejemplo presiones o temperaturas mximas), requerimientos tecnolgicos (por ejemplo mantener temperaturas en un rana o go dado), limitaciones de calidad del producto (no salirse de cierta zona) o normativa medioambiental.
10.1.1.
Tratamiento convencional de restricciones
El tratamiento convencional de restricciones en control de procesos se basa en que las restricciones en la variable manipulada (entrada) se cumplen saturando la salida del controlador. Sin embargo, las restricciones en la variable controlada (salida) no pueden abordarse; se intenta evitar su violacin trabajando alejados de los l o mites (en zona segura), operando lejos de la restriccin. Por seguridad se trabaja con una consigna o inferior, ms lejos del punto de operacin optimo, lo que normalmente equivale a una a o disminucin de la calidad y/o cantidad en la produccin, ya que normalmente el punto o o optimo se encuentra en la interseccin de las restricciones obligando a acercarse lo ms o a 151
152
RESTRICCIONES EN CONTROL PREDICTIVO
P Pmax P1 P2
Q1 Q2
Figura 10.1: Restricciones y punto de operacin optimo o
posible a las stas pero sin superarlas. e Si el controlador fuera capaz de tener en cuenta las restricciones y evitar su violacin, o el proceso podr operar ms cerca de stas y por tanto de forma ms eciente. La gura a a e a 10.1 muestra un ejemplo donde existe una limitacin de presin mxima y se observa o o a cmo al alejar el punto de operacin del l o o mite la produccin Q disminuye. o En cuanto a la forma de operar de un controlador predictivo que no considera restricciones el procedimiento es similar: si la seal de control calculada viola la restriccin, n o se satura. Las seales futuras ni siquiera se tienen en cuenta, ya que normalmente no n se calculan. Esta forma de proceder no garantiza el carcter optimo de la solucin y en a o ningn caso garantiza el cumplimiento de las restricciones en la salida. La violacin de u o los l mites de las variables controladas puede ser ms costoso y peligroso, produciendo a daos en equipos y prdidas en la produccin. n e o La gura 10.2 muestra con claridad el fenmeno de prdida de la solucin optima o e o cuando las variables manipuladas se mantienen en sus l mites por el programa de control o por el propio actuador. Este hecho puede llevar a valores mayores de la funcin objetivo y a un comportamiento no deseado (incluso inestabiliad). En 10.2a se o muestra un caso con horizonte de control igual a 2, donde se observa que si se satura la seal de control u(t) a umax el valor de la funcin de coste no es el mejor que se n o podr conseguir (que ser el correspondiente a uc ). Incluso puede que no se viole la a a restriccin en el instante actual pero s en el futuro (gura 10.2b) con lo que la seal o n enviada al sistema (sin saturar) no es la mejor para el problema de dimensin 2 que se o est optimizando. a
CAP ITULO 10. OTROS ASPECTOS DEL CONTROL PREDICTIVO
153
u(t+1)
u(t+1)
u max
u max
uc u max
u u(t)
uc
u u max u(t)
a)
Figura 10.2: Restricciones en la seal de control n
b)
10.1.2.
Restricciones en Control Predictivo
En la actualidad el mpc es la unica metodolog capaz de incorporar las restricciones a de forma sistemtica en la fase de diseo del controlador, siendo esta caracter a n stica una de las razones de su gran xito en la industria. Parece lgico que al disponer de un e o modelo dinmico del proceso se pueda conocer la evolucin futura de su salida y por a o tanto se pueda saber si sta va a violar o no las restricciones y actuar en consecuencia. e Para formular el algoritmo mpc con restricciones hay que expresar stas en funcin e o de la variable sobre la que se puede actuar, es decir, en funcin de u. Las restricciones o en la entrada estn ya expresadas en funcin de u y para las restricciones en la salida a o se hace uso de las ecuaciones de prediccin que expresan el valor futuro de las salidas o en funcin de las seales de control futuras y valores conocidos en el instante t. o n Cualquier controlador predictivo calcula la prediccin como: o y = Gu + f por lo que tanto entradas como salidas se pueden expresar en funcin del vector de o incrementos de la seal de control. n Las restricciones que aparecen sern bsicamente amplitud y velocidad de cambio a a en la seal de control y amplitud en la salida y se pueden expresar como: n
154
U u(t) U t u u(t) u(t 1) u t y y(t) y t
Para un proceso de m entradas y n salidas y restricciones en el horizonte N , las restricciones se pueden expresar como: 1 U T u + u(t 1) 1 1 U 1u u 1u 1y Gu + f 1y donde l es una matriz de dimensin (N n) m formada por N m m matrices o identidad y T es una matriz triangular inferior por bloques cuyos elementos no nulos son matrices identidad de dimensin m m. En forma condensada se pueden expresar o como: Ruc (10.1) siendo R= IN N IN N T T G G c= lu l u l U lu(t 1) l U + lu(t 1) l yf l y + f
Aparte de las restricciones en amplitud, a la salida se le pueden aplicar otro tipo de restricciones de para forzar un determinado comportamiento temporal (movimiento dentro de una banda, comportamiento montono, evitar respuesta inicial inversa, etc.), o pudiendo expresarlas tambin de la forma genrica (10.1). e e Adems de la clasicacin en restricciones en la entrada y en la salida segn a a o u qu tipo de variable se apliquen, se puede hacer otra clasicacin atendiendo a la e o forma de tratarlas. As se puede hablar de: , Restricciones duras como aqullas que no se pueden violar bajo ningn concepto. e u En este grupo se incluyen las restricciones relacionadas con la operacin segura o del proceso.
155
Restricciones blandas, que son aqullas que pueden ser violadas en un momento e dado por no ser cruciales, pero la violacin se penaliza en la funcin objetivo o o como un trmino ms. Es una forma de relajar la restriccin. e a o
10.1.3.
Resolucin del problema o
Con la adicin de restricciones el problema general de control predictivo cambia se o puede formular como minimizar J(u) sujeto a Ru c Es decir, el problema consiste en la minimizacin de una funcin cuadrtica con o o a restricciones lineales, lo que se conoce como Programacin Cuadrtica, qp. En este o a caso no se puede encontrar una solucin anal o tica como en el caso sin restricciones, sino que hay que recurrir a mtodos iterativos. e Resulta evidente que la carga de clculo ser considerable, ya que hay que encontrar a a la solucin resolviendo el algoritmo iterativo en cada periodo de muestreo. Normalmente o el esfuerzo est justicado por el benecio econmico obtenido al trabajar ms cerca del a o a punto de operacin optimo. Para resolver el problema qp existen diversos algoritmos o sucientemente probados. Un problema asociado a la implementacin del control con restricciones es el anlisis o a de la estabilidad del bucle cerrado. Como es necesario utilizar mtodos numricos para e e resolver el problema de la optimizacin, la ley de control resultante no se puede describir o de forma expl cita, haciendo el problema muy dif de atacar mediante la teor clsica cil a a de control. En los ultimos aos se ha trabajado mucho sobre la estabilidad en estas circun n stancias, proponindose soluciones basadas en la teor de Lyapunov. La idea bsica e a a consiste en que la funcin de coste cuando el horizonte es innito es montona decreo o ciente (si existe solucin factible) y se puede interpretar como funcin de Lyapunov o o que garantiza por tanto la estabilidad. Sin embargo, como la solucin tiene que ser o numrica, el nmero de variables de decisin tiene que ser nito, por lo que se han e u o propuesto dos ideas. En la primera, se descompone la funcin objetivo en dos partes: o una con horizonte nito y restricciones y otra con horizonte innito y sin restricciones. La segunda idea es en esencia equivalente y consiste en imponer restricciones terminales al estado y usar un horizonte innito.
156
En cualquier caso es un tema muy abierto, sobre todo si se quieren considerar las incertidumbres en el modelo y los temas asociados con la factiblidad.
10.1.4.
Gestin de restricciones o
Durante la etapa de optimizacin puede aparecer problemas de no existencia de o solucin optima para unas restricciones dadas (no existe compatibilidad entre las reo stricciones), por ejemplo por el planteamiento de unos objetivos inalcanzables para unas restricciones dadas. Existen otras posibles causas de inexistencia de solucin, coo mo es el caso de que una perturbacin saque al proceso fuera de la zona de trabajo o usual. La factibilidad de un problema de optimizacin signica que la funcin objetivo o o est acotada y que todas las restricciones sean satisfechas. e La no factibilidad puede aparecer en rgimen permanente o en el transitorio. El e problema de la falta de solucin en rgimen permanente puede venir provocado por o e un objetivo de control irrealizable. Sin embargo, este tipo de no factibilidad puede ser fcilmente eliminado en la etapa de diseo evitando la inclusin de tales objetivos. a n o Tambin puede ser debido a cambios en referencias que hagan incompatibles las ree stricciones (se quiera llevar alguna variable a un punto que es imposible de alcanzar con una entrada que est acotada). a En el rgimen transitorio puede aparecer no factibilidad incluso cuando las restrice ciones impuestas parezcan razonables. Restricciones que no causan problemas en operacin normal pueden producir problemas bajo ciertas circunstancias. Puede que una o perturbacin o cambio de referencia grande fuerce a una variable fuera de su l o mite y sea imposible introducirla de nuevo en su zona permitida con seales de control de energ n a limitada. En estos casos las restricciones se hacen temporalmente incompatibles. Las soluciones no factibles aparecen con mayor frecuencia en casos en que el optimo se encuentre cerca de las restricciones y el sistema est sujeto a perturbaciones, llevando e a la salida a regiones prohibidas.
157
Lmites fsicos
Lmites de operacin
Restricciones reales
Figura 10.3: Gestin de restricciones o
10.1.4.1.
Tcnicas de b squeda de soluciones factibles e u
Los mtodos de gestin de restricciones tratan de recuperar la factibilidad actuando e o sobre las restricciones segn diferentes criterios. u Los l mites de las restricciones se pueden considerar de los siguientes tipos: Limites sicos: nunca se pueden sobrepasar, principalmente por motivos de seguridad o por la propia construccin de los equipos (p.ej. actuadores) o Limites de operacin: son jados por los operarios para mantener las condiciones o nominales de funcionamiento. Se pueden sobrepasar bajo ciertas circunstancias Limites reales: son los que usa el algoritmo de control en cada instante. Son los que proporciona el gestor de restricciones, quien debe calcularlos de forma que nunca superen los limites f sicos. Es decir, el gestor de restricciones calcular los l a mites reales (los que se env al an algoritmo qp) en base a los l mites de operacin pero sin salirse nunca de los l o mites f sicos, segn se observa en la gura 10.3. u Se analizan a continuacin posibles soluciones para este problema, que se pueden o agrupar en: 1. Desconexin del controlador. o
158
2. Eliminacin de restricciones. o 3. Relajacin de restricciones. o 4. Otras tcnicas. e
1. Desconexin del controlador o La forma ms sencilla de resolver de este tipo de problemas es pasar el controlador a a posicin manual cuando aparecen las incompatibilidades de restricciones y volver a o operacin automtica cuando se recupera la admisibilidad de la solucin. o a o Este mtodo, como se puede comprender tiene serias desventajas. Normalmente, e cuando aparecen problemas de incompatibilidad de restricciones es porque el sistema en bucle cerrado se encuentra en un estado cr tico donde normalmente el operador tendr muy poca experiencia en la operacin. Adicionalmente, si las restricciones estn a o a relacionadas con aspectos de seguridad o econmicos, las decisiones llevadas a cabo o cuando aparecen problemticas de compatibilidad de restricciones suelen ser cr a ticas dado que en estos casos alguno de los objetivos del control no puede ser satisfecho. El mtodo suele ser utilizado cuando los problemas de incompatibilidad de restrice ciones no son frecuentes. 2. Eliminacin de restricciones o La factibilidad se analiza en cada periodo de muestreo, por lo que la eliminacin o de restricciones se realiza de forma temporal. Peridicamente se chequea la factibilidad o para poder reinsertar restricciones eliminadas. La eliminacin de un grupo de restricciones ha de realizarse en aquellos casos en que o el conjunto completo de restricciones que se imponen sobre el sistema sea incompatible. Cada vez que existe un problema de incompatibilidad de restricciones, se forma un conjunto de restricciones no admisibles que no se tienen en cuenta en el proceso de optimizacin. Se pueden distinguir en la metodolog de eliminacin de restricciones o a o varios tipos.
Eliminacin indiscriminada Con esta estrategia todas las restricciones se elimio nan cada vez que aparezcan problemas de existencia de solucin factible, quedando o la optimizacin de un problema sin restricciones. No es un mtodo muy optimo para o e
159
resolver el problema de la existencia de solucin admisible, pero es la forma ms rpida o a a de tener en cuenta incompatibilidad de restricciones. La eliminacin indiscriminada de restricciones no es adecuada en todas las aplicao ciones. No debe ser por ejemplo usada en casos en que las restricciones estn directae mente relacionadas con l mites de seguridad.
Eliminacin jerrquica En este caso slo se eliminan las restricciones que provocan o a o problemas de incompatibilidad. En este mtodo se asigna en la etapa de diseo una e n prioridad a cada restriccin, que da un grado de importancia relativa de dicha restrico cin frente a las otras. Esta prioridad se usar para clasicar las restricciones de una o a forma jerrquica (se asigna un nmero que indica su posicin en la jerarqu De este a u o a). modo, cada vez que haya problemas de factibilidad o existencia de solucin el gestor o de restricciones va eliminando por orden las restricciones menos prioritarias hasta que se restablece la factibilidad de la solucin, que se chequea cada periodo de muestreo o para reinsertar restricciones que hubieran sido temporalmente eliminadas. En este sentido, a la hora de eliminar restricciones se pueden establecer diferentes tipos de reglas para establecer el nmero de restricciones que se eliminan, si conviene u eliminar ms restricciones a costa de no eliminar una con prioridad superior, etc. a 3. Relajacin de restricciones o Otro mtodo para tener en cuenta el problema de existencia de solucin es la ree o lajacin de las restricciones. Se puede hacer una relajacin de los l o o mites de forma temporal o convertir restricciones duras (Ru c), cambindolas en restricciones blana das (Ru c + , con 0) para asegurar la existencia de solucin, aadiendo un o n trmino T T a la funcin de coste de forma que se penalice la violacin de la ree o o striccin y obtener un mejor comportamiento del sistema controlado. A largo plazo, el o trmino de penalizacin en la funcin objetivo llevar las variables auxiliares a cero. e o o a 4. Otras tcnicas e Existen tcnicas que se basan en la manipulacin del horizonte m e o nimo de las restricciones. Algunos controladores industriales como el qdmc usan el concepto de constraint window. La constraint window comienza en algn punto en el futuro y contina hasta u u el estado estacionario. Si existe dinmica del tipo de fase no m a nima, se pueden mejorar las prestaciones desplazando la ventana hacia el futuro, lo que equivale a ignorar las restricciones duras en la salida durante la fase inicial de la respuesta.
160

Control - Estado TiempO cOntinuO

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Control - Estado TiempO cOntinuO

Uploaded by

Copyright:

Available Formats

Depto.

de Ingenier de Sistemas y Automtica a a

APUNTES DE INGENIER DE CONTROL IA

Daniel Rodr guez Ram rez Carlos Bordns Alba o

1.10.1. Solucin de la ecuacin de Riccatti . . . . . . . . . . . . . . . . o o 1.11. Filtro de Kalman . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5. Introduccin al control adaptativo o 5.1. Planteamiento del problema . . . . . . . . . . . . . . . . . . . . . . . .

7. Controladores PID con autoajuste y Ajuste por tabla

8. Control Predictivo Basado en Modelo (MPC)

10.Otros aspectos del Control Predictivo

10.1.4.1. Tcnicas de bsqueda de soluciones factibles . . . . . . 157 e u

2.1. Procesos estocsticos: realizaciones y variables aleatorias. a

2.2. Modelo de Box-Jenkins. . . . . . . . . . . . . . . . . . . . . . . . . . .

3.1. Esquema de la identicacin en l o nea.

6.4. Estructura para la asignacin de polos y ceros. o

Cap tulo 1 Control de sistemas discretos en el espacio de estados

2OBTENCION DE LA REPRESENTACION DE EN ESPACIO DE ESTADOS DE SISTEMAS DISCRETOS

Obtencin de la representacin de en espacio o o de estados de sistemas discretos

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Mtodo de programacin directa e o

teniendo en cuenta que G(z) = Y (z) = b0 U (z) +

(b1 a1 b0 )z 1 + (b2 a2 b0 )z 2 + + (bn an b0 )z n U (z) 1 + a1 z 1 + a2 z 2 + + an z n

De ah se obtiene que: Q(z) = a1 z 1 Q(z) a2 z 2 Q(z) an z n Q(z) + U (z) (1.9)

4OBTENCION DE LA REPRESENTACION DE EN ESPACIO DE ESTADOS DE SISTEMAS DISCRETOS

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Mtodo de programacin anidada e o

LA REPRESENTACION EN ESPACIO DE ESTADOS DE UN SISTEMA NO ES UNICA

La representacin en espacio de estados de un o sistema no es unica

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Resolucin de las ecuaciones del espacio de eso tados

RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS

Gkj1 Hu(j) + Du(k)

Matriz de transicin de estados o

Considrese la ecuacin: e o x(k + 1) = Gx(k) (1.31)

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Mtodo basado en la transformada Z e

Gkj1 Hu(j) = Z1 (zI G)1 HU (z)

1 1 4 1 3 z+0,8 3 z+0,2 1 1 0,8 z+0,2 + 0,8 z+0,8 3 3

RESOLUCION DE LAS ECUACIONES DEL ESPACIO DE ESTADOS

Multiplicando lo anterior por z y antitransformando se obtiene: (k) = Gk = Z1 (zI G)1 z =

Finalmente la ecuacin de salida ser: o a y(k) = 1 0 x(k) 17 22 25 = (0,2)k + (0,8)k + 6 9 18

Procedimiento alternativo para calcular (zI G)1

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS

|zI G| = z 2 +z +0,16 = (z +0,2)(z +0,8)

que evidentemente es el mismo resultado obtenido en el ejemplo 1.1.

Discretizacin de las ecuaciones de estado cono tinuas

x(t) = eAt x(0) + eAt

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

x((k + 1)T ) = eA(k+1)T x(0) + eA(k+1)T

Mutiplicando la ecuacin (1.42) por eAT y restndola de la ecuacin (1.41) se obtiene: o a o

x((k + 1)T ) = eAT x(kT ) + eA(k+1)T

x((k + 1)T ) = eAT x(kT ) + eAT

eA Bu(kT )d eA Bu(kT )d (1.44)

G(T ) = eAT H(T ) =

DISCRETIZACION DE LAS ECUACIONES DE ESTADO CONTINUAS

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Luego: x(k + 1) = eaT x(k) + y(k) = x(k)

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Controlabilidad de la salida completa

Considrese un sistema autnomo: e o x((k + 1)T ) = Gx(kT ) y(kT ) = Cx(kT ) (1.56)

CAP ITULO 1. CONTROL DE SISTEMAS DISCRETOS EN EL ESPACIO DE ESTADOS

Sea S2 el sistema dual de S1 : S2 : (1.59)

Entonces se puede armar que2 : SI S1 CONTROLABLE OBSERVABLE ENTONCES S2 OBSERVABLE CONTROLABLE