You are on page 1of 31

UNIVERSIDAD NACIONAL DEL CALLAO

FACULTAD DE INGENIERIA ELECTRICA Y ELECTRONICA


ESCUELA PROFESIONAL DE INGENIERIA ELECTRONICA

SISTEMAS DE CONTROL
DIGITAL
DISEÑO DE CONTROLADORES REALIMENTADOS POR
UBICACACIÓN DE POLOS Y CEROS - CÁLCULO DE
OBSERVADORES

ALUMNO:
 Limas Morales Samuel 1423215216

PROFESOR: Ing. BORJAS CASTAÑEDA JULIO CESAR

2019
I. INTRODUCCIÓN

Un procedimiento utilizado en la sintonización de los controladores PID para procesos simples,


consiste en la localización de los polos de lazo cerrado en una posición especifica, procedimiento
que se conoce normalmente como método de ubicación de polos de Persson y popularizado por
Aström y Hägglund . Si bien los parámetros del controlador determinados con este procedimiento,
garantizan lograr la ubicación deseada de los polos de lazo cerrado, esta no puede asociarse
directamente con las características dinámicas de la respuesta del sistema de control, por no
tomar en consideración la posición resultante de los ceros del controlador. Se supondrá en
adelante el lazo de control mostrado en la Fig. 1, en donde Gp(s) es la función de transferencia del
proceso controlado y Gc(s) la del controlador. En este sistema las entradas son el valor deseado
r(s) y la perturbación z(s), y la salida la variable controlada y(s). Se presentará más adelante un
procedimiento sistemático para la sintonización de los controladores PI y PID para el control de
procesos de primer y segundo orden, que contempla la influencia de los ceros del controlador
sobre la respuesta del sistema de control, denominado método de sintonización de controladores
por ubicación de polos y ceros, el cual tiene como base el procedimiento desarrollado por Marín.

II. MÉTODO DE UBICACIÓN DE POLOS

A continuación se presentan en forma resumida las ecuaciones para la determinación de los


parámetros de los controladores PI y PID, necesarios para ubicar los polos de lazo cerrado en una
posición determinada.

II-A. Proceso de primer orden, controlador PI

Si un proceso de primer orden dado por la función de transferencia

(1)

Figura 1. Sistema de control realimentado

se controla con un controlador PI

la función de transferencia de lazo cerrado del servo control está dada por la expresión
siendo el polinomio característico del sistema de control

Si se desea que este sea de la forma general

de manera que los polos de lazo cerrado se encuentren localizados en

igualando (4) y (5), se obtiene que los parámetros requeridos del controlador son

Con estos parámetros en el controlador, la función de transferencia de lazo cerrado resultante es

El sistema de control obtenido tiene los polos en la posición especificada y un cero en

II-B. Proceso de segundo orden, controlador PID

Si un proceso de segundo orden dado por la función de transferencia

donde τ1 > τ2, τ = τ1 y a = τ2/τ1, se controla con un controlador PID

el polinomio característico del sistema de control sería en este caso


Si se desea que este tenga la forma general

de manera que los polos de lazo cerrado se encuentren localizados en

igualando (12) y (13), se obtiene que los parámetros requeridos del controlador son:

La función de transferencia de lazo cerrado del servo control tendrá ahora tres polos y dos ceros.

III. MÉTODO DE UBICACIÓN DE POLOS Y CEROS

Es práctica usual asociar la ubicación de los polos dominantes del sistema de control con las
características dinámicas de la respuesta a un cambio escalón en el valor deseado, suponiendo
que esta es similar a la de un sistema de segundo orden subamortiguado con ganancia unitaria de
la forma

En este caso el sobrepaso máximo de la respuesta

depende solamente de la razón de amortiguamiento ζ y el tiempo de asentamiento al 2%

de la constante de amortiguamiento ζωn.


Figura 2. Distancia entre el cero y el polo vrs ω∗

III-A. Proceso de primer orden, controlador PI

Para lograr que la respuesta del servo control (3) sea similar a la del sistema de segundo orden
(19), la influencia del cero del controlador sobre la respuesta del sistema debe ser mínima. Esto es
cierto solo si este cero se encuentra muy alejado hacia la izquierda de los polos dominantes en el
plano complejo. Se utilizará la constante de tiempo del proceso τ para normalizar la escala de
tiempo del sistema y se emplearán en adelante los siguientes parámetros normalizados:

III-A1. Distancia entre el cero y los polos:

La distancia entre el cero del controlador y la parte real de los polos de lazo cerrado, está dada
por la expresión
De (25) se puede obtener que la distancia entre el cero y los polos crece cuando 2ζω∗ → 1 y la
influencia del cero disminuye. Como se observa en la Fig. 2, el cero se encuentra alejado solo para
valores bajos de ω∗, por lo que en general no es posible suponer que su influencia es despreciable.
III-A2. Características de desempeño del sistema de control de lazo cerrado: Para evaluar la
influencia del cero del controlador sobre las características dinámicas del sistema de control
realimentado, se determinó el sobrepaso máximo Mp, el tiempo al que este ocurre o tiempo al
pico tp, y el tiempo de asentamiento al 2% ta2, para 0,5 ≤ ω∗ ≤ 10,0 y 0,40 ≤ ζ ≤ 0,95.

En la Fig. 3 se muestra la variación del sobrepaso máximo Mp, el cual, como se aprecia, depende
de la razón de amortiguamiento ζ y de la frecuencia natural ω∗. Además, se puede observar que la
influencia de ω∗ es mayor cuando esta tiene valores bajos.

Figura 3. Sobrepaso máximo vrs ω∗


Figura 4. Sobrepaso máximo vrs tiempo de asentamiento

En la Fig. 4 se muestra como se relaciona el sobrepaso máximo Mp con el tiempo de asentamiento


normalizado tan, y en la Fig. 5 la relación de este con el tiempo al pico normalizado tpn. Las Fig. 3 a
5 se pueden emplear como parte de un procedimiento de diseño de controladores, para lograr un
sistema de control con, por ejemplo, un sobrepaso máximo y un tiempo de asentamiento
deseados.

III-B. Proceso de segundo orden, controlador PID

Como se indicó anteriormente, en este caso el sistema de control de lazo cerrado tiene dos ceros y
tres polos. Si se escoge en (13) α = τ1/(τ2ω∗) se logra que un cero del controlador cancele el polo
real, reduciéndose la función de transferencia de lazo cerrado del control PID de la planta de
segundo orden a (9). Los parámetros requeridos del controlador PID son:
Figura 5. Sobrepaso máximo vrs tiempo al pico

IV. PROCEDIMIENTOS DE DISEÑO

A continuación se presentan los pasos a seguir para diseñar los sistemas de control para logar el
comportamiento dinámico deseado utilizando el método de ubicación de polos y ceros.

IV-A. Proceso de primer orden, controlador PI.

1. Determinar la ganancia kp y la constante de tiempo τ del proceso controlado

2. Establecer las especificaciones de diseño: sobrepaso máximo Mp y tiempo de asentamiento ta2


o sobrepaso máximo y tiempo al pico tp.

3. Utilizar las especificaciones de diseño con la Fig. 4 o la Fig. 5 según corresponda, para
determinar la razón de amortiguamiento ζ

4. Emplear Mp y ζ con la Fig. 3 para obtener la frecuencia natural normalizada ω∗

5. Calcular los parámetros del controlador PI (Kc, Ti), con (23) y (24)

6. Verificar el cumplimiento de las especificaciones de diseño a partir de la respuesta del sistema


de control con los parámetros determinados.
IV-B. Proceso de segundo orden, controlador PID

1. Determinar la ganancia kp y las constante de tiempo τ1 y τ2 del proceso controlado (con τ1 > τ2)
2. Hacer τ = τ1 y a = τ2/τ1

3. Establecer las especificaciones de diseño: sobrepaso máximo Mp y tiempo de asentamiento ta2


o sobrepaso máximo y tiempo al pico tp.

4. Utilizar las especificaciones de diseño con la Fig. 4 o la Fig. 5 según corresponda, para
determinar la razón de amortiguamiento ζ

5. Emplear Mp y ζ con la Fig. 3 para obtener la frecuencia natural normalizada ω∗

6. Calcular los parámetros del controlador PID (Kc, Ti, Td), con (26) a (28)

7. Verificar el cumplimiento de las especificaciones de diseño a partir de la respuesta del sistema


de control con los parámetros determinados.

V. EJEMPLOS

En los siguientes ejemplos, se muestra cómo es posible lograr el desempeño dinámico deseado del
sistema de control con el procedimiento de ubicación de polos y ceros propuesto y la diferencia
entre la respuesta lograda con este y la que se obtendría con el método de ubicación de polos
tradicional.

Ejemplo V.1. Considérese un proceso controlado con la función de transferencia

Se desean determinar los parámetros de un controlador PI de manera que la respuesta del sistema
de control a un cambio escalón en el valor deseado tenga un sobrepaso máximo Mp = 20% y un
tiempo de asentamiento ta2 = 3 segundos.

Método de ubicación de polos

Utilizando (20) y (21) se obtiene que la razón de amortiguamiento debería ser ζ = 0,456 y la
frecuencia natural ωn = 1,645.

Empleando (7) y (8) los parámetros del controlador serían Kc1 = 0,16 Ti1 = 0,092

y la función de transferencia de lazo cerrado resultante es

Esta muestra que el cero del controlador está alejado de los polos de lazo cerrado, por lo que se
espera que su influencia en la respuesta del sistema sea despreciable.
Método de ubicación de polos y ceros

El tiempo de asentamiento normalizado es tan = 3/0,80 = 3,75. Si se emplea la Fig. 4 con Mp = 20 y


tan = 3,75, se selecciona una razón de amortiguamiento ζ = 0,50. Con esta y el sobrepaso máximo,
de la Fig. 3 se obtiene que la frecuencia natural normalizada debe ser ω∗ = 2,25.

Utilizando (23) y (24), se determina que los parámetros normalizados son

Kcn = 1,25 Tin = 0,25

de donde se obtienen los parámetros requeridos para la sintonización del controlador

Kc2 = 1,0 Ti2 = 0,20

La función de transferencia de lazo cerrado resultante es

En la Fig. 6 se muestran las curvas de respuesta de los dos sistemas.

Figura 6. Respuestas del ejemplo 1

En este caso, el sobrepaso máximo y el tiempo de asentamiento obtenidos con el método de


ubicación de polos fueron Mp = 20,33% y ta2 = 3,09s, y con el controlador determinado mediante
la técnica de ubicación de polos y ceros Mp = 19,63% y ta2 = 2,73s. En ambos casos se logran
respuestas con las características deseadas.

Ejemplo V.2. Considérese ahora un proceso diez veces más lento dado por la función de
transferencia

Se desea que la respuesta del sistema de control a un cambio escalón en el valor deseado tenga un
sobrepaso máximo Mp = 10% y un tiempo de asentamiento ta2 = 12 segundos. Método de
ubicación de polos De (20) y (21) se obtiene que ζ = 0,59 y ωn = 0,565 y con (7) y (8) los
parámetros

Kc1 = 3,47 Ti1 = 1,70

La función de transferencia de lazo cerrado resultante es

En este caso el cero del controlador se encuentra relativamente cerca de los polos de lazo cerrado,
por lo que se puede esperar que influya sobre las características de la respuesta del sistema.

Método de ubicación de polos y ceros

Para este caso el tiempo de asentamiento normalizado es tan = 1,55. Si se emplea la Fig. 4 con
este tiempo y Mp = 10 se puede seleccionar ζ = 0,80. Con esta y Mp = 10 de la Fig. 3 se obtiene ω∗
= 3,20. Utilizando (23) y (24), se obtiene que los parámetros del controlador son

Kcn = 4,12 Tin = 0,40 Y Kc2 = 3,30 Ti2 = 3,22


Figura 7. Respuestas del ejemplo 2

En este caso la función de transferencia de lazo cerrado resultante es

En la Fig. 7 se muestran las curvas de respuesta de los dos sistemas.

Ahora, el sobrepaso máximo y el tiempo de asentamiento obtenidos con el método de ubicación


de polos fueron Mp = 19,35% y ta2 = 8,66s, y con el controlador determinado mediante la técnica
de ubicación de polos y ceros Mp = 10,02% y ta2 = 12,51s.

En este caso, solo la respuesta obtenida con el procedimiento de diseño propuesto, cumple con las
especificaciones de diseño.

Ejemplo V.3. Se empelará ahora un controlador PID para controlar un proceso cuya función de
transferencia es

Se desea que la respuesta del sistema de control a un cambio escalón en el valor deseado tenga un
sobrepaso máximo Mp = 15% y un tiempo de asentamiento ta2 = 10 segundos.
Método de ubicación de polos

De (20) y (21) se obtiene que los polos dominantes deben tener una razón de amortiguamiento ζ =
0,517 y una frecuencia natural ωn = 0,774. Para la ubicación del polo real se selecciona α = 1. Entre
mayor sea α, menor será la influencia de este tercer polo, sin embargo como se ve en (16) la
ganancia del controlador aumenta y por lo tanto también el cambio en la salida del controlador
cuando se varíe el valor deseado.

Empleando (16) a (18) se obtienen los parámetros requeridos del controlador

Kc1 = 5,09 Ti1 = 2,20 Td1 = 0,37

Figura 8. Respuestas del ejemplo 3

y la función de transferencia de lazo cerrado resultante es


Método de ubicación de polos y ceros

Para este caso el tiempo de asentamiento normalizado es tan = 2,0. Si se emplea la Fig. 4 con este
tiempo y Mp = 15% se puede seleccionar ζ = 0,65. Con esta razón de amortiguamiento y Mp = 15%
de la Fig. 3 se obtiene ω∗ = 3,0.

Utilizando (26) a (28), se obtiene que los parámetros del controlador deben ser

Kcn = 4,70 Tin = 0,52 Tdn = 0,12 Y Kc2 = 4,70 Ti2 = 2,61 Td2 = 0,62

En este caso la función de transferencia de lazo cerrado resultante es

En la Fig. 8 se muestran las curvas de respuesta de los dos sistemas.

Con el método de ubicación de ceros y polos se obtiene una respuesta con un sobrepaso Mp =
14,4% y un tiempo de asentamiento ta2 = 8,37s cumpliéndose con las especificaciones, mientras
que con el método de ubicación de polos tradicional la respuesta tiene un sobrepaso Mp = 24,0%,
el cual excede el valor especificado en un 9%, y un tiempo de asentamiento ta2 = 10s.

Si en el método de ubicación de polos se trata de disminuir la influencia del polo real, utilizando
por ejemplo α = 2,6, el valor de la ganancia del controlador se eleva a Kc1 = 10,04 con lo que se
duplicaría el cambio escalón que se produce en la señal de salida del controlador cuando se
cambie el valor deseado, pudiendo llevarse el elemento final de control a una posición extrema.

VI. CONCLUSIONES

El método tradicional de sintonización de controladores por ubicación de los polos del sistema de
control de lazo cerrado, permite localizarlos en la posición deseada. Sin embargo, esta posición no
puede asociarse directamente con las características dinámicas de la respuesta del sistema, ya que
no considera la influencia de los ceros del controlador.

El método de ubicación de polos y ceros propuesto, al tomar en cuenta la influencia de los ceros
del controlador, relaciona la ubicación requerida de los polos y ceros del sistema de control con las
características dinámicas de su respuesta.

El nuevo procedimiento determina los parámetros requeridos de los controladores PI y PID, para
controlar procesos de primer y segundo orden, de manera de lograr que la respuesta del sistema
de control a un cambio escalón en el valor deseado (servo control) cumpla con las especificaciones
de diseño.

La distancia ente el cero y los polos de lazo cerrado mostrado en la Fig. 2, es una indicación de su
influencia sobre la respuesta. Cuando esta distancia es grande, la influencia del cero es baja y el
método de ubicación de polos tradicional permite obtener resultados satisfactorios. Sin embargo,
cuando esta es pequeña, la influencia del cero es grande y no puede despreciarse. Por esta razón
el procedimiento de ubicación de polos no permite obtener una respuesta con las características
deseadas.
En el procedimiento de sintonización propuesto, las Fig. 3 a 5 muestran la relación de las
especificaciones de diseño (Mp, Ta2 y Tp) con la ubicación requerida de los polos y ceros del
sistema (ωn, ζ). Los ejemplos presentados ilustran claramente las ventajas de utilizar el
procedimiento de ubicación de polos y ceros de lazo cerrado propuesto, en vez del método
tradicional que solamente ubica los polos. Nota: Copias ampliadas de las curvas para el diseño
mediante el procedimiento de ubicación de polos y ceros (Fig. 3 a 5), se pueden obtener
directamente de los autores.

REFERENCIAS

[1] P. Persson, “Towards autonomous pid control,” Ph.D. dissertation, Department of Automatic
Control, Lund Institute of Technology, 1992.

[2] K. J. Aström and T. Hägglund, PID Controllers - Theory, Design and Tuning. Instrumentation
Society of America, 1995.

[3] L. J. Marín, Método de ubicación de polos y ceros para la sintonización de controladores PID.
Proyecto Eléctrico (Bachillerato), Escuela de Ingeniería Eléctrica, Universidad de Costa Rica, 2005.
CALCULO DE OBSERVADORES
Existen distintos enfoques dentro de la comunidad FDI a la hora de generar residuos para la
detección y diagnóstico. Entre estas técnicas se encuentran los observadores de estados. En este
capítulo se van a mostrar los fundamentos de los observadores de estados, tanto para sistemas
lineales como para sistemas no lineales, y se ejemplificará su uso para tareas de detección y
aislamiento o localización.

Conceptos Fundamentales

En determinadas circunstancias resulta necesario estimar el valor de ciertas variables de estado


que no son medidas en un sistema. La estimación de este tipo de variables se determina
observación. Un dispositivo (o programa) que estima u observa las variables de estado se llama
observador de estados (o simplemente observador). A la hora de precisar qué es un observador de
estado, nos encontramos con múltiples definiciones. Según Ogata: “Un observador de estados
estima las variables de estado con base en las mediciones de las variables de salida y de control.”
Para Pouliezos y Stavrakakis [84] los observadores son: “Sistemas dinámicos cuyo propósito es
reconstruir el estado x de un modelo en espacio de estados basándose en las entradas medidas u
y en las salidas y.” Más recientemente podemos destacar la definición acuñada por Kinnaert [59]:
“Un observador de estados es un filtro que recibe como entradas las señales de entrada, u (t), y de
salida, y (t), de un sistema y genera una estimación sobre el estado x(t)”. A la hora de dar una
clasificación de los tipos de observadores, Ogata se fija en el número de variables que son
observadas. De esta manera propone una clasificación de observadores en tres tipos:

• Orden completo: el observador capta todas las variables del sistema, sin importar si algunas
están disponibles para una medición directa.

• Orden reducido: el observador estima menos de n variables de estado, en donde n es la


dimensión del vector de estado.

• Orden mínimo: es un observador de orden reducido con el mínimo orden posible, es decir, si n
es la dimensión del vector de estado y m es la dimensión del vector de salidas, el observador de
orden mínimo observa n-m variable.

Dentro de cada una de estas familias, podemos tener, a su vez, otras subdivisiones.

Por ejemplo, si consideramos el tipo de sistema que estamos tratando podemos tener
observadores para sistemas lineales y observadores para sistemas no lineales. A continuación se
mostrará los fundamentes de observadores de estados para el caso más general, el de
observadores de orden completo para sistemas lineales. Posteriormente se realizará una
extensión para sistemas no lineales.
Observadores de Estado para Sistemas Lineales

Observador de Orden Completo:

Consideramos que tenemos un sistema en espacio de estados de la siguiente forma:

En donde x(t) es el vector de estado (vector de dimensión n), u(t) es el vector de entradas, y(t) es
el vector de salidas, y A, B y C son matrices de coeficientes constantes. Podemos definir un
observador de estados genérico1 para dicho sistema como:

El último término, es un valor de corrección que contiene la diferencia entre la salida medida y la
salida estimada. El término de corrección ayuda a reducir los efectos producidos por la diferencia
entre el modelo dinámico y el sistema real. La matriz Ke funciona como una matriz de ponderación.
En la figura 5.1 se puede ver de manera esquemática el sistema en espacio de estados y su
observador genérico correspondiente.

Figura 5.1: Esquema de un observador de estados de orden completo.


Podemos obtener la dinámica del error en la estimación del estado restando la ecuación 5.1 de la
ecuación:

Y definiendo la diferencia entre x(t) y xˆ(t) como el vector de error ex(t):

Entonces el error en la estimación del estado, nos queda:

A partir de la ecuación 5.5 podemos ver que el comportamiento dinámico del vector de error se
determina mediante los valores característicos de la matriz (A − KeC). Si la matriz es estable, el
vector convergerá a cero para cualquier vector de error inicial (e(0)). Es decir que xˆ(t) convergerá
a x(t) sin considerar los valores de xˆ(0) y x(0). Si se eligen los valores característicos de la matriz
A−KeC de manera que el comportamiento dinámico del vector de error sea asintóticamente
estable y suficientemente rápido, cualquier vector de error tenderá a 0 con una velocidad
adecuada. Al igual que para el error en la estimación del estado, podemos obtener el error en la
estimación de la salida como:

Que está directamente relacionado con el error en la estimación del estado de la siguiente
manera:

Problema Dual

Como acabamos de ver, el problema a la hora de diseñar un observador es determinar la matriz Ke


tal que la dinámica del error sea asintóticamente estable con una velocidad de respuesta
suficiente, es decir, determinar Ke, tal que A − KeC tenga los valores característicos deseados. Este
problema se corresponde con el problema de ubicación de polos. Consideramos el siguiente
sistema lineal en espacio de estados:

Al diseñar el observador de estados de orden completo, resolvemos el problema dual, es decir,


solucionamos el problema de ubicación de polos para el sistema dual:
Suponiendo que la señal de control v es (realimentación de estado):

v = −K · z

Si el sistema dual es de estado completamente controlable, la matriz de ganancias de


realimentación del estado K se determina de tal modo que la matriz A∗ − C ∗ · K produzca un
conjunto de los valores característicos deseados.

Si µ1, µ2, . . . , µn son los valores característicos de la matriz del observador de estado, tomando
los mismos µi que los valores característicos deseados de la matriz de ganancias de realimentación
del estado del sistema dual, obtenemos:

Considerando que los valores característicos de A∗ − C ∗K y los de A − K∗C son iguales, tenemos
que,

Comparando el polinomio característico |sI −(A− K∗C)| y el polinomio característico |sI −(A− KeC)|
para el sistema observador, encontramos que Ke y K∗ se relacionan mediante

Ke = K∗

Por tanto, usando la matriz K determinada mediante el enfoque de ubicación de polos en el


sistema dual, la matriz de ganancias del observador Ke para el sistema original se determina a
partir de la relación Ke = K∗.

Condición necesaria y suficiente para la observación del estado

La condición necesaria y suficiente para la determinación de la matriz de ganancias del


observador Ke para los valores característicos deseados de A − KeC es que el dual del sistema
original:

sea de estado completamente controlable. La condición de controlabilidad completa del estado


para este sistema dual es que el rango de:

sea n. Por tanto, ésta es la condición para una observabilidad completa del sistema original.
Diseño de Observadores

La señal de realimentación a través de Ke funciona como una señal de corrección para el modelo
de la planta. Si tenemos implícitos factores desconocidos de la planta con valores significativos, la
señal de realimentación debería ser grande (es decir, el valor de Ke). Sin embargo, si la salida está
excesivamente contaminada con ruidos o perturbaciones, esta señal ya no es confiable y por lo
tanto la señal de realimentación debería ser relativamente pequeña. A la hora de diseñar la matriz
Ke debemos prestar atención a los efectos de perturbaciones y ruido. Habitualmente se suele
diseñar como un compromiso una respuesta rápida y la sensibilidad frente a perturbaciones y
ruido. Existen diversas técnicas que podemos destacar a la hora de realizar un diseño automático
de la matriz de ganancias. Según Ogata [79] podemos destacar principalmente tres técnicas para el
diseño: • Enfoque directo • Enfoque de sustitución • Fórmula de Ackerman Debido a que la
Fórmula de Ackerman es la más genérica, así como la más usada, a continuación se procederá a
describir esta técnica, dejando al lector la consulta de las otras dos en.

Fórmula de Ackerman

La fórmula de Ackerman para la determinación de la matriz de ganancias del observador Ke, viene
dada por la siguiente ecuación:

en donde φ(A) es igual a φ(S) que es el polinomio característico deseado para el observador de
estado. Viene dado por la expresión:

en donde µ1, µ2, . . . , µn son los valores característicos deseados. La elección de dicho conjunto
de valores en muchos casos, no es única [79]. Por tanto, podrían elegirse muchas ecuaciones
características diferentes como ecuaciones características deseadas. Para cada ecuación
característica deseada, tenemos una matriz Ke diferente.

A la hora de diseñar un observador de estado, resulta conveniente calcular varias matrices de


ganancias del observador Ke con base en varias ecuaciones características deseadas distintas. Para
cada una de las matrices de ganancias que obtenemos, deben realizarse pruebas en simulación
con el fin de ver el comportamiento y la respuesta del observador generado. Como se ha
comentado previamente, en muchos casos prácticos la elección de la mejor matriz Ke se resuelve
en un compromiso entre la respuesta rápida y la sensibilidad ante perturbaciones y ruidos.
Observadores de Estados para Detección y Diagnóstico de Fallos

Considerando que tenemos el mismo sistema en espacio de estados que hemos utilizado
anteriormente (ecuaciones 5.1 y 5.2), podemos ampliar este sistema de modo que se considere la
influencia de fallos y perturbaciones de la siguiente manera:

donde f(t) denota los fallos en el proceso, ∆C(t) los fallos en los sensores, y w(t), v(t) los ruidos en
el proceso y en el sensor, respectivamente. Considerando esta nueva descripción de sistema, se
modifican las ecuaciones de error en la estimación de la salida y del estado, obteniendo lo
siguiente:

En ausencia de fallos y perturbaciones f(t), ∆C, w(t) y v(t) son cero y por lo tanto la matriz A−KeC
hace que el error en la estimación de la salida (ey(t)) tienda a 0 (después de los transitorios en los
instantes iniciales). En cambio, si ocurre un fallo, la señal ey(t) se va a ver afectada por este fallo,
por eso podemos utilizar el error en la estimación de la salida como residuo para la detección y
el diagnóstico de fallos.

A la hora de explotar las cualidades de estos residuos se proponen varias técnicas. En la literatura
se proponen diversas clasificaciones de estas técnicas, aunque según Kinnaert podemos destacar
principalmente dos técnicas:

• La primera consiste en seleccionar matriz de ganancias del observador de manera que las
trayectorias generadas por cada tipo de fallo se confinen es subespacios independientes del
espacio ey. Proyectando ey(t) en cada uno de esos subespacios y analizando la magnitud de cada
proyección podemos lograr el aislamiento de los fallos.

• La segunda técnica consiste en utilizar un banco de observadores, y ofrece más flexibilidad que
la anterior. El banco de observadores estará formado por p observadores de estados, diseñados de
tal manera que cada observador i sea sensible únicamente al fallo i (esquema de observador
dedicado o simplificado), o que cada observador i sea sensible a todos los fallos excepto al fallo i
(esquema de observador generalizado). En la figura se puede ver un esquema de observador de
estados dedicado.
Figura 5.2: Esquema de observador dedicado.

Otros autores, como Isermann consideran un mayor espectro de técnicas que Kinnaert y considera
técnicas que éste no tenía en cuenta, como filtros de Kalman o bancos de observadores excitados
por todas las salidas (además de los ya mencionados bancos de observadores excitados por una
salida y por todas las salidas excepto una). Por su parte, Pouliezos y Stavrakakis, hacen una
clasificación de técnicas fijándose en el tipo de fallo que queremos aislar. Así consideran tres tipos:
esquemas de detección de fallos en sensores, actuadores y componentes.

Observadores de Estado para Sistemas No Lineales

Al contrario que para los sistemas lineales, que han sido ampliamente estudiados y existe un
campo teórico bien fundado, para los sistemas no lineales no ocurre lo mismo. Los fundamentos
teóricos están lejos de la solidez que tienen para sistemas lineales, y su aplicación práctica
tampoco es comparable. Otro problema con los sistemas no lineales es que no existe una técnica
genérica para diseñar este tipo de observadores, y su resultado final dependerá directamente del
tipo de sistema con el que estemos trabajando. Existen múltiples aproximaciones para el diseño
de observadores no lineales. Algunas consisten en emplear directamente los conocimientos
existentes para la generación de observadores lineales, o en extenderlos para sistemas no lineales
(como el observador de Luenberger extendido o el filtro de Kalman extendido), otras son
únicamente aplicables en determinados tipo de sistemas no lineales (como, por ejemplo, para
sistemas bilineales), también existen aproximaciones basadas en técnicas de optimización
(observador de horizonte móvil, observador con algoritmos genéticos), etc... En el presente
apartado se pretende dar una introducción a las técnicas más conocidas y usadas en la literatura.

Diseño básico

Consideremos un sistema no lineal con la siguiente forma2 :

Recordando lo que habíamos visto previamente, un observador de estados para un sistema lineal
viene definido por las ecuaciones.
Este tipo de sistema no lineal, en el que el estado es función únicamente del estado y no de la
entrada, se considerará únicamente en este apartado de “diseño básico”. Posteriormente se
ampliará la definición sistema no lineal.

El último término de la ecuación (Ke · (y(t) − C · xˆ(t))) se conoce habitualmente como inyección de
salida. Utilizando esta inyección de salida directamente sobre el sistema no lineal podemos tener
una primera aproximación a un observador de estados no lineal. Esta técnica se conoce como
aproximación lineal.

Aproximación Lineal

Como primer intento para la construcción de un observador de estados para un sistema no lineal,
empleamos la misma técnica que utilizamos para sistemas lineales. El observador de estados nos
quedará como se puede ver en las ecuaciones.

A la hora de diseñar la matriz de ganancias Ke existen diversas propuestas en la literatura. Entre


ellas podemos destacar [121], en donde Zeitz presenta una extensión del observador de
Luenberger para ser aplicado en sistemas no lineales. En este artículo se propone un conjunto de
ecuaciones para el cálculo de la matriz Ke. Posteriormente, Adjallah et al. [2] también proponen un
método para el cálculo de dicha matriz. Al igual que ocurría en el caso lineal, consideramos el error
en la estimación del estado de la siguiente manera:

Aunque en este caso la dinámica del error será no lineal, por lo que no queda del todo clara la
estabilidad en la dinámica del error. Debido a que la estabilidad de un sistema linealizado en torno
a un punto fijo implica estabilidad local para el sistema no lineal correspondiente en torno a dicho
punto fijo, podemos intentar linealizar la dinámica del error en torno a su punto fijo (e = 0):
De tal forma que el sistema linealizado es:

Desafortunadamente, dicha linealización depende directamente de un estado x que, por una parte
no es una cantidad fija, y, por otra parte es desconocida para nosotros, por lo que no podemos
garantizar la estabilidad del sistema.

Métodos de Lyapunov

Los métodos de Lyapunov [86] intentan solucionar el problema de la falta de estabilidad en la


aproximación lineal. Se trata de utilizar la teoría de estabilidad de Lyapunov para analizar y
determinar las condiciones bajo las cuales la dinámica del error no lineal tiene un comportamiento
estable en torno a un punto fijo (e = 0). Como resultados más importantes dentro de esta
aproximación podemos destacar los trabajos de Kou et al. y de Thau.

Por lo general se trata de una aproximación teórica, que raramente ofrece la posibilidad de
construir dichos observadores, ya que no da ninguna pista sobre la manera en la que construir las
funciones de Lyapunov ni cómo diseñar el observador.

Método de Linealización Extendida

El método de linealización extendida utiliza la inyección de salida, al igual que para la


aproximación lineal, excepto que ahora este término inyectado es de tipo no lineal. El método de
linealización extendida fue propuesto por Baumann y Rugh. El método propuesto consiste en
utilizar la inyección de salida no lineal con la intención de lograr que la dinámica del error
linealizado tenga autovalores localmente constantes.

A pesar de que Baumann y Rugh demostraron para el sistema del péndulo invertido que los
resultados obtenidos son mejores que los que se pueden obtener linealizando el sistema y
diseñando un observador lineal, la aproximación tiene ciertas limitaciones. Primero, cabe destacar
que el observador está diseñado de manera que sólo puede operar en torno a un conjunto de
puntos del sistema original (aunque esto hace que funcione bien como controlador). Además,
resulta complicada su extensión para sistemas con múltiples entradas.

Técnicas Lie-algebraic

La idea básica de estas técnicas consiste en transformar los sistemas no lineales en sistemas en los
que sea válida la teoría para sistemas lineales. En la literatura podemos encontrar múltiples
aportaciones, entre las que cabe destacar el trabajo Keller y el trabajo de Krener e Isidori. La
ventaja de estas técnicas es que explotan el enorme conocimiento disponible para el diseño de
observadores lineales reduciendo el problema del observador no lineal a un problema que pueda
ser manejado con técnicas lineales.

El problema a la hora de su aplicación es que el sistema lineal sobre el que aplicarla debe cumplir
una serie de restrictivas propiedades, y que (aunque las cumpla) encontrar la transformación del
sistema no resulta una tarea sencilla.
Métodos Basados en el Filtro de Kalman

Una de las herramientas más usadas para la construcción de observadores de estados (y para otro
gran número de aplicaciones) es el filtro de Kalman. En 1960 Rudolph E. Kalman publicó su famoso
artículo [56] en el que establece los fundamentos de esta técnica. Desde entonces, han surgido
multitud de aplicaciones, herramientas, trabajos y libros describiendo y ampliando las cualidades
de este filtro. Entre ellos cabe destacar como dos de los libros más completos sobre el tema, y más
recientemente el curso de Welch y Bishop como una completa introducción.

El filtro de Kalman es esencialmente un conjunto de ecuaciones matemáticas que implementan un


estimador del tipo predictor-corrector que es óptimo en el sentido de que minimiza la covarianza
del error estimado. La gran ventaja del filtro de Kalman es su relativa “sencillez” y su robustez, ya
es capaz de trabajar considerablemente bien en multitud de situaciones.

Filtro de Kalman Discreto

Supongamos que tenemos un sistema lineal discreto en espacio de estado con la siguiente forma:

Donde wk es una variable que representa el ruido en el proceso y vk representa el ruido en la


medida. Ambas variables son independientes la una de la otra (no correlacionadas), blancas, y con
una distribución normal de probabilidad:

El filtro de Kalman realiza estimaciones de las variables de estado de un proceso utilizando una
especie de “control realimentado”: el filtro estima el estado del proceso en un instante de tiempo
y posteriormente obtiene una realimentación de las medidas. Por esto, podemos dividir las
ecuaciones del filtro de Kalman en dos grupos: actualización en el tiempo (conocida como
predicción) y actualización en las medidas (conocida como corrección). En la figura podemos ver
un esquema a “alto nivel” del funcionamiento del filtro de Kalman dividido en estas dos etapas.

Figura 5.3: Lazo del filtro de Kalman.


En la fase de predicción se realiza el cálculo del estado actual y de la covarianza del error (conocida
como P) a partir de la covarianza del error en instante anterior.

Durante la fase de corrección se realiza la actualización de la ganancia de Kalman usando la


covarianza del error calculada en la fase de predicción, se toman las medidas y se corrige la
estimación del estado calculado en la fase de predicción y por último se actualiza la covarianza del
error (P) con la ganancia de Kalman y la covarianza del error calculada en el instante anterior.

El filtro de Kalman resulta bastante fácil de calcular debido que es prácticamente lineal (excepto
por la inversión de la matriz). También se puede probar que el filtro de Kalman es un estimador
óptimo del estado de un proceso, dada una métrica de error cuadrática.

Filtro de Kalman Extendido

El filtro de Kalman extendido (EKF, extended Kalman filter) es una variación del filtro de Kalman
para tratar el problema de la estimación de estados cuando estamos trabajando con un sistema
que es no lineal.

Supongamos que tenemos un sistema no lineal con la siguiente forma:

Al igual que para el filtro de Kalman discreto, wk es una variable que representa el ruido en el
proceso y vk representa el ruido en la medida. Ambas variables son independientes la una de la
otra (no correladas), blancas, y con una distribución normal de probabilidad:

La forma del filtro de Kalman extendido es similar a la del filtro de Kalman discreto, sólo que ahora
estamos tratando con un sistema no lineal que, por tanto, tiene que ser linealizado para poderle
aplicar el filtro de Kalman. EKF soluciona este problema de la linealización calculando las matrices
jacobianas de f y h en torno al estado estimado:
• A será la jacobiana de la función de estado f respecto al estado x:

• W será la jacobiana de la función de estado f respecto al ruido en el modelo w:

• C será la jacobiana de la función de salida h respecto al estado x:

• V será la jacobiana de la función de salida h respecto al ruido en el sensor v:

Al igual que antes, en la fase de predicción se realiza el cálculo del estado actual y de la covarianza
del error (conocida como P) a partir de la covarianza del error en instante anterior.

Para la fase de corrección del filtro de Kalman extendido, también se realiza la actualización de la
ganancia de Kalman usando la covarianza del error calculada en la fase de predicción, se toman las
medidas y se corrige la estimación del estado calculado en la fase de predicción, y por último se
actualiza la covarianza del error (P) con la ganancia de Kalman y la covarianza del error calculada
en el instante anterior.

Como vemos, el filtro de Kalman extendido es una forma de obtener aproximaciones de primer
orden de los términos óptimos. Cuando el modelo es extremadamente no lineal, estas
aproximaciones pueden generar esperanzas y covarianzas muy distintas a las esperanzas y
covarianzas reales. Estas discrepancias, pueden conducir a un mal funcionamiento del filtro o
incluso a su divergencia. Otro inconveniente del filtro de Kalman extendido es que requiere el
cálculo de las matrices jacobianas, lo cual no es trivial en la mayoría de los casos, pudiendo
producirse errores de cálculo difíciles de detectar.

Unscented Kalman Filter

A pesar de las ventajas que EKF proporciona para su uso en sistemas no lineales, como acabamos
de ver también tiene ciertos problemas o inconvenientes. Con la intención de solucionar estos
problemas surgió el Unscented Kalman Filter (UKF). UKF fue propuesto por Julier y Uhlmann y
posteriormente ampliado y perfeccionado por Wan y van der Merwe. En lugar de utilizar
linealización de funciones, Julier y Uhlmann proponen realizar la transformación unscented. Esta
transformación utiliza un conjunto de puntos y los propaga a lo largo de la función no lineal,
eliminando así la linealización. Al igual que EKF, el filtro de Kalman Unscented es recursivo y
requiere las dos etapas de predicción-corrección. La gran ventaja de esta técnica frente a EKF es
que evita el cálculo de las matrices Jacobianas, presentando además una complejidad de cálculo
numérico comparable a la del EKF, y además genera estimaciones de mayor orden. Existen
diversos trabajos que comparan experimentalmente los resultados de ambas técnicas, entre ellos
cabe destacar [80], que aplica ambas técnicas a un sistema de seguimiento de aviones por radar, o
para un sistema de navegación.

Métodos de Horizonte Móvil

Los métodos de horizonte móvil (Moving Horizon Estimator, MHE) realizan estimaciones de
estados sin utilizar linealización del modelo ni información estadística de las perturbaciones. MHE
realiza las estimaciones ajustando el modelo de acuerdo a un horizonte de datos pasados y
estimando, a partir del modelo ajustado, los nuevos datos.

La idea básica de estimación con horizonte móvil es utilizar únicamente los N últimos datos para
realizar la estimación. El horizonte se mueve hacia delante en cada instante de muestreo para
poder así utilizar las medidas actuales. Supongamos que el horizonte comienza en un instante de
muestreo k − N, siendo k el instante de tiempo actual. MHE realiza un proceso de dos pasos:

• Minimizar una función de coste con respecto al estado inicial (x(k − N)) y a las perturbaciones del
modelo (wk). La función de coste empleada es la medida de la distancia entre la salida del sistema
y la salida del estimador a lo largo de un intervalo de tiempo anterior al instante de tiempo para el
que se requiere la estimación del estado (N intervalos hacia el pasado).

• Posteriormente, partiendo del estado inicial óptimo y de las perturbaciones óptimas, se itera
recursivamente el modelo desde el instante t − N hacia el futuro para estimar el estado en el
instante o instantes siguientes.

En la figura puede verse un esquema del funcionamiento del MHE. En la literatura cabe destacar el
trabajo de Haseltine y Rawlings en el que se compara “de manera crítica” la aproximación del
estimador con horizonte deslizante y el filtro de Kalman extendido como estimadores para
sistemas no lineales.

Programación Genética

Figura 5.4: Estimación por horizonte móvil.

Consideremos el sistema no lineal de las ecuaciones:

Para solucionar el problema de la construcción de un observador de estados se propone la


siguiente estructura:

Donde ²k|k−1 indica el error a priori de la salida, xˆk|k−1 es el estado estimado a priori, y K(·) es
una función que depende directamente de las funciones del error a priori del sistema y de la
entrada. El problema radica en identificar la función K(·) de tal manera que se minimice la media
normalizada del error en la salida (ecuación 5.33) dado un conjunto de pares entrada salida {uk,
yk} n k=1.
En el caso de que se desconozca el modelo del sistema el problema se puede reducir a la
identificación simultánea del modelo del sistema y de la matriz de ganancia.

Referencias

[1] Friendland, B. Control Systems Design. McGraw Hill. ISBN 0-07-022441-2.

[2] Brogan, W.L. Modern Control Theory. Prentice Hall. ISBN 0-13-590415-3.

[3] Ogata, K. Ingenier´ıa de Control Moderna. Prentice Hall.

You might also like