CENTRO DE INVESTIGACIÓN Y DE ESTUDIOS AVANZADOS

DEL
INSTITUTO POLITÉCNICO NACIONAL

DEPARTAMENTO DE CONTROL AUTOMÁTICO




Observadores Difusos y Control Adaptable
Difuso Basado en Observadores


TESIS QUE PRESENTA
Araceli Grande Meza

PARA OBTENER EL GRADO DE
MAESTRO EN CIENCIAS


EN LA ESPECIALIDAD DE
CONTROL AUTOMÁTICO


DIRECTOR DE TESIS:
Dr. Wen Yu Liu




México, D.F., octubre del 2003.
















Índice general
1. Introducción 1
1.1. Objetivos del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2. Método de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3. Estructura del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2. Lógica difusa y relación difusa 7
2.1. Lógica difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1. Conjuntos Difusos y operaciones básicas de los conjuntos difusos . . . 8
2.1.2. Proyecciones y Extensiones Cilíndricas . . . . . . . . . . . . . . . . . 21
2.2. Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) . . . . . 23
2.2.1. De las Variables Numéricas a las Variables Lingüísticas . . . . . . . . 23
2.2.2. Reglas difusas SI-ENTONCES (IF-THEN) . . . . . . . . . . . . . . . 26
2.2.3. La Lógica Difusa y el Razonamiento Aproximado . . . . . . . . . . . 28
3. Sistemas Difusos y Control Difuso 31
3.1. Sistemas Difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.2. Control Difuso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.2.1. Reglas Difusas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.2. Dispositivo de Inferencia Difusa . . . . . . . . . . . . . . . . . . . . . 39
3.3. El doble papel de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . 39
ii ÍNDICE GENERAL
3.4. Los sistemas difusos como aproximadores Universales . . . . . . . . . . . . . 40
3.5. Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente De-
scendente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.5.1. Estructura del Sistema Difuso . . . . . . . . . . . . . . . . . . . . . . 42
3.5.2. Diseño de los Parámetros por el Gradiente Descendente . . . . . . . . 44
4. Observadores Difusos 49
4.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.2. Observadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.3. Observadores Difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
4.4. Observador para un Sistema Difuso Takagi-Sugeno . . . . . . . . . . . . . . 53
4.5. Identificador Neuronal Difuso . . . . . . . . . . . . . . . . . . . . . . . . . . 56
4.6. Identificador Difuso basado en un Observador . . . . . . . . . . . . . . . . . 58
4.6.1. Observador en modo deslizante . . . . . . . . . . . . . . . . . . . . . 59
4.6.2. Análisis de estabilidad . . . . . . . . . . . . . . . . . . . . . . . . . . 60
4.6.3. Identificador Difuso basado en un Observador . . . . . . . . . . . . . 63
4.7. Simulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.7.1. Identificación de sistemas no lineales . . . . . . . . . . . . . . . . . . 70
5. Control Difuso basado en un Observador 101
5.1. Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.2. Controladores Difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.3. Retroalimentación a la Salida de Sistemas Difusos TSK . . . . . . . . . . . . 103
5.3.1. Control con Retroalimentación a la Salida de Sistemas Lineales . . . 104
5.3.2. Control Difuso de TSK . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.3.3. Control Difuso para TSK basado en un Observador . . . . . . . . . . 109
5.4. Control Difuso con Retroalimentación a la Salida basado en un observador . 110
5.5. Simulación . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.5.1. Control adaptable difuso . . . . . . . . . . . . . . . . . . . . . . . . . 118
5.5.2. Control adaptable difuso basado en un observador en modo deslizante 123
ÍNDICE GENERAL iii
6. Conclusión 131
Appendix:diagramas 141
iv ÍNDICE GENERAL
Capítulo 1
Introducción
En 1965 Lofti A. Zadeh escribió su celebre artículo “Fuzzy Sets” [52] en el que menciona
que “Muy comúnmente, las clases de objetos encontradas en el mundo físico real no tienen
definido de forma precisa su criterio de pertenencia". Esta misma ambigüedad crece en el
caso de un número, tal como el 10 con relación a la clase de todos los números reales que
son mucho más grandes que 1. Podemos observar con claridad que "las clases de todos los
números reales mucho más grandes que 1", o "la clase de las mujeres altas", o "la clase
de los hombres jóvenes", no constituyen clases o conjuntos en el sentido matemático usual.
Sin embargo, los datos restantes, imprecisamente llamados clases, desempeñan un papel
importante en el pensamiento humano, particularmente en el dominio de reconocimiento
de patrones, comunicación de información y abstracción. Zadeh estableció en su artículo
las bases principales del lenguaje difuso, definiendo el universo de discurso, como el área
dónde se atribuyen cualidades o se califican determinadas variables, y llamando a un tipo de
conjuntos que encierran una propiedad específica, funciones de pertenencia.
A partir de los primeros resultados presentados por Zadeh [53] y las primeras aplicaciones
en los procesos de control realizadas por Mamdani [28], el control difuso ha mostrado ser
una aproximación exitosa para los sistemas no lineales complejos.
Desde que las teorías de control clásicas se han combinado dentro de los sistemas difusos,
ha surgido un gran número de análisis de estabilidad y resultados de síntesis en el control
2 Introducción
difuso. Muchos autores en el campo de esta tecnología proclaman que el control difuso
está revolucionando el control, prometiendo mayores y mejores adelantos en la solución de
problemas de alta complejidad dentro del área ingenieríl, invirtiendo de esta forma menor
esfuerzo por parte de la comunidad interesada en encontrar nuevas alternativas.
1.1. Objetivos del trabajo
El objetivo general de esta tesis es proponer una herramienta que resuelva los problemas
de identificación y control para cierta clase de sistemas no lineales complejos, empleando los
principios de los sistemas difusos.
La motivación principal de este trabajo es que: "Si algunos estados internos de un sistema
no lineal no se pueden medir, entonces ¿cómo podemos diseñar un controlador difuso basado
en los datos entrada-salida que nos permita estabilizar tal sistema?".
1.2. Método de solución
De acuerdo a la complejidad y a la gran variedad de sistemas no lineales que abundan en
la naturaleza, no existe una metodología exacta que nos permita resolver los problemas de
identificación y control de estos sistemas, por tanto basándonos en el conocimiento de que
las redes neuronales y la lógica difusa son estimadores universales provistos con la capacidad
de aproximar cualquier función no lineal a cualquier precisión que se pida [1], [5], [25],
podemos emplear estos conceptos como una buena alternativa en la solución a los problemas
de identificación y control para la clase de sistemas de nuestro interés.
Hoy en día se ha mostrado que la combinanción de nuevas tecnologías tales como las
redes neuronales y la lógica difusa han permitido surgir nuevos conceptos como los neuro
identificadores difusos, los neuro controladores difusos, los controladores adaptables difusos,
etc., que nos proporcionan un medio bastante efectivo en la búsqueda de soluciones para una
amplia gama de sistemas con información parcial o ninguna información de sus modelos. Los
sistemas de control difuso son una herramienta muy versátil, permitiendonos de esta forma
1.3 Estructura del trabajo 3
encontrar diferentes medios de solución para un mismo problema.
En la figura 1.1 se muestra un panorama general para dar solución al problema que se ha
planteado en la tesis; se dan dos diferentes puntos de vista que nos podrían proporcionar la
información requerida acerca del sistema no lineal: el primero se basa en la estimación de los
estados internos del sistema por medio de un observador difuso tipo TSK y de acuerdo con
esta información poder diseñar un controlador de igual forma apoyado en los principios de
la lógica difusa [27]. En el segundo caso se emplea la identificación basada en los conceptos
de las redes neuronales y los sistemas difusos, y para poder estimar los estados internos del
sistema no lineal se utiliza un observador libre de la estructura del sistema como por ejemplo
un observador en modo deslizante, así, con la información obtenida poder dar una ley de
control para el sistema en cuestión [49]. Este último caso es más general y por lo tanto de
mayor interés.
1.3. Estructura del trabajo
Esta tesis está organizada de la siguiente forma:
En el capítulo 1 se plantea la necesidad de nuevas estrategias de identificación y control
que nos permitan hacer frente a problemas de alta complejidad que caracterizan a los sistemas
inmersos en el entorno que nos rodea y que se encuentran presentes en muchas aplicaciones
del área ingenieríl. El problema que se plantea nos permite enfocarnos en nuevas tendencias
del control, como son los sistemas de control difuso en combinación con conceptos tales
como las redes neuronales artificiales, poderosas herramientas en la identificación y control
de sistemas no lineales complejos.
En el capítulo 2 se revisan los conceptos básicos de la lógica difusa, cuya necesidad se
ha extendido en una amplia variedad de aplicaciones; a partir de la publicación de Lofti
Zadeh aparecen nuevas definiciones para los conjuntos clásicos. Se enuncia el significado de
palabras tales como conjunto difuso, función de pertenencia o inclusión, variable lingüística,
operaciones difusas, etc. El propósito de este capítulo es dar de forma breve una introducción
teórica al conocimiento tan extenso de la lógica difusa.
4 Introducción
Lógica Difusa
Sistemas Difusos
y
Control Difuso
Observador
TSK
Controlador
TSK
identificador difuso por
medio de un
observador en modo
deslizante
Controlador adaptable
difuso basado en un
observador en modo
deslizante
Identificación de los
estados internos del
sistema
Observador
difuso
Identificador
difuso
Simulación
Figura 1.1: Esquema general de la tesis.
1.3 Estructura del trabajo 5
En el capítulo 3 se muestra que la aplicación más importante de la lógica difusa son los
sistemas difusos y en especial los sistemas de control difuso. Los sistemas difusos son sistemas
basados en el conocimiento o en reglas, existen diferentes tipos de sistemas de control difuso
como son los de tipo Mamdani y los del tipo Takagi-Sugeno-Kang (TSK). Se definen las
características básicas de estos sistemas. Podemos ver que este tipo de sistemas se pueden
emplear muy bien en la identificación y control de sistemas no lineales complejos gracias a
la capacidad que tienen de aproximar sistemas no lineales con una buena exactitud.
En el capítulo 4 se muestra la aplicación de las redes neuronales y de los sistemas difusos
dentro del área de la identificación de sistemas no lineales, de los cuales no se cuenta con
toda la información y cuyos modelos matemáticos son muy complejos.
Se muestran dos formas para la estimación de los estados internos del sistema no lineal, la
primera es por medio de la aplicación de los observadores difusos para sistema tipo Takagi-
Sugeno y en el segundo método se introduce un observador en modo deslizante así como su
diagrama de diseño, esto es con el fin de estimar los estados internos del sistema no lineal
y de esta forma identificar la planta por medio de un neuro identificador difuso, también se
muestra el análisis de estabilidad de éste último.
En el capítulo 5 se plantea el problema de seguimiento para un sistema no lineal, y de
igual forma que en el capítulo anterior se presentan dos alternativas, en la primera propuesta
se utiliza un sistema de control tipo Takagi-Sugeno que es parte de la continuación a la
estimación de los estados internos del sistema por medio de un observador TSK, lo que
simplifica el problema mostrándolo como un caso lineal, en el segundo procedimiento se
define un error de seguimiento y de esta forma se propone un neuro controlador adaptable
difuso, este planteamiento es más general y de mayor interés en la solución para el control
de sistemas no lineales complejos.
Las partes de que consta un controlador adaptable son un identificador, un controlador,
el modelo de la planta y el modelo de referencia así como un algoritmo de adaptación, que
en éste caso podría ser el entrenamiento del gradiente descendente [29].
6 Introducción
1.4. Publicaciones
Parte de esta tesis se presentó como el artículo titulado Fuzzy Output Feedback Control
via Sliding Mode Observer, International Symposium on Robotics and Automation, Toluca,
Mexico, 2002
Capítulo 2
Lógica difusa y relación difusa
La mayoría de las definiciones que a continuación se citan son extraídas de [42] y [41], se
presentan los conceptos básicos que describen a la lógica difusa y a los sistemas de control
difuso.
2.1. Lógica difusa
En la década de los años veinte de este siglo, J. Lukasiewicz desarrolló los principios de
la lógica multivaluada, cuyos enunciados pueden tener valores de verdad comprendidos entre
el 0 (FALSO) y el 1 (CIERTO) de la lógica binaria clásica.
En 1965, L. Zadeh aplicó la lógica multivaluada a la teoría de conjuntos, estableciendo
la posibilidad de que los elementos pudieran tener diferentes grados de pertenencia a un
conjunto. Zadeh introdujo el término fuzzy (borroso, difuso) y desarrolló un álgebra completa
para los conjuntos difusos, aunque estos conjuntos no tuvieron aplicación práctica hasta
mediados de los años setenta, cuando E. H. Mamdani diseñó un controlador difuso para un
motor de vapor [42].
En la lógica borrosa o difusa se trabaja con conjuntos, que se definen por sus funciones
de pertenencia, que se denotan como µ
C
(x) e indican el grado de pertenencia (entre 0 y 1)
del elemento con valor x al conjunto C.
8 Lógica difusa y relación difusa
La denominada lógica difusa (fuzzy logic) permite tratar información imprecisa, como
estatura media, temperatura baja o mucha fuerza, en términos de conjuntos borrosos o difu-
sos (imprecisos en definitiva). Estos conjuntos borrosos se combinan en reglas para definir
acciones, como por ejemplo, Si la temperatura es alta entonces enfriar mucho. De esta man-
era, los sistemas de control basados en lógica difusa combinan unas variables de entrada
(definidas en términos de conjuntos difusos), por medio de grupos de reglas que producen
uno o varios valores de salida.
Los sistemas basados en lógica difusa pueden ser aplicados a problemas similares que las
redes neuronales, y resultan interesantes para problemas no lineales o no bien definidos.
Los sistemas difusos permiten modelar cualquier proceso no lineal, y aprender de los
datos haciendo uso de determinados algoritmos de aprendizaje (como los de las propias redes
neuronales). Estos sistemas permiten utilizar fácilmente el conocimiento de los expertos en
un tema, formalizando el conocimiento a veces ambiguo del experto (o el sentido común)
de una forma realizable. Y gracias a la simplicidad de los cálculos, normalmente pueden
realizarse en sistemas baratos y rápidos.
Desde los resultados presentados por Zadeh y sus primeras aplicaciones en procesos de
control demostrados por Mamdani, el control difuso ha probado ser una excelente aproxi-
mación para sistemas no lineales complejos. Debido a que muchas teorías del control clásico
se combinan en los sistemas difusos, han aparecido análisis de estabilidad y resultados de
síntesis en control difuso.
A continuación se presentan los aspectos básicos de la lógica difusa.
2.1.1. Conjuntos Difusos y operaciones básicas de los conjuntos
difusos
De los Conjuntos Clásicos a los Conjuntos difusos
Sea U el universo de discurso, o conjunto universal que contiene todos los elementos posi-
bles que concierne a cada contexto en particular o aplicación. Recordando que un conjunto
clásico (crisp) A, o simplemente el conjunto A, en el universo de discurso U se puede definir
2.1 Lógica difusa 9
o estando todos sus miembros o especificando las propiedades que pueden satisfacer los el-
ementos del conjunto.Podemos enlistar los elementos del conjunto, esto sólo para conjuntos
finitos. De forma más general podemos establecer una regla que cumplan los elementos que
pertenezcan al conjunto A y que podemos representar como
A = {x ∈ U | cumple ciertas condiciones} (2.1)
Podemos citar otro método para definir el conjunto A, el método de pertenencia, que
introduce una función de pertenencia (también llamada función característica, función dis-
criminante, o función indicador) para A, denotado por µ
A
(x) , tal que
µ
A
(x) =
(
1 si x ∈ A
0 si x / ∈ A
(2.2)
El conjunto A es equivalente matemáticamente a su función de pertenencia µ
A
(x) en el
sentido que conociendo µ
A
(x) conocemos al propio A.
Si queremos definir un conjunto en U de acuerdo a si el auto es un auto americano o no,
nos presentamos con una dificultad. Una perspectiva es que un auto es un auto americano
si tiene el nombre de auto manufacturado en Estados Unidos de América; (EUA) de otra
forma no es un auto americano. Sin embargo, mucha gente siente que la distinción entre un
auto americano y uno no americano no es como en un conjunto crisp, debido a que muchos
componentes de los autos que se consideran americanos (por ejemplo, Ford, GM, Chryslers)
son producidos fuera de Estados Unidos de América. Además, algunos autos ”no americanos”
son manufacturados en los EUA. ¿Qué se puede hacer para enfrentar este problema?
Esencialmente, la dificultad del ejemplo anterior muestra que algunos conjuntos no tienen
fronteras claras. La teoría de conjuntos clásica requiere que un conjunto debe tener una
propiedad bien definida, por tanto es incapaz de definir el conjunto como ”todos los autos
americanos en Los Angeles”. Para afrontar esta limitación de la teoría de conjuntos clásica,
se introdujo el concepto de conjunto difuso. El resultado de esa limitación es fundamental
y es necesaria una nueva teoría: la teoría de conjuntos difusos.
10 Lógica difusa y relación difusa
Definición 2.1 Un conjunto difuso en el universo de discurso U se caracteriza por una
función de pertenencia µ
A
(x) que toma valores en el intervalo [0, 1].
Notación Los conjuntos difusos se denotan por letras mayúsculas normales, por ejem-
plo los conjuntos difusos A, B, C, L, etc. Las matrices se denotan por letras mayúsculas
oscuras como la matriz A, B, C, etc. Los elementos de un conjunto difuso se denotan por
letras minúsculas normales como x, u, y, etc., para las variables lingüísticas se utilizarán
letras normales con gorro, como b x, b y, etc.
Por tanto, un conjunto difuso es una generalización de un conjunto clásico permitiendo
que la función de pertenencia tome cualquier valor en el intervalo de [0, 1]. En otras palabras
la función de pertenencia de un conjunto clásico puede tomar solo dos valores -cero y uno-,
mientras que la función de pertenencia de un conjunto difuso es una función continua con
rango entre [0, 1]. Podemos ver de la definición que no existe nada incierto de la definición
de conjunto difuso; es simplemente un conjunto con una función de pertenencia continua.
Un conjunto difuso A en U puede representarse como un conjunto de pares ordenados de un
elemento genérico x y de su valor de pertenencia,
A = {(x, µ
A
(x)) | x ∈ U} (2.3)
Cuando U es continuo (por ejemplo, U = R), A es comúnmente escrito como
A =
Z
U
µ
A
(x) /x (2.4)
donde el signo de integral no denota integración; denota la colección de todos los puntos
x ∈ U con la función de pertenencia asociada µ
A
(x). Cuando U es discreto, A es comúnmente
escrito como
A =
X
U
µ
A
(x) /x (2.5)
donde el signo de sumatoria no representa adición aritmética; denota la colección de todos los
puntos x ∈ U con la función de pertenencia asociada µ
A
(x). Regresando al ejemplo anterior
y empleando el concepto de conjunto difuso se pueden definir el conjunto de autos americanos
2.1 Lógica difusa 11
y no americanos. Para definir el conjunto de autos americanos en Los Angeles denotado
por D, como un conjunto difuso de acuerdo al porcentaje de las partes del auto hechas es
EUA. Específicamente, D se define por la función de pertenencia
µ
D
(x) = p (x) (2.6)
donde p (x) es el porcentaje de las partes del auto x hechas en EUA y toma valores entre 0 %
y 100 %. Por ejemplo, si un auto en particular x
0
tiene el 60 % de sus partes hechas en EUA,
entonces decimos que el auto x
0
pertenece al conjunto D en el grado de 0.6. Similarmente,
podemos definir el conjunto de autos no americanos en Los Angeles, denotado por F,
como el conjunto difuso con la función de pertenencia
µ
F
(x) = 1 −p (x) (2.7)
donde p (x) es lo mismo que en (2.6). De esta manera, si un auto particular x
0
tiene el
60 % de todas sus partes hechas en EUA, entonces podemos decir que el auto x
0
pertenece
al conjunto difuso F en un grado de 1-0.6=1.4. La figura 2.1 muestra (2.6) y (2.7). Por
supuesto, un elemento puede pertenecer a diferentes conjuntos difusos en el mismo o en
diferente grado.
Podemos definir a Z como el conjunto nombrado números cercanos al cero. Por tanto
una posible función de pertenencia para Z es
µ
Z
(x) = e
−x
2
(2.8)
donde x ∈ R. Esta es una función Gaussiana con media igual a cero y desviación estándar
igual a uno. De acuerdo a esta función de pertenencia, los números 0 y 2 pertenecen al
conjunto difuso Z en un grado de e
0
= 1 y e
−4
, respectivamente.
También podemos definir la función de pertenencia para Z como
µ
Z
(x) =
_
¸
¸
¸
¸
_
¸
¸
¸
¸
_
0 si x < −1
x + 1 si −1 ≤ x < 0
1 −x si 0 ≤ x < 1
0 si 1 ≤ x
(2.9)
12 Lógica difusa y relación difusa
1
0
µ
F
µ
D
100 p(x)
Figura 2.1: Función de pertenencia para autos americanos (µ
D
) y no americanos (µ
F
) basados
en el porcentaje de las partes del auto hechas en EUA (p (x)) .
De acuerdo a esta función de pertenencia, los números 0 y 2 pertenecen al conjunto difuso
Z en un grado de 1 y 0, respectivamente. (2.8) y (2.9) se pueden observar en las figuras
(2.2) y (2.3), respectivamente. Se pueden elegir muchas otras funciones de pertenencia que
caractericen a números cercanos a cero.
Podemos señalar tres observaciones importantes sobre los conjuntos difusos:
Comentario 2.1 Las propiedades empleadas para caracterizar conjuntos difusos usualmente
son difusos, por ejemplo, números cercanos al cero, lo cual no es una descripción precisa.
De esta forma, podemos usar diferentes funciones de pertenencia para caracterizar la misma
descripción. Sin embargo, las funciones de pertenencia por sí solas no son difusas - en reali-
dad son funciones matemáticas precisas -. Una vez que una propiedad difusa es representada
por una función de pertenencia, por ejemplo, ”números cercanos al cero” se representa por
la función de pertenencia (2.8) o (2.9), nada será difuso después. Así, caracterizando una
descripción difusa con una función de pertenencia, esencialmente se le quita lo difuso a la
descripción difusa. Un malentendido común de la teoría de conjuntos difusos es que la teoría
de conjuntos difusos trata de hacer difuso al mundo. Por el contrario, estos conjuntos difusos
son usados para no ver al mundo de forma difusa.
Comentario 2.2 La observación anterior es una cuestión importante: ¿cómo determinar las
2.1 Lógica difusa 13
0
1
µ
x
Figura 2.2: Función de pertenencia posible para caracterizar ”números cercanos al cero”.
-1 1
x
1
µ
Figura 2.3: Otra posible función de pertenencia para caracterizar ”números cercanos al cero”.
14 Lógica difusa y relación difusa
funciones de pertenencia? Debido a que existe una variedad de elecciones para las funciones
de pertenencia, ¿cómo podemos elegir una de estas opciones? Conceptualmente, existen dos
aproximaciones para determinar una función de pertenencia. La primera aproximación es
usar el conocimiento humano de los expertos, es decir, preguntar a los expertos del campo
para especificar las funciones de pertenencia. Ya que los conjuntos difusos son en ocasiones
empleados para formular el conocimiento humano, las funciones de pertenencia representan
una parte del conocimiento humano. Usualmente, esta aproximación puede darnos una fór-
mula rígida de la función de pertenencia; se necesita un ajuste más fino. Para la segunda
aproximación, empleamos una colección de datos provenientes de varios sensores para deter-
minar las funciones de pertenencia. Específicamente, primero se definen las estructuras de
las funciones de pertenencia y de esta forma se ajustan los parámetros de las funciones de
pertenencia basadas en los datos.
Comentario 2.3 Finalmente, debería enfatizarse que aunque (2.8) y (2.9) son usadas
para caracterizar la misma descripción de ”números cercanos al cero”, estos son diferentes
conjuntos difusos. Hablando rigurosamente, podríamos emplear diferentes etiquetas para rep-
resentar los conjuntos difusos (2.8) y (2.9); por ejemplo, podríamos usar µ
Z
1
(x) en (2.8) y
µ
Z
2
(x) en (2.9). Un conjunto difuso tiene una correspondencia uno a uno con su función de
pertenencia. Esto es, cuando decimos un conjunto difuso, existe una función de pertenencia
única asociada con éste; recíprocamente, cuando damos una función de pertenencia, ésta
representa un conjunto difuso.
Conceptos Básicos asociados con los Conjuntos Difusos
Muchos de estos conceptos son una extensión de los conceptos básicos de un conjunto
clásico (crisp), sin embargo algunos de ellos son únicos dentro del marco de los conjuntos
difusos.
Definición 2.2 A continuación se definen los conceptos de soporte, singleton difuso, centro,
punto de cruce, punto elevado, conjunto difuso normal, α-corte, conjunto difuso convexo y
proyecciones.
2.1 Lógica difusa 15
1
µ
varios
(x)
x entero
1 2 3 4 5 6 7 8 9 10
0.5
Figura 2.4: Función de pertenencia para el conjunto dufuso "varios".
El soporte (support) de un conjunto difuso A en el universo de discurso U es un conjunto
crisp que contiene todos los elementos de U que no tienen valores de pertenencia igual a cero
en A, esto es,
supp(A) = {x ∈ U | µ
A
(x) > 0} (2.10)
donde supp(A) denota el soporte del conjunto difuso A. Por ejemplo, el soporte del con-
junto difuso "varios"en la figura 2.4 es el conjunto de enteros {3, 4, 5, 6, 7, 8}. Si el soporte
de un conjunto difuso esta vacío, se le llama conjunto difuso vacío. Un singleton difuso
es un conjunto difuso cuyo soporte es un único punto en U.
El centro de un conjunto difuso se define como: si el valor medio de todos los puntos
en el cuál la función de pertenencia del conjunto difuso alcanza su máximo valor es finito,
por tanto se define este valor medio como el centro del conjunto difuso, si el valor medio es
igual a un infinito positivo (negativo), entonces el centro se define como el más grande (más
pequeño) entre todos los puntos que alcanzan el valor de pertenencia máximo. La figura 2.5
muestra los centros de algunos conjuntos difusos típicos. El punto de cruce de un conjunto
difuso es el punto en U cuyo valor de pertenencia en A es igual a 0,5.
16 Lógica difusa y relación difusa
µ
A
1
A
2
A
3
A
4
centro
de A
1
centro
de A
2
centro
de A
3
centro
de A
4
Figura 2.5: Centros de algunos conjuntos difusos típicos.
El punto elevado de un conjunto difuso es el valor de pertenencia más grande obtenido
por cualquier punto. Por ejemplo, los puntos elevados de todos los conjuntos difusos en las
Figuras 2.1-2.3 son iguales a uno. Si el punto elevado de un conjunto difuso es igual a uno,
se le llama conjunto difuso normal. Todos los conjuntos difusos en las Figuras 2.1-2.3 son
por tanto conjuntos difusos normales.
Un α-corte de un conjunto difuso A es un conjunto crisp A, que contiene todos los
elementos en U que tienen valores de pertenencia en A mayores o iguales a α, esto es,
A
α
= {x ∈ U | µ
A
(x) ≥ α} (2.11)
Por ejemplo, para α = 0.3 el α-corte del conjunto difuso (2.9) (figura 2.3) es el conjunto
crisp [-0.7,0.7], y para α = 0.9, es [-0.1,0.1] .
Cuando el universo de discurso U es el espacio Euclidiano n-dimensional R
n
, el concepto
de convexidad se puede generalizar al conjunto difuso. Un conjunto difuso A se dice convexo
si y solo si α-corte A
α
es un conjunto convexo para cualquier α en el intervalo (0, 1] .
Los conceptos básicos de las secciones anteriores conciernen a un sólo conjunto difuso. Se
asume que A y B son conjuntos difusos definidos en el mismo universo de discurso U.
2.1 Lógica difusa 17
Definición 2.3 La igualdad, contención complemento, unión e intersección de dos conjuntos
difusos A y B se definen a continuación
Decimos que A y B son iguales si y sólo sí µ
A
(x) = µ
B
(x) para todo x ∈ U. Se dice
que B contiene a A, denotado por A ⊂ B si y sólo sí µ
A
(x) ≤ µ
B
(x) para todo x ∈ U. El
complemento de A es un conjunto difuso A en U cuya función de pertenencia es definida por
µ
A
(x) = 1 −µ
A
(x) (2.12)
La unión de A y B es un conjunto difuso en U, denotado por A ∪ B cuya función de
pertenencia esta definida como
µ
A∪B
(x) = m´ax [µ
A
(x) , µ
B
(x)] (2.13)
La intersección de A y B es un conjunto difuso A∩ B en U con función de pertenencia
µ
A∩B
(x) = m´ın [µ
A
(x) , µ
B
(x)] (2.14)
La unión de A y B es el conjunto difuso más pequeño que contiene a A y B. Si C es
cualquier conjunto difuso que contiene a A y B, entonces también contiene la unión de A y B.
A∪B definido como en (2.13) contiene a ambos A y B ya que m´ax [µ
A
(x) , µ
B
(x)] ≥ µ
A
(x)
y m´ ax [µ
A
(x) , µ
B
(x)] ≥ µ
B
(x). Además, si C es cualquier conjunto difuso conteniendo a A
y B, entonces µ
C
(x) ≥ µ
A
(x) y µ
C
(x) ≥ µ
B
(x) . Por tanto, µ
C
(x) ≥ m´ ax [µ
A
(x) , µ
B
(x)] =
µ
A∪B
, lo que significa que A∪ B definido como en (2.13) es el conjunto difuso más pequeño
que contiene a ambos A y B.La intersección se justifica de igual manera.
Las funciones que definen la unión y la intersección pueden generalizarse a condición
de cumplir ciertas restricciones. Las funciones que cumplen estas condiciones se conocen
respectivamente como Conorma Triangular (T-Conorma) y Norma Triangular (T-Norma).
Algunas de las más usadas son:
Conomas Normas
MAX(a,b) MIN(a,b)
(a+b-ab) (ab)
MIN(1,a+b) MAX(0, a+b-1)
18 Lógica difusa y relación difusa
Como en la lógica clásica, las Conormas y Normas cumplen las leyes de Morgan que las
relacionan.
Particiones Difusas
Dada una variable difusa A, definida en un rango entre u
1
y u
2
, es posible establecer en
ella diversas particiones. Se conoce por partición a un conjunto de los conjuntos difusos
que se han definido para la variable A. Una partición de A es uno de los subconjuntos
que pueden formarse con los elementos (términos) de T(A). Así, para la variable "estatura"
una posible partición sería la correspondiente a la figura 2.6, con tres subconjuntos difusos,
cada uno identificado por una etiqueta, {Bajo, Medio, Alto}, y una función de inclusión
o pertenencia, {µ
Bajo
(t), µ
Medio
(t), µ
Alto
(t)}. Se dice que una partición es completa si
para todos los valores posibles de U existe en la partición un conjunto con pertenencia no
nula (es decir, los conjuntos definidos cubren todo U); así, completitud es el porcentaje de
los elementos de U para los que existe en la partición un conjunto con pertenencia no nula
frente al total de elementos de U. Se dice que dos conjuntos difusos están solapados si su
intersección es no nula; de este modo, el solapamiento de un conjunto difuso es la relación
del número de elementos que comparte con otros conjuntos de la misma partición, respecto
del número total de elementos que lo forman.
Para la realización ,de controladores basados en lógica difusa se han de definir particiones
de las variables del controlador. Normalmente se recomienda que estas particiones sean com-
pletas, con un solapamiento del 20 % al 50 %, y en número impar. Normalmente se emplean
particiones de 3 o 7 conjuntos, pues la complejidad no es excesiva y permiten una precisión
suficiente en la descripción de los valores de la variable. Además, se recomienda definir con-
juntos de tipo T (triangulares) en torno a puntos singulares, como el cero. Los nombres de
los conjuntos difusos que forman una partición se suelen expresar en forma abreviada por sus
iniciales; así, una partición típica como {Negativo Grande, Negativo Pequeño, Cero, Positivo
Pequeño, Positivo Grande} se representa como {NG, NP, CE, PP, PG} o, en ingles, {NL,
NS, ZE, PS, PL} (Negative Large, Negative Small, Zero, Positive Small, Positive Large).
2.1 Lógica difusa 19

µ
A
(x)
Bajo Medio Alto
x
Figura 2.6: Conjuntos difusos para la variable Estatura.
Inferencia Difusa
También como en el caso de la lógica clásica, la lógica difusa se ocupa del razonamiento
formal con proposiciones, pero a diferencia de ésta, los valores de las proposiciones pueden
tomar valores intermedios entre verdadero y falso.
De la misma forma que se define un isomorfismo entre la lógica y la teoría de conjuntos
clásica, es posible también definir un isomorfismo entre la lógica y la teoría de conjuntos
difusos, y de éstas a su vez con un Álgebra de Boole. De esta forma, los conjuntos difusos
también representan predicados en la lógica proposicional. El objeto de la lógica difusa
es proporcionar un soporte formal al razonamiento basado en el lenguaje natural, que se
caracteriza por tratarse de un razonamiento de tipo aproximado, que hace uso de unas
proposiciones que a su vez expresan información de carácter impreciso.
Relaciones Difusas y el Principio de Extensión
Sean U y V dos conjuntos clásicos arbitrarios. El producto Cartesiano de U y V , denotado
por U × V , es el conjunto no difuso de todos los pares ordenados (u, v) tal que u ∈ U y
v ∈ V ,
U ×V = {(u, v) | u ∈ U y v ∈ V } (2.15)
20 Lógica difusa y relación difusa
El orden en que aparecen U y V es importante, ya que si U 6= V , entonces U × V 6=
V ×U. En general el producto Cartesiano de n conjuntos no difusos arbitrarios U
1
, U
2
, . . . , U
n
denotado por U
1
×U
2
×. . . ×U
n
, es el conjunto no difuso de todas las n-tuplas (u
1
, u
2
, . . . , u
n
)
tales que u
i
∈ U
i
para i ∈ {1, 2, . . . , n}; esto es,
U
1
× U
2
×. . . ×U
n
= {(u
1
, u
2
, . . . , u
n
) | u
1
∈ U
1
, u
2
∈ U
2
, . . . , u
n
∈ U
n
} (2.16)
Una relación (no difusa) entre conjuntos (no difusos) U
1
, U
2
, . . . , U
n
es un subconjunto
del producto Cartesiano U
1
× U
2
× . . . × U
n
, esto es, si empleamos Q(U
1
, U
2
, . . . , U
n
) para
denotar una relación entre U
1
, U
2
, . . . , U
n
entonces
Q(U
1
, U
2
, . . . , U
n
) ⊂ U
1
× U
2
×. . . × U
n
(2.17)
Como un caso especial, una relación binaria entre conjuntos (no difusos) U y V es un
subconjunto del producto Cartesiano U × V.
Definición 2.4 Una relación difusa es un conjunto difuso definido en el producto Cartesiano
de conjuntos crisp U
1
, U
2
, . . . , U
n
. Con el esquema de representación
A = {(x, µ
A
(x)) | x ∈ U} (2.18)
una relación difusa Q en U
1
×U
2
× . . . × U
n
es definida como el conjunto difuso
Q =
©
((u
1
, u
2
, . . . , u
n
) , µ
Q
(u
1
, u
2
, . . . , u
n
)) | (u
1
, u
2
, . . . , u
n
) ∈ U
1
×U
2
× . . . × U
n
ª
(2.19)
donde µ
Q
: U
1
× U
2
×. . . × U
n
→[0, 1].
Como un caso especial, una relación binaria difusa es un conjunto difuso definido en el
producto Cartesiano de dos conjuntos crisp. Una relación binaria sobre un producto Carte-
siano finito es representado usualmente por una matriz relacional difusa, esto es, una matriz
cuyos elementos son los valores de pertenencia de los pares correspondientes a la relación
difusa.
El principio de extensión permite convertir conceptos no difusos en difusos, siendo
además la base de la inferencia en los sistemas difusos. Sean U y V dos universos de discurso,
2.1 Lógica difusa 21
y f una función de U a V . En general, para una conjunto difuso A en U el principio de
extensión define un conjunto difuso B en V dado por
µ
B
(v) = sup
u∈f
−1
(v)

A
(u)] (2.20)
es decir µ
B
(v) es el máximo de µ
A
(u) para todos los u ∈ U que cumplen que f(u) = v,
donde v ∈ V y suponiendo que f
−1
(v) no es vacío. Si f
−1
(v) es vacío para algún v ∈ V , se
definirá µ
B
(v) = 0.
2.1.2. Proyecciones y Extensiones Cilíndricas
Se definen estos conceptos ya que una relación crisp está definida en el espacio producto
de dos o más conjuntos. Por ejemplo, considerando el conjunto
A =
©
(x, y) ∈ R
2
| (x −1)
2
+ (y −1)
2
≤ 1
ª
que es una relación en U × V = R
2
. La proyección de A sobre U es A
1
= [0, 1] ⊂ U y la
proyección de A sobre V es A
2
= [0, 1] ⊂ V ; ver la figura 2.7. La extensión de A
1
sobre
U × V = R
2
es A
1E
= [0, 1] × (−∞, ∞) ⊂ R
2
. Estos conceptos se pueden extender a las
relaciones difusas.
Definición 2.5 Sea Q una relación difusa en U
1
×. . . ×U
n
y {i
1
, . . . , i
k
} una subsecuencia
de {1, 2, . . . , n} , entonces la proyección de Q sobre U
i
1
× . . . × U
i
k
es una relación difusa
Q
P
definida por la función de pertenencia
µ
Q
P
(u
i
1
, . . . , u
i
k
) = m´ ax
u
j1
∈U
j1
,...,u
j(N−K)
∈U
j(N−K)
µ
Q
(u
1
, . . . , u
n
) (2.21)
donde
©
u
j1
, . . . , u
j(n−k)
ª
es el complemento de {u
i
1
, . . . , u
i
k
} con respecto a {u
1
, . . . , u
n
}.
Como un caso especial, si Q es una relación binaria difusa en U×V , entonces la proyección
de Q sobre V , denotada por Q
1
, es el conjunto difuso en definido por:
µ
Q
1
(x) = m´ax
y∈V
µ
Q
(x, y) (2.22)
22 Lógica difusa y relación difusa
A
1E
A
V
U
A
2
A
1
Figura 2.7: Proyecciones y Extenciones Cilíndricas de una relación.
Definición 2.6 Sea Q
P
una relación difusa en U
i
1
× . . . × U
i
k
y {i
1
, . . . , i
k
} es una sub-
secuencia de {1, 2, . . . , n} , entonces la extensión cilíndrica de Q
P
a U
1
× . . . × U
n
en una
relación difusa Q
PE
en U
1
× . . . × U
n
definida por
µ
Q
PE
(u
1
, . . . , u
n
) = µ
Q
P
(u
i
1
, . . . , u
i
K
) (2.23)
Como un caso especial, si Q
1
es un conjunto difuso en U, entonces la extensión cilíndrica
de Q
1
a U × V es una relación difusa Q
1E
en U × V definida por
µ
Q
1E
(x, y) = µ
Q
1
(x) (2.24)
La definición (2.23) también es válida para relaciones crisp.
Sean P (U, V ) y Q(V, W) dos relaciones binarias crisp que comparten un conjunto V . La
composición de P y Q, denotada por P ◦ Q se define como una relación en U × W tal que
(x, z) ∈ P ◦ Q si y solo si existe una y ∈ V tal que (x, y) ∈ P y (y, z) ∈ Q.
P ◦ Q es la composición de P (U, V ) y Q(V, W) si y solo si
µ
P◦Q
(x, z) = m´ax
y∈V
t
£
µ
P
(x, y) , µ
Q
(y, z)
¤
(2.25)
para cualquier (x, z) ∈ U ×W, donde t es cualquier t-norma.
2.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 23
Definición 2.7 La composición de las relaciones difusas P (U, V ) y Q(V, W), denotada por
P ◦ Q, está definida como una relación difusa en U × W cuya función de pertenencia está
dada por (2.25) .
Debido a que la t-norma en (2.25) puede tomar una variedad de fórmulas, para cada
t-norma podemos obtener una composición en particular. Las dos composiciones más usadas
comúnmente son la composición m´ ax −m´ın y la composición m´ ax −product, que se definen
a continuación:
La composición m´ ax −m´ın de relaciones difusas P (U, V ) y Q(V, W) es una relación
difusa P ◦ Q en U × W definida por la función de pertenencia
µ
P◦Q
(x, z) = m´ax
y∈V
m´ın t
£
µ
P
(x, y) , µ
Q
(y, z)
¤
(2.26)
donde (x, z) ∈ U × W.
La composición m´ax −product de relaciones difusas P (U, V ) y Q(V, W) es una relación
difusa P ◦ Q en U × W definida por la función de pertenencia
µ
P◦Q
(x, z) = m´ax
y∈V
t
£
µ
P
(x, y) , µ
Q
(y, z)
¤
(2.27)
donde (x, z) ∈ U × W.
2.2. Variables Lingüísticas y Reglas Difusas SI-ENTONCES
(IF-THEN)
2.2.1. De las Variables Numéricas a las Variables Lingüísticas
En nuestra vida diaria, las palabra en ocasiones sirven para describir variables. Por ejem-
plo, cuando decimos "hoy hace calor", o de forma equivalente, "la temperatura de hoy es
alta", usamos la palabra alta para describir la variable de "la temperatura de hoy". De esta
24 Lógica difusa y relación difusa
forma, la variable "la temperatura de hoy", toma la palabra alta para describir su valor.
Claramente, la variable "la temperatura de hoy"puede tomar los números 25

C, 19

C, etc.,
como sus valores. Cuando una variable toma números como sus valores, tenemos un marco
matemático bien establecido para formularlo. Pero cuando una variable toma palabras como
sus valores, no tenemos un marco formal para expresarlo en la teoría matemática clásica.
Para proporcionar un marco formal, se introdujo el concepto de variables lingüísticas. Si una
variable puede tomar palabras en un lenguaje natural como sus valores, se le llama variable
lingüística.
Definición 2.8 Si una variable puede tomar palabras en lenguajes naturales como sus val-
ores, se le llama variable lingüística, donde las palabras son caracterizadas como conjuntos
difusos definidos en el universo de discurso en el que la variable es definida.
Definición 2.9 [54] y [55] Una variable lingüística se caracteriza por
³
b
X, T, U, M
´
, donde
b
X es el nombre de la variable lingüística; por ejemplo,
b
X podría ser la velocidad del
auto, cuya representación se muestra en la figura 2.8.
T es el conjunto de valores lingüísticos que
b
X puede tomar; en el ejemplo anterior
T={lenta,media, rápida}
U es el dominio físico actual en el que la variable lingüística
b
X toma valores (crisp)
cuantitativos; en el ejemplo anterior U = [0, V
m´ax
] .
M es la regla semántica que relaciona cada valor lingüístico en T con un conjunto
difuso en U; en el ejemplo anterior M relaciona lenta, media y rápida con la función
de pertenencia que se muestra en la figura 2.8.
De estas definiciones vemos que las variables lingüísticas son extensiones de las variables
numéricas en el sentido de que permiten tomar conjuntos difusos como sus valores; ver la
figura 2.9.
2.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 25
lenta

media rápida

0
1
35 55 75 V
max
Velocidad del auto en
(mph)

Figura 2.8: La velocidad de un auto como una variable lingüística puede tomar tres conjuntos
difusos.
U U
Variable numérica Variable lingüística
Figura 2.9: De la variable numérica a la variable lingüística.
26 Lógica difusa y relación difusa
Introduciendo el concepto de variables lingüísticas, podemos formular descripciones vagas
del lenguaje natural en términos matemáticos precisos. Este es el primer paso para incorporar
el conocimiento humano dentro de los sistemas de ingeniería en una manera sistemática y
eficiente.
2.2.2. Reglas difusas SI-ENTONCES (IF-THEN)
En los sistemas difusos y de control, el conocimiento humano se representa en términos
de reglas SI-ENTONCES. Una regla difusa SI-ENTONCES es una declaración expresada
como
SI hproposición difusai , ENTONCEShproposición difusai (2.28)
Proposiciones Difusas
Existen dos tipos de proposiciones: las proposiciones difusas atómicas y las proposiciones
difusas compuestas. Una proposición difusa atómica es una declaración simple
b x es A (2.29)
donde b x es una variable lingüística, y A es un valor lingüístico de b x (esto es, A es un
conjunto difuso definido en el dominio físico de b x). Por ejemplo, si b x representa la velocidad
del auto del ejemplo anterior, se tienen las siguientes proposiciones difusas (las primeras tres
son proposiciones atómicas difusas y las últimas tres son proposiciones compuestas difusas):
b x es L (2.30)
b x es M (2.31)
b x es R (2.32)
b x es L o b x no es M (2.33)
b x no es L y b x no es R (2.34)
(b x es L y b x no es R) o b x es M (2.35)
2.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 27
donde L, M y R denotan los conjuntos difusos "lento", "medio" y rápido", respectiva-
mente.
Se puede notar que en una proposición compuesta difusa, las proposiciones atómicas
difusas son independientes, esto es, las x´s en la misma proposición de (2.33)-(2.35) pueden
ser diferentes variables. En realidad, las variables lingüísticas en una proposición difusa son
en general diferentes. Por ejemplo sea x la velocidad de un auto y y =
·
x la aceleración
del auto, entonces si se define el conjunto alta (A) para la aceleración, se tiene la siguiente
proposición difusa compuesta
b x es R y b y es A
Por consiguiente, las proposiciones difusas deben entenderse como relaciones difusas. Se
pueden determinar las funciones de pertenencia para estas relaciones.
Las reglas difusas combinan uno o más conjuntos difusos de entrada, llamados an-
tecedentes o premisas, y les asocian un conjunto difuso de salida, llamado consecuente
o consecuencia. Los conjuntos difusos de la premisa se asocian mediante conjuntivas lóg-
icas como y, o, etc. Una regla típica, de tipo IF-THEN, para un sistema de control sería
"Si error es positivo_pequeño y derivada_de_error es negativo_pequeño Entonces acción es
positiva_pequeña", que se suele expresar abreviadamente mediante expresiones del tipo Si
E es PP y dE es NP Entonces U es PP.
Las reglas difusas permiten expresar el conocimiento que se dispone sobre la relación
entre antecedentes y consecuentes. Para expresar este conocimiento de forma completa nor-
malmente se precisa de varias reglas, que se agrupan formando lo que se conoce como una
base de reglas, es decir, el conjunto de reglas que expresan las relaciones conocidas entre
antecedentes y consecuentes.
La base de reglas se puede representar bien como una tabla de las reglas que la forman, o
bien como una memoria asociativa difusa o FAM(Fuzzy Associative Memory). Las FAM
son matrices que representan la consecuencia de cada regla definida para cada combinación
de dos entradas. Las FAM permiten realizar una representación gráfica clara de las relaciones
entre dos variables lingüísticas de entrada y la variable lingüística de salida, pero requiere
que se indique explícitamente todas las reglas que se pueden formar con estas dos variables
28 Lógica difusa y relación difusa
de entrada. Cuando el número de conjuntos de cada una de las particiones de entrada crece
las FAM se hacen difícilmente manejables. Es posible también definir FAM de más de dos
dimensiones, pero su tamaño se hace rápidamente excesivo y son más difíciles aún de manejar.
En su lugar se suele trabajar con varias FAM de dimensión dos, para así definir subconjuntos
de reglas que asocien las entradas de dos en dos en la base de reglas general [41].
Formalmente, una base de reglas difusa es una colección de reglas R
(l)
con el formato
R
(l)
: IF bx
1
is F
l
1
and...and bx
n
is F
l
n
THEN by is G
l
(2.36)
donde F
/
1
y G
l
son conjuntos difusos en U
i
⊂ < y V⊂ <, respectivamente, y b x =(b x
1,
. . . , b x
n
)
T

U
1
×· · · ×U
n
e b y ∈V son variables lingüísticas. Este formato de reglas se conoce como difuso
puro o de tipo Mamdani, por ser quien primero las propuso en 1974 para realizar un
controlador difuso que estabiliza un sistema en torno a su punto de trabajo. Otro formato
frecuente para las reglas es el llamado de tipo Sugeno. En este caso, la función de salida es
una combinación lineal de las variables de entrada, o en un caso más general, una función
genérica de las variables de entrada.
R
(l)
: IF bx
I
is F
/
1
and...and bx
n
is F
/
n
THEN by
l
= f
l
(x) (2.37)
Si llamamos M al número de reglas IF- THEN (SI-ENTONCES) de la base de reglas
entonces l = 1, 2, ..., M en las ecuaciones (2.36) y (2.37). El vector x representa el conjunto de
las entradas, mientras que y es la salida del sistema difuso. Los sistemas difusos descritos con
n entradas x
i
, y una sola salida y, se conocen como MISO (Multiple Input Single Output),
mientras que los que tienen varias salidas (de 1 hasta k) se conocen como MIMO (Multiple
Input Multiple Output). Para estos últimos sistemas, se puede generalizar el formato anterior
de las reglas, o bien descomponerlo en k sistemas de tipo MISO.
2.2.3. La Lógica Difusa y el Razonamiento Aproximado
La lógica es el estudio de los métodos y principios del razonamiento donde el razonamiento
significa obtener nuevas proposiciones de las ya existentes.
2.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 29
En la lógica clásica las proposiciones pueden ser ciertas o falsas, es decir, el valor real de
una proposición es 0 o 1.
La lógica difusa generaliza la lógica clásica de dos valores permitiendo que los valores de
una proposición sea cualquier número en el intervalo [0,1].
Esta generalización nos permite realizar un razonamiento aproximado, esto es, deducir
conclusiones imprecisas (proposiciones difusas) a partir de una colección de premisas impre-
cisas (proposiciones difusas).
Modus Ponens Generalizado y Modus Tollens Generalizado
Las reglas difusas son básicamente de tipo IF-THEN (SI-ENTONCES) y expresan una
relación o proposición difusa. En lógica difusa el razonamiento no es preciso, sino aproximado,
lo cual quiere decir que se puede inferir de una regla una conclusión aunque el antecedente
(premisa) no se cumpla plenamente. Existen dos métodos básicos de inferencia entre reglas
o leyes de inferencia, el modus ponens generalizado (GMP) y el modus tollens
generalizado (GMT), que representan extensiones o generalizaciones del razonamiento
clásico. El GMP se conoce como razonamiento directo y puede resumirse de la forma
siguiente:
(Conocimiento): Si x es A Entonces y es B
(Hecho): b x es A’
–––––––––––––––––––—
(Consecuencia): b y es B’
Donde A, A’, B Y B’ son conjuntos difusos. Esta relación se expresa también como B’=
A’ ◦ R.
El GMT se conoce como razonamiento inverso y puede resumirse de la forma
siguiente:
(Conocimiento): Si b x es A Entonces b y es B
(Hecho): b y es B’
––––––––––––––––––––-
(Consecuencia): b x es A’
30 Lógica difusa y relación difusa
Lo que se expresa como A’= B’◦ R
Las matemáticas difusas proporcionan un punto de inicio y un lenguaje para los sistemas
difusos y el control difuso. Las matemáticas difusas son un campo enorme donde sus princi-
pios se han desarrollado para reemplazar los conjuntos de la teoría matemática clásica por
conjuntos difusos. De esta forma la teoría de la matemática clásica se puede transformar
en matemática difusa, observando el nacimiento de palabras como topología difusa, álgebra
difusa, análisis difuso, etc. Estos principios y conceptos son muy útiles dentro de los sistemas
difusos y del control difuso.
En el siguiente capítulo se citan algunos conceptos básicos de los sistemas difusos y del
control difuso.
Capítulo 3
Sistemas Difusos y Control Difuso
Podemos observar que los principios de la lógica y de la matemática difusa son usados para
desarrollar los sistemas de control difuso, de estos prinicipios se derivan fórmulas matemáticas
compactas que nos ayudan a representar los diferentes tipos de sistemas difusos.
3.1. Sistemas Difusos
Una de las principales aplicaciones de la lógica difusa es el diseño de sistemas de control
que, a partir de unas entradas, deben generar unas salidas para actuar sobre determinados
mecanismos. Un ejemplo podría ser el sistema de control para regular la velocidad de un
ventilador en función de la temperatura ambiente. En este caso, la única entrada del sistema
sería el valor de la temperatura, por ejemplo en grados centígrados, y la única salida, el valor,
en revoluciones por minuto (rpm), de la velocidad necesaria del ventilador para conseguir
una temperatura ideal.
En años recientes el campo de los sistemas difusos y el control ha tenido un progreso
acelerado. Motivados por el éxito del control difuso en productos de consumo y en el con-
trol de procesos industriales, ha habido un incremento en la cantidad de trabajos sobre los
estudios de los sistemas difusos y el control difuso.
Los sistemas difusos son sistemas basados en el conocimiento o en reglas. El corazón de un
32 Sistemas Difusos y Control Difuso

1
45 55 65
Función de pertenencia para
“alta”
Velocidad (mph)
Figura 3.1: Función de pertenencia para ”alta”, donde el eje horizontal representa la velocidad
del auto y el eje vertical representa el valor miembro para ”alta”.
sistema difuso es la base del conocimiento que consiste de las llamadas reglas SI-ENTONCES
(IF-THEN rules). Una regla SI-ENTONCES es una declaración SI-ENTONCES en la cual
algunas palabras son caracterizadas por funciones de pertenencia continuas. Por ejemplo, la
siguiente es una regla difusa SI-ENTONCES.
SI la velocidad de un auto es alta,
ENTONCES se aplica menor fuerza al acelerador
(3.1)
donde las palabras ”alta” y ”menor” son caracterizadas por las funciones de pertenencia
mostradas en la figura 3.1 y 3.2 respectivamente. Un sistema difuso es construido de una
colección de reglas difusas SI-ENTONCES.
El punto de inicio para construir un sistema difuso es obtener una colección de reglas
difusas basadas en el conocimiento humano de los expertos. El siguiente paso es combinar es-
tas reglas en un sistema simple. Los diferentes sistemas difusos emplean diferentes principios
de esta combinación.
Existen tres tipos de sistemas difusos empleados comúnmente:
1. sistemas difusos puros o de Mamdani,
2. sistemas difusos Takagi-Sugeno-Kang (TSK), y
3.1 Sistemas Difusos 33

1
Función de pertenencia para
“menor”
Fuerza al acelerador
Figura 3.2: Función de pertenencia para ”menor”, donde el eje horizontal representa la fuerza
aplicada al acelerador y el eje vertical representa el valor miembro para ”menor”.
3. sistemas difusos con fuzzyficador y defuzzyficador.
La configuración básica de un sistema difuso puro se muestra en la figura 3.3. La base
de reglas difusas representa la colección de reglas SI-ENTONCES. Por ejemplo, para el
controlador de un auto, la base de reglas difusas consiste de las siguientes tres reglas:
SI la velocidad es baja,
ENTONCES se aplica más fuerza al acelerador
(3.2)
SI la velocidad es media,
ENTONCES se aplica una fuerza normal al acelerador
(3.3)
SI la velocidad es alta,
ENTONCES se aplica menor fuerza al acelerador
(3.4)
el dispositivo de inferencia difusa combina las reglas difusas SI-ENTONCES dentro de
un mapeo de conjuntos difusos en el espacio de entrada U ⊂ R
n
a conjuntos difusos en el
espacio de salida V ⊂ R basado en principios de la lógica difusa. Si existiera una línea de
retroalimentación en la figura 3.3, el sistema se transforma en un sistema dinámico difuso.
El principal problema con el sistema difuso puro es que sus entradas y salidas son conjun-
tos difusos (palabras en lenguajes naturales), por el contrario en los sistemas de ingeniería
34 Sistemas Difusos y Control Difuso
Base de Reglas
Difusas
Dispositivo de
inferencia difusa
x en U y en V
Figura 3.3: Configuración básica de los sistemas difusos puros.
las entradas y las salidas son variables valuadas en la realidad. Para resolver este problema,
Takagi, Sugeno y Kang propusieron otro sistema difuso cuyas entradas y salidas son variables
valuadas en la realidad.
Para considerar las reglas difusas SI-ENTONCES en la forma de 3.1, el sistema Takagi-
Sugeno-Kang (TSK) utiliza reglas en la siguiente forma:
SI la velocidad bx de un auto es alta,
ENTONCES la fuerza del acelerador es b y = cx
(3.5)
donde la palabra ”alta” tiene el mismo significado que en 3.1, y c es una constante.
Comparando 3.5 y 3.1 podemos ver que la parte ENTONCES de la regla cambia de una
descripción utilizando palabras en lenguajes naturales a una fórmula matemática simple.
Este cambio hace más fácil combinar las reglas. En realidad, el sistema difuso Takagi-Sugeno-
Kang es una media ponderada tomada de los valores en las partes ENTONCES de las reglas.
La configuración básica del sistema difuso Takagi-Sugeno-Kang se muestra en la figura 3.4.
Los problemas principales con el sistema difuso Takagi-Sugeno-Kang son: (i) su parte
ENTONCES es una fórmula matemática y por tanto no puede proporcionar un marco natural
que represente el conocimiento humano, y (ii) no hay mucha libertad para aplicar diferentes
principios en lógica difusa, debido a esto la versatilidad de los sistemas difusos no está
muy bien representada en este marco. Para resolver estos problemas empleamos los sistemas
difusos con fuzzyficador y defuzzyficador, su configuración se muestra en la figura 3.5.
3.1 Sistemas Difusos 35
Base de Reglas
difusas
Media
ponderada
x en U y en V
Figura 3.4: Configuración básica del sistema difuso Takagi-Sugeno-Kang.
Base de Reglas
Difusa
Dispositivo de
inferencia difusa
x en U
y en V
Fuzzyficador Defuzzyficador
Conjuntos
difusos en U
Conjuntos
difusos en V
Figura 3.5: Configuración básica de los sistemas difusos con fuzzyficador y defuzzyficador.
36 Sistemas Difusos y Control Difuso
Sistema
difuso
Proceso
Figura 3.6: Sistema difuso como controlador en lazo abierto.
Sistema
Difuso
Proceso
Figura 3.7: Sistema Difuso como controlador en lazo cerrado.
Los sistemas difusos mostrados en la figura 3.5 pueden ser usados como controladores en
lazo abierto o controladores en lazo cerrado mostrados en las figuras 3.6 y 3.7.
3.2. Control Difuso
Los sistemas expertos de control difuso basados en reglas, conocido como controladores
difusos o FLC (Fuzzy Logic Controllers), son sin duda la aplicación más extendida de la
lógica difusa. De forma general, podemos observar en la figura 3.8, que para controlar un
proceso o sistema se emplea un módulo controlador, que recibe como entradas una o varias
variables de control llamadas generalmente referencias,
__
R, y una o varias variables de salida
del propio proceso,
__
S , produciendo como salidas una o varias variables, que se conocen como
actuadores
__
A. Normalmente el objetivo del control es mantener
__
R =
__
S .
La estructura típica de un controlador basado en un sistema difuso puede verse en la
3.2 Control Difuso 37

Controlador


Proceso

_
R
_
A
_
S
Figura 3.8: Control directo de un proceso o sistema.
P
r
e
p
r
o
c
e
s
a
d
o

P
o
s
p
r
o
c
e
s
a
d
o

_
R
_
S
FLC
Controlador
_
X
_
Y
_
A
Figura 3.9: Estructura de un controlador (el núcleo FLC es el controlador difuso).
figura 3.9.
Es de destacar que el control difuso, que es la principal aplicación de los sistemas difusos,
aparte de ser un tema de investigación, resulta muy importante desde el punto de vista
industrial, en cuyo campo existen desde hace tiempo infinidad de aplicaciones para estos
sistemas en funcionamiento.
La arquitectura del controlador a utilizar depende de la aplicación concreta a llevar a
cabo. No resulta fácil realizar una clasificación genérica de todas las arquitecturas posibles
de controladores basados en lógica difusa, sin embargo, existen grandes grupos dentro de
los cuales podemos mencionar los controladores difusos directos sin optimización y los con-
38 Sistemas Difusos y Control Difuso
Base de conocimiento
Fuzzyficación
Dispositivo de
inferencia
Defuzzyficación
Planta
Figura 3.10: Esquema representativo de un control difuso.
troladores difusos directos con optimización, controladores difusos híbridos en los cuáles se
incluyen los formados por la combinación de lógica difusa con redes neuronales y sistemas
expertos. Actualmente, existe una gran cantidad de propuestas dentro de la combinación
de la capacidad de aprendizaje de las redes neuronales y del procesamiento de información
imprecisa de la lógica difusa.
En el área del control inteligente [25], la lógica difusa se ha utilizado para resolver de
forma exitosa una gran variedad de problemas de diversa complejidad, en general las etapas
más importantes utilizadas por un control difuso son las mostradas en la figura 3.10.
Las etapas mostradas en la figura 3.10 son:
a) La fuzzyficación toma valores de la planta y los interpreta como valores lingüísticos.
b) El dispositivo de inferencia realiza los planteamientos lógicos necesarios para la toma
de decisiones.
c) La defuzzyficación consiste en la conversión de datos lingüísticos a datos numéricos,
mediante una ponderación y normalización de las sentencias lógicas antecedentes.
d) La base de conocimiento, incluye los parámetros necesarios para la fuzzyficación,
inferencia y defuzzyficación, los cuales pueden ser de naturaleza heurística u optimizados
mediante alguna técnica particular.
3.3 El doble papel de los sistemas difusos 39
3.2.1. Reglas Difusas
Las reglas difusas combinan uno o más conjuntos difusos de entrada, llamados an-
tecedentes o premisas, y les asocian un conjunto difuso de salida, llamado consecuente o
consecuencia. Los conjuntos difusos de la premisa se asocian mediante conjuntivas lógicas
como y, o, etc. Una regla típica, de tipo SI-ENTONCES, para un sistema de control sería
"Si error es positivo_pequeño y derivada _de_error es negativo_pequeño Entonces acción
es positiva_pequeña", que suele expresar abreviadamente mediante expresiones de tipo Si E
es PP y dE es NP Entonces U es PP.
Las reglas difusas permiten expresar el conocimiento que se dispone sobre la relación
entre antecedentes y consecuentes. Para expresar este conocimiento de forma completa nor-
malmente se precisa de varias reglas, que se agrupan formando lo que se conoce como una
base de reglas.
La base de reglas se puede representar como una tabla de las reglas que la forma, o bien
como una memoria asociativa difusa o FAM (fuzzy Associative Memory), que son matrices
representando la consecuencia de cada regla definida para cada combinación de dos entradas.
3.2.2. Dispositivo de Inferencia Difusa
Se llaman dispositvos de inferencia difusa a los sistemas que interpretan las reglas
de tipo IF-THEN de una base de reglas, con el fin de obtener los valores de salida a partir de
los actuales valores de las variables lingüísticas de entrada al sistema. En un sistema difuso
las reglas del tipo R
(l)
: IF b x
1
is F
l
1
and...and b x
n
is F
l
n
THEN b y is G
l
donde F
l
1
y G
l
son
conjuntos difusos en U
i
⊂ R y V ⊂ R b x = (b x
i,...,
b x
n
)
T
∈ U
i
× ... × U
n
e b y ∈ V son variables
lingüísticas. Se interpreta como una implicación difusa de F
l
1
× ... × F
l
n
→G
l
en U × V.
3.3. El doble papel de los sistemas difusos
Por una parte, los sistemas difusos son sistemas basados en reglas construidas a partir
de una colección de reglas lingüísticas, y por otra parte, los sistemas difusos son mapeos no
40 Sistemas Difusos y Control Difuso
lineales que en muchos casos se pueden representar por fórmulas precisas y compactas como
en [41]:
f (x) =
P
M
l=1
y
l
(
Y
n
i=1
µ
A
l
i
(x))
P
M
l=1
(
Y
n
i=1
µ
A
l
i
(x))
la cuál representa un sistema de lógica difusa con defuzzyficador por media de centros,
implicación difusa por la regla del producto y fuzzyficador singleton.
Una contribución importante de la teoría de sistemas difusos es proporcionar un pro-
cedimiento sistemático para transformar un conjunto de reglas lingüísticas a un mapeo no
lineal.
Debido a que los mapeos no lineales son fáciles de implementar los sistemas difusos han
encontrado su camino dentro de una variedad de aplicaciones en la Ingeniería.
3.4. Los sistemas difusos como aproximadores Univer-
sales
Como se ha mencionado, ciertos tipos de sistemas difusos se pueden escribir como fórmu-
las no lineales compactas [41]. Por una parte estas fórmulas no lineales compactas simplifican
los cálculos de los sistemas; y por otra parte, nos proporcionan una oportunidad para analizar
los sistemas difusos con más detalle. Podemos ver que los sistemas difusos son tipos particu-
lares de funciones no lineales, por tanto, no hay ningún problema si los sistemas difusos son
usados como controladores, ejecutor de decisiones, procesadores de señales o cualquier otro
sistema, es interesante conocer la capacidad de los sistemas difusos desde un punto de vista
de aproximación de función. Por ejemplo, ¿qué tipos de funciones no lineales pueden repre-
sentar o aproximar los sistemas difusos y con qué grado de aproximación? Pero si los sistemas
difusos pueden aproximar cualquier función no lineal en una aproximación arbitraria, por
tanto podrían ser muy útiles en una amplia variedad de aplicaciones.
El decir que los sistemas difusos son aproximadores universales, nos indica que pueden
aproximar cualquier función sobre un conjunto compacto a una aproximación arbitraria. Este
3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 41
resultado muestra la existencia de un sistema difuso óptimo, sin embargo, no nos provee de
métodos para encontrarlo. De hecho, encontrar el sistema difuso es más difícil que probar su
existencia. Dependiendo de la información proporcionada, podemos o no encontrar el sistema
difuso.
Para responder la pregunta de cómo encontrar el sistema difuso óptimo, primero es nece-
sario ver qué información está disponible para la función no lineal g (x) : U ⊂ R
n
→R, que
se nos pide aproximar. En general, podemos encontrar tres situaciones:
1. La fórmula analítica de g (x) es conocida.
2. La fórmula analítica de g (x) es desconocida, pero para cualquier x ∈ U podemos
determinar la g (x) correspondiente. Esto es, g (x) es una caja negra -conocemos el
comportamiento entrada-salida de g (x) pero no conocemos los detalles internos.
3. La fórmula analítica de g (x) es desconocida y sólo se proporciona un número limitado
de pares entrada-salida (x
j
, g (x
j
)), donde x
j
∈ U no se pueden elegir arbitrariamente.
Para el diseño de los sistemas difusos existen diferentes métodos, de acuerdo a la infor-
mación que se dispone.
3.5. Diseño de sistemas Difusos empleando el Entre-
namiento del Gradiente Descendente
Hasta ahora se han establecido las bases de la lógica y sistemas difusos y se han presenta-
do los sistemas difusos de control, quizá la aplicación más importante, especialmente a nivel
industrial. Lejos de ser entes estáticos los sistemas difusos pueden ser entrenados para opti-
mizar su buen funcionamiento. Los sistemas difusos de control son aproximadores funcionales
genéricos, es decir, dado cierto nivel de error, se puede encontrar un controlador difuso que
aproxime cualquier función con un error menor al establecido, y para ello se pueden emplear
diversas técnicas, algunas procedentes del campo de las redes neuronales (sistemas neuro
borrosos), y otras de otros campos, como los algoritmos genéticos [19], [40].
42 Sistemas Difusos y Control Difuso
Existen numerosos algoritmos de aprendizaje que se pueden aplicar a los sistemas difusos,
algunos de los más importantes son:
- Entrenamiento del gradiente descendente.
- Algoritmos genéticos
- Mínimos cuadrados.
- Tablas de búsqueda.
A continuación se presenta el algoritmo de aprendizaje del gradiente descendente.
3.5.1. Estructura del Sistema Difuso
Se ha observado que en el esquema de tablas de búsqueda, las funciones de pertenencia
se fijan en el primer paso y no dependen de los pares entrada-salida; es decir, las funciones
de pertenencia no se optimizan de acuerdo a los pares entrada-salida. Desde un punto de
vista conceptual, el diseño de sistemas difusos a partir de los pares entrada-salida podrían
ser clasificados dentro de dos tipos de aproximación. En la primera aproximación, las reglas
difusas SI-ENTONCES (IF-THEN) se generan primero de los pares entrada-salida, y el sis-
tema difuso se construye a partir de estas reglas de acuerdo a cierta elección del dispositivo
de inferencia difusa, el fuzzyficador y defuzzyficador. En la segunda aproximación, la estruc-
tura del sistema difuso se especifica primero de algunos parámetros en la estructura libres de
cambio, y así, estos parámetros se determinan de acuerdo con los pares entrada-salida [41].
Primero, se especifica la estructura del sistema difuso que se diseñará. Si elegimos un
sistema difuso con un dispositivo de inferencia de producto, un fuzzyficador singleton, de-
fuzzyficador de promedio de centros y función de pertenencia Gaussiana. De esta forma
asumimos que el sistema a diseñar tiene la siguiente forma:
f (x) =
P
M
l=1
y
l
·
Q
n
i=1
exp
µ

³
x
i
−x
l
i
σ
l
i
´
2
¶¸
P
M
l=1
·
Q
n
i=1
exp
µ

³
x
i
−x
l
i
σ
l
i
´
2
¶¸ (3.6)
donde M es fija, y
l
, x
l
i
y σ
l
i
son parámetros libres (elegimos a
l
i
= 1). Aunque la estructura del
sistema difuso se elige como en (3.6) el sistema difuso no se ha podido diseñar debido a que
3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 43
f=a/b
y
-1
……
y
-M
……

……
……
x
1
x
n
µ
x
µ= exp[-(x-x
-
i
1
)
2
/ σ
i
12
]
z
1

z
M
capa 3
capa 2
capa 1
f
a b
Figura 3.11: Representación de una red para el sistema difuso.
los parámetros y
l
, x
l
i
y σ
l
i
no se han especificado. Una vez elegidos los parámetros y
l
, x
l
i
y
σ
l
i
, podemos obtener el sistema difuso diseñado; esto es, el diseñar el sistema difuso equivale
ahora a determinar los parámetros y
l
, x
l
i
y σ
l
i
.
Para determinar estos parámetros de forma óptima, podemos representar el sistema difuso
f (x) de (3.6) como una red con alimentación hacia adelante. Específicamente, el mapeo de
la entrada x ∈ U ⊂ R
n
a la salida f (x) ∈ V ⊂ R puede ser implementado de acuerdo
a las siguientes operaciones, primero, la entrada x pasa a través de un operador producto
Gaussiano para ser z
l
=
Q
n
i=1
exp
µ

³
x
i
−x
l
i
σ
l
i
´
2

así, z
l
pasa a través de un operador suma
y un operador suma de promedios para obtener b =
P
M
l=1
z
l
y a =
P
M
l=1
y
l
z
l
finalmente, la
salida del sistema difuso se obtiene como f (x) = a/b. Estas tres operaciones se muestran en
la figura 3.11 como una red de tres capas con alimentación hacia adelante.
44 Sistemas Difusos y Control Difuso
3.5.2. Diseño de los Parámetros por el Gradiente Descendente
Paso 1. Determinación de la Estructura y colocación de los parámetros ini-
ciales. Elegir el sistema difuso en la forma de (3.6) y determina M. M más grande
produce más parámetros y más cálculos, pero proporciona una mejor exactitud de la
aproximación. Especificar los parámetros iniciales y
l
(0) , x
l
i
(0) y σ
l
i
(0). Estos parámet-
ros iniciales se pueden determinar de acuerdo a las reglas lingüísticas de los expertos, o
se eligen de tal manera que las funciones de pertenencia correspondientes cubren uni-
formemente los espacios de entrada y salida. Para aplicaciones particulares se pueden
emplear métodos especiales.
Paso 2. La entrada presente y cálculo de la salida del sistema difuso. Para un
par entrada-salida dado (x
p
0
; y
p
0
), p = 0, 1, 2, ..., y en la q-ésima etapa de entrenamiento
q = 0, 1, 2, ..., el presente x
p
0
a la capa de entrada del sistema difuso en la figura 3.11 y
calcula las salidas de las Capas 1-3. Esto es, calcula
z
l
=
n
Y
i=1
exp(−(
x
p
0i
−x
l
i
(q)
σ
l
i
(q)
)
2
) (3.7)
b =
M
X
l=1
z
l
(3.8)
a =
M
X
l=1
y
l
(q) z
l
(3.9)
f = a/b (3.10)
Paso 3. Actualización de parámetros. Usar el algoritmo de entrenamiento (3.11),
(3.12), y (3.13) para calcular los parámetros y
l
(q + 1) , x
l
i
(q + 1) y σ
l
i
(q + 1) , donde
y = y
p
0
, y z
l
, b, a y f se calculan como en el paso 2.
Paso 4. Repetir yendo al Paso 2 con q = q +1, hasta que el error |f −y
p
0
| es menor al
número pre especificado , o hasta que q sea igual al número especificado.
3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 45
Paso 5. Repetir yendo al Paso 2 con p = p + 1; es decir, actualizar los parámetros
usando el siguiente par entrada-salida (x
p+1
0
; y
p+1
0
).
Paso 6. Si es deseable y factible, fijar p = 1 y hacer los Pasos 2-5 nuevamente hasta que
el sistema difuso diseñado sea satisfactorio. Para el control en línea y la identificación
del sistema dinámica, este paso no es factible porque los pares de entrada-salida se pro-
porcionan uno-por-uno en una forma de tiempo-real. Para problemas de reconocimiento
de patrones donde los pares entrada-salida se proporcionan fuera de línea, este paso es
usualmente deseable.
Siguiendo estos pasos se puede diseñar un sistema difuso f (x) en la forma (3.6) tal que
el error e
p
=
1
2
[f (x
p
0
) −y
p
0
]
2
sea mínimo. De esta forma se obtienen los parámetros y
l
, x
l
i
y
σ
l
i
, tal que e
p
se minimice.
y
l
(q + 1) = y
l
(q) −α(f −y)
1
b
z
l
(3.11)
donde l = 1, 2, ..., M, q = 0, 1, 2, ...
x
l
i
(q + 1) = x
l
i
(q) −α
(f −y)
b
¡
y
l
(q) −f
¢
z
l
2
¡
x
p
0i
−x
l
i
(q)
¢
σ
l2
i
(q)
(3.12)
donde i = 1, 2, ..., n, l = 1, 2, ..., M, q = 0, 1, 2, ...
σ
l
i
(q + 1) = σ
l
i
(q) −α
∂e
∂σ
l
i
|
q
= σ
l
i
(q) −α
(f−y)
b
¡
y
l
(q) −f
¢
z
l
2
(
x
p
0i
−x
l
i
(q)
)
2
σ
l3
i
(q)
(3.13)
donde i = 1, 2, ..., n, l = 1, 2, ..., M, q = 0, 1, 2, ...
Debido a que el algoritmo de entrenamiento (3.11), (3.12), y (3.13) es un algoritmo
del gradiente descendente, la opción de los parámetros iniciales es crucial para el éxito del
algoritmo. Si los parámetros iniciales son cercanos a los parámetros óptimos, el algoritmo
tiene una oportunidad buena para converger a la solución óptima; por otra parte, el algoritmo
puede converger a una solución no óptima o incluso diverja. La ventaja de usar el sistema
difuso es que los parámetros y
l
, x
l
i
y σ
l
i
, tienen un significado físico claro y tenemos los métodos
46 Sistemas Difusos y Control Difuso
para escoger los valores iniciales adecuados para ellos. Tener en mente que los parámetros
y
l
son los centros de los conjuntos difusos en las partes ENTONCES de las reglas y, los
parámetros x
l
i
y σ
l
i
son los centros y anchuras de los conjuntos difusos Gaussianos en las
partes SI de las reglas. Por consiguiente, dado un sistema difuso diseñado en la forma de
(3.6), podemos recuperar las reglas difusas SI-ENTONCES que constituyen al sistema difuso.
Estas reglas difusas SI-ENTONCES pueden ayudar para explicar el diseño del sistema difuso
de una manera amigable.
Este método se puede aplicar al problema de identificación de sistemas dinámicos no
lineales.
Identificación de sistemas dinámicos no lineales
El problema de identificación consiste en encontrar un modelo conveniente de identi-
ficación y ajustar los parámetros del modelo para optimizar una función de rendimiento
basado en el error entre la planta y la salida del modelo de identificación. La Identificación
de sistemas es un proceso de determinación de un modelo apropiado para el sistema basado
en mediciones proporcionadas por los sensores. La Identificación es un proceso importante ya
que muchas aproximaciones en ingeniería dependen del modelo del sistema. Debido a que los
sistemas difusos son poderosos aproximadores universales, es razonable usarlos como modelos
de identificación para sistemas no lineales. Podemos emplear al sistema difuso (3.6) provisto
con el algoritmo de entrenamiento (3.11), (3.12) y (3.13) para aproximar componentes no
lineales desconocidas en sistemas dinámicos.
Considerando el sistema dinámico no lineal en tiempo discreto
y (k + 1) = f (y (k) , . . . , y (k −n + 1) ; u(k) , . . . , u (k −m+ 1))
donde f es una función desconocida que queremos identificar, u e y son la entrada y salida
del sistema, respectivamente, n y m son enteros positivos. La tarea es identificar la función
f desconocida basada en los sistemas difuso.
Haciendo
b
f (x) el sistema difuso en la forma (3.6). Reemplazamos f (x) por
b
f (x) se
3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 47

planta f

sistema difuso
^
f
^
y
y
e u
Figura 3.12: Esquema básico de identificación de un modelo para un sistema dinánico no
lineal usando el sistema difuso.
obtiene el modelo de identificación siguiente:
b y (k + 1) =
b
f (y (k) , . . . , y (k −n + 1) ; u(k) , . . . , u (k −m+ 1))
Ahora se deben ajustar los parámetros en
b
f (x) tal que la salida del modelo de identificación
b y (k + 1) converja a la salida del sistema y (k + 1) conforme k tiende a infinito. La figura
3.12 muestra este esquema de identificación.
Los pares entrada-salida son (x
k+1
0
; y
k+1
0
), donde x
k+1
0
= (y (k) , . . . , y (k −n + 1) ; u(k) , . . . , u (k −m+ 1
y
k+1
0
= y (k + 1) ,y k = 0, 1, 2, .... Debido a que el sistema es dinámico, estos pares entrada-
salida se recolectan cada momento. La operación del proceso de identificación es el mismo
que en los pasos de 1 a 5.
En este capítulo hemos visto que los sistemas difusos consisten de cuatro componentes,
base de reglas difusa, dispositivo de infierencia difusa, fuzzyficador y defuzzyficador como lo
muestra la figura 3.10, para poder desarrollar los sistemas de control difuso son necesarios los
48 Sistemas Difusos y Control Difuso
conceptos de la matemática difusa, y de esta forma se pueden derivar fórmulas matemáticas
compactas que nos representes sistemas complejos con bastante aproximación.
En este capítulo se han presentado los conceptos fundamentales de los sistemas difusos,
que son necesarios para el diseño de controladores difusos. Hoy en día la tecnología avanza
de forma acelerada, incorporándose nuevas estrategias de control de sistemas, de esta forma
se han fusionado técnicas de control como son las redes neuronales y los conceptos de los
sistemas difusos, pudiendo mezclar la capacidad de procesamiento de información de las
redes neuronales y la sencillez de expresión los sistemas difusos, de esta forma han surgido
conceptos como las redes neuronales difusas o redes neuro difusas, identificadores difusos,
etc. En el siguiente capítulo se pretende mostrar algunas alternativas en la identifcación de
sistemas no lineales complejos empleando los principios de los sistemas difusos de control.
Capítulo 4
Observadores Difusos
Hoy en día uno de los retos principales del ser humano es crear computadoras más
inteligentes capaces de pensar por sí mismas, que puedan aprender de la experiencia y no
simplemente de la repetición de ciertas instrucciones que un programador de sistemas le
asigne. El afán de encontrar nuevas oportunidades de solución a este y otros problemas
interesantes le ha permitido crear modelos de procesamiento de información que sean capaces
de imitar el comportamiento del cerebro humano, prueba de ello son las redes neuronales
y los sistemas difusos. Estos sistemas se han fusionado con el fin de crear nuevos medios
para la identificación de sistemas no lineales complejos [25]. En este capítulo se proponen
diferentes formas para la estimación de los estados internos de un sistema no lineal en base
a los observadores e identificadores difusos.
4.1. Introducción
Para el diseño de los sistemas de control, en ocasiones hacemos la consideración de que
todas las variables están disponibles para la retroalimentación. En la realidad esta suposición
no es muy cierta, debido a que las variables de estado no son accesibles para una medición
directa o debido a que no se cuenta con los sensores o transductores adecuados, resultan ser
muy caros o el número de ellos es limitado.
50 Observadores Difusos
Es importante señalar que debemos evitar diferenciar una variable de estado para generar
otra. En el diseño de los sistemas de control se pueden usar diferentes métodos para estimar
e identificar los estados internos de un sistema cuando sólo se tiene información de los datos
de entrada y salida de la planta, ejemplo de ello pueden ser los identificadores basados en
redes neuronales y sistemas difusos (identificadores neuronales difusos); otra opción son los
estimadores de estado como los observadores, en este caso los observadores difusos. Ambas
herramientas son adecuadas para encontrar los estados internos de un sistema que carece
de esta información.
En este capítulo se presentan dos formas diferentes para la estimación de los estados
internos de un sistema no lineal, el primero de ellos es por medio de la observación, en este
caso empleando un observador difusos tipo Takagi-Sugeno cuya salida es una combinación
lineal de las entradas del sistema, lo que simplifica la complejidad del problema [27]. El
segundo método que se utiliza para la estimación de los estados internos del sistema se
realiza empleando un observador libre de la estructura del modelo en combinación con una
red neuronal difusa, lo que permite identificar los estados internos del sistema, en este caso se
emplean los sistemas difusos tipo Mamdani que expresan el conocimiento previo disponible
sobre el sistema, expresando así el conocimiento adquirido durante el proceso de optimización.
4.2. Observadores
Existen métodos para estimar las variables de estado que no se miden sin un proceso de
diferenciación. La estimación de semejantes variables de estado por lo general se denomina
observación. En este caso, para aplicar la retroalimentación de estado, podemos diseñar
un dispositivo, llamado estimador de estado u observador de estado, así, la salida del
dispositivo generará un estimador del estado. Si el observador de estado capta todas las
variables de estado del sistema, sin importar si algunas de ellas están disponibles para una
medición directa, se denomina observador de estado de orden completo. Hay ocasiones en
las que un observador tal no es necesario, sólo se requiere de la observación de las variables
de estado que no se miden, pero no de aquellas que también se miden directamente. Por
4.3 Observadores Difusos 51
ejemplo, dado que las variables de salida son observables y se relacionan en forma lineal con
las variables de estado, no es necesario observar todas las variables de estado, sino sólo las n
- m variables de estado en donde n es la dimensión del vector de estado y m es la dimensión
del vector de salida.
Un observador que estima menos de n variables de estado, en donde n es la dimensión
del vector de estado, se denomina observador de estado de orden reducido o, simplemente,
observador de orden reducido. Si el observador de estado de orden reducido tiene el orden
mínimo posible, se denomina observador de estado de orden mínimo, u observador de orden
mínimo [34].
4.3. Observadores Difusos
Desde sus inicios hasta la actualidad el control difuso está ganando una increíble madurez.
Es muy conocido que muchos investigadores en el campo del control han realizado estudios
sobre los observadores lineales y no lineales, en cambio, los observadores difusos aún no han
atraído suficiente la atención de los expertos.
En [10] se puede ver una de las pocas investigaciones que existen con respecto a los
observador difusos. Se presenta un observador difuso para procesos no lineales, obtenido a
través de la ”interconectividad difusa” de observadores tipo Luenberger lineales locales. La
aproximación emplea técnicas de estabilidad robusta en particular la cuadrática para mostrar
la estabilidad cuadrática global del observador difuso. En esta aproximación no se asume la
linealidad de los procesos no lineales con respecto a las entradas, que generalmente se asume
para los observadores no lineales convencionales.
Las técnicas difusas han demostrado tener una efectividad exitosa en el control de pro-
cesos complejos, donde se han presentado resultados teóricos importantes.
Sin embargo, a pesar de los impresionantes resultados en modelado y control el problema
dual y muy importante de los observadores difusos no ha tenido suficiente atracción para
realizar los debidos estudios que merecen.
Los problemas relacionados con los observadores difusos podrían ser dirigidos por lo
52 Observadores Difusos
menos desde dos puntos de vista:
1. Estimar las funciones de pertenencia asociadas con diferentes variables de estado fijando
valores difusos y;
2. Construir en la línea de los modelos Takagi-Sugeno, observadores difusos globales no
lineales por medio de conectividad difusa de observadores locales lineales.
De acuerdo con la segunda opción, primero el espacio de estados es dividido en subespacios
difusos. Así, en cada subespacio difuso se define un modelo local lineal o afín y un observador
correspondiente tipo Luenberger. Finalmente, se da una ”interconectividad difusa” de los
modelos lineales locales usando el método de inferencia estándar Sugeno para obtener el
modelo global. Los modelos locales interconectados, generan modelos lineales inciertos con
incertidumbres correspondientes y no correspondientes. Estas incertidumbres representan la
interacción entre los modelos locales y dependen de la elección de las funciones de pertenencia.
Asumiendo algunas cotas en estas incertidumbres, se emplean técnicas de estabilización
cuadrática y funciones de Lyapunov suaves y continuas por tramos para deducir estabilidad
de las dinámicas globales del error.
Como sabemos los modelos Takagi-Sugeno se representan por un conjunto finito de reglas
[10]:
R
i
p
: Si x
1
(t) ∈ L
1
i
, . . . , x
n
(t) ∈ L
i
n
Entonces P
i
:
(

x(t) = A
i
(t) +B
i
(t)
y = H
i
(t)
)
i = 1, . . . , M
(4.1)
donde x ∈ <
n
, u ∈ <
m
, y ∈ <
p
son respectivamente el estado, la entrada y las variables
de salida medibles. L
i
j
es un valor lingüístico de las variables difusas X
j
que representan las
variables de estado x
j
.Para cada valor lingüístico, L
i
j
, se asocia a un conjunto difuso
g
LX
i
j
.
Aquí se considera una subsecuencia I (con card(I) = ˜ n ≤ n) de 1, . . . , n y reescribiendo
4.4 Observador para un Sistema Difuso Takagi-Sugeno 53
(4.1):
R
i
p
: Si x
k
1
(t) ∈ L
i
k
1
, . . . , x
k
n
(t) ∈ L
i
k
n
Entonces P
i
:
(

x(t) = A
i
(t) +B
i
(t)
y = H
i
(t)
)
i = 1, . . . , M
(4.2)
con k
1
, k
2
, . . . , k
n
∈ I y suponemos que x
k
1
, x
k
2
, . . . , x
k
1
están disponibles para las mediciones
y permiten la partición (4.2). La tarea del observador es estimar n −I estados remanentes.
En base a los modelos locales P
i
, se pueden construir observadores locales tipo Luenberger
como:
R
i
O
: Si x
k
1
(t) ∈ L
i
k
1
, . . . , x
kn
(t) ∈ L
i
kn
Entonces O
i
:
_
_
_

b x(t) = A
i
b x(t) +L
i
H
i
(x − b x) +B
i
u(t)
b y = H
i
b x(t)
_
_
_
i = 1, . . . , M
(4.3)
donde O
i
representa un observador local asociado con el modelo local i-ésimo de (4.2) y
L
i
la ganancia del i-ésimo observador. b x ∈ <
n
, u ∈ <, b y ∈ <. Se puede notar que para la
definición de observadores locales O
i
, la partición difusa, en la parte "Si", está basada en la
variable del proceso x y no en b x.
4.4. Observador para un Sistema Difuso Takagi-Sugeno
Un observador de estado estima las variables de estado con base en las mediciones de
las variables de salida y de control. Aquí tiene una función importante el concepto de ob-
servabilidad. De hecho los observadores de estado pueden diseñarse si y sólo si satisfacen la
condición de observabilidad [34].
El vector de estado observado e x se usa en la retroalimentación del estado para generar
el vector de control deseado. Considere el sistema definido mediante
·
x = Ax +Bu (4.4)
54 Observadores Difusos
y = Cx (4.5)
Suponiendo que el estado x se aproximará mediante el estado e x del modelo dinámico

e x = Ae x+Bu +K
e
( y −Ce x) (4.6)
que representa el observador de estado. El observador de estado tiene y y u como entradas
y e x como salida. El último término del segundo miembro de esta ecuación es un término
de corrección que contiene la diferencia entre la salida y medida y la salida Ce x estimada.
La matriz K
e
funciona como una matriz de ponderación. El término de corrección vigila
el estado e x. Ante la presencia de una discrepancia entre las matrices A y B usadas en este
modelo y las del sistema real, la adición del término de corrección ayuda a reducir los efectos
producidos por la diferencia entre el modelo dinámico y el sistema real.
El orden del observador de estado es igual al del sistema. Suponiendo que el sistema
se define mediante las ecuaciones (4.4) y (4.5) y que el modelo del observador se define
mediante la ecuación (4.6).
Para obtener la ecuación de error del observador, se resta la ecuación (4.6) de la ecuación
(4.4).
·
x −

e x= Ax −Ae x−K
e
( Cx −Ce x)
= (A−K
e
C)(x−e x)
(4.7)
Definiendo la diferencia entre x y e x como el vector de error e , o
e = x−e x
así, la ecuación (4.7) se convierte en
·
e= (A−K
e
C)e (4.8)
A partir de (4.8) el comportamiento dinámico del vector de error se determina mediante los
valores característicos de la matriz A−K
e
C. Si la matriz A−K
e
C es estable, el vector de
4.4 Observador para un Sistema Difuso Takagi-Sugeno 55
error convergerá a cero para cualquier vector de error inicial e(0). Es decir que e x(t) converg-
erá a x(t) sin considerar los valores de x(0) y e x(0). Si se eligen los valores característicos de
la matriz A−K
e
C en tal forma que el comportamiento dinámico del vector de error sea
asintóticamente estable y suficientemente rápido, cualquier vector de error tenderá a 0 (el
origen) con una velocidad adecuada.
Para un sistema no lineal
·
x= f (x, u)
y = g (x)
(4.9)
Asumimos que (4.9) puede ser representado o aproximado de forma suficiente por un sistema
difuso Takagi-Sugeno. El sistema TS consiste de una base de reglas difusa, donde cada regla
i es de la forma
La regla i-ésima:
SI α
1
(t) es F
i1
y · · · y α
r
(t) es F
ir
ENTONCES
·
x(t) = A
i
x(t) +B
i
u(t) +a
i
y
i
(t) = C
i
x(t) +c
i
, i = 1, 2, · · · , r
(4.10)
donde
a
i
= f (x, u) −[A
i
x(t) +B
i
u(t)]
c
i
= g (x) −C
i
x(t)
A
i
=
∂f
∂x
|
(x
i
,u
i
)
B
i
=
∂f
∂u
|
(x
i
,u
i
)
C
i
=
∂g
∂x
|
(x
i
,u
i
)
Definición 4.1 Si los pares (A
i
, C
i
), i = 1, 2, · · · , r; son observables, el sistema difuso
(5.5) se dice localmente observable.
Para el diseño del observador Takagi-Sugeno , se asume que el sistema difuso (5.5)
es localmente observable. Primero, los observadores locales de estado son diseñados a con-
tinuación, basados en la tripleta (A
i
, B
i
, C
i
) :
La regla i-esima del observador:
SI z
1
(t) es F
i1
y · · · y z
g
(t) es F
ig
ENTONCES
·
b x(t) = A
i
b x(t) +B
i
u(t) +G
i
[y (t) − b y (t)]
b y
i
(t) = C
i
b x(t) , i = 1, 2, · · · , r
(4.11)
56 Observadores Difusos
donde G
i
(i = 1, 2, · · · , r) son matrices del error de observación. y (t) e b y (t) son la salida
final del sistema (5.5) y el observador difuso, respectivamente. Por tanto el estado final
estimado del observador difuso es
·
b x(t) =
r
X
i=1
µ
i
A
i
b x(t) +
r
X
i=1
µ
i
B
i
u(t) +
r
X
i=1
µ
i
G
i
[y (t) − b y (t)] (4.12)
la salida final del observador difuso es
b y
i
(t) =
r
X
i=1
µ
i
C
i
b x(t) (4.13)
donde se usa el mismo peso µ
i
igual al peso de la i-ésima regla del sistema difuso (5.6). Los
parámetros del observador son G
i
en cada regla.
4.5. Identificador Neuronal Difuso
El problema de la determinación de un modelo matemático para un sistema desconocido
por medio de la observación de los datos entrada-salida generalmente se refiere a la iden-
tificación del sistema. El propósito de la identificación del sistema es, entre otras cosas,
-Predecir el comportamiento del sistema, -Explicar la interacción y relación entre la entrada
y la salida de un sistema, -Diseñar un controlador basado en el modelo de un sistema. Para
realizar simulaciones del sistema bajo control, es necesario un modelo del sistema.
La identificación del sistema generalmente involucra dos pasos: la identificación de la
estructura del sistema y la identificación de los parámetros del sistema.
La identificación es uno de los problemas esenciales en la teoría del control, especialmente
cuando no tenemos información completa del modelo. Un método efectivo es utilizar redes
neuronales, debido a que una red neuronal es un identificador libre del modelo del sistema
[16], [32], es decir, la planta puede ser considerada como una ”caja negra” [38]. Las Redes
Neuronales Difusas (RND), son sistemas que incorporan aspectos de las redes neuronales
como es la capacidad de aprender a partir de ciertos datos, y aspectos de los sistemas
4.5 Identificador Neuronal Difuso 57
difusos ya que trabajan con razonamientos lógicos basados en reglas de inferencia y variables
lingüísticas.
Los neuro identificadores se pueden clasificar como estático (alimentación hacia adelante)
y dinámico (recurrente) [32], [30]. Los perceptrones multicapa son implementados por la
aproximación de la función no lineal en el lado derecho de la ecuación diferencial [18]. Se ha
empleado una versión continua de la red neuronal multicapa para estimar las no linealidades
de cierto robot manipulador [24]. La desventaja principal de las redes neuronales estáticas
es que las reglas de actualización de pesos utilizan información en las estructuras locales de
datos y la función de aproximación es sensible a datos de entrenamiento que se presentan
[11].
Las redes neuronales dinámicas superan de forma exitosa estas desventajas debido a la
estructura de retroalimentación [16]. Las redes neuronales dinámicas fueron introducidas
primero por Hopfield [14] y después estudiadas por otros [8], [11], [35], [46], etc. Existen
dos conceptos generales del entrenamiento recurrente. El aprendizaje de un punto fijo está
dirigido para hacer que las redes neuronales logren el equilibrio preestablecido [36]. El apren-
dizaje de la trayectoria entrena a la red para seguir la trayectoria deseada en el tiempo [37].
Muchas de las redes neuronales dinámicas no tienen capas ocultas [35], [47]. Como en los
perceptrones de una sola capa, las capacidades de aproximación de estas redes son limitadas.
Para afrontar estas limitaciones, se propusieron redes neuronas dinámicas de mayor orden
[21]. Esto contiene funciones no lineales múltiples para aproximar las dinámicas no lineales
complejas, la regla de entrenamiento es similar al caso de una sola capa [35]. Otro método
es emplear múltiples capas en las redes neuronales dinámicas, como con los perceptrones
multicapa, la habilidad de identificación podría ser mejorada exitosamente.
Muchos de los trabajos sobre identificación difusa emplean la consideración de accesibil-
idad completa de los estados, sin embargo, en la realidad esto no siempre es válido. En el
caso de que sólo la entrada y la salida son medibles, un sistema difuso complejo puede muy
bien hacer corresponder los pares entrada-salida. Si el sistema no lineal tiene demasiados
estados internos, el mapeo entrada-salida no será suficiente para modelar todo el sistema no
lineal. Para enfrentar este inconveniente, existen al menos dos métodos:
58 Observadores Difusos
Emplear el sistema difuso que contenga un observador tipo Luenberger [20], [48]. La
dimensión del sistema difuso es la misma que la de la planta. Debido a que sólo está
disponible el error a la salida , los parámetros correspondientes a los estados internos
no pueden cambiar cuando se aplica la regla de aprendizaje. Debido a esto es necesario
adicionar otros términos, tales como retardos [48] o términos lineales [20].
Utilizar el "principio de separación", es decir, el observador de estados y el sistema
de identificación son tratados separadamente. La dificultad es que los observadores
basados en un modelo no se pueden usar, debido a que no se dispone de un conocimiento
exacto de la planta. Los observadores no lineales libres de la estructura del sistema,
tales como los observadores de alta ganancia [33] y los observadores en modo deslizante
[2] pueden ser muy útiles, pero son adecuados para plantas especiales. Por ejemplo, los
observadores de alta ganancia requieren que las plantas no lineales tengan una forma
linealizable, esta condición no es aceptable cuando se trata de identificar un sistema que
se considera como una caja negra, por lo que el observador en modo deslizante [13] es
más adecuado, ademas es muy utilizado en las dinámicas de los robots manipuladores.
La combinación de observadores no lineales con identificadores basados en los sistemas
difusos es una buena dirección para mejorar la aproximación en la identificación. En esta
sección se aplicará el observador en modo deslizante para estimar los estados internos del
sistema.
4.6. Identificador Difuso basado en un Observador
Un modelo neurodifuso puede ser interpretado como una clase especial de red neuronal
con parámetros difusos, la red neuronal modifica estos parámetros [23]. Se han desarrollado
redes neuronales difusas basadas en las redes neuronales tradicionales, en particular el Per-
ceptrón Multicapa, en el que se han ido haciendo difusas algunas partes como por ejemplo
las neuronas o la función de costo.
4.6 Identificador Difuso basado en un Observador 59
En el caso cuando sólo la entrada y la salida son medibles, las redes neuronales complejas
pueden relacionar muy bien los pares entrada-salida. Si el sistema no lineal tiene muchos
estados internos, el mapeo entrada-salida no es suficiente para modelar totalmente al sistema
[17], por lo tanto en este caso podemos utilizar un observador para estimar los estados
intermos y de esta forma emplear todos los estados para identificar al sistema no lineal.
Sin embargo, muchos observadores se basan en la estructura de la planta, lo que significa
un gran problema cuando sólo se cuenta con información de los datos de entrada-salida
[49]. A continuación se presenta un observador libre de la estructura del sistema, como es un
observador en modo deslizante en combinación con una red neuronal difusa, esto nos permite
aplicarlo al problema de identificación del sistema no lineal el cuál carece de información
completa de sus estados internos.
4.6.1. Observador en modo deslizante
Generalmente un sistema no lineal MIMO puede ser escrito como
·
x
t
= f (x
t
, u
t
),
y
t
= Cx
t
(4.14)
donde x
t
∈ <
n
es el estado de la planta. u
t
∈ <
m
es determinada entrada de control que
puede estabilizar al sistema no lineal (4.14), |u
t
| ≤ u. y
t
∈ <
m
es la salida medible, C es la
matriz de salida conocida. Transformando el sistema (4.14) en una forma normal:
·
x
t
= Ax
t
+F(x
t
, u
t
), y
t
= Cx
t
(4.15)
donde F(x
t
, u
t
) := f (x
t
, u
t
) − Ax
t
, A es una matriz especial en la que el par (A, C) es
observable.
Construyendo el observador en modo deslizante como:
·
x
t
= Ax
t
+S(x
t
, e) −Ke
t
y
t
= Cx
t
(4.16)
donde e
t
es el error de salida definido como:
e
t
:= y
t
−y
t
= C∆
t
= C(x
t
−x
t
) ,
60 Observadores Difusos

t
es definido como el error del observador. El término de modo deslizante S(x
t
, e
t
) es
elegido como:
S(x
t
, e
t
) = −
P
−1
C
T
C∆
t
°
°
C∆
t
°
°
= −ρP
−1
C
T
sign(e
t
) (4.17)
donde ρ es una constante positiva.
Claramente el observador en modo deslizante (4.16) no es dependiente de la planta no
lineal (4.14).
La derivada del error del observador es
·

t
= A∆
t
+S(x
t
, e
t
) −KC∆
t
−F(x
t
, u
t
)
= (A−KC) ∆
t
+S(x
t
, e
t
) −F(x
t
, u
t
)
= A
0

t
+S(x
t
, e
t
) −F(x
t
, u
t
)
(4.18)
donde A
0
:= A−KC. Debido a que (A, C) es observable, existe K tal que A
0
es estable.
Así la siguiente ecuación de Lyapunov tiene una solución positiva P
A
T
0
P+PA
0
= −Q, Q = Q
T
> 0
para alguna matriz definida positiva Q.
Asumiendo que la función no lineal f(x
t
, u
t
) satisface la siguiente suposición
A1:
f(x
t
, u
t
) −Ax
t
= −P
−1
C
T
h(x
t
, u
t
)
donde h(x
t
, u
t
) es determinada una función como:
kh(x
t
, u
t
)k < ρ, ρ > 0.
4.6.2. Análisis de estabilidad
Teorema 4.1 Bajo la suposición A1, el error del observador entre el observador en modo
deslizante (4.16) y el sistema no lineal (4.14) es asintóticamente estable
l´ım
t→∞

t
= 0 (4.19)
4.6 Identificador Difuso basado en un Observador 61
Demostración. Considerando la siguiente función de Lyapunov candidata:
V
t
= ∆
T
t
P∆
t
Calculando su derivada
·
V
t
= ∆
T
t
¡
A
T
0
P+PA
0
¢

t
+ 2∆
T
t
P[S(x
t
, e
t
) −F(x
t
, u
t
)] .
Empleando A1
F(x
t
, u
t
) = −P
−1
C
T
h(x
t
, u
t
), kh(x
t
, u
t
)k < ρ.
Si elegimos S(x
t
, e
t
) como (4.17), tenemos
·
V
t
= −∆
T
t
Q∆
t
+ 2∆
T
t
C
T
h(x
t
, u
t
) −2

T
t
C
T
C∆
t
k
C∆
tk
ρ
= −∆
T
t
Q∆
t
+ 2∆
T
t
C
T
h(x
t
, u
t
) −2
°
°
C∆
t
°
°
ρ
≤ −∆
T
t
Q∆
t
+ 2
°
°
C∆
t
°
°
(kh(x
t
, u
t
)k −ρ) < 0
Con
·
V
t
< 0, ∆
t
∈ L

. De la ecuación de error (4.18) también concluimos que
·

t
∈ L

.
Debido a
·
V
t
≤ −∆
T
t
Q∆
t
y V
t
es el proceso determinado, ∆
t
es cuadráticamente integrable
y determinado ∆
t
∈ L
2
. Empleando el lema de Barbalat [32] obtenemos que el error del
observador ∆
t
es asintóticamente estable, así l´ım
t→∞

t
= 0.
Comentario 4.1 La suposición A1 es fácil de satisfacer si f(x
t
, u
t
) se determina, ya que A,
P y h(x
t
, u
t
) son seleccionados por el usuario. Muchos sistemas tienen funciones no lineales
establecidas f(x
t
, u
t
), por ejemplo, los sistemas mecánicos. El procedimiento de diseño del
observador en modo deslizante (4.16) se muestra en la figura 4.1.
62 Observadores Difusos

INICIO
Elegir A
¿(A, C)
observable?
Elegir K>0
¿A
0
=A-KC
estable?
1
SI
SI
NO
NO
FIN
Elegir Q>0
¿solución
P<0?
Elegir h(x) frontera
-P
-1
C
T
h=f-Ax
1
SI
SI
NO
NO
Figura 4.1: Procedimiento de diseño del observador en modo deslizante.
4.6 Identificador Difuso basado en un Observador 63
4.6.3. Identificador Difuso basado en un Observador
Redes Neuronales Difusas Tipo Mamdani
Un modelo difuso genérico se presenta como una colección de reglas difusas en la forma
siguiente:
R
i
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
·
b x
1
es B
1i
y · · ·
·
b x
n
es B
ni
O
·
b x
1
es u
1
C
1i
y· · ·
·
b x
m
es u
m
C
mi
· · ·
·
b x
n
es C
ni
O
·
b x
1
es a
1
b x
1
y· · ·
·
b x
n
es a
ni
b x
n
(4.20)
Esta regla se puede escribir de tres forma para las reglas:
R
i
1
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es B
1i
y· · ·
1
3
·
b x
n
es B
ni
R
i
2
: SI b x
1
is A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es u
1
C
1i
y· · ·
·
b x
m
es u
m
C
mi
y· · ·
·
b x
n
es C
ni
R
i
3
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es a
1
b x
1
y· · ·
·
1
3
b x
n
es a
ni
b x
n
Empleamos l(i = 1, 2, · · · , l) reglas difusas SI-ENTONCES para realizar un mapeo de un
vector lingüístico de entradas
b
X = [b x
1
· · · b x
n
] ∈ <
n
a un vector lingüístico de salidas
b
Y (k) =
·
·
b x
1
· · ·
·
b x
m
¸
T
.
A
1i
, · · · A
ni
, B
1i
, · · · B
ni
y C
1i
, · · · C
ni
son conjuntos difusos estándar [41]. Para una vari-
able de entrada x
i
existen l
i
conjuntos difusos. En el caso de una conexión completa l =
l
1
× l
2
× · · · l
n
. De [41] sabemos que, usando la inferencia del producto, media de centros
y fuzzyficador singleton, la p-ésima salida del sistema lógico difuso se puede expresar de la
64 Observadores Difusos
siguiente forma:
1
3
·
b x
p
=
Ã
l
P
i=1
w
1pi
"
n
Q
j=1
µ
A
ji
#!
/
Ã
l
P
i=1
"
n
Q
j=1
µ
A
ji
#!
=
l
P
i=1
w
1pi
φ
i
1
3
·
b x
p
=
Ã
l
P
i=1
u
i
w
2pi
"
n
Q
j=1
µ
A
ji
#!
/
Ã
l
P
i=1
"
n
Q
j=1
µ
A
ji
#!
=
l
P
i=1
u
i
w
2pi
φ
i
1
3
·
b x
p
=
l
P
i=1
a
i
b x
i
(4.21)
donde µ
A
ji
son las funciones de pertenencia de los conjuntos difusos A
ji
, w
pi
es el punto en
el que µ
B
pi
= 1. Si se define
φ
i
=
n
Y
j=1
µ
A
ji
/
l
X
i=1
n
Y
j=1
µ
A
ji
Podemos considerar la siguiente red neuronal para identificar al sistema no lineal.
.
b x
t
= A
n
b x
t
+W
1,t
σ(b x
t
) +W
2,t
φ(b x
t
)u
t
(4.22)
donde
el parámetro W
k
=
_
¸
¸
_
w
11
w
1l
.
.
.
w
n1
w
nl
_
¸
¸
_
,
el vector de datos σ(b x
t
) = [φ
1
· · · φ
l
]
T
, u
t
= [u
1
, u
2
· · · u
m
, 0, · · · 0]
T
, el vector b x
t
∈ <
n
es el
estado de la red neuronal. A
n
∈ <
n×n
es una matriz estable que se especifica posteriormente.
Las matrices W
1,t
∈ <
n×m
, W
2,t
∈ <
n×m
son los pesos que describen las conexiones de
las capas de salida.
σ(·) ∈ <
m
es el vector sigmoidal de funciones, φ(·) is <
m×m
la matriz diagonal
φ(·) = diag [φ
1
(V
2,t
b x
t
)
1
· · · φ
m
(V
2,t
b x
t
)
m
] .
Los elementos de σ
i
(·) (así como el φ
i
(·)) se eligen como funciones sigmoidales
σ
i
(x) = a
i
/
³
1 +e
−b
T
i
x
´
−c
i
.
4.6 Identificador Difuso basado en un Observador 65
Ahora el objetivo del observador difuso es hacer que los estados del modelo neuronal (4.22)
puedan seguir los estados completos de la planta real (4.14) o (4.15), de esta forma se plantea
el siguiente criterio:
J
m´ın
= m´ın
W
J, J = kx − b xk
2
R
(4.23)
Así, para cualquiera η > 0, tenemos
J ≤ (1 +η) kx −xk
2
R
1
+
¡
1 +η
−1
¢
kx − b xk
2
R
1
. (4.24)
El mínimo del término kx −xk
2
R
ya se ha resuelto en la sección para el observador. Si
seleccionamos R = (1 +η
−1
) R
1
, podemos reformular el objetivo de identificación como:
minimizar el término kx − b xk
2
R
. De hecho, éste es el Principio de Separación.
Podemos definir el error de identificación como

t
:= x
t
− b x
t
(4.25)
Debido a que σ y φ son elegidos como las funciones sigmoidales, las condiciones de
Lipschitz generales siguientes se cumplen:
e σ
T
t
Λ
1
e σ
t
≤ ∆
T
t
Λ
σ

t
,
³
e
φ
t
u
t
´
T
Λ
2
³
e
φ
t
u
t
´
≤ u
2

T
t
Λ
φ

t
(4.26)
donde
e σ
t
:= σ(x
t
) −σ(b x
t
),
e
φ
t
:= φ(x
t
) −φ(b x
t
)
f
W
1,t
:= W

1
−W
1,t
,
f
W
2,t
:= W

2
−W
2,t
Generalmente la red neuronal (4.22) no puede igualar al sistema no lineal (4.14) exactamente,
el sistema no lineal (4.14) puede representarse como
.
x
t
= A
n
x
t
+W

1
σ(x
t
) +W

2
φ(x
t
)u
t
+
e
f
t
. (4.27)
donde
e
f
t
es el error del modelado, W

1
, W

2
son matrices constantes dadas .
Si una entrada de control acotada u
t
puede estabilizar al sistema no lineal (4.14), la
dinámica no modelada
e
f
t
es acotada [24]. Ahora asumiendo que
A2: Existe una constante positiva η tal que
°
°
°
e
f
t
°
°
°
2
Λ
f
=
e
f
T
t
Λ
f
e
f
t
≤ η, Λ
f
= Λ
T
f
> 0
66 Observadores Difusos
Es bien sabido [45] que si la matriz A
n
es estable, el par (A
n
, R
1/2
) es controlable, el par
(Q
1/2
, A
n
) es observable, y la condición de frecuencia local especial o su equivalente de la
matriz
A
T
n
R
−1
A
n
−Q ≥
1
4
£
A
T
n
R
−1
−R
−1
A
n
¤
R
£
A
T
n
R
−1
−R
−1
A
n
¤
T
(4.28)
se cumple, de esta forma la ecuación de la matriz de Riccati
A
T
n
P+PA
n
+PRP+Q = 0 (4.29)
tiene una solución definida positiva P. Por lo tanto es razonable introducir la siguiente
suposición:
A3: Para una matriz estable dada A
n
existen una matriz estrictamente definida positiva
Q
1
tal que la matriz de la ecuación de Riccati (4.29) con
R = 2W
1
+ 2W
2

−1
f
, Q = Q
1

σ
+u
2
Λ
φ
(4.30)
donde W
1
:= W
∗T
1
Λ
−1
1
W

1
, W
2
:= W
∗T
2
Λ
−1
2
W

2
, tiene una solución positiva P.
La otra contribución principal de este documento es que se da una nueva regla de apren-
dizaje en línea para la red neuronal dinámica multicapa (4.22):
·
W
1,t
= −2s
t
K
1
P∆
t
σ
T
·
W
2,t
= −2s
t
K
2
P∆
t
(φu
t
)
T
(4.31)
donde
s
t
=
(
0 si k∆
t
k
2
Q
1
≤ η
1 isi k∆
t
k
2
Q
1
> η
(4.32)
K
i
∈ <
n×n
(i = 1 · · · 4) son matrices definidas positivas, P es la solución de la ecuación de
la matriz de Riccati dada por (4.29). Debido a que W

1
, W

2
pueden ser matrices constantes,
las seleccionamos como las condiciones iniciales:
W
1,0
= W

1
, W
2,0
= W

2
, (4.33)
El teorema siguiente declara el hecho que la regla de aprendizaje sugerida anteriormente
resulta ser globalmente estable.
4.6 Identificador Difuso basado en un Observador 67
Análisis de estabilidad
Teorema 4.2 Se considera un sistema no lineal (4.14) y la red neuronal dinámica multicapa
(4.22) cuyos pesos son ajustados con (4.31). Si las suposiciones A2 y A3 se cumplen„ se
puede concluir que
(I) Los pesos de las redes neuronales W
i,t
y el error de identificación ∆
t
están acotados.
(II) Para cualquiera T ∈ (0, ∞) el error de identificación ∆
t
converge al conjunto residual
D
∆t
=
n

t
| k∆
t
k
2
Q
1
≤ η
o
(4.34)
Demostración. Usando (4.22) y (4.27), la dinámica del error de identificación es
·

t
= A
n

t
+
f
W
1,t
σ +
f
W
2,t
φu
t
+W

1
e σ
t
+W

2
e
φ
t
u
t
+
e
f
t
(4.35)
Definiendo una función de Lyapunov candidata como
V
t
=
_
_
_
V
1,t
:= λ
m´ax
¡
PQ
−1
1
¢
η +
1
2
tr
h
f
W
T
1,t
K
−1
1
f
W
1,t
i
+
1
2
tr
h
f
W
T
2,t
K
−1
2
f
W
2,t
i
si k∆
t
k
2
Q
1
≤ η
V
2,t
:= ∆
T
t
P∆
t
+
1
2
tr
h
f
W
T
1,t
K
−1
1
f
W
1,t
i
+
1
2
tr
h
f
W
T
2,t
K
−1
2
f
W
2,t
i
si k∆
t
k
2
Q
1
> η
.
(4.36)
Debido a que
·
f
W
i,t
=
·
W
i,t
, de la zona muerta de la regla de aprendizaje (4.31), la derivada
de V
t
es
·
V
t
=
_
¸
¸
_
¸
¸
_
·
V
1,t
= 0 si k∆
t
k
2
Q
1
≤ η
·
V
2,t
= 2∆
T
t
P
·

t
+ tr
"
·
f
W
T
1,t
K
−1
1
f
W
1,t
#
+ tr
"
·
f
W
T
2,t
K
−1
2
f
W
2,t
#
si k∆
t
k
2
Q
1
> η
.
(4.37)
Ahora se puede discutir el término 2∆
T
t
P
·

t
, de acuerdo con:
2∆
T
t
P
·

t
= 2∆
T
t
PA
n

t
+ 2∆
T
t
P
³
W

1
e σ
t
+W

2
e
φ
t
u
t
+
e
f
t
´
+ 2∆
T
t
P
³
f
W
1,t
σ +
f
W
2,t
φu
t
´
(4.38)
La desigualdad de la matriz siguiente [47] es usada para estimar el lado derecho de (4.38)
X
T
Y+
¡
X
T
Y
¢
T
≤ X
T
Λ
−1
X+Y
T
ΛY (4.39)
68 Observadores Difusos
que es válido para cualquiera X, Y ∈ <
n×k
y para cualquier matriz definida positiva 0 <
Λ = Λ
T
∈ <
n×n
.
Usando (4.26) tenemos
2∆
T
t
PW

1
e σ
t
≤ ∆
T
t
PW

1
Λ
−1
1
W
∗T
1
P∆
t
+ e σ
T
t
Λ
1
e σ
t
≤ ∆
T
t
¡
PW
1
P+Λ
σ
¢

t
2∆
T
t
PW

2
e
φ
t
u
t
≤ ∆
T
t
¡
PW
2
P+u
2
Λ
φ
¢

t
2∆
T
t
PW

1
ν
σ
≤ ∆
T
t
PW
∗T
1
Λ
−1
1
W

1
P∆
t

T
σ
Λ
1
ν
σ
≤ ∆
T
t
PW
1
P∆
t
+l
1
°
°
°
e
V
1,t
b x
t
°
°
°
2
Λ
1
2∆
T
t
PW

2
ν
φ
≤ ∆
T
t
PW
2
P∆
t
+l
2
°
°
°
e
V
2,t
b x
t
°
°
°
2
Λ
2
(4.40)
De A2, 2∆
T
t
P
e
f
t
puede ser estimado como
2∆
T
t
P
e
f
t
≤ ∆
T
t

−1
f
P∆
t
+
e
f
T
t
Λ
f
e
f
t
≤ ∆
T
t

−1
f
P∆
t
+η (4.41)
Usando (4.38), (4.40) y (4.41),
·
V
2,t
puede ser escrito como
·
V
2,t
≤ ∆
T
t
L∆
t
+L
W1
+L
W2
−∆
T
t
Q
1

t
+η (4.42)
donde
L = PA
n
+ A
T
n
P+PRP+Q,
L
W1
= tr
"
·
f
W
T
1,t
K
−1
1
f
W
1,t
#
+ 2∆
T
t
P
f
W
1,t
σ
t
,
L
W2
= tr
"
·
f
W
T
2,t
K
−1
2
f
W
2,t
#
+ 2∆
T
t
P
f
W
2,t
φu
t
Usando A3 y la regla de adaptación (4.31),
·
V
2,t
≤ −∆
T
t
Q
1

t

Es conocido que cuando
k∆
t
k
2
Q
1
> η (4.43)
·
V
2,t
< 0, ∀t ∈ [0, T] . Como
·
V
1,t
= 0 y
·
V
2,t
< 0, V
t
es acotado, esto es, se cumple (I).
Así el tiempo total durante el cuál k∆
t
k
2
Q
1
> η, es finito. Teniendo T
k
se denote el
intervalo de tiempo durante el cuál k∆
t
k
2
Q
1
> η.
4.6 Identificador Difuso basado en un Observador 69
Si sólo se tienen tiempos finitos, k∆
t
k
2
Q
1
permanece fuera del círculo de radio η (y
entonces vuelve a entrar), k∆
t
k
2
Q
1
eventualmente permanecerá dentro de este círculo.
Si k∆
t
k
2
Q
1
deja el círculo infinitas veces, como el tiempo total en que k∆
t
k
2
Q
1
deja el
círculo es finito,

X
k=1
T
k
< ∞, l´ım
k→∞
T
k
= 0 (4.44)
Así k∆
t
k
2
Q
1
es acotada por medio de un argumento del conjunto invariante. De (4.43)
·

también es acotada. Teniendo k∆
t
k
2
Q
1
denota el error de seguimiento más grande durante el
intervalo T
k
. Entonces (4.44) y k∆
t,k
k
2
Q
1
acotado implica que
l´ım
k→∞
h
k∆
t,k
k
2
Q
1
−η
i
= 0
Así k∆
t,k
k
2
Q
1
convergerá a η. Por lo tanto se logra obtener (II).
Comentario 4.2 Muchos documentos han presentado la prueba de estabilidad del neuro
identificador a través de la teoría de Lyapunov (ver [21], [35] y [47]). La existencia del
error de modelado requiere la técnica adaptable robusta como en [32]. Para los ejemplos, [21]
usa σ−modificación para evitar que el error de identificación sea infinito en presencia de
una perturbación acotada pequeña. En este documento usamos la técnica de zona-muerta.
Esto significa que cuando la norma del error de identificación es pequeña comparado con
el error de modelado, se detine la regla de adaptación para asegurar que el peso y el error
de identificación sean acotados. Esta técnica se ha usado con éxito en las redes neuronales
estáticas como en [4]. Si la red neuronal (4.22) puede igualar al sistema no lineal exactamente
(
e
f = 0, η = 0), se alcanza la estabilidad asintótica , es decir.
l´ımsup
T→∞
1
T
Z
T
0
k∆
t
k
2
Q
1
dt = 0, l´ımsup
t→∞
k∆
t
k = 0.
Comentario 4.3 El procedimiento de aprendizaje (4.31) de las redes neuronales multicapa
dinámicas (4.58) es similar con la propagación hacia atrás de las redes neuronales multi-
capa estáticas [26]. (K
i
P) es el índice de aprendizaje.
¡
K
i
P∆
t
σ
T
¢
y
¡
K
i
PW
i,t

t
b x
T
t
¢
son
exactamente las mismas como en el esquema de propagación hacia atrás [12], [45].
70 Observadores Difusos
Comentario 4.4 Aún cuando la regla de aprendizaje propuesta se parece a los algoritmos
de propagación hacia atrás con un término adicional, la estabilidad del error asintótica global
es garantizada debido al hecho que es derivado basado en la aproximación de Lyapunov. Así,
el problema mínimo local (que es una preocupación mayor en el aprendizaje estático) no es
alcanzado en este caso.
Comentario 4.5 Ninguna condición inicial especial se requiere, por lo tanto no es necesario
el aprendizaje off-line. El objetivo de la regla de actualización (4.31) es para minimizar
(4.23). Así los pesos en este algoritmo on-line no puede converger a los valores óptimos,
pero éstos son acotados.
4.7. Simulación
4.7.1. Identificación de sistemas no lineales
Se emplea un sistema no lineal para ilustrar como diseñar un sistema difuso empleando
el algoritmo del gradiente descendente. Se desea diseñar un sistema difuso para identificar el
siguiente sistema no lineal:
y(k + 1) =
y(k)
1 +y(k)
2
+u(k)
3
(4.45)
Se tienen 2 reglas difusas
R
1
: Si y (k) es A
11
y u(k) es A
12
entonces y(k + 1) es B
1
R
2
: Si y (k) es A
21
y u(k) es A
22
entonces y(k + 1) es B
2
donde los 6 conjuntos difusos A
11
, A
12
, A
21
, A
22
, B
1
y B
2
son desconocidos, asumimos que
sus funciones de pertenencia se eligen como funciones Gaussianas
µ(x) = exp
Ã

(x −c)
2
σ
2
!
función con forma de campana, centrada en el valor c, de anchura σ y amplitud 1.
4.7 Simulación 71
1) Fuzzyficador tipo singleton
µ =
(
1 si x = x

0 otro caso
por lo tanto para una declaración difusa se tiene
(x es A) →µ
A
(x

)
2) La operación difusa:
{y (k) es A
11
y u(k) es A
12
} es
µ
A
11
µ
A
12
Empleando implicaciones difusas de la forma:
{Si y (k) es A
11
y u(k) es A
12
entonces y(k + 1) es B
1
} produce
µ
A
11
µ
A
12
µ
B
1
La relación de 2 reglas difusas R
1
y R
2
es la operación O
µ = m´ax
£¡
µ
A
11
µ
A
12
¢
µ
B
1
,
¡
µ
A
21
µ
A
22
¢
µ
B
2
¤
3) Defuzzyficador,
suponiendo que el centro del conjunto difuso B
1
es y
1
, el conjunto difuso es un conjunto
difuso normal µ
B
1
(y
1
) = 1
suponiendo que el centro del conjunto difuso B
2
es y
2
, el conjunto difuso es un conjunto
difuso normal µ
B
2
(y
2
) = 1
la altura del primer conjunto difuso es µ
A
11
µ
A
12
µ
B
1
la altura del segundo conjunto difuso es µ
A
21
µ
A
22
µ
B
2
Empleando un defuzzyficador por media de centros, la salida del sistema difuso es
b y(k + 1) =
y
1
¡
µ
A
11
µ
A
12
¢
+y
2
¡
µ
A
21
µ
A
22
¢
µ
A
11
µ
A
12

A
21
µ
A
22
(4.46)
72 Observadores Difusos
El objetivo de identificación es encontrar 4 funciones de pertenencia µ
A
11
, µ
A
12
, µ
A
21
,
µ
A
22
(cada función de pertenencia tiene dos parámetros y
1
(que corresponde al conjunto
difuso B
1
) y y
2
(que corresponde al conjunto difuso B
2
) por lo que se considera minimizar
el siguiente criterio (4.47):
J = [y(k + 1) − b y(k + 1)]
2
(4.47)
y
1
(k + 1) = y
1
(k) −η
(b y−y)
b
z
1
y
2
(k + 1) = y
2
(k) −η
(b y−y)
b
z
2
c
11
(k + 1) = c
11
(k) −2η (b y −y) z
1
(y
1
−b y)(y(k)−c
11
)

2
11
.
.
. c
12
c
21
c
22
(k + 1) = c
22
(k) −2η (b y −y) z
2
(
y
2
−b y
)
(u(k)−c
22
)

2
22
σ
11
(k + 1) = σ
11
(k) −2η (b y −y) z
1
(y
1
−b y)(y(k)−c
11
)
2

3
11
(4.48)
donde
z
1
= exp
³

(y(k)−c
11
)
2
σ
2
11
´
exp
³

(u(k)−c
12
)
2
σ
2
12
´
z
2
= exp
³

(y(k)−c
21
)
2
σ
2
21
´
exp
³

(u(k)−c
22
)
2
σ
2
22
´
a = y
1
z
1
+y
2
z
2
b = z
1
+z
2
η =
1
1 + kz
1
k
2
+ kz
1
k
2
De las condiciones iniciales aleatorias [0, 1], los resultados de identificación se muestran en
la figura 4.2:
Problema 4.1 En este caso se desea identificar un sistema no lineal empleando un sistema
difuso.
Solución 4.1 Los sistemas difusos son muy útiles cuando los modelos no están disponibles
o se tiene información parcial del sistema, en este problema se conoce el modelo matemático.
4.7 Simulación 73
Figura 4.2: Identificación de sistemas no lineales.
Figura 4.3: Funciones de pertenencia para B
1
y B
2
.
74 Observadores Difusos
-2 0 2 4
0
0.2
0.4
0.6
0.8
1
funcion de pertenencia para A11
x
m
u
(
x
)
-2 0 2 4
0
0.2
0.4
0.6
0.8
1
funcion de pertenencia para A12
x
m
u
(
x
)
-5 0 5
0
0.2
0.4
0.6
0.8
1
funcion de pertenencia para A21
x
m
u
(
x
)
-0.5 0 0.5 1
0.75
0.8
0.85
0.9
0.95
1
funcion de pertenencia para A22
x
m
u
(
x
)
c1=0.7159
s1=0.7679
c2=1.1737
s2=0.5711
c3=1.4970
s3 =-1.6077
c4=0.2173
s4=0.8400
Figura 4.4: Funciones de pertenencia para A
11
, A
12
, A
21
y A
22
.
-2 -1 0 1 2 3 4 5
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
funciones de pertenencia
x
mu(x)
A11
A12
A21
A22
A12
A22
A21
A11
Figura 4.5: Comparación de las funciones de pertenencia de A
11
, A
12
, A
21
y A
22
.
4.7 Simulación 75
0 20 40 60 80 100 120 140 160 180 200
-1
-0.5
0
0.5
1
1.5
2
tiempo
parámetros
Figura 4.6: Convergencia de parámetros para las funciones de pertenencia A
11
, A
12
,A
21
y
A
22
.
A
11
(0.7159) A
21
(1.4970)
y(k)
A
12
(1.1737)
A
22
(0.2173)
u(k)
B
1
(0.9937)
B
2
(-0.3331)
Figura 4.7: A cada combinación de las variables de entrada, se asocia una consecuencia.
76 Observadores Difusos
Conclusión 4.1 Para este caso se utilizaron dos reglas difusas, con este valor fue posible
obtener un buen resultado en la identificación del sistema; en realidad el número de reglas
ideal que nos permita hacer una aproximación adecuada del sistema es aún un tema de
investigación, este dato se establece de acuerdo a los resultados que mejor se adecuen al
problema.
La aproximación que se obtiene del sistema no lineal es adecuada en términos generales,
se determina a partir de un sistema difuso, con dos reglas difusas y cuatro conjuntos difusos
A
11
, A
12
, A
21
y A
22
(figura 4.4) para la parte de la premisa y B
1
y B
2
(figura 4.3) en la
parte de la consecuencia de estas reglas SI-ENTONCES (IF-THEN). Se utilizan funciones
del tipo Gaussianas, con parámetros variables: la posición del centro y ancho de cada función
(c y sigma). El propósito del algoritmo de optimización es cambiar estos parámetros de tal
forma que el sistema difuso aproxime lo mejor posible al sistema no lineal. En la figura
4.6 podemos observar que por medio del algoritmo empleado se alcanza la convergencia de
cada parámetro establecido permitiendo al sistema difuso identificar a la planta no lineal.
En la figura 4.7 se muestra que para una combinación de las variables de entrada se da un
valor en la consecuencia de las reglas difusas como parte de la aplicación del algoritmo de
optimización, así, para este caso:
R
1
: Si y (k) es 0,7159 y u(k) es 1,1737 entonces y(k + 1) es 0,9937
R
2
: Si y (k) es 1,4970 y u(k) es 0,2173 entonces y(k + 1) es −0,331
Este mismo conocimiento se puede emplear en la identificación y control de sistemas
no lineales prácticos tales como los robots manipuladores. A continuación se presenta el
siguiente ejemplo.
Ejemplo 4.1 Se aplicará el algoritmo de diseño establecido anteriormente a un problema
de un robot manipulador de dos grados de libertad [31].
Expresando las dinámicas de un robot manipulador de dos grados de libertad de la
siguiente forma:
M(q)
··
q + V (q,
·
q)
·
q + G(q) +f
D
(
·
q) = τ(t)
4.7 Simulación 77
mg1
mg2
q1
q2
x
y
r1
l2
l1
r2
Figura 4.8: Robot Manipulador de dos grados de libertad.
donde q = [q
1
, q
2
]
T
es la posición de los eslabones del robot, τ(t) ∈ R
2
es la entrada de
control, M(q) es la matriz de inercia, V (q,
·
q) es la matriz centrípeta y de Coriolis, G(q) es
el vector de la gravedad, f
D
(
·
q) es el vector de la fricción.
En la figura 4.8 se muestra un esquema de un robot manipulador de dos grados de
libertad. Para el caso de los dos eslabones, los elementos se pueden representar como
M (q) =
"
M
11
M
12
M
21
M
22
#
,
78 Observadores Difusos
M
11
= m
1
(r
2
1
/4 +l
2
1
/3) +m
2
(l
2
1
+r
2
2
/4 +l
2
2
/3 +l
1
l
2
cos q
2
)
+m
2
(l
2
1
+ 3/4l
2
2
+l
1
l
2
cos q
2
)
M
12
= m
2
¡
r
2
2
/4 +l
2
2
/3 +
1
2
l
1
l
2
cos q
2
¢
+m
L
l
2
2
= M
21
M
22
= m
2
(r
2
2
/4 +l
2
2
/3) +m
L
l
2
2
C
³
q,
·
q
´
=
_
_
−V
m
·
q
2
sinq
2
−V
m
sin q
2
³
·
q
1
+
·
q
2
´
V
m
·
q
1
sin q
2
0
_
_
V
m
=
¡
1
2
m
2
l
1
l
2
+m
L
l
1
l
2
¢
,
G(q) , =
"
¡
1
2
m
1
+m
2
¢
gl
1
cos q
1
+
1
2
m
2
gl
2
cos (q
1
+q
2
)
1
2
m
2
gl
2
cos (q
1
+q
2
)
#
F
d
³
·
q
´
=
"
ν
1
·
q
1

1
sign(
·
q
1
)
ν
2
·
q
2

2
sign(
·
q
2
)
#
(4.49)
Los parámetros del robot son: m
1
= 4,8Kg, m
2
= 5,3Kg, l
1
= l
2
= 1m. r
1
= l
1
/2,
r
2
= l
2
/2, m
L
= 0. Los coeficientes de fricción son 0,4 y 0,7. Por lo tanto las matrices reales
de (4.49) son:
M =
"
9,3 + 5,3 cos (q
2
) 2,1 + 2,65 cos q
2
2,1 + 2,65 cos q
2
2,1
#
,
C =
_
_
−2,65
·
q
2
sin q
2
−2,65
³
·
q
1
+
·
q
2
´
sin q
2
2,65
·
q
1
sin q
2
0
_
_
G(q) =
"
75,4 cos q
1
+ 25,97 cos (q
1
+q
2
)
25,97 cos (q
1
+q
2
)
#
,
Para realizar las simulaciones, se considera un robot manipulador planar de dos grados
de libertad. Se asume que cada eslabón tiene su masa concentrada en un punto al final. El
manipulador está en posición vertical, con gravedad y fricción.
Los parámetros del robot son: m
1
= m
2
= 1, l
1
= 1, l
2
= 2.
Los dos coeficientes de fricción son 0,3, y la gravedad es 9,8.
4.7 Simulación 79
(4.49) se puede escribir como:
·
x = f(x
t
, t) +g(x
t
, t)u
t
(4.50)
donde
x
t
=
h
q
1
, q
2
,
·
q
1
,
·
q
2
i
T
,
f(x
t
, t) =
h
··
q
1
,
··
q
2
, −M
−1
³
V
·
q +G+F
d
´i
T
,
g(x
t
, t)u = [0, 0, M
−1
(q)τ]
T
.
Asumimos que sólo la posición del ángulo q es medible, la velocidad
·
q será estimada por
el observador en modo deslizante (4.16).
Para el robot manipulador de dos grados de libertad se utilizan dos observadores,
observador (a):
·
q
a
= Aq
a
+ S (q
a
, e) −Ke
t
y
a
= Cq
a
, q
a
:= [q
1
,
·
q
1
]
(4.51)
observador (b):
·
q
b
= Aq
b
+S (q
b
, e) −Ke
t
y
b
= Cq
a
, q
a
:= [q
2
,
·
q
2
]
(4.52)
Siguiendo los pasos de diseño de la figura 4.1.
1.- Como tenemos la matriz C
C =
h
1 0
i
,
podemos elegir A =
"
0 1
1 0
#
para hacer que el par (A, C) sea observable.
2.- Ahora se verifica que el par (A, C) sea observable, esto lo podemos hacer calculando
la matriz siguiente la cuál debe ser de rango completo
rango
"
C
CA
#
= n
Si C =
h
1 0
i
, y CA =
h
1 0
i
"
0 1
1 0
#
=
h
0 1
i
80 Observadores Difusos
se tiene que
rango
"
1 0
0 1
#
= 2
De aquí se obtiene que el par (A, C) efectivamente es observable, por lo tanto podemos
encontrar K tal que A
0
= A −KC sea estable.
3.- Si elegimos K > 0 para que A
0
sea estable tenemos
K =
"
2
2
#
> 0,
4.- Entonces A
0
= A −KC =
"
0 1
1 0
#

Ã"
2
2
#
h
1 0
i
!
A
0
=
"
0 1
1 0
#

"
2 0
2 0
#
A
0
=
"
−2 1
−1 0
#
Se obtiene el polinomio característico de A
0
y sus raíces, se verifica si son raíces reales
negativas:
det |sI −A
0
| = det
¯
¯
¯
¯
¯
s
"
1 0
0 1
#

"
−2 1
−1 0

¯
¯
¯
¯
= det
¯
¯
¯
¯
¯
"
s 0
0 s
#

"
−2 1
−1 0

¯
¯
¯
¯
= det
¯
¯
¯
¯
¯
"
s + 2 −1
1 s

¯
¯
¯
¯
det |sI −A
0
| = (s + 2) s −(−1) = s
2
+ 2s + 1 = (s + 1) (s + 1)
polinomio característico = s
2
+ 2s + 1
raíces s
1
= −1, s
2
= −1 tienen parte real negativa, por lo tanto A
0
es estable.
5.- Seleccionar Q > 0
si empleamos Q =
"
3 1
8 3
#
, la solución de la ecuación de Lyapunov
A
0
P +PA
T
0
= −Q (4.53)
6.- Debemos obtener P > 0, de (4.53) se tiene:
4.7 Simulación 81
"
−2 1
−1 0
#"
P
1
P
2
P
3
P
4
#
+
"
P
1
P
2
P
3
P
4
#"
−2 −1
1 0
#
=
"
3 1
8 3
#
por lo tanto P =
"
1.5 -0.25
3.25 0
#
=
"
P
1
P
2
P
3
P
4
#
Para verificar que P > 0 es definida positiva, sus menores principales deben ser positivos.
P
1
= 1,5 > 0
det |P| = P
1
P
4
−P
2
P
3
= (1.5)(0) −(0.25)(3.25) = 0+0.8125 =0.8125> 0
de esta forma la matriz P es definida positiva.
7.- Se elije h(x) acotada
Por tanto las matrices reales de (4.49): donde q = [q
1
, q
2
]
T
(rad).
Para estabilizar al robot manipulador se emplea un control PD
τ = −K
p
(q −q
D
) −K
d
³
·
q −
·
q
D
´
"
τ
1
τ
2
#
= −K
p
"
q
1
−q
d
1
q
2
−q
d
2
#
−K
d
_
_
·
q
1

·
q
d
1
·
q
2

·
q
d
2
_
_
(4.54)
donde
K
p
=
"
600 0
0 600
#
, K
d
=
"
10 0
0 10
#
.
Por tanto todos los estados del manipulador son acotados. De las definiciones de M, V,
G y F
d
sabemos que f(x
t
, t) +g(x
t
, t)u en (4.50) es acotada, de modo que existe una función
h(x) tal que
−P
−1
C
T
h = f −Ax
Sin perder generalidad, elegimos kh(x
t
, u
t
)k < ρ, ρ = 10. Para eliminar el chattering, se
puede usar el siguiente compensador de capa acotada
S (x
t
, e
t
) = −
P
−1
C
T
C∆
t
kC∆
t
k
ρ =
(
−ρP
−1
C
T
sign(C∆
t
)
−ρP
−1
C
T
C∆
t

|C∆
t
| ≥ δ
|C∆
t
| < δ
(4.55)
El controlador de capa acotada anterior ofrece una aproximación continua para el modo
deslizante discontinuo dentro de la capa acotada y garantiza que el error del observador esté
82 Observadores Difusos
dentro de cualquier vecindad cercana al origen [6]. El valor de δ es un dato importante que
permite establecer el modo deslizante para el observador, en este caso se ha seleccionado un
dato de δ =0.01; de esta forma se proporciona la característica para el observardor en modo
deslizante.
Un modelo difuso genérico se representa como una colección de reglas difusas de la sigu-
iente forma:
R
i
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
·
b x
1
es B
1i
y · · ·
·
b x
n
es B
ni
O
·
b x
1
es u
1
C
1i
y· · ·
·
b x
m
es u
m
C
mi
· · ·
·
b x
n
es C
ni
O
·
b x
1
es a
1
b x
1
y· · ·
·
b x
n
es a
ni
b x
n
(4.56)
Esta regla se puede escribir de tres forma para las reglas:
R
i
1
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es B
1i
y· · ·
1
3
·
b x
n
es B
ni
R
i
2
: SI b x
1
is A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es u
1
C
1i
y· · ·
·
b x
m
es u
m
C
mi
y· · ·
·
b x
n
es C
ni
R
i
3
: SI b x
1
es A
1i
y b x
2
es A
2i
y · · · b x
n
es A
ni
ENTONCES
1
3
·
b x
1
es a
1
b x
1
y· · ·
·
1
3
b x
n
es a
ni
b x
n
Se utilizan las l(i = 1, 2 · · · l) reglas difusas SI-ENTONCES que permita realizar un
mapeo de un vector lingüístico de entrada
b
X = [b x
1
· · · b x
n
] ∈ <
n
a un vector lingüístico
de salida
b
Y (k) =
·
·
b x
1
· · ·
·
b x
m
¸
T
. A
1i
, · · · A
ni
, B
1i
, · · · B
ni
y C
1i
, · · · C
ni
son conjuntos difusos
estándar [41]. Para la variable de entrada x
i
existen l
i
conjuntos difusos. En el caso de
conexiones completas, l = l
1
× l
2
× · · · l
n
. De [41] es conocido que si se utiliza inferencia
de productos, media de centros y fuzzyficador tipo singleton, la p-ésima salida del sistema
4.7 Simulación 83
difuso se puede expresar de la siguiente forma:
1
3
·
b x
p
=
Ã
l
P
i=1
w
1pi
"
n
Q
j=1
µ
A
ji
#!
/
Ã
l
P
i=1
"
n
Q
j=1
µ
A
ji
#!
=
l
P
i=1
w
1pi
φ
i
1
3
·
b x
p
=
Ã
l
P
i=1
u
i
w
2pi
"
n
Q
j=1
µ
A
ji
#!
/
Ã
l
P
i=1
"
n
Q
j=1
µ
A
ji
#!
=
l
P
i=1
u
i
w
2pi
φ
i
1
3
·
b x
p
=
l
P
i=1
a
i
b x
i
donde µ
A
ji
son los valores de las funciones de pertenencia de los conjuntos difusos A
ji
, w
pi
es el punto en que µ
B
pi
= 1. Si definimos
φ
i
=
n
Y
j=1
µ
A
ji
/
l
X
i=1
n
Y
j=1
µ
A
ji
(4.57)
El modelo difuso anterior puede representar adecuadamente el siguiente sistema el cuál
puede ser una representación del modelo del sistema no lineal en cuestión:
·
b q = A
n
b q +W
1,t
σ(V
1,t
b q) +W
2,t
φ(V
2,t
b q)Bτ (4.58)
donde b q = [b q
1
,
·
b q
1
, b q
2
,
·
b q
2
]. Se seleccionan W
1,t
y W
2,t
∈ R
4×3
, V
1,t
y V
2,t
∈ R
3×4
,
σ(x) =
2
(1 +e
−2x
)
−0,5, φ(x) =
0,2
(1 + e
−0,2x
)
−0,05
Las condiciones iniciales son W
T
1,0
= W
T
2,0
= V
10
= V
2,0
=
_
¸
¸
_
1 1 1 1
1 2 1 2
2 1 2 1
_
¸
¸
_
, q(0) = q(0) =
b q(0) = 0.
Los pesos se actualizan de acuerdo a (4.31) con η = 0,2, K
i
:= K
i
P = 10I
4
, A
n
= −2I
4
.
Los resultados de la identificación para el estado q se muestran en las figuras 4.9 - 4.12. Si
no empleamos el observador, el neuro identificador como en (4.58) tendrá dos dimensiones,
elegimos W
1,t
y W
2,t
∈ R
2×3
, V
1,t
y V
2,t
∈ R
3×2
. Empleando la misma regla de actualización
(4.31) n = 2, los resultados de identificación se muestran en las figuras 4.13 - 4.14.
84 Observadores Difusos
Las funciones de pertenencia que se emplean en el sistema difuso se eligen como funciones
Gaussianas de la siguiente forma:
µ
A
ji
(k) = exp
Ã

(x
j
−c
ji
)
2
σ
2
ji
!
El algoritmo de aprendizaje tiene como objetivo variar la posición y ancho de las funciones
Gaussianas de forma iterativa tal que se aproxime apropiadamente al sistema no lineal. Se
seleccionan los siguientes datos para l = n = 2, c
ji
y σ
ji
son números aleatorios entre (0, 1) .
Podemos ver que el identificador basado en el observador es mejor que el identificador
difuso donde los estados son parcialmente medibles. El número de reglas establecido nos
muestra resultados aceptables.
En la figura 7.1 se muestra el diagrama general para la identificación de los estados del
robot manipulador.
Problema 4.2 Identificar los estados del sistema no lineal para el robot manipulador.
Solución 4.2 Se utiliza un neuro identificador con la regla de actualización (4.31). El dia-
grama de simulación se muestra en el apéndice A.
Conclusión 4.2 Se puede observar en las figuras correspondientes que la identificación de
los estados del robot manipulador es adecuada.
Problema 4.3 Estimar los estados del robot manipulador correspondientes a la posición y
velocidad empleando un observador en modo deslizante.
Solución 4.3 Haciendo uso del observador en modo deslizante (4.16) se estiman los esta-
dos correspondientes al sistema. Podemos diseñar un observador en modo deslizante para el
sistema (4.50).
4.7 Simulación 85
Figura 4.9: Identificación del estado q1 del robot manipulador.
Figura 4.10: Identificación del estado q2 del robot manipulador.
86 Observadores Difusos
Figura 4.11: Identificación del estado dq1 del robot manipulador.
Figura 4.12: Identificación del estado dq2 del robot manipulador.
4.7 Simulación 87
Figura 4.13: Observación del estado q por medio del observador en modo deslizante.
Figura 4.14: Observación del estado dq por medio del observador en modo deslizante.
88 Observadores Difusos
Figura 4.15: Identificación del estado q1 para el sistema no lineal.
Conclusión 4.3 Se puede observar en las figuras 4.13 y 4.14 la observación de los estados
por medio del observador en modo deslizante.
Problema 4.4 Identificar los estados para el robot manipulador empleando el resultado
obtenido de la estimación de los estados con el observador en modo deslizante.
Solución 4.4 Si se incluye el observador en modo deslizante dentro del neuro identificador
para estimar los estados correspondientes al sistema se obtienen los resultados mostrados en
las figuras 4.15-4.18.
Conclusión 4.4 En las figuras 4.15-4.18 se muestra que la identificación de los estados
del sistema empleando el observador en modo deslizante nos proporciona un resultado más
adecuado, donde los estados parciales son medibles. Los pequeños castañeos se deben a las
dinámicas no modeladas que se encuentran presentes. Se puede observar que con un número
4.7 Simulación 89
Figura 4.16: Identificación del estado q2 para el sistema no lineal.
Figura 4.17: Identificación del estado dq1 para el sistema no lineal.
90 Observadores Difusos
Figura 4.18: Identificación del estado dq2 para el sistema no lineal.
Figura 4.19: Funciones de pertenencia para B1 y B2.
4.7 Simulación 91
Figura 4.20: Funciones de pertenencia para la parte de la premisa de las reglas difusas.
Figura 4.21: Convergencia de parámetros de las reglas difusas.
92 Observadores Difusos
A
11
(1.4) A
21
(2.32)
y(k)
A
12
(-2.45)
A
22
(1.5)
u(k)
B
1
(0.253)
B
2
(0.035)
Figura 4.22: A cada combinación de las variables de entrada, se asocia una consecuencia.
de reglas difusas igual a 2 se obtiene una buena aproximación del sistema no lineal, este
valor es relativo ya que se debe variar hasta obtener un resultado satisfactorio a cada prob-
lema. En la figura 4.22 se observa que para cada combinación de las variables de entrada se
asocia un valor en la consecuencia de cada regla difusa, este resultado se logra a partir de
la convergencia de los parámetros establecidos dentro del algoritmo de optimización como se
muestra en las figuras 4.19-4.21, en este caso se varían tanto la posición de las funciones
Gaussianas como su ancho, permitiendo de esta forma la identificación del sistema no lineal.
Ejemplo 4.2 Se aplicará el mismo algoritmo de diseño a la identificación de un oscilador
de Van der Pol.
A continuación se considera el siguiente oscilador de Van der Pol dado por
"
·
x
1
·
x
2
#
=
"
0 1
0 0
#"
x
1
x
2
#
+
"
0
1,5
#
[(1 −x
2
1
) x
2
−x
1
]
y = x
1
. (4.59)
Sabemos que sin una entrada de control, los estados del oscilador de Van der Pol son acotados.
Por tanto, podemos usar el mismo observador en modo deslizante como en (4.51) para estimar
4.7 Simulación 93

0 50 100 150 200 250 300
-3
-2
-1
0
1
2
3
tiempo
Estado x1
x(t)
x
x
^
Figura 4.23: Identificación del estado x
1
del oscilador de Van der Pol.
el estado x
2
. Debido a que este sistema no lineal carece de una entrada de control, el sistema
difuso puede seleccionarse como
.
x
n
= Ax
n
+W
1,t
σ(V
1,t
x
n
)
donde W
1,t
y W
2,t
∈ R
2×3
, V
1,t
y V
2,t
∈ R
3×2
, K
i
:= K
i
P = 10I
2
, A = −2I
2
.
Problema 4.5 Identificar los estados del sistema de Van der Pol.
Solución 4.5 Se utiliza un neuro identificador con una regla de actualización (4.31), los
resultados se muestran en las figuras 4.23, 4.24. El diagrama de simulación para realizar la
identificación de los estados del sistema de Van der Pol por medio de un identificador difuso
se muestra en la figura 7.3 del Apéndice A.
Conclusión 4.5 Se puede observar en las figuras correspondientes que la identificación de
los estados del oscilador de Van der Pol es buena.
94 Observadores Difusos

0 50 100 150 200 250 300
-4
-3
-2
-1
0
1
2
3
4
tiempo
Estado x2
x(t)
x
x
^
Figura 4.24: Identificación del estado x
2
para el oscilador de Van der Pol.
Problema 4.6 Estimar los estados x1 y x2 del oscilador de Van der Pol.
Solución 4.6 Haciendo uso del observador en modo deslizante (4.16) se estiman los estados
x1 y x2 del oscilador de Van der Pol„ los resultados se muestran en la figura 4.25. Podemos
diseñar un observador en modo deslizante para el oscilador de Van der Pol, su diagrama se
muestra en la figura 7.4 del apéndice A.
Conclusión 4.6 Con ayuda del observador en modo deslizante se ha podido obtener infor-
mación acerca de los estados del oscilador de Van der Pol.
Problema 4.7 Identificar los estados para el oscilador de Van der Pol empleando el resul-
tado obtenido de la estimación parcial de sus estados con el observador en modo deslizante.
Solución 4.7 Se incluye el observador en modo deslizante dentro del neuro identificador
para estimar los estados correspondientes al sistema.
4.7 Simulación 95

0 100 200 300 400 500 600
-4
-2
0
2
4
6
8
10
12
tiempo
Estados x1 y x2
x1
x2
x(t)
Figura 4.25: Observación de los estados x1 y x2 del oscilador de Van de Pol.

0 100 200 300 400 500 600 700 800
-2.5
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
tiempo
Estado x1
x(t)
x
x
^
Figura 4.26: Identificación del estado x
1
en base a un observador en modo deslizante.
96 Observadores Difusos
0 100 200 300 400 500 600 700 800
-5
-4
-3
-2
-1
0
1
2
3
4
tiempo
Estado x2
x(t)
^
x
x
Figura 4.27: Identificación del estado x
2
en base a un observador en modo deslizante.
Figura 4.28: Funciones de pertenencia para B1 y B2.
4.7 Simulación 97
Figura 4.29: Funciones de pertenencia para la parte de la premisa de las reglas difusas.
Figura 4.30: Convergencia de parámetros de las reglas difusas.
98 Observadores Difusos

A
11
(-8.587) A
21
(-8.587)
y(k)
A
12
(9.3)
A
22
(9.3)
u(k)
B
1
(-2.22)
B
2
(-2.43)
Figura 4.31: A cada combinación de las variables de entrada, se asocia una consecuencia.
Conclusión 4.7 Podemos ver que se obtiene una buena aproximación del oscilador de Van
der Pol usando el neuro identificador difuso con la información adquirida a partir de la
observación de los estados x1 y x2 por medio del observador en modo deslizante, figuras
4.26-4.27. Los pequeños castañeos se deben a las dinámicas no modeladas que se encuentran
presentes. Se puede observar que con 2 reglas difusas se logra cierta aproximación del sistema
no lineal; en realidad el número óptimo de reglas difusas adecuado es un valor relativo que
se debe variar hasta obtener un resultado satisfactorio a cada problema. En la figura 4.31
se muestra que para cada combinación de las variables de entrada se asocia un valor en la
consecuencia de cada regla difusa, este resultado se logra a partir de la convergencia de los
parámetros establecidos dentro del algoritmo de optimización como se muestra en las figuras
4.28-4.30, en este caso se varían tanto la posición de las funciones Gaussianas como su
ancho, permitiendo de esta forma la identificación del sistema no lineal.
En este capítulo se han podido estimar los estados internos de un sistema no lineal
por medio de un identificador difuso y un observador en modo deslizante, el uso de este
observador es adecuado ya que para el caso de los sistemas difusos que se basan en reglas
de inferencia es necesario un observdor que sea libre de la estructura del modelo. Con la
información obtenida a partir de la estimación de los estados del sistema se puede diseñar un
4.7 Simulación 99
controlador difuso para esta clase de sistemas no lineales. En el capítulo siguiente se plantea
la posibilidad de diseño de un controlador adaptable difuso a partir de los datos obtenidos
en este capítulo.
100 Observadores Difusos
Capítulo 5
Control Difuso basado en un
Observador
Los sistema difusos y las redes neuronales son una herramienta muy acertada en el con-
trol de sistema no lineales complejos en casos cuando no se tiene información completa del
sistema o cuando se considera al sistema como una caja negra [3], [50], [51]. En este capítulo
se muestran dos alternativas de diseño para un controlador difuso, la primera alternativa es
una continuación a la opción del observador difuso Takagi-Sugeno que se mostró anterior-
mente, este opción es más simplificada que la segunda alternativa en la que se considera un
controlador adaptable difuso, el cual requiere de un algoritmo de aprendizaje como el entre-
namiento del gradiente descendente, esta segunda propuesta es una opción más general.
5.1. Introducción
Hoy en día el control difuso ha sido sugerido como una alternativa a las técnicas de control
convencionales para sistemas de control complejos. Durante la última década, el control difuso
ha atraído una gran atención de las comunidades académica e industrial. Mucha gente ha
dedicado gran parte de su tiempo y esfuerzo tanto del ámbito de la investigación como en
las técnicas de implementación a los controladores difusos [19], [22].
102 Control Difuso basado en un Observador
El control difuso es el más útil en la aplicación del conocimiento cualitativo de un sistema
para diseñar un controlador. El control difuso es aplicable generalmente a plantas que se
encuentran modeladas matemáticamente en forma pobre y donde el conocimiento cualitativo
de los operadores con experiencia pueden proporcionar control cualitativo.
Las técnicas de control difuso representan un medio para conjuntar el conocimiento hu-
mano, la habilidad y el trato con las incertidumbres dentro del proceso del control. Sin
embargo, las técnicas del control difuso sufren problemas tales como (1) el diseño del control
difuso es difícil de obtener debido a que no se dispone de las bases teóricas y (2) el desem-
peño del control difuso puede ser inconsistente debido a que éste depende principalmente de
la experiencia individual de los operadores. Sin embargo, debido al auge que ha tenido el
control difuso en la aplicación exitosa de los sistemas de control industrial, ha sido evidente
que muchos problemas olvidados pueden abordarse de una mejor manera. El análisis de es-
tabilidad y el diseño sistemático son los temas más importantes en los sistemas de control
difuso. Recientemente, se han hecho grandes esfuerzos en las investigaciones relacionadas a
este tema [4], [9].
5.2. Controladores Difusos
Cuando los sistemas difusos son usados como controladores, éstos se denominan contro-
ladores difusos. Si los sistemas difusos son usados para modelar el proceso y los contro-
ladores son diseñados en base al modelo, entonces los controladores resultantes también son
denominados controladores difusos. Por tanto, los controladores difusos son controladores
no lineales con una estructura especial. Como se ha visto, el control difuso representa la
aplicación más importante de la Teoría Difusa dentro de los problemas prácticos.
Existen dos categorías comunes para diseño de controladores difusos: una es en modelo
libre y la otra es en modelo base.
Se puede emplear un controlador al retroalimentar las variables de estado, de la forma
u = u(r, x), en lugar de aquel donde se retroalimenta la salida, que es de la forma u = u(r, y).
En la figura 5.1 se muestra la estructura del sistema en el que se hace control retroalimentando
5.3 Retroalimentación a la Salida de Sistemas Difusos TSK 103

Controlador Planta Mediciones
Estimador
Retroalimentación
de estado
Entrada de
control
automático
Entrada de
comando
r u
Estado
x y
Salida
Estado
estimado
x
^
Entrada
incierta
v
Entrada
incierta
W
Figura 5.1: Retroalimentación del estado con estimador.
las variables de estado. Si y 6= x, se debe estimar el estado, empleando x(t) ≈

x(t) como se
indica por el bloque del estimador. Esto será cierto, por ejemplo, cuando la salida y contenga
sólo algunas componentes del vector de estados x. En general, un estimador requerirá como
entradas tanto a la salida y como la entrada de control u. Con base en la entrada de control
u(t), la salida medida y (t) y el modelo del sistema dinámico, el estimador produce un estado
en lugar del estado real x(t) para producir la entrada al controlador. Si el estado completo
es medible de manera exacta, y = x, entonces no se requiere el estimador.
5.3. Retroalimentación a la Salida de Sistemas Difusos
TSK
Con el desarrollo de las redes neuronales y de los sistemas difusos, se sabe que el
conocimiento cualitativo de un sistema puede también ser representado por medio de una
forma funcional no lineal. En base a esta idea, han aparecido en el campo del control difuso
algunos modelos difusos basados en los métodos de diseño de sistemas de control difuso.
Estos métodos son conceptualmente simples y directos. Las técnicas de control lineal con
104 Control Difuso basado en un Observador
retroalimentación pueden utilizarse en el caso de estabilización con retroalimentación. El
procedimiento es el siguiente. Primero, la planta no lineal se representar por un modelo di-
fuso tipo Takagi-Sugeno. En este tipo de modelo difuso, las dinámicas locales en diferentes
regiones espacio-estado se representan por modelos lineales [27]. El modelo completo del sis-
tema se obtiene por una ”combinación” difusa de los modelos lineales a través de la función
de pertenencia difusa no lineal. El diseño del control se lleva a cabo de acuerdo en base al
modelo por medio del esquema de compensación distribuido paralelo. La idea es que, para
cada modelo lineal local, se diseña un control lineal con retroalimentación. El controlador
completo resultante, que no es lineal en general, nuevamente es una ”combinación” difusa
de cada uno de los controladores lineales. Al mismo tiempo, el problema de estabilización
robusta también ha sido considerado un caso del modelo difuso Takagi-Sugeno (T-S) [38],
[39], [43], [44].
El diseño del observador es un problema muy importante en los sistemas de control, sin
embargo, en los sistemas de control difuso, el diseño del observador difuso es tratado difícil-
mente [10]. Un problema clave es que la estabilidad del sistema total, con el controlador difuso
y el observador difuso, debe ser garantizado en el caso del modelo difuso. Una contribución
principal es el desarrollo del principio de separación; que es el diseño del controlador difuso
y del observador difuso en forma independiente [27].
Otra contribución importante de la teoría de los sistemas difusos es que proporcionan un
procedimiento sistemático para transformar una base del conocimiento humano a un mapeo
no lineal. Los sistemas difusos han sido aplicados a una gran variedad de campos alrededor del
control, procesamiento de señales, comunicaciones, manufacturación de circuitos integrados,
y sistemas expertos de negocios, medicina, psicología, etc. Sin embargo, la aplicación más
significativa se ha concentrado en los problemas de control.
5.3.1. Control con Retroalimentación a la Salida de Sistemas Lin-
eales
Considerando el sistema definido mediante
5.3 Retroalimentación a la Salida de Sistemas Difusos TSK 105
·
x= Ax +Bu
y = Cx
Suponemos que el sistema es completamente observable, pero x no está disponible para
una medición directa. Suponemos emplear el control mediante la retroalimentación del estado
observado
u = −Ke x (5.1)
En el sistema de control mediante la retroalimentación del estado observado da una
ecuación del observador

e x = (A−K
e
C)e x +Bu +K
e
y (5.2)
Tomando la transformada de Laplace de (5.1)
U(s) = −K
e
X(s) (5.3)
La transformada de Laplace de la ecuación del observador obtenida mediante la ecuación
(5.2) es
s
e
X(s) = (A−K
e
C)
e
X(s) +BU(s) +K
e
Y (s) (5.4)
donde se supuso que el estado observado inicial es cero, o e x(0) = 0. Sustituyendo (5.3) en
(5.4) y despejando
e
X(s) en la ecuación resultante, se tiene
e
X(s) = (sI)
5.3.2. Control Difuso de TSK
Muchos sistemas físicos son muy complejos en la práctica por lo que esos modelos
matemáticos rigurosos son muy difíciles de obtener, sino imposibles. Sin embargo, muchos de
estos problemas se pueden expresar de alguna forma con modelos matemáticos locales o como
una agregación de un conjunto de modelos matemáticos. Takagi y Sugeno han propuesto un
106 Control Difuso basado en un Observador
modelo difuso para describir los sistemas complejos. Podemos considerar el empleo del sigu-
iente modelo dinámico para representar un sistema complejo con múltiples entradas-múltiples
salidas, que incluya tanto modelos lineales analíticos locales y funciones de pertenencia di-
fusas [27].
Específicamente, el modelo dinámico difuso Takagi-Sugeno en tiempo continuo es descrito
por reglas difusas SI-ENTONCES, que localmente representan relaciones lineales entrada-
salida de sistemas no lineales. La regla i-ésima del modelo difuso es de la siguiente forma:
La regla i-ésima para la Planta es:
SI z
1
(t) es F
i1
y · · · y z
g
(t) es F
ig
ENTONCES
·
x(t) = A
i
x(t) +B
i
u(t)
y
i
(t) = C
i
x(t) , i = 1, 2, · · · , r
(5.5)
donde F
ij
(j = 1, 2, · · · , g) son conjuntos difusos, x(t) ∈ R
n
es el vector de estado, u(t) ∈
R
m
es el vector de salida, e y
i
(t) ∈ R
p
es el vector de salida. (A
i
∈ R
nxn
, B
i
∈ R
nxm
, C
i
∈ R
pxn
)
es una tripleta de matrices, r es el número de reglas SI-ENTONCES, y z
1
(t) v z
g
(t) son
algunas variables medibles del sistema, es decir., las variables de las premisas.
Dado un par [x(t) , u(t)], empleando el método de inferencia difusa estándar, esto es,
empleando un fuzzyficador singleton, producto de inferencia difusa y defuzzyficador media
ponderada- el estado final del sistema difuso se infiere de la siguiente forma:
·
x(t) =
r
P
i=1
w
i
[z(t)][A
i
x(t)+B
i
u(t)]
r
P
i=1
w
i
[z(t)]
=
r
P
i=1
µ
i
[z (t)] [A
i
x(t) +B
i
u(t)]
(5.6)
donde
w
i
[z (t)] =
g
Q
j=1
F
ij
[z
j
(t)] , µ
i
[z (t)] =
w
i
[z(t)]
r
P
i=1
w
i
[z(t)]
z (t) =
h
z
1
(t) z
2
(t) · · · z
g
(t)
i
F
ij
[z
j
(t)] es el grado de pertenencia de z
j
(t) en F
ij
. Se asume que
5.3 Retroalimentación a la Salida de Sistemas Difusos TSK 107
w
i
[z (t)] ≥ 0, i = 1, 2, · · · , r;
r
X
i=1
w
i
[z (t)] > 0
para toda t. De esta forma
µ
i
[z (t)] ≥ 0, i = 1, 2, · · · , r;
r
X
i=1
µ
i
[z (t)] = 1
para toda t. Por conveniencia de notación, sea w
i
= w
i
[z (t)], µ
i
= µ
i
[z (t)] ; por tanto
el estado final del sistema difuso puede representarse como
·
x(t) =
r
X
i=1
µ
i
A
i
x(t) +
r
X
i=1
µ
i
B
i
u(t) (5.7)
La salida final del sistema difuso es el siguiente:
y (t) =
r
P
i=1
w
i
[z (t)] C
i
x(t)
r
P
i=1
w
i
[z (t)]
=
r
X
i=1
µ
i
[z (t)] C
i
x(t) (5.8)
esto es,
y (t) =
r
X
i=1
µ
i
C
i
x(t) (5.9)
Definición 5.1 Si los pares (A
i
, B
i
), i = 1, 2, · · · , r; son controlables, el sistema difuso
visto en (5.5) se dice localmente controlable.
Para el diseño del controlador difuso, se supone que el sistema difuso (5.5) es localmente
controlable. Primero, los controladores con retroalimentación de estado locales son diseñados,
basados en los pares (A
i
, B
i
):
La regla i-ésima del controlador es:
SI z
1
(t) es F
i1
y · · · y z
g
(t) es F
ig
ENTONCES u(t) = −K
i
x(t) , i = 1, 2, · · · , r
(5.10)
108 Control Difuso basado en un Observador
por tanto, la salida final del controlador difuso es
u(t) = −
r
X
i=1
µ
i
[z (t)] K
i
x(t) = −
r
X
i=1
µ
i
K
i
x(t) (5.11)
donde se emplea el mismo peso µ
i
[z (t)] como el peso de la regla i-ésima del sistema
difuso (5.6). Los parámetros del controlador son K
i
en cada regla. Sustituyendo (5.11) en
(5.7), obtenemos
·
x(t) =
r
X
i=1
r
X
j=1
µ
i
µ
j
(A
i
−B
i
· K
j
) x(t) (5.12)
Una condición suficiente que garantice la estabilidad del sistema difuso se obtiene en
términos del método directo de Lyapunov. La ecuación anterior es asintóticamente estable
si existe una matriz P
1
definida positiva tal que
(A
i
−B
i
· K
i
)
T
P
1
+P
1
(A
i
−B
i
· K
i
) < 0
para i = 1, 2, · · · , r, y
³
A
i
−B
i
·K
j
+A
j
−B
j
·K
i
2
´
T
P
1
+P
1
³
A
i
−B
i
·K
j
+A
j
−B
j
·K
i
2
´
< 0
para i < j ≤ r. Estas ecuaciones se pueden resolver numéricamente de forma eficiente a
través del marco de desigualdad de matriz lineal (LMI).
Comentario 5.1 Si tenemos V (x) = x
T
P
1
x y
e
V (e x) = e x
T
P
2
e x, de acuerdo con el análisis
correspondiente, podemos satisfacer las condiciones necesarias para comprobar la estabilidad
del sistema controlador.
Comentario 5.2 El controlador difuso y el observador difuso se pueden diseñar indepen-
dientemente para ser estables y todo el sistema (con el controlador difuso y el observador
difuso) también se mantiene estable.
5.3 Retroalimentación a la Salida de Sistemas Difusos TSK 109
Comentario 5.3 En el desarrollo del principio de separación de los sistemas lineales, los
polos del sistema en lazo cerrado incluye ambos polos del sistema de control y los polos
del sistema de observación. En los sistemas difusos, el principio de separación es diferente,
la estabilidad del sistema en lazo cerrado se determina por el principio de comparación de
vector, más que por los polos.
En la práctica, todos los estados no son medibles completamente, y es necesario diseñar
un observador difuso para poder implementar el controlador difuso (5.11).
5.3.3. Control Difuso para TSK basado en un Observador
Sustituyendo (5.9) y retomando (4.13) en (4.12), obtenemos
·
b x(t) =
r
X
i=1
µ
i
A
i
b x(t) +
r
X
i=1
µ
i
B
i
u(t) +
r
X
i=1
r
X
j=1
µ
i
µ
j
G
i
· C
j
[x(t) − b x(t)] (5.13)
Usando el estado b x(t) final estimado, (5.13), y (5.11), obtenemos el siguiente controlador
difuso:
La regla i-ésima del controlador es:
SI z
1
(t) es F
i1
y · · · y z
g
(t) es F
ig
ENTONCES u(t) = −K
i
b x(t) , i = 1, 2, · · · , r
(5.14)
así, la salida final del controlador difuso es
u(t) = −
r
X
i=1
µ
i
K
i
b x(t) (5.15)
Si sustituimos (5.15) y (5.7) en (5.13), respectivamente, obtenemos
·
x(t) =
r
X
i=1
A
i
x(t) −
r
X
i=1
r
X
j=1
µ
i
µ
j
B
i
· K
j
b x(t) (5.16)
·
b x(t) =
r
X
i=1
r
X
j=1
µ
i
µ
j
(A
i
−B
i
· K
j
) b x(t) +
r
X
i=1
r
X
j=1
µ
i
µ
j
G
i
· C
j
[x(t) − b x(t)] (5.17)
110 Control Difuso basado en un Observador
Haciendo e x = x(t) − b x(t) ;entonces
·
e x(t) =
r
X
i=1
r
X
j=1
µ
i
µ
j
(A
i
−G
i
· C
j
) e x(t) (5.18)
La ecuación anterior es asintóticamente estable si existe una matriz P
2
definida positiva
tal que
(A
i
−G
i
· C
i
)
T
P
2
+P
2
(A
i
−G
i
· C
i
) < 0
para i = 1, 2, · · · , r, y
µ
A
i
−G
i
· C
j
+A
j
−G
j
· C
i
2

T
P
2
+P
2
µ
A
i
−G
i
· C
j
+A
j
−G
j
· C
i
2

< 0
para i < j ≤ r. Estas ecuaciones se pueden resolver numéricamente de forma eficiente a
través del marco de desigualdad de matriz lineal (LMI).
5.4. Control Difuso con Retroalimentación a la Salida
basado en un observador
En [16] se da un panorama de un control neuronal. Existen dos tipos de control neuronal:
control directo [21] y control indirecto [35]. El control neuronal directo se refiere cuando la
red neuronal se coloca en cascada con el sistema a controlar. En el control neuronal indirecto
el controlador se basa en la identificación del sistema no lineal, de esta forma el proceso de
identificación se convierte en una parte esencial de la construcción del controlador neuronal
[32].
La estructura general del control adaptable difuso con retroalimentación a la salida basado
en un observador en modo deslizante se muestra en la figura 5.2.
5.4 Control Difuso con Retroalimentación a la Salida basado en un observador 111


PLANTA

OBSERVADOR
EN MODO
DESLI ZANTE
CONTROL
DI FUSO
MODELO DE
REFERENCI A
Figura 5.2: Estructura general del control adaptable difuso basado en un observador en modo
deslizante.
112 Control Difuso basado en un Observador
Un modelo difuso genérico es presentado como una colección de reglas difusas en la
siguiente forma:
R
i
: SI x
1
es A
1i
y x
2
es A
2i
y · · · x
n
es A
ni
ENTONCES b y
1
es B
1i
y· · · b y
m
es B
mi
(5.19)
Empleamos l(i = 1, 2 · · · l) reglas difusas SI-ENTONCES para realizar un mapeo de un vector
lingüístico de entradas X = [x
1
· · · x
n
] ∈ <
n
a un variable lingüística de salida. A
1i
, · · · A
ni
y B
1i
, · · · B
mi
son conjuntos difusos estándar [41]. Para una variable de entrada x
i
existen l
i
conjuntos difusos. En el caso de una conexión completa l = l
1
× l
2
× · · · l
n
. De [41] sabemos
que, usando la inferencia del producto, media de centros y fuzzyficador singleton, la k-ésima
salida del sistema lógico difuso puede ser expresada como:
b y
k
=
Ã
l
P
i=1
w
ki
"
n
Q
j=1
µ
A
ji
#!
Ã
l
P
i=1
"
n
Q
j=1
µ
A
ji
#!
=
l
P
i=1
w
i
φ
i
(5.20)
donde
µ
A
ji
, µ
B
ki
son las funciones de pertenencia de los conjuntos difusos A
ji
y B
ki
,
l es el número de reglas SI-ENTONCES
w
ki
es el punto en el que µ
B
ki
= 1.
donde φ
i
está definido como:
φ
i
=
n
Q
j=1
µ
A
ji
l
P
i=1
n
Q
j=1
µ
A
ji
(5.20) se puede expresar en la forma paramétrica siguiente
b
Y
t
= W
t
Φ[X
t
] (5.21)
donde
b
Y
t
= [b y
1
· · · b y
m
]
T
, W
t
=
_
¸
¸
_
w
11
w
1l
.
.
.
w
m1
w
ml
_
¸
¸
_
, Φ[X
t
] = [φ
1
· · · φ
l
]
T
.
5.4 Control Difuso con Retroalimentación a la Salida basado en un observador 113

x
1
x
1n
A
1
A
1l1
A
n1
A
nln
φ
1
φ
2
φ
l
w
11
w
ml
y
1

y
m
CAPA I II III IV
^
^
Figura 5.3: Arquietectura del sistema adaptable difuso.
El controlador adaptable difuso se diseña a partir de la información siguiente. La es-
tructura del sistema adaptable difuso se muestra en la figura.5.3. Estas cuatro capas del
sistema difuso se han discutido en muchos documentos [25], [15]. La Capa I acepta el vector
lingüístico de entradas X (k) . Cada nodo de la capa II representa el valor de la función de
pertenencia de la variable lingüística. Los nodos de la capa III representan las reglas difusas.
La capa IV es la capa de salida, los lazos entre la capa III y la capa IV son conectados
completamente por la matriz de pesos W
k
. Las capas I y II son la parte de premisa. Las
capas III y IV son la parte de consecuencia.
De la salida b y uno puede controlar al sistema no lineal (4.14) o (4.15) por medio de
las reglas difusas, pero este modelo difuso puede reflejar sólo los pares entrada-salida. La
sección previa nos proporciona una estimación asintótica de los estados internos, si los estados
estimados x
i
en (4.16) son usados para controlar al sistema, el sistema difuso controlará al
sistema no lineal completo. Ahora el objetivo del control es hacer que todos los estados de
114 Control Difuso basado en un Observador
la planta real (4.14) o (4.15) sigan a los estados de referencia. Puede ser formulado como el
criterio siguiente:
J
m´ın
= m´ın
W
J, J = kx −x

k
2
R
(5.22)
donde x

es el estado de referencia, que satisface:
·
x

t
= h(x

t
)
Así, para cualquiera η > 0, tenemos
J ≤ (1 +η) kx −xk
2
R
+
¡
1 +η
−1
¢
kx −x

k
2
R
. (5.23)
El mínimo del término kx −xk
2
R
ya ha sido resuelto en la sección previa. Eligiendo
˜
R =
(1 +η
−1
) R, ahora podemos reformular el objetivo de la identificación como: minimizar el
término kx −x

k
2
R
. Y definiendo el error de seguimiento como
e
t
:= x
t
−x

t
(5.19) es cambiado como
R
i
: SI x
1
es A
1i
y x
2
es A
2i
y · · · x
n
es A
ni
ENTONCES b y
1
es B
1i
y· · · b y
m
es B
mi
(5.24)
Para el sistema no lineal
·
x
t
= f(x
t
) +g(x
t
)u
t
, y
t
= Cx
t
(5.25)
Si f (·) y g (·) son conocidos, podemos elegir el control u
t
para cancelar la no linealidad y
diseñar el controlador basado en la teoría de control lineal. La idea del control es:
u

=
1
g(x
t
)
[−f(x
t
) +A(x
t
−x

t
) +h(x

t
)]
donde A es una matriz estable. De esta forma el sistema en lazo cerrado es
·
e
t
= Ae
t
5.4 Control Difuso con Retroalimentación a la Salida basado en un observador 115
así
l´ım
t→∞
e
t
= 0
Puesto que f (·) y g (·) son conocidos y x
t
no está disponible, usamos el sistema difuso para
identificar f (·) y g (·) . El control adaptable es
u
t
=
1
bg(x
t
)
h

b
f(x
t
) +v
i
(5.26)
donde asumimos que b g(x
t
) 6= 0
v = Ae
t
+h(x

t
)
b
f(x
t
) = W
f
Φ
f
£
X
t
¤
b g(x
t
) = W
g
Φ
g
£
X
t
¤
(5.27)
con las reglas de actualización de peso proporcionadas por el gradiente
·
W
f
= K
f
Pe
t
Φ
f
£
X
t
¤
e
T
t
·
W
g
= K
g
Pu
c
Φ
g
£
X
t
¤
e
T
t
(5.28)
donde K
f,g
∈ <
1
e I es la matriz identidad
Teorema 5.1 Asumiendo que el sistema con retroalimentación-linealizable está en la forma
canónica de controlabilidad y el control de entrada está dado por (5.26). Haciendo que el
sistema difuso sea actualizado como:
· Si ke
t
k
2
>
η
λ
m´ın
(Q)
entonces la regla de actualización está dada por (5.28).
· Si ke
t
k
2

η
λ
m´ın
(Q)
entonces detenemos el procedimiento de aprendizaje .
De esta forma
· el error de seguimiento filtrado e(t), los parámetros del sistema difuso son acotados y
están dados en
e
t
∈ L

, W
f
∈ L

, W
g
∈ L

, (5.29)
· para cualquiera T > 0 el error de filtro cumple el siguiente desempeño de seguimiento
1
T
Z
T
0
¡
e
T
t
Qe
t
¢
dt ≤
e
T
0
e
0
T
+κη (5.30)
donde η = ε
f
+d
f
+
¡
ε
g
+d
f
¢
u, κ es el número de condición de Q definido como κ :=
λ
m´ax
(Q)
λ
m´ın
(Q)
.
116 Control Difuso basado en un Observador
Demostración.
·
e
t
= f +gu −h(x

t
) +v −v
= f +gu
c
−h(x

t
) +v −v
= f +
h
(eg + b g)
³
1
bg
h

b
f +v
i´i
−h(x

t
) +h(x

t
) +A∆
t
−v
= A∆
t
+
³
f −
b
f
´
+ (g −bg) u
c
(5.31)
Permitiendo que la función candidata de Lyapunov sea
L
t
= e
T
t
Pe
t
+tr
³
f
W
T
f
K
−1
f
f
W
f
´
+tr
³
f
W
T
g
K
−1
g
f
W
g
´
. (5.32)
Sustituyendo de (5.31) la derivada de (5.32) produce.
·
L
t
= 2e
T
t
P
³
Ae
t
+
³
f −
b
f
´
+ (g −b g) u
c
´
+2tr
Ã
·
f
W
T
f
K
−1
f
f
W
f
!
+ 2tr
Ã
·
f
W
T
g
K
−1
g
f
W
g
!
Usando (5.25) y (5.27),
f −
b
f = W

f
Φ
f
(X
t
) −
c
W
f
Φ
f
£
X
t
¤

f
= W

f
£
Φ
f
£
X
t
¤
+d
f
¤

c
W
f
Φ
f
£
X
t
¤

f
=
f
W
f
Φ
f
£
X
t
¤

f
+W

f
d
f
donde d
f
es el error del observador, ε
f
es el error de identificación difuso, y
g −bg =
f
W
g
Φ
g
£
X
t
¤

g
+W

g
d
g
Así
·
L
t
= 2e
T
t
P{Ae
t
+
f
W
f
Φ
f
£
X
t
¤

f
+W

f
d
f
+
f
W
g
Φ
g
£
X
t
¤
u
c
+
¡
ε
g
+W

g
d
g
¢
u
c
}
+2tr
Ã
·
f
W
T
f
K
−1
f
f
W
f
!
+ 2tr
Ã
·
f
W
T
g
K
−1
g
f
W
g
!
En vista de la desigualdad de la matriz
X
T
Y +
¡
X
T
Y
¢
T
≤ X
T
Λ
−1
X +Y
T
ΛY (5.33)
5.4 Control Difuso con Retroalimentación a la Salida basado en un observador 117
qué es válido para cualquiera X, Y ∈ <
n×k
y para cualquier matriz definida positiva 0 < Λ =
Λ
T
∈ <
n×n
,
2e
T

f
puede ser concluida como
2e
T

f
≤ e
T
Pl
1
Pe +ε
2
f
l
4
≤ e
T
Pl
1
Pe +ε
f
2e
T

g
u
c
puede ser concluida como
2e
T

g
u
c
≤ e
T
Pl
2
Pe +ε
2
g
u
2
c
l
5
≤ e
T
Pl
2
Pe
2

g
u
2e
T
PW

f
d
f
puede ser estimada como
2e
T
PW

f
d
f
≤ e
T
W
T∗
f
Pl
3
PW

f
e +d
T
f
l
−1
3
d
f
≤ e
T
PW

f
Pe +d
f
2e
T
PW

g
d
g
u
c
puede ser estimada como
2eW

g
d
g
u
c
≤ e
T
W
T∗
g
l
4
W

g
e + |u
c
|
2
g
d
g
l
−1
4
d
g
≤ e
T
PW

g
Pe +ud
g
Así
·
L
t
≤ L
rq
+L
w
+L
g
−e
T
Qe +η
Si usamos la regla de adaptación como:
L
rq
= A
T
P +PA +P
¡
l
1
+l
2
+W

f
+W

g
¢
P +Q
L
w
= 2tr
Ã
·
f
W
T
f
K
−1
f
f
W
f
!
+tr
©
Φ
f
£
X
t
¤ª
f
W
f
L
g
= 2tr
Ã
·
f
W
T
g
K
−1
g
f
W
g
!
+tr
©
Φ
g
£
X
t
¤
u
c
ª
f
W
g
η = ε
f
+d
f
+
¡
ε
g
+d
f
¢
u
donde L
rq
es la ecuación de Riccati estándar, la elección adecuada de la matriz estable A
puede hacerla cero, es decir, L
rq
= 0. Usando la regla de aprendizaje (5.28), L
w
= 0, L
g
= 0
118 Control Difuso basado en un Observador
· (I) si kek
2
> λ
−1
m´ın
(Q) η, usando la regla de actualización como (5.28) podemos concluir
que
·
L
t
≤ −e
T
Qe +η ≤ −λ
m´ın
(Q) kek
2
+η < 0. (5.34)
L es acotado. Integrando (5.34) desde 0 hasta T se produce
L
T
−L
0
≤ −
Z
T
0
¡
e
T
Qe
¢
dt +ηT
Debido a que κ ≥ 1, tenemos
Z
T
0
¡
e
T
Qe
¢
dt ≤ L
0
−L
T
+b
d
T ≤ L
0
+κηT (5.35)
donde κ es el número de condición de Q
· (II) si kek
2
≤ λ
−1
m´ın
(Q) η, de (5.28) los pesos se hacen constantes, L
t
permanece acotado.
Y
R
T
0
¡
e
T
Qe
¢
dt ≤
R
T
0
λ
m´ax
(Q) kek
2
dt

λ
m´ax
(Q)
λ
m´ın
(Q)
ηT ≤ L
0
+κηT
(5.36)
De (I) y (II), L
t
es acotado, (5.29) es alcanzado. Debido a que W
f,0
= W

f
y W
g,0
= W

g
,
de (5.35) y (5.36), (5.30) es obtenido. Por tanto el teorema ha sido comprobado.
5.5. Simulación
5.5.1. Control adaptable difuso
Tomando los parámetros del robot manipulador como en [24], y también incluyendo la
fricción en (4.49), es decir, l
1
= l
2
= 2r
1
= 2r
2
= 1m, m
1
= 0,8kg, m
2
= 2,3kg, v1 = v2 =
0,4, k1 = k2 = 0,8, g = 9,81. Las condiciones iniciales son
·
q(0) = [
·
q
1
(0),
·
q
2
(0)] = [0, 0],
q(0) = [q
1
(0), q
2
(0)] = [3,14, 0,6]. Asumimos que los parámetros en (4.49) son desconocidos,
sólo la posición y la velocidad de q están disponibles.
Siguiendo las reglas difusas usadas para la identificación
5.5 Simulación 119
R
i
: SI x
1
es A
1i
y x
2
es A
2i
y · · · x
n
es A
ni
ENTONCES b y
1
es B
1i
y· · · b y
m
es B
mi
(5.37)
Para el robot se puede representar como:
·
x
t
= f(x
t
) +g(x
t
)u
t
(5.38)
Puesto que f (·) y g (·) son conocidos y x
t
no está disponible, usamos el sistema difuso para
identificar f (·) y g (·) . El control adaptable es
u
t
=
1
bg(x
t
)
h

b
f(x
t
) +v
i
(5.39)
donde asumimos que b g(x
t
) 6= 0
v = Ae
t
+h(x

t
)
b
f(x
t
) = W
f
Φ
f
£
X
t
¤
b g(x
t
) = W
g
Φ
g
£
X
t
¤
(5.40)
con las reglas de actualización de peso proporcionadas por el gradiente descendente:
·
W
f
= K
f
Pe
t
Φ
f
£
X
t
¤
e
T
t
·
W
g
= K
g
Pu
c
Φ
g
£
X
t
¤
e
T
t
(5.41)
El control difuso es
τ = u
1,t
+u
2,t
u
1,t
= ϕ(x

) −
"
−2 0
0 −2
#
x

−W
t
σ(b x
t
) =
Ã
−3 cos t + sin t
cos t + 3 sin t
!
−W
t
σ(b x
t
),
u
2,t
=
"
−2 0
0 −2

q
1
q
2
!

Ã
b x
1
b x
2
!

"
3 0
0 3

·
q
1
·
q
2
!

_
_
³
·
q
1,t

·
q
1,t−τ
´

³
·
q
2,t

·
q
2,t−τ
´

_
_
donde τ = 0,1.
120 Control Difuso basado en un Observador
Figura 5.4: La respuesta característica del control derivativo incluye un defasameinto respecto
a la señal de entrada, el valor de ganancia a la salida es igual al de la entrada.
Problema 5.1 Hallar la ley de control que resuelva el problema de seguimiento para el robot
manipulador de dos grados de libertad.
Solución 5.1 Se utiliza un identificador para que nos proporcione información de los estados
del sistema y de esta forma dar una ley de control adecuada. El control adaptable difuso
presentado en esta sección se muestra en la figura.7.5 del apéndice A.
Conclusión 5.1 En este caso se emplea un control adaptable difuso que nos permite lograr
cierta trayectoria de seguimiento para una planta no lineal. En la figura 5.4 se muestra el
comportamiento del control PD usado en la compensación del sistema. El control establecido
para la planta no lineal es un control indirecto donde se realiza un proceso previo de identifi-
cación del sistema. Este proceso de identificación se logra a partir de un identificador difuso
cuyos resultados se muestran en las figuras 5.5 - 5.7. En la figura 5.14 se muestra que para
cada combinación de las variables de entrada se asocia un valor en la consecuencia de cada
regla difusa, este resultado se logra a partir de la convergencia de los parámetros establecidos
5.5 Simulación 121
Figura 5.5: Funciones de pertenencia para B
1
y B
2
.
Figura 5.6: Funciones de pertenencia para la parte de la premisa de las reglas difusas.
122 Control Difuso basado en un Observador
0 1 00 2 00 300 400 500 600
- 15
- 10
- 5
0
5
10
Ti emp o
par á me tr os
Figura 5.7: Convergencia de parámetros de las reglas difusas.

A
11
(1.3) A
21
(2.2)
y(k)
A
12
(2.5)
A
22
(1.5)
u(k)
B
1
(0.14)
B
2
(1.12)
Figura 5.8: A cada combinación de las variables de entrada, se asocia una consecuencia.
5.5 Simulación 123
dentro del algoritmo de optimización como se muestra en la figura 5.7, en este caso se varían
tanto la posición de las funciones Gaussianas como su ancho, permitiendo de esta forma la
identificación del sistema no lineal.
5.5.2. Control adaptable difuso basado en un observador en modo
deslizante
Asumiendo que sólo la posición del ángulo q es medible, la velocidad
·
q podría medirse
con el observador en modo deslizante (4.16). Para el robot manipulador de dos grados de
libertad podemos usar dos observadores:
observador (a):
·
q
a
= Aq
a
+S(q
a
, e) −Ke
t
y
a
= Cq
a
, q
a
:= [q
1
,
·
q
1
]
(5.42)
observador (b):
·
q
b
= Aq
b
+S(q
b
, e) −Ke
t
y
b
= Cq
b
, q
b
:= [q
2
,
·
q
2
]
(5.43)
Los pasos para el diseño se muestran en la figura 4.1. Como C =
h
1 0
i
, podemos escoger
A =
"
0 1
1 0
#
para hacer que el par (A, C) sea observable; se elegimos K =
"
2
2
#
> 0, por
tanto A
0
= A−KC =
"
−2 1
−1 0
#
es estable; si utilizamos Q =
"
3 1
8 3
#
, la solución para
la ecuación de Lyapunov
A
0
P+ PA
T
0
= −Q (5.44)
es definida positiva P =
"
1.5 -0.25
3.25 0
#
. Para estabilizar al manipulador, empleamos un
control difuso basado en un observador como el de modo deslizante.
De las definiciones de M, V, G y f
D
sabemos que f (x
t
, t) +g(x
t
, t)u en (4.50) es acotado,
por tanto existe una función h(x) tal que
−P
−1
C
T
h = f −Ax
124 Control Difuso basado en un Observador
Sin pérdida de generalidad, elegimos kh(x
t
, u
t
)k < ρ, ρ = 10. Para eliminar el efecto del
chattering, podemos usar el siguiente compensador de capa acotada mencionado anterior-
mente
S(x
t
, e
t
) = −
P
−1
C
T
C∆
t
kC∆
t
k
ρ =
(
−ρP
−1
C
T
sign(C∆
t
)
−ρP
−1
C
T
C∆
t

|C∆
t
| ≥ δ
|C∆
t
| < δ
(5.45)
El controlador de capa acotada enunciado ofrece una aproximación continua al modo deslizante
discontinuo dentro de la capa acotada y garantiza que el error del observador esté dentro
de cualquier vecindad cercana al origen [6]. En este caso δ = 0.01 que garantiza mejores re-
sultados. Podemos emplear q y
·
b q para modelar al robot manipulador por medio del modelo
difuso obtenido a partir de la siguiente información:
·
b q = A
n
b q +W
1,t
σ(V
1,t
b q) +W
2,t
φ(V
2,t
b q)τ (5.46)
donde b q = [b q
1
,
·
b q
1
, b q
2
,
·
b q
2
]. Escogemos W
1,t
y W
2,t
∈ R
4×3
, V
1,t
y V
2,t
∈ R
3×4
,
σ(x) =
2
(1 +e
−2x
)
−0,5, φ(x) =
0,2
(1 + e
−0,2x
)
−0,05
Las condiciones iniciales son W
T
1,0
(W

1
) = W
T
2,0
(W

2
) = V
1,0
(V

1
) = V
2,0
(V

2
) =
_
¸
¸
_
1 1 1 1
1 2 1 2
2 1 2 1
_
¸
¸
_
,
q(0) = q(0) = b q(0) = 0. Los pesos se actualizan de acuerdo a (4.31) con η = 0,2,
K
i
:= K
i
P = 10I
4
, A
n
= −2I
4
. Los resultados de identificación para q se muestran en-
seguida. Si no usamos el observador, el neuro identificador mostrado en (5.46) será de dos
dimensiones, elegimos W
1,t
y W
2,t
∈ <
2×3
, V
1,t
y V
2,t
∈ <
3×2
. Usando la misma regla de
actualización (4.31) con l = n = 2. los resultados de identificación se muestran en las figura
5.9 y 5.10. Podemos ver que el identificador basado en el observador es mejor que el neuro
identificador cuando los estados parciales son medibles.
Simulación
Podemos observar a continuación la identificación y control del robot manipulador de dos
grados de libertad considerando un observador en modo deslizante.
5.5 Simulación 125
Figura 5.9: Control basado en un observador en modo deslizante para la posición de los
eslabones.
Problema 5.2 Hallar la ley de control que resuelva el problema de seguimiento para el robot
manipulador de dos grados de libertad.
Solución 5.2 Se utiliza un controlador difuso con base en un observador en modo deslizante.
El neuro control presentado en esta sección se muestra en la figura 7.6 del apéndice A.
Conclusión 5.2 Las trayectorias de seguimiento para el control adaptable difuso basado en
un observador en modo deslizante se muestran en la figuras 5.9 y 5.10 que corresponde a la
posición y velocidad del robot manipulador. El controlador basado en la identificación com-
pleta de los estados del sistema es una mejor opción ya que permite controlar al sistema de
una forma más adecuada teniendo mayor información del sistema no lineal. El controlador
se establece por medio de un control indirecto que requiere un proceso previo de identificación
del sistema. Este proceso de identificación se logra a partir de un identificador difuso cuyo
algoritmo de optimización varía tanto la posición como el ancho de ciertas funciones Gaus-
sianas propuestas para el sistema difuso (figuras 5.11 y 5.12). En la figura 5.14 se muestra
que para cada combinación de las variables de entrada se asocia un valor en la consecuencia
126 Control Difuso basado en un Observador
Figura 5.10: Control basado en un observador en modo deslizante para la velocidad de las
juntas dq.
Figura 5.11: Funciones de pertenencia para B
1
y B
2
.
5.5 Simulación 127
Figura 5.12: Funciones de pertenencia para la parte de la premisa de las reglas difusas.
0 100 2 00 300 4 00 500 6 00 700
- 15
- 10
- 5
0
5
10
15
ti empo
par ámetr os
Figura 5.13: Convergencia de parámetros de las reglas difusas.
128 Control Difuso basado en un Observador

A
11
(-0.39) A
21
(-1.15)
y(k)
A
12
(-0.25)
A
22
(0.13)
u(k)
B
1
(-0.8)
B
2
(0.045)
Figura 5.14: A cada combinación de las variables de entrada, se asocia una consecuencia.
de cada regla difusa, este resultado se logra a partir de la convergencia de los parámetros
establecidos dentro del algoritmo de optimización, figura 5.13.
La ley de control es la siguiente:
τ = u
1,t
+u
2,t
u
1,t
= ϕ(x

) −
"
−2 0
0 −2
#
x

−W
t
σ(b x
t
) =
Ã
−3 cos t + sin t
cos t + 3 sin t
!
−W
t
σ(b x
t
),
u
2,t
=
"
−2 0
0 −2

q
1
q
2
!

Ã
b x
1
b x
2
!

"
3 0
0 3
#
_
_
·
b q
1
·
b q
2
_
_

_
_
_
_
µ
·
b q
1,t

·
b q
1,t−τ


µ
·
b q
2,t

·
b q
2,t−τ


_
_
_
_
Se puede observar que para el control adaptable difuso es necesario dar la estructura de las
reglas difusas del tipo SI-ENTONCES, no necesariamente se deben conocen los valores de los
conjuntos difusos o el número de reglas, se selecciona un método de fuzzyficación, inferencia y
defuzzyficación que nos permita obtener una solución adecuada a nuestro problema. En este
caso se emplearon reglas del tipo Mamdani y una representación del sistema con fuzzyficación
tipo singleton, inferencia por la regla del producto y defuzzyficación por media de centros.
5.5 Simulación 129
Con este modelo se pretende obtener una buena aproximación de la planta. La entrada y
la salida al sistema difuso se definen como funciones de pertenencia de tipo Gaussianas. El
algoritmo de optimización que se utiliza es el entrenamiento del gradiente descendente el
cuál modifica los parámetros de las funciones Gaussianas; tanto la ubicación del centro como
el ancho de éstas mismas de forma iterativa. El empleo del observador en modo deslizante
permite una mejor aproximación del sistema no lineal debido a que se tiene una estimación
aún mejor de los estados internos de éste, lo cual considera una mejora en la identificación
y control del sistema en cuestión.
En este capítulo se presentó el diseño de un controlador adaptable difuso que nos permi-
tiera el control de un robot manipulador de dos grados de libertad. Se empleó un identificador
difuso con base en un observador en modo deslizante para obtener una mejor estimación de
los estados internos del sistema y obtener resultados adecuados de control en la aplicación
del controlador adaptable difuso.
130 Control Difuso basado en un Observador
Capítulo 6
Conclusión
En forma general no podemos afirmar que la lógica difusa sea mejor que las redes neu-
ronales o viceversa, sencillamente que cada problema o parte de un problema requiere una
solución diferente, y cada técnica está más indicada para ciertos problema más que para
otro, con frecuencia la solución óptima consiste en una combinación inteligente de las diver-
sas técnicas de solución, de esta forma los sistemas difusos se aplican especialmente donde
existen comportamientos no lineales importantes, y se disponga de un conjunto de reglas
proporcinada por los expertos en la materia. Aunado a ello se pueden usar técnicas de esti-
mación de los estados internos del sistema para obtener una mejor información del sistema
no lineal y aplicar el diseño de un controlador que estabilice al sistema.
Los sistemas difusos son más favorables desde el punto de vista que son capaces de ex-
presar el conocimiento humano a través de reglas propias de cada individuo, y su desempeño
se realiza ajustando precisamente estas reglas mediante un algoritmo de adaptación como
en las redes neuronales.
La ventaja principal de los sistemas difusos es justamente la flexibilidad que tienen de
interpretar el razonamiento humano basado en reglas y que se pueden traducir a expresiones
matemáticas cuyo desempeño se logra variando ciertos parámetros de estas reglas; aunque
al final el resultado es igual al que se obtiene por medio de las redes neuronales, los sistemas
difusos contienen cierta información de la planta disponible a través de los expertos en la
132 Conclusión
materia, favoreciendo de esta forma la representación de modelos más completos.
En base a los resultados obtenidos en este trabajo, se puede observar que la simulación es
adecuada desde un punto de vista puramente académico, empleando sólo dos reglas difusas
se logra una aproximación satisfactoria del sistema no lineal; sin embargo, en aplicaciones
más prácticas dentro de la industria, es posible la necesidad de utilizar un número mayor de
reglas difusas con el objetivo de una mejor interpretación del sistema no lineal a través de
los sistemas difusos. El inconveniente que existe es que no hay una afirmación que precise
el número exacto de reglas difusas a utilizar para obtener los resultados requeridos en el
proceso de simulación; no obstante, de esta forma podemos asegurar un buen desempeño
empleando sólo dos reglas difusas.
Hemos visto que podemos extender las técnicas de control no lineal a casos más generales,
cuando:
1. el sistema es una caja negra,
2. sólo están disponibles los datos entradas-salidas.
Debido a que el sistema es una caja negra, son muy útiles los sistemas difusos; precisa-
mente porque solo las entradas-salidas son medibles, y de esta forma podemos propor-
cionar un observador en modo deslizante. Y finalmente podemos probar la estabilidad
de la combinación de estos dos métodos.
El desarrollo de este trabajo ha proporcionado varias experiencias positivas, asumiendo
nuevas estrategias de control, obteniendo resultados satisfactorios y de esta forma poder
establecer un precedente para este tipo de aplicaciones.
Para el diseño del control se consideran dos alternativas, en la primera se considera un
control difuso del tipo Takagi-Sugeno, el cual tiene la capacidad de sintetizar funciones
de control, proporcionar una capacidad de operación en diversas zonas de operación,
y un carácter lingüístico que le hace más accesible y que simplifica el problema. La
segunda alternativa considera el diseño de un controlador adaptable difuso, el cual
permite resolver satisfactoriamente el problema de seguimiento que se plantea.
133
La técnica de optimización utilizada por el control adaptable difuso para la segunda
alternativa de diseño fue la utilización de un observador en modo deslizante.
Una de las contribuciones principales del presente trabajo es el diseño de un control
adaptable difuso que permita estabilizar a la clase de sistemas no lineales en consideración.
Y debido a que el control es adaptable se incluyen conceptos relativos a observadores e
identificadores neuronales difusos.
Dentro de los trabajos futuros podría ser el mejoramiento del controlador en base a la
optimización de las reglas y bases de conocimiento. Así como la implementación práctica del
diseño del controlador adaptable difuso que se planteó.
134 Conclusión
Bibliografía
[1] M.Brown, C.J.Harris, Neurofuzzy Adaptive Modelling and Control, Prentice Hall: New
York , 1994.
[2] A.Canudas de Wit and J.J.E.Slotine, Sliding Observers for Robot Manipulator, Auto-
matica, Vol.27, No.5, pp. 859-864, 1991.
[3] W.C.Chan, C.W.Chan, K.C.Cheung and Y.Wang, Modeling of nonlinear stochastic dy-
namical systems using neurofuzzy networks, 38th IEEE Conference on Decision and
Control, pp. 2643-2648, Phoenix, USA, 1999.
[4] F.C.Chen and C.C.Liu, Adaptive Controlling Nonlinear Countinuous-Time Systems Us-
ing Multilayer Neural Networks, IEEE Transactions on Automatic Control, vol. 39, pp.
1306-1310, 1994.
[5] M.Y.Chen and D.A.Linkensm, A systematic neuro-fuzzy modeling framework with ap-
plication to material property prediction, IEEE Trans. Syst., Man, Cybern. B, Vol.31,
pp. 781-790, 2001.
[6] M.J.Corless and G.Leitmann, Continuous State Feedback Guaranteeing Uniform Ul-
timate Boundedness for Uncertain Dynamic Systems, IEEE Trans. Automat. Contr.
Vol.26, pp. 1139-1144, 1981.
[7] G.Cybenko, Approximation by Superposition of Sigmoidal Activation Function,
Math.Control, Sig Syst, Vol.2, pp. 303-314, 1989.
136 BIBLIOGRAFÍA
[8] A.Delgado, C.Kambahmpati, and K.Warwick, Dynamic recurrent neural network for
systems identification and control, IEE Proc.-Cont. Theo. Appl., Vol. 142, No 4, pp.
307-315, 1995.
[9] B.Egardt, Stability of Adaptive Controllers, Lecture Notes in Control and Information
Sciences, Vol.20, Springer-Verlag, Berlin, 1979.
[10] A.M.Fayaz, On the Sugeno-Type Fuzzy Observers, Proc. of 38th IEEE Conf. on Deci-
sion & Control, pp. 4828-4833, Phoneix, USA,1999.
[11] K.Funahashi, and Y.Nakamura, Approximation of dynamical systems by continuous
time recurrent neural networks, Neural Networks, Vol. 6, pp. 801-806, 1993.
[12] S.Haykin, Neural Networks- A Comprehensive Foundation, Macmillan College Publ.
Co., New York, 1994.
[13] J.Hernandez and J-P.Barbot, Sliding Observer-based Feedback Control for Flexible
Joints Manipulator, Automatica, Vol.32, No.9, pp. 1243-1254, 1996.
[14] J.J.Hopfield, Neurons with grade response have collective computational properties like
those of a two-state neurons, Proc. Nat. Acad. Sci., USA, 81, pp. 3088-3092, 1984.
[15] S.I.Horikawa, T.Furuhashi and Y.Uchikawa, On fuzzy modeling using fuzzy neural net-
works with the back-propagation algorithm, IEEE Trans. Neural Networks, Vol.3, No.5,
pp. 801-806, 1992.
[16] K.J.Hunt, D.Sbarbaro, R.Zbikowski, and P.J.Gawthrop, Neural Network for control
systems-a survey, Automatica, 28, pp. 1083-1112, 1992.
[17] P.A.Ioannou and J.Sun, Robust Adaptive Control, Prentice-Hall, Inc, Upper Saddle Riv-
er: NJ, 1996.
[18] S.Jagannathan and F.L. Lewis, Identification of nonlinear dynamical systems using mul-
tilayered neural networks, Automatica, vol.32, no.12, pp. 1707-1712, 1996.
BIBLIOGRAFÍA 137
[19] C.F.Juang, A TSK-type recurrent fuzzy network for dynamic systems processing by
neural network and genetic algorithm, IEEE Trans. Fuzzy Syst., Vol.10, pp. 155-170,
2002.
[20] Y.H. Kim and F.L. Lewis, High-Level Feedback Control with Neural Networks, World
Scientific Publ. Co., 1998.
[21] E.B.Kosmatopoulos, M.M.Polycarpou, M.A.Christodoulou and P.A.Ioannpu, ”High-
Order Neural Network Structures for Identification of Dynamical Systems”, IEEE Trans.
on Neural Networks, Vol.6, No.2, pp. 442-431, 1995. Convergence”, Neural Networks,
Vol.10, No.2, pp. 299-314, 1997. Vol.1, pp. 4-27.
[22] Lee Chuen, Fuzzy Logic in Control Systems: Fuzzy Logic Controller-Part I”, IEEE
Transactions on Systems, Man and Cybernetics, Vol 20, No. 2 March/April 1990.
[23] Y.G.Leu, T.T.Lee and W.Y.Wang, Observer-based adaptive fuzzy-neural control for
unknown nonlinear dynamical systems, IEEE Trans. Syst., Man, Cybern. B, Vol.29,
pp. 583-591, 1999.
[24] F.L.Lewis, A.Yesildirek and K.Liu, Multilayer neural-net robot controller with guaran-
teed tracking performance, IEEE Trans. on Neural Networks, Vol.7, No.2, pp. 388-399,
1996.
[25] C.T.Lin and G.Lee, Neural fuzzy systems: A neural-fuzzy synergism to intelligent sys-
tems, Prentice-Hall Inc., NJ, 1996.
[26] C.T.Lin, A neural fuzzy control system with structure and parameter learning, Fuzzy
Sets anc Systems., Vol.70, pp. 183-212, 1995.
[27] Xiao-Jun Ma, Zeng-Qi Sun, Yan-Yan He, Analysis and Design of Fuzzy Controller and
Fuzzy Observer, IEEE Trans.on Fuzzy Systems, Vol. 6, No.1, Feb. 1998.
[28] E.H.Mamdani, Application of fuzzy algorithm for simple dynamic plant, IEE
Proceedings-Control Theory and Applications, Vol. 121, No.12, 1585-1588, 1974.
138 BIBLIOGRAFÍA
[29] D.P.Mandic, A.I.Hanna and M.Razaz, A normalized gradient descent algorithm for non-
linear adaptive filters using a gradient adaptive step size, IEEE Signal Processing Let-
ters, Vol.8, No.11, pp. 295-297, 2001
[30] P.A.Mastorocostas and J.B.Theocharis, A recurrent fuzzy-neural model for dynamic
system identification, IEEE Trans. Syst., Man, Cybern. B, Vol.32, pp. 176-190, 2002.
[31] R. M. Murray, Z. Li, S. S. Sastry, A mathematical introduction to robotics manipulation,
CRC Press, 1993.
[32] K.S.Narendra and K.Karthasarathy, Identification and Control of Dynamical Systems
Using Neural Networks, IEEE Trans. Neural Networks, Vol.1, pp. 4-27, 1990.
[33] S.Nicosia and A.Tornambe, High-Gain Observers in the State and Parameter Estimation
of Robots Having Elastic Joins, System & Control Letter, Vol.13, pp. 331-337, 1989.
[34] K.Ogata, Ingeniería de Control Moderno, 3a.Ed. Prentice-Hall, 1998.
[35] G.A.Rovithakis and M.A.Christodoulou, Adaptive Control of Unknown Plants Using
Dynamical Neural Networks, IEEE Trans. on Syst., Man and Cybern., Vol. 24, pp.
400-412, 1994.
[36] I.W.Sandberg, Uniform approximation and the circle criterion, IEEE Trans. on Auto-
matic Control, Vol. 38, pp. 1450-1458., 1992.
[37] E.Sontag, Neural nets as systems models and controllers, in Proc. 7th Yale Workshop
on Adaptive and Learning Systems, pp. 73-79, Yale University, 1992.
[38] H.H.Tsai and P.T.Yu, On the optimal design of fuzzy neural networks with robust
learning for function approximation, IEEE Trans. Syst., Man, Cybern. B, Vol.30, pp.
217-223, 2000.
[39] K.Wang, and A.N.Mitchel, Robustness and perturbation analysis of a class of artificial
neural networks, Neural Networks, Vol. 7, No 2, pp. 251-257, 1994.
BIBLIOGRAFÍA 139
[40] C.H.Wang, H.L.Liu and C.T.Lin, Dynamic optimal learning rates of a certain class of
fuzzy neural networks and its applications with genetic algorithm, IEEE Trans. Syst.,
Man, Cybern. B, Vol.31, pp. 467-475, 2001.
[41] L.X.Wang, Adaptive Fuzzy Systems and Control, Englewood Cliffs NJ: Prentice-Hall,
1994.
[42] L.X.Wang, A course in Fuzzy Systems and Control, Englewood Cliffs NJ: Prentice-Hall,
1997.
[43] W.Y.Wang, T.T.Lee, C.L.Liu and C.H.Wang, Function approximation using fuzzy neu-
ral networks with robust learning algorithm, IEEE Trans. Syst., Man, Cybern. B, Vol.27,
pp. 740-747, 1997.
[44] W.Y.Wang, Y.G.Leu and C.C.Hsu, Robust adaptive fuzzy-neural control of nonlin-
ear dynamical systems using generalized projection updated law and variable structure
controller, IEEE Trans. Syst., Man, Cybern. B, Vol.31, pp. 140-147, 2001.
[45] J.C.Willems, Least Squares Optimal Control and Algebraic Riccati Equations, IEEE
Trans. on Automatic Control, Vol. 16, No 6, pp. 621-634, 1971.
[46] S.Wu and M.J.Er, Dynamic fuzzy neural networks- a novel approach to function ap-
proximation, IEEE Trans. Syst., Man, Cybern. B, Vol.30, pp. 358-364, 2000.
[47] W. Yu, Alexander S.Poznyak, Indirect Adaptive Control vía Parallel Dynamic Neural
Networks, IEE Proceedings - Control Theory and Applications, Vol.37, No.1, 1999.
[48] W. Yu and Alexander S.Poznyak, Robust Asymptotic Neuro Observer with Time Delay
Term, submitted to CDC’99
[49] Wen Yu, Marco A. Moreno, Xiaoou Li, Observer Based Neuro Identifier, IEE Proceedings
- Control Theory and Applications, Vol.147, No.2, pp. 145-152, 2000.
140 BIBLIOGRAFÍA
[50] W.Yu and X. Li, Some stability properties of dynamic neural networks, IEEE Trans.
Circuits and Systems, Part I, Vol.48, No.1, pp. 256-259, 2001.
[51] W.Yu and X. Li, Some new results on system identification with dynamic neural net-
works, IEEE Trans. Neural Networks, Vol.12, No.2, pp. 412-417, 2001.
[52] L.A.Zadeh, Fuzzy Sets, Information and Control, Vol 8, pp. 338-356, 1965.
[53] L.A. Zadeh, Fuzzy Algorithm, Information and Control, Vol.12, No.2, pp. 94-102, 1968.
[54] L.A.Zadeh, Outline of a new approach to the analysis of complex systems and decision
processes, IEEE Trans. on Systems, Man, and Cybern., Vol.3, No.1, pp.28-44, 1973
[55] L.A.Zadeh, The concept of a linguistic variable and its application to approximate
reasoning I, II, III, Information Sciences, Vol.8, pp. 199-251, pp. 301-357; Vol.9 pp.
43-88, 1975.
Appendix: diagramas
Para las diferentes simulaciones se utilizó la herramienta Matlab Simulink, a continuación
se muestran los diagramas.
Figura 7.1: Diagrama principal para el neuro identificador del robot manipulador.
142 Appendix: diagramas
Figura 7.2: Diagrama principal del observador para estimar los estados del robot de dos
grados de libertad.
Figura 7.3: Diagrama principal para la identificación del sistema de Van der Pol por medio
de un sistema difuso.
Figura 7.4: Observador en modo deslizante para el sistema de Van der Pol.
143
Figura 7.5: Diagrama principal del control neuronal adaptativo para el robot manipulador
de dos grados de libertad.
Figura 7.6: Diagrama principal del contol incluyendo el observador en modo deslizante para
la velocidad de la junta del robot.

Índice general
1. Introducción 1.1. Objetivos del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Método de solución . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3. Estructura del trabajo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4. Publicaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Lógica difusa y relación difusa 2.1. Lógica difusa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.1.1. Conjuntos Difusos y operaciones básicas de los conjuntos difusos . . . 2.1.2. Proyecciones y Extensiones Cilíndricas . . . . . . . . . . . . . . . . . 2.2. Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) . . . . . 2.2.1. De las Variables Numéricas a las Variables Lingüísticas . . . . . . . . 2.2.2. Reglas difusas SI-ENTONCES (IF-THEN) . . . . . . . . . . . . . . . 2.2.3. La Lógica Difusa y el Razonamiento Aproximado . . . . . . . . . . . 3. Sistemas Difusos y Control Difuso 3.1. Sistemas Difusos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. Control Difuso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1. Reglas Difusas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2. Dispositivo de Inferencia Difusa . . . . . . . . . . . . . . . . . . . . . 3.3. El doble papel de los sistemas difusos . . . . . . . . . . . . . . . . . . . . . . 1 2 2 3 6 7 7 8 21 23 23 26 28 31 31 36 39 39 39

. . . . . 41 42 44 49 49 50 51 53 56 58 59 60 63 70 70 101 40 4. . . Observador para un Sistema Difuso Takagi-Sugeno . . . . . . . 3. . . . . . . . .6. . . . . . . . . 104 5. . . . . Identificador Difuso basado en un Observador . Control Difuso para TSK basado en un Observador . . .5. .2. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Control Difuso basado en un Observador 5. . 3. . . 4. . . . . . . . . . 103 5. Simulación . . . . . . . . . . Identificador Difuso basado en un Observador . . . . . . . . . . . . . . .2. . . . . . . .ii ÍNDICE GENERAL 3. . . .7. . . . . . . . . . . . . . . . . . . . . . . . . .5.1.4. . . . . . . . . . .1. .3. . . . . . . . . . .6.5. . . . . 4. . . 102 5. .3.2. 4. . . . . .3. . . Control con Retroalimentación a la Salida de Sistemas Lineales . . . . .4. . . . . . . . . . . . . . . . . Observadores Difusos . . . . . . . . . . . . . Estructura del Sistema Difuso . . . . . . . . . . . . . Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente . . . . . . . . .2. . . . . . . . .7.5. . . . Observadores . . 3. . . . . . . . . . Diseño de los Parámetros por el Gradiente Descendente . . Retroalimentación a la Salida de Sistemas Difusos TSK . . . . . . . Los sistemas difusos como aproximadores Universales . . . . 4. . . . . . .3. . . . . 118 5. . . . . . . . . . . . . . .5. . . . . . Identificador Neuronal Difuso .2. . . . 4. . . . . Simulación .1. . . . . . . Control adaptable difuso . . . . . Identificación de sistemas no lineales .5. . 4. . . . . . . . . . . .3. . 101 5. Control adaptable difuso basado en un observador en modo deslizante 123 . . . . . . . . . . . . . . . .5. . . . . . . . . . . . . . . . . . . . . Análisis de estabilidad . . . .6. . . . . . . . . . . . . . . . . Introducción . .3. . . . Observador en modo deslizante . . . . . . 4. Controladores Difusos . . .1. . . . . . . . . . . . . . . . . . . . . . . . . Observadores Difusos 4. 4. . . . . . .2. . . . . . . . .3. . . . . . . . . . . . . . . . . . . 110 5. . . . . . . . . 5. . . 109 5. . . 118 5. . . . . Control Difuso con Retroalimentación a la Salida basado en un observador .1. . . .6. Introducción . . . . . . .4. . . . . . . . . . . . . . . . . . . . . . . . . . . . 105 5. . . . . 4. . . Control Difuso de TSK . . 4. .1. . . . . . . . . . . . .1. .

ÍNDICE GENERAL 6. Conclusión Appendix: diagramas iii 131 141 .

iv ÍNDICE GENERAL .

particularmente en el dominio de reconocimiento de patrones. las clases de objetos encontradas en el mundo físico real no tienen definido de forma precisa su criterio de pertenencia". Sin embargo. o "la clase de las mujeres altas". o "la clase de los hombres jóvenes". Desde que las teorías de control clásicas se han combinado dentro de los sistemas difusos. comunicación de información y abstracción. y llamando a un tipo de conjuntos que encierran una propiedad específica. el control difuso ha mostrado ser una aproximación exitosa para los sistemas no lineales complejos. A partir de los primeros resultados presentados por Zadeh [53] y las primeras aplicaciones en los procesos de control realizadas por Mamdani [28]. desempeñan un papel importante en el pensamiento humano. imprecisamente llamados clases. definiendo el universo de discurso. Podemos observar con claridad que "las clases de todos los números reales mucho más grandes que 1". funciones de pertenencia. los datos restantes. ha surgido un gran número de análisis de estabilidad y resultados de síntesis en el control . tal como el 10 con relación a la clase de todos los números reales que son mucho más grandes que 1. Zadeh escribió su celebre artículo “Fuzzy Sets” [52] en el que menciona que “Muy comúnmente. como el área dónde se atribuyen cualidades o se califican determinadas variables. Zadeh estableció en su artículo las bases principales del lenguaje difuso. no constituyen clases o conjuntos en el sentido matemático usual.Capítulo 1 Introducción En 1965 Lofti A. Esta misma ambigüedad crece en el caso de un número.

los controladores adaptables difusos.. etc. los neuro controladores difusos. Los sistemas de control difuso son una herramienta muy versátil. [25].2 Introducción difuso. no existe una metodología exacta que nos permita resolver los problemas de identificación y control de estos sistemas. invirtiendo de esta forma menor esfuerzo por parte de la comunidad interesada en encontrar nuevas alternativas.1. 1.2. La motivación principal de este trabajo es que: "Si algunos estados internos de un sistema no lineal no se pueden medir. 1. empleando los principios de los sistemas difusos. permitiendonos de esta forma . Hoy en día se ha mostrado que la combinanción de nuevas tecnologías tales como las redes neuronales y la lógica difusa han permitido surgir nuevos conceptos como los neuro identificadores difusos. que nos proporcionan un medio bastante efectivo en la búsqueda de soluciones para una amplia gama de sistemas con información parcial o ninguna información de sus modelos. Método de solución De acuerdo a la complejidad y a la gran variedad de sistemas no lineales que abundan en la naturaleza. entonces ¿cómo podemos diseñar un controlador difuso basado en los datos entrada-salida que nos permita estabilizar tal sistema?". por tanto basándonos en el conocimiento de que las redes neuronales y la lógica difusa son estimadores universales provistos con la capacidad de aproximar cualquier función no lineal a cualquier precisión que se pida [1]. podemos emplear estos conceptos como una buena alternativa en la solución a los problemas de identificación y control para la clase de sistemas de nuestro interés. [5]. Objetivos del trabajo El objetivo general de esta tesis es proponer una herramienta que resuelva los problemas de identificación y control para cierta clase de sistemas no lineales complejos. prometiendo mayores y mejores adelantos en la solución de problemas de alta complejidad dentro del área ingenieríl. Muchos autores en el campo de esta tecnología proclaman que el control difuso está revolucionando el control.

y para poder estimar los estados internos del sistema no lineal se utiliza un observador libre de la estructura del sistema como por ejemplo un observador en modo deslizante. El propósito de este capítulo es dar de forma breve una introducción teórica al conocimiento tan extenso de la lógica difusa. etc. El problema que se plantea nos permite enfocarnos en nuevas tendencias del control. 3 En la figura 1. cuya necesidad se ha extendido en una amplia variedad de aplicaciones. operaciones difusas. variable lingüística.1 se muestra un panorama general para dar solución al problema que se ha planteado en la tesis. se dan dos diferentes puntos de vista que nos podrían proporcionar la información requerida acerca del sistema no lineal: el primero se basa en la estimación de los estados internos del sistema por medio de un observador difuso tipo TSK y de acuerdo con esta información poder diseñar un controlador de igual forma apoyado en los principios de la lógica difusa [27].3 Estructura del trabajo encontrar diferentes medios de solución para un mismo problema. 1. Este último caso es más general y por lo tanto de mayor interés. Estructura del trabajo Esta tesis está organizada de la siguiente forma: En el capítulo 1 se plantea la necesidad de nuevas estrategias de identificación y control que nos permitan hacer frente a problemas de alta complejidad que caracterizan a los sistemas inmersos en el entorno que nos rodea y que se encuentran presentes en muchas aplicaciones del área ingenieríl. a partir de la publicación de Lofti Zadeh aparecen nuevas definiciones para los conjuntos clásicos. con la información obtenida poder dar una ley de control para el sistema en cuestión [49]. función de pertenencia o inclusión. En el capítulo 2 se revisan los conceptos básicos de la lógica difusa.3. así.1. poderosas herramientas en la identificación y control de sistemas no lineales complejos. como son los sistemas de control difuso en combinación con conceptos tales como las redes neuronales artificiales. Se enuncia el significado de palabras tales como conjunto difuso. . En el segundo caso se emplea la identificación basada en los conceptos de las redes neuronales y los sistemas difusos.

4 Introducción Lógica D ifusa Sistem as D ifusos y C ontrol D ifuso Identificación de los estados internos del sistem a Observador difuso Identificador difuso O bservador TSK C ontrolador TSK identificador difuso por medio de un observador en m odo deslizante C ontrolador adaptable difuso basado en un observador en m odo deslizante Simulación Figura 1. .1: Esquema general de la tesis.

existen diferentes tipos de sistemas de control difuso como son los de tipo Mamdani y los del tipo Takagi-Sugeno-Kang (TSK). un controlador. En el capítulo 4 se muestra la aplicación de las redes neuronales y de los sistemas difusos dentro del área de la identificación de sistemas no lineales. en la primera propuesta se utiliza un sistema de control tipo Takagi-Sugeno que es parte de la continuación a la estimación de los estados internos del sistema por medio de un observador TSK.3 Estructura del trabajo 5 En el capítulo 3 se muestra que la aplicación más importante de la lógica difusa son los sistemas difusos y en especial los sistemas de control difuso. Podemos ver que este tipo de sistemas se pueden emplear muy bien en la identificación y control de sistemas no lineales complejos gracias a la capacidad que tienen de aproximar sistemas no lineales con una buena exactitud. Los sistemas difusos son sistemas basados en el conocimiento o en reglas. En el capítulo 5 se plantea el problema de seguimiento para un sistema no lineal. Se definen las características básicas de estos sistemas. este planteamiento es más general y de mayor interés en la solución para el control de sistemas no lineales complejos. . lo que simplifica el problema mostrándolo como un caso lineal. de los cuales no se cuenta con toda la información y cuyos modelos matemáticos son muy complejos. la primera es por medio de la aplicación de los observadores difusos para sistema tipo TakagiSugeno y en el segundo método se introduce un observador en modo deslizante así como su diagrama de diseño. también se muestra el análisis de estabilidad de éste último. esto es con el fin de estimar los estados internos del sistema no lineal y de esta forma identificar la planta por medio de un neuro identificador difuso. en el segundo procedimiento se define un error de seguimiento y de esta forma se propone un neuro controlador adaptable difuso. el modelo de la planta y el modelo de referencia así como un algoritmo de adaptación. Se muestran dos formas para la estimación de los estados internos del sistema no lineal.1. Las partes de que consta un controlador adaptable son un identificador. y de igual forma que en el capítulo anterior se presentan dos alternativas. que en éste caso podría ser el entrenamiento del gradiente descendente [29].

6 Introducción 1. Publicaciones Parte de esta tesis se presentó como el artículo titulado Fuzzy Output Feedback Control via Sliding Mode Observer. International Symposium on Robotics and Automation. Toluca.4. 2002 . Mexico.

H. J. Mamdani diseñó un controlador difuso para un motor de vapor [42]. Zadeh aplicó la lógica multivaluada a la teoría de conjuntos. estableciendo la posibilidad de que los elementos pudieran tener diferentes grados de pertenencia a un conjunto.1.Capítulo 2 Lógica difusa y relación difusa La mayoría de las definiciones que a continuación se citan son extraídas de [42] y [41]. cuando E. aunque estos conjuntos no tuvieron aplicación práctica hasta mediados de los años setenta. 2. En 1965. se presentan los conceptos básicos que describen a la lógica difusa y a los sistemas de control difuso. Lógica difusa En la década de los años veinte de este siglo. difuso) y desarrolló un álgebra completa para los conjuntos difusos. L. En la lógica borrosa o difusa se trabaja con conjuntos. cuyos enunciados pueden tener valores de verdad comprendidos entre el 0 (FALSO) y el 1 (CIERTO) de la lógica binaria clásica. Lukasiewicz desarrolló los principios de la lógica multivaluada. . Zadeh introdujo el término fuzzy (borroso. que se denotan como µC (x) e indican el grado de pertenencia (entre 0 y 1) del elemento con valor x al conjunto C. que se definen por sus funciones de pertenencia.

A continuación se presentan los aspectos básicos de la lógica difusa. formalizando el conocimiento a veces ambiguo del experto (o el sentido común) de una forma realizable. Si la temperatura es alta entonces enfriar mucho. normalmente pueden realizarse en sistemas baratos y rápidos. como por ejemplo. han aparecido análisis de estabilidad y resultados de síntesis en control difuso. y resultan interesantes para problemas no lineales o no bien definidos.8 Lógica difusa y relación difusa La denominada lógica difusa (fuzzy logic) permite tratar información imprecisa. 2. Los sistemas difusos permiten modelar cualquier proceso no lineal. Desde los resultados presentados por Zadeh y sus primeras aplicaciones en procesos de control demostrados por Mamdani. Conjuntos Difusos y operaciones básicas de los conjuntos difusos De los Conjuntos Clásicos a los Conjuntos difusos Sea U el universo de discurso. Debido a que muchas teorías del control clásico se combinan en los sistemas difusos.1. Recordando que un conjunto clásico (crisp) A. por medio de grupos de reglas que producen uno o varios valores de salida. Y gracias a la simplicidad de los cálculos. De esta manera. o conjunto universal que contiene todos los elementos posibles que concierne a cada contexto en particular o aplicación. Los sistemas basados en lógica difusa pueden ser aplicados a problemas similares que las redes neuronales. Estos conjuntos borrosos se combinan en reglas para definir acciones. en términos de conjuntos borrosos o difusos (imprecisos en definitiva). en el universo de discurso U se puede definir .1. y aprender de los datos haciendo uso de determinados algoritmos de aprendizaje (como los de las propias redes neuronales). como estatura media. o simplemente el conjunto A. el control difuso ha probado ser una excelente aproximación para sistemas no lineales complejos. temperatura baja o mucha fuerza. los sistemas de control basados en lógica difusa combinan unas variables de entrada (definidas en términos de conjuntos difusos). Estos sistemas permiten utilizar fácilmente el conocimiento de los expertos en un tema.

debido a que muchos componentes de los autos que se consideran americanos (por ejemplo. La teoría de conjuntos clásica requiere que un conjunto debe tener una propiedad bien definida. función discriminante. Sin embargo. esto sólo para conjuntos finitos. Chryslers) son producidos fuera de Estados Unidos de América. Una perspectiva es que un auto es un auto americano si tiene el nombre de auto manufacturado en Estados Unidos de América.2) El conjunto A es equivalente matemáticamente a su función de pertenencia µA (x) en el sentido que conociendo µA (x) conocemos al propio A. mucha gente siente que la distinción entre un auto americano y uno no americano no es como en un conjunto crisp.Podemos enlistar los elementos del conjunto. por tanto es incapaz de definir el conjunto como ”todos los autos americanos en Los Angeles”. De forma más general podemos establecer una regla que cumplan los elementos que pertenezcan al conjunto A y que podemos representar como A = {x ∈ U | cumple ciertas condiciones} (2. algunos autos ”no americanos” son manufacturados en los EUA.2. denotado por µA (x) . Ford. o función indicador) para A. Para afrontar esta limitación de la teoría de conjuntos clásica.1) Podemos citar otro método para definir el conjunto A. se introdujo el concepto de conjunto difuso. Además. ¿Qué se puede hacer para enfrentar este problema? Esencialmente. la dificultad del ejemplo anterior muestra que algunos conjuntos no tienen fronteras claras.1 Lógica difusa 9 o estando todos sus miembros o especificando las propiedades que pueden satisfacer los elementos del conjunto. que introduce una función de pertenencia (también llamada función característica. . nos presentamos con una dificultad. El resultado de esa limitación es fundamental y es necesaria una nueva teoría: la teoría de conjuntos difusos. el método de pertenencia. tal que ( 1 si x ∈ A µA (x) = 0 si x ∈ A / (2. GM. Si queremos definir un conjunto en U de acuerdo a si el auto es un auto americano o no. (EUA) de otra forma no es un auto americano.

u. Los elementos de un conjunto difuso se denotan por letras minúsculas normales como x. y. A es comúnmente escrito como Z A= µA (x) /x U (2. Un conjunto difuso A en U puede representarse como un conjunto de pares ordenados de un elemento genérico x y de su valor de pertenencia. etc. etc. U = R). B. por ejemplo los conjuntos difusos A.4) donde el signo de integral no denota integración. un conjunto difuso es una generalización de un conjunto clásico permitiendo que la función de pertenencia tome cualquier valor en el intervalo de [0. denota la colección de todos los puntos escrito como x ∈ U con la función de pertenencia asociada µA (x). Regresando al ejemplo anterior y empleando el concepto de conjunto difuso se pueden definir el conjunto de autos americanos . C. para las variables lingüísticas se utilizarán letras normales con gorro. 1]. Notación Los conjuntos difusos se denotan por letras mayúsculas normales. como x. es simplemente un conjunto con una función de pertenencia continua. En otras palabras la función de pertenencia de un conjunto clásico puede tomar solo dos valores -cero y uno-. 1]. mientras que la función de pertenencia de un conjunto difuso es una función continua con rango entre [0.. b b Por tanto. Cuando U es discreto.1 Un conjunto difuso en el universo de discurso U se caracteriza por una función de pertenencia µA (x) que toma valores en el intervalo [0. B. L. A = {(x. Las matrices se denotan por letras mayúsculas oscuras como la matriz A.3) (2.10 Lógica difusa y relación difusa Definición 2. denota la colección de todos los puntos x ∈ U con la función de pertenencia asociada µA (x). y . µA (x)) | x ∈ U } Cuando U es continuo (por ejemplo. 1]. etc. Podemos ver de la definición que no existe nada incierto de la definición de conjunto difuso.5) donde el signo de sumatoria no representa adición aritmética. C. etc. A es comúnmente A= X U µA (x) /x (2.

6.6=1.6) donde p (x) es el porcentaje de las partes del auto x hechas en EUA y toma valores entre 0 % y 100 %.6). entonces decimos que el auto x0 pertenece al conjunto D en el grado de 0. Por tanto una posible función de pertenencia para Z es µZ (x) = e−x 2 (2. Para definir el conjunto de autos americanos en Los Angeles denotado por D. denotado por F. Por supuesto. podemos definir el conjunto de autos no americanos en Los Angeles. Esta es una función Gaussiana con media igual a cero y desviación estándar igual a uno. si un auto particular x0 tiene el 60 % de todas sus partes hechas en EUA. Específicamente.1 muestra (2. como el conjunto difuso con la función de pertenencia µF (x) = 1 − p (x) (2.9) . Por ejemplo.4.8) donde x ∈ R.1 Lógica difusa 11 y no americanos. También podemos definir la función       µZ (x) =      de pertenencia para Z como 0 x+1 0 si x < −1 1 − x si 0 ≤ x < 1 si 1 ≤ x si −1 ≤ x < 0 (2. los números 0 y 2 pertenecen al conjunto difuso Z en un grado de e0 = 1 y e−4 .7).7) donde p (x) es lo mismo que en (2. Similarmente.2. De esta manera. respectivamente. La figura 2. como un conjunto difuso de acuerdo al porcentaje de las partes del auto hechas es EUA. un elemento puede pertenecer a diferentes conjuntos difusos en el mismo o en diferente grado. Podemos definir a Z como el conjunto nombrado números cercanos al cero. si un auto en particular x0 tiene el 60 % de sus partes hechas en EUA. D se define por la función de pertenencia µD (x) = p (x) (2. De acuerdo a esta función de pertenencia. entonces podemos decir que el auto x0 pertenece al conjunto difuso F en un grado de 1-0.6) y (2.

Por el contrario. las funciones de pertenencia por sí solas no son difusas . (2.9). Comentario 2. Sin embargo. esencialmente se le quita lo difuso a la descripción difusa. De acuerdo a esta función de pertenencia. números cercanos al cero.1: Función de pertenencia para autos americanos (µD ) y no americanos (µF ) basados en el porcentaje de las partes del auto hechas en EUA (p (x)) . lo cual no es una descripción precisa. De esta forma.1 Las propiedades empleadas para caracterizar conjuntos difusos usualmente son difusos.3).9) se pueden observar en las figuras (2. por ejemplo.8) y (2. respectivamente. estos conjuntos difusos son usados para no ver al mundo de forma difusa.12 Lógica difusa y relación difusa 1 µF µD 0 100 p(x) Figura 2. caracterizando una descripción difusa con una función de pertenencia. por ejemplo. ”números cercanos al cero” se representa por la función de pertenencia (2. Así.2 La observación anterior es una cuestión importante: ¿cómo determinar las . Se pueden elegir muchas otras funciones de pertenencia que caractericen a números cercanos a cero.2) y (2.en realidad son funciones matemáticas precisas -. respectivamente. Podemos señalar tres observaciones importantes sobre los conjuntos difusos: Comentario 2. nada será difuso después. los números 0 y 2 pertenecen al conjunto difuso Z en un grado de 1 y 0.8) o (2. Una vez que una propiedad difusa es representada por una función de pertenencia. podemos usar diferentes funciones de pertenencia para caracterizar la misma descripción. Un malentendido común de la teoría de conjuntos difusos es que la teoría de conjuntos difusos trata de hacer difuso al mundo.

2: Función de pertenencia posible para caracterizar ”números cercanos al cero”.2. µ 1 -1 1 x Figura 2.1 Lógica difusa 13 1 µ 0 x Figura 2.3: Otra posible función de pertenencia para caracterizar ”números cercanos al cero”. .

cuando damos una función de pertenencia. cuando decimos un conjunto difuso. por ejemplo.14 Lógica difusa y relación difusa funciones de pertenencia? Debido a que existe una variedad de elecciones para las funciones de pertenencia. es decir.9) son usadas para caracterizar la misma descripción de ”números cercanos al cero”. punto elevado. podríamos emplear diferentes etiquetas para representar los conjuntos difusos (2. primero se definen las estructuras de las funciones de pertenencia y de esta forma se ajustan los parámetros de las funciones de pertenencia basadas en los datos. Usualmente. Definición 2.9). singleton difuso. centro.8) y (2. Hablando rigurosamente.8) y µZ2 (x) en (2. podríamos usar µZ1 (x) en (2. ésta representa un conjunto difuso. se necesita un ajuste más fino. . Esto es. Un conjunto difuso tiene una correspondencia uno a uno con su función de pertenencia. existe una función de pertenencia única asociada con éste. punto de cruce. esta aproximación puede darnos una fórmula rígida de la función de pertenencia. conjunto difuso convexo y proyecciones. sin embargo algunos de ellos son únicos dentro del marco de los conjuntos difusos. Para la segunda aproximación. Conceptos Básicos asociados con los Conjuntos Difusos Muchos de estos conceptos son una extensión de los conceptos básicos de un conjunto clásico (crisp). Ya que los conjuntos difusos son en ocasiones empleados para formular el conocimiento humano. existen dos aproximaciones para determinar una función de pertenencia.2 A continuación se definen los conceptos de soporte. La primera aproximación es usar el conocimiento humano de los expertos. debería enfatizarse que aunque (2.9). conjunto difuso normal. α-corte. recíprocamente. preguntar a los expertos del campo para especificar las funciones de pertenencia. estos son diferentes conjuntos difusos. Específicamente. empleamos una colección de datos provenientes de varios sensores para determinar las funciones de pertenencia. las funciones de pertenencia representan una parte del conocimiento humano. Comentario 2. ¿cómo podemos elegir una de estas opciones? Conceptualmente.8) y (2.3 Finalmente.

La figura 2.5 muestra los centros de algunos conjuntos difusos típicos. El soporte (support) de un conjunto difuso A en el universo de discurso U es un conjunto crisp que contiene todos los elementos de U que no tienen valores de pertenencia igual a cero en A.10) donde supp(A) denota el soporte del conjunto difuso A. Un singleton difuso es un conjunto difuso cuyo soporte es un único punto en U . 6. junto difuso "varios"en la figura 2. Si el soporte .1 Lógica difusa 15 µvarios(x) 1 0. Por ejemplo. entonces el centro se define como el más grande (más pequeño) entre todos los puntos que alcanzan el valor de pertenencia máximo.5 x entero 1 2 3 4 5 6 7 8 9 10 Figura 2.4: Función de pertenencia para el conjunto dufuso "varios". si el valor medio es igual a un infinito positivo (negativo).4 es el conjunto de enteros {3. 8}. 4.2.5. El punto de cruce de un conjunto difuso es el punto en U cuyo valor de pertenencia en A es igual a 0. por tanto se define este valor medio como el centro del conjunto difuso. supp(A) = {x ∈ U | µA (x) > 0} (2. se le llama conjunto difuso vacío. 7. El centro de un conjunto difuso se define como: si el valor medio de todos los puntos en el cuál la función de pertenencia del conjunto difuso alcanza su máximo valor es finito. esto es. 5. el soporte del conde un conjunto difuso esta vacío.

1] . Si el punto elevado de un conjunto difuso es igual a uno.3 son iguales a uno. Un conjunto difuso A se dice convexo si y solo si α-corte Aα es un conjunto convexo para cualquier α en el intervalo (0. 1] . .0. para α = 0. (2.3 son por tanto conjuntos difusos normales. Aα = {x ∈ U | µA (x) ≥ α} crisp [-0. Se asume que A y B son conjuntos difusos definidos en el mismo universo de discurso U. es [-0.3 el α-corte del conjunto difuso (2.7].9. Por ejemplo. Todos los conjuntos difusos en las Figuras 2. se le llama conjunto difuso normal. Los conceptos básicos de las secciones anteriores conciernen a un sólo conjunto difuso.1.0.3) es el conjunto Cuando el universo de discurso U es el espacio Euclidiano n-dimensional Rn . que contiene todos los elementos en U que tienen valores de pertenencia en A mayores o iguales a α. el concepto de convexidad se puede generalizar al conjunto difuso. y para α = 0. esto es.1-2. los puntos elevados de todos los conjuntos difusos en las Figuras 2.5: Centros de algunos conjuntos difusos típicos. Un α-corte de un conjunto difuso A es un conjunto crisp A. El punto elevado de un conjunto difuso es el valor de pertenencia más grande obtenido por cualquier punto.16 µ A1 A2 A3 Lógica difusa y relación difusa A4 centro de A1 centro centro de A2 de A3 centro de A4 Figura 2.11) Por ejemplo.1-2.9) (figura 2.7.

denotado por A ⊂ B si y sólo sí µA (x) ≤ µB (x) para todo x ∈ U .13) contiene a ambos A y B ya que m´x [µA (x) . denotado por A ∪ B cuya función de µA∪B (x) = m´x [µA (x) . µB (x)] = a que contiene a ambos A y B. a+b-1) y B. µB (x)] a (2. entonces µC (x) ≥ µA (x) y µC (x) ≥ µB (x) .12) La unión de A y B es un conjunto difuso en U . lo que significa que A ∪ B definido como en (2. entonces también contiene la unión de A y B. si C es cualquier conjunto difuso conteniendo a A a µA∪B .1 Lógica difusa 17 Definición 2.14) La unión de A y B es el conjunto difuso más pequeño que contiene a A y B.3 La igualdad. Se dice complemento de A es un conjunto difuso A en U cuya función de pertenencia es definida por (2. A ∪ B definido como en (2. Algunas de las más usadas son: Conomas MAX(a. Si C es cualquier conjunto difuso que contiene a A y B.13) es el conjunto difuso más pequeño Las funciones que definen la unión y la intersección pueden generalizarse a condición de cumplir ciertas restricciones. Además. Por tanto.La intersección se justifica de igual manera. µC (x) ≥ m´x [µA (x) . El µA (x) = 1 − µA (x) pertenencia esta definida como Decimos que A y B son iguales si y sólo sí µA (x) = µB (x) para todo x ∈ U . unión e intersección de dos conjuntos difusos A y B se definen a continuación que B contiene a A.b) (a+b-ab) MIN(1.b) (ab) MAX(0. µB (x)] ≥ µB (x).2.a+b) Normas MIN(a. Las funciones que cumplen estas condiciones se conocen respectivamente como Conorma Triangular (T-Conorma) y Norma Triangular (T-Norma). µB (x)] ın (2.13) La intersección de A y B es un conjunto difuso A ∩ B en U con función de pertenencia µA∩B (x) = m´ [µA (x) . µB (x)] ≥ µA (x) a y m´x [µA (x) . contención complemento. .

completitud es el porcentaje de los elementos de U para los que existe en la partición un conjunto con pertenencia no nula frente al total de elementos de U. Los nombres de los conjuntos difusos que forman una partición se suelen expresar en forma abreviada por sus iniciales. pues la complejidad no es excesiva y permiten una precisión suficiente en la descripción de los valores de la variable. Una partición de A es uno de los subconjuntos que pueden formarse con los elementos (términos) de T (A). Alto}. Negativo Pequeño. PL} (Negative Large. . NP. Se conoce por partición a un conjunto de los conjuntos difusos que se han definido para la variable A. {NL. ZE. los conjuntos definidos cubren todo U ). respecto del número total de elementos que lo forman. y en número impar.de controladores basados en lógica difusa se han de definir particiones de las variables del controlador.18 Lógica difusa y relación difusa Como en la lógica clásica. Normalmente se recomienda que estas particiones sean completas. {µBajo (t). se recomienda definir conjuntos de tipo T (triangulares) en torno a puntos singulares. Así. Zero. es posible establecer en ella diversas particiones. {Bajo. el solapamiento de un conjunto difuso es la relación del número de elementos que comparte con otros conjuntos de la misma partición. definida en un rango entre u1 y u2 . con un solapamiento del 20 % al 50 %. Además. así. Medio. una partición típica como {Negativo Grande. Cero. Positive Small. en ingles. PG} o. para la variable "estatura" una posible partición sería la correspondiente a la figura 2. así. Positivo Grande} se representa como {NG. µM edio (t). Normalmente se emplean particiones de 3 o 7 conjuntos. CE. las Conormas y Normas cumplen las leyes de Morgan que las relacionan.6. PS. Se dice que dos conjuntos difusos están solapados si su intersección es no nula. Particiones Difusas Dada una variable difusa A. Para la realización . como el cero. cada uno identificado por una etiqueta. Positive Large). con tres subconjuntos difusos. NS. Negative Small. Positivo Pequeño. PP. de este modo. y una función de inclusión o pertenencia. µAlto (t)}. Se dice que una partición es completa si para todos los valores posibles de U existe en la partición un conjunto con pertenencia no nula (es decir.

que se caracteriza por tratarse de un razonamiento de tipo aproximado. Inferencia Difusa También como en el caso de la lógica clásica. y de éstas a su vez con un Álgebra de Boole. De esta forma. es posible también definir un isomorfismo entre la lógica y la teoría de conjuntos difusos. denotado por U × V . la lógica difusa se ocupa del razonamiento formal con proposiciones.1 Lógica difusa 19 Bajo Medio Alto µA(x) x Figura 2. El producto Cartesiano de U y V . pero a diferencia de ésta.15) . los conjuntos difusos también representan predicados en la lógica proposicional. Relaciones Difusas y el Principio de Extensión Sean U y V dos conjuntos clásicos arbitrarios. El objeto de la lógica difusa es proporcionar un soporte formal al razonamiento basado en el lenguaje natural. v) tal que u ∈ U y v ∈V.2.6: Conjuntos difusos para la variable Estatura. v) | u ∈ U y v ∈ V } (2. los valores de las proposiciones pueden tomar valores intermedios entre verdadero y falso. que hace uso de unas proposiciones que a su vez expresan información de carácter impreciso. U × V = {(u. De la misma forma que se define un isomorfismo entre la lógica y la teoría de conjuntos clásica. es el conjunto no difuso de todos los pares ordenados (u.

. . . . . . Un entonces del producto Cartesiano U1 × U2 × . . El principio de extensión permite convertir conceptos no difusos en difusos. U2 . . . . u2 . una relación binaria entre conjuntos (no difusos) U y V es un © ª Q = ((u1 . . . . Sean U y V dos universos de discurso. . . Como un caso especial. . . En general el producto Cartesiano de n conjuntos no difusos arbitrarios U1 . .4 Una relación difusa es un conjunto difuso definido en el producto Cartesiano de conjuntos crisp U1 . Un ) ⊂ U1 × U2 × . un ) | u1 ∈ U1 . u2 . U2 .20 Lógica difusa y relación difusa El orden en que aparecen U y V es importante. es el conjunto no difuso de todas las n-tuplas (u1 . × Un = {(u1 .18) (2. . . . . . un ) U1 × U2 × . . una matriz cuyos elementos son los valores de pertenencia de los pares correspondientes a la relación difusa. µA (x)) | x ∈ U } una relación difusa Q en U1 × U2 × .19) donde µQ : U1 × U2 × .16) V ×U. . denotado por U1 ×U2 ×. Con el esquema de representación A = {(x. . esto es. u2 . un) . . . . . Un ) para Q (U1 . . µQ (u1 . . × Un . . . si empleamos Q (U1 . n}. un ) ∈ U1 × U2 × . × Un → [0. una relación binaria difusa es un conjunto difuso definido en el producto Cartesiano de dos conjuntos crisp. . U2 . × Un es definida como el conjunto difuso (2. 1]. . u2 ∈ U2 . . . . . u2 . Un Una relación (no difusa) entre conjuntos (no difusos) U1 . . × Un (2. . . esto es. ya que si U 6= V . . un ∈ Un } (2. . . . . u2 . esto es. . . . U2 . . Un . . U2 . . un )) | (u1 . . Un es un subconjunto denotar una relación entre U1 . 2.17) Como un caso especial. . . . U2 . entonces U × V 6= tales que ui ∈ Ui para i ∈ {1. . . Una relación binaria sobre un producto Cartesiano finito es representado usualmente por una matriz relacional difusa. . . . ×Un . . . × Un subconjunto del producto Cartesiano U × V. Definición 2. siendo además la base de la inferencia en los sistemas difusos. . .

.20) donde v ∈ V y suponiendo que f −1 (v) no es vacío. . . ∞) ⊂ R2 . . . . .22) © ª donde uj1 . es el conjunto difuso en definido por: a µQ1 (x) = m´xµQ (x.5 Sea Q una relación difusa en U1 × . un }. .uj(N −K) ∈Uj(N −K) (2.7. considerando el conjunto © ª A = (x. . . . uj(n−k) es el complemento de {ui1 . y) ∈ R2 | (x − 1)2 + (y − 1)2 ≤ 1 proyección de A sobre V es A2 = [0..21) . . para una conjunto difuso A en U el principio de extensión define un conjunto difuso B en V dado por µB (v) = supu∈f −1 (v) [µA (u)] (2. entonces la proyección (2. En general. n} . . . . La extensión de A1 sobre relaciones difusas. es decir µB (v) es el máximo de µA (u) para todos los u ∈ U que cumplen que f (u) = v. y) y∈V Como un caso especial. que es una relación en U × V = R2 . . Estos conceptos se pueden extender a las Definición 2. Por ejemplo. ik } una subsecuencia QP definida por la función de pertenencia µQP (ui1 . . La proyección de A sobre U es A1 = [0. ver la figura 2. si Q es una relación binaria difusa en U ×V .2.1 Lógica difusa 21 y f una función de U a V . entonces la proyección de Q sobre Ui1 × . . .. uik } con respecto a {u1 . 2. .. 1] ⊂ V . 2. uik ) = de {1. .1. .. . denotada por Q1 . . × Uik es una relación difusa m´x a µQ (u1 . . 1] ⊂ U y la U × V = R2 es A1E = [0. se definirá µB (v) = 0. Proyecciones y Extensiones Cilíndricas Se definen estos conceptos ya que una relación crisp está definida en el espacio producto de dos o más conjuntos. . . Si f −1 (v) es vacío para algún v ∈ V . . 1] × (−∞. . .2. un) de Q sobre V . × Un y {i1 . . . uj1 ∈Uj1 .

uiK ) (2.6 Sea QP una relación difusa en Ui1 × . . . V ) y Q (V. W ) dos relaciones binarias crisp que comparten un conjunto V . Sean P (U. ik } es una sub- secuencia de {1. . La (x. denotada por P ◦ Q se define como una relación en U × W tal que para cualquier (x. µQ (y. . . . £ ¤ µP ◦Q (x. .25) . . V ) y Q (V. .22 V Lógica difusa y relación difusa A1E A2 A A1 U Figura 2. × Un en una relación difusa QP E en U1 × . .23) Como un caso especial. W ) si y solo si y∈V (2. z) ∈ U × W . .7: Proyecciones y Extenciones Cilíndricas de una relación. si Q1 es un conjunto difuso en U . entonces la extensión cilíndrica de Q1 a U × V es una relación difusa Q1E en U × V definida por µQ1E (x. z) = m´xt µP (x. . y) . y) = µQ1 (x) La definición (2. . P ◦ Q es la composición de P (U. .23) también es válida para relaciones crisp. donde t es cualquier t-norma. . . .24) composición de P y Q. . z) ∈ Q. z) a (2. . n} . . z) ∈ P ◦ Q si y solo si existe una y ∈ V tal que (x. . . entonces la extensión cilíndrica de QP a U1 × . × Uik y {i1 . un ) = µQP (ui1 . × Un definida por µQP E (u1 . y) ∈ P y (y. Definición 2. 2.

26) La composición m´x −product de relaciones difusas P (U. V ) y Q (V. P ◦ Q. (2. V ) y Q (V.2. Por ejemplo.25) puede tomar una variedad de fórmulas. µQ (y. z) = m´x m´ t µP (x. Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 2.25) . V ) y Q (V.27) 2. y) . está definida como una relación difusa en U × W cuya función de pertenencia está Debido a que la t-norma en (2. las palabra en ocasiones sirven para describir variables. para cada t-norma podemos obtener una composición en particular. usamos la palabra alta para describir la variable de "la temperatura de hoy". Las dos composiciones más usadas a continuación: comúnmente son la composición m´x − m´ y la composición m´x −product. z) ∈ U × W. µQ (y.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 23 Definición 2.2. W ) es una relación a ın difusa P ◦ Q en U × W definida por la función de pertenencia y∈V £ ¤ µP ◦Q (x. o de forma equivalente. y) . cuando decimos "hoy hace calor". De esta . "la temperatura de hoy es alta". denotada por dada por (2. z) = m´xt µP (x. z) a ın donde (x.2. z) donde (x. De las Variables Numéricas a las Variables Lingüísticas En nuestra vida diaria.7 La composición de las relaciones difusas P (U. que se definen a ın a La composición m´x − m´ de relaciones difusas P (U.1. W ). (2. W ) es una relación a difusa P ◦ Q en U × W definida por la función de pertenencia y∈V £ ¤ a µP ◦Q (x. z) ∈ U × W.

Pero cuando una variable toma palabras como sus valores. Si una variable puede tomar palabras en un lenguaje natural como sus valores. Cuando una variable toma números como sus valores. X podría ser la velocidad del auto. no tenemos un marco formal para expresarlo en la teoría matemática clásica. a b U es el dominio físico actual en el que la variable lingüística X toma valores (crisp) M es la regla semántica que relaciona cada valor lingüístico en T con un conjunto difuso en U. De estas definiciones vemos que las variables lingüísticas son extensiones de las variables numéricas en el sentido de que permiten tomar conjuntos difusos como sus valores. donde b b X es el nombre de la variable lingüística. en el ejemplo anterior M relaciona lenta.8 Si una variable puede tomar palabras en lenguajes naturales como sus valores.9.media. media y rápida con la función de pertenencia que se muestra en la figura 2.24 Lógica difusa y relación difusa forma. Para proporcionar un marco formal. ver la figura 2. T={lenta. 19◦ C. ³ ´ b Definición 2. Claramente. en el ejemplo anterior U = [0. tenemos un marco matemático bien establecido para formularlo. se le llama variable lingüística.8. rápida} b T es el conjunto de valores lingüísticos que X puede tomar. como sus valores. T.. etc. M . Vm´x ] . toma la palabra alta para describir su valor.8. se introdujo el concepto de variables lingüísticas. U. por ejemplo. donde las palabras son caracterizadas como conjuntos difusos definidos en el universo de discurso en el que la variable es definida. la variable "la temperatura de hoy"puede tomar los números 25◦ C. la variable "la temperatura de hoy". se le llama variable lingüística. cuya representación se muestra en la figura 2. en el ejemplo anterior cuantitativos.9 [54] y [55] Una variable lingüística se caracteriza por X. Definición 2. .

2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 25 1 lenta media rápida 0 35 55 75 Vmax Velocidad del auto en (mph) Figura 2.2. .9: De la variable numérica a la variable lingüística.8: La velocidad de un auto como una variable lingüística puede tomar tres conjuntos difusos. Variable numérica Variable lingüística U U Figura 2.

26

Lógica difusa y relación difusa Introduciendo el concepto de variables lingüísticas, podemos formular descripciones vagas

del lenguaje natural en términos matemáticos precisos. Este es el primer paso para incorporar el conocimiento humano dentro de los sistemas de ingeniería en una manera sistemática y eficiente.

2.2.2.

Reglas difusas SI-ENTONCES (IF-THEN)

En los sistemas difusos y de control, el conocimiento humano se representa en términos de reglas SI-ENTONCES. Una regla difusa SI-ENTONCES es una declaración expresada como SI hproposición difusai , ENTONCES hproposición difusai Proposiciones Difusas Existen dos tipos de proposiciones: las proposiciones difusas atómicas y las proposiciones difusas compuestas. Una proposición difusa atómica es una declaración simple x es A b (2.29) (2.28)

del auto del ejemplo anterior, se tienen las siguientes proposiciones difusas (las primeras tres son proposiciones atómicas difusas y las últimas tres son proposiciones compuestas difusas): x es L b

conjunto difuso definido en el dominio físico de x). Por ejemplo, si x representa la velocidad b b (2.30) (2.31) (2.32) (2.33) (2.34) (2.35)

donde x es una variable lingüística, y A es un valor lingüístico de x (esto es, A es un b b

x es M b x no es L y x no es R b b x es L o x no es M b b x es R b

(b es L y x no es R) o x es M x b b

2.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN)

27

donde L, M y R denotan los conjuntos difusos "lento", "medio" y rápido", respectivamente. Se puede notar que en una proposición compuesta difusa, las proposiciones atómicas difusas son independientes, esto es, las x´s en la misma proposición de (2.33)-(2.35) pueden ser diferentes variables. En realidad, las variables lingüísticas en una proposición difusa son en general diferentes. Por ejemplo sea x la velocidad de un auto y y = x la aceleración del auto, entonces si se define el conjunto alta (A) para la aceleración, se tiene la siguiente proposición difusa compuesta x es R y y es A b b
·

Por consiguiente, las proposiciones difusas deben entenderse como relaciones difusas. Se pueden determinar las funciones de pertenencia para estas relaciones. Las reglas difusas combinan uno o más conjuntos difusos de entrada, llamados antecedentes o premisas, y les asocian un conjunto difuso de salida, llamado consecuente o consecuencia. Los conjuntos difusos de la premisa se asocian mediante conjuntivas lógicas como y, o, etc. Una regla típica, de tipo IF-THEN, para un sistema de control sería "Si error es positivo_pequeño y derivada_de_error es negativo_pequeño Entonces acción es positiva_pequeña", que se suele expresar abreviadamente mediante expresiones del tipo Si E es PP y dE es NP Entonces U es PP. Las reglas difusas permiten expresar el conocimiento que se dispone sobre la relación entre antecedentes y consecuentes. Para expresar este conocimiento de forma completa normalmente se precisa de varias reglas, que se agrupan formando lo que se conoce como una base de reglas, es decir, el conjunto de reglas que expresan las relaciones conocidas entre antecedentes y consecuentes. La base de reglas se puede representar bien como una tabla de las reglas que la forman, o bien como una memoria asociativa difusa o FAM (Fuzzy Associative Memory). Las FAM son matrices que representan la consecuencia de cada regla definida para cada combinación de dos entradas. Las FAM permiten realizar una representación gráfica clara de las relaciones entre dos variables lingüísticas de entrada y la variable lingüística de salida, pero requiere que se indique explícitamente todas las reglas que se pueden formar con estas dos variables

28

Lógica difusa y relación difusa

de entrada. Cuando el número de conjuntos de cada una de las particiones de entrada crece las FAM se hacen difícilmente manejables. Es posible también definir FAM de más de dos dimensiones, pero su tamaño se hace rápidamente excesivo y son más difíciles aún de manejar. En su lugar se suele trabajar con varias FAM de dimensión dos, para así definir subconjuntos de reglas que asocien las entradas de dos en dos en la base de reglas general [41]. Formalmente, una base de reglas difusa es una colección de reglas R(l) con el formato x x y R(l) : IF b1 is Fl and...and bn is Fl THEN b is Gl 1 n (2.36)

b U1 × · · · × Un e y ∈V son variables lingüísticas. Este formato de reglas se conoce como difuso puro o de tipo Mamdani, por ser quien primero las propuso en 1974 para realizar un controlador difuso que estabiliza un sistema en torno a su punto de trabajo. Otro formato

donde F1 y Gl son conjuntos difusos en Ui ⊂ < y V⊂ <, respectivamente, y x =(b1, . . . , xn )T ∈ b x b

/

frecuente para las reglas es el llamado de tipo Sugeno. En este caso, la función de salida es una combinación lineal de las variables de entrada, o en un caso más general, una función genérica de las variables de entrada. R(l) : IF bI is F1 and...and bn is F/ THEN bl = f l (x) x x y n
/

(2.37)

Si llamamos M al número de reglas IF- THEN (SI-ENTONCES) de la base de reglas entonces l = 1, 2, ..., M en las ecuaciones (2.36) y (2.37). El vector x representa el conjunto de las entradas, mientras que y es la salida del sistema difuso. Los sistemas difusos descritos con n entradas xi , y una sola salida y, se conocen como MISO (Multiple Input Single Output), mientras que los que tienen varias salidas (de 1 hasta k) se conocen como MIMO (Multiple Input Multiple Output). Para estos últimos sistemas, se puede generalizar el formato anterior de las reglas, o bien descomponerlo en k sistemas de tipo MISO.

2.2.3.

La Lógica Difusa y el Razonamiento Aproximado

La lógica es el estudio de los métodos y principios del razonamiento donde el razonamiento significa obtener nuevas proposiciones de las ya existentes.

Existen dos métodos básicos de inferencia entre reglas o leyes de inferencia. el modus ponens generalizado (GMP) y el modus tollens generalizado (GMT). En lógica difusa el razonamiento no es preciso. que representan extensiones o generalizaciones del razonamiento clásico. es decir. B Y B’ son conjuntos difusos. deducir conclusiones imprecisas (proposiciones difusas) a partir de una colección de premisas imprecisas (proposiciones difusas). lo cual quiere decir que se puede inferir de una regla una conclusión aunque el antecedente (premisa) no se cumpla plenamente. El GMP se conoce como razonamiento directo y puede resumirse de la forma siguiente: (Conocimiento): (Hecho): (Consecuencia): A’ ◦ R. sino aproximado. La lógica difusa generaliza la lógica clásica de dos valores permitiendo que los valores de una proposición sea cualquier número en el intervalo [0. Si x es A Entonces y es B x es A’ b –––––––––––––––––––— Donde A. Esta relación se expresa también como B’= El GMT se conoce como razonamiento inverso y puede resumirse de la forma (Conocimiento): (Hecho): (Consecuencia): Si x es A Entonces y es B b b x es A’ b y es B’ b y es B’ b siguiente: ––––––––––––––––––––- . A’.2. esto es. Esta generalización nos permite realizar un razonamiento aproximado.2 Variables Lingüísticas y Reglas Difusas SI-ENTONCES (IF-THEN) 29 En la lógica clásica las proposiciones pueden ser ciertas o falsas.1]. el valor real de una proposición es 0 o 1. Modus Ponens Generalizado y Modus Tollens Generalizado Las reglas difusas son básicamente de tipo IF-THEN (SI-ENTONCES) y expresan una relación o proposición difusa.

análisis difuso.30 Lo que se expresa como A’= B’◦ R Lógica difusa y relación difusa Las matemáticas difusas proporcionan un punto de inicio y un lenguaje para los sistemas difusos y el control difuso. . etc. observando el nacimiento de palabras como topología difusa. En el siguiente capítulo se citan algunos conceptos básicos de los sistemas difusos y del control difuso. álgebra difusa. Estos principios y conceptos son muy útiles dentro de los sistemas difusos y del control difuso. De esta forma la teoría de la matemática clásica se puede transformar en matemática difusa. Las matemáticas difusas son un campo enorme donde sus principios se han desarrollado para reemplazar los conjuntos de la teoría matemática clásica por conjuntos difusos.

Un ejemplo podría ser el sistema de control para regular la velocidad de un ventilador en función de la temperatura ambiente.1. En años recientes el campo de los sistemas difusos y el control ha tenido un progreso acelerado. deben generar unas salidas para actuar sobre determinados mecanismos. de la velocidad necesaria del ventilador para conseguir una temperatura ideal. la única entrada del sistema sería el valor de la temperatura. El corazón de un . 3. y la única salida. Motivados por el éxito del control difuso en productos de consumo y en el control de procesos industriales. Los sistemas difusos son sistemas basados en el conocimiento o en reglas. Sistemas Difusos Una de las principales aplicaciones de la lógica difusa es el diseño de sistemas de control que.Capítulo 3 Sistemas Difusos y Control Difuso Podemos observar que los principios de la lógica y de la matemática difusa son usados para desarrollar los sistemas de control difuso. por ejemplo en grados centígrados. En este caso. ha habido un incremento en la cantidad de trabajos sobre los estudios de los sistemas difusos y el control difuso. el valor. de estos prinicipios se derivan fórmulas matemáticas compactas que nos ayudan a representar los diferentes tipos de sistemas difusos. a partir de unas entradas. en revoluciones por minuto (rpm).

2. Existen tres tipos de sistemas difusos empleados comúnmente: 1. El siguiente paso es combinar estas reglas en un sistema simple. sistemas difusos puros o de Mamdani.1) donde las palabras ”alta” y ”menor” son caracterizadas por las funciones de pertenencia mostradas en la figura 3. El punto de inicio para construir un sistema difuso es obtener una colección de reglas difusas basadas en el conocimiento humano de los expertos.2 respectivamente. Los diferentes sistemas difusos emplean diferentes principios de esta combinación. sistema difuso es la base del conocimiento que consiste de las llamadas reglas SI-ENTONCES (IF-THEN rules). sistemas difusos Takagi-Sugeno-Kang (TSK). Un sistema difuso es construido de una colección de reglas difusas SI-ENTONCES.1 y 3. SI la velocidad de un auto es alta. la siguiente es una regla difusa SI-ENTONCES.32 Sistemas Difusos y Control Difuso 1 Función de pertenencia para “alta” Velocidad (mph) 45 55 65 Figura 3. Una regla SI-ENTONCES es una declaración SI-ENTONCES en la cual algunas palabras son caracterizadas por funciones de pertenencia continuas. Por ejemplo. y . ENTONCES se aplica menor fuerza al acelerador (3. donde el eje horizontal representa la velocidad del auto y el eje vertical representa el valor miembro para ”alta”.1: Función de pertenencia para ”alta”.

1 Sistemas Difusos 33 1 Función de pertenencia para “menor” Fuerza al acelerador Figura 3. 3. por el contrario en los sistemas de ingeniería . para el controlador de un auto.3. la base de reglas difusas consiste de las siguientes tres reglas: SI la velocidad es baja.3) (3. La configuración básica de un sistema difuso puro se muestra en la figura 3. sistemas difusos con fuzzyficador y defuzzyficador. Si existiera una línea de retroalimentación en la figura 3. El principal problema con el sistema difuso puro es que sus entradas y salidas son conjuntos difusos (palabras en lenguajes naturales). donde el eje horizontal representa la fuerza aplicada al acelerador y el eje vertical representa el valor miembro para ”menor”.3. La base de reglas difusas representa la colección de reglas SI-ENTONCES. ENTONCES se aplica más fuerza al acelerador SI la velocidad es media.4) el dispositivo de inferencia difusa combina las reglas difusas SI-ENTONCES dentro de un mapeo de conjuntos difusos en el espacio de entrada U ⊂ Rn a conjuntos difusos en el espacio de salida V ⊂ R basado en principios de la lógica difusa. el sistema se transforma en un sistema dinámico difuso. ENTONCES se aplica una fuerza normal al acelerador SI la velocidad es alta. ENTONCES se aplica menor fuerza al acelerador (3.2: Función de pertenencia para ”menor”.2) (3. Por ejemplo.3.

Los problemas principales con el sistema difuso Takagi-Sugeno-Kang son: (i) su parte ENTONCES es una fórmula matemática y por tanto no puede proporcionar un marco natural que represente el conocimiento humano.5) donde la palabra ”alta” tiene el mismo significado que en 3. En realidad. Sugeno y Kang propusieron otro sistema difuso cuyas entradas y salidas son variables valuadas en la realidad. x (3.34 Base de Reglas Difusas Sistemas Difusos y Control Difuso Dispositivo de inferencia difusa x en U y en V Figura 3.5.3: Configuración básica de los sistemas difusos puros.1.4. ENTONCES la fuerza del acelerador es y = cx b . el sistema TakagiSugeno-Kang (TSK) utiliza reglas en la siguiente forma: SI la velocidad b de un auto es alta. debido a esto la versatilidad de los sistemas difusos no está muy bien representada en este marco. La configuración básica del sistema difuso Takagi-Sugeno-Kang se muestra en la figura 3. las entradas y las salidas son variables valuadas en la realidad. Comparando 3. Este cambio hace más fácil combinar las reglas. Para resolver este problema. Takagi. el sistema difuso Takagi-SugenoKang es una media ponderada tomada de los valores en las partes ENTONCES de las reglas.5 y 3. su configuración se muestra en la figura 3. y (ii) no hay mucha libertad para aplicar diferentes principios en lógica difusa. y c es una constante. Para resolver estos problemas empleamos los sistemas difusos con fuzzyficador y defuzzyficador. Para considerar las reglas difusas SI-ENTONCES en la forma de 3.1 podemos ver que la parte ENTONCES de la regla cambia de una descripción utilizando palabras en lenguajes naturales a una fórmula matemática simple.1.

Base de Reglas Difusa Fuzzyficador Defuzzyficador x en U Dispositivo de inferencia difusa Conjuntos difusos en U Conjuntos difusos en V y en V Figura 3. .1 Sistemas Difusos 35 Base de Reglas difusas Media ponderada x en U y en V Figura 3.3.4: Configuración básica del sistema difuso Takagi-Sugeno-Kang.5: Configuración básica de los sistemas difusos con fuzzyficador y defuzzyficador.

7: Sistema Difuso como controlador en lazo cerrado. 3. De forma general. Los sistemas difusos mostrados en la figura 3.6: Sistema difuso como controlador en lazo abierto. conocido como controladores difusos o FLC (Fuzzy Logic Controllers). que se conocen como __ __ __ actuadores A . podemos observar en la figura 3. La estructura típica de un controlador basado en un sistema difuso puede verse en la .8. son sin duda la aplicación más extendida de la lógica difusa. Normalmente el objetivo del control es mantener R = S .36 Sistemas Difusos y Control Difuso Sistema difuso Proceso Figura 3. Control Difuso Los sistemas expertos de control difuso basados en reglas.7.6 y 3. Proceso Sistema Difuso Figura 3. S . que recibe como entradas una o varias __ variables de control llamadas generalmente referencias. y una o varias variables de salida __ del propio proceso. que para controlar un proceso o sistema se emplea un módulo controlador.5 pueden ser usados como controladores en lazo abierto o controladores en lazo cerrado mostrados en las figuras 3. R .2. produciendo como salidas una o varias variables.

No resulta fácil realizar una clasificación genérica de todas las arquitecturas posibles de controladores basados en lógica difusa. Es de destacar que el control difuso. figura 3.9.2 Control Difuso 37 _ R Controlador _ A Proceso _ S Figura 3.3. La arquitectura del controlador a utilizar depende de la aplicación concreta a llevar a cabo. resulta muy importante desde el punto de vista industrial. sin embargo.9: Estructura de un controlador (el núcleo FLC es el controlador difuso). en cuyo campo existen desde hace tiempo infinidad de aplicaciones para estos sistemas en funcionamiento.8: Control directo de un proceso o sistema. _ X FLC _ Y Posprocesado Preprocesado _ R Controlador _ A _ S Figura 3. aparte de ser un tema de investigación. que es la principal aplicación de los sistemas difusos. existen grandes grupos dentro de los cuales podemos mencionar los controladores difusos directos sin optimización y los con- .

troladores difusos directos con optimización. controladores difusos híbridos en los cuáles se incluyen los formados por la combinación de lógica difusa con redes neuronales y sistemas expertos. d) La base de conocimiento.10: Esquema representativo de un control difuso. En el área del control inteligente [25]. c) La defuzzyficación consiste en la conversión de datos lingüísticos a datos numéricos.10 son: a) La fuzzyficación toma valores de la planta y los interpreta como valores lingüísticos.10. en general las etapas más importantes utilizadas por un control difuso son las mostradas en la figura 3. los cuales pueden ser de naturaleza heurística u optimizados mediante alguna técnica particular. inferencia y defuzzyficación. la lógica difusa se ha utilizado para resolver de forma exitosa una gran variedad de problemas de diversa complejidad. existe una gran cantidad de propuestas dentro de la combinación de la capacidad de aprendizaje de las redes neuronales y del procesamiento de información imprecisa de la lógica difusa. mediante una ponderación y normalización de las sentencias lógicas antecedentes. Las etapas mostradas en la figura 3.38 Sistemas Difusos y Control Difuso Base de conocimiento Fuzzyficación Dispositivo de inferencia Defuzzyficación Planta Figura 3. incluye los parámetros necesarios para la fuzzyficación. b) El dispositivo de inferencia realiza los planteamientos lógicos necesarios para la toma de decisiones. Actualmente. .

Dispositivo de Inferencia Difusa Se llaman dispositvos de inferencia difusa a los sistemas que interpretan las reglas de tipo IF-THEN de una base de reglas. × Fn → Gl en U × V.. Una regla típica. de tipo SI-ENTONCES. los sistemas difusos son sistemas basados en reglas construidas a partir de una colección de reglas lingüísticas. y por otra parte. Reglas Difusas Las reglas difusas combinan uno o más conjuntos difusos de entrada. La base de reglas se puede representar como una tabla de las reglas que la forma. llamados antecedentes o premisas.2.2. o. xn )T ∈ Ui × . Se interpreta como una implicación difusa de F1 × .3. 3. y les asocian un conjunto difuso de salida..3 El doble papel de los sistemas difusos 39 3. para un sistema de control sería "Si error es positivo_pequeño y derivada _de_error es negativo_pequeño Entonces acción es positiva_pequeña". que suele expresar abreviadamente mediante expresiones de tipo Si E es PP y dE es NP Entonces U es PP. Las reglas difusas permiten expresar el conocimiento que se dispone sobre la relación entre antecedentes y consecuentes.2.. o bien como una memoria asociativa difusa o FAM (fuzzy Associative Memory).. × Un e y ∈ V son variables x b b l l lingüísticas.. que se agrupan formando lo que se conoce como una base de reglas.. Los conjuntos difusos de la premisa se asocian mediante conjuntivas lógicas como y. 3.3. Para expresar este conocimiento de forma completa normalmente se precisa de varias reglas. En un sistema difuso l l l b b b las reglas del tipo R(l) : IF x1 is F1 and. que son matrices representando la consecuencia de cada regla definida para cada combinación de dos entradas.1.. llamado consecuente o consecuencia..and xn is Fn T HEN y is Gl donde F1 y Gl son b conjuntos difusos en Ui ⊂ R y V ⊂ R x = (bi. los sistemas difusos son mapeos no . con el fin de obtener los valores de salida a partir de los actuales valores de las variables lingüísticas de entrada al sistema. El doble papel de los sistemas difusos Por una parte... etc.

¿qué tipos de funciones no lineales pueden representar o aproximar los sistemas difusos y con qué grado de aproximación? Pero si los sistemas difusos pueden aproximar cualquier función no lineal en una aproximación arbitraria. 3. Por ejemplo. ejecutor de decisiones. implicación difusa por la regla del producto y fuzzyficador singleton. Una contribución importante de la teoría de sistemas difusos es proporcionar un procedimiento sistemático para transformar un conjunto de reglas lingüísticas a un mapeo no lineal. por tanto podrían ser muy útiles en una amplia variedad de aplicaciones. El decir que los sistemas difusos son aproximadores universales.40 Sistemas Difusos y Control Difuso lineales que en muchos casos se pueden representar por fórmulas precisas y compactas como en [41]: Y ( n µAl (x)) i=1 i Y f (x) = P M n i=1 µAl (x)) l=1 ( i PM l=1 y l la cuál representa un sistema de lógica difusa con defuzzyficador por media de centros. Podemos ver que los sistemas difusos son tipos particulares de funciones no lineales. y por otra parte. nos indica que pueden aproximar cualquier función sobre un conjunto compacto a una aproximación arbitraria. procesadores de señales o cualquier otro sistema. no hay ningún problema si los sistemas difusos son usados como controladores.4. Debido a que los mapeos no lineales son fáciles de implementar los sistemas difusos han encontrado su camino dentro de una variedad de aplicaciones en la Ingeniería. Este . Los sistemas difusos como aproximadores Universales Como se ha mencionado. por tanto. nos proporcionan una oportunidad para analizar los sistemas difusos con más detalle. ciertos tipos de sistemas difusos se pueden escribir como fórmulas no lineales compactas [41]. Por una parte estas fórmulas no lineales compactas simplifican los cálculos de los sistemas. es interesante conocer la capacidad de los sistemas difusos desde un punto de vista de aproximación de función.

3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 41 resultado muestra la existencia de un sistema difuso óptimo, sin embargo, no nos provee de métodos para encontrarlo. De hecho, encontrar el sistema difuso es más difícil que probar su existencia. Dependiendo de la información proporcionada, podemos o no encontrar el sistema difuso. Para responder la pregunta de cómo encontrar el sistema difuso óptimo, primero es necese nos pide aproximar. En general, podemos encontrar tres situaciones: 1. La fórmula analítica de g (x) es conocida. 2. La fórmula analítica de g (x) es desconocida, pero para cualquier x ∈ U podemos determinar la g (x) correspondiente. Esto es, g (x) es una caja negra -conocemos el comportamiento entrada-salida de g (x) pero no conocemos los detalles internos. 3. La fórmula analítica de g (x) es desconocida y sólo se proporciona un número limitado de pares entrada-salida (xj , g (xj )), donde xj ∈ U no se pueden elegir arbitrariamente. Para el diseño de los sistemas difusos existen diferentes métodos, de acuerdo a la información que se dispone. sario ver qué información está disponible para la función no lineal g (x) : U ⊂ Rn → R, que

3.5.

Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente

Hasta ahora se han establecido las bases de la lógica y sistemas difusos y se han presentado los sistemas difusos de control, quizá la aplicación más importante, especialmente a nivel industrial. Lejos de ser entes estáticos los sistemas difusos pueden ser entrenados para optimizar su buen funcionamiento. Los sistemas difusos de control son aproximadores funcionales genéricos, es decir, dado cierto nivel de error, se puede encontrar un controlador difuso que aproxime cualquier función con un error menor al establecido, y para ello se pueden emplear diversas técnicas, algunas procedentes del campo de las redes neuronales (sistemas neuro borrosos), y otras de otros campos, como los algoritmos genéticos [19], [40].

42

Sistemas Difusos y Control Difuso Existen numerosos algoritmos de aprendizaje que se pueden aplicar a los sistemas difusos,

algunos de los más importantes son: - Entrenamiento del gradiente descendente. - Algoritmos genéticos - Mínimos cuadrados. - Tablas de búsqueda. A continuación se presenta el algoritmo de aprendizaje del gradiente descendente.

3.5.1.

Estructura del Sistema Difuso

Se ha observado que en el esquema de tablas de búsqueda, las funciones de pertenencia se fijan en el primer paso y no dependen de los pares entrada-salida; es decir, las funciones de pertenencia no se optimizan de acuerdo a los pares entrada-salida. Desde un punto de vista conceptual, el diseño de sistemas difusos a partir de los pares entrada-salida podrían ser clasificados dentro de dos tipos de aproximación. En la primera aproximación, las reglas difusas SI-ENTONCES (IF-THEN) se generan primero de los pares entrada-salida, y el sistema difuso se construye a partir de estas reglas de acuerdo a cierta elección del dispositivo de inferencia difusa, el fuzzyficador y defuzzyficador. En la segunda aproximación, la estructura del sistema difuso se especifica primero de algunos parámetros en la estructura libres de cambio, y así, estos parámetros se determinan de acuerdo con los pares entrada-salida [41]. Primero, se especifica la estructura del sistema difuso que se diseñará. Si elegimos un sistema difuso con un dispositivo de inferencia de producto, un fuzzyficador singleton, defuzzyficador de promedio de centros y función de pertenencia Gaussiana. De esta forma asumimos que el sistema a diseñar tiene la siguiente forma: · µ ³ ´2 ¶¸ PM l Qn xi −xl i i=1 exp − l=1 y σl i · µ ³ f (x) = ´2 ¶¸ PM Qn xi −xl i i=1 exp − l=1 σl
i

(3.6)

donde M es fija, y l , xl y σ l son parámetros libres (elegimos al = 1). Aunque la estructura del i i i

sistema difuso se elige como en (3.6) el sistema difuso no se ha podido diseñar debido a que

3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 43

f a y-1 z1 f=a/b y-M zM b

capa 3

……

capa 2

…… ……
x1 µ µ= exp[-(x-x-i1)2/ σi12] x

……
capa 1 xn

Figura 3.11: Representación de una red para el sistema difuso.

los parámetros y l , xl y σ l no se han especificado. Una vez elegidos los parámetros y l , xl y i i i σ l , podemos obtener el sistema difuso diseñado; esto es, el diseñar el sistema difuso equivale i ahora a determinar los parámetros y l , xl y σ l . i i Para determinar estos parámetros de forma óptima, podemos representar el sistema difuso f (x) de (3.6) como una red con alimentación hacia adelante. Específicamente, el mapeo de la entrada x ∈ U ⊂ Rn a la salida f (x) ∈ V ⊂ R puede ser implementado de acuerdo a las siguientes operaciones, primero, la entrada x pasa a través de un operador producto µ ³ ´2 ¶ Qn xi −xl l i así, z l pasa a través de un operador suma Gaussiano para ser z = i=1 exp − σl i PM l PM l l y un operador suma de promedios para obtener b = l=1 z y a = l=1 y z finalmente, la

salida del sistema difuso se obtiene como f (x) = a/b. Estas tres operaciones se muestran en la figura 3.11 como una red de tres capas con alimentación hacia adelante.

hasta que el error |f − y0 | es menor al número pre especificado . y0 ). pero proporciona una mejor exactitud de la aproximación. Para un p par entrada-salida dado (xp .. p Paso 4.10) f = a/b Paso 3.13) para calcular los parámetros y l (q + 1) . calcula xp − xl (q) 2 z = exp(−( 0i l i )) σ i (q) i=1 l M X b= zl l=1 n Y (3. 1. 2. o hasta que q sea igual al número especificado. xl (q + 1) y σ l (q + 1) . Determinación de la Estructura y colocación de los parámetros iniciales. Especificar los parámetros iniciales y l (0) . el presente xp a la capa de entrada del sistema difuso en la figura 3.8) a= M X y l (q) z l l=1 (3. M más grande produce más parámetros y más cálculos.. La entrada presente y cálculo de la salida del sistema difuso. donde i i p y = y0 .9) (3.2. y (3. Paso 2... Esto es.7) (3. 1. Repetir yendo al Paso 2 con q = q + 1. p = 0. . 2.5. b.6) y determina M . Para aplicaciones particulares se pueden emplear métodos especiales..11 y 0 calcula las salidas de las Capas 1-3. .44 Sistemas Difusos y Control Difuso 3. Usar el algoritmo de entrenamiento (3. y z l . (3. o se eligen de tal manera que las funciones de pertenencia correspondientes cubren uniformemente los espacios de entrada y salida. y en la q-ésima etapa de entrenamiento 0 q = 0. a y f se calculan como en el paso 2.12). Actualización de parámetros.. xl (0) y σ l (0). Estos parámeti i ros iniciales se pueden determinar de acuerdo a las reglas lingüísticas de los expertos. Diseño de los Parámetros por el Gradiente Descendente Paso 1.11). . Elegir el sistema difuso en la forma de (3.

el algoritmo puede converger a una solución no óptima o incluso diverja. . Para el control en línea y la identificación del sistema dinámica. l = 1. l = 1. 1. Si es deseable y factible. i p [f (xp ) − y0 ]2 sea mínimo. xl y σ l . σ l (q + 1) i ∂e = σ l (q) − α ∂σl |q i i = σl i (q) − α (f −y) b donde i = 1. . xl i (q + 1) = xl i ¡ ¢ ¢ l 2 xp − xl (q) (f − y) ¡ l i 0i (q) − α y (q) − f z b σ l2 (q) i (3. Si los parámetros iniciales son cercanos a los parámetros óptimos.. . .6) tal que el error ep = 1 2 σ l .. el algoritmo tiene una oportunidad buena para converger a la solución óptima. Repetir yendo al Paso 2 con p = p + 1.. tienen un significado físico claro y tenemos los métodos i i . q = 0. q = 0. 2. 2. 2.. y0 ). y (3.3. este paso es usualmente deseable. .11).. La ventaja de usar el sistema difuso es que los parámetros y l .. ¡ ¢ 2(xp −xl (q))2 i y l (q) − f z l 0i l3 (q) σ i (3. 2. . 2.. 1.13) Debido a que el algoritmo de entrenamiento (3. este paso no es factible porque los pares de entrada-salida se proporcionan uno-por-uno en una forma de tiempo-real. 1. 2.. n. la opción de los parámetros iniciales es crucial para el éxito del algoritmo. M. .. por otra parte. M. 0 Paso 6... tal que ep se minimice. 2.. (3...12) donde i = 1. q = 0. n.. . fijar p = 1 y hacer los Pasos 2-5 nuevamente hasta que el sistema difuso diseñado sea satisfactorio... M.11) (3. xl y i 0 1 y l (q + 1) = y l (q) − α (f − y) z l b donde l = 1...13) es un algoritmo del gradiente descendente. es decir.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 45 Paso 5. De esta forma se obtienen los parámetros y l . 2.. Siguiendo estos pasos se puede diseñar un sistema difuso f (x) en la forma (3.. Para problemas de reconocimiento de patrones donde los pares entrada-salida se proporcionan fuera de línea. actualizar los parámetros p+1 usando el siguiente par entrada-salida (xp+1 .12).

b b Haciendo f (x) el sistema difuso en la forma (3. n y m son enteros positivos. u (k) . Considerando el sistema dinámico no lineal en tiempo discreto y (k + 1) = f (y (k) . y (k − n + 1) .6). Estas reglas difusas SI-ENTONCES pueden ayudar para explicar el diseño del sistema difuso de una manera amigable. . es razonable usarlos como modelos de identificación para sistemas no lineales. La tarea es identificar la función f desconocida basada en los sistemas difuso. .6) provisto con el algoritmo de entrenamiento (3.12) y (3. Identificación de sistemas dinámicos no lineales El problema de identificación consiste en encontrar un modelo conveniente de identificación y ajustar los parámetros del modelo para optimizar una función de rendimiento basado en el error entre la planta y la salida del modelo de identificación. . dado un sistema difuso diseñado en la forma de (3. (3. . podemos recuperar las reglas difusas SI-ENTONCES que constituyen al sistema difuso. .13) para aproximar componentes no lineales desconocidas en sistemas dinámicos.6). La Identificación es un proceso importante ya que muchas aproximaciones en ingeniería dependen del modelo del sistema. Debido a que los sistemas difusos son poderosos aproximadores universales. los parámetros xl y σ l son los centros y anchuras de los conjuntos difusos Gaussianos en las i i partes SI de las reglas. Tener en mente que los parámetros y l son los centros de los conjuntos difusos en las partes ENTONCES de las reglas y.11). Este método se puede aplicar al problema de identificación de sistemas dinámicos no lineales. u e y son la entrada y salida del sistema. La Identificación de sistemas es un proceso de determinación de un modelo apropiado para el sistema basado en mediciones proporcionadas por los sensores. . Podemos emplear al sistema difuso (3. u (k − m + 1)) donde f es una función desconocida que queremos identificar. Por consiguiente. . Reemplazamos f (x) por f (x) se .46 Sistemas Difusos y Control Difuso para escoger los valores iniciales adecuados para ellos. . respectivamente.

3.5 Diseño de sistemas Difusos empleando el Entrenamiento del Gradiente Descendente 47

planta f

y

u

e

sistema difuso ^ f

^ y

Figura 3.12: Esquema básico de identificación de un modelo para un sistema dinánico no lineal usando el sistema difuso. obtiene el modelo de identificación siguiente: b y (k + 1) = f (y (k) , . . . , y (k − n + 1) ; u (k) , . . . , u (k − m + 1)) b

3.12 muestra este esquema de identificación.

b Ahora se deben ajustar los parámetros en f (x) tal que la salida del modelo de identificación y (k + 1) converja a la salida del sistema y (k + 1) conforme k tiende a infinito. La figura b
k+1 y0 = y (k + 1) ,y k = 0, 1, 2, .... Debido a que el sistema es dinámico, estos pares entrada-

k+1 Los pares entrada-salida son (xk+1 ; y0 ), donde xk+1 = (y (k) , . . . , y (k − n + 1) ; u (k) , . . . , u (k − m + 1 0 0

salida se recolectan cada momento. La operación del proceso de identificación es el mismo que en los pasos de 1 a 5. En este capítulo hemos visto que los sistemas difusos consisten de cuatro componentes, base de reglas difusa, dispositivo de infierencia difusa, fuzzyficador y defuzzyficador como lo muestra la figura 3.10, para poder desarrollar los sistemas de control difuso son necesarios los

48

Sistemas Difusos y Control Difuso

conceptos de la matemática difusa, y de esta forma se pueden derivar fórmulas matemáticas compactas que nos representes sistemas complejos con bastante aproximación. En este capítulo se han presentado los conceptos fundamentales de los sistemas difusos, que son necesarios para el diseño de controladores difusos. Hoy en día la tecnología avanza de forma acelerada, incorporándose nuevas estrategias de control de sistemas, de esta forma se han fusionado técnicas de control como son las redes neuronales y los conceptos de los sistemas difusos, pudiendo mezclar la capacidad de procesamiento de información de las redes neuronales y la sencillez de expresión los sistemas difusos, de esta forma han surgido conceptos como las redes neuronales difusas o redes neuro difusas, identificadores difusos, etc. En el siguiente capítulo se pretende mostrar algunas alternativas en la identifcación de sistemas no lineales complejos empleando los principios de los sistemas difusos de control.

Capítulo 4 Observadores Difusos
Hoy en día uno de los retos principales del ser humano es crear computadoras más inteligentes capaces de pensar por sí mismas, que puedan aprender de la experiencia y no simplemente de la repetición de ciertas instrucciones que un programador de sistemas le asigne. El afán de encontrar nuevas oportunidades de solución a este y otros problemas interesantes le ha permitido crear modelos de procesamiento de información que sean capaces de imitar el comportamiento del cerebro humano, prueba de ello son las redes neuronales y los sistemas difusos. Estos sistemas se han fusionado con el fin de crear nuevos medios para la identificación de sistemas no lineales complejos [25]. En este capítulo se proponen diferentes formas para la estimación de los estados internos de un sistema no lineal en base a los observadores e identificadores difusos.

4.1.

Introducción

Para el diseño de los sistemas de control, en ocasiones hacemos la consideración de que todas las variables están disponibles para la retroalimentación. En la realidad esta suposición no es muy cierta, debido a que las variables de estado no son accesibles para una medición directa o debido a que no se cuenta con los sensores o transductores adecuados, resultan ser muy caros o el número de ellos es limitado.

lo que simplifica la complejidad del problema [27]. Si el observador de estado capta todas las variables de estado del sistema. podemos diseñar un dispositivo. ejemplo de ello pueden ser los identificadores basados en redes neuronales y sistemas difusos (identificadores neuronales difusos). expresando así el conocimiento adquirido durante el proceso de optimización. Por .2. se denomina observador de estado de orden completo. para aplicar la retroalimentación de estado. llamado estimador de estado u observador de estado. en este caso los observadores difusos. otra opción son los estimadores de estado como los observadores. En el diseño de los sistemas de control se pueden usar diferentes métodos para estimar e identificar los estados internos de un sistema cuando sólo se tiene información de los datos de entrada y salida de la planta. En este capítulo se presentan dos formas diferentes para la estimación de los estados internos de un sistema no lineal. Hay ocasiones en las que un observador tal no es necesario. así. En este caso. la salida del dispositivo generará un estimador del estado. el primero de ellos es por medio de la observación. lo que permite identificar los estados internos del sistema. El segundo método que se utiliza para la estimación de los estados internos del sistema se realiza empleando un observador libre de la estructura del modelo en combinación con una red neuronal difusa. en este caso se emplean los sistemas difusos tipo Mamdani que expresan el conocimiento previo disponible sobre el sistema. Ambas herramientas son adecuadas para encontrar los estados internos de un sistema que carece de esta información. pero no de aquellas que también se miden directamente. en este caso empleando un observador difusos tipo Takagi-Sugeno cuya salida es una combinación lineal de las entradas del sistema.50 Observadores Difusos Es importante señalar que debemos evitar diferenciar una variable de estado para generar otra. Observadores Existen métodos para estimar las variables de estado que no se miden sin un proceso de diferenciación. 4. sin importar si algunas de ellas están disponibles para una medición directa. sólo se requiere de la observación de las variables de estado que no se miden. La estimación de semejantes variables de estado por lo general se denomina observación.

en cambio. 4. que generalmente se asume para los observadores no lineales convencionales. se denomina observador de estado de orden reducido o. Se presenta un observador difuso para procesos no lineales. a pesar de los impresionantes resultados en modelado y control el problema dual y muy importante de los observadores difusos no ha tenido suficiente atracción para realizar los debidos estudios que merecen. donde se han presentado resultados teóricos importantes. u observador de orden mínimo [34]. Un observador que estima menos de n variables de estado. obtenido a través de la ”interconectividad difusa” de observadores tipo Luenberger lineales locales. Sin embargo. La aproximación emplea técnicas de estabilidad robusta en particular la cuadrática para mostrar la estabilidad cuadrática global del observador difuso. Si el observador de estado de orden reducido tiene el orden mínimo posible. Las técnicas difusas han demostrado tener una efectividad exitosa en el control de procesos complejos.3 Observadores Difusos 51 ejemplo. se denomina observador de estado de orden mínimo.4.3. En esta aproximación no se asume la linealidad de los procesos no lineales con respecto a las entradas. Los problemas relacionados con los observadores difusos podrían ser dirigidos por lo . En [10] se puede ver una de las pocas investigaciones que existen con respecto a los observador difusos. no es necesario observar todas las variables de estado. Observadores Difusos Desde sus inicios hasta la actualidad el control difuso está ganando una increíble madurez. Es muy conocido que muchos investigadores en el campo del control han realizado estudios sobre los observadores lineales y no lineales. sino sólo las n . observador de orden reducido. dado que las variables de salida son observables y se relacionan en forma lineal con las variables de estado.m variables de estado en donde n es la dimensión del vector de estado y m es la dimensión del vector de salida. los observadores difusos aún no han atraído suficiente la atención de los expertos. en donde n es la dimensión del vector de estado. simplemente.

Estimar las funciones de pertenencia asociadas con diferentes variables de estado fijando valores difusos y. se asocia a un conjunto difuso LX i . se da una ”interconectividad difusa” de los modelos lineales locales usando el método de inferencia estándar Sugeno para obtener el modelo global. y ∈ <p son respectivamente el estado. observadores difusos globales no lineales por medio de conectividad difusa de observadores locales lineales. . en cada subespacio difuso se define un modelo local lineal o afín y un observador correspondiente tipo Luenberger. Li es un valor lingüístico de las variables difusas Xj que representan las j g variables de estado x . primero el espacio de estados es dividido en subespacios difusos. Como sabemos los modelos Takagi-Sugeno se representan por un conjunto finito de reglas [10]: i Rp : Si x1 (t) ∈ L1 . . . . . . xn (t) ∈ Li n ( i• ) x (t) = Ai (t) + Bi (t) Entonces Pi : y = Hi (t) i = 1. M (4. Asumiendo algunas cotas en estas incertidumbres. . Así.Para cada valor lingüístico. 2. Construir en la línea de los modelos Takagi-Sugeno. . j j j donde x ∈ <n . Estas incertidumbres representan la interacción entre los modelos locales y dependen de la elección de las funciones de pertenencia. generan modelos lineales inciertos con incertidumbres correspondientes y no correspondientes. n y reescribiendo ˜ . . se emplean técnicas de estabilización cuadrática y funciones de Lyapunov suaves y continuas por tramos para deducir estabilidad de las dinámicas globales del error. u ∈ <m . Finalmente. Los modelos locales interconectados. la entrada y las variables Aquí se considera una subsecuencia I (con card(I) = n ≤ n) de 1. De acuerdo con la segunda opción. . .52 menos desde dos puntos de vista: Observadores Difusos 1. .1) de salida medibles. Li .

xkn (t) ∈ Li n k k  •  b b b x (t) = Ai x (t) + Li Hi (x − x) + Bi u (t) Entonces Oi :  y b b = Hi x (t) i = 1. . Se puede notar que para la 4. M    (4. . .2) con k1 . .2). Observador para un Sistema Difuso Takagi-Sugeno Un observador de estado estima las variables de estado con base en las mediciones de las variables de salida y de control. De hecho los observadores de estado pueden diseñarse si y sólo si satisfacen la condición de observabilidad [34]. xk2 . . Aquí tiene una función importante el concepto de observabilidad. . .4. u ∈ <. . en la parte "Si". .4 Observador para un Sistema Difuso Takagi-Sugeno (4. . . . .2) y definición de observadores locales O i . .4. . kn ∈ I y suponemos que xk1 . y ∈ <. . x ∈ <n . . M ) (4. .4) . La tarea del observador es estimar n − I estados remanentes. k2 . b b b Li la ganancia del i-ésimo observador. el vector de control deseado. . está basada en la variable del proceso x y no en x. xkn (t) ∈ Li n k ( k • x (t) = Ai (t) + Bi (t) Entonces Pi : y = Hi (t) i = 1. . . la partición difusa. Considere el sistema definido mediante x = Ax + Bu · e El vector de estado observado x se usa en la retroalimentación del estado para generar (4. .1): i Rp : 53 Si xk1 (t) ∈ Li 1 . se pueden construir observadores locales tipo Luenberger como: i RO : Si xk1 (t) ∈ Li 1 . . En base a los modelos locales Pi . xk1 están disponibles para las mediciones y permiten la partición (4. .3) donde O i representa un observador local asociado con el modelo local i-ésimo de (4.

7) se convierte en e= (A − Ke C)e · (4. la adición del término de corrección ayuda a reducir los efectos (4.8) A partir de (4. El orden del observador de estado es igual al del sistema. El observador de estado tiene y y u como entradas e y x como salida. o e = x−e x así. la ecuación (4. Suponiendo que el sistema se define mediante las ecuaciones (4. El último término del segundo miembro de esta ecuación es un término de corrección que contiene la diferencia entre la salida y medida y la salida Ce estimada.4).5) Suponiendo que el estado x se aproximará mediante el estado x del modelo dinámico e e x = Ae+Bu + Ke ( y − Ce) x x • (4. x La matriz Ke funciona como una matriz de ponderación.6) de la ecuación (4. Si la matriz A − Ke C es estable. se resta la ecuación (4.6).54 y = Cx Observadores Difusos (4. e x x − x= Ax − Ae−Ke ( Cx − Ce) x x = (A − Ke C)(x−e) · • modelo y las del sistema real.7) e Definiendo la diferencia entre x y x como el vector de error e . Para obtener la ecuación de error del observador.4) y (4.6) que representa el observador de estado.5) y que el modelo del observador se define mediante la ecuación (4.8) el comportamiento dinámico del vector de error se determina mediante los valores característicos de la matriz A − Ke C. el vector de . Ante la presencia de una discrepancia entre las matrices A y B usadas en este producidos por la diferencia entre el modelo dinámico y el sistema real. El término de corrección vigila e el estado x.

11) .u ) ∂x ∂u ∂x i i Definición 4. u) y = g (x) · e error convergerá a cero para cualquier vector de error inicial e(0). Ci ) : La regla i-esima del observador: SI z1 (t) es Fi1 y · (5. Es decir que x(t) converg- e erá a x(t) sin considerar los valores de x(0) y x(0).5) es localmente observable. cualquier vector de error tenderá a 0 (el (4.1 Si los pares (Ai . Ci ). Primero. donde cada regla i es de la forma La regla i-ésima: SI α1 (t) es Fi1 y · EN T ONCES x (t) = Ai x (t) + Bi u (t) + ai yi (t) = Ci x (t) + ci . u) − [Ai x (t) + Bi u (t)] ∂f ∂f ∂g |(xi .ui ) Bi = |(xi . 2. los observadores locales de estado son diseñados a continuación.4.5) se dice localmente observable.9) puede ser representado o aproximado de forma suficiente por un sistema difuso Takagi-Sugeno. Bi . i = 1.4 Observador para un Sistema Difuso Takagi-Sugeno 55 la matriz A − Ke C en tal forma que el comportamiento dinámico del vector de error sea origen) con una velocidad adecuada. 2. Si se eligen los valores característicos de asintóticamente estable y suficientemente rápido.10) ai = f (x. el sistema difuso Ai = Para el diseño del observador Takagi-Sugeno . (4. · · · y zg (t) es Fig i = 1. r · · · y αr (t) es Fir (4. son observables. r b b b ENT ON CES x (t) = Ai x (t) + Bi u (t) + Gi [y (t) − y (t)] b b yi (t) = Ci x (t) . r.9) Asumimos que (4. basados en la tripleta (Ai . se asume que el sistema difuso (5. · · · . El sistema TS consiste de una base de reglas difusa. donde ci = g (x) − Ci x (t) i = 1. 2. · · · . Para un sistema no lineal x= f (x.ui ) Ci = |(x . · · · .

-Explicar la interacción y relación entre la entrada y la salida de un sistema.5.6).5) y el observador difuso. la planta puede ser considerada como una ”caja negra” [38]. Los parámetros del observador son Gi en cada regla. La identificación es uno de los problemas esenciales en la teoría del control. especialmente cuando no tenemos información completa del modelo. debido a que una red neuronal es un identificador libre del modelo del sistema [16].56 Observadores Difusos final del sistema (5. entre otras cosas. Las Redes Neuronales Difusas (RND). r) son matrices del error de observación. Un método efectivo es utilizar redes neuronales. es necesario un modelo del sistema. El propósito de la identificación del sistema es. · · · .12) la salida final del observador difuso es (4. 4. Identificador Neuronal Difuso El problema de la determinación de un modelo matemático para un sistema desconocido por medio de la observación de los datos entrada-salida generalmente se refiere a la identificación del sistema. son sistemas que incorporan aspectos de las redes neuronales como es la capacidad de aprender a partir de ciertos datos. La identificación del sistema generalmente involucra dos pasos: la identificación de la estructura del sistema y la identificación de los parámetros del sistema. 2.13) donde se usa el mismo peso µi igual al peso de la i-ésima regla del sistema difuso (5. -Diseñar un controlador basado en el modelo de un sistema. Por tanto el estado final estimado del observador difuso es · b donde Gi (i = 1. es decir. Para realizar simulaciones del sistema bajo control. y (t) e y (t) son la salida r r r X X X b b b x (t) = µi Ai x (t) + µi Bi u (t) + µi Gi [y (t) − y (t)] i=1 i=1 i=1 r X b b µi Ci x (t) yi (t) = i=1 (4. -Predecir el comportamiento del sistema. respectivamente. y aspectos de los sistemas . [32].

En el caso de que sólo la entrada y la salida son medibles. Otro método es emplear múltiples capas en las redes neuronales dinámicas. las capacidades de aproximación de estas redes son limitadas. el mapeo entrada-salida no será suficiente para modelar todo el sistema no lineal. la regla de entrenamiento es similar al caso de una sola capa [35]. un sistema difuso complejo puede muy bien hacer corresponder los pares entrada-salida. Los perceptrones multicapa son implementados por la aproximación de la función no lineal en el lado derecho de la ecuación diferencial [18]. [35]. Para enfrentar este inconveniente. La desventaja principal de las redes neuronales estáticas es que las reglas de actualización de pesos utilizan información en las estructuras locales de datos y la función de aproximación es sensible a datos de entrenamiento que se presentan [11]. Se ha empleado una versión continua de la red neuronal multicapa para estimar las no linealidades de cierto robot manipulador [24]. Los neuro identificadores se pueden clasificar como estático (alimentación hacia adelante) y dinámico (recurrente) [32]. como con los perceptrones multicapa. Las redes neuronales dinámicas superan de forma exitosa estas desventajas debido a la estructura de retroalimentación [16]. Si el sistema no lineal tiene demasiados estados internos. Existen dos conceptos generales del entrenamiento recurrente. Muchas de las redes neuronales dinámicas no tienen capas ocultas [35]. existen al menos dos métodos: . El aprendizaje de un punto fijo está dirigido para hacer que las redes neuronales logren el equilibrio preestablecido [36]. Esto contiene funciones no lineales múltiples para aproximar las dinámicas no lineales complejas.4. [11]. sin embargo.5 Identificador Neuronal Difuso 57 difusos ya que trabajan con razonamientos lógicos basados en reglas de inferencia y variables lingüísticas. se propusieron redes neuronas dinámicas de mayor orden [21]. [30]. Las redes neuronales dinámicas fueron introducidas primero por Hopfield [14] y después estudiadas por otros [8]. etc. El aprendizaje de la trayectoria entrena a la red para seguir la trayectoria deseada en el tiempo [37]. en la realidad esto no siempre es válido. [47]. Para afrontar estas limitaciones. la habilidad de identificación podría ser mejorada exitosamente. Como en los perceptrones de una sola capa. [46]. Muchos de los trabajos sobre identificación difusa emplean la consideración de accesibilidad completa de los estados.

La dimensión del sistema difuso es la misma que la de la planta. [48]. Debido a esto es necesario adicionar otros términos. los observadores de alta ganancia requieren que las plantas no lineales tengan una forma linealizable. tales como retardos [48] o términos lineales [20]. en particular el Perceptrón Multicapa.6. Se han desarrollado redes neuronales difusas basadas en las redes neuronales tradicionales. debido a que no se dispone de un conocimiento exacto de la planta. La combinación de observadores no lineales con identificadores basados en los sistemas difusos es una buena dirección para mejorar la aproximación en la identificación. el observador de estados y el sistema de identificación son tratados separadamente. ademas es muy utilizado en las dinámicas de los robots manipuladores. la red neuronal modifica estos parámetros [23]. esta condición no es aceptable cuando se trata de identificar un sistema que se considera como una caja negra. Los observadores no lineales libres de la estructura del sistema. los parámetros correspondientes a los estados internos no pueden cambiar cuando se aplica la regla de aprendizaje. por lo que el observador en modo deslizante [13] es más adecuado. Por ejemplo. Debido a que sólo está disponible el error a la salida . en el que se han ido haciendo difusas algunas partes como por ejemplo las neuronas o la función de costo. La dificultad es que los observadores basados en un modelo no se pueden usar. Identificador Difuso basado en un Observador Un modelo neurodifuso puede ser interpretado como una clase especial de red neuronal con parámetros difusos. 4. pero son adecuados para plantas especiales. es decir. tales como los observadores de alta ganancia [33] y los observadores en modo deslizante [2] pueden ser muy útiles. .58 Observadores Difusos Emplear el sistema difuso que contenga un observador tipo Luenberger [20]. Utilizar el "principio de separación". En esta sección se aplicará el observador en modo deslizante para estimar los estados internos del sistema.

como es un observador en modo deslizante en combinación con una red neuronal difusa.4. ut ) := f (xt . A es una matriz especial en la que el par (A.6 Identificador Difuso basado en un Observador 59 En el caso cuando sólo la entrada y la salida son medibles.14) donde xt ∈ <n es el estado de la planta. · (4. yt = Cxt (4.1. ut ) − Axt . Sin embargo. · puede estabilizar al sistema no lineal (4.16) . muchos observadores se basan en la estructura de la planta. lo que significa un gran problema cuando sólo se cuenta con información de los datos de entrada-salida [49]. |ut | ≤ u. ut ). Observador en modo deslizante · Generalmente un sistema no lineal MIMO puede ser escrito como xt = f (xt . ut ).14) en una forma normal: xt = Axt + F(xt . 4. C es la yt = Cxt (4. Si el sistema no lineal tiene muchos estados internos. yt ∈ <m es la salida medible. esto nos permite aplicarlo al problema de identificación del sistema no lineal el cuál carece de información completa de sus estados internos. donde F(xt . C) es Construyendo el observador en modo deslizante como: xt = Axt + S (xt .15) observable. las redes neuronales complejas pueden relacionar muy bien los pares entrada-salida.14). por lo tanto en este caso podemos utilizar un observador para estimar los estados intermos y de esta forma emplear todos los estados para identificar al sistema no lineal. ut ∈ <m es determinada entrada de control que matriz de salida conocida. e) − Ket yt = Cxt donde et es el error de salida definido como: et := yt − yt = C∆t = C (xt − xt ) . el mapeo entrada-salida no es suficiente para modelar totalmente al sistema [17]. A continuación se presenta un observador libre de la estructura del sistema.6. Transformando el sistema (4.

2.18) Así la siguiente ecuación de Lyapunov tiene una solución positiva P AT P + PA0 = −Q. Asumiendo que la función no lineal f(xt .1 Bajo la suposición A1.17) (4. ut ) donde h (xt . Debido a que (A. ut ) es determinada una función como: kh (xt .16) no es dependiente de la planta no P−1 CT C∆t ° ° = −ρP−1 CT sign (et ) °C∆t ° (4. ut ) = A0 ∆t + S (xt . et ) = − donde ρ es una constante positiva. 4. ut )k < ρ.14) es asintóticamente estable t→∞ l´ ∆t = 0 ım (4. et ) − F(xt . et ) − F(xt . ut ) satisface la siguiente suposición A1: f(xt . ut ) = (A − KC) ∆t + S (xt . 0 para alguna matriz definida positiva Q.19) .14). existe K tal que A0 es estable. C) es observable. Análisis de estabilidad Teorema 4.60 Observadores Difusos ∆t es definido como el error del observador. ut ) · Claramente el observador en modo deslizante (4. ρ > 0. et ) − KC∆t − F(xt . et ) es elegido como: S (xt . Q = QT > 0 donde A0 := A − KC. lineal (4. La derivada del error del observador es ∆t = A∆t + S (xt . ut ) − Axt = −P−1 CT h(xt .16) y el sistema no lineal (4. el error del observador entre el observador en modo deslizante (4.6. El término de modo deslizante S (xt .

Considerando la siguiente función de Lyapunov candidata: Vt = ∆t P∆t Calculando su derivada · ¢ T ¡ T V t = ∆t AT P + PA0 ∆t + 2∆t P [S (xt .17). ut )k − ρ) < 0 · T · T T T T kh(xt . ut ). los sistemas mecánicos. ya que A. ut ). ut ) se determina.1 La suposición A1 es fácil de satisfacer si f(xt . El procedimiento de diseño del observador en modo deslizante (4. ut ) − 2 ° ° T ≤ −∆t Q∆t + 2 °C∆t ° (kh(xt .4. · · Comentario 4. ı t→∞ Con V t < 0. por ejemplo. Si elegimos S (xt . ∆t es cuadráticamente integrable y determinado ∆t ∈ L2 . 0 T 61 Empleando A1 F(xt .6 Identificador Difuso basado en un Observador Demostración. Debido a Vt ≤ −∆t Q∆t y Vt es el proceso determinado. et ) como (4.18) también concluimos que ∆t ∈ L∞ . Empleando el lema de Barbalat [32] obtenemos que el error del observador ∆t es asintóticamente estable. ∆t ∈ L∞ . et ) − F(xt .1. tenemos C V t = −∆t Q∆t + 2∆t CT h(xt . ut )] . ut ) son seleccionados por el usuario. ut ) − 2 ∆t C∆C∆t ρ k °k t ° T T T °C∆t ° ρ = −∆t Q∆t + 2∆t C h(xt . ut ) = −P−1 CT h(xt . así l´m ∆t = 0. . De la ecuación de error (4. P y h(xt . ut )k < ρ.16) se muestra en la figura 4. Muchos sistemas tienen funciones no lineales establecidas f(xt .

62 Observadores Difusos INICIO 1 Elegir A Elegir Q>0 NO ¿(A.C) observable? SI Elegir K>0 NO ¿solución P<0? SI Elegir h(x) frontera NO ¿A 0=A-KC estable? SI 1 NO -P-1 CTh=f-A x SI FIN Figura 4. .1: Procedimiento de diseño del observador en modo deslizante.

usando la inferencia del producto. Para una varil1 × l2 × · · · ln . · · · .4. l) reglas difusas SI-ENTONCES para realizar un mapeo de un b b vector lingüístico de entradas X = [b1 · · · xn ] ∈ <n a un vector lingüístico de salidas Y (k) = x b ·· ¸T · x1 · · · xm . · · · Ani . En el caso de una conexión completa l = A1i .6. · · · Cni son conjuntos difusos estándar [41]. · · · Bni y C1i . media de centros y fuzzyficador singleton.3. 2. B1i .20) Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani b b b 1 · · Ri : SI x1 is A1i y x2 es A2i y · · · xn es Ani b b b 2 · · · · ENTONCES 1 x1 es B1i y · · · 1 xn es Bni b b 3 3 Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani b b b 3 ENTONCES 1 x1 es u1 C1i y · · · xm es um Cmi y · · · xnes Cni b b b 3 ENTONCES 1 x1 es a1 x1 y · · · 1 xn es ani xn b b b b 3 3 · Empleamos l(i = 1. Identificador Difuso basado en un Observador Redes Neuronales Difusas Tipo Mamdani Un modelo difuso genérico se presenta como una colección de reglas difusas en la forma siguiente: Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani b b b · O x1 es u1 C1i y · · · xm es um Cmi · · · xn es Cni b b b Esta regla se puede escribir de tres forma para las reglas: O x1 es a1 x1 y · · · xn es ani xn b b b b · · ENTONCES x1 es B1i y · · · xn es Bni b b · · · · (4. la p-ésima salida del sistema lógico difuso se puede expresar de la . b b able de entrada xi existen li conjuntos difusos. De [41] sabemos que.6 Identificador Difuso basado en un Observador 63 4.

w1l   .t xt )m ] .. Las matrices W1.t σ(bt ) + W2. · · · 0]T . u2 · · · um . An ∈ <n×n es una matriz estable que se especifica posteriormente.64 siguiente forma: Observadores Difusos l P / = µAji w1pi φi i=1 j=1 i=1 j=1 i=1 Ã " #! Ã " #! l n l n l · P Q P Q P 1 xp = b ui w2pi µAji / µAji = ui w2pi φi 3 1 x b 3 p · · = Ã l P w1pi " n Q µAji #! Ã " l n P Q i=1 #! (4.  (4. wn1 wnl b el vector de datos σ(bt ) = [φ1 · · · φl ]T . φ(·) is <m×m la matriz diagonal b b φ(·) = diag [φ1 (V2. las capas de salida.t xt )1 · · · φm (V2. wpi es el punto en el que µBpi = 1. ut = [u1 .t ∈ <n×m son los pesos que describen las conexiones de σ (·) ∈ <m es el vector sigmoidal de funciones. 0.22) estado de la red neuronal.. . . donde  el parámetro Wk =    b b xt = An xt + W1.t ∈ <n×m . Si se define φi = n Y j=1 n l XY i=1 j=1 1 x b 3 p = i=1 l P ai xi b µAji / µAji Podemos considerar la siguiente red neuronal para identificar al sistema no lineal. el vector xt ∈ <n es el x Los elementos de σ i (·) (así como el φi (·)) se eligen como funciones sigmoidales ³ ´ T σ i (x) = ai / 1 + e−bi x − ci .t φ(bt )ut x x w11 . W2.21) i=1 j=1 j=1 i=1 donde µAji son las funciones de pertenencia de los conjuntos difusos Aji .

26) donde Generalmente la red neuronal (4.14). R (4. ¡ ¢ b R J ≤ (1 + η) kx − xk2 1 + 1 + η −1 kx − xk2 1 . el sistema no lineal (4.t .27) Si una entrada de control acotada ut puede estabilizar al sistema no lineal (4.t := W1 − W1. de esta forma se plantea el siguiente criterio: b R Jm´ = m´ J.22) no puede igualar al sistema no lineal (4. Podemos definir el error de identificación como Debido a que σ y φ son elegidos como las funciones sigmoidales. .t := W2 − W2.14) puede representarse como e φt := φ(xt ) − φ(bt ) x ∗ f W2.t ∗ ∗ donde et es el error del modelado.23) Así. Si R seleccionamos R = (1 + η−1 ) R1 . para cualquiera η > 0.14) exactamente. Λf Λf = ΛT > 0 f .22) puedan seguir los estados completos de la planta real (4.25) (4. De hecho. las condiciones de Lipschitz generales siguientes se cumplen: ³ ´T ³ ´ e e et e φt ut Λ2 φt ut ≤ u2 ∆T Λφ ∆t σ T Λ1 σ t ≤ ∆T Λσ ∆t . la dinámica no modelada et es acotada [24]. W1 . W2 son matrices constantes dadas . J = kx − xk2 ın ın W (4. Ahora asumiendo que f A2: Existe una constante positiva η tal que ° °2 °e ° f f °ft ° = etT Λf et ≤ η.14) o (4. t t e σ t := σ(xt ) − σ(bt ). éste es el Principio de Separación. podemos reformular el objetivo de identificación como: b R minimizar el término kx − xk2 .24) b ∆t := xt − xt (4. x ∗ f W1.6 Identificador Difuso basado en un Observador 65 Ahora el objetivo del observador difuso es hacer que los estados del modelo neuronal (4. f (4.15). f ∗ ∗ xt = An xt + W1 σ(xt ) + W2 φ(xt )ut + et .4. tenemos El mínimo del término kx − xk2 ya se ha resuelto en la sección para el observador.

t = −2st K1 P∆t σ T ( · W2. Debido a que W1 . .30) ∗T ∗ ∗T ∗ donde W1 := W1 Λ−1 W1 .0 = W1 . 1 2 La otra contribución principal de este documento es que se da una nueva regla de aprendizaje en línea para la red neuronal dinámica multicapa (4.t = −2st K2 P∆t (φut )T donde st = 0 si k∆t k2 1 ≤ η Q · (4.29). el par (An .66 Observadores Difusos Es bien sabido [45] que si la matriz An es estable.29) con R = 2W1 + 2W2 + Λ−1 .0 = W2 .29) tiene una solución definida positiva P.28) (4. el par (Q1/2 . R1/2 ) es controlable. W2 := W2 Λ−1 W2 . ∗ W2.22): W1. de esta forma la ecuación de la matriz de Riccati AT R−1 An − Q ≥ n AT P + PAn + PRP + Q = 0 n matriz (4. y la condición de frecuencia local especial o su equivalente de la ¤ £ ¤T 1 £ T −1 An R − R−1 An R AT R−1 − R−1 An n 4 se cumple. tiene una solución positiva P. f Q = Q1 + Λσ + u2 Λφ (4. P es la solución de la ecuación de 1 isi k∆t k2 1 > η Q (4.31) ∗ ∗ la matriz de Riccati dada por (4. Por lo tanto es razonable introducir la siguiente suposición: A3: Para una matriz estable dada An existen una matriz estrictamente definida positiva Q1 tal que la matriz de la ecuación de Riccati (4. W2 pueden ser matrices constantes. (4. Ki ∈ <n×n (i = 1 · · · 4) son matrices definidas positivas.33) El teorema siguiente declara el hecho que la regla de aprendizaje sugerida anteriormente resulta ser globalmente estable.32) las seleccionamos como las condiciones iniciales: ∗ W1. An ) es observable.

2 Se considera un sistema no lineal (4.4.37) La desigualdad de la matriz siguiente [47] es usada para estimar el lado derecho de (4.27).t si k∆t k2 > η  1 2 t Q1  · · · (4.14) y la red neuronal dinámica multicapa (4.t si k∆t k2 1 > η t Q 2 2 (4.22) cuyos pesos son ajustados con (4.t φut + W1 σ t + W2 φt ut + et f · (4. Vt = · · f f f f  V 2. de la zona muerta de la regla de aprendizaje (4. la dinámica del error de identificación es ∗ ∗e f f e ∆t = An ∆t + W1.t K−1 W2.t + tr W2.38) ¡ ¢T XT Y + XT Y ≤ XT Λ−1 X + Y T ΛY Ahora se puede discutir el término 2∆T P∆t . Si las suposiciones A2 y A3 se cumplen„ se puede concluir que (I) Los pesos de las redes neuronales Wi.t K−1 W1.t σ + W2.22) y (4. la derivada de Vt es  ·  V =0  1.t = 2∆T P∆t + tr W1.t φut f f e 2∆t P∆t = 2∆t PAn ∆t + 2∆t P W1 σ t + W2 φt ut + f t (4.t := λm´x PQ−1 η + 1 tr W1. fT 1 f fT 2 f  V2.36) f Debido a que Wi.35) Definiendo una función de Lyapunov candidata como  h i h i ¡ ¢ fT f fT f  V1.34) Q Demostración. (II) Para cualquiera T ∈ (0.6 Identificador Difuso basado en un Observador Análisis de estabilidad 67 Teorema 4. de acuerdo con: t ³ ´ ³ ´ · T T T ∗ ∗e et + 2∆T P W1.31).t + 1 tr W2.39) .t := ∆T P∆t + 1 tr W1.38) (4.t y el error de identificación ∆t están acotados.t K−1 W1.t + 1 tr W2. ∞) el error de identificación ∆t converge al conjunto residual n o D∆t = ∆t | k∆t k2 1 ≤ η (4.t si k∆t k2 ≤ η a 1 1 2 Q1 h 2 i h2 i Vt = . Usando (4.t si k∆t k2 1 ≤ η  Q · " T # " T # · · .t σ + W2.t = Wi.t K−1 W1.t .31).t K−1 W2.t K−1 W2.

t xt ° Λ2 (4.t xt ° 1 t t σ t 1 1 Λ1 ° °2 °e ° ∗ T T b 2∆t PW2 ν φ ≤ ∆t PW2 P∆t + l2 °V2.40) De A2.t σ t . Y ∈ <n×k y para cualquier matriz definida positiva 0 < Usando (4. 2∆T Pet f t puede ser estimado como Usando (4. esto es.41). intervalo de tiempo durante el cuál k∆t k2 1 > η. T ] . se cumple (I).40) y (4. n # " · T −1 f f f = tr W K1 W1. 1. Q Así el tiempo total durante el cuál k∆t k2 1 > η. Como V 1.38). V 2. que es válido para cualquiera X.t ≤ ∆T L∆t + LW1 + LW2 − ∆T Q1 ∆t + η t t donde L = PAn + AT P + PRP + Q.26) tenemos ¡ ¢ ∗T e et 2∆T PW∗ σ t ≤ ∆T PW∗ Λ−1 W1 P∆t + σ T Λ1 σ t ≤ ∆T PW1 P + Λσ ∆t 1e 1 1 t t t ¡ ¢ e 2∆T PW∗ φt ut ≤ ∆T PW2 P + u2 Λφ ∆t t t 2 ° °2 °e ° ∗ b 2∆T PW∗ ν σ ≤ ∆T PW∗T Λ−1 W1 P∆t + ν T Λ1 ν σ ≤ ∆T PW1 P∆t + l1 °V1. · f f f LW2 = tr W2. ∀t ∈ [0.43) V 2.31).42) LW1 Usando A3 y la regla de adaptación (4.t + 2∆T PW1.t + 2∆T PW2.t ≤ −∆T Q1 ∆t + η t " · T # Es conocido que cuando · · · k∆t k2 1 > η Q (4.t = 0 y V 2. es finito. (4.41) V 2.68 Observadores Difusos Λ = ΛT ∈ <n×n . Vt es acotado.t < 0.t K−1 W2.t φut 2 t V2.t t (4.t puede ser escrito como · f f f 2∆T Pet ≤ ∆T PΛ−1 P∆t + etT Λf et ≤ ∆T PΛ−1 P∆t + η t t t f f · (4.t < 0. Teniendo Tk se denote el Q .

[21] usa σ−modificación para evitar que el error de identificación sea infinito en presencia de una perturbación acotada pequeña. se alcanza la estabilidad asintótica . k∆t k2 1 eventualmente permanecerá dentro de este círculo.6 Identificador Difuso basado en un Observador 69 entonces vuelve a entrar). Por lo tanto se logra obtener (II). La existencia del error de modelado requiere la técnica adaptable robusta como en [32].44) y k∆t.k kQ1 − η = 0 k→∞ Así k∆t k2 1 es acotada por medio de un argumento del conjunto invariante.58) es similar con la propagación hacia atrás de las redes neuronales multi¡ ¢ ¡ ¢ bt capa estáticas [26]. [45].31) de las redes neuronales multicapa dinámicas (4. (Ki P) es el índice de aprendizaje.k k2 1 convergerá a η.44) · también es acotada. Q círculo es finito. η = 0). Si sólo se tienen tiempos finitos. ım Q T 0 t→∞ T →∞ Comentario 4. Q Comentario 4.22) puede igualar al sistema no lineal exactamente (e = 0.3 El procedimiento de aprendizaje (4.4. como el tiempo total en que k∆t k2 1 deja el Q Q ∞ X k=1 Tk < ∞. l´ sup k∆t k = 0.2 Muchos documentos han presentado la prueba de estabilidad del neuro identificador a través de la teoría de Lyapunov (ver [21]. Entonces (4. Teniendo k∆t k2 1 denota el error de seguimiento más grande durante el Q intervalo Tk . Para los ejemplos. k→∞ l´ Tk = 0 ım (4. En este documento usamos la técnica de zona-muerta.43) ∆ Q Así k∆t. De (4. Esta técnica se ha usado con éxito en las redes neuronales estáticas como en [4].t ∆t xT son exactamente las mismas como en el esquema de propagación hacia atrás [12].k k2 1 acotado implica que Q h i 2 l´ ım k∆t. Si la red neuronal (4. se detine la regla de adaptación para asegurar que el peso y el error de identificación sean acotados. f Z 1 T l´ sup ım k∆t k2 1 dt = 0. . es decir. [35] y [47]). Ki P∆t σ T y Ki PWi. Esto significa que cuando la norma del error de identificación es pequeña comparado con el error de modelado. k∆t k2 1 permanece fuera del círculo de radio η (y Q Si k∆t k2 1 deja el círculo infinitas veces.

Así.1. pero éstos son acotados. Comentario 4. Simulación Identificación de sistemas no lineales Se emplea un sistema no lineal para ilustrar como diseñar un sistema difuso empleando el algoritmo del gradiente descendente. el problema mínimo local (que es una preocupación mayor en el aprendizaje estático) no es alcanzado en este caso. asumimos que sus funciones de pertenencia se eligen como funciones Gaussianas à ! (x − c)2 µ (x) = exp − σ2 función con forma de campana.31) es para minimizar (4.23). El objetivo de la regla de actualización (4. por lo tanto no es necesario el aprendizaje off-line.5 Ninguna condición inicial especial se requiere.7. 4. de anchura σ y amplitud 1. Así los pesos en este algoritmo on-line no puede converger a los valores óptimos. y(k) + u(k)3 1 + y(k)2 (4.7.70 Observadores Difusos Comentario 4. A21 . centrada en el valor c. A12 .4 Aún cuando la regla de aprendizaje propuesta se parece a los algoritmos de propagación hacia atrás con un término adicional. Se desea diseñar un sistema difuso para identificar el siguiente sistema no lineal: y(k + 1) = Se tienen 2 reglas difusas R1 : Si y (k) es A11 y u(k) es A12 entonces y(k + 1) es B1 R2 : Si y (k) es A21 y u(k) es A22 entonces y(k + 1) es B2 donde los 6 conjuntos difusos A11 . 4.45) . B1 y B2 son desconocidos. A22 . la estabilidad del error asintótica global es garantizada debido al hecho que es derivado basado en la aproximación de Lyapunov.

el conjunto difuso es un conjunto .4.7 Simulación 1) Fuzzyficador tipo singleton µ= ( 1 si x = x∗ 0 otro caso 71 por lo tanto para una declaración difusa se tiene (x es A) → µA (x∗ ) 2) La operación difusa: {y (k) es A11 y u(k) es A12 } es µA11 µA12 Empleando implicaciones difusas de la forma: {Si y (k) es A11 y u(k) es A12 entonces y(k + 1) es B1 } produce µA11 µA12 µB1 La relación de 2 reglas difusas R1 y R2 es la operación O µ = m´x a 3) Defuzzyficador. difuso normal µB1 (y 1 ) = 1 suponiendo que el centro del conjunto difuso B2 es y 2 . µA21 µA22 µB2 suponiendo que el centro del conjunto difuso B1 es y 1 . el conjunto difuso es un conjunto difuso normal µB2 (y 2 ) = 1 la altura del primer conjunto difuso es µA11 µA12 µB1 la altura del segundo conjunto difuso es µA21 µA22 µB2 Empleando un defuzzyficador por media de centros.46) µA11 µA12 + µA21 µA22 £¡ ¡ ¢ ¢ ¤ µA11 µA12 µB1 . la salida del sistema difuso es ¡ ¢ ¡ ¢ y 1 µA11 µA12 + y 2 µA21 µA22 y (k + 1) = b (4.

µA12 .48) bσ2 22 (y1 −b)(y(k)−c11 )2 y y) z1 bσ3 11 y (y2 −b)(u(k)−c22 ) ³ ´ ³ ´ 2 2 z1 = exp − (y(k)−c11 ) exp − (u(k)−c12 ) σ2 σ2 11 12 ³ ´ ³ ´ (y(k)−c21 )2 (u(k)−c22 )2 z2 = exp − σ2 exp − σ2 21 22 a = y 1 z1 + y 2 z2 b = z1 + z2 1 η= 1 + kz1 k2 + kz1 k2 De las condiciones iniciales aleatorias [0. .2: Problema 4. . c22 (k + 1) = c22 (k) − 2η (b − y) z2 y σ 11 (k + 1) = σ 11 (k) − 2η (b − y donde y (y1 −b)(y(k)−c11 ) bσ2 11 (4. Solución 4. en este problema se conoce el modelo matemático. los resultados de identificación se muestran en la figura 4.1 Los sistemas difusos son muy útiles cuando los modelos no están disponibles o se tiene información parcial del sistema. c12 c21 .72 Observadores Difusos El objetivo de identificación es encontrar 4 funciones de pertenencia µA11 .47): J = [y(k + 1) − y (k + 1)]2 b (4. µA22 (cada función de pertenencia tiene dos parámetros y 1 (que corresponde al conjunto difuso B1 ) y y 2 (que corresponde al conjunto difuso B2 ) por lo que se considera minimizar el siguiente criterio (4. 1].47) y y 1 (k + 1) = y 1 (k) − η (b−y) z1 b y y 2 (k + 1) = y 2 (k) − η (b−y) z2 b c11 (k + 1) = c11 (k) − 2η (b − y) z1 y . µA21 .1 En este caso se desea identificar un sistema no lineal empleando un sistema difuso.

.4.2: Identificación de sistemas no lineales.7 Simulación 73 Figura 4. Figura 4.3: Funciones de pertenencia para B1 y B2 .

8 mu(x) mu(x) 0 0.5711 0.4: Funciones de pertenencia para A11 .2 0.9 0.7679 0.74 Observadores Difusos funcion de pertenencia para A11 1 c1=0. . A21 y A22 .8 s2=0.8 0.75 -0.7 0.4 0.4 0.2 2 4 x funcion de pertenencia para A21 1 c3=1.6077 mu(x) mu(x) 0.2 2 4 x funcion de pertenencia para A22 1 0.5 c4=0. A21 y A22 .2 0 -5 0 x 5 0 -2 funcion de pertenencia para A12 1 c2=1.9 A22 0.5: Comparación de las funciones de pertenencia de A11 .5 0. A12 .8 s3 =-1.7159 s1=0.8 0.2173 s4=0. funciones de pertenencia A11 A12 A21 A22 1 0.85 0.1 0 -2 -1 0 1 2 A12 A11 A21 x 3 4 5 Figura 4.6 0.4 0.6 0.1737 0.4 0.4970 0.8400 0 x 0.95 0.3 0.6 mu(x) 0.6 0.5 1 0 -2 0 Figura 4. A12 .

7159) A12(1.5 1 0.A21 y A22 . A12 . se asocia una consecuencia.9937) B2(-0. y(k) A11(0.2173) B1(0. .5 0 -0.4.7 Simulación 75 parámetros 2 1.7: A cada combinación de las variables de entrada.4970) u(k) Figura 4.5 -1 0 20 40 60 80 100 120 140 160 180 tiempo 200 Figura 4.6: Convergencia de parámetros para las funciones de pertenencia A11 .1737) A22(0.3331) A21(1.

así.1737 entonces y(k + 1) es 0.76 Observadores Difusos Conclusión 4. A continuación se presenta el siguiente ejemplo.1 Se aplicará el algoritmo de diseño establecido anteriormente a un problema de un robot manipulador de dos grados de libertad [31]. se determina a partir de un sistema difuso.6 podemos observar que por medio del algoritmo empleado se alcanza la convergencia de cada parámetro establecido permitiendo al sistema difuso identificar a la planta no lineal. A21 y A22 (figura 4. Expresando las dinámicas de un robot manipulador de dos grados de libertad de la siguiente forma: M(q)q + V (q.9937 R2 : Si y (k) es 1. Se utilizan funciones del tipo Gaussianas. Ejemplo 4. en realidad el número de reglas ideal que nos permita hacer una aproximación adecuada del sistema es aún un tema de investigación.4) para la parte de la premisa y B1 y B2 (figura 4.2173 entonces y(k + 1) es − 0. este dato se establece de acuerdo a los resultados que mejor se adecuen al problema. A12 .7 se muestra que para una combinación de las variables de entrada se da un valor en la consecuencia de las reglas difusas como parte de la aplicación del algoritmo de optimización.1 Para este caso se utilizaron dos reglas difusas. La aproximación que se obtiene del sistema no lineal es adecuada en términos generales. con parámetros variables: la posición del centro y ancho de cada función (c y sigma). El propósito del algoritmo de optimización es cambiar estos parámetros de tal forma que el sistema difuso aproxime lo mejor posible al sistema no lineal. con este valor fue posible obtener un buen resultado en la identificación del sistema.3) en la parte de la consecuencia de estas reglas SI-ENTONCES (IF-THEN). En la figura 4. con dos reglas difusas y cuatro conjuntos difusos A11 .7159 y u(k) es 1.4970 y u(k) es 0.331 Este mismo conocimiento se puede emplear en la identificación y control de sistemas no lineales prácticos tales como los robots manipuladores. para este caso: R1 : Si y (k) es 0. q)q + G(q) + fD (q) = τ (t) ·· · · · . En la figura 4.

los elementos se pueden representar como " # M (q) = M11 M12 M21 M22 . control. τ (t) ∈ R2 es la entrada de · En la figura 4.4. G(q) es el vector de la gravedad.8: Robot Manipulador de dos grados de libertad. V (q. M (q) es la matriz de inercia.7 Simulación y l2 77 r2 l1 r1 q2 mg2 q1 mg1 x Figura 4. q) es la matriz centrípeta y de Coriolis. fD (q) es el vector de la fricción. . q2 ]T es la posición de los eslabones del robot. · donde q = [q1 .8 se muestra un esquema de un robot manipulador de dos grados de libertad. Para el caso de los dos eslabones.

4 cos q1 + 25.4 y 0. El manipulador está en posición vertical.78 Observadores Difusos 2 2 2 2 2 M11 = m1 (r1 /4 + l1 /3) + m2 (l1 + r2 /4 + l2 /3 + l1 l2 cos q2 ) M12 = m2 2 2 2 M22 = m2 (r2 /4 + l2 /3) + mL l2  ³· ´  · · ³ ·´ −Vm q 2 sin q2 −Vm sin q2 q 1 + q 2  C q. Los dos coeficientes de fricción son 0.1 # C= M=   · 2.1 + 2. m2 = 5.3Kg.65q 1 sin q2 0 # " 75.8. Los coeficientes de fricción son 0.49) Los parámetros del robot son: m1 = 4. Por lo tanto las matrices reales de (4.65q2 sin q2 −2.1 + 2. q =  · 0 Vm q 1 sin q2 ¡1 ¢ Vm = 2 m2 l1 l2 + mL l1 l2 .8Kg. G (q) = 25.65 cos q2 2. y la gravedad es 9. se considera un robot manipulador planar de dos grados de libertad.3. l1 = l2 = 1m. Se asume que cada eslabón tiene su masa concentrada en un punto al final. = 1 m2 gl2 cos (q1 + q2 ) # "2 · · ³·´ ν 1 q1 + κ1 sign(q 1 ) Fd q = · · ν 2 q2 + κ2 sign(q 2 ) ¡ 2 2 +m2 (l1 + 3/4l2 + l1 l2 cos q2 ) ¢ 2 2 2 r2 /4 + l2 /3 + 1 l1 l2 cos q2 + mL l2 = M21 2 (4. con gravedad y fricción. l1 = 1.65 q1 + q 2 sin q2 . Los parámetros del robot son: m1 = m2 = 1.3 + 5.97 cos (q1 + q2 ) . l2 = 2. mL = 0. r1 = l1 /2. r2 = l2 /2.65 cos q2 2.  Para realizar las simulaciones. # " ¡ ¢ 1 m1 + m2 gl1 cos q1 + 1 m2 gl2 cos (q1 + q2 ) 2 2 G (q) .7.3 cos (q2 ) 2.49) son: " 9.97 cos (q1 + q2 ) ´ ³· · · −2. .

t) + g(xt .Como tenemos la matriz C i h C= 1 0 . q 2 .Ahora se verifica que el par (A. q2 . 1.7 Simulación (4.1. Para el robot manipulador de dos grados de libertad se utilizan dos observadores. t)u = [0. esto lo podemos hacer calculando la matriz " siguiente la cuál debe ser de rango completo # C rango =n CA Si C= h i . h ·· ·· ³ · ´iT . f (xt .. q2 . q a := [q2 . C) sea observable. q 1 . e) − Ket y a = Cq a . qa := [q1 . q 2 ] · · (4. −M −1 V q + G + Fd g(xt . t) = q 1 .51) observador (b): q b = Aqb + S (q b . " # 0 1 podemos elegir A = para hacer que el par (A.4.16). 1 0 2.50) Asumimos que sólo la posición del ángulo q es medible. y CA = h i " 0 1 1 0 # = h i 1 0 1 0 0 1 . observador (a): q a = Aq a + S (q a . 0. T · · 79 (4.49) se puede escribir como: x = f (xt . t)ut donde i h · · T xt = q1 . M −1 (q)τ ] .. la velocidad q será estimada por el observador en modo deslizante (4. q 1 ] · · (4. e) − Ket y b = Cq a . C) sea observable.52) Siguiendo los pasos de diseño de la figura 4.

por lo tanto podemos encontrar K tal que A0 = A − KC sea estable.Entonces A0 = A − KC = − 1 0 1 0 2 " # " # 0 1 2 0 A0 = − 1 0 2 0 " # −2 1 A0 = −1 0 Se obtiene el polinomio característico de A0 y sus raíces. C) efectivamente es observable.53) se tiene: .80 se tiene que rango " 1 0 0 1 # =2 Observadores Difusos De aquí se obtiene que el par (A.Debemos obtener P > 0.53) A0 P + P AT = −Q 0 6. 2 " # Ã" # ! i 0 1 2 h 4. de (4.Si" # elegimos K > 0 para que A0 sea estable tenemos 2 K= > 0. por lo tanto A0 es estable. s2 = −1 " tienen parte real negativa. se verifica si son raíces reales negativas: ¯ " ¯" ¯" # " #¯ # " #¯ #¯ ¯ ¯ s 0 ¯ s + 2 −1 ¯ 1 0 −2 1 ¯ −2 1 ¯ ¯ ¯ ¯ ¯ ¯ ¯ det |sI − A0 | = det ¯s − − ¯ = det ¯ ¯ = det ¯ ¯ ¯ ¯ ¯ 0 s ¯ ¯ 0 1 −1 0 −1 0 1 s ¯ det |sI − A0 | = (s + 2) s − (−1) = s2 + 2s + 1 = (s + 1) (s + 1) polinomio característico = s2 + 2s + 1 s1 = −1.Seleccionar Q > 0 si empleamos Q = 3 1 8 3 . 3. # raíces 5... la solución de la ecuación de Lyapunov (4...

G y Fd sabemos que f (xt .5 > 0 det |P | = P1 P4 − P2 P3 = (1. Para eliminar el chattering. t)u en (4.25 0 Para verificar que P > 0 es definida positiva.5 -0. q2 ]T (rad).25 P1 P2 por lo tanto P = = P3 P4 3. ut )k < ρ. se donde" Kp = 600 0 # |C∆t | ≥ δ |C∆t | < δ (4. V. P3 P4 " P1 = 1. Para estabilizar al robot manipulador se emplea un control PD ³· · ´ τ = −Kp (q − qD ) − Kd q − q D   # " # " · ·d d q1 − q1 q −q τ1 = −Kp − Kd  · 1 · 1  d d τ2 q2 − q2 q2 − q2 " 10 0 # + (4. ρ = 10. et ) = − ρ= kC∆t k −ρP −1 C T C∆t /δ Sin perder generalidad.49): donde q = [q1 .Se elije h(x) acotada Por tanto las matrices reales de (4. De las definiciones de M.4.5)(0) − (0. t) + g(xt . 7.54) .8125 =0. sus menores principales deben ser positivos.8125> 0 de esta forma la matriz P es definida positiva.7 Simulación " −2 1 −1 0 #" P1 P2 # " P1 P2 #" −2 −1 # " 3 1 # 81 = P3 P4 1 0 8 3 # " # 1. elegimos kh (xt .25)(3.50) es acotada.. 0 600 0 10 Por tanto todos los estados del manipulador son acotados. de modo que existe una función h(x) tal que −P −1 C T h = f − Ax puede usar el siguiente compensador de capa acotada ( −ρP −1 C T sign (C∆t ) P −1 C T C∆t S (xt . Kd = .25) = 0+0.55) El controlador de capa acotada anterior ofrece una aproximación continua para el modo deslizante discontinuo dentro de la capa acotada y garantiza que el error del observador esté .

De [41] es conocido que si se utiliza inferencia . A1i . de esta forma se proporciona la característica para el observardor en modo deslizante.01. la p-ésima salida del sistema conexiones completas.56) Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani b b b 1 · · Ri : SI x1 is A1i y x2 es A2i y · · · xn es Ani b b b 2 · · · · ENTONCES 1 x1 es B1i y · · · 1 xn es Bni b b 3 3 Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani b b b 3 ENTONCES 1 x1 es u1 C1i y · · · xm es um Cmi y · · · xnes Cni b b b 3 ENTONCES 1 x1 es a1 x1 y · · · 1 xn es ani xn b b b b 3 3 · Se utilizan las l(i = 1. l = l1 × l2 × · · · ln . en este caso se ha seleccionado un dato de δ =0.82 Observadores Difusos dentro de cualquier vecindad cercana al origen [6]. 2 · · · l) reglas difusas SI-ENTONCES que permita realizar un b b mapeo de un vector lingüístico de entrada X = [b1 · · · xn ] ∈ <n a un vector lingüístico x ·· ¸T · b de salida Y (k) = x1 · · · xm . media de centros y fuzzyficador tipo singleton. · · · Bni y C1i . Un modelo difuso genérico se representa como una colección de reglas difusas de la siguiente forma: b b b Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani · O x1 es u1 C1i y · · · xm es um Cmi · · · xn es Cni b b b Esta regla se puede escribir de tres forma para las reglas: O x1 es a1 x1 y · · · xn es ani xn b b b b · · ENTONCES x1 es B1i y · · · xn es Bni b b · · · · (4. En el caso de de productos. · · · Ani . B1i . · · · Cni son conjuntos difusos b b estándar [41]. El valor de δ es un dato importante que permite establecer el modo deslizante para el observador. Para la variable de entrada xi existen li conjuntos difusos.

12. b q b b b σ(x) = 0. q 1 .7 Simulación difuso se puede expresar de la siguiente forma: " #! Ã " #! Ã l n l n l · P Q P Q P 1 / = xp = b w1pi µAji µAji w1pi φi 3 i=1 j=1 i=1 j=1 i=1 " #! Ã " #! Ã l n l n l · P Q P Q P 1 / = xp = b ui w2pi µAji µAji ui w2pi φi 3 i=1 j=1 i=1 j=1 i=1 83 donde µAji son los valores de las funciones de pertenencia de los conjuntos difusos Aji .t φ(V2.t q ) + W2.t y W2.t y V2. V1.t y W2.31) con η = 0.t q)Bτ b b b b 2 − 0. los resultados de identificación se muestran en las figuras 4. el neuro identificador como en (4.2.4. . q 2 ]. Si definimos φi = n Y j=1 1 x b 3 p · = i=1 l P ai xi b µAji / n l XY i=1 j=1 µAji (4.5. b   .0 = V10 q (0) = 0. (1 + e−2x ) φ(x) = · (4. wpi es el punto en que µBpi = 1.t σ(V1. Los resultados de la identificación para el estado q se muestran en las figuras 4.t y V2.58) tendrá dos dimensiones. K i := Ki P = 10I4 .t ∈ R2×3 .31) n = 2. An = −2I4 .9 . V1. Empleando la misma regla de actualización (4.05 (1 + e−0.4.2x )  1 1 1 1  = V2.t ∈ R3×2 .2 − 0. Si no empleamos el observador.13 . Se seleccionan W1. q(0) = q(0) =  Los pesos se actualizan de acuerdo a (4.14. q2 . elegimos W1.57) El modelo difuso anterior puede representar adecuadamente el siguiente sistema el cuál puede ser una representación del modelo del sistema no lineal en cuestión: q = An q + W1.0 =  1 2 1 2  2 1 2 1  · · T T Las condiciones iniciales son W1.t ∈ R4×3 .4.0 = W2.58) donde q = [b1 .t ∈ R3×4 .

cji y σ ji son números aleatorios entre (0.84 Observadores Difusos Las funciones de pertenencia que se emplean en el sistema difuso se eligen como funciones Gaussianas de la siguiente forma: (xj − cji )2 µAji (k) = exp − σ2 ji à ! El algoritmo de aprendizaje tiene como objetivo variar la posición y ancho de las funciones Gaussianas de forma iterativa tal que se aproxime apropiadamente al sistema no lineal. Se seleccionan los siguientes datos para l = n = 2.2 Se utiliza un neuro identificador con la regla de actualización (4.3 Haciendo uso del observador en modo deslizante (4. Solución 4.3 Estimar los estados del robot manipulador correspondientes a la posición y velocidad empleando un observador en modo deslizante.2 Se puede observar en las figuras correspondientes que la identificación de los estados del robot manipulador es adecuada.16) se estiman los estados correspondientes al sistema. Conclusión 4. Problema 4. En la figura 7.2 Identificar los estados del sistema no lineal para el robot manipulador.31). Podemos diseñar un observador en modo deslizante para el sistema (4. 1) .1 se muestra el diagrama general para la identificación de los estados del robot manipulador. Solución 4. El diagrama de simulación se muestra en el apéndice A. Podemos ver que el identificador basado en el observador es mejor que el identificador difuso donde los estados son parcialmente medibles. .50). Problema 4. El número de reglas establecido nos muestra resultados aceptables.

. Figura 4.10: Identificación del estado q2 del robot manipulador.7 Simulación 85 Figura 4.4.9: Identificación del estado q1 del robot manipulador.

.86 Observadores Difusos Figura 4.11: Identificación del estado dq1 del robot manipulador. Figura 4.12: Identificación del estado dq2 del robot manipulador.

Figura 4.14: Observación del estado dq por medio del observador en modo deslizante.4.7 Simulación 87 Figura 4.13: Observación del estado q por medio del observador en modo deslizante. .

13 y 4.88 Observadores Difusos Figura 4. Los pequeños castañeos se deben a las dinámicas no modeladas que se encuentran presentes.4 Identificar los estados para el robot manipulador empleando el resultado obtenido de la estimación de los estados con el observador en modo deslizante.15-4.15-4.15: Identificación del estado q1 para el sistema no lineal.4 En las figuras 4.4 Si se incluye el observador en modo deslizante dentro del neuro identificador para estimar los estados correspondientes al sistema se obtienen los resultados mostrados en las figuras 4. Problema 4.14 la observación de los estados por medio del observador en modo deslizante. Se puede observar que con un número .3 Se puede observar en las figuras 4. Conclusión 4. Solución 4.18 se muestra que la identificación de los estados del sistema empleando el observador en modo deslizante nos proporciona un resultado más adecuado.18. Conclusión 4. donde los estados parciales son medibles.

16: Identificación del estado q2 para el sistema no lineal.17: Identificación del estado dq1 para el sistema no lineal.4. .7 Simulación 89 Figura 4. Figura 4.

19: Funciones de pertenencia para B1 y B2. .18: Identificación del estado dq2 para el sistema no lineal. Figura 4.90 Observadores Difusos Figura 4.

20: Funciones de pertenencia para la parte de la premisa de las reglas difusas. .21: Convergencia de parámetros de las reglas difusas. Figura 4.7 Simulación 91 Figura 4.4.

5 y = x1 Sabemos que sin una entrada de control. Ejemplo 4. x2 0 0 x2 1.32) u(k) Figura 4.22 se observa que para cada combinación de las variables de entrada se asocia un valor en la consecuencia de cada regla difusa. en este caso se varían tanto la posición de las funciones Gaussianas como su ancho. A continuación se considera el siguiente oscilador de Van der Pol dado por #" # " # " · # " x1 0 1 x1 0 = + [(1 − x2 ) x2 − x1 ] · 1 . permitiendo de esta forma la identificación del sistema no lineal.5) B1(0.51) para estimar (4. de reglas difusas igual a 2 se obtiene una buena aproximación del sistema no lineal. este valor es relativo ya que se debe variar hasta obtener un resultado satisfactorio a cada problema.59) .21.92 Observadores Difusos y(k) A11(1. En la figura 4.22: A cada combinación de las variables de entrada. Por tanto. podemos usar el mismo observador en modo deslizante como en (4.19-4. este resultado se logra a partir de la convergencia de los parámetros establecidos dentro del algoritmo de optimización como se muestra en las figuras 4.253) B2(0. se asocia una consecuencia.45) A22(1.2 Se aplicará el mismo algoritmo de diseño a la identificación de un oscilador de Van der Pol.4) A12(-2.035) A21(2. los estados del oscilador de Van der Pol son acotados.

31).24. 4.4.t σ(V1. K i := Ki P = 10I2 . . los resultados se muestran en las figuras 4. . El diagrama de simulación para realizar la identificación de los estados del sistema de Van der Pol por medio de un identificador difuso se muestra en la figura 7.5 Se puede observar en las figuras correspondientes que la identificación de los estados del oscilador de Van der Pol es buena.t y V2.5 Se utiliza un neuro identificador con una regla de actualización (4. Problema 4.t ∈ R2×3 . Solución 4.t xn ) donde W1.7 Simulación Estado x1 93 3 2 1 x ^ x x(t) 0 -1 -2 -3 0 50 100 150 200 250 tiempo 300 Figura 4. el estado x2 . A = −2I2 . Conclusión 4.23: Identificación del estado x1 del oscilador de Van der Pol. Debido a que este sistema no lineal carece de una entrada de control.3 del Apéndice A.t y W2.23.5 Identificar los estados del sistema de Van der Pol.t ∈ R3×2 . el sistema difuso puede seleccionarse como xn = Axn + W1. V1.

Problema 4.24: Identificación del estado x2 para el oscilador de Van der Pol. Conclusión 4. Solución 4. Podemos diseñar un observador en modo deslizante para el oscilador de Van der Pol. Solución 4.6 Con ayuda del observador en modo deslizante se ha podido obtener información acerca de los estados del oscilador de Van der Pol. su diagrama se muestra en la figura 7.16) se estiman los estados x1 y x2 del oscilador de Van der Pol„ los resultados se muestran en la figura 4.94 Estado x2 Observadores Difusos 4 3 2 1 ^ x x x(t) 0 -1 -2 -3 -4 0 50 100 150 200 250 300 tiempo Figura 4. Problema 4.25.6 Estimar los estados x1 y x2 del oscilador de Van der Pol.7 Identificar los estados para el oscilador de Van der Pol empleando el resultado obtenido de la estimación parcial de sus estados con el observador en modo deslizante.7 Se incluye el observador en modo deslizante dentro del neuro identificador para estimar los estados correspondientes al sistema.6 Haciendo uso del observador en modo deslizante (4.4 del apéndice A. .

26: Identificación del estado x1 en base a un observador en modo deslizante. .5 Estado x1 ^ x x x(t) 0 -0.5 2 1.25: Observación de los estados x1 y x2 del oscilador de Van de Pol.4.5 0 100 200 300 400 500 600 700 800 tiempo Figura 4.5 -1 -1.5 -2 -2. 2.5 1 0.7 Simulación 95 12 10 8 6 x(t) 4 2 0 -2 x2 -4 0 100 200 x1 Estados x1 y x2 300 400 500 600 tiempo Figura 4.

28: Funciones de pertenencia para B1 y B2. .27: Identificación del estado x2 en base a un observador en modo deslizante. Figura 4.96 Observadores Difusos 4 3 2 1 Estado x2 ^ x x x(t) 0 -1 -2 -3 -4 -5 0 100 200 300 400 500 600 700 800 tiempo Figura 4.

Figura 4.30: Convergencia de parámetros de las reglas difusas.4.7 Simulación 97 Figura 4.29: Funciones de pertenencia para la parte de la premisa de las reglas difusas. .

98 Observadores Difusos y(k) A11(-8. en este caso se varían tanto la posición de las funciones Gaussianas como su ancho.30.3) B1(-2. figuras 4. Se puede observar que con 2 reglas difusas se logra cierta aproximación del sistema no lineal. en realidad el número óptimo de reglas difusas adecuado es un valor relativo que se debe variar hasta obtener un resultado satisfactorio a cada problema.7 Podemos ver que se obtiene una buena aproximación del oscilador de Van der Pol usando el neuro identificador difuso con la información adquirida a partir de la observación de los estados x1 y x2 por medio del observador en modo deslizante.27.587) u(k) Figura 4.28-4. permitiendo de esta forma la identificación del sistema no lineal.31 se muestra que para cada combinación de las variables de entrada se asocia un valor en la consecuencia de cada regla difusa. el uso de este observador es adecuado ya que para el caso de los sistemas difusos que se basan en reglas de inferencia es necesario un observdor que sea libre de la estructura del modelo.3) A22(9. Conclusión 4. Los pequeños castañeos se deben a las dinámicas no modeladas que se encuentran presentes. En la figura 4.26-4. En este capítulo se han podido estimar los estados internos de un sistema no lineal por medio de un identificador difuso y un observador en modo deslizante. se asocia una consecuencia.22) B2(-2.587) A12(9. este resultado se logra a partir de la convergencia de los parámetros establecidos dentro del algoritmo de optimización como se muestra en las figuras 4.31: A cada combinación de las variables de entrada.43) A21(-8. Con la información obtenida a partir de la estimación de los estados del sistema se puede diseñar un .

7 Simulación 99 controlador difuso para esta clase de sistemas no lineales.4. . En el capítulo siguiente se plantea la posibilidad de diseño de un controlador adaptable difuso a partir de los datos obtenidos en este capítulo.

100 Observadores Difusos .

la primera alternativa es una continuación a la opción del observador difuso Takagi-Sugeno que se mostró anteriormente. . Durante la última década. [22]. esta segunda propuesta es una opción más general.Capítulo 5 Control Difuso basado en un Observador Los sistema difusos y las redes neuronales son una herramienta muy acertada en el control de sistema no lineales complejos en casos cuando no se tiene información completa del sistema o cuando se considera al sistema como una caja negra [3]. Mucha gente ha dedicado gran parte de su tiempo y esfuerzo tanto del ámbito de la investigación como en las técnicas de implementación a los controladores difusos [19]. [51]. Introducción Hoy en día el control difuso ha sido sugerido como una alternativa a las técnicas de control convencionales para sistemas de control complejos. este opción es más simplificada que la segunda alternativa en la que se considera un controlador adaptable difuso. el cual requiere de un algoritmo de aprendizaje como el entrenamiento del gradiente descendente. [50].1. En este capítulo se muestran dos alternativas de diseño para un controlador difuso. el control difuso ha atraído una gran atención de las comunidades académica e industrial. 5.

Sin embargo. de la forma u = u(r. Se puede emplear un controlador al retroalimentar las variables de estado. El análisis de estabilidad y el diseño sistemático son los temas más importantes en los sistemas de control difuso.1 se muestra la estructura del sistema en el que se hace control retroalimentando . las técnicas del control difuso sufren problemas tales como (1) el diseño del control difuso es difícil de obtener debido a que no se dispone de las bases teóricas y (2) el desempeño del control difuso puede ser inconsistente debido a que éste depende principalmente de la experiencia individual de los operadores. [9]. El control difuso es aplicable generalmente a plantas que se encuentran modeladas matemáticamente en forma pobre y donde el conocimiento cualitativo de los operadores con experiencia pueden proporcionar control cualitativo. En la figura 5. x). y). Como se ha visto. el control difuso representa la aplicación más importante de la Teoría Difusa dentro de los problemas prácticos. entonces los controladores resultantes también son denominados controladores difusos.2. Sin embargo. Existen dos categorías comunes para diseño de controladores difusos: una es en modelo libre y la otra es en modelo base. que es de la forma u = u (r. Las técnicas de control difuso representan un medio para conjuntar el conocimiento humano. la habilidad y el trato con las incertidumbres dentro del proceso del control. Por tanto. en lugar de aquel donde se retroalimenta la salida. los controladores difusos son controladores no lineales con una estructura especial. ha sido evidente que muchos problemas olvidados pueden abordarse de una mejor manera. se han hecho grandes esfuerzos en las investigaciones relacionadas a este tema [4]. Recientemente. debido al auge que ha tenido el control difuso en la aplicación exitosa de los sistemas de control industrial. Si los sistemas difusos son usados para modelar el proceso y los controladores son diseñados en base al modelo. 5. Controladores Difusos Cuando los sistemas difusos son usados como controladores.102 Control Difuso basado en un Observador El control difuso es el más útil en la aplicación del conocimiento cualitativo de un sistema para diseñar un controlador. éstos se denominan controladores difusos.

3 Retroalimentación a la Salida de Sistemas Difusos TSK Entrada incierta v Entrada de control automático Controlador u Planta Entrada incierta W 103 Entrada de comando r Estado x Mediciones Salida y Retroalimentación de estado Estado estimado ^ x Estimador Figura 5. se sabe que el conocimiento cualitativo de un sistema puede también ser representado por medio de una forma funcional no lineal. se debe estimar el estado. por ejemplo. y = x.1: Retroalimentación del estado con estimador. el estimador produce un estado en lugar del estado real x(t) para producir la entrada al controlador. En base a esta idea. Retroalimentación a la Salida de Sistemas Difusos TSK Con el desarrollo de las redes neuronales y de los sistemas difusos. han aparecido en el campo del control difuso algunos modelos difusos basados en los métodos de diseño de sistemas de control difuso.5. Con base en la entrada de control u (t). entonces no se requiere el estimador. Esto será cierto. Si y 6= x.3. la salida medida y (t) y el modelo del sistema dinámico. En general. las variables de estado. empleando x(t) ≈x (t) como se ∧ indica por el bloque del estimador. 5. Si el estado completo es medible de manera exacta. Las técnicas de control lineal con . Estos métodos son conceptualmente simples y directos. un estimador requerirá como entradas tanto a la salida y como la entrada de control u. cuando la salida y contenga sólo algunas componentes del vector de estados x.

Un problema clave es que la estabilidad del sistema total. medicina. etc. y sistemas expertos de negocios. las dinámicas locales en diferentes regiones espacio-estado se representan por modelos lineales [27]. con el controlador difuso y el observador difuso. para cada modelo lineal local. 5. el diseño del observador difuso es tratado difícilmente [10]. sin embargo. psicología. debe ser garantizado en el caso del modelo difuso. En este tipo de modelo difuso. manufacturación de circuitos integrados. El diseño del observador es un problema muy importante en los sistemas de control. La idea es que. El modelo completo del sistema se obtiene por una ”combinación” difusa de los modelos lineales a través de la función de pertenencia difusa no lineal. [43]. El diseño del control se lleva a cabo de acuerdo en base al modelo por medio del esquema de compensación distribuido paralelo. Otra contribución importante de la teoría de los sistemas difusos es que proporcionan un procedimiento sistemático para transformar una base del conocimiento humano a un mapeo no lineal. comunicaciones. El procedimiento es el siguiente. [39]. Una contribución principal es el desarrollo del principio de separación. procesamiento de señales. nuevamente es una ”combinación” difusa de cada uno de los controladores lineales. el problema de estabilización robusta también ha sido considerado un caso del modelo difuso Takagi-Sugeno (T-S) [38]. Al mismo tiempo. que es el diseño del controlador difuso y del observador difuso en forma independiente [27]. El controlador completo resultante. la planta no lineal se representar por un modelo difuso tipo Takagi-Sugeno. que no es lineal en general. Primero. se diseña un control lineal con retroalimentación. [44].3. Control con Retroalimentación a la Salida de Sistemas Lineales Considerando el sistema definido mediante . Sin embargo. en los sistemas de control difuso. la aplicación más significativa se ha concentrado en los problemas de control. Los sistemas difusos han sido aplicados a una gran variedad de campos alrededor del control.104 Control Difuso basado en un Observador retroalimentación pueden utilizarse en el caso de estabilización con retroalimentación.1.

1) En el sistema de control mediante la retroalimentación del estado observado da una (5.5.3) La transformada de Laplace de la ecuación del observador obtenida mediante la ecuación (5. pero x no está disponible para una medición directa. sino imposibles. Suponemos emplear el control mediante la retroalimentación del estado observado u = −Ke x ecuación del observador e x x = (A − Ke C)e + Bu + Ke y e U (s) = −KX (s) • · (5.3. Takagi y Sugeno han propuesto un . Sustituyendo (5. se tiene e X (s) = (sI) 5. o x(0) = 0.3) en e (5.2.2) Tomando la transformada de Laplace de (5.1) (5.4) y despejando X (s) en la ecuación resultante.4) e donde se supuso que el estado observado inicial es cero. Sin embargo.3 Retroalimentación a la Salida de Sistemas Difusos TSK 105 x= Ax + Bu y = Cx Suponemos que el sistema es completamente observable. muchos de estos problemas se pueden expresar de alguna forma con modelos matemáticos locales o como una agregación de un conjunto de modelos matemáticos. Control Difuso de TSK Muchos sistemas físicos son muy complejos en la práctica por lo que esos modelos matemáticos rigurosos son muy difíciles de obtener.2) es e e sX (s) = (A − Ke C)X (s) + BU(s) + Ke Y (s) (5.

. Se asume que g Q wi [z (t)] = Fij [zj (t)] . µi [z (t)] = j=1 h i z (t) = z1 (t) z2 (t) · · · zg (t) i=1 wi [z(t)] r P wi [z(t)] . esto es. el modelo dinámico difuso Takagi-Sugeno en tiempo continuo es descrito por reglas difusas SI-ENTONCES. que localmente representan relaciones lineales entradasalida de sistemas no lineales. (Ai ∈ Rnxn . · · · . u (t) ∈ wi [z(t)][Ai x(t)+Bi u(t)] r P x (t) = = donde i=1 wi [z(t)] i=1 r P i=1 (5. e yi (t) ∈ Rp es el vector de salida. r es el número de reglas SI-ENTONCES.el estado final del sistema difuso se infiere de la siguiente forma: · r P donde Fij (j = 1. · · · . g) son conjuntos difusos. Ci ∈ Rpxn ) es una tripleta de matrices. Específicamente. empleando un fuzzyficador singleton.5) Rm es el vector de salida. Dado un par [x (t) . y z1 (t) v zg (t) son algunas variables medibles del sistema. producto de inferencia difusa y defuzzyficador media ponderada. r SI z1 (t) es Fi1 y · · · y zg (t) es Fig · (5. las variables de las premisas. es decir. Bi ∈ Rnxm . 2.6) µi [z (t)] [Ai x (t) + Bi u (t)] Fij [zj (t)] es el grado de pertenencia de zj (t) en Fij . Podemos considerar el empleo del siguiente modelo dinámico para representar un sistema complejo con múltiples entradas-múltiples salidas. i = 1. u (t)]. que incluya tanto modelos lineales analíticos locales y funciones de pertenencia difusas [27].106 Control Difuso basado en un Observador modelo difuso para describir los sistemas complejos. x (t) ∈ Rn es el vector de estado. 2. empleando el método de inferencia difusa estándar. La regla i-ésima del modelo difuso es de la siguiente forma: La regla i-ésima para la Planta es: EN T ONCES x (t) = Ai x (t) + Bi u (t) yi (t) = Ci x (t) .

r. i=1 = wi [z (t)] i=1 r X µi [z (t)] Ci x (t) i=1 (5. 2. · · · .5) es localmente controlable.8) y (t) = r X µi Ci x (t) i=1 (5. i = 1. De esta forma µi [z (t)] ≥ 0. basados en los pares (Ai . 2. Bi ). Por conveniencia de notación. son controlables. para toda t. µi = µi [z (t)] .5) se dice localmente controlable.1 Si los pares (Ai . · · · . SI z1 (t) es Fi1 y · · · y zg (t) es Fig (5. el sistema difuso Para el diseño del controlador difuso. · · · . 2. · · · .7) La salida final del sistema difuso es el siguiente: r P wi [z (t)] Ci x (t) r P y (t) = esto es. Primero. para toda t.5.10) i = 1.3 Retroalimentación a la Salida de Sistemas Difusos TSK 107 wi [z (t)] ≥ 0. por tanto el estado final del sistema difuso puede representarse como r r X X x (t) = µi Ai x (t) + µi Bi u (t) · i=1 i=1 r X µi [z (t)] = 1 i=1 (5. 2. se supone que el sistema difuso (5. r X wi [z (t)] > 0 i=1 i = 1. sea wi = wi [z (t)]. Bi ): La regla i-ésima del controlador es: EN T ONCES u (t) = −Ki x (t) . i = 1. los controladores con retroalimentación de estado locales son diseñados.9) visto en (5. r . Definición 5. r. r.

1 Si tenemos V (x) = xT P1 x y V (e) = xT P2 x. la salida final del controlador difuso es u (t) = − r r X X µi [z (t)] Ki x (t) = − µi Ki x (t) i=1 i=1 (5. . 2. para i < j ≤ r. Los parámetros del controlador son Ki en cada regla. · · · . e x e e Comentario 5.2 El controlador difuso y el observador difuso se pueden diseñar independientemente para ser estables y todo el sistema (con el controlador difuso y el observador difuso) también se mantiene estable. y ³ ´T Ai −Bi ·Kj +Aj −Bj ·Ki P1 ³ 2 ´ Ai −Bi ·Kj +Aj −Bj ·Ki +P1 2 <0 través del marco de desigualdad de matriz lineal (LMI). Estas ecuaciones se pueden resolver numéricamente de forma eficiente a correspondiente. de acuerdo con el análisis Comentario 5.11) en (5. Sustituyendo (5.11) donde se emplea el mismo peso µi [z (t)] como el peso de la regla i-ésima del sistema difuso (5.12) Una condición suficiente que garantice la estabilidad del sistema difuso se obtiene en términos del método directo de Lyapunov. podemos satisfacer las condiciones necesarias para comprobar la estabilidad del sistema controlador. r. La ecuación anterior es asintóticamente estable si existe una matriz P1 definida positiva tal que (Ai − Bi · Ki )T P1 + P1 (Ai − Bi · Ki ) < 0 para i = 1. obtenemos r r XX x (t) = µi µj (Ai − Bi · Kj ) x (t) · i=1 j=1 (5.108 Control Difuso basado en un Observador por tanto.6).7).

2. todos los estados no son medibles completamente. obtenemos el siguiente controlador La regla i-ésima del controlador es: b ENT ON CES u (t) = −Ki x (t) .9) y retomando (4.16) r r r r XX XX b b b x (t) = µi µj (Ai − Bi · Kj ) x (t) + µi µj Gi · Cj [x (t) − x (t)] · i=1 j=1 i=1 j=1 (5.15) y (5.13). la salida final del controlador difuso es Si sustituimos (5.11). obtenemos b x (t) = · r r r r X X XX b (t) + b µi Ai x µi Bi u (t) + µi µj Gi · Cj [x (t) − x (t)] i=1 i=1 i=1 j=1 (5. · · · . más que por los polos. En los sistemas difusos. 5. y es necesario diseñar un observador difuso para poder implementar el controlador difuso (5.3.13).11).7) en (5.15) (5. En la práctica. la estabilidad del sistema en lazo cerrado se determina por el principio de comparación de vector.5.3 En el desarrollo del principio de separación de los sistemas lineales. obtenemos x (t) = · r r r X XX b Ai x (t) − µi µj Bi · Kj x (t) i=1 i=1 j=1 r X b u (t) = − µi Ki x (t) i=1 (5. r así.14) i = 1. SI z1 (t) es Fi1 y · · · y zg (t) es Fig (5. el principio de separación es diferente.13) en (4.17) . y (5. Control Difuso para TSK basado en un Observador Sustituyendo (5. los polos del sistema en lazo cerrado incluye ambos polos del sistema de control y los polos del sistema de observación.3 Retroalimentación a la Salida de Sistemas Difusos TSK 109 Comentario 5.12).13) difuso: b Usando el estado x (t) final estimado.3. (5. respectivamente.

18) P2 + P2 <0 través del marco de desigualdad de matriz lineal (LMI). Estas ecuaciones se pueden resolver numéricamente de forma eficiente a 5. . El control neuronal directo se refiere cuando la red neuronal se coloca en cascada con el sistema a controlar. r. Existen dos tipos de control neuronal: control directo [21] y control indirecto [35].110 b Haciendo x = x (t) − x (t) . Control Difuso con Retroalimentación a la Salida basado en un observador En [16] se da un panorama de un control neuronal. 2. En el control neuronal indirecto el controlador se basa en la identificación del sistema no lineal.entonces e · Control Difuso basado en un Observador La ecuación anterior es asintóticamente estable si existe una matriz P2 definida positiva tal que (Ai − Gi · Ci )T P2 + P2 (Ai − Gi · Ci ) < 0 para i = 1.2. y µ Ai − Gi · Cj + Aj − Gj · Ci 2 ¶T µ Ai − Gi · Cj + Aj − Gj · Ci 2 ¶ r r XX e x (t) = e µi µj (Ai − Gi · Cj ) x (t) i=1 j=1 (5. de esta forma el proceso de identificación se convierte en una parte esencial de la construcción del controlador neuronal [32]. para i < j ≤ r.4. La estructura general del control adaptable difuso con retroalimentación a la salida basado en un observador en modo deslizante se muestra en la figura 5. · · · .

4 Control Difuso con Retroalimentación a la Salida basado en un observador 111 PLANT A O B S E R V AD O R EN MODO DESLI ZANTE CONTROL DI FUSO MODELO DE REFERENCIA Figura 5. .2: Estructura general del control adaptable difuso basado en un observador en modo deslizante.5.

· · · Ani Empleamos l(i = 1. la k-ésima salida del sistema lógico difuso puede ser expresada como: yk = b donde µAji .  (5. 2 · · · l) reglas difusas SI-ENTONCES para realizar un mapeo de un vector y B1i ...21) n l PQ donde  b Yt = [b1 · · · ym ]T . · · · Bmi son conjuntos difusos estándar [41]. Wt =  y b   w11 . es el número de reglas SI-ENTONCES es el punto en el que µBki = 1. De [41] sabemos (5. A1i .19) lingüístico de entradas X = [x1 · · · xn ] ∈ <n a un variable lingüística de salida.20) = i=1 l P wi φi son las funciones de pertenencia de los conjuntos difusos Aji y Bki . usando la inferencia del producto.112 Control Difuso basado en un Observador Un modelo difuso genérico es presentado como una colección de reglas difusas en la siguiente forma: Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani ENTONCES y1 es B1i y · · · ym es Bmi b b (5.20) se puede expresar en la forma paramétrica siguiente b Yt = Wt Φ [Xt ] w1l . Φ [Xt ] = [φ1 · · · φl ]T . n Q donde φi está definido como: φi = j=1 µAji µAji i=1 j=1 (5. µBki l wki à " #! n Q wki µAji i=1 j=1 à " #! l n P Q µAji l P i=1 j=1 conjuntos difusos. Para una variable de entrada xi existen li que. En el caso de una conexión completa l = l1 × l2 × · · · ln . wm1 wml    . media de centros y fuzzyficador singleton.

La Capa I acepta el vector lingüístico de entradas X (k) . Las capas I y II son la parte de premisa. La estructura del sistema adaptable difuso se muestra en la figura. pero este modelo difuso puede reflejar sólo los pares entrada-salida. Cada nodo de la capa II representa el valor de la función de pertenencia de la variable lingüística.15) por medio de b estimados xi en (4. Estas cuatro capas del sistema difuso se han discutido en muchos documentos [25]. el sistema difuso controlará al sistema no lineal completo.3. Las capas III y IV son la parte de consecuencia. El controlador adaptable difuso se diseña a partir de la información siguiente. Ahora el objetivo del control es hacer que todos los estados de .5.16) son usados para controlar al sistema. si los estados De la salida y uno puede controlar al sistema no lineal (4.4 Control Difuso con Retroalimentación a la Salida basado en un observador 113 A1 x1 φ1 w 11 ^ y1 A 1l1 A n1 x 1n A nln φ2 ^ ym φl w ml CAPA I II III IV Figura 5.3: Arquietectura del sistema adaptable difuso. las reglas difusas.14) o (4. Los nodos de la capa III representan las reglas difusas. La capa IV es la capa de salida. los lazos entre la capa III y la capa IV son conectados completamente por la matriz de pesos Wk .5. La sección previa nos proporciona una estimación asintótica de los estados internos. [15].

De esta forma el sistema en lazo cerrado es et = Aet · . para cualquiera η > 0. Y definiendo el error de seguimiento como R et := xt − x∗ t (5. Puede ser formulado como el criterio siguiente: Jm´ = m´ J.114 Control Difuso basado en un Observador la planta real (4.24) yt = Cxt (5.25) Si f (·) y g (·) son conocidos. La idea del control es: u∗ = 1 [−f(xt ) + A (xt − x∗ ) + h(x∗ )] t t g(xt ) donde A es una matriz estable.19) es cambiado como Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani Para el sistema no lineal ENTONCES y1 es B1i y · · · ym es Bmi b b xt = f (xt ) + g(xt )ut . ahora podemos reformular el objetivo de la identificación como: minimizar el (5.22) donde x∗ es el estado de referencia. que satisface: xt = h(x∗ ) t Así. Eligiendo R = R término kx − x∗ k2 .15) sigan a los estados de referencia. tenemos ¡ ¢ J ≤ (1 + η) kx − xk2 + 1 + η −1 kx − x∗ k2 . podemos elegir el control ut para cancelar la no linealidad y diseñar el controlador basado en la teoría de control lineal.14) o (4. R R (5. J = kx − x∗ k2 ın ın R W (5. · (1 + η −1 ) R.23) ·∗ ˜ El mínimo del término kx − xk2 ya ha sido resuelto en la sección previa.

λm´ ın .1 Asumiendo que el sistema con retroalimentación-linealizable está en la forma canónica de controlabilidad y el control de entrada está dado por (5.27) donde Kf.4 Control Difuso con Retroalimentación a la Salida basado en un observador así t→∞ 115 l´ et = 0 ım Puesto que f (·) y g (·) son conocidos y xt no está disponible. usamos el sistema difuso para identificar f (·) y g (·) . El control adaptable es i 1 h b −f(xt ) + v ut = g b(xt ) v = Aet + h(x∗ ) t £ ¤ b f (xt ) = Wf Φf X t £ ¤ g (xt ) = Wg Φg X t b (5.g ∈ <1 e I es la matriz identidad con las reglas de actualización de peso proporcionadas por el gradiente · £ ¤ W f = Kf P et Φf X t eT t · £ ¤ T W g = Kg P uc Φg X t et (5. Haciendo que el sistema difuso sea actualizado como: · Si ket k2 ≤ · Si ket k2 > η λm´ (Q) ın η λm´ (Q) ın entonces la regla de actualización está dada por (5.28) Teorema 5. entonces detenemos el procedimiento de aprendizaje . (5.26).26) donde asumimos que g (xt ) 6= 0 b (5.29) están dados en · para cualquiera T > 0 el error de filtro cumple el siguiente desempeño de seguimiento Z ¢ 1 T¡ T eT e0 et Qet dt ≤ 0 + κη (5.30) T 0 T ¡ ¢ a (Q) donde η = εf +df + εg + df u. los parámetros del sistema difuso son acotados y et ∈ L∞ . Wg ∈ L∞ . De esta forma · el error de seguimiento filtrado e(t).5.28). κ es el número de condición de Q definido como κ := λm´x(Q) . Wf ∈ L∞ .

31) la derivada de (5.25) y (5.32) Sustituyendo de (5. εf es el error de identificación difuso.116 Demostración. ³ ³ ´ ´ · T b + (g − g ) uc Lt = 2et P Aet + f − f b à · T ! à · T ! f f f f +2tr W f K −1 Wf + 2tr W g Kg −1 Wg f Usando (5. et = f + gu − h(x∗ ) + v − v t · Control Difuso basado en un Observador Permitiendo que la función candidata de Lyapunov sea = f + guc − h(x∗ ) + v − v i´i h ³t h 1 b+ v − h(x∗ ) + h(x∗ ) + A∆t − v = f + (e + g ) b −f g b g t t ³ ´ b = A∆t + f − f + (g − b) uc g ³ ´ ³ ´ fT f f f Lt = eT P et + tr Wf Kf −1 Wf + tr WgT Kg −1 Wg .33) .27). donde df es el error del observador. y £ ¤ g − b = Wg Φg X t + εg + Wg∗ dg g f £ ¤ ∗ b c f − f = Wf Φf (Xt ) − Wf Φf X t + εf £ £ ¤ ¤ £ ¤ ∗ c = Wf Φf X t + df − Wf Φf X t + εf £ ¤ ∗ f = Wf Φf X t + εf + Wf df Así En vista de la desigualdad de la matriz · £ ¤ f Lt = 2eT P {Aet + Wf Φf X t + εf t ¡ £ ¤ ¢ ∗ f +Wf df + Wg Φg X t uc + εg + Wg∗ dg uc } à · T ! à · T ! f f f f +2tr W f K −1 Wf + 2tr W g Kg −1 Wg f ¡ ¢T XT Y + XT Y ≤ X T Λ−1 X + Y T ΛY (5. t (5.32) produce.31) (5.

Usando la regla de aprendizaje (5. la elección adecuada de la matriz estable A puede hacerla cero.28). Lg = 0 ¡ ¢ η = εf + df + εg + df u ! © £ ¤ ª f + tr Φg X t uc Wg .5. Y ∈ <n×k y para cualquier matriz definida positiva 0 < Λ = ΛT ∈ <n×n . Lrq = 0. Lw = 0. 2eT P εf puede ser concluida como 2eT P εf ≤ eT P l1 P e + ε2 l4 ≤ eT P l1 P e + εf f 2eT P εg uc puede ser concluida como 2eT P εg uc ≤ eT P l2 P e + ε2 u2 l5 ≤ eT P l2 P e2 + εg u g c ∗ 2eT P Wf df puede ser estimada como −1 ∗ T ∗ 2eT P Wf df ≤ eT Wf ∗ P l3 P Wf e + dT l3 df f ∗ ≤ eT P Wf P e + df ∗ 2eT P Wg dg uc puede ser estimada como −1 2eWg∗ dg uc ≤ eT WgT ∗ l4 Wg∗ e + |uc |2 dg l4 dg g ≤ eT P Wg∗ P e + udg · Así Lt ≤ Lrq + Lw + Lg − eT Qe + η Si usamos la regla de adaptación como: ¢ ¡ ∗ Lrq = AT P + P A + P l1 + l2 + Wf + Wg∗ P + Q à T ! · © £ ¤ª f f f Lw = 2tr W f K −1 Wf + tr Φf X t Wf f f f Lg = 2tr W g Kg −1 Wg à · T donde Lrq es la ecuación de Riccati estándar. es decir.4 Control Difuso con Retroalimentación a la Salida basado en un observador 117 qué es válido para cualquiera X.

y también incluyendo la fricción en (4. q 2 (0)] = [0.49). Integrando (5. k1 = k2 = 0. de (5.28) podemos concluir m´ ın Lt ≤ −eT Qe + η ≤ −λm´ (Q) kek2 + η < 0. g = 9. (5.49) son desconocidos.36).118 Control Difuso basado en un Observador que · (I) si kek2 > λ−1 (Q) η. Asumimos que los parámetros en (4. de (5. Debido a que Wf.1.30) es obtenido. q2 (0)] = [3. Por tanto el teorema ha sido comprobado. l1 = l2 = 2r1 = 2r2 = 1m.34) desde 0 hasta T se produce LT − L0 ≤ − Debido a que κ ≥ 1. 5.36) ∗ ∗ De (I) y (II). 0. sólo la posición y la velocidad de q están disponibles.8kg.81. Lt permanece acotado.5.28) los pesos se hacen constantes.29) es alcanzado.6]. m2 = 2. Simulación Control adaptable difuso Tomando los parámetros del robot manipulador como en [24].35) y (5.3kg. 0]. usando la regla de actualización como (5. m1 = 0. v1 = v2 = 0. Lt es acotado. Las condiciones iniciales son q(0) = [q 1 (0). q(0) = [q1 (0). es decir.5.14.0 = Wf y Wg. 5. tenemos Z T 0 Z T 0 ¡ ¢ eT Qe dt + ηT donde κ es el número de condición de Q Y ¡ ¢ eT Qe dt ≤ L0 − LT + bd T ≤ L0 + κηT (5.34) L es acotado. (5.4.0 = Wg . ın · (5. m´ ın RT ¡ T ¢ RT e Qe dt ≤ 0 λm´x (Q) kek2 dt a 0 λm´x (Q) a ηT λm´ (Q) ın ≤ ≤ L0 + κηT (5. Siguiendo las reglas difusas usadas para la identificación · · · .35) · (II) si kek2 ≤ λ−1 (Q) η.8.

40) con las reglas de actualización de peso proporcionadas por el gradiente descendente: · £ ¤ W f = Kf P et Φf X t eT t · £ ¤ T W g = Kg P uc Φg X t et (5.5.t = ϕ (x∗ ) − u2. − Wt σ(bt ).t = " −2 0 τ = u1. x cos t + 3 sin t ´  à ! " #à · !  ³· · q 1.41) El control difuso es u1.t " −2 0 −2 #à ! 0 q1 q2 −2 0 # donde τ = 0.5 Simulación 119 Ri : SI x1 es A1i y x2 es A2i y · · · xn es Ani Para el robot se puede representar como: · ENTONCES y1 es B1i y · · · ym es Bmi b b xt = f (xt ) + g(xt )ut (5.t − q 2.37) (5. El control adaptable es i 1 h b ut = −f(xt ) + v g b(xt ) v = Aet + h(x∗ ) t £ ¤ b f (xt ) = Wf Φf X t £ ¤ g (xt ) = Wg Φg X t b (5.t−τ /τ x1 b 3 0 q1 ´  − − −  ³· · · x2 b q2 0 3 q 2.39) donde asumimos que g (xt ) 6= 0 b (5. usamos el sistema difuso para identificar f (·) y g (·) .t + u2.t − q 1.t−τ /τ x∗ − Wt σ(bt ) = x à −3 cos t + sin t ! .1.38) Puesto que f (·) y g (·) son conocidos y xt no está disponible.

1 Se utiliza un identificador para que nos proporcione información de los estados del sistema y de esta forma dar una ley de control adecuada.1 Hallar la ley de control que resuelva el problema de seguimiento para el robot manipulador de dos grados de libertad. Problema 5. En la figura 5. Este proceso de identificación se logra a partir de un identificador difuso cuyos resultados se muestran en las figuras 5. el valor de ganancia a la salida es igual al de la entrada. este resultado se logra a partir de la convergencia de los parámetros establecidos .5 .5 del apéndice A. Conclusión 5.1 En este caso se emplea un control adaptable difuso que nos permite lograr cierta trayectoria de seguimiento para una planta no lineal.14 se muestra que para cada combinación de las variables de entrada se asocia un valor en la consecuencia de cada regla difusa. El control adaptable difuso presentado en esta sección se muestra en la figura.120 Control Difuso basado en un Observador Figura 5.4: La respuesta característica del control derivativo incluye un defasameinto respecto a la señal de entrada. Solución 5.7.4 se muestra el comportamiento del control PD usado en la compensación del sistema. En la figura 5. El control establecido para la planta no lineal es un control indirecto donde se realiza un proceso previo de identificación del sistema.7.5.

5. . Figura 5.6: Funciones de pertenencia para la parte de la premisa de las reglas difusas.5 Simulación 121 Figura 5.5: Funciones de pertenencia para B1 y B2 .

3) A12(2.8: A cada combinación de las variables de entrada.5) A22(1.14) B2(1.2) u(k) Figura 5.122 Control Difuso basado en un Observador 10 p ar á me tr o s 5 0 -5 -10 -15 0 1 00 2 00 300 400 5 00 6 00 T iem p o Figura 5.5) B1(0. . se asocia una consecuencia.7: Convergencia de parámetros de las reglas difusas.12) A21(2. y(k) A11(1.

la solución para tanto A0 = A − KC = −1 0 8 3 la ecuación de Lyapunov (5.5 -0. empleamos un 3.50) es acotado.5 Simulación 123 dentro del algoritmo de optimización como se muestra en la figura 5. t) + g(xt . por 1 0 2 " # " # −2 1 3 1 es estable. Para el robot manipulador de dos grados de libertad podemos usar dos observadores: observador (a): qa = Aqa + S (qa . se elegimos K = > 0. Para estabilizar al manipulador.2.25 0 control difuso basado en un observador como el de modo deslizante. si utilizamos Q = . e) − Ket yb = Cqb . podemos escoger " # " # 0 1 2 A= para hacer que el par (A. en este caso se varían tanto la posición de las funciones Gaussianas como su ancho. por tanto existe una función h(x) tal que −P−1 CT h = f − Ax .7. q 2 ] · · (5. 5.16). e) − Ket ya = Cqa . C) sea observable. G y fD sabemos que f (xt .5.5.43) h i Los pasos para el diseño se muestran en la figura 4. la velocidad q podría medirse con el observador en modo deslizante (4. V.1. De las definiciones de M. q 1 ] · · (5. qb := [q2 . Como C = 1 0 .42) observador (b): qb = Aqb + S (qb . t)u en (4.25 es definida positiva P = . Control adaptable difuso basado en un observador en modo deslizante · Asumiendo que sólo la posición del ángulo q es medible. permitiendo de esta forma la identificación del sistema no lineal. qa := [q1 .44) A0 P + PAT = −Q 0 " # 1.

01 que garantiza mejores reb sultados. (1 + e−2x ) φ(x) = 0.   2 1 2 1 b q(0) = q(0) = q(0) = 0. Escogemos W1.31) con η = 0. An = −2I4 . et ) = − ρ= kC∆t k ( −ρP−1 CT sign (C∆t ) −ρP C C∆t /δ −1 T Sin pérdida de generalidad.05 (1 + e−0. Si no usamos el observador. q b b b σ(x) = 2 − 0. Usando la misma regla de actualización (4.t ∈ R3×4 . En este caso δ = 0.t σ(V1. .0 (W1 ) = W2.t ∈ R4×3 . Para eliminar el efecto del chattering.124 Control Difuso basado en un Observador ρ = 10.t ∈ <3×2 .2 − 0.t y V2. q 2 ].t ∈ <2×3 .t q) + W2.0 (V1 ) = V2.0 (W2 ) = V1. Los resultados de identificación para q se muestran en 1 1 1 1  · · b b b b q = An q + W1. q2 . V1. Ki := Ki P = 10I4 . |C∆t | ≥ δ |C∆t | < δ (5. Podemos ver que el identificador basado en el observador es mejor que el neuro identificador cuando los estados parciales son medibles. V1.10. elegimos W1.t φ(V2.t y W2. q 1 .45) El controlador de capa acotada enunciado ofrece una aproximación continua al modo deslizante discontinuo dentro de la capa acotada y garantiza que el error del observador esté dentro de cualquier vecindad cercana al origen [6].t y V2.0 (V2 ) =  1 2 1 2  .t y W2. Podemos emplear q y q para modelar al robot manipulador por medio del modelo difuso obtenido a partir de la siguiente información: · · b donde q = [b1 .46) seguida.5. Los pesos se actualizan de acuerdo a (4.9 y 5. el neuro identificador mostrado en (5.2x )   T ∗ T ∗ ∗ ∗ Las condiciones iniciales son W1. ut )k < ρ.31) con l = n = 2.2. podemos usar el siguiente compensador de capa acotada mencionado anteriormente P−1 CT C∆t S (xt . Simulación Podemos observar a continuación la identificación y control del robot manipulador de dos grados de libertad considerando un observador en modo deslizante. elegimos kh (xt .46) será de dos dimensiones. los resultados de identificación se muestran en las figura 5.t q)τ (5.

2 Hallar la ley de control que resuelva el problema de seguimiento para el robot manipulador de dos grados de libertad.11 y 5. El neuro control presentado en esta sección se muestra en la figura 7.14 se muestra que para cada combinación de las variables de entrada se asocia un valor en la consecuencia . Solución 5. El controlador se establece por medio de un control indirecto que requiere un proceso previo de identificación del sistema.10 que corresponde a la posición y velocidad del robot manipulador. En la figura 5.2 Se utiliza un controlador difuso con base en un observador en modo deslizante. Problema 5.9: Control basado en un observador en modo deslizante para la posición de los eslabones.2 Las trayectorias de seguimiento para el control adaptable difuso basado en un observador en modo deslizante se muestran en la figuras 5. El controlador basado en la identificación completa de los estados del sistema es una mejor opción ya que permite controlar al sistema de una forma más adecuada teniendo mayor información del sistema no lineal.9 y 5.5 Simulación 125 Figura 5.12).6 del apéndice A. Conclusión 5.5. Este proceso de identificación se logra a partir de un identificador difuso cuyo algoritmo de optimización varía tanto la posición como el ancho de ciertas funciones Gaussianas propuestas para el sistema difuso (figuras 5.

Figura 5.10: Control basado en un observador en modo deslizante para la velocidad de las juntas dq.126 Control Difuso basado en un Observador Figura 5. .11: Funciones de pertenencia para B1 y B2 .

13: Convergencia de parámetros de las reglas difusas.12: Funciones de pertenencia para la parte de la premisa de las reglas difusas.5.5 Simulación 127 Figura 5. 15 p a r á m e tr o s 10 5 0 -5 -10 -15 0 1 00 2 00 3 00 4 00 5 00 6 00 7 00 tiem p o Figura 5. .

t−τ /τ b b 0 −2 −2 0 # x − Wt σ(bt ) = x ∗ Ã −3 cos t + sin t !     . se selecciona un método de fuzzyficación.13. En este caso se emplearon reglas del tipo Mamdani y una representación del sistema con fuzzyficación tipo singleton.39) A12(-0.8) B2(0.25) A22(0. La ley de control es la siguiente: u1. − Wt σ(bt ). no necesariamente se deben conocen los valores de los conjuntos difusos o el número de reglas. este resultado se logra a partir de la convergencia de los parámetros establecidos dentro del algoritmo de optimización. de cada regla difusa. figura 5.128 Control Difuso basado en un Observador y(k) A11(-0.t + u2.13) B1(-0. x cos t + 3 sin t ¶  µ· · ! Ã ! " # ·  " #Ã b b  q 1. se asocia una consecuencia.15) u(k) Figura 5.t " ∗ u2.14: A cada combinación de las variables de entrada.t − q 1. inferencia por la regla del producto y defuzzyficación por media de centros.t − q 2.t Se puede observar que para el control adaptable difuso es necesario dar la estructura de las reglas difusas del tipo SI-ENTONCES.t = ϕ (x ) − τ = u1. inferencia y defuzzyficación que nos permita obtener una solución adecuada a nuestro problema.045) A21(-1.t−τ /τ x1 b 3 0 q b −2 0 q1  ·1  −  µ· ¶ − − = ·  q2 x2 b 0 3 0 −2 q2 b q 2.

En este capítulo se presentó el diseño de un controlador adaptable difuso que nos permitiera el control de un robot manipulador de dos grados de libertad. El algoritmo de optimización que se utiliza es el entrenamiento del gradiente descendente el cuál modifica los parámetros de las funciones Gaussianas. lo cual considera una mejora en la identificación y control del sistema en cuestión. La entrada y la salida al sistema difuso se definen como funciones de pertenencia de tipo Gaussianas. tanto la ubicación del centro como el ancho de éstas mismas de forma iterativa. El empleo del observador en modo deslizante permite una mejor aproximación del sistema no lineal debido a que se tiene una estimación aún mejor de los estados internos de éste. . Se empleó un identificador difuso con base en un observador en modo deslizante para obtener una mejor estimación de los estados internos del sistema y obtener resultados adecuados de control en la aplicación del controlador adaptable difuso.5.5 Simulación 129 Con este modelo se pretende obtener una buena aproximación de la planta.

130 Control Difuso basado en un Observador .

con frecuencia la solución óptima consiste en una combinación inteligente de las diversas técnicas de solución. sencillamente que cada problema o parte de un problema requiere una solución diferente. Aunado a ello se pueden usar técnicas de estimación de los estados internos del sistema para obtener una mejor información del sistema no lineal y aplicar el diseño de un controlador que estabilice al sistema. La ventaja principal de los sistemas difusos es justamente la flexibilidad que tienen de interpretar el razonamiento humano basado en reglas y que se pueden traducir a expresiones matemáticas cuyo desempeño se logra variando ciertos parámetros de estas reglas. y su desempeño se realiza ajustando precisamente estas reglas mediante un algoritmo de adaptación como en las redes neuronales. Los sistemas difusos son más favorables desde el punto de vista que son capaces de expresar el conocimiento humano a través de reglas propias de cada individuo. de esta forma los sistemas difusos se aplican especialmente donde existen comportamientos no lineales importantes. y cada técnica está más indicada para ciertos problema más que para otro. y se disponga de un conjunto de reglas proporcinada por los expertos en la materia.Capítulo 6 Conclusión En forma general no podemos afirmar que la lógica difusa sea mejor que las redes neuronales o viceversa. aunque al final el resultado es igual al que se obtiene por medio de las redes neuronales. los sistemas difusos contienen cierta información de la planta disponible a través de los expertos en la .

sin embargo. y un carácter lingüístico que le hace más accesible y que simplifica el problema. . En base a los resultados obtenidos en este trabajo. cuando: 1. Hemos visto que podemos extender las técnicas de control no lineal a casos más generales. favoreciendo de esta forma la representación de modelos más completos. son muy útiles los sistemas difusos. se puede observar que la simulación es adecuada desde un punto de vista puramente académico. el cual permite resolver satisfactoriamente el problema de seguimiento que se plantea. en la primera se considera un control difuso del tipo Takagi-Sugeno. es posible la necesidad de utilizar un número mayor de reglas difusas con el objetivo de una mejor interpretación del sistema no lineal a través de los sistemas difusos. asumiendo nuevas estrategias de control. El inconveniente que existe es que no hay una afirmación que precise el número exacto de reglas difusas a utilizar para obtener los resultados requeridos en el proceso de simulación. Debido a que el sistema es una caja negra. de esta forma podemos asegurar un buen desempeño empleando sólo dos reglas difusas. empleando sólo dos reglas difusas se logra una aproximación satisfactoria del sistema no lineal. el sistema es una caja negra. sólo están disponibles los datos entradas-salidas. El desarrollo de este trabajo ha proporcionado varias experiencias positivas. precisamente porque solo las entradas-salidas son medibles. obteniendo resultados satisfactorios y de esta forma poder establecer un precedente para este tipo de aplicaciones. el cual tiene la capacidad de sintetizar funciones de control. no obstante. y de esta forma podemos proporcionar un observador en modo deslizante. Y finalmente podemos probar la estabilidad de la combinación de estos dos métodos. 2.132 Conclusión materia. La segunda alternativa considera el diseño de un controlador adaptable difuso. Para el diseño del control se consideran dos alternativas. proporcionar una capacidad de operación en diversas zonas de operación. en aplicaciones más prácticas dentro de la industria.

Una de las contribuciones principales del presente trabajo es el diseño de un control adaptable difuso que permita estabilizar a la clase de sistemas no lineales en consideración.133 La técnica de optimización utilizada por el control adaptable difuso para la segunda alternativa de diseño fue la utilización de un observador en modo deslizante. . Y debido a que el control es adaptable se incluyen conceptos relativos a observadores e identificadores neuronales difusos. Dentro de los trabajos futuros podría ser el mejoramiento del controlador en base a la optimización de las reglas y bases de conocimiento. Así como la implementación práctica del diseño del controlador adaptable difuso que se planteó.

134 Conclusión .

859-864. 1991.J. 1981. 39.Chen and D. 1994. pp.31. B.Slotine. Continuous State Feedback Guaranteeing Uniform Ultimate Boundedness for Uncertain Dynamic Systems. Man. Vol. 303-314. Approximation by Superposition of Sigmoidal Activation Function. Sig Syst.2.27. Syst.Harris. Math. Automat.Canudas de Wit and J. pp. Cybern.Brown. K.Y.A.Wang. [2] A. IEEE Transactions on Automatic Control.Bibliografía [1] M.5. [6] M.C. pp.J. Sliding Observers for Robot Manipulator. Contr. [3] W.Cybenko. Adaptive Controlling Nonlinear Countinuous-Time Systems Using Multilayer Neural Networks. 1994.Leitmann. C. 1306-1310. 2643-2648. Vol. USA. 2001. [4] F. C. vol. pp. IEEE Trans.Liu. 1989.Cheung and Y.Chen and C. Phoenix. Vol. A systematic neuro-fuzzy modeling framework with application to material property prediction. Vol. Modeling of nonlinear stochastic dynamical systems using neurofuzzy networks. No. [5] M.Linkensm.W.Corless and G. pp. 38th IEEE Conference on Decision and Control.Control.26.E. 1139-1144. pp.Chan. . [7] G.C.C.. Prentice Hall: New York .J. 781-790. Neurofuzzy Adaptive Modelling and Control. IEEE Trans.C.Chan. 1999. Automatica.

Upper Saddle River: NJ. 1083-1112. Proc. R. vol. Co.J.M.Hernandez and J-P.32.Fayaz.A. pp. No.Egardt. Macmillan College Publ.Kambahmpati. and P. No. 3088-3092. IEEE Trans.Horikawa. Automatica. 1992. Springer-Verlag. Inc. No 4. Stability of Adaptive Controllers. 81.Zbikowski. On the Sugeno-Type Fuzzy Observers. Neural Networks.J. 1993. 1979. Sci. Vol. . 1994.Delgado.Jagannathan and F. Appl.L. [18] S. pp. [13] J. [15] S. USA.12.Warwick. Vol. 801-806.32. [11] K. Robust Adaptive Control. 1707-1712. and Y. Neural Network for control systems-a survey. [10] A.Haykin.Hopfield. Neural Networks.-Cont. Sliding Observer-based Feedback Control for Flexible Joints Manipulator. Proc. Automatica.. Lewis. 1995.Uchikawa. New York. of 38th IEEE Conf. on Decision & Control.5. Phoneix. pp. Lecture Notes in Control and Information Sciences. Prentice-Hall. Automatica.20.Sbarbaro.136 BIBLIOGRAFÍA [8] A. Vol.Hunt. and K. C. Identification of nonlinear dynamical systems using multilayered neural networks.9.Ioannou and J. no.. 1992. pp. 307-315.3.Gawthrop. pp.I. 6. Approximation of dynamical systems by continuous time recurrent neural networks. 4828-4833. 1243-1254. [14] J. T. 1996. Berlin. Nat.Funahashi. Acad. [16] K. 1984. pp. [9] B. 142.Nakamura.Barbot. On fuzzy modeling using fuzzy neural networks with the back-propagation algorithm. Theo.J. 28.A Comprehensive Foundation.Furuhashi and Y.. pp. Neurons with grade response have collective computational properties like those of a two-state neurons.1999. Neural Networks. [17] P. Vol. 1996. Dynamic recurrent neural network for systems identification and control. USA.Sun. 1996. Vol. IEE Proc. pp. D. 801-806. [12] S.

T.F. 6. pp. 1998. IEEE Trans.1. World Scientific Publ. No. 1995. Zeng-Qi Sun. on Neural Networks.G. Neural Networks.Liu. Vol. 4-27.7. [24] F. IEEE Trans. Fuzzy Logic in Control Systems: Fuzzy Logic Controller-Part I”.Mamdani. Vol.BIBLIOGRAFÍA 137 [19] C. [25] C..on Fuzzy Systems. Lewis. Yan-Yan He. pp. Vol 20.1. Man.A. Observer-based adaptive fuzzy-neural control for unknown nonlinear dynamical systems.T.29. Vol. pp. No. 121. Multilayer neural-net robot controller with guaranteed tracking performance.12. Vol.. Syst.6. 1995. T. IEEE Transactions on Systems. 155-170. No. pp.70. Man and Cybernetics.Lin and G. Application of fuzzy algorithm for simple dynamic plant.Leu. A.Ioannpu. 1996..Lee. IEEE Trans. Feb. IEE Proceedings-Control Theory and Applications. 1999. [27] Xiao-Jun Ma. No. Kim and F. M.Christodoulou and P. 2002. Fuzzy Sets anc Systems. IEEE Trans.10.Yesildirek and K. Vol. Prentice-Hall Inc. 1997.T. NJ. 388-399.B. 583-591. IEEE Trans.Lin. A neural fuzzy control system with structure and parameter learning. ”HighOrder Neural Network Structures for Identification of Dynamical Systems”.Lee and W. Co.10. Cybern. High-Level Feedback Control with Neural Networks.H.. A TSK-type recurrent fuzzy network for dynamic systems processing by neural network and genetic algorithm. 299-314. on Neural Networks. pp. No. Fuzzy Syst.Kosmatopoulos. [20] Y. [26] C. Vol. [28] E. No. [21] E. 1974. [22] Lee Chuen.H.Juang.Lewis. 442-431.Polycarpou. Convergence”.L.2. Analysis and Design of Fuzzy Controller and Fuzzy Observer. [23] Y. B.Wang. Vol. .M.A. Vol.L. M.Y. 2 March/April 1990. 183-212.2. Vol. pp. 1585-1588.. Neural fuzzy systems: A neural-fuzzy synergism to intelligent systems.2. 1996. pp. 1998.

pp. Yale University. Man. Syst.Tornambe. 217-223. 3a.Sandberg. pp. pp.Tsai and P. Identification and Control of Dynamical Systems Using Neural Networks. 2000. 38.Narendra and K. M. Robustness and perturbation analysis of a class of artificial neural networks.Karthasarathy. Neural Networks.. pp. 1993. [33] S. 1992. IEEE Trans. pp.Mastorocostas and J. 7. 1989. Vol. [38] H.Yu. IEEE Trans. 295-297. IEEE Signal Processing Letters. Vol. Vol. Vol. [35] G.Mandic. High-Gain Observers in the State and Parameter Estimation of Robots Having Elastic Joins. B. Vol.N. Vol. Uniform approximation and the circle criterion.8. A.Hanna and M. Neural Networks.A. No.13. 7th Yale Workshop on Adaptive and Learning Systems. [36] I. 1994. Sastry. 1990. IEEE Trans. 331-337. IEEE Trans.Razaz. No 2. On the optimal design of fuzzy neural networks with robust learning for function approximation.Theocharis.A. 24. Vol. IEEE Trans. 1450-1458. S.. Cybern.Sontag. [31] R.Ed. Li. pp. CRC Press. 176-190.Christodoulou..Wang.W. S. in Proc. A normalized gradient descent algorithm for nonlinear adaptive filters using a gradient adaptive step size.A. [39] K.Ogata.I. Neural nets as systems models and controllers. 73-79.T. pp. 2002. pp. A recurrent fuzzy-neural model for dynamic system identification. 2001 [30] P. [32] K. [37] E. 1998. .. System & Control Letter. 251-257.32. B. Z.. 400-412. 4-27. Prentice-Hall. Murray. Ingeniería de Control Moderno.Rovithakis and M. and A.H.30. Vol. [34] K.1. Man. pp. Syst. Man and Cybern. Cybern. on Syst.Mitchel. 1992. 1994.138 BIBLIOGRAFÍA [29] D.B. Adaptive Control of Unknown Plants Using Dynamical Neural Networks.Nicosia and A.S.P.11. on Automatic Control. A mathematical introduction to robotics manipulation.

Man. Observer Based Neuro Identifier. 145-152. Cybern. 467-475. submitted to CDC’99 [49] Wen Yu.2. pp.Y. 2000.T.Willems.Er. 740-747. [42] L. C. No. B. Man.. [48] W. Robust Asymptotic Neuro Observer with Time Delay Term. IEEE Trans.31.37. Man. T.Control Theory and Applications. Englewood Cliffs NJ: Prentice-Hall. .Y. Vol.Wang. 1999. 16. 1997.. 621-634. IEEE Trans. No..T.147.. B. Adaptive Fuzzy Systems and Control.BIBLIOGRAFÍA 139 [40] C. 1997. 2000. pp. [43] W. Syst. Marco A. Dynamic optimal learning rates of a certain class of fuzzy neural networks and its applications with genetic algorithm.Poznyak.X.Wang. Vol. Xiaoou Li.Wang.Lee.27. Vol. B. [47] W.C. pp.L. pp. [45] J. Dynamic fuzzy neural networks. Moreno. Syst. Function approximation using fuzzy neural networks with robust learning algorithm. 2001. IEE Proceedings . No 6. Alexander S. Yu and Alexander S. B.H.Wang.30.a novel approach to function approximation.Lin.C. Syst.J. Cybern. Vol. H.Liu and C. Least Squares Optimal Control and Algebraic Riccati Equations. Indirect Adaptive Control vía Parallel Dynamic Neural Networks.Liu and C. Man.1. [41] L. A course in Fuzzy Systems and Control. [44] W. IEEE Trans.Wang. IEE Proceedings .L. pp. 1994. Vol.Wu and M. 140-147.Poznyak.Wang. Syst. Cybern. Vol.Hsu. Robust adaptive fuzzy-neural control of nonlinear dynamical systems using generalized projection updated law and variable structure controller. 1971. on Automatic Control.G. pp. Englewood Cliffs NJ: Prentice-Hall. Cybern.Leu and C. IEEE Trans.31. 2001. Yu.X.H.Control Theory and Applications. Y. 358-364. Vol. [46] S. IEEE Trans.

8. pp. Information and Control. 338-356.140 BIBLIOGRAFÍA [50] W. Circuits and Systems. 43-88.Zadeh. Vol.2.1. 301-357. IEEE Trans. No. pp.12. 412-417. pp. on Systems. No.9 pp.48. No.A. 1973 [55] L. pp. [53] L.1. Part I. Li. [52] L. No. 1965. . Outline of a new approach to the analysis of complex systems and decision processes. Vol. Fuzzy Sets. Vol.Yu and X. Some stability properties of dynamic neural networks. The concept of a linguistic variable and its application to approximate reasoning I. Zadeh. 199-251. Fuzzy Algorithm.A. 94-102.Zadeh.Yu and X. pp.12. III.3. Li. 2001. 1975. pp. Information and Control. Vol 8.A.28-44. 256-259.A. Man. Vol. II. Vol. Neural Networks. 2001. [54] L.Zadeh.. pp. Some new results on system identification with dynamic neural networks.2. and Cybern. Information Sciences. IEEE Trans. Vol. [51] W. 1968. IEEE Trans.

Figura 7.1: Diagrama principal para el neuro identificador del robot manipulador. a continuación se muestran los diagramas. .Appendix: diagramas Para las diferentes simulaciones se utilizó la herramienta Matlab Simulink.

142 Appendix: diagramas Figura 7.4: Observador en modo deslizante para el sistema de Van der Pol.2: Diagrama principal del observador para estimar los estados del robot de dos grados de libertad. Figura 7. . Figura 7.3: Diagrama principal para la identificación del sistema de Van der Pol por medio de un sistema difuso.

5: Diagrama principal del control neuronal adaptativo para el robot manipulador de dos grados de libertad.6: Diagrama principal del contol incluyendo el observador en modo deslizante para la velocidad de la junta del robot.143 Figura 7. Figura 7. .