You are on page 1of 54

III - Análisis y diseño de sistemas de control 

A lo largo de este capítulo se aplica la Teoría de Control con el objetivo de controlar el sistema
en estudio, es decir, el cuadricóptero. Primero se introducirán aquellos conceptos elementales
de Teoría de Control y se aplicarán algunos de estos conceptos al sistema bajo análisis. Luego
se mostrará cómo transformar el sistema a una representación adecuada para la aplicación de
los métodos de control considerados, se los aplicará y se analizarán sus resultados. Se
comenzará por un método simple, el posicionamiento de polos, y se lo complementará
mediante la utilización de prácticas propias del área de Control, como ser el uso de
integradores. Luego se aplicará un método más avanzado, el regulador cuadrático lineal (LQR),
y se presentarán sus resultados. A continuación se estudiará la incorporación de observadores
de estados al controlador, que permiten que el sistema opere en condiciones más cercanas a la
realidad, y se presentará el sistema de control definitivo a utilizar en el presente proyecto.
Posteriormente, se analizará cómo se comporta el sistema ante la presencia de fuerzas
externas o perturbaciones. Finalmente, como cierre, se presentarán algunas maniobras
avanzadas que pueden realizarse con el sistema obtenido. Debe aclararse que a lo largo de las
distintas secciones, cuando resulte conveniente, se definirán algunos conceptos fundamentales
de Teoría de Control, que no han sido presentados en la primer sección para facilitar la claridad
de la exposición. Entre éstos se incluyen la estabilidad, la controlabilidad y la observabilidad de
los sistemas.

1. Conceptos básicos de la Teoría de Control 

En términos generales, todos los sistema dinámicos pueden modelarse como un bloque al que
ingresan una o más entradas y que produce como resultado una o más salidas. El grado de
conocimiento que se posea sobre el funcionamiento de dicho bloque será determinante para la
capacidad de ​controlar el sistema, es decir, de influir sobre sus salidas. El sistema que se
desea controlar suele denominarse en la literatura con el término ​planta​, mientras que el
sistema que se utiliza para controlar a la planta se designa en general como ​sistema de
control​, o simplemente ​controlador​. En la Figura III.1 se muestra un esquema de una planta
general. El bloque interno, denotado por la letra Σ, representa el modelo que se tiene del
sistema, mientras que el término adicional ​d se refiere a cualquier perturbación que afecte a la
salida, como ser por ejemplo errores de modelado o de medición.

Figura III.1

-1-
El objetivo básico de todo sistema de control es determinar los valores que deben ir tomando
las entradas de la planta a lo largo del tiempo de forma tal de lograr que sus salidas se ajusten
lo mejor posible a los valores deseados que se ingresan al controlador, llamados comúnmente
referencia​. Las entradas de la planta cuyo valor es determinado por el controlador suelen ser
denominadas ​variables manipuladas (o simplemente ​manipuladas​), mientras que las salidas
de la planta sobre las que se desea tener dominio reciben en general el nombre de ​variables
controladas​ (o simplemente ​controladas​).

Dentro de la Teoría de Control se distinguen dos grandes tipos de sistemas de control, según si
las variables manipuladas dependen o no de las variables controladas (y de sus integrales y/o
derivadas). Éstos son los sistemas de control a ​lazo abierto y los sistemas de control a ​lazo
cerrado​.

Los sistemas de control a lazo abierto son aquéllos en los que la salida de la planta no tiene
influencia en la acción de control. Es decir, las variables controladas no son medidas ni afectan
de ninguna manera al valor de las variables manipuladas. Por lo tanto, para cada referencia
(salida deseada) corresponde una determinada condición de operación. La precisión del
sistema de control dependerá por lo tanto en grado sumo de la precisión del modelo que se
posea de la planta. Ante cualquier tipo de perturbación, externa o interna, la planta no producirá
la salida deseada. Por otra parte, estos controladores tienen la ventaja de no presentar
problemas de estabilidad. La Figura III.2 ilustra un sistema de este tipo, donde ​u representa a la
variable manipulada.

Figura III.2

Los sistemas de control a lazo cerrado, también llamados sistemas de control de


retroalimentación​, son aquéllos en los que la salida de la planta se compara con la salida
deseada, para luego utilizar la diferencia entre ellas como entrada del controlador. Estos
sistemas por lo tanto tienen un grado de sensibilidad a las perturbaciones mucho menor que los
presentados anteriormente. Si el sistema que se desea controlar no se conoce con exactitud o
si se presentan perturbaciones, es posible que un controlador a lazo cerrado cumpla
igualmente su objetivo, aunque así también podría suceder que el sistema se vuelva inestable.
La Figura III.3 ilustra un sistema de este tipo.

Figura III.3

La opción por uno de estos tipos de controladores dependerá del sistema que se desea
controlar y del conocimiento que se posea del mismo. Cuando la planta puede modelarse con

-2-
exactitud suele ser preferible utilizar un sistema a lazo abierto, ya que éste resulta más simple
(y por ende más económico y fácil de mantener) que el correspondiente sistema a lazo cerrado,
además de contar con la ventaja de no presentar problemas de estabilidad. Los controladores a
lazo abierto también se prefieren en general cuando la salida de la planta no puede ser medida,
o bien cuando medirla no es viable económicamente. Por otro lado, cuando el sistema no
puede modelarse con exactitud, es conveniente utilizar controladores a lazo cerrado. [1]

Según otro criterio, un controlador puede ser clasificado como ​analógico​, ​digital o ​mixto​. Un
controlador analógico es aquél que opera en tiempo continuo, es decir, que trabaja con
entradas y salidas continuas, y generalmente se constituye en un sistema construido mediante
componentes electrónicos, neumáticos o mecánicos. Un controlador digital, por otra parte, es
aquél que trabaja a tiempo discreto, es decir, que opera con entradas muestreadas cada cierto
intervalo de tiempo, llamado ​período de discretización o ​período de muestreo​, generando
salidas cada vez que recibe una entrada. En general, un controlador digital funciona embebido
en un microcontrolador, o como un programa de computadora. Un controlador mixto, o híbrido,
es aquél que combina en algún sentido elementos de los anteriores.

Los controladores digitales suelen preferirse a los analógicos puesto que son más robustos,
precisos y versátiles, entre otras ventajas. Además, para sistemas complejos, los controladores
digitales resultan en general más económicos que los analógicos.

Dentro del campo de la Teoría de Control se distinguen tres grandes áreas, dentro de las
cuales se presentan diferentes métodos. Éstas áreas son la ​Teoría de Control Clásica​, la
Teoría de Control Moderna ​y la ​Teoría de Control Robusto​.

La Teoría de Control Clásica se basa en el análisis en el dominio frecuencial y es adecuada en


general para sistemas con una única variable manipulada, una única variable controlada
(llamados en la literatura sistemas SISO, de ​Single Input Single Output​) y condiciones iniciales
nulas. Además, si bien su aplicación suele dar lugar a sistemas estables y que satisfacen una
serie de requerimientos de desempeño arbitrarios, dichos sistemas no son en general óptimos
en ningún sentido significativo [1]. Por otro lado, si el conocimiento que se tiene sobre la planta
no es exacto, se presentarán diferencias en el desempeño del controlador al ser aplicado al
sistema real, y dichas diferencias podrían afectar su estabilidad.

La Teoría de Control Moderna se basa en el ańalisis en el dominio temporal y es aplicable a


sistemas con múltiples variables manipuladas y múltiples variables controladas (llamados en la
literatura sistemas MIMO, de ​Multiple Input Multiple Output)​ , sin restricciones en sus
condiciones iniciales. Esta teoría permite desarrollar sistemas que no sólo sean estables y
satisfagan ciertos requerimientos, sino que además sean óptimos en un sentido determinado.
Asimismo, puesto que estos métodos utilizan de forma directa la descripción de la planta por
medio de ecuaciones diferenciales, su aplicación a sistemas complejos suele ser más sencilla
que la aplicación de la Teoría de Control Clásica. Sin embargo, así como ocurre para esa
teoría, si la descripción que se tiene de la planta, es decir, su modelo, no es exacto, podrían
surgir problemas de desempeño y estabilidad.

-3-
Un concepto clave dentro de la Teoría de Control Moderna es el de ​espacio de estados​. En
esta teoría, el sistema que se desea controlar se describe por medio de sus entradas, salidas y
estados internos, donde las entradas y los estados se relacionan entre sí mediante ecuaciones
diferenciales de primer orden o modelos Markovianos, mientras que las salidas se relacionan
con los estados mediante ecuaciones algebraicas. Si bien los estados del sistema suelen tener
una interpretación física directa (como ser velocidades lineales o rotacionales, entropía, etc.)
esto no es algo necesario, sino que cada estado puede definirse como resulte conveniente.
Una de las ventajas de esta representación es que permite trabajar en forma vectorial,
independizándose de esta manera del número de entradas y salidas.

La Teoría de Control Robusto, por su parte, se apoya simultáneamente en el análisis en el


dominio temporal y frecuencial. Esta teoría permite trabajar con sistemas MIMO complejos
sujetos a perturbaciones internas (como ser errores de modelado) o externas. Estos métodos
suponen un conocimiento previo del rango en el que estas perturbaciones pueden presentarse,
y permiten obtener controladores tales que, si los errores se mantienen dentro de dichos
márgenes, el sistema final resulte estable. Sin embargo, esta teoría presenta la dificultad de
incorporar una complejidad matemática muy elevada, requiriendo extensos desarrollos, por lo
que su uso no es muy frecuente en la práctica.

2. Análisis para el sistema bajo estudio 

La planta con la que se trabaja en este proyecto, es decir, el cuadricóptero, es un sistema no


lineal inherentemente inestable. El sistema es además de tipo MIMO, ya que cuenta con cuatro
entradas (las velocidades de rotación de sus cuatro rotores Loading..., Loading..., Loading... y
Loading...) y seis salidas (su posición Loading..., Loading... y Loading..., y sus ángulos de
navegación , y ).

En primer lugar, se opta por utilizar un sistema de control a lazo cerrado. Esta elección se debe
a la presencia de errores de modelado, puesto que, como se dijo en la Sección 9 del capítulo
anterior, se han realizado ciertas simplificaciones a la hora de construir el modelo, por lo que la
descripción que se desarrolló para el sistema dista de ser exacta. Estas perturbaciones,
combinadas con la inestabilidad propia del sistema, hacen inviable la utilización de
controladores a lazo abierto. Asimismo, puesto que se desea que el trabajo realizado pueda
aplicarse en un futuro en un sistema físico real, debe tenerse presente que el vehículo estará
sometido inevitablemente a perturbaciones externas (como ser, por ejemplo, variaciones en el
flujo del aire).

Por otra parte, se elige realizar el control en forma digital, debido a las ventajas que el mismo
presenta, y puesto que es un objetivo del proyecto la obtención de un controlador que pueda
funcionar como un programa dentro de un ordenador de placa reducida.

Finalmente, es claro que la Teoría de Control Clásica no resulta adecuada para el problema,
resultando la Teoría de Control Moderna una buena opción, ya que el sistema estudiado es de
tipo MIMO, y además se cuenta con una descripción en el dominio temporal del mismo: su

-4-
modelo, consistente en un sistema de ecuaciones diferenciales de primer orden, hallado en el
capítulo anterior (Ec. II.26). Por otra parte, la Teoría de Control Robusto no es considerada una
alternativa viable, puesto que la dificultad que presenta su aplicación, potenciada por la
complejidad inherente del problema, escapa a los alcances del proyecto.

En lo que resta del capítulo, por lo tanto, se estudiará la aplicación de la Teoría de Control
Moderna al problema, trabajando con controladores digitales a lazo cerrado.

3. Ecuaciones vectoriales del sistema 

En primer lugar, se comienza por escribir el modelo del sistema en forma vectorial. Se llama
al vector de estados del sistema, al vector de entradas e al vector de salidas. Es decir,

Se define luego la función como el miembro derecho del sistema de ecuaciones


diferenciales hallado en el capítulo anterior para modelar la dinámica del cuadricóptero (Ec.
II.26), es decir,

(Ec.
III.1)

Así, puede expresarse la ecuación de estados como la ecuación diferencial vectorial


.

La ecuación de salida, es decir, la relación entre e , viene dada por la ecuación algebraica
matricial , donde

-5-
En consecuencia, el modelo en espacio de estados del sistema es

(Ec. III.2)

4. Linealización del sistema 

El modelo en espacio de estados expresado en la sección anterior (Ec. III.2) es claramente no


lineal. Sin embargo, muchos de los conceptos y métodos de la Teoría de Control Moderna son
aplicables sólo a sistemas lineales. Luego, es conveniente realizar una linealización del
sistema. Para esto, se considera un punto , llamado comúnmente punto de operación,
y se linealiza el sistema en torno al mismo. Debe notarse que, puesto que la ecuación de salida
ya es lineal, sólo necesita linealizarse la ecuación de estados.

La ecuación para la variable de estado , correspondiente al último elemento de la función


vectorial (Ec. III.1), presenta un inconveniente para la linealización del sistema. El obstáculo
viene dado por el término

ya que éste involucra a las derivadas de las entradas, lo cual dificulta el proceso de
linealización. Este término se debe al contra-torque de ​yaw​, que fue analizado en el apartado
8.6 del capítulo anterior. Como se dijo allí, en condiciones normales de operación este torque
suele ser muy pequeño, por lo que se opta por no considerarlo para la linealización. Sin
embargo, este efecto sí es tenido en cuenta al realizar simulaciones de la planta, por lo que el
mismo actúa como una perturbación al modelo considerado.

Aproximando la función mediante una expansión de Taylor en torno al punto de


operación (sin considerar, como se dijo, al contra-torque de ​yaw)​ , y despreciando los términos
de segundo orden y superiores, se tiene

, (Ec. III.3)

-6-
donde es el jacobiano de la función respecto de evaluado en el punto
de operación y es el jacobiano de la función respecto de evaluado en el
punto de operación.

Llamando

se tiene la ecuación de estados linealizada

(Ec. III.4)

Por lo tanto, el modelo en espacio de estados linealizado del sistema viene dado por

(Ec. III.5)

En la Figura III.4 puede observarse un diagrama de bloques del modelo linealizado de la planta.

Figura III.4

Finalmente, debe definirse el punto de linealización a utilizar posteriormente. Como


se toma en cada simulación al correspondiente estado estacionario final deseado. Para
calcular , se buscan las velocidades de rotación tales que la fuerza de empuje generada por
los rotores se equilibre con el peso del vehículo. Como se vio en el apartado 7.2 del
capítulo anterior (Ec. II.14), la componente vertical de la fuerza de empuje viene dada por

. Puesto que no deben generarse torques de ningún tipo, todos los

-7-
rotores deben girar a la misma velocidad, es decir, . Por lo tanto, se
tiene , de donde se obtiene

(Ec. III.6)

5. Discretización del sistema 

El modelo lineal hallado en la sección anterior (Ec. III.5) es una representación en tiempo
continuo. Puesto que, como se dijo anteriormente, se pretende realizar el control en forma
digital, debe procederse a discretizar el modelo.

Para esto, se opera con la ecuación de estados (Ec. III.4) de la misma forma que si se la
quisiese resolver en forma analítica. En primer lugar, se expresa la ecuación diferencial
vectorial como

Se multiplica luego miembro a miembro por izquierda por el factor integrante , obteniendo

Se identifica entonces el miembro izquierdo como

por lo que se tiene

Por lo tanto,

donde se ha considerado que las condiciones iniciales están dadas en el instante .


Puesto que la variable temporal no aparece explícitamente en el modelo, esta suposición
arbitraria no supone una pérdida de generalidad.

Se obtiene entonces la solución de la ecuación diferencial:

-8-
(Ec. III.7)
.

Se llama ahora al período de discretización, y se define la variable de tiempo discreto


. Se tienen entonces la variables discretas y . La variable se calcula a
partir del muestreo de los estados continuos, siendo . La relación entre la variable
y la variable es un poco más compleja, ya que debe elegirse un método que permita
construir una variable continua a partir de una variable discreta. A tal efecto existen muchos
métodos posibles, entre los que pueden mencionarse el uso de impulsos, los retenedores de
orden cero, los retenedores de primer orden y los retenedores de orden superior. El método
más utilizado en general dentro del campo de Control, y el que se opta por utilizar aquí, es el
retenedor de orden cero. El mismo consiste en conservar constante el valor de durante el
tiempo que transcurre entre cada par de instantes de discretización, es decir,

. (Ec. III.8)

Esto puede observarse en la Figura III.5, donde se ve en color azul una cantidad escalar
discreta, y en rojo dicha cantidad luego de pasar por un retenedor de orden cero. En la Figura
III.6, por otra parte, se presenta un diagrama de la planta incorporando un retenedor de orden
cero en sus entradas y realizando el muestreo de sus salidas.

Figura III.5

Figura III.6

-9-
Prosiguiendo con el desarrollo, se evalúa la solución obtenida para (Ec. III.7) en dos
instantes de discretización sucesivos, y :

Desarrollando la segunda expresión, se tiene

Reconociendo el término entre corchetes como , aplicando un retenedor de orden cero para
y recordando que los términos y son constantes, se tiene

donde se extrae de la integral puesto que es constante durante el intervalo de integración.

Realizando en la integral la sustitución , se obtiene

(Ec. III.9)
.

Finalmente, si se define ,

y además y , se obtiene el modelo lineal discreto

-10-
(Ec. III.10)
.

En la Figura III.7 puede observarse un diagrama de bloques del modelo linealizado y


discretizado de la planta.

Figura III.7

Los métodos de control analizados en las secciones restantes suponen que el modelo de la
planta corresponde exactamente al expuesto en la Figura III.7, es decir, a la planta lineal
discreta. Sin embargo, debe destacarse que las simulaciones computacionales se realizan
utilizando el modelo “real” de la planta, el cual fue expresado en la Sección 3 (Ec. III.1). En
consecuencia, el sistema es afectado por tres fuentes de perturbaciones:

● La linealización de la planta
● La discretización de la planta linealizada
● El efecto del contra-torque de ​yaw​, que no fue tenido en cuenta en la linealización

No obstante, esta tercer fuente de perturbaciones no es incorporada en las simulaciones


realizadas en las secciones subsiguientes, ya que, para los controladores considerados
inicialmente, la misma ocasiona en algunos casos la divergencia del sistema. El problema es
abordado en la Sección 10, incorporándose este efecto en todas las simulaciones realizadas a
partir de ese punto.

Para concluir esta sección, debe definirse el período de muestreo a utilizar en la discretización
desarrollada. Para un problema como el estudiado, el período elegido suele ser una decisión de
diseño. Un mayor período de muestreo implica una capacidad de control más fina y aumenta la
robustez del sistema frente a perturbaciones. Por otro lado, cuanto mayor es el período de
muestreo, mayor potencia de cómputo se demanda al procesador utilizado. Puesto que uno de
los objetivos de este proyecto es que el controlador pueda implementarse en un Ordenador de
Placa Reducida, donde se cuenta con menor capacidad de cómputo que en un ordenador
tradicional, el período de muestreo no puede ser demasiado bajo. La decisión tomada aquí es
adoptar un período de discretización de . De esta forma, se ejecutan 20 acciones

-11-
de control por segundo, lo cual no requiere una gran potencia de cómputo y, como se verá,
permite obtener resultados satisfactorios.

6. Control por retroalimentación de estados 

El control por retroalimentación de estados consiste en definir la acción de control en forma


proporcional a los estados del sistema. En la bibliografía consultada [1][2], suele caclularse
como , donde es una matriz cuyo número de filas se corresponde con el
número de entradas del sistema, y cuyo número de columnas con el número de estados del
sistema. Es decir, que en el problema en estudio, debe ser una matriz de dimensión
.

Sin embargo, esta definición de la acción de control es útil sólo cuando el objetivo del
controlador es llevar el sistema al estado . Sería deseable poder llevar el sistema a
cualquier estado estacionario arbitrario. Esto puede lograrse definiendo el estado objetivo o de
referencia como , y calculando la salida del controlador como

(Ec. III.11)
.

El diagrama de bloques del sistema, compuesto por el controlador y la planta, puede


observarse en la Figura III.8. Aquí, la planta puede estar modelada por el modelo completo real,
incorporando el muestreo y el retenedor de orden cero, o por la simplificación lineal discreta
hallada.

Figura III.8

Suponiendo que la planta viene dada por el modelo lineal discreto hallado anteriormente, se
tiene

Evaluando la última expresión en dos instantes de discretización sucesivos, se tiene

-12-
Definiendo , se tiene entonces

(Ec. III.12)
.

Resulta de interés analizar esta expresión, para conocer qué debe exigirse de la matriz .
Para ello, se recurre a un concepto básico de Teoría de Control: la ​estabilidad​. Se dice que un
sistema es estable en el punto estacionario si para todo existe tal
que si entonces para todo se tiene . Es decir, que
si un sistema es estable en y su estado inicial es lo suficientemente cercano a ese estado,
entonces su estado estará en todo momento a no más de una cierta distancia de . Si
además de lo anterior, se cumple que existen , , tales que
implica para todo , entonces el sistema es
asintóticamente estable en . Esto significa que si el estado inicial del sistema es lo
suficientemente cercano a , entonces convergerá exponencialmente a ese estado. [3]

Si el sistema que se está analizando es lineal, ya sea continuo o discreto, entonces el análisis
de su estabilidad exponencial se simplifica. Puesto que el estado estacionario que resulta de
interés suele ser , en general se afirma que un sistema es o no asintóticamente estable,
dejando implícito que la estabilidad se analiza en dicho estado. Un sistema lineal continuo
es asintóticamente estable si todos los autovalores de tienen parte real negativa.
Un sistema lineal discreto es asintóticamente estable si todos los autovalores
de tienen módulo menor a 1. [3]

La última afirmación puede verificarse con facilidad para la Ec. III.12. Desarrollando esta
expresión, se tiene

Puesto que se quiere que el sistema alcance un estado estacionario, debe cumplirse

. Es decir que debe tender a la matriz nula. Para que esto


ocurra, es sabido en el campo del álgebra lineal que los autovalores de la matriz
deben hallarse dentro del círculo unitario en el plano complejo [4]. Ésta es
justamente la condición expuesta anteriormente para la estabilidad exponencial de un sistema
lineal discreto.

La matriz debe elegirse, por lo tanto, de forma tal que se satisfaga este requisito.
Supóngase que se define un conjunto arbitrario de autovalores para la matriz

-13-
, de dimensión . Debe analizarse bajo qué condiciones es posible hallar
una matriz que dé lugar a los autovalores deseados.

La respuesta está relacionada con otro concepto clave del campo de Teoría de Control: la
controlabilidad​. Se dice que un sistema es controlable si es posible, mediante la manipulación
irrestricta de sus entradas, llevarlo de cualquier estado inicial arbitrario a cualquier otro estado
arbitrario en un intervalo finito de tiempo [1]. Una condición suficiente y necesaria para que un
sistema lineal discreto, cuya ecuación de estados esté dada por , sea
controlable, es que el rango de la matriz

llamada matriz de controlabilidad, sea igual al número de estados del sistema.

Para aplicar esta condición sobre el sistema que se está analizando, escrito en su forma lineal
discreta , debe tomarse y
. Luego, procediendo de forma similar a como se hizo para obtener la Ec.
III.12, se tiene

. (Ec. III.13)

Por lo tanto, la matriz constante no tiene influencia sobre la dinámica del sistema, y la
condición de controlabilidad puede aplicarse tal como fue expuesta.

En el desarrollo de este trabajo se han realizado numerosas pruebas, considerando distintos


tipos de puntos estacionarios en el proceso de linealización. Si bien no se ha demostrado con
rigor matemático que toda linealización arbitraria del sistema sea controlable, sí se ha podido
verificar la condición de controlabilidad en cada una de las pruebas realizadas.

Ha sido demostrado en [1] que una condición suficiente y necesaria para que la matriz
pueda hallarse de manera que los autovalores de la matriz puedan definirse
arbitrariamente es que el sistema sea controlable. Por lo expuesto, entonces, se tiene un grado
aceptable de seguridad de que la matriz siempre puede ser hallada para el problema bajo
análisis.

Existen numerosos algoritmos que, dado un conjunto de autovalores deseados para la


matriz , de dimensión , hallan, de ser posible, coeficientes adecuados
para la matriz . Algunos de estos algoritmos pueden verse en [1][2]. Puesto que los
autovalores de la matriz son los polos del sistema a lazo cerrado que se
observa en la Figura III.8, el proceso descripto se conoce en la literatura bajo el nombre de
posicionamiento de polos​. Para sistemas con múltiples entradas, como el que se trata aquí,

-14-
se presentan grados de libertad adicionales en la aplicación de esta técnica. En este proyecto
se ha utilizado el algoritmo descripto en [5], que utiliza dichos grados de libertad para minimizar
la sensibilidad de la ubicación de los polos a perturbaciones en las matrices y .

Una desventaja de trabajar con el sistema en forma discreta es la influencia que el período de
discretización tiene sobre la acción de los polos. Por ejemplo, si un polo discreto se ubica en
la posición , su influencia en el comportamiento del sistema es muy distinta según
sea 0.01s o 0.1s. Si bien esto no constituye un problema en sí mismo, resulta incómodo a la
hora de realizar pruebas sobre el sistema. Una forma conveniente de salvar esta dificultad es
definir cada polo en el dominio continuo, y luego calcular cada polo discreto
correspondiente mediante la ecuación

(Ec. III.14)
.

De esta manera, pueden definirse los polos de forma continua, independizándose del periodo
de discretización utilizado.

A continuación se presentan los resultados de la aplicación de este método al problema bajo


análisis. Para la obtención de los mismos, así como para todas las simulaciones del capítulo,
se hace uso del software ​MATLAB.​ Los algoritmos correspondientes pueden consultarse en el
Anexo II.

7. Resultados de la aplicación del método de posicionamiento de polos 

Como maniobra de prueba, supóngase que se desea que, partiendo desde el estado inicial
, el cuadricóptero se eleve a 3m sobre el nivel del suelo y se mantenga estable a dicha
altura.

El primer paso consiste en definir los polos deseados para la matriz . Como se
mencionó anteriormente, dichos polos se definen en tiempo en continuo y luego se transforman
a tiempo discreto aplicando la Ec. III.14.

Para realizar una primera prueba, se elige


(Ec.
. III.15)
En la Figura III.9 puede observarse la evolución de la altura del cuadricóptero, y en la Figura
III.10 se muestran las velocidades de los rotores que fueron calculadas por el controlador. Los
restantes estados del sistema no sufren variaciones significativas, por lo que no se presentan
gráficamente.

-15-
Figura III.9

Figura III.10
Observando la respuesta en altura del sistema, en la Figura III.9, pueden distinguirse dos
fenómenos significativos. En primer lugar, puede verse que, al inicio del vuelo, el vehículo se
excede en más de 6m del valor deseado. Este fenómeno se conoce en la literatura como
overshoot,​ y es abordado a continuación. En segundo lugar, puede observarse que el
-16-
cuadricóptero se estabiliza a una altura de aproximadamente 2.4m, es decir, 0.6m por debajo
de la altura deseada. Este segundo fenómeno se conoce como ​offset,​ y es analizado en la
siguiente sección.

Puesto que un nivel tan alto de ​overshoot no puede considerarse aceptable, debe abordarse el
problema. La causa del mismo radica en los valores definidos para los polos del sistema a lazo
cerrado. Estos polos son muy grandes (o, como suele decirse, “rápidos”), y eso da lugar a una
ganancia muy elevada, que ocasiona el gran nivel de ​overshoot.​ En consecuencia, se realiza
una segunda prueba, definiendo ahora los polos como

(Ec. III.16)

En la Figura III.11 se observa la respuesta en altura del sistema, y en la Figura III.12 se ven las
correspondientes velocidades de los rotores.

Figura III.11

-17-
Figura III.12

Como puede observarse en la Figura III.11, con este conjunto de polos se logró eliminar el
overshoot​. Sin embargo, se incrementó el ​offset​, pasando de ser 0.6m a ser 1.6m
aproximadamente. Esto puede deberse a que los nuevos polos son demasiado pequeños (o
“lentos”), dando lugar a una ganancia demasiado baja. Se repite entonces la prueba por tercera
vez, definiendo los polos como

. (Ec. III.17)

En la Figura III.13 se muestra la respuesta de la altura del sistema, y en la Figura III.14 se


observan las correspondientes velocidades de los rotores.

Figura III.13

-18-
Figura III.14
Como puede verse en la Figura III.13, con el tercer grupo de polos adoptado el ​offset resultante
es de aproximadamente 0.75m, por lo que se tiene un mejor resultado que en el segundo caso.
Además, no se presenta ​overshoot respecto de la altura deseada, sino que el vehículo sólo se
excede en 0.4m respecto de la altura en la que finalmente se estabiliza. Por lo tanto, se tiene
un resultado más aceptable que en el primer caso.

A continuación se analizan algunos métodos que permiten abordar el problema del ​offset​.

8. Tratamiento del offset 

Existen muchos métodos utilizados comúnmente en la práctica para lidiar con el problema del
offset​. El más simple de ellos consiste en multiplicar la altura de referencia por un coeficiente
determinado, dando lugar a un nuevo valor de referencia. El múltiplo debe ser tal que el ​offset
se compense. Es decir, que la diferencia entre el nuevo valor de referencia y el estado
estacionario del sistema debe ser igual a la diferencia entre el nuevo valor de referencia y el
valor de referencia original. Este método, sin embargo, presenta demasiada dependencia a que
el modelo que se tenga de la planta corresponda de manera exacta con la planta real. Por lo
tanto, no se intenta aplicarlo al problema bajo análisis.

-19-
Otro método consiste en aumentar la ganancia del sistema, lo cual puede lograrse definiendo
polos más rápidos. Esto se condice con lo observado en la sección anterior, ya que para el
caso donde se usaron los polos de mayor magnitud (Ec. III.15) el ​offset obtenido fue el menor,
como pudo verse en la Figura III.9. Sin embargo, también se presentó el fenómeno de
overshoot​, que, como se observó, se incrementa al aumentar la magnitud de los polos. Una
alternativa para mitigarlo consiste en cambiar la forma en que se ingresa la altura de referencia
al sistema. En lugar de ingresarla como un valor constante para , es decir, como un
escalón, se define una función compuesta por una rampa inicial que va desde la altura inicial a
la altura objetivo, y que luego se mantiene constante en dicho valor. Esto permite, como se ve
en el apartado 8.1, aumentar considerablemente la ganancia sin producir ​overshoot​. Además,
es común que no sólo resulte de interés la altitud en que se halla el vehículo, sino también la
velocidad con que se alcanza esa altitud. Definir la altura utilizando una rampa inicial permite
cumplir también este objetivo. Si bien este enfoque da buenos resultados, no logra eliminar el
offset completamente, sino sólo reducirlo. Además, presenta la desventaja de que no es
confiable basarse en polos de gran magnitud, puesto que éstos tienden a generar dificultades
ante la presencia de ruido.

Un enfoque más avanzado consiste en la utilización de un integrador. Este método se basa en


la incorporación de una nueva variable de estado al sistema, cuya tasa de variación se define
de forma proporcional a la diferencia entre la altura del vehículo y la altura de referencia.
Puesto que el método de posicionamiento de polos necesariamente lleva al sistema a un
estado estacionario, la tasa de variación de todas sus variables de estado debe converger a 0,
lo cual, con esta nueva variable de estado, sólo es posible si el cuadricóptero alcanza
exactamente la altura deseada. En consecuencia, este enfoque logra eliminar completamente
el ​offset,​ como se ve en el apartado 8.2.

Finalmente, es posible combinar los dos enfoques anteriores, definiendo la altura de referencia
mediante una rampa inicial e incorporando además un integrador al sistema. De esta forma,
como se ve en el apartado 8.3, se obtienen las ventajas de ambos métodos: reducir el
overshoot​, eliminar el ​offset y controlar la velocidad de ascenso. Por lo tanto, éste es el método
que se adopta en el resto del proyecto.

8.1 Amplificación de ganancia y referencia incremental 


En primer lugar, se define la altura de referencia de forma variante en el tiempo. Inicialmente
podría parecer que esto imposibilita la aplicación de los resultados teóricos presentados en la
Sección 6, donde se supuso que el vector de estados de referencia era constante. Sin
embargo, nótese que aquí la altura sólo varía durante un determinado tiempo, ,y
se mantiene constante para (o, equivalentemente, para ). Este cambio no altera
de ningún modo los desarrollos realizados, por lo que las conclusiones obtenidas previamente
siguen siendo aplicables.

-20-
Se define la altura objetivo utilizando una rampa durante los primeros 5s, y luego se mantiene
constante en el valor de referencia deseado, el cual se fija en 3m, como se hizo en los ensayos
previos. Se adoptan como polos del sistema los siguientes valores:

(Ec.
. III.18)

La evolución de la altura del vehículo puede observarse en la Figura III.15. Como puede verse,
se presenta un ​offset de aproximadamente 0.2m y no se produce ​overshoot​, lo cual es una
mejora significativa respecto de los resultados obtenidos en la sección anterior.

Figura III.15

Supóngase ahora que se utilizan polos aún más rápidos. Eligiendo

(Ec.
, III.19)

se obtiene la evolución de la altura del vehículo que puede observarse en la Figura III.16. Como
puede verse, el ​offset obtenido es de aproximadamente 0.05m. Por lo tanto, se obtuvo un mejor
resultado que en la prueba anterior.

-21-
Figura III.16

Sin embargo, el proceso de incrementar sucesivamente la magnitud de los polos no puede


extenderse indefinidamente. Si los polos son demasiado rápidos, se produce ​overshoot en el
punto de finalización de la rampa, y el intento de compensar esa desviación, debido a la gran
ganancia del controlador, produce la divergencia del sistema. Esto puede verse en la Figura
III.17, donde se muestra la evolución de la altura del vehículo hasta los 0.2s posteriores a la
finalización de la rampa. En la Figura III.18 se presentan las velocidades de los rotores, donde
pueden verse las grandes magnitudes de las acciones de control. Los resultados obtenidos
corresponden a la adopción del conjunto de polos
(Ec.
III.20)

Figura III.17

-22-
Figura III.18

8.2 Utilización de un integrador 


Como ya se dijo, el enfoque anterior presenta algunas dificultades. Lo que se propone en este
apartado es ampliar el modelo de la planta, añadiendo una nueva variable de estado al
sistema, , cuya ecuación en espacio de estados se define como

(Ec. III.21)
,

siendo la altura objetivo. Integrando esta expresión, se tiene

(Ec. III.22)
,
lo cual deja en evidencia la razón de la denominación “integrador”. La función de la variable de
estado , entonces, consiste en acumular la diferencia entre la altura del vehículo y la altura
deseada.

En la Sección 6 se mostró que el método de retroalimentación de estados asegura, al menos


para la planta lineal, la convergencia del sistema a un estado estacionario. Como el estado

-23-
estacionario del sistema ampliado con el integrador implica , se tiene entonces, por la
Ec. III.21, que la altura del vehículo debe converger a , tal como se desea.

Al utilizar el método de posicionamiento de polos, se necesita ahora elegir 13 autovalores


(puesto que el sistema fue ampliado y tiene un estado adicional). Tomando por ejemplo

, (Ec. III.23)

la respuesta en la altura del vehículo corresponde a la que se observa en la Figura III.19.a. En


la Figura III.19.b, además, puede verse la evolución temporal de la nueva variable de estado .

a) b)

Figura III.19
Como puede verse en la Figura III.19.a, ya no se produce ​offset en absoluto. Además, en la
Figura III.19.b puede observarse que, tal como se había previsto, la nueva variable de estado
también converge a un valor estable.

8.3 Utilización de un integrador y referencia incremental 


En este apartado se combinan los dos enfoques anteriores. Es decir, se incorpora la variable
de estado , descripta por la Ec. III.21, y se define la altura de referencia en forma incremental.
Al igual que antes, se utiliza como referencia una rampa durante los primeros 5s, que luego se
mantiene constante en el valor de la altura objetivo.

Si se definen los polos del sistema de igual forma que en el apartado anterior (Ec. III.23), la
evolución de la altitud del vehículo es la que se muestra en la Figura III.20.

-24-
Figura III.20

Como puede observarse en la Figura III.20, el cuadricóptero asciende a la altura deseada y no


presenta ​offset en su estado estacionario. Sin embargo, el vehículo cae 0.5m al inicio de la
simulación. Este tipo de respuesta inicial, en sentido contrario al deseado, se conoce en la
literatura como ​respuesta inversa​. En el problema bajo análisis, puede explicarse sin dificultad
la razón de este fenómeno. En la Ec. III.22, en el apartado anterior, se definió

lo cual implica que . Por lo tanto, al comienzo el integrador no tiene influencia en el


sistema. Como la altura de referencia inicial es igual a la altura inicial del vehículo, es decir 0m,
y como ya se vio que sin el efecto del integrador el sistema presenta un cierto ​offset​, es natural
que inicialmente el controlador actúe disminuyendo la altura. A medida que el tiempo
transcurre, el integrador gana fuerza, por lo que la altura converge al valor deseado.

Si la respuesta inversa inicial se considera inaceptable, puede procederse de dos formas


alternativas para eliminarla. La primer forma consiste en otorgarle al sistema un tiempo inicial
para estabilizar sus variables, manteniendo como referencia al estado inicial de la planta. En la
literatura, este periodo se conoce como tiempo de ​start-up,​ y se considera aceptable que el
sistema presente un comportamiento normalmente indeseable durante ese tiempo, siempre
que, finalizado este período, se obtenga la respuesta deseada.

Supóngase que se define dicho tiempo como 4.5s. Es decir, que durante los primeros 4.5s la
altura de referencia se define igual a la altura inicial, y al cabo de este tiempo comienza la
rampa de ascenso. Si se utiliza nuevamente el conjunto de polos definido en la Ec. III.23, se
obtiene como resultado la evolución de la altura del cuadricóptero que se observa en la Figura

-25-
III.21. Como puede verse, a partir del momento en que comienza la rampa de ascenso, el
vehículo se eleva de la manera deseada.

Figura III.21

Otra forma de abordar el problema de la respuesta inversa inicial es redefiniendo la variable de


estado del integrador como

(Ec. III.24)
,

de forma que ahora . Nótese que la ecuación en espacio de estados de (Ec. III.21)
no resulta alterada por esta modificación. Si se define el vector

(Ec. III.25)

como los estados del sistema ampliado y como los estados de referencia del sistema
ampliado, entonces es suficiente con elegir el valor de de forma tal que la acción de control
inicial del sistema, es decir, , sea aproximadamente igual al valor de .
Si esto se logra, la velocidad inicial de los rotores mantendrá al sistema en equilibrio, por lo que
el vehículo no experimentará el descenso inicial propio de la respuesta inversa.

Para ello, se plantea . Como tiene dimensión y


tiene dimensión , resulta conveniente escribir el producto en forma de
bloques [4], como

-26-
,

donde tiene dimensión y tiene dimensión . Se tiene entonces

es decir,

Debe notarse que la igualdad entre el miembro izquierdo y el derecho en general no es posible,
dado que para ello el valor de la incógnita tendría que satisfacer simultáneamente cuatro
ecuaciones. En consecuencia, debe utilizarse algún criterio de optimización. Optando por el
método de mínimos cuadrados [6] y suponiendo que la pseudoiversa [4] existe, se
obtiene

. (Ec. III.26)

Utilizando los polos del sistema a lazo cerrado definidos en la Ec. III.23, se obtienen los
resultados presentados en la Figura III.22, donde se observa la evolución de la altura del
vehículo, y en la Figura III.23, donde pueden verse las velocidades de sus rotores. Como puede
observarse en la Figura III.22, se ha logrado eliminar la respuesta inversa inicial sin necesidad
de esperar el tiempo de ​start-up​. Se opta entonces por continuar utilizando este procedimiento,
puesto que es más eficiente que el primer enfoque en términos computacionales, además de
resultar matemáticamente más elegante.

Figura III.22

-27-
Figura III.23

9. Regulador cuadrático lineal 

Los métodos utilizados hasta este punto presentan una debilidad evidente: la elección de los
polos. El método de posicionamiento de polos permite simplemente que los polos del sistema a
lazo cerrado se ubiquen en los lugares deseados, pero no hace ninguna mención respecto de
cómo elegir estos polos. Para sistemas pequeños, gobernados por una o dos ecuaciones
diferenciales de primer orden, esto es aceptable, ya que se conoce claramente [1] el efecto de
los polos en el comportamiento del sistema. Sin embargo, para sistemas complejos como el
que compete a este trabajo, descripto por 12 ecuaciones diferenciales de primer orden, es
prácticamente imposible analizar de forma sistemática la influencia de cada polo sobre el
controlador resultante. Pueden realizarse observaciones generales (por ejemplo, se vio
anteriormente que si el conjunto de polos tiene mayor magnitud, el sistema responde con
mayor velocidad), pero analizar cuestiones específicas presenta una dificultad muy elevada.
Por otro lado, este método no responde a ningún criterio de optimalidad, por lo que no se tienen
garantías de que el sistema obtenido sea óptimo en algún sentido.

Puesto que se desea continuar utilizando el método de retroalimentación de estados, sería


deseable contar con un enfoque que permita definir parámetros más concretos para el sistema,
de forma que no sea necesario elegir los polos del mismo. Además, se querría tener la

-28-
seguridad de que el sistema obtenido cumple con algún criterio de optimalidad. El regulador
cuadrático lineal (LQR, de ​Linear Quadratic Regulator)​ , perteneciente al área del Control
Óptimo (incluido a su vez en el campo de la Teoría de Control Moderna) cumple precisamente
ambos objetivos. Existen varios tipos de control LQR, entre los que se destaca el control LQR
con horizonte temporal infinito, cuyo uso es muy frecuente en la práctica. Éste el método que
se opta por utilizar aquí. [7] [8]

El control LQR con horizonte temporal infinito busca hallar la matriz que minimiza un cierto
índice de costo o desempeño. Para el caso de un sistema lineal continuo, cuya ecuación de
estados esté dada por , el índice de costo se define como

(Ec. III.27)
,
donde es una matriz semidefinida positiva hermitiana (o real simétrica) y ​R una matriz
definida positiva hermitiana (o real simétrica). Asimismo, para el caso de un sistema lineal
discreto, cuya dinámica se halle descripta por la ecuación , el índice
de desempeño se define como

(Ec. III.28)
,

donde las matrices y deben cumplir los requisitos ya mencionados [9]. Puesto que en
este proyecto se trabaja con el sistema lineal discretizado, se utiliza el segundo índice de
desempeño (Ec. III.28). Existen algoritmos que, dadas las matrices y​ , permiten obtener
la matriz . En el presente trabajo se ha utilizado la implementación integrada en ​MATLAB​.

En primera instancia, podría pensarse que este enfoque no presenta ventajas sobre lo visto
anteriormente: en las secciones pasadas debían definirse arbitrariamente los polos del sistema,
mientras que ahora deben definirse arbitrariamente las matrices y . Sin embargo, este
método es superior en dos cuestiones fundamentales. En primer lugar, la influencia de los
coeficiente individuales de las matrices y es mucho más clara que el efecto de cada polo
del sistema. Por ejemplo, supóngase que se desea que el controlador otorgue más peso a los
errores en el ángulo de ​roll que a los errores en el ángulo de ​pitch​. Para ello, basta
simplemente con que el elemento ​sea mayor que el elemento . Por otro lado,
supóngase que se prefiere que las acciones de control sean poco agresivas, con el propósito
de ahorrar energía. Esto puede lograrse definiendo valores suficientemente elevados para los
elementos de la matriz . Utilizando la técnica de posicionamiento de polos sería muy difícil,
sino imposible, lograr de forma sistemática que el controlador presente este tipo de
características. La otra ventaja importante que presenta el método de LQR es que, puesto que
para hallar la matriz se resuelve un problema de minimización, ahora sí es posible afirmar

-29-
que el controlador final es óptimo en un cierto sentido, determinado por el índice de desempeño
en función de las matrices y​ elegidas. Debe notarse que este método puede combinarse
sin dificultades con el uso de integradores, puesto que, como se vio anteriormente, éstos
simplemente se definen como estados adicionales que se incorporan al sistema.

Se procede a aplicar el método de LQR al problema en estudio, manteniendo el integrador


definido anteriormente (Ec. III.24) y definiendo la altura de referencia de la misma forma que en
las pruebas anteriores. Para las matrices y , se elige:

,
(Ec. III.29)
,

donde denota la matriz diagonal cuyos elementos se listan en cada caso. En la Figura
III.24 se presenta la evolución resultante de la altura del vehículo, y en la Figura III.25 pueden
verse las velocidades de sus rotores.

Si se compara la Figura III.22 con la Figura III.24, puede observarse que los resultados
obtenidos en ambas pruebas son similares, mostrando sólo una leve mejoría en el segundo
caso. Debe destacarse, sin embargo, que para alcanzar el primer resultado se siguió un largo
proceso de prueba y error, manipulando los valores de los polos sin seguir un procedimiento
claro. Aquí, en cambio, bastó con seguir el simple criterio de pesar todos los estados de la
misma forma y de otorgar al integrador un peso especialmente alto.

Figura III.24

-30-
Figura III.25

10. Observadores de estados 

En los métodos analizados hasta este punto, se ha supuesto que todos los estados del sistema
se hallan disponibles para ser utilizados en la retroalimentación. Es decir, que se supuso que
se poseen mediciones exactas de todos los estados del sistema. En la práctica, esta hipótesis
suele no ser válida. Es muy común que sólo se disponga de mediciones de las salidas del
sistema, , y que a partir de éstas deban estimarse de algún modo los estados del mismo. Un
método que permita obtener aproximaciones de los estados de un sistema a partir de
mediciones de sus salidas se denomina ​observador de estados​.

El ​orden de un observador de estados se define como el número de estados estimados por


el mismo. Se distinguen en general dos tipos de observadores de estados: los ​observadores
de orden máximo y los ​observadores de orden reducido​. Los observadores de orden
máximo son aquéllos que estiman todos los estados del sistema de forma directa, es decir,
aquéllos cuyo orden coincide con el de la planta. Para el problema en estudio, un observador
de orden máximo estimaría los 12 estados del sistema (o 13, si se incorpora además el
integrador). Los observadores de orden reducido, por otra parte, son aquéllos que no estiman
todos los estados del sistema. Suponiendo una relación lineal entre los estados del sistema
y sus salidas, la ecuación algebraica puede utilizarse para, conociendo al menos

-31-
estados, obtener los estados desconocidos. En particular, un observador de orden
reducido que estime sólo estados y utilice la ecuación de salida para obtener los
restantes estados se conoce como un ​observador de orden mínimo​. En el sistema en
estudio, un observador de orden mínimo estimaría en primera instancia 6 estados, y obtendría
los otros 6 (o 7, si se utiliza el integrador) utilizando la ecuación de salida.

Los observadores de orden máximo y mínimo presentan diferentes características


frecuenciales [1]. En particular, los observadores de orden mínimo dan lugar a un mayor ancho
de banda, por lo que los observadores de orden máximo funcionan mejor en presencia de
perturbaciones o errores de medición. Por otro lado, utilizando observadores de orden mínimo
se obtienen, como cabría esperarse, sistemas de menor orden. Cuando se trabaja con circuitos
analógicos, un sistema de mayor orden implica un mayor costo. Sin embargo, esto no
representa una preocupación al trabajar con controladores digitales. En consecuencia, se opta
por utilizar en el presente trabajo un observador de orden máximo.

Cuando se diseña un observador, se supone para el mismo un modelo similar al de la planta,


adicionando además un término de corrección. Aquí se continúa trabajando con el modelo de la
planta lineal discretizada, cuya representación en espacio de estados se obtuvo en la Ec. III.10.

Si se llama a los estados estimados, el modelo del observador se define entonces como

. (Ec. III.30)

Nótese que es la salida estimada del sistema correspondiente a los estados


estimados . Por lo tanto, el término afecta a la estimación siguiente
en función del error cometido en la salida según la estimación actual.

Definiendo , se tiene

de donde

. (Ec. III.31)

Puesto que se desea que , de forma que los estados estimados mediante el
observador converjan a los estados reales, puede procederse de la misma forma que en el
ańalisis realizado en la Sección 6 para el controlador por retroalimentación, obteniendo así que
los autovalores de la matriz deben hallarse dentro del círculo unitario del plano
complejo. Estos autovalores son los polos del observador [1].

-32-
Es deseable, por lo tanto, saber si, dado un conjunto arbitrario de polos, puede hallarse la
matriz de forma que los autovalores de la matriz se ubiquen en las
posiciones deseadas. Para esto, debe analizarse en primer lugar el concepto de
observabilidad​. Se dice que un sistema lineal discreto es observable si cualquier vector de
estados, , puede determinarse mediante la observación de un número finito de salidas ,
, …, . Es decir, que un sistema es observable si un cambio en cualquiera de los
estados eventualmente se refleja en la alteración de su salida. Una condición necesaria y
suficiente para que un sistema lineal discreto, cuya ecuación de estados esté dada por
y su ecuación de salida por , sea observable, es que el rango de
su matriz de observabilidad sea igual al número de estados del sistema. La matriz de
observabilidad se define como:

Se ha demostrado en [1] que una condición suficiente y necesaria para que sea posible hallar
la matriz de manera que los polos del observador puedan definirse arbitrariamente es que el
sistema sea observable. Para la discretización del sistema linealizado en estudio, dada por

esta condición se aplica igualmente. El término debido a las entradas, , así como el
vector constante , no alteran la observabilidad del sistema. Así como se procedió para
evaluar la controlabilidad del sistema en la Sección 6, la condición de observabilidad fue
verificada mediante numerosas pruebas, utilizando diferentes puntos estacionarios en la
linealización del sistema. Si bien no se ha demostrado rigurosamente que toda linealización del
sistema cumple esta condición, todas las pruebas realizadas han dado lugar a sistemas
observables.

La similaridad entre los conceptos de observabilidad y controlabilidad, así como entre las
condiciones necesarias y suficientes para garantizarlos, no es fortuita. La misma se debe al
hecho de que la controlabilidad y la observabilidad son problemas duales. Para ver esto,
considérense dos sistemas; el primero, descripto por

-33-
(Ec. III.32)
,

y el segundo por

(Ec. III.33)
,

donde el operador * representa la transpuesta conjugada de las respectivas matrices. Si se


plantea la condición de controlabilidad para el primer sistema, puede verse que coincide con la
condición de observabilidad para el segundo. De la misma manera, si se plantea la condición
de observabilidad para el primer sistema, puede verse que coincide con la condición de
controlabilidad para el segundo. Se dice por ello que estos sistemas son duales. Esta dualidad
pone de manifiesto la estrecha relación entre los conceptos de controlabilidad y observabilidad.

El método de retroalimentación de estados aplicado anteriormente puede modificarse de


manera tal que se utilicen los estados observados del sistema. La acción de control, entonces,
se define ahora por

. (Ec. III.34)

En la Figura III.26 se presenta un diagrama de bloques del sistema completo, donde se ha


destacado con línea de puntos al observador de orden máximo.

Figura III.26

-34-
Resulta de interés evaluar los polos del sistema completo resultante. La ecuación característica
del sistema a lazo cerrado, como se indica en [1], viene dada por

. (Ec. III.35)

Las soluciones de la ecuación anterior, como puede verse, están dadas por las soluciones de

, (Ec. III.36)

correspondientes a los polos del controlador obtenido por el método de retroalimentación de


estados; y las soluciones de

, (Ec. III.37)

correspondientes a los polos del observador. Esto pone de manifiesto que el controlador y el
observador pueden diseñarse de manera independiente, dando lugar a un sistema cuyos polos
a lazo cerrado vienen dados por los polos de cada subsistema individual. Por ende, si tanto el
controlador como el observador se diseñan mediante los métodos vistos, se tiene garantizada
la estabilidad del sistema a lazo cerrado resultante, ya que se tiene la seguridad de que todos
sus polos se ubican dentro del círculo unitario en el plano complejo. En la práctica, sin
embargo, la estabilidad del sistema a lazo cerrado no suele ser suficiente, sino que es
necesario analizar también la estabilidad del sistema a lazo abierto compuesto por el
observador y el controlador, sin incluir la planta. Se suele denominar a este subsistema como
“observador-controlador”. La entrada del observador-controlador es , es decir, la salida de la
planta, y su salida es , a saber, la entrada de la planta. Para analizar este subsistema,
deben combinarse las ecuaciones correspondientes al observador

y al controlador,

dando como resultado

. (Ec. III.38)

Utilizando la Transformada Z, se obtiene que los polos de la función de transferencia


que relaciona con , es decir, , vienen dados por los autovalores de la
matriz . Debe notarse que, aún cuando los polos del controlador y del
observador, independientemente, estén dentro del círculo unitario (y por lo tanto, como se dijo,
se tenga un sistema a lazo cerrado estable), es posible que los autovalores de la matriz

-35-
estén fuera del círculo unitario. Tener un observador-controlador
inestable a lazo abierto constituye un problema, ya que puede dar lugar a varios inconvenientes
prácticos (por ejemplo, el sistema podría volverse condicionalmente estable [1]), por lo que no
se considera aceptable. En consecuencia, a pesar de que el controlador y el observador
pueden diseñarse de forma independiente, constituye una buena práctica el verificar luego que
los polos del sistema a lazo abierto del observador-controlador también sean estables.

Retomando el problema del diseño del observador de orden máximo, que, como se vio, se
reduce a la elección de los autovalores de la matriz , se analiza ahora la forma
en la que puede buscarse la matriz . En [1] se demuestra que el problema de hallar la matriz
que permite obtener un observador de orden máximo con un conjunto de polos dado, para el
sistema definido por la Ec. III.32, es equivalente al problema de hallar la matriz tal que,
utilizando control por retroalimentación de estados, el controlador para su sistema dual definido
por la Ec. III.33 presente el mismo conjunto de polos, donde la relación entre y viene
dada por . Como se dijo en la Sección 6, existen algoritmos que permiten resolver el
problema de posicionamiento de polos y obtener la matriz . Luego, los mismos algoritmos
pueden ser utilizados para hallar la matriz requerida en el observador de orden máximo.

En general, los polos del observador suelen elegirse de forma que sean entre dos y cinco
veces más rápidos que los polos del controlador. De esta manera, se logra que los errores de
observación converjan a cero lo suficientemente rápido para que el controlador produzca los
resultados deseados. Sin embargo, cuanto mayor sea la magnitud de los polos, mayor es el
ancho de banda del sistema resultante; y un mayor ancho de banda implica mayor sensibilidad
a las perturbaciones, externas e internas. Cuando las mediciones con las que se trabaja están
afectadas por perturbaciones, como ser ruido de sensores, entonces puede ser conveniente
que los polos del observador sean más lentos. En la práctica, por lo tanto, la elección de los
polos de la matriz se reduce a un compromiso entre la velocidad de la respuesta
y la sensibilidad a las perturbaciones [1].

Como se desea continuar trabajando con un integrador en la variable de altura, debe definirse
si esta variable de estado afecta a la salida del sistema, ya que esto es relevante en el diseño
del observador. Puesto que el integrador no es una variable física sujeta a un proceso de
medición, sino que se calcula internamente en el controlador a partir de las mediciones de la
variable de altura, puede considerarse sin dificultad como una salida adicional del sistema.
Dado que tener una salida adicional permite obtener mejores resultados por parte del
observador, se elige redefinir la matriz como

-36-
(Ec. III.39)

De esta forma, se tiene una nueva ecuación de salida, dada por , donde es el
vector de estados ampliado definido en la Ec. III.25. Asimismo, debe modificarse la
inicialización del integrador: en la Ec. III.26, la misma se realizaba en función de los estados
iniciales del sistema, ; ahora debe realizarse en función de las estimaciones iniciales, .
Por lo tanto, se define

. (Ec. III.40)

Supóngase que se continúa trabajando con el sistema como se hizo en la sección anterior. Es
decir, que se utiliza el método de LQR para hallar la matriz para la retroalimentación de
estados, con las matrices y como fueron definidas en la Ec. III.29. Se repite la prueba
realizada anteriormente: se desea que, siguiendo una rampa inicial de 5s de duración, el
cuadricóptero alcance los 3m de altura, partiendo de una altitud inicial de 0m. Definiendo los
polos del observador como

, (Ec. III.41)
se obtienen los resultados presentados a continuación. En la Figura III.27.a puede observarse
la evolución de la altura del cuadricóptero, donde puede verse cómo la altura estimada por el
observador corresponde con precisión a la altura real del vehículo. En la Figura III.27.b se
muestra en detalle la evolución de la diferencia entre la altura real y la altura observada. Como
puede verse, estos errores son muy pequeños, y se presentan con mayor magnitud en los
puntos en los que se producen los principales cambios (es decir, al inicio y al final de la rampa
de referencia).

a) b)

-37-
Figura III.27
Los polos del observador-controlador a lazo abierto resultante vienen dados por:
, , , ,
, , , , ,
, , y . Puesto que todos estos polos se hallan dentro del
círculo unitario en el plano complejo, el observador-controlador a lazo abierto es estable.

En la Sección 5 se dijo que el efecto del contra-torque de ​yaw presentaba dificultades, y que no
sería tenido en cuenta en las pruebas subsiguientes. Se procede ahora a abordar este
problema. En primer lugar, se analiza cuál es el conflicto generado por este fenómeno.
Supóngase que se continúan utilizando las matrices y como fueron definidas en la Ec.
III.29 y que se realiza el control utilizando la retroalimentación de los estados exactos, es decir,
sin utilizar un observador. Incluyendo al contra-torque de ​yaw en las simulaciones, se obtiene el
resultado presentado en las Figuras III.28 y III.29. Como puede verse, el controlador logra
estabilizar la altura del vehículo (Figura III.28.a) y su ángulo de ​yaw (Figura III.28.b). Sin
embargo, la velocidad de ​yaw (​ Figura III.28.c) presenta un comportamiento oscilante, así como
las velocidades de los rotores (Figura III.29.a-d). Esto se explica por el hecho de que el
contra-torque de ​yaw introduce rápidas variaciones en la velocidad de ​yaw​, y el controlador, al
intentar compensarlas, debe variar aún más rápidamente las velocidades de los rotores, lo cual,
a su vez, amplifica el impacto de este torque. Este efecto se potencia hasta llegar al punto en
que en cada instante de discretización se alterna entre que los rotores 1 y 3 se apaguen y los
rotores 0 y 2 tomen una velocidad que permita mantener estable la altura del vehículo, y que
ocurra lo contrario. Como se vio en el capítulo anterior, los rotores 0 y 2 giran ambos en sentido
antihorario, y los rotores 1 y 3 giran en sentido horario. Por lo tanto, el controlador está
alternando entre generar grandes torques de ​yaw en direcciones opuestas. Este
comportamiento no sólo no es deseable, sino que es poco realista, puesto que, en la práctica,
sería imposible que las velocidades de los rotores cambien con tal celeridad. En la Figura

-38-
III.29.e se presenta una porción de la evolución de la velocidad de un rotor, donde puede
apreciarse claramente el comportamiento oscilatorio mencionado.

a) b) c)

Figura III.28

a) b) c)

d) e)

Figura III.29
Supóngase que se repite la prueba anterior, pero utilizando ahora un observador de orden
máximo, con los mismos polos definidos en la Ec. III.41. Los resultados de la simulación
pueden verse en las Figuras III.30 y III.31. Como se observa en la Figura III.30, el vehículo
exhibe el comportamiento deseado. Puesto que los ejes de ordenadas de las Figuras III.30.b y
III.30.c se hallan escalados por un factor de , las variaciones en ​yaw y en su velocidad
-39-
son despreciables. Además, como puede verse en la Figura III.31, las velocidades de los
rotores no exhiben las oscilaciones presentadas en el caso anterior.

a) b) c)

Figura III.30

Figura III.31

La prueba realizada pone en relieve un beneficio adicional de los observadores: éstos actúan
como un filtro pasa bajos sobre las mediciones de los estados del sistema, por lo que los
efectos demasiado rápidos, como es en este caso el contra-torque de ​yaw​, no afectan el
desempeño del controlador. Esto puede observarse en la Figura III.30.c, donde a pesar de que
la velocidad de ​yaw varía rápidamente (aunque con magnitudes despreciables), el valor
observado de esta variable exhibe un comportamiento mucho más estable. Esta característica
de los observadores se manifiesta en mayor medida cuando se utilizan, como en este trabajo,
observadores de orden máximo. Esto se debe a que, como se dijo anteriormente, estos
observadores presentan menor ancho de banda que los observadores de orden mínimo, por lo
que el efecto de filtrado es mayor.

Debe mencionarse que el uso de observadores no es la única forma de lograr que el sistema
se desempeñe adecuadamente aún ante la presencia del contra-torque de ​yaw.​ Otra forma de
resolver el problema consiste en definir de forma más cuidadosa la matriz de peso .
Supóngase que esta matriz se define como

. (Ec. III.42)

-40-
En primer lugar, nótese que se ha conservado el peso otorgado al integrador, de forma que
posee más relevancia que el resto de los estados. Para los ángulos de navegación se ha
definido un peso relativamente pequeño, especialmente para y , puesto que las funciones
en las que intervienen en el modelo real de la planta son altamente no lineales, por lo que su
aproximación lineal, en la cual se basa el controlador, resulta poco confiable. Para las variables
de posición, por otro lado, se otorga un peso mayor, puesto que no presentan este problema.
Además, se ha definido un peso pequeño para las velocidades lineales y rotacionales, ya que
éstas pueden variar rápidamente, lo cual puede dar lugar a problemas como el que se presentó
previamente debido al contra-torque de ​yaw.​

Utilizando la matriz definida en la Ec. III.42 y la matriz empleada anteriormente (Ec.


III.29), el desempeño del controlador basado en la retroalimentación de los estados exactos es
satisfactorio. En particular, los cuatro rotores convergen a una velocidad estable, a diferencia
de lo ocurrido previamente, presentado en la Figura III.29.

En lo que resta del capítulo, se continúa utilizando un observador-controlador basado en control


LQR, empleando la matriz definida en la Ec. III.42 y la matriz que se definió en la Ec.
III.29. Como los polos del observador se continúa adoptando el conjunto definido en la Ec.
III.41. Además, en todas las simulaciones restantes se incluye dentro del modelo de la planta al
efecto del contra-torque de ​yaw.​

Para finalizar esta sección, debe notarse que en las pruebas anteriores se supuso que los
estados observados iniciales, , coincidían con los estados iniciales reales . En la
práctica, sin embargo, esta hipótesis no siempre es válida. Supóngase por ejemplo que se tiene

como estimación inicial , pero que los estados iniciales

en realidad son . Por lo tanto, las estimaciones


iniciales de , y no coinciden con sus valores reales. Repitiendo la misma prueba que
se ha venido realizando hasta aquí, pero utilizando los valores iniciales mencionados, se
obtienen los resultados que se observan en la Figura III.32. Como puede verse en las Figuras
III.32.a-c, las observaciones convergen rápidamente a los valores exactos, y el vehículo
presenta un comportamiento satisfactorio. En la Figura III.32.d se muestra la evolución de los
errores de observación, donde puede verse que estos convergen a 0. Como puede notarse en
la Figura III.32.b, la altura del vehículo no se ajusta tan precisamente como en los casos
anteriores a la rampa de referencia. Si este comportamiento no se considera aceptable, basta
con utilizar el concepto de tiempo de ​start-up del sistema analizado en el apartado 8.3. Es decir
que antes de ingresar la rampa incremental como referencia, se puede permitir que el sistema
evolucione por un tiempo determinado (por ejemplo, 5s) manteniendo sus referencias nulas, de
forma que los estados observados se aproximen suficientemente a sus valores reales antes de
comenzar el ascenso.

a) b)

-41-
c) d)

Figura III.32

En las simulaciones realizadas en el resto del proyecto se considera siempre que las
estimaciones iniciales son exactas, pero, como se ha visto, el sistema puede desempeñarse
adecuadamente aún cuando . Además, se continúa utilizando el
observador-controlador diseñado en esta sección, que se menciona en adelante sólo como
“controlador” o “sistema de control”.

11. Desempeño frente a perturbaciones 

Con el objetivo de poner a prueba la robustez del sistema desarrollado, se desea evaluar el
comportamiento del mismo en presencia de perturbaciones. Para ello, se consideran dos tipos
de fuerzas externas que actúan sobre el cuadricóptero. En primer lugar, se define un conjunto
de cuatro fuerzas, , , y . Cada una de ellas es ejercida sobre un rotor
del vehículo, denotado por su subíndice, en la dirección vertical del marco de referencia inercial

-42-
. Esto se ilustra en la Figura III.33.a, donde se muestra una fuerza de módulo 0.5N
actuando sobre el primer rotor del cuadricóptero. Como elemento de comparación, téngase
presente que, en estado estacionario (y en ausencia de perturbaciones), cada rotor produce
una fuerza de empuje de aproximadamente 2.45N. Por lo tanto, el módulo de la fuerza externa
mencionada equivale a más del 20% del de la fuerza de estado estacionario producida por
cada rotor. En segundo lugar, con el propósito de simular la acción del viento sobre el vehículo,
y bajo la simplificación de suponer que éste actúa uniformemente sobre el mismo, se considera
una fuerza que actúa sobre el centro de masa del cuadricóptero, sin estar limitada a una
dirección particular. Esto se observa en la Figura III.33.b, donde se presenta una fuerza
ejercida sobre el centro de masa del vehículo.

a) b)

Figura III.33
En las simulaciones realizadas hasta este punto, la dinámica de la planta ha sido descripta por
la ecuación de estados , donde fue definida en la Ec. III.1. Debe
calcularse ahora una función que considere la influencia de las fuerzas externas
mencionadas, de manera que la dinámica de la planta se describa ahora por .
Analizando las fuerzas y torques ejercidos sobre el vehículo de forma similar a como se
procedió en el capítulo anterior, puede obtenerse la función como

donde

-43-
y

donde es la matriz de cambio de coordenadas del marco de referencia del


vehículo al marco de referencia final definida en la Ec. II.4, y siendo la posición
del i-ésimo rotor, medido desde el centro de masa del vehículo, en el marco .

En la Figura III.34 se presenta un diagrama de bloques del sistema completo, donde se


muestra cómo la planta es afectada por las fuerzas externas definidas. Debe destacarse que en
las pruebas realizadas se empleó exactamente el mismo controlador diseñado en la sección
anterior. En otras palabras, mientras que las fuerzas externas son utilizadas en la simulación de
la planta por medio de la función , éstas no fueron incluidas en el modelo utilizado
para obtener el controlador y el observador, por lo que el sistema de control no posee
información de ningún tipo sobre la dinámica de estas fuerzas. Por lo tanto, las fuerzas
externas descriptas actúan verdaderamente como perturbaciones al sistema.

Figura III.34

Supóngase que se desea realizar la misma maniobra ejecutada en las simulaciones anteriores,
pero que sobre el cuadricóptero actúan las fuerzas externas que se observan en la Figura
III.35, donde no se ha incluido la presencia de viento. Como puede verse, el vehículo es
perturbado, en primer lugar, durante su ascenso (en t=1s), y posteriormente es vuelto a
perturbar una vez que el sistema se halla ya estabilizado (en t=12s). La evolución de la altura
del cuadricóptero puede verse en la Figura III.36, donde se observa que el sistema exhibe un
comportamiento satisfactorio a pesar de las perturbaciones, y que el vehículo se estabiliza
finalmente en la altura deseada.

-44-
Figura III.35

Figura III.36
Supóngase ahora que se desea repetir la maniobra, pero que en este caso los rotores del
vehículo se encuentran perturbados por fuerzas estocásticas con una distribución normal de
media 0 y desviación estándar 0.05, como las que se observan en la Figura III.37. Nuevamente,
no se ha incluido la presencia del viento en el ensayo. Los resultados de la simulación pueden
observarse en la Figura III.38, correspondiente a la evolución de la altura del cuadricóptero, y
en la Figura III.39, donde se grafican las velocidades de sus rotores. Como puede verse, si bien
el sistema no alcanza un estado estacionario (lo cual es esperable dada la naturaleza de las

-45-
perturbaciones externas), el vehículo logra mantenerse alrededor de la altura de referencia
deseada.

Figura III.37

Figura III.38

-46-
Figura III.39

Supóngase que se repite nuevamente la maniobra, pero que ahora se incluye la acción de la
fuerza del viento , cuyas componentes pueden observarse en la Figura III.40. Los rotores
del vehículo, asimismo, se hallan perturbados por las fuerzas presentadas en la Figura III.41. El
resultado de esta prueba puede observarse en la Figura III.42, donde se muestra la evolución
de la posición del vehículo, y en la Figura III.43, donde pueden verse las velocidades de sus
rotores. Como puede notarse en la Figura III.42.c, el vehículo alcanza la altura deseada y logra
mantenerse estable en ella, a pesar de que las fuerzas externas permanecen actuando sobre
sus rotores hasta el final de la simulación. Además, en la Figura III.43 puede verse que la
velocidad de los rotores una vez que el sistema se ha estabilizado es superior a la resultante en
todos los ensayos realizados anteriormente. Esto es esperable, puesto que los rotores deben
girar a mayor velocidad para compensar la acción de la perturbación presente. También es
interesante observar, en la Figura III.42.c, el hecho de que se presenta ​offset entre la altura
final real del vehículo y la correspondiente altura estimada por el observador. Esto se debe a
que, debido a las perturbaciones, el modelo del observador no refleja con precisión al modelo
real. Sin embargo, debe destacarse que a pesar del ​offset mencionado, la altura real del
vehículo alcanza el valor de referencia deseado.

-47-
Figura III.40

Figura III.41

a) b) c)

Figura III.42

-48-
Figura III.43

Como puede verse en estos ejemplos, y como se comprobó en otras numerosas pruebas, el
sistema desarrollado es suficientemente robusto como para tolerar perturbaciones externas de
cierta magnitud. Debe aclararse, sin embargo, que el sistema podría exhibir un comportamiento
divergente si las perturbaciones consideradas son demasiado grandes o si presentan cambios
de excesiva velocidad.

12. Maniobras avanzadas 

En el alcance del proyecto se estableció que sólo se intentaría controlar la altitud y los ángulos
de navegación del vehículo. Sin embargo, el controlador diseñado puede desempeñarse
satisfactoriamente para realizar muchos tipos de maniobras. En esta sección se presentan
algunos ejemplos, sin profundizar en detalles teóricos al respecto.

Supóngase que se desea que el cuadricóptero se dirija a un punto de interés y realice allí una
maniobra de aterrizaje sobre una plataforma ubicada a una altura de 2.25m, siguiendo
trayectorias de referencia definidas. Para ello, comenzando en el vehículo debe
elevarse a una altitud de 2.8m, según una rampa de 10s. Además, se quiere que cuando se
halle a mitad de dicha altura, en , el vehículo comience a trasladarse hacia el noreste,
siguiendo rampas de 7.5s, que finalizan en un punto ubicado 15m al norte y 10m al este de la
posición original. Finalmente, se desea que, comenzando en , el vehículo descienda
suavemente (más precisamente, siguiendo una curva de decaimiento exponencial), hasta la
altura de 2.25m. Los resultados de esta prueba pueden verse a continuación. En la Figura III.44
se presenta la evolución de la posición del cuadricóptero, en la Figura III.45 se muestran sus
ángulos de navegación y en la Figura III.46 se grafican las velocidades de sus rotores. Es
interesante observar en la Figura III.45 que, a pesar de que no se provee al controlador con
una referencia a seguir en los ángulos de navegación (técnicamente, la referencia es
constantemente 0), éste logra que el cuadricóptero varíe los ángulos de forma tal de poder
seguir la trayectoria deseada. Nótese además, en las Figuras III.44.a y III.44.b, el ​offset
producido en y durante el ascenso del vehículo. Si esto no se considerase aceptable,

-49-
podría resolverse ajustando los pesos de la matriz o incorporando un integrador en estas
variables.

a) b) c)

Figura III.44

Figura III.45

Figura III.46

Se considera ahora una maniobra más compleja. Supóngase que se desea que el
cuadricóptero efectúe una inspección de una torre de alta tensión. Para ello, el vehículo podría
-50-
recorrer una hélice ascendente alrededor de la torre. En primer lugar se considera el caso en el
que no se desea que el cuadricóptero varíe su ángulo de ​yaw. Si el vehículo está equipado con
una cámara, la misma debería hallarse colocada sobre un ​gimbal que rote de manera de
enfocar en todo momento hacia el centro de la hélice. Supóngase que se desea que la
inspección tenga una duración de 200s, y que durante la misma el vehículo dé ocho giros
alrededor de la torre. Utilizando como referencia para Loading..., Loading... y Loading... las
ecuaciones paramétricas de la hélice, se logran los resultados presentados en la Figura III.47,
donde se observa la evolución de la posición del vehículo. Como puede verse, el sistema logra
ejecutar la maniobra deseada satisfactoriamente.

Figura III.47

Supóngase que ahora se desea repetir la maniobra anterior, con los mismos parámetros, pero
variando además el ángulo de ​yaw del cuadricóptero. Es decir, se desea que, mientras
asciende, el vehículo “mire” en todo momento hacia la torre. De esta forma, si el cuadricóptero
está provisto de una cámara, la misma podría montarse sobre un soporte fijo, en lugar de
precisar rotar como en el caso anterior. Si se intenta realizar esta maniobra con el sistema
actual, éste diverge. Esto se evidencia en la Figura III.48, donde se muestra la evolución de la
posición y el ángulo de ​yaw del vehículo durante los primeros 15.5s de simulación, y en la
Figura III.49, donde se observan las velocidades de sus rotores durante ese intervalo.

-51-
Figura III.48

Figura III.49
Debe destacarse que se realizaron numerosas pruebas buscando que el vehículo logre realizar
esta maniobra, modificando para ello distintas variables del sistema, tales como los parámetros
del controlador y del observador o el punto de operación considerado en la linealización. En
ningún caso se logró que el sistema converja. Esto puede comprenderse si se observa que las
funciones en las que interviene el ángulo de ​yaw e​ n el modelo real de la planta (Ec. III.1) son
de tipo trigonométricas, con lo cual es esperable que la linealización represente de forma muy
poco precisa a la planta real cuando este ańgulo varía demasiado respecto del valor
considerado en el punto de operación. Si se desease obtener cotas del error debido a la
linealización, podría aplicarse el Teorema de Taylor para funciones de múltiples variables y
analizar el error de truncamiento generado [10].

Para lograr realizar esta maniobra, se opta por utilizar un enfoque alternativo: relinealizar el
sistema en cada instante de discretización, tomando como punto de operación al estado de
referencia correspondiente a ese instante. De esta manera, las matrices que intervienen en el
controlador y en el observador se recalculan en cada paso. Operando de esta forma, se
obtienen los resultados presentados a continuación. En la Figura III.50 se observa la evolución
de la posición del cuadricóptero y de su ángulo de ​yaw​, y en la Figura III.51 se muestran las
velocidades de sus rotores. Como puede verse, el sistema presenta el comportamiento
deseado. Sin embargo, su costo computacional es mucho mayor. Además, el hecho de
recalcular las matrices en cada paso implica que el desarrollo teórico expuesto a lo largo del
capítulo no es aplicable a este controlador. Un sistema de esta naturaleza requiere de un
análisis mucho más complejo que el realizado. No obstante, como se dijo al comienzo de esta
sección, no se pretendía aquí más que presentar algunas potencialidades del método de
diseño empleado, sin desarrollar el marco teórico correspondiente.

-52-
Figura III.50

Figura III.51

-53-
Referencias 
[1] Ogata K., “Modern Control Engineering”, quinta edición, Prentice Hall, 2010.

[2] Kuo B., “Sistemas de Control Automático”, séptima edición, Prentice Hall, 1996.

[3] Slotine J. y Li W., “Applied Nonlinear Control”, Prentice Hall, 1991.

[4] Noble B. y Daniel J., “Álgebra Lineal Aplicada”, tercera edición, Prentice Hall, 1989.

[5] Kautsky J., Nichols N., Van Dooren P., “Robust Pole Assignment in Linear State Feedback”,
International Journal of Control, 41, p. 1129-1155, 1985.

[6] Crassidis J. y Junkins J., “Optimal Estimation of Dynamic Systems”, CRC Press LLC, 2004.

[7] Kwakernaak H. y Sivan R., “Linear Optimal Control Systems”, primera edición,
Wiley-Interscience, 1972.

[8] Lewis F., Vrabie D. y Syrmos V., “Optimal Control”, tercera edición, John Wiley & Sons,
2012.

[9] Goodwin G., Graebe S. y Salgado M., “Control System Design”, Prentice Hall, 2000.

[10] Trench W., “Introduction to Real Analysis”, Trinity University, 2013.

-54-

You might also like