You are on page 1of 492

《现代控制理论》MOOC课程

王建全
浙江大学电气工程学院
绪论

课程简介

什么是自动控制理论

自动控制理论的两个基本主题

自动控制理论的发展

本课程的基本内容

学习本课程的目的
绪论

0.1 课程简介

《非线性系统理论》 《自适应控制》 《模糊控制》 《鲁棒控制》 《智能控制理论》 《随机控制理论》

《状态空间法》
《现代控制理论》 《最优控制理论》

《自动控制理论》 《常微分方程》 《泛函分析》


《泛函分析》 《线性代数》
绪论

0.2 自动控制理论

分析和 综合 的理论,其研究的目的
控制理论是关于自动控制系统结构、

是为了分析并改进动态系统的性能,以达到期望的要求。

建立系统的数学模型;用尽可能精确、合理的数学语言去描述
结构
动态系统。
绪论

0.2 自动控制理论

定量分析: 在特定输入下研究系统输出的运动规律;
分析
𝜎𝑝

𝑡𝑠
绪论

0.2 自动控制理论

定量分析: 在特定输入下研究系统输出的运动规律;
分析
定性分析: 能控性、能观性、稳定性;

综合 改变原有系统的运动规律,使系统满足给定的动态性能标的要求。
绪论
0.3 自动控制领域中两个基本主题

反馈控制的概念 最优控制的概念

反馈控制是利用系统的输出量与参考输入量的

偏差进行控制,能够在存在扰动的情下减少系统
的输出量与参考输入量之间的偏差。

例如: PID励磁系统
绪论
0.3 自动控制领域中两个基本主题

最优控制的概念

最优控制,就是要寻找一个容许控制,使得被控系统在满足各种约束

条件下,使给定的性能指标达到最优值。

例如:最优励磁系统
绪论
0.3 自动控制领域中两个基本主题

反馈与最优
绪论
0.3 自动控制领域中两个基本主题

反馈与最优
绪论

0.4 自动控制理论的发展

1788年 1875年 1892年


1788年
调速器装置 Routh- Hurwitz判据 稳定性理论
调速器装置

1932年 1945年 1948年


Nyquist判据 Bode图 根轨迹

 1788年J.Watt发明了蒸汽机用的离心式飞摆调速器;
 1868年J.C.Maxwell发表了“论调速器”的论文;
 1875年E.J.Routh、1895年A.Hurwitz先后提出了系统稳定性的代数判据。
绪论

0.4 自动控制理论的发展

 1892年A.M.Lyapunov在其博士论文《论运动稳定性的一般问题》中,
建立了关于稳定性理论的完整体系;

 1932年H.Nyquist提出了根据频率响应判断系统稳定性的判据;
 1945年H.W.Bode提出了基于频率响应的分析与综合方法.

 1948年W.R.Evans提出了控制系统分析与设计的根轨迹法。

☆ 1948年N.Wiener出版了专著《控制论-关于在动物和机器中控制和通讯
的科学》,系统地论述了控制理论的一般原理和方法,推广了反馈的概念,
创立了控制理论,标志着经典控制理论的诞生。
绪论

0.4 自动控制理论的发展

1948年
维纳创立《控制论》
绪论

0.4 自动控制理论的发展

1956年
1788年 1960年
1788年 1961年
1788年
动态规划法
调速器装置 状态空间法
调速器装置 极大值原理
调速器装置

1788年
现代控制理论
调速器装置
绪论

0.4 自动控制理论的发展

 1956年R.Bellman提出了寻求最优控制的动态规划法。

 1960年R.E.Kalman引入了状态空间法,提出了能控性、能观性、最优调
节器和卡尔曼滤波等概念。

 1961年Pontryagin提出了最优控制的极大值原理。
绪论

0.4 自动控制理论的发展

经  以单变量线性定常系统为主要研究对象;


制  以频域法为研究控制系统动态特性的主要方法;

论  以各种图表,如Bode图、Nyquist曲线、根轨迹等

点 为系统分析和综合的主要工具。
绪论

0.4 自动控制理论的发展

现  以多变量线性、非线性系统为主要研究对象;

控  以时域法,特别是以状态空间法为主要研究方法;
制  以现代数学为主要分析手段;

论  以计算机为主要分析和设计工具;
特  研究内容线性系统理论、非线性系统理论、最优控制、鲁棒控制
点 自适应控制、大系统理论,深度学习、智能控制等。
绪论
0.5 本课程的基本内容

1 状态空间表达式 结构

2 状态空间表达式的解 定量分析

3 控制系统的能控、能观性 定性分析

4 稳定性和李亚普诺夫方法 定性分析

5 极点配置、镇定、解耦 综合

6 最优控制 综合
第一讲 绪论

1.6 学习本课程的目的

 掌握现代控制理论的基本理论及其应用方法

 学会用数学语言描述动态系统的方法

 学会用数学工具分析改善动态系统性能的方法

 培养用数学语言解决工程问题的能力
《现代控制理论》MOOC课程

第一章 控制系统的状态空间表达式
第一章 控制系统的状态空间表达式

状态空间变量及状态空间表达式

状态空间表达式的建立

状态向量的线性变换

从状态空间表达式求传递函数

组合系统的状态空间表达式

离散系统、 时变系统和非线性系统
的状态空间表达式
第一章 控制系统的状态空间表达式

 经典控制理论: Y(s)
数学模型:传递函数 G( s ) 
U( s )

u y
G(s)
传递函数的定义

线性定常系统的传递函数是指在初始状态为零的条件下,系统输出变
量的拉氏变换与输入变量的拉氏变换之比。

𝑌(𝑠)
𝐺(𝑠) =
𝑈(𝑠)
第一章 控制系统的状态空间表达式

 经典控制理论: Y(s)
数学模型:传递函数 G( s ) 
U( s )

u y
G(s)
 现代控制理论:


u y
X

数学模型:状态空间表达式
《现代控制理论》MOOC课程

1.1 状态空间变量及状态空间表达式
1.1 状态空间变量及状态空间表达式

一 . 状态变量

足以完全表征系统运动状态的最少个数的一组变量,称为状态变量。

完全 只要给定状态变量的初值𝒙(𝒕𝟎 )以及𝒕 ≥ 𝒕𝟎 时刻的输入𝒖(𝒕),就能够完全


表征 确定系统在任何𝒕 ≥ 𝒕𝟎 时间的动态行为。

R1 L1 L2
已知:
i1 (t ) i2 (t )
 i1 (t0 ), i2 (t0 ), uc (t0 )
u(t ) uc (t ) C R2
 u (t )
1.1 状态空间变量及状态空间表达式
一 . 状态变量

体现在减少变量个数就不能够完全表征系统的动态行为,
最小性
而增加变量的个数则是完全表征系统动态行为所不需要的。

R1 L1 L2

i1 (t ) i2 (t ) i1 (t ), i2 (t ), uc (t )

u(t ) uc (t ) C R2
 i (t ) duc (t )
c ic (t )  C
dt
1.1 状态空间变量及状态空间表达式
关于状态变量的几点说明

 状态变量是相互独立的。

 对于一个实际的物理系统,状态变量个数等于系统中独立储能元件的个数。

 对同一个动态系统,状态变量的选取不是唯一的,但状态变量的个数是唯一确定的,
不能多,也不能少。

R1 L1 L2
状态变量1: i1 (t ), i2 (t ), uc (t )
i1 (t ) i2 (t )

u(t ) uc (t ) C R2
 状态变量2: i1 (t ), i2 (t ), ic (t )
1.1 状态空间变量及状态空间表达式

二 . 状态向量

由系统状态变量构成的向量,称为系统的状态向量。

若一个系统有𝒏个状态变量𝑥1 𝑡 , 𝑥2 𝑡 , ⋯ , 𝑥𝑛 𝑡 ,把这𝒏 个状态变量作为分量所构成

的向量就称为系统的状态向量。

x1 𝑡
x 𝑡 𝒙 = 𝑥1 𝑡 𝑥2 𝑡 ⋯ 𝑥𝑛 𝑡
𝒙= 2 或

𝑥𝑛 𝑡
1.1 状态空间变量及状态空间表达式

三 . 状态空间

以状态向量的每一个分量𝑥1 𝑡 , 𝑥2 𝑡 , ⋯ , 𝑥𝑛 𝑡 为坐标轴所构成的空间,称为状态空间。
x2

x(t)
x1
x3

 系统任一时刻的状态均可表示为状态空间中的一个点。

 系统状态随时间变化的过程,在状态空间中描绘出一条轨迹,称为状态轨迹。
1.1 状态空间变量及状态空间表达式

四. 状态方程

由系统状态变量构成的描述系统动态过程的一阶微分方程组,称为系统的状态方程。

 状态方程用于描述系统输入引起系统状态变化的动态过程 。


𝒖 𝒚
𝒙

 状态方程的一般形式为:𝒙ሶ =A𝒙 + 𝑩𝒖
1.1 状态空间变量及状态空间表达式

五. 输出方程

在指定系统输出𝒚 的情况下,输出𝒚向量与状态向量𝒙及系统输入𝒖向量的函数关系
式,称为系统的输出方程 。

 系统的状态和输入决定了系统输出的变化 。


𝒖 𝒙 𝒚

 系统输出方程的一般形式为: 𝒚 = 𝑪𝒙 + 𝑫𝒖
1.1 状态空间变量及状态空间表达式

六 . 状态空间表达式

状态方程和输出方程总和起来,构成对一个系统的完整动态描述,称为系统的
状态空间表达式。

对于𝒏个状态变量、𝒓 个输入、 𝒎个输出的动态系统,状态空间表达式的一般形式为:


𝒙ሶ =A𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙 + 𝑫𝒖

A∈ 𝑹𝒏×𝒏 ,表征了系统内部状态的联系,称为系统矩阵;
B∈ 𝑹𝒏×𝒓 ,表征了输入对状态的作用,称为控制矩阵;
C ∈ 𝑹𝒎×𝒏 ,表征了输出与状态变量的关系,称为输出矩阵;
D∈ 𝑹𝒎×𝒓 ,表征了输出与输入的关系,称为直接传输矩阵;
1.1 状态空间变量及状态空间表达式
关于状态空间表达式的几点说明

𝒙ሶ =A𝒙 + 𝑩𝒖 𝑫
𝒚 = 𝑪𝒙 + 𝑫𝒖 +
𝒖 + 𝒙ሶ 𝒙 + y
𝑩 න 𝑪
+

𝑨
 状态空间表达式可以用系统方框图描述;
 输入引起系统状态的变化,而状态和输入则决定了输出的变化;
 状态空间表达式的方框图,只含有比例、积分、加法三类基本环节;

 在输出方程中,若无特殊声明,均不考虑输入向量的直接传输,即令D=0;
1.1 状态空间变量及状态空间表达式

小结

 状态变量、状态向量、状态空间、状态轨迹、状态空间表达式的定义;

 状态变量是相互独立的,从数学上来看是线性无关的。

 对同一个动态系统,状态变量的个数是唯一确定的,但是状态向量的选取可以

有无穷多种;

 对于一个实际的物理系统,状态变量个数等于系统中独立储能元件的个数。

 状态空间表达式的方框图,只含有比例、积分、加法三类基本环节;
《现代控制理论》MOOC课程

1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
建立系统状态空间表达式的三种方法

一. 根据系统的方框图列写

二. 从系统的基本原理进行推导

三. 根据传递函数或高阶微分方程实现
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

方框图法的基本步骤

𝝎𝟐𝒏
二阶振荡环节 𝑮 𝒔 =𝟐
𝒔 +𝟐𝝎𝒏 𝝃𝒔+𝝎𝟐𝒏

𝑻𝒄 𝒔
惯性微分环节 𝑮 𝒔 =
𝑻𝒅 𝒔+𝟏
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

方框图法的基本步骤

比例

惯性微分环节
状态空间表达式方 积分
框图法的基本环节

加法
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

方框图法的基本步骤

1. 方框图变换,将系统方框图中的各环节变换为只包含比例、积分和加法环节的方框图;

2. 选取状态变量,将每一个积分器的输出选作一个状态变量;

3. 根据方框图各环节的关联关系,列写状态空间表达式;
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

例: 已知系统的模拟结构图如下,建立其状态空间表达式

𝒖(𝒔) 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
𝑲𝟏
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −

𝑲𝒏
𝒔

解: 1. 传递函数变换
𝑲𝟏

𝟏 𝑲𝒑 +
𝑲𝟏 𝑲𝟏 𝟏 𝑲𝟏 𝑲𝟏 −
= = 𝒔
𝑲𝒑 𝒔 + 𝑲𝟏 𝑲𝒑 𝑲 𝑲𝒑 𝟏 + 𝑲𝟏 ∙ 𝟏 𝑲𝒑 𝒔 + 𝑲𝟏
𝒔 + 𝑲𝟏
𝒑 𝑲𝒑 𝒔 𝑲𝟏
惯性环节 𝑲𝒑
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

例: 已知系统的模拟结构图如下,建立其状态空间表达式

𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −

𝑲𝒏
𝒔

解: 1. 传递函数变换

𝑲𝟏 න
+
𝑲𝒑 𝒔 + 𝑲𝟏 𝟏 𝑲𝒑 𝒔 + 𝑲𝟏
+
= 𝑲𝒑 + 𝑲𝟏 𝒔
𝒔 𝒔
PI环节 𝑲𝑷
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

例: 已知系统的模拟结构图如下,建立其状态空间表达式

𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −

𝑲𝒏
𝒔

解: 1. 传递函数变换

𝟏 𝟏 න
𝑱𝟏 𝒔 𝑱𝟏
积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

例: 已知系统的模拟结构图如下,建立其状态空间表达式

𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −

𝑲𝒏
𝒔

解: 1. 传递函数变换

𝑲𝒏
න 𝑲𝒏
𝒔
积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

例: 已知系统的模拟结构图如下,建立其状态空间表达式

𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −

𝑲𝒏
𝒔

解: 1. 传递函数变换

𝑲𝒃 𝑲𝒃
න න
𝑱𝟐 𝒔𝟐 𝑱𝟐
重积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

解: 1. 传递函数变换

𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −

𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑

2. 选取状态变量

每个积分器的输出选做一个状态变量,共6个状态变量:

𝒙𝟏 , 𝒙𝟐 , ⋯ , 𝒙𝟔
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

解:

𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −

𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑

3. 列写状态方程
𝟏 𝟏 𝑲𝒑 𝟏 𝑲𝒑
𝒙ሶ 𝟏 = 𝒙𝟐 𝒙ሶ 𝟒 = ((𝒙𝟓 +𝑲𝒑 (𝒙𝟔 − 𝒙𝟒 )) −𝒙𝟑 )= − 𝒙 − 𝒙 + 𝒙 + 𝒙
𝑱𝟏 𝑱𝟏 𝟑 𝑱𝟏 𝟒 𝑱𝟏 𝟓 𝑱𝟏 𝟔
𝑲𝒃
𝒙ሶ 𝟐 = 𝒙𝟒 𝒙ሶ 𝟓 = 𝑲𝟏 (𝒙𝟔 − 𝒙𝟒 ) = −𝑲𝟏 𝒙𝟒 + 𝑲𝟏 𝒙𝟔
𝑱𝟐
𝑲𝟏 𝑲𝟏 𝑲𝟏 𝑲𝟏 𝑲𝟏
𝒙ሶ 𝟑 = 𝑲𝒏 𝒙𝟒 𝒙ሶ 𝟔 = (𝒖 𝒔 − 𝒙𝟏 ) − 𝒙 =− 𝒙 − 𝒙 + u(s) 𝜽(𝒔) = 𝒙𝟏
𝑲𝒑 𝑲𝒑 𝟔 𝑲𝒑 𝟏 𝑲𝒑 𝟔 𝑲𝒑
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式

𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −

𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑

状态空间表达式 𝟎 𝟏 𝟎
𝟎 𝟎 𝟎
𝑲𝒃
𝒙ሶ 𝟏 𝟎 𝟎 𝒙𝟏 𝟎
𝟎 𝟎 𝟎 𝑱𝟐
𝒙ሶ 𝟐 𝒙𝟐 𝟎
𝟎 𝟎 𝟎 𝑲𝒑 𝟎 𝟎 𝟎
𝒙ሶ 𝟑 𝒙𝟑
状态方程 = 𝟏

𝑲𝒑 𝟏 𝑲𝒑
𝒙𝟒 + 𝟎 u(s)
𝒙ሶ 𝟒 𝟎 𝟎 −
𝑱𝟏 𝑱𝟏 𝑱𝟏 𝑱𝟏 𝒙𝟓 𝟎
𝒙ሶ 𝟓 𝟎 𝟎 𝟎 −𝐾1 𝟎 𝐾1 𝑲𝟏
𝒙𝟔
𝒙ሶ 𝟔 𝑲 𝑲𝟏 𝑲𝒑
− 𝟏 𝟎 𝟎 𝟎 𝟎
𝑲𝒑 𝑲𝒑

输出方程 𝜽(𝒔) = 𝒙𝟏
《现代控制理论》MOOC课程

1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式

状态变量的选取

对于实际物理系统,状态变量的个数等于系统中独立储能元件的个数,因此在列写

状态方程时可对每一个独立储能元件指定一个变量作为状态变量。

基本方法

根据具体的控制系统,应用其物理规律,列写出描述系统动态过程的一阶微分方程

组,写成矩阵的形式,即得到系统的状态方程。
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式

例1:有电路如下图所示。列写以电压𝒖(𝒕)为输入量,以电阻 𝑹𝟐 上的电压作为输出的状态
空间表达式。
解: 𝑅1 𝐿1 𝑎 𝐿2
1. 选取状态变量 𝑥1 = 𝑖1 𝑥2 = 𝑖2 𝑥3 = 𝑢𝑐
𝑖 (𝑡) 𝑖1 (𝑡) 2
 C
2.建立状态方程
u( t ) 𝑙1 𝑢𝑐 (𝑡) 𝑅2
由基尔霍夫电压定理  𝑙2

回路1: 𝑢 − 𝑅1 𝑥1 − 𝐿1 𝑥ሶ 1 − 𝑥3 =0
状态空间表达式: 𝑅1 1
− 0 −
回路2: 𝑥3 − 𝐿2 𝑥ሶ 2 − 𝑅2 𝑥2 =0 𝑥ሶ 1 𝐿1 𝐿1 𝑥1 1
𝑅2 1
𝑥ሶ 2 = 0 − 𝑥2 + 0 u
𝐿2 𝐿2
𝑥ሶ 2 𝑥3 0
由基尔霍夫电流定理 1

1
0
𝐶 𝐶

节点a: 𝑥1 − 𝑥2 − 𝐶 𝑥ሶ 3 =0 𝑦 = 𝑅2 𝑥2
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式

例2:有机械系统如下图所示,𝑀1 和 𝑀2分别受外力 𝑓1 和 𝑓2 的作用。求以 𝑀1 和 𝑀2 的运动速


度为输出的状态空间表达式。
𝑠2 𝑠1
𝐾2 𝑣2 𝐾 𝑣1
解:1. 选取状态变量 1
𝑥1 = 𝑠1 𝑥3 = 𝑣1 = 𝑦1
𝑀2 𝑓2 𝑀1 𝑓1
𝑥2 = 𝑠2 𝑥4 = 𝑣2 = 𝑦2
2.建立状态方程 𝐵2 𝐵1

对于M1: 𝑓1 − 𝐾1 𝑥1 − 𝑥2 − 𝐵1 𝑥3 − 𝑥4 =𝑀1 𝑥ሶ 3

对于M2: 𝑓2 + 𝐾1 𝑥1 − 𝑥2 + 𝐵1 𝑥3 − 𝑥4 −𝐾2 𝑥2 − 𝐵2 𝑥4 =𝑀2 𝑥ሶ 4


𝑥ሶ 2 = 𝑥4 𝑥ሶ 1 = 𝑥3
输出方程: 𝑦1 = 𝑥3
𝑦2 = 𝑥4
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式

状态空间表达式:
0 0 1 0
𝑥ሶ 1 𝑥1 0 0
0 0 0 1
𝑥ሶ 2 𝐾 𝐾1 𝐵 𝐵1 𝑥2 0 0 𝑓1
= − 1 − 1 𝑥3 + 1 0
𝑥ሶ 3 𝑀1 𝑀1 𝑀1 𝑀1
𝑀1 1 𝑓2
𝑥ሶ 4 𝐾1 𝐾 +𝐾 𝐵1 𝐵 +𝐵 𝑥4
− 1 2 − 1 2 0 𝑀1
𝑀2 𝑀2 𝑀2 𝑀2

𝑥1
𝑦1 0 0 1 0 𝑥2
=
𝑦2 0 0 0 1 𝑥3
𝑥4
《现代控制理论》MOOC课程

1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式

控制系统的外
控制系统的外部描述

部描述
描述控制系统的外部特征,即描述系统的输入、输出关系。

控制系统的内部描述

不仅可以描述系统的输入输出关系,而且还能够揭示出系统内部各变量的关联关系。

外部描述 内部描述
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式

实现问题 由输入输出描述确定状态空间描述的问题称为实现问题。

即若对于单输入、单输出的线性定常系统,已知描述系统动态过程的微分方程为:

𝑦 (𝑛) + 𝑎𝑛−1 𝑦 (𝑛−1) + ⋯ + 𝑎1 𝑦 1


+ 𝑎0 𝑦 = 𝑏𝑚 𝑢(𝑚) + 𝑏𝑚−1 𝑢(𝑚−1) + ⋯ + 𝑏1 𝑢 1
+ 𝑏0 𝑢

或传递函数 :
𝑌(𝑠) 𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0
𝑊(𝑠) = = 𝑛 𝑚≤𝑛
𝑈(𝑠) 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

求出状态空间表达式 : 𝒙ሶ = 𝑨𝒙 + 𝑏𝑢
y = 𝑪𝒙 + 𝑑𝑢
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式

关于实现问题的说明

 实现存在的条件: 𝑚 ≤ 𝑛
1.2 状态空间表达式的建立
解释
说明

𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0


Y(s)=G(s)U(s) = 𝑛
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
𝑈(𝑠)

当m<n ,输入输出之间不存在比例关系,D=0 。
𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0 𝑏ത𝑛−1 𝑠 𝑛−1 +⋯+𝑏ത1 𝑠+𝑏ത0
当m=n, Y(s)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠) + 𝑏𝑛 𝑈(𝑠)
𝑛−1 1 0 𝑛−1 1 0

输入输出之间存在比例关系,D=𝑏𝑛 。

当m>n,假定m=n+1:
𝑏𝑛+1 𝑠 𝑛+1 +𝑏𝑛 𝑠 𝑛 +⋯+𝑏1 𝑠+𝑏0 𝑏෠𝑛−1 𝑠 𝑛−1 +⋯+𝑏෠1 𝑠+𝑏෠0
Y(s)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠) =𝑛 𝑈 𝑠 + 𝑏ത𝑛 𝑈 𝑠 + 𝑏𝑛+1 𝑠𝑈(𝑠)
𝑛−1 1 0 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

输入输出之间存在微分关系。若要表述这一关系,则输出方程为:
y=C𝑥 + D𝑢 + E𝑢ሶ
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式

关于实现问题的说明

 实现存在的条件: 𝑚≤𝑛
当 𝑚 < 𝑛 时,直接传输矩阵D=0 ;
当m>n ,输出将含有输入信号的直接微分项。这在实际系统中是不允许的,状态空
间表达式也无法表示。

 实现的非唯一性;
会有无穷多个状态空间表达式,实现给定的输入输出关系。

 没有零极点对消的传递函数的实现称为最小实现。
因为没有零、极点对消的传递函,求得的状态空间表达式的阶数是最小的。
《现代控制理论》MOOC课程

1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式

单输入单输出系统实现方法一

由系统的传递函数可得:
𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0
𝑌(𝑠) = 𝑛 𝑈(𝑠) 𝑚≤𝑛
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

1. 当 𝑚 < 𝑛
1
引入中间变量 ෨
𝑌(𝑠) = 𝑈(𝑠)
𝑠 𝑛 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

进而可得 ෨
𝑌(𝑠)(𝑠 𝑛+𝑎
𝑛−1 𝑠 𝑛−1 + ⋯ + 𝑎 𝑠 + 𝑎 )=𝑈(𝑠)
1 0


𝑌 𝑠 = 𝑌(𝑠) (𝑏𝑚 𝑠 𝑚 + 𝑏𝑚−1 𝑠 𝑚−1 + ⋯ + 𝑏1 𝑠 + 𝑏0 )
1.2 状态空间表达式的建立

拉氏微分定理

𝑛
𝑑 𝑛 𝑓(𝑡)
拉氏微分定理: 𝐿 = 𝑠 𝑛 𝐹 𝑠 − ෍ 𝑠 𝑛−𝑘 𝑓 𝑛−𝑘 (0)
𝑑𝑡 𝑛
𝑘=1

当初始条件为0时:
𝑑 𝑛 𝑓(𝑡) 𝑛𝐹 𝑠
𝐿 = 𝑠
𝑑𝑡 𝑛

拉氏反变换: 𝑑𝑛 𝑓(𝑡)
𝐿−1 𝑠 𝑛 𝐹 𝑠 = 𝑛
=𝑓 𝑛 (𝑡)
𝑑𝑡
1.2 状态空间表达式的建立

取拉式反变换可得:
𝑦 =𝑏𝑚 𝑦෤ (𝑚) + 𝑏𝑚−1 𝑦෤ (𝑚−1) + ⋯ + 𝑏1 𝑦෤ 1
+ 𝑏0 𝑦෤ (1)

𝑦෤ (𝑛) + 𝑎𝑛−1 𝑦෤ (𝑛−1) + ⋯ + 𝑎1 𝑦෤ 1 + 𝑎0 𝑦෤ = 𝑢 (2)


选取状态变量为:
𝑥1 = 𝑦,
෤ 𝑥2 = 𝑦෤ 1 , ⋯ , 𝑥𝑛 = 𝑦෤ (𝑛−1) (3)
可得状态方程为:
𝑥ሶ1 = 𝑥2 , 𝑥ሶ 2 = 𝑥3 , ⋯ , 𝑥ሶ 𝑛−1 = 𝑥𝑛

𝑥ሶ 𝑛 = 𝑦෤ (𝑛) = −𝑎𝑛−1 𝑦෤ 𝑛−1 − ⋯ − 𝑎1 𝑦෤ 1 − 𝑎0 𝑦෤ + 𝑢= −𝑎𝑛−1 𝑥𝑛 − ⋯ − 𝑎1 𝑥2 − 𝑎0 𝑥1 + 𝑢

可得输出方程为: 𝑦 =𝑏𝑚 𝑥𝑚+1 + 𝑏𝑚−1 𝑥𝑚 + ⋯ + 𝑏1 𝑥2 + 𝑏0 𝑥1


1.2 状态空间表达式的建立

状态空间表达式: 𝑥ሶ 1 0 1 0 ⋯ 0 𝑥1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 0
⋮ = ⋮ ⋮ ⋮ ⋱ 0 ⋮ + ⋮ u
𝑥ሶ 𝑛−1 0 0 0 … 1 𝑥n−1 0
𝑥ሶ 𝑛 −𝑎0 −𝑎1 −𝑎2 … −𝑎n−1 𝑥𝑛 1

𝑦 = 𝑏0 ⋯ 𝑏𝑚 0 ⋯ 0𝒙
特点:

 系统矩阵A的前n-1行为次对角单位阵,最后一行由传递函数分母的系数,也就是系统
特征多项式的系数取相反号组成。
 输入矩阵b,最后一个元素为1,其余元素均为0。
 能控标准I型。
1.2 状态空间表达式的建立

2. 当 𝑚 = 𝑛
𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0 𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0
𝑌(𝑠) = 𝑛 𝑈(𝑠) = 𝑛 𝑈(𝑠)
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

𝑏𝑛−1 −𝑏𝑛 𝑎𝑛−1 𝑠 𝑛−1 +⋯+(𝑏1 −𝑏𝑛 𝑎1 )𝑠+(𝑏0 −𝑏𝑛 𝑎0 )


= 𝑏𝑛 + 𝑈 𝑠 (1)
𝑠 𝑛 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0

1
引入中间变量 ෨
𝑌(𝑠) = 𝑈(𝑠)
𝑠 𝑛 +𝑎𝑚−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0


将中间变量𝑌(𝑠) 代入(1)式可得


Y(s)= 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝑠 𝑛−1 + ⋯ + (𝑏1 −𝑏𝑛 𝑎1 )𝑠 + (𝑏0 −𝑏𝑛 𝑎0 ) 𝑌(𝑠) +𝑏𝑛 𝑈(𝑠)
1.2 状态空间表达式的建立

取拉氏反变换
𝑦 = 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝑦෤ 𝑛−1 + ⋯ + (𝑏1 −𝑏𝑛 𝑎1 )𝑦෤ 1 + (𝑏0 −𝑏𝑛 𝑎0 )𝑦෤ +𝑏𝑛 𝑢 (1)

𝑦෤ (𝑛) + 𝑎𝑛−1 𝑦෤ (𝑛−1) + ⋯ + 𝑎1 𝑦෤ 1 + 𝑎0 𝑦෤ = 𝑢 (2)

同样选取状态变量为: 𝑥1 = 𝑦,
෤ 𝑥2 = 𝑦෤ 1 , ⋯ , 𝑥𝑛 = 𝑦෤ (𝑛−1)
状态空间表达式:
𝑥ሶ 1 0 1 0 ⋯ 0 𝑥1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 0
⋮ = ⋮ ⋮ ⋮ ⋱ 0 ⋮ + ⋮ u
𝑥ሶ 𝑛−1 0 0 0 … 1 𝑥n−1 0
𝑥ሶ 𝑛 −𝑎0 −𝑎1 −𝑎2 … −𝑎n−1 𝑥𝑛 1
𝑦 = (𝑏0 −𝑏𝑛 𝑎0 ) (𝑏1 −𝑏𝑛 𝑎1 ) ⋯ 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝒙 +𝑏𝑛 𝑢
1.2 状态空间表达式的建立

例:系统的动态特性由下列微分方程描述 取拉氏反变换,有:
(1). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u 𝑦෤ (3) + 5𝑦෤ (2) + 7𝑦෤ (1) + 3𝑦෤ = 𝑢

(2). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሷ + 3𝑢ሶ +2u 𝑦 = 𝑦෤ (1) + 2𝑦෤
列写其相应的状态空间表达式。 选取状态变量:𝑥1 = 𝑦, ෤ 𝑥2 = 𝑦෤ (1) , 𝑥3 = 𝑦෤ (2)
则: 𝑥ሶ1 = 𝑥2 , 𝑥ሶ 2 = 𝑥3
解: (1) 对微分方程取拉氏变换,可得
𝑥ሶ 3 = 𝑦෤ (3) = −5𝑥3 − 7𝑥2 − 3𝑥1 +u
𝑠+2
Y 𝑠 = 3 2
𝑈(𝑠) 𝑦 = 𝑥2 + 2𝑥1
𝑠 + 5𝑠 + 7𝑠 + 3
可得状态空间表达式:
1
设 𝑌෨ 𝑠 = 3 2
𝑈(𝑠) 𝑥ሶ 1 0 1 0 𝑥1 0
𝑠 + 5𝑠 + 7𝑠 + 3
𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u
𝑥ሶ 3 −3 −7 −5 𝑥3 1
则有 Y 𝑠 = (𝑠 + 2)𝑌෨ 𝑠
𝑦= 2 1 0𝒙
1.2 状态空间表达式的建立
单输入单输出系统实现方法一
例:系统的动态特性由下列微分方程描述
(1). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u
(2). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሷ + 3𝑢ሶ +2u
列写其相应的状态空间表达式。
解: (2) 状态空间表达式: 第(1)小题状态空间表达式:
𝑥ሶ1 0 1 0 𝑥1 0 𝑥ሶ 1 0 1 0 𝑥1 0
𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u 𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u
𝑥ሶ 3 −3 −7 −5 𝑥3 1 𝑥ሶ 3 −3 −7 −5 𝑥3 1
𝑦= 2 3 1𝒙 𝑦= 2 1 0𝒙

 在实现问题中,传递函数的分母决定系统的状态方程,而传递函数的分子决定系统
的输出方程。
《现代控制理论》MOOC课程

1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
单输入单输出系统实现方法二

1. 当 𝑚 = 𝑛
𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0
由系统的传递函数可得: Y(s)= 𝑛 𝑈(𝑠)
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
取拉氏反变换,可得:
𝑦 (𝑛) + 𝑎𝑛−1 𝑦 (𝑛−1) + ⋯ + 𝑎1 𝑦 1 + 𝑎0 𝑦 = 𝑏𝑛 𝑢(𝑛) + 𝑏𝑛−1 𝑢(𝑛−1) + ⋯ + 𝑏1 𝑢 1 + 𝑏0 𝑢
选取状态变量,令:
𝑥1 = 𝑦 − 𝛽0 𝑢 𝑦 = 𝑥1 + 𝛽0 𝑢
𝑥2 = 𝑥ሶ 1 − 𝛽1 𝑢 𝑥ሶ 1 = 𝑥2 + 𝛽1 𝑢
𝑥3 = 𝑥ሶ 2 − 𝛽2 𝑢 𝑥ሶ 2 = 𝑥3 + 𝛽2 𝑢
⋮ ⋮
𝑥𝑛 = 𝑥ሶ 𝑛−1 − 𝛽𝑛−1 𝑢 𝑥ሶ 𝑛−1 = 𝑥𝑛 + 𝛽𝑛−1 𝑢
𝑥𝑛+1 = 𝑥ሶ 𝑛 −𝛽𝑛 𝑢 𝑥ሶ 𝑛 = 𝑥𝑛+1 + 𝛽𝑛 𝑢
1.2 状态空间表达式的建立

写成矩阵的形式,得到含有待定系数及待求变量的状态方程:

𝑥ሶ1 0 1 0 ⋯ 0 𝑥1 𝛽1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 𝛽2 0
⋮ = ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ + ⋮ u+ ⋮
𝑥ሶ 𝑛−1 0 0 0 ⋯ 1 𝑥𝑛−1 𝛽𝑛−1 0
𝑥ሶ 𝑛 0 0 0 ⋯ 0 𝑥𝑛 𝛽𝑛 𝑥𝑛+1
𝑥1
𝑥2
𝑦= 1 0 0 ⋯ 0 ⋮ +𝛽0 u
𝑥𝑛−1
𝑥𝑛

其中 𝛽0 , 𝛽1 , ⋯ , 𝛽𝑛及 𝑥𝑛+1为待求系数和变量;
1.2 状态空间表达式的建立

求待定系数和变量
𝑥1 = 𝑦 − 𝛽0 𝑢
𝑥2 = 𝑥ሶ 1 − 𝛽1 𝑢 = 𝑦 (1) −𝛽0 𝑢(1) − 𝛽1 𝑢
𝑥3 = 𝑥ሶ 2 − 𝛽2 𝑢 = 𝑦 (2) −𝛽0 𝑢(2) − 𝛽1 𝑢(1) − 𝛽2 𝑢

𝑥𝑛 = 𝑥ሶ 𝑛−1 − 𝛽𝑛−1 𝑢 = 𝑦 (𝑛−1) −𝛽0 𝑢 𝑛−1 − 𝛽1 𝑢 𝑛−2 − ⋯ − 𝛽𝑛−2 𝑢 1 − 𝛽𝑛−1 𝑢
𝑥𝑛+1 = 𝑥ሶ 𝑛 −𝛽𝑛 𝑢 = 𝑦 (𝑛) −𝛽0 𝑢 𝑛 − 𝛽1 𝑢 𝑛−1 − ⋯ − 𝛽𝑛−1 𝑢 1 − 𝛽𝑛 𝑢

𝑦 = 𝑥1 + 𝛽0 𝑢
𝑦 (1) = 𝑥2 + 𝛽0 𝑢(1) + 𝛽1 𝑢
𝑦 (2) = 𝑥3 + 𝛽0 𝑢(2) + 𝛽1 𝑢(1) + 𝛽2 𝑢

𝑦 (𝑛−1) = 𝑥𝑛 + 𝛽0 𝑢 𝑛−1 + 𝛽1 𝑢 𝑛−2 + ⋯ + 𝛽𝑛−2 𝑢 1 + 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 + 𝛽0 𝑢 𝑛 + 𝛽1 𝑢 𝑛−1 + ⋯ + 𝛽𝑛−1 𝑢 1 + 𝛽𝑛 𝑢
1.2 状态空间表达式的建立

将前n个方程两边分别同乘 𝑎0 , 𝑎1 , ⋯ , 𝑎𝑛−1
𝑎0 𝑦 = 𝑎0 𝑥1 + 𝑎0 𝛽0 𝑢
𝑎1 𝑦 (1) = 𝑎1 𝑥2 + 𝑎1 𝛽0 𝑢(1) + 𝑎1 𝛽1 𝑢
𝑎2 𝑦 (2) = 𝑎2 𝑥3 + 𝑎2 𝛽0 𝑢(2) + 𝑎2 𝛽1 𝑢(1) + 𝑎2 𝛽2 𝑢

𝑎𝑛−1 𝑦 (𝑛−1) = 𝑎𝑛−1 𝑥𝑛 + 𝑎𝑛−1 𝛽0 𝑢 𝑛−1 + 𝑎𝑛−1 𝛽1 𝑢 𝑛−2 + ⋯ + 𝑎𝑛−1 𝛽𝑛−2 𝑢 1 + 𝑎𝑛−1 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 + 𝛽0 𝑢 𝑛 + 𝛽1 𝑢 𝑛−1 + ⋯ + 𝛽𝑛−1 𝑢 1 + 𝛽𝑛 𝑢

𝑎0 𝑦 = 𝑎0 𝑥1 +𝑎0 𝛽0 𝑢
𝑎1 𝑦 (1) = 𝑎1 𝑥2 +𝑎1 𝛽0 𝑢(1) +𝑎1 𝛽1 𝑢
𝑎2 𝑦 (2) = 𝑎2 𝑥3 +𝑎2 𝛽0 𝑢(2) +𝑎2 𝛽1 𝑢(1) +𝑎2 𝛽2 𝑢
⋮ ⋮ ⋮ ⋮ ⋮
𝑎𝑛−1 𝑦 (𝑛−1) = 𝑎𝑛−1 𝑥𝑛 + 𝑎𝑛−1 𝛽0 𝑢 𝑛−1
+ ⋯ + 𝑎𝑛−1 𝛽n−3 𝑢 2 1
+ 𝑎𝑛−1 𝛽𝑛−2 𝑢 + 𝑎𝑛−1 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 +𝛽0 𝑢 𝑛
+𝛽1 𝑢 𝑛−1 +⋯ +𝛽𝑛−2 𝑢(2) +𝛽𝑛−1 𝑢 1 +𝛽𝑛 𝑢
1.2 状态空间表达式的建立

将每个方程等式两边相加

左边 = 𝑎0 𝑦+𝑎1 𝑦 (1) +⋯+𝑎𝑛−1 𝑦 (𝑛−1) +𝑦 (𝑛)= 𝑏𝑛 𝑢(𝑛) + 𝑏𝑛−1 𝑢(𝑛−1) + ⋯ + 𝑏1 𝑢 1 + 𝑏0 𝑢

右边 = (𝑎0 𝑥1 + 𝑎1 𝑥2 + ⋯ 𝑎𝑛−1 𝑥𝑛 + 𝑥𝑛+1 )+𝛽0 𝑢 𝑛


+ ⋯ +(𝛽𝑛 +𝑎𝑛−1 𝛽𝑛−1 + ⋯ + 𝑎1 𝛽1 +𝑎0 𝛽0 )𝑢

𝑥1
𝑥2
比较方程两边的系数有: 𝑎0 𝑥1 + 𝑎1 𝑥2 + ⋯ 𝑎𝑛−1 𝑥𝑛 + 𝑥𝑛+1 =0 𝑥𝑛+1 = −𝑎0 −𝑎1 ⋯ −𝑎𝑛−1

𝑥𝑛
𝛽0 = 𝑏𝑛

𝛽1 = 𝑏𝑛−1 − 𝑎𝑛−1 𝛽0 ,⋯ ,𝛽𝑛 = 𝑏0 − 𝑎𝑛−1 𝛽𝑛−1 − ⋯ − 𝑎1 𝛽1 +𝑎0 𝛽0


1.2 状态空间表达式的建立
代入状态方程,可得:
𝑥ሶ1 0 10 ⋯0 𝑥1 𝛽1
𝑥ሶ 2 0 01 ⋯ 0 𝑥2 𝛽2
⋮ = ⋮ ⋮⋮ ⋱ ⋮ ⋮ + ⋮ 𝑢
𝑥ሶ 𝑛−1 0 00 ⋯ 1 𝑥𝑛−1 𝛽𝑛−1
𝑥ሶ 𝑛 −𝑎0 −𝑎1
−𝑎2 ⋯ −𝑎𝑛−1 𝑥𝑛 𝛽𝑛
𝑥1
𝑥2
𝑦= 1 0 0 ⋯ 0 ⋮ +𝛽0 u 能观标准I型
𝑥𝑛−1
𝑥𝑛
𝛽0 = 𝑏𝑛
待定系数递推公式: 𝛽1 = 𝑏𝑛−1 − 𝑎𝑛−1 𝛽0

𝛽𝑛 = 𝑏0 − 𝑎𝑛−1 𝛽𝑛−1 − ⋯ − 𝑎1 𝛽1 +𝑎0 𝛽0

2. 当m<n时:与所讨论情形的等价 𝑏𝑘 = 0, 𝑘 = 𝑛,n − 1, ⋯ ,𝑚 + 1
1.2 状态空间表达式的建立

例:系统的动态特性由下列微分方程描述
𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u
列写其相应的状态空间表达式。
解: 𝑏3 = 𝑏2 = 0,𝑏1 = 1,𝑏0 = 2 𝑎2 = 5,𝑎1 = 7,𝑎0 = 3
𝛽0 = 𝑏3 = 0
𝛽1 = 𝑏2 − 𝑎2 𝛽0 = 0
𝛽2 = 𝑏1 − 𝑎2 𝛽1 − 𝑎1 𝛽0 = 1 − 5 × 0 − 7 × 0 = 1
𝛽3 = 𝑏0 − 𝑎2 𝛽2 − 𝑎1 𝛽1 − 𝑎0 𝛽0 = 2 − 5 × 1 − 7 × 0 − 3 × 0 = −3

𝑥ሶ 1 0 1 0 𝑥1 0 𝑥1
𝑥ሶ 2 = 0 0 1 𝑥2 + 1 𝑢 𝑦 = 1 0 0 𝑥2
𝑥ሶ 3 −3 −7 −5 𝑥3 −3 𝑥3
1.2 状态空间表达式的建立

多输入多输出系统实现方法

 多输入多输出系统的实现,可采用方框图法。就是依据高阶微分方程组,

画出所对应的方框图,再根据方框图列写状态空间表达式。

 由于经典控制理论难以有效的处理多输入多输出系统,通常不会建立多输入多输出

系统的微分方程或传递函数描述。
1.2 状态空间表达式的建立
小结

 方框图法、机理法、实现的方法的建模步骤;

 状态变量的选取方法:

方框图法:每一个积分器的输出选为状态变量

机理法:每一个独立储能元件,选一个变量作为状态变量

实现方法1:传递函数分母分之输入的拉氏反变换,及其各阶导数作为状态变量。

实现方法2:系统输入、输出各阶导数的线性组合选作状态变量。
《现代控制理论》MOOC课程

1.3 状态向量的线性变换
1.3 状态向量的线性变换

状态空间空间表达式的非唯一性

系统特征值的不变性

对角线规范型和约当规范型
1.3 状态向量的线性变换

一. 状态空间空间表达式的非唯一性

 状态变量是足以完全表征系统运
动状态的最小个数的一组变量

 状态变量是相互独立的
 同一系统不同状态向量之间必然
存在一种线性变换的关系
 同一系统状态变量的个数是唯一
确定的

 同一系统状态变量的选取是非唯
一的
1.3 状态向量的线性变换

一. 状态空间空间表达式的非唯一性

同一系统不同状态向量之间必然存在一种线性变换的关系。
证明:
反设:𝒙、𝒛为同一系统的两个不同状态向量,但𝒙、𝒛之间不存在线性变换关系

由𝒙、𝒛之间不存在线性变换关系。
则向量𝒙中至少存在一个变量𝒙𝒊 , 不能用向量𝒛各分量的线性组合来表示,即
独立于𝒛向量的各分量。
因为,变量𝒙𝒊 和向量𝒛的各分量都是状态变量,故要完全表征系统的动态行为
向量𝒛至少还要增加一个分量𝒙𝒊 ,即向量z不是系统的状态向量。

反设不成立。故,同一系统不同状态向量之间必然存在一种线性变换的关系。
1.3 状态向量的线性变换

一. 状态空间空间表达式的非唯一性

设一给定的n阶系统的状态空间表达式为
𝒙ሶ =A𝒙 + 𝑩𝒖 𝒙(𝟎) = 𝒙𝟎
𝒚 = 𝑪𝒙 + 𝑫𝒖
对于任意给定的n×n阶非奇异阵T, 作如下变换:

𝒛 = 𝑻−𝟏 𝒙
则z也一定是给定系统的另一个状态向量。

由 𝒛 = 𝑻−𝟏 𝒙 可得 𝒙 = 𝑻𝒛 ,代入状态空间表达式为:
𝑻𝒛ሶ =A𝑻𝒛 + 𝑩𝒖 T𝒛(𝟎) = 𝒙𝟎
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
1.3 状态向量的线性变换

一. 状态空间空间表达式的非唯一性

状态方程和初值两端同乘T的逆:
𝒛ሶ =𝑻−𝟏 A𝑻𝒛+ 𝑻−𝟏 𝑩𝒖 𝒛(𝟎) = 𝑻−𝟏 𝒙𝟎
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
则有系统新的状态空间表达式:
ഥ𝒛 + 𝑩
𝒛ሶ = 𝑨 ഥ𝒖 𝒛(𝟎) = 𝒛𝟎
𝒚=𝑪 ഥ𝒛 + 𝑫
ഥ𝒖
ഥ = 𝑻−𝟏 A𝑻,𝑩
其中, 𝑨 ഥ =𝑪𝑻,𝑫
ഥ =𝑻−𝟏 𝑩, 𝑪 ഥ =D ,𝒛𝟎 = 𝑻−𝟏 𝒙𝟎
由于T 是任意非奇异阵,故系统的状态空间表达式是非唯一的。
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性

0 −2 2 1
例. 某系统的状态空间表达式为: 𝒙ሶ = 𝒙+ 𝒖, 𝒙 𝟎 =
1 −3 0 1
𝒚= 0 3𝒙
6 2
作如下变换,𝒙 = 𝑻𝒛 = z 。 求变换后系统的状态空间表达式。
2 0

解: 𝑻−𝟏
𝟏 0 1
=
𝟐 1 −3
𝟏 0 1 1 1Τ2
𝒛 𝟎 = 𝑻−𝟏 𝒙(0) = =
𝟐 1 −3 1 −1

𝟏 0 1 0 −2 6 2 0 1
ഥ=𝑻
𝑨 −𝟏
𝑨𝑻 = =
𝟐 1 −3 1 −3 2 0 −2 −3
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性

𝟏 0 1 2 0
ഥ=
𝑩 𝑻−𝟏 𝑩 = =
𝟐 1 −3 0 1

ഥ 6 2
𝑪 = 𝑪𝑻 = 0 3 = 6 0
2 0

变换后系统的状态空间表达式为:
0 1 0 1Τ2
𝒛ሶ = 𝒛+ 𝒖, 𝒛 𝟎 =
−2 −3 1 −1
𝒚= 6 0𝒙
1.3 状态向量的线性变换

二. 系统特征根的不变性

系统的特征值

定义:系统状态空间表达式中系统矩阵A的特征值称为系统的特征值。

 系统特征值也就是系统矩阵特征方程 𝝀𝑰 − 𝑨 = 0 的根。

 将特征方程写成多项式的形式:

𝜆𝑰 − 𝑨 = 𝜆𝑛 + 𝑎𝑛−1 𝜆𝑛−1 + ⋯ + 𝑎1 𝜆 + 𝑎0 =0
显然对n阶系统有n个特征值。
1.3 状态向量的线性变换

二. 系统特征根的不变性

系统特征值的不变性

非奇异线性变换不改变系统的特征值。
证明: 非奇异线性变换前: 𝝀𝑰 − 𝑨 = 0 非奇异线性变换后: 𝝀𝑰 − 𝑻−𝟏 𝑨𝑻 = 0
而: 𝜆𝑰 − 𝑻−𝟏 𝑨𝑻 = 𝜆𝑻−𝟏 𝑻 − 𝑻−𝟏 𝑨𝑻 = 𝑻−𝟏 𝜆𝑻 − 𝑻−𝟏 𝑨𝑻 = 𝑻−𝟏 (𝜆𝑰 − 𝑨)𝑻
因为矩阵乘积的行列式等于行列式的乘积,矩阵逆的行列式等于矩阵行列式的倒数,
所以有:

𝑻−𝟏 (𝜆𝑰 − 𝑨)𝑻 = 𝑻−𝟏 𝜆𝑰 − 𝑨 𝑻 = 𝜆𝑰 − 𝑨

即 𝜆𝑰 − 𝑨 = 𝜆𝑰 − 𝑻−𝟏 𝑨𝑻 证毕
《现代控制理论》MOOC课程

1.3 状态向量的线性变换
1.3 状态向量的线性变换

三. 状态空间表达式的对角规范型和约当规范型

系统的特征向量
对于n×n维矩阵A,若存在一个不为零的n维向量𝑝𝑖 和一个标量 𝜆𝑖,使得:

(𝑨 − 𝜆𝑖 𝐼)𝒑𝑖 =0
则称 𝑝𝑖 为矩阵A的特征值 𝝀𝑖 所对应的特征向量。

计算特征向量,求是求解齐次代数方程

(𝑨 − 𝝀𝑖 𝑰)𝒑𝑖 =0
由齐次代数方程解的性质,系数矩阵奇异时,有无穷多组非零解。

一个特征根,对应于无穷多个特征向量。
1.3 状态向量的线性变换

三. 状态空间表达式的对角规范型和约当规范型

对角规范型
对于给定系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,设其特征值 𝝀𝟏 , 𝝀𝟐 ,⋯ , 𝝀𝒏 为两两互异,由它们的特征向

量组成变换阵 𝑻 = 𝒑𝟏 ,𝒑𝟐 , ⋯ , 𝒑𝒏 ,那么系统的状态方程在变换 𝒛 = 𝑻−𝟏 𝒙下必可化为


如下形式的对角规范型:
𝜆1
𝜆2 ഥ 𝒖, ഥ = 𝑻−𝟏 𝑩
𝒛ሶ = 𝒛 +𝑩 𝑩

𝜆𝑛
证:对系统进行线性变换 𝒛 = 𝑻−𝟏 𝒙
可得到一个新的状态方程 𝒛ሶ = 𝑻−𝟏 𝑨𝑻𝒛 +𝑻−𝟏 𝑩𝒖
1.3 状态向量的线性变换

三. 状态空间表达式的对角规范型和约当规范型

𝑨𝑻 = 𝑨 𝒑𝟏 ,𝒑𝟐 , ⋯ , 𝒑𝒏 = 𝑨𝒑𝟏 ,𝑨𝒑𝟐 , ⋯ , 𝑨𝒑𝒏 = 𝝀𝟏 𝒑𝟏 ,𝝀𝟐 𝒑𝟐 , ⋯ , 𝝀𝒏 𝒑𝒏


𝝀𝟏 𝝀𝟏
𝝀𝟐 𝝀𝟐
= 𝒑𝟏 ,𝒑𝟐 , ⋯ , 𝒑𝒏 =𝑻
⋱ ⋱
𝝀𝒏 𝝀𝒏
方程两边同乘 𝑻−𝟏 可得:
𝝀𝟏
−𝟏 𝝀𝟐 证毕
𝑻 𝑨𝑻 =

𝝀𝒏
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

讨论

 在对角规范型下,各状态变量间实现了完全解耦,可表示为n个独立的状态变量方程。

𝑧1ሶ 𝜆1 𝑧1
𝑧2ሶ 𝜆2 𝑧2
= + ഥ𝒖
𝑩
⋮ ⋱ ⋮
𝑧𝑛ሶ 𝜆𝑛 𝑧𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

0 1 ⋯ 0
⋮ ⋮ ⋱ ⋮
 若系统矩阵A为标准型,即 𝑨= 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1

则将状态方程变换为对角规范型的变换阵T为范德蒙德阵,即:

1 ⋯ 1
𝜆1 ⋯ 𝜆𝑛
𝑻=
⋮ ⋮ ⋮
𝜆1𝑛−1 ⋯ 𝜆𝑛−1
𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

证明: 设系统矩阵A的特征值 𝜆𝑖所对应特征向量为:

𝑝𝑖 = 𝑝1𝑖 𝑝2𝑖 ⋯ 𝑝𝑛𝑖 𝑇

由特征向量的定义可得 (𝑨 − 𝜆𝑖 𝐼)𝑝𝑖 = 0
将规范性系统矩阵代入: 0 1 ⋯ 0
⋮ ⋮ ⋱ ⋮
𝑨= 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1

−𝜆𝑖 1 ⋯ 0 𝑝1𝑖
⋮ ⋮ ⋱ ⋮ 𝑝2𝑖
0 −𝜆𝑖 … 1 ⋮ =0
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 −𝜆𝑖 𝑝𝑛𝑖
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

将矩阵方程展开: −𝜆𝑖 𝑝1𝑖 + 𝑝2𝑖 = 0


−𝜆𝑖 𝑝2𝑖 + 𝑝3𝑖 = 0

−𝜆𝑖 𝑝(𝑛−1)𝑖 + 𝑝𝑛𝑖 = 0
−𝑎0 𝑝1𝑖 − 𝑎1 𝑝2𝑖 − ⋯ − 𝑎𝑛−1 +𝜆𝑖 𝑝𝑛𝑖 = 0
这是一个齐次方程,且其秩小于n,故其有无穷个解。

令 𝑝1𝑖 = 1 可得 𝑝2𝑖 = 𝜆𝑖 , ⋯ ,𝑝𝑛𝑖 = 𝜆𝑛−1


𝑖

故状态方程变换为对角规范型的变换阵可表示为: 1 ⋯ 1
⋯ 𝑝𝑛 𝜆1 ⋯ 𝜆𝑛
𝑻 = 𝑝1 𝑝1 = ⋯
⋮ ⋮
得证
𝜆1𝑛−1 ⋯ 𝜆𝑛−1
𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

例. 给定线性定常系统 𝒙ሶ =A𝒙 + 𝑩𝒖 ,其中


2 −1 −1 7
𝑨 = 0 −1 0 𝑩= 2
0 2 1 3
将状态方程化为规范型。

解: ① 确定系统的特征值,即
𝜆−2 1 1
𝜆𝑰 − 𝑨 = 0 𝜆+1 0 =(𝜆 − 2)(𝜆 + 1)(𝜆 − 1)
0 −2 𝜆 − 1
可得: 𝜆1 = 2,𝜆2 = −1,𝜆3 = 1
因为系统特征值不存在重根,故系统的状态方程可化为对角规范型。
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

② 确定非奇异变换阵T
求取与特征值 𝜆1 = 2,𝜆2 = −1,𝜆3 = 1 所对应的特征向量 。
代入特征向量求解方程 (A−𝜆𝑖 𝑰)𝒑𝒊 =0 ,当 𝜆1 = 2 有:
0 −1 −1 𝑝11
0 −3 0 𝑝21 =0 可得 𝑝11 = 𝑘 (𝑘 ≠ 0的任意值), 𝑝21 = 𝑝31 = 0
0 2 −1 𝑝31
1 0 1
取 𝑘 = 1 有 : 𝒑𝟏 = 0 同理可得: 𝒑𝟐 = 1 𝒑𝟑 = 0
0 −1 1
1 0 1 1 −1 −1
由此可得: 𝑻 = 0 1 0 求逆可得: 𝑻−𝟏 = 0 1 0
0 −1 1 0 1 1
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

③ 求系数矩阵 ഥ 、𝑩
𝑨 ഥ
1 −1 −1 2 −1 −1 1 0 1 2 0 0
ഥ = 𝑻−1 𝑨𝑻 = 0 1
𝑨 0 0 −1 0 0 1 0 = 0 −1 0
0 1 1 0 2 1 0 −1 1 0 0 1

1 −1 −1 7 2
ഥ = 𝑻−1 𝑩 = 0
𝑩 1 0 2 = 2
0 1 1 3 5
故系统状态方程的对角规范型为:

2 0 0 2
𝒛ሶ = 0 −1 0 𝒛+ 2 u
0 0 1 5
《现代控制理论》MOOC课程

1.3 状态向量的线性变换
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

特征根的代数重数和几何重数

 设 𝝀𝒊 为系统矩阵A的特征值,若𝝀𝒊 的重根数为 𝝈𝒊 ,则称𝝀𝒊的代数重数为𝝈𝒊 。

 设V为n维线性空间,𝝀𝒊 为系统矩阵A的特征值,则 𝝀𝒊 的特征子空间

𝑽𝜆𝑖 ={𝒑𝑖 ∈ 𝑽|𝑨𝒑𝑖 = 𝜆𝑖 𝒑𝑖 } 的维数𝜶𝒊 , 称为𝝀𝒊 特征值的几何重数。

𝝀𝒊 的几何重数 𝜶𝒊 也就是𝝀𝒊线性无关特征向量的个数。

𝜶𝒊 = 𝒏 − 𝒓𝒂𝒏𝒌(𝝀𝒊 I −A)
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

1 2 3
例:求系统矩阵 𝑨 = 3 2 3 相异特征值的代数重数和几何重数。
0 0 −1

𝜆 − 1 −2 −3 𝝀𝟏 = −1, − 1
𝟐
解: 𝜆𝑰 − 𝑨 = −3 𝜆 − 2 −3 =(𝜆 + 1) (𝜆 − 4) = 𝟎 可得:
0 0 𝜆+1 𝜆𝟐 = 4

故 𝜆𝟏 、𝜆𝟐 的代数重数分别为 𝜎𝟏 = 2、𝜎𝟐 =1


−2 −2 −3
𝜆𝟏的几何重数 𝛼𝟏 = 3 − rank(𝝀𝟏 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 −3 −3 −3 = 3 − 2=1
0 0 0

3 −2 −3
𝜆𝟐的几何重数 𝛼𝟐 = 3 − rank(𝝀𝟐 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 −3 2 −3 = 3 − 2=1
0 0 4
1.3 状态向量的线性变换

三. 状态空间表达式的对角规范型和约当规范型

系统的广义特征向量

对于n×n维矩阵A,若存在一个不为零的n维向量 𝑝𝑖 和一个标量𝝀𝑖 ,𝑘 为正整数,

(𝑨 − 𝜆 𝑰) 𝑘 𝒑 =0
使得: ൝ 𝑖 𝑖
(𝑨 − 𝜆𝑖 𝑰)𝑘−1 𝒑𝑖 ≠ 0

成立,则称𝑝𝑖 为矩阵A的特征值𝛌𝑖 所对应的k 级广义特征向量。


1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

约当规范型

对于给定的n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖 。设系统的特征值为:
𝝀𝟏 (𝝈𝟏代数重,𝜶𝟏几何重),𝝀𝟐 (𝝈𝟐代数重,𝜶𝟐几何重),⋯ ,𝝀𝒍 (𝝈𝒍代数重,
𝜶𝒍 几何重)
(𝝈𝟏 + 𝝈𝟐 +⋯ + 𝝈𝒍 = 𝒏) ,则存在由各特征值的广义特征向量组成的变换阵Q,通
过变换 z=𝑸−𝟏 𝒙 ,可将状态方程化为如下的约当规范型:
𝑱𝟏
𝒛ሶ = 𝑸−𝟏 𝑨𝑸 + 𝑸−𝟏 𝑩𝒖 = ⋱ ഥ𝒖
𝒛+𝑩
𝑱𝒍
𝑱𝟏
ഥ = 𝑸−𝟏 𝑨𝑸 =
其中, 𝑨 ⋱ , ഥ =𝑸−𝟏 𝑩
𝑩
𝑱𝒍
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

𝑱𝒊𝟏 特征值 𝝀𝒊 对应的约当块矩阵 𝑱𝒊 由 𝜶𝒊个约


当子块矩阵组成。

𝑱𝒊 = 𝑱𝒊𝒌 同一个约当块中,每一个约当子块都对
⋱ 应着同一个特征值。
𝑱𝒊𝜶𝒊 𝑱𝒊的维数为 𝝈𝒊 × 𝝈𝒊 𝒊 = 𝟏, 𝟐, ⋯ , 𝒍
𝑱𝟏
⋱ 𝜆𝑖 1
𝒛ሶ = 𝑱𝒊 ഥ𝒖
𝒛+𝑩 𝜆𝑖 ⋱
⋱ 𝑱𝒊𝒌 =
⋱ 1
𝑱𝒍 𝜆𝑖
系统矩阵为 𝒍 个约当块组成的对角块矩阵; 𝑱𝒊𝒌 的维数为 𝒓𝒊𝒌 × 𝒓𝒊𝒌 𝒌 = 𝟏, 𝟐, ⋯ , 𝜶𝒊
𝒍 个约当块,对应着 𝒍 组不同的特征值;
一个约当块,对应着一组相同的特征值。 𝒓𝒊𝟏 + 𝒓𝒊𝟐 +⋯ + 𝒓𝒊𝜶𝒊 = 𝝈𝒊
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型

讨论

 当系统矩阵A的特征值有重根时,通常不可能通过线性变换而实现状态变量之间的
完全解耦,约当规范型是可能达到的最简耦合形式。同一特征根、同一约当子块
所对应的状态变量之间存才在耦合关系。
1.3 状态向量的线性变换
小结

 对同一动态系统,描述系统动态过程的状态空间表达式有无穷多种,但反映系统

本质特征的系统特征值是唯一的。

 同一动态系统,不同状态空间表达式之间,存在着一种非奇异线性变换关系。

 同一动态系统,不同状态空间表达式的系统矩阵是相似矩阵。

 不存在重根的系统,可变换为对角规范型,实现状态变量之间的完全解耦。

 存在重根的系统,通常只能变换为约当规范型,实现部分状态变量解耦。
《现代控制理论》MOOC课程

1.4 从状态空间表达式求传递函数矩阵
1.4 从状态空间表达式求传递函数矩阵

一. 传递函数矩阵的定义

定义:对于多输入-多输出线性定常系统,输入向量为 𝒖 = 𝑢1 𝑢2 ⋯ 𝑢𝑟 𝑇 , 输出向
量为 𝒚 = 𝑦1 𝑦2 ⋯ 𝑦𝑚 𝑇 , 且假定初始状态为零。 𝒖 ෝ𝒊 𝑠 分别表示 𝑢𝑖 , 𝑦𝑖 的拉氏
ෝ𝒊 𝑠 , 𝒚
变换,𝑤𝒊𝒋 (s)表示第j个输入端到第i个输出端的传递函数,系统的输入输出关系可描述为:
𝑦ො1 𝑠 = 𝑤11 𝑠 𝑢ො1 𝑠 + 𝑤12 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤1𝑟 𝑠 𝑢ො 𝑟 𝑠
𝑦ො2 𝑠 = 𝑤21 𝑠 𝑢ො1 𝑠 + 𝑤22 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤2𝑟 𝑠 𝑢ො 𝑟 𝑠

𝑦ො𝑚 𝑠 = 𝑤𝑚1 𝑠 𝑢ො1 𝑠 + 𝑤𝑚2 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤𝑚𝑟 𝑠 𝑢ො 𝑟 𝑠
写成向量形式:
𝑦ො1 (𝑠) 𝑤11 𝑠 ⋯ 𝑤1𝑟 𝑠 𝑢ො1 (𝑠)
ෝ(s)=
𝒚 ⋮ = ⋮ ⋯ ⋮ ⋮ =W(s)ෝ
𝒖 (s)
𝑦ො𝑚 (𝑠) 𝑤𝑚1 𝑠 ⋯ 𝑤𝑚𝑟 𝑠 𝑢ො 𝑟 (𝑠)
称 W(s)为系统的传递函数矩阵。
1.4 从状态空间表达式求传递函数矩阵
二. 由状态空间表达式导出传递函数矩阵

结论:对应于状态空间描述
𝒙ሶ =A 𝒙 +Bu 𝒙 𝟎 =𝟎
y=C 𝒙 +Du
其传递函数矩阵为: W(s)=C(𝒔𝑰 − 𝑨)−𝟏 𝑩 + 𝑫
并且,当D≠0时,W(s) 为真有理分式矩阵,当D=0时,𝑾 𝒔 为严格真有理分式矩阵,
且有:lim 𝑾 𝒔 = 𝑫
𝑠→∞
证明: 对状态空间表达式取拉氏变换: sX(s)=AX(s) +BU(s)
Y(s)=CX(s) +DU(s)
由状态方程的拉氏变换表达式可得:X(s)=(sI − A)−𝟏 𝑩U(s)
代入输出方程的拉氏变换表达式可得:Y(s)=(C(sI − A)−𝟏 𝑩 +D )U(s)
故传递函数矩阵为: W(s)=C(sI − A)−𝟏 𝑩 +D
1.4 从状态空间表达式求传递函数矩阵
二. 由状态空间表达式导出传递函数矩阵

对于传递函数矩阵: W(s)=C(sI − A)−𝟏 𝑩 +D


考虑: (sI − A)−𝟏 =adj (sI − A)Τ𝒅𝒆𝒕(sI − A)

且伴随矩阵 adj (sI − A) 每个元素多项式的最高次幂都小于 𝑑𝑒𝑡(sI − A) 的最高次幂,故


lim (sI − A)−𝟏 = 𝟎
𝑠→∞

因此有: lim 𝑾 𝒔 = 𝑫
𝑠→∞

故当D≠0时, 𝑾 𝒔 为真有理分式;

当D=0时,𝑾 𝒔 为严格真有理分式;
1.4 从状态空间表达式求传递函数矩阵
三. 传递函数矩阵的唯一性

一个系统的状态空间表达式是非唯一的,但其传递函数矩阵是唯一的。
证明:原系统的状态空间表达式为: 其所对应的传递函数矩阵为:
𝒙ሶ = 𝑨𝒙 + 𝑩𝒖 𝑾 𝒔 = 𝑪 𝒔𝑰 − 𝑨 −𝟏 𝑩 + 𝑫
𝒚 = 𝑪𝒙 + 𝑫𝒖
设 𝒛 = 𝑻−𝟏 𝒙 ,可得系统的另一个状态空间表达式为:
𝒛ሶ = 𝑻−𝟏 𝑨𝑻𝒛 + 𝑻−𝟏 𝑩𝒖
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
(𝑨𝑩)−𝟏 = 𝑩−𝟏 𝑨−𝟏
其对应的传递函数矩阵:
−𝟏 −𝟏 −𝟏 −𝟏
෪ 𝒔 = 𝑪𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻
𝑾 𝑻 𝑩 + 𝑫 = 𝑪𝑻 𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻 −𝟏 −𝟏
𝑩 + 𝑫 = 𝑪(𝑻 ) 𝑻 𝒔𝑰 − 𝑻 −𝟏
𝑨𝑻 𝑩+𝑫
−𝟏
= 𝑪 𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻 𝑻−𝟏 𝑩+𝑫
−𝟏
= 𝑪 𝒔𝑰 − 𝑻 𝑩 + 𝑫 = 𝑾(𝒔)

即非奇异线性变换不改变系统的传递函数矩阵,同一系统的传递函数矩阵是唯一的。
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的状态空间表达式和传递函数矩阵

由两个或两个以上的子系统按照一定方式联接构成的系统称为组合系统。组合系统的
基本组合方式可分为串联、并联和反馈三种类型。

构建组合系统数学模型的基本思路

 确定子系统可组合的条件,即确定各子系统联接的输入输出维数是否匹配。

 找出联接的各子系统间、子系统与组合系统间的输入输出关系。

 根据各子系统与组合系统的输入输出关系,导出组合系统的状态空间表达式与传递函
数矩阵。
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵

子系统并联
𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
考虑两个子系统: 𝚺𝒊 :
𝒚𝒊 = 𝑪𝒊 𝒙𝒊 + 𝑫𝒊 𝒖𝒊 (𝒊 = 𝟏, 𝟐)

经并联构成组合系统 𝚺𝒑 ,如下图所示: 𝒖𝟏 𝒚𝟏
Σ1
+
𝒖 𝒚
𝒖𝟐 𝒚𝟐 +
Σ2

 子系统 𝚺𝟏 和 𝚺𝟐 可并联的条件: 𝒅𝒊𝒎 𝒖𝟏 = 𝒅𝒊𝒎 𝒖𝟐 , 𝒅𝒊𝒎 𝒚𝟏 = 𝒅𝒊𝒎 𝒚𝟐

 并联系统与子系统的输入、输出关系 : 𝒖 = 𝒖𝟏 = 𝒖𝟐 , 𝒚 = 𝒚𝟏 + 𝒚𝟐
 由并联系统与子系统的输入输出关系导出系统的状态空间表达式 :
𝒙ሶ 𝟏 = 𝑨𝟏 𝒙𝟏 + 𝑩𝟏 𝒖 𝒙ሶ 𝟏 𝑨 𝟎 𝒙𝟏 𝑩𝟏
= 𝟏 + u
𝒙ሶ 𝟐 = 𝑨𝟐 𝒙𝟐 + 𝑩𝟐 𝒖 𝒙ሶ 𝟐 𝟎 𝑨𝟐 𝒙𝟐 𝑩𝟐
𝒚 = 𝒚𝟏 + 𝒚𝟐 = 𝑪𝟏 𝒙𝟏 + 𝑪𝟐 𝒙𝟐 + (𝑫𝟏 +𝑫𝟐 )𝒖 𝒙
𝒚 = 𝑪𝟏 𝑪𝟐 𝒙𝟏 + 𝑫𝟏 +𝑫𝟐 𝒖
𝟐
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵

 并联系统的传递函数矩阵:

子系统的传递函数矩阵为:𝒘𝒊 (𝒔) = 𝑪𝒊 (𝒔𝑰 − 𝑨𝒊 )−𝟏 𝑩𝒊+𝑫𝒊 𝑖 =1, 𝟐

由并联系统与子系统的输入、输出关系 : 𝒖 = 𝒖𝟏 = 𝒖𝟐 , 𝒚 = 𝒚𝟏 + 𝒚𝟐

可得: 𝒚 𝒔 = 𝒚𝟏 𝒔 + 𝒚𝟐 𝒔 = 𝒘𝟏 𝒔 𝒖 𝒔 + 𝒘𝟐 𝒔 𝒖 𝒔 =(𝒘𝟏 𝒔 + 𝒘𝟐 𝒔 )𝒖 𝒔

故并联组合系统的传递函数为:
𝒘 𝒔 = 𝒘𝟏 𝒔 + 𝒘𝟐 𝒔
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵

子系统串联

𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
两个子系统: 𝚺𝒊 : (𝒊 = 𝟏, 𝟐)
𝒚𝒊 = 𝑪𝒊 𝒙𝒊 + 𝑫𝒊 𝒖𝒊

经串联构成组合系统 𝚺𝒔 ,如下图所示:
𝒖𝟏 𝒚𝟏 𝒖𝟐 𝒚𝟐
𝒖 Σ1 Σ2 𝒚

同理可推导出,串联系统的状态空间表达式 :
𝒙ሶ 𝟏 𝑨𝟏 𝟎 𝒙𝟏 𝑩𝟏
= + u
𝒙ሶ 𝟐 𝑩𝟐 𝑪𝟏 𝑨𝟐 𝒙𝟐 𝑩𝟐 𝑫𝟏

𝒙
𝒚 = 𝑫𝟐 𝑪𝟏 𝑪𝟐 𝒙𝟏 + 𝑫𝟏 𝑫𝟐 𝒖
𝟐
串联系统的传递函数矩阵为:
𝒘 𝒔 = 𝒘𝟏 𝒔 𝒘𝟐 𝒔
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵

子系统的反馈联接

𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
两个子系统: 𝚺𝒊 : (𝒊 = 𝟏, 𝟐)
𝒚𝒊 = 𝑪𝒊 𝒙𝒊

经反馈联接构成组合系统 𝚺𝒇 ,如下图所示: 𝒖 𝒖𝟏 𝒚𝟏
Σ1 𝒚
+ −

𝒚𝟐 Σ2
𝒖𝟐
同理可推导出,反馈联接系统的状态空间表达式 :
𝒙ሶ 𝟏 𝑨𝟏 −𝑩𝟏 𝑪𝟐 𝒙𝟏 𝑩𝟏
= 𝒙𝟐 + u
𝒙ሶ 𝟐 𝑩𝟐 𝑪𝟏 𝑨𝟐 𝟎
𝒙
𝒚 = 𝑪𝟏 𝟎 𝒙𝟏
𝟐
反馈系统的传递函数矩阵为:
𝒘 𝒔 = 𝑰 + 𝒘𝟏 𝒔 𝒘𝟐 𝒔 −𝟏 𝒘𝟏 𝒔
《现代控制理论》MOOC课程

1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式


1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式

一. 时间离散系统

离散系统的状态空间表达式可用差分方程组表示为
𝒙(𝒌 + 𝟏) = 𝑮𝒙(𝒌) + 𝑯𝒖 (𝒌)
𝒚 𝒌 = 𝑪𝒙 𝒌 + 𝑫𝒖(𝒌)

二. 线性时变系统

线性时变系统的状态空间表达式为:
𝒙ሶ =A 𝑡 𝒙 +A 𝑡 𝒖
y=C 𝑡 𝒙 +D 𝑡 𝒖

其系数矩阵的元素中至少有一个元素是时间t的函数;
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式

三. 非线性系统

1.非线性时变系统的状态空间表达式
𝒙ሶ =f (𝒙, 𝒖, t)
y=g (𝒙, 𝒖, 𝑡)
式中,f,g为函数向量;

2.非线性定常系统的状态空间表达式

当非线性系统的状态方程中不显含时间t时,则称为非线性定常系统

𝒙ሶ =f (𝒙, 𝒖)
y=g (𝒙, 𝒖)
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式

3.非线性系统的线性化
设 𝒙0 ,𝒖0 是非线性系统 𝒙ሶ =f (𝒙, 𝒖)
𝒚 =g (𝒙, 𝒖)
的一个平衡状态, 即 f (𝒙0 , 𝒖0 )=0 , 𝒚0 =g (𝒙0 , 𝒖0 ) 。
若只考虑 𝒙0 ,𝒖0 ,𝒚0 附近小范围的行为,则可将非线性系统取一次近似而予以线性化。
将非线性函数f、g在 𝒙0 ,𝒖0 附近作泰勒级数展开,并忽略高次项,仅保留一次项:
𝜕𝑓 𝜕𝒇
𝒇 𝒙, 𝒖 = 𝒇 𝒙0 , 𝒖0 + ቟ 𝛿𝒙 + ቟ 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0

𝜕𝐠 𝜕𝐠
𝐠 𝒙, 𝒖 = 𝐠 𝒙0 , 𝒖0 + ቟ 𝛿𝒙 + ቟ 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式

则非线性系统的一次线性化方程可表示为:
𝜕𝒇 𝜕𝒇
𝜹𝒙ሶ = 𝒙ሶ − 𝒙ሶ 𝟎 = ቟ 𝛿𝒙 + ቟ 𝛿𝒖
𝜕𝒙 𝒙 ,𝒖 𝜕𝒖 𝒙
0 0 0 ,𝒖0
𝜕𝐠 𝜕𝐠
𝜹𝒚 = 𝒚 − 𝒚𝟎 = ቟ 𝛿𝒙 + ቟ 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0

将微增量 𝛿𝒙,𝛿𝒖,𝜹𝒚 用符号 𝒙 ෥,෥𝒖,෥


𝒚 表示,线性化状态方程就表示为:
෥ሶ = 𝑨෥
𝒙 𝒙 + 𝑩෥
𝒖
෥ = 𝑪෥
𝒚 𝒙 + 𝑫෥
𝒖

𝜕𝒇 𝜕𝒇 𝜕𝐠 𝜕𝐠
其中, 𝑨= ቟ , 𝑩= ቟ , 𝑪= ቟ , 𝑫= ቟
𝜕𝒙 𝒙 𝜕𝒖 𝒙 𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0 0 ,𝒖0 0 ,𝒖0
第一章 控制系统的状态空间表达式

第一章 小结

 状态变量、状态空间、状态空间表达式的定义

 建立系统状态空间表达式的方法,特别是状态变量选取的方法;

 状态空间表达式非奇异线性变换的方法;

 由状态空间表达式导出传递函数矩阵的方法;

 组合系统状态空间表达式的建立方法;

 离散系统、非线性系统状态空间的基本形式;
《现代控制理论》MOOC课程

第二章 系统状态空间表达式的解
第二章 控制系统状态空间表达式的解

线性定常齐次状态方程的解

状态转移矩阵

线性定常非齐次状态方程的解

线性时变系统状态方程的解
第二章 控制系统状态空间表达式的解

 控制系统状态空间表达式的解,就是求解系统
𝒙ሶ =A𝒙 + 𝑩𝒖 𝒙 𝟎 = 𝒙𝟎
𝒚 = 𝑪𝒙 + 𝑫𝒖
在给定初始条件 𝒙 𝟎 = 𝒙𝟎 和控制输入 𝒖(𝒕)共同作用下,状态向量和输出向量的随时
间变化的运动规律 𝒙 𝑡 , 𝒚 𝑡 。
 线性系统一定满足叠加原理。系统在初始状态 𝒙𝟎 和控制输入 𝒖(𝒕)共同作用下的运动
状态 𝒙 𝑡 ,可以分解为由初始状态 𝒙𝟎 和控制输入 𝒖(𝒕) 分别单独作用产生的运动状态
𝒙𝟎𝒖 𝑡 和 𝒙𝟎𝒙 𝑡 的叠加,即 𝒙 𝑡 = 𝒙𝟎𝒖 𝑡 + 𝒙𝟎𝒙 𝑡
零输入响应 零状态响应
响应
𝒙(𝒕) 𝒖=𝟎 𝒙𝟎𝒖 𝑡 𝒖 𝒙𝟎𝒙 𝑡
𝒖 𝒙ሶ =A𝒙 + 𝑩𝒖 = 𝒙ሶ =A𝒙 + 𝑩𝒖 + 𝒙ሶ =A𝒙 + 𝑩𝒖

𝒙𝟎 𝒙𝟎 𝒙𝟎 =0
第二章 控制系统状态空间表达式的解

定义为只有初始状态作用即𝒙𝟎 ≠ 𝟎 ,而无输入作用即 𝒖 ≡ 𝟎时系统的状态


零输入响应
响应 𝒙𝟎𝒖 𝑡 。
零输入响应 𝒙𝟎𝒖 𝑡 就是自治方程
𝒙ሶ =A𝒙,𝒙 0 = 𝒙𝟎
在非平衡初始状态 𝒙𝟎 作用下的自由解。

定义为只有输入作用即 𝒖 ≢ 𝟎 ,而无初始状态作用即 𝒙𝟎 = 𝟎时系统的状态


零状态响应 响应 𝒙𝟎𝒙 𝑡 。
零状态响应 𝒙𝟎𝒙 𝑡 就是状态方程
𝒙ሶ =A𝒙 + 𝑩𝒖,𝒙 0 = 𝟎
在平衡初始状态时,输入 𝒖 激励作用下的强迫运动。
第二章 控制系统状态空间表达式的解
𝒖≠𝟎 𝒖≠𝟎

𝒙𝟐 𝒙𝟐 𝒙𝟐

𝒕 = 𝒕𝟎
𝒙𝟎 ≠ 𝟎

𝒙𝟎 ≠ 𝟎 𝟎 𝒖≢𝟎 𝟎 𝒖≢𝟎 𝟎
𝒕 = 𝒕𝟎 𝒙𝟏 𝒙𝟏 𝒙𝟏
𝒙𝒆 = 𝟎 𝒙𝒆 = 𝟎 𝒙𝒆 = 𝟎
𝒕 = 𝒕𝟎
𝒙𝟎 = 𝟎

零输入响应 零状态响应 响应
《现代控制理论》MOOC课程

2.1 线性定常齐次状态方程的解
2.1 线性定常齐次状态方程的解
一。系统的零输入响应

线性定常系统齐次状态方程
𝒙ሶ =A𝒙,𝒙 0 = 𝒙𝟎 ,𝒕 ≥ 𝟎 (2 − 1)
的解,即系统的零输入响应 𝒙𝟎𝒖 𝑡 为:
𝒙𝟎𝒖 𝑡 = 𝒆𝑨𝒕 𝒙𝟎 , 𝒕 ≥ 𝟎
式中,𝒆𝑨𝒕 为系统矩阵A的矩阵指数函数:

1 𝟐 2 1
𝒆𝑨𝒕 ≜ 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = ෍ 𝑨𝑘 𝑡 𝑘
2! 𝑘!
𝒌=𝟎
证明:令方程(2-1)的解为系数向量待定的一个幂级数,即

𝒙𝟎𝒖 𝑡 = 𝒃𝟎 + 𝒃𝟏 𝑡 + 𝒃𝟐 𝑡 2 + ⋯ = ෍ 𝒃𝒌 𝑡 𝑘 (2 − 2)
𝒌=𝟎
其必满足方程(2-1),将上式代入方程(2-1)可得
𝒃𝟏 + 2𝒃2 𝑡 + 3𝒃3 𝑡 2 ⋯ = 𝑨(𝒃𝟎 + 𝒃𝟏 𝑡 + 𝒃𝟐 𝑡 2 + ⋯)
𝟏 𝟏 𝟐 𝟏
比较可得:𝒃𝟏 = 𝑨𝒃𝟎 , 𝒃2 = 𝟐 𝑨𝒃𝟏 = 𝑨 𝒃𝟎 , ⋯ , 𝒃𝒌 = 𝑨𝒌 𝒃𝟎 , ⋯
𝟐 𝒌!
2.1 线性定常齐次状态方程的解

将求得的待定系数,代入(2-2)式可得:
1 2 2 1 3 3
𝒙𝟎𝒖 𝑡 = (𝑰 + 𝑨𝑡 + 𝑨 𝑡 + 𝑨 𝑡 + ⋯ )𝒃𝟎
2! 3!
由初始条件 𝒙𝟎𝒖 0 = 𝒙𝟎 可得 𝒃𝟎 = 𝒙𝟎 ,故
1 2 2 1 3 3
𝒙𝟎𝒖 𝑡 = (𝑰 + 𝑨𝑡 + 𝑨 𝑡 + 𝑨 𝑡 + ⋯ )𝒙𝟎 = 𝒆𝑨𝒕 𝒙𝟎
2! 3!
得证

线性定常系统零输入响应的几点说明

 如果 𝑡 取某个固定值,零输入响应就是状态空间中由初始状态 𝒙𝟎 经线性变换阵 𝒆𝑨𝒕 所导


出的一个变换点。系统的自由运动就是由初始状态 𝒙𝟎 出发,并由各个时刻的变换点 𝒙 𝑡
所组成的一条轨线;
 零输入响应轨线的形态由矩阵指数函数唯一地确定;
2.1 线性定常齐次状态方程的解

lim 𝒆 𝑨𝒕 =0
 线性定常系统渐进稳定的充要条件是:𝑡→∞
系统渐进稳定的条件是:当时 𝑡 → ∞ ,自由运动的轨迹将趋于系统的平衡状态 𝒙𝒆 = 𝟎 ,
即状态空间的原点。

 求解零输入响应的核心是计算矩阵指数函数 𝒆𝑨𝒕

 当 𝒙 𝒕𝟎 = 𝒙𝟎 , 𝒕𝟎 ≠ 𝟎时,零输入响应表达式更一般的形式:
𝒙𝟎𝒖 𝑡 = 𝒆𝑨(𝒕−𝒕𝟎) 𝒙𝟎 𝒕 ≥ 𝒕𝟎
2.1 线性定常齐次状态方程的解

二. 矩阵指数函数的性质

由矩阵指数函数的定义:

1 𝟐 2 1 𝑘 𝑘
𝒆𝑨𝒕 ≜ 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = ෍ 𝑨 𝑡
2! 𝑘!
𝒌=𝟎
可得以下一些基本性质:

1. lim 𝒆𝑨𝒕 = 𝑰
𝒕→𝟎

2. 令 𝒕 和 𝝉 为两个时间变量,则必成立:𝒆𝑨(𝒕+𝜏) = 𝒆𝑨𝑡 𝒆𝑨𝜏 = 𝒆𝑨𝜏 𝒆𝑨𝒕


证明:𝒆𝑨𝒕 𝒆𝑨𝝉=( 𝑰 + 𝑨𝑡 + 2!1 𝑨𝟐 𝑡 2 + ⋯ ) ( 𝑰 + 𝑨𝜏 + 2!1 𝑨2 𝜏 2 + ⋯ ) = 𝑰 + 𝑨(𝑡 + 𝜏) + 2!1 𝑨𝟐 (𝑡 + 𝜏)2 + ⋯ =𝒆𝑨(𝒕+𝜏)
3. 矩阵指数函数的逆:(𝒆𝑨𝒕 )−𝟏 = 𝒆−𝑨𝒕
证明: 因为 𝒆𝑨𝒕 𝒆−𝑨𝒕 = 𝒆𝑨(𝒕−𝒕) = 𝑰
所以 𝒆−𝑨𝒕 = (𝒆𝑨𝒕 )−𝟏
2.1 线性定常齐次状态方程的解

𝒅 𝑨𝑡
4. 矩阵指数函数 对t的导数为: (𝒆 ) = 𝑨𝒆𝑨𝑡 = 𝒆𝑨𝑡 𝑨
𝒆𝑨𝒕
𝒅𝒕
证明: 𝒅 (𝒆𝑨𝑡 ) = 𝑨 + 𝑨𝟐 𝑡 + 1 𝑨𝟑 𝑡 2 + ⋯ + 1 𝑨𝒌 𝑡 𝑘−1 + ⋯
𝒅𝒕 2! 𝑘−1 !
1 𝟐 2 1
=𝑨(𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯+ 𝑨 𝒌−𝟏 𝑡 𝑘−1
+ ⋯ ) = 𝐴𝒆𝑨𝑡
2! 𝑘−1 !

1 𝟐 2 1
= 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯+ 𝑨 𝒌−𝟏 𝑡 𝑘−1 + ⋯ 𝐴 = 𝒆𝑨𝑡 A
2! 𝑘−1 !

5. 设有n×n维常阵A和B,如果A和B是可交换的,即AB=BA,则必成立:
𝒆(𝑨+𝑩)𝒕 = 𝒆𝑨𝒕 𝒆𝑩𝒕 = 𝒆𝑩𝒕 𝒆𝑨𝒕
由定义,用数学归纳法可证明。
6. 矩阵指数函数的积: (𝒆𝑨𝒕 )𝒎= 𝒆𝑨(𝒎𝒕) , 𝒎 = 𝟎, 𝟏, 𝟐, ⋯
由性质2,可证明。
《现代控制理论》MOOC课程

第二章 系统状态空间表达式的解
2.1 线性定常齐次状态方程的解

三. 矩阵指数函数的计算方法

1 𝟐 2 1 𝑘 𝑘 直接计算。
方法一 根据矩阵指数函数的定义:𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = ෍ 𝑨 𝑡
2! 𝑘!
𝒌=𝟎

方法二 将A阵化为对角标准型或约当标准型求解

1. A的特征值不存在重根
若A的n个特征值 𝝀𝟏 , 𝝀𝟐 ,⋯ , 𝝀𝒏 不存在重根,则在求出使A阵实现对角化
𝝀𝟏
𝝀𝟐
𝑻−𝟏 𝑨𝑻 =

𝝀𝒏
𝒆 𝝀𝟏 𝒕
的变换阵 𝑻−𝟏 、𝑻 后,即有指数函数矩阵: 𝒆𝑨𝒕 = 𝑻 𝒆𝝀𝟐 𝒕 𝑻−𝟏

𝒆𝝀𝒏 𝒕
2.1 线性定常齐次状态方程的解
证明:
𝝀𝟏 𝝀𝟏
𝝀𝟐 𝝀𝟐
由 𝑻−𝟏𝑨𝑻 = ⋱ 可得 𝑨=𝑻

𝑻−𝟏
𝝀𝒏 𝝀𝒏
𝑘 𝑘
∞ ∞ 𝝀𝟏 ∞ 𝝀𝟏
𝑨𝒕
1 𝑘 𝑘 1 𝝀𝟐 1 𝝀𝟐
𝒆 =෍ 𝑨 𝑡 =෍ 𝑻 𝑻 −𝟏 𝑘
𝑡 =෍ 𝑻 ⋱ 𝑻−𝟏 𝑡𝑘
𝑘! 𝑘! ⋱ 𝑘!
𝒌=𝟎 𝒌=𝟎 𝒌=𝟎
𝝀𝒏 𝝀𝒏


1 𝒌 𝑘
෍ 𝝀𝟏 𝑡
𝑘!
𝒌=𝟎

1 𝒌 𝑘 𝒆𝝀𝟏 𝒕
෍ 𝝀 𝑡 𝑻−𝟏 = 𝑻 𝒆𝝀𝟐 𝒕
=𝑻 𝑘! 𝟐 𝑻−𝟏
𝒌=𝟎 ⋱


𝒆 𝝀𝒏 𝒕
1 𝒌 𝑘 得证
෍ 𝝀 𝑡
𝑘! 𝒏
𝒌=𝟎
2.1 线性定常齐次状态方程的解

2. A的特征值存在重根
若A的𝒍组不同特征值为:𝝀𝟏 ,𝝀𝟐 ,⋯ ,𝝀𝒍 ,代数重数分别为𝝈𝟏 ,𝝈𝟐 ,⋯ ,𝝈𝒍 (𝝈𝟏 +𝝈𝟐 +⋯ +𝝈𝒍 = 𝒏)
且几何重数均为1,则在求出使A阵为约当标准型:

𝑱𝟏 𝜆𝑖 1
𝑱𝟐 𝜆𝑖 ⋱
𝑱 = 𝑻−𝟏 𝑨𝑻 = 其中 𝑱𝒊 = 为 𝝈𝒊 × 𝝈𝒊 维矩阵
⋱ ⋱ 1
𝑱𝒍 𝜆𝑖
的变换阵 𝑻−𝟏 、𝑻 后,即有指数函数矩阵: 𝟏 𝟐 𝟏
𝟏 𝒕 𝒕⋯ 𝒕𝝈𝒊−𝟏
𝟐! (𝝈𝒊 − 𝟏)!
𝒆𝑱𝟏 𝒕 𝟏
𝒆𝑨𝒕 = 𝑻 𝒆𝑱𝟐 𝒕 𝑻−𝟏 其中 𝒆𝑱𝒊𝒕 = 𝒆𝝀𝒊𝒕 𝟎 𝟏 𝒕 ⋯ 𝒕𝝈𝒊 −𝟐
⋱ (𝝈𝒊 − 𝟐)!
𝒆𝑱𝒍𝒕 ⋮ ⋮ ⋮ ⋯ ⋮
𝟎 𝟎 𝟎 ⋯ 𝒕
𝟎 𝟎 𝟎 ⋯ 𝟏
证明:证明的思路与1相同,略去。
2.1 线性定常齐次状态方程的解
三. 矩阵指数函数的计算方法
𝒕𝒌 𝟏
𝑳 = 𝒌+𝟏
方法三 拉氏变换法 :𝒆𝑨𝒕 = 𝑳−𝟏 (𝑠𝑰 − 𝑨)−𝟏 𝒌! 𝒔

证明:由矩阵指数函数的定义: 𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 1 𝑨𝟐 𝑡 2 + ⋯ = ෍ 1 𝑨𝑘 𝑡 𝑘
2! 𝑘!
𝒌=𝟎
取拉氏变换

𝟏 𝟏 𝟏 𝟐 1
𝑳(𝒆𝑨𝒕 ) = 𝑰 + 𝟐 𝑨 + 𝟑 𝑨 + ⋯ = ෍ (𝑘+1) 𝑨𝑘
𝒔 𝒔 𝒔 𝑠
∞ 𝒌=𝟎
𝒌
= 𝒔−𝟏 ෍ 𝒔−𝟏 𝑨 = 𝒔−𝟏 𝑰 − 𝒔−𝟏 𝑨 −𝟏

𝒌=𝟎

= 𝒔𝑰 − 𝑨 −𝟏

1
取拉氏反变换 1=
𝒆𝑨𝒕 𝑥2 + ⋯ + 𝑥𝑘
+ 𝑳𝑥−𝟏+(𝑠𝑰 − 𝑨)−𝟏 +⋯ = ෍𝒙 =𝑘
=(1 − 𝑥)−1
𝒌=𝟎
1−𝑥
得证
2.1 线性定常齐次状态方程的解
三. 矩阵指数函数的计算方法

方法四 应用凯莱-哈迷尔顿定理将𝒆𝑨𝒕 表示为一个多项式


𝒆𝑨𝒕 =𝑎0 𝑡 𝐼 + 𝑎1 𝑡 A+𝑎2 𝑡 𝐴2 +⋯ + 𝑎𝑛−1 𝑡 𝐴𝑛−1
若A的特征值两两互异,则多项式的系数可按下式计算:
−1
𝑎0 𝑡 1 𝜆1 𝜆12 ⋯ 𝜆1𝑛−1 𝑒 𝜆1𝑡
𝑎1 𝑡
= 1 𝜆2 𝜆22 ⋯ 𝜆𝑛−1
2 𝑒 𝜆2𝑡
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑎𝑛−1 𝑡 1 𝜆𝑛 𝜆2𝑛 ⋯ 𝜆𝑛−1
𝑛 𝑒 𝜆𝑛𝑡
若A的n个特征值为:𝝀𝟏 ,𝝀𝟐 ,⋯ ,𝝀𝒍 ,代数重数分别为𝝈𝟏 ,𝝈𝟐 ,⋯ ,𝝈𝒍 ,几何重数均为1,
1
𝑎0 𝑡 𝑡 𝜎1−1 𝑒 𝜆1𝑡 𝑝𝑖1 = 1 𝜆𝑖 𝜆2𝑖 ⋯ 𝜆𝑛−1
𝑝1𝜎1 −1 𝜎1 − 1 ! 𝑖
⋮ ⋮ ⋮ 𝑑𝑝𝑖1
𝑎𝜎1 𝑡 𝑝11 𝑒 𝜆1 𝑡 𝑝𝑖2 =
𝑑𝜆𝑖
⋮ = ⋮ ⋮ 式中
𝑎(σ𝑙−1 𝑡 𝑝𝑙𝜎𝑙 ⋮
𝑘=1 𝜎𝑘 )+1
1
⋮ 𝑡 𝜎𝑙 −1 𝑒 𝜆𝑙 𝑡 1 𝑑 𝜎𝑖 −1 𝑝𝑖1
⋮ 𝜎𝑙 − 1 ! 𝑝𝑖𝜎𝑖 =
𝑝𝑙1 𝜎𝑖 − 1 ! 𝑑𝜆 𝜎𝑖 −1
𝑎𝑛−1 𝑡 ⋮ 𝑖
𝑒 𝜆𝑙 𝑡
方法四 2.1 线性定常齐次状态方程的解

凯莱-哈迷尔顿定理
设 𝐴 ∈ 𝑅𝑛×𝑛 , 其特征多项式为:
𝐷 𝜆 = 𝜆𝐼 − 𝐴 = 𝜆𝑛 + 𝑎𝑛−1 𝜆𝑛−1 + ⋯ + 𝑎1 𝜆 + 𝑎0 = 0

则矩阵A必满足其特征多项式,即
𝑨𝑛 + 𝑎𝑛−1 𝑨𝑛−1 + ⋯ + 𝑎1 𝑨 + 𝑎0 𝑰 = 𝟎
方法四 2.1 线性定常齐次状态方程的解

证明:由凯莱-哈迷尔顿定理 𝑨𝑛 可表示为 𝑨𝑛−1 、𝑨𝑛−2 、 ⋯ 、𝑨、𝑰 的线性组合,即


𝑨𝑛 = −𝑎𝑛−1 𝑨𝑛−1 − ⋯ − 𝑎1 𝑨 − 𝑎0 𝑰
进而有:
𝑨𝑛+1 = 𝑨𝑨𝑛 = 𝑨(−𝑎𝑛−1 𝑨𝑛−1 − ⋯ − 𝑎1 𝑨 − 𝑎0 𝑰) = −𝑎𝑛−1 𝑨𝑛 − 𝑎𝑛−2 𝑨𝑛−1 − ⋯ − 𝑎1 𝑨2 − 𝑎0 𝑨

= −𝑎𝑛−1 (−𝑎𝑛−1 𝑨𝑛−1 − ⋯ − 𝑎1 𝑨 − 𝑎0 𝑰) − 𝑎𝑛−2 𝑨𝑛−1 − ⋯ − 𝑎1 𝑨2 − 𝑎0 𝑨


2
= (𝑎𝑛−1 −𝑎𝑛−2 )𝑨𝑛−1 +(𝑎𝑛−1 𝑎𝑛−2 − 𝑎𝑛−3 )𝑨𝑛−3 + ⋯ + 𝑎𝑛−1 𝑎1 − 𝑎0 𝑨 + 𝑎𝑛−1 𝑎0 𝑰

这样 𝑨𝑛+1 、𝑨𝑛+2 、 ⋯ 均可表示为 𝑨𝑛−1 、𝑨𝑛−2 、 ⋯ 、𝑨、𝑰的线性组合。


1 𝟐 2
故有:𝒆 𝑨𝒕
= 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ =𝑎0 𝑡 𝐼 + 𝑎1 𝑡 A+𝑎2 𝑡 𝐴2 +⋯ + 𝑎𝑛−1 𝑡 𝐴𝑛−1
2!
若A的特征值不存在重根,则有

𝒆𝝀𝟏 𝒕
𝒆𝑨𝒕 = 𝑻 𝒆 𝝀𝟐 𝒕 𝑻−𝟏 =𝑎0 𝑡 𝐼 + 𝑎1 𝑡 A+𝑎2 𝑡 𝐴2 +⋯ + 𝑎𝑛−1 𝑡 𝐴𝑛−1

𝒆𝝀𝒏 𝒕
方法四 2.1 线性定常齐次状态方程的解
𝑻−𝟏 𝐴2 𝑻=(𝑻−𝟏 𝑨𝑻)(𝑻−𝟏 𝑨𝑻)
𝑒 𝜆1 𝑡
𝑒 𝜆2𝑡 =𝑎0 𝑡 𝑻−𝟏 𝑻 + 𝑎1 𝑡 𝑻−𝟏 A𝑻+𝑎2 𝑡 𝑻−𝟏 𝐴2 𝑻+ ⋯ + 𝑎𝑛−1 𝑡 𝑻−𝟏 𝐴𝑛−1 𝑻

𝑒 𝜆𝑛 𝑡
𝜆1 𝜆12 𝜆1𝑛−1
𝜆2 𝜆22 𝜆𝑛−1
=𝑎0 𝑡 𝑰 + 𝑎1 𝑡 ⋱ +𝑎2 𝑡 + ⋯ + 𝑎𝑛−1 𝑡 2
⋱ ⋱
𝜆𝑛 𝜆2𝑛 𝜆𝑛−1
𝑛
比较等式两边可得:
−𝟏
𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝟏 + 𝑎2 𝑡 𝝀𝟐𝟏 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 =𝒆 𝝀𝟏 𝒕 𝑎0 𝑡 1 𝜆1 𝜆12 … 𝜆1𝑛−1 𝑒 𝜆1𝑡
𝟏
𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝟐 + 𝑎2 𝑡 𝝀𝟐𝟐 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 = 𝒆𝝀 𝟐 𝒕
𝑎1 𝑡
= 1 𝜆2 𝜆22 … 𝜆𝑛−1
2 𝑒 𝜆2𝑡
𝟐 解得 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮

𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝒏 + 𝑎2 𝑡 𝝀𝟐𝒏 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 = 𝒆𝝀 𝒏 𝒕
𝑎𝑛−1 𝑡 1 𝜆𝑛 𝜆2𝑛 … 𝜆𝑛−1
𝑛 𝑒 𝜆𝑛 𝑡
𝒏

对于有重根的情况,可类似地方法证明。
得证。
2.1 线性定常齐次状态方程的解
例1 设系统矩阵为 𝑨 = 0 1
−2 −3
按照矩阵指数函数的定义和拉氏变换法求 𝒆𝑨𝒕 。
解:(1) 用定义计算
1 𝟐 2 0 1 1 0 1 𝟐
1 − 𝑡 2+⋯ 𝑡 − 1.5𝑡 2+⋯
𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = 𝑰 + 𝑡+ 𝑡2 +⋯=
2! −2 −3 2! −2 −3 −2𝑡 + 3𝑡 2 + ⋯ 1 − 3𝑡 + ⋯
(2) 用拉氏变换法计算
𝑠+3 1
𝑠 −1 (𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)
(s𝑰 − 𝑨) = (s𝑰 − 𝑨)−𝟏 =
2 𝑠+3 −2 𝑠
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)

𝑠+3 1
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2) 2𝑒 −𝑡
− 𝑒 −2𝑡
𝑒 −𝑡 − 𝑒 −2𝑡
𝒆𝑨𝒕 = 𝑳−𝟏 (s𝑰 − 𝑨)−𝟏 = 𝑳−𝟏 =
−2 𝑠 −2𝑒 −𝑡 + 2𝑒 −2𝑡 −𝑒 −𝑡 + 2𝑒 −2𝑡
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)
2.1 线性定常齐次状态方程的解
0 1 0
例2 用标准型法计算系统矩阵 𝑨 = 0 0 1 的 𝒆𝑨𝒕
2 3 0
解:矩阵A的特征方程为
𝜆𝑰 − 𝑨 = (𝜆3 − 3𝜆 − 2) = 𝜆 + 1 2 𝜆−2 =0
解得系统特征根为:𝜆1 = 2( 𝜎1 = 1), 𝜆2 = −1( 𝜎2 = 2)
2 −1 0
𝜆𝟏的几何重数 𝛼𝟏 = 3 − rank(𝝀𝟏 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 0 2 −1 = 3 − 2=1
−2 −3 2
−1 −1 0
𝜆𝟐的几何重数 𝛼𝟐 = 3 − rank(𝝀𝟐 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 0 −1 −1 = 3 − 2=1
−2 −3 −1
计算特征根对应的特征向量和广义特征向量:
将𝝀𝟏 = 2,代入特征向量计算公式(𝑨 − 𝜆𝑖 𝑰)𝑝𝑖 = 0
−2 1 0 𝑝11 𝑝11 1
0 −2 1 𝑝21 =0 解得 𝑝21 = 2
可得
2 3 −2 𝑝31 𝑝31 4
2.1 线性定常齐次状态方程的解

将𝝀𝟐 = −1,代入特征向量计算公式(𝑨 − 𝜆𝑖 𝑰)𝑝𝑖 = 0


1 1 0 𝑝12 𝑝12 1
可得 0 1 1 𝑝22 =0 解得 𝑝22 = −1
2 3 1 𝑝32 𝑝32 1
将𝝀𝟐 = −1,代入广义特征向量计算公式(𝑨 − 𝜆𝑖 𝑰)𝑝𝑖 = 𝑝𝑖−1
1 1 0 𝑝13 1 𝑝13 1
可得 0 1 1 𝑝23 = −1 解得 𝑝23 = 0
2 3 1 𝑝33 1 𝑝33 −1

1 1 1 𝟏 1 2 1
故变换阵为:T = 2 −1 0 故变换阵的逆为:𝑻−𝟏 = 2 −5 2
𝟗
4 1 −1 6 3 −3
2.1 线性定常齐次状态方程的解

𝒆𝑨𝒕 =𝑻 𝒆𝟐𝒕 𝟎 𝑻−𝟏


𝟎 𝒆𝑱𝟐 𝒕

而𝝀𝟐 = −1的约当块矩阵指数函数为:
−𝟏 𝟏 −𝒕
𝒆𝑱𝟐 𝒕 =𝒆 𝟎 −𝟏
𝒕
= 𝒆 𝒕𝒆−𝒕
𝟎 𝒆−𝒕
这样,系统的矩阵指数函数为:
1 1 1 𝑒 2𝑡 0 0 1 2 1
𝑨𝒕 1
𝒆 = 2 −1 0 0 𝑒 −𝑡 𝑡𝑒 −𝑡 2 −5 2
9
4 1 −1 0 0 𝑒 −𝑡 6 3 −3

𝑒 2𝑡 + (8 + 6𝑡)𝑒 −𝑡 2𝑒 2𝑡 + (−2 + 3𝑡)𝑒 −𝑡 𝑒 2𝑡 − (1 + 3𝑡)𝑒 −𝑡


1
= 2𝑒 2𝑡 − (2 + 6𝑡)𝑒 −𝑡 4𝑒 2𝑡 + (5 − 3𝑡)𝑒 −𝑡 2𝑒 2𝑡 + (−2 + 3𝑡)𝑒 −𝑡
9
4𝑒 2𝑡 + (−4 + 6𝑡)𝑒 −𝑡 8𝑒 2𝑡 + (−8 + 3𝑡)𝑒 −𝑡 4𝑒 2𝑡 + (5 − 3𝑡)𝑒 −𝑡
2.1 线性定常齐次状态方程的解

例3. 用凯莱-哈密尔顿法计算系统矩阵的矩阵指数函数𝒆𝑨𝒕
0 1 0
𝑨= 0 0 1
−6 −11 −6
解:矩阵A的特征方程为
𝜆𝑰 − 𝑨 = (𝜆3 + 6𝜆2 + 11𝜆 + 6) 解的系统的特征值为 𝜆1 = −1,𝜆2 = −2,𝜆,3 = −3
3𝑒 −𝑡 − 3𝑒 −2𝑡 + 𝑒 −3𝑡
𝑎0 𝑡 −𝟏 5 −𝑡 3 −3𝑡
1 −1 1 𝑒 −𝑡 −2𝑡
𝑒 − 4𝑒 + 𝑒
𝑎1 𝑡 = 1 −2 4 𝑒 −2𝑡 = 2 2
𝑎2 𝑡 1 −3 9 𝑒 −3𝑡 1 −𝑡 −2𝑡
1 −3𝑡
𝑒 −𝑒 + 𝑒
2 2

于是: 5 −𝑡 3 1 −𝑡 1
3𝑒 −𝑡 − 3𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 4𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 𝑒 −2𝑡 + 𝑒 −3𝑡
2 2 2 2
5 9 1 −𝑡 3
𝒆𝑨𝒕 = 𝑎0 𝑡 I +𝑎1 𝑡 A+𝑎2 𝑡 𝑨2 = −3𝑒 −𝑡 + 6𝑒 −2𝑡 − 3𝑒 −3𝑡 − 𝑒 −𝑡 + 8𝑒 −2𝑡 − 𝑒 −3𝑡
2 2 2
𝑒 − 2𝑒 −2𝑡 + 𝑒 −3𝑡
2
5 −𝑡 27 1 −𝑡 9
3𝑒 −𝑡 − 12𝑒 −2𝑡 + 9𝑒 −3𝑡 𝑒 − 16𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 4𝑒 −2𝑡 + 𝑒 −3𝑡
2 2 2 2
《现代控制理论》MOOC课程

2.2 状态转移矩阵
2.2 状态转移矩阵
一. 状态转移矩阵的定义

定义:对于给定的线性定常系统 𝒙ሶ =A𝒙 + 𝑩𝒖 其中,x为n维状态向量

称满足如下矩阵微分方程
ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡

的n×n维解阵 𝚽 𝑡 − 𝑡0 为系统的状态转移矩阵。

求解矩阵微分方程可得,状态转移矩阵为: 𝚽 𝑡 − 𝑡0 = 𝒆𝑨(𝒕−𝑡0 ) ,𝑡 ≥ 𝑡0
当 𝑡0 = 0时,状态转移矩阵可表示为: 𝚽 𝑡 = 𝒆𝑨𝒕 ,𝑡 ≥ 0

 系统的零输入响应可用状态转移矩阵表示:
𝒙 𝒕 = 𝒆𝑨 𝒕−𝑡0 𝒙 𝑡0 = 𝚽 𝒕 − 𝑡0 𝒙 𝑡0 ,𝑡 ≥ 𝑡0 或 𝒙 𝒕 = 𝒆𝑨𝒕 𝒙 0 = 𝚽 𝒕 𝒙 0 ,𝑡 ≥ 0
 状态转移矩阵的物理意义 :
𝚽 𝒕 − 𝑡0 就是在零输入条件下将时刻 𝑡0 的状态 𝑥0 转移到时刻t的状态 𝒙(𝑡) 的一个线性变换。
2.2 状态转移矩阵
二. 状态转移矩阵的性质

1. 分解性 𝚽 𝑡 + 𝜏 = 𝚽 𝑡 𝚽 𝜏
证明:由状态转移矩阵的物理意义:
𝒙 𝑡 = 𝚽 𝑡 − (−𝜏 )𝒙(−𝜏) = 𝚽 𝑡 + 𝜏 𝒙 −𝜏
𝒙 𝑡 = 𝚽 𝑡 𝒙 0 = 𝚽 𝑡 𝚽 0 − (−𝜏 )𝒙 −𝜏 =𝚽(𝑡)𝚽(𝜏) 𝒙(−𝜏)
故有: 𝚽 𝑡 + 𝜏 = 𝚽 𝑡 𝚽 𝜏
从-𝜏 到t的转移,可以看作是从-𝜏 转移到0,再从0转移到t的组合。
2. 可逆性 𝚽 𝑡 −𝟏 = 𝚽 −𝑡
证明: 由性质1
𝚽 𝑡 − 𝑡 = 𝚽 𝑡 𝚽 −𝑡 = 𝑰 故有: 𝚽 𝑡 −𝟏 = 𝚽 −𝑡
状态转移矩阵的逆意味着状态向量按时间的逆向转移。
即从0状态到t状态转移的逆,等于从t状态到0状态的转移。
2.2 状态转移矩阵
二. 状态转移矩阵的性质

3. 传递性 𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 = 𝚽 𝑡2 − 𝑡0
一个转移过程可以分解为若干个小的转移过程。即从𝑡0到𝑡2的转移等于从 𝑡0 转移到 𝑡1 ,
再从 𝑡1 转移到 𝑡2 。
证明:由状态转移矩阵的物理意义:
𝑥 𝑡2 = 𝚽 𝑡2 − 𝑡0 𝒙(𝑡0 )
𝑥 𝑡2 = 𝚽 𝑡2 − 𝑡1 𝒙(𝑡1 ) = 𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 𝒙(𝑡0 )
故有:𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 = 𝚽 𝑡2 − 𝑡0

𝒌
4. 倍时性 𝚽(𝑡) = 𝚽 𝑘𝑡
状态转移矩阵的k次方等于该转移矩阵的时间自变量扩大k倍。
证明:由性质1
𝚽(𝑡) 𝒌 = 𝚽(𝑡) ⋯ 𝚽(𝑡) = 𝚽 𝑘𝑡
2.2 状态转移矩阵
二. 状态转移矩阵的性质

5. 微分性和交换性 𝚽ሶ 𝒕 = 𝑨𝚽 𝒕 = 𝚽 𝒕 𝑨
状态转移矩阵与矩阵A的乘积是可以互换的。
证明:由矩阵指数函数的性质
𝑑 𝑨𝑡
(𝒆 ) = 𝑨𝒆𝑨𝑡 = 𝒆𝑨𝑡 𝑨
𝑑𝑡

故有: 𝚽ሶ 𝒕 = 𝑨𝚽 𝒕 = 𝚽 𝒕 𝑨
6. 唯一性
系统的状态转移矩阵唯一地由系统的系统矩阵决定。

ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
由状态转移矩阵的定义 𝚽(𝑡
其唯一的参数就是系统矩阵。
2.2 状态转移矩阵
三. 状态转移矩阵的算法

状态转移矩阵实质上就是矩阵指数函数,其求解方法与矩阵指数函数相同。

例:已知线性定常系统的状态转移矩阵𝚽 𝒕 为:
1 −𝑡 3𝑡
1
(𝑒 + 𝑒 ) (−𝑒 −𝑡 + 𝑒 3𝑡 )
𝚽 𝒕 = 2 4
−𝑡 3𝑡
1 −𝑡
−𝑒 + 𝑒 (𝑒 + 𝑒 3𝑡 )
2
求系统矩阵。
解:由状态转移矩阵的定义:𝚽(𝑡) ሶ =A𝚽 𝑡 ,𝚽 0 = 𝑰,𝑡 ≥ 0

解法1:由 A = 𝚽(𝑡)𝚽 𝑡 −𝟏 计算


解法2:由 A = 𝚽(𝑡)𝚽 𝑡 −𝟏 ห ሶ
= 𝚽(𝑡) ห𝒕=𝟎
𝒕=𝟎

1 −𝑡 3𝑡
1 −𝑡
(−𝑒 + 3𝑒 ) (𝑒 + 3𝑒 3𝑡 )

𝚽(𝒕) = 2 4 ሶ
A = 𝚽(𝑡) ห𝒕=𝟎 = 1 1
−𝑡 3𝑡
1 4 1
𝑒 + 3𝑒 (−𝑒 −𝑡 + 3𝑒 3𝑡 )
2
《现代控制理论》MOOC课程

2.3 线性定常系统非齐次状态方程的解
2.3 线性定常系统非齐次状态方程的解

一. 零状态响应

结论: 给定初始状态为零的线性定常系统
𝒙ሶ =A𝒙+Bu,𝒙 0 = 𝟎,𝑡 ≥0
其中,x为n维状态向量,u为r维输入向量,A和B分别为n×n和n×r常阵,那么系统的零
状态响应可表示为:
𝒕 𝑨 𝒕−𝝉
𝒙𝟎𝒙 (𝒕) = ‫𝒆 𝟎׬‬ 𝑩𝒖(𝝉)d𝝉 𝑡≥𝟎

证明: 𝒅 −𝑨𝑡
𝒆 𝒙 = 𝒆−𝑨𝒕 −𝑨 𝒙 + 𝒆−𝑨𝑡 𝒙ሶ =𝒆−𝑨𝑡 𝒙ሶ − 𝑨𝒙 = 𝒆−𝑨𝑡 𝑩𝒖(𝑡)
𝒅𝒕 𝒕

对上式两边从0到t进行积分,得到 𝒆−𝑨𝑡 𝒙 𝒕 − 𝒙 0 = න 𝒆−𝑨𝜏 𝑩𝒖 𝜏 𝒅𝜏


𝟎
由初值条件 𝒙 0 = 𝟎 ,等式两边左乘 𝒆𝑨𝑡 即得:
𝒕 𝒕 𝒕 𝒕
𝒙𝟎𝒙 𝒕 = 𝒆𝑨𝑡 න 𝒆−𝑨𝜏 𝑩𝒖 𝜏 𝒅𝜏 = න 𝒆𝑨𝑡 𝒆−𝑨𝜏 𝑩𝒖 𝜏 𝒅𝜏 = න 𝒆𝑨(𝑡−𝜏) 𝑩𝒖 𝜏 𝒅𝜏 = න Φ(𝒕 − 𝝉)𝑩𝒖 𝜏 𝒅𝜏
𝟎 𝟎 𝟎 𝟎
得证
2.3 线性定常系统非齐次状态方程的解

二. 线性定常系统非齐次状态方程的解

同时考虑初始状态 𝒙𝟎 和外部输入 𝒖 作用的线性定常系统的运动规律,即状态方程

𝒙ሶ =A𝒙+Bu,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
的解可以表示为零输入响应和零状态响应的叠加,即
𝒕 𝒕
𝒙 𝑡 = 𝒙𝟎𝒖 𝒕 + 𝒙𝟎𝒙 𝒕 = 𝒆𝑨𝑡 𝒙𝟎 + ‫𝑡(𝑨𝒆 𝟎׬‬−𝜏) 𝑩𝒖 𝜏 𝒅𝜏 = Φ 𝒕 𝒙𝟎 + ‫ 𝟎׬‬Φ 𝒕 − 𝝉 𝑩𝒖 𝜏 𝒅𝜏, 𝑡 ≥0

或写为更一般的形式:
𝒕 𝒕

𝒙 𝑡 = 𝒆𝑨(𝑡−𝑡0) 𝒙(𝑡𝟎 ) + න 𝒆𝑨(𝑡−𝜏) 𝑩𝒖 𝜏 𝒅𝜏 = Φ 𝒕 − 𝑡0 𝒙(𝑡𝟎 ) + න Φ 𝑡 − 𝜏 𝑩𝒖 𝜏 𝒅𝜏, 𝑡 ≥ 𝑡0


𝑡0 𝑡0
2.3 线性定常系统非齐次状态方程的解
三. 线性定常系统的响应

1. 脉冲响应: 𝒖 𝑡 = 𝑲𝛿(𝑡)
𝒕
𝒕
𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝒖 𝜏 𝑑𝜏 =𝒆𝑨𝑡 𝒙𝟎 + ‫𝑡(𝑨𝒆 𝟎׬‬−𝜏) 𝑩𝑲𝛿 𝜏 𝑑𝜏
𝟎
𝒕
=𝒆𝑨𝑡 𝒙𝟎 + ‫𝑡(𝑨𝒆 𝟎׬‬−𝜏) 𝛿 𝜏 𝑑𝜏 𝑩𝑲 =𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝑩𝑲

2. 阶跃响应: 𝒖 𝑡 = 𝑲1(𝑡)
𝒕 𝒕
𝒕
𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲1(𝜏) 𝑑𝜏= 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲 𝑑𝜏 = 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 ‫𝒆 𝟎׬‬−𝑨𝜏 𝑑𝜏 𝐵𝐾
𝟎 𝟎

𝒕
= 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 ‫𝒆𝒅 𝟎׬‬−𝑨𝜏 (−𝑨−𝟏 ) 𝑩𝐾 = 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝒆−𝑨𝑡 − 𝑰 (−𝑨−𝟏 ) 𝑩𝐾

= 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 − 𝑰 𝑨−𝟏 𝑩𝐾 = 𝒆𝑨𝑡 𝒙𝟎 + 𝑨−𝟏 𝒆𝑨𝑡 − 𝑰 𝑩𝐾


2.3 线性定常系统非齐次状态方程的解
三. 线性定常系统的响应 令 𝑡−𝜏 =𝜇
3. 斜坡响应: 𝒖 𝑡 = 𝑲𝑡1(𝑡) 则 d𝜏 = −𝑑𝜇
𝒕 𝒕 𝟎

𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲𝜏1(𝜏) 𝑑𝜏 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲𝜏𝑑𝜏= 𝒆𝑨𝑡 𝒙𝟎 − න 𝒆𝑨𝜇 𝑩𝑲(𝑡 − 𝜇)𝑑𝜇
𝟎 𝟎 𝒕
𝒕 𝒕 𝒕

= 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨𝜏 𝑩𝑲(𝑡 − 𝜏)𝑑𝜏 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨𝜏 𝑩𝑲𝑡𝑑𝜏 − න 𝒆𝑨𝜏 𝑩𝐾𝜏𝑑𝜏


𝟎 𝟎 𝟎
𝒕

= 𝒆𝑨𝑡 𝒙𝟎 + 𝑨−𝟏 𝒆𝑨𝑡 − 𝑰 𝑩𝑲𝑡 − 𝑨−𝟏 න 𝜏𝑑𝒆𝑨𝜏 𝑩𝐾 න 𝑢𝑑𝑣 = 𝑢𝑣 − න 𝑣𝑑𝑢


𝟎 𝒕
𝑡
= 𝒆𝑨𝑡 𝒙𝟎 + 𝑨−𝟏 𝒆𝑨𝑡 − 𝑰 𝑩𝑲𝑡 − 𝑨−𝟏 𝜏𝒆𝑨𝜏 𝑩𝐾 ቚ + 𝑨−𝟏 න 𝒆𝑨𝜏 𝑑𝜏 𝑩𝐾
0
𝟎

= 𝒆𝑨𝑡 𝒙𝟎 + 𝑨−𝟐 𝒆𝑨𝑡 − 𝑰 − 𝑨−𝟏 𝒕 𝑩𝑲


《现代控制理论》MOOC课程

2.4 线性时变系统的解
2.3 线性时变系统的解
一. 时变系统状态方程解的特点

对于线性时变系统的状态空间表达式可以表示为:
𝒙ሶ =A (t )𝒙+B (t )u,𝒙 𝑡0 = 𝒙𝟎 ,𝑡 ∈ [𝑡0 , 𝑡∝ ]
𝒚 =C (t )𝒙+D (t )u
为了求解时变系统的状态方程,先讨论一个时变的标量方程:
𝑥ሶ =a (t )𝑥
𝑑𝑥
解: =a (t )𝑑𝑡 𝑡
𝑥
对上式两边从 𝑡0 到 t 积分:𝑙𝑛𝑥 𝑡 − 𝑙𝑛𝑥(𝑡0 ) = න a (𝜏 )𝑑𝜏
𝑡0
𝑡
𝑥 𝑡 𝑡
a (𝜏 )𝑑 𝜏
可得: 𝑙𝑛 = න a (𝜏 )𝑑𝜏 𝑥 𝑡 =𝑒
‫𝑡׬‬
0 𝑥(𝑡0 )
𝑥(𝑡0 )
𝑡0
2.3 线性时变系统的解
一. 时变系统状态方程解的特点

𝑡
‫𝜏𝑑 𝜏 𝐴 𝑡׬‬
 齐次方程 𝒙ሶ = 𝑨 𝑡 𝒙 解为 𝒙(𝑡) = 𝑒 0 𝒙(𝑡𝟎 ) 成立的条件。
𝑑
𝑡
‫𝜏𝑑 𝜏 𝐴 𝑡׬‬ 𝑑 ‫𝐴 𝑡𝑡׬‬ 𝜏 𝑑𝜏
左边 = 𝒙ሶ = (𝑒 0 𝒙(𝑡𝟎 ) ) = (𝑒 0 )𝒙(𝑡𝟎 )
𝑑𝑡 𝑑𝑡
𝑡 𝑡 𝑡
𝑑 1
= (𝐼 + න 𝐴 𝜏 𝑑𝜏 + න 𝐴 𝜏 𝑑𝜏 න 𝐴 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
𝑑𝑡 2!
𝑡0 𝑡0 𝑡0
𝑡 𝑡
1 1
= (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 + ⋯ )𝒙(𝑡𝟎 )
2 2
𝑡0 𝑡0
𝑡
右边 =A (t )𝒙 =A (t )𝑒 ‫𝜏𝑑 𝜏 𝐴 𝑡׬‬
0 𝒙(𝑡𝟎 )
𝑡 1 𝑡 𝑡
=A (t )(𝐼 + ‫𝐴 𝑡׬‬ 𝜏 𝑑𝜏 + ‫𝐴 𝑡׬‬ 𝜏 𝑑𝜏 ‫𝐴 𝑡׬‬ 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
0 2! 0 0
2.3 线性时变系统的解
一. 时变系统状态方程解的特点
𝑡 𝑡 𝑡
1
右边 = (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 න 𝐴 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
2!
𝑡0 𝑡0 𝑡0
𝑡 𝑡
1 1
左边 = (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 + ⋯ )𝒙(𝑡𝟎 )
2 2
𝑡0 𝑡0
𝑡 𝑡

仅当 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 = ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 时 𝒙ሶ = 𝑨 𝑡 𝒙
𝑡0 𝑡0
𝑡 𝑡
𝑡
‫𝜏𝑑 𝜏 𝐴 𝑡׬‬
即方程解为:𝒙(𝑡) = 𝑒 0 𝒙(𝑡𝟎 ) 成立的条件为:𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 = ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡
𝑡0 𝑡0

这个条件通常是不成立的。因此,时变系统的自由解通常不能写成封闭形式。
2.3 线性时变系统的解
二. 线性时变系统的零输入响应

线性时变系统在零输入情况下,状态方程
𝒙ሶ = 𝑨 𝑡 𝒙 𝒙(𝑡)ȁ𝒕=𝒕𝟎 =𝒙(𝑡𝟎 )

的解可表示为 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 )

其中 𝚽(𝑡, 𝑡0 ),称为线性时变系统的状态转移矩阵,是如下矩阵方程的解:
ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0 ,𝚽 𝑡0 , 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡, ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡
证明:将 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) 代入方程 𝒙ሶ = 𝑨 𝑡 𝒙 可得:
ሶ 𝑡0 )𝒙(𝑡𝟎 ) =A(𝑡)𝚽 𝑡, 𝑡0 𝒙(𝑡𝟎 )
𝚽(𝑡,

故 ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0
𝚽(𝑡,

由 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) 可得 𝒙 𝑡0 = 𝚽(𝑡0 , 𝑡0 ) 𝒙(𝑡𝟎 ) 。 故 𝚽 𝑡0 , 𝑡0 = 𝑰


得证
2.3 线性时变系统的解
三. 状态转移矩阵的性质

1. 传递性 𝚽 𝑡2 , 𝑡1 𝚽 𝑡1 , 𝑡0 = 𝚽 𝑡2 , 𝑡0

2.可逆性 𝚽−𝟏 𝑡, 𝑡0 = 𝚽 𝑡0 , 𝑡

3. 初始时刻的状态转移矩阵 𝚽 𝑡0 , 𝑡0 =I

4. 微分性 ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0
𝚽(𝑡,

系统矩阵和状态转移矩阵通常不满足可交换条件。

5. 唯一性
当A(t)确定以后,𝚽 𝑡, 𝑡0 是唯一的。
2.3 线性时变系统的解
四.线性时变系统非齐次状态方程的解

结论:线性时变系统的状态方程为

𝒙(𝑡) =A (t )𝒙(t)+B (t )u (t ),𝒙 𝑡0 = 𝒙𝟎 ,𝑡 ∈ [𝑡0 , 𝑡𝛼 ]

且A(t)和B(t)的元素在 𝑡 ∈ [𝑡0 , 𝑡𝛼 ] 时分段连续,则其解为:


𝑡
𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + ‫𝑡 𝚽 𝑡׬‬, 𝜏 𝑩 𝜏 𝒖 𝜏 𝒅𝜏
0
证明:应用叠加定理,状态方程的解可以看作是初始状态的转移与控制激励状态的转移之
和,即设其解具有如下形式:
𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝚽 𝑡, 𝑡0 𝒙𝒖 𝒕 = 𝚽(𝑡, 𝑡0 ) (𝒙(𝑡𝟎 ) + 𝒙𝒖 𝑡 )
将 𝒙 𝑡 代入系统的状态方程
左边= 𝒙ሶ = 𝚽ሶ (𝑡, 𝑡0 ) (𝒙(𝑡𝟎 ) + 𝒙𝒖 𝑡 )+𝚽(𝑡, 𝑡0 )𝒙ሶ 𝒖 𝑡 右边=A (t )𝒙(t)+B (t )u (t )
= A(𝑡)𝚽 𝑡, 𝑡0 (𝒙(𝑡𝟎 ) + 𝒙𝒖 𝑡 )+𝚽(𝑡, 𝑡0 )𝒙ሶ 𝒖 𝑡
= A 𝑡 𝒙 𝑡 + 𝚽(𝑡, 𝑡0 )𝒙ሶ 𝒖 𝑡
2.3 线性时变系统的解
因此,有 𝚽 𝑡, 𝑡0 𝒙ሶ 𝒖 𝑡 = B (t )u (t )

𝒙ሶ 𝒖 𝑡 = 𝚽 −𝟏 𝑡, 𝑡0 B (t )u (t ) 𝒕

对方程两边在[𝑡0 ,𝑡] 区间积分有 𝒙𝒖 𝑡 = න 𝚽 𝑡0 , 𝜏 B (𝜏 )u (𝜏 )d𝜏 + 𝒙𝒖 𝑡0


𝑡0

于是有 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝚽 𝑡, 𝑡0 𝒙𝒖 𝒕


𝒕
= 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝚽 𝑡, 𝑡0 ‫𝚽 𝑡׬‬ 𝑡0 , 𝜏 B (𝜏 )u (𝜏 )d𝛕 +𝚽 𝑡, 𝑡0 𝒙𝒖 𝑡0
0

𝒕
= 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + ‫𝚽 𝑡׬‬ 𝑡, 𝜏 B (𝜏 )u (𝜏 )d𝛕 +𝚽 𝑡, 𝑡0 𝒙𝒖 𝑡0
0

令 𝑡 = 𝑡0 可得 𝒙𝒖 𝑡0 =0
𝑡
故有 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + ‫𝚽 𝑡׬‬ 𝑡, 𝜏 𝑩 𝜏 𝒖 𝜏 𝒅𝜏 得证
0

由于通常情况下,封闭形式的状态转移矩阵很难求得,上式的意义不在于计算的应用,
而在于系统理论研究中的应用。
第二章 控制系统状态空间表达式的解

第二章 小结

 建立系统状态在状态空间中运动的基本概念。

 推导建立了线性定常系统和线性时变系统状态方程的解析表达式:
𝒕
𝒙 𝑡 = 𝜱 𝒕 − 𝑡0 𝒙(𝑡𝟎 ) + න 𝜱 𝑡 − 𝜏 𝑩𝒖 𝜏 𝒅𝜏, 𝑡 ≥ 𝑡0
𝑡0

𝒕
𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + ‫𝑡 𝜱 𝑡׬‬,𝜏 𝑩 𝜏 𝒖 𝜏 𝒅𝜏, 𝑡∈[𝑡0 ,𝑡𝛼 ]
0

 状态转移矩阵的定义、性质和计算方法。
《现代控制理论》MOOC课程

第三章 线性控制系统的能控性和能观性
第三章 线性控制系统的能控性和能观性

线性定常系统的能控性

线性定常系统的能观性

线性时变系统的能控性与能观性

能控性与能观性的对偶关系

状态空间表达式的能控能观标准型

线性系统的结构分解
第三章 线性控制系统的能控性和能观性

能控性和能观性是现代控制理论中两个非常重要的概念,是反馈控制与最优控制的基础。

u x y

 系统的能控、能观指的是系统的状态能控、能观。

 如果通过控制量u可使系统的每一个状态变量由初始状态到达指定的终端状态,那
么就称系统是能控的;

 如果可通过系统的输出反映每一个状态的变化,则称系统是能观的。
《现代控制理论》MOOC课程

3.1 线性定常系统的能控性
3.1 线性定常系统的能控性
一. 能控性的定义

能控:若存在一个无约束的容许控制 𝒖 𝑡 ,能在有限时间区间内t ∈ 𝑡0 , 𝑡1 ,使系统由某


一非零的初始状态𝒙 𝒕𝟎 ,转移到指定的终端状态 𝒙 𝒕𝟏 = 𝟎,则称系统的状态𝒙 𝒕𝟎
是能控的。
完全能控:若系统在状态空间中的所有非零状态均能控,则称系统是完全能控的。

不完全能控:若系统在状态空间中至少存在一个非零状态是不能控的,则称系统是不完全
能控的。
𝒙𝟐
𝒙 𝒕𝟎

𝒙 𝒕𝟎

𝒖 𝑡

𝒙𝟏
𝟎 𝒙 𝒕𝟏
3.1 线性定常系统的能控性
二 线性定常系统的能控性判别

 由系统完全能控的定义,若系统在状态空间中任一非零的初始状态,均能找到一个
容许控制,使系统在有限的时间内转移到平衡状态,则称系统是完全能控的。

 对于任一给定的非零初始状态 𝒙 0 = 𝒙𝟎 ≠ 𝟎 , 要寻找一个容许控制 𝒖 𝑡 ,使系统在有限


时间 𝑡1 时刻,转移到平衡状态,即
𝑡1

𝒙 𝑡1 = 𝒆𝑨𝑡1 𝒙(0) + න 𝒆𝑨(𝑡1−𝑡) 𝑩𝒖 𝑡 𝒅𝑡 = 𝟎


0

 现在的问题是系统要满足什么条件,这样的控制才存在。
3.1 线性定常系统的能控性
1. Gram(格拉姆)矩阵判据

线性定常系统: 𝒙ሶ =A𝒙+B 𝒖 ,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
为完全能控的充分必要条件为,存在时刻 𝑡1 > 0 使如下定义的GRAM矩阵
𝑡1

𝑊𝑐 [0, 𝑡1 ] = න (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝒅𝑡


0
为非奇异。
证:充分性,若 𝑊𝑐 [0, 𝑡1 ] 非奇异,则系统应完全能控。
对于任一非零初始状态 𝒙𝟎 ≠ 𝟎 构造一个控制𝒖 𝑡 = −(𝒆−𝑨𝑡 𝑩)𝑻 𝑊𝐶−1 [0, 𝑡1 ]𝒙𝟎
在 𝒖 𝑡 作用下,系统在时刻 𝑡1 的状态 𝒙 𝑡1 为:
𝑡1 𝑡1

𝒙 𝑡1 = 𝒆𝑨𝑡1 𝒙(0) + න 𝒆𝑨(𝑡1−𝑡) 𝑩𝒖 𝑡 𝒅𝑡 = 𝒆𝑨𝑡1 𝒙𝟎 − න 𝒆𝑨(𝑡1−𝑡) 𝑩(𝒆−𝑨𝑡 𝑩)𝑻 𝑊𝐶−1 [0, 𝑡1 ]𝒙𝟎 𝒅𝑡
0 0
齐次代数方程解的性质 3.1 线性定常系统的能控性
1. Gram(格拉姆)矩阵判据
𝑡1

𝒙 𝑡1 = 𝒆𝑨𝑡1 𝒙𝟎 − 𝒆𝑨𝑡1 [න (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝒅𝑡]𝑊𝐶−1 [0, 𝑡1 ]𝒙𝟎


0

= 𝒆𝑨𝑡1 𝒙𝟎 − 𝒆𝑨𝑡1 𝑊𝐶 [0, 𝑡1 ]𝑊𝐶−1 [0, 𝑡1 ]𝒙𝟎 =𝟎


这表明对于任一初始状态 𝒙𝟎 ≠ 𝟎 ,总存在控制 𝒖 𝑡 ,在时刻 𝑡1 ,使系统状态转移到𝒙 𝑡1 =0
即系统是完全能控的。 充分性得证
必要性:若系统完全能控,则 𝑊𝑐 [0, 𝑡1 ] 非奇异。
采用反证法,反设系统完全能控,但 𝑊𝑐 [0, 𝑡1 ]奇异。
由于 𝑊𝑐 [0, 𝑡1 ] 奇异,故存在某个非零状态 𝑥ҧ0 ,使 𝑥ҧ0 𝑇 𝑊𝑐 [0, 𝑡1 ] 𝑥ҧ0 = 0
𝑡1 𝑡1

因此有 𝑥ҧ0 𝑇 𝑊𝑐 [0, 𝑡1 ] 𝑥ҧ0 = 𝑥ҧ0 𝑇 න (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝒅𝑡 𝑥ҧ0 = න 𝑥ҧ0 𝑇 (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝑥ҧ0 𝒅𝑡
0 0
3.1 线性定常系统的能控性
𝑡1

= න 𝑥ҧ0 𝑇 ((𝒆−𝑨𝑡 𝑩)𝑻 )𝑻 (𝒆−𝑨𝑡 𝑩)𝑻 𝑥ҧ0 𝒅𝑡


0 (𝑟 × 𝑛)(𝑛 × 𝑛)(𝑛 × 1) → 𝑟 × 1

𝑡1 𝑡1
𝑻 𝑻 𝑻 2
= න [𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 ]𝑇 [𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 ]𝒅𝑡 = න 𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 𝒅𝑡 = 𝟎 因此有: 𝑩𝑻 𝒆−𝑨𝑻𝑡 𝑥ҧ0 ≡0 𝑡 ∈ [0, 𝑡1 ]
0 0

再由系统完全能控,故存在控制使系统由非零初始状态 𝑥ҧ0 ,转移到零,即


𝑡1 𝑡1 𝑡1

𝒙 𝑡1 = 𝒆𝑨𝑡1 𝑥ҧ0 + න 𝒆𝑨(𝑡1−𝑡) 𝑩𝒖 𝑡 𝒅𝑡 = 𝒆𝑨𝑡1 𝑥ҧ0 + 𝒆𝑨𝑡1 න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡 = 𝟎 故有: 𝑥ҧ0 = − න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡
0 0 0
𝑡1 𝑻 𝑡1
𝑻
𝑥ҧ0 2 = 𝑥ҧ0 𝑇 𝑥ҧ0 = − න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡 𝑥ҧ0 = − න 𝒖𝑻 (𝒕)𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 𝒅𝑡 = 𝟎
0 0

可得:𝑥ҧ0 =0 ,这与 𝑥ҧ0 ≠0 的假设矛盾,故反设不成立;


即 𝑊𝑐 [0, 𝑡1 ] 非奇异。 必要性得证 得证
3.1 线性定常系统的能控性
2. 秩判据

线性定常系统完全能控的充要条件是矩阵 M= 𝐵 𝐴𝐵 ⋯ 𝐴𝑛−1 𝐵 的秩 rankM=n 。


其中,n为系统矩阵A的维数。
证:充分性:rankM=n ,则系统完全能控
反证法。反设 rankM=n ,但系统不完全能控。
根据Gram矩阵判据,由于系统不完全能控,有 𝑊𝑐 [0, 𝑡1 ]奇异。

因此存在一个非零的n维向量 𝛼 使 𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ] 𝛼 = 0
𝑡1
因此有 𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ]𝛼 = න [𝛼 𝑇 𝒆−𝐴𝑡 𝑩][𝛼 𝑇 𝒆−𝐴𝑡 𝑩]𝑇 𝒅𝑡 = 𝟎
0

可得 𝛼 𝑇 𝒆−𝐴𝑡 𝑩 ≡0 𝑡 ∈ [0, 𝑡1 ]
3.1 线性定常系统的能控性

对等式 𝛼 𝑇 𝒆−𝐴𝑡 𝑩 =0 求导直至n-1次,可得:𝛼 𝑇 𝒆−𝐴𝑡 𝑩 =0, 𝛼 𝑇 𝒆−𝐴𝑡 𝑨𝑩 =0,⋯ , 𝛼 𝑇 𝒆−𝐴𝑡 𝑨𝒏−𝟏 𝑩 = 0


令t =0,可得 𝛼 𝑇 𝑩 =0, 𝛼 𝑇 𝑨𝑩 =0,⋯ , 𝛼 𝑇 𝑨𝒏−𝟏 𝑩 = 0
故 𝛼 𝑇 𝐵 𝐴𝐵 ⋯ 𝐴𝑛−1 𝐵 = 0, 𝛼 𝑇 𝑀 = 0
由于 𝛼 为非零向量,故M行向量线性相关,即rankM<n,这与已知矛盾,故系统完全能控
充分性得证。
必要性:若系统完全能控,则rankM=n
反设系统完全能控,但rankM<n
由于rankM<n,故M行向量线性相关,因此必存在一个n维非零向量,使
𝛼𝑇 𝐵 𝐴𝐵 ⋯ 𝐴𝑛−1 𝐵 = 0, 即 𝛼 𝑇 𝑨𝒊 𝑩 = 0, i=0,1,2,⋯ , 𝑛 − 1
由凯莱-哈密尔顿定理 𝐴𝑛 , 𝐴𝑛+1 , ⋯ 均可表示为𝐼, 𝐴, ⋯ , 𝐴𝑛−1 的线性组合,故可导出
𝛼 𝑇 𝑨𝒊 𝑩 = 0, i=0,1,2,⋯
3.1 线性定常系统的能控性

𝑇 𝑨𝒊 𝒕𝒊
从而对于任意 𝑡1 > 0 有 ±𝛼 𝑩 = 0, 𝑡 ∈ [0, 𝑡1 ], i=0,1,2,⋯
𝑖!

𝟏 𝟐 𝟐 𝟏 𝟑 𝟑
因此, 𝛼 𝑇 𝐼 − 𝐴𝑡 + 𝑨 𝒕 − 𝑨 𝒕 + ⋯ 𝑩 = 𝛼 𝑇 𝑒 −𝐴𝑡 𝑩=0
2! 3!
𝑡1 𝑡1
故有, න [𝛼 𝑇 𝒆−𝐴𝑡 𝑩][𝛼 𝑇 𝒆−𝐴𝑡 𝑩]𝑇 𝒅𝑡 = 𝟎 𝛼 𝑇 {න 𝒆−𝐴𝑡 𝑩 𝒆−𝐴𝑡 𝑩 𝑇 𝒅𝑡}𝜶 = 𝟎
0 0

𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ]𝜶 = 𝟎

即 𝑊𝑐 [0, 𝑡1 ] 奇异,故系统不完全能控,这与已知条件矛盾,反设不成立。于是有
rankM=n。 必要性得证。
得证
3.1 线性定常系统的能控性

例. 已知系统的状态方程为: 𝑥ሶ 1 −1 −4 −2 𝑥1 2
𝑥ሶ 2 = 0 6 1 𝑥2 + 0 𝑢
𝑥ሶ 3 1 7 −1 𝑥3 1
试判别其能控性。

解:其能控性判别矩阵为:M= 𝐵 𝐴𝐵 𝐴2 𝐵
2 −1 −4 −2 2 −4 −1 −4 −2 −4 −2
𝐵= 0 𝐴𝐵 = 0 6 1 0 = 1 𝐴2 𝐵 = 0 6 1 1 = 7
1 1 7 −1 1 1 1 7 −1 1 2

2 −4 −2 2 −4 −2
故: M= 0 1 7 rankM=rank 0 1 7 =3
1 1 2 1 1 2

所以系统完全能控。
3.1 线性定常系统的能控性

例. 已知系统的状态方程为: 𝑥ሶ 1 1 1 0 𝑥1 0 1 𝑢
𝑥ሶ 2 = 0 1 0 𝑥2 + 1 0 𝑢12
𝑥ሶ 3 0 1 1 𝑥3 0 1
试判别其能控性。

解:其能控性判别矩阵为:M= 𝐵 𝐴𝐵 𝐴2 𝐵
0 1 1 1 0 0 1 1 1 1 1 0 1 1 2 1
𝐵= 1 0 𝐴𝐵 = 0 1 0 1 0=1 0 𝐴2 𝐵 = 0 1 0 1 0 = 1 0
0 1 0 1 1 0 1 1 1 0 1 1 1 1 2 1

0 1 1 1 2 1 8 3 8
故: M= 1 0 1 0 1 0 𝑇
rankM=rankM𝑀 =rank 3 3 3 =2
0 1 1 1 2 1 8 8 8

所以系统不完全能控。
3.1 线性定常系统的能控性
3. PBH秩判据

线性定常系统完全能控的充要条件是,对系统矩阵的所有特征值 𝜆𝑖 (𝑖 = 1,2, ⋯ , 𝑛) :
𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 𝑖 = 1,2, ⋯ , 𝑛
均成立。
证明:必要性:若系统完全能控,则 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n ,成立;
反设系统完全能控,但存在某个特征值 𝜆𝑖 ,有 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]<n
故必存在一个非零向量 𝜶 ,使 𝜶𝑇 [𝜆𝑖 𝑰 − 𝑨, 𝑩]=0 成立。即:
𝜶𝑇 𝑨 = 𝜆𝑖 𝜶𝑇 𝜶𝑇 𝑩 = 𝟎
由此可得:𝜶𝑇 𝑩 = 𝟎, 𝜶𝑇 𝑨𝑩 = 𝜆𝑖 𝜶𝑇 𝑩 = 0,⋯ , 𝛼 𝑇 𝑨𝒏−𝟏 𝑩 = 𝜆𝑛−1
𝑖 𝜶𝑇 𝑩 = 𝟎

进一步可得: 𝜶𝑇 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩 = 𝜶𝑇 M=0


由于向量 𝜶 不为0,故 rankM<n ,系统不完全能控,这与反设矛盾, 故反设不成立。
即系统完全能控必有: 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 𝑖 = 1,2, ⋯ , 𝑛 成立。 必要性得证
3.1 线性定常系统的能控性

充分性:若 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 𝑖 = 1,2, ⋯ , 𝑛 成立,则系统完全能控;

证略:需用能控性分解的知识。

例. 已知系统的状态方程为: 𝑥ሶ 1 −7 0 0 𝑥1 2
𝑥ሶ 2 = 0 −5 0 𝑥2 + 0 𝑢
试判别其能控性。 𝑥ሶ 3 0 0 −1 𝑥3 9

解:系统的特征根为 𝜆1 = −7,𝜆2 = −5,𝜆3 = −1


0 0 0 2 2 0 0 2
𝑟𝑎𝑛𝑘[𝜆1 𝑰 − 𝑨, 𝑩]=rank 0 −2 0 0 = 3 𝑟𝑎𝑛𝑘[𝜆2 𝑰 − 𝑨, 𝑩]=rank 0 0 0 0 =2
0 0 −6 9 0 0 −4 9

6 0 0 2
𝑟𝑎𝑛𝑘[𝜆3 𝑰 − 𝑨, 𝑩]=rank 0 4 0 0 =3 所以系统不完全能控。
0 0 0 9
3.1 线性定常系统的能控性
4. 规范型判据
线性定常系统完全能控的充要条件为:
1). 当系统矩阵A的特征值为两两互异时,系统状态方程经线性变换导出的对角规范型:
𝜆1 ഥ𝟏
𝑩
𝜆2 ഥ
ഥሶ =
𝒙 ഥ + 𝑩𝟐 𝒖
𝒙
⋱ ⋮
𝜆𝑛 ഥ𝒏
𝑩
ഥ 𝒊 ≠ 𝟎, 𝒊 = 𝟏, 𝟐, ⋯ , 𝒏 ,即 𝑩
式中, 𝑩 ഥ 中不包含元素全为零的行。

2).当系统矩阵A的特征值存在重根时,系统状态方程经线性变换导出的约当标准型:
𝑱𝟏 ෩𝟏
𝑩
⋱ ⋮ 设特征值 𝜆𝑖 的代数重数为 𝜎𝑖 ,几何重数为 𝛼𝑖
𝑥෤ሶ = 𝑱𝒊 ෩𝒊 𝒖
𝑥෤ + 𝑩
⋱ ⋮ 𝜆𝑖 对应的第 𝑘 个约当子块的维数为 𝑟𝑖𝑘
𝑱𝒍 ෩𝒍
𝑩

则约当规范型的具体结构可表示为如下形式:
𝑱𝒊𝟏 3.1 线性定常系统的能控性
⋱ 𝜆𝑖 1
𝑱𝒊 = 𝑱𝒊𝒌 𝜆𝑖 ⋱
⋱ 𝑱𝒊𝒌 =
⋱ 1
𝑱𝒊𝜶𝒊 𝜆𝑖

෩𝟏 ෩ 𝒊𝟏
𝑩 ഥ𝟏
𝑱𝟏 𝑩 𝒃 𝒊𝒌
⋱ ⋮ ⋮ ഥ𝟐
෩ 𝒊𝒌
෩𝒊 = 𝑩 ෩ 𝒊𝒌 = 𝒃
𝑥෤ሶ = 𝑱𝒊 ෩𝒊 𝒖
𝑥෤ + 𝑩 𝑩 𝑩 𝒊𝒌

⋱ ⋮ ⋮
⋮ ഥ𝒓
𝑱𝒍 ෩𝒍 ෩ 𝒊𝜶
𝑩 𝒃
𝑩 𝒊
𝒊𝒌

෩ 𝒊 不全为0;
1)若 𝜎𝑖 =1 ,则 𝜆𝑖 对应的输入矩阵 𝑩

෩ 𝒊 的最后一行不全为0;
2)若 𝜎𝑖 >1, 𝛼𝑖 =1 ,则 𝜆𝑖 对应的输入矩阵 𝑩 ഥ𝒓
𝒃 𝒊𝟏
ഥ𝒓
𝒃
3)若 𝛼𝑖 >1 ,则 𝜆𝑖 对应的每一个约当子块最后一行对应的输入矩阵行组成的矩阵 𝒊𝟐

均为行线性无关。 ഥ𝒓
𝒃 𝒊𝜶 𝒊
3.1 线性定常系统的能控性

证明:
1. 对角规范型判据
𝐵ത1 𝜆1 𝐵ത1 ⋯ 𝜆1𝑛−1 𝐵ത1

𝑛−1 ത = 𝐵2 𝜆2 𝐵ത2 ⋯ 𝜆𝑛−1
2 𝐵2

M= 𝐵ത 𝐽𝐵ത ⋯ 𝐽 𝐵
⋮ ⋮ ⋯ ⋮
𝐵ത𝑛 𝜆𝑛 𝐵ത𝑛 ⋯ 𝜆𝑛−1
𝑛 𝐵𝑛

若 𝐵ത 存在全为0的行,则 M 阵也存在全为0的行。则rankM<n,根据秩判据,系统不
完全能控。故系统完全能控的充要条件为:
ഥ 𝑖 ≠ 0,
𝑩 𝑖 = 1,2, ⋯ , 𝑛

2.对约当规范型判据
应用PBH秩判据 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 可导出约当规范型完全能控的充要条件。
3.1 线性定常系统的能控性
现以一实例加以说明,取7维系统
𝜆1 𝑏111
𝑏1
𝜆2 1 𝑏121 𝑏2
𝜆2 𝐵11 𝑏221
𝐵1 𝑏3
𝐴= 𝜆3 1 𝐵21
𝐵 = 𝐵2 = = 𝑏131 = 𝑏4
𝜆3 𝐵31
𝐵3 𝑏231 𝑏5
𝐵32
𝜆3 1 𝑏6
𝑏132
𝜆3 𝑏7
𝑏232
系统特征根类型为:
𝜆1 为单根,𝜎1 = 1,𝛼1 = 1,对应的输入矩阵为B矩阵的第一行 𝑏1 = 𝑏111

𝜆2 为二重根,𝜎2 = 2,𝛼2 = 1,只有一个约当块,其约当块最后行对应的输入矩阵行为𝑏3 = 𝑏221

𝜆3 为四重根,𝜎1 = 4,𝛼3 = 2,有二个约当块,每个约当块最后一行对应的输入矩阵行组成


的矩阵为: 𝑏5 𝑏231
=
𝑏7 𝑏232
3.1 线性定常系统的能控性

当 𝜆 = 𝜆1 时:
0 b111 
 
 1  2 1 b121 
 1  2 b221 
 
[1I  A, B ]   1  3 1 b131  只要 𝑏1 = 𝑏111 ≠ 0, rank[𝜆1 𝐼 − 𝐴, 𝐵]=7
 
 1  3 b231 
 
 1  3 1 b132 
 
 1  3 b232 

当 𝜆 = 𝜆2 时:
2  1 b111 
 
 0 1 b121 
 b221 

0
 只要 𝑏3 = 𝑏221 ≠ 0, rank[𝜆2 𝐼 − 𝐴, 𝐵]=7
[2 I  A, B ]   2  3 1 b131 
 
 2  3 b231 
 
 2  3 1 b132 
 
 2  3 b232 
3.1 线性定常系统的能控性
4. 规范型判据
当 𝜆 = 𝜆3 时:
3  1 b111 
 
 3  2 1 b121 
 3  2 b221 
 
[3 I  A, B ]   0 1 b131 
 
 0 b231 
 
 0 1 b132 
 
 0 b232 

𝑏231
只要 rank 𝑏 =2 就有 rank[𝜆3 𝐼 − 𝐴, 𝐵]=7
232

由PBH判据,三个特征值对应的秩判别矩阵的秩均等于系统维数时,系统完全能控。
3.1 线性定常系统的能控性
4. 规范型判据
例. 已知系统的状态方程为:
𝑥ሶ 1 7 0 0 𝑥1 2 𝑥ሶ 1 7 0 0 𝑥1 2
1. 𝑥ሶ 2 = 0 5 0 𝑥2 + 0 𝑢 2. 𝑥ሶ 2 = 0 5 0 𝑥2 + 5 𝑢
0 0 −1 𝑥3 𝑥ሶ 3 0 0 −1 𝑥3 7
𝑥ሶ 3 9

𝑥ሶ 1 −4 1 0 𝑥1 0
𝑥ሶ 1 7 0 0 𝑥1 0 1 𝑢 𝑥ሶ 2 = 0 −4 0 𝑥2 + 4 𝑢
3. 𝑥ሶ 2 = 0 5 0 𝑥2 + 4 0 𝑢12 4.
𝑥ሶ 3 0 0 −2 𝑥3 3
𝑥ሶ 3 0 0 −1 𝑥3 7 5
𝑥ሶ 1 −4 1 0 0 𝑥1 0 1 1 𝑢
𝑥ሶ 1 −4 1 0 𝑥1 4 2 𝑢 𝑥ሶ 2 𝑥2 1
1 6. = 0 −4 0 0 + 0 0 2 𝑢
5. 𝑥ሶ 2 = 0 −4 0 𝑥2 + 0 0 𝑢2 𝑥ሶ 3 0 0 −1 1 𝑥3 0 0 0 𝑢2
𝑥4 3
𝑥ሶ 3 0 0 −2 𝑥3 3 0 𝑥ሶ 4 0 0 0 −1 0 1 0

1, 5不完全能控,2,3,4,6完全能控。
3.1 线性定常系统的能控性
4. 规范型判据
例. 已知系统的状态方程为:
𝑥ሶ 1
−2 1 𝑥1 0 0 0
𝑥ሶ 2 𝑥2
−2 1 0 0
𝑥ሶ 3 −2 𝑥3 0 4 0 𝑢1
𝑥ሶ 4 = 𝑥4 + 0 0 7 𝑢2
−2
𝑥5 0 0 0 𝑢3
𝑥ሶ 5 −3 1
−3 𝑥6 1 0 0
𝑥ሶ 6 𝑥7 0 4 1
−3
ሶ𝑥7

1 0 0 1 0 0
0 4 0 和 均线性无关,系统完全能控。
0 4 1
0 0 7
《现代控制理论》MOOC课程

3.2 线性控制系统的能观性
3.2 线性定常系统的能观性
一. 能观性的定义

能观:对于线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
𝒚 =C 𝒙+D 𝒖
存在一有限的观测时间 𝑡1 > 𝑡0 ,使根据 𝑡0 , 𝑡1 期间的输出 𝒚 𝑡 ,能唯一地确定系统在 𝒕𝟎 时刻
的状态 𝒙 𝒕𝟎 ,则称状态 𝒙 𝒕𝟎 是能观测的。

完全能观:若系统的每一个非零状态都是能观测的,则称系统完全能观。

不能观:如果取时刻 𝒕𝟎 的一个非零初始状态 𝒙 𝒕𝟎 ,存在一个有限时刻 𝑡1,


> 𝑡0 使对所有
的t ∈ 𝑡0 , 𝑡1 有 𝒚 𝑡 ≡ 𝟎 则称状态 𝒙 𝒕𝟎 是不能观的。
3.2 线性定常系统的能观性
二 线性定常系统的能观性判据

 由于能观所表示的是输出反映状态变量的能力,与控制作用无直接关系,因此在分析
能观性时,可令 𝒖(𝒕) ≡ 𝟎 ,此时系统的状态方程为:
𝒙ሶ =A𝒙,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥ 𝟎
𝒚 =C 𝒙

1. Gram(格拉姆)矩阵判据

线性定常系统 𝒙ሶ =A𝒙,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥ 𝟎
𝒚 =C 𝒙
完全能观的充要条件是:存在时刻 𝑡𝟏 > 𝟎 ,使如下定义的Gram矩阵为非奇异。
𝑡1 𝑡1

𝑊𝑜 [0, 𝑡1 ] = න (𝑪𝒆𝑨𝑡 )𝑻 (𝑪𝒆𝑨𝑡 ) 𝒅𝑡 𝑊𝑐 [0, 𝑡1 ] = න (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝒅𝑡


0 0
3.2 线性定常系统的能观性

证明:充分性:已知 𝑊𝑜 [0, 𝑡1 ]非奇异,证明系统应完全能观。


由于 𝑊𝑜 [0, 𝑡1 ]非奇异,故 𝑊𝑜−1 [0, 𝑡1 ] 存在,因此可根据系统在 0, 𝑡1 上的已知输出 𝒚(𝑡) 来构
造如下函数:
𝑡 𝑡 𝑡
𝑊𝑜−1 [0, 𝑡1 ] ‫׬‬0 1(𝑪𝒆𝑨𝑡 )𝑻 𝒚(𝑡)𝒅𝑡 = 𝑊𝑜−1 [0, 𝑡1 ] ‫׬‬0 1(𝑪𝒆𝑨𝑡 )𝑻 𝑪𝒙 𝑡 𝒅𝑡 = 𝑊𝑜−1 [0, 𝑡1 ] ‫׬‬0 1(𝑪𝒆𝑨𝑡 )𝑻 𝑪𝒆𝑨𝑡 𝒙𝟎 𝒅𝑡
𝑡
= 𝑊𝑜−1 [0, 𝑡1 ] ‫׬‬0 1(𝑪𝒆𝑨𝑡 )𝑻 (𝑪𝒆𝑨𝑡 ) 𝒅𝑡𝒙𝟎 = 𝑊𝑜−1 [0, 𝑡1 ]𝑊𝑜 [0, 𝑡1 ]𝒙𝟎 = 𝒙𝟎

这表明在 𝑊𝑜 [0, 𝑡1 ] 非奇异的条件下,系统任意的非零初始状态都可以通过系统在 0, 𝑡1 上


的输出获得,因此系统完全能观。 充分性得证

必要性:已知系统应完全能观,证明非奇异。
反证法。反设 𝑊𝑜 [0, 𝑡1 ]奇异,但系统能观。
由于 𝑊𝑜 [0, 𝑡1 ] 奇异,则必存在某个非零的向量 𝒙ഥ𝟎 ,使 𝒙ഥ𝑇0 𝑊𝑜 0, 𝑡1 𝒙ഥ𝟎 = 𝟎 成立。
3.2 线性定常系统的能观性

𝑡1 𝑡1 𝑡1
𝑻
ഥ𝑇0 𝑊𝑜 0, 𝑡1 𝒙
𝒙 ഥ𝟎 = 𝒙 ഥ𝟎 = න (𝑪𝒆𝑨𝑡 𝒙
ഥ𝑇0 න (𝑪𝒆𝑨𝑡 )𝑻 (𝑪𝒆𝑨𝑡 ) 𝒅𝑡 𝒙 ഥ𝟎 )𝑻 (𝑪𝒆𝑨𝑡 𝒙
ഥ𝟎 ) 𝒅𝑡 = න 𝒚 𝒕 𝒚 𝒕 𝒅𝑡
0 0 0
𝑡 𝟐 𝒅𝑡 =0
= ‫׬‬0 1 𝒚 𝒕

故 𝒚 𝒕 = 𝑪𝒆𝑨𝑡 𝒙
ഥ𝟎 = 𝟎 ∀𝑡 ∈ 0, 𝑡1

即非零状态 𝒙ഥ𝟎 是不可观的。反设不成立。 必要性得证


得证

2. 秩判据
𝑪
(n× 𝑚) × 𝑚 阶能观性矩阵 N= 𝑪𝑨
线性定常系统完全能观的充要条件是: ⋮ 的秩 rankN=n
𝑪𝑨𝒏−𝟏
3.2 线性定常系统的能观性
3. PBH判据

线性定常系统完全能观的充要条件是,对矩阵A的所有特征值 𝜆𝑖 (𝑖 = 1,2, ⋯ , 𝑛)

𝑪
rankN= =n 𝑖 = 1,2, ⋯ , 𝑛
𝜆𝑖 𝑰 − 𝑨
均成立。

4. 规范型判据

线性定常系统完全能观的充要条件是:
(1) 当系统矩阵A的特征值为两两互异时,系统状态方程经线性变换导出的对角规范型
𝜆1
𝜆2 ഥ𝒙
ഥ=𝑪 ഥ = 𝒄ത1 𝒄ത 𝟐 ⋯ 𝒄ത 𝑛
ഥሶ =
𝒙 ഥ
𝒙 𝒚

𝜆𝑛

中 𝒄ത 𝒊 ≠ 𝟎 ,即 𝑪ഥ中不包含元素全为零的列。
3.2 线性定常系统的能观性

(2) 当系统矩阵A的特征值存在重根时,系统状态方程经线性变换导出的约当标准型
𝑱𝟏

෥ሶ =
𝒙 𝑱𝒊 ෥
𝒙 ෩𝒙
෥=𝑪
𝒚 ෥ = 𝒄෤ 1 ⋯ 𝒄෤ 𝑖 ⋯ 𝒄෤ 𝑙

𝑱𝒍

设特征值 𝜆𝑖 的代数重数为 𝜎𝑖 ,几何重数为 𝛼𝑖

1)若 𝜎𝑖 =1 ,则 𝜆𝑖 对应的输出矩阵列 𝒄෤ 𝒊 不全为0;

2)若 𝜎𝑖 >1, 𝛼𝑖 =1 ,则 𝜆𝑖 对应的输出矩阵 𝒄෤ 𝒊 的第一列不全为0;

3)若 𝛼𝑖 >1 ,则 𝜆𝑖 对应的每一个约当子块第一列对应的输出矩阵列组成的矩阵


𝒄෤ 𝟏𝒊𝟏 𝒄෤ 𝟏𝒊𝟐 ⋯ 𝒄෤ 𝟏𝒊𝜶𝒊 均为列线性无关。
3.2 线性定常系统的能观性

例. 已知系统的状态方程为:
𝑥ሶ 1 4 0 𝑥1
= 𝒚= 0 −6 𝑥
𝑥ሶ 2 0 −5 𝑥2

试判别其能观性。

解: 𝑟𝑎𝑛𝑘𝑁 = 𝑟𝑎𝑛𝑘 𝐶 = 𝑟𝑎𝑛𝑘 0 6


=1 故系统不完全能观。
𝐶𝐴 0 30

例. 已知系统的状态方程为:
𝑥ሶ 1 7 0 0 𝑥1
4 0 7
𝑥ሶ 2 = 0 −2 0 𝑥2 𝒚=
0 3 1
𝑥ሶ 3 0 0 1 𝑥3

试判别其能观性。
解:由于C中不包含全为0的列,故系统完全能观。
《现代控制理论》MOOC课程

3.3 线性时变系统的能控性与能观性
3.3 线性时变系统的能控性与能观性

一. 线性时变系统能控性的定义

对于线性时变系统: 𝒙ሶ =A 𝑡 𝒙+B 𝑡 𝒖 ,𝒙 𝒕𝟎 = 𝒙𝟎 ,𝑡, 𝑡𝟎 ∈ 𝑱


𝒚 =C 𝑡 𝒙+D 𝑡 𝒖

能控:若存在一个无约束的容许控制 𝒖 𝑡 ,能在有限时间区间内t ∈ 𝑡0 , 𝑡1 ,使系统由某一


非零的初始状态 𝒙 𝒕𝟎 ,转移到终端状态 𝒙 𝒕𝟏 = 𝟎 ,则称系统在 𝒕𝟎 时刻的状态 𝒙 𝒕𝟎 是能控的。

完全能控:若系统在状态空间中的所有非零点,在时刻 𝒕𝟎 均能控,则称系统在时刻 𝒕𝟎 是
完全能控的。

不完全能控:若系统在状态空间中至少存在一个非零状态在𝒕𝟎不能控,则称系统在时刻 𝒕𝟎
是不完全能控的。
3.3 线性时变系统的能控性与能观性
二 线性时变系统的能控性判据

1. Gram(格拉姆)矩阵判据

线性时变系统: 𝒙ሶ =A(t )𝒙+B (t )𝒖 ,𝒙 𝑡0 = 𝒙𝟎 ,𝑡, 𝑡0 ∈ 𝑱


在 𝑡0 时刻为完全能控的充要条件是,存在一个有限的时刻 𝑡1 ∈ 𝑱, 𝑡1 > 𝑡0 ,使如下定义的
GRAM矩阵: 𝑡1

𝑊𝑐 [𝑡0 , 𝑡1 ] = න [𝚽 𝑡0 , 𝑡 𝑩 𝑡 ][𝚽 𝑡0 , 𝑡 𝑩 𝑡 ]𝑻 𝒅𝑡
𝑡0
为非奇异。
3.3 线性时变系统的能控性与能观性
2. 秩判据

线性时变系统: 𝒙ሶ =A(t)𝒙+B (t)𝒖 ,𝒙 𝑡0 = 𝒙𝟎 ,𝑡, 𝑡0 ∈ 𝑱


在𝑡0 时刻为完全能控的充分条件是,矩阵 A(t) 和 B (t)是(n-1)阶连续可微的,且存在一个有限
的时刻 𝑡1 ∈ 𝑱, 𝑡1 > 𝑡0 ,使如下定义的能控性判别矩阵
𝑴(𝑡1 ) = 𝑴0 (𝑡1 ) 𝑴1 (𝑡1 ) ⋯ 𝑴𝑛−1 (𝑡1 )
的秩 rank𝑴(𝑡1 ) = 𝑛 。 其中,n为系统矩阵的维数;
𝑴0 𝑡 = 𝑩 𝑡
𝑑
𝑴𝑘+1 𝑡 = −𝑨 𝑡 𝑴𝑘 𝑡 + 𝑴
𝑑𝑡 𝑘
𝑡 k=0,1,⋯,n-2

𝑥ሶ 1 0 𝑡 𝑥1 0
例. 设线性时变系统的状态方程为: = 𝑥 + 𝑢 判断系统的能控性。
𝑥ሶ 2 0 0 2 1
0 𝑀 𝑡 = 𝑴 𝑡 𝑴 𝑡 0 −𝑡
解: 𝑴0 𝑡 = 𝑩 𝑡 = 1 0 1 =
1 0
rank𝑴 𝑡 = 2
𝑴1 𝑡 = −𝑨 𝑡 𝑴0 𝑡 + 𝑀ሶ 0 𝑡 = − 0 𝑡 0 + 0 = −𝑡
0 0 1 0 0 故当 t >0 时 ,系统完全能控。
3.3 线性时变系统的能控性与能观性

三. 线性时变系统能观性的定义

对于线性时变系统: 𝒙ሶ =A 𝑡 𝒙+B 𝑡 𝒖 ,𝒙 𝒕𝟎 = 𝒙𝟎 ,𝑡, 𝑡𝟎 ∈ 𝑱


𝒚 =C 𝑡 𝒙+D 𝑡 𝒖

能观:存在一有限的观测时间 𝑡1 > 𝑡0 ,使根据 𝑡0 , 𝑡1 期间的输出 𝒚 𝑡 ,能唯一地确定系统在


时刻 𝒕𝟎 的状态𝒙 𝒕𝟎 ,则称系统在时刻 𝒕𝟎 的状态 𝒙 𝒕𝟎 是能观测的。

完全能观:若系统的每一非零状态在时刻 𝒕𝟎 都是能观测的,则称系统在时刻 𝒕𝟎 是完全能观。

不能观:如果取时刻 𝒕𝟎 的一个非零初始状态 𝒙 𝒕𝟎 ,存在一个有限时刻 𝑡1,


> 𝑡0 使对所有
的t ∈ 𝑡0 , 𝑡1 有 𝒚 𝑡 ≡ 𝟎 则称系统在 𝒕𝟎 时刻的状态 𝒙 𝒕𝟎 是不能观的。
3.3 线性时变系统的能控性与能观性

四 线性时变系统的能观性判据

1. Gram(格拉姆)矩阵判据

线性时变系统:𝒙ሶ =A(t)𝒙,𝒙 𝑡0 = 𝒙𝟎 ,𝑡, 𝑡0 ∈ 𝑱


𝒚 =C (t)𝒙
在 𝑡0 时刻为完全能观的充要条件是,存在一个有限的时刻 𝑡1 ∈ 𝑱, 𝑡1 > 𝑡0 ,使如下定义的
GRAM矩阵: 𝑡1

𝑊𝑜 [𝑡0 , 𝑡1 ] = න [𝑪 𝑡 𝚽 𝑡, 𝑡0 ]𝑻 [𝑪 𝑡 𝚽 𝑡, 𝑡0 ] 𝒅𝑡
𝑡0
为非奇异。
3.3 线性时变系统的能控性与能观性
2. 秩判据

线性时变系统:𝒙ሶ =A(t)𝒙,𝒙 𝑡0 = 𝒙𝟎 ,𝑡, 𝑡0 ∈ 𝑱


𝒚 =C (t)𝒙
在 𝑡0 时刻为完全能观的充分条件是,矩阵 A(t) 和 B (t)是(n-1)阶连续可微的,且存在一个有限
的时刻 𝑡1 ∈ 𝑱, 𝑡1 > 𝑡0 ,使如下定义的能观性判别矩阵
𝑵0 (𝑡1 )
𝑵1 (𝑡1 )
𝑵(𝑡1 ) =

𝑵𝑛−1 (𝑡1 )

的秩 rank𝑁(𝑡1 ) = 𝑛 。
其中,n为系统矩阵的维数; 𝑵0 𝑡 = 𝑪 𝑡
𝑑
𝑵𝑘+1 𝑡 = 𝑵𝑘 𝑡 𝑨 𝑡 + 𝑵
𝑑𝑡 𝑘
𝑡 k=0,1,⋯,n-2
3.3 线性时变系统的能控性与能观性
例. 设线性时变系统的 A (t )、 C (t ) 为:
t 1 0 
 
A(t )  0 t 0  C (t )  1 0 1
 2
 0 0 t 
判断系统的能观性。
解: N 0 (t )  C (t )  1 0 1 t 1 0 
 

N1 (t )  N 0 (t ) A(t )  N 0 (t )  1 0 10 t 0   0 0 0  t 1 t 2
 
 2
 0 0 t 
𝑡 1 0
𝑁2 𝑡 = 𝑁1 𝑡 𝐴 𝑡 + 𝑁ሶ 1 𝑡 = 𝑡 1 𝑡2 0 𝑡 0 + 1 0 2𝑡
0 0 𝑡2

= 𝑡 2 + 1 2𝑡 2𝑡 + 𝑡 4
3.3 线性时变系统的能控性与能观性

𝑁0 𝑡 1 0 1
故 𝑁 𝑡 = 𝑁1 𝑡 = 𝑡 1 𝑡2
𝑁2 𝑡 𝑡2 + 1 2𝑡 2𝑡 + 𝑡 4

只要 t  0, 有 rankN  3 ,故系统完全能观。
《现代控制理论》MOOC课程

3.4 能控与能观性的对偶关系
3.4 能控与能观性的对偶关系
一. 对偶系统的定义

1. 线性时变对偶系统

对于线性时变系统σ 1: 𝒙ሶ 𝟏 =A 𝑡 𝒙𝟏 +B 𝑡 𝒖𝟏
𝒚𝟏 =C 𝑡 𝒙𝟏
𝒙ሶ = −𝑨 𝑻 𝑡 𝒙 +𝑪𝑻 𝑡 𝒖
σ
则定义如下构成的线性时变系统 2: 𝟐 𝟐 𝟐
𝒚𝟐 = 𝑩𝑻 (𝒕)𝒙𝟐
称为系统σ 1的对偶系统。

其中,𝒙𝟏 ,𝒙𝟐 为n维状态向量; 𝒖𝟏 ,𝒖𝟐 分别为r维和m维控制向量;𝒚𝟏 ,𝒚𝟐 分别为m维和r维


输出向量。
3.4 能控与能观性的对偶关系

2. 线性定常对偶系统

对于线性定常系统σ 1: 𝒙ሶ 𝟏 =A𝒙𝟏 +B 𝒖𝟏
𝒚𝟏 =C 𝒙𝟏
则定义如下构成的线性定常系统:
𝒙ሶ 𝟐 = −𝑨𝑻 𝒙𝟐 +𝑪𝑻 𝒖𝟐 𝒙ሶ 𝟐 = 𝑨𝑻 𝒙𝟐 +𝑪𝑻 𝒖𝟐
σ 2: 或 σ 2:
𝒚𝟐 = 𝑩𝑻 𝒙𝟐 𝒚𝟐 = 𝑩𝑻 𝒙𝟐

称为系统的σ 1对偶系统。

其中,𝒙𝟏 ,𝒙𝟐 为n维状态向量; 𝒖𝟏 ,𝒖𝟐 分别为r维和m维控制向量;𝒚𝟏 ,𝒚𝟐 分别为m维和r

维输出向量。
3.4 能控与能观性的对偶关系
二. 线性时变系统的对偶原理

1. 互为对偶的两系统的状态转移矩阵互为转置逆

系统σ 1与系统σ 2是互为对偶系统,系统σ 1 、 σ 2的状态转移矩阵分别为𝜱1 𝑡, 𝑡0 ,𝜱2 (𝑡, 𝑡0 )


则如下关系式成立:𝜱2 𝑡, 𝑡0 = 𝜱𝑻𝟏 𝑡0 , 𝑡

证明: 对系统σ 1有: 𝜱ሶ 1 𝑡, 𝑡0 = 𝑨(𝑡)𝜱1 𝑡, 𝑡0 , 𝜱1 𝑡0 , 𝑡0 = 𝐼

对系统σ 2有: 𝜱ሶ 2 𝑡, 𝑡0 = −𝑨𝑻 𝑡 𝜱2 𝑡, 𝑡0 , 𝜱2 𝑡0 , 𝑡0 = 𝐼

由: 𝜱1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 = 𝐼
𝑑
对上式两边求导可得: 𝑑𝑡 [𝜱1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 ] = 0
3.4 能控与能观性的对偶关系

𝜱ሶ 1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 + 𝜱1 𝑡, 𝑡0 𝜱ሶ 1−1 𝑡, 𝑡0 = 0

𝑨(𝑡)𝜱1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 + 𝜱1 𝑡, 𝑡0 𝜱ሶ 1−1 𝑡, 𝑡0 = 0

𝑨(𝑡) + 𝜱1 𝑡, 𝑡0 𝜱ሶ 1 𝑡0 , 𝑡 = 0

𝜱ሶ 1 𝑡0 , 𝑡 = −𝜱1 𝑡0 , 𝑡 𝑨 𝑡

对上式取转置可得:𝜱ሶ 1𝑇 𝑡0 , 𝑡 = −𝑨𝑇 𝑡 𝜱1𝑇 𝑡0 , 𝑡 由已知可得:𝜱1𝑇 𝑡0 , 𝑡0 = 𝐼

由于 −𝑨𝑇 𝑡 是σ 2系统的系统矩阵,故 𝜱1𝑇 𝑡0 , 𝑡 也是系统σ 2的状态转移矩阵。

由状态转移矩阵的唯一性可得: 𝜱2 𝑡, 𝑡0 = 𝜱1𝑇 𝑡0 , 𝑡
得证
3.4 能控与能观性的对偶关系
2. 对偶原理

若系统σ 1与系统σ 2是互为对偶系统,则系统σ 1的能控性等价于系统σ 2能观性,系统

σ 1的能观性等价于系统σ 2能控性。

证明: 对系统σ 1,其能控性Gram矩阵可表示为:


𝑡1 𝑡1

𝑊σ 1𝑐 [𝑡0 , 𝑡1 ] = න [𝜱1 𝑡0 , 𝑡 𝑩 𝑡 ][𝜱1 𝑡0 , 𝑡 𝑩 𝑡 ]𝑻 𝒅𝑡 = න [𝜱𝑻𝟐 𝑡, 𝑡0 𝑩 𝑡 ][𝜱𝑻𝟐 𝑡, 𝑡0 𝑩 𝑡 ]𝑻 𝒅𝑡


𝑡0 𝑡0

𝑡1

= න [𝑩𝑻 𝑡 𝜱𝟐 𝑡, 𝑡0 ]𝑇 [𝑩𝑻 𝑡 𝜱𝟐 𝑡, 𝑡0 ]𝒅𝑡 = 𝑊σ 2𝑜 [𝑡0 , 𝑡1 ]


𝑡0

即 σ 1系统的能控性等价于σ 2的能观性。

同理可证σ 1系统的能观性等价于σ 2的能控性。 得证


3.4 能控与能观性的对偶关系
三. 线性定常系统的对偶原理

1. 互为对偶的两系统的状态转移矩阵互为转置逆

对于线性定常系统σ 1:[A,B,C ]
 当对偶系统σ 2表示为:[−𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 ]

系统 σ 1 、σ 2 的状态转移矩阵分别为𝜱1 𝑡 − 𝑡0 、𝜱𝟐 (𝑡 − 𝑡0 )
𝑇 (𝑡 −𝑡)
则有: 𝜱1 𝑡 − 𝑡0 = 𝑒 𝐴(𝑡−𝑡0) , 𝜱1𝑇 𝑡 − 𝑡0 −1 = 𝑒𝐴 0

𝑇 (𝑡 −𝑡)
𝜱2 𝑡 − 𝑡0 = 𝑒 −𝐴
𝑇 (𝑡−𝑡 )
0 = 𝑒𝐴 0 = 𝜱1𝑇 𝑡0 − 𝑡

满足状态转移矩阵互为转置逆的性质。
 当对偶系统σ 2表示为:[𝑨𝑻 , 𝑪𝑻, 𝑩𝑻 ]
𝐴𝑇 (𝑡−𝑡0 )
则有: 𝜱2 𝑡 − 𝑡0 = 𝑒 = 𝜱1𝑇 𝑡 − 𝑡0 ≠ 𝜱1𝑇 𝑡0 − 𝑡 即不满足状态转移矩阵互为转置逆的性质。
3.4 能控与能观性的对偶关系

2. 对偶原理

若系统σ 1与系统σ 2是互为对偶系统,则系统σ 1完全能控等价于系统σ 2完全能观,系统

σ 1完全能观等价于系统σ 2 完全能控。
证明:
 当对偶系统σ 2表示为:[−𝑨𝑻 , 𝑪𝑻, 𝑩𝑻 ]
𝑡1 𝑡1
𝑻 (𝒕−𝑡0 ) ]𝑻 [𝑩𝑻 𝒆−𝑨𝑻 (𝒕−𝑡0 ) ] 𝒅𝑡
𝑊σ 2𝑂 [𝑡0 , 𝑡1 ] = න [𝑩𝑻 𝒆−𝑨 = න [𝒆𝑨(𝑡0−𝒕) 𝑩][𝒆𝑨(𝑡0−𝒕) 𝑩]𝑻 𝒅𝑡= 𝑊σ 1𝑐 [𝑡0 , 𝑡1 ]
𝑡0 𝑡0
𝑡1 𝑡1
−𝑨𝑻 (𝑡0 −𝒕) 𝑻 −𝑨𝑻 (𝑡0 −𝒕) 𝑻 𝑻
𝑊σ 2𝐶 [𝑡0 , 𝑡1 ] = න [𝒆 𝑪 ][𝒆 𝑪 ] 𝒅𝑡 = න [𝑪𝒆𝑨 (𝒕−𝑡0) ]𝑻 [𝑪𝒆𝑨 (𝒕−𝑡0) ] 𝒅𝑡 = 𝑊σ 1𝑂 [𝑡0 , 𝑡1 ]
𝑡0 𝑡0

即系统σ 1完全能控等价于系统σ 2完全能观,系统σ 1完全能观等价于系统σ 2完全能控。


得证
3.4 能控与能观性的对偶关系

2. 对偶原理

 当对偶系统σ 2表示为:[𝑨𝑻 , 𝑪𝑻, 𝑩𝑻 ]


𝑇
𝑪
𝑴Σ2 = 𝑪𝑻 𝑪𝑨 = 𝑵𝑇
𝑨𝑻 𝑪𝑻 ⋯ (𝑨𝑻 )𝒏−𝟏 𝑪𝑻 = ⋮ Σ1
𝑪𝑨𝒏−𝟏

𝐵𝑇
𝐵 𝑇 𝐴𝑇
𝑇 𝑇
𝑵Σ2 = ⋮ = 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩 = 𝑴Σ1
𝐵𝑇 (𝐴𝑇 )(𝑛−1)

故有:𝑟𝑎𝑛𝑘(𝑴Σ2 ) = 𝑟𝑎𝑛𝑘(𝑵𝑇Σ1 ) = 𝑟𝑎𝑛𝑘(𝑵Σ1 )


𝑟𝑎𝑛𝑘(𝑵Σ2 ) = 𝑟𝑎𝑛𝑘(𝑴𝑇Σ1 ) = 𝑟𝑎𝑛𝑘(𝑴Σ1 )
得证
《现代控制理论》MOOC课程

3.5 状态空间表达式的能控标准型与能观标准型
3.5 状态空间表达式的能控性标准型与能观标准型

一.能控性与能观性的不变性
𝒙ሶ =A𝒙 + 𝑩𝒖
定理:在任意非奇异线性变换下,线性定常系统 的能控性和能观性不变。
𝒚 = 𝑪𝒙
证明:令P为n×n维非奇异线性矩阵,对系统作如下变换 𝒙෥ = 𝑷𝒙 ,则系统状态方程为:
෥ሶ = 𝑨
𝒙 ෩𝒙 ෩𝒖
෥+𝑩 ෥
෩෥ ෩ =PA𝑷−𝟏 , 𝑩
其中,𝑨 ෩=C 𝑷−𝟏
෩ =PB, 𝑪
෥=𝑪
𝒚 𝒙

෩ 𝑨
由: 𝑩 ෩𝑩෩ ⋯ 𝑨
෩ 𝒏−𝟏 𝑩
෩ = 𝑷𝑩 𝑷𝑨𝑩 ⋯ 𝑷𝑨𝒏−𝟏 𝑩 =P 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩

𝑪 C 𝑷−𝟏 C
෩𝑨෩ = 𝑪𝑨 𝑷−𝟏
𝑪 = 𝑪𝑨 𝑷−𝟏
⋮ ⋮ ⋮
෩𝑨
𝑪 ෩ 𝒏−𝟏 𝑪𝑨𝒏−𝟏 𝑷−𝟏 𝑪𝑨𝒏−𝟏

由于非奇异变换不改变矩阵的秩 ෩
𝑪 C
෩𝑨෩
෩ 𝑨
故 rank 𝑩 ෩𝑩෩ ⋯ 𝑨 ෩ =r𝑎𝑛𝑘 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩
෩ 𝒏−𝟏 𝑩 rank 𝑪 = 𝑟𝑎𝑛𝑘 𝑪𝑨
⋮ ⋮
෩𝑨
𝑪 ෩ 𝒏−𝟏 𝑪𝑨𝒏−𝟏
即非奇异线性变换不改变系统的能控能观性。 得证。
3.5 状态空间表达式的能控标准型与能观标准型

二. 能控标准I型变换


结论:对于完全能控的单输入单输出线性定常系统 𝒙 =A𝒙 + 𝒃𝒖 存在线性非奇异变换 𝒙 = 𝑻𝑪𝟏 ഥ𝒙
y=𝑪𝒙

其中: 𝟏
𝒂𝒏−𝟏 𝟏
𝑻𝑪𝟏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 = 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯ 𝒃 ⋮ ⋮ ⋱
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏
𝒆𝟏 =𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃

𝒆𝟐 =𝑨𝒏−𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟑 𝒃 + ⋯ + 𝒂𝟑 𝑨𝒃 + 𝒂𝟐 𝒃

𝒆𝒏−𝟏 =𝑨𝒃 + 𝒂𝒏−𝟏 𝒃

𝒆𝒏 =𝒃
𝒂𝒊 ( 𝒊 = 𝟎, 𝟏, ⋯,n-1) 为系统特征多项式 𝝀𝑰 − 𝑨 = 𝝀𝒏 + 𝒂𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂𝟏 𝝀 + 𝒂𝟎 = 𝟎 的系数。
3.5 状态空间表达式的能控标准型与能观标准型

二. 能控标准I型变换

ഥ𝒙 ഥ𝒖
能够使状态空间表达式化成如下形式的能控标准型(I型):𝒙ഥሶ = 𝑨 ഥ + 𝒃ഥ
𝒚 ഥഥ
ഥ =𝑪 𝒙
其中: 0
0 1 ⋯ 0
ഥ = 𝑻𝑪𝟏 −𝟏 A𝑻𝑪𝟏 ⋮ ⋮ ⋱ ⋮ ഥ = 𝑻𝑪𝟏 −𝟏 𝒃 = ⋮
𝒃
𝑨 = 0 0 … 1 0 ഥ = 𝑪𝑻𝑪𝑰 = 𝜷𝟎
𝑪 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 1

𝜷𝟎 =C(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃)

𝜷𝟏 =𝑪(𝑨𝒏−𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟑 𝒃 + ⋯ + 𝒂𝟑 𝑨𝒃 + 𝒂𝟐 𝒃)

𝜷𝒏−𝟐 =𝐂(𝑨𝒃 + 𝒂𝒏−𝟏 𝒃)

𝜷𝒏−𝟏 =C𝒃
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换

证明:(1)推导 𝑨 ഥ
ഥ = 𝑻𝑪𝟏 −𝟏 A𝑻𝑪𝟏 可得 𝑻𝑪𝑰 𝑨
由 𝑨 ഥ = A𝑻𝑪𝑰 =A 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 = A𝒆𝟏 A𝒆𝟐 ⋯ A𝒆𝒏

A𝒆𝟏 =A(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃)=(𝑨𝒏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟏 𝒃 + ⋯ + 𝒂𝟐 𝑨𝟐 𝒃 + 𝒂𝟏 𝑨𝒃 + 𝒂𝟎 𝒃) − 𝒂𝟎 𝒃


= −𝒂𝟎 𝒃= −𝒂𝟎 𝒆𝒏

A𝒆𝟐 =A(𝑨𝒏−𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟑 𝒃 + ⋯ + 𝒂𝟑 𝑨𝒃 + 𝒂𝟐 𝒃)=(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃) −𝒂𝟏 𝒃 =𝒆𝟏 −𝒂𝟏 𝒆𝒏

𝑨𝒆𝒏−𝟏 =A(𝑨𝒃 + 𝒂𝒏−𝟏 𝒃) = (𝑨𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒃 + 𝒂𝒏−𝟐 𝒃) − 𝒂𝒏−𝟐 𝒃=𝒆𝒏−𝟐 − 𝒂𝒏−𝟐 𝒆𝒏

𝑨𝒆𝒏 =A𝒃 = A𝒃 + 𝒂𝒏−𝟏 𝒃 − 𝒂𝒏−𝟏 𝒃 = 𝒆𝒏−𝟏 − 𝒂𝒏−𝟏 𝒆𝒏

ഥ = −𝒂𝟎 𝒆𝒏 𝒆𝟏 −𝒂𝟏 𝒆𝒏 ⋯ 𝒆𝒏−𝟐 − 𝒂𝒏−𝟐 𝒆𝒏 𝒆𝒏−𝟏 − 𝒂𝒏−𝟏 𝒆𝒏


由此:𝑻𝑪𝟏 𝑨
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换

0 1 ⋯ 0 0 1 ⋯ 0
ഥ = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
𝑻𝑪𝟏 𝑨 0 0 … 1 = 𝑻𝑪𝟏 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 −𝑎0 −𝑎1 ⋯ −𝑎𝑛−1

0 1 ⋯ 0
ഥ= ⋮
故有:𝑨
⋮ ⋱


0 0 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1

(2)推导 𝒃ഥ
0 0 0
⋮ =𝑻 ⋮ ഥ= ⋮
由:𝒃ഥ = 𝑻𝑪𝟏 −𝟏 𝒃 可得 𝑻𝑪𝟏 𝒃ഥ = 𝒃 = 𝒆𝒏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 0 𝑪𝑰 0 故 𝒃
0
1 1 1
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换

(3)推导 𝑪ഥ
𝟏
𝒂𝒏−𝟏 𝟏
ഥ = 𝑪𝑻𝑪𝟏 = 𝑪 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯
𝑪 𝒃 ⋮ ⋮ ⋱ = 𝜷𝟎 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏
可得
𝜷𝟎 =C(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃)

𝜷𝟏 =𝑪(𝑨𝒏−𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟑 𝒃 + ⋯ + 𝒂𝟑 𝑨𝒃 + 𝒂𝟐 𝒃)

𝜷𝒏−𝟐 =𝐂(𝑨𝒃 + 𝒂𝒏−𝟏 𝒃)

𝜷𝒏−𝟏 =C𝒃
得证
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换

例. 将下列状态空间表达式
1 2 0 2
𝒙ሶ = 3 −1 1 𝒙 + 1 𝒖 y= 0 0 1 𝒙
0 2 0 1
变换为能控标准I型。
解.判别系统的可控性
2 4 16
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 1 6 8 rankM=3 系统完全能控
1 2 12
计算系统的特征多项式:det(𝝀𝑰 − 𝑨) = 𝝀𝟑 − 𝟗𝝀 + 𝟐 = 𝟎

可得 𝒂𝟎 = 𝟐, 𝒂𝟏 = −𝟗, 𝒂𝟐 = 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换

可得: 0 1 0 𝟎
ഥ= 0 0 ഥ= 𝟎
𝒃
𝑨 1
𝟏
−2 9 0

𝟏 𝟎 𝟎 16 4 2 𝟏 𝟎 𝟎
ഥ = 𝑪𝑻𝑪𝟏
𝑪 = 𝑪 𝑨𝟐 𝒃 𝑨𝒃 𝒃 𝒂𝟐 𝟏 𝟎 = 0 0 1 8 6 1 𝟎 𝟏 𝟎= 3 2 1
𝒂𝟏 𝒂𝟐 𝟏 12 2 1 −𝟗 𝟎 𝟏

有能控标准I型为:
0 1 0 𝟎
𝒙ሶ = 0 0 1 𝒙+ 𝟎 𝒖 𝒚= 3 2 1𝒙
−2 9 0 𝟏
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换

结论:对于完全能控的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙

存在线性非奇异变换 𝒙 = 𝑻𝑪𝟐 ഥ𝒙 , 𝑻𝑪𝟐 = 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃

能够使状态空间表达式化成如下形式的能控标准型(II型):
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙
其中:
𝟎 𝟎 ⋯ 𝟎 −𝑎0
𝟏 𝟎 ⋯ 𝟎 −𝑎1 1
ഥ = 𝑻𝑪𝟐 −𝟏 A𝑻𝑪𝟐
𝑨 = 𝟎 𝟏 ⋯ 𝟎 −𝑎2 ഥ = 𝑻𝑪𝟐 −𝟏 𝒃 = 0
𝒃
⋮ ⋮
𝟎 𝟎 ⋱ ⋮
0
𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1

𝒂𝒊 ( 𝒊 = 𝟎, 𝟏, ⋯,n-1) 为系统特征多项式 𝝀𝑰 − 𝑨 = 𝝀𝒏 + 𝒂𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂𝟏 𝝀 + 𝒂𝟎 = 𝟎 的系数。


3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换

ഥ = 𝑪𝑻𝑪𝟐 = 𝜷𝟎
𝑪 𝜷𝟏 ⋯ 𝜷𝒏−𝟏 𝜷𝟎 =C𝒃, 𝜷𝟏 =C𝑨𝒃, ⋯ , 𝜷𝒏−𝟏 =C𝑨𝒏−𝟏 𝒃


证明:(1)推导 𝑨
ഥ =A𝑻𝑪𝟐 = A 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃 = A𝒃 𝑨𝟐 𝒃 ⋯ 𝑨𝒏 𝒃
ഥ = 𝑻𝑪𝟐 −𝟏 A𝑻𝑪𝟐 可得 𝑻𝑪𝟐 𝑨
由 𝑨

由凯莱-哈密尔顿定理:𝑨𝑛 = −𝑎𝑛−1 𝑨𝑛−1 − ⋯ − 𝑎2 𝑨2 − 𝑎1 𝑨 − 𝑎0 𝑰 −𝑎0


−𝑎1
故 𝑨𝑛 𝒃 = −𝑎𝑛−1 𝑨𝑛−1 𝒃 − ⋯ − 𝑎2 𝑨2 𝒃 − 𝑎1 𝑨𝒃 − 𝑎0 𝒃 = 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃 −𝑎2

−𝑎𝑛−1

𝟎 𝟎 ⋯ 𝟎 −𝑎0 𝟎 𝟎 ⋯ 𝟎 −𝑎0
𝟏 𝟎 ⋯ 𝟎 −𝑎1 𝟏 𝟎 ⋯ 𝟎 −𝑎1
ഥ = 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃 𝟎
𝑻𝑪𝟐 𝑨 𝟏 ⋯ 𝟎 −𝑎2 故 ഥ= 𝟎
𝑨 𝟏 ⋯ 𝟎 −𝑎2
𝟎 𝟎 ⋱ ⋮ ⋮ 𝟎 𝟎 ⋱ ⋮ ⋮
𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1 𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换

(2)推导 𝒃ഥ
1 1 1
0 =𝑻 0 ഥ= 0
由:𝒃ഥ = 𝑻𝑪𝟐 −𝟏 𝒃 可得 𝑻𝑪𝟐 𝒃ഥ = 𝒃 = 𝒆𝟏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 ⋮ 𝑪𝟐 ⋮ 故 𝒃

0 0 0

(3)推导 𝑪ഥ

ഥ = 𝑪𝑻𝑪𝟐 = 𝑪 𝒃 𝑨𝒃 ⋯
𝑪 𝑨𝒏−𝟏 𝒃 = 𝜷𝟎 𝜷𝟏 ⋯ 𝜷𝒏−𝟏

𝜷𝟎 =C𝒃, 𝜷𝟏 =C𝑨𝒃, ⋯ , 𝜷𝒏−𝟏 =C𝑨𝒏−𝟏 𝒃

得证
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换

例. 将下列状态空间表达式
1 2 0 2
𝒙ሶ = 3 −1 1 𝒙 + 1 𝒖 y= 0 0 1 𝒙
0 2 0 1
变换为能控标准II型。
解.判别系统的可控性
2 4 16
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 1 6 8 rankM=3 系统完全能控
1 2 12
计算系统的特征多项式:det(𝝀𝑰 − 𝑨) = 𝝀𝟑 − 𝟗𝝀 + 𝟐 = 𝟎

可得 𝒂𝟎 = 𝟐, 𝒂𝟏 = −𝟗, 𝒂𝟐 = 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换

可得: 0 0 −2 𝟏
ഥ= 1 ഥ= 𝟎
𝒃
𝑨 0 9
𝟎
0 1 0

2 4 16
ഥ = 𝑪𝑻𝑪𝟐 = 𝑪 𝒃 𝑨𝒃 𝑨𝟐 𝒃 = 0 0 1
𝑪 1 6 8 = 1 2 12
1 2 12

有能控标准II型为:
0 0 −2 𝟏
𝒙ሶ = 1 0 9 𝒙+ 𝟎 𝒖 y= 1 2 12 𝒙
0 1 0 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
四. 能观标准I型变换

结论:对于完全能观的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
𝑪
存在线性非奇异变换 𝒙ഥ = 𝑻𝒐𝟏 𝒙 , 𝑻𝒐𝟏 =N= 𝑪𝑨

𝑪𝑨𝒏−𝟏

能够使状态空间表达式化成如下形式的能观标准I型:
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙

其中: 𝜷𝟎
0 1 ⋯ 0
ഥ = 𝑻𝒐𝟏 A𝑻𝒐𝟏 −𝟏
𝑨 = 0
⋮ ⋮ ⋱ ⋮ ഥ = 𝑻𝒐𝟏 𝒃 = 𝜷𝟏
𝒃
0 … 1 ⋮ ഥ = 𝑪𝑻𝒐𝟏 −𝟏 = 𝟏 𝟎
𝑪 ⋯ 𝟎
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 𝜷𝒏−𝟏
3.5 状态空间表达式的能控标准型与能观标准型
五. 能观标准II型变换

结论:对于完全能观的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
𝟏 𝒂𝒏−𝟏 ⋯ 𝒂𝟐 𝒂𝟏 𝒏−𝟏
𝟎 𝟏 ⋯ 𝒂𝟑 𝒂𝟐 𝑪𝑨
存在线性非奇异变换 𝒙ഥ = 𝑻𝒐𝟐 𝒙 , 𝑻𝒐𝟐 = ⋮ ⋮ ⋱ ⋮ ⋮ ⋮
⋯ 𝟏 𝒂𝒏−𝟏 𝑪𝑨
𝟎 𝟎
𝑪
𝟎 𝟎 ⋯ 𝟎 𝟏
能够使状态空间表达式化成如下形式的能观标准II型:
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙
其中:
0 0 ⋯ 0 −𝑎0 𝜷𝟎
1 0 ⋯ 0 −𝑎1
ഥ = 𝑻𝒐𝟐 A𝑻𝒐𝟐 −𝟏 ഥ = 𝑻𝒐𝟐 𝒃 = 𝜷𝟏
𝒃
𝑨 = 0 1 ⋯ 0 −𝑎2 ⋮ ഥ = 𝑪𝑻𝒐𝟐 −𝟏 = 𝟎 ⋯
𝑪 𝟎 𝟏
0 0 ⋱ ⋮ ⋮ 𝜷𝒏−𝟏
0 0 ⋯ 1 −𝑎𝑛−1
《现代控制理论》MOOC课程

3.6 线性系统的结构分解
3.6 线性系统的结构分解
一. 能控性分解

结论:对于不完全能控的n阶线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
其能控性判据 M= 𝑩 𝑨𝑩 ⋯ 𝑨n−1 𝑩 的秩为 rankM=𝑛1 < 𝑛
则存在非奇异变换 𝒙=𝑹𝑪 𝒙෥ ,将系统的状态空间表达式变换为按能控性分解的规范表达式
෥ሶ 𝒄
𝒙 ෩𝒄
𝑨 ෩ 𝟏𝟐 𝒙
𝑨 ෥𝒄 𝑩 ෩𝒄
= + 𝒖
ሶ𝒙
෥𝒄ത 𝟎 ෩
𝑨𝒄ത ෥
𝒙 𝒄ത 𝟎
෥𝒄
𝒙
෩𝒄
𝒚= 𝑪 ෩
𝑪𝒄ത
෥𝒄ത
𝒙
其中,变换阵 𝑹𝑪 按照如下方式选取,𝑹𝑪 的前𝒏𝟏 个列向量为能控性判别阵M中任意𝒏𝟏 个线

性无关的列向量,其余 𝒏 − 𝒏𝟏 个列向量在确保 𝑹𝑪 非奇异的情况下任意选取。


3.6 线性系统的结构分解

讨论
 不完全能控系统可被分解能控部分和不能控部分,其能控部分的 𝒏𝟏 阶子系统可表示为
෥ሶ 𝒄 = 𝑨
𝒙 ෩𝒄𝒙 ෩ 𝟏𝟐 𝒙
෥ 𝒄 +𝑨 ෩𝒄 𝒖
෥𝒄ത +𝑩
෩𝒄 𝒙
𝒚𝟏 = 𝑪 ෥𝒄
不能控的 𝒏 − 𝒏𝟏 阶子系统可表示为:
෥ሶ 𝒄ത = 𝑨
𝒙 ෩ 𝒄ത 𝒙
෥𝒄ത
𝒚𝟐 = 𝑪 ෩𝒄ത 𝒙෥𝒄ത
෩𝒄
𝒔𝑰 − 𝑨 −𝑨෩ 𝟏𝟐
෩ =det
 由于 𝒅𝒆𝒕 𝒔𝑰 − 𝑨 = 𝒅𝒆𝒕 𝒔𝑰 − 𝑨 = 𝒅𝒆𝒕 𝒔𝑰 − ෩ 𝒄 𝒅𝒆𝒕(𝒔𝑰 − 𝑨
𝑨 ෩ഥ𝒄)
𝟎 ෩ഥ𝒄
𝒔𝑰 − 𝑨

෩ 𝒄的特征值,称为系统的能控振型;另一部
故系统的特征值,被分为两部分。一部分为 𝑨
෩ 𝒄ത 的特征值,称为系统的不能控振型。输入只能改变能控振型的位置,而不能改变
分为 𝑨
不能控振型的位置。
3.6 线性系统的结构分解
讨论

 系统的不能控子系统是不受外部输入作用影响的子系统。

 由于变换阵𝑹𝑪的选取不是唯一的,因此能控性分解的结果也是不唯一的。

例:将如下系统按能控性进行结构分解:
1 2 −1 0
𝑨= 0 1 0 , 𝑩= 0 , C= 1 −1 1
0 −4 3 1
解:系统的能控性秩判别矩阵为:
0 −1 −4 0 −1 0 3 0 1
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 0 0 0 rankM=2 取 𝑅𝑐 = 0 0 1 𝑅𝐶−1 = −1 0 0
1 3 9 1 3 0 0 1 0
3.6 线性系统的结构分解
做如下线性变换 :𝒙 =𝑹𝑪 𝒙෥ 得:
3 0 1 1 2 −1 0 −1 0 0 −3 2
ഥ =𝑹−𝟏
𝑨 𝑪 𝑨𝑹𝑪 = −1 0 0 0 1 0 0 0 1 = 1 4 −2
0 1 0 0 −4 3 1 3 0 0 0 1
3 0 1 0 1 0 −1 0
ഥ =𝑹−𝟏
𝑩 𝑪 𝑩 = −1 0 0 0 = 0 ഥ=𝑪𝑹𝑪 = 1 −1
𝑪 1 0 0 1 = 1 2 −1
0 1 0 1 0 1 3 0

得能控分解标准型为:
ሶ𝒙𝒄 0 −3 2
෥ ෥𝒄 1
𝒙 ෥𝒄
𝒙
= 1 4 −2 +0 𝒖 𝒚= 1 2 −1
ሶ𝒙
෥𝒄ത ෥
𝒙 𝒄ത ෥𝒄ത
𝒙
0 0 1 0

能控子系统为: 不能控子系统为:
0 −3 2 1
෥ሶ 𝒄 =
𝒙 ෥𝒄 +
𝒙 ෥𝒄ത + 𝒖
𝒙 ෥ሶ 𝒄ത = 1 𝒙
𝒙 ෥𝒄ത
1 4 −2 0
𝒚𝟏 = 1 2 𝒙 ෥𝒄 𝒚𝟐 = −1 𝒙 ෥𝒄ത
3.6 线性系统的结构分解
二. 能观性分解

结论:对于不完全能观的n阶线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
𝑪 y=𝑪𝒙
其能观性判据 N= 𝑪𝑨
⋮ 的秩为 rankN=𝑛1 < 𝑛
𝑪𝑨𝒏−𝟏
则存在非奇异变换 𝒙෥ = 𝑹𝑶 𝒙 ,将系统的状态空间表达式变换为按能观性分解的规范表达式

෥ሶ 𝑶
𝒙 ෩𝑶
𝑨 𝟎 𝒙 ෥𝑶 ෩𝑶
𝑩
= + 𝒖
ሶ𝒙
෥𝑶ഥ ෩ 𝟐𝟏
𝑨 ෩
𝑨𝑶ഥ ෥
𝒙 ഥ
𝑶 ෩
𝑩𝑶ഥ
෥𝑶
𝒙
෩𝑶
𝒚= 𝑪 𝟎 ෥
𝒙𝑶ഥ
其中,变换阵 𝑹𝑶 按照如下方式选取,𝑹𝑶的前𝒏𝟏 个行向量为能观性判别阵N中任意 𝒏𝟏个线

性无关的行向量,其余 𝒏 − 𝒏𝟏 个行向量在确保 𝑹𝑶 非奇异的情况下任意选取。


3.6 线性系统的结构分解
例:将如下系统按能观性进行结构分解:
−2 2 −1 0
𝑨 = 0 −2 0 , 𝑩= 0 , C= 1 −1 1
1 −4 0 1
解:系统的能观性秩判别矩阵为:
𝑪 1 −1 1 1 −1 1 0 0 1
N= 𝑪𝑨 = −1 0 −1 rankN=2 取 𝑹𝑂 = −1 0 −1 得 𝑹−1
𝑂 = −1 −1 0
𝑪𝑨𝟐 1 2 1 1 0 0 0 −1 −1

做线性变换: 𝒙෥=𝑹𝑶 𝒙 得
1 −1 1 −2 2 −1 0 0 1 0 1 0
ഥ =𝑹𝑶 𝑨𝑹−𝟏
𝑨 𝑶 = −1 0 −1 0 −2 0 −1 −1 0 = −2 −3 0
1 0 0 1 −4 0 0 −1 −1 −2 −1 −1

1 −1 1 0 1
ഥ =𝑹𝑶 𝑩 = −1 0
𝑩 −1 0 = −1
1 0 0 1 0
3.6 线性系统的结构分解
0 0 1
ഥ=𝑪𝑹−𝟏
𝑪 𝑶 = 1 −1 1 −1 −1 0 = 1 0 0
0 −1 −1

得能观性分解标准型为:
0 1 0
෥ሶ 𝑶
𝒙 ෥𝑶
𝒙 1
= −2 −3 0 + −1 𝒖
෥ሶ 𝑶ഥ
𝒙 −2 −1 −1
෥𝑶ഥ
𝒙 0

෥𝑶
𝒙
𝒚= 1 0 0
෥𝑶ഥ
𝒙

得能观子系统为: 不能观子系统为:

෥ሶ 𝑶 =
𝒙
0
1
෥𝑶 +
𝒙
1
𝒖
෥ሶ 𝑶ഥ = −𝟏 𝒙
𝒙 ෥𝑶ഥ + −𝟐 ෥𝑶
−𝟏 𝒙
−2
−3 −1
෥𝑶
𝒚𝟏 = 𝟏 𝟎 𝒙
3.6 线性系统的结构分解
三. 能控性和能观性分解

𝒙ሶ =A𝒙 + 𝒃𝒖
结论:对于不完全能控和不完全能观的n阶线性定常系统
y=𝑪𝒙
通过非奇异线性变换,可实现系统结构的规范型分解,其规范分解的表达式为:

෥ሶ 𝒄𝒐
𝒙 ෩ 𝒄𝒐
𝑨 𝟎 ෩ 𝟏𝟑
𝑨 𝟎 ෥𝒄𝒐 𝑩
𝒙 ෩ 𝒄𝒐 ෥𝒄𝒐
𝒙
෥ሶ 𝒄ഥ𝒐
𝒙 ෩ 𝟐𝟏
𝑨 ෩ 𝒄ഥ𝒐
𝑨 ෩ 𝟐𝟑
𝑨 ෩ 𝟐𝟒
𝑨 ෥𝒄ഥ𝒐 𝑩
𝒙 ෩ ෩𝒄𝒐 ෩𝒄ത𝒐
෥𝒄ഥ𝒐
𝒙
= + 𝒄ഥ𝒐 𝒖 𝒚= 𝑪 𝟎 𝑪 𝟎
෥ሶ 𝒄ത𝒐
𝒙 𝟎 𝟎 ෩ 𝒄ത𝒐
𝑨 𝟎 ෥𝒄ത𝒐
𝒙 𝟎 ෥𝒄ത𝒐
𝒙
෩ 𝒄ത𝒐ഥ
𝑨 ෥𝒄ത𝒐ഥ
𝒙 ෥𝒄ത𝒐ഥ
𝒙
෥ሶ 𝒄ത𝒐ഥ
𝒙 𝟎 𝟎 ෩ 𝟒𝟑
𝑨 𝟎

෥𝒄𝒐 为能控且能观测状态,෥
其中, 𝒙 𝒙𝒄ഥ𝒐 为能控但不能观状态,෥
𝒙𝒄ത𝒐 为不能控但能观状态,
෥𝒄ത𝒐ഥ 为不能控且不能观状态。
𝒙
第三章 线性控制系统的能控性和能观性

第三章 小结

 能控、能观性是现代控制理论最重要、最基本的概念。应牢固掌握能控、能观性的定义
、判据、标准型和结构分解,掌握能控、能观的对偶原理。
 能控、能观指的是系统的状态能控、能观。能控性反映了外部控制对系统内部运动状
态的可影响性,能观性则表征了系统内部运动状态通过外部输出的可反映性。
 能控、能观性判据的证明是完美的,对于用数学方法解决工程问题有指导意义。

 能控标准型和能观标准型是便于控制器和观测器综合的状态空间表达式的最简单形式。

 线性系统的结构分解能够深刻揭示系统内部能控、能观性状态变量的结构。
《现代控制理论》MOOC课程

第四章 稳定性与李亚普诺夫方法
第四章 稳定性与李亚普诺夫方法

李亚普诺夫关于稳定性的定义

李亚普诺夫第一法

李亚普诺夫第二法

李亚普诺夫方法在线性系统中的应用

李亚普诺夫方法在非线性系统中的应用
第四章 稳定性与李亚普诺夫方法

 稳定性是控制系统最重要的特性。

 李亚普诺夫奠定了稳定性理论的基础。

 李亚普诺夫稳定性理论是研究系统稳定性的普遍方法。

 系统的稳定性是相对系统的平衡状态而言的。
《现代控制理论》MOOC课程

4.1 李亚普诺夫关于稳定性的定义
4.1 李亚普诺夫关于稳定性的定义
一. 系统的平衡状态

对于一个不受外力作用的系统
𝒙ሶ = 𝒇 𝒙, 𝑡 , 𝒙 𝑡𝟎 = 𝒙𝟎 ,𝒕 ≥ 𝑡𝟎

如果存在某个状态𝒙𝒆 ,使 𝒙ሶ 𝒆 = 𝒇 𝒙𝒆 , 𝑡 , = 𝟎, ∀𝑡 ≥ 𝑡𝟎
成立,则称𝒙𝒆 为系统的一个平衡状态。

 对于线性系统:𝒙ሶ = 𝑨𝒙 , 𝑨𝒙𝒆 =0
当A非奇异,系统只有唯一的一个平衡状态,𝒙𝒆 =0
当A奇异,则存在无穷多个平衡状态。

 对于非线性系统通常存在多个平衡状态。
4.1 李亚普诺夫关于稳定性的定义
一. 系统的平衡状态
𝒙𝟐
例如:对于非线性系统
𝒙ሶ 𝟏 = −𝒙𝟏 𝒙𝒆𝟐

𝒙ሶ 𝟐 = 𝒙𝟏 + 𝒙𝟐 − 𝒙𝟑𝟐

𝒙𝟏 = 𝟎
其平衡状态为方程: ൝𝒙 + 𝒙 − 𝒙𝟑 = 𝟎 的解 𝒙𝒆𝟏 𝒙𝟏
𝟏 𝟐 𝟐

𝟎 𝟎 𝟎 𝒙𝒆𝟑
𝒙 =
可解得有三个平衡状态: 𝟏 𝟎
𝒆 , 𝒙𝒆 = , 𝒙𝒆 =
𝟐 𝟏 𝟑 −𝟏

 孤立的平衡状态:如果平衡状态是彼此孤立的,即在某一平衡状态的任意小的邻域内
不存在其它平衡状态,则称该平衡状态为孤立的平衡状态。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义

1.李亚普诺夫意义下的稳定

若一不受外力作用的系统(自治系统)
𝒙ሶ = 𝒇 𝒙, 𝑡 , 𝒙 𝑡𝟎 = 𝒙𝟎 ,𝒕 ≥ 𝑡𝟎
对任意选定的实数 𝜺 > 0 ,都存在另一实数𝜹 𝜺, 𝑡𝟎 > 0,使得由满足不等式
𝒙𝟐
𝒙𝟎 − 𝒙𝒆 <𝜹 𝜺, 𝑡𝟎
的任一初始状态出发的受扰运动都满足不等式 𝜺
𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 < 𝜺, 𝒕 ≥ 𝑡𝟎
𝒙𝒆 𝒙𝟏
则称孤立平衡状态𝒙𝒆 为李亚普诺夫意义下的稳定状态。 𝒙𝟎 𝟎
𝜹
𝚽

 若𝜹的取值与𝑡𝟎 无关,则称这个孤立平衡状态是一致稳定的。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义
𝒙𝟐

2. 渐进稳定 𝜺

若平衡状态 𝒙𝒆 是李亚普诺夫意义下的稳定状态,且满足 𝒙𝟏
𝒙𝒆
𝒙𝟎 𝟎
lim 𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 =0 𝜹
𝒕→∞
𝚽
则称孤立平衡状态𝒙𝒆 为渐进稳定的。 𝒙𝟐

3. 大范围渐进稳定
𝒙𝟎 𝚽
若平衡状态 𝒙𝒆 是李亚普诺夫意义下的稳定状态, 𝒙𝟏
且对系统的任一非平衡初始状态均满足 𝟎 𝒙𝒆

lim 𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 =0
𝒕→∞
 李雅普诺夫意义下的渐进稳定等于工程意
则称孤立平衡状态𝒙𝒆 为大范围渐进稳定的。 义下的稳定。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义

4. 不稳定
𝒙𝟐

若一不受外力作用的系统(自治系统)
𝒙ሶ = 𝒇 𝒙, 𝑡 , ሶ 𝒙 𝑡𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝑡𝟎 𝚽
若对于不管取多么大的有限实数 𝜺 > 0 ,都不可能找 𝒙𝟏
𝒙𝟎 𝜹
到相应的实数𝜹 𝜺, 𝑡𝟎 > 0,使得由满足不等式:
𝟎 𝒙𝒆
𝜺
𝒙𝟎 − 𝒙𝒆 <𝜹 𝜺, 𝑡𝟎

的任一初始状态出发的受扰运动都不满足不等式

𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 < 𝜺, 𝒕 ≥ 𝑡𝟎

则称孤立平衡状态𝒙𝒆 为李亚普诺夫意义下的不稳定状态。
《现代控制理论》MOOC课程

4.2 李亚普诺夫第一法
4.2 李亚普诺夫第一法

 李亚普诺夫第一法的基本思想是通过系统状态方程的解来判断系统的稳定性,因此
这种方法又称为间接方法。

1. 外部稳定(输出稳定)

给定系统一个有界输入(扰动),判断系统的输出是否有界,若系统的输出是有界的,
则称系统在该输入(扰动)下是稳定的。

2. 内部稳定(状态稳定)

只需求出系统矩阵A的所有特征值(对于非线性系统,在平衡状态附近一次线性化),

若系统所有特征值均有负实部,则系统是稳定,否则系统是不稳定的。
《现代控制理论》MOOC课程

4.3 李亚普诺夫第二法
4.3 李亚普诺夫第二法
李亚普诺夫第二法是基于这样一个基本的物理事实:
 如果一个系统经受一个扰动,当扰动消失后,系统储存的能量将随着时间的推移而逐渐
衰减,直至趋于平衡状态,系统的能量趋于极小值,那么这个平衡状态就是渐近稳定的

 若当扰动消失后,系统的能量不再增加,那么这个平衡状态就是李亚普诺夫意义下的
稳定;
 若当扰动消失后,系统不断从外界吸收能量,系统的储能随着时间的推移不断增加,
那么这个平衡状态就是不稳定的。

𝑥𝑒
𝑥0 𝑥0

𝑥𝑒
4.3 李亚普诺夫第二法

一. 预备知识

1.标量函数𝑽(𝒙)符号性质的几个定义

(1). 如果对于在域 𝑸中的所有非零向量𝒙 ,有 𝑽 𝒙 > 𝟎, 且在𝒙 = 𝟎有𝑽 𝒙 = 𝟎, 则在域 𝑸 内


称标量函数 𝑽 𝒙 为正定。
例如: 𝑽 𝒙 =𝑥𝟏𝟐 + 2𝑥𝟐𝟐
(2). 如果标量函数 𝑽 𝒙 除了在原点及某些状态等于零外,在域 𝑸 中的所有其它状态都为
正,则标量函数 𝑽 𝒙 为半正定。
例如:𝑽(𝒙)=(𝑥1 +𝑥2 )2

(3). 如果标量函数 −𝑽 𝒙 是正定的,则标量函数 𝑽 𝒙 为负定。


例如: 𝑽 𝒙 = −(𝑥𝟏𝟐 + 𝟐𝑥𝟐𝟐 )
4.3 李亚普诺夫第二法

一. 预备知识

(4). 如果标量函数 −𝑽 𝒙 是半正定的,则标量函数 𝑽 𝒙 为半负定。


例如:𝑽(𝒙)= − (𝑥1 +𝑥2 )2
(5). 如果在域𝑸内,不论 𝑸多么小,𝑽 𝒙 既可为正值也可为负值。则标量函数𝑽 𝒙 称为
不定。 例如:𝑽(𝒙)=𝑥 𝑥 + 𝑥 2
1 2 2

2. 二次型函数的符号性质
设𝑽 𝒙 是一个二次型函数,即𝑽 𝒙 =𝒙𝑻 𝑷𝒙,其中 𝑷 为对称阵。当𝒙 ≠ 0时, 𝑽 𝒙 >0,
则𝑽 𝒙 是正定的,因而矩阵𝑷是正定的。
 判断𝑽(𝒙)为正定的准则为𝑷的所有主子行列式均大于零。
 判断𝑽(𝒙)为负定的准则为𝑷的各阶主子行列式𝚫𝒊 满足:
𝚫𝒊 : 𝒊 =偶数, 𝚫𝒊 >0; 𝒊 =奇数,𝚫𝒊 <0;
4.3 李亚普诺夫第二法
二. 李亚普诺夫稳定性判据

定理(李雅普诺夫稳定性主判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;

(2) 𝑽ሶ 𝒙 是负定的;

则系统在平衡状态𝒙𝒆 = 𝟎是渐进稳定的。
(3) 除满足条件(1)、(2)外, 若 𝒙 → ∞, 有𝑽 𝒙 → ∞,则系统在平衡状态𝒙𝒆 = 𝟎是大范
围渐进稳定的。
4.3 李亚普诺夫第二法

例:对于非线性系统
𝑥ሶ1 =𝑥2 − 𝑥1 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
𝑥ሶ 2 =−𝑥1 − 𝑥2 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )

由于𝑉 𝒙 正定,𝑽ሶ 𝒙 负定,故系统在平衡状态𝒙𝒆 = 𝟎 是渐近稳定的。

由于当 𝒙 → ∞, 有𝑽 𝒙 → ∞ ,故系统在平衡状态𝒙𝒆 = 𝟎 是大范围渐近稳定的。


4.3 李亚普诺夫第二法

例:对于线性系统
𝑥ሶ1 =𝑥2
𝑥ሶ 2 =−𝑥1 − 𝑥2
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2𝑥𝟐𝟐

由于𝒙𝟏 = 𝟎,𝒙𝟐 = 𝟎时有,𝑽ሶ 𝒙 = 𝟎;


𝒙𝟏 ≠ 𝟎,𝒙𝟐 = 𝟎时有,𝑽ሶ 𝒙 = 𝟎; 𝑽ሶ 𝒙 为半负定

𝒙𝟐 ≠ 𝟎时有, 𝑽(𝒙)<𝟎

由于李亚普诺夫第二稳定性判别定理,只是充分条件,而非必要条件,故据此并不能判
定系统在平衡状态不稳定。
4.3 李亚普诺夫第二法

1
重新选取正定标量函数: 𝑉 𝒙 = [(𝑥1 +𝑥2 )2 + 2𝑥𝟏𝟐 + 𝑥𝟐𝟐 ]
2

𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = (𝑥1 +𝑥2 ) 𝑥ሶ 1 + 𝑥ሶ 2 + 2𝑥1 𝑥ሶ 1 +𝑥2 𝑥ሶ 2 = −(𝑥𝟏𝟐 +𝑥𝟐𝟐 )

显然𝑉ሶ 𝒙 负定。

由于𝑉 𝒙 正定,𝑽ሶ 𝒙 负定,故系统在平衡状态𝒙𝒆 = 𝟎 是渐近稳定的。

由于当 𝒙 → ∞, 有𝑽 𝒙 → ∞ ,故系统在平衡状态𝒙𝒆 = 𝟎 是大范围渐近稳定的。


4.3 李亚普诺夫第二法
二. 李亚普诺夫稳定性判据

定理(李雅普诺夫稳定性辅助判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;

(2) 𝑽ሶ 𝒙 是半负定的;
(3) 对于任意初始状态𝒙(𝑡0 ) ≠ 0, 在𝑡 ≥ 𝑡0 ,除𝒙= 0时, 有𝑽ሶ 𝒙 = 0外,𝑽ሶ 𝒙 不恒等于零。
则系统在平衡状态𝒙𝒆 = 𝟎是渐进稳定的。
(4) 除满足条件(1)、(2)、 (3)外, 若 𝒙 → ∞, 有𝑽 𝒙 → ∞,则系统在平衡状态𝒙𝒆 = 𝟎是
大范围渐进稳定的。
 𝑽ሶ 𝒙 半负定,说明在𝑡 ≥ 𝑡0 的某些时刻,系统的“能量”不再减少;𝑽ሶ 𝒙 不恒等于零,
表明系统“能量”不再减少的状态不能保持,即系统会继续减少能量,直到平衡状态。
4.3 李亚普诺夫第二法

例:对于线性系统
𝑥ሶ1 =𝑥2
𝑥ሶ 2 =−𝑥1 − 𝑥2
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2𝑥𝟐𝟐

由于𝒙𝟏 = 𝟎,𝒙𝟐 = 𝟎时有,𝑽ሶ 𝒙 = 𝟎;


𝒙𝟏 ≠ 𝟎,𝒙𝟐 = 𝟎时有,𝑽ሶ 𝒙 = 𝟎; 𝑽ሶ 𝒙 为半负定

𝒙𝟐 ≠ 𝟎时有, 𝑽(𝒙)<𝟎

只要𝒙𝟐 不恒等于0,𝑽ሶ 𝒙 就不恒等于0。


4.3 李亚普诺夫第二法

由状态方程:𝑥ሶ 2 =−𝑥1 − 𝑥2 可知:

只要 x1  0 即使 x2 0 ,x2 也不会等于0,即x2 不会恒等于0。

V ( x )  0 只是暂时出现在某一时刻。

故系统在平衡状态𝒙𝒆 = 𝟎 是渐近稳定的。

由于当 𝒙 → ∞, 有𝑽 𝒙 → ∞ ,故系统在平衡状态𝒙𝒆 = 𝟎 是大范围渐近稳定的。


4.3 李亚普诺夫第二法
二. 李亚普诺夫稳定性判据

定理(李雅普诺夫不稳定性判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;
(2) 𝑽ሶ 𝒙 是正定的;
则系统在平衡状态𝒙𝒆 = 𝟎是不稳定的。

例:系统的状态方程为: 𝑥ሶ1 =𝑥1 + 𝑥2


𝑥ሶ 2 =−𝑥1 + 𝑥2
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为:𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ1 +2𝑥2 𝑥ሶ 2 = 2(𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
由于𝑉 𝒙 正定,𝑽ሶ 𝒙 也正定,故系统在平衡状态𝒙𝑒 是不稳定的。
4.3 李亚普诺夫第二法
关于李亚普诺夫第二法的几点说明

1. 李亚普诺夫函数是一个标量函数;是一个正定函数 ;对于一个给定系统,李亚普诺
夫函数不是惟一的。

2. 不仅对于线性系统,而且对于非线性系统,它都能给出关于大范围内稳定的信息。

3. 李亚普诺夫稳定性定理只是充分条件;对于一个特定系统,若不能找到一个合适的
李亚普诺夫函数来判定系统的稳定性,则不能给出该系统稳定性的任何信息。

4. 李亚普诺夫稳定性理论没有提供构造李亚普诺夫函数的一般方法;李亚普诺夫函数最
简单的形式是二次型函数。
《现代控制理论》MOOC课程

4.4 李亚普诺夫方法在线性系统中的应用
4.4 李亚普诺夫方法在线性系统中的应用
一. 线性定常系统的渐近稳定性判据

定理:对于给定的没有外界输入的线性定常系统:𝒙ሶ = 𝑨𝒙, 𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 0
在平衡状态 𝒙𝒆 = 𝟎 渐近稳定的充要条件为:对于任意给定的一个实正定对称
矩阵𝑸,必存在唯一的实正定对称矩阵𝑷,满足如下李亚普诺夫方程:
𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸
证明:充分性
𝑷为正定实对称阵且满足李亚普诺夫方程,则系统在 𝒙𝒆 = 𝟎 渐近稳定。
取 𝑽 𝒙 = 𝒙𝑻 𝑷𝒙,由于𝑷 = 𝑷𝑻 > 0,故 𝑽 𝒙 为正定。
则 𝑽ሶ 𝒙 = 𝒙ሶ 𝑻 𝑷𝒙 + 𝒙𝑻 𝑷𝒙ሶ = (𝑨𝒙)𝑻 𝑷𝒙 + 𝒙𝑻 𝑷(𝑨𝒙) = 𝒙𝑻 𝑨𝑻 𝑷𝒙 + 𝒙𝑻 𝑷𝑨𝒙
= 𝒙𝑻 (𝑨𝑻 𝑷 + 𝑷𝑨)𝒙 = −𝒙𝑻 𝑸𝒙
由于𝑸为正定对称矩阵,故𝑽ሶ 𝒙 负定;
由李亚普诺夫稳定性判据,系统在平衡状态 𝒙𝒆 = 𝟎 是渐近稳定的。 充分性得证
4.4 李亚普诺夫方法在线性系统中的应用
一. 线性定常系统的渐近稳定性判据

证明必要性
系统在 𝒙𝒆 = 𝟎 为渐近稳定,𝑸为正定对称阵,则𝑷为唯一满足李亚普诺夫方程的对称正定阵。
考虑如下矩阵微分方程:𝑿ሶ = 𝑨𝑻 𝑿 + 𝑿𝑨, 𝑿 𝟎 = 𝑸, 𝒕≥𝟎
𝑻𝒕
易知其解矩阵为: 𝑿 𝒕 = 𝒆 𝑸𝒆𝑨𝒕 ,
𝑨 𝒕≥𝟎
𝑻 ∞ ∞
对矩阵方程由𝑡 = 0至 𝑡 → ∞ 求取积分,可得:𝑿 ∞ − 𝑿 0 = 𝑨 ‫׬‬0 𝑿𝒅𝑡 + (‫׬‬0 𝑿𝒅𝑡)𝑨
由于系统在 𝒙𝒆 = 𝟎 为渐近稳定,即𝑿 ∞ =0

令 𝑷 = ‫׬‬0 𝑿𝒅𝑡 ,则矩阵方程可表示为李雅普诺夫方程:𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸

即𝑷为李亚普诺夫方程的解。

由于𝑿 𝒕 存在且唯一及𝑿 ∞ =0 ,故𝑷存在且唯一。


4.4 李亚普诺夫方法在线性系统中的应用
一. 线性定常系统的渐近稳定性判据

∞ 𝑻 ∞ 𝑨𝑻 𝒕 ∞ 𝑨𝑻 𝒕 𝑨𝒕
由:𝑷 = 𝑻
‫׬‬0 𝑿 𝒅𝑡 = ‫׬‬0 (𝒆 𝑸𝒆 ) 𝒅𝑡 = ‫׬‬0 𝒆 𝑸𝒆 𝒅𝑡
𝑨𝒕 𝑻 =𝑷

可知: 𝑷为对称阵。 ∞
∞ 𝑨𝑻 𝒕
对任意 𝒙0 ≠ 𝟎,有: 𝒙0 𝑷 𝒙0 = 𝑻
𝒙0 [‫׬‬0 𝒆 𝑸𝒆𝑨𝒕 𝒅𝑡]
𝑻
𝒙0 = න (𝒆𝑨𝒕 𝒙0 )𝑻 𝑸(𝒆𝑨𝒕 𝒙0 )𝒅𝑡
0
由于𝑸为正定对称阵,故有𝑸 = 𝑵𝑇 𝑵, 𝑵为非奇异矩阵。
∞ ∞

这样 𝒙0 𝑻 𝑷 𝒙0 = න (𝒆𝑨𝒕 𝒙0 )𝑻 𝑵𝑇 𝑵(𝒆𝑨𝒕 𝒙0 )𝒅𝑡 = න (𝑵𝒆𝑨𝒕 𝒙0 )𝑻 (𝑵𝒆𝑨𝒕 𝒙0 )𝒅𝑡


0 0

2
=න 𝑵𝒆𝑨𝒕 𝒙0 𝒅𝑡 > 0
0

故𝑷为正定。即𝑷为唯一的满足李雅普诺夫方程的对称正定阵。必要性得证。 得证
4.4 李亚普诺夫方法在线性系统中的应用

关于线性定常系统李亚普诺夫判据的几点说明

1. 为何不直接根据李亚普诺夫判据给定正定矩阵𝑷,通过判断 𝑸 = −(𝑨𝑻 𝑷 + 𝑷𝑨)


的符号性质,来判定系统的渐近稳定性。
给定𝑷,计算𝑸的方法,相当于直接应用李亚普诺夫稳定性主判据。一般意义下的李亚
普诺夫判据只是充分条件而非必要条件,若不满足判据则不能判定系统是否稳定。
而应用李亚普诺夫方程,给定𝑸 ,计算𝑷。则能一次就判定系统是稳定或不稳定。
2. 线性系统中的李亚普诺夫方程为充要条件,对于任意给定的实正定对称矩阵𝑸,若根
据李亚普诺夫方程得到矩阵𝑷,当𝑷>0系统是大范围渐近稳定的;当𝑷<0时,系统是不
稳定的;当𝑷半正定或不定时,系统不是渐近稳定的,但系统是否李亚普诺夫稳定还需
进一步判别。
3. 给定的𝑸只要求正定对称,最简单的是取𝑰 ,而后求解 n(n+1)/2 阶的代数方程组。
4.4 李亚普诺夫方法在线性系统中的应用

例:对于线性系统
0 1
A=
−1 −1
试判别其稳定性。
解:采用线性定常系统的李亚普诺夫判据
𝑝11 𝑝12
令𝑸=𝑰,𝑷= 𝑝 𝑝 。
21 22
1.5 0.5
由李雅普诺夫方程𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸 可得: 𝑷 =
0.5 1
1.5 0.5
其主子行列式:∆𝟏 = 𝟏. 𝟓 > 𝟎, ∆𝟐 = = 1.25 > 0
0.5 1
故𝑷为正定对称阵,系统是渐近稳定的。
4.4 李亚普诺夫方法在线性系统中的应用
二. 线性时变系统的渐近稳定性判据

定理:对于给定的没有外界输入的线性时变系统:
𝒙ሶ = 𝑨(𝒕)𝒙, 𝒙 𝑡0 = 𝒙𝟎 , 𝒕 ≥ 0 , 𝑡0 ≥0
在平衡状态 𝒙𝒆 = 𝟎 渐近稳定的充要条件为:对于任意给定的一个实对称,一致正定矩阵
𝑸(𝒕),必存在唯一的实正定,一致对称矩阵𝑷(𝒕),满足如下李亚普诺夫方程:
𝑷ሶ 𝒕 = −𝑨𝑻 𝒕 𝑷 𝒕 − 𝑷 𝒕 𝑨 𝒕 − 𝑸 𝒕 , 𝑡 ≥ 𝑡0

证明略,思路与线性定常系统相同。
《现代控制理论》MOOC课程

4.5 李亚普诺夫方法在非线性系统中的应用
4.5 李亚普诺夫方法在非线性系统中的应用

一. 雅克比矩阵法(克拉索夫斯基法)

考虑n维非线性系统: 𝒙ሶ = 𝒇(𝒙)
𝒇 𝒙 对 𝑥𝑖 (𝑖 = 1,2, ⋯ )连续可微,系统的雅可比矩阵为
𝜕𝑓1 𝜕𝑓1 𝜕𝑓1

𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝜕𝑓2 𝜕𝑓2 𝜕𝑓2
𝜕𝑓(𝑥) ⋯
𝐽 𝒙 = = 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝜕𝑥
⋮ ⋮ ⋮ ⋮
𝜕𝑓𝑛 𝜕𝑓𝑛 𝜕𝑓𝑛
𝜕𝑥1 𝜕𝑥2 ⋯ 𝜕𝑥𝑛
系统在平衡状态 𝒙𝒆 = 𝟎,渐近稳定的充分条件为:对任意正定的实对称阵𝑷 ,使下列矩阵
𝑸 𝒙 = −𝑱𝑻 𝒙 𝑷 − 𝑷𝑱 𝒙 为正定。
且 𝑽 𝒙 = 𝒇𝑻 𝒙 𝑷𝒇 𝒙 是系统的一个李亚普诺夫函数。

如果,当 𝒙 → ∞,有𝑽 𝒙 → ∞,则系统在平衡状态是大范围渐近稳定的。


4.5 李亚普诺夫方法在非线性系统中的应用

证明:由于𝑷为对称正定阵,故𝑽 𝒙 = 𝒇𝑻 𝒙 𝑷𝒇 𝒙 为正定。

𝑽ሶ 𝒙 = 𝒇ሶ 𝑻 𝒙 𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷𝒇ሶ 𝒙
𝜕𝒇 𝒙 𝑻 𝑻
𝜕𝒇 𝒙
=( ሶ
𝒙) 𝑷𝒇 𝒙 + 𝒇 𝒙 𝑷( ሶ
𝒙)
𝜕𝒙 𝜕𝒙
= (𝑱(𝒙)𝒇 𝒙 ) 𝑻 𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷(𝑱(𝒙)𝒇 𝒙 )

= 𝒇 𝑻 𝒙 𝑱𝑻 (𝒙)𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷𝑱(𝒙)𝒇 𝒙

= 𝒇 𝑻 𝒙 (𝑱𝑻 (𝒙)𝑷 + 𝑷𝑱(𝒙))𝒇 𝒙


= −𝒇 𝑻 𝒙 𝑸𝒇 𝒙

由于,𝑸为正定,故𝑽ሶ 𝒙 为负定。

由李亚普诺夫稳定性判据,系统在平衡状态渐近稳定。 得证
4.5 李亚普诺夫方法在非线性系统中的应用

例:设系统的状态方程为
𝒙ሶ 1 = −3𝑥1 + 𝑥2

𝒙ሶ 2 = 𝑥1 −𝑥2 −𝑥23
试确定系统在平衡状态 𝒙𝒆 = 𝟎渐近稳定。
解:对系统方程,有
−3𝑥1 + 𝑥2
𝒇 𝒙 =
𝑥1 −𝑥2 −𝑥23

其雅可比矩阵为
𝜕𝑓1 𝜕𝑓1
𝜕𝑓(𝑥) 𝜕𝑥1 𝜕𝑥2 −3 1
𝐽 𝒙 = = =
𝜕𝑥 𝜕𝑓2 𝜕𝑓2 1 −1 − 3𝑥22
𝜕𝑥1 𝜕𝑥2
4.5 李亚普诺夫方法在非线性系统中的应用

取𝑷=𝑰

3 −1 3 −1 6 −2
则 𝑸 𝒙 = −𝑱𝑻 𝒙 −𝑱 𝒙 = + =
−1 1 + 3𝑥22 −1 1 + 3𝑥22 −2 2 + 6𝑥22
6 −2 2
其主子行列式:∆𝟏 = 𝟔 > 𝟎, ∆𝟐 = 2 = 8 + 36𝑥2 > 0
−2 2 + 6𝑥2

故𝑸 𝒙 > 𝟎, 系统在平衡状态 𝒙𝒆 = 𝟎是渐近稳定的。

由于当 𝒙 → ∞, 有𝑽 𝒙 = 𝒇𝑻 𝒙 𝒇(𝒙) → ∞ ,故系统在平衡状态𝒙𝒆 = 𝟎 是大范围渐近


稳定的。
4.3 李亚普诺夫第二法
关于雅可比矩阵法的说明

1. 定理是系统在平衡状态渐近稳定的充分条件,若𝑸 𝒙 不是正定的,则不能得出任何
结论, 此时该法无效。

2. 𝑸 𝒙 正定的必要条件是𝑱 𝒙 的主对角线上的所有元素均不为零,即(𝜕𝑓𝑖 (𝒙)Τ𝝏𝒙𝒊 ) ≠ 𝟎


要求状态方程的第𝒊个方程含有𝒙𝒊 这个状态分量,否则不能用雅可比矩阵法。
4.5 李亚普诺夫方法在非线性系统中的应用

二. 变量梯度法

 变量梯度法依据的基本事实:如果存在一个特定的李亚普诺夫函数𝑽 𝒙 并能够证明
给定系统的平衡状态为渐近稳定,则该李亚普诺夫函数的梯度必定存在且唯一。

 设给定𝑛维系统 𝒙ሶ = 𝒇(𝒙) ,平衡状态为 𝒙𝒆 = 𝟎


若此系统存在李亚普诺夫函数𝑽 𝒙 ,则其梯度为
𝜕𝑉 𝒙
𝜕𝑥1
𝛻𝑉1
𝜕𝑉 𝒙 𝜕𝑉 𝒙
𝛻𝑉2
𝜵𝑽 𝒙 = = 𝜕𝑥2 =
𝜕𝑥 ⋮
⋮ 𝛻𝑉𝑛
𝜕𝑉 𝒙
𝜕𝑥𝑛
4.5 李亚普诺夫方法在非线性系统中的应用

二. 变量梯度法

 设𝑉 𝒙 是 𝒙 的显函数,但不是𝑡的显函数,则𝑽ሶ 𝒙 可表示为:
𝑥ሶ1
𝑑𝑉 𝒙 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝑥ሶ 2
𝑽ሶ 𝒙 = = 𝑥ሶ 1 + 𝑥ሶ 2 + ⋯ + 𝑥ሶ 𝑛 = ⋯
⋮ = 𝛻𝑉 𝑇 𝒙ሶ
𝑑𝑡 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝑥ሶ 𝑛
𝑡 𝑥 𝑥 𝑑𝑥1
𝑡 ሶ 𝑑𝑥2
故 𝑉 𝒙 = ‫׬‬0 𝑉 𝒙 𝑑𝑡 = න 𝛻𝑉 𝒙ሶ 𝑑𝑡 = න 𝛻𝑉 𝑑𝒙
𝑇 𝑇 = න 𝛻𝑉1 (𝑥) 𝛻𝑉2 (𝑥) ⋯ 𝛻𝑉𝑛 (𝑥)

0 0 0 𝑑𝑥𝑛

 为使该线积分与积分路径无关,要求𝛻𝑉的旋度为零,即𝑟𝑜𝑡 𝛻𝑉 = 0
𝜕𝛻 𝑉𝑖 𝜕𝛻𝑉𝑗 𝝏𝜵𝑽
即满足 = 𝑖, 𝑗 = 1,2, ⋯ , 𝑛 即要求𝑱 = 为对称阵。
𝜕𝑥𝑗 𝜕𝑥𝑖 𝝏𝒙

这样,𝑉 𝒙 = ‫׬‬0𝑥1 𝛻𝑉1 𝑥 𝑑𝑥1 + ‫׬‬0𝑥2 𝛻𝑉2 𝑥 𝑑𝑥2 + ⋯ ‫׬‬0𝑥𝑛 𝛻𝑉𝑛 𝑥 𝑑𝑥𝑛
4.5 李亚普诺夫方法在非线性系统中的应用

二. 变量梯度法

应用变量梯度法分析系统稳定性的步骤如下:
1. 假定𝜵𝑽 𝒙 的形式为: 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛
𝑎 𝑥 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛
𝜵𝑽 𝒙 = 21 1 ⋮
𝑎𝑛1 𝑥1 + 𝑎𝑛2 𝑥2 + ⋯ + 𝑎𝑛𝑛 𝑥𝑛

2. 由𝑉ሶ 𝒙 = 𝜵𝑽𝑇 𝒙ሶ 确定系数待定的𝑉ሶ 𝒙 。

3. 由𝑉ሶ 𝒙 负定或至少半负定及𝑟𝑜𝑡 𝛻𝑉 = 0确定𝜵𝑽的系数𝑎𝑖𝑗 (𝑖, 𝑗 = 1,2, ⋯ , 𝑛) 。

4. 计算:𝑉 𝒙 = ‫׬‬0𝑥1 𝛻𝑉1 𝑥 𝑑𝑥1 + ‫׬‬0𝑥2 𝛻𝑉2 𝑥 𝑑𝑥2 + ⋯ ‫׬‬0𝑥𝑛 𝛻𝑉𝑛 𝑥 𝑑𝑥𝑛

5. 确定使𝑉 𝒙 > 0的渐近稳定范围 。


4.5 李亚普诺夫方法在非线性系统中的应用

例:设系统的状态方程为
𝒙ሶ 1 = −𝑥1 + 2𝑥1 𝑥22

𝒙ሶ 2 = −𝑥2
试确定系统在平衡状态 𝒙𝒆 = 𝟎渐近稳定。
𝑎 𝑥 +𝑎 𝑥
𝜵𝑽 𝒙 = 𝑎11 𝑥1 + 𝑎12 𝑥2
解:设李亚普诺夫函数𝑽 𝒙 的梯度为:
21 1 22 2

−𝑥1 + 2𝑥1 𝑥22


则𝑉ሶ 𝒙 为:𝑉ሶ 𝒙 = 𝜵𝑽𝑇 𝒙ሶ = 𝑎11 𝑥1 + 𝑎12 𝑥2 𝑎21 𝑥1 + 𝑎22 𝑥2
−𝑥2

= −𝑎11 𝑥12 + 2𝑎11 𝑥12 𝑥22 − 𝑎12 𝑥1 𝑥2 + 2𝑎12 𝑥1 𝑥23 − 𝑎21 𝑥1 𝑥2 − 𝑎22 𝑥22
𝜕𝛻𝑉1 𝜕𝛻𝑉2
由𝑟𝑜𝑡 𝛻𝑉 = 0的条件得: = 𝑎12 = = 𝑎21
𝜕𝑥2 𝜕𝑥1
4.5 李亚普诺夫方法在非线性系统中的应用

取 𝑎11 =1,𝑎22 =2,𝑎,12 = 𝑎21 = 0,则𝑉ሶ 𝒙 =−𝑥12 + 2𝑥12 𝑥22 − 2𝑥22 = −𝑥12 − 2𝑥22 1 − 𝑥12

故若 1 − 𝑥12 >0 ,则𝑉ሶ 𝒙 <0


𝑥1 𝑥2
𝑥 𝑥 1 2
而𝑉 𝒙 = ‫׬‬0 1 𝛻𝑉1 𝑥 𝑑𝑥1 + ‫׬‬0 2 𝛻𝑉2 𝑥 𝑑𝑥2 = න 𝑥1 𝑑𝑥1 + න 2𝑥2 𝑑𝑥2 = 𝑥1 + 𝑥22 > 0
2
0 0

故在1 − 𝑥12 >0范围内,系统在 𝒙𝒆 = 𝟎 处是渐近稳定的。


第四章 稳定性与李亚普诺夫方法

第四章 小结

 系统的稳定性是相对系统的平衡状态而言的。

 内部稳定(特征值)和外部稳定(输入有界输出有界)

 李亚普诺夫意义下的稳定,渐近稳定,大范围渐近稳定,不稳定的定义。

 李亚普诺夫稳定性主判据,辅助判据,不稳定判据;均是充分条件。

 线性系统的李亚普诺夫方程判据是充分必要条件。

 构建李亚普诺夫函数没有统一的方法,雅克比矩阵法,变量梯度法均只能适应于某
些特定的系统。
《现代控制理论》MOOC课程

第五章 线性定常系统的综合
第五章 线性定常系统的综合

线性反馈控制系统综合的基本概念

极点配置问题

系统镇定问题

系统解耦问题

状态观测器

利用状态观测器实现状态反馈的系统
5.1 线性反馈控制系统综合的基本概念
一. 系统的综合

给定系统的状态空间表达式:
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
寻找一个控制𝒖, 使得在其作用下系统的性能指标满足所期望的要求。

二. 状态反馈控制和输出反馈控制

1. 状态反馈

若系统的控制可表示为系统状态的一个线性向量函数, 即 𝒖 = −𝑲𝒙 + 𝒗 则称为状态反

馈控制。其中𝒗 为参考输入。
5.1 线性反馈控制系统综合的基本概念

 状态反馈系统的结构为:

𝒖 + 𝒙ሶ 𝒙
𝒗 𝑩 න 𝑪 y
+ - +

𝑨
K
 状态反馈系统的状态方程
原系统的状态方程为: 引入状态反馈𝒖 = −𝑲𝒙 + 𝒗 后,系统的状态方程为:
𝒙ሶ =A𝒙+B 𝒖 𝒙ሶ = 𝑨 − 𝑩𝑲 𝒙 + 𝑩𝒗
 系统的性能主要由系统矩阵决定的,通过合理的选择状态反馈矩阵,就可改变系统矩阵
以使系统的性能满足期望的要求。
5.1 线性反馈控制系统综合的基本概念

 状态反馈系统的传递函数:

原开环系统的传递函数为:
𝑾𝟎 𝒔 = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩

引入状态反馈𝒖 = −𝑲𝒙 + 𝒗 后,系统的闭环传递函数为:

𝑾𝑲 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑲)−𝟏 𝑩

系统的性能主要由系统闭环传递函数的极点确定,通过合理的选择状态反馈矩阵,
就可改变系统传递函数的极点,以使系统的性能满足期望的要求。
5.1 线性反馈控制系统综合的基本概念

2. 输出反馈

若系统的控制可表示为系统输出的一个线性向量函数, 即 𝒖 = −𝑯𝒚 + 𝒗 则称为输出反


控制。其中𝒗 为参考输入。
 输出反馈系统的结构为:

𝒖 + 𝒙ሶ 𝒙
𝒗 𝑩 න 𝑪 y
+ - +

𝑨
H
5.1 线性反馈控制系统综合的基本概念
 输出反馈系统的状态方程

原系统的状态方程为: 引入输出反馈𝒖 = −𝑯𝒚 + 𝒗 后,系统的状态方程为:


𝒙ሶ =A𝒙+B 𝒖 𝒙ሶ = 𝑨 − 𝑩𝑯𝑪 𝒙 + 𝑩𝒗

通过合理的选择输出反馈矩阵,就可改变系统矩阵,以使系统的性能满足期望的要求。

 输出反馈系统的传递函数:

原开环系统的传递函数为:
𝑾𝟎 𝒔 = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩

引入输出反馈𝒖 = −𝑯𝒚 + 𝒗 后,系统的闭环传递函数为:

𝑾𝑲 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑯𝑪)−𝟏 𝑩
5.1 线性反馈控制系统综合的基本概念

3. 状态反馈与输出反馈的比较

 系统的输出通常只是系统状态的部分信息,所以输出反馈仅相当于部分状态反馈。

 如果输出反馈阵𝑯存在,则满足同样要求的状态反馈矩阵𝑲一定存在,只需取𝑲 = 𝑯𝑪

 如果状态反馈阵𝑲存在,则满足同样要求的输出反馈矩阵𝑯不一定存在,因为由
𝑲 = 𝑯𝑪 ,通常解不出𝑯。
5.1 线性反馈控制系统综合的基本概念

三. 闭环系统的能控与能观性

定理1: 状态反馈不改变系统的能控性,但可能改变系统的能观性。
证明:能控性不变的证明思路:计算引入状态反馈前后,系统的能控性秩判别矩阵。
用数学归纳法证明秩不变。
有可能改变能观性的证明思路:用特列说明状态反馈矩阵不同,能观性秩判别矩
阵的秩不同。

定理2: 输出反馈不改变系统的能控性与能观性。
证明:能控性不变的证明思路:任一输出反馈总存在等效的状态反馈,而状态反馈不
改变系统的能控性,故输出反馈也不改变系统的能控性。

能观性不变的证明思路:计算引入输出反馈前后,系统的能观性秩判别矩阵。
用数学归纳法证明秩不变。
5.1 线性反馈控制系统综合的基本概念

四. 系统的性能指标

1. 以一组期望的闭环系统极点为性能指标,相应的综合问题称为极点配置问题。

2. 以系统渐近稳定为性能指标,相应的综合问题称为镇定问题。

3. 以使一个多输入多输出系统实现“一个输入只控制一个输出”作为性能指标,相应的
综合问题称为解耦问题。

4. 以使系统的输出无静差地跟踪一个外部信号作为性能指标,相应的综合问题称为跟踪
问题。
5.1 线性反馈控制系统综合的基本概念

五. 研究综合问题的基本思路

1. 第一建立可综合的条件,即对于给定的受控系统和期望的性能指标,确定相应控制存
在所应满足的条件。

2. 第二建立起相应的,用以综合控制规律的算法。
《现代控制理论》MOOC课程

5.2 极点配置问题
5.2 极点配置问题
一. 状态反馈的极点配置问题

给定n阶线性定常受控系统: 𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0


𝒚 = 𝑪𝒙

确定状态反馈控制𝒖 = −𝑲𝒙 + 𝒗 ,使得所导出的状态反馈闭环系统


𝒙ሶ = 𝑨 − 𝑩𝑲 𝒙 + 𝑩𝒗
的极点为期望值 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 。

二. 状态反馈极点可配置的条件

定理:线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
可通过状态反馈 𝒖 = −𝑲𝒙 + 𝒗 任意配置全部极点的充要条件是系统完全能控。
5.2 极点配置问题

证明:充分性(只讨论单输入单输出系统)
已知系统为完全能控,证明可任意配置极点。
即通过状态反馈必成立𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒇(𝝀∗ )
其中, 𝒇 𝝀∗ = ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊 = 𝝀𝒏 + 𝒂∗𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂∗𝟏 𝝀 + 𝒂∗𝟎

由于系统完全能控,故必存在非奇异变换𝒙 = 𝑻𝑪𝟏 𝒙ഥ ,使系统变换为能控标准I型:


𝒙 ഥ𝒙
ഥሶ = 𝑨 ഥ𝒖
ഥ+𝑩 ഥ
ഥ=𝑪ഥ
𝒚 ഥ𝒙
其中
0 1 ⋯ 0 0
⋮ ⋮ ⋱ ⋮
ഥ = 𝑻𝑪𝟏 −𝟏 A𝑻𝑪𝟏
𝑨 = 0 0 … 1 ഥ = 𝑻𝑪𝟏 −𝟏 𝑩 = ⋮
𝑩 ഥ = 𝑪𝑻𝑪𝑰 = 𝜷𝟎
𝑪 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
0
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 1

取 𝑲 ഥ𝟎
ഥ = 𝑲𝑻𝑪𝟏 = 𝒌 ഥ𝟏
𝒌 ഥ𝒏−𝟏 = 𝒂∗𝟎 − 𝒂𝟎
⋯ 𝒌 𝒂∗𝟏 − 𝒂𝟏 ⋯ 𝒂∗𝒏−𝟏 − 𝒂𝒏−𝟏
5.2 极点配置问题

于是
0 1 ⋯ 0 0 0 1 ⋯ 0
ഥ= ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
ഥ −𝑩
𝑨 ഥ𝑲
0 0 … 1 − ⋮ 𝒂∗𝟎 − 𝒂𝟎 𝒂∗𝟏 − 𝒂𝟏 ⋯ 𝒂∗𝒏−𝟏 − 𝒂𝒏−𝟏 = 0 0 … 1
0
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 1 −𝒂∗𝟎 −𝒂∗𝟏 ⋯ −𝒂∗𝒏−𝟏

这说明在能控标准I型下,状态反馈𝑲ഥ 已将闭环系统极点配置到期望的位置。
ഥ 与𝑲之间的关系是什么?由于非奇异线性变换不改变系统的特征值,即
那么𝑲
𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝒔𝑰 − 𝑻𝑪𝟏 −𝟏 A − 𝑩𝑲 𝑻𝑪𝟏 ]
= 𝒅𝒆𝒕[𝒔𝑰 − 𝑻𝑪𝟏 −𝟏 𝑨𝑻𝑪𝟏 + (𝑻𝑪𝟏 −𝟏 𝑩)(𝑲𝑻𝑪𝟏 )]
ഥ−𝑩
= 𝒅𝒆𝒕[𝒔𝑰 − (𝑨 ഥ𝑲ഥ )]
ഥ 𝑻𝑪𝟏 −𝟏
其中,𝑲𝑻𝑪𝟏 = 𝑲 , 即 𝑲 = 𝑲
这说明对于任意给定的期望极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 ,都可以找到状态反馈矩阵
ഥ 𝑻𝑪𝟏 −𝟏 使上式成立,即可任意配置系统的闭环极点。
𝑲=𝑲 充分性得证。
5.2 极点配置问题

必要性:已知极点可配置,证明系统完全能控。
反证法,已知极点可任意配置,反设系统不完全能控。
由于系统不完全能控,故存在非奇异线性变换阵𝑹𝑪 ,对系统进行能控性分解而导出:
෩𝒄
𝑨 ෩ 𝟏𝟐
𝑨 ෩𝒄
𝑩
෩=
𝑨 𝑹−𝟏
𝑪 𝑨𝑹𝒄 = ෩ −𝟏
𝑩 = 𝑹𝑪 𝑩 =
𝟎 ෩ 𝒄ത
𝑨 𝟎
且对任一状态反馈矩阵𝑲 = 𝒌𝟏 𝒌𝟐 , ෩ = 𝑲𝑹𝒄 = 𝒌
𝑲 ෩𝟏 ෩𝟐 有
𝒌
𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 A − 𝑩𝑲 𝑹𝑪 ]= 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 𝑨𝑹𝑪 + (𝑹𝑪 −𝟏 𝑩)(𝑲𝑹𝑪 )]
෩𝒄 + 𝑩
𝝀𝑰 − 𝑨 ෩𝟏
෩ 𝒄𝒌 ෩ 𝟏𝟐 + 𝑩
−𝑨 ෩ 𝒄𝒌 ෩𝟐
= 𝒅𝒆𝒕 ෩𝒄 + 𝑩
= 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 ෩𝟏 𝒅𝒆𝒕(𝝀𝑰 − 𝑨
෩ 𝒄𝒌 ෩ 𝒄ത )
𝟎 𝝀𝑰 − 𝑨෩ 𝒄ത
这表明状态反馈不能改变系统不能控部分的特征值,系统不能任意配置全部极点。这与
系统可任意配置极点的已知条件矛盾,故反设不成立。
即系统是完全能控的,必要性得证。
5.2 极点配置问题
三.单输入单输出系统状态反馈极点配置的算法

算法1 给定线性定常系统𝒙ሶ =A𝒙+B 𝒖 和一组期望的闭环极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 确定状

态反馈矩阵K,实现极点配置的算法如下:

1. 判断系统的能控性,若系统完全能控则继续下一步。

2. 计算受控系统矩阵A的特征多项式,即 𝑑𝑒𝑡 𝝀𝑰 − 𝑨 = 𝝀𝑛 + 𝑎𝑛−1 𝝀𝑛−1 + ⋯ + 𝑎1 𝝀 + 𝑎0

3.计算由期望极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 所确定的特征多项式


𝒏

𝒇 𝝀∗ = ෑ 𝝀 − 𝝀∗𝒊 = 𝝀𝒏 + 𝒂∗𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂∗𝟏 𝝀 + 𝒂∗𝟎


𝒊=𝟏

ഥ = 𝒂∗𝟎 − 𝒂𝟎 𝒂∗𝟏 − 𝒂𝟏 ⋯ 𝒂∗𝒏−𝟏 − 𝒂𝒏−𝟏


4. 计算变换为能控标准型后系统的状态反馈矩阵: 𝑲
5.2 极点配置问题

5.计算I型能控标准型变换阵
𝟏
𝒂𝒏−𝟏 𝟏
𝑻𝑪𝟏 = 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯ 𝒃 ⋮ ⋮ ⋱
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏

ഥ 𝑻𝑪𝟏 −𝟏 。
6.计算状态反馈矩阵 𝑲 = 𝑲

例:受控系统的状态方程如下: 𝒙ሶ = −2 −3 𝒙 + 3 𝒖
4 −9 1
求状态反馈矩阵K使系统的闭环极点为 𝜆𝟏,𝟐 = −1 ± 𝑗2
解:( 1 )判断系统的可控性
3 −9
系统的能控性秩判别矩阵: 𝑴 = 𝑩 , 𝑨𝑩 =
𝒓𝒂𝒏𝒌𝑴 = 2
1 3
满秩,系统是完全能控的,可由状态反馈任意配置系统的闭环极点。
5.2 极点配置问题

(2)原开环系统的特征多项式为:
𝜆+2 3
𝑓0 𝜆 = 𝑑𝑒𝑡 𝝀𝑰 − 𝑨 = = 𝜆2 + 11𝜆 + 30
−4 𝜆+9
(3)闭环系统的期望特征多项式为 :
𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5
(4)能控标准型变换后的反馈矩阵:
ഥ = 𝑎0∗ − 𝑎0 𝑎1∗ − 𝑎1 = 5 − 30 2 − 11 = − 25 9
𝑲
(5)I型能控标准型变换阵
𝟏 𝟎 −𝟗 𝟑 𝟏 𝟎 𝟐𝟒 𝟑 1 1 −3
𝑻𝑪𝟏 = 𝑨𝑩 𝑩 𝒂 = = , 𝑻−𝟏
𝑪𝟏 = −
𝟏 𝟏 𝟑 𝟏 𝟏𝟏 𝟏 𝟏𝟒 𝟏 18 −14 24

(6)状态反馈增益
1 1 −3
ഥ 𝑻𝑪𝟏 −𝟏 = − 25 9
𝑲=𝑲 − = −5.6 7.8
18 −14 24
5.2 极点配置问题

算法2 给定线性定常系统 𝒙ሶ =A𝒙+B 𝒖 和一组期望的闭环极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 确定状


态反馈矩阵K,实现极点配置的算法如下:

1.计算由期望极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 所确定的特征多项式


𝒏

𝒇 𝝀∗ = ෑ 𝝀 − 𝝀∗𝒊 = 𝝀𝒏 + 𝒂∗𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂∗𝟏 𝝀 + 𝒂∗𝟎


𝒊=𝟏

2. 计算状态反馈闭环系统的特征多项式:𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 =0

3. 令状态反馈特征多项式与期望特征多项式相等,得到状态反馈阵𝑲。
5.2 极点配置问题

例:受控系统的状态方程如下: 𝒙ሶ = −2 −3 𝒙 + 3 𝒖
4 −9 1
求状态反馈矩阵K使系统的闭环极点为 𝜆𝟏,𝟐 = −1 ± 𝑗2
解:( 1 )判断系统的可控性
3 −9
系统的能控性秩判矩阵:𝑴 = 𝑩 𝑨𝑩 = , 𝒓𝒂𝒏𝒌𝑴 = 2
1 3
满秩,系统是完全能控的,可由状态反馈任意配置系统的闭环极点。
(2)闭环系统的期望特征多项式为 :
𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5

(3)设状态反馈阵为:𝑲 = 𝒌𝟏 𝒌𝟐 ,则状态反馈控制系统的特征多项式为:
𝝀 𝟎 −2 −3 3 𝒌
𝝀𝑰 − 𝑨 − 𝑩𝑲 = − − 𝒌𝟐 = 𝜆2 + 11 + 3𝑘1 + 𝑘2 𝜆 + 30 + 24𝑘1 + 14𝑘2 = 0
𝟎 𝝀 4 −9 1 𝟏
比较期望特征多项式可得:11 + 3𝑘1 + 𝑘2 =2
解得: 𝑲 = 𝑘1 𝑘2 = −5.6 7.8
30 + 24𝑘1 + 14𝑘2 =5
5.2 极点配置问题
四. 输出反馈的极点配置问题

1. 利用非动态输出反馈𝒖 = −𝑲𝒙 + 𝒗 ,不能任意地配置系统的全部极点。


以单输入单输出系统为例,设受控系统的传递函数为𝑊𝟎 (𝑠),则输出反馈系统的传递函
𝑊𝟎 (𝑠)
数为: 𝑊𝒉 𝑠 =
1 + 𝐻𝑊𝟎 (𝑠)
因此,闭环系统的根轨迹方程为: 1 + 𝐻𝑊𝟎 𝑠 = 𝟎
当𝐻从0到∞ 变化时,就得到了闭环系统的根轨迹。
因此,无论𝐻怎样变化,系统的特征根总是在根轨迹上。即极点不能任意配置。

2. 如果在引入输出反馈的同时,引入动态补偿器,将可对输出反馈系统的全部极点实现
任意配置。
《现代控制理论》MOOC课程

5.3 系统镇定问题
5.3 系统镇定问题
一. 状态反馈的镇定问题

给定n阶线性定常受控系统: 𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0


𝒚 = 𝑪𝒙
确定状态反馈控制𝒖 = −𝑲𝒙 + 𝒗 ,使得所导出的状态反馈闭环系统
𝒙ሶ = 𝑨 − 𝑩𝑲 𝒙 + 𝑩𝒗
是渐近稳定的,也即闭环系统的特征值均有负的实部,则称系统实现了状态反馈镇定。
 镇定是极点配置的一类特殊情况,它要求将极点配置到根平面的左半平面。

二. 状态反馈可镇定的条件

定理:线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
可通过状态反馈 𝒖 = −𝑲𝒙 + 𝒗 实现镇定的充要条件是其不能控子系统是渐近稳定的。
5.3 系统镇定问题

证明:设线性定常系统为不完全能控,故存在非奇异线性变换𝑹𝑪 对系统进行能控性分解
෩𝒄
𝑨 ෩ 𝟏𝟐
𝑨 ෩𝒄
𝑩
෩=
而导出: 𝑨 𝑹−𝟏
𝑪 𝑨𝑹𝒄 = ෩ −𝟏
𝑩 = 𝑹𝑪 𝑩 =
𝟎 ෩ 𝒄ത
𝑨 𝟎
且对任一状态反馈矩阵 𝑲 = 𝒌𝟏 ෩ = 𝑲𝑹𝒄 = 𝒌
𝒌𝟐 可导出 𝑲 ෩𝟏 ෩𝟐 ,
𝒌
于是有:𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 A − 𝑩𝑲 𝑹𝑪 ]

෩𝒄 + 𝑩
𝝀𝑰 − 𝑨 ෩𝟏
෩ 𝒄𝒌 ෩ 𝟏𝟐 + 𝑩
−𝑨 ෩ 𝒄𝒌 ෩𝟐
= 𝒅𝒆𝒕 ෩𝒄 + 𝑩
= 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 ෩𝟏 𝒅𝒆𝒕(𝝀𝑰 − 𝑨
෩ 𝒄𝒌 ෩ 𝒄ത )
𝟎 𝝀𝑰 − 𝑨෩ 𝒄ത

෩ 𝒄 ,𝑩
由于{𝑨 ෩ 𝟏 使 (𝑨
෩ 𝒄 } 为能控,故必存在𝒌 ෩ 𝒄 −𝑩 ෩𝟏 ) 的特征值具有负的实部,即存在𝑲使能
෩ 𝒄𝒌
控子系统的特征值均具有负的实部。
因此,系统由状态反馈实现镇定的充要条件为不能控子系统的特征值均具有负实部。
得证
5.3 系统镇定问题
三. 状态反馈镇定的算法

算法 给定不完全能控系统 𝒙ሶ =A𝒙+B 𝒖 ,且知其满足可镇定的条件,则镇定问题中


反馈矩阵𝑲的计算步骤如下:
෩ 𝒄 ,𝑩
1. 对给定系统进行能控性分解,导出能控子系统{𝑨 ෩ 𝒄 },能控性分解的变换阵为𝑹𝑪 ;

෩ 𝒄 ,𝑩
2.应用非奇异线性变换阵 𝑻𝑪𝟏 ,将能控子系统 {𝑨 ෩ 𝒄 } 化为能控标准I型{𝑨
ഥ 𝒄 ,𝑩
ഥ 𝒄} ;

ഥ 使能控子系统的特征值具有负的实部 ;
3.应用极点配置算法,计算反馈增益阵𝑲

4.计算状态反馈矩阵 𝑲 = 𝒌1 0 ;
𝑲 = 𝒌1 0 = ഥ1 𝑇𝐶1
𝒌 −1
0 𝑹−1
𝐶
5.3 系统镇定问题
例:已知系统的状态方程为:
1 0 −1 0
𝒙ሶ = 0 −2 0 𝒙 + 0 𝒖
−1 0 2 1
判别其是否为可镇定的,若是可镇定的,试求一状态反馈 𝑲 ,使闭环系统为渐近稳定。

解:(1) 判别系统的可控性
0 −1 −3
𝑴= 𝑩 𝑨𝑩 𝑨𝟐 𝑩 = 0 0 0 rank𝑴 = 2 < 3
1 2 5
故系统为不完全能控。
(2)将系统按能控性进行分解(取M中2个线性无关列,第3 列为确保非奇异的任意向量)
0 −1 0 2 0 1
取 𝑹𝑪 = 0 0 1 𝑹𝐶−1 = −1 0 0
1 2 0 0 1 0
5.3 系统镇定问题


作非奇异变换𝒙 = 𝑹𝑪 𝒙
0 −1 0 1
෥ሶ = 𝑹−𝟏
𝒙 ෥ + 𝑹−𝟏
𝑪 𝑨𝑹𝑪 𝒙 𝑪 𝑩𝒖 = 1 3 ෥+ 0 𝒖
0 𝒙
0 0 −2 0
෥ሶ 𝑪ഥ = −𝟐෥
不可控子系统为:𝒙 𝒙𝑪ഥ , 𝝀𝑪ഥ = −𝟐 不可控子系统渐近稳定,故系统是可镇定的。
(3)对可控子系统作状态反馈,使系统稳定
a. 可控子系统的特征多项式为:
𝜆 1
𝑓0 𝜆 = 𝑑𝑒𝑡 𝝀𝑰 − 𝑨 = = 𝜆2 − 3𝜆 + 1
−1 𝜆 − 3
b. 假定使能控子系统的闭环极点为:𝜆𝟏,𝟐 = −1 ± 𝑗2
闭环系统的期望特征多项式为 : 𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5
c. 变换后的反馈矩阵:
ഥ = 𝑎0∗ − 𝑎0
𝑲 𝑎1∗ − 𝑎1 = 5 − 1 2 − (−3) = 4 5
5.3 系统镇定问题

(4)计算状态反馈矩阵

能控标准I型变换阵 :
𝟏 𝟎 𝟎 𝟏 𝟏 𝟎 −𝟑 𝟏 𝟎 𝟏
𝑻𝑪𝟏 = 𝑨𝑩 𝑩 𝒂 = = , 𝑻−𝟏
𝑪𝟏 =
𝟏 𝟏 𝟏 𝟎 −𝟑 𝟏 𝟏 𝟎 𝟏 𝟑

2 0 1
ഥ1 𝑇𝐶1 𝟎 𝟏
𝑲= 𝒌 −1
0 𝑹−1
𝐶 = 4 5 0 −1 0 0 = −9 0 5
𝟏 𝟑
0 1 0
《现代控制理论》MOOC课程

5.4 系统解耦问题
5.4 系统解耦问题
一. 解耦的定义

对于𝒎个输入𝒎个输出的线性定常系统σ(𝑨, 𝑩, 𝑪)其传递函数为:
𝑤11 𝑠 ⋯ 𝑤1𝑚 𝑠
W(s)= ⋮ ⋯ ⋮
𝑤𝑚1 𝑠 ⋯ 𝑤𝑚𝑚 𝑠
即输入输出有如下关系: 𝑦1 𝑠 = 𝑤11 𝑠 𝑢1 𝑠 + 𝑤12 𝑠 𝑢2 𝑠 + ⋯ + 𝑤1𝑚 𝑠 𝑢𝑚 𝑠
𝑦2 𝑠 = 𝑤21 𝑠 𝑢1 𝑠 + 𝑤22 𝑠 𝑢2 𝑠 + ⋯ + 𝑤2𝑚 𝑠 𝑢𝑚 𝑠

𝑦𝑚 𝑠 = 𝑤𝑚1 𝑠 𝑢1 𝑠 + 𝑤𝑚2 𝑠 𝑢2 𝑠 + ⋯ + 𝑤𝑚𝑚 𝑠 𝑢𝑚 𝑠
设计控制器,使多变量输入输出系统实现每一个输出仅受相应的一个输入控制,每一个输
入也仅能控制相应的一个输出。即构造控制器使系统的传递函数变为非奇异对角规范型
ഥ11 𝑠
𝑊
即:𝑾𝒌 (s)= ⋱ 则称这样的系统是解耦的,相应的控制为解耦控制。
ഥ𝑚𝑚 𝑠
𝑊
5.4 系统解耦问题
二. 状态反馈解耦问题的描述

对于多输入-多输出的线性定常系统: 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
假定 (1) 系统输出变量个数𝒑与输入变量个数𝒒相等,即𝒑 = 𝒒;
(2) 控制规律采用状态反馈和输入变换相结合,即𝒖 = −𝑲𝒙 + 𝑳𝒗

𝒗 𝒖 + 𝒙ሶ 𝒙
𝑳 𝑩 න
𝑪 𝒚
+ - +
𝑨

K
(3) 输入变换阵L为非奇异,即𝐝𝐞𝐭𝑳 ≠ 𝟎
5.4 系统解耦问题

寻找输入变换和状态反馈矩阵对{𝑳,𝑲} ,使得所导出的状态反馈系统
𝒙ሶ = (𝑨 − 𝑩𝑲)𝒙 + 𝑩𝑳𝒗
𝒚 = 𝑪𝒙

的传递函数矩阵 𝑾𝑲𝑳 (𝒔) = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑲)−𝟏 𝑩𝑳 为非奇异对角有理分式矩阵。

即𝑾𝑲𝑳 = 𝑑𝑖𝑎𝑔[𝑊11 𝑠 , 𝑊22 𝑠 , ⋯ , 𝑊𝑝𝑝 𝑠 ] 其中𝑊𝑖𝑖 𝑠 ≠ 0, 𝑖 = 1,2, ⋯ , 𝑝


5.4 系统解耦问题
三. 传递函数矩阵的两个结构特征量

1.特征量的定义
设𝑾 (𝒔)为𝑝 × 𝑝 阶的传递函数矩阵, 𝑾𝒊 (𝒔)为其第𝑖行传递函数向量

即 𝑾𝒊 𝒔 = [𝑊𝑖1 𝑠 , 𝑊𝑖2 𝑠 , ⋯ , 𝑊𝑖𝑝 𝑠 ]

𝜎𝑖𝑗 为𝑊𝑖𝑗 (𝑠)的分母多项式的阶数和分子多项式阶数之差,则定义

 𝑾 𝒔 的第一个特征量𝑑𝑖 (结构特性指数)为:𝑑𝑖 = min 𝜎𝑖1 , 𝜎𝑖2 , ⋯ , 𝜎𝑖𝑝 − 1, 𝑖 = 1,2, ⋯ , 𝑝

 𝑾 𝒔 的第二个特征量𝐸𝑖 (结构特性向量)为:𝑬𝑖 = lim 𝑠 𝑑𝑖 +1 𝑾𝑖 𝑠 , 𝑖 = 1,2, ⋯ , 𝑝


𝑠→∞
5.4 系统解耦问题

2. 特征量的性质

(1). 与传递函数矩阵𝑾 (𝒔) 相对应的状态空间表达式为{𝑨, 𝑩, 𝑪} ,且𝑪𝑖 为𝑪的第𝒊个行向量,


则有𝑾(𝒔) = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩 的特征量为:

𝜇𝑖 , 𝜇𝑖 为满足𝑪𝑖 𝑨𝜇𝑖 𝐵 ≠ 0的最小值 <1>


𝒅𝑖 = ൝
𝑛 − 1,当𝑪𝑖 𝑨𝑘 𝐵 = 0, 𝑘 = 0,1, ⋯ , 𝑛 − 1

𝑬𝑖 = 𝑪𝑖 𝑨𝒅𝒊 𝐵 <2>

证明:由𝑾(𝒔) = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩 可得𝑾𝒊 (𝒔) = 𝑪𝒊 (𝒔𝑰 − 𝑨)−𝟏 𝑩


𝟏
而(𝒔𝑰 − 𝑨)−𝟏 = (𝑹𝒏−𝟏 𝒔𝒏−𝟏 + ⋯ + 𝑹𝟏 𝒔 + 𝑹𝟎 )
𝒂 𝒔

其中: 𝒂 𝒔 = 𝑑𝑒𝑡 𝒔𝑰 − 𝑨 = 𝒔𝑛 + 𝑎𝑛−1 𝒔𝑛−1 + ⋯ + 𝑎1 𝒔 + 𝑎0


𝑹𝒏−𝟏 = 𝑰, 𝑹𝒏−𝟐 = 𝑨 + 𝑎𝑛−1 𝑰, ⋯ , 𝑹𝟎 = 𝑨𝑛−1 + 𝑎𝑛−1 𝑨𝑛−2 + ⋯ + 𝑎1 𝑰
5.4 系统解耦问题

则:𝑾𝒊 (𝒔) = 𝒂 𝟏𝒔 (𝑪𝒊 𝑹𝒏−𝟏 𝑩𝒔𝒏−𝟏 + ⋯ + 𝑪𝒊 𝑹𝒏−𝒅𝑖 𝑩𝒔𝒏−𝒅𝑖 + 𝑪𝒊 𝑹𝒏−𝒅𝑖−1 𝑩𝒔𝒏−𝒅𝑖−𝟏 + ⋯ + 𝑪𝒊 𝑹𝟏 𝑩𝒔 + 𝑪𝒊 𝑹𝟎 𝑩)

由 𝒅𝑖 定义可知,𝑾𝒊 (𝒔)中各元素分母和分子多项式的阶数之差的最小值为𝒅𝑖 + 1,这表明与

𝒔𝒏−𝟏 , 𝒔𝒏−𝟐 , ⋯ , 𝒔𝒏−𝒅𝑖 相关的系数矩阵为零,而 𝒔𝒏−𝒅𝑖−𝟏 的系数矩阵不为零,即:

𝑪𝒊 𝑹𝒏−𝟏 𝑩 = 𝟎,𝑪𝒊 𝑹𝒏−𝟐 𝑩 = 𝟎, ⋯ , 𝑪𝒊 𝑹𝒏−𝒅𝑖 𝑩 = 𝟎, 𝑪𝒊 𝑹𝒏−𝒅𝑖 −1 𝑩 ≠ 𝟎

将 𝑹𝒏−𝟏 , 𝑹𝒏−𝟐 , ⋯ , 𝑹𝒏−𝒅𝑖 , 𝑹𝒏−𝒅𝑖−𝟏代入可得:

𝑪𝒊 𝑩 = 𝟎,𝑪𝒊 𝑨𝑩 = 𝟎, ⋯ , 𝑪𝒊 𝑨𝒅𝑖 −1 𝑩 = 𝟎, 𝑪𝒊 𝑨𝒅𝑖 𝑩 ≠ 𝟎

即𝒅𝑖 是使𝑪𝑖 𝑨𝑘 𝐵 ≠ 0成立的最小正整数。


而当𝑾𝒊 (𝒔) =0,即𝑪𝑖 𝑨𝑘 𝐵 = 0, (𝑘 = 0,1, ⋯ , 𝑛 − 1) ,则规定𝒅𝑖 = 𝑛 − 1
故<1>式得证。
5.4 系统解耦问题

由𝑬𝑖 的定义可得:
𝑬𝑖 = lim 𝑠 𝑑𝑖 +1 𝑾𝑖 𝑠
𝑠→∞
𝑠 𝑑𝑖+1
= lim (𝑪𝒊 𝑹𝒏−𝟏 𝑩𝒔𝒏−𝟏 + ⋯ + 𝑪𝒊 𝑹𝒏−𝒅𝑖 𝑩𝒔𝒏−𝒅𝑖 + 𝑪𝒊 𝑹𝒏−𝒅𝑖−1 𝑩𝒔𝒏−𝒅𝑖−𝟏 + ⋯ + 𝑪𝒊 𝑹𝟎 𝑩)
𝑠→∞ 𝒂 𝒔

= 𝑪𝒊 𝑹𝒏−𝒅𝑖−1 𝑩

= 𝑪𝒊 (𝑨𝑑𝑖 + 𝑎𝑛−1 𝑨𝑑𝑖 −𝟏 + ⋯ + 𝑎𝑛−𝑑𝑖 𝑰)𝑩

= 𝑪𝒊 𝑨𝑑𝑖 𝑩 + 𝑎𝑛−1 𝑪𝒊 𝑨𝑑𝑖−𝟏 𝑩 + ⋯ + 𝑎𝑛−𝑑𝑖 𝑪𝒊 𝑩

= 𝑪𝒊 𝑨𝑑𝑖 𝑩

故特征量的性质(1)得证。
5.4 系统解耦问题

(2). 对于任意的非奇异矩阵对{𝑳,𝑲} ,状态反馈闭环系统的传递函数矩阵

𝑾𝑲𝑳 (𝒔) = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑲)−𝟏 𝑩𝑳的两个特征量𝑑ҧ𝑖 和𝑬


ഥ 𝑖 则可表示为:

ഥ𝑖
𝜇
ҧ 𝜇ҧ 𝑖 , 𝜇ҧ 𝑖 为满足𝑪𝑖 (𝑨 − 𝑩𝑲) 𝑩𝑳 ≠ 0的最小值
𝑑𝑖 = ൝
𝑛 − 1,当𝑪𝑖 (𝑨 − 𝑩𝑲)𝑘 𝑩𝑳 = 0, 𝑘 = 0,1, ⋯ , 𝑛 − 1

ഥ 𝑖 = 𝑪𝑖 (𝑨 − 𝑩𝑲)𝒅𝒊 𝑩𝑳
𝑬

根据性质 ( 1 ) 相同的方法可证。

(3) 对于任意的非奇异矩阵对{𝑳,𝑲} ,开环系统和闭环系统的传递函数矩阵的特征量之


间存在如下关系式:

𝑑ҧ𝑖 = 𝑑𝑖 , ഥ 𝑖 = 𝑬𝑖 𝐿
𝑬 𝑖 = 1,2, ⋯ . 𝑝
5.4 系统解耦问题
四. 系统可解耦的条件

定理:给定𝒑个输入𝒑个输出的线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
可采用输入变换和状态反馈矩阵𝒖 = −𝑲𝒙 + 𝑳𝒗进行解耦控制的充要条件,由系统传递函数
矩阵每一行结构特性向量𝑬𝒊 组成的矩阵非奇异。

𝑬𝟏
𝑬𝟐
𝑬= ⋮ 𝑬 ∈ 𝑹𝒑×𝒑
𝑬𝒑
证明:必要性:
已知存在控制𝒖 = −𝑲𝒙 + 𝑳𝒗 ,可使系统实现解耦,即闭环系统的传递函数矩阵为

𝑾𝑲𝑳 = 𝑑𝑖𝑎𝑔[𝑾11 𝑠 , 𝑾22 𝑠 , ⋯ , 𝑾𝑝𝑝 𝑠 ],则E非奇异。


5.4 系统解耦问题
由于解耦,由结构特性向量的定义可得

ഥ𝟏 lim 𝑠 𝑑1 +1 𝑾𝑲𝑳𝟏 𝑠
𝑬 𝑠→∞ lim 𝑠 𝑑1 +1 𝑾𝟏𝟏 𝑠
ഥ𝟐 𝑑2 +1 𝑾 𝑠→∞
ഥ 𝑬 lim 𝑠 𝑲𝑳𝟐 𝑠 ⋱
𝑬= = 𝑠→∞ =
⋮ ⋮
ഥ𝒑
𝑬 lim 𝑠 𝑑𝑝 +1 𝑾𝒑𝒑 𝑠
lim 𝑠 𝑑𝑝 +1 𝑾𝑲𝑳𝒑 𝑠 𝑠→∞
𝑠→∞

即为对角非奇异常阵。
ഥ = 𝑬𝑳 可知 𝑬 = 𝑬
由𝑬 ഥ 𝑳−𝟏 ,由于𝑬
ഥ 和𝑳均为非奇异,故E非奇异,必要性得证。
充分性:已知𝑬非奇异,证明可解耦。
由已知𝑬非奇异,故𝑬−𝟏 存在
𝑪𝟏 𝑨𝑑1 +1
取{𝑳,𝑲} 为:𝑳=𝑬−𝟏 ,𝑲 = 𝑬−𝟏 𝑭, 𝑭 = ⋮
𝑪𝒑 𝑨𝑑𝑝 +1
5.4 系统解耦问题
这样,闭环系统的传递函数矩阵为:

𝑾𝑲𝑳 (𝒔) = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑬−𝟏 𝑭)−𝟏 𝑩𝑬−𝟏


由结构特征量的性质和凯莱-哈密尔顿定理可得:
𝟏
𝑾𝑲𝑳𝒊 (𝒔) = 𝟎 ⋯ 𝟎 𝟎 ⋯ 𝟎
𝒔𝒅𝒊 +𝟏

𝟏 𝟏 𝟏
𝑾𝑲𝑳 (𝒔) = 𝒅𝒊𝒂𝒈 ⋯
𝒔𝒅𝟏 +𝟏 𝒔𝒅𝟐 +𝟏 𝒔𝒅𝒑+𝟏
即实现了解耦,充分性得证。

 解耦后,各输入输出间的传递函数是多重积分,称为积分型解耦系统。极点在坐
标的原点,其性能在工程上不能被接受。其意义在于理论分析,即可通过简单的
输入变换和状态反馈实现解耦。
5.4 系统解耦问题
五.系统可解耦的条件
四. 确定解耦控制器的算法

算法:给定完全能控的线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
确定使系统完全解耦的输入变换和状态反馈矩阵{L,K}的计算步骤如下:
1. 计算系统的特征量 {𝑑𝑖 , 𝑖 = 1,2, ⋯ , 𝑝} 和 {𝑬𝑖 = 𝑪𝑖 𝑨𝒅𝒊 𝑩, 𝑖 = 1,2, ⋯ , 𝑝} 。判断 𝑬 是否非奇异。
若是,可解耦,进入下一步。若否,不能解耦,退出计算。
𝑪𝟏 𝑨𝑑1 +1
2.计算𝑬−𝟏 和𝑭 = ⋮
𝑪𝒑 𝑨𝑑𝑝 +1

3.取{𝑳,𝑲}为 𝑳=𝑬−𝟏 ,𝑲 = 𝑬−𝟏 𝑭, 导出积分型解耦系统


ഥ𝒙 + 𝑩
𝒙ሶ = 𝑨 − 𝑩𝑲 𝒙 + 𝑩𝑳𝒗 = 𝑨 − 𝑩𝑬−𝟏 𝑭 𝒙 + 𝑩𝑬−𝟏 𝒗 = 𝑨 ഥ𝒗
𝒚 = 𝑪𝒙
5.4 系统解耦问题

状态空间表达式所对应的传递函数矩阵为:
𝟏 𝟏 𝟏
𝑮 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑬−𝟏 𝑭) −𝟏 𝑩𝑬−𝟏 = 𝒅𝒊𝒂𝒈 ⋯
𝒔𝒅𝟏 +𝟏 𝒔𝒅𝟐 +𝟏 𝒔𝒅𝒑+𝟏

例:已知系统的状态空间表达式为:

1 1
1 1
𝒙ሶ = − 2 0 𝒙+
2
0 𝒖 𝒚= 𝒙
2 1
0 −1 0 1
求解耦控制的𝑲阵和𝑳阵。

解:(1)计算E阵
1 1
1 0 0 1 1 0 0 = 1
𝟎
𝑪𝟏 𝑨 𝑩 = 1 1 = 𝑪𝟐 𝑨𝟎 𝑩 = 2 1 1
0 1 2 2
1 0 1 2
0 1 0 1
5.4 系统解耦问题

故有:𝑑1 = 𝑑2 = 0
1
𝑬𝟏 = 𝑪𝟏 𝑨𝑑1 𝑩 = 1 𝑬𝟐 = 𝑪𝟐 𝑨𝑑2 𝑩 = 1 1
2
1 1 1
𝑬𝟏 1 1
𝑬= = 2 𝑑𝑒𝑡𝑬 = 2 =−
𝑬𝟐 2
1 1 1 1
故可实现状态反馈解耦控制。
(2)求解耦控制的K阵和L阵。
−𝟏
1 1
𝑪𝟏 𝑨𝑑1 +1 −2 2
𝑭= = −2 −1 𝑬−𝟏 = 2 1 =
2 −1
𝑪𝟐 𝑨𝑑2 +1 −1 −1 1 1
5.4 系统解耦问题

1
−2 2 − −1 −1 0
因此: 𝑲 = 𝑬−𝟏 𝑭 = 2 =
2 −1 −1 −1 0 −1

−𝟏 −2 2
𝑳=𝑬 =
2 −1
解耦后的变换传递函数为:

1
0
𝑾𝑲𝑳 (𝒔) = 𝑠
1
0
𝑠
《现代控制理论》MOOC课程

5.5 状态观测器
5.5 状态观测器
一. 状态观测器的定义

定义:考虑n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
其中,𝒙不能直接测量,输出𝒚和控制𝒖是可以测量的。则称以𝒚和𝒖为输入,且其输出
ෝ 𝒕 满足如下关系式 lim 𝒙
𝒙 ෝ 𝒕 = lim 𝒙 𝒕 的一个n维线性定常系统为全维状态观测器。
𝒕→∞ 𝒕→∞
二. 全维状态观测器的实现

1.根据系统已知的系数矩阵𝑨、𝑩和𝑪,按和原系统相同的结构形式,复制一个基本系统。
ෝሶ = 𝑨ෝ
𝒙 𝒙 + 𝑩𝒖,ෝ ෝ𝟎 , 𝒕 ≥ 𝟎
𝒙 𝟎 =𝒙
当使初始状态ෝ𝒙𝟎 =𝒙𝟎 ,则理论上可实现所有的𝑡 > 0均成立ෝ𝒙 𝑡 = 𝒙(𝑡)即实现完全的状
态重构;
 但是,这种开环型的状态观测器是难以实际应用的。因为:
第一,每次用这种观测器前都必须设置初始状态,这显然是不方便的;
第二,如果系统矩阵𝑨包含不稳定的特征值,那么即使ෝ 𝒙𝟎 和𝒙𝟎 间有很小的偏差,则随着
时间的推移偏差将愈来愈大。
5.5 状态观测器

2. 取原系统输出𝒚和复制系统输出ෝ 𝒚之差作为修正变量,并将其经增益矩阵𝑮反馈到复制
统中的积分器输入端,构成一个闭环系统。即
ෝሶ = 𝑨ෝ
𝒙 ෝ = 𝑨ෝ
𝒙 + 𝑩𝒖 + 𝑮 𝒚 − 𝒚 𝒙 + 𝑩𝒖 + 𝑮 𝒚 − 𝑪ෝ
𝒙 = (𝑨 − 𝑮𝑪)ෝ
𝒙 + 𝑮𝒚 + 𝑩𝒖
其结构可表示如下:
𝒖 + 𝒙ሶ 𝒙
𝑩 න 𝑪
+ 𝒚𝒚

𝑨
+
𝑮
𝑮 −
𝑪 ෝ𝒙
𝒙ෝ
𝑩 + ෝሶ
𝒙 නන
+
𝑨 −𝑨𝑮𝑪
5.5 状态观测器
三. 全维状态观测器极点配置的条件

定理:考虑n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
完全能观,则必可由如下描述的状态观测器
ෝሶ = 𝑨 − 𝑮𝑪 𝒙
𝒙 ෝ + 𝑮𝒚 + 𝑩𝒖 ෝ 𝟎 =𝒙
𝒙 ෝ𝟎
来重构系统状态,并且必可通过选择增益矩阵𝑮而实现任意配置𝑨 − 𝑮𝑪的全部特征值。
ෝ ,则有
𝒙=𝒙−𝒙
证明:取෥
𝒙 ෝሶ = 𝑨𝒙 + 𝑩𝒖 − 𝑨 − 𝑮𝑪 𝒙
෥ሶ = 𝒙ሶ − 𝒙 ෝ − 𝑮𝒚 − 𝑩𝒖 = (𝑨 − 𝑮𝑪) 𝒙 − 𝒙

只要使矩阵(𝑨 − 𝑮𝑪)的特征值具有负的实部,那么一定可以做到使
෥ 𝒕 =𝟎
lim 𝒙 即 ෝ(𝒕) = lim 𝒙 𝒕
lim 𝒙
𝒕→∞ 𝒕→∞ 𝒕→∞

因此,状态能否重构的关键在于能否找到增益矩阵𝑮,使矩阵 𝑨 − 𝑮𝑪 的极点任意配置。
5.5 状态观测器

因为系统{𝑨, 𝑩, 𝑪}完全能观,故根据对偶定理,其对偶系统{𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 } 完全能控。


根据极点配置的充要条件,对于任意给定的𝒏个特征值 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 ,必可找到一个
实常数阵𝑲,使下式成立:
𝒅𝒆𝒕[𝝀𝑰 − (𝑨𝑻 − 𝑪𝑻 𝑲)]=ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊
由于矩阵转置特征值不变,即
(𝑨𝑻 − 𝑪𝑻 𝑲) 与 (𝑨𝑻 − 𝑪𝑻 𝑲)𝑻 = (𝑨 − 𝑲𝑻 𝑪)
具有相同的特征值。
故当取 𝑮 = 𝑲𝑻 时有:
𝒅𝒆𝒕[𝝀𝑰 − (𝑨 − 𝑮𝑪)]=ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊

即可任意配置矩阵(𝑨 − 𝑮𝑪) 的特征值,故必可使系统稳定,从而可实现状态观测。


5.5 状态观测器
四. 全维状态观测器的设计步骤

算法:给定需状态估计的系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
为完全能观,使设计的状态观测器有一组期望的极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 ,则设计全维状态观
测器的步骤如下:
1. 导出对偶系统{𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 }

2. 应用极点配置算法,对系统{𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 } 确定状态反馈矩阵𝑲,使下式成立
𝒅𝒆𝒕[𝝀𝑰 − (𝑨𝑻 − 𝑪𝑻 𝑲)]=ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊
3.取𝑮 = 𝑲𝑻
4.计算 𝑨 − 𝑮𝑪 ,则所要设计的全维状态观测器就为
ෝሶ = 𝑨 − 𝑮𝑪 𝒙
𝒙 ෝ + 𝑮𝒚 + 𝑩𝒖 ෝ 𝟎 =𝒙
𝒙 ෝ𝟎
ෝ,即为𝒙的估计状态。
而𝒙
5.5 状态观测器
五. 降维状态观测器

由于系统的输出𝒚总是能观测的。若系统能观,且输出向量𝒚的维数是𝒒,则状态向
量中的𝒒个分量可由输出𝒚直接获得。那么设计的状态观测器只需观测其余𝒏 − 𝒒个状态分
量,这样的观测器称为降维观测器。
算法 降维观测器的设计步骤
给定需估计状态的系统 {𝑨, 𝑩, 𝑪},已知𝑟𝑎𝑛𝑘𝐂 = 𝐪,且{𝑨, 𝑪}为完全能观,则其𝒏 − 𝒒维
降维观测器可按如下步骤设计:
𝑪
1. 定义𝒏 × 𝒏维矩阵𝑷 = 其中, 𝑹为使𝑷非奇异的(𝒏 − 𝒒) × 𝒏 常阵。
𝑹
计算𝑷的逆,并将其分块表示 𝑸 = 𝑷−𝟏 = 𝑸𝟏 𝑸𝟐
其中,𝑸𝟏 ,𝑸𝟐 分别为𝐧 × 𝒒和𝐧 × (𝒏 − 𝒒)矩阵。显然有:
𝑪 𝑸 𝑪𝑸𝟏 𝑪𝑸𝟐
𝑷𝑸 = 𝟏 𝑸𝟐 = 即𝑪𝑸𝟏 = 𝑰𝒒 , 𝑪𝑸𝟐 = 𝟎
𝑹 𝑹𝑸𝟏 𝑹𝑸𝟐
5.5 状态观测器

𝒙 = 𝑷𝒙,可导出
2. 对需估计状态的系统,进行非奇异变换ഥ

ഥሶ = 𝑷𝑨𝑷−𝟏 𝒙
𝒙 ഥ𝒙
ഥ + 𝑷𝑩𝒖 = 𝑨 ഥ+𝑩ഥ𝒖

𝒚 = 𝑪𝑷−𝟏 𝒙
ഥ = 𝑪 𝑸𝟏 𝑸𝟐 𝒙 ഥ = 𝑰𝒒 0𝒙

ഥ𝟏
𝒙
ഥ=
令𝒙 ഥ𝟐 分别为𝒒和𝒏 − 𝒒维,则上式可表示为:
𝒙𝟏 和 𝒙
其中ഥ
ഥ𝟐
𝒙

ഥሶ 𝟏
𝒙 ഥ 𝟏𝟏
𝑨 ഥ 𝟏𝟐 𝒙
𝑨 ഥ𝟏 ഥ𝟏
𝑩
= + 𝒖
ሶ𝒙
ഥ𝟐 ഥ 𝟐𝟏
𝑨 ഥ
𝑨𝟐𝟐 ഥ
𝒙 𝟐 ഥ
𝑩𝟐
ഥ𝟏
𝒙
𝒚 = 𝑰𝒒 ഥ𝟏
=𝒙 0
ഥ𝟐
𝒙
ഥ𝟏 可直接利用无需重构,只需重构𝒏 − 𝒒维的分量。
由于𝒚 = 𝒙
5.5 状态观测器

𝒙𝟐 分量的状态方程和输出方程
3. 导出ഥ
ഥ 𝟐𝟐 𝒙
ഥሶ 𝟐 = 𝑨
𝒙 ഥ 𝟐𝟏 𝒚 + 𝑩
ഥ 𝟐 + (𝑨 ഥ 𝟐 𝒖)
ഥ 𝟏𝟏 𝒚 − 𝑩
𝒚ሶ − 𝑨 ഥ 𝟐𝒖 = 𝑨
ഥ 𝟏𝟐 𝒙
ഥ𝟐
ഥ 𝟐𝟏 𝒚 + 𝑩
ഥ=𝑨
令 𝒖 ഥ 𝟐 𝒖,𝒘 = 𝒚ሶ − 𝑨 ഥ 𝟏𝟏 𝒚 − 𝑩
ഥ 𝟐𝒖
则上式可表示为
ഥሶ 𝟐 = 𝑨
𝒙 ഥ 𝟐𝟐 𝒙
ഥ𝟐 + 𝒖

𝒘=𝑨 ഥ 𝟏𝟐 𝒙
ഥ𝟐
ഥ 𝟐𝟐 , 𝑨
系统 {𝑨 ഥ 𝟏𝟐 }为完全能观的充要条件为 {𝑨, 𝑪}完全能观。

4. 对𝒏 − 𝒒维子系统,构造全维观测器。

5. 进行状态变换。
《现代控制理论》MOOC课程

5.6 利用状态观测器实现状态反馈的系统
5.6 利用状态观测器实现状态反馈的系统

一. 利用状态观测器的状态反馈系统的构成

设受控系统的状态空间表达式为: 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
状态观测器为:
ෝሶ = (𝑨 − 𝑮𝑪)ෝ
𝒙 ෝ 𝟎 =𝒙
𝒙 + 𝑮𝒚 + 𝑩𝒖 , 𝒙 ෝ𝟎
ෝ+𝒗
反馈控制规律为: 𝒖 = −𝑲𝒙
则整个系统的状态空间表达式为:
𝒙ሶ = 𝑨𝒙 − 𝑩𝑲ෝ𝒙 + 𝑩𝒗 𝒙ሶ 𝑨 −𝑩𝑲 𝒙 𝑩
ሶ𝒙 = + 𝒗
ෝ 𝑮𝑪 𝑨 − 𝑮𝑪 − 𝑩𝑲 ෝ
𝒙 𝑩
ෝሶ = 𝑮𝑪𝒙 + (𝑨 − 𝑮𝑪 − 𝑩𝑲)ෝ
𝒙 𝒙 + 𝑩𝒗
𝒙
𝒚 = 𝑪𝒙 𝒚= 𝑪 𝟎

𝒙
这是一个2n维系统;
5.6 利用状态观测器实现状态反馈的系统

𝒗 + 𝒖 + 𝒙ሶ 𝒙
𝑩 න 𝑪
− + 𝒚

𝑮

𝒙
𝑩 + ෝሶ
𝒙 න
+
𝑨 − 𝑮𝑪
𝑲

利用状态观测器的状态反馈系统
5.6 利用状态观测器实现状态反馈的系统

二. 利用状态观测器的状态反馈系统的基本特性

1. 引入状态观测器后,提高了状态反馈系统的维数。
𝑑𝑖𝑚 𝛴 = 𝑑𝑖𝑚 𝛴0 + 𝑑𝑖𝑚(𝛴𝑂𝐵 )
系统的维数等于受控制系统的维数与观测器维数之和。
2.包含观测器的状态反馈系统的特征值集合具有分离性。即
෥ =𝒙−𝒙
引入线性变换 𝒙 ෝ 可得: 𝒙ሶ = 𝑨 − 𝑩𝑲 𝑩𝑲 𝒙 𝑩
ሶ + 𝒗

𝒙 𝟎 ෥
𝑨 − 𝑮𝑪 𝒙 𝟎

𝒚 = 𝑪𝒙
而线性变换不改变系统的特征值
ഥ ) = 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 𝒅𝒆𝒕[𝝀𝑰 − 𝑨 − 𝑮𝑪 ]
𝒅𝒆𝒕(𝝀𝑰 − 𝑨
5.6 利用状态观测器实现状态反馈的系统

二. 利用状态观测器的状态反馈系统的基本特性

3.作为上一个性质的推论:状态观测器的引入不影响状态反馈矩阵𝑲所配置的系统特
征值;状态反馈的引入也不影响已设计好的状态观测器的特征值;

4.状态观测器的引入不改变原状态反馈系统的传递函数;
𝑾𝒌 𝝀 = 𝑾𝒌𝑮 𝝀 = 𝑪[𝝀𝑰 − 𝑨 − 𝑩𝑲 ]−𝟏 𝑩

注意传递函数在非奇异线性变换下保持不变。

5.状态观测器反馈与直接状态反馈设计的等效性;
第五章 线性定常系统的综合

第五章 小结

 对于综合问题首先是建立可综合的条件,其次才是构造综合的算法。

 极点配置是最基本的综合问题。极点配置可综合的充要条件是系统完全能控,最简洁的
综合算法是基于标准型的算法。
 系统镇定问题只是极点配置问题的一个特例。
 解耦控制在工程中有着广泛的需求,但是积分型解耦控制器意义只在于理论分析。

 状态观测器对于实现状态反馈有重要意义。实现状态观测器的充分条件是系统完全能
观。利用降维观测器的状态反馈系统的性能要优于利用全维状态观测器的状态反馈系
统。状态观测器增益矩阵与状态反馈矩阵的设计是可分离的。
《现代控制理论》MOOC课程

第六章 最优控制
第六章 最优控制

最优控制问题的数学描述

求解最优控制的变分方法

极小值原理

动态规划法

线性二次型最优控制问题
第六章 最优控制

 最优控制理论所要解决的问题:
按照控制对象的动态特性,选择一个容许控制,使得被控对象按照技术要求运行,并使
给定的性能指标达到最优值。

 最优控制的数学问题:
从数学观点来看,最优控制问题就是求解一类带有约束条件的泛函极值问题。

 最优控制的基本内容:
经典变分法;
极小值原理;
动态规划;
《现代控制理论》MOOC课程

6.1 最优控制问题的数学描述
6.1 最优控制问题的数学描述
一. 最优控制问题的实例

例1:最速升降问题
设有一质量为𝑴的物体,其内部有一控制器,可以产生一个作用力𝒖(𝒕)控制物体上下运动
作用力满足约束条件 𝒖(𝒕) ≤ 𝑪 。若物体在𝑡𝟎 时刻,离地面的高度为ℎ𝟎 ,垂直运动的速度
为𝑣𝟎 。寻找作用力𝒖(𝒕),使物体最快地到达地面,且到达地面的速度为零。物体运动的
速度 𝒗(𝒕) ≤ 𝒗𝒎𝒂𝒙 u (t )

建模:受控系统的状态方程 M
令 𝑥1 𝑡 = ℎ 𝑡 , 𝑥𝟐 𝑡 = ℎሶ 𝑡 = 𝑣(𝑡)
g
系统的状态方程为:
𝑑𝑥1 h(t )
= 𝑥2
𝑑𝑡 (6---1)
𝑑𝑥2 𝑢(𝑡)
= −𝑔
𝑑𝑡 𝑀
6.1 最优控制问题的数学描述
一. 最优控制问题的实例

初始条件为: 𝑥1 𝑡𝟎 = ℎ𝟎 , 𝑥𝟐 𝑡𝟎 = 𝑣𝟎

现在的问题是,寻找一个𝒖 𝒕 , 且满足 𝒖(𝒕) ≤ 𝑪 ,使物体在最短时间内由状态 (ℎ𝟎 , 𝑣𝟎 ) ,转


移到(0, 0) 。且 𝒗(𝒕) ≤ 𝒗𝒎𝒂𝒙 。

问题例1:对于给定的动态系统(6-1),寻找满足约束条件 𝒖(𝒕) ≤ 𝑪 的最优控制𝒖(𝒕),


使性能指标 𝑡𝑓

𝑱 = න 𝒅𝒕 = 𝑡𝑓 − 𝑡𝟎
𝑡𝟎

取得极小值,且满足如下约束条件:
𝑥2 𝑡 ≤ 𝒗𝒎𝒂𝒙
𝑥1 𝑡𝑓 = 0, 𝑥2 𝑡𝑓 = 0
6.1 最优控制问题的数学描述
二. 最优控制问题的一般提法

用数学语言描述最优控制问题,应包括以下几个方面的内容:

1. 受控系统的数学模型
用状态方程描述:𝒙ሶ 𝑡 = 𝒇[𝒙 𝑡 , 𝒖 𝑡 , 𝑡]

2. 受控系统的始端和终端条件,即状态方程的边界条件:
对最优控制问题始端条件通常是已知的: 𝒙 𝑡𝟎 = 𝒙𝟎

终端条件可以用一个目标集表示:𝛀𝒇 = {𝒙 𝑡𝒇 ; 𝒈1 𝒙 𝑡𝒇 = 𝟎, 𝒈2 𝒙 𝑡𝒇 ≤ 𝟎}

3. 容许控制
控制量受客观条件限制所能取值的范围:𝒖 𝒕 ∈ 𝑼, 𝑼 = 𝒖 𝒕 ; 𝝋 𝒙, 𝒖 ≤ 𝟎
6.1 最优控制问题的数学描述

4. 性能指标
𝒕𝒇
(1)积分型性能指标:𝑱 = ‫𝑳 𝒕׬‬ 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝟎

反映控制过程中对系统性能的要求。

(2)终值型性能指标: 𝑱 = 𝚽[𝒙 𝒕𝒇 , 𝒕𝒇 ]
反映了系统状态在终端时刻的性能。
𝒕𝒇
(3)复合型性能指标:𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + ‫𝑳 𝒕׬‬ 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝟎

反映了控制过程和终端时刻对系统性能的要求。

若:𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 ,𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 为二次型函数,则性能指标可表示为二次型性能指标:
𝒕𝒇
𝟏 𝑻 𝟏
𝑱= 𝒙 𝒕𝒇 𝑷𝒙 𝒕𝒇 + න [𝒙 𝒕 𝑻 𝑸𝒙 𝒕 + 𝒖 𝒕 𝑻 𝑹𝒖 𝒕 ]𝒅𝒕
𝟐 𝟐
𝒕𝟎
6.1 最优控制问题的数学描述
最优控制问题的一般提法:
已知受控系统的状态方程:𝒙ሶ 𝑡 = 𝒇[𝒙 𝑡 , 𝒖 𝑡 , 𝑡]

及给定的始端条件𝒙 𝑡𝟎 = 𝒙𝟎 和规定的目标集𝛀𝒇 = {𝒙 𝑡𝒇 ; 𝒈1 𝒙 𝑡𝒇 = 𝟎, 𝒈2 𝒙 𝑡𝒇 ≤ 𝟎}
在容许控制集合 𝑼中,寻找控制向量𝒖 𝒕 ∈ 𝑼,𝒕 ∈ [𝑡0 , 𝑡𝒇 ]

使系统由给定的初始状态出发,在𝑡𝒇 > 𝑡0 时刻转移到规定的目标集,并使性能指标:


𝒕𝒇

𝐦𝐢𝐧 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝒕𝟎

最优控制问题是在多种约束条件下寻找控制𝒖∗ 𝒕 ,使某个性能指标 𝑱取得极小值。由于 𝑱

为函数𝒙 𝑡 , 𝒖 𝑡 的函数,即泛函。最优控制问题可归结为求某个泛函的条件极值问题。
《现代控制理论》MOOC课程

6.2 求解最优控制的变分方法
6.2.1 泛函与变分的基本概念
一 泛函与泛函的变分

1. 泛函的定义

对于某一类函数集合 𝒙(𝑡) 中的每一个函数𝒙(𝑡),均有一个确定的数 𝑱与之对应,则称𝑱为


依赖于函数𝒙(𝑡)的泛函,记作:𝑱 = 𝑱[𝒙 𝒕 ]

 𝑱[𝒙 𝒕 ]中的𝒙 𝒕 应理解为某一特定函数的整体,而不是对应于𝒕的函数值。


𝟏 𝒅𝒙 𝒕
例如泛函: 𝑱 = ‫ 𝑡 𝟐𝒙 𝟎׬‬+ 𝑡 𝒅𝑡
𝒅𝑡

𝟏 5
当 𝒙(𝑡) = 𝑡 有:𝑱 = ‫𝟎׬‬ 𝑡2 + 𝑡 𝒅𝑡 =
6

𝟏 1 2𝑡 1 1
当 𝒙(𝑡) = 𝑒𝑡 有:𝑱 = ‫𝟎׬‬ 𝑒 2𝑡 + 𝑡𝑒 𝑡 𝒅𝑡 = 𝑒 +𝑡𝑒 𝑡 − 𝑒𝑡 ቚ = (𝑒 2 + 1)
2 0 2
6.2.1 泛函与变分的基本概念

2.泛函自变量的变分

泛函𝑱[𝒙 𝒕 ]的自变量函数𝒙 𝒕 与标称函数𝒙∗ 𝒕 之间的差值函数:


𝜹𝒙 = 𝜹𝒙 𝒕 = 𝒙 𝒕 − 𝒙∗ 𝒕
称为泛函自变量的变分,记作𝜹𝒙 𝒕 或𝜹𝒙。
这样𝒙 𝒕 可表示为:𝒙 𝒕 = 𝒙∗ 𝒕 + 𝜹𝒙 𝒕
3.泛函的变分

 泛函的增量
由自变量函数𝒙 𝒕 的变分𝜹𝒙 𝒕 引起泛函𝑱[𝒙 𝒕 ]的增加值

∆𝑱 𝒙 𝒕 = 𝑱 𝒙∗ 𝒕 + 𝜹𝒙 𝒕 − 𝑱 𝒙∗ 𝒕
称为泛函𝑱[𝒙 𝒕 ]的增量。
6.2.1 泛函与变分的基本概念

 泛函的连续性
对于任意给定的正数𝜺 ,可以找到这样一个正数𝜹,当𝑑 𝒙, 𝒙∗ < 𝛆 时,有
𝑱 𝒙 𝒕 − 𝑱 𝒙∗ 𝒕 <𝛿
则称泛函𝑱 𝒙 𝒕 在𝒙∗ 𝒕 处是连续的。
其中,𝑑 𝒙, 𝒙∗ 表示在函数空间中𝒙 𝒕 与𝒙∗ 𝒕 之间的距离:
𝑑 𝒙, 𝒙∗ = max 𝒙 𝒕 − 𝒙∗ 𝒕
𝒂≤𝒕≤𝒃
 泛函的变分
泛函𝑱 𝒙 𝒕 增量∆𝑱 𝒙 𝒕 的线性主部称为泛函的一阶变分,简称泛函的变分,记作𝜹𝑱
𝑑𝐽 1 𝑑2 𝐽
∆𝑱 = 𝑱 𝒙∗ 𝒕 + 𝜹𝒙 𝒕 − 𝑱 𝒙∗ 𝒕 = ቟ 𝜹𝒙 + 2
቟ 𝜹𝒙 𝟐
+𝑹
𝑑𝑥 𝒙∗ 2 𝑑𝑥 𝒙∗
其中,𝑹是关于𝜹𝒙的高阶无穷小项。
𝑑𝐽
泛函的变分定义为:𝛿𝐽 = ቕ 𝜹𝒙
𝑑𝒙 𝒙∗
6.2.1 泛函与变分的基本概念

泛函的变分引理
𝜕
泛函的变分 𝛿𝑱[𝒙(𝒕)] = 𝑱[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ
𝜕𝛼 𝜶=𝟎

证明: ∆𝜶 = 𝜶 − 𝟎 = 𝜶
𝜕 ∆𝑱 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕
𝑱[𝒙 𝒕 + 𝜶𝜹𝒙 𝒕 ]቟ = lim ቤ
𝜕𝛼 𝜶=𝟎 ∆𝜶→𝟎 ∆𝜶 𝜶=𝟎

𝑱 𝒙 𝒕 + 𝜶𝜹𝒙 𝒕 − 𝑱 𝒙 𝒕
= lim
𝜶→𝟎 𝜶 ∆𝒇 𝒇(∆𝒙 + 𝒙𝟎 ) − 𝒇(𝒙𝟎 )
𝒇′ 𝒙𝟎 = lim = lim
∆𝒙→𝟎 ∆𝒙 ∆𝒙→𝟎 ∆𝒙
1 𝑑𝐽 1 𝑑2 𝐽 𝟐
= lim { ඐ 𝜶𝜹𝒙 + ቟ 𝜶𝜹𝒙 +𝑹}
𝜶→𝟎 𝜶 𝑑𝑥 𝑥 2
2 𝑑𝑥 𝒙
𝑑𝐽
= ඐ 𝛿𝒙 = 𝛿𝐽
𝑑𝑥 𝑥 得证
6.2.1 泛函与变分的基本概念

𝟏
例 计算 泛函𝑱 = ‫ 𝒕𝒅 𝒕 𝟐𝒙 𝟎׬‬的变分
解:方法一,直接根据变分引理:
𝜕 1
𝛿𝐽 = න [𝑥 𝑡 + 𝛼𝛿𝑥 𝑡 ]2 𝑑𝑡቟
𝜕𝛼 0
𝛼=0
1 𝟏
= න 2[𝑥 𝑡 + 𝛼𝛿𝑥 𝑡 ]𝛿𝑥 𝑡 𝑑𝑡ඐ = න 2𝒙 𝒕 𝛿𝑥 𝑡 𝑑𝑡
0 𝛼=0 𝟎

方法二,根据变分的定义:
1 1 1 1
∆𝐽 = න [𝑥 𝑡 + 𝛿𝑥 𝑡 ]2 𝑑𝑡 − න 𝑥 2 𝑡 𝑑𝑡 = න 2𝑥 𝑡 𝛿𝑥 𝑡 𝑑𝑡 + න (𝛿𝑥 𝑡 )2 𝑑𝑡
0 0 0 0

𝟏
故增量的线性主部为:𝛿𝐽 = ‫ 𝟎׬‬2𝒙 𝒕 𝛿𝑥 𝑡 𝑑𝑡
6.2.1 泛函与变分的基本概念
二 泛函的极值

1. 泛函极值的定义

如果泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 的邻域内,其增量:
∆𝑱 = 𝑱 𝒙 𝒕 ] − 𝑱[𝒙∗ 𝒕 ≥𝟎
或 ∆𝑱 = 𝑱 𝒙 𝒕 ] − 𝑱[𝒙∗ 𝒕 ≤𝟎
则称泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 有极小值或极大值。

2. 泛函极值定理
若可微泛函𝑱 𝒙 𝒕 在函数𝒙 𝒕 = 𝒙∗ 𝒕 达到极值,则泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 上的变分等
于零,即
𝛿𝐽 𝒙∗ 𝒕 =0
6.2.1 泛函与变分的基本概念

证明:对于任意给定的𝛿𝑥 𝑡 来说, 𝑱[𝒙∗ 𝒕 + 𝜶𝜹𝒙 𝒕 ] 是实变量𝛼 的函数。

泛函𝑱 𝒙 𝒕 在𝒙∗ 𝒕 时达到极值,即函数𝑱[𝒙∗ 𝒕 + 𝜶𝜹𝒙 𝒕 ]在𝜶 = 𝟎时达到极值,

所以它的导数在𝜶 = 𝟎时应为零,即
𝜕
𝑱[𝒙∗ 𝒕 + 𝛼𝛿𝒙 𝒕 ]቟ =𝟎
𝜕𝛼 𝜶=𝟎

𝜕
由变分引理 𝑱[𝒙∗ 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ = 𝛿𝐽 𝒙∗ 𝒕 =𝟎
𝜕𝛼 𝜶=𝟎

得证
《现代控制理论》MOOC课程

6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题

引理:如果函数𝑭(𝒕) 在区间𝒕 ∈ [𝒕𝟎 , 𝒕𝒇 ]上是连续的,而且对于只满足某些一般条件的任意


𝒕𝒇
选定的函数𝜼(𝒕)有‫𝑡𝒅)𝒕(𝜼)𝒕(𝑭 𝒕׬‬ = 𝟎, 则在区间𝒕 ∈ [𝒕𝟎 , 𝒕𝒇 ]上有: 𝑭(𝒕) ≡ 𝟎
𝟎

一 欧拉方程

讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
𝒕𝒇
问题: 考虑泛函为 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎


式中𝒙 𝒕 在𝒕 ∈ [𝒕𝟎 , 𝒕𝒇 ]上连续, 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]连续,二阶可微,求使𝑱 𝒙 𝒕 取极值,且满
足给定边界条件:𝒙(𝒕𝟎 ) = 𝒙𝟎 , 𝒙 𝒕𝒇 = 𝒙𝒇 的函数 𝒙∗ 𝒕 。
解:根据泛函极值定理,在极值曲线𝒙∗ 𝒕 上,必有𝛅𝑱 𝒙∗ 𝒕 = 𝟎
𝒕𝒇
𝜕 𝜕
而 𝛿𝑱[𝒙 𝒕 ] = 𝑱[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ = න 𝑳[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕] ቟ 𝒅𝑡
𝜕𝛼 𝜶=𝟎 𝒕𝟎 𝜕𝛼
𝜶=𝟎
6.2.2 无约束条件的变分问题

𝒕𝒇
𝜕 𝜕 𝒙(𝒕)+𝛼𝛿𝒙(𝒕)
=න ൝ 𝑳 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕
𝒕𝟎 𝜕(𝒙(𝒕)+𝛼𝛿𝒙(𝒕)) 𝜕𝛼

𝜕 𝜕 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕
+ 𝑳 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕 ቋቩ 𝒅𝑡
𝜕(𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 ) 𝜕𝛼
𝜶=𝟎

𝒕𝒇 ሶ ሶ
𝜕𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕] 𝜕𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]
=න 𝛿𝒙 𝒕 + 𝛿 𝒙ሶ 𝒕 𝒅𝑡
𝒕𝟎 𝜕𝒙 𝒕 𝜕𝒙ሶ 𝒕
6.2.2 无约束条件的变分问题

𝒕𝒇
𝜕𝑳 𝜕𝑳
𝛿𝑱 = න 𝛿𝒙 + 𝛿 𝒙ሶ 𝒅𝑡
𝒕𝟎 𝜕𝒙 𝜕𝒙ሶ

𝒕𝒇 𝒕 𝒇 𝒕𝒇
𝜕𝑳 𝒕𝒇
𝜕𝑳 𝒕𝒇 𝜕𝑳 𝜕𝑳 𝜕𝑳
右边第二项:
න ሶ
𝛿 𝒙𝒅𝑡 =න 𝛿𝑑𝒙 = න 𝑑(𝛿𝒙) = 𝛿𝒙ቤ − න 𝑑 𝛿𝒙
𝒕𝟎 𝜕 𝒙ሶ 𝒕𝟎 𝜕 𝒙ሶ 𝒕𝟎 𝜕 𝒙ሶ
𝜕𝒙ሶ 𝒕𝟎 𝒕𝟎 𝜕𝒙ሶ
𝒕𝒇 𝒕𝒇
𝜕𝑳 𝑑 𝜕𝑳
= 𝛿𝒙ቤ − න 𝛿𝒙𝑑𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝑑𝑡 𝜕 𝒙ሶ
𝟎

𝒕𝒇
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
故: 𝛿𝑱 = 𝛿𝒙ቤ + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝟎

考虑端点固定,故有:𝜹𝒙(𝒕𝟎 ) = 𝜹𝒙 𝒕𝒇 = 𝟎
6.2.2 无约束条件的变分问题

𝒕𝒇
𝜕𝑳 𝑑 𝜕𝑳
所以: 𝛿𝑱 = න − 𝛿𝒙𝒅𝑡
𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ

在极值曲线𝒙∗ 𝒕 上,必有 𝛿𝑱 𝒙∗ 𝒕 =𝟎

𝒕 𝜕𝑳 𝑑 𝜕𝑳
即:𝛿𝑱 𝒙∗ 𝒕 = ‫𝒇 𝒕׬‬ − ฬ 𝛿𝒙𝒅𝑡 = 0
𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ 𝒙=𝒙∗

𝜕𝑳 𝑑 𝜕𝑳
故: − =𝟎
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ

该式称为欧拉方程,是泛函极值的必要条件。
由于
𝑑 𝜕𝑳 𝑑 𝜕𝑳[𝒙, 𝒙,ሶ 𝒕] 𝜕 𝜕𝑳 𝑑𝑥 𝜕 𝜕𝑳 𝑑 𝒙ሶ 𝜕 𝜕𝑳 𝜕2𝑳 𝜕2𝑳 𝜕2𝑳
= = + + = 𝒙ሶ + 𝟐 𝒙ሷ +
𝑑𝑡 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒙ሶ 𝜕𝒙 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒙ሶ 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒕 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒙 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒕
6.2.2 无约束条件的变分问题

欧拉方程可进一步表示为:
𝜕𝑳 𝜕2𝑳 𝜕2𝑳 𝜕2𝑳
− 𝒙ሶ − 𝟐 𝒙ሷ − =𝟎

𝜕𝒙 𝜕𝒙𝜕𝒙 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒕
ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
写成简洁的形式: 𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎

这样无约束泛函极值问题就归结为求解欧拉方程问题。
𝝅
例:求泛函 𝑱 = ‫𝒙( 𝟎׬‬ሶ 𝟐 − 𝒙𝟐 )𝒅𝑡
𝟐

𝜋
在边界条件: 𝑥 0 = 1, 𝑥 = 2 下的极值曲线。
2
解:𝑳 = 𝒙ሶ 𝟐 − 𝒙𝟐 𝑳𝒙 = −𝟐𝒙 𝑳𝒙ሶ = 𝟐𝒙ሶ 𝑳𝒙ሶ 𝒙ሶ = 𝟐 𝑳𝒙𝒙
ሶ = 𝑳𝒙𝒕
ሶ =𝟎

ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
由欧拉方程:𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎 可得:−𝟐𝒙 − 𝟐𝒙ሷ = 𝟎
解得:𝒙∗ 𝒕 = 𝒄𝒐𝒔 𝒕 + 𝟐𝒔𝒊𝒏(𝒕)
《现代控制理论》MOOC课程

6.2.2 无约束条件的变分问题(2)
6.2.2 无约束条件的变分问题
二 横截条件

端点状态𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的变分问题。
𝒕𝒇
问题: 寻求使泛函 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎

取极值,且𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的函数 𝒙∗ 𝒕 。
𝒕 𝒇 𝒕𝒇
𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
解: 𝛿𝑱 = 𝛿𝒙ቤ + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝟎

由于端点不固定,所以𝜹𝒙(𝒕𝟎 ) ≠ 𝟎, 𝛅𝒙 𝒕𝒇 ≠ 𝟎
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
𝛿𝑱 = ቤ 𝛿𝒙 𝒕𝒇 − ቤ 𝛿𝒙(𝒕𝟎 ) + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝒇 𝟎
6.2.2 无约束条件的变分问题

在极值曲线𝒙∗ 𝒕 上,必有 𝛿𝑱 𝒙∗ 𝒕 =𝟎

𝜕𝑳 𝑑 𝜕𝑳
故欧拉方程: − =𝟎
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
横截条件: 𝜕𝑳
ቤ = 𝟎,
𝜕𝒙ሶ 𝒕
𝒇

𝜕𝑳
ቤ =𝟎
𝜕𝒙ሶ 𝒕
𝟎

成立
显然,端点中任意一点固定时,其横截条件改由终端条件代替。
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
𝛿𝑱 = ቤ 𝛿𝒙 𝒕𝒇 − ቤ 𝛿𝒙 𝒕𝟎 + න − 𝛿𝒙𝒅𝑡 = 𝟎
𝜕𝒙ሶ 𝒕 𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝒇 𝟎
6.2.2 无约束条件的变分问题
𝟏
例:求泛函 𝑱 = ‫𝒙( 𝟎׬‬ሶ 𝟐 + 1)𝒅𝑡

求满足下列两种端点情况的极值曲线。
(1) 𝑥 0 = 1, 𝑥 1 = 2 (2) 𝑥 0 = 1, 𝑥 1 未定

解:𝑳 = 𝒙ሶ 𝟐 + 1 𝑳𝒙ሶ 𝒙ሶ = 𝟐 𝑳𝒙 = 𝑳𝒙𝒙


ሶ = 𝑳𝒙𝒕
ሶ =𝟎

ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
由欧拉方程:𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎

可得:𝟐𝒙ሷ = 𝟎
通解为:𝒙 𝒕 = 𝑪𝟏 𝒕 + 𝑪𝟐
对端点情况(1)可得: 𝒙∗ 𝒕 = 𝑡 + 1 相应的极值为:𝑱 𝒙∗ 𝒕 =𝟐
对端点情况(2)由横截条件: 𝜕𝑳
ቤ = 𝟐𝒙ሶ ቚ =𝟎 可得:𝒙ሶ 1 = 𝟎
𝜕𝒙ሶ 𝒕 𝒕=𝟏
𝒇

考虑初值条件可得: 𝒙∗ 𝒕 = 1 相应的极值为:𝑱 𝒙∗ 𝒕 =1
6.2.2 无约束条件的变分问题
二 欧拉方程与横截条件的向量形式
𝒕𝒇
问题: 寻求使泛函 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎

取极值,且𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的函数 𝒙∗ 𝒕 。

其中, 𝒙 𝒕 = 𝑥1 𝑡 , 𝑥2 𝑡 , ⋯ , 𝑥𝑛 𝑡 𝑻

𝑻
𝒙ሶ 𝒕 = 𝑥ሶ1 𝑡 , 𝑥ሶ 2 𝑡 , ⋯ , 𝑥ሶ 𝑛 𝑡

一维情况下的欧拉方程和横截条件可以推广到n维情况:
𝜕𝑳
ቤ = 𝟎,
𝜕𝒙ሶ 𝒕
𝜕𝑳 𝑑 𝜕𝑳 𝒇
故欧拉方程: − =𝟎 横截条件:
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝜕𝑳
ቤ =𝟎

𝜕𝒙 𝒕
𝟎
6.2.2 无约束条件的变分问题

例. 求泛函 2
J [ x (t )]   ( 2 x1 x2  x12  x 22 ) dt
0

满足边界条件  x ( 0 ) 
1 0   x1 ( 2 )  1 
 x (0)   0  ,    
 2     x 2 ( 2 )    1
的最优轨线。
𝜕𝐿 𝑑 𝜕𝐿
解:由欧拉方程 − =0 得
𝜕𝑥 𝑑𝑡 𝜕𝑥ሶ

𝜕𝐿 𝜕𝐿
𝜕𝐿 𝑑 𝜕𝐿 𝜕𝑥1 𝑑 𝜕 𝑥ሶ 1 2𝑥2 𝑑 2𝑥ሶ 1 2𝑥2 2𝑥ሷ 1
− = − = − = - =0
𝜕𝑥 𝑑𝑡 𝜕 𝑥ሶ 𝜕𝐿 𝑑𝑡 𝜕𝐿 2𝑥1 𝑑𝑡 2𝑥ሶ 2 2𝑥1 2𝑥ሷ 2
𝜕𝑥2 𝜕 𝑥ሶ 2
6.2.2 无约束条件的变分问题

于是:  x2  x1  0
 可得: x1( 4 )  x1  0
 x1  x2  0
特征方程为: 4 1  0
特征值为: 𝜆1 = 1, 𝜆2 = −1, 𝜆3 = 𝑖, 𝜆4 = −𝑖

其通解为: x1 ( t )  C 1 e t  C 2 e  t  C 3 cos t  C 4 sin t

x 2 ( t )  C 1e t  C 2 e  t  C 3 cos t  C 4 sin t

代入边界条件得: x1* (t )  sin t


x2* (t )   sin t
《现代控制理论》MOOC课程

6.2.3 有约束条件的变分问题 (1)


6.2.3 有约束条件的变分问题

 在本节中假定,控制𝒖(𝒕) 是无约束的,且是连续的。
一. 终端时间固定、状态自由,等式约束条件下的变分问题
受控系统的状态方程为 𝒙ሶ (𝒕) = 𝒇[𝒙 𝒕 , 𝒖 𝒕 , 𝒕]
初始状态为𝒙(𝒕𝟎 ) = 𝒙𝟎
终端时间𝒕𝒇 固定,终端状态𝒙(𝒕𝒇 )自由
𝒕𝒇
寻求最优控制𝒖(𝒕)使性能指标 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + ‫𝑳 𝒕׬‬ 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕 取得极小值。
𝟎

将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎
引入拉格朗日乘子函数𝝀 𝒕 ,原等式约束问题,转化为如下无约束优化问题:
𝒕𝒇

𝑱′ = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题

定义标量函数 𝑯 𝒙 𝑡 , 𝒖 𝑡 , 𝝀 𝒕 , 𝑡 = 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕

称𝑯 𝒙 𝑡 , 𝒖 𝑡 , 𝝀 𝒕 , 𝑡 为哈密尔顿函数。则
𝒕𝒇 𝒕𝒇

𝑱′ = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑯 𝒙 𝑡 , 𝒖 𝑡 , 𝝀 𝒕 , 𝑡 −𝝀𝑻 𝒕 𝒙ሶ (𝒕) 𝒅𝒕 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න [𝑯 −𝝀𝑻 𝒕 𝒙ሶ (𝒕)]𝒅𝒕


𝒕𝟎 𝒕𝟎

泛函 𝑱′ 取得极值的必要条件为:𝛅𝑱′ = 𝟎
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = 𝜹𝒙 𝒕𝒇 + න 𝜹𝒙 + 𝜹𝒖 + 𝜹𝝀 − 𝒙ሶ 𝑻 𝜹𝝀 −𝝀𝑻 𝜹 𝒙ሶ 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎

𝒕𝒇 𝒕𝒇 𝒕𝒇 𝒕𝒇 𝒕𝒇
𝒕𝒇 𝒕𝒇
而 න 𝝀𝑻 𝜹 𝒙ሶ 𝒅𝒕 = න 𝝀𝑻 𝜹𝒅𝒙 = න 𝝀𝑻 𝒅 𝜹𝒙 = 𝝀𝑻 𝜹𝒙ቚ −න 𝒅𝝀𝑻 𝜹𝒙 = 𝝀𝑻 𝜹𝒙ቚ − න 𝝀ሶ 𝑻 𝜹𝒙𝒅𝒕
𝒕𝟎 𝒕𝟎
𝒕𝟎 𝒕𝟎 𝒕𝟎 𝒕𝟎 𝒕𝟎
6.2.3 有约束条件的变分问题

𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = 𝜹𝒙 𝒕𝒇 −𝝀𝑻 𝜹𝒙ቚ + න 𝜹𝒙 + 𝜹𝒖 + 𝜹𝝀 − 𝒙ሶ 𝑻 𝜹𝝀 + 𝝀ሶ 𝑻 𝜹𝒙 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝒕𝟎 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎

𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + 𝝀𝑻 𝒕𝟎 𝜹𝒙 𝒕𝟎 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎

由于𝒙 𝒕𝟎 固定,故𝛅𝒙 𝒕𝟎 = 𝟎
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎

由于𝒙 𝒕 , 𝒖 𝒕 , 𝝀 𝒕 , 𝒙 𝒕𝒇 不受限制,故𝛅𝒙 𝒕 , 𝜹𝒖 𝒕 , 𝜹𝝀 𝒕 , 𝜹𝒙 𝒕𝒇 任意
𝝏𝑯
要使 𝜹𝑱′ =𝟎 必有:𝝏𝑯 − 𝒙ሶ = 𝟎 即有 𝒙ሶ =
𝝏𝝀
= 𝒇(𝒙, 𝒖, 𝒕)
𝝏𝝀 𝝏𝑯
=𝟎
𝝏𝑯 𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝒖
𝝀ሶ = − 𝝀 𝒕𝒇 =
𝝏𝒙 𝝏𝒙 𝒕𝒇
6.2.3 有约束条件的变分问题

综上,终端时间固定、状态自由,等式约束条件下的性能指标取极值的必要条件为:
 H
x   f ( x, u , t )
状态方程:  
 x(t )  x
 0 0

 H
    x
协状态方程: 
 [ x(t f ), t f ]
 (t ) 
 f x(t f )

控制方程: H  0
u
《现代控制理论》MOOC课程

6.2.3 有约束条件的变分问题 (2)


6.2.3 有约束条件的变分问题

 哈密尔顿函数的重要性质:

沿着最优轨迹的哈密尔顿函数对时间的全导数等于对时间的偏导数: dH  H
dt t

当哈密尔顿函数不显含时间变量时,沿着最优轨迹的哈密尔顿函数为常数: 𝐻 = 𝐶

证明: 𝐻 = 𝐿 + 𝜆𝑇 𝑓
T T T
dH  H   H   H  H
  x    u     
dt  x   u     t

当系统取得极值时有:
T T T T
 H   H   H   H   H   H 
  x             0
 x      x         x 
6.2.3 有约束条件的变分问题

故: dH H

dt t

当H不显含t时有: dH  H  0 即: H  C
dt t
这一性质可用于判断系统的最优轨迹是否正确。
例:已知一阶受控系统 x  u, x(t0 )  x0 性能指标函数为
1 1 tf 2
J  C x (t f )   u dt
2
2 2 t0
其中常数 C  0 ,求使 J 为极小值的最优控制 u (t )
1 2 H
解: H  u   u 得   u
2
由  u    0
u
6.2.3 有约束条件的变分问题
解协状态方程:
1 
H   Cx 2 (t f ) 
 0  (t f )  
2   Cx(t ) 得:   Cx(t f )
x x(t f )
f

代入状态方程: x  u    C x(t f )
x(t0 )  x0

故: x(t )  x0  C x(t f ) t  C x(t f ) t0

x0
令 𝑡 = 𝑡𝑓 可得:x(t f ) 
1  C (t f  t0 )

C x0
进而得: u     (t f )  Cx(t f )  
1  C (t f  t0 )
《现代控制理论》MOOC课程

6.2.3 有约束条件的变分问题 (3)


6.2.3 有约束条件的变分问题

二. 终端时间固定、状态约束,等式约束条件下的变分问题

受控系统的状态方程为 𝒙ሶ (𝒕) = 𝒇[𝒙 𝒕 , 𝒖 𝒕 , 𝒕]


初始状态为𝒙(𝒕𝟎 ) = 𝒙𝟎
终端时间𝒕𝒇 固定,但终端状态𝒙(𝒕𝒇 )受约束:g[ x(t f ), t f ]  0
𝒕𝒇
寻求最优控制𝒖(𝒕)使性能指标 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + ‫𝑳 𝒕׬‬ 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕 取得极小值。
𝟎

将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎

引入拉格朗日乘子函数𝝀 𝒕 , 𝝁(𝒕), 原等式约束问题,转化为如下无约束优化问题:


𝒕𝒇

𝑱′ = 𝜽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题

其中:  [ x(t f ), t f ]  [ x(t f ), t f ]   T (t ) g[ x(t f ), t f ]


终端时间固定、终端状态约束,等式约束条件下性能指标取得极值的必要条件为:
 H
x  f ( x, u , t )
状态方程:  H
  控制方程: 0
 x(t )  x  u
 0 0

 H
    x

协状态方程: 
  [ x(t f ), t f ] [ x(t f ), t f ]  g[ x(t f ), t f ] 

 f (t )     T
 
x(t f ) x(t f )   x (t ) 
  f 
 g[ x(t ), t ]  0
 f f


6.2.3 有约束条件的变分问题

例:受控系统的状态方程为: x1  x2
x2  u
初始状态为: x1 (0)  x2 (0)  0
当 t f  1 时将系统状态转移到 x1 (1)  x2 (1)  1 ,且使性能指标

1 1 2
J   u dt
2 0
达到极小值,求最优控制及相应的最优轨线。
解:终端约束为:g ( x(t f ))  x1 (1)  x2 (1)  1  0
1 2
哈密尔顿函数为: H  u  1x2  2u
2
H
由:  u  2  0 得 u  2
u
6.2.3 有约束条件的变分问题

代入状态方程和协状态方程:
x1  x2 x1 (0)  0
x2  2 x2 (0)  0

H [ g ( x(1))]
1   0 1 (1)  
x1 x1 (1)
x1(1)  x2 (1)  1  0
H [ g ( x(1))]
2    1 2 (1)  
解得: x2 x2 (1)
1 3 3 2
x1 (t )   t  t
14 7 3 6
3 2 6 3 6 u (t )   t 
x2 (t )   t  t 𝜆2 𝑡 = 𝑡 − 7 7
14 7 7 7
《现代控制理论》MOOC课程

6.2.3 有约束条件的变分问题 (4)


6.2.3 有约束条件的变分问题

三. 终端时间自由、状态约束,等式约束条件下的变分问题

受控系统的状态方程为 𝒙ሶ (𝒕) = 𝒇[𝒙 𝒕 , 𝒖 𝒕 , 𝒕] 初始状态为𝒙(𝒕𝟎 ) = 𝒙𝟎

寻求最优控制𝒖(𝒕)及最优终端时刻𝒕𝒇 ,使系统在终端时刻转移到某一终端状态𝒙(𝒕𝒇 )

且满足:𝐠[𝒙(𝒕𝒇 ), 𝒕𝒇 ] = 𝟎
𝒕
使性能指标 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + ‫ 𝑡 𝒙 𝑳 𝒇 𝒕׬‬, 𝒖 𝑡 , 𝑡 𝒅𝒕 取得极小值。
𝟎

将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎
引入拉格朗日乘子函数 𝝀 𝒕 , 𝝁(𝒕) 原等式约束问题,转化为如下无约束优化问题:
𝒕𝒇

𝑱′ = 𝜽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题

其中:  [ x(t f ), t f ]  [ x(t f ), t f ]   T (t ) g[ x(t f ), t f ]

哈密尔顿函数为:H [ x(t ), u(t ),  (t ), t ]  L[ x(t ), u(t ), t ]  T (t ) f [ x(t ), u(t ), t ]

tf
于是: J  [ x(t f ), t f ]   g[ x(t f ), t f ] 

{H [ x(t ), u (t ),  (t ), t ]   T (t ) x(t )}dt
' T
t0
T
 [ x(t f ), t f ]   [ x(t f ), t f ] 
故:  J   '
  x(t f )    d tf
  x (t )   t 
 f   f 

 g[ x(t f ), t f ]  
T g[ x(t f ), t f ]

 T
  x(t f )     d t f  g [ x(t f ), t f ]  
T
 x(t f )   t 
   f 
6.2.3 有约束条件的变分问题

{H [ x (t ), u(t ), t ]   T (t ) x (t )} t  t f dt f

T T T
tf  H   H   H 
 {   x     u       xT
    T
(t )  x(t )}dt
t0  x   u    

tf tf tf
t   xdt   d x   x 
tf
而:
T T T
t0  T  xdt
0 t0 t0
6.2.3 有约束条件的变分问题
故有:
 [ x(t ), t ] T    
'  g [ x (t ), t ] 
 J         x(t f ) 
f f T f f
 x(t f )   x(t f ) 
    
 [ x(t f ), t f ]  
T g[ x (t f ), t f ] 

      f d t  g T
[ x(t f ), t f ]  
 t    t 
 f   f  
{H [ x(t ), u (t ), t ]   T (t ) x(t )} t t f dt f   T  x t t f 
T T T
tf  H   H   H 
t 0
{
 x
  x


 u 
 u  
 
 x   }dt

6.2.3 有约束条件的变分问题

注意在  t f  0 时, x(t f ) 与  x(t ) t t 的区别:


f
x(t )
C x (t f )d t f  x(t f ) 是终端状态向量的变分,它是由
D  x(t ) 和 dt f 综合引起的,相当于FC;
E
x(t )  x(t f )
 x(t ) t t f 是在时刻 t f 上,变分  x(t )
 x(t )
F
的值,相当于BD。
B
x* (t )  x(t ) t t f  BD  FC  EC
A
x(t0 )   x(t f )  x (t f ) dt f
t

t0 tf tf  d tf
6.2.3 有约束条件的变分问题

故有:

 [ x(t ), t ] T    
'  g [ x (t ), t ] 
 J         x(t f ) 
f f T f f
 x(t f )   x(t f ) 
    
 [ x(t f ), t f ]  
T g[ x(t f ), t f ] 

      f d t  g T
[ x(t f ), t f ]   
 t    t 
 f   f  
{H [ x(t ), u (t ), t ]   T (t ) x(t )} t t f dt f   T (t f ) x(t f )   T (t f ) x(t f ) d t f 
T T T
tf  H   H   H 
t 0
{
 x
  x

  u 
 u   
 x   }dt

6.2.3 有约束条件的变分问题

即:

 [ x(t ), t ] T    
'  g [ x (t ), t ] 
 J         (t f )   x(t f ) 
f f T f f T
 x(t f )   x(t f ) 
    
  [ x(t f ), t f ]    g [ x (t ), t ]  

 
f f
 H [ x(t f ), u (t f ), t f ]    d t f 
T
t    t 
  f   f  
g T [ x(t f ), t f ]   
T T T
tf  H   H   H 
t 0
{
 x
  x


 u 
 u  
 
 x   }dt

6.2.3 有约束条件的变分问题

泛函极值存在的必要条件为  J '  0 ,即:


 H
状态方程:  x   f ( x, u , t ) H
  控制方程:
 u
0
 x(t )  x
 0 0

协状态方程:   H
 x

  [ x(t f ), t f ]   g[ x(t f ), t f ] 
T
 (t )     
 f  x(t f )   x(t f ) 
    
 g[ x(t ), t ]  0
 f f
  [ x(t f ), t f ]   ]
 H [ x(t f ), u (t f ), t f ]   T g[ x (t f ), t f
  0
  t f   t f 
    
6.2.3 有约束条件的变分问题

例:给定受控系统 x  u, x(0)  1

求最优控制 u (t ) ,使 x(t f )  0 ,并使性能指标


1 tf 2
J  t f   u (t )dt
2 0
取极小值。其中 t f 未定。
1 2
解:哈密尔顿函数为 H  u   u
2
H
控制方程为:  u    0 得 u  
u

状态方程为: x  H  u 协状态方程为:   
H
0
 x
6.2.3 有约束条件的变分问题

边界条件为(由于端点状态固定,故不用横截条件):

x (0)  1
 [ x (t f ), t f ]  T  g[ x (t f ), t f ]   2 (t f )
由:H [ x (t f ), u(t f ), t f ]  
        1  0
 t f   t f  2
可得:
(t f )  2

故:  2 可得: u(t )     2

x(t )  1  2 t 1
再由: x (t f )  0 可得: t f 
2
《现代控制理论》MOOC课程

6.3 极小值原理
6.3.1 经典变分法的局限性

经典变分法
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱 = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎

 用经典变分法求泛函极值时,假定控制量𝒖(𝒕)不受约束,即𝜹𝒖为任意,为使性能指标
函𝜹𝑱 = 𝟎 , 可得获得最优控制所需满足的控制方程𝝏𝑯Τ𝝏𝒖 = 𝟎 。而当控制量存在约束时,
𝜹𝒖不能任意取值,控制方程不成立。
6.3.1 经典变分法的局限性
例 . 考虑一阶系统
x(t )   x(t )  u(t ), x(0)  1
试求最优控制 u (t ) ,使如下目标函数有极小值。
1
J   x(t )dt
0
解:这是一个终端时间固定、状态自由的最优控制问题。
应用经典变分法求解。
引入乘子  (t ) ,构造哈密尔顿函数:
H  x(t )   (t )[ x(t )  u(t )]
H
协状态方程及边界条件为:  (t )     (t )  1
x
 (t f )   (1)  0
6.3.1 经典变分法的局限性

控制方程为: H
  (t )  0
u
显然,控制方程与协状态方程矛盾。

用变分法求解,问题无解。

而问题是有解的。由于H是u的一次函数,故极值一定存在且存在边界上,而不能在
H
 0 的点上达到。
u

此外,应用经典变分法H对u必须有导数,即要求状态方程的右侧 f ( x, u, t ) 和目标
函数的被积函数 L( x, u, t ) 对控制u可导。
《现代控制理论》MOOC课程

6.3.2 终端时间固定的极小值原理
6.3.2 终端时间固定的极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端时间𝑡𝑓 固定,终端状态 𝒙(𝑡𝑓 )自由。 控制 u(t ) U ,U 可为闭集。
𝑡𝑓
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = ‫𝐿 𝑡׬‬ 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0
若取: H  L[ x(t ), u(t ), t ]  T f [ x(t ), u(t ), t ]
则极小值存在的必要条件为:
H
 (t )    (t f )  0
x
𝑥ሶ 𝑡 = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑥 𝑡0 = 0

𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 , 𝑡 = min 𝐻 𝑥 ∗ 𝑡 , 𝑢 𝑡 , 𝜆 𝑡 , 𝑡
𝑢∈𝑈
式中, 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 为最优运动轨迹和最优控制。
6.3.2 终端时间固定的极小值原理

说明:
1)∀𝑢 ∈ 𝑈, 𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 ≤ 𝐻 𝑥 ∗ , 𝑢, 𝜆, 𝑡 ,即𝑢∗ 使哈密尔顿函数为𝑢的函数极小值。

2)𝑢∗ 使哈密尔顿函数为𝑢的函数最小值,这也是极小值原理的来源。若𝐻 = −𝐿 − 𝜆𝑇 𝑓
则有极大值原理,此时最优控制的必要条件为:
𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 , 𝑡 = max 𝐻 𝑥 ∗ 𝑡 , 𝑢 𝑡 , 𝜆 𝑡 , 𝑡
𝑢∈𝑈
3)极小值原理是性能指标取极小值的最优控制问题的必要条件,而非充分条件。

证明:
u* (t ), t  [t , t )  x* (t ), t  [t , t )


0


0
对于控制: 
u (t )  u (t ), t  [t , t   ) x (t )   x(t ), t  [t , t   )
对应的状态轨迹为:
 *  *
u (t ), t  [t   , t f ]
  x (t ), t  [t   , t f ]

6.3.2 终端时间固定的极小值原理

tf
故有: J (u ( ))  J (u* ( ))   [ L( x , u , t ) L( x* , u* , t )]dt  0
t0

对上式加减: LT
( x  x* ) 可得:
x
tf
LT LT
        )]dt  0
* * * *
[ L ( x , u , t ) L ( x , u , t ) ( x x ) ( x x
t
x x
0

由协状态方程可得:    H  ( L   T
f ) L f T
   
x x x x

L f T LT T f
即:      
T
x x x x
6.3.2 终端时间固定的极小值原理

tf
LT
T f
故有:  [ L( x , u , t ) L( x* , u* , t )  ( x  x )  (  
* T
)( x  x* )]dt  0
t
x x
0

tf tf tf tf
其中: * tf * tf
 
            )dt

T * T *
( x x ) dt d ( x x )  T
( x  x )  T
d ( x  x *
)  T
( x  x )  T
( x  x*
t0 t0
t0 t0 t0 t0
tf
* tf
  T ( x  x )    T [ f ( x , u , t )  f ( x* , u* , t )]dt
t0
t0
代入上式可得:
tf
* tf LT T f
  ( x  x )   {[ L( x , u , t ) L( x , u , t )]   [ f ( x , u , t )  f ( x , u , t )] 
T * * T * *
( x  x )  
*
( x  x* )}dt  0
t0
t0
x x
tf T
t  H 
          )]dt  0
T * f * * *
即: ( x x ) [ H ( x ,
 u , , t ) H ( x , u , , t )   ( x x
t0
t  x 
0
6.3.2 终端时间固定的极小值原理

按积分区间分段可得:

𝑡𝑓 𝑡 𝜕𝐻 𝑇
−𝜆𝑇 (𝑥𝜀 − ∗ ‫ۂ‬
𝑥 ) 𝑡0 + ‫ ∗ 𝑥(𝐻[ 𝑡׬‬, 𝑢∗ , 𝜆, 𝑡) −𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 − 𝑥 ∗ − 𝑥 ∗ ]𝑑𝑡
0 𝜕𝑥

𝑡+𝜀 𝜕𝐻 𝑇
+ ‫𝑥(𝐻[ 𝑡׬‬,
෤ 𝑢, 𝜆, 𝑡) −𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 − 𝑥෤ − 𝑥 ∗ ]𝑑𝑡
𝜕𝑥

𝑡𝑓 𝜕𝐻 𝑇
+ ‫𝑡׬‬+𝜀[𝐻(𝑥෤ ∗ , 𝑢෤ ∗ , 𝜆, 𝑡) ∗ ∗
− 𝐻 𝑥 , 𝑢 , 𝜆, 𝑡 − 𝑥෤ ∗ − 𝑥 ∗ ]𝑑𝑡 ≥ 0
𝜕𝑥

由于  (t f )  0 ,当 t  t0 有: x  x*

t T
* tf  H  * *
故有:  ( x  x )   [ H ( x , u ,  , t ) H ( x , u ,  , t )    ( x  x )]dt  0
T * * * *
t0
t  x 
0
6.3.2 终端时间固定的极小值原理

在 t 处: x  x* ,当   0
t  T t 
 H  * *
 [ H ( x , u,  , t ) H ( x , u ,  , t )    ( x  x )]dt   [ H ( x*, u,  , t ) H ( x*, u*,  , t )]dt
* * *

t  x  t

  [ H ( x* , u,  , t )  H ( x*, u*,  , t )]  o( )


其中: o( ) 是关于  的高阶无穷小。

tf T
 H  * *
V (t   )   [ H ( x , u ,  , t ) H ( x , u ,  , t )    ( x  x )]dt
令: * * * * *

t   x 

dV
对 V (t   ) 在   0 处用泰勒级数展开:V (t   )  V (t ) 
* * *
  o( )
d  0
6.3.2 终端时间固定的极小值原理

当   0 时, x* (t )  x* (t ), u* (t )  u* (t )

dV
故有, V * (t )  0,  0
d  0
tf
H * *
即: V * (t   ) 
 [H ( x , u , , t ) H ( x , u , , t )  x ( x  x )]dt  o( )
* * * *

t 

综上可得,对 u U :
o( )
[ H ( x , u,  , t )  H ( x , u ,  , t )] 
* * *
0

即: u U H ( x* , u* , , t )  H ( x*, u, , t )
得证
6.3.2 终端时间固定的极小值原理

例. 给定受控系统:x1   x2  u x1 (0)  x10


x2  u x2 (0)  x20
控制变量𝑢 满足如下不等式: 0  u  u  u
求最优控制,使如下性能指标取得极小值。
T
J   (2x1  u )dt
0
解:哈密尔顿函数为
u  x2 
H  L( x, u, t )   f ( x, u, t )  2 x1  u  1
T
2     2 x1  u  1u  1x2  2u
 u 
 2 x1  1x2  (1  1  2 )u
u , 1  1  2  0
𝐻是𝑢的线性函数,使𝐻在 0  u  u  u 中取极小值有:u  
*
 u , 1  1  2  0
6.3.2 终端时间固定的极小值原理
由协状态方程:

1  H  2 1 (T )  0 


     (T )   0 
2  x 1   2   
可得: 1 (t )  2(t  T )
2 (t )  (t  T ) 2
换接函数: (t )  1  1  2  1  2(t  T )  (t  T )2  (1  t  T )2  0

故最优控制 u* (t )  u
《现代控制理论》MOOC课程

6.3.3 终端时间未固定的极小值原理
6.3.3 终端时间未固定的极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端时间𝑡𝑓 不固定,终端状态 𝑥(𝑡𝑓 )自由。控制 u(t ) U , U 可为闭集。
𝑡
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = ‫ 𝑡 𝑥 𝐿 𝑓 𝑡׬‬, 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0

若取: H  L[ x(t ), u(t ), t ]  T f [ x(t ), u(t ), t ]


则极小值存在的必要条件为:
H
 (t )    (t f )  0
x
𝑥ሶ 𝑡 = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑥 𝑡0 = 0
𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 , 𝑡 = min 𝐻 𝑥 ∗ 𝑡 , 𝑢 𝑡 , 𝜆 𝑡 , 𝑡
𝑢∈𝑈

且: 𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 ቚ =0 式中, 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 为最优运动轨迹和最优控制。
𝑡𝑓∗
6.3.3 终端时间未固定的极小值原理

证明:作时间变换

t   : t ( )  t0   w( s)ds, t (1)  t f , 0  w( )  
0
dt
 w( ) dt  w( )d
d
将问题有 t  [t0 , t f ] 变换为: [0,1]

系统状态方程为: x( )  f ( x( ), u( ))w( )


1
目标函数为: J   L( x( ), u ( )) w( )d
0
6.3.3 终端时间未固定的极小值原理

取:H [ x( ), u( ), w( ),  ( )]  L( x( ), u( )) w( )   T ( ) f ( x( ), u( )) w( )

H [ x( ), u( ),  ( )]  L( x( ), u( ))  T ( ) f ( x( ), u( ))


H [ x ( ), u( ), w( ),  ( )]  H [ x( ), u( ),  ( )]w( )
若 x ( ), u ( ), w* ( ) 为变换后问题的最优解,则必为下列二个问题的最优解:
* *

问题(A): 固定 w* ( ) ,求取 x ( ), u ( ) ,使如下问题取极小


* *

1
J   L( x( ), u ( )) w( )d s.t. x( )  f ( x( ), u( ))w( )
0
问题(B): 固定u ( ) ,求取 x* ( ),
*
w* ( ) ,使如下问题取极小
1
J   L( x( ), u ( )) w( )d s.t. x( )  f ( x( ), u( ))w( )
0
6.3.3 终端时间未固定的极小值原理

对于问题(A),应用终端时间固定的极小值原理,其必要条件为:
H H
 ( )    w( )
x x
 w( ) 有:  ( )  d  ( )  d  (t ) w( )   H w( )
dt

d d dt x
d  (t ) H
即  (t)  
dt x
H [ x* ( ), u* ( ), w* ( ),  ( )]  min H [ x* ( ), u( ), w* ( ),  ( )]
uU
由于 w* ( ) 固定,故 H [ x* ( ), u* ( ),  ( )]  min H [ x* ( ), u( ),  ( )]
uU

即: H [ x* (t ), u* (t ),  (t )]  min H [ x* (t ), u(t ),  (t )]
uU
6.3.3 终端时间未固定的极小值原理

对于问题(B),应用变分法,其必要条件为:

H
 (t )  
x
H
H 0
w( )

即: H [ x* (t ), u* (t ),  (t )]  0

从而: H [ x* (t ), u* (t ),  (t )] *
0
t f

证毕
6.3.3 终端时间未固定的极小值原理

例. 给定受控系统:
x1  0.5 x2  4u x1 (0)  50
x2  u x2 (0)  1
控制变量𝑢满足如下不等式
1  u  1 tf
求最优控制及终端时刻 t f ,使如下性能指标取得极小值: J   ( x2  u )dt
0
解:哈密尔顿函数为

H  L ( x, u , t )   T f ( x, u , t )
 0.5 x2  4u 
 x2  u   1 2     x2  u  0.5 x2 1  4u 1  2u
u 
6.3.3 终端时间未固定的极小值原理

H  x 2  0.5 x 2 1  (  2  1  4 1 ) u

1, 2  1  4 1  0
为使H函数取得极小值: u  
*
  1, 2  1  4 1  0

 1 (t f )  0
由协状态方程:    0
 1
 
 2   1  0.51  2 (t f )  0

1  0
解得: 

2  t  t f

换接函数为:  ( t )   2  1  4 1   t  t f  1
6.3.3 终端时间未固定的极小值原理

由: H  x 2  0.5 x 2 1  (  2  1  4 1 ) u  x 2  (  t  t f  1) u
当:𝑡 = 𝑡𝑓 时,𝜉 = −1,𝐻 = 0 故: x 2 ( t f )  1

当:𝑡 ∈ 0, 𝑡𝑓 − 1 , 𝜉 > 0, 𝑢∗ = −1
 x2   1
由:  得: x2  1  t
 x2 (0)  1

当:𝑡 ∈ (𝑡𝑓 −1, 𝑡𝑓 ], 𝜉 < 0, 𝑢∗ = 1

由:  x2  1 解得: x2 (t )  t  t f  1

 x2 (t f )  1
6.3.3 终端时间未固定的极小值原理

由于状态连续,在换接点 t  t f  1 ,必有

x 2 ( t f  1)  t f  1  t f  1  1  ( t f  1)
故:t  2
f

  1, 0  t  1
最优控制为: u 
*
1, 1  t  2
《现代控制理论》MOOC课程

6.3.4 极小值原理
6.3.4 极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端状态 𝑥(𝑡𝑓 )满足约束 g ( x ( t f ), t f )  0
控制 u(t ) U , U 可为闭集
𝑡
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = Φ 𝑥 𝑡𝑓 , 𝑡𝑓 + ‫ 𝑡 𝑥 𝐿 𝑓 𝑡׬‬, 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0

若取: H  L[ x(t ), u(t ), t ]  T f [ x(t ), u(t ), t ]


则泛函极值存在的必要条件为:

 H
状态方程:  x   f ( x, u , t )
 
 x (t )  x
 0 0
6.3.4 极小值原理

H
协状态方程:  
   x

  [ x (t f ), t f ]   g[ x (t f ), t f ] 
T
 (t )     
 f   x (t )    x (t ) 
  f   f 
 g[ x (t ), t ]  0
 f f
  [ x (t f ), t f ]   g[ x (t f ), t f ]
 H [ x (t f ), u (t f ), t f ]     T  0
  t f   t f 
    

𝐻函数在最优轨迹和最优控制上取极小值:

H ( x * ( t ), u * ( t ),  )  min H ( x * ( t ), u ( t ),  )
uU

式中 , x * ( t )、 u * ( t ) 为最优状态轨迹和最优控制。
6.3.4 极小值原理

t f 固定, H [ x* (t ), u * (t ),  (t )]  C


t f 未固定, H [ x* (t ), u * (t ),  (t )] 0

*
t f

证明:略。
基本思想是将混合型目标函数化为积分型目标函数,将终端目标集约束化为动态约束。
然后用与证明积分型性能指标极小值原理相同的方法来证明。

例如,对于目标函数,由于  ( x ( t 0 ), t 0 ) 为常数
如下目标函数与原问题目标函数 𝑱等价
tf
J   ( x (t f ), t f )   ( x (t 0 ), t 0 )   L[ x (t ), u (t )]dt
t0
6.3.4 极小值原理

目标函数 𝑱ҧ 可进一步表示为:

tf d  ( x (t ), t )
J  [  L ( x (t ), u (t ))]dt
t0 dt
tf  ( x (t ), t )  T ( x (t ), t ) dx (t )
 [   L ( x (t ), u (t ))]dt
t0 t  x (t ) dt

tf  ( x (t ), t )  T ( x (t ), t )
J  [  f ( x (t ), u (t ))  L ( x (t ), u (t ))]dt
t0 t  x (t )

这样复合型目标函数就化为了积分型目标函数。
《现代控制理论》MOOC课程

6.3.5 时间最优控制
6.3.5 时间最优控制

一.线性定常时间最优控制问题的数学描述
问题:已知受控系统的状态方程为:
𝒙ሶ = 𝑨𝒙 𝑡 + 𝑩𝒖(𝑡)
求满足如下不等式约束条件

𝒖 ≤ 𝟏 或 𝒖 ≤ 𝐶, 𝑡 ∈ [0, 𝑡𝑓 ]

的控制 𝑢(𝑡) ,使系统自某一初始状态𝒙 0 转移到状态空间原点,即𝒙(𝑡𝑓 ) = 0。


tf
使如下性能指标取极小值: J   dt
0
6.3.5 时间最优控制

二.线性定常系统时间最优控制

系统哈密尔顿函数为:
H [ x ( t ), u ( t ),  ( t )]  L ( x , u , t )   T f ( x , u , t )  1   T A x   T B u

运用最小值原理,若系统取得最优控制必有控制 𝒖∗ ,使得:

H [ x*,u*, * ]  min{1  ( * )T Ax*  ( * )T Bu}  1  ( * )T Ax*  min{( * )T Bu}


u 1 u 1

可得最优控制为: u * ( t )   sign [(  * ) T B ]
协状态方程为: 可解得:
H  AT t
   AT   (t )  e  (0)
x
6.3.5 时间最优控制

由极小值原理得哈密尔顿函数在终端时刻的值为:

H t tf
0
H [ x ( t f ), u ( t f ),  ( t f )]  1   T ( t f ) Ax ( t f )   T ( t f ) Bu ( t f )  0

可知:𝜆(𝑡𝑓 ) ≠ 0 故 :𝜆(0) ≠ 0

 At
故最优控制为: u ( t )   sign [(  ) B ]   sign (  (0) e B )   sign ( ( t ))
* * T T

u*j (t )   sign( j (t ))   sign( T (0)e  At b j ) j  1, 2 ,r

最优控制完全由𝜉(𝑡)的符号和变符号的时间决定,称𝜉(𝑡)为换接函数。

𝑏𝒋 为系统输入矩阵𝑩的列向量。
6.3.5 时间最优控制
三. 时间最优控制正则的充要条件

定义:若对时间最优控制问题,协状态方程的任一非零解𝜆(𝑡)都使换接函数的每一个分量
𝜉𝒋 (𝒕)在[𝑡0 , 𝑡𝑓∗ ] 上不存在零聚点,则称时间最优控制问题为正则的,否则为奇异的。

所谓 𝜉𝒋 (𝑡)的零聚点𝑡ҧ ∈[𝑡0 , 𝑡𝑓∗ ]是指𝜉𝒋 𝑡ҧ = 0 ,且在 𝑡的任何邻域内都存在𝜉


ҧ 𝒋 (𝑡)的零点。

定理:线性定常时间最优控制问题为正则的充要条件为:
𝑟𝑎𝑛𝑘𝐺𝒋 = 𝑛, 𝑗 = 1,2, ⋯ , 𝑟

𝐺𝒋 = 𝑏𝒋 , 𝑨𝑏𝒋 , ⋯ , 𝑨𝒏−𝟏 𝑏𝒋

证明:充分条件:
若 𝑟𝑎𝑛𝑘𝐺𝒋 = 𝑛, 𝑗 = 1,2, ⋯ , 𝑟,则时间最优控制问题为正则。
6.3.5 时间最优控制

反设𝑟𝑎𝑛𝑘𝐺𝒋 = 𝑛, 𝑗 = 1,2, ⋯ , 𝑟 存在一个正整数𝑗𝑘 ,使得:

 jk ( t )   T (0) e  At b jk
在区间[𝑡0 , 𝑡𝑓 ] 上有零聚点 t  [ t 0 , t f ] ,即在 𝑡ҧ 的任何邻域内总存在  j (t ) 的零点。
k

因此,存在无穷时间点列 t r
(0)
 [ t 0 , t f ] ( r  1, 2, )
𝜉
满足: lim t r(0) t
r  (0) (0)
𝑡𝑟 𝑡𝑟+1
  T (0) e  At b jk  0
(0)
且  jk r )
( t (0) r 0
(1)
𝑡
𝑡𝑟

根据罗尔定理:一个连续可微函数的两个零点之间其导数至少存在一个零点。

故必存在无穷点列t r(1) ( r  1, 2, ) 满足:t  [ t 0 , t f ]


6.3.5 时间最优控制

d  jk ( t )
且使的    T (0) e  At Ab jk 0
dt t t (1)

t  t r(1)
r

反复应用罗尔定理,可得:

d 2 j k ( t )
  T (0) e  At A 2b jk  0, t r(1)  t r(2)  t r(1)1
dt 2 t  t r( 2 )
t  t r( 2 )

d n 1 jk (t )
  T (0) e  At A n 1b jk  0, t r( n  2)  t r( n 1)  t r( n1 2)
dt n 1 t t r( n1)
t t r( n1)
6.3.5 时间最优控制

显然有: lim t (1)


r  lim t r 
(2)
 lim t r( n 1)  t
r r r

故有:  T (0) e  A t b jk  0
 T (0) e  A t Ab jk  0

 T (0) e  At A n 1b j  0
k

因此有:  T (0) e  A t [ b Ab jk A n  1b j k ]  0
j k

由于:  T (0) e  A t  0

故有: rank [ b jk Ab jk A n 1b jk ]  n


6.3.5 时间最优控制

这与假设 rankG j  n , j  1, 2, , r 矛盾。反设不成立。

即  jk (t ) 在区间 [ t 0 , t f ]没有零聚点,问题正则。

必要条件:若正则,必有 rankG j  n , j  1, 2, ,r
反设正则,但存在一个 j (1  j  r ) 使得:
rankG j  n

故必存在   0,   R n 使

 T G j   T [ b j Ab j A n  1b j ]  0

即  T b j  0,  T Ab j  0 , ,  T A n 1b j  0
6.3.5 时间最优控制

由凯莱-哈密尔顿定理,矩阵指数函数 e  At 可表示为:
n 1
e  At    i (t ) Ai
i 0 n 1
T  At
用  、 b j 左、右乘上式,可得: e b j
T
  i (t )aT Ai b j
i 0

由  T b j  0,  T A b j  0 , ,  T A n 1b j  0
n 1
可得:
T  At
e b j   i (t )aT Ai b j  0
i 0

由  (0)  0 ,取  (0)   则:  j ( t )   T (0) e  At b j  0

故问题奇异,这与问题正则的假设矛盾。反设不成立,必要性得证。 得证
《现代控制理论》MOOC课程

6.3.5 时间最优控制
6.3.5 时间最优控制

四.时间最优控制的唯一性
定理:设线性定常时间最优控制问题是正则的,若其时间最优控制存在,则最优控制必是
唯一的。

五.开关次数

定理:设线性定常时间最优控制问题是正则的,且其最优控制存在。记最优控制 𝒖∗ (𝑡)
的第𝑗 个分量𝒖∗𝒋 (𝑡) 的开关次数为𝑁𝒋 (𝒖∗𝒋 (𝑡)开关次数为相应换接函数的零点个数),若系统
的n个特征值均为实数,则开关次数:

N  max N j  n  1
j
6.3.5 时间最优控制

例:已知受控系统的状态方程为:
x ( t )  Ax ( t )  bu ( t )

0 1  0 
式中: A   b 
 1 
 0 0 
求满足如下不等式约束条件
u 1 t  [0, t f ]
的控制 u (t ) ,使系统自某一初始状态
x 0   x10 x 20 T
转移到状态空间原点的时间最短。即使如下性能指标取极小值:
tf
J   dt
0
6.3.5 时间最优控制

解: 哈密尔顿函数为:

H [ x ( t ), u ( t ),  ( t )]  1   1 ( t ) x 2 ( t )   2 ( t ) u ( t )

1* (t )  0
协状态方程为:    H
x 2* (t )  1*
可得: 1* (t )  C1
*2 (t )  C1t  C 2

运用极小值原理可得: H [ x *, u *, * ]  min {1  * x *  * u (t )}
1 2 2
u 1

 1  1* x2*  min {*2u (t )}


u 1
6.3.5 时间最优控制

可得最优控制为: u * ( t )   sign *2 ( t )

当: *2 ( t )   C 1t  C 2  0 有: u * ( t )   1

状态方程为: x1 (t )  x2 (t ) x1 (0)  x10


x2 (t )  u * (t )   1 x2 (0)  x20

解得: x2 (t )  t  x20
1 2
x1 (t )  x20 t  t  x10
2
1 2 1
消去t可得: x1 (t )   x 2 (t )  ( x10  x 20 )
2 2
6.3.5 时间最优控制

当: *2 ( t )   C 1t  C 2  0 有: u * (t )  1

状态方程为: x1 (t )  x 2 (t ) x1 ( 0 )  x10


x 2 (t )  1 x 2 ( 0 )  x 20
解得:x2 (t )  t  x20 1 2 1 2
消去t可得: x1 (t )  x 2 (t )  ( x10  x 20 )
1 2 2 2
x1 (t )  x20 t  t  x10
2
x2
u *  1 u*  1

x1
6.3.5 时间最优控制

通过原点的曲线为:
1 2
当 u ( t )   1 : x1 (t )   x 2 (t ) x 2 (t )  0
2
1 2
当 u (t )  1 : x1 (t )  x 2 (t ) x 2 (t )  0
2
 1
合并为一个方程为 称为开关曲线:x1 (t )   x 2 (t ) x 2 (t )
2
故最优控制规律与初始状态的位置有关,当初始状态

在  的上半沿上: u *  {  1} 在  的下半沿上: u *  {  1}

在 的右侧:u *  {  1,  1} 在  的左侧: u *  {  1,  1}
6.3.5 时间最优控制

最优时间的计算步骤:

1) 根据初始状态的位置确定 𝑢∗ 的取值。
2) 将 𝑢 = 𝑢∗ 代入状态方程求出状态轨线。
3) 计算状态轨线与开关曲线的交点,并计算从初始状态到交点处的时间。

4) 计算从状态轨线与开关曲线的交点到座标原点的时间。
5) 将两段时间加起来就是总的最优控制时间。

2
𝑥20 + 4𝑥10 + 2𝑥20 当(𝑥10 , 𝑥20 )位于𝛾曲线的右侧

𝑡𝑓∗ = 𝑥20 当(𝑥10 , 𝑥20 )位于𝛾曲线上


2
−𝑥20 + −4𝑥10 + 2𝑥20 当(𝑥10 , 𝑥20 )位于𝛾曲线的左侧
《现代控制理论》MOOC课程

6.4 线性二次型最优控制
6.4 线性二次型最优控制
一.线性二次型最优控制问题的数学描述
问题LQ:给定线性定常系统:
x  Ax  Bu
x (0)  x 0 t  [0, t f ]
寻找最优控制𝑢∗ (𝑡),使得系统由指定初始状态𝑥0 出发的运动,导致如下二次型性能指标:
tf
1 T 1
J (u ())  x (t f ) S x (t f )   [ x T (t )Q x (t )  u T (t ) R u (t )]dt
2 2 0
取得极小值。
其中,𝑡𝑓 为终端时间,𝑆, 𝑄为𝒏 × 𝒏阶半正定对称权矩阵;𝑅为𝒓 × 𝒓阶正定对称权矩阵。

 目标函数的物理意义:应用最小的控制能量,使得系统在指定时间区间内的状态与平
衡状态的偏差最小。
𝟏
第一项, 𝒙𝑻 𝑡𝑓 𝑆𝒙(𝑡𝑓 )强调了终端时刻系统状态与平衡状态的偏差最小;
𝟐
6.4 线性二次型最优控制

t
1 f T
第二项  x (t )Q x (t )dt 希望系统的整个运动轨迹与平衡状态的偏差最小;
2 0
t
1 f T
第三项  u (t ) R u (t ) dt 希望控制能量最小;
2 0

 线性二次型最优控制系统的分类:

1. 当终端时刻是固定的且为有限值时,称为有限时间线性二次型最优控制问题;

2.当终端时刻 t f   ,称为无限时间线性二次型最优控制问题;此时

1 T
J (u ())   [ x (t )Q x (t )  u T (t ) R u (t )]dt
20
6.4 线性二次型最优控制

3.当寻找最优控制的目的是将系统由初始状态驱动到平衡状态,同时使二次型性能指标
最小,称为线性二次型最优调节问题;

4.当寻找最优控制的目的是使系统的输出跟踪已知或未知的参考信号,同时使二次型性能
指标最小,称为线性二次型最优跟踪问题;

 有限时间问题与无限时间问题,对控制及控制系统的要求有着显著的不同;而跟踪问题
则可以看作是调节问题的一种推广。
6.4 线性二次型最优控制
二. 有限时间LQ调节问题
1.有限时间LQ最优控制的充要条件
定理:给定线性定常系统和二次型性能指标
x  Ax  Bu x (0)  x 0 t  [0, t f ]
t
1 T 1 f T
J (u ())  x (t f ) S x (t f )   [ x (t )Q x (t )  u T (t ) R u (t )]dt
2 2 0
其中,𝑡𝑓 固定,S  S T  0, Q  Q T  0, R  R T  0
1 T
则存在最优反馈控制 u * ( t )   K ( t ) x ( t ) 的充要条件为: K ( t )  R B P ( t )
其中,P ( t )  P T ( t )  0 且满足如下形式的Riccati微分方程
P ( t )   A T P ( t )  P ( t ) A  Q  P ( t ) B R -1 B T P ( t ), P ( t f )  S

的解,且最优性能指标为: J *  1 x 0T P (0) x 0
2
6.4 线性二次型最优控制
证明:必要性
当系统取得形如 u * ( t )   K ( t ) x ( t )的最优控制时,必有 K ( t )  R  1 B T P ( t )

𝑷(𝒕)为Riccati矩阵微分方程的解。
1 T 1
系统的哈密尔顿函数为: H ( x , u , λ , t )  x Qx  u T Ru  λT Ax  λT Bu
2 2
H
系统已取得最优控制,控制方程  0 必成立,可得:R u  B T λ  0
u

由于 R  0 ,故: u * ( t )   R  1 B T λ

要使最优控制具有 u * ( t )   K ( t ) x ( t ) 的形式,协状态变量必具有如下形式:λ  P ( t ) x ( t )

对上式两端求导可得:λ  P ( t ) x ( t )  P ( t ) x ( t )
6.4 线性二次型最优控制
H
由协状态方程: λ   可得:
x λ  [Qx  AT λ]

λ(t f )  λ(t f )  Sx (t f )
x (t f )
故: P (t ) x  P (t ) x  [Q x  A T λ ]  [Q x  A T P (t ) x ]

将状态方程 x  A x  B u  A x  B R  1 B T P ( t ) x 代入上式,可得:

P ( t ) x  P ( t )[ A x  B R  1 B T P ( t ) x ]   [ Q x  A T P ( t ) x ]

故有: [ P ( t )  P ( t ) A  A T P ( t )  Q  P ( t ) B R  1 B T P ( t )] x  0

由于已给定 x (0)  x 0 ,且在过渡过程中 x ( t )  0 ,故有:

P (t )  P (t ) A  A T P (t )  Q  P (t ) B R 1B T P (t )  0
6.4 线性二次型最优控制

由 λ ( t f )  Sx ( t f ) 及 λ ( t f )  P ( t f ) x ( t f ) 可得: P (t f )  S

即: P ( t )   P ( t ) A  A T P ( t )  Q  P ( t ) B R  1 B T P ( t ), P (t f )  S

对上式两边取转置:
P T ( t )   A T P T ( t )  P T ( t ) A  Q  P T ( t ) B R  1 B T P T ( t ), P T ( t f )  S

由于 P T ( t )、 P ( t ) 为同一Riccati方程的解,故 P T ( t )= P ( t )

故当系统取得形如 u * ( t )   K ( t ) x ( t ) 的最优控制时,必有
K (t )  R  1 B T P (t )

𝑷(𝒕)为Riccati矩阵微分方程的解, 且𝑷(𝒕) ≥ 𝟎, 𝑷 𝒕 = 𝑷𝑻 (𝒕) 。 必要性得证


6.4 线性二次型最优控制
充分性:
𝑃(𝑡)为Riccati矩阵微分方程的解, 𝑥(𝑡) 为系统在[0, 𝑡𝑓 ]区间上容许控制𝑢(𝑡)作用下
的状态,则对如下函数求导:
x T P (t ) x
d T
可得: ( x P ( t ) x )  x T
P ( t ) x  x T
P ( t ) x  x T
P (t ) x
dt
 [ x T A T  u T ( t ) B T ] P ( t ) x  x T [  P ( t ) A  A T P ( t )  Q  P ( t ) B R  1 B T P ( t )] x  x T P ( t )[ A x  B u ( t )]

 x T A T P (t ) x  u T (t ) B T P (t ) x  x T P (t ) A x  x T A T P (t ) x  x T Q x

 x T P (t ) B R 1 B T P (t ) x  x T P (t ) A x  x T P (t ) B u (t )

  x T Q x  u T (t ) B T P (t ) x  x T P (t ) B u (t )  x T P (t ) B R 1B T P (t ) x

  x T Q x  u T ( t ) R u ( t )  u T ( t ) R u ( t )  u T ( t ) R R  1 B T P ( t ) x  x T P ( t ) B R R  1u ( t )
 x T P (t ) B R  1 R R  1 B T P (t ) x
6.4 线性二次型最优控制

  x T Q x  u T ( t ) R u ( t )  [ u ( t )  R  1 B T P ( t ) x ]T R [ u ( t )  R  1 B T P ( t ) x ]

对上式两边从0到𝑡𝑓 积分:
tf
d T
 dt
( x P (t ) x ) dt  x T ( t f ) P ( t f ) x ( t f )  x T (0) P (0) x (0)
0
tf
  { x T Qx  uT (t ) Ru (t )  [ u (t )  R 1 B T P (t ) x ]T R[ u ( t )  R 1B T P ( t ) x ]}dt
0
tf tf
   ( x T Qx  uT (t ) Ru (t )) dt   [ u (t )  R 1 B T P (t ) x ]T R[ u ( t )  R 1B T P ( t ) x ]dt
0 0

1 T 1 tf
J (u ( ))  x ( 0 ) P ( 0 ) x ( 0 )   [u (t )  R 1 B T P (t ) x ]T R[ u (t )  R 1 B T P (t ) x ]dt
2 2 0
6.4 线性二次型最优控制
由于 R  0 故:[ u ( t )  R  1 B T P ( t ) x ]T R [ u ( t )  R  1 B T P ( t ) x ]  0

故,当 u ( t )  R  1 B T P ( t ) x  0

即:u ( t )   R  1 B T P ( t ) x 时,目标函数取得极小值:
1 T
J (u())  x (0) P (0) x (0)
*
2
充分性得证。
得证
6.4 线性二次型最优控制

2. 有限时间线性二次型最优调节器的设计步骤

(1). 根据工程经验和性能分析,确定权矩阵S,Q,R;

(2). 求解黎卡提方程  P (t )  P (t ) A  A T P (t )  Q  P (t ) BR  1 B T P (t )
P (t f )  S , t  [ 0, t f ]
(3).计算反馈增益阵 K * ( t ) 及最优控制u * (t )

K * ( t )  R  1 B T P ( t )、 u * ( t )   K * ( t ) x * ( t )
(4).计算最优状态轨迹

x * ( t )  Ax * ( t )  BR  1 B T P ( t ) x * ( t ), x * ( 0 )  x 0
1 T * *
(5).计算最优目标函数值 J  J (u ())  x 0 P ( 0 ) x 0
2
《现代控制理论》MOOC课程

6.4 线性二次型最优控制
6.4 线性二次型最优控制
三. 无限时间LQ调节问题
1.无限时间LQ最优控制的充要条件
定理:给定完全能控的线性定常系统和二次型性能指标
x  Ax  Bu x (0)  x 0

1
J (u ())   [ x T (t )Q x (t )  u T (t ) Ru (t )]dt
20
其中, Q  Q  0, R  R  0
T T

则存在最优反馈控制 u * ( t )   K x ( t ) 的充要条件为
K  R 1B T P
其中,P  P T  0 且为满足如下形式的Riccati代数方程
A T P  P A  Q  P B R -1 B T P  0
1 T
的解,且最优性能指标为: J *  x0 Px0
2
6.4 线性二次型最优控制

证明:必要条件:当系统用状态反馈 u * ( t )   K x ( t ) 实现了最优控制时,
要证明反馈矩阵 K  R  1 B T P ,其中𝑷为Riccati代数方程的解。

系统的哈密尔顿函数为: H ( x , u , λ , t )  1 x T Qx  1 u T Ru  λT Ax  λT Bu
2 2
H
由控制方程  0 可得: R u  B T λ  0
u
由于 R  0 ,故:u* (t )   R 1BT λ

要使最优控制具有 u * ( t )   K x ( t ) 的形式,协状态量必具有如下形式:

λ  Px ( t )
1 T 1 T
故:u (t )   R B λ   R B Px
*
6.4 线性二次型最优控制

由协状态变量和状态变量的关系𝝀 = 𝑷𝒙(𝒕)可得:𝝀ሶ = 𝑷𝒙(𝒕)



𝝏𝑯 𝝏𝚽
由协状态方程 𝝀ሶ = − 𝝀 𝒕𝒇 = 可得: 𝝀ሶ = − 𝑸𝒙 + 𝑨𝑻 𝝀 𝝀 ∞ =𝟎
𝝏𝒙 𝝏𝒙(𝒕𝒇 )
ሶ 𝒙(𝒕)
将𝝀、 ሶ 代入 𝝀ሶ = 𝑷𝒙(𝒕)
ሶ 有: − 𝑸𝒙 𝒕 + 𝑨𝑻 𝝀 = 𝑷(𝑨𝒙(𝒕) + 𝑩𝒖)

故有: − 𝑸𝒙 𝒕 + 𝑨𝑻 𝑷𝒙 𝒕 = 𝑷(𝑨𝒙(𝒕) − 𝑩𝑹−𝟏 𝑩𝑻 𝑷𝒙(𝒕))

[ A T P  P A  Q  P B R 1B T P ] x (t )  0
故可得: A T P  P A  Q  P B R  1 B T P  0
对上式取转置可知 𝑷𝑻 也满足该方程,故有:𝑷 = 𝑷𝑻
故当系统取得形如 u * ( t )   K x ( t ) 的最优控制时,必有 K  R  1 B T P
𝑷为Riccati矩阵代数方程的解。 必要性得证。
6.4 线性二次型最优控制

充分性:
𝑷为Riccati矩阵代数方程的解,𝒙(𝒕)为系统容许控𝒖(𝒕)作用下的状态,则对如下函数求导
x ( t ) T Px ( t )
𝒅
可得: (𝒙𝑻 𝒕 𝑷𝒙 𝒕 ) = 𝒙ሶ 𝑻 𝒕 𝑷𝒙 𝒕 + 𝒙𝑻 𝒕 𝑷𝒙ሶ 𝒕  ( Ax  Bu)T Px  x T P ( Ax  Bu)
𝒅𝒕

 x T AT Px  x T PAx  uT BT Px  x T PBu

 x T ( AT P  PA) x  uT BT Px  x T PBu

 x T ( Q  PBR 1BT ) x  uT BT Px  x T PBu

  x T Qx  uT Ru  uT Ru  x T PBRR 1R 1BT x  uT RR 1BT Px  x T PBRR 1u

  x T Qx  uT Ru  [u  R 1BT Px ]T R[u  R 1BT Px ]


6.4 线性二次型最优控制
对上式两边积分可得:
 
1 d T 1 1 T 1 T
       
T T T
( x Px ) dt { x Qx u Ru [ u R B Px ] R [ u R B Px ]}dt
2 0 dt 20

 
1 T 1 1
 x 0 Px 0    ( x Qx  u Ru ) dt   [ u  R 1 B T Px ]T R[ u  R 1B T Px ]dt
T T
2 20 20

1 T 1
J (u ())  x0 Px0   [ u  R 1BT Px ]T R[ u  R 1B T Px ]dt
2 20
1 T
故,当 u ( t )  R  1 B T Px  0 即:u ( t )   R B Px 时
1 T
目标函数取得极小值: J (u ())  x 0 Px0
*
2
由于 J * ( u ())  0 ,可得 P  0 充分性得证。 得证
6.4 线性二次型最优控制

2. 无限时间线性二次型最优调节器的设计步骤
(1). 根据工程经验和性能分析,确定权矩阵Q,R;

(2). 求解黎卡提方程 PA  A T P  Q  PBR  1 B T P  0

(3).计算反馈增益阵 K * 及最优控制 u * (t )

K * (t )  R  1 B T P 、 u * (t )   K * x * (t )
(4).计算最优状态轨迹

x * ( t )  Ax * ( t )  BR  1 B T Px * ( t ), x * ( 0 )  x 0

(5).计算最优目标函数值 1 T
J *  J (u * ())  x0 Px 0
2
6.4 线性二次型最优控制

例:给定线性定常系统
x1  x2 , x1 (0)  1
x2  u , x2 (0)  1
求最优反馈控制 u*使 
1
J   (4 x12  u 2 ) dt
20
取极小值.
解: 0 1  0  4 0
A  , B   , Q   0, R 1
0 0  1  0 0 

 P11 P12 
令 P
 P12 P22 
6.4 线性二次型最优控制

由Riccati代数方程:
AT P  P A  Q  P B R 1B T P

可得: 4 2
P  0
2 2

 4 2   x1 
故 u   R B Px    0 1 
* 1 T
     2 x1  2 x2
 2 2   x2 

1 T 1  4 2  1
J  x0 Px0  1 1 
*
   5
2 2  2 2  1
《现代控制理论》MOOC课程

6.5 动态规划法
6.5.1 多段决策问题与最优性原理

例:最优路线决策问题
从A城到B城的线路如下图所示,确定最优路径,使A城到B城的时间最短,其中线段
中的数字表示走这路程所需的时间。

P1 7 P2 2 P3
4
3
6 2
B
A
4 3
2
4

Q1 8 Q2 3 Q3
6.5.1 多段决策问题与最优性原理

解:方法一:穷举法
找出所有可能的行车路径,计算行走每一路径所需的时间,比较大小,得出最优路径。

共有4个路段,每个节点有二种选择,故共有8条路径。

2 n 1  2 4 1  8
计算 (4  1)2 n 1  24次加法得到行走每一路径所需的时间如下:
(1) AP1P 2 P 3B  16 (5) AQ1Q 2Q 3B  17
(2) AP1Q 2Q 3 B  14 (6) AQ1P 2 P 3 B  14
(3) AP1Q 2 P 3B  16 (7) AQ1P 2Q 3B  12
(4) AP1P 2Q 3 B  14 (8) AQ1Q 2 P 3 B  19
比较7次可得最优路径为(7),所需时间为12。
6.5.1 多段决策问题与最优性原理

对电力网络的节点编号优化问题:节点数3千个,则编号排序方式种类为:

3000!  4.149  10
9130

假定每种编号方式,计算新增元个数的计算时间为1ms

则每一种编号方式的新增元都计算出来需 1.316  109121年。


上次宇宙大爆炸的时间距今约在150亿年。

方法二:动态规划法(逆向分级计算法)
从终点开始,逐段向前逆推,依次计算出各节点至终点的最优值,确定最优路径。

只需进行 4( n  2)  2  10 次加法和6次比较可得最优路径。
6.5.1 多段决策问题与最优性原理

P1 7 P2 2 P3
4
3
6 2
B
A
4 3 2
4
Q 8 Q 3 Q
1 2 3

P1 7 P2 P3
11 4 4
4

6 2
A 12 B

4
2
4
5 2
8 3
Q1 Q2 Q3
6.5.1 多段决策问题与最优性原理

3 4 13

6 3 4
3 4 1
12 9

3 4 1 6
3 3
2 1 3 3 3
12 8
3
2 1 3 3 3
1 2 4 4 1
A 1 B
13 5
11
4 1
7 A 1 1 2 4 B
2 4 2
9
7 2 1
5 6 12 2 4

5 3
13 6

9
6.5.1 多段决策问题与最优性原理

动态规划法得特点:

(1)与穷举法相比,计算量大大减少。

(2)将多段决策问题转换为多个单段决策问题处理。

(3)多段决策的最优策略遵循最优性原理,即:
不论初始状态和初始决策如何,当把其中任何一级作为初始级和初始状态时,余下的决

策对此仍然是最优决策。也就是说一个最优过程的任何最后一段过程都是最优的,或者
说最优路径上任一节点至终点的路径必定也是最优的。
《现代控制理论》MOOC课程

6.5.2 离散系统动态规划
6.5.2 离散系统动态规划

一. 离散系统动态规划的数学描述:

给定有n阶离散系统:x k  1  f ( x k , u k ), k  0,1, , N 1

状态初值: x (0)  x 0
控制约束: g [ x k , u k ]  0

寻求一个最优控制序列 u k*   ( k  0,1, , N  1)
N 1
使性能指标: J  [ x N ]   L[ x k , u k ]
k 0
取得极小值。
6.5.2 离散系统动态规划

二. 动态规划递推方程:

给定初值:x (0)  x 0 ,
寻求一个最优控制序列 u k*   ( k  0,1, , N  1) 使性能指标取得极小值。


𝑢0∗ 𝑢1∗ 𝑢𝑘∗ 𝑢𝑁−1
𝑥0 𝑥1 𝑥2 𝑥𝑘 𝑥𝑘+1 𝑥𝑁−1 𝑥𝑁
1 2 ⋯ 𝑘+1 ⋯ 𝑁

控制过程顺序

动态规划法依据最优性原理进行逆向分级计算

第𝑁步 第𝑁 − 1步 第𝑁 − 𝑘步 第1步

求𝑢0∗ 求𝑢1∗ 求𝑢𝑘∗ 求𝑢𝑁−1
⋯ ⋯
使𝐽𝑁∗ [𝑥0 ]

使𝐽𝑁−1 [𝑥1 ] ∗
使𝐽𝑁−𝑘 [𝑥𝑥 ] 使𝐽1∗ [𝑥𝑁−1 ]

动态规划法求解顺序
6.5.2 离散系统动态规划
性能指标:
N 1
J  [ x N ]   L[ x k , u k ]
k 0 𝑁−2 𝑁−2

= Φ 𝑥𝑁 + 𝐿 𝑥𝑁−1 , 𝑢𝑁−1 + ෍ 𝐿[𝑥𝑘 , 𝑢𝑘 ] = 𝐽1 𝑥𝑁−1 + ෍ 𝐿[𝑥𝑘 , 𝑢𝑘 ]


𝑘=0 𝑘=0

其中 𝐽1 𝑥𝑁−1 = Φ 𝑥𝑁 + 𝐿 𝑥𝑁−1 , 𝑢𝑁−1 = 𝐽0 𝑥𝑁 + 𝐿 𝑥𝑁−1 , 𝑢𝑁−1

第一计算步:𝐽∗ 𝑥𝑁−1 = min{𝐽0 𝑥𝑁 + 𝐿 𝑥𝑁−1 , 𝑢𝑁−1 }


1

𝑥𝑁 = 𝑓(𝑥𝑁−1 , 𝑢𝑁−1 )
𝑁−3 𝑁−3

𝐽 = 𝐽1 𝑥𝑁−1 + 𝐿 𝑥𝑁−2 , 𝑢𝑁−2 + ෍ 𝐿[𝑥𝑘 , 𝑢𝑘 ]= 𝐽2 𝑥𝑁−2 + ෍ 𝐿[𝑥𝑘 , 𝑢𝑘 ]


𝑘=0 𝑘=0

其中 𝐽2 𝑥𝑁−2 = 𝐽1 𝑥𝑁−1 + 𝐿 𝑥𝑁−2 , 𝑢𝑁−2


6.5.2 离散系统动态规划

第二计算步:𝐽∗ 𝑥𝑁−2 = min{𝐽1 𝑥𝑁−1 + 𝐿 𝑥𝑁−2 , 𝑢𝑁−2 }


2

𝑥𝑁−1 = 𝑓(𝑥𝑁−2 , 𝑢𝑁−2 )

𝑘−1

𝐽 = 𝐽𝑁−𝑘 𝑥𝑘 + ෍ 𝐿[𝑥𝑘 , 𝑢𝑘 ] 其中 𝐽𝑁−𝑘 𝑥𝑘 = 𝐽𝑁−𝑘−1 𝑥𝑘+1 + 𝐿 𝑥𝑘 , 𝑢𝑘


𝑘=0


第N-k计算步: 𝐽𝑁−𝑘 𝑥𝑘 = min{𝐽𝑁−𝑘−1 𝑥𝑘+1 + 𝐿 𝑥𝑘 , 𝑢𝑘 }
𝑥𝑘+1 = 𝑓(𝑥𝑘 , 𝑢𝑘 )

有了第一个计算步和第N-k个计算步的优化计算方程,就可以递推计算出最优控制序列和
最优状态轨迹。把这个递推计算方程称为动态规划递推方程。
6.5.2 离散系统动态规划

例:设一阶离散系统,状态方程和初始条件为:
x k 1  x k  u k , x (0)  x 0
N 1
性能指标为 J x N2   ( xk2  u k2 )
k 0
求当N=2时的最优控制决策序列和最优轨迹序列。

解:当N=2时,求 u * (0)、 u * (1) 和 x * (1)、 x * (2)


考虑系统在 u (1)控制下由 x (1)转移到 x (2) ,则有

x (2)  x (1)  u (1)


J1[ x (1)]  x 2 (2)  x 2 (1)  u 2 (1)  [ x (1)  u (1)]2  x 2 (1)  u 2 (1)
 2 x 2 (1)  2 x (1)u (1)  2u 2 (1)
6.5.2 离散系统动态规划

为使 J 1 [ x (1)] 为极小,故有:
 J1[ x (1)]
 2 x (1)  4 u (1)  0
 u (1)
得: u (1)   1 x (1)
2
最优目标
1 1 3
J 1[ x (1)]  2 x 2 (1)  2 x (1) x (1)  2(  x (1)) 2  x 2 (1)
2 2 2
进一步求上一级决策:
3 2
J 2 [ x (0)]  x (0)  u (0) 
2 2
J1*[ x (1)]  x (0)  u (0)  x (1)
2 2
2
3
 x 2 (0)  u 2 (0)  [ x (0)  u (0)]2
2
6.5.2 离散系统动态规划

可得:  J 2 [ x (0)]  2 u (0)  3[ x (0)  u (0)]  5u (0)  3 x (0)  0


 u (0)
3
u (0)   x (0)
5
3 8
故最优性能指标为: J *  J 2 [ x (0)]  x 2 (0)  u 2 (0)  [ x (0)  u (0)] 2  x 2 (0)
2 5
最优控制序列为:
3
u (0)   x (0)
5
1 1 1 3 1
u (1)   x (1)   ( x (0)  u (0))   ( x (0)  x (0))   x (0)
2 2 2 5 5
3 2
最优轨迹为: x (0)、 x (1)  x (0)  u (0)  x (0)  x (0)  x (0)
5 5
2 1 2 1 1
x (2)  x (1)  u (1)  x (0)  x (1)  x (0)  x (0)  x (0)
5 2 5 5 5
《现代控制理论》MOOC课程

6.5.3 连续系统动态规划
6.5.3 连续系统动态规划

一. 连续动态规划的数学描述

给定连续系统状态方程: x  f [ x, u , t ]
初始状态: x (t0 )  x0

终端约束: g[ x(t f ), t f ]  0
求最优控制 u * ( t ), u  U ,使如下性能指标取极小值:

 tf
J [ x0 , t ]  min  ( x ( t f ))   L ( x , u , t ) dt
t0 
6.5.3 连续系统动态规划

二. 连续动态规划方程

 由最优性原理:如果对于初始时刻𝑡0 和初始状态𝑥0 ,𝑢∗ (𝑡)和𝑥 ∗ (𝑡) 是系统的最优控制


和相应的最优轨迹,那么对任一时刻𝑡1 (𝑡0 < 𝑡1 < 𝑡𝒇 ) 的控制𝑢∗ (𝑡1 )和状态𝑥 ∗ (𝑡1 ),它
们仍然是系统在𝑡 > 𝑡1 以后直到𝑡𝒇 这一时间的最优控制和最优轨迹。

引进记号 V ( x , t )

V ( x , t )  J [ x * ( t ), u * ( t )]  min J ( x ( t ), u ( t ))
uU
表示以𝑡时刻状态𝑥(𝑡)作初始条件所得到的最优性能指标。

 tf
则有:V ( x (t ), t )  min  ( x (t f ))   L( x(t ), u(t ), t )dt
uU t 
6.5.3 连续系统动态规划


V ( x (t ), t )  min
uU
t t
t
L( x (t ), u(t ), t )dt  
tf
t t
L( x (t ), u(t ), t )dt  ( x(t f )) 
 min    L( x(t), u(t), t)dt  ( x(t ))
t t tf
L( x (t ), u(t ), t )dt  min f
uU t uU t t

 min  L( x (t ), u(t ), t )dt  V ( x (t  t ), t  t )


t t
uU t

其中: V ( x (t   t ), t   t )  min
 L ( x(t ), u (t ), t )dt   ( x(t ))
uU
tf
t  t f

用泰勒级数展开可得:
T
  V  dx V
V ( x (t   t ), t   t )  V ( x (t ), t )     t   t  o (  t ) 2
  x  dt t
6.5.3 连续系统动态规划
由中值定理:
t  t
t L ( x ( t ), u ( t ), t ) dt  L ( x ( t    t ), u ( t    t ), t    t )  t
其中: 0    1

则有:
T
 V  dx V
V ( x (t ), t )  min L( x (t  t ), u(t  t ), t  t ) t  V ( x (t ), t )    t  t  o ( t ) 2
uU  x  dt t

 V    V 
T
dx o (  t ) 2

可得:   min  L ( x (t    t ), u (t    t ), t    t )   
 
t uU 
   x  dt  t 
令: t  0
  
T 
可得:   min  L ( x (t ), u (t ), t )  
V V ( x , t ) 
f ( x, u , t )  连续系统动态规划方程
 
t uU 
  x  
6.5.3 连续系统动态规划

V
令:  ( t )  ,则动态规划方程可表示为:
x
V
t uU
 T
uU

  min L ( x , u , t )   f ( x , u , t )   min H ( x ,  , u , t )
*

即系统要取得极值,必须要满足极小值原理。
可以证明当系统取得最优控制时,协状态方程成立:
 H
  
 x

  [ x (t f ), t f ]   g [ x (t f ), t f ] 
T
 (t )     
 f  x (t f )   x (t f ) 
    
 g [ x (t ), t ]  0
 f f
  [ x (t f ), t f ]   g [ x (t f ), t f ] 
 H [ x (t f ), u (t f ), t f ]     T  0
  t f   t f 
    
6.5.3 连续系统动态规划

系统取得最优控制的必要条件为:

状态方程: x  f [ x, u , t ] x (t0 )  x0
 H
协状态方程   
 x

  [ x (t f ), t f ]   g [ x (t f ), t f ] 
T
 (t )     
 f  x (t f )   x (t f ) 
    
 g [ x (t ), t ]  0
 f f
  [ x (t f ), t f ]   g [ x (t f ), t f ] 
 H [ x (t f ), u (t f ), t f ]     T  0
  t f   t f 
    

动态规划方程
V
t uU
 uU

  min L ( x , u , t )  T f ( x , u , t )   min H ( x* ,  , u , t )
第六章 最优控制

第六章 小结

 最优控制问题就是求解一类带有约束的泛函极值问题;

 有约束的泛函极值问题是通过引入拉格朗日乘子向量转换为无约束的泛函极值问题;

 泛函极值存在的必要条件为泛函的变分为零。

 求解泛函极值问题有三种方法:经典变分法、极小值原理和动态规划法

 时间最优控制,线性二次型最优控制是极小值原理和经典变分法在特殊情况下的应用。

You might also like