Professional Documents
Culture Documents
王建全
浙江大学电气工程学院
绪论
课程简介
什么是自动控制理论
自动控制理论的两个基本主题
自动控制理论的发展
本课程的基本内容
学习本课程的目的
绪论
0.1 课程简介
《状态空间法》
《现代控制理论》 《最优控制理论》
0.2 自动控制理论
分析和 综合 的理论,其研究的目的
控制理论是关于自动控制系统结构、
是为了分析并改进动态系统的性能,以达到期望的要求。
建立系统的数学模型;用尽可能精确、合理的数学语言去描述
结构
动态系统。
绪论
0.2 自动控制理论
定量分析: 在特定输入下研究系统输出的运动规律;
分析
𝜎𝑝
𝑡𝑠
绪论
0.2 自动控制理论
定量分析: 在特定输入下研究系统输出的运动规律;
分析
定性分析: 能控性、能观性、稳定性;
综合 改变原有系统的运动规律,使系统满足给定的动态性能标的要求。
绪论
0.3 自动控制领域中两个基本主题
反馈控制的概念 最优控制的概念
反馈控制是利用系统的输出量与参考输入量的
偏差进行控制,能够在存在扰动的情下减少系统
的输出量与参考输入量之间的偏差。
例如: PID励磁系统
绪论
0.3 自动控制领域中两个基本主题
最优控制的概念
最优控制,就是要寻找一个容许控制,使得被控系统在满足各种约束
条件下,使给定的性能指标达到最优值。
例如:最优励磁系统
绪论
0.3 自动控制领域中两个基本主题
反馈与最优
绪论
0.3 自动控制领域中两个基本主题
反馈与最优
绪论
0.4 自动控制理论的发展
1788年J.Watt发明了蒸汽机用的离心式飞摆调速器;
1868年J.C.Maxwell发表了“论调速器”的论文;
1875年E.J.Routh、1895年A.Hurwitz先后提出了系统稳定性的代数判据。
绪论
0.4 自动控制理论的发展
1892年A.M.Lyapunov在其博士论文《论运动稳定性的一般问题》中,
建立了关于稳定性理论的完整体系;
1932年H.Nyquist提出了根据频率响应判断系统稳定性的判据;
1945年H.W.Bode提出了基于频率响应的分析与综合方法.
1948年W.R.Evans提出了控制系统分析与设计的根轨迹法。
☆ 1948年N.Wiener出版了专著《控制论-关于在动物和机器中控制和通讯
的科学》,系统地论述了控制理论的一般原理和方法,推广了反馈的概念,
创立了控制理论,标志着经典控制理论的诞生。
绪论
0.4 自动控制理论的发展
1948年
维纳创立《控制论》
绪论
0.4 自动控制理论的发展
1956年
1788年 1960年
1788年 1961年
1788年
动态规划法
调速器装置 状态空间法
调速器装置 极大值原理
调速器装置
1788年
现代控制理论
调速器装置
绪论
0.4 自动控制理论的发展
1956年R.Bellman提出了寻求最优控制的动态规划法。
1960年R.E.Kalman引入了状态空间法,提出了能控性、能观性、最优调
节器和卡尔曼滤波等概念。
1961年Pontryagin提出了最优控制的极大值原理。
绪论
0.4 自动控制理论的发展
经 以单变量线性定常系统为主要研究对象;
典
控
制 以频域法为研究控制系统动态特性的主要方法;
理
论 以各种图表,如Bode图、Nyquist曲线、根轨迹等
特
点 为系统分析和综合的主要工具。
绪论
0.4 自动控制理论的发展
现 以多变量线性、非线性系统为主要研究对象;
代
控 以时域法,特别是以状态空间法为主要研究方法;
制 以现代数学为主要分析手段;
理
论 以计算机为主要分析和设计工具;
特 研究内容线性系统理论、非线性系统理论、最优控制、鲁棒控制
点 自适应控制、大系统理论,深度学习、智能控制等。
绪论
0.5 本课程的基本内容
1 状态空间表达式 结构
2 状态空间表达式的解 定量分析
3 控制系统的能控、能观性 定性分析
4 稳定性和李亚普诺夫方法 定性分析
5 极点配置、镇定、解耦 综合
6 最优控制 综合
第一讲 绪论
1.6 学习本课程的目的
掌握现代控制理论的基本理论及其应用方法
学会用数学语言描述动态系统的方法
学会用数学工具分析改善动态系统性能的方法
培养用数学语言解决工程问题的能力
《现代控制理论》MOOC课程
第一章 控制系统的状态空间表达式
第一章 控制系统的状态空间表达式
状态空间变量及状态空间表达式
状态空间表达式的建立
状态向量的线性变换
从状态空间表达式求传递函数
组合系统的状态空间表达式
离散系统、 时变系统和非线性系统
的状态空间表达式
第一章 控制系统的状态空间表达式
经典控制理论: Y(s)
数学模型:传递函数 G( s )
U( s )
u y
G(s)
传递函数的定义
线性定常系统的传递函数是指在初始状态为零的条件下,系统输出变
量的拉氏变换与输入变量的拉氏变换之比。
𝑌(𝑠)
𝐺(𝑠) =
𝑈(𝑠)
第一章 控制系统的状态空间表达式
经典控制理论: Y(s)
数学模型:传递函数 G( s )
U( s )
u y
G(s)
现代控制理论:
u y
X
数学模型:状态空间表达式
《现代控制理论》MOOC课程
1.1 状态空间变量及状态空间表达式
1.1 状态空间变量及状态空间表达式
一 . 状态变量
足以完全表征系统运动状态的最少个数的一组变量,称为状态变量。
R1 L1 L2
已知:
i1 (t ) i2 (t )
i1 (t0 ), i2 (t0 ), uc (t0 )
u(t ) uc (t ) C R2
u (t )
1.1 状态空间变量及状态空间表达式
一 . 状态变量
体现在减少变量个数就不能够完全表征系统的动态行为,
最小性
而增加变量的个数则是完全表征系统动态行为所不需要的。
R1 L1 L2
i1 (t ) i2 (t ) i1 (t ), i2 (t ), uc (t )
u(t ) uc (t ) C R2
i (t ) duc (t )
c ic (t ) C
dt
1.1 状态空间变量及状态空间表达式
关于状态变量的几点说明
状态变量是相互独立的。
对于一个实际的物理系统,状态变量个数等于系统中独立储能元件的个数。
对同一个动态系统,状态变量的选取不是唯一的,但状态变量的个数是唯一确定的,
不能多,也不能少。
R1 L1 L2
状态变量1: i1 (t ), i2 (t ), uc (t )
i1 (t ) i2 (t )
u(t ) uc (t ) C R2
状态变量2: i1 (t ), i2 (t ), ic (t )
1.1 状态空间变量及状态空间表达式
二 . 状态向量
由系统状态变量构成的向量,称为系统的状态向量。
的向量就称为系统的状态向量。
x1 𝑡
x 𝑡 𝒙 = 𝑥1 𝑡 𝑥2 𝑡 ⋯ 𝑥𝑛 𝑡
𝒙= 2 或
⋮
𝑥𝑛 𝑡
1.1 状态空间变量及状态空间表达式
三 . 状态空间
以状态向量的每一个分量𝑥1 𝑡 , 𝑥2 𝑡 , ⋯ , 𝑥𝑛 𝑡 为坐标轴所构成的空间,称为状态空间。
x2
x(t)
x1
x3
系统任一时刻的状态均可表示为状态空间中的一个点。
系统状态随时间变化的过程,在状态空间中描绘出一条轨迹,称为状态轨迹。
1.1 状态空间变量及状态空间表达式
四. 状态方程
由系统状态变量构成的描述系统动态过程的一阶微分方程组,称为系统的状态方程。
状态方程用于描述系统输入引起系统状态变化的动态过程 。
𝒖 𝒚
𝒙
状态方程的一般形式为:𝒙ሶ =A𝒙 + 𝑩𝒖
1.1 状态空间变量及状态空间表达式
五. 输出方程
在指定系统输出𝒚 的情况下,输出𝒚向量与状态向量𝒙及系统输入𝒖向量的函数关系
式,称为系统的输出方程 。
系统的状态和输入决定了系统输出的变化 。
𝒖 𝒙 𝒚
系统输出方程的一般形式为: 𝒚 = 𝑪𝒙 + 𝑫𝒖
1.1 状态空间变量及状态空间表达式
六 . 状态空间表达式
状态方程和输出方程总和起来,构成对一个系统的完整动态描述,称为系统的
状态空间表达式。
A∈ 𝑹𝒏×𝒏 ,表征了系统内部状态的联系,称为系统矩阵;
B∈ 𝑹𝒏×𝒓 ,表征了输入对状态的作用,称为控制矩阵;
C ∈ 𝑹𝒎×𝒏 ,表征了输出与状态变量的关系,称为输出矩阵;
D∈ 𝑹𝒎×𝒓 ,表征了输出与输入的关系,称为直接传输矩阵;
1.1 状态空间变量及状态空间表达式
关于状态空间表达式的几点说明
𝒙ሶ =A𝒙 + 𝑩𝒖 𝑫
𝒚 = 𝑪𝒙 + 𝑫𝒖 +
𝒖 + 𝒙ሶ 𝒙 + y
𝑩 න 𝑪
+
𝑨
状态空间表达式可以用系统方框图描述;
输入引起系统状态的变化,而状态和输入则决定了输出的变化;
状态空间表达式的方框图,只含有比例、积分、加法三类基本环节;
在输出方程中,若无特殊声明,均不考虑输入向量的直接传输,即令D=0;
1.1 状态空间变量及状态空间表达式
小结
状态变量、状态向量、状态空间、状态轨迹、状态空间表达式的定义;
状态变量是相互独立的,从数学上来看是线性无关的。
对同一个动态系统,状态变量的个数是唯一确定的,但是状态向量的选取可以
有无穷多种;
对于一个实际的物理系统,状态变量个数等于系统中独立储能元件的个数。
状态空间表达式的方框图,只含有比例、积分、加法三类基本环节;
《现代控制理论》MOOC课程
1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
建立系统状态空间表达式的三种方法
一. 根据系统的方框图列写
二. 从系统的基本原理进行推导
三. 根据传递函数或高阶微分方程实现
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
方框图法的基本步骤
𝝎𝟐𝒏
二阶振荡环节 𝑮 𝒔 =𝟐
𝒔 +𝟐𝝎𝒏 𝝃𝒔+𝝎𝟐𝒏
𝑻𝒄 𝒔
惯性微分环节 𝑮 𝒔 =
𝑻𝒅 𝒔+𝟏
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
方框图法的基本步骤
比例
惯性微分环节
状态空间表达式方 积分
框图法的基本环节
加法
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
方框图法的基本步骤
1. 方框图变换,将系统方框图中的各环节变换为只包含比例、积分和加法环节的方框图;
2. 选取状态变量,将每一个积分器的输出选作一个状态变量;
3. 根据方框图各环节的关联关系,列写状态空间表达式;
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
例: 已知系统的模拟结构图如下,建立其状态空间表达式
𝒖(𝒔) 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
𝑲𝟏
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −
𝑲𝒏
𝒔
解: 1. 传递函数变换
𝑲𝟏
න
𝟏 𝑲𝒑 +
𝑲𝟏 𝑲𝟏 𝟏 𝑲𝟏 𝑲𝟏 −
= = 𝒔
𝑲𝒑 𝒔 + 𝑲𝟏 𝑲𝒑 𝑲 𝑲𝒑 𝟏 + 𝑲𝟏 ∙ 𝟏 𝑲𝒑 𝒔 + 𝑲𝟏
𝒔 + 𝑲𝟏
𝒑 𝑲𝒑 𝒔 𝑲𝟏
惯性环节 𝑲𝒑
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
例: 已知系统的模拟结构图如下,建立其状态空间表达式
𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −
𝑲𝒏
𝒔
解: 1. 传递函数变换
𝑲𝟏 න
+
𝑲𝒑 𝒔 + 𝑲𝟏 𝟏 𝑲𝒑 𝒔 + 𝑲𝟏
+
= 𝑲𝒑 + 𝑲𝟏 𝒔
𝒔 𝒔
PI环节 𝑲𝑷
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
例: 已知系统的模拟结构图如下,建立其状态空间表达式
𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −
𝑲𝒏
𝒔
解: 1. 传递函数变换
𝟏 𝟏 න
𝑱𝟏 𝒔 𝑱𝟏
积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
例: 已知系统的模拟结构图如下,建立其状态空间表达式
𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −
𝑲𝒏
𝒔
解: 1. 传递函数变换
𝑲𝒏
න 𝑲𝒏
𝒔
积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
例: 已知系统的模拟结构图如下,建立其状态空间表达式
𝒖(𝒔) 𝑲𝟏 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝟏 𝑲𝒃 𝜽(𝒔)
+ 𝑲𝒑 𝒔 + 𝑲𝟏 + 𝒔 𝑱𝟏 𝒔 𝑱𝟐 𝒔𝟐
− − −
𝑲𝒏
𝒔
解: 1. 传递函数变换
𝑲𝒃 𝑲𝒃
න න
𝑱𝟐 𝒔𝟐 𝑱𝟐
重积分环节
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
解: 1. 传递函数变换
𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −
𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑
2. 选取状态变量
每个积分器的输出选做一个状态变量,共6个状态变量:
𝒙𝟏 , 𝒙𝟐 , ⋯ , 𝒙𝟔
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
解:
𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −
𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑
3. 列写状态方程
𝟏 𝟏 𝑲𝒑 𝟏 𝑲𝒑
𝒙ሶ 𝟏 = 𝒙𝟐 𝒙ሶ 𝟒 = ((𝒙𝟓 +𝑲𝒑 (𝒙𝟔 − 𝒙𝟒 )) −𝒙𝟑 )= − 𝒙 − 𝒙 + 𝒙 + 𝒙
𝑱𝟏 𝑱𝟏 𝟑 𝑱𝟏 𝟒 𝑱𝟏 𝟓 𝑱𝟏 𝟔
𝑲𝒃
𝒙ሶ 𝟐 = 𝒙𝟒 𝒙ሶ 𝟓 = 𝑲𝟏 (𝒙𝟔 − 𝒙𝟒 ) = −𝑲𝟏 𝒙𝟒 + 𝑲𝟏 𝒙𝟔
𝑱𝟐
𝑲𝟏 𝑲𝟏 𝑲𝟏 𝑲𝟏 𝑲𝟏
𝒙ሶ 𝟑 = 𝑲𝒏 𝒙𝟒 𝒙ሶ 𝟔 = (𝒖 𝒔 − 𝒙𝟏 ) − 𝒙 =− 𝒙 − 𝒙 + u(s) 𝜽(𝒔) = 𝒙𝟏
𝑲𝒑 𝑲𝒑 𝟔 𝑲𝒑 𝟏 𝑲𝒑 𝟔 𝑲𝒑
1.2 状态空间表达式的建立
一. 从系统方框图出发建立状态空间表达式
𝒖(𝒔) 𝑲𝟏 𝒙ሶ 𝟔 𝒙𝟔 𝒙ሶ 𝟓 න 𝒙𝟓 𝟏 𝒙ሶ 𝟒 𝒙𝟒 𝑲𝒃 𝒙ሶ 𝟐 𝒙𝟐 𝒙𝟏 𝜽(𝒔)
න 𝑲𝟏 න න න
+ 𝑲𝒑 + + + + 𝑱𝟏 𝑱𝟐 𝒙ሶ 𝟏
− − − + −
𝑲𝟏 𝒙𝟑 𝒙ሶ 𝟑
𝑲𝑷 න 𝑲𝒏
𝑲𝒑
状态空间表达式 𝟎 𝟏 𝟎
𝟎 𝟎 𝟎
𝑲𝒃
𝒙ሶ 𝟏 𝟎 𝟎 𝒙𝟏 𝟎
𝟎 𝟎 𝟎 𝑱𝟐
𝒙ሶ 𝟐 𝒙𝟐 𝟎
𝟎 𝟎 𝟎 𝑲𝒑 𝟎 𝟎 𝟎
𝒙ሶ 𝟑 𝒙𝟑
状态方程 = 𝟏
−
𝑲𝒑 𝟏 𝑲𝒑
𝒙𝟒 + 𝟎 u(s)
𝒙ሶ 𝟒 𝟎 𝟎 −
𝑱𝟏 𝑱𝟏 𝑱𝟏 𝑱𝟏 𝒙𝟓 𝟎
𝒙ሶ 𝟓 𝟎 𝟎 𝟎 −𝐾1 𝟎 𝐾1 𝑲𝟏
𝒙𝟔
𝒙ሶ 𝟔 𝑲 𝑲𝟏 𝑲𝒑
− 𝟏 𝟎 𝟎 𝟎 𝟎
𝑲𝒑 𝑲𝒑
输出方程 𝜽(𝒔) = 𝒙𝟏
《现代控制理论》MOOC课程
1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式
状态变量的选取
对于实际物理系统,状态变量的个数等于系统中独立储能元件的个数,因此在列写
状态方程时可对每一个独立储能元件指定一个变量作为状态变量。
基本方法
根据具体的控制系统,应用其物理规律,列写出描述系统动态过程的一阶微分方程
组,写成矩阵的形式,即得到系统的状态方程。
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式
例1:有电路如下图所示。列写以电压𝒖(𝒕)为输入量,以电阻 𝑹𝟐 上的电压作为输出的状态
空间表达式。
解: 𝑅1 𝐿1 𝑎 𝐿2
1. 选取状态变量 𝑥1 = 𝑖1 𝑥2 = 𝑖2 𝑥3 = 𝑢𝑐
𝑖 (𝑡) 𝑖1 (𝑡) 2
C
2.建立状态方程
u( t ) 𝑙1 𝑢𝑐 (𝑡) 𝑅2
由基尔霍夫电压定理 𝑙2
回路1: 𝑢 − 𝑅1 𝑥1 − 𝐿1 𝑥ሶ 1 − 𝑥3 =0
状态空间表达式: 𝑅1 1
− 0 −
回路2: 𝑥3 − 𝐿2 𝑥ሶ 2 − 𝑅2 𝑥2 =0 𝑥ሶ 1 𝐿1 𝐿1 𝑥1 1
𝑅2 1
𝑥ሶ 2 = 0 − 𝑥2 + 0 u
𝐿2 𝐿2
𝑥ሶ 2 𝑥3 0
由基尔霍夫电流定理 1
−
1
0
𝐶 𝐶
节点a: 𝑥1 − 𝑥2 − 𝐶 𝑥ሶ 3 =0 𝑦 = 𝑅2 𝑥2
1.2 状态空间表达式的建立
二. 从系统的机理出发建立状态空间表达式
对于M1: 𝑓1 − 𝐾1 𝑥1 − 𝑥2 − 𝐵1 𝑥3 − 𝑥4 =𝑀1 𝑥ሶ 3
状态空间表达式:
0 0 1 0
𝑥ሶ 1 𝑥1 0 0
0 0 0 1
𝑥ሶ 2 𝐾 𝐾1 𝐵 𝐵1 𝑥2 0 0 𝑓1
= − 1 − 1 𝑥3 + 1 0
𝑥ሶ 3 𝑀1 𝑀1 𝑀1 𝑀1
𝑀1 1 𝑓2
𝑥ሶ 4 𝐾1 𝐾 +𝐾 𝐵1 𝐵 +𝐵 𝑥4
− 1 2 − 1 2 0 𝑀1
𝑀2 𝑀2 𝑀2 𝑀2
𝑥1
𝑦1 0 0 1 0 𝑥2
=
𝑦2 0 0 0 1 𝑥3
𝑥4
《现代控制理论》MOOC课程
1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式
控制系统的外
控制系统的外部描述
部描述
描述控制系统的外部特征,即描述系统的输入、输出关系。
控制系统的内部描述
不仅可以描述系统的输入输出关系,而且还能够揭示出系统内部各变量的关联关系。
外部描述 内部描述
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式
实现问题 由输入输出描述确定状态空间描述的问题称为实现问题。
即若对于单输入、单输出的线性定常系统,已知描述系统动态过程的微分方程为:
或传递函数 :
𝑌(𝑠) 𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0
𝑊(𝑠) = = 𝑛 𝑚≤𝑛
𝑈(𝑠) 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
求出状态空间表达式 : 𝒙ሶ = 𝑨𝒙 + 𝑏𝑢
y = 𝑪𝒙 + 𝑑𝑢
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式
关于实现问题的说明
实现存在的条件: 𝑚 ≤ 𝑛
1.2 状态空间表达式的建立
解释
说明
当m<n ,输入输出之间不存在比例关系,D=0 。
𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0 𝑏ത𝑛−1 𝑠 𝑛−1 +⋯+𝑏ത1 𝑠+𝑏ത0
当m=n, Y(s)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠) + 𝑏𝑛 𝑈(𝑠)
𝑛−1 1 0 𝑛−1 1 0
输入输出之间存在比例关系,D=𝑏𝑛 。
当m>n,假定m=n+1:
𝑏𝑛+1 𝑠 𝑛+1 +𝑏𝑛 𝑠 𝑛 +⋯+𝑏1 𝑠+𝑏0 𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0
Y(s)= 𝑠𝑛+𝑎 𝑠𝑛−1+⋯+𝑎 𝑠+𝑎 𝑈(𝑠) =𝑛 𝑈 𝑠 + 𝑏ത𝑛 𝑈 𝑠 + 𝑏𝑛+1 𝑠𝑈(𝑠)
𝑛−1 1 0 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
输入输出之间存在微分关系。若要表述这一关系,则输出方程为:
y=C𝑥 + D𝑢 + E𝑢ሶ
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式
关于实现问题的说明
实现存在的条件: 𝑚≤𝑛
当 𝑚 < 𝑛 时,直接传输矩阵D=0 ;
当m>n ,输出将含有输入信号的直接微分项。这在实际系统中是不允许的,状态空
间表达式也无法表示。
实现的非唯一性;
会有无穷多个状态空间表达式,实现给定的输入输出关系。
没有零极点对消的传递函数的实现称为最小实现。
因为没有零、极点对消的传递函,求得的状态空间表达式的阶数是最小的。
《现代控制理论》MOOC课程
1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
三. 依据传递函数或高阶微分方程建立状态空间表达式
单输入单输出系统实现方法一
由系统的传递函数可得:
𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0
𝑌(𝑠) = 𝑛 𝑈(𝑠) 𝑚≤𝑛
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
1. 当 𝑚 < 𝑛
1
引入中间变量 ෨
𝑌(𝑠) = 𝑈(𝑠)
𝑠 𝑛 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
进而可得 ෨
𝑌(𝑠)(𝑠 𝑛+𝑎
𝑛−1 𝑠 𝑛−1 + ⋯ + 𝑎 𝑠 + 𝑎 )=𝑈(𝑠)
1 0
෨
𝑌 𝑠 = 𝑌(𝑠) (𝑏𝑚 𝑠 𝑚 + 𝑏𝑚−1 𝑠 𝑚−1 + ⋯ + 𝑏1 𝑠 + 𝑏0 )
1.2 状态空间表达式的建立
拉氏微分定理
𝑛
𝑑 𝑛 𝑓(𝑡)
拉氏微分定理: 𝐿 = 𝑠 𝑛 𝐹 𝑠 − 𝑠 𝑛−𝑘 𝑓 𝑛−𝑘 (0)
𝑑𝑡 𝑛
𝑘=1
当初始条件为0时:
𝑑 𝑛 𝑓(𝑡) 𝑛𝐹 𝑠
𝐿 = 𝑠
𝑑𝑡 𝑛
拉氏反变换: 𝑑𝑛 𝑓(𝑡)
𝐿−1 𝑠 𝑛 𝐹 𝑠 = 𝑛
=𝑓 𝑛 (𝑡)
𝑑𝑡
1.2 状态空间表达式的建立
取拉式反变换可得:
𝑦 =𝑏𝑚 𝑦 (𝑚) + 𝑏𝑚−1 𝑦 (𝑚−1) + ⋯ + 𝑏1 𝑦 1
+ 𝑏0 𝑦 (1)
状态空间表达式: 𝑥ሶ 1 0 1 0 ⋯ 0 𝑥1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 0
⋮ = ⋮ ⋮ ⋮ ⋱ 0 ⋮ + ⋮ u
𝑥ሶ 𝑛−1 0 0 0 … 1 𝑥n−1 0
𝑥ሶ 𝑛 −𝑎0 −𝑎1 −𝑎2 … −𝑎n−1 𝑥𝑛 1
𝑦 = 𝑏0 ⋯ 𝑏𝑚 0 ⋯ 0𝒙
特点:
系统矩阵A的前n-1行为次对角单位阵,最后一行由传递函数分母的系数,也就是系统
特征多项式的系数取相反号组成。
输入矩阵b,最后一个元素为1,其余元素均为0。
能控标准I型。
1.2 状态空间表达式的建立
2. 当 𝑚 = 𝑛
𝑏𝑚 𝑠 𝑚 +𝑏𝑚−1 𝑠 𝑚−1 +⋯+𝑏1 𝑠+𝑏0 𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0
𝑌(𝑠) = 𝑛 𝑈(𝑠) = 𝑛 𝑈(𝑠)
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0 𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
1
引入中间变量 ෨
𝑌(𝑠) = 𝑈(𝑠)
𝑠 𝑛 +𝑎𝑚−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
෨
将中间变量𝑌(𝑠) 代入(1)式可得
෨
Y(s)= 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝑠 𝑛−1 + ⋯ + (𝑏1 −𝑏𝑛 𝑎1 )𝑠 + (𝑏0 −𝑏𝑛 𝑎0 ) 𝑌(𝑠) +𝑏𝑛 𝑈(𝑠)
1.2 状态空间表达式的建立
取拉氏反变换
𝑦 = 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝑦 𝑛−1 + ⋯ + (𝑏1 −𝑏𝑛 𝑎1 )𝑦 1 + (𝑏0 −𝑏𝑛 𝑎0 )𝑦 +𝑏𝑛 𝑢 (1)
同样选取状态变量为: 𝑥1 = 𝑦,
𝑥2 = 𝑦 1 , ⋯ , 𝑥𝑛 = 𝑦 (𝑛−1)
状态空间表达式:
𝑥ሶ 1 0 1 0 ⋯ 0 𝑥1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 0
⋮ = ⋮ ⋮ ⋮ ⋱ 0 ⋮ + ⋮ u
𝑥ሶ 𝑛−1 0 0 0 … 1 𝑥n−1 0
𝑥ሶ 𝑛 −𝑎0 −𝑎1 −𝑎2 … −𝑎n−1 𝑥𝑛 1
𝑦 = (𝑏0 −𝑏𝑛 𝑎0 ) (𝑏1 −𝑏𝑛 𝑎1 ) ⋯ 𝑏𝑛−1 − 𝑏𝑛 𝑎𝑛−1 𝒙 +𝑏𝑛 𝑢
1.2 状态空间表达式的建立
例:系统的动态特性由下列微分方程描述 取拉氏反变换,有:
(1). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u 𝑦 (3) + 5𝑦 (2) + 7𝑦 (1) + 3𝑦 = 𝑢
൝
(2). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሷ + 3𝑢ሶ +2u 𝑦 = 𝑦 (1) + 2𝑦
列写其相应的状态空间表达式。 选取状态变量:𝑥1 = 𝑦, 𝑥2 = 𝑦 (1) , 𝑥3 = 𝑦 (2)
则: 𝑥ሶ1 = 𝑥2 , 𝑥ሶ 2 = 𝑥3
解: (1) 对微分方程取拉氏变换,可得
𝑥ሶ 3 = 𝑦 (3) = −5𝑥3 − 7𝑥2 − 3𝑥1 +u
𝑠+2
Y 𝑠 = 3 2
𝑈(𝑠) 𝑦 = 𝑥2 + 2𝑥1
𝑠 + 5𝑠 + 7𝑠 + 3
可得状态空间表达式:
1
设 𝑌෨ 𝑠 = 3 2
𝑈(𝑠) 𝑥ሶ 1 0 1 0 𝑥1 0
𝑠 + 5𝑠 + 7𝑠 + 3
𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u
𝑥ሶ 3 −3 −7 −5 𝑥3 1
则有 Y 𝑠 = (𝑠 + 2)𝑌෨ 𝑠
𝑦= 2 1 0𝒙
1.2 状态空间表达式的建立
单输入单输出系统实现方法一
例:系统的动态特性由下列微分方程描述
(1). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u
(2). 𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሷ + 3𝑢ሶ +2u
列写其相应的状态空间表达式。
解: (2) 状态空间表达式: 第(1)小题状态空间表达式:
𝑥ሶ1 0 1 0 𝑥1 0 𝑥ሶ 1 0 1 0 𝑥1 0
𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u 𝑥ሶ 2 = 0 0 1 𝑥2 + 0 u
𝑥ሶ 3 −3 −7 −5 𝑥3 1 𝑥ሶ 3 −3 −7 −5 𝑥3 1
𝑦= 2 3 1𝒙 𝑦= 2 1 0𝒙
在实现问题中,传递函数的分母决定系统的状态方程,而传递函数的分子决定系统
的输出方程。
《现代控制理论》MOOC课程
1.2 状态空间表达式的建立
1.2 状态空间表达式的建立
单输入单输出系统实现方法二
1. 当 𝑚 = 𝑛
𝑏𝑛 𝑠 𝑛 +𝑏𝑛−1 𝑠 𝑛−1 +⋯+𝑏1 𝑠+𝑏0
由系统的传递函数可得: Y(s)= 𝑛 𝑈(𝑠)
𝑠 +𝑎𝑛−1 𝑠 𝑛−1 +⋯+𝑎1 𝑠+𝑎0
取拉氏反变换,可得:
𝑦 (𝑛) + 𝑎𝑛−1 𝑦 (𝑛−1) + ⋯ + 𝑎1 𝑦 1 + 𝑎0 𝑦 = 𝑏𝑛 𝑢(𝑛) + 𝑏𝑛−1 𝑢(𝑛−1) + ⋯ + 𝑏1 𝑢 1 + 𝑏0 𝑢
选取状态变量,令:
𝑥1 = 𝑦 − 𝛽0 𝑢 𝑦 = 𝑥1 + 𝛽0 𝑢
𝑥2 = 𝑥ሶ 1 − 𝛽1 𝑢 𝑥ሶ 1 = 𝑥2 + 𝛽1 𝑢
𝑥3 = 𝑥ሶ 2 − 𝛽2 𝑢 𝑥ሶ 2 = 𝑥3 + 𝛽2 𝑢
⋮ ⋮
𝑥𝑛 = 𝑥ሶ 𝑛−1 − 𝛽𝑛−1 𝑢 𝑥ሶ 𝑛−1 = 𝑥𝑛 + 𝛽𝑛−1 𝑢
𝑥𝑛+1 = 𝑥ሶ 𝑛 −𝛽𝑛 𝑢 𝑥ሶ 𝑛 = 𝑥𝑛+1 + 𝛽𝑛 𝑢
1.2 状态空间表达式的建立
写成矩阵的形式,得到含有待定系数及待求变量的状态方程:
𝑥ሶ1 0 1 0 ⋯ 0 𝑥1 𝛽1 0
𝑥ሶ 2 0 0 1 ⋯ 0 𝑥2 𝛽2 0
⋮ = ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ + ⋮ u+ ⋮
𝑥ሶ 𝑛−1 0 0 0 ⋯ 1 𝑥𝑛−1 𝛽𝑛−1 0
𝑥ሶ 𝑛 0 0 0 ⋯ 0 𝑥𝑛 𝛽𝑛 𝑥𝑛+1
𝑥1
𝑥2
𝑦= 1 0 0 ⋯ 0 ⋮ +𝛽0 u
𝑥𝑛−1
𝑥𝑛
其中 𝛽0 , 𝛽1 , ⋯ , 𝛽𝑛及 𝑥𝑛+1为待求系数和变量;
1.2 状态空间表达式的建立
求待定系数和变量
𝑥1 = 𝑦 − 𝛽0 𝑢
𝑥2 = 𝑥ሶ 1 − 𝛽1 𝑢 = 𝑦 (1) −𝛽0 𝑢(1) − 𝛽1 𝑢
𝑥3 = 𝑥ሶ 2 − 𝛽2 𝑢 = 𝑦 (2) −𝛽0 𝑢(2) − 𝛽1 𝑢(1) − 𝛽2 𝑢
⋮
𝑥𝑛 = 𝑥ሶ 𝑛−1 − 𝛽𝑛−1 𝑢 = 𝑦 (𝑛−1) −𝛽0 𝑢 𝑛−1 − 𝛽1 𝑢 𝑛−2 − ⋯ − 𝛽𝑛−2 𝑢 1 − 𝛽𝑛−1 𝑢
𝑥𝑛+1 = 𝑥ሶ 𝑛 −𝛽𝑛 𝑢 = 𝑦 (𝑛) −𝛽0 𝑢 𝑛 − 𝛽1 𝑢 𝑛−1 − ⋯ − 𝛽𝑛−1 𝑢 1 − 𝛽𝑛 𝑢
𝑦 = 𝑥1 + 𝛽0 𝑢
𝑦 (1) = 𝑥2 + 𝛽0 𝑢(1) + 𝛽1 𝑢
𝑦 (2) = 𝑥3 + 𝛽0 𝑢(2) + 𝛽1 𝑢(1) + 𝛽2 𝑢
⋮
𝑦 (𝑛−1) = 𝑥𝑛 + 𝛽0 𝑢 𝑛−1 + 𝛽1 𝑢 𝑛−2 + ⋯ + 𝛽𝑛−2 𝑢 1 + 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 + 𝛽0 𝑢 𝑛 + 𝛽1 𝑢 𝑛−1 + ⋯ + 𝛽𝑛−1 𝑢 1 + 𝛽𝑛 𝑢
1.2 状态空间表达式的建立
将前n个方程两边分别同乘 𝑎0 , 𝑎1 , ⋯ , 𝑎𝑛−1
𝑎0 𝑦 = 𝑎0 𝑥1 + 𝑎0 𝛽0 𝑢
𝑎1 𝑦 (1) = 𝑎1 𝑥2 + 𝑎1 𝛽0 𝑢(1) + 𝑎1 𝛽1 𝑢
𝑎2 𝑦 (2) = 𝑎2 𝑥3 + 𝑎2 𝛽0 𝑢(2) + 𝑎2 𝛽1 𝑢(1) + 𝑎2 𝛽2 𝑢
⋮
𝑎𝑛−1 𝑦 (𝑛−1) = 𝑎𝑛−1 𝑥𝑛 + 𝑎𝑛−1 𝛽0 𝑢 𝑛−1 + 𝑎𝑛−1 𝛽1 𝑢 𝑛−2 + ⋯ + 𝑎𝑛−1 𝛽𝑛−2 𝑢 1 + 𝑎𝑛−1 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 + 𝛽0 𝑢 𝑛 + 𝛽1 𝑢 𝑛−1 + ⋯ + 𝛽𝑛−1 𝑢 1 + 𝛽𝑛 𝑢
𝑎0 𝑦 = 𝑎0 𝑥1 +𝑎0 𝛽0 𝑢
𝑎1 𝑦 (1) = 𝑎1 𝑥2 +𝑎1 𝛽0 𝑢(1) +𝑎1 𝛽1 𝑢
𝑎2 𝑦 (2) = 𝑎2 𝑥3 +𝑎2 𝛽0 𝑢(2) +𝑎2 𝛽1 𝑢(1) +𝑎2 𝛽2 𝑢
⋮ ⋮ ⋮ ⋮ ⋮
𝑎𝑛−1 𝑦 (𝑛−1) = 𝑎𝑛−1 𝑥𝑛 + 𝑎𝑛−1 𝛽0 𝑢 𝑛−1
+ ⋯ + 𝑎𝑛−1 𝛽n−3 𝑢 2 1
+ 𝑎𝑛−1 𝛽𝑛−2 𝑢 + 𝑎𝑛−1 𝛽𝑛−1 𝑢
𝑦 (𝑛) = 𝑥𝑛+1 +𝛽0 𝑢 𝑛
+𝛽1 𝑢 𝑛−1 +⋯ +𝛽𝑛−2 𝑢(2) +𝛽𝑛−1 𝑢 1 +𝛽𝑛 𝑢
1.2 状态空间表达式的建立
将每个方程等式两边相加
𝑥1
𝑥2
比较方程两边的系数有: 𝑎0 𝑥1 + 𝑎1 𝑥2 + ⋯ 𝑎𝑛−1 𝑥𝑛 + 𝑥𝑛+1 =0 𝑥𝑛+1 = −𝑎0 −𝑎1 ⋯ −𝑎𝑛−1
⋮
𝑥𝑛
𝛽0 = 𝑏𝑛
2. 当m<n时:与所讨论情形的等价 𝑏𝑘 = 0, 𝑘 = 𝑛,n − 1, ⋯ ,𝑚 + 1
1.2 状态空间表达式的建立
例:系统的动态特性由下列微分方程描述
𝑦ഺ + 5𝑦ሷ + 7𝑦ሶ + 3𝑦 = 𝑢ሶ +2u
列写其相应的状态空间表达式。
解: 𝑏3 = 𝑏2 = 0,𝑏1 = 1,𝑏0 = 2 𝑎2 = 5,𝑎1 = 7,𝑎0 = 3
𝛽0 = 𝑏3 = 0
𝛽1 = 𝑏2 − 𝑎2 𝛽0 = 0
𝛽2 = 𝑏1 − 𝑎2 𝛽1 − 𝑎1 𝛽0 = 1 − 5 × 0 − 7 × 0 = 1
𝛽3 = 𝑏0 − 𝑎2 𝛽2 − 𝑎1 𝛽1 − 𝑎0 𝛽0 = 2 − 5 × 1 − 7 × 0 − 3 × 0 = −3
𝑥ሶ 1 0 1 0 𝑥1 0 𝑥1
𝑥ሶ 2 = 0 0 1 𝑥2 + 1 𝑢 𝑦 = 1 0 0 𝑥2
𝑥ሶ 3 −3 −7 −5 𝑥3 −3 𝑥3
1.2 状态空间表达式的建立
多输入多输出系统实现方法
多输入多输出系统的实现,可采用方框图法。就是依据高阶微分方程组,
画出所对应的方框图,再根据方框图列写状态空间表达式。
由于经典控制理论难以有效的处理多输入多输出系统,通常不会建立多输入多输出
系统的微分方程或传递函数描述。
1.2 状态空间表达式的建立
小结
方框图法、机理法、实现的方法的建模步骤;
状态变量的选取方法:
方框图法:每一个积分器的输出选为状态变量
机理法:每一个独立储能元件,选一个变量作为状态变量
实现方法1:传递函数分母分之输入的拉氏反变换,及其各阶导数作为状态变量。
实现方法2:系统输入、输出各阶导数的线性组合选作状态变量。
《现代控制理论》MOOC课程
1.3 状态向量的线性变换
1.3 状态向量的线性变换
状态空间空间表达式的非唯一性
系统特征值的不变性
对角线规范型和约当规范型
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
状态变量是足以完全表征系统运
动状态的最小个数的一组变量
状态变量是相互独立的
同一系统不同状态向量之间必然
存在一种线性变换的关系
同一系统状态变量的个数是唯一
确定的
同一系统状态变量的选取是非唯
一的
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
同一系统不同状态向量之间必然存在一种线性变换的关系。
证明:
反设:𝒙、𝒛为同一系统的两个不同状态向量,但𝒙、𝒛之间不存在线性变换关系
由𝒙、𝒛之间不存在线性变换关系。
则向量𝒙中至少存在一个变量𝒙𝒊 , 不能用向量𝒛各分量的线性组合来表示,即
独立于𝒛向量的各分量。
因为,变量𝒙𝒊 和向量𝒛的各分量都是状态变量,故要完全表征系统的动态行为
向量𝒛至少还要增加一个分量𝒙𝒊 ,即向量z不是系统的状态向量。
反设不成立。故,同一系统不同状态向量之间必然存在一种线性变换的关系。
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
设一给定的n阶系统的状态空间表达式为
𝒙ሶ =A𝒙 + 𝑩𝒖 𝒙(𝟎) = 𝒙𝟎
𝒚 = 𝑪𝒙 + 𝑫𝒖
对于任意给定的n×n阶非奇异阵T, 作如下变换:
𝒛 = 𝑻−𝟏 𝒙
则z也一定是给定系统的另一个状态向量。
由 𝒛 = 𝑻−𝟏 𝒙 可得 𝒙 = 𝑻𝒛 ,代入状态空间表达式为:
𝑻𝒛ሶ =A𝑻𝒛 + 𝑩𝒖 T𝒛(𝟎) = 𝒙𝟎
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
状态方程和初值两端同乘T的逆:
𝒛ሶ =𝑻−𝟏 A𝑻𝒛+ 𝑻−𝟏 𝑩𝒖 𝒛(𝟎) = 𝑻−𝟏 𝒙𝟎
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
则有系统新的状态空间表达式:
ഥ𝒛 + 𝑩
𝒛ሶ = 𝑨 ഥ𝒖 𝒛(𝟎) = 𝒛𝟎
𝒚=𝑪 ഥ𝒛 + 𝑫
ഥ𝒖
ഥ = 𝑻−𝟏 A𝑻,𝑩
其中, 𝑨 ഥ =𝑪𝑻,𝑫
ഥ =𝑻−𝟏 𝑩, 𝑪 ഥ =D ,𝒛𝟎 = 𝑻−𝟏 𝒙𝟎
由于T 是任意非奇异阵,故系统的状态空间表达式是非唯一的。
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
0 −2 2 1
例. 某系统的状态空间表达式为: 𝒙ሶ = 𝒙+ 𝒖, 𝒙 𝟎 =
1 −3 0 1
𝒚= 0 3𝒙
6 2
作如下变换,𝒙 = 𝑻𝒛 = z 。 求变换后系统的状态空间表达式。
2 0
解: 𝑻−𝟏
𝟏 0 1
=
𝟐 1 −3
𝟏 0 1 1 1Τ2
𝒛 𝟎 = 𝑻−𝟏 𝒙(0) = =
𝟐 1 −3 1 −1
𝟏 0 1 0 −2 6 2 0 1
ഥ=𝑻
𝑨 −𝟏
𝑨𝑻 = =
𝟐 1 −3 1 −3 2 0 −2 −3
1.3 状态向量的线性变换
一. 状态空间空间表达式的非唯一性
𝟏 0 1 2 0
ഥ=
𝑩 𝑻−𝟏 𝑩 = =
𝟐 1 −3 0 1
ഥ 6 2
𝑪 = 𝑪𝑻 = 0 3 = 6 0
2 0
变换后系统的状态空间表达式为:
0 1 0 1Τ2
𝒛ሶ = 𝒛+ 𝒖, 𝒛 𝟎 =
−2 −3 1 −1
𝒚= 6 0𝒙
1.3 状态向量的线性变换
二. 系统特征根的不变性
系统的特征值
定义:系统状态空间表达式中系统矩阵A的特征值称为系统的特征值。
系统特征值也就是系统矩阵特征方程 𝝀𝑰 − 𝑨 = 0 的根。
将特征方程写成多项式的形式:
𝜆𝑰 − 𝑨 = 𝜆𝑛 + 𝑎𝑛−1 𝜆𝑛−1 + ⋯ + 𝑎1 𝜆 + 𝑎0 =0
显然对n阶系统有n个特征值。
1.3 状态向量的线性变换
二. 系统特征根的不变性
系统特征值的不变性
非奇异线性变换不改变系统的特征值。
证明: 非奇异线性变换前: 𝝀𝑰 − 𝑨 = 0 非奇异线性变换后: 𝝀𝑰 − 𝑻−𝟏 𝑨𝑻 = 0
而: 𝜆𝑰 − 𝑻−𝟏 𝑨𝑻 = 𝜆𝑻−𝟏 𝑻 − 𝑻−𝟏 𝑨𝑻 = 𝑻−𝟏 𝜆𝑻 − 𝑻−𝟏 𝑨𝑻 = 𝑻−𝟏 (𝜆𝑰 − 𝑨)𝑻
因为矩阵乘积的行列式等于行列式的乘积,矩阵逆的行列式等于矩阵行列式的倒数,
所以有:
即 𝜆𝑰 − 𝑨 = 𝜆𝑰 − 𝑻−𝟏 𝑨𝑻 证毕
《现代控制理论》MOOC课程
1.3 状态向量的线性变换
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
系统的特征向量
对于n×n维矩阵A,若存在一个不为零的n维向量𝑝𝑖 和一个标量 𝜆𝑖,使得:
(𝑨 − 𝜆𝑖 𝐼)𝒑𝑖 =0
则称 𝑝𝑖 为矩阵A的特征值 𝝀𝑖 所对应的特征向量。
计算特征向量,求是求解齐次代数方程
(𝑨 − 𝝀𝑖 𝑰)𝒑𝑖 =0
由齐次代数方程解的性质,系数矩阵奇异时,有无穷多组非零解。
一个特征根,对应于无穷多个特征向量。
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
对角规范型
对于给定系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,设其特征值 𝝀𝟏 , 𝝀𝟐 ,⋯ , 𝝀𝒏 为两两互异,由它们的特征向
三. 状态空间表达式的对角规范型和约当规范型
讨论
在对角规范型下,各状态变量间实现了完全解耦,可表示为n个独立的状态变量方程。
𝑧1ሶ 𝜆1 𝑧1
𝑧2ሶ 𝜆2 𝑧2
= + ഥ𝒖
𝑩
⋮ ⋱ ⋮
𝑧𝑛ሶ 𝜆𝑛 𝑧𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
0 1 ⋯ 0
⋮ ⋮ ⋱ ⋮
若系统矩阵A为标准型,即 𝑨= 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1
则将状态方程变换为对角规范型的变换阵T为范德蒙德阵,即:
1 ⋯ 1
𝜆1 ⋯ 𝜆𝑛
𝑻=
⋮ ⋮ ⋮
𝜆1𝑛−1 ⋯ 𝜆𝑛−1
𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
由特征向量的定义可得 (𝑨 − 𝜆𝑖 𝐼)𝑝𝑖 = 0
将规范性系统矩阵代入: 0 1 ⋯ 0
⋮ ⋮ ⋱ ⋮
𝑨= 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1
−𝜆𝑖 1 ⋯ 0 𝑝1𝑖
⋮ ⋮ ⋱ ⋮ 𝑝2𝑖
0 −𝜆𝑖 … 1 ⋮ =0
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 −𝜆𝑖 𝑝𝑛𝑖
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
故状态方程变换为对角规范型的变换阵可表示为: 1 ⋯ 1
⋯ 𝑝𝑛 𝜆1 ⋯ 𝜆𝑛
𝑻 = 𝑝1 𝑝1 = ⋯
⋮ ⋮
得证
𝜆1𝑛−1 ⋯ 𝜆𝑛−1
𝑛
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
解: ① 确定系统的特征值,即
𝜆−2 1 1
𝜆𝑰 − 𝑨 = 0 𝜆+1 0 =(𝜆 − 2)(𝜆 + 1)(𝜆 − 1)
0 −2 𝜆 − 1
可得: 𝜆1 = 2,𝜆2 = −1,𝜆3 = 1
因为系统特征值不存在重根,故系统的状态方程可化为对角规范型。
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
② 确定非奇异变换阵T
求取与特征值 𝜆1 = 2,𝜆2 = −1,𝜆3 = 1 所对应的特征向量 。
代入特征向量求解方程 (A−𝜆𝑖 𝑰)𝒑𝒊 =0 ,当 𝜆1 = 2 有:
0 −1 −1 𝑝11
0 −3 0 𝑝21 =0 可得 𝑝11 = 𝑘 (𝑘 ≠ 0的任意值), 𝑝21 = 𝑝31 = 0
0 2 −1 𝑝31
1 0 1
取 𝑘 = 1 有 : 𝒑𝟏 = 0 同理可得: 𝒑𝟐 = 1 𝒑𝟑 = 0
0 −1 1
1 0 1 1 −1 −1
由此可得: 𝑻 = 0 1 0 求逆可得: 𝑻−𝟏 = 0 1 0
0 −1 1 0 1 1
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
③ 求系数矩阵 ഥ 、𝑩
𝑨 ഥ
1 −1 −1 2 −1 −1 1 0 1 2 0 0
ഥ = 𝑻−1 𝑨𝑻 = 0 1
𝑨 0 0 −1 0 0 1 0 = 0 −1 0
0 1 1 0 2 1 0 −1 1 0 0 1
1 −1 −1 7 2
ഥ = 𝑻−1 𝑩 = 0
𝑩 1 0 2 = 2
0 1 1 3 5
故系统状态方程的对角规范型为:
2 0 0 2
𝒛ሶ = 0 −1 0 𝒛+ 2 u
0 0 1 5
《现代控制理论》MOOC课程
1.3 状态向量的线性变换
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
特征根的代数重数和几何重数
𝝀𝒊 的几何重数 𝜶𝒊 也就是𝝀𝒊线性无关特征向量的个数。
𝜶𝒊 = 𝒏 − 𝒓𝒂𝒏𝒌(𝝀𝒊 I −A)
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
1 2 3
例:求系统矩阵 𝑨 = 3 2 3 相异特征值的代数重数和几何重数。
0 0 −1
𝜆 − 1 −2 −3 𝝀𝟏 = −1, − 1
𝟐
解: 𝜆𝑰 − 𝑨 = −3 𝜆 − 2 −3 =(𝜆 + 1) (𝜆 − 4) = 𝟎 可得:
0 0 𝜆+1 𝜆𝟐 = 4
3 −2 −3
𝜆𝟐的几何重数 𝛼𝟐 = 3 − rank(𝝀𝟐 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 −3 2 −3 = 3 − 2=1
0 0 4
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
系统的广义特征向量
(𝑨 − 𝜆 𝑰) 𝑘 𝒑 =0
使得: ൝ 𝑖 𝑖
(𝑨 − 𝜆𝑖 𝑰)𝑘−1 𝒑𝑖 ≠ 0
约当规范型
对于给定的n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖 。设系统的特征值为:
𝝀𝟏 (𝝈𝟏代数重,𝜶𝟏几何重),𝝀𝟐 (𝝈𝟐代数重,𝜶𝟐几何重),⋯ ,𝝀𝒍 (𝝈𝒍代数重,
𝜶𝒍 几何重)
(𝝈𝟏 + 𝝈𝟐 +⋯ + 𝝈𝒍 = 𝒏) ,则存在由各特征值的广义特征向量组成的变换阵Q,通
过变换 z=𝑸−𝟏 𝒙 ,可将状态方程化为如下的约当规范型:
𝑱𝟏
𝒛ሶ = 𝑸−𝟏 𝑨𝑸 + 𝑸−𝟏 𝑩𝒖 = ⋱ ഥ𝒖
𝒛+𝑩
𝑱𝒍
𝑱𝟏
ഥ = 𝑸−𝟏 𝑨𝑸 =
其中, 𝑨 ⋱ , ഥ =𝑸−𝟏 𝑩
𝑩
𝑱𝒍
1.3 状态向量的线性变换
三. 状态空间表达式的对角规范型和约当规范型
讨论
当系统矩阵A的特征值有重根时,通常不可能通过线性变换而实现状态变量之间的
完全解耦,约当规范型是可能达到的最简耦合形式。同一特征根、同一约当子块
所对应的状态变量之间存才在耦合关系。
1.3 状态向量的线性变换
小结
对同一动态系统,描述系统动态过程的状态空间表达式有无穷多种,但反映系统
本质特征的系统特征值是唯一的。
同一动态系统,不同状态空间表达式之间,存在着一种非奇异线性变换关系。
同一动态系统,不同状态空间表达式的系统矩阵是相似矩阵。
不存在重根的系统,可变换为对角规范型,实现状态变量之间的完全解耦。
存在重根的系统,通常只能变换为约当规范型,实现部分状态变量解耦。
《现代控制理论》MOOC课程
1.4 从状态空间表达式求传递函数矩阵
1.4 从状态空间表达式求传递函数矩阵
一. 传递函数矩阵的定义
定义:对于多输入-多输出线性定常系统,输入向量为 𝒖 = 𝑢1 𝑢2 ⋯ 𝑢𝑟 𝑇 , 输出向
量为 𝒚 = 𝑦1 𝑦2 ⋯ 𝑦𝑚 𝑇 , 且假定初始状态为零。 𝒖 ෝ𝒊 𝑠 分别表示 𝑢𝑖 , 𝑦𝑖 的拉氏
ෝ𝒊 𝑠 , 𝒚
变换,𝑤𝒊𝒋 (s)表示第j个输入端到第i个输出端的传递函数,系统的输入输出关系可描述为:
𝑦ො1 𝑠 = 𝑤11 𝑠 𝑢ො1 𝑠 + 𝑤12 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤1𝑟 𝑠 𝑢ො 𝑟 𝑠
𝑦ො2 𝑠 = 𝑤21 𝑠 𝑢ො1 𝑠 + 𝑤22 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤2𝑟 𝑠 𝑢ො 𝑟 𝑠
⋮
𝑦ො𝑚 𝑠 = 𝑤𝑚1 𝑠 𝑢ො1 𝑠 + 𝑤𝑚2 𝑠 𝑢ො 2 𝑠 + ⋯ + 𝑤𝑚𝑟 𝑠 𝑢ො 𝑟 𝑠
写成向量形式:
𝑦ො1 (𝑠) 𝑤11 𝑠 ⋯ 𝑤1𝑟 𝑠 𝑢ො1 (𝑠)
ෝ(s)=
𝒚 ⋮ = ⋮ ⋯ ⋮ ⋮ =W(s)ෝ
𝒖 (s)
𝑦ො𝑚 (𝑠) 𝑤𝑚1 𝑠 ⋯ 𝑤𝑚𝑟 𝑠 𝑢ො 𝑟 (𝑠)
称 W(s)为系统的传递函数矩阵。
1.4 从状态空间表达式求传递函数矩阵
二. 由状态空间表达式导出传递函数矩阵
结论:对应于状态空间描述
𝒙ሶ =A 𝒙 +Bu 𝒙 𝟎 =𝟎
y=C 𝒙 +Du
其传递函数矩阵为: W(s)=C(𝒔𝑰 − 𝑨)−𝟏 𝑩 + 𝑫
并且,当D≠0时,W(s) 为真有理分式矩阵,当D=0时,𝑾 𝒔 为严格真有理分式矩阵,
且有:lim 𝑾 𝒔 = 𝑫
𝑠→∞
证明: 对状态空间表达式取拉氏变换: sX(s)=AX(s) +BU(s)
Y(s)=CX(s) +DU(s)
由状态方程的拉氏变换表达式可得:X(s)=(sI − A)−𝟏 𝑩U(s)
代入输出方程的拉氏变换表达式可得:Y(s)=(C(sI − A)−𝟏 𝑩 +D )U(s)
故传递函数矩阵为: W(s)=C(sI − A)−𝟏 𝑩 +D
1.4 从状态空间表达式求传递函数矩阵
二. 由状态空间表达式导出传递函数矩阵
因此有: lim 𝑾 𝒔 = 𝑫
𝑠→∞
故当D≠0时, 𝑾 𝒔 为真有理分式;
当D=0时,𝑾 𝒔 为严格真有理分式;
1.4 从状态空间表达式求传递函数矩阵
三. 传递函数矩阵的唯一性
一个系统的状态空间表达式是非唯一的,但其传递函数矩阵是唯一的。
证明:原系统的状态空间表达式为: 其所对应的传递函数矩阵为:
𝒙ሶ = 𝑨𝒙 + 𝑩𝒖 𝑾 𝒔 = 𝑪 𝒔𝑰 − 𝑨 −𝟏 𝑩 + 𝑫
𝒚 = 𝑪𝒙 + 𝑫𝒖
设 𝒛 = 𝑻−𝟏 𝒙 ,可得系统的另一个状态空间表达式为:
𝒛ሶ = 𝑻−𝟏 𝑨𝑻𝒛 + 𝑻−𝟏 𝑩𝒖
𝒚 = 𝑪𝑻𝒛 + 𝑫𝒖
(𝑨𝑩)−𝟏 = 𝑩−𝟏 𝑨−𝟏
其对应的传递函数矩阵:
−𝟏 −𝟏 −𝟏 −𝟏
෪ 𝒔 = 𝑪𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻
𝑾 𝑻 𝑩 + 𝑫 = 𝑪𝑻 𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻 −𝟏 −𝟏
𝑩 + 𝑫 = 𝑪(𝑻 ) 𝑻 𝒔𝑰 − 𝑻 −𝟏
𝑨𝑻 𝑩+𝑫
−𝟏
= 𝑪 𝑻 𝒔𝑰 − 𝑻−𝟏 𝑨𝑻 𝑻−𝟏 𝑩+𝑫
−𝟏
= 𝑪 𝒔𝑰 − 𝑻 𝑩 + 𝑫 = 𝑾(𝒔)
即非奇异线性变换不改变系统的传递函数矩阵,同一系统的传递函数矩阵是唯一的。
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的状态空间表达式和传递函数矩阵
由两个或两个以上的子系统按照一定方式联接构成的系统称为组合系统。组合系统的
基本组合方式可分为串联、并联和反馈三种类型。
构建组合系统数学模型的基本思路
确定子系统可组合的条件,即确定各子系统联接的输入输出维数是否匹配。
找出联接的各子系统间、子系统与组合系统间的输入输出关系。
根据各子系统与组合系统的输入输出关系,导出组合系统的状态空间表达式与传递函
数矩阵。
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵
子系统并联
𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
考虑两个子系统: 𝚺𝒊 :
𝒚𝒊 = 𝑪𝒊 𝒙𝒊 + 𝑫𝒊 𝒖𝒊 (𝒊 = 𝟏, 𝟐)
经并联构成组合系统 𝚺𝒑 ,如下图所示: 𝒖𝟏 𝒚𝟏
Σ1
+
𝒖 𝒚
𝒖𝟐 𝒚𝟐 +
Σ2
并联系统与子系统的输入、输出关系 : 𝒖 = 𝒖𝟏 = 𝒖𝟐 , 𝒚 = 𝒚𝟏 + 𝒚𝟐
由并联系统与子系统的输入输出关系导出系统的状态空间表达式 :
𝒙ሶ 𝟏 = 𝑨𝟏 𝒙𝟏 + 𝑩𝟏 𝒖 𝒙ሶ 𝟏 𝑨 𝟎 𝒙𝟏 𝑩𝟏
= 𝟏 + u
𝒙ሶ 𝟐 = 𝑨𝟐 𝒙𝟐 + 𝑩𝟐 𝒖 𝒙ሶ 𝟐 𝟎 𝑨𝟐 𝒙𝟐 𝑩𝟐
𝒚 = 𝒚𝟏 + 𝒚𝟐 = 𝑪𝟏 𝒙𝟏 + 𝑪𝟐 𝒙𝟐 + (𝑫𝟏 +𝑫𝟐 )𝒖 𝒙
𝒚 = 𝑪𝟏 𝑪𝟐 𝒙𝟏 + 𝑫𝟏 +𝑫𝟐 𝒖
𝟐
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵
并联系统的传递函数矩阵:
由并联系统与子系统的输入、输出关系 : 𝒖 = 𝒖𝟏 = 𝒖𝟐 , 𝒚 = 𝒚𝟏 + 𝒚𝟐
可得: 𝒚 𝒔 = 𝒚𝟏 𝒔 + 𝒚𝟐 𝒔 = 𝒘𝟏 𝒔 𝒖 𝒔 + 𝒘𝟐 𝒔 𝒖 𝒔 =(𝒘𝟏 𝒔 + 𝒘𝟐 𝒔 )𝒖 𝒔
故并联组合系统的传递函数为:
𝒘 𝒔 = 𝒘𝟏 𝒔 + 𝒘𝟐 𝒔
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵
子系统串联
𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
两个子系统: 𝚺𝒊 : (𝒊 = 𝟏, 𝟐)
𝒚𝒊 = 𝑪𝒊 𝒙𝒊 + 𝑫𝒊 𝒖𝒊
经串联构成组合系统 𝚺𝒔 ,如下图所示:
𝒖𝟏 𝒚𝟏 𝒖𝟐 𝒚𝟐
𝒖 Σ1 Σ2 𝒚
同理可推导出,串联系统的状态空间表达式 :
𝒙ሶ 𝟏 𝑨𝟏 𝟎 𝒙𝟏 𝑩𝟏
= + u
𝒙ሶ 𝟐 𝑩𝟐 𝑪𝟏 𝑨𝟐 𝒙𝟐 𝑩𝟐 𝑫𝟏
𝒙
𝒚 = 𝑫𝟐 𝑪𝟏 𝑪𝟐 𝒙𝟏 + 𝑫𝟏 𝑫𝟐 𝒖
𝟐
串联系统的传递函数矩阵为:
𝒘 𝒔 = 𝒘𝟏 𝒔 𝒘𝟐 𝒔
1.4 从状态空间表达式求传递函数矩阵
四. 组合系统的传递函数矩阵
子系统的反馈联接
𝒙ሶ 𝒊 = 𝑨𝒊 𝒙𝒊 + 𝑩𝒊 𝒖𝒊
两个子系统: 𝚺𝒊 : (𝒊 = 𝟏, 𝟐)
𝒚𝒊 = 𝑪𝒊 𝒙𝒊
经反馈联接构成组合系统 𝚺𝒇 ,如下图所示: 𝒖 𝒖𝟏 𝒚𝟏
Σ1 𝒚
+ −
𝒚𝟐 Σ2
𝒖𝟐
同理可推导出,反馈联接系统的状态空间表达式 :
𝒙ሶ 𝟏 𝑨𝟏 −𝑩𝟏 𝑪𝟐 𝒙𝟏 𝑩𝟏
= 𝒙𝟐 + u
𝒙ሶ 𝟐 𝑩𝟐 𝑪𝟏 𝑨𝟐 𝟎
𝒙
𝒚 = 𝑪𝟏 𝟎 𝒙𝟏
𝟐
反馈系统的传递函数矩阵为:
𝒘 𝒔 = 𝑰 + 𝒘𝟏 𝒔 𝒘𝟐 𝒔 −𝟏 𝒘𝟏 𝒔
《现代控制理论》MOOC课程
一. 时间离散系统
离散系统的状态空间表达式可用差分方程组表示为
𝒙(𝒌 + 𝟏) = 𝑮𝒙(𝒌) + 𝑯𝒖 (𝒌)
𝒚 𝒌 = 𝑪𝒙 𝒌 + 𝑫𝒖(𝒌)
二. 线性时变系统
线性时变系统的状态空间表达式为:
𝒙ሶ =A 𝑡 𝒙 +A 𝑡 𝒖
y=C 𝑡 𝒙 +D 𝑡 𝒖
其系数矩阵的元素中至少有一个元素是时间t的函数;
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式
三. 非线性系统
1.非线性时变系统的状态空间表达式
𝒙ሶ =f (𝒙, 𝒖, t)
y=g (𝒙, 𝒖, 𝑡)
式中,f,g为函数向量;
2.非线性定常系统的状态空间表达式
当非线性系统的状态方程中不显含时间t时,则称为非线性定常系统
𝒙ሶ =f (𝒙, 𝒖)
y=g (𝒙, 𝒖)
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式
3.非线性系统的线性化
设 𝒙0 ,𝒖0 是非线性系统 𝒙ሶ =f (𝒙, 𝒖)
𝒚 =g (𝒙, 𝒖)
的一个平衡状态, 即 f (𝒙0 , 𝒖0 )=0 , 𝒚0 =g (𝒙0 , 𝒖0 ) 。
若只考虑 𝒙0 ,𝒖0 ,𝒚0 附近小范围的行为,则可将非线性系统取一次近似而予以线性化。
将非线性函数f、g在 𝒙0 ,𝒖0 附近作泰勒级数展开,并忽略高次项,仅保留一次项:
𝜕𝑓 𝜕𝒇
𝒇 𝒙, 𝒖 = 𝒇 𝒙0 , 𝒖0 + 𝛿𝒙 + 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0
𝜕𝐠 𝜕𝐠
𝐠 𝒙, 𝒖 = 𝐠 𝒙0 , 𝒖0 + 𝛿𝒙 + 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0
1.5 离散时间系统、 时变系统和非线性系统的状态空间表达式
则非线性系统的一次线性化方程可表示为:
𝜕𝒇 𝜕𝒇
𝜹𝒙ሶ = 𝒙ሶ − 𝒙ሶ 𝟎 = 𝛿𝒙 + 𝛿𝒖
𝜕𝒙 𝒙 ,𝒖 𝜕𝒖 𝒙
0 0 0 ,𝒖0
𝜕𝐠 𝜕𝐠
𝜹𝒚 = 𝒚 − 𝒚𝟎 = 𝛿𝒙 + 𝛿𝒖
𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0
𝜕𝒇 𝜕𝒇 𝜕𝐠 𝜕𝐠
其中, 𝑨= , 𝑩= , 𝑪= , 𝑫=
𝜕𝒙 𝒙 𝜕𝒖 𝒙 𝜕𝒙 𝒙 𝜕𝒖 𝒙
0 ,𝒖0 0 ,𝒖0 0 ,𝒖0 0 ,𝒖0
第一章 控制系统的状态空间表达式
第一章 小结
状态变量、状态空间、状态空间表达式的定义
建立系统状态空间表达式的方法,特别是状态变量选取的方法;
状态空间表达式非奇异线性变换的方法;
由状态空间表达式导出传递函数矩阵的方法;
组合系统状态空间表达式的建立方法;
离散系统、非线性系统状态空间的基本形式;
《现代控制理论》MOOC课程
第二章 系统状态空间表达式的解
第二章 控制系统状态空间表达式的解
线性定常齐次状态方程的解
状态转移矩阵
线性定常非齐次状态方程的解
线性时变系统状态方程的解
第二章 控制系统状态空间表达式的解
控制系统状态空间表达式的解,就是求解系统
𝒙ሶ =A𝒙 + 𝑩𝒖 𝒙 𝟎 = 𝒙𝟎
𝒚 = 𝑪𝒙 + 𝑫𝒖
在给定初始条件 𝒙 𝟎 = 𝒙𝟎 和控制输入 𝒖(𝒕)共同作用下,状态向量和输出向量的随时
间变化的运动规律 𝒙 𝑡 , 𝒚 𝑡 。
线性系统一定满足叠加原理。系统在初始状态 𝒙𝟎 和控制输入 𝒖(𝒕)共同作用下的运动
状态 𝒙 𝑡 ,可以分解为由初始状态 𝒙𝟎 和控制输入 𝒖(𝒕) 分别单独作用产生的运动状态
𝒙𝟎𝒖 𝑡 和 𝒙𝟎𝒙 𝑡 的叠加,即 𝒙 𝑡 = 𝒙𝟎𝒖 𝑡 + 𝒙𝟎𝒙 𝑡
零输入响应 零状态响应
响应
𝒙(𝒕) 𝒖=𝟎 𝒙𝟎𝒖 𝑡 𝒖 𝒙𝟎𝒙 𝑡
𝒖 𝒙ሶ =A𝒙 + 𝑩𝒖 = 𝒙ሶ =A𝒙 + 𝑩𝒖 + 𝒙ሶ =A𝒙 + 𝑩𝒖
𝒙𝟎 𝒙𝟎 𝒙𝟎 =0
第二章 控制系统状态空间表达式的解
𝒙𝟐 𝒙𝟐 𝒙𝟐
𝒕 = 𝒕𝟎
𝒙𝟎 ≠ 𝟎
𝒙𝟎 ≠ 𝟎 𝟎 𝒖≢𝟎 𝟎 𝒖≢𝟎 𝟎
𝒕 = 𝒕𝟎 𝒙𝟏 𝒙𝟏 𝒙𝟏
𝒙𝒆 = 𝟎 𝒙𝒆 = 𝟎 𝒙𝒆 = 𝟎
𝒕 = 𝒕𝟎
𝒙𝟎 = 𝟎
零输入响应 零状态响应 响应
《现代控制理论》MOOC课程
2.1 线性定常齐次状态方程的解
2.1 线性定常齐次状态方程的解
一。系统的零输入响应
线性定常系统齐次状态方程
𝒙ሶ =A𝒙,𝒙 0 = 𝒙𝟎 ,𝒕 ≥ 𝟎 (2 − 1)
的解,即系统的零输入响应 𝒙𝟎𝒖 𝑡 为:
𝒙𝟎𝒖 𝑡 = 𝒆𝑨𝒕 𝒙𝟎 , 𝒕 ≥ 𝟎
式中,𝒆𝑨𝒕 为系统矩阵A的矩阵指数函数:
∞
1 𝟐 2 1
𝒆𝑨𝒕 ≜ 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = 𝑨𝑘 𝑡 𝑘
2! 𝑘!
𝒌=𝟎
证明:令方程(2-1)的解为系数向量待定的一个幂级数,即
∞
𝒙𝟎𝒖 𝑡 = 𝒃𝟎 + 𝒃𝟏 𝑡 + 𝒃𝟐 𝑡 2 + ⋯ = 𝒃𝒌 𝑡 𝑘 (2 − 2)
𝒌=𝟎
其必满足方程(2-1),将上式代入方程(2-1)可得
𝒃𝟏 + 2𝒃2 𝑡 + 3𝒃3 𝑡 2 ⋯ = 𝑨(𝒃𝟎 + 𝒃𝟏 𝑡 + 𝒃𝟐 𝑡 2 + ⋯)
𝟏 𝟏 𝟐 𝟏
比较可得:𝒃𝟏 = 𝑨𝒃𝟎 , 𝒃2 = 𝟐 𝑨𝒃𝟏 = 𝑨 𝒃𝟎 , ⋯ , 𝒃𝒌 = 𝑨𝒌 𝒃𝟎 , ⋯
𝟐 𝒌!
2.1 线性定常齐次状态方程的解
将求得的待定系数,代入(2-2)式可得:
1 2 2 1 3 3
𝒙𝟎𝒖 𝑡 = (𝑰 + 𝑨𝑡 + 𝑨 𝑡 + 𝑨 𝑡 + ⋯ )𝒃𝟎
2! 3!
由初始条件 𝒙𝟎𝒖 0 = 𝒙𝟎 可得 𝒃𝟎 = 𝒙𝟎 ,故
1 2 2 1 3 3
𝒙𝟎𝒖 𝑡 = (𝑰 + 𝑨𝑡 + 𝑨 𝑡 + 𝑨 𝑡 + ⋯ )𝒙𝟎 = 𝒆𝑨𝒕 𝒙𝟎
2! 3!
得证
线性定常系统零输入响应的几点说明
lim 𝒆 𝑨𝒕 =0
线性定常系统渐进稳定的充要条件是:𝑡→∞
系统渐进稳定的条件是:当时 𝑡 → ∞ ,自由运动的轨迹将趋于系统的平衡状态 𝒙𝒆 = 𝟎 ,
即状态空间的原点。
求解零输入响应的核心是计算矩阵指数函数 𝒆𝑨𝒕
当 𝒙 𝒕𝟎 = 𝒙𝟎 , 𝒕𝟎 ≠ 𝟎时,零输入响应表达式更一般的形式:
𝒙𝟎𝒖 𝑡 = 𝒆𝑨(𝒕−𝒕𝟎) 𝒙𝟎 𝒕 ≥ 𝒕𝟎
2.1 线性定常齐次状态方程的解
二. 矩阵指数函数的性质
由矩阵指数函数的定义:
∞
1 𝟐 2 1 𝑘 𝑘
𝒆𝑨𝒕 ≜ 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = 𝑨 𝑡
2! 𝑘!
𝒌=𝟎
可得以下一些基本性质:
1. lim 𝒆𝑨𝒕 = 𝑰
𝒕→𝟎
𝒅 𝑨𝑡
4. 矩阵指数函数 对t的导数为: (𝒆 ) = 𝑨𝒆𝑨𝑡 = 𝒆𝑨𝑡 𝑨
𝒆𝑨𝒕
𝒅𝒕
证明: 𝒅 (𝒆𝑨𝑡 ) = 𝑨 + 𝑨𝟐 𝑡 + 1 𝑨𝟑 𝑡 2 + ⋯ + 1 𝑨𝒌 𝑡 𝑘−1 + ⋯
𝒅𝒕 2! 𝑘−1 !
1 𝟐 2 1
=𝑨(𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯+ 𝑨 𝒌−𝟏 𝑡 𝑘−1
+ ⋯ ) = 𝐴𝒆𝑨𝑡
2! 𝑘−1 !
1 𝟐 2 1
= 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯+ 𝑨 𝒌−𝟏 𝑡 𝑘−1 + ⋯ 𝐴 = 𝒆𝑨𝑡 A
2! 𝑘−1 !
5. 设有n×n维常阵A和B,如果A和B是可交换的,即AB=BA,则必成立:
𝒆(𝑨+𝑩)𝒕 = 𝒆𝑨𝒕 𝒆𝑩𝒕 = 𝒆𝑩𝒕 𝒆𝑨𝒕
由定义,用数学归纳法可证明。
6. 矩阵指数函数的积: (𝒆𝑨𝒕 )𝒎= 𝒆𝑨(𝒎𝒕) , 𝒎 = 𝟎, 𝟏, 𝟐, ⋯
由性质2,可证明。
《现代控制理论》MOOC课程
第二章 系统状态空间表达式的解
2.1 线性定常齐次状态方程的解
三. 矩阵指数函数的计算方法
∞
1 𝟐 2 1 𝑘 𝑘 直接计算。
方法一 根据矩阵指数函数的定义:𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = 𝑨 𝑡
2! 𝑘!
𝒌=𝟎
方法二 将A阵化为对角标准型或约当标准型求解
1. A的特征值不存在重根
若A的n个特征值 𝝀𝟏 , 𝝀𝟐 ,⋯ , 𝝀𝒏 不存在重根,则在求出使A阵实现对角化
𝝀𝟏
𝝀𝟐
𝑻−𝟏 𝑨𝑻 =
⋱
𝝀𝒏
𝒆 𝝀𝟏 𝒕
的变换阵 𝑻−𝟏 、𝑻 后,即有指数函数矩阵: 𝒆𝑨𝒕 = 𝑻 𝒆𝝀𝟐 𝒕 𝑻−𝟏
⋱
𝒆𝝀𝒏 𝒕
2.1 线性定常齐次状态方程的解
证明:
𝝀𝟏 𝝀𝟏
𝝀𝟐 𝝀𝟐
由 𝑻−𝟏𝑨𝑻 = ⋱ 可得 𝑨=𝑻
⋱
𝑻−𝟏
𝝀𝒏 𝝀𝒏
𝑘 𝑘
∞ ∞ 𝝀𝟏 ∞ 𝝀𝟏
𝑨𝒕
1 𝑘 𝑘 1 𝝀𝟐 1 𝝀𝟐
𝒆 = 𝑨 𝑡 = 𝑻 𝑻 −𝟏 𝑘
𝑡 = 𝑻 ⋱ 𝑻−𝟏 𝑡𝑘
𝑘! 𝑘! ⋱ 𝑘!
𝒌=𝟎 𝒌=𝟎 𝒌=𝟎
𝝀𝒏 𝝀𝒏
∞
1 𝒌 𝑘
𝝀𝟏 𝑡
𝑘!
𝒌=𝟎
∞
1 𝒌 𝑘 𝒆𝝀𝟏 𝒕
𝝀 𝑡 𝑻−𝟏 = 𝑻 𝒆𝝀𝟐 𝒕
=𝑻 𝑘! 𝟐 𝑻−𝟏
𝒌=𝟎 ⋱
⋱
∞
𝒆 𝝀𝒏 𝒕
1 𝒌 𝑘 得证
𝝀 𝑡
𝑘! 𝒏
𝒌=𝟎
2.1 线性定常齐次状态方程的解
2. A的特征值存在重根
若A的𝒍组不同特征值为:𝝀𝟏 ,𝝀𝟐 ,⋯ ,𝝀𝒍 ,代数重数分别为𝝈𝟏 ,𝝈𝟐 ,⋯ ,𝝈𝒍 (𝝈𝟏 +𝝈𝟐 +⋯ +𝝈𝒍 = 𝒏)
且几何重数均为1,则在求出使A阵为约当标准型:
𝑱𝟏 𝜆𝑖 1
𝑱𝟐 𝜆𝑖 ⋱
𝑱 = 𝑻−𝟏 𝑨𝑻 = 其中 𝑱𝒊 = 为 𝝈𝒊 × 𝝈𝒊 维矩阵
⋱ ⋱ 1
𝑱𝒍 𝜆𝑖
的变换阵 𝑻−𝟏 、𝑻 后,即有指数函数矩阵: 𝟏 𝟐 𝟏
𝟏 𝒕 𝒕⋯ 𝒕𝝈𝒊−𝟏
𝟐! (𝝈𝒊 − 𝟏)!
𝒆𝑱𝟏 𝒕 𝟏
𝒆𝑨𝒕 = 𝑻 𝒆𝑱𝟐 𝒕 𝑻−𝟏 其中 𝒆𝑱𝒊𝒕 = 𝒆𝝀𝒊𝒕 𝟎 𝟏 𝒕 ⋯ 𝒕𝝈𝒊 −𝟐
⋱ (𝝈𝒊 − 𝟐)!
𝒆𝑱𝒍𝒕 ⋮ ⋮ ⋮ ⋯ ⋮
𝟎 𝟎 𝟎 ⋯ 𝒕
𝟎 𝟎 𝟎 ⋯ 𝟏
证明:证明的思路与1相同,略去。
2.1 线性定常齐次状态方程的解
三. 矩阵指数函数的计算方法
𝒕𝒌 𝟏
𝑳 = 𝒌+𝟏
方法三 拉氏变换法 :𝒆𝑨𝒕 = 𝑳−𝟏 (𝑠𝑰 − 𝑨)−𝟏 𝒌! 𝒔
∞
证明:由矩阵指数函数的定义: 𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 1 𝑨𝟐 𝑡 2 + ⋯ = 1 𝑨𝑘 𝑡 𝑘
2! 𝑘!
𝒌=𝟎
取拉氏变换
∞
𝟏 𝟏 𝟏 𝟐 1
𝑳(𝒆𝑨𝒕 ) = 𝑰 + 𝟐 𝑨 + 𝟑 𝑨 + ⋯ = (𝑘+1) 𝑨𝑘
𝒔 𝒔 𝒔 𝑠
∞ 𝒌=𝟎
𝒌
= 𝒔−𝟏 𝒔−𝟏 𝑨 = 𝒔−𝟏 𝑰 − 𝒔−𝟏 𝑨 −𝟏
𝒌=𝟎
= 𝒔𝑰 − 𝑨 −𝟏
∞
1
取拉氏反变换 1=
𝒆𝑨𝒕 𝑥2 + ⋯ + 𝑥𝑘
+ 𝑳𝑥−𝟏+(𝑠𝑰 − 𝑨)−𝟏 +⋯ = 𝒙 =𝑘
=(1 − 𝑥)−1
𝒌=𝟎
1−𝑥
得证
2.1 线性定常齐次状态方程的解
三. 矩阵指数函数的计算方法
凯莱-哈迷尔顿定理
设 𝐴 ∈ 𝑅𝑛×𝑛 , 其特征多项式为:
𝐷 𝜆 = 𝜆𝐼 − 𝐴 = 𝜆𝑛 + 𝑎𝑛−1 𝜆𝑛−1 + ⋯ + 𝑎1 𝜆 + 𝑎0 = 0
则矩阵A必满足其特征多项式,即
𝑨𝑛 + 𝑎𝑛−1 𝑨𝑛−1 + ⋯ + 𝑎1 𝑨 + 𝑎0 𝑰 = 𝟎
方法四 2.1 线性定常齐次状态方程的解
𝒆𝝀𝟏 𝒕
𝒆𝑨𝒕 = 𝑻 𝒆 𝝀𝟐 𝒕 𝑻−𝟏 =𝑎0 𝑡 𝐼 + 𝑎1 𝑡 A+𝑎2 𝑡 𝐴2 +⋯ + 𝑎𝑛−1 𝑡 𝐴𝑛−1
⋱
𝒆𝝀𝒏 𝒕
方法四 2.1 线性定常齐次状态方程的解
𝑻−𝟏 𝐴2 𝑻=(𝑻−𝟏 𝑨𝑻)(𝑻−𝟏 𝑨𝑻)
𝑒 𝜆1 𝑡
𝑒 𝜆2𝑡 =𝑎0 𝑡 𝑻−𝟏 𝑻 + 𝑎1 𝑡 𝑻−𝟏 A𝑻+𝑎2 𝑡 𝑻−𝟏 𝐴2 𝑻+ ⋯ + 𝑎𝑛−1 𝑡 𝑻−𝟏 𝐴𝑛−1 𝑻
⋱
𝑒 𝜆𝑛 𝑡
𝜆1 𝜆12 𝜆1𝑛−1
𝜆2 𝜆22 𝜆𝑛−1
=𝑎0 𝑡 𝑰 + 𝑎1 𝑡 ⋱ +𝑎2 𝑡 + ⋯ + 𝑎𝑛−1 𝑡 2
⋱ ⋱
𝜆𝑛 𝜆2𝑛 𝜆𝑛−1
𝑛
比较等式两边可得:
−𝟏
𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝟏 + 𝑎2 𝑡 𝝀𝟐𝟏 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 =𝒆 𝝀𝟏 𝒕 𝑎0 𝑡 1 𝜆1 𝜆12 … 𝜆1𝑛−1 𝑒 𝜆1𝑡
𝟏
𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝟐 + 𝑎2 𝑡 𝝀𝟐𝟐 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 = 𝒆𝝀 𝟐 𝒕
𝑎1 𝑡
= 1 𝜆2 𝜆22 … 𝜆𝑛−1
2 𝑒 𝜆2𝑡
𝟐 解得 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮
⋮
𝑎0 𝑡 + 𝑎1 𝑡 𝝀𝒏 + 𝑎2 𝑡 𝝀𝟐𝒏 + ⋯ + 𝑎𝑛−1 𝑡 𝝀𝒏−𝟏 = 𝒆𝝀 𝒏 𝒕
𝑎𝑛−1 𝑡 1 𝜆𝑛 𝜆2𝑛 … 𝜆𝑛−1
𝑛 𝑒 𝜆𝑛 𝑡
𝒏
对于有重根的情况,可类似地方法证明。
得证。
2.1 线性定常齐次状态方程的解
例1 设系统矩阵为 𝑨 = 0 1
−2 −3
按照矩阵指数函数的定义和拉氏变换法求 𝒆𝑨𝒕 。
解:(1) 用定义计算
1 𝟐 2 0 1 1 0 1 𝟐
1 − 𝑡 2+⋯ 𝑡 − 1.5𝑡 2+⋯
𝒆𝑨𝒕 = 𝑰 + 𝑨𝑡 + 𝑨 𝑡 + ⋯ = 𝑰 + 𝑡+ 𝑡2 +⋯=
2! −2 −3 2! −2 −3 −2𝑡 + 3𝑡 2 + ⋯ 1 − 3𝑡 + ⋯
(2) 用拉氏变换法计算
𝑠+3 1
𝑠 −1 (𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)
(s𝑰 − 𝑨) = (s𝑰 − 𝑨)−𝟏 =
2 𝑠+3 −2 𝑠
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)
𝑠+3 1
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2) 2𝑒 −𝑡
− 𝑒 −2𝑡
𝑒 −𝑡 − 𝑒 −2𝑡
𝒆𝑨𝒕 = 𝑳−𝟏 (s𝑰 − 𝑨)−𝟏 = 𝑳−𝟏 =
−2 𝑠 −2𝑒 −𝑡 + 2𝑒 −2𝑡 −𝑒 −𝑡 + 2𝑒 −2𝑡
(𝑠 + 1)(𝑠 + 2) (𝑠 + 1)(𝑠 + 2)
2.1 线性定常齐次状态方程的解
0 1 0
例2 用标准型法计算系统矩阵 𝑨 = 0 0 1 的 𝒆𝑨𝒕
2 3 0
解:矩阵A的特征方程为
𝜆𝑰 − 𝑨 = (𝜆3 − 3𝜆 − 2) = 𝜆 + 1 2 𝜆−2 =0
解得系统特征根为:𝜆1 = 2( 𝜎1 = 1), 𝜆2 = −1( 𝜎2 = 2)
2 −1 0
𝜆𝟏的几何重数 𝛼𝟏 = 3 − rank(𝝀𝟏 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 0 2 −1 = 3 − 2=1
−2 −3 2
−1 −1 0
𝜆𝟐的几何重数 𝛼𝟐 = 3 − rank(𝝀𝟐 𝑰 − 𝑨)
= 3 − 𝒓𝒂𝒏𝒌 0 −1 −1 = 3 − 2=1
−2 −3 −1
计算特征根对应的特征向量和广义特征向量:
将𝝀𝟏 = 2,代入特征向量计算公式(𝑨 − 𝜆𝑖 𝑰)𝑝𝑖 = 0
−2 1 0 𝑝11 𝑝11 1
0 −2 1 𝑝21 =0 解得 𝑝21 = 2
可得
2 3 −2 𝑝31 𝑝31 4
2.1 线性定常齐次状态方程的解
1 1 1 𝟏 1 2 1
故变换阵为:T = 2 −1 0 故变换阵的逆为:𝑻−𝟏 = 2 −5 2
𝟗
4 1 −1 6 3 −3
2.1 线性定常齐次状态方程的解
而𝝀𝟐 = −1的约当块矩阵指数函数为:
−𝟏 𝟏 −𝒕
𝒆𝑱𝟐 𝒕 =𝒆 𝟎 −𝟏
𝒕
= 𝒆 𝒕𝒆−𝒕
𝟎 𝒆−𝒕
这样,系统的矩阵指数函数为:
1 1 1 𝑒 2𝑡 0 0 1 2 1
𝑨𝒕 1
𝒆 = 2 −1 0 0 𝑒 −𝑡 𝑡𝑒 −𝑡 2 −5 2
9
4 1 −1 0 0 𝑒 −𝑡 6 3 −3
例3. 用凯莱-哈密尔顿法计算系统矩阵的矩阵指数函数𝒆𝑨𝒕
0 1 0
𝑨= 0 0 1
−6 −11 −6
解:矩阵A的特征方程为
𝜆𝑰 − 𝑨 = (𝜆3 + 6𝜆2 + 11𝜆 + 6) 解的系统的特征值为 𝜆1 = −1,𝜆2 = −2,𝜆,3 = −3
3𝑒 −𝑡 − 3𝑒 −2𝑡 + 𝑒 −3𝑡
𝑎0 𝑡 −𝟏 5 −𝑡 3 −3𝑡
1 −1 1 𝑒 −𝑡 −2𝑡
𝑒 − 4𝑒 + 𝑒
𝑎1 𝑡 = 1 −2 4 𝑒 −2𝑡 = 2 2
𝑎2 𝑡 1 −3 9 𝑒 −3𝑡 1 −𝑡 −2𝑡
1 −3𝑡
𝑒 −𝑒 + 𝑒
2 2
于是: 5 −𝑡 3 1 −𝑡 1
3𝑒 −𝑡 − 3𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 4𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 𝑒 −2𝑡 + 𝑒 −3𝑡
2 2 2 2
5 9 1 −𝑡 3
𝒆𝑨𝒕 = 𝑎0 𝑡 I +𝑎1 𝑡 A+𝑎2 𝑡 𝑨2 = −3𝑒 −𝑡 + 6𝑒 −2𝑡 − 3𝑒 −3𝑡 − 𝑒 −𝑡 + 8𝑒 −2𝑡 − 𝑒 −3𝑡
2 2 2
𝑒 − 2𝑒 −2𝑡 + 𝑒 −3𝑡
2
5 −𝑡 27 1 −𝑡 9
3𝑒 −𝑡 − 12𝑒 −2𝑡 + 9𝑒 −3𝑡 𝑒 − 16𝑒 −2𝑡 + 𝑒 −3𝑡 𝑒 − 4𝑒 −2𝑡 + 𝑒 −3𝑡
2 2 2 2
《现代控制理论》MOOC课程
2.2 状态转移矩阵
2.2 状态转移矩阵
一. 状态转移矩阵的定义
称满足如下矩阵微分方程
ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡
的n×n维解阵 𝚽 𝑡 − 𝑡0 为系统的状态转移矩阵。
求解矩阵微分方程可得,状态转移矩阵为: 𝚽 𝑡 − 𝑡0 = 𝒆𝑨(𝒕−𝑡0 ) ,𝑡 ≥ 𝑡0
当 𝑡0 = 0时,状态转移矩阵可表示为: 𝚽 𝑡 = 𝒆𝑨𝒕 ,𝑡 ≥ 0
系统的零输入响应可用状态转移矩阵表示:
𝒙 𝒕 = 𝒆𝑨 𝒕−𝑡0 𝒙 𝑡0 = 𝚽 𝒕 − 𝑡0 𝒙 𝑡0 ,𝑡 ≥ 𝑡0 或 𝒙 𝒕 = 𝒆𝑨𝒕 𝒙 0 = 𝚽 𝒕 𝒙 0 ,𝑡 ≥ 0
状态转移矩阵的物理意义 :
𝚽 𝒕 − 𝑡0 就是在零输入条件下将时刻 𝑡0 的状态 𝑥0 转移到时刻t的状态 𝒙(𝑡) 的一个线性变换。
2.2 状态转移矩阵
二. 状态转移矩阵的性质
1. 分解性 𝚽 𝑡 + 𝜏 = 𝚽 𝑡 𝚽 𝜏
证明:由状态转移矩阵的物理意义:
𝒙 𝑡 = 𝚽 𝑡 − (−𝜏 )𝒙(−𝜏) = 𝚽 𝑡 + 𝜏 𝒙 −𝜏
𝒙 𝑡 = 𝚽 𝑡 𝒙 0 = 𝚽 𝑡 𝚽 0 − (−𝜏 )𝒙 −𝜏 =𝚽(𝑡)𝚽(𝜏) 𝒙(−𝜏)
故有: 𝚽 𝑡 + 𝜏 = 𝚽 𝑡 𝚽 𝜏
从-𝜏 到t的转移,可以看作是从-𝜏 转移到0,再从0转移到t的组合。
2. 可逆性 𝚽 𝑡 −𝟏 = 𝚽 −𝑡
证明: 由性质1
𝚽 𝑡 − 𝑡 = 𝚽 𝑡 𝚽 −𝑡 = 𝑰 故有: 𝚽 𝑡 −𝟏 = 𝚽 −𝑡
状态转移矩阵的逆意味着状态向量按时间的逆向转移。
即从0状态到t状态转移的逆,等于从t状态到0状态的转移。
2.2 状态转移矩阵
二. 状态转移矩阵的性质
3. 传递性 𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 = 𝚽 𝑡2 − 𝑡0
一个转移过程可以分解为若干个小的转移过程。即从𝑡0到𝑡2的转移等于从 𝑡0 转移到 𝑡1 ,
再从 𝑡1 转移到 𝑡2 。
证明:由状态转移矩阵的物理意义:
𝑥 𝑡2 = 𝚽 𝑡2 − 𝑡0 𝒙(𝑡0 )
𝑥 𝑡2 = 𝚽 𝑡2 − 𝑡1 𝒙(𝑡1 ) = 𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 𝒙(𝑡0 )
故有:𝚽 𝑡2 − 𝑡1 𝚽 𝑡1 − 𝑡0 = 𝚽 𝑡2 − 𝑡0
𝒌
4. 倍时性 𝚽(𝑡) = 𝚽 𝑘𝑡
状态转移矩阵的k次方等于该转移矩阵的时间自变量扩大k倍。
证明:由性质1
𝚽(𝑡) 𝒌 = 𝚽(𝑡) ⋯ 𝚽(𝑡) = 𝚽 𝑘𝑡
2.2 状态转移矩阵
二. 状态转移矩阵的性质
5. 微分性和交换性 𝚽ሶ 𝒕 = 𝑨𝚽 𝒕 = 𝚽 𝒕 𝑨
状态转移矩阵与矩阵A的乘积是可以互换的。
证明:由矩阵指数函数的性质
𝑑 𝑨𝑡
(𝒆 ) = 𝑨𝒆𝑨𝑡 = 𝒆𝑨𝑡 𝑨
𝑑𝑡
故有: 𝚽ሶ 𝒕 = 𝑨𝚽 𝒕 = 𝚽 𝒕 𝑨
6. 唯一性
系统的状态转移矩阵唯一地由系统的系统矩阵决定。
ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
由状态转移矩阵的定义 𝚽(𝑡
其唯一的参数就是系统矩阵。
2.2 状态转移矩阵
三. 状态转移矩阵的算法
状态转移矩阵实质上就是矩阵指数函数,其求解方法与矩阵指数函数相同。
例:已知线性定常系统的状态转移矩阵𝚽 𝒕 为:
1 −𝑡 3𝑡
1
(𝑒 + 𝑒 ) (−𝑒 −𝑡 + 𝑒 3𝑡 )
𝚽 𝒕 = 2 4
−𝑡 3𝑡
1 −𝑡
−𝑒 + 𝑒 (𝑒 + 𝑒 3𝑡 )
2
求系统矩阵。
解:由状态转移矩阵的定义:𝚽(𝑡) ሶ =A𝚽 𝑡 ,𝚽 0 = 𝑰,𝑡 ≥ 0
ሶ
解法1:由 A = 𝚽(𝑡)𝚽 𝑡 −𝟏 计算
ሶ
解法2:由 A = 𝚽(𝑡)𝚽 𝑡 −𝟏 ห ሶ
= 𝚽(𝑡) ห𝒕=𝟎
𝒕=𝟎
1 −𝑡 3𝑡
1 −𝑡
(−𝑒 + 3𝑒 ) (𝑒 + 3𝑒 3𝑡 )
ሶ
𝚽(𝒕) = 2 4 ሶ
A = 𝚽(𝑡) ห𝒕=𝟎 = 1 1
−𝑡 3𝑡
1 4 1
𝑒 + 3𝑒 (−𝑒 −𝑡 + 3𝑒 3𝑡 )
2
《现代控制理论》MOOC课程
2.3 线性定常系统非齐次状态方程的解
2.3 线性定常系统非齐次状态方程的解
一. 零状态响应
结论: 给定初始状态为零的线性定常系统
𝒙ሶ =A𝒙+Bu,𝒙 0 = 𝟎,𝑡 ≥0
其中,x为n维状态向量,u为r维输入向量,A和B分别为n×n和n×r常阵,那么系统的零
状态响应可表示为:
𝒕 𝑨 𝒕−𝝉
𝒙𝟎𝒙 (𝒕) = 𝒆 𝟎 𝑩𝒖(𝝉)d𝝉 𝑡≥𝟎
证明: 𝒅 −𝑨𝑡
𝒆 𝒙 = 𝒆−𝑨𝒕 −𝑨 𝒙 + 𝒆−𝑨𝑡 𝒙ሶ =𝒆−𝑨𝑡 𝒙ሶ − 𝑨𝒙 = 𝒆−𝑨𝑡 𝑩𝒖(𝑡)
𝒅𝒕 𝒕
二. 线性定常系统非齐次状态方程的解
𝒙ሶ =A𝒙+Bu,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
的解可以表示为零输入响应和零状态响应的叠加,即
𝒕 𝒕
𝒙 𝑡 = 𝒙𝟎𝒖 𝒕 + 𝒙𝟎𝒙 𝒕 = 𝒆𝑨𝑡 𝒙𝟎 + 𝑡(𝑨𝒆 𝟎−𝜏) 𝑩𝒖 𝜏 𝒅𝜏 = Φ 𝒕 𝒙𝟎 + 𝟎Φ 𝒕 − 𝝉 𝑩𝒖 𝜏 𝒅𝜏, 𝑡 ≥0
或写为更一般的形式:
𝒕 𝒕
1. 脉冲响应: 𝒖 𝑡 = 𝑲𝛿(𝑡)
𝒕
𝒕
𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝒖 𝜏 𝑑𝜏 =𝒆𝑨𝑡 𝒙𝟎 + 𝑡(𝑨𝒆 𝟎−𝜏) 𝑩𝑲𝛿 𝜏 𝑑𝜏
𝟎
𝒕
=𝒆𝑨𝑡 𝒙𝟎 + 𝑡(𝑨𝒆 𝟎−𝜏) 𝛿 𝜏 𝑑𝜏 𝑩𝑲 =𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝑩𝑲
2. 阶跃响应: 𝒖 𝑡 = 𝑲1(𝑡)
𝒕 𝒕
𝒕
𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲1(𝜏) 𝑑𝜏= 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲 𝑑𝜏 = 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝒆 𝟎−𝑨𝜏 𝑑𝜏 𝐵𝐾
𝟎 𝟎
𝒕
= 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝒆𝒅 𝟎−𝑨𝜏 (−𝑨−𝟏 ) 𝑩𝐾 = 𝒆𝑨𝑡 𝒙𝟎 + 𝒆𝑨𝑡 𝒆−𝑨𝑡 − 𝑰 (−𝑨−𝟏 ) 𝑩𝐾
𝒙 𝑡 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲𝜏1(𝜏) 𝑑𝜏 = 𝒆𝑨𝑡 𝒙𝟎 + න 𝒆𝑨(𝑡−𝜏) 𝑩𝑲𝜏𝑑𝜏= 𝒆𝑨𝑡 𝒙𝟎 − න 𝒆𝑨𝜇 𝑩𝑲(𝑡 − 𝜇)𝑑𝜇
𝟎 𝟎 𝒕
𝒕 𝒕 𝒕
2.4 线性时变系统的解
2.3 线性时变系统的解
一. 时变系统状态方程解的特点
对于线性时变系统的状态空间表达式可以表示为:
𝒙ሶ =A (t )𝒙+B (t )u,𝒙 𝑡0 = 𝒙𝟎 ,𝑡 ∈ [𝑡0 , 𝑡∝ ]
𝒚 =C (t )𝒙+D (t )u
为了求解时变系统的状态方程,先讨论一个时变的标量方程:
𝑥ሶ =a (t )𝑥
𝑑𝑥
解: =a (t )𝑑𝑡 𝑡
𝑥
对上式两边从 𝑡0 到 t 积分:𝑙𝑛𝑥 𝑡 − 𝑙𝑛𝑥(𝑡0 ) = න a (𝜏 )𝑑𝜏
𝑡0
𝑡
𝑥 𝑡 𝑡
a (𝜏 )𝑑 𝜏
可得: 𝑙𝑛 = න a (𝜏 )𝑑𝜏 𝑥 𝑡 =𝑒
𝑡
0 𝑥(𝑡0 )
𝑥(𝑡0 )
𝑡0
2.3 线性时变系统的解
一. 时变系统状态方程解的特点
𝑡
𝜏𝑑 𝜏 𝐴 𝑡
齐次方程 𝒙ሶ = 𝑨 𝑡 𝒙 解为 𝒙(𝑡) = 𝑒 0 𝒙(𝑡𝟎 ) 成立的条件。
𝑑
𝑡
𝜏𝑑 𝜏 𝐴 𝑡 𝑑 𝐴 𝑡𝑡 𝜏 𝑑𝜏
左边 = 𝒙ሶ = (𝑒 0 𝒙(𝑡𝟎 ) ) = (𝑒 0 )𝒙(𝑡𝟎 )
𝑑𝑡 𝑑𝑡
𝑡 𝑡 𝑡
𝑑 1
= (𝐼 + න 𝐴 𝜏 𝑑𝜏 + න 𝐴 𝜏 𝑑𝜏 න 𝐴 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
𝑑𝑡 2!
𝑡0 𝑡0 𝑡0
𝑡 𝑡
1 1
= (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 + ⋯ )𝒙(𝑡𝟎 )
2 2
𝑡0 𝑡0
𝑡
右边 =A (t )𝒙 =A (t )𝑒 𝜏𝑑 𝜏 𝐴 𝑡
0 𝒙(𝑡𝟎 )
𝑡 1 𝑡 𝑡
=A (t )(𝐼 + 𝐴 𝑡 𝜏 𝑑𝜏 + 𝐴 𝑡 𝜏 𝑑𝜏 𝐴 𝑡 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
0 2! 0 0
2.3 线性时变系统的解
一. 时变系统状态方程解的特点
𝑡 𝑡 𝑡
1
右边 = (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 න 𝐴 𝜏 𝑑𝜏 + ⋯ )𝒙(𝑡𝟎 )
2!
𝑡0 𝑡0 𝑡0
𝑡 𝑡
1 1
左边 = (𝐴 𝑡 + 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 + ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 + ⋯ )𝒙(𝑡𝟎 )
2 2
𝑡0 𝑡0
𝑡 𝑡
仅当 𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 = ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡 时 𝒙ሶ = 𝑨 𝑡 𝒙
𝑡0 𝑡0
𝑡 𝑡
𝑡
𝜏𝑑 𝜏 𝐴 𝑡
即方程解为:𝒙(𝑡) = 𝑒 0 𝒙(𝑡𝟎 ) 成立的条件为:𝐴 𝑡 න 𝐴 𝜏 𝑑𝜏 = ( න 𝐴 𝜏 𝑑𝜏) 𝐴 𝑡
𝑡0 𝑡0
这个条件通常是不成立的。因此,时变系统的自由解通常不能写成封闭形式。
2.3 线性时变系统的解
二. 线性时变系统的零输入响应
线性时变系统在零输入情况下,状态方程
𝒙ሶ = 𝑨 𝑡 𝒙 𝒙(𝑡)ȁ𝒕=𝒕𝟎 =𝒙(𝑡𝟎 )
其中 𝚽(𝑡, 𝑡0 ),称为线性时变系统的状态转移矩阵,是如下矩阵方程的解:
ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0 ,𝚽 𝑡0 , 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡, ሶ − 𝑡0 ) =A𝚽 𝑡 − 𝑡0 ,𝚽 𝑡0 = 𝑰,𝑡 ≥ 𝑡0
𝚽(𝑡
证明:将 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) 代入方程 𝒙ሶ = 𝑨 𝑡 𝒙 可得:
ሶ 𝑡0 )𝒙(𝑡𝟎 ) =A(𝑡)𝚽 𝑡, 𝑡0 𝒙(𝑡𝟎 )
𝚽(𝑡,
故 ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0
𝚽(𝑡,
1. 传递性 𝚽 𝑡2 , 𝑡1 𝚽 𝑡1 , 𝑡0 = 𝚽 𝑡2 , 𝑡0
2.可逆性 𝚽−𝟏 𝑡, 𝑡0 = 𝚽 𝑡0 , 𝑡
3. 初始时刻的状态转移矩阵 𝚽 𝑡0 , 𝑡0 =I
4. 微分性 ሶ 𝑡0 ) =A(𝑡)𝚽 𝑡, 𝑡0
𝚽(𝑡,
系统矩阵和状态转移矩阵通常不满足可交换条件。
5. 唯一性
当A(t)确定以后,𝚽 𝑡, 𝑡0 是唯一的。
2.3 线性时变系统的解
四.线性时变系统非齐次状态方程的解
结论:线性时变系统的状态方程为
ሶ
𝒙(𝑡) =A (t )𝒙(t)+B (t )u (t ),𝒙 𝑡0 = 𝒙𝟎 ,𝑡 ∈ [𝑡0 , 𝑡𝛼 ]
𝒙ሶ 𝒖 𝑡 = 𝚽 −𝟏 𝑡, 𝑡0 B (t )u (t ) 𝒕
𝒕
= 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝚽 𝑡 𝑡, 𝜏 B (𝜏 )u (𝜏 )d𝛕 +𝚽 𝑡, 𝑡0 𝒙𝒖 𝑡0
0
令 𝑡 = 𝑡0 可得 𝒙𝒖 𝑡0 =0
𝑡
故有 𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝚽 𝑡 𝑡, 𝜏 𝑩 𝜏 𝒖 𝜏 𝒅𝜏 得证
0
由于通常情况下,封闭形式的状态转移矩阵很难求得,上式的意义不在于计算的应用,
而在于系统理论研究中的应用。
第二章 控制系统状态空间表达式的解
第二章 小结
建立系统状态在状态空间中运动的基本概念。
推导建立了线性定常系统和线性时变系统状态方程的解析表达式:
𝒕
𝒙 𝑡 = 𝜱 𝒕 − 𝑡0 𝒙(𝑡𝟎 ) + න 𝜱 𝑡 − 𝜏 𝑩𝒖 𝜏 𝒅𝜏, 𝑡 ≥ 𝑡0
𝑡0
𝒕
𝒙 𝑡 = 𝚽(𝑡, 𝑡0 ) 𝒙(𝑡𝟎 ) + 𝑡 𝜱 𝑡,𝜏 𝑩 𝜏 𝒖 𝜏 𝒅𝜏, 𝑡∈[𝑡0 ,𝑡𝛼 ]
0
状态转移矩阵的定义、性质和计算方法。
《现代控制理论》MOOC课程
第三章 线性控制系统的能控性和能观性
第三章 线性控制系统的能控性和能观性
线性定常系统的能控性
线性定常系统的能观性
线性时变系统的能控性与能观性
能控性与能观性的对偶关系
状态空间表达式的能控能观标准型
线性系统的结构分解
第三章 线性控制系统的能控性和能观性
能控性和能观性是现代控制理论中两个非常重要的概念,是反馈控制与最优控制的基础。
u x y
系统的能控、能观指的是系统的状态能控、能观。
如果通过控制量u可使系统的每一个状态变量由初始状态到达指定的终端状态,那
么就称系统是能控的;
如果可通过系统的输出反映每一个状态的变化,则称系统是能观的。
《现代控制理论》MOOC课程
3.1 线性定常系统的能控性
3.1 线性定常系统的能控性
一. 能控性的定义
不完全能控:若系统在状态空间中至少存在一个非零状态是不能控的,则称系统是不完全
能控的。
𝒙𝟐
𝒙 𝒕𝟎
ഥ
𝒙 𝒕𝟎
𝒖 𝑡
𝒙𝟏
𝟎 𝒙 𝒕𝟏
3.1 线性定常系统的能控性
二 线性定常系统的能控性判别
由系统完全能控的定义,若系统在状态空间中任一非零的初始状态,均能找到一个
容许控制,使系统在有限的时间内转移到平衡状态,则称系统是完全能控的。
现在的问题是系统要满足什么条件,这样的控制才存在。
3.1 线性定常系统的能控性
1. Gram(格拉姆)矩阵判据
线性定常系统: 𝒙ሶ =A𝒙+B 𝒖 ,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
为完全能控的充分必要条件为,存在时刻 𝑡1 > 0 使如下定义的GRAM矩阵
𝑡1
𝒙 𝑡1 = 𝒆𝑨𝑡1 𝒙(0) + න 𝒆𝑨(𝑡1−𝑡) 𝑩𝒖 𝑡 𝒅𝑡 = 𝒆𝑨𝑡1 𝒙𝟎 − න 𝒆𝑨(𝑡1−𝑡) 𝑩(𝒆−𝑨𝑡 𝑩)𝑻 𝑊𝐶−1 [0, 𝑡1 ]𝒙𝟎 𝒅𝑡
0 0
齐次代数方程解的性质 3.1 线性定常系统的能控性
1. Gram(格拉姆)矩阵判据
𝑡1
因此有 𝑥ҧ0 𝑇 𝑊𝑐 [0, 𝑡1 ] 𝑥ҧ0 = 𝑥ҧ0 𝑇 න (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝒅𝑡 𝑥ҧ0 = න 𝑥ҧ0 𝑇 (𝒆−𝑨𝑡 𝑩)(𝒆−𝑨𝑡 𝑩)𝑻 𝑥ҧ0 𝒅𝑡
0 0
3.1 线性定常系统的能控性
𝑡1
𝑡1 𝑡1
𝑻 𝑻 𝑻 2
= න [𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 ]𝑇 [𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 ]𝒅𝑡 = න 𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 𝒅𝑡 = 𝟎 因此有: 𝑩𝑻 𝒆−𝑨𝑻𝑡 𝑥ҧ0 ≡0 𝑡 ∈ [0, 𝑡1 ]
0 0
𝒙 𝑡1 = 𝒆𝑨𝑡1 𝑥ҧ0 + න 𝒆𝑨(𝑡1−𝑡) 𝑩𝒖 𝑡 𝒅𝑡 = 𝒆𝑨𝑡1 𝑥ҧ0 + 𝒆𝑨𝑡1 න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡 = 𝟎 故有: 𝑥ҧ0 = − න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡
0 0 0
𝑡1 𝑻 𝑡1
𝑻
𝑥ҧ0 2 = 𝑥ҧ0 𝑇 𝑥ҧ0 = − න 𝒆−𝑨𝑡 𝑩𝒖 𝑡 𝒅𝑡 𝑥ҧ0 = − න 𝒖𝑻 (𝒕)𝑩𝑻 𝒆−𝑨 𝑡 𝑥ҧ0 𝒅𝑡 = 𝟎
0 0
因此存在一个非零的n维向量 𝛼 使 𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ] 𝛼 = 0
𝑡1
因此有 𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ]𝛼 = න [𝛼 𝑇 𝒆−𝐴𝑡 𝑩][𝛼 𝑇 𝒆−𝐴𝑡 𝑩]𝑇 𝒅𝑡 = 𝟎
0
可得 𝛼 𝑇 𝒆−𝐴𝑡 𝑩 ≡0 𝑡 ∈ [0, 𝑡1 ]
3.1 线性定常系统的能控性
𝑇 𝑨𝒊 𝒕𝒊
从而对于任意 𝑡1 > 0 有 ±𝛼 𝑩 = 0, 𝑡 ∈ [0, 𝑡1 ], i=0,1,2,⋯
𝑖!
𝟏 𝟐 𝟐 𝟏 𝟑 𝟑
因此, 𝛼 𝑇 𝐼 − 𝐴𝑡 + 𝑨 𝒕 − 𝑨 𝒕 + ⋯ 𝑩 = 𝛼 𝑇 𝑒 −𝐴𝑡 𝑩=0
2! 3!
𝑡1 𝑡1
故有, න [𝛼 𝑇 𝒆−𝐴𝑡 𝑩][𝛼 𝑇 𝒆−𝐴𝑡 𝑩]𝑇 𝒅𝑡 = 𝟎 𝛼 𝑇 {න 𝒆−𝐴𝑡 𝑩 𝒆−𝐴𝑡 𝑩 𝑇 𝒅𝑡}𝜶 = 𝟎
0 0
𝛼 𝑇 𝑊𝑐 [0, 𝑡1 ]𝜶 = 𝟎
即 𝑊𝑐 [0, 𝑡1 ] 奇异,故系统不完全能控,这与已知条件矛盾,反设不成立。于是有
rankM=n。 必要性得证。
得证
3.1 线性定常系统的能控性
例. 已知系统的状态方程为: 𝑥ሶ 1 −1 −4 −2 𝑥1 2
𝑥ሶ 2 = 0 6 1 𝑥2 + 0 𝑢
𝑥ሶ 3 1 7 −1 𝑥3 1
试判别其能控性。
解:其能控性判别矩阵为:M= 𝐵 𝐴𝐵 𝐴2 𝐵
2 −1 −4 −2 2 −4 −1 −4 −2 −4 −2
𝐵= 0 𝐴𝐵 = 0 6 1 0 = 1 𝐴2 𝐵 = 0 6 1 1 = 7
1 1 7 −1 1 1 1 7 −1 1 2
2 −4 −2 2 −4 −2
故: M= 0 1 7 rankM=rank 0 1 7 =3
1 1 2 1 1 2
所以系统完全能控。
3.1 线性定常系统的能控性
例. 已知系统的状态方程为: 𝑥ሶ 1 1 1 0 𝑥1 0 1 𝑢
𝑥ሶ 2 = 0 1 0 𝑥2 + 1 0 𝑢12
𝑥ሶ 3 0 1 1 𝑥3 0 1
试判别其能控性。
解:其能控性判别矩阵为:M= 𝐵 𝐴𝐵 𝐴2 𝐵
0 1 1 1 0 0 1 1 1 1 1 0 1 1 2 1
𝐵= 1 0 𝐴𝐵 = 0 1 0 1 0=1 0 𝐴2 𝐵 = 0 1 0 1 0 = 1 0
0 1 0 1 1 0 1 1 1 0 1 1 1 1 2 1
0 1 1 1 2 1 8 3 8
故: M= 1 0 1 0 1 0 𝑇
rankM=rankM𝑀 =rank 3 3 3 =2
0 1 1 1 2 1 8 8 8
所以系统不完全能控。
3.1 线性定常系统的能控性
3. PBH秩判据
线性定常系统完全能控的充要条件是,对系统矩阵的所有特征值 𝜆𝑖 (𝑖 = 1,2, ⋯ , 𝑛) :
𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 𝑖 = 1,2, ⋯ , 𝑛
均成立。
证明:必要性:若系统完全能控,则 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n ,成立;
反设系统完全能控,但存在某个特征值 𝜆𝑖 ,有 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]<n
故必存在一个非零向量 𝜶 ,使 𝜶𝑇 [𝜆𝑖 𝑰 − 𝑨, 𝑩]=0 成立。即:
𝜶𝑇 𝑨 = 𝜆𝑖 𝜶𝑇 𝜶𝑇 𝑩 = 𝟎
由此可得:𝜶𝑇 𝑩 = 𝟎, 𝜶𝑇 𝑨𝑩 = 𝜆𝑖 𝜶𝑇 𝑩 = 0,⋯ , 𝛼 𝑇 𝑨𝒏−𝟏 𝑩 = 𝜆𝑛−1
𝑖 𝜶𝑇 𝑩 = 𝟎
证略:需用能控性分解的知识。
例. 已知系统的状态方程为: 𝑥ሶ 1 −7 0 0 𝑥1 2
𝑥ሶ 2 = 0 −5 0 𝑥2 + 0 𝑢
试判别其能控性。 𝑥ሶ 3 0 0 −1 𝑥3 9
6 0 0 2
𝑟𝑎𝑛𝑘[𝜆3 𝑰 − 𝑨, 𝑩]=rank 0 4 0 0 =3 所以系统不完全能控。
0 0 0 9
3.1 线性定常系统的能控性
4. 规范型判据
线性定常系统完全能控的充要条件为:
1). 当系统矩阵A的特征值为两两互异时,系统状态方程经线性变换导出的对角规范型:
𝜆1 ഥ𝟏
𝑩
𝜆2 ഥ
ഥሶ =
𝒙 ഥ + 𝑩𝟐 𝒖
𝒙
⋱ ⋮
𝜆𝑛 ഥ𝒏
𝑩
ഥ 𝒊 ≠ 𝟎, 𝒊 = 𝟏, 𝟐, ⋯ , 𝒏 ,即 𝑩
式中, 𝑩 ഥ 中不包含元素全为零的行。
2).当系统矩阵A的特征值存在重根时,系统状态方程经线性变换导出的约当标准型:
𝑱𝟏 ෩𝟏
𝑩
⋱ ⋮ 设特征值 𝜆𝑖 的代数重数为 𝜎𝑖 ,几何重数为 𝛼𝑖
𝑥ሶ = 𝑱𝒊 ෩𝒊 𝒖
𝑥 + 𝑩
⋱ ⋮ 𝜆𝑖 对应的第 𝑘 个约当子块的维数为 𝑟𝑖𝑘
𝑱𝒍 ෩𝒍
𝑩
则约当规范型的具体结构可表示为如下形式:
𝑱𝒊𝟏 3.1 线性定常系统的能控性
⋱ 𝜆𝑖 1
𝑱𝒊 = 𝑱𝒊𝒌 𝜆𝑖 ⋱
⋱ 𝑱𝒊𝒌 =
⋱ 1
𝑱𝒊𝜶𝒊 𝜆𝑖
෩𝟏 ෩ 𝒊𝟏
𝑩 ഥ𝟏
𝑱𝟏 𝑩 𝒃 𝒊𝒌
⋱ ⋮ ⋮ ഥ𝟐
෩ 𝒊𝒌
෩𝒊 = 𝑩 ෩ 𝒊𝒌 = 𝒃
𝑥ሶ = 𝑱𝒊 ෩𝒊 𝒖
𝑥 + 𝑩 𝑩 𝑩 𝒊𝒌
⋱ ⋮ ⋮
⋮ ഥ𝒓
𝑱𝒍 ෩𝒍 ෩ 𝒊𝜶
𝑩 𝒃
𝑩 𝒊
𝒊𝒌
෩ 𝒊 不全为0;
1)若 𝜎𝑖 =1 ,则 𝜆𝑖 对应的输入矩阵 𝑩
෩ 𝒊 的最后一行不全为0;
2)若 𝜎𝑖 >1, 𝛼𝑖 =1 ,则 𝜆𝑖 对应的输入矩阵 𝑩 ഥ𝒓
𝒃 𝒊𝟏
ഥ𝒓
𝒃
3)若 𝛼𝑖 >1 ,则 𝜆𝑖 对应的每一个约当子块最后一行对应的输入矩阵行组成的矩阵 𝒊𝟐
⋮
均为行线性无关。 ഥ𝒓
𝒃 𝒊𝜶 𝒊
3.1 线性定常系统的能控性
证明:
1. 对角规范型判据
𝐵ത1 𝜆1 𝐵ത1 ⋯ 𝜆1𝑛−1 𝐵ത1
ത
𝑛−1 ത = 𝐵2 𝜆2 𝐵ത2 ⋯ 𝜆𝑛−1
2 𝐵2
ത
M= 𝐵ത 𝐽𝐵ത ⋯ 𝐽 𝐵
⋮ ⋮ ⋯ ⋮
𝐵ത𝑛 𝜆𝑛 𝐵ത𝑛 ⋯ 𝜆𝑛−1
𝑛 𝐵𝑛
ത
若 𝐵ത 存在全为0的行,则 M 阵也存在全为0的行。则rankM<n,根据秩判据,系统不
完全能控。故系统完全能控的充要条件为:
ഥ 𝑖 ≠ 0,
𝑩 𝑖 = 1,2, ⋯ , 𝑛
2.对约当规范型判据
应用PBH秩判据 𝑟𝑎𝑛𝑘[𝜆𝑖 𝑰 − 𝑨, 𝑩]=n, 可导出约当规范型完全能控的充要条件。
3.1 线性定常系统的能控性
现以一实例加以说明,取7维系统
𝜆1 𝑏111
𝑏1
𝜆2 1 𝑏121 𝑏2
𝜆2 𝐵11 𝑏221
𝐵1 𝑏3
𝐴= 𝜆3 1 𝐵21
𝐵 = 𝐵2 = = 𝑏131 = 𝑏4
𝜆3 𝐵31
𝐵3 𝑏231 𝑏5
𝐵32
𝜆3 1 𝑏6
𝑏132
𝜆3 𝑏7
𝑏232
系统特征根类型为:
𝜆1 为单根,𝜎1 = 1,𝛼1 = 1,对应的输入矩阵为B矩阵的第一行 𝑏1 = 𝑏111
当 𝜆 = 𝜆1 时:
0 b111
1 2 1 b121
1 2 b221
[1I A, B ] 1 3 1 b131 只要 𝑏1 = 𝑏111 ≠ 0, rank[𝜆1 𝐼 − 𝐴, 𝐵]=7
1 3 b231
1 3 1 b132
1 3 b232
当 𝜆 = 𝜆2 时:
2 1 b111
0 1 b121
b221
0
只要 𝑏3 = 𝑏221 ≠ 0, rank[𝜆2 𝐼 − 𝐴, 𝐵]=7
[2 I A, B ] 2 3 1 b131
2 3 b231
2 3 1 b132
2 3 b232
3.1 线性定常系统的能控性
4. 规范型判据
当 𝜆 = 𝜆3 时:
3 1 b111
3 2 1 b121
3 2 b221
[3 I A, B ] 0 1 b131
0 b231
0 1 b132
0 b232
𝑏231
只要 rank 𝑏 =2 就有 rank[𝜆3 𝐼 − 𝐴, 𝐵]=7
232
由PBH判据,三个特征值对应的秩判别矩阵的秩均等于系统维数时,系统完全能控。
3.1 线性定常系统的能控性
4. 规范型判据
例. 已知系统的状态方程为:
𝑥ሶ 1 7 0 0 𝑥1 2 𝑥ሶ 1 7 0 0 𝑥1 2
1. 𝑥ሶ 2 = 0 5 0 𝑥2 + 0 𝑢 2. 𝑥ሶ 2 = 0 5 0 𝑥2 + 5 𝑢
0 0 −1 𝑥3 𝑥ሶ 3 0 0 −1 𝑥3 7
𝑥ሶ 3 9
𝑥ሶ 1 −4 1 0 𝑥1 0
𝑥ሶ 1 7 0 0 𝑥1 0 1 𝑢 𝑥ሶ 2 = 0 −4 0 𝑥2 + 4 𝑢
3. 𝑥ሶ 2 = 0 5 0 𝑥2 + 4 0 𝑢12 4.
𝑥ሶ 3 0 0 −2 𝑥3 3
𝑥ሶ 3 0 0 −1 𝑥3 7 5
𝑥ሶ 1 −4 1 0 0 𝑥1 0 1 1 𝑢
𝑥ሶ 1 −4 1 0 𝑥1 4 2 𝑢 𝑥ሶ 2 𝑥2 1
1 6. = 0 −4 0 0 + 0 0 2 𝑢
5. 𝑥ሶ 2 = 0 −4 0 𝑥2 + 0 0 𝑢2 𝑥ሶ 3 0 0 −1 1 𝑥3 0 0 0 𝑢2
𝑥4 3
𝑥ሶ 3 0 0 −2 𝑥3 3 0 𝑥ሶ 4 0 0 0 −1 0 1 0
1, 5不完全能控,2,3,4,6完全能控。
3.1 线性定常系统的能控性
4. 规范型判据
例. 已知系统的状态方程为:
𝑥ሶ 1
−2 1 𝑥1 0 0 0
𝑥ሶ 2 𝑥2
−2 1 0 0
𝑥ሶ 3 −2 𝑥3 0 4 0 𝑢1
𝑥ሶ 4 = 𝑥4 + 0 0 7 𝑢2
−2
𝑥5 0 0 0 𝑢3
𝑥ሶ 5 −3 1
−3 𝑥6 1 0 0
𝑥ሶ 6 𝑥7 0 4 1
−3
ሶ𝑥7
1 0 0 1 0 0
0 4 0 和 均线性无关,系统完全能控。
0 4 1
0 0 7
《现代控制理论》MOOC课程
3.2 线性控制系统的能观性
3.2 线性定常系统的能观性
一. 能观性的定义
能观:对于线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥0
𝒚 =C 𝒙+D 𝒖
存在一有限的观测时间 𝑡1 > 𝑡0 ,使根据 𝑡0 , 𝑡1 期间的输出 𝒚 𝑡 ,能唯一地确定系统在 𝒕𝟎 时刻
的状态 𝒙 𝒕𝟎 ,则称状态 𝒙 𝒕𝟎 是能观测的。
完全能观:若系统的每一个非零状态都是能观测的,则称系统完全能观。
由于能观所表示的是输出反映状态变量的能力,与控制作用无直接关系,因此在分析
能观性时,可令 𝒖(𝒕) ≡ 𝟎 ,此时系统的状态方程为:
𝒙ሶ =A𝒙,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥ 𝟎
𝒚 =C 𝒙
1. Gram(格拉姆)矩阵判据
线性定常系统 𝒙ሶ =A𝒙,𝒙 𝟎 = 𝒙𝟎 ,𝑡 ≥ 𝟎
𝒚 =C 𝒙
完全能观的充要条件是:存在时刻 𝑡𝟏 > 𝟎 ,使如下定义的Gram矩阵为非奇异。
𝑡1 𝑡1
必要性:已知系统应完全能观,证明非奇异。
反证法。反设 𝑊𝑜 [0, 𝑡1 ]奇异,但系统能观。
由于 𝑊𝑜 [0, 𝑡1 ] 奇异,则必存在某个非零的向量 𝒙ഥ𝟎 ,使 𝒙ഥ𝑇0 𝑊𝑜 0, 𝑡1 𝒙ഥ𝟎 = 𝟎 成立。
3.2 线性定常系统的能观性
𝑡1 𝑡1 𝑡1
𝑻
ഥ𝑇0 𝑊𝑜 0, 𝑡1 𝒙
𝒙 ഥ𝟎 = 𝒙 ഥ𝟎 = න (𝑪𝒆𝑨𝑡 𝒙
ഥ𝑇0 න (𝑪𝒆𝑨𝑡 )𝑻 (𝑪𝒆𝑨𝑡 ) 𝒅𝑡 𝒙 ഥ𝟎 )𝑻 (𝑪𝒆𝑨𝑡 𝒙
ഥ𝟎 ) 𝒅𝑡 = න 𝒚 𝒕 𝒚 𝒕 𝒅𝑡
0 0 0
𝑡 𝟐 𝒅𝑡 =0
= 0 1 𝒚 𝒕
故 𝒚 𝒕 = 𝑪𝒆𝑨𝑡 𝒙
ഥ𝟎 = 𝟎 ∀𝑡 ∈ 0, 𝑡1
2. 秩判据
𝑪
(n× 𝑚) × 𝑚 阶能观性矩阵 N= 𝑪𝑨
线性定常系统完全能观的充要条件是: ⋮ 的秩 rankN=n
𝑪𝑨𝒏−𝟏
3.2 线性定常系统的能观性
3. PBH判据
线性定常系统完全能观的充要条件是,对矩阵A的所有特征值 𝜆𝑖 (𝑖 = 1,2, ⋯ , 𝑛)
𝑪
rankN= =n 𝑖 = 1,2, ⋯ , 𝑛
𝜆𝑖 𝑰 − 𝑨
均成立。
4. 规范型判据
线性定常系统完全能观的充要条件是:
(1) 当系统矩阵A的特征值为两两互异时,系统状态方程经线性变换导出的对角规范型
𝜆1
𝜆2 ഥ𝒙
ഥ=𝑪 ഥ = 𝒄ത1 𝒄ത 𝟐 ⋯ 𝒄ത 𝑛
ഥሶ =
𝒙 ഥ
𝒙 𝒚
⋱
𝜆𝑛
中 𝒄ത 𝒊 ≠ 𝟎 ,即 𝑪ഥ中不包含元素全为零的列。
3.2 线性定常系统的能观性
(2) 当系统矩阵A的特征值存在重根时,系统状态方程经线性变换导出的约当标准型
𝑱𝟏
⋱
ሶ =
𝒙 𝑱𝒊
𝒙 ෩𝒙
=𝑪
𝒚 = 𝒄 1 ⋯ 𝒄 𝑖 ⋯ 𝒄 𝑙
⋱
𝑱𝒍
例. 已知系统的状态方程为:
𝑥ሶ 1 4 0 𝑥1
= 𝒚= 0 −6 𝑥
𝑥ሶ 2 0 −5 𝑥2
试判别其能观性。
例. 已知系统的状态方程为:
𝑥ሶ 1 7 0 0 𝑥1
4 0 7
𝑥ሶ 2 = 0 −2 0 𝑥2 𝒚=
0 3 1
𝑥ሶ 3 0 0 1 𝑥3
试判别其能观性。
解:由于C中不包含全为0的列,故系统完全能观。
《现代控制理论》MOOC课程
3.3 线性时变系统的能控性与能观性
3.3 线性时变系统的能控性与能观性
一. 线性时变系统能控性的定义
完全能控:若系统在状态空间中的所有非零点,在时刻 𝒕𝟎 均能控,则称系统在时刻 𝒕𝟎 是
完全能控的。
不完全能控:若系统在状态空间中至少存在一个非零状态在𝒕𝟎不能控,则称系统在时刻 𝒕𝟎
是不完全能控的。
3.3 线性时变系统的能控性与能观性
二 线性时变系统的能控性判据
1. Gram(格拉姆)矩阵判据
𝑊𝑐 [𝑡0 , 𝑡1 ] = න [𝚽 𝑡0 , 𝑡 𝑩 𝑡 ][𝚽 𝑡0 , 𝑡 𝑩 𝑡 ]𝑻 𝒅𝑡
𝑡0
为非奇异。
3.3 线性时变系统的能控性与能观性
2. 秩判据
𝑥ሶ 1 0 𝑡 𝑥1 0
例. 设线性时变系统的状态方程为: = 𝑥 + 𝑢 判断系统的能控性。
𝑥ሶ 2 0 0 2 1
0 𝑀 𝑡 = 𝑴 𝑡 𝑴 𝑡 0 −𝑡
解: 𝑴0 𝑡 = 𝑩 𝑡 = 1 0 1 =
1 0
rank𝑴 𝑡 = 2
𝑴1 𝑡 = −𝑨 𝑡 𝑴0 𝑡 + 𝑀ሶ 0 𝑡 = − 0 𝑡 0 + 0 = −𝑡
0 0 1 0 0 故当 t >0 时 ,系统完全能控。
3.3 线性时变系统的能控性与能观性
三. 线性时变系统能观性的定义
四 线性时变系统的能观性判据
1. Gram(格拉姆)矩阵判据
𝑊𝑜 [𝑡0 , 𝑡1 ] = න [𝑪 𝑡 𝚽 𝑡, 𝑡0 ]𝑻 [𝑪 𝑡 𝚽 𝑡, 𝑡0 ] 𝒅𝑡
𝑡0
为非奇异。
3.3 线性时变系统的能控性与能观性
2. 秩判据
的秩 rank𝑁(𝑡1 ) = 𝑛 。
其中,n为系统矩阵的维数; 𝑵0 𝑡 = 𝑪 𝑡
𝑑
𝑵𝑘+1 𝑡 = 𝑵𝑘 𝑡 𝑨 𝑡 + 𝑵
𝑑𝑡 𝑘
𝑡 k=0,1,⋯,n-2
3.3 线性时变系统的能控性与能观性
例. 设线性时变系统的 A (t )、 C (t ) 为:
t 1 0
A(t ) 0 t 0 C (t ) 1 0 1
2
0 0 t
判断系统的能观性。
解: N 0 (t ) C (t ) 1 0 1 t 1 0
N1 (t ) N 0 (t ) A(t ) N 0 (t ) 1 0 10 t 0 0 0 0 t 1 t 2
2
0 0 t
𝑡 1 0
𝑁2 𝑡 = 𝑁1 𝑡 𝐴 𝑡 + 𝑁ሶ 1 𝑡 = 𝑡 1 𝑡2 0 𝑡 0 + 1 0 2𝑡
0 0 𝑡2
= 𝑡 2 + 1 2𝑡 2𝑡 + 𝑡 4
3.3 线性时变系统的能控性与能观性
𝑁0 𝑡 1 0 1
故 𝑁 𝑡 = 𝑁1 𝑡 = 𝑡 1 𝑡2
𝑁2 𝑡 𝑡2 + 1 2𝑡 2𝑡 + 𝑡 4
只要 t 0, 有 rankN 3 ,故系统完全能观。
《现代控制理论》MOOC课程
3.4 能控与能观性的对偶关系
3.4 能控与能观性的对偶关系
一. 对偶系统的定义
1. 线性时变对偶系统
对于线性时变系统σ 1: 𝒙ሶ 𝟏 =A 𝑡 𝒙𝟏 +B 𝑡 𝒖𝟏
𝒚𝟏 =C 𝑡 𝒙𝟏
𝒙ሶ = −𝑨 𝑻 𝑡 𝒙 +𝑪𝑻 𝑡 𝒖
σ
则定义如下构成的线性时变系统 2: 𝟐 𝟐 𝟐
𝒚𝟐 = 𝑩𝑻 (𝒕)𝒙𝟐
称为系统σ 1的对偶系统。
2. 线性定常对偶系统
对于线性定常系统σ 1: 𝒙ሶ 𝟏 =A𝒙𝟏 +B 𝒖𝟏
𝒚𝟏 =C 𝒙𝟏
则定义如下构成的线性定常系统:
𝒙ሶ 𝟐 = −𝑨𝑻 𝒙𝟐 +𝑪𝑻 𝒖𝟐 𝒙ሶ 𝟐 = 𝑨𝑻 𝒙𝟐 +𝑪𝑻 𝒖𝟐
σ 2: 或 σ 2:
𝒚𝟐 = 𝑩𝑻 𝒙𝟐 𝒚𝟐 = 𝑩𝑻 𝒙𝟐
称为系统的σ 1对偶系统。
维输出向量。
3.4 能控与能观性的对偶关系
二. 线性时变系统的对偶原理
1. 互为对偶的两系统的状态转移矩阵互为转置逆
由: 𝜱1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 = 𝐼
𝑑
对上式两边求导可得: 𝑑𝑡 [𝜱1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 ] = 0
3.4 能控与能观性的对偶关系
𝜱ሶ 1 𝑡, 𝑡0 𝜱1−1 𝑡, 𝑡0 + 𝜱1 𝑡, 𝑡0 𝜱ሶ 1−1 𝑡, 𝑡0 = 0
𝑨(𝑡) + 𝜱1 𝑡, 𝑡0 𝜱ሶ 1 𝑡0 , 𝑡 = 0
𝜱ሶ 1 𝑡0 , 𝑡 = −𝜱1 𝑡0 , 𝑡 𝑨 𝑡
由状态转移矩阵的唯一性可得: 𝜱2 𝑡, 𝑡0 = 𝜱1𝑇 𝑡0 , 𝑡
得证
3.4 能控与能观性的对偶关系
2. 对偶原理
σ 1的能观性等价于系统σ 2能控性。
𝑡1
即 σ 1系统的能控性等价于σ 2的能观性。
1. 互为对偶的两系统的状态转移矩阵互为转置逆
对于线性定常系统σ 1:[A,B,C ]
当对偶系统σ 2表示为:[−𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 ]
系统 σ 1 、σ 2 的状态转移矩阵分别为𝜱1 𝑡 − 𝑡0 、𝜱𝟐 (𝑡 − 𝑡0 )
𝑇 (𝑡 −𝑡)
则有: 𝜱1 𝑡 − 𝑡0 = 𝑒 𝐴(𝑡−𝑡0) , 𝜱1𝑇 𝑡 − 𝑡0 −1 = 𝑒𝐴 0
𝑇 (𝑡 −𝑡)
𝜱2 𝑡 − 𝑡0 = 𝑒 −𝐴
𝑇 (𝑡−𝑡 )
0 = 𝑒𝐴 0 = 𝜱1𝑇 𝑡0 − 𝑡
满足状态转移矩阵互为转置逆的性质。
当对偶系统σ 2表示为:[𝑨𝑻 , 𝑪𝑻, 𝑩𝑻 ]
𝐴𝑇 (𝑡−𝑡0 )
则有: 𝜱2 𝑡 − 𝑡0 = 𝑒 = 𝜱1𝑇 𝑡 − 𝑡0 ≠ 𝜱1𝑇 𝑡0 − 𝑡 即不满足状态转移矩阵互为转置逆的性质。
3.4 能控与能观性的对偶关系
2. 对偶原理
σ 1完全能观等价于系统σ 2 完全能控。
证明:
当对偶系统σ 2表示为:[−𝑨𝑻 , 𝑪𝑻, 𝑩𝑻 ]
𝑡1 𝑡1
𝑻 (𝒕−𝑡0 ) ]𝑻 [𝑩𝑻 𝒆−𝑨𝑻 (𝒕−𝑡0 ) ] 𝒅𝑡
𝑊σ 2𝑂 [𝑡0 , 𝑡1 ] = න [𝑩𝑻 𝒆−𝑨 = න [𝒆𝑨(𝑡0−𝒕) 𝑩][𝒆𝑨(𝑡0−𝒕) 𝑩]𝑻 𝒅𝑡= 𝑊σ 1𝑐 [𝑡0 , 𝑡1 ]
𝑡0 𝑡0
𝑡1 𝑡1
−𝑨𝑻 (𝑡0 −𝒕) 𝑻 −𝑨𝑻 (𝑡0 −𝒕) 𝑻 𝑻
𝑊σ 2𝐶 [𝑡0 , 𝑡1 ] = න [𝒆 𝑪 ][𝒆 𝑪 ] 𝒅𝑡 = න [𝑪𝒆𝑨 (𝒕−𝑡0) ]𝑻 [𝑪𝒆𝑨 (𝒕−𝑡0) ] 𝒅𝑡 = 𝑊σ 1𝑂 [𝑡0 , 𝑡1 ]
𝑡0 𝑡0
2. 对偶原理
𝐵𝑇
𝐵 𝑇 𝐴𝑇
𝑇 𝑇
𝑵Σ2 = ⋮ = 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩 = 𝑴Σ1
𝐵𝑇 (𝐴𝑇 )(𝑛−1)
3.5 状态空间表达式的能控标准型与能观标准型
3.5 状态空间表达式的能控性标准型与能观标准型
一.能控性与能观性的不变性
𝒙ሶ =A𝒙 + 𝑩𝒖
定理:在任意非奇异线性变换下,线性定常系统 的能控性和能观性不变。
𝒚 = 𝑪𝒙
证明:令P为n×n维非奇异线性矩阵,对系统作如下变换 𝒙 = 𝑷𝒙 ,则系统状态方程为:
ሶ = 𝑨
𝒙 ෩𝒙 ෩𝒖
+𝑩
෩ ෩ =PA𝑷−𝟏 , 𝑩
其中,𝑨 ෩=C 𝑷−𝟏
෩ =PB, 𝑪
=𝑪
𝒚 𝒙
෩ 𝑨
由: 𝑩 ෩𝑩෩ ⋯ 𝑨
෩ 𝒏−𝟏 𝑩
෩ = 𝑷𝑩 𝑷𝑨𝑩 ⋯ 𝑷𝑨𝒏−𝟏 𝑩 =P 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩
෩
𝑪 C 𝑷−𝟏 C
෩𝑨෩ = 𝑪𝑨 𝑷−𝟏
𝑪 = 𝑪𝑨 𝑷−𝟏
⋮ ⋮ ⋮
෩𝑨
𝑪 ෩ 𝒏−𝟏 𝑪𝑨𝒏−𝟏 𝑷−𝟏 𝑪𝑨𝒏−𝟏
由于非奇异变换不改变矩阵的秩 ෩
𝑪 C
෩𝑨෩
෩ 𝑨
故 rank 𝑩 ෩𝑩෩ ⋯ 𝑨 ෩ =r𝑎𝑛𝑘 𝑩 𝑨𝑩 ⋯ 𝑨𝒏−𝟏 𝑩
෩ 𝒏−𝟏 𝑩 rank 𝑪 = 𝑟𝑎𝑛𝑘 𝑪𝑨
⋮ ⋮
෩𝑨
𝑪 ෩ 𝒏−𝟏 𝑪𝑨𝒏−𝟏
即非奇异线性变换不改变系统的能控能观性。 得证。
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
ሶ
结论:对于完全能控的单输入单输出线性定常系统 𝒙 =A𝒙 + 𝒃𝒖 存在线性非奇异变换 𝒙 = 𝑻𝑪𝟏 ഥ𝒙
y=𝑪𝒙
其中: 𝟏
𝒂𝒏−𝟏 𝟏
𝑻𝑪𝟏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 = 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯ 𝒃 ⋮ ⋮ ⋱
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏
𝒆𝟏 =𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃
𝒆𝒏 =𝒃
𝒂𝒊 ( 𝒊 = 𝟎, 𝟏, ⋯,n-1) 为系统特征多项式 𝝀𝑰 − 𝑨 = 𝝀𝒏 + 𝒂𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂𝟏 𝝀 + 𝒂𝟎 = 𝟎 的系数。
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
ഥ𝒙 ഥ𝒖
能够使状态空间表达式化成如下形式的能控标准型(I型):𝒙ഥሶ = 𝑨 ഥ + 𝒃ഥ
𝒚 ഥഥ
ഥ =𝑪 𝒙
其中: 0
0 1 ⋯ 0
ഥ = 𝑻𝑪𝟏 −𝟏 A𝑻𝑪𝟏 ⋮ ⋮ ⋱ ⋮ ഥ = 𝑻𝑪𝟏 −𝟏 𝒃 = ⋮
𝒃
𝑨 = 0 0 … 1 0 ഥ = 𝑪𝑻𝑪𝑰 = 𝜷𝟎
𝑪 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 1
𝜷𝒏−𝟏 =C𝒃
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
证明:(1)推导 𝑨 ഥ
ഥ = 𝑻𝑪𝟏 −𝟏 A𝑻𝑪𝟏 可得 𝑻𝑪𝑰 𝑨
由 𝑨 ഥ = A𝑻𝑪𝑰 =A 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 = A𝒆𝟏 A𝒆𝟐 ⋯ A𝒆𝒏
A𝒆𝟐 =A(𝑨𝒏−𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟑 𝒃 + ⋯ + 𝒂𝟑 𝑨𝒃 + 𝒂𝟐 𝒃)=(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃) −𝒂𝟏 𝒃 =𝒆𝟏 −𝒂𝟏 𝒆𝒏
⋮
𝑨𝒆𝒏−𝟏 =A(𝑨𝒃 + 𝒂𝒏−𝟏 𝒃) = (𝑨𝟐 𝒃 + 𝒂𝒏−𝟏 𝑨𝒃 + 𝒂𝒏−𝟐 𝒃) − 𝒂𝒏−𝟐 𝒃=𝒆𝒏−𝟐 − 𝒂𝒏−𝟐 𝒆𝒏
0 1 ⋯ 0 0 1 ⋯ 0
ഥ = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
𝑻𝑪𝟏 𝑨 0 0 … 1 = 𝑻𝑪𝟏 0 0 … 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 −𝑎0 −𝑎1 ⋯ −𝑎𝑛−1
0 1 ⋯ 0
ഥ= ⋮
故有:𝑨
⋮ ⋱
…
⋮
0 0 1
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1
(2)推导 𝒃ഥ
0 0 0
⋮ =𝑻 ⋮ ഥ= ⋮
由:𝒃ഥ = 𝑻𝑪𝟏 −𝟏 𝒃 可得 𝑻𝑪𝟏 𝒃ഥ = 𝒃 = 𝒆𝒏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 0 𝑪𝑰 0 故 𝒃
0
1 1 1
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
(3)推导 𝑪ഥ
𝟏
𝒂𝒏−𝟏 𝟏
ഥ = 𝑪𝑻𝑪𝟏 = 𝑪 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯
𝑪 𝒃 ⋮ ⋮ ⋱ = 𝜷𝟎 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏
可得
𝜷𝟎 =C(𝑨𝒏−𝟏 𝒃 + 𝒂𝒏−𝟏 𝑨𝒏−𝟐 𝒃 + ⋯ + 𝒂𝟐 𝑨𝒃 + 𝒂𝟏 𝒃)
𝜷𝒏−𝟏 =C𝒃
得证
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
例. 将下列状态空间表达式
1 2 0 2
𝒙ሶ = 3 −1 1 𝒙 + 1 𝒖 y= 0 0 1 𝒙
0 2 0 1
变换为能控标准I型。
解.判别系统的可控性
2 4 16
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 1 6 8 rankM=3 系统完全能控
1 2 12
计算系统的特征多项式:det(𝝀𝑰 − 𝑨) = 𝝀𝟑 − 𝟗𝝀 + 𝟐 = 𝟎
可得 𝒂𝟎 = 𝟐, 𝒂𝟏 = −𝟗, 𝒂𝟐 = 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
二. 能控标准I型变换
可得: 0 1 0 𝟎
ഥ= 0 0 ഥ= 𝟎
𝒃
𝑨 1
𝟏
−2 9 0
𝟏 𝟎 𝟎 16 4 2 𝟏 𝟎 𝟎
ഥ = 𝑪𝑻𝑪𝟏
𝑪 = 𝑪 𝑨𝟐 𝒃 𝑨𝒃 𝒃 𝒂𝟐 𝟏 𝟎 = 0 0 1 8 6 1 𝟎 𝟏 𝟎= 3 2 1
𝒂𝟏 𝒂𝟐 𝟏 12 2 1 −𝟗 𝟎 𝟏
有能控标准I型为:
0 1 0 𝟎
𝒙ሶ = 0 0 1 𝒙+ 𝟎 𝒖 𝒚= 3 2 1𝒙
−2 9 0 𝟏
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换
结论:对于完全能控的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
能够使状态空间表达式化成如下形式的能控标准型(II型):
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙
其中:
𝟎 𝟎 ⋯ 𝟎 −𝑎0
𝟏 𝟎 ⋯ 𝟎 −𝑎1 1
ഥ = 𝑻𝑪𝟐 −𝟏 A𝑻𝑪𝟐
𝑨 = 𝟎 𝟏 ⋯ 𝟎 −𝑎2 ഥ = 𝑻𝑪𝟐 −𝟏 𝒃 = 0
𝒃
⋮ ⋮
𝟎 𝟎 ⋱ ⋮
0
𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1
ഥ = 𝑪𝑻𝑪𝟐 = 𝜷𝟎
𝑪 𝜷𝟏 ⋯ 𝜷𝒏−𝟏 𝜷𝟎 =C𝒃, 𝜷𝟏 =C𝑨𝒃, ⋯ , 𝜷𝒏−𝟏 =C𝑨𝒏−𝟏 𝒃
ഥ
证明:(1)推导 𝑨
ഥ =A𝑻𝑪𝟐 = A 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃 = A𝒃 𝑨𝟐 𝒃 ⋯ 𝑨𝒏 𝒃
ഥ = 𝑻𝑪𝟐 −𝟏 A𝑻𝑪𝟐 可得 𝑻𝑪𝟐 𝑨
由 𝑨
𝟎 𝟎 ⋯ 𝟎 −𝑎0 𝟎 𝟎 ⋯ 𝟎 −𝑎0
𝟏 𝟎 ⋯ 𝟎 −𝑎1 𝟏 𝟎 ⋯ 𝟎 −𝑎1
ഥ = 𝒃 𝑨𝒃 ⋯ 𝑨𝒏−𝟏 𝒃 𝟎
𝑻𝑪𝟐 𝑨 𝟏 ⋯ 𝟎 −𝑎2 故 ഥ= 𝟎
𝑨 𝟏 ⋯ 𝟎 −𝑎2
𝟎 𝟎 ⋱ ⋮ ⋮ 𝟎 𝟎 ⋱ ⋮ ⋮
𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1 𝟎 𝟎 ⋯ 𝟏 −𝑎𝑛−1
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换
(2)推导 𝒃ഥ
1 1 1
0 =𝑻 0 ഥ= 0
由:𝒃ഥ = 𝑻𝑪𝟐 −𝟏 𝒃 可得 𝑻𝑪𝟐 𝒃ഥ = 𝒃 = 𝒆𝟏 = 𝒆𝟏 𝒆𝟐 ⋯ 𝒆𝒏 ⋮ 𝑪𝟐 ⋮ 故 𝒃
⋮
0 0 0
(3)推导 𝑪ഥ
ഥ = 𝑪𝑻𝑪𝟐 = 𝑪 𝒃 𝑨𝒃 ⋯
𝑪 𝑨𝒏−𝟏 𝒃 = 𝜷𝟎 𝜷𝟏 ⋯ 𝜷𝒏−𝟏
得证
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换
例. 将下列状态空间表达式
1 2 0 2
𝒙ሶ = 3 −1 1 𝒙 + 1 𝒖 y= 0 0 1 𝒙
0 2 0 1
变换为能控标准II型。
解.判别系统的可控性
2 4 16
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 1 6 8 rankM=3 系统完全能控
1 2 12
计算系统的特征多项式:det(𝝀𝑰 − 𝑨) = 𝝀𝟑 − 𝟗𝝀 + 𝟐 = 𝟎
可得 𝒂𝟎 = 𝟐, 𝒂𝟏 = −𝟗, 𝒂𝟐 = 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
三. 能控标准II型变换
可得: 0 0 −2 𝟏
ഥ= 1 ഥ= 𝟎
𝒃
𝑨 0 9
𝟎
0 1 0
2 4 16
ഥ = 𝑪𝑻𝑪𝟐 = 𝑪 𝒃 𝑨𝒃 𝑨𝟐 𝒃 = 0 0 1
𝑪 1 6 8 = 1 2 12
1 2 12
有能控标准II型为:
0 0 −2 𝟏
𝒙ሶ = 1 0 9 𝒙+ 𝟎 𝒖 y= 1 2 12 𝒙
0 1 0 𝟎
3.5 状态空间表达式的能控标准型与能观标准型
四. 能观标准I型变换
结论:对于完全能观的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
𝑪
存在线性非奇异变换 𝒙ഥ = 𝑻𝒐𝟏 𝒙 , 𝑻𝒐𝟏 =N= 𝑪𝑨
⋮
𝑪𝑨𝒏−𝟏
能够使状态空间表达式化成如下形式的能观标准I型:
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙
其中: 𝜷𝟎
0 1 ⋯ 0
ഥ = 𝑻𝒐𝟏 A𝑻𝒐𝟏 −𝟏
𝑨 = 0
⋮ ⋮ ⋱ ⋮ ഥ = 𝑻𝒐𝟏 𝒃 = 𝜷𝟏
𝒃
0 … 1 ⋮ ഥ = 𝑪𝑻𝒐𝟏 −𝟏 = 𝟏 𝟎
𝑪 ⋯ 𝟎
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 𝜷𝒏−𝟏
3.5 状态空间表达式的能控标准型与能观标准型
五. 能观标准II型变换
结论:对于完全能观的单输入单输出线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
𝟏 𝒂𝒏−𝟏 ⋯ 𝒂𝟐 𝒂𝟏 𝒏−𝟏
𝟎 𝟏 ⋯ 𝒂𝟑 𝒂𝟐 𝑪𝑨
存在线性非奇异变换 𝒙ഥ = 𝑻𝒐𝟐 𝒙 , 𝑻𝒐𝟐 = ⋮ ⋮ ⋱ ⋮ ⋮ ⋮
⋯ 𝟏 𝒂𝒏−𝟏 𝑪𝑨
𝟎 𝟎
𝑪
𝟎 𝟎 ⋯ 𝟎 𝟏
能够使状态空间表达式化成如下形式的能观标准II型:
ഥ𝒙
ഥሶ = 𝑨
𝒙 ഥ𝒖
ഥ + 𝒃ഥ
ഥ =𝑪
𝒚 ഥഥ
𝒙
其中:
0 0 ⋯ 0 −𝑎0 𝜷𝟎
1 0 ⋯ 0 −𝑎1
ഥ = 𝑻𝒐𝟐 A𝑻𝒐𝟐 −𝟏 ഥ = 𝑻𝒐𝟐 𝒃 = 𝜷𝟏
𝒃
𝑨 = 0 1 ⋯ 0 −𝑎2 ⋮ ഥ = 𝑪𝑻𝒐𝟐 −𝟏 = 𝟎 ⋯
𝑪 𝟎 𝟏
0 0 ⋱ ⋮ ⋮ 𝜷𝒏−𝟏
0 0 ⋯ 1 −𝑎𝑛−1
《现代控制理论》MOOC课程
3.6 线性系统的结构分解
3.6 线性系统的结构分解
一. 能控性分解
结论:对于不完全能控的n阶线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
y=𝑪𝒙
其能控性判据 M= 𝑩 𝑨𝑩 ⋯ 𝑨n−1 𝑩 的秩为 rankM=𝑛1 < 𝑛
则存在非奇异变换 𝒙=𝑹𝑪 𝒙 ,将系统的状态空间表达式变换为按能控性分解的规范表达式
ሶ 𝒄
𝒙 ෩𝒄
𝑨 ෩ 𝟏𝟐 𝒙
𝑨 𝒄 𝑩 ෩𝒄
= + 𝒖
ሶ𝒙
𝒄ത 𝟎 ෩
𝑨𝒄ത
𝒙 𝒄ത 𝟎
𝒄
𝒙
෩𝒄
𝒚= 𝑪 ෩
𝑪𝒄ത
𝒄ത
𝒙
其中,变换阵 𝑹𝑪 按照如下方式选取,𝑹𝑪 的前𝒏𝟏 个列向量为能控性判别阵M中任意𝒏𝟏 个线
讨论
不完全能控系统可被分解能控部分和不能控部分,其能控部分的 𝒏𝟏 阶子系统可表示为
ሶ 𝒄 = 𝑨
𝒙 ෩𝒄𝒙 ෩ 𝟏𝟐 𝒙
𝒄 +𝑨 ෩𝒄 𝒖
𝒄ത +𝑩
෩𝒄 𝒙
𝒚𝟏 = 𝑪 𝒄
不能控的 𝒏 − 𝒏𝟏 阶子系统可表示为:
ሶ 𝒄ത = 𝑨
𝒙 ෩ 𝒄ത 𝒙
𝒄ത
𝒚𝟐 = 𝑪 ෩𝒄ത 𝒙𝒄ത
෩𝒄
𝒔𝑰 − 𝑨 −𝑨෩ 𝟏𝟐
෩ =det
由于 𝒅𝒆𝒕 𝒔𝑰 − 𝑨 = 𝒅𝒆𝒕 𝒔𝑰 − 𝑨 = 𝒅𝒆𝒕 𝒔𝑰 − ෩ 𝒄 𝒅𝒆𝒕(𝒔𝑰 − 𝑨
𝑨 ෩ഥ𝒄)
𝟎 ෩ഥ𝒄
𝒔𝑰 − 𝑨
෩ 𝒄的特征值,称为系统的能控振型;另一部
故系统的特征值,被分为两部分。一部分为 𝑨
෩ 𝒄ത 的特征值,称为系统的不能控振型。输入只能改变能控振型的位置,而不能改变
分为 𝑨
不能控振型的位置。
3.6 线性系统的结构分解
讨论
系统的不能控子系统是不受外部输入作用影响的子系统。
由于变换阵𝑹𝑪的选取不是唯一的,因此能控性分解的结果也是不唯一的。
例:将如下系统按能控性进行结构分解:
1 2 −1 0
𝑨= 0 1 0 , 𝑩= 0 , C= 1 −1 1
0 −4 3 1
解:系统的能控性秩判别矩阵为:
0 −1 −4 0 −1 0 3 0 1
M= 𝐵 𝐴𝐵 𝐴2 𝐵 = 0 0 0 rankM=2 取 𝑅𝑐 = 0 0 1 𝑅𝐶−1 = −1 0 0
1 3 9 1 3 0 0 1 0
3.6 线性系统的结构分解
做如下线性变换 :𝒙 =𝑹𝑪 𝒙 得:
3 0 1 1 2 −1 0 −1 0 0 −3 2
ഥ =𝑹−𝟏
𝑨 𝑪 𝑨𝑹𝑪 = −1 0 0 0 1 0 0 0 1 = 1 4 −2
0 1 0 0 −4 3 1 3 0 0 0 1
3 0 1 0 1 0 −1 0
ഥ =𝑹−𝟏
𝑩 𝑪 𝑩 = −1 0 0 0 = 0 ഥ=𝑪𝑹𝑪 = 1 −1
𝑪 1 0 0 1 = 1 2 −1
0 1 0 1 0 1 3 0
得能控分解标准型为:
ሶ𝒙𝒄 0 −3 2
𝒄 1
𝒙 𝒄
𝒙
= 1 4 −2 +0 𝒖 𝒚= 1 2 −1
ሶ𝒙
𝒄ത
𝒙 𝒄ത 𝒄ത
𝒙
0 0 1 0
能控子系统为: 不能控子系统为:
0 −3 2 1
ሶ 𝒄 =
𝒙 𝒄 +
𝒙 𝒄ത + 𝒖
𝒙 ሶ 𝒄ത = 1 𝒙
𝒙 𝒄ത
1 4 −2 0
𝒚𝟏 = 1 2 𝒙 𝒄 𝒚𝟐 = −1 𝒙 𝒄ത
3.6 线性系统的结构分解
二. 能观性分解
结论:对于不完全能观的n阶线性定常系统 𝒙ሶ =A𝒙 + 𝒃𝒖
𝑪 y=𝑪𝒙
其能观性判据 N= 𝑪𝑨
⋮ 的秩为 rankN=𝑛1 < 𝑛
𝑪𝑨𝒏−𝟏
则存在非奇异变换 𝒙 = 𝑹𝑶 𝒙 ,将系统的状态空间表达式变换为按能观性分解的规范表达式
ሶ 𝑶
𝒙 ෩𝑶
𝑨 𝟎 𝒙 𝑶 ෩𝑶
𝑩
= + 𝒖
ሶ𝒙
𝑶ഥ ෩ 𝟐𝟏
𝑨 ෩
𝑨𝑶ഥ
𝒙 ഥ
𝑶 ෩
𝑩𝑶ഥ
𝑶
𝒙
෩𝑶
𝒚= 𝑪 𝟎
𝒙𝑶ഥ
其中,变换阵 𝑹𝑶 按照如下方式选取,𝑹𝑶的前𝒏𝟏 个行向量为能观性判别阵N中任意 𝒏𝟏个线
做线性变换: 𝒙=𝑹𝑶 𝒙 得
1 −1 1 −2 2 −1 0 0 1 0 1 0
ഥ =𝑹𝑶 𝑨𝑹−𝟏
𝑨 𝑶 = −1 0 −1 0 −2 0 −1 −1 0 = −2 −3 0
1 0 0 1 −4 0 0 −1 −1 −2 −1 −1
1 −1 1 0 1
ഥ =𝑹𝑶 𝑩 = −1 0
𝑩 −1 0 = −1
1 0 0 1 0
3.6 线性系统的结构分解
0 0 1
ഥ=𝑪𝑹−𝟏
𝑪 𝑶 = 1 −1 1 −1 −1 0 = 1 0 0
0 −1 −1
得能观性分解标准型为:
0 1 0
ሶ 𝑶
𝒙 𝑶
𝒙 1
= −2 −3 0 + −1 𝒖
ሶ 𝑶ഥ
𝒙 −2 −1 −1
𝑶ഥ
𝒙 0
𝑶
𝒙
𝒚= 1 0 0
𝑶ഥ
𝒙
得能观子系统为: 不能观子系统为:
ሶ 𝑶 =
𝒙
0
1
𝑶 +
𝒙
1
𝒖
ሶ 𝑶ഥ = −𝟏 𝒙
𝒙 𝑶ഥ + −𝟐 𝑶
−𝟏 𝒙
−2
−3 −1
𝑶
𝒚𝟏 = 𝟏 𝟎 𝒙
3.6 线性系统的结构分解
三. 能控性和能观性分解
𝒙ሶ =A𝒙 + 𝒃𝒖
结论:对于不完全能控和不完全能观的n阶线性定常系统
y=𝑪𝒙
通过非奇异线性变换,可实现系统结构的规范型分解,其规范分解的表达式为:
ሶ 𝒄𝒐
𝒙 ෩ 𝒄𝒐
𝑨 𝟎 ෩ 𝟏𝟑
𝑨 𝟎 𝒄𝒐 𝑩
𝒙 ෩ 𝒄𝒐 𝒄𝒐
𝒙
ሶ 𝒄ഥ𝒐
𝒙 ෩ 𝟐𝟏
𝑨 ෩ 𝒄ഥ𝒐
𝑨 ෩ 𝟐𝟑
𝑨 ෩ 𝟐𝟒
𝑨 𝒄ഥ𝒐 𝑩
𝒙 ෩ ෩𝒄𝒐 ෩𝒄ത𝒐
𝒄ഥ𝒐
𝒙
= + 𝒄ഥ𝒐 𝒖 𝒚= 𝑪 𝟎 𝑪 𝟎
ሶ 𝒄ത𝒐
𝒙 𝟎 𝟎 ෩ 𝒄ത𝒐
𝑨 𝟎 𝒄ത𝒐
𝒙 𝟎 𝒄ത𝒐
𝒙
෩ 𝒄ത𝒐ഥ
𝑨 𝒄ത𝒐ഥ
𝒙 𝒄ത𝒐ഥ
𝒙
ሶ 𝒄ത𝒐ഥ
𝒙 𝟎 𝟎 ෩ 𝟒𝟑
𝑨 𝟎
𝒄𝒐 为能控且能观测状态,
其中, 𝒙 𝒙𝒄ഥ𝒐 为能控但不能观状态,
𝒙𝒄ത𝒐 为不能控但能观状态,
𝒄ത𝒐ഥ 为不能控且不能观状态。
𝒙
第三章 线性控制系统的能控性和能观性
第三章 小结
能控、能观性是现代控制理论最重要、最基本的概念。应牢固掌握能控、能观性的定义
、判据、标准型和结构分解,掌握能控、能观的对偶原理。
能控、能观指的是系统的状态能控、能观。能控性反映了外部控制对系统内部运动状
态的可影响性,能观性则表征了系统内部运动状态通过外部输出的可反映性。
能控、能观性判据的证明是完美的,对于用数学方法解决工程问题有指导意义。
能控标准型和能观标准型是便于控制器和观测器综合的状态空间表达式的最简单形式。
线性系统的结构分解能够深刻揭示系统内部能控、能观性状态变量的结构。
《现代控制理论》MOOC课程
第四章 稳定性与李亚普诺夫方法
第四章 稳定性与李亚普诺夫方法
李亚普诺夫关于稳定性的定义
李亚普诺夫第一法
李亚普诺夫第二法
李亚普诺夫方法在线性系统中的应用
李亚普诺夫方法在非线性系统中的应用
第四章 稳定性与李亚普诺夫方法
稳定性是控制系统最重要的特性。
李亚普诺夫奠定了稳定性理论的基础。
李亚普诺夫稳定性理论是研究系统稳定性的普遍方法。
系统的稳定性是相对系统的平衡状态而言的。
《现代控制理论》MOOC课程
4.1 李亚普诺夫关于稳定性的定义
4.1 李亚普诺夫关于稳定性的定义
一. 系统的平衡状态
对于一个不受外力作用的系统
𝒙ሶ = 𝒇 𝒙, 𝑡 , 𝒙 𝑡𝟎 = 𝒙𝟎 ,𝒕 ≥ 𝑡𝟎
如果存在某个状态𝒙𝒆 ,使 𝒙ሶ 𝒆 = 𝒇 𝒙𝒆 , 𝑡 , = 𝟎, ∀𝑡 ≥ 𝑡𝟎
成立,则称𝒙𝒆 为系统的一个平衡状态。
对于线性系统:𝒙ሶ = 𝑨𝒙 , 𝑨𝒙𝒆 =0
当A非奇异,系统只有唯一的一个平衡状态,𝒙𝒆 =0
当A奇异,则存在无穷多个平衡状态。
对于非线性系统通常存在多个平衡状态。
4.1 李亚普诺夫关于稳定性的定义
一. 系统的平衡状态
𝒙𝟐
例如:对于非线性系统
𝒙ሶ 𝟏 = −𝒙𝟏 𝒙𝒆𝟐
൝
𝒙ሶ 𝟐 = 𝒙𝟏 + 𝒙𝟐 − 𝒙𝟑𝟐
𝒙𝟏 = 𝟎
其平衡状态为方程: ൝𝒙 + 𝒙 − 𝒙𝟑 = 𝟎 的解 𝒙𝒆𝟏 𝒙𝟏
𝟏 𝟐 𝟐
𝟎 𝟎 𝟎 𝒙𝒆𝟑
𝒙 =
可解得有三个平衡状态: 𝟏 𝟎
𝒆 , 𝒙𝒆 = , 𝒙𝒆 =
𝟐 𝟏 𝟑 −𝟏
孤立的平衡状态:如果平衡状态是彼此孤立的,即在某一平衡状态的任意小的邻域内
不存在其它平衡状态,则称该平衡状态为孤立的平衡状态。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义
1.李亚普诺夫意义下的稳定
若一不受外力作用的系统(自治系统)
𝒙ሶ = 𝒇 𝒙, 𝑡 , 𝒙 𝑡𝟎 = 𝒙𝟎 ,𝒕 ≥ 𝑡𝟎
对任意选定的实数 𝜺 > 0 ,都存在另一实数𝜹 𝜺, 𝑡𝟎 > 0,使得由满足不等式
𝒙𝟐
𝒙𝟎 − 𝒙𝒆 <𝜹 𝜺, 𝑡𝟎
的任一初始状态出发的受扰运动都满足不等式 𝜺
𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 < 𝜺, 𝒕 ≥ 𝑡𝟎
𝒙𝒆 𝒙𝟏
则称孤立平衡状态𝒙𝒆 为李亚普诺夫意义下的稳定状态。 𝒙𝟎 𝟎
𝜹
𝚽
若𝜹的取值与𝑡𝟎 无关,则称这个孤立平衡状态是一致稳定的。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义
𝒙𝟐
2. 渐进稳定 𝜺
若平衡状态 𝒙𝒆 是李亚普诺夫意义下的稳定状态,且满足 𝒙𝟏
𝒙𝒆
𝒙𝟎 𝟎
lim 𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 =0 𝜹
𝒕→∞
𝚽
则称孤立平衡状态𝒙𝒆 为渐进稳定的。 𝒙𝟐
3. 大范围渐进稳定
𝒙𝟎 𝚽
若平衡状态 𝒙𝒆 是李亚普诺夫意义下的稳定状态, 𝒙𝟏
且对系统的任一非平衡初始状态均满足 𝟎 𝒙𝒆
lim 𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 =0
𝒕→∞
李雅普诺夫意义下的渐进稳定等于工程意
则称孤立平衡状态𝒙𝒆 为大范围渐进稳定的。 义下的稳定。
4.1 李亚普诺夫关于稳定性的定义
二. 稳定性的几个定义
4. 不稳定
𝒙𝟐
若一不受外力作用的系统(自治系统)
𝒙ሶ = 𝒇 𝒙, 𝑡 , ሶ 𝒙 𝑡𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝑡𝟎 𝚽
若对于不管取多么大的有限实数 𝜺 > 0 ,都不可能找 𝒙𝟏
𝒙𝟎 𝜹
到相应的实数𝜹 𝜺, 𝑡𝟎 > 0,使得由满足不等式:
𝟎 𝒙𝒆
𝜺
𝒙𝟎 − 𝒙𝒆 <𝜹 𝜺, 𝑡𝟎
的任一初始状态出发的受扰运动都不满足不等式
𝚽(𝒕; 𝒙𝟎 , 𝒕𝟎 ) − 𝒙𝒆 < 𝜺, 𝒕 ≥ 𝑡𝟎
则称孤立平衡状态𝒙𝒆 为李亚普诺夫意义下的不稳定状态。
《现代控制理论》MOOC课程
4.2 李亚普诺夫第一法
4.2 李亚普诺夫第一法
李亚普诺夫第一法的基本思想是通过系统状态方程的解来判断系统的稳定性,因此
这种方法又称为间接方法。
1. 外部稳定(输出稳定)
给定系统一个有界输入(扰动),判断系统的输出是否有界,若系统的输出是有界的,
则称系统在该输入(扰动)下是稳定的。
2. 内部稳定(状态稳定)
只需求出系统矩阵A的所有特征值(对于非线性系统,在平衡状态附近一次线性化),
若系统所有特征值均有负实部,则系统是稳定,否则系统是不稳定的。
《现代控制理论》MOOC课程
4.3 李亚普诺夫第二法
4.3 李亚普诺夫第二法
李亚普诺夫第二法是基于这样一个基本的物理事实:
如果一个系统经受一个扰动,当扰动消失后,系统储存的能量将随着时间的推移而逐渐
衰减,直至趋于平衡状态,系统的能量趋于极小值,那么这个平衡状态就是渐近稳定的
若当扰动消失后,系统的能量不再增加,那么这个平衡状态就是李亚普诺夫意义下的
稳定;
若当扰动消失后,系统不断从外界吸收能量,系统的储能随着时间的推移不断增加,
那么这个平衡状态就是不稳定的。
𝑥𝑒
𝑥0 𝑥0
𝑥𝑒
4.3 李亚普诺夫第二法
一. 预备知识
1.标量函数𝑽(𝒙)符号性质的几个定义
一. 预备知识
2. 二次型函数的符号性质
设𝑽 𝒙 是一个二次型函数,即𝑽 𝒙 =𝒙𝑻 𝑷𝒙,其中 𝑷 为对称阵。当𝒙 ≠ 0时, 𝑽 𝒙 >0,
则𝑽 𝒙 是正定的,因而矩阵𝑷是正定的。
判断𝑽(𝒙)为正定的准则为𝑷的所有主子行列式均大于零。
判断𝑽(𝒙)为负定的准则为𝑷的各阶主子行列式𝚫𝒊 满足:
𝚫𝒊 : 𝒊 =偶数, 𝚫𝒊 >0; 𝒊 =奇数,𝚫𝒊 <0;
4.3 李亚普诺夫第二法
二. 李亚普诺夫稳定性判据
定理(李雅普诺夫稳定性主判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;
(2) 𝑽ሶ 𝒙 是负定的;
则系统在平衡状态𝒙𝒆 = 𝟎是渐进稳定的。
(3) 除满足条件(1)、(2)外, 若 𝒙 → ∞, 有𝑽 𝒙 → ∞,则系统在平衡状态𝒙𝒆 = 𝟎是大范
围渐进稳定的。
4.3 李亚普诺夫第二法
例:对于非线性系统
𝑥ሶ1 =𝑥2 − 𝑥1 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
𝑥ሶ 2 =−𝑥1 − 𝑥2 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2 (𝑥𝟏𝟐 + 𝑥𝟐𝟐 )
例:对于线性系统
𝑥ሶ1 =𝑥2
𝑥ሶ 2 =−𝑥1 − 𝑥2
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2𝑥𝟐𝟐
由于李亚普诺夫第二稳定性判别定理,只是充分条件,而非必要条件,故据此并不能判
定系统在平衡状态不稳定。
4.3 李亚普诺夫第二法
1
重新选取正定标量函数: 𝑉 𝒙 = [(𝑥1 +𝑥2 )2 + 2𝑥𝟏𝟐 + 𝑥𝟐𝟐 ]
2
显然𝑉ሶ 𝒙 负定。
定理(李雅普诺夫稳定性辅助判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;
(2) 𝑽ሶ 𝒙 是半负定的;
(3) 对于任意初始状态𝒙(𝑡0 ) ≠ 0, 在𝑡 ≥ 𝑡0 ,除𝒙= 0时, 有𝑽ሶ 𝒙 = 0外,𝑽ሶ 𝒙 不恒等于零。
则系统在平衡状态𝒙𝒆 = 𝟎是渐进稳定的。
(4) 除满足条件(1)、(2)、 (3)外, 若 𝒙 → ∞, 有𝑽 𝒙 → ∞,则系统在平衡状态𝒙𝒆 = 𝟎是
大范围渐进稳定的。
𝑽ሶ 𝒙 半负定,说明在𝑡 ≥ 𝑡0 的某些时刻,系统的“能量”不再减少;𝑽ሶ 𝒙 不恒等于零,
表明系统“能量”不再减少的状态不能保持,即系统会继续减少能量,直到平衡状态。
4.3 李亚普诺夫第二法
例:对于线性系统
𝑥ሶ1 =𝑥2
𝑥ሶ 2 =−𝑥1 − 𝑥2
试判别其平衡状态 𝒙𝒆 = 𝟎 的稳定性。
解:取正定标量函数: 𝑉 𝒙 = 𝑥𝟏𝟐 + 𝑥𝟐𝟐
𝑉 𝒙 对时间的导数为: 𝑽ሶ 𝒙 = 2𝑥1 𝑥ሶ 1 +2𝑥2 𝑥ሶ 2 = −2𝑥𝟐𝟐
V ( x ) 0 只是暂时出现在某一时刻。
故系统在平衡状态𝒙𝒆 = 𝟎 是渐近稳定的。
定理(李雅普诺夫不稳定性判据):设系统的状态方程为:𝒙ሶ = 𝒇(𝒙)
若存在一个具有连续一阶导数的标量函数𝑽 𝒙 且满足:
(1) 𝑽 𝒙 是正定的;
(2) 𝑽ሶ 𝒙 是正定的;
则系统在平衡状态𝒙𝒆 = 𝟎是不稳定的。
1. 李亚普诺夫函数是一个标量函数;是一个正定函数 ;对于一个给定系统,李亚普诺
夫函数不是惟一的。
2. 不仅对于线性系统,而且对于非线性系统,它都能给出关于大范围内稳定的信息。
3. 李亚普诺夫稳定性定理只是充分条件;对于一个特定系统,若不能找到一个合适的
李亚普诺夫函数来判定系统的稳定性,则不能给出该系统稳定性的任何信息。
4. 李亚普诺夫稳定性理论没有提供构造李亚普诺夫函数的一般方法;李亚普诺夫函数最
简单的形式是二次型函数。
《现代控制理论》MOOC课程
4.4 李亚普诺夫方法在线性系统中的应用
4.4 李亚普诺夫方法在线性系统中的应用
一. 线性定常系统的渐近稳定性判据
定理:对于给定的没有外界输入的线性定常系统:𝒙ሶ = 𝑨𝒙, 𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 0
在平衡状态 𝒙𝒆 = 𝟎 渐近稳定的充要条件为:对于任意给定的一个实正定对称
矩阵𝑸,必存在唯一的实正定对称矩阵𝑷,满足如下李亚普诺夫方程:
𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸
证明:充分性
𝑷为正定实对称阵且满足李亚普诺夫方程,则系统在 𝒙𝒆 = 𝟎 渐近稳定。
取 𝑽 𝒙 = 𝒙𝑻 𝑷𝒙,由于𝑷 = 𝑷𝑻 > 0,故 𝑽 𝒙 为正定。
则 𝑽ሶ 𝒙 = 𝒙ሶ 𝑻 𝑷𝒙 + 𝒙𝑻 𝑷𝒙ሶ = (𝑨𝒙)𝑻 𝑷𝒙 + 𝒙𝑻 𝑷(𝑨𝒙) = 𝒙𝑻 𝑨𝑻 𝑷𝒙 + 𝒙𝑻 𝑷𝑨𝒙
= 𝒙𝑻 (𝑨𝑻 𝑷 + 𝑷𝑨)𝒙 = −𝒙𝑻 𝑸𝒙
由于𝑸为正定对称矩阵,故𝑽ሶ 𝒙 负定;
由李亚普诺夫稳定性判据,系统在平衡状态 𝒙𝒆 = 𝟎 是渐近稳定的。 充分性得证
4.4 李亚普诺夫方法在线性系统中的应用
一. 线性定常系统的渐近稳定性判据
证明必要性
系统在 𝒙𝒆 = 𝟎 为渐近稳定,𝑸为正定对称阵,则𝑷为唯一满足李亚普诺夫方程的对称正定阵。
考虑如下矩阵微分方程:𝑿ሶ = 𝑨𝑻 𝑿 + 𝑿𝑨, 𝑿 𝟎 = 𝑸, 𝒕≥𝟎
𝑻𝒕
易知其解矩阵为: 𝑿 𝒕 = 𝒆 𝑸𝒆𝑨𝒕 ,
𝑨 𝒕≥𝟎
𝑻 ∞ ∞
对矩阵方程由𝑡 = 0至 𝑡 → ∞ 求取积分,可得:𝑿 ∞ − 𝑿 0 = 𝑨 0 𝑿𝒅𝑡 + (0 𝑿𝒅𝑡)𝑨
由于系统在 𝒙𝒆 = 𝟎 为渐近稳定,即𝑿 ∞ =0
∞
令 𝑷 = 0 𝑿𝒅𝑡 ,则矩阵方程可表示为李雅普诺夫方程:𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸
即𝑷为李亚普诺夫方程的解。
∞ 𝑻 ∞ 𝑨𝑻 𝒕 ∞ 𝑨𝑻 𝒕 𝑨𝒕
由:𝑷 = 𝑻
0 𝑿 𝒅𝑡 = 0 (𝒆 𝑸𝒆 ) 𝒅𝑡 = 0 𝒆 𝑸𝒆 𝒅𝑡
𝑨𝒕 𝑻 =𝑷
可知: 𝑷为对称阵。 ∞
∞ 𝑨𝑻 𝒕
对任意 𝒙0 ≠ 𝟎,有: 𝒙0 𝑷 𝒙0 = 𝑻
𝒙0 [0 𝒆 𝑸𝒆𝑨𝒕 𝒅𝑡]
𝑻
𝒙0 = න (𝒆𝑨𝒕 𝒙0 )𝑻 𝑸(𝒆𝑨𝒕 𝒙0 )𝒅𝑡
0
由于𝑸为正定对称阵,故有𝑸 = 𝑵𝑇 𝑵, 𝑵为非奇异矩阵。
∞ ∞
故𝑷为正定。即𝑷为唯一的满足李雅普诺夫方程的对称正定阵。必要性得证。 得证
4.4 李亚普诺夫方法在线性系统中的应用
关于线性定常系统李亚普诺夫判据的几点说明
例:对于线性系统
0 1
A=
−1 −1
试判别其稳定性。
解:采用线性定常系统的李亚普诺夫判据
𝑝11 𝑝12
令𝑸=𝑰,𝑷= 𝑝 𝑝 。
21 22
1.5 0.5
由李雅普诺夫方程𝑨𝑻 𝑷 + 𝑷𝑨 = −𝑸 可得: 𝑷 =
0.5 1
1.5 0.5
其主子行列式:∆𝟏 = 𝟏. 𝟓 > 𝟎, ∆𝟐 = = 1.25 > 0
0.5 1
故𝑷为正定对称阵,系统是渐近稳定的。
4.4 李亚普诺夫方法在线性系统中的应用
二. 线性时变系统的渐近稳定性判据
定理:对于给定的没有外界输入的线性时变系统:
𝒙ሶ = 𝑨(𝒕)𝒙, 𝒙 𝑡0 = 𝒙𝟎 , 𝒕 ≥ 0 , 𝑡0 ≥0
在平衡状态 𝒙𝒆 = 𝟎 渐近稳定的充要条件为:对于任意给定的一个实对称,一致正定矩阵
𝑸(𝒕),必存在唯一的实正定,一致对称矩阵𝑷(𝒕),满足如下李亚普诺夫方程:
𝑷ሶ 𝒕 = −𝑨𝑻 𝒕 𝑷 𝒕 − 𝑷 𝒕 𝑨 𝒕 − 𝑸 𝒕 , 𝑡 ≥ 𝑡0
证明略,思路与线性定常系统相同。
《现代控制理论》MOOC课程
4.5 李亚普诺夫方法在非线性系统中的应用
4.5 李亚普诺夫方法在非线性系统中的应用
一. 雅克比矩阵法(克拉索夫斯基法)
考虑n维非线性系统: 𝒙ሶ = 𝒇(𝒙)
𝒇 𝒙 对 𝑥𝑖 (𝑖 = 1,2, ⋯ )连续可微,系统的雅可比矩阵为
𝜕𝑓1 𝜕𝑓1 𝜕𝑓1
⋯
𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝜕𝑓2 𝜕𝑓2 𝜕𝑓2
𝜕𝑓(𝑥) ⋯
𝐽 𝒙 = = 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝜕𝑥
⋮ ⋮ ⋮ ⋮
𝜕𝑓𝑛 𝜕𝑓𝑛 𝜕𝑓𝑛
𝜕𝑥1 𝜕𝑥2 ⋯ 𝜕𝑥𝑛
系统在平衡状态 𝒙𝒆 = 𝟎,渐近稳定的充分条件为:对任意正定的实对称阵𝑷 ,使下列矩阵
𝑸 𝒙 = −𝑱𝑻 𝒙 𝑷 − 𝑷𝑱 𝒙 为正定。
且 𝑽 𝒙 = 𝒇𝑻 𝒙 𝑷𝒇 𝒙 是系统的一个李亚普诺夫函数。
证明:由于𝑷为对称正定阵,故𝑽 𝒙 = 𝒇𝑻 𝒙 𝑷𝒇 𝒙 为正定。
𝑽ሶ 𝒙 = 𝒇ሶ 𝑻 𝒙 𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷𝒇ሶ 𝒙
𝜕𝒇 𝒙 𝑻 𝑻
𝜕𝒇 𝒙
=( ሶ
𝒙) 𝑷𝒇 𝒙 + 𝒇 𝒙 𝑷( ሶ
𝒙)
𝜕𝒙 𝜕𝒙
= (𝑱(𝒙)𝒇 𝒙 ) 𝑻 𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷(𝑱(𝒙)𝒇 𝒙 )
= 𝒇 𝑻 𝒙 𝑱𝑻 (𝒙)𝑷𝒇 𝒙 + 𝒇𝑻 𝒙 𝑷𝑱(𝒙)𝒇 𝒙
由于,𝑸为正定,故𝑽ሶ 𝒙 为负定。
由李亚普诺夫稳定性判据,系统在平衡状态渐近稳定。 得证
4.5 李亚普诺夫方法在非线性系统中的应用
例:设系统的状态方程为
𝒙ሶ 1 = −3𝑥1 + 𝑥2
ቊ
𝒙ሶ 2 = 𝑥1 −𝑥2 −𝑥23
试确定系统在平衡状态 𝒙𝒆 = 𝟎渐近稳定。
解:对系统方程,有
−3𝑥1 + 𝑥2
𝒇 𝒙 =
𝑥1 −𝑥2 −𝑥23
其雅可比矩阵为
𝜕𝑓1 𝜕𝑓1
𝜕𝑓(𝑥) 𝜕𝑥1 𝜕𝑥2 −3 1
𝐽 𝒙 = = =
𝜕𝑥 𝜕𝑓2 𝜕𝑓2 1 −1 − 3𝑥22
𝜕𝑥1 𝜕𝑥2
4.5 李亚普诺夫方法在非线性系统中的应用
取𝑷=𝑰
3 −1 3 −1 6 −2
则 𝑸 𝒙 = −𝑱𝑻 𝒙 −𝑱 𝒙 = + =
−1 1 + 3𝑥22 −1 1 + 3𝑥22 −2 2 + 6𝑥22
6 −2 2
其主子行列式:∆𝟏 = 𝟔 > 𝟎, ∆𝟐 = 2 = 8 + 36𝑥2 > 0
−2 2 + 6𝑥2
1. 定理是系统在平衡状态渐近稳定的充分条件,若𝑸 𝒙 不是正定的,则不能得出任何
结论, 此时该法无效。
二. 变量梯度法
变量梯度法依据的基本事实:如果存在一个特定的李亚普诺夫函数𝑽 𝒙 并能够证明
给定系统的平衡状态为渐近稳定,则该李亚普诺夫函数的梯度必定存在且唯一。
二. 变量梯度法
设𝑉 𝒙 是 𝒙 的显函数,但不是𝑡的显函数,则𝑽ሶ 𝒙 可表示为:
𝑥ሶ1
𝑑𝑉 𝒙 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝜕𝑉 𝑥ሶ 2
𝑽ሶ 𝒙 = = 𝑥ሶ 1 + 𝑥ሶ 2 + ⋯ + 𝑥ሶ 𝑛 = ⋯
⋮ = 𝛻𝑉 𝑇 𝒙ሶ
𝑑𝑡 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛 𝜕𝑥1 𝜕𝑥2 𝜕𝑥𝑛
𝑥ሶ 𝑛
𝑡 𝑥 𝑥 𝑑𝑥1
𝑡 ሶ 𝑑𝑥2
故 𝑉 𝒙 = 0 𝑉 𝒙 𝑑𝑡 = න 𝛻𝑉 𝒙ሶ 𝑑𝑡 = න 𝛻𝑉 𝑑𝒙
𝑇 𝑇 = න 𝛻𝑉1 (𝑥) 𝛻𝑉2 (𝑥) ⋯ 𝛻𝑉𝑛 (𝑥)
⋮
0 0 0 𝑑𝑥𝑛
为使该线积分与积分路径无关,要求𝛻𝑉的旋度为零,即𝑟𝑜𝑡 𝛻𝑉 = 0
𝜕𝛻 𝑉𝑖 𝜕𝛻𝑉𝑗 𝝏𝜵𝑽
即满足 = 𝑖, 𝑗 = 1,2, ⋯ , 𝑛 即要求𝑱 = 为对称阵。
𝜕𝑥𝑗 𝜕𝑥𝑖 𝝏𝒙
这样,𝑉 𝒙 = 0𝑥1 𝛻𝑉1 𝑥 𝑑𝑥1 + 0𝑥2 𝛻𝑉2 𝑥 𝑑𝑥2 + ⋯ 0𝑥𝑛 𝛻𝑉𝑛 𝑥 𝑑𝑥𝑛
4.5 李亚普诺夫方法在非线性系统中的应用
二. 变量梯度法
应用变量梯度法分析系统稳定性的步骤如下:
1. 假定𝜵𝑽 𝒙 的形式为: 𝑎11 𝑥1 + 𝑎12 𝑥2 + ⋯ + 𝑎1𝑛 𝑥𝑛
𝑎 𝑥 + 𝑎22 𝑥2 + ⋯ + 𝑎2𝑛 𝑥𝑛
𝜵𝑽 𝒙 = 21 1 ⋮
𝑎𝑛1 𝑥1 + 𝑎𝑛2 𝑥2 + ⋯ + 𝑎𝑛𝑛 𝑥𝑛
4. 计算:𝑉 𝒙 = 0𝑥1 𝛻𝑉1 𝑥 𝑑𝑥1 + 0𝑥2 𝛻𝑉2 𝑥 𝑑𝑥2 + ⋯ 0𝑥𝑛 𝛻𝑉𝑛 𝑥 𝑑𝑥𝑛
例:设系统的状态方程为
𝒙ሶ 1 = −𝑥1 + 2𝑥1 𝑥22
ቊ
𝒙ሶ 2 = −𝑥2
试确定系统在平衡状态 𝒙𝒆 = 𝟎渐近稳定。
𝑎 𝑥 +𝑎 𝑥
𝜵𝑽 𝒙 = 𝑎11 𝑥1 + 𝑎12 𝑥2
解:设李亚普诺夫函数𝑽 𝒙 的梯度为:
21 1 22 2
= −𝑎11 𝑥12 + 2𝑎11 𝑥12 𝑥22 − 𝑎12 𝑥1 𝑥2 + 2𝑎12 𝑥1 𝑥23 − 𝑎21 𝑥1 𝑥2 − 𝑎22 𝑥22
𝜕𝛻𝑉1 𝜕𝛻𝑉2
由𝑟𝑜𝑡 𝛻𝑉 = 0的条件得: = 𝑎12 = = 𝑎21
𝜕𝑥2 𝜕𝑥1
4.5 李亚普诺夫方法在非线性系统中的应用
取 𝑎11 =1,𝑎22 =2,𝑎,12 = 𝑎21 = 0,则𝑉ሶ 𝒙 =−𝑥12 + 2𝑥12 𝑥22 − 2𝑥22 = −𝑥12 − 2𝑥22 1 − 𝑥12
第四章 小结
系统的稳定性是相对系统的平衡状态而言的。
内部稳定(特征值)和外部稳定(输入有界输出有界)
李亚普诺夫意义下的稳定,渐近稳定,大范围渐近稳定,不稳定的定义。
李亚普诺夫稳定性主判据,辅助判据,不稳定判据;均是充分条件。
线性系统的李亚普诺夫方程判据是充分必要条件。
构建李亚普诺夫函数没有统一的方法,雅克比矩阵法,变量梯度法均只能适应于某
些特定的系统。
《现代控制理论》MOOC课程
第五章 线性定常系统的综合
第五章 线性定常系统的综合
线性反馈控制系统综合的基本概念
极点配置问题
系统镇定问题
系统解耦问题
状态观测器
利用状态观测器实现状态反馈的系统
5.1 线性反馈控制系统综合的基本概念
一. 系统的综合
给定系统的状态空间表达式:
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
寻找一个控制𝒖, 使得在其作用下系统的性能指标满足所期望的要求。
二. 状态反馈控制和输出反馈控制
1. 状态反馈
馈控制。其中𝒗 为参考输入。
5.1 线性反馈控制系统综合的基本概念
状态反馈系统的结构为:
𝒖 + 𝒙ሶ 𝒙
𝒗 𝑩 න 𝑪 y
+ - +
𝑨
K
状态反馈系统的状态方程
原系统的状态方程为: 引入状态反馈𝒖 = −𝑲𝒙 + 𝒗 后,系统的状态方程为:
𝒙ሶ =A𝒙+B 𝒖 𝒙ሶ = 𝑨 − 𝑩𝑲 𝒙 + 𝑩𝒗
系统的性能主要由系统矩阵决定的,通过合理的选择状态反馈矩阵,就可改变系统矩阵
以使系统的性能满足期望的要求。
5.1 线性反馈控制系统综合的基本概念
状态反馈系统的传递函数:
原开环系统的传递函数为:
𝑾𝟎 𝒔 = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩
𝑾𝑲 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑲)−𝟏 𝑩
系统的性能主要由系统闭环传递函数的极点确定,通过合理的选择状态反馈矩阵,
就可改变系统传递函数的极点,以使系统的性能满足期望的要求。
5.1 线性反馈控制系统综合的基本概念
2. 输出反馈
𝒖 + 𝒙ሶ 𝒙
𝒗 𝑩 න 𝑪 y
+ - +
𝑨
H
5.1 线性反馈控制系统综合的基本概念
输出反馈系统的状态方程
通过合理的选择输出反馈矩阵,就可改变系统矩阵,以使系统的性能满足期望的要求。
输出反馈系统的传递函数:
原开环系统的传递函数为:
𝑾𝟎 𝒔 = 𝑪(𝒔𝑰 − 𝑨)−𝟏 𝑩
𝑾𝑲 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑯𝑪)−𝟏 𝑩
5.1 线性反馈控制系统综合的基本概念
3. 状态反馈与输出反馈的比较
系统的输出通常只是系统状态的部分信息,所以输出反馈仅相当于部分状态反馈。
如果输出反馈阵𝑯存在,则满足同样要求的状态反馈矩阵𝑲一定存在,只需取𝑲 = 𝑯𝑪
如果状态反馈阵𝑲存在,则满足同样要求的输出反馈矩阵𝑯不一定存在,因为由
𝑲 = 𝑯𝑪 ,通常解不出𝑯。
5.1 线性反馈控制系统综合的基本概念
三. 闭环系统的能控与能观性
定理1: 状态反馈不改变系统的能控性,但可能改变系统的能观性。
证明:能控性不变的证明思路:计算引入状态反馈前后,系统的能控性秩判别矩阵。
用数学归纳法证明秩不变。
有可能改变能观性的证明思路:用特列说明状态反馈矩阵不同,能观性秩判别矩
阵的秩不同。
定理2: 输出反馈不改变系统的能控性与能观性。
证明:能控性不变的证明思路:任一输出反馈总存在等效的状态反馈,而状态反馈不
改变系统的能控性,故输出反馈也不改变系统的能控性。
能观性不变的证明思路:计算引入输出反馈前后,系统的能观性秩判别矩阵。
用数学归纳法证明秩不变。
5.1 线性反馈控制系统综合的基本概念
四. 系统的性能指标
1. 以一组期望的闭环系统极点为性能指标,相应的综合问题称为极点配置问题。
2. 以系统渐近稳定为性能指标,相应的综合问题称为镇定问题。
3. 以使一个多输入多输出系统实现“一个输入只控制一个输出”作为性能指标,相应的
综合问题称为解耦问题。
4. 以使系统的输出无静差地跟踪一个外部信号作为性能指标,相应的综合问题称为跟踪
问题。
5.1 线性反馈控制系统综合的基本概念
五. 研究综合问题的基本思路
1. 第一建立可综合的条件,即对于给定的受控系统和期望的性能指标,确定相应控制存
在所应满足的条件。
2. 第二建立起相应的,用以综合控制规律的算法。
《现代控制理论》MOOC课程
5.2 极点配置问题
5.2 极点配置问题
一. 状态反馈的极点配置问题
二. 状态反馈极点可配置的条件
定理:线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
可通过状态反馈 𝒖 = −𝑲𝒙 + 𝒗 任意配置全部极点的充要条件是系统完全能控。
5.2 极点配置问题
证明:充分性(只讨论单输入单输出系统)
已知系统为完全能控,证明可任意配置极点。
即通过状态反馈必成立𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒇(𝝀∗ )
其中, 𝒇 𝝀∗ = ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊 = 𝝀𝒏 + 𝒂∗𝒏−𝟏 𝝀𝒏−𝟏 + ⋯ + 𝒂∗𝟏 𝝀 + 𝒂∗𝟎
取 𝑲 ഥ𝟎
ഥ = 𝑲𝑻𝑪𝟏 = 𝒌 ഥ𝟏
𝒌 ഥ𝒏−𝟏 = 𝒂∗𝟎 − 𝒂𝟎
⋯ 𝒌 𝒂∗𝟏 − 𝒂𝟏 ⋯ 𝒂∗𝒏−𝟏 − 𝒂𝒏−𝟏
5.2 极点配置问题
于是
0 1 ⋯ 0 0 0 1 ⋯ 0
ഥ= ⋮ ⋮ ⋱ ⋮ ⋮ ⋮ ⋱ ⋮
ഥ −𝑩
𝑨 ഥ𝑲
0 0 … 1 − ⋮ 𝒂∗𝟎 − 𝒂𝟎 𝒂∗𝟏 − 𝒂𝟏 ⋯ 𝒂∗𝒏−𝟏 − 𝒂𝒏−𝟏 = 0 0 … 1
0
−𝑎0 −𝑎1 ⋯ −𝑎𝑛−1 1 −𝒂∗𝟎 −𝒂∗𝟏 ⋯ −𝒂∗𝒏−𝟏
这说明在能控标准I型下,状态反馈𝑲ഥ 已将闭环系统极点配置到期望的位置。
ഥ 与𝑲之间的关系是什么?由于非奇异线性变换不改变系统的特征值,即
那么𝑲
𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝒔𝑰 − 𝑻𝑪𝟏 −𝟏 A − 𝑩𝑲 𝑻𝑪𝟏 ]
= 𝒅𝒆𝒕[𝒔𝑰 − 𝑻𝑪𝟏 −𝟏 𝑨𝑻𝑪𝟏 + (𝑻𝑪𝟏 −𝟏 𝑩)(𝑲𝑻𝑪𝟏 )]
ഥ−𝑩
= 𝒅𝒆𝒕[𝒔𝑰 − (𝑨 ഥ𝑲ഥ )]
ഥ 𝑻𝑪𝟏 −𝟏
其中,𝑲𝑻𝑪𝟏 = 𝑲 , 即 𝑲 = 𝑲
这说明对于任意给定的期望极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 ,都可以找到状态反馈矩阵
ഥ 𝑻𝑪𝟏 −𝟏 使上式成立,即可任意配置系统的闭环极点。
𝑲=𝑲 充分性得证。
5.2 极点配置问题
必要性:已知极点可配置,证明系统完全能控。
反证法,已知极点可任意配置,反设系统不完全能控。
由于系统不完全能控,故存在非奇异线性变换阵𝑹𝑪 ,对系统进行能控性分解而导出:
෩𝒄
𝑨 ෩ 𝟏𝟐
𝑨 ෩𝒄
𝑩
෩=
𝑨 𝑹−𝟏
𝑪 𝑨𝑹𝒄 = ෩ −𝟏
𝑩 = 𝑹𝑪 𝑩 =
𝟎 ෩ 𝒄ത
𝑨 𝟎
且对任一状态反馈矩阵𝑲 = 𝒌𝟏 𝒌𝟐 , ෩ = 𝑲𝑹𝒄 = 𝒌
𝑲 ෩𝟏 ෩𝟐 有
𝒌
𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 A − 𝑩𝑲 𝑹𝑪 ]= 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 𝑨𝑹𝑪 + (𝑹𝑪 −𝟏 𝑩)(𝑲𝑹𝑪 )]
෩𝒄 + 𝑩
𝝀𝑰 − 𝑨 ෩𝟏
෩ 𝒄𝒌 ෩ 𝟏𝟐 + 𝑩
−𝑨 ෩ 𝒄𝒌 ෩𝟐
= 𝒅𝒆𝒕 ෩𝒄 + 𝑩
= 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 ෩𝟏 𝒅𝒆𝒕(𝝀𝑰 − 𝑨
෩ 𝒄𝒌 ෩ 𝒄ത )
𝟎 𝝀𝑰 − 𝑨෩ 𝒄ത
这表明状态反馈不能改变系统不能控部分的特征值,系统不能任意配置全部极点。这与
系统可任意配置极点的已知条件矛盾,故反设不成立。
即系统是完全能控的,必要性得证。
5.2 极点配置问题
三.单输入单输出系统状态反馈极点配置的算法
态反馈矩阵K,实现极点配置的算法如下:
1. 判断系统的能控性,若系统完全能控则继续下一步。
5.计算I型能控标准型变换阵
𝟏
𝒂𝒏−𝟏 𝟏
𝑻𝑪𝟏 = 𝑨𝒏−𝟏 𝒃 𝑨𝒏−𝟐 𝒃 ⋯ 𝒃 ⋮ ⋮ ⋱
𝒂𝟐 𝒂𝟑 ⋱
𝒂𝟏 𝒂𝟐 ⋯ 𝒂𝒏−𝟏 𝟏
ഥ 𝑻𝑪𝟏 −𝟏 。
6.计算状态反馈矩阵 𝑲 = 𝑲
例:受控系统的状态方程如下: 𝒙ሶ = −2 −3 𝒙 + 3 𝒖
4 −9 1
求状态反馈矩阵K使系统的闭环极点为 𝜆𝟏,𝟐 = −1 ± 𝑗2
解:( 1 )判断系统的可控性
3 −9
系统的能控性秩判别矩阵: 𝑴 = 𝑩 , 𝑨𝑩 =
𝒓𝒂𝒏𝒌𝑴 = 2
1 3
满秩,系统是完全能控的,可由状态反馈任意配置系统的闭环极点。
5.2 极点配置问题
(2)原开环系统的特征多项式为:
𝜆+2 3
𝑓0 𝜆 = 𝑑𝑒𝑡 𝝀𝑰 − 𝑨 = = 𝜆2 + 11𝜆 + 30
−4 𝜆+9
(3)闭环系统的期望特征多项式为 :
𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5
(4)能控标准型变换后的反馈矩阵:
ഥ = 𝑎0∗ − 𝑎0 𝑎1∗ − 𝑎1 = 5 − 30 2 − 11 = − 25 9
𝑲
(5)I型能控标准型变换阵
𝟏 𝟎 −𝟗 𝟑 𝟏 𝟎 𝟐𝟒 𝟑 1 1 −3
𝑻𝑪𝟏 = 𝑨𝑩 𝑩 𝒂 = = , 𝑻−𝟏
𝑪𝟏 = −
𝟏 𝟏 𝟑 𝟏 𝟏𝟏 𝟏 𝟏𝟒 𝟏 18 −14 24
(6)状态反馈增益
1 1 −3
ഥ 𝑻𝑪𝟏 −𝟏 = − 25 9
𝑲=𝑲 − = −5.6 7.8
18 −14 24
5.2 极点配置问题
2. 计算状态反馈闭环系统的特征多项式:𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 =0
3. 令状态反馈特征多项式与期望特征多项式相等,得到状态反馈阵𝑲。
5.2 极点配置问题
例:受控系统的状态方程如下: 𝒙ሶ = −2 −3 𝒙 + 3 𝒖
4 −9 1
求状态反馈矩阵K使系统的闭环极点为 𝜆𝟏,𝟐 = −1 ± 𝑗2
解:( 1 )判断系统的可控性
3 −9
系统的能控性秩判矩阵:𝑴 = 𝑩 𝑨𝑩 = , 𝒓𝒂𝒏𝒌𝑴 = 2
1 3
满秩,系统是完全能控的,可由状态反馈任意配置系统的闭环极点。
(2)闭环系统的期望特征多项式为 :
𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5
(3)设状态反馈阵为:𝑲 = 𝒌𝟏 𝒌𝟐 ,则状态反馈控制系统的特征多项式为:
𝝀 𝟎 −2 −3 3 𝒌
𝝀𝑰 − 𝑨 − 𝑩𝑲 = − − 𝒌𝟐 = 𝜆2 + 11 + 3𝑘1 + 𝑘2 𝜆 + 30 + 24𝑘1 + 14𝑘2 = 0
𝟎 𝝀 4 −9 1 𝟏
比较期望特征多项式可得:11 + 3𝑘1 + 𝑘2 =2
解得: 𝑲 = 𝑘1 𝑘2 = −5.6 7.8
30 + 24𝑘1 + 14𝑘2 =5
5.2 极点配置问题
四. 输出反馈的极点配置问题
2. 如果在引入输出反馈的同时,引入动态补偿器,将可对输出反馈系统的全部极点实现
任意配置。
《现代控制理论》MOOC课程
5.3 系统镇定问题
5.3 系统镇定问题
一. 状态反馈的镇定问题
二. 状态反馈可镇定的条件
定理:线性定常系统
𝒙ሶ =A𝒙+B 𝒖 ,𝒙 0 = 𝟎,𝑡 ≥0
𝒚 = 𝑪𝒙
可通过状态反馈 𝒖 = −𝑲𝒙 + 𝒗 实现镇定的充要条件是其不能控子系统是渐近稳定的。
5.3 系统镇定问题
证明:设线性定常系统为不完全能控,故存在非奇异线性变换𝑹𝑪 对系统进行能控性分解
෩𝒄
𝑨 ෩ 𝟏𝟐
𝑨 ෩𝒄
𝑩
෩=
而导出: 𝑨 𝑹−𝟏
𝑪 𝑨𝑹𝒄 = ෩ −𝟏
𝑩 = 𝑹𝑪 𝑩 =
𝟎 ෩ 𝒄ത
𝑨 𝟎
且对任一状态反馈矩阵 𝑲 = 𝒌𝟏 ෩ = 𝑲𝑹𝒄 = 𝒌
𝒌𝟐 可导出 𝑲 ෩𝟏 ෩𝟐 ,
𝒌
于是有:𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 = 𝒅𝒆𝒕[𝝀𝑰 − 𝑹𝑪 −𝟏 A − 𝑩𝑲 𝑹𝑪 ]
෩𝒄 + 𝑩
𝝀𝑰 − 𝑨 ෩𝟏
෩ 𝒄𝒌 ෩ 𝟏𝟐 + 𝑩
−𝑨 ෩ 𝒄𝒌 ෩𝟐
= 𝒅𝒆𝒕 ෩𝒄 + 𝑩
= 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 ෩𝟏 𝒅𝒆𝒕(𝝀𝑰 − 𝑨
෩ 𝒄𝒌 ෩ 𝒄ത )
𝟎 𝝀𝑰 − 𝑨෩ 𝒄ത
෩ 𝒄 ,𝑩
由于{𝑨 ෩ 𝟏 使 (𝑨
෩ 𝒄 } 为能控,故必存在𝒌 ෩ 𝒄 −𝑩 ෩𝟏 ) 的特征值具有负的实部,即存在𝑲使能
෩ 𝒄𝒌
控子系统的特征值均具有负的实部。
因此,系统由状态反馈实现镇定的充要条件为不能控子系统的特征值均具有负实部。
得证
5.3 系统镇定问题
三. 状态反馈镇定的算法
෩ 𝒄 ,𝑩
2.应用非奇异线性变换阵 𝑻𝑪𝟏 ,将能控子系统 {𝑨 ෩ 𝒄 } 化为能控标准I型{𝑨
ഥ 𝒄 ,𝑩
ഥ 𝒄} ;
ഥ 使能控子系统的特征值具有负的实部 ;
3.应用极点配置算法,计算反馈增益阵𝑲
4.计算状态反馈矩阵 𝑲 = 𝒌1 0 ;
𝑲 = 𝒌1 0 = ഥ1 𝑇𝐶1
𝒌 −1
0 𝑹−1
𝐶
5.3 系统镇定问题
例:已知系统的状态方程为:
1 0 −1 0
𝒙ሶ = 0 −2 0 𝒙 + 0 𝒖
−1 0 2 1
判别其是否为可镇定的,若是可镇定的,试求一状态反馈 𝑲 ,使闭环系统为渐近稳定。
解:(1) 判别系统的可控性
0 −1 −3
𝑴= 𝑩 𝑨𝑩 𝑨𝟐 𝑩 = 0 0 0 rank𝑴 = 2 < 3
1 2 5
故系统为不完全能控。
(2)将系统按能控性进行分解(取M中2个线性无关列,第3 列为确保非奇异的任意向量)
0 −1 0 2 0 1
取 𝑹𝑪 = 0 0 1 𝑹𝐶−1 = −1 0 0
1 2 0 0 1 0
5.3 系统镇定问题
作非奇异变换𝒙 = 𝑹𝑪 𝒙
0 −1 0 1
ሶ = 𝑹−𝟏
𝒙 + 𝑹−𝟏
𝑪 𝑨𝑹𝑪 𝒙 𝑪 𝑩𝒖 = 1 3 + 0 𝒖
0 𝒙
0 0 −2 0
ሶ 𝑪ഥ = −𝟐
不可控子系统为:𝒙 𝒙𝑪ഥ , 𝝀𝑪ഥ = −𝟐 不可控子系统渐近稳定,故系统是可镇定的。
(3)对可控子系统作状态反馈,使系统稳定
a. 可控子系统的特征多项式为:
𝜆 1
𝑓0 𝜆 = 𝑑𝑒𝑡 𝝀𝑰 − 𝑨 = = 𝜆2 − 3𝜆 + 1
−1 𝜆 − 3
b. 假定使能控子系统的闭环极点为:𝜆𝟏,𝟐 = −1 ± 𝑗2
闭环系统的期望特征多项式为 : 𝑓𝑘 𝜆∗ = (𝜆 − 𝜆1 )(𝜆 − 𝜆2 ) = 𝜆2 + 2𝜆 + 5
c. 变换后的反馈矩阵:
ഥ = 𝑎0∗ − 𝑎0
𝑲 𝑎1∗ − 𝑎1 = 5 − 1 2 − (−3) = 4 5
5.3 系统镇定问题
(4)计算状态反馈矩阵
能控标准I型变换阵 :
𝟏 𝟎 𝟎 𝟏 𝟏 𝟎 −𝟑 𝟏 𝟎 𝟏
𝑻𝑪𝟏 = 𝑨𝑩 𝑩 𝒂 = = , 𝑻−𝟏
𝑪𝟏 =
𝟏 𝟏 𝟏 𝟎 −𝟑 𝟏 𝟏 𝟎 𝟏 𝟑
2 0 1
ഥ1 𝑇𝐶1 𝟎 𝟏
𝑲= 𝒌 −1
0 𝑹−1
𝐶 = 4 5 0 −1 0 0 = −9 0 5
𝟏 𝟑
0 1 0
《现代控制理论》MOOC课程
5.4 系统解耦问题
5.4 系统解耦问题
一. 解耦的定义
对于𝒎个输入𝒎个输出的线性定常系统σ(𝑨, 𝑩, 𝑪)其传递函数为:
𝑤11 𝑠 ⋯ 𝑤1𝑚 𝑠
W(s)= ⋮ ⋯ ⋮
𝑤𝑚1 𝑠 ⋯ 𝑤𝑚𝑚 𝑠
即输入输出有如下关系: 𝑦1 𝑠 = 𝑤11 𝑠 𝑢1 𝑠 + 𝑤12 𝑠 𝑢2 𝑠 + ⋯ + 𝑤1𝑚 𝑠 𝑢𝑚 𝑠
𝑦2 𝑠 = 𝑤21 𝑠 𝑢1 𝑠 + 𝑤22 𝑠 𝑢2 𝑠 + ⋯ + 𝑤2𝑚 𝑠 𝑢𝑚 𝑠
⋮
𝑦𝑚 𝑠 = 𝑤𝑚1 𝑠 𝑢1 𝑠 + 𝑤𝑚2 𝑠 𝑢2 𝑠 + ⋯ + 𝑤𝑚𝑚 𝑠 𝑢𝑚 𝑠
设计控制器,使多变量输入输出系统实现每一个输出仅受相应的一个输入控制,每一个输
入也仅能控制相应的一个输出。即构造控制器使系统的传递函数变为非奇异对角规范型
ഥ11 𝑠
𝑊
即:𝑾𝒌 (s)= ⋱ 则称这样的系统是解耦的,相应的控制为解耦控制。
ഥ𝑚𝑚 𝑠
𝑊
5.4 系统解耦问题
二. 状态反馈解耦问题的描述
对于多输入-多输出的线性定常系统: 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
假定 (1) 系统输出变量个数𝒑与输入变量个数𝒒相等,即𝒑 = 𝒒;
(2) 控制规律采用状态反馈和输入变换相结合,即𝒖 = −𝑲𝒙 + 𝑳𝒗
𝒗 𝒖 + 𝒙ሶ 𝒙
𝑳 𝑩 න
𝑪 𝒚
+ - +
𝑨
K
(3) 输入变换阵L为非奇异,即𝐝𝐞𝐭𝑳 ≠ 𝟎
5.4 系统解耦问题
寻找输入变换和状态反馈矩阵对{𝑳,𝑲} ,使得所导出的状态反馈系统
𝒙ሶ = (𝑨 − 𝑩𝑲)𝒙 + 𝑩𝑳𝒗
𝒚 = 𝑪𝒙
1.特征量的定义
设𝑾 (𝒔)为𝑝 × 𝑝 阶的传递函数矩阵, 𝑾𝒊 (𝒔)为其第𝑖行传递函数向量
2. 特征量的性质
𝑬𝑖 = 𝑪𝑖 𝑨𝒅𝒊 𝐵 <2>
由𝑬𝑖 的定义可得:
𝑬𝑖 = lim 𝑠 𝑑𝑖 +1 𝑾𝑖 𝑠
𝑠→∞
𝑠 𝑑𝑖+1
= lim (𝑪𝒊 𝑹𝒏−𝟏 𝑩𝒔𝒏−𝟏 + ⋯ + 𝑪𝒊 𝑹𝒏−𝒅𝑖 𝑩𝒔𝒏−𝒅𝑖 + 𝑪𝒊 𝑹𝒏−𝒅𝑖−1 𝑩𝒔𝒏−𝒅𝑖−𝟏 + ⋯ + 𝑪𝒊 𝑹𝟎 𝑩)
𝑠→∞ 𝒂 𝒔
= 𝑪𝒊 𝑹𝒏−𝒅𝑖−1 𝑩
= 𝑪𝒊 𝑨𝑑𝑖 𝑩
故特征量的性质(1)得证。
5.4 系统解耦问题
ഥ𝑖
𝜇
ҧ 𝜇ҧ 𝑖 , 𝜇ҧ 𝑖 为满足𝑪𝑖 (𝑨 − 𝑩𝑲) 𝑩𝑳 ≠ 0的最小值
𝑑𝑖 = ൝
𝑛 − 1,当𝑪𝑖 (𝑨 − 𝑩𝑲)𝑘 𝑩𝑳 = 0, 𝑘 = 0,1, ⋯ , 𝑛 − 1
ഥ 𝑖 = 𝑪𝑖 (𝑨 − 𝑩𝑲)𝒅𝒊 𝑩𝑳
𝑬
根据性质 ( 1 ) 相同的方法可证。
𝑑ҧ𝑖 = 𝑑𝑖 , ഥ 𝑖 = 𝑬𝑖 𝐿
𝑬 𝑖 = 1,2, ⋯ . 𝑝
5.4 系统解耦问题
四. 系统可解耦的条件
定理:给定𝒑个输入𝒑个输出的线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
可采用输入变换和状态反馈矩阵𝒖 = −𝑲𝒙 + 𝑳𝒗进行解耦控制的充要条件,由系统传递函数
矩阵每一行结构特性向量𝑬𝒊 组成的矩阵非奇异。
𝑬𝟏
𝑬𝟐
𝑬= ⋮ 𝑬 ∈ 𝑹𝒑×𝒑
𝑬𝒑
证明:必要性:
已知存在控制𝒖 = −𝑲𝒙 + 𝑳𝒗 ,可使系统实现解耦,即闭环系统的传递函数矩阵为
ഥ𝟏 lim 𝑠 𝑑1 +1 𝑾𝑲𝑳𝟏 𝑠
𝑬 𝑠→∞ lim 𝑠 𝑑1 +1 𝑾𝟏𝟏 𝑠
ഥ𝟐 𝑑2 +1 𝑾 𝑠→∞
ഥ 𝑬 lim 𝑠 𝑲𝑳𝟐 𝑠 ⋱
𝑬= = 𝑠→∞ =
⋮ ⋮
ഥ𝒑
𝑬 lim 𝑠 𝑑𝑝 +1 𝑾𝒑𝒑 𝑠
lim 𝑠 𝑑𝑝 +1 𝑾𝑲𝑳𝒑 𝑠 𝑠→∞
𝑠→∞
即为对角非奇异常阵。
ഥ = 𝑬𝑳 可知 𝑬 = 𝑬
由𝑬 ഥ 𝑳−𝟏 ,由于𝑬
ഥ 和𝑳均为非奇异,故E非奇异,必要性得证。
充分性:已知𝑬非奇异,证明可解耦。
由已知𝑬非奇异,故𝑬−𝟏 存在
𝑪𝟏 𝑨𝑑1 +1
取{𝑳,𝑲} 为:𝑳=𝑬−𝟏 ,𝑲 = 𝑬−𝟏 𝑭, 𝑭 = ⋮
𝑪𝒑 𝑨𝑑𝑝 +1
5.4 系统解耦问题
这样,闭环系统的传递函数矩阵为:
𝟏 𝟏 𝟏
𝑾𝑲𝑳 (𝒔) = 𝒅𝒊𝒂𝒈 ⋯
𝒔𝒅𝟏 +𝟏 𝒔𝒅𝟐 +𝟏 𝒔𝒅𝒑+𝟏
即实现了解耦,充分性得证。
解耦后,各输入输出间的传递函数是多重积分,称为积分型解耦系统。极点在坐
标的原点,其性能在工程上不能被接受。其意义在于理论分析,即可通过简单的
输入变换和状态反馈实现解耦。
5.4 系统解耦问题
五.系统可解耦的条件
四. 确定解耦控制器的算法
算法:给定完全能控的线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖
𝒚 = 𝑪𝒙
确定使系统完全解耦的输入变换和状态反馈矩阵{L,K}的计算步骤如下:
1. 计算系统的特征量 {𝑑𝑖 , 𝑖 = 1,2, ⋯ , 𝑝} 和 {𝑬𝑖 = 𝑪𝑖 𝑨𝒅𝒊 𝑩, 𝑖 = 1,2, ⋯ , 𝑝} 。判断 𝑬 是否非奇异。
若是,可解耦,进入下一步。若否,不能解耦,退出计算。
𝑪𝟏 𝑨𝑑1 +1
2.计算𝑬−𝟏 和𝑭 = ⋮
𝑪𝒑 𝑨𝑑𝑝 +1
状态空间表达式所对应的传递函数矩阵为:
𝟏 𝟏 𝟏
𝑮 𝒔 = 𝑪(𝒔𝑰 − 𝑨 + 𝑩𝑬−𝟏 𝑭) −𝟏 𝑩𝑬−𝟏 = 𝒅𝒊𝒂𝒈 ⋯
𝒔𝒅𝟏 +𝟏 𝒔𝒅𝟐 +𝟏 𝒔𝒅𝒑+𝟏
例:已知系统的状态空间表达式为:
1 1
1 1
𝒙ሶ = − 2 0 𝒙+
2
0 𝒖 𝒚= 𝒙
2 1
0 −1 0 1
求解耦控制的𝑲阵和𝑳阵。
解:(1)计算E阵
1 1
1 0 0 1 1 0 0 = 1
𝟎
𝑪𝟏 𝑨 𝑩 = 1 1 = 𝑪𝟐 𝑨𝟎 𝑩 = 2 1 1
0 1 2 2
1 0 1 2
0 1 0 1
5.4 系统解耦问题
故有:𝑑1 = 𝑑2 = 0
1
𝑬𝟏 = 𝑪𝟏 𝑨𝑑1 𝑩 = 1 𝑬𝟐 = 𝑪𝟐 𝑨𝑑2 𝑩 = 1 1
2
1 1 1
𝑬𝟏 1 1
𝑬= = 2 𝑑𝑒𝑡𝑬 = 2 =−
𝑬𝟐 2
1 1 1 1
故可实现状态反馈解耦控制。
(2)求解耦控制的K阵和L阵。
−𝟏
1 1
𝑪𝟏 𝑨𝑑1 +1 −2 2
𝑭= = −2 −1 𝑬−𝟏 = 2 1 =
2 −1
𝑪𝟐 𝑨𝑑2 +1 −1 −1 1 1
5.4 系统解耦问题
1
−2 2 − −1 −1 0
因此: 𝑲 = 𝑬−𝟏 𝑭 = 2 =
2 −1 −1 −1 0 −1
−𝟏 −2 2
𝑳=𝑬 =
2 −1
解耦后的变换传递函数为:
1
0
𝑾𝑲𝑳 (𝒔) = 𝑠
1
0
𝑠
《现代控制理论》MOOC课程
5.5 状态观测器
5.5 状态观测器
一. 状态观测器的定义
定义:考虑n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
其中,𝒙不能直接测量,输出𝒚和控制𝒖是可以测量的。则称以𝒚和𝒖为输入,且其输出
ෝ 𝒕 满足如下关系式 lim 𝒙
𝒙 ෝ 𝒕 = lim 𝒙 𝒕 的一个n维线性定常系统为全维状态观测器。
𝒕→∞ 𝒕→∞
二. 全维状态观测器的实现
1.根据系统已知的系数矩阵𝑨、𝑩和𝑪,按和原系统相同的结构形式,复制一个基本系统。
ෝሶ = 𝑨ෝ
𝒙 𝒙 + 𝑩𝒖,ෝ ෝ𝟎 , 𝒕 ≥ 𝟎
𝒙 𝟎 =𝒙
当使初始状态ෝ𝒙𝟎 =𝒙𝟎 ,则理论上可实现所有的𝑡 > 0均成立ෝ𝒙 𝑡 = 𝒙(𝑡)即实现完全的状
态重构;
但是,这种开环型的状态观测器是难以实际应用的。因为:
第一,每次用这种观测器前都必须设置初始状态,这显然是不方便的;
第二,如果系统矩阵𝑨包含不稳定的特征值,那么即使ෝ 𝒙𝟎 和𝒙𝟎 间有很小的偏差,则随着
时间的推移偏差将愈来愈大。
5.5 状态观测器
2. 取原系统输出𝒚和复制系统输出ෝ 𝒚之差作为修正变量,并将其经增益矩阵𝑮反馈到复制
统中的积分器输入端,构成一个闭环系统。即
ෝሶ = 𝑨ෝ
𝒙 ෝ = 𝑨ෝ
𝒙 + 𝑩𝒖 + 𝑮 𝒚 − 𝒚 𝒙 + 𝑩𝒖 + 𝑮 𝒚 − 𝑪ෝ
𝒙 = (𝑨 − 𝑮𝑪)ෝ
𝒙 + 𝑮𝒚 + 𝑩𝒖
其结构可表示如下:
𝒖 + 𝒙ሶ 𝒙
𝑩 න 𝑪
+ 𝒚𝒚
𝑨
+
𝑮
𝑮 −
𝑪 ෝ𝒙
𝒙ෝ
𝑩 + ෝሶ
𝒙 නන
+
𝑨 −𝑨𝑮𝑪
5.5 状态观测器
三. 全维状态观测器极点配置的条件
定理:考虑n维线性定常系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
完全能观,则必可由如下描述的状态观测器
ෝሶ = 𝑨 − 𝑮𝑪 𝒙
𝒙 ෝ + 𝑮𝒚 + 𝑩𝒖 ෝ 𝟎 =𝒙
𝒙 ෝ𝟎
来重构系统状态,并且必可通过选择增益矩阵𝑮而实现任意配置𝑨 − 𝑮𝑪的全部特征值。
ෝ ,则有
𝒙=𝒙−𝒙
证明:取
𝒙 ෝሶ = 𝑨𝒙 + 𝑩𝒖 − 𝑨 − 𝑮𝑪 𝒙
ሶ = 𝒙ሶ − 𝒙 ෝ − 𝑮𝒚 − 𝑩𝒖 = (𝑨 − 𝑮𝑪) 𝒙 − 𝒙
ෝ
只要使矩阵(𝑨 − 𝑮𝑪)的特征值具有负的实部,那么一定可以做到使
𝒕 =𝟎
lim 𝒙 即 ෝ(𝒕) = lim 𝒙 𝒕
lim 𝒙
𝒕→∞ 𝒕→∞ 𝒕→∞
因此,状态能否重构的关键在于能否找到增益矩阵𝑮,使矩阵 𝑨 − 𝑮𝑪 的极点任意配置。
5.5 状态观测器
算法:给定需状态估计的系统 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
为完全能观,使设计的状态观测器有一组期望的极点 𝝀∗𝟏 ,𝝀∗𝟐 , ⋯ ,𝝀∗𝒏 ,则设计全维状态观
测器的步骤如下:
1. 导出对偶系统{𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 }
2. 应用极点配置算法,对系统{𝑨𝑻 , 𝑪𝑻 , 𝑩𝑻 } 确定状态反馈矩阵𝑲,使下式成立
𝒅𝒆𝒕[𝝀𝑰 − (𝑨𝑻 − 𝑪𝑻 𝑲)]=ς𝒏𝒊=𝟏 𝝀 − 𝝀∗𝒊
3.取𝑮 = 𝑲𝑻
4.计算 𝑨 − 𝑮𝑪 ,则所要设计的全维状态观测器就为
ෝሶ = 𝑨 − 𝑮𝑪 𝒙
𝒙 ෝ + 𝑮𝒚 + 𝑩𝒖 ෝ 𝟎 =𝒙
𝒙 ෝ𝟎
ෝ,即为𝒙的估计状态。
而𝒙
5.5 状态观测器
五. 降维状态观测器
由于系统的输出𝒚总是能观测的。若系统能观,且输出向量𝒚的维数是𝒒,则状态向
量中的𝒒个分量可由输出𝒚直接获得。那么设计的状态观测器只需观测其余𝒏 − 𝒒个状态分
量,这样的观测器称为降维观测器。
算法 降维观测器的设计步骤
给定需估计状态的系统 {𝑨, 𝑩, 𝑪},已知𝑟𝑎𝑛𝑘𝐂 = 𝐪,且{𝑨, 𝑪}为完全能观,则其𝒏 − 𝒒维
降维观测器可按如下步骤设计:
𝑪
1. 定义𝒏 × 𝒏维矩阵𝑷 = 其中, 𝑹为使𝑷非奇异的(𝒏 − 𝒒) × 𝒏 常阵。
𝑹
计算𝑷的逆,并将其分块表示 𝑸 = 𝑷−𝟏 = 𝑸𝟏 𝑸𝟐
其中,𝑸𝟏 ,𝑸𝟐 分别为𝐧 × 𝒒和𝐧 × (𝒏 − 𝒒)矩阵。显然有:
𝑪 𝑸 𝑪𝑸𝟏 𝑪𝑸𝟐
𝑷𝑸 = 𝟏 𝑸𝟐 = 即𝑪𝑸𝟏 = 𝑰𝒒 , 𝑪𝑸𝟐 = 𝟎
𝑹 𝑹𝑸𝟏 𝑹𝑸𝟐
5.5 状态观测器
𝒙 = 𝑷𝒙,可导出
2. 对需估计状态的系统,进行非奇异变换ഥ
ഥሶ = 𝑷𝑨𝑷−𝟏 𝒙
𝒙 ഥ𝒙
ഥ + 𝑷𝑩𝒖 = 𝑨 ഥ+𝑩ഥ𝒖
ഥ
𝒚 = 𝑪𝑷−𝟏 𝒙
ഥ = 𝑪 𝑸𝟏 𝑸𝟐 𝒙 ഥ = 𝑰𝒒 0𝒙
ഥ
ഥ𝟏
𝒙
ഥ=
令𝒙 ഥ𝟐 分别为𝒒和𝒏 − 𝒒维,则上式可表示为:
𝒙𝟏 和 𝒙
其中ഥ
ഥ𝟐
𝒙
ഥሶ 𝟏
𝒙 ഥ 𝟏𝟏
𝑨 ഥ 𝟏𝟐 𝒙
𝑨 ഥ𝟏 ഥ𝟏
𝑩
= + 𝒖
ሶ𝒙
ഥ𝟐 ഥ 𝟐𝟏
𝑨 ഥ
𝑨𝟐𝟐 ഥ
𝒙 𝟐 ഥ
𝑩𝟐
ഥ𝟏
𝒙
𝒚 = 𝑰𝒒 ഥ𝟏
=𝒙 0
ഥ𝟐
𝒙
ഥ𝟏 可直接利用无需重构,只需重构𝒏 − 𝒒维的分量。
由于𝒚 = 𝒙
5.5 状态观测器
𝒙𝟐 分量的状态方程和输出方程
3. 导出ഥ
ഥ 𝟐𝟐 𝒙
ഥሶ 𝟐 = 𝑨
𝒙 ഥ 𝟐𝟏 𝒚 + 𝑩
ഥ 𝟐 + (𝑨 ഥ 𝟐 𝒖)
ഥ 𝟏𝟏 𝒚 − 𝑩
𝒚ሶ − 𝑨 ഥ 𝟐𝒖 = 𝑨
ഥ 𝟏𝟐 𝒙
ഥ𝟐
ഥ 𝟐𝟏 𝒚 + 𝑩
ഥ=𝑨
令 𝒖 ഥ 𝟐 𝒖,𝒘 = 𝒚ሶ − 𝑨 ഥ 𝟏𝟏 𝒚 − 𝑩
ഥ 𝟐𝒖
则上式可表示为
ഥሶ 𝟐 = 𝑨
𝒙 ഥ 𝟐𝟐 𝒙
ഥ𝟐 + 𝒖
ഥ
𝒘=𝑨 ഥ 𝟏𝟐 𝒙
ഥ𝟐
ഥ 𝟐𝟐 , 𝑨
系统 {𝑨 ഥ 𝟏𝟐 }为完全能观的充要条件为 {𝑨, 𝑪}完全能观。
4. 对𝒏 − 𝒒维子系统,构造全维观测器。
5. 进行状态变换。
《现代控制理论》MOOC课程
5.6 利用状态观测器实现状态反馈的系统
5.6 利用状态观测器实现状态反馈的系统
一. 利用状态观测器的状态反馈系统的构成
设受控系统的状态空间表达式为: 𝒙ሶ = 𝑨𝒙 + 𝑩𝒖,𝒙 𝟎 = 𝒙𝟎 , 𝒕 ≥ 𝟎
𝒚 = 𝑪𝒙
状态观测器为:
ෝሶ = (𝑨 − 𝑮𝑪)ෝ
𝒙 ෝ 𝟎 =𝒙
𝒙 + 𝑮𝒚 + 𝑩𝒖 , 𝒙 ෝ𝟎
ෝ+𝒗
反馈控制规律为: 𝒖 = −𝑲𝒙
则整个系统的状态空间表达式为:
𝒙ሶ = 𝑨𝒙 − 𝑩𝑲ෝ𝒙 + 𝑩𝒗 𝒙ሶ 𝑨 −𝑩𝑲 𝒙 𝑩
ሶ𝒙 = + 𝒗
ෝ 𝑮𝑪 𝑨 − 𝑮𝑪 − 𝑩𝑲 ෝ
𝒙 𝑩
ෝሶ = 𝑮𝑪𝒙 + (𝑨 − 𝑮𝑪 − 𝑩𝑲)ෝ
𝒙 𝒙 + 𝑩𝒗
𝒙
𝒚 = 𝑪𝒙 𝒚= 𝑪 𝟎
ෝ
𝒙
这是一个2n维系统;
5.6 利用状态观测器实现状态反馈的系统
𝒗 + 𝒖 + 𝒙ሶ 𝒙
𝑩 න 𝑪
− + 𝒚
𝑮
ෝ
𝒙
𝑩 + ෝሶ
𝒙 න
+
𝑨 − 𝑮𝑪
𝑲
利用状态观测器的状态反馈系统
5.6 利用状态观测器实现状态反馈的系统
二. 利用状态观测器的状态反馈系统的基本特性
1. 引入状态观测器后,提高了状态反馈系统的维数。
𝑑𝑖𝑚 𝛴 = 𝑑𝑖𝑚 𝛴0 + 𝑑𝑖𝑚(𝛴𝑂𝐵 )
系统的维数等于受控制系统的维数与观测器维数之和。
2.包含观测器的状态反馈系统的特征值集合具有分离性。即
=𝒙−𝒙
引入线性变换 𝒙 ෝ 可得: 𝒙ሶ = 𝑨 − 𝑩𝑲 𝑩𝑲 𝒙 𝑩
ሶ + 𝒗
𝒙 𝟎
𝑨 − 𝑮𝑪 𝒙 𝟎
𝒚 = 𝑪𝒙
而线性变换不改变系统的特征值
ഥ ) = 𝒅𝒆𝒕 𝝀𝑰 − 𝑨 − 𝑩𝑲 𝒅𝒆𝒕[𝝀𝑰 − 𝑨 − 𝑮𝑪 ]
𝒅𝒆𝒕(𝝀𝑰 − 𝑨
5.6 利用状态观测器实现状态反馈的系统
二. 利用状态观测器的状态反馈系统的基本特性
3.作为上一个性质的推论:状态观测器的引入不影响状态反馈矩阵𝑲所配置的系统特
征值;状态反馈的引入也不影响已设计好的状态观测器的特征值;
4.状态观测器的引入不改变原状态反馈系统的传递函数;
𝑾𝒌 𝝀 = 𝑾𝒌𝑮 𝝀 = 𝑪[𝝀𝑰 − 𝑨 − 𝑩𝑲 ]−𝟏 𝑩
注意传递函数在非奇异线性变换下保持不变。
5.状态观测器反馈与直接状态反馈设计的等效性;
第五章 线性定常系统的综合
第五章 小结
对于综合问题首先是建立可综合的条件,其次才是构造综合的算法。
极点配置是最基本的综合问题。极点配置可综合的充要条件是系统完全能控,最简洁的
综合算法是基于标准型的算法。
系统镇定问题只是极点配置问题的一个特例。
解耦控制在工程中有着广泛的需求,但是积分型解耦控制器意义只在于理论分析。
状态观测器对于实现状态反馈有重要意义。实现状态观测器的充分条件是系统完全能
观。利用降维观测器的状态反馈系统的性能要优于利用全维状态观测器的状态反馈系
统。状态观测器增益矩阵与状态反馈矩阵的设计是可分离的。
《现代控制理论》MOOC课程
第六章 最优控制
第六章 最优控制
最优控制问题的数学描述
求解最优控制的变分方法
极小值原理
动态规划法
线性二次型最优控制问题
第六章 最优控制
最优控制理论所要解决的问题:
按照控制对象的动态特性,选择一个容许控制,使得被控对象按照技术要求运行,并使
给定的性能指标达到最优值。
最优控制的数学问题:
从数学观点来看,最优控制问题就是求解一类带有约束条件的泛函极值问题。
最优控制的基本内容:
经典变分法;
极小值原理;
动态规划;
《现代控制理论》MOOC课程
6.1 最优控制问题的数学描述
6.1 最优控制问题的数学描述
一. 最优控制问题的实例
例1:最速升降问题
设有一质量为𝑴的物体,其内部有一控制器,可以产生一个作用力𝒖(𝒕)控制物体上下运动
作用力满足约束条件 𝒖(𝒕) ≤ 𝑪 。若物体在𝑡𝟎 时刻,离地面的高度为ℎ𝟎 ,垂直运动的速度
为𝑣𝟎 。寻找作用力𝒖(𝒕),使物体最快地到达地面,且到达地面的速度为零。物体运动的
速度 𝒗(𝒕) ≤ 𝒗𝒎𝒂𝒙 u (t )
建模:受控系统的状态方程 M
令 𝑥1 𝑡 = ℎ 𝑡 , 𝑥𝟐 𝑡 = ℎሶ 𝑡 = 𝑣(𝑡)
g
系统的状态方程为:
𝑑𝑥1 h(t )
= 𝑥2
𝑑𝑡 (6---1)
𝑑𝑥2 𝑢(𝑡)
= −𝑔
𝑑𝑡 𝑀
6.1 最优控制问题的数学描述
一. 最优控制问题的实例
初始条件为: 𝑥1 𝑡𝟎 = ℎ𝟎 , 𝑥𝟐 𝑡𝟎 = 𝑣𝟎
𝑱 = න 𝒅𝒕 = 𝑡𝑓 − 𝑡𝟎
𝑡𝟎
取得极小值,且满足如下约束条件:
𝑥2 𝑡 ≤ 𝒗𝒎𝒂𝒙
𝑥1 𝑡𝑓 = 0, 𝑥2 𝑡𝑓 = 0
6.1 最优控制问题的数学描述
二. 最优控制问题的一般提法
用数学语言描述最优控制问题,应包括以下几个方面的内容:
1. 受控系统的数学模型
用状态方程描述:𝒙ሶ 𝑡 = 𝒇[𝒙 𝑡 , 𝒖 𝑡 , 𝑡]
2. 受控系统的始端和终端条件,即状态方程的边界条件:
对最优控制问题始端条件通常是已知的: 𝒙 𝑡𝟎 = 𝒙𝟎
终端条件可以用一个目标集表示:𝛀𝒇 = {𝒙 𝑡𝒇 ; 𝒈1 𝒙 𝑡𝒇 = 𝟎, 𝒈2 𝒙 𝑡𝒇 ≤ 𝟎}
3. 容许控制
控制量受客观条件限制所能取值的范围:𝒖 𝒕 ∈ 𝑼, 𝑼 = 𝒖 𝒕 ; 𝝋 𝒙, 𝒖 ≤ 𝟎
6.1 最优控制问题的数学描述
4. 性能指标
𝒕𝒇
(1)积分型性能指标:𝑱 = 𝑳 𝒕 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝟎
反映控制过程中对系统性能的要求。
(2)终值型性能指标: 𝑱 = 𝚽[𝒙 𝒕𝒇 , 𝒕𝒇 ]
反映了系统状态在终端时刻的性能。
𝒕𝒇
(3)复合型性能指标:𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + 𝑳 𝒕 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝟎
反映了控制过程和终端时刻对系统性能的要求。
若:𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 ,𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 为二次型函数,则性能指标可表示为二次型性能指标:
𝒕𝒇
𝟏 𝑻 𝟏
𝑱= 𝒙 𝒕𝒇 𝑷𝒙 𝒕𝒇 + න [𝒙 𝒕 𝑻 𝑸𝒙 𝒕 + 𝒖 𝒕 𝑻 𝑹𝒖 𝒕 ]𝒅𝒕
𝟐 𝟐
𝒕𝟎
6.1 最优控制问题的数学描述
最优控制问题的一般提法:
已知受控系统的状态方程:𝒙ሶ 𝑡 = 𝒇[𝒙 𝑡 , 𝒖 𝑡 , 𝑡]
及给定的始端条件𝒙 𝑡𝟎 = 𝒙𝟎 和规定的目标集𝛀𝒇 = {𝒙 𝑡𝒇 ; 𝒈1 𝒙 𝑡𝒇 = 𝟎, 𝒈2 𝒙 𝑡𝒇 ≤ 𝟎}
在容许控制集合 𝑼中,寻找控制向量𝒖 𝒕 ∈ 𝑼,𝒕 ∈ [𝑡0 , 𝑡𝒇 ]
𝐦𝐢𝐧 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕
𝒕𝟎
为函数𝒙 𝑡 , 𝒖 𝑡 的函数,即泛函。最优控制问题可归结为求某个泛函的条件极值问题。
《现代控制理论》MOOC课程
6.2 求解最优控制的变分方法
6.2.1 泛函与变分的基本概念
一 泛函与泛函的变分
1. 泛函的定义
𝟏 5
当 𝒙(𝑡) = 𝑡 有:𝑱 = 𝟎 𝑡2 + 𝑡 𝒅𝑡 =
6
𝟏 1 2𝑡 1 1
当 𝒙(𝑡) = 𝑒𝑡 有:𝑱 = 𝟎 𝑒 2𝑡 + 𝑡𝑒 𝑡 𝒅𝑡 = 𝑒 +𝑡𝑒 𝑡 − 𝑒𝑡 ቚ = (𝑒 2 + 1)
2 0 2
6.2.1 泛函与变分的基本概念
2.泛函自变量的变分
泛函的增量
由自变量函数𝒙 𝒕 的变分𝜹𝒙 𝒕 引起泛函𝑱[𝒙 𝒕 ]的增加值
∆𝑱 𝒙 𝒕 = 𝑱 𝒙∗ 𝒕 + 𝜹𝒙 𝒕 − 𝑱 𝒙∗ 𝒕
称为泛函𝑱[𝒙 𝒕 ]的增量。
6.2.1 泛函与变分的基本概念
泛函的连续性
对于任意给定的正数𝜺 ,可以找到这样一个正数𝜹,当𝑑 𝒙, 𝒙∗ < 𝛆 时,有
𝑱 𝒙 𝒕 − 𝑱 𝒙∗ 𝒕 <𝛿
则称泛函𝑱 𝒙 𝒕 在𝒙∗ 𝒕 处是连续的。
其中,𝑑 𝒙, 𝒙∗ 表示在函数空间中𝒙 𝒕 与𝒙∗ 𝒕 之间的距离:
𝑑 𝒙, 𝒙∗ = max 𝒙 𝒕 − 𝒙∗ 𝒕
𝒂≤𝒕≤𝒃
泛函的变分
泛函𝑱 𝒙 𝒕 增量∆𝑱 𝒙 𝒕 的线性主部称为泛函的一阶变分,简称泛函的变分,记作𝜹𝑱
𝑑𝐽 1 𝑑2 𝐽
∆𝑱 = 𝑱 𝒙∗ 𝒕 + 𝜹𝒙 𝒕 − 𝑱 𝒙∗ 𝒕 = 𝜹𝒙 + 2
𝜹𝒙 𝟐
+𝑹
𝑑𝑥 𝒙∗ 2 𝑑𝑥 𝒙∗
其中,𝑹是关于𝜹𝒙的高阶无穷小项。
𝑑𝐽
泛函的变分定义为:𝛿𝐽 = ቕ 𝜹𝒙
𝑑𝒙 𝒙∗
6.2.1 泛函与变分的基本概念
泛函的变分引理
𝜕
泛函的变分 𝛿𝑱[𝒙(𝒕)] = 𝑱[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ
𝜕𝛼 𝜶=𝟎
证明: ∆𝜶 = 𝜶 − 𝟎 = 𝜶
𝜕 ∆𝑱 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕
𝑱[𝒙 𝒕 + 𝜶𝜹𝒙 𝒕 ] = lim ቤ
𝜕𝛼 𝜶=𝟎 ∆𝜶→𝟎 ∆𝜶 𝜶=𝟎
𝑱 𝒙 𝒕 + 𝜶𝜹𝒙 𝒕 − 𝑱 𝒙 𝒕
= lim
𝜶→𝟎 𝜶 ∆𝒇 𝒇(∆𝒙 + 𝒙𝟎 ) − 𝒇(𝒙𝟎 )
𝒇′ 𝒙𝟎 = lim = lim
∆𝒙→𝟎 ∆𝒙 ∆𝒙→𝟎 ∆𝒙
1 𝑑𝐽 1 𝑑2 𝐽 𝟐
= lim { ඐ 𝜶𝜹𝒙 + 𝜶𝜹𝒙 +𝑹}
𝜶→𝟎 𝜶 𝑑𝑥 𝑥 2
2 𝑑𝑥 𝒙
𝑑𝐽
= ඐ 𝛿𝒙 = 𝛿𝐽
𝑑𝑥 𝑥 得证
6.2.1 泛函与变分的基本概念
𝟏
例 计算 泛函𝑱 = 𝒕𝒅 𝒕 𝟐𝒙 𝟎的变分
解:方法一,直接根据变分引理:
𝜕 1
𝛿𝐽 = න [𝑥 𝑡 + 𝛼𝛿𝑥 𝑡 ]2 𝑑𝑡
𝜕𝛼 0
𝛼=0
1 𝟏
= න 2[𝑥 𝑡 + 𝛼𝛿𝑥 𝑡 ]𝛿𝑥 𝑡 𝑑𝑡ඐ = න 2𝒙 𝒕 𝛿𝑥 𝑡 𝑑𝑡
0 𝛼=0 𝟎
方法二,根据变分的定义:
1 1 1 1
∆𝐽 = න [𝑥 𝑡 + 𝛿𝑥 𝑡 ]2 𝑑𝑡 − න 𝑥 2 𝑡 𝑑𝑡 = න 2𝑥 𝑡 𝛿𝑥 𝑡 𝑑𝑡 + න (𝛿𝑥 𝑡 )2 𝑑𝑡
0 0 0 0
𝟏
故增量的线性主部为:𝛿𝐽 = 𝟎2𝒙 𝒕 𝛿𝑥 𝑡 𝑑𝑡
6.2.1 泛函与变分的基本概念
二 泛函的极值
1. 泛函极值的定义
如果泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 的邻域内,其增量:
∆𝑱 = 𝑱 𝒙 𝒕 ] − 𝑱[𝒙∗ 𝒕 ≥𝟎
或 ∆𝑱 = 𝑱 𝒙 𝒕 ] − 𝑱[𝒙∗ 𝒕 ≤𝟎
则称泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 有极小值或极大值。
2. 泛函极值定理
若可微泛函𝑱 𝒙 𝒕 在函数𝒙 𝒕 = 𝒙∗ 𝒕 达到极值,则泛函𝑱 𝒙 𝒕 在𝒙 𝒕 = 𝒙∗ 𝒕 上的变分等
于零,即
𝛿𝐽 𝒙∗ 𝒕 =0
6.2.1 泛函与变分的基本概念
所以它的导数在𝜶 = 𝟎时应为零,即
𝜕
𝑱[𝒙∗ 𝒕 + 𝛼𝛿𝒙 𝒕 ] =𝟎
𝜕𝛼 𝜶=𝟎
𝜕
由变分引理 𝑱[𝒙∗ 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ = 𝛿𝐽 𝒙∗ 𝒕 =𝟎
𝜕𝛼 𝜶=𝟎
得证
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(1)
6.2.2 无约束条件的变分问题
一 欧拉方程
讨论一个固定端点时间,固定端点状态的无约束条件变分问题。
𝒕𝒇
问题: 考虑泛函为 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎
ሶ
式中𝒙 𝒕 在𝒕 ∈ [𝒕𝟎 , 𝒕𝒇 ]上连续, 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]连续,二阶可微,求使𝑱 𝒙 𝒕 取极值,且满
足给定边界条件:𝒙(𝒕𝟎 ) = 𝒙𝟎 , 𝒙 𝒕𝒇 = 𝒙𝒇 的函数 𝒙∗ 𝒕 。
解:根据泛函极值定理,在极值曲线𝒙∗ 𝒕 上,必有𝛅𝑱 𝒙∗ 𝒕 = 𝟎
𝒕𝒇
𝜕 𝜕
而 𝛿𝑱[𝒙 𝒕 ] = 𝑱[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 ]ቕ = න 𝑳[𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕] 𝒅𝑡
𝜕𝛼 𝜶=𝟎 𝒕𝟎 𝜕𝛼
𝜶=𝟎
6.2.2 无约束条件的变分问题
𝒕𝒇
𝜕 𝜕 𝒙(𝒕)+𝛼𝛿𝒙(𝒕)
=න ൝ 𝑳 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕
𝒕𝟎 𝜕(𝒙(𝒕)+𝛼𝛿𝒙(𝒕)) 𝜕𝛼
𝜕 𝜕 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕
+ 𝑳 𝒙 𝒕 + 𝛼𝛿𝒙 𝒕 , 𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 , 𝒕 ቋቩ 𝒅𝑡
𝜕(𝒙ሶ 𝒕 + 𝛼𝛿 𝒙ሶ 𝒕 ) 𝜕𝛼
𝜶=𝟎
𝒕𝒇 ሶ ሶ
𝜕𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕] 𝜕𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]
=න 𝛿𝒙 𝒕 + 𝛿 𝒙ሶ 𝒕 𝒅𝑡
𝒕𝟎 𝜕𝒙 𝒕 𝜕𝒙ሶ 𝒕
6.2.2 无约束条件的变分问题
𝒕𝒇
𝜕𝑳 𝜕𝑳
𝛿𝑱 = න 𝛿𝒙 + 𝛿 𝒙ሶ 𝒅𝑡
𝒕𝟎 𝜕𝒙 𝜕𝒙ሶ
𝒕𝒇 𝒕 𝒇 𝒕𝒇
𝜕𝑳 𝒕𝒇
𝜕𝑳 𝒕𝒇 𝜕𝑳 𝜕𝑳 𝜕𝑳
右边第二项:
න ሶ
𝛿 𝒙𝒅𝑡 =න 𝛿𝑑𝒙 = න 𝑑(𝛿𝒙) = 𝛿𝒙ቤ − න 𝑑 𝛿𝒙
𝒕𝟎 𝜕 𝒙ሶ 𝒕𝟎 𝜕 𝒙ሶ 𝒕𝟎 𝜕 𝒙ሶ
𝜕𝒙ሶ 𝒕𝟎 𝒕𝟎 𝜕𝒙ሶ
𝒕𝒇 𝒕𝒇
𝜕𝑳 𝑑 𝜕𝑳
= 𝛿𝒙ቤ − න 𝛿𝒙𝑑𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝑑𝑡 𝜕 𝒙ሶ
𝟎
𝒕𝒇
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
故: 𝛿𝑱 = 𝛿𝒙ቤ + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝟎
考虑端点固定,故有:𝜹𝒙(𝒕𝟎 ) = 𝜹𝒙 𝒕𝒇 = 𝟎
6.2.2 无约束条件的变分问题
𝒕𝒇
𝜕𝑳 𝑑 𝜕𝑳
所以: 𝛿𝑱 = න − 𝛿𝒙𝒅𝑡
𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
在极值曲线𝒙∗ 𝒕 上,必有 𝛿𝑱 𝒙∗ 𝒕 =𝟎
𝒕 𝜕𝑳 𝑑 𝜕𝑳
即:𝛿𝑱 𝒙∗ 𝒕 = 𝒇 𝒕 − ฬ 𝛿𝒙𝒅𝑡 = 0
𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ 𝒙=𝒙∗
𝜕𝑳 𝑑 𝜕𝑳
故: − =𝟎
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
该式称为欧拉方程,是泛函极值的必要条件。
由于
𝑑 𝜕𝑳 𝑑 𝜕𝑳[𝒙, 𝒙,ሶ 𝒕] 𝜕 𝜕𝑳 𝑑𝑥 𝜕 𝜕𝑳 𝑑 𝒙ሶ 𝜕 𝜕𝑳 𝜕2𝑳 𝜕2𝑳 𝜕2𝑳
= = + + = 𝒙ሶ + 𝟐 𝒙ሷ +
𝑑𝑡 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒙ሶ 𝜕𝒙 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒙ሶ 𝜕𝒙ሶ 𝑑𝑡 𝜕𝒕 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒙 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒕
6.2.2 无约束条件的变分问题
欧拉方程可进一步表示为:
𝜕𝑳 𝜕2𝑳 𝜕2𝑳 𝜕2𝑳
− 𝒙ሶ − 𝟐 𝒙ሷ − =𝟎
ሶ
𝜕𝒙 𝜕𝒙𝜕𝒙 𝜕𝒙ሶ ሶ
𝜕𝒙𝜕𝒕
ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
写成简洁的形式: 𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎
这样无约束泛函极值问题就归结为求解欧拉方程问题。
𝝅
例:求泛函 𝑱 = 𝒙( 𝟎ሶ 𝟐 − 𝒙𝟐 )𝒅𝑡
𝟐
𝜋
在边界条件: 𝑥 0 = 1, 𝑥 = 2 下的极值曲线。
2
解:𝑳 = 𝒙ሶ 𝟐 − 𝒙𝟐 𝑳𝒙 = −𝟐𝒙 𝑳𝒙ሶ = 𝟐𝒙ሶ 𝑳𝒙ሶ 𝒙ሶ = 𝟐 𝑳𝒙𝒙
ሶ = 𝑳𝒙𝒕
ሶ =𝟎
ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
由欧拉方程:𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎 可得:−𝟐𝒙 − 𝟐𝒙ሷ = 𝟎
解得:𝒙∗ 𝒕 = 𝒄𝒐𝒔 𝒕 + 𝟐𝒔𝒊𝒏(𝒕)
《现代控制理论》MOOC课程
6.2.2 无约束条件的变分问题(2)
6.2.2 无约束条件的变分问题
二 横截条件
端点状态𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的变分问题。
𝒕𝒇
问题: 寻求使泛函 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎
取极值,且𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的函数 𝒙∗ 𝒕 。
𝒕 𝒇 𝒕𝒇
𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
解: 𝛿𝑱 = 𝛿𝒙ቤ + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝟎
由于端点不固定,所以𝜹𝒙(𝒕𝟎 ) ≠ 𝟎, 𝛅𝒙 𝒕𝒇 ≠ 𝟎
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
𝛿𝑱 = ቤ 𝛿𝒙 𝒕𝒇 − ቤ 𝛿𝒙(𝒕𝟎 ) + න − 𝛿𝒙𝒅𝑡
𝜕𝒙ሶ 𝒕 𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝒇 𝟎
6.2.2 无约束条件的变分问题
在极值曲线𝒙∗ 𝒕 上,必有 𝛿𝑱 𝒙∗ 𝒕 =𝟎
𝜕𝑳 𝑑 𝜕𝑳
故欧拉方程: − =𝟎
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
横截条件: 𝜕𝑳
ቤ = 𝟎,
𝜕𝒙ሶ 𝒕
𝒇
𝜕𝑳
ቤ =𝟎
𝜕𝒙ሶ 𝒕
𝟎
成立
显然,端点中任意一点固定时,其横截条件改由终端条件代替。
𝒕𝒇
𝜕𝑳 𝜕𝑳 𝜕𝑳 𝑑 𝜕𝑳
𝛿𝑱 = ቤ 𝛿𝒙 𝒕𝒇 − ቤ 𝛿𝒙 𝒕𝟎 + න − 𝛿𝒙𝒅𝑡 = 𝟎
𝜕𝒙ሶ 𝒕 𝜕𝒙ሶ 𝒕 𝒕𝟎 𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝒇 𝟎
6.2.2 无约束条件的变分问题
𝟏
例:求泛函 𝑱 = 𝒙( 𝟎ሶ 𝟐 + 1)𝒅𝑡
求满足下列两种端点情况的极值曲线。
(1) 𝑥 0 = 1, 𝑥 1 = 2 (2) 𝑥 0 = 1, 𝑥 1 未定
ሶ 𝒙ሶ − 𝑳𝒙ሶ 𝒙ሶ 𝒙ሷ − 𝑳𝒙𝒕
由欧拉方程:𝑳𝒙 − 𝑳𝒙𝒙 ሶ =𝟎
可得:𝟐𝒙ሷ = 𝟎
通解为:𝒙 𝒕 = 𝑪𝟏 𝒕 + 𝑪𝟐
对端点情况(1)可得: 𝒙∗ 𝒕 = 𝑡 + 1 相应的极值为:𝑱 𝒙∗ 𝒕 =𝟐
对端点情况(2)由横截条件: 𝜕𝑳
ቤ = 𝟐𝒙ሶ ቚ =𝟎 可得:𝒙ሶ 1 = 𝟎
𝜕𝒙ሶ 𝒕 𝒕=𝟏
𝒇
考虑初值条件可得: 𝒙∗ 𝒕 = 1 相应的极值为:𝑱 𝒙∗ 𝒕 =1
6.2.2 无约束条件的变分问题
二 欧拉方程与横截条件的向量形式
𝒕𝒇
问题: 寻求使泛函 𝑱𝒙 𝒕 ሶ
= න 𝑳[𝒙 𝒕 , 𝒙(𝒕), 𝒕]𝒅𝑡
𝒕𝟎
取极值,且𝒙(𝒕𝟎 ) 和 𝒙 𝒕𝒇 均不固定时的函数 𝒙∗ 𝒕 。
其中, 𝒙 𝒕 = 𝑥1 𝑡 , 𝑥2 𝑡 , ⋯ , 𝑥𝑛 𝑡 𝑻
𝑻
𝒙ሶ 𝒕 = 𝑥ሶ1 𝑡 , 𝑥ሶ 2 𝑡 , ⋯ , 𝑥ሶ 𝑛 𝑡
一维情况下的欧拉方程和横截条件可以推广到n维情况:
𝜕𝑳
ቤ = 𝟎,
𝜕𝒙ሶ 𝒕
𝜕𝑳 𝑑 𝜕𝑳 𝒇
故欧拉方程: − =𝟎 横截条件:
𝜕𝒙 𝑑𝑡 𝜕𝒙ሶ
𝜕𝑳
ቤ =𝟎
ሶ
𝜕𝒙 𝒕
𝟎
6.2.2 无约束条件的变分问题
例. 求泛函 2
J [ x (t )] ( 2 x1 x2 x12 x 22 ) dt
0
满足边界条件 x ( 0 )
1 0 x1 ( 2 ) 1
x (0) 0 ,
2 x 2 ( 2 ) 1
的最优轨线。
𝜕𝐿 𝑑 𝜕𝐿
解:由欧拉方程 − =0 得
𝜕𝑥 𝑑𝑡 𝜕𝑥ሶ
𝜕𝐿 𝜕𝐿
𝜕𝐿 𝑑 𝜕𝐿 𝜕𝑥1 𝑑 𝜕 𝑥ሶ 1 2𝑥2 𝑑 2𝑥ሶ 1 2𝑥2 2𝑥ሷ 1
− = − = − = - =0
𝜕𝑥 𝑑𝑡 𝜕 𝑥ሶ 𝜕𝐿 𝑑𝑡 𝜕𝐿 2𝑥1 𝑑𝑡 2𝑥ሶ 2 2𝑥1 2𝑥ሷ 2
𝜕𝑥2 𝜕 𝑥ሶ 2
6.2.2 无约束条件的变分问题
于是: x2 x1 0
可得: x1( 4 ) x1 0
x1 x2 0
特征方程为: 4 1 0
特征值为: 𝜆1 = 1, 𝜆2 = −1, 𝜆3 = 𝑖, 𝜆4 = −𝑖
x 2 ( t ) C 1e t C 2 e t C 3 cos t C 4 sin t
在本节中假定,控制𝒖(𝒕) 是无约束的,且是连续的。
一. 终端时间固定、状态自由,等式约束条件下的变分问题
受控系统的状态方程为 𝒙ሶ (𝒕) = 𝒇[𝒙 𝒕 , 𝒖 𝒕 , 𝒕]
初始状态为𝒙(𝒕𝟎 ) = 𝒙𝟎
终端时间𝒕𝒇 固定,终端状态𝒙(𝒕𝒇 )自由
𝒕𝒇
寻求最优控制𝒖(𝒕)使性能指标 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + 𝑳 𝒕 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 𝒅𝒕 取得极小值。
𝟎
将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎
引入拉格朗日乘子函数𝝀 𝒕 ,原等式约束问题,转化为如下无约束优化问题:
𝒕𝒇
𝑱′ = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题
定义标量函数 𝑯 𝒙 𝑡 , 𝒖 𝑡 , 𝝀 𝒕 , 𝑡 = 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕
称𝑯 𝒙 𝑡 , 𝒖 𝑡 , 𝝀 𝒕 , 𝑡 为哈密尔顿函数。则
𝒕𝒇 𝒕𝒇
泛函 𝑱′ 取得极值的必要条件为:𝛅𝑱′ = 𝟎
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = 𝜹𝒙 𝒕𝒇 + න 𝜹𝒙 + 𝜹𝒖 + 𝜹𝝀 − 𝒙ሶ 𝑻 𝜹𝝀 −𝝀𝑻 𝜹 𝒙ሶ 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎
𝒕𝒇 𝒕𝒇 𝒕𝒇 𝒕𝒇 𝒕𝒇
𝒕𝒇 𝒕𝒇
而 න 𝝀𝑻 𝜹 𝒙ሶ 𝒅𝒕 = න 𝝀𝑻 𝜹𝒅𝒙 = න 𝝀𝑻 𝒅 𝜹𝒙 = 𝝀𝑻 𝜹𝒙ቚ −න 𝒅𝝀𝑻 𝜹𝒙 = 𝝀𝑻 𝜹𝒙ቚ − න 𝝀ሶ 𝑻 𝜹𝒙𝒅𝒕
𝒕𝟎 𝒕𝟎
𝒕𝟎 𝒕𝟎 𝒕𝟎 𝒕𝟎 𝒕𝟎
6.2.3 有约束条件的变分问题
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = 𝜹𝒙 𝒕𝒇 −𝝀𝑻 𝜹𝒙ቚ + න 𝜹𝒙 + 𝜹𝒖 + 𝜹𝝀 − 𝒙ሶ 𝑻 𝜹𝝀 + 𝝀ሶ 𝑻 𝜹𝒙 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝒕𝟎 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + 𝝀𝑻 𝒕𝟎 𝜹𝒙 𝒕𝟎 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎
由于𝒙 𝒕𝟎 固定,故𝛅𝒙 𝒕𝟎 = 𝟎
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱′ = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎
由于𝒙 𝒕 , 𝒖 𝒕 , 𝝀 𝒕 , 𝒙 𝒕𝒇 不受限制,故𝛅𝒙 𝒕 , 𝜹𝒖 𝒕 , 𝜹𝝀 𝒕 , 𝜹𝒙 𝒕𝒇 任意
𝝏𝑯
要使 𝜹𝑱′ =𝟎 必有:𝝏𝑯 − 𝒙ሶ = 𝟎 即有 𝒙ሶ =
𝝏𝝀
= 𝒇(𝒙, 𝒖, 𝒕)
𝝏𝝀 𝝏𝑯
=𝟎
𝝏𝑯 𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝒖
𝝀ሶ = − 𝝀 𝒕𝒇 =
𝝏𝒙 𝝏𝒙 𝒕𝒇
6.2.3 有约束条件的变分问题
综上,终端时间固定、状态自由,等式约束条件下的性能指标取极值的必要条件为:
H
x f ( x, u , t )
状态方程:
x(t ) x
0 0
H
x
协状态方程:
[ x(t f ), t f ]
(t )
f x(t f )
控制方程: H 0
u
《现代控制理论》MOOC课程
哈密尔顿函数的重要性质:
沿着最优轨迹的哈密尔顿函数对时间的全导数等于对时间的偏导数: dH H
dt t
当哈密尔顿函数不显含时间变量时,沿着最优轨迹的哈密尔顿函数为常数: 𝐻 = 𝐶
证明: 𝐻 = 𝐿 + 𝜆𝑇 𝑓
T T T
dH H H H H
x u
dt x u t
当系统取得极值时有:
T T T T
H H H H H H
x 0
x x x
6.2.3 有约束条件的变分问题
故: dH H
dt t
当H不显含t时有: dH H 0 即: H C
dt t
这一性质可用于判断系统的最优轨迹是否正确。
例:已知一阶受控系统 x u, x(t0 ) x0 性能指标函数为
1 1 tf 2
J C x (t f ) u dt
2
2 2 t0
其中常数 C 0 ,求使 J 为极小值的最优控制 u (t )
1 2 H
解: H u u 得 u
2
由 u 0
u
6.2.3 有约束条件的变分问题
解协状态方程:
1
H Cx 2 (t f )
0 (t f )
2 Cx(t ) 得: Cx(t f )
x x(t f )
f
代入状态方程: x u C x(t f )
x(t0 ) x0
x0
令 𝑡 = 𝑡𝑓 可得:x(t f )
1 C (t f t0 )
C x0
进而得: u (t f ) Cx(t f )
1 C (t f t0 )
《现代控制理论》MOOC课程
二. 终端时间固定、状态约束,等式约束条件下的变分问题
将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎
𝑱′ = 𝜽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题
H
x
协状态方程:
[ x(t f ), t f ] [ x(t f ), t f ] g[ x(t f ), t f ]
f (t ) T
x(t f ) x(t f ) x (t )
f
g[ x(t ), t ] 0
f f
6.2.3 有约束条件的变分问题
例:受控系统的状态方程为: x1 x2
x2 u
初始状态为: x1 (0) x2 (0) 0
当 t f 1 时将系统状态转移到 x1 (1) x2 (1) 1 ,且使性能指标
1 1 2
J u dt
2 0
达到极小值,求最优控制及相应的最优轨线。
解:终端约束为:g ( x(t f )) x1 (1) x2 (1) 1 0
1 2
哈密尔顿函数为: H u 1x2 2u
2
H
由: u 2 0 得 u 2
u
6.2.3 有约束条件的变分问题
代入状态方程和协状态方程:
x1 x2 x1 (0) 0
x2 2 x2 (0) 0
H [ g ( x(1))]
1 0 1 (1)
x1 x1 (1)
x1(1) x2 (1) 1 0
H [ g ( x(1))]
2 1 2 (1)
解得: x2 x2 (1)
1 3 3 2
x1 (t ) t t
14 7 3 6
3 2 6 3 6 u (t ) t
x2 (t ) t t 𝜆2 𝑡 = 𝑡 − 7 7
14 7 7 7
《现代控制理论》MOOC课程
三. 终端时间自由、状态约束,等式约束条件下的变分问题
寻求最优控制𝒖(𝒕)及最优终端时刻𝒕𝒇 ,使系统在终端时刻转移到某一终端状态𝒙(𝒕𝒇 )
且满足:𝐠[𝒙(𝒕𝒇 ), 𝒕𝒇 ] = 𝟎
𝒕
使性能指标 𝑱 = 𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 + 𝑡 𝒙 𝑳 𝒇 𝒕, 𝒖 𝑡 , 𝑡 𝒅𝒕 取得极小值。
𝟎
将状态方程改写成:𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕) = 𝟎
引入拉格朗日乘子函数 𝝀 𝒕 , 𝝁(𝒕) 原等式约束问题,转化为如下无约束优化问题:
𝒕𝒇
𝑱′ = 𝜽 𝒙 𝒕𝒇 , 𝒕𝒇 + න 𝑳 𝒙 𝑡 , 𝒖 𝑡 , 𝑡 + 𝝀𝑻 𝒕 [𝒇 𝒙 𝒕 , 𝒖 𝒕 , 𝒕 − 𝒙ሶ (𝒕)] 𝒅𝒕
𝒕𝟎
6.2.3 有约束条件的变分问题
tf
于是: J [ x(t f ), t f ] g[ x(t f ), t f ]
{H [ x(t ), u (t ), (t ), t ] T (t ) x(t )}dt
' T
t0
T
[ x(t f ), t f ] [ x(t f ), t f ]
故: J '
x(t f ) d tf
x (t ) t
f f
g[ x(t f ), t f ]
T g[ x(t f ), t f ]
T
x(t f ) d t f g [ x(t f ), t f ]
T
x(t f ) t
f
6.2.3 有约束条件的变分问题
{H [ x (t ), u(t ), t ] T (t ) x (t )} t t f dt f
T T T
tf H H H
{ x u xT
T
(t ) x(t )}dt
t0 x u
tf tf tf
t xdt d x x
tf
而:
T T T
t0 T xdt
0 t0 t0
6.2.3 有约束条件的变分问题
故有:
[ x(t ), t ] T
' g [ x (t ), t ]
J x(t f )
f f T f f
x(t f ) x(t f )
[ x(t f ), t f ]
T g[ x (t f ), t f ]
f d t g T
[ x(t f ), t f ]
t t
f f
{H [ x(t ), u (t ), t ] T (t ) x(t )} t t f dt f T x t t f
T T T
tf H H H
t 0
{
x
x
u
u
x }dt
6.2.3 有约束条件的变分问题
t0 tf tf d tf
6.2.3 有约束条件的变分问题
故有:
[ x(t ), t ] T
' g [ x (t ), t ]
J x(t f )
f f T f f
x(t f ) x(t f )
[ x(t f ), t f ]
T g[ x(t f ), t f ]
f d t g T
[ x(t f ), t f ]
t t
f f
{H [ x(t ), u (t ), t ] T (t ) x(t )} t t f dt f T (t f ) x(t f ) T (t f ) x(t f ) d t f
T T T
tf H H H
t 0
{
x
x
u
u
x }dt
6.2.3 有约束条件的变分问题
即:
[ x(t ), t ] T
' g [ x (t ), t ]
J (t f ) x(t f )
f f T f f T
x(t f ) x(t f )
[ x(t f ), t f ] g [ x (t ), t ]
f f
H [ x(t f ), u (t f ), t f ] d t f
T
t t
f f
g T [ x(t f ), t f ]
T T T
tf H H H
t 0
{
x
x
u
u
x }dt
6.2.3 有约束条件的变分问题
协状态方程: H
x
[ x(t f ), t f ] g[ x(t f ), t f ]
T
(t )
f x(t f ) x(t f )
g[ x(t ), t ] 0
f f
[ x(t f ), t f ] ]
H [ x(t f ), u (t f ), t f ] T g[ x (t f ), t f
0
t f t f
6.2.3 有约束条件的变分问题
例:给定受控系统 x u, x(0) 1
状态方程为: x H u 协状态方程为:
H
0
x
6.2.3 有约束条件的变分问题
边界条件为(由于端点状态固定,故不用横截条件):
x (0) 1
[ x (t f ), t f ] T g[ x (t f ), t f ] 2 (t f )
由:H [ x (t f ), u(t f ), t f ]
1 0
t f t f 2
可得:
(t f ) 2
故: 2 可得: u(t ) 2
x(t ) 1 2 t 1
再由: x (t f ) 0 可得: t f
2
《现代控制理论》MOOC课程
6.3 极小值原理
6.3.1 经典变分法的局限性
经典变分法
𝑻 𝒕𝒇
𝑻 𝑻 𝑻
𝝏𝚽 𝒙 𝒕𝒇 , 𝒕𝒇 𝝏𝑯 𝝏𝑯 𝝏𝑯
𝟎 = 𝜹𝑱 = − 𝝀 𝒕𝒇 𝜹𝒙 𝒕𝒇 + න + 𝝀ሶ 𝜹𝒙 + 𝜹𝒖 + − 𝒙ሶ 𝜹𝝀 𝒅𝒕
𝝏𝒙 𝒕𝒇 𝝏𝒙 𝝏𝒖 𝝏𝝀
𝒕𝟎
用经典变分法求泛函极值时,假定控制量𝒖(𝒕)不受约束,即𝜹𝒖为任意,为使性能指标
函𝜹𝑱 = 𝟎 , 可得获得最优控制所需满足的控制方程𝝏𝑯Τ𝝏𝒖 = 𝟎 。而当控制量存在约束时,
𝜹𝒖不能任意取值,控制方程不成立。
6.3.1 经典变分法的局限性
例 . 考虑一阶系统
x(t ) x(t ) u(t ), x(0) 1
试求最优控制 u (t ) ,使如下目标函数有极小值。
1
J x(t )dt
0
解:这是一个终端时间固定、状态自由的最优控制问题。
应用经典变分法求解。
引入乘子 (t ) ,构造哈密尔顿函数:
H x(t ) (t )[ x(t ) u(t )]
H
协状态方程及边界条件为: (t ) (t ) 1
x
(t f ) (1) 0
6.3.1 经典变分法的局限性
控制方程为: H
(t ) 0
u
显然,控制方程与协状态方程矛盾。
用变分法求解,问题无解。
而问题是有解的。由于H是u的一次函数,故极值一定存在且存在边界上,而不能在
H
0 的点上达到。
u
此外,应用经典变分法H对u必须有导数,即要求状态方程的右侧 f ( x, u, t ) 和目标
函数的被积函数 L( x, u, t ) 对控制u可导。
《现代控制理论》MOOC课程
6.3.2 终端时间固定的极小值原理
6.3.2 终端时间固定的极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端时间𝑡𝑓 固定,终端状态 𝒙(𝑡𝑓 )自由。 控制 u(t ) U ,U 可为闭集。
𝑡𝑓
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = 𝐿 𝑡 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0
若取: H L[ x(t ), u(t ), t ] T f [ x(t ), u(t ), t ]
则极小值存在的必要条件为:
H
(t ) (t f ) 0
x
𝑥ሶ 𝑡 = 𝑓 𝑥 𝑡 , 𝑢 𝑡 , 𝑡 𝑥 𝑡0 = 0
𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 , 𝑡 = min 𝐻 𝑥 ∗ 𝑡 , 𝑢 𝑡 , 𝜆 𝑡 , 𝑡
𝑢∈𝑈
式中, 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 为最优运动轨迹和最优控制。
6.3.2 终端时间固定的极小值原理
说明:
1)∀𝑢 ∈ 𝑈, 𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 ≤ 𝐻 𝑥 ∗ , 𝑢, 𝜆, 𝑡 ,即𝑢∗ 使哈密尔顿函数为𝑢的函数极小值。
2)𝑢∗ 使哈密尔顿函数为𝑢的函数最小值,这也是极小值原理的来源。若𝐻 = −𝐿 − 𝜆𝑇 𝑓
则有极大值原理,此时最优控制的必要条件为:
𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 , 𝑡 = max 𝐻 𝑥 ∗ 𝑡 , 𝑢 𝑡 , 𝜆 𝑡 , 𝑡
𝑢∈𝑈
3)极小值原理是性能指标取极小值的最优控制问题的必要条件,而非充分条件。
证明:
u* (t ), t [t , t ) x* (t ), t [t , t )
0
0
对于控制:
u (t ) u (t ), t [t , t ) x (t ) x(t ), t [t , t )
对应的状态轨迹为:
* *
u (t ), t [t , t f ]
x (t ), t [t , t f ]
6.3.2 终端时间固定的极小值原理
tf
故有: J (u ( )) J (u* ( )) [ L( x , u , t ) L( x* , u* , t )]dt 0
t0
对上式加减: LT
( x x* ) 可得:
x
tf
LT LT
)]dt 0
* * * *
[ L ( x , u , t ) L ( x , u , t ) ( x x ) ( x x
t
x x
0
由协状态方程可得: H ( L T
f ) L f T
x x x x
L f T LT T f
即:
T
x x x x
6.3.2 终端时间固定的极小值原理
tf
LT
T f
故有: [ L( x , u , t ) L( x* , u* , t ) ( x x ) (
* T
)( x x* )]dt 0
t
x x
0
tf tf tf tf
其中: * tf * tf
)dt
T * T *
( x x ) dt d ( x x ) T
( x x ) T
d ( x x *
) T
( x x ) T
( x x*
t0 t0
t0 t0 t0 t0
tf
* tf
T ( x x ) T [ f ( x , u , t ) f ( x* , u* , t )]dt
t0
t0
代入上式可得:
tf
* tf LT T f
( x x ) {[ L( x , u , t ) L( x , u , t )] [ f ( x , u , t ) f ( x , u , t )]
T * * T * *
( x x )
*
( x x* )}dt 0
t0
t0
x x
tf T
t H
)]dt 0
T * f * * *
即: ( x x ) [ H ( x ,
u , , t ) H ( x , u , , t ) ( x x
t0
t x
0
6.3.2 终端时间固定的极小值原理
按积分区间分段可得:
𝑡𝑓 𝑡 𝜕𝐻 𝑇
−𝜆𝑇 (𝑥𝜀 − ∗ ۂ
𝑥 ) 𝑡0 + ∗ 𝑥(𝐻[ 𝑡, 𝑢∗ , 𝜆, 𝑡) −𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 − 𝑥 ∗ − 𝑥 ∗ ]𝑑𝑡
0 𝜕𝑥
𝑡+𝜀 𝜕𝐻 𝑇
+ 𝑥(𝐻[ 𝑡,
𝑢, 𝜆, 𝑡) −𝐻 𝑥 ∗ , 𝑢∗ , 𝜆, 𝑡 − 𝑥 − 𝑥 ∗ ]𝑑𝑡
𝜕𝑥
𝑡𝑓 𝜕𝐻 𝑇
+ 𝑡+𝜀[𝐻(𝑥 ∗ , 𝑢 ∗ , 𝜆, 𝑡) ∗ ∗
− 𝐻 𝑥 , 𝑢 , 𝜆, 𝑡 − 𝑥 ∗ − 𝑥 ∗ ]𝑑𝑡 ≥ 0
𝜕𝑥
由于 (t f ) 0 ,当 t t0 有: x x*
t T
* tf H * *
故有: ( x x ) [ H ( x , u , , t ) H ( x , u , , t ) ( x x )]dt 0
T * * * *
t0
t x
0
6.3.2 终端时间固定的极小值原理
在 t 处: x x* ,当 0
t T t
H * *
[ H ( x , u, , t ) H ( x , u , , t ) ( x x )]dt [ H ( x*, u, , t ) H ( x*, u*, , t )]dt
* * *
t x t
tf T
H * *
V (t ) [ H ( x , u , , t ) H ( x , u , , t ) ( x x )]dt
令: * * * * *
t x
dV
对 V (t ) 在 0 处用泰勒级数展开:V (t ) V (t )
* * *
o( )
d 0
6.3.2 终端时间固定的极小值原理
当 0 时, x* (t ) x* (t ), u* (t ) u* (t )
dV
故有, V * (t ) 0, 0
d 0
tf
H * *
即: V * (t )
[H ( x , u , , t ) H ( x , u , , t ) x ( x x )]dt o( )
* * * *
t
综上可得,对 u U :
o( )
[ H ( x , u, , t ) H ( x , u , , t )]
* * *
0
即: u U H ( x* , u* , , t ) H ( x*, u, , t )
得证
6.3.2 终端时间固定的极小值原理
故最优控制 u* (t ) u
《现代控制理论》MOOC课程
6.3.3 终端时间未固定的极小值原理
6.3.3 终端时间未固定的极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端时间𝑡𝑓 不固定,终端状态 𝑥(𝑡𝑓 )自由。控制 u(t ) U , U 可为闭集。
𝑡
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = 𝑡 𝑥 𝐿 𝑓 𝑡, 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0
且: 𝐻 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 , 𝜆 𝑡 ቚ =0 式中, 𝑥 ∗ 𝑡 , 𝑢∗ 𝑡 为最优运动轨迹和最优控制。
𝑡𝑓∗
6.3.3 终端时间未固定的极小值原理
证明:作时间变换
t : t ( ) t0 w( s)ds, t (1) t f , 0 w( )
0
dt
w( ) dt w( )d
d
将问题有 t [t0 , t f ] 变换为: [0,1]
取:H [ x( ), u( ), w( ), ( )] L( x( ), u( )) w( ) T ( ) f ( x( ), u( )) w( )
1
J L( x( ), u ( )) w( )d s.t. x( ) f ( x( ), u( ))w( )
0
问题(B): 固定u ( ) ,求取 x* ( ),
*
w* ( ) ,使如下问题取极小
1
J L( x( ), u ( )) w( )d s.t. x( ) f ( x( ), u( ))w( )
0
6.3.3 终端时间未固定的极小值原理
对于问题(A),应用终端时间固定的极小值原理,其必要条件为:
H H
( ) w( )
x x
w( ) 有: ( ) d ( ) d (t ) w( ) H w( )
dt
由
d d dt x
d (t ) H
即 (t)
dt x
H [ x* ( ), u* ( ), w* ( ), ( )] min H [ x* ( ), u( ), w* ( ), ( )]
uU
由于 w* ( ) 固定,故 H [ x* ( ), u* ( ), ( )] min H [ x* ( ), u( ), ( )]
uU
即: H [ x* (t ), u* (t ), (t )] min H [ x* (t ), u(t ), (t )]
uU
6.3.3 终端时间未固定的极小值原理
对于问题(B),应用变分法,其必要条件为:
H
(t )
x
H
H 0
w( )
即: H [ x* (t ), u* (t ), (t )] 0
从而: H [ x* (t ), u* (t ), (t )] *
0
t f
证毕
6.3.3 终端时间未固定的极小值原理
例. 给定受控系统:
x1 0.5 x2 4u x1 (0) 50
x2 u x2 (0) 1
控制变量𝑢满足如下不等式
1 u 1 tf
求最优控制及终端时刻 t f ,使如下性能指标取得极小值: J ( x2 u )dt
0
解:哈密尔顿函数为
H L ( x, u , t ) T f ( x, u , t )
0.5 x2 4u
x2 u 1 2 x2 u 0.5 x2 1 4u 1 2u
u
6.3.3 终端时间未固定的极小值原理
H x 2 0.5 x 2 1 ( 2 1 4 1 ) u
1, 2 1 4 1 0
为使H函数取得极小值: u
*
1, 2 1 4 1 0
1 (t f ) 0
由协状态方程: 0
1
2 1 0.51 2 (t f ) 0
1 0
解得:
2 t t f
换接函数为: ( t ) 2 1 4 1 t t f 1
6.3.3 终端时间未固定的极小值原理
由: H x 2 0.5 x 2 1 ( 2 1 4 1 ) u x 2 ( t t f 1) u
当:𝑡 = 𝑡𝑓 时,𝜉 = −1,𝐻 = 0 故: x 2 ( t f ) 1
当:𝑡 ∈ 0, 𝑡𝑓 − 1 , 𝜉 > 0, 𝑢∗ = −1
x2 1
由: 得: x2 1 t
x2 (0) 1
由: x2 1 解得: x2 (t ) t t f 1
x2 (t f ) 1
6.3.3 终端时间未固定的极小值原理
由于状态连续,在换接点 t t f 1 ,必有
x 2 ( t f 1) t f 1 t f 1 1 ( t f 1)
故:t 2
f
1, 0 t 1
最优控制为: u
*
1, 1 t 2
《现代控制理论》MOOC课程
6.3.4 极小值原理
6.3.4 极小值原理
定理(极小值原理)
受控系统的状态方程为 𝑥ሶ (𝑡) = 𝑓[𝑥 𝑡 , 𝑢 𝑡 , 𝑡]
初始状态为𝑥(𝑡0 ) = 𝑥0
终端状态 𝑥(𝑡𝑓 )满足约束 g ( x ( t f ), t f ) 0
控制 u(t ) U , U 可为闭集
𝑡
寻求最优控制𝒖(𝒕)使性能指标 𝐽 = Φ 𝑥 𝑡𝑓 , 𝑡𝑓 + 𝑡 𝑥 𝐿 𝑓 𝑡, 𝑢 𝑡 , 𝑡 𝑑𝑡 取得极小值。
0
H
状态方程: x f ( x, u , t )
x (t ) x
0 0
6.3.4 极小值原理
H
协状态方程:
x
[ x (t f ), t f ] g[ x (t f ), t f ]
T
(t )
f x (t ) x (t )
f f
g[ x (t ), t ] 0
f f
[ x (t f ), t f ] g[ x (t f ), t f ]
H [ x (t f ), u (t f ), t f ] T 0
t f t f
𝐻函数在最优轨迹和最优控制上取极小值:
H ( x * ( t ), u * ( t ), ) min H ( x * ( t ), u ( t ), )
uU
式中 , x * ( t )、 u * ( t ) 为最优状态轨迹和最优控制。
6.3.4 极小值原理
t f 固定, H [ x* (t ), u * (t ), (t )] C
t f 未固定, H [ x* (t ), u * (t ), (t )] 0
*
t f
证明:略。
基本思想是将混合型目标函数化为积分型目标函数,将终端目标集约束化为动态约束。
然后用与证明积分型性能指标极小值原理相同的方法来证明。
例如,对于目标函数,由于 ( x ( t 0 ), t 0 ) 为常数
如下目标函数与原问题目标函数 𝑱等价
tf
J ( x (t f ), t f ) ( x (t 0 ), t 0 ) L[ x (t ), u (t )]dt
t0
6.3.4 极小值原理
目标函数 𝑱ҧ 可进一步表示为:
tf d ( x (t ), t )
J [ L ( x (t ), u (t ))]dt
t0 dt
tf ( x (t ), t ) T ( x (t ), t ) dx (t )
[ L ( x (t ), u (t ))]dt
t0 t x (t ) dt
tf ( x (t ), t ) T ( x (t ), t )
J [ f ( x (t ), u (t )) L ( x (t ), u (t ))]dt
t0 t x (t )
这样复合型目标函数就化为了积分型目标函数。
《现代控制理论》MOOC课程
6.3.5 时间最优控制
6.3.5 时间最优控制
一.线性定常时间最优控制问题的数学描述
问题:已知受控系统的状态方程为:
𝒙ሶ = 𝑨𝒙 𝑡 + 𝑩𝒖(𝑡)
求满足如下不等式约束条件
𝒖 ≤ 𝟏 或 𝒖 ≤ 𝐶, 𝑡 ∈ [0, 𝑡𝑓 ]
二.线性定常系统时间最优控制
系统哈密尔顿函数为:
H [ x ( t ), u ( t ), ( t )] L ( x , u , t ) T f ( x , u , t ) 1 T A x T B u
运用最小值原理,若系统取得最优控制必有控制 𝒖∗ ,使得:
可得最优控制为: u * ( t ) sign [( * ) T B ]
协状态方程为: 可解得:
H AT t
AT (t ) e (0)
x
6.3.5 时间最优控制
由极小值原理得哈密尔顿函数在终端时刻的值为:
H t tf
0
H [ x ( t f ), u ( t f ), ( t f )] 1 T ( t f ) Ax ( t f ) T ( t f ) Bu ( t f ) 0
可知:𝜆(𝑡𝑓 ) ≠ 0 故 :𝜆(0) ≠ 0
At
故最优控制为: u ( t ) sign [( ) B ] sign ( (0) e B ) sign ( ( t ))
* * T T
最优控制完全由𝜉(𝑡)的符号和变符号的时间决定,称𝜉(𝑡)为换接函数。
𝑏𝒋 为系统输入矩阵𝑩的列向量。
6.3.5 时间最优控制
三. 时间最优控制正则的充要条件
定义:若对时间最优控制问题,协状态方程的任一非零解𝜆(𝑡)都使换接函数的每一个分量
𝜉𝒋 (𝒕)在[𝑡0 , 𝑡𝑓∗ ] 上不存在零聚点,则称时间最优控制问题为正则的,否则为奇异的。
定理:线性定常时间最优控制问题为正则的充要条件为:
𝑟𝑎𝑛𝑘𝐺𝒋 = 𝑛, 𝑗 = 1,2, ⋯ , 𝑟
𝐺𝒋 = 𝑏𝒋 , 𝑨𝑏𝒋 , ⋯ , 𝑨𝒏−𝟏 𝑏𝒋
证明:充分条件:
若 𝑟𝑎𝑛𝑘𝐺𝒋 = 𝑛, 𝑗 = 1,2, ⋯ , 𝑟,则时间最优控制问题为正则。
6.3.5 时间最优控制
jk ( t ) T (0) e At b jk
在区间[𝑡0 , 𝑡𝑓 ] 上有零聚点 t [ t 0 , t f ] ,即在 𝑡ҧ 的任何邻域内总存在 j (t ) 的零点。
k
因此,存在无穷时间点列 t r
(0)
[ t 0 , t f ] ( r 1, 2, )
𝜉
满足: lim t r(0) t
r (0) (0)
𝑡𝑟 𝑡𝑟+1
T (0) e At b jk 0
(0)
且 jk r )
( t (0) r 0
(1)
𝑡
𝑡𝑟
根据罗尔定理:一个连续可微函数的两个零点之间其导数至少存在一个零点。
d jk ( t )
且使的 T (0) e At Ab jk 0
dt t t (1)
t t r(1)
r
反复应用罗尔定理,可得:
d 2 j k ( t )
T (0) e At A 2b jk 0, t r(1) t r(2) t r(1)1
dt 2 t t r( 2 )
t t r( 2 )
d n 1 jk (t )
T (0) e At A n 1b jk 0, t r( n 2) t r( n 1) t r( n1 2)
dt n 1 t t r( n1)
t t r( n1)
6.3.5 时间最优控制
故有: T (0) e A t b jk 0
T (0) e A t Ab jk 0
T (0) e At A n 1b j 0
k
因此有: T (0) e A t [ b Ab jk A n 1b j k ] 0
j k
由于: T (0) e A t 0
即 jk (t ) 在区间 [ t 0 , t f ]没有零聚点,问题正则。
必要条件:若正则,必有 rankG j n , j 1, 2, ,r
反设正则,但存在一个 j (1 j r ) 使得:
rankG j n
故必存在 0, R n 使
T G j T [ b j Ab j A n 1b j ] 0
即 T b j 0, T Ab j 0 , , T A n 1b j 0
6.3.5 时间最优控制
由凯莱-哈密尔顿定理,矩阵指数函数 e At 可表示为:
n 1
e At i (t ) Ai
i 0 n 1
T At
用 、 b j 左、右乘上式,可得: e b j
T
i (t )aT Ai b j
i 0
由 T b j 0, T A b j 0 , , T A n 1b j 0
n 1
可得:
T At
e b j i (t )aT Ai b j 0
i 0
故问题奇异,这与问题正则的假设矛盾。反设不成立,必要性得证。 得证
《现代控制理论》MOOC课程
6.3.5 时间最优控制
6.3.5 时间最优控制
四.时间最优控制的唯一性
定理:设线性定常时间最优控制问题是正则的,若其时间最优控制存在,则最优控制必是
唯一的。
五.开关次数
定理:设线性定常时间最优控制问题是正则的,且其最优控制存在。记最优控制 𝒖∗ (𝑡)
的第𝑗 个分量𝒖∗𝒋 (𝑡) 的开关次数为𝑁𝒋 (𝒖∗𝒋 (𝑡)开关次数为相应换接函数的零点个数),若系统
的n个特征值均为实数,则开关次数:
N max N j n 1
j
6.3.5 时间最优控制
例:已知受控系统的状态方程为:
x ( t ) Ax ( t ) bu ( t )
0 1 0
式中: A b
1
0 0
求满足如下不等式约束条件
u 1 t [0, t f ]
的控制 u (t ) ,使系统自某一初始状态
x 0 x10 x 20 T
转移到状态空间原点的时间最短。即使如下性能指标取极小值:
tf
J dt
0
6.3.5 时间最优控制
解: 哈密尔顿函数为:
H [ x ( t ), u ( t ), ( t )] 1 1 ( t ) x 2 ( t ) 2 ( t ) u ( t )
1* (t ) 0
协状态方程为: H
x 2* (t ) 1*
可得: 1* (t ) C1
*2 (t ) C1t C 2
运用极小值原理可得: H [ x *, u *, * ] min {1 * x * * u (t )}
1 2 2
u 1
当: *2 ( t ) C 1t C 2 0 有: u * ( t ) 1
解得: x2 (t ) t x20
1 2
x1 (t ) x20 t t x10
2
1 2 1
消去t可得: x1 (t ) x 2 (t ) ( x10 x 20 )
2 2
6.3.5 时间最优控制
当: *2 ( t ) C 1t C 2 0 有: u * (t ) 1
x1
6.3.5 时间最优控制
通过原点的曲线为:
1 2
当 u ( t ) 1 : x1 (t ) x 2 (t ) x 2 (t ) 0
2
1 2
当 u (t ) 1 : x1 (t ) x 2 (t ) x 2 (t ) 0
2
1
合并为一个方程为 称为开关曲线:x1 (t ) x 2 (t ) x 2 (t )
2
故最优控制规律与初始状态的位置有关,当初始状态
在 的上半沿上: u * { 1} 在 的下半沿上: u * { 1}
在 的右侧:u * { 1, 1} 在 的左侧: u * { 1, 1}
6.3.5 时间最优控制
最优时间的计算步骤:
1) 根据初始状态的位置确定 𝑢∗ 的取值。
2) 将 𝑢 = 𝑢∗ 代入状态方程求出状态轨线。
3) 计算状态轨线与开关曲线的交点,并计算从初始状态到交点处的时间。
4) 计算从状态轨线与开关曲线的交点到座标原点的时间。
5) 将两段时间加起来就是总的最优控制时间。
2
𝑥20 + 4𝑥10 + 2𝑥20 当(𝑥10 , 𝑥20 )位于𝛾曲线的右侧
6.4 线性二次型最优控制
6.4 线性二次型最优控制
一.线性二次型最优控制问题的数学描述
问题LQ:给定线性定常系统:
x Ax Bu
x (0) x 0 t [0, t f ]
寻找最优控制𝑢∗ (𝑡),使得系统由指定初始状态𝑥0 出发的运动,导致如下二次型性能指标:
tf
1 T 1
J (u ()) x (t f ) S x (t f ) [ x T (t )Q x (t ) u T (t ) R u (t )]dt
2 2 0
取得极小值。
其中,𝑡𝑓 为终端时间,𝑆, 𝑄为𝒏 × 𝒏阶半正定对称权矩阵;𝑅为𝒓 × 𝒓阶正定对称权矩阵。
目标函数的物理意义:应用最小的控制能量,使得系统在指定时间区间内的状态与平
衡状态的偏差最小。
𝟏
第一项, 𝒙𝑻 𝑡𝑓 𝑆𝒙(𝑡𝑓 )强调了终端时刻系统状态与平衡状态的偏差最小;
𝟐
6.4 线性二次型最优控制
t
1 f T
第二项 x (t )Q x (t )dt 希望系统的整个运动轨迹与平衡状态的偏差最小;
2 0
t
1 f T
第三项 u (t ) R u (t ) dt 希望控制能量最小;
2 0
线性二次型最优控制系统的分类:
1. 当终端时刻是固定的且为有限值时,称为有限时间线性二次型最优控制问题;
2.当终端时刻 t f ,称为无限时间线性二次型最优控制问题;此时
1 T
J (u ()) [ x (t )Q x (t ) u T (t ) R u (t )]dt
20
6.4 线性二次型最优控制
3.当寻找最优控制的目的是将系统由初始状态驱动到平衡状态,同时使二次型性能指标
最小,称为线性二次型最优调节问题;
4.当寻找最优控制的目的是使系统的输出跟踪已知或未知的参考信号,同时使二次型性能
指标最小,称为线性二次型最优跟踪问题;
有限时间问题与无限时间问题,对控制及控制系统的要求有着显著的不同;而跟踪问题
则可以看作是调节问题的一种推广。
6.4 线性二次型最优控制
二. 有限时间LQ调节问题
1.有限时间LQ最优控制的充要条件
定理:给定线性定常系统和二次型性能指标
x Ax Bu x (0) x 0 t [0, t f ]
t
1 T 1 f T
J (u ()) x (t f ) S x (t f ) [ x (t )Q x (t ) u T (t ) R u (t )]dt
2 2 0
其中,𝑡𝑓 固定,S S T 0, Q Q T 0, R R T 0
1 T
则存在最优反馈控制 u * ( t ) K ( t ) x ( t ) 的充要条件为: K ( t ) R B P ( t )
其中,P ( t ) P T ( t ) 0 且满足如下形式的Riccati微分方程
P ( t ) A T P ( t ) P ( t ) A Q P ( t ) B R -1 B T P ( t ), P ( t f ) S
的解,且最优性能指标为: J * 1 x 0T P (0) x 0
2
6.4 线性二次型最优控制
证明:必要性
当系统取得形如 u * ( t ) K ( t ) x ( t )的最优控制时,必有 K ( t ) R 1 B T P ( t )
𝑷(𝒕)为Riccati矩阵微分方程的解。
1 T 1
系统的哈密尔顿函数为: H ( x , u , λ , t ) x Qx u T Ru λT Ax λT Bu
2 2
H
系统已取得最优控制,控制方程 0 必成立,可得:R u B T λ 0
u
由于 R 0 ,故: u * ( t ) R 1 B T λ
要使最优控制具有 u * ( t ) K ( t ) x ( t ) 的形式,协状态变量必具有如下形式:λ P ( t ) x ( t )
对上式两端求导可得:λ P ( t ) x ( t ) P ( t ) x ( t )
6.4 线性二次型最优控制
H
由协状态方程: λ 可得:
x λ [Qx AT λ]
λ(t f ) λ(t f ) Sx (t f )
x (t f )
故: P (t ) x P (t ) x [Q x A T λ ] [Q x A T P (t ) x ]
将状态方程 x A x B u A x B R 1 B T P ( t ) x 代入上式,可得:
P ( t ) x P ( t )[ A x B R 1 B T P ( t ) x ] [ Q x A T P ( t ) x ]
故有: [ P ( t ) P ( t ) A A T P ( t ) Q P ( t ) B R 1 B T P ( t )] x 0
P (t ) P (t ) A A T P (t ) Q P (t ) B R 1B T P (t ) 0
6.4 线性二次型最优控制
由 λ ( t f ) Sx ( t f ) 及 λ ( t f ) P ( t f ) x ( t f ) 可得: P (t f ) S
即: P ( t ) P ( t ) A A T P ( t ) Q P ( t ) B R 1 B T P ( t ), P (t f ) S
对上式两边取转置:
P T ( t ) A T P T ( t ) P T ( t ) A Q P T ( t ) B R 1 B T P T ( t ), P T ( t f ) S
由于 P T ( t )、 P ( t ) 为同一Riccati方程的解,故 P T ( t )= P ( t )
故当系统取得形如 u * ( t ) K ( t ) x ( t ) 的最优控制时,必有
K (t ) R 1 B T P (t )
x T A T P (t ) x u T (t ) B T P (t ) x x T P (t ) A x x T A T P (t ) x x T Q x
x T P (t ) B R 1 B T P (t ) x x T P (t ) A x x T P (t ) B u (t )
x T Q x u T (t ) B T P (t ) x x T P (t ) B u (t ) x T P (t ) B R 1B T P (t ) x
x T Q x u T ( t ) R u ( t ) u T ( t ) R u ( t ) u T ( t ) R R 1 B T P ( t ) x x T P ( t ) B R R 1u ( t )
x T P (t ) B R 1 R R 1 B T P (t ) x
6.4 线性二次型最优控制
x T Q x u T ( t ) R u ( t ) [ u ( t ) R 1 B T P ( t ) x ]T R [ u ( t ) R 1 B T P ( t ) x ]
对上式两边从0到𝑡𝑓 积分:
tf
d T
dt
( x P (t ) x ) dt x T ( t f ) P ( t f ) x ( t f ) x T (0) P (0) x (0)
0
tf
{ x T Qx uT (t ) Ru (t ) [ u (t ) R 1 B T P (t ) x ]T R[ u ( t ) R 1B T P ( t ) x ]}dt
0
tf tf
( x T Qx uT (t ) Ru (t )) dt [ u (t ) R 1 B T P (t ) x ]T R[ u ( t ) R 1B T P ( t ) x ]dt
0 0
1 T 1 tf
J (u ( )) x ( 0 ) P ( 0 ) x ( 0 ) [u (t ) R 1 B T P (t ) x ]T R[ u (t ) R 1 B T P (t ) x ]dt
2 2 0
6.4 线性二次型最优控制
由于 R 0 故:[ u ( t ) R 1 B T P ( t ) x ]T R [ u ( t ) R 1 B T P ( t ) x ] 0
故,当 u ( t ) R 1 B T P ( t ) x 0
即:u ( t ) R 1 B T P ( t ) x 时,目标函数取得极小值:
1 T
J (u()) x (0) P (0) x (0)
*
2
充分性得证。
得证
6.4 线性二次型最优控制
2. 有限时间线性二次型最优调节器的设计步骤
(1). 根据工程经验和性能分析,确定权矩阵S,Q,R;
(2). 求解黎卡提方程 P (t ) P (t ) A A T P (t ) Q P (t ) BR 1 B T P (t )
P (t f ) S , t [ 0, t f ]
(3).计算反馈增益阵 K * ( t ) 及最优控制u * (t )
K * ( t ) R 1 B T P ( t )、 u * ( t ) K * ( t ) x * ( t )
(4).计算最优状态轨迹
x * ( t ) Ax * ( t ) BR 1 B T P ( t ) x * ( t ), x * ( 0 ) x 0
1 T * *
(5).计算最优目标函数值 J J (u ()) x 0 P ( 0 ) x 0
2
《现代控制理论》MOOC课程
6.4 线性二次型最优控制
6.4 线性二次型最优控制
三. 无限时间LQ调节问题
1.无限时间LQ最优控制的充要条件
定理:给定完全能控的线性定常系统和二次型性能指标
x Ax Bu x (0) x 0
1
J (u ()) [ x T (t )Q x (t ) u T (t ) Ru (t )]dt
20
其中, Q Q 0, R R 0
T T
则存在最优反馈控制 u * ( t ) K x ( t ) 的充要条件为
K R 1B T P
其中,P P T 0 且为满足如下形式的Riccati代数方程
A T P P A Q P B R -1 B T P 0
1 T
的解,且最优性能指标为: J * x0 Px0
2
6.4 线性二次型最优控制
证明:必要条件:当系统用状态反馈 u * ( t ) K x ( t ) 实现了最优控制时,
要证明反馈矩阵 K R 1 B T P ,其中𝑷为Riccati代数方程的解。
系统的哈密尔顿函数为: H ( x , u , λ , t ) 1 x T Qx 1 u T Ru λT Ax λT Bu
2 2
H
由控制方程 0 可得: R u B T λ 0
u
由于 R 0 ,故:u* (t ) R 1BT λ
要使最优控制具有 u * ( t ) K x ( t ) 的形式,协状态量必具有如下形式:
λ Px ( t )
1 T 1 T
故:u (t ) R B λ R B Px
*
6.4 线性二次型最优控制
[ A T P P A Q P B R 1B T P ] x (t ) 0
故可得: A T P P A Q P B R 1 B T P 0
对上式取转置可知 𝑷𝑻 也满足该方程,故有:𝑷 = 𝑷𝑻
故当系统取得形如 u * ( t ) K x ( t ) 的最优控制时,必有 K R 1 B T P
𝑷为Riccati矩阵代数方程的解。 必要性得证。
6.4 线性二次型最优控制
充分性:
𝑷为Riccati矩阵代数方程的解,𝒙(𝒕)为系统容许控𝒖(𝒕)作用下的状态,则对如下函数求导
x ( t ) T Px ( t )
𝒅
可得: (𝒙𝑻 𝒕 𝑷𝒙 𝒕 ) = 𝒙ሶ 𝑻 𝒕 𝑷𝒙 𝒕 + 𝒙𝑻 𝒕 𝑷𝒙ሶ 𝒕 ( Ax Bu)T Px x T P ( Ax Bu)
𝒅𝒕
x T AT Px x T PAx uT BT Px x T PBu
x T ( AT P PA) x uT BT Px x T PBu
1 T 1 1
x 0 Px 0 ( x Qx u Ru ) dt [ u R 1 B T Px ]T R[ u R 1B T Px ]dt
T T
2 20 20
1 T 1
J (u ()) x0 Px0 [ u R 1BT Px ]T R[ u R 1B T Px ]dt
2 20
1 T
故,当 u ( t ) R 1 B T Px 0 即:u ( t ) R B Px 时
1 T
目标函数取得极小值: J (u ()) x 0 Px0
*
2
由于 J * ( u ()) 0 ,可得 P 0 充分性得证。 得证
6.4 线性二次型最优控制
2. 无限时间线性二次型最优调节器的设计步骤
(1). 根据工程经验和性能分析,确定权矩阵Q,R;
(3).计算反馈增益阵 K * 及最优控制 u * (t )
K * (t ) R 1 B T P 、 u * (t ) K * x * (t )
(4).计算最优状态轨迹
x * ( t ) Ax * ( t ) BR 1 B T Px * ( t ), x * ( 0 ) x 0
(5).计算最优目标函数值 1 T
J * J (u * ()) x0 Px 0
2
6.4 线性二次型最优控制
例:给定线性定常系统
x1 x2 , x1 (0) 1
x2 u , x2 (0) 1
求最优反馈控制 u*使
1
J (4 x12 u 2 ) dt
20
取极小值.
解: 0 1 0 4 0
A , B , Q 0, R 1
0 0 1 0 0
P11 P12
令 P
P12 P22
6.4 线性二次型最优控制
由Riccati代数方程:
AT P P A Q P B R 1B T P
可得: 4 2
P 0
2 2
4 2 x1
故 u R B Px 0 1
* 1 T
2 x1 2 x2
2 2 x2
1 T 1 4 2 1
J x0 Px0 1 1
*
5
2 2 2 2 1
《现代控制理论》MOOC课程
6.5 动态规划法
6.5.1 多段决策问题与最优性原理
例:最优路线决策问题
从A城到B城的线路如下图所示,确定最优路径,使A城到B城的时间最短,其中线段
中的数字表示走这路程所需的时间。
P1 7 P2 2 P3
4
3
6 2
B
A
4 3
2
4
Q1 8 Q2 3 Q3
6.5.1 多段决策问题与最优性原理
解:方法一:穷举法
找出所有可能的行车路径,计算行走每一路径所需的时间,比较大小,得出最优路径。
共有4个路段,每个节点有二种选择,故共有8条路径。
2 n 1 2 4 1 8
计算 (4 1)2 n 1 24次加法得到行走每一路径所需的时间如下:
(1) AP1P 2 P 3B 16 (5) AQ1Q 2Q 3B 17
(2) AP1Q 2Q 3 B 14 (6) AQ1P 2 P 3 B 14
(3) AP1Q 2 P 3B 16 (7) AQ1P 2Q 3B 12
(4) AP1P 2Q 3 B 14 (8) AQ1Q 2 P 3 B 19
比较7次可得最优路径为(7),所需时间为12。
6.5.1 多段决策问题与最优性原理
对电力网络的节点编号优化问题:节点数3千个,则编号排序方式种类为:
3000! 4.149 10
9130
假定每种编号方式,计算新增元个数的计算时间为1ms
方法二:动态规划法(逆向分级计算法)
从终点开始,逐段向前逆推,依次计算出各节点至终点的最优值,确定最优路径。
只需进行 4( n 2) 2 10 次加法和6次比较可得最优路径。
6.5.1 多段决策问题与最优性原理
P1 7 P2 2 P3
4
3
6 2
B
A
4 3 2
4
Q 8 Q 3 Q
1 2 3
P1 7 P2 P3
11 4 4
4
6 2
A 12 B
4
2
4
5 2
8 3
Q1 Q2 Q3
6.5.1 多段决策问题与最优性原理
3 4 13
6 3 4
3 4 1
12 9
3 4 1 6
3 3
2 1 3 3 3
12 8
3
2 1 3 3 3
1 2 4 4 1
A 1 B
13 5
11
4 1
7 A 1 1 2 4 B
2 4 2
9
7 2 1
5 6 12 2 4
5 3
13 6
9
6.5.1 多段决策问题与最优性原理
动态规划法得特点:
(1)与穷举法相比,计算量大大减少。
(2)将多段决策问题转换为多个单段决策问题处理。
(3)多段决策的最优策略遵循最优性原理,即:
不论初始状态和初始决策如何,当把其中任何一级作为初始级和初始状态时,余下的决
策对此仍然是最优决策。也就是说一个最优过程的任何最后一段过程都是最优的,或者
说最优路径上任一节点至终点的路径必定也是最优的。
《现代控制理论》MOOC课程
6.5.2 离散系统动态规划
6.5.2 离散系统动态规划
一. 离散系统动态规划的数学描述:
给定有n阶离散系统:x k 1 f ( x k , u k ), k 0,1, , N 1
状态初值: x (0) x 0
控制约束: g [ x k , u k ] 0
寻求一个最优控制序列 u k* ( k 0,1, , N 1)
N 1
使性能指标: J [ x N ] L[ x k , u k ]
k 0
取得极小值。
6.5.2 离散系统动态规划
二. 动态规划递推方程:
给定初值:x (0) x 0 ,
寻求一个最优控制序列 u k* ( k 0,1, , N 1) 使性能指标取得极小值。
∗
𝑢0∗ 𝑢1∗ 𝑢𝑘∗ 𝑢𝑁−1
𝑥0 𝑥1 𝑥2 𝑥𝑘 𝑥𝑘+1 𝑥𝑁−1 𝑥𝑁
1 2 ⋯ 𝑘+1 ⋯ 𝑁
控制过程顺序
动态规划法依据最优性原理进行逆向分级计算
第𝑁步 第𝑁 − 1步 第𝑁 − 𝑘步 第1步
∗
求𝑢0∗ 求𝑢1∗ 求𝑢𝑘∗ 求𝑢𝑁−1
⋯ ⋯
使𝐽𝑁∗ [𝑥0 ]
∗
使𝐽𝑁−1 [𝑥1 ] ∗
使𝐽𝑁−𝑘 [𝑥𝑥 ] 使𝐽1∗ [𝑥𝑁−1 ]
动态规划法求解顺序
6.5.2 离散系统动态规划
性能指标:
N 1
J [ x N ] L[ x k , u k ]
k 0 𝑁−2 𝑁−2
𝑥𝑁 = 𝑓(𝑥𝑁−1 , 𝑢𝑁−1 )
𝑁−3 𝑁−3
𝑘−1
∗
第N-k计算步: 𝐽𝑁−𝑘 𝑥𝑘 = min{𝐽𝑁−𝑘−1 𝑥𝑘+1 + 𝐿 𝑥𝑘 , 𝑢𝑘 }
𝑥𝑘+1 = 𝑓(𝑥𝑘 , 𝑢𝑘 )
有了第一个计算步和第N-k个计算步的优化计算方程,就可以递推计算出最优控制序列和
最优状态轨迹。把这个递推计算方程称为动态规划递推方程。
6.5.2 离散系统动态规划
例:设一阶离散系统,状态方程和初始条件为:
x k 1 x k u k , x (0) x 0
N 1
性能指标为 J x N2 ( xk2 u k2 )
k 0
求当N=2时的最优控制决策序列和最优轨迹序列。
为使 J 1 [ x (1)] 为极小,故有:
J1[ x (1)]
2 x (1) 4 u (1) 0
u (1)
得: u (1) 1 x (1)
2
最优目标
1 1 3
J 1[ x (1)] 2 x 2 (1) 2 x (1) x (1) 2( x (1)) 2 x 2 (1)
2 2 2
进一步求上一级决策:
3 2
J 2 [ x (0)] x (0) u (0)
2 2
J1*[ x (1)] x (0) u (0) x (1)
2 2
2
3
x 2 (0) u 2 (0) [ x (0) u (0)]2
2
6.5.2 离散系统动态规划
6.5.3 连续系统动态规划
6.5.3 连续系统动态规划
一. 连续动态规划的数学描述
给定连续系统状态方程: x f [ x, u , t ]
初始状态: x (t0 ) x0
终端约束: g[ x(t f ), t f ] 0
求最优控制 u * ( t ), u U ,使如下性能指标取极小值:
tf
J [ x0 , t ] min ( x ( t f )) L ( x , u , t ) dt
t0
6.5.3 连续系统动态规划
二. 连续动态规划方程
引进记号 V ( x , t )
V ( x , t ) J [ x * ( t ), u * ( t )] min J ( x ( t ), u ( t ))
uU
表示以𝑡时刻状态𝑥(𝑡)作初始条件所得到的最优性能指标。
tf
则有:V ( x (t ), t ) min ( x (t f )) L( x(t ), u(t ), t )dt
uU t
6.5.3 连续系统动态规划
V ( x (t ), t ) min
uU
t t
t
L( x (t ), u(t ), t )dt
tf
t t
L( x (t ), u(t ), t )dt ( x(t f ))
min L( x(t), u(t), t)dt ( x(t ))
t t tf
L( x (t ), u(t ), t )dt min f
uU t uU t t
其中: V ( x (t t ), t t ) min
L ( x(t ), u (t ), t )dt ( x(t ))
uU
tf
t t f
用泰勒级数展开可得:
T
V dx V
V ( x (t t ), t t ) V ( x (t ), t ) t t o ( t ) 2
x dt t
6.5.3 连续系统动态规划
由中值定理:
t t
t L ( x ( t ), u ( t ), t ) dt L ( x ( t t ), u ( t t ), t t ) t
其中: 0 1
则有:
T
V dx V
V ( x (t ), t ) min L( x (t t ), u(t t ), t t ) t V ( x (t ), t ) t t o ( t ) 2
uU x dt t
V V
T
dx o ( t ) 2
可得: min L ( x (t t ), u (t t ), t t )
t uU
x dt t
令: t 0
T
可得: min L ( x (t ), u (t ), t )
V V ( x , t )
f ( x, u , t ) 连续系统动态规划方程
t uU
x
6.5.3 连续系统动态规划
V
令: ( t ) ,则动态规划方程可表示为:
x
V
t uU
T
uU
min L ( x , u , t ) f ( x , u , t ) min H ( x , , u , t )
*
即系统要取得极值,必须要满足极小值原理。
可以证明当系统取得最优控制时,协状态方程成立:
H
x
[ x (t f ), t f ] g [ x (t f ), t f ]
T
(t )
f x (t f ) x (t f )
g [ x (t ), t ] 0
f f
[ x (t f ), t f ] g [ x (t f ), t f ]
H [ x (t f ), u (t f ), t f ] T 0
t f t f
6.5.3 连续系统动态规划
系统取得最优控制的必要条件为:
状态方程: x f [ x, u , t ] x (t0 ) x0
H
协状态方程
x
[ x (t f ), t f ] g [ x (t f ), t f ]
T
(t )
f x (t f ) x (t f )
g [ x (t ), t ] 0
f f
[ x (t f ), t f ] g [ x (t f ), t f ]
H [ x (t f ), u (t f ), t f ] T 0
t f t f
动态规划方程
V
t uU
uU
min L ( x , u , t ) T f ( x , u , t ) min H ( x* , , u , t )
第六章 最优控制
第六章 小结
最优控制问题就是求解一类带有约束的泛函极值问题;
有约束的泛函极值问题是通过引入拉格朗日乘子向量转换为无约束的泛函极值问题;
泛函极值存在的必要条件为泛函的变分为零。
求解泛函极值问题有三种方法:经典变分法、极小值原理和动态规划法
时间最优控制,线性二次型最优控制是极小值原理和经典变分法在特殊情况下的应用。