Professional Documents
Culture Documents
自动化系
清华大学自动化系 慕春棣
自动控制理论
控制理论 所要解决的主要问题
1 系统建模(实际问题抽象,数学描述)
3 系统综合 (方案选择,设计)
4 系统验证(数字仿真,半实物/实物仿真)
2 清华大学自动化系 慕春棣
自动控制理论
控制理论是应用基础理论
具有鲜明的时代性,强调对实践的指导作用
总是和社会的重大需求紧密联系在一起的。人们总是
把当时最先进的技术用作自动化技术的主要内容, 这
就要求理论必须指导实践。应用数学的许多成就都会
被自动化学科所应用。
控制理论是系统的理论
强调从“系统”(整体)的角度来分析、研究和实现
各种目标,而不单单是其中的部件的性能。
控制理论具有多学科交叉融合的特征
离不开信息技术、电气技术、数学以及被控对象的相
关领域知识
宋健院士还指出:近年来,让控制科学家最为兴奋的是,许多政治家和国家领导
人开始理解控制论中的理论、概念和方法的重要性,他们很多人在演讲或论文中
广泛使用控制论的语言去阐述社会政治问题。当政治家们遇到某些棘手的政治问
题时,他们时常寄希望于系统科学家伸出援助之手,即使后者的研究工作从来未
涉及到政治问题。这种形势常使控制论和系统科学家们冷暖皆忘,把酒临风,心
旷神怡。
宋健教授这些精辟论述说明,控制科学与工程学科已经渗透到多个学科,不但在
自然科学和工程科学领域,而且在社会科学领域也有广泛的应用,成为多个学科
和领域的发展动力。
4 2006秋 清华大学自动化系 慕春棣
自动控制理论
课程基本情况
学时: 64 信息学院五大平台课之一, 自动化专业必
修课,专业基础课
教材:《自动控制原理》上下册 吴麒主编
参考书:
《现代控制工程》 绪方胜彦 科学出版社 第三版 2000
《自动控制理论基础》 戴忠达,1991
《控制理论 (日)》 藤井隆雄著 卢伯英译 科学出版社,2003
《自动控制系统》 第 8 版 [美]Benjamin C. Kuo,汪小帆,
李翔译 高等教育出版社
《自动控制原理》 国防工业出版社 李友善
有关Matlab的工具书:《精通Matlab 6.5版》《Matlab 6.x
符号运算及其应用》等(Matlab的工具书很多,校内很多ftp
还有相关的电子书资源可以下载)
自动控制理论例题习题集 王诗宓, 杜继宏, 窦曰轩编著 ,清
华大学出版社 2002
5 清华大学自动化系 慕春棣
自动控制理论
关于学习的几点建议
◎ 培养好的学习方法
应用数学工具分析解决工程问题
科学思维方法 抽象 综合
数学工具(如MATLAB)的使用
重视实践活动,积极参加 SRT,各类竞赛活动
◎ 关注学术活动 IFAC—中国自动化学会—专业委员会
IFAC’99 北京
CDC, ACC, ECC, CCC
7 清华大学自动化系 慕春棣
自动控制理论
经典控制理论
经典控制理论,以单变量控制,随动/调节
为主要内容,以微分方程和传递函数为数
学模型,所用的方法主要以频率响应法为
主。数学工具: 微分方程, 复变函数
8 清华大学自动化系 慕春棣
自动控制理论
现代控制理论、后现代控制理论
◎ 现代控制理论
60年代初形成并迅速发展起来的
现代控制理论是在航天、航空、导弹等军事尖端技术的发展,对
自动控制系统提出越来越高的要求的推动下发展起来的。要求设
计高精度、快速响应、低消耗、低代价的控制系统;被控制对象
越来越大型、复杂、综合化,从单个局部自动化发展成综合集成
自动化
◎ 后现代控制理论
80年代以后,控制理论向广度与深度发展
大系统,是指规模大,结构复杂变量众多的信息与控制系统。在
系统理论中,采用状态方程和代数方程相结合的数学模型,状态
空间,运筹学等相结合的数学方法。
智能控制 是具有某些仿人智能的工程控制与信息处理系统,其中
最典型的是智能机器人, 智能主体等。
21世纪 网络、通讯、人机交互为代表的信息自动化 集成的理论与
技术。
9 清华大学自动化系 慕春棣
自动控制理论
目前的发展趋势
1 2 3
10 清华大学自动化系 慕春棣
自动控制理论
我国控制理论的教学
11 清华大学自动化系 慕春棣
第一章:控制的基本概念
清华大学自动化系 慕春棣
13
一、反馈控制原理
开环系统
例子:
风扇转速
电热管
自动控制理论
14
一、反馈控制原理
负反馈的例子:
抽水马桶
冰箱温度控制
空调温度控制
人的动作控制
自动控制理论
15
一、反馈控制原理
负反馈的概念
典型系统框图
负反馈:将给定量与被控量进行比较(相减),得到偏
差信号,利用偏差产生控制作用,作用于被控对象,以
达到减小或消除偏差的目的。
自动控制理论
16
二、控制系统的基本组成
控制系统组成示意图
自动控制理论
17
四、控制系统的基本要求
稳定
静态指标
品质、性能
动态指标
自动控制理论
控制系统的数学模型
清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
1、RLC电路
2 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
1、RLC电路
根据电路基本原理有:
Ri + L dtdi + uc = u r
duc
i = c
dt
d 2uc du c
⇒ Lc 2 + Rc + uc = ur
dt dt
3 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
2、质量-弹簧-阻尼系统
∑ F = ma
dy d2y
F − ky − f =m 2
dt dt
d2y dy
⇒m 2 + f + ky = F
dt dt
4 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
3、电动机方程
电路方程:
dia
ur − Ea = La + Raia (1)
dt
动力学方程:
dΩ
M − Mc = J (2)
dt
Ea = k d Ω (3)
M = k d ia (4)
5 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
(4)→(2)得:
J dΩ M c
ia = + (5)
k d dt kd
(3)(5)→(1)得:
La J d 2 Ω Ra J dΩ La dM c Ra
2
+ + kd Ω = ur − ( − Mc)
k d dt k d dt Ra dt kd
6 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
整理并定义两个时间常数
JRa
2
= Tm 机电时间常数
kd
La
= Ta 电磁时间常数
Ra
电机方程
d 2Ω dΩ 1
Ta Tm 2
+ Tm +Ω = u r − (........)
dt dt kd
7 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
如果忽略阻力矩,即 M c = 0 ,
方程右边只有电枢回路的控制量 ur
则电机方程是一典型二阶方程 。
dΩ 1
Tm +Ω = ur
dt kd
8 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
随动系统的例子:(图见教科书《自动控制原理》上册P20图2.11)
9 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
1)电位器组
u p = k p (ψ − ϕ )
2)放大器-发电机励磁
dI f dI f ka
Rf I f + Lf = kau p ⇒ T f +If = up
dt dt Rf
3)发电机-电动机组
E f = kg I f
d 2Ω dΩ 1
Ta Tm 2
+ Tm + Ω = Ef
dt dt kd
dϕ
4)传动机构 Ω →ϕ = kt Ω
dt
10 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
整理得:
T f Ta Tm d 4ϕ (T f + Ta )Tm d 3ϕ T f + Tm d 2ϕ 1 dϕ
4
+ 3
+ 2
+ + ϕ =ψ
k dt k dt k dt k dt
k p k a k g kt
k= R f kd
开环比例系数
解释 k 的物理意义, k 的量纲
解释 ϕ 跟踪ψ 无差
以上建模叫机理建模
11 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
Laplace变换
L[f(t)]—F(s) 从时域→复域
∞
定义: F ( s ) = ∫ f (t )e dt− st
举例: f (t ) = 1(t )
1 −st ∞ 1
∞
F ( s ) = ∫ e dt = − e
− st
=
0
s 0 s
12 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
常见函数的Laplace变换
1 α
1(t ) → sin αt →
s s2 +α 2
1 s
t→ 2 cos αt → 2
s s +α 2
−αt 1
e →
s +α
13 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
Laplace变换基本定理
−
初值定理 x(0 ) = lim s x( s )
+
s →∞
d
微分定理 L f (t ) = sF ( s ) − f (0)
dt
延迟定理 L[ f (t − α )] = e −αs F ( s )
14 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
用Laplace变换解微分方程
dy
T +y=r r =1
dt
y(0} = 0
方程两边进行Laplace 变换(零初始条件)
− − −
Ts y ( s ) + y ( s ) = r ( s )
−
− r (s) 1 1 1 1
y(s) = = . = −
Ts + 1 Ts + 1 s s 1
s+
T
15 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
t
−
反变换 y (t ) = 1(t ) − e T
当 r (t ) = δ (t )
− 1 1 1
y(s) = =
Ts + 1 T 1
s+
T
1 − Tt
反变换 y (t ) = e
T
1
y (o ) = 0, y (0 ) =
− +
初值跳变问题!
T
16 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
定义传递函数
−
y( s)
−
= G( s)
r( s)
零初始条件下
输出的Laplace变换
= 传递函数
输入的Laplace变换
d2y −
什么是零初始条件? L[ 2 ] = s y ( s ) − sy (0) − y ' (0)
2
dt
17 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
把上面的随动系统用传递函数表示,并化成框图
up If Ef Ω ϕ
ψ + ka R f 1 kd kt
+ kp kg
- Tf s + 1 TaTms2 + Tms + 1 s
ϕ
如何从该框图求得 ϕ 与 ψ 之间的关系?
微分方程 ↔ 传递函数
18 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
1、框图的几种连接方式 −
y(s)
串联 传递函数相乘 −
= G1 ( s )G2 ( s )
u (s)
−
y(s)
并联 传递函数相加 −
= G1 ( s ) + G2 ( s )
u (s)
19 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
1、框图的几种连接方式
反馈
G(s):主通道的传递函数
H(s):反馈通道的传递函数
G(s)H(s):开环传递函数 (u − yH )G = y
−
y( s) G( s) G主
−
= =
u( s ) 1 + G ( s ) H ( s ) 1 + G开
−
y(s) G (s)
同理可得正反馈下: =
−
u (s) 1 − G (s) H (s)
20 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
1、框图的几种连接方式
前面随动系统的例子
21 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
2、框图变换
1)交叉反馈
此例说明交叉点左右移动对传递函数的影响,
跨越求和点要注意。
22 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
2、框图变换
2)有扰动输入的情况
−
y(s)
a)求 −
(f=0)
r (s)
b)求 y(s)
− (r=0)
f (s)
23 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
2、框图变换
−
y(s) G1G2
a) − =
r (s) 1 + G1G2
b)
−
y(s) (G 3 −G4 G1 )G2
=
−
f (s) 1 + G1G2
−
y(s) G3
c) 当 −
=0 即 G4 =
G1
y 不受 f 影响
f (s)
24 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
2、框图变换
3)顺馈的例子:
变换框图:
G3
(G1 + G 2 )
y( s) 1 + G3 G 4 (G1 + G2 )G3
−
=
G1G3
=
r (s) 1+ 1 + G3 G4 + G1G3
1 + G3 G 4
25 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
2、框图变换
也可把它看成
是双输入系统
26 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
补充题:
27 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
节点表示变量
(框图表示) (信号流图表示)
两节点之间的传递函数叫传输(增益),用直线加箭头表示
支路:两节点之间的定向线段
回路:闭合的通路
不接触回路:没有公共节点的回路
28 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
前面补充题1用信号流图表示如下:
29 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
计算信号流 图中的两节点之间的传递函数用梅逊公式
1
H ( s ) = ∑ Qi ( s )∆ i ( s )
∆ i
Qi (s ) 第i条前向通路传递函数的乘积
∆ 流图的特征式= 1 - 所有回路传递函数乘积之和
+每两个互不接触回路传递函数
乘积之和-每三个….
=1- ∑ L + ∑∑ L L
a
a
b c
b c − ..........
∆ i 余子式, 从∆中处除去与第i条前向通路接触的回路
30 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
此例有前向通路三条
Q1 = G1G2 G3G4 G5 Q2 = G1G4 G5 G6 Q3 = G1G2 G7
回路四个
补充题2
32 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
前向通路: Q1 = G1G2G3G4G5G6
回路: L1 − G2 G3 H 2 L2 = G1G2 H 1 L3 = −G5 H 4
L4 = G 5 G 6 H 3 L5 = −G1G2 G3 G4 L6 = −G1G2 G3 G4 G5 G6 H 5
不接触回路: L1L3 , L1L4 , L2L3 , L2L4 , L5L3 , L5L4
∆1 = 1
∆ = 1 − ( L1 +..... + L6 ) + ( L1 L3 + L1 L4 + L2 L3 + L2 L4 + L5 L3 + L5 L4 )
c 1
= Q1 ∆ 1
r ∆
33 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
顺馈的例子
前向通路
y 1
∆ = 1 − ( L1 + L2 ) ∆ 1 = 1, ∆ 2 = 1 ∴ = (Q1 ∆ 1 + Q2 ∆ 2 )
r ∆
34 清华大学自动化系 慕春棣
自动控制理论
课后作业
2.1 a. b. c. (提示:用复数阻抗法)
2.4, 2.5a
2.46, 2.47
补充二题 两种方法解:框图变换法和信号流图法
35 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元
1.比例
G ( s) = k
2.惰性(惯性)
1
G (s) = T 时间常数
Ts + 1
36 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元
3.二阶振荡环节
1
G (s) = 2 2 T时间常数,ζ 阻尼系数
T s + 2ζTs + 1
特征方程的根 s1.2 =
− 2ζT ± 4ζ 2 − 4T 2 ζ ζ 2 −1
=− ±
2T 2 T T
0 < ζ < 1 ,一对共轭复根(实部为负) 衰减振荡
ζ =0 ,一对共轭虚根 等幅振荡
ζ =1 , 两个相等负实根 单调衰减
ζ >1 , 两个不相等的负实根,可分解
为两个惰性单元 ,单调衰减
系统动态响应的性质取决于其特征根的性质
37 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元
4.积分
1 1
G (s) = s
1
s r c r s c
5.延迟环节
G ( s ) = e −τs e-τs
x(t)
6.微分环节 一阶微分,二阶微分,纯微分
这些环节不能单独存在,只能与其它环节配合使用
38 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题
以放大器为例:在一定范围内输出与输入是线性关系y=kx,
但是当放大器饱和时,y与x就不是线性关系了。
微偏线性化
在工作点附近的小邻域内,将y与x之间的关系展成台劳级数
设 y = f (x)
在 x0 附近可以表示成
1 ''
f ( x) = f ( x0 ) + f ( x0 )( x − x0 ) + f ( x0 )( x − x0 ) 2 + ......
'
39 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题
1 ''
f ( x ) = f ( x 0 ) + f ( x 0 )( x − x 0 ) + f ( x 0 )( x − x 0 ) 2 + ......
'
即
'
∆y = f ( x 0 )∆x
这说明y的增量与x的增量之间的关系变成了线性关系
40 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题
举例:
L
U0 i
k
R0 θ
R = R0 + k∆θ , U 0已知,研究当∆θ变化时,i如何变化
di
U 0 = L + Ri
dt
di
= L + ( R0 + k∆θ )i 两变量相乘, 非线性!
dt
41 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题
工作点设在 θ 等于0处,有: L
U0
I0 = , i = I 0 + ∆i U0 i
R0
k
于是:
d ( I 0 + ∆i ) R0 θ
U0 = L + ( R0 + k∆θ )( I 0 + ∆i )
dt
d∆i
U0 = L + R0 I 0 + kI 0 ∆θ + R0 ∆i + k∆θ∆i
dt
∵ U 0 = R0 I 0
d∆i
∴ L + R0 ∆i = −kI 0 ∆θ i
dt I0
电流按指数规律下降!
0 t
42 清华大学自动化系 慕春棣
线性系统时域分析方法
自动化系
清华大学自动化系 慕春棣
1、稳定性
自动控制理论
前面讲的随动系统是一个四阶微分方程,代入参数得
0.025ϕ ( 4) + 0.55ϕ (3) + 1.5ϕ '' + ϕ ' + ϕ = ψ
特征方程 0.025s 4 + 0.55s 3 + 1.5s 2 + s + 1 = 0
特征根 s1 = −18.94, s2 = −2.61, s3, 4 = −0.228 ± j 0.871
A.B.C. θ 由初始条件求出
分析 当 t → ∞ ,前三项 → 0 ,ϕ (t ) → ϕ * (t )
现将 k( k 为开环比例系数)增大10倍,再解特征方程得
2 清华大学自动化系 慕春棣
1、稳定性
自动控制理论
于是得
ϕ (t ) = Ae s1t + Be s2t + Ce 0.501t sin(2.21t + θ ) + ϕ * (t )
∴ 只要C ≠ 0, 当t → ∞, ϕ (t ) → ∞, 达不到ϕ * (t )
可见 ϕ (t ) 取决于特征根,组成 ϕ (t ) 的分量诸如 e λi t,叫运动模态。
由这个例子我们可以得到下面的结论:
线性系统稳定的充分必要条件是特征方程的根必须具有负的
实部,或说特征根都在s平面的左半平面
但是,对于非线性方程,在有些初始条件下,解能达到一种
确定的状态,称为稳定的运动,而在另一些初始条件下的解表现
为不稳定的运动。所以,对一个非线性系统,不能笼统地称系统
稳定与否,而只能说哪些解是稳定的,哪些是不稳定的。
见书上p184图3.2.1例
3 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论
1. 定义
如果一个关于X的微分方程组,在初始条件 X (t 0 ) = X 0下
有解X(t),且对于任意给定的正数ε>0,总存在一个正数
~ ~
δ(ε),当初始条件 X 0变为 X 0 时,只要|| X 0 − X 0 ||≤δ,其相应
~
t ~
解 X (t ) 在t> 0 的任何时刻都满足|| X (t )− X (t ) ||<ε,则称解 是 X (t )
稳定的。如果不存在这样的正数δ,则称解X (t ) 是不稳定的。
4 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论
大范围稳定 δ 任意大
~
渐近稳定 稳定,存在 δ , x(t )无限趋于x(t )
工程上希望的系统是大范围渐近稳定的。
5 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论
补充说明:一个高阶方程可以化成一个一阶微分方程组
. 0 1
0 x
x1 1
0
.
x2 = 0 0 1 x 2 + 0 u
. 1
x a0 a1 a2 x a
3 − − − 3 3
a3 a3 a3
6 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论
2.Liapunov第一方法(见书P190)
a. 若线性化后系统特征方程的所有根均为负实数或实部为负
的复数,则原系统的运动不但是稳定的而且是渐近稳定的。
线性化过程中被忽略的高于一阶的项也不会使运动变成不
稳定。
b. 若线性化后系统特征方程的诸根中,只要有一个为正实数
或实部为正的复数,则原系统的运动就是不稳定的。被
忽略的高于一阶的项也不会使运动变成稳定。
c.若线性化后系统特征方程的诸根中,有一些是实部为零的,
而其余均具有负实部,则实际系统运动的稳定与否与被忽略
的高阶项有关。这种情况下不可能按照线性化后的方程来判
断原系统的运动稳定性。若要分析原系统的运动稳定性必须
分析原系统的非线性数学模型。
7 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
根据微分方程特征方程的系数,不解方程来判断是否有右半
平面的根。这就是Routh和Hurwitz分别独立提出来的稳定性判据,
其功能是判断一个代数多项式有几个零点位于复数平面的右半面
例1 特征方程
2 s 6 + 5s 5 + 3s 4 + 4 s 3 + 6 s 2 + 14 s + 7 = 0
构造Routh表如下:
8 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
例1 特征方程
2s 6 + 5s 5 + 3s 4 + 4s 3 + 6s 2 + 14s + 7 = 0
构造Routh表 s 6 2 3 6 7
s5 5 4 14
4 12 3 7 12 6 2 12 7 2
s − =
55 4 5
− =
5 5 14 5
− =
55 0 5
18
s3 -11
7
115 7
s2 18
1589
s1 −
115
s0 7
9 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
看第一列:
2
5
7
5
18
7
115
18 一次变号
1589
−
115 又一次变号
7
第一列系数全为正,是系统稳定的充分必要条件。
出现负号说明有右半平面的根,有几个?看变号的次数
此例有两个右半平面的根。
10 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
例2 s 4 + 5s 3 + 10 s 2 + 20 s + 24 = 0
s4 1 10 24
s3 5 20
s2 6 24
1 5 20
0(ε )
1
s −
6 6 24
=0
s0 24 −
1 6 24
= 24
ε ε 0
第一列系数出现0,用一个小正数 ε 代替,如果 ε
上下元素相同,表示有一对纯虚根存在,
如果相反,则认为有一次变号
此例解得根为: ± 2 j ,−2,−3.
11 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
例3
s 3 − 3s + 2 = 0
s3 1 -3
一次变号 s2 0(ε ) 2
1 1 −3 1
s 1 − = −3 − (负数)
ε ε 2 ε
二次变号
s0 2
这说明有两个根在右半平面+1,+1,-2
12 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
s 5 + 2 s 4 + 24 s 3 + 48s 2 − 25s − 50 = 0
例4.
s5 1 24 -25
s4 2 48 -50
s3 0(8) 0(96)
s2 24 -50
s1 112.7
一次
变号
s0 -50
出现全零行时构造一辅助多项式:
2 s 4 + 48s 2 − 50
s5 1 24 -25
s4 2 48 -50
s3 0(8) 0(96)
s2 24 -50
s1 112.7
一次
变号
s0 -50
一次变号说明有一个正的实根 0上下同号说明有一对纯虚根
全0行说明有一对大小相等关于原点对称的根。这一对根可以
从辅助多项式构成的方程 2s 4 + 48s 2 − 50=0 解出。
该方程全部解为:± 1, ± 5 j ,−2
14 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
●关于稳定的必要条件
设想方程全部为负实根或实部为负的共轭复数
则一定可以分解成下面一些因式的乘积
( s + α )( s + β + jγ )( s + β − jγ ) α, β ,γ > 0
( s + α )( s 2 + 2 βs + β 2 + γ 2 )
可见全部系数必为正
得出:方程系数全为正是系统稳定的必要条件(但不充分)
15 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论
●用Routh判据来分析一.二.三阶系统,得到
稳定的充要条件
16 清华大学自动化系 慕春棣
4、参数对稳定性的影响,参数稳定域
自动控制理论
系统的参数集中体现在k(开环比例系数)和诸T,
它们是影响系统稳定的主要因素
1一般情况下,k过大不利于稳定(有些特殊情况,条件稳定)
2增大时间常数,不利于稳定
3增多时间常数,不利于稳定
参数稳定域(单参数稳定域)
设一个系统的开环传递函数
1
k ( s + 1)
G开 ( s ) = 3
s ( s + 1)(2 s + 1)
试找出k的稳定范围
17 清华大学自动化系 慕春棣
4、参数对稳定性的影响,参数稳定域
自动控制理论
首先列出特征方程:1 + G开 ( s ) = 0
1
即 s ( s + 1)(2 s + 1) + k ( s + 1) = 0
3
1
2 s 3 + 3s 2 + (1 + k ) s + k = 0
3
k >0
根据Routh判据 3(1 + 1 k ) > 2k ∴0 < k < 3 是k的稳定范围
3
k (τs + 1)
双参数稳定域 G开 ( s ) = k ,τ > 0
s ( s + 1)(2 s + 1)
特征方程: 2s 3 + 3s 2 + (1 + kτ ) s + k = 0
3(1 + kτ ) > 2k
2 1
τ> − 试画出 τ − k 的关系曲线
3 k
18 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
1、引言
1)静差表示系统的静态精度,只有稳定系统才谈得上静差
2)静差与输入信号有关,用一些典型输入信号作为标准
1
阶跃 1(t ) →
s
1
斜坡 t→
s2
1 2 1
加速度 t → 3
2 s
19 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
2、定义
基本定义 e = y要求值 − y实际值
表现在框图上
b = yH 反映y的实际值,r体现对y的要求值
∴ e = r − yH
20 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
对于有些复杂情况,从框图上找不到e 要求e=r-y
是否可以把它变换成
21 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
y HG
1.先求出 =
r 1 + GF
2.求出对应的 G开(s),即求出对应于闭环传递函数 (G闭 = y/r)
开 s)
的单位反馈的开环传递函数 G(
即: G开 y
= = G闭
1 + G开 r
所以: G闭 GH
G开 = =
1 − G闭 1 + GF − GH
22 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
3、静态误差的计算
针对一般情况
−
e( s ) 1 − 1 −
= ∴ e( s ) = r (s)
r ( s ) 1 + G开 ( s ) 1 + G开 ( s )
−
−
可见误差与 G开 (s) 和输入 r (s) 有关
−
用Laplace变换的终值定理求 e(∞) = lim
s →0
s e( s ) = ess
23 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
系统在三种典型输入信号下的误差
− 1 − 1 1 1
r( s) = ess = lim s e( s ) = lim s = lim
s s → 0 s → 0 1 + G开 ( s ) s s→0 1 + G开 ( s )
− 1 − 1 1 1
r( s) = 2 ess = lim s e( s ) = lim s 2
= lim
s s →0 s →0 1 + G ( s ) s s →0 sG ( s )
开 开
− 1 − 1 1 1
r( s) = 3 ess = lim s e( s ) = lim s = lim 2
s s →0 s →0 1 + G ( s ) s 3 s →0 s G ( s )
开 开
24 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
∴ 对三种典型输入的静态误差为
1
1 + k 阶跃输入
p
1
e ss = 斜坡输入
kv
1
k 加速度输入
a
25 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
4、系统类型与静差的关系
以上我们定义了误差系数,导出了在特定输入信号的作用
下,静差与误差系数的关系,而误差系数与系统的开环传递函
数有关,也就是说与系统的参数和结构有关。
k (τ 1 s + 1)...(τ m s + 1)
设 G开 ( s ) = γ ( γ = 0,1,2, 分别称为0型,
1型,2型
s (T1 s + 1)...(Tn s + 1)
系统)注意 k 的定义。
26 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
对0型系统:
1
kp = k 阶跃输入下的静差 ess =
1+ k
k v = 0 斜坡输入下的静差 ess = ∞
k = 0 加速度输入下的静差 ess = ∞
a
27 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
对1型系统
k p = ∞ 阶跃输入下的静差 ess = 0
1
kv = k 斜坡输入下的静差 ess =
k
k a = 0 加速度输入下的静差 ess = ∞
28 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
对2型系统
k p = ∞ 阶跃输入下的静差 ess = 0
kv = ∞ 斜坡输入下的静差 ess = 0
1
ka = k 加速度输入下的静差 ess =
k
29 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
总结如下表:
30 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
5、关于静差的物理解释
这是一个有差系统
31 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
+
u
初始状态: h = h0 , ∆u = 0, l = l 0 , M 0 = Q0
D
当M升为 M 1 ,h下降,∆u > 0 ,电动机动作, - l
提高 l , l 0 升为l1 , Q升为Q1
Q M
h0
直到 Q1 = M 1 达到新平衡
此时 h1 ? = h0
试想:只要 h1 ≠ h0 , ∆u ≠ 0, 电动机就转,阀门就动作(不是开大就是
关小)直到 h = h0 达到新平衡
这是一个无静差系统。
32 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
数学模型
k1
33 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
两者不同,前者是0型,后者是1型,多了一个电动机,在把
速度信号变为位置信号时多了一个积分环节。
34 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
6、对扰动的误差
1.扰动(P(t))也是一种输入,系统静差由两部分组成,由r(t)引起的
和由p(t)引起的代数和。
−
e( s ) GH
=− 在已知p(t)下,求出 e ss
−
p( s) 1 + GHK
35 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
试分析 K(s)含积分和K(s)不含积分两种情况下的静差
●K(s)含积分 即扰动作用点之前(左)含积分,
对阶跃扰动无静差 e ss = 0
●K(s)不含积分
k2
− (GH中不含积分)
1 1 + k1k2
ess ≈ −
k1 − 1 (GH中含积分)
k1
36 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
自测题:求以下3题的静差 e = r−c
1)第一种情况:r(t)=1(t), f(t)=1(t)
第二种情况:r(t)=t, f(t)=1(t)
37 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
2)第一种情况:r(t)=1(t), f(t)=1(t)
第二种情况:r(t)=t, f(t)=1(t)
38 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
3)第一种情况:r(t)=1(t),
第二种情况:r(t)=t,
39 清华大学自动化系 慕春棣
5、静态误差
自动控制理论
1) -1/ K1 1 K1 K 2 − 1 K1
2) 0 0
3) 0 0
40 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
1)超调
y max − y (∞)
σ= × 100%
y (∞ )
41 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
2)过渡过程时间 ts
y(t)达到 y (∞)5%或2%的时间
t r 上升时间,y(t)第一次达到 y (∞) 的时间
t d 延迟时间,y(t)达到 y (∞)一半的时间
3)峰值时间 t p ,y(t)达到 y max 时的 t p
4)振荡次数
5)爬行现象
∞ ∞ ∞
6)误差积分指标 ∫ e (t )dt , ∫ te (t )dt , ∫ e(t ) dt
2 2
0 0 0
在阶跃函数作用下,误差的某个函数的积分值,无论
哪一种都希望越小越好。
42 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
典型二阶系统
2
d y dy
T 2
2
+ 2ζT +y=v T时间常数,ζ阻尼系数
dt dt
另一种形式:
d2y dy 1
2
+ 2ζω n + ω 2
n y = ω 2
nv ω n = 无阻尼自振频率
dt dt T
43 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
在零初始条件下,解此方程有以下情况
1−ζ 2
ζ
1) 0 ≤ ζ < 1, s1, 2 = − ± j (= −ω nζ ± jω d )
T T
( ω d 是阻尼振荡频率)
ζ
1 − t 1−ζ 2 1−ζ 2
y (t ) = 1 − e T
sin( t + arctg )
1−ζ 2 T ζ
曲线如图3.26
44 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
45 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
t
1 t −
2)ζ = 1 ,两个相等的负实根,s1, 2 = − , y (t ) = 1 − (1 + )e T
T T
− ζ ± ζ 2 −1
3)ζ > 1 ,两个不相等的负实根,s1, 2 =
T
s1t s2t
y (t ) = 1 + a1e + a2 e
y(t)单调趋近于1
46 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
分析:
1)看 ζ 的作用:
2) t T 总在一起,T是个时间尺度,曲线展宽或压缩。
47 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
1−ζ 2
θ = arctg.
ζ
cosθ = ζ
48 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
性能指标:
1) t r , y (t r ) = 1
ζ
1 − tr .
y (t r ) = 1 = 1 − e T
sin(ω d t r + θ )
1−ζ 2
sin(ω d t r + θ ) = 0 → ω d t r + θ = π
即:
π −θ
tr =
ωd
49 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
2) t p ,令
dy
= 0 ,得 t p =
π πT
=
dt ωd 1−ζ 2
−(ζπ )
1−ζ 2
∴ 得σ = e
t 3~ 4
4) s 近似估计值, s
t ≈
ζω n
(误差带5% ~ 2%)
50 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
课堂练习 r y
k
s (τs + 1)
试分析当r(t)=1(t),在以下三种不同k, τ 参数下,该二阶系统
的主要特征,并划出y(t)曲线
51 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论
−(ζπ πT
2
)
tp = 3
σ =e 1−ζ
ts ≈
1−ζ 2
ζω n
2)能根据主要特征绘制阶跃响应曲线
52 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论
一个高阶系统的闭环传递函数,可以写成如下的形式
−
m m −1
y( s) b s + b s + ...b1s + b0 k ( s + z1)( s + z2 )...( s + zm )
− = m
n
m −1
n −1
=
r ( s ) an s + an −1s + ...a1s + a0 ( s + p1 )( s + p2 )....( s + pn )
− pi (i=1,…n)系统的闭环极点
− zj (j=1,…m)系统的闭环零点
53 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论
在单位阶跃输入,零初始条件下,且假设这些零极点
都是实数且互不相同,于是有:
− A0 n Ai
y( s) = +∑ , A0 , Ai是相应于s = 0, s = − pi极点处的留数
s i =1 s + pi
有
n
y (t ) = A0 + ∑ Ai e − pi t
i =1
−
A0 = [ y ( s ).s ]s =0
−
Ai = [ y ( s )( s + pi )]s =− p
54 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论
1)设一极点 − pk 远离原点,此极点处的留数为 Ak
− k ( s + z1 )......( s + z m )
Ak = y ( s )( s + p k ) s = − pk = (s + pk ) s =− p k
s ( s + p1 )...( s + p k )...( s + p n )
k ( − pk + z1 )......( − pk + z m ) k ( pk ) m
= ≈ n>m
( − pk )( − pk + p1 )......( − pk + pn ) ( pk ) n
∴ Ak 很小。
这表示远离原点的极点所对应的运
动成分对于阶跃响应的影响很小。
55 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论
k (− p k + z1 )...(− p k + z r )...(− p k + z m )
=
(− p k )(− p k + p1 )......(− p k + p n )
可见 Ak 很小
这表明如果有一零点与一极点相近,则这个极点
所对应的运动成分在阶跃响应中所占的比重很小。
因此我们在分析高阶系统时,就可以把上述两种情况的极点化为次要
因素而忽略。如果一稳定系统有一对左半平面的共轭复极点,而在它们附
近又没有零点,则这一对共轭复极点称之为主导极点,这个系统就可以近
似化为一个二阶系统,其动态特性是由这一对主导极点决定。
56 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
介绍两种常用的校正方式,串联校正,局部反馈校正,
以及两者的结合
1、串联校正
r y
57 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
1
1. k ( s ) = k p (比例), 设G g ( s ) =
Ts(Ts + 2ζ )
当 k p = 1 特征方程为: T 2 s 2 + 2ζTs + 1 = 0
当 k p ≠ 1 特征方程为:T 2 s 2 + 2ζTs + k p = 0
T ζ
T'= ,ζ ' =
kp kp
58 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
1 1 1
2.K ( s ) = G
(积分校正)设 g ( s ) = G开 ( s ) =
TI s s (Ts + 1) TI s 2 (Ts + 1)
特征方程:TI Ts 3 + TI s 2 + 1 = 0 显然系统不稳定
k0 1
如果 Gg ( s) = , k (s) =
T0 s + 1 TI s
特征方程 TI s (T0 s + 1) + k 0 = 0
TI T0 s 2 + TI s + k 0 = 0 1
G g (s) =
s(Ts + 1)
TI T0 1 TI
T'= ,ζ ' =
k0 2 k 0T0
59 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
可以通过调整 TI , k 0 ,使系统具有希望的特征
3T '
ts ≈ = 6T0 , 与不加积分比较,系统响应变慢
ζ'
不加积分的特征方程为:T0 s + 1 + k 0 = 0
T0 3T0
T'= , t s = 3T ' =
1 + k0 1 + k0
可见加积分 优点-对克服静差有利
缺点-系统变慢,甚至于不稳定
60 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
3.将上述两者结合起来,比例加积分
1 TI s + 1 k0
k ( s ) = k p (1 + ) = kp , 设 G g (s) =
TI s TI s T0 s +1
k p k 0 (TI s + 1) k p k 0 (TI s + 1)
G闭 ( s ) = =
TI s (T0 s + 1) + k p k 0 (TI s + 1) TI T0 s 2 + (k p k 0 + 1)TI s + k p k 0
TI s + 1 k p k0 >>1
TI s + 1
= ⇒
TI T0 s 2
k p k0 + 1 TI T0 2
+ TI s + 1 s + TI s + 1
k p k0 k p k0 k p k0
TI s + 1 1
≈ =
T0 T0
(TI s + 1)( s + 1) s +1
k p k0 k p k0
61 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
比例加积分控制:
1)有积分对克服静态误差有利
T0
2)使响应可达到非振荡状态且 t s 不长,t s = 3
k p k0
T0
(不加比例积分:t s = 3 )
1 + k0
62 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
4.比例加微分
k ( s ) = k p (1 + TD s )
de(t )
控制信号 u (t ) = k p e(t ) + k p TD
dt
无微分作用只要y(t)<1,e(t)>0,就产生使y(t)增大的
控制作用,当 t = t1 , e = 0 时,y(t)还在增加,会出现
过头现象,加了微分作用 u (t ) 在t= t1' < t1 时为零,在
t1' 到t1 这段时间内 u (t ) < 0 ,抑制 y (t ) 的增加,好像
在车辆到达目标之前,提前制动一样。
微分作用只在信号发生变化时才起作用。
63 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
5. 比例加积分加微分 PID
1
K ( s) = K p + + TD s
TI s
综合了比例积分加微分的优点。
64 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论
2、局部反馈校正
通常用局部反馈改善局部特性,再配以串联校正
K
设 G( s) = ,Gc ( s ) = k
Ts + 1 K K
Ts + 1 = K
小闭环等效为 = 1 + kK
Kk Ts + 1 + kK T
1+ s +1
Ts + 1 1 + kK
1
当 kK >> 1 时 ⇒
k
当 G 中 T 较大时,采用局部反馈可减少惰性。
65 清华大学自动化系 慕春棣
自动控制理论
本章小结
1、稳定问题 充要条件
稳定判据及其应用
2、静差 系统类型
对典型信号的误差
对扰动的误差
3、二阶系统的动态特性 ζ ,T
66 清华大学自动化系 慕春棣
频率响应法
自动化系
清华大学自动化系 慕春棣
1、引言
自动控制理论
从 RC 电路对正弦信号的响应,引出频率特性
提出问题
1、这种分析方法是否适合于一般系统,即如果已知传递函数
G (s ) ,那它的频率特性是不是 G ( jω ) 。
2、如果输入不是正弦,而是一般周期函数,通过 Fourier
变换分解成一系正弦函数之和。
3、如果是非周期函数,这种关系还成立吗?
3 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论
满足Dirichlet(狄里赫利)条件的周期函数,都可以用
Fourier 变换,表示为一系列的谐波(正余弦)之和
∞
f (t ) = a 0 + ∑ a n cos nω 1t + bn sin nω 1t
n =1
其中: 1
T1
+
a0 =
T1 ∫
−
2
T1 f (t )dt ,
2
T
2 + 1
an =
T 1
−∫ 2
T1
2
f (t ) cos nω1tdt ,
2 + T21
bn = ∫ T1 f (t ) sin nω1tdt ,
T1 − 2
2π
ω1 = ,T1 为 f (t ) 的周期
T1
4 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论
这时基波ω 1 → 0 ,各次谐波之间的差趋向于无穷小,
即无限接近,谐波的幅值 → 0
∴ 非周期函数的频谱含有一切频率成分,即是由无穷
多个无穷小的谐波组成,所以它的频谱是连续的。
5 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论
Fourier 变换的数学描述
− +∞
f ( jω ) = ∫
−∞
f (t )e − jωt dt
与拉普拉斯变换对照:
− +∞
f ( s) = ∫ f (t )e − st dt
0−
6 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论
t
−
举例: f (t ) = e 1(t )
τ
∞ t
− − τ τ
f ( jω ) = ∫ e τ e − jωt dt = = ∠ − arg tgωτ
0
1 + jωτ 1 + (ωτ ) 2
其图像为
1
称为截止角频率
τ
7 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论
ω 从0→∞
从图中可以看到 f (t ) 中含有一切频率成分,
f ( jω ) 代表频率为 ω 的那项谐波的相对幅值
(乘以一个无穷小量才是真正的幅值)
− arctgωτ 代表频率为 ω 的那项谐波在 t = 0 时刻的初相角。
频带:通常指截止角频率的10倍。
试想当 τ 越小时,f(t)越尖 f ( jω ) 的频带越宽,由此可知,
变化越剧烈的函数,它的频带越宽,含有的高频成分越多。
8 清华大学自动化系 慕春棣
3、频率特性
自动控制理论
现在我们来回答引言中的第一个问题,一个正弦信号加到一G (s )
对象上,其输出与输入之间的关系,是不是可以用频率特性来表示,而
频率特性是不是 G ( jω ) ?
p( s )
G( s) =
( s + s1 )( s + s2 )...( s + sn )
9 清华大学自动化系 慕春棣
3、频率特性
自动控制理论
− − Xω p( s )
y ( s ) = x ( s ).G ( s ) = .
s 2 + ω 2 ( s + s1 )( s + s2 )...( s + sn )
−
b1 bn a a
= + ... + + +
s + s1 s + sn s + jω s − jω
−
− jωt
y (t ) = b1e − s1t
+ ... + bn e − sn t
+ ae + a e jωt
− Xω
其中: a = y ( s )( s + jω ) s =− jω = G ( s ). ( s + jω ) s = − jω
( s + jω )( s − jω )
Xω X
= G ( − jω ) * =− G ( jω ) e − jφ (ω )
− 2 jω 2j
− X
同理可求 a= G ( jω ) e jφ (ω )
2j
10 清华大学自动化系 慕春棣
3、频率特性
自动控制理论
−X X
y (t ) = G ( jω ) e − jφ (ω ) e − jωt + G ( jω ) e jφ (ω ) e jωt
2j 2j
− X G ( jω ) e − j [ωt +φ (ω ) ] + X G ( jω ) e j [ωt +φ (ω ) ]
=
2j
− X G ( jω ) − j (ωt +φ (ω ))
= (e − e j (ωt +φ (ω )) )
2j
= X G ( jω ) sin[ωt + φ (ω )]
y (t )
∴ = G ( jω ) 输出的模与输入的模之比等于G(jω)的模
x(t )
y(t)与x(t)的相位差 φ (ω )(就是G ( jω ) 的角)
G ( jω ) :频率特性,就是将G(s)中的 s → jω
G ( jω ) 是个复变函数,它的模表示 输出 的模。
输入
它的角表示输出与输入的相位差
11 清华大学自动化系 慕春棣
3、频率特性
自动控制理论
现在我们将上述结论拓宽:
如果输入信号不是正弦函数,而是一非周期函数,
通过Fourier变换可以表示为一系列的正弦函数之和,
对于每一项正弦函数都有上述关系。
∴ 我们把频率特性定义为输出的Fourier变换与输入
的Fourier变换之比。
G ( jω ) 称为幅频特性
它们都是ω的函数,都可以用图像表示出来。
arg G ( jω )称为相频特性
根据图像我们可以分析出系统的许多特性。
12 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论
1.极坐标图:
在复平面,把频率特性的模和角同时表示出来的图就是极坐标
看一个惰性环节的频率特性
k k
G ( jω ) = = ∠ − arg tgωT
1 + j ωT 1+ω T
2 2
ω 0 ∞
k 0
0
π
-
2
可以证明它的图像是一个半圆
k k kωT ,令 x = k kωT
G ( jω ) = = − j , y =
1 + j ωT 1 + ω 2 T 2 1 + ω 2T 2 1 + ω 2T 2 1 + ω 2T 2
k k
有 x 2 + y 2 − kx = 0, 即( x − ) 2 + y 2 = ( ) 2
2 2
13 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论
2.对数坐标图
横坐标为 ω 轴,以对数刻度表示之,十倍频程
对数分度:
lg 2 = 0.301 lg 3 = 0.4771
lg 4 = 0.602 lg 5 = 0.699
lg 6 = lg 3 + lg 2 = 0.778
lg 7 = 0.845
lg 8 = 3 lg 2 = 0.903
lg 9 = 2 lg 3 = 0.954
14 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论
画惰性环节的对数频率特性 1
T
1 2 10 100
令 k = 1, T = 0.5
0 ω
-1
π
1 2
G ( jω ) =
1 + (ωT ) 2
1 1
ω= , = ,20 lg = −10 lg 2 = −3分贝
T 2
1
ω << , ≈ 1 ,20 lg = 0分贝
T
1 1
ω >> , ≈ 20 lg = −20 lg ωT
T ωT ,
ω 每增大十倍, 下降20分贝
15 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论
1 0 ω
ω = , ∠ = −45 -1
T
1
ω >> , ∠ → −90 π
T 2
1
ω << , ∠ → 0
T
a
ω=
T 1
1 是关于 ω = 中心对称
a T
ω=
T
1
θ1 = arg tga, θ 2 = arg tg
a
θ1 + θ 2 = 90
16 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论
对数频率特性优点:
1)展宽频率范围
2) k变,幅频特性曲线只是上下移动
形状不变
T变,幅、相频特性曲线只是左右移动
3)几个频率特性相乘,对数幅、相曲线相加
G1 ( jω )G2 ( jω ) = G1 ( jω ) e jφ1 (ω ) . G2 ( jω ) e jφ2 (ω ) = G1 G2 e j [φ1 +φ2 ]
20 lg G1G2 = 20 lg G1 + 20 lg G2 ∠G1G2 = φ1 + φ 2
4)两个频率特性互为倒数,幅、相特性反号,关于 ω 轴对称
1 1
G1 = G1 = φ1 = −φ 2
G2 G2
20 lg G1 = −20 lg G2
17 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论
1.比例 G ( s ) = k , G ( jω ) = k , = k , ∠ = 0
1 1 1
2.积分 G ( s ) = ,G ( jω ) = , = , ∠ = −90
s jω ω
-20db
dec
0 0.1 1 10 ω
π
2
k k ω
s
18 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论
1 1 1
3.惰性 G ( s) = ,G ( jω ) = , = ,
Ts + 1 Tjω + 1 1+ω T 2 2
∠ = − arg tgωT
1
T ω
0
-20db
dec
π
2
19 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论
1
4.二阶振荡 G ( s ) =
T 2 s 2 + 2ςTs + 1
1 2ςωT
= ∠ = − arg tg ,
(1 − ω T ) + (2ςTω )
2 2 2 2
1 − ω 2T 2
显然幅相特性都与 ς 有关,见p182-183
Im
—
1
1 T ω
1 Re
ω= T
-40db
dec
ζ减小
1
可以证明:峰值频率 ω r = 1 − 2ζ 2
T
1
峰值 Mr =
2ζ 1 − ζ 2
20 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论
5.微分(2.3.4的幅相反号)
6.延时环节,G ( s ) = e −τs ,G ( jω ) = e −τjω = cos ωτ − j sin ωτ
= 1 , ∠ = −ωτ
1
τ ω
-57.3°
21 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论
7.不稳定单元
1 1 −1
, , 与 Ts + 1 比较
− Ts + 1 Ts − 1
以上三者的模都是半圆
− ωT ωT ∠ = −180 − arg tgωT
∠ = − arg tg ∠ = − arg tg
1 −1
= -180 − (0 → 90 )
= −(0 → −90 ) = −(−180 → −270 )
= -180 → −270
= 0 → 90 = 180 → 270
= 180 → 90
图像分别为:
22 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
1) 100(0.5s + 1)
G ( s) =
s (10 s + 1)(0.1s + 1)(0.01s + 1)
-1
-2
-1 ωc 100 ω
0° 0.1 1 2 10
-2
-90°
-3
-180°
-270°
相频特性:
讨论 ω c(剪切频率)求法,作图法,计算法 Im
100 2 ω -1 ω ∞
20 lg = 40 lg + 20 lg c
0.1 0.1 2 Re
∴ω c = 5
ω
讨论极坐标图大致形状 : ω
0
模从很大 → 0
π3
角从 − →− π
2 2
− 1点位置如图所示,当角 = -180 时,模小于1
24 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
40( s + 1)
2) G (s) =
(20 s + 1)(0.5s + 1)(0.1s + 1)
-1
20Lg40
-1 10 ω
0° 0.01 0.05 0.1 1 2 ωc 100
-2
-90°
-180°
Im
1 ω Re
由图可知: 20 lg 40 = 20 lg + 20 lg c
0.05 2
解得 ωc = 4 θ (ω c ) = −98.5
25 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
小结:对最小相位系统、幅频特性与相频特性的关系
如果幅频特性的斜率为 − 1对应的相角为 −
π
2
kπ
如果幅频特性的斜率为 − k对应的相角为 −
2
ω c 的定义,开环幅频特性曲线(折线)过0分贝的频率。
也叫剪切频率或穿越频率。
作业:4.6,4.7,4.9,4.11,4.16
26 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
6(0.33s + 1)
3) 非最小相位系统的例子 G0 ( s ) =
-1 s ( s − 1)
10 100
0° 3
1 2 ω
-1
-90°
-180°
-270°
非最小相位系统的幅相之间的关系没有象最小相位系统那样有确定的
规律,必须根据具体对象具体分析 。(试画出极坐标图)
27 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
练习开环对数图和极坐标图的画法
给定一些传递函数找出各自对应的极坐标图,并判
断闭环系统的稳定性,若不稳定,有几个极点在右
半平面。
K K
G0 (s ) = G0 (s ) =
(T1 s + 1)(T2 s + 1)(T3 s + 1) s (T1s + 1)(T2 s + 1)
28 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
Im Im Im
ω=0
-1 ω=0
0 Re -1 0 Re -1 0 Re
ω=0
Im Im
Im
ω=0
-1 ω=0
0 Re -1 0 Re -1 0 Re
ω=0
29 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
K (Ta s + 1)(Tb s + 1)
已知 G0 (s ) =
s 2 (T1 s + 1)
在以下三种情况下各自画出对数图和极坐标图
30 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论
已知 G (s ) =
K
s (T1 s + 1)(T2 s + 1)
0
求 θ (ω g ) = −180 的 ω g
31 清华大学自动化系 慕春棣
7、闭环频率特性
自动控制理论
如果从开环频率特性求闭环频率特性
G o ( jω )
G c ( jω ) = (设单位反馈)
1 + G o ( jω )
A∠φ A∠φ A
所以闭环 Gc ( jω1 ) = = = ∠φ − θ
1 + A∠φ B∠θ B
如图所示
∴ 可以看出求闭环频率特性很费事,人们提出:能否根据开环频率特性
来判断闭环系统的一些性质呢?
32 清华大学自动化系 慕春棣
7、闭环频率特性
自动控制理论
分析闭环
(1)在低频段 Go ( jω ) >> 1 ∴ Gc ( jω ) ≈ 1, ≈ 1, ∠ ≈ 0
(2)在高频段 Go ( jω ) << 1 ∴ Gc ( jω ) ≈ Go ( jω )
(3)在中频段 (指在剪切频率的附近)
如果出现 Go ( jω ) ≈ −1(模为1,角 ≈ −180 )这时 Gc ( jω ) >> 1,
这种情况要尽可能避免 G开
∴ 可见闭环频率特性具有如下形状
ω
33 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
Im
映射定理 S-P1
P1
S
O
Re
∏ (s − z
j =1
j )
W (s) = p 设W(s)在复平面一个封闭曲线内具有P个极点和Z个零点,
∏ (s − p ) i
i =1
当s向量沿封闭曲线顺钟向旋转一圈,所有向量s − z j , s − p j
也都顺钟旋转一周
∴ W(s)顺钟向旋转的圈数N=Z-P
34 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
N ( s)
∏ (s − z
j =1
j )
设系统的开环传递函数:Q( s) = = k.
P( s) p
∏ (s − p )
i =1
i
构造一个函数
P( s) + N ( s) 闭环分母
W ( s) = 1 + Q( s) =
P( s) 开环分母
做一封闭曲线D包围整个右半平面,且已知有p个极点在其中。
现在我们关心是这其中是否有闭环极点?
35 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
Im
+∞
∞
O
Re
-∞
按映射定理,当s沿D形围线顺钟向旋转一圈
[1 + Q( s)]顺钟方向旋转圈数 = 闭环在右半平面的极点数Z −
开环在右半平面的极点数P
36 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
1、什么是1+Q(s)旋转的圈数
当s沿D形围线顺旋一圈
s → ∞, (Q( s ) → 0) Q( s )的分母次数大于分子次数
即当s沿无穷大半圆旋转时,Q(s)在原点处蠕动。
∴我们只看ω从-∞→+∞ ( s = jω ) , 1 + Q( jω ) 旋转的周数
按映射定理,若闭环系统稳定
37 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
Im
-1
Re
1+Q(jω)
Q(jω)
38 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
举例:
K
1. Go ( s ) = K=20
(10 s + 1)(2s + 1)(0.2s + 1)
由 Go (s ) 可知,P=0,其极坐标图如例1所示。(ω 从 − ∞ → 0 → +∞ )
Im
当ω 从 − ∞ → +∞
-1 ω=0
+∞ Re
1 + Go ( jω ) 旋转0圈,
39 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
Im
-1 ω=0
+∞ Re
可以判断出:N=2,又P=0, ∴ Z = 2 闭环有两个根在右半平面
从以上两例总结出规律:Go ( jω ) 稳定与否看其极坐标图包不包-1点
40 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
K
3. Go ( s) = K=2
s ( s + 1)(0.1s + 1)
前面已说过D形围线不能通过 W (s ) 的零点,现在已知开环有一个极点
∴ 要对D形围线加以改造,如图例3.1。
在虚轴上即在D形围线上, Im
0-
-1 -∞
+∞ Re
0+
例3.1 例3.2
这样就把 s = 0 的极点归到左半平面∴ 仍认为 P = 0 ω = 0− → ω = 0+
s = ε e jθ θ 从− π → π 映射到 Go ( jω ) 平面
2 2
π π
Go ( jω ) 沿无穷大半径从 →− 如图例3.2. 可以判断 N=0∴ Z=0
2 2
41 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
-1
-∞
+∞ Re
0+ 例4
小结: Go (s ) 含有一个零极点的情况,闭环稳定与否可以从
其开环极坐标图包不包-1来判断。
42 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
K (T3 s + 1) 2
5.Go ( s ) =
(T1 s + 1)(T2 s + 1) 2 (T4 s + 1)(T5 s + 1)
对数坐标图和极坐标图如下所示。 K变,相应于横轴上下移动
-1
Im
-3
1 1
0° -1 T4 T5
1 1 1
T1 T2 T3
-2
-3
A -1
-90°
B C D O Re
-180°
-270°
-1点的位置有四种情况(即-1点处于A,B,C,D四处),试判断哪
几种情况稳定(-1点位于A,C处闭环稳定,位于B,D处闭环不稳定)
43 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
6(0.33s + 1)
6.非最小相位对象 Go ( s ) = Im
s ( s − 1) 0+
其极坐标图如例6所示
由图可以判断:N=-1(即 -1
+∞
1 + Go ( s ) 逆钟向旋转一圈) -∞ Re
∵N=Z-P,已知P=1 0-
∴ Z = 0 系统稳定。如果K增大,系统总是稳定的。
例6
当K减少至 Go ( jω ) 不包-1,系统就不稳定。
∴ 非最小相位系统稳定与否不能看 Go ( jω ) 是否包-1点.
用Routh判据可以得出:该系统稳定的范围是K>3。
44 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
7.结构不稳定例子 K
Go ( s ) = 2 P=0
s (T1 s + 1)(T2 s + 1)
极坐标图如图例7所示
可判断出 N=2, 由Z=N+P 得 Z=2 , 闭环不稳定
Im
0+ +∞
-1
0- -∞ Re
例7
Tb s + 1
怎样使其稳定呢?加 显然应该 Tb〉Ta
Ta s + 1
45 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
Im
1 1 0- -1
T2 Ta B +∞
1 1 -∞ Re
Tb T1 0+
可以通过调整K使-1点处在B,可使系统稳定。
46 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
-90°
-180°
-270°
-360°
47 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
-90°
-180°
-270°
-360°
0+
可见2),3)的校正无济于事
48 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论
作业:
49 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论
Routh判据和Nyquist判据给出系统绝对稳定的信息,但稳定
程度如何,离不稳定边缘还有多远?这是工程上最关心的
由此引出稳定裕量 Im
-1 Re
γ
G o ( jω )
γ = 180 + θ (ω c ) 相角裕量
50 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论
ωc ω0 ω
Kg
-90°
γ
-180°
-270°
-360°
θ (ω 0 ) = −180 L0 = −6db 增益裕量 K g = 6db
1
20 Lg =6 ∴ G0 = 0.5
G0
51 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论
1)上述定义是针对最小相位系统( γ , K g 都是正的)
这两个一正一负,正是非最小相位系统的特征
2)工程上根据经验一般要求 γ ≥ 30
,30 − 60 之间,
52 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
1. 从开环对数幅频特性可以判断闭环稳定性
如果开环对数频率特性穿越0分贝时的斜率为-1,并且有一定宽度
我们看如下频率特性
-2
-1 2.5ωc
ωc K ωc
2.5
-4
53 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
-2
2.5
K( s + 1)
ωc -1 2.5ωc
Go ( s ) =
2
s (
1
s + 1) 3
ωc K ωc
2.5ω c 2.5
1 -4
θ (ω c ) = −180 + arctg 2.5 − 3arctg
2.5
= -177.2
2.5ω
-1段的宽度 ω c = 6.25,
c
2.5
可以看出这种结构和参数几乎是临界情况。如要求闭环系统稳定 Go ( jω )
应以-1斜率穿越0分贝轴,且-1段的宽度为 5 − 10 倍。
54 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
2.从开环对数幅频特性可以判断闭环系统静态特性
-2
-1 2.5ωc
ωc K ωc
2.5
-4
该系统II型,K如何从图上求出?——由K可知系统静特性
ωc K K ω c2
20 lg = 40 lg ∴ = 2.5 ∴K =
ωc ωc ωc 2.5
( )2
2.5 2.5 2.5
55 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
3. 如何从开环对数幅频特性来判断闭环系统的动态特能
开环的中频段决定系统的主要动态性能
稳定裕量与超调的关系
1
有一些近似的关系 M r (闭环峰值)=
sin γ
100( M r − 1) M r ≤ 1.25
σ% =
50 M r − 1 M r > 1.25
2000
更粗略 σ% = − 20 (有一定范围)
γ
如果稳定裕量不够应加入怎样的环节?
56 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
t s 减小,说明频率尺度与时间尺度成反比关系
4~9
对于复杂系统也有类似关系 t s ≈
ωc
57 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
4. 高、低频段特性与动态性能的关系
低频段主要影响静态特性(系统型次,和K)对动态性能影响很
小。如何提高低频段增益,而不改变中频段的特性?
高频频带宽,阶跃相应上升沿好。高频段要衰减得快些,抑制噪声
5. 介绍几个经验公式
对于以下所示的典型四阶开环特性
斜率=-1
-2
L
-1
γω c γδωc
ωc ωc
ωc
αβ α
-2
-3
58 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
有如下经验公式
1 3.5 4 100
t s = 8 − − + 2
ωc α β (αγδ )
σ (% ) = 160 + 6.5 β + 2
∗
γ 2δ β ∗
= min(β ,10)
α
还有经验公式
t s ≈ (4 ~ 9 ) ω c
64 + 16h
σ (% ) = h是中频-1段的宽度
h −1
59 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)
作业:
60 清华大学自动化系 慕春棣
Chapter 5 Root Locus Method
Contents
5.1 Introduction
5.1.1 Time Domain Methods
5.1.2 Requirements of Analysis and Design Methods
5.1.3 Major Indirect Methods
5.2 Root Locus Plots
5.2.1 An Example 5.2.2 Angle and Magnitude Conditions
5.3 Properties of Root Locus and Their Applications
5.3.1 Properties of Root Locus
5.3.2 Conservation of the Sum of System Poles
5.3.3 Illustrative Examples
5.4 Root Locus Analysis of Control Systems
5.4.1 Conditionally Stable Systems
5.4.2 Comparison study for different Controllers
5.4.3 Effect of poles and Zeros 5.4.4 Parameter RL and Root Contours
5.4.5 Systems with Pure Time Delay
5.5 Complementary Root Locus
2024/2/8 TAC(1), Chap. 5 Root Locus 1
5.1 Introduction
5.1.1 Time Domain Method
—Direct analysis approach
• Best for judging performance
• Too complicated in calculation
• Difficult to predict the performance as
parameters change
• Time consuming
5.1.2 Requirements of Analysis Methods
• Simple and easy to implement
• Easy to predict the system performance
• Possible to indicate better parameters
ζ 1−ζ 2 s - plane
0 ≤ ζ < 1, s1, 2 =− ± j = −ω nζ ± jω d
T T s=σ+jω
♦ Possible to study
the root locus? K→∞ K→∞ σ
• Yes. K=0 O K=0
W R Evans,
1948, 1950 K=0
K→∞
1 1 4K − 1 1
K> s1,2 =− ± j K=
4
4 2 2 K→∞
K=0 K=0 σ
K → −∞ − 1 O K → −∞
• It is equivalent to ( s − p1 )( s − p2 )( s − pn ) = 0
• All OL poles are starting points
• Conjugate OL poles/zeros
s σ
make no contributions O
to the angle condition θ2
θ 1 + θ 2 = 360°
s2
n n
∑ p j − ∑ zi
j =1 i =1
σa =
γ n−m
σ
σa O
σ σ
−2 −1 0 σ
Root Locus
(ii) When B(s) = 1, the necessary condition is A′( s ) = 0
i =1
n n
• So ∑ λi = ∑ pi
i =1 i =1
♦ Part of CL poles may be found according to
this equation
−2 −1 σ
(iv) Asymptotes ( n − m = 1, k = 0)
± 180°(2k + 1) ± 180°(2k + 1)
γ= = = −180°
n−m 1
• No need to calculate σ a
j 2
−1 σ
−2
• Let s = −ζω n ± jω n 1 − ζ 2
j 2
1−ζ2
= −σ ± jσ σ
ζ −2 −1
= −σ ± j 1.0202σ
then G (s ) =
K ( −σ + j 1.0202σ + 2)
( −σ + j 1.0202σ + 1 − j 2 )( −σ + j 1.0202σ + 1 + j 2 )
1.0202σ 1.0202σ − 2
arg G ( s ) = arctan − arctan
2 −σ 1−σ
1.0202σ + 2
− arctan = −180°
1−σ
2024/2/8 TAC(1), Chap. 5 Root Locus 39
jω
ζ = 0.7
ϕ1
j 2
θ
−2 σ
−σ1 ϕ2
arg G ( s ) = θ − ϕ 1 − ϕ 2 = −180°
tan ϕ 1 + tan ϕ 2
• θ + 180° = ϕ 1 + ϕ 2 tan θ =
1 − tan ϕ 1 tan ϕ 2
2.0408σ 2 − 4σ + 1 = 0
σ1 = 1.666 σ 2 = 0.294
• According to σ
−2 −1
magnitude condition,
( s + 1) 2 + 2
K= = 1.34
s+2 s = −1.67 ± j 1.70
• Conclusion:
s = −1.67 ± j 1.70 K = 1.34
− 2.73 − 2 −1 σ
− 1.183
= −75°
− 2.0565 j1
ϕ p 4 = 75° jω
p3
j1 −1 σ
30° − 2.73 − 2
135°
p2 − 2 −1 p1 σ
90° − 1.183
p4
− 1.183
jω jω jω
O σ O σ O σ
jω jω jω
O σ O σ O σ
jω jω jω
O σ O σ O σ
jω jω jω
O σ O σ O σ
Solution:
(i) OL poles: 0 , − 4 , − 6 , − 0.7 ± j 0.714
OL zeros: − 1± j 1.7321
− 2.36
−6 −4 0 σ
0 σ
ω 2 = 2.1545 K 2 = 64.74 −6 −4
ω 3 = 3.7538 K 3 = 163.51
− 0.2 σ .
− 125 − 0.2 σ
Remarks:
• System I s1,2 = − 0.1 ± j 0.995 ζ = 01
.
Heavy oscillation, slow decaying rate
• System II,III s1,2 = − 0.5 ± j 0.866 ζ = 0.5
Better performance could be expected
R ( s) + C ( s) R ( s) + C ( s)
5(1 + 0.8s) G ( s) 5 G ( s)
− −
1 + 0.8s
5(1 + 0.8s ) 5
G ( s ) CL II = 2 G ( s ) CL =
III
5s + 5s + 5 5s 2 + 5s + 5
1 + 0.8s 1
= 2 = 2
s + s +1 s + s +1
2024/2/8 TAC(1), Chap.5 Root Locus 58
5.4.3 Effect of Zeros and Poles on Root Loci
1. Addition of Zeros
Example 5.4.3 Addition of a zero
• Original open-loop
transfer function and
jω root locus
K
G( s) F ( s) =
−p −p
1 2
σ ( s + p1 )( s + p2 )
p1 > p2 > 0
G (s) F (s) = jω
p1 > p2 > z
K (s + z) − p1 − p2 −z σ
( s + p1 )( s + p2 ) jω
p1 > z > p2 σ
• A zero may move − p1 −z − p2
jω
• A pole may move
the root locus
p3 > z
to the right − p3 − z − p1 − p2 σ
−a −1 σ
OL poles: OL zeros:
0.386 ± j 1.564 0 a = +∞ a=0 a = +∞
−1 O 1 σ
− 0.771 0
• Crossing points with
imaginary axis − j1
ω = 1.4142 a =1 a=0
• Condition of CL stability
a >1
as
• Sketch the root locus of G ( s ) F ( s ) =
s2 + K
OL poles: ± j K OL zero: 0
K = −( s + 1) eTs
(ii) Asymptotes: j3π
σ → +∞
ω = ±π , ± 3π , ± 5π , jπ
σ → −∞
σ
( n − m = 1 : odd ) −1
ω = 0, ± 2π , ± 4π ,
(iii) Real axis locus:
(−∞, −1)
d
ds
[
− ( s + 1)eTs ] ω = 14.21
K = 14.24
Ts Ts j3π
= −T ( s + 1)e −e
ω = 7.983
= eTs ( −Ts − T − 1) = 0 ω = 2.03 K = 8.04
K = 2.26 jπ
T +1 −2
s=− = −2 σ
T −1
(v) Root locus
* Delay causes
instability
K >0 K1 = − K < 0
• Positive feedback configuration systems
+ −
KW (s ) − KW (s )
+ −
K >0 K2 = − K < 0
♦ Root locus for negative gain is required
for system analysis
Even number of
• Asymptotes real poles/zeros
± 2 kπ
γ= , k = 0 , 1, 2 , , n − m − 1
n−m
• Angle of departure and Angle of arrival
m n
ϕ pr = ± 2kπ + ∑ arg( pr − zi ) − ∑ arg( pr − p j )
i =1 j =1
j ≠r
m n
ϕ zr = ± 2kπ − ∑ arg( zr − zi ) + ∑ arg( z r − p j )
i =1 j =1
i≠r
O σ O σ O σ
jω jω jω
O σ O σ O σ
O σ O σ O σ
jω jω jω
O σ O σ O σ
jω jω jω
O σ O σ O σ
♦ Features:
• Multi-loop control scheme
• Complicated in analysis and design
• Special results may be obtained by using simple
compensator
−180°
Types Methods
1 1 σ
− −
T αT
ϕ
ϕm
0° ωm ω
steady-state accuracy 0°
ωm ω
1
• ωm = is the
αT
geometrical centre
1 1
of and
T αT
1 + sin ϕ m
• α= • When α = 10 ϕ m = 54.9°
1 − sin ϕ m
1 + α Ts s − zc
Gc ( s ) = K c Gc ( s ) = K c
1 + Ts s − pc
with pc / zc = α
D D C C O
P P P
ϕ ϕ ϕ
D C D C D C
α ↓, K c ↑↑, K v ↑ α ↑↑, K c ↓, K v ↓↓
(3) ϕ ϕ
2 (3)
2
D (2) C
pc E zc O
4Kc
= =1
18.91
18.91
Kc = = 4.728
4
• CL poles:
s 1,2 = −2 ± j 2 3
s3 = −3.46
is near to
zc = −2.93
after
comp.
(red)
(black)
16
G( s) =
s 2 + 4 s + 16
s1,2 = −2 ± j 2 3
⇒ ωgc ↓, γ ↑
− 180° γ γ
L(ω ) K c2
K c2 > α , >1
α
K c1
K c1 = α , =1
α
0 dB
ω
Kc = 1
ω
0dB
* Kc1 : ωgc1 ↑,
ω γ1 ↑↑,
0°
Kv unchanged
γ′
−180°
angle 40 − 20
20
• After gain-compensated,
20
50 100 ω
0 dB
− 20
to be designed is 31.62 −6
0
Gc ( s ) 1 + α Ts ϕ
= 0°
ω
Kc 1 + Ts
• Let ωc = 50 > 45 rad/s, −180°
then
arg Gp ( j 50) = −90°− arctan 5 − arctan 0.5
= −90°−78.69°−26.57° = −195.26°
• Since required phase margin is γ = 30°, so
lead compensator should provide ϕ = 45°
• Choose ϕ m = ϕ + (5 to 10)° = 55°
2024/2/8 TAC(1), Chap.6 Comp Design 49
Gc ( s ) 1 + α Ts
=
Kc 1 + Ts
(iv) Calculate α L(ω )
1 + sin ϕ m 20 lg α
α= = 10 10 lg α
1 − sin ϕ m 0 dB
1 1 1 ω
αT αT T
ϕ
(v) Calculate T ϕm
ϕ
0°
50 ω
−180°
1 20 lg α
T= = 0.006325 10 lg α
α ωm 0 dB
1
αT
1 1
T
ω
αT
1
= 158.11
ϕ
ϕm
T
1
αT = 0.06325 = 15.81 0° ωm ω
αT
(vi) Compensator
Gc ( s ) 1 + 0.06325s
=
Kc 1 + 0.006325s
• It keeps the low frequency response unchanged
for retaining Kv = 100 s−1
• NB: The expected gain crossover frequency was
not guaranteed during this step
2024/2/8 TAC(1), Chap.6 Comp Design 51
Gp ( s )Gc ( s ) =
(vii) Final check 100(1 + 0.06325s )
Lm s(1 + 0.1s )(1 + 0.01s )(1 + 0.006325s )
40 − 20 12.05
Gc ( s ) 1 + 0.06325s
20
20 =
100 158 ω Kc 1 + 0.006325s
0 dB
10
s + 15.8
15.8
- 3.98
-11.93 = 10
− 20
−6
s + 158
31.62
0
K c Gp ( s ) =
ϕ
0° 100
ω
s(1 + 0.1s )(1 + 0.01s )
γ
−180°
20
20 γ = 30.8°
0 dB
10
100 158 ω
K v = 100s −1
- 3.98
15.8 -11.93
− 20
31.62 −6
0
ϕ
• By accurate
0°
ω curves:
ω gc = 54
γ γ = 37°
−180° ω pc = 119.7
K g = 11.31
• Before comp.
p1 = −109.23
p2,3 = −0.39
± j 30.26
• After comp.
p1 = −203.89
p2,3 = −23.47
± j 62.75
p4 = −17.27
z1 = −15.81
−1 −1
Kc = 1 Kp ↓ Kc = α > 1 Kg ↓ γ ↓
NB: Phase lead compensator is seldom used for the
plant of type 0, unless the plant possesses
very high Kp or very high γ
2024/2/8 TAC(1), Chap.6 Comp Design 57
2. Type I systems
−1
γ ↑
R1 + R2
• Let R2C = T, = β >1
R2
1
then s +
Eo ( s ) Ts + 1 1 T
= = ⋅
Ei ( s ) β Ts + 1 β s + 1
βT
1 1
− −
T βT
• Creates lag angle
− 20lg β
1
ϕ
βT ω
0°
ϕm
− 90°
• Behaves like a low-pass filter
• Worsens the transient response in general
at middle frequency
• Additional gain is added ϕ m
− 90°
for avoiding the influence
on the magnitude
at middle frequency,
• Which results in
* Increase of the magnitude at low frequency, and then
* Improvement of steady-state error
s+
1 ∏ ( − zi )
K K v′ = K i =1
• Let Gc ( s ) = c ⋅ T n
β s+ 1 ∏ (− p j )
βT j =1
m
K ∏ ( s − zi ) s+
1
K T
• Then Gp ( s )Gc ( s ) = ni =1 ⋅ c⋅
β s+ 1
s∏ ( s − p j ) βT
j =1
m
K ∏ ( − zi ) 1
• Static error
i =1 Kc T
K
• v = ⋅ ⋅ = K v′ K c coefficient will
n β 1 be increased
∏ (− p j ) βT by a factor Kc
j =1
• Conclusion: jω
* Kc = β, sd remains almost at K c2 ≠ β
the original place sd
Kc = β
* Kc ≠ β, sd will move to a
new place along
K c1 ≠ β
the new root locus
(3) High accuracy requires that
O σ
the gain of the compensator
and the ratio β = zc / pc to be high
(4) pc and zc should be very close to the origin
• pc ≈ zc for guaranteeing the root locus and
• zc / pc = β >> 1 to achieving higher gain, resulting in
• zc << 1 and pc << 1
after compensation
Black –
with Gc2(s)
2. Pictorial Explanation ω
0 dB
− 180° γ
ϕ
• The CL system
0°
2.15 ω is unstable
ω pc = 1.5
K g = −6
−180°
γ
13.98
arg Gp ( jω ) = 20
1.94 ω
0 dB
0.1 0.5 1 2 − 10
1 60
arg
( jω )(1 + jω )(1 + j0.5ω ) ϕ
2.15 ω
0°
= −90° − arctan ω
− arctan 0.5ω
= −128° −180°
γ
ω = 0.5 rad/s
• Take new crossover freq ωgc = 0.5 rad/s
• Lag compensator ϕ
ω
2.15
should reduce the 0°
• − 20 lg β = −20 β = 10
1 1 + Ts 1 + 10 s
= 0.01 • Gc ( s ) = =
βT 1 + βTs 1 + 100 s
−
K v = 5 s −1
60
ϕ
2.15 ω (By accurate
0°
response)
ω gc = 0.454
γ γ = 416. °
−180°
γ ω pc = 1.32
K g = 14.3
2024/2/8 TAC(1), Chap.6 Comp Design 90
(v) Time responses
(red—compensated)
2024/2/8 TAC(1), Chap.6 Comp Design 91
4. Summary of Procedures ( for reference only )
(1) Determine the desired OL gain according
to the steady-state error coefficient
(2) Draw the Bode diagrams of the gain-compensated
system and obtain the gain margin and phase margin
of the system with K included
(3) Choose a new ωgc such that
[ ]
180° + arg KGp ( jωgc ) = γ + (5 to 12)°
1 1 1
(4) select < to ωgc
T 5 10
1 ωgc
at least <
T 2
ωc
−1
• Kg ↑, γ ↑
For
ω1 1 example
1
βT 1 ω1
≈
T T 10
−1
Kc = β
R1
ei R2 eo
C2
Eo ( s ) ( R1C1s + 1) ( R2C2 s + 1)
=
Ei ( s ) ( R1C1s + 1) ( R2C2 s + 1) + R1C2 s
β σ
1 1
− − −
T1 T1 βT2
0°
ω
− 90°
1 • Lag-lead compensator ≈
• ω1 =
T1T2 Lag comp + Lead comp
2024/2/8 TAC(1), Chap.6 Comp Design 100
Eo ( s ) (1 + T1s ) (1 + T2 s )
=
3. Polar plot Ei ( s ) T1
1 + s (1 + βT2 s )
β
Im
ω1 ω→∞ Re
ω =0 1
• When ω = ω 1 , ϕ = 0
− 0.5 σ
(1) (2)
Kg ↑,
Kv unchanged ϕ
• Kc2 > 1,
ω
ωc2 ↑, γ2 ↑, − 180°
γ1 γ γ2
Kv ↑
−
60
0° ω • The CL
system
is almost
−180° unstable
2024/2/8 TAC(1), Chap.6 Comp Design 120
ω c = 20 rad/s
Lm
γ ≥ 40°
60 − 20
40
20 31.6
20
100
0dB
0.1 1 10 20 ω
− 20
−6
ϕ 0
0° ω
−180°
α= = 4.599
60 − 20
1 − sin 40° 40
31.6
1 20 20
T = 0.0233 αT = 0.1072 ϕ
−
60
0° ω
1 + 0.023s
• Finally, the lead part is selected to be
= 1 + 0.1s s + 10
Gc1 ( s ) = 4.348 α = 4.348
1 + 0.023s s + 43.48
since the zero of the compensator is near
to one pole of the plant
2024/2/8 TAC(1), Chap.6 Comp Design 122
α = 4.348
(iv) Design of the lag part Gc2(s)
• Bode diagrams of
20 13.98 7.237
Gp( jω) Gc1( jω)
Lm(Gc1 )
12.77
* Gp ( j 20) Gc1 ( j 20) 7.96
Lm(GpGc1 )
= 7.96 + 6.02 ≈ 14 dB
10 20 43.48 100 ω
6.02 − 7.234
* At ω c = 20 rad/s Lm(Gp )
− 20
Gp ( j 20) Gc1 ( j 20) Gc2 ( j 20) = 1
Gc2 ( j 20) = −14 dB
−
γ = 44.97°
60
K v = 100 s −1
0° ω
ω pc = 62.4 rad/s
γ
−180° K g = 13.05 dB
−4
0
ω3 ω4 ω
ω1 ω2 ωc
−
compensated systems
60
2024/2/8 TAC(1), Chap.6 Comp Design 128
K (1 + s ω2 )
− 20 s(1 + s ω1 )(1 + s ω3 )(1 + s ω4 )
−4
0
ω3 ω4 ω
ω1 ω2 ωc
−
60
0°
− 90°
−180°
− 270°
ω2 ↓ ϕ ↑ γ↑ ω3 ↑ ϕ↑ γ↑
2024/2/8 TAC(1), Chap.6 Comp Design 129
− 20
−4
0
ω3 ω4 ω
ω1 ω2 ωc
−
60
(1) Middle frequency range
• Slope of −20 dB/decade guarantees stability
• Wide range (ω3 − ω2 ) gives sufficient phase margin
• Higher ωc ⇒ Fast response
−4
0
ω3 ω4 ω
ω1 ω2 ωc
−
60
(2) Higher frequency range
• Higher ω3 and ω4 ⇒ Better stability margins
• Lower ω3 and ω4 ⇒ Better noise reduction
(3) Lower frequency range
• Lower ω2
⇒ Better stability
⇒ Response approaching to
the steady-state value varies slowly
2024/2/8 TAC(1), Chap.6 Comp Design 131
• Effect of ω2 on time response
K (1 + s ω 2 )
Gp ( s )Gc ( s ) =
s(1 + s ω1 )(1 + s ω 3 )(1 + s ω 4 )
K = 100
ω 3 = 43 ω 4 = 100
(i) Black:
ω1 = 0.8, ω2 = 4
(ii) Red:
ω1 = 0.4, ω2 = 2
(iii) Blue:
ω1 = 0.2, ω2 = 1
ei C C eo
R1
Eo ( s) R1CR2Cs 2 + 2 R1Cs + 1
=
Ei ( s ) R1CR2Cs 2 + ( R2C + 2 R1C ) s + 1
jω
1 1
− −
R1C 2 R1C
O σ
O σ
(4) Case of Conjugate Plant Poles
• They may be cancelled out by
a bridged-T compensator
t1
c(t ) c(t )
a +b
a
t1 t1
x x
♦ Features:
• No output when input signal is small
• Residual may cause steady-state error
• Oscillation is usually weakened
− M x<0
y=
x M x≥0
−M
♦ Features:
• Fast switching is offered
• Fast and smooth regulation could be achieved
if used properly
• Oscillation may occur
if used improperly
♦ Features:
• Causes retarded operation
• Causes oscillation
k ( x + a) x < 0
−a k y=
a x k ( x − a ) x ≥ 0
k
♦ Features:
• Operation is delayed
• Oscillation may occur
Frictions, etc.
m x
(1) k2 = 0, linear spring:
x f
x0
• Decaying oscillation,
frequency decreases m x
as magnitude decreases
(2) k2 < 0, soft spring: f
x
x0
(2) k2 > 0
X
ω p
(3) k2 < 0 m x
X f
* x0 > 1:
x0
x (t) → ∞ as t → ln
x0 − 1 1
* x0 < 1: x (t) → 0 as t → ∞
• Conclusions: t
* x = 0 is the stable 0
equilibrium state
* x = 1 is the unstable x0
equilibrium state ln
x0 − 1
(dashed)
x (0) = 2.01
x (0) = 3.01
ωt
Bn = 0
A2 k = 0 B2 k = 0
Y1 (ω ) = B1 sin ω t
• Then
A0 = A2 k = B2 k = 0
Y1 (ω ) = A1 cos ω t x
+ B1 sin ω t
and momeryless.
⇒ Output -- odd
function and
only B1 is to be
calculated ωt
ωt
4 αs π /2
= ∫ k ( X sin ωt − D) sin ωt dω t + k ( S − D) ∫ sinωt dω t
π α d αs
= ( Omitted )
2kX 1
= α s − α d − (sin 2α s − sin 2α d )
π 2
2S 2D
+ cos α s − cos α d
X X
2 π
= ∫
π 0
M sin ω t dω t x t
2M π
=
π ∫0 sin ω t dω t x
2M
= [− cos ω t ] π0
π
4M
=
π
t
M
0 X
1 πX
• − =−
Im
N 4M
Re
X →∞ 1 X =0
−
N
h X
• ω t1 = arcsin t1 x
X
h ωT
ω t2 = arcsin +
X 2 t2
T
= ω t1 +
2 t
0 h 1.0
X
−M
0 0 ≤ t < t1 ,
π
x
t1
t2 ≤ t < + t1 ,
ω
π 2π t2
• y= + t2 ≤ t ≤
ω ω
M t1 ≤ t <t2
π π
t
− M + t1 ≤ t < +t2
ω ω
or ϕ1
0.4 0.2
N=
2 M jθ 2
πX
(
e + e − jθ1 ) α = 0.8
− 50°
N α =0
( X ≥ ∆ + h) β
∆−h 0.2
θ1 = arcsin 0.8 h
X α=
θ 2 = arcsin
∆+h ∆
X M
0 1.0 β=
∆ ∆
X
2024/2/8 TAC(1), Chap.7 NL Systems 54
1
• − ( X ≥ ∆ + h)
N
m→∞
X =∆+h
h
m = 1+
∆
( h = 0.6, M = 1)
h − X 3π π
≤ t < t1 +
2ω ω
x − h π 2π t
t1 + ≤ t ≤
ω ω
N − 90°
0 h 10
.
X
2024/2/8 TAC(1), Chap.7 NL Systems 57
1 Im
•− ( X ≥ h)
N −1 Re
X →∞
1
−
N
5. Dead zone Im
1 X =h
1 −
− k
N Re
X =D X →∞
6. Saturation 1 Im
1 −
− k
N Re
X →∞ X =S
• It is usual that
Z1
≠ N 2 (Y ) N 1 ( X )
X
M2
x z
K1 K2
• x y
∆1 ∆2 z
K K = K1K 2
x ∆ z
∆2
∆ = ∆1 +
K1
C1 Y1 Z1
then N = = + = N1 + N 2
X X X
y k1
y
x k2
k1
y D x
k2 − k1
D x
−1 −1 −1
NGp ( jω )
NGp ( jω ) NGp ( jω )
♦ Stability conditions by Gp ( jω )
⇓
and −1/N(X) 1
Gp ( jω ) = −
Gp ( jω ) Gp ( jω ) Gp ( jω ) N(X )
1 1
− −
N 1 N
−
N
Gp ( jω )
X →∞ E B A represents
F unstable
1
− oscillation
N B represents
C
A stable
X =0 D
oscillation
• A & B: Self-sustained oscillations
• C, D, E, F : Oscillations with their respective
amplitudes Xs
Im Gp ( jω ) = 0 ⇒ ω 1
−
N
1
Re Gp ( jω ) = −
N(X )
⇒ X Gp ( jω )
Gp ( jω )
Im N ( X )Gp ( jω ) = 0
1
−
N Re N ( X )Gp ( jω ) = −1
⇒ X, ω
Given
K
Gp ( j ω ) =
jω (1 + jω )(1 + 0.5 jω )
and dead zone nonlinearity with
2k
2
∆ ∆ ∆
N ( X ) = k − arcsin + 1−
π X X X
Determine and analyze the self-sustained
oscillations.
x (0) = 0, x (0) = 0
x (0) = 0, x (0) = 0
■
• Let x1 = x, x2 = x , then O A′
B′
dx1 dx 2
= x = x 2 = − x = − x 2 x2 = 0 x1
dt dt
dx 2 x2 B
• =−
dx1 x2
⇒ All point with x2 = 0 are singular points
i.e. all points on the x1 -axis are singular points
NB: The system is a mass-damper system with motion
x (t ) = [ x (0) + x (0)] − x (0)e −t ■
⇒ x = −(1 + α ) x = 0 α =∞
x
• α = −2 ⇒ x = x
1
• α = −4 ⇒ x = x
3 α =0
A′
− 2ζy AB O x
1
−
2ζ
■
O σ O x
λ2
O σ O x
λ2
λ2 λ1 O σ O x
λ1
λ2
λ 1t λ 2t
• x (t ) = C1e + C2e
• The lines with slopes λ1 , λ2 are phase trajectories
• The lines with slopes λ1 , λ2 are separatrices as well
• All trajectories approach the separatrice of λ1
when | λ1 | < | λ2 |
O
O λ1 λ2 σ x
if λ1 < λ2
O σ O x
λ2
λ2 O λ1 σ x
λ2
x x x
■
2024/2/8 TAC(1), Chap.7 NL Systems 123
End of
Section 3, Chapter 7
R e R e
O O
R c R c
O O
R e( x ) e( x )
R
O O
V V
K K ■
x = M 7.3.5
x + x = P
x
f (
x , x , x ) = − M f ( x, x , x ) = M
x
II I
x < 0, u = − M x > 0, u = M
where GN m
is as follows
− e0 k e
e for e > e0 O e0
m=
ke for e < e0
k <1 I II III
O E0 e
− e0 e0 A
I II B III
I II B III
t I II B III
t
I II B III
PI PII
e
− e0 e0
I II III
PI PII
e
− e0 e0
I II III
PI PII e
− e0 O e0
I II III
• ramp with
e B
A(0.3,0.04)
big V
e
− 0.2 PI PII 0.2 D
PI e
− 0.2 O PII
B C
I II III
I II III
■
2024/2/8 TAC(1), Chap.7 NL Systems 154
Example 7.4.4 Obtain the phase plane portrait for
the system
M0
r + e − e1 − e0 m K c
− e0 e1 s(Ts + 1)
− M0
M 0 e > e1
m = 0 − e0 < e ≤ e1 for e > 0
− M e ≤ −e0
0
M 0 e > e0
m = 0 − e1 < e ≤ e0 for e ≤ 0
− M e ≤ −e1
0
• System equations:
C ( s) K
=
M ( s ) s(Ts + 1)
Tc + c = Km
e = r − c, c = r − e
c = r − e, c = r − e e
Te + e = Tr + r − Km I II III
− e1 e0 e
− e0 O e1
• In e − e plane:
m = − M0 m=0 m = M0
KM 0
− e1 e0 R e
− e0 O e1
− KM 0
I II III
KM 0
− e1 O e0 R e
− e0 e1
− KM 0
I II III
e.g. T = 1, KM 0 > 7, e1 = 2, e0 = 1, R = 4
Te + e = V + KM 0 Area I
Te + e = V Area II
Te + e = V − KM Area III
0
V + KM 0
V − KM 0
O e0 e1 e
I II III
V + KM 0
V
− e1 e
− e0 O e0 e1
I II III
V + KM 0 e1
V
− e1 e
− e0 O e0
V − KM 0
I II III
e.g. T = 1, V = 1, KM 0 > 1.5, e1 = 2, e0 = 1, R = 4 ■
PII PI e
I II
x1
O
B( x1b , x2 b )
x1c = x1a
⇒ limit cycles
x2 c = x2 a
α =0
α = −2 −1
α = − 0 .5
α = −1.5
α =0
α = −2 −1
α = − 0 .5
α = −1.5
Time response × √
Stability analysis √ √
Accuracy × √
t
0 γ T 2T
• Sampling interval T = const
• Sampling instants tk = kT
• γ << T
p(t )
1
• Sampling operation x *p (t )
is a magnitude
modulating process
t
p(t )
∞
p (t ) = ∑ Ck exp( jkωst ) ωs = 2π T
t
x *p ( t )
k = −∞
* Calculations of Ck are complicated t
∞
*
• xp (t ) = x(t ) ⋅ p (t ) = ∑ Ck x(t ) exp( jkωst )
k = −∞
* Calculation of xp*(t) is complicated as well
t
0 γ
δT (t )
♦ Impulse train
∞
• δ T (t ) = ∑ δ (t − nT )
n = −∞
t
0 T 2T
δT ( t )
x * (t )
• x (t ) = x (t ) ⋅ δ T (t ) δT ( t )
∞
= ∑ Cn ⋅ δ (t − nT ) t
n = −∞ x * (t )
nT +
• Cn = ∫ − x(t )δ (t − nT ) dt t
nT
= x ( nT ) = x * ( nT )
Let s = jω , then
X * ( jω ) = ω
1 ∞ X * ( jω )
∑ X [ j (ω − kωs ) ]
T k =−∞
ω
− ωs 0 ωs
X * ( jω )
ω
− ωs 0 ωs
t
O T 2T
Zero order hold First order hold
ω
− 2ω s − ωs ωs 2ωs
arg H 0 ( jω )
π
ωs 2ωs ω
− 2ω s − ωs
−π
H 0 ( jω ) = 0 H0 ( jω )
X * ( jω ) H 0 ( jω ) ≈ X ( jω )
• Phase lag less then π ω
− ωs O ωs
arg H 0 ( jω )
π
ω
X * ( jω ) H 0 ( jω )
ωs 2ωs
− 2ω s − ωs
−π
ω
− ωs O ωs
X ( z ) = Z { x* (t ) }
= x (0) + x (T ) z −1 + x ( 2T ) z −2 + + x ( kT ) z −k +
∞
= ∑ x(kT ) z −k x (t ) x* (t )
k =0
Z Z
• for discrete-time series x(k)
∞
X ( z ) = Z { x(k ) } = ∑ x ( k ) z −k
X (z )
k =0
♦ z-Transform of a time function can be found
in a z-transform table
x (t + nT )
Z{x(t + nT )} =
n −1 x (t )
z n X (z ) − ∑ x ( iT ) z n −i
i =0 t
0 nT
• Convolution summation
y* (t ) = ∑ y (kT ) δ (t − kT )
k =0
At t = kT
y ( kT ) = g (t )u(0) + g (t − T )u(T ) +
g (t − 2T )u( 2T ) + + g (t − kT )u( kT )
k k
= ∑ g (t − nT )u( nT ) = ∑ g ( kT − nT )u ( nT )
n =0 n =0
m=k −n k
=
( n=k −m)
∑ g (mT )u (kT − mT ) = u (kT ) * g (kT )
m =0
• z- transform of y*(t)
∞ ∞ k
Y ( z) = ∑ y ( kT ) z −k = ∑ ∑ g ( kT − nT ) u( nT ) z −k
k =0 k =0 n =0
* Since
Y ( z) = ∑ ∑ g (kT − nT ) u (nT ) z −k
k =0 n =0
∞
∑ g ( kT − nT )u( nT )
n =0
= g ( kT )u(0) + g ( kT − T )u(T ) + + g (T )u( kT − T )
+ g (0)u( kT ) + g ( −T )u( kT + T ) +
= g ( kT )u(0) + g ( kT − T )u(T ) + + g (T )u( kT − T )
+ g (0)u( kT )
k
= ∑ g ( kT − nT )u( nT ) = y (kT )
n =0
♦ z-transfer function
∑ g (mT ) z −m ⋅ U ( z ) = G ( z ) U ( z )
m =0
∞
G( z) = ∑ g ( mT ) z −m
m =0
♦ The procedure to obtain
z- transfer function by definition
L −1
→ g * (t ) → G (z )
Z
G ( s )
→ g (t )
• Calculation of z-transfer functions will be given
later
F ( s)
Solution:
• Y ( s ) = G ( s ) E ( s ) = G ( s ) [R ( s ) − V ( s ) ]
= G ( s) R( s) − G ( s) F ( s) ⋅ Y * ( s)
• Y ( z ) = GR( z ) − GF ( z ) ⋅ Y ( z )
GR ( z )
Y ( z) =
1 + GF ( z )
• No pulse transfer function from R (z ) to Y (z ) ■
k =0
[
− (t − 1) − 1 + e −( t −1) ] ⋅ 1(t − 1)
1 t
• g ( 0) = 0 1 t
• For k = 1, 2, …
[ ][
g ( k ) = k − 1 + e −k − k − 1 − 1 + e −( k −1) ]
= 1 + e − k − e −( k −1)
∞ ∞
• G( z) = ∑ g (k ) z −k = ∑ g (k ) z −k
k =0 k =1
[ ]
∞
= ∑ 1 + e −k − e −( k −1) z −k
k =1
[ ]
∞
= ∑ z − k + (1 − e)(ez ) − k
k =1
[ ]
∞
G ( z ) = ∑ z −k + (1 − e)(ez ) −k
k =1
• Correspondence of
( )
G ( s ) = 1 − e −Ts X ( s )
G ( z ) = ( 1 − z −1 ) X ( z )
suggests the a procedure to calculate
the z- transfer function as follows
e jωT
σ
σ1 O O 1
s-plane z-plane
s-plane z-plane
• Constant ζ jω ζ = 0.5 ζ =0
β σ
β = arccosζ O O 1
ζ = 0.7
s-plane z-plane
and so on
Solution:
(i) OL z-transfer function
G( z)
C( z) = R( z )
1 + GF ( z )
0.632 Kz
G ( z ) = GF ( z ) =
( z − 1)( z − 0.368)
−1 0.368 1
z-plane w-plane
◊ Inside of the unit circle in z-plane
⇔ Left half plane in the w-plane
2π
jω D
j ωT ωs
z=e =e C−
z-plane w-plane
ωs
ω =0→
2
ωT ωT B
j −j
e 2 −e 2 C +
A A u
= ωT ωT −1 1
C−
j −j D
e +e 2 2
ωT D
sin C−
=j 2 = j tan ωT = j tan ω π = jv
ωT 2 ωs
cos
2
to the frequency B
in the s-plane C +
A A u
−1 1
C−
D
D
C−
♦ Let w = u + jv,
v is called the fictitious frequency
0+ u −∞ Re
0− KT + ∞
−
2
−∞ 0+
w-plane GH 0 ( w) -plane
(iii) Stability condition
KT 2
p0 = 0 ⇒ N −1 = 0 ⇒ − > −1 i.e. K <
2 T
■
− 90°
−180°
( K ′ = 0) ( K ′ = −∞) u
1
jv
K=0 K=∞
( K ′ = −1) ( K ′ = 0) ( K ′ = −∞) u
2 1
K=
T
= 2 z −1 + z −2 + z −3 + z −4 +
T ( 2 z − 1) −2 −3 −4
= 3 2 = 2Tz + 3 Tz + 4Tz +
z − 2z + z ■
♦ Remarks:
(1) Shortest time is required for reaching steady-state
value
(2) Saturation in control may occur because of high
control energy
(3) Sensitive to parameter variations
2024/2/8 TAC(1), Chap.8 Sampled Systems 76
2. Steady-state Response
• Consider the stable CL system
r (t ) + e( t ) e* (t ) y (t )
G ( s)
T
v (t ) −
F ( s)
R( z )
• Error E ( z ) =
1 + GF ( z )
T2
= lim
z →1 ( z − 1) 2 GF ( z )
Type 1 1
single pole ess→0 ess = ess→∞
Kp→∞ Kv
z=1
Type 2 1
ess→0 ess =
double pole
Kv→∞ Ka
z=1
Type 3 ess→0
triple pole Ka→∞
z=1
2024/2/8 TAC(1), Chap.8 Sampled Systems 82
3. Modified z-transform
♦ Motivation for studying modified z-transform
• x1 (t ) ≠ x2 (t ) • The behaviors between
but x1* (t ) = x2* (t ) the sampling instants
may not be satisfactory
x1 (t ) x2 ( t )
t t
x (t ) ⋅ 1(t − 2T )
x (t )
x (t ) ⋅ 1(t − 2.5T )
t
0 T 2T 3T 4T
Im s Im z Re w
A
C
π Re s Re z
C
A A
Im w z +1
w=
z −1
Re w
C
在经典控制理论中,主要研究的仅仅是输入、输出之间的动态关
系。对于一个线性定常系统,是用一个高阶微分方程或传递函数加以
描述的,它们将某个变量作为输出,直接和输入联系起来。系统的动
态特性由该变量对给定输入的响应来表征。虽然这个输出变量的响应
可能是我们直接感兴趣的唯一结果,但是系统除了这个变量外,还包
含有其它相互独立的变量。关于它们对给定输入的响应如何,则必须
另行研究。因此,用一个高阶微分方程或传递函数来描述一个线性定
常系统显然有其不足之处,它们不能完全描述系统的全部运动状态。
如图 1.1 所示的系统,其中 y 表示小车运动的位移,u 表示外作用
力,F 为摩擦力,k 为摩擦系数,M 为小车的质量。根据力学定理,系
统的方程为:
u F ky
M
图 1.1
d2y dy
M 2
k u
dt dt
以小车的位移 y 为输出,外作用力 u 作为输入,系统的传递函数为:
y( s ) 1
g( s )
u( s ) s( Ms k )
我们知道,光有位置 y 还不能完全表达小车的状态。对于某个位移
y,速度可以具有任何数值而与位移的数值无关。要完整地描述这个系
dy
统的状态,既要知道 y 又要知道 。一般说来,要完整地描述任意一
dt
1
个系统都需要知道其全部独立变量。这就说明建立在输入—输出关系
上的古典控制理论存在着局限性。
五十年代后期开始,贝尔曼(Bellman)等人提出了状态变量法。在
用状态空间法分析系统时,系统的动态特性是由状态变量构成的一阶
微分方程组来描述的。在数字计算机上求解一阶微分方程组比求解与
之相应在的高阶微分方程容易得多,而且可以同时得到系统全部独立
变量的响应,因而能同时确定系统的全部内部运动状态。此外,状态
空间法还可以方便地处理初始条件,可以用来分析设计多变量、时变
和非线性系统,也可以应用于随机过程和采样数据系统,因此它是研
究大型、复杂、高质量控制系统的理论基础。
现代控制理论是在引入状态和状态空间概念的基础上发展起来的。
因此,确定控制系统状态空间的描述,即建立状态空间的数学模型,
是一个基本问题。
§1.1 状态的概念、状态方程和输出方程
一、状态
动态系统的状态粗略地说就是指系统的过去、现在和将来的运动状
况。精确地说,状态需要一组必要而充分的数据来说明。如图 1.1 中所
示的小车的运动,这个系统的状态就是车子每一时刻的位置(位移)
和速度。
二、状态变量
系统的状态变量就是指足以完全确定系统运动状态的最小一组变量。
一个用 n 阶微分方程描述的系统,就有 n 个独立变量,求得这 n 个独
立变量的时间响应,系统的运动状态也就被揭示无遗了。因此,可以
说系统的状态变量就是 n 阶系统的 n 个独立变量。
、xn ( t ) 为系统的一组状态变量,则它应该
设 x1 ( t )、x2 ( t)、
满足下列两个条件:
、xn ( t 0 ) 都
1、在任何时刻 t=t 0 ,这组变量的值 x1 ( t 0 )、x2 ( t 0)、
表示系统在该时刻的状态;
2、当系统在 t≧t 0 的输入和上述初始状态确定以后,状态变量便能
2
完全确定系统在任何 t≧t 0 时刻的行为。
图 1.1 中,只要已知 t=t 0 时刻小车的位置 y 0 和速度 v 0 ,并且知道
t≧t 0 时作用函数 u ,那么,小车在任何时刻的状态就确定了。
、xn ( t )
很显然, n 阶动态系统在 t 时刻的状态 x1 ( t )、x2 ( t)、
( t 0 ≦t≦∞ ) 是 由 其 在 t0 时 刻 的 初 始 状 态
、xn ( t 0 ) 和 t≧t 0 时的输入函数 u(t) 所唯一确定的
x1 ( t0 )、x2 ( t0)、
而与 t 0 前时刻的状态和输入无关。
同一个系统,究竟选取那些变量作为状态变量,这不是唯一的,要
紧的是这些状态变量是相互独立的,且其个数应等于微分方程的阶数
因为微分方程的阶数是唯一地取决于系统中独立储能元件的个数,因
此,状态变量的个数就应等于系统独立储能元件的个数。
还应该指出,状态变量不一定是物理上可量测或可观测的量,但通
常总是选择易于测量或观测的量作为状态变量,因为当系统实现最佳
控制规律时,需要反馈所有的状态变量。
三、状态向量
如果完全描述一个系统的动态行为需要 n 个状态变量
、xn ( t ) ,那么这 n 个状态变量作分量所构成的
x1 ( t )、x2 ( t)、
向量 x (t ) 就叫做该系统的状态向量,记作
x1 ( t )
x ( t )
x(t ) 2 或 x ( t ) [ x 1 ( t ) x 2 ( t ) x n ( t )]
T
x
n ( t )
四、状态空间
、xn ( t ) 为坐标所构成的 n 维空间称
以状态变量 x1 ( t )、x2 ( t)、
为状态空间。任何状态,都可以用状态空间中的一个点来表示。即在特
定时刻 t ,状态向量 x (t ) 在状态空间中是一点。已知初始时刻 t 0 的
x ( t 0 ) ,就得到状态空间中的一个初始点。随着时间的推移, x (t ) 将
在状态空间中描绘出一条轨迹,称为状态轨线。显然,这一轨线的形
3
状,完全由系统在 t 0 时刻的初始状态和 t≧t 0 的输入以及系统的动态
特性唯一决定的。状态向量的状态空间表示则将向量的代数结构和几
何概念联系了起来。
五、状态方程
描述系统状态变量与系统输入之间关系的一阶微分方程组称为状态
方程。
dy
图 1.1 中,若令 x1 y , x2 ,即取 x1、x2 为此系统的一
dt
组状态变量,则得一阶微分方程组:
dx1 dy
x2
dt dt
dx 2 d 2 y k dy 1 k 1
2 u x2 M u
dt dt M dt M M
即
x 1 0 1 x 0
1
x 0 k x 1 u (1.1)
2 M 2 M
式(1.1)即为该系统的状态方程,上式可简写成:
x A x bu
其中
0 1 0 x1
A k , b = 1 , x
0 M M x2
六、输出方程
描述系统的状态变量与输出变量关系的一组代数方程称为输出方程。
图 1.1 中,指定位移 y 为系统的输出,则有
y x1
x1
或 y 1 0 (1.2)
x2
式(1.2)即为该系统的输出方程,简写成
4
x1
c 1 0 , x
T T
yc x 其中
x2
状态方程和输出方程一道构成一个系统动态的完整描述,称为系统
的状态空间表达式。如式(1.1)和式(1.2)就是图 1.1 系统的状态空
间表达式。
下面举几个例子,进一步说明列写状态方程和输出方程的方法。
例 1.1 如图 1.2 所示的 R—L—C 网络,此系统有两个独立储能元
件电容 C 和电感 L,所以应有两个独立变量。现选 i 和 vC 为两个状态变
量,根据电学原理,可以写出两个含有状态变量的一阶微分方程:
R
+
i
u
vC
L
-
图 1.2
dvc
c i
dt
di
L Ri v c u
dt
即
1
v c i
c
i 1 v R i 1 u
L
c
L L
令
v c x1
i x2
5
并写成向量和矩阵形式,则状态方程为:
1
0 0
C x 1 u
x
1 R L
L L
若以 v c 为输出,则输出方程为:
y 1 0 x
例 1.2 如图 1.3 所示的水槽系统中,设水槽 1 的横截面积为 C1 ,水
位为 x1 ;水槽 2 的横截面积为 C 2 ,水位为 x2 , R1 、R2 、R3 为各导
管的液阻。试导出以 x1 、x2 为状态变量的状态方程和以 y1 、y2 为输出
量的输出方程。其中 u 为流入水槽 1 的流量(即单位时间内流进的水
量), y1 、 y2 为单位时间内流出的水量。
考虑水槽 1 的水量变化,包括 u 及水槽的水位差 ( x2 x1 ) 造成的
水量变化 ( x 2 x 1 ) / R 3 和从水槽流出的水量 y1 x1 / R1 ,可以得到:
dx1 x 2 x1 x1
c1 u
dt R3 R1
同理,对水槽 2 可以得到
dx 2 x1 x 2 x 2
c2
dt R3 R2
将上两式加以整理得到
C1 C2
1 2
x2
x1
R1 R3
R2
y1 y2
6
图 1.3
1 1 1 1
x 1 ( R C R C ) x1 R C x 2 C u
1 1 3 1 3 1 1
1 1 1
x 2 x1 ( ) x2
R3C 2 R2C 2 R3C 2
写成向量和矩阵形式,得到状态方程为:
1 1 1
( ) x1 1
x1 R1C1 R3C1 R3C1
x C1 u
1 1 1
2 ( ) x2 0
R3C 2 R2C 2 R3C 2
1 1
输出方程为: y1 x1 y2 x2
R1 R2
或写成矩形的形式,得输出方程为
1
0 x1
y1 R1
y
2 0 1
x
R2 2
Ra La w J
e0 eb f
ia
if= cost
图 1.4
在电枢控制型直流电动机中,只有电枢电感 La 和转子转动惯量
J 两个独立储能元件,因此,选择电枢电流 ia 和转速 w 为一组状态
变量,对于电枢回路有下面微分方程:
dia
La Ra ia eb e0 (电枢回路微分方程)
dt
其中 eb 是反电势,它与转速成正比:
7
eb k e w
其中 ke 为电动势常数[伏/弧度/秒]。假设负载转矩为零,对于转矩驱动
机械系统有下面微分方程:
dw
J f w k a ia (力学回路微分方程)
dt
其中 J [牛顿·米·秒 2]为转子的转动惯量, f [牛顿 ·米/弧度·秒-1]为
粘滞摩擦系数。将上述状态方程改写成:
di a R k 1
a ia e w e0
dt La La La
dw k a i f w
dt J
a
J
写成向量矩阵形式为: 以 w 为输出的输出方程为:
ia Ra
ke i
a 1
La i
K
La L e
y 0 1 a
f 0
a
w a w 0 w
J J
例 1.4 如图 1.5 所示的力学系统,作用外力为 u ,输出位移为 x .求
该系统的状态方程和输出方程。
k
u
x, v
图 1.5
此系统中位移 x 和速度 v 为两个独立的状态变量,根据牛顿定律有:
8
dv
m dt fv kx u
v dx
dt
经整理,得:
dv f k 1
dt v x u
m m m
dx v
dt
写成向量知阵形式为:
v f k v 1
m m m u
x 1 0 x 0
输出方程,由于
y x
v
故得 y 0 1
x
一般地,对于单输入--单输出系统,状态方程具有如下形式:
x 1 a11 x1 a12 x2 a1n xn b1u
x a x a x a x b u
2 21 1 22 2 2n n 2
(1.3)
x n an1 x1 an 2 x2 ann xn bn u
输出方程有如下形式:
y c1 x1 c2 x2 cn xn
用向量矩阵表示的状态空间表达式则为:
x A x bu
T (1.4)
y c x
x1
x
式中 x
2
xn
9
表示 n 维状态向量,矩阵
a11 a12 a 1n
a a 22 a 2 n
A
21
a n1 a n2 a nn
表示系统内部状态之间的联系,称为状态矩阵(或称系统矩阵,系数
矩阵),是 n×n 方阵;向量
b1
b
b
2
bn
表示输入对状态的作用,称为输入矩阵(或控制矩阵),它为 n×1
的列阵;向量
c c1 c2 cn
T
而输出方程,不仅是状态变量的组合,而且在特殊情况下,可以有输
入向量的直接传送,因而有以下一般形式:
y1 C11 x1 C12 x2 C1n xn d11u1 d1r ur
y C x C x C x d u d u
2 21 1 22 2 2n n 21 1 2r r
ym C m 1 x1 C m 2 x2 C mn xn d m 1u1 d mr ur
因而多输入―多输出系统状态空间表达式的向量矩阵形式为:
x A x B u
(1.6)
y C x Du
10
式中 x 和 A 与单输入系统一样,分别为 n 维状态向量和 n × n 状态矩
阵;
u1
u
u 2
ur
表示 r 维输入(或控制)向量;
y1
y
y
2
ym
表示 m 维输出向量;
b11 b12 b1r
b b b
B
21 22 2 r
bn1 bn 2 bnr
表示 n×r 输入(或控制)矩阵;
c11 c12 c1 n
c c22 C 2 n
C 21
cm 1 cm 2 cmn
表示 m×n 输出矩阵;
d 11 d 12 d 1r
d d 22 d 2 r
D
21
d m1 d m2 d mr
表示输入量的 m×r 直接传递矩阵。
综合上述分析,可以清楚地看出:状态空间的描述和经典控制理论
中的描述不同。状态空间描述了系统内部状态和输入、输出关系,而在
经典控制理论中描述的是输入输出之间的关系。因而状态空间描述揭
示了系统的内部联系,输入引起状态的变化,而状态的变化决定输出
的变化。输入引起状态的变化是一个运动过程,用微方程组来表示,
11
即状态方程。状态决定输出的变化则是一个变换过程,数学上表现为
一个变换方程,即代数方程。从上面分析还可以看到,系统状态变量
的个数等于系统所包含的独立贮能元件的个数。因此,一个 n 阶系统
有且仅有 n 个状态变量可以选择。对于简单的电路和力学回路,选择
独立的贮能元件的贮能变量,如电容端电压 v c ,电感中(或电枢中)
§1.2 系统按其状态空间表达式进行分类
通常,动态系统的状态、输入、输出可以都是向量,用 x (t ) 、u(t ) 、
y (t ) 来表示,其维数为 n、r、m 。系统本身常用方块图,如图 1.6
所示。 动态系统
输入 u(t) 输出 y(t)
状态
图 1.6
系统的状态空间描述,是其动力学性质的完整表达。因此,按其状
态空间表达式将系统分类,就能充分揭示它们在某些特性上的质的差
别。
一般的非线性、时变动态系统可以用下列状态变量形式的微分方
程和输出方程来描述。
x ( t ) f [ x ( t ), u( t ), t ]
(1.7)
y( t ) h[ x ( t ), u( t ), t ]
其中 f 和 h 是状态 x( t ) 和输入 u( t ) 的某类非线性函数。
如果(1.7)式中向量函数 f 、h 的元都是 x( t ) 和 u( t ) 的线性函数:
12
则称此系统为线性系统。对于线性系统其方程变为:
x ( t ) A( t ) x ( t ) B( t )u( t )
(1.8)
y( t ) C ( t ) x ( t ) D( t )u( t )
其中 A( t )、B ( t )、C ( t )、D( t ) 的元是时间 t 的函数,因此称此类系统
是线性时变系统。通常为了形象起见,式(1.8)代表的系统可以表示
为图 1.7。
D( t
)
x (t )
+
u(t) +
x(t )
B( t C( t
) + ) + y(t)
A( t
)
图 1.7
严格地说,一切物理系统都是非线性的,但是其中相当部分可以在
足够精度下,用线性系统来近似。和非线性系统相比,线性系统无论
在分析上或是在综合上都要简单得多。线性系统理论是现代控制理论
中内容最成熟应用最广泛的一个分支。
一个线性时不变系统是用下式来描述的:
x ( t ) A x ( t ) B u( t )
(1.9)
y ( t ) C x ( t ) D u( t )
其中 A 、B 、C 、D 为常数矩阵。时不变性的简单含义是系统参数不随时
间而变化。
式(1.9)所示的系统是本讲义主要研究的系统,在上节中已经指
出,因为输入输出都是向量,所以称为多变量(或多输入多输出)系
统。作为子集的标量系统(或单输入单输出系统)具有如下形式:
13
x ( t ) A x ( t ) bu( t )
T (1.10)
y( t ) c x ( t ) du( t )
式(1.10)也在上节出现过。
§1.3 单输入一一单输出系统的状态空间表达式
在状态空间分析中,首先要有由状态空间表达式所描述的系统数
学模型。这种数学模型一般可以从以下三个途径获得:一是从一般时
域描述化为状态空间表达式;二是从模拟结构图写出状态空间描述;
三是从系统的物理化学机理推出状态空间表达式。本节分别介绍由这
三种途径写出状态空间表达式。
一、由系统的时域描述写出状态空间表达式
对于一个单变量线性定常系统,在经典控制理论中它的运动方程
通常是一个 n 阶线性常系数微分方程:
y ( n ) a1 y ( n 1 ) a n 1 y a n y
b0 u( m ) b1 u ( m 1 ) bm 1 u bm u ( 1.11 )
其中 m ≦ n 。
上节中我们已经给出单变量线性定常系统的状态空间表达式为:
x A x bu
T (1.12)
y c x du
因此,化系统的一般时域描述(1.11)式为状态空间描述(1.12)式
的关键在于选择合适的状态变量,根据(1.11)式的系数 ai (i=1,2,
c T 、d 。
由高阶微分方程(或传递函数)出发来建立与之等效的状态空间表
达式的问题实际上是动态系统的实现问题,在第三章中将进一步讨论
这里只是将单变量系统微分方程化为某种特定形式的状态方程的方法
14
作一介绍。
1.方程(1.11)式中不含作用函数导数项
首先我们讨论最简单的情况,即在(1.11)中不含作用函数的各阶
导数的情况。显然(1.11)式可表示为如下形式
y ( n ) a1 y ( n 1 ) a n 1 y a n y bu ( 1.13 )
由式(1.13)可以看出,对于此系统,若已知初始条件 y(0) , y
(0) ,…, y (n-1) (0) 及 t ≥ 0 时的输入 u(t) ,则该系统在任何 t ≥0 时刻的
行为便可以确定。因此我们可以选取 y(t) , y (t),…, y (n-1) 这 n 个变量
为系统的一组状态变量,现记为:
x1 y
x y
2
x 3 y (1.14)
x n y ( n 1 )
进一步化高阶微分方程组(1.14)为一阶微分方程组,即:
x 1 y x 2
x y x
2 3
(1.15)
x n 1 y ( n 1 ) x n
x n y ( n ) a1 y ( n1 ) a 2 y ( n 2 ) a n y bu
a1 x n a 2 x n 1 a n x1 bu
由(1.14)式所示方程组中第一式可得系统的输出关系式为:
y x1
将上式化为向量矩阵形式:
x A x bu
T
y c x
15
0 1 0 0
0 0 x1
0 1 0 0 x
其中 A , b , x ,
2
0 0 0 1
an an 1 an 2 a1 b xn
c T 1 0 0 0 (1.16)
例 1.5 设系统的微分方程为:
y 7 y 14 y 10 y 5u
求系统的状态方程和输出方程。
解:选取状态变量为
x1 y
x2 y
x y
3
则得状态方程组
x 1 y x 2
x 2 y x 3
x y 10 x 14 x 7 x 5u
3 1 2 3
写成向量矩阵的形式:
x1 0 1 0 x 1 0
x 0 0 1 x 0 u
2 2
x 3 10 14 7 x 3 5
16
x1
y = [1 0 0] x 2
x 3
或简写为:
0 1 0 0
x 0 0 1 x 0 u
10 14 7 5
y 1 0 0 x
对于方程中含有作用函数导数项的情况,可按与上述相同的步骤
来推出相应的状态方程和输出方程。首先,我们来看一个三阶系统的
微分方程。
现希望将方程(1.17)变换成如下形式的状态方程
x1 0 1 0 x1 1
x 0 0 1 x u
2 2 2 (1.18)
x 3 a3 a2 a1 x 3 3
17
为此,定义
x 1 x2 1u
x 2 x3 2 u (1.19)
x a x a x a x u
3 3 1 2 2 1 3 3
以及
y x1 0 u (1.20)
于是问题就变成如何从系数 ai 和 b j 来求 0 、 1 、 2 、 3 。由式
(1.20)和(1.19)得:
y x2 0 u 1u ( 1.21 )
y x3 0 u
1u 2 u ( 1.22 )
y a x a x a x u u
3 1 2 2 1 3 0 1 2 u
3u ( 1.23 )
将它们与(1.23)式相加,就可得到:
y a1 y a2 y a3 y
a3 x1 a2 x2 a1 x3 0u 1u 2 u 3 u a1 x3 a1 0 u a1 1u
a1 2 u a2 x2 a2 0 u a2 1u a3 x1 a3 0 u
0u ( 1 a1 0 )u ( 2 a1 1 a2 0 )u ( 3 a1 2 a2 1 a3 0 )u
b0u b1u b2 u b 3 u
上式系数与(1.17)式系数相比,可得:
18
0 b0
b a
1 1 1 0
(1.24)
2 b2 a1 1 a2 0
3 b3 a1 2 a2 1 a3 0
不难看出,这里所选的一组状态变量是
x1 y 0 u
x 2 y 0 u 1 u
x y u
3 0 1 u
2u
y( n ) a1 y( n 1 ) a2 y( n 2 ) an 1 y an y
b0 u( n ) b1u( n 1 ) bn 1u bn u ( 1.25 )
为此,定义:
19
x1 x2 1u
x x u
2 3 2
(1.26)
x xn n 1 u
n 1
x n an x1 an 1 x2 a1 xn n u
以及
y x1 0 u (1.27)
由式(1.26)和(1.27)可得
y x1 0 u
y x u u
2 0 1
y x3 0 u 1u 2 u ( 1.28 )
y( n 1 ) xn 0 u( n 1 ) 1u( n 2 ) n 2 u n 1u
y( n ) an x1 an 1 x2 a1 xn 0 u( n ) 1u( n 1 ) n 1u n u
加,得:
y ( n ) a1 y ( n1 ) a 2 y ( n 2 ) a n1 y a n y
0 u ( n ) ( 1 a1 0 )u ( n1 ) ( 2 a1 1 a 2 0 )u ( n 2 ) ( n1
a1 n 2 a n 2 1 a n1 0 )u ( n a1 n1 a n1 1 a n 0 )u
b0 u( n ) b1u( n 1 ) bn 1u bn u
20
0 b0
b a
1 1 1 0
2 b2 a1 1 a2 0 (1.29)
n bn a1 n 1 an 1 1 an 0
将(1.26)化为向量矩阵的形式为:
x1 0 1 0 0 x1 1
x 0 x
0 1 0 2 2
2
u (1.30)
0 0 0 1
x n an an 1 an 2 a1 xn n
x1
x
0] 0 u
2
y [1 0 0
xn
例 1.6 已知系统的输入一一输出微分方程为:
求系统的状态方程和输出方程。
解:因该方程的系数 ai 和 b j 分别为
a1 = 6 , a2 = 11, a3 = 6
21
b0 = 1, b1 = 8 , b2 = 17, b3 = 8
由式(1.29)得
0 b0 1
b a 8 6 1 2
1 1 1 0
2 b2 a1 1 a2 0 17 6 2 11 1 6
3 b3 a1 2 a2 1 a3 0 16
22
再由式(1.30)可得状态方程和输出方程
0 10 2
x 0 0 1 x 6 u
6 11 6 16
y [1 0 0] x u
3.线性时变系统的状态空间表达式
上面对线性定常系统的讨论,其方法也可以推广到线性时变系统,
设有如下的线性时变系统:
y( n ) a1 ( t ) y( n 1 ) an 1 ( t ) y an ( t ) y
(1.31)
b0 ( t )u (n)
b1 ( t )u ( n1 )
bn ( t )u
式仿照线性时不变系统的情况,我们可以导出
x1 x2 1 ( t )u
x x ( t )u
2 3 2
( 1.32 )
x xn n 1 ( t )u
n 1
x n an ( t ) x1 an 1 ( t ) x2 a2 ( t ) xn 1 a1 ( t ) xn n ( t )u
和 y x1 0 ( t )u
其中 i ( t ) ( i 0 ,1, , n ) 的计算式,相应地为:
23
0 (t ) b0 (t )
i 1 i k
( n l i )!
l ! ( n i )! ai k l ( t ) k ( t )
l
i ( t ) bi ( t )
k 0 l 0 (1.33)
( i 1,2 , n )
显然,状态变量的表达式因 ai ( t ) 、 b j ( t ) 是时变的而远较时不变系统
要复杂得多,写为:
x1 ( t ) y 0 ( t )u
x 2 ( t ) y 0 ( t )u [ 1 ( t ) 0 ( t )]u (1.34)
x 3 ( t ) y 0 ( t )u [ 1 ( t ) 2 0 ( t )]u [ 2 ( t ) 1 ( t ) 0 ( t )]u
将(1.32)表示为向量矩阵形式,即可变为如下形式:
x1 0 1 0 0 x1 1 ( t )
x
2 0 0 1 0 x2 2 ( t )
u
0 1
0 0
x n an ( t ) an 1 ( t ) a1 ( t ) xn n ( t )
x1
x
y [1 0 0 0] 0 ( t )u
2
(1.35)
xn
必须指出,无论是时变系统还是定常系统,在由高阶微分方程化为
状态空间表达式时,通常可采用不同的方法来组成不同的状态变量组
24
从而导出不同形式的状态方程和输出方程,上面介绍的只是其中的一
种。
二、由模拟结构图写出状态方程
在状态空间分析中,利用模拟计算机的模拟结构图能充分反映状
态变量间的相互关系,对建立状态空间表达式很有帮助。
下面介绍的几种方法是由微分方程(或传递函数)画出模拟结构
图,再写出状态方程。由模拟结构图写出状态方程的方法往往使我们
得到几种有用的特殊的状态方程的实现形式,称标准型。至于这些标
准型的特殊含义我们将以后陆续介绍,这里只要了解这几种标准型的
名称和对应的状态方程的形式即可。
1、能控标准 I 型
为了方便起见,先来看一个三阶微分方程:
其传递函数如下:
b0 S 3 b1 S 2 b2 S b3
g( s )
S 3 a1 S 2 a2 S a3
25
上式可变换为
y( s )
g( s )
u( s )
( b1 a1b0 )S 2 ( b2 a2b0 )S b3 a3 b0
b0
S 3 a1 S 2 a2 S a3
1 2 3
(1.37)
( b1 a1b0 )S ( b2 a2b0 )S ( b3 a3b0 )S
b0
1 a1 S 1 a2 S 2 a3 S 3
1
e( s ) 1
u( s )
1 a1 S a2 S 2 a3 S 3
(1.39)
26
b0
b1-a1b0
+
x3 b2-a2b0
u + e x2 x1
+ +
b3-a3b0
+ + y
-a1
-a2
-a3
图 1.8 能控标准Ⅰ型
在图 1.8 上设置状态变量,则得状态空间表达式为:
x 1 x 2
x x
2 3
x 3 a 3 x1 a 2 x 2 a1 x 3 u
y ( b3 a 3 b0 ) x1 ( b2 a 2 b0 ) x 2 ( b1 a1 b0 ) x 3 b0 u
( 1.40
将(1.40)写成矩阵形式:
x1 0 1 0 x1 0
x 0 0 1 x2 0 u
2
x 3 a3 a2 a1 x3 1
27
x1
y [(b3 a 3 b0 ) (b2 a 2 b0 ) (b1 a1b0 )] x 2 b0 u (1.41)
x 3
上述这种方法有人称为直接程序法。
将(1.41)扩大到 n 阶系统,得:
x 1 0 1 0 0 x1 0
x 0 0 1 0 x2 0
2
u (1.42)
x n 1 0 0 0 1 x n 1 0
x n an an 1 an 2 a1 xn 1
器规范型。(吴:第二可控规范型)
2、能观标准 I 型
仍从三阶系统(1.36)式出发,其传递函数为:
b0 S 3 b1 S 2 b2 S b3
g( s ) 3 (1.43)
S a1 S 2 a2 S a3
0
试采用图 1.9 的模拟结构图来实现它,图中的 0 、 1 、 2 、 3 是待求的。
1
2
+ y
x3 x2 x1
u + + + + +
3
+
+
-a1
28
-a2
-a3
图 1.9 能观标准 I 型
在图 1.9 上设置状态变量,得到这种结构下的状态空间表达式:
x1 x2 1u
x x u
2 3 2
(1.44)
x 3 a3 x1 a2 x 2 a1 x3 3 u
y x1 0 u
式(1.44)的形式即为上面见过的(1.19)式,这里的待求量 0 ,
1 , 2 , 3 可见(1.24)式求出,即为
0 b0
b a
1 1 1 0
(1.45)
2 b2 a1 1 a2 0
3 b3 a1 2 a2 1 a3 0
系数公式(1.45)多少有点不方便,特别是阶数高时更是如此,可以
给出如下更加紧凑的系数表达式:
29
1 0 0 0 0 b0
a
1 0 0 1 b1
1 (1.46)
a2 a1 1 0 2 b2
a3 a2 a1 1 3 b3
将式(1.44)写成向量矩阵的形式为:
x1 0 1 0 x1 1
x 0 0 1 x2 2 u
2 (1.47)
x 3 a3 a2 a1 x3 3
x1
y [1 0 0] x 2 0 u
x 3
扩展到 n 阶系统,其状态空间表达式为:
x1 0 1 0 0 x1 1
x x
2 0 0 1 0 2 2
u
x n 1 0 0 0 1 xn 1 n 1
x n an an 1 an 2 a1 x n n
x1
y [1 0 0 0] 0 u (1.48)
xn
式中:
30
0 b0
b a
1 1 1 0
2 b2 a1 1 a2 0 (1.49)
n bn a1 n 1 an 1 1 an 0
或记为:
1 0 b0
a 1 0 b
1 1 1
a 2 a1 1 2 b2
(1.50)
a n a n 1 a n 2 1 n bn
能观标准 I 型,也称能观测性规范型(吴:第一可观规范型)。显然这
种形式我们在(1.30)式中已见到过。
3、能控标准 II 型
为了方便,我们仍以三阶系统出发,将(1.36)式重写如下:
+
0
+
1
现在采用图 1.10 所示的模拟结构来实现它,图中的 0 、 1 、 、 3 是
+ 2
2
x1
待定的。
+ + x2 x3
+ +
3 y
u +
+ + + y
在图 1.10 中设置状态变量,得到这种结构下的状态空间表达式:
x 1 a 3 x 3 u
x 2 x1 a 2 x 3 (1.52)
x x a x
3 2 1 3
以及
y 1 x1 2 x 2 3 x 3 0 u (1.53)
(1.52)、(1.53)可得
y 1 x 1 2 x 2 3 x 3 0 u
(1.54)
2 x1 3 x2 ( a3 1 a2 2 a1 3 ) x3 1u 0 u
y 2 x 1 3 x 2 ( a 3 1 a 2 2 a1 3 ) x 3 1 u 0 u
3 x1 ( a 3 1 a 2 2 a1 3 ) x 2 [( a 3 1 a 2 2 a1 3 )a1
a 3 2 a 2 3 ] x 3 2 u 1 u 0 u
32
(1.55)
y 3 x 1 ( a3 1 a2 2 a1 3 ) x 2 [( a3 1 a2 2 a1 3 )a1
a3 2 a2 3 ] x 3 2 u 1u 0u
( a3 1 a2 2 a1 3 ) x1 [( a3 1 a2 2 a1 3 )a1 a3 2 (1.56)
a2 3 ] x2 [( a3 1 a2 2 a1 3 )a2 a3 3 a1 ( a3 1 a2 2
a1 3 )a1 a3 2 a2 3 ] x3 2 u 1u 0u
(1.56)相加,于是得:
y a1 y a 2 y a 3 y
0u ( 1 a1 0 )u
( 2 a1 1 a 2 0 )u
( 3 a1 2 a 2 1 a 3 0 )u
b0u b1 u
b2 u b3 u
由此得:
0 b0
1 b1 a1 0
(1.57)
2 b2 a1 1 a 2 0
3 b3 a1 2 a 2 1 a 3 0
可见待定系数的计算和能观标准 I 型的待定系数的计算是相同的(见
(1.24)式)。将式(1.52)、(1.53)写成向量矩阵的形式则为:
x 1 0 0 a 3 x1 1
x 0 u
x
1 0 a (1.58)
2 2 2
x 3 0 1 a1 x 3 0
y 1 2 3 x 0u
33
将(1.58)扩展到 n 阶系统,则得:
x 1 0 0 0 an x1 1
x 2 1 0 0 an 1 x2 0
x 3 0 1 0 a n 2 x 3 0 u
(1.59)
x 0 0 1 a1 xn 0
n
y [1 2 n ]x 0u
和式(1.48)比较,可以发现,(1.59)式的状态矩阵是(1.48)
相应的状态矩阵的转置,而输入矩阵为(1.48)式输出矩阵的转置,输
出矩阵为(1.48)式输入矩阵的转置。我们将(1.59)、(1.48)两式称
式的系统称为能控标准 II 型,也称能控性规范型(吴:第一可控规范
4、能观标准 II 型
同样以三阶系统为例,将(1.36)式传递函数重写如下:
y( s ) b0 S 3 b1 S 2 b2 S b3
3
u( s ) S a1 S 2 a 2 S a 3
b0 b1 S 1 b2 S 2 b3 S 3
(1.60)
1 a1 S 1 a 2 S 2 a 3 S 3
34
则
y( s ) a1 S 1 y( s ) a2 S 2 y( s ) a 3 S 3 y( s )
b0 u( s ) b1 S 1u( s ) b2 S 2 u( s ) b3 S 3 u( s )
进一步
b3 b2 b1 b0
+
x1 x2 x3 y
+ + +
+ +
+ + + +
图 1.11 能观标准 II 型
出方程:
35
x1 a3 ( x3 b0 u ) b3 u
x 2 x1 a2 ( x3 b0 u ) b2 u
x x a ( x b u ) b u
3 2 1 3 0 1
y b0 u x3
将上式加以整理得:
x1 a3 x3 ( b3 a3b0 )u
x 2 x1 a2 x3 ( b2 a2b0 )u
x x a x ( b a b )u
3 2 1 3 1 1 0
y b0 u x 3
将上式写成向量矩阵式得:
x 1 0 0 a 3 x1 ( b3 a 3 b0 )
x
1 0 a x
( b a b )u (1.62)
2 2 2 2 2 0
x 3 0 1 a1 x 3 ( b1 a1 b0 )
y [0 0 1] x b0 u
上述这种方法称多层积分法。将上式扩展到 n 阶系统
x1 0 0 0 an x1 ( bn anb0 )
x 1 0 0 an 1 x2 ( bn 1 an 1b0 )
2
x 3 0 1 0 an 2 x3 ( bn 2 an 2b0 ) u (1.63)
x n 0 0 1 a1 xn ( b1 a1b0 )
y [0 0 0 1] x b0 u
36
同样我们可以看到(1.63)式和(1.42)式在形式上是对偶的,即能
范型(吴:第二可观规范型)。
5、约当标准型
将传递函数展开成部分分式,根据此部分分式画出其模拟结构图,
然后由此模拟结构图写出的状态空间表达式是具有一定特点的某种标
准型。
设单输入一一单输出系统的传递函数如下:
b0 S n b1 S n1 b2 S n 2 bn 1 S bn
g( s ) (1.64)
S n a 1 S n 1 a 2 S n 2 a n 1 S a n
由于系统的特征值有两种情况,一是所有的特征值都是两两相异的;
一是有些特征值是相同的。以下分两种情况分别讨论。
(1)设(1.64)式具有两两相异的特征值 1 、 2 、 n ,则 g(s)可展
开成如下部分分式:
y( s ) 1 2 n
g( s ) (1.65)
u( s ) s 1 s 2 s n
其中 i slim ( s i ) g( s ) i 1 ,2 , , n (1.66)
i
37
而
n
i
y( s ) u( s ) u( s ) i 1,2 , , n (1.67)
i 1 s i
的显著特点是积分器不再是前后串联形式而是并联形式。取状态变量
如图 1.12 所示,则状态方程和输出方程可表示为:
1 0 0 1
0 2 0 1
x x u (1.68)
0 0 n 1
y [ 1 2 n ] x u
1 0 0 1
0 0 x 2
2 +
x x u 1
(1.69)
+ 1
0 0 +
n x n
1
2
2
y [1 1 + 1] x u 2
+ + y
u
………..
+ +
+ xn
n
+
n
38
(a) + Xn X1
+ x1
1
+
1
+ x2
2
+
2
u + + y
………….
+
+
图 1.12 对角标准型
+ xn
n
+
式(1.68)和式(1.69)是互为对偶的,两式的系数矩阵
A 均为对
n
角矩阵,对角线上各元素是互异的 n 个特征值。故称为对角线标准型
(b)
或解耦标准型,即变量之间不存在耦合关系。广义地说,它是属于下
面介绍的约当标准型。
(2)考虑式(1.64)的特征方程式具有重根的情况。此时,也可以象
下面那样用部分分式展开。为了简单起见,设 1 为三重根, 4 ~ n 为
39
互异的根,于是得到
11 12 13 4 n
g ( s) (1.70)
( S 1 ) 3 ( S 1 ) 2 ( S 1 ) S 4 S n
其中
11 lim [( S 1 ) 3 g ( s )]
S 1
d [( S 1 ) 3 g ( s )]
12 lim [ ]
S 1 dS
(1.71)
1 lim [ d [( S 1 ) g ( s )] ]
2 3
13 2! S 1 dS 2
lim [( S i ) g ( s )] ( i 4,5, , n)
i S i
构中,重根分式采取积分器的串联形式,其余的采用积分器并联形式
设置状态变量如图所示,则相应的状态空间表达式为:
x3 x2 x1
1 1 1 11
s 1 s 1 s 1
12
13 +
x4
1
+
u(s) +
y(s)
s 4 4 +
+
+
xn
1 n 40
s n
δ
图 1.13 约当标准型
x 1 1 x1 x2
x x x
2 1 2 3
x 3 1 x3 u
x 4 4 x4 u
x n n xn u
y 11 x1 12 x2 13 x3 4 x4 n xn u
写成向量矩阵的形式
x 1 1 1 0 0 0 x1 0
x
2 0 1 1 0 0 x2 0
x 3 0 0 1 0 0 x3 1
u
x 4 0 0 0 4 0 x4 1 (1.72)
x n 0 0 0 0 0 n xn 1
y [ 11 12 13 4 n ]x u
式(1.72)称为约当标准型。式中系数矩阵 A 中对应于重特征根
虚线框块称为约当块。约当块的特点是主对角元素是特征值,主对角
41
线左下方的元素都为零,主对角线右上面,紧靠重根的元素全为 1,
1 1 0
0 1
1 0
0 0 1
A 2 1
0 2
0 3 0
0 4
其中有两个约当块,每个从属于一个特征值。
例 1.7 已知系统的传递函数为
3( S 1 )
g( s ) (1.73)
S 3 4S 2 3S 3
对于(1.73)式,我们可以应用前述方法中的任何一种写出它的状态
空间表达式。熟练之后,可以不必画出状态变量图,而直接由式
(1.73)列写方程。上式中
a1 4 , a2 3 , a3 3
b0 0 , b1 0 , b2 3 , b3 3
能控标准 I 型为(吴:第二可控规范型):
42
x 1 0 1 0 x1 0
x2
0 0 1 x 2 0 u
x 3
3 3 4 x 3 1
x1
y 3 3 0 x 2
x 3
而能观标准 II 型(吴:第二可观规范型)为上式的对偶形式,即为
x1 0 0 3 x1 3
1 0
x 2 3 x2 3u
x3
0 1 4 x3 0
x1
y 0 0 1 x2
x3
能控标准 II 型(吴:第一可控规范型),则根据(1.59)式写出:
x1 0 0 3 x1 1
x 2 1 0 3 x2 0 u
x3 0
1 4 x3 0
x1
y [0 3 9] x2
x3
上式的对偶形式即为能观标准 I 型(吴:第一可观规范型):
x1 0 1 0 x1 0
x2 0 0 1 x2 3 u
x 3 3 3 4 x3 9
x1
y 1 0 0 x 2
x3
43
通常能控标准 I 型,能观标准 II 型用得较多,以后如不加特殊说明,
能控标准型就是指其 I 型,而能观标准型就是指其 II 型。
例 1.8 设系统的传递函数为
s 2 3s 2 1/ 6 2/ 3 3/ 2
g( s )
s( s 2 7 s 12 ) s s3 s4
程及输出方程为:
x1 1
6
u y
+
x2 2 +
+
+
3
+
-3
+ x3 3
图 1.142
+
-4
x1 u
x 2 3 x2 u
x 4 x u
3 3
1 2 3
y x1 x 2 x 3
6 3 2
写成向量矩阵形式即为
0 0 0 1
x 0 3 0 x 1 u
0 0 4 1
44
1 2 3
y [ ]x
6 3 2
必须指出,当系统的描述是以方块图给出时,不必算出其总的传
递函数就可直接导出相应的状态空间表达式。下面,我们举例说明此
方法。
y 为输出,u 是输入。导出相应的状态空间表达式。
ki
第一步是把各环节的传递函数化为最简形式 ( ) 的组合,于
S Pi
是图(a) 可化为图(b)。第二步是把具有简单函数相加的环节化为
单元方块的并联,把具有简单函数相乘的环节化为单元方块的串联,
从而将图(b)转化为图(c)。第三步,在图(c)上设置状态变量,
并列出状态方程和输出方程。
u
+ s z1 k
y
- s p1 ( s p2 )( s p3 )
(a)
u +
z P 1 k
1 1 1 y
- s p1 s p2 s p3
(b)
u +
z1 P1 x3
+
1 x2 k x1
y
s p1 +
s p2 s p3
-
45
(c)
图 1.15
x1 p3 x1 kx2
x 2 p2 x2 x3 u x1 x1 p2 x2 x3 u
x P x ( u x )( Z P ) ( P Z ) x P x ( Z P )u
3 1 3 1 1 1 1 1 1 1 3 1 1
y x1
写成矩阵向量的形式即为
P3 k 0 0
x 1 P2 1 x 1 u
( P1 Z 1 ) 0 P1 Z 1 P1
y [1 0 0] x
例 1.9 写出图 1.16(a)所示系统的状态方程和输出方程。
首先把前向通路的二阶传递函数表示为两个一阶传递函数的串联
如图 1.16(b)所示,然后在图 1.16(b)上设置状态变量,并根据图
1.16(b)写出状态空间表达式。
u
+
3 y
- (a) s( s 2 )
1
s 1
u + 3 x2 1 x1
y
- s3 s (b)
图 1.16
x3 1
s 1
46
x 1 x 2
x 3 x 3( x u)
2 2 3
x 3 x 3 x1
y x1 整理并写成向量矩阵形式为:
0 1 0 0
x 0 3 3 x 3 u
1 0 1 0
y [1 0 0] x
三、通过系统的物理机理直接写出系统的状态空间表达式
状态空间表达式也可以直接由物理系统写出。我们已在§1.1 中举
出了许多个例子。这里进一步举例说明。
置摆,因为用一个外力 u(t)保持摆直立不倒的问题和手握摆杆维持平
衡很相似,所以通常称之为自动搜索平衡车。为了简化,设车与摆只
在一个平面内运动,并且忽略杆的质量、电机本身的动态摩擦、风力等
因素,但保留问题的实质。很显然,系统本来是不稳定的,因为如果
不加控制力,杆必然会倒下来。
小车的位置为 Z。则本系统的动态特征可用小车的位移和速度及单摆的
角位移和角速度来完整地描述。其状态向量为:
47
Z ( t )
Z ( t )
x(t ) (1.74)
( t )
( t )
L
mg
u
图 1.17
为了确定系统的微分方程,首先应注意小车的水平位置是 Z,此
Mg
时摆心的位置是 Z+L Sin 。这样,在水平方向根据牛顿第二定律:
d 2Z d2
M 2 m 2 ( Z LSin ) u (1.75)
dt dt
同样的定律也可以用摆的质量,在垂直于摆杆方向可得:
这些微分方程是非线性的,需要进行简化。由于控制本系统的目的是
保 持 单 摆 直 立 , 因 此 可 假 设 ( t ) 和 ( t ) 接 近 于 零 。 因 此 ,
48
( M m ) Z mL u ( 1.77 )
Z L g ( 1.78 )
Z (s) 1 S2 g
g( s ) L
m (1.79)
u( s ) M
S 2 [ S 2 (1 ) g ]
M L
方程(1.77)、(1.78)两式对 Z 和
联立求解得:
mg 1
Z u
M M
(1.80)
( M m ) g 1 u
ML ML
如果把恒等式
dZ d
Z
dt dt
也包括在内,就可以用状态变量形式表示这些关系:
0
Z 0 1 0 0 Z
mg 1
d Z 0 0
M
0 Z
M u
(1.81)
dt 0 0 0 1 0
(m M ) g
0 0 0 1
ML ML
若以 y 表示输出(即为位移 Z)则输出方程为:
Z
Z
y [1 0 0 0]
49
若 M = 1kg , m = 0.1kg , L = 1m , g = 9.81m/sec2 , 并 用
x [Z Z ]T 来表示状态向量,y 表示输出,则(1.81)式变
为:
0 1 0 0 0
0 0 1
0 1
x x u (1.82)
0 0 0 1 0
0 0 11 0 1
y 1 0 0 0 x
这是状态变量形式的线性化微分方程组,当 很小时,本方程确
定了自动搜索平衡装置的动态特性。在以后各章将研究这种系统的各
种性质和控制方法。
§1.4 多输入一一多输出系统的状态空间表达式
到目前为止,我们所研究的系统全是单输入单输出的系统,但很
多系统是多输入和多输出的。
1 x1 +
y1
u1 s a1 +
1 x3 +
s a3 +
y2
1 x2
u2 s a2
图 1.18
1 x4 50
s a4
由图 1.18 可写出系统方程为:
1 1
y1 ( s ) S a1 S a2 u1 ( s )
y ( s ) 1
1 u2 ( s )
2
S a3 S a4
简写成
Y ( s ) G ( s )u( s )
其中 G(s)称为传递函数矩阵。
空间表达式:
x 1 a1 x1 u1
x a2 x 2 u2
2
x 3 a3 x 3 u1
x 4 a4 x4 u2
y1 x1 x 2
y2 x 3 x 4
其矩阵形式为
x1 a1 0 0 0 x1 1 0
x
2 0 a2 0 0 x2 0 1 u1
x 3 0 0 a3 0 x3 1 0 u2
a4 x4 0
x 4 0 0 0 1
x1
y1 1 1 0 0 x2
y 0 0 1 1 x3
2
x4 51
这是一个具有两个输入量和两个输出量的系统,并有四个状态变量。
例 1.12 已知系统的传递函数矩阵为
2S 5 2S 2 7 S 7
2
G ( s ) S 25 S 6 S 3 6 S 2 11S 6
3 S 12 S 11 S 1
S 3 6 S 2 11S 6 2
S 5S 6
要求写出其状
态空间表达式。
初看起来,相应的形式应当如图 1.19(a)所示,它需要两个三阶
传递函数 g12(s)和 g21(s),两个二阶传递函数 g11(s)和 g22(s)。这里共有十
个状态变量。相应地需要十个单独的积分器。实际上状态变量的数目可
以减少。这里引进一个概念——最小实现。所谓最小实现简单地说就是
用最少积分器的实现。有关最小实现的问题下面还会碰到。为了得到最
小实现,一般的做法是将 G(s)按部分分式展开。下式是一般的形式:
1 x1
s 1
u1
y1(s)
-
1 x2 + +
y1
u1 g11(s) +
+
+ s2 +
g12(s)
g21(s) u2 + 1 +
2 y2
s3
u2 + x3 +
y2(s) + +
g22(s) +
1 x4
(a)
s 1
(b)
52
图 1.19
1 1 1
G( s ) R1 R2 RP (1.83)
S 1 S 2 S P
其中 1 , 2 , P 是各传递函数元素的极点; R1 , R2 , RP 是极点的留数
u1 ( s )
u ( s )
1
y( s ) [r k 1 , r k 2 , r kr ] 2 (1.84)
S K
ur ( s )
1
如果 R K 是满秩的,将有 r 个独立的列,需要 r 个独立的 的描述,
S k
1
如果 R K 不满秩,则需要较少的描述,其中每一个 的描述与独
S k
立的列对应。
本题的传递函数部分分式展开式为:
s 1 2 s 1 3 1
s 1
s 1 2 2
s3
G( s ) 1 1
s 1 s 2 s 3 s 2 3
1 1
s2
1 0 1 1 1 1 1 1 2
S 1 1 0 S 2 1 1 S 3 1 2
R1 R2 R3
53
所以
u ( s ) 1 u2 ( s ) 1 1
y( s ) G ( s ) 1
u ( s )
S 1 u ( s )
S 2 1 u1 ( s ) u2 ( s )
2 1
1 1
u1 ( s ) 2u2 ( s )
S 3 1
由 上 式 可 画 出 图 1.19 ( b ) , 显 然 这 个 描 述 仅 含 四 个 状 态 变 量
x1、x2、x3、x4,由图可直接写出状态空间表达式:
1 0 0 1
2 1 1
x x u
3 1 2
0
1 1 0
1 1 1 0
Y x
0 1 1 1
其中
x1
x
u
x u 1
2
x3 u2
x4
可见实现的状态变量数目由原来的十个减少到四个。上述实现实
际上就是一个最小实现,是否是最小实现是可以检验的,以后我
们将会涉及。
例 1.13 设给定的多输入多输出系统为如下微分方程组的形式:
54
y1 a1 y1 a2 y2 b1u1 b2 u1 b3 u2
(1.85)
y 2 a3 y2 a4 y1 b4 u2
式(1.85)的实现也是非唯一的,现采用模拟结构图的方法。首先按最
高阶导数求解。
y1 a1 y1 b1u a2 y2 b2 u1 b3 u2
y 2 a3 y2 a4 y1 b4 u2
对每一个方程积分,得:
y1 [( a 1 y 1 b1 u 1 ) a 2 y 2 b2 u1 b3 u2 ]dt 2
[( a 1 y1 b1 u1 ) (b2 u1 b3 u2 a 2 y 2 )dt ]dt
y 2 ( a 3 y 2 a 4 y1 b4 u2 )dt
b1
u1 + x2 + x1
b2 y1
+ + + +
-a2 -a1
b3
) -a4
u2 + + x3
b4 y2
+
-a3
图 1.20
x 1 a1 x1 x 2 b1 u1
x 2 a 2 x 3 b2 u1 b3 u2
x a x a x b u
3 4 1 3 3 4 2
y1 x1
y2 x3
写成向量矩阵形式
55
x1 a1 1 0 x1 b1 0
x 0 u
2 0 a2 x2 b2 b3 1
u
x 3 a4 0 a3 x3 0 b4 2
x1
y 1 1 0 0
y 0 0 1 x 2
2
x3
§1.5 离散时间系统的状态空间表达式
连续时间系统的状态空间表达法也可以推广到离散时间系统。在连
续时间系统中,可以从微分方程或传递函数来建立状态空间表达式。
而在离散系统中,可以从差分方程或脉冲传递函数来建立离散状态空
间表达式。
设离系统的差分方程为:
y( k n ) a1 y( k n 1 ) a n 1 y( k 1 ) a n y( k )
(1.86)
b0 u( k n ) b1 u( k n 1 ) bn u( k )
相应地脉冲传递函数为:
b0 Z n b1 Z n 1 bn 1 Z bn
G( z ) n (1.87)
Z a1 Z n 1 an 1 Z an
实现的任务就是确定一种状态空间表达式
x ( k 1) G x ( k ) hu( k )
T (1.88)
y ( k ) c x ( k ) du( k )
式(1.88)可以用方块图 1.21 来表示,图中 Z-1 代表右移算子,类似于
连续系统中的积分算子。
d
图 1.21
56
当然离散状态空间表达式也可以直接由连续系统离散化获得(见
§2.3)或由离散物理系统直接建立。
一、由差分方程导出离散状态方程
由差分方程(即时域模型)导出离散状态方程和连续系统类似,同
样可分两种情况讨论。
1、 差分方程作用函数中不包含高阶差分的情况。
差分方程作用函数中不包含高阶差分时,(1.86)式可以写成:
y( k n ) a1 y( k n 1 ) an1 y( k 1 ) an y( k )
(1.89)
bu( k )
选取各采样时刻的 y( k ) , y( k 1 ) , y( k n 1 ) 为 n 个状态变量,
即令
x1 ( k ) y( k )
x ( k ) y( k 1 )
2
(1.90)
x n ( k ) y( k n 1 )
根据(1.89)、(1.90)两式可得:
x1 ( k 1 ) x 2 ( k )
x ( k 1 ) x ( k )
2 3
( 1.91 )
x ( k 1) x ( k )
n 1 n
xn ( k 1 ) y( k n ) an x1 ( k ) an 1 x2 ( k ) a1 xn ( k ) bu( k )
而 y( k ) x1 ( k ) , 从而(1.91)式可写成:
x1 ( k 1 ) 0 1 0 0 x1 ( k ) 0
x ( k 1)
2 0 0 1 0 x2 ( k ) 0
u( k )
xn 1 ( k 1 ) 0 0 0 1 xn 1 ( k ) 0
xn ( k 1 ) an an 1 an 2 a1 xn ( k ) b
y ( k ) 1 0 0 0 x ( k ) (1.92)
2、差分方程作用函数中包含高阶差分的情况
首先来考察一个三阶差分方程
57
y( k 3 ) a1 y( k 2 ) a 2 y( k 1 ) a 3 y( k )
b0 u( k 3 ) b1 u( k 2 ) b2 u( k 1 ) b3 u( k )
希望将上述三阶差分方程变成如下形式的三阶状态方程:
x1 ( k 1 ) 0 1 0 x1 ( k ) h1
x ( k 1 ) 0 0 1 x2 ( k ) h2 u( k )
2
x3 ( k 1 ) a3 a2 a1 x3 ( k ) h3
y( k ) x1 ( k ) h0 u( k )
即定义:
x 1 ( k 1 ) x 2 ( k ) h1 u( k )
x 2 ( k 1 ) x 3 ( k ) h2 u( k )
x ( k 1 ) a x ( k ) a x ( k ) a x ( k ) h u( k )
3 3 1 2 2 1 3 3
以及 y( k ) x1 ( k ) h0 u( k ) (a)
于是问题变成如何从系数 ai, bj 求 h0, h1, h2, h3。由上两式可知:
y( k 1 ) x1 ( k 1 ) h0 u( h 1 )
x 2 ( k ) h0 u( k 1 ) h1 u( k ) (b)
y( k 2 ) x 2 ( k 1 ) h0 u( k 2 ) h1 u( k 1 )
x 3 ( k ) h0 u( k 2 ) h1 u( k 1 ) h2 u( k ) (c)
y( k 3 ) x 3 ( k 1 ) h0 u( k 3 ) h1 u( k 2 ) h2 u( k 1 )
a3 x1 ( k ) a2 x2 ( k ) a1 x3 ( k ) h0 u( k 3 ) h1u( k 2 )
(d)
h2 u( k 1 ) h3 u( h )
以上式(a),(b),(c),(d)分别乘以 a3、a2、a1、1,并相加得
y( k 3 ) a1 y( k 2 ) a2 y( k 1 ) a3 y( k )
h0 u( k 3 ) ( h1 a1h0 )u( k 2 ) ( h2 a1h1 a2 h0 )u( k 1 )
( h3 a1h2 a2 h1 a3 h0 )u( k )
b0 u( k 3 ) b1u( k 2 ) b2 u( k 1 ) b3 u( k )
h0 b0
h1 b1 a1 h0
由此可得:
h2 b2 a1 h1 a 2 h0
h3 b3 a1 h2 a 2 h1 a 3 h0
不难看出,这里所选的一组变量是:
58
x1 ( k ) y( k ) h0 u( k )
x 2 ( k ) y( k 1 ) h0 u( k 1 ) h1 u( k )
x ( k ) y( k 2 ) h u( k 2 ) h u( k 1 ) h u( k )
3 0 1 2
上面以三阶为例的状态方程可以推广到一般情况。n 阶差分方程为:
y( k n ) a1 y( k n 1 ) a n 1 y( k 1 ) a n y( k )
(1.93)
b0 u( k n ) b1u( k n 1 ) bn u( k )
和连续系统类似,我们选择
x1 ( k ) y ( k ) h0 u( k )
x 2 (k ) x1 ( k 1) h1 u( k )
x 3 (k ) x 2 ( k 1) h2 u( k ) (1.94)
x n (k ) x n 1 ( k 1) hn 1 u( k )
其中,待定系数 h0、h1、 , hn 的计算关系式为
h0 b0
h1 b1 a1 h0
h2 b2 a1 h1 a 2 h0 (1.95)
hn bn a1 hn1 a n1 h1 a n h0
由式(1.93)和(1.94)即可导出
x1 ( k 1 ) x 2 ( k ) h1 u( k )
x ( k 1 ) x ( k ) h u( k )
2 3 2
x ( k 1 ) x ( k ) h u( k )
n 1 n n 1
x n ( k 1 ) a n x1 ( k ) a n 1 x 2 ( k ) a1 x n ( k ) hn u( k )
从而,其相应的状态方程和输出方程为:
x1 ( k 1 ) 0 1 0 0 x1 ( k ) h1
x ( k 1)
2 0 0 1 0 x2 ( k ) h2
u( k )
x n 1 ( k 1 ) 0 0 0 1 xn 1 ( k ) hn 1
x n ( k 1 ) an an 1 an 2 a1 xn ( k ) hn
y ( k ) [1 0 0 0] x ( k ) h0 u( k ) (1.96)
59
例 1.14 设一个三阶差分方程为:
y ( k 3 ) 5 y( k 2 ) 7 y ( k 1 ) 3 y ( k )
u( k 1 ) 2u( k )
求相应的离散状态方程和输出方程。
解:差分方程的系数为
a1 = 5, a2 = 7, a3 = 3, b0 = 0, b1 = 0, b2 = 1, b3 =2
则由(1.95)式可求得相应的系数 hi 为:
h0 = 0, h1 = 0, h2 = 1, h3 = -3
由式(1.96)得离散状态空间表达式为:
x1 ( k 1 ) 0 1 0 x1 ( k ) 0
x ( k ) 1 u( k )
x ( k 1 )
0 0 1
2 2
x 3 ( k 1 ) 3 7 5 x 3 ( k ) 3
x1 ( k )
y( k ) [ 1 0 0 ] x 2 ( k )
x 3 ( k )
二、由脉冲传递函数推导离散状态方程
由脉冲传递函数(或由模拟结构图)推导离散状态方程也和连续系
统中类似,常见而又较简单的一些实现如前所述为能控标准型
(I 、II),能观标准型(I、II)或约当标准型等,这里仅举例说明。
例 1.15 已知一离散系统的传递函数为
b1 Z b2
g( z )
Z 2 a1 Z a2
求其状态空间表达式。
首先,上式可写成:
y( z ) b1 Z 1 b2 Z 2
u( z ) 1 a1 Z 1 a 2 Z 2
所以
u( z )
y( z ) ( b1 Z 1 b2 Z 2 )
1 a1 Z 1 a2 Z 2
令
60
u( z )
e( z )
1 a1 Z 1 a2 Z 2
则
y( z ) b1 Z 1e( z ) b2 Z 2 e( z )
e( z ) u( z ) a1 Z 1e( z ) a 2 Z 2 e( z )
由此可画出下面的模拟结构图。
b1
y(z)
u(z) e (z) x2(z) x1(z)
z -1 y(k)
z-1 b2
x2(k) x1(k)
-a1
-a2
图 1.22 能控标准 I 型
在图上设置状态变量,由上图可直接写出状态空间表达式:
x1 ( k 1 ) x 2 ( k )
x 2 ( k 1 ) a 2 x1 ( k ) a1 x 2 ( k ) u( k )
y( k ) b2 x1 ( k ) b1 x 2 ( k )
写成矩阵形式:
x1 ( k 1 ) 0 1 x 1 ( k ) 0
x ( k 1 ) a
a1 x 2 ( k ) 1
u( k )
2 2
x1 ( k )
y ( k ) b2 b1
x 2 ( k )
上式即为能控标准 I 型,显然其能观标准 II 型为:
x 1 ( k 1 ) 0 a 2 x 1 ( k ) b2
x ( k 1 ) 1 a x ( k ) b u( k )
2 1 2 1
61
x1 ( k )
y( k ) 0 1
x 2 ( k )
其模拟结构图为:
u(z)
u(k)
b2 bb1
1
+ x1(z) +
+ x2(z) y(z)
-1
z -1 z x2(k)
x1(k) + y(k)
+
-a2 -a1
图 1.23 能观标准 II 型
例 1.15(b) 已知一离散系统的传递函数为:
0.368 Z 0.264
g( z ) 2
Z 1.368 Z 0.368
试写出它的状态空间表达式,并且具有对角标准形式。
解:将 g( z ) 用部分分式展开
62
x1 ( k )
y ( k ) [1 0.632]
x 2 ( k )
x1(z)
+
z-1 1
+ x1(k)
u(z) 1 + y(z)
u(k) +
y(k)
+ x2(z)
z-1 -0.632
x2(k)
+
0.368
图 1.24 对角标准型
§1.6 状态变量的线性变换
一、线性变换
从前两节可以看出,对于一个给定的动态系统,可以选择不同的状
态变量组,从而得到不同结构的状态空间表达式,例如能控标准型,
能观标准型或约当标准型。不同的状态变量组之间的关系实质上是一
种线性变换的关系,或称坐标变换。设给定系统为:
x A x B u
(1.97)
y C x Du
我们总可以找到任意一个非奇异矩阵 T,将原状态向量 x 作线性变换,
得到另一个状态向量 z ,即
x T z ,或 z T 1 x (1.98)
将式(1.98)代入式(1.97)则得新状态空间表达式:
63
z T 1 AT z T 1 B u
(1.99)
y CTz D u
令
~ ~
A T 1 AT B T 1 B
~ ~ (1.100)
C CT DD
则得
~ ~
z A z B u
~ ~ (1.101)
y C z D u
可以看出,用式(1.98)的变换而联系起来的两个系统(1.97)式和
(1.101)式,对于相同的输入,必定给出相同的输出,此时称这两个
系统为代数上等价的系统。由于非奇异变换矩阵是任意选择的,所以
和某系统代数上等价的系统有无穷多。反过来说,尽管系统的状态空
间表达式不是唯一的,但不同的表达式之间,也仅仅只是(1.100)关
系式所确定的线性非奇异变换的关系。
例 1.16 设原系统的状态空间表达式为:
0 2 2
x x 0 u
1 3
y 0 3 x
6 2 1 0 1
若取 T 即 T 1
2 0 2 1 3
则
~ 1 0 1 0 2 6 2 0 1
A T 1 AT
2 1 3 1 3 2 0 2 3
~ 1 0 1 2 0
B T 1B
2 1 3 0 1
~ 6 2
C CT 0 3 6 0
2 0
所以新状态空间表达式为:
64
0 1 0
z 2 3 z 1 u
y 6 0 z
显然上式为能控标准 I 型。
二、系统特征值不变性及系统的不变量
状态方程中的系数矩阵 A,也称为状态矩阵,是一个很重要的矩阵。
它包含了许多有关系统特征的重要信息,这里讨论 A 的特征值。
系统特征值就是状态矩阵 A 的特征值,也即特征方程
I A 0 (1.102)
的根。n n 方阵 A 有 n 个特征值。实际的物理系统,A 为实数矩阵,故
特征值或为实数,或为共轭复数对。
例 1.17 若系统矩阵为:
0 1
A
2 3
求它的特征值。
矩阵 A 的特征方程为:
1
I A 2 3 2 ( 1 )( 2 ) 0
2 3
1 1 , 2 2 即为特征方程的根。
状态矩阵 A 的一个重要性质是其特征值的不变性,即在状态变量的
线性变换中,新老状态方程的 A 阵和 A ~ 阵的特征值是相同的。为了证
~
明这一点,只要证明 I A I A 即可,证明如下:
~
I A I T 1 AT T 1T T 1 AT
65
T 1 ( I A )T
T 1 I A T
T 1T ( I A )
I A
从而我们证明了在对状态变量作线性变换的情况下,A 阵的特征值是
~ 阵的特征方程是相同的。即如设系统的特
不变的。这还意味着 A 阵和 A
征方程为:
I A n a 1 n 1 a 2 n 2 a n 1 a n 0
则方程的系数是不变的量,故称特征多项式的系数为系统的不变量。
同样可以证明,对于给定的系统,尽管其状态空间表达式不同,但
反映输入—输出的特性的传递函数阵却是具有相同的形式。
~ ~ ~ ~ ~
G ( s ) C ( SI A )1 B D
CT ( ST 1T T 1 AT ) 1 T 1 B D
CT [T 1 ( SI A)T ]1 T 1 B D
CTT 1 ( SI A) 1 TT 1 B D
C ( SI A) 1 B D
G( s)
可见一切代数上等价的线性系统都有相同的传递函数阵。
三、特征向量
设 P i 为 n 维向量, i 为标量,它是矩阵 A 的特征值,若下式成
立
AP i i P i
则称向量 P i 为矩阵 A 的对应于特征值 i 的特征向量。从上式可以看出,
特征向量 P i 经 A 线性变换后,方向不变,仅长度增加了 i 倍。
四、化状态空间表达式为约当标准型
这里介绍化状态空间表达式为约当标准型的方法。显然,约当标准
型可由线性变换而获得。这里分两种情况:若矩阵有两两相异的特征
值,则可化为对角标准型;若系统矩阵有重根,则可化为一般的约当
66
标准型。
1、状态矩阵 A 无重根时
对线性定常系统
x A x B u (1.103)
如果 A 有 n 个两两相异特征值,则存在非奇异矩阵 T,通过线性变换
~ T 1 x ,使之化为对角线规范形式
x
~~ ~
~ A
x x Bu
1 0
~
A (1.104)
0 n
其中 1 , 2 , n 为矩阵 A 的特征值。
证明:首先令 P i 为 A 的属于特征值 i 的特征向量,且
p1i
p
P i 2i ( i = 1, 2, …n)
pni
因为 1 , 2 , n 为两两相异,故 P 1 , P 2 , P n 必线性无关,由这些特
征向量组成矩阵 T:
p11 p12 p1n
p p22 p2 n
T [P1 P2 P n ] 21
p n1 pn 2 pnn
必是非奇异的。进而,根据特征向量的关系式
AP i i P i
我们有
67
AT A P 1 P 2 P n AP 1 AP 2 AP n
1 P 1 2 P 2 n P n
1 1
0
2 2
0
P1 P2 P n T
0
n n
0
因为 T 是非奇异阵,必有逆。将上式左乘 T -1 ,即得
1
2
0
T 1 AT
0
n
对(1.103)式,令 x T x~ ,则得
~ AT x
Tx ~ Bu
上式两边左乘 T-1 得
~ T 1 AT x
x ~ T 1 B u
即
~ ~
x~ A x~ B u
其中:
~ ~
A T 1 AT , B T 1 B
由此,上述命题得证。
例 1.17 已知系统
2 1 1 7
x 0 1 0 x 2 u
0 2 1 3
将此状态空间表达式化为对角标准型。
解:A 的特征方程为:
68
2 1 1
I A 0 1 0 ( 2 )( 1 )( 1 )
0 2 1
所以 A 的特征值为:
1 2 , 2 1 , 3 1
可见此系统的特征值两两相异。进而可确定线性变换矩阵 T,根据特征
向量关系式:
AP i i P i
定出 A 的分别属于 1 、 2 、 3 的特征向量。
由
A P 1 1 P 1
即
2 1 1 p11 p11
0 1 0 p 2 p
21 21
0 2 1 p31 p31
69
从而可以求得
1 1 1 2 1 1 1 1 0
~
A T 1 AT 0 1 1 0 1 0 0 0 1
0 1 0 0 2 1 0 1 1
1 1 1 2 1 0 2 0 0
0 1 1 0 0 1 0 1 0
0 1 0 0 1 1 0 0 1
1 1 1 7 2
~
b T 1 b 0 1 1 2 5
0 1 0 3 2
这样,给定系统的状态方程的对角标准型为
2 0 0 2
x~ 0 1 0 x~ 5 u
0 0 1 2
2、状态矩阵 A 有重根时
对线性定常系统(1.103)式,设 A 的特征值为 1 、 2 、 k 其中
特征值 j 为 m j 重特征值,所以有
k
mj n ( j 1,2 , , k )
j 1
70
j 1 0
j 1
Jj j
0 1
j m
j m j
称为第 j 个约当块。
现在的问题是怎样得到变换矩阵 T。因为特征值重复,所以得不到 n
个线性无关的特征向量。即不能用化对角标准型的方法,假设对 m1 重
特征值 1 ,只能得到一个特征向量 P 1 ,其余向量 P 2 , P 3 , , P m1 尚未
求出,但由
J1
J2 0
~
A T 1 AT J3
0
J K
得
~
AT TA
将此式展开
m1
A[ P 1 P2 P m1 Pn]
71
1 1 0
m1
1
0
0 1
1
[P1 P2 P m1 P n ]
J2 0
J3
0
0
J k
3 1 0 0
x 0 3 1 x 0 u
4 0 0 9
试将此表达式化为约当标准型。
解:求 A 的特征值
3 1 0
I A 0 3 1 ( 3 )2 4 ( 1 )2 ( 4 ) 0
4 0
所以特征值为:
72
1 2 1 , 3 4
求特征向量,由
A P 1 1 P 1
3 1 0 P11 P11
0 3 1 P P
即 21 21
4 0 0 P31 P31
得
1
P 1 2
4
由 ( A 1 I )P 2 P 1
3 1 0 1
0
即 3 1 ( 1 )I
P 2 2
4 0 0 4
得
1
P 2 3
8
由 AP 3 3 P 3
得
1
P 3 1
1
所以
1 1 1
T [P1 P2 P 3 ] 2 3 1
4 8 1
11 7 4
1
T 1 6 3 3
9
4 4 1
因而
73
1 1 0
~
A T AT 0 1 0
1
0 0 4
4
B T B 3
~ 1
1
此系统的约当标准型为:
1 1 0 4
~ 0 1 0 x
x ~ 3 u
0 0 4 1
§1.7 由状态方程导出传递函数阵
上面我们曾讨论了由系统的传递函数推导状态方程的问题。在这一
节里,我们从状态方程出发,来导出系统的传递函数阵,进一步讨论
这两种表达式之间的内在联系。
一、单输入一一单输出系统
令系统的状态方程和输出方程为:
x A x bu
T (1.105)
y c x du
式中 x 为 n 维向量,y、u 分别为输出和输入,它们都是标量。在这种
74
T
y( s ) [c ( SI A) 1 b d ]u( s ) (1.109)
于是可得传递函数为:
y( s )
c ( SI A )1 b d
T
g( s ) (1.110)
u( s )
可见只需知道系统状态方程中的系数阵 A, b , c T 和 d,就能求得传递
函数 g(s)。
例 1.19 已知一个系统的状态方程和输出方程为:
x 1 x 2
x 2 x 3
x 5 x 3 x 2 x u
3 1 2 3
3 1
y
x1 x 2 x 3
2 2
求系统的传递函数。
解:首先将状态方程和输出方程用矩阵形式表示成
x 1 0 1 0 x1 0
x 0 u
x
0 0 1
2 2
x 3 5 3 2 x 3 1
x1
3 1
y 1 x2
2 2
x3
因为
1
S 1 0
adJ ( SI A)
[ SI A] 0
1
S 1
| SI A |
5 3 S 2
S 2 2S 3 S2 1
1
3 5 S ( S 2 ) S
S 2S 2 3S 5 2
5S ( 3S 5 ) S
故
75
3 1 S 2 2S 3 S2 1 0
2 1
2
g( s ) 3 5 S ( S 2) S 0
S 2S 2 3S 5
5S ( 3 S 5) S 2 1
3 1
1
2 1
2 S 2 2S 3
3 S
S 2 S 2 3 S 5 2 2 S 3 4 S 2 6 S 10
S
在经典控制理论中,已知 g(s)具有如下的形式:
y( s ) b0 S n b1 S n1 bn1 S bn
g( s ) n (1.111)
u( s ) S a 1 S n 1 a n 1 S a n
显然,(1.110)和(1.111)两式应是相等同的。为了讨论这两个表达
式之间的联系,我们把(1.110)式化为如下形式:
T adj ( SI A )
g( s ) c bd
| SI A |
T
c adj ( SI A )b d | SI A |
(1.112)
| SI A |
比较(1.112)和(1.111)两式可知,传递函数的分子多项式等同于
矩阵 A 的特征多项式。换句话说,传递函数的极点即为状态矩阵 A 的
特征值。由此也可得出单输入——单输出线性定常系统稳定的充要条
件是要求 g(s)的极点均具有负实部。在状态空间表达式中,这即要求状
态矩阵 A 的所有特征值均具有负实部。
二、多输――多输出系统
已知系统的状态空间表达式为
76
x A x B u
(1.113)
y C x Du
式中:
u r 1 输入列向量; y m 1 输出列向量;
A n n 系统矩阵; B n r 控制矩阵;
C m n 输出矩阵; D m r 直接传递矩阵;
x n 1 状态向量。
在初始条件为零的前提下,对式(1.113)作拉氏变换,得
x ( s ) ( SI A) 1 B u( s )
y( s ) C x( s ) D u( s )
于是得传递函数阵
G ( s ) C ( SI A )1 B D (1.114)
它是一个 m r 的矩阵函数,设
g ij ( s ) ( i 1 ,2 , m , j 1,2 , r )
为 G( s) 的元,则系统的传递函数阵 G( s) 可表示为如下的形式:
g11 ( s ) g12 ( s ) g1r ( s )
g ( s ) g ( s ) g ( s )
G( s )
21 22 2r
(1.115)
g m1 ( s ) g m 2 ( s ) g mr ( s )
并且容易看出,其元 g ij ( s ) 都是标量函数,它在物理上表示为第 j 个
输入对第 i 个输出的传递关系,当 i j 时,意味着不同标号的输入与
输出有相互关联。称为耦合关系,这正是多变量系统的特点。
例 1.20 考虑这样一个系统,它的状态方程为:
x 1 0 1 x1 1 0 u1 ( t )
x 2 3 x 1 1 u ( t )
2 2 2
输出方程为:
77
y1 1 0 0 0
x1 u1 ( t )
y 1 1 1 0
2 x u ( t )
y 3 0 2 2
0 1 2
求系统的传递函数矩阵。
解:因为
1 0 0 0
0 1 1 0 1 0
A
2 3 ,B 1 1 , C 1 1 , D
0 2 0 1
且
S3 1
1 ( S 1 )( S 2 )
S 1 ( S 1 )( S 2 )
( SI A ) 1
2 S 3 2 S
( S 1 )( S 2 ) ( S 1 )( S 2 )
因此,系统的传递矩阵为:
G ( s ) C ( SI A ) 1 B D
S3
1 0
1
0 0
( S 1 )( S 2 ) ( S 1 )( S 2 ) 1 0
1 1 1 0
2 S 1 1
0 2 0 1
( S 1 )( S 2 ) ( S 1 )( S 2 )
S4 1
( S 1 )( S 2 ) ( S 1 )( S 2 )
S4 1
S2 S2
2( S 2 ) S 5S 2
2
( S 1 )( S 2 ) ( S 1 )( s 2 )
此传递函数矩阵有六个元素,每个都是一个传递函数。
三、组合系统的空间表达式及传递函数阵
实际的控制系统,往往由多个子系统组合而成,或并联,或串联,
或形成反馈连接,这种系统称组合系统。这里仅限于讨论线性定常系
统的组合系统的状态空间表达式及其传递函数阵。
设子系统 1 为:
78
x 1 A1 x 1 B1 u1
(1.116)
y 1 C1 x 1 D1 u1
简记为: 1 :( A1 , B1 , C 1 , D1 )
和子系统2 为:
x 2 A2 x 2 B2 u 2
(1.117)
y 2 C 2 x 2 D2 u 2
简记为 2 :
( A2 ,B 2 , C 2 , D2 ).
1、并联组合系统
所谓并联组合系统,是指各子系统有相同的输入,组合系统的输出
是各子系统的代数和,其结构简图如图 1.25 所示。
u1 y1
A1 、B1 、C1 、D1
u +
y
+
u2 y2
A2 、B2 、C2 、D2
图 1.25 并联组合系统
由图可知:
u1 u2 u
y y1 y 2
并由式(1.116)和(1.117)得状态空间表达式:
x 1 A1 0 x 1 B1
x 0
A2 x 2 B2
u
2
x1
y C1 C 2 [ D1 D2 ]u (1.118)
x2
从而组合系统的传递函数阵为:
( SI A1 )1 0 B1
G ( s ) C1 C2 1 B
D1 D2
0 ( SI A2 ) 2
79
[ C1 ( SI A1 )1 B1 D 1 ] [ C 2 ( SI A2 )1 B2 D2 ]
G1 ( s ) G2 ( s )
故系统并联时,系统传递函数阵等于子系统的传递函数阵之和。
2、串联组合系统
A 1 , B1 , C1 , D 1 A 2 , B2 , C2 , D 2
u = u1 y1 = u2 y2 = y
u1 = u1
图 126 串联组合系统
串联组合系统如图 126 所示,从图可知:
u u1 , y1 u2 , y y2
并由式(1.116)和(1.117)得
x 1 A1 x 1 B1 u
x 2 A2 x 2 B 2 C 1 x 1 B 2 D1 u
y C x D C x D D u
2 2 2 1 1 2 1
即为:
x 1 A1 O x 1 B1
B C A B D u
x 2 2 1 2 x2 2 1
(1.119)
y D C C x1 D D u
2 1 2 2 1
x2
而传递函数阵为:
1
SI A1 O B1
G s D2C1 C2 D2 D1 (1.120)
B2 C 1 SI A2 B2 D1
SI A1 O
由于 为下三角矩阵,所以
B2 C 1 SI A2
1
SI A1 O ( SI A1 ) 1 O
B C SI A (1.121)
SI A2 B2C1 SI A1 SI A2 1
1 1
2 1 2
将式(1.121)代入式(1.120)得:
80
G s D1C 1 C 2
SI A1 1 O B1
D D
SI A2 B2 C 1 SI A1
1 1
SI A2 1 B2 D1 2 1
D2 C 1 SI A1 1 B1 C 2 SI A2 1 B2 C 1 SI A1 1 B1
C 2 SI A2 1 B 2 D1 D2 D1 ( 1.122 )
C 2 SI A2 1 B2 D2 C 1 SI A1 1 B1 D1
故
G ( s ) G2 ( s ).G1 ( s )
即串联组合系统的传递函数阵等于子系统传递函数阵之积。应注意
先后次序不能颠倒。
3、具有输出反馈的系统
如图 1.27 所示为常数反馈的情况。
u + u H y
A, B, C
-
图 1.127 常数反馈系统
从图可知,系统在没有反馈时,系统前向通道的传递函数矩阵为:
G0 s C SI A 1 B (1.123)
闭环后系统状态空间表达式为:
x A x B( u H y ) ( A BHC ) x B u
(1.124)
y Cx
故常数反馈系统传递函数阵为:
G ( s ) C ( SI A BHC )1 B (1.125)
下面我们进一步推导 G0(s)与 G(s)的关系。
先计算 G(S)[I+HG0(S)]
81
G ( s ) I HGo( s ) G ( s ) G ( s ) HGo( s )
C ( SI A BHC ) 1 B C ( SI A BHC ) 1 BHC ( SI A) 1 B
由于 (1.126)
SI A BHC 1 BHC SI A BHC 1 BHC I I
SI A BHC BHC SI A BHC SI A BHC I
1 1
SI A BHC ( SI A ) I
1
( 1.127 )
将(1.127)代入(1.126)式,得
G ( s ) I HGo( s ) C ( SI A BHC )1 B C ( SI A BHC )1
( SI A ) I ( SI A )1 B
C SI A HBC
1
SI A BHC
1
( SI A )1 B
C ( SI A )1 B G0 ( s )
所以 G s G0 s I HG0 s 1 (1.128)
而 G0 s I G s H 1 G s (1.129)
再计算 I G0 s H G s , 同理还可推出
G s I Go s H Go s
1
( 1.130 )
Go s G s I HG s
1
( 1.131 )
再考察如图 1-28 所示的动态反馈的情况:
u u1
+ y1
A1, B1, C1
-
y2
u2
A2, B2, C2
图 1.28 动态反馈系统
由图可知:
u1 u y 2
y y1 u 2
82
x 1 A1 x 1 B1 u1
1 y C x 1
:
1 1
x 2 A2 x 2 B2 u 2
2 y C x2
:
2 2
由此可得动态反馈系统的状态空间表达式为:
x 1 A1 x 1 B1 u B1C 2 x 2
x 2 A2 x 2 B2C1 x 1
y C1 x 1
化为矩阵形式:
x 1 A1 B1C 2 x 1 B1
x B C u (1.132)
2 2 1 A2 x 2 0
x1
y C 1 0
x2
便可得传递函数阵:
1
SI A1 B1C 2 B1
G s C1 0
B2C1 SI A2 0
其中 SI A 1 可这样来计算:
1
F F12 SI A1 B1C 2
令 SI A 1
11
F21 F22 B2C1 SI A2
则有
F11 F12 SI A1 B1C 2 I O
F
21 F22 B2C1 SI A2 0 I
展开得
F11 SI A1 F12 B2C1 I ( 1.133 )
F11 B1C 2 F12 SI A2 0 ( 1.134 )
由(1.134)式得
F12 F11 B1 C 2 SI A2 1
由(1.133)式得:
83
F11 SI A1 I F12 B2C1
I F11 B1C 2 SI A2
1
B2C1
所以
F11 SI A1 1 F11 B1 C 2 SI A2 1 B 2 C 1 SI A1 1
因而
F F22 B1
G s C1 0 11 C1F11 B1
F21 F22 0
C1 SI A1 B1 C1F11 B1C 2 SI A2 B2C1 SI A1
1 1 1
B1
G1 s G s G2 s G1 ( s )
于是可得动态反馈系统的传递函数矩数为:
G s G1 s I G2 s G1 s
1
(1.135)
同理也可求得
G s I G1 s G2 ( s ) 1 G1 s (1.136)
84
第2章 线性系统状态方程的解(模块十)
上一章我们讨论了如何建立系统的状态空间表达式,这一章将讨
论如何解系统的状态方程。
§2.1 线性定常系统状态方程的解
线性定常系统的状态方程为:
x A x B u , x(t0 ) x 0 (t ≥ t0 ) (2.1)
其中 x , u 分别为 n , r 维向量,系数矩阵 A、B 分别为 n n , n r 常
数矩阵。
对于上述方程,现讨论具体求解的方法。
一、齐次方程的解
在求微分方程式(2.1)的解之前,首先考虑输入项 u 为零的齐次
方程式
x A x (2.2)
的解。此时无控制作用,系统处于由初始状态引起的自由运动状态,
所以齐次方程式的解也称自由解。
若初始时刻 t 0 时的状态给定为 x ( t 0 ) x 0 ,则式(2.2)有唯一
确定解:
x ( t ) e A ( t -t 0 ) x 0 (t ≥ t0 ) (2.3)
1
x ( t ) b 0 b1 t b 2 t b k t b k t k
2 k
(2.5)
k 0
式中: t ≥ 0 ,将(2.5)式代入方程(2.2)式得
b1 2b2 t 3b 3 t 2 k b k t k 1
A( b 0 b1 t b k t k ) (t≥ 0) (2.6)
因为上式对 t ≥ 0 均成立,故等式两边 t 的同次幂项的系数应相等,可
得如下一组关系式:
b1 Ab 0
1 1
b2 Ab1 A2 b 0
2 2!
1 1
b 3 Ab 2 A3 b 0
3 3!
………
1 1 k
bk Ab k 1 A b0
k k!
………
在式(2.5)中,令 t 0 ,可得
b 0 x ( 0) x 0
将以上结果代入(2.5)中,即有
1 2 2 1
x ( t ) ( I At A t Ak t k ) x 0 ( 2. 7 )
2! k!
或写成
1 k k
x( t ) ( A t )x0 ( 2.8)
k 0 k!
仿照标量指数的定义
1 2 2 1
e at 1 at a t akt k
2! k!
∞ 1
∑ akt k
k 0 k !
我们可定义矩阵指数为:
2
1 2 2 1 k k
e At
1 At A t A t
2! k!
(2.9)
∞ 1 k k
∑ A t
k 0 k !
故(2.7)式可表示为
x ( t ) e At x 0
若用 ( t t 0 ) 代替 t,即初始时刻为 t0 ,同样可证明
x( t ) e A( t - t 0 ) x 0
的正确性。
2.用 Laplace 变换法证明
式(2.4)也可以采用 L a p l a c e 变换法来证明。对(2.2)式两边取
L a p l a c e 变换。可得
S x ( s ) x 0 A x ( s )
其中 x ( s ) L[ x ( t )] 为状态向量 x (t ) 的拉氏变换,经整理有:
( SI - A) x ( s ) x 0
3
I A A2 Ak
x( t ) L 1
k 1 x 0
S S2 S3 S
1 1 1 (2.11)
( I At A2 t 2 A3 t 3 Ak t k ) x 0
2! 3! k!
e At x 0
可见 e At L1 [( SI A) 1 ] , 从而(2.4)式得到证明。
二、矩阵指数函数——状态转移矩阵
1.状态转移矩阵
前面已经得齐次方程(2. 2)的自由解为:
x ( t ) e At x 0 或 x ( t ) e A( t - t 0 ) x 0
上式的物理意义是系统在 t ≥ 0 或 t ≥ t 0 的任一瞬时的状态 x (t ) ,只是
初始时刻状态向量 x 0 的一种变换关系。变换矩阵为 e At 或 e A( t -t 0 ) 。指数
矩阵 e At 或 e A( t -t 0 ) 是一个 n n 的时间 t 的函数矩阵。这意味着它使状态
向量随着时间的推移在不断地作坐标变换,即不断在状态空间中作转
移。因此指数矩阵 e At 或 e A( t -t 0 ) 也称状态转移矩阵。通常表示为:
( t ) e At 或 ( t t 0 ) e A( t t0 )
其中 ( t ) 表示为 x ( 0) 到 x (t ) 的状态转移矩阵, ( t t 0 ) 表示为 x ( t 0 )
到 x (t ) 的状态转移矩阵。因此齐次状态方程(2.2)式的解也可表示为:
x(t ) ( t ) x 0
或 x(t ) ( t t0 ) x 0
可以看出,系统作自由运动时,它的运动形态将是唯一地由状态转移
矩阵所决定,它包含了系统自由运动的全部信息。它的几何意义,以
二维状态向量为例,表示在图(2.1)中。
x2
x20 x21
x(t1) x22
x(0) ф(t1) φ(t2-t1)
φ(t2) x(t2)
0 t1 t2 t
x10
x11 4 x12
x1
图 2.1
x10
图中设 t 0 时,状态的初态为 x (0) ,若已知状态转移矩
x 20
阵 ( t 1 ) ,则 t t 1 的状态为:
x11
x ( t1 ) ( t1 ) x ( 0 ) ( 2.12)
x21
如果已知状态转移矩阵 ( t 2 ) ,则 t t 2 的状态为
x12
x ( t 2 ) ( t 2 ) x ( 0) ( 2.13)
x22
这就清楚地表明状态从 x ( 0) 开始,随着时间的推移,它将按 ( t 1 ) 或
( t 2 ) 作自由运动,最后状态转移到 x( t 1 ) 或 x (t 2 ) ,相应地在状态空间
中描绘出一条如图 2.1 所示的运动轨线。
若 t1 为初始时刻, x ( t1 ) 为初始状态,则 t t 2 的状态为:
x ( t 2 ) ( t 2 t1 ) x ( t1 ) ( 2.14)
将式(2.12)的 x ( t1 ) 代入上式,则得
x ( t 2 ) ( t 2 t1 ) ( t1 ) x ( 0) ( 2.15)
式(2.15)表示从 x (0) 转移到 x (t 1 ) ,再由 x (t 1 ) 转移到 x (t 2 ) 的运
动轨线。
( t 2 t1 ) ( t1 ) ( t 2 )
或 e A( t 2 t1 )e At1 e At 2 ( 2.16 )
这种关系称为组合性质。
我们知道在经典控制理论中,求解高阶微分方程时,对初始条
件的处理是相当困难的,通常都是假定初始时刻 t 0, x ( 0) 0 ,
即从零初始条件出发去计算系统的输出响应,而从上面分析中可以看
5
出,在现代控制理论中,利用状态转移矩阵,对任意时刻的状态量
x (t ) ,可以由任意指定的初始时刻 t 0 的初始向量 x ( t 0 ) 求得。就是说,
矩阵微分方程的解,在时间上可以任意分段求取。这是系统用状态方
程描述的又一优点。
2.状态转移矩阵的性质
现在我们来简单地阐明状态转移矩阵的几个重要性质。
(1)性质一
( t t ) ( 0 ) I
( 2.17 )
或 e A( t t ) e A 0 I
本性质直接根据定义(2.9)式证得。意味着状态向量从 t 时刻又转移
到 t 时刻,显然状态向量是不变的。
(2)性质二
( t ) ( ) ( t )
或 ( 2.18)
e At e A e A( t )
这是组合性质,意味着从 t 转移到 t 0 ,再从 t 0 转移到
t t 的组合,即
( t 0 ) ( 0 ( )) ( t ( )) ( t )
本性质也可由定义(2.9)式直接证明。
(3)性质三
( t ) 1 ( t )
或 ( 2.19 )
At 1 At
(e ) e
这意味着转移矩阵总是非奇异的,必有逆。利用这个性质,可以在已
知 x (t ) 的情况下,求出 t 时刻以前的 x ( t 0 ), (t 0 t ) 。
证明:由式(2.18)
( t ) ( t ) ( )
或 e A( t ) e At e A
现令 t ,得
6
( t ) ( t ) ( t t ) I
或 e At e At e A( t t ) I
同样 ( t ) ( ) ( t )
或 e A( t ) e A e At
令 t ,得
( t ) ( t ) ( t t ) I
或 e At e At e A( t t ) I
从而证明了 ( t ) 为 ( t ) 的逆。或 e At 为 e At 的逆。
(4)性质四
对转移矩阵有
( t ) A ( t ) ( t ) A
或 d At ( 2.20 )
e A e At e At A
dt
证明:据定义
A2 t 2 A3 t 3
c At
I At
2! 3!
由于此无穷级数对有限 t 值是绝对收敛的,所以可将上式两边对 t 求导,
有
d At A3 t 2 A4 t 3
2
e A A t
dt 2! 3!
d At A2 t 2 A3 t 3
因此 e A( I At ) A e At
dt 2! 3!
d At A2 t 2 A3 t 3
或者 e ( I At ) A e At .A
dt 2! 3!
即: ( t ) A ( t ) ( t ) A
此性质得证。
(5)性质五
设 有 n n 矩 阵 A 和 B , 当 且 仅 当 AB BA 时 , 有
7
e At e Bt e ( A B )t ,而当 AB BA 时,则 e At e Bt e ( A B )t 。
证明:根据定义式
( A B )t ( A B )2 2 ( A B )3 3
e I ( A B )t t t
2! 3!
A 2 t 2 ABt 2 BAt 2 B 2 t 2
I ( A B )t ( )
2! 2! 2! 2!
A 3 t 3 A 2 Bt 3 ABAt 3 AB 2 t 3 BA 2 t 3 BABt 3
(
3! 3! 3! 3! 3! 3!
B 2 At 3 B 3 t 3
)
3! 3!
而
A2 t 2 A3 t 3 B 2t 2
e At e Bt ( I At )( I Bt
2! 3! 2!
B 3t 3
)
3!
A2t 2 2 B 2t 2
I ( A B )t ( ABt )
2! 2!
A 3 t 3 A 2 Bt 3 AB 2 t 3 B 3 t 3
( )
3! 2! 2! 3!
将上述两式相减得:
e ( A B )t e At e Bt
BA AB 2 BA 2 ABA B 2 A BAB 2 A 2 B 2 AB 2 3
t t
2! 3!
上 式 说 明 , 当 A和 B 是 可 交 换 的 , 等 式 右 边 为 零 , 故
e ( A B )t e At e Bt ;当 A 和 B 是不可交换时,等式右边不为零,故
e ( A B )t e At e Bt ,可以看出这与标量指数函数的性质是不同的,此
性质得证。
(6)性质六
若 A 为对角矩阵。即
8
1
0
2
A
0 n
e 1 t
0
e 2t
At
则 e ( t ) ( 2.21 )
0 ent
证明:根据定义
1 0
1t 0
k k
At 1 2 t
e At
k 0 k!
0 1 0 n t
12 t 2 1k t k
2! 0 k! 0
k 0
22 t 2
k k
2t
2!
k 0 k!
2 2
n t
kn t k
0
2!
0
k 0 k!
e 1 t 0
e2t
nt
0 e
则式(2.21)得证。
(7)性质七
9
若 A 能通过非奇异变换予以对角线化,即
T 1 A T
则
e 1 t
0
e 2t 1
e At ( t ) T T ( 2.22 )
n t
0 e
证明:根据定义式
A2 t 2 A3t 3 Ak t k
e At
I At
2!
3!
k 0 k!
因为 A 能通过非奇异变换予以对角线化,即
1
0
2
T 1 A T
0 n
同理有
12
0
22
T 1 A2 T T 1 AT T 1 AT
0 2n
对于一般项有
1k
0
k2
T 1 Ak T ( T 1 AT )( T 1 AT )
0 kn
于是得
10
1
T e T t k T 1 AkT
1 At
k 0 k!
1 k k
k! t 1 0 e 1 t
k 0 0
1
k 0 k! t k k2 e 2t
0 nt
1 k k e
0 k 0 k! n
t
所以:
e 1 t
0
e 2t 1
e At T T
0 ent
于是(2.22)式得证。
(8)性质八
若 A 为 J o r d a n 型矩阵
1 0
1
1
A J , 则可得
1
0
11
1 2 1
1 t t t n 1
2! ( n 1 )!
0 1 1 n 2
t t
( n 2 )!
e Jt ( t ) e t ( 2.23 )
0 0 0 t
0 0 0 1
式(2 23)证明可仿照性质六式(2.21)证明方法,同学们可自行证明。
(9)性质九
若 A 能通过非奇异变换变成约当标准型,即
1 0
1
T AT J
1
则
1
0
e At ( t ) Te Jt T 1 ( 2.24 )
读者可仿照性质七式(2.22)方法来证明。
3 . 状 态 转 移 矩 阵 ( t )或e At
的计算
上面我们介绍了状态转移矩阵的性质,在具体分析线性定常系统
时,不可避免地要碰到计算 ( t )或e At 的问题,这里将介绍几种主要
计算方法。
(1 ) 直 接 利 用 e At 的 级 数 展
开法
根据矩阵指数的定义, e At 可以展开成幂级数:
A2 t 2 A3 t 3 Ak t k
e At
I At ( 2.25 )
2! 3! k!
即
12
At At At At A 2 t 2
e At I ( ) ( )
1! 2 1! 3 2!
At A( k 1 ) t ( k 1 )
( ) ( 2.26 )
k ( k 1 )!
从 式 ( 2.25 ) 可 以 看 出 , 即 使 A 很 简 单 , 手 算 也 是 不 容 易 的 。 式
(2.25)不是闭合表达式,只能取有限项作近似计算,高阶项忽略。式
(2.26)中圆括号内每一项完全等于前一项。它给出了一种方便的递推
方案,可用计算机实现。显然编程简单,但是由于 e At 的收敛比较慢,
与其它方法相比计算时间较长。
0 1
例 2.1 已知 A 求e
At
2 3
解:将 A 直接代入(2.25)式
A2 t 2 A3 t 3
e At I At
2! 3!
2 3
1 0 0 1 0 1 t2 0 1 t3
0 1 2 3 2 3 2! 2 3 3!
t
3 7
1 t2 t3 t t2 t3
2 6
7 7 5
2t 3t 2 t 3 1 3t t 2 t 3
3 2 2
(2)应用 Gayley Hamilton 定理求 e At
( a )Caylay Hamilton 定理
设 n n 矩阵 A 的特征多项式为:
f ( ) n a1 n1 a n1 a n ,则 A 必满足其自身的特征方
程,即
f ( A ) A n a1 A n 1 a n 1 A a n I 0 ( 2.27 )
证明:由下式
adj ( I A )
( I A ) 1
I A
两边右乘 ( I A ) 得
13
adj ( I A )
( I A ) 1 ( I A ) ( I A ) I
I A
可导出:
I A I adj ( I A ) ( I A ) ( 2.28 )
其中 adj ( I A ) 的元为 的 ( n 1 ) 次多项式,所以可表示为:
adj ( I A ) H 1 n 1 H 2 n 2 H n 1 H n ( 2.29 )
而 I A n a1 n 1 a 2 n 2 a n 1 a n ( 2.30 )
将(2 29)、(2.30)式代入(2.28)式得
In a1 In 1 an 1 I an I
( H1n 1 H 2n 2 H n 1 H n )( I A )
将上式展开得
H1n ( H 2 H1 A )n 1 ( H n H n 1 A ) H n A
In a1 In 1 an 1 I an I
上式中,等式两边 之同次幂项的系数应相等。因而可得。
H1 I
H H A a I
2 1 1
H 3 H 2 A a 2 I
H n H n 1 A an 1 I
H n A a n I
将上述关系式,从上到下依次右乘 A n , A n 1 , A , I , 然后把等式左右各
式相加,得
A n a1 A n 1 a n 1 A a n I
H 1 An ( H 2 An 1 H 1 An ) ( H n A H n 1 A2 ) H n A 0
这就证明了 f ( A ) 0
(b)由 Cayley Hamilton 定理我们很容易得到如下命题。
即 : 设 A 为 n n 矩 阵 , 则 矩 阵 指 数 e At 可 表 示 为 A 的 一 个 不 高 于
( n 1 ) 次的有限多项式,即可表示为:
14
n 1
e At 0 ( t ) I 1 ( t ) A n 1 ( t ) A n 1 k ( t ) A k ( 2.31 )
k 0
在 e At 的定义式(2.32)中用上述方法可以消去 A 的 n 及 n 以上的
幂 次 项 , 表 明 e At 的 表 达 式 ( 2.32 ) 中 有 且 仅 有 n 个 A 的 乘 幂
A n1 , A n 2 , A , I 是 独 立 的 , 而 所 有 高 于 ( n 1 ) 次 的 乘 幂
A n , A n1 , 都可以表为 A n1 , A n 2 , A , I 的线性组合,把这些表达式
代入(2.32)式,即可得
n 1
e At 0 ( t ) I 1 ( t ) A 2 ( t ) A 2 n 1 ( t ) A n 1 K ( t ) A k
k 0
0 1
例 2.2 已知 A ,应用 Cayley-Hamilton 定理求 e At 。
2 3
解: f ( ) I A 2 3 2
根据 Cayley Hamilton 定理有 A 2 3 A 2 I 0
所以 A 2 3 A 2 I
15
A 3 A A 2 A( 3 A 2 I ) 3 A 2 2 A
3( 3 A 2 I ) 2 A 7 A 6 I
而 A 4 A A 3 7 A 2 6 A 7( 3 A 2 I ) 6 A
15 A 14 I
代入(2.32)式,即得:
将 A、A2、A3、
A2 2 1 3 3 1 4 4
At
e I At t A t A t
2! 3! 4!
3 7 15
( t t 2 t 3 t 4 )A
2! 3! 4!
14
( 1 t 2 t 3 t 4 )I
4!
0 ( t )I 1 ( t ) A
3 14 4
0 ( t ) 1 t 2
t t
4!
其中
( t ) t 3 t 2 7 t 3 15 t 4
1 2! 3! 4!
上面例题只是为了加深对(2.31)式的理解,并说明 i ( t ) 是 t 的
函数,实际却不宜用来作为计算 i ( t ) 的方法,因为在阶数高时,这
种计算很繁杂,且得不到解析表达式。下面将介绍 i ( t ) 的一般计算方
法。
16
可以互换的,因此 也满足式(2.31)
e At 0 ( t ) I 1 ( t ) A n 1 ( t ) An 1
0 ( t ) 1 ( t )1 n 1 ( t )1n 1 e 1 t
从而有 0 ( t ) 1 ( t )2 n 1 ( t )n2 1 e 2 t
n1 n t
0 ( t ) 1 ( t )n n 1 ( t )n e
将上式写成矩阵形式:
1 1 12 1n 1 0 ( t ) e 1 t
1 2 22 n2 1 1 ( t ) e 2 t
1 n 2n nn 1 n 1 ( t ) e n t
解此方程组即得(2.33)式。
0 1 At
例 2.3 已知 A 2 3 ,利用(2.33)式求 e
2
解: f ( ) 3 2 0
得: 1 1 , 2 2 , 根据式(2.33)可写出:
1
0 ( t ) 1 1 e t 2 1 e t
1 ( t ) 1 2 e 2 t 1 1 e 2 t
所以
0 ( t ) 2e t e 2t
1 ( t ) e t e 2 t
e At 0 ( t ) I 1 ( t ) A
2e t e 2 t
1 0
( e t e 2t
0
)
1
0 1 2 3
2e t e 2 t e t e 2t
t 2t
2( e e ) e t 2e 2 t
17
(d)设 n n 的矩阵 A 有 n 重特征值 1 ,则其计算 i ( t ) 的关系式为:
0 ( t )
1 ( t )
n 2 ( t )
( t )
n 1
1
t n 1 e 1 t
1 ( n 1)!
0 0 0 1
0 0 1
1 ( n 1) 1 ( n 2)! t e
n 2 1 t
( n 1)( n 2)1n 3
0 0 1
2! 1 t 2 e 1t
0 1 ( n 1) n 2 2!
2 1 1
1! 1
1 12 1n 1 te 1 t
1 1!
e 1t
( 2.34)
证明:同上已证明有
0 ( t ) 1 ( t )1 2 ( t )12 n 1 ( t )1n 1 e 1 t
上式对1 求一次导数,有
1 ( t ) 2 2 ( t )1 ( n 1 ) n 1 ( t )1n 2 te 1 t
再将上式再求导一次,有
2 2 ( t ) 6 3 ( t )1 ( n 1 )( n 2 ) n 1 ( t )1n 3 t 2e 1 t
重复上述步骤,最后有
( n 1 )! n1 ( t ) t n 1 e 1t
将上面几个方程写成矩阵的形式,有
18
0 0 0 1
0 0 1 ( n 1 )1 0 ( t )
1 ( t )
( n 1 )( n 2 ) n 3
0 0 1 1 n 3 ( t )
2!
( n 1 ) n 2
0 1 21 1 n 2 ( t )
1! ( t )
1 1 12 1n 1 n 1
1 n 1 1 t
( n 1 )! t e
1 n 2 1 t
( n 2 )! t e
1
t 2 e 1 t
2 !
te 1 t
e 1 t
解此方程即得(2.34)式。
1 1
例 2.4 已知 A 求e
At
1 3
解: f ( ) 2 4 4 0 , 1 2 2
由式(2.34),得
1 t 1
0 ( t ) 0 1 te 1 0 1 te 2 t 2 1 te 2 t
1 1 t 1 2 2 t 1 0 2 t
(
1 t ) 1 e e e
即:
1 ( t ) t e 2 t
0 ( t ) e 2 t 2t e 2 t
所以
19
e At 0 ( t )I 1 ( t ) A
1 0 1 1
( e 2t 2te 2 t ) te 2t
0 1 1 3
e 2 t te 2 t te 2 t
2t
te e 2t te 2 t
(3)利用拉普拉斯反变换法求 eAt
由(2.11)式可知
e At L1 {( SI A )1 }
可见这种方法归结为计算 ( SI A ) 1 ,而 ( SI A ) 1 也称预解矩阵,
这里仅介绍两种计算 ( SI A ) 1 的方法。
a)根据公式
adj ( SI A)
( SI A) 1 ( 2.35)
SI A
这是一种最常用的计算方法,这种方法在维数较大时,其计算往往比
较复杂。
b)根据下面公式来计算
( SI A ) 1
( 2.36 )
(s)
其中 ( s ) 为 n n 矩阵 A 的最小多项式(注 1),即令 d ( s ) 为 n n 矩阵 A
的 特 征 矩 阵 ( SI A ) 的 所 有 ( n 1 ) 维 余 子 式 的 最 大 公 因 子 , 如 果
d ( s ) 中的 s 的最高幂项的系数选择为 1,则最小多项式就为
SI A
( s )
d( s )
( s ) 0 S m 1 S m 1 m 1 S m
20
式中 0 1 , m n 。
上式证明如下:
令 P ( SI A ) 1 ,将此式左乘 ( SI A ) ,得
( SI A) P I SP AP I
再把上式左乘 ( SI A ) 得,
( SI A ) SP ( SI A )( AP I ) S 2 P A2 P A SI
类似地再把上式左乘 ( SI A ) ,得
( SI A )S 2 P ( SI A )( A 2 P A SI ) S 3 P A 3 P A 2 SA S 2 I
依次类推,可组成如下一组关系式
P P
SP AP I
S 2 P A 2 P A SI
3 3 2 2
S P A P A SA S I
S m P A m P A m 1 SA m 2 S m 2 A S m 1 I
现将上式自上而下依次乘 m , m 1 , ,1 , 0 ,然后依等式左右进行
相加。等式左边相加结果是:
m P m 1 SP 1 S m 1 P 0 S m P
( m m 1 S 1 S m 1 0 S m )P ( s )P
而等式右边相加结果为:
( m I m 1 A 0 A m )P ( m 1 I m 2 A 0 A m 1 )
( m 2 I m 3 A 0 A m 2 )S ( 1 I 0 A ) S m 2 ( 0 I ) S m 1
m m m
( A )P m i Ai 1 S m i Ai 2 S m 1 m i Ai m
i 1 i2 im
m 1 m
( A )P S m i Ai j 1
j
j0 i j 1
(注 1)最小多项式:
尽管 Cayley gamilton 定理指明有 f ( A ) 0 ,但可能有一 些比
f ( s ) 次数更低的多项式 ( s ) ,使 ( A) 0 。使 ( A ) 0 的次数最低的
21
首一多项式,叫做 A 的最小多项式。
上述两式相等,且 ( A ) 0 ,从而就证明了
m 1 m
S j
mi A i j 1
j 0 i j 1
( SI A ) 1
( s )
2 0 0
例 2.5 已知 A 0 2 0 ,求预解矩阵 ( SI A ) 1
0 3 1
解: f ( s ) SI A ( S 2 ) 2 ( S 1 )
( S 2 )( S 1 ) 0 0
adj ( SI A ) 0 ( S 2 )( S 1 ) 0
0 3( S 2 ) ( S 2 )2
所以 adj ( SI A ) 的最大公因子 d ( S ) ( S 2 ) 。
则 A 的最小多项式
SI A ( S 2 )2 ( S 1 )
( s ) ( S 2 )( S 1 ) S 2 3 S 2
d( s ) (S 2)
由最小多项式 ( s ) 可知: m 2 , 0 1, 1 3 , 2 2 。
于是得:
0 IS ( 1 I 0 A ) A ( S 3 )I
( SI A ) 1 2
( s ) S 3S 2
2 ( S 3 ) 0 0
1
2 0 2 (S 3) 0
S 3S 2
0 3 1 ( S 3 )
1
S 2 0 0
1
0 0
S2
3 1
0 ( S 1 )( S 2 ) S 1
式(2.36)也可以写成下面两种形式
22
形式 I:
Pm 1 ( S ) I Pm 2 ( S ) A P1 ( S ) A m 2 P0 ( S ) A m 1
( SI A ) 1
( S )
m 1
Pm i 1 ( S ) Ai
i0
( 2.37 )
( S )
其中
Pm 1 ( s ) 0 S m 1 m 2 S m 1
Pm 2 ( s ) 0 S m 2 1 S m 3 m 2
P ( s ) S
1 0 1
P0 ( s ) 0
形式Ⅱ
如果 n n 方阵的特征为两两相异,则(2.36)式也可以写成如下
形式
m 1 m
S m i Ai j 1
j
j 0 i j 1
( SI A ) 1 ( 2.38 )
SI A
(4 ) 利 用 Sylvester 的 插
补公式法计算 e At
设 n n 矩阵 A 有两两相异的特征值 1 , 2 , 3 , , n , 则 e At 可表示
为:
n
( A 1 I )( A k 1 I )( A k 1 I ) ( A n I )
e At
e t k
( k 1 )( k k 1 )( k k 1 ) ( k n )
( 2.39 )
k 1
0 1 0
1 ,求 e At (用内插公式求)
例 2.6 已知 A 0 0
6 11 6
23
解:由式(2.39)可知, 首先应求出特征值。
0 1 0
f ( ) I A I 0 0 1
6 11 6
1 0
0 1 ( 1 )( 2 )( 3 )
6 11 6
所以 1 1 , 2 2 , 3 3
( A 2 I )( A 3 I ) ( A 1 I )( A 3 I )
e At e 1 t e2t
( 1 2 )( 1 3 ) ( 2 1 )( 2 3 )
( A 1 I )( A 2 I )
e3t
( 3 1 )( 3 2 )
2 1 0 3 1 0
1 t
e 0 2 1 0 3 1
2
6 11 4 6 11 3
1 0 3
1 1 0
e 2 t 0 1 0
1 3 1
6 11
5 6 11 3
1 1 0 2 1 0
1 3t
e 0 1 1 0 2 1
2
6 11 5 6 11 4
6 5 1 2t
6 8 2 3t
2 3 1
et e e
6 5 1 12 16 4 6 9 3
2 2 2
6 5
1
24 32 8
18 27 9
(5) 变 换 A 为
对角标准型或 Jordon 标准型来计算 e At
a)A 特征值互异
当 A 有两两相异特征值时,必能找到非奇异矩阵 T ,使下式成立,
即 T 1 AT
由式(2.22)性质七有
24
e At ( t ) T e t T 1
0 1
例 2.7 已知 A At
,求 e 。
2 3
1
解: f ( ) I A 2 3 2
2 3
所以 1 1, 2 2
0 1 p11 p11
由 A P 1 1 P 1 ( 1 )p
2 3 p21 21
p11 1
得 p 1
21
0 1 p12 p12
同理 AP 2 2 P 2 ( 2 )p
2 3 p22 22
p12 1
得 p 2
22
p11 p12 1 1 1 2 1
T , T
p21 p22 1 2 1 1
At t 1 1 1 e t 0 2 1
所以 e Te T
1 2 0 e 2 t 1 1
2e t e 2 t e t 2e 2t
t 2t
2e 2e e t 2e 2 t
b)A 的特征值有重根
在 A 的特征值有重根的情况下,根据公式(2.24)性质九可知
e At T e Jt T 1
其中 J T 1 AT
3 1 0
例 2.8 已知 A 0 3 1 ,求 e At
4 0 0
解:先求 A 的特征值
25
3 1 0
f ( ) 0 3 1 ( 3) 2 4 ( 1) 2 ( 4)
4 0
所以 1 2 1 3 4
1 1 0 e t te t 0
则 J 0 1 0 , e Jt 0 et 0
0 0 4 0 0 e 4t
由上一章例 1.18 可知
1 1 1 11 7 4
1
T 2 3 1 T 1 6 3 3
9
4 8 1 4 4 1
所以
e At T e Jt T 1
t
1 1 1 e te t 0 11 7 4
1
2 3 1 0 e t 0 6 3 3
4t 9
3 8 1 0 0 e 4 1
4
et te t e t e 4t 11 7 4
1
2e t 2e t 3e t e 4t 6 3 3
4e t 4te t 8e t e 4t 9 4 4 1
5e t 6te t 4e 4t 4e t 3te t 4e 4t e t 3te t e 4t
1
4e t 12te t 4e 4t 5e t 6te t 4e 4t e t 6te t e 4 t
9 t
4e 24te 4e
t 4t
4e t 12te t 4e 4t 8e t 12te t e 4 t
三、非齐次方程的解
现在来讨论线性定常系统在控制作用 u(t ) 下的强制运动。此时状态
方程为一般的非齐次方程
x A x B u ( 2.40)
26
在初始时刻 t 0 时,初始状态为 x ( t 0 ) ,则其解为:
即
dt
e x( t ) e At B u( t )
d At
( 2.43)
对上式在 t 0 ~ t 之间积分,有
即 e
At
x( t ) e At 0 x ( t 0 ) tt 0 e A B u( )d
两边同左乘 e At ,得
x ( t ) e A( t t 0 ) x ( t 0 ) tt 0 e A( t ) B u( )d
故(2.41)式得证。
若对(2.43)式在 0 ~ t 间积分,即可证明(2.42)式。式(2.41)和
(2.42)可分别写成如下形式:
x ( t ) ( t t 0 ) x ( t 0 ) tt 0 ( t ) B u( )d
及 x ( t ) ( t ) x (0) 0t ( t ) B u( )d
例 2.9 求状态方程
27
x 1 0 1 x1 0
u
x 2 2 3 x 2 1
在 u( t ) 1( t ), 初状态为 x1 ( 0), x2 ( 0) 时的解。
解:在上面例题中,我们已经求出
At 2e t e 2t e t e 2t
e ( t ) t 2t
2e 2e e t 2e 2t
因此,根据(2.42)式,有
x1 ( t ) 2e t e 2 t e t e 2t x1 ( 0 )
x ( t ) t 2t
2 2e 2e e t 2e 2t x 2 ( 0 )
t 2e ( t ) e 2( t ) e ( t ) e 2( t ) 0
0 ( t ) 1( )d
2e 2e 2( t ) e ( t ) 2e 2( t ) 1
( 2e t e 2 t ) x1 ( 0 ) ( e t e 2 t ) x 2 ( 0 )
( 2e t 2e 2t ) x1 ( 0 ) ( e t 2e 2 t ) x 2 ( 0 )
( t ) e 2( t )
t e
0 d
( t ) 2( t )
e 2e
( 2e t 2e 2t ) x1 ( 0 ) ( e t e 2t ) x 2 0
( 2e t 2e 2t ) x1 ( 0 ) ( e t 2e 2 t ) x 2 ( 0 )
1 t 1 2t
e e
2 2
t 2t
e e
1 1 2t
2 x ( 0 ) x ( 0 ) 1 e t
x
1 ( 0 ) x ( 0 ) e
2
1 2 2
2 ( t 0 )
2 x1 ( 0 ) x 2 ( 0 ) 1 e t 2 x1 ( 0 ) 2 x 2 ( 0 ) 1 e 2t
在特殊的控制作用下,例如在脉冲函数,阶跃函数或斜坡函数的
作用下,系统解(2.42)可简化为如下公式:
28
(1) u( t ) 为脉冲函数时,即 u( t ) k ( t ), x (0 ) x(0) 时,
x ( t ) e At x (0) e At B k
式中 k 是与 u( t ) 同维常数向量。
(2) u( t ) 为阶跃函数时,即 u( t ) k 1( t ), x (0 ) x (0) 时,
x ( t ) e At x (0) A 1 (e At I ) B k
(3) u( t ) 为斜坡函数时,即 u( t ) k t 1( t ), x (0 ) x(0) 时
x ( t ) e At x ( 0) A 2 ( e At I ) A 1t B k
非齐次方程也可以用拉氏变换方法求解。对非齐次方程(2.40)式
两边进行拉氏变换:
S x ( s ) x ( 0) A x ( s ) B u( s )
化简为
( SI A) x ( s ) x ( 0) B u( s )
所以 x ( s ) ( SI A) 1 x(0) B u( s )
对上式进行反拉氏变换,得
x ( t ) L1 { x ( s )} L1 {( SI A)1 x (0) B u( s ) }
例 2.10 已知系统的状态方程为
2 13
x 12
3 x u( t ), u( t ) 1( t ) 为单位阶跃函数,初始
36 1 1
条件 x1 ( 0) 2, x2 (0) 1 ,求此状态方程的解。
解:
1 S 1 2/ 3
2 ( S 4)( S 9)
S 12 ( S 4)( S 9)
( SI A) 1 3
36 36 S 12
S 1
( S 4)( S 9) ( S 4)( S 9)
2 1
又 x ( 0) u( s )
1 S
29
所以
1 6S 1
1 3S 3S
1
bu( s ) 3 , x (0) bu( s )
S 1 S 1
1 S S
从而有
x( s ) ( SI A) 1 x( 0) bu( s )
6 S 1 2 S 3 S 1
2
S 1 2/ 3
( S 4)( S 9)
( S 4)( S 9) 3 S S ( S 4)( S 9)
36 S 12 S 1 S 59
( S 4)( S 9) ( S 4)( S 9) S ( S 4)( S 9)
将上式进行部份分式展开:
1 21 136
36
20 45
S S4 S 9
x( s )
63 68
5 5
S 4 S9
并作拉氏反变换,得
1 21 4 t 136 9t
e e
x1 ( t ) 36 20 45
x ( t ) 63 (t 0)
2 e 4 t 68 e 9 t
5 5
§2—2 线性时变系统状态方程的解
状态变量法的优点之一就是具有广泛的适应性,它可以推广到线
性时变系统。设线性时变系统的状态方程为:
x A( t ) x B( t )u ( 2.44)
时变系统不一定有解析解,但当系统矩阵 A( t ) , B( t ) 的元素在定义区
间 t 0 , t 上是绝对可积时,对每一初始状态 x ( t 0 ) 存在唯一解。
一、线性时变齐次状态方程的解
首先来研究线性时变齐次状态方程的解。状态方程为:
30
x A( t ) x
( 2.45)
x ( t ) t t0 x ( t 0 )
其解为
x( t ) (t , t0 ) x( t0 ) ( 2.46)
式中 ( t , t 0 ) 类似于前述线性时不变系统中的 ( t t 0 ) 它也是 n n 非奇
异方阵,并满足如下的矩阵微分方程和初始条件
( t , t 0 ) A( t ) ( t , t 0 ) ( 2.47 )
和 (t 0 , t0 ) I ( 2.48)
证明:将解式(2.46)代入原方程(2.45)式,有
d
( t , t 0 ) x ( t 0 ) A( t ) ( t , t 0 ) x ( t 0 )
dt
即有 ( t , t 0 ) A( t ) ( t , t 0 )
在解(2.46)式中令 t t 0 时有
x( t0 ) ( t0 , t0 ) x(t0 )
即 ( t0 ,t0 ) I
这就证明了由满足式(2.47),(2.48)的 ( t , t 0 ) ,按(2.46)式所
求得的 x(t ) 确是原齐次状态方程式(2.45)的解。和前节所述的时不变
系统一样,也是初始状态的转移,故 ( t , t 0 ) 也称为时变线性系统状态
转移矩阵。在一般情况下,只需将 ( t ) 或 ( t t 0 ) 改为 ( t , t 0 ) ,上节
关于时不变系统所得到的大部分结论,均可推广应用于线时变系统。
二、 状 态 转 移 矩 阵 ( t ,t0 ) 的
基本性质
(1) ( t 2 , t1 ) ( t1 , t 0 ) ( t 2 , t 0 ) ( 2.49 )
证明:由式(2.46)可导出
x ( t1 ) ( t1 , t 0 ) x ( t 0 )
x( t 2 ) ( t 2 , t0 ) x( t0 )
x ( t 2 ) ( t 2 , t1 ) x ( t1 )
( t 2 , t1 ) ( t1 , t 0 ) x ( t 0 )
31
故 ( t 2 , t 1 ) ( t 1 , t 0 ) ( t 2 , t 0 )
(2) ( t , t ) I ( 2.50 )
见式(2.48)定义
(3) ( t , t0 ) 1 ( t0 , t )
根据式(2.48),(2.49)可知
( t , t 0 ) ( t 0 , t ) ( t , t ) I
又 ( t 0 , t ) ( t , t 0 ) ( t 0 , t 0 ) I
所以 ( t , t 0 )与 ( t 0 , t ) 为互逆矩阵。
(4) ( t , t ) A( t ) ( t , t )
0 0
见定义(2.47),在这里, A( t ) 和 ( t , t0 ) 一般的说是不能交换的。
三、状态转移矩阵 ( t , t0 ) 的计算
时变系统的状态转移矩阵 ( t , t0 ) 和定常系统的 ( t t0 ) 或 ( t ) 在形
式上和某些性质上有类似之处,但在本质上两者是有区别的。可以看出
( t t0 ) 或 ( t ) 是 ( t t0 ) 或 t 的函数,而 ( t , t0 ) 则是 t 和 t0 的函数。
在线性定常系统中 ( t t0 ) 或 ( t ) 一般可写成指数矩阵形式,即写成
e A( t t 0 ) 或 e At ,但在时变系统中 ( t , t0 ) 往往不能写成指数矩阵形式,
除非它满足某种条件。
设(2.45)式的解可以写成如下形式:
t
t0 A( ) d (2.51)
x( t ) e x( t0 )
根据指数矩阵的展开法则,上式可写成
3
1 2 1
x( t ) { I t
t0 A( )d t
t0 A( )d t
t0 A( )d } x ( t 0 ) ( 2.52)
2! 3!
对(2.52)式两边求导,得:
1 1
x ( t ) A( t ) A( t ) tt0 A( )d tt0 A( )dA( t ) x ( t 0 ) ( 2.53)
2 2
将(2.52)和(2.53)式代入(2.45)式,可以看出,等式左右两边只
有当 A( t )和
t
t0 A( )d 是可交换的,等式才能成立。即若等式
32
A( t ) tt 0 A( )d tt 0 A( )dA( t ) ( 2.54 )
成立时,式(2.53)将变为:
x
( t ) A( t ) A( t ) t
t0
A( )d x ( t 0 )
A( t ) I
t
t0 A( )d x ( t 0 ) ‘
A( t ) x ( t )
所以式(2.51)是原方程(2.45)式的解。
那么,在什么条件下 A(t ) 和 tt A( )d 才是可交换的呢?以下对此 0
问题作简单说明。
若(2.54)式成立,显然有
A( t ) t
t0
A( )d t
t0
A( )dA( t )
t
t0
A( t ) A( ) A( ) A( t ) d 0
若上式对任意 t 皆成立,则对于任意 t 1和t 2 ,等式
A( t1 ) A( t 2 ) A( t 2 ) A( t1 ) ( 2.55 )
应能成立。反之,若等式(2.55)成立, A( t ) 和 t
t0 A( )d 就是可交
换的。以上便是要求的条件,由此可以得出如下结论:当(2.55)式对
任意 t 1和t 2 都成立时,式(2.51)即为式(2.45)的解,这时系统的状
态转移矩阵可写成:
t
A( )d
( t ,t0 ) e t0
I t
t0 A( )d
1 t
2! 0
tA( )d
2
1 t
3! 0
t A( )d
3
( 2.56 )
一般地说,上式不能表达成封闭的形式,或者说,上式一般不能
用有限多项式表示,但在特殊情况下也是可能的。
例 2.11 已知对象的状态方程为
0 1
x ( t ) ( t 1) 2
x( t )
0 0
求系统的状态转移矩阵。
33
解:由于
1 1
0 0
A( t1 ) A( t 2 ) ( t1 1 )
2
( t 2 1 ) 0 A( t 2 ) A( t1 )
2
0 0 0 0
满足(2.55)式所给出的条件,从而 A( t ) 和 t
t0 A( )d 是可交换的。
而系统的状态转移矩阵可由式(2.56)所给出,即
t 2
A ( ) d 1 t
I A( )d
2! t 0
t
( t , t0 ) e t0
A( )d
t0
2
1
t 0
1
1 t 0
I ( 1 )2 d
2!
( 1 ) 2 d t0
t0
0 0
0 0
1 t t0
上式中 t 0 d 0
2
( t 1 )( t 0 1 )
t0 ( 1 )
0 0 0 0
k
t t0
而 0 ( t 1 )( t 0 1 ) 0 ( k 2 ,3 , )
0 0
将上述结果代入 ( t , t 0 ) 表达式后,得
t t0 t t0
1 0 0 1
( t ,t0 ) ( t 1 )( t 0 1 ) ( t 1 )( t 0 1 )
0 1
0 0 0 1
一般情况下, A( t ) 不能满足可交换的条件(2.55)式。这时, ( t , t 0 )
的计算,是用级数近似法,即:
( t , t0 ) I tt0 A( 1 )d 1 tt 0 A( 1 ) t 1 A( 2 )d 2d 1
0
1 2
t
t0 A( 1 ) t 0 A( 2 ) t 0 A( 3 )d 3d 2d 1 ( 2.57 )
证明:在上述情况下,可有
34
( t , t0 )
d
dt
I tt 0 A( 1 )d 1 tt 0 A( 1 ) t 1 A( 2 )d 2 d 1
0
tt 0 A( 1 ) t 1 A( 2 ) t 2 A( 3 )d 3 d 2 d 1
0 0
A( t ) A( t ) t
t0 A( 1 )d 1 A( t ) t
t0 A( 1 ) t 1 A( 2 )d 2 d 1
0
A( t ) I t
t0 A( 1 )d 1 t
t0 A( 1 ) t 1 A( 2 )d 2 d 1
0
A( t ) ( t , t0 ) ( 2.58 )
又 ( t0 , t0 ) I 0 0 I ( 2.59 )
可知式(2.57)满足式(2.58)和式(2.59)。
例 2.12 已知线性时变系统的状态方程为
0 1
x x , 计算 ( t ,0)
0 t
解: 因为
0 1 0 1 0 t 2
A( t1 ). A( t2 ) 0 t 0 t t
0 t1 2 1 2
0 1 0 1 0 t1
A( t2 ).A( t1 ) 0 t 0 t t A( t1 ).A( t2 )
0 t 2 1 1 2
所以 A( t ) 和 t
t0 A( )d 是不能交换的, ( t , t 0 ) 不能写成矩阵指
数形式,只能用级数展开。故按式(2.57)作 ( t , t 0 ) 的近似计算。
t t 01 0 t
0 A( )d 0 0 d 0 1 t2
2
t 1 t 0 1 1 0 1
0 A( 1 )0 A( 2 )d 2d 1 0 0 1 0 0 2 2 1
d d
1 0
t 0 1 t 0
1 2 0 1 t3
2 1 d
0 0 0 1 2 d 1 0 0 1 3
1 6
1 4
1 2 1 2 1 0 8
t
35
t 1 2 t 0 1 3
6 1 d
0 A( 1 )0 A( 2 )
0
A( 3 )d 3 d 2 d 1 A( 1 )
0 1 4
1
0 8 1
1 0
t 0
1 3
6 1 d
0 1 5
t
1 40
0 0 0 1 4
1 6
1 8 1 0 48
t
…… ……
所以
0 t 0 1 t 3 0 1 5
t
( t ,0 ) I 1 2 61 4 40
0 2 t 0 8 t 0
1 6
48
t
1 t 1 t 3 1 t 5
6 40
0 1 2 t 8 t 48 t
1 2 1 4 1 6
例 2.13 已知时变系统状态方程为
t 1
x x
1 t
试求其 ( t ,0 )
1 2
t 1 2 t t
0 A( )d
t
解: 0
1 d 1 2
t t
2
由于
1 2 1
t 1 2 t t t2 t t 1
A( t ) 0 A( )d
t
2
1 t t 1 2 1 2 1 t
t t t
2 2
1 t3 t 3 2
t
0 A( )dA( t )
t
2 3 2 2
1 3
2 t 2
t t
即 A( t ) 和 t
t0 A( )d 是可交换的,状态转移矩阵可按式(2.56)
计算。
36
t
A( )d
( t ,0 ) e t0
2
1 2 1 2
1 0 2 t t 1 2 t t
1 1
0 1 t 2
t 2 t 2
t
2 2
t4 t3
1 t 2
t
8 2
3 4
t t t
1 t 2
2 8
当然也可按(2.57)式计算。
( t ,0 ) I tt 0 A( 1 )d 1 tt0 A( 1 ) tt0 A( 2 )d 2d 1
1 2 1 1 1 3
1 0 2 t t t4 t2 t
8 2 2
0 1 t 1 2 1 1 4 1 2
t t3 t t
2 2 8 2
1 4 1 3
1 t 2
t t t
8 2
1 1 4
t t 3 1 t t
2
2 8
可知它们的计算结果是一致的。
四、线性时变非齐次方程的解
线性时变非齐次方程(2.44)式的解,类似于时不变系统为
证明 :因线性系统满足叠加定理,故可将式(2.44)的解看成由初始
状态 X ( t 0 ) 的转移和由控制作用激励的状态 X u ( t ) 的转移两部分组成,
37
x( t ) ( t , t0 ) x( t0 ) ( t , t0 ) x u ( t )
(a)
( t , t0 ) x ( t 0 ) x u ( t )
代入式(2.44),有
( t , t 0 ) x( t 0 ) x u ( t ) ( t , t 0 ) x u ( t )
A( t ) x ( t ) B( t ) u( t )
A( t ) ( t , t 0 ) x ( t 0 ) x u ( t ) ( t , t 0 ) x u ( t )
A( t ) x ( t ) B( t )u( t )
进一步可写成
A( t ) x ( t ) ( t , t 0 ) x u ( t )
A( t ) x ( t ) B( t )u( t )
所以
x u ( t ) ( t , t 0 )1 B( t )u( t )
( t 0 , t ) B( t )u( t )
在 t 0 ~ t 区间内对上式两边进行积分,有
于是将(b)式代入(a)式,得:
38
故 x ( t ) ( t , t0 ) x ( t 0 ) tt 0 ( t , ) B( )u( )d
为原非齐次方程(2.44)式的解。
§2.3 线性连续时间状态空间表达式的离散化
如果用数字计算机对连续时间状态方程求解,或者对连续受控对象
采用数字计算机进行在线控制,都要碰到一个将连续时间系统化为离
散时间系统的问题。本节将讨论线性连续时间状态空间表达式的离散
化方法。
一、线性时变系统的离散化
设原线性系统的状态空间表达式为:
x A( t ) x( t ) B( t )u( t )
( 2.61)
y C ( t ) x( t ) D( t )u( t )
离散化后状态空间表达式为:
x ( k 1)T G ( kT ) x( kT ) H ( kT )u( kT )
( 2.62)
y( kT ) C ( kT ) x( kT ) D( kT ) u( kT )
式(2.61)、(2.62)之间的系数关系如下
G ( kT ) ( k 1 )T , kT
( k 1 )T
H ( kT ) ( k 1 )T , B( )d
kT
C ( kT ) C ( t ) t kT
D( kT ) D( t ) t kT ( 2.63 )
式中 ( k 1 )T , kT 表示 ( t , t 0 ) 在 kT t ( k 1)T 区段内的状态
转移矩阵,而 ( t , t 0 ) 则表示原连续系统(2.61)式的状态转移矩阵。
证明:由上节(2.60)式可知(2.61)式的解为:
x( t ) ( t , t 0 ) x 0 tt 0 ( t , ) B( )u( )d ( 2.64)
39
对 上 式 离 散 化 , 令 t ( k 1 )T , t 0 hT , T 为 采 样 周 期 , 则 得
( k 1)T , kT x ( kT ) ( k 1)T , kT
( kT , hT ) x 0 ( k 1)T , kT kT
hT ( kT , ) B ( )u( )d
( k 1)T , hT x 0 kT
hT ( k 1)T , B ( )u( )d ( 2.67 )
将(2.65)式减去(2.67)式得:
x ( k 1)T ( k 1)T , kT x( kT ) (kTk 1)T ( k 1)T , B( )u( )d
( 2.68)
上式中,令
G ( kT ) ( k 1 )T , kT
H ( kT ) ( k 1 )T
kT ( k 1 )T , B( )d
设在区间 kT , ( k 1 )T 内, u( ) u( kT ) ,则(2.68)式可简写成:
x ( k 1)T G ( kT ) x ( kT ) H ( kT ) u( kT )
同时,对(2.61)式输出方程离散化,则证明了
y( kT ) C ( kT ) x ( kT ) D( kT ) u( kT )
二、线性时不变系统的离散化
对于线性时不变系统
x A x B u
( 2.69)
y C x Du
离散化状态空间表达式为
x ( k 1)T G (T ) x ( kT ) H (T )u( kT )
( 2.70)
y ( kT ) C x ( kT ) D u( kT )
40
其中 G ( T ), H ( T ), C , D 均为常数阵,且
G (T ) e AT
( 2.71)
H (T ) ( 0 e dt ) B
T At
证明 :由于时不变系统是时变系统的一种特殊情况,所以只需要
证明式(2.71)成立即可。由(2. 63)式可得
G ( kT ) ( k 1 )T kT ( T ) e AT G ( T )
H ( kT ) (kTk 1 )T ( k 1 )T Bd
上式中,令 t (k 1)T , 则 dt d
( k 1 )T
积分项 T 0 dt ,因此
0 T
kT d dt
H ( kT ) ( T0 ( t )dt )B ( T0 e At dt )B H ( T )
所以时不变系统的状态方程为:
x ( k 1)T G (T ) x ( kT ) H (T )u( kT )
因为输出方程是状态向量和控制向量的某种线性组合,离散化后,这
种组合关系不变,故C 、 D 是不变的。
例 2.14 求连续系统
0 1 0
x ( t ) x ( t ) u( t )
0 2 1
的离散状态空间表达式。
解:由式(2.71)计算
1
G( T ) e AT
L 1
( SI A ) 1 1 S
L
0
1
S 2
1 1
1
L 1 S S ( S 2 ) 1 ( 1 e 2T )
2
0 1 0 e 2T
S 2
41
1
1 ( 1 e 2t ) 0
H(T ) T At
0 e dt b T
2 dt
0
1
0 e 2t
1 1 1
T ( T e 2T ) 0
2 2 2
1 2T 1
0 e 1
2 2
1 e 2T 1
(T )
2 2
1 2T
2 ( 1 e )
从而可求得离散化状态方程为:
1 e 2T 1
1
1 (1 e 2T
) 2 (T 2
)
x ( k 1)T 2 x ( kT ) u( kT )
0 e 2T 1
(1 e 2T )
2
假如采样周期 T 为 1 秒,则上述状态方程为:
1 0.432 0.284
x ( k 1) x ( k ) 0.432 u( k )
0 0 .135
三、近似离散化
在采样周期 T 较小,一般当其为系统最小时间常数的十分之一左右
时,时不变系统离散化状态方程可近似表达为:
x ( k 1)T (TA I ) x ( kT ) TB u( kT ) ( 2.72)
G ( T ) AT 1
即 ( 2.73 )
H ( T ) TB
证明:根据导数的定义
x( t0 t ) x(t0 )
x ( t 0 ) lim
t 0 t
现研究 t 0 kT 时,和 t (k 1)T 这一段的导数,有
x ( k 1)T x( kT ) x ( k 1)T x kT
x ( kT ) Lim
T 0 T T
以此代入原方程
42
x ( t ) A x ( t ) B u( t )
可得
x ( k 1)T x ( kT )
A x ( kT ) B u( kT )
T
即 x ( k 1)T ( I AT ) x ( kT ) TB u( kT )
例 2.15 将例 2.14 按(2.72)、(2.73)两式计算来进行离散化。
解:
0 1 1 0 1 T
G ( T ) TA I T
0 2 0 1 0 1 2T
0 0
H ( T ) TB T
1 T
将例[2.14]、例[2.15]两种计算方法在不同采样周期 T 时的计算结果
列表如表 2.1 所示,可知 T 0.05 时,两者更为接近。
表 2.1
T G (T ) H (T )
T 1 2T 1 e 2T 1 0
1 (T e ) (T ) T
0
2
1 T 2 2
e 2T 0 1 2T 1 (1 e 2T )
2
1 1 0.432 1 1 0.284 0
0 0.135 0 1 0.432 1
43
对线性时变系统也可仿上面时不变系统近似离散化的方法,得近似
的计算公式如下:
§2.4 离散状态方程的解
一、线性时不变离散状态方程的解
现讨论离散状态方程的解,首先研究时不变系统的情况,设时不变
系统状态方程为:
x( k 1) G x ( k ) H u( k )
( 2.75)
x ( k ) k 0 x ( 0)
对于时不变系统的求解,主要有两类方法,一类是用矩阵差分方
程的迭代法,另一类是用 Z 变换法。
1.迭代法求解
对于任意采样时刻 k 0 ,方程(2.75)的解可用迭代法求得,即先
令 k 0 ,由已知条件 x ( 0) , u( 0 ) 可先求得 x (1) ,再令 k 1 ,由
44
k 1
或 x ( k ) G x (0) G H u( k j 1)
k j
( 2.76b )
j 0
上两式可以用向量矩阵形式
x(1) G
1
H 0 0 0 u(0)
x( 2) G 2 GH H 0 0 u(1)
x( 3) G 3 x(0) G 2 H GH H 0 u( 2)
x( k ) G k G k 1 H G k 2 H G k 3 H H u( k 1)
( 2.76c )
解式(2.76)是按初始时刻为 k 0 得到的,若初始时刻从 k h 开始,
且相应的初始状态为 X (h) ,则其解为:
k 1
x( k ) G kh
x ( h) G k j 1 H u( j ) ( 2.77a )
jh
k 1
或 x( k ) G kh
x( h) G j h H u( k j 1 h) ( 2.77b)
jh
由解式(2.76)式(2.77)可以看出,离散系统的解和连续系统的解
45
(1) ( k h) ( k h1 ) ( h1 h), ( k h1 h) ( 2.80)
(2)当且仅当 G (k ) 是非奇异时, 1 ( k ) ( k ) ( 2.81)
(3)如果 G 为对角线矩阵,且 G diag ( g1 , g 2 , g n ) 则 ( k ) 也必为
对角线矩阵,即为
( k ) diag ( g1k , g 2k , , g nk )
( 4 ) 设 连 续 系 统 系 数 矩 阵 为 A具 有 两 两 相 异 的 特 征 值
1 , 2 , 3 , , n , G e AT , T 为采样周期,记 i e iT ,则
n G j I
n
(k ) k
( 2.82)
j 1
i
i 1 i
ji
j
而(2.77)式可写成:
k 1
x ( k ) ( k h) x ( h) ( k j 1) H u( j )
jh
k 1
或 x ( k ) ( k h) x( h) ( j h) H u( k j 1 h) ( 2.84)
jh
例 2.16 离散状态方程
x ( k 1) G x ( k ) hu( k )
0 1 1
其中 G ,h 1
0.16 1
46
1
试求当初始状态 x ( 0) 和控制作用为 u( k ) 1 时,此系统的
1
( k ) 和 x (k ) 。
解:根据定义
k
k 0 1
( k ) G
0.16 1
按上式直接计算 (k ) 有一定困难。为此,将原状态方程变换成约当标
准型,即将 G 变换为对角型。
~ ( k ) 代入原方程得:
令 x(k ) T x
x~ ( k 1) T 1GT x
~ ( k ) T 1 hu( k )
相应地有
~
T 1GT ( k ) (T 1GT )k ( )k
k 1
~ ~ ~ ~
x ( k ) ( k ) x (0) ( j )T 1 hu( k j 1) ( 2.85)
j0
为此求特征值
1
I G ( 0.2 )( 0.8 ) 0
0.16 1
1 0.2 2 0.8
k
0.2 0 ~ 0.2 0 ( 0.2 )k 0
所以 , ( k )
0 0.8 0
0.8 0 ( 0.8 )k
1 1 4/ 3 5/ 3
又求得 T T 1
0.2 0.8 1 / 3 5 / 3
从而求得
~ 1 1 ( 0 .2 ) k 0 4 / 3 5/ 3
( k ) T ( k )T 1
0.2 0.8 0 ( 0 .8 ) k 1 / 3 5 / 3
47
1 4( 0.2 )k ( 0.8 )k
5 ( 0 .2 ) k ( 0 .8 ) k
3 0 .8 ( 0 .2 ) k ( 0 .8 ) k ( 0.2 )k 4( 0.8 )k
~ ( k ) ,该式右边第一项为:
现按(2.85)式求 x
~ ~ ~ 1
( 0.2)k 0 4 / 3 5 / 3 1
( k ) x (0) ( k )T x(0)
0 ( 0.8)k 1 / 3 5 / 3 1
1 ( 0.2)
k
3 4( 0.8)k
该式右边第二项为:
k 1 k 1
~ ~ 4/ 3 5 / 3 1
( j )T 1
hu( k j 1 ) ( j ) 1 / 3 1
j 0 j 0 5 / 3 1
0 3 k 1 3( 0.2 )
k 1 j
( 0.2 ) j
( 0.8 ) j 2 j 0 2( 0.8 ) j
j 0 0
3 1 ( 0.2 ) ( 0.2 )2 ( 0.2 )k 1
2 1 ( 0.8 ) ( 0.8 )2 ( 0.8 )k 1
3 1 ( 0.2 )k
1 . 2
2 1 ( 0 . 8 ) k
1.8
所以
1
1 ( 0.2) k
17
( 0.2 ) k
5
~ ( k ) 1 (0.2) 0.4 6 2
k
x 22 10
3 4( 0.8) k 1
0.9
1 ( 0.8) k
9
( 0.8) k
9
48
17 5
( 0 .2 ) k
~(k ) 1 1 6 2
x(k ) T x 0.2 0.8 22
( 0.8)k 10
9 9
17 22 25
6 ( 0. 2 ) k
( 0 . 8 ) k
9 18
( k 0)
3 . 4 17 .6 7
( 0.2) k
( 0.8) k
6 9 18
2.Z 变换求解
zx ( z ) z x(0) G x( z ) H u( z )
得
( zI G ) x ( z ) zx (0) H u( z )
即 x ( z ) ( zI G )1 z x ( 0) H u( z )
对上式两边取 Z 反变换。即得解 x (k ) :
x ( k ) Z 1 ( zI G ) 1 z x ( 0) Z 1 ( zI G ) 1 H u( z ) ( 2.86)
式(2. 86)和式(2.76)形式虽不不同,但实际上是完全一致的。
即有
G k ( k ) Z 1 ( zI G ) 1 z ( 2.87 )
G k j 1 H u( j ) Z 1 ( zI G )1 H u( z )
k 1
和 ( 2.88 )
j 0
上两式可用如下证明:
先求 G k 的 变换,
G z
k k
ZG k
I Gz 1 G 2 z 2 ( 2.89 )
k 0
式(2.89)两边同左乘 Gz 1
49
Gz 1 Z G k Gz 1 G 2 z 2 G 3 z 3 ( 2.90 )
式(2.89)减式(2.90)有: ( I Gz 1 ) Z G k I
对 Z G k 求解,有
式(2.91)两边取 Z 反变换,故得式(2.87),
G k Z 1 ( zI G ) 1 z
再利用卷积求和公式证明式(2.88),
k 1
Z G k j 1 H u( j ) Z G k 1 HZ u( k )
j 0
Z G k z 1 HZ u( k ) ( zI G ) 1 H u( z ) ( 2.92 )
式(2.92)两边取 Z 反边换,即得式(2.88):
G k j 1 H u( j ) Z 1 ( zI G ) 1 H u( z )
k 1
j0
z
解:因为 u( k ) 1 ,所以 u( z )
z 1
由式(2.87)
50
G k ( k ) Z 1 ( zI G )1 z
z 1
1
1
Z z
0.16 z 1
z z 1 1
Z 1
( z 0.2 )( z 0.8 ) 0.16 z
4 1 5 5
z
Z 1 z 0.2 z 0.8 z 0.2 z 0.8
0.8 0.8 1 4
3
z 0.2 z 0.8 z 0.2 z 0.8
1 4( 0.2 )k ( 0.8 )k 5( 0.2 )k 5( 0.8 )k
3 0.8( 0.2 )k 0.8( 0.8 )k ( 0.2 )k 4( 0.8 )k
再计算
z z
2
z z 1 z 1
z x ( 0) H u( z )
z
z z 2z
2
z 1 z 1
x ( z ) ( zI G )1 z x ( 0) H u( z )
z2
1 z 1 1 z 1
2
( z 0.2)( z 0.8) 0.16 z z 2 z
z 1
( z 2 2 )z 17 z 22
z 25
z
6 9 18
( z 0.2 )( z 0.8 )( z 1 ) z 0.2 z 0.8 z 1
( z 2 1.84 z )z 3.4 z 179.6 z 187
z
6
( z 0.2 )( z 0.8 )( z 1 ) z 0.2 z 0.8 z 1
51
从而得离散状态方程的解为:
17 22 25
6 ( 0.2 ) k
( 0 .8 ) k
9 18
x ( k ) Z 1 x ( z ) ( k 0)
17 ( 0.2)k 88 ( 0.8)k 7
30 45 18
显然和例 2.16 的结果是一致的。
3.线性时不变离散系统稳定条件
对线性时不变离散自由运动方程
x ( k 1) G x ( k )
其解为 x( k ) ( k ) x 0
依定义,当系统渐近稳定时,必有
Lim x ( k ) Lim ( k ) x 0 0
k k
由于起始条件 X 0 是任意的非零向量,上式即等价于
Lim ( k ) 0
k
似地推导,为简单起见,这里考虑为单值的情况)。则由(2.82)式,
可导出:
n
n G I
Lim ( k ) Lim ik
j
0
k k i 1
i j
j 1
ji
显然,欲使上式成立即要求
52
Lim ik 0 ( i 1,2 , n )
k
也即 i 1 ( i 1,2 , n ) ( 2.93 )
这即表明,线性时不变离散系统稳定的充分必要条件为其系数矩
阵G 的特征值的模均小于 1,即分布在 Z 平面上以原点为中心的单位
园内。而且,如果原连续系统是稳定的,即 Re i 0 , ( i 1 ,2 , , n ) 则
T R T
其离散化系统,由于 i e i e e i 1 , ( i 1,2 , , n ) 也将一定
是稳定的。事实上,这个结论是和经典控制理论中所指出的“时不变
线性离散系统稳定的充要条件为其脉冲传递函数的极点的模均小于 1”
的条件相等价的。
二、线性时变离散状态方程的解
现简单地研究一下时变离散系统状态方程的解。设时变系统的状
态方程为:
x( k 1)T G ( kT ) x( kT ) H ( kT )u( kT )
( 2.94)
x( hT ) x 0
那么它的解是
k 1
x ( kT ) ( kT , hT ) x 0 kT , ( j 1)T H ( jT )u( jT ) ( 2.95)
jh
证 明 :只需证明(2.95)式满足原方程和起始条件(2.94)式即可,
为此,有
53
k
x ( k 1)T ( k 1)T , hT x 0 ( k 1)T , ( j 1)T H ( jT )u( jT )
jh
k 1
( k 1)T , hT x 0 ( k 1)T , hT 1
( jT , hT ) H ( j 1)T u ( j 1)T
j h 1
( kT , hT ) G ( k 1 )T G ( k 2 )T G ( h 1 )T G ( hT )
( k 1 )T , hT G ( kT ) G ( k 1 )T G ( h 1 )T G ( hT )
G ( kT ) ( kT , hT )
x ( k 1)T G ( kT ) ( kT , hT ) x 0 G ( kT ) ( kT , hT )
k
1 ( jT , hT ) H ( j 1)T u ( j 1)T
j h 1
( hT , hT ) x0
x0
表明式(2.95)也满足起始条件。由此结论得证。
54
第4章 线性定常系统的综合(模块十二)
前三章我们着重讨论了状态空间的分析方法。利用这些方法可以
分析系统的结构、性能。而综合是分析相反的一个命题。对于给定的一
个受控系统 ( A , B , C ) ,确定其控制规律,即设计控制器的结构
参数,使其控制性能满足事先给定的性能指标,这样一类问题称为
系统的综合问题。本章中只限于讨论线性定常系统在常规性能指标下
的综合问题,并且只涉及极点配置问题及镇定问题。关于解耦问题,
将在单独一章中讨论。
§4.1 状态变量反馈和输出反馈
无论在经典控制理论还是在现代控制理论中,反馈都是系统设
计的重要方式。但是,由于经典控制理论是用传递函数来描述系统的,
因此它只能对输出量进行一定改造后用来作为反馈量。这种方式称为
输出反馈,即量测输出量,再由输出的测量值与给定的输入量进行
比较后确定闭环系统的控制规律。而在现代控制理论中是用系统的内
部状态变量来描述系统特性的,所以除了上述的反馈外,通常采用
状态反馈,即利用系统的全部状态变量作为反馈量。
一、输出反馈和状态反馈的基本形式
设线性定常系统为
x A x B u
(4.1)
y C x Du
其输入 u ,状态变量 x ,输出量 y 的维数分别是 r , n, m ,输 出 反
馈的基本形式如图 4.1 所示。
D
w + y
F
u
B
+ x C
+
+
∫
+
-
A
1
图 4.1
设 H是rxm 阶矩阵,用 H y 作为反馈量构成闭环,并对输入量作
变换,变换矩阵为 F ,控制 u 便成为:
u Fw H y
F w H (C x D u )
u ( I HD ) 1 ( F w HC x ) ( 4.2)
即可导出闭环系统的方程
x A x B( I HD )1 ( F w HC x )
[ A B( I HD ) 1 HC ] x B( I HD ) 1 F w
y C x D( I HD ) 1 ( F w HC x )
[C D( I HD ) 1 HC ] x D( I HD ) 1 F w
以下我们假定 D 0 ,这样闭环系统就成为
x ( A BHC ) x BF w
( 4.3)
y Cx
显然其传递函数阵为
WH ,F ( s ) C ( SI A BHC )1 BF ( 4.4 )
如果 F I ,即对输入不作变换,就成为单纯的输出反馈,这时
(4.3)式,(4.4)式分别为如下形式:
x ( A BHC ) x B w
( 4 .5 )
y Cx
W H ( s ) C ( SI A BHC ) 1 B ( 4 .6 )
状态反馈的基本形式如图 4.2 所示
x + y
w F
+ u B
+
∫ C
+
- +
K
2
图 4.2
设 K是r n 阶矩阵,用 K x 作为反馈量构成闭环,对输入量也
作 F 变换,则得控制
u Fw K x ( 4. 7 )
这种反馈方式称状态反馈,闭环状态方程为:
x ( A BK ) x BF w
( 4.8)
y (C DK ) x DF w
当 D 0 时,闭环方程为
x ( A BK ) x BF w
( 4.9)
y Cx
其传递函数为:
WK ,F ( s ) C ( SI A BK )1 BF ( 4.10 )
若 F I ,则(4.9),(4.10)两式分别为:
x ( A BK ) x B w
(4.11)
y Cx
WK ( s ) C ( SI A BK )1 B ( 4.12 )
从(4.6)式和(4.12)式可以看出,输出反馈和状态反馈均可
改变系统的极点。但是反馈的引入并不增加新的状态变量,即闭环系
统和开环系统具有相同的阶数。
比较(4.5)式和(4.11)式可以看出,当 K HC 时,状态反馈
和输出反馈的控制效果是一样的,凡是输出反馈阵 H 所能达到的效
果,通过状态反馈阵 K HC 来代替,可达到同样的控制效果。但是
反过来,由于已知 K、C 时 H 阵不一定有解,这说明状态反馈有可能
获得比输出反馈更好的效果,输出反馈仅仅是状态反馈的特殊情况。
由(4.11)式可知,适当地选择反馈阵 K ,可以改善系统的性能或
者满足一定的设计指标。
例 4.1 设有二阶系统
3
0 1 0
1 , c [ 1 , 2 ]
T
A , b
a1 a 2
分析状态反馈对系统性能的影响。
解: ( A, b, c T ) 的传递函数为:
2S 1
w( s )
S 2 a2 S a1
取状态反馈 k T [ k1 , k2 ], F I
T 0 1
则 A bk
( a1 k 1 ) ( a 2 k 2 )
闭环传递函数为:
2S 1
wK ( s ) 2
S ( a2 k2 )S ( a1 k1 )
2
则: 1、2 -( a2 k2 ) (a2 k2 ) 4( a1 k1 )
2
显然可见,只要适当地选择 k1 , k2 ,闭环的极点可以任意配置,如果
( a2 k2 )2
k1 a1
4
闭环就有两个相同的极点,并且在 k 2 a 2 时是稳定的;如果
( a2 k2 )2
k1 a1
4
闭环就有两个相异的实极点;如果
( a 2 k 2 )2
k1 a1
4
闭环成为振荡系统,在 k 2 a 2 时系统稳定,系统的稳态偏差为
1 1 ( a k2 ) 2 ( a1 k1 )
ep 1 , ev t ( 1 ) 1 2
a1 k1 ( a1 k1 ) ( a1 k1 )2
若要求 e p 0 ,就需 k1 a1 1 ,这时
a2 k2 2
ev
1
若还要求 e v 0 ,就需 k 2 a 2 2 ,那么自然要求 2 0 ,否则
4
系统就不稳定了。
二、状态反馈、输出反馈对系统能控性和能观性的影响
为了简单起见,我们讨论在 D 0 , 及F I 的条件下反馈对能
控、能观性的影响,这并不失去一般性。此时原系统表示为
x A x B u
( 4.13)
y Cx
令 u wKx (4.14)
闭环系统的状态空间表达式为
x ( A BK ) x B w
(4.15)
y Cx
1.状态反馈不影响系统的能控性
计算式(4.15)的能控性矩阵,因为
( A BK ) B AB BKB AB BD (这里 : D KB )
( A BK ) 2 B ( A BK )( AB BD ) A 2 B ( B、AB的线性组合)
( A BK ) 3 B ( A BK )( A 2 B ( B、AB的线性组合)
)
A 3 B ( B、AB、A 2 B的线性组合)
、A n 2 B的线性组合)
( A BK ) n1 B A n1 B ( B、AB、A 2 B、
故有 B ( A BK ) B ( A BK ) n1 B
1
0 1
B AB A B
n 1
0 0 1
上式中最后一个矩阵为非奇异矩阵,因此有
rank[ B ( A BK ) B ( A BK ) n1 B ] rank[ B AB A n1 B ] (4.16)
式(4.16)表明状态反馈不影响系统能控性,即若原系统是完全能
控的,加上任意状态反馈后,所得到的闭环系统也完全能控。若原系
5
统是不完全能控的,不论加上什么样的状态反馈,所得到的闭环系
统仍然不完全能控。
2.状态反馈不一定保持系统的能观性
状态反馈有可能改变系统的能观性,即若原系统完全能观,在
某些状态反馈作用下,所得的闭环系统可能是不完全能观的。若原系
统不完全能观,在某些状态反馈作用下,所得的闭环系统可能成为
完全能观。对此,举例可以说明。
例 4.2 系统运动方程为
1 1 0
x x 1 u , y 0 1 x
0 1
显然该系统不完全能观,若取状态反馈 k 1 1 1 时,闭环系统为
1 1 0
x ( A b k ) x bw x w
1 0 1
y 0 1 x
显然该系统完全能观。若取状态反馈 k 2 0 1 时,闭环系统为
1 1 0
x ( A b k ) x bw x 1 w
0 0
y 0 1 x
此时该系统仍然不完全能观。
当 y 1 1 x 时,系统是完全能观的,若取 k 3 1 2 时,闭环
系统不完全能观,若取 k 4 1 1 时,闭环系统仍是完全能观的。
当 y 1 0 x 时,系统完全能观,加任意的状态反馈后所得的
闭环系统仍是完全能观的。
3. 输出反馈可保持系统的能控性和能观性
因为对任一输出反馈系统都可以对应地构成等价的一个状态反
馈系统,而状态反馈保持能控性,从而证明了输出反馈可保持能控
性。再证明输出反馈可保持能观性。带有输出反馈的状态空间表达式
为
6
x ( A BHC ) x B w
(4.17)
y Cx
显然只要证明下式成立即可。
C C
C ( A BHC ) CA
rank rank (4.18)
n 1 n 1
C ( A BHC ) CA
证明方法与上面证明状态反馈能保持能控性的方法类似,读者可自
行证明。
可见我们可以给出这样的结论:状态反馈不影响系统的能控性但不一定保持系统的能观性
输出反馈不影响系统的能控性和能观性。
§4.2 单变量系统的极点配置
控制系统的各种特性或各种品质指标,在很大程度上是由系统
的极点决定的。因此,系统的综合形式之一,可以在 S 平面上给定一
组所希望的极点,通过状态反馈阵 k 的选择,使闭环系统
T T
k ( A bk , b, c ) 的极点恰好处于希望的一组极点的位置上。由于
希望极点位置有任意性,因此极点的配置应当做到具有任意性。这就
是所谓极点配置问题。
一、希望极点的选取
对于希望的极点选取,实际上是确定综合目标的问题。这里仅提
出一般应了解的方面。
(1)对于 n 维受控系统,应当且只应当指定 n 个希望的极点。
(2)对希望极点位置的选取,需要研究它门对系统品质的影响,
以及它们与零极点分布状况的关系,从工程实际需要出发加以解决。
(3)希望极点可以是实数或共轭复数对。
工程实际的需要要包括抗干扰能力,灵敏度等,所以极点位置的选
取实际上是个复杂的工作。
二、极点配置定理
对单输入单输出系统 ( A , b , c T ) 在 S 平面上预先任意指定 n 个
7
极点,则存在着状态反馈律:
T
u( t ) k x ( t ) w ( t ) (4.19)
使闭环系统 k ( A b k T , b , c T ) 极点位于预先指定的位置上的充分必
要条件是原系统 ( A , b , c T ) 完全能控。
证 明 :上面我们已经证明了状态反馈不影响系统的能控性,因
此可以说若一个系统不完全能控,那么状态反馈不能改变系统的不
能控模态。这就证明了系统可以任意配置极点的必要条件是受控系统
( A , b , c T ) 是完全能控的。
下面证明充分性。
由于 ( A, b, c T ) 为能控的,那么一定可以通过非奇异变换,化
~ ~
成能控规范型 ( A , b , c~ T ) ,其中
0
~ 0 I n 1 ~
A , b ,
p1 p2 pn 0
1
c~ [ 1 , , n ]
T
(4.20)
对于状态反馈阵 k~ [ k~1 , k~2 , , k~n ] ,有
T
~ ~ ~T 0 I n1
Abk ~ ~ ~
( p 1 k1 ) ( p2 k2 ) ( pn kn )
~ ~ ~ ~T ~ ~T 仍为能控标准型。这样状态
可见状态反馈系统 k ( A bk ,b,c )
反馈系统的特征多项为:
~ ~ ~T ~ ~
f ( s ) SI ( A b k ) S n ( pn k n )S n 1 ( p1 k1 )
( 4.21 )
假定任意给定的极点分布为 1 , 2 , , n ,则希望的特征多项式为
n
f ( S ) ( S i ) S n n S n 1 n 1 S n 2 1 ( 4.22 )
i 1
比较(4.21)式,(4.22)式,可知
8
~
pi k i i ( i 1, 2 , , n )
~
则 k i i pi
~T
所以 k [ 1 P1 , 2 P2 , , n p n ] (4.23)
而原系统 ( A , b , c T ) 的线性反馈律应为:
T
u wk x
~ T 1 x , 即 x T x
由 x ~ 代入上式
~
u wk Tx
T
所以 k~ k T T ~T
T
即 k T 1
T
k
由于线性非奇异变换不改变系统的特征多项式(4.21),所以 k 正是所
要求的反馈增益向量。上面只是对单输入系统作了证明,不难看到,
定理对多输入系统也是成立的。
上述证明过程也给出了单变量系统极点配置的方法,现归纳如
下:
~ ~ ~
(1)对于给定的系统 ( A, b) 化为能控标准型 ( A, b ) ;
~ ~ ~
( 2) 导出系统 ( A , b ) 的特征多项式,它也是原系统的特征
多项式。
f ( s ) S n Pn S n 1 P1
( 3) 根据给定的极点分布 (1 , 2 , , n ) 导出希望的闭环特征多
n
项式。 f ( S ) ( S i ) S n n S n1 1
i 1
~ ~ ~ ~ 的反馈向量
(4)确定能控标准型 ( A , b ) 的状态 x
~T
k [ 1 P1 , 2 P2 , , n Pn ]
(5)原系统 ( A , b ) 的状态 x 的反馈阵
~T
k T k T 1
(6) 输入变换阵 F 对单变量系统是标量,可由综合指标中对系
统静态误差要求来确定。
9
当然,具体综合某个特定系统的状态反馈不一定完全遵照上述
步骤,可根据具体问题有所改变。
例 4.3 已知图 4.3(a)所示的受控系统,其传递函数为
0.0139 1
w( S )
S ( 0.167 S 1) ( 0.083 S 1) S ( S 6) ( S 12)
u x1 x2
1 1
x3 y
1
S S6 S 12
u (a) y
+ T
F ( A, b, C )
-
kT
x
(b)
图 4.3
综合指标为:
输出超调量 M p 5%
峰值时间 t p 0.5秒
静态误差 e p 0 , e v 0 .2
解 :考虑到综合指标既有动态要求,又有静态要求,所以采用
状态反馈和输入变换相结合的形式,即如图 4.3(b)所示。
In
(1) 将给定指标化为希望极点,确定 λ1
ωn
希望模型。显然希望极点数 n 3 。现在
这样选取:一对为主导极点对 1和 2 ,另 -σ
λ3
一个为远方极点 3 如图 4.4 所示。 Re
可以认为动态特性主要由主导极点决定, λ2
而远方极点只有微小的影响,主导极点对构 图 4.4
成二阶系统模型,有关系式: 1 2 n , cos 1
其中 : 阻尼系数,
10
n : 自然振动频率
由于系统性能主要由主导极点对决定,所以按综合指标先行决定主
导极点对 1和 2 。为此,利用二阶模型关系式:
M e / 1 2 5%
P
t p 0.5秒
n 1 2
来求 和 n
5% 求
2
利用 M P e / 1
则 / 1 2 3.14 从而有
1
0.707 , 于是选取 0.707
2
由 tp 0.5 秒求 n
2
n 1
tp 0.5
则 n 1 2 1
n
2
从而有 n 9 , 选 n 1 0
0.5 0.707
这样可定出主导极点对:
1 ,2 n cos j n sin
n j n 1 2 7.07 j 7.07
而 远 方 极 点 3 应 该 选 择 得 使 其 和 原 点 距 离 远 大 于 1 , 现 取
3 10 1 100 。
于是希望的闭环系统特征多项式为
f ( S ) ( S 100 )( S 7.07 j 7.07 )( S 7.07 j 7.07 )
( S 100 )( S 2 14.1 S 100 )
S 3 114.1 S 2 1510 S 10000
(2) 校核模型的静态指标,确定变换放大器系数 F;因为原系
11
统无零点,所以闭环系统的传递函数为
F
wk ( s )
f ( S )
由位置误差定义
1 wk ( s )
e p Lim 1 y p ( t ) Lim S ( )
t S 0 S S
F
1 0 ( 因为e p 0 )
1
所以, F 1 10000
再校核速度误差 e v 是否满足要求
1 wk ( s )
ev Lim t y t ( t ) Lim S ( )
t S 0 S2 S2
1 wk ( s )
Lim
s0 S
因为
F
1 wk ( s ) 1
f ( s )
10000
1
S 3 114.1S 2 1510 S 10000
S 3 114.1 S 2 1510 S
S 3 114.1 S 2 1510 S 10000
所以
S 2 114.1S 1510
e v Lim ( 3 ) 0.1510 0.2
S 0 S 114.1 S 2 1510 S 10000
满足要求。
(3) 确定系统的状态空间表达式并化为能控标准型。原系统的
一个实现为 ( A , b , c T ) ,其中:
0 0 0 1
A 1 6 0 , b 0 , c T 0 , 0 , 1
0 1 12 0
12
可求得变换阵 T
0 0 1 72 18 1
T 1 0 1 12 , T 12 1 0
1 18 144 1 0 0
~ ~ ~
得能控标准型 ( A , b , c T )
0 1 0 0
~ ~
其中 A 0 0 1 , b 0 , c T 1 0 0
0 72 18 1
~ ~ ~
(4)确定能控标准型 ( A , b , c T ) 的状态反馈阵 k~ T 。
令 k~ k~1 , k~2 , k~3
T
~
则 k1 1 p1 10000 0 10000
~
k 2 2 p2 1510 72 1438
~
k 3 3 p3 114.1 18 96.1
(5)确定对 ( A , b , c T ) 的状态反馈 k T
~
k k T 1
0 0 1
10000 , 1438 , 96.1 0 1 12
1 18 144
96.1, 291.8 , 6582.4
(6)画出方块图如下:
w
u x1 x2
1
x3 y
1 + 1
10000
- S S6 S 12
+
96.1
+
-291.8
+
6582.4
13
图 4.5
例 4.4 在第一章中,我们已经得到了倒置摆的状态方程为:
0 1 0 0 0
0 0 1 0 1
x x u
0 0 0 1 0
0 0 11 0 1
其特征多项式是
f ( ) I A 4 11 2 2 ( 2 11)
1 2 0, 3 11 , 4 11
系统很不稳定,这和人们从物理意义上预料的一样,现在要设计状
态反馈,使系统稳定,并且使 1 1, 2 2 , 3 ,4 1 j 。
解:
(1)检查能控性
0 1 0 1
1 0
2 3
Qk b , Ab , A b , A b
0 1
0 1
0 11
1 0 11 0
因为 Qk 100 , Rank Qk 4 ,系统完全能控。
2 (2)化为能控标准型或直接计算,本题采用后者,所以本步骤省略。
(3)求闭环系统的特征多项式
令 k T k1 k2 k3 k4
14
T
fk ( S ) SI ( A b k )
0 1 0 0 0
0 0 1 0 1
SI k1 , k2 , k3 , k4
0 0 0 1 0
0 0 11 0 1
S 1 0 0
k S k2 1 k3 k4
1
0 0 S 1
k1 k2 k3 11 S k4
S 4 ( k2 k4 )S 3 ( k1 k3 11 )S 2 10 k2 S 10k1
(4)期望的特征多项式为
f ( S ) ( S 1 )( S 2 )( S 1 j )( S 1 j )
S 4 5 S 3 10 S 2 10 S 4
上述两式对应项系数应相等。
即 k1 0.4 , k 2 1, k 3 21.4 , k 4 6
所以 k T 0.4 , 1, 21.4 , 6
(5)画出反馈系统模拟结构图
15
1
w + y
+ + x4 x3 x2 x1
+ 1
-1 ∫ ∫ -1 ∫ ∫
- u +
11
+
-6
+
-21.4
图 4.6
+
-1
+
-0.4
15
§4.3 多变量系统的极点配置
一、多变量系统状态反馈出现的新问题
设多变量系统
z z B1 u (4.24)
其中 为对角线矩阵(原方程假定已对角化)
diag ( 1 , 2 , , n )
则 SI ( S 1 )( S 2 )( S n ) 即为该系统的特征多项式。
设
u w K1 z ( 4.25)
其中 K 1 为 r n 阵,代入(4.24)式,则得:
z ( B1 K 1 ) z B1 w
+ u + z
w
-
B
+
∫ C
y
K1
图 4.7
闭环系统的特征多项式为
f K ( s ) SI ( B1 K1 )
希望的极点分布为 1 , 2 , n ,则其特征多项式为
f ( s ) ( S 1 )( S 2 )( S n ) ( 4.26 )
因为 K 1是r n 矩阵,若采用单变量系统的设计 K 1 的老办法,就只
能有 n 个方程,因此确定不了 K 1 ,所以对多变量系统,选择 K 1 的
自由度大了,必须采用新的办法。
多变量系统的极点配置方法很多,这里仅介绍其中的一种,即
所谓双向量法。
16
二、双向量法
设原系统为
x A x B u
(4.27)
y Cx
将(4.27)化为对角标准型
z z B1 u
(4.28)
y C1 z
令 u w K1 z
则 z ( B1 K 1 ) z B1 w
上式中 K 1 为 r n 阵,设
K1 f d T ( 4.29 )
f1 d1
f d
f 2 , d 2
fr d n
则闭环系统的特征多项式为:
T T
f K ( S ) SI B 1 K 1 SI B1 f d ( SI ) I ( SI )( SI ) 1 B1 f d
T
SI I ( SI ) 1 B1 f d
设希望极点为 i , i 1, 2 , , n ,则希望的特征多项式为:
n
f ( s ) ( S i )
i 1
令 fK ( s ) f ( s ) 即
n
( S i ) SI I ( SI )1 B1 f d
T
i 1
n
又令 ( S i ) SI ( i为原系统的极点, i 1, 2 , , n )
i 1
n n
则 ( S i ) ( S i ) I ( SI ) 1 B1 f d T ( 4.30 )
i 1 i 1
17
设 P为n m 矩阵 , Q为m n 矩阵,可以证明恒等式:
I n PQ I m QP
利用该恒等式,可得
T T
I ( SI ) 1 B1 f d I d ( SI ) 1 B1 f (4.31)
1n 1n
n1 n1
1 1 1 1
因为 ( SI ) diag ( , ,, ) ( 4.32 )
S 1 S 2 S n
设定 f ,即得
r1
r
B f 2 (4.33)
1
n r r 1
rn
将(4.32)式,(4.33)式代入(4.31)式,得
1 r
S 0 1
T
2
r2
I ( SI )1 B1 f d
T
1 d
0 1
S n rn
n
d1r1 d 2 r2 d n rn dr
1( ) 1 i i ( 4.34 )
S 1 S 2 S n i 1 S i
将(4.34)式代入(4.30)式
n n n d r
( S i ) ( S i ) ( 1 S i i )
i 1 i 1 i 1 i
所以
n
n
dr
( S i )
S i i i 1
n
1 ( 4.35 )
i 1 i
( S i )
i 1
18
i 是已知的,所以 d i 可以求出,进一步由(4.29)式求得 K 1 。
4 10 1 1
例 4.4 已知 x x 2 0 u
3 7
要求: 1 3 , 2 3 ,求反馈阵 K 。
解(1)化原系统为对角标准型,计算开环极点
I A ( 1)( 2)
1 1, 2 2
并求得变换矩阵
2 5 3 5
T T 1
1 3 1 2
令 x T z ,得
1 0 13 3
z z 5 1 u
0 2
n
d r
(2)计算 S i i
i 1 i
2
( S i ) ( S 1 )( S 2 ) S 2 3 S 2
i 1
2
( S i ) ( S 3 )2 S 2 6 S 9
i 1
2
2
dr
( S i ) S 2 6S 9 3S 7 4 1
S i i i 1
2
1
S 2 3S 2
1
S 2 3S 2
S 1 S 2
i 1 i
( S i )
i 1
所以 d 1 r1 4 , d 2 r2 1
1
(3)求 K,假设 f
1
13 3 1 10 r1
B1 f r
5 1 1 4 r2
19
d 1 r1 4 2
d1
r1 10 5
d 2 r2 1 1
d2
r2 4 4
2 1
1 2 1 4
5
T
所以 K1 f d
1 5 4 2 1
5 4
19 3
20 2
而 K K 1 T 1
19
3
20 2
(4)验证
19 3
2
4 10 1 1 20
SI ( A BK ) SI
3 7 2 0
19 3
20 2
4 10 S 4 10
SI 4.9 ( S 3) 2
4.9 10 S 10
所以 1 2 3 ,满足要求。
上例也可以看出,选择 f 不能使 B1 f 出现零元素,否则 ri 为零,
d i 就得不到。
从上面可以知道,对单变量系统,完成希望极点配置任务的状
态反馈阵 k T 是唯一的,而对多变量系统其 K 阵不是唯一的。对单变
量系统,引入状态反馈任意配置极点的同时,并不改变系统的零点,
除非故意制造零极相消,而对多变量系统引入状态反馈后其零点可
20
能会改变,故在实际应用中必须注意。
由极点配置定理可知:系统完全能控是闭环极点任意配制的条
件,当不满足条件时,显然不能任意配置闭环极点,但有可能配置
一些特定的极点组。由于状态反馈不能改变系统的不能控模态,当
系统不完全能控时,若希望的极点组中包含了系统所有的不能控模
态时,这组希望极点也是可以配置的。
§4.4 带输出误差积分的状态反馈(稳态特性)
一、问题的提出
上面我们看到,采用状态反馈,可以使系统的极点处于指定的
位置上,因而也就决定了系统的瞬态特性。现在,来分析另一方面
的问题,即稳态特性。
设如下系统
x ( t ) A x ( t ) B u( t ) d ( t )
y( t ) C x( t ) (4.36)
这里 u( t ) 为控制向量, d ( t ) 是未知的 n 维扰动输入向量,我们希望
输出 y(t ) 尽可能地接近于一个参考输入(或期望输入) y r ( t ) ,假
定(4.36)式对输入 u 是完全能控的。
对于一个具有恒定参考输入和恒定扰动输入的系统,如果保证
控制输入中包含有正比于误差的积分项,就可获得理想的稳定精度。
如图 4.8 所示。
yr e q u d x y
-
X A X B u d
+
∫ K2 C
+ +
K1
图 4.8 所示。
设 y r , d 均为阶跃函数的情况,在这种情况下,控制作用应包
含这样一项,它正比于
21
t t
q( t ) 0
e( t )dt
0
[ y( t ) y r ( t )]dt
q ( t ) e( t ) C x ( t ) y r ( t ) ( q( 0) 0 )
这里 e( t ) 为误差向量。
二、复合系统
令 u K1 x K 2 q
我们把 q 也当作为一个状态向量,这样可以把原系统(4.36)式增
广如下:
x A 0 x B d
q
u y
C 0 q 0 r
x
y C 0 (4.37 )
q
三、复合系统的能控性
首先提出的问题是:新系统对输入 u 是否能控?对此回答如下:
要使式(4.37)系统能控,其充分必要条件是:
1)原系统(4.36)式能控
A B
2)且 Rank nm
C 0
注意上式成立的必要条件是: r m ,(即有多少个输出,至少有
多少个输入)及 Rank ( C ) m ,(即输出相互独立的)。
上面的结论是可以严格证明的,读者不妨试证一下。当然直接判
别复合系统的能控性也是可以的。但阶数高时,计算量较大。
四、复合系统的设计
x ( t )
设 u( t ) [ K 1 , K 2 ] K1 x K 2 q ( 4.38)
q( t )
代入(4.37)式得闭环系统:
22
x A BK 1 BK 2 x d
q
C 0 q y r
x
y C 0 (4.39)
q
注意:这里 K 1 取正号,目的是为了和 K 2 符号一致, K 1 也可取负号。
例4.5 已知如图 4.9 所示,自动搜索平衡系统,采用状态反馈
控制,状态向量 x为[ z , z , , ]T ,现假定小车受到风力 4w ,小球受
风力为 w ,为了便于立方程,设阻力方向如图所示。根据力学原理,
得系统方程:
w
4w mg
Mg
图 4.9
0 1 0 0 0 0
0 0
1 0 1
u
4w
x A x bu d x
0 0 0 1 0 0
0 0 11 0 1 6w
y 1 0 0 0 x
(1)建立组合系统
采用积分
t
q( t )
0
[ y ( ) y r ( )]d
可消除 Z 的稳态误差。系统增广如下:
23
z 0 1 0 0 0 z 0 0
z 0 0 1 0 0 z 1 4w
d
0 0 0 1 0 0 u 0 (4.40)
dt
11 0 0 1
0 0 6w
q 1 0 0 0 0 q 0 yr
2 (2)判别组合系统的能控性
a)原系统能控
A b A b
3 b) 因为 T 10 , 即Rank T 5
c 0 c 0
所以复合系统能控。
(3)复合系统的设计
T
令 K 1 [ k1 , k 2 , k 3 , k 4 ], K 2 k5
z
z
u K 1 x K 2 q [k 1 , k 2 , k 3 , k 4 , k 5 ]
q
将上式代入(4.40)式,得
z 0 1 0 0 0 z 0
z k k 2 k 3 1 k4 k5 z 4w
d
1
0 0 0 1 0 0
dt
k k 11 k k k 6 w
1 2 3 4 5
q 1 0 0 0 0 q yr
f K ( S ) SI ( A b K T ) S 5 ( k 4 k 2 )S 4 ( k 3 k1 11 )S 3
则
( 10k 2 k 5 )S 2 10k1 S 10k 5
设希望的极点为 1, 2 , 2 , 1 j , 1 j 则
24
f ( S ) ( S 1 )( S 2 )2 ( S 1 j )( S 1 j )
S 5 7 S 4 20 S 3 30 S 2 24 S 8
解得 k5 0.8 , k1 2.4 , k2 3.08 , k3 33.4 , k4 10.08
最后,可以验证闭环系统的稳态特性是令人满意的。(略)
§4.5 状态空间中系统的镇定问题
假定线性系统 ( A, B , C ) 完全能控,则一定存在线性状
态反馈 K,使闭环系统 K ( A BK , B , C ) 极点可以任意配置。这
也可以说,对完全能控的不稳定系统,总可以求得线性状态反馈阵
K,使系统变为渐近稳定,即 A BK 的特征值均在 S 平面的左边。
这就是镇定问题。可见镇定问题是极点配置问题的一个特殊情况。
在镇定问题中,只要求极点配置在 S 平面的左边,不必要在指定的
位置上,所 以 对 系 统 ( A, B , C ) , 若 存 在 状 态 反 馈 阵 K, 使
闭 环 系 统 K ( A BK , B, C ) 的 极 点 具 有 负 实 部 , 则 称 原 系 统 是 状
态 反 馈 能 镇 定 的 。 同 理, 若 存 在输 出反 馈阵 H , 使闭 环系 统
H ( A BHC , B , C ) 的极点具有负实部,则称系统是输出反馈能镇
定的。
一、状态反馈能镇定的条件
线性系统 ( A , B , C ) 的状态反馈能镇定的充分必要条件为:
系统的不能控部分是渐近稳定的。对此说明如下:假定系统已经按
能控性进行分解成如下形式:
A A12 B
A 11 B 1
0 A22 0
设状态反馈阵为 K [ K 1 , K 2 ] ,则闭环系统的状态矩阵为:
A B1 K 1 A12 B1 K 2
A BK 11
0 A22
其特征多项式为:
25
f K ( S ) SI ( A BK ) SI1 A11 B1 K1 SI 2 A22
显然 1 ( A11 , B1 ) 是能控部分,所以上式中的 SI1 A11 B1 K 1 部分可
以 通 过 极 点 配 置 的 方 法 使 ( A11 B1 K1 ) 的 极 点 具 有 负 实 部 , 而
2 ( A22 ,0 ) 是不能控部分,上式中的 SI 2 A22 部分说明无法通过极点
配置方法使 A22 的极点改变,而必须先行要求 A22 的极点具有负实部。
结论得证。
二、输出反馈能镇定的条件
对于输出反馈,我们在§4.1 中已经指出它保持了系统的能控性
和能观性,即输出反馈不能改变系统的不能控模态和不能观测模态 。
假定我们已经将系统 ( A , B , C ) 进行 Kalman 结构分解,
A11 0 A12 0 B1
A A22 A23 A24 B
A B 2
21
0 0 A33 0 0
0 0 A43 A44 0
C [C 1 , 0, C 3 , 0]
其 中 A11 , B1 , C1 是 能 控 且 能 观 的 ; ( A22 , B2 ,0 ) 是 能 控 不 能 观 的 ;
( A33 ,0 ,C 3 ) 是不能控而能观的; ( A44 ,0 ,0 ) 是不能控又不能观的,则
对于这样的系统输出反馈镇定的条件(充分必要)为:
1)能控又能观测部分是能镇定的;
2)其余三部分均是渐近稳定的。
对此说明如下:设输出反馈阵为 H,则闭环系统矩阵为:
A11 B1 HC1 0 A13 B1 HC 3 0
A B HC A22 A23 B2 HC 3 A24
A BHC 21 2 1
0 0 A33 0
0 0 A43 A44
其特征多项式为
f H ( S ) SI ( A BHC ) SI1 ( A11 B1 HC1 )
SI 2 A22 SI 3 A33 SI 4 A44
可以看出:当且仅当 A11 B1 HC1 具有负实部的极点,即能控又能
26
观部分为输出反馈能镇定, A22 , A33 , A44 均具有负实部的极点,即其
余三部分为渐近稳定的时候,闭环系统才是渐近稳定的。从而说明
了结论的的正确性。
例 4.6 分析如下不稳定系统的能否成为稳定系统。
2 1 4 1
x 0 1 4 x 1 u
0 2 3 1
解:
1 3 1
Qk 1 3 1 Rank Qk 2 所以原系统不完全能控,取
1 1 3
1 3 1 0 1 3
T 1 3 0 , T 1 0 1 1
1 1 0 2 2 0
0 5 0 1
T 1 AT 1 2 0 , T 1 b 0
0 0 2 0
可见其不能控部分的极点为-2,是渐近稳定的,因此原系统是能稳
定的。
27
第五章 状态观测器(模块十三)
第四章中介绍了状态反馈,它是现代控制理论中分析设计线性
系统的一个重要方法。但是,用这个方法时要求系统的状态变量可以
直接测量得到。而在许多情况下一个系统内部的状态变量并不能被直
接测量,状态反馈就有困难。经典控制理论中并不存在这个问题,因
为它用可以测量到的输出来进行反馈。因此可以想到,能否利用系统
可测的量来构造状态变量?本章就讨论这个问题,原系统的输入输
出是直接可以量测到的,于是可以另外再构造一个系统,这个系统
以原系统的输入输出作为输入,将状态重新构造出来,这样构造的
系统就称为状态观测器。
状态观测器是确定性系统的状态估计器。关于随机系统的状态估
计问题,如 Kalman 滤波器,由于时间限制本章就不介绍了,感兴趣
的同学可参考有关材料。
§5.1 状态观测器的基本概念
给定系统的状态空间表达式如下:
x A x B u (5.1a )
y Cx ( 5.1b )
设此系统是完全能观的,输入 u 和输出 y 是可以直接量测的。
将(5.1b)式两边对时间 t 求导数,得
y C x CA x CB u
y CB u CA x
对上式再求导,并将(5.1a)式代入后得
y CB u CAB u CA2 x
重复上述过程一直到 n 1 次求导,最后得
CA n 2 B u CAn 1 x
( n 1) ( n 2) (n 3)
y CB u CAB u
将以上各式写成矩阵形式
18
y C
y CBu CA
y CBu CABu CA 2 x Q x
g
( n 1 ) ( n 1 )
CA ( n 2 ) B u CA
( n 2 ) ( n 3 )
y CB u CAB u
由于系统完全能观,所以 Q g 的秩为 n ,因而上述方程中 x 有解,这
图 5.1
将(5.1a)式和(5.2)式相减,得
d
( x xˆ ) A( x xˆ )
dt
19
ˆ 0 ,则
设两个系统的初始状态分别为 x 0 , x
x ( t ) xˆ ( t ) e At ( x 0 xˆ 0 )
所 以 只 要 x 0 x̂ 0 , 就 有 x ( t ) x ˆ ( t ) , 即 x̂ 完 全 复 现 x 。 当
x 0 x̂ 0 时,如果 ( A, B ,C ) 是稳定的,即 A 的特征值都具有负实
部,则有 Lim ( x ( t ) xˆ ( t )) 0
t
u x A x B u y
y Cx
~
y +
M ŷ -
C
x̂
xˆ A xˆ B u M ~y
图 5.2
~y y yˆ y C xˆ
(5.3)式可写成
xˆ A xˆ B u M ( y C xˆ ) (5.4)
进一步写成
20
xˆ ( A MC ) xˆ B u M y ( 5.5)
为了表示状态误差量,将(5.1a)式减去(5.3)式,则得
x~ x xˆ A x A xˆ M ~y A( x xˆ ) MC ( x xˆ )
( A MC )( x xˆ ) ( A MC ) x~ (5.6)
只要适当地选择 M ,使 A MC 的特征值具有负实部,则有
Lim x( t ) xˆ ( t ) 0
t
这说明只要原系统完全能观,总可以按要求配置观测器的极点,使
~ 按要求的速度衰减到零。图 5.2 所示的观测器称为全
状态观测误差 x
维观测器。其结构特点是,仿原系统再加上反馈阵 M。
从第三章中已知,若 ( A, B, C ) 不完全能观,那么,总可以按能
观性分解,得
A 0 B
A 11 B 1
A21 A22 B2
x1
C C1 0 , x ( 5 .7 )
x2
其中: x 1 为能观测状态部分,其维数为 n1 ;
x 2 为不能观测状态部分,其维数为 n n1 ,
( A11 , B1 , C1 ) 为能观子系统, ( A22 , B2 ,0 ) 为不能观子系统,此时
按(5.5)式,构造状态观测器
x̂ ( A MC ) xˆ B u M y
M1
其中 M
M , M 为 n m 维, M 1 为 n1 m 维, M 2 为 ( n n1 ) m
2
维,由(5.6)式可知
21
从而使 Lim ( x 1 ( t ) xˆ 1 ( t )) 0
t
Lim ( x 2 ( t ) xˆ 2 ( t )) 0
t
于是我们得到如下结论:
线性定常系统 的观测器 g 可以任意配置极点,即状态误差向
量按任意希望的速度衰减到零的充分必要条件是原系统 ( A , B , C )
完全能观;对不完全能观的系统 ( A , B , C ) ,其观测器存在的充分
必要条件是 的不能观测部分是渐近稳定的,这时观测器的极点不
能任意配置。
§5.2 全维观测器的设计
从(5.6)式可知,全维观测器的设计,实际上在于合理选择 M
阵,使 ( A MC ) 的特征值具有负实部,而且负实部的绝对值足够大,
ˆ ( t ) 逼近 x (t ) 的速度足够快。同时应当考虑到观测器的通频带,
使x
使它具有一定的抗高频干扰的能力。因此在设计时应兼顾这两个方面。
在选择合理的观测器极点后,就可以用前述方法计算 M 。以单变量系
统为例设计步骤如下:
(1)判别系统的能观性;
(2)若系统能观,化为能观标准型;
~ ~ ~T
现假定其能观标准型为 ( A , c ) ,其中
0 P0
P1
~ c~ 0 0 1
T
A
I n 1
Pn 1
~ ~ ~T ~
(3)计算能观标准型 ( A , c ) 的观测阵 M ;
22
m~
0
m~
~ 1
设 M
~
mn 1
观测器系数矩阵为
0 P0 0 0 m ~
0
~
~ ~ ~T P1 0 0 m1
A Mc
I n 1
~
Pn1 0 0 m n 1
0 ( P0 m~ )
0
~ )
( P1 m
1
I n1
~
( Pn 1 m n 1 )
于是特征方程为:
~ )S n 1 ( P m
f ( S ) S n ( Pn 1 m ~ )S P m
~ ( 5.9 )
n 1 1 1 0 0
根据希望的观测器极点,得到希望的特征多项式
f * ( S ) S n *n 1 S n 1 1* S *0 ( 5.10 )
比较(5.9),(5.10)两式得
~ P *
m ( i 0 ,1,2 , , n 1 )
i i i
(4)求原系统 ( A, b, c T ) 的观测阵 M :
~
由M TM 计算 M
(5)画出观测器的结构图。
例 5.1 设有系统
1 0 0 1
A 0 2 1 , b 0 , c 1 1 0
T
0 0 2 1
求它的状态观测器,并使观测器的极点为-3、-4、-5。
解 1) 判此系统的能观性
23
1 1 0
Q g 1 2 1 Rank Q g 3 , 所以系统能观。
1 4 4
2)化原系统为能观标准型
4 4 1 0 1
Q g1 3 4 1 , r Q g 1 0 1
2 3 1 1 1
1 1 1 4 2 1
T r , Ar , A 2 r 1 1
0 ,
T 1 4 3 1
1 2 4 1 1 0
0 0 4 3
~ ~
c~ 0 0 1
T
所以 A 1 0 8 b 3
0 1 5 1
3)求观测阵 M ,由观测器的希望极点,得特征方程:
f * ( S ) ( S 3 )( S 4 )( S 5 ) S 3 12 S 2 47 S 60
~
于是可算出观测阵 M m
~ ,m
0
~ ,m~ T ,其中
1 2
m~ P * 4 60 64
0 0
0
~ *
m1 P1 1 8 47 39
~
m2 P2 * 5 12 17
2
~
120 , 103 , 210 ,由式(5.5)得观测器方程为:
T
因而, M T M
119 120 0 1 120
x̂ 103 105 1 xˆ 0 u 103 y
210 210 2 1 210
由式(5.3)画出观测器结构如图 5.3 所示: ŷ y
u + x̂ 1 - +
~
+ +
y
-
+ x̂ 3+ x̂ 2
+
+ + 120
2
+
2
- 103
24
210
图 5.3
例 5.2 再次研究倒置摆系统,其状态向量为
x z , z, ,
T
系数矩阵为
0 1 0 0
0
0 0 1 0
1
A b ,, c 1 0 0 0
T
0 0 0 1
0
0 1
0 11 0
并假定唯一可测得的输出量为 z( t ) ,即小车的位置,试设计全维观
测器,使观测器极点为-2,-3,-2±j。
解:(1)判别系统的能观性
1 0 0 0
0 1 0 0
Qg Rank Q g 4 , 此系统能观。
0 0 1 0
0 0 0 1
(2)本题系数矩阵较简单,可直接计算 M ,不必先化为能观标
准型。
m1
m
M , 则
2
设
m3
m4
0 1 0 0 m1 0 0 0 m1 1 0 0
0 0 1 0 m2 0 0 0 m2 0 1 0
A Mc
T
0 0 0 1 m3 0 0 0 m3 0 0 1
0 0 11 0 m4 0 0 0 m4 0 11 0
则其特征多项式为:
25
T
f ( s ) SI ( A M c )
S 4 m1 S 3 ( 11 m2 )S 2 ( 11m1 m3 )S ( 11m2 m4 )
观测器希望的特征多项式为:
f * ( S ) ( S 2 )( S 3 )( S 2 j )( S 2 j )
S 4 9 S 3 31S 2 49 S 30
由上两式得
M 9 , 42 , 148 , 492
T
.(3)画出观测器结构图
u
y x1
- x̂ 4 + x̂ 3 +
+
x̂ 2 x̂1 ŷ +
~y
+ -1
+ + -
+
11
9
42
-148
-492
图 5.4
全维观测器方程为:
0 1 0 0 0 9
0 1 0 1 42
xˆ A xˆ Bu M~y 0 xˆ u ~y
0 0 0 1 0 148
0 0 11 0 1 492
也可以写成如下形式:
9 1 0 0 0 9
42
̂x ( A MC ) xˆ Bu My 42 0 1 0 1
xˆ u y
148 0 0 1 0 148
492 0 11 0 1 492
§5.3 降维观测器
26
一、问题的提出
上节中讨论的观测器是对全部几个状态进行观测。实际上这种观
测器含有多余的东西,因为状态的某种线性组合(由 C 阵决定)可
以直接作为输出而测出,并不需要进行估计。如例 5.2 中,小车的位
置 z 可以直接量测 ( y z ) ,所以只需要观测 z , , 三个状态变量
即可,由此说明状态观测器的维数可以降低,对于一般情况:
x A x B u
(5.11)
y Cx
总可以作一个线性变换
~ Q x 或 x Q 1 x
x ~ ( 5.12)
其中
D ( n m ) n
Q ( 5.13 )
C m n
( 5.13 ) 式 中 C 为 m n 阵 , 秩 为 m , D 为 使 Q 1 存 在 的 任 意
( n m ) n 矩阵,通过此线性变换将(5.11)式变换成:
x~ QAQ 1 x~ QB u
x~ 1 ~ (5.14)
y CQ x 0 I x~ x 2
1 ~
2
~ 为 m 维,是直接可以量测的,现在只要观测 ( n m ) 维状态
其中 x 2
~ 即可。
向量 x 1
二、降维观测器的设计
现在来考虑如下形式的能观系统,它的输出量由后面的 m 个状
态组成
x 1 A11 A12 x 1 B1
x A
A22 x 2 B2
u
2 21
x1
y 0 Im x2 (5.15)
x2
27
上面已经讨论过,这种形式是通过线性变换得来的,所以并不失
去它的一般性。整理(5.15)式得:
x 1 A11 x 1 A12 x 2 B1 u (5.16a )
x 2 A21 x 1 A22 x 2 B2 u (5.16b)
令
v A12 x 2 B1 u (5.17 )
z A21 x 1 (5.18)
将(5.17)代入(5.16a),并和(5.18)联立得系统
x 1 A11 x 1 v
( 5.19)
z A21 x 1
因 为 u已 知 , y x2可 以 直 接 量 测 , 所 以 把
v A12 x 2 B1 u A12 y B1 u 当作已知输入量并不困难。同理
z A21 x 1 x 2 A22 x 2 B2 u y A22 y B2 u
也可直接算出。
这样(5.19)式可以看作为(5.15)式的一个子系统。可以证明若
原系统(5.15)是能观的,则子系统(5.19)式也是能观的(证明
略)。
一旦证实了式(5.19)是能观的,就可以用全维观测器的设计方
法来设计子系统(5.19)式的观测器。即
xˆ 1 ( A M A ) xˆ 1 v M z
11 1 21 1 (5.20)
其中 ( n m ) m 维矩阵 M 1 可以选得使式(5.20)的极点置于期望的
任意位置,将 v, z 代入得:
xˆ 1 ( A11 M 1 A21 ) xˆ 1 A12 y B1 u M 1 y M 1 A22 y M 1 B2 u ( 5.21)
此系统即为系统(5.15)式的一个 n m 维观测器
实现(5.21)式的一个明显的困难是需要输出量 y 的微分,可以
重新定义观测器的状态避开这个困难。
令 xˆ 1 M 1 y w 并代入(5.21)式得
28
w xˆ 1 M 1 y ( A11 M 1 A21 )w ( B1 M 1 B2 )u
A12 M 1A22 ( A11 M 1 A21 ) M 1 y ( 5.22)
令
B0 B1 M 1 B2
E A12 M 1 A22 ( A11 M 1 A21 ) M 1
即得
w ( A11 M1 A21 )w B0 u E y
上述观测器也称为 Luenberger 观测器,用图 5.5 所示:
u
B0
+
y w + x̂ 1
+
E
+
+
A11 M 1 A21
M1
y x2
图 5.5
整个状态向量可表示为:
xˆ 1 w M 1 y I M1
xˆ 0 w I y
y
y
由(5.19)式减去(5.20)式得
x~ 1 ( A11 M 1 A21 ) x~ 1
显然这种观测器的误差为:
29
到零。
这种观测器的一个明显缺点是,量测通过 M 1 直接反映到状态 x̂ 1
上来,(见图 5.5)这样就必然将量测噪声带入。另外, M 1 的误差直
接影响到 x̂ 1 的稳态值,而在全维观测器中不存在这种误差。
例 5.3 上例中设计了倒置摆的全维观测器,由于小车位移直接可
以量测,所以可设计降维观测器,并使降维观测器极点为 3 ,2 j 。
z 0 1 0 0 z 0
d z 0 0 1 0 z 1
解:倒置摆状态空间表达式为 u
dt 0 0 0 1 0
0 0 11 0 1
z
z
y 1 0 0 0
(1)判能观性
已经证明此系统完全能观。
(2)将此系统进行线性变换,得到(5.15)式形式。
本系统输出矩阵很简单,只要重新安排状态变量次序即得
(5.15)式形式。
z 0 1 0 0 z 1
d 0 0 1 0 0
u
dt 0 11 0 0 1
z 1 0 0 0 z 0
z
y 0 0 0 1
z
式中虚线将 A11 , A12 等分开,因为 A12 , A22 和 B2 均为零,由(5.22)式得
30
w ( A11 M 1 A21 )w B1 u ( A11 M 1 A21 ) M 1 y
(3)求 M 1
m1
设 M 1 m2 ,则
m3
0 1 0 m1 0 0 m1 1 0
A11 M 1 A21 0 0 1 m2 0 0 m2 0 1
0 11 0 m3 0 0 m3 11 0
此矩阵的特征多项式为:
S m1 1 0
f1 ( S ) SI ( A11 M 1 A21 ) m2 S 1
m3 11 S
S 3 m1 S 2 ( m2 11 )S ( 11m1 m3 )
由希望的极点分布: 1 3 , 2 ,3 2 j 得特征多项式
f1* ( S ) ( S 3 )( S 2 j )( S 2 j ) S 3 7 S 2 17 S 15
所以
7
M 1 28
92
(4)写出观测器方程
21
E ( A11 M 1 A21 ) M1 104
336
1 7 1 0
B0 B1 0 , A11 M 1 A21 28 0 1
1 92 11 0
得观测器方程为
31
7 1 0 1 21
w ( A11 M 1 A21 )w B1 u Ey 28 0 1 w 0 u 104 y
92 11 0 1 336
1 0 0 7
0 1 0 28
I M1 w y
xˆ w y 0
0
1 0 1 92
0 0 0 1
(5)进一步可画出降维观测器的框图(略)
§5.4 重构状态反馈控制系统
上两节,我们介绍了全维观测器及降维观测器,在第四章中了
解到一个完全能控的系统可以用状态反馈控制规律将闭环极点配置
在期望的任何位置上。如果反馈时得不到全部状态,可用观测器对它
进行估值并将观测到的估值用到控制规律中去。这就是所谓重构状态
反馈控制系统。本节将讨论带有重构状态的反馈控制系统的设计问题
以及它的一些特征。图 5.6 表示这种重构状态反馈控制系统。
w+ u y
- x A x B ux C xˆ A xˆ B u
M ( y C xˆ )
K
图 5.6
设能控又能观的系统为
x A x B u
y Cx (5.23)
32
当状态不能直接测量时,可以用状态观测器将状态 x 观测出来,即
xˆ ( A MC ) xˆ B u MC x (5.24)
为了便于分析,可将对象(5.23)式和观测器(5.24)式看成是一个
2n 维的合成系统:
x A 0 x B
u
xˆ MC A MC xˆ B
y C 0 x (5.25)
xˆ
此时,反馈控制律为
u w K x̂ (5.26)
代入(5.25)式,得
x A BK x B
̂ xˆ B w
x MC A MC BK
(5.27)
y c 0 x
xˆ
~
但是,一般用误差 x x xˆ 来表示这个系统的状态更为方便。通
过下述状态变换容易做到这一点。
1
x x In 0n x I 0 I 0
~ x
x
xˆ I n I n xˆ
, 又
I
I
I I
它可以将(5.27)式变成
x A BK BK x B
~ w
x 0 A MC x~ 0
y C 0 x (5.28)
x~
上式的特征多项式为
33
A BK BK
f ( s ) SI 2 n
0 A MC
SI ( A BK ) BK
n
On SI n ( A MC )
由分块矩阵行列式公式可写成
f ( s ) SI n ( A BK ) SI n ( A MC ) ( 5.29 )
可见,重构状态反馈系统的特征值由两个不同的部份组成,一
部分是由反馈矩阵 K 决定的 ( A BK ) 的极点;另一部分是由状态观
测器参数 M 决定的 ( A MC ) 的极点。这两部分的极点是可分离的,这
一性质称具有可分离性。很明显,状态向量 x 的性能由 ( A BK ) 的
~ 的性能则由 ( A MC ) 的极点所支配。所以
极点所决定,而误差向量 x
反馈控制规律的确定和观测器的结构实现可以当作单独问题来考虑。
现概括成如下定理。
可分 离性定理 :如果系统 ( A , B , C ) (5.23)式的反馈控制规
律可以用观测器来实现,则最后合成系统的极点由下列两部分组成:
a) A BK 的极点——完全由反馈矩阵 K 所决定;
b) A MC 的极点——完全由观测器参数 M 所决定。
状态向量的性能由 a)中极点所支配,误差向量的性能由 b)中极点
所决定。
§5.5 扰动量的观测
如果系统 ( A , B , C ) 受到一个不可量测的常值扰动,即
x A x B u E w (5.30)
其中 E 为 n l 阵, w 为 l 维的常值扰动。那么,可以将 w 当作状态,
用观测器将它估计出来。于是系统可写成
x A E x B
w 0 0 w 0 u
(5.31)
y C 0 x
w
34
x
其中新状态向量 为 n l 维。
w
这个方法的实现依赖于式(5.31)是否能观,可以证明合成系统
(5.31)式能观测的充分必要条件为
1)原系统 ( A , B , C ) 能观测;
A E
2) Rank
C 0 n l
注意这个条件仅当 m l 时(即至少输出量的个数和干扰量的个数相
等),及 RankE l (即干扰量为独立的)才能成立。
只要检验(5.31)式完全能观,就可以设计全维观测器或降维观
1 M
测器。令 M
M2
则(5.31)式的全维观测器为:
xˆ A M 1C E xˆ B M 1
wˆ 0 u M y (5.32)
wˆ M 2 C 0 2
对观测器来说,我们感兴趣的总是状态量的误差量,为此令
x~ x xˆ , w
~ w wˆ
将(5.31)式减去(5.32)式,即得
x~ A M 1C E x~
~ (5.33)
w M 2C 0 w
~
由(5.33)式可知,适当地选择 M 1 , M 2 可以使观测误差按希望的速
度衰减到零。
§5.6 Kalman 滤波器的基本概念
一、问题的提出
以往我们所讨论的仅是确定性系统,即系统
x A x B u
(5.34)
y Cx
35
其中 A , B , C 是已知常阵,系统内并不存在随机干扰, u 是确定
性输入,其值精确给定; y 是可精确量测的输出;状态 x 也是确定
量。 x 虽然不能从 y 简单地确定出来,但是只要系统能观,就可以通
过输入 u 和输出 y 把状态 x 观测出来,得到了状态的观测量 x̂ 就能
实现状态反馈控制,观测器示意见图 5.7。
u
观测器 x̂
y
x̂ ( A MC ) xˆ B u M y
图 5.7
但是很多情况下, x 本身可能受到“系统干扰”的影响,在量测过
程中也会有“量测噪声”的出现。如果这些随机干扰比较严重不容忽
视,那么状态观测器就不能满足要求了。观测器只能用在随机干扰可
以忽略的情况。
二、线性随机系统
和确定性系统相对的系统是随机系统。在讨论随机系统之前,首
先对分析随机系统用到的概率统计的一些基本概念作一简单回顾。
1.随机变量 x 的数字特征
表示随机试验的结果即为随机变量的取值。所谓随机变量的均
值指的是随机变量 x 的平均值,用下式表示。
x E x ( 5.35 )
Var( x ) E ( x x )2 ( 5.36 )
显然非随机变量的方差为零。
两个随机变量 x 和 y 之间的依赖程度,主要用它们的协方差来度
量,表示为:
36
Cov( x , y ) E ( x Ex )( y Ey ) ( 5.37 )
如果 Cov( x , y ) 0 ,则称 x , y 是两个不相关的随机变量,完全
独立的随机变量永远是不相关的。
2.随机过程及其数字特征
随 机 过 程 是 一 组 定 义 在 时 间 ( t0 , T ) 中 的 诸 随 机 变 量
x( t ) : t0 t T 的集合,例如 5 秒周期的每个时间点上电压表的读
数就是一个随机过程。
一个随机过程 x( t ) 的平均值和方差定义为:
x ( t ) E x ( t ) (t 0 t T ) (5.38)
Var x ( t ) E x ( t ) Ex ( t )
2
(t 0 t T ) (5.39)
对随机过程还有一个感兴趣的数字特征是自协方差函数。
r ( t , ) Cov x ( t ), x( )
E x ( t ) Ex ( t ) x ( ) Ex ( ) ( 5.40)
它度量过程同它本身在不同时刻的相互关系。若一个随机过程
x( t ) 有 r ( t , ) Var x( t ) ( t )
1 t
其中 ( t )
0 t
则称此过程为广义的白噪声过程。意思是随机过程 x( t ) ,从一个时刻
t 到下一时刻 完全不相关。白噪声过程在物理上不可实现,但是它
是一个极其有用的数学手段。
3.随机向量及其数字特征
如果 x1 , x 2 , , x n 都是随机变量(或随机过程),它们的集合称
随机向量,随机向量用下式表达:
x x1 , x2 ,, xn
T
(5.41)
其平均值为:
x E x x1 , x2 , , xn
T
( 5.42)
37
协方差矩阵可定义为:
P E ( x x )( x x )T
( x1 x1 ) 2 ( x1 x1 )( x2 x 2 ) ( x1 x1 )( x n xn )
( x2 x2 )( x1 x1 ) ( x2 x2 )2 ( x2 x2 )( xn xn )
E 0
( xn xn )( x1 x1 ) ( xn xn )( x 2 x2 ) ( xn xn )2
(5.43)
可以证明:此矩阵是对称而且非负定的。
如果这些随机变量两两不相关,那么非对角元素为 0,P 阵就成
为对角阵,即
( x1 x 1)
2
0
P E ( x2 x 2 ) 2 (5.44)
2
0 ( x n x n )
现在讨论线性随机系统:
x ( t ) A x( t ) B u( t ) F w( t )
(5.45)
y( t ) C x( t ) v ( t )
其中 w( t ) 是一个向量随机过程,称为模型噪声,输入噪声或过
程噪声, w( t ) 可以理解为外加控制信号 u( t ) 的波动或加到系统上的
未知干扰等, v( t ) 也是一个向量随机过程,称为量测噪声或输出噪
声,它表示测量不确定性或偏移,典型例子是量测放大器中的热噪
声。
首先对(5.45)式所示的系统作如下假定:
1)假定(5.45)式所示的系统是能控又能观的;
2)假定过程 w( t ) 和 v( t ) 为零均值白噪声,即
38
E w( t ) 0
E v( t ) 0 ( 对全部时间 t ) ( 5.46 )
T
E w( t )w ( t ) Q ( t )
E v( t )v
T
( t ) R ( t ) ( 对全部时间 t , ) ( 5.47 )
其中 ( t ) 的定义和(5.40)式中定义的相同,协方差阵 Q 表示
w( t ) 各分量之间的相关程度,它是 l l 的对称方阵;协方差阵 R 则
表示 v (t ) 各分量之间的相关程度,它是 m m 对称方阵。
3)并且假定 w( t ) 和 v( t ) 是不相关的,即
T
E w( t )v ( ) 0 ( 对全部时间 t , ) ( 5.48 )
4)同时假定状态变量的初态和噪声过程 w( t ) , v( t ) 不相关,即
E x ( 0 )w ( t ) 0
T
( 对全部时间t ) ( 5.49 )
T
E x ( 0 )v ( t ) 0
5) x, y 为独立的随机变量。
以上假定可以保证状态 x (t ) 和输出 y( t ) , ( t0 t ) 本身是正
规的向量随机过程。下面我们来研究在上述假定下的(5.45)式随机
过程的状态估计问题。
由于 x, y 都是随机量,因而必须用统计学的观点去估计 x 。现在
比较成功的方法是 Kalman 滤波器
由于 Kalman 滤波器的基本原理较复杂,这里只是比较通俗地介
绍离散型 Kalman 滤波器的基本原理。
和观测器一样,Kalman 滤波器的输入量也是 y 和 u ,输出是 x
的估计值。不同的是,它可以在随机干扰的情况下对 x 作出最优估计,
这相当于把噪声从有用的信号中滤掉,故称滤波器见图 5.8。
w
u
x̂
Kalman 滤波器
y v
39
图 5.8
Kalman 滤波器是一种递推估计,其过程为:
在以下的分析中也分两部进行,即
1)如何用量测结果 y k 来改善原估计 x k ,得到可靠的估计 x̂ k ,
y
k x
ˆk。
即由 x k
2)状态转移后对下一时刻的估计,即由 xˆ k x k 1 。
§5.7 Kalman 滤波器的递推算法
一、利用量测结果改善 x 的原估计
现在 x 、y 都是随机过程,并假定已经根据系统的状态方程对 x
作出了某种估计 x ,而且已经知道了它的协方差阵。
COV ( x , x ) E ( x E x )( x E x )T M nn (5.50)
其中 M 是 n n 正定对称阵,我们称 x 为量测前的估计或原估计。然
后根据量测结果 y 对原估计进行修改,以便得到更好的估计 x̂ 。
y
必须指出,由 x k
k
xˆ k 是在同一步中进行的,它们的下标量
均为 k ,为了简化而将下标省略。
用量测 y 来修正原估计的公式为:
xˆ x K ( y c x ) (5.51)
其中 k 为 Kalman 滤波器的增益矩阵,上式可用图 5.9 来表示。
x + x̂
X
+
-
C +
K
y
40
图 5.9
现在的问题是,原估计 x 并不十分可靠,量测结果 y 也并不十分靠,
我们怎样从中对 x 做出更好的估计呢?
假定 y 的协方差阵已知为
COV ( y , y ) E ( y E y )( y E y )T R
(5.52)
R 为 m m 的正定对称阵,并假定 y 与 x 是互相独立的随机变量,
现在需要在已知 x 和 y 的协方差阵 M , R 的情况下确定 K ,使得 x̂
是对于 x 的最优估计。
Kalman 滤波器是最小方差估计,它的最优准则是:
E ( x̂1 Ex̂1 )2 ( x̂2 Ex̂2 )2 ( x̂n Ex̂n )2 min ( 5.53 )
即 x̂ 的各分量的方差之和最小。设 P 表示经量测 y 修正后的估计值 x̂
的协方差阵,即
P E ( xˆ E xˆ )( xˆ E xˆ )T
(5.54)
它为 n n 的正定对称阵。显然 P 阵的主对角元素之和正好是(5.53)
式的左边。因此,现在问题可转化为在已知 x , y 的协方差阵 M , R
的情况下确定 K 使得
t r P min
二、增益阵 K 的确定
现在要把 P 阵表达出来,以确定 K 阵。由上面已知
xˆ x K ( y C x )
对上式两边取均值
E xˆ E x K ( E y CE x )
将上两式相减得:
xˆ E xˆ x E x K ( y E y ) KC ( x E x )
( I KC )( x E x ) K ( y E y ) (5.55)
41
再将(5.55)式代入(5.54)式,得
P E ( xˆ E xˆ )( xˆ E xˆ )T
E ( I KC )( x E x ) K ( y E y ) ( I KC )( x E x ) K ( y E y )
T
E ( I KC )( x E x ) K ( y E y ) ( x E x )T ( I KC )T ( y E y )T K T
即
P ( I KC ) M ( I KC )T KRK T ( 5.56 )
因为 X 与 y 相互独立,所以其中两项为零。
下面求使估计误差的方差极小的 K 。为了避免用微分法求极小值,
可将式(5.56)进行变换。然后把与 K 有关的项集中到一起得:
P M KCM MC T K T KCMC T K T KPK T
M K ( CMC T R )K T KCM MC T K T ( 5.57 )
因为 M , R 均为对称方阵,故上式中 CMC T R 亦为对称阵。
令
SS T CMC T R ( 5.58 )
则(5.57)式为
P M KSS T K T KCM MC T K T
试凑
M ( KS L )( KS L )T ( 5.59 )
( KS L )( KS L )T ( KS L )( S T K T LT )
其中
KSS T K T KSLT LS T K T LLT
设 SLT CM 则 LS T MC T ( 5.60 )
则(5.59)式变成
P M ( KS L )( KS L )T LLT ( 5.61 )
由(5.58)、(5.60)两式可求得 LLT 。即在(5.60)式两边左乘
S T ,则得
S T SLT S T CM LT ( S T S )1 S T CM
又 L MC T S ( S T S )1
42
以上两式相乘,得
LLT MC T S ( S T S )1 ( S T S )1 S T CM ( 5.62 )
令
W S ( S T S ) 1 ( S T S ) 1 S T
S T W S S T S ( S T S ) 1 ( S T S ) 1 S T S I
SS T W SS T SS T
所以
W ( SS T )1 ( CMC T R )1
即得 LLT MC T ( CMC T R )1 CM
因而(5.61)式可以写成
P M ( KS L )( KS L )T MC T ( CMC T R )1 CM ( 5.63 )
从上式可以看出,只有第二项中有 K ,且第二项也是对称方阵,其
对角元素为非负数。可见若选 KS L 0 ,则有 trp min ,这样就可
以确定 K 。
KS L
KSS T LS T MC T
K MC T ( SS T ) 1 MC T ( CMC T R ) 1 ( 5.64 )
由式(5.63)得出 X̂ 的估计误差最小方差表达式
P M MC T ( CMC T R )1 CM ( 5.65 )
或
P M KCM ( 5.66 )
由矩阵反演公式
P ( M 1 C T R 1C ) 1 (5.67 )
K ( M 1 C T R 1 C ) 1 C T R 1 (5.68)
于是,我们就得到了 K ,并且知道了新估计 x̂ 的协方差阵。对上面表
达式 P , K 加以分析,可以得到一些有趣的结论:
(1)对于 P 阵的解释
43
T T 1
P M
MC
( CMC
R ) CM
因为
LLT
44
其中
1 i j
ij
0 i j
同时假定 x k 、 w k 、 v k 也是两两不相关的。
2.状态转移后对下一时刻的估计
若在状态转移之前, x k 之估计为 x̂ k ,协方差阵为 Pk ,经状态
转移得到状态预报值 x k 1 应由下式决定
x k 1 A xˆ k B u k F w k (5.70)
对(5.70)式两边取均值,由于 E w k 0 ,所以得
E x k 1 AE xˆ k B u k ( 5.71)
现在来求 x k 1 的误差方差阵。对(5.70)式减去(5.71)式,得
x k 1 E x k 1 A( xˆ k E xˆ k ) F w k
M k 1 E ( x k 1 E x k 1 )( x k 1 E x k 1 )T
E [ A( xˆ k E xˆ k ) F w k ][ A( xˆ k E xˆ k ) F w k ]T
T
E A( xˆ k E xˆ k )( xˆ k E xˆ k )T AT F w k w k F T
APk AT FQF T (5.72)
ˆ k 与w k 不相关,所以相应有两项为零。
上式,因为 x
四、Kalman 滤波器的递推算法
1.递推算法
现将 Kalman 滤波器的各步算法,按其计算顺序再一次地总结如下:
(1)预先必须确切已知,参数矩阵 A , B , C和F ,输入、输出噪声
的方差分别为 Q , R 。
(2)下列初始条件必须已知,或者必须适当地假设:
初始状态 x̂ ( 0)
协方差阵 P ( 0 )
(3)计算下一步的新估计预测(即状态转移)
45
x ( k 1) A xˆ ( k ) B u( k ) F w ( k ) (5.73)
因为 w (k ) 是未知的,这里用 w( k ) 的均值 w ( k ) 来代替。
(4)计算 X ( k 1 ) 误差协方差阵
M k 1 APk AT FQF T ( 5.74 )
(5)计算改进新估计值的修正矩阵(即增益阵)。
K k 1 M k 1C T ( CM k 1C T R )1 ( 5.75 )
ˆ k 1
(6)计算 k 1 时刻的精确估计 x
xˆ k 1 x k 1 K k 1 ( y k 1 C x k 1 ) ( 5.76)
ˆ k 1 的误差协方差阵
(7)计算估计值, x
Pk 1 M k 1 K k 1CM k 1 ( 5.77 )
(8)将 K 增 1,并重得按(3)往下进行
2.Kalman 滤波器框图(见图 5.10)
3.几点说明
(1)Kalman 滤波方法的一个明显优点是,它是一种递推算法,
当获得一次新的量测 y k 1 后,只需要利用上一次推算得到的前一状
ˆ k 1 和滤波误差阵 Pk 1 。这样,不论量测次数如何增加,需要存
值x
贮的历史的量测数据和计算结果并不相应增加。
(2)初始值的确定
开始时需要假定初始状态。由于初始状态是未知的,所以一般设:
xˆ ( 0) x ( 0)
另外必须适当地假设
P (0) E ( xˆ (0) E xˆ (0))( xˆ (0) E xˆ (0))T
若 x̂ (0) , P ( 0 ) 选择适当,用 K 可以消除影响,并不需要准确地知道
x̂(0) 和 P ( 0 ) 。
(3)增益阵 K 的离线计算。
46
增益阵 K 与测量无关,因此,在测量开始之前就能对它进行计算,
并加以存贮,增益阵 K 的离线计算通过下述三个公式交替进行。
M k 1 APk AT FQF T
K k 1 M k 1C T ( CM k 1C T R )1
Pk 1 M k 1 M k 1C T ( CM k 1C T R )1 CM k 1
当k 时, M k 1 , K k 1 , Pk 1 均趋于它们各自的常数。
47
例 5.4 已知随机系统
0 1 0 0
x ( k 1) 0 0 1 x ( k ) 0 w ( k )
0.1766 0.9580 1.7063 1
y( k ) 0 0 1 x ( k ) v ( k )
w( k ), v( k ) 为零均值白噪声, w ( k ), v ( k ), x ( k ) 两两不相关。
0.5 0
, Q 1,
现假定 P ( 0 ) 0.5
R 4,
0 0.5
表 5.1 给出了 k 0 ,1, ,10 时的协方差矩阵,可以看出,当 k 6 后
其元素变化很小。因此大约在 k 6 时,Kalman 滤波器就处于稳定状
态。
Kalman 滤波器内容很丰富,这里只介绍了离散定常系统的 Kalman
滤波器。
表 5.1
48
1.2243 0.9337 0.4492 1.2547 0.9229 0.4282
P ( 4 ) 0.9337 1.3603 1.1991 , P ( 6 ) 0.9229 1.3511 1.1949
0.4492 1.1991 2.1033 0.4284 1.1949 2.1072
49
过程
wk v k 1
F
+ + x k 1 C
+
+
uk + + y k 1
xk
A Z 1
C - k k 1
F x k 1 +
+ + +
+ + ˆ k 1
x
x̂ k
A Z 1
Kalman
滤波器
图 5.10
50
第六章 李雅普诺夫稳定性(模块十四)
我们已经学过判别系统稳定性的几种方法:劳斯-胡尔维兹判据、
奈魁斯特判据等,这些方法主要适用于线性定常系统。本章将介绍适
用于一般非线性系统(当然也包括线性定常系统)的 李雅普诺夫稳
定性判据。
§1 基本概念
1.1 系统的分类
系统 定常 非定常
线性 x Ax x A(t ) x
非线性 x f ( x ) x f ( x, t )
按是否满足迭加原理分为:线性、非线性 ;按是否显含时间变
量分为:定常(时不变)、非定常(时变)。线性定常系统最简单,
非线性时变系统最复杂。
1.2 标量函数的定号性
定的):若 V ( x ) 是正定的(半正定的)。
足定号性条件。
请特别注意正定(负定)与半正定(半负定)的区别,更要注意
V (0) 0 是定号性的必要条件。
定 号 性 可 以 是 原 点 邻 域 上 的 局 部 性 质 , 如 :
第六章 李雅普诺夫稳定性 1
在不引起混淆时,可直接用 V ( x ) 0 表示正定,其余类推。
1.3 运动和平衡状态
考虑不受外部作用的系统 x f ( x , t ) ,其状态轨线,即方程的
解 x (t ) (t ; x 0 , t 0 ) 称作系统的运动。
统的平衡状态 ,是一种“静止”的运动。平衡点可能不止一个,甚
至无穷多个。若某一平衡点附近足够小的邻域内没有别的平衡点,则
称它为孤立平衡点 。经过适当的坐标变换,任一平衡点总可以变换
到状态空间的原点。
1.4 平衡状态的稳定性
李雅普诺夫意义下平衡状态稳定性的几个基本概念如下。
x 0 x e ( ) 内出发的运动,恒有 x xe 。
吸引域充满整个状态空间。
讨论的是平衡状态(而不是系统)的稳定性;
平衡状态唯一是大范围渐近稳定的必要条件;
对线性系统,渐近稳定必定大范围渐近稳定。
§2 李雅普诺夫方法
2.1 第一方法(间接法)
第六章 李雅普诺夫稳定性 2
f
y Ay ,其中, y x x e , A
x T x xe
由线性化模型判定原系统平衡状态稳定性的第一方法如下:
值至少有一个具有正实部,则 xe 是不稳定的;其它情况下(即 A 的
特征值均没有正实部,但至少有一个具有零实部),则不能判定 xe
的稳定性。
[ 例 2-1] 非线性系统用下列微分方程组描述,其中系数 , ,
均大于零,且 ,要求判断平衡状态的稳定性。
x1 x2
x 2 sin x1 x2
解:该系统的平衡状态有无穷多个,这里仅讨论其中的一个:
arcsin
xe
0
原系统在平衡状态 x e 附近的线性化模型是:
y Ay
其中
y x xe
f 0 1
A T =
x x x e cos(arcsin )
det( I A) 2 cos(arcsin ) 0
显然,当 时,线性化模型的两个特征值均具有负的实部,
型的特征值有一个为负,而另一个为零,因而,不能据此判断原系
统平衡状态 xe 的稳定性。
2.2 第二方法(直接法)
第六章 李雅普诺夫稳定性 3
李雅普诺夫提出的第二方法不需要线性化的步骤,而是通过所
谓的“能量”函数,直接判断系统平衡状态的稳定性。
设原点是定常系统
x f ( x ) (2-1)
的平衡状态, V ( x ) 是正定的标量函数(“能量”函数),它沿系统
解曲线(状态轨线)对时间 t 的导数为
x1
V V V ( x ) f ( x )
V ( x ) (2-2)
x1 xn x T
x n
根据V ( x ) 的定号性,李雅普诺夫给出了原点稳定性的判别定理。
若 x 时,V ( x ) ,则原点是大范围渐近稳定的。
V ( x ) 除原点外沿状态轨线不恒为零,则原点是渐近稳定的;再进一
以上均为充分条件,找不到满足定理条件的V ( x ) ,不能下结论;
李雅普诺夫函数;
曲线上是消耗功率的过程。
[例 2-2] 考察如下非线性系统原点的稳定性。
x1 4 x2 x13
x 2 3 x1 x2
3
解:(原点是唯一平衡点,但由第一方法不能判定它的稳定性)
设 V ( x ) ax12 bx22 0 , a, b 0
第六章 李雅普诺夫稳定性 4
则 V ( x ) 2ax1 (4 x2 x13 ) 2bx2 (3x1 x23 )
令 8ax1 x2 6bx1 x2 0 4a 3b
当 x 时,V ( x ) ,所以原点大范围渐近稳定。
[例 2-3]考察如下线性系统的稳定性
0 1
x x
1 1
解:(原点是唯一平衡点,特征值均具有负实部)
若 V ( x ) 0 , 则 x2 x 2 0 , 代 入 原 方 程 得 x1 x1 0 , 因 而
V ( x ) 0 仅发生在原点处,且当 x 时, V ( x ) ,所以
原点大范围渐近稳定。
x 时,V ( x ) ,所以原点大范围渐近稳定。
[例 2-4] 考察如下非线性系统在原点处的稳定性。
x1 x2
x 2 (1 x2 ) x2 x1 ( 0)
2
解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)
选 V ( x ) x12 x22 0 ,
则 V ( x ) 2 x1 x1 2 x2 x 2 2 (1 x2 ) 2 x22 0 。
到: x1 0 和 x1 0 。因而,只有原点满足 x2 0 。
综上所述,在系统的状态轨线上, V ( x ) 0 ;除原点外, V ( x )
[例 2-5] 考察如下非线性系统在原点处的稳定性。
1
x 1 x1 x 2
2
1
x 2 ( x12 x 22 ) x1 x2
2
解:(原点是平衡点但不唯一,由第一方法可判定它是渐近稳定
的)
选V ( x ) x12 2 x1 x 2 3 x 22 ( x1 x 2 ) 2 2 x 22 0 ,
则V ( x ) 2( x1 x 2 )( x1 x 2 ) 4 x 2 x 2
显然, V ( x ) 在 2 x1 ( x1 3 x 2 ) 1范围(兰虚线)内负定,且原点
为该范围的内点,所以原点是渐稳的。
图 2-1
dV 4 1 1 2
x1 3 0 x12 Vmin
dx1 3 6 x1 2 2 3
2
得到一个保守的吸引域: x12 2 x1 x2 3 x22 ,如红色点划线
3
所示,黑色实线所示是仿真所得的实际(最大)吸引域。
请思考:该例题中, V ( x ) 在 2 x1 ( x1 3 x 2 ) 1范围(兰虚线)内
是负定的,为什么这一范围内不都是原点的吸引域呢?
§3 构造李雅普诺夫函数的方法
很遗憾,对于非线性系统,没有一种构造李雅普诺夫函数的完
全有效的通用方法。人们通常凭经验和技巧来选取李氏函数,最常见
的是二次型函数。此外,也涌现出了许多适用于特定情形的辅助方法。
这里介绍其中比较有影响的两种:克拉索夫斯基方法和变量梯度法。
3.1 克拉索夫斯基方法(KrasovsKii)
思路:不用 x 而用 x 构造李雅普诺夫函数。
非线性定常系统 x f ( x ) 的雅可比(Jacobi)矩阵定义为:
f1 f1
x
xn
f(x ) 1
F ( x) (3-1)
xT
fn
fn
x1 xn
[定理 3-1](KrasovsKii)非线性系统 x f ( x ) ,原点是它的平衡状
态。若矩阵 F T ( x ) F ( x ) 负定,则原点是渐近稳定的。进一步,当
x 时,有 f ( x ) ,则原点是大范围渐近稳定的。
证明:
2
取 V ( x) f ( x) f T ( x) f ( x) (3-2)
则 V ( x ) f T ( x ) f ( x ) f T ( x ) f ( x )
第六章 李雅普诺夫稳定性 7
f T ( x )[ F T ( x ) F ( x )] f ( x )
根据李雅普诺夫稳定性定理,[定理 3-1]成立。证毕。
KrasovsKii 方法仍然是充分条件,条件不满足不能下结论;
x1 5 x1 x2
x 2 x1 x2 x2
3
解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)
5 1
F ( x) 2 是对称矩阵,
1 1 3 x2
1 5 0 , 2 det F 15 x22 4 0 ,故 F 负定。
2
且当 x 时, f (5 x1 x2 ) 2 ( x1 x2 x23 ) 2
所以原点是大范围渐近稳定的。
x1 5 x1 x22
x 2 x1 x2 x2
3
解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)
5 2 x2 T 10 2 x2 1
F ( x) 2 , F ( x ) F ( x ) 2 x 1 2 6 x 2
1 1 3 x2 2 2
故 F T ( x ) F ( x ) 负定。
2
且当 x 时, f (5 x1 x22 ) 2 ( x1 x2 x23 ) 2
所以原点是大范围渐近稳定的。
3.2 变量梯度法(Schultz,Gibson)
思路:先找V ( x ) 0 ,而后计算V ( x ) 。
(1)由V ( x ) 的梯度向量确定V ( x ) 。
第六章 李雅普诺夫稳定性 8
x1
dV V V V
V ( x ) gradV x
T
dt x1
x2 xn
x n
V V V
gradV T
1 2 n
x1 x2 xn
gradV 称为标量函数 V 的梯度,它是一个向量函数。
(2)求李雅普诺夫函数V ( x )
n
V ( x ) 0 V ( x ) d t 0 gradV d x 0 i d xi
t x T x
i 1
这是一个沿解曲线的曲线积分,当被积函数是梯度时,结果与
积分路径无关。
(3)构成梯度的条件:梯度向量的雅可比矩阵必是对称阵,
1 1
x
xn
1 i j
grad V , i j
xT x j xi
n
n
x xn
1
共有 n(n 1) / 2 个方程。
(4)选择一条简单的积分路径
上述条件满足时,选择按坐标的逐渐积分是最方便的。
x x x
V ( x ) 0 1 1 d x1 0 2 2 d x2 0 n n d xn
注意, 0 1 1 d x1 时, x2 x3 xn 0
x
2 d x2 时, x1 x1 , x3 x4 xn 0 ,余类推。
x2
0
变量梯度法的步骤:
(1)设梯度向量
第六章 李雅普诺夫稳定性 9
1 a11 x1 a12 x2 a1n xn
gradV ( x )
n an1 x1 an 2 x2 ann xn
(2)计算导函数:V ( x ) gradV T x 1 f1 ( x ) n f n ( x ) ;
i j
(3)由 , i j ,以及 V ( x ) 0 确定待定的 aij ;
x j xi
x x
(4)按坐标积分求V ( x ) :V ( x ) 0 1 1 d x1 0 n n d xn ;
(5)根据所得的 V ( x ) 和 V ( x ) 判定原点的稳定性,若得不出结论不
说明任何问题。
[例 3-3] 用变量梯度法判定下述系统平衡状态的稳定性。
x1 x1 2 x12 x2
x 2 x2
解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)
1 a11 x1 a12 x2
(1)设梯度向量: gradV ( x )
2 a21 x1 a22 x2
(2)计算导函数:V ( x ) gradV x
T
V ( x ) x12 (1 2 x1 x2 ) x22 0 ,若 1 2 x1 x2 0
(注意,原点是范围1 2 x1 x2 0 的内点)。
1 2
校验: 1 x1 , 2 x2 ; 满足梯度条件
x2 x1
(4)按坐标积分求V ( x )
第六章 李雅普诺夫稳定性 10
x x 1
V ( x ) 0 1 x1 d x1 0 2 x2 d x2 ( x12 x22 ) 0
2
(5)综上, V ( x ) 0 ,且在原点的一个邻域内有 V ( x ) 0 ;所以原
点是渐近稳定的。
[例 3-4] 用变量梯度法判定下述系统平衡状态的稳定性。
x1 x2
x 2 x2 x1
3
解:(原点是唯一平衡点,但由第一方法不能判定它的稳定性)
1 a11 x1 a12 x2
(1)设梯度向量: grad V
2 a21 x1 a 22 x2
(2)计算导函数:V ( x ) gradV T x
V ( x ) x22 0
(由于 a11 不是常数,违反了原假定,必须进行下面的校验)
1 2
校验: 1 x13 , 2 x2 ; 满足梯度条件
x2 x1
(4)按坐标积分求V ( x )
1 4 1 2
V x 0 1 x13 d x1 0 2 x2 d x2
x x
x1 x2 0
4 2
(5)综上, V ( x ) 0 , V ( x ) 0 ;在解曲线上除原点外, V ( x ) 不恒
§4 线性定常系统的稳定性
4.1 线性定常系统的渐近稳定性
第六章 李雅普诺夫稳定性 11
对线性定常系统
x Ax (4-1)
而言,系统的稳定性和原点的稳定性是一致的,以下不再区分。
AT P PA Q (4-2)(1)充
分性证明(有正定解 P 渐稳):
选 V ( x ) x T Px ( P 0 ),
则 V ( x ) x T Px x T Px x T ( AT P PA) x x T Qx
若 Q 0 ,根据李雅普诺夫稳定性定理,系统是渐近稳定的。换
系统是渐近稳定的。证毕。
考察矩阵微分方程: E (t ) AT E (t ) E (t ) A
则(4-3)式就是李亚普诺夫方程(4-2)。由于 A 是渐稳的,上
若 x0 0 ,则 x 0 ,由于 Q 0 ,因而上式中被积函数总是正的,
见式(4-4),满足李雅普诺夫方程(4-2)。证毕。
上述证明过程给出了线性定常系统的李雅普诺夫函数以及它的导
第六章 李雅普诺夫稳定性 12
函数:V ( x ) x T Px ,V ( x ) x T Qx ;
若李雅普诺夫方程的解矩阵 P 是负定的,则系统是不稳定的;
Q 可以任取,通常取 Q I ,解 AT P PA I 求 P ;若 P 正定,
系统渐稳,否则,不渐稳;(充分必要条件)
也可以先任取正定矩阵 P ,求 AT P PA Q ;若 Q 正定(负
定),则系统渐稳(不稳),否则,不说明任何问题。
的充分必要条件是: i ( A) j ( A) 0, i, j 1, 2, , n ,即矩阵 A 没
有互为相反数的特征根。当条件满足时,P 唯一且为对称阵。
提示:(1)前面已学过:方程 AE EM N 有唯一解矩阵 E 的充
要条件是:矩阵 A 和 M 彼此间没有相同特征值。
[例 4-1] 判定下述线性定常系统的渐近稳定性。
0 1
x x
1 1
a c
解:取 Q I ,令 P ,代入李雅普诺夫方程得:
c b
0 1 a c a c 0 1 1 0
1 1 c b c b 1 1 0 1
比较矩阵元素得:
2c 1 a 1.5
1.5 0.5
a b c 0 b 1 P 0
2b 2c 1 c 0.5 0 . 5 1
所以该系统是渐近稳定的。(思考:和其它判稳方法比较)
第六章 李雅普诺夫稳定性 13
AT P PA 2P Q (4-5)
实部均小于 3 。
0 1 1 1
x x 2 1 u
2 2
a b ac 1 b d
解:设 F ,则 A BF 2 2a c 2 2b d
c d
ac 2 2a c a c 1 b d 7 0
1 b d
2 2b d 2 2a c 2 2b d 0 7
(思考:和极点配置方法比较)
4.2 线性定常系统稳定性小结
在前面的稳定性讨论中,我们并没有涉及系统的输入和输出。这
种仅考虑系统的初态和状态之间关系的稳定性问题称为内部稳定性
问题,而仅考虑系统的输入和输出之间关系的稳定性问题称为外部
稳定性 问题。如果一个系统对于有界的输入必然产生有界的输出,
对线性定常系统而言,系统的内部稳定性取决于系数矩阵 A 的
特征值,而外部稳定性取决于输入输出传递函数的不可约极点。我们
知道,在由系统的状态方程和输出方程求传递函数的过程中可能发
生零极对消,如果消去的极点是不稳定的,尽管它没有体现在外部,
但将造成内部状态的不断增长,最终引起系统的瘫痪。下面给出线性
定常系统稳定性的有关重要结论:
第六章 李雅普诺夫稳定性 14
系统渐近稳定的充分必要条件是:系数矩阵 A 的特征值全部在
复平面的左半开平面内;
系统稳定的充分必要条件是:系数矩阵 A 的特征值全部在复平
面的左半闭平面内,且虚轴上特征值对应的约当块为 1 阶;
系统 BIBO 稳定的充分必要条件是:输入输出传递函数的不可
约极点全部在复平面的左半开平面内;
定;对于最小实现的系统,BIBO 稳定和渐近稳定等价。
§5 离散系统的稳定性
李雅普诺夫第二方法可以很方便地推广到离散系统。
5.1 非线性定常离散系统
对于离散时间系统
x ( k 1) f [ x ( k )] (5-1)
设V [ x (k )] 为标量函数,它沿系统状态轨迹的增量为
V [ x ( k )] V [ x (k 1)] V [ x ( k )] (5-2)
适用于连续时间系统的李雅普诺夫各种稳定性判据,只要相应
散时间系统。例如,假定原点是系统(5-1)的平衡点,有:
若 x (k ) 时,V [ x (k )] ,则原点是大范围渐近稳定的。
5.2 线性定常离散系统
对线性定常离散系统
x (k 1) Gx ( k ) (5-3)
有类似于连续情形的定理:
下面仅对充分性证明作一提示:
取 V ( x k ) x kT P x k
则 V ( x k ) x kT 1 P x k 1 x kT P x k (G x k ) T P (G x k ) x kT P x k
x kT [G T PG P ] x k x kT Q x k
请思考:线性定常连续系统离散化后,渐近稳定性会改变吗?
的充分必要条件是: i (G ) j (G ) 1, i, j 1, 2, , n ,即矩阵 G 没有
互为倒数的特征根。当条件满足时,P 唯一且为对称阵。
2G T PG P Q (5-5)
参考书
《自动控制原理》(下册),吴麒主编,清华大学出版社,1992,(第 10 章)
《自动控制理论基础》,戴忠达主编,清华大学出版社,1991,(第 7 章)
《线性系统理论》(第二版),郑大钟,清华大学出版社,2002,(第 5 章)
《线性系统控制理论》,陈树中等,华东师范大学出版社,2000,(第 3 章)
《非线性控制系统导论》,高为炳,科学出版社,1988,(第 3 章)
《控制理论导论》,郭雷主编,科学出版社,2005,(第 2 章)
第六章 李雅普诺夫稳定性 16
第七章 最优控制(模块十五)
最优控制是在 50 年代后期,由于航空航天的制导、导航和控制
技术的需要而逐渐发展起来的,并推广应用于其它一些领域。所谓最
优控制是指:对于给定的受控系统,寻找一种控制律,使 系统由给
定的初态转移到希望的末态,并使得某一性能评价指标为最优。
§1 基本概念
1.1 一个例子
如图 1-1 所示,宇宙飞船在月球表面实现软着陆,要求控制发
动机的推力 f ,使燃料消耗最少。
高度和垂直速度分别为 h 和 v 。月球的重力加速度可视为常数 g ,自
某 t 0 时刻开始飞船进入着陆过程。其运动方程和初始条件为:
h v, h(0) h0 ;
f
v g , v(0) v0 ; v
m
m k f , m(0) M F .
其中 k 是一常数。要求控制飞船从初始状态
出发,于某一时刻 t f 实现软着陆,即
月球
h(t f ) 0 , v(t f ) 0 。
0 f (t ) f max 。
满足上述限制,使飞船实现软着陆的推力程序 f (t ) 不止一种,其中
消耗燃料最少,或使下述性能指标为最大者才是最佳推力程序,
J m(t f ) 。
1.2 基本术语
的,也可以是时变的;可以是线性的,也可以是非线性的。
第七章 最优控制 1
(2)初始条件和终端条件:通常,初始时刻 t 0 和初始状态 x (t 0 ) 是
以是自由的,或是受某种约束的。终端条件又称为目标集。
(3)容许控制:在实际问题中,控制量通常会受到客观条件的限制,
只能在一定范围(称为容许控制域)内取值,记作: u U ,
控制域 U 可以是受限的,也可以是不受限的。
(4)性能指标:需最小(大)化的标量函数(泛函),通常形式为:
t
J φ [ x (t f ), t f ] t f L[ x (t ), u(t ), t ] d t
0
其中,第一项称为末值型指标,第二项称为积分型指标。仅有末
值型指标,称麦耶耳(Mayer)问题,仅有积分型指标,称拉格伦日
(Lagrange)问题,二者均有(复合型),称波尔扎(Bolza)问题。
1.3 最优控制的提法和求解
最优控制的一般提法是:给定受控系统的状态方程,求一容许
控制,使系统由给定的初态转移到希望的目标集,并使给定的性能
指标为最小。最优控制的求解方法主要有:
(1)古典变分法(极大值原理的基础)
(2)极大值原理(苏,庞德里亚金,Pontryagin)
(3)动态规划(美,贝尔曼,Bellman)
§2 泛函与变分
2.1 定义与公式
变分法是数学的一个分支,是求泛函极值的一种经典方法,本
节介绍与变分法有关的一些基本概念。
记为: J J [ y ( x)] 。
第七章 最优控制 2
1
如 , J 0 y ( x) d x , 则 y ( x ) x , J 0.5 ; y ( x) cos x ,
J sin 1 。
1
x2
示为: S [ y ( x)]
x1
[1 y 2
( x)] 2 dx。
注意,函数的应变量是数,自变 B
量也是数;泛函的应变量是数,而自 A
变量是函数。为区别起见,通常把泛
x1 x2
函的自变量称为“宗量”,并通俗地
图 2-1
将泛函比喻作“函数的函数”。再强
调一
遍,泛函的宗量是函数,泛函的取值依赖于宗量所取函数的整体形
式。
函数之差: y ( x) y1 ( x) y ( x) 。
d d x x
dx
y ( x) [ y ( x)] ,
dx
0 y ( x) d x [ 0 y ( x) d x] (2-1)
[ 定 义 2-4] (泛函的变分)宗量的变分引起的泛函增量可以表示为:
J J [ y ( x) y ( x)] J [ y ( x)]
L [ y ( x), y ( x)] [ y ( x), y ( x)] (2-2)
第七章 最优控制 3
为泛函的变分,记为:
J L [ y ( x), y ( x)] (2-3)
由定义知,泛函的变分是泛函增量的线性主部。
量)
J J [ y ( x) a y ( x)] a 0 (2-4)证明:
a
J J
J [ y ( x) a y ( x)] a 0 lim lim ( a a 0 )
a a 0 a a 0 a
a 0
x F
J x2 y ( x) d x (2-5)
1 y
x2
J F [ y ( x) a y ( x)] d x a0
a x1
x F ( y a y ) ( y a y )
x2 dx
1
( y a y ) a a 0
x F
x2 y ( x) d x 证毕。
1 y
x
[结论 2-3] 若 J x F [ y1 ( x), , y n ( x), x] d x ,则:
2
x F F
J x2 y1 ( x) y n ( x) d x (2-6)
1
y1 yn
1
[例 2-1] 求泛函 J 0 y ( x) d x 的变分
2
解:以下三种方法分别根据式(2-3)、(2-4)和(2-5)
第七章 最优控制 4
1 1
(1) J 0 [ y ( x) y ( x)] d x 0 [ y ( x)] d x
2 2
1 1
2 0 y ( x) y ( x) d x 0 [ y ( x)]2 d x
1
J 2 0 y ( x) y ( x) d x
1
(2) J J [ y ( x) a y ( x)] a0 0 [ y ( x) a y ( x)]2 dx
a a a 0
1 1
0 2[ y ( x) a y ( x)] y ( x) a0 d x 2 0 y ( x) y ( x) d x
1 F 1
(3) J 0 y ( x) d x 2 y ( x) y ( x) d x
y 0
可以看出,以上三种方法得到了相同的结果。
2.2 无条件泛函极值
[ 定 义 2-5] (泛函的极值)如果泛函 J [ y ( x)] 对于充分接近 y (x) 的
J [ y ( x)] 0 (2-7)
J [ y ( x) a y ( x)]
J [ y ( x)] 0 。 证毕。
a a 0
下面举例讨论如何利用上述定理求不动边界的泛函极值问题。
t
设性能指标为: J t F [ x(t ), x (t ), t ] d t ,
f
(2-8)
0
t t F F
J t f F [ x(t ), x (t ), t ] d t t f x x d t
0 0
x
x
第七章 最优控制 5
t
tf F F f
t d F
t xdt x t f x d t
0 x x t0 0 d t x
t
F f
t F d F
x tf x d t 0
x t0 0
x d t
x
第一项为零,因而第二项也必须为零。由于 x 是任意的,我们得到:
F d F
0 (2-9)
x d t x
这就是著名的欧拉-拉格伦日方程,简称欧拉方程。
2
[例 2-1] 设泛函为 J 1 ( x x t ) d t , x(1) 1, x(2) 2 ,求 x (t ) 。
2 2
解:该题符合上面讨论的问题类型,可直接利用欧拉方程求解。
d
F x x 2 t 2 的欧拉方程为: (1 2 xt 2 ) 0 ,即: t x 2 x 0 ,
dt
c1
其解为: x c2 ,代入 x(1) 1, x( 2) 2 得: c1 2, c2 3 ,
t
2
因此,使性能指标 J 取极值的最优函数为 x (t ) 3 。
t
除了上面讨论的不动边界的泛函极值问题外,类似地还可以讨
论可动边界的泛函极值问题等;进一步,除了无条件泛函极值问题
外,还可以讨论有条件泛函极值问题。我们不逐一讨论,而直接转向
泛函极值问题的重要应用-最优控制问题。
§3 变分法求解最优控制
3.1 末时刻固定末状态自由问题
(1)问题描述:
x f ( x, u, t ) , x (t 0 ) x 0 (3-1a)
t
J [u()] φ [ x (t f ), t f ] t f L( x, u, t ) d t (3-1b)
0
第七章 最优控制 6
(2)基本假设:
· f ( x , u, t ), L( x , u, t ) 对 x 和 u 连续且有连续的一阶偏导数;
(3)化为无条件极值问题
t
J 1[ u()] φ [ x (t f ), t f ] f {L( x, u, t ) T [ f ( x, u, t ) x ]}d t ,
t 0
则原问题等价于求 J 1 的无条件极小。
·定义 Hamilton 函数 H ( x , u, , t ) f ( x , u, t ) L( x, u, t ) ,则
T
t
J 1[ u()] φ [ x (t f ), t f ] f [ H ( x, u, , t ) T x ] d t
t 0
分部积分
t f T x d t
t tf t
t f T x d t T x
0 t0 0
J1[u()] φ [ x (t f ), t f ] T (t 0 ) x (t 0 ) T (t f ) x (t f )
t [ H ( x, u, , t ) T x ] d t
tf
为取 J 1 的极值,应令其变分为零。注意,在该问题中,当控制量
x (t f ) ;而 t f , t0 和 x (t 0 ) 是固定的,不变分,待定乘子 (t ) 也不变分。
T
φ
J1 0 (t f ) x (t f )
x (t f )
tf H
T
H
T
(t ) x (t ) u(t ) d t
t0 x u
H φ
选择 : (t) , (t f )
x x (t f )
H
极值条件: 0
u
[结论 3-1]:末时刻固定末状态自由的最优控制问题(3-1),其最
优解应满足的必要条件如下:
第七章 最优控制 7
H 函数: H ( x , u, , t ) T f ( x , u, t ) L( x, u, t )
H
极值条件: 0
u
x f ( x, u, t ) 状态方程
规范方程: H
x 协态方程
x (t 0 ) x 0 初始条件
边界条件: φ ( x (t f ), t f )
(t ) 末端条件
x (t f )
f
3.2 各种末端情况下的最优控制问题
最优控制问题。事实上,根据末端情况的不同,有 2 大类问题:A. t f
通过变分法求解,由于它们之间仅仅是末端情况不同,因而(可以
预料)它们所应满足的必要条件中也仅仅是规范方程的末端条件不
同。
[ 结 论 3-2] :各种末端情况下的最优控制问题,其最优解的必要条
件具有相同的哈密顿函数、极值条件、规范方程和初始条件,仅末端
条件不同(参见[结论 3-1])。
下面,我们简明地列出各种情形下,最优解应满足的末端条件:
A. t f 固定
φ [ x (t f ), t f ]
(1) x (t f ) 自由: (t f )
x (t f )
(2) x (t f ) 固定: x (t f ) x f
(3) x (t f ) 受约束: g[ x (t f ), t f ] 0
φ [ x (t f ), t f ] g T [ x (t f ), t f ]
(t f )
x (t f ) x (t f )
第七章 最优控制 8
其中, g 为 k 维向量函数, 为 k 维待定乘子向量。
B. t f 可变
对应于 A 中情形(1)和(2),增加如下终端条件:
φ [ x (t f ), t f ]
H [ x (t f ), u(t f ), (t f ), t f ]
t f
对应于 A 中情形(3),增加如下终端条件:
φ [ x (t f ), t f ] g T [ x (t f ), t f ]
H [ x (t f ), u(t f ), (t f ), t f ]
t f t f
t f 固定, x (t f ) 也固定时,性能指标中的末值型指标为固定值,
失去意义;此时, x (t f ) x f 本身构成规范方程的末端条件。
t f 固定, x (t f ) 受 g[ x (t f ), t f ] 0 约束时,末值型指标中需要增加
拉格伦日乘子项 g[ x (t f ), t f ] ,因而末端条件多出相应项。
T
分 d t f ,可以多导出一个终端条件,用以确定最优的末态时刻 t f 。
3.3 哈密顿函数的性质
规范方程中,状态方程和协态方程对偶:
H H
x ,
x
d H H H H H H
T x T u T
d t x u t t
3.4 变分法求解最优控制问题举例
解题步骤:分析题意,列写哈密顿函数和必要条件。由极值条件
H u 0 ,求出 u* (t ) 并代入规范方程。最后需求解两点边值问
题,通常这是一个困难的问题,需利用计算机求数值解。这里给出的
第七章 最优控制 9
例题是足够简单的,但题目类型和解题步骤是有代表性的。
指标为最小:(其中,常数 c 0 , t f 是固定时刻)
1 1 t
J c x 2 (t f ) t u 2 d t ,
f
2 2 0
H 函数: H L u (1 2)u 2 u ;
极值条件: H u u 0 ,解得 u ;
规范方程: x u , H x 0 ;
c x0
u (t ) (t ) (t f ) c x(t f )
1 c(t f t 0 )
已知问题本身有解,而根据必要条件求得的解又是唯一的,所
以该极值控制就是最优控制。
1 1 2
J u dt
2 0
解:这是 t f 固定, x (t f ) 受约束的最优控制问题。
1 (1) , 2 (1) ,
注: (t f ) φ x (t f ) [ g x (t f )]
第七章 最优控制 10
3 6
解方程得: u (t ) t ,
7 7
1 3 3 2 3 6
x1 (t ) t t , x2 (t ) t 2 t 。
14 7 14 7
注意, 1 (1) 2 (1) 与目标集 x1 (1) x2 (1) 1 正交(横截条件)。
[ 例 3-3] 已 知 一 阶 受 控 系 统 x u , x(0) 1。 求 控 制 u (t ) , 使
x(t f ) 0 ( t f 可变),并使下述性能指标为最小:
1 tf 2
J tf u dt
2 0
解:这是一个 t f 可变, x (t f ) 固定的问题。
H 函数: H L f (1 2)u u ;
2
极值条件: H u u 0 ,解得 u ;
规范方程: x u , H x 0 ;
注: (t f ) 由 H (t f ) t f 和极值条件求得。
解方程得: (t ) 2 , u (t ) 2 , x (t ) 1 2 t , t f 1 2。
§4 极大值原理简介
利用古典变分法求解最优控制问题时要求 H 对 u 的偏导数存在
且连续,这对某些性能指标而言,是不能满足的。特别是,在实际问
题中,控制量一般是有限制的,如阀门的开度、电机的转矩、火箭的
推力等,通常有类似 ui M i 的不等式约束,而最优控制往往要求
在闭域的边界上取值,这时,古典变分法就无能为力了。对此,许多
学者作了很多努力,其中,庞特里亚金(Pontryagin)的极(最)大
值原理是比较成功的一种方法。极(最)大值原理的原始证明内容艰
深,而和古典变分法相比,在解决同类问题时,结论几乎完全相同,
仅在极值条件上有差别,这种差别从概念上又是容易理解的,因此,
这里将略去证明,直接给出结论。
第七章 最优控制 11
[ 极 大 值 原 理 ] 如果 u (t ) 是所给问题的最优控制, x (t ) 和 (t ) 是
规范方程组对应于 u (t ) 的最优轨线和最优协态变量,则
H ( x (t ), u (t ), (t ), t ) min H ( x (t ), u(t ), (t ), t )
u ( t )U
极大值原理在这里表述的实际是极小值原理,只是沿用了原有文
献的提法。也有不少文献直接称极小值原理,使之名副其实;
和古典变分法一样,极大值原理给出的是最优控制所应满足的必
要条件,不是充分条件;也不涉及最优解的存在问题;
和古典变分法相比,极大值原理不要求 H 对 u 可微,且允许控制
受限,放宽了应用条件,更具实用价值;
古典变分法给出的极值条件使哈密尔顿函数取局部极小(甚至不
是),而极大值原理给出的是全局最小;但寻求全局最小难度大。
u 1 。求使下述性能指标最小的最优控制及相应的最优状态轨线。
1 1
J 0 ( x u) d t
2
解:这是一个 t f 固定, x (t f ) 自由,控制受限的最优控制问题。
H 函数: H L f x x u ( 1 2)
1
极值条件: u sign( )
2
规范方程: x x u , H x 1
1, 0 t t s e
即: u (t ) t s 1 ln 2 ln
1, t s t 1 2
当 0 t t s 时有: x x 1 , x(0) 1,
得: x * (t ) 2e t 1 , x (t s ) 4e 1
1
第七章 最优控制 12
当 t s t 1 时有: x x 1 , x(t s ) 4e 1
1
得: x * (t ) 1 (2 4e 1 )e (t ts )
最优轨线共分为两段,方程不同,首尾相接,见图 4-2。
1
1
1
1
e t 1
2
1
图 4-1 u * (t ) 图形 图 4-2 x * (t ) 图形
§5 时间最优控制※
使系统由初态转移到目标集的时间为最短的控制称为时间最优
控制,或最速控制。这里,我们仅讨论一种最简单、最常见的情况。
已知控制受约束的二阶积分型受控系统及性能指标如下:
H 函数: H (t ) L f 1 1 (t ) x2 (t ) 2 (t )u (t )
T
1 1(t f ) x2 (t f ) 2 (t f )u (t f ) 0 H (t f ) φ t f
第七章 最优控制 13
将极值条件代入规范方程和边界条件可以求得 2 (t ) ,从而得到
统往往存在扰动,若能实现闭环控制就更理想。也就是说,希望找到
意常数,且不能同时为零(否则 1 (t ) 2 (t ) 0, 不满足上述边界
条件中的最后一个方程),所以, 2 (t ) 是一条不恒为零的直线,
图 5-1
方程和初始条件可以解得:
1
x2 (t ) x20 M t , x1 (t ) x10 x20 t M t 2
2
1 2 1 2
消去 t 后,得到: x1 ( x10 x20 ) x2
2M 2M
这就是在控制 u M 作用下,始于 ( x10 , x20 ) 的状态轨线(相轨线)
第七章 最优控制 14
表示随时间增长状态演化的方向。
图 5-2 图 5-3
1 1
( x1 , x2 ) : x1 x22 ; x2 0 , ( x1 , x2 ) : x1 x22 ; x2 0
2 2
如 果 初 始 状 态 ( x10 , x20 ) 位 于 ( ) 上 , 则 最 优 控 制 律 为
何其它控制律(在切换不超过一次的前提下)都不能使状态转移到
原点。
由 和 合成的曲线 称为开关曲线,它将相平面分为两个区
1
( x1 , x2 ) : x1 x2 x2 ,
2
1 1
R ( x1 , x2 ) : x1 x2 x2 , R ( x1 , x2 ) : x1 x2 x2
2 2
若初态 ( x10 , x20 ) 位于区域 R ,如图 5-3 上的 A 点,控制序列
{+1}、{-1}、{+1,-1}所对应的轨线分别为 AF、AG、AHI,均不能转移
到坐标原点。只有采用控制序列{-1,+1},且当相点到达开关曲线
( )时,实现由 u 1 到 u 1 的转换,才能使状态转移到原点,
第七章 最优控制 15
优控制序列应是{+1,-1},转换同样应发生在开关曲线 ( )上。
[ 结 论 4-1] 二 阶 积 分 型 受 控 系 统 的 时 间 最 优 控 制 u * 为 :
1, ( x1 , x2 ) 0
u * 1, ( x1 , x2 ) 0 (5-2)
sgn( x ), ( x1 , x2 ) 0
2
1
其中, ( x1 , x2 ) x1 x2 x2 ,称为开关函数。
2
可见,二阶积分型受控系统的时间最优控制能以状态变量函数的
形式表示出来,因而可按状态反馈实现闭环控制。下图所示的是它的
一种工程实现框图。
R
图 5-4
最后,我们不加证明地给出时间最优控制中著名的“ n 段定
理”
的切换次数不会超过 n-1 次。
§6 线性系统二次型指标的最优控制
对于线性系统,若性能指标中的各项取二次型函数形式,则称为
第七章 最优控制 16
线性系统二次型指标的最优控制,简称线性二次型(LQ)问题。它
的最优解可以用解析形式表达为简单的状态反馈控制律,是现代控
制理论及其应用中最富有成果的一部分。
6.1 线性系统有限时间状态调节器
受控系统和最小化性能指标如下:
1 T 1 t
J x (t f ) F x (t f ) t f [ x T Q (t ) x uT R(t )u] d t (6-1b)
2 2 0
其中:矩阵 F 和 Q (t ) 正定或者半正定, R(t ) 正定。F 项反映了对
末态趋于零的要求,Q 项反映了对状态过渡过程性能的要求,R 项
了各项要求之间的权衡,是非常重要的。遗憾的是,这是个困难的问
题,通常靠试探和经验,这里假定它们已确定。有限时间状态调节器
直接利用前面的结果。(以下除特别强调外,略去自变量 t)
1 T 1
H 函数: H L T f x Qx u T Ru T Ax T Bu
2 2
H
极值条件: Ru B T 0 , 得 u R 1 B T
u
H
规范方程: x Ax BR 1 B T , Qx AT
x
φ
边界条件: x (t 0 ) x 0 , (t f ) Fx (t f )
x (t f )
由规范方程和边界条件可以求出 (t ) ,代入到极值条件,进而
解出 u (t ) R (t ) B (t ) (t ) ,这是一种开环控制。能否实现闭环控
1 T
制呢?也就是说, u (t ) 能否用状态 x (t ) 来表达呢?考虑到规范方程
是线性的,且 (t f ) Fx (t f ) 也是线性的,不妨设:
(t ) P (t ) x (t ) , P (t f ) F , (6-2)
第七章 最优控制 17
则 u (t ) R (t ) B (t ) P (t ) x (t ) ,
1 T
(6-3)
(Riccati)矩阵微分方程:
P PA AT P PBR 1 B T P Q 0 (6-4a)
P (t f ) F (6-4b)
[结论 6-1]对线性系统有限时间状态调节器问题(6-1),最优反馈
控制的充分必要条件是: u (t ) R (t ) B (t ) P (t ) x (t ) ,其中, P (t )
1 T
T
是矩阵微分方程(6-4)的解;且 J (1 2) x (t 0 ) P (t 0 ) x (t 0 ) 。
证明:(思路:对 J 进行配方)
d T
(1) ( x Px ) x T Px x T P x x T Px
dt
( x T AT uT B T ) Px x T P x x T P ( Ax Bu)
x T ( AT P PA P ) x u T B T Px x T PBu
(u R 1 B T Px ) T R( u R 1 B T Px ) x T Qx uT Ru
tf d T
(2) t ( x Px ) d t x T (t f ) Fx (t f ) x T (t 0 ) P (t 0 ) x (t 0 )
0 dt
t t
t f [(u R 1 B T Px ) T R(u R 1 B T Px )] d t t f ( x T Qx uT Ru) d t
0 0
1 T 1 t
(3) J x (t f ) Fx (t f ) t f ( x T Qx uT Ru) d t
2 2 0
1 T 1 t
x (t 0 ) P (t 0 ) x (t 0 ) t f [(u R 1 B T Px ) T R(u R 1 B T Px )] d t
2 2 0
上式第二项大于等于零,当且仅当 u R 1 B T Px 时为零,此
1 T
时,性能指标取最小值: J x (t 0 ) P (t 0 ) x (t 0 ) , 证毕。
2
不管 A(t ), B (t ), Q (t ), R(t ) 是时变的还是定常的, P (t ) 通常是时变
第七章 最优控制 18
的,因而反馈系数矩阵是时变的,这是有限时间终点的复杂性;
有矩阵的元均有界,则 P (t ) 存在且唯一,但通常无解析解;
是,由解的唯一性可知: P (t ) P (t ) 是对称矩阵;
T
J 0 , J (1/ 2) x T (t 0 ) P (t 0 ) x (t 0 ) 0 , x (t 0 ) 是 任 意 的 ,
P (t 0 , 0, t1 ) P (t 0 , 0, t 2 ) , t 0 t1 t 2
(提示:当 F 0 时, J [t 0 , t1 ] J [t 0 , t 2 ] )
P (t f , F , t f ) F , 所 以 若 时 变 矩 阵 P (t , P (t1 , F , t 2 ), t1 ) 和
条件( t t1 时,二者取值相等),解又是唯一的,则下式成立:
P (t , F , t 2 ) P (t , P (t1 , F , t 2 ), t1 ) , t t1 t 2
1 tf 2
能指标为最小: J
2
t 0
(x u 2 )d t
Riccati 方程: p 2 p p 1 0 , p (t f ) 0
2
2 2 ( t t f )
1 e
p (t ) 2 2 ( t t f )
2 1 ( 2 1) e
第七章 最优控制 19
及趋于无穷时对应的 p (t ) 曲线。
p(t )
T
t
smaller T larger T
图 6-1
6.2 线性定常系统无限时间状态调节器
受控系统和最小化性能指标如下:
x (t ) Ax (t ) Bu(t ), x (t 0 ) x 0 (6-5a)
1 T
J
2
t 0
[ x (t )Qx (t ) uT (t ) Ru(t )] d t (6-5b)
和上节研究的问题相比主要有两点差别:首先是所有的系数矩
阵和加权矩阵均改为常数矩阵,其次是末端时间由有限改为无限;
目的是获得定常的最优控制反馈矩阵。此外,由于 t f ,不再有末
时刻,因而在 J 中取消了末态指标项;对稳态(注意稳态和末态的
正定。
对于有限时间调节器问题,J 总是有限值,其最优解必存在,但
在无限时间情况下,可能会发生这样的情形:无论怎样选择 u,J 值
总是无限大,因而不存在最优解。怎样才能保证有最优解呢?
统完全可控,则存在最优解。
证明:因系统完全可控,对任意非零初始状态 x (t 0 ) ,必存在有
~ (t ) ,在有限时刻 t t 使系统回到状态空间原点(平衡点),
界控制 u 1 0
~ (t ), t [t )
~ (t ) 为零。在如此定义的 u
在时刻 t1 之后置 u 0, 作用下,性能
指标 J 一定是有界的,因而最优解是存在的。证毕。
第七章 最优控制 20
※ 完全可控性只是问题有解的充分条件。事实上,只要不可控模
态是渐稳的(可稳定性),或者既不可控又不渐稳的模态在性能指
标中不可观(不反映在指标中),问题就有解。
在问题有解的前提下,可以将前节讨论的有限时间调节器的结
果推广到这里讨论的无限时间的情形。因此,我们要考察 t f 时,
解 P (t , 0, ) 存在,且为常数。
证明:
(1)若问题(6-5)有解,则 J (t f ) (1 2) x (t 0 ) P (t 0 , 0, t f ) x (t 0 ) 随着
T
是线性定常的,因而 P (t , 0, t f ) P (0, 0, t f t ) ,令 t f ,则
由于 P (t ) 定常,导数为零,Riccati 矩阵微分方程(6-4)变为:
PA AT P PBR 1 B T P Q 0 (6-6)
u (t ) R 1 B T Px (t ) ,其中, P 是矩阵微分方程(6-4)的稳态解,
T
或代数方程(6-6)的非负定解;且 J (1 2) x (t 0 ) Px (t 0 ) 。
※ 注意,Riccati 矩阵微分方程的解是唯一的,因而稳态解也是唯
一的,但其对应的代数方程的解却不一定唯一。上面的限定词“非负
定”在这里是指正定或半正定,以下同。
按上述结论构成的闭环系统是否一定稳定呢?先看一个简单的
1 T
例子: x x u , J u u d t 。由于 Q 0 ,根据 Riccati 代数方程
2 0
第七章 最优控制 21
得到 P 0 ,从而 u 0 (也可由性能指标直接看出),闭环系统
x x
显然是不稳定的。这是由于开环系统的不稳定状态完全没有反映在性
能指标中。如果系统的全部状态都能通过性能指标观测(反映)出来,
是否能保证闭环系统稳定呢?
(6-6)的非负定解为正定矩阵的充分必要条件。
反设 P 不是正定的,因而存在非零的 x (t 0 ) ,使得
1 T
J x (t 0 ) Px (t 0 ) 0 ,
2
这就要求性能指标中的被积函数恒等于零, R 0 , u 0 ,此时,
A ( t t0 )
系统的状态为: x (t ) e x (t 0 ) ,从而
1 T 1 T
J x (t )Qx (t ) d t x (t ) D T D x (t ) d t 0 ,
2 t0
2 t 0
A ( t t 0 )
这就意味着: D x (t ) De x (t 0 ) 0 ,也就是说,存在非零状态
x (t 0 ) 是 ( A, D) 不可观测的,这和 ( A, D) 完全能观测是矛盾的。证毕。
命题的必要性可以用类似的方法得到证明(略)。
[ 结 论 6-6] 设 Q D D ,若 ( A, D) 完全能观测,则由最优控制律构
T
成的闭环系统 x ( A BR B P ) x 是渐近稳定的。
1 T
证明:由给定条件和[结论 6-5]可以得到: P 0 ;
选取李亚普诺夫函数: V ( x ) x Px 0
T
则: V ( x ) x T Px x T Px
x T ( AT PBR 1 B T ) Px x T P ( A BR 1 B T P ) x
x T ( AT P PA PBR 1 B T P ) x x T PBR 1 B T Px
x T Qx uT Ru 0
假设 V ( x ) 0 , R 0 , u 0 ,根据[结论 6-5]的证明过程
可知,这将导致 ( A, D) 不完全能观,这和给定条件相矛盾;因此,
第七章 最优控制 22
沿状态轨线V ( x ) 不恒为零,故闭环系统渐近稳定。证毕。
观测性并不取决于某个特定的分解,而是由 A 和 Q 本身决定的。
为保证闭环渐稳, ( A, D) 完全能观并不是必要的。只要不能观测
的部分是渐稳的,闭环系统就是渐近稳定的。
1 T
最小: J 0
( x Qx R u 2 ) d t ,其中, Q I 2 , R 1 。
2
0 1 0
解:可控性: A , b , ( A, B ) 完全可控;
0 0 1
1 0 1 0
可观性: Q D D , ( A, D) 完全可观;
T
0 1 0 1
Riccati 方程: PA AT P PbR 1b T P Q 0
p11 p12
设 P ,并代入 A, b, R, Q ,得到:
p12 p22
0 1
闭环系统: AL A b [1 3] ,渐近稳定。
1 3
思 考 :若性能指标为: J 0 ( y Wy u Ru)dt ,其中 y Cx 是系
T T
统的输出,这类问题称为最优输出调节器问题,请问它和最优状态
调节器问题之间有什么关系?
§7 离散系统的最优控制※
前面,我们已经比较系统地学习了连续系统的最优控制问题,
其理论可以方便地推广到离散系统中来,因而,二者有很多相似性。
7.1 离散系统的极大值原理
第七章 最优控制 23
受控系统的运动方程和性能指标如下:
x ( k 1) f [ x ( k ), u(k ), k ] , x (0) x0 (7-1a)
N 1
J φ [ x ( N ), N ] L[ x (k ), u(k ), k ] (7-1b)
k 0
这里,要求最优控制在给定的 ( N 1) 个采样周期内完成,常称为
由的。
引人拉格伦日乘子 (k ) ,得到无约束条件的等价性能指标:
N 1
J J T (k 1){ f [ x ( k ), u( k ), k ] x (k 1)}
k 0
N 1
φ [ x ( N ), N ] [ H (k ) T ( k 1) x (k 1)]
k 0
φ [ x ( N ), N ] T (0) x (0) T ( N ) x ( N )
N 1
[ H (k ) T ( k ) x (k )]
k 0
其中, H (k ) 为离散系统的哈密顿函数:
H ( k ) L[ x (k ), u(k ), k ] T ( k 1) f [ x (k ), u(k ), k ]
计算 J 的变分
φ
J T T ( N ) x ( N )
x ( N )
N 1 H ( k ) N 1
H (k )
x T (k ) T
( k ) x ( k ) 0 u (k )
T
u( k )
k 0 k
由 J 0 ,可以得到求解该最优控制问题的结论如下:
[结论 7-1]由式(7-1)给出的离散系统最优控制问题,其最优解应
满足的必要条件如下:
H 函数: H (k ) L(k ) T (k 1) f (k )
H ( k )
极值条件: 0 , 若 u(k ) 有限制,采用下式:
u(k )
第七章 最优控制 24
x ( k 1) f [ x (k ), u(k ), k ] 状态方程
规范方程: ( k ) H (k ) 协态方程
x (k )
x (0) x 0 初始条件
边界条件: ( N ) φ 末端条件
x( N )
[例 7-1] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k 1) x(k ) u (k ) , x(0) 3
1 2 1
1
J x ( 2) u 2 ( k )
2 k 0 2
1
哈密顿函数: H (k ) u 2 (k ) (k 1)[u (k ) x( k )] , k 0, 1
2
H ( k )
极值条件: u (k ) (k 1) 0 , k 0, 1
u (k )
H (k )
规范方程: x(k 1) x( k ) (k 1) , (k ) (k 1)
x(k )
φ
边界条件: x(0) 3 , (2) x( 2)
x( 2)
由规范方程和边界条件解得:
7.2 线性离散系统二次型性能指标的最优控制
受控系统的运动方程和性能指标如下:
x ( k 1) A( k ) x (k ) B (k )u(k ) , x (0) x 0 (7-1a)
1 T 1 N 1
J x ( N ) Fx ( N ) [ x T ( k )Q (k ) x ( k ) uT (k ) R( k )u(k )] ( 7-
2 2 k 0
1b)
其中:矩阵 F 和 Q (k ) 正定或者半正定, R(k ) 正定,u 不受约束。
可以直接利用前节的结果,得到:
第七章 最优控制 25
1 T 1
H 函数: H ( k ) x (k )Q (k ) x ( k ) uT (k ) R( k )u(k )
2 2
T (k 1)[ A(k ) x (k ) B (k ) u( k )]
极值条件: u (k ) R (k ) B (k ) (k 1)
1 T
规范方程: x ( k 1) A( k ) x (k ) B (k ) R (k ) B ( k ) (k 1)
1 T
(k ) Q ( k ) x (k ) AT ( k ) (k 1)
边界条件: x (0) x 0 , ( N ) Fx ( N )
设: ( k ) P (k ) x (k ) , P (N ) F (7-2)
将上式分别代入规范方程中的状态方程和协态方程,得到:
P (k ) x (k ) Q (k ) x (k ) AT (k ) P (k 1) x ( k 1) (7-4)
k N 1, , 1, 0 , P (N ) F
将式(7-2)代入极值条件,得到:
u (k ) R 1 (k ) B T ( k ) P (k 1) x (k 1) (7-6)
将式(7-3)代入上式,并考虑到式(7-5b)得到:
~
u (k ) R 1 (k ) B T (k ) P (k ) x (k ) (7-7)
(注意 P 和 P~ 的区别)
[例 7-2] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k 1) x(k ) u (k ) , x(0) 3
1 2 1
1
J x ( 2) u 2 ( k )
2 k 0 2
第七章 最优控制 26
解:该例同[例 7-1]。这里直接利用[结论 7-2]来求解,注意到:
A 1, B 1, F 1, Q 0, R 1 ,我们得到:
~ ~
(1) P ( k ) [ P 1 (k 1) 1]1 , P (k ) P ( k ) , P (2) F 1 ,
~ ~
反向递推得: P (1) 1 2 , P (1) 1 2 ; P (0) 1 3 , P (0) 1 3
~
(2) u (k ) P (k ) x (k ) , x ( k 1) x (k ) u ( k ) , x (0) 3
1 1
1 3
校核: J
2
[ x ( 2 )] 2
k 0 2
[u (k )]2
2
由该例可见,尽管系统是线性定常的,但最优反馈阵是时变的。
和连续系统的情形类似,只有当终止时间为无穷大时,即 N 时,
反馈增益矩阵才可能变为常数矩阵。
受控系统的运动方程和性能指标如下:
x ( k 1) Ax (k ) Bu(k ) (7-8a)
1
J
2 k 0
[ x T ( k )Qx (k ) u T ( k ) Ru( k )] (7-8b)
所有的系数矩阵和加权矩阵均为常数阵,末端为无限。类似于连续系
统,可以证明,若 ( A, B ) 完全可控,该问题的最优解存在,此时,
Riccati 矩阵递推方程(7-5)的递推解有极限,即存在稳态解,并等
同于下述矩阵代数方程的非负定解:
~
P Q AT P , (7-9a)
~
P [ P 1 BR 1 B T ]1 A (7-9b)
统 完 全 可 控 , 最 优 反 馈 控 制 的 充 分 必 要 条 件 是 :
~
u (k ) R 1 B T P x ( k ) ,其中, P~ 是矩阵递推方程(7-5)的稳态解,
T
或代数方程(7-9)的非负定解;且 J (1 2) x (0) P x (0) 。 (注意
P 和 P~ 的区别)
第七章 最优控制 27
§8 动态规划
求解最优控制问题的另一种方法是动态规划,它的基础是下面的
最优性原理,或称为最优法则。
[最优法则] 一个过程的最优策略具有以下性质,即无论其初始状态
和初始决策如何,其后的各决策对以第一个决策所形成的状态作为
初始状态的过程而言,必须构成最优策略。
最优法则的正确性是显见的,或者可用反证法非常容易地得到证
明。下面通过例子说明动态规划在离散最优控制问题中的应用。
[例 8-1] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k 1) x(k ) u (k ) , x(0) 3
1 2 1
1
J x (2) u 2 ( k )
2 k 0 2
解:该例同[例 7-1]和[例 7-2],这里用动态规划求解。
不难看出,系统的运动过程如下:
u (0) u (1)
x(0) x(1) x(2)
1 2 1 1
定义: J 2 x (2) , J 1 u 2 (1) J 2* , J 0 u 2 (0) J 1
2 2 2
(1)由 J 2 开始,反向递推:
1 2
J 2 min J 2 x (2)
u ( 2) 2
1 1
J 1 [u 2 (1) x 2 (2)] {u 2 (1) [u (1) x(1)]2 }
2 2
J1 1
2u (1) x(1) 0 ,得到: u (1) x(1)
u (1) 2
1 2
将 u (1) 代入 J 1 得: J 1 x (1) ,从而有
4
1 1 1 1
J 0 u 2 (0) x 2 (1) u 2 (0) [ x(0) u (0)]2
2 4 2 4
J0 3 1 1
u (0) x(0) 0 ,得到: u (0) x(0)
u (0) 2 2 3
第七章 最优控制 28
(2)由 x(0) 3 开始,正向递推:
从上面的例子可以看出,动态规划法把一个难于直接处理的多
阶段决策过程,通过反向递推过程,化为一个多次一步决策的简单
问题。它不仅适用于离散系统,也适用于连续系统;但当系统的维数
增加时,其计算量成指数增长,即存在所谓的“维数灾”问题。
参考书
《自动控制原理》(下册),吴麒主编,清华大学出版社,1992,(第 12 章)
《自动控制理论基础》,戴忠达主编,清华大学出版社,1991,(第 8 章)
《线性系统理论》(第二版),郑大钟,清华大学出版社,2002,(第 6 章)
《最优控制理论》,王朝珠,秦化淑,科学出版社,2003
《控制理论导论》,郭雷主编,科学出版社,2005,(第 7 章)
第七章 最优控制 29