You are on page 1of 941

自动控制理论

自动化系

清华大学自动化系 慕春棣
自动控制理论
控制理论 所要解决的主要问题

1 系统建模(实际问题抽象,数学描述)

2 系统分析 (稳定性, 动/静态性能)

3 系统综合 (方案选择,设计)

4 系统验证(数字仿真,半实物/实物仿真)

2 清华大学自动化系 慕春棣
自动控制理论
控制理论是应用基础理论

 具有鲜明的时代性,强调对实践的指导作用
总是和社会的重大需求紧密联系在一起的。人们总是
把当时最先进的技术用作自动化技术的主要内容, 这
就要求理论必须指导实践。应用数学的许多成就都会
被自动化学科所应用。
 控制理论是系统的理论
强调从“系统”(整体)的角度来分析、研究和实现
各种目标,而不单单是其中的部件的性能。
 控制理论具有多学科交叉融合的特征
离不开信息技术、电气技术、数学以及被控对象的相
关领域知识

3 2006秋 清华大学自动化系 慕春棣


自动控制理论
学习控制论的重要意义
 我国著名的控制论专家、宋健院士在第14届IFAC世界大会报告中指出:控制论
的理论、概念和方法在计算机技术的支持下,已经远远超越了40年前主要为工
业生产和军事装备的服务范围,广泛应用到政治、军事和社会科学的各领域。过
去20年来,经济学家们从控制论中得益而获得新成就是有目共睹的事实。原属
于控制论科学中的专业概念和术语,如正负反馈、系统分析、非线性系统、系统
工程等已被自然科学、社会科学等各学科所接收和采用,往往能在完全不同的学
科中引导出令人意外的新发现。经济学家们从控制科学中受益已是众所周知的。
很多大学多把控制理论列为所有工科和部分社会科学学生的必修课。

 宋健院士还指出:近年来,让控制科学家最为兴奋的是,许多政治家和国家领导
人开始理解控制论中的理论、概念和方法的重要性,他们很多人在演讲或论文中
广泛使用控制论的语言去阐述社会政治问题。当政治家们遇到某些棘手的政治问
题时,他们时常寄希望于系统科学家伸出援助之手,即使后者的研究工作从来未
涉及到政治问题。这种形势常使控制论和系统科学家们冷暖皆忘,把酒临风,心
旷神怡。

宋健教授这些精辟论述说明,控制科学与工程学科已经渗透到多个学科,不但在
自然科学和工程科学领域,而且在社会科学领域也有广泛的应用,成为多个学科
和领域的发展动力。
4 2006秋 清华大学自动化系 慕春棣
自动控制理论
课程基本情况
 学时: 64 信息学院五大平台课之一, 自动化专业必
修课,专业基础课
 教材:《自动控制原理》上下册 吴麒主编
 参考书:
 《现代控制工程》 绪方胜彦 科学出版社 第三版 2000
 《自动控制理论基础》 戴忠达,1991
 《控制理论 (日)》 藤井隆雄著 卢伯英译 科学出版社,2003
 《自动控制系统》 第 8 版 [美]Benjamin C. Kuo,汪小帆,
李翔译 高等教育出版社
 《自动控制原理》 国防工业出版社 李友善
 有关Matlab的工具书:《精通Matlab 6.5版》《Matlab 6.x
符号运算及其应用》等(Matlab的工具书很多,校内很多ftp
还有相关的电子书资源可以下载)
 自动控制理论例题习题集 王诗宓, 杜继宏, 窦曰轩编著 ,清
华大学出版社 2002
5 清华大学自动化系 慕春棣
自动控制理论
关于学习的几点建议
◎ 培养好的学习方法
应用数学工具分析解决工程问题
科学思维方法 抽象 综合
数学工具(如MATLAB)的使用
重视实践活动,积极参加 SRT,各类竞赛活动

◎ 关注学术活动 IFAC—中国自动化学会—专业委员会
IFAC’99 北京
CDC, ACC, ECC, CCC

◎ 阅读学术期刊 : IEEE Transactions on Automatic


Control, Control Systems Technology …
自动化学报, 控制理论与应用,系统仿真学报,
计算机工程与应用 ……
6 清华大学自动化系 慕春棣
自动控制理论
控制理论发展的历史,现状及前景
3
1
后现代控制理论
经典控制理论
大系统、 智能控制 ;以
以单变量控制,随动/调
网络、通讯、人机交互为
节为主要内容,以微分
代表的信息自动化 集成
方程和传递函数为数学
的理论与技术。
模型,以频率响应法为 2
主要方法。数学工具:
微分方程,复变函数
现代控制理论
现代控制理论以多变量控
制、最优控制为主要内容,
采用时域法,以状态方程
为数学模型。数学工具:
线性代数, 泛函分析

7 清华大学自动化系 慕春棣
自动控制理论
经典控制理论

经典控制理论,以单变量控制,随动/调节
为主要内容,以微分方程和传递函数为数
学模型,所用的方法主要以频率响应法为
主。数学工具: 微分方程, 复变函数

8 清华大学自动化系 慕春棣
自动控制理论
现代控制理论、后现代控制理论
◎ 现代控制理论
60年代初形成并迅速发展起来的
现代控制理论是在航天、航空、导弹等军事尖端技术的发展,对
自动控制系统提出越来越高的要求的推动下发展起来的。要求设
计高精度、快速响应、低消耗、低代价的控制系统;被控制对象
越来越大型、复杂、综合化,从单个局部自动化发展成综合集成
自动化

◎ 后现代控制理论
80年代以后,控制理论向广度与深度发展
大系统,是指规模大,结构复杂变量众多的信息与控制系统。在
系统理论中,采用状态方程和代数方程相结合的数学模型,状态
空间,运筹学等相结合的数学方法。
智能控制 是具有某些仿人智能的工程控制与信息处理系统,其中
最典型的是智能机器人, 智能主体等。
21世纪 网络、通讯、人机交互为代表的信息自动化 集成的理论与
技术。
9 清华大学自动化系 慕春棣
自动控制理论
目前的发展趋势

1 2 3

突出含机、电、 控制论的根本是 人才培养:多学


计算机、通信网 信息的控制, 包 科交叉、基础雄
络的大系统、复 括模型的建立 厚、适应面宽。
杂系统与人机交 (数学特征), 培养宽口径、多
互系统的集成; 信息的处理(计 面手、复合型人
算机微电子技术) 才
与实体的控制
(领域知识,工
程特征)

10 清华大学自动化系 慕春棣
自动控制理论
我国控制理论的教学

 1949. 上海交大 张钟俊 伺服系统


 1950 清华大学 钟士模 自动调节原理
 50-60年代 随动系统,自动调节原理
 70年代末-80年代 现代控制理论,最优控制 ,
自适应控制,系统辨识, 随机控制,大系统理论
(运筹学),鲁棒控制
 90年代 模糊控制, 智能控制,系统集成
 新世纪 网络技术,生物信息技术,嵌入式系统-
-信息自动化

要求:厚基础 宽口径 学科交叉 科学思维方法


勇于实践和探索

11 清华大学自动化系 慕春棣
第一章:控制的基本概念

清华大学自动化系 慕春棣
13
一、反馈控制原理

开环系统

例子:
 风扇转速
 电热管

自动控制理论
14
一、反馈控制原理
负反馈的例子:
 抽水马桶
 冰箱温度控制
 空调温度控制
 人的动作控制

自动控制理论
15
一、反馈控制原理

负反馈的概念

典型系统框图

负反馈:将给定量与被控量进行比较(相减),得到偏
差信号,利用偏差产生控制作用,作用于被控对象,以
达到减小或消除偏差的目的。

自动控制理论
16
二、控制系统的基本组成

控制系统组成示意图

自动控制理论
17
四、控制系统的基本要求

稳定
静态指标
品质、性能
动态指标

自动控制理论
控制系统的数学模型

清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

1、RLC电路

2 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

1、RLC电路
根据电路基本原理有:

 Ri + L dtdi + uc = u r

 duc
 i = c
dt
d 2uc du c
⇒ Lc 2 + Rc + uc = ur
dt dt

3 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

2、质量-弹簧-阻尼系统

∑ F = ma
dy d2y
F − ky − f =m 2
dt dt
d2y dy
⇒m 2 + f + ky = F
dt dt

4 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

3、电动机方程
电路方程:
dia
ur − Ea = La + Raia (1)
dt
动力学方程:

dΩ
M − Mc = J (2)
dt

 Ea = k d Ω (3)

 M = k d ia (4)

5 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

(4)→(2)得:

J dΩ M c
ia = + (5)
k d dt kd

(3)(5)→(1)得:

La J d 2 Ω Ra J dΩ La dM c Ra
2
+ + kd Ω = ur − ( − Mc)
k d dt k d dt Ra dt kd

6 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

整理并定义两个时间常数

JRa
2
= Tm 机电时间常数
kd
La
= Ta 电磁时间常数
Ra

电机方程

d 2Ω dΩ 1
Ta Tm 2
+ Tm +Ω = u r − (........)
dt dt kd
7 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

如果忽略阻力矩,即 M c = 0 ,
方程右边只有电枢回路的控制量 ur
则电机方程是一典型二阶方程 。

如果忽略 Ta(Ta = 0 )电机方程就是一阶的

dΩ 1
Tm +Ω = ur
dt kd
8 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

随动系统的例子:(图见教科书《自动控制原理》上册P20图2.11)

9 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述
1)电位器组
u p = k p (ψ − ϕ )
2)放大器-发电机励磁
dI f dI f ka
Rf I f + Lf = kau p ⇒ T f +If = up
dt dt Rf
3)发电机-电动机组
E f = kg I f
d 2Ω dΩ 1
Ta Tm 2
+ Tm + Ω = Ef
dt dt kd

4)传动机构 Ω →ϕ = kt Ω
dt
10 清华大学自动化系 慕春棣
自动控制理论
一、控制系统的微分方程描述

整理得:

T f Ta Tm d 4ϕ (T f + Ta )Tm d 3ϕ T f + Tm d 2ϕ 1 dϕ
4
+ 3
+ 2
+ + ϕ =ψ
k dt k dt k dt k dt

k p k a k g kt
k= R f kd
开环比例系数

解释 k 的物理意义, k 的量纲
解释 ϕ 跟踪ψ 无差
以上建模叫机理建模
11 清华大学自动化系 慕春棣
自动控制理论
二、传递函数

Laplace变换
L[f(t)]—F(s) 从时域→复域

定义: F ( s ) = ∫ f (t )e dt− st

举例: f (t ) = 1(t )

1 −st ∞ 1

F ( s ) = ∫ e dt = − e
− st
=
0
s 0 s
12 清华大学自动化系 慕春棣
自动控制理论
二、传递函数

常见函数的Laplace变换

1 α
1(t ) → sin αt →
s s2 +α 2
1 s
t→ 2 cos αt → 2
s s +α 2

−αt 1
e →
s +α

13 清华大学自动化系 慕春棣
自动控制理论
二、传递函数

Laplace变换基本定理


初值定理 x(0 ) = lim s x( s )
+
s →∞

终值定理 x(∞) = lim s x( s )


s →0

d 
微分定理 L  f (t ) = sF ( s ) − f (0)
 dt 

延迟定理 L[ f (t − α )] = e −αs F ( s )

14 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
用Laplace变换解微分方程

 dy
T +y=r r =1
 dt
 y(0} = 0

方程两边进行Laplace 变换(零初始条件)

− − −
Ts y ( s ) + y ( s ) = r ( s )

− r (s) 1 1 1 1
y(s) = = . = −
Ts + 1 Ts + 1 s s 1
s+
T

15 清华大学自动化系 慕春棣
自动控制理论
二、传递函数
t

反变换 y (t ) = 1(t ) − e T

当 r (t ) = δ (t )

− 1 1 1
y(s) = =
Ts + 1 T 1
s+
T

1 − Tt
反变换 y (t ) = e
T

1
y (o ) = 0, y (0 ) =
− +
初值跳变问题!
T
16 清华大学自动化系 慕春棣
自动控制理论
二、传递函数

定义传递函数

y( s)

= G( s)
r( s)
零初始条件下

输出的Laplace变换
= 传递函数
输入的Laplace变换
d2y −
什么是零初始条件? L[ 2 ] = s y ( s ) − sy (0) − y ' (0)
2

dt

17 清华大学自动化系 慕春棣
自动控制理论
二、传递函数

把上面的随动系统用传递函数表示,并化成框图

up If Ef Ω ϕ
ψ + ka R f 1 kd kt
+ kp kg
- Tf s + 1 TaTms2 + Tms + 1 s
ϕ

如何从该框图求得 ϕ 与 ψ 之间的关系?

微分方程 ↔ 传递函数

18 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

1、框图的几种连接方式 −
y(s)
串联 传递函数相乘 −
= G1 ( s )G2 ( s )
u (s)


y(s)
并联 传递函数相加 −
= G1 ( s ) + G2 ( s )
u (s)

19 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

1、框图的几种连接方式

反馈

G(s):主通道的传递函数
H(s):反馈通道的传递函数
G(s)H(s):开环传递函数 (u − yH )G = y

y( s) G( s) G主

= =
u( s ) 1 + G ( s ) H ( s ) 1 + G开


y(s) G (s)
同理可得正反馈下: =

u (s) 1 − G (s) H (s)

20 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

1、框图的几种连接方式
前面随动系统的例子

自己推导出 ϕ与ψ之间的关系 (1)传递函数


(2)微分方程

21 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

2、框图变换
1)交叉反馈

此例说明交叉点左右移动对传递函数的影响,
跨越求和点要注意。
22 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

2、框图变换
2)有扰动输入的情况


y(s)
a)求 −
(f=0)
r (s)

b)求 y(s)
− (r=0)
f (s)

c)为使 y 不受扰动 f 的影响应如何选 G4

23 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

2、框图变换

y(s) G1G2
a) − =
r (s) 1 + G1G2

b)


y(s) (G 3 −G4 G1 )G2
=

f (s) 1 + G1G2


y(s) G3
c) 当 −
=0 即 G4 =
G1
y 不受 f 影响
f (s)

24 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

2、框图变换
3)顺馈的例子:

变换框图:

G3
(G1 + G 2 )
y( s) 1 + G3 G 4 (G1 + G2 )G3

=
G1G3
=
r (s) 1+ 1 + G3 G4 + G1G3
1 + G3 G 4

25 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换

2、框图变换

也可把它看成
是双输入系统

26 清华大学自动化系 慕春棣
自动控制理论
三、框图及其变换
补充题:

27 清华大学自动化系 慕春棣
自动控制理论
四、信号流图

节点表示变量

(框图表示) (信号流图表示)
两节点之间的传递函数叫传输(增益),用直线加箭头表示

支路:两节点之间的定向线段
回路:闭合的通路
不接触回路:没有公共节点的回路

28 清华大学自动化系 慕春棣
自动控制理论
四、信号流图

前面补充题1用信号流图表示如下:

29 清华大学自动化系 慕春棣
自动控制理论
四、信号流图

计算信号流 图中的两节点之间的传递函数用梅逊公式
1
H ( s ) = ∑ Qi ( s )∆ i ( s )
∆ i

Qi (s ) 第i条前向通路传递函数的乘积

∆ 流图的特征式= 1 - 所有回路传递函数乘积之和
+每两个互不接触回路传递函数
乘积之和-每三个….

=1- ∑ L + ∑∑ L L
a
a
b c
b c − ..........

∆ i 余子式, 从∆中处除去与第i条前向通路接触的回路

30 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
此例有前向通路三条
Q1 = G1G2 G3G4 G5 Q2 = G1G4 G5 G6 Q3 = G1G2 G7
回路四个

L1 = −G4 H 1 L2 = −G2 G7 H 2 L3 = −G6 G4 G5 H 2 L4 = −G2 G3 G4 G5 H 2


互不接触回路
L1 , L2 互不接触
∆ = 1 − ( L1 + L2 + L3 + L4 ) + L1 L2
∆1 = 1
∆2 = 1
∆ 3 = 1 − L1
c 1
= (Q1 ∆ 1 + Q2 ∆ 2 + Q3 ∆ 3 )
r ∆
31 清华大学自动化系 慕春棣
自动控制理论
四、信号流图

补充题2

32 清华大学自动化系 慕春棣
自动控制理论
四、信号流图
前向通路: Q1 = G1G2G3G4G5G6
回路: L1 − G2 G3 H 2 L2 = G1G2 H 1 L3 = −G5 H 4
L4 = G 5 G 6 H 3 L5 = −G1G2 G3 G4 L6 = −G1G2 G3 G4 G5 G6 H 5
不接触回路: L1L3 , L1L4 , L2L3 , L2L4 , L5L3 , L5L4
∆1 = 1

∆ = 1 − ( L1 +..... + L6 ) + ( L1 L3 + L1 L4 + L2 L3 + L2 L4 + L5 L3 + L5 L4 )

c 1
= Q1 ∆ 1
r ∆

33 清华大学自动化系 慕春棣
自动控制理论
四、信号流图

顺馈的例子

前向通路

Q1 = G1G3 L1 = −G3 G4 无不接触回路


Q2 = G2G3 L2 = −G1G3

y 1
∆ = 1 − ( L1 + L2 ) ∆ 1 = 1, ∆ 2 = 1 ∴ = (Q1 ∆ 1 + Q2 ∆ 2 )
r ∆

34 清华大学自动化系 慕春棣
自动控制理论
课后作业

2.1 a. b. c. (提示:用复数阻抗法)

2.4, 2.5a

2.46, 2.47

补充二题 两种方法解:框图变换法和信号流图法

35 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元

1.比例

G ( s) = k

2.惰性(惯性)

1
G (s) = T 时间常数
Ts + 1

36 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元
3.二阶振荡环节
1
G (s) = 2 2 T时间常数,ζ 阻尼系数
T s + 2ζTs + 1

特征方程的根 s1.2 =
− 2ζT ± 4ζ 2 − 4T 2 ζ ζ 2 −1
=− ±
2T 2 T T
0 < ζ < 1 ,一对共轭复根(实部为负) 衰减振荡
ζ =0 ,一对共轭虚根 等幅振荡
ζ =1 , 两个相等负实根 单调衰减
ζ >1 , 两个不相等的负实根,可分解
为两个惰性单元 ,单调衰减

系统动态响应的性质取决于其特征根的性质

37 清华大学自动化系 慕春棣
自动控制理论
五、控制系统的基本单元

4.积分
1 1
G (s) = s
1
s r c r s c

5.延迟环节

G ( s ) = e −τs e-τs
x(t)

6.微分环节 一阶微分,二阶微分,纯微分

这些环节不能单独存在,只能与其它环节配合使用

38 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题

以放大器为例:在一定范围内输出与输入是线性关系y=kx,
但是当放大器饱和时,y与x就不是线性关系了。

微偏线性化
在工作点附近的小邻域内,将y与x之间的关系展成台劳级数

设 y = f (x)

在 x0 附近可以表示成
1 ''
f ( x) = f ( x0 ) + f ( x0 )( x − x0 ) + f ( x0 )( x − x0 ) 2 + ......
'

39 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题
1 ''
f ( x ) = f ( x 0 ) + f ( x 0 )( x − x 0 ) + f ( x 0 )( x − x 0 ) 2 + ......
'

对相当多的 f (x) ,当 x − x0 = ∆x 足够小,且在 x0点f(x)高阶导数不是


∞ 时,忽略∆x的高阶项,得
f ( x) = f ( x0 ) + f ' ( x0 )( x − x0 )


'
∆y = f ( x 0 )∆x

这说明y的增量与x的增量之间的关系变成了线性关系

40 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题

举例:
L

U0 i
k
R0 θ
R = R0 + k∆θ , U 0已知,研究当∆θ变化时,i如何变化

di
U 0 = L + Ri
dt
di
= L + ( R0 + k∆θ )i 两变量相乘, 非线性!
dt

41 清华大学自动化系 慕春棣
自动控制理论
六、线性化问题

工作点设在 θ 等于0处,有: L
U0
I0 = , i = I 0 + ∆i U0 i
R0
k
于是:
d ( I 0 + ∆i ) R0 θ
U0 = L + ( R0 + k∆θ )( I 0 + ∆i )
dt
d∆i
U0 = L + R0 I 0 + kI 0 ∆θ + R0 ∆i + k∆θ∆i
dt
∵ U 0 = R0 I 0
d∆i
∴ L + R0 ∆i = −kI 0 ∆θ i
dt I0

电流按指数规律下降!

0 t

42 清华大学自动化系 慕春棣
线性系统时域分析方法
自动化系

清华大学自动化系 慕春棣
1、稳定性
自动控制理论

前面讲的随动系统是一个四阶微分方程,代入参数得
0.025ϕ ( 4) + 0.55ϕ (3) + 1.5ϕ '' + ϕ ' + ϕ = ψ
特征方程 0.025s 4 + 0.55s 3 + 1.5s 2 + s + 1 = 0
特征根 s1 = −18.94, s2 = −2.61, s3, 4 = −0.228 ± j 0.871

ϕ (t ) = Ae s t + Be s t + Ce −0.228t sin(0.871t + θ ) + ϕ * (t )( ϕ * (t ) 为特解)


1 2

A.B.C. θ 由初始条件求出

分析 当 t → ∞ ,前三项 → 0 ,ϕ (t ) → ϕ * (t )
现将 k( k 为开环比例系数)增大10倍,再解特征方程得

s1 = −18.87, s2 = −4.13, s3, 4 = 0.501 ± j 2.21

2 清华大学自动化系 慕春棣
1、稳定性
自动控制理论

于是得
ϕ (t ) = Ae s1t + Be s2t + Ce 0.501t sin(2.21t + θ ) + ϕ * (t )
∴ 只要C ≠ 0, 当t → ∞, ϕ (t ) → ∞, 达不到ϕ * (t )
可见 ϕ (t ) 取决于特征根,组成 ϕ (t ) 的分量诸如 e λi t,叫运动模态。
由这个例子我们可以得到下面的结论:

线性系统稳定的充分必要条件是特征方程的根必须具有负的
实部,或说特征根都在s平面的左半平面
但是,对于非线性方程,在有些初始条件下,解能达到一种
确定的状态,称为稳定的运动,而在另一些初始条件下的解表现
为不稳定的运动。所以,对一个非线性系统,不能笼统地称系统
稳定与否,而只能说哪些解是稳定的,哪些是不稳定的。

见书上p184图3.2.1例
3 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论

1. 定义
如果一个关于X的微分方程组,在初始条件 X (t 0 ) = X 0下
有解X(t),且对于任意给定的正数ε>0,总存在一个正数
~ ~
δ(ε),当初始条件 X 0变为 X 0 时,只要|| X 0 − X 0 ||≤δ,其相应
~
t ~
解 X (t ) 在t> 0 的任何时刻都满足|| X (t )− X (t ) ||<ε,则称解 是 X (t )
稳定的。如果不存在这样的正数δ,则称解X (t ) 是不稳定的。

4 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论

大范围稳定 δ 任意大
~
渐近稳定 稳定,存在 δ , x(t )无限趋于x(t )

工程上希望的系统是大范围渐近稳定的。

5 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论

补充说明:一个高阶方程可以化成一个一阶微分方程组

a3 x (3) + a 2 x' '+ a1 x'+ a 0 x = u


.
x1 = x x1 = x 2
.
设: x 2 = x' 有: x 2 = x3
x 3 = x' ' . 1 1
x3 = (−a0 x1 − a1 x 2 − a 2 x3 ) + u
a3 a3

 .   0 1

0 x   
 x1    1
   0 
 .  
 x2  =  0 0 1   x 2  +  0 u
 .     1

 x   a0 a1 a2   x   a 
 3  − − −  3   3 
 a3 a3 a3   

6 清华大学自动化系 慕春棣
2、稳定的Liapunov定义
自动控制理论

2.Liapunov第一方法(见书P190)
a. 若线性化后系统特征方程的所有根均为负实数或实部为负
的复数,则原系统的运动不但是稳定的而且是渐近稳定的。
线性化过程中被忽略的高于一阶的项也不会使运动变成不
稳定。
b. 若线性化后系统特征方程的诸根中,只要有一个为正实数
或实部为正的复数,则原系统的运动就是不稳定的。被
忽略的高于一阶的项也不会使运动变成稳定。
c.若线性化后系统特征方程的诸根中,有一些是实部为零的,
而其余均具有负实部,则实际系统运动的稳定与否与被忽略
的高阶项有关。这种情况下不可能按照线性化后的方程来判
断原系统的运动稳定性。若要分析原系统的运动稳定性必须
分析原系统的非线性数学模型。
7 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

根据微分方程特征方程的系数,不解方程来判断是否有右半
平面的根。这就是Routh和Hurwitz分别独立提出来的稳定性判据,
其功能是判断一个代数多项式有几个零点位于复数平面的右半面

例1 特征方程

2 s 6 + 5s 5 + 3s 4 + 4 s 3 + 6 s 2 + 14 s + 7 = 0

构造Routh表如下:

8 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

例1 特征方程
2s 6 + 5s 5 + 3s 4 + 4s 3 + 6s 2 + 14s + 7 = 0
构造Routh表 s 6 2 3 6 7

s5 5 4 14

4 12 3 7 12 6 2 12 7 2
s − =
55 4 5
− =
5 5 14 5
− =
55 0 5
18
s3 -11
7
115 7
s2 18
1589
s1 −
115
s0 7

9 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

看第一列:
2
5
7
5
18
7
115
18 一次变号
1589

115 又一次变号
7
第一列系数全为正,是系统稳定的充分必要条件。
出现负号说明有右半平面的根,有几个?看变号的次数
此例有两个右半平面的根。
10 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

例2 s 4 + 5s 3 + 10 s 2 + 20 s + 24 = 0
s4 1 10 24

s3 5 20
s2 6 24
1 5 20
0(ε )
1
s −
6 6 24
=0

s0 24 −
1 6 24
= 24
ε ε 0

第一列系数出现0,用一个小正数 ε 代替,如果 ε
上下元素相同,表示有一对纯虚根存在,
如果相反,则认为有一次变号
此例解得根为: ± 2 j ,−2,−3.
11 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

例3
s 3 − 3s + 2 = 0

s3 1 -3

一次变号 s2 0(ε ) 2

1 1 −3 1
s 1 − = −3 − (负数)
ε ε 2 ε
二次变号
s0 2

这说明有两个根在右半平面+1,+1,-2

12 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

s 5 + 2 s 4 + 24 s 3 + 48s 2 − 25s − 50 = 0
例4.
s5 1 24 -25

s4 2 48 -50

s3 0(8) 0(96)

s2 24 -50

s1 112.7
一次
变号
s0 -50

出现全零行时构造一辅助多项式:
2 s 4 + 48s 2 − 50

求导得:8s 3 + 96s 3 用此行代替全0行


13 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

s5 1 24 -25

s4 2 48 -50

s3 0(8) 0(96)

s2 24 -50

s1 112.7
一次
变号
s0 -50

一次变号说明有一个正的实根 0上下同号说明有一对纯虚根
全0行说明有一对大小相等关于原点对称的根。这一对根可以
从辅助多项式构成的方程 2s 4 + 48s 2 − 50=0 解出。
该方程全部解为:± 1, ± 5 j ,−2
14 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

●关于稳定的必要条件
设想方程全部为负实根或实部为负的共轭复数
则一定可以分解成下面一些因式的乘积

( s + α )( s + β + jγ )( s + β − jγ ) α, β ,γ > 0

( s + α )( s 2 + 2 βs + β 2 + γ 2 )

可见全部系数必为正

得出:方程系数全为正是系统稳定的必要条件(但不充分)

15 清华大学自动化系 慕春棣
3、Routh判据Routh-Hurwitz判据
自动控制理论

●用Routh判据来分析一.二.三阶系统,得到
稳定的充要条件

a1s + a0 = 0, a1 > 0, a0 > 0


2
a2 s + a1s + a0 = 0, a2 , a1, a0 > 0
3 2
a3s + a2 s + a1s + a0 = 0, a3 , a2 , a1, a0 > 0, 且a2a1 > a3a0

作业:3.5, 3.8, 3.9, 3.10, 3.11, 3.12

16 清华大学自动化系 慕春棣
4、参数对稳定性的影响,参数稳定域
自动控制理论

系统的参数集中体现在k(开环比例系数)和诸T,
它们是影响系统稳定的主要因素

1一般情况下,k过大不利于稳定(有些特殊情况,条件稳定)
2增大时间常数,不利于稳定
3增多时间常数,不利于稳定

参数稳定域(单参数稳定域)
设一个系统的开环传递函数
1
k ( s + 1)
G开 ( s ) = 3
s ( s + 1)(2 s + 1)

试找出k的稳定范围

17 清华大学自动化系 慕春棣
4、参数对稳定性的影响,参数稳定域
自动控制理论

首先列出特征方程:1 + G开 ( s ) = 0
1
即 s ( s + 1)(2 s + 1) + k ( s + 1) = 0
3
1
2 s 3 + 3s 2 + (1 + k ) s + k = 0
3
 k >0
根据Routh判据 3(1 + 1 k ) > 2k ∴0 < k < 3 是k的稳定范围
 3

k (τs + 1)
双参数稳定域 G开 ( s ) = k ,τ > 0
s ( s + 1)(2 s + 1)

特征方程: 2s 3 + 3s 2 + (1 + kτ ) s + k = 0
3(1 + kτ ) > 2k
2 1
τ> − 试画出 τ − k 的关系曲线
3 k
18 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

1、引言
1)静差表示系统的静态精度,只有稳定系统才谈得上静差
2)静差与输入信号有关,用一些典型输入信号作为标准

1
阶跃 1(t ) →
s
1
斜坡 t→
s2

1 2 1
加速度 t → 3
2 s

19 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

2、定义
基本定义 e = y要求值 − y实际值
表现在框图上

b = yH 反映y的实际值,r体现对y的要求值

∴ e = r − yH
20 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

对于有些复杂情况,从框图上找不到e 要求e=r-y

是否可以把它变换成

21 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

y HG
1.先求出 =
r 1 + GF
2.求出对应的 G开(s),即求出对应于闭环传递函数 (G闭 = y/r)
开 s)
的单位反馈的开环传递函数 G(
即: G开 y
= = G闭
1 + G开 r
所以: G闭 GH
G开 = =
1 − G闭 1 + GF − GH
22 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

3、静态误差的计算

针对一般情况


e( s ) 1 − 1 −
= ∴ e( s ) = r (s)
r ( s ) 1 + G开 ( s ) 1 + G开 ( s )


可见误差与 G开 (s) 和输入 r (s) 有关


用Laplace变换的终值定理求 e(∞) = lim
s →0
s e( s ) = ess

23 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

系统在三种典型输入信号下的误差

− 1 − 1 1 1
r( s) = ess = lim s e( s ) = lim s = lim
s s → 0 s → 0 1 + G开 ( s ) s s→0 1 + G开 ( s )

− 1 − 1 1 1
r( s) = 2 ess = lim s e( s ) = lim s 2
= lim
s s →0 s →0 1 + G ( s ) s s →0 sG ( s )
开 开

− 1 − 1 1 1
r( s) = 3 ess = lim s e( s ) = lim s = lim 2
s s →0 s →0 1 + G ( s ) s 3 s →0 s G ( s )
开 开

24 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

定义误差系数 k p = lim G开 ( s ) 位置误差系数


s →0
k v = lim sG开 ( s ) 速度误差系数
s →0
k a = lim s 2 G开 ( s ) 加速度误差系数
s →0

∴ 对三种典型输入的静态误差为

 1
1 + k 阶跃输入
 p
 1
e ss =  斜坡输入
 kv
 1
k 加速度输入
 a

25 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

4、系统类型与静差的关系

以上我们定义了误差系数,导出了在特定输入信号的作用
下,静差与误差系数的关系,而误差系数与系统的开环传递函
数有关,也就是说与系统的参数和结构有关。

k (τ 1 s + 1)...(τ m s + 1)
设 G开 ( s ) = γ ( γ = 0,1,2, 分别称为0型,
1型,2型
s (T1 s + 1)...(Tn s + 1)

系统)注意 k 的定义。

26 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

对0型系统:

 1
 kp = k 阶跃输入下的静差 ess =
1+ k

k v = 0 斜坡输入下的静差 ess = ∞
k = 0 加速度输入下的静差 ess = ∞
 a

27 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

对1型系统

k p = ∞ 阶跃输入下的静差 ess = 0
 1
 kv = k 斜坡输入下的静差 ess =
 k
 k a = 0 加速度输入下的静差 ess = ∞

28 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

对2型系统


k p = ∞ 阶跃输入下的静差 ess = 0

 kv = ∞ 斜坡输入下的静差 ess = 0
 1
 ka = k 加速度输入下的静差 ess =
 k

29 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

总结如下表:

30 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

5、关于静差的物理解释

初始条件:平衡位置 h0 ,阀门开度 l 0,进水 Q0 ,出水 M 0


当M增大,水位h降低,l变大,从而Q变大,h回升,
当 Q = Q1 达到新的平衡,此时 h1 ? = h0
如果要保证 Q1 > Q0 , l 就必须大于l 0 ,∴ h1 < h0
1

这是一个有差系统
31 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

+
u
初始状态: h = h0 , ∆u = 0, l = l 0 , M 0 = Q0
D
当M升为 M 1 ,h下降,∆u > 0 ,电动机动作, - l

提高 l , l 0 升为l1 , Q升为Q1
Q M
h0
直到 Q1 = M 1 达到新平衡

此时 h1 ? = h0

试想:只要 h1 ≠ h0 , ∆u ≠ 0, 电动机就转,阀门就动作(不是开大就是
关小)直到 h = h0 达到新平衡

这是一个无静差系统。

32 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

数学模型

k1

33 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

两者不同,前者是0型,后者是1型,多了一个电动机,在把
速度信号变为位置信号时多了一个积分环节。

34 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

6、对扰动的误差
1.扰动(P(t))也是一种输入,系统静差由两部分组成,由r(t)引起的
和由p(t)引起的代数和。

1.由r(t)引起的误差,可根据r(t)的性质和 G开 (s) ,求得


− 此时p(t)=0
e( s )
2.由p(t)引起的误差,令r(t)=0,做框图变换,求 −
p( s)


e( s ) GH
=− 在已知p(t)下,求出 e ss

p( s) 1 + GHK

35 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

试分析 K(s)含积分和K(s)不含积分两种情况下的静差

●K(s)含积分 即扰动作用点之前(左)含积分,

对阶跃扰动无静差 e ss = 0

●K(s)不含积分

 k2
− (GH中不含积分)
1  1 + k1k2
ess ≈ − 
k1  − 1 (GH中含积分)
 k1

36 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

自测题:求以下3题的静差 e = r−c

1)第一种情况:r(t)=1(t), f(t)=1(t)
第二种情况:r(t)=t, f(t)=1(t)

37 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

2)第一种情况:r(t)=1(t), f(t)=1(t)
第二种情况:r(t)=t, f(t)=1(t)

38 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

3)第一种情况:r(t)=1(t),
第二种情况:r(t)=t,

39 清华大学自动化系 慕春棣
5、静态误差
自动控制理论

答案: r(t)=1(t), f(t)=1(t) r(t)=t, f(t)=1(t)

1) -1/ K1 1 K1 K 2 − 1 K1

2) 0 0

3) 0 0

作业:3.14, 3.15, 3.16, 3.17, 3.18,

40 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

1)超调
y max − y (∞)
σ= × 100%
y (∞ )

41 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

2)过渡过程时间 ts
y(t)达到 y (∞)5%或2%的时间
t r 上升时间,y(t)第一次达到 y (∞) 的时间
t d 延迟时间,y(t)达到 y (∞)一半的时间
3)峰值时间 t p ,y(t)达到 y max 时的 t p
4)振荡次数
5)爬行现象
∞ ∞ ∞
6)误差积分指标 ∫ e (t )dt , ∫ te (t )dt , ∫ e(t ) dt
2 2
0 0 0

在阶跃函数作用下,误差的某个函数的积分值,无论
哪一种都希望越小越好。

42 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

典型二阶系统

2
d y dy
T 2
2
+ 2ζT +y=v T时间常数,ζ阻尼系数
dt dt

另一种形式:

d2y dy 1
2
+ 2ζω n + ω 2
n y = ω 2
nv ω n = 无阻尼自振频率
dt dt T

43 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

在零初始条件下,解此方程有以下情况

1−ζ 2
ζ
1) 0 ≤ ζ < 1, s1, 2 = − ± j (= −ω nζ ± jω d )
T T
( ω d 是阻尼振荡频率)

ζ
1 − t 1−ζ 2 1−ζ 2
y (t ) = 1 − e T
sin( t + arctg )
1−ζ 2 T ζ

曲线如图3.26

44 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

45 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

t
1 t −
2)ζ = 1 ,两个相等的负实根,s1, 2 = − , y (t ) = 1 − (1 + )e T
T T

− ζ ± ζ 2 −1
3)ζ > 1 ,两个不相等的负实根,s1, 2 =
T
s1t s2t
y (t ) = 1 + a1e + a2 e

y(t)单调趋近于1

46 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

分析:

1)看 ζ 的作用:

0 ≤ ζ < 1, 欠阻尼, ζ = 0无阻尼,带振荡性


ζ = 1,临界阻尼
ζ > 1,过阻尼

2) t T 总在一起,T是个时间尺度,曲线展宽或压缩。

47 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

3)看两个根在s平面的分布,随着 ζ从0 → 1 → 大于1


看根位置的变化

1−ζ 2
θ = arctg.
ζ

cosθ = ζ

48 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

性能指标:

1) t r , y (t r ) = 1

ζ
1 − tr .
y (t r ) = 1 = 1 − e T
sin(ω d t r + θ )
1−ζ 2
sin(ω d t r + θ ) = 0 → ω d t r + θ = π
即:
π −θ
tr =
ωd

49 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

2) t p ,令
dy
= 0 ,得 t p =
π πT
=
dt ωd 1−ζ 2

3)求 σ , 将t = t p 代入y (t ), 求出y max , y (∞) = 1

−(ζπ )
1−ζ 2
∴ 得σ = e

t 3~ 4
4) s 近似估计值, s
t ≈
ζω n
(误差带5% ~ 2%)

50 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

课堂练习 r y
k
s (τs + 1)

试分析当r(t)=1(t),在以下三种不同k, τ 参数下,该二阶系统
的主要特征,并划出y(t)曲线

1)k = 1,τ = 1; (ζ = 0.5, T = 1, ts = 6)


1
2)k = 4,τ = 1; (ζ = 0.25, T = , ts = 6)
2
3)k = 1,τ = 4; (ζ = 0.25, T = 2, ts = 24)

51 清华大学自动化系 慕春棣
6、动态性能指标,二阶系统的运动
自动控制理论

作业:3.19, 20 21 22, 23, 24, 25, 26

小结: 1)二阶系统 T , ζ 对动态性能的影响

−(ζπ πT
2
)
tp = 3
σ =e 1−ζ
ts ≈
1−ζ 2
ζω n

2)能根据主要特征绘制阶跃响应曲线

52 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论

一个高阶系统的闭环传递函数,可以写成如下的形式


m m −1
y( s) b s + b s + ...b1s + b0 k ( s + z1)( s + z2 )...( s + zm )
− = m
n
m −1
n −1
=
r ( s ) an s + an −1s + ...a1s + a0 ( s + p1 )( s + p2 )....( s + pn )

− pi (i=1,…n)系统的闭环极点

− zj (j=1,…m)系统的闭环零点

53 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论

在单位阶跃输入,零初始条件下,且假设这些零极点
都是实数且互不相同,于是有:
− A0 n Ai
y( s) = +∑ , A0 , Ai是相应于s = 0, s = − pi极点处的留数
s i =1 s + pi


n
y (t ) = A0 + ∑ Ai e − pi t
i =1

A0 = [ y ( s ).s ]s =0

Ai = [ y ( s )( s + pi )]s =− p

54 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论

1)设一极点 − pk 远离原点,此极点处的留数为 Ak

− k ( s + z1 )......( s + z m )
Ak = y ( s )( s + p k ) s = − pk = (s + pk ) s =− p k
s ( s + p1 )...( s + p k )...( s + p n )

k ( − pk + z1 )......( − pk + z m ) k ( pk ) m
= ≈ n>m
( − pk )( − pk + p1 )......( − pk + pn ) ( pk ) n

∴ Ak 很小。
这表示远离原点的极点所对应的运
动成分对于阶跃响应的影响很小。

55 清华大学自动化系 慕春棣
7、高阶系统的二阶近似
自动控制理论

2)设一零点 − z r 和一极点 − pk 很靠近,即 − p k + z r 很小,


这一对零极点称为偶极子。
k ( s + z1 )...( s + z r )..( s + z m )
此极点的留数 Ak = (s + pk ) s = − pk
s ( s + p1 )...( s + p k )...( s + p n )

k (− p k + z1 )...(− p k + z r )...(− p k + z m )
=
(− p k )(− p k + p1 )......(− p k + p n )
可见 Ak 很小
这表明如果有一零点与一极点相近,则这个极点
所对应的运动成分在阶跃响应中所占的比重很小。

因此我们在分析高阶系统时,就可以把上述两种情况的极点化为次要
因素而忽略。如果一稳定系统有一对左半平面的共轭复极点,而在它们附
近又没有零点,则这一对共轭复极点称之为主导极点,这个系统就可以近
似化为一个二阶系统,其动态特性是由这一对主导极点决定。

56 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

介绍两种常用的校正方式,串联校正,局部反馈校正,
以及两者的结合

1、串联校正

r y

57 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

1
1. k ( s ) = k p (比例), 设G g ( s ) =
Ts(Ts + 2ζ )
当 k p = 1 特征方程为: T 2 s 2 + 2ζTs + 1 = 0

当 k p ≠ 1 特征方程为:T 2 s 2 + 2ζTs + k p = 0
T ζ
T'= ,ζ ' =
kp kp

当 k p 变大,T ' 变小,系统的响应快,但是 ζ ' 也变小,振荡加剧

58 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

1 1 1
2.K ( s ) = G
(积分校正)设 g ( s ) = G开 ( s ) =
TI s s (Ts + 1) TI s 2 (Ts + 1)
特征方程:TI Ts 3 + TI s 2 + 1 = 0 显然系统不稳定
k0 1
如果 Gg ( s) = , k (s) =
T0 s + 1 TI s
特征方程 TI s (T0 s + 1) + k 0 = 0

TI T0 s 2 + TI s + k 0 = 0 1
G g (s) =
s(Ts + 1)

TI T0 1 TI
T'= ,ζ ' =
k0 2 k 0T0

59 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

可以通过调整 TI , k 0 ,使系统具有希望的特征

3T '
ts ≈ = 6T0 , 与不加积分比较,系统响应变慢
ζ'

不加积分的特征方程为:T0 s + 1 + k 0 = 0
T0 3T0
T'= , t s = 3T ' =
1 + k0 1 + k0

可见加积分 优点-对克服静差有利

缺点-系统变慢,甚至于不稳定

60 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

3.将上述两者结合起来,比例加积分
1 TI s + 1 k0
k ( s ) = k p (1 + ) = kp , 设 G g (s) =
TI s TI s T0 s +1
k p k 0 (TI s + 1) k p k 0 (TI s + 1)
G闭 ( s ) = =
TI s (T0 s + 1) + k p k 0 (TI s + 1) TI T0 s 2 + (k p k 0 + 1)TI s + k p k 0

TI s + 1 k p k0 >>1
TI s + 1
= ⇒
TI T0 s 2
k p k0 + 1 TI T0 2
+ TI s + 1 s + TI s + 1
k p k0 k p k0 k p k0
TI s + 1 1
≈ =
T0 T0
(TI s + 1)( s + 1) s +1
k p k0 k p k0

61 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

比例加积分控制:

1)有积分对克服静态误差有利

T0
2)使响应可达到非振荡状态且 t s 不长,t s = 3
k p k0

T0
(不加比例积分:t s = 3 )
1 + k0

62 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

4.比例加微分

k ( s ) = k p (1 + TD s )
de(t )
控制信号 u (t ) = k p e(t ) + k p TD
dt

无微分作用只要y(t)<1,e(t)>0,就产生使y(t)增大的
控制作用,当 t = t1 , e = 0 时,y(t)还在增加,会出现
过头现象,加了微分作用 u (t ) 在t= t1' < t1 时为零,在
t1' 到t1 这段时间内 u (t ) < 0 ,抑制 y (t ) 的增加,好像
在车辆到达目标之前,提前制动一样。

微分作用只在信号发生变化时才起作用。

63 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

5. 比例加积分加微分 PID

1
K ( s) = K p + + TD s
TI s

综合了比例积分加微分的优点。

64 清华大学自动化系 慕春棣
8、控制系统的校正问题
自动控制理论

2、局部反馈校正

通常用局部反馈改善局部特性,再配以串联校正
K
设 G( s) = ,Gc ( s ) = k
Ts + 1 K K
Ts + 1 = K
小闭环等效为 = 1 + kK
Kk Ts + 1 + kK T
1+ s +1
Ts + 1 1 + kK
1
当 kK >> 1 时 ⇒
k
当 G 中 T 较大时,采用局部反馈可减少惰性。

65 清华大学自动化系 慕春棣
自动控制理论
本章小结

1、稳定问题 充要条件
稳定判据及其应用

2、静差 系统类型
对典型信号的误差
对扰动的误差

3、二阶系统的动态特性 ζ ,T

66 清华大学自动化系 慕春棣
频率响应法
自动化系

清华大学自动化系 慕春棣
1、引言
自动控制理论

从 RC 电路对正弦信号的响应,引出频率特性

u r = X sin ωt 由电路知识可知,u c 也是同频率的正弦信号,


只不过幅值和相位发生变化,它们之间的关系满足

1
uc jωc 1 1
= = = ∠ − arg tgRCω

1 RCjω + 1 ( RC ) ω + 1
2 2
ur R+
jωc
1
我们称之为频率特性,它是一个复变函数(是将 RCs + 1 中
的 s → jω )。
2 清华大学自动化系 慕春棣
1、引言
自动控制理论

提出问题

1、这种分析方法是否适合于一般系统,即如果已知传递函数
G (s ) ,那它的频率特性是不是 G ( jω ) 。

2、如果输入不是正弦,而是一般周期函数,通过 Fourier
变换分解成一系正弦函数之和。

3、如果是非周期函数,这种关系还成立吗?

3 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论

满足Dirichlet(狄里赫利)条件的周期函数,都可以用
Fourier 变换,表示为一系列的谐波(正余弦)之和

f (t ) = a 0 + ∑ a n cos nω 1t + bn sin nω 1t
n =1

其中: 1
T1
+
a0 =
T1 ∫

2
T1 f (t )dt ,
2
T
2 + 1
an =
T 1
−∫ 2
T1
2
f (t ) cos nω1tdt ,

2 + T21
bn = ∫ T1 f (t ) sin nω1tdt ,
T1 − 2

ω1 = ,T1 为 f (t ) 的周期
T1

4 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论

可以看出,周期函数 f (t ) 的频谱是离散的,即只在 ω1 ,2ω1


3ω1 等频率下有谱线。
当 f (t ) 是非周期函数,可以看成 T1 → ∞ 的周期函数

这时基波ω 1 → 0 ,各次谐波之间的差趋向于无穷小,
即无限接近,谐波的幅值 → 0

∴ 非周期函数的频谱含有一切频率成分,即是由无穷
多个无穷小的谐波组成,所以它的频谱是连续的。

5 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论

Fourier 变换的数学描述

− +∞
f ( jω ) = ∫
−∞
f (t )e − jωt dt

与拉普拉斯变换对照:

− +∞
f ( s) = ∫ f (t )e − st dt
0−

6 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论

t

举例: f (t ) = e 1(t )
τ

∞ t
− − τ τ
f ( jω ) = ∫ e τ e − jωt dt = = ∠ − arg tgωτ
0
1 + jωτ 1 + (ωτ ) 2

其图像为

1
称为截止角频率
τ
7 清华大学自动化系 慕春棣
2、Fourier变换与周期函数的频谱 自动控制理论

ω 从0→∞
从图中可以看到 f (t ) 中含有一切频率成分,
f ( jω ) 代表频率为 ω 的那项谐波的相对幅值

(乘以一个无穷小量才是真正的幅值)
− arctgωτ 代表频率为 ω 的那项谐波在 t = 0 时刻的初相角。

频带:通常指截止角频率的10倍。
试想当 τ 越小时,f(t)越尖 f ( jω ) 的频带越宽,由此可知,

变化越剧烈的函数,它的频带越宽,含有的高频成分越多。

8 清华大学自动化系 慕春棣
3、频率特性
自动控制理论

现在我们来回答引言中的第一个问题,一个正弦信号加到一G (s )

对象上,其输出与输入之间的关系,是不是可以用频率特性来表示,而
频率特性是不是 G ( jω ) ?

p( s )
G( s) =
( s + s1 )( s + s2 )...( s + sn )

9 清华大学自动化系 慕春棣
3、频率特性
自动控制理论

− − Xω p( s )
y ( s ) = x ( s ).G ( s ) = .
s 2 + ω 2 ( s + s1 )( s + s2 )...( s + sn )

b1 bn a a
= + ... + + +
s + s1 s + sn s + jω s − jω

− jωt
y (t ) = b1e − s1t
+ ... + bn e − sn t
+ ae + a e jωt
− Xω
其中: a = y ( s )( s + jω ) s =− jω = G ( s ). ( s + jω ) s = − jω
( s + jω )( s − jω )
Xω X
= G ( − jω ) * =− G ( jω ) e − jφ (ω )
− 2 jω 2j
− X
同理可求 a= G ( jω ) e jφ (ω )
2j
10 清华大学自动化系 慕春棣
3、频率特性
自动控制理论

−X X
y (t ) = G ( jω ) e − jφ (ω ) e − jωt + G ( jω ) e jφ (ω ) e jωt
2j 2j
− X G ( jω ) e − j [ωt +φ (ω ) ] + X G ( jω ) e j [ωt +φ (ω ) ]
=
2j
− X G ( jω ) − j (ωt +φ (ω ))
= (e − e j (ωt +φ (ω )) )
2j
= X G ( jω ) sin[ωt + φ (ω )]
y (t )
∴ = G ( jω ) 输出的模与输入的模之比等于G(jω)的模
x(t )
y(t)与x(t)的相位差 φ (ω )(就是G ( jω ) 的角)
G ( jω ) :频率特性,就是将G(s)中的 s → jω
G ( jω ) 是个复变函数,它的模表示 输出 的模。
输入
它的角表示输出与输入的相位差
11 清华大学自动化系 慕春棣
3、频率特性
自动控制理论

现在我们将上述结论拓宽:

如果输入信号不是正弦函数,而是一非周期函数,
通过Fourier变换可以表示为一系列的正弦函数之和,
对于每一项正弦函数都有上述关系。
∴ 我们把频率特性定义为输出的Fourier变换与输入
的Fourier变换之比。

G ( jω ) 称为幅频特性 
它们都是ω的函数,都可以用图像表示出来。
arg G ( jω )称为相频特性
根据图像我们可以分析出系统的许多特性。

12 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论

1.极坐标图:
在复平面,把频率特性的模和角同时表示出来的图就是极坐标
看一个惰性环节的频率特性
k k
G ( jω ) = = ∠ − arg tgωT
1 + j ωT 1+ω T
2 2

ω 0 ∞
k 0
0
π
-
2

可以证明它的图像是一个半圆
k k kωT ,令 x = k kωT
G ( jω ) = = − j , y =
1 + j ωT 1 + ω 2 T 2 1 + ω 2T 2 1 + ω 2T 2 1 + ω 2T 2
k k
有 x 2 + y 2 − kx = 0, 即( x − ) 2 + y 2 = ( ) 2
2 2

13 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论

2.对数坐标图
横坐标为 ω 轴,以对数刻度表示之,十倍频程

纵坐标为贝尔lg (分贝20 lg ,线性刻度)

对数分度:
lg 2 = 0.301 lg 3 = 0.4771
lg 4 = 0.602 lg 5 = 0.699
lg 6 = lg 3 + lg 2 = 0.778
lg 7 = 0.845
lg 8 = 3 lg 2 = 0.903
lg 9 = 2 lg 3 = 0.954

14 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论

画惰性环节的对数频率特性 1
T
1 2 10 100
令 k = 1, T = 0.5
0 ω
-1

π
1 2
G ( jω ) =
1 + (ωT ) 2
1 1
ω= , = ,20 lg = −10 lg 2 = −3分贝
T 2
1
ω << , ≈ 1 ,20 lg = 0分贝
T
1 1
ω >> , ≈ 20 lg = −20 lg ωT
T ωT ,
ω 每增大十倍, 下降20分贝
15 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论

相频: ∠ = − arg tgωT 1 2 10 100

1 0 ω
ω = , ∠ = −45  -1
T
1
ω >> , ∠ → −90  π
T 2

1
ω << , ∠ → 0 
T
a 
ω= 
T  1
1  是关于 ω = 中心对称
a  T
ω=
T 
1
θ1 = arg tga, θ 2 = arg tg
a
θ1 + θ 2 = 90

16 清华大学自动化系 慕春棣
4、频率特性的图像
自动控制理论

对数频率特性优点:
1)展宽频率范围
2) k变,幅频特性曲线只是上下移动 
形状不变
T变,幅、相频特性曲线只是左右移动

3)几个频率特性相乘,对数幅、相曲线相加
G1 ( jω )G2 ( jω ) = G1 ( jω ) e jφ1 (ω ) . G2 ( jω ) e jφ2 (ω ) = G1 G2 e j [φ1 +φ2 ]
20 lg G1G2 = 20 lg G1 + 20 lg G2 ∠G1G2 = φ1 + φ 2
4)两个频率特性互为倒数,幅、相特性反号,关于 ω 轴对称
1 1
G1 = G1 = φ1 = −φ 2
G2 G2
20 lg G1 = −20 lg G2
17 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论

1.比例 G ( s ) = k , G ( jω ) = k , = k , ∠ = 0

1 1 1
2.积分 G ( s ) = ,G ( jω ) = , = , ∠ = −90 
s jω ω

-20db
dec
0 0.1 1 10 ω

π
2

k k ω
s

18 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论

1 1 1
3.惰性 G ( s) = ,G ( jω ) = , = ,
Ts + 1 Tjω + 1 1+ω T 2 2

∠ = − arg tgωT

1
T ω
0

-20db
dec

π
2

19 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论

1
4.二阶振荡 G ( s ) =
T 2 s 2 + 2ςTs + 1
1 2ςωT
= ∠ = − arg tg ,
(1 − ω T ) + (2ςTω )
2 2 2 2
1 − ω 2T 2

显然幅相特性都与 ς 有关,见p182-183
Im

1
1 T ω
1 Re
ω= T
-40db
dec
ζ减小
1
可以证明:峰值频率 ω r = 1 − 2ζ 2
T
1
峰值 Mr =
2ζ 1 − ζ 2

20 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论

5.微分(2.3.4的幅相反号)
6.延时环节,G ( s ) = e −τs ,G ( jω ) = e −τjω = cos ωτ − j sin ωτ
= 1 , ∠ = −ωτ

1
τ ω

-57.3°

21 清华大学自动化系 慕春棣
5、基本环节的频率特性
自动控制理论

7.不稳定单元
1 1 −1
, , 与 Ts + 1 比较
− Ts + 1 Ts − 1
以上三者的模都是半圆
− ωT ωT ∠ = −180 − arg tgωT
∠ = − arg tg ∠ = − arg tg
1 −1
= -180 − (0 → 90 )
= −(0 → −90  ) = −(−180  → −270  )
= -180 → −270
= 0 → 90  = 180 → 270
 

= 180 → 90
图像分别为:

22 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

1) 100(0.5s + 1)
G ( s) =
s (10 s + 1)(0.1s + 1)(0.01s + 1)
-1

-2

-1 ωc 100 ω
0° 0.1 1 2 10
-2

-90°
-3

-180°

-270°

相频特性:

θ (ω ) = −90  − arg tg10ω − arg tg 0.1ω − arg tg 0.01ω + arg tg 0.5ω


23 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

讨论 ω c(剪切频率)求法,作图法,计算法 Im

100 2 ω -1 ω ∞
20 lg = 40 lg + 20 lg c
0.1 0.1 2 Re
∴ω c = 5
ω
讨论极坐标图大致形状 : ω
0
模从很大 → 0
π3
角从 − →− π
2 2
− 1点位置如图所示,当角 = -180  时,模小于1

24 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

40( s + 1)
2) G (s) =
(20 s + 1)(0.5s + 1)(0.1s + 1)
-1
20Lg40
-1 10 ω
0° 0.01 0.05 0.1 1 2 ωc 100

-2

-90°

-180°
Im
1 ω Re
由图可知: 20 lg 40 = 20 lg + 20 lg c
0.05 2

解得 ωc = 4 θ (ω c ) = −98.5

25 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

小结:对最小相位系统、幅频特性与相频特性的关系

如果幅频特性的斜率为 − 1对应的相角为 −
π
2

如果幅频特性的斜率为 − k对应的相角为 −
2
ω c 的定义,开环幅频特性曲线(折线)过0分贝的频率。
也叫剪切频率或穿越频率。

作业:4.6,4.7,4.9,4.11,4.16

26 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

6(0.33s + 1)
3) 非最小相位系统的例子 G0 ( s ) =
-1 s ( s − 1)
10 100
0° 3
1 2 ω
-1
-90°

-180°

-270°

非最小相位系统的幅相之间的关系没有象最小相位系统那样有确定的
规律,必须根据具体对象具体分析 。(试画出极坐标图)

27 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

练习开环对数图和极坐标图的画法

给定一些传递函数找出各自对应的极坐标图,并判
断闭环系统的稳定性,若不稳定,有几个极点在右
半平面。
K K
G0 (s ) = G0 (s ) =
(T1 s + 1)(T2 s + 1)(T3 s + 1) s (T1s + 1)(T2 s + 1)

K (T0 s + 1) K (Ta s + 1)(Tb s + 1)


G0 (s ) = G0 (s ) =
(T1 s + 1) (T5 s + 1) s(T1 s + 1) (T4 s + 1)

28 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

Im Im Im
ω=0

-1 ω=0
0 Re -1 0 Re -1 0 Re

ω=0

Im Im
Im
ω=0

-1 ω=0
0 Re -1 0 Re -1 0 Re

ω=0

29 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

K (Ta s + 1)(Tb s + 1)
已知 G0 (s ) =
s 2 (T1 s + 1)
在以下三种情况下各自画出对数图和极坐标图

(1) Ta > Tb > T1 > 0


(2) Ta > T1 > Tb > 0
(3) T1 > Ta > Tb > 0

30 清华大学自动化系 慕春棣
6、复杂频率特性的绘制
自动控制理论

 已知 G (s ) =
K
s (T1 s + 1)(T2 s + 1)
0

 求 θ (ω g ) = −180 的 ω g

31 清华大学自动化系 慕春棣
7、闭环频率特性
自动控制理论

如果从开环频率特性求闭环频率特性
G o ( jω )
G c ( jω ) = (设单位反馈)
1 + G o ( jω )

在任一 ω1 下,开环频率特性的模角可表示为 A∠φ

A∠φ A∠φ A
所以闭环 Gc ( jω1 ) = = = ∠φ − θ
1 + A∠φ B∠θ B
如图所示

∴ 可以看出求闭环频率特性很费事,人们提出:能否根据开环频率特性
来判断闭环系统的一些性质呢?

32 清华大学自动化系 慕春棣
7、闭环频率特性
自动控制理论

分析闭环
(1)在低频段 Go ( jω ) >> 1 ∴ Gc ( jω ) ≈ 1, ≈ 1, ∠ ≈ 0 
(2)在高频段 Go ( jω ) << 1 ∴ Gc ( jω ) ≈ Go ( jω )

(3)在中频段 (指在剪切频率的附近)
如果出现 Go ( jω ) ≈ −1(模为1,角 ≈ −180 )这时 Gc ( jω ) >> 1,
这种情况要尽可能避免 G开

∴ 可见闭环频率特性具有如下形状
ω

33 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

Im

映射定理 S-P1
P1
S
O
Re

∏ (s − z
j =1
j )
W (s) = p 设W(s)在复平面一个封闭曲线内具有P个极点和Z个零点,
∏ (s − p ) i
i =1
当s向量沿封闭曲线顺钟向旋转一圈,所有向量s − z j , s − p j

也都顺钟旋转一周

∴ W(s)顺钟向旋转的圈数N=Z-P

34 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

N ( s)
∏ (s − z
j =1
j )
设系统的开环传递函数:Q( s) = = k.
P( s) p

∏ (s − p )
i =1
i

构造一个函数
P( s) + N ( s) 闭环分母
W ( s) = 1 + Q( s) =
P( s) 开环分母

做一封闭曲线D包围整个右半平面,且已知有p个极点在其中。

现在我们关心是这其中是否有闭环极点?

35 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

Im
+∞


O
Re

-∞
按映射定理,当s沿D形围线顺钟向旋转一圈

[1 + Q( s)]顺钟方向旋转圈数 = 闭环在右半平面的极点数Z −
开环在右半平面的极点数P

36 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

1、什么是1+Q(s)旋转的圈数
当s沿D形围线顺旋一圈
s → ∞, (Q( s ) → 0)  Q( s )的分母次数大于分子次数
即当s沿无穷大半圆旋转时,Q(s)在原点处蠕动。
∴我们只看ω从-∞→+∞ ( s = jω ) , 1 + Q( jω ) 旋转的周数
按映射定理,若闭环系统稳定

[P( s) + N ( s)] 在右半平面应有0个极点


[P(s)] 在右半平面有P个极点
∴ 稳定的充要条件是:1 + Q( jω ) 应顺钟向转-P圈
即逆钟向转P圈

37 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

什么是 1 + Q( jω )? 从-1点指向 Q( jω ) 的向量

Im
-1
Re
1+Q(jω)
Q(jω)

38 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

举例:
K
1. Go ( s ) = K=20
(10 s + 1)(2s + 1)(0.2s + 1)
由 Go (s ) 可知,P=0,其极坐标图如例1所示。(ω 从 − ∞ → 0 → +∞ )
Im

当ω 从 − ∞ → +∞
-1 ω=0
+∞ Re
1 + Go ( jω ) 旋转0圈,

即N=0 又知P=0,∴ Z = 0 ,闭环稳定

39 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

2.Go (s ) 同例1,但 K = 100 其极坐标图如所示。

Im

-1 ω=0
+∞ Re

可以判断出:N=2,又P=0, ∴ Z = 2 闭环有两个根在右半平面
从以上两例总结出规律:Go ( jω ) 稳定与否看其极坐标图包不包-1点

40 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

K
3. Go ( s) = K=2
s ( s + 1)(0.1s + 1)

前面已说过D形围线不能通过 W (s ) 的零点,现在已知开环有一个极点
∴ 要对D形围线加以改造,如图例3.1。
在虚轴上即在D形围线上, Im
0-

-1 -∞
+∞ Re

0+
例3.1 例3.2
这样就把 s = 0 的极点归到左半平面∴ 仍认为 P = 0 ω = 0− → ω = 0+
s = ε e jθ θ 从− π → π 映射到 Go ( jω ) 平面
2 2
π π
Go ( jω ) 沿无穷大半径从 →− 如图例3.2. 可以判断 N=0∴ Z=0
2 2
41 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

4.Go (s ) 同例1,但 K = 20 其极坐标图如例4所示。N=2 Z=2


Im
0-

-1
-∞
+∞ Re

0+ 例4

小结: Go (s ) 含有一个零极点的情况,闭环稳定与否可以从
其开环极坐标图包不包-1来判断。

42 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

K (T3 s + 1) 2
5.Go ( s ) =
(T1 s + 1)(T2 s + 1) 2 (T4 s + 1)(T5 s + 1)
对数坐标图和极坐标图如下所示。 K变,相应于横轴上下移动

-1
Im
-3
1 1
0° -1 T4 T5
1 1 1
T1 T2 T3
-2
-3
A -1
-90°
B C D O Re

-180°

-270°

-1点的位置有四种情况(即-1点处于A,B,C,D四处),试判断哪
几种情况稳定(-1点位于A,C处闭环稳定,位于B,D处闭环不稳定)

43 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

6(0.33s + 1)
6.非最小相位对象 Go ( s ) = Im
s ( s − 1) 0+
其极坐标图如例6所示

由图可以判断:N=-1(即 -1
+∞
1 + Go ( s ) 逆钟向旋转一圈) -∞ Re

∵N=Z-P,已知P=1 0-
∴ Z = 0 系统稳定。如果K增大,系统总是稳定的。
例6
当K减少至 Go ( jω ) 不包-1,系统就不稳定。

∴ 非最小相位系统稳定与否不能看 Go ( jω ) 是否包-1点.
用Routh判据可以得出:该系统稳定的范围是K>3。

44 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

7.结构不稳定例子 K
Go ( s ) = 2 P=0
s (T1 s + 1)(T2 s + 1)
极坐标图如图例7所示
可判断出 N=2, 由Z=N+P 得 Z=2 , 闭环不稳定
Im

0+ +∞
-1
0- -∞ Re

例7
Tb s + 1
怎样使其稳定呢?加 显然应该 Tb〉Ta
Ta s + 1

45 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

1)当 Tb > T1 > T2 > Ta

Im

1 1 0- -1
T2 Ta B +∞
1 1 -∞ Re
Tb T1 0+

可以通过调整K使-1点处在B,可使系统稳定。

46 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

2)Tb > Ta 但 Tb < T1 < T2 1 1


T1 T2
1 1
Tb Ta

-90°

-180°

-270°

-360°

47 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

3)Ta < T2 < Tb < T1 1


T1
1
Tb
1
Ta
1
T2

-90°

-180°

-270°

-360°

0+

可见2),3)的校正无济于事

48 清华大学自动化系 慕春棣
8、Nyquist稳定判据
自动控制理论

作业:

4.22,4.23, 4.24, 4.25, 4.26,


4.29(思) 4.30(思)

49 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论

Routh判据和Nyquist判据给出系统绝对稳定的信息,但稳定
程度如何,离不稳定边缘还有多远?这是工程上最关心的

由此引出稳定裕量 Im

-1 Re
γ
G o ( jω )

γ = 180  + θ (ω c ) 相角裕量

当相角为− 180  时,开环模<1,取其倒数,再用分贝表示 增益裕量Kg

50 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论

ωc ω0 ω
Kg

-90°

γ
-180°

-270°

-360°
θ (ω 0 ) = −180  L0 = −6db 增益裕量 K g = 6db

1
20 Lg =6 ∴ G0 = 0.5
G0
51 清华大学自动化系 慕春棣
9、相对稳定性(稳定裕量)
自动控制理论

1)上述定义是针对最小相位系统( γ , K g 都是正的)
这两个一正一负,正是非最小相位系统的特征

2)工程上根据经验一般要求 γ ≥ 30 
,30  − 60  之间,

K g > 6db ,主要使用 γ 这一指标。

52 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

1. 从开环对数幅频特性可以判断闭环稳定性
如果开环对数频率特性穿越0分贝时的斜率为-1,并且有一定宽度
我们看如下频率特性

-2
-1 2.5ωc
ωc K ωc
2.5
-4

53 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

-2
2.5
K( s + 1)
ωc -1 2.5ωc
Go ( s ) =
2
s (
1
s + 1) 3
ωc K ωc
2.5ω c 2.5
1 -4
θ (ω c ) = −180 + arctg 2.5 − 3arctg

2.5
= -177.2 

2.5ω
-1段的宽度 ω c = 6.25,
c
2.5

可以看出这种结构和参数几乎是临界情况。如要求闭环系统稳定 Go ( jω )
应以-1斜率穿越0分贝轴,且-1段的宽度为 5 − 10 倍。

54 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

2.从开环对数幅频特性可以判断闭环系统静态特性
-2
-1 2.5ωc
ωc K ωc
2.5
-4

该系统II型,K如何从图上求出?——由K可知系统静特性

ωc K K ω c2
20 lg = 40 lg ∴ = 2.5 ∴K =
ωc ωc ωc 2.5
( )2
2.5 2.5 2.5

55 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

3. 如何从开环对数幅频特性来判断闭环系统的动态特能

开环的中频段决定系统的主要动态性能

稳定裕量与超调的关系
1
有一些近似的关系 M r (闭环峰值)=
sin γ
100( M r − 1) M r ≤ 1.25
σ% = 
 50 M r − 1 M r > 1.25
2000
更粗略 σ% = − 20 (有一定范围)
γ
如果稳定裕量不够应加入怎样的环节?

56 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

剪切频率 ωc与过渡过程时间 t s 的近似关系


K
让我们看 Go ( s) = 系统闭环以后
s
K 1
Go ( s ) = =
s+K 1
s +1
K
t s = 3.
1 ω
K
K
3
=
ωc
如果K ,频带加宽

t s 减小,说明频率尺度与时间尺度成反比关系
4~9
对于复杂系统也有类似关系 t s ≈
ωc

57 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

4. 高、低频段特性与动态性能的关系
低频段主要影响静态特性(系统型次,和K)对动态性能影响很
小。如何提高低频段增益,而不改变中频段的特性?
高频频带宽,阶跃相应上升沿好。高频段要衰减得快些,抑制噪声
5. 介绍几个经验公式
对于以下所示的典型四阶开环特性
斜率=-1

-2
L
-1
γω c γδωc
ωc ωc
ωc
αβ α
-2

-3

58 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

有如下经验公式

 1  3.5 4 100 
t s = 8 − − + 2
 ωc  α β (αγδ ) 

σ (% ) =  160 + 6.5 β + 2 

  γ 2δ  β ∗
= min(β ,10)
  α 
还有经验公式

t s ≈ (4 ~ 9 ) ω c

 64 + 16h
σ (% ) = h是中频-1段的宽度
 h −1
59 清华大学自动化系 慕春棣
自动控制理论
10、从开环频率特性研究闭环系统性能(针对最小相位)

作业:

4.32, 4.33, 4.34, 4.35

60 清华大学自动化系 慕春棣
Chapter 5 Root Locus Method
Contents
5.1 Introduction
5.1.1 Time Domain Methods
5.1.2 Requirements of Analysis and Design Methods
5.1.3 Major Indirect Methods
5.2 Root Locus Plots
5.2.1 An Example 5.2.2 Angle and Magnitude Conditions
5.3 Properties of Root Locus and Their Applications
5.3.1 Properties of Root Locus
5.3.2 Conservation of the Sum of System Poles
5.3.3 Illustrative Examples
5.4 Root Locus Analysis of Control Systems
5.4.1 Conditionally Stable Systems
5.4.2 Comparison study for different Controllers
5.4.3 Effect of poles and Zeros 5.4.4 Parameter RL and Root Contours
5.4.5 Systems with Pure Time Delay
5.5 Complementary Root Locus
2024/2/8 TAC(1), Chap. 5 Root Locus 1
5.1 Introduction
5.1.1 Time Domain Method
—Direct analysis approach
• Best for judging performance
• Too complicated in calculation
• Difficult to predict the performance as
parameters change
• Time consuming
5.1.2 Requirements of Analysis Methods
• Simple and easy to implement
• Easy to predict the system performance
• Possible to indicate better parameters

2024/2/8 TAC(1), Chap. 5 Root Locus 2


5.1.3 Major Indirect Methods
(1) Algebraic Stability Criterion
♦ Routh Stability Criterion
• Easy to investigate absolute stability
• No proper measure of relative stability
• Difficult to judge whether jω

the CL poles reside


in a given region
• No enough clue to parameter selection O σ

ζ 1−ζ 2 s - plane
0 ≤ ζ < 1, s1, 2 =− ± j = −ω nζ ± jω d
T T s=σ+jω

2024/2/8 TAC(1), Chap. 5 Root Locus 3


(2) Frequency Response Method
• Nyquist plot, Bode diagrams, Nichols charts
are available
• Easy to predict the closed loop performance
• Measure of relative stability is available
• Easy to improve the closed loop performance by
modifying open loop frequency response
• Not able to predict closed loop pole allocation
directly according to open loop parameters

2024/2/8 TAC(1), Chap. 5 Root Locus 4


(3) Root Locus Method
♦ What is a root locus?
• A plot of the Roots of the Closed Loop
characteristic equation
as the function of Open-Loop Gain
♦ Why to study the root locus?
• Easy to predict the jω K→∞
CL performances K=0

♦ Possible to study
the root locus? K→∞ K→∞ σ
• Yes. K=0 O K=0
W R Evans,
1948, 1950 K=0
K→∞

2024/2/8 TAC(1), Chap. 5 Root Locus 5


End of Section 1,
Chapter 5

2024/2/8 TAC(1), Chap. 5 Root Locus 6


5.2 Root Locus Plots
5.2.1 An Example
Example 5.2.1 Draw the closed loop root locus for
the given open loop transfer function
K R ( s) + C ( s)
G( s) = G ( s )
s( s + 1) −
Solution:
C ( s) G( s) K
G
• CL TF is CL ( s ) = = =
R( s ) 1 + G ( s ) s 2 + s + K
• CL characteristic equation: s 2 + s + K = 0
• K varies  CL poles change
• CL poles are:
1 1
s1,2 = − ± 1 − 4 K
2 2

2024/2/8 TAC(1), Chap. 5 Root Locus 7


− 1 ± 1 − 4K
s1,2 =
(i) K ≥ 0 2
1 1
K =0 s1,2 = − ± = 0, −1 (OL poles)
2 2

1 1 1 − 4K K→∞
K< s1,2 = − ±
4 2 2
1 1 1 1 K=0 K=0 σ
K= s1,2 = − ± 0 = − , −
4 2 2 2 −1 O

1 1 4K − 1 1
K> s1,2 =− ± j K=
4
4 2 2 K→∞

• Damping property of CL system


K=0 → 0.25 → ∞
Overdamped Underdamped

2024/2/8 TAC(1), Chap. 5 Root Locus 8


−1 ± 1 − 4K
s1, 2 =
(ii) K ≤ 0 2

K =0 s1,2 = 0, −1 (OL poles)


−1± 1+ 4 K
K <0 s1, 2 =
2
s1 ∈ ( −∞,−1] jω
s2 ∈ [0,+∞)

K=0 K=0 σ
K → −∞ − 1 O K → −∞

2024/2/8 TAC(1), Chap. 5 Root Locus 9


5.2.2 Angle and Magnitude Conditions
♦ Assumption: R ( s) + C ( s)
G ( s)
• System configuration −
•K≥0 F (s )
♦ Root locus conditions
• All CL poles satisfy G ( s ) F ( s ) = −1
resulting in
• Magnitude condition:
| G(s)F(s) | = 1
• Angle condition:
arg [G ( s ) F ( s )] = ± (2k + 1) π k = 0, 1, 2, 

2024/2/8 TAC(1), Chap. 5 Root Locus 10


Example 5.2.2 Check if the root locus conditions
are met in Example 5.2.1
Solution: jω
1 s1
• Take arbitrarily s1 = − + j 2 j2
2
(i) Angle condition check
1
arg G ( s1 ) = arg
s1 ( s1 + 1)
= − arg( s1 ) − arg( s1 + 1) θ2 θ1
= −θ1 − θ 2
−1 O σ
2 2 − 0.5
= − arctan − arctan
− 0.5 0.5
= −104.04° − 75.96° = −180°

2024/2/8 TAC(1), Chap. 5 Root Locus 11


K
G( s) =
(2) Magnitude condition check s( s + 1)
K 4K
G ( −0.5 + j 2) = = =1
− 0.5 + j 2 − 0.5 + j 2 + 1 17
17 1
i.e. K = ⇒ CL poles s1 = − ± j 2
4 2
Remarks:
• All CL poles satisfy angle condition
without knowing K
⇒ Angle condition ALONE gives root locus
• Magnitude condition gives K for a given CL pole

2024/2/8 TAC(1), Chap. 5 Root Locus 12


End of Section 2,
Chapter 5

2024/2/8 TAC(1), Chap. 5 Root Locus 13


5.3 Properties of Root Locus and Their Applications
♦ Assumptions: jω
• Sign of argument:
Positive real axis — 0°
Counterclockwise
O σ
— positive direction
• Negative F/B configuration and K ≥ 0
• Only CL root locus on the upper s plane are calculated
♦ Write CL Characteristic Equation in the form
B( s)
1 + G ( s ) F ( s ) = 1 + KW ( s ) = 1 + K
A( s )
K ( s − z1 )( s − zm )
= 1+ =0
( s − p1 )( s − p2 )( s − pn )
and locate the OL poles and zeros in the s plane
2024/2/8 TAC(1), Chap. 5 Root Locus 14
5.3.1 Properties of
Root Locus
1. Starting / Terminating
Points and Number of Branches
♦ Starting points: ( K = 0)
1 1
KW ( s ) = 1 ⇒ W ( s ) = lim =∞
K K →0 K
lim W ( s ) = ∞
K →0

• It is equivalent to ( s − p1 )( s − p2 )( s − pn ) = 0
• All OL poles are starting points

2024/2/8 TAC(1), Chap. 5 Root Locus 15


♦ Terminating points:
( K = ∞)
1
lim =0 lim W ( s ) = 0
K →∞ K K →∞
( s − z1 )( s − z2 )( s − zm ) = 0
• It is equivalent to 
s → ∞ if n > m
• All OL zeros are (finite) terminating points
• If n > m, there are n − m infinite terminating points
♦ Number of Branches
• n branches ← n starting points
where m branches approach to m finite zeros
n − m branches approach to infinity
Remarks: Consider the case of n < m by yourself

2024/2/8 TAC(1), Chap. 5 Root Locus 16


2. Loci on the Real Axis
♦ It depends only on the θ1 jω
real OL poles & zeros s1

• Conjugate OL poles/zeros
s σ
make no contributions O
to the angle condition θ2
θ 1 + θ 2 = 360°
s2

♦ The number of real OL poles and zeros


to the right of loci should be odd
• Case of all real poles / zeros on the left to the test point
z s Angle = 0°, which means that
the test point does
p s
not satisfy angle condition

2024/2/8 TAC(1), Chap. 5 Root Locus 17


• Case of single pole / zero on the right
to the test point Angle = 180° or −180° ,
which means that the
s − 180°
test point satisfies
s 180° angle condition
• Case of 2k poles / zeros on the right
to a real test point
s Angle = ± 180° × 2k,
− 360°
which means that
s
0° the test point does not
s satisfy angle condition
360°
♦ Drawing real
axis root loci ↑
Rightmost pole / zero
2024/2/8 TAC(1), Chap. 5 Root Locus 18
3. Asymptotes of loci as s → ∞
♦ Angle of asymptotes s
• As s → ∞, all angles are the same : γ
arg[G ( s ) F ( s )] s → ∞ = ( m − n )γ
• From arg[G ( s ) F ( s )] = ± ( 2k + 1)π
we have
 ( 2k + 1)π
γ= k = 0, 1, 2,  γ
n−m
• n − m distinct asymptotes
• Angles of asymptotes with the real axis
− ( 2k + 1)π
γ= k = 0, 1, , n − m − 1
n−m

2024/2/8 TAC(1), Chap. 5 Root Locus 19


♦ Real axis intersect of asymptotes

n n
∑ p j − ∑ zi
j =1 i =1
σa =
γ n−m
σ
σa O

2024/2/8 TAC(1), Chap. 5 Root Locus 20


4. Breakaway and break-in points
• Breakaway and break-in points
are equivalent to multiple
CL pole case

♦ Real axis breakaway / break-in points


K=0 K=0 K=∞ K=∞
σ σ
K K

σ σ

K takes maximum K takes minimum


at break-in point at breakaway point
2024/2/8 TAC(1), Chap. 5 Root Locus 21
♦ Calculation
• CL poles satisfy f ( s ) = A( s ) + KB( s ) = 0 (1)
• Multiple CL poles (at least) satisfy
d f ( s) A′( s ) (2)
= A′( s ) + KB ′( s ) = 0 K =−
ds B ′( s )
• Substituting Eqn (2) into Eqn (1) gives
A′( s )
A( s ) − B( s ) = 0
B ′( s )
i.e A( s ) B ′( s ) − A′( s ) B ( s ) = 0 (3)
• Since K = − A( s )
B( s)
dK A( s ) B ′( s ) − A′( s ) B( s ) (4)
=
ds B 2 ( s)

2024/2/8 TAC(1), Chap. 5 Root Locus 22


• Comparing Eqns (3) and
(4) gives the necessary
condition:
dK (5)
=0
ds
NB:
(i) Breakaway / break-in points are only those points
satisfying K > 0
(ii) There may be more than ONE breakaway/break-in
points
(iii) Breakaway / break-in points are not necessarily
on the real axis

2024/2/8 TAC(1), Chap. 5 Root Locus 23


Example 5.3.1 Given
K
G( s) F ( s) =
s( s + 1)( s + 2)
To find the breakaway / break-in points
Solution:
• The characteristic equation is
K = − s( s + 1)( s + 2) = − s 3 − 3s 2 − 2 s
dK
• = −3s 2 − 6 s − 2 = 0 s = − 0.423 , − 1.577
ds
• For s = −0.423
K = − s( s + 1)( s + 2) s = − 0.423 = 0.385 > 0
• For s = −1.577
K = − s( s + 1)( s + 2) s = −1.577
= − 0.385 < 0

2024/2/8 TAC(1), Chap. 5 Root Locus 24


• So s = − 0.423 is the
break-in point
NB:
(i) It is easy to find that −1.557 is not on the root locus,
⇒ it is not a breakaway / break-in point.
− 1.557 − 0.423

−2 −1 0 σ
Root Locus
(ii) When B(s) = 1, the necessary condition is A′( s ) = 0

2024/2/8 TAC(1), Chap. 5 Root Locus 25


5. Angle of Departure from Complex Poles and
Angle of Arrival at Complex Zeros
• These angles are important for drawing root locus
ω 2 , K2
ω1 , K1

• A test point near the complex pole / zero is used


for calculating the angle condition
s s
ϕ pr ϕzr
pr zr
2024/2/8 TAC(1), Chap. 5 Root Locus 26
♦ Angle of departure from a complex pole pr
• A test point s should satisfy s
m ϕ pr
arg G ( s ) F ( s ) = ∑ arg( pr − zi ) pr
i =1 n
− ϕ pr − ∑ arg( pr − p j )
j =1
j ≠r
= ± ( 2k + 1)π
n m
ϕ pr = ±( 2k + 1)π − ∑ arg( pr − p j ) + ∑ arg( pr − zi )
j =1 i =1
j ≠r

2024/2/8 TAC(1), Chap. 5 Root Locus 27


Example 5.3.2 Find the angle of departure for
K ( s + 2)
G( s) F ( s) = 2
s + 2s + 3
Solution: OL poles are p1,2 = −1 ± j 2
• Using formula on the last page
ϕ p1 = ±180°( 2k + 1) − arg( p1 − p2 ) + arg( p1 − z1 ) jω
ϕ p1
= ±180°( 2k + 1) − 90° + 55°
p1 j 2
= 145°
ϕ p 2 = −145° (by symmetry) z1 55°
• Using the angle condition directly −2 −1 σ
90°
55° − ϕ p1 − 90° = 180° p2
ϕ p1 = −215° ϕ p2

2024/2/8 TAC(1), Chap. 5 Root Locus 28


♦ Angle of arrival at a complex zero z r
• A test point s should satisfy
m s
arg G ( s ) F ( s ) = ∑ arg( z r − zi ) + ϕ zr
i =1
ϕzr
i ≠r n zr
− ∑ arg( z r − p j )
j =1
= ± ( 2k + 1)π
n m
ϕ zr = ±( 2k + 1)π + ∑ arg( zr − p j ) − ∑ arg( z r − zi )
j =1 i =1
i ≠r

2024/2/8 TAC(1), Chap. 5 Root Locus 29


6. Imaginary Axis Crossing Points
• Crossing of imaginary axis by root locus
⇒ change of stability status
• The crossing points indicate critical K and
oscillation frequency
• Methods
(i) Routh stability criterion
(ii) Let s = jω . Solve
 Re [ 1 + G ( jω ) F ( jω )] = 0

Im [ 1 + G ( jω ) F ( jω )] = 0
for K and ω .

2024/2/8 TAC(1), Chap. 5 Root Locus 30


Example 5.3.3 Find the crossing points for
K
G( s) F ( s) =
Solution: s( s + 1)( s + 2)
• CL char. eqn: f ( s ) = s 3 + 3s 2 + 2 s + K = 0
(i) Routh criterion
• Routhian array • Critical gain
s3 1 2 6−K =0 K =6
s2 3 K • Aux. Eqn from line s2
s1 (6 − K ) 3 3s 2 + K = 3s 2 + 6 = 0
s0 K s = ±j 2
(ii) f ( jω ) = ( jω ) 3 + 3( jω ) 2 + 2( jω ) + K = 0
2
The above are
 K − 3ω = 0 ω = ± 2 most important
  2
2ω − ω 3 = 0  K = 3ω =6 properties
2024/2/8 TAC(1), Chap. 5 Root Locus 31
5.3.2 Conservation of the Sum of System Poles
♦ Sum of CL poles = Sum of OL poles
if n − m ≥ 2
• f ( s ) = A( s ) + KB( s )
n  n 
= s − ∑ pi s +  + K  s − ∑ z j s
n n −1 m m −1
+ 
i =1  j =1 
• When n − m ≥ 2 i.e. m ≤ n − 2,
n
f ( s ) = s n − ∑ pi s n −1
i =1
+ ∑ terms of (s n −2 , s n −3 ,, s m , s m −1 ,)

2024/2/8 TAC(1), Chap. 5 Root Locus 32


• Suppose the CL poles are
λ 1 , λ 2 , , λ n
then n
f ( s ) = ∏ ( s − λi )
i =1
n
= s − ∑ λi s n −1 + 
n

i =1
n n
• So ∑ λi = ∑ pi
i =1 i =1
♦ Part of CL poles may be found according to
this equation

2024/2/8 TAC(1), Chap. 5 Root Locus 33


5.3.3 Illustrative Examples
Example 5.3.4 Sketch the root locus for

K ( s + 2)
G( s) = 2 F ( s) = 1
s + 2s + 3 j 2
Solution:
K ( s + 2)
(i) G ( s ) F ( s ) = 2 −1
−2 σ
s + 2s + 3
OL poles: p1,2 = −1 ± j 2
OL zero: z1 = −2
Char eqn: f ( s ) = s 2 + 2 s + 3 + K ( s + 2)
= s 2 + ( 2 + K ) s + (3 + 2 K ) = 0
A( s ) s 2 + 2s + 3
K =− =−
B( s ) s+2

2024/2/8 TAC(1), Chap. 5 Root Locus 34


(ii) Starting points: − 1 ± j 2
Terminating points: − 2, ∞ jω
Number of branches: 2
j 2
(iii) Real axis locus: ( −∞, − 2)

−2 −1 σ

(iv) Asymptotes ( n − m = 1, k = 0)
± 180°(2k + 1) ± 180°(2k + 1)
γ= = = −180°
n−m 1
• No need to calculate σ a

2024/2/8 TAC(1), Chap. 5 Root Locus 35


(v) Breakaway points
dK B ( s ) B′( s ) s+2 1
=0 = 2
=
ds A( s ) A′( s ) s + 2s + 3 2s + 2
s 2 + 4s + 1 = 0
s1,2 = −2 ± 3 = −3.732 , − 0.268
• −3.732 is on the root locus and is the
breakaway point
− 3.73 −2 − 0.27 σ
• Check of the sign of the gain
s 2 + 2s + 3
K =− = 5.4641 > 0
s+2
s = −3.732

2024/2/8 TAC(1), Chap. 5 Root Locus 36



(vi) Angle of departure
ϕ p1
ϕ p1 = ±180° − arg( p1 − p2 ) p1 j 2
+ arg( p1 − z1 )
= 145° or − 215° z1 55°
ϕ p 2 = −145° −2 −1 σ
90°
p2
(vii) Imaginary axis crossing
ϕ p2
points
• No crossing points
* Seen from the departure angle and breakaway point
* Seen from the CL Characteristic equation
s 2 + ( 2 + K ) s + ( 3 + 2K ) = 0
with all coefficients positive

2024/2/8 TAC(1), Chap. 5 Root Locus 37


(viii) Root locus plot

j 2

−1 σ
−2

• A part of the circle at centre (−2,0)


with radius 3

2024/2/8 TAC(1), Chap. 5 Root Locus 38


(ix) A simple application: To find the CL poles
with ζ = 0.7 and the corresponding gain ζ = 0.7 jω

• Let s = −ζω n ± jω n 1 − ζ 2
j 2
1−ζ2
= −σ ± jσ σ
ζ −2 −1
= −σ ± j 1.0202σ
then G (s ) =
K ( −σ + j 1.0202σ + 2)
( −σ + j 1.0202σ + 1 − j 2 )( −σ + j 1.0202σ + 1 + j 2 )
1.0202σ 1.0202σ − 2
arg G ( s ) = arctan − arctan
2 −σ 1−σ
1.0202σ + 2
− arctan = −180°
1−σ
2024/2/8 TAC(1), Chap. 5 Root Locus 39

ζ = 0.7
ϕ1
j 2

θ
−2 σ
−σ1 ϕ2
arg G ( s ) = θ − ϕ 1 − ϕ 2 = −180°

tan ϕ 1 + tan ϕ 2
• θ + 180° = ϕ 1 + ϕ 2 tan θ =
1 − tan ϕ 1 tan ϕ 2
2.0408σ 2 − 4σ + 1 = 0
σ1 = 1.666 σ 2 = 0.294

2024/2/8 TAC(1), Chap. 5 Root Locus 40


σ 1 = 1.666 σ 2 = 0.294
• Take σ1 = 1.666 ,
ζ = 0.7 jω
then s = −1.67 ± j 1.70
j 2

• According to σ
−2 −1
magnitude condition,
( s + 1) 2 + 2
K= = 1.34
s+2 s = −1.67 ± j 1.70

• Conclusion:
s = −1.67 ± j 1.70 K = 1.34

2024/2/8 TAC(1), Chap. 5 Root Locus 41


Example 5.3.5 Sketch the root locus for
K
G( s) F ( s) =
s( s + 2.73)( s 2 + 2 s + 2)
Solution:
(i) OL poles: 0, −2.73, −1 ± j 1
CL Characteristic equation: jω
K = − s( s + 2.73)( s 2 + 2 s + 2)
= −( s 4 + 4.73s 3 + 7.46s 2 + 5.46s ) j1
(ii) Starting points:
0, −2.73, −1 ± j 1 − 2.73 − 2 −1 σ
Terminating points: ∞
Number of branches: 4

2024/2/8 TAC(1), Chap. 5 Root Locus 42


(iii) Real axis locus: (−2.73 , 0)
(iv) Asymptotes
± 180°( 2k + 1)
γ =
n−m
± 180°( 2k + 1) jω
= = ±45°, ±135°
4
n m
j1
∑ p j − ∑ zi
j =1 i =1
σa =
n−m − 2.73 − 2 −1 σ
0 − 2.73 − 1 + j1 − 1 − j1
=
4
.
= −1183 − 1.183

2024/2/8 TAC(1), Chap. 5 Root Locus 43


(v) Break-in points
dK
=0 4 s 3 + 14.19 s 2 + 14.92 s + 5.46 = 0
ds
One real root s = −2.0565 jω
K = − A( s ) s = −2.0565
= 2.931 > 0
− 2.0565 j1

− 2.73 − 2 −1 σ

− 1.183

2024/2/8 TAC(1), Chap. 5 Root Locus 44


(vi) Angle of departure
− arg( p3 − p1 ) − arg( p3 − p2 ) − ϕ p 3 − arg( p3 − p4 )
= −135° − 30° − ϕ p 3 − 90° = −180°

ϕ p 3 = 180° − 135° − 30° − 90° jω

= −75°
− 2.0565 j1
ϕ p 4 = 75° jω
p3
j1 −1 σ
30° − 2.73 − 2
135°
p2 − 2 −1 p1 σ
90° − 1.183
p4

2024/2/8 TAC(1), Chap. 5 Root Locus 45


(vii) Imaginary crossing points
f ( s ) = s 4 + 4.73s 3 + 7.46s 2 + 5.46s + K = 0
Let s = jω , then
ω 4 − j4.73ω 3 − 7.46ω 2 + j5.46ω + K = 0
 K + ω 4 − 7.46ω 2 = 0 jω

5.46ω − 4.73ω 3 = 0
ω = ±1.0744 K = 7.28 − 2.0565 j1

(viii) Root locus sketch is


− 2.73 − 2 −1 σ
easily obtained by hand

− 1.183

2024/2/8 TAC(1), Chap. 5 Root Locus 46


(ix) Drawing root loci
with MATLAB
num=[1];
den=[1 4.73 7.56 5.46 0];
rlocus(num,den)

2024/2/8 TAC(1), Chap. 5 Root Locus 47


♦ Some typical root loci

jω jω jω

O σ O σ O σ

jω jω jω

O σ O σ O σ

2024/2/8 TAC(1), Chap. 5 Root Locus 48


♦ More typical root loci

jω jω jω

O σ O σ O σ

jω jω jω

O σ O σ O σ

2024/2/8 TAC(1), Chap. 5 Root Locus 49


End of Section 3,
Chapter 5

2024/2/8 TAC(1), Chap. 5 Root Locus 50


5.4 Root Locus Analysis of Control Systems
5.4.1 Conditionally Stable Systems
Example 5.4.1 Given transfer functions along the OL
K ( s 2 + 2 s + 4)
G( s) = 2
F ( s) = 1
s( s + 4)( s + 6)( s + 1.4 s + 1)
Find the stability ranges of K. jω

Solution:
(i) OL poles: 0 , − 4 , − 6 , − 0.7 ± j 0.714
OL zeros: − 1± j 1.7321
− 2.36

−6 −4 0 σ

Break-in point: − 2.3557

2024/2/8 TAC(1), Chap.5 Root Locus 51


(ii) Imaginary axis crossing points:
f ( s ) = s 5 + 11.4 s 4 + 39 s 3 + ( 43.6 + k ) s 2
+ ( 24 + 2 K ) s + 4 K = 0
11.4ω 4 − ( 43.6 + K )ω 2 + 4 K = 0 (1)

ω [ω 4 − 39ω 2 + ( 24 + 2 K )] = 0 ( 2) jω

K = −0.5ω 4 + 19.5ω 2 − 12 (from (2))


ω 6 − 20.2ω 4 + 92.9ω 2 − 96 = 0
ω1 = 12115
. K1 = 15.54 − 2.36

0 σ
ω 2 = 2.1545 K 2 = 64.74 −6 −4

ω 3 = 3.7538 K 3 = 163.51

2024/2/8 TAC(1), Chap.5 Root Locus 52


(iii) Root locus

(iii) Stability ranges


K < 15.54 64.74 < K < 163.51

2024/2/8 TAC(1), Chap.5 Root Locus 53


5.4.2 Comparison Study for Different Controllers
Example 5.4.2 Comparing the effects of
Derivative control and velocity feedback
in a positional servomechanism with OL TF
1
G( s) =
Solution: s(5s + 1)
(1) Three Loop Configurations
• P-control
R ( s) + C ( s)
5 G ( s)

5 1
GI ( s ) FI ( s ) = =
s(5s + 1) s( s + 0.2)

2024/2/8 TAC(1), Chap.5 Root Locus 54


• PD-control
R ( s) + C ( s)
5(1 + 0.8s) G ( s)

5(1 + 0.8s ) 0.8( s + 1.25)
GII ( s ) FII ( s ) = =
s(5s + 1) s( s + 0.2)
• Velocity feedback
R ( s) + C ( s)
5 G ( s)

1 + 0.8s

GIII ( s ) FIII ( s ) = 5(1 + 0.8s ) = 0.8( s + 1.25)


s(5s + 1) s( s + 0.2)

2024/2/8 TAC(1), Chap.5 Root Locus 55


(2) Root Loci
jω jω

− 0.2 σ .
− 125 − 0.2 σ

Remarks:
• System I s1,2 = − 0.1 ± j 0.995 ζ = 01
.
Heavy oscillation, slow decaying rate
• System II,III s1,2 = − 0.5 ± j 0.866 ζ = 0.5
Better performance could be expected

2024/2/8 TAC(1), Chap.5 Root Locus 56


3. Time
response
• Unit step
response

* System II: derivative of position error is used,


resulting in fast response
* System III : velocity F/B is used, correction is taken
before error occurs,
resulting in smaller overshoot
2024/2/8 TAC(1), Chap.5 Root Locus 57
* The zero causes the
difference between
Systems II and III

R ( s) + C ( s) R ( s) + C ( s)
5(1 + 0.8s) G ( s) 5 G ( s)
− −
1 + 0.8s
5(1 + 0.8s ) 5
G ( s ) CL II = 2 G ( s ) CL =
III
5s + 5s + 5 5s 2 + 5s + 5
1 + 0.8s 1
= 2 = 2
s + s +1 s + s +1
2024/2/8 TAC(1), Chap.5 Root Locus 58
5.4.3 Effect of Zeros and Poles on Root Loci
1. Addition of Zeros
Example 5.4.3 Addition of a zero
• Original open-loop
transfer function and
jω root locus
K
G( s) F ( s) =
−p −p
1 2
σ ( s + p1 )( s + p2 )
p1 > p2 > 0

2024/2/8 TAC(1), Chap.5 Root Locus 59



• Open-loop transfer function
and root loci after adding
σ
a zero − p1 − p2

G (s) F (s) = jω
p1 > p2 > z
K (s + z) − p1 − p2 −z σ

( s + p1 )( s + p2 ) jω
p1 > z > p2 σ
• A zero may move − p1 −z − p2

the root locus jω


to the left
if the zero is z > p1 > p2 σ
properly located − z − p1 − p2

2024/2/8 TAC(1), Chap.5 Root Locus 60


• Step responses for systems with different zeros
7( s + 0.5)
0.5( s + 1)( s + 3)
(blue)
7( s + 2 )
2( s + 1)( s + 3) 7
(red) ( s + 1)( s + 3)
7( s + 4 ) step ( [ 7 ] , [ 1 4 10 ] )
4( s + 1)( s + 3)
(Black)

2024/2/8 TAC(1), Chap.5 Root Locus 61


2. Addition of Poles
Example 5.4.4 Addition of a pole
• Original open-loop
transfer function
jω and root locus
K (s + z)
G( s) F ( s) =
( s + p1 )( s + p2 )
− z − p1 − p2 σ z > p1 > p2

2024/2/8 TAC(1), Chap.5 Root Locus 62


• Open-loop transfer function


and root loci after adding − z − p1 − p2 σ
a pole

G (s) F (s) =
K (s + z) p2 > p3
σ
( s + p1 )( s + p2 )( s + p3 ) − z − p1 − p2 − p3


• A pole may move
the root locus
p3 > z
to the right − p3 − z − p1 − p2 σ

2024/2/8 TAC(1), Chap.5 Root Locus 63


3. Effect of Pole or Zero Movements on Root Loci
Example 5.4.5 Sketch the root loci for following
system with different a
K ( s + 1)
G( s) F ( s) = 2 a>0
s (s + a)
Solution:
• Real axis locus jω

−a −1 σ

• It is important to check if there are


break-in / breakaway points in (−a, −1)

2024/2/8 TAC(1), Chap.5 Root Locus 64


A( s ) s2 (s + a)
K =− =−
B( s) s +1
dK
= 0 ⇒ A( s ) B ′( s ) = A′( s ) B ( s )
ds
s 2 ( s + a ) = (3s 2 + 2as )( s + 1)
2 s 2 + ( a + 3) s + 2a = 0
− ( a + 3) ± a 2 − 10a + 9
s=
4
• Break-in / breakaway points exist if
a 2 − 10a + 9 ≥ 0
i.e. a ≤1 a≥9

2024/2/8 TAC(1), Chap.5 Root Locus 65


(i) a = 10 ≥ 9 s1,2 = −4, −2.5

2024/2/8 TAC(1), Chap.5 Root Locus 66


(ii) a = 9: s1,2 = −3, −3

2024/2/8 TAC(1), Chap.5 Root Locus 67


(iii) a = 8: No break-in & breakaway points

2024/2/8 TAC(1), Chap.5 Root Locus 68


(iv) a = 3

2024/2/8 TAC(1), Chap.5 Root Locus 69


K
(v) a = 1 : G ( s ) F ( s ) =
s2

2024/2/8 TAC(1), Chap.5 Root Locus 70


(vi) a = 0.5

2024/2/8 TAC(1), Chap.5 Root Locus 71


• Minor change in the OL poles may cause
dramatic change in the CL root loci

2024/2/8 TAC(1), Chap.5 Root Locus 72


5.4.4 Parameter Root Locus and Root Contour
• Can we investigate the behavior of CL poles
when parameter other than gain varies ?
• Could we investigate the behavior of the CL poles
when more than one parameters vary ?
1. Parameter Root Locus
• Parameter root locus represents closed loop poles
as function of the specified parameter
• Let the CL characteristic equation be
A(s, K1)+KB(s, K1) = 0
• Rewrite the CL characteristic equation as
P ( s ) + K1Q1 ( s ) = 0
where P(s) , Q1(s) are polynomials, and
K1 might not be the open loop gain

2024/2/8 TAC(1), Chap.5 Root Locus 73


• Then the CL Char. equation is equivalent to
K1Q1 ( s )
1+ = 1 + G1 ( s ) = 0
P(s)
• Parameter root locus can be plotted with
the equivalent OL TF
K1Q1 ( s )
G1 ( s ) =
P( s)
as K1 changes

2024/2/8 TAC(1), Chap.5 Root Locus 74


Example 5.4.6 Given a negative F/B system with OL TF
2( s + 1)
G( s) = 2 a>0
s (s + a)
Investigate the CL stability as a varies.
Solution :
• Closed loop characteristic equation
ϕ ( s ) = s 3 + as 2 + 2 s + 2 = 0
• Closed loop char. equation may be rewritten as
as 2
1+ 3 =0
s + 2s + 2

2024/2/8 TAC(1), Chap.5 Root Locus 75


• Equivalent OL TF
as 2
G1 ( s ) = 3 ω = 1.4142 jω
s + 2s + 2 a =1 a=0

• Parameter root locus j1

OL poles: OL zeros:
0.386 ± j 1.564 0 a = +∞ a=0 a = +∞
−1 O 1 σ
− 0.771 0
• Crossing points with
imaginary axis − j1

ω = 1.4142 a =1 a=0

• Condition of CL stability
a >1

2024/2/8 TAC(1), Chap.5 Root Locus 76


2. Root Contour
• Root contour represents closed loop poles
as function of 2 specified parameters
• Let the CL characteristic equation be
P ( s ) + K1Q1 ( s ) + K 2Q2 ( s ) = 0
where P(s) , Q1(s) , Q2(s) are polynomials
(1) Let K2 = 0 , then P(s) + K1Q1(s) = 0
K Q ( s)
1+ 1 1 = 0
P( s) K1
• Corresponding equivalent OL TF
K1Q1 ( s )
G1 ( s ) F1 ( s ) =
P( s )
• The root locus for K1 = 0 → ∞ represents
the roots of P(s) + K1Q1(s) = 0

2024/2/8 TAC(1), Chap.5 Root Locus 77


(2) Write the CL characteristic
equation as
K 2 Q2 ( s )
1+ =0
P ( s ) + K1Q1 ( s )
• Corresponding OL TF
K 2Q2 ( s )
G2 ( s ) F2 ( s ) =
P ( s ) + K1Q1 ( s )
• OL poles of G2(s)F2(s) :
on the root locus of G1(s)F1(s) K2 K1
• Root locus of G2(s)F2(s)
starts from the root locus
of G1(s)F1(s) for a given K1
• Sets of root loci are formed as K1 varies

2024/2/8 TAC(1), Chap.5 Root Locus 78


Example 5.4.7 Given
K
G( s) = F ( s) = 1 K > 0 a > 0
s( s + a )
Sketch the root contour for varying K and a
Solution:
CL char eqn: s 2 + as + K = 0
(i) Let a = 0, then s2 + K = 0
• The root locus of
K
G1 ( s ) F1 ( s ) = 2
s
coincides with the
imaginary axis

2024/2/8 TAC(1), Chap.5 Root Locus 79


(ii) Set
K = const,
we have
as
1+ 2 =0
s +K

as
• Sketch the root locus of G ( s ) F ( s ) =
s2 + K
OL poles: ± j K OL zero: 0

2024/2/8 TAC(1), Chap.5 Root Locus 80


5.4.5 Systems with Pure Time Delay
G ( s ) F ( s ) = KW ( s ) e −Ts K >0
where W(s) is a rational function
1. Root Locus Conditions
• Let s = σ + jω , then e −Ts = e −Tσ − jTω
• CL characteristic equation: 1 + KW ( s ) e −Ts = 0
KW ( s ) e −Tσ − jTω = −1
• Since  G ( s ) F ( s ) = KW ( s ) e −Tσ =1 
 
 arg[G ( s ) F ( s )] = arg W ( s ) − Tω = − ( 2 k + 1)π 
• We have root locus conditions
 KW ( s ) e −Tσ = 1

 arg W ( s ) = ± (2k + 1)π + ω T k = 0 , 1, 2 , 

2024/2/8 TAC(1), Chap.5 Root Locus 81


2. Properties
(1) Starting points ( K = 0 )
1
lim = ∞ lim W ( s ) e −Tσ = ∞
K →0 K K →0
• All poles of W(s) and points with σ → − ∞
(2) Terminating points ( K → ∞ )
1
lim =0 lim W ( s ) e −Tσ = 0
K →∞ K K →∞
• All zeros of W(s) and points with σ → + ∞

2024/2/8 TAC(1), Chap.5 Root Locus 82


(3) Asymptotes
• When K → 0 and K → ∞ , we have s → ∞ , then
1 ω
arg W ( s ) s→∞ = arg n−m = − ( n − m ) arctan
s σ
♦σ→+∞
jω ω
arctan → 0
σ σ
arg W ( s ) = 0

arg W ( s ) = ± (2k + 1)π + ω T = 0


± ( 2k + 1)π
ω= k = 0 , 1, 2 , 
T

2024/2/8 TAC(1), Chap.5 Root Locus 83


♦σ→−∞
jω ω
arctan →π
σ σ
arg W ( s ) = − ( n − m )π
arg W ( s ) = ± ( 2k + 1)π + ωT = − ( n − m )π
(n − m) ± (2k + 1)
ω=− ⋅π
T
• If n − m is odd 2 kπ
ω= k = 0 , ± 1, ± 2 , 
T
• If n − m is even
( 2k + 1)π
ω= k = 0 , ± 1, ± 2 , 
T
• All asymptotes are parallel to the real axis

2024/2/8 TAC(1), Chap.5 Root Locus 84


(4) Number of branches: infinite
(5) Real axis root locus
• Same as that of G ( s ) F ( s ) = KW ( s )
since ω = 0
(6) Breakaway points
dK d  eTs 
=0 − =0
ds ds  W ( s ) 

2024/2/8 TAC(1), Chap.5 Root Locus 85


Example 5.4.8 Sketch the root locus for system with
open loop transfer function
Ke −Ts
G( s) = F ( s) = 1 T=1
s +1
Solution:

2024/2/8 TAC(1), Chap.5 Root Locus 86


1
(i) Write W ( s ) = jω
s +1 j5π

K = −( s + 1) eTs
(ii) Asymptotes: j3π

σ → +∞
ω = ±π , ± 3π , ± 5π ,  jπ
σ → −∞
σ
( n − m = 1 : odd ) −1
ω = 0, ± 2π , ± 4π , 
(iii) Real axis locus:
(−∞, −1)

2024/2/8 TAC(1), Chap.5 Root Locus 87


(iv) Breakaway point j5π

d
ds
[
− ( s + 1)eTs ] ω = 14.21
K = 14.24
Ts Ts j3π
= −T ( s + 1)e −e
ω = 7.983
= eTs ( −Ts − T − 1) = 0 ω = 2.03 K = 8.04
K = 2.26 jπ
T +1 −2
s=− = −2 σ
T −1
(v) Root locus
* Delay causes
instability

2024/2/8 TAC(1), Chap.5 Root Locus 88


(vi) Root locus for a larger range

2024/2/8 TAC(1), Chap.5 Root Locus 89


End of Section 4,
Chapter 5

2024/2/8 TAC(1), Chap.5 Root Locus 90


5.5 Complementary Root Locus
1. Root Locus Condition for Some Non-minimum
Phase Systems R ( s) + C ( s)
G ( s)
where −
K (1 − T1s )
G( s) = T1 > 0 K > 0 T > 0
s(1 + Ts )
• Angle condition
K (1 − T1s )  K (T1s − 1) 
arg G ( s ) = arg = arg  − 
s(1 + Ts )  s(Ts + 1) 
 K (T1s − 1) 
= π + arg   = ± ( 2k + 1)π
 s (Ts + 1) 
K (T1s − 1)
arg = ± 2 kπ k = 0 , 1, 2 , 
s(Ts + 1)

2024/2/8 TAC(1), Chap.5 Root Locus 91


2. Root Locus Condition for a System Under
Positive Feedback R ( s) + E ( s ) C ( s)
G ( s)
Configuration +
C ( s ) = G ( s ) E ( s ) = G ( s ) [R ( s ) + C ( s ) ]
= G ( s ) R ( s ) + G ( s )C ( s )
C ( s) G( s)
=
R( s ) 1 − G ( s )
• Characteristic equation of CL system: 1 − G ( s ) = 0
G( s) = 1
• Angle condition: arg G ( s ) = ± 2kπ k = 0 , 1, 2 , 
♦ Note: Condition arg G(s) = − (2k+1)π is not
sufficient to plot root locus for some
systems

2024/2/8 TAC(1), Chap.5 Root Locus 92


3. Complementary Root Loci and Complete Root Loci
• Non-minimum phase systems
+ K (1 − T1s ) + − K (T1s − 1)
− s(1 + Ts) − s(1 + Ts)

K >0 K1 = − K < 0
• Positive feedback configuration systems
+ −
KW (s ) − KW (s )
+ −
K >0 K2 = − K < 0
♦ Root locus for negative gain is required
for system analysis

2024/2/8 TAC(1), Chap.5 Root Locus 93


♦ Unified approach
Let a system with negative feedback configuration
have open loop transfer function in the form
K ( s − z1 )( s − zm )
G( s) F ( s) =
( s − p1 )( s − p2 )( s − pn )
0< K <∞ Root loci
−∞< K <0 Complementary root loci
−∞< K <∞ Complete root loci

2024/2/8 TAC(1), Chap.5 Root Locus 94


4. Plotting Complementary Root Loci for a System
Under Negative Feedback Configuration with K < 0
♦ Root locus conditions for K < 0
• CL Characteristic equation
G ( s ) F ( s ) = K W ( s ) = −1 K <0
• Let K′ = − K , then
K ′W ( s ) = 1 K′ > 0
• Root locus conditions:
 K ′W ( s ) = 1

 arg W ( s ) = ± 2kπ , k = 0 , 1, 2 ,
• All properties related to the angle condition
should be modified

2024/2/8 TAC(1), Chap.5 Root Locus 95


♦ Modifications of properties
• Real axis locus

Even number of
• Asymptotes real poles/zeros
± 2 kπ
γ= , k = 0 , 1, 2 , , n − m − 1
n−m
• Angle of departure and Angle of arrival
m n
ϕ pr = ± 2kπ + ∑ arg( pr − zi ) − ∑ arg( pr − p j )
i =1 j =1
j ≠r
m n
ϕ zr = ± 2kπ − ∑ arg( zr − zi ) + ∑ arg( z r − p j )
i =1 j =1
i≠r

2024/2/8 TAC(1), Chap.5 Root Locus 96


Example 5.5.1 Sketch root locus for
K (1 − T1s )
G( s) F ( s) = , K > 0 , T1 > 0 , T > 0
s(Ts + 1)
Solution: • Rewrite OL TF as  1
K1  s − 
− K (T1s − 1)  T1 
G (s) F (s) = =
s (Ts + 1)  1
s s + 
jω  T
K1 = 0 −∞ − KT1
where K1 = <0
K=0 +∞ T
1 1 σ • The root locus for

T T1 0 < K < ∞ is
the complementary root
locus for − ∞ < K1 < 0

2024/2/8 TAC(1), Chap.5 Root Locus 97


Example 5.5.2 Sketch the complete root locus plot
for given system
K
G( s) = , F ( s) = 1
s( s + 1)( s + 2)
Solution:

2024/2/8 TAC(1), Chap.5 Root Locus 98


♦ Some typical complete root loci
jω jω jω

O σ O σ O σ

jω jω jω

O σ O σ O σ

2024/2/8 TAC(1), Chap.5 Root Locus 99


jω jω jω

O σ O σ O σ

jω jω jω

O σ O σ O σ

jω jω jω

O σ O σ O σ

2024/2/8 TAC(1), Chap.5 Root Locus 100


End of Section 4,
and Chapter 5

2024/2/8 TAC(1), Chap.5 Root Locus 101


Chapter 6 Compensator Design
Contents
6.1 Introduction
6.1.1 Necessity of Compensation
6.1.2 Performance Specifications
6.1.3 System Configurations
6.1.4 Design Methods

2024/2/8 TAC(1), Chap.6 Comp Design 1


Contents (cont.)
6.1 Introduction
6.2 Lead Compensation
6.2.1 Phase Lead Network 6.2.2 Characteristics
6.2.3 Lead Comp. by Using RL Method
6.2.4 Lead Comp. by Using Bode Diagrams
6.2.5 Lead Comp. by Using Nyquist Plot
6.3 Lag Compensation
6.3.1 Phase Lag Network 6.3.2 Characteristics
6.3.3 Lag Comp. by Using RL Method
6.3.4 Lag Comp. by Using Bode Diagrams
6.3.5 Lag Comp. by Using Nyquist Plot
6.4 Lag-Lead Compensation
6.4.1 Lag-Lead Network 6.4.2 Characteristics
6.4.3 Lag-Lead Comp. by Using RL Method
6.4.4 Lag-Lead Comp. by Using Bode Diagrams
6.4.5 Expected Open Loop Frequency Response

2024/2/8 TAC(1), Chap.6 Comp Design 2


Contents (cont.)
6.1 Introduction
6.2 Lead Compensation
6.3 Lag Compensation
6.4 Lag-Lead Compensation
6.5 Feedback Compensation
6.5.1 Reduction of the Influences of Environmental Conditions
6.5.2 Simple Feedback May Achieve Good Results

2024/2/8 TAC(1), Chap.6 Comp Design 3


6.1 Introduction
6.1.1 Necessities of Compensation
♦ A system may be unsatisfactory in
• stability
• speed of response
• steady-state error
6.1.2 Performance Specifications
♦ Performance indexes commonly used are
• relative stability: γ , Kg ( ζ , ωn )
• speed of response: ωc ( ζ , ωn )
• accuracy: Kp , Kv , Ka

2024/2/8 TAC(1), Chap.6 Comp Design 4


♦ Engineering specifications
• in time domain: tr , σ , ts
• in frequency domain: ωr , Mr , ωB
♦ Desired values usually adopted are
45° ≤ γ ≤ 60° K g ≥ 10 dB 1.0 < M r < 1.4
0.4 < ζ < 0.7 σ < 25%
• since for a typical 2nd order system, we have
ζ γ σ Mr
0.4 44° 25.4% 1.364
0.7 60° 4.6% 1.002
NB: • High performance means high cost
• Required performance specifications
may be contradictory to each other
2024/2/8 TAC(1), Chap.6 Comp Design 5
6.1.3 System Configurations
1. Cascade Compensation
+
Gc ( s ) Gp ( s )

♦ Features:
• Simple in analysis and design
• Additional amplifier may be required
♦ Compensator types:
• Lag compensator: to raise steady state accuracy
• Lead compensator: to improve transient response
• Lag-lead compensator: to raise steady state accuracy
and response speed
• Bridged-T compensator (Notch filter)

2024/2/8 TAC(1), Chap.6 Comp Design 6


2. Feedback Compensation
+ +
G1 ( s) Gp ( s )
− −
Gc ( s )
F ( s)

♦ Features:
• Multi-loop control scheme
• Complicated in analysis and design
• Special results may be obtained by using simple
compensator

2024/2/8 TAC(1), Chap.6 Comp Design 7


6.1.4 Design methods
1. Root Locus Approach
(1) Poles move the locus to the right

• Resulting in lower system stability

2024/2/8 TAC(1), Chap.6 Comp Design 8


(2) Zeros move the locus to the left

• Resulting in higher stability and fast response


(3) The gain is adjusted such that
the dominant poles correspond to the higher gain,
and ess will decrease consequently
(4) The common specifications used are
ζ , ωn and Kv

2024/2/8 TAC(1), Chap.6 Comp Design 9


2. Frequency Response Approach
(1) The common specifications used are γ , Kg
and static error coefficients
(2) Relations between the frequency response
and system performance:
• Lower frequency - steady state error
• Middle frequency - relative stability
• Higher frequency - speed of response

2024/2/8 TAC(1), Chap.6 Comp Design 10


(3) Unsatisfactory performances and
their improvements
(i) Stable, but ess is too big

Modified freq. resp.

• The middle frequency


response ensures the
stability
• The magnitude of
?
the response at lower
−180° frequency is too low

2024/2/8 TAC(1), Chap.6 Comp Design 11


(ii) Stable, but time response is too slow
Modified freq. resp.

−180°

• The middle frequency response ensures the stability


• But ωc is not high enough

2024/2/8 TAC(1), Chap.6 Comp Design 12


(iii) Stable, but ess is too big and time response
is too slow
Modified freq. resp.

• The middle frequency response ensures the stability


• But the magnitude of the response at lower
frequency is too low
• And ωc is not high enough

2024/2/8 TAC(1), Chap.6 Comp Design 13


(iv) Unstable for any K
• The open-loop frequency response is not
appropriate
• The most parts of the frequency response
should be modified

Types Methods

Lead Frequency response


Lag
Lag-lead Root locus

2024/2/8 TAC(1), Chap.6 Comp Design 14


End of Section 1,
Chapter 6

2024/2/8 TAC(1), Chap.6 Comp Design 15


6.2 Lead Compensation
6.2.1 Phase Lead Network Eo ( s) R2
=
C Ei ( s ) 1
R1
R2 + Cs
1
R1 R 1 +
ei R2 eo Cs
R2 R1Cs + 1
= ⋅
R1 + R2 R1R2 Cs + 1
R1 R2 R1 + R2 R1 + R2
Let C =T =α >1
R1 + R2 R2
1
s+
then Eo ( s ) 1 α Ts + 1 αT • Other expression
= ⋅ =
Ei ( s ) α Ts + 1 1 exists
s+
T
2024/2/8 TAC(1), Chap.6 Comp Design 16
1
s+
αT
6.2.2 Characteristics Gc ( s ) =
1
1. Pole-Zero allocation s+
T
• For any test point
(α > 1)
s = σ + j ω ( ω > 0 ),
s jω
Gc(s) gives leading angle
ϕ = θ1 − θ2 ( ϕ > 0 ) ϕ
• So Gc(s) moves the
root locus to the left
θ2 θ1

1 1 σ
− −
T αT

2024/2/8 TAC(1), Chap.6 Comp Design 17


1 1 + α Ts
Gc ( s ) = ⋅ (α > 1)
2. Bode diagrams α 1 + Ts
1 1 + jαω T
G ( jω ) = ⋅
α 1 + jω T
Lm
1 1 1
αT αT T
0 dB
− 10 lg α ω
− 20 lg α

ϕ
ϕm

0° ωm ω

2024/2/8 TAC(1), Chap.6 Comp Design 18


Lm
1 1 1
• Behaves like a αT αT T
0 dB
high pass filter − 10 lg α ω
− 20 lg α
• LmG ( j0) = −20 lg α < 0 dB
⇒ An additional gain ϕ
is required for ϕ m

steady-state accuracy 0°
ωm ω
1
• ωm = is the
αT
geometrical centre
1 1
of and
T αT

2024/2/8 TAC(1), Chap.6 Comp Design 19


1 1 + jαω T
Gc ( jω ) = ⋅
α 1 + jω T
3. Polar plot
(α > 1)
Im
α −1
ωm α −1
ϕm
sin ϕ m = 2α =
α +1 α +1
ω =0 ω→∞ Re 2α
1α 1 α −1 α −1
ϕ m = arcsin = arctan
α +1 α −1 α +1 2 α
2α 2α

1 + sin ϕ m
• α= • When α = 10 ϕ m = 54.9°
1 − sin ϕ m

2024/2/8 TAC(1), Chap.6 Comp Design 20


♦ Forms to be used in design
1
s+
1 1 + α Ts αT
Gc ( s ) = ⋅ =
α 1 + Ts 1
s+
T 1
s+
K c 1 + α Ts αT
Gc ( s ) = ⋅ = Kc Set − 1/α T as zc
α 1 + Ts 1
s+ and − 1/T as pc
Set Kc / α as Kc T

1 + α Ts s − zc
Gc ( s ) = K c Gc ( s ) = K c
1 + Ts s − pc
with pc / zc = α

2024/2/8 TAC(1), Chap.6 Comp Design 21


6.2.3 Lead Compensation by Using Root Locus Method
1. Ideal Derivative Compensation
• Slow response (Instability) implies that the CL poles
are too near to the imag. axis (in the Right Half Plane)
♦ Remedy: Adding a single zero
( Gc(s) =1+Tds = Td (s+1/Td) )
• moves root loci to the left
• achieves higher stability
♦ Shortcomings:
• Difficult to realize Lm
Gc(s)=1+Td s
• The noise, especially the 1 ω
higher frequency noise, Td
is amplified

2024/2/8 TAC(1), Chap.6 Comp Design 22


2. Phase Lead Compensator
1
s+
αT s − zc
Gc ( s ) = K c = Kc , α >1
1 s − pc
s+
T
• Kc compensates the lower frequency gain
♦ It is desired to have jω
large 1/T
1 1 σ
− −
T αT
• for the effect of the pole of the compensator
on the root locus to be neglected
♦ But a pole far away to the left results in large α ,
and consequently the difficulty in realization

2024/2/8 TAC(1), Chap.6 Comp Design 23


3. Required Lead Angle for a Dominant Pole
• Look at the root locus plot of a plant sd
• Let the expected dominant poles be
sd = −ζω n + jω n 1 − ζ 2
(not on the original root locus)
• The angle condition for the
compensated system should be
arg [ Gp ( sd )Gc ( sd ) ] = arg [ Gp ( sd ) ] + arg [ Gc ( sd )]
= ± (2k + 1)π
• The compensator should provide an angle
ϕ = arg [ Gc ( sd ) ] = ± (2k + 1)π − arg [ Gp ( sd ) ]

2024/2/8 TAC(1), Chap.6 Comp Design 24


• The lead angle actually provided
by a lead compensator is determined
with its pole and zero as follows
P sd
arg[Gc ( sd )] = arg (sd − zc )
ϕ
− arg (sd − pc )
= θ1 − θ2
θ2 θ1
D C
pc zc O

• Proper choices of pc and zc may create


the right lead angle
θ1 − θ 2 = ϕ = ± (2k + 1)π − arg [ Gp ( sd ) ]

2024/2/8 TAC(1), Chap.6 Comp Design 25


4. Selection of pc and zc
(1) Infinite number of solutions
P sd
for a required lead angle ϕ ϕ ϕ

D D C C O

• Different pairs ( zc / pc ) correspond to


different α and different open loop gains
• Different pairs ( zc / pc ) may result in
different realization problems and
different steady state errors

2024/2/8 TAC(1), Chap.6 Comp Design 26


s − zc
Gc ( s ) = K c
(2) Relation between zc , pc and s − pc
static error coefficient
• Before the compensation
lim s Gp ( s ) = K v′ P sd
s →0 ϕ
• After the compensation
zc K
K v = lim s Gp ( s )Gc ( s ) = K v′ K c = K v′ c
s→0 pc α θ2 θ1
D C
• Magnitude condition
pc zc O
sd − zc
Gp ( sd )Gc ( sd ) = Gp ( sd ) K c =1
sd − pc
OD
1 sd − pc 1 DP •α =
Kc = ⋅ = ⋅ OC
Gp ( sd ) sd − zc Gp ( sd ) CP

2024/2/8 TAC(1), Chap.6 Comp Design 27


Kc OD DP
K v = K v′ α= Kc ∝
• 3 different cases: α OC CP

P P P

ϕ ϕ ϕ

D C D C D C

α ↓, K c ↑↑, K v ↑ α ↑↑, K c ↓, K v ↓↓

* Preferred case is that pc ( zc ) moves to the left


to certain extent, which results in Kc ↑ , Kv ↑

2024/2/8 TAC(1), Chap.6 Comp Design 28


(3) Obtaining pc ( zc ) with the smallest α
• Bisector method A P
sd
(1)

(3) ϕ ϕ
2 (3)
2
D (2) C
pc E zc O

• Static velocity coefficient could be calculated as


p PD 1
α= c Kc = ⋅
zc PC Gp ( sd )
Kc
Kv = Kv′
α
2024/2/8 TAC(1), Chap.6 Comp Design 29
5. Example
Example 6.2.1 Given +
4 Gc ( s) Gp ( s)
Gp ( s ) = −
s ( s + 2)
Design a phase lead compensator such that
the desired CL poles have ωn = 4 rad/s and ζ = 0.5
Solution:

(i) Uncompensated system analysis
4
GCL ( s ) = 2 s1
s + 2s + 4
s 1, 2 = −1 ± j 3 −2 σ
ω n = 2 rad/s ζ = 0.5
K v′ = 2 s −1

2024/2/8 TAC(1), Chap.6 Comp Design 30


(ii) Desired CL dominant poles
sd = −ζω n ± jω n 1 − ζ 2 = −2 ± j2 3
• The original CL poles are not on the desired places
• Adjusting K only cannot obtain the right CL poles
• sd is on the left to the original root locus
• Lead compensation is required sd jω
• Let the compensator be
in the form s1
s − zc
Gc ( s ) = K c σ
s − pc −2

2024/2/8 TAC(1), Chap.6 Comp Design 31


4
Gp ( s ) =
(iii) Calculation of the required lead angle s ( s + 2)
 4 
[
arg Gp (−2 + j 2 3) = ]
arg  (−2 + j 2 3) ( j 2 3)  = −210°
 
ϕ = −180°− ( −210° ) = 30°
(iv) Determination of pc and zc
• By bisector method sd
j 3.464
pc = −5.46 zc = −2.93
α = 1.863
s + 2.93 15°
Gc ( s ) = K c 15°
s + 5.46
− 5.46 − 2.93

2024/2/8 TAC(1), Chap.6 Comp Design 32


(v) Determine OL gain
4 K c ( s + 2.93)
Gp ( s )Gc ( s ) =
s ( s + 2) ( s + 5.46)
4 K c ( s + 2.93)
Gp ( sd )Gc ( sd ) =
s ( s + 2) ( s + 5.46) s = −2+ j 2 3
d

4Kc
= =1
18.91
18.91
Kc = = 4.728
4

2024/2/8 TAC(1), Chap.6 Comp Design 33


4 K c ( s + 2.93)
Gp ( s )Gc ( s ) =
(vi) Check of the s ( s + 2) ( s + 5.46)
compensated system
• Root locus

• CL poles:
s 1,2 = −2 ± j 2 3
s3 = −3.46
is near to
zc = −2.93

2024/2/8 TAC(1), Chap.6 Comp Design 34


18.91( s + 2.93)
Gp ( s )Gc ( s ) =
• Static velocity coefficient s ( s + 2) ( s + 5.46)
18.91 × 2.93
K v = lim sGp ( s )Gc ( s ) = = 5.074 s−1
s→ 0 2 × 5.46
• The resulted closed loop system meets
the prespecified requirements
(vii) Further investigation on the time performance

2024/2/8 TAC(1), Chap.6 Comp Design 35


• Before and after compensation

after
comp.
(red)

2024/2/8 TAC(1), Chap.6 Comp Design 36


• Comparison of the compensated system with
a typical 2nd system

(black)
16
G( s) =
s 2 + 4 s + 16
s1,2 = −2 ± j 2 3

2024/2/8 TAC(1), Chap.6 Comp Design 37


6. Summary of Procedure ( for reference only )
(i) Select desired dominant poles according to
ζ and ωn
(ii) Calculate the required lead angle ϕ for the
dominant poles
(iii) Calculate pc / zc from required ϕ and
prespecified Kv
sd (ϕ ) ⇒ infinite solution
sd (ϕ ) ess ⇒ unique solution
(iv) Determine the open loop gain
(v) System performance check and adjustment

2024/2/8 TAC(1), Chap.6 Comp Design 38


6.2.4 Lead Compensation by Using Bode Diagrams
1. Improvements of the performance seen from
the Bode diagrams
K 1 + α Ts
Gc ( s ) = c ⋅
α 1 + Ts
α >1
ω gc
(1) Influence on 0dB
ω gc
relative stability
• Lead compensation
with Kc = 1 0°

⇒ ωgc ↓, γ ↑
− 180° γ γ

2024/2/8 TAC(1), Chap.6 Comp Design 39


(2) Influence on steady-state error & speed of response
• Select two compensators for a plant with
reasonable γ
K c 1 + α Ts
Gc ( s ) = ⋅ K c1 = α K c2 > α
α 1 + Ts

L(ω ) K c2
K c2 > α , >1
α
K c1
K c1 = α , =1
α
0 dB
ω
Kc = 1

2024/2/8 TAC(1), Chap.6 Comp Design 40


• After
compensation L(ω ) K c2
K c2 > α , >1
α
K
K c1 = α , c1 = 1
α
0 dB
ω
ωgc1 ωgc2 Kc = 1

ω
0dB

* Kc1 : ωgc1 ↑,
ω γ1 ↑↑,

Kv unchanged

γ γ1 γ2 * Kc2 : ωgc2 ↑↑,


− 180° γ2 ≈ γ or γ2 ↑,
Kv ↑

2024/2/8 TAC(1), Chap.6 Comp Design 41


2. Example
Example 6.2.2 Given the plant transfer function
5 +
Gp ( s ) = Gc ( s ) Gp ( s )
s(1 + 0.5s ) −
and phase lead compensators
(1 + 0.5s ) 2(1 + 0.5s )
Gc1 ( s ) = Gc2 ( s ) =
(1 + 0.05s ) (1 + 0.05s )
Demonstrate the improvements in relative stability
and steady-state error.
Solution:

2024/2/8 TAC(1), Chap.6 Comp Design 42


5
Gp ( s ) =
s(1 + 0.5s )
(i) Analysis of uncompensated system
Lm
40
− 20
13.98 7.96 ω c′ = 3.16 rad/s
20
10 ω arg Gp (ω c′ ) = −90°
0 dB
1 2ω ′
c − arctan( 0.5 × 3.16)
−4
0
= −147.7°
ϕ
γ ′ = 32.3°
0° K v′ = 5 s −1
ω

γ′
−180°

2024/2/8 TAC(1), Chap.6 Comp Design 43


(ii) With the 1st compensator
Lm
Gp ( s )Gc1 ( s ) =
5 1 + 0.5s
40
13.98 7.96 ×
20
− 20 s (1 + 0.5s ) 1 + 0.05s
Gc1
ω 5
0 dB
10 20 =
1 2ω ′
c
s (1 + 0.05s )
−4
0
GpGc1 −4
ω c1 = 5 rad/s
ω c1 0
arg Gp (ω c1 ) = −90°
ϕ
− arctan(0.05 × 5)

ω = −104.0°
γ 1 = 76.0°
ϕ
γ′
ϕ1
K v1 = 5 s −1
−180°
γ 1′

2024/2/8 TAC(1), Chap.6 Comp Design 44


(iii) With the 2nd compensator Gp ( s )Gc1 ( s ) =
Lm
5 2(1 + 0.5s )
40 ×
− 20
13.98 7.96 Gc 2 s (1 + 0.5s ) 1 + 0.05s
20
Gc1 10
10 20 ω =
0 dB
1 2ω ′ s (1 + 0.05s )
c
GpGc 2
−4
0 ω c2 = 10 rad/s
GpGc1 −4
0
ω c1 ω c 2
arg Gp (ω c2 ) = −90°
ϕ
− arctan(0.05 ×10)

ω = −116.6°
γ 2 = 63.43°
ϕ
γ′
ϕ1 ϕ
2 K v2 = 10 s −1
−180°
γ 1′ γ 2′

2024/2/8 TAC(1), Chap.6 Comp Design 45


(iv) General conclusions
• Phase margin is increased with a phase lead comp.
which has a zero canceling the plant pole
nearest to the origin
• Steady state error may be improved
if the phase lead compensator has a proper gain
• Selecting pole results in the phase margin increase,
however, the amount of the phase margin increase
may be constrained by the fixed zero
• If the pole, zero and gain of the phase lead
compensator are freely selected by the designer,
better phase margin, crossover frequency
and steady state error could be expected

2024/2/8 TAC(1), Chap.6 Comp Design 46


Example 6.2.3 Given
K
Gp ( s ) =
s(1 + 0.1s )(1 + 0.01s )
Design cascade compensator, such that the
system after compensation has
−1
γ ≥ 30° ω c ≥ 45 rad/s K v ≥ 100 s
Solution:
(i) Determine desired OL gain
K v = lim sGp ( s ) = K K = 100
s →0
NB: The gain K = 100 in this step should include
both the plant gain and the compensator gain

2024/2/8 TAC(1), Chap.6 Comp Design 47


100
K c Gp ( s ) =
s(1 + 0.1s )(1 + 0.01s )
(ii) Gain-compensated
Lm
system analysis
40 − 20 ω gc = 10 × 100
20
20
100
= 31.62 rad/s
ω
0 dB
10 γ = 0°
− 20
31.62

60
• Note: By accurate
ϕ
freq. response,

ω we have
ω pc = 31.62 rad/s
K g = 0.8277 dB
−180°

2024/2/8 TAC(1), Chap.6 Comp Design 48


100
K c Gp ( s ) =
s(1 + 0.1s )(1 + 0.01s )
(iii) Required phase lead Lm

angle 40 − 20
20

• After gain-compensated,
20
50 100 ω
0 dB

the lead compensator


10

− 20
to be designed is 31.62 −6
0

Gc ( s ) 1 + α Ts ϕ

= 0°
ω
Kc 1 + Ts
• Let ωc = 50 > 45 rad/s, −180°

then
arg Gp ( j 50) = −90°− arctan 5 − arctan 0.5
= −90°−78.69°−26.57° = −195.26°
• Since required phase margin is γ = 30°, so
lead compensator should provide ϕ = 45°
• Choose ϕ m = ϕ + (5 to 10)° = 55°
2024/2/8 TAC(1), Chap.6 Comp Design 49
Gc ( s ) 1 + α Ts
=
Kc 1 + Ts
(iv) Calculate α L(ω )
1 + sin ϕ m 20 lg α
α= = 10 10 lg α
1 − sin ϕ m 0 dB
1 1 1 ω
αT αT T
ϕ
(v) Calculate T ϕm

• Proper choice of T may



guarantee phase margin ωm ω

ϕ

50 ω

−180°

2024/2/8 TAC(1), Chap.6 Comp Design 50


Gc ( s ) 1 + α Ts
=
Kc 1 + Ts
• Take ωm = 50 rad/s, then L(ω )

1 20 lg α
T= = 0.006325 10 lg α

α ωm 0 dB
1
αT
1 1
T
ω
αT
1
= 158.11
ϕ
ϕm
T
1
αT = 0.06325 = 15.81 0° ωm ω
αT
(vi) Compensator
Gc ( s ) 1 + 0.06325s
=
Kc 1 + 0.006325s
• It keeps the low frequency response unchanged
for retaining Kv = 100 s−1
• NB: The expected gain crossover frequency was
not guaranteed during this step
2024/2/8 TAC(1), Chap.6 Comp Design 51
Gp ( s )Gc ( s ) =
(vii) Final check 100(1 + 0.06325s )
Lm s(1 + 0.1s )(1 + 0.01s )(1 + 0.006325s )
40 − 20 12.05
Gc ( s ) 1 + 0.06325s
20
20 =
100 158 ω Kc 1 + 0.006325s
0 dB
10
s + 15.8
15.8
- 3.98
-11.93 = 10
− 20
−6
s + 158
31.62
0
K c Gp ( s ) =
ϕ
0° 100
ω
s(1 + 0.1s )(1 + 0.01s )
γ
−180°

2024/2/8 TAC(1), Chap.6 Comp Design 52


• By asymptotes:
Lm
− 20
ω gc = 63.3
40 12.05

20
20 γ = 30.8°
0 dB
10
100 158 ω
K v = 100s −1
- 3.98
15.8 -11.93
− 20
31.62 −6
0

ϕ
• By accurate

ω curves:
ω gc = 54
γ γ = 37°
−180° ω pc = 119.7
K g = 11.31

2024/2/8 TAC(1), Chap.6 Comp Design 53


(viii) Further investigations
• Log-magnitude vs frequency curve

2024/2/8 TAC(1), Chap.6 Comp Design 54


• Step responses before and after compensation

• Before comp.
p1 = −109.23
p2,3 = −0.39
± j 30.26
• After comp.
p1 = −203.89
p2,3 = −23.47
± j 62.75
p4 = −17.27
z1 = −15.81

2024/2/8 TAC(1), Chap.6 Comp Design 55


3. Summary of Procedures ( for reference only )
(1) Determine the desired open-loop gain
according to the steady-state error coefficient
(2) Calculate the phase margin of the
gain-compensated system with K included
(3) Determine the required phase lead angle ϕ ,
and take ϕm = ϕ + (5 to 10)°
(4) Calculate
1 + sin ϕ m
α=
1 − sin ϕ m
(5) Calculate
1 α
T= αT =
α ωm ωm
(6) Compensated system check and analysis

2024/2/8 TAC(1), Chap.6 Comp Design 56


6.2.5 Lead Compensation by Using the Nyquist Plot
K c 1 + α Ts
Gc ( s ) = ⋅ α >1
α 1 + Ts
1. Type 0 systems

−1 −1

Kc = 1 Kp ↓ Kc = α > 1 Kg ↓ γ ↓
NB: Phase lead compensator is seldom used for the
plant of type 0, unless the plant possesses
very high Kp or very high γ
2024/2/8 TAC(1), Chap.6 Comp Design 57
2. Type I systems

−1

γ ↑

2024/2/8 TAC(1), Chap.6 Comp Design 58


End of Section 2,
Chapter 6

2024/2/8 TAC(1), Chap.6 Comp Design 59


6.3 Lag Compensator
6.3.1 Phase Lag Network
R1 Eo ( s ) R2Cs + 1
=
Ei ( s ) ( R1 + R2 ) Cs + 1
ei R2
eo
C

R1 + R2
• Let R2C = T, = β >1
R2
1
then s +
Eo ( s ) Ts + 1 1 T
= = ⋅
Ei ( s ) β Ts + 1 β s + 1
βT

2024/2/8 TAC(1), Chap.6 Comp Design 60


1
s+
6.3.2 Characteristics 1 T
Gc ( s ) = ⋅
1. Pole-Zero Allocation β s+ 1
s βT
β >1

1 1
− −
T βT
• Creates lag angle

2024/2/8 TAC(1), Chap.6 Comp Design 61


1 + Ts
Gc ( s ) = β >1
2. Bode diagrams 1 + β Ts
Lm
1 1
βT ωm T ω
0 dB

− 20lg β

1
ϕ
βT ω

ϕm
− 90°
• Behaves like a low-pass filter
• Worsens the transient response in general

2024/2/8 TAC(1), Chap.6 Comp Design 62


Lm
1 1
βT ωm T ω
• Usually works on the 0 dB

low frequency range − 20lg β

for reducing its influence 1


ϕ
on the phase angle 0°
βT ω

at middle frequency
• Additional gain is added ϕ m

− 90°
for avoiding the influence
on the magnitude
at middle frequency,
• Which results in
* Increase of the magnitude at low frequency, and then
* Improvement of steady-state error

2024/2/8 TAC(1), Chap.6 Comp Design 63


1 + Ts
Gc ( s ) = β >1
1 + β Ts
3. Polar plot
β +1 β −1
Im
2β 2β
1
β ω =0
ω→∞ 1 Re
1− β
ωm sin ϕ m =
ϕm 1+ β
1− β
ϕ m = arcsin
1+ β
ϕm < 0 1− β
= arctan
2 β

2024/2/8 TAC(1), Chap.6 Comp Design 64


6.3.3 Lag Compensation by Using
Root Locus Method
1. Integral Compensator
♦ A PI controller
1 s + zc zc
Gc ( s ) = 1 + K I =
s s
• If original plant has fast transient response,
a PI controller can improve ess
by increasing the system type
♦ Advantage of PI controllers
• It reduces the steady-state error
♦ Shortcomings of PI controllers
• It slows down the response speed
• It is difficult to realize a pure integrator

2024/2/8 TAC(1), Chap.6 Comp Design 65


♦ An alternative to a PI controller
• To move the pole away from the origin
• That results in a phase lag
compensator with pc << 1
s − zc zc pc
Gc ( s ) =
s − pc
2. Improvements in Steady-State Error
• Take type I system as example
m m
∏ ( s − zi ) ∏ ( − zi )
i =1 K v′ = K i =1
Gp ( s ) = K n n
s∏ ( s − p j ) ∏ (− p j )
j =1 j =1

2024/2/8 TAC(1), Chap.6 Comp Design 66


m

s+
1 ∏ ( − zi )
K K v′ = K i =1
• Let Gc ( s ) = c ⋅ T n
β s+ 1 ∏ (− p j )
βT j =1
m
K ∏ ( s − zi ) s+
1
K T
• Then Gp ( s )Gc ( s ) = ni =1 ⋅ c⋅
β s+ 1
s∏ ( s − p j ) βT
j =1
m
K ∏ ( − zi ) 1
• Static error
i =1 Kc T
K
• v = ⋅ ⋅ = K v′ K c coefficient will
n β 1 be increased
∏ (− p j ) βT by a factor Kc
j =1

2024/2/8 TAC(1), Chap.6 Comp Design 67


3. Selection of a Pole and a Zero
(1) pc and zc should be very close to each other to
guarantee that the root locus
sd jω
shifts very little
• pc= zc ⇒ the root locus
will not change
• pc ≈ zc ⇒ the root locus has
minor change ϕ
σ
zc pc O
• Conclusion:
pc ≈ zc can guarantee that the root locus is almost
unchanged in the areas around the dominant poles

2024/2/8 TAC(1), Chap.6 Comp Design 68


(2) Kc = β makes dominant poles almost unchanged
s −z
• pc ≈ zc ⇒ d c ≈ 1
sd − pc
• From magnitude condition Gp ( s )Gc ( s ) = 1
m
K ∏ ( sd − zi )
i =1 K c sd − zc
Gp ( s )Gc ( s ) = n
⋅ ⋅
β sd − pc
sd ∏ ( sd − p j )
j =1
m
K ∏ ( sd − zi )
i =1 Kcsd − zc Kc
= ⋅ ⋅ ≈ 1 ⋅ ⋅1 = 1
n β sd − pc β
sd ∏ ( sd − p j )
j =1
2024/2/8 TAC(1), Chap.6 Comp Design 69
Kc = β

• Conclusion: jω
* Kc = β, sd remains almost at K c2 ≠ β
the original place sd
Kc = β
* Kc ≠ β, sd will move to a
new place along
K c1 ≠ β
the new root locus
(3) High accuracy requires that
O σ
the gain of the compensator
and the ratio β = zc / pc to be high
(4) pc and zc should be very close to the origin
• pc ≈ zc for guaranteeing the root locus and
• zc / pc = β >> 1 to achieving higher gain, resulting in
• zc << 1 and pc << 1

2024/2/8 TAC(1), Chap.6 Comp Design 70


4. Example
Example 6.3.1 Given
1.06
Gp ( s ) =
s ( s + 1) ( s + 2)
Design a phase lag compensator such that
the compensated system has Kv = 5 sec−1
with sd almost unchanged
Solution:

2024/2/8 TAC(1), Chap.6 Comp Design 71


1.06
GCL ( s ) = 3
(i) Uncompensated system s + 3s 2 + 2 s + 1.06
analysis

s1, 2 = − 0.33 ± j 0.59 ω n = 0.67 ζ = 0.5


s3 = −2.34 K v′ = 0.53 s −1

2024/2/8 TAC(1), Chap.6 Comp Design 72


K c s − zc
Gc ( s ) = ⋅
(ii) Required additional gain β s − pc
Kv 5 zc / pc = β >> 1
K′ = = = 9.43 ≈ 10
K v′ 0.53
• A lag compensator is required for raising Kv
and attaining sd unchanged
(iii) Lag compensator design
• Take β = K ′ = 10 • Select zc = − 0.1 pc = − 0.01
K c s + 0.1
Gc ( s ) = ⋅
10 s + 0.01
1.06 K c s + 0.1
Gp ( s )Gc ( s ) = ⋅
10 s( s + 1)( s + 2)( s + 0.01)
NB: Kc could be 10 at this stage to meet the required
specifications, but we leave it free for further
investigation
2024/2/8 TAC(1), Chap.6 Comp Design 73
0.106 K c ( s + 0.1)
Gp ( s )Gc ( s ) =
• Root locus of the s( s + 1)( s + 2)( s + 0.01)
compensated system

2024/2/8 TAC(1), Chap.6 Comp Design 74


• Finding dominant poles
* Dominant poles with
ζ = 0.5 by trial and error
s1, 2 = − 0.2896 ± j 0.5016
• Finding compensator gain
with magnitude condition
Gp ( s1 ) Gc ( s1 ) = 1
1.06 K c s ( s + 1)( s + 2)( s + 0.01)
= = 0.9615
10 s + 0.1 s =s1
K c = 9.0708
• Final compensator s + 0.1
Gc ( s ) = 0.9071 ⋅
s + 0.01

2024/2/8 TAC(1), Chap.6 Comp Design 75


s1, 2 = − 0.33 ± j 0.59
(iv) Check of the compensated system ωn = 0.676
s1, 2 = − 0.2896 ± j 0.5016 ( dominant poles ) ← ωn = 0.579
s3 = − 0.1243 ≈ zc
s 4 = −2.3065 = −7.96 × 0.2896 = −7.96σ
K v = 4.8075 < 5 s −1 s + 0.1
Gc ( s ) = 0.9071 ⋅
(v) Further improvements s + 0.01
(a) Smaller | zc | with β = 10 reduces the effect
on the root locus
• For example s + 0.05
Gc1 ( s ) = 0.95 ⋅
s + 0.005
s1, 2 = − 0.314 ± j 0.544 K v = 5.04 s −1

ωn = 0.628
2024/2/8 TAC(1), Chap.6 Comp Design 76
s + 0.1
Gc ( s ) = 0.9071
s + 0.01
(b) Higher β with zc unchanged s1, 2 = −0.33 ± j 0.59
raises steady-state
error coefficient K v = 4.8075 s −1
• For example
s + 0.1 s + 0.05
Gc2 ( s ) = 0.905 ⋅ Gc1 ( s ) = 0.95
s + 0.008 s + 0.005
β = 12.5 s1, 2 = − 0.314 ± j 0.544
K v = 5.04 s −1
s1, 2 = − 0.2885 ± j 0.4997
K v = 5.998 s −1 ↑
ωn = 0.577

2024/2/8 TAC(1), Chap.6 Comp Design 77


(vi) Time responses
• Step responses before and after compensation
with Gc(s)

( Red line -- after compensation )


2024/2/8 TAC(1), Chap.6 Comp Design 78
• Ramp responses before and after compensation (1)

after compensation

2024/2/8 TAC(1), Chap.6 Comp Design 79


• Ramp responses before and after compensation (2)

2024/2/8 TAC(1), Chap.6 Comp Design 80


• Step responses for different compensators

Black –
with Gc2(s)

Red – with Gc(s) Blue – with Gc1(s)

2024/2/8 TAC(1), Chap.6 Comp Design 81


♦ Remarks:
(1) Kv increases by a factor approximately equal to β
(2) Small change of sd is caused by the distance
between pc and zc
s + 0.1
arg Gc ( sd ) = arg
s + 0.01 s = −0.33+ j0.59
0.59 0.59
= arctan − arctan = −7.17°
− 0.23 − 0.32
s + 0.05
arg Gc1 ( sd ) = arg = −3.46°
s + 0.005 s = −0.33+ j 0.59
(3) The response slows down: ωn ↓, ts ↑

2024/2/8 TAC(1), Chap.6 Comp Design 82


5. Summary of Procedures ( for reference only )
(1) Draw the root locus of Gp(s) and find sd
(2) Calculate the required additional gain
(3) Determine pc , zc and Kc
(4) Check the dominant poles with the root locus
of Gp(s)Gc(s)

2024/2/8 TAC(1), Chap.6 Comp Design 83


1 + Ts
Gc ( s ) =
1 + β Ts
6.3.4 Lag Compensation by Using
Bode Diagrams
1
1. Selection of
T
1 ωc  ωc  ωc ω
<   0dB
ωc Kg
T 10  5 
⇒ arg Gc ( jω c ) < 5° Kg

2. Pictorial Explanation ω

(i) For a plant with


high gain − 180° γ γ
• When no additional
gain is added,
then ωc ↓, γ ↑, Kg ↑

2024/2/8 TAC(1), Chap.6 Comp Design 84


1 + Ts
Gc ( s ) = K c
(ii) For a system with 1 + β Ts
high stability
• Additional gain is allowed to raise Kv

0 dB

− 180° γ

2024/2/8 TAC(1), Chap.6 Comp Design 85


3. Example
Example 6.3.2 Given
K
Gp ( s ) =
s(1 + s )(1 + 0.5s )
Design a cascade compensator such
that the compensated system has
γ ≥ 40° K g ≥ 10 dB K v ≥ 5 s −1
Solution:
(i) Determine open loop gain
K v = lim s Gp ( s ) = K = 5
s →0
5
Gp ( s ) =
s(1 + s )(1 + 0.5s )

2024/2/8 TAC(1), Chap.6 Comp Design 86


5
Gp ( s ) =
(ii) Gain-compensated system s (1 + s )(1 + 0.5s )
analysis
Lm
53.98 ω gc = 2.1544
40 − 20
γ = −22.2293°
20 13.98
1.94 ω
0 dB
0.1 1 2 −6 10
0

ϕ
• The CL system

2.15 ω is unstable

ω pc = 1.5
K g = −6
−180°
γ

2024/2/8 TAC(1), Chap.6 Comp Design 87


5
Gp ( s ) =
(iii) Selection of ωgc s (1 + s )(1 + 0.5s )
Lm
53.98
γ = (40 + 12)° = 52° 40 − 20

13.98
arg Gp ( jω ) = 20
1.94 ω
0 dB
0.1 0.5 1 2 − 10
1 60

arg
( jω )(1 + jω )(1 + j0.5ω ) ϕ
2.15 ω

= −90° − arctan ω
− arctan 0.5ω
= −128° −180°
γ

ω = 0.5 rad/s
• Take new crossover freq ωgc = 0.5 rad/s

2024/2/8 TAC(1), Chap.6 Comp Design 88


1 ω gc
(iv) Let = = 0.1 Lm
53.98
T 5 40 − 20
T = 10 20 13.98
(v) Calculate β 0 dB
1.94 ω
0.1 0.5 1 2 − 10
• Gp ( j0.5) ≈ 10 = 20 dB
60

• Lag compensator ϕ
ω
2.15
should reduce the 0°

magnitude at 0.5 rad/s


by 20 dB to assure
ωgc = 0.5 rad/s −180°
γ

• − 20 lg β = −20 β = 10
1 1 + Ts 1 + 10 s
= 0.01 • Gc ( s ) = =
βT 1 + βTs 1 + 100 s

2024/2/8 TAC(1), Chap.6 Comp Design 89


5(1 + 10 s )
Gp ( s )Gc ( s ) =
s (1 + s )(1 + 0.5s )(1 + 100 s )
(vi) Compensated
1 + 10 s
system check Gc ( s ) =
Lm
1 + 100 s
53.98
ω gc = 0.5
40 − 20
γ = 39°
13.98
20
1.94 ω
ω pc = 1.32
0.01
0 dB
0.1 0.5 1 2 10 K g = 11


K v = 5 s −1

60
ϕ
2.15 ω (By accurate

response)
ω gc = 0.454
γ γ = 416. °
−180°
γ ω pc = 1.32
K g = 14.3
2024/2/8 TAC(1), Chap.6 Comp Design 90
(v) Time responses

(red—compensated)
2024/2/8 TAC(1), Chap.6 Comp Design 91
4. Summary of Procedures ( for reference only )
(1) Determine the desired OL gain according
to the steady-state error coefficient
(2) Draw the Bode diagrams of the gain-compensated
system and obtain the gain margin and phase margin
of the system with K included
(3) Choose a new ωgc such that
[ ]
180° + arg KGp ( jωgc ) = γ + (5 to 12)°
1 1 1
(4) select <  to  ωgc
T 5 10 
1 ωgc
at least <
T 2

2024/2/8 TAC(1), Chap.6 Comp Design 92


1
(5) Calculate β and
βT
20lg β

ωc

The lag compensator should make


20 lg Gp ( jωgc )Gc ( jωgc ) = 0
(6) Compensated system check and analysis

2024/2/8 TAC(1), Chap.6 Comp Design 93


6.3.5 Lag Compensation by Using the Nyquist Diagram
1 + Ts
Gc ( s ) = K c
1 + βTs
• For type 0 systems ( as example )
1. Improvement in stability
(with Kc = 1 )

−1
• Kg ↑, γ ↑
For
ω1 1 example
1
βT 1 ω1

T T 10

2024/2/8 TAC(1), Chap.6 Comp Design 94


2. Reduction of ess ( with Kc = β >1 )

−1

Kc = β

• Additional gain ⇒ ess ↓

2024/2/8 TAC(1), Chap.6 Comp Design 95


End of Section 3,
Chapter 6

2024/2/8 TAC(1), Chap.6 Comp Design 96


6.4 Lag-Lead Compensator
• Application
* Used for the plants with poor stability and
poor steady-state accuracy C1
6.4.1 Lag-Lead Network

R1
ei R2 eo
C2

Eo ( s ) ( R1C1s + 1) ( R2C2 s + 1)
=
Ei ( s ) ( R1C1s + 1) ( R2C2 s + 1) + R1C2 s

2024/2/8 TAC(1), Chap.6 Comp Design 97


Eo ( s ) ( R1C1s + 1) ( R2C2 s + 1)
=
• Let R1C1 = T1, Ei ( s ) ( R1C1s + 1) ( R2C2 s + 1) + R1C2 s
R2C2 = T2,
( T1 < T2 usually )
T1
R1C1 + R2C2 + R1C2 = + β T2 ( β > 1)
β
• Then
 1  1
 s +  s + 
Eo ( s ) (T1s + 1) (T2 s = 1)  T1   T2 
= =
Ei ( s )  T1   β  1 
 s + 1 ( β T2 s + 1)  s +   s + 
β   T1   β T2 

2024/2/8 TAC(1), Chap.6 Comp Design 98


 1  1
 s +  s + 
6.4.2 Characteristics Eo ( s )  T1   T2 
=
1. Pole-Zero Allocation Ei ( s )  β  1 
 s +  s + 
 T1   βT2 
1 jω
− ( T2 > T1 )
T2

β σ
1 1
− − −
T1 T1 βT2

• The two pole-zero sets


• Similar to { a lead comp. + a lag comp. }

2024/2/8 TAC(1), Chap.6 Comp Design 99


Eo ( s ) (1 + T1s ) (1 + T2 s )
=
2. Bode diagrams Ei ( s )  T1 
1 + s  (1 + βT2 s )
 β 
Lm
1 1 1 β
( T1 < T2 )
βT2 T2 ω1 T1 T1
0dB
ω
− 20lg β


ω
− 90°

1 • Lag-lead compensator ≈
• ω1 =
T1T2 Lag comp + Lead comp
2024/2/8 TAC(1), Chap.6 Comp Design 100
Eo ( s ) (1 + T1s ) (1 + T2 s )
=
3. Polar plot Ei ( s )  T1 
1 + s  (1 + βT2 s )
 β 
Im

ω1 ω→∞ Re
ω =0 1

• When ω = ω 1 , ϕ = 0

2024/2/8 TAC(1), Chap.6 Comp Design 101


Eo ( s ) (1 + T1s ) (1 + T2 s )
=
• Alternate form Ei ( s )  T1 
1 + s  (1 + βT2 s )
(1 + α T1s ) (1 + T2 s )  β 
Gc ( s ) = K c ⋅ ⋅
(1 + T1s ) (1 + β T2 s )
 1   1 α >1 β >1
s +  s + 
Kα α T1   T2  α = β or α ≠ β
= c ⋅ ⋅
β  1  1 
s +  s + 
 T1   β T2 
 1   1
s +  s + 
 α T1   T2 
Gc ( s ) = K c ⋅ ⋅ (s − z1 ) (s − z2 )
 1  1  Gc ( s ) = K c ⋅ ⋅
s +  s +  (s − p1 ) (s − p2 )
 T1   β T2 
p1 z1 = α z 2 p2 = β
2024/2/8 TAC(1), Chap.6 Comp Design 102
6.4.3 Lag-Lead Compensation by Using the
Root Locus Method
1. Basic Principles
(1) T1 and T2 may be selected separately with T2 / T1 >>1
(2) Lead part:
−1 −β −1 −1
or
T1 T1 αT1 T1
♦ Function: To improve stability and response speed
♦ Selection methods:
• Same as that for lead compensators
• − 1/T1 ( − 1/αT1 ) may be selected to cancel
a plant pole nearest to the origin
for achieving higher stability and fast response

2024/2/8 TAC(1), Chap.6 Comp Design 103


(3) Lag part:
−1 −1
T2 βT2
♦ Function: To improve steady-state accuracy
♦ Selection method: Close to the origin with larger β
2. Example
Example 6.4.1 Given
4
Gp ( s ) =
s( s + 0.5)
Design a compensator such that the
compensated system has
K v = 50 s −1 ωn = 5 ζ = 0.5

2024/2/8 TAC(1), Chap.6 Comp Design 104


4
Gp ( s ) =
s( s + 0.5)
Solution:
(i) Uncompensated system analysis ωn = 5
s1,2 = −0.25 ± j 1.984 ζ = 0.5

ω n = 2 rad/s ζ = 0125
.
K v′ = 8 s −1
Desired
(ii) Desired dominant poles dominnt
pole
sd = −ζω n ± jω n 1 − ζ 2
= −2.5 ± j4.33
− 0.5 σ

2024/2/8 TAC(1), Chap.6 Comp Design 105


K v′ = 8 s −1
(iii) Determination of compensator type ω n′ = 2
• A lag-lead compensator may be required ζ ′ = 0.125
• Let the compensator be in the form
jω K v = 50 s −1
 1  1
s +  s +  ωn = 5
 T1   T2 
Gc ( s ) = K c ⋅ ⋅
 β  1  Desired ζ = 0.5
 s +   s +  dominnt
 T1   β T2  pole

− 0.5 σ

2024/2/8 TAC(1), Chap.6 Comp Design 106


(iii) Required lead angle jω
sd
j 4.33
1
arg [ Gp ( sd )] = arg 
 
s ( s + 0 .5) 
  s=s d
4.33
= − arctan
− 2.5
4.33
− arctan O σ
− 2.5 + 0.5 − 2.5 − 0.5
= −120°−114.8° = −234.8°
• Required lead angle:
ϕ = −180° − (−234.8°) ≈ 55°
NB: At this point, 1/T1 and β may be determined from
the lead angle,
but such 1/T1 and β may not guarantee Kv

2024/2/8 TAC(1), Chap.6 Comp Design 107


 1  1
s +  s + 
(iv) Calculate Kc  T1   T2 
Gc ( s ) = K c ⋅ ⋅
 β  1 
• K v = lim sGp ( s )Gc ( s ) s +  s + 
s→ 0  T1   βT2 
= lim sGp ( s ) K c 4
s→ 0 Gp ( s ) =
s( s + 0.5)
4Kc
= lim = 8K c = 50
s→ 0 0.5
• K c = 6.25
• Kv has been guaranteed in this procedure
(v) Calculate T1 and β
• Assume T2 >> 1, then 1
sd +
T2
≈1
1
sd +
βT2
2024/2/8 TAC(1), Chap.6 Comp Design 108
4
Gp ( s ) =
s( s + 0.5)
• Magnitude condition: 1
sd + sd = −2.5 ± j4.33
T1
Gp ( sd )Gc ( sd ) ≈ Gp ( sd ) ⋅ K c ⋅
β
sd +
T1
1 1
sd + sd +
4 × 6.25 5 T1 T1
= ⋅ = ⋅ =1
sd sd + 0.5 s + β 4.77 s + β
d d
T1 T1
1
sd +
T1 4.77
=
β 5
sd +
T1

2024/2/8 TAC(1), Chap.6 Comp Design 109


1
sd +
• Find T1 by trial and error T1 4.77
=
or by calculation β 5
sd
sd +
∠DPC = 55° P T1
PC 4.77 ϕ = 55°
= 55° 4.77 x
PD 5 5x 4
Gp ( s ) =
s( s + 0.5)

D C
CO = 0.5
−5 − 0.5 O
DO = 5  β  1
−  − 
 T1   T1 
1 β
− = − 0.5 − = −5 i.e. T1 = 2 β = 10
T1 T1
• −1/T1 happens to cancel a plant pole
2024/2/8 TAC(1), Chap.6 Comp Design 110
(vi) Select T2 such that
1  s + 1 
sd +
T2  d T2 
≈1 − 3° < arg   < 0°
1  1 
sd + sd +
βT2  βT2 
• Take T2 = 10
sd + 0.1  sd + 0.1 
≈ 0.9911 arg   = − 0.9°
sd + 0.01  sd + 0.01 
• Finally
( s + 0.5)( s + 0.1)
Gc ( s ) = 6.25
( s + 5)( s + 0.01)

2024/2/8 TAC(1), Chap.6 Comp Design 111


(vii) Check of the compensated system
25( s + 0.1)
Gp ( s ) Gc ( s ) =
s ( s + 5)( s + 0.01)
• Sketch on the upper half plane
* Break-in points:

−2.451, − 0.0051
j4
* Break-away points:
ζ = 0.5
j3 − 0.1989
j2
− 0.1 j1
sd = −2.454 ± j 4.304
− 0.5 σ s3 = − 0.1018 ≈ − 1 T2
−5 −4 −3 −2 −1 0
− 0.01 K v = 50 s −1

2024/2/8 TAC(1), Chap.6 Comp Design 112


• MATLAB drawings

(1) (2)

2024/2/8 TAC(1), Chap.6 Comp Design 113


(viii) Step response before and after compensation

( red - after compensation )


2024/2/8 TAC(1), Chap.6 Comp Design 114
♦ Remarks:
(1) Cancellation of one plant pole by a zero of the lead
part may be used for achieving fast response.
(2) Separate design of lag and lead parts
may be used for this example as well
3. Summary of Procedures ( for reference only )
(1) Select the allocation of the desired dominant pole sd
(2) Calculate the necessary angle increment ϕ
to be offered by the lead part
(3) Let  1  1
s +  s + 
 T1   T2 
Gc ( s ) = K c ⋅
 β  1 
s +  s + 
 T1   β T2 
Decide Kc to meet the error coefficient
2024/2/8 TAC(1), Chap.6 Comp Design 115
(4) Calculate T1 and β according to
1 s + 1 
sd +  d
T1 T1 
Gp ( sd ) ⋅ K c ⋅ =1 arg   =ϕ
β 
β
sd + sd +
T1  T1 

(5) Find T2 such that


1  s + 1 
sd +  d T 
T2 2
≈1 − 3° < arg   < 0°
1  1 
sd + sd +
β T2  β T2 
(6) Compensated system check

2024/2/8 TAC(1), Chap.6 Comp Design 116


(1 + jωT1 )(1 + jωT2 )
Gc ( jω ) = K c
6.4.4 Lag-Lead (1 + jωT1 β )(1 + jωβ T2 )
Compensation by Using the Bode Diagrams
1. Pictorial Lm
Explanation K c2 > 1
K c1 = 1 ωc
• Kc1 = 1, 0 dB
ωc2 ω
ωc1 ↓, γ 1 ↑, ωc1

Kg ↑,
Kv unchanged ϕ
• Kc2 > 1,
ω
ωc2 ↑, γ2 ↑, − 180°
γ1 γ γ2
Kv ↑

2024/2/8 TAC(1), Chap.6 Comp Design 117


2. Design Methods
(1) Method A: Separated design of the lag and
lead parts
1 ωc
• Select < such that  1 
T2 10  j ω c +
T2 
arg   = − (3° ~ 5°)
 jω c + 1 
 β T2 
• Select T1
* Such that 1/T1 cancels one plant pole
* In the same way as in lead compensator
(2) Method B: Choose T1 , T2 and β by experience
• For example , β =10, T2 ≥ T1 , and
T1 is selected as for lead compensators

2024/2/8 TAC(1), Chap.6 Comp Design 118


3. Example
Example 6.4.2 Given
K
Gp ( s ) =
s (1 + 0.1s ) (1 + 0.01s )
Design a cascade compensator such that the
compensated system has
γ ≥ 40° ω c = 20 rad/s K v ≥ 100 s −1
Solution:
(i) Determine the desired open loop gain
K v = lim s Gp ( s ) = K = 100
s →0
100
Gp ( s ) =
s (1 + 0.1s ) (1 + 0.01s )

2024/2/8 TAC(1), Chap.6 Comp Design 119


100
Gp ( s ) =
s (1 + 0.1s ) (1 + 0.01s )
(ii) Gain-compensated
system analysis ω gc
′ = 31.6 rad/s
Lm γ ′ = 0°
60 − 20 ω pc
′ = 31.6 rad/s
40
K g′ = 0.83
20 31.6
20
100
0dB
0.1 1 10 ω
− 20


60
0° ω • The CL
system
is almost
−180° unstable
2024/2/8 TAC(1), Chap.6 Comp Design 120
ω c = 20 rad/s
Lm
γ ≥ 40°
60 − 20

40
20 31.6
20
100
0dB
0.1 1 10 20 ω
− 20

−6
ϕ 0

0° ω

−180°

• arg G ( j 20) = −165°


• Required phase lead angle ϕ = 25°
• Take ϕ m = 40°

2024/2/8 TAC(1), Chap.6 Comp Design 121


100
Gp ( s ) =
s(1 + 0.1s )(1 + 0.01s )
(iii) Design of the lead part Gc1(s)
1 + sin 40°
Lm

α= = 4.599
60 − 20

1 − sin 40° 40
31.6

1 20 20

= αω c = 4.599 × 20 = 42.89 0dB


0.1 10 20
100
ω
T
1
− 20

T = 0.0233 αT = 0.1072 ϕ


60
0° ω

• Lead part of the compensator


should be 1 + 0.107 s
Gc1 ( s ) =
−180°

1 + 0.023s
• Finally, the lead part is selected to be
= 1 + 0.1s s + 10
Gc1 ( s ) = 4.348 α = 4.348
1 + 0.023s s + 43.48
since the zero of the compensator is near
to one pole of the plant
2024/2/8 TAC(1), Chap.6 Comp Design 122
α = 4.348
(iv) Design of the lag part Gc2(s)
• Bode diagrams of
20 13.98 7.237
Gp( jω) Gc1( jω)
Lm(Gc1 )
12.77
* Gp ( j 20) Gc1 ( j 20) 7.96
Lm(GpGc1 )
= 7.96 + 6.02 ≈ 14 dB
10 20 43.48 100 ω
6.02 − 7.234
* At ω c = 20 rad/s Lm(Gp )
− 20
Gp ( j 20) Gc1 ( j 20) Gc2 ( j 20) = 1
Gc2 ( j 20) = −14 dB

* Gc2 ( j 20) = −20 log β − 20 log β = −14 β ≈5


NB: α ≠ β

2024/2/8 TAC(1), Chap.6 Comp Design 123


ω c = 20 rad/s
• Let 1/T2 = ωc /5 = 4, 1/βT2 = 0.8 β ≈5

T2 = 0.25 βT2 = 125 .


1 + 0.25s 1 s + 4
Gc2 ( s ) = = ⋅
1 + 1.25s 5 s + 0.8
• Compensator TF
(1 + 0.1s ) (1 + 0.25s )
Gc ( s ) =
(1 + 0.023s ) (1 + 1.25s )
( s + 10) ( s + 4)
= 0.87 α β = 0.87
( s + 43.48) ( s + 0.8)
(v) Compensated system check
100 (1 + 0.25s )
Gp ( s )Gc ( s ) =
s (1 + 0.01s ) (1 + 0.023s ) (1 + 1.25s )

2024/2/8 TAC(1), Chap.6 Comp Design 124


Gp ( s )Gc ( s ) =
• Bode diagrams 100(1 + 0.25s )
Lm s (1 + 0.01s )(1 + 0.023s )(1 + 1.25s )
60 − 20
41.94
ω c = 20 rad/s
40
31.6 43.48
γ ≥ 40°
20
20
− 13.97 100
K v ≥ 100 s −1
0dB
0.1 1 10 20 − 1.21 ω
− 20
− 6.75
0.8
4
ω gc = 20 rad/s
− 21.21
ϕ


γ = 44.97°

60
K v = 100 s −1
0° ω

ω pc = 62.4 rad/s
γ
−180° K g = 13.05 dB

2024/2/8 TAC(1), Chap.6 Comp Design 125


By asymptotes
ω gc = 20 rad/s
(vi) Accurate log-magnitude freq. resp
γ = 44.97°

By accurate resp. ω gc = 18.50 rad/s γ = 46.75°

2024/2/8 TAC(1), Chap.6 Comp Design 126


(vii) Time response

2024/2/8 TAC(1), Chap.6 Comp Design 127


6.4.5 Expected Open Loop Frequency Response
♦ A typical 4th order OL plant
 s 
K 1 + 
 ω2 
Gp ( s )Gc ( s ) =
 s  s  s 
s 1 +  1 +  1 + 
 ω1   ω3   ω4 
− 20

−4
0

ω3 ω4 ω
ω1 ω2 ωc

• Look back on the


compensated systems

60
2024/2/8 TAC(1), Chap.6 Comp Design 128
K (1 + s ω2 )
− 20 s(1 + s ω1 )(1 + s ω3 )(1 + s ω4 )
−4
0

ω3 ω4 ω
ω1 ω2 ωc


60

− 90°

−180°

− 270°

ω2 ↓ ϕ ↑ γ↑ ω3 ↑ ϕ↑ γ↑
2024/2/8 TAC(1), Chap.6 Comp Design 129
− 20

−4
0

ω3 ω4 ω
ω1 ω2 ωc


60
(1) Middle frequency range
• Slope of −20 dB/decade guarantees stability
• Wide range (ω3 − ω2 ) gives sufficient phase margin
• Higher ωc ⇒ Fast response

2024/2/8 TAC(1), Chap.6 Comp Design 130


− 20

−4
0

ω3 ω4 ω
ω1 ω2 ωc


60
(2) Higher frequency range
• Higher ω3 and ω4 ⇒ Better stability margins
• Lower ω3 and ω4 ⇒ Better noise reduction
(3) Lower frequency range
• Lower ω2
⇒ Better stability
⇒ Response approaching to
the steady-state value varies slowly
2024/2/8 TAC(1), Chap.6 Comp Design 131
• Effect of ω2 on time response
K (1 + s ω 2 )
Gp ( s )Gc ( s ) =
s(1 + s ω1 )(1 + s ω 3 )(1 + s ω 4 )

K = 100
ω 3 = 43 ω 4 = 100
(i) Black:
ω1 = 0.8, ω2 = 4
(ii) Red:
ω1 = 0.4, ω2 = 2
(iii) Blue:
ω1 = 0.2, ω2 = 1

2024/2/8 TAC(1), Chap.6 Comp Design 132


End of Section 4,
Chapter 6

2024/2/8 TAC(1), Chap.6 Comp Design 133


6.5 Feedback Compensation
6.5.1 Reduction of the Influences of Environmental
Conditions
Example 6.5.1 Compare the output variation as
transfer function changes for different types
of system configurations
Solution:
(i) Open loop plant
R ( s) C ( s)
G ( s) C ( s) = G ( s) R ( s)
• Under small change dG(s):
dG ( s ) dG ( s )
dC ( s) = dG ( s) ⋅ R ( s) = ⋅ G ( s ) R ( s ) = ⋅ C ( s)
G ( s) G (s)

2024/2/8 TAC(1), Chap.6 Comp Design 134


(ii) Unity feedback
R ( s) + C ( s) G (s)
G ( s) C (s) = ⋅ R( s)
− 1 + G (s)
[ 1 + G ( s ) ] dG ( s ) − G ( s ) dG ( s )
dC ( s ) = 2
⋅ R( s)
[1 + G ( s ) ]
dG ( s ) 1 G ( s ) dG ( s )
= 2
⋅ R( s) = ⋅ ⋅ ⋅ R( s)
[ 1 + G (s) ] 1 + G (s) 1 + G (s) G (s)
1 dG ( s )
= ⋅ ⋅ C (s)
1 + G (s) G (s)
1
• Influence is reduced by
1+ G ( s)

2024/2/8 TAC(1), Chap.6 Comp Design 135


(iii) Non-unity feedback
R ( s) + C ( s)
G ( s) G (s)
− C (s) = ⋅ R( s)
F (s ) 1 + G (s) F (s)

• If F(s) does not vary


[ 1 + GF ] dG − GF dG dG
dC ( s) = 2
⋅R = 2
⋅R
[ 1 + GF ] [ 1 + GF ]
1 G dG 1 dG ( s )
= ⋅ ⋅ ⋅R = ⋅ ⋅ C (s)
1 + GF 1 + GF G 1 + G (s) F (s) G (s)
• It is designed such that 1 + G ( s ) F ( s ) >> 1
⇒ Influence of dG(s) will be greatly reduced

2024/2/8 TAC(1), Chap.6 Comp Design 136


6.5.2 Simple Feedback May Achieve Good Results
Example 6.5.2 Design different types of compensators
for the open loop transfer function
K
G ( s) =
1 + 01
.s
such that the CL system has steady-state
output C(∞) = 0.9
Solution:
(i) OL analysis ( by final value theorem )
K = 0.9 ⇒ C( ∞) = 0.9
• The system has T = 0.1 sec

2024/2/8 TAC(1), Chap.6 Comp Design 137


K
G( s) =
1 + 0.1s
(ii) Unity feedback
R ( s) + C ( s) T = 0.1
G ( s)

C ( s) K
=
R ( s) 1 + K + 01 .s
K
C (s) = ⋅ R( s)
1 + K + 0.1s
K=9 ⇒ C( ∞) = 0.9 C (s) 9
=
R ( s ) 10 + 0.1s
• CL system has T = 0.01 sec.

2024/2/8 TAC(1), Chap.6 Comp Design 138


K
G( s) =
1 + 0.1s
(iii) Lead compensation
R ( s) +
Gc ( s ) G ( s)
C ( s) T = 0.1

F/B T = 0.01
1 + 0.1s
Let Gc ( s ) = 0.5 ⋅
1 + 0.05s
0.5K
G ( s )Gc ( s ) =
1 + 0.05s
C (s) 9
C ( s) 0.5K =
= R ( s ) 10 + 0.05s
R ( s) 1 + 0.5K + 0.05s
K = 18 ⇒ C( ∞) = 0.9
• CL system has T = 0.005 sec.

2024/2/8 TAC(1), Chap.6 Comp Design 139


K
G( s) =
1 + 0.1s
(iv) Feedback compensation
R ( s) + E ( s) + C ( s) T = 0.1
G ( s)
− −
k F/B T = 0.01

C (s) G (s) K Lead T = 0.005


= =
E ( s ) 1 + kG ( s ) 1 + kK + 0.1s
C (s) K
=
R( s ) 1 + K + kK + 0.1s
For C(∞) = 0.9 K 01
. 1
= 0.9 , = 0.005 =
and T = 0.005 sec: 1 + K + Kk 1 + K + Kk 200
K = 18 k = 0.05556
• A simple feedback achieves the same result
as a lead compensator
2024/2/8 TAC(1), Chap.6 Comp Design 140
K
G( s) =
1 + 0.1s
(v) Feedback lag compensation
R ( s) + C ( s)
G ( s)

k
s+a
C ( s) 10 K ( s + a )
= 2
R ( s) s + (10 + a ) s + 10(a + kK )
For C(∞) = 0.9 and T = 0.005 sec
aK 1
= 0.9 10(a + kK ) = 2 = 40000
a + kK T

2024/2/8 TAC(1), Chap.6 Comp Design 141


C ( s) 10 K ( s + a )
= 2
R ( s ) s + (10 + a ) s + 10( a + kK )
Let ζ = 1, then
ζ 1
s 2 + (10 + a ) s + 10(a + kK ) = s 2 + 2 s + 2 T = 0.005
T T
2
= s + 400s + 40000 aK
= 0.9
K = 9.23 k = 39112
. a = 390 a + kK
• Lag compensator is
k 391 1.00287
Gc ( s ) = = =
s + a s + 390 1 + 0.002564 s
• The effect of a feedback lag compensator is
similar to that of a cascade lead compensator.

2024/2/8 TAC(1), Chap.6 Comp Design 142


• Step Response

2024/2/8 TAC(1), Chap.6 Comp Design 143


Bridged-T Compensator
(1) Bridged-T Network
R2

ei C C eo
R1

Eo ( s) R1CR2Cs 2 + 2 R1Cs + 1
=
Ei ( s ) R1CR2Cs 2 + ( R2C + 2 R1C ) s + 1

2024/2/8 TAC(1), Chap.6 Comp Design 144


Eo ( s) R1CR2Cs 2 + 2 R1Cs + 1
=
(2) Pole Equation Ei ( s ) R1CR2Cs 2 + ( R2C + 2 R1C ) s + 1
R1CR2Cs 2 + ( R2C + 2 R1C ) s + 1 = 0 1
s+
2 R1Cs + 1 2 2 R1C
Let G ′( s ) = 2
= ⋅
R1CR2Cs + R2Cs R2C s s + 1 
 
 R1C 


1 1
− −
R1C 2 R1C
O σ

2024/2/8 TAC(1), Chap.6 Comp Design 145


Eo ( s) R1CR2Cs 2 + 2 R1Cs + 1
=
(3) Zero Equation Ei ( s ) R1CR2Cs 2 + ( R2C + 2 R1C ) s + 1
R1CR2Cs 2 + 2 R1Cs + 1 = 0 1
s+
Let G ′′( s ) = 2 R1Cs + 1 = 2 ⋅ 2 R1C
R1CR2Cs 2 R2C s2
1 jω

2 R1C

O σ
(4) Case of Conjugate Plant Poles
• They may be cancelled out by
a bridged-T compensator

2024/2/8 TAC(1), Chap.6 Comp Design 146


End of Section 5
and Chapter 6

2024/2/8 TAC(1), Chap.6 Comp Design 147


Chapter 7 Analysis of Nonlinear
Control Systems
Contents
7.1 Introduction
7.1.1 Linear Systems and NL Systems
7.1.2 Why to Study Nonlinearity
7.1.3 Classification of Nonlinearities
7.1.4 Some Characteristic Phenomena of NL Systems
7.1.5 Analysis Tools
7.2 Describing Function Method
7.2.1 Definition 7.2.2 Fourier Series
7.2.3 Calculation of DFs 7.2.4 Some Typical DFs
7.2.5 DF Analysis of NL Systems
7.2.6 Summary

2024/2/8 TAC (1), Chap.7 NL Systems 1


7.3 Phase Plane
7.3.1 Introduction
7.3.2 Properties of Phase Plane
7.3.3 Construction of Phase Plane Portraits
7.3.4 Singular Points and Limit Cycles
7.4 Phase Plane Analysis
7.4.1 Analysis of Linear Systems
7.4.2 Analysis of Nonlinear Systems
7.5 Summary

2024/2/8 TAC (1), Chap.7 NL Systems 2


7.1 Introduction
7.1.1 Linear Systems and Nonlinear Systems
1. Main Features of Linear Systems
• Principle of superposition
c1 (t ) = f [r1 (t )] c1 (t ) + c2 (t ) = f [r1 (t ) + r2 (t )]

c2 (t ) = f [r2 (t )] ac1 (t ) = f [ar1 (t )]
• Typical inputs are used to generate TFs
• Complete set of mathematical tools is available
for analysis and design:
e.g. ODE, Laplace transformation, etc.
2. Nonlinear Systems
• Principle of superposition is not applicable
• No unified solution

2024/2/8 TAC (1), Chap.7 NL Systems 3


7.1.2 Why to Study Nonlinearity
(1) Most practical systems are nonlinear
• All linear systems we study are only the
approximations to the practical systems
to a certain extent
• For some systems, the nonlinearities are not
negligible
(2) Special result may be achieved by using
nonlinear control
• Posicast control

2024/2/8 TAC (1), Chap.7 NL Systems 4


• Posicast control
r (t ) r (t )
a +b
a a

t1
c(t ) c(t )
a +b
a

t1 t1

* a, b and t1 have to be chosen properly

2024/2/8 TAC (1), Chap.7 NL Systems 5


7.1.3 Classification of Nonlinearities
♦ Inherent nonlinearity:
system or component possesses, and
unavoidable in systems
♦ Intentional nonlinearity:
deliberately introduced into the system
to perform a specific nonlinear function

2024/2/8 TAC (1), Chap.7 NL Systems 6


1. Continuous Nonlinearities
• Nonlinear differential equation
dn y d n −1 y dy
a0 n + a1 n −1 +  + an −1 + an y = f ( x )
dt dt dt
• Coefficients are functions of system variables
ai
e.g ai = y2
ai = x3
y

2024/2/8 TAC (1), Chap.7 NL Systems 7


• A nonlinear spring y = k1 x + k 2 x 3 (k1 > 0)
2
* y = ( k1 + k 2 )x
x
x has continuous nonlinear coefficient
y y

x x

k 2 > 0 (Stiff spring) k 2 < 0 (Soft spring)

2024/2/8 TAC (1), Chap.7 NL Systems 8


2. Discontinuous Nonlinearities ai
(1) Saturation
( Magnetic amp.,
Electronic amp., y y
Power limitation
in servo motors) ka
− ka x ≤ − a
−a 
a y =  kx − a < x < a
x
 ka x≥a
− ka 
♦ Features:
• Can not give enough output when input is big
• Settling time ↑, dynamic error ↑
• Oscillation usually does not become stronger
due to saturation
2024/2/8 TAC (1), Chap.7 NL Systems 9
(2) Dead zone (Relay amplifier, Actuator)
y
k
k ( x + a ) x ≤ − a
−a 
a x
y=0 −a < x < a
k ( x − a ) x ≥ a
k 

♦ Features:
• No output when input signal is small
• Residual may cause steady-state error
• Oscillation is usually weakened

2024/2/8 TAC (1), Chap.7 NL Systems 10


(3) Relay characteristics
♦ Ideal relay
y
M

− M x<0
y=
x M x≥0
−M

2024/2/8 TAC (1), Chap.7 NL Systems 11


♦ Relay with dead zone
y
M
− M x ≤ − a
−a 
a x
y =  0 −a < x < a
M x≥a
−M

♦ Features:
• Fast switching is offered
• Fast and smooth regulation could be achieved
if used properly
• Oscillation may occur
if used improperly

2024/2/8 TAC (1), Chap.7 NL Systems 12


(4) Hysteresis
y
M − M x<a
y= for x ≥ 0
−a
M x≥a
a x
M x > −a
y= for x < 0
−M
− M x ≤ −a

♦ Features:
• Causes retarded operation
• Causes oscillation

2024/2/8 TAC (1), Chap.7 NL Systems 13


(5) Backlash
y

 k ( x + a) x < 0
−a k y=
a x k ( x − a ) x ≥ 0
k

♦ Features:
• Operation is delayed
• Oscillation may occur

2024/2/8 TAC (1), Chap.7 NL Systems 14


(6) Combined nonlinearities

Frictions, etc.

2024/2/8 TAC (1), Chap.7 NL Systems 15


7.1.4 Some Characteristic Phenomena
of Nonlinear Systems
1. Frequency-Amplitude Dependence
mx + f x = − k1 x − k 2 x 3 k1 > 0

m x
(1) k2 = 0, linear spring:
x f
x0

• Decaying oscillation with constant frequency

2024/2/8 TAC (1), Chap.7 NL Systems 16


mx + f x = − k1 x − k 2 x 3 k1 > 0
(2) k2 > 0, stiff spring:
x
x0

• Decaying oscillation,
frequency decreases m x
as magnitude decreases
(2) k2 < 0, soft spring: f
x
x0

• Decaying oscillation, frequency increases


as magnitude decreases
2024/2/8 TAC (1), Chap.7 NL Systems 17
2. Jump Resonance
mx + f x + k1 x + k 2 x 3 = p
k1 > 0
• Driving force: p = P cos ω t
(1) k2 = 0
p
X
m x

2024/2/8 TAC (1), Chap.7 NL Systems 18


X

(2) k2 > 0
X

ω p
(3) k2 < 0 m x

X f

2024/2/8 TAC (1), Chap.7 NL Systems 19


3. Self-sustained Oscillation
♦ Van der pol equation mx − f (1 − x 2 ) x + kx = 0 ( f > 0)
◊ For large x
• Damping term is
positive
• System consumes
energy
• Motion is
suppressed
◊ For small x
• Damping term is
negative
• System releases energy
• Motion is enhanced

2024/2/8 TAC (1), Chap.7 NL Systems 20


♦ Self-sustained oscillation (Limit cycle)
• Self-sustained oscillation with fixed frequency
and amplitude exists even the outside force is
removed
• Some of the
limit cycles are
stable and some
are unstable
• Multiple limit
cycles may
exist in the
same system

2024/2/8 TAC (1), Chap.7 NL Systems 21


4. Subharmonic Oscillations x y
ω NL
ω k
5. Stability Depends on Initial Conditions
Example 7.1.1 Investigate the stability of a nonlinear
system described by the following equation:
x = − x (1 − x )
Solution:
• Two equilibrium states: x = 0 and x = 1
dx
• When x ≠ 0 and x ≠ 1, we have = −dt
x (1 − x )
• Integrating the above equation gives
−t
x C e
= C e −t x(t ) =
1− x 1 + C e −t

2024/2/8 TAC (1), Chap.7 NL Systems 22


x
= Ce −t
• If x(0) = x0 ≠ 1 , then C = x0 / (1− x0) 1− x
and x 0 e −t Ce −t
x (t ) =
x (t ) = 1 + Ce −t
1 − x 0 + x 0 e −t x

* x0 > 1:
x0
x (t) → ∞ as t → ln
x0 − 1 1
* x0 < 1: x (t) → 0 as t → ∞
• Conclusions: t
* x = 0 is the stable 0
equilibrium state
* x = 1 is the unstable x0
equilibrium state ln
x0 − 1

2024/2/8 TAC (1), Chap.7 NL Systems 23


6. Bifurcation
Example 7.1.2 Undamped Duffing equation
x + ax + x 3 = 0
Solution:
• It is natural for you to think that
the properties of the equilibrium points
may change when a changes
• However, it is hardly to envision that
the number of the equilibrium points
may change as well when a changes

2024/2/8 TAC (1), Chap.7 NL Systems 24


x + ax + x 3 = 0 x + x3 = 0
• a =1> 0 x=0

2024/2/8 TAC (1), Chap.7 NL Systems 25


x + ax + x 3 = 0 x + x3 = 0 x=0
• a =1> 0
xe = 0

2024/2/8 TAC (1), Chap.7 NL Systems 26


x + ax + x 3 = 0 3 0
x =x x=
• a = −1 < 0 ± 1

2024/2/8 TAC (1), Chap.7 NL Systems 27


3 3 0
x + ax + x = 0 x =x x=
• a = −1 < 0 ± 1
x e = ±1

2024/2/8 TAC (1), Chap.7 NL Systems 28


7. Chaos
Example 7.1.3 Differential equation
x + 0.1x + x 5 = 6 sin t
Solution:
• It might be envisioned that
the output changes slightly
when the initial conditions vary slightly
with a deterministic accurate model

2024/2/8 TAC (1), Chap.7 NL Systems 29


(solid)
x ( 0) = 2
x (0) = 3

(dashed)
x (0) = 2.01
x (0) = 3.01

• However, the system output is extremely sensitive to


initial condition variations

2024/2/8 TAC (1), Chap.7 NL Systems 30


• It might be impossible to predict the output change
when the initial conditions vary slightly
even with deterministic accurate model ■
2024/2/8 TAC (1), Chap.7 NL Systems 31
7.1.5 Analysis Tools
(1) Linearization
(2) Describing function
(3) Phase plane analysis
(4) Lyapunov’s second method
(5) Computer simulation

2024/2/8 TAC (1), Chap.7 NL Systems 32


End of
Section 1, Chapter 7

2024/2/8 TAC (1), Chap.7 NL Systems 33


7.2 Describing Function Method
7.2.1 Definition
♦ System configuration
r + e y c
NL Linear Plant

♦ Assumption:
• Most linear systems are low pass filters
• c consists mainly of the lower frequency
components

2024/2/8 TAC(1), Chap.7 NL Systems 34


• The nonlinearity can be regarded as
X sin ω t Y1 sin(ω t + ϕ1 )
NL
where, Y1 : Amplitude of the fundamental
harmonic component of the output
ϕ1 : Phase shift of the fundamental
harmonic component of the output
• Then the NL system is approximated
with a linear system
♦ Describing function
• Let x = X sin(ω t ) Y1 jϕ 1
N= e
X
• A function which approximately describes
nonlinearity characteristics

2024/2/8 TAC(1), Chap.7 NL Systems 35


7.2.2 Fourier Series
1. Definition
y (t ) : Bounded integrable function with period T,
( There are finite maxima and minima within T )
then
A0 ∞
y (t ) = + ∑ [ An cos(nω t ) + Bn sin( nω t )]
2 n =1
A0 ∞
= + ∑Yn sin( nω t + ϕ n )
2 n =1
1 2π
An2 + Bn2
π ∫0
An = y (t ) cos(nω t ) d(ω t ) Yn =

ω= An
T 1 2π ϕ n = arctan
Bn = ∫ y (t ) sin( nω t ) d(ω t )
π 0 Bn

2024/2/8 TAC(1), Chap.7 NL Systems 36


2. Properties:
(1) y(t) — Odd function
( y(t) = −y(− t) )
y
An = 0
ωt

(2) y(t) — Even function


( y(t) = y(− t) )
y

ωt
Bn = 0

2024/2/8 TAC(1), Chap.7 NL Systems 37


(3) y (t) — Half-wave symmetric function
y
2π ω t
π ( y (ω t) = −y (ω t + π ) )

A2 k = 0 B2 k = 0

2024/2/8 TAC(1), Chap.7 NL Systems 38


7.2.3 Calculation of Describing Functions
1. Types of Describing Functions
(1) Single-valued y y
odd Nonlinearity
( memoryless )
x t
• Output:
Odd function
• Then An = 0 x

Y1 (ω ) = B1 sin ω t

2024/2/8 TAC(1), Chap.7 NL Systems 39


(2) Multi-valued
nonlinearity y y
• Output: Half-wave
symmetrical
function x t

• Then
A0 = A2 k = B2 k = 0
Y1 (ω ) = A1 cos ω t x

+ B1 sin ω t

2024/2/8 TAC(1), Chap.7 NL Systems 40


(3) General forms of describing functions
• Single-valued, symmetric about the origin
B1
N=
X
• Hysteresis and backlash
Y1 jϕ 1
N= e
X

2024/2/8 TAC(1), Chap.7 NL Systems 41


2. Calculation of Describing Functions
Example 7.2.1 Find the y y
describing function of
k
a dead zone and x
saturation nonlinearity D S αd α s ωt
Solution:
(i) Let x (t ) = X sin ω t
X
NL -- symmetric αd
αs
x

and momeryless.
⇒ Output -- odd
function and
only B1 is to be
calculated ωt

2024/2/8 TAC(1), Chap.7 NL Systems 42


(ii) Two important angles:
D y y
• dα = arcsin
X k
when ω t > α d x
D S α dα s ωt
y = k ( x − D)
S
• α s = arcsin
X X
α x
when ω t > α s d
αs
y = k ( S − D)

ωt

2024/2/8 TAC(1), Chap.7 NL Systems 43


y
(iii) Calculation of B1
1 2π
• B1 = ∫0 y (t ) sin ω t dω t
π
α dα s ωt
4 π / 2
= ∫ y (t ) sin ω t dω t
π 0

4  αs π /2
= ∫ k ( X sin ωt − D) sin ωt dω t + k ( S − D) ∫ sinωt dω t 
π  α d αs 
= ( Omitted )
2kX  1
= α s − α d − (sin 2α s − sin 2α d )
π  2
2S 2D 
+ cos α s − cos α d 
X X 

2024/2/8 TAC(1), Chap.7 NL Systems 44


D
• sin α d = ⇒
X 2
D D D
sin 2α d = 2 sin α d cos α d = 2 cos α d = 2 1 −  
X X X
2
s s S S
sin α s = ⇒ sin 2α s = 2 cos α s = 2 1 −  
X X X X
2kX  1 
B
• Then 1 = α s − α d + (sin 2α s − sin 2α )
d 
π  2 
kX
= [2α s − 2α d + sin 2α s − sin 2α d ]
π
B1 k  S D
(iv) N = = [2α s − 2α d + sin 2α s − sin 2α d ] = f  , 
X π X X
( X ≥ S)

2024/2/8 TAC(1), Chap.7 NL Systems 45


y
(1) Pure dead zone k
π x
• S → ∞ ( or X < S ), α s = sin 2α s = 0
k 2 D
• N = [2α s − 2α d + sin 2α s
π 1.0
− sin 2α d ]
k
= [π − 2α d − sin 2α d ]
π N
k
=k−
2k 
2
D D D
arcsin + 1 −   
π  X X  X  
0 D 1.0
( X ≥ D) X

2024/2/8 TAC(1), Chap.7 NL Systems 46


y
(2) Pure saturation k
x
• D = 0, α d = 0 sin 2α d = 0 S
k
• N = [2α s − 2α d + sin 2α s
π 1.0
− sin 2α d ]
k
= [2α s + sin 2α s ] N
π
k
2k  S S S
2
= arcsin + 1 −   
π  X X  X  
( X ≥ S) 0 S 1.0
X

2024/2/8 TAC(1), Chap.7 NL Systems 47


7.2.4 Some Typical Describing Functions
1. Ideal Relay (On-off nonlinearity)
1 2π
• B1 = ∫0 y (t ) sin ω t dω t y y
π M

2 π
= ∫
π 0
M sin ω t dω t x t

2M π
=
π ∫0 sin ω t dω t x

2M
= [− cos ω t ] π0
π
4M
=
π
t

2024/2/8 TAC(1), Chap.7 NL Systems 48


4M
4M B1 =
•N= π
πX N

M
0 X
1 πX
• − =−
Im
N 4M

Re
X →∞ 1 X =0

N

2024/2/8 TAC(1), Chap.7 NL Systems 49


2. On-off Relay with Hysteresis
• x(t ) = X sin ω t M
y y

− M 0 ≤ t < t1 , ω
=T

• y= t2 < t ≤ T −h h x t1 π t2 t
M t1 < t ≤t2 ω
 −M

h X
• ω t1 = arcsin t1 x
X
h ωT
ω t2 = arcsin +
X 2 t2
T
= ω  t1 + 
 2 t

2024/2/8 TAC(1), Chap.7 NL Systems 50


h
4M − j arcsin
•N= e X ( X ≥ h)
πX

ϕ1
4
π
hN − 90°
M

0 h 1.0
X

2024/2/8 TAC(1), Chap.7 NL Systems 51


h
4M − j arcsin
X
h N= e
1 πX j arcsin πX
• − =− e X ( X ≥ h)
N 4M
πX πX   h
2
h 
=− (cosϕ + j sinϕ ) = − 1−   + j
4M 4M   X X
 
( ϕ = arcsin(h X ) )
Im
2 2
 1  π X − h Re
• Re −  = −
 N 4M πh1

1 X →∞ X = h1 4M
 1 πh −
Im −  = − N
 N 4M −
πh2
X →∞ X = h2 4M

2024/2/8 TAC(1), Chap.7 NL Systems 52


3. On-off Relay with
y 2h y
Dead Zone and M

π
Hysteresis −∆ ω ω t
• x(t ) = X sin ω t ∆ x t1 t2

−M
0 0 ≤ t < t1 ,
 π
x
t1
 t2 ≤ t < + t1 ,
 ω
 π 2π t2
• y= + t2 ≤ t ≤
 ω ω
M t1 ≤ t <t2
 π π
t

− M + t1 ≤ t < +t2
 ω ω

2024/2/8 TAC(1), Chap.7 NL Systems 53


4hM
a1 = −
a1 πX
2 2 j arctan
 a1  +  b1  e b1 2M 
2 2
• N =     b1 = 
 1− 
∆−h
 + 1 − 
∆+h
 
X X πX 
  X   X  
( X ≥ ∆ + h) α =0

or ϕ1
0.4 0.2
N=
2 M jθ 2
πX
(
e + e − jθ1 ) α = 0.8
− 50°
N α =0
( X ≥ ∆ + h) β
∆−h 0.2
θ1 = arcsin 0.8 h
X α=
θ 2 = arcsin
∆+h ∆
X M
0 1.0 β=
∆ ∆
X
2024/2/8 TAC(1), Chap.7 NL Systems 54
1
• − ( X ≥ ∆ + h)
N

m→∞

X =∆+h
h
m = 1+

( h = 0.6, M = 1)

2024/2/8 TAC(1), Chap.7 NL Systems 55


4. Backlash y y 3π π
+t
• x(t ) = X sin ω t 2ω ω 1
h
−h t
x − h π h x t1
0≤t< 2π
 2ω −h
ω
 π
X − h π π
≤ t < t1 X 2ω ω
 2ω x
 3π
• y = x + h t1 ≤ t <
 2ω t1

h − X 3π π
≤ t < t1 +
 2ω ω

x − h π 2π t
t1 + ≤ t ≤
 ω ω

2024/2/8 TAC(1), Chap.7 NL Systems 56


 2
1  4h  2h   2h   2h 
• N=  −   1 −  + π − arccos1 − 
π  X  X   X   X
 2h  2 4h   0°
+ j   −  
 X  X   ϕ1
10
.
( X ≥ h)

N − 90°

0 h 10
.
X
2024/2/8 TAC(1), Chap.7 NL Systems 57
1 Im
•− ( X ≥ h)
N −1 Re
X →∞
1

N

5. Dead zone Im
1 X =h
1 −
− k
N Re
X =D X →∞

6. Saturation 1 Im
1 −
− k
N Re
X →∞ X =S

2024/2/8 TAC(1), Chap.7 NL Systems 58


For cascade nonlinearities as follows
x y z
N1 ( X ) N 2 (Y )

• It is usual that
Z1
≠ N 2 (Y ) N 1 ( X )
X

2024/2/8 TAC(1), Chap.7 NL Systems 59


M1 M2
• x y z

M2
x z

K1 K2
• x y
∆1 ∆2 z

K K = K1K 2
x ∆ z
∆2
∆ = ∆1 +
K1

2024/2/8 TAC(1), Chap.7 NL Systems 60


For parallel nonlinearities as follows
N1 ( X )
x
y +
c c( x) = y ( x) + z ( x)
N 2 (Y ) z + C1 = Y1 + Z1

C1 Y1 Z1
then N = = + = N1 + N 2
X X X
y k1
y
x k2
k1
y D x
k2 − k1

D x

2024/2/8 TAC(1), Chap.7 NL Systems 61


7.2.5 Describing Function Analysis of Nonlinear
Systems
1. Basis for Describing Function Analysis
r + e c
NL element Plant

• Most plants are low pass filters
• Mainly lower frequency components are
acting in the loop
• Equivalent block diagram:
R( jω ) + e C( jω )
N (E) Gp ( jω )

2024/2/8 TAC(1), Chap.7 NL Systems 62


D( s) + N ( s)
1 + G( s) =
2. Stability Analysis D( s)
(1) Nyquist criterion (A revision)
• z − p0 = N
z — No. of closed-loop poles in the RHP
p0 — No. of unstable open-loop poles
N — No. of clockwise encirclements of
point (−1, j 0) by G( jω)
• Closed-loop stability requires:
N = −p0 : for encirclements in the
clockwise direction
N = p0 : for encirclements in the
counterclockwise direction

2024/2/8 TAC(1), Chap.7 NL Systems 63


(2) The equivalent CL frequency response function
of the nonlinear system
C ( jω ) N ( X )Gp ( jω )
=
R ( jω ) 1 + N ( X )Gp ( jω )
• Char. Eqn: 1 + N ( X )Gp ( jω ) = 0
(3) Stability conditions
• Suppose that Gp( jω) is a minimum phase
system, i.e. p0 = 0

2024/2/8 TAC(1), Chap.7 NL Systems 64


♦ Stability conditions by N ( X )Gp ( jω )

−1 −1 −1

NGp ( jω )
NGp ( jω ) NGp ( jω )

• NGp( jω) encircles point (−1, j 0) ⇒ Unstable


• NGp( jω) does not encircle point (−1, j 0) ⇒ Stable
• NGp( jω) passes through point (−1, j 0)
* Critically stable
* Self-sustained oscillations exist
!! However, a usable N (X)Gp( jω) is not able to be
sketched if X is unknown

2024/2/8 TAC(1), Chap.7 NL Systems 65


N ( X )Gp ( jω ) = −1

♦ Stability conditions by Gp ( jω )

and −1/N(X) 1
Gp ( jω ) = −
Gp ( jω ) Gp ( jω ) Gp ( jω ) N(X )

1 1
− −
N 1 N

N

Unstable Critically stable Stable

• Gp ( jω ) crosses − 1 N ⇒ Critically stable


Self-sustained oscillations
• Gp ( jω ) does not encircle − 1 N ⇒ Stable
• Gp ( jω ) encircles − 1 N ⇒ Unstable

2024/2/8 TAC(1), Chap.7 NL Systems 66


3. Self-sustained Oscillations
(1) Determination of
Gp ( jω )
Self-sustained Oscillations
• Gp( jω) locus crosses
the –1/N locus c
⇒ Oscillations 1
• Crossing point gives −
N
the frequency and amplitude

2024/2/8 TAC(1), Chap.7 NL Systems 67


(2) Stable and Unstable
Operating Points
Gp ( jω )
• a: Unstable operating point
* amplitude at input of
nonlinearity is X = a X =b c a
* Gp(s) encircle −1 / N(a) 1

* N(a)Gp(s) encircle −1 + j 0 N
• b: Stable operating point
• c: X = c
Critical operating point

2024/2/8 TAC(1), Chap.7 NL Systems 68


(3) Stable or Unstable Oscillations

Gp ( jω )

X →∞ E B A represents
F unstable
1
− oscillation
N B represents
C
A stable
X =0 D
oscillation
• A & B: Self-sustained oscillations
• C, D, E, F : Oscillations with their respective
amplitudes Xs

2024/2/8 TAC(1), Chap.7 NL Systems 69


• C: G p ( jω ) encircles –1/N
-- Unstable condition: X is increasing G ( jω )
p

-- Point C will move towards point B.


E B
• D: G p ( jω ) does not encircle –1/N X →∞
F
-- Stable condition: X is decreasing −
1
N
-- System becomes more stable. C
• F: G p ( jω ) encircles –1/N X =0 D
A

-- Unstable condition: X is increasing


-- Point F will move towards point B.
• E: G p ( jω ) does not encircle –1/N
-- Stable condition: X is decreasing
-- Point E will move towards point B.
♦ Conclusion:
• Around A -- Unstable self-sustained oscillation
• Around B -- Stable self-sustained oscillation
2024/2/8 TAC(1), Chap.7 NL Systems 70
(4) Calculation of Self-sustained Oscillations
(i) Graphical method
(ii) Analytical method
• CL Characteristic equation
1 + N ( X )Gp ( jω ) = 0
• When N(X) is a real function

Im Gp ( jω ) = 0 ⇒ ω 1

N
1
Re Gp ( jω ) = −
N(X )
⇒ X Gp ( jω )

2024/2/8 TAC(1), Chap.7 NL Systems 71


• When N(X) is a complex function

Gp ( jω )

Im N ( X )Gp ( jω ) = 0
1 

N  Re N ( X )Gp ( jω ) = −1
⇒ X, ω

2024/2/8 TAC(1), Chap.7 NL Systems 72


Example 7.2.2
k
R( jω ) + C( jω )
Gp ( s )
− ∆

Given
K
Gp ( j ω ) =
jω (1 + jω )(1 + 0.5 jω )
and dead zone nonlinearity with
2k 
2
∆ ∆ ∆
 
N ( X ) = k − arcsin + 1−   
π  X X  X  
Determine and analyze the self-sustained
oscillations.

2024/2/8 TAC(1), Chap.7 NL Systems 73


K
Gp ( j ω ) =
jω (1 + jω )(1 + 0.5 jω )
Solution:
arg Gp ( jω )
Im
1 = −90° − arctan ω − arctan( 0.5ω )

N Re = −180°
X =∆ −1 O
0.5ω 2 = 1 ω= 2
X →∞ Gp ( j 2 ) = 1
K >3 K =1
K = j 2 (1 + j 2 )(1 + 0.5 j 2 )
• Is the system stable? =3
* The system is unstable when K ≥ 3
* There exists a self-sustained oscillation
• Is the self-sustained oscillation stable ?
* The self-sustained oscillation is unstable

2024/2/8 TAC(1), Chap.7 NL Systems 74


Example 7.2.3 Given
x + x = 1 for x − x > 0
x + x = −1 for x − x < 0
Determine and analyze the self-sustained
oscillations with DF method.
Solution :
(i) Draw block diagram of CL system
1
r=0 + x − x x + x Gp ( s )
x − x c(t )
− e( t ) u( t )
−1

• What is the nonlinearity ?


• Input and output of the nonlinear element ?
• Input and output of the plant ?

2024/2/8 TAC(1), Chap.7 NL Systems 75


u = x + x
c = x − x
(ii) Calculate the plant transfer function
C ( s ) (1 − s ) X ( s ) 1− s
Gp ( s ) = = 2 =
U ( s ) ( s + s ) X ( s ) s ( s + 1)
(iii) describing function of the relay nonlinearity
4M 4
N (E) = =
πE πE 1 G p ( jω ) Im

(iii) Stability analysis N −1 Re
E→∞ E=0
• CL system is unstable
• Self-sustained oscillation is stable

2024/2/8 TAC(1), Chap.7 NL Systems 76


1− s
Gp ( s ) =
(iv) Calculation of frequency and s( s + 1)
amplitude 4
2 N (E) =
1 − jω 2ω + j(1 − ω ) πE
• G p ( jω ) = =−
jω ( jω + 1) ω (1 + ω 2 )
(1 − ω 2 )
[
• Im Gp ( jω ) = ] 2
= 0 ⇒ ω = 1 rad/s
ω (1 + ω )
Im
[
• Re Gp ( j 1) ] −
1 G p ( jω )
N −1 Re
2 + j (1 − 1)
=− = −1
1 (1 + 1) E→∞ E=0
1
[
• Re Gp ( j1) = − ] N (E)
πE 4
1= ⇒ E = = 1.2733
4 π

2024/2/8 TAC(1), Chap.7 NL Systems 77


x − x = e = E sin ω t
(v) The amplitude X
Solving the differential equation of x gives
2 2
X = = 0.900
π

2024/2/8 TAC(1), Chap.7 NL Systems 78


Time response of x

x (0) = 0, x (0) = 0

2024/2/8 TAC(1), Chap.7 NL Systems 79


Time response of dx/dt

x (0) = 0, x (0) = 0

2024/2/8 TAC(1), Chap.7 NL Systems 80


2.6 Summary
(1) DF method gives
• the information about stability,
• but not that about transient response
(2) DF method is an approximate method
• Gp( jω ) should be a low-pass filter
• The more perpendicular Gp( jω ) is to –1/N,
the more accurate the result is
1 1
− Gp ( jω ) − Gp ( jω )
N N

More accurate Less accurate

2024/2/8 TAC(1), Chap.7 NL Systems 81


(3) The above DF method is more accurate for
sinusoidal inputs than for other inputs
• Some other types of DFs have to be defined for
systems with signal other than sinusoid
(4) The difficulty and accuracy
by using DF method depend mainly on
the complexity of NL components

2024/2/8 TAC(1), Chap.7 NL Systems 82


End of
Section 2, Chapter 7

2024/2/8 TAC(1), Chap.7 NL Systems 83


4  αs π /2
= ∫ k ( X sin ω t − D ) sin ω t dω t + k ( S − D ) ∫ sinω t dω t 
π  α d αs 
=
4  αs
π  ∫α d
kX (
sin 2
ω t − kD sin ω t d ω)t + k ( S − D )
π /2
∫α s sinω t dω t 

4  α s  1 − cos ω t
= ∫ kX − kD sin ω t  dω t
π  α d  2  π /2
+ k ( S − D)∫ sinω t dω t 
αs
αs 
4  ωt 1
π   2 4 

=  kX  − sin 2ω t  + kD cos ω t  − k ( S − D ) cos ω t α
α d
π /2
s
}
2kX  1
= α s − α d − (sin 2α s − sin 2α d )
π  2
2S 2D
+ cosα s − cosα d 
X X 
2024/2/8 TAC(1), Chap.7 NL Systems 84
7.3 Phase Plane
7.3.1 Introduction
1. Limitations of Describing Function Method
• Approximate method
• For simple nonlinearities
• No time response is obtained
• Not suitable for aperiodical inputs
2. Phase Plane
x
x + f ( x, x ) = 0 ( * )
• x and x x
— phase variables O
• Phase plane

2024/2/8 TAC(1), Chap.7 NL Systems 85


x + f ( x, x ) = 0 (*)
3. Phase Plane Portraits
• Let x1 = x, x2 = x
• Equation ( * ) becomes:
dx1 dx 2
= x2 = − f ( x, x ) = − f ( x1 , x 2 )
dt dt
• General 2nd order system can be written as
dx1 dx 2
= f1 ( x1 , x 2 ) = f 2 ( x1 , x 2 )
dt dt
• A trajectory in the phase plane x ( x2 )
dx 2 f 2 ( x1 , x 2 ) x2 = ϕ ( x1 )
= with ( x10 , x20 )
dx1 f1 ( x1 , x 2 )
⇒ x2 = ϕ ( x1 ) O x( x1 )
♦ Phase plane portraits
A set of ( x10 , x20 ) ⇒ A set of trajectories
2024/2/8 TAC(1), Chap.7 NL Systems 86
♦ Ordinary point x2 dx2
=a
• At ( x1 , x 2 ) dx1
dx 2
= a : the direction of x1
dx1
the motion of O
point ( x1 , x 2 )
along the trajectory
• a is a definite number
⇒ direction at this point is unique
• The trajectory started from an ordinary point
is unique

2024/2/8 TAC(1), Chap.7 NL Systems 87


♦ Singular point
If f1 ( x1 , x 2 ) = f 2 ( x1 , x 2 ) = 0 at ( x1 , x 2 )
dx 2 0
then =
dx1 0
• Slope of the trajectory ( i.e. the direction of the
motion ) is an uncertain value
• Infinite number of trajectories may departure
from or approach to this point
• Singular point is equilibrium point ( x1 = 0, x2 = 0)
• Isolated singular point
* a singular point in the neighborhood of which
there do not exist any other singular points

2024/2/8 TAC(1), Chap.7 NL Systems 88


Example 7.3.1 Find the singular points of system
x + x = 0 x
Solution : x
• Let x1 = x, x2 = x , then O
dx1 dx 2
= x = x 2 = x = − x = − x1
dt dt
⇒ ( x1 = 0, x2 = 0) is the equilibrium point
dx2 x1
• =−
dx1 x2
⇒ ( x1 = 0, x2 = 0) is a singular point
and is the only singular point
NB: The solution is an undamped oscillation with
x 2 + x 2 = R 2 ■

2024/2/8 TAC(1), Chap.7 NL Systems 89


Example 7.3.2 Find the singular points of system
x + x = 0 x2
Solution : A

• Let x1 = x, x2 = x , then O A′
B′
dx1 dx 2
= x = x 2 = − x = − x 2 x2 = 0 x1
dt dt
dx 2 x2 B
• =−
dx1 x2
⇒ All point with x2 = 0 are singular points
i.e. all points on the x1 -axis are singular points
NB: The system is a mass-damper system with motion
x (t ) = [ x (0) + x (0)] − x (0)e −t ■

2024/2/8 TAC(1), Chap.7 NL Systems 90


7.3.2 Properties of Phase Plane
1. Direction of Motion In the Upper and
Lower Half Phase Plane
x
• Upper half plane x > 0
⇒x↑
x
O
• Lower half plane x < 0
⇒x↓

2024/2/8 TAC(1), Chap.7 NL Systems 91


Example 7.3.3 Find the singular points and
sketch the phase plane portrait of system
x + x + x = 0
Solution :
• Let x1 = x, x2 = x , then
dx1 dx dx2 dx dx 2 x x + x
= = x = = x = −( x + x ) = =−
dt dt dt dt dx1 x x
(i) When x = 0 and x ≠ 0
x2 ( x )
dx 2 x
=− →∞
dx1 0
O
• All trajectories passing
x1 ( x)
through the x-axis are
perpendicular to the x-axis

2024/2/8 TAC(1), Chap.7 NL Systems 92


dx2 x x + x
= =−
dx1 x x
(ii) When x = 0 and x = 0
dx 2 0
=−
dx1 0
• The origin is a singular point
(iii) Phase plane portrait of x + x + x = 0
NB: For all second order systems x + f ( x, x ) = 0
(i) the singular points are at
the x-axis; x2 ( x )
(ii) a trajectory is always
perpendicular to the x-axis
O
when the trajectory x1 ( x)
passes through the x-axis.

2024/2/8 TAC(1), Chap.7 NL Systems 93


2. Symmetry in Phase Plane Portraits
dx dx dx dx dx x
x = = ⋅ = ⋅ x =
dt dx dt dx dx x
• x + f ( x, x ) = 0 can be written as
dx dx f ( x, x )
x ⋅ = − f ( x, x ) =−
dx dx x
(1) The case of symmetry about the x-axis
x
A
• f ( x, x ) is even function of x a
f ( x, x ) = f ( x,− x )
dx f ( x, x ) O x
A: = − =a
dx x B
−a
dx f ( x,− x )
B: = − = −a
dx − x
2024/2/8 TAC(1), Chap.7 NL Systems 94
dx f ( x, x )
=−
(2) The case of symmetry about the x -axis dx x
x
• f ( x, x ) is odd function of x −a
A
B a
f ( x, x ) = − f ( − x, x )
O x
dx f ( x, x )
A: = − =a
dx x
dx f ( − x, x )
B: = − = −a
dx x

2024/2/8 TAC(1), Chap.7 NL Systems 95


dx f ( x, x )
=−
(3) The case of symmetry about the origin dx x
f ( x, x ) = − f ( − x,− x ) x
A
dx f ( x, x ) a
A: = − =a
dx x
dx f ( − x,− x ) O x
B: = − =a
dx − x a
B
• More discussions are
omitted here

2024/2/8 TAC(1), Chap.7 NL Systems 96


dx
x = x
7.3.3 Construction of Phase Plane dx
Portraits
1. Analytical Methods
Example 7.3.4 To draw the phase plane
portrait of system x
2
x + ω x = 0 ωA
Solution:
dx A
• By using x = x , we have O x
dx
dx
x + ω 2 x = 0
dx
xdx + ω 2 xdx = 0 • Oscillation occurs
• Integrating the 2
above equation gives x
 2 2
2
+ x = A ■
ω
2024/2/8 TAC(1), Chap.7 NL Systems 97
Example 7.3.5 To draw the phase plane portrait
of system x
x = − M x (0) = x0 x (0) = 0
Solution:
• From x = − M , we have x0 x
x = − Mt + C1
1
x = − Mt 2 + C1t + C 2 M =1
2
• Initial conditions ⇒ C1 = 0, C2 = x0 x
1 2
x = − Mt x = − Mt + x0
2
1 2 O x0 x
i.e. x = − x + x0
2M
or x 2 = 2 M ( x0 − x ) = −2 M ( x − x0 ) M = −1 ■

2024/2/8 TAC(1), Chap.7 NL Systems 98


2. Graphical Methods
(1) The isocline method
♦ An isocline
α
dx 2 f 2 ( x1 , x 2 )
= =α
dx1 f1 ( x1 , x 2 )
⇓ f 2 ( x1 , x2 ) = α f1 ( x1 , x2 )
ϕ
x 2 = ϕ ( x1 ,α )
• All trajectories passing through any point on
the curve x 2 = ϕ ( x1 ,α ) have the same slope (α ) ,
i.e. the same direction of motion
• x2 = ϕ (x1, α ) is an isocline

2024/2/8 TAC(1), Chap.7 NL Systems 99


♦ Field of direction
A set of different values of α
⇒ A set of different isoclines
α1 α2
ϕ2
ϕ1
• All these isoclines give the
field of direction for the tangents to trajectories.

2024/2/8 TAC(1), Chap.7 NL Systems 100


Example 7.3.6 To draw the phase plane portrait by
the isocline method for the system
x + 2ζω x + ω 2 x = 0
Solution:
The system can be rewritten as
dx
x + 2ζω x + ω 2 x = 0
dx
(i) Draw the isoclines
dx
Let = α , then α x + 2ζω x + ω 2 x = 0
dx
x −ω2
i.e. =
x 2ζω + α
Assume ζ = 0.5 and ω = 1 −1
⇒ x = x
( x + x + x = 0) 1+α

2024/2/8 TAC(1), Chap.7 NL Systems 101


−1
x = x
1+α
• α =0 ⇒ x = − x x
α = −1
α = −2
• α =∞ ⇒ x = 0
• α = −1 x x = − 1 0 α = −4

⇒ x = −(1 + α ) x = 0 α =∞
x
• α = −2 ⇒ x = x
1
• α = −4 ⇒ x = x
3 α =0

(ii) Draw short line segments on the isoclines to


represent the field of direction.
(iii) Draw the phase trajectory from an ordinary point.

2024/2/8 TAC(1), Chap.7 NL Systems 102


(2) The delta method
• Regard the phase trajectory as a set of connected arc
with their centers on the x-axis.
• Write the motion equation as
x = − f ( x , x ) f ( x , x ) is a continuous and
single-valued function
• Rewrite motion equation as
x + ω 2 x = − f ( x , x ) + ω 2 x
− f ( x , x ) + ω 2 x
and let δ =
ω2
we have δ 1 = δ ( x1 , x1 ) ≈ const around ( x1 , x1 )

2024/2/8 TAC(1), Chap.7 NL Systems 103


x + ω 2 x = − f ( x , x ) + ω 2 x
• New motion equation around − f ( x , x ) + ω 2 x
δ= 2
( x1 , x1 ) ω
x + ω 2 x = ω 2δ 1
x
x + ω 2 ( x − δ 1 ) = 0 P ( x1 ,
x1
, t1 )
ω ω
• The solution is
x 2 + ω 2 ( x − δ 1 ) 2 = A2
• In the normalized phase plane
2 O Q(δ1 ,0) x
x
   + ( x − δ )2 = B 2
  1
ω 
• The arc around point P is a part of the circle with
2 2
centre at (δ 1 ,0) and radius PQ = ( x1 ω ) + ( x1 − δ 1 )
NB: For the convenience of drawing, the values of δ
and ω should be properly selected
2024/2/8 TAC(1), Chap.7 NL Systems 104
PQ = ( x1 ω )2 + ( x1 − δ1 )2
Example 7.3.7 To draw the phase plane portrait by
the δ method for system
x + 2ζω x + ω 2 x = 0
Solution:
2 − 2ζω x x
(i) Write x + ω x = −2ζω x and let δ = 2
= −2ζ
2 ω ω
 x  + ( x − δ ) 2 = R 2
i.e.  
ω 
(ii) For point ( x1 , x1 )
2 2
 x1   2ζ x1 
R1 =   +  x1 + 
ω
   ω 
2 ζ x1
δ1 = −
ω

2024/2/8 TAC(1), Chap.7 NL Systems 105


2 2
 x1   x1 
R1 =   +  x1 + 2ζ 
ω   ω
= y 2 + ( x1 + 2ζ δ1 )2
x x1
y= δ1 = −2ζ
ω y
y ABA A ω
= −2ζ y
yB B

A′
− 2ζy AB O x

1


2024/2/8 TAC(1), Chap.7 NL Systems 106


3. Computer Simulations (with MATLAB)
♦ Van de Pol equation mx − f (1 − x 2 ) x + kx = 0
where m = 1, f = 1, k = 1
• Let x1 = x, x2 = x , then x1 = x2 x 2 = (1 − x12 ) x 2 − x1
◊ Model file: model.m
function [sys,x0]= model(t,x)
sys=[x(2);(1-x(1)*x(1))*x(2)-x(1)];
◊ Simulation program: simu.m
[t,x]=ode45('model',[0,20],[3;4])
plot(x(:,1),x(:,2),'-b');
where: ode45 -- name of simulation function
‘model’-- name of model function
[0,20]-- simulation time interval
[3,4] -- initial conditions

2024/2/8 TAC(1), Chap.7 NL Systems 107


◊ Simulation result

2024/2/8 TAC(1), Chap.7 NL Systems 108


7.3.4 Singular Points and Limit Cycles
1. Singular Points
• A singular point is the point which satisfies
dx1 dx 2
= f1 ( x1 , x 2 ) = 0 = f 2 ( x1 , x 2 ) = 0
dt dt
dx2 0
• = ⇒ The motion cannot
dx1 0 dx2
be determined with
dx1
• Special care should be paid to singular points

2024/2/8 TAC(1), Chap.7 NL Systems 109


2. Properties of Singular Points
♦ Linearized motion equation
• Taylor series of the equations in the neiborhood
of the origin
dx1 dx 2
= a1 x1 + b1 x 2 = a 2 x1 + b2 x 2
dt dt
• Let x = x1 , then
x = x1 = a1 x1 + b1 x2 = a1 x + b1 x2
x = x1 = a1 x + b1 x 2 = a1 x + b1 ( a 2 x1 + b2 x 2 )
= a1 x + b1a 2 x + b1b2 x 2
Since x = a1 x + b1 x2 , b1 x 2 = x − a1 x
x = a1 x + b1a 2 x + b2 ( x − a1 x )
= ( a1 + b2 ) x + (b1a 2 − b2 a1 ) x

2024/2/8 TAC(1), Chap.7 NL Systems 110


x = (a1 + b2 ) x + (b1a2 − b2 a1 ) x
• That is x + ax + bx = 0
where a = −( a1 + b2 ) , b = a1b2 − a 2 b1
• The roots of the char. eqn λ2 + a λ+ b = 0 are
− a ± a 2 − 4b
λ1,2 =
2
* Suppose λ1 ≠ 0 and λ2 ≠ 0
• The linearized model could be used
for studying the properties of
the original nonlinear system

2024/2/8 TAC(1), Chap.7 NL Systems 111


♦ Classification of singular points
(1) Stable focus jω x
λ1

O σ O x
λ2

(2) Unstable focus jω x


λ1

O σ O x
λ2

2024/2/8 TAC(1), Chap.7 NL Systems 112


(3) Stable node
jω x

λ2 λ1 O σ O x

λ1
λ2
λ 1t λ 2t
• x (t ) = C1e + C2e
• The lines with slopes λ1 , λ2 are phase trajectories
• The lines with slopes λ1 , λ2 are separatrices as well
• All trajectories approach the separatrice of λ1
when | λ1 | < | λ2 |

2024/2/8 TAC(1), Chap.7 NL Systems 113


(4) Unstable node
jω x λ2
λ1

O
O λ1 λ2 σ x

• Ce λ t will dominate the motion as t increases


2

if λ1 < λ2

2024/2/8 TAC(1), Chap.7 NL Systems 114


(5) Centre jω x
λ1

O σ O x
λ2

(6) Saddle point


jω x
λ1

λ2 O λ1 σ x

λ2

2024/2/8 TAC(1), Chap.7 NL Systems 115


3. Limit Cycles
• Definition:
An isolated closed path in the phase plane
x x x

x x x

Stable limit cycle Unstable limit cycle Semistable limit cycle

2024/2/8 TAC(1), Chap.7 NL Systems 116


Example 7.3.8 Obtain a phase plane portrait of the
system given by x + 0.5 x + 2 x + x 2 = 0
Solution:
(i) Standard form
• Let x1 = x, x2 = x , then
x1 = x = x2 = f1 ( x1 , x2 )
x 2 = x = − 0.5 x − 2 x − x 2 = −2 x1 − 0.5 x 2 − x12 = f 2 ( x1 , x2 )
(ii) Singular points
x1 = x 2 = 0 x 2 = −2 x1 − 0.5 x 2 − x12 = 0
• Singular points are
 x1 = 0  x1 = −2 or  x = 0  x = −2
   
x
 2 = 0  x2 = 0 equivalently  x = 0  x = 0

2024/2/8 TAC(1), Chap.7 NL Systems 117


f1 = x2
(iii) Properties of the singular points f 2 = −2 x1 − x12 − 0.5 x2
♦ Property of singular point (0, 0)
• Linearization at (0, 0)
∂ f1 ∂ f1
=0 =1 a1 = 0 , b1 = 1
∂ x1 x1 =0 ∂ x2 x1 =0
x2 = 0 x2 = 0
∂ f2 ∂ f2
= ( −2 − 2 x1 ) x1 =0
= −2 = − 0 .5
∂ x1 x1 =0 ∂ x2 x1 =0
x2 = 0 x2 = 0
• The linearized equation a2 = −2 , b2 = − 0.5
 x1 = x2  dx = x
  dt 
 x 2 = −2 x1 − 0.5 x2 i.e. 
 dx = −2 x − 0.5 x
 dt
2024/2/8 TAC(1), Chap.7 NL Systems 118
x + 0.5 x + 2 x + x 2 = 0
* Since a1 = 0 , b1 = 1, a2 = −2 , b2 = − 0.5 , then
− ( a1 + b2 ) = 0.5
⇒ x + 0.5 x + 2 x = 0
a1b2 − b1a 2 = 2
* Characteristic equation
λ2 + 0.5λ + 2 = 0 x
λ1,2 = − 0.25 ± j 1.987
x
• Conclusion: (0,0) is
0
a stable focus

2024/2/8 TAC(1), Chap.7 NL Systems 119


x + 0.5 x + 2 x + x 2 = 0
♦ Property of singular point (−2,0)
* Let y = x + 2 , we obtain y + 0.5 y − 2 y + y 2 = 0
* In the similar way, we have
y + 0.5 y − 2 y = 0
λ2 + 0.5λ − 2 = 0 x
λ 1,2 = 1.186 , − 1.686
• Conclusion: (−2 , 0) x
is a saddle point 0
−2

2024/2/8 TAC(1), Chap.7 NL Systems 120


(iv) Actual phase plane portrait

2024/2/8 TAC(1), Chap.7 NL Systems 121


x + 0.5 x + 2 x + x 2 = 0
NB: The isocline method may be dx
x = x = α x
used for sketching the phase dx
plane portraits in this example
• The isocline is given by
− 0.5 x − 2 x − x 2

x
( x + 1) 2 1
x = − +
α + 0.5 α + 0.5
• Parabols passing through (−2,0) and (0,0)

2024/2/8 TAC(1), Chap.7 NL Systems 122


• An isocline for α = 0


2024/2/8 TAC(1), Chap.7 NL Systems 123
End of
Section 3, Chapter 7

2024/2/8 TAC(1), Chap.7 NL Systems 124


7.4 Phase Plane Analysis
♦ Basis: Some nonlinear systems are
composed of piecewise linear systems
1 x>0
x + x = 
− 1 x<0
x

x + x = −1 x + x = 1 • Linear system


analysis is
O x
x>0
useful
x<0

2024/2/8 TAC(1), Chap.7 NL Systems 125


7.4.1 Analysis of Linear Systems
Example 7.4.1 Obtain the phase trajectories of
the given 2nd R( s) + E ( s) K C ( s)
order system − s(Ts + 1)
Solution:
• Basic equations:
C ( s) K
= 2 ⇒ Tc + c + Kc = Kr
R ( s ) Ts + s + K
E ( s) Ts 2 + s
= 2 ⇒ Te + e + Ke = Tr + r
R ( s ) Ts + s + K

2024/2/8 TAC(1), Chap.7 NL Systems 126


Tc + c + Kc = Kr Te + e + Ke = Tr + r
(i) Step response r (t ) = R ⋅ 1(t ) ⇒ r = r = 0
Tc + c + Kc = KR Te + e + Ke = 0
• For error equation  Te + e + Ke = 0

e(0) = R , e(0) = 0
Let x1 = e, x2 = e  dx1
 dt = e = x2
then 
 dx2 = e = − e − K e = − x2 − K x
1
 dt T T T T
* Singular point
 x1 = 0 e = 0
 i.e. 
x2 = 0 e = 0

2024/2/8 TAC(1), Chap.7 NL Systems 127


Te + e + Ke = 0
• Properties of (0,0)
Tλ2 + λ + K = 0
When 1−4KT< 0 When 1−4KT ≥ 0
⇒ stable focus ⇒ stable node
e e

R e R e
O O

2024/2/8 TAC(1), Chap.7 NL Systems 128


• For output equation Tc + c + Kc = KR

c(0) = 0 , c(0) = 0
* Singular point
 x1 = R c = R
 i.e. 
x2 = 0 c = 0
* Properties of (R,0)
When 1−4KT< 0 When 1−4KT ≥ 0
⇒ stable focus ⇒ stable node
c c

R c R c
O O

2024/2/8 TAC(1), Chap.7 NL Systems 129


Tc + c + Kc = Kr Te + e + Ke = Tr + r
(ii) Ramp response r = Vt + R r = V , r = 0
Tc + c + Kc = KVt + KR Te + e + Ke = V
• For error equation Te + e + Ke = V

e(0) = R , e(0) = V
* Singular point V
e = , e = 0
K
* Properties of singular point
V
-- By Coordinate transformation: x = e −
K
Te + e + Ke = V ⇒ Tx + x + Kx = 0
V V
x ( 0) = e ( 0) − = R − x (0) = e(0) = V
K K

2024/2/8 TAC(1), Chap.7 NL Systems 130


Te + e + Ke = V

-- New system equation: e(0) = R , e(0) = V

Tx + x + Kx = 0 Singular point


 x(0) = R − V , x (0) = V In e − e plane
 V
K e = , e = 0
K
-- Properties of singular point
When 1−4KT < 0 When 1−4KT ≥ 0
⇒ stable focus ⇒ stable node
e x e x
V V

R e( x ) e( x )
R
O O
V V
K K ■

2024/2/8 TAC(1), Chap.7 NL Systems 131


Example 7.4.2 Obtain the phase plane portrait of the
given system Te + e = P
Solution: NB: No item e !
(i) When P = 0
de de e
Te + e = 0 Te + e = 0 =−
de de Te
• For e = 0
Continuous singular e
point: e = 0
• For e ≠ 0 , then e
de 1
=−
de T
• Phase plane portrait

2024/2/8 TAC(1), Chap.7 NL Systems 132


x1 = e = x2
(i) When P ≠ 0 Te + e = P P − x2
x2 = e =
• No singular points T
P
• Isoclines: de = P − e = α e = de
e = e = α e
de Te 1 + αT de
⇒ A set of parallels
•P>0
e
* α =0 ⇒ e = P

1
<α < 0
* e = P is a phase T
P α =0
plane
α >0 e
trajectory
O α =∞
* Phase plane portrait 1
by using isocline α<−
T
method

2024/2/8 TAC(1), Chap.7 NL Systems 133


P
e =
*P<0 1 + αT
e 1
α<−
T
α =∞ e
O
α >0
P
α =0
1
− <α < 0
T

* e = P is the separatrice and the asymptote


of all trajectories ■

2024/2/8 TAC(1), Chap.7 NL Systems 134


♦ Second order systems we have studied are
x + x + x = P 7.3.3, 7.4.1
= 0 7.3.2
x + x = P 
≠ 0 7.4.2
x + x = 0 7.3.1, 7.3.4

x = M 7.3.5

x + x = P

2024/2/8 TAC(1), Chap.7 NL Systems 135


7.4.2 Analysis of Nonlinear Systems
1. Piecewise Analysis
♦ An example
M for x > 0
f ( x, x , x ) = u = 
− M for x < 0

x

f ( 
x , x , x ) = − M f ( x, x , x ) = M
x
II I
x < 0, u = − M x > 0, u = M

2024/2/8 TAC(1), Chap.7 NL Systems 136


2. Actual Singular Points and Virtual Singular
Points
♦ An example
Let f ( x, x , x ) = M for Area I
PI1 and PI 2 be singular points of f ( x, x , x ) = M
x

◊ PI1 : Actual singular


PI2 PI1 x point
O ◊ PI2 : Virtual singular
Area I point

2024/2/8 TAC(1), Chap.7 NL Systems 137


Example 7.4.3 Obtain the phase plane portrait for
the system
R ( s) + E ( s) M ( s) K C (s )
GN
− s(Ts + 1)

where GN m
is as follows

− e0 k e
e for e > e0 O e0
m=
ke for e < e0
k <1 I II III

2024/2/8 TAC(1), Chap.7 NL Systems 138


R ( s) + E ( s) M ( s) K C (s )
GN
− s(Ts + 1)
Solution: e for e > e0
• System equations: m=
ke for e < e0
C ( s) K
= Tc + c = Km
M ( s ) s(Ts + 1)
e = r −c c = r −e
c = r − e c = r − e
Te + e = Tr + r − Km
• In e − e plane: e e
3 areas, but − e0 O e0
2 different equations I II III

2024/2/8 TAC(1), Chap.7 NL Systems 139


Te + e = Tr + r − Km
(i) Step response e for e > e0
r (t ) = 1(t ) r = 0 , r = 0 m=
ke for e < e0
 Te + e + Ke = 0 Areas I and III
 e e
 Te + e + kKe = 0 Area II
e(0) = E0 = 1 , e(0) = 0 − e0 O e0
I II III
• Singular point: e = 0, e = 0
* Actual singular point for system in Area II
* Virtual singular point for systems in Areas I, III

2024/2/8 TAC(1), Chap.7 NL Systems 140


Te + e + Ke = 0 Areas I and III

• Properties of the Te + e + kKe = 0 Area II
singular point:
Suppose 1−4kKT = 0
Since k < 1 , so 1−4KT < 0 e e
* Small error: e < e0 − e0 O e0
Te + e + kKe = 0 I II III
⇒ (0,0) is the stable node
* Large error: e > e0
Te + e + Ke = 0
⇒ (0,0) is the stable focus

2024/2/8 TAC(1), Chap.7 NL Systems 141


Te + e + Ke = 0 Areas I and III

• Phase trajectory Te + e + kKe = 0 Area II
* Let A (E0,0) be the initial point
* For A, (0,0) is the stable focus
e

O E0 e
− e0 e0 A

I II B III

2024/2/8 TAC(1), Chap.7 NL Systems 142


Te + e + Ke = 0 Areas I and III

• Phase trajectory Te + e + kKe = 0 Area II
* Let A (E0,0) be the initial point
* For A, (0,0) is the stable focus
* For B, (0,0) is
e
the stable node
* For C, (0,0) is
the stable focus D E0 e
O
* For D, (0,0) is − e0 e0 A
the stable node C

I II B III

2024/2/8 TAC(1), Chap.7 NL Systems 143


Te + e + Ke = 0
• Features: Speeds up the regulation 1−4KT < 0
* When large signal in the loop
-- The origin is the stable
focus, the motion exhibits
underdamped property e
-- Error decreases
fast D E0 e
O
e − e0 e0 A
E0 C

t I II B III

2024/2/8 TAC(1), Chap.7 NL Systems 144


Te + e + Ke = 0
* When small signal in the loop 1−4KT < 0
-- The origin is the stable Te + e + kKe = 0
node, the motion exhibits 1−4kKT = 0
critically damped
property e
-- Oscillation avoided
D O E0 e
e
− e0 e0 A
E0
C

t
I II B III

2024/2/8 TAC(1), Chap.7 NL Systems 145


Te + e = Tr + r − Km e for e > e0
m=
(ii) Ramp response ke for e < e0
r (t ) = R + Vt r = V , r = 0
Te + e + Ke = V Areas I and III

Te + e + kKe = V Area II
e(0) = R , e(0) = V
• Singular points
* Area II: * Area I, III: * PII > PI
V V
PII : e = , e = 0 PI : e = , e = 0
kK K
• Properties of the singular points
* Suppose 1−4kKT = 0
PII : Stable node PI : Stable focus
* Obviously, positions of PI and PII depends on
k,K,V
2024/2/8 TAC(1), Chap.7 NL Systems 146
(A) V < kKe0
• Properties of the singular point:
V
PII : e = < e0 : Actual singular point
kK
V
PI : e = < ke0 < e0 : Virtual singular point
K
e

PI PII
e
− e0 e0

I II III

2024/2/8 TAC(1), Chap.7 NL Systems 147


e + e + 4e = 0.04
e + e + 0.25e = 0.04
• Phase trajectory
Let T = 1, K = 4, k = 0.0625, e0 = 0.2 r (t ) = 0.3 + 0.04t
then V < kKe0 = 0.05 e
V
PII : e = = 0.16
kK
V A(0.3,0.04)
PI : e = = 0.01
K e
* For A: − 0.2 PI PII 0.2
PI-- Stable focus
* For B:
PII-- Stable node B
• Features: ess = PII I II III

2024/2/8 TAC(1), Chap.7 NL Systems 148


(B) kKe0 < V < Ke0
• Properties of the singular point:
V
PII : e = > e0 : Virtual singular point
kK
V
PI : e = < e0 : Virtual singular point
K
e

PI PII
e
− e0 e0

I II III

2024/2/8 TAC(1), Chap.7 NL Systems 149


e + e + 4e = 0.4
e + e + 0.25e = 0.4
• Phase trajectory
Let T = 1, K = 4, k = 0.0625, e0 = 0.2 r (t ) = 0.4t
then 0.05 = kKe0 < V < Ke0 = 0.8
V e
PII : e = = 1. 6
kK A(0,0.4)
V B
PI : e = = 0.1 D
K
* For A & C: e
PII-- Stable node − 0.2 O PI PII
* For B & D: C
PI -- Stable focus
• Features: ess = e0 I II III

2024/2/8 TAC(1), Chap.7 NL Systems 150


• Time response of error under ramp input
-- fluttering with high frequency

2024/2/8 TAC(1), Chap.7 NL Systems 151


(C) V > Ke0
• Properties of the singular point:
V V
PII : e = > > e0 : Virtual singular point
kK K
V
PI : e = > e0 : Actual singular point
K
e

PI PII e
− e0 O e0

I II III

2024/2/8 TAC(1), Chap.7 NL Systems 152


e + e + 4e = 1.2
e + e + 0.25e = 1.2
• Phase trajectory
* Let T = 1, K = 4, k = 0.0625, e0 = 0.2 r (t ) = 1.2t
then V > Ke0 = 0.8 e
A(0,1.2)
V
PII : e = = 4.8 B
kK
V
PI : e = = 0.3
K
* For A & C:
PII -- Stable node
* For B & D: D
PI -- Stable focus
PI e
• Features: − 0.2 O PII
ess ↑ ⇐ ess = PI
C
ts ↑ (long-time
oscillation) I II III
2024/2/8 TAC(1), Chap.7 NL Systems 153
• step e
A(0,0.4) • ramp with
e B
D middle V
D O E0 e e
− e0 e0 A − 0.2 O PI PII
C
C
B
I II III I II III

• ramp with small V e



A(0,1.2)

• ramp with
e B

A(0.3,0.04)
big V
e
− 0.2 PI PII 0.2 D

PI e
− 0.2 O PII
B C
I II III
I II III

2024/2/8 TAC(1), Chap.7 NL Systems 154
Example 7.4.4 Obtain the phase plane portrait for
the system
M0
r + e − e1 − e0 m K c
− e0 e1 s(Ts + 1)
− M0

M 0 e > e1

m = 0 − e0 < e ≤ e1 for e > 0
− M e ≤ −e0
 0
M 0 e > e0

m = 0 − e1 < e ≤ e0 for e ≤ 0
− M e ≤ −e1
 0

2024/2/8 TAC(1), Chap.7 NL Systems 155


M0
r + e − e1 − e0 m K c
Solution: − e0 e1
− M0
s(Ts + 1)

• System equations:
C ( s) K
=
M ( s ) s(Ts + 1)
Tc + c = Km
e = r − c, c = r − e
c = r − e, c = r − e e
Te + e = Tr + r − Km I II III
− e1 e0 e
− e0 O e1
• In e − e plane:
m = − M0 m=0 m = M0

3 areas, 3 different equations

2024/2/8 TAC(1), Chap.7 NL Systems 156


Te + e = Tr + r − Km
(i) Step response e
I II III
r (t ) = R ⋅1(t ), r = 0, r = 0 − e1 e0 e
Te + e = − Km ( no e ) − e0 O e1
e(0) = R, e(0) = 0 m = − M0 m=0 m = M0
Te + e = KM 0 Area I

Te + e = 0 Area II
Te + e = − KM Area III
 0
• Singular point:
* Area II: Continuous actual singular points on e-axis
* Area I, III: No singular points
-- Asymptotes in Areas I & III:
-- Area I: e = KM 0 -- Area III: e = − KM 0

2024/2/8 TAC(1), Chap.7 NL Systems 157


• Trajectories
* Large e0 and small KM 0
e

KM 0

− e1 e0 R e
− e0 O e1

− KM 0
I II III

2024/2/8 TAC(1), Chap.7 NL Systems 158


* Small e0 and large KM 0
e

KM 0

− e1 O e0 R e
− e0 e1

− KM 0
I II III
e.g. T = 1, KM 0 > 7, e1 = 2, e0 = 1, R = 4

2024/2/8 TAC(1), Chap.7 NL Systems 159


Te + e = Tr + r − Km
(ii) Ramp response e
I II III
r (t ) = Vt , r = V , r = 0 − e1 e0 e
− e0 O e1
Te + e = V − Km
m = − M0 m=0 m = M0
e(0) = 0, e(0) = V

Te + e = V + KM 0 Area I

Te + e = V Area II
Te + e = V − KM Area III
 0

2024/2/8 TAC(1), Chap.7 NL Systems 160


V + KM 0 
 
(A) V > KM0 Te + e = V ≠0
V − KM 
• No singular points  0

• Phase plane portraits


e

V + KM 0

V − KM 0
O e0 e1 e

I II III

2024/2/8 TAC(1), Chap.7 NL Systems 161


V + KM 0

(B) V = KM0 Te + e = V
V − KM = 0
* Continuous singular points  0
on e-axis in Area III
• Phase plane portraits
e

V + KM 0

V
− e1 e
− e0 O e0 e1

I II III

2024/2/8 TAC(1), Chap.7 NL Systems 162


V + KM 0 
 
(C) V < KM0 Te + e = V ≠0
V − KM 
* No singular points  0
• Trajectories
e

V + KM 0 e1

V
− e1 e
− e0 O e0

V − KM 0

I II III
e.g. T = 1, V = 1, KM 0 > 1.5, e1 = 2, e0 = 1, R = 4 ■

2024/2/8 TAC(1), Chap.7 NL Systems 163


• Summary of generation of limit cycles
(i) There exist an unstable (ii) There are two adjacent
actual singular point unstable region
and a stable virtual e
singular point
e
e

PII PI e

I II

PI: Unstable actual singular point


PII: Stable virtual singular point
2024/2/8 TAC(1), Chap.7 NL Systems 164
• Determination and calculation of limit cycles
x2
C ( x1c , x2 c ) A( x1a , x2 a )

x1
O

B( x1b , x2 b )

x1c = x1a
⇒ limit cycles
x2 c = x2 a

2024/2/8 TAC(1), Chap.7 NL Systems 165


Example 7.4.5 Predict the limit cycle in the system
x + x = 1 ( x − x > 0)
x + x = −1 ( x − x < 0)
by phase plane method
Solution:
(i) Singular points
x + x = P ( P ≠ 0)
• There are no singular points in system

2024/2/8 TAC(1), Chap.7 NL Systems 166


x + x = 1
(ii) Phase plane portrait
• In region x > x
* Asymptote of phase trajectories: x = 1
* Isoclines:
x
x + x = 1
α = −0.5
⇓ 1
dx
x + x = 1 α =0
dx x
dx
Let =α
dx
then x (1 + α ) = 1 α = −2
1
i.e x = α = −1.5
1+α

2024/2/8 TAC(1), Chap.7 NL Systems 167


x + x = −1
• In region x < x
* Asymptote of phase trajectories: x = −1
* Isoclines:
−1
x = x α = −1.5
1+α
α = −0.5
1 α = −2
α =0
x

α =0
α = −2 −1
α = − 0 .5
α = −1.5

2024/2/8 TAC(1), Chap.7 NL Systems 168


◊ Phase plane portrait
• Limit cycle may exist
• If there is a limit cycle, then it is symmetrical
about the origin
x α = −1.5
α = −0.5
1 α = −2
α =0
x

α =0
α = −2 −1
α = − 0 .5
α = −1.5

2024/2/8 TAC(1), Chap.7 NL Systems 169


(iii) Frequency and amplitude
of the limit cycle x
• In region x > x B
Start point A :
−a
x ( 0) = − a x (0) = − a x
End point B:
• Solve differential equation −a
A
x + x = 1
2 1
s X ( s ) − sx(0) − x (0) + sX ( s ) − x(0) =
s
1
s 2 X ( s ) − s (− a ) − (− a ) + sX ( s ) − (− a ) =
s
2 1
( s + s ) X ( s ) + 2a + as =
s

2024/2/8 TAC(1), Chap.7 NL Systems 170


2 1
( s + s ) X ( s ) + 2a + as =
s
1 − 2as − as 2
X (s) = x
s 2 ( s + 1) a B
1 2a + 1 a + 1
= 2− +
s s s +1 −a
a x
x (t ) = t − 2a − 1 + ( a + 1)e −t
−a
x (t ) = 1 − ( a + 1)e −t A
• Find end time t1
End point B:
x (t1 ) = a x (t1 ) = a
a = t1 − 2a − 1 + ( a + 1)e −t1

a = 1 − ( a + 1)e −t1

2024/2/8 TAC(1), Chap.7 NL Systems 171


a = t1 − 2a − 1 + ( a + 1)e −t1
t1 = 4a a = 1 − ( a + 1)e −t1
t1 = 3.83
−4a 1− a ⇒
e = a = 0.9575
1+ a x (θ ), x (θ ) x
• Frequency: −a
x
T = 2t1 = 7.66 sec
−a
ω = 0.820 rad/s x (0), x (0) A
• Amplitude
Phase trajectory is perpendicular to x-axis,
the motion assumes maximum magnitude
when x (θ ) = 0

2024/2/8 TAC(1), Chap.7 NL Systems 172


x(t ) = t − 2a − 1 + (a + 1)e −t x (t ) = 1 − (a + 1)e −t
1 − ( a + 1)e −θ = 0
⇓ e −θ =
1 1
= x (θ ), x (θ ) x
a + 1 1.9575
−a
θ = 0.6717 x
x(θ ) = θ − 2a − 1 + (a + 1)e −θ
−a
= −1.2433 x (0), x (0) A
X = 1.2433
(iv) Comparison ×
DF PP Simu(Appr)
T 6.28 7.66 7.65
X 0.90 1.243 1.241 ■

2024/2/8 TAC(1), Chap.7 NL Systems 173


§7.5 Summary
DF Method PP analysis

Method used Equivalent Pictorial solution


linearization
Plant complexity √ 1st & 2nd order system

NL complexity × Piecewise linearity

Time response × √

Stability analysis √ √

Limit cycle analysis √ √

Accuracy × √

2024/2/8 TAC(1), Chap.7 NL Systems 174


End of Chapter 7

2024/2/8 TAC(1), Chap.7 NL Systems 175


Chapter 8 Sampled-Data Systems
Contents
8.1 Introduction
8.2 General Description
8.2.1 Pulse Sampling 8.2.2 Impulse Sampling
8.2.3 Shannon Theorem 8.2.4 Hold
8.3 z-Transform Method
8.3.1 Definition 8.3.2 Properties of z-Transform
8.3.3 z-Transfer Functions
8.3.4 General Procedure of Calculating z-TFs
8.4 Sampled-Data System Analysis
8.4.1 Stability Analysis in z-Plane
8.4.2 Bilinear Transformation 8.4.3 Time Response
8.5 Summary

2024/2/8 TAC(1), Chap.8 Sampled Systems 1


8.1 Introduction
1. Continuous Systems
+
Gc ( s ) Gp ( s )

• Gp ( s ) is the continuous plant, and


• Gc ( s ) is the analog controller, so
• Time and magnitude are varying continuously

2024/2/8 TAC(1), Chap.8 Sampled Systems 2


2. Sampled-data Systems
+
D( z ) Gp ( s )
− T T

• Gp(s) is the continuous plant, but


• D(z) is the digital controller, then
• Continuous (analog) signals and discrete
(digital) signals exist simultaneously.
• Sampling switches, A/D and D/A converters
are employed

2024/2/8 TAC(1), Chap.8 Sampled Systems 3


3. Discrete-time Signal and Digital Signal

Continuous signal Discrete-time signal

Quantized signal Discrete-time


quantized signal
2024/2/8 TAC(1), Chap.8 Sampled Systems 4
4. Types of Sampling Operation
(1) Periodic sampling ( conventional )
t
tk = kT k = 0,1,2,
0 t1 t2
(2) Multi-rate sampling ( parallel )
T2 2T2 3T2
t  pT1
0 tk =  p, q = 0,1,2,
T1 2T1 3T1 qT2
(3) Multi-order sampling
t k +2 t k + r +2 t tk+1− tk ≠ tk − tk − 1 ,
tk t k +1 t k + r +1  t k + 2 r
but tk+ r− tk = const
 tk + r
(4) Random sampling

2024/2/8 TAC(1), Chap.8 Sampled Systems 5


End of
Section 1, Chapter 8

2024/2/8 TAC(1), Chap.8 Sampled Systems 6


8.2 Sampling Process and Hold
8.2.1 Pulse Sampling
♦ Sampler:
A switch with step
1
response as follows

t
0 γ T 2T
• Sampling interval T = const
• Sampling instants tk = kT
• γ << T

2024/2/8 TAC(1), Chap.8 Sampled Systems 7


♦ Sampled signal: x (t )

p(t )
1

• Sampling operation x *p (t )

is a magnitude
modulating process
t

2024/2/8 TAC(1), Chap.8 Sampled Systems 8


x (t )

• p(t) : the pulse train t

p(t )

• The Fourier series of p(t) 1


p (t ) = ∑ Ck exp( jkωst ) ωs = 2π T
t

x *p ( t )

k = −∞
* Calculations of Ck are complicated t


*
• xp (t ) = x(t ) ⋅ p (t ) = ∑ Ck x(t ) exp( jkωst )
k = −∞
* Calculation of xp*(t) is complicated as well

2024/2/8 TAC(1), Chap.8 Sampled Systems 9


8.2.2 Impulse Sampling (Ideal Sampling)
♦ Ideal sampler
• Let the height of the pulse be 1/γ 1
• γ → 0 ⇒ ideal sampler γ

t
0 γ
δT (t )
♦ Impulse train

• δ T (t ) = ∑ δ (t − nT )
n = −∞
t
0 T 2T

2024/2/8 TAC(1), Chap.8 Sampled Systems 10


• Dirac δ - function: δ (t) δ (t )
(i) δ (0) = ∞
(ii) δ (t) = 0 for all t ≠ 0
∞ t
(iii) ∫−∞ δ (t ) dt = 1 0
i.e. the strength of the impulse is unity

(iv) ∫−∞ δ (t )ϕ (t ) dt = ϕ (0)
for all complex-valued function ϕ (t)

2024/2/8 TAC(1), Chap.8 Sampled Systems 11


♦ Sampled signal x (t )

δT ( t )

x * (t )

2024/2/8 TAC(1), Chap.8 Sampled Systems 12


x (t )

δ T (t ) = ∑ δ (t − kT )
* k = −∞
t

• x (t ) = x (t ) ⋅ δ T (t ) δT ( t )


= ∑ Cn ⋅ δ (t − nT ) t

n = −∞ x * (t )

nT +
• Cn = ∫ − x(t )δ (t − nT ) dt t

nT
= x ( nT ) = x * ( nT )

• Fourier series of x*(t)


1 ∞ jkωst 1 ∞
δ T (t ) = ∑ e x (t ) = ∑ x(t ) e jkωst
*
T k =−∞ T k =−∞

2024/2/8 TAC(1), Chap.8 Sampled Systems 13



1
x* (t ) = ∑ x(t )e jkωst
• Frequency spectrum of x*(t) T k =−∞
Taking the Laplace transform

1
X * ( s ) = ∑ X ( s − jkωs ) X ( jω )
T k =−∞

Let s = jω , then

X * ( jω ) = ω

1 ∞ X * ( jω )
∑ X [ j (ω − kωs ) ]
T k =−∞

ω
− ωs 0 ωs

2024/2/8 TAC(1), Chap.8 Sampled Systems 14


8.2.3 Shannon Theorem (Sampling Theorem)
Let 2ω1 correspond to the spectrum of
the continuous signal x (t)
• If ωs ≥ 2ω1 , X ( jω )
then signal x (t) can be
reconstructed completely
from the sampled ω
signal x (t)
*
− ω1 ω1

X * ( jω )

ω
− ωs 0 ωs

2024/2/8 TAC(1), Chap.8 Sampled Systems 15


Example 8.2.1 Find the transfer function from
sampled input to the sampled output
for the following system
1
u(t ) T u * (t ) s +1 y (t ) T y * (t )
Solution:
u * (t ) = δ (t ) U * ( s) = 1
y (t ) = e − t y * (t ) = δ (t ) + e −T δ (t − T ) + e −2T δ (t − 2T ) + 
* −T −Ts − 2T − 2Ts 1
Y ( s) = 1 + e e +e e + =
* 1 − e −T ( s +1)
* Y ( s) 1
G ( s) = * =
U ( s ) 1 − e −T ( s +1)

2024/2/8 TAC(1), Chap.8 Sampled Systems 16


1
• It seems that the investigation of 1 − e −T ( s +1)
sampled-date systems could stop
* since transfer functions in s-domain has been
obtained
• But there are problems with such transfer functions
* Transcendental equations appear everywhere
during the whole calculation
* Much inconvenient in analysis and design ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 17


8.2.4 Hold
x (t )

t
O T 2T
Zero order hold First order hold

2024/2/8 TAC(1), Chap.8 Sampled Systems 18


h0 (t )
♦ Zero-order hold: 1
δ (t ) h0 (t )
ZOH
t
• h0 (t ) = 1(t ) − 1(t − T ) O T
1 − e −Ts
• Transfer function of ZOH: H 0 ( s ) =
s
♦ Frequency response of ZOH:

Let s = jω and ωs = , then
T j ωT j ωT
− j ωT j ωT − j ωT
1− e 2 − e 2 −e 2
2 ωT −
H 0 ( jω ) = = ⋅e 2 ⋅ = ⋅ sin ⋅e 2
jω ω 2j ω 2

2024/2/8 TAC(1), Chap.8 Sampled Systems 19



T=
j ωT ωs
2 ωT −
H 0 ( jω ) = ⋅ sin ⋅e 2
ω 2
ωπ
−j
ωπ sin −j
ωπ
2 ωπ 2π ωs
= ⋅ sin ⋅e ωs = ⋅ ⋅ e ωs
ω ωs ωs ωπ
ωs

2024/2/8 TAC(1), Chap.8 Sampled Systems 20


ωπ
sin
−j
ωπ
2π ωs
H 0 ( jω ) = ⋅ ⋅ e ωs
ωs ωπ
ωs
• Bode diagrams • Nyquist plot
H0 ( jω ) Im
T Re

ω
− 2ω s − ωs ωs 2ωs
arg H 0 ( jω )
π
ωs 2ωs ω
− 2ω s − ωs
−π

2024/2/8 TAC(1), Chap.8 Sampled Systems 21


X * ( jω )
♦ Advantages of ZOH
• Only one recent data
is needed ω
• When ω = kωs − ωs O ωs

H 0 ( jω ) = 0 H0 ( jω )
X * ( jω ) H 0 ( jω ) ≈ X ( jω )
• Phase lag less then π ω
− ωs O ωs
arg H 0 ( jω )
π
ω
X * ( jω ) H 0 ( jω )
ωs 2ωs
− 2ω s − ωs
−π

ω
− ωs O ωs

2024/2/8 TAC(1), Chap.8 Sampled Systems 22


End of
Section 2, Chapter 8

2024/2/8 TAC(1), Chap.8 Sampled Systems 23


8.3 z-Transform Method
8.3.1 z-Transform
1. Definition
♦ Sampled signal x* (t )
x (t )
• One-sided signal x (t )
( x (t ) = 0 for t < 0)
t
• Sampled signal:

*
x (t ) = x (t )δ T (t ) = ∑ x ( kT )δ (t − kT )
n =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 24



x* (t ) = ∑ x(kT )δ (t − kT )
♦ z-Transform of time function n =0

X ( z ) = Z { x* (t ) }
= x (0) + x (T ) z −1 + x ( 2T ) z −2 +  + x ( kT ) z −k + 

= ∑ x(kT ) z −k x (t ) x* (t )
k =0
Z Z
• for discrete-time series x(k)

X ( z ) = Z { x(k ) } = ∑ x ( k ) z −k
X (z )
k =0
♦ z-Transform of a time function can be found
in a z-transform table

2024/2/8 TAC(1), Chap.8 Sampled Systems 25


8.3.2 Properties of z-Transform
(1) Shifting theorem
x (t )
x (t − nT )
−n
Z{x(t − nT )} = z X (z )
t
0 nT

x (t + nT )
Z{x(t + nT )} =
n −1 x (t )

z n X (z ) − ∑ x ( iT ) z n −i

i =0 t
0 nT

2024/2/8 TAC(1), Chap.8 Sampled Systems 26


(2) Initial value theorem
lim X ( z ) = x (0) if lim X ( z ) exists
z →∞ z →∞
(3) Final value theorem
If x (∞) exists, i.e. X (z) has no poles on
z ≥ 1 except z = 1 , then
x ( ∞) = lim [ ( z − 1) X ( z ) ]
z →1

• Refer to textbook for more properties

2024/2/8 TAC(1), Chap.8 Sampled Systems 27


8.3.3 z-Transfer Functions
Y ( z)
• Definition: G ( z ) =
U ( z)
• It is called Pulse Transfer Function as well
1. Obtaining z-Transfer Functions
with Input and Output Signals
u( t ) u* ( t ) y (t ) y * (t )
G ( s)
T T

2024/2/8 TAC(1), Chap.8 Sampled Systems 28


♦ Sampled input
u* (t ) = u(0)δ (t ) + u(T ) δ (t − T ) + u( 2T ) δ (t − 2T ) + 
+ u( nT ) δ (t − nT ) + 

= ∑ u (nT ) δ (t − nT )
n =0
• z- transform of u*(t) • Laplace transform of u*(t)
∞ ∞
U ( z) = ∑ u ( nT ) z −n
U * ( s) = ∑ u ( nT ) e − nTs
n =0 n =0
• It is understood from the above that
z = eTs

2024/2/8 TAC(1), Chap.8 Sampled Systems 29


♦ Sampled output
y* (t ) = y (0)δ (t ) + y (T ) δ (t − T ) + y (2T ) δ (t − 2T ) + 
+ y (kT ) δ (t − kT ) + 

= ∑ y (kT ) δ (t − kT )
k =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 30


• Convolution summation
y* (t ) = ∑ y (kT ) δ (t − kT )
k =0
At t = kT
y ( kT ) = g (t )u(0) + g (t − T )u(T ) +
g (t − 2T )u( 2T ) +  + g (t − kT )u( kT )
k k
= ∑ g (t − nT )u( nT ) = ∑ g ( kT − nT )u ( nT )
n =0 n =0
m=k −n k
=
( n=k −m)
∑ g (mT )u (kT − mT ) = u (kT ) * g (kT )
m =0
• z- transform of y*(t)
∞ ∞ k
Y ( z) = ∑ y ( kT ) z −k = ∑ ∑ g ( kT − nT ) u( nT ) z −k
k =0 k =0 n =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 31


∞ k

* Since
Y ( z) = ∑ ∑ g (kT − nT ) u (nT ) z −k
k =0 n =0

∑ g ( kT − nT )u( nT )
n =0
= g ( kT )u(0) + g ( kT − T )u(T ) +  + g (T )u( kT − T )
+ g (0)u( kT ) + g ( −T )u( kT + T ) + 
= g ( kT )u(0) + g ( kT − T )u(T ) +  + g (T )u( kT − T )
+ g (0)u( kT )
k
= ∑ g ( kT − nT )u( nT ) = y (kT )
n =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 32


∞ k
Y ( z) = ∑ ∑ g (kT − nT ) u (nT ) z −k
k =0 n =0
* So
∞ ∞ k
Y ( z) = ∑ ∑ g ( kT − nT ) u( nT ) z −k ∑ g (kT − nT ) u (nT ) =
k =0 n =0 n =0
m =k −n ∞ ∞ ∞
= ∑ ∑ g ( mT ) u( nT ) z −( n + m ) ∑ g (kT − nT ) u (nT )
m =0 n =0 n =0
independent ∞ ∞
Y ( z)
=
n & m m =0
∑ g (mT ) z −m ∑ u (nT ) z −n G( z) =
U ( z)
n =0

= ∑ g (mT ) z −m ⋅ U (z ) = G ( z ) ⋅ U ( z )
m =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 33


♦ z-transfer function
∑ g (mT ) z −m ⋅ U ( z ) = G ( z ) U ( z )
m =0

G( z) = ∑ g ( mT ) z −m
m =0
♦ The procedure to obtain
z- transfer function by definition
L −1
→ g * (t ) → G (z )
Z
G ( s ) 
→ g (t ) 
• Calculation of z-transfer functions will be given
later

2024/2/8 TAC(1), Chap.8 Sampled Systems 34


2. Obtaining z-Transfer Functions
by Block Diagram Transformation
• For given block diagram
U * ( s) Y ( s) Y * ( s)
G ( s)
T
• Y ( s) = G ( s) ⋅U * ( s) [
Y ( z ) = Z G ( s ) ⋅U * ( s ) ]
• z-transform expression for the above block
U (z ) Y (z )
G (z )
Y ( z ) = G ( z ) ⋅U ( z )
[ ]
• Z G ( s) ⋅U * ( s) = G ( z ) ⋅U ( z )

2024/2/8 TAC(1), Chap.8 Sampled Systems 35


Example 8.3.1 Find the pulse transfer function
of the following system
u( t ) u* ( t ) y1 (t ) y1* (t ) y (t ) y * (t )
G1 ( s) G2 ( s)
T T T
Solution:
• Y1 ( s ) = G1 ( s )U * ( s ) ⇒ Y1 ( z ) = G1 ( z )U ( z )
• Y ( s ) = G2 ( s )Y1* ( s ) ⇒ Y ( z ) = G2 ( z )Y1 ( z )
Y ( z ) = G2 ( z )G1 ( z ) ⋅ U ( z )
= G ( z ) ⋅U ( z )
• G ( z ) = G2 ( z )G1 ( z ) ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 36


Example 8.3.2 Find the pulse transfer function
of the following system
u( t ) u* ( t ) y1 (t ) y (t ) y * (t )
G1 ( s) G2 ( s)
T T
Solution:
• Let G ( s ) = G1 ( s )G2 ( s ) , then
Y ( s ) = G2 ( s )G1 ( s )U * ( s ) = G ( s ) ⋅ U * ( s )
Y ( z ) = G ( z ) ⋅U ( z )

• where G ( z ) = ∑ g (mT ) z −m g (t ) = L −1[ G1 ( s ) G2 ( s ) ]
m =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 37


• N.B: In general, Z [G1 ( s )G2 ( s )] ≠ G1 ( z )G2 ( z )
1 z
G1 ( s ) = G1 ( z ) =
s z −1
1 z z2
G2 ( s ) = G 2 ( z ) = G1 ( z )G2 ( z ) =
s +1 z − e −T ( z − 1)( z − e −T )
1
G ( s ) = G1 ( s )G2 ( s ) =
s ( s + 1)
(1 − e −T ) z
Z [G1 ( s )G2 ( s )] =
( z − 1)( z − e −T )
[
• Denoted as Z G1 ( s )G2 ( s ) ] = G G ( z)
1 2

2024/2/8 TAC(1), Chap.8 Sampled Systems 38


Example 8.3.3
Find the pulse r (t ) + e( t ) e* (t ) y (t ) y * (t )
G ( s)
transfer function T T
v (t ) −
of the system
on the right F ( s)
Solution:
• e(t ) = r (t ) − v(t ) ⇒ E ( z ) = R( z ) − V ( z )
• V ( s ) = F ( s )Y ( s ) = F ( s ) G ( s ) ⋅ E * ( s )
V ( z ) = FG ( z ) ⋅ E ( z )
• E ( z ) = R ( z ) − FG ( z ) ⋅ E ( z )
R( z )
E ( z) =
1 + FG ( z )

2024/2/8 TAC(1), Chap.8 Sampled Systems 39


R( z )
E( z) =
1 + FG ( z )
r (t ) + e( t ) e* (t ) y (t ) y * (t )
G ( s)
T T
v (t ) −
F ( s)
• Y (s) = G (s) ⋅ E * (s)
R( z )
• Y ( z) = G( z) ⋅ E ( z) = G( z) ⋅
1 + FG ( z )
• CL pulse transfer function:
Y ( z) G( z)
= ■
R ( z ) 1 + FG ( z )

2024/2/8 TAC(1), Chap.8 Sampled Systems 40


Example 8.3.4 Find the pulse transfer function
of the following system
r (t ) + e( t ) y (t ) y * (t )
G ( s)
v (t ) − T

F ( s)
Solution:
• Y ( s ) = G ( s ) E ( s ) = G ( s ) [R ( s ) − V ( s ) ]
= G ( s) R( s) − G ( s) F ( s) ⋅ Y * ( s)
• Y ( z ) = GR( z ) − GF ( z ) ⋅ Y ( z )
GR ( z )
Y ( z) =
1 + GF ( z )
• No pulse transfer function from R (z ) to Y (z ) ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 41


8.3.4 General Procedure of Calculating
z-Transfer Functions
(1) Find G(s) between two samplers
• If there exists a ZOH, then G(s) = Gp(s)H0(s)
• G(s) should include all serially connected
transfer functions
(2) Calculate g (t) = L−1[G(s)]

(3) Calculate G ( z ) = ∑ g ( kT ) z
−k

k =0

2024/2/8 TAC(1), Chap.8 Sampled Systems 42


Example 8.3.5 Find the z-transfer function
of the following system
R ( s) R* ( s) 1 − e−s 1 C ( s)
T =1 s s( s + 1)
Solution: ZOH
(i) Method A: By definition
C ( s) 1 − e−s −s  1 1 1 
• G( s) = * = 2 = (1 − e ) ⋅  2 − +
R ( s ) s ( s + 1) s s s + 1
−1
[
• g (t ) = L [G ( s )] = t − 1 + e
−t
] ⋅ 1(t ) t

[
− (t − 1) − 1 + e −( t −1) ] ⋅ 1(t − 1)
1 t

2024/2/8 TAC(1), Chap.8 Sampled Systems 43


t

• g ( 0) = 0 1 t

• For k = 1, 2, …
[ ][
g ( k ) = k − 1 + e −k − k − 1 − 1 + e −( k −1) ]
= 1 + e − k − e −( k −1)
∞ ∞
• G( z) = ∑ g (k ) z −k = ∑ g (k ) z −k
k =0 k =1

[ ]

= ∑ 1 + e −k − e −( k −1) z −k
k =1

[ ]

= ∑ z − k + (1 − e)(ez ) − k
k =1

2024/2/8 TAC(1), Chap.8 Sampled Systems 44


1 1
(1 − e)
= z + ez
1 1
1− 1−
z ez
1 e −1 − 1 e −1 z + 1 − 2e −1
= + −1
= 2
z −1 z − e z − (1 + e −1 ) z + e −1
0.368 z + 0.264
=
z 2 − 1.368 z + 0.368 • Analytic
Continuation

[ ]

G ( z ) = ∑ z −k + (1 − e)(ez ) −k
k =1

2024/2/8 TAC(1), Chap.8 Sampled Systems 45


1 1
−s 1 
G ( s ) = (1 − e )  2 − +
(ii) Method B: By using the s s s + 1
table of z- transforms
( )
• If G ( s ) = 1 − e −Ts X ( s ) = X ( s ) − e −Ts X ( s )
then g (t ) = x (t ) − x (t − T ) ⋅ 1(t − T )
• By using the addition and shift theorems, we have
( )
G ( z ) = X ( z ) − z −1 X ( z ) = 1 − z −1 X ( z )

• Correspondence of
( )
G ( s ) = 1 − e −Ts X ( s )
G ( z ) = ( 1 − z −1 ) X ( z )
suggests the a procedure to calculate
the z- transfer function as follows

2024/2/8 TAC(1), Chap.8 Sampled Systems 46


• Transfer function with zero-order hold
− s Gp ( s )
G ( s ) = (1 − e ) ⋅
s
Gp ( s ) 1 1 1
X ( s) = = 2− +
s s s s +1
• From the table of z- transforms
 Gp ( s )  z z z
X (z ) = Z [ X (s )] = Z   = 2
− +
 s  ( z − 1) z − 1 z − e −1
z (2 − z ) z
= +
( z − 1) 2 z − e −1

2024/2/8 TAC(1), Chap.8 Sampled Systems 47


z (2 − z ) z
X ( z) = 2
+
( z − 1) z − e −1
• G ( z ) = (1 − z −1 ) X ( z )
z − 1  z (2 − z ) z 
= ⋅ 2
+ −1 
z  ( z − 1) z −e 
2− z z −1
= +
z − 1 z − e −1
e −1 z − 2e −1 + 1
= 2
z − (1 + e −1 ) z + e −1 ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 48


End of
Section 3, Chapter 8

2024/2/8 TAC(1), Chap.8 Sampled Systems 49


8.4 Sampled-Data System Analysis
8.4.1 Stability Analysis in the z-plane
♦ Stability region in the z-plane
◊ Mapping Between z and s
Ts
• z=e
• s = σ + jω ⇒ z = eT (σ + jω ) = eTσ e jTω
• Constant σ jω e Tσ 1 e jωT

e jωT
σ
σ1 O O 1

s-plane z-plane

2024/2/8 TAC(1), Chap.8 Sampled Systems 50


• Constant ω jω jω 1T
ρe
jω 1 ω 1T
σ
O O
(ρ = e Tσ )

s-plane z-plane

• Constant ζ jω ζ = 0.5 ζ =0

β σ
β = arccosζ O O 1
ζ = 0.7

s-plane z-plane

2024/2/8 TAC(1), Chap.8 Sampled Systems 51


◊ Stability region in the z-plane
s =σ + jω
z=e Ts
= eTσ e jTω Re { s } < 0 ⇔ z <1
♦ Condition of asymptotical stability:
Kψ ( z )
• OL z-transfer function: GH ( z ) =
ϕ o ( z)
• CL characteristic polynomial ϕ c ( z ) = ϕ o ( z ) + Kψ ( z )
◊ Stability condition: All the roots of ϕc (z) = 0
reside within the unit circle

2024/2/8 TAC(1), Chap.8 Sampled Systems 52


1. Jury Stability Criterion ( Algebraic criterion )
• CL characteristic polynomial
ϕc ( z ) = z n + an−1z n−1 + an−2 z n−2 +  + a1z + a0
• Jury’s array
1 an−1 an − 2 … … a1 a0
a0 a1 a2 … … an−1 1
b21 b22 b23 … … b2 n
c21 = b2 n c22 = b2,n −1 c23 = b2,n −2 … … c2 n = b21
b31 b32 b33 … b3,n −1
c31 = b3,n −1 c32 = b3,n − 2 c33 … c3n = b31
…………
…………
cn +1, 1

2024/2/8 TAC(1), Chap.8 Sampled Systems 53


where
1 an−1  1 an − 2 
b21 = det  b22 = det  and so on
a0 a1  a0 a2 

b21 b22  b21 b23 


b31 = det   b32 = det   and so on
c21 c22  c21 c23 

and so on

2024/2/8 TAC(1), Chap.8 Sampled Systems 54


1 an−1 …
• Sufficient and necessary a0 a1 …
condition of stability: b21 … b2 n
ϕc (1) > 0 (−1) n ϕc (−1) > 0 c21 = b2 n …

c21 > 0
ci1 < 0 for i = 3 , 4 , , n + 1

N.B. Numerous algebraic criteria exist


E. I. Jury.
Theory and Application of the z- transform Method.
(2nd ed), Malabar, Florida: Krieger, 1982 )

2024/2/8 TAC(1), Chap.8 Sampled Systems 55


Example 8.4.1 Determine 2 1 1
the stability of a system 1 − −
3 4 6
with the CL characteristic 1 1 2 1
− −
polynomial 6 4 3
3 2 2 1 1 5 5 35
ϕ c ( z) = z + z − z − b21 = −
3 4 6 36 8 36
Solution: 35 5 5
c21 = −
(i) Write the Jury’s array 36 8 36
25 25
b31 = − −
36 27
25 25
c31 = − −
27 36
b41 = −0.3750
c41 = −0.3750

2024/2/8 TAC(1), Chap.8 Sampled Systems 56


3 2 2 1 1 ϕ c ( z ) = 0 z = − 0.667, ± 0.5
ϕc ( z ) = z + z − z −
3 4 6
2 1 1
1 − −
(ii) Stability condition 3 4 6
15 1 1 2 1
ϕc (1) = > 0 − −
12 6 4 3
3 5 5 35
3
(−1) ϕc (−1) = > 0 b21 = −
12 36 8 36
35 35 5 5
c21 = > 0 c21 = −
36 36 8 36
c31 < 0 25 25
b31 = − −
36 27
c41 < 0 25 25
⇒ the system c31 = − −
27 36
is stable b41 = −0.3750
c41 = −0.3750 ■
2024/2/8 TAC(1), Chap.8 Sampled Systems 57
2. Root Locus Method
Example 8.4.2 Determine the stability of
the following system
R( s) + E ( s) E * ( s) C( s) K
G ( s) where G ( s ) =
− T s( s + a )
F ( s) K >0 a = 1 F ( s) = 1

Solution:
(i) OL z-transfer function
G( z)
C( z) = R( z )
1 + GF ( z )
0.632 Kz
G ( z ) = GF ( z ) =
( z − 1)( z − 0.368)

2024/2/8 TAC(1), Chap.8 Sampled Systems 58


0.632 Kz
G( z) =
( z − 1)( z − 0.368)
(ii) Root locus
z = −1 is the K
G (s) =
critical point s( s + a)

−1 0.368 1

(iii) Stability 0.607


− 0.607
condition
• Substituting z = −1
into the CL characteristic equation gives
z 2 − (1.368 − 0.632 K ) z + 0.368 = 0 ⇒ K = 4.329
• When K > 4.329, the system becomes unstable
N.B: The continuous CL system is always
stable for K > 0 ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 59


3. Nyquist Stability Criterion
Im
♦ Nyquist contour in z-plane:
DR
• D = D1 + D out + D R + Din R=∞
♦ Stability condition: D1 Re
N = p0 O
D out
D in
where
p0 : No of OL poles
outside the unit circle
N : Encirclements of point (−1, j0)
by Γ in the counterclockwise direction
Γ : Mapping of G(z) in the G(z) plane

2024/2/8 TAC(1), Chap.8 Sampled Systems 60


8.4.2 Bilinear Transformation
z −1 1+ w
♦ w= i.e. z = ♦ Alternative
z +1 1− w definition
w +1
j c
j c z=
w −1
d a b a b i.e.
−1 1 −1 1
z +1
w=
−j e z −1
−j e

z-plane w-plane
◊ Inside of the unit circle in z-plane
⇔ Left half plane in the w-plane

2024/2/8 TAC(1), Chap.8 Sampled Systems 61


1. Routh Criterion
• The roots of ϕc (z) = 0 reside inside the
unit circle in z-plane
n 1 + w 
⇔ The roots of (1 − w) ϕc  =0
1 − w 
reside in the left half w-plane
Example 8.4.3 Determine the CL stability of the
system with the OL z-transfer function
0.632 Kz
GH ( z ) =
( z − 1)( z − 0.368)
Solution:

2024/2/8 TAC(1), Chap.8 Sampled Systems 62


0.632 Kz
GH ( z ) =
( z − 1)( z − 0.368)
Solution:
(i) The CL characteristic equation 1+ w
z=
• ϕc(z) = z − ( 1.368 − 0.632K ) z +.368 = 0
2
1− w
• By bilinear transformation
(1 + w) 2 + (0.632 K − 1.368)(1 + w)(1 − w) + 0.368(1 − w) 2 = 0
( 2.736 − 0.632 K ) w 2 + 1.264 w + 0.632 K = 0
(ii) CL stability conditions
• 2.736 – 0.632K > 0 and 0.632K > 0
• That is 0 < K < 4.329
N.B: The same result can be obtained by using
the transformation w + 1 i.e. z +1
z= w=
w −1 z −1 ■

2024/2/8 TAC(1), Chap.8 Sampled Systems 63


z −1
w=
2. Nyquist Stability Criterion z +1
♦ Mapping of the unit circle in the z-plane
by bilinear transformation:
C+ jv
B
• Mathematical
B
expression for C +
u
A A
upper half part C−
−1 1
of the unit circle D


jω D
j ωT ωs
z=e =e C−

z-plane w-plane
ωs
ω =0→
2

2024/2/8 TAC(1), Chap.8 Sampled Systems 64


• Mathematical expression for mapping of the upper
half part of the unit circle in the w-plane:
z − 1 e j ωT − 1
w= = j ωT C+ jv
z +1 e +1 B

ωT ωT B
j −j
e 2 −e 2 C +
A A u
= ωT ωT −1 1
C−
j −j D
e +e 2 2

ωT D
sin C−
=j 2 = j tan ωT = j tan ω π = jv
ωT 2 ωs
cos
2

2024/2/8 TAC(1), Chap.8 Sampled Systems 65


ω
w = j tan π = jv
π ωs
• v = 0 → tan (0 → ∞ )
2
ωs
as ω = 0 →
2
C+ jv
• v behaves similar B

to the frequency B
in the s-plane C +
A A u
−1 1
C−
D

D
C−

♦ Let w = u + jv,
v is called the fictitious frequency

2024/2/8 TAC(1), Chap.8 Sampled Systems 66


Example 8.4.4 Determine the CL stability of the
system with the OL transfer function
K 1 − e −Ts
G( s) = ( K > 0) and H 0 ( s ) =
s s
Solution:
(i) OL z-transfer function
K (1 − e −Ts ) −1
GH 0 ( z ) = (1 − z )
KTz
=
KT
GH 0 ( s ) = 2
s 2 ( z − 1) z −1
KT KT (1 − w)
GH 0 ( w) = =
1+ w 2w
−1
1− w
Let w = jv , then
KT  1  KT KT
GH 0 ( jv ) =  − 1  = − − j
2  jv  2 2v

2024/2/8 TAC(1), Chap.8 Sampled Systems 67


KT KT
GH 0 ( jv) = − −j
(ii) Nyquist plot 2 2v
+∞ 0− Im KT (1 − w)
jv GH 0 ( w) =
2w

0+ u −∞ Re
0− KT + ∞

2

−∞ 0+
w-plane GH 0 ( w) -plane
(iii) Stability condition
KT 2
p0 = 0 ⇒ N −1 = 0 ⇒ − > −1 i.e. K <
2 T

2024/2/8 TAC(1), Chap.8 Sampled Systems 68


KT (1 − w)
GH 0 ( w) =
3. Bode Diagrams Analysis 2w
Example 8.4.5 The plant open loop transfer function
is the same as in Example 8.4.4
Solution:
(i) OL pulse transfer (ii) Bode diagrams of GH 0 ( jv )
function
20 log GH 0 ( jv)
KT 1 − jv
GH 0 ( jv) = ⋅ 1 v
2 jv
KT
20 log
2
arg GH0 ( jv ) v

− 90°
−180°

2024/2/8 TAC(1), Chap.8 Sampled Systems 69


(iii) Stability condition
• Critically stable case corresponds to
KT
20 log =0
2
2
i.e. K =
T 20 log GH 0 ( jv)
2 1 v
• if K <
T KT
20 log
then CL system 2
arg GH0 ( jv ) v
is stable
− 90°
−180°

2024/2/8 TAC(1), Chap.8 Sampled Systems 70
KT (1 − w)
GH 0 ( w) =
4. Root Locus Method 2w
Example 8.4.6 The plant open loop transfer function
is the same as in Example 8.4.4
Solution:
(i) OL pulse transfer function
KT w − 1 w −1 KT
GH 0 ( w) = − = K′ K′ = − < 0 as K > 0
2 w w 2
K ′( w − 1)
(ii) Complementary root locus of
w
jv

( K ′ = 0) ( K ′ = −∞) u
1

2024/2/8 TAC(1), Chap.8 Sampled Systems 71


• By amplitude condition:
KT w − 1 KT 2
lim ⋅ = lim =1 ⇒ K=
w→ ∞ 2 w w→ ∞ 2 T
2
• If K < , then CL system is stable ■
T

jv

K=0 K=∞
( K ′ = −1) ( K ′ = 0) ( K ′ = −∞) u
2 1
K=
T

2024/2/8 TAC(1), Chap.8 Sampled Systems 72


♦ Summary of stability analysis methods:
G( z) Jury criterion
z-plane
Root locus
Nyquist plot
Bode diagrams w-plane
G ( w) Routh criterion

2024/2/8 TAC(1), Chap.8 Sampled Systems 73


8.4.3 Time Response
1. Minimal response
a0 z n + a1 z n −1 +  + an −1 z + an
Let GCL ( z ) =
zn
= a0 + a1 z −1 +  + an −1 z −n +1 + an z −n
♦ Unit impulse response
g * (t ) = a0δ (t ) + a1δ (t − T ) + 
+ an −1δ [t − ( n − 1)T ] + anδ (t − nT )
♦ CL response reaches the steady-state value
within the finite time

2024/2/8 TAC(1), Chap.8 Sampled Systems 74


Example 8.4.7 Find the time response for the system
with the following closed-loop z-transfer function
2z −1
GCL ( z ) = 2
Solution: z
(1) Unit step response
z
R( z ) = c * (t )
z −1
C ( z ) = GCL ( z ) R ( z )
2z −1 z
= 2 ⋅
z z −1
2z −1 t
= 2
z −z 0 T 2T 3T 4T

= 2 z −1 + z −2 + z −3 + z −4 + 

2024/2/8 TAC(1), Chap.8 Sampled Systems 75


(2) Unit ramp response c * (t )
Tz
R( z ) =
( z − 1) 2
C ( z ) = GCL ( z ) R ( z )
2 z − 1 Tz t
= 2 ⋅
z ( z − 1) 2 0 T 2T 3T 4T

T ( 2 z − 1) −2 −3 −4
= 3 2 = 2Tz + 3 Tz + 4Tz +
z − 2z + z ■
♦ Remarks:
(1) Shortest time is required for reaching steady-state
value
(2) Saturation in control may occur because of high
control energy
(3) Sensitive to parameter variations
2024/2/8 TAC(1), Chap.8 Sampled Systems 76
2. Steady-state Response
• Consider the stable CL system
r (t ) + e( t ) e* (t ) y (t )
G ( s)
T
v (t ) −
F ( s)

R( z )
• Error E ( z ) =
1 + GF ( z )

2024/2/8 TAC(1), Chap.8 Sampled Systems 77


R( z )
E( z) =
(1) Step input case r (t ) = 1(t ) 1 + GF ( z )
z 1 z
R( z ) = E( z) = ⋅
z −1 1 + GF ( z ) z − 1
• By the final value theorem
z
lim e(t ) = lim ( z − 1) E ( z ) = lim
t →∞ z →1 z →1 1 + GF ( z )
1
=
1 + lim GF ( z )
z→1

• K p = lim GF ( z ) : Static positional error


z→1
coefficient
1
• ess =
1+ Kp

2024/2/8 TAC(1), Chap.8 Sampled Systems 78


R( z )
E( z) =
(2) Ramp input case r (t ) = t 1 + GF ( z )
Tz 1 Tz
R( z ) = 2
E ( z ) = ⋅
( z − 1) 1 + GF ( z ) ( z − 1) 2
• By the final value theorem
Tz
lim e(t ) = lim ( z − 1) E ( z ) = lim
t →∞ z →1 z →1 ( z − 1)[1 + GF ( z )]
T
= lim
z →1 ( z − 1)GF ( z )

• K v = T −1 lim ( z − 1)GF ( z ) : Static velocity error


z →1
coefficient
1
• ess =
Kv

2024/2/8 TAC(1), Chap.8 Sampled Systems 79


R( z )
E( z) =
1 2 1 + GF ( z )
(3) Parabolic input case r ( t ) = t
2 2
T z ( z + 1) 1 T 2 z ( z + 1)
R( z ) = E( z) = ⋅
2( z − 1) 3 1 + GF ( z ) 2( z − 1)3
• By the final value theorem
T 2 z ( z + 1)
lim e(t ) = lim ( z − 1) E ( z ) = lim
t →∞ z →1 z →1 2( z − 1) 2 [1 + GF ( z )]

T2
= lim
z →1 ( z − 1) 2 GF ( z )

• K a = T −2 lim ( z − 1) 2 GF ( z ) : Static acceleration error


z →1
coefficient
1
• ess =
Ka

2024/2/8 TAC(1), Chap.8 Sampled Systems 80


Unit Unit Unit
Input step ramp parabolic

Type 1 1
single pole ess→0 ess = ess→∞
Kp→∞ Kv
z=1
Type 2 1
ess→0 ess =
double pole
Kv→∞ Ka
z=1
Type 3 ess→0
triple pole Ka→∞
z=1
2024/2/8 TAC(1), Chap.8 Sampled Systems 82
3. Modified z-transform
♦ Motivation for studying modified z-transform
• x1 (t ) ≠ x2 (t ) • The behaviors between
but x1* (t ) = x2* (t ) the sampling instants
may not be satisfactory
x1 (t ) x2 ( t )

t t

2024/2/8 TAC(1), Chap.8 Sampled Systems 83


• For a system with delay τ which is not divided
by the sampling period T ,
the ordinary z-transform may not help
to find the sampled values
* For τ = LT , where L is
an integer x (t ) ⋅ 1(t − 2T )
x (t )
Z{ G(s)e−Ls }=G(z) z −L

the sampled values


of the delayed system
can be found with
shifting theorem t
0 T 2T 3T 4T

2024/2/8 TAC(1), Chap.8 Sampled Systems 84


* For τ ≠ LT ,
the sampled value has to be
found in other way

x (t ) ⋅ 1(t − 2T )
x (t )

x (t ) ⋅ 1(t − 2.5T )

t
0 T 2T 3T 4T

2024/2/8 TAC(1), Chap.8 Sampled Systems 85


♦ Modified z-transform
• Table of modified z-transform
can be found in the textbook

2024/2/8 TAC(1), Chap.8 Sampled Systems 86


End of
Section 4, Chapter 8

2024/2/8 TAC(1), Chap.8 Sampled Systems 92


§8.5 Summary
1. Pulse sampling and impulse sampling
2. z-transfer functions
3. Obtaining z-transfer functions
4. Stability analysis of sampled-data systems
5. Time responses of sampled-data systems

2024/2/8 TAC(1), Chap.8 Sampled Systems 93


End of
Chapter 8

2024/2/8 TAC(1), Chap.8 Sampled Systems 94


C Im w z −1
w=
z +1

Im s Im z Re w
A

C
π Re s Re z
C
A A
Im w z +1
w=
z −1
Re w
C

2024/2/8 TAC(1), Chap.8 Sampled Systems 95


第1章 控制系统的状态空间表达式(模块九)

在经典控制理论中,主要研究的仅仅是输入、输出之间的动态关
系。对于一个线性定常系统,是用一个高阶微分方程或传递函数加以
描述的,它们将某个变量作为输出,直接和输入联系起来。系统的动
态特性由该变量对给定输入的响应来表征。虽然这个输出变量的响应
可能是我们直接感兴趣的唯一结果,但是系统除了这个变量外,还包
含有其它相互独立的变量。关于它们对给定输入的响应如何,则必须
另行研究。因此,用一个高阶微分方程或传递函数来描述一个线性定
常系统显然有其不足之处,它们不能完全描述系统的全部运动状态。
如图 1.1 所示的系统,其中 y 表示小车运动的位移,u 表示外作用
力,F 为摩擦力,k 为摩擦系数,M 为小车的质量。根据力学定理,系
统的方程为:

u F  ky

M
图 1.1

d2y dy
M 2
k u
dt dt
以小车的位移 y 为输出,外作用力 u 作为输入,系统的传递函数为:
y( s ) 1
g( s )  
u( s ) s( Ms  k )

我们知道,光有位置 y 还不能完全表达小车的状态。对于某个位移
y,速度可以具有任何数值而与位移的数值无关。要完整地描述这个系
dy
统的状态,既要知道 y 又要知道 。一般说来,要完整地描述任意一
dt

1
个系统都需要知道其全部独立变量。这就说明建立在输入—输出关系
上的古典控制理论存在着局限性。
五十年代后期开始,贝尔曼(Bellman)等人提出了状态变量法。在
用状态空间法分析系统时,系统的动态特性是由状态变量构成的一阶
微分方程组来描述的。在数字计算机上求解一阶微分方程组比求解与
之相应在的高阶微分方程容易得多,而且可以同时得到系统全部独立
变量的响应,因而能同时确定系统的全部内部运动状态。此外,状态
空间法还可以方便地处理初始条件,可以用来分析设计多变量、时变
和非线性系统,也可以应用于随机过程和采样数据系统,因此它是研
究大型、复杂、高质量控制系统的理论基础。
现代控制理论是在引入状态和状态空间概念的基础上发展起来的。
因此,确定控制系统状态空间的描述,即建立状态空间的数学模型,
是一个基本问题。

§1.1 状态的概念、状态方程和输出方程
一、状态
动态系统的状态粗略地说就是指系统的过去、现在和将来的运动状
况。精确地说,状态需要一组必要而充分的数据来说明。如图 1.1 中所
示的小车的运动,这个系统的状态就是车子每一时刻的位置(位移)
和速度。
二、状态变量
系统的状态变量就是指足以完全确定系统运动状态的最小一组变量。
一个用 n 阶微分方程描述的系统,就有 n 个独立变量,求得这 n 个独
立变量的时间响应,系统的运动状态也就被揭示无遗了。因此,可以
说系统的状态变量就是 n 阶系统的 n 个独立变量。
、xn ( t ) 为系统的一组状态变量,则它应该
设 x1 ( t )、x2 ( t)、
满足下列两个条件:
、xn ( t 0 ) 都
1、在任何时刻 t=t 0 ,这组变量的值 x1 ( t 0 )、x2 ( t 0)、
表示系统在该时刻的状态;
2、当系统在 t≧t 0 的输入和上述初始状态确定以后,状态变量便能

2
完全确定系统在任何 t≧t 0 时刻的行为。
图 1.1 中,只要已知 t=t 0 时刻小车的位置 y 0 和速度 v 0 ,并且知道
t≧t 0 时作用函数 u ,那么,小车在任何时刻的状态就确定了。
、xn ( t )
很显然, n 阶动态系统在 t 时刻的状态 x1 ( t )、x2 ( t)、
( t 0 ≦t≦∞ ) 是 由 其 在 t0 时 刻 的 初 始 状 态
、xn ( t 0 ) 和 t≧t 0 时的输入函数 u(t) 所唯一确定的
x1 ( t0 )、x2 ( t0)、
而与 t 0 前时刻的状态和输入无关。
同一个系统,究竟选取那些变量作为状态变量,这不是唯一的,要
紧的是这些状态变量是相互独立的,且其个数应等于微分方程的阶数
因为微分方程的阶数是唯一地取决于系统中独立储能元件的个数,因
此,状态变量的个数就应等于系统独立储能元件的个数。
还应该指出,状态变量不一定是物理上可量测或可观测的量,但通
常总是选择易于测量或观测的量作为状态变量,因为当系统实现最佳
控制规律时,需要反馈所有的状态变量。
三、状态向量
如果完全描述一个系统的动态行为需要 n 个状态变量
、xn ( t ) ,那么这 n 个状态变量作分量所构成的
x1 ( t )、x2 ( t)、
向量 x (t ) 就叫做该系统的状态向量,记作

 x1 ( t )
 
x ( t )
x(t )   2  或 x ( t )  [ x 1 ( t ) x 2 ( t )  x n ( t )]
T

 
 
x
 n ( t )
四、状态空间
、xn ( t ) 为坐标所构成的 n 维空间称
以状态变量 x1 ( t )、x2 ( t)、
为状态空间。任何状态,都可以用状态空间中的一个点来表示。即在特
定时刻 t ,状态向量 x (t ) 在状态空间中是一点。已知初始时刻 t 0 的

x ( t 0 ) ,就得到状态空间中的一个初始点。随着时间的推移, x (t ) 将
在状态空间中描绘出一条轨迹,称为状态轨线。显然,这一轨线的形

3
状,完全由系统在 t 0 时刻的初始状态和 t≧t 0 的输入以及系统的动态
特性唯一决定的。状态向量的状态空间表示则将向量的代数结构和几
何概念联系了起来。
五、状态方程
描述系统状态变量与系统输入之间关系的一阶微分方程组称为状态
方程。
dy
图 1.1 中,若令 x1  y , x2  ,即取 x1、x2 为此系统的一
dt
组状态变量,则得一阶微分方程组:
dx1 dy
  x2
dt dt
dx 2 d 2 y k dy 1 k 1
 2   u x2  M u
dt dt M dt M M

 x 1  0 1  x   0 
1
 x   0  k   x    1 u (1.1)
 2   M   2   M 
式(1.1)即为该系统的状态方程,上式可简写成:

x  A x  bu
其中
0 1  0  x1 
A  k  , b = 1  , x 
0  M   M   x2 

六、输出方程
描述系统的状态变量与输出变量关系的一组代数方程称为输出方程。
图 1.1 中,指定位移 y 为系统的输出,则有
y  x1
 x1 
或 y   1 0   (1.2)
 x2 
式(1.2)即为该系统的输出方程,简写成

4
 x1 
c   1 0 , x   
T T
yc x 其中
 x2 
状态方程和输出方程一道构成一个系统动态的完整描述,称为系统
的状态空间表达式。如式(1.1)和式(1.2)就是图 1.1 系统的状态空
间表达式。
下面举几个例子,进一步说明列写状态方程和输出方程的方法。
例 1.1 如图 1.2 所示的 R—L—C 网络,此系统有两个独立储能元
件电容 C 和电感 L,所以应有两个独立变量。现选 i 和 vC 为两个状态变
量,根据电学原理,可以写出两个含有状态变量的一阶微分方程:

R
+

i
u
vC
L
-

图 1.2

dvc
c i
dt
di
L  Ri  v c  u
dt

 1
 
v c  i
c

 i   1 v  R i  1 u
 L
c
L L

v c  x1

 i  x2

5
并写成向量和矩阵形式,则状态方程为:
 1 
 0 0
C  x   1 u
x  
1 R  L 
  
 L L

若以 v c 为输出,则输出方程为:
y  1 0 x
例 1.2 如图 1.3 所示的水槽系统中,设水槽 1 的横截面积为 C1 ,水
位为 x1 ;水槽 2 的横截面积为 C 2 ,水位为 x2 , R1 、R2 、R3 为各导
管的液阻。试导出以 x1 、x2 为状态变量的状态方程和以 y1 、y2 为输出
量的输出方程。其中 u 为流入水槽 1 的流量(即单位时间内流进的水
量), y1 、 y2 为单位时间内流出的水量。
考虑水槽 1 的水量变化,包括 u 及水槽的水位差 ( x2  x1 ) 造成的
水量变化 ( x 2  x 1 ) / R 3 和从水槽流出的水量 y1  x1 / R1 ,可以得到:
dx1 x 2  x1 x1
c1   u
dt R3 R1
同理,对水槽 2 可以得到
dx 2 x1  x 2 x 2
c2  
dt R3 R2
将上两式加以整理得到

C1 C2

1 2
x2
x1

R1 R3
R2
y1 y2

6
图 1.3
 1 1 1 1
 x 1   ( R C  R C ) x1  R C x 2  C u
1 1 3 1 3 1 1
 1 1 1
 x 2  x1  (  ) x2
 R3C 2 R2C 2 R3C 2
写成向量和矩阵形式,得到状态方程为:
 1 1 1 
 (  )   x1   1 
 x1   R1C1 R3C1 R3C1
 x         C1  u
1 1 1
 2  (  )  x2   0 
 R3C 2 R2C 2 R3C 2 
1 1
输出方程为: y1  x1 y2 x2
R1 R2
或写成矩形的形式,得输出方程为
 1 
0   x1 
 y1   R1
y     
 2  0 1  
x 
 R2   2 

例 1.3 如图 1.4 所示的电枢控制型直流电动机,由于激磁电流 i f

为常数,所以电动机转矩 M D [牛顿·米]与电枢电流 ia 成正比:


M D  ka ia 其中 ka 为转矩常数[牛顿·米/安]。

Ra La w J

e0 eb f
ia

if= cost

图 1.4
在电枢控制型直流电动机中,只有电枢电感 La 和转子转动惯量
J 两个独立储能元件,因此,选择电枢电流 ia 和转速 w 为一组状态
变量,对于电枢回路有下面微分方程:
dia
La  Ra ia  eb  e0 (电枢回路微分方程)
dt
其中 eb 是反电势,它与转速成正比:
7
eb  k e  w
其中 ke 为电动势常数[伏/弧度/秒]。假设负载转矩为零,对于转矩驱动
机械系统有下面微分方程:
dw
J  f  w  k a  ia (力学回路微分方程)
dt
其中 J [牛顿·米·秒 2]为转子的转动惯量, f [牛顿 ·米/弧度·秒-1]为
粘滞摩擦系数。将上述状态方程改写成:
 di a R k 1
   a ia  e w  e0
 dt La La La

 dw  k a i  f w

 dt J
a
J
写成向量矩阵形式为: 以 w 为输出的输出方程为:
 ia    Ra 
ke  i 
a  1 
   La  i 
  K
La     L  e
 y  0 1  a 
f     0
a
 w   a   w  0  w
 J J     
例 1.4 如图 1.5 所示的力学系统,作用外力为 u ,输出位移为 x .求
该系统的状态方程和输出方程。

k
u

x, v

图 1.5
此系统中位移 x 和速度 v 为两个独立的状态变量,根据牛顿定律有:

8
 dv
 m dt  fv  kx  u

v  dx
 dt
经整理,得:
 dv f k 1
 dt   v  x  u
m m m

 dx  v
 dt
写成向量知阵形式为:
 v   f k  v   1 
      
   m m     m u
 x   1 0   x   0 
 
输出方程,由于
y x
v 
故得 y  0 1  
 x
一般地,对于单输入--单输出系统,状态方程具有如下形式:
 x 1  a11 x1  a12 x2    a1n xn  b1u
 x  a x  a x    a x  b u
 2 21 1 22 2 2n n 2
 (1.3)

 x n  an1 x1  an 2 x2    ann xn  bn u

输出方程有如下形式:
y  c1 x1  c2 x2    cn xn
用向量矩阵表示的状态空间表达式则为:
 x  A x  bu
 T (1.4)
y  c x
 x1 
x 
式中 x   
2


 
 xn 

9
表示 n 维状态向量,矩阵
 a11 a12  a 1n 
a a 22  a 2 n 
A 
21
   
 
a n1 a n2  a nn 
表示系统内部状态之间的联系,称为状态矩阵(或称系统矩阵,系数
矩阵),是 n×n 方阵;向量
 b1 
b 
b 
2


 
 bn 
表示输入对状态的作用,称为输入矩阵(或控制矩阵),它为 n×1
的列阵;向量

c   c1 c2  cn 
T

表示输出与状态的关系,称为输出矩阵,它为 1×n 的行向量。


对于一个复杂系统,它可以有 r 个输入,m 个输出,此时状态方程
变为:
 x 1  a11 x1  a12 x 2    a1n x n  b11 u1    b1r ur
 
 x 2  a 21 x1  a22 x2    a 2 n x n  b21 u1    b 2 r ur
 (1.5)
 

 x  a x  a x    a x  b u    b u
 n n1 1 n2 2 nn n n1 1 nr r

而输出方程,不仅是状态变量的组合,而且在特殊情况下,可以有输
入向量的直接传送,因而有以下一般形式:
 y1  C11 x1  C12 x2    C1n xn  d11u1    d1r ur
 y  C x  C x    C x  d u    d u
 2 21 1 22 2 2n n 21 1 2r r

 
 ym  C m 1 x1  C m 2 x2    C mn xn  d m 1u1    d mr ur
因而多输入―多输出系统状态空间表达式的向量矩阵形式为:
 x  A x  B u
 (1.6)
 y  C x  Du

10
式中 x 和 A 与单输入系统一样,分别为 n 维状态向量和 n × n 状态矩
阵;
 u1 
u 
u   2

 
 ur 
表示 r 维输入(或控制)向量;
 y1 
y 
y 
2
  
 
 ym 
表示 m 维输出向量;
 b11 b12  b1r 
b b  b 
B 
21 22 2 r
  
 
bn1 bn 2  bnr 
表示 n×r 输入(或控制)矩阵;
 c11 c12  c1 n 
c c22  C 2 n 
C   21 
  
 
 cm 1 cm 2  cmn 
表示 m×n 输出矩阵;
 d 11 d 12  d 1r 
d d 22  d 2 r 
D
21
  
 
d m1 d m2  d mr 
表示输入量的 m×r 直接传递矩阵。
综合上述分析,可以清楚地看出:状态空间的描述和经典控制理论
中的描述不同。状态空间描述了系统内部状态和输入、输出关系,而在
经典控制理论中描述的是输入输出之间的关系。因而状态空间描述揭
示了系统的内部联系,输入引起状态的变化,而状态的变化决定输出
的变化。输入引起状态的变化是一个运动过程,用微方程组来表示,
11
即状态方程。状态决定输出的变化则是一个变换过程,数学上表现为
一个变换方程,即代数方程。从上面分析还可以看到,系统状态变量
的个数等于系统所包含的独立贮能元件的个数。因此,一个 n 阶系统
有且仅有 n 个状态变量可以选择。对于简单的电路和力学回路,选择
独立的贮能元件的贮能变量,如电容端电压 v c ,电感中(或电枢中)

电流 il ,惯性元件的速度 v ,弹性元件的位移 x ,电动机转子的角速


度 w ,以及水槽的水位 h 等作为状态变量是方便的。同时看到状态变
量的选择不是唯一的。
状态空间表达式的突出优点是当状态变量个数,输入和输出个数增
加时并不增加方程在表达和分析上的复杂性。同时,系统的状态空间
分析法是在时域内进行的一种矩阵运算的方法,因此特别适用于计算
机来运算。

§1.2 系统按其状态空间表达式进行分类

通常,动态系统的状态、输入、输出可以都是向量,用 x (t ) 、u(t ) 、
y (t ) 来表示,其维数为 n、r、m 。系统本身常用方块图,如图 1.6
所示。 动态系统
输入 u(t) 输出 y(t)
状态

图 1.6
系统的状态空间描述,是其动力学性质的完整表达。因此,按其状
态空间表达式将系统分类,就能充分揭示它们在某些特性上的质的差
别。
一般的非线性、时变动态系统可以用下列状态变量形式的微分方
程和输出方程来描述。

 x ( t )  f [ x ( t ), u( t ), t ]
 (1.7)
 y( t )  h[ x ( t ), u( t ), t ]
其中 f 和 h 是状态 x( t ) 和输入 u( t ) 的某类非线性函数。
如果(1.7)式中向量函数 f 、h 的元都是 x( t ) 和 u( t ) 的线性函数:

12
则称此系统为线性系统。对于线性系统其方程变为:

 x ( t )  A( t ) x ( t )  B( t )u( t )
 (1.8)
 y( t )  C ( t ) x ( t )  D( t )u( t )
其中 A( t )、B ( t )、C ( t )、D( t ) 的元是时间 t 的函数,因此称此类系统
是线性时变系统。通常为了形象起见,式(1.8)代表的系统可以表示
为图 1.7。

D( t

x (t )
+
u(t) +
x(t )

B( t C( t
) + ) + y(t)

A( t

图 1.7

严格地说,一切物理系统都是非线性的,但是其中相当部分可以在
足够精度下,用线性系统来近似。和非线性系统相比,线性系统无论
在分析上或是在综合上都要简单得多。线性系统理论是现代控制理论
中内容最成熟应用最广泛的一个分支。
一个线性时不变系统是用下式来描述的:
 x ( t )  A x ( t )  B u( t )
 (1.9)
 y ( t )  C x ( t )  D u( t )
其中 A 、B 、C 、D 为常数矩阵。时不变性的简单含义是系统参数不随时
间而变化。
式(1.9)所示的系统是本讲义主要研究的系统,在上节中已经指
出,因为输入输出都是向量,所以称为多变量(或多输入多输出)系
统。作为子集的标量系统(或单输入单输出系统)具有如下形式:

13
 x ( t )  A x ( t )  bu( t )
 T (1.10)
 y( t )  c x ( t )  du( t )
式(1.10)也在上节出现过。

§1.3 单输入一一单输出系统的状态空间表达式

在状态空间分析中,首先要有由状态空间表达式所描述的系统数
学模型。这种数学模型一般可以从以下三个途径获得:一是从一般时
域描述化为状态空间表达式;二是从模拟结构图写出状态空间描述;
三是从系统的物理化学机理推出状态空间表达式。本节分别介绍由这
三种途径写出状态空间表达式。

一、由系统的时域描述写出状态空间表达式
对于一个单变量线性定常系统,在经典控制理论中它的运动方程
通常是一个 n 阶线性常系数微分方程:

y ( n )  a1 y ( n  1 )    a n  1 y  a n y
 b0 u( m )  b1 u ( m  1 )    bm  1 u  bm u ( 1.11 )

其中 m ≦ n 。
上节中我们已经给出单变量线性定常系统的状态空间表达式为:

 x  A x  bu
 T (1.12)
 y  c x  du
因此,化系统的一般时域描述(1.11)式为状态空间描述(1.12)式
的关键在于选择合适的状态变量,根据(1.11)式的系数 ai (i=1,2,

…,n), b j (j=0,1,2,…,m) 来定出相应的式(1.12)的系数 A 、b 、

c T 、d 。
由高阶微分方程(或传递函数)出发来建立与之等效的状态空间表
达式的问题实际上是动态系统的实现问题,在第三章中将进一步讨论
这里只是将单变量系统微分方程化为某种特定形式的状态方程的方法
14
作一介绍。
1.方程(1.11)式中不含作用函数导数项
首先我们讨论最简单的情况,即在(1.11)中不含作用函数的各阶
导数的情况。显然(1.11)式可表示为如下形式

y ( n )  a1 y ( n  1 )    a n  1 y  a n y  bu ( 1.13 )

由式(1.13)可以看出,对于此系统,若已知初始条件 y(0) , y
(0) ,…, y (n-1) (0) 及 t ≥ 0 时的输入 u(t) ,则该系统在任何 t ≥0 时刻的
行为便可以确定。因此我们可以选取 y(t) , y (t),…, y (n-1) 这 n 个变量
为系统的一组状态变量,现记为:
 x1  y
 x  y
 2
 x 3  y (1.14)


 x n  y ( n  1 )
进一步化高阶微分方程组(1.14)为一阶微分方程组,即:
 x 1  y  x 2
 x  y  x
 2 3


 (1.15)
 x n  1  y ( n  1 )  x n

 x n  y ( n )   a1 y ( n1 )  a 2 y ( n  2 )    a n y  bu

   a1 x n  a 2 x n  1    a n x1  bu
由(1.14)式所示方程组中第一式可得系统的输出关系式为:
y  x1
将上式化为向量矩阵形式:

 x  A x  bu
 T
 y  c x

15
 0 1 0  0 
 0  0  x1 
0 1  0   0 x 
 
其中 A         , b   , x   ,
2

   
 0 0 0  1     
  an  an  1  an  2   a1  b   xn 

c T   1 0 0   0 (1.16)

例 1.5 设系统的微分方程为:

y  7 y  14 y  10 y  5u

求系统的状态方程和输出方程。

解:选取状态变量为

 x1  y

 x2  y
x  y
 3

则得状态方程组

 x 1  y  x 2

 x 2  y  x 3
 x  y  10 x  14 x  7 x  5u
 3 1 2 3

写成向量矩阵的形式:

 x1   0 1 0   x 1   0
 x    0 0 1   x    0 u
   2   2  
 x 3    10  14  7  x 3  5

16
 x1 
 
y = [1 0 0]  x 2 
 x 3 

或简写为:

 0 1 0   0
x   0 0 1  x   0 u
   
  10  14  7  5

y   1 0 0 x

2、方程( 1.11 )中含有作用函数导数项

对于方程中含有作用函数导数项的情况,可按与上述相同的步骤

来推出相应的状态方程和输出方程。首先,我们来看一个三阶系统的

微分方程。

y  a1 y  a2 y  a3 y  b0u  b1u  b2 u  b3 u (1.17)

现希望将方程(1.17)变换成如下形式的状态方程

 x1   0 1 0   x1    1 
 x    0 0 1   x    u
 2    2  2 (1.18)
 x 3    a3  a2  a1   x 3    3 

17
为此,定义

 x 1  x2   1u

 x 2  x3   2 u (1.19)
 x   a x  a x  a x   u
 3 3 1 2 2 1 3 3

以及

y  x1   0 u (1.20)

于是问题就变成如何从系数 ai 和 b j 来求  0 、  1 、  2 、  3 。由式

(1.20)和(1.19)得:

 y  x2   0 u   1u ( 1.21 )

 y  x3   0 u
   1u   2 u ( 1.22 )
y   a x  a x  a x   u   u
 3 1 2 2 1 3 0 1    2 u
   3u ( 1.23 )

将式(1.22)、(1.21)、(1.20)两边分别乘以 a1、a2、a3 , 然后再

将它们与(1.23)式相加,就可得到:

y  a1 y  a2 y  a3 y
  a3 x1  a2 x2  a1 x3   0u   1u   2 u   3 u  a1 x3  a1  0 u  a1  1u
 a1  2 u  a2 x2  a2  0 u  a2  1u  a3 x1  a3  0 u
  0u  (  1  a1  0 )u  (  2  a1  1  a2  0 )u  (  3  a1  2  a2  1  a3  0 )u
 b0u  b1u  b2 u  b 3 u

上式系数与(1.17)式系数相比,可得:

18
  0  b0
  b  a 
 1 1 1 0
 (1.24)
  2  b2  a1  1  a2  0
  3  b3  a1  2  a2  1  a3  0

不难看出,这里所选的一组状态变量是

 x1  y   0 u

 x 2  y   0 u   1 u
 x  y   u
 3 0    1 u
   2u

由上面的 3 阶系统可以推广到一般的 n 阶系统,设 n 阶系统为:

y( n )  a1 y( n  1 )  a2 y( n  2 )    an 1 y  an y
 b0 u( n )  b1u( n 1 )    bn 1u  bn u ( 1.25 )

为此,定义:

19
 x1  x2   1u
 x  x   u
 2 3 2

 (1.26)
 x  xn   n  1 u
 n 1
 x n   an x1  an  1 x2    a1 xn   n u

以及

y  x1   0 u (1.27)

由式(1.26)和(1.27)可得

 y  x1   0 u
 y  x   u   u
 2 0 1
 y  x3   0 u   1u   2 u ( 1.28 )


 y( n  1 )  xn   0 u( n 1 )   1u( n  2 )     n  2 u   n  1u

 y( n )   an x1  an 1 x2    a1 xn   0 u( n )   1u( n  1 )     n 1u   n u

将(1.28)式中各式依次分别乘以 、a1、1 ,然后相


an、an  1、an  2、

加,得:

y ( n )  a1 y ( n1 )  a 2 y ( n 2 )    a n1 y  a n y
  0 u ( n )  (  1  a1  0 )u ( n1 )  (  2  a1  1  a 2  0 )u ( n 2 )    (  n1
 a1  n 2    a n 2  1  a n1  0 )u  (  n  a1  n1    a n1  1  a n  0 )u

 b0 u( n )  b1u( n  1 )    bn 1u  bn u

上式中等式两边 u( k ) ( k  0 ,1, , n ) 项的系数应相等,故有

20
  0  b0
  b  a 
 1 1 1 0
  2  b2  a1  1  a2  0 (1.29)


  n  bn  a1  n 1    an 1  1  an  0

将(1.26)化为向量矩阵的形式为:

 x1   0 1 0  0   x1    1 
 x   0  x   
0 1  0   2  2
 2  
              u (1.30)
       
  0 0 0  1     
 x n    an  an  1  an  2   a1   xn    n 

 x1 
x 
0]     0 u
2
y  [1 0 0 

 
 xn 

例 1.6 已知系统的输入一一输出微分方程为:

y  6 y  11 y  6 y  u  8u  17 u  8u

求系统的状态方程和输出方程。

解:因该方程的系数 ai 和 b j 分别为

a1 = 6 , a2 = 11, a3 = 6

21
b0 = 1, b1 = 8 , b2 = 17, b3 = 8

由式(1.29)得

  0  b0  1
  b  a   8  6  1  2
 1 1 1 0

  2  b2  a1  1  a2  0  17  6  2  11  1  6
  3 b3  a1  2  a2  1  a3  0  16

22
再由式(1.30)可得状态方程和输出方程

 0 10 2
 
 x   0 0 1  x    6 u

   6  11  6  16 
 y  [1 0 0] x  u

3.线性时变系统的状态空间表达式

上面对线性定常系统的讨论,其方法也可以推广到线性时变系统,

设有如下的线性时变系统:

y( n )  a1 ( t ) y( n 1 )    an  1 ( t ) y  an ( t ) y
(1.31)
 b0 ( t )u (n)
 b1 ( t )u ( n1 )
   bn ( t )u

假定 ai ( t ) ( i  1,2 , n ), b j ( t ) ( j  0 ,1, n ) 是充分可微的,对(1.31)

式仿照线性时不变系统的情况,我们可以导出

 x1  x2   1 ( t )u
 x  x   ( t )u


2 3 2

  ( 1.32 )
 x  xn   n 1 ( t )u
 n 1
 x n   an ( t ) x1  an 1 ( t ) x2    a2 ( t ) xn 1  a1 ( t ) xn   n ( t )u

和 y  x1   0 ( t )u

其中  i ( t ) ( i  0 ,1, , n ) 的计算式,相应地为:

23
 0 (t )  b0 (t )

i 1 i  k
( n  l  i )!
  l ! ( n  i )! ai  k  l ( t )  k ( t )
l
 i ( t )  bi ( t ) 
k 0 l 0 (1.33)
( i  1,2 , n )

显然,状态变量的表达式因 ai ( t ) 、 b j ( t ) 是时变的而远较时不变系统

要复杂得多,写为:

 x1 ( t )  y   0 ( t )u

 x 2 ( t )  y   0 ( t )u  [  1 ( t )   0 ( t )]u (1.34)

 x 3 ( t )  y   0 ( t )u  [  1 ( t )  2 0 ( t )]u  [  2 ( t )  1 ( t )  0 ( t )]u
 

将(1.32)表示为向量矩阵形式,即可变为如下形式:

 x1   0 1 0  0   x1    1 ( t )
 x    
 2  0 0 1  0   x2    2 ( t )
 
               u
   0  1       
  
0 0
  
 x n    an ( t )  an 1 ( t )   a1 ( t )  xn    n ( t )
 

 x1 
x 
y  [1 0 0  0]    0 ( t )u
2
(1.35)

 
 xn 

必须指出,无论是时变系统还是定常系统,在由高阶微分方程化为

状态空间表达式时,通常可采用不同的方法来组成不同的状态变量组

24
从而导出不同形式的状态方程和输出方程,上面介绍的只是其中的一

种。

二、由模拟结构图写出状态方程

在状态空间分析中,利用模拟计算机的模拟结构图能充分反映状

态变量间的相互关系,对建立状态空间表达式很有帮助。

下面介绍的几种方法是由微分方程(或传递函数)画出模拟结构

图,再写出状态方程。由模拟结构图写出状态方程的方法往往使我们

得到几种有用的特殊的状态方程的实现形式,称标准型。至于这些标

准型的特殊含义我们将以后陆续介绍,这里只要了解这几种标准型的

名称和对应的状态方程的形式即可。

1、能控标准 I 型

为了方便起见,先来看一个三阶微分方程:

y  a1 y  a2 y  a3 y  b0u  b1u  b2 u  b3 u (1.36)

其传递函数如下:

b0 S 3  b1 S 2  b2 S  b3
g( s ) 
S 3  a1 S 2  a2 S  a3

25
上式可变换为

y( s )
g( s ) 
u( s )

( b1  a1b0 )S 2  ( b2  a2b0 )S  b3  a3 b0
 b0 
S 3  a1 S 2  a2 S  a3
1 2 3
(1.37)
( b1  a1b0 )S  ( b2  a2b0 )S  ( b3  a3b0 )S
 b0 
1  a1 S 1  a2 S  2  a3 S  3

1
e( s )  1
u( s )
1  a1 S  a2 S  2  a3 S  3

则 e( s )  u( s )  a1e ( s )S 1  a2e ( s )S 2  a3e ( s )S 3 (1.38)

y( s )  b0 u( s )  e( s )[(b1  a1b0 ) S 1  (b2  a 2 b0 ) S 2  (b3  a 3 b0 ) S 3 ]

(1.39)

由(1.38)、(1.39)式画出如图 1.8 所示的模拟结构图。

26
b0

b1-a1b0
+
x3 b2-a2b0
u + e x2 x1
+ +
   b3-a3b0
+ + y
-a1

-a2

-a3

图 1.8 能控标准Ⅰ型

在图 1.8 上设置状态变量,则得状态空间表达式为:

 x 1  x 2
 x  x
 2 3

 x 3   a 3 x1  a 2 x 2  a1 x 3  u
 y  ( b3  a 3 b0 ) x1  ( b2  a 2 b0 ) x 2  ( b1  a1 b0 ) x 3  b0 u

( 1.40

将(1.40)写成矩阵形式:

 x1   0 1 0   x1  0
 x    0 0 1   x2   0 u
 2    
 x 3    a3  a2  a1   x3  1 

27
 x1 
y  [(b3  a 3 b0 ) (b2  a 2 b0 ) (b1  a1b0 )] x 2   b0 u (1.41)
 x 3 

上述这种方法有人称为直接程序法。

将(1.41)扩大到 n 阶系统,得:

 x 1   0 1 0  0   x1  0
 x   0 0 1  0   x2  0
 2     
               u (1.42)
      
 x n  1   0 0 0  1   x n  1   0
 x n    an  an  1  an  2   a1   xn  1 

y   (bn  a n b0 )(bn1  a n1b0 )(b1  a1b0 ) x  b0 u

具有图 1.8 结构或式(1.42)所示的形式称为能控标准 I 型,也称控制

器规范型。(吴:第二可控规范型)

2、能观标准 I 型

仍从三阶系统(1.36)式出发,其传递函数为:

b0 S 3  b1 S 2  b2 S  b3
g( s )  3 (1.43)
S  a1 S 2  a2 S  a3
0
试采用图 1.9 的模拟结构图来实现它,图中的  0 、 1 、 2 、 3 是待求的。
1
2
+ y
x3 x2 x1
u + + + + +
3   
+
+
-a1
28
-a2

-a3
图 1.9 能观标准 I 型

在图 1.9 上设置状态变量,得到这种结构下的状态空间表达式:

 x1  x2   1u
 x  x   u
 2 3 2
 (1.44)
 x 3   a3 x1  a2 x 2  a1 x3   3 u
 y  x1   0 u

式(1.44)的形式即为上面见过的(1.19)式,这里的待求量  0 ,

 1 ,  2 ,  3 可见(1.24)式求出,即为

  0  b0
  b a 
 1 1 1 0
 (1.45)
  2  b2  a1  1  a2  0
  3  b3  a1  2  a2  1  a3  0

系数公式(1.45)多少有点不方便,特别是阶数高时更是如此,可以

给出如下更加紧凑的系数表达式:

29
1 0 0 0   0   b0 
a    
1 0 0   1   b1 
 1   (1.46)
 a2 a1 1 0   2   b2 
    
 a3 a2 a1 1   3   b3 

将式(1.44)写成向量矩阵的形式为:

 x1   0 1 0   x1    1 
 x    0 0 1   x2     2  u
 2   (1.47)
 x 3    a3  a2  a1   x3    3 

 x1 
y  [1 0 0] x 2    0 u
 x 3 

扩展到 n 阶系统,其状态空间表达式为:

 x1   0 1 0  0   x1    1 
 x    x   
 2   0 0 1  0   2   2 

            u
       
 x n  1   0 0 0  1   xn 1    n 1 
 x n    an  an 1  an  2   a1   x n    n 

 x1 
y  [1 0 0  0]     0 u (1.48)
 
 xn 

式中:

30
  0  b0
  b  a 
 1 1 1 0
  2  b2  a1  1  a2  0 (1.49)


  n  bn  a1  n 1    an 1  1  an  0

或记为:

1    0  b0 
a 1 0     b 
 1  1   1 
a 2 a1 1    2  b2 
      (1.50)
       
       
    
a n a n 1 a n  2   1    n  bn 

凡 A、b、CT 具有如式(1.48)形式或模拟结构如图 1.9 所示的系统称

能观标准 I 型,也称能观测性规范型(吴:第一可观规范型)。显然这

种形式我们在(1.30)式中已见到过。

3、能控标准 II 型

为了方便,我们仍以三阶系统出发,将(1.36)式重写如下:

y  a1 y  a 2 y  a 3 y  b0u  b1 u


  b2 u  b3 u (1.51)

+
0
+
1
现在采用图 1.10 所示的模拟结构来实现它,图中的  0 、 1 、 、 3 是
+ 2
2
x1
待定的。
+ + x2 x3
+ +
   3 y
u +
+ + + y

-a3 -a2 -a1 31


图 1.10 能控标准 II 型

在图 1.10 中设置状态变量,得到这种结构下的状态空间表达式:

 x 1   a 3 x 3  u

 x 2  x1  a 2 x 3 (1.52)
 x  x  a x
 3 2 1 3

以及

y   1 x1   2 x 2   3 x 3   0 u (1.53)

于是问题就变成如何从系数 ai 、 b j 、来求  0 、  1 、  2 、  3 ,由式

(1.52)、(1.53)可得

y   1 x 1   2 x 2   3 x 3   0 u
(1.54)
  2 x1   3 x2  ( a3  1  a2  2  a1  3 ) x3   1u   0 u

y   2 x 1   3 x 2  ( a 3  1  a 2  2  a1  3 ) x 3   1 u   0 u

  3 x1  ( a 3  1  a 2  2  a1  3 ) x 2  [( a 3  1  a 2  2  a1  3 )a1
 a 3  2  a 2  3 ] x 3   2 u   1 u   0 u


32
(1.55)

y   3 x 1  ( a3  1  a2  2  a1  3 ) x 2  [( a3  1  a2  2  a1  3 )a1
 a3  2  a2  3 ] x 3   2 u   1u    0u
  ( a3  1  a2  2  a1  3 ) x1  [( a3  1  a2  2  a1  3 )a1  a3  2 (1.56)
 a2  3 ] x2  [( a3  1  a2  2  a1  3 )a2  a3  3  a1 ( a3  1  a2  2
 a1  3 )a1  a3  2  a2  3 ] x3   2 u   1u   0u

将(1.55)、(1.54)、(1.53)式分别乘以 a1、a 2、a 3 ,然后将它们和

(1.56)相加,于是得:

y  a1 y  a 2 y  a 3 y
  0u  (  1  a1  0 )u
  (  2  a1  1  a 2  0 )u
 (  3  a1  2  a 2  1  a 3  0 )u
 b0u  b1 u
  b2 u  b3 u

由此得:

  0  b0

  1 b1  a1  0
 (1.57)
  2  b2  a1  1  a 2  0
  3  b3  a1  2  a 2  1  a 3  0

可见待定系数的计算和能观标准 I 型的待定系数的计算是相同的(见

(1.24)式)。将式(1.52)、(1.53)写成向量矩阵的形式则为:

 x 1  0 0  a 3   x1  1 
     x    0 u
x
    1 0  a (1.58)
2 2  2   
 x 3  0 1  a1   x 3  0
y   1 2  3  x   0u

33
将(1.58)扩展到 n 阶系统,则得:

 x 1  0 0  0  an   x1  1 
    
 x 2  1 0  0  an  1   x2  0
 x 3   0 1 0  a n  2   x 3    0 u
       (1.59)
            
 x  0 0  1  a1   xn  0
 n 
y  [1  2   n ]x   0u

和式(1.48)比较,可以发现,(1.59)式的状态矩阵是(1.48)

相应的状态矩阵的转置,而输入矩阵为(1.48)式输出矩阵的转置,输

出矩阵为(1.48)式输入矩阵的转置。我们将(1.59)、(1.48)两式称

为是互为对偶的形式。凡具有(1.59)形式或图 1.10 所示模拟结构形

式的系统称为能控标准 II 型,也称能控性规范型(吴:第一可控规范

型)。显然,能控标准 II 型是能观标准 I 型的对偶形式。

4、能观标准 II 型

同样以三阶系统为例,将(1.36)式传递函数重写如下:

y( s ) b0 S 3  b1 S 2  b2 S  b3
 3
u( s ) S  a1 S 2  a 2 S  a 3

b0  b1 S 1  b2 S 2  b3 S 3
 (1.60)
1  a1 S  1  a 2 S  2  a 3 S  3

34

y( s )  a1 S 1 y( s )  a2 S 2 y( s )  a 3 S 3 y( s )
 b0 u( s )  b1 S  1u( s )  b2 S  2 u( s )  b3 S  3 u( s )

进一步

y( s )  b0 u( s )  [b1 u( s )  a1 y( s )]S 1  [b2 u( s )  a 2 y( s )]S 2


 [b3 u( s )  a 3 y( s )]S  3  b0 u( s ) (1.61)

 S 1 b1 u( s )  a1 y(( s )  S 1 [b2 u( s )  a 2 y( s )  S 1 (b3 u( s )  a 3 y( s ))] 
将(1.61)式用模拟结构图来表示,则可画出下面图 1.11 所示。

b3 b2 b1 b0

+
x1 x2 x3 y
+ + +
  
+ +
+ + + +

-a3 -a2 -a1

图 1.11 能观标准 II 型

在图 1.11 上设置状态变量,则根据图 1.11 可以写出状态方程和输

出方程:

35
 x1   a3 ( x3  b0 u )  b3 u

 x 2  x1  a2 ( x3  b0 u )  b2 u
 x  x  a ( x  b u )  b u
 3 2 1 3 0 1
y  b0 u  x3

将上式加以整理得:

 x1   a3 x3  ( b3  a3b0 )u

 x 2  x1  a2 x3  ( b2  a2b0 )u
 x  x  a x  ( b  a b )u
 3 2 1 3 1 1 0

y  b0 u  x 3

将上式写成向量矩阵式得:

 x 1  0 0  a 3   x1  ( b3  a 3 b0 )
       
x
    1 0  a x
    ( b  a b )u (1.62)
2 2  2 2 2 0
 x 3  0 1  a1   x 3  ( b1  a1 b0 ) 

y  [0 0 1] x  b0 u

上述这种方法称多层积分法。将上式扩展到 n 阶系统

 x1  0 0  0  an   x1   ( bn  anb0 ) 
 x  1 0  0  an 1   x2   ( bn 1  an  1b0 ) 
 2     
 x 3   0 1  0  an  2   x3   ( bn  2  an  2b0 ) u (1.63)
      
             
 x n  0 0  1  a1   xn   ( b1  a1b0 ) 
   

y  [0 0  0 1] x  b0 u

具有(1.63)式形式或具有图 1.11 模拟结构的系统称能观标准 II 型。

36
同样我们可以看到(1.63)式和(1.42)式在形式上是对偶的,即能

观标准 II 型是能控标准 I 型的对偶形式。能观标准 II 型也称观测器型规

范型(吴:第二可观规范型)。

5、约当标准型

将传递函数展开成部分分式,根据此部分分式画出其模拟结构图,

然后由此模拟结构图写出的状态空间表达式是具有一定特点的某种标

准型。

设单输入一一单输出系统的传递函数如下:

b0 S n  b1 S n1  b2 S n 2    bn 1 S  bn
g( s )  (1.64)
S n  a 1 S n 1  a 2 S n  2    a n  1 S  a n

由于系统的特征值有两种情况,一是所有的特征值都是两两相异的;

一是有些特征值是相同的。以下分两种情况分别讨论。

(1)设(1.64)式具有两两相异的特征值 1 、 2 、  n ,则 g(s)可展

开成如下部分分式:

y( s ) 1 2 n
g( s )      (1.65)
u( s ) s  1 s   2 s  n

其中  i  slim ( s   i )  g( s ) i  1 ,2 , , n (1.66)
i

37

n
i
y( s )   u( s )  u( s ) i  1,2 , , n (1.67)
i 1 s   i

根据式(1.67)容易看到,其模拟结构图如图 1.12 所示。这种结构

的显著特点是积分器不再是前后串联形式而是并联形式。取状态变量

如图 1.12 所示,则状态方程和输出方程可表示为:

1 0  0 1
0 2  0 1
x    x   u (1.68)
    
   
0 0  n  1

y  [ 1  2   n ] x  u

1 0  0  1 
0 0  x  2 
2 +
x     x    u 1
(1.69)
  +     1

    
0 0 +
  n  x  n 
1

2
 2
y  [1 1 + 1] x  u 2
+ + y
u
………..
+ +

+ xn
 n
+
n

38

(a) + Xn X1
+ x1
1 
+
1

+ x2
2 
+
2

u + + y
………….
+
+
图 1.12 对角标准型
+ xn
n 
+
式(1.68)和式(1.69)是互为对偶的,两式的系数矩阵
 A 均为对
n


角矩阵,对角线上各元素是互异的 n 个特征值。故称为对角线标准型
(b)

或解耦标准型,即变量之间不存在耦合关系。广义地说,它是属于下

面介绍的约当标准型。

(2)考虑式(1.64)的特征方程式具有重根的情况。此时,也可以象

下面那样用部分分式展开。为了简单起见,设 1 为三重根, 4 ~ n 为

39
互异的根,于是得到

 11  12  13 4 n
g ( s)         (1.70)
( S  1 ) 3 ( S  1 ) 2 ( S  1 ) S   4 S  n

其中

 11  lim [( S  1 ) 3 g ( s )]
 S 1

 d [( S  1 ) 3 g ( s )]
 12  lim [ ]
 S 1 dS
 (1.71)
  1 lim [ d [( S  1 ) g ( s )] ]
2 3

 13 2! S 1 dS 2

  lim [( S   i ) g ( s )] ( i  4,5,  , n)
 i S  i

由式(1.70)可以画出系统的模拟结构图,如图 1.13 所示。在这种结

构中,重根分式采取积分器的串联形式,其余的采用积分器并联形式

设置状态变量如图所示,则相应的状态空间表达式为:

x3 x2 x1
1 1 1  11
s  1 s  1 s  1
 12

 13 +
x4
1
+

u(s) +
y(s)
s  4 4 +


 
+

+
xn
1 n 40
s  n
δ
图 1.13 约当标准型

 x 1  1 x1  x2
 x   x  x
 2 1 2 3

 x 3  1 x3  u


 x 4  4 x4  u


 x n   n xn  u

y   11 x1   12 x2   13 x3   4 x4     n xn   u

写成向量矩阵的形式

 x 1  1 1 0 0  0   x1  0
 x      
 2  0 1 1 0  0   x2  0
 x 3   0 0 1 0  0   x3  1 
      u
 x 4   0 0 0 4  0   x4  1  (1.72)
            
      
 x n   0 0 0 0 0 n   xn  1 
y  [ 11  12  13  4   n ]x   u

式(1.72)称为约当标准型。式中系数矩阵 A 中对应于重特征根

虚线框块称为约当块。约当块的特点是主对角元素是特征值,主对角

41
线左下方的元素都为零,主对角线右上面,紧靠重根的元素全为 1,

其余元素均为零。一个系统有 n 个多重根,就有 n 个约当块。例如一系

统含有三重 1 ,二重 2 以及 3 和 4 ,则其状态矩阵 A 为

1 1 0 
0 1 

1 0 
0 0 1 
A   2 1 

 0 2 
 
 0 3 0
 0 4 

其中有两个约当块,每个从属于一个特征值。

例 1.7 已知系统的传递函数为

3( S  1 )
g( s )  (1.73)
S 3  4S 2  3S  3

对于(1.73)式,我们可以应用前述方法中的任何一种写出它的状态

空间表达式。熟练之后,可以不必画出状态变量图,而直接由式

(1.73)列写方程。上式中

a1  4 , a2  3 , a3  3
b0  0 , b1  0 , b2  3 , b3  3

能控标准 I 型为(吴:第二可控规范型):

42
  x 1   0 1 0   x1   0
  
 x2  
 0 0 1   x 2    0 u
    
  x 3 
   3 3  4  x 3  1

  x1 
 y  3 3 0  x 2 
  

  x 3 

而能观标准 II 型(吴:第二可观规范型)为上式的对偶形式,即为

 x1  0 0  3  x1  3
  1 0
 x 2     3  x2   3u
 x3 
 0 1  4  x3  0

  x1 
 y  0 0 1  x2 


  x3 

能控标准 II 型(吴:第一可控规范型),则根据(1.59)式写出:

 x1  0 0  3  x1  1 
  
 x 2   1 0  3  x2   0 u
 x3  0
 1  4  x3  0

  x1 
 y  [0 3  9] x2 


  x3 

上式的对偶形式即为能观标准 I 型(吴:第一可观规范型):

  x1   0 1 0   x1   0 
   
  x2    0 0 1   x2    3  u
   
  x 3    3  3  4  x3    9

  x1 
 y   1 0 0  x 2 
  
  x3 

43
通常能控标准 I 型,能观标准 II 型用得较多,以后如不加特殊说明,

能控标准型就是指其 I 型,而能观标准型就是指其 II 型。

例 1.8 设系统的传递函数为

s 2  3s  2 1/ 6 2/ 3 3/ 2
g( s )    
s( s 2  7 s  12 ) s s3 s4

可画出如图 1.14 所示的模拟结构图,并在图上设置状态变量。状态方

程及输出方程为:


x1 1
6
u y
+

x2 2 +
+

+ 
3
+

-3
+ x3 3

图 1.142
+

-4
 x1  u

 x 2  3 x2  u
 x  4 x  u
 3 3

1 2 3
y x1  x 2  x 3
6 3 2

写成向量矩阵形式即为

0 0 0  1
x   0 3 0  x  1 u
   
 0 0  4 1

44
1 2 3
y [  ]x
6 3 2

必须指出,当系统的描述是以方块图给出时,不必算出其总的传

递函数就可直接导出相应的状态空间表达式。下面,我们举例说明此

方法。

设给出系统如图 1.15(a)所示,其中 Z1、P1、P2、P3、k 均为常值,

y 为输出,u 是输入。导出相应的状态空间表达式。

ki
第一步是把各环节的传递函数化为最简形式 ( ) 的组合,于
S  Pi

是图(a) 可化为图(b)。第二步是把具有简单函数相加的环节化为

单元方块的并联,把具有简单函数相乘的环节化为单元方块的串联,

从而将图(b)转化为图(c)。第三步,在图(c)上设置状态变量,

并列出状态方程和输出方程。

u
+ s  z1 k
y
- s  p1 ( s  p2 )( s  p3 )
(a)

u +
z P 1 k
1 1 1  y
- s  p1 s  p2 s  p3
(b)

u +
z1  P1 x3
+
1 x2 k x1

y
s  p1 +
s  p2 s  p3
-
45
(c)

图 1.15

 x1   p3 x1  kx2

 x 2   p2 x2  x3  u  x1   x1  p2 x2  x3  u
 x   P x  ( u  x )( Z  P )  ( P  Z ) x  P x  ( Z  P )u
 3 1 3 1 1 1 1 1 1 1 3 1 1
y  x1

写成矩阵向量的形式即为

   P3 k 0  0 
 x    1  P2 1  x  1 u
    

 ( P1  Z 1 ) 0  P1   Z 1  P1 

 y  [1 0 0] x
例 1.9 写出图 1.16(a)所示系统的状态方程和输出方程。

首先把前向通路的二阶传递函数表示为两个一阶传递函数的串联

如图 1.16(b)所示,然后在图 1.16(b)上设置状态变量,并根据图

1.16(b)写出状态空间表达式。

u
+
3 y

- (a) s( s  2 )

1
s 1
u + 3 x2 1 x1
y

- s3 s (b)

图 1.16
x3 1
s 1
46
 x 1  x 2
 x  3 x  3(  x  u)
 2 2 3

 x 3   x 3  x1
 y  x1 整理并写成向量矩阵形式为:

0 1 0  0 
x  0  3  3 x   3 u
   
1 0  1  0 

y  [1 0 0] x
三、通过系统的物理机理直接写出系统的状态空间表达式

状态空间表达式也可以直接由物理系统写出。我们已在§1.1 中举

出了许多个例子。这里进一步举例说明。

例 1.10 一动态系统如图 1.17 所示,它包含有一个小车和一个倒

置摆,因为用一个外力 u(t)保持摆直立不倒的问题和手握摆杆维持平

衡很相似,所以通常称之为自动搜索平衡车。为了简化,设车与摆只

在一个平面内运动,并且忽略杆的质量、电机本身的动态摩擦、风力等

因素,但保留问题的实质。很显然,系统本来是不稳定的,因为如果

不加控制力,杆必然会倒下来。

设小车和球的质量分别为 M、m ,摆杆的长度和角位移分别为 L、 ,

小车的位置为 Z。则本系统的动态特征可用小车的位移和速度及单摆的

角位移和角速度来完整地描述。其状态向量为:

47
 Z ( t )
 
Z ( t )
x(t )   (1.74)
 ( t ) 
 
 ( t ) 

L
mg

u
图 1.17

为了确定系统的微分方程,首先应注意小车的水平位置是 Z,此
Mg
时摆心的位置是 Z+L Sin 。这样,在水平方向根据牛顿第二定律:

d 2Z d2
M 2  m 2 ( Z  LSin )  u (1.75)
dt dt

同样的定律也可以用摆的质量,在垂直于摆杆方向可得:

m( ZCos  L )  mgSin (1.76)

这些微分方程是非线性的,需要进行简化。由于控制本系统的目的是

保 持 单 摆 直 立 , 因 此 可 假 设  ( t ) 和 ( t ) 接 近 于 零 。 因 此 ,

cos   1, Sin   。得近似微分方程式为:

48
( M  m ) Z  mL  u ( 1.77 )
Z  L  g ( 1.78 )

假定以 u 为系统输入,Z 为输出,则系统的传递函数为:

Z (s) 1 S2  g
g( s )    L
m (1.79)
u( s ) M
S 2 [ S 2  (1  ) g ]
M L

方程(1.77)、(1.78)两式对 Z 和 
 联立求解得:

  mg 1
 Z     u
 M M
 (1.80)
  ( M  m ) g  1 u

 ML ML

如果把恒等式

dZ  d 
Z 
dt dt

也包括在内,就可以用状态变量形式表示这些关系:

 0 
 Z  0 1 0 0  Z   
   mg    1 
d  Z  0 0 
M
0 Z
    M u
  (1.81)
dt   0 0 0 1    0 
  (m  M ) g    
  0 0 0    1 
 ML    ML 

若以 y 表示输出(即为位移 Z)则输出方程为:

Z 
 
Z
y  [1 0 0 0] 
 
 

 

49
若 M = 1kg , m = 0.1kg , L = 1m , g = 9.81m/sec2 , 并 用

x  [Z Z   ]T 来表示状态向量,y 表示输出,则(1.81)式变

为:

0 1 0 0  0
0 0 1 
0  1
x   x   u (1.82)
0 0 0 1  0
   
0 0 11 0   1

y   1 0 0 0 x

这是状态变量形式的线性化微分方程组,当  很小时,本方程确

定了自动搜索平衡装置的动态特性。在以后各章将研究这种系统的各

种性质和控制方法。

§1.4 多输入一一多输出系统的状态空间表达式

到目前为止,我们所研究的系统全是单输入单输出的系统,但很

多系统是多输入和多输出的。

例 1.11 如图 1.18 所示的系统

1 x1 +
y1
u1 s  a1 +

1 x3 +

s  a3 +
y2

1 x2

u2 s  a2
图 1.18

1 x4 50

s  a4
由图 1.18 可写出系统方程为:

 1 1 
 y1 ( s )   S  a1 S  a2   u1 ( s ) 
 y ( s )   1 
1   u2 ( s )
 2  
 S  a3 S  a4 

简写成

Y ( s )  G ( s )u( s )

其中 G(s)称为传递函数矩阵。

在图 1.18 上可直接设置状态变量 x1、x2、x3、x4 。由此可写出状态

空间表达式:

 x 1   a1 x1  u1
 x   a2 x 2  u2
 2

 x 3   a3 x 3  u1

 x 4   a4 x4  u2

 y1  x1  x 2

 y2  x 3  x 4
其矩阵形式为

 x1    a1 0 0 0   x1  1 0
 x    
 2   0  a2 0 0   x2  0 1  u1 
   
 x 3   0 0  a3 0   x3  1 0  u2 
    
 a4   x4  0 
 x 4   0 0 0 1
 x1 
 
 y1  1 1 0 0  x2 
 y   0 0 1 1  x3 
 2 
 
 x4  51
这是一个具有两个输入量和两个输出量的系统,并有四个状态变量。

例 1.12 已知系统的传递函数矩阵为

 2S  5 2S 2  7 S  7 
 2 
G ( s )   S  25 S  6 S 3  6 S 2  11S  6 
 3 S  12 S  11 S 1 
 S 3  6 S 2  11S  6 2
S  5S  6 
要求写出其状

态空间表达式。

初看起来,相应的形式应当如图 1.19(a)所示,它需要两个三阶
传递函数 g12(s)和 g21(s),两个二阶传递函数 g11(s)和 g22(s)。这里共有十
个状态变量。相应地需要十个单独的积分器。实际上状态变量的数目可
以减少。这里引进一个概念——最小实现。所谓最小实现简单地说就是
用最少积分器的实现。有关最小实现的问题下面还会碰到。为了得到最
小实现,一般的做法是将 G(s)按部分分式展开。下式是一般的形式:

1 x1

s 1
u1
y1(s)

1 x2 + +
y1
u1 g11(s) +

+
+ s2 +
g12(s)

g21(s) u2 + 1 +
2 y2
s3
u2 + x3 +
y2(s) + +

g22(s) +
1 x4

(a)
s 1
(b)
52
图 1.19

1 1 1
G( s )  R1  R2    RP (1.83)
S  1 S  2 S  P
其中 1 ,  2 ,   P 是各传递函数元素的极点; R1 , R2 ,  RP 是极点的留数

矩阵,在留数矩阵 RK 中,各列  r k 1 , r k 2 , r kr  把相应的基本传递函


1
数 分配到输出端去。
S  k

 u1 ( s ) 
 u ( s )
1
y( s )    [r k 1 , r k 2 ,  r kr ] 2    (1.84)
S  K   
 
 ur ( s )
1
如果 R K 是满秩的,将有 r 个独立的列,需要 r 个独立的 的描述,
S  k

1
如果 R K 不满秩,则需要较少的描述,其中每一个 的描述与独
S  k
立的列对应。
本题的传递函数部分分式展开式为:

 s 1 2  s 1 3 1
s 1
 s 1 2  2 
s3
G( s )   1 1 
 s 1  s  2  s  3  s 2 3
1 1
s2 
1  0 1 1 1  1 1 1 2
  
S  1 1 0 S  2 1  1 S  3 1 2
R1 R2 R3

上式中 R1 是满秩的,但 R2 和 R3 的秩为 1,因此,G(s)继续可以表示为:


1 0 1 1 1 1 1
G( s )    1  1   1 2
S  1 1 0 S  2 1 S  3 1

53
所以
u ( s ) 1  u2 ( s ) 1 1
y( s )  G ( s ) 1
u ( s ) 
S  1  u ( s )  
S  2 1 u1 ( s )  u2 ( s )
 2   1   
1 1
  u1 ( s )  2u2 ( s )
S  3 1

由 上 式 可 画 出 图 1.19 ( b ) , 显 然 这 个 描 述 仅 含 四 个 状 态 变 量
x1、x2、x3、x4,由图可直接写出状态空间表达式:

  
 1 0  0 1 
  2  1  1
 x   x   u
  3  1 2 
  0  
  1 1 0 
 

 1 1 1 0
Y   x
 0 1 1 1

其中
 x1 
x 
u 
x  u   1
2

 x3   u2 
 
 x4 

可见实现的状态变量数目由原来的十个减少到四个。上述实现实

际上就是一个最小实现,是否是最小实现是可以检验的,以后我

们将会涉及。

例 1.13 设给定的多输入多输出系统为如下微分方程组的形式:

54
 y1  a1 y1  a2 y2  b1u1  b2 u1  b3 u2
 (1.85)
 y 2  a3 y2  a4 y1  b4 u2
式(1.85)的实现也是非唯一的,现采用模拟结构图的方法。首先按最
高阶导数求解。
 y1   a1 y1  b1u  a2 y2  b2 u1  b3 u2

 y 2   a3 y2  a4 y1  b4 u2
对每一个方程积分,得:
 y1  [(  a 1 y 1  b1 u 1 )  a 2 y 2  b2 u1  b3 u2 ]dt 2
 

   [(  a 1 y1  b1 u1 )   (b2 u1  b3 u2  a 2 y 2 )dt ]dt

 y 2   (  a 3 y 2  a 4 y1  b4 u2 )dt

由上式得模拟构图如图 1.20 所示。

b1
u1 + x2 + x1
b2   y1
+ + + +
-a2 -a1
b3

) -a4
u2 + + x3
b4  y2
+

-a3

图 1.20
 x 1   a1 x1  x 2  b1 u1

 x 2   a 2 x 3  b2 u1  b3 u2
 x   a x  a x  b u
 3 4 1 3 3 4 2

 y1  x1

 y2  x3
写成向量矩阵形式

55
 x1    a1 1 0   x1   b1 0
 x    0 u 
 2  0  a2   x2    b2 b3   1 
   u
 x 3    a4 0  a3   x3   0 b4   2 

 x1 
 y 1   1 0 0  
 y   0 0 1  x 2 
 2   
 x3 
§1.5 离散时间系统的状态空间表达式
连续时间系统的状态空间表达法也可以推广到离散时间系统。在连
续时间系统中,可以从微分方程或传递函数来建立状态空间表达式。
而在离散系统中,可以从差分方程或脉冲传递函数来建立离散状态空
间表达式。
设离系统的差分方程为:
y( k  n )  a1 y( k  n  1 )    a n  1 y( k  1 )  a n y( k )
(1.86)
 b0 u( k  n )  b1 u( k  n  1 )    bn u( k )

相应地脉冲传递函数为:
b0 Z n  b1 Z n  1    bn  1 Z  bn
G( z )  n (1.87)
Z  a1 Z n  1    an 1 Z  an
实现的任务就是确定一种状态空间表达式
 x ( k  1)  G x ( k )  hu( k )
 T (1.88)
 y ( k )  c x ( k )  du( k )
式(1.88)可以用方块图 1.21 来表示,图中 Z-1 代表右移算子,类似于
连续系统中的积分算子。
d

u(k) + x(k+1) x(k) +


h +
Z -1
C
y(k)
+

图 1.21

56
当然离散状态空间表达式也可以直接由连续系统离散化获得(见
§2.3)或由离散物理系统直接建立。
一、由差分方程导出离散状态方程
由差分方程(即时域模型)导出离散状态方程和连续系统类似,同
样可分两种情况讨论。
1、 差分方程作用函数中不包含高阶差分的情况。
差分方程作用函数中不包含高阶差分时,(1.86)式可以写成:
y( k  n )  a1 y( k  n  1 )    an1 y( k  1 )  an y( k )
(1.89)
 bu( k )
选取各采样时刻的 y( k ) , y( k  1 ) ,  y( k  n  1 ) 为 n 个状态变量,
即令
 x1 ( k )  y( k )
 x ( k )  y( k  1 )
 2
 (1.90)

 x n ( k )  y( k  n  1 )

根据(1.89)、(1.90)两式可得:
 x1 ( k  1 )  x 2 ( k )
x ( k  1 )  x ( k )
 2 3

 ( 1.91 )
x ( k  1)  x ( k )
 n 1 n
 xn ( k  1 )  y( k  n )   an x1 ( k )  an  1 x2 ( k )    a1 xn ( k )  bu( k )
而 y( k )  x1 ( k ) , 从而(1.91)式可写成:
 x1 ( k  1 )   0 1 0  0   x1 ( k )  0
x ( k  1)    
 2   0 0 1  0   x2 ( k )  0 
  
             u( k )
      
 xn 1 ( k  1 )  0 0 0  1   xn 1 ( k ) 0
 xn ( k  1 )    an  an 1  an  2   a1   xn ( k )  b
y ( k )   1 0 0  0 x ( k ) (1.92)
2、差分方程作用函数中包含高阶差分的情况
首先来考察一个三阶差分方程

57
y( k  3 )  a1 y( k  2 )  a 2 y( k  1 )  a 3 y( k )
 b0 u( k  3 )  b1 u( k  2 )  b2 u( k  1 )  b3 u( k )
希望将上述三阶差分方程变成如下形式的三阶状态方程:
 x1 ( k  1 )   0 1 0   x1 ( k )   h1 
 x ( k  1 )   0 0 1   x2 ( k )   h2  u( k )
 2   
 x3 ( k  1 )   a3  a2  a1   x3 ( k )  h3 
y( k )  x1 ( k )  h0 u( k )
即定义:
 x 1 ( k  1 )  x 2 ( k )  h1 u( k )

 x 2 ( k  1 )  x 3 ( k )  h2 u( k )
 x ( k  1 )   a x ( k )  a x ( k )  a x ( k )  h u( k )
 3 3 1 2 2 1 3 3

以及 y( k )  x1 ( k )  h0 u( k ) (a)
于是问题变成如何从系数 ai, bj 求 h0, h1, h2, h3。由上两式可知:
y( k  1 )  x1 ( k  1 )  h0 u( h  1 )
 x 2 ( k )  h0 u( k  1 )  h1 u( k ) (b)
y( k  2 )  x 2 ( k  1 )  h0 u( k  2 )  h1 u( k  1 )
 x 3 ( k )  h0 u( k  2 )  h1 u( k  1 )  h2 u( k ) (c)

y( k  3 )  x 3 ( k  1 )  h0 u( k  3 )  h1 u( k  2 )  h2 u( k  1 )
  a3 x1 ( k )  a2 x2 ( k )  a1 x3 ( k )  h0 u( k  3 )  h1u( k  2 )
(d)
 h2 u( k  1 )  h3 u( h )
以上式(a),(b),(c),(d)分别乘以 a3、a2、a1、1,并相加得
y( k  3 )  a1 y( k  2 )  a2 y( k  1 )  a3 y( k )
 h0 u( k  3 )  ( h1  a1h0 )u( k  2 )  ( h2  a1h1  a2 h0 )u( k  1 )
 ( h3  a1h2  a2 h1  a3 h0 )u( k )
 b0 u( k  3 )  b1u( k  2 )  b2 u( k  1 )  b3 u( k )
 h0  b0

 h1  b1  a1 h0
由此可得: 
 h2  b2  a1 h1  a 2 h0
 h3  b3  a1 h2  a 2 h1  a 3 h0

不难看出,这里所选的一组变量是:

58
 x1 ( k )  y( k )  h0 u( k )

 x 2 ( k )  y( k  1 )  h0 u( k  1 )  h1 u( k )
 x ( k )  y( k  2 )  h u( k  2 )  h u( k  1 )  h u( k )
 3 0 1 2

上面以三阶为例的状态方程可以推广到一般情况。n 阶差分方程为:
y( k  n )  a1 y( k  n  1 )    a n  1 y( k  1 )  a n y( k )
(1.93)
 b0 u( k  n )  b1u( k  n  1 )    bn u( k )
和连续系统类似,我们选择
 x1 ( k )  y ( k )  h0 u( k )

 x 2 (k )  x1 ( k  1)  h1 u( k )

 x 3 (k )  x 2 ( k  1)  h2 u( k ) (1.94)



 x n (k )  x n 1 ( k  1)  hn 1 u( k )
其中,待定系数 h0、h1、 , hn 的计算关系式为
 h0  b0

 h1  b1  a1 h0
 h2  b2  a1 h1  a 2 h0 (1.95)


 hn  bn  a1 hn1    a n1 h1  a n h0
由式(1.93)和(1.94)即可导出
 x1 ( k  1 )  x 2 ( k )  h1 u( k )
 x ( k  1 )  x ( k )  h u( k )
 2 3 2


 x ( k  1 )  x ( k )  h u( k )
 n 1 n n 1
 x n ( k  1 )   a n x1 ( k )  a n  1 x 2 ( k )    a1 x n ( k )  hn u( k )
从而,其相应的状态方程和输出方程为:
 x1 ( k  1 )   0 1 0  0   x1 ( k )   h1 
x ( k  1)      
 2   0 0 1  0   x2 ( k )   h2 

             u( k )
      
 x n  1 ( k  1 )  0 0 0  1   xn  1 ( k )  hn  1 
 x n ( k  1 )    an  an  1  an  2   a1   xn ( k )   hn 

y ( k )  [1 0 0  0] x ( k )  h0 u( k ) (1.96)

59
例 1.14 设一个三阶差分方程为:
y ( k  3 )  5 y( k  2 )  7 y ( k  1 )  3 y ( k )
 u( k  1 )  2u( k )
求相应的离散状态方程和输出方程。
解:差分方程的系数为
a1 = 5, a2 = 7, a3 = 3, b0 = 0, b1 = 0, b2 = 1, b3 =2
则由(1.95)式可求得相应的系数 hi 为:
h0 = 0, h1 = 0, h2 = 1, h3 = -3
由式(1.96)得离散状态空间表达式为:
 x1 ( k  1 )   0 1 0   x1 ( k )   0 
     x ( k )   1  u( k )
 x ( k  1 ) 
  0 0 1
2  2   
 x 3 ( k  1 )   3  7  5  x 3 ( k )   3
 x1 ( k ) 
 
y( k )  [ 1 0 0 ]  x 2 ( k )
 x 3 ( k )

二、由脉冲传递函数推导离散状态方程
由脉冲传递函数(或由模拟结构图)推导离散状态方程也和连续系
统中类似,常见而又较简单的一些实现如前所述为能控标准型
(I 、II),能观标准型(I、II)或约当标准型等,这里仅举例说明。
例 1.15 已知一离散系统的传递函数为
b1 Z  b2
g( z ) 
Z 2  a1 Z  a2
求其状态空间表达式。
首先,上式可写成:
y( z ) b1 Z 1  b2 Z 2

u( z ) 1  a1 Z  1  a 2 Z  2
所以
u( z )
y( z )  ( b1 Z  1  b2 Z  2 )
1  a1 Z 1  a2 Z  2

60
u( z )
e( z ) 
1  a1 Z 1  a2 Z  2

y( z )  b1 Z 1e( z )  b2 Z 2 e( z )
e( z )  u( z )  a1 Z  1e( z )  a 2 Z  2 e( z )

由此可画出下面的模拟结构图。

b1
y(z)

u(z) e (z) x2(z) x1(z)
 z -1 y(k)
z-1 b2
x2(k) x1(k)

-a1

-a2

图 1.22 能控标准 I 型

在图上设置状态变量,由上图可直接写出状态空间表达式:

 x1 ( k  1 )  x 2 ( k )

 x 2 ( k  1 )   a 2 x1 ( k )  a1 x 2 ( k )  u( k )
y( k )  b2 x1 ( k )  b1 x 2 ( k )
写成矩阵形式:
 x1 ( k  1 )   0 1   x 1 ( k )  0
 x ( k  1 )    a 
 a1   x 2 ( k ) 1 
u( k )
 2   2
 x1 ( k ) 
y ( k )   b2 b1   
 x 2 ( k )
上式即为能控标准 I 型,显然其能观标准 II 型为:
 x 1 ( k  1 )  0  a 2   x 1 ( k )  b2 
 x ( k  1 )  1  a   x ( k )  b  u( k )
 2   1  2   1

61
 x1 ( k ) 
y( k )   0 1  
 x 2 ( k )
其模拟结构图为:

u(z)

u(k)
b2 bb1
1

+ x1(z) +
+ x2(z) y(z)
-1
z -1 z x2(k)
x1(k) + y(k)
+
-a2 -a1

图 1.23 能观标准 II 型

例 1.15(b) 已知一离散系统的传递函数为:
0.368 Z  0.264
g( z )  2
Z  1.368 Z  0.368
试写出它的状态空间表达式,并且具有对角标准形式。
解:将 g( z ) 用部分分式展开

0.368 Z  0.264 1 0.632


g( z )   
Z 2  1.368 Z  0.368 Z  1 Z  0.368
u( z ) 0.632u( z )
y( z )  
Z  1 Z  0.368
由上式可以画出模拟结构图,如图 1.24,在图上设置状态变量,即可
将状态空间表达式为:
 x1 ( k  1 )  x1 ( k )  u( k )

 x2 ( k  1 )  0.368 x2 ( k )  u( k )
y( k )  x1 ( k )  0.632 x 2 ( k )
写成向量矩阵形式为:
 x1 ( k  1 )  1 0  x1 ( k )  1
 x ( k  1 )  0 
0.368  x 2 ( k ) 1
u( k )
 2  

62
 x1 ( k ) 
y ( k )  [1  0.632] 
 x 2 ( k )

x1(z)
+
z-1 1
+ x1(k)

u(z) 1 + y(z)

u(k) +
y(k)
+ x2(z)
z-1 -0.632
x2(k)
+
0.368

图 1.24 对角标准型

§1.6 状态变量的线性变换
一、线性变换

从前两节可以看出,对于一个给定的动态系统,可以选择不同的状

态变量组,从而得到不同结构的状态空间表达式,例如能控标准型,

能观标准型或约当标准型。不同的状态变量组之间的关系实质上是一

种线性变换的关系,或称坐标变换。设给定系统为:
 x  A x  B u
 (1.97)
 y  C x  Du
我们总可以找到任意一个非奇异矩阵 T,将原状态向量 x 作线性变换,

得到另一个状态向量 z ,即
x  T z ,或 z  T 1 x (1.98)
将式(1.98)代入式(1.97)则得新状态空间表达式:

63
 z  T  1 AT z  T  1 B u
 (1.99)
 y  CTz  D u

~ ~
 A  T  1 AT B  T 1 B
~ ~ (1.100)
C  CT DD
则得
~ ~
 z  A z  B u

 ~ ~ (1.101)

 y  C z  D u
可以看出,用式(1.98)的变换而联系起来的两个系统(1.97)式和
(1.101)式,对于相同的输入,必定给出相同的输出,此时称这两个
系统为代数上等价的系统。由于非奇异变换矩阵是任意选择的,所以
和某系统代数上等价的系统有无穷多。反过来说,尽管系统的状态空
间表达式不是唯一的,但不同的表达式之间,也仅仅只是(1.100)关
系式所确定的线性非奇异变换的关系。
例 1.16 设原系统的状态空间表达式为:
 0  2  2
x  x  0  u
 1  3  
 y   0 3 x

 6 2 1 0 1 
若取 T    即 T 1 
 2 0 2 1  3

~ 1 0 1  0  2  6 2   0 1 
A  T  1 AT   
2 1  3 1  3  2 0   2  3
    

~ 1  0 1   2 0 
B  T 1B   
2 1  3 0 1 
~  6 2
C  CT   0 3     6 0
 2 0 
所以新状态空间表达式为:

64
  0 1   0
 
z    2  3 z  1  u
    
 y   6 0 z

显然上式为能控标准 I 型。
二、系统特征值不变性及系统的不变量
状态方程中的系数矩阵 A,也称为状态矩阵,是一个很重要的矩阵。
它包含了许多有关系统特征的重要信息,这里讨论 A 的特征值。
系统特征值就是状态矩阵 A 的特征值,也即特征方程
I  A  0 (1.102)
的根。n  n 方阵 A 有 n 个特征值。实际的物理系统,A 为实数矩阵,故
特征值或为实数,或为共轭复数对。
例 1.17 若系统矩阵为:
 0 1 
A  
  2  3
求它的特征值。
矩阵 A 的特征方程为:
 1
I  A    2  3  2  (   1 )(   2 )  0
2 3
1  1 ,  2  2 即为特征方程的根。
状态矩阵 A 的一个重要性质是其特征值的不变性,即在状态变量的
线性变换中,新老状态方程的 A 阵和 A ~ 阵的特征值是相同的。为了证
~
明这一点,只要证明 I  A  I  A 即可,证明如下:
~
I  A  I  T  1 AT  T  1T  T  1 AT

65
 T 1 ( I  A )T

 T 1  I  A T

 T 1T ( I  A )
 I  A
从而我们证明了在对状态变量作线性变换的情况下,A 阵的特征值是
~ 阵的特征方程是相同的。即如设系统的特
不变的。这还意味着 A 阵和 A
征方程为:
I  A   n  a 1  n  1  a 2  n  2    a n  1   a n  0
则方程的系数是不变的量,故称特征多项式的系数为系统的不变量。
同样可以证明,对于给定的系统,尽管其状态空间表达式不同,但
反映输入—输出的特性的传递函数阵却是具有相同的形式。
~ ~ ~ ~ ~
G ( s )  C ( SI  A )1 B  D
 CT ( ST 1T  T 1 AT ) 1 T 1 B  D
 CT [T 1 ( SI  A)T ]1 T 1 B  D
 CTT 1 ( SI  A) 1 TT 1 B  D
 C ( SI  A) 1 B  D
 G( s)
可见一切代数上等价的线性系统都有相同的传递函数阵。

三、特征向量
设 P i 为 n 维向量,  i 为标量,它是矩阵 A 的特征值,若下式成

AP i  i P i
则称向量 P i 为矩阵 A 的对应于特征值  i 的特征向量。从上式可以看出,
特征向量 P i 经 A 线性变换后,方向不变,仅长度增加了  i 倍。
四、化状态空间表达式为约当标准型
这里介绍化状态空间表达式为约当标准型的方法。显然,约当标准
型可由线性变换而获得。这里分两种情况:若矩阵有两两相异的特征
值,则可化为对角标准型;若系统矩阵有重根,则可化为一般的约当
66
标准型。

1、状态矩阵 A 无重根时
对线性定常系统
x  A x  B u (1.103)
如果 A 有 n 个两两相异特征值,则存在非奇异矩阵 T,通过线性变换
~  T 1 x ,使之化为对角线规范形式
x
~~ ~
~  A
x x  Bu
 1 0
~  
A    (1.104)
 0  n 
其中 1 ,  2 ,  n 为矩阵 A 的特征值。
证明:首先令 P i 为 A 的属于特征值  i 的特征向量,且
 p1i 
p 
P i   2i  ( i = 1, 2, …n)
  
 
 pni 
因为 1 ,  2 ,  n 为两两相异,故 P 1 , P 2 , P n 必线性无关,由这些特
征向量组成矩阵 T:
 p11 p12  p1n 
p p22  p2 n 
T  [P1 P2  P n ]   21 
    
 
 p n1 pn 2  pnn 
必是非奇异的。进而,根据特征向量的关系式
AP i  i P i
我们有

67
AT  A P 1 P 2  P n    AP 1 AP 2  AP n 
  1 P 1 2 P 2   n P n 
 1   1
 0 

2  2 
   0 
  P1 P2  P n    T  
   
    0  
 n   n 
 0 

因为 T 是非奇异阵,必有逆。将上式左乘 T -1 ,即得
 1 
 2 
 0 
 
T  1 AT    
 
 0  
  n 

对(1.103)式,令 x  T x~ ,则得
~  AT x
Tx ~  Bu
上式两边左乘 T-1 得
~  T 1 AT x
x ~  T 1 B u

~ ~
x~  A x~  B u
其中:
~ ~
A  T 1 AT , B  T 1 B
由此,上述命题得证。
例 1.17 已知系统
2  1  1 7
x   0  1 0  x   2 u
   
 0 2 1   3
将此状态空间表达式化为对角标准型。
解:A 的特征方程为:

68
2 1 1
I  A  0  1 0  (   2 )(   1 )(   1 )
0 2  1
所以 A 的特征值为:
1  2 ,  2  1 ,  3  1
可见此系统的特征值两两相异。进而可确定线性变换矩阵 T,根据特征
向量关系式:
AP i  i P i
定出 A 的分别属于 1 、  2 、  3 的特征向量。

A P 1  1 P 1

 2  1  1  p11   p11 
0  1 0   p   2 p 
   21   21 
 0 2 1   p31   p31 

 p 21  p31  0  p11  K ( 任意常值 )


 
得到  3 p21  0   p21  0
 2 p  p  0 p  0
 21 31  31
我们任选一组:
1 
P 1  0
 
0
同理可定出
1   0
P 2  0 , P 3   1 
1    1
于是得到
1 1 0  1  1  1
 1 
T  [P1 P2 P 3 ]  0 0 1  和 T  1 0 1
0 1  1 0 1 0 

69
从而可以求得

1  1  1  2  1  1 1 1 0 
~
A  T  1 AT  0 1 1   0  1 0  0 0 1 
0 1 0   0 2 1  0 1  1
1  1  1  2 1 0   2 0 0 
 0 1 1   0 0  1   0 1 0 
0 1 0   0 1 1   0 0  1
1  1  1 7  2
~
b  T  1 b  0 1 1   2  5 
0 1 0   3  2
这样,给定系统的状态方程的对角标准型为

2 0 0   2
x~   0 1 0  x~  5  u
   
 0 0  1  2
2、状态矩阵 A 有重根时
对线性定常系统(1.103)式,设 A 的特征值为 1 、 2 、 k 其中
特征值  j 为 m j 重特征值,所以有
k
mj  n ( j  1,2 , , k )
j 1

对于上述有重根的情况,可以回顾 § 1.3 中传递函数状态空间表达式


的实现,这时导出的形式叫约当标准型,就是说总可以找到变换矩阵
T,使得
J1 
 
~  J2 0 
1
A  T AT   J3 
 
 0  
 J K 
这里

70
 j 1 0 

 j 1 
Jj   j  
 
 0  1
  j  m
 j m j

称为第 j 个约当块。
现在的问题是怎样得到变换矩阵 T。因为特征值重复,所以得不到 n
个线性无关的特征向量。即不能用化对角标准型的方法,假设对 m1 重
特征值 1 ,只能得到一个特征向量 P 1 ,其余向量 P 2 , P 3 , , P m1 尚未
求出,但由

J1 
 
 J2 0 
~  
A  T  1 AT   J3 
 
 0  
 J K 


~
AT  TA
将此式展开
m1
A[ P 1 P2  P m1  Pn]

71
 1 1 0 
 
m1  
 1  
 0 
 0  1 
 1 
 [P1 P2  P m1  P n ] 
 J2 0
 
 J3 
 0 
 
 0  
 J k 

现在研究上式两边矩阵的第 2 列到第 m1 列,得下列关系式:


 A P 2  P 1  1 P 2 ( A  1 I ) P 2  P 1
 AP  P   P ( A   I ) P  P
 3 2 1 3  1 3 2
 
 
 A P m  P m  1  1 P m ( A  1 I ) P m  P m 1
1 1 1 1 1

上式有 m1-1 个方程和 P 2 , P 3 , P m1 共 m1-1 个未知量,由上式可求得


P 2 , P 3 , P m1 。
同理可求得 P m1 -以后的特征向量,于是可组成 T 矩阵。
例 1.18 已知系统状态空间表达式为:

 3 1 0 0
x   0  3 1  x  0 u
   
  4 0 0 9
试将此表达式化为约当标准型。
解:求 A 的特征值
  3 1 0
I  A  0   3  1  (   3 )2   4  (   1 )2 (   4 )  0
4 0 
所以特征值为:

72
1   2  1 ,  3  4
求特征向量,由
A P 1  1 P 1
  3 1 0  P11   P11 
 0  3 1  P     P 
即    21   21 
  4 0 0  P31   P31 


1 
P 1   2
4
由 ( A  1 I )P 2  P 1
 3 1 0  1 
  0 
即   3 1  ( 1 )I  
 P 2   2

   4 0 0  4
 

1 
P 2   3
8
由 AP 3  3 P 3

 1
P 3    1
 
 1 
所以
1 1 1
T  [P1 P2 P 3 ]   2 3  1
 4 8 1 
 11 7  4
1
T 1    6  3 3 
9
 4  4 1 
因而
73
 1 1 0
~
A  T AT  0  1 0 
1 
 
 0 0  4
  4
B  T B   3 
~ 1

 1 
此系统的约当标准型为:
 1 1 0   4
~   0  1 0  x
x ~   3 u
   
 0 0  4  1 
§1.7 由状态方程导出传递函数阵
上面我们曾讨论了由系统的传递函数推导状态方程的问题。在这一
节里,我们从状态方程出发,来导出系统的传递函数阵,进一步讨论
这两种表达式之间的内在联系。
一、单输入一一单输出系统
令系统的状态方程和输出方程为:
 x  A x  bu
 T (1.105)
 y  c x  du
式中 x 为 n 维向量,y、u 分别为输出和输入,它们都是标量。在这种

情况下,A 是 n  n 方阵, b 是 n  1 列阵, cT 是 1  n 行阵,d 为标量,


一般为零。
对(1.105)式进行拉氏变换,并假定初始条件为零,则有
 S x ( s )  A x ( s )  bu( s ) (1.106)
 T
 y( s )  c x ( s )  du( s ) (1.107 )
由(1.106)式得
x ( s )  ( SI  A)1 bu( s ) (1.108)
将(1.108)式代入(1.107)式得

74
T
y( s )  [c ( SI  A) 1 b  d ]u( s ) (1.109)
于是可得传递函数为:
y( s )
 c ( SI  A )1 b  d
T
g( s )  (1.110)
u( s )
可见只需知道系统状态方程中的系数阵 A, b , c T 和 d,就能求得传递
函数 g(s)。
例 1.19 已知一个系统的状态方程和输出方程为:
 x 1  x 2

 x 2  x 3
 x  5 x  3 x  2 x  u
 3 1 2 3

3 1
y
x1  x 2  x 3
2 2
求系统的传递函数。
解:首先将状态方程和输出方程用矩阵形式表示成
 x 1   0 1 0   x1  0
     x    0 u
x
    0 0 1
2  2   
 x 3    5  3  2  x 3  1 

 x1 
 3 1  
y 1 x2
2 2   
 x3 
因为
1
S 1 0 
adJ ( SI  A)
[ SI  A]   0
1
S  1  
| SI  A |
 5 3 S  2

 S 2  2S  3 S2 1
1  
 3   5 S ( S  2 ) S 
S  2S 2  3S  5  2
 5S  ( 3S  5 ) S
 

75
3 1  S 2  2S  3 S2 1   0
 2 1
2   
g( s )  3 5 S ( S  2) S   0
S  2S 2  3S  5   
  5S  ( 3 S  5) S 2  1 
3 1
1 
2 1 
2   S 2  2S  3
 3   S 
S  2 S 2  3 S  5  2  2 S 3  4 S 2  6 S  10
S 
 
在经典控制理论中,已知 g(s)具有如下的形式:
y( s ) b0 S n  b1 S n1    bn1 S  bn
g( s )   n (1.111)
u( s ) S  a 1 S n 1    a n 1 S  a n
显然,(1.110)和(1.111)两式应是相等同的。为了讨论这两个表达
式之间的联系,我们把(1.110)式化为如下形式:
T adj ( SI  A )
g( s )  c bd
| SI  A |
T
c adj ( SI  A )b  d | SI  A |
 (1.112)
| SI  A |

比较(1.112)和(1.111)两式可知,传递函数的分子多项式等同于

多项式 cT adj ( SI  A )b  d | SI  A | ;传递函数的分母多项式即为系数

矩阵 A 的特征多项式。换句话说,传递函数的极点即为状态矩阵 A 的

特征值。由此也可得出单输入——单输出线性定常系统稳定的充要条

件是要求 g(s)的极点均具有负实部。在状态空间表达式中,这即要求状

态矩阵 A 的所有特征值均具有负实部。

二、多输――多输出系统
已知系统的状态空间表达式为

76
 x  A x  B u
 (1.113)
 y  C x  Du
式中:
u    r  1 输入列向量; y    m  1 输出列向量;
A    n  n 系统矩阵; B    n  r 控制矩阵;
C    m  n 输出矩阵; D    m  r 直接传递矩阵;
x    n  1 状态向量。
在初始条件为零的前提下,对式(1.113)作拉氏变换,得
 x ( s )  ( SI  A) 1 B u( s )

 y( s )  C x( s )  D u( s )
于是得传递函数阵
G ( s )  C ( SI  A )1 B  D (1.114)
它是一个 m  r 的矩阵函数,设
g ij ( s ) ( i  1 ,2 , m , j  1,2 , r )
为 G( s) 的元,则系统的传递函数阵 G( s) 可表示为如下的形式:
 g11 ( s ) g12 ( s )  g1r ( s ) 
 g ( s ) g ( s )  g ( s )
G( s )   
21 22 2r
(1.115)
  
 
 g m1 ( s ) g m 2 ( s )  g mr ( s )
并且容易看出,其元 g ij ( s ) 都是标量函数,它在物理上表示为第 j 个
输入对第 i 个输出的传递关系,当 i  j 时,意味着不同标号的输入与
输出有相互关联。称为耦合关系,这正是多变量系统的特点。
例 1.20 考虑这样一个系统,它的状态方程为:
 x 1   0 1   x1  1 0  u1 ( t ) 
 x    2  3  x   1 1  u ( t )

 2   2    2 

输出方程为:

77
 y1  1 0   0 0
     x1     u1 ( t ) 
y  1 1  1 0
 2   x     u ( t )
 y 3  0 2  2
0 1  2 
求系统的传递函数矩阵。
解:因为
1 0  0 0
 0 1  1 0   1 0 
A 
 2  3  ,B  1 1 , C  1 1  , D   
    0 2 0 1

 S3 1 
1  ( S  1 )( S  2 )
S 1  ( S  1 )( S  2 ) 
( SI  A ) 1    
2 S  3  2 S 
 ( S  1 )( S  2 ) ( S  1 )( S  2 ) 
因此,系统的传递矩阵为:
G ( s )  C ( SI  A ) 1 B  D
S3
1 0  
1
 0 0
( S  1 )( S  2 ) ( S  1 )( S  2 )  1 0 
 1 1     1 0
2 S  1 1 
0 2  0 1
 ( S  1 )( S  2 ) ( S  1 )( S  2 ) 
 S4 1 
 ( S  1 )( S  2 ) ( S  1 )( S  2 ) 

S4 1
 
 S2 S2 
 2( S  2 ) S  5S  2 
2
 
 ( S  1 )( S  2 ) ( S  1 )( s  2 ) 
此传递函数矩阵有六个元素,每个都是一个传递函数。
三、组合系统的空间表达式及传递函数阵
实际的控制系统,往往由多个子系统组合而成,或并联,或串联,
或形成反馈连接,这种系统称组合系统。这里仅限于讨论线性定常系
统的组合系统的状态空间表达式及其传递函数阵。
设子系统 1 为:

78
 x 1  A1 x 1  B1 u1
 (1.116)
 y 1  C1 x 1  D1 u1
简记为: 1 :( A1 , B1 , C 1 , D1 )
和子系统2 为:
 x 2  A2 x 2  B2 u 2
 (1.117)
 y 2  C 2 x 2  D2 u 2
简记为  2 :
( A2 ,B 2 , C 2 , D2 ).
1、并联组合系统
所谓并联组合系统,是指各子系统有相同的输入,组合系统的输出
是各子系统的代数和,其结构简图如图 1.25 所示。

u1 y1
A1 、B1 、C1 、D1
u +
y
+
u2 y2
A2 、B2 、C2 、D2

图 1.25 并联组合系统
由图可知:
u1  u2  u
y  y1  y 2

并由式(1.116)和(1.117)得状态空间表达式:
 x 1   A1 0   x 1   B1 
 x    0 
A2   x 2   B2 
u
 2 
 x1 
y   C1 C 2     [ D1  D2 ]u (1.118)
 x2 
从而组合系统的传递函数阵为:
( SI  A1 )1 0   B1 
G ( s )   C1 C2   1   B 
  D1  D2 
 0 ( SI  A2 )   2 

79
 [ C1 ( SI  A1 )1 B1  D 1 ]  [ C 2 ( SI  A2 )1 B2  D2 ]
 G1 ( s )  G2 ( s )
故系统并联时,系统传递函数阵等于子系统的传递函数阵之和。
2、串联组合系统

A 1 , B1 , C1 , D 1 A 2 , B2 , C2 , D 2
u = u1 y1 = u2 y2 = y

u1 = u1
图 126 串联组合系统
串联组合系统如图 126 所示,从图可知:
u  u1 , y1  u2 , y  y2

并由式(1.116)和(1.117)得

 x 1  A1 x 1  B1 u

 x 2  A2 x 2  B 2 C 1 x 1  B 2 D1 u
y  C x  D C x  D D u
 2 2 2 1 1 2 1

即为:
  x 1   A1 O   x 1   B1 
     B C A     B D  u
 x 2   2 1 2  x2   2 1
 (1.119)
 y   D C C   x1    D D  u
 2 1 2   2 1
 x2 
而传递函数阵为:
1
 SI  A1 O   B1 
G  s    D2C1 C2    D2 D1  (1.120)
  B2 C 1 SI  A2   B2 D1 
 SI  A1 O 
由于  为下三角矩阵,所以
  B2 C 1 SI  A2 
1
 SI  A1 O   ( SI  A1 ) 1 O 
  B C SI  A    (1.121)
 SI  A2  B2C1  SI  A1   SI  A2   1 
1 1
 2 1 2

将式(1.121)代入式(1.120)得:

80

G  s    D1C 1 C 2  
 SI  A1  1 O   B1 
 D D 

 SI  A2  B2 C 1  SI  A1 
1 1
 SI  A2  1   B2 D1  2 1
 D2 C 1  SI  A1  1 B1  C 2  SI  A2  1 B2 C 1  SI  A1  1 B1
 C 2  SI  A2  1 B 2 D1  D2 D1 ( 1.122 )
 
 C 2  SI  A2  1 B2  D2 C 1  SI  A1  1 B1  D1 

G ( s )  G2 ( s ).G1 ( s )
即串联组合系统的传递函数阵等于子系统传递函数阵之积。应注意
先后次序不能颠倒。
3、具有输出反馈的系统
如图 1.27 所示为常数反馈的情况。

u + u H y
A, B, C
-

图 1.127 常数反馈系统

从图可知,系统在没有反馈时,系统前向通道的传递函数矩阵为:
G0  s   C  SI  A 1 B (1.123)
闭环后系统状态空间表达式为:
 x  A x  B( u  H y )  ( A  BHC ) x  B u
 (1.124)
y  Cx
故常数反馈系统传递函数阵为:
G ( s )  C ( SI  A  BHC )1 B (1.125)
下面我们进一步推导 G0(s)与 G(s)的关系。
先计算 G(S)[I+HG0(S)]

81
G ( s ) I  HGo( s )  G ( s )  G ( s ) HGo( s )
 C ( SI  A  BHC ) 1 B  C ( SI  A  BHC ) 1 BHC ( SI  A) 1 B
由于 (1.126)
 SI  A  BHC  1 BHC   SI  A  BHC  1 BHC  I  I
  SI  A  BHC  BHC   SI  A  BHC   SI  A  BHC   I
1 1

   SI  A  BHC  ( SI  A )  I
1
( 1.127 )
将(1.127)代入(1.126)式,得
G ( s ) I  HGo( s )  C ( SI  A  BHC )1 B  C  ( SI  A  BHC )1
( SI  A )  I  ( SI  A )1 B


 C  SI  A  HBC 
1
  SI  A  BHC 
1

 ( SI  A )1 B
 C ( SI  A )1 B  G0 ( s )
所以 G  s   G0  s   I  HG0  s   1 (1.128)
而 G0  s    I  G  s  H   1 G  s  (1.129)
再计算  I  G0  s  H G  s  , 同理还可推出
G  s    I  Go s  H  Go  s 
1
( 1.130 )
Go  s   G  s   I  HG  s  
1
( 1.131 )
再考察如图 1-28 所示的动态反馈的情况:

u u1
+ y1
A1, B1, C1

y2
u2
A2, B2, C2

图 1.28 动态反馈系统
由图可知:
u1  u  y 2
y  y1  u 2
82
 x 1  A1 x 1  B1 u1
1  y  C x 1
:
 1 1

 x 2  A2 x 2  B2 u 2
 2  y  C x2
:
 2 2

由此可得动态反馈系统的状态空间表达式为:
 x 1  A1 x 1  B1 u  B1C 2 x 2

 x 2  A2 x 2  B2C1 x 1
 y  C1 x 1

化为矩阵形式:
 x 1   A1  B1C 2   x 1   B1 

 x   B C  u (1.132)
 2  2 1 A2   x 2   0 
 x1 
y   C 1 0  
 x2 
便可得传递函数阵:
1
 SI  A1 B1C 2   B1 
G  s    C1 0 
  B2C1 SI  A2   0 
其中  SI  A 1 可这样来计算:
1
F F12   SI  A1 B1C 2 
令  SI  A 1
  11 
 F21 F22    B2C1 SI  A2 
则有
 F11 F12   SI  A1 B1C 2   I O 
F 
 21 F22    B2C1 SI  A2   0 I 
展开得
F11  SI  A1   F12 B2C1  I ( 1.133 )
F11 B1C 2  F12  SI  A2   0 ( 1.134 )
由(1.134)式得
F12   F11 B1 C 2  SI  A2  1
由(1.133)式得:

83
F11  SI  A1   I  F12 B2C1
 I  F11 B1C 2  SI  A2 
1
B2C1
所以
F11   SI  A1  1  F11 B1 C 2  SI  A2  1 B 2 C 1  SI  A1  1
因而
F F22   B1 
G  s    C1 0  11  C1F11 B1
 F21 F22   0 
 C1  SI  A1  B1  C1F11 B1C 2  SI  A2  B2C1  SI  A1 
1 1 1
B1
 G1  s   G  s  G2  s  G1 ( s )
于是可得动态反馈系统的传递函数矩数为:
G  s   G1  s   I  G2  s  G1  s  
1
(1.135)
同理也可求得
G  s    I  G1  s  G2 ( s ) 1 G1  s  (1.136)

84
第2章 线性系统状态方程的解(模块十)

上一章我们讨论了如何建立系统的状态空间表达式,这一章将讨
论如何解系统的状态方程。

§2.1 线性定常系统状态方程的解
线性定常系统的状态方程为:
x  A x  B u , x(t0 )  x 0 (t ≥ t0 ) (2.1)
其中 x , u 分别为 n , r 维向量,系数矩阵 A、B 分别为 n  n , n  r 常
数矩阵。
对于上述方程,现讨论具体求解的方法。
一、齐次方程的解
在求微分方程式(2.1)的解之前,首先考虑输入项 u 为零的齐次
方程式
x  A x (2.2)
的解。此时无控制作用,系统处于由初始状态引起的自由运动状态,
所以齐次方程式的解也称自由解。
若初始时刻 t 0 时的状态给定为 x ( t 0 )  x 0 ,则式(2.2)有唯一
确定解:
x ( t )  e A ( t -t 0 ) x 0 (t ≥ t0 ) (2.3)

若初始时刻从 t  0 开始,即 x ( 0)  x 0 ,则(2.2)解形式 为:


x( t )  e At x 0 ( t ≥ 0) (2.4)
其中 e At 或 e A( t -t 0 ) 称为矩阵指数,为 n  n 方阵。
1. 用直接法证明
首先我们用直接法来证明上述基本结论。和通常的标量微分方程
类似,先假定(2.2)式的解 x (t ) 为时间 t 的向量幂级数形式,即

1

x ( t )  b 0  b1 t  b 2 t    b k t     b k  t k
2 k
(2.5)
k 0

式中: t ≥ 0 ,将(2.5)式代入方程(2.2)式得
b1  2b2 t  3b 3 t 2    k b k t k 1  
 A( b 0  b1 t  b k t k   ) (t≥ 0) (2.6)
因为上式对 t ≥ 0 均成立,故等式两边 t 的同次幂项的系数应相等,可
得如下一组关系式:
b1  Ab 0
1 1
b2  Ab1  A2 b 0
2 2!
1 1
b 3  Ab 2  A3 b 0
3 3!
………
1 1 k
bk Ab k  1  A b0
k k!
………
在式(2.5)中,令 t  0 ,可得
b 0  x ( 0)  x 0
将以上结果代入(2.5)中,即有
1 2 2 1
x ( t )  ( I  At  A t    Ak t k  ) x 0 ( 2. 7 )
2! k!
或写成

1 k k
x( t )  (  A t )x0 ( 2.8)
k  0 k!

仿照标量指数的定义
 1 2 2 1
e at  1  at  a t   akt k  
2! k!
∞ 1
 ∑ akt k
k 0 k !

我们可定义矩阵指数为:

2
 1 2 2 1 k k
e At
 1  At  A t  A t 
2! k!
(2.9)
∞ 1 k k
∑ A t
k 0 k !
故(2.7)式可表示为
x ( t )  e At x 0
若用 ( t  t 0 ) 代替 t,即初始时刻为 t0 ,同样可证明

x( t )  e A( t - t 0 ) x 0
的正确性。
2.用 Laplace 变换法证明
式(2.4)也可以采用 L a p l a c e 变换法来证明。对(2.2)式两边取
L a p l a c e 变换。可得

S  x ( s )  x 0  A x ( s )
其中 x ( s )  L[ x ( t )] 为状态向量 x (t ) 的拉氏变换,经整理有:

( SI - A) x ( s )  x 0

将上式两边左乘 ( SI - A )1 ,从而有


x ( s )  ( SI  A)1  x 0
将上式作反变换得齐次方程的解,即
x ( t )  L1[( SI  A)1 ]  x 0 (2.10)
I A A2 Ak
因为 ( SI - A )(  2  3    k  1   )  I
S S S S
I A A2 Ak
所以 ( SI  A ) 1   2  3    k 1  
S S S S
将上式代入(2.10)式,即得

3
I A A2 Ak
x( t )  L  1
     k 1    x 0
S S2 S3 S
1 1 1 (2.11)
 ( I  At  A2 t 2  A3 t 3    Ak t k  ) x 0
2! 3! k!
 e At x 0
可见 e At  L1 [( SI  A) 1 ] , 从而(2.4)式得到证明。
二、矩阵指数函数——状态转移矩阵
1.状态转移矩阵
前面已经得齐次方程(2. 2)的自由解为:
x ( t )  e At x 0 或 x ( t )  e A( t - t 0 )  x 0
上式的物理意义是系统在 t ≥ 0 或 t ≥ t 0 的任一瞬时的状态 x (t ) ,只是
初始时刻状态向量 x 0 的一种变换关系。变换矩阵为 e At 或 e A( t -t 0 ) 。指数
矩阵 e At 或 e A( t -t 0 ) 是一个 n  n 的时间 t 的函数矩阵。这意味着它使状态
向量随着时间的推移在不断地作坐标变换,即不断在状态空间中作转
移。因此指数矩阵 e At 或 e A( t -t 0 ) 也称状态转移矩阵。通常表示为:
 ( t )  e At 或  ( t  t 0 )  e A( t  t0 )
其中  ( t ) 表示为 x ( 0) 到 x (t ) 的状态转移矩阵,  ( t  t 0 ) 表示为 x ( t 0 )

到 x (t ) 的状态转移矩阵。因此齐次状态方程(2.2)式的解也可表示为:
x(t )   ( t )  x 0
或 x(t )   ( t  t0 )  x 0
可以看出,系统作自由运动时,它的运动形态将是唯一地由状态转移
矩阵所决定,它包含了系统自由运动的全部信息。它的几何意义,以
二维状态向量为例,表示在图(2.1)中。
x2

x20 x21
x(t1) x22
x(0) ф(t1) φ(t2-t1)
φ(t2) x(t2)
0 t1 t2 t
x10
x11 4 x12
x1
图 2.1
 x10 
图中设 t  0 时,状态的初态为 x (0)    ,若已知状态转移矩
 x 20 
阵  ( t 1 ) ,则 t  t 1 的状态为:
 x11 
x ( t1 )      ( t1 ) x ( 0 ) ( 2.12)
 x21 
如果已知状态转移矩阵  ( t 2 ) ,则 t  t 2 的状态为
 x12 
x ( t 2 )      ( t 2 )  x ( 0) ( 2.13)
 x22 
这就清楚地表明状态从 x ( 0) 开始,随着时间的推移,它将按  ( t 1 ) 或
 ( t 2 ) 作自由运动,最后状态转移到 x( t 1 ) 或 x (t 2 ) ,相应地在状态空间
中描绘出一条如图 2.1 所示的运动轨线。
若 t1 为初始时刻, x ( t1 ) 为初始状态,则 t  t 2 的状态为:
x ( t 2 )   ( t 2  t1 )  x ( t1 ) ( 2.14)
将式(2.12)的 x ( t1 ) 代入上式,则得
x ( t 2 )   ( t 2  t1 )   ( t1 ) x ( 0) ( 2.15)
式(2.15)表示从 x (0) 转移到 x (t 1 ) ,再由 x (t 1 ) 转移到 x (t 2 ) 的运
动轨线。
 ( t 2  t1 ) ( t1 )   ( t 2 )
或 e A( t 2  t1 )e At1  e At 2 ( 2.16 )
这种关系称为组合性质。
我们知道在经典控制理论中,求解高阶微分方程时,对初始条
件的处理是相当困难的,通常都是假定初始时刻 t  0, x ( 0)  0 ,
即从零初始条件出发去计算系统的输出响应,而从上面分析中可以看

5
出,在现代控制理论中,利用状态转移矩阵,对任意时刻的状态量
x (t ) ,可以由任意指定的初始时刻 t 0 的初始向量 x ( t 0 ) 求得。就是说,
矩阵微分方程的解,在时间上可以任意分段求取。这是系统用状态方
程描述的又一优点。
2.状态转移矩阵的性质
现在我们来简单地阐明状态转移矩阵的几个重要性质。
(1)性质一
( t  t )  ( 0 )  I
 ( 2.17 )
或 e A( t  t )  e A 0  I 
本性质直接根据定义(2.9)式证得。意味着状态向量从 t 时刻又转移
到 t 时刻,显然状态向量是不变的。
(2)性质二
 ( t )   ( )   ( t   )
或  ( 2.18)
e At  e A  e A( t  ) 
这是组合性质,意味着从 t   转移到 t  0 ,再从 t  0 转移到
t  t 的组合,即
 ( t  0 )   ( 0  (  ))   ( t  (  ))   ( t   )
本性质也可由定义(2.9)式直接证明。
(3)性质三
 ( t )  1   (  t )
或  ( 2.19 )
At  1  At
(e ) e 
这意味着转移矩阵总是非奇异的,必有逆。利用这个性质,可以在已
知 x (t ) 的情况下,求出 t 时刻以前的 x ( t 0 ), (t 0  t ) 。
证明:由式(2.18)
 ( t   )   ( t )   ( )
或 e A( t  )  e At  e A
现令   t ,得

6
 ( t )   ( t )   ( t  t )  I
或 e At e  At  e A( t  t )  I
同样  (   t )   (  )   ( t )

或 e A(   t )  e A  e At
令   t ,得
 ( t )   ( t )   ( t  t )  I
或 e  At  e At  e A(  t  t )  I
从而证明了  (  t ) 为  ( t ) 的逆。或 e  At 为 e At 的逆。
(4)性质四
对转移矩阵有
( t )  A   ( t )   ( t )  A

或 d At  ( 2.20 )
e  A  e At  e At  A 
dt 
证明:据定义

A2 t 2 A3 t 3
c At
 I  At   
2! 3!
由于此无穷级数对有限 t 值是绝对收敛的,所以可将上式两边对 t 求导,

d At A3 t 2 A4 t 3
2
e  A A t   
dt 2! 3!
d At A2 t 2 A3 t 3
因此 e  A( I  At     )  A  e At
dt 2! 3!
d At A2 t 2 A3 t 3
或者 e  ( I  At     )  A  e At .A
dt 2! 3!
即: ( t )  A   ( t )   ( t )  A
此性质得证。
(5)性质五
设 有 n  n 矩 阵 A 和 B , 当 且 仅 当 AB  BA 时 , 有

7
e At e Bt  e ( A B )t ,而当 AB  BA 时,则 e At e Bt  e ( A B )t 。
证明:根据定义式

( A  B )t ( A  B )2 2 ( A  B )3 3
e  I  ( A  B )t  t  t 
2! 3!
A 2 t 2 ABt 2 BAt 2 B 2 t 2
 I  ( A  B )t  (    )
2! 2! 2! 2!
A 3 t 3 A 2 Bt 3 ABAt 3 AB 2 t 3 BA 2 t 3 BABt 3
(     
3! 3! 3! 3! 3! 3!
B 2 At 3 B 3 t 3
  )
3! 3!

A2 t 2 A3 t 3 B 2t 2
e At  e Bt  ( I  At     )( I  Bt 
2! 3! 2!
B 3t 3
  )
3!
A2t 2 2 B 2t 2
 I  ( A  B )t  (  ABt  )
2! 2!
A 3 t 3 A 2 Bt 3 AB 2 t 3 B 3 t 3
(    )
3! 2! 2! 3!
将上述两式相减得:
e ( A  B )t  e At  e Bt
BA  AB 2 BA 2  ABA  B 2 A  BAB  2 A 2 B  2 AB 2 3
 t  t 
2! 3!
上 式 说 明 , 当 A和 B 是 可 交 换 的 , 等 式 右 边 为 零 , 故
e ( A B )t  e At  e Bt ;当 A 和 B 是不可交换时,等式右边不为零,故
e ( A B )t  e At  e Bt ,可以看出这与标量指数函数的性质是不同的,此
性质得证。
(6)性质六
若 A 为对角矩阵。即

8
 1
 0 
 2 
A   
 
0 n 
 
e 1 t 
 0 
 e 2t 
At
则 e  ( t )     ( 2.21 )
 
 0 ent 
 
证明:根据定义

1 0 
1t 0 
 
 k k
At  1   2 t 
e At    
  
k  0 k!
 
   
0 1 0 n t 
   
 12 t 2    1k t k 
 2! 0    k! 0 
  k  0 
22 t 2 

 k k
2t 

 2!

    

k  0 k! 
     
 2 2
n t  
kn t k 
 0
2! 
  0  
  k  0 k! 

 e 1 t 0 

 e2t 
 

 nt 
0 e 
 
则式(2.21)得证。
(7)性质七

9
若 A 能通过非奇异变换予以对角线化,即
T 1  A  T  

 e 1 t
 0 
 e 2t  1
e At  ( t )  T    T ( 2.22 )
 n t

 0 e 
 
证明:根据定义式

A2 t 2 A3t 3 Ak t k
e At
 I  At 
2!

3!
 
k 0 k!

因为 A 能通过非奇异变换予以对角线化,即
 1
 0 
 2 
T 1  A T      
 
0 n 
 
同理有
 12
 0 
 22 
T  1  A2  T  T  1 AT  T 1 AT    
 
0 2n 
 
对于一般项有
 1k
 0 
 k2 
T  1  Ak  T  ( T 1 AT )( T  1 AT )    
 
0 kn 
 
于是得

10

1
T e  T   t k T  1 AkT
 1 At

k  0 k!

 1 k k 
 k! t 1 0   e 1 t
k 0  0 
  

 1
 k 0 k! t k  k2   e 2t 
     
  0 nt 


1 k k   e 
 0 k 0 k! n 
t 

所以:

e 1 t 
 0

 e 2t  1
e At T  T
 
 0 ent 
 
于是(2.22)式得证。
(8)性质八
若 A 为 J o r d a n 型矩阵


1 0 
  1 
  1 
A J    , 则可得
   
  1 
 0
  

11
 1 2 1 
1 t t   t n 1 
2! ( n  1 )!
 
0 1 1 n 2 
t   t
 ( n  2 )! 
e Jt   ( t )  e t         ( 2.23 )
 
      
0 0 0   t 
 
0 0 0   1 
式(2 23)证明可仿照性质六式(2.21)证明方法,同学们可自行证明。
(9)性质九
若 A 能通过非奇异变换变成约当标准型,即
 

1 0 
  1 
T AT  J  
1
   则
 
  1 
  
 0 
e At   ( t )  Te Jt T 1 ( 2.24 )
读者可仿照性质七式(2.22)方法来证明。
3 . 状 态 转 移 矩 阵  ( t )或e At
的计算
上面我们介绍了状态转移矩阵的性质,在具体分析线性定常系统
时,不可避免地要碰到计算  ( t )或e At 的问题,这里将介绍几种主要
计算方法。
(1 ) 直 接 利 用 e At 的 级 数 展
开法
根据矩阵指数的定义, e At 可以展开成幂级数:
A2 t 2 A3 t 3 Ak t k
e At
 I  At     ( 2.25 )
2! 3! k!

12
At At At At A 2 t 2
e At  I   ( ) ( )
1! 2 1! 3 2!
At A( k 1 ) t ( k 1 )
 ( )   ( 2.26 )
k ( k  1 )!
从 式 ( 2.25 ) 可 以 看 出 , 即 使 A 很 简 单 , 手 算 也 是 不 容 易 的 。 式
(2.25)不是闭合表达式,只能取有限项作近似计算,高阶项忽略。式
(2.26)中圆括号内每一项完全等于前一项。它给出了一种方便的递推
方案,可用计算机实现。显然编程简单,但是由于 e At 的收敛比较慢,
与其它方法相比计算时间较长。
 0 1 
例 2.1 已知 A    求e
At
  2  3 
解:将 A 直接代入(2.25)式
A2 t 2 A3 t 3
e At  I  At   
2! 3!
2 3
 1 0  0 1   0 1  t2  0 1  t3

0 1    2  3   2  3 2!   2  3 3!  
 t  
       
 3 7 
 1  t2  t3  t  t2  t3  
 2 6
7 7 5 
  2t  3t 2  t 3   1  3t  t 2  t 3  
 3 2 2 
(2)应用 Gayley  Hamilton 定理求 e At
( a )Caylay  Hamilton 定理
设 n  n 矩阵 A 的特征多项式为:
f (  )   n  a1  n1    a n1   a n ,则 A 必满足其自身的特征方
程,即
f ( A )  A n  a1 A n  1    a n  1 A  a n I  0 ( 2.27 )
证明:由下式
adj ( I  A )
( I  A ) 1 
I  A
两边右乘 ( I  A ) 得

13
adj ( I  A )
( I  A ) 1  ( I  A )   ( I  A )  I
I  A
可导出:
I  A I  adj ( I  A )  ( I  A ) ( 2.28 )
其中 adj ( I  A ) 的元为  的 ( n  1 ) 次多项式,所以可表示为:
adj ( I  A )  H 1 n  1  H 2 n  2    H n  1  H n ( 2.29 )
而 I  A   n  a1 n  1  a 2  n  2    a n  1  a n ( 2.30 )
将(2 29)、(2.30)式代入(2.28)式得
In  a1 In  1    an  1 I  an I
 ( H1n  1  H 2n  2    H n 1  H n )( I  A )
将上式展开得
H1n  ( H 2  H1 A )n  1    ( H n  H n 1 A )  H n A
 In  a1 In  1    an 1 I  an I
上式中,等式两边  之同次幂项的系数应相等。因而可得。
 H1  I
H  H A  a I
 2 1 1
 H 3  H 2 A  a 2 I


 H n  H n 1 A  an 1 I

  H n A  a n I
将上述关系式,从上到下依次右乘 A n , A n  1 , A , I , 然后把等式左右各
式相加,得
A n  a1 A n  1    a n  1 A  a n I
 H 1 An  ( H 2 An  1  H 1 An )    ( H n A  H n  1 A2 )  H n A  0
这就证明了 f ( A )  0
(b)由 Cayley  Hamilton 定理我们很容易得到如下命题。
即 : 设 A 为 n  n 矩 阵 , 则 矩 阵 指 数 e At 可 表 示 为 A 的 一 个 不 高 于
( n  1 ) 次的有限多项式,即可表示为:

14
n 1
e At   0 ( t ) I   1 ( t ) A     n  1 ( t ) A n  1   k ( t ) A k ( 2.31 )
k 0

式中 0 ( t ), 1 ( t ), 2 ( t ), , n1 ( t ) 为 t 的函数。


证明:根据矩阵指数的定义,有
A2 t 2 A3 t 3 A n 1 t n  1 An t n
e At
 I  At      ( 2.32 )
2! 3! ( n  1 )! n!
而根据 Cayley  Hamilton 定理:
f ( A )  A n  a 1 A n 1    a n 1 A  a n I  0
故 A n   a 1 A n 1  a 2 A n  2    a n 1 A  a n I
即 A n 是A n1 , A n 2  A , I 的线性组合。
同理
A n  1  A  A n   a1 A n  ( a2 A n 1  a3 A n  2    an  1 A2  an A )
  a1 (  a1 A n 1  a2 An  2    an  1 A  an I )  ( a2 An  1  a3 A n  2  
 an 1 A 2  an A )
 ( a12  a2 ) An  1  ( a1a2  a3 ) An  2    ( a1an  1  an ) A  a1an I
类此, A n 1 , A n 2 , 都可用 A n1 , A n 2 , A , I 表示。

在 e At 的定义式(2.32)中用上述方法可以消去 A 的 n 及 n 以上的
幂 次 项 , 表 明 e At 的 表 达 式 ( 2.32 ) 中 有 且 仅 有 n 个 A 的 乘 幂
A n1 , A n 2 , A , I 是 独 立 的 , 而 所 有 高 于 ( n  1 ) 次 的 乘 幂
A n , A n1 , 都可以表为 A n1 , A n 2 , A , I 的线性组合,把这些表达式
代入(2.32)式,即可得
n 1
e At   0 ( t ) I   1 ( t ) A   2 ( t ) A 2     n 1 ( t ) A n 1    K ( t ) A k
k 0

 0 1 
例 2.2 已知 A    ,应用 Cayley-Hamilton 定理求 e At 。
  2  3
解: f (  )  I  A   2  3  2
根据 Cayley  Hamilton 定理有 A 2  3 A  2 I  0
所以 A 2  3 A  2 I

15
A 3  A  A 2  A( 3 A  2 I )  3 A 2  2 A
 3( 3 A  2 I )  2 A  7 A  6 I
而 A 4  A  A 3  7 A 2  6 A  7(  3 A  2 I )  6 A
 15 A  14 I

 代入(2.32)式,即得:
将 A、A2、A3、
A2 2 1 3 3 1 4 4
At
e  I  At  t  A t  A t 
2! 3! 4!
3 7 15
 ( t  t 2  t 3  t 4   )A
2! 3! 4!
14
 ( 1  t 2  t 3  t 4   )I
4!
  0 ( t )I   1 ( t ) A
 3 14 4
  0 ( t )  1  t 2
 t  t 
4!
其中 
 ( t )  t  3 t 2  7 t 3  15 t 4  
 1 2! 3! 4!
上面例题只是为了加深对(2.31)式的理解,并说明  i ( t ) 是 t 的
函数,实际却不宜用来作为计算  i ( t ) 的方法,因为在阶数高时,这
种计算很繁杂,且得不到解析表达式。下面将介绍 i ( t ) 的一般计算方
法。

(c)设 n  n 矩阵 A 的特征值 1 ,  2 ,  n 是两两相异的,则计算


 i ( t ) 的关系式为:
1
  0 ( t )  1 1 12  1n  1   e 1 t 
  (t)     2 t 
 1   1 2 22  n2  1  e  ( 2.33 )
           
     n t 
 n  1 ( t ) 1 n 2n  nn 1   e 
证明:根据 A 满足其自身特征方程式的定理,可知特征值  和 A 是

16
可以互换的,因此  也满足式(2.31)
e At   0 ( t ) I  1 ( t ) A     n  1 ( t ) An 1
 0 ( t )  1 ( t )1     n 1 ( t )1n 1  e 1 t

从而有  0 ( t )  1 ( t )2     n 1 ( t )n2 1  e 2 t


 n1 n t
 0 ( t )  1 ( t )n     n 1 ( t )n  e

将上式写成矩阵形式:

1 1 12  1n 1    0 ( t )   e 1 t 
    
1 2 22  n2 1   1 ( t )   e  2 t 

          
    
1 n 2n  nn 1   n 1 ( t )  e  n t 

解此方程组即得(2.33)式。
 0 1  At
例 2.3 已知 A    2  3 ,利用(2.33)式求 e
 
2
解: f (  )    3  2  0
得: 1  1 ,  2  2 , 根据式(2.33)可写出:
1
 0 ( t ) 1  1 e  t   2  1 e  t 
      
 1 ( t )  1  2 e  2 t  1  1 e  2 t 

所以
 0 ( t )  2e  t  e  2t

1 ( t )  e  t  e  2 t
e At   0 ( t ) I  1 ( t ) A


 2e  t  e  2 t  
1 0
  ( e  t  e  2t
0
)
1 

0 1   2  3
 2e  t  e  2 t e  t  e  2t 
 t  2t 
  2( e  e )  e  t  2e  2 t 

17
(d)设 n  n 的矩阵 A 有 n 重特征值 1 ,则其计算 i ( t ) 的关系式为:
 0 ( t ) 
 
 1 ( t ) 
 
 
 n  2 ( t )
 ( t ) 
 n 1 
 1 
 t n  1 e 1 t 
 1 ( n  1)!
0 0   0 1   
0 0   1 
   1 ( n  1) 1   ( n  2)! t e 
n 2  1 t

       
 ( n  1)( n  2)1n 3   
 0 0 1    
 2!   1 t 2 e 1t 
0 1 ( n  1) n  2   2! 
2 1  1
 1!  1 
1  12  1n 1   te 1 t

 1   1! 
e 1t 
 
( 2.34)

证明:同上已证明有
 0 ( t )   1 ( t )1   2 ( t )12     n  1 ( t )1n  1  e 1 t
上式对1 求一次导数,有
 1 ( t )  2 2 ( t )1    ( n  1 ) n  1 ( t )1n  2  te 1 t
再将上式再求导一次,有
2 2 ( t )  6 3 ( t )1    ( n  1 )( n  2 ) n  1 ( t )1n  3  t 2e 1 t
重复上述步骤,最后有
( n  1 )!  n1 ( t )  t n 1 e 1t
将上面几个方程写成矩阵的形式,有

18
0 0   0 1 
0 0   1 ( n  1 )1   0 ( t ) 
  1 ( t ) 
      
 ( n  1 )( n  2 ) n  3   
0 0 1  1   n  3 ( t )
2!
 ( n  1 ) n 2  
0 1 21  1   n  2 ( t )

 1!   ( t ) 
1 1 12  1n 1   n 1 
 1 n  1 1 t 
 ( n  1 )! t e 
 
 1 n  2 1 t 
 ( n  2 )! t e 
 
   
1 
 t 2 e 1 t 
 2 ! 
 te 1 t 
 
 e 1 t 
解此方程即得(2.34)式。
 1 1 
例 2.4 已知 A    求e
At
  1  3 
解: f (  )   2  4  4  0 , 1   2  2
由式(2.34),得
1  t 1
 0 ( t ) 0 1   te 1  0 1   te  2 t   2 1  te  2 t 
   1     1 t    1  2    2 t    1 0    2 t 
 (
 1  t ) 1  e    e    e 
即:
 1 ( t )  t  e  2 t

 0 ( t )  e  2 t  2t  e  2 t
所以

19
e At   0 ( t )I   1 ( t ) A
1 0   1 1 
 ( e  2t  2te  2 t )   te  2t  
0 1   1  3
e  2 t  te  2 t te  2 t 
  2t 
  te e  2t  te  2 t 
(3)利用拉普拉斯反变换法求 eAt
由(2.11)式可知
e At  L1 {( SI  A )1 }
可见这种方法归结为计算 ( SI  A ) 1 ,而 ( SI  A ) 1 也称预解矩阵,

这里仅介绍两种计算 ( SI  A ) 1 的方法。
a)根据公式
adj ( SI  A)
( SI  A) 1  ( 2.35)
SI  A
这是一种最常用的计算方法,这种方法在维数较大时,其计算往往比
较复杂。
b)根据下面公式来计算
( SI  A ) 1

( 0 I )S m1  ( 1 I   0 A) S m2    ( m2 I     0 A m2 ) S  ( m1 I     0 A m1 )



 ( s)
m 1  j m 
j 0  i j 1 mi 
S a A i  j 1

 
 ( 2.36 )
 (s)
其中  ( s ) 为 n  n 矩阵 A 的最小多项式(注 1),即令 d ( s ) 为 n  n 矩阵 A
的 特 征 矩 阵 ( SI  A ) 的 所 有 ( n  1 ) 维 余 子 式 的 最 大 公 因 子 , 如 果
d ( s ) 中的 s 的最高幂项的系数选择为 1,则最小多项式就为
SI  A
( s ) 
d( s )
 ( s )   0 S m   1 S m 1     m 1 S   m

20
式中 0  1 , m  n 。
上式证明如下:
令 P  ( SI  A ) 1 ,将此式左乘 ( SI  A ) ,得
( SI  A) P  I  SP  AP  I
再把上式左乘 ( SI  A ) 得,
( SI  A )  SP  ( SI  A )( AP  I )  S 2 P  A2 P  A  SI
类似地再把上式左乘 ( SI  A ) ,得
( SI  A )S 2 P  ( SI  A )( A 2 P  A  SI )  S 3 P  A 3 P  A 2  SA  S 2 I
依次类推,可组成如下一组关系式
P  P
 SP  AP  I

 S 2 P  A 2 P  A  SI

 3 3 2 2
 S P  A P  A  SA  S I


 S m P  A m P  A m 1  SA m  2    S m  2 A  S m 1 I
现将上式自上而下依次乘  m , m 1 , ,1 , 0 ,然后依等式左右进行
相加。等式左边相加结果是:
 m P   m  1 SP     1 S m  1 P   0 S m P
 (  m   m  1 S     1 S m  1   0 S m )P   ( s )P
而等式右边相加结果为:
(  m I   m  1 A     0 A m )P  (  m  1 I   m  2 A     0 A m  1 )
 (  m  2 I   m  3 A     0 A m  2 )S    (  1 I   0 A ) S m  2  (  0 I ) S m  1
m m m
  ( A )P   m  i Ai  1  S  m  i Ai  2    S m  1  m  i Ai  m
i 1 i2 im
m 1  m 
  ( A )P    S  m  i Ai  j  1 
j

j0  i  j 1 
(注 1)最小多项式:
尽管 Cayley  gamilton 定理指明有 f ( A )  0 ,但可能有一 些比
f ( s ) 次数更低的多项式  ( s ) ,使  ( A)  0 。使  ( A )  0 的次数最低的

21
首一多项式,叫做 A 的最小多项式。
上述两式相等,且  ( A )  0 ,从而就证明了
m 1 m 
 S j
 mi A i  j 1


j 0  i  j 1 
( SI  A ) 1 
( s )
 2 0 0
 
例 2.5 已知 A   0 2 0 ,求预解矩阵 ( SI  A ) 1
 0 3 1

解: f ( s )  SI  A  ( S  2 ) 2 ( S  1 )
( S  2 )( S  1 ) 0 0 
adj ( SI  A )   0 ( S  2 )( S  1 ) 0 
 
 0  3( S  2 ) ( S  2 )2 
所以 adj ( SI  A ) 的最大公因子 d ( S )  ( S  2 ) 。
则 A 的最小多项式
SI  A ( S  2 )2 ( S  1 )
( s )    ( S  2 )( S  1 )  S 2  3 S  2
d( s ) (S  2)
由最小多项式  ( s ) 可知: m  2 ,  0  1, 1  3 ,  2  2 。
于是得:
 0 IS  (  1 I   0 A ) A  ( S  3 )I
( SI  A ) 1   2
( s ) S  3S  2
2  ( S  3 ) 0 0 
1  
 2 0 2 (S  3) 0
S  3S  2  
 0 3 1  ( S  3 )
 1 
S  2 0 0 
 1 
 0 0 
 S2 
 3 1 
 0 ( S  1 )( S  2 ) S  1 

式(2.36)也可以写成下面两种形式

22
形式 I:
Pm 1 ( S ) I  Pm  2 ( S ) A    P1 ( S ) A m  2  P0 ( S ) A m  1
( SI  A ) 1 
( S )
m 1
 Pm  i 1 ( S )  Ai
i0
 ( 2.37 )
( S )
其中
 Pm 1 ( s )   0 S m 1     m  2 S   m 1

 Pm  2 ( s )   0 S m  2   1 S m  3     m  2

 
P ( s )   S  
 1 0 1
 P0 ( s )   0

形式Ⅱ
如果 n  n 方阵的特征为两两相异,则(2.36)式也可以写成如下
形式
m 1  m 
  S   m  i Ai  j 1 
j

j 0  i  j 1 
( SI  A ) 1  ( 2.38 )
SI  A
(4 ) 利 用 Sylvester 的 插
补公式法计算 e At
设 n  n 矩阵 A 有两两相异的特征值 1 , 2 , 3 , , n , 则 e At 可表示
为:
n
( A  1 I )( A  k 1 I )( A  k 1 I ) ( A  n I )
e At
  e t k
( k  1 )( k  k 1 )( k  k 1 ) ( k  n )
( 2.39 )
k 1

这是对于矩阵指数的 Sylvester 内插公式。用它可以直接求 e At 。

 0 1 0 
 1  ,求 e At (用内插公式求)
例 2.6 已知 A   0 0

  6  11  6

23
解:由式(2.39)可知, 首先应求出特征值。
 0 1 0 
f (  )  I  A  I   0 0 1 
  6  11  6
 1 0
 0  1  (  1 )(   2 )(   3 )
6 11   6
所以 1  1 ,  2  2 ,  3  3
( A   2 I )( A   3 I ) ( A  1 I )( A   3 I )
e At  e 1 t  e2t
( 1   2 )( 1   3 ) (  2  1 )(  2   3 )
( A  1 I )( A   2 I )
 e3t
(  3  1 )(  3   2 )
 2 1 0  3 1 0 
1 t 
 e  0 2 1   0 3 1 
2
  6  11  4   6  11  3
 1 0  3
1 1 0 
 e  2 t  0 1   0
1 3 1 
  6  11
 5   6  11  3
 1 1 0  2 1 0 
1  3t   
 e  0 1 1  0 2 1 
2
  6  11  5   6  11  4
 6 5 1  2t 
 6  8  2  3t 
2 3 1 
et  e e
  6  5  1   12 16 4     6  9  3
2  2  2  
 6 5 
1 
  24  32  8  
 18 27 9 
(5) 变 换 A 为
对角标准型或 Jordon 标准型来计算 e At
a)A 特征值互异
当 A 有两两相异特征值时,必能找到非奇异矩阵 T ,使下式成立,
即   T 1 AT
由式(2.22)性质七有

24
e At   ( t )  T  e t  T 1
 0 1 
例 2.7 已知 A   At
 ,求 e 。
  2  3 
 1 
解: f (  )  I  A      2  3  2
 2   3
所以  1  1,  2  2
 0 1   p11   p11 
由 A P 1  1 P 1      (  1 )p 
  2  3  p21   21 
 p11   1 
得  p     1
 21   
 0 1   p12   p12 
同理 AP 2  2 P 2      (  2 )p 
  2  3  p22   22 
 p12   1 
得  p     2
 22   
 p11 p12   1 1 1  2 1
T  , T 
 p21 p22    1  2   1  1
 
At t 1  1 1  e  t 0  2 1
所以 e  Te T    
  1  2  0 e  2 t    1  1
 2e  t  e  2 t e  t  2e  2t 
 t  2t 
  2e  2e  e  t  2e  2 t 
b)A 的特征值有重根
在 A 的特征值有重根的情况下,根据公式(2.24)性质九可知
e At  T  e Jt  T 1
其中 J  T 1 AT
  3 1 0
 
例 2.8 已知 A   0  3 1 ,求 e At
  4 0 0
解:先求 A 的特征值

25
  3  1 0

f ( )   0   3  1  (  3) 2  4  (  1) 2 (  4)
 4 0  
所以  1   2  1  3  4
 1 1 0  e  t te  t 0 
 
则 J   0  1 0  , e Jt  0 et 0 
 0 0  4  0 0 e  4t 

由上一章例 1.18 可知
1 1 1   11 7  4
1
T   2 3  1 T 1    6  3 3 
9
 4 8 1   4  4 1 
所以

e At  T  e Jt  T 1
t
1 1 1  e te  t 0   11 7  4
 1
  2 3  1  0 e  t 0    6  3 3 
 4t  9
 3 8 1   0 0 e   4 1 
   4
 et te  t  e  t e  4t   11 7  4
 1
  2e  t 2e  t  3e  t  e  4t    6  3 3 
4e  t 4te  t  8e  t e  4t  9  4  4 1 
  
 5e  t  6te  t  4e  4t 4e  t  3te  t  4e  4t  e  t  3te  t  e  4t 
1 
  4e  t  12te  t  4e  4t 5e  t  6te  t  4e  4t e  t  6te  t  e  4 t 
9 t
  4e  24te  4e
t  4t
4e  t  12te  t  4e  4t 8e  t  12te  t  e  4 t 

三、非齐次方程的解
现在来讨论线性定常系统在控制作用 u(t ) 下的强制运动。此时状态
方程为一般的非齐次方程
x  A x  B u ( 2.40)

26
在初始时刻 t 0 时,初始状态为 x ( t 0 ) ,则其解为:

x ( t )  e A( t  t0 ) x ( t 0 )   tt0 e A( t  )  B  u( )d ( 2.41)


初始时刻 t 0  0 时,初始状态 x( t 0 )  x(0) ,其解为:

x ( t )  e At x (0)   0t e A( t  )  B  u( )d ( 2.42)


很明显,线性系统( 2.40 )式的解由两部分组成。 ( 2.41)式和
(2.42)式的第一项表示由初始状态引起的自由运动,第二项表示由
控制作用引起的强制运动。
证明:将式(2.40)写成
x  A x  B u(t )
两边同左乘 e  At 得
e  At ( x  A x )  e  At B u( t )


dt
 e x( t )  e  At B u( t )
d  At
( 2.43)

对上式在 t 0 ~ t 之间积分,有

e  At x ( t ) tt0   e  A B u( )d


t
t0

即 e
 At
x( t )  e  At 0 x ( t 0 )   tt 0 e  A B u( )d
两边同左乘 e At ,得
x ( t )  e A( t  t 0 ) x ( t 0 )   tt 0 e A( t  ) B u( )d
故(2.41)式得证。
若对(2.43)式在 0 ~ t 间积分,即可证明(2.42)式。式(2.41)和
(2.42)可分别写成如下形式:

x ( t )   ( t  t 0 ) x ( t 0 )   tt 0  ( t   ) B u( )d
及 x ( t )   ( t ) x (0)   0t  ( t   ) B u( )d
例 2.9 求状态方程

27
 x 1   0 1   x1   0 
         u
 x 2    2  3  x 2  1 
在 u( t )  1( t ), 初状态为 x1 ( 0), x2 ( 0) 时的解。
解:在上面例题中,我们已经求出

At  2e  t  e  2t e  t  e  2t 
e  ( t )   t  2t 
  2e  2e  e  t  2e  2t 
因此,根据(2.42)式,有

 x1 ( t )   2e  t  e  2 t e  t  e  2t   x1 ( 0 ) 
 x ( t )   t  2t  
 2    2e  2e  e  t  2e  2t   x 2 ( 0 )

t  2e  ( t   )  e  2( t   ) e  ( t   )  e  2( t   )  0 
 0  ( t  )   1(  )d
  2e  2e  2( t  )  e  ( t  )  2e  2( t  )  1 
( 2e  t  e  2 t ) x1 ( 0 )  ( e  t  e  2 t ) x 2 ( 0 ) 
 
( 2e  t  2e  2t ) x1 ( 0 )  (  e  t  2e  2 t ) x 2 ( 0 )
  ( t   )  e  2( t   ) 
t e
  0 d
 ( t  )  2( t   )
  e  2e 
( 2e  t  2e  2t ) x1 ( 0 )  ( e  t  e  2t ) x 2 0 
 
( 2e  t  2e  2t ) x1 ( 0 )  (  e  t  2e  2 t ) x 2 ( 0 )
1 t 1  2t 
 e  e 
 2 2
 t  2t

 e  e 
1  1   2t 
   2 x ( 0 )  x ( 0 )  1 e t
 x
 1 ( 0 )  x ( 0 )  e 
2 
1 2 2
 2 ( t  0 )
   2 x1 ( 0 )  x 2 ( 0 )  1 e  t   2 x1 ( 0 )  2 x 2 ( 0 )  1 e  2t 

在特殊的控制作用下,例如在脉冲函数,阶跃函数或斜坡函数的
作用下,系统解(2.42)可简化为如下公式:

28
(1) u( t ) 为脉冲函数时,即 u( t )  k ( t ), x (0 )  x(0) 时,
x ( t )  e At x (0)  e At B k
式中 k 是与 u( t ) 同维常数向量。
(2) u( t ) 为阶跃函数时,即 u( t )  k  1( t ), x (0 )  x (0) 时,
x ( t )  e At x (0)  A 1 (e At  I ) B k
(3) u( t ) 为斜坡函数时,即 u( t )  k  t  1( t ), x (0 )  x(0) 时
x ( t )  e At x ( 0)   A 2 ( e At  I )  A 1t  B k
非齐次方程也可以用拉氏变换方法求解。对非齐次方程(2.40)式
两边进行拉氏变换:
S x ( s )  x ( 0)  A x ( s )  B u( s )
化简为
( SI  A) x ( s )  x ( 0)  B u( s )
所以 x ( s )  ( SI  A) 1  x(0)  B u( s )
对上式进行反拉氏变换,得
x ( t )  L1 { x ( s )}  L1 {( SI  A)1  x (0)  B u( s ) }
例 2.10 已知系统的状态方程为
 2  13 
x    12 
3 x    u( t ), u( t )  1( t ) 为单位阶跃函数,初始
  36  1 1 

条件 x1 ( 0)  2, x2 (0)  1 ,求此状态方程的解。
解:

1  S 1 2/ 3 
 2   ( S  4)( S  9)
S  12   ( S  4)( S  9) 
( SI  A) 1  3  
 36  36 S  12
 S  1  
 ( S  4)( S  9) ( S  4)( S  9) 

 2 1
又 x ( 0)    u( s ) 
1  S

29
所以
 1   6S  1
1  3S   3S 
  1
bu( s )  3  , x (0)  bu( s )   
  S 1  S 1 
1   S   S 
从而有
x( s )  ( SI  A) 1  x( 0)  bu( s )
  6 S  1  2 S  3 S  1 
2
 S 1 2/ 3
 ( S  4)( S  9)  
( S  4)( S  9)   3 S   S ( S  4)( S  9) 
  
  36 S  12  S  1   S  59 
 ( S  4)( S  9) ( S  4)( S  9)   S   ( S  4)( S  9) 
将上式进行部份分式展开:
 1 21 136 
 36 
  20  45 
S S4 S  9
x( s )  
  63 68 
 5  5 

S  4 S9 

并作拉氏反变换,得
 1 21  4 t 136  9t 
 e  e 
 x1 ( t )   36 20 45
 x ( t )   63  (t  0)
 2    e  4 t  68 e  9 t 
 5 5 

§2—2 线性时变系统状态方程的解
状态变量法的优点之一就是具有广泛的适应性,它可以推广到线
性时变系统。设线性时变系统的状态方程为:
x  A( t ) x  B( t )u ( 2.44)
时变系统不一定有解析解,但当系统矩阵 A( t ) , B( t ) 的元素在定义区
间  t 0 , t  上是绝对可积时,对每一初始状态 x ( t 0 ) 存在唯一解。
一、线性时变齐次状态方程的解
首先来研究线性时变齐次状态方程的解。状态方程为:

30
 x  A( t ) x
 ( 2.45)
 x ( t ) t  t0  x ( t 0 )
其解为
x( t )   (t , t0 ) x( t0 ) ( 2.46)
式中  ( t , t 0 ) 类似于前述线性时不变系统中的  ( t  t 0 ) 它也是 n  n 非奇
异方阵,并满足如下的矩阵微分方程和初始条件
( t , t 0 )  A( t ) ( t , t 0 ) ( 2.47 )

和  (t 0 , t0 )  I ( 2.48)
证明:将解式(2.46)代入原方程(2.45)式,有
d
 ( t , t 0 ) x ( t 0 )  A( t ) ( t , t 0 ) x ( t 0 )
dt
即有 ( t , t 0 )  A( t ) ( t , t 0 )
在解(2.46)式中令 t  t 0 时有
x( t0 )   ( t0 , t0 ) x(t0 )
即  ( t0 ,t0 )  I
这就证明了由满足式(2.47),(2.48)的  ( t , t 0 ) ,按(2.46)式所
求得的 x(t ) 确是原齐次状态方程式(2.45)的解。和前节所述的时不变
系统一样,也是初始状态的转移,故  ( t , t 0 ) 也称为时变线性系统状态
转移矩阵。在一般情况下,只需将  ( t ) 或  ( t  t 0 ) 改为  ( t , t 0 ) ,上节
关于时不变系统所得到的大部分结论,均可推广应用于线时变系统。
二、 状 态 转 移 矩 阵 ( t ,t0 ) 的
基本性质
(1)  ( t 2 , t1 ) ( t1 , t 0 )   ( t 2 , t 0 ) ( 2.49 )
证明:由式(2.46)可导出
x ( t1 )   ( t1 , t 0 ) x ( t 0 )
x( t 2 )   ( t 2 , t0 ) x( t0 )
x ( t 2 )   ( t 2 , t1 ) x ( t1 )
  ( t 2 , t1 ) ( t1 , t 0 ) x ( t 0 )

31
故  ( t 2 , t 1 ) ( t 1 , t 0 )   ( t 2 , t 0 )
(2)  ( t , t )  I ( 2.50 )
见式(2.48)定义
(3)  ( t , t0 )   1 ( t0 , t )
根据式(2.48),(2.49)可知
 ( t , t 0 ) ( t 0 , t )   ( t , t )  I
又  ( t 0 , t ) ( t , t 0 )   ( t 0 , t 0 )  I
所以  ( t , t 0 )与 ( t 0 , t ) 为互逆矩阵。
(4) ( t , t )  A( t ) ( t , t )
0 0

见定义(2.47),在这里, A( t ) 和  ( t , t0 ) 一般的说是不能交换的。
三、状态转移矩阵  ( t , t0 ) 的计算
时变系统的状态转移矩阵  ( t , t0 ) 和定常系统的  ( t  t0 ) 或  ( t ) 在形
式上和某些性质上有类似之处,但在本质上两者是有区别的。可以看出
 ( t  t0 ) 或  ( t ) 是 ( t  t0 ) 或 t 的函数,而  ( t , t0 ) 则是 t 和 t0 的函数。
在线性定常系统中  ( t  t0 ) 或  ( t ) 一般可写成指数矩阵形式,即写成
e A( t  t 0 ) 或 e At ,但在时变系统中  ( t , t0 ) 往往不能写成指数矩阵形式,
除非它满足某种条件。
设(2.45)式的解可以写成如下形式:
t
t0 A( ) d (2.51)
x( t )  e x( t0 )
根据指数矩阵的展开法则,上式可写成

   
3
1 2 1
x( t )  { I   t
t0 A( )d  t
t0 A( )d  t
t0 A( )d  } x ( t 0 ) ( 2.52)
2! 3!
对(2.52)式两边求导,得:
 1 1 
x ( t )   A( t )  A( t ) tt0 A( )d   tt0 A( )dA( t )   x ( t 0 ) ( 2.53)
 2 2 
将(2.52)和(2.53)式代入(2.45)式,可以看出,等式左右两边只

有当 A( t )和
t
t0 A(  )d 是可交换的,等式才能成立。即若等式

32
A( t ) tt 0 A(  )d   tt 0 A(  )dA( t ) ( 2.54 )
成立时,式(2.53)将变为:

x 
 ( t )  A( t )  A( t )  t
t0 
A( )d   x ( t 0 )
 A( t ) I   
t
t0 A( )d   x ( t 0 )  ‘

 A( t ) x ( t )
所以式(2.51)是原方程(2.45)式的解。
那么,在什么条件下 A(t ) 和  tt A( )d 才是可交换的呢?以下对此 0

问题作简单说明。
若(2.54)式成立,显然有
A( t ) t
t0
A(  )d   t
t0
A(  )dA( t )

 t
t0
 A( t ) A(  )  A(  ) A( t ) d  0
若上式对任意 t 皆成立,则对于任意 t 1和t 2 ,等式
A( t1 )  A( t 2 )  A( t 2 ) A( t1 ) ( 2.55 )
应能成立。反之,若等式(2.55)成立, A( t ) 和  t
t0 A(  )d 就是可交

换的。以上便是要求的条件,由此可以得出如下结论:当(2.55)式对
任意 t 1和t 2 都成立时,式(2.51)即为式(2.45)的解,这时系统的状
态转移矩阵可写成:
t
 A(  )d
 ( t ,t0 )  e t0
I t
t0 A(  )d


1 t
2!  0
tA(  )d
2

1 t
3!  0
t A(  )d
3
 
( 2.56 ) 
一般地说,上式不能表达成封闭的形式,或者说,上式一般不能
用有限多项式表示,但在特殊情况下也是可能的。
例 2.11 已知对象的状态方程为
0 1

x ( t )   ( t  1) 2
 x( t )
0 0 
求系统的状态转移矩阵。

33
解:由于
 1  1 
0 0
A( t1 ) A( t 2 )   ( t1  1 )  
2
( t 2  1 )   0  A( t 2 )  A( t1 )
2

0 0  0 0 

满足(2.55)式所给出的条件,从而 A( t ) 和  t
t0 A(  )d 是可交换的。

而系统的状态转移矩阵可由式(2.56)所给出,即
t 2
 A (  ) d 1  t 
 I  A(  )d  
2!  t 0
t
 ( t , t0 )  e t0
A(  )d 
t0 
2
  1  
t 0 
1
1  t 0 
 I  (   1 )2 d   
2!  
(   1 ) 2 d  t0
t0
0 0   
 0 0  
 
1  t  t0 
上式中  t 0  d   0
2
( t  1 )( t 0  1 ) 
t0  (  1 )   
0 0  0 0 
k
 t  t0 
而 0 ( t  1 )( t 0  1 )  0 ( k  2 ,3 , )
 
0 0 
将上述结果代入  ( t , t 0 ) 表达式后,得
 t  t0   t  t0 
1 0 0 1
 ( t ,t0 )    ( t  1 )( t 0  1 )    ( t  1 )( t 0  1 ) 
 0 1    
0 0  0 1 
一般情况下, A( t ) 不能满足可交换的条件(2.55)式。这时,  ( t , t 0 )
的计算,是用级数近似法,即:
 ( t , t0 )  I   tt0 A(  1 )d 1   tt 0 A(  1 ) t 1 A(  2 )d 2d 1
0
1 2
 t
t0 A(  1 ) t 0 A(  2 ) t 0 A(  3 )d 3d 2d 1   ( 2.57 )

证明:在上述情况下,可有

34
( t , t0 ) 
d
dt

I   tt 0 A(  1 )d 1   tt 0 A(  1 ) t 1 A(  2 )d 2 d 1
0

  tt 0 A(  1 ) t 1 A(  2 ) t 2 A(  3 )d 3 d 2 d 1   
0 0

 A( t )  A( t ) t
t0 A(  1 )d 1  A( t ) t
t0 A(  1 ) t 1 A(  2 )d 2 d 1  
0


 A( t ) I   t
t0 A(  1 )d 1   t
t0 A(  1 ) t 1 A(  2 )d 2 d 1  
0

 A( t )   ( t , t0 ) ( 2.58 )
又  ( t0 , t0 )  I  0  0    I ( 2.59 )
可知式(2.57)满足式(2.58)和式(2.59)。
例 2.12 已知线性时变系统的状态方程为
0 1
x    x , 计算 ( t ,0)
0 t 
解: 因为
 0 1  0 1  0 t 2 
A( t1 ). A( t2 )    0 t   0 t t 
 0 t1 2  1 2

0 1  0 1  0 t1 
A( t2 ).A( t1 )    0 t   0 t t   A( t1 ).A( t2 )
 0 t 2  1  1 2

所以 A( t ) 和  t
t0 A(  )d 是不能交换的,  ( t , t 0 ) 不能写成矩阵指

数形式,只能用级数展开。故按式(2.57)作  ( t , t 0 ) 的近似计算。
t t 01 0 t 
0 A(  )d  0 0  d  0 1 t2
 2 
t 1 t 0 1   1 0 1 
0 A(  1 )0 A(  2 )d 2d 1  0 0  1  0 0  2  2 1
d d

1  0
t 0 1  t 0
1 2 0 1 t3
  2 1 d
0 0   0 1  2  d 1  0 0 1 3

 1  6
1 4

 1 2 1  2 1  0 8
t 

35
t 1 2 t 0 1 3

6 1 d
0 A(  1 )0 A(  2 )
0
A(  3 )d 3 d 2 d 1   A(  1 )
0 1 4

 1
0 8 1
1  0
t 0
1 3

6 1 d
0 1 5
t
    1  40

0 0   0 1 4
 1 6
 1 8 1 0 48
t 
…… ……

所以
0 t  0 1 t 3  0 1 5
t
 ( t ,0 )  I   1 2    61 4    40
 
0 2 t  0 8 t  0
1 6
48
t 
1 t  1 t 3  1 t 5   
6 40
 
0 1  2 t  8 t  48 t  
1 2 1 4 1 6

例 2.13 已知时变系统状态方程为
t 1
x   x
1 t 
试求其  ( t ,0 )
1 2 
t  1 2 t t 
 0 A(  )d  
t
解: 0
1   d   1 2
   t t 
 2 
由于
1 2  1 
 t 1 2 t t   t2 t   t 1
A( t ) 0 A(  )d  
t
  2
1 t   t 1 2  1 2  1 t 
t   t t 
 2   2 
1 t3  t 3 2
t 
   0 A(  )dA( t )
t
 2 3 2 2
1 3
 2 t 2
t  t 

即 A( t ) 和  t
t0 A(  )d 是可交换的,状态转移矩阵可按式(2.56)

计算。

36
t
 A(  )d
 ( t ,0 )  e t0

2
1 2  1 2 
1 0  2 t t  1 2 t t 
  1   1  
 0 1   t 2
t  2  t 2
t 
 2   2 
 t4 t3 
 1  t 2
   t   
 8 2 
3 4
 t t t
  1  t 2   
2 8 
当然也可按(2.57)式计算。
 ( t ,0 )  I   tt 0 A(  1 )d 1   tt0 A(  1 ) tt0 A(  2 )d 2d 1  
1 2  1 1 1 3 
 1 0  2 t t   t4  t2 t 
   8 2 2 
 0 1  t 1 2  1 1 4 1 2
t   t3 t  t 
 2  2 8 2 
 1 4 1 3 
1  t 2
 t  t t  
 8 2
1 1 4 
t  t 3   1  t  t  
2
 2 8 

可知它们的计算结果是一致的。

四、线性时变非齐次方程的解

线性时变非齐次方程(2.44)式的解,类似于时不变系统为

x ( t )   ( t , t 0 ) x ( t 0 )   tt0  ( t , ) B( )u( )d ( 2.60)

证明 :因线性系统满足叠加定理,故可将式(2.44)的解看成由初始

状态 X ( t 0 ) 的转移和由控制作用激励的状态 X u ( t ) 的转移两部分组成,

37
x( t )   ( t , t0 ) x( t0 )   ( t , t0 ) x u ( t )
(a)
  ( t , t0 ) x ( t 0 )  x u ( t )

代入式(2.44),有

( t , t 0 ) x( t 0 )  x u ( t )   ( t , t 0 ) x u ( t )
 A( t ) x ( t )  B( t )  u( t )

A( t ) ( t , t 0 ) x ( t 0 )  x u ( t )   ( t , t 0 ) x u ( t )
 A( t ) x ( t )  B( t )u( t )
进一步可写成

A( t ) x ( t )   ( t , t 0 ) x u ( t )
 A( t ) x ( t )  B( t )u( t )
所以

x u ( t )   ( t , t 0 )1 B( t )u( t )
  ( t 0 , t ) B( t )u( t )

在 t 0 ~ t 区间内对上式两边进行积分,有

x u ( t )   tt 0  ( t 0 , ) B( )u( )d  x u ( t 0 ) (b)

于是将(b)式代入(a)式,得:

x( t )   ( t , t 0 ) x( t 0 )   tt0 ( t , t 0 ) ( t 0 , ) B( )u( )d   ( t , t 0 ) x u ( t 0 )


  ( t , t 0 ) x( t 0 )   tt0 ( t , ) B( )u( )d   ( t , t 0 ) x u ( t 0 )

上式中令 t  t 0 ,因为  ( t 0 , t 0 )  I ,可知 x u ( t 0 )  0,

38
故 x ( t )   ( t , t0 ) x ( t 0 )   tt 0  ( t , ) B( )u( )d
为原非齐次方程(2.44)式的解。

§2.3 线性连续时间状态空间表达式的离散化

如果用数字计算机对连续时间状态方程求解,或者对连续受控对象
采用数字计算机进行在线控制,都要碰到一个将连续时间系统化为离
散时间系统的问题。本节将讨论线性连续时间状态空间表达式的离散
化方法。
一、线性时变系统的离散化
设原线性系统的状态空间表达式为:

 x  A( t ) x( t )  B( t )u( t )
 ( 2.61)
 y  C ( t ) x( t )  D( t )u( t )
离散化后状态空间表达式为:
 x ( k  1)T   G ( kT ) x( kT )  H ( kT )u( kT )
 ( 2.62)
 y( kT )  C ( kT )  x( kT )  D( kT )  u( kT )
式(2.61)、(2.62)之间的系数关系如下
G ( kT )    ( k  1 )T , kT 
( k  1 )T
H ( kT )     ( k  1 )T ,  B(  )d
kT
C ( kT )  C ( t ) t  kT
D( kT )  D( t ) t  kT ( 2.63 )
式中   ( k  1 )T , kT  表示  ( t , t 0 ) 在 kT  t  ( k  1)T 区段内的状态
转移矩阵,而  ( t , t 0 ) 则表示原连续系统(2.61)式的状态转移矩阵。
证明:由上节(2.60)式可知(2.61)式的解为:
x( t )   ( t , t 0 ) x 0   tt 0  ( t , ) B( )u( )d ( 2.64)

39
对 上 式 离 散 化 , 令 t  ( k  1 )T , t 0  hT , T 为 采 样 周 期 , 则 得

x ( k  1)T     ( k  1)T , hT  x 0   (hTk 1)T   ( k  1)T ,  B( )u( )d


( 2.65)
再以 t  kT , t 0  hT 代入(2.64)式,则得
x ( kT )   ( kT , hT ) x 0   kT
hT  ( kT , ) B ( )u( )d ( 2.66)
将(2.66)式两边同左乘   ( k  1 )T , kT  ,得

  ( k  1)T , kT  x ( kT )    ( k  1)T , kT 
  ( kT , hT ) x 0    ( k  1)T , kT   kT
hT  ( kT ,  ) B ( )u( )d

   ( k  1)T , hT  x 0   kT
hT   ( k  1)T ,   B ( )u( )d ( 2.67 )
将(2.65)式减去(2.67)式得:
x ( k  1)T     ( k  1)T , kT  x( kT )   (kTk 1)T   ( k  1)T ,  B( )u( )d
( 2.68)
上式中,令
G ( kT )    ( k  1 )T , kT 
H ( kT )  ( k  1 )T
 kT   ( k  1 )T , B(  )d

设在区间  kT , ( k  1 )T  内, u(  )  u( kT ) ,则(2.68)式可简写成:
x ( k  1)T   G ( kT )  x ( kT )  H ( kT )  u( kT )
同时,对(2.61)式输出方程离散化,则证明了
y( kT )  C ( kT ) x ( kT )  D( kT )  u( kT )

二、线性时不变系统的离散化
对于线性时不变系统
 x  A x  B u
 ( 2.69)
 y  C x  Du
离散化状态空间表达式为
 x ( k  1)T  G (T ) x ( kT )  H (T )u( kT )
 ( 2.70)
 y ( kT )  C x ( kT )  D u( kT )

40
其中 G ( T ), H ( T ), C , D 均为常数阵,且
G (T )  e AT
 ( 2.71)
 H (T )  (  0 e dt ) B
T At

证明 :由于时不变系统是时变系统的一种特殊情况,所以只需要
证明式(2.71)成立即可。由(2. 63)式可得
G ( kT )    ( k  1 )T  kT    ( T )  e AT  G ( T )
H ( kT )   (kTk 1 )T   ( k  1 )T    Bd

上式中,令 t  (k  1)T   , 则 dt   d
( k  1 )T
积分项  T  0 dt ,因此
0 T
kT d   dt 

H ( kT )  (  T0  ( t )dt )B  (  T0 e At dt )B  H ( T )

所以时不变系统的状态方程为:
x ( k  1)T  G (T ) x ( kT )  H (T )u( kT )
因为输出方程是状态向量和控制向量的某种线性组合,离散化后,这
种组合关系不变,故C 、 D 是不变的。
例 2.14 求连续系统
0 1   0
x ( t )    x ( t )    u( t )
0  2 1 
的离散状态空间表达式。
解:由式(2.71)计算
 1 
G( T )  e AT
L 1
( SI  A )  1 1  S
 L 
0
1 
S  2



 

1 1 
  1 
 L 1  S S ( S  2 )   1 ( 1  e  2T )
 2
0 1  0 e  2T


 S  2 

41
 1 
1 ( 1  e  2t ) 0
H(T )   T At
0 e dt b  T
2 dt
0
  1 
0 e  2t 
 1 1 1 
T ( T  e  2T  ) 0
 2 2 2
1  2T 1  
0  e   1 
 2 2 
1 e  2T  1 
 (T  )
  2 2 
 1  2T 
 2 ( 1  e ) 

从而可求得离散化状态方程为:
1 e  2T  1 
 1
1 (1  e  2T 
)  2 (T  2
)
x ( k  1)T    2  x ( kT )    u( kT )
0 e  2T  1
 (1  e  2T ) 
 
 2 
假如采样周期 T 为 1 秒,则上述状态方程为:
1 0.432 0.284
x ( k  1)    x ( k )  0.432 u( k )
 0 0 .135   
三、近似离散化
在采样周期 T 较小,一般当其为系统最小时间常数的十分之一左右
时,时不变系统离散化状态方程可近似表达为:
x ( k  1)T  (TA  I ) x ( kT )  TB u( kT ) ( 2.72)
G ( T )  AT  1
即  ( 2.73 )
 H ( T )  TB
证明:根据导数的定义
x( t0   t )  x(t0 )
x ( t 0 )  lim
 t 0 t
现研究 t 0  kT 时,和 t  (k  1)T 这一段的导数,有
x ( k  1)T   x( kT ) x ( k  1)T   x kT 
x ( kT )  Lim 
T 0 T T
以此代入原方程

42
x ( t )  A x ( t )  B u( t )
可得
x ( k  1)T  x ( kT )
 A x ( kT )  B u( kT )
T
即 x ( k  1)T   ( I  AT ) x ( kT )  TB u( kT )
例 2.15 将例 2.14 按(2.72)、(2.73)两式计算来进行离散化。
解:
 0 1  1 0 1 T 
G ( T )  TA  I  T      
0  2 0 1 0 1  2T 
 0 0 
H ( T )  TB  T     
1  T 

将例[2.14]、例[2.15]两种计算方法在不同采样周期 T 时的计算结果
列表如表 2.1 所示,可知 T  0.05 时,两者更为接近。
表 2.1
T G (T ) H (T )

T  1  2T  1 e 2T  1  0 
 1 (T  e )  (T  ) T 
0
2
 1 T   2 2   
 e  2T  0 1  2T   1 (1  e  2T ) 
   2 
1 1 0.432 1 1  0.284  0
0 0.135 0  1 0.432 1 
       

0.5 1 0.316 1 0.5 0.092 0 


0 0.368 0 0  0.316 0.5
       

0.05 1 0.048 1 0.05 0.0012 0 


0 0.905 0 0.90 0.0475 0.05
       

43
对线性时变系统也可仿上面时不变系统近似离散化的方法,得近似
的计算公式如下:
§2.4 离散状态方程的解
一、线性时不变离散状态方程的解
现讨论离散状态方程的解,首先研究时不变系统的情况,设时不变
系统状态方程为:
 x( k  1)  G x ( k )  H u( k )
 ( 2.75)
 x ( k ) k  0  x ( 0)
对于时不变系统的求解,主要有两类方法,一类是用矩阵差分方
程的迭代法,另一类是用 Z 变换法。
1.迭代法求解
对于任意采样时刻 k  0 ,方程(2.75)的解可用迭代法求得,即先
令 k  0 ,由已知条件 x ( 0) , u( 0 ) 可先求得 x (1) ,再令 k  1 ,由

求得的 x (1) 和已知 u( 1 ) 可求得 x ( 2) ,如此进行,即可得 x (k ) 。显


然,这种解法便于在数字计算机上进行运算。由方程(2.75)式,由迭
代法,有
k0 x (1)  G x (0)  H u(0)
k 1 x ( 2)  G x (1)  H u(1)  G 2 x(0)  GH u(0)  H u(1)
k2 x ( 3)  G x ( 2)  H u( 2)  G 3 x (0)  G 2 H u(0)  GH u(1)  H u( 2)

k 1 x ( k )  G X ( k  1)  H u( k  1)
 G k x (0)  G k 1 H u(0)  GH u( k  2)  H u( k  1)
从而
k 1
x ( k )  G k x (0)   G k  j 1 H  u( j ) ( 2.76a )
j 0

44
k 1
或 x ( k )  G x (0)   G H  u( k  j  1)
k j
( 2.76b )
j 0

上两式可以用向量矩阵形式

 x(1)  G 
1
 H 0 0  0   u(0) 
 x( 2)  G 2   GH H 0  0   u(1) 
      
 x( 3)   G 3  x(0)   G 2 H GH H  0   u( 2) 
      
             
 x( k ) G k  G k  1 H G k  2 H G k  3 H  H   u( k  1)
 
( 2.76c )
解式(2.76)是按初始时刻为 k  0 得到的,若初始时刻从 k  h 开始,
且相应的初始状态为 X (h) ,则其解为:
k 1
x( k )  G kh
x ( h)   G k  j  1 H u( j ) ( 2.77a )
jh

k 1
或 x( k )  G kh
x( h)   G j  h H u( k  j  1  h) ( 2.77b)
jh

由解式(2.76)式(2.77)可以看出,离散系统的解和连续系统的解

是很类似的,也由两部分组成。第一部分是由初始状态 x (0) 转移而来,


第二部分是由控制作用所激励的状态转移产生的,而且其中
A( t  t 0 )
G k 或G k  h 相当于连续时间系统中的  ( t )  e
At
或  (t  t 0 )  e ,类似
地,这里也定义:
 (k )  G k ( 2.78a )
或  ( k  h)  G k h ( 2.78b)
称为离散时间系统的状态转移矩阵,很明显它满足:
 ( k  1)  G ( k )
 ( 2.79)
 (0)  I
状态转移矩阵具有如下性质:

45
(1)  ( k  h)   ( k  h1 ) ( h1  h), ( k  h1  h) ( 2.80)
(2)当且仅当 G (k ) 是非奇异时,  1 ( k )   (  k ) ( 2.81)
(3)如果 G 为对角线矩阵,且 G  diag ( g1 , g 2 , g n ) 则  ( k ) 也必为
对角线矩阵,即为
 ( k )  diag ( g1k , g 2k , , g nk )
( 4 ) 设 连 续 系 统 系 数 矩 阵 为 A具 有 两 两 相 异 的 特 征 值
1 ,  2 ,  3 , ,  n , G  e AT , T 为采样周期,记  i  e  iT ,则
n G   j I 
n
 (k )     k
 ( 2.82)
j 1   
i
i 1  i
ji 

j 

这可由 Sylveter 展开定理来证明,此略。


(5)因为当且仅当G 是非奇异时,  ( k ) 才是非奇异的,对于由连续系
统离散化得到的系统, G  e AT 总是非奇异的, 所以 ( k ) 必是非奇异的。
利用状态转移  ( k ) ,离散时间状态方程的解(2.76)可写成
k 1
x ( k )   ( k ) x ( 0)    ( k  j  1) H u( j )
j0
k 1
或 x ( k )   ( k ) x (0)    ( j ) H u( k  j  1) ( 2.83)
j 0

而(2.77)式可写成:
k 1
x ( k )   ( k  h) x ( h)    ( k  j  1) H u( j )
jh

k 1
或 x ( k )   ( k  h) x( h)    ( j  h) H u( k  j  1  h) ( 2.84)
jh

例 2.16 离散状态方程
x ( k  1)  G x ( k )  hu( k )
 0 1 1
其中 G  ,h  1
  0.16  1  

46
 1
试求当初始状态 x ( 0)    和控制作用为 u( k )  1 时,此系统的

 1
 ( k ) 和 x (k ) 。
解:根据定义
k
k 0 1
( k )  G   
  0.16  1
按上式直接计算  (k ) 有一定困难。为此,将原状态方程变换成约当标
准型,即将 G 变换为对角型。
~ ( k ) 代入原方程得:
令 x(k )  T x

x~ ( k  1)  T 1GT x
~ ( k )  T 1 hu( k )
相应地有
~
T 1GT    ( k )  (T 1GT )k  (  )k
k 1
~ ~ ~ ~
x ( k )   ( k )  x (0)    ( j )T  1 hu( k  j  1) ( 2.85)
j0

为此求特征值
  1 
I  G     (   0.2 )(   0.8 )  0
0.16   1
1  0.2  2  0.8
k
  0.2 0  ~   0.2 0  ( 0.2 )k 0 
所以    ,  ( k )    
 0  0.8  0
  0.8  0 ( 0.8 )k 

 1 1   4/ 3 5/ 3 
又求得 T    T 1   
  0.2  0.8   1 / 3  5 / 3

从而求得

~  1 1  (  0 .2 ) k 0  4 / 3 5/ 3 
 ( k )  T ( k )T 1       
  0.2  0.8  0 (  0 .8 ) k    1 / 3  5 / 3 

47
1  4( 0.2 )k  ( 0.8 )k 
5 (  0 .2 ) k  (  0 .8 ) k  
 

3   0 .8 (  0 .2 ) k  (  0 .8 ) k   ( 0.2 )k  4( 0.8 )k 

~ ( k ) ,该式右边第一项为:
现按(2.85)式求 x

~ ~ ~ 1
( 0.2)k 0  4 / 3 5 / 3  1 
 ( k ) x (0)   ( k )T x(0)   
 0 ( 0.8)k    1 / 3  5 / 3   1
1   ( 0.2) 
k

  
3 4( 0.8)k 

该式右边第二项为:

k 1 k 1
~ ~  4/ 3 5 / 3  1
  ( j )T 1
hu( k  j  1 )    ( j )  1 / 3 1
j 0 j 0   5 / 3 1

0   3  k 1 3( 0.2 ) 
k 1 j
( 0.2 ) j
        
( 0.8 ) j    2 j  0   2( 0.8 ) j 
j 0  0

 3 1  ( 0.2 )  ( 0.2 )2    ( 0.2 )k 1 
 


  2 1  ( 0.8 )  ( 0.8 )2    ( 0.8 )k 1  

 3 1  ( 0.2 )k  
 
1 . 2

  2 1 (  0 . 8 ) k

1.8

所以

 1
 1  ( 0.2) k   

 17
 (  0.2 ) k

5
~ ( k )  1   (0.2)    0.4  6 2
k

x     22 10 
3 4( 0.8) k   1

 0.9
1  ( 0.8) k   


 9
( 0.8) k

9 

48
 17 5
 (  0 .2 ) k

~(k )   1 1  6 2
x(k )  T x   0.2  0.8 22  
   ( 0.8)k  10 
 9 9 
 17 22 25 

 6 (  0. 2 ) k
 (  0 . 8 ) k

9 18 
  ( k  0)
 3 . 4 17 .6 7 
( 0.2)  k
( 0.8)  k

 6 9 18 

2.Z 变换求解

离散状态方程也可以用 Z 变换法求解,对式(2.75)两边 Z 变换,

zx ( z )  z x(0)  G x( z )  H u( z )

( zI  G ) x ( z )  zx (0)  H u( z )

即 x ( z )  ( zI  G )1  z x ( 0)  H u( z )

对上式两边取 Z 反变换。即得解 x (k ) :

x ( k )  Z 1  ( zI  G ) 1 z  x ( 0)  Z 1  ( zI  G ) 1 H u( z ) ( 2.86)

式(2. 86)和式(2.76)形式虽不不同,但实际上是完全一致的。

即有 
G k   ( k )  Z  1 ( zI  G ) 1 z  ( 2.87 )

 G k  j 1 H u( j )  Z 1 ( zI  G )1 H u( z )
k 1
和 ( 2.88 )
j 0

上两式可用如下证明:
先求 G k 的  变换,

   G z

k k
ZG k
 I  Gz  1  G 2 z  2   ( 2.89 )
k 0

式(2.89)两边同左乘 Gz 1

49
 
Gz 1 Z G k  Gz 1  G 2 z 2  G 3 z 3   ( 2.90 )

式(2.89)减式(2.90)有: ( I  Gz 1 ) Z G k  I  
对 Z G k  求解,有

Z ( G k )  ( I  Gz 1 )1  ( zI  G )1 z ( 2.91 )

式(2.91)两边取 Z 反变换,故得式(2.87),


G k  Z  1 ( zI  G ) 1 z 
再利用卷积求和公式证明式(2.88),
k 1 
 
Z   G k  j  1 H u( j )   Z G k  1 HZ  u( k )
 j  0 
 
 Z G k z  1 HZ  u( k )  ( zI  G ) 1 H u( z ) ( 2.92 )
式(2.92)两边取 Z 反边换,即得式(2.88):

 G k  j  1 H  u( j )  Z  1 ( zI  G ) 1 H u( z )
k 1

j0

例 2.17 同例 2.16 试用 Z 变换法求 ( k )和 x ( k ) 。

z
解:因为 u( k )  1 ,所以 u( z ) 
z 1

由式(2.87)

50

G k   ( k )  Z 1 ( zI  G )1 z 
 z 1  
1
1   
Z  z 
0.16 z  1 

 
 z  z  1 1 
 Z 1   
 ( z  0.2 )( z  0.8 )   0.16 z  
  4 1 5  5 
  
z 
 Z 1   z  0.2 z  0.8 z  0.2 z  0.8  

 0.8 0.8 1 4  
3    

  z  0.2 z  0.8 z  0.2 z  0.8  

1  4( 0.2 )k  ( 0.8 )k 5( 0.2 )k  5( 0.8 )k 
  
3   0.8( 0.2 )k  0.8( 0.8 )k  ( 0.2 )k  4( 0.8 )k 

再计算

 z   z 
2

 z   z  1  z 1 
z x ( 0)  H u( z )  
  z  
z    z  2z 
2
  
 z  1   z  1 

x ( z )  ( zI  G )1  z x ( 0)  H u( z )
 z2 
1  z  1 1  z  1 
  2 
( z  0.2)( z  0.8)   0.16 z    z  2 z 
 z  1 

 ( z 2  2 )z    17 z 22
z 25 
z
6 9 18
     
 ( z  0.2 )( z  0.8 )( z  1 )   z  0.2 z  0.8 z  1 
 
 (  z 2  1.84 z )z   3.4 z  179.6 z 187
z
   6   
 ( z  0.2 )( z  0.8 )( z  1 )   z  0.2 z  0.8 z  1 

51
从而得离散状态方程的解为:

 17 22 25 

 6 (  0.2 ) k
 (  0 .8 ) k

9 18 
x ( k )  Z  1  x ( z )    ( k  0)
 17 ( 0.2)k  88 ( 0.8)k  7 
 30 45 18 
显然和例  2.16 的结果是一致的。

3.线性时不变离散系统稳定条件

对线性时不变离散自由运动方程

x ( k  1)  G x ( k )

其解为 x( k )   ( k ) x 0
依定义,当系统渐近稳定时,必有

Lim x ( k )  Lim  ( k ) x 0  0
k  k 

由于起始条件 X 0 是任意的非零向量,上式即等价于

Lim  ( k )  0
k 

现设 G 具有两两相异特征值  1 ,  2 ,,  n (当有重根时也可进行类

似地推导,为简单起见,这里考虑为单值的情况)。则由(2.82)式,

可导出:

n 
n G   I 
 
Lim  ( k )  Lim    ik  
j
  0
k  k   i 1
   i   j  
j  1
 ji 

显然,欲使上式成立即要求

52
Lim  ik  0 ( i  1,2 , n )
k 

也即 i  1 ( i  1,2 , n ) ( 2.93 )

这即表明,线性时不变离散系统稳定的充分必要条件为其系数矩
阵G 的特征值的模均小于 1,即分布在 Z 平面上以原点为中心的单位
园内。而且,如果原连续系统是稳定的,即 Re   i   0 , ( i  1 ,2 , , n ) 则
T R   T
其离散化系统,由于  i  e i  e e i  1 , ( i  1,2 , , n ) 也将一定

是稳定的。事实上,这个结论是和经典控制理论中所指出的“时不变
线性离散系统稳定的充要条件为其脉冲传递函数的极点的模均小于 1”
的条件相等价的。

二、线性时变离散状态方程的解

现简单地研究一下时变离散系统状态方程的解。设时变系统的状

态方程为:

 x( k  1)T  G ( kT ) x( kT )  H ( kT )u( kT )
 ( 2.94)
 x( hT )  x 0

那么它的解是

k 1
x ( kT )   ( kT , hT ) x 0     kT , ( j  1)T  H ( jT )u( jT ) ( 2.95)
jh

证 明 :只需证明(2.95)式满足原方程和起始条件(2.94)式即可,

为此,有

53
k
x ( k  1)T     ( k  1)T , hT  x 0     ( k  1)T , ( j  1)T  H ( jT )u( jT )
jh
k 1
   ( k  1)T , hT  x 0    ( k  1)T , hT   1
( jT , hT ) H  ( j  1)T   u ( j  1)T 
j  h 1

 ( kT , hT )  G  ( k  1 )T   G  ( k  2 )T  G  ( h  1 )T   G ( hT )
  ( k  1 )T , hT   G ( kT )  G  ( k  1 )T  G ( h  1 )T   G ( hT )
 G ( kT ) ( kT , hT )

x ( k  1)T   G ( kT ) ( kT , hT ) x 0  G ( kT ) ( kT , hT )
k
   1 ( jT , hT )  H  ( j  1)T  u ( j  1)T 
j  h 1

   ( k  1)T , hT  1  ( k  1)T , hT  H ( kT )u( kT )


 k

 G ( kT ) ( kT , hT ) x 0   ( kT , hT )   1 ( jT , hT )  H  ( j  1)T   u ( j  1)T  
 j  h 1 
 H ( kT )  u( kT )
 k 1

 G ( kT ) ( kT , hT ) x 0     ( kT , ( j  1)T   H ( jT )u( jT )  H ( kT )u( kT )
 jh 
 G ( kT ) x( kT )  H ( kT )u( kT )

所以(2.95)式满足原方程(2.94)。再有令 k=h 代入(2.95)式:


h 1
x( hT )   ( hT , hT ) x 0     hT , ( j  1)T   H ( jT )u( jT )
jh

  ( hT , hT ) x0
 x0

表明式(2.95)也满足起始条件。由此结论得证。

54
第4章 线性定常系统的综合(模块十二)

前三章我们着重讨论了状态空间的分析方法。利用这些方法可以
分析系统的结构、性能。而综合是分析相反的一个命题。对于给定的一
个受控系统   ( A , B , C ) ,确定其控制规律,即设计控制器的结构
参数,使其控制性能满足事先给定的性能指标,这样一类问题称为
系统的综合问题。本章中只限于讨论线性定常系统在常规性能指标下
的综合问题,并且只涉及极点配置问题及镇定问题。关于解耦问题,
将在单独一章中讨论。

§4.1 状态变量反馈和输出反馈
无论在经典控制理论还是在现代控制理论中,反馈都是系统设
计的重要方式。但是,由于经典控制理论是用传递函数来描述系统的,
因此它只能对输出量进行一定改造后用来作为反馈量。这种方式称为
输出反馈,即量测输出量,再由输出的测量值与给定的输入量进行
比较后确定闭环系统的控制规律。而在现代控制理论中是用系统的内
部状态变量来描述系统特性的,所以除了上述的反馈外,通常采用
状态反馈,即利用系统的全部状态变量作为反馈量。
一、输出反馈和状态反馈的基本形式
设线性定常系统为
 x  A x  B u
 (4.1)
 y  C x  Du
其输入 u ,状态变量 x ,输出量 y 的维数分别是 r , n, m ,输 出 反
馈的基本形式如图 4.1 所示。
D

w + y
F
u
B
+ x C
+
+

+
-
A

1
图 4.1
设 H是rxm 阶矩阵,用 H y 作为反馈量构成闭环,并对输入量作
变换,变换矩阵为 F ,控制 u 便成为:
u  Fw  H y
 F w  H (C x  D u )
u  ( I  HD ) 1 ( F w  HC x ) ( 4.2)
即可导出闭环系统的方程
x  A x  B( I  HD )1 ( F w  HC x )
 [ A  B( I  HD ) 1 HC ] x  B( I  HD ) 1 F w
y  C x  D( I  HD ) 1 ( F w  HC x )
 [C  D( I  HD ) 1 HC ] x  D( I  HD ) 1 F w
以下我们假定 D  0 ,这样闭环系统就成为
 x  ( A  BHC ) x  BF w
 ( 4.3)
y  Cx
显然其传递函数阵为
WH ,F ( s )  C ( SI  A  BHC )1 BF ( 4.4 )
如果 F  I ,即对输入不作变换,就成为单纯的输出反馈,这时
(4.3)式,(4.4)式分别为如下形式:
 x  ( A  BHC ) x  B w
 ( 4 .5 )
y  Cx
W H ( s )  C ( SI  A  BHC ) 1 B ( 4 .6 )
状态反馈的基本形式如图 4.2 所示

x + y
w F
+ u B
+
∫ C
+

- +

K
2
图 4.2
设 K是r  n 阶矩阵,用 K x 作为反馈量构成闭环,对输入量也
作 F 变换,则得控制
u  Fw  K x ( 4. 7 )
这种反馈方式称状态反馈,闭环状态方程为:
 x  ( A  BK ) x  BF w
 ( 4.8)
 y  (C  DK ) x  DF w
当 D  0 时,闭环方程为
 x  ( A  BK ) x  BF w
 ( 4.9)
y  Cx
其传递函数为:
WK ,F ( s )  C ( SI  A  BK )1 BF ( 4.10 )
若 F  I ,则(4.9),(4.10)两式分别为:
 x  ( A  BK ) x  B w
 (4.11)
y  Cx
WK ( s )  C ( SI  A  BK )1 B ( 4.12 )
从(4.6)式和(4.12)式可以看出,输出反馈和状态反馈均可
改变系统的极点。但是反馈的引入并不增加新的状态变量,即闭环系
统和开环系统具有相同的阶数。
比较(4.5)式和(4.11)式可以看出,当 K  HC 时,状态反馈
和输出反馈的控制效果是一样的,凡是输出反馈阵 H 所能达到的效
果,通过状态反馈阵 K  HC 来代替,可达到同样的控制效果。但是
反过来,由于已知 K、C 时 H 阵不一定有解,这说明状态反馈有可能
获得比输出反馈更好的效果,输出反馈仅仅是状态反馈的特殊情况。
由(4.11)式可知,适当地选择反馈阵 K ,可以改善系统的性能或
者满足一定的设计指标。
例 4.1 设有二阶系统

3
 0 1   0
1  , c  [  1 ,  2 ]
T
A  , b
  a1  a 2   
分析状态反馈对系统性能的影响。
解: ( A, b, c T ) 的传递函数为:
 2S  1
w( s ) 
S 2  a2 S  a1
取状态反馈 k T  [ k1 , k2 ], F  I

T  0 1 
则 A  bk  
  ( a1  k 1 )  ( a 2  k 2 )
闭环传递函数为:
 2S  1
wK ( s )  2
S  ( a2  k2 )S  ( a1  k1 )
2
则: 1、2  -( a2  k2 )  (a2  k2 )  4( a1  k1 )
2
显然可见,只要适当地选择 k1 , k2 ,闭环的极点可以任意配置,如果
( a2  k2 )2
k1   a1
4
闭环就有两个相同的极点,并且在 k 2   a 2 时是稳定的;如果
( a2  k2 )2
k1   a1
4
闭环就有两个相异的实极点;如果
( a 2  k 2 )2
k1   a1
4
闭环成为振荡系统,在 k 2   a 2 时系统稳定,系统的稳态偏差为
1 1  ( a  k2 )   2 ( a1  k1 )
ep  1 , ev  t ( 1  ) 1 2
a1  k1 ( a1  k1 ) ( a1  k1 )2
若要求 e p  0 ,就需 k1   a1   1 ,这时
a2  k2   2
ev 
1
若还要求 e v  0 ,就需 k 2   a 2   2 ,那么自然要求  2  0 ,否则

4
系统就不稳定了。
二、状态反馈、输出反馈对系统能控性和能观性的影响
为了简单起见,我们讨论在 D  0 , 及F  I 的条件下反馈对能
控、能观性的影响,这并不失去一般性。此时原系统表示为
 x  A x  B u
 ( 4.13)
y  Cx
令 u wKx (4.14)
闭环系统的状态空间表达式为
 x  ( A  BK ) x  B w
 (4.15)
y  Cx
1.状态反馈不影响系统的能控性
计算式(4.15)的能控性矩阵,因为
( A  BK ) B  AB  BKB  AB  BD (这里 : D  KB )
( A  BK ) 2 B  ( A  BK )( AB  BD )  A 2 B  ( B、AB的线性组合)

( A  BK ) 3 B  ( A  BK )( A 2 B  ( B、AB的线性组合)
)
 A 3 B  ( B、AB、A 2 B的线性组合)

、A n 2 B的线性组合)
( A  BK ) n1 B  A n1 B  ( B、AB、A 2 B、
故有 B ( A  BK ) B  ( A  BK ) n1 B 
 1   
0 1   
 B AB  A B  
n 1 
    
 
0  0 1
上式中最后一个矩阵为非奇异矩阵,因此有
rank[ B ( A  BK ) B  ( A  BK ) n1 B ]  rank[ B AB  A n1 B ] (4.16)
式(4.16)表明状态反馈不影响系统能控性,即若原系统是完全能
控的,加上任意状态反馈后,所得到的闭环系统也完全能控。若原系

5
统是不完全能控的,不论加上什么样的状态反馈,所得到的闭环系
统仍然不完全能控。
2.状态反馈不一定保持系统的能观性
状态反馈有可能改变系统的能观性,即若原系统完全能观,在
某些状态反馈作用下,所得的闭环系统可能是不完全能观的。若原系
统不完全能观,在某些状态反馈作用下,所得的闭环系统可能成为
完全能观。对此,举例可以说明。
例 4.2 系统运动方程为
1 1  0
x   x  1  u , y  0 1 x
0 1  
显然该系统不完全能观,若取状态反馈 k 1   1 1 时,闭环系统为
  1 1  0
 x  ( A  b k ) x  bw    x   w
  1 0 1 
 y   0 1 x

显然该系统完全能观。若取状态反馈 k 2   0 1 时,闭环系统为
 1 1  0
 x  ( A  b k ) x  bw   x 1  w
 0 0  
 y   0 1 x

此时该系统仍然不完全能观。
当 y   1 1 x 时,系统是完全能观的,若取 k 3   1 2 时,闭环
系统不完全能观,若取 k 4   1 1 时,闭环系统仍是完全能观的。
当 y   1 0 x 时,系统完全能观,加任意的状态反馈后所得的
闭环系统仍是完全能观的。
3. 输出反馈可保持系统的能控性和能观性
因为对任一输出反馈系统都可以对应地构成等价的一个状态反
馈系统,而状态反馈保持能控性,从而证明了输出反馈可保持能控
性。再证明输出反馈可保持能观性。带有输出反馈的状态空间表达式

6
 x  ( A  BHC ) x  B w
 (4.17)
y  Cx
显然只要证明下式成立即可。
 C   C 
 C ( A  BHC )   CA 
rank    rank   (4.18)
     
 n 1   n 1 
C ( A  BHC )  CA 
证明方法与上面证明状态反馈能保持能控性的方法类似,读者可自
行证明。
可见我们可以给出这样的结论:状态反馈不影响系统的能控性但不一定保持系统的能观性
输出反馈不影响系统的能控性和能观性。
§4.2 单变量系统的极点配置
控制系统的各种特性或各种品质指标,在很大程度上是由系统
的极点决定的。因此,系统的综合形式之一,可以在 S 平面上给定一
组所希望的极点,通过状态反馈阵 k 的选择,使闭环系统
T T
 k ( A  bk , b, c ) 的极点恰好处于希望的一组极点的位置上。由于
希望极点位置有任意性,因此极点的配置应当做到具有任意性。这就
是所谓极点配置问题。

一、希望极点的选取
对于希望的极点选取,实际上是确定综合目标的问题。这里仅提
出一般应了解的方面。
(1)对于 n 维受控系统,应当且只应当指定 n 个希望的极点。
(2)对希望极点位置的选取,需要研究它门对系统品质的影响,
以及它们与零极点分布状况的关系,从工程实际需要出发加以解决。
(3)希望极点可以是实数或共轭复数对。
工程实际的需要要包括抗干扰能力,灵敏度等,所以极点位置的选
取实际上是个复杂的工作。
二、极点配置定理
对单输入单输出系统 ( A , b , c T ) 在 S 平面上预先任意指定 n 个

7
极点,则存在着状态反馈律:
T
u( t )   k x ( t )  w ( t ) (4.19)
使闭环系统  k ( A  b k T , b , c T ) 极点位于预先指定的位置上的充分必

要条件是原系统 ( A , b , c T ) 完全能控。
证 明 :上面我们已经证明了状态反馈不影响系统的能控性,因
此可以说若一个系统不完全能控,那么状态反馈不能改变系统的不
能控模态。这就证明了系统可以任意配置极点的必要条件是受控系统
( A , b , c T ) 是完全能控的。
下面证明充分性。
由于 ( A, b, c T ) 为能控的,那么一定可以通过非奇异变换,化
~ ~
成能控规范型   ( A , b , c~ T ) ,其中
 0
 
~  0 I n 1  ~ 
A , b  ,
  p1  p2   pn   0
 
1 
c~  [  1 , ,  n ]
T
(4.20)
对于状态反馈阵 k~  [ k~1 , k~2 ,  , k~n ] ,有
T

~ ~ ~T  0 I n1 
Abk   ~ ~ ~ 
  ( p 1  k1 )  ( p2  k2 )  ( pn  kn )
~ ~ ~ ~T ~ ~T 仍为能控标准型。这样状态
可见状态反馈系统  k  ( A bk ,b,c )
反馈系统的特征多项为:
~ ~ ~T ~ ~
f ( s )  SI  ( A  b  k )  S n  ( pn  k n )S n  1    ( p1  k1 )

( 4.21 )
假定任意给定的极点分布为  1 ,  2 , ,  n ,则希望的特征多项式为
n
f  ( S )   ( S   i )  S n   n S n  1   n  1 S n  2   1 ( 4.22 )
i 1

比较(4.21)式,(4.22)式,可知

8
~
pi  k i   i ( i  1, 2 ,  , n )
~
则 k i   i  pi
~T
所以 k  [ 1  P1 ,  2  P2 , ,  n  p n ] (4.23)
而原系统   ( A , b , c T ) 的线性反馈律应为:
T
u wk x
~  T 1 x , 即 x  T x
由 x ~ 代入上式
~
u wk Tx
T

所以 k~  k T T ~T
T
即  k T 1
T
k
由于线性非奇异变换不改变系统的特征多项式(4.21),所以 k 正是所
要求的反馈增益向量。上面只是对单输入系统作了证明,不难看到,
定理对多输入系统也是成立的。
上述证明过程也给出了单变量系统极点配置的方法,现归纳如
下:
~ ~ ~
(1)对于给定的系统   ( A, b) 化为能控标准型   ( A, b ) ;
~ ~ ~
( 2) 导出系统   ( A , b ) 的特征多项式,它也是原系统的特征
多项式。
f ( s )  S n  Pn S n  1    P1
( 3) 根据给定的极点分布 (1 ,  2 , ,  n ) 导出希望的闭环特征多
n
项式。 f  ( S )   ( S   i )  S n   n S n1     1
i 1
~ ~ ~ ~ 的反馈向量
(4)确定能控标准型   ( A , b ) 的状态 x
~T
k  [ 1  P1 ,  2  P2 ,  ,  n  Pn ]
(5)原系统   ( A , b ) 的状态 x 的反馈阵
~T
k T  k T 1
(6) 输入变换阵 F 对单变量系统是标量,可由综合指标中对系
统静态误差要求来确定。

9
当然,具体综合某个特定系统的状态反馈不一定完全遵照上述
步骤,可根据具体问题有所改变。
例 4.3 已知图 4.3(a)所示的受控系统,其传递函数为
0.0139 1
w( S )  
S ( 0.167 S  1) ( 0.083 S  1) S ( S  6) ( S  12)
u x1 x2
1 1
x3  y
1
S S6 S  12

u (a) y
+ T
F  ( A, b, C )
-

kT
x
(b)
图 4.3
综合指标为:
输出超调量 M p  5%
峰值时间 t p  0.5秒

静态误差 e p  0 , e v  0 .2
解 :考虑到综合指标既有动态要求,又有静态要求,所以采用
状态反馈和输入变换相结合的形式,即如图 4.3(b)所示。
In
(1) 将给定指标化为希望极点,确定 λ1
ωn
希望模型。显然希望极点数 n  3 。现在

这样选取:一对为主导极点对 1和 2 ,另 -σ
λ3
一个为远方极点  3 如图 4.4 所示。 Re
可以认为动态特性主要由主导极点决定, λ2

而远方极点只有微小的影响,主导极点对构 图 4.4

成二阶系统模型,有关系式: 1  2   n ,   cos 1 
其中  : 阻尼系数,

10
 n : 自然振动频率

由于系统性能主要由主导极点对决定,所以按综合指标先行决定主
导极点对 1和 2 。为此,利用二阶模型关系式:
 M  e  / 1 2  5%
 P
 
 t p   0.5秒
 n 1 2
来求  和  n

 5% 求 
2
利用 M P  e   / 1

则  / 1   2  3.14 从而有
1
   0.707 , 于是选取   0.707
2

由 tp   0.5 秒求 n
2
n 1  
 
tp    0.5
则 n 1   2 1
n
2

从而有  n   9 , 选  n  1 0
0.5  0.707
这样可定出主导极点对:
1 ,2   n cos   j n sin
 n  j n 1   2  7.07  j 7.07
而 远 方 极 点  3 应 该 选 择 得 使 其 和 原 点 距 离 远 大 于 1 , 现 取
 3  10 1  100 。
于是希望的闭环系统特征多项式为
f  ( S )  ( S  100 )( S  7.07  j 7.07 )( S  7.07  j 7.07 )
 ( S  100 )( S 2  14.1 S  100 )
 S 3  114.1 S 2  1510 S  10000
(2) 校核模型的静态指标,确定变换放大器系数 F;因为原系

11
统无零点,所以闭环系统的传递函数为
F
wk ( s ) 
f ( S )
由位置误差定义
 1 wk ( s )
e p  Lim 1  y p ( t )  Lim S (  )
t  S 0 S S
F
 1  0 ( 因为e p  0 )
 1
所以, F   1  10000
再校核速度误差 e v 是否满足要求
1 wk ( s )
ev  Lim t  y t ( t )  Lim S (  )
t  S 0 S2 S2
1  wk ( s )
 Lim
s0 S
因为
F
1  wk ( s )  1 
f ( s )
10000
1
S 3  114.1S 2  1510 S  10000
S 3  114.1 S 2  1510 S

S 3  114.1 S 2  1510 S  10000
所以
S 2  114.1S  1510
e v  Lim ( 3 )  0.1510  0.2
S  0 S  114.1 S 2  1510 S  10000

满足要求。
(3) 确定系统的状态空间表达式并化为能控标准型。原系统的
一个实现为 ( A , b , c T ) ,其中:
0 0 0  1 
A  1  6 0  , b  0 , c T   0 , 0 , 1
0 1  12 0

12
可求得变换阵 T
0 0 1  72 18 1
T 1  0 1  12 , T  12 1 0
1  18 144   1 0 0
~ ~ ~
得能控标准型 ( A , b , c T )
0 1 0  0
~  ~
其中 A  0 0 1  , b  0 , c T   1 0 0
0  72  18 1
~ ~ ~
(4)确定能控标准型 ( A , b , c T ) 的状态反馈阵 k~ T 。


令 k~  k~1 , k~2 , k~3
T

~
则 k1   1  p1  10000  0  10000
~
k 2   2  p2  1510  72  1438
~
k 3   3  p3  114.1  18  96.1
(5)确定对 ( A , b , c T ) 的状态反馈 k T
~
k  k T 1
0 0 1 

  10000 , 1438 , 96.1 0 1  12
1  18 144 
  96.1,  291.8 , 6582.4

(6)画出方块图如下:
w
u x1 x2
1
x3  y
1 + 1
10000
- S S6 S  12
+
96.1

+
-291.8

+
6582.4

13
图 4.5
例 4.4 在第一章中,我们已经得到了倒置摆的状态方程为:
0 1 0 0  0
0 0 1 0  1
x    x  u
0 0 0 1  0
   
0 0 11 0   1
其特征多项式是
f (  )  I  A   4  11 2   2 ( 2  11)
1   2  0,  3  11 ,  4   11
系统很不稳定,这和人们从物理意义上预料的一样,现在要设计状
态反馈,使系统稳定,并且使 1  1, 2  2 , 3 ,4  1  j 。
解:
(1)检查能控性
0 1 0 1 
1 0 
 2 3
Qk  b , Ab , A b , A b   
 0 1
0 1
0  11
 
  1 0  11 0 
因为 Qk  100 , Rank Qk  4 ,系统完全能控。
2 (2)化为能控标准型或直接计算,本题采用后者,所以本步骤省略。
(3)求闭环系统的特征多项式
令 k T   k1 k2 k3 k4 

14
T
fk ( S )  SI  ( A  b k )

0 1 0 0  0 
0 0 1 0  1 
 SI        k1 , k2 , k3 , k4 
0 0 0 1  0 
   
0 0 11 0   1
S 1 0 0
k S  k2 1  k3 k4
 1
0 0 S 1
 k1  k2  k3  11 S  k4
 S 4  ( k2  k4 )S 3  ( k1  k3  11 )S 2  10 k2 S  10k1
(4)期望的特征多项式为
f  ( S )  ( S  1 )( S  2 )( S  1  j )( S  1  j )
 S 4  5 S 3  10 S 2  10 S  4
上述两式对应项系数应相等。
即 k1  0.4 , k 2  1, k 3  21.4 , k 4  6
所以 k T    0.4 ,  1,  21.4 ,  6
(5)画出反馈系统模拟结构图

15
1

w + y
+ + x4 x3 x2 x1
+ 1
-1 ∫ ∫ -1 ∫ ∫
- u +

11

+
-6

+
-21.4
图 4.6
+
-1

+
-0.4

15
§4.3 多变量系统的极点配置

一、多变量系统状态反馈出现的新问题
设多变量系统
z   z  B1 u (4.24)
其中  为对角线矩阵(原方程假定已对角化)
  diag ( 1 , 2 ,  , n )
则 SI    ( S  1 )( S  2 )( S  n ) 即为该系统的特征多项式。

u  w  K1 z ( 4.25)
其中 K 1 为 r  n 阵,代入(4.24)式,则得:
z  (   B1 K 1 ) z  B1 w

+ u + z
w
-
B
+
∫ C
y

K1

图 4.7
闭环系统的特征多项式为
f K ( s )  SI  (   B1 K1 )
希望的极点分布为  1 ,  2 ,   n ,则其特征多项式为
f  ( s )  ( S   1 )( S   2 )( S   n ) ( 4.26 )
因为 K 1是r  n 矩阵,若采用单变量系统的设计 K 1 的老办法,就只
能有 n 个方程,因此确定不了 K 1 ,所以对多变量系统,选择 K 1 的
自由度大了,必须采用新的办法。
多变量系统的极点配置方法很多,这里仅介绍其中的一种,即
所谓双向量法。

16
二、双向量法
设原系统为
 x  A x  B u
 (4.27)
y  Cx
将(4.27)化为对角标准型
 z   z  B1 u
 (4.28)
 y  C1 z
令 u  w  K1 z
则 z  (   B1 K 1 ) z  B1 w
上式中 K 1 为 r  n 阵,设
K1  f d T ( 4.29 )

 f1   d1 
f  d 
f   2 , d   2
   
   
fr  d n 
则闭环系统的特征多项式为:
T T
f K ( S )  SI    B 1 K 1  SI    B1 f d  ( SI   ) I  ( SI   )( SI   ) 1 B1 f d
T
 SI   I  ( SI   ) 1 B1 f d

设希望极点为  i , i  1, 2 ,  , n ,则希望的特征多项式为:
n
f ( s )  ( S  i )

i 1

令 fK ( s )  f ( s ) 即
n
 ( S   i )  SI   I  ( SI   )1 B1 f d
T

i 1
n
又令  ( S  i )  SI   ( i为原系统的极点, i  1, 2 ,  , n )
i 1
n n
则  ( S   i )   ( S  i ) I  ( SI   ) 1 B1 f d T ( 4.30 )
i 1 i 1

17
设 P为n  m 矩阵 , Q为m  n 矩阵,可以证明恒等式:
I n  PQ  I m  QP
利用该恒等式,可得

T T
I  ( SI   ) 1 B1 f d  I  d ( SI   ) 1 B1 f (4.31)
 1n 1n

n1 n1

1 1 1 1
因为 ( SI   )  diag ( , ,, ) ( 4.32 )
S  1 S  2 S  n
设定 f ,即得

 r1 
r 
B f   2 (4.33)
  
1
n r r 1
 
 rn 
将(4.32)式,(4.33)式代入(4.31)式,得
 1  r 
S   0   1
T
2
  r2 
I  ( SI   )1 B1 f d 
T
 1 d  
 0 1 
 
 S  n   rn 
n
d1r1 d 2 r2 d n rn dr
1(   )  1  i i ( 4.34 )
S  1 S  2 S  n i  1 S  i

将(4.34)式代入(4.30)式
n n n d r
 ( S   i )   ( S   i ) ( 1   S i i )
i 1 i 1 i 1 i

所以
n
n
dr
 ( S  i )
 S i i  i 1
n
1 ( 4.35 )
i 1 i
 ( S  i )
i 1

上式中 ri 在设定 f 后由式(4.33)求得。  i 为设计要求,已经给定,

18
 i 是已知的,所以 d i 可以求出,进一步由(4.29)式求得 K 1 。
 4 10  1 1
例 4.4 已知 x    x   2 0 u
  3  7   
要求:  1  3 ,  2  3 ,求反馈阵 K 。
解(1)化原系统为对角标准型,计算开环极点
 I  A  (   1)(  2)
 1  1,  2  2
并求得变换矩阵
2 5  3 5 
T  T 1   
  1  3   1  2
令 x  T z ,得
 1 0   13 3 
z    z    5  1 u
 0  2   
n
d r
(2)计算  S i i
i 1 i
2
 ( S   i )  ( S  1 )( S  2 )  S 2  3 S  2
i 1
2
 ( S   i )  ( S  3 )2  S 2  6 S  9
i 1
2

2
dr
 ( S  i ) S 2  6S  9 3S  7 4 1
 S i i  i 1
2
1
S 2  3S  2
1
S 2  3S  2
 
S 1 S 2
i 1 i
 ( S  i )
i 1

所以 d 1 r1  4 , d 2 r2  1
  1
(3)求 K,假设 f   
1
 13 3    1   10  r1 
B1 f  r      
  5  1  1   4   r2 

19
d 1 r1 4 2
d1   
r1  10 5
d 2 r2  1 1
d2   
r2 4 4

 2 1 
  1  2 1  4 
  5
T
所以 K1  f d     
 1  5 4   2 1
 
 5 4
 19 3 
 20 2 
而 K  K 1  T 1  
 
  19 
3
 20 2 
(4)验证

  19 3 
  2 
  4 10  1 1  20 
SI  ( A  BK )  SI   
   3  7   2 0  
   19  3
  20 2  
 4 10  S  4  10
 SI     4.9  ( S  3) 2
  4.9  10  S  10
所以  1   2  3 ,满足要求。
上例也可以看出,选择 f 不能使 B1 f 出现零元素,否则 ri 为零,
d i 就得不到。
从上面可以知道,对单变量系统,完成希望极点配置任务的状
态反馈阵 k T 是唯一的,而对多变量系统其 K 阵不是唯一的。对单变
量系统,引入状态反馈任意配置极点的同时,并不改变系统的零点,
除非故意制造零极相消,而对多变量系统引入状态反馈后其零点可

20
能会改变,故在实际应用中必须注意。
由极点配置定理可知:系统完全能控是闭环极点任意配制的条
件,当不满足条件时,显然不能任意配置闭环极点,但有可能配置
一些特定的极点组。由于状态反馈不能改变系统的不能控模态,当
系统不完全能控时,若希望的极点组中包含了系统所有的不能控模
态时,这组希望极点也是可以配置的。
§4.4 带输出误差积分的状态反馈(稳态特性)
一、问题的提出
上面我们看到,采用状态反馈,可以使系统的极点处于指定的
位置上,因而也就决定了系统的瞬态特性。现在,来分析另一方面
的问题,即稳态特性。
设如下系统
 x ( t )  A x ( t )  B u( t )  d ( t )

 y( t )  C x( t ) (4.36)
这里 u( t ) 为控制向量, d ( t ) 是未知的 n 维扰动输入向量,我们希望
输出 y(t ) 尽可能地接近于一个参考输入(或期望输入) y r ( t ) ,假
定(4.36)式对输入 u 是完全能控的。
对于一个具有恒定参考输入和恒定扰动输入的系统,如果保证
控制输入中包含有正比于误差的积分项,就可获得理想的稳定精度。
如图 4.8 所示。

yr e q u d x y
-
X  A X  B u  d
+
∫ K2 C
+ +

K1

图 4.8 所示。
设 y r , d 均为阶跃函数的情况,在这种情况下,控制作用应包
含这样一项,它正比于

21
t t
q( t )  0
e( t )dt  
0
[ y( t )  y r ( t )]dt
q ( t )  e( t )  C x ( t )  y r ( t ) ( q( 0)  0 )
这里 e( t ) 为误差向量。
二、复合系统
令 u  K1 x  K 2 q
我们把 q 也当作为一个状态向量,这样可以把原系统(4.36)式增
广如下:

 x   A 0  x   B   d 

 q   
    u   y 
  C 0   q   0   r
 x
y   C 0   (4.37 )
q
三、复合系统的能控性
首先提出的问题是:新系统对输入 u 是否能控?对此回答如下:
要使式(4.37)系统能控,其充分必要条件是:
1)原系统(4.36)式能控
 A B
2)且 Rank    nm
C 0 
注意上式成立的必要条件是: r  m ,(即有多少个输出,至少有
多少个输入)及 Rank ( C )  m ,(即输出相互独立的)。
上面的结论是可以严格证明的,读者不妨试证一下。当然直接判
别复合系统的能控性也是可以的。但阶数高时,计算量较大。
四、复合系统的设计
 x ( t )
设 u( t )  [ K 1 , K 2 ]    K1 x  K 2 q ( 4.38)
 q( t ) 
代入(4.37)式得闭环系统:

22
 x   A  BK 1 BK 2   x   d 
 q      
   C 0   q    y r 
 x
y   C 0   (4.39)
q
注意:这里 K 1 取正号,目的是为了和 K 2 符号一致, K 1 也可取负号。
例4.5 已知如图 4.9 所示,自动搜索平衡系统,采用状态反馈
控制,状态向量 x为[ z , z , , ]T ,现假定小车受到风力 4w ,小球受
风力为 w ,为了便于立方程,设阻力方向如图所示。根据力学原理,
得系统方程:

w

4w  mg

Mg

图 4.9
 0 1 0 0  0   0 
 0 0
  1 0  1 
 u
4w 
 
 x  A x  bu  d  x
 0 0 0 1  0   0 
      
 0 0 11 0   1 6w 
 y   1 0 0 0 x

(1)建立组合系统
采用积分
t
q( t )  
0
[ y ( )  y r ( )]d

可消除 Z 的稳态误差。系统增广如下:

23
 z  0 1 0 0 0  z   0   0 
 z  0 0  1 0 0  z   1   4w 
d        
   0 0 0 1 0     0  u   0  (4.40)
dt         
 11 0 0     1
  0 0  6w 
 q  1 0 0 0 0  q   0    yr 
2 (2)判别组合系统的能控性
a)原系统能控
A b A b
3 b) 因为 T  10 , 即Rank  T  5
c 0 c 0
所以复合系统能控。
(3)复合系统的设计
T
令 K 1  [ k1 , k 2 , k 3 , k 4 ], K 2  k5
z
 z 
 
u  K 1 x  K 2 q  [k 1 , k 2 , k 3 , k 4 , k 5 ]  
 
 
 q 
将上式代入(4.40)式,得
z  0 1 0 0 0  z  0 
 z   k k 2 k 3  1 k4 k5   z   4w 
d  
1
   
    0 0 0 1 0      0 
dt        
  k  k 11  k  k  k  6 w
   1 2 3 4 5    
 q   1 0 0 0 0   q    yr 

f K ( S )  SI  ( A  b K T )  S 5  ( k 4  k 2 )S 4  ( k 3  k1  11 )S 3

 ( 10k 2  k 5 )S 2  10k1 S  10k 5
设希望的极点为  1,  2 ,  2 ,  1  j ,  1  j 则

24
f  ( S )  ( S  1 )( S  2 )2 ( S  1  j )( S  1  j )
 S 5  7 S 4  20 S 3  30 S 2  24 S  8
解得 k5  0.8 , k1  2.4 , k2  3.08 , k3  33.4 , k4  10.08

即 K 1   2.4, 3.08, 33.4, 10.08 , K 2  0.8


T

最后,可以验证闭环系统的稳态特性是令人满意的。(略)

§4.5 状态空间中系统的镇定问题
假定线性系统   ( A, B , C ) 完全能控,则一定存在线性状
态反馈 K,使闭环系统  K ( A  BK , B , C ) 极点可以任意配置。这
也可以说,对完全能控的不稳定系统,总可以求得线性状态反馈阵
K,使系统变为渐近稳定,即 A  BK 的特征值均在 S 平面的左边。
这就是镇定问题。可见镇定问题是极点配置问题的一个特殊情况。
在镇定问题中,只要求极点配置在 S 平面的左边,不必要在指定的
位置上,所 以 对 系 统   ( A, B , C ) , 若 存 在 状 态 反 馈 阵 K, 使
闭 环 系 统  K ( A  BK , B, C ) 的 极 点 具 有 负 实 部 , 则 称 原 系 统 是 状
态 反 馈 能 镇 定 的 。 同 理, 若 存 在输 出反 馈阵 H , 使闭 环系 统
 H ( A  BHC , B , C ) 的极点具有负实部,则称系统是输出反馈能镇
定的。
一、状态反馈能镇定的条件
线性系统   ( A , B , C ) 的状态反馈能镇定的充分必要条件为:
系统的不能控部分是渐近稳定的。对此说明如下:假定系统已经按
能控性进行分解成如下形式:
A A12  B 
A   11 B   1
 0 A22  0
设状态反馈阵为 K  [ K 1 , K 2 ] ,则闭环系统的状态矩阵为:
 A  B1 K 1 A12  B1 K 2 
A  BK   11 
 0 A22 
其特征多项式为:

25
f K ( S )  SI  ( A  BK )  SI1  A11  B1 K1  SI 2  A22
显然  1 ( A11 , B1 ) 是能控部分,所以上式中的 SI1  A11  B1 K 1 部分可
以 通 过 极 点 配 置 的 方 法 使 ( A11  B1 K1 ) 的 极 点 具 有 负 实 部 , 而
 2 ( A22 ,0 ) 是不能控部分,上式中的 SI 2  A22 部分说明无法通过极点
配置方法使 A22 的极点改变,而必须先行要求 A22 的极点具有负实部。
结论得证。
二、输出反馈能镇定的条件
对于输出反馈,我们在§4.1 中已经指出它保持了系统的能控性
和能观性,即输出反馈不能改变系统的不能控模态和不能观测模态 。
假定我们已经将系统 ( A , B , C ) 进行 Kalman 结构分解,
 A11 0 A12 0   B1 
A A22 A23 A24  B 
A  B   2
21

 0 0 A33 0  0
   
 0 0 A43 A44  0
C  [C 1 , 0, C 3 , 0]
其 中 A11 , B1 , C1 是 能 控 且 能 观 的 ; ( A22 , B2 ,0 ) 是 能 控 不 能 观 的 ;
( A33 ,0 ,C 3 ) 是不能控而能观的; ( A44 ,0 ,0 ) 是不能控又不能观的,则
对于这样的系统输出反馈镇定的条件(充分必要)为:
1)能控又能观测部分是能镇定的;
2)其余三部分均是渐近稳定的。
对此说明如下:设输出反馈阵为 H,则闭环系统矩阵为:
 A11  B1 HC1 0 A13  B1 HC 3 0 
 A  B HC A22 A23  B2 HC 3 A24 
A  BHC   21 2 1 
 0 0 A33 0 
 
 0 0 A43 A44 
其特征多项式为
f H ( S )  SI  ( A  BHC )  SI1  ( A11  B1 HC1 ) 
SI 2  A22  SI 3  A33  SI 4  A44
可以看出:当且仅当 A11  B1 HC1 具有负实部的极点,即能控又能

26
观部分为输出反馈能镇定, A22 , A33 , A44 均具有负实部的极点,即其
余三部分为渐近稳定的时候,闭环系统才是渐近稳定的。从而说明
了结论的的正确性。
例 4.6 分析如下不稳定系统的能否成为稳定系统。
  2 1 4 1
x   0  1 4 x  1 u
 0  2 3 1
解:
1 3 1 
Qk  1 3 1  Rank Qk  2 所以原系统不完全能控,取
 
1 1  3

1 3 1 0  1 3 
T  1 3 0 , T 1   0 1  1
   
1 1 0  2  2 0 
0  5 0   1
T 1 AT  1 2 0  , T  1 b   0
   
 0 0  2 0
可见其不能控部分的极点为-2,是渐近稳定的,因此原系统是能稳
定的。

27
第五章 状态观测器(模块十三)

第四章中介绍了状态反馈,它是现代控制理论中分析设计线性
系统的一个重要方法。但是,用这个方法时要求系统的状态变量可以
直接测量得到。而在许多情况下一个系统内部的状态变量并不能被直
接测量,状态反馈就有困难。经典控制理论中并不存在这个问题,因
为它用可以测量到的输出来进行反馈。因此可以想到,能否利用系统
可测的量来构造状态变量?本章就讨论这个问题,原系统的输入输
出是直接可以量测到的,于是可以另外再构造一个系统,这个系统
以原系统的输入输出作为输入,将状态重新构造出来,这样构造的
系统就称为状态观测器。
状态观测器是确定性系统的状态估计器。关于随机系统的状态估
计问题,如 Kalman 滤波器,由于时间限制本章就不介绍了,感兴趣
的同学可参考有关材料。

§5.1 状态观测器的基本概念
给定系统的状态空间表达式如下:
 x  A x  B u (5.1a )

y  Cx ( 5.1b )
设此系统是完全能观的,输入 u 和输出 y 是可以直接量测的。
将(5.1b)式两边对时间 t 求导数,得
y  C x  CA x  CB u
y  CB u  CA x
对上式再求导,并将(5.1a)式代入后得
y  CB u  CAB u  CA2 x
重复上述过程一直到 n  1 次求导,最后得
   CA n  2 B u  CAn  1 x
( n  1) ( n  2) (n 3)
y  CB u  CAB u
将以上各式写成矩阵形式

18
y  C 
   
 y  CBu  CA 
 y  CBu  CABu   CA 2  x  Q x
   
g

   
 ( n 1 )   ( n  1 ) 
  CA ( n 2 ) B u CA 
( n 2 ) ( n 3 )
 y  CB u  CAB u
由于系统完全能观,所以 Q g 的秩为 n ,因而上述方程中 x 有解,这

说明状态向量可用输入 u 和输出 y 以及它们的导数估计出来。


以上只说明在系统完全能观的条件下,可以利用输入和输出来
估计状态。但是,这种方案仅仅是一种可能性。在工程实际中,由于
引入大量高阶微分器,会给系统带来一系列高频干扰,从而大大影
响输出 x ,所以这种方案没有实际价值,但它清楚地表明,只要系
统是完全能观的,那么状态就可以用它的输入输出估计出来。
由上分析可知,我们希望的观测器中,不要含有微分器,而应
采用积分器。因此可按照(5.1)式的结构,设计出一个相同的结构
模型。
xˆ  A xˆ  B u (5.2)
其中 x̂ 为状态的估计值,这样可以构成如图 5.1 所示的开环状态估
计器。 ( 原系统 ) y
u
x  A x  B u
y Cx
(模型) x̂
x̂  A xˆ  B u (状态估值)

图 5.1
将(5.1a)式和(5.2)式相减,得
d
( x  xˆ )  A( x  xˆ )
dt

19
ˆ 0 ,则
设两个系统的初始状态分别为 x 0 , x

x ( t )  xˆ ( t )  e At ( x 0  xˆ 0 )
所 以 只 要 x 0  x̂ 0 , 就 有 x ( t )  x ˆ ( t ) , 即 x̂ 完 全 复 现 x 。 当
x 0  x̂ 0 时,如果 ( A, B ,C ) 是稳定的,即 A 的特征值都具有负实
部,则有 Lim ( x ( t )  xˆ ( t ))  0
t 

该式说明 x̂ 不断地逼近 x ;当 ( A , B , C ) 不是稳定系统时,上述方


案不能实现。实际上由于模型参数不准确,噪声和干扰也难以一致,
上述开环观测器存在严重问题,解决的办法是采用如图 5.2 所示的方

案。我们把可量测的 y 及 ŷ 的差值乘以适当的加权矩阵 M 进行反馈,


这时观测器方程为:
xˆ  A xˆ  B u  M ~y (5.3)
从(5.3)式可知,对原模型(5.2)式增加了一项取决于输出误差量
的校正项。由于

u x  A x  B u y
y Cx
~
y +

M ŷ -
C

xˆ  A xˆ  B u  M ~y
图 5.2
~y  y  yˆ  y  C xˆ
(5.3)式可写成
xˆ  A xˆ  B u  M ( y  C xˆ ) (5.4)
进一步写成

20
xˆ  ( A  MC ) xˆ  B u  M y ( 5.5)
为了表示状态误差量,将(5.1a)式减去(5.3)式,则得
x~  x  xˆ  A x  A xˆ  M ~y  A( x  xˆ )  MC ( x  xˆ )
 ( A  MC )( x  xˆ )  ( A  MC ) x~ (5.6)
只要适当地选择 M ,使 A  MC 的特征值具有负实部,则有

Lim  x( t )  xˆ ( t )  0
t 

这说明只要原系统完全能观,总可以按要求配置观测器的极点,使
~ 按要求的速度衰减到零。图 5.2 所示的观测器称为全
状态观测误差 x
维观测器。其结构特点是,仿原系统再加上反馈阵 M。
从第三章中已知,若  ( A, B, C ) 不完全能观,那么,总可以按能
观性分解,得
A 0  B 
A   11 B   1
 A21 A22   B2 

 x1 
C   C1 0 , x  ( 5 .7 )
x2 
其中: x 1 为能观测状态部分,其维数为 n1 ;

x 2 为不能观测状态部分,其维数为 n  n1 ,
( A11 , B1 , C1 ) 为能观子系统, ( A22 , B2 ,0 ) 为不能观子系统,此时
按(5.5)式,构造状态观测器
x̂  ( A  MC ) xˆ  B u  M y
 M1 
其中 M  
M  , M 为 n  m 维, M 1 为 n1  m 维, M 2 为 ( n  n1 )  m
 2
维,由(5.6)式可知

 x 1  xˆ 1   A11  M 1C1 0   x 1  xˆ 1 


     x  xˆ  ( 5 .8 )
 x 2  xˆ 2   A21  M 2 C 1 A22  2 2 
显然,只要适当选择 M 1 ,总可以使 A11  M 1C 1 的特征值具有负实部,

21
从而使 Lim ( x 1 ( t )  xˆ 1 ( t ))  0
t 

但是无论 M 怎么选择也改变不了 A22 的极点。若 A22 的特征值也具有


负实部,那么

Lim ( x 2 ( t )  xˆ 2 ( t ))  0
t 

于是我们得到如下结论:
线性定常系统  的观测器  g 可以任意配置极点,即状态误差向
量按任意希望的速度衰减到零的充分必要条件是原系统 ( A , B , C )
完全能观;对不完全能观的系统 ( A , B , C ) ,其观测器存在的充分
必要条件是  的不能观测部分是渐近稳定的,这时观测器的极点不
能任意配置。
§5.2 全维观测器的设计
从(5.6)式可知,全维观测器的设计,实际上在于合理选择 M
阵,使 ( A  MC ) 的特征值具有负实部,而且负实部的绝对值足够大,
ˆ ( t ) 逼近 x (t ) 的速度足够快。同时应当考虑到观测器的通频带,
使x
使它具有一定的抗高频干扰的能力。因此在设计时应兼顾这两个方面。
在选择合理的观测器极点后,就可以用前述方法计算 M 。以单变量系
统为例设计步骤如下:
(1)判别系统的能观性;
(2)若系统能观,化为能观标准型;
~ ~ ~T
现假定其能观标准型为 ( A , c ) ,其中
 0  P0 
  P1 
~   c~   0  0 1
T
A
 
 I n 1
 
  Pn  1 
~ ~ ~T ~
(3)计算能观标准型 ( A , c ) 的观测阵 M ;

22
m~ 
0
m~ 
~  1 
设 M
 
~ 
 mn 1 
观测器系数矩阵为
 0  P0  0  0 m ~ 
0
   ~ 
~ ~ ~T   P1  0  0 m1 
A  Mc  
 I n 1      
   ~ 
  Pn1  0  0 m n 1 

 0  ( P0  m~ ) 
0
 ~ ) 
 ( P1  m
 1 
 I n1  
 ~ 
  ( Pn 1  m n  1 )

于是特征方程为:
~ )S n  1    ( P  m
f ( S )  S n  ( Pn 1  m ~ )S  P  m
~ ( 5.9 )
n 1 1 1 0 0
根据希望的观测器极点,得到希望的特征多项式
f * ( S )  S n   *n 1 S n 1    1* S   *0 ( 5.10 )
比较(5.9),(5.10)两式得
~  P  *
m ( i  0 ,1,2 , , n  1 )
i i i

(4)求原系统  ( A, b, c T ) 的观测阵 M :
~
由M TM 计算 M
(5)画出观测器的结构图。
例 5.1 设有系统
1 0 0 1 
A  0 2 1 , b   0 , c   1 1 0
T
   
0 0 2 1 
求它的状态观测器,并使观测器的极点为-3、-4、-5。
解 1) 判此系统的能观性

23
1 1 0
Q g  1 2 1 Rank Q g  3 , 所以系统能观。
 
1 4 4
2)化原系统为能观标准型
 4 4 1   0  1 
Q g1    3 4  1 , r  Q g 1 0    1
     
 2  3 1  1   1 
1 1 1 4 2  1
 
T  r , Ar , A 2 r    1  1

0 ,

T 1    4  3 1 
 
 1 2 4  1 1 0 
0 0 4   3
~   ~  
c~   0 0 1
T
所以 A  1 0  8 b  3
 
0 1 5   1 
3)求观测阵 M ,由观测器的希望极点,得特征方程:
f * ( S )  ( S  3 )( S  4 )( S  5 )  S 3  12 S 2  47 S  60
~
于是可算出观测阵 M  m
~ ,m
0
~ ,m~ T ,其中
1 2

m~  P   *  4  60  64
0 0
 0
~ *
 m1  P1   1  8  47  39
~
 m2  P2   *  5  12  17
 2

~
   120 , 103 ,  210 ,由式(5.5)得观测器方程为:
T
因而, M  T M
  119  120 0 1   120 
x̂   103 105 1  xˆ  0 u    103 y
     
  210  210 2 1   210 
由式(5.3)画出观测器结构如图 5.3 所示: ŷ y
u + x̂ 1 - +
~
+ +
y
-
+ x̂ 3+ x̂ 2
+
 
+ + 120
2
+
2
- 103
24

210
图 5.3
例 5.2 再次研究倒置摆系统,其状态向量为

x   z , z,  ,  
T

系数矩阵为
0 1 0 0
 0
0 0  1 0
 1
A  b   ,, c   1 0 0 0
T
0 0 0 1
 0
   
0   1
0 11 0
并假定唯一可测得的输出量为 z( t ) ,即小车的位置,试设计全维观
测器,使观测器极点为-2,-3,-2±j。
解:(1)判别系统的能观性
1 0 0 0
0 1 0 0
Qg    Rank Q g  4 , 此系统能观。
0 0 1 0 
 
0 0 0  1
(2)本题系数矩阵较简单,可直接计算 M ,不必先化为能观标
准型。
 m1 
m 
M   , 则
2

 m3 
 
 m4 
0 1 0 0  m1 0 0 0  m1 1 0 0
0 0 1 0   m2 0 0 0   m2 0  1 0
A Mc  
T   
0 0 0 1   m3 0 0 0   m3 0 0 1
     
0 0 11 0  m4 0 0 0  m4 0 11 0
则其特征多项式为:

25
T
f ( s )  SI  ( A  M c )

 S 4  m1 S 3  ( 11  m2 )S 2  ( 11m1  m3 )S  ( 11m2  m4 )
观测器希望的特征多项式为:
f * ( S )  ( S  2 )( S  3 )( S  2  j )( S  2  j )
 S 4  9 S 3  31S 2  49 S  30
由上两式得
M    9 ,  42 , 148 , 492
T

.(3)画出观测器结构图
u
y  x1
- x̂ 4 + x̂ 3 +
+
x̂ 2 x̂1  ŷ +
  ~y
+  -1
+ +  -
+
11
9

42

-148

-492
图 5.4
全维观测器方程为:
0 1 0 0  0  9
 0  1 0 1   42
xˆ  A xˆ  Bu  M~y  0  xˆ    u    ~y
0 0 0 1  0  148 
     
0 0 11 0   1  492 
也可以写成如下形式:
 9 1 0 0 0  9
      42
̂x  ( A  MC ) xˆ  Bu  My    42 0 1 0 1
 xˆ    u   y
 148 0 0 1 0  148 
     
 492 0 11 0   1  492 
§5.3 降维观测器

26
一、问题的提出
上节中讨论的观测器是对全部几个状态进行观测。实际上这种观
测器含有多余的东西,因为状态的某种线性组合(由 C 阵决定)可
以直接作为输出而测出,并不需要进行估计。如例 5.2 中,小车的位
置 z 可以直接量测 ( y  z ) ,所以只需要观测 z , ,  三个状态变量
即可,由此说明状态观测器的维数可以降低,对于一般情况:
 x  A x  B u
 (5.11)
y  Cx
总可以作一个线性变换
~  Q x 或 x  Q 1 x
x ~ ( 5.12)
其中
 D ( n  m )  n
Q  ( 5.13 )
C  m  n
( 5.13 ) 式 中 C 为 m  n 阵 , 秩 为 m , D 为 使 Q 1 存 在 的 任 意
( n  m )  n 矩阵,通过此线性变换将(5.11)式变换成:

 x~  QAQ  1 x~  QB u

  x~ 1  ~ (5.14)
 y  CQ x   0 I   x~   x 2
1 ~

  2
~ 为 m 维,是直接可以量测的,现在只要观测 ( n  m ) 维状态
其中 x 2

~ 即可。
向量 x 1

二、降维观测器的设计
现在来考虑如下形式的能观系统,它的输出量由后面的 m 个状
态组成
 x 1   A11 A12   x 1   B1 
 x    A 
A22   x 2   B2 
u
 2   21
 x1 
y   0 Im     x2 (5.15)
 x2 

27
上面已经讨论过,这种形式是通过线性变换得来的,所以并不失
去它的一般性。整理(5.15)式得:
 x 1  A11 x 1  A12 x 2  B1 u (5.16a )

 x 2  A21 x 1  A22 x 2  B2 u (5.16b)

v  A12 x 2  B1 u (5.17 )

 z  A21 x 1 (5.18)
将(5.17)代入(5.16a),并和(5.18)联立得系统
 x 1  A11 x 1  v
 ( 5.19)
 z  A21 x 1
因 为 u已 知 , y  x2可 以 直 接 量 测 , 所 以 把
v  A12 x 2  B1 u  A12 y  B1 u 当作已知输入量并不困难。同理
z  A21 x 1  x 2  A22 x 2  B2 u  y  A22 y  B2 u
也可直接算出。
这样(5.19)式可以看作为(5.15)式的一个子系统。可以证明若
原系统(5.15)是能观的,则子系统(5.19)式也是能观的(证明
略)。
一旦证实了式(5.19)是能观的,就可以用全维观测器的设计方
法来设计子系统(5.19)式的观测器。即
xˆ 1  ( A  M A ) xˆ 1  v  M z
11 1 21 1 (5.20)
其中 ( n  m )  m 维矩阵 M 1 可以选得使式(5.20)的极点置于期望的
任意位置,将 v, z 代入得:
xˆ 1  ( A11  M 1 A21 ) xˆ 1  A12 y  B1 u  M 1 y  M 1 A22 y  M 1 B2 u ( 5.21)
此系统即为系统(5.15)式的一个 n  m 维观测器
实现(5.21)式的一个明显的困难是需要输出量 y 的微分,可以
重新定义观测器的状态避开这个困难。

令 xˆ 1  M 1 y  w 并代入(5.21)式得

28
w  xˆ 1  M 1 y  ( A11  M 1 A21 )w  ( B1  M 1 B2 )u
  A12  M 1A22  ( A11  M 1 A21 ) M 1  y ( 5.22)


B0  B1  M 1 B2

E  A12  M 1 A22  ( A11  M 1 A21 ) M 1
即得
w  ( A11  M1 A21 )w  B0 u  E y
上述观测器也称为 Luenberger 观测器,用图 5.5 所示:

u
B0
+
y w + x̂ 1
+
E
+

+

A11  M 1 A21

M1

y  x2
图 5.5
整个状态向量可表示为:
 xˆ 1   w  M 1 y   I    M1 
xˆ        0  w   I y
y
   y     
由(5.19)式减去(5.20)式得
x~ 1  ( A11  M 1 A21 ) x~ 1
显然这种观测器的误差为:

x~  x 1  xˆ 1  e ( A11  M 1 A21 ) t x~ 1 (0)


设计者根据需要总可以选择适当的 M 1 ,使其误差按规定的速度衰减

29
到零。
这种观测器的一个明显缺点是,量测通过 M 1 直接反映到状态 x̂ 1
上来,(见图 5.5)这样就必然将量测噪声带入。另外, M 1 的误差直
接影响到 x̂ 1 的稳态值,而在全维观测器中不存在这种误差。
例 5.3 上例中设计了倒置摆的全维观测器,由于小车位移直接可
以量测,所以可设计降维观测器,并使降维观测器极点为  3 ,2  j 。
 z  0 1 0 0  z   0 
    
d  z  0 0 1 0  z  1 
解:倒置摆状态空间表达式为     u
dt   0 0 0 1   0 
      
  0 0 11 0     1

z 
 z 
y   1 0 0 0  
 
 
 
(1)判能观性
已经证明此系统完全能观。
(2)将此系统进行线性变换,得到(5.15)式形式。
本系统输出矩阵很简单,只要重新安排状态变量次序即得
(5.15)式形式。
  z  0  1 0 0  z   1 
   
 d    0 0 1 0    0 
   u
 dt   0 11 0 0     1
       
  z  1 0 0 0  z   0 

  z 
  
 y  0 0 0  1  
  
  
 z 
式中虚线将 A11 , A12 等分开,因为 A12 , A22 和 B2 均为零,由(5.22)式得

30
w  ( A11  M 1 A21 )w  B1 u  ( A11  M 1 A21 ) M 1 y
(3)求 M 1
 m1 
设 M 1   m2  ,则
 m3 

0  1 0  m1 0 0  m1  1 0
A11  M 1 A21  0 0 1   m2 0 0    m2 0 1
     
0 11 0  m3 0 0  m3 11 0
此矩阵的特征多项式为:
 S  m1 1 0
f1 ( S )  SI  ( A11  M 1 A21 )    m2 S  1
 
  m3  11 S 
 S 3  m1 S 2  ( m2  11 )S  ( 11m1  m3 )
由希望的极点分布: 1  3 , 2 ,3  2  j 得特征多项式

f1* ( S )  ( S  3 )( S  2  j )( S  2  j )  S 3  7 S 2  17 S  15
所以
  7
M 1   28 
 
92 
(4)写出观测器方程
  21
E  ( A11  M 1 A21 ) M1  104 
 
 336 
 1   7  1 0
B0  B1   0  , A11  M 1 A21   28 0 1
   
  1  92 11 0
得观测器方程为

31
  7  1 0  1    21
w  ( A11  M 1 A21 )w  B1 u  Ey   28 0 1 w   0  u  104  y
 92 11 0   1  336 
1 0 0  7 
0 1 0   28
I   M1   w   y
xˆ    w    y  0
0
   1  0 1   92 
   
0 0 0  1 
(5)进一步可画出降维观测器的框图(略)

§5.4 重构状态反馈控制系统
上两节,我们介绍了全维观测器及降维观测器,在第四章中了
解到一个完全能控的系统可以用状态反馈控制规律将闭环极点配置
在期望的任何位置上。如果反馈时得不到全部状态,可用观测器对它
进行估值并将观测到的估值用到控制规律中去。这就是所谓重构状态
反馈控制系统。本节将讨论带有重构状态的反馈控制系统的设计问题
以及它的一些特征。图 5.6 表示这种重构状态反馈控制系统。

w+ u y
- x  A x  B ux C xˆ  A xˆ  B u
 M ( y  C xˆ )

K
图 5.6
设能控又能观的系统为
 x  A x  B u

y  Cx (5.23)

32
当状态不能直接测量时,可以用状态观测器将状态 x 观测出来,即
xˆ  ( A  MC ) xˆ  B u  MC x (5.24)
为了便于分析,可将对象(5.23)式和观测器(5.24)式看成是一个
2n 维的合成系统:
  x   A 0   x B
          u
  xˆ    MC A  MC   xˆ   B 

 y   C 0  x  (5.25)
  xˆ 
  
此时,反馈控制律为
u  w  K x̂ (5.26)
代入(5.25)式,得
  x   A  BK   x  B
  ̂      xˆ    B  w
 x   MC A  MC  BK    
 (5.27)
 y   c 0  x 
  xˆ 
  
~
但是,一般用误差 x  x  xˆ 来表示这个系统的状态更为方便。通
过下述状态变换容易做到这一点。

1
x x   In 0n   x  I 0  I 0 
~   x 
x 
xˆ   I n  I n   xˆ 
, 又
 I 

 I 
   I I
它可以将(5.27)式变成
  x   A  BK BK   x   B
  ~     w
 x   0 A  MC   x~   0 

 y   C 0  x  (5.28)
  x~ 
  
上式的特征多项式为

33
 A  BK BK 
f ( s )  SI 2 n   
 0 A  MC 
SI  ( A  BK )  BK
 n
On SI n  ( A  MC )
由分块矩阵行列式公式可写成
f ( s )  SI n  ( A  BK ) SI n  ( A  MC ) ( 5.29 )
可见,重构状态反馈系统的特征值由两个不同的部份组成,一
部分是由反馈矩阵 K 决定的 ( A  BK ) 的极点;另一部分是由状态观
测器参数 M 决定的 ( A  MC ) 的极点。这两部分的极点是可分离的,这
一性质称具有可分离性。很明显,状态向量 x 的性能由 ( A  BK ) 的
~ 的性能则由 ( A  MC ) 的极点所支配。所以
极点所决定,而误差向量 x
反馈控制规律的确定和观测器的结构实现可以当作单独问题来考虑。
现概括成如下定理。
可分 离性定理 :如果系统  ( A , B , C ) (5.23)式的反馈控制规
律可以用观测器来实现,则最后合成系统的极点由下列两部分组成:
a) A  BK 的极点——完全由反馈矩阵 K 所决定;
b) A  MC 的极点——完全由观测器参数 M 所决定。
状态向量的性能由 a)中极点所支配,误差向量的性能由 b)中极点
所决定。
§5.5 扰动量的观测
如果系统 ( A , B , C ) 受到一个不可量测的常值扰动,即
x  A x  B u  E w (5.30)
其中 E 为 n  l 阵, w 为 l 维的常值扰动。那么,可以将 w 当作状态,
用观测器将它估计出来。于是系统可写成
  x   A E   x   B 
  w    0 0   w   0  u
      
 (5.31)
 y   C 0  x 
 w
 

34
x 
其中新状态向量   为 n  l 维。
w 
这个方法的实现依赖于式(5.31)是否能观,可以证明合成系统
(5.31)式能观测的充分必要条件为
1)原系统 ( A , B , C ) 能观测;
 A E
2) Rank 
C 0   n l
 
注意这个条件仅当 m  l 时(即至少输出量的个数和干扰量的个数相
等),及 RankE  l (即干扰量为独立的)才能成立。
只要检验(5.31)式完全能观,就可以设计全维观测器或降维观

1 M 
测器。令 M   
 M2 
则(5.31)式的全维观测器为:
 xˆ   A  M 1C E   xˆ   B   M 1 
      wˆ   0  u   M  y (5.32)
 wˆ   M 2 C 0      2 
对观测器来说,我们感兴趣的总是状态量的误差量,为此令
 
x~  x  xˆ , w
~  w  wˆ
将(5.31)式减去(5.32)式,即得
 x~   A  M 1C E   x~ 
 ~    (5.33)
 w   M 2C 0   w
~

由(5.33)式可知,适当地选择 M 1 , M 2 可以使观测误差按希望的速
度衰减到零。
§5.6 Kalman 滤波器的基本概念
一、问题的提出
以往我们所讨论的仅是确定性系统,即系统
 x  A x  B u
 (5.34)
y  Cx

35
其中 A , B , C 是已知常阵,系统内并不存在随机干扰, u 是确定
性输入,其值精确给定; y 是可精确量测的输出;状态 x 也是确定
量。 x 虽然不能从 y 简单地确定出来,但是只要系统能观,就可以通
过输入 u 和输出 y 把状态 x 观测出来,得到了状态的观测量 x̂ 就能
实现状态反馈控制,观测器示意见图 5.7。
u
观测器 x̂
y
x̂  ( A  MC ) xˆ  B u  M y

图 5.7
但是很多情况下, x 本身可能受到“系统干扰”的影响,在量测过
程中也会有“量测噪声”的出现。如果这些随机干扰比较严重不容忽
视,那么状态观测器就不能满足要求了。观测器只能用在随机干扰可
以忽略的情况。
二、线性随机系统
和确定性系统相对的系统是随机系统。在讨论随机系统之前,首
先对分析随机系统用到的概率统计的一些基本概念作一简单回顾。
1.随机变量 x 的数字特征
表示随机试验的结果即为随机变量的取值。所谓随机变量的均
值指的是随机变量 x 的平均值,用下式表示。

x  E  x ( 5.35 )

随机变量的方 差 指的是随机变量 x 与平均值之差的平方的平均


值。它表示随机变量围绕着平均值变化的分散程度,写成

 

Var( x )  E ( x  x )2 ( 5.36 )
显然非随机变量的方差为零。
两个随机变量 x 和 y 之间的依赖程度,主要用它们的协方差来度
量,表示为:

36
Cov( x , y )  E ( x  Ex )( y  Ey ) ( 5.37 )
如果 Cov( x , y )  0 ,则称 x , y 是两个不相关的随机变量,完全
独立的随机变量永远是不相关的。
2.随机过程及其数字特征
随 机 过 程 是 一 组 定 义 在 时 间 ( t0 , T ) 中 的 诸 随 机 变 量
 x( t ) : t0  t  T  的集合,例如 5 秒周期的每个时间点上电压表的读
数就是一个随机过程。
一个随机过程 x( t ) 的平均值和方差定义为:

x ( t )  E  x ( t ) (t 0  t  T ) (5.38)

 

Var x ( t )  E  x ( t )  Ex ( t )
2
(t 0  t  T ) (5.39)
对随机过程还有一个感兴趣的数字特征是自协方差函数。

r ( t , )  Cov x ( t ), x( )
 E   x ( t )  Ex ( t ) x ( )  Ex ( ) ( 5.40)
它度量过程同它本身在不同时刻的相互关系。若一个随机过程
x( t ) 有 r ( t , )  Var x( t ) ( t   )
1 t 
其中  ( t  )  
0 t 
则称此过程为广义的白噪声过程。意思是随机过程 x( t ) ,从一个时刻
t 到下一时刻  完全不相关。白噪声过程在物理上不可实现,但是它
是一个极其有用的数学手段。
3.随机向量及其数字特征
如果 x1 , x 2 , , x n 都是随机变量(或随机过程),它们的集合称
随机向量,随机向量用下式表达:

x   x1 , x2 ,, xn 
T
(5.41)

其平均值为:

x  E  x   x1 , x2 , , xn 
T
( 5.42)

37
协方差矩阵可定义为:

P  E ( x  x )( x  x )T 

 ( x1  x1 ) 2 ( x1  x1 )( x2  x 2 )  ( x1  x1 )( x n  xn ) 
 
 ( x2  x2 )( x1  x1 ) ( x2  x2 )2  ( x2  x2 )( xn  xn )
 E    0
  
  
 
( xn  xn )( x1  x1 ) ( xn  xn )( x 2  x2 )  ( xn  xn )2 
(5.43)
可以证明:此矩阵是对称而且非负定的。
如果这些随机变量两两不相关,那么非对角元素为 0,P 阵就成
为对角阵,即
 
 ( x1  x 1)
2
0 
P  E ( x2  x 2 ) 2  (5.44)
 2
 0 ( x n  x n ) 
 
现在讨论线性随机系统:

 x ( t )  A x( t )  B u( t )  F w( t )
 (5.45)
 y( t )  C x( t )  v ( t )
其中 w( t ) 是一个向量随机过程,称为模型噪声,输入噪声或过
程噪声, w( t ) 可以理解为外加控制信号 u( t ) 的波动或加到系统上的
未知干扰等, v( t ) 也是一个向量随机过程,称为量测噪声或输出噪
声,它表示测量不确定性或偏移,典型例子是量测放大器中的热噪
声。
首先对(5.45)式所示的系统作如下假定:
1)假定(5.45)式所示的系统是能控又能观的;
2)假定过程 w( t ) 和 v( t ) 为零均值白噪声,即

38
E  w( t )  0
E  v( t )  0 ( 对全部时间 t ) ( 5.46 )
 T

E w( t )w ( t )  Q ( t   )
E v( t )v 
T
( t )  R ( t   ) ( 对全部时间 t , ) ( 5.47 )
其中  ( t   ) 的定义和(5.40)式中定义的相同,协方差阵 Q 表示
w( t ) 各分量之间的相关程度,它是 l  l 的对称方阵;协方差阵 R 则
表示 v (t ) 各分量之间的相关程度,它是 m  m 对称方阵。
3)并且假定 w( t ) 和 v( t ) 是不相关的,即
 T
E w( t )v (  )  0  ( 对全部时间 t , ) ( 5.48 )
4)同时假定状态变量的初态和噪声过程 w( t ) , v( t ) 不相关,即

E x ( 0 )w ( t )  0 
T
 
 
 ( 对全部时间t ) ( 5.49 )
T
E x ( 0 )v ( t )  0 

5) x, y 为独立的随机变量。
以上假定可以保证状态 x (t ) 和输出 y( t ) , ( t0  t   ) 本身是正
规的向量随机过程。下面我们来研究在上述假定下的(5.45)式随机
过程的状态估计问题。
由于 x, y 都是随机量,因而必须用统计学的观点去估计 x 。现在
比较成功的方法是 Kalman 滤波器
由于 Kalman 滤波器的基本原理较复杂,这里只是比较通俗地介
绍离散型 Kalman 滤波器的基本原理。
和观测器一样,Kalman 滤波器的输入量也是 y 和 u ,输出是 x
的估计值。不同的是,它可以在随机干扰的情况下对 x 作出最优估计,
这相当于把噪声从有用的信号中滤掉,故称滤波器见图 5.8。

w
u

Kalman 滤波器

y v

39
图 5.8
Kalman 滤波器是一种递推估计,其过程为:

某一时刻的原 用量测结果 得到较可靠的估 状态转移 得到下一时刻估


估计 x k
进行修正
计 x̂ k 计 xˆ k  1

在以下的分析中也分两部进行,即
1)如何用量测结果 y k 来改善原估计 x k ,得到可靠的估计 x̂ k ,
y
k  x
ˆk。
即由 x k

2)状态转移后对下一时刻的估计,即由 xˆ k  x k  1 。
§5.7 Kalman 滤波器的递推算法
一、利用量测结果改善 x 的原估计
现在 x 、y 都是随机过程,并假定已经根据系统的状态方程对 x
作出了某种估计 x ,而且已经知道了它的协方差阵。
COV ( x , x )  E ( x  E x )( x  E x )T   M nn (5.50)
其中 M 是 n  n 正定对称阵,我们称 x 为量测前的估计或原估计。然
后根据量测结果 y 对原估计进行修改,以便得到更好的估计 x̂ 。
y
必须指出,由 x k 
k
xˆ k 是在同一步中进行的,它们的下标量
均为 k ,为了简化而将下标省略。
用量测 y 来修正原估计的公式为:

xˆ  x  K ( y  c x ) (5.51)
其中 k 为 Kalman 滤波器的增益矩阵,上式可用图 5.9 来表示。
x + x̂
X
+
-
C +
K
y

40
图 5.9
现在的问题是,原估计 x 并不十分可靠,量测结果 y 也并不十分靠,

我们怎样从中对 x 做出更好的估计呢?
假定 y 的协方差阵已知为

COV ( y , y )  E ( y  E y )( y  E y )T   R

(5.52)
R 为 m  m 的正定对称阵,并假定 y 与 x 是互相独立的随机变量,
现在需要在已知 x 和 y 的协方差阵 M , R 的情况下确定 K ,使得 x̂
是对于 x 的最优估计。
Kalman 滤波器是最小方差估计,它的最优准则是:

 
E ( x̂1  Ex̂1 )2  ( x̂2  Ex̂2 )2    ( x̂n  Ex̂n )2  min ( 5.53 )
即 x̂ 的各分量的方差之和最小。设 P 表示经量测 y 修正后的估计值 x̂
的协方差阵,即

P  E ( xˆ  E xˆ )( xˆ  E xˆ )T 

(5.54)
它为 n  n 的正定对称阵。显然 P 阵的主对角元素之和正好是(5.53)
式的左边。因此,现在问题可转化为在已知 x , y 的协方差阵 M , R
的情况下确定 K 使得

t r P  min
二、增益阵 K 的确定
现在要把 P 阵表达出来,以确定 K 阵。由上面已知
xˆ  x  K ( y  C x )
对上式两边取均值
E xˆ  E x  K ( E y  CE x )
将上两式相减得:
xˆ  E xˆ  x  E x  K ( y  E y )  KC ( x  E x )
 ( I  KC )( x  E x )  K ( y  E y ) (5.55)

41
再将(5.55)式代入(5.54)式,得
P  E ( xˆ  E xˆ )( xˆ  E xˆ )T 
 
 E ( I  KC )( x  E x )  K ( y  E y ) ( I  KC )( x  E x )  K ( y  E y ) 
T

 
 E  ( I  KC )( x  E x )  K ( y  E y ) ( x  E x )T ( I  KC )T  ( y  E y )T K T 

P  ( I  KC ) M ( I  KC )T  KRK T ( 5.56 )
因为 X 与 y 相互独立,所以其中两项为零。
下面求使估计误差的方差极小的 K 。为了避免用微分法求极小值,
可将式(5.56)进行变换。然后把与 K 有关的项集中到一起得:
P  M  KCM  MC T K T  KCMC T K T  KPK T
 M  K ( CMC T  R )K T  KCM  MC T K T ( 5.57 )
因为 M , R 均为对称方阵,故上式中 CMC T  R 亦为对称阵。

SS T  CMC T  R ( 5.58 )
则(5.57)式为
P  M  KSS T K T  KCM  MC T K T
试凑
 M  ( KS  L )( KS  L )T   ( 5.59 )

( KS  L )( KS  L )T  ( KS  L )( S T K T  LT )
其中
 KSS T K T  KSLT  LS T K T  LLT
设 SLT  CM 则 LS T  MC T ( 5.60 )
则(5.59)式变成
P  M  ( KS  L )( KS  L )T  LLT ( 5.61 )
由(5.58)、(5.60)两式可求得 LLT 。即在(5.60)式两边左乘
S T ,则得

S T SLT  S T CM LT  ( S T S )1 S T CM
又 L  MC T S ( S T S )1

42
以上两式相乘,得
LLT  MC T S ( S T S )1 ( S T S )1 S T CM ( 5.62 )

W   S ( S T S ) 1 ( S T S )  1 S T
S T W S  S T S ( S T S ) 1 ( S T S ) 1 S T S  I
SS T W SS T  SS T
所以
W   ( SS T )1  ( CMC T  R )1
即得 LLT  MC T ( CMC T  R )1 CM
因而(5.61)式可以写成
P  M  ( KS  L )( KS  L )T  MC T ( CMC T  R )1 CM ( 5.63 )
从上式可以看出,只有第二项中有 K ,且第二项也是对称方阵,其
对角元素为非负数。可见若选 KS  L  0 ,则有 trp  min ,这样就可
以确定 K 。
KS  L
KSS T  LS T  MC T
K  MC T ( SS T )  1  MC T ( CMC T  R )  1 ( 5.64 )
由式(5.63)得出 X̂ 的估计误差最小方差表达式
P  M  MC T ( CMC T  R )1 CM ( 5.65 )

P  M  KCM ( 5.66 )
由矩阵反演公式
P  ( M 1  C T R 1C )  1 (5.67 )
K  ( M  1  C T R  1 C ) 1 C T R  1 (5.68)
于是,我们就得到了 K ,并且知道了新估计 x̂ 的协方差阵。对上面表
达式 P , K 加以分析,可以得到一些有趣的结论:
(1)对于 P 阵的解释

43
T T 1
P  M
MC
 ( CMC
 
R ) CM

因为
LLT

后一项 LLT 是对称阵,其主对角元素为非负值,所以 P 的主对角元


素总是小于等于 M 之相应主对角元素。而 P 是 x̂ 的误差方差阵,其
P 主对角元素是 x̂ 的各分量的误差方差; M 是 x 的误差方差阵,其

对角元素是 x 各分量的误差方差。这就是说利用量测结果将 x 修正后
得到的估计 x̂ 比 x 更可靠,这是合乎需要的。
(2)增益阵 K 的直观解释
a) 当 R 一定时,若 M 很大(指主对角元素很大)由式(5.68)
可以看出 K 也很大,意即,若量测前的估计很不可靠,则应根据量
测结果多修改些。
b) 当 M 一定时, R 增大,则由式(5.64)式可以看出 K 减小
(对于 m  1, R 是标量的情况更明显)。意即:若量测结果本身并不
可靠,则不宜多修改原来的估计。
可见增益阵 K 是权衡了 x 的原估计 x 与量测结果 y 两者可靠性,决
定该作多大程度的修改。
三、状态转移后对下一时刻的估计
现在来分析怎样由 x̂ k 经状态转移得到下一时刻的估计 x k  1 。为
此有必要将离散模型重申如下:
1.离散模型
 x ( k  1)  A x ( k )  B u( k )  F w ( k )

 y( k  1)  C x ( k  1)  v ( k  1) (5.69)
其中 A, B, C , F 均为已知。 u k 是确定性量,是可以量测出来的, w k 、
v k 是随机干扰,假定为零均值的白噪声。
T
E ( w i w j )   ij Q , E( wk )  0
T
E ( v i v j )   ij R E( vk )  0

44
其中
1 i j
 ij  
0 i j

同时假定 x k 、 w k 、 v k 也是两两不相关的。
2.状态转移后对下一时刻的估计
若在状态转移之前, x k 之估计为 x̂ k ,协方差阵为 Pk ,经状态

转移得到状态预报值 x k  1 应由下式决定

x k  1  A xˆ k  B u k  F w k (5.70)
对(5.70)式两边取均值,由于 E w k  0 ,所以得
E x k 1  AE xˆ k  B u k ( 5.71)

现在来求 x k  1 的误差方差阵。对(5.70)式减去(5.71)式,得
x k 1  E x k 1  A( xˆ k  E xˆ k )  F w k

M k 1  E ( x k 1  E x k 1 )( x k 1  E x k 1 )T 

 E [ A( xˆ k  E xˆ k )  F w k ][ A( xˆ k  E xˆ k )  F w k ]T 
 T
 E A( xˆ k  E xˆ k )( xˆ k  E xˆ k )T AT  F w k w k F T 
 APk AT  FQF T (5.72)
ˆ k 与w k 不相关,所以相应有两项为零。
上式,因为 x

四、Kalman 滤波器的递推算法
1.递推算法
现将 Kalman 滤波器的各步算法,按其计算顺序再一次地总结如下:
(1)预先必须确切已知,参数矩阵 A , B , C和F ,输入、输出噪声
的方差分别为 Q , R 。
(2)下列初始条件必须已知,或者必须适当地假设:
初始状态 x̂ ( 0)
协方差阵 P ( 0 )
(3)计算下一步的新估计预测(即状态转移)

45
x ( k 1)  A xˆ ( k )  B u( k )  F w ( k ) (5.73)
因为 w (k ) 是未知的,这里用 w( k ) 的均值 w ( k ) 来代替。
(4)计算 X ( k  1 ) 误差协方差阵
M k 1  APk AT  FQF T ( 5.74 )
(5)计算改进新估计值的修正矩阵(即增益阵)。
K k 1  M k 1C T ( CM k 1C T  R )1 ( 5.75 )
ˆ k 1
(6)计算 k  1 时刻的精确估计 x

xˆ k  1  x k  1  K k  1 ( y k  1  C x k  1 ) ( 5.76)

ˆ k  1 的误差协方差阵
(7)计算估计值, x
Pk  1  M k  1  K k 1CM k  1 ( 5.77 )
(8)将 K 增 1,并重得按(3)往下进行
2.Kalman 滤波器框图(见图 5.10)
3.几点说明
(1)Kalman 滤波方法的一个明显优点是,它是一种递推算法,
当获得一次新的量测 y k  1 后,只需要利用上一次推算得到的前一状

态的估计值 x̂ k 和滤波误差方差阵 Pk ,就可以算出新一步状态估计

ˆ k  1 和滤波误差阵 Pk  1 。这样,不论量测次数如何增加,需要存
值x
贮的历史的量测数据和计算结果并不相应增加。
(2)初始值的确定
开始时需要假定初始状态。由于初始状态是未知的,所以一般设:
xˆ ( 0)  x ( 0)
另外必须适当地假设
P (0)  E ( xˆ (0)  E xˆ (0))( xˆ (0)  E xˆ (0))T 
若 x̂ (0) , P ( 0 ) 选择适当,用 K 可以消除影响,并不需要准确地知道
x̂(0) 和 P ( 0 ) 。
(3)增益阵 K 的离线计算。

46
增益阵 K 与测量无关,因此,在测量开始之前就能对它进行计算,
并加以存贮,增益阵 K 的离线计算通过下述三个公式交替进行。
M k  1  APk AT  FQF T
K k  1  M k 1C T ( CM k  1C T  R )1
Pk  1  M k 1  M k  1C T ( CM k 1C T  R )1 CM k 1

当k   时, M k  1 , K k  1 , Pk  1 均趋于它们各自的常数。

47
例 5.4 已知随机系统
  0 1 0   0
 x ( k  1)   0 0 1  x ( k )   0 w ( k )
    

 0.1766  0.9580 1.7063 1 
 y( k )   0 0 1 x ( k )  v ( k )
w( k ), v( k ) 为零均值白噪声, w ( k ), v ( k ), x ( k ) 两两不相关。
0.5 0 
  , Q  1,
现假定 P ( 0 )   0.5

R  4,
 0 0.5
表 5.1 给出了 k  0 ,1, ,10 时的协方差矩阵,可以看出,当 k  6 后
其元素变化很小。因此大约在 k  6 时,Kalman 滤波器就处于稳定状
态。
Kalman 滤波器内容很丰富,这里只介绍了离散定常系统的 Kalman
滤波器。
表 5.1

 0 .5 0 0 0.4669 0.059  0.2765


P ( 0 )   0 0 .5 0  , P ( 1 )  0.059 0.395 0.4924 
   
 0 0 0.5   0.2765 0.4924 1.6913 

0.3688 0.3611 0.2221 0.9224 0.8166 0.4572


P ( 2 )   0.3611 1.0335 1.1124  , P ( 3 )  0.8166 1.3306 1.2177 
   
 0.2221 1.1124 2.1187 0.4572 1.2177 2.1183

48
1.2243 0.9337 0.4492 1.2547 0.9229 0.4282
P ( 4 )  0.9337 1.3603 1.1991 , P ( 6 )  0.9229 1.3511 1.1949 
   
 0.4492 1.1991 2.1033 0.4284 1.1949 2.1072

1.2546 0.9242 0.4292 1.2549 0.9242 0.4294


P ( 8 )  0.9242 1.3523 1.1954  , P ( 10 )  0.9242 1.3523 1.1954 
   
0.4292 1.1954 2.1075 0.4294 1.1954 2.1073

49
过程
wk v k 1
F
+ + x k 1 C
+
+
uk + + y k 1
xk
A Z 1

C - k k 1

F x k 1 +
+ + +
+ + ˆ k 1
x
x̂ k
A Z 1
Kalman
滤波器

图 5.10

50
第六章 李雅普诺夫稳定性(模块十四)

我们已经学过判别系统稳定性的几种方法:劳斯-胡尔维兹判据、

奈魁斯特判据等,这些方法主要适用于线性定常系统。本章将介绍适

用于一般非线性系统(当然也包括线性定常系统)的 李雅普诺夫稳

定性判据。

§1 基本概念

1.1 系统的分类

系统 定常 非定常
线性 x  Ax x  A(t ) x
非线性 x  f ( x ) x  f ( x, t )

按是否满足迭加原理分为:线性、非线性 ;按是否显含时间变

量分为:定常(时不变)、非定常(时变)。线性定常系统最简单,

非线性时变系统最复杂。

1.2 标量函数的定号性

称标量函数 V ( x ) 是正 定 的(半 正 定 的):若 V (0)  0 ,且当

x  0 时, V ( x )  0 ( V ( x )  0 )。称标量函数 V ( x ) 是负定 的(半负

定的):若  V ( x ) 是正定的(半正定的)。

例如,在二维空间中: x12  x22 是正定的; ( x1  x2 ) 2 是半正定

的;  ( x14  x22 ) 是负定的;  x12 是半负定的; ( x12  x22 ) 1 根本不满

足定号性条件。

 请特别注意正定(负定)与半正定(半负定)的区别,更要注意
V (0)  0 是定号性的必要条件。

 定 号 性 可 以 是 原 点 邻 域 上 的 局 部 性 质 , 如 :

[( x12  x22 )  1]( x12  x22 ) 在域 { x12  x22  1} 上是负定的。

 二次型函数 x T Ax 的定号性同矩阵 A(实对称)的定号性。

第六章 李雅普诺夫稳定性 1
 在不引起混淆时,可直接用 V ( x )  0 表示正定,其余类推。

1.3 运动和平衡状态

考虑不受外部作用的系统 x  f ( x , t ) ,其状态轨线,即方程的

解 x (t )   (t ; x 0 , t 0 ) 称作系统的运动。

满足 x  0 的状态 x e ,也就是 f ( x e , t )  0 的解(零解),称作系

统的平衡状态 ,是一种“静止”的运动。平衡点可能不止一个,甚

至无穷多个。若某一平衡点附近足够小的邻域内没有别的平衡点,则

称它为孤立平衡点 。经过适当的坐标变换,任一平衡点总可以变换

到状态空间的原点。

1.4 平衡状态的稳定性

李雅普诺夫意义下平衡状态稳定性的几个基本概念如下。

称平衡状态 xe 是稳 定 的:若任给   0 ,存在  ( )  0 ,使得由

x 0  x e   ( ) 内出发的运动,恒有 x  xe   。

称平衡状态 xe 是渐近稳定 的:若 xe 是稳定的,且存在一个邻域,

其内出发的运动始终在域内,且 tlim x  xe  0 。该邻域称为吸引域。




称平衡状态 xe 是大范围渐近稳定 的:若 xe 是渐近稳定 的,且

吸引域充满整个状态空间。

称平衡状态 xe 是不稳定的:若 xe 不满足上述稳定的条件。

 讨论的是平衡状态(而不是系统)的稳定性;

 平衡状态唯一是大范围渐近稳定的必要条件;

 对线性系统,渐近稳定必定大范围渐近稳定。

§2 李雅普诺夫方法

2.1 第一方法(间接法)

非线性定常系统 x  f ( x ) 在平衡状态 x e 附近的线性化模型是:

第六章 李雅普诺夫稳定性 2
f
y  Ay ,其中, y  x  x e , A 
 x T x  xe

由线性化模型判定原系统平衡状态稳定性的第一方法如下:

若 A 的特征值均具有负实部,则 xe 是渐近稳定的;若 A 的特征

值至少有一个具有正实部,则 xe 是不稳定的;其它情况下(即 A 的

特征值均没有正实部,但至少有一个具有零实部),则不能判定 xe

的稳定性。

[ 例 2-1] 非线性系统用下列微分方程组描述,其中系数  ,  , 

均大于零,且    ,要求判断平衡状态的稳定性。

 x1  x2

 x 2   sin x1   x2  
解:该系统的平衡状态有无穷多个,这里仅讨论其中的一个:

 
arcsin
xe   
 0 
 
原系统在平衡状态 x e 附近的线性化模型是:
y  Ay

其中
y  x  xe

f  0 1 
A T =   
 x x  x e   cos(arcsin )  
  

det( I  A)  2      cos(arcsin )  0

显然,当    时,线性化模型的两个特征值均具有负的实部,

因而,原系统的平衡状态 xe 是渐近稳定的。而当    时,线性化模

型的特征值有一个为负,而另一个为零,因而,不能据此判断原系

统平衡状态 xe 的稳定性。

2.2 第二方法(直接法)

第六章 李雅普诺夫稳定性 3
李雅普诺夫提出的第二方法不需要线性化的步骤,而是通过所

谓的“能量”函数,直接判断系统平衡状态的稳定性。

设原点是定常系统
x  f ( x ) (2-1)

的平衡状态, V ( x ) 是正定的标量函数(“能量”函数),它沿系统

解曲线(状态轨线)对时间 t 的导数为

 x1 
  V  V      V ( x ) f ( x )
V ( x )     (2-2)
  x1  xn    x T
 x n 

根据V ( x ) 的定号性,李雅普诺夫给出了原点稳定性的判别定理。

[ 定 理 2-1] V ( x ) 正定, V ( x ) 负定,则原点是渐近稳定的;此外,

若 x   时,V ( x )   ,则原点是大范围渐近稳定的。

[ 定 理 2-2] V ( x ) 正定, V ( x ) 半负定,则原点是稳定的;此外,若

V ( x ) 除原点外沿状态轨线不恒为零,则原点是渐近稳定的;再进一

步,若 x   时,V ( x )   ,则原点是大范围渐近稳定的。

[定理 2-3] V ( x ) 正定,V ( x ) 也正定,则原点是不稳定的。

 以上均为充分条件,找不到满足定理条件的V ( x ) ,不能下结论;

 若 V ( x ) 正定,且 V ( x ) 负定或半负定,这样的 V ( x ) 被称为系统的

李雅普诺夫函数;

 若 V ( x ) 代表广义能量,则 V ( x ) 代表广义功率。 V  0 ,说明在解

曲线上是消耗功率的过程。

[例 2-2] 考察如下非线性系统原点的稳定性。

 x1  4 x2  x13

 x 2  3 x1  x2
3

解:(原点是唯一平衡点,但由第一方法不能判定它的稳定性)

设 V ( x )  ax12  bx22  0 , a, b  0

第六章 李雅普诺夫稳定性 4
则 V ( x )  2ax1 (4 x2  x13 )  2bx2 (3x1  x23 )

 8ax1 x2  6bx1 x2  2ax14  2bx24

令  8ax1 x2  6bx1 x2  0  4a  3b

取 V ( x )  3x12  4 x22  0 ,得 V ( x )  6 x14  8 x24  0

当 x   时,V ( x )   ,所以原点大范围渐近稳定。

[例 2-3]考察如下线性系统的稳定性

0 1
x   x
 1  1
解:(原点是唯一平衡点,特征值均具有负实部)

(1)取V ( x )  2 x12  x22  0 ,得V ( x )  2 x1 x 2  2 x22 ,不定,不能判。

(2)取V ( x )  x12  x 22  0 ,得V ( x )  2 x 22 ,半负定,故原点稳定。

若 V ( x )  0 , 则 x2  x 2  0 , 代 入 原 方 程 得 x1  x1  0 , 因 而

V ( x )  0 仅发生在原点处,且当 x   时, V ( x )   ,所以

原点大范围渐近稳定。

( 3 ) 取 V ( x )  1.5 x12  x22  x1 x2  0 , 得 V ( x )   x12  x 22  0 , 且 当

x   时,V ( x )   ,所以原点大范围渐近稳定。

[例 2-4] 考察如下非线性系统在原点处的稳定性。

 x1  x2

 x 2    (1  x2 ) x2  x1 (   0)
2

解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)

选 V ( x )  x12  x22  0 ,

则 V ( x )  2 x1 x1  2 x2 x 2  2  (1  x2 ) 2 x22  0 。

设V ( x )  0 ,有两种可能: x2  0 而 x1 任意; x2  1 而 x1 任意。

先看第一种情况。 x2  0 意味着 x 2  0 ,代入系统的状态方程得

到: x1  0 和 x1  0 。因而,只有原点满足 x2  0 。

再看第二种情况。x2  1 意味着 x 2  0 ,代入系统的状态方程得


第六章 李雅普诺夫稳定性 5
到: x1  0 和 x1  1。结果矛盾,所以这种情况不会发生。

综上所述,在系统的状态轨线上, V ( x )  0 ;除原点外, V ( x )

不恒为零;且当 x   时,V ( x )   ;所以原点大范围渐近稳定。

[例 2-5] 考察如下非线性系统在原点处的稳定性。

 1
 
x 1   x1  x 2
2
 1
 x 2  ( x12  x 22 ) x1  x2
 2
解:(原点是平衡点但不唯一,由第一方法可判定它是渐近稳定

的)

选V ( x )  x12  2 x1 x 2  3 x 22  ( x1  x 2 ) 2  2 x 22  0 ,

则V ( x )  2( x1  x 2 )( x1  x 2 )  4 x 2 x 2

 ( x12  x22 ) 2 x1 ( x1  3x2 )  1

显然, V ( x ) 在 2 x1 ( x1  3 x 2 )  1范围(兰虚线)内负定,且原点

为该范围的内点,所以原点是渐稳的。

图 2-1

下面介绍确定吸引域的一种方法。在 V  0 的边界上求V 的最小

值Vmin ,则V ( x )  Vmin 就是一个保守的吸引域(可能比实际的小)。


1 1
由V ( x )  0 ,即 2 x1 ( x1  3 x 2 )  1 , 得 x2  (  x1 )
3 2 x1
第六章 李雅普诺夫稳定性 6
2 2 1
V ( x) V ( x )  0  x12  2 x1 x2  3x22  x1 
3 12 x12

dV 4 1 1 2
 x1  3  0  x12   Vmin 
dx1 3 6 x1 2 2 3

2
得到一个保守的吸引域: x12  2 x1 x2  3 x22  ,如红色点划线
3
所示,黑色实线所示是仿真所得的实际(最大)吸引域。

请思考:该例题中, V ( x ) 在 2 x1 ( x1  3 x 2 )  1范围(兰虚线)内

是负定的,为什么这一范围内不都是原点的吸引域呢?

§3 构造李雅普诺夫函数的方法

很遗憾,对于非线性系统,没有一种构造李雅普诺夫函数的完

全有效的通用方法。人们通常凭经验和技巧来选取李氏函数,最常见

的是二次型函数。此外,也涌现出了许多适用于特定情形的辅助方法。

这里介绍其中比较有影响的两种:克拉索夫斯基方法和变量梯度法。

3.1 克拉索夫斯基方法(KrasovsKii)

思路:不用 x 而用 x 构造李雅普诺夫函数。

非线性定常系统 x  f ( x ) 的雅可比(Jacobi)矩阵定义为:

  f1  f1 
 x 
 xn 
  f(x )  1 
F ( x)       (3-1)
 xT
 fn 
 fn 
  x1  xn 

[定理 3-1](KrasovsKii)非线性系统 x  f ( x ) ,原点是它的平衡状

态。若矩阵 F T ( x )  F ( x ) 负定,则原点是渐近稳定的。进一步,当

x   时,有 f ( x )   ,则原点是大范围渐近稳定的。

证明:
2
取 V ( x)  f ( x)  f T ( x) f ( x) (3-2)

则 V ( x )  f T ( x ) f ( x )  f T ( x ) f ( x )

第六章 李雅普诺夫稳定性 7
 f T ( x )[ F T ( x )  F ( x )] f ( x )
根据李雅普诺夫稳定性定理,[定理 3-1]成立。证毕。

 KrasovsKii 方法仍然是充分条件,条件不满足不能下结论;

 也可取V ( x )  f T ( x ) P f ( x ) , P  0 ;称为 Jacobi 方法。

[例 3-1] 用 KrasovsKii 方法判定下述系统平衡状态的稳定性。

 x1  5 x1  x2

 x 2  x1  x2  x2
3

解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)

 5 1 
F ( x)   2  是对称矩阵,
 1  1  3 x2 
 1  5  0 ,  2  det F  15 x22  4  0 ,故 F 负定。
2
且当 x   时, f  (5 x1  x2 ) 2  ( x1  x2  x23 ) 2  

所以原点是大范围渐近稳定的。

[例 3-2] 用 KrasovsKii 方法判定下述系统平衡状态的稳定性。

 x1  5 x1  x22

 x 2  x1  x2  x2
3

解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)

 5 2 x2  T   10 2 x2  1 
F ( x)   2 , F ( x )  F ( x )  2 x  1  2  6 x 2 
 1  1  3 x2   2 2

1  10  0 ,  2  20(1  3x22 )  (2 x2  1) 2  56 x22  4 x2  19  0 ,

故 F T ( x )  F ( x ) 负定。
2
且当 x   时, f  (5 x1  x22 ) 2  ( x1  x2  x23 ) 2  

所以原点是大范围渐近稳定的。

3.2 变量梯度法(Schultz,Gibson)

思路:先找V ( x )  0 ,而后计算V ( x ) 。

(1)由V ( x ) 的梯度向量确定V ( x ) 。

第六章 李雅普诺夫稳定性 8
 x1 
dV  V V V    
V ( x )       gradV  x
T

dt   x1   
 x2  xn 
 x n 

  V V V  
 gradV  T
    1  2   n 
  x1  x2  xn 
gradV 称为标量函数 V 的梯度,它是一个向量函数。

(2)求李雅普诺夫函数V ( x )
n
V ( x )   0 V ( x ) d t   0  gradV  d x   0   i d xi
t x T x

i 1

这是一个沿解曲线的曲线积分,当被积函数是梯度时,结果与

积分路径无关。

(3)构成梯度的条件:梯度向量的雅可比矩阵必是对称阵,

  1  1 
 x 
 xn 
  1   i  j
 grad V        , i j
 xT x j  xi
  n 
 n 
 x  xn 
 1
共有 n(n  1) / 2 个方程。

(4)选择一条简单的积分路径

上述条件满足时,选择按坐标的逐渐积分是最方便的。
x x x
V ( x )   0 1 1 d x1   0 2  2 d x2     0 n  n d xn

注意,  0 1 1 d x1 时, x2  x3    xn  0
x

 2 d x2 时, x1  x1 , x3  x4   xn  0 ,余类推。
x2
0

变量梯度法的步骤:

(1)设梯度向量

第六章 李雅普诺夫稳定性 9
 1   a11 x1  a12 x2    a1n xn 
gradV ( x )         
   
 n  an1 x1  an 2 x2    ann xn 

其中:待定的 aij 可以是常数,也可以是 x 的函数;

(2)计算导函数:V ( x )   gradV  T x  1 f1 ( x )     n f n ( x ) ;

 i  j
(3)由  , i  j ,以及 V ( x )  0 确定待定的 aij ;
x j  xi
x x
(4)按坐标积分求V ( x ) :V ( x )   0 1 1 d x1     0 n  n d xn ;

(5)根据所得的 V ( x ) 和 V ( x ) 判定原点的稳定性,若得不出结论不

说明任何问题。

[例 3-3] 用变量梯度法判定下述系统平衡状态的稳定性。

 x1   x1  2 x12 x2

 x 2   x2
解:(原点是唯一平衡点,由第一方法可判定它是渐近稳定的)

 1   a11 x1  a12 x2 
(1)设梯度向量: gradV ( x )      
 2  a21 x1  a22 x2 

(2)计算导函数:V ( x )   gradV  x
T

V (x )  (a11 x1  a12 x2 )( x1  2 x12 x2 )  (a 21 x1  a22 x2 )( x2 )

  a11 x12 (1  2 x1 x2 )  a22 x22  (a12  a21 ) x1 x2  2a12 x12 x22


 1   2
(3)由  ,并假定 aij 均为常数,可得: a12  a21
 x2  x1

为使 V ( x )  0 ,取 a12  a21  0 , a11  a22  1 ,得到:

V ( x )   x12 (1  2 x1 x2 )  x22  0 ,若 1  2 x1 x2  0

(注意,原点是范围1  2 x1 x2  0 的内点)。
 1   2
校验: 1  x1 ,  2  x2 ;  满足梯度条件
 x2  x1

(4)按坐标积分求V ( x )

第六章 李雅普诺夫稳定性 10
x x 1
V ( x )   0 1 x1 d x1   0 2 x2 d x2  ( x12  x22 )  0
2
(5)综上, V ( x )  0 ,且在原点的一个邻域内有 V ( x )  0 ;所以原

点是渐近稳定的。

[例 3-4] 用变量梯度法判定下述系统平衡状态的稳定性。

 x1  x2

 x 2   x2  x1
3

解:(原点是唯一平衡点,但由第一方法不能判定它的稳定性)

 1   a11 x1  a12 x2 
(1)设梯度向量: grad V      
 2  a21 x1  a 22 x2 

(2)计算导函数:V ( x )   gradV  T x

V ( x )  (a11 x1  a12 x2 ) x2  (a21 x1  a22 x2 )( x2  x13 )

 x1 x2 (a11  a21  a22 x12 )  x22  a12  a 22   a 21 x14


 1   2
(3)由  ,并假定 aij 均为常数,可得: a12  a 21
 x2  x1

为使 V ( x )  0 ,取 a12  a21  0 , a22  1 , a11  x12 ,得到:

V ( x )   x22  0
(由于 a11 不是常数,违反了原假定,必须进行下面的校验)

 1   2
校验: 1  x13 ,  2  x2 ;  满足梯度条件
 x2  x1

(4)按坐标积分求V ( x )
1 4 1 2
V  x    0 1 x13 d x1   0 2 x2 d x2 
x x
x1  x2  0
4 2
(5)综上, V ( x )  0 , V ( x )  0 ;在解曲线上除原点外, V ( x ) 不恒

为零;且当 x   时,V ( x )   ;所以原点大范围渐近稳定。

§4 线性定常系统的稳定性

4.1 线性定常系统的渐近稳定性

第六章 李雅普诺夫稳定性 11
对线性定常系统

x  Ax (4-1)

而言,系统的稳定性和原点的稳定性是一致的,以下不再区分。

[定理 4-1] 系统(4-1)渐近稳定的充分必要条件是:对任意给定的

某个正定矩阵 Q,存在正定矩阵 P 满足李雅普诺夫方程:

AT P  PA  Q (4-2)(1)充

分性证明(有正定解 P  渐稳):

选 V ( x )  x T Px ( P  0 ),

则 V ( x )  x T Px  x T Px  x T ( AT P  PA) x   x T Qx

若 Q  0 ,根据李雅普诺夫稳定性定理,系统是渐近稳定的。换

言之,若任给 Q  0 ,存在 P  0 ,满足李雅普诺夫方程(4-2),则

系统是渐近稳定的。证毕。

(2) 必要性证明(渐稳  有正定解 P ):

考察矩阵微分方程: E (t )  AT E (t )  E (t ) A

不难验证, E (t )  e A t Q e A t 是它的解矩阵,且有: E (0)  Q 以及


T

E ()  0 (由于 A 渐稳)。将方程两边对时间积分得到:


 
AT  0 E d t   0 E d t A  E ()  E (0)  Q (4-3)
  T
令: P   0 E (t ) d t   0 e A t Q e A t d t (4-4)

则(4-3)式就是李亚普诺夫方程(4-2)。由于 A 是渐稳的,上

式定义的 P 是存在的。显然,P 是对称的,考察下面的二次型:


 T 
x0T Px 0   0 x 0T e A t Q e A t x0 d t   0 x T (t )Qx (t ) d t

若 x0  0 ,则 x  0 ,由于 Q  0 ,因而上式中被积函数总是正的,

所以 P 是正定的。综上,若 A 渐稳,则对任给的 Q  0 ,存在 P  0 ,

见式(4-4),满足李雅普诺夫方程(4-2)。证毕。

 上述证明过程给出了线性定常系统的李雅普诺夫函数以及它的导

第六章 李雅普诺夫稳定性 12
函数:V ( x )  x T Px ,V ( x )   x T Qx ;

 [定理 4-1]也可取 Q  0 ,只要V ( x )   x T Qx 沿解曲线不恒为零;

 若李雅普诺夫方程的解矩阵 P 是负定的,则系统是不稳定的;

 Q 可以任取,通常取 Q  I ,解 AT P  PA   I 求 P ;若 P 正定,

系统渐稳,否则,不渐稳;(充分必要条件)

 也可以先任取正定矩阵 P ,求 AT P  PA  Q ;若 Q 正定(负

定),则系统渐稳(不稳),否则,不说明任何问题。

[定理 4-2] 任给正定矩阵 Q,李雅普诺夫方程(4-2)的解唯一确定

的充分必要条件是: i ( A)   j ( A)  0, i, j  1, 2, , n ,即矩阵 A 没

有互为相反数的特征根。当条件满足时,P 唯一且为对称阵。

提示:(1)前面已学过:方程 AE  EM  N 有唯一解矩阵 E 的充

要条件是:矩阵 A 和 M 彼此间没有相同特征值。

(2)若 P 是 AT P  PA  Q 的解,则 P T 也是解。

[例 4-1] 判定下述线性定常系统的渐近稳定性。

0 1
x   x
 1  1
a c 
解:取 Q  I ,令 P    ,代入李雅普诺夫方程得:
c b
0  1 a c  a c   0 1   1 0 
1  1  c b  c b  1  1   0  1

       
比较矩阵元素得:

 2c  1 a  1.5
  1.5 0.5
a  b  c  0  b  1  P 0
 2b  2c  1 c  0.5  0 . 5 1 
 
所以该系统是渐近稳定的。(思考:和其它判稳方法比较)

[ 定 理 4-3] 矩阵 A 所有特征值的实部均小于   (  0) 的充分必要

条件是:对任意给定的某个正定矩阵 Q,存在正定矩阵 P 满足:

第六章 李雅普诺夫稳定性 13
AT P  PA  2P  Q (4-5)

[例 4-2] 设系统状态方程如下,求控制律 u   Fx 使闭环系统极点的

实部均小于   3 。

0 1   1 1
x    x   2 1 u
 2 2  

a b   ac 1 b  d 
解:设 F    ,则 A  BF  2  2a  c 2  2b  d 
c d   

代入方程 ( A  BF ) T  ( A  BF )  2I   I ,得:

 ac 2  2a  c    a  c 1  b  d   7 0 
1  b  d  
 2  2b  d  2  2a  c 2  2b  d   0  7

取 a  1 ,可解得 b  3, c  4.5, d  0.5

1  3    3.5 4.5 


则: F    ,闭环系统: 
x   4.5  3.5 x
4.5  0.5  

其特征值为共轭复数,实部为  3.5  3 ,满足要求。

(思考:和极点配置方法比较)

4.2 线性定常系统稳定性小结

在前面的稳定性讨论中,我们并没有涉及系统的输入和输出。这

种仅考虑系统的初态和状态之间关系的稳定性问题称为内部稳定性

问题,而仅考虑系统的输入和输出之间关系的稳定性问题称为外部

稳定性 问题。如果一个系统对于有界的输入必然产生有界的输出,

则称该系统是有界输入-有界输出稳定,简称 BIBO 稳定。

对线性定常系统而言,系统的内部稳定性取决于系数矩阵 A 的

特征值,而外部稳定性取决于输入输出传递函数的不可约极点。我们

知道,在由系统的状态方程和输出方程求传递函数的过程中可能发

生零极对消,如果消去的极点是不稳定的,尽管它没有体现在外部,

但将造成内部状态的不断增长,最终引起系统的瘫痪。下面给出线性

定常系统稳定性的有关重要结论:
第六章 李雅普诺夫稳定性 14
 系统渐近稳定的充分必要条件是:系数矩阵 A 的特征值全部在

复平面的左半开平面内;

 系统稳定的充分必要条件是:系数矩阵 A 的特征值全部在复平

面的左半闭平面内,且虚轴上特征值对应的约当块为 1 阶;

 系统 BIBO 稳定的充分必要条件是:输入输出传递函数的不可

约极点全部在复平面的左半开平面内;

 系统渐近稳定则一定 BIBO 稳定;系统 BIBO 稳定不一定渐近稳

定;对于最小实现的系统,BIBO 稳定和渐近稳定等价。

§5 离散系统的稳定性

李雅普诺夫第二方法可以很方便地推广到离散系统。

5.1 非线性定常离散系统

对于离散时间系统
x ( k  1)  f [ x ( k )] (5-1)

设V [ x (k )] 为标量函数,它沿系统状态轨迹的增量为
V [ x ( k )]  V [ x (k  1)]  V [ x ( k )] (5-2)

适用于连续时间系统的李雅普诺夫各种稳定性判据,只要相应

地将 V ( x ) 修改为 V [ x (k )] ,将 V ( x ) 修改为 V [ x ( k )] ,即可适用于离

散时间系统。例如,假定原点是系统(5-1)的平衡点,有:

[定理 5-1] V [ x (k )]  0 , V [ x ( k )]  0 ,则原点是渐近稳定的;此外,

若 x (k )   时,V [ x (k )]   ,则原点是大范围渐近稳定的。

5.2 线性定常离散系统

对线性定常离散系统
x (k  1)  Gx ( k ) (5-3)

有类似于连续情形的定理:

[定理 5-2] 系统(5-3)渐近稳定的充分必要条件是:对任意给定的

正定矩阵 Q,存在正定矩阵 P 满足下述李雅普诺夫方程:


第六章 李雅普诺夫稳定性 15
G T PG  P  Q (5-4)

下面仅对充分性证明作一提示:

取 V ( x k )  x kT P x k

则 V ( x k )  x kT 1 P x k 1  x kT P x k  (G x k ) T P (G x k )  x kT P x k

 x kT [G T PG  P ] x k   x kT Q x k
请思考:线性定常连续系统离散化后,渐近稳定性会改变吗?

[定理 5-3] 任给正定矩阵 Q,李雅普诺夫方程(5-4)的解唯一确定

的充分必要条件是: i (G ) j (G )  1, i, j  1, 2, , n ,即矩阵 G 没有

互为倒数的特征根。当条件满足时,P 唯一且为对称阵。

[ 定 理 5-4] 矩阵 G 所有特征值的模均小于  (  0) 的充分必要条件

是:对任意给定的正定矩阵 Q,存在正定矩阵 P 满足:

 2G T PG  P  Q (5-5)

参考书

《自动控制原理》(下册),吴麒主编,清华大学出版社,1992,(第 10 章)

《自动控制理论基础》,戴忠达主编,清华大学出版社,1991,(第 7 章)

《线性系统理论》(第二版),郑大钟,清华大学出版社,2002,(第 5 章)

《线性系统控制理论》,陈树中等,华东师范大学出版社,2000,(第 3 章)

《非线性控制系统导论》,高为炳,科学出版社,1988,(第 3 章)

《控制理论导论》,郭雷主编,科学出版社,2005,(第 2 章)

第六章 李雅普诺夫稳定性 16
第七章 最优控制(模块十五)

最优控制是在 50 年代后期,由于航空航天的制导、导航和控制

技术的需要而逐渐发展起来的,并推广应用于其它一些领域。所谓最

优控制是指:对于给定的受控系统,寻找一种控制律,使 系统由给

定的初态转移到希望的末态,并使得某一性能评价指标为最优。

§1 基本概念

1.1 一个例子

如图 1-1 所示,宇宙飞船在月球表面实现软着陆,要求控制发

动机的推力 f ,使燃料消耗最少。

设飞船总质量为 m ,自身质量及所带燃料分别为 M 和 F ;它的

高度和垂直速度分别为 h 和 v 。月球的重力加速度可视为常数 g ,自

某 t  0 时刻开始飞船进入着陆过程。其运动方程和初始条件为:

h  v, h(0)  h0 ;
 f
v   g , v(0)  v0 ; v
 m
m   k f , m(0)  M  F .

其中 k 是一常数。要求控制飞船从初始状态

出发,于某一时刻 t f 实现软着陆,即
月球
h(t f )  0 , v(t f )  0 。

推力 f (t ) 受发动机最大推力 f max 的限制,即 图 1-1

0  f (t )  f max 。

满足上述限制,使飞船实现软着陆的推力程序 f (t ) 不止一种,其中

消耗燃料最少,或使下述性能指标为最大者才是最佳推力程序,
J  m(t f ) 。

1.2 基本术语

(1)受控系统的状态方程: x (t )  f [ x (t ), u(t ), t ] ,系统可以是定常

的,也可以是时变的;可以是线性的,也可以是非线性的。
第七章 最优控制 1
(2)初始条件和终端条件:通常,初始时刻 t 0 和初始状态 x (t 0 ) 是

固定的,而终端时刻 t f 和终端状态 x (t f ) 可以是固定的,也可

以是自由的,或是受某种约束的。终端条件又称为目标集。

(3)容许控制:在实际问题中,控制量通常会受到客观条件的限制,

只能在一定范围(称为容许控制域)内取值,记作: u  U ,

控制域 U 可以是受限的,也可以是不受限的。

(4)性能指标:需最小(大)化的标量函数(泛函),通常形式为:
t
J  φ [ x (t f ), t f ]   t f L[ x (t ), u(t ), t ] d t
0

其中,第一项称为末值型指标,第二项称为积分型指标。仅有末

值型指标,称麦耶耳(Mayer)问题,仅有积分型指标,称拉格伦日

(Lagrange)问题,二者均有(复合型),称波尔扎(Bolza)问题。

1.3 最优控制的提法和求解

最优控制的一般提法是:给定受控系统的状态方程,求一容许

控制,使系统由给定的初态转移到希望的目标集,并使给定的性能

指标为最小。最优控制的求解方法主要有:

(1)古典变分法(极大值原理的基础)

(2)极大值原理(苏,庞德里亚金,Pontryagin)

(3)动态规划(美,贝尔曼,Bellman)

§2 泛函与变分

2.1 定义与公式

变分法是数学的一个分支,是求泛函极值的一种经典方法,本

节介绍与变分法有关的一些基本概念。

[ 定 义 2-1] (泛函)如果对于函数集合{ y (x) }中的每一个函数 y (x) ,

均有 J 的一个实数值与之对应,则称变量 J 是函数 y (x) 的泛函。通常

记为: J  J [ y ( x)] 。

第七章 最优控制 2
1
如 , J   0 y ( x) d x , 则 y ( x )  x , J  0.5 ; y ( x)  cos x ,

J  sin 1 。

又如,图 2-1 所示,设 y  y (x) 是连接平面上 A、B 两点的一条曲

线。则曲线的弧长 S 是函数 y (x) 的泛函。若 y (x) 连续可微,则 S 可表

1
x2
示为: S [ y ( x)]  
x1
[1  y 2
( x)] 2 dx。

注意,函数的应变量是数,自变 B

量也是数;泛函的应变量是数,而自 A
变量是函数。为区别起见,通常把泛
x1 x2
函的自变量称为“宗量”,并通俗地
图 2-1
将泛函比喻作“函数的函数”。再强

调一

遍,泛函的宗量是函数,泛函的取值依赖于宗量所取函数的整体形

式。

思考:试比较泛函 J  J [ y ( x)] 和复合函数 f  f [ y ( x)] 的异同。

[定义 2-2](线性泛函)满足以下条件的泛函 J 称为线性泛函。

 J [ y1 ( x)  y 2 ( x)]  J [ y1 ( x)]  J [ y 2 ( x)]



 J [ay ( x)]  a J [ y ( x)] a为任意常数
[定义 2-3](函数的变分)函数(宗量) y (x) 的变分  y (x) 是指两个

函数之差:  y ( x)  y1 ( x)  y ( x) 。

注意,函数 y (x) 的变分  y (x) 仍然是 x 的函数。根据定义可得:

d d x x

dx
 y ( x)   [ y ( x)] ,
dx
 0 y ( x) d x   [  0 y ( x) d x] (2-1)

[ 定 义 2-4] (泛函的变分)宗量的变分引起的泛函增量可以表示为:
J  J [ y ( x)   y ( x)]  J [ y ( x)]
 L [ y ( x),  y ( x)]   [ y ( x),  y ( x)] (2-2)

若 L 是关于  y 的线性泛函,而  是关于  y 的高阶无穷小,则把 L 称

第七章 最优控制 3
为泛函的变分,记为:
 J  L [ y ( x),  y ( x)] (2-3)

由定义知,泛函的变分是泛函增量的线性主部。

[ 结 论 2-1] 泛函 J  J [ y ( x)] 的变分可由下式计算:(其中 a 是实变

量)


J  J [ y ( x)  a y ( x)] a 0 (2-4)证明:
a

 J J
J [ y ( x)  a y ( x)] a 0  lim  lim ( a  a  0 )
a a 0 a a 0 a
a 0

L[ y ( x), a y ( x)]  [ y ( x), a y ( x)]


 lim  lim  y ( x)
a 0 a a 0 a y ( x )

 L[ y ( x),  y ( x)]   J 证毕。


x
[结论 2-2] 泛函 J   x F [ y ( x)] d x 的变分可由下式计算:
2

x F
 J   x2  y ( x) d x (2-5)
1 y

证明: 由[结论 2-1]中的式(2-4)得:

 x2
J   F [ y ( x)  a y ( x)] d x a0
 a x1

x   F ( y  a y )  ( y  a y ) 
  x2    dx
1
  ( y  a  y ) a  a 0

x F
  x2  y ( x) d x 证毕。
1 y
x
[结论 2-3] 若 J   x F [ y1 ( x), , y n ( x), x] d x ,则:
2

x  F F 
 J   x2   y1 ( x)     y n ( x)  d x (2-6)
1
  y1  yn 
1
[例 2-1] 求泛函 J   0 y ( x) d x 的变分
2

解:以下三种方法分别根据式(2-3)、(2-4)和(2-5)

第七章 最优控制 4
1 1
(1) J   0 [ y ( x)   y ( x)] d x   0 [ y ( x)] d x
2 2

1 1
 2  0 y ( x) y ( x) d x   0 [ y ( x)]2 d x

1
 J  2 0 y ( x) y ( x) d x

 1 
(2)  J  J [ y ( x)  a y ( x)] a0   0 [ y ( x)  a y ( x)]2 dx
a a a 0

1 1
  0 2[ y ( x)  a y ( x)] y ( x) a0 d x  2  0 y ( x) y ( x) d x
1 F 1
(3)  J   0  y ( x) d x  2  y ( x) y ( x) d x
y 0

可以看出,以上三种方法得到了相同的结果。

2.2 无条件泛函极值

[ 定 义 2-5] (泛函的极值)如果泛函 J [ y ( x)] 对于充分接近 y (x) 的

任 何 曲 线 y (x) , 都 有 J  J [ y ( x)]  J [ y  ( x)]  0 ( 0) , 则 称 泛 函

J [ y ( x)] 在曲线 y  (x) 上达到极小值(极大值)。

[定理 2-1]具有变分的泛函 J [ y ( x)] 在 y  (x) 上取极值的必要条件是:

 J [ y  ( x)]  0 (2-7)

证 明 : 泛 函 J [ y ( x)] 在 y  (x) 上 取 得 极 值 , 即 J [ y  ( x)  a y ( x)] 在


a0
时取得极值,由函数在某点取极值的必要条件可得:

 J [ y  ( x)  a y ( x)]
  J [ y  ( x)]  0 。 证毕。
a a 0

下面举例讨论如何利用上述定理求不动边界的泛函极值问题。
t
设性能指标为: J   t F [ x(t ), x (t ), t ] d t ,
f
(2-8)
0

起始时刻 t 0 和终端时刻 t f 是固定的,初值 x(t 0 ) 和终值 x(t f ) 也都是



固定的,求最优函数 x (t ) 使性能指标 J 为极小。

t t  F F 
 J   t f  F [ x(t ), x (t ), t ] d t   t f   x   x  d t
0 0
  x  
x 
第七章 最优控制 5
t
tf F F f
t d  F 
t  xdt   x   t f  x   d t
0 x  x t0 0 d t   x 

t
F f
t  F d  F 
  x   tf      x d t  0
 x t0 0
  x d t   
x 

由于初值 x(t 0 ) 和终值 x(t f ) 是固定的,  x(t f )   x(t 0 )  0 ,上式

第一项为零,因而第二项也必须为零。由于  x 是任意的,我们得到:

F d  F 
  0 (2-9)
 x d t   x 

这就是著名的欧拉-拉格伦日方程,简称欧拉方程。
2
[例 2-1] 设泛函为 J   1 ( x  x t ) d t , x(1)  1, x(2)  2 ,求 x  (t ) 。
2 2

解:该题符合上面讨论的问题类型,可直接利用欧拉方程求解。

d
F  x  x 2 t 2 的欧拉方程为: (1  2 xt 2 )  0 ,即: t x  2 x  0 ,
dt
c1
其解为: x   c2 ,代入 x(1)  1, x( 2)  2 得: c1  2, c2  3 ,
t

 2
因此,使性能指标 J 取极值的最优函数为 x (t )    3 。
t
除了上面讨论的不动边界的泛函极值问题外,类似地还可以讨

论可动边界的泛函极值问题等;进一步,除了无条件泛函极值问题

外,还可以讨论有条件泛函极值问题。我们不逐一讨论,而直接转向

泛函极值问题的重要应用-最优控制问题。

§3 变分法求解最优控制

3.1 末时刻固定末状态自由问题

(1)问题描述:
x  f ( x, u, t ) , x (t 0 )  x 0 (3-1a)
t
J [u()]  φ [ x (t f ), t f ]   t f L( x, u, t ) d t (3-1b)
0

寻找 u (t ) 及相应的 x  (t ) 使 J [u* ()] 最小。

第七章 最优控制 6
(2)基本假设:

·允许控制 u(t )  R ,无限制, u(t ) 对 t 是连续的;


r

· f ( x , u, t ), L( x , u, t ) 对 x 和 u 连续且有连续的一阶偏导数;

· t 0 固定, x (t 0 )  x 0 固定; t f 固定, x (t f ) 自由。

(3)化为无条件极值问题

·引入 Lagrange 待定乘子  (t )  [ 1 (t ), , n (t )] , 设:


T

t
J 1[ u()]  φ [ x (t f ), t f ]   f {L( x, u, t )  T [ f ( x, u, t )  x ]}d t ,
t 0

则原问题等价于求 J 1 的无条件极小。

·定义 Hamilton 函数 H ( x , u,  , t )   f ( x , u, t )  L( x, u, t ) ,则
T

t
J 1[ u()]  φ [ x (t f ), t f ]   f [ H ( x, u,  , t )  T x ] d t
t 0

分部积分
  t f T x d t
t tf t
   t f T x d t   T x
0 t0 0

 J1[u()]  φ [ x (t f ), t f ]  T (t 0 ) x (t 0 )  T (t f ) x (t f )

  t [ H ( x, u,  , t )  T x ] d t
tf

为取 J 1 的极值,应令其变分为零。注意,在该问题中,当控制量

有变分(变化)  u(t ) 时,将引起状态变分  x (t ) ,从而有末态变分

 x (t f ) ;而 t f , t0 和 x (t 0 ) 是固定的,不变分,待定乘子  (t ) 也不变分。
T
 φ 
 J1  0     (t f )  x (t f )
  x (t f ) 
tf H 
T
 H 
T

   
  (t )  x (t )    u(t )  d t
t0   x    u  

H φ
选择  :  (t)   ,  (t f ) 
x  x (t f )

H
极值条件: 0
u

[结论 3-1]:末时刻固定末状态自由的最优控制问题(3-1),其最

优解应满足的必要条件如下:

第七章 最优控制 7
H 函数: H ( x , u,  , t )  T f ( x , u, t )  L( x, u, t )

H
极值条件: 0
u

 x  f ( x, u, t ) 状态方程

规范方程:   H
    x 协态方程

 x (t 0 )  x 0 初始条件

边界条件:   φ ( x (t f ), t f )
 (t )  末端条件
x (t f )
f

3.2 各种末端情况下的最优控制问题

前面我们已经讨论了末时刻 t f 固定,末状态 x (t f ) 自由情况下的

最优控制问题。事实上,根据末端情况的不同,有 2 大类问题:A. t f

固定,B. t f 可变;在每一类中,又各有 3 种可能的情形:(1)

x (t f ) 自由,(2) x (t f ) 固定,(3) x (t f ) 受约束。每种情形均可以

通过变分法求解,由于它们之间仅仅是末端情况不同,因而(可以

预料)它们所应满足的必要条件中也仅仅是规范方程的末端条件不

同。

[ 结 论 3-2] :各种末端情况下的最优控制问题,其最优解的必要条

件具有相同的哈密顿函数、极值条件、规范方程和初始条件,仅末端

条件不同(参见[结论 3-1])。

下面,我们简明地列出各种情形下,最优解应满足的末端条件:

A. t f 固定

 φ [ x (t f ), t f ]
(1) x (t f ) 自由:  (t f ) 
 x (t f )

(2) x (t f ) 固定: x (t f )  x f

(3) x (t f ) 受约束: g[ x (t f ), t f ]  0

 φ [ x (t f ), t f ]  g T [ x (t f ), t f ]
 (t f )   
 x (t f )  x (t f )
第七章 最优控制 8
其中, g 为 k 维向量函数,  为 k 维待定乘子向量。

B. t f 可变

对应于 A 中情形(1)和(2),增加如下终端条件:

 φ [ x (t f ), t f ]
H [ x (t f ), u(t f ),  (t f ), t f ]  
t f

对应于 A 中情形(3),增加如下终端条件:

 φ [ x (t f ), t f ]  g T [ x (t f ), t f ]
H [ x (t f ), u(t f ),  (t f ), t f ]    
t f t f

 t f 固定, x (t f ) 也固定时,性能指标中的末值型指标为固定值,

失去意义;此时, x (t f )  x f 本身构成规范方程的末端条件。

 t f 固定, x (t f ) 受 g[ x (t f ), t f ]  0 约束时,末值型指标中需要增加

拉格伦日乘子项  g[ x (t f ), t f ] ,因而末端条件多出相应项。
T

 t f 可变时,和固定相比,多了一个待定量 t f ,但由于 t f 本身有变

分 d t f ,可以多导出一个终端条件,用以确定最优的末态时刻 t f 。

3.3 哈密顿函数的性质

 规范方程中,状态方程和协态方程对偶:

H H
x  ,   
 x

 沿最优轨线 H 的全导数 = 偏导数

d H H H H H H
 T x  T u  T   
d t x u  t t

 对于定常系统,H 不显含 t,则沿最优轨线 H 为常数 ;进一 步 ,

若 t f 可变,φ 和 g 中不显含 t f ,则沿最优轨线 H 为零。

3.4 变分法求解最优控制问题举例

解题步骤:分析题意,列写哈密顿函数和必要条件。由极值条件

H  u  0 ,求出 u* (t ) 并代入规范方程。最后需求解两点边值问

题,通常这是一个困难的问题,需利用计算机求数值解。这里给出的

第七章 最优控制 9
例题是足够简单的,但题目类型和解题步骤是有代表性的。

[例 3-1] 已知一阶受控系统 x  u , x(t 0 )  x0 ,求 u (t ) ,使下述性能

指标为最小:(其中,常数 c  0 , t f 是固定时刻)

1 1 t
J  c x 2 (t f )   t u 2 d t ,
f

2 2 0

解:这是 t f 固定, x (t f ) 自由的最优控制问题。

H 函数: H  L   u  (1 2)u 2   u ;

极值条件: H u  u    0 ,解得 u   ;

规范方程: x  u   ,    H  x  0 ;

边界条件: x(t 0 )  x0 ,  (t f )   φ  x(t f )  c x(t f ) 。

解方程得: x(t )  c x(t f )t  c x(t f ) t 0  x0

c x0
u  (t )   (t )   (t f )  c x(t f )  
1  c(t f  t 0 )

已知问题本身有解,而根据必要条件求得的解又是唯一的,所

以该极值控制就是最优控制。

[例 3-2] 求 u (t ) ,使受控系统 x1  x2 , x 2  u 由 x1 (0)  x2 (0)  0 出发,

当 t f  1 时转移到目标集 x1 (1)  x2 (1)  1 ,并使下述性能指标最小:

1 1 2
J  u dt
2 0
解:这是 t f 固定, x (t f ) 受约束的最优控制问题。

末态约束: g ( x (t f ))  x1 (1)  x2 (1)  1  0 ,

H 函数: H  (1 2)u 2  1 x2  2u ;

极值条件: H u  u  2 ,解得 u  2 ;

规范方程: x1  x 2 , x 2   2 , 1  0 , 2  1 ;

边界条件: x1 (0)  0 , x2 (0)  0 , x1 (1)  x2 (1)  1

1 (1)   , 2 (1)   ,

注:  (t f )   φ  x (t f )  [ g  x (t f )]

第七章 最优控制 10
 3 6
解方程得: u (t )   t  ,
7 7
1 3 3 2 3 6
x1 (t )   t  t , x2 (t )   t 2  t 。
14 7 14 7
注意, 1 (1)  2 (1) 与目标集 x1 (1)  x2 (1)  1 正交(横截条件)。

[ 例 3-3] 已 知 一 阶 受 控 系 统 x  u , x(0)  1。 求 控 制 u (t ) , 使

x(t f )  0 ( t f 可变),并使下述性能指标为最小:

1 tf 2
J tf   u dt
2 0
解:这是一个 t f 可变, x (t f ) 固定的问题。

H 函数: H  L   f  (1 2)u  u ;
2

极值条件: H u u    0 ,解得 u   ;

规范方程: x  u   ,    H  x  0 ;

边界条件: x(0)  1, x(t f )  0 ,  (t f )  2 ;

注:  (t f ) 由 H (t f )     t f 和极值条件求得。

解方程得:  (t )  2 , u  (t )   2 , x  (t )  1  2 t , t f  1 2。

§4 极大值原理简介

利用古典变分法求解最优控制问题时要求 H 对 u 的偏导数存在

且连续,这对某些性能指标而言,是不能满足的。特别是,在实际问

题中,控制量一般是有限制的,如阀门的开度、电机的转矩、火箭的

推力等,通常有类似 ui  M i 的不等式约束,而最优控制往往要求

在闭域的边界上取值,这时,古典变分法就无能为力了。对此,许多

学者作了很多努力,其中,庞特里亚金(Pontryagin)的极(最)大

值原理是比较成功的一种方法。极(最)大值原理的原始证明内容艰

深,而和古典变分法相比,在解决同类问题时,结论几乎完全相同,

仅在极值条件上有差别,这种差别从概念上又是容易理解的,因此,

这里将略去证明,直接给出结论。

第七章 最优控制 11
 
[ 极 大 值 原 理 ] 如果 u (t ) 是所给问题的最优控制, x  (t ) 和  (t ) 是

规范方程组对应于 u (t ) 的最优轨线和最优协态变量,则

H ( x  (t ), u (t ),  (t ), t )  min H ( x  (t ), u(t ),  (t ), t )
u ( t )U

 极大值原理在这里表述的实际是极小值原理,只是沿用了原有文

献的提法。也有不少文献直接称极小值原理,使之名副其实;

 和古典变分法一样,极大值原理给出的是最优控制所应满足的必

要条件,不是充分条件;也不涉及最优解的存在问题;

 和古典变分法相比,极大值原理不要求 H 对 u 可微,且允许控制

受限,放宽了应用条件,更具实用价值;

 古典变分法给出的极值条件使哈密尔顿函数取局部极小(甚至不

是),而极大值原理给出的是全局最小;但寻求全局最小难度大。

[ 例 4-1] 一阶受控系统 x   x  u , x(0)  1, t f  1, x (t f ) 自由,

u  1 。求使下述性能指标最小的最优控制及相应的最优状态轨线。

1 1
J   0 ( x  u) d t
2
解:这是一个 t f 固定, x (t f ) 自由,控制受限的最优控制问题。

H 函数: H  L   f  x   x  u (  1 2)

1
极值条件: u    sign(  )
2
规范方程: x   x  u  ,    H  x  1  

边界条件: x(0)  1,  (1)    x (t f )  0



解方程得:   1  e t 1 , u (t )   sign(1 2  e ) ,
t 1

  1, 0  t  t s e
即: u (t )   t s  1  ln 2  ln
 1, t s  t  1 2

最优控制分为两段,是 Bang-Bang 控制,见图 4-1。

当 0  t  t s 时有: x   x  1 , x(0)  1,

得: x * (t )  2e t  1 , x (t s )  4e  1
1

第七章 最优控制 12
当 t s  t  1 时有: x   x  1 , x(t s )  4e  1
1

得: x * (t )  1  (2  4e 1 )e  (t ts )

最优轨线共分为两段,方程不同,首尾相接,见图 4-2。

1
1
1
1
 e t 1
2
1

图 4-1 u * (t ) 图形 图 4-2 x * (t ) 图形

§5 时间最优控制※

使系统由初态转移到目标集的时间为最短的控制称为时间最优

控制,或最速控制。这里,我们仅讨论一种最简单、最常见的情况。

已知控制受约束的二阶积分型受控系统及性能指标如下:

 x1  x2 , x1 (0)  x10 , x1 (t f )  0


 (5-1a)
 x 2  u, x2 (0)  x20 , x2 (t f )  0
t
J   0f d t  t f , u(t )  1 (5-1b)

求最优控制 u (t ) ,使系统在最短的时间 t f 内(即 J 最小),自任意

初态 ( x10 , x20 ) 转移到状态空间的原点 (0, 0) 。(时间最优调节器问题)

显然,这是 t f 可变, x (t f ) 固定的最优控制问题。

H 函数: H (t )  L   f  1  1 (t ) x2 (t )   2 (t )u (t )
T

极值条件: u   sgn( 2 ) (根据极大值原理)

规范方程: x1  x2 , x 2  u , 1  0 , 2  1

边界条件: x1 (0)  x10 , x2 (0)  x20 , x1 (t f )  0 , x2 (t f )  0

1   1(t f ) x2 (t f )  2 (t f )u (t f )  0  H (t f )    φ  t f

第七章 最优控制 13

将极值条件代入规范方程和边界条件可以求得 2 (t ) ,从而得到

最优控制 u * (t )   sgn[2 (t )] 。显然,这是一种开环控制,由于实际系

统往往存在扰动,若能实现闭环控制就更理想。也就是说,希望找到

最优控制 u * (t ) 和状态 x (t ) 之间的函数关系。

由规范方程可得: 1 (t )  c1 , 2 (t )  c2  c1t 。其中 c1 和 c2 为任

意常数,且不能同时为零(否则 1 (t )  2 (t )  0, 不满足上述边界

条件中的最后一个方程),所以, 2 (t ) 是一条不恒为零的直线,

在区间 [0, t f ] 上, 2 (t ) 至多有一点过零。根据 c1 和 c2 的不同组合,

2 (t ) 有四种可能情况,相应的最优控制 u * (t )   sgn[2 (t )] 是最多

切换一次的 Bang-Bang 控制,如图 5-1 所示。

图 5-1

考虑到最优控制只可能取  1 或  1 ,现取 u (t )  M  1 ,由状态

方程和初始条件可以解得:

1
x2 (t )  x20  M t , x1 (t )  x10  x20 t  M t 2
2
1 2 1 2
消去 t 后,得到: x1  ( x10  x20 )  x2
2M 2M
这就是在控制 u  M 作用下,始于 ( x10 , x20 ) 的状态轨线(相轨线)

方程,如图 5-2 所示,在相平面 x1  x2 上,它是一族抛物线。图中实

线表示对应于 u  1 的轨线,虚线则是对应于 u  1 的轨线,箭头

第七章 最优控制 14
表示随时间增长状态演化的方向。

图 5-2 图 5-3

由图 5-2 可见,只有   和   两条轨线能到达原点,它们是:

 1   1 
   ( x1 , x2 ) : x1  x22 ; x2  0 ,    ( x1 , x2 ) : x1   x22 ; x2  0
 2   2 

如 果 初 始 状 态 ( x10 , x20 ) 位 于   (   ) 上 , 则 最 优 控 制 律 为

u   1( u   1),系统自初态沿着   (   )运动到坐标原点。任

何其它控制律(在切换不超过一次的前提下)都不能使状态转移到

原点。

由   和   合成的曲线  称为开关曲线,它将相平面分为两个区

域:其上方区域记作 R ,下方区域记作 R ,用状态集合表示如下:

 1 
        ( x1 , x2 ) : x1   x2 x2  ,
 2 

 1   1 
R  ( x1 , x2 ) : x1   x2 x2  , R  ( x1 , x2 ) : x1   x2 x2 
 2   2 
若初态 ( x10 , x20 ) 位于区域 R ,如图 5-3 上的 A 点,控制序列

{+1}、{-1}、{+1,-1}所对应的轨线分别为 AF、AG、AHI,均不能转移

到坐标原点。只有采用控制序列{-1,+1},且当相点到达开关曲线 

(   )时,实现由 u  1 到 u  1 的转换,才能使状态转移到原点,

相应的最优轨线为 AJO。同理,若初态 ( x10 , x20 ) 位于区域 R 内,最

第七章 最优控制 15
优控制序列应是{+1,-1},转换同样应发生在开关曲线  (   )上。

[ 结 论 4-1] 二 阶 积 分 型 受 控 系 统 的 时 间 最 优 控 制 u * 为 :

 1,  ( x1 , x2 )  0

u *   1,  ( x1 , x2 )  0 (5-2)
 sgn( x ),  ( x1 , x2 )  0
 2

1
其中,  ( x1 , x2 )  x1  x2 x2 ,称为开关函数。
2
可见,二阶积分型受控系统的时间最优控制能以状态变量函数的

形式表示出来,因而可按状态反馈实现闭环控制。下图所示的是它的

一种工程实现框图。
R
 

图 5-4

最后,我们不加证明地给出时间最优控制中著名的“ n 段定

理”

[定理 5-1]n 阶定常线性受控系统只有实特征值时,其时间最优控制

的切换次数不会超过 n-1 次。

思考题: 控制受约束( u (t )  1 )的二阶积分型受控系统,自任意初

态 ( x10 , x20 ) 转移到状态空间原点 (0, 0) 所需的最小时间是多少?

§6 线性系统二次型指标的最优控制

对于线性系统,若性能指标中的各项取二次型函数形式,则称为

第七章 最优控制 16
线性系统二次型指标的最优控制,简称线性二次型(LQ)问题。它

的最优解可以用解析形式表达为简单的状态反馈控制律,是现代控

制理论及其应用中最富有成果的一部分。

6.1 线性系统有限时间状态调节器

受控系统和最小化性能指标如下:

x  A(t ) x  B (t )u, x (t 0 )  x 0 (6-1a)

1 T 1 t
J x (t f ) F x (t f )   t f [ x T Q (t ) x  uT R(t )u] d t (6-1b)
2 2 0
其中:矩阵 F 和 Q (t ) 正定或者半正定, R(t ) 正定。F 项反映了对

末态趋于零的要求,Q 项反映了对状态过渡过程性能的要求,R 项

则反映了对控制能量的限制。因此,加权矩阵 F,Q,R 的选择决定

了各项要求之间的权衡,是非常重要的。遗憾的是,这是个困难的问

题,通常靠试探和经验,这里假定它们已确定。有限时间状态调节器

问题实际上是 t f 固定、x (t f ) 自由、u 不受约束的最优控制问题,可以

直接利用前面的结果。(以下除特别强调外,略去自变量 t)

1 T 1
H 函数: H  L  T f  x Qx  u T Ru  T Ax  T Bu
2 2
H
极值条件:  Ru  B T   0 , 得 u   R 1 B T 
u
H
规范方程: x  Ax  BR 1 B T  ,     Qx  AT 
x
φ
边界条件: x (t 0 )  x 0 ,  (t f )   Fx (t f )
x (t f )

由规范方程和边界条件可以求出  (t ) ,代入到极值条件,进而

解出 u (t )   R (t ) B (t ) (t ) ,这是一种开环控制。能否实现闭环控
1 T


制呢?也就是说, u (t ) 能否用状态 x (t ) 来表达呢?考虑到规范方程

是线性的,且  (t f )  Fx (t f ) 也是线性的,不妨设:

 (t )  P (t ) x (t ) , P (t f )  F , (6-2)

第七章 最优控制 17

则 u (t )   R (t ) B (t ) P (t ) x (t ) ,
1 T
(6-3)

由式(6-2)得:   P x  Px  ( P  PA  PBR 1 B T P ) x ,而由规范方

程知:   (Q  AT P ) x , 比较这两个式子,便得到著名的黎卡提

(Riccati)矩阵微分方程:

P  PA  AT P  PBR 1 B T P  Q  0 (6-4a)

P (t f )  F (6-4b)

其中, A(t ), B (t ), Q (t ), R(t ) ,以及 F 是已知矩阵, P (t ) 是待求矩阵。

[结论 6-1]对线性系统有限时间状态调节器问题(6-1),最优反馈
 
控制的充分必要条件是: u (t )   R (t ) B (t ) P (t ) x (t ) ,其中, P (t )
1 T

 T 
是矩阵微分方程(6-4)的解;且 J  (1 2) x (t 0 ) P (t 0 ) x (t 0 ) 。

证明:(思路:对 J 进行配方)

d T
(1) ( x Px )  x T Px  x T P x  x T Px
dt
 ( x T AT  uT B T ) Px  x T P x  x T P ( Ax  Bu)
 x T ( AT P  PA  P ) x  u T B T Px  x T PBu

 x T ( PBR 1 B T P ) x  x T Qx  uT B T Px  x T PBu 参见(6-4a)

 (u  R 1 B T Px ) T R( u  R 1 B T Px )  x T Qx  uT Ru

tf d T
(2)  t ( x Px ) d t  x T (t f ) Fx (t f )  x T (t 0 ) P (t 0 ) x (t 0 )
0 dt
t t
  t f [(u  R 1 B T Px ) T R(u  R 1 B T Px )] d t   t f ( x T Qx  uT Ru) d t
0 0

1 T 1 t
(3) J  x (t f ) Fx (t f )   t f ( x T Qx  uT Ru) d t
2 2 0
1 T 1 t
 x (t 0 ) P (t 0 ) x (t 0 )   t f [(u  R 1 B T Px ) T R(u  R 1 B T Px )] d t
2 2 0
上式第二项大于等于零,当且仅当 u   R 1 B T Px  时为零,此

1 T
时,性能指标取最小值: J   x (t 0 ) P (t 0 ) x (t 0 ) , 证毕。
2
 不管 A(t ), B (t ), Q (t ), R(t ) 是时变的还是定常的, P (t ) 通常是时变

第七章 最优控制 18
的,因而反馈系数矩阵是时变的,这是有限时间终点的复杂性;

 若 A(t ) 的元是连续的, B (t ), Q (t ), R(t ) 的元是分段连续的,且所

有矩阵的元均有界,则 P (t ) 存在且唯一,但通常无解析解;

 Riccati 矩阵微分方程是对称的,如果 P (t ) 是它的解,则 P (t ) 也


T

是,由解的唯一性可知: P (t )  P (t ) 是对称矩阵;
T

  J  0 ,  J   (1/ 2) x T (t 0 ) P (t 0 ) x (t 0 )  0 ,  x (t 0 ) 是 任 意 的 ,

 P (t 0 )  0 ,又由于 t 0 可任意选择,所以 P (t )  0 ,是半正定的;

  P (t f )  F ,为强调 Riccati 方程的解 P (t ) 依赖于末端条件(末

时刻 t f 和末值 F ),记为 P (t , F , t f ) 。不难证明:

P (t 0 , 0, t1 )  P (t 0 , 0, t 2 ) , t 0  t1  t 2
 
(提示:当 F  0 时, J [t 0 , t1 ]  J [t 0 , t 2 ] )

  P (t f , F , t f )  F , 所 以 若 时 变 矩 阵 P (t , P (t1 , F , t 2 ), t1 ) 和

P (t , F , t 2 ) 描述的是同一个 Riccati 方程的解,由于满足相同边界

条件( t  t1 时,二者取值相等),解又是唯一的,则下式成立:

P (t , F , t 2 )  P (t , P (t1 , F , t 2 ), t1 ) , t  t1  t 2

[ 例 6-1] 设有受控系统 x   x  u , x(0)  x0 ,求最优控制使下述性

1 tf 2
能指标为最小: J 
2
 t 0
(x  u 2 )d t

解:由题意知: A  1, B  1, Q  1, R  1 ,根据[结论 6-1]得:

最优控制: u  (t )   p(t ) x(t )

Riccati 方程: p  2 p  p  1  0 , p (t f )  0
2

2 2 ( t t f )
1 e
p (t )  2 2 ( t t f )
2  1  ( 2  1) e

lim p(t )  2  1  const


t f 

注意, p (t ) 是时间 t 的函数,而且依赖于 t f ,当 t f 趋于无穷大时,

p (t ) 趋于常数(时不变)。下图给出了 t f (图中为 T)较小、较大、以

第七章 最优控制 19
及趋于无穷时对应的 p (t ) 曲线。

p(t )
T 

t
smaller T larger T

图 6-1

6.2 线性定常系统无限时间状态调节器

受控系统和最小化性能指标如下:

x (t )  Ax (t )  Bu(t ), x (t 0 )  x 0 (6-5a)

1  T
J
2
 t 0
[ x (t )Qx (t )  uT (t ) Ru(t )] d t (6-5b)

和上节研究的问题相比主要有两点差别:首先是所有的系数矩

阵和加权矩阵均改为常数矩阵,其次是末端时间由有限改为无限;

目的是获得定常的最优控制反馈矩阵。此外,由于 t f   ,不再有末

时刻,因而在 J 中取消了末态指标项;对稳态(注意稳态和末态的

区别)时状态趋于零的要求体现在 Q 项中。这里 Q 正定或半正定, R

正定。

对于有限时间调节器问题,J 总是有限值,其最优解必存在,但

在无限时间情况下,可能会发生这样的情形:无论怎样选择 u,J 值

总是无限大,因而不存在最优解。怎样才能保证有最优解呢?

[结论 6-2] 对线性定常系统无限时间状态调节器问题(6-5),若系

统完全可控,则存在最优解。

证明:因系统完全可控,对任意非零初始状态 x (t 0 ) ,必存在有
~ (t ) ,在有限时刻 t  t 使系统回到状态空间原点(平衡点),
界控制 u 1 0

~ (t ), t  [t )
~ (t ) 为零。在如此定义的 u
在时刻 t1 之后置 u 0, 作用下,性能

指标 J 一定是有界的,因而最优解是存在的。证毕。
第七章 最优控制 20
※ 完全可控性只是问题有解的充分条件。事实上,只要不可控模

态是渐稳的(可稳定性),或者既不可控又不渐稳的模态在性能指

标中不可观(不反映在指标中),问题就有解。

在问题有解的前提下,可以将前节讨论的有限时间调节器的结

果推广到这里讨论的无限时间的情形。因此,我们要考察 t f   时,

Riccati 矩阵微分方程(6-4)的解 P (t , 0, ) 是否存在。(注: F  0 )

[ 结 论 6-3] 当问题(6-5)有解时,Riccati 矩阵微分方程(6-4)的

解 P (t , 0, ) 存在,且为常数。

证明:

(1)若问题(6-5)有解,则 J (t f )  (1 2) x (t 0 ) P (t 0 , 0, t f ) x (t 0 ) 随着
T

t f   时有界,由于 t 0 和 x (t 0 ) 的任意性,可知 P (t , 0, ) 存在。

(2)由于 A, B, Q, R 为定常矩阵,所以 Riccati 矩阵微分方程(6-4)

是线性定常的,因而 P (t , 0, t f )  P (0, 0, t f  t ) ,令 t f   ,则

有: P (t , 0, )  P (0, 0, ) ,即 P (t )  P (0) 为定常矩阵。证毕。

由于 P (t ) 定常,导数为零,Riccati 矩阵微分方程(6-4)变为:

PA  AT P  PBR 1 B T P  Q  0 (6-6)

[结论 6-4] 对线性定常系统无限时间状态调节器问题(6-5),若系

统 完全 可控, 则反 馈 控制 u (t ) 为最优控制的 充 分必要条件是:

u (t )   R 1 B T Px  (t ) ,其中, P 是矩阵微分方程(6-4)的稳态解,
 T 
或代数方程(6-6)的非负定解;且 J  (1 2) x (t 0 ) Px (t 0 ) 。

※ 注意,Riccati 矩阵微分方程的解是唯一的,因而稳态解也是唯

一的,但其对应的代数方程的解却不一定唯一。上面的限定词“非负

定”在这里是指正定或半正定,以下同。

按上述结论构成的闭环系统是否一定稳定呢?先看一个简单的

1  T
例子: x  x  u , J   u u d t 。由于 Q  0 ,根据 Riccati 代数方程
2 0

第七章 最优控制 21
得到 P  0 ,从而 u  0 (也可由性能指标直接看出),闭环系统
x  x
显然是不稳定的。这是由于开环系统的不稳定状态完全没有反映在性

能指标中。如果系统的全部状态都能通过性能指标观测(反映)出来,

是否能保证闭环系统稳定呢?

[ 结 论 6-5] 设 Q  D D ,则 ( A, D) 完全能观测是 Riccati 代数方程


T

(6-6)的非负定解为正定矩阵的充分必要条件。

证明:(充分性) ( A, D) 完全能观测必导致非负定 P 为正定矩阵。

反设 P 不是正定的,因而存在非零的 x (t 0 ) ,使得

1 T
J  x (t 0 ) Px (t 0 )  0 ,
2
这就要求性能指标中的被积函数恒等于零,  R  0 , u  0 ,此时,
A ( t  t0 )
系统的状态为: x (t )  e x (t 0 ) ,从而

1  T 1  T
J   x (t )Qx (t ) d t   x (t ) D T D x (t ) d t  0 ,
2 t0
2 t 0

A ( t t 0 )
这就意味着: D x (t )  De x (t 0 )  0 ,也就是说,存在非零状态

x (t 0 ) 是 ( A, D) 不可观测的,这和 ( A, D) 完全能观测是矛盾的。证毕。

命题的必要性可以用类似的方法得到证明(略)。

[ 结 论 6-6] 设 Q  D D ,若 ( A, D) 完全能观测,则由最优控制律构
T

成的闭环系统 x  ( A  BR B P ) x 是渐近稳定的。
1 T

证明:由给定条件和[结论 6-5]可以得到: P  0 ;

选取李亚普诺夫函数: V ( x )  x Px  0
T

则: V ( x )  x T Px  x T Px

 x T ( AT  PBR 1 B T ) Px  x T P ( A  BR 1 B T P ) x
 x T ( AT P  PA  PBR 1 B T P ) x  x T PBR 1 B T Px

  x T Qx  uT Ru  0
假设 V ( x )  0 ,  R  0 , u  0 ,根据[结论 6-5]的证明过程

可知,这将导致 ( A, D) 不完全能观,这和给定条件相矛盾;因此,
第七章 最优控制 22
沿状态轨线V ( x ) 不恒为零,故闭环系统渐近稳定。证毕。

 注意, Q  D D 的分解并不是唯一的,可以证明 ( A, D) 的完全能


T

观测性并不取决于某个特定的分解,而是由 A 和 Q 本身决定的。

 为保证闭环渐稳, ( A, D) 完全能观并不是必要的。只要不能观测

的部分是渐稳的,闭环系统就是渐近稳定的。

[例 6-2] 设有受控系统 x1  x2 , x 2  u ,求最优控制使下述性能指标为

1  T
最小: J   0
( x Qx  R u 2 ) d t ,其中, Q  I 2 , R  1 。
2
0 1  0 
解:可控性: A    , b    , ( A, B ) 完全可控;
0 0  1 
1 0  1 0 
可观性: Q  D D    , ( A, D) 完全可观;
T

0 1   0 1 
Riccati 方程: PA  AT P  PbR 1b T P  Q  0

 p11 p12 
设 P ,并代入 A, b, R, Q ,得到:
 p12 p22 

p122  1 , p222  2 p12  1 , p11  p12 p22

 P 是非负定的,得到: p12  1, p11  p22  3



最优控制: u (t )   R b Px (t )  [1
1 T
3 ] x (t )

0 1 
闭环系统: AL  A  b [1 3]    ,渐近稳定。
 1  3 

思 考 :若性能指标为: J   0 ( y Wy  u Ru)dt ,其中 y  Cx 是系
T T

统的输出,这类问题称为最优输出调节器问题,请问它和最优状态

调节器问题之间有什么关系?

§7 离散系统的最优控制※

前面,我们已经比较系统地学习了连续系统的最优控制问题,

其理论可以方便地推广到离散系统中来,因而,二者有很多相似性。

7.1 离散系统的极大值原理

第七章 最优控制 23
受控系统的运动方程和性能指标如下:
x ( k  1)  f [ x ( k ), u(k ), k ] , x (0)  x0 (7-1a)
N 1
J  φ [ x ( N ), N ]   L[ x (k ), u(k ), k ] (7-1b)
k 0

这里,要求最优控制在给定的 ( N  1) 个采样周期内完成,常称为

“N 阶段决策过程”。初始状态 x (0) 是给定的,末端状态 x (N ) 是自

由的。

引人拉格伦日乘子  (k ) ,得到无约束条件的等价性能指标:
N 1
J   J   T (k  1){ f [ x ( k ), u( k ), k ]  x (k  1)}
k 0

N 1
 φ [ x ( N ), N ]   [ H (k )  T ( k  1) x (k  1)]
k 0

 φ [ x ( N ), N ]  T (0) x (0)  T ( N ) x ( N )
N 1
  [ H (k )  T ( k ) x (k )]
k 0

其中, H (k ) 为离散系统的哈密顿函数:

H ( k )  L[ x (k ), u(k ), k ]  T ( k  1) f [ x (k ), u(k ), k ]

计算 J  的变分

 φ 
J    T  T ( N ) x ( N )
 x ( N ) 
N 1  H ( k )  N 1
 H (k )
   x T (k )   T
( k )  x ( k )   0  u (k )
T
 u( k )
k 0   k 

由  J   0 ,可以得到求解该最优控制问题的结论如下:

[结论 7-1]由式(7-1)给出的离散系统最优控制问题,其最优解应

满足的必要条件如下:

H 函数: H (k )  L(k )  T (k  1) f (k )
H ( k )
极值条件:  0 , 若 u(k ) 有限制,采用下式:
u(k )

H [u (k )]  min H [u(k )]


u ( k )U

第七章 最优控制 24
 x ( k  1)  f [ x (k ), u(k ), k ] 状态方程

规范方程:  ( k )   H (k ) 协态方程
  x (k )

 x (0)  x 0 初始条件

边界条件:  ( N )  φ 末端条件
  x( N )

[例 7-1] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k  1)   x(k )  u (k ) , x(0)  3

1 2 1
1
J x ( 2)   u 2 ( k )
2 k 0 2

解:设最优控制序列为 u  (0), u  (1) ,必要条件为:

1
哈密顿函数: H (k )  u 2 (k )   (k  1)[u (k )  x( k )] , k  0, 1
2
H ( k )
极值条件:  u (k )   (k  1)  0 , k  0, 1
 u (k )

 H (k )
规范方程: x(k  1)   x( k )   (k  1) ,  (k )    (k  1)
 x(k )

φ
边界条件: x(0)  3 ,  (2)   x( 2)
 x( 2)

由规范方程和边界条件解得:

 (1)  1 ,  (2)  1; x  (1)  2 , x  ( 2)  1

由 u (k )   (k  1) 得到: u  (0)  1 , u  (1)  1

7.2 线性离散系统二次型性能指标的最优控制

受控系统的运动方程和性能指标如下:
x ( k  1)  A( k ) x (k )  B (k )u(k ) , x (0)  x 0 (7-1a)

1 T 1 N 1
J x ( N ) Fx ( N )   [ x T ( k )Q (k ) x ( k )  uT (k ) R( k )u(k )] ( 7-
2 2 k 0

1b)
其中:矩阵 F 和 Q (k ) 正定或者半正定, R(k ) 正定,u 不受约束。

可以直接利用前节的结果,得到:

第七章 最优控制 25
1 T 1
H 函数: H ( k )  x (k )Q (k ) x ( k )  uT (k ) R( k )u(k )
2 2
 T (k  1)[ A(k ) x (k )  B (k ) u( k )]

极值条件: u (k )   R (k ) B (k ) (k  1)
1 T

规范方程: x ( k  1)  A( k ) x (k )  B (k ) R (k ) B ( k ) (k  1)
1 T

 (k )  Q ( k ) x (k )  AT ( k ) (k  1)

边界条件: x (0)  x 0 ,  ( N )  Fx ( N )

设:  ( k )  P (k ) x (k ) , P (N )  F (7-2)

将上式分别代入规范方程中的状态方程和协态方程,得到:

x ( k  1)  [ I  B (k ) R 1 (k ) B T ( k ) P (k  1)]1 A(k ) x ( k ) (7-3)

P (k ) x (k )  Q (k ) x (k )  AT (k ) P (k  1) x ( k  1) (7-4)

将式(7-3)代入(7-4)得到离散系统 Riccati 递推方程:


~
P ( k )  Q ( k )  AT ( k ) P ( k ) (7-5a)
~
P (k )  [ P 1 ( k  1)  B (k ) R 1 (k ) B T (k )]1 A(k ) (7-5b)

k  N  1, , 1, 0 , P (N )  F

将式(7-2)代入极值条件,得到:

u (k )   R 1 (k ) B T ( k ) P (k  1) x (k  1) (7-6)

将式(7-3)代入上式,并考虑到式(7-5b)得到:
~
u (k )   R 1 (k ) B T (k ) P (k ) x (k ) (7-7)

[结论 7-2] 对线性离散系统有限拍状态调节器问题(7-1),最优反


~
馈控制的充分必要条件是: u (k )   R 1 (k ) B T ( k ) P (k ) x  (k ) ,其中,
~
P (k ) 是矩阵递推方程(7-5)的解;且 J   (1 2) x T (0) P (0) x  (0) 。

(注意 P 和 P~ 的区别)

[例 7-2] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k  1)   x(k )  u (k ) , x(0)  3

1 2 1
1
J  x ( 2)   u 2 ( k )
2 k 0 2

第七章 最优控制 26
解:该例同[例 7-1]。这里直接利用[结论 7-2]来求解,注意到:
A  1, B  1, F  1, Q  0, R  1 ,我们得到:
~ ~
(1) P ( k )  [ P 1 (k  1)  1]1 , P (k )   P ( k ) , P (2)  F  1 ,
~ ~
反向递推得: P (1)  1 2 , P (1)  1 2 ; P (0)  1 3 , P (0)  1 3
~
(2) u  (k )   P (k ) x  (k ) , x  ( k  1)   x  (k )  u  ( k ) , x  (0)  3

正向递推得: u  (0)  1 , x  (1)  2 , u  (1)  1, x  ( 2)  1


  
(3) J  (1 2) x (0) P(0) x (0)  3 2

1  1
1  3
校核: J 
2
[ x ( 2 )] 2
 
k 0 2
[u (k )]2 
2
由该例可见,尽管系统是线性定常的,但最优反馈阵是时变的。

和连续系统的情形类似,只有当终止时间为无穷大时,即 N   时,

反馈增益矩阵才可能变为常数矩阵。

受控系统的运动方程和性能指标如下:
x ( k  1)  Ax (k )  Bu(k ) (7-8a)

1 
J 
2 k 0
[ x T ( k )Qx (k )  u T ( k ) Ru( k )] (7-8b)

所有的系数矩阵和加权矩阵均为常数阵,末端为无限。类似于连续系

统,可以证明,若 ( A, B ) 完全可控,该问题的最优解存在,此时,

Riccati 矩阵递推方程(7-5)的递推解有极限,即存在稳态解,并等

同于下述矩阵代数方程的非负定解:
~
P  Q  AT P , (7-9a)
~
P  [ P 1  BR 1 B T ]1 A (7-9b)

[结论 7-2] 线性定常离散系统无限拍状态调节器问题(7-8),若系

统 完 全 可 控 , 最 优 反 馈 控 制 的 充 分 必 要 条 件 是 :
~
u (k )   R 1 B T P x  ( k ) ,其中, P~ 是矩阵递推方程(7-5)的稳态解,
 T 
或代数方程(7-9)的非负定解;且 J  (1 2) x (0) P x (0) 。 (注意

P 和 P~ 的区别)

第七章 最优控制 27
§8 动态规划

求解最优控制问题的另一种方法是动态规划,它的基础是下面的

最优性原理,或称为最优法则。

[最优法则] 一个过程的最优策略具有以下性质,即无论其初始状态

和初始决策如何,其后的各决策对以第一个决策所形成的状态作为

初始状态的过程而言,必须构成最优策略。

最优法则的正确性是显见的,或者可用反证法非常容易地得到证

明。下面通过例子说明动态规划在离散最优控制问题中的应用。

[例 8-1] 对下述一阶系统和给定的性能指标,求最优控制序列。
x(k  1)   x(k )  u (k ) , x(0)  3

1 2 1
1
J  x (2)   u 2 ( k )
2 k 0 2
解:该例同[例 7-1]和[例 7-2],这里用动态规划求解。

不难看出,系统的运动过程如下:

u (0) u (1)
x(0)  x(1)  x(2)

1 2 1 1
定义: J 2  x (2) , J 1  u 2 (1)  J 2* , J 0  u 2 (0)  J 1
2 2 2
(1)由 J 2 开始,反向递推:

1 2
J 2  min J 2  x (2)
u ( 2) 2
1 1
J 1  [u 2 (1)  x 2 (2)]  {u 2 (1)  [u (1)  x(1)]2 }
2 2
 J1 1
 2u (1)  x(1)  0 ,得到: u  (1)  x(1)
u (1) 2

 1 2
将 u (1) 代入 J 1 得: J 1  x (1) ,从而有
4
1 1 1 1
J 0  u 2 (0)  x 2 (1)  u 2 (0)  [  x(0)  u (0)]2
2 4 2 4
J0 3 1 1
 u (0)  x(0)  0 ,得到: u  (0)  x(0)
u (0) 2 2 3
第七章 最优控制 28
(2)由 x(0)  3 开始,正向递推:

u  (0)  1 , x  (1)  2 , u  (1)  1, x  (2)  1

从上面的例子可以看出,动态规划法把一个难于直接处理的多

阶段决策过程,通过反向递推过程,化为一个多次一步决策的简单

问题。它不仅适用于离散系统,也适用于连续系统;但当系统的维数

增加时,其计算量成指数增长,即存在所谓的“维数灾”问题。

参考书

《自动控制原理》(下册),吴麒主编,清华大学出版社,1992,(第 12 章)

《自动控制理论基础》,戴忠达主编,清华大学出版社,1991,(第 8 章)

《线性系统理论》(第二版),郑大钟,清华大学出版社,2002,(第 6 章)

《最优控制理论》,王朝珠,秦化淑,科学出版社,2003

《控制理论导论》,郭雷主编,科学出版社,2005,(第 7 章)

第七章 最优控制 29

You might also like