You are on page 1of 109

非线性系统控制理论

何长安 编
2002 稿

西北工业大学
前 言
众所周知,实际上诸多的控制系统都是非线性系统 特别是机
器人控制系统 飞行控制系统 直升机飞控系统等 人们对非线性
控制系统的研究也已经有近百年历史了 可以说从控制理论诞生之
日起就开展了非线性系统的研究 由于非线性控制系统可能具有比
线性系统丰富和复杂得多的特性 且除去一些特殊情况外 大多数
非线性系统所建立的数学方程都无法得到它的闭合解或解析解 因
而在一个很长的时期内不是致力于去寻找它直接的解析解 而是研
究系统的一些定性的性质 例如对稳定性的研究就取得了很大的成
绩 其中值得一提的是李亚普诺夫方法 并且适合于分析低阶系统
的相平面法 描述函数法等也得到了发展 但是综合起来看所解决
的问题是有限的 有许多重大的 根本性的问题尚没有解决 有些
只是一个开端 有些还是空白 远远不能满足工程技术及其他各领
域的需要
近 20 年来 非线性控制系统理论有了突破性进展 微分几何
方法在非线性控制系统中得到了广泛的应用 从而形成了控制系统
理论中一个崭新的分支 罗马大学教授 A.Isidori 在 1985 年指出
正如 50 年代拉氏变换 复变函数理论用于线性单输入单输出系统
60 年代状态空间描述和线性代数理论用于多变量线性系统那样 用
微分几何方法研究非线性控制系统取得了并将进一步取得突破与
成功 几乎同时钱学森教授也曾指出 微分几何方法对研究非线性
系统是很有前途的 到目前为止 这一理论不仅已经初步形成了自
己的理论体系 而且在机器人控制系统 直升机飞控系统 化学反
应器控制系统 电力系统动态安全性控制以及生物医学方面得到了
成功的应用
本课程的目的是要把这个理论介绍给大家 起一个引导和桥梁
的作用
由于微分几何这一数学分支对于工程类的学生来说是不大熟
悉的 特别是有关的一些概念 如拓扑空间 微分流形 映射 切
空间 向量场 微分同坯 李导数 李代数 分布与对偶分布 对
合性 闭包 Frobenius 定理等 比较抽象 较难学懂 但不掌握
这些概念就会妨碍对非线性控制理论的透彻理解 也就很难将理论
用于实际 而对理科类学生来说 虽然有较好的数学基础 这些数
学基础也已掌握 但对控制系统的工程实际又了解太少 因而也很
难将这一理论真正用于实际的工程系统 本课程的目的就是建立起
一座联结彼岸与此岸的桥梁 使学习本课程的理 工两类学生均有
收益
由于课内学时较少 因而希望学生在课外针对自己的弱点多阅
读参考文献 以加强对课程的理解和消化

主要参考书
1.Alberto Isidori 著, Nonlinear Control Systems ,
Springer-Verlag 出版 1989 年第 2 版
2.Henk Nijmeijer , Arjan Van der Schaft 合著 Nonlinear
Dynamical Control Systems, Springer-Verlag 出版 1990 年第 1

3.程代展编著 非线性系统的几何理论 科学出版社 1988 年
4.卢强 孙元章著, 电力系统非线性控制, 科学出版社, 1993

5.夏小华 高为炳著 非线性系统控制及解耦 科学出版社 1993

6.J.-J.E.Slotine 李卫平,应用非线性控制 国防出版社 1992

7.欧阳光中著 流形上的微积分 上海科技出版社 1988 年
目 录

第一章 微分几何基础 ..........................................................................1

1.1 度量空间 ..................................................................................1


1.2 邻域概念 ..................................................................................2
1.3 欧氏空间上的连续映射 ..........................................................2
1.4 拓扑空间 ..................................................................................6
1.5 连续映射与同胚 ......................................................................8
1.6 流形和微分流形 ......................................................................8
1.7 可微映射 ................................................................................12
1.8 流形上的可微函数 ................................................................13
1.9 切向量和切空间 ....................................................................14

第二章 李导数李括号运算与分布 ........................................................19

2.1 向量场 ....................................................................................19


2.2 李导数 ....................................................................................19
2.3 李括号运算 ............................................................................20
2.4 李括号运算具有下列性质 ....................................................20
2.5 协向量场的微分运算 ............................................................21
2.6 运算法则 ................................................................................21
2.7 分布 Distributions ..........................................................22
2.8 Frobenius 定理 ......................................................................25

第三章 反馈线性化的初等理论 ............................................................29

3.1 局部坐标变换 ........................................................................29


3.2 状态反馈精确线性化 ............................................................43

第四章 反馈线性化原理的应用 ............................................................55

4.1 零动态 .....................................................................................55


4.2 局部渐近稳定化(镇定)..........................................................64
4.3 渐近输出跟踪 ........................................................................70
4.4 干扰解耦 ................................................................................74
4.5 高增益反馈 ............................................................................78
4.6 关于精确化问题的补充 ........................................................83
4.7 具有线性误差动态的观测器 ................................................86
4.8 举例 ........................................................................................91

第五章 MIMO 非线性系统的反馈线性化初步理论...........................96

5.1 向量相对阶和总相对阶 ....................................................96


5.2 局部坐标变换和标准形 ........................................................97
5.3 零动态 ..................................................................................100
5.4 参考输出复制问题 ..............................................................100
5.5 反馈线性化 ......................................................................102
5.6 输入输出解耦控制 或互不影响的控制 ......................102
非线性系统控制理论

第一章 微分几何基础
本章叙述本课程将要用到的一些微分几何的基础知识 但一般不
作证明 有兴趣者可参阅有关资料
1.1 度量空间
设集合 R n = {x = ( x1 , x 2 ,..., x n ) | xi 是任意实数 1 ≤ i ≤ n} , n 是正整数,
其中 R n 中的元素 x = ( x1 , x 2 ,...x n ) 叫做点, xi 是点 x 的座标分量 两点的
距离定义为
n
ρ ( x, y ) = [∑ ( xi − y i ) 2 ]1 / 2 ∈ R 1
i =1

它可以看作是一种从 R 到 R 的对应关系 定义了上述距离 ρ n 1

R × Rn 
n
→ R 1 的集合 R n ,叫做欧几里得空间 上述 ρ 叫做欧氏空间
的通常度量 欧氏空间记为 R n ρ
通常度量 ρ R n × R n  → R 1 是非负函数 且具有下列性质
1 ρ ( x, y ) = 0 ⇔ x = y
2 对称性 ρ ( x, y ) = ρ ( y, x)
3 三角不等式 ρ ( x, z ) ≤ ρ ( x, y ) + ρ ( y, z )
定义 1: 度量空间 若我们抛弃具体的集合 R n 以及由此而赋予的具
体距离 只保留性质 1 2 3 则可引进更为一般的度量空间 即
设 X 为集 其中元素叫做点 记为 x, y, z 等 记 ρ : X × X  → R 1 为非
负函数,且满足性质 1 ,2 ,3 ,则 X ρ 就叫做度量空间,函数 ρ
叫做 X ρ 的度量, ρ ( x, y ) 叫做 x , y 间的距离,在明确了所赋予的
ρ 时,度量空间 X ρ 可简记为 X 因而欧氏空间可看成是度量空
间的一个特例
*希尔伯特空间 Hilbert 也是度量空间的一个特例
Hilbert 空间: R ω = ( R ω , ρ ,

集合 R ω = {x = ( x1 , x 2 ,...) | xi ∈ R 1 , i = 1,2,..., ∑ xi2 < +∞}
i =1

→ R 1 定义为: ρ ( x, y ) = [∑ ( xi − y i ) 2 ]1 / 2
而度量 ρ : R ω × R ω 
i =1

显然 ρ 满足性质 1 2 3 证明性质 3 时 可根据 n 维欧氏空间 R n


中的三角不等式再令 n  → ∞
*离散度量空间 设 X 为 任 一 集 合 , 定 义 ρ ( x, y ) = 0 , 当
x = y ; ρ ( x, y ) = 1 ,当 x ≠ y ;则 X ρ 是度量空间,叫做离散度量
空间

1
非线性系统控制理论

1.2 邻域概念
我们把数学分析中邻域的概念引入度量空间 以平面为例 设点
M 0 = ( x0 , y 0 ) 是平面上的一点 以 M 0 为中心既可以作一个园形邻域
O( M 0 , δ ) ,也可以作一个方形邻域 O ' M 0 ,δ ) 它们的定义分别是
O( M 0 , δ ) = {( x, y ) ∈ R | ( x − x 0 ) + ( y − y 0 ) 2 < δ 2 }
2 2

O ' ( M 0 , δ ) = {( x, y ) ∈ R 2 | x − x0 < δ , y − y 0 < δ }

δ
δ

M0 δ
M0

图 1-1
平面上一个点列 M n = ( x n , y n )(n = 1,2,..., ) 收敛于 M 0 可以用两种方式
来陈述:
1 园形邻域的方式 对于任给的 ε >0 存在正整数 N ,当 n > N 时,
有 ( x n − x0 ) + ( y n − y 0 ) < ε
2 2

或者说当 n 充分大时 点列 M n ∈ O( M 0 , ε )
2 方形邻域的方式 对于任给的 ε >0 存在正整数 N ,当 n > N 时有
x n − x0 < ε y n − y0 < ε
或者说当 n 充分大时,点列 M n ∈ O ' ( M 0 , ε )
这两种陈述方式是一致的 即在一种方式下是收敛的 则在另一
种方式下也一定是收敛的 因而在研究收敛性时 不同邻域的陈述是
等价的 因而今后常常用球邻域为代表来论述
定义 若 A 是度量空间 X 的子集 a ∈ A ,若 a 有一个球形邻域 ⊂ A ,
则 a 称为 A 在 X 中的内点 A 在 X 中的内点全体叫做 A 的在 X 中的内
部,记为 IntA 若 A = IntA ,则称 A 为 X 的开集 A 是开集等价于 A 是
__
若干球形邻域的并集 如果 A 是度量空间 X 的子集 A 的余集 A 是 X 的
开集,则 A 叫做 X 的闭集
1.3 欧氏空间上的连续映射
(1) 映射
设 D 是 n 维欧氏空间 R n 内的一个子集, f 是从 D 到 R m 的一个映射,

f :D → R m , D ⊂ R n ; x 
→ y ;

2
非线性系统控制理论

这 里 自 变 量 x ∈ D 是 R n 中 的 一 个 点 x = ( x1 , x 2 ,...x n ) , D 是 f 的 定 义
域, x 的象 y = f (x) 是 R m 中的一个点 向量 y = ( y1 , y 2 ,... y m ) ,因此 f 也
可称是定义在 D 内的向量值函数 表明 y 依赖于 x ,即 y 的每一个坐标
y j ( j = 1,2,..., m) 都依赖于 x = ( x1 , x 2 ,...x n ) :
y1 = f1 ( x1 , x 2 ,...x n )
y 2 = f 2 ( x1 , x 2 ,...x n )
.
.
.
y m = f m ( x1 , x 2 ,...x n )
x = ( x1 , x 2 ,...x n ) ∈ D
f i 是 f 的第 i 个坐标函数 记为
f = ( f1 , f 2 ,... f m )
引入了映射的概念之后 就有可能站在更高的层次上来看待曲线
曲面 坐标变换 多元函数等具体的概念
例如 设 D 是 R 3 中的一个区域 设映射T :
T : R3  → R 3
(u , v, ω ) 
→( x, y, z )
若 x = f (u , v, ω ),
y = g (u , v, ω ),
z = h(u , v, ω ), (u, v, ω ) ∈ D
x = f (⋅) = uSinv ⋅ Cosω ,
y = g (⋅) = uSinv ⋅ Sinω ,
z = h(⋅) = uCosv ,
若 D = {(u , v, ω ) | 0 < u < +∞,0 < v < π ,0 < ω < 2π } 则映射 T 就是球面
坐标变换
若 D 中任意两个不同点的映射,其象也不相同,就称映射 f 是由 D 到
R 的一个单射,或一对一的映射
m

若 f :D  → E , D ⊂ R n , E ⊂ R m , E 内任何点 y 在 D 内至少存
在一个 x ,使得 f ( x) = y 就称 f 是从 D 到 E 的一个满射
若 f 是从 D 到 E 的一个满射,同时又是一个单射,则称 f 是从 D 到
E 的一个双射 或称 D 和 E 之间是一一对应的映射
如果 f : D  → E 是双射的,则其逆映射 f −1 : D  → E 一定存

3
非线性系统控制理论

(2) 范数
考虑一个比欧氏空间更普遍的线性空间 X 若在上定义一个映射

:x 
→ R
x 
→ x
即对每一点 x ∈ X ,其象 x 是一个实数 如果该映射满足下列条件
(I) x ≥ 0, ∀x ∈ X
x =0 当且仅当x = 0 此式右端的0是X中的零元 )
(II) ax = a x , ∀x ∈ X , ∀a ∈ R
(III) x + y ≤ x + y , ∀x, y ∈ X
称这个映射 是 X 上的一个范数 称 x 是 x 的范数 当线性空间 X
具备了范数以后,就称 X 是一个赋范线性空间,通常用( X , ) 表示
在欧氏空间中可以用向量的模长 x :
x = x12 + x 22 + ...x n2
表示 x 的欧几里得范数,它显然满足上述的三个条件 两点 x , y 之间
的距离可以用范数来定义 即 在 空 间 Rn 中 , 任 何 两 点
x = ( x1 , x 2 ,...x n ) , y = ( y1 , y 2 ,... y n ) 间的距离就是 x y 的范数 x − y
因为 x − y = ( x1 − y1 ) 2 + ... + ( x n − y n ) 2
有了距离就能够正确表达收敛的概念 从而可以引进内点 外点
边界点 开集 闭集等一系列重要的概念
若在同一个线性空间上装备了两个范数 和 如果存在两个常
1 2

数 c >0, d >0,使 x 1 ≤ c x 2
x 2
≤d x1 ∀x ∈ X
就称范数 和 是等价的范数 如果赋范线性空间的两个范数
1 2

和 是等价的范数 那末在范数 的意义下的收敛性与在范数


1 2 1

意义下的收敛性也是相同的 对任一线性空间来说 如果它装备了


2

两个以上的范数 我们不能断定它们一定是等价的 但是对于欧氏空


间而言 可以证明任何两个范数都是等价的 因而不同范数意义下的
收敛性相互是一致的
(3) 连续映射
设 D 是 R n 中的一个开集 f 是从 D 到 R m 的一个映射, x0 ∈ D ,如
果对于任给的 ε > 0, 存在 δ > 0 ,对任何 x ∈ D 当 x − x0 < δ 时 有

4
非线性系统控制理论

f ( x) − f ( x0 ) < ε 就称映射 f 在点 x0 连续,要注意的是范数 x − x0 是


R n 上的欧氏范数,而 f ( x) − f ( x0 ) 是 R m 上的欧氏范数 因为欧氏空间
上范数的等价性 所以欧氏空间上映射的连续性也与欧氏空间上范数
的选取无关
由此观之 在欧氏空间或赋范线性空间中连续的概念与范数有关
为了将连续的概念拓广到更为一般的空间上去 我们用 开集 的概
念来表示连续的概念 即下列定理成立 证明从略
设 f :D → R , D 是 R 内的一个开集,那末 f 在 D 连续的充分
m n

必要条件是:对于 R m 内的任一开集V ,它的逆象


U = f −1 (V ) = {x ∈ D | f ( x) ∈ V }
是 R n 的一个开集
现在先用一元实函数的例子来说明一下 例如实数轴上的正弦函数
y = f ( x) = Sin( x) ,它是整个数轴上的连续函数 图 1-2 ,对于 y 轴上
的开区间V
y

U −2 U −1 0 U1 U2 U3
x

图 1-2
它的逆象是 x 轴上的开区间 U 1 , U 2 ,...U −1 , U − 2 ,... 之并,仍是 x 轴上的开
集 又如图 1-3 中所表示的函数 y = f (x) ,定义在区间 (a, b) 内,但在
−1
(a, b) 内不连续,对 y 轴上的开区间V ,它的逆象 f (V ) 却是 x 轴的一个
左闭右开的区间,因而不是开集

5
非线性系统控制理论

[ )
0 a b x

图 1-3
1.4 拓扑空间
(1) 定义 令 S 是一个集合,所谓拓扑或拓扑结构是指满足下列条件的
S 上的一个开子集族T :
(I) T 中任意多个元素的并仍属于T ;
(II) T 中有限多个元素的交仍属于T ;
(III) 集合 S 本身及空集 ∅ 也属于T ;
则称 ( S , T ) 为拓扑空间 有时简单的把 S 称为拓扑空间 T 称为 S 上
的一个拓扑, T 中的元素则为开集
若 T 中有一个子集 B ,使得 T 中的每个元素都可以由 B 中的若干元
素的并生成,则称 B 为一个拓扑基,当然 S 也由拓扑基的并生成 拓扑空
间在 P 点处的邻域是指包含 P 的任意开集 作为一个拓扑空间,它只装
备着满足三条性质的开集体系,因而太共性化了,显得不够细微 因而
引进一些公理,在这些公理的限制下 空间的性质可被描写的细致一

第一可数公理: 如果拓扑空间 ( S , T ) 内的每一个点 x ,存在可列个
开集 On (n = 1,2,...) ,使对任何一个含有 x 的开集 V ,{ On }中存在一个
On0 ⊂ V ,就称 ( S , T ) 满足第一可数公理 直观地说,在满足第一可数公
理的空间中,任意固定一点 x ,它的邻域可能会有不可列的无限多个,但
总可以选出可列无限多个就足以和那不可列的无限多个相当
第 二 可 数 公 理 设 (S , T ) 是 拓 扑 空 间 , 若 存 在 可 列 个 开 集
On (n = 1,2,...) 使得任何一个开集都可以表示为{ On } 中某些开集的并,
就称 ( S , T ) 满足第二可数公理 直观地说,在满足第二可数公理的空间
中,其开集可能是不可列无限多个,但总可以选出可列无限多个就足够

Hausdorff 公理:设 ( S , T ) 是拓扑空间,若 S 中的任意两点

6
非线性系统控制理论

Hausdorff 公理:设 ( S , T ) 是拓扑空间,若 S 中的任意两点 x , y ( x ≠ y ) ,


总存在两个开集 O x 和 O y , O x ∩ O y = ∅ ,且 x ∈ O x , y ∈ O y ,就称 ( S , T ) 满
足 Hausdorff 公理 又称 ( S , T ) 是 Hausdorff 空间
任 何 一 个 赋 范 线 性 空 间 都 是 Hausdorff 空 间 直 观 地 说 , 在
Hausdorff 空间中 任意两个不同点总可以找到两个不相交的邻域分别
包含这两点 即该空间的不同点是可以分离的
(2)关于拓扑空间的一些概念
设 ( X ,τ ) 是一个拓扑空间 E 是 X 的一个子集
收敛 若点列 {xn } ⊂ X ,点x ⊂ X 若对于含有 x 的任何一个开集 O
存 在 N 当 n > N 时 , 有 x n ∈ O , 则 称 {xn } 收 敛 , x n 收 敛 于 x , 记 为
xn 
→ x
内点 设 x ∈ E 若在一个含有 x 的开集 O , O ⊂ E ,就称 x 是 E 的一
个内点,显然开集内的每一个点都是它的内点
外点:设 x ∈ E ,若在一个含有 x 的开集 O , O ⊂ X − E 或者写为
O ∩ E = ∅ ,就称 x 是 E 的一个外点,显然 x ∉ E
边界点:设 x ∈ X ( x 可以属于 E ,也可以不属于 E ),如果对含有 x 的
任 何 开 集 O , O 中 既 有 E 的 点 , 又 有 非 E 的 点 , 即
O ∩ E ≠ ∅ , O ∩ ( X − E ) ≠ ∅ ,就称 x 是 E 的一个边界点, E 的所有边界
点组成 E 的边界
聚点 设 x ∈ X (不论 x 是否属于 E ),如果对含有 x 的任何开集
O , O - {x} 中必有 E 的点,即 O − {x}) ∩ E ≠ ∅ ,就称 x 是 E 的一个聚

闭集 如果 E 的补集 X − E 是 X 中的开集,就称 E 是闭集 即开集
的补集是闭集 闭集的补集是开集 X 和空集 ∅ 既是开集又是闭集
紧 集 设 { Oa } 是 E 的 一 个 开 覆 盖 ( 即 每 一 个 Oa 是 开 集 , 并 且
E ⊂ U Oa ),如果在{ Oa }中总可以选出有限个开集覆盖 E ,就称 E 是一
a

个紧集
邻域 在度量空间中应用了球形邻域的概念 对拓扑空间来说 直
接将开集作为邻域 即拓扑空间 X 的任一开集U 叫做它的每一个点
x ∈ U 的邻域,也叫做它的子集 A ⊂ U 的邻域
度量空间也可以作为拓扑空间,所以它的任一开集是其中任一点的
邻域,而原先的球形邻域只是它的一个点(球心)的球形邻域 所以拓扑
空间邻域的概念有更普遍的含义
__ __
闭包 记 E = EU {E 的所有聚点} 称 E 是 E 的闭包 例如实数轴

7
非线性系统控制理论

__
上带有通常的拓扑 E = (a, b), 则 E = [a, b]
拓扑子空间 设 ( X , τ ) 为拓扑空间 A 为 X 的非空子集,容易验证 A
的子集族 τ A = {O ∩ A | O ∈ τ } 是 A 上的一个拓扑 τ A 称为 X 的拓扑τ 在
A 上的诱导拓扑,拓扑空间 ( A,τ A ) 叫做 ( X ,τ ) 的拓扑子空间
1.5 连续映射与同胚
设 ( X ,τ x ) 和 (Y , τ y ) 是两个拓扑空间,它们可以是相同的,也可以是
不相同的 如果对每一点 x ∈ X ,通过关系 f 在 Y 内存在唯一的一点 y
与这个 x 对应,即 f 是从 X 到 Y 的映射,记为 f : X  → Y , 或
f : ( X ,τ x ) 
→(Y ,τ y ) ,称 y 是 x 在 f 作用下的象 x 是 y 的一个逆象
可记为 x  → y = f (x) 类似于欧氏空间的映射 也可以引进单射 满
射,和双射的概念
对于拓扑空间 我们是以 开集 来定义映射的连续性的
设 f : ( X ,τ x ) 
→(Y ,τ y ) 若对于Y 中任意一个开集V ,它的逆象
U = f −1 (V ) = {x ∈ X | f ( x) ∈ V }
是 X 中的开集,就称 f 是从 X 到Y 的一个连续映射 若 f 是从 X 到Y 的
双射(因此逆映射 f −1 在),同时 f 又是从 X 到 Y 的连续映射,且 f −1 (从
Y 到 X 的映射)也是连续映射 就称 f 是同胚映射 当两个拓扑空间之
间存在一个同胚映射时,就称这两个拓扑空间同胚
由此可知,如果两个空间是同胚的,则这两个空间之间不仅点与点
一一对应,而且开集与开集之间也一一对应,这表明它们有相同的拓扑
结构 从拓扑学的观点看,可以把同胚的两个拓扑空间看作是相同的
1.6 流形和微分流形
(1) 流形
先考虑两个例子
例 1 在 3 维欧氏空间 R 3 带有通常拓扑 中 上半球面
S = {( x, y, z ) ∈ R 3 | x 2 + y 2 + z 2 = 1, z > 0}
和开圆盘
D = {( x, y, z ) ∈ R 3 | z = 0, x 2 + y 2 < 1}
同胚 这是因为设映射 f : D  → S 是
x=x y = y , z = 1 − x2 − y2 ( x, y ) ∈ D
由上述定义可知 f 是从 D 到 S 的同胚映射 所以 D 和 S 是同胚,
而开圆盘 D 显然又和整个 2 维欧氏空间同胚,因此 S 和 R 2 同胚,从拓扑
学的观点来看 S 和 R 2 一样的

8
非线性系统控制理论

例2 设 S 是 R 3 中的一个球面, S = {( x, y, z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 } ,在
S 上装备着由 R 3 中通常拓扑诱导出来的拓扑,但 S 和例 1 的半球不同,
故我们来作一次手术,用 z = b 的平面将 S 剖成两片, S1 和 S 2 : 设 a
b>0
S1 是上半球 {( x, y , z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 , z > b} ,
S 2 是下半球罐 {( x, y , z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 , z < b}
z

y
0
x
z
N(0,0,a)

0
0 y

M'
(0,0,-a)

x π

S1 和 S 2 上的拓扑结构都是由 R 3 内通常拓扑诱导出来的,并且 S1 和 S 2
都是开集 它们覆盖了 S
由例 1 可知, S1 和平面上的一个开圆盘同胚,由右图中可见若点
N = (0,0, a ) 是球面 S 的北极,平面π 是球面 S 在南极 (0,0,− a ) 的切平面
通过 N 作射线穿过球罐 S 2 和平面 π ,交点分别是 M 和 M ' ,作映射
ϕ :M  → M ' ,在这一映射下,容易看出 S 2 和平面上的某个开圆盘同

可见 S 虽然不和平面上的任何一个开集同胚,但是它有两个开集 S1
和 S 2 组成的开覆盖,每一个开集都和平面上的某个开圆盘同胚 换句话
说,从整体来说 S 不和 R 2 内任何开集同胚 但 S 的每一个局部(开集)
都和 R 2 内某个开集同胚
将此情况加以抽象,就得到流形的概念
设 M 是一个拓扑空间,并且是第二可数的 Hausdorff 空间, {U a } 是
M的 开 覆 盖 如果对 每 一 个 开 集 U a ,联 系 着 一 个 映射

9
非线性系统控制理论

ϕa :U a 
→Va , Va 是 n 维欧氏空间内的一个非空开集,也可以不妨假
设它是 n 维开球或 n 维开矩形,并且 ϕ a 是同胚映射,即 U a 和 Va 是同胚
就称 M 是一个 n 维流形
由流形的定义可归纳成两点
(I) M 虽然不一定是欧氏空间,但是它可以”局部欧氏空间化”, M 的
每一个局部 U a 都和 R n 中的一个开集 Va 同胚,从拓扑学的观点看 U a 和
Va 相同
xn

Va
Va

P x
M
0 x2

x1
(II) M 内的点可能并没有坐标,但可以安装”局部坐标”,由于 U a 和 Va
同胚,它们的点与点一一对应,设点 P ∈ U a ,通过同胚映射 ϕ a ,点 P 映射
为 Va 中 的 点 x , 设 x = ( x1 , x 2 ,...x n ) , ( x1 , x 2 ,...x n ) 是 x 的 坐 标 , 就 把
( x1 , x 2 ,...x n ) 当作是 P 的局部坐标来表示点 P
所以从直观上概括地说所谓 n 维流形就是可以局部( n 维)欧几里得
空间化的一个拓扑空间,其中的点可以安装局部坐标
根据 Brouwer’s 的域的不变性原理,当 n ≠ m 时,一个 R n 的开子集U
与一个 R m 的开子集V 不可能构成同胚映射 所以流形的维数 n 是很重
要的,很确定的东西
流形不一定支持微分运算,但在实际应用中微分又是十分必需的,
所以就把能够支持微分运算的流形称为微分流形
(2) 微分流形
设 M 是一个 n 维流形,这表明 M 有一个开覆盖 {U a } ,并且每一个
U a 联系着一个映射 ϕ a : U a 
→Va , ϕ a 是同胚映射 如果 U α U β 都在
{U a } 内 并且 U α ∩ U β ≠ ∅ 设 P = U α ∩ U β 则在 ϕ a 的作用下将点 P
映射为 x = ( x1 , x 2 ,...x n ) ,在 ϕ β 的作用下将点 P 映射为 y = ( y1 , y 2 ,... y n )
同 一 点 P 既 可 以 用 坐 标 x = ( x1 , x 2 ,...x n ) 表 示 , 又 可 以 用 坐 标
y = ( y1 , y 2 ,... y n ) 表示,于是这两个坐标之间有一个坐标变换式,即

10
非线性系统控制理论

ϕ β ⋅ ϕ α−1 : ϕ α (U α ∩ U β ) 
→ ϕ β (U α ∩ U β )
x = ( x1 , x 2 ,...x n ) 
→ y = ( y1 , y 2 ,... y n )
即 ϕ β ⋅ ϕ α−1 是定义了 R n 上两个开集间的一个同胚映射 这实际上就
是两个欧氏空间中的局部坐标变换

Uβ y2
PPP
υα
U ϕβ
x2 α
ϕα
y = ( y1 , y2 ,... yn )
ϕβ ⋅ϕα
−1

x = ( x1 , x2 ,...xn )
0 y1

0 x1
如果它是可微的 并且其逆映射 ϕ α ⋅ ϕ β−1 : y 
→ x 也是可微的 就
称 M 是 n 维微分流形 具体一点说就是
y = ϕ β ⋅ ϕ α−1 ( x)
x = ϕ α ⋅ ϕ β−1 ( y )
当这个映射及其逆映射的所有阶数 ≤ k 的偏导数均存在且连续时,
则称 (U α , ϕα ) 与 (U β , ϕ β ) 是 C k 级的 或 C k 可比较的 或相容的 则
若它们是无穷次可微的 则称是 C ∞ 可比较的 一个 R n  → R n 的映
射 如果它具有局部收敛的台劳级数展开式 则称为解析映射 解
析映射显然是一个 C ∞ 映射 但反之未必成立 解析映射记为 C ω
若一个 n 维微分流形,对一切的 U α ∩ U β ≠ ∅ 的 α 和 β 可微映射
ϕ β ⋅ ϕ α−1 ∈ C k (1 ≤ k ≤ ∞) 就称 M 是 n 维 C k 微分流形 当 k = ∞ 时就称
为 C 流形或光滑流形 当它们是 C 可比较时 则称 M 为 n 维 C ω 流形
∞ ω

或解析流形
对一个微分流形 M 的子集 U a ,我们又可称它为坐标邻域 ϕα 是坐
标映射 (U α , ϕα ) 称为坐标卡或坐标图 所有的{ (U α , ϕα ) }组成 M 的坐
标图册 这好比用一本地图册来表示地球表面上的地理疆界一样 地
球表面近似是球面 整体上它不和平面上的任何开矩形同胚 但可以
把整个地球表面用有限个开集来覆盖 每一个开集是可以与开矩形同
胚的 即同胚于地图册上的一页图 这样一本地图册就足以表现全世
界所有的地理疆界

11
非线性系统控制理论

所以粗略地说 流形可以看成是由许多块同胚于欧氏空间的开集的
片粘起来的几何体 若粘得光滑 则可以支持微分运算 就构成微分
流形
1.7 可微映射
先来回顾一下二元实函数的可微性
若 D 是 R 2 中的一个开集,点 P ( x0 , y 0 ) ∈ D ,映射 f : D 
→ R ,实际
上表示了一种函数关系: f ( P) = f ( x, y ), f ( P0 ) = f ( x0 , y 0 )
若在 P0 点可微,则有
∂f ( x, y ) ∂f ( x, y )
f ( x, y ) − f ( x 0 − y 0 ) = | ( x0 , y ) ( x − x 0 ) + | ( x0 , y ) ( y − y 0 ) + γ ( P, P0 )
∂x 0
∂y 0

= A( P0 )( x − x0 ) + B ( P0 )( y − y 0 ) + γ ( P, P0 )
其中 A( P0 ) , B( P0 ) 是仅与 P0 点有关而与 P 无关的常值,它们分别是
函数在 P0 的对 x 及 y 的偏导数
γ ( P, P0 )
γ 满足 lim =0
P − P → 0 P − P0
0

 x − x0 
可写成 f ( x, y ) − f ( x 0 , y 0 ) = [ A( P0 ) B ( P0 )]  + γ ( P, P0 )
 y − y0 
其中 [ A( P0 ) B( P0 )] 是 1× 2 的矩阵 记为 l P0
 x − x0 
 y − y  表示 R 中的一个点 P − P0
2

 0

因而上式变成 f ( P) − f ( P0 ) = l p0 ( P − P0 ) + γ ( P, P0 )
其中 l p0 ( P − P0 ) 可以看成是一个线性变换作用在 ( P − P0 ) 上 若 P 点
是 R n 上的点 f (⋅) 也可以是在 R m 上的向量函数 则上述式子可加以拓
广
设 D 是 R n 中的开集, x0 是 D 内的一点, T 是 R m 中的开集,映射
f :D
→ T ,如果存在一个与 x0 有关,而与 x 无关的,从 R n 到 R m 的线
性变换 l x0 使得对 D 内任何 x 有
f ( x ) − f ( x 0 ) = l x 0 ( x − x0 ) + γ ( x , x0 )
γ ( x, x 0 )
且 γ ( x, x0 ) 满足 lim =0
x − x0 → 0 x − x 0

则称映射 f 在点 x0 可微
称线性变换 l x0 是 f 在 x0 的导数记为 f / ( x0 ) 如果映射 f 在 D 内的

12
非线性系统控制理论

每一点可微 就称 f 在 D 内可微 又称 f 是 D 内的可微映射


1.8 流形上的可微函数
设 M 是 n 维 C ∞ 流形 坐标册是 {(U d , ϕ d )} G 是 M 中的一个开集
P ∈ G 则映射 f : G  → R 表示了某一函数关系 因为流形是 局部
欧几里得化 的
考察 f o ϕ d−1 它是定义在 ϕ d (G ∩ U d ) 上的函数 由于 ϕ d (G ∩ U d ) 是
R n 内的一个开集 因此 f o ϕ d−1 是 n 元的实函数
ϕ d (υ d )
R n (x)

M
G ϕd ϕ d (P)
υd P

f ⋅ϕ −1
d

f
R

设 x = ϕ d ( P), x = ( x1 , x2 ...xn ) 是 P 的局部坐标 如果 f o ϕ d−1 在 x 处可


微 就称 f 在点 P 处可微 因为 U d 与 ϕ d (U d ) 是同胚的 如果 f 在每一
个点 P ∈ G 可微 称 f 在 G 上可微
现在会产生一个问题 如果 P ∈ G ∩ U d 同时 P ∈ G ∩ U a 则利用
坐标卡 (U d , ϕ d ) 说明了 f 在 P 可微 即 f o ϕ d−1 在 x 处可微 则在坐标卡
(U a , ϕ a ) 内 设 y = ϕ a (P )) f o ϕ d−1 在点 y 处 是否也可微 即可微性是
否与局部坐标的选取无关
实际上 因为 f o ϕ d−1 = f o ϕ d−1 (ϕ d ⋅ ϕ a−1 ) f ⋅ ϕ d−1 在 x 处可微 即 f (P)
在 P 点可微 因而 f ⋅ ϕ a−1 在点 y 处也可微 因为它们是同胚的关系 所
以可微性与局部坐标的选取无关
若 M 1 与 M 2 分 别 是 n1 维 和 n2 维 的 光 滑 的 微 分 流 形 又 映 射
→ M 2 则任取点 P ∈ M 1 的坐标卡 (U , ϕ ) 又 F ( P) ∈ M 2 的坐
F : M1 
标卡 (V ,ψ ) 于是两个坐标卡之间的关系可表示为

F = ψ ⋅ F ⋅ ϕ −1

即 F : ϕ (U ) ⊂ R n1 
→ψ (V ) ⊂ R n2

或 F : y ( x) 因为 x y 都是欧氏空间的坐标

13
非线性系统控制理论

M1 F M2 n2
P F(P)
ψ
y = ( y1 , y2 ,... yn )

n1 ϕ
ψ ⋅ F ⋅ ϕ −1
x = ( x1 , x2 ,...xn )

所以具体来说就是
y1 = y1 ( x1 ,..., x n1 )
y 2 = y 2 ( x1 ,..., x n1 )
.
.
.
y n2 = y n2 ( x1 ,..., x n1 )
当它们是可微映射时 则定义

 ∂y1 ∂y1 
 ∂x ... ...
∂x n1 
 1 
 ∂y 2 ... ... ∂y 2 
J F =  ∂x1 ∂x n1 
 
 . . 
 ∂y n2 ∂y n2 
 
 ∂x1 ∂x n1 
为映射 F 的 Jacobian 阵
显然,当 M 1 与 M 2 是微分同胚时,则根据前述的秩定理,流形 M 1 与
M 2 的维数又应当相等 此时 J F 是一个方阵 而且应当是非奇异的 当
J F 只在某个邻域内是非奇异的 就表明 M 1 与 M 2 只是在这些邻域内是
局部微分同胚的 于是在微分流形上 两个局部坐标之间的变换有时
也就叫做微分同胚
1.9 切向量和切空间
现在要把 R 3 中光滑曲线的切线和光滑曲面的切平面的概念拓广到
微分流形上 先分析一个简单的情形 求平面上光滑曲线的切线 设 l
是平面上的一条光滑曲线 其方程为 y = f ( x), P = ( x0 , y 0 ) 是 l 上的一

14
非线性系统控制理论

点 求曲线在点 P 处的切线 实际上求切线与求导数是密切相关的


df
因为函数在 x0 处的导数 | x 就是曲线 y = f (x) 在点 P 处切线的斜率
dx 0
它表示切线的方向 有了切线的方向 再用解析几何的知识 切线的
d
方程就可以容易得出 现在我们把 | x0 看作一个映射 它作用在函数
dx
d
f 上就获得一个实数 f | x0 这个实数就是曲线 y = f (x) 在点 P 的切
dx
线的斜率
更抽象一点来说 设 Fx0 是所有在点 x0 可微的函数组成的空间 若
带有通常的函数 相加 数乘 和 乘 的运算 表示为
( f + g )( x) = f ( x) + g ( x)
(αf )( x) = αf ( x)
( fg )( x) = f ( x) g ( x)
作映射 即在点 x0 求导
d
| x : Fx0  → R
dx 0
d
f  → f | x0
dx
则由求导法则可知 它满足以下性质
d d d
(I) 线性 ( f + g ) | x0 = f | x0 + g | x 0
dx dx dx
d d
(αf ) | x0 = α f | x0 α 是实数
dx dx
(II) 莱布尼兹 Leibniz 法则
d d d
( fg ) | x0 = f ( x0 ) ⋅ g | x0 + g ( x0 ) ⋅ f | x0
dx dx dx
若反过来 有一个映射 ϕ : Fx0  → R
满足 (I ϕ ( f + g) = ϕ ( f ) + ϕ (g)
线性
ϕ (αf ) = αϕ ( f )
(II 莱布尼兹法则
ϕ ( fg ) = f ( x0 ) ⋅ ϕ ( g ) + g ( x0 ) ⋅ ϕ ( f )
那末这个 ϕ 是否一定是求导 回答是肯定的 因为对任何 f ∈ Fx 0

总可以将它表示为:
f ( x) = f ( x0 ) + ( x − x0 ) ⋅ g ( x)
其中

15
非线性系统控制理论

 f ( x) − f ( x0 )
 , x ≠ x0
g ( x) =  x − x 0

 d f | x , x = x0
 dx 0

由 ϕ 的性质,可得:
ϕ ( f ) = ϕ ( f ( x0 )) + ( x0 − x0 ) ⋅ ϕ ( g ) + ϕ ( x − x0 ) ⋅ g ( x0 )
= ϕ ( f ( x 0 )) + ϕ ( x) ⋅ g ( x0 ) − ϕ ( x0 ) ⋅ g ( x 0 )
又由莱布尼兹法则,对常数 1:
ϕ (1) = ϕ (1 ⋅ 1) = ϕ (1) + ϕ (1) = 2ϕ (1)
所以可得 ϕ (1) = 0 ,因而对任何常数 C ,有:
ϕ (C ) = C ⋅ ϕ (1) = 0
代入 ϕ ( f ) 有
d
ϕ ( f ) = ϕ ( x) ⋅ g ( x0 ) = ϕ ( x) ⋅ f | x0
dx
由于 ϕ (x) 是与 f 无关的量,它只与 ϕ 有关,因而记为 α ,所以
d
ϕ ( f ) = α ⋅ f | x0
dx
d
这表明映射 ϕ 作用在任何 f ∈ Fx0 上,等于求导数 α ⋅ | x0 作用在 f 上,
dx
d
即 ϕ ≡ α ⋅ | x0
dx
α 是一个只与 ϕ 有关,而与 f 无关的常数,这又说明所有这种 ϕ 组成一
d
个 1 维的线性空间,基是 | x0 ,每一个这样的 ϕ 作用在 f ∈ Fx0 上,便得
dx
到曲线 y = f (x) 在点 ( x 0 , f ( x0 )) 的切线方向,故称 ϕ 是切向量 通常我们
把向量看成是有方向和大小的量 现在把映射 ϕ 称为切向量可能很难理
解 其实把切向量看作是映射会更有力也更自然的 例如我们把金子
看作是一种财富 但 炼金术 也是财富 映射就是 炼金术 把它
作用在任何可微函数上就得到一个切向量 因而直接把 ϕ 作为切向量是
很自然的 正如你愿意背一大筐金子呢 还是愿意掌握 炼金术
现在将这一基本思想用到微分流形上 设 M 是 n 维 C ∞ 流形
P ∈ M 又设 FP 是所有在 P 点附近有定义且在 P 可微的函数组成的空
间 且有以下的 加 数乘 和 乘 的运算
( f + g )( P ' ) = f ( P ' ) + g ( P ' )
(αf )( P ' ) = αf ( P ' )
( fg )( P ' ) = f ( P ' ) g ( P ' )

16
非线性系统控制理论

设映射ϕ : FP 
→ R 满足
(I) 线性: ϕ ( f + g) = ϕ ( f ) + ϕ (g)
ϕ (αf ) = αϕ ( f )
(II) 莱布尼兹法则:
ϕ ( fg ) = f ( P) ⋅ ϕ ( g ) + g ( P) ⋅ ϕ ( f )
就称 ϕ 是 M 在 P 点的一个切向量,所有这种 ϕ 组成的空间就称为
M 在点 P 的切空间,记为TP ,其中的”加”和”数乘”是:对任何 f ∈ FP ,任
何ϕ 1 ,ϕ 2 ∈ TP ,以及任何实数α 均成立:
(ϕ 1 + ϕ 2 )( f ) = ϕ 1 ( f ) + ϕ 2 ( f )
ϕ 1 (αf ) = αϕ 1 ( f )
具有上述性质后,TP 是一个线性空间 那末ϕ 具有什么样的形式
TP 的基又是什么
定理 切空间 TP 是 n 维线性空间 在给定的坐标系 ( x1 , x 2 ,...x n ) 下 它
∂ ∂
的基是 | x0 ,..., | x 其中 x0 = ( x1o , x 2o ,..., x no ) 它是点 P 的局部坐
∂x1 ∂x n 0

标 每一个切向量ϕ 都可以用 | x ( j = 1,2,..., n) 的线性组合表示出来
∂x j 0
∂ ∂
ϕ = α1
| x0 +... + α n |x
∂x1 ∂x n 0
证明 设 (U α , ϕ α ) 是坐标卡 P ∈ U α 对任何 f ∈ FP f 在点 P 可微
−1 −1
即 f o ϕ 在 x0 处可微 为记号的简便起见 我们把 f o ϕ 仍旧记为 f
α α

将 f 展开
n
f ( x) = f ( x0 ) + ∑ ( xi − xio ) g i ( x)
i =1

其中 g i 在点 x0 的值是 g i ( x0 ) = f | x0 切向量ϕ 作用于 f 得
∂xi
n n
ϕ ( f ) = ϕ ( f ( x0 )) + ∑ ( xi0 − xi0 ) ⋅ ϕ ( g i ) + ∑ ϕ ( xi − xi0 ) g i ( x0 )
i =1 i =1
n n
= ϕ ( f ( x0 )) + ∑ ϕ ( xi ) g i ( x0 ) − ∑ ϕ ( xi0 ) g i ( x0 )
i =1 i =1

由莱布尼兹法则
ϕ (1) = ϕ (1 ⋅ 1) = ϕ (1) + ϕ (1)
所以ϕ (1) = 0 从而对任何常数 C
ϕ (C ) = 0

17
非线性系统控制理论

n
∂ n
ϕ ( f ) = ∑ ϕ ( xi ) g i ( x0 ) = ∑ ϕ ( xi )
f | x0
i =1 i =1 ∂xi
记 ϕ i = ϕ ( xi )(i = 1,2,...n) ϕ i 与 f 无关 它们是由ϕ 确定的 则对任
何 f ∈ FP
n

ϕ ( f ) = ∑α i ⋅ f | x0
i =1 ∂xi
n

即 ϕ = ∑α i ⋅ |x
i =1 ∂xi 0

这即表明切向量 ϕ 是 | x (i = 1,2,..., n) 的 线 性 组 合 而 每 一 个
∂xi 0
∂ ∂
| x0 都满足线性和莱布尼兹法则的 因此 | x 即是一个切向量
∂xi ∂xi 0
∂ ∂
再证明 | x0 ,..., |x 线 性 无 关 现假设存在一组实数
∂x1 ∂x n 0
C1 , C 2 ,..., C n 使
∂ ∂ ∂
C1 | x0 + C 2 | x0 +... + C n |x = 0
∂x1 ∂x 2 ∂x n 0
将 它 作 用 在 函 数 xi 上 即 可 得 C i = 0(i = 1,2,..., n) 所以
∂ ∂
| x0 ,..., | x 应线性无关 因而它是切向量的基 从而定理得证
∂x1 ∂x n 0

18
非线性系统控制理论

第二章 李导数李括号运算与分布
为了尽快的涉及非线性系统的几何理论 我们将以较短的篇幅介绍
李导数的概念与李括号运算
2.1 向量场
若 f (x) 是 n 维函数向量,即
 f 1 ( x1 ,..., x n ) 
 f ( x ,..., x ) 
 2 1 n 

 . 
f ( x) =  
 . 
 . 
 
 f n ( x1 ,..., x n )
它的每一个分量 f i (x) 都是变量 x = ( x1 ,...., x n ) T 的函数 从几何观点
看 即是对状态空间中每一个点 对应一个状态 对应一个确定的向
量 即映射 f : R n 
→ R n 即可以想象从每一个点 x 发射 出一个
向量 因而从整体上看形成一个由向量构成的场
2.2 李导数
给定一个光滑的标量函数 h(x) 和一个向量场 f (x) ,则可以定义标量
函数沿向量场的导数称为李导数,或称为 h对f 的李导数 它是一个新的
标量函数记为 L f h
设 h( x ) : R n 
→ R 为一光滑标量函数;
f ( x) : R 
n
→ R n 为 R n 上的一个光滑的向量场;
g ( x) : R n → R n 为 R n 上的另一个光滑的向量场;

∂h( x) ∂h( x) ∂h( x) ∂h( x)
L f h( x ) = ⋅ f ( x) = ( , ,..., ) ⋅ f ( x)
∂x ∂x1 ∂x 2 ∂x n
n
∂h( x)
= dh( x) ⋅ f ( x) = ∑ ⋅ f i ( x) 或记为 ∇h( x) ⋅ f ( x)
i =1 ∂x i
n
∂h( x)
同理有: L g h( x) = ∇h( x) ⋅ g ( x) = dh( x) ⋅ g ( x) = ∑ ⋅ g i ( x) = ...
i =1 ∂xi
多重李导数可以递归地定义为:
k −1
∂ ( Lkf−1 h( x))
L h( x) = L f ( L h( x)) =
k
⋅ f ( x)
∂x
f f

19
非线性系统控制理论

∂ ( L f h( x))
L g L f h( x) = L g ( L f h( x)) = ⋅ g ( x)
∂x
∂ ( L f h( x))
k

L g Lkf h( x) = L g ( Lkf h( x)) = ⋅ g ( x)


∂x
又定义: L0f h( x) = h( x) 同理 L0g h( x) = h( x)
上标”0”意味着不求导 因为 L f h( x) = L f ( L0f h( x)) 适合递归式子
2.3 李括号运算
若 f (x) 与 g (x) 为 R n 上的两个向量场,两同维的向量 f (x) , g (x) 的李
括号运算定义为:
∂g ∂f
[ f , g ]( x) = ⋅ f − ⋅ g = ∇ g ⋅ f − ∇f ⋅ g
∂x ∂x
或记为 ad f g ,它是一个新的向量场
 ∂g1 ∂g1 ∂g1 
 ∂x . .
∂x 2 ∂x n 
 1 
 ∂g 2 ∂g 2
. .
∂g 2 
∂g  ∂x1 ∂x 2 ∂x n 
=
∂x  . . . 

 . . . 
 ∂g n ∂g n ∂g n 
 . . 
 ∂x1 ∂x 2 ∂x n  n×n矩阵
∂f
同理可知 也是一个 n × n 的矩阵 它们分别称为流形映射到 g 和 f 的
∂x
Jacobian 阵
李括号运算也可以多次重复进行 例如
[ f , [ f , g ]],..., [ f [ f ,...[ f , g ]]]
或 ad f (ad f g ),..., ad f (ad f ...(ad f g )) 也可采用递归记法:
ad kf g ( x) = [ f , ad kf −1 g ]( x) k ≥1
当 k = 1时 ad f g ( x) = [ f , ad g ( x)]( x) = [ f , g ]( x)
0
f

因而可以定义: ad 0f g ( x) = g ( x)
2.4 李括号运算具有下列性质
(1) 在 R 域上是双线性的,即若 f1 , f 2 , g1 , g 2 是向量场,且 r1 , r2 是实数,
则有: [r1 f1 + r2 f 2 , g1 ] = r1 [ f 1 , g1 ] + r2 [ f 2 , g 1 ]
[ f1 , r1 g1 + r2 g 2 ] = r1 [ f1 , g 1 ] + r2 [ f1 , g 2 ]
(2) 是斜可交换的,即:

20
非线性系统控制理论

[ f , g ] = −[ g , f ]
(3) 满足 Jacobian 恒等式,即若 f , g , p 是向量场,则
[ f , [ g , p]] + [ g , [ p, f ]] + [ p, [ f , g ]] = 0
2.5 协向量场的微分运算
对于一个向量场 f ,常常采用与其对偶的协向量场 ω ,两者都定义
在 Rn 的 开 集 V 上 , 但 f 是 列 向 量 场 , 而 ω 是 行 向 量 场 , 即
ω ( x) = [ω1 ( x), ω 2 ( x),..., ω n ( x)] 它是 R n 空间的对偶空间 记为 ( R n ) *
定义一种新的运算 称为协向量场 ω 沿向量场 f 的李导数 即
T
∆  ∂ω T  ∂f
L f ω ( x) = d ω , f =  ⋅ f  + ω ( x) ⋅
 ∂x  ∂x
T
 ∂ω T  ∂f
= f   + ω ( x) ⋅
T

 ∂x  ∂x
其中上标"T "表示转置
以上三种运算可以统一起来统称为李导数 只是
L f h(x) 是指光滑标量函数沿向量场的李导数 得到的仍是一个标量
函数
ad f g (x) 是光滑的向量场沿向量场的李导数 得到的是一个新的向
量场
L f ω (x) 是协向量场沿向量场的李导数 得到的是一个新的协向量

这三种李导数有下列关系
L f ω , g = L f ω , g + ω ,[ f , g ]
其中 f , g 表示向量场 ω 表示协向量场 •,• 表示内积
2.6 运算法则
以上三种李导数运算,经过简单的推导 可以得到下列运算规则:
(1) 如果 f 是一个向量场, α , λ 为实值函数,则
Lαf λ ( x) = ( L f λ ( x))α ( x)
(2) 若 f , g 是向量场, α , β 是实值函数,则
[αf , βg ]( x) = α ( x) β ( x)[ f , g ]( x) + ( L f β ( x))α ( x) g ( x) − ( L g α ( x)) β ( x) f ( x)
(3) 若 f , g 是向量场, λ 是实值函数,则
L[ f , g ] λ ( x) = L f Lg λ ( x) − Lg L f λ ( x)
(4) 若 f 是向量场, ω 是协向量场, α , β 是实值函数,.则
Lαf βω ( x) = α ( x) β ( x)( L f ω ( x)) + β ( x) ω ( x), f ( x) dα ( x)

21
非线性系统控制理论

+ ( L f β ( x))α ( x)ω ( x)
若 f 是向量场, λ 是实值函数,则
L f dλ ( x) = dL f λ ( x)
(5) 若 f , g 是向量场, ω 是协向量场,则
L f ω , g ( x) = L f ω ( x), g ( x) + ω ( x), [ f , g ]( x)
此式即上述已提到的三种李导数之间的关系

2.7 分布 Distributions
(1)分布的意义
定义在 R n 开集U 上的光滑向量场 f 可以直观地看作是一种光滑映
射 即对于U 上每一点 x 赋以 n 维光滑向量 f (x) 现在假设定义在同
样的开集U 上有 d 个光滑的向量场 f 1 , , fd 并且注意到在 U中任意
给定的点 x 向量 f 1( x) , , fd ( x) 张成了一个向量空间 该向量空间
是 fi (x) 内被定义的那个向量空间 即 R n 的子空间
即有
∆(x ) =span { f 1( x), K , fd ( x)}
若 f1 ( x) , , f d (x) 是光滑的 则对开集U R n 上的每一点 x 来说
子空间由某些光滑的向量场来张成 于是称它为光滑分布
所以分布是在某种意义下的子空间的集合 也是向量场的集合
记为
=span { f 1, K, fd }
要注意 记分布整体 而记 ∆(x ) 记 在 x 点上的 值 即某一个子空

从分布是一个向量空间 一个 R n 的子空间的观点出发 则可列出分布
的一些特性
(2)分布的一些特性
如果 ∆1 和 ∆ 2 是分布 则 ∆1 +∆ 2 也是分布 称为分布的和 即
若 ∆ 1 ( x) = span { f 1( x), K , fd ( x)}
∆ 2 ( x) = span {g 1( x), K, ge( x)}
当 x 指定时 上两式均表示子空间
因此 (∆1 + ∆ 2 )( x ) =span { f 1 x , K , fd  x , g 1 x , K , ge x } 也
表示某子空间
故 ∆ = ∆1 + ∆ 2 = span{ f 1, L , fd , g1 , L, g e }
同理若 ∆1 和 ∆ 2 是分布 则 ∆1 I ∆ 2 也是分布 称为分布的交

22
非线性系统控制理论

即由下式确定
(∆1 I ∆ 2 )(x ) =∆1 x  I ∆ 2 x 
包容 若对所有 x ,有 ∆1( x ) ⊃ ∆ 2( x ) 记为 ∆1 ⊃ ∆ 2 称为 ∆1 包容 ∆ 2
所以若对所有 x f ( x ) ∈ ∆( x ) ,则称向量场 f 属于分布 ∆ 记 f ∈ ∆
若一个矩阵 F 它具有 n 行 每一行的各项均是 x 的光滑函数,
则它的每一列就可看成是光滑的向量场 这种矩阵就可表示成由它的
列张成的光滑分布 其在每一点 x 上的 值 就是矩阵 F 在 x 点上的
象 即
∆(x ) =Im(F ( x ))
分布在点 x 处的维数就是 ∆(x ) 子空间的维数 显然若分布被看成
是某矩阵 F 的列所张成的子空间的集合 则分布在点 x 处的维数就是矩
阵 F (x ) 的秩
若一个分布它在U 中任何 x 上的维数不变 即
dim(∆( x )) =const x ∈U
则称分布是非奇异的 否则称变维分布
若在某点 x 0 处及其 x 0 的邻域U 0 上分布是非奇异的 则称 x 0 为正则
点 否则称奇异点
两个光滑分布的和仍是光滑分布 而两个光滑分布的交不一定
是光滑的
可由反例说明
1 1 + x1  
若 ∆1 =span   ∆ 2 =span  
1 1 
则 (∆1 I ∆ 2 )(x ) = {0} 若 x1 ≠ 0

(∆1 I ∆ 2 )(x ) =∆1(x ) = ∆ 2(x ) = span  若 x1 = 0 所 以


1
1
∆1与∆ 2 的交是不光滑的 因为不可能在 R 2 上找到一个光滑的向量场
它除了 x1 = 0 的线上不为零之外 其余各处均为零
3 对合分布
定义 若 τ 1 和 τ 2 是属于分布 ∆ 的任意两个向量场 且由 τ 1 和 τ 2
构成的李括号 [τ 1 , τ 2 ] 所得到的向量场仍然属于分布 ∆ 则这样的分布
∆ 称为对合分布
即 当且仅当 τ 1 ∈ ∆ τ 2 ∈ ∆ ⇒ [τ 1 τ 2 ] ∈ ∆
称 为对合分布
判别对合分布的方法
考虑非奇异分布 ∆ 则 ∆ 中的任意两个向量场 τ 1 τ 2 ∈ ∆ 均可

23
非线性系统控制理论

表示成
d
τ 1 ( x) =∑ ci ( x) fi ( x)
i =1
d
τ 2 ( x) =∑ di ( x) fi ( x)
i =1

其中 ∆( x ) = span{ f 1(x ), K, fd ( x )}
则可容易推导得
[τ 1 ,τ 2 ](x ) ∈ ∆ 等价于
[ fi, fj ](x ) ∈ ∆ 对所有 1 i ,j d
所以有 当且仅当 [ fi, fj ]( x ) ∈ ∆ 对所有 1 i ,j d 分布 ∆ 是对合

因此实际上只要证明对非奇异分布
rank [ f 1( x ), K , fd ( x )] = rank [ f 1( x ), K , fd ( x ), [ fi, fj ]( x )]
对所有 x和所有 1 i ,j d 成立
一些推论
一维分布总是对合分布
因为 ∆ = span{ f }, f 是非零向量场

则由 [ f , f ] =∂f ⋅ f − ∂f ⋅ f =0
∂x ∂x
因而 rank { f } = 1
rank { f , [ f , f ]} = rank { f ,0} = 1
rank { f } = rank { f , [ f , f ]} = 1
故结论得证
二维分布不一定是对合的
考虑在 R 3 空间中的二维分布
∆ = span{ f 1, f 2}
2 x 2 1

f 1( x) = 1  ,  f 2( x) = 0 
 0   x 2 
∂f 2 ∂f 1
由于 [ f 1, f 2] = ⋅ f 1 ⋅ f2
∂x ∂x
0 0 0  2 x 2  0 2 0   1  0 
=0 0 0  1  0 0 0  0  =0
    
0 1 0  0  0 0 0  x 2  1

24
非线性系统控制理论

所以有 rank { f 1, f 2} =2
 2 x 2 1 0
rank { f 1, f 2 [ f 1, f 2]} =rank  1 0 0 =3
 0 x 2 1
因而该分布不是对合的
两个对合分布的和不一定是对合的 可由上面的例子说明 因为
一维分布是对合的 但两个一维分布的和不一定对合 但两个对
合分布的交仍是对合分布
对偶分布 协分布
在很多情况下 为了应用的方便起见 常常采用所谓对偶分布或
协分布
上面提到分布 ∆ 是用列向量场来定义的
而对偶分布是用其对偶物行向量场来定义的 所以对于某一给定
的点 x 协分布是对偶空间 R n 的一个子空间 ( ) ∗

若 ω 1, ω 2, K, ωd 表示一组行向量场 即协向量场 则协分布表示为


Ω = span{ω 1, K , ωd }
对于U 中给定的点 x 协分布是 R n 中的一个子空间 记为 ( )∗

Ω( x ) = span{ω 1( x ),L , ωd (x )}
所以如果给定一个分布 ∆ 则对于U 中的每一个点 x 有 ∆(x ) 它
是 R 的子空间 ∆(x ) 的所有零化向量的集合构成了对偶空间特定的子
n

空间 即它是 ∆(x ) 的正交补 ( ) ∗


是 R n 的子空间 即可用式子表示成
( )
∆⊥ ( x ) = { ω ∗ ∈ R n

ω∗, υ 0 对所有 υ ∈ ∆( x ) }
∆ ( x ) 也称为 (x)的零化子

式中 ω ∗ , υ 表示行向量 *与列向量 的内积


类似的 若给定一个协分布 则协分布 的正交补 可表示成
Ω (x ) = { v ∈ R
⊥ n
ω ,υ

0 对所有 ω ∈ Ω( x ) }

要注意的是由此构成的协分布可能失掉光滑性 即原分布是光滑
的 而其正交补不一定保证也是光滑的
2.8 Frobenius 定理
考虑偏微分方程 x ∈ R n ( )
∂λj  x  ∂λj  x 
[ f 1(x ),L, fd (x )] =   F (x ) = 0
∂x ∂x
其中 1 j n−d

25
非线性系统控制理论

λj ( x ) 是需要求解的未知函数
f 1( x ), L , fd ( x ) 是已知向量场
∂λj ( x )
所以 是未知函数的偏导数 是一个行向量 现在要问此偏
∂x
微分方程是否有解
以上问题如果用几何的观点来叙述 则表示如下
一个非奇异的 d 维分布 ∆
∆ = span{ f 1, L , fd } 定义在 R n 的开集U 上 对于U 上
的每一点 x 0 及其邻域U 0 f 1( x ),L , fd ( x ) 是定义在U 0 上的光滑向量
场 如果在U 0 上定义的 (n − d ) 个实光滑函数 λ 1( x ), λ 2( x ), L λn − d ( x )
能使 span{dλ 1, dλ 2 L , dλn − d }=∆⊥ 那末就称这个分布 ∆ 是完全可积
的 或者具体一点说就是矩阵 F (x ) 的列所张成的分布是完全可积
的 现在的问题是在什么条件下分布 ∆ 是完全可积的
Frobenius 定理 一个分布当且仅当它是对合的 则是完全可积的
该定理的证明应分两部分 即需证明条件的必要性与充分性
必要性 即若这样的解 λj 存在 即 ∆ 是完全可积的 来推导
出 ∆ 是对合的
即 若已知 span{dλ 1, dλ 2 L , dλn − d }=∆⊥
∂λj ( x )
则有 ⋅ fi ( x ) = dλj , fi = 0
∂x
x ∈U 0 , 1 j n − d 1 i d
采用李导数记号 即 Lf λj  x  = 0 i

再由李括号运算法则可得
L[ fi , fk ]λj ( x ) = LfiLfkλj (x ) − LfkLfiλj  x  = 0
由于上式中的两项为零
故有 dλj , [ fi, fk ] = L[ fi , fk ]λj ( x ) = 0
则构造
 L[ fi , fk ]λ 1( x )   dλ 1 
 L[ fi , fk ]λ 2( x )   dλ 2 
  =  ⋅ [ fi , f k ] = 0
 M   M 
   
 L[ fi , fk ]λn − d ( x ) dλn − d 
因为已知 span{dλ 1, dλ 2 L , dλn − d }=∆⊥
所以所有 [ fi, fk ] 一定是 ∆ 中的一个向量 根据对合分布的判别
法则可知 ∆ 是对合的

26
非线性系统控制理论

充分性 充分性可以从构造上来证明 即若条件满足,偏微分方


程的 n − d 个独立函数是如何一定能被构造出来的 因为分布
∆ = span{ f 1, L , fd }对应的子空间 ∆(x) 是非奇异的 且其维数为 d
于是总可以找到另外的同样定义在开集 U 0 上的向量场集合
它是原来 ∆(x) 向量场集合的补集 即在每一点 x ∈ U ,
0
f d +1 ,L f n
有 span{ f 1 ( x),L f d ( x), f d +1 ( x),L f n ( x)} = R n
并假设向量场中的函数均是光滑的 再 令 φt f ( x 0 ) 是 常 微 分 方 程
x& = f (x) 在 x(0) = x 0 初始条件下的解 即 x(t ) = φ t f ( x 0 ) 它是 x 和 t 的

光滑函数 换句话说 它满足 φ t f ( x) = f (φ t f ( x)) φ 0f ( x) = x φ t f ( x)
∂t
可以称为流函数 因此 对任意给定的 x 0 以及 x 0 的领域U 0 上的任意
x 总可以找到充分小的 t 使下列映射关系成立
φ t f : x → φ t f ( x)
它是一个局部微分同胚映射 所以其逆映射也存在 即 φ t f [ ] −1
= φ −ft 因
此对于充分小的 t s 有 φ t f+ s ( x) = φ t f (φ sf ( x)) 成立 这样偏微分方程的
解可以用向量场 f1 ,L , f n 的流函数的恰当组合来构成 这些流函数是
φ t f ( x) φ t f ( x),L, φ t f (x) 现在来考虑映射 F : U ε → R n
1
1
2
2
n
n
z1 ,L , z n
→ φ zf11 o φ zf22 o L o φ zfnn ( x 0 ) 其中 U ε = {x ∈ R n | z i < ε } 记号 o 表示
恰当的组合 若 ε 充分的小 则可以证明这个映射具有下列特点
1 它定义在所有 z = ( z1 , L z n ) ∈ U ε 上 并且是微分同胚映射 因而
U ε 与U 0 是微分同胚
 ∂F 
2 对所有 z ∈ U ε
它的雅可比阵   其前面的 d 列是 ∆( F ( z )) 中
 ∂z 
的线性独立向量
因为U 是映射 F 的象域 U 0 是 x 0 的一个开邻域 而若 x 0 就是点 z = 0
0

的象 或值 则由特性 1 知 F 是微分同胚映射 则 F −1 存在 且也
是光滑的 可微的
φ1 ( x) 
φ ( x) 
设  2  = F −1 ( x) 其中 φ1 ( x),L, φ n ( x) 是定义在 x ∈ U 0 上的实值函数
L 
 
φ n ( x)
则可以断言这些函数最后面的 n − d 个函数 就是偏微分方程的 n − d 个

27
非线性系统控制理论

独 立 解 为 什 么 可 以 作 此 断 言 因 为 由 定 义 可 知
 ∂F 
−1
 ∂F 
 ∂x  •   = I 对所有 z ∈ Uε 及所有 x ∈ U 0 成立 其中 I 是
  x = F ( z )  ∂z 
 ∂F 
单位阵 而由上述特点 2 可知  ∂z  的前 d 列 构成分布 ∆(x ) 在
点 x = F (z ) ( x ∈ U 0 ) 的基 所以微分
∂φ d +1
dφ d +1 =
∂x
∂φ
dφ d + 2 = d + 2
∂x
M
∂φ
dφ n = n
∂x
就构成了分布 ∆ 在点 x ∈ U 的子空间 ∆(x) 的零化向量 换句话说 若
0

令 Ω( x) = span{∂φ d +1 ( x),L , ∂φ n ( x)} 则 Ω( x) = ∆⊥ ( x) ( x ∈ U 0 ) 即这些


函数 φ d +1 ( x),L , φ n ( x) 就是偏微分方程 n − d 个独立解
从而充分性得证

28
非线性系统控制理论

第三章 反馈线性化的初等理论
3.1 局部坐标变换
我们将按照循序渐进的方式来研究有关于非线性系统的反馈
控制规律的一系列问题 首先我们在本章讨论单输入单输出系统
然后在后面的章节中将其大多数结果推广到多输入多输出系统
1 相对阶 或相对度 定义
单输入单输出系统若写成下列形式(称仿射非线性系统)
x& = f ( x ) + g ( x )u 1 1a
y = h( x ) 1 1b
则系统在点 x 0 上 说他具有相对阶r 若下面两个条件成立
(对所有 x 0 的邻域上的x及所有k<r-1)
(i) Lg Lkf h( x ) = 0
(ii) ( )
Lg Lrf−1h x 0 ≠ 0
注意在某些情况下相对阶不能被确定 事实上 当 L g h( x )
L g L f h( x ) 函数序列的首函数不是一致为零 在 x 的邻域上 0


而在x= x 点上又精确为零时就出现这种情况 然而很清楚地
相对阶能够被确定的点的集合是系统 1 1 被定义的集合U的一
个稠密的开子集
2 举例
考虑状态空间的范德波尔振荡方程
•  x2  0
 x = f ( x ) + g ( x )u =  +  u
2ως (1 − µx1 )x2 − ω x1  1
2 
 2


 y = h(x ) = x1

∂h 0
Lg L0f h( x ) = Lg h( x ) = ⋅ g ( x ) = [1 0]  = 0
∂x 1
∂h( x )  x2 
L f h( x ) = f ( x ) = [1 0]  = x 2
∂x ∗
(
∂ L f h( x ) ) ⋅ g( x ) = 0
Lg L1f h( x ) =
∂x
[0 1]1 = 1 ≠ 0
 

∴我们可以看到在 x 0 为任意值时 其邻域上均有

29
非线性系统控制理论

(i ) Lg L0f h( x ) = 0
(ii ) Lg L f h( x 0 ) = 1 ≠ 0

可得出 r-1=1 则即 r=2


因 此 系 统 在 任 何 点 x 0 上 均 有 相 对 阶 为 2,然 而 若 输 出 函 数 为
y = h( x ) = sin x 2 ,那么 Lg h( x ) = cos x 2
则 当 x 0 2 ≠ (2k + 1)π 2 则 cosx 20 ≠ 0 则 系 统 的 相 对 阶 为 1 否
则若 x 0 2 = (2k + 1)π 2 则 cosx 20 = 0 则系统的相对阶不能被确定
3 关于相对阶的几点讨论
1 对于线性系统 相对阶是其传递函数的分母阶次与分子阶次
的差值
 x• = Ax + Bu
对线性系统 
 y = Cx
f ( x ) = Ax g( x ) = B h( x ) = Cx
∂h( x )
L f h( x ) = ⋅ f ( x ) = CAx
则 ∂x
L f h( x ) = CA k x
k

Lg Lkf h( x ) = CA k B

则确定相对阶的条件变成

(i ) CA k B = 0
对所有 k<r-1
(ii ) CA r −1 B ≠ 0
而传递函数为 H ( s) = C( sI − A) B
−1

由 Faddeev 公式
H (s ) = C (sI − A) B
−1

CBs n −1 + (CAB + a n −1CB )s n − 2 + (CA 2 B + a n −1CAB + a n − 2CB )s n −3 + ⋅ ⋅ ⋅ + (CA n −1 B + ⋅ ⋅ ⋅ + a1CB )


=
s n + a n −1 s n −1 + ⋅ ⋅ ⋅ + a1 s + a0


若 CA 0B ≠ 0 r-1=0 r=1 而此时分母与分子阶次差 1 阶

30
非线性系统控制理论

若 CA 0B = 0 而 CAB ≠ 0 r-1=1 r=2 此时分母与分子阶次差


2阶

若 CA 0 B = 0, ⋅ ⋅ ⋅ , CA k B = 0 ( k < r − 1) 而 CA r −1B ≠ 0 相对阶为r


此时分母与分子阶次差 n − (n − (r − 1) − 1) = r 阶
因此对于单输入单输出线性系统相对阶等于其传递函数分
母阶次与分子阶次之差
2 在t = t0 时刻 为了从输出 y( t ) 得到 u t 0 的显式表示 必需对 ( )
y( t ) 进行微分的次数正好等于系统的相对阶r
若 系 统 在 t0 时 刻 处 于 状 态 x0 = x t 0 ( ) 则

( ) ( ( )) = h( x )
y t0 = h x t0 0

以 y ( ) ( t ), k = 1,2,⋅⋅⋅ 表示在t = t0 时刻
k
y( t ) 对时间的各阶导

∂h( x ) dx
y (1) (t ) = ⋅
∂x dt
∂h
=
∂x
( f ( x ) + g ( x )u )
= L f h( x ) + L g h( x ) ⋅ u
若相对阶r=1 ( )
则 Lg h x 0 ≠ 0 所以对y作一次微分就可以得
( )
到 u t 0 的显式表示

( )
u t0 =
1
L h( x )
( y ( ) (t )
0
1
t0 ( ))
− Lf h x0
g

( )
若相对阶 r>1 则 L g h x 0 = 0 ,所以 y ( ) (t ) = L f h( x )
1
于是
∂L f h( x ) dx
y ( 2 ) (t ) = ⋅
∂x dt
∂L f h( x )
=
∂x
( f ( x ) + g ( x )u )
= L2f h( x ) + Lg L f h( x ) ⋅ u

31
非线性系统控制理论

若 相 对 阶 r>2 则 在 t 接 近 于 t0 的 邻 域 上 L g L f h( x ) = 0 而
y ( 2 ) ( t ) = L2f h( x )
若 相 对 阶 为 r 则 如 此 继 续 进 行 微 分 可 得
y (t ) = L f h( x ) + Lg L f h( x ) ⋅ u
(r ) r r −1

( )
因为 L g Lrf−1 h x 0 ≠ 0 所以
y ( r ) (t ) to ( ) ( ) ( )
= Lrf h x 0 + Lg Lrf−1h x 0 ⋅ u t 0

( )
u t0 =
1
r −1
Lg L h x ( )
0 ( y ( ) (t ) − L h( x ))
r
t0
r
f
0

这就说明当系统的相对阶为 r 时 u t 0 可以用 y( t ) 的 r 阶 ( )
导数显式表示

3 r 是最大线性无关的下列行向量的数目
( )
dh x 0 , dL f h x 0 ,⋅ ⋅ ⋅ , dLkf h x 0 ( ) ( )
即 若 r 是 系 统 的 相 对 阶 则 行 向 量 组
( ) ( )
dh x , dL f h x 0 ,⋅ ⋅ ⋅ , dLrf−1h x 0 是线性无关的
0
( )
由 此 可 见 相 对 阶 一 定 ≤ n 因为 用 反 证 法 若 r>n 则上
述行向量组一定是线性相关的 所以 r 不可能大于 n
为了证明这一点需要进行一些数学推导 我们将这一推导分
几个步骤 并且在本讲义中仅列出其要点
第一步 先来证明一个今后有用的定理
定 理 令 Φ 是实值函数 f和g是向量场(均定义在 R n 的开集上),
则对于任选的s,k,r>0,下列式子成立:
r
r
dLsf Φ ( x), ad kf + r g ( x) = ∑ (−1) i   Lrf−i dLsf+i Φ ( x), ad kf g ( x)
i =0 i
r r!
其 中 *,*表 示 向 量 的 内 积 ,   = 表 示 从 r个 不 同 的
 i  i!(r − i )!
元素中取i个的组合数
该定理的证明是容易的 只要对r进行归纳法即可,并且注意
到下列事实:
dLsf Φ ( x), ad kf + r +1 g ( x) = dLsf Φ ( x), [ f , ad kf + r g ( x)]
= L f dLsf Φ ( x), ad kf + r g ( x) − dLsf+1Φ ( x), ad kf + r g ( x)

32
非线性系统控制理论

第二步 作为上述定理的直接推论,可得出下列两组条件是等
价的:
(i ) Lg φ ( x ) = Lg L f φ ( x ) = Lg L2f φ ( x ) =L = Lg Lkf φ ( x ) = 0 对 于 所
有 x ∈U
(ii ) Lg φ ( x ) = Lad f g φ ( x ) = Lad 2 g φ ( x ) =L = Lad k g φ ( x ) = 0
f f
对于所有
x ∈U
第三步 根据相对阶的定义 再应用上述定理 可以得出对所
有 i j 只要 i + j ≤ r − 2
则 dL jf h( x ), ad if g( x ) = 0 对 所 有 x 0 的 邻 域 上 的 x 以 及

( ) ( ) = (−1) (
dL jf h x 0 , ad if g x 0
r −1− j )
( )
L g Lrf−1h x 0 ≠ 0 只要i+j=r-1
因此下列矩阵
 dh x 0 

( )

0
( ) [ g( x )
 dL f h x  0
ad f g x 0 ( ) ( )]
L ad rf −1 g x 0
 M 
 r −1 0 
( )
dL f h x 



0 L L ( ) ( ) 
dh x 0 , ad rf −1 g x 0
 0 L L ∗ 
= 
M ∗
 r −1 0 
( )
 dL f h x , g x
0
( ) ∗ L ∗ 

的秩是 r ( ) ( )
所以行向量组 dh x 0 , dL f h x 0 ,L , dLrf−1h x 0 是线性无关 ( )

4局部坐标变换及正则形 可以看作是相对阶的一种应用
为了使系统的数学描述简化或便于应用 有时需要将原来用 x
作为状态变量的系统方 程通过坐标变换变成用 Ζ 作为新的状态变
量的系统方程
若系统在 x 0 处有相对阶r 则 r ≤ n
i 若r=n 则我们可以选择

33
非线性系统控制理论

z1 = φ 1 ( x ) = h( x ) φ 1 ( x ) 
z 2 = φ 2 ( x ) = L f h( x )  
 φ 2 ( x )
→ Ζ = φ ( x) φ ( x) =
M  M 
 
z n = φ n ( x ) = Lnf−1h( x ) = Lrf−1h( x ) φ n ( x )
dz1 ∂φ 1 ( x ) dx ∂h( x )
dt
=
∂x

dt
=
∂x
( f ( x ) + g ( x )u )
∂h( x ) ∂h( x )
= f ( x) + g( x ) ⋅ u
∂x ∂x
= L f h( x ) + Lg h( x ) ⋅ u = L f h( x ) = z2
dz 2 ∂φ 2 ( x ) dx ∂L f h( x )
dt
=
∂x

dt
=
∂x
( f ( x ) + g ( x )u )
= L2f h( x ) + Lg L f h( x )u = L2f h( x ) = z 3
M
dz n −1 ∂φ n −1 ( x ) dx ∂L f h( x )
n−2

dt
=
∂x

dt
=
∂x
( f ( x ) + g ( x )u )
= Lnf−1h( x ) + Lg Lnf− 2 h( x ) ⋅ u
= Lrf−1h( x ) + Lg Lrf− 2 h( x ) ⋅ u = Lrf−1h( x ) = z n
dz n ∂φ n ( x ) dx ∂L f h( x )
n −1

dt
=
∂x

dt
=
∂x
( f ( x ) + g ( x )u )
= Lnf h( x ) + Lg Lnf−1h( x )u
= Lrf h( x ) + Lg Lrf−1h( x )u
其中因为r=n 所以根据相对阶的定义
Lg h( x ) = Lg L f h( x ) = L = Lg Lrf− 2 h( x ) = 0
而 L g Lrf−1 h( x ) ≠ 0
又因 Ζ = φ ( x) ∴ x = φ −1 ( z )
( )
Lrf h( x ) = Lrf h φ −1 ( z ) = b( z )

Lg Lrf−1h( x ) = Lg Lrf−1 h(φ ( z )) = a ( z ) ≠ 0
−1

所以方程变换成

34
非线性系统控制理论


z1 = z 2

z2 = z3
M

z n −1 = z n

z n = b( z ) + a( z )u
写成矩阵形式



 z2   0 
  z   0 


 3   
  ⋅   ⋅ 
 =  ⋅  +  ⋅ u
 •
Z    

  ⋅   ⋅ 

    
  z n   0 

 b( z ) a ( z )
 y = z1

(ii 若r<n 则选择


z1 = φ 1 ( x ) = h( x )
z 2 = φ 2 ( x ) = L f h( x )
M M M
z r = φ r ( x ) = Lrf−1h( x )
z r +1 = φ r +1 ( x )
M M
zn = φ n ( x )
φ 1 ( x ) 
 
 φ 2 ( x )
φ ( x) =
 M 
 
φ n ( x )

35
非线性系统控制理论

这后面的 n-r 个函数在满足在 x 0 处有一个非奇异的雅可比


矩阵的条件下 这样才有资格在 x 0 的邻域上成为局部坐标变换的
变 换 矩 阵 可 以 自 由 选 择 但 根 据 Frobenius 定 理 总 有 可 能 选 择
φ r +1 ( x ),L , φ n ( x ) 使得 L g Φ i ( x) = 0, r + 1 ≤ i ≤ n x在 x 0 的邻域上 证
明见后面定理1 4

这样一来 新的状态方程就可写成

z1 = z 2

z 2 = z3
M

z r −1 = z r

z r = b( z ) + a ( z )u

z r +1 = L f Φ r +1 ( x) = L f Φ r +1 (Φ −1 ( z )) = q r +1 ( z )



z n = L f Φ n ( x) = L f Φ n (Φ −1 ( z )) = q n ( z )

写成矩阵形式

36
非线性系统控制理论




 z2   0 
  z   
   0


3

  ⋅   ⋅ 

•
 
zr   ⋅ 
 =  + u
Z
  b( z )   a ( z ) 
    
 q
 r +1   0

( z ) 
  ⋅   ⋅ 

    
 q
 n ( )   0 
z
 y = z1

这种形式的系统方程称为正则形 可用方块图表示

• • •

u Zr Z r −1 Z1 z=y
b(z)+a(z)u ∫ ∫ ... ∫

...
Z r +1 Zn

Zi =qi ( z)
r<i<n

定理1.4: 假设系统在x o 处有相对阶r 且r是严格小于n的 则取


φ 1 ( x ) = h( x )
φ 2 ( x ) = L f h( x )
M
φ r ( x ) = Lrf−1h( x )

37
非线性系统控制理论

且 总 有 可 能 找 到 另 外 n-r个 函 数 φ r +1 ( x ),L , φ n ( x ) 使 得 映 射
φ 1 ( x ) 
 
φ ( x ) =  M  在x 0 处有非奇异的雅可比矩阵 因而在x 0 的邻域上有资
φ n ( x )
格作为一个局部坐标变换阵 且这些附加函数在 x 0 处的值能够被任意
确定 更进一步 总有可能选择φ r +1 ( x ),L , φ n ( x ) 使得
Lg φ i ( x) = 0
对所有r + 1 ≤ i ≤ n 及所有x 0 邻域上的x
[证明]
( )
根据相对阶的定义 向量 g x 0 是非零的 所以分布 G = Span{ g} 在

x 处是非奇异的1维分布 所以也是对合的 所以由 Frobenius 定理
我们可以推论出存在n-1个实值函数 λ 1 ( x ),L λ n −1 ( x ) 它们定义在 x 0 的
邻域上且使得
Span{dλ 1 , L , dλ n − `1 } = G ⊥ 1 5
( {
容易推知在x 0 处 dim G ⊥ + Span dh, dL f h, L , dLrf−1 h = n }) 1 6
这可以用反证法来证明 因为假若这是错的 则
( ) ( { }) ( x ) ≠ 0

G x 0 ∩ Span dh, dL f h,L , dLrf−1h 0

也就是说向量 g( x ) 零化在 Span{dh, dL h,L , dL h} 上的所有协向


0
f
r −1
f

量 但这是矛盾的 因为由定义 dL h( x ), g( x ) 是非零的r −1


f
0 0

因为 Span{dh, dL h,L , dL h} 的维数是r 而且 1 5


f
r −1
f 1 6
成立 所以从集合 {λ 1 ,L , λ n−1 } 中总可以找出n-r个函数 不失一般性
令其为λ 1 ,L ,λ n −r 使得
dh,dLf h,L ,dLrf −1h,dλ 1 ,L,dλ n −r
在x 0 处是线性无关的 根据函数λ 1 ,L ,λ n −r 的构造可知
dλ i ( x ), g( x ) = Lg λ i ( x ) = 0
对所有x 0 邻域上的x及所有1 ≤ i ≤ n − r
因此本定理得到证明 注意任何形为 λ'i ( x ) = λ i ( x ) + Ci 的函数 其
中C i 为常数 满足同样的条件 因此这些函数在x 0 处的值是能够任意选
取的

例:考虑系统

38
非线性系统控制理论

 − x1  ex p( x 2 )

   
X =  x1 x 2  +  1  u
 x 2   0 

y = h( x ) = x 3
首先看一下它的相对阶 因
∂h ∂h
= [0 0 1] L g h( x ) =
⋅ g( x ) = 0
∂x ∂x
∂h
L f h( x ) = ⋅ f ( x) = x2
∂x
∂ Lf h ( )
= [0 1 0] L g L f h( x ) =
∂ Lf h ( )
⋅ g( x ) = 1 ≠ 0
∂x ∂x
所以相对阶r=2 为了变换成正则形 则
z1 = φ 1 ( x ) = h( x ) = x 3
z 2 = φ 2 ( x ) = L f h( x ) = x 2
现在需要找第三个函数φ 3 ( x ) 考虑
exp( x 2 )
∂φ 3 ( x )
 ∂φ 3 ∂φ 3 ∂φ 3   
g( x ) =  , , ⋅ 1 
∂x  ∂x1 ∂x 2 ∂x 3 
 0 
∂φ ∂φ
= 3 ⋅ ex p( x 2 ) + 3 = 0
∂x 1 ∂x 2
一般来说这涉及到要解偏微分方程 通常有一定的难度 但在本例
中容易看出 若取 φ 3 ( x ) = 1 + x1 − exp( x 2 )
则能够满足上述条件 因为这时
∂φ 3 ( x )
=1
∂x1
∂φ 3 ( x )
p( x 2 )
= − ex
∂x 2
∂φ 3 ( x ) ∂φ 3
所以 p( x 2 ) +
⋅ ex =0
∂x 1 ∂φ 2

39
非线性系统控制理论

0 0 1
∂φ ( x )  
变换 Ζ = φ ( x ) 的雅可比矩阵 = 0 1 0 在所有的x
∂x
p( x 2 ) 0
1 − ex
处都是非奇异的 因而其逆变换可得
x1 = −1 + z 3 + ex( 2)
pz
x2 = z2
x 3 = z1
且注意φ (0) = 0 在新坐标上系统方程为

z1 = z 2

z 2 = ( −1 + z 3 + ex
p( z 2 ))z 2 + u

z 3 = (1 − z 3 − ex
p( z 2 ))(1 + z2 expz
( 2 ))
由于该方程在任何处都成立 因而是一个全局坐标变换 该系统
方程也是全局有效的 变换后方程是正则形的 因为只有第2个方程中
含有u 第3个方程中是不含u的
5 关于局部坐标变换的讨论
i 正则形的另一种表示
前面已经提到 正则形只有第r个方程中含有u 其余方程中均不
含u 我们将系统方程重新列写如下

z 1 = z2

z 2 = z3
M

z r −1 = zr

z r = b( z ) + a( z ) ⋅ u

z r +1 = q r +1 ( z )
M

z n = qn ( z)
y = z1

40
非线性系统控制理论

由此可见前面r-1个方程是线性的 第r个方程含有u 后面n-r个方


程不含u 通常是 Z的非线性函数 如果我们把状态变量Z分成两组
 z1 
z   z r +1  q r +1 
 η =  M  再以 q =  M 
 
2
ξ= 则方程变成
M
   z n   q n 
 zr 
 ξ2   0 
•  M   M 
ξ= + u
 ξr   0 
   
b(ξ ,η ) a (ξ ,η )

η = q (ξ ,η)
y = [1 0 L 0] ⋅ ξ
由此可见η这组状态变量在输出中没有直接反映出来 在以后的讨
论中我们将常常采用这种形式
ii 非正则形的局部坐标变换
前面已经指出 有时候构造n-r个函数φ r +1 ( x ),L , φ n ( x ) 使 Lg φi = 0 并
不是一件容易的事 因为它涉及到要解n-r个偏微分方程组 而要找n-r
个函数仅仅只要满足 φ ( x ) 的雅可比矩阵在 x 0 处是非奇异的 要比较容
易些 但此时 φ ( x ) 就有资格来作坐标变换 不过后面的 n-r 个方程中
可能含有u 也就是说可取这样的坐标变换 方程列写成

z 1 = z2

z 2 = z3
M

z r −1 = z r
M
这前r个方程与正则形是相同的 但后n-r个方程只能一般化的写成

z r +1 = q r +1 ( z ) + pr +1 ( z ) ⋅ u
M

z n = q n ( z ) + pn ( z ) ⋅ u
其中可能含有u
例1 3 考虑系统

41
非线性系统控制理论

 x1 x 2 − x13   0 
   
 + 2 + 2 x3 u
• x1
X = 
 − x3   1 
 2   
 x1 + x 2   0 

y = h( x ) = x 4
对这个系统 有
∂h
= [0 0 0 1] Lg h( x ) = 0 L f h( x ) = x12 + x 2
∂x
(
∂ Lf h )
= [2 x1 1 0 0] L g L f h( x ) = 2(1 + x 3 )
∂x
注意只要 x3 ≠ −1 则 L g L f h( x ) ≠ 0 这说明只要 x3 ≠ −1 就有相
对阶2
为了局部坐标能变换成正则形 首先
z = (z1 , z2 , z3 , z4 )
再就是要找φ 3 ( x ) 和φ 4 ( x ) 使 L g φ 3 ( x ) = L g φ 4 ( x ) = 0 就要解偏微
分方程 如果我们放弃这一点 则可以选
 0 0 0 1
z3 = φ 3 ( x) = x3  0
∂φ 2 x1 1 0

则雅可比矩阵 = 对于任何
z 4 = φ 4 ( x ) = x1 ∂x  0 0 1 0
 
 1 0 0 0
的x都是非奇异的 因而可以用φ ( x ) 进行坐标变换 则有
x1 = z 4
x 2 = z 2 − z 42
x3 = z3
x 4 = z1
注意也有φ (0) = 0 则此时新坐标下的系统方程为

z1 = z 2

( ( ) )

z 2 = z 4 + 2 z4 z 4 z 2 − z 42 − z 43 + (2 + 2 z 3 )u

z3 = − z3 + u

z 4 = −2 z 43 + z 2 z4

42
非线性系统控制理论

这些方程是全局有效的 因为 z = φ x = 0 的雅可比矩阵对任意x
0 0
( )
都是非奇异的 但是它不是正则形的 因为表现在第3个方程中含有u
∂φ ∂φ
若 要 求 Lg φ 3 ( x) = 3 (2 + 2 x 3 ) + 3 = 0 采用试探法 取
∂x 2 ∂x 3
φ 3 ( x ) = x 2 − 2 x 3 − x 32
能满足上述条件 就可以找到新坐标下的正则
形表示 但是此时坐标变换是局部有效的 不能包括 x3 = −1 的点
因为此时的φ ( x ) 其雅可比矩阵在x3 = −1处是奇异的
3.2 状态反馈精确线性化
我们的主要目的之一是要分析和设计非线性系统的反馈控制规
律 如果我们假定系统的状态x都是可以直接测量的 但系统的输入取
决于这些状态及外加的参考输入 如果系统的控制只取决于同一时刻
的状态及外加的参考输入 则这样的控制叫作静态的 或者无记忆的
状态反馈控制模式 否则若控制还取决于一组附加的状态变量 也就
是说控制本身是一个特定的动态系统的输出 这个动态系统由状态x及
外加的参考输入所驱动 并且有它自己的内部状态 这样的控制叫做
动态的状态反馈控制模式
对于一个单输入单输出系统 最常用的静态的状态反馈控制构造

u = α ( x ) + β ( x )v
其中v是外加的参考输入
若原系统是

x = f ( x ) + g ( x )u
y = h(x)
将两者组合起来就得到一个闭路控制 它由下列类似的结构来描


x = f ( x ) + g ( x ) ⋅ α ( x ) + g ( x ) β ( x )v
y = h( x )
α ( x ), β ( x ) 是定义在 R n 开集上的函数 它们描述了控制u 显然 β ( x )
对于在该集上的所有x应当是非零的

43
非线性系统控制理论


v α ( x ) + β ( x )v u x = f ( x ) + g ( x )u
y = h( x ) y

现在的问题是如何设计反馈控制规律
1 .用反馈使非线性系统精确线性化
实际的意义是用反馈将原非线性系统改造成线性系统
考虑某非线性系统在某点 x = x 0 处 具有相对度r=n 即相对度恰
好等于系统状态空间的维数 这时通过坐标变换可将其变换成正则形
其变换阵直接为
φ 1 ( x )   h( x ) 
   
 φ 2 ( x )  L f h( x ) 
φ ( x) = =
 M   M 
   n −1 
φ n ( x )  L f h( x )
新坐标 zi = φ i ( x ) = Lif−1h( x ) 1≤ i ≤ n
z = ( z1 , z2 ,L , zn )

z1 = z 2

z2 = z3
M

z n −1 = z n

z n = b( z ) + a( z )u
其中 ( )
在 z 0 = φ x 0 的邻域上 函数a(z)
是非零的 则可选下列状
态反馈
1
(− b(z ) + v )
u=
a (z )
它确实存在 并且在 z 0 的邻域上能很好的被确定 则最后一个式

子成为 zn =v

44
非线性系统控制理论

 z• = z
 •1 2

z =z
 2 3
系统方程变成  M
 •
z n −1 = z n
 z• = v
 n
它是一个线性能控形的状态方程 所以可得下述结论
任何一个在某点 x 0 处具有相对阶n的非线性系统 在点 z 0 = φ x 0 ( )
的一个邻域上都能够变化成一个线性的能控的系统 在此要强调两点
1 坐标变换是局部地给定在x 0 的周围的
2 状态反馈也是局部地给定在x 0 的周围的
2. 讨论及推论
1 容易推知 为了得到线性形式的状态方程 两种变换是可以交换
次序的 即可以先进行反馈 然后再作坐标变换 可以得到同样的结

这时的反馈应表示成x的函数 即
u=
1
(− b(φ (x )) + v )
a (φ ( x ))
=
1
Lg L f h( x )
n −1 (
− Lnf h( x ) + v )
于是再作同样的坐标变换 即可推出这一结论
2 如果x 0 是原非线性系统的一个平衡点 并且总可以通过输出的零
点变换使此时的 y 0 = 0 ( )
即有 f x 0 = 0 和 h x 0 = 0 ( )
0
( )=0
因而 z = φ x 0
因为事实上有
( ) ( )
φ1 x0 = h x0 = 0
∂ ( L h)
i −2

φ (x ) = f (x ) = 0
f
0 0
对 2≤i ≤ n
∂x
i

于是可以得到下列推论
若x 0 是原系统的一个平衡点 且在x 0 处系统的相对阶是n 则存在
一个反馈控制律和一种坐标变换 使原系统在原点0处变成一个线性能
控的系统
3 在如此得出的线性能控系统上 就可以采用新的状态反馈来设计
系统了 例如采用极点配置法或某种优化准则来设计系统 换句话说

45
非线性系统控制理论

对于线性系统的所有设计方法现在都可以应用了 例如取 V=Kz其中


K = (c0 , c1 ,L cn −1 ) 状态反馈阵K可以由极点配置或优化准则来确定
因而 V = c0 h( x ) + c1 L f h( x )+L+ cn −1 Lnf−1h( x )
n −1
− Lnf h( x ) + ∑ ci Lif h( x )
i =0
于是 u=
L g L h( x )
n −1
f

4 需要指出的是通过非线性反馈来使系统线性化的方法与以前的小
扰动线性化有着质的区别 后者是在额定工作点附近的一种线性近似
而前者是一种 改造 而且得出的线性系统只要表达式是精确的 则
得到的也就是一个精确的线性系统 而且它与原系统已完全不同了
因而更好的说法是通过反馈改造非线性系统为一个线性能控的系统
是以非线性 反馈 来治非线性 改造成为线性系统

3.举例
例2.1 考虑系统
 0  ex p( x 2 )

 
x =  x1 + x 22  + ex
p( x 2 )u
 x1 − x 2   0 
y = x3
对于这个系统 有
L g h( x ) = 0 L f h( x ) = x1 − x 2
L g L f h( x ) = 0 L2f h( x ) = − x1 − x 22
L g L2f h( x ) = −(1 + 2 x 2 ) ex
p( x 2 )
(
L3f h( x ) = −2 x 2 x1 + x 22 )
所以系统的相对阶为3 即r=3=n 当1 + 2x 2 ≠ 0 则在除1 + 2x 2 = 0
以外的任何点的邻域上通过状态反馈可将系统变换成线性能控的形
式 以x=0处为例 通过状态反馈 此时

u=
−2 x 2 x1 + x 22 ( −
) 1
v
(1 + 2 x 2 ) exp( x 2 ) (1 + 2 x 2 ) exp( x 2 )
坐标变换是 z1 = h( x ) = x 3
z 2 = L f h( x ) = x1 − x 2
z 3 = L2f h( x ) = − x1 − x 22

46
非线性系统控制理论

0 1 0 0

在新坐标下系统为 z = 0 0 1 + 0v 这是线性 能控的
0 0 0 1
4.状态空间精确线性化的充分必要条件
我们来考虑一个系统如下 暂时不考虑它的输出

x = f ( x ) + g ( x )u
在一个给定的点x 0 处 如果能够找到一个反馈 在x 0 的邻域U上
u = α ( x ) + β ( x )v
且在x 0 的U上又有一个坐标变换 z = φ ( x ) 或 x = φ −1 ( z )

则 x = f ( x ) + g ( x )u
= f ( x ) + g( x )α ( x ) + g( x )β ( x )v
再由坐标变换
• ∂φ ( x ) • ∂φ ( x )
z =
∂x
⋅x =
∂x
( f ( x) + g( x)α ( x) + g( x)β ( x)v)
∂φ ( x ) ∂φ ( x )
=
∂x
( f ( x ) + g( x )α ( x )) +
∂x
g( x )β ( x ) ⋅ v

 ∂φ ( x ) 
当 ( f ( x ) + g( x )α ( x )) = Az
 ∂x  x =φ −1 ( z )
 ∂φ ( x ) 
 g ( x ) ⋅ β ( x ) =B
 ∂x  x =φ −1 ( z )

又 rank B ( AB L A n −1 B = n 时 ) 系统 z = Az + Bv 就是线性能控

这个问题就是单输入系统的所谓状态空间精确线性化问题 在上
面的论述中可看到问题与输出没有直接的关系 但是相对阶的概念与
输出直接有关
我们将状态空间精确线性化问题归结为下列定理
定理 状态空间精确线性化问题是能解的充分必要条件是存在x 0 的一
个邻域U 及一个定义在U上的实值函数 λ ( x ) 使得系统

x = f ( x ) + g ( x )u
y = λ( x)
在x 0 处有相对阶n

47
非线性系统控制理论

证明
因为充分性已经从前述的反馈线性化问题中得到论证 因此现在
只需要证明它的必要性
在证明必要性之前先来说明相对阶的一个有趣的性质 即在坐标
变换下或进行状态反馈后 相对阶是不变的
若 z = φ ( x ) 是一个坐标变换 x = φ −1 ( z )

原系统 x = f ( x ) + g ( x )u y = h( x )
• ∂φ ( x) • ∂φ ( x) ∂φ ( x)
新系统 z= ⋅x = ⋅ f (x ) + ⋅ g (x ) ⋅ u
∂x ∂x ∂x
− −
= f ( z ) + g ( z )u

y = h( z )
−  ∂φ ( x ) 
其中 f ( z ) =  ⋅ f ( x )
 ∂x  x = φ −1 ( z )
−  ∂φ ( x ) 
g( z ) =  ⋅ g ( x )
 ∂x  x =φ −1 ( z )

h( z ) = [h( x )] x =φ −1 ( z )

− ∂ h( z ) −
则 L − h( z ) = ⋅ f ( z)
f ∂z
 ∂h( x )  ∂φ −1 ( z )  ∂φ ( x ) 
=  ⋅ ⋅ ⋅ f ( x )
 ∂ x  x = φ −1 ( z ) ∂z  ∂x  x =φ −1 ( z )
 ∂h( x )  ∂φ −1 ( z )  ∂φ ( x ) 
=  ⋅   ⋅ [ f ( x )] x =φ −1 ( z )
 ∂ x  x = φ −1 ( z ) ∂z  ∂x  x =φ −1 ( z )
 ∂φ −1 (z ) ∂φ ( x )   ∂x ∂z 
因  ∂z ⋅ ∂x  = ⋅  =I
  x =φ −1 ( z )  ∂z ∂x  x =φ −1 ( z )
 ∂h( x ) 
故上式 = 
 ∂ x
⋅ f ( x )
 x =φ ( z )
− 1
= L f h( x ) [ ] x = φ −1 ( z )

[ ]

同样的运算可得出 L − Lk− h( z ) = L g Lkf h( x ) x = φ −1 ( z )
g f

因而原系统的相对阶与坐标变换后系统的相对阶是一样的
再来考虑反馈控制 若反馈取为 u = α ( x ) + β ( x )v

48
非线性系统控制理论


则 x = f ( x ) + g( x )α ( x ) + g( x )β ( x )v
− −
= f (x ) + g (x ) ⋅ v
y = h( x )
此式中

f ( x ) = f ( x ) + g ( x )α ( x )

g ( x) = g ( x)β ( x)
L − h (x ) = L f + gα ⋅ h( x )
f

∂h( x )
=
∂x
( f ( x ) + g ( x ) ⋅ α ( x ))
∂h( x ) ∂h( x )
= f ( x) + g( x )α ( x )
∂x ∂x
= L f ⋅ h( x ) + L g h( x ) ⋅ α ( x )
= L f h( x ) + L g L0f h( x )α ( x )
若原系统相对阶为r 则 L g Lkf h( x ) = 0, k < r − 1
因此 Lkf + gα h( x ) = Lkf h( x ) 0 ≤ k ≤ r − 1
此式可以用递归的方法来证明 只要说明当k=0时此式成立 然后
证明k+1也成立
再来看 L− Lk− h( x ) = Lgβ Lkf + gα h( x ) = Lgβ Lkf h(x )
g f

∂Lkf h( x )
= ⋅ gβ = Lg Lkf h( x ) ⋅ β (0 ≤ k ≤ r − 1)
∂x
所以只要 β x 0 ( ) ≠ 0 因原系统 L g Lrf−1 h x 0 ≠ 0 ( )
则 L− L h( x ) = L
r −1

0
g L r −1
f h( x ) ⋅ β ( x ) ≠ 0
0 0
g f

所以在状态反馈下相对阶是不变的
证明了相对阶的这个特性之后 定理的必要性证明就比较容易了
所谓必要条件就是说如果结论成立那么就可以推出条件也成立 也就
是说如果一个系统通过坐标变换和状态反馈能够变成线性能控系统
那么一定有一个函数 λ ( x ) 使原系统的相对阶r=n 故必要性的证明如

如果系统能够变化成线性能控的系统 那么由线性系统理论可知
通过坐标变换总可以变成下列标准型

49
非线性系统控制理论

0 1 0 L 0
0 0

0 1 L
 0
即此时 A =  M M M B =  M 
 
0 0 0 L 1 1
0 0 0 L 0

z = Az + Bu
现在我们再来定义输出函数 y = [1L 0]z
由此我们可以来计算这个线性系统的相对阶 由计算的结果就可
以得出其相对阶r=n
由于坐标变换和反馈下相对阶的不变性 因而原系统相应的相对
阶一定也是 r=n 这就完成了定理的证明
5. 状态空间精确线性化问题的进一步研究
现在来考虑一个问题 如果系统的相对阶 r ≠ n 时 则按照上述
的充分必要条件 该系统就不能进行状态空间精确线性化 但是我们
已经指出相对阶的概念直接与输出函数有关 如果我们能重新找出一
个函数 在这新的输出函数下 系统的相对阶满足r=n 这样的系统它
的状态空间精确线性化问题是可解的 但是当回到原来的输出时 输
出函数可能是非线性函数 这样做的好处是系统的动态部分是精确线
性化的 仅是输出函数 静态或代数方程 是非线性的 即使这样
对系统的设计也是很有利的 更何况有时系统没有明确给出输出时
输出函数作为观测值可人为的选取
这样问题变成 能否找到一个函数 λ (x) 且令系统输出 y = λ (x) 使
得系统在 x 0 处的相对阶 r 恰恰等于 n 也就是说 若系统

x = f ( x ) + g ( x )u
取 y = λ (x)
使 L g λ ( x ) = L g L f λ ( x) = L g Lnf− 2 ⋅ λ ( x ) = 0 对所有 x 0 附近的x 2.9
L g Lnf−1 ( x 0 ) ≠ 0 2 .10
这个问题显然是解 λ (x) 的一组偏微分方程的问题 而且未知函数
λ (x) 被微分到 n-1 次 且用一个约束条件 L g Lnf−1 ( x 0 ) ≠ 0 去掉了象
λ (x) = 0 这种平凡解 这样一个高阶偏微分方程是不容易解的 但我们
在前面曾经证明过一个定理 这一组高阶偏微分方程事实上等价与一
组一阶偏微分方程 这就使问题得到了一点简化 根据上述定理 问
题变成解
L g λ ( x ) = Lad f g λ ( x) = L = Lad n − 2 g λ ( x ) = 0 2.11
f

50
非线性系统控制理论


f
( )
Lad n −1g λ x 0 ≠ 0 2.12
那么这样一个问题的解是否存在 回答这个问题可看作是
定理的一个简单的推论
Frobenius

定理2.5 当且仅当下列条件满足时
[
(i) 矩阵 g ( x 0 ) ad f g ( x 0 ) L ad nf −1 g ( x 0 ) ]
ad nf −1 g ( x 0 ) 的秩为n
(ii)分布 D = Span g , { }
ad f g , L , ad nf − 2 g 在 x 0 的邻域 U 中是对合的
则定义在 x 0 的领域 U 中满足偏微分方程 2.11 和非平凡条件
2.12 的实值函数 λ (x) 是存在的
[证明]
首先 假设满足 2.11 和 2.12 的解函数 λ (x) 存在 则从定理
1.2 特 别 是 从 1.4 矩 阵 的 非 奇 异 性 就 可 导 出 n 个 向 量
g ( x 0 ), ad f g ( x 0 ), L , ad nf − 2 g ( x 0 ), ad nf −1 g ( x 0 ) 是线性无关的
这就证明了条件 i 是必要的 若 i 成立 那么定义在 x 0 邻域
上的分布D是非奇异的且是 n-1 维的 方程 2.11 可重写成
dλ ( x) g ( x 0 ) [
ad f g ( x 0 ) L ad nf − 2 g ( x 0 ) = 0 ]

这 就 说 明 微 分 dλ (x) 是 x 附 近 的 1 维 协 分 布 D 的 基 所 以 由
0

定理分布D是对合的 这就证明了条件 ii 的必要性


Frobenius
反之 若假设 i 成立 那么分布在 x 0 附近是非奇异的 且若 ii
也成立 则由Frobenius 定理 我们可以得知存在一个实值函数 λ (x)
它定义在 x 0 的邻域 v 上 且它使 dλ (x ) 张成 D ⊥ 也就是说 解得微分
方程 2.11 更进一步 dλ (x) 也满足 2.12 因为否则 dλ (x) 就会被一
组n个线性无关的向量所零化 这是矛盾的
综述以上的讨论 我们可以归结出关于状态空间的线性化问题的
一个正式的论述 即定理2.6

定理2.6 假设给定一个系统

x = f ( x ) + g ( x )u
在某 x 0 点附近状态空间线性化问题是可解的 即存在一个 输出 函
数 λ ( x) 它使系统在 x 0 处有相对阶n 当且仅当下列条件满足
n−2
i 矩阵[g(x) 0
ad f g ( x ) L ad f g ( x 0 )
0
ad nf −1 g ( x 0 )] 的秩为
n
(ii) 分布 D = Span g , { }
ad f g , L, ad nf − 2 g 在 x 0 附近是对合的

51
非线性系统控制理论

因此只要解得 λ (x) 就可以按以前讨论的步骤完成状态空间线性


化的变换
例2.2 考虑系统
 x3 (1 + x 2 )  0 

x =  x1  + 1 + x u
  2

 x 2 (1 + x1 )   − x3 
首先我们必须计算 ad f g (x) 和 ad 2f g ( x)
0 0 0   x3 (1 + x 2 )  0 x3 1 + x2   0 
ad f g ( x) = 0 1 0   x1 −1
  0 0  1 + x 2 u
0 0 − 1  x 2 (1 + x1 )   x 2 1 + x1 0   − x3 
 0 
= x1 

− (1 + x1 )(1 + 2 x3 )
 (1 + x 2 )(1 + 2 x 2 )(1 + x1 ) − x3 x1 
ad 2f g ( x) =  x3 (1 + x 2 ) 

− x3 (1 + x 2 )(1 + 2 x 2 ) − 3x1 (1 + x1 )

当取x=0时 则矩阵
0 0 1 
[g ( x) ad f g ( x) 2
ad g ( x)
f ]
x =0
= 1 0 0
0 − 1 0
它的秩是3 所以条件 i 满足
再校核条件 ii 因为[ g , ad f g ]( x) 有下列形式
0 
g, [ ]
ad f g ( x) = ∗
∗
因此矩阵 [ g ( x), ad f g ( x), [ g , ad f g ]( x)] 在x=0附 近的秩是2 所以条
件 ii 于是 λ (x) 是可以从偏微分方程解得的
也满足
∂λ
∂x
g ( x) ad f g ( x) = 0[ ]
从观察可知 λ ( x) = x1
从前述讨论可知这时系统在x=0处的相对阶是3 等于n 我们再
来核对一下

52
非线性系统控制理论

L g λ ( x) = 0, L g L f λ ( x) = 0, L g L2f λ ( x) = (1 + x1 )(1 + x 2 )(1 + 2 x 2 ) − x3 x1


且 L g L2f λ ( x 0 ) = Lg L2f λ (0) = 1
因而系统通过状态反馈和坐标变换可以变成线性能控的系统
− L3f λ ( x) + v
u=
L g L2f λ ( x)

− x32 (1 + x 2 ) − x 2 x3 (1 + x 2 ) 2 − x1 (1 + x1 )(1 + 2 x 2 ) − x1 x 2 (1 + x1 ) + v
=
(1 + x1 )(1 + x 2 )(1 + 2 x 2 ) − x3 x1
且坐标变换后
z1 = λ ( x) = x1
z 2 = L f λ ( x) = x3 (1 + x 2 )
z 3 = L2f λ ( x) = x3 x1 + (1 + x1 )(1 + x 2 ) x 2
6.小结
(1)对于一个2维的非线性系统 若在某点 x 0 处周围 只要
rank[ g ( x 0 ) ad f g ( x 0 )] = 2
则总是可以通过状态反馈和坐标变换将其转化为一个线性能控
的系统 因为事实上这就是条件 i 得到了满足 因为是2维系统
所以分布 D = Span{g} 是1维的 它总是对合的 因而条件 ii 也满
足 于是 λ (x) 总是可以解得的
(2)非线性系统的一阶线性近似在x=x 0 处的能控性是非线性系统状态
空间精确线性化的必要条件
假设向量场f x 有一个平衡点 x 0 =0 则f x 0 =0
则 f ( x) = Ax + f 2 ( x)
 ∂f   ∂f 
其中 A =   且  2  = 0
 ∂x  x =0  ∂x  x =0
也就是说前者是f x 的线性近似 后者是高阶小量
再考虑 g ( x) = B + g1 ( x)
其中 B = g (0) [ g 1 ( x)] x =0 = 0

因而系统在x=0处的线性近似可表示成 x = Ax + Bu ,则有
ad f g ( x) = (−1) k A k B + Pk ( x) 式成立
k

其中当x=0时 Pk ( x) = 0
这可以证明如下 用归纳法
首先当k=0时 ad kf g ( x) = ad 0f g ( x) = g ( x) = B + Pk ( x)

53
非线性系统控制理论

因此上述关系式是成立的
然后假设当k时 该式成立 导得 k+1 时也成立 便可得到证


k +1
∂ (ad kf g ( x)) ∂f
ad g ( x) = f ( x) −
• ad kf g ( x)
∂x ∂x
f

∂P ( x) ∂f
= k ( Ax + f 2 ( x)) − ( A + 2 )((−1) k A k B + Pk ( x))
∂x ∂x
k +1 k +1
= (−1) A B + Pk +1 ( x)
其中 Pk +1 ( x) 由其组成可知在x=0时为0
所以条件 i 等效于条件
rank ( B AB L A n −1 B) = n
也就是说条件 i 相当于线性近似系统在x=0处是能控的
3 若非线性系统

x = f ( x ) + g ( x )u
y = h(x)
它的相对阶若小于n 但它却又满足定理2.6的条件 i ii ,
则就可以取另一个不同的函数 λ (x) 作为输出 这时系统的相对阶等于
n 就有可能通过状态反馈和坐标变换 ( z = φ (x)) 使系统转化成线性能
控的形式
然而实际的输出是 h(x) 这样在新的坐标下系统的状态方程是线
性能控的 而输出方程 y = h( x) = h(φ −1 ( z )) 通常依旧是非线性的

54
非线性系统控制理论

第四章 反馈线性化原理的应用
在这一章中将介绍在局部坐标变换和反馈线性化原理基础上的一
些推论及其在控制系统设计中的应用 它们是零动态 局部渐近镇定
渐近输出跟踪 干扰解耦 高增益反馈 具有线性误差动态特性的观
测器问题等
4.1 零动态
在这一节中我们将介绍并讨论一个重要的概念 零动态 在很
多场合中它起着与线性系统中传递函数的 零点 极其类似的作用
在前述中我们已经看到线性系统的相对阶r能够被解释为其传递函数的
极点数目与零点数目之差 即若任何一个线性系统其相对阶r严格小于
其维数n 则其传递函数中必存在零点 反之若r=n 则传递函数中就没
有零点 所以前节中精确线性化所讨论的系统 在某种意义上类似于
线性系统中无零点的情况 在这一节中这种类比将进一步推广
考虑一个相对阶 r 严格小于 n 的非线性系统

x = f ( x ) + g ( x )u
y = h( x )
则可通过坐标变换 变成正则形
 h( x ) 
 
 L f h( x ) 
 M  ξ   z1   z r +1 
 
Z = φ ( x ) =  Lrf−1h( x ) = L
 
ξ =  M  η =  M 
 φ r +1 ( x )   η   zr   z n 
 
 M 
 φ ( x) 
 n 
φ r +1 ( x )
 
其中  M  若能使 L g φ i ( x ) = 0 , r + 1 ≤ i ≤ n
 φ n ( x ) 
则可将系统变成下列形式

z1 = z 2

z 2 = z3
M

z r −1 = z r

z r = b( z ) + a( z )u

55
非线性系统控制理论


zr +1 = q r +1 ( z )
M

zn = q n ( z)
或写成

 ξ2   0 

 M   M 
ξ= +  u
 ξr   0 
   
b(ξ , η) a(ξ , η)

η = q(ξ , η)
( ) ( )
若x 0 是使 f x 0 = 0, h x 0 = 0 的点 则在x 0 一定有 ξ = 0 虽然此时
η 可以任意选择 但是不失一般性 可以选 η = 0 如果x 0 是系统的一个
平衡点 则在新坐标下也应是一个平衡点
因而有
b(ξ , η) = 0 当 (ξ , η) = (0,0) 时
q(ξ , η) = 0 当 (ξ , η) = (0,0) 时
这也就是说 在x 0 = 0 系统处于平衡状态下 若此时及以后又没有
输入作用 即 u = 0 则该系统就一直处于平衡状态
1.输出零化问题和零动态
现在提出一个这样的问题
能否找到这样成对的关系 即某个初始状态x 0 及对应的 u 0 (t ) u 0 (t )
定义在t = 0的一个邻域上 使得系统在t = 0的邻域上输出 y( t ) 恒等于0
这个问题被叫作输出零化问题 当然我们感兴趣的是所有这样的对子
( )
x 0 ,u0 而不是前面提到过的x 0 = 0,u 0 = 0 简单的平凡对
对于正则形有 y(t ) = z1 (t )
由于限制在所有t时刻 y(t ) = 0 这就必须有
⋅ ⋅ ⋅
z1 (t ) = z 2 (t ) =L = z r (t ) = 0
也就是说在所有时刻 ξ (t ) = 0
所以 我们可知当系统的输出恒等于零时 其状态也以这样一种方
式受到限制 这时 ξ (t ) 也恒等于零 并且 u(t ) 必须是下列方程的唯一解
0 = b(0, η(t )) + a(0, η( t )) ⋅ u(t )
其中 a(0, η(t )) ≠ 0 当 η( t ) 趋近于零时

56
非线性系统控制理论

η( t ) 应服从下列微分方程 因为到目前为止 我们只知道 ξ (t ) = 0



η(t ) = q(0, η(t )) 3.1
由 于 η( t ) 与 输 出 不 直 接 有 关 所 以 要 使 y( t ) 保 持 为 零 只要
ξ (0 ) = 0, 而η (0 ) = η 0 可以任意来选择 但是对于不同的 η

要解得 η( t )
再取
b(0, η(t ))
u(t ) =
a(0, η(t ))
才能使 y( t ) 保持为零
当初始条件选择为 ξ (0) = 0 及 η(0) = η 0 时 上述的解 u(t ) 是唯一
的 方程 3.1 描写了系统内部的这样一种动态特性 即在限制输出
恒为零的条件下 对于所选择的初始条件 并由此而解出的控制作用
u(t ) 下 系统内部的动态特性 这个动态在我们今后的讨论中颇为重要
被叫作系统的零动态

2.关于零动态的几个评注
1 对于线性系统而言 零动态是这样一个特殊的线性系统的动态 这
个系统的极点或特征值是原系统的零点 即以原系统传递函数的分子多
项式为其特征多项式的线性系统的动态
现在我们来说明这一点 假定线性系统的传递函数为
b0 + b1 s+L+ s n − r
H ( s) = K
a 0 + a1 s+L+ s n
可知其相对阶为r 若该系统传递函数的分子与分母是互质的 则容
易得出其一种最小实现为

x = Ax + Bu
y = Cx
其中
 0 1 0 L 0  0
 0 0 1 L 0  M
   
A= M O M  B = M
   
 M 1  0
− a1 − a 2 L L − a n −1   k 
C = b0 b1 L bn −r −1 1 0 L 0
化为正则形后
z1 = Cx = b0x1 + b1x 2 +L +bn −r −1x n −r + x n −r +1

57
非线性系统控制理论

z 2 = CAx = b0x 2 + b1x3 +L +bn −r −1x n −r +1 + x n −r +2


M
r −1
z r = CA x = b0x r + b1x r +1 +L +bn −r −1x n −1 + x n
再取
z r +1 = x1
z r +2 = x 2
M
z n = x n −r
∂φ
它使 Lg φi = 0 且 是非奇异的
∂x
因为
 1 0 
 * O  
 [L]  
∂φ  
 * * 1  
=
∂ x  1 0 0 0 
 M O   M O 
   
 
 0 L 1 
 
 0 L 0  
容易验证它是非奇异的 因而用该坐标变换可以化成正则形 其形
式为

z1 = z2 
 0 1 L 0 

 M  ξ   0 
z2 = z3 
O  
 ⋅
0   M 
M  → ξ = M 1  L + u
⋅    η   0 
zr −1 = z r  0 L L 0     K 
⋅  
z r = Rξ + Sη + Ku 
R S

η = Pξ + Qη

根据零动态的意义 ξ = 0 所以有 η = Qη
1
此时应取 u(t ) = Sη(t )
K

58
非线性系统控制理论

 dzr +1 dx1
 = = x2 = z r + 2
dt dt
 dzr + 2 dx2
 = = x3 = z r + 3

 dt dt
η→ M
 dz dx
 n = n − r = xn − r +1 = − b0 x1 − b1 x2 − L − bn − r −1 xn − r + z1
 dt dt
 = − b0 zr +1 − b1 zr + 2 − L − bn − r −1 zn + z1
由于 ξ = 0 故z1 = 0

 0 1 L L 0 
 0 0 1 L 0 
 
Q= M M M 
 
 0 0 L L 1 
−b0 −b1 L L −bn − r −1 
由此零动态的特征多项式为
(SI − Q ) = b0 + b1S + L + bn − r −1S n − r −1 + S n − r
det
此即为原系统传递函数的分子 因而零动态的极点就是原系统的零

( 2 ) 非线性系统的零动态在 =0处的线性近似与整个非线性系统在
x=0处的线性近似系统的零动态是一致的 也就是说取零动态与取线性
近似的操作运算本质上是可以交换的
为了校验这一点 我们必须做的仅仅是要说明正则非线性方程的
线性近似与原系统线性近似的正则形是一致的 并且非线性系统的相
对阶与其线性近似系统的相对阶也是一致的
前面业已介绍
f(x )= Ax + f2(x )
g(x )= B + g1(x )
同理
h(x )= Cx + h2(x )
由递推关系 容易计算
'

L f h ( x ) = CA x + d k ( x )
k k

 ∂d 
其中函数d k(x )使得  k  = 0
 ∂x  x =0
由此可以推出

59
非线性系统控制理论

CA B = Lg L f h ( 0) = 0
k k

r −1 r −1
对所有k<r-1
CA B = Lg L f h ( 0) ≠ 0
也就是说原系统在 x=0处的线性近似系统 它的相对阶就等于r
则非线性系统的正则形的相应项可以写成下列展开式
b (ξ ,η ) = Rξ + Sη + b2 (ξ ,η )
a ( ξ , η ) = K + a1 ( ξ , η )
q (ξ ,η ) = Pξ + Qη + q2 (ξ ,η )
则其零动态的线性近似式为
 ∂q 
  = Q +  ∂q2  =Q
 ∂η  ( ξ ,η ) =0  ∂η  (ξ ,η ) =0

所有 η = Q η 描写了当 ξ 0 时 原系统在 =0 处的零动态的线性
近似 它与整个系统在 x=0处的线性近似的零动态是一致的

例3.2 我们来分析下列系统的零动态
 x3 − x23   0 
.    
x =  − x2  +  −1 u y = x1
 2   
 x1 − x3   1 

则有
Lg h( x ) = 0
L f h( x ) = x 3 − x 2
3

Lg L f h( x ) = 1 + 3x 2
2

因此其相对阶 r=2 为了化为正则形 取


z1 = x1 z2 = x 3 − x 2
3

z3 = x2 + x3
0
 
( Lg φ 3 = [ 0 1 1] −1 = 0)
 
1
于是在新坐标下系统的方程为

60
非线性系统控制理论

. .
z 1 = z2 z 2 = b(z1 ,z 2 ,z3 )+ a(z1 ,z 2 ,z3 )u

z3 = z 1 − z3

从零动态的意义可知 y(t)=0意味着z 1(t )= z 2(t )= 0 所以系统的


零动态为

z 3 = − z3

(3)非正则形时的零动态
虽然上述零动态的分析是在正则形的条件下进行的 但是由于坐标
变换中的 状态变量要满足 Lg φi(x )= 0 常常有难处 于是得到的是非
正则形 系统的描述成为

z 1 = z2

z 2 = z3



z r −1 = z r

z r = b( ξ ,η )+ α( ξ ,η )u

η = q( ξ ,η )+ p( ξ ,η )u
我们可以看出方程的前面几个变量与正则形是相同 所以从零动
. . .
态的概念出发 应有y(t) 0 所以 z1 = z 1 = z 2 = ⋅ ⋅ ⋅ = zr =0
b( ξ ,η )
由此可得u = −
a( ξ ,η )

b( ξ ,η )
所以 η = q( ξ ,η )+ p( ξ ,η )( − )
a( ξ ,η )
则零动态为
. b(0,η)
η = q(0,η)− p(0,η)
a(0,η)
(4)几何观点

61
非线性系统控制理论


若系统在某点x 处的相对阶为r 则有
y (t )= Lf h(x(t ))
(k ) k
0 k r-1
r −1
y (t )= L h(x(t ))+ L L h(x(t ))(
(r ) r

对于输出零化问题 则有 y (t )= 0 0


  k
(k )
u t)
g f

r-1 故系统一定
在下面的子集上运动( 局部地围绕x )
∗ r −1
z ={x ∈ R :h(x )= Lf h(x )=L = Lf h(x )= 0)

也就是说在新坐标下 恰恰正是z 1 ,z 2 ,L,z r 均为零的点集上运动


且附加的限制条件
r −1
y = Lf h(x(t ))+ Lg Lf h(x(t ))(u t )= 0
(r ) r

图4.6表示了在新坐标下零动态的几何表示

图 4.6
i 0
因为微分 dL h(x ) 0 f i r-1 在 x 处是线性无关的 所以
∗ 0
z 处在 x 附近的一个 n-r 维的光滑流形 其状态反馈为
− Lf h(x )


u (t )= r −1
Lg Lf h(x )
因 为
 L h( x ) 
 dh( x )   L f h( x ) + Lg h( x )u ∗ ( x )   2f 
 dL h( x )   2 ∗   L f h( x ) 
 f ( f ( x ) + g ( x )u ∗ (t )) =  L f h( x ) + Lg L f h( x )u (t )  =  M =0
 M   M   r −1 
 r −1   r r −1 ∗   L f h( x ) 
dL f h( x )   L f h( x ) + Lg L f h( x )u (t )  
 0 
∗ ∗ ∗
所以向量场 f ( x )= f ( x )+ g( x )u ( x ) 是与 Z 子集相切的

∗ ∗
也就可以由此推得闭环系统 x = f ( x ) 的任何运动轨迹从 Z 上的某

62
非线性系统控制理论

∗ ∗ ∗
点开始一直在 Z 中运动(对于小的时间t 内) 约束条件 f ( x )是 Z 的
一个确定的向量场 它精确的描写了系统的零动态,而与所取的坐标无

(5) 零动态在精确线性化下的不变性
若系统的相对阶为 r, 又 r<n 则可以通过状态反馈构成闭环并使
b( z )
之局部精确线性化 如前所述取 u = − +v 于是系统成为
a( z )

ξ = Aξ + Bv

η = q( ξ ,η ) ,
y =Cξ

0 1 ⋅ ⋅ 0 0
   
0 0 1 ⋅ 0 ⋅
   
其中 A =  ⋅ ⋅ ⋅ , B = ⋅ ,
   
0 0 ⋅ ⋅ 1 0
0 ⋅ 0  1
 0 0  
C = [1 0 ⋅ ⋅ ⋅]

当线性子系统初始时是静止的, 即 y(0)=0, 而且在此后又没有输


入作用 指V=0 , 因而可保持 y(t)=0 也就是说 ξ(t )= 0 这时整个

系统即闭环系统的内部动态就是 η = q(0 ,η ),也即是开环系统( 原系
统 )的零动态

( 6 )参考输出的再产生问题
输出零化问题实质上是强迫输出去精确的跟踪零 我们很容易推
广到这样的情况,即是否可强迫输出去跟踪一个任意的函数 y R (t ) 这
一个问题被称为参考输出的再产生问题 说得具体一点就是若有可能,
0 0 0 0
寻找成对的 x , u (t ). x 是初始状态 u (t )是定义在t=0的邻域上

63
非线性系统控制理论

的输出函数, 使系统的输出 y(t)在 t=0的所有邻域 t上与给的 y R (t )精


确地相一致
则 与 前 面 的 分 析 相 类 似 , 因 为 要 求 y (t ) ≡ y R (t ) , 这 就 意 味 着 :
y (t )= y R (t ) , 对 所 有 的
(i ) (i )
t 和 所 有 的 i 因 而 至 少
( i −1 )
zi(t )= y R (t ) ,对所有的 t和 1 ≤ i ≤ r
令 ξ R (t ) = Col ( y R (t ), y R(1) (t ),L, y R( r −1) (t )) ,因而输入 u(t)必须满足
y R (t )= b( ξ R ,η )+ a( ξ R ,η )u(t ),
(r )

其中 η(t )是下列微分方程的解

η = q( ξ R (t ),η(t )) (3.3)
为使 y (t ) ≡ y R (t ) , 首 先 应 保 证 在 初 始 时 刻 , ξ(0 )= ξ R (0 ) , 而
η(0 )= η 是可以任选的 于是按照所选的 η ,则
0 0

y R (t )− b( ξ R (t ),η(t ))
(r )

u(t )= (3.4)
a( ξ R (t ),η(t ))
所以为了使系统的输出能精确地跟踪给定的 y R (t ),首先在初始
ξ(0 )= ξ R (0 ),然后由给定的 ξ R (t )和 η ,解

时刻, 必须 对准 ,即
方程(3.3)得出 η(t ),再由(3.4)式解出 u(t) 这个输入 u(t)是能保持
y(t )= y R (t )的唯一解 从上述过程可以看出,(3.3)和(3.4)式好像构造
了一个以 ξ R (t )为输入, η(t ) 为状态, u(t)为输出的 系统 ,它被解
释为原系统的 逆实现
4.2 局部渐近稳定化(镇定)
1.问题的提出:
考虑系统

x = f ( x )+ g( x )u ,
平衡点 x ,不失一般性可取 x = 0 (移动坐标原点)
0 0
能否找到

一个控制 u = α( x ) (状态反馈),使系统 x = f ( x )+ g( x )⋅ α( x )在
处是渐近稳定的,称为局部渐近稳定问题
后面的讨论将说明零动态的概念对处理这个问题是很有用的
2. 线性系统能否稳定化的回顾:
对于一个线性系统, 通过合适的分解总可以分解成能控和不能控

64
非线性系统控制理论

两个子系统 对于能控的子系统总可以通过状态反馈, 使其特征值处在


复平面上任意给定的位置,对于不能控的子系统则状态反馈就不能使特
其特征值配置在任意位置

所以一个线性系统能稳定化的充要条件是: 当不能控子系统的特
征值均在复平面的左半平面,则整个系统是能稳的 否则系统是不能稳

3.命题4.1 假若非线性系统的一阶线性近似系统是渐近能稳的 则原
非线性系统也是渐近能稳的 反之亦然
.
x = f ( x) + g ( x)u
 ∂f 
A=  B = g (0)
因为非线性系统 f ( x) = Ax + f 2 ( x) ,其中  ∂x  x = 0

g ( x) = B + g1 ( x)
若取 u=Fx,

则 x = f ( x )+ g( x )⋅ F x =( A + B F )x + f2( x )+ g 1( x )F x
所以当线性近似系统是能稳的 则 A BF 的特征值均具有负实
部 而在 x = 0 邻域上 后两项是 x的2阶小量 此时该非线性闭环系

0 
统在 x 处也是局部渐近稳定的 反之若线性近似系统是不能稳的 则
不管 u = α( x )取什么规律 其线性近似系统是总有右半平面的特征
值 因而原非线性系统也是不可稳的
由一阶线性近似系统的渐近稳定来判别原非线性系统是否渐近稳
定 称为 一阶线性近似稳定性判别原则 它早由李亚普诺夫和庞加
莱所证明
注意 以上命题没有说明当线性近似系统的不能控子系统中仅仅
包括有虚轴上的特征值时 非线性系统是否能稳的情况 这种情况称
为局部能稳的临界问题

65
非线性系统控制理论

4.命题4.2( 临界问题 ) 若系统的零动态在 η = 0 处是渐近稳定的 那


么通过状态反馈可以使原系统在 ( ξ ,η )=(0 ,0 )处渐近稳定
证明
(1):若系统的相对阶为 r,则可将系统化成正则形
 ξ2   0 
.  M   M  .
ξ= + u , η = q(ξ ,η )
 ξr   0 
   
b(ξ ,η ) a(ξ ,η )
b( ξ ,η )= Lf h( x ), a( ξ ,η )= Lg Lf h( x )≠ 0
r r −1
其中

(2):取

u= ( − Lf h( x )− C 0ξ 1 − C 1ξ 2 − L − C r −1ξ r )

r −1
Lg Lf h( x )

1 r −1
= ( − Lf h( x )− C 0 h( x )− C 1Lf h( x )− L − C r −1Lf h( x ))

r −1
Lg Lf h( x )
可将该子系统化成线性能控的 则只要 C 0 , L ,C r −1 取得适当
总能使 ξ 表示的线性子系统的特征值处在左半复平面内 使该子系统
是渐近稳定的

(3):而另一方面零动态所表示的子系统 η = q( ξ ,η )在( ξ ,η )=(0 ,0 )
处是渐近稳定的
因而综上所述整个系统是渐近稳定的 也即原非线性系统在
( ξ ,η )=(0 ,0 )处是能渐近稳定化的
又若在上述情况中取


u= ( − b( ξ ,η )− C 0ξ 1 − C 1ξ 2 − L − C r −1ξ r + v )
a( ξ ,η )
. .
则系统为 ξ = A ξ + B v ,η = q( ξ ,η ) 由于有参考输入 v的作
用 则当系统是渐近稳定的 v 又是有限的 则运动的轨迹也是有界

66
非线性系统控制理论

5.临界问题举例
考虑系统

x 1x 2 − x 13   0 
   
.  x 1  2 + 2x 3 
x= + u y = h( x )= x 4
 − x 3   1 
 2   
 x1 + x2   0 

 ∗ 
 
∂h  ∗ 
⋅ f = [0 1]  = x1 + x 2

Lf h( x )= 0 0 Lg h( x )= 0
∂x  ∗ 
 2 
x 1 + x2 

 0 
 
2 + 2x 3 
Lg Lf h( x )= [2x 1 1 0 0]   = 2 + 2x 3 ≠ 0
 1 
 
 0 
( 若 x 3 ≠ −1 )
∴当 x3 ≠ −1 时其相对阶为 2
坐标变换

z 1 = Φ 1( x )= x 4
z 2 = Φ 2( x )= x 1 + x 2

z 3 = Φ3( x )= x 3 
 取
z 4 = Φ 4( x )= x 1 
检查:(1)雅可比阵

67
非线性系统控制理论

 0 0 1 0
 
∂Φ 2x 1 1 0 0
:  
∂x  0 0 1 0
 
 1 0 0 0

其行列式 ∂Φ 非奇异
det( ) = −1 ≠ 0
∂x

(2)
 0
 
∗ 
Lg Φ 3 = [ 0 0 1 0]  = 1 ≠ 0
1
 0
 
 0
 
∗ 
Lg Φ 4 = [1 0 0 0]  = 0
∗ 
 0
 
故不满足正则形 但可进行变换
反变换
x1 = z 4
x2 = z2 − z4

x3 = z3
x4 = z1


z1 = z 2
. . .
.z 2 = 2x 1 x 1 + x 2 = 2z 4( z 2z 4 − 2z 4 )+ z 4 +( 2 + 2z3 )u

因取

68
非线性系统控制理论

z 1  z3 
ξ =  , η =  
z 2  z 4 
当考虑平衡点 ξ(0 )= 0 时 即有
z 4 − 4z 4

u=
2 + 2z 3

原系统:
x 2 − 3x 1 0 x1 0 0 0 0

   
 ∂f   1 0 0 0 1 0 0 0
A=  =  = 
 ∂x  x =0
 0 0 − 1 0  0 0 −1 0 
 
1 0 0 x =0 0 1 0 0
 2x 1

0 
 
2
B = g(0 )=  
1
 
0 
原系统中含有不能控的运动模态且其特征值 λ = 0 ,即临界状态 其
零动态
z 4 − 4z 4


z 3 = −z 3 − u = −z 3 −
2 + 2z 3

z 4 = − 2z 4

可由李亚普诺夫定理证明零动态是渐近稳定的 但是其一阶近似
是临界的 这就适合于命题4.2的情况 因而系统是可以渐近稳定的,只
要取

u= ( − Lf h( x )− C 0 h( x )− C 1Lf h( x ))

Lg Lf h( x )

4.3 渐近输出跟踪
1. 何谓渐近输出跟踪:

69
非线性系统控制理论

前面业已提出欲使系统的输出能精确地复现给定的参考输出
y R (t )必须满足这样两个条件:
(1):初始时刻要对准,
即 ξ (0) = ξ R (0) = Col ( y R (0) y R( 0 ) (0) L y R( r −1) (0))
(2):
y R ( t ) − b(ξ R ( t ), η ( t ))
( r)

u( t ) =
a(ξ R ( t ), η ( t ))

其 中 η(t ) 是 η(t )= q( ξ R (t ),η(t )) 在 初 始 条 件 η(0 )= η 下 的

这实际上是种开环处理的方法 很难达到目的
(1)初始时刻很难对准
(2)何况可能存在干扰 使y(t)偏离期望的值
所以比较现实的是不论初始状态是否有偏差 也不论是否受到扰
动 要研究实际的输出能否渐近收敛到所给定的参考函数 y R (t ) 这个
课题就叫做渐近输出跟踪
2.如何实现渐进输出跟踪
自动控制原理中的一个最重要的概念 反馈
我们来研究一下如何利用反馈来实现
从正则形出发

70
非线性系统控制理论

.
z1 = z2
.
z2 = z 3
.
M
z r −1 = z r
.
z r = b(ξ , η ) + a(ξ , η ) ⋅ u
.
η = q (ξ , η )
y = z1
我们来定义一个新的变量 误差 e( t ) = y ( t ) − y R ( t )
因 y = z 1 ,∴用
e1 ( t ) = z 1 ( t ) − y R ( t )
.
e = e2 ( t ) = z 2 ( t ) − y R ( t )
( 1)

..
e = e3 ( t ) = z 3 ( t ) − y R ( t )
(2)

M
( r−1) ( r−1)
e = er ( t ) = z r ( t ) − y R (t )
. .
= er ( t ) = z r ( t ) − y R ( t )
(r) (r)
e
选择控制u的目的
(1)一方面使系统精确线性化
(2)构成负反馈 驱动系统向着消除误差的方向运动
64e7 (t )
48 i

1 r
( − b( ξ ,η )+ y R (t )− ∑C i −1( zi − y R ))
( i −1 )
故选择 u(t )=
(r )

a( ξ ,η ) i =1


我们将该控制规律代入 z r 式 得

z r = y R (t )− C 0e1 − C 1e2 − L − C r −1er
(r )

( r −1 )
= −C 0e − C 1e − L − C r −1e
(r ) ( 1)


( r −1 )
+ C r −1e + L + C 1e + C 0e = 0
(r ) ( 1)

71
非线性系统控制理论

这是误差e的r阶线性常微分方程 只要系数C 0 , L ,C r −1 取得好


让其特征方程的根均在左复平面内 不论初始误差多大 最后均能使 e
及其各阶导数收敛到零 而且收敛的快慢在理论上也可以由系数
C 0 , L ,C r −1 的配置来决定

由于
( i −1 ) ( i −1 )
zi = y R +e

ξ R (t ) = Col ( y R (t ), y R(1) (t ), L , yR( r −1) (t ))

χ (t ) = Col ( e(t ), e(1) (t ), L , e( r −1) (t ))


因此 η(t )应满足下列微分方程

η = q( ξ R (t )+ χ(t ),η(t ))
由于 ξ R ( t )是时间的确定函数 因而由上述 u 所驱动的系统本质
上是时变非线性系统
3.推广 渐近模型匹配
(1)何谓渐进模型匹配
若期望的输出 y R (t )不以某时间确定函数的形式给出 而以某参考
模型的输出的形式给出 特别是参考模型是一个简单的线性系统 例


ζ = Aζ + Bw
yR =C ζ
则提出问题 找一个反馈控制规律 不论系统和模型的初始状态
如何 使系统的输出y(t)渐近地收敛到在w(t)作用下参考模型产生的相
应输出 y R (t )
(2)如何实现
我们可以考虑采用前述相似的控制u 因为

72
非线性系统控制理论

y R ( t ) = Cζ

. .
y R (t ) = C ζ = CAζ + CBw

.. . . .
y R (t ) = CAζ + CB w = CA2ζ + CABw + CB w

y R( i ) (t ) = CAiζ + CAi −1Bw + L + CBw( i −1)

r
1
u(t ) = ( −b(ξ ,η ) + y R( r ) (t ) − ∑ Ci −1 ( zi − y R( i −1) ))
a(ξ ,η ) i =1

因此可以看出在控制 u(t)中包含 ξ ,η ,ζ 还有 w(t)的各阶导数 如果


用一个专门的装置来得到 u(t) 那么对 w(t)的微分将不可避免的提升
附加噪声的影响 这在实际中是很难处理的
然而若模型的相对阶等于或大于系统的相对阶 r,则由于:
r −2
CB = CAB = L = CA B = 0
y R ( t ) = CA ζ 0≤i ≤ r −1
(i ) i

y R ( t ) = CA ζ + CA Bw
(r) r r −1

则 u(t)得到简化,不包含 w(t)的导数 此时
r
1
u(t ) = ( − b(ξ ,η ) + CArς + CAr −1Bw − ∑ Ci −1 ( zi − CAi −1ς ))
a(ξ ,η ) r −1
r
1
= ( − Lrf h( x ) + CArς + CAr −1Bw − ∑ Ci −1 ( Lif−1h( x ) − CAi −1ς ))
Lg Lrf−1h( x ) i =1

⇒ α (ς , x ) + β (ς , x )w

当 C 0 , L , C r −1 选得恰当时 误差及其各阶导数将收敛到零 即意味



着输出 y (t ) 渐进的接近模型的输出 y R (t ) 因 ς (⋅) 是线性系统 故
t
y R (t ) = Ce At ς (0) + ∫ Ce A( t −τ ) ⋅ Bw(τ ) ⋅ dτ
0
t
y (t ) = e(t ) + Ce ς (0) + ∫ Ce A( t −τ ) Bw(τ ) ⋅ dτ
At
0

73
非线性系统控制理论

以图表示

e→0
w •
ς = A ς + Bw yR = Cς

ς

x = f ( x) + g ( x)u
α(ς , x) + β (ς , x)w u
y = h( x ) y
w
x

4.4 干扰解耦
1. 何谓干扰解耦
考虑系统

x = f ( x) + g ( x)u + p( x) w
y = h( x )
w(t ) 为干扰 不希望的输入
我们希望通过反馈控制 u = α ( x) + β ( x)v 使系统的输出 y与 w 无
关 就是说 y与 w 解耦 研究这个问题就叫做干扰解耦问题
2. 命题 6.1 若系统在 x 0 处的相对阶为 r 则当且仅当 L p Lif h( x) = 0
对所有 0 ≤ i ≤ r − 1 和所有 x 0 附近的 x 成立 则干扰解耦问题有解
且解为
Lrf h( x) v
u=− r −1
+ r −1
L g L f h( x ) L g L f h( x )
证明
1 充分性 因

x = f ( x) + g ( x)u + p( x) w
y = h( x )
相对阶为 r 为使其成为正则形 取坐标变换 则

z = Col[h( x ) L f h( x ) L Lrf−1h( x ) φr +1 L φn ( x )]

74
非线性系统控制理论

• ∂z1 • ∂h( x)
z1 = ⋅x = [ f ( x) + g ( x)u + p( x) w]
∂x ∂x
= L f h( x) + Lg h( x)u + L p h( x) w
= L f h( x ) = z 2
其中因相对阶为 r L g h( x)u = 0 由于条件成立 L p h( x) w = 0
• ∂L f h( x) • ∂L f h( x)
z2 = ⋅x = [ f ( x) + g ( x)u + p( x) w]
∂x ∂x
= L2f h( x) + L g L f h( x)u + L p L f h( x) w
= z3
同理 Lg L f h( x )u = 0 但 L p L f h( x ) w = 0
M
直到

z r −1 = z r

z r = Lrf h( x) + L g Lrf−1 h( x)u + L p Lrf−i h( x) w
其中 L g Lrf−1 h( x)u ≠ 0 L p Lrf−1 h( x) w = 0
Lrf h( x) v •
当取 u = − + 时 zr = v
L g Lrf−1 h( x) L g Lrf−1 h( x)
故方程变成
ξ 2  0

 M  M 
ξ =   =  v
ξ r  0
   
 0  1

η = q(ξ ,η ) + k (ξ ,η ) w
y = ξ 1 = z1
从此式可见 w 影响不了 y

75
非线性系统控制理论

(2)必要性
若系统通过状态反馈 u = α ( x) + β ( x)v 实现了干扰解耦 无论 v 是
否为零 对于干扰解耦没有影响 所以
 •
 x = f ( x) + g ( x)u + p ( x) w
 = f ( x) + g ( x)α ( x) + p( x) w
 y = h( x )

是干扰解耦的
∂h( x) • ∂h( x)
y (1) = ⋅x = [ f ( x) + g ( x)α ( x) + p( x) w]
∂x ∂x
= L f h( x ) + L g h( x ) ⋅ α ( x ) + L p h( x ) ⋅ w
其中因相对阶为 r L g h( x ) ⋅ α ( x ) = 0
因为 y 与 w 无关
(1)
只有使 L p h( x) = 0
∂L f h( x) •
y ( 2) = ⋅ x = L2f h( x) + Lg L f h( x) ⋅ α ( x) + L p L f h( x) ⋅ w
∂x
其中 L g L f h( x) ⋅ α ( x) = 0
因为 y ( 2 ) 与 w 无关 只有使 L p L f h( x) = 0
如此一直求下去 应有 L p Lrf−1 h( x) = 0
此时 y ( r ) = Lrf h( x) + L g Lrf−1 h( x) ⋅ α ( x) 其中 L g Lrf−1 h( x) ⋅ α ( x) ≠ 0

Lrf h( x)
α ( x) = −
L g Lrf−1 h( x)
所以条件 L p Lif h( x) = 0, 0 ≤ i ≤ r −1 x在 x 0 领域中是必要的
3. 几点评注
1 前面已经提过 可以选择
v = −(C0 h( x ) + L + Cr −1Lrf−1h( x )) + v

76
非线性系统控制理论

通过选择 C 0 , L , C r −1 使系统满足一些附加的特性 具有一


定收敛速度的渐进稳定性
2 条件 L p Lif h( x) = 0 的几何选择
因为 L p Lif h( x) = 0 即 dLif h( x) ⋅ p ( x) = 0
或 < dLif h( x), p ( x) >= 0 0 ≤ i ≤ r −1
则令协分布 Ω = Span{dh( x), L , dLrf−1 h( x)} 那么条件就是
p ( x) ∈ Ω ⊥ ( x), x ∈ x 0 的邻域
3 当干扰 w 可 量测 时 则可以通过测量得到的 w 来构造一个前
馈补偿 使系统达到干扰解耦 即取 u = α ( x) + β ( x)v + γ ( x) w

x = f ( x) + g ( x)u + p ( x) w
= f ( x) + g ( x)α ( x) + g ( x) β ( x)v + g ( x)γ ( x) w + p ( x) w
= f ( x) + g ( x)α ( x) + g ( x) β ( x)v + ( g ( x)γ ( x) + p ( x)) w
y = h(x)
与命题的情况相比较其干扰解耦的条件为
( g ( x)γ ( x) + p ( x)) ∈ Ω ⊥ 即 L gγ + p Lif h( x) = 0

L gγ + p Lif h( x) = dLif h( x)( gγ + p )
= L gγ Lif h( x) + L p Lif h( x) = 0 (0 ≤ i ≤ r − 1)
结合系统的相对阶为 r 故得出下列条件
i 当 0 ≤ i ≤ r − 2 时 L p Lif h( x) = 0
ii 当 i = r − 1时 Lgγ Lrf−1h( x ) + Lp Lrf−1h( x ) = 0
即 L g Lrf−1 h( x) ⋅ γ ( x) + L p Lrf−1 h( x) = 0
解得
L p Lrf−1 h( x)
γ ( x) = −
L g Lrf−1 h( x)
综上所述
Lrf h( x ) − v + Lp Lrf−1h( x )w
u=−
Lg Lrf−1h( x )
此条件弱于命题 6.1 的条件

4.5 高增益反馈
1.问题的提出

77
非线性系统控制理论

前面我们已经讨论了局部镇定问题 说的是若零动态的一阶近似
是临界的 但是零动态是渐进稳定的 则可以通过状态反馈使系
统渐近稳定 这一节我们将讨论如果零动态的一阶线性近似是渐
近稳定的 则用输出反馈就可以局部镇定系统
2.命题 7.1 考虑系统

x = f ( x) + g ( x)u
y = h( x )
且设 f (0) = 0, h(0) = 0 并假设系统的相对阶 r=1 而且其零动态
在 x=0处的一阶线性近似是渐近稳定的 即下列矩阵的特征值都具有
负实部
 ∂q (ξ ,η ) 
Q= 
 ∂η  (ξ ,η ) =( 0, 0)
则考虑用输出反馈来构成闭环控制 此时

x = f ( x) + g ( x)u , y = h( x )
u = − kh( x)
其中为保证系统为负反馈 取
若 L g h(0) > 0 取 k > 0
若 L g h(0) < 0 取k < 0
那么就存在一个正实数 k 0 使得对于所有 k ≥ k0 系统在 x=0处
是渐近稳定的
证明 严格的证明可参阅奇异摄动理论
我们来证明 L g h(0) < 0 的情况 L g h(0) > 0 的情况完全类似
1
令k = − 当ε → 0时 k →∞
ε
• 1
故 x = f ( x) + g ( x)(− k ⋅ h( x)) = f ( x) + ⋅ g ( x ) h( x )
ε

则 ε x = εf ( x) + g ( x)h( x) = F ( x, ε )
dx dx dt
令 t = ε ⋅τ 则 x(t ) = x(ε ⋅ τ ) 记为 x ′ = = ⋅
dτ dt dτ

故 x ′ = x⋅ ε = εf ( x) + g ( x)h( x) = F ( x, ε )
对于平衡点 x ′ = 0 则 F ( x, ε ) = 0 当 ε → 0 时 就有 F ( x,0) = 0
t
由于 τ = 所以 x ′ 表示的是慢变状态 x ′ = F (x,0)
ε
取其一阶线性近似 可得雅可比阵

78
非线性系统控制理论

∂ ( g ( x)h( x)) ∂g ( x) ∂h( x)


Jx = = ⋅ h( x ) + g ( x ) ⋅
∂x ∂x ∂x
因在平衡点处 h( x) = 0 而 g ( x) ≠ 0 故
∂h( x)
J x g ( x) = g ( x) ⋅ g ( x ) = g ( x ) ⋅ L g h( x )
∂x
这就说明 g (x) 是 J x 的特征向量 特征值是 λ ( x) = Lg h( x) < 0 因而
x ′ = F (x,0) 是渐近稳定的
由于已知系统的相对阶 r=1 所以其正则形为

ξ 1 = b(ξ ,η ) + a(ξ ,η ) ⋅ u

η = q(ξ ,η )
y = ξ1
1
故 u = −kh( x) = − kξ 1 = ⋅ ξ1
ε
• •
则有 ε ξ 1 = ε ⋅ b(ξ ,η ) + a(ξ ,η ) ⋅ ξ1 且 ε η = ε ⋅ q(ξ ,η )
 •  ε ⋅ b(ξ ,η ) a(ξ ,η )ξ 
ξ
所以有 ε  •1  =   + 0
1

η   ε ⋅ q (ξ ,η )   
 
因此从前面的讨论可知当 ε → 0 时 系统时渐近稳定的

由于在平衡点处 y = ξ = 0 所以 η = q (0,η ) 正是系统的零动态 由
于已假设的零动态有一阶线性近似是渐近稳定的 所以总可以存在一
个足够小的 ε 0 > 0 只要 ε ∈ (0, ε 0 ) 系统在 x=0处是一个孤立的平衡
点 并且是渐近稳定的
附注 用线性系统为例理解

y
G s

对线性系统来说 如果相对阶为 1 则意味着 G (s ) 的分子与分母的阶


数相差为 1

79
非线性系统控制理论

bn −1 s n −1 + L + b0
G ( s) =
s n + L + a1 s + a 0
说明开环有 n 个极点和 n-1个零点 零动态是渐近稳定的 说明所
有零点均在左半平面 则从根轨迹的观点来看 当 k → ∞ 时 系统的
所有极点或者趋向零点 或者趋向 ∞ 所以可使系统渐近稳定
因此对于相对阶为 1 的线性系统来说 当所有的零点处在左半复
平面时 对于充分大的开环增益 则所有根轨迹的分支也都处在左半
复平面中

3.推广 相对阶 r > 1 时的情况


对于这种情况 我们可以假设一个 虚拟 的输出函数 w 在这个
虚拟的输出下 使系统的相对阶等于 1 然后再利用上述结果来处理
现在令
w = k ( x) = Lrf−1 h( x) + C r −2 Lrf− 2 h( x) + L + C1 L f h( x) + C 0 h( x)
其中 C 0 , C1 , L , C r − 2 是要选取的实数
则系统成为

x = f ( x) + g ( x)u
w = k ( x)
若原系统在 x 0 = 0 处的相对阶为 r 则现在系统在 x 0 = 0 处的相对
阶为 1
因为
L g k ( x 0 ) = Lg Lrf−1 h( x 0 ) + L + C1 L g L f h( x 0 ) + C 0 L g h( x 0 )
= L g Lrf−1 h( x 0 ) = L g Lrf−1 h(0) ≠ 0
所以就适用命题 7.1
现在就要检查以下系统的零动态的渐近特性
以前已经指出 零动态是强使系统的输出为零时系统内部存在的
一种动态 这个动态特性的本质与取什么样的坐标表示无关 现在虚
拟的输出为 w 所以当 w=0时意味着
w = Lrf−1h( x ) + L + C1L f h( x ) + C0 h( x ) = 0
如果我们仍采用原来的坐标 Z 并且选择 u (t ) 使 w(t ) = 0 就有
w = z r + C r − 2 z r −1 + L + C1 z 2 + C 0 z1 = 0
z r = −(C r − 2 z r −1 + L +C 1 z 2 + C 0 z1 )

• • ∂w • ∂w
并且 w = 0, w = ⋅x= ( f ( x ) + g ( x )u ) 可解的相应的 u ,则此
∂x ∂x
时的零动态用 z及η 表示为

80
非线性系统控制理论


z1 = z2

z 2 = z3
M

z r −1 = z r = −(C r − 2 z r −1 + L + C1 z 2 + C 0 z1 )

η = q( z1 , z 2 ,
,−(C r − 2 z r −1 + L + C1 z 2 + C 0 z1 ),η )
L
∗ 0
这些方程具有一种 块三角形 的形式 f阵形如   因
∗ ∗
此当原系统的零动态的一阶线性近似是渐近稳定的 且下列多项式的
所有根都具有负实部时 则该系统的一阶近似也是渐近稳定的
n( s ) = s r −1 + C r − 2 s r −2 + L + C1 s + C 0
于是由命题 7.1 可得出 当 n(s ) 的根都具有负实部 而且原系统的
零动态的一阶线性近似是渐近稳定的 再取 k 的符号与 Lg w(0) 相同
r −1
即与 Lg L f h(0) 符号相同 则反馈控制
r −1 r −2
u = −k ( L h( x) + C r − 2 L h( x) + L + C1 L f h( x) + C 0 h( x))
f f 7.3
能使系统在平衡点 x=0处渐近稳定
从式(7.3)可见 反馈 w 实际上是一种状态反馈 部分状态 因为
(i )
L f h( x ) (0 ≤ i ≤ r − 1) 与函数 y对时间取 i 阶导数是一致的 所以
当 w 用 y来表示时
w(t ) = y ( r −1) (t ) + C r −2 y ( r − 2 ) (t ) + L + C r y (1) (t ) + C 0 y (t )
因而 w( s ) = n( s ) ⋅ y ( s )
所以所假设的虚拟输出 w 可以看成是原系统的输出 y通过一个传
递函数为 n(s ) 的线性滤波器来得到的 然而由于 n(s ) 是包含高阶微分
的滤波器 因而是物理不能实现的 但是在不危及相应闭环稳定性的
条件下可以用一个物理可实现的近似滤波器来代替 命题 7.3 实际应
有的考虑

如果系统 x = f ( x) − g ( x) ⋅ k ( x) ⋅ K 在平衡点 x 0 = 0 处是一阶近似渐
近稳定的 那么当 T是一个充分小的正数时 系统

x = f ( x) − g ( x) ⋅ ζ
• 1
ζ = ( )(−ζ + k ( x) ⋅ K )
T
在 ( x, ζ ) = (0,0) 处也是一阶近似稳定的 其后一个方程可以用方框图表

81
非线性系统控制理论


K(x)k ζ ζ K ⋅ k (x)
ζ
1
∫ 或
1
Ts + 1
T

证明 该命题仍可以用奇异摄动理论来加以证明
若设一个新的变量 z 并令
z = −ζ + k ( x) ⋅ K
• • ∂k ( x) • 1 ∂k ( x)
z = −ζ + K ⋅ ⋅ x = ( )(−ζ + k ( x) ⋅ K ) + K ⋅ x
∂x T ∂x
则 ζ = − z + k ( x) ⋅ K


x = f ( x) − g ( x) ⋅ (− z + k ( x) ⋅ K )
• ∂k ( x)
T z = − z + TK ( )[ f ( x) − g ( x) ⋅ (− z + k ( x) ⋅ K )]
∂x
= − z + Tb( z , x)
t
若令 τ = 当T → 0 时 τ → ∞ τ 表示一个慢变过程
T
• • dτ 1 • •
将 z t = zτ ⋅ = ⋅ z τ 代入上式 得 z τ = − z + Tb( z , x)
dt T
故当T = ε 足够小时 第 2 项 → 0 该方程表示一个仅仅有一个为
-1的非平凡特征值的子系统 除了这个子系统之外系统降阶为

x = f ( x) − g ( x) ⋅ k ( x) ⋅ K

综上所述 由假设 x = f ( x) − g ( x) ⋅ k ( x) ⋅ K 的一阶近似是渐近稳定
的 对于足够小的 T 附加子系统的特征值又趋于-1 其一阶线性近似
也是渐近稳定的 因此该系统在平衡点 ( x, ζ ) = (0,0) 处的一阶近似的确
是渐近稳定的 这说明这样一个事实 即在闭环控制中引入 小时间
常数 的非周期环节不会危害它的渐近稳定性 至少对局部来说
将该性质应用 r-1次 我们立即可以得出下列结论
5.命题 7.4
假设系统在 x 0 = 0 处的相对阶为 r 并且其零动态的一阶近似是渐
近稳定的 再假设下列多项式的根
n( s ) = s r −1 + C r −1 s r −2 + L + C1 s + C 0

82
非线性系统控制理论

全都具有负实部 则具有下列参考函数的线性输出反馈控制
− Kn( s )
H (s) =
(1 + Ts ) r −1
能稳定系统 只要 K 取适当大 且其符号与 L g Lrf−1 h(0) 相同 而 T
是充分小的正数

4.6 关于精确化问题的补充
1.问题的提出
回顾一下精确线性化问题的主要命题

说的是系统 x = f ( x )+ g( x )u 其状态空间精确线性化问题在

x 处能解的充分必要的条件是
0 0 n −2 0 n −1 0
( i)矩阵[ g( x ),ad f g( x ),ad f g( x ),ad f g( x )]的秩是 n
n −2
( ii)分布 D = Span{ g ,ad f g , L ,ad f g }在 x 处是对合的

也就是说上述条件满足时一定存在一个实值函数 λ( x ),当取 y
λ( x )时 使系统的相对阶为 n
现在的问题是 若上述条件不成立 则通过坐标变换和状态反馈
是不能使系统变成线性能控的系统的 但是否总能使系统分解为两个
子系统 其中有一个子系统是线性的 我们希望至少能找到一种坐标
变换及状态反馈使线性子系统的维数最大 换句话说找到一个适当的
输出映射 λ( x ) 此时系统在该点的相对阶最高 这个问题就是我们在
本节中所要讨论的
2.预备知识 分布 ∆ 的对合闭包( 记为inv( ∆ ) )
分布的对合性
考虑向量场 f1 , L ,fd 分布 ∆ = Span{ f1 , L ,fd }
充要条件 若李括号运算[ fi ,fj ]∈∆ ,对所有 1 ≤ i ,j ≤ d 均成立
则∆ 是 对合分布
判别方法
rank[ f1 , L ,fd ]= ?rank[ f1 , L ,fd ,[ fi ,fj ]( x )]
若相等则是对合的 否则不是对合的
从对合的性质可知
若分布 ∆ 1 是对合的 ∆ 2 也是对合的
则 ∆ 1 + ∆ 2 不一定是对合的

83
非线性系统控制理论

但 ∆ 1 ∩ ∆ 2 是对合的
因此如果 ∆ 不是对合的
但 ∆ 1 包含 ∆ 而 ∆ 1 是对合的
又 ∆ 2 包含 ∆ ∆ 2 也是对合的
则 ∆ 1 ∩ ∆ 2 也包含 ∆ 且 ∆ 1 ∩ ∆ 2 是对合的

则由所有包含 ∆ 的对合分布族 ∆ 1 ,∆ 2 , L 的交 可以得到一个包


含 ∆ 的最小的对合分布 称为 ∆ 的对合闭包 记为inv( ∆ )
对合闭包的求法 大致可以这样来做
若 分 布 ∆ = Span{ f1 , L ,fd } 则若 ∆ 不 是 闭 合 的 就是说
[ fi ,fj ]( x ) 不 在 ∆ 中 因 而 看 看
∆ ′ = Span{ f1 , L ,fd ,[ fi ,fj ]( x )}是否是对合的 若 ∆ ′ 是对合的
则 ∆ ′ 就是 ∆ 的对合闭包 否则继续做下去 便能找出inv( ∆ )来
2.定理 8.1
考虑分布 ∆ 并假设 λ( x )是实值函数 且 dλ( x )≠ 0 及 dλ ∈ ∆
0 ⊥

dλ ∈(inv( ∆ ))
0 ⊥
那么在 x 的邻域上
证明 考虑分布 Γ =( Span{ dλ }) 则这个分布在 x 的邻域上是( n - 1 )
⊥ 0

维的
并由 Frobenius定理可知 Γ 是对合的 再由构造可知 ∆ ⊂ Γ
由定义可知inv( ∆ )是包含 ∆ 的最小对合分布 所以
Γ ⊃ inv( ∆ )
即是 Span{ dλ }⊂(inv( ∆ ))

3.定理 8.2( 最大相对阶定理 )


考虑一对向量场 f( x ) g( x ) 假设对某个整数 γ

在某 x 处有
γ −2
( 1 ) dim (inv( Span{ g ,ad f g , L ,ad f g }))= k < n 而
γ −1
( 2 ) dim (inv( Span{ g ,ad f g , L ,ad f g }))= n
则就存在一个函数 λ( x )使系统

84
非线性系统控制理论


x = f ( x )+ g( x )u
y = λ( x )
在 x 处的相对阶为 γ 而对于任何其他的输出映射 y ′ = λ ′( x )

系统的相对阶低于或等于 γ
证明
γ −2
( 1 )因为inv( Span{ g , L ,ad f g }是 k维( k < n 的
) 且是对合的
由 Frobenius定理 就一定存在 n - k个函数 λ 1( x ), L ,λ n − k ( x ) 它
们的微分张成上述分布的零化子( 局部地 )
λ( x )= λ 1( x ) 则对所有 x 附近的 x有

如果我们令
Lg λ( x )= Lad g λ( x )= L = Lad g λ( x )= 0

γ −2

λ( x )≠ 0

而且可以证明 L γ −1
ad f g

这可以用反证法 因为假若上述结论是错的 那么非零向量 dλ( x )


γ −2 γ −1
将属于分布 Span{ g , L ,ad f g ,ad f g }的零化子
γ −2 γ −1
dλ( x )∈( Span{ g , L ,ad f g ,ad f g })
0 ⊥
即 则由定理 8.1
γ −2 γ −1
dλ( x )∈(inv( Span{ g , L ,ad f g ,ad f g })) ,但这是矛
0 ⊥

盾 的 不 可 能 的 因 为 已 由 假 设 条 件
γ −2 γ −1
inv( Span{ g , L ,ad f g ,ad f g })是 n 维的 所以它的零化子是 0
维的 所以一维非零的 dλ( x )不可能属于它的零化子 因而由相对阶

的定义可知系统的相对阶为 γ
( 2 )再来考虑任何其他的 λ ′( x )为其输出函数 并假设此时对应的相对
阶为 r 所以 dλ ′ ∈ ( Span{g , L , ad rf − 2 g}) ⊥
由定理 8.1 dλ ′ ∈ (inv ( Span{g , L , ad rf − 2 g})) ⊥
因为 dλ ′ ≠ 0 故 dim(inv ( Span{g , L , ad rf − 2 g})) < n
对 于 假 设 ( 1 ) 及 ( 2 ) 便 可 推 知 r ≤γ
( Q r − 2 ≤ γ − 2, ∴ r ≤ γ )

4.7 具有线性误差动态的观测器
1.问题的提出
在线性系统理论中 用状态反馈进行系统极点配置与观测器用前向

85
非线性系统控制理论

增益阵使其具有给定的特征值的观测器设计是一个对偶问题 那么在
非线性系统中从某种意义上讲 本节所要讨论的问题也就是第 2 节中
状态空间精确线性化问题的对偶问题
众所周知 观测器的动态与观测误差的动态是相同的 观测误差定
义为未知的状态与估计状态之差 由此看来 如果我们希望将前面已
经研究过的一定结果来作对偶处理 就引出误差动态的非线性观测器
的综合问题 有可能在作了适当的坐标变换之后这个动态变成线性的
且在频谱上 或其特征值 可以进行配置的
为简单起见 在考虑观测器综合时 先考虑无外加输入及标量输出
的情况
系统方程

x = f( x ) ( 9.1a )
y = h( x ) ( 9.1b )
并假定存在一种坐标变换 z = Φ( x ) 在此变换下 若上述方程变


 ∂Φ( x ) .   ∂Φ( x ) 
z= ⋅x = ⋅ f ( x ) = A z + k(C z )
 ∂x  x = Φ ( z )  ∂x
−1  x =Φ ( z )
−1

y = [ h( x )]x = Φ ( z ) = C z
−1

( A ,C )是能观测对 k(⋅ )是 n 维时变函数的向量 则可构成这样的


观测器


ξ = A ⋅ ξ + k(C z )− G C z + G C ξ
=( A + G C )ξ − G y + k( y )
e = ξ − z = ξ − Φ( x )
. . .
e = ξ− z

86
非线性系统控制理论

则误差动态

e =( A + G C )ξ − G y + k( y )− A z − k( y )
=( A + G C )ξ −( A + G C )z
=( A + G C )e

这是线性的 又因( A ,C )是能观对 故可通过 n 维实数向量 G 使


其特征值配置在希望的位置
关键的问题是要找这样的坐标变换 z = Φ( x ) 及与此有关的映射
k(⋅ ) 这个问题就称为观测器线性化问题 其正式叙述如下

已知一个无外加输入的系统( 9.1 ) 及初始状态 x 是否能找到一
以及定义在 U 上的坐标变换 z = Φ( x ) 和输出映射
0 0 0
个 x 的邻域 U
k h(U )→ R 使得对所有 z ∈Φ(U ) 有
0 n 0

 ∂Φ 
 f ( x ) = A z + k(C z )
 ∂x  x =Φ −1
(z )

−1
h( Φ ( z ))= C z
其中矩阵 A 和行向量 C 是能观对 即满足
 C 
 
 C A 
rank  =n
 M 
 n −1 
C A 
2.定理 9.1 观测器线性化问题能解的必要条件是
n −1
dim ( Span{ dh( x ),dLf h( x ), L ,dLf h( x )})= n
0 0 0

证明
由线性系统理论可知如果( A ,C )是能观对 则一定可以通过坐标变
换将它化成所谓能观标准形 所以一定有这样的 T和 G 使

87
非线性系统控制理论

0 0 L 0 
 
1 0 L 0 
A = T ( A + G C )T − 1 = 
0 O 0 M 
 
0 0 L 10
C = C T − 1 =[0 , L .1]
不失一般性 若( A ,C )能观测 则直接就假设它们具有这种形式
如果新坐标取
z 1 
 
z=M 
 
z n 
则有 y = C z = zn

而由 z = A z + k(C z )= A z + k( z n )
可得

z 1 = k1( z n )

z 2 = z 1 + k n( z n )
M

z n = z n −1 + k n( z n )
故 h( x )=z n
∂z n ∂z . .
L f h( x ) = ⋅ f = n ⋅ x = z n = z n −1 + k n ( z n )
∂x ∂x

∂L f h ( x ) ∂z ∂k ( z )
L2f h( x) = ⋅ f = n −1 ⋅ f + n n ⋅ f
∂x ∂x ∂x

88
非线性系统控制理论

.
• ∂k n (⋅) ∂zn .
= z n −1 + ⋅ ⋅x
∂zn ∂x

= z n − 2 + k n − 1 ( z n , z n −1 )

Lif h( x) = z n −i + k n −i +1 ( z n , z n −1 , L , z n −i +1 )

Lnf−1 h( x) = z1 + k 2 ( z n , z n −1 , L , z 2 )

 ∂h ( x )   ∂h ∂z   ∂h 

 dh( x)   ∂x   ∂z ∂x   ∂z 
 dL h( x)   ∂L f h( x)   ∂L f h ∂z   ∂L f h 
=      ∂z
 f
 ∂ x  =  ∂z ⋅ ∂x  =  ∂z  ⋅
 
  M  ∂x
M
 n −1   n −1M   M
dL f h( x)  ∂L f h( x)   ∂L f h ∂z   ∂L f h 
n −1 n −1

   ⋅   
 ∂x   ∂z ∂x   ∂z 

0 L L L 1
0 L L 1 ∗
 ∂Φ ( x )
= 0 L 1 ∗ ∗ ⋅
  ∂x
M N M M M
1 ∗ L L ∗
∂Φ( x )
由于 为坐标变换的雅可比阵 它是非奇异的
∂x
所以

89
非线性系统控制理论

 dh( x ) 
 
 M  应是非奇异阵
 n −1 
dL
 f h( x ) 
n −1
这就证明了 dim ( Span{ dh( x ),dLf h( x ), L ,dLf h( x )})= n
0 0 0

推论 由于这个条件满足 所以可以使下列方程有唯一的解 τ( x )
 dh( x )  0
   
 dLf h( x )  M 
  τ( x ) =   ( 9.7 )
 M  0
 
 n −1   
dLf h( x ) 1
即有
n −2
Lτ h( x )= Lτ Lf h( x )= L = Lτ Lf h( x )= 0
n −1
Lτ Lf h( x )= 1
3.定理 9.2( 充分必要条件 )
观测器线性化问题能解的充分必要条件是
n −1
( i ) dim ( Span{ dh( x ),dLf h( x ), L ,dLf h( x )})= n
0 0 0

( 即定理 9.1 的条件 )


n 0 0
( ii )在 R 的某个开集 V 上存在一个映射 F 它映射到 x 的邻域U
上 对
所有 z ∈V 满足
∂F
=[τ( x ),− ad f τ( x ), L ,( − 1) ad f τ( x )]x = F ( z )
n −1 n −1
( 9.8 )
∂z
其中向量场 τ( x )是方程( 9.7 )的唯一解
证明 略
4.观测器线性化问题的求解过程
( 1 )首先检查条件( i ) 若条件满足 则进行下面步骤
( 2 )解方程( 9.7 )得到向量场 τ( x )
( 3 )再检查条件( ii ) 实际上要解偏微分方程( 9.8 ) 找到函数 F (⋅ )
并使 F ( z )= x
0 0 0 0
它定义在 z 的邻域V 上
−1
( 4 )然后得到 Φ = F
( 5 )显然可计算出映射 k(⋅ )

90
非线性系统控制理论

 k1( z n )  0 
   
 k2( z n )  ∂Φ   z1 
k( z n )=  = ⋅ f ( x ) − 
 M   ∂x  x =Φ −1
(z )  M 
   
k n( z n ) z n −1 
( 6 )最后可以得到满足要求的观测器方程

ξ =( A + G C )ξ − G y + k( y )
其中
0 0 ⋅ ⋅ ⋅ 0
1 0 ⋅ ⋅ ⋅ 0 
 
A = 0 1 ⋅ ⋅ ⋅ 0 C = [0, L ,1]
 
⋅ ⋅ ⋅ ⋅
0 ⋅ ⋅ ⋅ 1 0
G 是根据所要求的观测器动态来设计

4.8 举例
考虑一个简单的单连杆机械手

在实践中 机械的运动往往用一个长轴或传送带来传动 或者用


电机的电枢来驱动 这时显示的谐振频率常常与控制讯号的频率在同
一个范围之内
作动器与连杆之间的弹性耦合影响 其数学模型常常可以用一个线
性的扭簧来表示 本例中的数学模型可以用两个二阶方程来描写 一
个是驱动轴的力学方程 另一个是连杆的力学方程 q1 ,q 2 表示驱动轴
与连杆的角位移( 相对于固定参考系)

91
非线性系统控制理论

.. .
K q
J 1 q1 + F1 q1 + ( q 2 − 1 )= T
N N
.. .

J 2 q 2 + F2 q2 + K ( q 2 − 1 )+ m gdC osq2 = 0

其中 N 传动比
m 杆的质量
d 杆的重心至转轴中心的距离
. .
取状态变量 x = C ol( q1 ,q 2 ,q 1,q 2 ) 控制 u = T 则将上述方程化成
状态方程
 x3 
 
 x 4 
 −K K F1 
f ( x )=  2
x 1
+ x 2
− x 3 
 J 1
N J 1
N J 1 
 K K m gd F2 
 x 1
− x 2
− C osx 2
− x4 
J 2N J2 J2 J 2 
0 
 
0 
g( x )=  1 
 
J 1 
 0 

y = h( x )= x 2 ( 观测 q 2 )

92
非线性系统控制理论

∗
x 
∂h ( x )
∴ L f h( x ) = ⋅ f ( x) = [0 1 0 0] 4  = x 4
∂x ∗
 
∗

 ∗ 
∂L f h ( x )  ∗ 
L2f h( x) = ⋅ f ( x) = [0 0 0 1]  = f ( x)
∂x  ∗ 
4

 
 f 4 ( x)

∂L2f h( x)
L3f h( x) = ⋅ f ( x)
∂x

 K K mgd F 
= ,− + Sinx 2 ,0, 2  ⋅ f
 J2N J2 J2 J2 

K K mgd F
= x3 + (− + Sinx 2 ) x 4 − 2 f 4 ( x)
J2N J2 J2 J2

0
0
Lg h( x ) = [0 1 0 0]  = 0
∗
 
0

0
0
Lg L f h( x ) = [0 0 0 1]  = 0
*
 
0

93
非线性系统控制理论

0
0
Lg L f h( x ) = [∗ ∗ 0 ∗]  = 0
2

∗
 
0

0
 
 K  0  K
Lg L f h( x ) = 0 ∗
3
∗ 1 = ≠0
 
 J2N   J  J1J 2 N
1
 0 
∴ 相对阶 r = 4 = n在状态空间中每一点处均成立
故系统能精确线性化

− L4f h( x ) + v
U =T =
Lg L3f h( x )
新坐标
 h( x )  y 
   . 
 f
L h( x ) y 
z= 2  =  .. 

 f h( x ) y 
 3   .. . 

 f h( x ) y 
q1 
 
q2 
原坐标  .
q1 
 .
q2 

我们来考虑一个有趣的事情 看看系统能否在某个 x 处线性化 若
x 2 = 0 即 q 2 = 0 ,我们立即可以看出 这时的系统不是一个平衡状态

因为有C os0 = 1 所以 f ( x )= 0 与 x 2 = 0 是不协调的 也就是说不加


0 0

控制时 要达到平衡状态时 x 2 ≠ 0

换句话说 要用控制来使其平衡

94
非线性系统控制理论

即 f ( x )+ g( x )C = 0
0 0

则在 x 2 = 0 下

x3 = 0

x4 = 0

K 0
− x1 + C = 0

K 0
x 1 − m gd = 0


此式可以唯一的解得 x 1 和 C

− Lf h( x )+ v

u= 3
+C
Lf Lf h( x )
因 y = x2 故此控制可使 y及其各阶导数为 0 及可使 z = 0 除控

制不为零外 x 1 亦不为零 说明轴要扭一个角度

95
非线性系统控制理论

第五章 MIMO非线性系统的反馈线性化初步理论
引言
对于多输入多输出系统仍可以用下列紧缩的形式的方程来描述
x& = f ( x) + g ( x)u
* x ∈ Rn
y = h( x )
若输入的个数与输出的个数的数目相同时 可令
u = Col (u1 ,..., u m ) (m × 1)
y = Col ( y1 ,..., y m ) (m × 1)
g ( x) = [ g1 ( x),..., g m ( x)] ( n × m)
f ( x) = Col[ f1 ( x),..., f n ( x)] (n × 1)
h( x) = Col[h1 ( x),..., hm ( x)] (m × 1)
f ( x), g1 ( x),..., g m ( x) 均是光滑的向量场, h1 ( x),..., hm ( x) 是光滑的函数,
均定义在 R n 的某个开集上

5.1 向量相对阶和总相对阶
一个多变量非线性系统 * 在 x o 处有向量相对阶{r1 ,..., rm } 是指
1≤ j ≤ m
(i) L g j Lkf hi ( x) = 0 对所有 1 ≤ i ≤ m ∀x ∈ x o 的邻域
k < ri − 1
(ii) m × m 矩阵
 L g1 Lr1f −1 h1 ( x) . . L g m Lr1f −1 h1 ( x) 
 
 L g1 Lrf2 −1 h2 ( x) . . Lg m Lrf2 −1 h2 ( x) 
A( x) =
 . . . . 
 rm −1 rm −1 
 L g1 L f hm ( x) . . Lg m L f hm ( x)
在 x = x o 处是非奇异的
注意
1 该定义涵盖了 SISO系统
2 整数 r1 ,..., rm 中的某个 ri 是与系统第 i 个输出 hi (x) 有关的 行向
ri −1 ri −1
量 [ Lg1 L h ( x),..., L g m L h ( x)] 至少有一个元素是非零的
f i f i

即行向量不是零向量 否则矩阵 A( x o ) 就是奇异的了 所以对某个 y i 来


说至少有一个 u j 对这样的单输入单输出系统说来 它在 x o 处的相对
阶就是 ri 而对于其他可以选择的 u k 说来 其在 x o 处相应的相对阶如

96
非线性系统控制理论

果存在的话 一定大于或等于这个 ri
3 ri 也是在 t = t 0 时刻 从 y i (t ) 的微分中得到至少 u (t 0 ) 中一个分量
的显式表示时所需要微分的次数
4 若系统在 x = x 0 处有向量相对阶{r1 ,..., rm } 则行向量
0 0 r1 −1 0
dh1 ( x ), dL f h1 ( x ),..., dL h ( x )
f 1

dh2 ( x 0 ), dL f h2 ( x 0 ),..., dLrf2 −1 h2 ( x 0 )


⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
dhm ( x 0 ), dL f hm ( x 0 ),..., dLrfm −1 hm ( x 0 )
是线性无关的
证明该性质可以仿照单输入单输出的思路
若 r1 > ri 2 ≤ i ≤ m 构造两个矩阵
Q = Col (dh1 ( x),..., dLr1f −1 h1 ( x), dh2 ( x),..., dLrf2 −1 h2 ( x),..., dhm ( x),..., dLrfm −1 hm ( x))

P = Col ( g1 ( x),..., g m ( x),..., ad rf1 −1 g1 ( x),..., ad rf1 −1 g m ( x))


然后将 QP 相乘 再对它的行重新排列后 矩阵就呈现一个块三角的
结构 其对角线上的块组成 A(x) 矩阵的行 由 A(x) 的非奇异性即可证
明 QP 的行是线性无关的 因而 Q 的行也是线性无关的
5 当系统的输入数目大于输出数目时 向量相对阶定义中的条件
ii , A( x 0 ) 阵的非奇异性用该矩阵的秩等于它的行数 也就是输出
通道的个数 来代替 实际多输入多输出系统关键的是输入的数目
所谓输出是看效果的地方 所以采集某个量 观察某个量都可以看作
是输出
6 r = r1 + r2 + ... + rm 称为总相对阶 且有 r ≤ n
5.2 局部坐标变换和标准形
若系统在 x 0 处有向量相对阶{r1 ,..., rm } 称 r = r1 + r2 + ... + rm 为总相
对阶 则 r ≤ n 设1 ≤ i ≤ m 则对于某一指定的 i 取下列映射
φ1i ( x) = hi ( x)
φ 2i ( x) = L f hi ( x)
.
.
.
φ ri ( x) = Lrfi −1 hi ( x)
i

当 r 严格小于 n 时 总可以找到另外 n − r 个函数 φ r +1 ( x)...φ n ( x) 使得

97
非线性系统控制理论

z = φ ( x)
= Col[φ11 ( x),..., φ r11 ( x), φ12 ( x),..., φ r22 ( x),..., φ1m ( x),..., φ rmm ( x),..., φ r +1 ( x),..., φ n ( x)]

在 x 0 处的雅可比矩阵是非奇异的 则 φ (x) 就有资格作坐标变换 一般


来说 附加的变换函数 φ r +1 ( x),..., φ n (x) 是可以任选的 但是当分布
G = Span{g1 ,..., g m } 在 x 0 处是对合的 则与 SISO情况相似 总可以找
到 φ r +1 ( x),..., φ n ( x) 使
r +1 ≤ i ≤ n
Lg j φi ( x ) = 0 ∀x ∈ x 0 的邻域
1≤ j ≤ m
 ξ 11 
 
 . 
 ξ r1 
ξ   1 
1

ξ   2   M 
 .  ξ   m 
   M   ξ1 
z = . =  m =  M 
  ξ   m 
 .   M   ξ rm 
η     M 
 η   
 η1 
 M 
 
η n −r 
则利用上述坐标变换后 新坐标表示的系统方程可以分成 m+1 组:
第 1 组:
•1 dφ 1
ξ 1 = 1 = φ 21 = ξ 21 (t )
dt
•1 dφ 1
ξ 2 = 2 = ξ 31 (t )
dt

.
.
.

98
非线性系统控制理论

•1
ξ r −1 = ξ r1 (t )
1 1

• m m
ξ r = Lrf h1 ( x) + ∑ L g Lrf −1 h1 ( x) ⋅ u j = b1 ( z ) + ∑ a1 j ( z ) ⋅ u j
1
1
j
1

j =1 j =1

y1 = ξ 1
1

其中
b1 ( z ) = b1 (ξ ,η ) = Lr1f h1 (φ −1 (ξ ,η ))
a1 j ( z ) = a1 j (ξ ,η ) = Lgj Lr1f −1 h1 (φ −1 (ξ ,η ))
注意前式 u j 中所乘的系数 L gj Lr1f −1 h1 ( x) 正是 A(x) 阵中的第 (1, j ) 项
第 i 组:
•i
ξ 1 = ξ 2i (t )
•i
ξ 2 = ξ 3i (t )

.
.
.
•i
ξ r −1 = ξ ri
i i

• m m
ξ r = Lrf hi ( x) + ∑ Lg Lrf −1 hi ( x) ⋅ u j = bi ( z ) + ∑ aij ( z ) ⋅ u j
i
i
j
i

j =1 j =1

yi = ξ 1
i

再令
 η1  φ r +1 ( x)
 .   . 
   
η= . = . 
   
 .   . 
η n − r   φ n ( x) 
对一般情况下
• m
η = q(ξ ,η ) + ∑ Pj (ξ ,η ) ⋅ u j = q(ξ ,η ) + P(ξ ,η )u
j =1

若分布 G = Span{g1 ,..., g m } 是对合的 又由此可得 φ i (x) 满足


L gjφ i ( x) = 0

99
非线性系统控制理论

则该方程可简化成

η = q(ξ ,η )
将以上各组合并起来就得到多输入多输出系统的标准形
5.3 零动态
由输出零化的概念同样可以定义零动态
由于输出及其各阶导数为零 可得
h 1 ( x ) = L f h 1 ( x ) = ... = L r1f − 1 h 1 ( x ) = 0
.
.
.
h m ( x ) = L f h m ( x ) = ... = L rfm − 1 h m ( x ) = 0

m
及 y i( ri ) (t ) = bi (0,η ) + ∑ aij (0,η ) ⋅ u j = 0 共m 个
j =1

写成矩阵和向量的形式则有
b(0,η ) + A(0,η )u = 0
其中
 Lr1f h1 ( x) 
 
 . 
b( x ) =  .  x = φ −1 (ξ ,η ) = φ −1 (0,η )
 
 . 
 Lrm h ( x)
 f m 
A(x) 其中就是以前定义向量相对阶时的矩阵 所以
u (t ) = −[A(0,η ]−1 b(0,η )

η 是 η = q 0 (0,η (t )) 在 η (0) = η 0 下的解
对一般情况
η& = q(ξ ,η ) − p(ξ ,η )[A(ξ ,η )]−1 b(ξ ,η )
对零动态 则在 ξ (0) = 0,η (0) = η 0 下求解
5.4 参考输出复制问题
若参考输出 y R (t ) = Col ( y1R (t ),..., y mR (t ))
其中

100
非线性系统控制理论

ξ R1 (t ) 
 2 
ξ R (t ) 
 .   y iR( 0) (t )
   (1) 
 .   y iR (t ) 
 .   . 
ξ R (t ) =  i  ξ Ri (t ) =   1≤ i ≤ m
ξ R (t )   . 
 .   . 
   ( r −1) 
 .   y iRi 
 
 . 
ξ Rm (t )
则类似推导后可得
(i) 初始时刻对准 即 ξ (0) = ξ R (0) ,而内动态 η (0) = η 0 可以任取
(ii) 取
 y1(Rr1 ) (t ) 
 
 . 
u (t ) = A −1 (ξ R (t ),η (t ))(−b(ξ R (t ),η (t )) +  .  )
 
 . 
 y ( rm ) (t )
 mR 
其中 η 为下列方程的解
 y1(Rr1 ) (t ) 
 
 . 

η = q(ξ R (t ),η ) + p (ξ R (t ),η ) ⋅ A −1 (ξ R (t ),η )(−b(ξ R (t ),η ) +  .  )
 
 . 
 y ( rm ) (t )
 mR 
η (0) = η 0
同样可以将

yR u (t ) = ...... u (t )

η = .......

解释为原系统的逆实现

101
非线性系统控制理论

5.5 反馈线性化
当 r1 + r2 + ... + rm = r = n 时 可以实现状态反馈精确线性化 此时没有
内部动态 即取
u (t ) = α ( x) + β ( x)ν = A −1 ( x)[− b( x) + ν ]
当 r1 + r2 + ... + rm = r < n 时 可以实现输入输出精确线性化 此时有内
部动态 但解的式子与上面的表达式一样
5.6 输入输出解耦控制 或互不影响的控制
问题的提法
给定一个非线性系统
. m
x = f ( x) + ∑ g i ( x)u i
i =1

y1 = h1 ( x)
.
.
.
y m = hm ( x)
给定初始状态 x 0 及 x 0 的邻域U 0 找一个静态状态反馈控制律
m
u i = α i ( x) + ∑ β ij ( x)ν j
j =1

使闭环系统
. m m m
x = f ( x) + ∑ g i ( x) ⋅ α i ( x) + ∑ (∑ g i ( x) β ij ( x))ν j
i =1 j =1 i =1

y1 = h1 ( x)
.
.
.
y m = hm ( x)
的每一输出 y i 1≤ i ≤ m 只受相应的输入 ν i 的影响 而与其他
ν j (i ≠ j ) 无关
这个问题当用标准形来研究时是很简单的 因为

102
非线性系统控制理论

⋅ i
ξ 1 = ξ 2i
.
.
.
⋅ i
ξ r −1 = ξ ri
i i
⋅ m
ξ r = bi (ξ ,η ) + ∑ aij (ξ ,η )u j
i
j =1

η = q(ξ ,η ) + p(ξ ,η ) ⋅ u
则取
 u1 
.
 
u =  .  = A −1 (ξ ,η )[− b(ξ ,η ) + ν ]
 
.
u 2 
时 其中 η 为下列方程的解

η = q(ξ ,η ) − p (ξ ,η ) A −1 (ξ ,η )b(ξ ,η ) + p(ξ ,η ) A −1 (ξ ,η )ν
η (0) = η 0

则上述式子中 ξ ri = ν i y i = ξ1i ξ1i 只与ν i 有关 所以系统既被输入
输出线性化了 又被解耦了
系统的传递函数为
1 
 s r1 . . . . 
 1 
 . . . . 
H (s) =  s r2 
 . . . . . 
 . . . . . 
 1 
 . . . . 
 s rm 
图形表示如下图
当 r = n 时 内动态就没有了

103
非线性系统控制理论

v1 ξ 1r1 y1 = ξ11
∫ ∫

ξ r22 y 2 = ξ 12

v2

vm ξ rmm y m = ξ1m
∫ ∫

⋅ ∧ ∧
η = q(ξ ,η ) + p(ξ ,η )v

阴沟洞 内动态

当然解耦之后得线性系统还应当根据实际需求及可实现性来设计其动
态性能 不必多论了

(课程到此结束)

104

You might also like