非线性系统理论

非线性系统控制理论
何长安编
2002 稿
西北工业大学
前言
众所周知,实际上诸多的控制系统都是非线性系统特别是机
器人控制系统飞行控制系统直升机飞控系统等人们对非线性
控制系统的研究也已经有近百年历史了可以说从控制理论诞生之
日起就开展了非线性系统的研究由于非线性控制系统可能具有比
线性系统丰富和复杂得多的特性且除去一些特殊情况外大多数
非线性系统所建立的数学方程都无法得到它的闭合解或解析解因
而在一个很长的时期内不是致力于去寻找它直接的解析解而是研
究系统的一些定性的性质例如对稳定性的研究就取得了很大的成
绩其中值得一提的是李亚普诺夫方法并且适合于分析低阶系统
的相平面法描述函数法等也得到了发展但是综合起来看所解决
的问题是有限的有许多重大的根本性的问题尚没有解决有些
只是一个开端有些还是空白远远不能满足工程技术及其他各领
域的需要
近 20 年来非线性控制系统理论有了突破性进展微分几何
方法在非线性控制系统中得到了广泛的应用从而形成了控制系统
理论中一个崭新的分支罗马大学教授 A.Isidori 在 1985 年指出
正如 50 年代拉氏变换复变函数理论用于线性单输入单输出系统
60 年代状态空间描述和线性代数理论用于多变量线性系统那样用
微分几何方法研究非线性控制系统取得了并将进一步取得突破与
成功几乎同时钱学森教授也曾指出微分几何方法对研究非线性
系统是很有前途的到目前为止这一理论不仅已经初步形成了自
己的理论体系而且在机器人控制系统直升机飞控系统化学反
应器控制系统电力系统动态安全性控制以及生物医学方面得到了
成功的应用
本课程的目的是要把这个理论介绍给大家起一个引导和桥梁
的作用
由于微分几何这一数学分支对于工程类的学生来说是不大熟
悉的特别是有关的一些概念如拓扑空间微分流形映射切
空间向量场微分同坯李导数李代数分布与对偶分布对
合性闭包 Frobenius 定理等比较抽象较难学懂但不掌握
这些概念就会妨碍对非线性控制理论的透彻理解也就很难将理论
用于实际而对理科类学生来说虽然有较好的数学基础这些数
学基础也已掌握但对控制系统的工程实际又了解太少因而也很
难将这一理论真正用于实际的工程系统本课程的目的就是建立起
一座联结彼岸与此岸的桥梁使学习本课程的理工两类学生均有
收益
由于课内学时较少因而希望学生在课外针对自己的弱点多阅
读参考文献以加强对课程的理解和消化
主要参考书
1.Alberto Isidori 著, Nonlinear Control Systems ,
Springer-Verlag 出版 1989 年第 2 版
2.Henk Nijmeijer , Arjan Van der Schaft 合著 Nonlinear
Dynamical Control Systems, Springer-Verlag 出版 1990 年第 1
版
3.程代展编著非线性系统的几何理论科学出版社 1988 年
4.卢强孙元章著, 电力系统非线性控制, 科学出版社, 1993
年
5.夏小华高为炳著非线性系统控制及解耦科学出版社 1993
年
6.J.-J.E.Slotine 李卫平,应用非线性控制国防出版社 1992
年
7.欧阳光中著流形上的微积分上海科技出版社 1988 年
目录
第一章微分几何基础 ..........................................................................1
1.1 度量空间 ..................................................................................1

1.2 邻域概念 ..................................................................................2
1.3 欧氏空间上的连续映射 ..........................................................2
1.4 拓扑空间 ..................................................................................6
1.5 连续映射与同胚 ......................................................................8
1.6 流形和微分流形 ......................................................................8
1.7 可微映射 ................................................................................12
1.8 流形上的可微函数 ................................................................13
1.9 切向量和切空间 ....................................................................14
第二章李导数李括号运算与分布 ........................................................19
2.1 向量场 ....................................................................................19

2.2 李导数 ....................................................................................19
2.3 李括号运算 ............................................................................20
2.4 李括号运算具有下列性质 ....................................................20
2.5 协向量场的微分运算 ............................................................21
2.6 运算法则 ................................................................................21
2.7 分布 Distributions ..........................................................22
2.8 Frobenius 定理 ......................................................................25
第三章反馈线性化的初等理论 ............................................................29
3.1 局部坐标变换 ........................................................................29

3.2 状态反馈精确线性化 ............................................................43
第四章反馈线性化原理的应用 ............................................................55
4.1 零动态 .....................................................................................55

4.2 局部渐近稳定化(镇定)..........................................................64
4.3 渐近输出跟踪 ........................................................................70
4.4 干扰解耦 ................................................................................74
4.5 高增益反馈 ............................................................................78
4.6 关于精确化问题的补充 ........................................................83
4.7 具有线性误差动态的观测器 ................................................86
4.8 举例 ........................................................................................91
第五章 MIMO 非线性系统的反馈线性化初步理论...........................96
5.1 向量相对阶和总相对阶 ....................................................96

5.2 局部坐标变换和标准形 ........................................................97
5.3 零动态 ..................................................................................100
5.4 参考输出复制问题 ..............................................................100
5.5 反馈线性化 ......................................................................102
5.6 输入输出解耦控制或互不影响的控制 ......................102
第一章微分几何基础
本章叙述本课程将要用到的一些微分几何的基础知识但一般不
作证明有兴趣者可参阅有关资料
1.1 度量空间
设集合 R n = {x = ( x1 , x 2 ,..., x n ) | xi 是任意实数 1 ≤ i ≤ n} , n 是正整数,
其中 R n 中的元素 x = ( x1 , x 2 ,...x n ) 叫做点, xi 是点 x 的座标分量两点的
距离定义为
n
ρ ( x, y ) = [∑ ( xi − y i ) 2 ]1 / 2 ∈ R 1
i =1
它可以看作是一种从 R 到 R 的对应关系定义了上述距离 ρ n 1
R × Rn 
n
→ R 1 的集合 R n ,叫做欧几里得空间上述 ρ 叫做欧氏空间
的通常度量欧氏空间记为 R n ρ
通常度量 ρ R n × R n  → R 1 是非负函数且具有下列性质
1 ρ ( x, y ) = 0 ⇔ x = y
2 对称性 ρ ( x, y ) = ρ ( y, x)
3 三角不等式 ρ ( x, z ) ≤ ρ ( x, y ) + ρ ( y, z )
定义 1: 度量空间若我们抛弃具体的集合 R n 以及由此而赋予的具
体距离只保留性质 1 2 3 则可引进更为一般的度量空间即
设 X 为集其中元素叫做点记为 x, y, z 等记 ρ : X × X  → R 1 为非
负函数,且满足性质 1 ,2 ,3 ,则 X ρ 就叫做度量空间,函数 ρ
叫做 X ρ 的度量, ρ ( x, y ) 叫做 x , y 间的距离,在明确了所赋予的
ρ 时,度量空间 X ρ 可简记为 X 因而欧氏空间可看成是度量空
间的一个特例
*希尔伯特空间 Hilbert 也是度量空间的一个特例
Hilbert 空间: R ω = ( R ω , ρ ,
∞
集合 R ω = {x = ( x1 , x 2 ,...) | xi ∈ R 1 , i = 1,2,..., ∑ xi2 < +∞}
i =1
∞
→ R 1 定义为: ρ ( x, y ) = [∑ ( xi − y i ) 2 ]1 / 2
而度量 ρ : R ω × R ω 
i =1
显然 ρ 满足性质 1 2 3 证明性质 3 时可根据 n 维欧氏空间 R n

中的三角不等式再令 n  → ∞
*离散度量空间设 X 为任一集合 , 定义 ρ ( x, y ) = 0 , 当
x = y ; ρ ( x, y ) = 1 ,当 x ≠ y ;则 X ρ 是度量空间,叫做离散度量
空间
1
1.2 邻域概念
我们把数学分析中邻域的概念引入度量空间以平面为例设点
M 0 = ( x0 , y 0 ) 是平面上的一点以 M 0 为中心既可以作一个园形邻域
O( M 0 , δ ) ,也可以作一个方形邻域 O ' M 0 ,δ ) 它们的定义分别是
O( M 0 , δ ) = {( x, y ) ∈ R | ( x − x 0 ) + ( y − y 0 ) 2 < δ 2 }
2 2
O ' ( M 0 , δ ) = {( x, y ) ∈ R 2 | x − x0 < δ , y − y 0 < δ }
δ
δ
M0 δ
M0
图 1-1
平面上一个点列 M n = ( x n , y n )(n = 1,2,..., ) 收敛于 M 0 可以用两种方式
来陈述:
1 园形邻域的方式对于任给的 ε >0 存在正整数 N ,当 n > N 时,
有 ( x n − x0 ) + ( y n − y 0 ) < ε
2 2
或者说当 n 充分大时点列 M n ∈ O( M 0 , ε )
2 方形邻域的方式对于任给的 ε >0 存在正整数 N ,当 n > N 时有
x n − x0 < ε y n − y0 < ε
或者说当 n 充分大时,点列 M n ∈ O ' ( M 0 , ε )
这两种陈述方式是一致的即在一种方式下是收敛的则在另一
种方式下也一定是收敛的因而在研究收敛性时不同邻域的陈述是
等价的因而今后常常用球邻域为代表来论述
定义若 A 是度量空间 X 的子集 a ∈ A ,若 a 有一个球形邻域 ⊂ A ,
则 a 称为 A 在 X 中的内点 A 在 X 中的内点全体叫做 A 的在 X 中的内
部,记为 IntA 若 A = IntA ,则称 A 为 X 的开集 A 是开集等价于 A 是
__
若干球形邻域的并集如果 A 是度量空间 X 的子集 A 的余集 A 是 X 的
开集,则 A 叫做 X 的闭集
1.3 欧氏空间上的连续映射
(1) 映射
设 D 是 n 维欧氏空间 R n 内的一个子集, f 是从 D 到 R m 的一个映射,
即
f :D → R m , D ⊂ R n ; x 
→ y ;
2
这里自变量 x ∈ D 是 R n 中的一个点 x = ( x1 , x 2 ,...x n ) , D 是 f 的定义
域, x 的象 y = f (x) 是 R m 中的一个点向量 y = ( y1 , y 2 ,... y m ) ,因此 f 也
可称是定义在 D 内的向量值函数表明 y 依赖于 x ,即 y 的每一个坐标
y j ( j = 1,2,..., m) 都依赖于 x = ( x1 , x 2 ,...x n ) :
y1 = f1 ( x1 , x 2 ,...x n )
y 2 = f 2 ( x1 , x 2 ,...x n )
.
.
.
y m = f m ( x1 , x 2 ,...x n )
x = ( x1 , x 2 ,...x n ) ∈ D
f i 是 f 的第 i 个坐标函数记为
f = ( f1 , f 2 ,... f m )
引入了映射的概念之后就有可能站在更高的层次上来看待曲线
曲面坐标变换多元函数等具体的概念
例如设 D 是 R 3 中的一个区域设映射T :
T : R3  → R 3
(u , v, ω ) 
→( x, y, z )
若 x = f (u , v, ω ),
y = g (u , v, ω ),
z = h(u , v, ω ), (u, v, ω ) ∈ D
x = f (⋅) = uSinv ⋅ Cosω ,
y = g (⋅) = uSinv ⋅ Sinω ,
z = h(⋅) = uCosv ,
若 D = {(u , v, ω ) | 0 < u < +∞,0 < v < π ,0 < ω < 2π } 则映射 T 就是球面
坐标变换
若 D 中任意两个不同点的映射,其象也不相同,就称映射 f 是由 D 到
R 的一个单射,或一对一的映射
m
若 f :D  → E , D ⊂ R n , E ⊂ R m , E 内任何点 y 在 D 内至少存
在一个 x ,使得 f ( x) = y 就称 f 是从 D 到 E 的一个满射
若 f 是从 D 到 E 的一个满射,同时又是一个单射,则称 f 是从 D 到
E 的一个双射或称 D 和 E 之间是一一对应的映射
如果 f : D  → E 是双射的,则其逆映射 f −1 : D  → E 一定存
在
3
(2) 范数
考虑一个比欧氏空间更普遍的线性空间 X 若在上定义一个映射
:x 
→ R
x 
→ x
即对每一点 x ∈ X ,其象 x 是一个实数如果该映射满足下列条件
(I) x ≥ 0, ∀x ∈ X
x =0 当且仅当x = 0 此式右端的0是X中的零元 )
(II) ax = a x , ∀x ∈ X , ∀a ∈ R
(III) x + y ≤ x + y , ∀x, y ∈ X
称这个映射是 X 上的一个范数称 x 是 x 的范数当线性空间 X
具备了范数以后,就称 X 是一个赋范线性空间,通常用( X , ) 表示
在欧氏空间中可以用向量的模长 x :
x = x12 + x 22 + ...x n2
表示 x 的欧几里得范数,它显然满足上述的三个条件两点 x , y 之间
的距离可以用范数来定义即在空间 Rn 中 , 任何两点
x = ( x1 , x 2 ,...x n ) , y = ( y1 , y 2 ,... y n ) 间的距离就是 x y 的范数 x − y
因为 x − y = ( x1 − y1 ) 2 + ... + ( x n − y n ) 2
有了距离就能够正确表达收敛的概念从而可以引进内点外点
边界点开集闭集等一系列重要的概念
若在同一个线性空间上装备了两个范数和如果存在两个常
1 2
数 c >0, d >0,使 x 1 ≤ c x 2
x 2
≤d x1 ∀x ∈ X
就称范数和是等价的范数如果赋范线性空间的两个范数
1 2
和是等价的范数那末在范数的意义下的收敛性与在范数

1 2 1
意义下的收敛性也是相同的对任一线性空间来说如果它装备了

2
两个以上的范数我们不能断定它们一定是等价的但是对于欧氏空

间而言可以证明任何两个范数都是等价的因而不同范数意义下的
收敛性相互是一致的
(3) 连续映射
设 D 是 R n 中的一个开集 f 是从 D 到 R m 的一个映射, x0 ∈ D ,如
果对于任给的 ε > 0, 存在 δ > 0 ,对任何 x ∈ D 当 x − x0 < δ 时有
4
f ( x) − f ( x0 ) < ε 就称映射 f 在点 x0 连续,要注意的是范数 x − x0 是

R n 上的欧氏范数,而 f ( x) − f ( x0 ) 是 R m 上的欧氏范数因为欧氏空间
上范数的等价性所以欧氏空间上映射的连续性也与欧氏空间上范数
的选取无关
由此观之在欧氏空间或赋范线性空间中连续的概念与范数有关
为了将连续的概念拓广到更为一般的空间上去我们用开集的概
念来表示连续的概念即下列定理成立证明从略
设 f :D → R , D 是 R 内的一个开集,那末 f 在 D 连续的充分
m n
必要条件是:对于 R m 内的任一开集V ,它的逆象

U = f −1 (V ) = {x ∈ D | f ( x) ∈ V }
是 R n 的一个开集
现在先用一元实函数的例子来说明一下例如实数轴上的正弦函数
y = f ( x) = Sin( x) ,它是整个数轴上的连续函数图 1-2 ,对于 y 轴上
的开区间V
y
U −2 U −1 0 U1 U2 U3
x
图 1-2
它的逆象是 x 轴上的开区间 U 1 , U 2 ,...U −1 , U − 2 ,... 之并,仍是 x 轴上的开
集又如图 1-3 中所表示的函数 y = f (x) ,定义在区间 (a, b) 内,但在
−1
(a, b) 内不连续,对 y 轴上的开区间V ,它的逆象 f (V ) 却是 x 轴的一个
左闭右开的区间,因而不是开集
5
[ )
0 a b x
图 1-3
1.4 拓扑空间
(1) 定义令 S 是一个集合,所谓拓扑或拓扑结构是指满足下列条件的
S 上的一个开子集族T :
(I) T 中任意多个元素的并仍属于T ;
(II) T 中有限多个元素的交仍属于T ;
(III) 集合 S 本身及空集 ∅ 也属于T ;
则称 ( S , T ) 为拓扑空间有时简单的把 S 称为拓扑空间 T 称为 S 上
的一个拓扑, T 中的元素则为开集
若 T 中有一个子集 B ,使得 T 中的每个元素都可以由 B 中的若干元
素的并生成,则称 B 为一个拓扑基,当然 S 也由拓扑基的并生成拓扑空
间在 P 点处的邻域是指包含 P 的任意开集作为一个拓扑空间,它只装
备着满足三条性质的开集体系,因而太共性化了,显得不够细微因而
引进一些公理,在这些公理的限制下空间的性质可被描写的细致一
些
第一可数公理: 如果拓扑空间 ( S , T ) 内的每一个点 x ,存在可列个
开集 On (n = 1,2,...) ,使对任何一个含有 x 的开集 V ,{ On }中存在一个
On0 ⊂ V ,就称 ( S , T ) 满足第一可数公理直观地说,在满足第一可数公
理的空间中,任意固定一点 x ,它的邻域可能会有不可列的无限多个,但
总可以选出可列无限多个就足以和那不可列的无限多个相当
第二可数公理设 (S , T ) 是拓扑空间 , 若存在可列个开集
On (n = 1,2,...) 使得任何一个开集都可以表示为{ On } 中某些开集的并,
就称 ( S , T ) 满足第二可数公理直观地说,在满足第二可数公理的空间
中,其开集可能是不可列无限多个,但总可以选出可列无限多个就足够
了
Hausdorff 公理:设 ( S , T ) 是拓扑空间,若 S 中的任意两点
6
Hausdorff 公理:设 ( S , T ) 是拓扑空间,若 S 中的任意两点 x , y ( x ≠ y ) ,

总存在两个开集 O x 和 O y , O x ∩ O y = ∅ ,且 x ∈ O x , y ∈ O y ,就称 ( S , T ) 满
足 Hausdorff 公理又称 ( S , T ) 是 Hausdorff 空间
任何一个赋范线性空间都是 Hausdorff 空间直观地说 , 在
Hausdorff 空间中任意两个不同点总可以找到两个不相交的邻域分别
包含这两点即该空间的不同点是可以分离的
(2)关于拓扑空间的一些概念
设 ( X ,τ ) 是一个拓扑空间 E 是 X 的一个子集
收敛若点列 {xn } ⊂ X ,点x ⊂ X 若对于含有 x 的任何一个开集 O
存在 N 当 n > N 时 , 有 x n ∈ O , 则称 {xn } 收敛 , x n 收敛于 x , 记为
xn 
→ x
内点设 x ∈ E 若在一个含有 x 的开集 O , O ⊂ E ,就称 x 是 E 的一
个内点,显然开集内的每一个点都是它的内点
外点:设 x ∈ E ,若在一个含有 x 的开集 O , O ⊂ X − E 或者写为
O ∩ E = ∅ ,就称 x 是 E 的一个外点,显然 x ∉ E
边界点:设 x ∈ X ( x 可以属于 E ,也可以不属于 E ),如果对含有 x 的
任何开集 O , O 中既有 E 的点 , 又有非 E 的点 , 即
O ∩ E ≠ ∅ , O ∩ ( X − E ) ≠ ∅ ,就称 x 是 E 的一个边界点, E 的所有边界
点组成 E 的边界
聚点设 x ∈ X (不论 x 是否属于 E ),如果对含有 x 的任何开集
O , O - {x} 中必有 E 的点,即 O − {x}) ∩ E ≠ ∅ ,就称 x 是 E 的一个聚
点
闭集如果 E 的补集 X − E 是 X 中的开集,就称 E 是闭集即开集
的补集是闭集闭集的补集是开集 X 和空集 ∅ 既是开集又是闭集
紧集设 { Oa } 是 E 的一个开覆盖 ( 即每一个 Oa 是开集 , 并且
E ⊂ U Oa ),如果在{ Oa }中总可以选出有限个开集覆盖 E ,就称 E 是一
a
个紧集
邻域在度量空间中应用了球形邻域的概念对拓扑空间来说直
接将开集作为邻域即拓扑空间 X 的任一开集U 叫做它的每一个点
x ∈ U 的邻域,也叫做它的子集 A ⊂ U 的邻域
度量空间也可以作为拓扑空间,所以它的任一开集是其中任一点的
邻域,而原先的球形邻域只是它的一个点(球心)的球形邻域所以拓扑
空间邻域的概念有更普遍的含义
__ __
闭包记 E = EU {E 的所有聚点} 称 E 是 E 的闭包例如实数轴
7
__
上带有通常的拓扑 E = (a, b), 则 E = [a, b]
拓扑子空间设 ( X , τ ) 为拓扑空间 A 为 X 的非空子集,容易验证 A
的子集族 τ A = {O ∩ A | O ∈ τ } 是 A 上的一个拓扑 τ A 称为 X 的拓扑τ 在
A 上的诱导拓扑,拓扑空间 ( A,τ A ) 叫做 ( X ,τ ) 的拓扑子空间
1.5 连续映射与同胚
设 ( X ,τ x ) 和 (Y , τ y ) 是两个拓扑空间,它们可以是相同的,也可以是
不相同的如果对每一点 x ∈ X ,通过关系 f 在 Y 内存在唯一的一点 y
与这个 x 对应,即 f 是从 X 到 Y 的映射,记为 f : X  → Y , 或
f : ( X ,τ x ) 
→(Y ,τ y ) ,称 y 是 x 在 f 作用下的象 x 是 y 的一个逆象
可记为 x  → y = f (x) 类似于欧氏空间的映射也可以引进单射满
射,和双射的概念
对于拓扑空间我们是以开集来定义映射的连续性的
设 f : ( X ,τ x ) 
→(Y ,τ y ) 若对于Y 中任意一个开集V ,它的逆象
U = f −1 (V ) = {x ∈ X | f ( x) ∈ V }
是 X 中的开集,就称 f 是从 X 到Y 的一个连续映射若 f 是从 X 到Y 的
双射(因此逆映射 f −1 在),同时 f 又是从 X 到 Y 的连续映射,且 f −1 (从
Y 到 X 的映射)也是连续映射就称 f 是同胚映射当两个拓扑空间之
间存在一个同胚映射时,就称这两个拓扑空间同胚
由此可知,如果两个空间是同胚的,则这两个空间之间不仅点与点
一一对应,而且开集与开集之间也一一对应,这表明它们有相同的拓扑
结构从拓扑学的观点看,可以把同胚的两个拓扑空间看作是相同的
1.6 流形和微分流形
(1) 流形
先考虑两个例子
例 1 在 3 维欧氏空间 R 3 带有通常拓扑中上半球面
S = {( x, y, z ) ∈ R 3 | x 2 + y 2 + z 2 = 1, z > 0}
和开圆盘
D = {( x, y, z ) ∈ R 3 | z = 0, x 2 + y 2 < 1}
同胚这是因为设映射 f : D  → S 是
x=x y = y , z = 1 − x2 − y2 ( x, y ) ∈ D
由上述定义可知 f 是从 D 到 S 的同胚映射所以 D 和 S 是同胚,
而开圆盘 D 显然又和整个 2 维欧氏空间同胚,因此 S 和 R 2 同胚,从拓扑
学的观点来看 S 和 R 2 一样的
8
例2 设 S 是 R 3 中的一个球面, S = {( x, y, z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 } ,在
S 上装备着由 R 3 中通常拓扑诱导出来的拓扑,但 S 和例 1 的半球不同,
故我们来作一次手术,用 z = b 的平面将 S 剖成两片, S1 和 S 2 : 设 a
b>0
S1 是上半球 {( x, y , z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 , z > b} ,
S 2 是下半球罐 {( x, y , z ) ∈ R 3 | x 2 + y 2 + z 2 = a 2 , z < b}
z
y
0
x
z
N(0,0,a)
0
0 y
M'
(0,0,-a)
x π
S1 和 S 2 上的拓扑结构都是由 R 3 内通常拓扑诱导出来的,并且 S1 和 S 2
都是开集它们覆盖了 S
由例 1 可知, S1 和平面上的一个开圆盘同胚,由右图中可见若点
N = (0,0, a ) 是球面 S 的北极,平面π 是球面 S 在南极 (0,0,− a ) 的切平面
通过 N 作射线穿过球罐 S 2 和平面 π ,交点分别是 M 和 M ' ,作映射
ϕ :M  → M ' ,在这一映射下,容易看出 S 2 和平面上的某个开圆盘同
胚
可见 S 虽然不和平面上的任何一个开集同胚,但是它有两个开集 S1
和 S 2 组成的开覆盖,每一个开集都和平面上的某个开圆盘同胚换句话
说,从整体来说 S 不和 R 2 内任何开集同胚但 S 的每一个局部(开集)
都和 R 2 内某个开集同胚
将此情况加以抽象,就得到流形的概念
设 M 是一个拓扑空间,并且是第二可数的 Hausdorff 空间, {U a } 是
M的开覆盖如果对每一个开集 U a ,联系着一个映射
9
ϕa :U a 
→Va , Va 是 n 维欧氏空间内的一个非空开集,也可以不妨假
设它是 n 维开球或 n 维开矩形,并且 ϕ a 是同胚映射,即 U a 和 Va 是同胚
就称 M 是一个 n 维流形
由流形的定义可归纳成两点
(I) M 虽然不一定是欧氏空间,但是它可以”局部欧氏空间化”, M 的
每一个局部 U a 都和 R n 中的一个开集 Va 同胚,从拓扑学的观点看 U a 和
Va 相同
xn
Va
Va
P x
M
0 x2
x1
(II) M 内的点可能并没有坐标,但可以安装”局部坐标”,由于 U a 和 Va
同胚,它们的点与点一一对应,设点 P ∈ U a ,通过同胚映射 ϕ a ,点 P 映射
为 Va 中的点 x , 设 x = ( x1 , x 2 ,...x n ) , ( x1 , x 2 ,...x n ) 是 x 的坐标 , 就把
( x1 , x 2 ,...x n ) 当作是 P 的局部坐标来表示点 P
所以从直观上概括地说所谓 n 维流形就是可以局部( n 维)欧几里得
空间化的一个拓扑空间,其中的点可以安装局部坐标
根据 Brouwer’s 的域的不变性原理,当 n ≠ m 时,一个 R n 的开子集U
与一个 R m 的开子集V 不可能构成同胚映射所以流形的维数 n 是很重
要的,很确定的东西
流形不一定支持微分运算,但在实际应用中微分又是十分必需的,
所以就把能够支持微分运算的流形称为微分流形
(2) 微分流形
设 M 是一个 n 维流形,这表明 M 有一个开覆盖 {U a } ,并且每一个
U a 联系着一个映射 ϕ a : U a 
→Va , ϕ a 是同胚映射如果 U α U β 都在
{U a } 内并且 U α ∩ U β ≠ ∅ 设 P = U α ∩ U β 则在 ϕ a 的作用下将点 P
映射为 x = ( x1 , x 2 ,...x n ) ,在 ϕ β 的作用下将点 P 映射为 y = ( y1 , y 2 ,... y n )
同一点 P 既可以用坐标 x = ( x1 , x 2 ,...x n ) 表示 , 又可以用坐标
y = ( y1 , y 2 ,... y n ) 表示,于是这两个坐标之间有一个坐标变换式,即
10
ϕ β ⋅ ϕ α−1 : ϕ α (U α ∩ U β ) 
→ ϕ β (U α ∩ U β )
x = ( x1 , x 2 ,...x n ) 
→ y = ( y1 , y 2 ,... y n )
即 ϕ β ⋅ ϕ α−1 是定义了 R n 上两个开集间的一个同胚映射这实际上就
是两个欧氏空间中的局部坐标变换
Uβ y2
PPP
υα
U ϕβ
x2 α
ϕα
y = ( y1 , y2 ,... yn )
ϕβ ⋅ϕα
−1
x = ( x1 , x2 ,...xn )
0 y1
0 x1
如果它是可微的并且其逆映射 ϕ α ⋅ ϕ β−1 : y 
→ x 也是可微的就
称 M 是 n 维微分流形具体一点说就是
y = ϕ β ⋅ ϕ α−1 ( x)
x = ϕ α ⋅ ϕ β−1 ( y )
当这个映射及其逆映射的所有阶数 ≤ k 的偏导数均存在且连续时,
则称 (U α , ϕα ) 与 (U β , ϕ β ) 是 C k 级的或 C k 可比较的或相容的则
若它们是无穷次可微的则称是 C ∞ 可比较的一个 R n  → R n 的映
射如果它具有局部收敛的台劳级数展开式则称为解析映射解
析映射显然是一个 C ∞ 映射但反之未必成立解析映射记为 C ω
若一个 n 维微分流形,对一切的 U α ∩ U β ≠ ∅ 的 α 和 β 可微映射
ϕ β ⋅ ϕ α−1 ∈ C k (1 ≤ k ≤ ∞) 就称 M 是 n 维 C k 微分流形当 k = ∞ 时就称
为 C 流形或光滑流形当它们是 C 可比较时则称 M 为 n 维 C ω 流形
∞ ω
或解析流形
对一个微分流形 M 的子集 U a ,我们又可称它为坐标邻域 ϕα 是坐
标映射 (U α , ϕα ) 称为坐标卡或坐标图所有的{ (U α , ϕα ) }组成 M 的坐
标图册这好比用一本地图册来表示地球表面上的地理疆界一样地
球表面近似是球面整体上它不和平面上的任何开矩形同胚但可以
把整个地球表面用有限个开集来覆盖每一个开集是可以与开矩形同
胚的即同胚于地图册上的一页图这样一本地图册就足以表现全世
界所有的地理疆界
11
所以粗略地说流形可以看成是由许多块同胚于欧氏空间的开集的
片粘起来的几何体若粘得光滑则可以支持微分运算就构成微分
流形
1.7 可微映射
先来回顾一下二元实函数的可微性
若 D 是 R 2 中的一个开集,点 P ( x0 , y 0 ) ∈ D ,映射 f : D 
→ R ,实际
上表示了一种函数关系: f ( P) = f ( x, y ), f ( P0 ) = f ( x0 , y 0 )
若在 P0 点可微,则有
∂f ( x, y ) ∂f ( x, y )
f ( x, y ) − f ( x 0 − y 0 ) = | ( x0 , y ) ( x − x 0 ) + | ( x0 , y ) ( y − y 0 ) + γ ( P, P0 )
∂x 0
∂y 0
= A( P0 )( x − x0 ) + B ( P0 )( y − y 0 ) + γ ( P, P0 )
其中 A( P0 ) , B( P0 ) 是仅与 P0 点有关而与 P 无关的常值,它们分别是
函数在 P0 的对 x 及 y 的偏导数
γ ( P, P0 )
γ 满足 lim =0
P − P → 0 P − P0
0
 x − x0 
可写成 f ( x, y ) − f ( x 0 , y 0 ) = [ A( P0 ) B ( P0 )]  + γ ( P, P0 )
 y − y0 
其中 [ A( P0 ) B( P0 )] 是 1× 2 的矩阵记为 l P0
 x − x0 
 y − y  表示 R 中的一个点 P − P0
2
 0
因而上式变成 f ( P) − f ( P0 ) = l p0 ( P − P0 ) + γ ( P, P0 )
其中 l p0 ( P − P0 ) 可以看成是一个线性变换作用在 ( P − P0 ) 上若 P 点
是 R n 上的点 f (⋅) 也可以是在 R m 上的向量函数则上述式子可加以拓
广
设 D 是 R n 中的开集, x0 是 D 内的一点, T 是 R m 中的开集,映射
f :D
→ T ,如果存在一个与 x0 有关,而与 x 无关的,从 R n 到 R m 的线
性变换 l x0 使得对 D 内任何 x 有
f ( x ) − f ( x 0 ) = l x 0 ( x − x0 ) + γ ( x , x0 )
γ ( x, x 0 )
且 γ ( x, x0 ) 满足 lim =0
x − x0 → 0 x − x 0
则称映射 f 在点 x0 可微
称线性变换 l x0 是 f 在 x0 的导数记为 f / ( x0 ) 如果映射 f 在 D 内的
12
每一点可微就称 f 在 D 内可微又称 f 是 D 内的可微映射

1.8 流形上的可微函数
设 M 是 n 维 C ∞ 流形坐标册是 {(U d , ϕ d )} G 是 M 中的一个开集
P ∈ G 则映射 f : G  → R 表示了某一函数关系因为流形是局部
欧几里得化的
考察 f o ϕ d−1 它是定义在 ϕ d (G ∩ U d ) 上的函数由于 ϕ d (G ∩ U d ) 是
R n 内的一个开集因此 f o ϕ d−1 是 n 元的实函数
ϕ d (υ d )
R n (x)
M
G ϕd ϕ d (P)
υd P
f ⋅ϕ −1
d
f
R
设 x = ϕ d ( P), x = ( x1 , x2 ...xn ) 是 P 的局部坐标如果 f o ϕ d−1 在 x 处可

微就称 f 在点 P 处可微因为 U d 与 ϕ d (U d ) 是同胚的如果 f 在每一
个点 P ∈ G 可微称 f 在 G 上可微
现在会产生一个问题如果 P ∈ G ∩ U d 同时 P ∈ G ∩ U a 则利用
坐标卡 (U d , ϕ d ) 说明了 f 在 P 可微即 f o ϕ d−1 在 x 处可微则在坐标卡
(U a , ϕ a ) 内设 y = ϕ a (P )) f o ϕ d−1 在点 y 处是否也可微即可微性是
否与局部坐标的选取无关
实际上因为 f o ϕ d−1 = f o ϕ d−1 (ϕ d ⋅ ϕ a−1 ) f ⋅ ϕ d−1 在 x 处可微即 f (P)
在 P 点可微因而 f ⋅ ϕ a−1 在点 y 处也可微因为它们是同胚的关系所
以可微性与局部坐标的选取无关
若 M 1 与 M 2 分别是 n1 维和 n2 维的光滑的微分流形又映射
→ M 2 则任取点 P ∈ M 1 的坐标卡 (U , ϕ ) 又 F ( P) ∈ M 2 的坐
F : M1 
标卡 (V ,ψ ) 于是两个坐标卡之间的关系可表示为
∧
F = ψ ⋅ F ⋅ ϕ −1
∧
即 F : ϕ (U ) ⊂ R n1 
→ψ (V ) ⊂ R n2
∧
或 F : y ( x) 因为 x y 都是欧氏空间的坐标
13
M1 F M2 n2
P F(P)
ψ
y = ( y1 , y2 ,... yn )
n1 ϕ
ψ ⋅ F ⋅ ϕ −1
x = ( x1 , x2 ,...xn )
所以具体来说就是
y1 = y1 ( x1 ,..., x n1 )
y 2 = y 2 ( x1 ,..., x n1 )
.
.
.
y n2 = y n2 ( x1 ,..., x n1 )
当它们是可微映射时则定义
 ∂y1 ∂y1 
 ∂x ... ...
∂x n1 
 1 
 ∂y 2 ... ... ∂y 2 
J F =  ∂x1 ∂x n1 
 
 . . 
 ∂y n2 ∂y n2 
 
 ∂x1 ∂x n1 
为映射 F 的 Jacobian 阵
显然,当 M 1 与 M 2 是微分同胚时,则根据前述的秩定理,流形 M 1 与
M 2 的维数又应当相等此时 J F 是一个方阵而且应当是非奇异的当
J F 只在某个邻域内是非奇异的就表明 M 1 与 M 2 只是在这些邻域内是
局部微分同胚的于是在微分流形上两个局部坐标之间的变换有时
也就叫做微分同胚
1.9 切向量和切空间
现在要把 R 3 中光滑曲线的切线和光滑曲面的切平面的概念拓广到
微分流形上先分析一个简单的情形求平面上光滑曲线的切线设 l
是平面上的一条光滑曲线其方程为 y = f ( x), P = ( x0 , y 0 ) 是 l 上的一
14
点求曲线在点 P 处的切线实际上求切线与求导数是密切相关的

df
因为函数在 x0 处的导数 | x 就是曲线 y = f (x) 在点 P 处切线的斜率
dx 0
它表示切线的方向有了切线的方向再用解析几何的知识切线的
d
方程就可以容易得出现在我们把 | x0 看作一个映射它作用在函数
dx
d
f 上就获得一个实数 f | x0 这个实数就是曲线 y = f (x) 在点 P 的切
dx
线的斜率
更抽象一点来说设 Fx0 是所有在点 x0 可微的函数组成的空间若
带有通常的函数相加数乘和乘的运算表示为
( f + g )( x) = f ( x) + g ( x)
(αf )( x) = αf ( x)
( fg )( x) = f ( x) g ( x)
作映射即在点 x0 求导
d
| x : Fx0  → R
dx 0
d
f  → f | x0
dx
则由求导法则可知它满足以下性质
d d d
(I) 线性 ( f + g ) | x0 = f | x0 + g | x 0
dx dx dx
d d
(αf ) | x0 = α f | x0 α 是实数
dx dx
(II) 莱布尼兹 Leibniz 法则
d d d
( fg ) | x0 = f ( x0 ) ⋅ g | x0 + g ( x0 ) ⋅ f | x0
dx dx dx
若反过来有一个映射 ϕ : Fx0  → R
满足 (I ϕ ( f + g) = ϕ ( f ) + ϕ (g)
线性
ϕ (αf ) = αϕ ( f )
(II 莱布尼兹法则
ϕ ( fg ) = f ( x0 ) ⋅ ϕ ( g ) + g ( x0 ) ⋅ ϕ ( f )
那末这个 ϕ 是否一定是求导回答是肯定的因为对任何 f ∈ Fx 0
总可以将它表示为:
f ( x) = f ( x0 ) + ( x − x0 ) ⋅ g ( x)
其中
15
 f ( x) − f ( x0 )
 , x ≠ x0
g ( x) =  x − x 0
 d f | x , x = x0
 dx 0
由 ϕ 的性质,可得:
ϕ ( f ) = ϕ ( f ( x0 )) + ( x0 − x0 ) ⋅ ϕ ( g ) + ϕ ( x − x0 ) ⋅ g ( x0 )
= ϕ ( f ( x 0 )) + ϕ ( x) ⋅ g ( x0 ) − ϕ ( x0 ) ⋅ g ( x 0 )
又由莱布尼兹法则,对常数 1:
ϕ (1) = ϕ (1 ⋅ 1) = ϕ (1) + ϕ (1) = 2ϕ (1)
所以可得 ϕ (1) = 0 ,因而对任何常数 C ,有:
ϕ (C ) = C ⋅ ϕ (1) = 0
代入 ϕ ( f ) 有
d
ϕ ( f ) = ϕ ( x) ⋅ g ( x0 ) = ϕ ( x) ⋅ f | x0
dx
由于 ϕ (x) 是与 f 无关的量,它只与 ϕ 有关,因而记为 α ,所以
d
ϕ ( f ) = α ⋅ f | x0
dx
d
这表明映射 ϕ 作用在任何 f ∈ Fx0 上,等于求导数 α ⋅ | x0 作用在 f 上,
dx
d
即 ϕ ≡ α ⋅ | x0
dx
α 是一个只与 ϕ 有关,而与 f 无关的常数,这又说明所有这种 ϕ 组成一
d
个 1 维的线性空间,基是 | x0 ,每一个这样的 ϕ 作用在 f ∈ Fx0 上,便得
dx
到曲线 y = f (x) 在点 ( x 0 , f ( x0 )) 的切线方向,故称 ϕ 是切向量通常我们
把向量看成是有方向和大小的量现在把映射 ϕ 称为切向量可能很难理
解其实把切向量看作是映射会更有力也更自然的例如我们把金子
看作是一种财富但炼金术也是财富映射就是炼金术把它
作用在任何可微函数上就得到一个切向量因而直接把 ϕ 作为切向量是
很自然的正如你愿意背一大筐金子呢还是愿意掌握炼金术
现在将这一基本思想用到微分流形上设 M 是 n 维 C ∞ 流形
P ∈ M 又设 FP 是所有在 P 点附近有定义且在 P 可微的函数组成的空
间且有以下的加数乘和乘的运算
( f + g )( P ' ) = f ( P ' ) + g ( P ' )
(αf )( P ' ) = αf ( P ' )
( fg )( P ' ) = f ( P ' ) g ( P ' )
16
设映射ϕ : FP 
→ R 满足
(I) 线性: ϕ ( f + g) = ϕ ( f ) + ϕ (g)
ϕ (αf ) = αϕ ( f )
(II) 莱布尼兹法则:
ϕ ( fg ) = f ( P) ⋅ ϕ ( g ) + g ( P) ⋅ ϕ ( f )
就称 ϕ 是 M 在 P 点的一个切向量,所有这种 ϕ 组成的空间就称为
M 在点 P 的切空间,记为TP ,其中的”加”和”数乘”是:对任何 f ∈ FP ,任
何ϕ 1 ,ϕ 2 ∈ TP ,以及任何实数α 均成立:
(ϕ 1 + ϕ 2 )( f ) = ϕ 1 ( f ) + ϕ 2 ( f )
ϕ 1 (αf ) = αϕ 1 ( f )
具有上述性质后,TP 是一个线性空间那末ϕ 具有什么样的形式
TP 的基又是什么
定理切空间 TP 是 n 维线性空间在给定的坐标系 ( x1 , x 2 ,...x n ) 下它
∂ ∂
的基是 | x0 ,..., | x 其中 x0 = ( x1o , x 2o ,..., x no ) 它是点 P 的局部坐
∂x1 ∂x n 0
∂
标每一个切向量ϕ 都可以用 | x ( j = 1,2,..., n) 的线性组合表示出来
∂x j 0
∂ ∂
ϕ = α1
| x0 +... + α n |x
∂x1 ∂x n 0
证明设 (U α , ϕ α ) 是坐标卡 P ∈ U α 对任何 f ∈ FP f 在点 P 可微
−1 −1
即 f o ϕ 在 x0 处可微为记号的简便起见我们把 f o ϕ 仍旧记为 f
α α
将 f 展开
n
f ( x) = f ( x0 ) + ∑ ( xi − xio ) g i ( x)
i =1
∂
其中 g i 在点 x0 的值是 g i ( x0 ) = f | x0 切向量ϕ 作用于 f 得
∂xi
n n
ϕ ( f ) = ϕ ( f ( x0 )) + ∑ ( xi0 − xi0 ) ⋅ ϕ ( g i ) + ∑ ϕ ( xi − xi0 ) g i ( x0 )
i =1 i =1
n n
= ϕ ( f ( x0 )) + ∑ ϕ ( xi ) g i ( x0 ) − ∑ ϕ ( xi0 ) g i ( x0 )
i =1 i =1
由莱布尼兹法则
ϕ (1) = ϕ (1 ⋅ 1) = ϕ (1) + ϕ (1)
所以ϕ (1) = 0 从而对任何常数 C
ϕ (C ) = 0
17
n
∂ n
ϕ ( f ) = ∑ ϕ ( xi ) g i ( x0 ) = ∑ ϕ ( xi )
f | x0
i =1 i =1 ∂xi
记 ϕ i = ϕ ( xi )(i = 1,2,...n) ϕ i 与 f 无关它们是由ϕ 确定的则对任
何 f ∈ FP
n
∂
ϕ ( f ) = ∑α i ⋅ f | x0
i =1 ∂xi
n
∂
即 ϕ = ∑α i ⋅ |x
i =1 ∂xi 0
∂
这即表明切向量 ϕ 是 | x (i = 1,2,..., n) 的线性组合而每一个
∂xi 0
∂ ∂
| x0 都满足线性和莱布尼兹法则的因此 | x 即是一个切向量
∂xi ∂xi 0
∂ ∂
再证明 | x0 ,..., |x 线性无关现假设存在一组实数
∂x1 ∂x n 0
C1 , C 2 ,..., C n 使
∂ ∂ ∂
C1 | x0 + C 2 | x0 +... + C n |x = 0
∂x1 ∂x 2 ∂x n 0
将它作用在函数 xi 上即可得 C i = 0(i = 1,2,..., n) 所以
∂ ∂
| x0 ,..., | x 应线性无关因而它是切向量的基从而定理得证
∂x1 ∂x n 0
18
第二章李导数李括号运算与分布
为了尽快的涉及非线性系统的几何理论我们将以较短的篇幅介绍
李导数的概念与李括号运算
2.1 向量场
若 f (x) 是 n 维函数向量,即
 f 1 ( x1 ,..., x n ) 
 f ( x ,..., x ) 
 2 1 n 
 . 
f ( x) =  
 . 
 . 
 
 f n ( x1 ,..., x n )
它的每一个分量 f i (x) 都是变量 x = ( x1 ,...., x n ) T 的函数从几何观点
看即是对状态空间中每一个点对应一个状态对应一个确定的向
量即映射 f : R n 
→ R n 即可以想象从每一个点 x 发射出一个
向量因而从整体上看形成一个由向量构成的场
2.2 李导数
给定一个光滑的标量函数 h(x) 和一个向量场 f (x) ,则可以定义标量
函数沿向量场的导数称为李导数,或称为 h对f 的李导数它是一个新的
标量函数记为 L f h
设 h( x ) : R n 
→ R 为一光滑标量函数;
f ( x) : R 
n
→ R n 为 R n 上的一个光滑的向量场;
g ( x) : R n → R n 为 R n 上的另一个光滑的向量场;
则
∂h( x) ∂h( x) ∂h( x) ∂h( x)
L f h( x ) = ⋅ f ( x) = ( , ,..., ) ⋅ f ( x)
∂x ∂x1 ∂x 2 ∂x n
n
∂h( x)
= dh( x) ⋅ f ( x) = ∑ ⋅ f i ( x) 或记为 ∇h( x) ⋅ f ( x)
i =1 ∂x i
n
∂h( x)
同理有: L g h( x) = ∇h( x) ⋅ g ( x) = dh( x) ⋅ g ( x) = ∑ ⋅ g i ( x) = ...
i =1 ∂xi
多重李导数可以递归地定义为:
k −1
∂ ( Lkf−1 h( x))
L h( x) = L f ( L h( x)) =
k
⋅ f ( x)
∂x
f f
19
∂ ( L f h( x))
L g L f h( x) = L g ( L f h( x)) = ⋅ g ( x)
∂x
∂ ( L f h( x))
k
L g Lkf h( x) = L g ( Lkf h( x)) = ⋅ g ( x)

∂x
又定义: L0f h( x) = h( x) 同理 L0g h( x) = h( x)
上标”0”意味着不求导因为 L f h( x) = L f ( L0f h( x)) 适合递归式子
2.3 李括号运算
若 f (x) 与 g (x) 为 R n 上的两个向量场,两同维的向量 f (x) , g (x) 的李
括号运算定义为:
∂g ∂f
[ f , g ]( x) = ⋅ f − ⋅ g = ∇ g ⋅ f − ∇f ⋅ g
∂x ∂x
或记为 ad f g ,它是一个新的向量场
 ∂g1 ∂g1 ∂g1 
 ∂x . .
∂x 2 ∂x n 
 1 
 ∂g 2 ∂g 2
. .
∂g 2 
∂g  ∂x1 ∂x 2 ∂x n 
=
∂x  . . . 

 . . . 
 ∂g n ∂g n ∂g n 
 . . 
 ∂x1 ∂x 2 ∂x n  n×n矩阵
∂f
同理可知也是一个 n × n 的矩阵它们分别称为流形映射到 g 和 f 的
∂x
Jacobian 阵
李括号运算也可以多次重复进行例如
[ f , [ f , g ]],..., [ f [ f ,...[ f , g ]]]
或 ad f (ad f g ),..., ad f (ad f ...(ad f g )) 也可采用递归记法:
ad kf g ( x) = [ f , ad kf −1 g ]( x) k ≥1
当 k = 1时 ad f g ( x) = [ f , ad g ( x)]( x) = [ f , g ]( x)
0
f
因而可以定义: ad 0f g ( x) = g ( x)
2.4 李括号运算具有下列性质
(1) 在 R 域上是双线性的,即若 f1 , f 2 , g1 , g 2 是向量场,且 r1 , r2 是实数,
则有: [r1 f1 + r2 f 2 , g1 ] = r1 [ f 1 , g1 ] + r2 [ f 2 , g 1 ]
[ f1 , r1 g1 + r2 g 2 ] = r1 [ f1 , g 1 ] + r2 [ f1 , g 2 ]
(2) 是斜可交换的,即:
20
[ f , g ] = −[ g , f ]
(3) 满足 Jacobian 恒等式,即若 f , g , p 是向量场,则
[ f , [ g , p]] + [ g , [ p, f ]] + [ p, [ f , g ]] = 0
2.5 协向量场的微分运算
对于一个向量场 f ,常常采用与其对偶的协向量场 ω ,两者都定义
在 Rn 的开集 V 上 , 但 f 是列向量场 , 而 ω 是行向量场 , 即
ω ( x) = [ω1 ( x), ω 2 ( x),..., ω n ( x)] 它是 R n 空间的对偶空间记为 ( R n ) *
定义一种新的运算称为协向量场 ω 沿向量场 f 的李导数即
T
∆  ∂ω T  ∂f
L f ω ( x) = d ω , f =  ⋅ f  + ω ( x) ⋅
 ∂x  ∂x
T
 ∂ω T  ∂f
= f   + ω ( x) ⋅
T
 ∂x  ∂x
其中上标"T "表示转置
以上三种运算可以统一起来统称为李导数只是
L f h(x) 是指光滑标量函数沿向量场的李导数得到的仍是一个标量
函数
ad f g (x) 是光滑的向量场沿向量场的李导数得到的是一个新的向
量场
L f ω (x) 是协向量场沿向量场的李导数得到的是一个新的协向量
场
这三种李导数有下列关系
L f ω , g = L f ω , g + ω ,[ f , g ]
其中 f , g 表示向量场 ω 表示协向量场 •,• 表示内积
2.6 运算法则
以上三种李导数运算,经过简单的推导可以得到下列运算规则:
(1) 如果 f 是一个向量场, α , λ 为实值函数,则
Lαf λ ( x) = ( L f λ ( x))α ( x)
(2) 若 f , g 是向量场, α , β 是实值函数,则
[αf , βg ]( x) = α ( x) β ( x)[ f , g ]( x) + ( L f β ( x))α ( x) g ( x) − ( L g α ( x)) β ( x) f ( x)
(3) 若 f , g 是向量场, λ 是实值函数,则
L[ f , g ] λ ( x) = L f Lg λ ( x) − Lg L f λ ( x)
(4) 若 f 是向量场, ω 是协向量场, α , β 是实值函数,.则
Lαf βω ( x) = α ( x) β ( x)( L f ω ( x)) + β ( x) ω ( x), f ( x) dα ( x)
21
+ ( L f β ( x))α ( x)ω ( x)
若 f 是向量场, λ 是实值函数,则
L f dλ ( x) = dL f λ ( x)
(5) 若 f , g 是向量场, ω 是协向量场,则
L f ω , g ( x) = L f ω ( x), g ( x) + ω ( x), [ f , g ]( x)
此式即上述已提到的三种李导数之间的关系
2.7 分布 Distributions
(1)分布的意义
定义在 R n 开集U 上的光滑向量场 f 可以直观地看作是一种光滑映
射即对于U 上每一点 x 赋以 n 维光滑向量 f (x) 现在假设定义在同
样的开集U 上有 d 个光滑的向量场 f 1 , , fd 并且注意到在 U中任意
给定的点 x 向量 f 1( x) , , fd ( x) 张成了一个向量空间该向量空间
是 fi (x) 内被定义的那个向量空间即 R n 的子空间
即有
∆(x ) =span { f 1( x), K , fd ( x)}
若 f1 ( x) , , f d (x) 是光滑的则对开集U R n 上的每一点 x 来说
子空间由某些光滑的向量场来张成于是称它为光滑分布
所以分布是在某种意义下的子空间的集合也是向量场的集合
记为
=span { f 1, K, fd }
要注意记分布整体而记 ∆(x ) 记在 x 点上的值即某一个子空
间
从分布是一个向量空间一个 R n 的子空间的观点出发则可列出分布
的一些特性
(2)分布的一些特性
如果 ∆1 和 ∆ 2 是分布则 ∆1 +∆ 2 也是分布称为分布的和即
若 ∆ 1 ( x) = span { f 1( x), K , fd ( x)}
∆ 2 ( x) = span {g 1( x), K, ge( x)}
当 x 指定时上两式均表示子空间
因此 (∆1 + ∆ 2 )( x ) =span { f 1 x , K , fd  x , g 1 x , K , ge x } 也
表示某子空间
故 ∆ = ∆1 + ∆ 2 = span{ f 1, L , fd , g1 , L, g e }
同理若 ∆1 和 ∆ 2 是分布则 ∆1 I ∆ 2 也是分布称为分布的交
22
即由下式确定
(∆1 I ∆ 2 )(x ) =∆1 x  I ∆ 2 x 
包容若对所有 x ,有 ∆1( x ) ⊃ ∆ 2( x ) 记为 ∆1 ⊃ ∆ 2 称为 ∆1 包容 ∆ 2
所以若对所有 x f ( x ) ∈ ∆( x ) ,则称向量场 f 属于分布 ∆ 记 f ∈ ∆
若一个矩阵 F 它具有 n 行每一行的各项均是 x 的光滑函数,
则它的每一列就可看成是光滑的向量场这种矩阵就可表示成由它的
列张成的光滑分布其在每一点 x 上的值就是矩阵 F 在 x 点上的
象即
∆(x ) =Im(F ( x ))
分布在点 x 处的维数就是 ∆(x ) 子空间的维数显然若分布被看成
是某矩阵 F 的列所张成的子空间的集合则分布在点 x 处的维数就是矩
阵 F (x ) 的秩
若一个分布它在U 中任何 x 上的维数不变即
dim(∆( x )) =const x ∈U
则称分布是非奇异的否则称变维分布
若在某点 x 0 处及其 x 0 的邻域U 0 上分布是非奇异的则称 x 0 为正则
点否则称奇异点
两个光滑分布的和仍是光滑分布而两个光滑分布的交不一定
是光滑的
可由反例说明
1 1 + x1  
若 ∆1 =span   ∆ 2 =span  
1 1 
则 (∆1 I ∆ 2 )(x ) = {0} 若 x1 ≠ 0
(∆1 I ∆ 2 )(x ) =∆1(x ) = ∆ 2(x ) = span  若 x1 = 0 所以

1
1
∆1与∆ 2 的交是不光滑的因为不可能在 R 2 上找到一个光滑的向量场
它除了 x1 = 0 的线上不为零之外其余各处均为零
3 对合分布
定义若 τ 1 和 τ 2 是属于分布 ∆ 的任意两个向量场且由 τ 1 和 τ 2
构成的李括号 [τ 1 , τ 2 ] 所得到的向量场仍然属于分布 ∆ 则这样的分布
∆ 称为对合分布
即当且仅当 τ 1 ∈ ∆ τ 2 ∈ ∆ ⇒ [τ 1 τ 2 ] ∈ ∆
称为对合分布
判别对合分布的方法
考虑非奇异分布 ∆ 则 ∆ 中的任意两个向量场 τ 1 τ 2 ∈ ∆ 均可
23
表示成
d
τ 1 ( x) =∑ ci ( x) fi ( x)
i =1
d
τ 2 ( x) =∑ di ( x) fi ( x)
i =1
其中 ∆( x ) = span{ f 1(x ), K, fd ( x )}
则可容易推导得
[τ 1 ,τ 2 ](x ) ∈ ∆ 等价于
[ fi, fj ](x ) ∈ ∆ 对所有 1 i ,j d
所以有当且仅当 [ fi, fj ]( x ) ∈ ∆ 对所有 1 i ,j d 分布 ∆ 是对合
的
因此实际上只要证明对非奇异分布
rank [ f 1( x ), K , fd ( x )] = rank [ f 1( x ), K , fd ( x ), [ fi, fj ]( x )]
对所有 x和所有 1 i ,j d 成立
一些推论
一维分布总是对合分布
因为 ∆ = span{ f }, f 是非零向量场
则由 [ f , f ] =∂f ⋅ f − ∂f ⋅ f =0
∂x ∂x
因而 rank { f } = 1
rank { f , [ f , f ]} = rank { f ,0} = 1
rank { f } = rank { f , [ f , f ]} = 1
故结论得证
二维分布不一定是对合的
考虑在 R 3 空间中的二维分布
∆ = span{ f 1, f 2}
2 x 2 1

f 1( x) = 1  ,  f 2( x) = 0 
 0   x 2 
∂f 2 ∂f 1
由于 [ f 1, f 2] = ⋅ f 1 ⋅ f2
∂x ∂x
0 0 0  2 x 2  0 2 0   1  0 
=0 0 0  1  0 0 0  0  =0
    
0 1 0  0  0 0 0  x 2  1
24
所以有 rank { f 1, f 2} =2
 2 x 2 1 0
rank { f 1, f 2 [ f 1, f 2]} =rank  1 0 0 =3
 0 x 2 1
因而该分布不是对合的
两个对合分布的和不一定是对合的可由上面的例子说明因为
一维分布是对合的但两个一维分布的和不一定对合但两个对
合分布的交仍是对合分布
对偶分布协分布
在很多情况下为了应用的方便起见常常采用所谓对偶分布或
协分布
上面提到分布 ∆ 是用列向量场来定义的
而对偶分布是用其对偶物行向量场来定义的所以对于某一给定
的点 x 协分布是对偶空间 R n 的一个子空间 ( ) ∗
若 ω 1, ω 2, K, ωd 表示一组行向量场即协向量场则协分布表示为

Ω = span{ω 1, K , ωd }
对于U 中给定的点 x 协分布是 R n 中的一个子空间记为 ( )∗
Ω( x ) = span{ω 1( x ),L , ωd (x )}
所以如果给定一个分布 ∆ 则对于U 中的每一个点 x 有 ∆(x ) 它
是 R 的子空间 ∆(x ) 的所有零化向量的集合构成了对偶空间特定的子
n
空间即它是 ∆(x ) 的正交补 ( ) ∗

是 R n 的子空间即可用式子表示成
( )
∆⊥ ( x ) = { ω ∗ ∈ R n
∗
ω∗, υ 0 对所有 υ ∈ ∆( x ) }
∆ ( x ) 也称为 (x)的零化子
⊥
式中 ω ∗ , υ 表示行向量 *与列向量的内积

类似的若给定一个协分布则协分布的正交补可表示成
Ω (x ) = { v ∈ R
⊥ n
ω ,υ
∗
0 对所有 ω ∈ Ω( x ) }
∗
要注意的是由此构成的协分布可能失掉光滑性即原分布是光滑
的而其正交补不一定保证也是光滑的
2.8 Frobenius 定理
考虑偏微分方程 x ∈ R n ( )
∂λj  x  ∂λj  x 
[ f 1(x ),L, fd (x )] =   F (x ) = 0
∂x ∂x
其中 1 j n−d
25
λj ( x ) 是需要求解的未知函数
f 1( x ), L , fd ( x ) 是已知向量场
∂λj ( x )
所以是未知函数的偏导数是一个行向量现在要问此偏
∂x
微分方程是否有解
以上问题如果用几何的观点来叙述则表示如下
一个非奇异的 d 维分布 ∆
∆ = span{ f 1, L , fd } 定义在 R n 的开集U 上对于U 上
的每一点 x 0 及其邻域U 0 f 1( x ),L , fd ( x ) 是定义在U 0 上的光滑向量
场如果在U 0 上定义的 (n − d ) 个实光滑函数 λ 1( x ), λ 2( x ), L λn − d ( x )
能使 span{dλ 1, dλ 2 L , dλn − d }=∆⊥ 那末就称这个分布 ∆ 是完全可积
的或者具体一点说就是矩阵 F (x ) 的列所张成的分布是完全可积
的现在的问题是在什么条件下分布 ∆ 是完全可积的
Frobenius 定理一个分布当且仅当它是对合的则是完全可积的
该定理的证明应分两部分即需证明条件的必要性与充分性
必要性即若这样的解 λj 存在即 ∆ 是完全可积的来推导
出 ∆ 是对合的
即若已知 span{dλ 1, dλ 2 L , dλn − d }=∆⊥
∂λj ( x )
则有 ⋅ fi ( x ) = dλj , fi = 0
∂x
x ∈U 0 , 1 j n − d 1 i d
采用李导数记号即 Lf λj  x  = 0 i
再由李括号运算法则可得
L[ fi , fk ]λj ( x ) = LfiLfkλj (x ) − LfkLfiλj  x  = 0
由于上式中的两项为零
故有 dλj , [ fi, fk ] = L[ fi , fk ]λj ( x ) = 0
则构造
 L[ fi , fk ]λ 1( x )   dλ 1 
 L[ fi , fk ]λ 2( x )   dλ 2 
  =  ⋅ [ fi , f k ] = 0
 M   M 
   
 L[ fi , fk ]λn − d ( x ) dλn − d 
因为已知 span{dλ 1, dλ 2 L , dλn − d }=∆⊥
所以所有 [ fi, fk ] 一定是 ∆ 中的一个向量根据对合分布的判别
法则可知 ∆ 是对合的
26
充分性充分性可以从构造上来证明即若条件满足,偏微分方

程的 n − d 个独立函数是如何一定能被构造出来的因为分布
∆ = span{ f 1, L , fd }对应的子空间 ∆(x) 是非奇异的且其维数为 d
于是总可以找到另外的同样定义在开集 U 0 上的向量场集合
它是原来 ∆(x) 向量场集合的补集即在每一点 x ∈ U ,
0
f d +1 ,L f n
有 span{ f 1 ( x),L f d ( x), f d +1 ( x),L f n ( x)} = R n
并假设向量场中的函数均是光滑的再令 φt f ( x 0 ) 是常微分方程
x& = f (x) 在 x(0) = x 0 初始条件下的解即 x(t ) = φ t f ( x 0 ) 它是 x 和 t 的
∂
光滑函数换句话说它满足 φ t f ( x) = f (φ t f ( x)) φ 0f ( x) = x φ t f ( x)
∂t
可以称为流函数因此对任意给定的 x 0 以及 x 0 的领域U 0 上的任意
x 总可以找到充分小的 t 使下列映射关系成立
φ t f : x → φ t f ( x)
它是一个局部微分同胚映射所以其逆映射也存在即 φ t f [ ] −1
= φ −ft 因
此对于充分小的 t s 有 φ t f+ s ( x) = φ t f (φ sf ( x)) 成立这样偏微分方程的
解可以用向量场 f1 ,L , f n 的流函数的恰当组合来构成这些流函数是
φ t f ( x) φ t f ( x),L, φ t f (x) 现在来考虑映射 F : U ε → R n
1
1
2
2
n
n
z1 ,L , z n
→ φ zf11 o φ zf22 o L o φ zfnn ( x 0 ) 其中 U ε = {x ∈ R n | z i < ε } 记号 o 表示
恰当的组合若 ε 充分的小则可以证明这个映射具有下列特点
1 它定义在所有 z = ( z1 , L z n ) ∈ U ε 上并且是微分同胚映射因而
U ε 与U 0 是微分同胚
 ∂F 
2 对所有 z ∈ U ε
它的雅可比阵   其前面的 d 列是 ∆( F ( z )) 中
 ∂z 
的线性独立向量
因为U 是映射 F 的象域 U 0 是 x 0 的一个开邻域而若 x 0 就是点 z = 0
0
的象或值则由特性 1 知 F 是微分同胚映射则 F −1 存在且也
是光滑的可微的
φ1 ( x) 
φ ( x) 
设  2  = F −1 ( x) 其中 φ1 ( x),L, φ n ( x) 是定义在 x ∈ U 0 上的实值函数
L 
 
φ n ( x)
则可以断言这些函数最后面的 n − d 个函数就是偏微分方程的 n − d 个
27
独立解为什么可以作此断言因为由定义可知
 ∂F 
−1
 ∂F 
 ∂x  •   = I 对所有 z ∈ Uε 及所有 x ∈ U 0 成立其中 I 是
  x = F ( z )  ∂z 
 ∂F 
单位阵而由上述特点 2 可知  ∂z  的前 d 列构成分布 ∆(x ) 在
点 x = F (z ) ( x ∈ U 0 ) 的基所以微分
∂φ d +1
dφ d +1 =
∂x
∂φ
dφ d + 2 = d + 2
∂x
M
∂φ
dφ n = n
∂x
就构成了分布 ∆ 在点 x ∈ U 的子空间 ∆(x) 的零化向量换句话说若
0
令 Ω( x) = span{∂φ d +1 ( x),L , ∂φ n ( x)} 则 Ω( x) = ∆⊥ ( x) ( x ∈ U 0 ) 即这些

函数 φ d +1 ( x),L , φ n ( x) 就是偏微分方程 n − d 个独立解
从而充分性得证
28
第三章反馈线性化的初等理论
3.1 局部坐标变换
我们将按照循序渐进的方式来研究有关于非线性系统的反馈
控制规律的一系列问题首先我们在本章讨论单输入单输出系统
然后在后面的章节中将其大多数结果推广到多输入多输出系统
1 相对阶或相对度定义
单输入单输出系统若写成下列形式(称仿射非线性系统)
x& = f ( x ) + g ( x )u 1 1a
y = h( x ) 1 1b
则系统在点ｘ０上说他具有相对阶r 若下面两个条件成立
(对所有ｘ０的邻域上的x及所有k<r-1)
(i) Lg Lkf h( x ) = 0
(ii) ( )
Lg Lrf−1h x 0 ≠ 0
注意在某些情况下相对阶不能被确定事实上当 L g h( x )
L g L f h( x ) 函数序列的首函数不是一致为零在ｘ的邻域上０
０
而在x= ｘ点上又精确为零时就出现这种情况然而很清楚地
相对阶能够被确定的点的集合是系统 1 1 被定义的集合U的一
个稠密的开子集
2 举例
考虑状态空间的范德波尔振荡方程
•  x2  0
 x = f ( x ) + g ( x )u =  +  u
2ως (1 − µx1 )x2 − ω x1  1
2 
 2

 y = h(x ) = x1
则
∂h 0
Lg L0f h( x ) = Lg h( x ) = ⋅ g ( x ) = [1 0]  = 0
∂x 1
∂h( x )  x2 
L f h( x ) = f ( x ) = [1 0]  = x 2
∂x ∗
(
∂ L f h( x ) ) ⋅ g( x ) = 0
Lg L1f h( x ) =
∂x
[0 1]1 = 1 ≠ 0
 
∴我们可以看到在ｘ０为任意值时其邻域上均有
29
(i ) Lg L0f h( x ) = 0
(ii ) Lg L f h( x 0 ) = 1 ≠ 0
可得出 r-1=1 则即 r=2

因此系统在任何点ｘ０上均有相对阶为 2,然而若输出函数为
y = h( x ) = sin x 2 ,那么 Lg h( x ) = cos x 2
则当 x 0 2 ≠ (2k + 1)π 2 则ｃｏｓｘ２０ ≠ ０则系统的相对阶为 1 否
则若 x 0 2 = (2k + 1)π 2 则ｃｏｓｘ２０ = ０则系统的相对阶不能被确定
3 关于相对阶的几点讨论
1 对于线性系统相对阶是其传递函数的分母阶次与分子阶次
的差值
 x• = Ax + Bu
对线性系统 
 y = Cx
f ( x ) = Ax g( x ) = B h( x ) = Cx
∂h( x )
L f h( x ) = ⋅ f ( x ) = CAx
则 ∂x
L f h( x ) = CA k x
k
Lg Lkf h( x ) = CA k B
则确定相对阶的条件变成
(i ) CA k B = 0
对所有 k<r-1
(ii ) CA r −1 B ≠ 0
而传递函数为 H ( s) = C( sI − A) B
−1
由 Faddeev 公式
H (s ) = C (sI − A) B
−1
CBs n −1 + (CAB + a n −1CB )s n − 2 + (CA 2 B + a n −1CAB + a n − 2CB )s n −3 + ⋅ ⋅ ⋅ + (CA n −1 B + ⋅ ⋅ ⋅ + a1CB )

=
s n + a n −1 s n −1 + ⋅ ⋅ ⋅ + a1 s + a0
则
若ＣＡ０Ｂ ≠ ０ r-1=0 r=1 而此时分母与分子阶次差 1 阶
30
若ＣＡ０Ｂ = ０而ＣＡＢ ≠ ０ r-1=1 r=2 此时分母与分子阶次差

2阶
若 CA 0 B = 0, ⋅ ⋅ ⋅ , CA k B = 0 ( k < r − 1) 而ＣＡｒ −１Ｂ ≠ ０相对阶为r

此时分母与分子阶次差 n − (n − (r − 1) − 1) = r 阶
因此对于单输入单输出线性系统相对阶等于其传递函数分
母阶次与分子阶次之差
2 在ｔ = ｔ０时刻为了从输出 y( t ) 得到 u t 0 的显式表示必需对 ( )
y( t ) 进行微分的次数正好等于系统的相对阶r
若系统在ｔ０时刻处于状态 x0 = x t 0 ( ) 则
( ) ( ( )) = h( x )
y t0 = h x t0 0
以 y ( ) ( t ), k = 1,2,⋅⋅⋅ 表示在ｔ = ｔ０时刻
k
y( t ) 对时间的各阶导
数
∂h( x ) dx
y (1) (t ) = ⋅
∂x dt
∂h
=
∂x
( f ( x ) + g ( x )u )
= L f h( x ) + L g h( x ) ⋅ u
若相对阶r=1 ( )
则 Lg h x 0 ≠ 0 所以对y作一次微分就可以得
( )
到 u t 0 的显式表示
( )
u t0 =
1
L h( x )
( y ( ) (t )
0
1
t0 ( ))
− Lf h x0
g
( )
若相对阶 r>1 则 L g h x 0 = 0 ,所以 y ( ) (t ) = L f h( x )
1
于是
∂L f h( x ) dx
y ( 2 ) (t ) = ⋅
∂x dt
∂L f h( x )
=
∂x
( f ( x ) + g ( x )u )
= L2f h( x ) + Lg L f h( x ) ⋅ u
31
若相对阶 r>2 则在 t 接近于ｔ０的邻域上 L g L f h( x ) = 0 而
y ( 2 ) ( t ) = L2f h( x )
若相对阶为 r 则如此继续进行微分可得
y (t ) = L f h( x ) + Lg L f h( x ) ⋅ u
(r ) r r −1
( )
因为 L g Lrf−1 h x 0 ≠ 0 所以
y ( r ) (t ) to ( ) ( ) ( )
= Lrf h x 0 + Lg Lrf−1h x 0 ⋅ u t 0
( )
u t0 =
1
r −1
Lg L h x ( )
0 ( y ( ) (t ) − L h( x ))
r
t0
r
f
0
这就说明当系统的相对阶为 r 时 u t 0 可以用 y( t ) 的 r 阶 ( )
导数显式表示
3 r 是最大线性无关的下列行向量的数目
( )
dh x 0 , dL f h x 0 ,⋅ ⋅ ⋅ , dLkf h x 0 ( ) ( )
即若 r 是系统的相对阶则行向量组
( ) ( )
dh x , dL f h x 0 ,⋅ ⋅ ⋅ , dLrf−1h x 0 是线性无关的
0
( )
由此可见相对阶一定 ≤ n 因为用反证法若 r>n 则上
述行向量组一定是线性相关的所以 r 不可能大于 n
为了证明这一点需要进行一些数学推导我们将这一推导分
几个步骤并且在本讲义中仅列出其要点
第一步先来证明一个今后有用的定理
定理令 Φ 是实值函数 f和g是向量场(均定义在 R n 的开集上),
则对于任选的s,k,r>0,下列式子成立:
r
r
dLsf Φ ( x), ad kf + r g ( x) = ∑ (−1) i   Lrf−i dLsf+i Φ ( x), ad kf g ( x)
i =0 i
r r!
其中 *,*表示向量的内积 ,   = 表示从 r个不同的
 i  i!(r − i )!
元素中取i个的组合数
该定理的证明是容易的只要对r进行归纳法即可,并且注意
到下列事实:
dLsf Φ ( x), ad kf + r +1 g ( x) = dLsf Φ ( x), [ f , ad kf + r g ( x)]
= L f dLsf Φ ( x), ad kf + r g ( x) − dLsf+1Φ ( x), ad kf + r g ( x)
32
第二步作为上述定理的直接推论,可得出下列两组条件是等
价的:
(i ) Lg φ ( x ) = Lg L f φ ( x ) = Lg L2f φ ( x ) =L = Lg Lkf φ ( x ) = 0 对于所
有ｘ ∈Ｕ
(ii ) Lg φ ( x ) = Lad f g φ ( x ) = Lad 2 g φ ( x ) =L = Lad k g φ ( x ) = 0
f f
对于所有
ｘ ∈Ｕ
第三步根据相对阶的定义再应用上述定理可以得出对所
有 i j 只要ｉ + ｊ ≤ ｒ − ２
则 dL jf h( x ), ad if g( x ) = 0 对所有ｘ０的邻域上的 x 以及
( ) ( ) = (−1) (
dL jf h x 0 , ad if g x 0
r −1− j )
( )
L g Lrf−1h x 0 ≠ 0 只要i+j=r-1
因此下列矩阵
 dh x 0 

( )

0
( ) [ g( x )
 dL f h x  0
ad f g x 0 ( ) ( )]
L ad rf −1 g x 0
 M 
 r −1 0 
( )
dL f h x 


0 L L ( ) ( ) 
dh x 0 , ad rf −1 g x 0
 0 L L ∗ 
= 
M ∗
 r −1 0 
( )
 dL f h x , g x
0
( ) ∗ L ∗ 
的秩是 r ( ) ( )
所以行向量组 dh x 0 , dL f h x 0 ,L , dLrf−1h x 0 是线性无关 ( )
的
4局部坐标变换及正则形可以看作是相对阶的一种应用
为了使系统的数学描述简化或便于应用有时需要将原来用ｘ
作为状态变量的系统方程通过坐标变换变成用 Ζ 作为新的状态变
量的系统方程
若系统在ｘ０处有相对阶r 则ｒ ≤ ｎ
i 若r=n 则我们可以选择
33
z1 = φ 1 ( x ) = h( x ) φ 1 ( x ) 
z 2 = φ 2 ( x ) = L f h( x )  
 φ 2 ( x )
→ Ζ = φ ( x) φ ( x) =
M  M 
 
z n = φ n ( x ) = Lnf−1h( x ) = Lrf−1h( x ) φ n ( x )
dz1 ∂φ 1 ( x ) dx ∂h( x )
dt
=
∂x
⋅
dt
=
∂x
( f ( x ) + g ( x )u )
∂h( x ) ∂h( x )
= f ( x) + g( x ) ⋅ u
∂x ∂x
= L f h( x ) + Lg h( x ) ⋅ u = L f h( x ) = z2
dz 2 ∂φ 2 ( x ) dx ∂L f h( x )
dt
=
∂x
⋅
dt
=
∂x
( f ( x ) + g ( x )u )
= L2f h( x ) + Lg L f h( x )u = L2f h( x ) = z 3
M
dz n −1 ∂φ n −1 ( x ) dx ∂L f h( x )
n−2
dt
=
∂x
⋅
dt
=
∂x
( f ( x ) + g ( x )u )
= Lnf−1h( x ) + Lg Lnf− 2 h( x ) ⋅ u
= Lrf−1h( x ) + Lg Lrf− 2 h( x ) ⋅ u = Lrf−1h( x ) = z n
dz n ∂φ n ( x ) dx ∂L f h( x )
n −1
dt
=
∂x
⋅
dt
=
∂x
( f ( x ) + g ( x )u )
= Lnf h( x ) + Lg Lnf−1h( x )u
= Lrf h( x ) + Lg Lrf−1h( x )u
其中因为r=n 所以根据相对阶的定义
Lg h( x ) = Lg L f h( x ) = L = Lg Lrf− 2 h( x ) = 0
而 L g Lrf−1 h( x ) ≠ 0
又因 Ζ = φ ( x) ∴ x = φ −1 ( z )
( )
Lrf h( x ) = Lrf h φ −1 ( z ) = b( z )
令
Lg Lrf−1h( x ) = Lg Lrf−1 h(φ ( z )) = a ( z ) ≠ 0
−1
所以方程变换成
34
•
z1 = z 2
•
z2 = z3
M
•
z n −1 = z n
•
z n = b( z ) + a( z )u
写成矩阵形式



 z2   0 
  z   0 


 3   
  ⋅   ⋅ 
 =  ⋅  +  ⋅ u
 •
Z    

  ⋅   ⋅ 

    
  z n   0 

 b( z ) a ( z )
 y = z1
(ii 若r<n 则选择

z1 = φ 1 ( x ) = h( x )
z 2 = φ 2 ( x ) = L f h( x )
M M M
z r = φ r ( x ) = Lrf−1h( x )
z r +1 = φ r +1 ( x )
M M
zn = φ n ( x )
φ 1 ( x ) 
 
 φ 2 ( x )
φ ( x) =
 M 
 
φ n ( x )
35
这后面的 n-r 个函数在满足在ｘ０处有一个非奇异的雅可比

矩阵的条件下这样才有资格在ｘ０的邻域上成为局部坐标变换的
变换矩阵可以自由选择但根据Ｆｒｏｂｅｎｉｕｓ定理总有可能选择
φ r +1 ( x ),L , φ n ( x ) 使得 L g Φ i ( x) = 0, r + 1 ≤ i ≤ n x在ｘ０的邻域上证
明见后面定理1 4
这样一来新的状态方程就可写成
•
z1 = z 2
•
z 2 = z3
M
•
z r −1 = z r
•
z r = b( z ) + a ( z )u
•
z r +1 = L f Φ r +1 ( x) = L f Φ r +1 (Φ −1 ( z )) = q r +1 ( z )
⋅
⋅
•
z n = L f Φ n ( x) = L f Φ n (Φ −1 ( z )) = q n ( z )
写成矩阵形式
36



 z2   0 
  z   
   0


3

  ⋅   ⋅ 

•
 
zr   ⋅ 
 =  + u
Z
  b( z )   a ( z ) 
    
 q
 r +1   0

( z ) 
  ⋅   ⋅ 

    
 q
 n ( )   0 
z
 y = z1

这种形式的系统方程称为正则形可用方块图表示
• • •
u Zr Z r −1 Z1 z=y
b(z)+a(z)u ∫ ∫ ... ∫
...
Z r +1 Zn
Zi =qi ( z)
r<i<n
定理1.4: 假设系统在ｘｏ处有相对阶r 且r是严格小于n的则取

φ 1 ( x ) = h( x )
φ 2 ( x ) = L f h( x )
M
φ r ( x ) = Lrf−1h( x )
37
且总有可能找到另外 n-r个函数 φ r +1 ( x ),L , φ n ( x ) 使得映射
φ 1 ( x ) 
 
φ ( x ) =  M  在ｘ０处有非奇异的雅可比矩阵因而在ｘ０的邻域上有资
φ n ( x )
格作为一个局部坐标变换阵且这些附加函数在ｘ０处的值能够被任意
确定更进一步总有可能选择φ r +1 ( x ),L , φ n ( x ) 使得
Lg φ i ( x) = 0
对所有ｒ + １ ≤ ｉ ≤ ｎ及所有ｘ０邻域上的x
[证明]
( )
根据相对阶的定义向量 g x 0 是非零的所以分布 G = Span{ g} 在
０
ｘ处是非奇异的1维分布所以也是对合的所以由Ｆｒｏｂｅｎｉｕｓ定理
我们可以推论出存在n-1个实值函数 λ 1 ( x ),L λ n −1 ( x ) 它们定义在ｘ０的
邻域上且使得
Span{dλ 1 , L , dλ n − `1 } = G ⊥ 1 5
( {
容易推知在ｘ０处 dim G ⊥ + Span dh, dL f h, L , dLrf−1 h = n }) 1 6
这可以用反证法来证明因为假若这是错的则
( ) ( { }) ( x ) ≠ 0
⊥
G x 0 ∩ Span dh, dL f h,L , dLrf−1h 0
也就是说向量 g( x ) 零化在 Span{dh, dL h,L , dL h} 上的所有协向

0
f
r −1
f
量但这是矛盾的因为由定义 dL h( x ), g( x ) 是非零的r −1

f
0 0
因为 Span{dh, dL h,L , dL h} 的维数是r 而且 1 5

f
r −1
f 1 6
成立所以从集合 {λ 1 ,L , λ n−1 } 中总可以找出n-r个函数不失一般性
令其为λ １，L ，λ ｎ −ｒ使得
ｄｈ，ｄＬｆｈ，L ，ｄＬｒｆ −１ｈ，ｄλ １，L，ｄλ ｎ −ｒ
在ｘ０处是线性无关的根据函数λ １，L ，λ ｎ −ｒ的构造可知
dλ i ( x ), g( x ) = Lg λ i ( x ) = 0
对所有ｘ０邻域上的x及所有１ ≤ ｉ ≤ ｎ − ｒ
因此本定理得到证明注意任何形为 λ'i ( x ) = λ i ( x ) + Ci 的函数其
中Ｃｉ为常数满足同样的条件因此这些函数在ｘ０处的值是能够任意选
取的
例:考虑系统
38
 − x1  ex p( x 2 )
•
   
X =  x1 x 2  +  1  u
 x 2   0 
y = h( x ) = x 3
首先看一下它的相对阶因
∂h ∂h
= [0 0 1] L g h( x ) =
⋅ g( x ) = 0
∂x ∂x
∂h
L f h( x ) = ⋅ f ( x) = x2
∂x
∂ Lf h ( )
= [0 1 0] L g L f h( x ) =
∂ Lf h ( )
⋅ g( x ) = 1 ≠ 0
∂x ∂x
所以相对阶r=2 为了变换成正则形则
z1 = φ 1 ( x ) = h( x ) = x 3
z 2 = φ 2 ( x ) = L f h( x ) = x 2
现在需要找第三个函数φ 3 ( x ) 考虑
exp( x 2 )
∂φ 3 ( x )
 ∂φ 3 ∂φ 3 ∂φ 3   
g( x ) =  , , ⋅ 1 
∂x  ∂x1 ∂x 2 ∂x 3 
 0 
∂φ ∂φ
= 3 ⋅ ex p( x 2 ) + 3 = 0
∂x 1 ∂x 2
一般来说这涉及到要解偏微分方程通常有一定的难度但在本例
中容易看出若取 φ 3 ( x ) = 1 + x1 − exp( x 2 )
则能够满足上述条件因为这时
∂φ 3 ( x )
=1
∂x1
∂φ 3 ( x )
p( x 2 )
= − ex
∂x 2
∂φ 3 ( x ) ∂φ 3
所以 p( x 2 ) +
⋅ ex =0
∂x 1 ∂φ 2
39
0 0 1
∂φ ( x )  
变换 Ζ = φ ( x ) 的雅可比矩阵 = 0 1 0 在所有的x
∂x
p( x 2 ) 0
1 − ex
处都是非奇异的因而其逆变换可得
x1 = −1 + z 3 + ex( 2)
pz
x2 = z2
x 3 = z1
且注意φ (0) = 0 在新坐标上系统方程为
•
z1 = z 2
•
z 2 = ( −1 + z 3 + ex
p( z 2 ))z 2 + u
•
z 3 = (1 − z 3 − ex
p( z 2 ))(1 + z2 expz
( 2 ))
由于该方程在任何处都成立因而是一个全局坐标变换该系统
方程也是全局有效的变换后方程是正则形的因为只有第2个方程中
含有u 第3个方程中是不含u的
5 关于局部坐标变换的讨论
i 正则形的另一种表示
前面已经提到正则形只有第r个方程中含有u 其余方程中均不
含u 我们将系统方程重新列写如下
•
ｚ１ = ｚ２
•
ｚ２ = ｚ３
M
•
z r −1 = zr
•
z r = b( z ) + a( z ) ⋅ u
•
z r +1 = q r +1 ( z )
M
•
z n = qn ( z)
ｙ = ｚ１
40
由此可见前面r-1个方程是线性的第r个方程含有u 后面n-r个方

程不含u 通常是 Z的非线性函数如果我们把状态变量Z分成两组
 z1 
z   z r +1  q r +1 
 η =  M  再以 q =  M 
 
2
ξ= 则方程变成
M
   z n   q n 
 zr 
 ξ2   0 
•  M   M 
ξ= + u
 ξr   0 
   
b(ξ ,η ) a (ξ ,η )
•
η = q (ξ ,η)
y = [1 0 L 0] ⋅ ξ
由此可见η这组状态变量在输出中没有直接反映出来在以后的讨
论中我们将常常采用这种形式
ii 非正则形的局部坐标变换
前面已经指出有时候构造n-r个函数φ r +1 ( x ),L , φ n ( x ) 使Ｌｇ φｉ = ０并
不是一件容易的事因为它涉及到要解n-r个偏微分方程组而要找n-r
个函数仅仅只要满足 φ ( x ) 的雅可比矩阵在ｘ０处是非奇异的要比较容
易些但此时 φ ( x ) 就有资格来作坐标变换不过后面的 n-r 个方程中
可能含有u 也就是说可取这样的坐标变换方程列写成
•
ｚ１ = ｚ２
•
ｚ２ = ｚ３
M
•
ｚｒ −１ = ｚｒ
M
这前r个方程与正则形是相同的但后n-r个方程只能一般化的写成
•
z r +1 = q r +1 ( z ) + pr +1 ( z ) ⋅ u
M
•
z n = q n ( z ) + pn ( z ) ⋅ u
其中可能含有u
例1 3 考虑系统
41
 x1 x 2 − x13   0 
   
 + 2 + 2 x3 u
• x1
X = 
 − x3   1 
 2   
 x1 + x 2   0 
y = h( x ) = x 4
对这个系统有
∂h
= [0 0 0 1] Lg h( x ) = 0 L f h( x ) = x12 + x 2
∂x
(
∂ Lf h )
= [2 x1 1 0 0] L g L f h( x ) = 2(1 + x 3 )
∂x
注意只要ｘ３ ≠ −１则 L g L f h( x ) ≠ 0 这说明只要ｘ３ ≠ −１就有相
对阶2
为了局部坐标能变换成正则形首先
z = (z1 , z2 , z3 , z4 )
再就是要找φ 3 ( x ) 和φ 4 ( x ) 使 L g φ 3 ( x ) = L g φ 4 ( x ) = 0 就要解偏微
分方程如果我们放弃这一点则可以选
 0 0 0 1
z3 = φ 3 ( x) = x3  0
∂φ 2 x1 1 0

则雅可比矩阵 = 对于任何
z 4 = φ 4 ( x ) = x1 ∂x  0 0 1 0
 
 1 0 0 0
的x都是非奇异的因而可以用φ ( x ) 进行坐标变换则有
ｘ１ = ｚ４
ｘ２ = ｚ２ − ｚ４２
ｘ３ = ｚ３
ｘ４ = ｚ１
注意也有φ (0) = 0 则此时新坐标下的系统方程为
•
ｚ１ = ｚ２
( ( ) )
•
z 2 = z 4 + 2 z4 z 4 z 2 − z 42 − z 43 + (2 + 2 z 3 )u
•
ｚ３ = − ｚ３ + ｕ
•
z 4 = −2 z 43 + z 2 z4
42
这些方程是全局有效的因为 z = φ x = 0 的雅可比矩阵对任意x
0 0
( )
都是非奇异的但是它不是正则形的因为表现在第3个方程中含有u
∂φ ∂φ
若要求 Lg φ 3 ( x) = 3 (2 + 2 x 3 ) + 3 = 0 采用试探法取
∂x 2 ∂x 3
φ 3 ( x ) = x 2 − 2 x 3 − x 32
能满足上述条件就可以找到新坐标下的正则
形表示但是此时坐标变换是局部有效的不能包括ｘ３ = −１的点
因为此时的φ ( x ) 其雅可比矩阵在ｘ３ = −１处是奇异的
3.2 状态反馈精确线性化
我们的主要目的之一是要分析和设计非线性系统的反馈控制规
律如果我们假定系统的状态x都是可以直接测量的但系统的输入取
决于这些状态及外加的参考输入如果系统的控制只取决于同一时刻
的状态及外加的参考输入则这样的控制叫作静态的或者无记忆的
状态反馈控制模式否则若控制还取决于一组附加的状态变量也就
是说控制本身是一个特定的动态系统的输出这个动态系统由状态x及
外加的参考输入所驱动并且有它自己的内部状态这样的控制叫做
动态的状态反馈控制模式
对于一个单输入单输出系统最常用的静态的状态反馈控制构造
是
u = α ( x ) + β ( x )v
其中v是外加的参考输入
若原系统是
•
x = f ( x ) + g ( x )u
y = h(x)
将两者组合起来就得到一个闭路控制它由下列类似的结构来描
述
•
x = f ( x ) + g ( x ) ⋅ α ( x ) + g ( x ) β ( x )v
y = h( x )
α ( x ), β ( x ) 是定义在Ｒｎ开集上的函数它们描述了控制u 显然 β ( x )
对于在该集上的所有x应当是非零的
43
•
v α ( x ) + β ( x )v u x = f ( x ) + g ( x )u
y = h( x ) y
现在的问题是如何设计反馈控制规律
1 .用反馈使非线性系统精确线性化
实际的意义是用反馈将原非线性系统改造成线性系统
考虑某非线性系统在某点ｘ = ｘ０处具有相对度r=n 即相对度恰
好等于系统状态空间的维数这时通过坐标变换可将其变换成正则形
其变换阵直接为
φ 1 ( x )   h( x ) 
   
 φ 2 ( x )  L f h( x ) 
φ ( x) = =
 M   M 
   n −1 
φ n ( x )  L f h( x )
新坐标 zi = φ i ( x ) = Lif−1h( x ) 1≤ i ≤ n
z = ( z1 , z2 ,L , zn )
•
z1 = z 2
•
z2 = z3
M
•
z n −1 = z n
•
z n = b( z ) + a( z )u
其中 ( )
在 z 0 = φ x 0 的邻域上函数a(z)
是非零的则可选下列状
态反馈
1
(− b(z ) + v )
u=
a (z )
它确实存在并且在ｚ０的邻域上能很好的被确定则最后一个式
•
子成为ｚｎ =ｖ
44
 z• = z
 •1 2
z =z
 2 3
系统方程变成  M
 •
z n −1 = z n
 z• = v
 n
它是一个线性能控形的状态方程所以可得下述结论
任何一个在某点ｘ０处具有相对阶n的非线性系统在点 z 0 = φ x 0 ( )
的一个邻域上都能够变化成一个线性的能控的系统在此要强调两点
1 坐标变换是局部地给定在ｘ０的周围的
2 状态反馈也是局部地给定在ｘ０的周围的
2. 讨论及推论
1 容易推知为了得到线性形式的状态方程两种变换是可以交换
次序的即可以先进行反馈然后再作坐标变换可以得到同样的结
果
这时的反馈应表示成x的函数即
u=
1
(− b(φ (x )) + v )
a (φ ( x ))
=
1
Lg L f h( x )
n −1 (
− Lnf h( x ) + v )
于是再作同样的坐标变换即可推出这一结论
2 如果ｘ０是原非线性系统的一个平衡点并且总可以通过输出的零
点变换使此时的ｙ０ = ０ ( )
即有 f x 0 = 0 和 h x 0 = 0 ( )
0
( )=0
因而 z = φ x 0
因为事实上有
( ) ( )
φ1 x0 = h x0 = 0
∂ ( L h)
i −2
φ (x ) = f (x ) = 0
f
0 0
对２≤ｉ ≤ ｎ
∂x
i
于是可以得到下列推论
若ｘ０是原系统的一个平衡点且在ｘ０处系统的相对阶是n 则存在
一个反馈控制律和一种坐标变换使原系统在原点0处变成一个线性能
控的系统
3 在如此得出的线性能控系统上就可以采用新的状态反馈来设计
系统了例如采用极点配置法或某种优化准则来设计系统换句话说
45
对于线性系统的所有设计方法现在都可以应用了例如取 V=Kz其中

K = (c0 , c1 ,L cn −1 ) 状态反馈阵K可以由极点配置或优化准则来确定
因而 V = c0 h( x ) + c1 L f h( x )+L+ cn −1 Lnf−1h( x )
n −1
− Lnf h( x ) + ∑ ci Lif h( x )
i =0
于是 u=
L g L h( x )
n −1
f
4 需要指出的是通过非线性反馈来使系统线性化的方法与以前的小
扰动线性化有着质的区别后者是在额定工作点附近的一种线性近似
而前者是一种改造而且得出的线性系统只要表达式是精确的则
得到的也就是一个精确的线性系统而且它与原系统已完全不同了
因而更好的说法是通过反馈改造非线性系统为一个线性能控的系统
是以非线性反馈来治非线性改造成为线性系统
3.举例
例2.1 考虑系统
 0  ex p( x 2 )
•
 
x =  x1 + x 22  + ex
p( x 2 )u
 x1 − x 2   0 
ｙ = ｘ３
对于这个系统有
L g h( x ) = 0 L f h( x ) = x1 − x 2
L g L f h( x ) = 0 L2f h( x ) = − x1 − x 22
L g L2f h( x ) = −(1 + 2 x 2 ) ex
p( x 2 )
(
L3f h( x ) = −2 x 2 x1 + x 22 )
所以系统的相对阶为3 即r=3=n 当１ + ２ｘ２ ≠ ０则在除１ + ２ｘ２ = ０
以外的任何点的邻域上通过状态反馈可将系统变换成线性能控的形
式以x=0处为例通过状态反馈此时
u=
−2 x 2 x1 + x 22 ( −
) 1
v
(1 + 2 x 2 ) exp( x 2 ) (1 + 2 x 2 ) exp( x 2 )
坐标变换是 z1 = h( x ) = x 3
z 2 = L f h( x ) = x1 − x 2
z 3 = L2f h( x ) = − x1 − x 22
46
0 1 0 0
•
在新坐标下系统为 z = 0 0 1 + 0v 这是线性能控的
0 0 0 1
4.状态空间精确线性化的充分必要条件
我们来考虑一个系统如下暂时不考虑它的输出
•
x = f ( x ) + g ( x )u
在一个给定的点ｘ０处如果能够找到一个反馈在ｘ０的邻域U上
u = α ( x ) + β ( x )v
且在ｘ０的U上又有一个坐标变换 z = φ ( x ) 或 x = φ −1 ( z )
•
则 x = f ( x ) + g ( x )u
= f ( x ) + g( x )α ( x ) + g( x )β ( x )v
再由坐标变换
• ∂φ ( x ) • ∂φ ( x )
z =
∂x
⋅x =
∂x
( f ( x) + g( x)α ( x) + g( x)β ( x)v)
∂φ ( x ) ∂φ ( x )
=
∂x
( f ( x ) + g( x )α ( x )) +
∂x
g( x )β ( x ) ⋅ v
 ∂φ ( x ) 
当 ( f ( x ) + g( x )α ( x )) = Az
 ∂x  x =φ −1 ( z )
 ∂φ ( x ) 
 g ( x ) ⋅ β ( x ) =B
 ∂x  x =φ −1 ( z )
•
又 rank B ( AB L A n −1 B = n 时 ) 系统ｚ = Ａｚ + Ｂｖ就是线性能控
的
这个问题就是单输入系统的所谓状态空间精确线性化问题在上
面的论述中可看到问题与输出没有直接的关系但是相对阶的概念与
输出直接有关
我们将状态空间精确线性化问题归结为下列定理
定理状态空间精确线性化问题是能解的充分必要条件是存在ｘ０的一
个邻域U 及一个定义在U上的实值函数 λ ( x ) 使得系统
•
x = f ( x ) + g ( x )u
y = λ( x)
在ｘ０处有相对阶n
47
证明
因为充分性已经从前述的反馈线性化问题中得到论证因此现在
只需要证明它的必要性
在证明必要性之前先来说明相对阶的一个有趣的性质即在坐标
变换下或进行状态反馈后相对阶是不变的
若 z = φ ( x ) 是一个坐标变换 x = φ −1 ( z )
•
原系统 x = f ( x ) + g ( x )u y = h( x )
• ∂φ ( x) • ∂φ ( x) ∂φ ( x)
新系统 z= ⋅x = ⋅ f (x ) + ⋅ g (x ) ⋅ u
∂x ∂x ∂x
− −
= f ( z ) + g ( z )u
−
y = h( z )
−  ∂φ ( x ) 
其中 f ( z ) =  ⋅ f ( x )
 ∂x  x = φ −1 ( z )
−  ∂φ ( x ) 
g( z ) =  ⋅ g ( x )
 ∂x  x =φ −1 ( z )
−
h( z ) = [h( x )] x =φ −1 ( z )
−
− ∂ h( z ) −
则 L − h( z ) = ⋅ f ( z)
f ∂z
 ∂h( x )  ∂φ −1 ( z )  ∂φ ( x ) 
=  ⋅ ⋅ ⋅ f ( x )
 ∂ x  x = φ −1 ( z ) ∂z  ∂x  x =φ −1 ( z )
 ∂h( x )  ∂φ −1 ( z )  ∂φ ( x ) 
=  ⋅   ⋅ [ f ( x )] x =φ −1 ( z )
 ∂ x  x = φ −1 ( z ) ∂z  ∂x  x =φ −1 ( z )
 ∂φ −1 (z ) ∂φ ( x )   ∂x ∂z 
因  ∂z ⋅ ∂x  = ⋅  =I
  x =φ −1 ( z )  ∂z ∂x  x =φ −1 ( z )
 ∂h( x ) 
故上式 = 
 ∂ x
⋅ f ( x )
 x =φ ( z )
− 1
= L f h( x ) [ ] x = φ −1 ( z )
[ ]
−
同样的运算可得出 L − Lk− h( z ) = L g Lkf h( x ) x = φ −1 ( z )
g f
因而原系统的相对阶与坐标变换后系统的相对阶是一样的
再来考虑反馈控制若反馈取为 u = α ( x ) + β ( x )v
48
•
则 x = f ( x ) + g( x )α ( x ) + g( x )β ( x )v
− −
= f (x ) + g (x ) ⋅ v
y = h( x )
此式中
−
f ( x ) = f ( x ) + g ( x )α ( x )
−
g ( x) = g ( x)β ( x)
L − h (x ) = L f + gα ⋅ h( x )
f
∂h( x )
=
∂x
( f ( x ) + g ( x ) ⋅ α ( x ))
∂h( x ) ∂h( x )
= f ( x) + g( x )α ( x )
∂x ∂x
= L f ⋅ h( x ) + L g h( x ) ⋅ α ( x )
= L f h( x ) + L g L0f h( x )α ( x )
若原系统相对阶为r 则 L g Lkf h( x ) = 0, k < r − 1
因此 Lkf + gα h( x ) = Lkf h( x ) 0 ≤ k ≤ r − 1
此式可以用递归的方法来证明只要说明当k=0时此式成立然后
证明k+1也成立
再来看 L− Lk− h( x ) = Lgβ Lkf + gα h( x ) = Lgβ Lkf h(x )
g f
∂Lkf h( x )
= ⋅ gβ = Lg Lkf h( x ) ⋅ β (0 ≤ k ≤ r − 1)
∂x
所以只要 β x 0 ( ) ≠ 0 因原系统 L g Lrf−1 h x 0 ≠ 0 ( )
则 L− L h( x ) = L
r −1
−
0
g L r −1
f h( x ) ⋅ β ( x ) ≠ 0
0 0
g f
所以在状态反馈下相对阶是不变的
证明了相对阶的这个特性之后定理的必要性证明就比较容易了
所谓必要条件就是说如果结论成立那么就可以推出条件也成立也就
是说如果一个系统通过坐标变换和状态反馈能够变成线性能控系统
那么一定有一个函数 λ ( x ) 使原系统的相对阶r=n 故必要性的证明如
下
如果系统能够变化成线性能控的系统那么由线性系统理论可知
通过坐标变换总可以变成下列标准型
49
0 1 0 L 0
0 0

0 1 L
 0
即此时 A =  M M M B =  M 
 
0 0 0 L 1 1
0 0 0 L 0
•
ｚ = Ａｚ + Ｂｕ
现在我们再来定义输出函数 y = [1L 0]z
由此我们可以来计算这个线性系统的相对阶由计算的结果就可
以得出其相对阶r=n
由于坐标变换和反馈下相对阶的不变性因而原系统相应的相对
阶一定也是 r=n 这就完成了定理的证明
5. 状态空间精确线性化问题的进一步研究
现在来考虑一个问题如果系统的相对阶 r ≠ n 时则按照上述
的充分必要条件该系统就不能进行状态空间精确线性化但是我们
已经指出相对阶的概念直接与输出函数有关如果我们能重新找出一
个函数在这新的输出函数下系统的相对阶满足r=n 这样的系统它
的状态空间精确线性化问题是可解的但是当回到原来的输出时输
出函数可能是非线性函数这样做的好处是系统的动态部分是精确线
性化的仅是输出函数静态或代数方程是非线性的即使这样
对系统的设计也是很有利的更何况有时系统没有明确给出输出时
输出函数作为观测值可人为的选取
这样问题变成能否找到一个函数 λ (x) 且令系统输出 y = λ (x) 使
得系统在 x 0 处的相对阶 r 恰恰等于 n 也就是说若系统
•
x = f ( x ) + g ( x )u
取 y = λ (x)
使 L g λ ( x ) = L g L f λ ( x) = L g Lnf− 2 ⋅ λ ( x ) = 0 对所有 x 0 附近的x 2.9
L g Lnf−1 ( x 0 ) ≠ 0 2 .10
这个问题显然是解 λ (x) 的一组偏微分方程的问题而且未知函数
λ (x) 被微分到 n-1 次且用一个约束条件 L g Lnf−1 ( x 0 ) ≠ 0 去掉了象
λ (x) = 0 这种平凡解这样一个高阶偏微分方程是不容易解的但我们
在前面曾经证明过一个定理这一组高阶偏微分方程事实上等价与一
组一阶偏微分方程这就使问题得到了一点简化根据上述定理问
题变成解
L g λ ( x ) = Lad f g λ ( x) = L = Lad n − 2 g λ ( x ) = 0 2.11
f
50
及
f
( )
Lad n −1g λ x 0 ≠ 0 2.12
那么这样一个问题的解是否存在回答这个问题可看作是
定理的一个简单的推论
Frobenius
定理2.5 当且仅当下列条件满足时
[
(i) 矩阵 g ( x 0 ) ad f g ( x 0 ) L ad nf −1 g ( x 0 ) ]
ad nf −1 g ( x 0 ) 的秩为n
(ii)分布 D = Span g , { }
ad f g , L , ad nf − 2 g 在 x 0 的邻域 U 中是对合的
则定义在 x 0 的领域 U 中满足偏微分方程 2.11 和非平凡条件
2.12 的实值函数 λ (x) 是存在的
[证明]
首先假设满足 2.11 和 2.12 的解函数 λ (x) 存在则从定理
1.2 特别是从 1.4 矩阵的非奇异性就可导出 n 个向量
g ( x 0 ), ad f g ( x 0 ), L , ad nf − 2 g ( x 0 ), ad nf −1 g ( x 0 ) 是线性无关的
这就证明了条件 i 是必要的若 i 成立那么定义在 x 0 邻域
上的分布D是非奇异的且是 n-1 维的方程 2.11 可重写成
dλ ( x) g ( x 0 ) [
ad f g ( x 0 ) L ad nf − 2 g ( x 0 ) = 0 ]
⊥
这就说明微分 dλ (x) 是 x 附近的 1 维协分布 D 的基所以由
0
定理分布D是对合的这就证明了条件 ii 的必要性

Frobenius
反之若假设 i 成立那么分布在 x 0 附近是非奇异的且若 ii
也成立则由Frobenius 定理我们可以得知存在一个实值函数 λ (x)
它定义在 x 0 的邻域 v 上且它使 dλ (x ) 张成 D ⊥ 也就是说解得微分
方程 2.11 更进一步 dλ (x) 也满足 2.12 因为否则 dλ (x) 就会被一
组n个线性无关的向量所零化这是矛盾的
综述以上的讨论我们可以归结出关于状态空间的线性化问题的
一个正式的论述即定理2.6
定理2.6 假设给定一个系统
•
x = f ( x ) + g ( x )u
在某 x 0 点附近状态空间线性化问题是可解的即存在一个输出函
数 λ ( x) 它使系统在 x 0 处有相对阶n 当且仅当下列条件满足
n−2
i 矩阵[g(x) 0
ad f g ( x ) L ad f g ( x 0 )
0
ad nf −1 g ( x 0 )] 的秩为
n
(ii) 分布 D = Span g , { }
ad f g , L, ad nf − 2 g 在 x 0 附近是对合的
51
因此只要解得 λ (x) 就可以按以前讨论的步骤完成状态空间线性

化的变换
例2.2 考虑系统
 x3 (1 + x 2 )  0 
•
x =  x1  + 1 + x u
  2
 x 2 (1 + x1 )   − x3 
首先我们必须计算 ad f g (x) 和 ad 2f g ( x)
0 0 0   x3 (1 + x 2 )  0 x3 1 + x2   0 
ad f g ( x) = 0 1 0   x1 −1
  0 0  1 + x 2 u
0 0 − 1  x 2 (1 + x1 )   x 2 1 + x1 0   − x3 
 0 
= x1 

− (1 + x1 )(1 + 2 x3 )
 (1 + x 2 )(1 + 2 x 2 )(1 + x1 ) − x3 x1 
ad 2f g ( x) =  x3 (1 + x 2 ) 

− x3 (1 + x 2 )(1 + 2 x 2 ) − 3x1 (1 + x1 )
当取x=0时则矩阵
0 0 1 
[g ( x) ad f g ( x) 2
ad g ( x)
f ]
x =0
= 1 0 0
0 − 1 0
它的秩是3 所以条件 i 满足
再校核条件 ii 因为[ g , ad f g ]( x) 有下列形式
0 
g, [ ]
ad f g ( x) = ∗
∗
因此矩阵 [ g ( x), ad f g ( x), [ g , ad f g ]( x)] 在x=0附近的秩是2 所以条
件 ii 于是 λ (x) 是可以从偏微分方程解得的
也满足
∂λ
∂x
g ( x) ad f g ( x) = 0[ ]
从观察可知 λ ( x) = x1
从前述讨论可知这时系统在x=0处的相对阶是3 等于n 我们再
来核对一下
52
L g λ ( x) = 0, L g L f λ ( x) = 0, L g L2f λ ( x) = (1 + x1 )(1 + x 2 )(1 + 2 x 2 ) − x3 x1

且 L g L2f λ ( x 0 ) = Lg L2f λ (0) = 1
因而系统通过状态反馈和坐标变换可以变成线性能控的系统
− L3f λ ( x) + v
u=
L g L2f λ ( x)
− x32 (1 + x 2 ) − x 2 x3 (1 + x 2 ) 2 − x1 (1 + x1 )(1 + 2 x 2 ) − x1 x 2 (1 + x1 ) + v
=
(1 + x1 )(1 + x 2 )(1 + 2 x 2 ) − x3 x1
且坐标变换后
z1 = λ ( x) = x1
z 2 = L f λ ( x) = x3 (1 + x 2 )
z 3 = L2f λ ( x) = x3 x1 + (1 + x1 )(1 + x 2 ) x 2
6.小结
(1)对于一个2维的非线性系统若在某点 x 0 处周围只要
rank[ g ( x 0 ) ad f g ( x 0 )] = 2
则总是可以通过状态反馈和坐标变换将其转化为一个线性能控
的系统因为事实上这就是条件 i 得到了满足因为是2维系统
所以分布 D = Span{g} 是1维的它总是对合的因而条件 ii 也满
足于是 λ (x) 总是可以解得的
(2)非线性系统的一阶线性近似在x=x 0 处的能控性是非线性系统状态
空间精确线性化的必要条件
假设向量场f x 有一个平衡点 x 0 =0 则f x 0 =0
则 f ( x) = Ax + f 2 ( x)
 ∂f   ∂f 
其中 A =   且  2  = 0
 ∂x  x =0  ∂x  x =0
也就是说前者是f x 的线性近似后者是高阶小量
再考虑 g ( x) = B + g1 ( x)
其中 B = g (0) [ g 1 ( x)] x =0 = 0
•
因而系统在x=0处的线性近似可表示成 x = Ax + Bu ,则有
ad f g ( x) = (−1) k A k B + Pk ( x) 式成立
k
其中当x=0时 Pk ( x) = 0
这可以证明如下用归纳法
首先当k=0时 ad kf g ( x) = ad 0f g ( x) = g ( x) = B + Pk ( x)
53
因此上述关系式是成立的
然后假设当k时该式成立导得 k+1 时也成立便可得到证
明
因
k +1
∂ (ad kf g ( x)) ∂f
ad g ( x) = f ( x) −
• ad kf g ( x)
∂x ∂x
f
∂P ( x) ∂f
= k ( Ax + f 2 ( x)) − ( A + 2 )((−1) k A k B + Pk ( x))
∂x ∂x
k +1 k +1
= (−1) A B + Pk +1 ( x)
其中 Pk +1 ( x) 由其组成可知在x=0时为0
所以条件 i 等效于条件
rank ( B AB L A n −1 B) = n
也就是说条件 i 相当于线性近似系统在x=0处是能控的
3 若非线性系统
•
x = f ( x ) + g ( x )u
y = h(x)
它的相对阶若小于n 但它却又满足定理2.6的条件 i ii ,
则就可以取另一个不同的函数 λ (x) 作为输出这时系统的相对阶等于
n 就有可能通过状态反馈和坐标变换 ( z = φ (x)) 使系统转化成线性能
控的形式
然而实际的输出是 h(x) 这样在新的坐标下系统的状态方程是线
性能控的而输出方程 y = h( x) = h(φ −1 ( z )) 通常依旧是非线性的
54
第四章反馈线性化原理的应用
在这一章中将介绍在局部坐标变换和反馈线性化原理基础上的一
些推论及其在控制系统设计中的应用它们是零动态局部渐近镇定
渐近输出跟踪干扰解耦高增益反馈具有线性误差动态特性的观
测器问题等
4.1 零动态
在这一节中我们将介绍并讨论一个重要的概念零动态在很
多场合中它起着与线性系统中传递函数的零点极其类似的作用
在前述中我们已经看到线性系统的相对阶r能够被解释为其传递函数的
极点数目与零点数目之差即若任何一个线性系统其相对阶r严格小于
其维数n 则其传递函数中必存在零点反之若r=n 则传递函数中就没
有零点所以前节中精确线性化所讨论的系统在某种意义上类似于
线性系统中无零点的情况在这一节中这种类比将进一步推广
考虑一个相对阶 r 严格小于 n 的非线性系统
⋅
x = f ( x ) + g ( x )u
y = h( x )
则可通过坐标变换变成正则形
 h( x ) 
 
 L f h( x ) 
 M  ξ   z1   z r +1 
 
Z = φ ( x ) =  Lrf−1h( x ) = L
 
ξ =  M  η =  M 
 φ r +1 ( x )   η   zr   z n 
 
 M 
 φ ( x) 
 n 
φ r +1 ( x )
 
其中  M  若能使 L g φ i ( x ) = 0 , r + 1 ≤ i ≤ n
 φ n ( x ) 
则可将系统变成下列形式
⋅
ｚ１ = ｚ２
⋅
ｚ２ = ｚ３
M
⋅
⋅
z r = b( z ) + a( z )u
55
⋅
zr +1 = q r +1 ( z )
M
⋅
zn = q n ( z)
或写成
⋅
 ξ2   0 
⋅
 M   M 
ξ= +  u
 ξr   0 
   
b(ξ , η) a(ξ , η)
⋅
η = q(ξ , η)
( ) ( )
若ｘ０是使 f x 0 = 0, h x 0 = 0 的点则在ｘ０一定有 ξ = ０虽然此时
η 可以任意选择但是不失一般性可以选 η = ０如果ｘ０是系统的一个
平衡点则在新坐标下也应是一个平衡点
因而有
b(ξ , η) = 0 当 (ξ , η) = (0,0) 时
q(ξ , η) = 0 当 (ξ , η) = (0,0) 时
这也就是说在ｘ０ = ０系统处于平衡状态下若此时及以后又没有
输入作用即 u = 0 则该系统就一直处于平衡状态
1.输出零化问题和零动态
现在提出一个这样的问题
能否找到这样成对的关系即某个初始状态ｘ０及对应的 u 0 (t ) u 0 (t )
定义在ｔ = ０的一个邻域上使得系统在ｔ = ０的邻域上输出 y( t ) 恒等于0
这个问题被叫作输出零化问题当然我们感兴趣的是所有这样的对子
( )
x 0 ,u0 而不是前面提到过的ｘ０ = ０，ｕ０ = ０简单的平凡对
对于正则形有 y(t ) = z1 (t )
由于限制在所有t时刻 y(t ) = 0 这就必须有
⋅ ⋅ ⋅
z1 (t ) = z 2 (t ) =L = z r (t ) = 0
也就是说在所有时刻 ξ (t ) = 0
所以我们可知当系统的输出恒等于零时其状态也以这样一种方
式受到限制这时 ξ (t ) 也恒等于零并且 u(t ) 必须是下列方程的唯一解
0 = b(0, η(t )) + a(0, η( t )) ⋅ u(t )
其中 a(0, η(t )) ≠ 0 当 η( t ) 趋近于零时
56
η( t ) 应服从下列微分方程因为到目前为止我们只知道 ξ (t ) = 0

⋅
η(t ) = q(0, η(t )) 3.1
由于 η( t ) 与输出不直接有关所以要使 y( t ) 保持为零只要
ξ (0 ) = 0, 而η (0 ) = η 0 可以任意来选择但是对于不同的 η
０
要解得 η( t )
再取
b(0, η(t ))
u(t ) =
a(0, η(t ))
才能使 y( t ) 保持为零
当初始条件选择为 ξ (0) = 0 及 η(0) = η 0 时上述的解 u(t ) 是唯一
的方程 3.1 描写了系统内部的这样一种动态特性即在限制输出
恒为零的条件下对于所选择的初始条件并由此而解出的控制作用
u(t ) 下系统内部的动态特性这个动态在我们今后的讨论中颇为重要
被叫作系统的零动态
2.关于零动态的几个评注
1 对于线性系统而言零动态是这样一个特殊的线性系统的动态这
个系统的极点或特征值是原系统的零点即以原系统传递函数的分子多
项式为其特征多项式的线性系统的动态
现在我们来说明这一点假定线性系统的传递函数为
b0 + b1 s+L+ s n − r
H ( s) = K
a 0 + a1 s+L+ s n
可知其相对阶为r 若该系统传递函数的分子与分母是互质的则容
易得出其一种最小实现为
⋅
ｘ = Ａｘ + Ｂｕ
ｙ = Ｃｘ
其中
 0 1 0 L 0  0
 0 0 1 L 0  M
   
A= M O M  B = M
   
 M 1  0
− a1 − a 2 L L − a n −1   k 
Ｃ = ｂ０ｂ１ L ｂｎ −ｒ −１１０ L ０
化为正则形后
ｚ１ = Ｃｘ = ｂ０ｘ１ + ｂ１ｘ２ +L +ｂｎ −ｒ −１ｘｎ −ｒ + ｘｎ −ｒ +１
57
ｚ２ = ＣＡｘ = ｂ０ｘ２ + ｂ１ｘ３ +L +ｂｎ −ｒ −１ｘｎ −ｒ +１ + ｘｎ −ｒ +２

M
ｒ −１
ｚｒ = ＣＡｘ = ｂ０ｘｒ + ｂ１ｘｒ +１ +L +ｂｎ −ｒ −１ｘｎ −１ + ｘｎ
再取
ｚｒ +１ = ｘ１
ｚｒ +２ = ｘ２
M
ｚｎ = ｘｎ −ｒ
∂φ
它使Ｌｇ φｉ = ０且是非奇异的
∂ｘ
因为
 1 0 
 * O  
 [L]  
∂φ  
 * * 1  
=
∂ x  1 0 0 0 
 M O   M O 
   
 
 0 L 1 
 
 0 L 0  
容易验证它是非奇异的因而用该坐标变换可以化成正则形其形
式为
⋅
z1 = z2 
 0 1 L 0 
⋅
 M  ξ   0 
z2 = z3 
O  
 ⋅
0   M 
M  → ξ = M 1  L + u
⋅    η   0 
zr −1 = z r  0 L L 0     K 
⋅  
z r = Rξ + Sη + Ku 
R S
⋅
η = Pξ + Qη
⋅
根据零动态的意义 ξ = ０所以有 η = Qη
1
此时应取 u(t ) = Sη(t )
K
因
58
 dzr +1 dx1
 = = x2 = z r + 2
dt dt
 dzr + 2 dx2
 = = x3 = z r + 3
⋅
 dt dt
η→ M
 dz dx
 n = n − r = xn − r +1 = − b0 x1 − b1 x2 − L − bn − r −1 xn − r + z1
 dt dt
 = − b0 zr +1 − b1 zr + 2 − L − bn − r −1 zn + z1
由于 ξ = 0 故z1 = 0
故
 0 1 L L 0 
 0 0 1 L 0 
 
Q= M M M 
 
 0 0 L L 1 
−b0 −b1 L L −bn − r −1 
由此零动态的特征多项式为
(SI − Q ) = b0 + b1S + L + bn − r −1S n − r −1 + S n − r
det
此即为原系统传递函数的分子因而零动态的极点就是原系统的零
点
( 2 ) 非线性系统的零动态在 =0处的线性近似与整个非线性系统在
x=0处的线性近似系统的零动态是一致的也就是说取零动态与取线性
近似的操作运算本质上是可以交换的
为了校验这一点我们必须做的仅仅是要说明正则非线性方程的
线性近似与原系统线性近似的正则形是一致的并且非线性系统的相
对阶与其线性近似系统的相对阶也是一致的
前面业已介绍
ｆ（ｘ）= Ａｘ + ｆ２（ｘ）
ｇ（ｘ）= Ｂ + ｇ１（ｘ）
同理
ｈ（ｘ）= Ｃｘ + ｈ２（ｘ）
由递推关系容易计算
'
L f h ( x ) = CA x + d k ( x )
k k
 ∂d 
其中函数ｄｋ（ｘ）使得  k  = 0
 ∂x  x =0
由此可以推出
59
CA B = Lg L f h ( 0) = 0
k k
r −1 r −1
对所有k<r-1
CA B = Lg L f h ( 0) ≠ 0
也就是说原系统在 x=0处的线性近似系统它的相对阶就等于r
则非线性系统的正则形的相应项可以写成下列展开式
b (ξ ,η ) = Rξ + Sη + b2 (ξ ,η )
a ( ξ , η ) = K + a1 ( ξ , η )
q (ξ ,η ) = Pξ + Qη + q2 (ξ ,η )
则其零动态的线性近似式为
 ∂q 
  = Q +  ∂q2  =Q
 ∂η  ( ξ ,η ) =0  ∂η  (ξ ,η ) =0
．
所有 η = Ｑ η 描写了当 ξ 0 时原系统在 =0 处的零动态的线性
近似它与整个系统在 x=0处的线性近似的零动态是一致的
例3.2 我们来分析下列系统的零动态
 x3 − x23   0 
.    
x =  − x2  +  −1 u y = x1
 2   
 x1 − x3   1 
则有
Lg h( x ) = 0
L f h( x ) = x 3 − x 2
3
Lg L f h( x ) = 1 + 3x 2
2
因此其相对阶 r=2 为了化为正则形取

z1 = x1 z2 = x 3 − x 2
3
z3 = x2 + x3
0
 
( Lg φ 3 = [ 0 1 1] −1 = 0)
 
1
于是在新坐标下系统的方程为
60
．．
ｚ１ = ｚ２ｚ２ = ｂ（ｚ１，ｚ２，ｚ３）+ ａ（ｚ１，ｚ２，ｚ３）ｕ
．
ｚ３ = ｚ１ − ｚ３
２
从零动态的意义可知 y(t)=0意味着ｚ１（ｔ）= ｚ２（ｔ）= ０所以系统的

零动态为
．
ｚ３ = − ｚ３
(3)非正则形时的零动态
虽然上述零动态的分析是在正则形的条件下进行的但是由于坐标
变换中的状态变量要满足Ｌｇ φｉ（ｘ）= ０常常有难处于是得到的是非
正则形系统的描述成为
．
ｚ１ = ｚ２
．
ｚ２ = ｚ３
．
．
．
．
．
ｚｒ = ｂ（ ξ ，η ）+ α（ ξ ，η ）ｕ
．
η = ｑ（ ξ ，η ）+ ｐ（ ξ ，η ）ｕ
我们可以看出方程的前面几个变量与正则形是相同所以从零动
．．．
态的概念出发应有y(t) 0 所以ｚ１ = ｚ１ = ｚ２ = ⋅ ⋅ ⋅ = ｚｒ =０
ｂ（ ξ ，η ）
由此可得ｕ = −
ａ（ ξ ，η ）
．
ｂ（ ξ ，η ）
所以 η = ｑ（ ξ ，η ）+ ｐ（ ξ ，η ）（ − ）
ａ（ ξ ，η ）
则零动态为
．ｂ（０，η）
η = ｑ（０，η）− ｐ（０，η）
ａ（０，η）
(4)几何观点
61
０
若系统在某点ｘ处的相对阶为r 则有
ｙ（ｔ）= Ｌｆｈ（ｘ（ｔ））
（ｋ）ｋ
0 k r-1
ｒ −１
ｙ（ｔ）= Ｌｈ（ｘ（ｔ））+ ＬＬｈ（ｘ（ｔ））（
（ｒ）ｒ
对于输出零化问题则有ｙ（ｔ）= ０ 0
０
ｆ
　 k
（ｋ）
ｕｔ）
ｇｆ
r-1 故系统一定
在下面的子集上运动( 局部地围绕ｘ )
∗ ｒ −１
ｚ =｛ｘ ∈ Ｒ：ｈ（ｘ）= Ｌｆｈ（ｘ）=L = Ｌｆｈ（ｘ）= ０）
ｎ
也就是说在新坐标下恰恰正是ｚ１，ｚ２，L，ｚｒ均为零的点集上运动

且附加的限制条件
ｒ −１
ｙ = Ｌｆｈ（ｘ（ｔ））+ ＬｇＬｆｈ（ｘ（ｔ））（ｕｔ）= ０
（ｒ）ｒ
图4.6表示了在新坐标下零动态的几何表示
图 4.6
ｉ０
因为微分ｄＬｈ（ｘ） 0 ｆ i r-1 在ｘ处是线性无关的所以
∗ ０
ｚ处在ｘ附近的一个 n-r 维的光滑流形其状态反馈为
− Ｌｆｈ（ｘ）
ｒ
∗
ｕ（ｔ）= ｒ −１
ＬｇＬｆｈ（ｘ）
因为
 L h( x ) 
 dh( x )   L f h( x ) + Lg h( x )u ∗ ( x )   2f 
 dL h( x )   2 ∗   L f h( x ) 
 f ( f ( x ) + g ( x )u ∗ (t )) =  L f h( x ) + Lg L f h( x )u (t )  =  M =0
 M   M   r −1 
 r −1   r r −1 ∗   L f h( x ) 
dL f h( x )   L f h( x ) + Lg L f h( x )u (t )  
 0 
∗ ∗ ∗
所以向量场ｆ（ｘ）= ｆ（ｘ）+ ｇ（ｘ）ｕ（ｘ）是与Ｚ子集相切的
．
∗ ∗
也就可以由此推得闭环系统ｘ = ｆ（ｘ）的任何运动轨迹从Ｚ上的某
62
∗ ∗ ∗
点开始一直在Ｚ中运动(对于小的时间t 内) 约束条件ｆ（ｘ）是Ｚ的
一个确定的向量场它精确的描写了系统的零动态,而与所取的坐标无
关
(5) 零动态在精确线性化下的不变性
若系统的相对阶为 r, 又 r<n 则可以通过状态反馈构成闭环并使
ｂ（ｚ）
之局部精确线性化如前所述取ｕ = − +ｖ于是系统成为
ａ（ｚ）
．
ξ = Ａξ + Ｂｖ
．
η = ｑ（ ξ ，η ） ,
ｙ =Ｃξ
０１ ⋅ ⋅ ０ ０
   
００１ ⋅ ０ ⋅
   
其中Ａ =  ⋅ ⋅ ⋅ , Ｂ = ⋅ ,
   
００ ⋅ ⋅ １ ０
０ ⋅ ０  １
 ００  
C = [1 0 ⋅ ⋅ ⋅]
当线性子系统初始时是静止的, 即 y(0)=0, 而且在此后又没有输

入作用指V=0 , 因而可保持 y(t)=0 也就是说 ξ（ｔ）= ０这时整个
．
系统即闭环系统的内部动态就是 η = ｑ（０，η ）,也即是开环系统( 原系
统 )的零动态
( 6 )参考输出的再产生问题
输出零化问题实质上是强迫输出去精确的跟踪零我们很容易推
广到这样的情况,即是否可强迫输出去跟踪一个任意的函数ｙＲ（ｔ）这
一个问题被称为参考输出的再产生问题说得具体一点就是若有可能,
００００
寻找成对的ｘ，ｕ（ｔ）．ｘ是初始状态ｕ（ｔ）是定义在t=0的邻域上
63
的输出函数, 使系统的输出 y(t)在 t=0的所有邻域 t上与给的ｙＲ（ｔ）精

确地相一致
则与前面的分析相类似 , 因为要求 y (t ) ≡ y R (t ) , 这就意味着 :
ｙ（ｔ）= ｙＲ（ｔ） , 对所有的
（ｉ）（ｉ）
t 和所有的 i 因而至少
（ｉ −１）
ｚｉ（ｔ）= ｙＲ（ｔ） ,对所有的 t和１ ≤ ｉ ≤ ｒ
令 ξ R (t ) = Col ( y R (t ), y R(1) (t ),L, y R( r −1) (t )) ,因而输入 u(t)必须满足
ｙＲ（ｔ）= ｂ（ ξ Ｒ，η ）+ ａ（ ξ Ｒ，η ）ｕ（ｔ）,
（ｒ）
其中 η（ｔ）是下列微分方程的解
．
η = ｑ（ ξ Ｒ（ｔ），η（ｔ）） (3.3)
为使 y (t ) ≡ y R (t ) , 首先应保证在初始时刻 , ξ（０）= ξ Ｒ（０） , 而
η（０）= η 是可以任选的于是按照所选的 η ,则
００
ｙＲ（ｔ）− ｂ（ ξ Ｒ（ｔ），η（ｔ））
（ｒ）
ｕ（ｔ）= (3.4)
ａ（ ξ Ｒ（ｔ），η（ｔ））
所以为了使系统的输出能精确地跟踪给定的ｙＲ（ｔ）,首先在初始
ξ（０）= ξ Ｒ（０）,然后由给定的 ξ Ｒ（ｔ）和 η ,解
０
时刻, 必须对准 ,即
方程(3.3)得出 η（ｔ）,再由(3.4)式解出 u(t) 这个输入 u(t)是能保持
ｙ（ｔ）= ｙＲ（ｔ）的唯一解从上述过程可以看出,(3.3)和(3.4)式好像构造
了一个以 ξ Ｒ（ｔ）为输入, η（ｔ）为状态, u(t)为输出的系统 ,它被解
释为原系统的逆实现
4.2 局部渐近稳定化(镇定)
1.问题的提出:
考虑系统
．
ｘ = ｆ（ｘ）+ ｇ（ｘ）ｕ ,
平衡点ｘ ,不失一般性可取ｘ = ０ (移动坐标原点)
００
能否找到
．
一个控制ｕ = α（ｘ） (状态反馈),使系统ｘ = ｆ（ｘ）+ ｇ（ｘ）⋅ α（ｘ）在
处是渐近稳定的,称为局部渐近稳定问题
后面的讨论将说明零动态的概念对处理这个问题是很有用的
2. 线性系统能否稳定化的回顾:
对于一个线性系统, 通过合适的分解总可以分解成能控和不能控
64
两个子系统对于能控的子系统总可以通过状态反馈, 使其特征值处在

复平面上任意给定的位置,对于不能控的子系统则状态反馈就不能使特
其特征值配置在任意位置
所以一个线性系统能稳定化的充要条件是: 当不能控子系统的特
征值均在复平面的左半平面,则整个系统是能稳的否则系统是不能稳
的
3.命题4.1 假若非线性系统的一阶线性近似系统是渐近能稳的则原
非线性系统也是渐近能稳的反之亦然
.
x = f ( x) + g ( x)u
 ∂f 
A=  B = g (0)
因为非线性系统 f ( x) = Ax + f 2 ( x) ,其中  ∂x  x = 0
g ( x) = B + g1 ( x)
若取 u=Fx,
．
则ｘ = ｆ（ｘ）+ ｇ（ｘ）⋅ Ｆｘ =（Ａ + ＢＦ）ｘ + ｆ２（ｘ）+ ｇ１（ｘ）Ｆｘ
所以当线性近似系统是能稳的则 A BF 的特征值均具有负实
部而在ｘ = ０邻域上后两项是 x的2阶小量此时该非线性闭环系
０
０　
统在ｘ处也是局部渐近稳定的反之若线性近似系统是不能稳的则
不管ｕ = α（ｘ）取什么规律其线性近似系统是总有右半平面的特征
值因而原非线性系统也是不可稳的
由一阶线性近似系统的渐近稳定来判别原非线性系统是否渐近稳
定称为一阶线性近似稳定性判别原则它早由李亚普诺夫和庞加
莱所证明
注意以上命题没有说明当线性近似系统的不能控子系统中仅仅
包括有虚轴上的特征值时非线性系统是否能稳的情况这种情况称
为局部能稳的临界问题
65
4.命题4.2( 临界问题 ) 若系统的零动态在 η = ０处是渐近稳定的那

么通过状态反馈可以使原系统在（ ξ ，η ）=（０，０）处渐近稳定
证明
(1):若系统的相对阶为 r,则可将系统化成正则形
 ξ2   0 
.  M   M  .
ξ= + u , η = q(ξ ,η )
 ξr   0 
   
b(ξ ,η ) a(ξ ,η )
ｂ（ ξ ，η ）= Ｌｆｈ（ｘ），ａ（ ξ ，η ）= ＬｇＬｆｈ（ｘ）≠ ０
ｒｒ −１
其中
(2):取
１
ｕ= （ − Ｌｆｈ（ｘ）− Ｃ０ξ １ − Ｃ１ξ ２ − L − Ｃｒ −１ξ ｒ）
ｒ
ｒ −１
１ｒ −１
= （ − Ｌｆｈ（ｘ）− Ｃ０ｈ（ｘ）− Ｃ１Ｌｆｈ（ｘ）− L − Ｃｒ −１Ｌｆｈ（ｘ））
ｒ
ｒ −１
可将该子系统化成线性能控的则只要Ｃ０， L ，Ｃｒ −１取得适当
总能使 ξ 表示的线性子系统的特征值处在左半复平面内使该子系统
是渐近稳定的
．
(3):而另一方面零动态所表示的子系统 η = ｑ（ ξ ，η ）在（ ξ ，η ）=（０，０）
处是渐近稳定的
因而综上所述整个系统是渐近稳定的也即原非线性系统在
（ ξ ，η ）=（０，０）处是能渐近稳定化的
又若在上述情况中取
１
ｕ= （ − ｂ（ ξ ，η ）− Ｃ０ξ １ − Ｃ１ξ ２ − L − Ｃｒ −１ξ ｒ + ｖ）
ａ（ ξ ，η ）
．．
则系统为 ξ = Ａ ξ + Ｂｖ，η = ｑ（ ξ ，η ）由于有参考输入 v的作
用则当系统是渐近稳定的 v 又是有限的则运动的轨迹也是有界
的
66
5.临界问题举例
考虑系统
ｘ１ｘ２ − ｘ１３   ０ 
   
．  ｘ１  ２ + ２ｘ３ 
ｘ= + ｕｙ = ｈ（ｘ）= ｘ４
 − ｘ３   １ 
 ２   
 ｘ１ + ｘ２   ０ 
 ∗ 
 
∂ｈ  ∗ 
⋅ ｆ = [０１]  = ｘ１ + ｘ２
２
Ｌｆｈ（ｘ）= ００Ｌｇｈ（ｘ）= ０
∂ｘ  ∗ 
 ２ 
ｘ１ + ｘ２ 
 ０ 
 
２ + ２ｘ３ 
ＬｇＬｆｈ（ｘ）= [２ｘ１１００]   = ２ + ２ｘ３ ≠ ０
 １ 
 
 ０ 
( 若ｘ３ ≠ −１ )
∴当ｘ３ ≠ −１时其相对阶为 2
坐标变换
ｚ１ = Φ １（ｘ）= ｘ４
ｚ２ = Φ ２（ｘ）= ｘ１ + ｘ２
２
ｚ３ = Φ３（ｘ）= ｘ３ 
 取
ｚ４ = Φ ４（ｘ）= ｘ１ 
检查:(1)雅可比阵
67
 ００１ ０
 
∂Φ ２ｘ１１００
：  
∂ｘ  ００１０
 
 １０００
其行列式 ∂Φ 非奇异
det( ) = −1 ≠ 0
∂x
(2)
 0
 
∗ 
Lg Φ 3 = [ 0 0 1 0]  = 1 ≠ 0
1
 0
 
 0
 
∗ 
Lg Φ 4 = [1 0 0 0]  = 0
∗ 
 0
 
故不满足正则形但可进行变换
反变换
ｘ１ = ｚ４
ｘ２ = ｚ２ − ｚ４
２
ｘ３ = ｚ３
ｘ４ = ｚ１
故
．
ｚ１ = ｚ２
．．．
．ｚ２ = ２ｘ１ｘ１ + ｘ２ = ２ｚ４（ｚ２ｚ４ − ２ｚ４）+ ｚ４ +（２ + ２ｚ３）ｕ
２
因取
68
ｚ１  ｚ３ 
ξ =  ， η =  
ｚ２  ｚ４ 
当考虑平衡点 ξ（０）= ０时即有
ｚ４ − ４ｚ４
３
ｕ=
２ + ２ｚ３
原系统:
ｘ２ − ３ｘ１０ ｘ１ ００００
０
   
 ∂ｆ   １０００ １０００
Ａ=  =  = 
 ∂ｘ  ｘ =０
 ００ − １０  ００ −１０ 
 
１００ ｘ =０ ０１００
 ２ｘ１

０ 
 
２
Ｂ = ｇ（０）=  
１
 
０ 
原系统中含有不能控的运动模态且其特征值 λ = ０ ,即临界状态其
零动态
ｚ４ − ４ｚ４
４
．
ｚ３ = −ｚ３ − ｕ = −ｚ３ −
２ + ２ｚ３
．
ｚ４ = − ２ｚ４
３
可由李亚普诺夫定理证明零动态是渐近稳定的但是其一阶近似
是临界的这就适合于命题4.2的情况因而系统是可以渐近稳定的,只
要取
１
ｕ= （ − Ｌｆｈ（ｘ）− Ｃ０ｈ（ｘ）− Ｃ１Ｌｆｈ（ｘ））
２
4.3 渐近输出跟踪
1. 何谓渐近输出跟踪:
69
前面业已提出欲使系统的输出能精确地复现给定的参考输出
ｙＲ（ｔ）必须满足这样两个条件:
(1):初始时刻要对准,
即 ξ (0) = ξ R (0) = Col ( y R (0) y R( 0 ) (0) L y R( r −1) (0))
(2):
y R ( t ) − b(ξ R ( t ), η ( t ))
( r)
u( t ) =
a(ξ R ( t ), η ( t ))
．
其中 η（ｔ）是 η（ｔ）= ｑ（ ξ Ｒ（ｔ），η（ｔ））在初始条件 η（０）= η 下的
０
这实际上是种开环处理的方法很难达到目的
(1)初始时刻很难对准
(2)何况可能存在干扰使y(t)偏离期望的值
所以比较现实的是不论初始状态是否有偏差也不论是否受到扰
动要研究实际的输出能否渐近收敛到所给定的参考函数ｙＲ（ｔ）这个
课题就叫做渐近输出跟踪
2.如何实现渐进输出跟踪
自动控制原理中的一个最重要的概念反馈
我们来研究一下如何利用反馈来实现
从正则形出发
70
.
z1 = z2
.
z2 = z 3
.
M
z r −1 = z r
.
z r = b(ξ , η ) + a(ξ , η ) ⋅ u
.
η = q (ξ , η )
y = z1
我们来定义一个新的变量误差 e( t ) = y ( t ) − y R ( t )
因 y = z 1 ,∴用
e1 ( t ) = z 1 ( t ) − y R ( t )
.
e = e2 ( t ) = z 2 ( t ) − y R ( t )
( 1)
..
e = e3 ( t ) = z 3 ( t ) − y R ( t )
(2)
M
( r−1) ( r−1)
e = er ( t ) = z r ( t ) − y R (t )
. .
= er ( t ) = z r ( t ) − y R ( t )
(r) (r)
e
选择控制u的目的
(1)一方面使系统精确线性化
(2)构成负反馈驱动系统向着消除误差的方向运动
64ｅ7 （ｔ）
48 ｉ
１ｒ
（ − ｂ（ ξ ，η ）+ ｙＲ（ｔ）− ∑Ｃｉ −１（ｚｉ − ｙＲ））
（ｉ −１）
故选择ｕ（ｔ）=
（ｒ）
ａ（ ξ ，η ）ｉ =１
．
我们将该控制规律代入ｚｒ式得
．
ｚｒ = ｙＲ（ｔ）− Ｃ０ｅ１ − Ｃ１ｅ２ − L − Ｃｒ −１ｅｒ
（ｒ）
（ｒ −１）
= −Ｃ０ｅ − Ｃ１ｅ − L − Ｃｒ −１ｅ
（ｒ）（１）
ｅ
即
（ｒ −１）
+ Ｃｒ −１ｅ + L + Ｃ１ｅ + Ｃ０ｅ = ０
（ｒ）（１）
ｅ
71
这是误差e的r阶线性常微分方程只要系数Ｃ０， L ，Ｃｒ −１取得好

让其特征方程的根均在左复平面内不论初始误差多大最后均能使 e
及其各阶导数收敛到零而且收敛的快慢在理论上也可以由系数
Ｃ０， L ，Ｃｒ −１的配置来决定
由于
（ｉ −１）（ｉ −１）
ｚｉ = ｙＲ +ｅ
故
ξ R (t ) = Col ( y R (t ), y R(1) (t ), L , yR( r −1) (t ))
χ (t ) = Col ( e(t ), e(1) (t ), L , e( r −1) (t ))

因此 η（ｔ）应满足下列微分方程
．
η = ｑ（ ξ Ｒ（ｔ）+ χ（ｔ），η（ｔ））
由于 ξ Ｒ（ｔ）是时间的确定函数因而由上述 u 所驱动的系统本质
上是时变非线性系统
3.推广渐近模型匹配
(1)何谓渐进模型匹配
若期望的输出ｙＲ（ｔ）不以某时间确定函数的形式给出而以某参考
模型的输出的形式给出特别是参考模型是一个简单的线性系统例
如
．
ζ = Ａζ + Ｂｗ
ｙＲ =Ｃ ζ
则提出问题找一个反馈控制规律不论系统和模型的初始状态
如何使系统的输出y(t)渐近地收敛到在w(t)作用下参考模型产生的相
应输出ｙＲ（ｔ）
(2)如何实现
我们可以考虑采用前述相似的控制u 因为
72
y R ( t ) = Cζ
. .
y R (t ) = C ζ = CAζ + CBw
.. . . .
y R (t ) = CAζ + CB w = CA2ζ + CABw + CB w
y R( i ) (t ) = CAiζ + CAi −1Bw + L + CBw( i −1)
r
1
u(t ) = ( −b(ξ ,η ) + y R( r ) (t ) − ∑ Ci −1 ( zi − y R( i −1) ))
a(ξ ,η ) i =1
因此可以看出在控制 u(t)中包含 ξ ,η ,ζ 还有 w(t)的各阶导数如果

用一个专门的装置来得到 u(t) 那么对 w(t)的微分将不可避免的提升
附加噪声的影响这在实际中是很难处理的
然而若模型的相对阶等于或大于系统的相对阶 r,则由于:
r −2
CB = CAB = L = CA B = 0
y R ( t ) = CA ζ 0≤i ≤ r −1
(i ) i
y R ( t ) = CA ζ + CA Bw
(r) r r −1
则 u(t)得到简化,不包含 w(t)的导数此时
r
1
u(t ) = ( − b(ξ ,η ) + CArς + CAr −1Bw − ∑ Ci −1 ( zi − CAi −1ς ))
a(ξ ,η ) r −1
r
1
= ( − Lrf h( x ) + CArς + CAr −1Bw − ∑ Ci −1 ( Lif−1h( x ) − CAi −1ς ))
Lg Lrf−1h( x ) i =1
⇒ α (ς , x ) + β (ς , x )w
当 C 0 , L , C r −1 选得恰当时误差及其各阶导数将收敛到零即意味

•
着输出 y (t ) 渐进的接近模型的输出 y R (t ) 因 ς (⋅) 是线性系统故
t
y R (t ) = Ce At ς (0) + ∫ Ce A( t −τ ) ⋅ Bw(τ ) ⋅ dτ
0
t
y (t ) = e(t ) + Ce ς (0) + ∫ Ce A( t −τ ) Bw(τ ) ⋅ dτ
At
0
73
以图表示
e→0
w •
ς = A ς + Bw yR = Cς
ς
•
x = f ( x) + g ( x)u
α(ς , x) + β (ς , x)w u
y = h( x ) y
w
x
4.4 干扰解耦
1. 何谓干扰解耦
考虑系统
•
x = f ( x) + g ( x)u + p( x) w
y = h( x )
w(t ) 为干扰不希望的输入
我们希望通过反馈控制 u = α ( x) + β ( x)v 使系统的输出 y与 w 无
关就是说 y与 w 解耦研究这个问题就叫做干扰解耦问题
2. 命题 6.1 若系统在 x 0 处的相对阶为 r 则当且仅当 L p Lif h( x) = 0
对所有 0 ≤ i ≤ r − 1 和所有 x 0 附近的 x 成立则干扰解耦问题有解
且解为
Lrf h( x) v
u=− r −1
+ r −1
L g L f h( x ) L g L f h( x )
证明
1 充分性因
•
x = f ( x) + g ( x)u + p( x) w
y = h( x )
相对阶为 r 为使其成为正则形取坐标变换则
z = Col[h( x ) L f h( x ) L Lrf−1h( x ) φr +1 L φn ( x )]
74
• ∂z1 • ∂h( x)
z1 = ⋅x = [ f ( x) + g ( x)u + p( x) w]
∂x ∂x
= L f h( x) + Lg h( x)u + L p h( x) w
= L f h( x ) = z 2
其中因相对阶为 r L g h( x)u = 0 由于条件成立 L p h( x) w = 0
• ∂L f h( x) • ∂L f h( x)
z2 = ⋅x = [ f ( x) + g ( x)u + p( x) w]
∂x ∂x
= L2f h( x) + L g L f h( x)u + L p L f h( x) w
= z3
同理 Lg L f h( x )u = 0 但 L p L f h( x ) w = 0
M
直到
•
z r −1 = z r
•
z r = Lrf h( x) + L g Lrf−1 h( x)u + L p Lrf−i h( x) w
其中 L g Lrf−1 h( x)u ≠ 0 L p Lrf−1 h( x) w = 0
Lrf h( x) v •
当取 u = − + 时 zr = v
L g Lrf−1 h( x) L g Lrf−1 h( x)
故方程变成
ξ 2  0
•
 M  M 
ξ =   =  v
ξ r  0
   
 0  1
•
η = q(ξ ,η ) + k (ξ ,η ) w
y = ξ 1 = z1
从此式可见 w 影响不了 y
75
(2)必要性
若系统通过状态反馈 u = α ( x) + β ( x)v 实现了干扰解耦无论 v 是
否为零对于干扰解耦没有影响所以
 •
 x = f ( x) + g ( x)u + p ( x) w
 = f ( x) + g ( x)α ( x) + p( x) w
 y = h( x )

是干扰解耦的
∂h( x) • ∂h( x)
y (1) = ⋅x = [ f ( x) + g ( x)α ( x) + p( x) w]
∂x ∂x
= L f h( x ) + L g h( x ) ⋅ α ( x ) + L p h( x ) ⋅ w
其中因相对阶为 r L g h( x ) ⋅ α ( x ) = 0
因为 y 与 w 无关
(1)
只有使 L p h( x) = 0
∂L f h( x) •
y ( 2) = ⋅ x = L2f h( x) + Lg L f h( x) ⋅ α ( x) + L p L f h( x) ⋅ w
∂x
其中 L g L f h( x) ⋅ α ( x) = 0
因为 y ( 2 ) 与 w 无关只有使 L p L f h( x) = 0
如此一直求下去应有 L p Lrf−1 h( x) = 0
此时 y ( r ) = Lrf h( x) + L g Lrf−1 h( x) ⋅ α ( x) 其中 L g Lrf−1 h( x) ⋅ α ( x) ≠ 0
而
Lrf h( x)
α ( x) = −
L g Lrf−1 h( x)
所以条件 L p Lif h( x) = 0, 0 ≤ i ≤ r −1 x在 x 0 领域中是必要的
3. 几点评注
1 前面已经提过可以选择
v = −(C0 h( x ) + L + Cr −1Lrf−1h( x )) + v
76
通过选择 C 0 , L , C r −1 使系统满足一些附加的特性具有一

定收敛速度的渐进稳定性
2 条件 L p Lif h( x) = 0 的几何选择
因为 L p Lif h( x) = 0 即 dLif h( x) ⋅ p ( x) = 0
或 < dLif h( x), p ( x) >= 0 0 ≤ i ≤ r −1
则令协分布 Ω = Span{dh( x), L , dLrf−1 h( x)} 那么条件就是
p ( x) ∈ Ω ⊥ ( x), x ∈ x 0 的邻域
3 当干扰 w 可量测时则可以通过测量得到的 w 来构造一个前
馈补偿使系统达到干扰解耦即取 u = α ( x) + β ( x)v + γ ( x) w
•
x = f ( x) + g ( x)u + p ( x) w
= f ( x) + g ( x)α ( x) + g ( x) β ( x)v + g ( x)γ ( x) w + p ( x) w
= f ( x) + g ( x)α ( x) + g ( x) β ( x)v + ( g ( x)γ ( x) + p ( x)) w
y = h(x)
与命题的情况相比较其干扰解耦的条件为
( g ( x)γ ( x) + p ( x)) ∈ Ω ⊥ 即 L gγ + p Lif h( x) = 0
因
L gγ + p Lif h( x) = dLif h( x)( gγ + p )
= L gγ Lif h( x) + L p Lif h( x) = 0 (0 ≤ i ≤ r − 1)
结合系统的相对阶为 r 故得出下列条件
i 当 0 ≤ i ≤ r − 2 时 L p Lif h( x) = 0
ii 当 i = r − 1时 Lgγ Lrf−1h( x ) + Lp Lrf−1h( x ) = 0
即 L g Lrf−1 h( x) ⋅ γ ( x) + L p Lrf−1 h( x) = 0
解得
L p Lrf−1 h( x)
γ ( x) = −
L g Lrf−1 h( x)
综上所述
Lrf h( x ) − v + Lp Lrf−1h( x )w
u=−
Lg Lrf−1h( x )
此条件弱于命题 6.1 的条件
4.5 高增益反馈
1.问题的提出
77
前面我们已经讨论了局部镇定问题说的是若零动态的一阶近似
是临界的但是零动态是渐进稳定的则可以通过状态反馈使系
统渐近稳定这一节我们将讨论如果零动态的一阶线性近似是渐
近稳定的则用输出反馈就可以局部镇定系统
2.命题 7.1 考虑系统
•
x = f ( x) + g ( x)u
y = h( x )
且设 f (0) = 0, h(0) = 0 并假设系统的相对阶 r=1 而且其零动态
在 x=0处的一阶线性近似是渐近稳定的即下列矩阵的特征值都具有
负实部
 ∂q (ξ ,η ) 
Q= 
 ∂η  (ξ ,η ) =( 0, 0)
则考虑用输出反馈来构成闭环控制此时
•
x = f ( x) + g ( x)u , y = h( x )
u = − kh( x)
其中为保证系统为负反馈取
若 L g h(0) > 0 取 k > 0
若 L g h(0) < 0 取k < 0
那么就存在一个正实数 k 0 使得对于所有 k ≥ k0 系统在 x=0处
是渐近稳定的
证明严格的证明可参阅奇异摄动理论
我们来证明 L g h(0) < 0 的情况 L g h(0) > 0 的情况完全类似
1
令k = − 当ε → 0时 k →∞
ε
• 1
故 x = f ( x) + g ( x)(− k ⋅ h( x)) = f ( x) + ⋅ g ( x ) h( x )
ε
•
则 ε x = εf ( x) + g ( x)h( x) = F ( x, ε )
dx dx dt
令 t = ε ⋅τ 则 x(t ) = x(ε ⋅ τ ) 记为 x ′ = = ⋅
dτ dt dτ
•
故 x ′ = x⋅ ε = εf ( x) + g ( x)h( x) = F ( x, ε )
对于平衡点 x ′ = 0 则 F ( x, ε ) = 0 当 ε → 0 时就有 F ( x,0) = 0
t
由于 τ = 所以 x ′ 表示的是慢变状态 x ′ = F (x,0)
ε
取其一阶线性近似可得雅可比阵
78
∂ ( g ( x)h( x)) ∂g ( x) ∂h( x)

Jx = = ⋅ h( x ) + g ( x ) ⋅
∂x ∂x ∂x
因在平衡点处 h( x) = 0 而 g ( x) ≠ 0 故
∂h( x)
J x g ( x) = g ( x) ⋅ g ( x ) = g ( x ) ⋅ L g h( x )
∂x
这就说明 g (x) 是 J x 的特征向量特征值是 λ ( x) = Lg h( x) < 0 因而
x ′ = F (x,0) 是渐近稳定的
由于已知系统的相对阶 r=1 所以其正则形为
•
ξ 1 = b(ξ ,η ) + a(ξ ,η ) ⋅ u
•
η = q(ξ ,η )
y = ξ1
1
故 u = −kh( x) = − kξ 1 = ⋅ ξ1
ε
• •
则有 ε ξ 1 = ε ⋅ b(ξ ,η ) + a(ξ ,η ) ⋅ ξ1 且 ε η = ε ⋅ q(ξ ,η )
 •  ε ⋅ b(ξ ,η ) a(ξ ,η )ξ 
ξ
所以有 ε  •1  =   + 0
1

η   ε ⋅ q (ξ ,η )   
 
因此从前面的讨论可知当 ε → 0 时系统时渐近稳定的
•
由于在平衡点处 y = ξ = 0 所以 η = q (0,η ) 正是系统的零动态由
于已假设的零动态有一阶线性近似是渐近稳定的所以总可以存在一
个足够小的 ε 0 > 0 只要 ε ∈ (0, ε 0 ) 系统在 x=0处是一个孤立的平衡
点并且是渐近稳定的
附注用线性系统为例理解
y
G s
对线性系统来说如果相对阶为 1 则意味着 G (s ) 的分子与分母的阶

数相差为 1
79
bn −1 s n −1 + L + b0
G ( s) =
s n + L + a1 s + a 0
说明开环有 n 个极点和 n-1个零点零动态是渐近稳定的说明所
有零点均在左半平面则从根轨迹的观点来看当 k → ∞ 时系统的
所有极点或者趋向零点或者趋向 ∞ 所以可使系统渐近稳定
因此对于相对阶为 1 的线性系统来说当所有的零点处在左半复
平面时对于充分大的开环增益则所有根轨迹的分支也都处在左半
复平面中
3.推广相对阶 r > 1 时的情况

对于这种情况我们可以假设一个虚拟的输出函数 w 在这个
虚拟的输出下使系统的相对阶等于 1 然后再利用上述结果来处理
现在令
w = k ( x) = Lrf−1 h( x) + C r −2 Lrf− 2 h( x) + L + C1 L f h( x) + C 0 h( x)
其中 C 0 , C1 , L , C r − 2 是要选取的实数
则系统成为
•
x = f ( x) + g ( x)u
w = k ( x)
若原系统在 x 0 = 0 处的相对阶为 r 则现在系统在 x 0 = 0 处的相对
阶为 1
因为
L g k ( x 0 ) = Lg Lrf−1 h( x 0 ) + L + C1 L g L f h( x 0 ) + C 0 L g h( x 0 )
= L g Lrf−1 h( x 0 ) = L g Lrf−1 h(0) ≠ 0
所以就适用命题 7.1
现在就要检查以下系统的零动态的渐近特性
以前已经指出零动态是强使系统的输出为零时系统内部存在的
一种动态这个动态特性的本质与取什么样的坐标表示无关现在虚
拟的输出为 w 所以当 w=0时意味着
w = Lrf−1h( x ) + L + C1L f h( x ) + C0 h( x ) = 0
如果我们仍采用原来的坐标 Z 并且选择 u (t ) 使 w(t ) = 0 就有
w = z r + C r − 2 z r −1 + L + C1 z 2 + C 0 z1 = 0
z r = −(C r − 2 z r −1 + L +C 1 z 2 + C 0 z1 )
即
• • ∂w • ∂w
并且 w = 0, w = ⋅x= ( f ( x ) + g ( x )u ) 可解的相应的 u ,则此
∂x ∂x
时的零动态用 z及η 表示为
80
•
z1 = z2
•
z 2 = z3
M
•
z r −1 = z r = −(C r − 2 z r −1 + L + C1 z 2 + C 0 z1 )
•
η = q( z1 , z 2 ,
,−(C r − 2 z r −1 + L + C1 z 2 + C 0 z1 ),η )
L
∗ 0
这些方程具有一种块三角形的形式 f阵形如   因
∗ ∗
此当原系统的零动态的一阶线性近似是渐近稳定的且下列多项式的
所有根都具有负实部时则该系统的一阶近似也是渐近稳定的
n( s ) = s r −1 + C r − 2 s r −2 + L + C1 s + C 0
于是由命题 7.1 可得出当 n(s ) 的根都具有负实部而且原系统的
零动态的一阶线性近似是渐近稳定的再取 k 的符号与 Lg w(0) 相同
r −1
即与 Lg L f h(0) 符号相同则反馈控制
r −1 r −2
u = −k ( L h( x) + C r − 2 L h( x) + L + C1 L f h( x) + C 0 h( x))
f f 7.3
能使系统在平衡点 x=0处渐近稳定
从式(7.3)可见反馈 w 实际上是一种状态反馈部分状态因为
(i )
L f h( x ) (0 ≤ i ≤ r − 1) 与函数 y对时间取 i 阶导数是一致的所以
当 w 用 y来表示时
w(t ) = y ( r −1) (t ) + C r −2 y ( r − 2 ) (t ) + L + C r y (1) (t ) + C 0 y (t )
因而 w( s ) = n( s ) ⋅ y ( s )
所以所假设的虚拟输出 w 可以看成是原系统的输出 y通过一个传
递函数为 n(s ) 的线性滤波器来得到的然而由于 n(s ) 是包含高阶微分
的滤波器因而是物理不能实现的但是在不危及相应闭环稳定性的
条件下可以用一个物理可实现的近似滤波器来代替命题 7.3 实际应
有的考虑
•
如果系统 x = f ( x) − g ( x) ⋅ k ( x) ⋅ K 在平衡点 x 0 = 0 处是一阶近似渐
近稳定的那么当 T是一个充分小的正数时系统
•
x = f ( x) − g ( x) ⋅ ζ
• 1
ζ = ( )(−ζ + k ( x) ⋅ K )
T
在 ( x, ζ ) = (0,0) 处也是一阶近似稳定的其后一个方程可以用方框图表
示
81
•
K(x)k ζ ζ K ⋅ k (x)
ζ
1
∫ 或
1
Ts + 1
T
证明该命题仍可以用奇异摄动理论来加以证明
若设一个新的变量 z 并令
z = −ζ + k ( x) ⋅ K
• • ∂k ( x) • 1 ∂k ( x)
z = −ζ + K ⋅ ⋅ x = ( )(−ζ + k ( x) ⋅ K ) + K ⋅ x
∂x T ∂x
则 ζ = − z + k ( x) ⋅ K
故
•
x = f ( x) − g ( x) ⋅ (− z + k ( x) ⋅ K )
• ∂k ( x)
T z = − z + TK ( )[ f ( x) − g ( x) ⋅ (− z + k ( x) ⋅ K )]
∂x
= − z + Tb( z , x)
t
若令 τ = 当T → 0 时 τ → ∞ τ 表示一个慢变过程
T
• • dτ 1 • •
将 z t = zτ ⋅ = ⋅ z τ 代入上式得 z τ = − z + Tb( z , x)
dt T
故当T = ε 足够小时第 2 项 → 0 该方程表示一个仅仅有一个为
-1的非平凡特征值的子系统除了这个子系统之外系统降阶为
•
x = f ( x) − g ( x) ⋅ k ( x) ⋅ K
•
综上所述由假设 x = f ( x) − g ( x) ⋅ k ( x) ⋅ K 的一阶近似是渐近稳定
的对于足够小的 T 附加子系统的特征值又趋于-1 其一阶线性近似
也是渐近稳定的因此该系统在平衡点 ( x, ζ ) = (0,0) 处的一阶近似的确
是渐近稳定的这说明这样一个事实即在闭环控制中引入小时间
常数的非周期环节不会危害它的渐近稳定性至少对局部来说
将该性质应用 r-1次我们立即可以得出下列结论
5.命题 7.4
假设系统在 x 0 = 0 处的相对阶为 r 并且其零动态的一阶近似是渐
近稳定的再假设下列多项式的根
n( s ) = s r −1 + C r −1 s r −2 + L + C1 s + C 0
82
全都具有负实部则具有下列参考函数的线性输出反馈控制
− Kn( s )
H (s) =
(1 + Ts ) r −1
能稳定系统只要 K 取适当大且其符号与 L g Lrf−1 h(0) 相同而 T
是充分小的正数
4.6 关于精确化问题的补充
1.问题的提出
回顾一下精确线性化问题的主要命题
．
说的是系统ｘ = ｆ（ｘ）+ ｇ（ｘ）ｕ其状态空间精确线性化问题在
０
ｘ处能解的充分必要的条件是
００ｎ −２０ｎ −１０
( i)矩阵［ｇ（ｘ），ａｄｆｇ（ｘ），ａｄｆｇ（ｘ），ａｄｆｇ（ｘ）］的秩是 n
ｎ −２
( ii)分布Ｄ = Ｓｐａｎ｛ｇ，ａｄｆｇ， L ，ａｄｆｇ｝在ｘ处是对合的
０
也就是说上述条件满足时一定存在一个实值函数 λ（ｘ）,当取 y
λ（ｘ）时使系统的相对阶为 n
现在的问题是若上述条件不成立则通过坐标变换和状态反馈
是不能使系统变成线性能控的系统的但是否总能使系统分解为两个
子系统其中有一个子系统是线性的我们希望至少能找到一种坐标
变换及状态反馈使线性子系统的维数最大换句话说找到一个适当的
输出映射 λ（ｘ）此时系统在该点的相对阶最高这个问题就是我们在
本节中所要讨论的
2.预备知识分布 ∆ 的对合闭包( 记为ｉｎｖ（ ∆ ） )
分布的对合性
考虑向量场ｆ１， L ，ｆｄ分布 ∆ = Ｓｐａｎ｛ｆ１， L ，ｆｄ｝
充要条件若李括号运算［ｆｉ，ｆｊ］∈∆ ,对所有１ ≤ ｉ，ｊ ≤ ｄ均成立
则∆ 是对合分布
判别方法
ｒａｎｋ［ｆ１， L ，ｆｄ］= ？ｒａｎｋ［ｆ１， L ，ｆｄ，［ｆｉ，ｆｊ］（ｘ）］
若相等则是对合的否则不是对合的
从对合的性质可知
若分布 ∆ １是对合的 ∆ ２也是对合的
则 ∆ １ + ∆ ２不一定是对合的
83
但 ∆ １ ∩ ∆ ２是对合的
因此如果 ∆ 不是对合的
但 ∆ １包含 ∆ 而 ∆ １是对合的
又 ∆ ２包含 ∆ ∆ ２也是对合的
则 ∆ １ ∩ ∆ ２也包含 ∆ 且 ∆ １ ∩ ∆ ２是对合的
则由所有包含 ∆ 的对合分布族 ∆ １，∆ ２， L 的交可以得到一个包

含 ∆ 的最小的对合分布称为 ∆ 的对合闭包记为ｉｎｖ（ ∆ ）
对合闭包的求法大致可以这样来做
若分布 ∆ = Ｓｐａｎ｛ｆ１， L ，ｆｄ｝则若 ∆ 不是闭合的就是说
［ｆｉ，ｆｊ］（ｘ）不在 ∆ 中因而看看
∆ ′ = Ｓｐａｎ｛ｆ１， L ，ｆｄ，［ｆｉ，ｆｊ］（ｘ）｝是否是对合的若 ∆ ′ 是对合的
则 ∆ ′ 就是 ∆ 的对合闭包否则继续做下去便能找出ｉｎｖ（ ∆ ）来
2.定理 8.1
考虑分布 ∆ 并假设 λ（ｘ）是实值函数且ｄλ（ｘ）≠ ０及ｄλ ∈ ∆
０ ⊥
ｄλ ∈（ｉｎｖ（ ∆ ））
０ ⊥
那么在ｘ的邻域上
证明考虑分布 Γ =（Ｓｐａｎ｛ｄλ ｝）则这个分布在ｘ的邻域上是( n - 1 )
⊥ ０
维的
并由 Frobenius定理可知 Γ 是对合的再由构造可知 ∆ ⊂ Γ
由定义可知ｉｎｖ（ ∆ ）是包含 ∆ 的最小对合分布所以
Γ ⊃ ｉｎｖ（ ∆ ）
即是Ｓｐａｎ｛ｄλ ｝⊂（ｉｎｖ（ ∆ ））
⊥
3.定理 8.2( 最大相对阶定理 )

考虑一对向量场 f( x ) g( x ) 假设对某个整数 γ
０
在某ｘ处有
γ −２
( 1 ) ｄｉｍ（ｉｎｖ（Ｓｐａｎ｛ｇ，ａｄｆｇ， L ，ａｄｆｇ｝））= ｋ < ｎ而
γ −１
( 2 ) ｄｉｍ（ｉｎｖ（Ｓｐａｎ｛ｇ，ａｄｆｇ， L ，ａｄｆｇ｝））= ｎ
则就存在一个函数 λ（ｘ）使系统
84
．
ｘ = ｆ（ｘ）+ ｇ（ｘ）ｕ
ｙ = λ（ｘ）
在ｘ处的相对阶为 γ 而对于任何其他的输出映射ｙ ′ = λ ′（ｘ）
０
系统的相对阶低于或等于 γ
证明
γ −２
( 1 )因为ｉｎｖ（Ｓｐａｎ｛ｇ， L ，ａｄｆｇ｝是 k维( k < n 的
) 且是对合的
由 Frobenius定理就一定存在 n - k个函数 λ １（ｘ）， L ，λ ｎ − ｋ（ｘ）它
们的微分张成上述分布的零化子( 局部地 )
λ（ｘ）= λ １（ｘ）则对所有ｘ附近的 x有
０
如果我们令
Ｌｇ λ（ｘ）= Ｌａｄｇ λ（ｘ）= L = Ｌａｄｇ λ（ｘ）= ０
ｆ
γ −２
ｆ
λ（ｘ）≠ ０
０
而且可以证明Ｌ γ −１
ａｄｆｇ
这可以用反证法因为假若上述结论是错的那么非零向量ｄλ（ｘ）

０
γ −２ γ −１
将属于分布Ｓｐａｎ｛ｇ， L ，ａｄｆｇ，ａｄｆｇ｝的零化子
γ −２ γ −１
ｄλ（ｘ）∈（Ｓｐａｎ｛ｇ， L ，ａｄｆｇ，ａｄｆｇ｝）
０ ⊥
即则由定理 8.1
γ −２ γ −１
ｄλ（ｘ）∈（ｉｎｖ（Ｓｐａｎ｛ｇ， L ，ａｄｆｇ，ａｄｆｇ｝）） ,但这是矛
０ ⊥
盾的不可能的因为已由假设条件
γ −２ γ −１
ｉｎｖ（Ｓｐａｎ｛ｇ， L ，ａｄｆｇ，ａｄｆｇ｝）是 n 维的所以它的零化子是 0
维的所以一维非零的ｄλ（ｘ）不可能属于它的零化子因而由相对阶
０
的定义可知系统的相对阶为 γ
( 2 )再来考虑任何其他的 λ ′（ｘ）为其输出函数并假设此时对应的相对
阶为 r 所以 dλ ′ ∈ ( Span{g , L , ad rf − 2 g}) ⊥
由定理 8.1 dλ ′ ∈ (inv ( Span{g , L , ad rf − 2 g})) ⊥
因为ｄλ ′ ≠ ０故 dim(inv ( Span{g , L , ad rf − 2 g})) < n
对于假设 ( 1 ) 及 ( 2 ) 便可推知ｒ ≤γ
( Q ｒ − ２ ≤ γ − ２， ∴ ｒ ≤ γ )
4.7 具有线性误差动态的观测器
1.问题的提出
在线性系统理论中用状态反馈进行系统极点配置与观测器用前向
85
增益阵使其具有给定的特征值的观测器设计是一个对偶问题那么在
非线性系统中从某种意义上讲本节所要讨论的问题也就是第 2 节中
状态空间精确线性化问题的对偶问题
众所周知观测器的动态与观测误差的动态是相同的观测误差定
义为未知的状态与估计状态之差由此看来如果我们希望将前面已
经研究过的一定结果来作对偶处理就引出误差动态的非线性观测器
的综合问题有可能在作了适当的坐标变换之后这个动态变成线性的
且在频谱上或其特征值可以进行配置的
为简单起见在考虑观测器综合时先考虑无外加输入及标量输出
的情况
系统方程
．
ｘ = ｆ（ｘ）（９．１ａ）
ｙ = ｈ（ｘ）（９．１ｂ）
并假定存在一种坐标变换ｚ = Φ（ｘ）在此变换下若上述方程变
成
．
 ∂Φ（ｘ）．   ∂Φ（ｘ） 
ｚ= ⋅ｘ = ⋅ ｆ（ｘ） = Ａｚ + ｋ（Ｃｚ）
 ∂ｘ  ｘ = Φ （ｚ）  ∂ｘ
−１  ｘ =Φ （ｚ）
−１
ｙ = [ ｈ（ｘ）]ｘ = Φ （ｚ） = Ｃｚ
−１
( A ,C )是能观测对ｋ（⋅ ）是 n 维时变函数的向量则可构成这样的

观测器
．
ξ = Ａ ⋅ ξ + ｋ（Ｃｚ）− ＧＣｚ + ＧＣ ξ
=（Ａ + ＧＣ）ξ − Ｇｙ + ｋ（ｙ）
ｅ = ξ − ｚ = ξ − Φ（ｘ）
．．．
ｅ = ξ− ｚ
86
则误差动态
．
ｅ =（Ａ + ＧＣ）ξ − Ｇｙ + ｋ（ｙ）− Ａｚ − ｋ（ｙ）
=（Ａ + ＧＣ）ξ −（Ａ + ＧＣ）ｚ
=（Ａ + ＧＣ）ｅ
这是线性的又因( A ,C )是能观对故可通过 n 维实数向量 G 使

其特征值配置在希望的位置
关键的问题是要找这样的坐标变换ｚ = Φ（ｘ）及与此有关的映射
ｋ（⋅ ）这个问题就称为观测器线性化问题其正式叙述如下
０
已知一个无外加输入的系统( 9.1 ) 及初始状态ｘ是否能找到一
以及定义在Ｕ上的坐标变换ｚ = Φ（ｘ）和输出映射
０００
个ｘ的邻域Ｕ
k ｈ（Ｕ）→ Ｒ使得对所有ｚ ∈Φ（Ｕ）有
０ｎ０
 ∂Φ 
 ｆ（ｘ） = Ａｚ + ｋ（Ｃｚ）
 ∂ｘ  ｘ =Φ −１
（ｚ）
−１
ｈ（ Φ （ｚ））= Ｃｚ
其中矩阵 A 和行向量 C 是能观对即满足
 Ｃ 
 
 ＣＡ 
ｒａｎｋ  =ｎ
 M 
 ｎ −１ 
ＣＡ 
2.定理 9.1 观测器线性化问题能解的必要条件是
ｎ −１
ｄｉｍ（Ｓｐａｎ｛ｄｈ（ｘ），ｄＬｆｈ（ｘ）， L ，ｄＬｆｈ（ｘ）｝）= ｎ
０００
证明
由线性系统理论可知如果( A ,C )是能观对则一定可以通过坐标变
换将它化成所谓能观标准形所以一定有这样的 T和 G 使
87
００ L ０ 
 
１０ L ０ 
Ａ = Ｔ（Ａ + ＧＣ）Ｔ − １ = 
０ O ０ M 
 
００ L １０
Ｃ = ＣＴ − １ =［０， L ．１］
不失一般性若( A ,C )能观测则直接就假设它们具有这种形式
如果新坐标取
ｚ１ 
 
ｚ=M 
 
ｚｎ 
则有ｙ = Ｃｚ = ｚｎ
．
而由ｚ = Ａｚ + ｋ（Ｃｚ）= Ａｚ + ｋ（ｚｎ）
可得
．
ｚ１ = ｋ１（ｚｎ）
．
ｚ２ = ｚ１ + ｋｎ（ｚｎ）
M
．
ｚｎ = ｚｎ −１ + ｋｎ（ｚｎ）
故ｈ（ｘ）=ｚｎ
∂z n ∂z . .
L f h( x ) = ⋅ f = n ⋅ x = z n = z n −1 + k n ( z n )
∂x ∂x
∂L f h ( x ) ∂z ∂k ( z )
L2f h( x) = ⋅ f = n −1 ⋅ f + n n ⋅ f
∂x ∂x ∂x
88
.
• ∂k n (⋅) ∂zn .
= z n −1 + ⋅ ⋅x
∂zn ∂x
= z n − 2 + k n − 1 ( z n , z n −1 )
Lif h( x) = z n −i + k n −i +1 ( z n , z n −1 , L , z n −i +1 )
Lnf−1 h( x) = z1 + k 2 ( z n , z n −1 , L , z 2 )
∴
 ∂h ( x )   ∂h ∂z   ∂h 
⋅
 dh( x)   ∂x   ∂z ∂x   ∂z 
 dL h( x)   ∂L f h( x)   ∂L f h ∂z   ∂L f h 
=      ∂z
 f
 ∂ x  =  ∂z ⋅ ∂x  =  ∂z  ⋅
 
  M  ∂x
M
 n −1   n −1M   M
dL f h( x)  ∂L f h( x)   ∂L f h ∂z   ∂L f h 
n −1 n −1
   ⋅   
 ∂x   ∂z ∂x   ∂z 
0 L L L 1
0 L L 1 ∗
 ∂Φ ( x )
= 0 L 1 ∗ ∗ ⋅
  ∂x
M N M M M
1 ∗ L L ∗
∂Φ（ｘ）
由于为坐标变换的雅可比阵它是非奇异的
∂ｘ
所以
89
 ｄｈ（ｘ） 
 
 M  应是非奇异阵
 ｎ −１ 
ｄＬ
 ｆｈ（ｘ） 
ｎ −１
这就证明了ｄｉｍ（Ｓｐａｎ｛ｄｈ（ｘ），ｄＬｆｈ（ｘ）， L ，ｄＬｆｈ（ｘ）｝）= ｎ
０００
推论由于这个条件满足所以可以使下列方程有唯一的解 τ（ｘ）
 ｄｈ（ｘ）  ０
   
 ｄＬｆｈ（ｘ）  M 
  τ（ｘ） =   ( 9.7 )
 M  ０
 
 ｎ −１   
ｄＬｆｈ（ｘ） １
即有
ｎ −２
Ｌτ ｈ（ｘ）= Ｌτ Ｌｆｈ（ｘ）= L = Ｌτ Ｌｆｈ（ｘ）= ０
ｎ −１
Ｌτ Ｌｆｈ（ｘ）= １
3.定理 9.2( 充分必要条件 )
观测器线性化问题能解的充分必要条件是
ｎ −１
( i ) ｄｉｍ（Ｓｐａｎ｛ｄｈ（ｘ），ｄＬｆｈ（ｘ）， L ，ｄＬｆｈ（ｘ）｝）= ｎ
０００
( 即定理 9.1 的条件 )

ｎ００
( ii )在Ｒ的某个开集 V 上存在一个映射 F 它映射到ｘ的邻域Ｕ
上对
所有ｚ ∈Ｖ满足
∂Ｆ
=［τ（ｘ），− ａｄｆ τ（ｘ）， L ，（ − １）ａｄｆ τ（ｘ）］ｘ = Ｆ（ｚ）
ｎ −１ｎ −１
( 9.8 )
∂ｚ
其中向量场 τ（ｘ）是方程( 9.7 )的唯一解
证明略
4.观测器线性化问题的求解过程
( 1 )首先检查条件( i ) 若条件满足则进行下面步骤
( 2 )解方程( 9.7 )得到向量场 τ（ｘ）
( 3 )再检查条件( ii ) 实际上要解偏微分方程( 9.8 ) 找到函数Ｆ（⋅ ）
并使Ｆ（ｚ）= ｘ
００００
它定义在ｚ的邻域Ｖ上
−１
( 4 )然后得到 Φ = Ｆ
( 5 )显然可计算出映射ｋ（⋅ ）
90
 ｋ１（ｚｎ）  ０ 
   
 ｋ２（ｚｎ）  ∂Φ   ｚ１ 
ｋ（ｚｎ）=  = ⋅ ｆ（ｘ） − 
 M   ∂ｘ  ｘ =Φ −１
（ｚ）  M 
   
ｋｎ（ｚｎ） ｚｎ −１ 
( 6 )最后可以得到满足要求的观测器方程
．
ξ =（Ａ + ＧＣ）ξ − Ｇｙ + ｋ（ｙ）
其中
0 0 ⋅ ⋅ ⋅ 0
1 0 ⋅ ⋅ ⋅ 0 
 
A = 0 1 ⋅ ⋅ ⋅ 0 C = [0, L ,1]
 
⋅ ⋅ ⋅ ⋅
0 ⋅ ⋅ ⋅ 1 0
G 是根据所要求的观测器动态来设计
4.8 举例
考虑一个简单的单连杆机械手
在实践中机械的运动往往用一个长轴或传送带来传动或者用

电机的电枢来驱动这时显示的谐振频率常常与控制讯号的频率在同
一个范围之内
作动器与连杆之间的弹性耦合影响其数学模型常常可以用一个线
性的扭簧来表示本例中的数学模型可以用两个二阶方程来描写一
个是驱动轴的力学方程另一个是连杆的力学方程ｑ１，ｑ２表示驱动轴
与连杆的角位移( 相对于固定参考系)
91
．．．
Ｋｑ
Ｊ１ｑ１ + Ｆ１ｑ１ + （ｑ２ − １）= Ｔ
ＮＮ
．．．
ｑ
Ｊ２ｑ２ + Ｆ２ｑ２ + Ｋ（ｑ２ − １）+ ｍｇｄＣｏｓｑ２ = ０
Ｎ
其中 N 传动比
m 杆的质量
d 杆的重心至转轴中心的距离
．．
取状态变量ｘ = Ｃｏｌ（ｑ１，ｑ２，ｑ１，ｑ２）控制 u = T 则将上述方程化成
状态方程
 ｘ３ 
 
 ｘ４ 
 −ＫＫＦ１ 
ｆ（ｘ）=  ２
ｘ１
+ ｘ２
− ｘ３ 
 Ｊ１
ＮＪ１
ＮＪ１ 
 ＫＫｍｇｄＦ２ 
 ｘ１
− ｘ２
− Ｃｏｓｘ２
− ｘ４ 
Ｊ２ＮＪ２Ｊ２Ｊ２ 
０ 
 
０ 
ｇ（ｘ）=  １ 
 
Ｊ１ 
 ０ 
ｙ = ｈ（ｘ）= ｘ２ ( 观测ｑ２ )
92
∗
x 
∂h ( x )
∴ L f h( x ) = ⋅ f ( x) = [0 1 0 0] 4  = x 4
∂x ∗
 
∗
 ∗ 
∂L f h ( x )  ∗ 
L2f h( x) = ⋅ f ( x) = [0 0 0 1]  = f ( x)
∂x  ∗ 
4
 
 f 4 ( x)
∂L2f h( x)
L3f h( x) = ⋅ f ( x)
∂x
 K K mgd F 
= ,− + Sinx 2 ,0, 2  ⋅ f
 J2N J2 J2 J2 
K K mgd F
= x3 + (− + Sinx 2 ) x 4 − 2 f 4 ( x)
J2N J2 J2 J2
0
0
Lg h( x ) = [0 1 0 0]  = 0
∗
 
0
0
0
Lg L f h( x ) = [0 0 0 1]  = 0
*
 
0
93
0
0
Lg L f h( x ) = [∗ ∗ 0 ∗]  = 0
2
∗
 
0
0
 
 K  0  K
Lg L f h( x ) = 0 ∗
3
∗ 1 = ≠0
 
 J2N   J  J1J 2 N
1
 0 
∴ 相对阶 r = 4 = n在状态空间中每一点处均成立
故系统能精确线性化
取
− L4f h( x ) + v
U =T =
Lg L3f h( x )
新坐标
 ｈ（ｘ）  ｙ 
   ．　
 ｆ
Ｌｈ（ｘ） ｙ 
ｚ= ２  =  ．．　
Ｌ
 ｆｈ（ｘ） ｙ 
 ３   ．．　． 
Ｌ
 ｆｈ（ｘ） ｙ 
ｑ１ 
 
ｑ２ 
原坐标  ．
ｑ１ 
 ．
ｑ２ 
０
我们来考虑一个有趣的事情看看系统能否在某个ｘ处线性化若
ｘ２ = ０即ｑ２ = ０ ,我们立即可以看出这时的系统不是一个平衡状态
０
因为有Ｃｏｓ０ = １所以ｆ（ｘ）= ０与ｘ２ = ０是不协调的也就是说不加

００
控制时要达到平衡状态时ｘ２ ≠ ０
０
换句话说要用控制来使其平衡
94
即ｆ（ｘ）+ ｇ（ｘ）Ｃ = ０
００
则在ｘ２ = ０下
０
ｘ３ = ０
０
ｘ４ = ０
０
Ｋ０
− ｘ１ + Ｃ = ０
Ｎ
Ｋ０
ｘ１ − ｍｇｄ = ０
Ｎ
０
此式可以唯一的解得ｘ１和 C
则
− Ｌｆｈ（ｘ）+ ｖ
４
ｕ= ３
+Ｃ
ＬｆＬｆｈ（ｘ）
因ｙ = ｘ２故此控制可使 y及其各阶导数为 0 及可使 z = 0 除控
０
制不为零外ｘ１亦不为零说明轴要扭一个角度
95
第五章 MIMO非线性系统的反馈线性化初步理论
引言
对于多输入多输出系统仍可以用下列紧缩的形式的方程来描述
x& = f ( x) + g ( x)u
* x ∈ Rn
y = h( x )
若输入的个数与输出的个数的数目相同时可令
u = Col (u1 ,..., u m ) (m × 1)
y = Col ( y1 ,..., y m ) (m × 1)
g ( x) = [ g1 ( x),..., g m ( x)] ( n × m)
f ( x) = Col[ f1 ( x),..., f n ( x)] (n × 1)
h( x) = Col[h1 ( x),..., hm ( x)] (m × 1)
f ( x), g1 ( x),..., g m ( x) 均是光滑的向量场, h1 ( x),..., hm ( x) 是光滑的函数,
均定义在 R n 的某个开集上
5.1 向量相对阶和总相对阶
一个多变量非线性系统 * 在 x o 处有向量相对阶{r1 ,..., rm } 是指
1≤ j ≤ m
(i) L g j Lkf hi ( x) = 0 对所有 1 ≤ i ≤ m ∀x ∈ x o 的邻域
k < ri − 1
(ii) m × m 矩阵
 L g1 Lr1f −1 h1 ( x) . . L g m Lr1f −1 h1 ( x) 
 
 L g1 Lrf2 −1 h2 ( x) . . Lg m Lrf2 −1 h2 ( x) 
A( x) =
 . . . . 
 rm −1 rm −1 
 L g1 L f hm ( x) . . Lg m L f hm ( x)
在 x = x o 处是非奇异的
注意
1 该定义涵盖了 SISO系统
2 整数 r1 ,..., rm 中的某个 ri 是与系统第 i 个输出 hi (x) 有关的行向
ri −1 ri −1
量 [ Lg1 L h ( x),..., L g m L h ( x)] 至少有一个元素是非零的
f i f i
即行向量不是零向量否则矩阵 A( x o ) 就是奇异的了所以对某个 y i 来

说至少有一个 u j 对这样的单输入单输出系统说来它在 x o 处的相对
阶就是 ri 而对于其他可以选择的 u k 说来其在 x o 处相应的相对阶如
96
果存在的话一定大于或等于这个 ri
3 ri 也是在 t = t 0 时刻从 y i (t ) 的微分中得到至少 u (t 0 ) 中一个分量
的显式表示时所需要微分的次数
4 若系统在 x = x 0 处有向量相对阶{r1 ,..., rm } 则行向量
0 0 r1 −1 0
dh1 ( x ), dL f h1 ( x ),..., dL h ( x )
f 1
dh2 ( x 0 ), dL f h2 ( x 0 ),..., dLrf2 −1 h2 ( x 0 )

⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅⋅
dhm ( x 0 ), dL f hm ( x 0 ),..., dLrfm −1 hm ( x 0 )
是线性无关的
证明该性质可以仿照单输入单输出的思路
若 r1 > ri 2 ≤ i ≤ m 构造两个矩阵
Q = Col (dh1 ( x),..., dLr1f −1 h1 ( x), dh2 ( x),..., dLrf2 −1 h2 ( x),..., dhm ( x),..., dLrfm −1 hm ( x))
P = Col ( g1 ( x),..., g m ( x),..., ad rf1 −1 g1 ( x),..., ad rf1 −1 g m ( x))

然后将 QP 相乘再对它的行重新排列后矩阵就呈现一个块三角的
结构其对角线上的块组成 A(x) 矩阵的行由 A(x) 的非奇异性即可证
明 QP 的行是线性无关的因而 Q 的行也是线性无关的
5 当系统的输入数目大于输出数目时向量相对阶定义中的条件
ii , A( x 0 ) 阵的非奇异性用该矩阵的秩等于它的行数也就是输出
通道的个数来代替实际多输入多输出系统关键的是输入的数目
所谓输出是看效果的地方所以采集某个量观察某个量都可以看作
是输出
6 r = r1 + r2 + ... + rm 称为总相对阶且有 r ≤ n
5.2 局部坐标变换和标准形
若系统在 x 0 处有向量相对阶{r1 ,..., rm } 称 r = r1 + r2 + ... + rm 为总相
对阶则 r ≤ n 设1 ≤ i ≤ m 则对于某一指定的 i 取下列映射
φ1i ( x) = hi ( x)
φ 2i ( x) = L f hi ( x)
.
.
.
φ ri ( x) = Lrfi −1 hi ( x)
i
当 r 严格小于 n 时总可以找到另外 n − r 个函数 φ r +1 ( x)...φ n ( x) 使得
97
z = φ ( x)
= Col[φ11 ( x),..., φ r11 ( x), φ12 ( x),..., φ r22 ( x),..., φ1m ( x),..., φ rmm ( x),..., φ r +1 ( x),..., φ n ( x)]
在 x 0 处的雅可比矩阵是非奇异的则 φ (x) 就有资格作坐标变换一般

来说附加的变换函数 φ r +1 ( x),..., φ n (x) 是可以任选的但是当分布
G = Span{g1 ,..., g m } 在 x 0 处是对合的则与 SISO情况相似总可以找
到 φ r +1 ( x),..., φ n ( x) 使
r +1 ≤ i ≤ n
Lg j φi ( x ) = 0 ∀x ∈ x 0 的邻域
1≤ j ≤ m
 ξ 11 
 
 . 
 ξ r1 
ξ   1 
1
ξ   2   M 
 .  ξ   m 
   M   ξ1 
z = . =  m =  M 
  ξ   m 
 .   M   ξ rm 
η     M 
 η   
 η1 
 M 
 
η n −r 
则利用上述坐标变换后新坐标表示的系统方程可以分成 m+1 组:
第 1 组:
•1 dφ 1
ξ 1 = 1 = φ 21 = ξ 21 (t )
dt
•1 dφ 1
ξ 2 = 2 = ξ 31 (t )
dt
.
.
.
98
•1
ξ r −1 = ξ r1 (t )
1 1
• m m
ξ r = Lrf h1 ( x) + ∑ L g Lrf −1 h1 ( x) ⋅ u j = b1 ( z ) + ∑ a1 j ( z ) ⋅ u j
1
1
j
1
j =1 j =1
y1 = ξ 1
1
其中
b1 ( z ) = b1 (ξ ,η ) = Lr1f h1 (φ −1 (ξ ,η ))
a1 j ( z ) = a1 j (ξ ,η ) = Lgj Lr1f −1 h1 (φ −1 (ξ ,η ))
注意前式 u j 中所乘的系数 L gj Lr1f −1 h1 ( x) 正是 A(x) 阵中的第 (1, j ) 项
第 i 组:
•i
ξ 1 = ξ 2i (t )
•i
ξ 2 = ξ 3i (t )
.
.
.
•i
ξ r −1 = ξ ri
i i
• m m
ξ r = Lrf hi ( x) + ∑ Lg Lrf −1 hi ( x) ⋅ u j = bi ( z ) + ∑ aij ( z ) ⋅ u j
i
i
j
i
j =1 j =1
yi = ξ 1
i
再令
 η1  φ r +1 ( x)
 .   . 
   
η= . = . 
   
 .   . 
η n − r   φ n ( x) 
对一般情况下
• m
η = q(ξ ,η ) + ∑ Pj (ξ ,η ) ⋅ u j = q(ξ ,η ) + P(ξ ,η )u
j =1
若分布 G = Span{g1 ,..., g m } 是对合的又由此可得 φ i (x) 满足

L gjφ i ( x) = 0
99
则该方程可简化成
•
η = q(ξ ,η )
将以上各组合并起来就得到多输入多输出系统的标准形
5.3 零动态
由输出零化的概念同样可以定义零动态
由于输出及其各阶导数为零可得
h 1 ( x ) = L f h 1 ( x ) = ... = L r1f − 1 h 1 ( x ) = 0
.
.
.
h m ( x ) = L f h m ( x ) = ... = L rfm − 1 h m ( x ) = 0
m
及 y i( ri ) (t ) = bi (0,η ) + ∑ aij (0,η ) ⋅ u j = 0 共m 个
j =1
写成矩阵和向量的形式则有
b(0,η ) + A(0,η )u = 0
其中
 Lr1f h1 ( x) 
 
 . 
b( x ) =  .  x = φ −1 (ξ ,η ) = φ −1 (0,η )
 
 . 
 Lrm h ( x)
 f m 
A(x) 其中就是以前定义向量相对阶时的矩阵所以
u (t ) = −[A(0,η ]−1 b(0,η )
⋅
η 是 η = q 0 (0,η (t )) 在 η (0) = η 0 下的解
对一般情况
η& = q(ξ ,η ) − p(ξ ,η )[A(ξ ,η )]−1 b(ξ ,η )
对零动态则在 ξ (0) = 0,η (0) = η 0 下求解
5.4 参考输出复制问题
若参考输出 y R (t ) = Col ( y1R (t ),..., y mR (t ))
其中
100
ξ R1 (t ) 
 2 
ξ R (t ) 
 .   y iR( 0) (t )
   (1) 
 .   y iR (t ) 
 .   . 
ξ R (t ) =  i  ξ Ri (t ) =   1≤ i ≤ m
ξ R (t )   . 
 .   . 
   ( r −1) 
 .   y iRi 
 
 . 
ξ Rm (t )
则类似推导后可得
(i) 初始时刻对准即 ξ (0) = ξ R (0) ,而内动态 η (0) = η 0 可以任取
(ii) 取
 y1(Rr1 ) (t ) 
 
 . 
u (t ) = A −1 (ξ R (t ),η (t ))(−b(ξ R (t ),η (t )) +  .  )
 
 . 
 y ( rm ) (t )
 mR 
其中 η 为下列方程的解
 y1(Rr1 ) (t ) 
 
 . 
⋅
η = q(ξ R (t ),η ) + p (ξ R (t ),η ) ⋅ A −1 (ξ R (t ),η )(−b(ξ R (t ),η ) +  .  )
 
 . 
 y ( rm ) (t )
 mR 
η (0) = η 0
同样可以将
yR u (t ) = ...... u (t )
•
η = .......
解释为原系统的逆实现
101
5.5 反馈线性化
当 r1 + r2 + ... + rm = r = n 时可以实现状态反馈精确线性化此时没有
内部动态即取
u (t ) = α ( x) + β ( x)ν = A −1 ( x)[− b( x) + ν ]
当 r1 + r2 + ... + rm = r < n 时可以实现输入输出精确线性化此时有内
部动态但解的式子与上面的表达式一样
5.6 输入输出解耦控制或互不影响的控制
问题的提法
给定一个非线性系统
. m
x = f ( x) + ∑ g i ( x)u i
i =1
y1 = h1 ( x)
.
.
.
y m = hm ( x)
给定初始状态 x 0 及 x 0 的邻域U 0 找一个静态状态反馈控制律
m
u i = α i ( x) + ∑ β ij ( x)ν j
j =1
使闭环系统
. m m m
x = f ( x) + ∑ g i ( x) ⋅ α i ( x) + ∑ (∑ g i ( x) β ij ( x))ν j
i =1 j =1 i =1
y1 = h1 ( x)
.
.
.
y m = hm ( x)
的每一输出 y i 1≤ i ≤ m 只受相应的输入 ν i 的影响而与其他
ν j (i ≠ j ) 无关
这个问题当用标准形来研究时是很简单的因为
102
⋅ i
ξ 1 = ξ 2i
.
.
.
⋅ i
ξ r −1 = ξ ri
i i
⋅ m
ξ r = bi (ξ ,η ) + ∑ aij (ξ ,η )u j
i
j =1
⋅
η = q(ξ ,η ) + p(ξ ,η ) ⋅ u
则取
 u1 
.
 
u =  .  = A −1 (ξ ,η )[− b(ξ ,η ) + ν ]
 
.
u 2 
时其中 η 为下列方程的解
⋅
η = q(ξ ,η ) − p (ξ ,η ) A −1 (ξ ,η )b(ξ ,η ) + p(ξ ,η ) A −1 (ξ ,η )ν
η (0) = η 0
⋅
则上述式子中 ξ ri = ν i y i = ξ1i ξ1i 只与ν i 有关所以系统既被输入
输出线性化了又被解耦了
系统的传递函数为
1 
 s r1 . . . . 
 1 
 . . . . 
H (s) =  s r2 
 . . . . . 
 . . . . . 
 1 
 . . . . 
 s rm 
图形表示如下图
当 r = n 时内动态就没有了
103
v1 ξ 1r1 y1 = ξ11
∫ ∫
ξ r22 y 2 = ξ 12
∫
v2
∫
vm ξ rmm y m = ξ1m
∫ ∫
⋅ ∧ ∧
η = q(ξ ,η ) + p(ξ ,η )v
阴沟洞内动态
当然解耦之后得线性系统还应当根据实际需求及可实现性来设计其动
态性能不必多论了
(课程到此结束)
104

非线性系统理论

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

非线性系统理论

Uploaded by

Copyright:

Available Formats

非线性系统控制理论

第一章 微分几何基础 ..........................................................................1

1.1 度量空间 ..................................................................................1

第二章 李导数李括号运算与分布 ........................................................19

2.1 向量场 ....................................................................................19

第三章 反馈线性化的初等理论 ............................................................29

3.1 局部坐标变换 ........................................................................29

第四章 反馈线性化原理的应用 ............................................................55

4.1 零动态 .....................................................................................55

第五章 MIMO 非线性系统的反馈线性化初步理论...........................96

5.1 向量相对阶和总相对阶 ....................................................96

它可以看作是一种从 R 到 R 的对应关系 定义了上述距离 ρ n 1

显然 ρ 满足性质 1 2 3 证明性质 3 时 可根据 n 维欧氏空间 R n

O ' ( M 0 , δ ) = {( x, y ) ∈ R 2 | x − x0 < δ , y − y 0 < δ }

和 是等价的范数 那末在范数 的意义下的收敛性与在范数

意义下的收敛性也是相同的 对任一线性空间来说 如果它装备了

两个以上的范数 我们不能断定它们一定是等价的 但是对于欧氏空

f ( x) − f ( x0 ) < ε 就称映射 f 在点 x0 连续,要注意的是范数 x − x0 是

必要条件是:对于 R m 内的任一开集V ,它的逆象

Hausdorff 公理:设 ( S , T ) 是拓扑空间,若 S 中的任意两点 x , y ( x ≠ y ) ,

每一点可微 就称 f 在 D 内可微 又称 f 是 D 内的可微映射

设 x = ϕ d ( P), x = ( x1 , x2 ...xn ) 是 P 的局部坐标 如果 f o ϕ d−1 在 x 处可

点 求曲线在点 P 处的切线 实际上求切线与求导数是密切相关的

L g Lkf h( x) = L g ( Lkf h( x)) = ⋅ g ( x)

(∆1 I ∆ 2 )(x ) =∆1(x ) = ∆ 2(x ) = span  若 x1 = 0 所 以

若 ω 1, ω 2, K, ωd 表示一组行向量场 即协向量场 则协分布表示为

空间 即它是 ∆(x ) 的正交补 ( ) ∗

式中 ω ∗ , υ 表示行向量 *与列向量 的内积

充分性 充分性可以从构造上来证明 即若条件满足,偏微分方

令 Ω( x) = span{∂φ d +1 ( x),L , ∂φ n ( x)} 则 Ω( x) = ∆⊥ ( x) ( x ∈ U 0 ) 即这些

∴我们可以看到在 ｘ ０ 为任意值时 其邻域上均有

可得出 r-1=1 则即 r=2

CBs n −1 + (CAB + a n −1CB )s n − 2 + (CA 2 B + a n −1CAB + a n − 2CB )s n −3 + ⋅ ⋅ ⋅ + (CA n −1 B + ⋅ ⋅ ⋅ + a1CB )

若 ＣＡ ０Ｂ = ０ 而 ＣＡＢ ≠ ０ r-1=1 r=2 此时分母与分子阶次差

若 CA 0 B = 0, ⋅ ⋅ ⋅ , CA k B = 0 ( k < r − 1) 而 ＣＡ ｒ −１Ｂ ≠ ０ 相对阶为r

(ii 若r<n 则选择

这后面的 n-r 个函数在满足在 ｘ ０ 处有一个非奇异的雅可比

定理1.4: 假设系统在ｘ ｏ 处有相对阶r 且r是严格小于n的 则取

也就是说向量 g( x ) 零化在 Span{dh, dL h,L , dL h} 上的所有协向

量 但这是矛盾的 因为由定义 dL h( x ), g( x ) 是非零的r −1

因为 Span{dh, dL h,L , dL h} 的维数是r 而且 1 5

由此可见前面r-1个方程是线性的 第r个方程含有u 后面n-r个方

对于线性系统的所有设计方法现在都可以应用了 例如取 V=Kz其中

定理分布D是对合的 这就证明了条件 ii 的必要性

因此只要解得 λ (x) 就可以按以前讨论的步骤完成状态空间线性

L g λ ( x) = 0, L g L f λ ( x) = 0, L g L2f λ ( x) = (1 + x1 )(1 + x 2 )(1 + 2 x 2 ) − x3 x1

η( t ) 应服从下列微分方程 因为到目前为止 我们只知道 ξ (t ) = 0

ｚ ２ = ＣＡｘ = ｂ０ｘ ２ + ｂ１ｘ３ +L +ｂｎ −ｒ −１ｘ ｎ −ｒ +１ + ｘ ｎ −ｒ +２

因此其相对阶 r=2 为了化为正则形 取

从零动态的意义可知 y(t)=0意味着ｚ １（ｔ ）= ｚ ２（ｔ ）= ０ 所以系统的

也就是说在新坐标下 恰恰正是ｚ １ ，ｚ ２ ，L，ｚ ｒ 均为零的点集上运动

当线性子系统初始时是静止的, 即 y(0)=0, 而且在此后又没有输

的输出函数, 使系统的输出 y(t)在 t=0的所有邻域 t上与给的 ｙ Ｒ （ｔ ）精

两个子系统 对于能控的子系统总可以通过状态反馈, 使其特征值处在

4.命题4.2( 临界问题 ) 若系统的零动态在 η = ０ 处是渐近稳定的 那

这是误差e的r阶线性常微分方程 只要系数Ｃ ０ ， L ，Ｃ ｒ −１ 取得好

χ (t ) = Col ( e(t ), e(1) (t ), L , e( r −1) (t ))

y R( i ) (t ) = CAiζ + CAi −1Bw + L + CBw( i −1)

因此可以看出在控制 u(t)中包含 ξ ,η ,ζ 还有 w(t)的各阶导数 如果

当 C 0 , L , C r −1 选得恰当时 误差及其各阶导数将收敛到零 即意味

通过选择 C 0 , L , C r −1 使系统满足一些附加的特性 具有一

∂ ( g ( x)h( x)) ∂g ( x) ∂h( x)

对线性系统来说 如果相对阶为 1 则意味着 G (s ) 的分子与分母的阶

3.推广 相对阶 r > 1 时的情况

第一章微分几何基础 ..........................................................................1

第二章李导数李括号运算与分布 ........................................................19

第三章反馈线性化的初等理论 ............................................................29

第四章反馈线性化原理的应用 ............................................................55

它可以看作是一种从 R 到 R 的对应关系定义了上述距离 ρ n 1

显然 ρ 满足性质 1 2 3 证明性质 3 时可根据 n 维欧氏空间 R n

和是等价的范数那末在范数的意义下的收敛性与在范数

意义下的收敛性也是相同的对任一线性空间来说如果它装备了

两个以上的范数我们不能断定它们一定是等价的但是对于欧氏空

每一点可微就称 f 在 D 内可微又称 f 是 D 内的可微映射

设 x = ϕ d ( P), x = ( x1 , x2 ...xn ) 是 P 的局部坐标如果 f o ϕ d−1 在 x 处可

点求曲线在点 P 处的切线实际上求切线与求导数是密切相关的

(∆1 I ∆ 2 )(x ) =∆1(x ) = ∆ 2(x ) = span  若 x1 = 0 所以

若 ω 1, ω 2, K, ωd 表示一组行向量场即协向量场则协分布表示为

空间即它是 ∆(x ) 的正交补 ( ) ∗

式中 ω ∗ , υ 表示行向量 *与列向量的内积

充分性充分性可以从构造上来证明即若条件满足,偏微分方

∴我们可以看到在ｘ０为任意值时其邻域上均有

若ＣＡ０Ｂ = ０而ＣＡＢ ≠ ０ r-1=1 r=2 此时分母与分子阶次差

若 CA 0 B = 0, ⋅ ⋅ ⋅ , CA k B = 0 ( k < r − 1) 而ＣＡｒ −１Ｂ ≠ ０相对阶为r

这后面的 n-r 个函数在满足在ｘ０处有一个非奇异的雅可比

定理1.4: 假设系统在ｘｏ处有相对阶r 且r是严格小于n的则取

量但这是矛盾的因为由定义 dL h( x ), g( x ) 是非零的r −1

由此可见前面r-1个方程是线性的第r个方程含有u 后面n-r个方

对于线性系统的所有设计方法现在都可以应用了例如取 V=Kz其中

定理分布D是对合的这就证明了条件 ii 的必要性

η( t ) 应服从下列微分方程因为到目前为止我们只知道 ξ (t ) = 0

ｚ２ = ＣＡｘ = ｂ０ｘ２ + ｂ１ｘ３ +L +ｂｎ −ｒ −１ｘｎ −ｒ +１ + ｘｎ −ｒ +２

因此其相对阶 r=2 为了化为正则形取

从零动态的意义可知 y(t)=0意味着ｚ１（ｔ）= ｚ２（ｔ）= ０所以系统的

也就是说在新坐标下恰恰正是ｚ１，ｚ２，L，ｚｒ均为零的点集上运动

的输出函数, 使系统的输出 y(t)在 t=0的所有邻域 t上与给的ｙＲ（ｔ）精

两个子系统对于能控的子系统总可以通过状态反馈, 使其特征值处在

4.命题4.2( 临界问题 ) 若系统的零动态在 η = ０处是渐近稳定的那

这是误差e的r阶线性常微分方程只要系数Ｃ０， L ，Ｃｒ −１取得好

因此可以看出在控制 u(t)中包含 ξ ,η ,ζ 还有 w(t)的各阶导数如果

当 C 0 , L , C r −1 选得恰当时误差及其各阶导数将收敛到零即意味

通过选择 C 0 , L , C r −1 使系统满足一些附加的特性具有一

对线性系统来说如果相对阶为 1 则意味着 G (s ) 的分子与分母的阶

3.推广相对阶 r > 1 时的情况

则由所有包含 ∆ 的对合分布族 ∆ １，∆ ２， L 的交可以得到一个包

这可以用反证法因为假若上述结论是错的那么非零向量ｄλ（ｘ）

( A ,C )是能观测对ｋ（⋅ ）是 n 维时变函数的向量则可构成这样的

这是线性的又因( A ,C )是能观对故可通过 n 维实数向量 G 使

在实践中机械的运动往往用一个长轴或传送带来传动或者用

因为有Ｃｏｓ０ = １所以ｆ（ｘ）= ０与ｘ２ = ０是不协调的也就是说不加

即行向量不是零向量否则矩阵 A( x o ) 就是奇异的了所以对某个 y i 来

当 r 严格小于 n 时总可以找到另外 n − r 个函数 φ r +1 ( x)...φ n ( x) 使得

在 x 0 处的雅可比矩阵是非奇异的则 φ (x) 就有资格作坐标变换一般

若分布 G = Span{g1 ,..., g m } 是对合的又由此可得 φ i (x) 满足