Professional Documents
Culture Documents
5.7
• 线 性 二 次 型 最 优 控 制 问 题 , 一 般 也 称 做 LQ或
Q或 LQR
Q
(Linear Quadratic Regulator)问题,在最优控制理
论与方法体系中具有非常重要的地位。
论与方法体系中具有非常重要的地位
• 线性二次型最优控制问题的重要性在于其具有如下特
点:
① 对于用线性微分或线性差分方程描述的动态系统,最优控制
指标具有非常明确、实际的物理意义;
② 在系统设计技术上做到规范化,具有统一的解析解形式;
③ 构成反馈控制形式,可以得到线性反馈控制的最优解;
④ 在工程实现上使实时控制计算工作大为简化。
实 实 算 作
• LQR方法因此成为应用最为广泛的一种最优控制算法 。
5.7.1 线性二次型最优控制问题
线性 次 最优控制问题
(1) 问题提法
给定线性时变系统的状态方程和输出方程
x ( t ) A( t ) x( t ) B( t )u( t )
y( t ) C ( t ) x( t )
其中 x( t ) R , u( t ) R , y( t ) R ,A(t)、B(t)、C(t)分别是n ╳ n、n
n m l
╳ m和l ╳ n维时变系统矩阵、增益矩阵和输出矩阵。
假定0≤l≤m≤n,且控制变量u(t)不受限制。用yr(t)表示期望输出向
量 yr ( tt)) R ,有误差向量
l
量, 有误差向量
e( t ) y r ( t ) y ( t )
二次型最优控制要解决的问题是,选择最优控制u*(t),使二次型 ()
性能指标
1 T 1 tf T
J ( u) e ( t f )Fe( t f ) [e ( t )Q( t )e( t ) u T ( t ) R( t )u( t )]dt
2 2 t0
最小。这就是LQR问题。
二次型性能指标
1 T 1 tf T
J ( u) e ( t f )Fe( t f ) [e ( t )Q( t )e( t ) u T ( t ) R( t )u( t )]dt
2 2 t0
中,F、Q、R为加权矩阵,其中:
F为 l ╳ l 维非负定(半正定)常数矩阵,
Q(t)为l ╳ l 维非负定(半正定)矩阵,
维非负定(半正定)矩阵
R(t)为m ╳ m维正定矩阵。
• 矩阵正定与非负定(半正定)的定义分别为:
矩阵 定与非负定 半 定 的定义分别为
正定矩阵:如果对n╳n维方阵A,任意n╳1维列向量x,均有二
次型 x Ax 0 ,则A为正定矩阵;
T
非负定(半正定)矩阵:如果对n ╳ n维方阵A,任意n ╳ 1维
列向量x,均有二次型 x Ax 0 ,则 A为非负定(半正定)矩
T
阵。
(2) 性能指标的物理意义
将性能指标表示为
1 1 tf
J ( u) e T ( t f )Fe( t f ) [ Le Lu ]dt
2 2 t0
其中
Le e T ( t )Q( t )e( t ) 为衡量系统控制误差大小的代价函数,当系统
为单输出,即e(t)为数量函数时,1 tf
e 2 ( tt))dt 即为经典控制中的动态误
2
t0
差平方积分;
Lu u T ( t ) R ( t ) u( t )为衡量控制功率
为衡量控制功率(积分后即为能量)大小的
积分后即为能量 大小的
代价函数,若u(t)表示电流或电压时,则u2(t)正比于电功率;
e T ( t f )Fe( t f ) 是要使末值时刻误差最小。
• 二次型性能指标的物理意义:用尽可能小的控制能量,来保持尽量小
的输出误差,以达到控制能量和输出误差综合最优的目的。
(3) 加权矩阵F、Q、R的选取
• F、Q、R的选取对二次型性能指标的取值、特别是对各个误差分量
和控制分量的影响至关重要,一般遵循下列原则:
一般取为对角线矩阵,其对角线元素的大小由各个分量的重要性
决定。对重要性高的分量,其对应系数矩阵对角线元素的取值相
对较大;反之 则取较小值
对较大;反之,则取较小值。
若要减少各分量间的关联耦合作用,加权矩阵可不为对角线矩阵,
只需将对应关联分量位置的元素取为非零的正数,其大小也依对
消除各分量间关联的重视程度而定 即最优性能指标也可以用于
消除各分量间关联的重视程度而定,即最优性能指标也可以用于
解耦控制设计。
Q Q( ) ()
当Q、R取为时变矩阵Q(t)和R(t)时,可以反映不同时间阶段的系
统控制要求。如当t = t0时e(t)可能很大,但此时并不反映系统的控
制性能,可以将Q(t)取得较小;当t → tf、e(t)减小时,为保证控制
系统性能,可以将Q(t)逐渐取大。
• 二次型性能指标中系数矩阵F、Q、R的选取在最优
控制理论中是受人为因素影响最大的步骤。
• 对同样的二次型最优控制问题,选取不同的F、Q、
R,则所得到的最优控制规律也将不
则所得到的最优控制规律也将不一样。
样。
• 控制规律设计(控制器综合)中人为因素总是客观
存在的
存在的。
(4) 线性二次型最优控制问题的三种类型
• 状态调节器问题
此时有C( ) = I 为单位矩阵,y
此时有C(t) 为单位矩阵 r(t)
( ) = 0,即有
0 即有
x(t) = -e(t)
• 输出调节器问题
此时有yr(t) = 0,即有
y(t) = -e(t)
• 跟踪问题
此时yr(t) ≠ 0, e(t) = yr(t) - y(t)
• 三种类型中,状态调节器问题是最基本的线性二次
型最优控制问题,输出调节器和跟踪问题均可视为
状态调节器问题的扩展。
状态调节器问题的扩展
5.7.2 状态调节器问题—Riccati方程
(1) 问题描述
• 设线性时变系统的状态方程为
x ( t ) A( t ) x( t ) B( t )u( t ) (1)
其中,x( t ) R n , u( t ) R m,A(t)和B(t)分别是系统矩阵和
增益矩阵 x(t0)= x0已知,且控制变量u(t)不受约束。
增益矩阵,x(t 已知 且控制变量u(t)不受约束
状态调节器问题是要求最优控制u*(t),使二次型性
能指标
1 T 1 tf T
J ( u) x ( t f )Fx( t f ) [ x ( t )Q( t ) x( t ) u T ( t ) R( t )u( t )]dt
2 2 t0
(2)
最小。式中,满足F、Q(t)半正定,R(t)正定条件。
• 性能指标的含义:以尽量小的能量代价,使状态保持
在零值附近。
在零值附近
首先将条件极值问题转化为无条件极值问题
1 T 1 tf T
J ( u) x ( t f )Fx( t f ) [ x ( t )Q( t ) x( t ) u T ( t ) R( t )u( t )]dt
2 2 t0
12 x T Q ( t ) x u T R ( t ) u
tf dt
J (u ) 1
x T ( t f ) Fx ( t f ) T
A ( t ) x B ( t ) u x
2 t0
H ( x , u , , t ) x d t
tf
1
2 x T ( t f ) Fx ( t f ) T
t0
tf d T T
1
2 x ( t f ) Fx ( t f ) H ( x , u , , t )
T
x x d t
t0
dt
1
2 x T ( t f ) Fx ( t f ) T ( t f ) x ( t f ) T ( t 0 ) x ( t 0 )
x d t
tf
T
H ( x , u , , t )
t0
据变分法知,J(u)取极小值的必要条件为 J(u*) 0
引入Hamilton函数
1 T 1
H x ( t )Q( t ) x( t ) u T ( t ) R( t )u( t ) T [ A( t ) x( t ) B( t )u( t )]
2 2 (3)
H
因u(t)不受约束,所以沿最优轨线有 0,
H
H u( t )
即 R( t )u( t ) B ( t ) ( t ) 0
T
(4)
u( t )
由此可得
u( t ) R 1 ( t ) B T ( t ) ( t ) (5)
由横截条件
1 T
(t f ) [ x ( t f )Fx( t f )] Fx( t f ) (10)
x ( t f ) 2
用Ω(t,t0)表示方程组(9)的2n╳2n维转移矩阵,用λ(t0)表示待
定的协态变量初值,则方程组(9)的解可以表示为
x( t ) x( t 0 )
( t ) ( t , t 0 ) ( t ) (11)
0
在终端时刻有
x( t f ) x( t )
( t f , t ) (12)
( t
f ) ( t )
将Ω(tf ,t)划分为4个n╳n维子矩阵,即
11 ( t f , t ) 12 ( t f , t )
( t f , t ) (13)
(
21 f t , t ) 22 ( t f , t )
则(12)式可写为
x ( t f ) 11 ( t f , t ) x ( t ) 12 ( t f , t ) ( t ) (14)
( t f ) 21 ( t f , t ) x( t ) 22 ( t f , t ) ( t ) (15)
Ω11(t
( f ,tf)=Ω ) Ω22(t ( f ,tf)=I) In n ,Ω
╳ Ω12(t
( f ,tf)=Ω
) Ω21(t
( f ,tf)=0
) 0
可求得
P(tf) )= F (18)
为避免求逆运算,对(17)式求导,有
( t ) P ( t ) x( t ) P ( t ) x ( t ) (19)
将系统状态方程
x ( t ) A( t ) x ( t ) B( t )u( t ) A( t ) x ( t ) S ( t ) ( t )
A( t ) x ( t ) S ( t ) P ( t ) x ( t ) (20)
代入(19)式,有
( t ) [ P ( t ) P ( t ) A( t ) P ( t ) S ( t ) P ( t )]x( t ) (21)
由协态方程( )式及( )式 又有
由协态方程(6)式及(17)式,又有
(t ) [Q( t ) AT (t ) P ( t )]x( t ) (22)
综合上两式,并考虑 x(t) 任意,有
P ( t ) P ( t ) A( t ) P ( t ) S ( t ) P ( t ) AT ( t ) P ( t ) Q( t ) 0
1
(23)
将 S ( t ) B( t ) R ( t ) B ( t )代
T
代入,整理得
得
P ( t ) P ( t ) A( t ) P ( t ) B( t ) R 1 ( t ) B T ( t ) P ( t ) AT ( t ) P ( t ) Q( t )
(24)
此式即为解二次型最优控制问题著名的黎卡提(Riccati)
型矩阵微分方程,一般简称为黎卡提(Riccati)方程。
结合(5)和(17)式即可得到最优控制的状态反馈形式
u* ( t ) R 1 ( t ) B Τ ( t ) P ( t ) x ( t ) K ( t ) x ( t ) (25)
其中 K ( t ) R 1 ( t ) B Τ ( t ) P ( t ) 为反馈增益矩阵。
为反馈增益矩阵
• 可以证明(25)式是状态调节器问题最优控制的充分必要并
且是唯一的条件。
# 充分条件的证明:
考虑二次型 x T ( t ) P ( t ) x( t ) ,将其对 t 求导得
d T
[ x ( t ) P ( t ) x( t )] x T ( t ) P ( t ) x( t ) x T ( t ) P ( t ) x( t ) x T ( t ) P ( t ) x ( t )
dt (26)
将状态方程(1)式和黎卡提方程(24)式代入,经配方整理可得
将状态方程(1)式和黎卡提方程(24)式代入 经配方整理可得
d T
[ x ( t ) P ( t ) x ( t )] [ x T ( t )Q ( t ) x ( t ) u T ( t ) R( t )u( t )]
dt
[u( t ) R -1 ( t ) B T ( t ) P ( t ) x ( t )]T R( t )[u( t ) R -1 ( t ) B T ( t ) P ( t ) x ( t )]
(27)
对上式两边由t0到tf 积分,经整理得
tf
x ( t f )Fx ( t f ) [ x T ( t )Q( t ) x ( t ) u T ( t ) R( t )u( t )] x T ( t 0 ) P ( t 0 ) x ( t 0 )
T
t0
tf
{[u( t ) R -1 ( t ) B T ( t ) P ( t ) x ( t )]T R( t )[u( t ) R -1 ( t ) B T ( t ) P ( t ) x ( t )]}dt
t0
((28))
上式左边乘以1/2即为性能指标(2)式的右边 也即有
上式左边乘以1/2即为性能指标(2)式的右边,也即有
1 T
J ( u) x ( t 0 ) P ( t 0 ) x( t 0 )
2
1 tf
{[u( t ) R -1 ( t ) B T ( t ) P ( t ) x( t )]T R( t )[u( t ) R -1 ( t ) B T ( t ) P ( t ) x( t )]}dt
2 t0
(29)
1
当 u( t ) R ( t ) B ( t ) P ( t ) x( t ) K ( t ) x( t ) 时,J(u)取极小值
T
时 J(u)取极小值
1
J * ( u) x T ( t 0 ) P ( t 0 ) x ( t 0 ) (30)
2
因而充分条件得证。#
由此可得状态调节器问题最优性能指标的一般结论,即:从任一x(t)
开始考虑最优控制问题,均有
1
J * ( u) V [ x , t ] x T ( t ) P ( t ) x ( t ) (31)
2
将状态方程、最优控制规律以及协态变量与状态变量关
系综合,可给出如图所示状态调节器问题最优控制的闭
环系统框图。
u(t) x(t)
(t)
R 1 ( t ) B T ( t ) x ( t ) A( t ) x( t ) B( t )u( t )
λ(t)
P(t)
状态调节器最优控制闭环系统
(3) 有关求解黎卡提方程的若干问题
I. 所求解的黎卡提方程及边界条件分别为(24)式和(18);
II 有限时域二次型最优控制问题的黎卡提方程为非线性
II.
微分方程,一般难于得到解析解,多通过计算机数值
迭代算法求近似解;
III. 黎卡提方程的解P(t)为n╳n维对称正定矩阵,这是由于
黎卡提方程本身的对称性决定的(前提为Q(t)和R(t)均
为对称矩阵),所以只需求解n(n+1)/2个独立微分方程;
IV. P(t)与状态x(t)无关,可以离线计算;
V. 当tf有限时,即使A、B、Q、R均为常数矩阵,黎卡提
方程的解P(t)也是时变的。
5 7 3 无限时域线性定常系统状态调节器问题
5.7.3
• 前面给出的状态调节器问题考虑的是有限时域、即 tf有
限时的黎卡提方程求解问题。存在以下问题:
即使是一个非常简单的二阶定常系统,所得到的黎
卡提方程也是非线性微分方程 很难求得解析解
卡提方程也是非线性微分方程,很难求得解析解;
在实际应用中,特别是定值过程控制场合,控制系
统在 续 行时要将时域划分为有限 间再去确定
统在连续运行时要将时域划分为有限区间再去确定
最优控制参数也是十分困难的;
时变的黎卡提方程解P(t)在工程实现上也极不方便。
• 针对上述问题,无限时域状态调节器是一种有效的解
针对上述问题 无 时域状态 节 是 种有效的解
决方案。
(1) 无限时域线性定常系统状态调节器
给定线性定常系统状态方程
x ( t ) Ax( t ) Bu( t ), x( t 0 ) x0 (1)
其中, x( t ) R n , u( t ) R m,A和B分别是n╳n和n╳m维常数系统矩阵
和增益矩阵,控制变量u(t)不受约束。
考虑无限时域二次型性能指标
1 T
J [ x ( t )Qx( t ) u T ( t ) Ru( t )]dt (2)
2 0
t
上式也可表示为有限时域性能指标取极限的形式,即
1 tf T
J lim [ x ( t )Qx( t ) u T ( t ) Ru( t )]dt lim J t f
t f 2 t0 t f
(3)
所以可以直接应用有限时域性能指标状态调节器结果。
由于在(3)式中使 J t f 取极小值的最优控制为
u * ( t ) R 1 B T P ( t ) x ( t )
(4)
其中P(t)为黎卡提微分方程
P ( t ) P ( t ) A P ( t ) BR 1 B T P ( t ) AT P ( t ) Q (5)
的正定对称解。
可以证明,当系统(1)完全可控时,存在常数阵 P ,使
lim P ( t ) P , 0 t t f 成立。 而当t <<∞时,P ( t ) 0 ,即 P ( t ) 0
t f
因此 当 t f 时,黎卡提微分方程转化为黎卡提代数方程,即有
因此,当 时 黎卡提微分方程转化为黎卡提代数方程 即有
P A P BR 1 B T P AT P Q 0 (8)
P 为上式的对称正定解。此时,最优控制存在且唯一,为
为上式的对称正定解 此时 最优控制存在且唯一 为
u * ( t ) R 1 B T P x ( t ) (9)
而最优状态 *( )则为下列线性定常齐次方程的解
而最优状态x*(t)则为下列线性定常齐次方程的解
x * ( t ) [ A BR 1 B T P ] x( t ) Ac x( t ), x ( t 0 ) x0 (10)
(2) 有关讨论
• 无限时域线性定常系统状态调节器与有限时域一般线性系统状态
调节器相比的区别在于:
要求系统(1)完全可控,从而可以保证使每一个状态都趋于零,
从而保证当tf →∞时性能指标有限;
最优控制系统是稳定系统,亦即(10)式中矩阵Ac的所有特征
根都必须具有负实部。否则,不具有负实部的特征根所对应的
状态将不趋于零,因而性能指标将趋于无穷大;
要求F = 0,因为所关心的只是在有限时域内的响应,对 tf →∞
的终端代价无实际意义。
5.7.4 输出调节器问题
以状态调节器这一最基本的线性二次型最优控制问题为基础讨论
输出调节器问题。
(1) 输出调节器问题
考虑线性定常系统的状态方程和输出方程
x (t ) Ax(t ) Bu(t ) (1)
y ( t ) Cx ( t ) (2)
及二次型性能指标
1 T 1 tf T
J y ( t f )Fy ( t f ) [ y ( t )Qy( t ) u T ( t ) Ru( t )]dt (3)
2 2 t0
其中,A、B、C分别是n╳n、n╳m和l╳n维常数系统矩阵、增益矩
阵和输出矩阵 控制变量 ( )不受约束 F Q非负定(半正定)
阵和输出矩阵,控制变量u(t)不受约束;F、Q非负定(半正定),
R正定。
假定系统完全可观,要求最优控制u (t),使J最小。
假定系统完全可观,要求最优控制u*(t),使J最小。
将 y ( t ) Cx
C ( t ) 代入J,有
代入J 有
1 T 1 tf
J x ( t f )C T FCx ( t f ) [ x T ( t )C T QCx ( t ) u T ( t ) Ru( t )]dt
2 2 t0
(4)
)
• 可以证明,若系统可观,F、Q都为半正定时,则CTFC和CTQC也都
为半正定。
• 这样,输出调节器问题即可转化为等效的状态调节器问题,可以应
这样 输出调节器问题即可转化为等效的状态调节器问题 可以应
用状态调节器问题的解法求解输出调节器问题。
(2) 有限时域输出调节器问题
此时,tf有限,F、Q半正定,R正定。
与有限时域状态调节器问题类似有 u * ( t ) R 1 B T P ( t ) x( t ) 存在且
唯一。
其中n╳n维矩阵P(t)为黎卡提矩阵微分方程
P ( t ) P ( t ) A P ( t ) BR 1 B T P ( t ) AT P ( t ) C T QC
P ( t f ) C T FC
的对称正定解。
注意:u*(t)是x(t)的函数而不是y(t)的函数,系统不可观则无法实现反
注意:u*(t)是x(t)的函数而不是y(t)的函数 系统不可观则无法实现反
馈最优控制!
u(t)
R B 1 T
x ( t ) Ax ( t ) Bu( t ) C
y(t)
x(t)
λ(t)
P(t) 状态观测器
xˆ ( t )
输出调节器最优控制闭环系统
(3) 无限时域输出调节器问题
此时tf→∞,且F
且F = 0,系统完全可控可观,
0 系统完全可控可观 Q半正定,R正定。
Q半正定 R正定
类似于无限时域状态调节器,有
u * ( t ) R 1 B T P x ( t )
存在且唯一。
其中n╳n维矩阵 P 为黎卡提矩阵代数方程
P A P BR 1 B T P AT P C T QC 0
的对称正定解。
5 7 5 跟踪问题(伺服(servo)问题)
5.7.5
(1) 问题描述
考虑线性可观系统
x (t ) Ax(t ) Bu(t ), x(t0 ) x0 (1)
y ( t ) Cx ( t ) , yr (t ) 为预期输出 (2)
及二次型性能指标
次 性能指标
1 tf
J {[ yr ( t ) y( t )]T Q[ yr ( t ) y( t )] u T ( t ) Ru( t )}dt
2 t0 (3)
其中,A、B、C分别是n╳n、n╳m和l ╳n维常数系统矩阵增益矩阵
和输出矩阵,控制变量u(t)不受约束; Q非负定(半正定),R正
定;系统完全可观。
定;系统完全可观
要求u*(t),使J达最小值
(2) 问题求解
考虑Hamilton函数
1
H {[ yr ( t ) y( t )]T Q[ yr ( t ) y( t )] u T ( t ) Ru( t )}
2
T ( t ) Ax( t ) T ( t ) Bu( t ) (4)
由于u(t)不受约束,有
H (5)
Ru( t ) B T ( t ) 0
u
则 u * (t ) R B (t )
1 T
(6)
2
又由于 H2 R 0,所以u*(t)是使H和J达到最小值的最优控
u
制
制。
由输出方程及H,可得协态方程为
H
( t ) C TQ[Cx ( t ) y r ( t )] AT ( t ) (7)
x
由于无终端性能指标及约束,即x(tf)自由,所以有
(t f ) 0 (8)
x ( t f )
将(6)式代入状态方程(1)式,并结合(7)和(8)式,则规范方程组可
表示为
x ( t ) Ax ( t ) BR 1 B T ( t ), x( t 0 ) x0 (9)
(t ) C TQCx
QC (t ) A (t ) C TQy ) (t f ) 0
Q r (t ), (10)
与状态调节器问题的规范方程组相比,(10)式中多了一项反映预
T
期输出的 C Qyr ((t ) 而成为非齐次微分方程。假设其解为
(t ) P (t ) x(t ) (t ) (11)
其中P(t)为待定的n╳n维矩阵、ζ(t)为待定的 n维向量。
对上式两边求导得
( t ) P ( t ) x( t ) P ( t ) x ( t ) ( t ) (12)
结合前面有关各式,消去 ( t ), ( t ), x ( t ) 后整理得
T
[ P ( t ) P ( t ) A A P ( t ) P ( t ) BR 1 B P ( t ) C QC ] x( t )
T
( t ) A ( t ) P ( t ) BR 1 B ( t ) C Qy ( t ) (13)
r
T
P ( t ) P ( t ) A A P ( t ) P ( t ) BR 1 B P ( t ) C Q
QC 0 (14)
T
T
( t ) A ( t ) P ( t ) BR 1 B ( t ) C Qy r ( t ) 0 (15)
或表示为
T
T
P ( t ) P ( t ) A A P ( t ) P ( t ) BR 1 B P ( t ) C QC (16)
T
( t ) A ( t ) P ( t ) BR 1 B ( t ) C Qy ( t ) r
(17)
由于 ( t f ) P ( t f ) x ( t f ) ( t f ) 0 ,且x(tf)任意,所以有
P ( t f ) 0, ( t f ) 0 (18)
求方程组(16)、(17)满足边界条件(18)的解, 即可得最优控制为
u * ( t ) R 1 B T [ P ( t ) x( t ) ( t )] (19)
R 1 B T P ( t ) x ( t ) R 1 B T ( t )
T
P A A P P BR 1 B P C Q QC 0 (20)
T
T
( t ) [ P BR 1 B A] ( t ) C Qy ( t ) r
(21)
的解。
5 7 6 具有指定稳定度的最优调节器问题
5.7.6
(1) 渐近稳定性概念
个系统 x ( t ) Ax( t ) Bu( t ) 是渐近稳定的,是指微分方程
一个系统 是渐近稳定的 是指微分方程
x ( t ) Ax( t ), x( t 0 ) x0 , t t 0
的解 x(t) 对于任意的 x0 都有 lim x ( t ) 0 。
t
前面讨论的无限时间调节器都是渐近稳定的,但均未考虑 x(t)→0的
速度,即衰减速度问题。衰减速度越快,则稳定性越好。
。
(2)具有指定稳定度的最优调节器
首先给 稳定度含义
首先给出稳定度含义:对于一个渐近稳定系统,稳定度
个 稳定 稳定度α>0,是表
示 x(t)→0 的衰减速度不低于 e t 的数量级。
以下以无限时域状态调节器为例进行讨论。
考虑系统状态方程为
x ( t ) Ax( t ) Bu( t )
(1)
x ( t 0 ) x0
其中 x ( t ) R n , u( t ) R m ,A和B分别是 n╳n 和 n╳m 维常数系统
其中,
矩阵和增益矩阵,系统完全可控,且控制变量u(t)不受约束。
考虑指定的稳定度α>0,性能指标为 性能指标为
1 2 t T
J e [ x ( t )Qx( t ) u T ( t ) Ru( t )]dt (2)
2 t0
其中Q半正定,
半正定 R正定。要求最优控制
正定 要求最优控制u*(t),使
使J达最小值。此问题
达最小值 此问题
也称为改进的最优状态调节器问题。
令 x~ ( t ) e t x( t )
~ ( t ) e t u( t ) (3)
u
则有 x( t ) e t x~ ( t ) (4)
~(t )
u( t ) e t u
并有
x ( t ) e t x~ ( t ) e t x~ ( t ) (5)
将(4)、 (5)式代入状态方程(1)式,可得
x~ ( t ) ( A I ) x~ ( t ) Bu
~(t )
(6)
将(4)式代入性能指标,得
1 ~T
J [ x ( t )Qx~(t ) u
~ T ( t ) Ru
~( t )]dt (7)
2 t0
(6)和(7)为规范的最优状态调节器问题。
如果(A,B)完全可控,则(
可以证明,如果(
可以证明 )完全可控 则(A+αI,B)完全可控。因此,
)完全可控 因此
对于系统(6),使性能指标(7)达到最小值的最优控制作用为
~ * ( t ) R 1 B T P x~ ( t )
u (8)
其中 P 为黎卡提代数方程
( A I )T P P ( A I ) P BR 1 B T P Q 0 (9)
的对称正定解。
由(3)、(4)式可知,对于原系统,最优控制为
~ * ( t ) R 1 B T P e t x~ ( t ) R 1 B T P x( t )
u * ( t ) e t u (10)
最优轨线为
x * ( t ) e t x~ * ( t )
由于 lim x~ * ( t ) 0 ,而 lim x * ( t ) lim e t x~ * ( t )
t t t
所以 x* (t ) 比 x ~* (t
(t ) 衰减更快,即在最优控制(10)的作用下,闭环控制
1 T
系统 x ( t ) [ A R B P ] x( t ) 具有指定的稳定度α >0。
其中S为半正定对称常数阵,Q(k)为半正定对称时变阵,R(k)为正定
对称时变阵
对称时变阵。
要求最优控制序列 u* (k ), k=0,1,···, N-1,使J达最小值。
利用离散极大值原理求解
利用离散极大值原理求解:
Hamilton函数
H (k )
2
1 T
x ( k )Q( k ) x( k ) u T ( k ) R( k )u( k ) T ( k 1)F ( k ) x( k ) G ( k )u( k )
(4)
协态方程
H ( k ) (6)
(k ) Q ( k ) x ( k ) F T ( k ) ( k 1)
x ( k )
因终态无约束,所以
( N ) Sx ( N ) (7)
由控制方程
H ( k ) (8)
R( k )u( k ) G T ( k ) ( k 1) 0
u( k )
有
u( k ) R 1 (k )G T ( k ) ( k 1) (9)
代入((1))式得两点边值问题(规范方程组)
x ( k 1) F ( k ) x ( k ) G ( k ) R 1 ( k )G T ( k ) ( k 1)
( k ) Q( k ) x( k ) F T ( k ) ( k 1)
(10)
x ( 0) x 0
( N ) Sx ( N )
假设 ( k ) P ( k ) x ( k ) (11)
代入规范方程组得
x( k 1) F ( k ) x( k ) G( k ) R 1 ( k )G T ( k ) P ( k 1) x( k 1) (12)
P ( k ) x( k ) Q( k ) x( k ) F T ( k ) P ( k 1) x( k 1) (13)
消去其中x(k+1),得
1
P ( k ) x ( k ) Q ( k ) x ( k ) F T ( k ) P ( k 1) I G ( k ) R 1 ( k )G T ( k ) P ( k 1) F ( k ) x ( k )
((14))
此式对任意x(k)成立,因此得离散黎卡提方程:
P ( k ) Q ( k ) F T ( k ) P ( k 1) I G ( k ) R 1 ( k )G T ( k ) P ( k 1) 1
F (k )
Q ( k ) F T ( k ) P 1 ( k 1) G ( k ) R 1 ( k )G T ( k )
1
F (k ) (15)
及其终值条件
P( N ) S (16)
若F 1 (k
( k ) 存在(事实上可以放宽,但要使用动态规划求解),则由协
存在(事实上可以放宽 但要使用动态规划求解) 则由协
态方程
( k ) P (k ) x( k ) Q(k ) x(k ) F T ( k ) ( k 1) (17)
有
( k 1) F T ( k )P ( k ) Q( k )x( k ) (18)
则最优控制为
u* ( k ) R 1 ( k )G T ( k )F T ( k )P ( k ) Q( k )x( k ) K ( k ) x( k ) (19)
为状态反馈控制,其中
K ( k ) R 1 ( k )G T ( k )F T ( k )P ( k ) Q( k ) (20)
为反馈增益矩阵。
由以上结果,离散线性二次型最优状态调节器状态反馈的闭环系
由以上结果 离散线性二次型最优状态调节器状态反馈的闭环系
统构成可表示为
u(k) +
x(k+1) x(k)
G(k) z -11I
+
F(k)
与连续系统二次型最优控制相似,如果 N , F ( k ) = F 和
G ( k ) = G 均为常数矩阵,系统完全可控,则也应有黎卡提方程的
均为常数矩阵 系统完全可控 则也应有黎卡提方程的
解 P ( k ) P (当k<<N时)为常数矩阵。
以离散线性二次型最优状态调节器为基础,同样可以得到离散线
性二次型最优输出调节器和跟踪问题的解。