Professional Documents
Culture Documents
Giảng viên:
Giả iê PGS.
PGS TS.
TS Huỳnh
H ỳ h Thái Hoàng
H à
Bộ môn Điều Khiển Tự Động
Khoa Điện – Điện Tử
Đại học Bách Khoa TP
TP.HCM
HCM
Email: hthoang@hcmut.edu.vn
Homepage: http://www4.hcmut.edu.vn/~hthoang/
ĐIỀU
Ề KHIỂN
Ể TỐI
Ố ƯU
Có nhiều
hiề bài ttoán
á điều
điề khiển
khiể tối ưu, tù
tùy th
theo:
Loại đối tượng điều khiển
Miền thời gian liên tục hay rời rạc
Chỉ tiêu chất lượng
Bài toán tối ưu có ràng buộc hay không
ĐK tối ưu tĩnh: chỉ tiêu chất lượng không phụ thuộc thời
gian
ĐK tối ưu động: chỉ tiêu chất lượng phụ thuộc thời gian
Bài toán chỉnh toàn phương tuyến tính (Linear
Quadractic Regulator – LQR)
Bài toán điều khiển tối ưu H2
…
250
200
150
L 100
50
-50 u* 4
6 2
4 2 0
0
u2
-2 -4 -6 -4
4
-2
u1
x x
Viết gọ ạ Lx f x
gọn lại: T 1
H x ( x , u) Lx ( x, u) T f x ( x , u) 0
H u ( x, u) Lu ( x, u) f u ( x , u) 0
T
H ( x , u) f ( x , u) 0
trong đó: H ( x , u) L( x , u) T f ( x, u)
Tì cực trị
Tìm hà L(u) 5u12 2u22 2u1u 2 8u1 3u2
t ị hàm:
Với điều kiện ràng buộc:
f (u) u1 6u2 2 0
Giải:
Hàm
Hà H Hamilton:
il
H ( u) L ( u ) f ( u) T
250
200
150
L 100
50
-50
u* 4
6 2
4 2 0
0
u2
-2 -4 -6 -4
4
-2
u1
Tì cực trị
Tìm hà L( x, u ) ( x 2) (u 2)
t ị hàm: 2 2
Hà Hamilton:
Hàm H ilt
H ( x, u ) L( x, u ) T f ( x, u )
H ( x, u ) ( x 2) 2 (u 2) 2 ( x 2 3 x 6 u )
Giải hệ phương
h trình,
ì h ta được
đ b
ba nghiệm:
hiệ
( x, u ) (4.53;0.92), (1.71;2.04), (1.68;8.22)
Thay 3 nghiệm trên vào L( x , u ) ( x 2) (u 2) , ta được
2 2
các giá trị tương ứng là: 43.78; 0.087; 117.94.
* 2* ) (1.71
Kết
ế luận: cực trị cần ( x, u ) ( x 2) (u 2) 2 ;2.04
ầ Htìm là ( x , u ( x 2) 3x 6 u )
15 January 2014 © H. T. Hoàng - HCMUT 22
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Tìm cực trị có ràng buộc – Thí dụ 3
Tì cực trị
Tìm hà L( x , u ) x 3 x u
t ị hàm: 2
1
2
2
2
H ( x , u ) L( x , u ) f ( x , u )
T
H ( x , u ) x12 3 x22 u 2 1 (2 x1 x2 4) 2 ( x1 u 2)
Do L( x , u ) x 3 x u 2
1
2
2
2
là hàm toàn p phương g nên
cực trị tìm được
H ( x , u )ở
xtrên
2
1 3 cũng
x 2
2 u 2
1 (2 x1 là
chính xcực 2 ( x1 u 2)
2 4)tiểu
x (t ) x * (t )
15 January 2014 © H. T. Hoàng - HCMUT 26
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Tìm cực trị phiếm hàm?
Nhắc lại cực trị hàm:
Điều kiện cần: đạo hàm bậc 1 của hàm cần tìm cực trị
bằng 0
điểm dừng
Điểm dừng g có đạo
ạ hàm bậc
ậ 2 xác định
ị dương g
điểm cực tiểu
Cực trị phiếm hàm?
Khái niệm biến phân (variation): có thể hiểu là “đạo
hàm của p phiếm hàm”
Phương pháp biến phân (Calculus of Variation): dựa
vào khái niệm biến phân đưa ra điều kiện cực trị của
phiếm
ế hàm tương tự như điềuề kiện cực trị hàm
15 January 2014 © H. T. Hoàng - HCMUT 27
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Khái niệm biến phân
L
Lượng gia
i của
ủ phiếm hàm: J ( x ) J ( x x ) J ( x )
hiế hà
x (t )
x (t ) x (t )
t
ế hàm: J ( x) x 2 (t )dt
Cho phiếm
0
Ch phiếm
Cho hiế hà
hàm dạng
d tích
í h phân
hâ tổng
ổ quát:
á
tf
J ( x ) L( x )dt
t0
Biến phân của phiếm hàm dạng tích phân được tính như
sau:
tf
L( x )
J ( x ) x dt
t0
x
x (t0 ) x (t f ) 0
Thực hiện biến đổi tích phân,
phân suy ra:
tf
L( x, x , t ) d L( x, x , t )
J xdt
t0
x dt x
15 January 2014 © H. T. Hoàng - HCMUT 31
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Điều kiện cần để phiếm hàm đạt cực trị cục bộ
Điều kiện cần để phiếm hàm J ( x ) đạt cực trị cục bộ
tại x * (t ) là biến phân của J ( x ) phải bằng 0 tại x * (t )
J ( x ) 0 x x *
ĐK cần để bài toán tối ưu động không ràng buộc có cực trị:
L( x, x , t ) d L( x, x , t ) L d L
0 0
x dt x x dt x
(phương trình Euler-Lagrange)
Trường hợp đặc biệt khi L không phụ thuộc tường
minh vào t, dạng đơn giản của pt Euler-Lagrange là:
t
L J L( x, x , t ) d L( x, x , t ) xdt
f
L x c (c là hằng
x
số)
dt x
x t 0
15 January 2014 © H. T. Hoàng - HCMUT 32
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Tối ưu hóa động không ràng buộc – Thí dụ 1
/2
Tìm hàm x(t) sao cho : J ( x) [ x (t ) x (t )]dt min
2 2
0
Vớii điều
điề kiện bi x(0) 1, x( / 2) 3
ki biên:
Giải:
Theo đềề bài, ta có: L x 2 x 2
Phương trình Euler-Lagrange:
L d L d
0 2 x 2 x 0 x x 0
x dt x dt
ổ quát: x(t ) C1 sin t C2 cos t
Lời giải tổng
Thay điều kiện biên, suy ra: C1 3,C 2 1
Kết luận: x * (t ) 3 sin t cos t
15 January 2014 © H. T. Hoàng - HCMUT 33
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Tối ưu hóa động không ràng buộc – Thí dụ 2
Tìm hàm x(t) sao cho phiếm hàm dưới đây đạt cực tiểu:
2
J ( x) 1 x 2 (t )dt min với ĐK biên: x(0) 1, x(2) 0
0
Giải:
L d L
Phương trình Euler-Lagrange: 0
x dt
d x
1
x 1 x 2 x xx
d x 1
x 2
0 0 x 0
dt 1 x 2
1
x 2
L : n n
f : n n p
9 2 9
Kết luận: x (t ) *
t t
32 8 x(t ) t 2 c1t c2
4
15 January 2014 © H. T. Hoàng - HCMUT 41
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Tối ưu hóa động có ràng buộc – Thí dụ 2
Tìm vector hàm x (t ) x1 (t ) x2 (t ) sao cho phiếm hàm
T
dưới đây đạt cực tiểu:
2
J ( x ) 5( x1 1) 2 x22 dt
d min
i
0
Bài toán điều khiển tối ưu: tìm tín hiệu ĐK u(t) sao cho:
tf
Nghiệm x*(t) của phương trình vi phân (*) ứng với tín hiệu
điều
ề khiển ố ưu u*(t) gọi là quỹ đạo trạng thái tối
ể tối ố ưu.
15 January 2014 © H. T. Hoàng - HCMUT 46
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Phân loại bài toán điều khiển tối ưu
Khoảng thời gian xảy ra quá trình tối ưu là tf , có thể phân loại:
Bài toán tối ưu có tf cố định, ví dụ:
Điều
Điề khiển đoàn tàutà hỏa giữa 2 ga với
ới lịch trình xác
ác
định sao cho năng lượng đoàn tàu tiêu thụ là thấp nhất;
Điều khiển quá trình chuyển đổi hóa học trong thời gian
cho trước với chi phí thấp nhất
Bài toán tối ưu có tf không cố định, ví dụ:
Điều khiển tên lửa lên độ cao xác định với thời gian
nhanh nhất
Điều khiển tàu biển đi được xa nhất với một nguồn năng
lượng cố định cho trước
J ( u) ( x (t f )) [ H ( x, u, t , ) T (t ) x ]dt
t0
(t)) đ
được Jh(u) (trình
gọii là phương [ Htrạng
xì(t fh))đồ
đồng (t ) Tthái
(t ) x ]dt
hái d
x 0
min J ( u) ( x (t f )) L( x (t ),
) u(t ),
) t )dt
u( t )
t0
Điều kiện đầu: x (t0 ) x0
Bài toán điểm cuối ràng buộc:
tf
2 20
(Đây là bài toán tối
ố ưu điểm
ể cuối
ố tự do)
trong đó là trọng số tùy chọn (muốn trạng thái cuối càng gần xf thì
chọn càng lớn)
Điều kiện đầu: x0 0; t f 1
Bước 3: Định nghĩa hàm Hamilton:
H ( x, u, , t ) L( x, u, t ) (t ) f ( x , u, t )
1 2
H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )]
2
15 January 2014 © H. T. Hoàng - HCMUT 55
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Điều khiển tối ưu – Thí dụ 1 (tt)
Bước 4: Điều kiện cần để có nghiệm tối ưu
PT trạng thái: x (t ) 2 x(t ) u (t ) (1)
H (2)
PT đồng trạng thái: (t ) (t ) 2 (t )
x
Điề kiệ
Điều kiện dừ
dừng: HH
0 u (t ) (t ) 0 (3)
u
Điề kiệ
Điều kiện đầ
đầu: x(t0 ) x0 0 (4)
(t f )
Điều kiện cuối: (t f ) (1) ( x(1) 50) ((5))
x
1 2
H ( x , u, , t ) u (t ) (t )[2 x(t ) u (t )]
2
15 January 2014 © H. T. Hoàng - HCMUT 56
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Điều khiển tối ưu – Thí dụ 1 (tt)
Bước 5: Giải phương trình vi phân
Nghiệm phương trình (2):
(t ) C1e 2t (6)
C1 2t
x(t ) e C2 e 2t
4
Kết
ế luận: Tín hiệu điều
ề khiển
ể và quỹ đạo trạng thái tối
ố ưu là:
u (t ) C1e 2t
C1 2t
x(t ) e C2 e 2t
4
x1 (t ) x 2 (t )
x (t ) 1 u(t )
2 M
x1 (t ) x2 (t )
x 2 (t ) 2u(t )
Kết
ế luận: Tín hiệu điều
ề khiển
ể tối
ố ưu là
u (t ) 60t 30
*
(7)
x2
Đoạn 2
Đoạn 3 xN
xk Đoạn 1
x0
x1
15 January 2014 © H. T. Hoàng - HCMUT 67
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Thí dụ tìm đường ngắn nhất dùng DP
Tìm đường ngắn nhất đi từ A đến J,
J cho biết mạng
lưới đường như hình vẽ.
N42
N33
N23
Ký hiệu:
*
J k ( N ki ) là khoảng cách ngắn nhất từ nút N ki đến nút đích J
g cách từ nút N ki đến nút N k 1, j
d ( N ki , N k 1, j ) là khoảng
Phương trình Bellman: J k* ( N ki ) min d ( N ki , N k 1, j ) J k*1 ( N k 1, j )
j
J1* ( N11 ) là khoảng cách ngắn
ắ nhất
ấ từ nút đầu
ầ đến
ế nút đích.
Vòng ngược:
Bước 5: bắt đầu từ nút đích J 5* ( N 51 ) 0
Bước 4: đoạn đường ngắn nhất từ nút N41 hoặc N42
đến đích:
J 4* ( N 41 ) d ( N 41 , N 51 ) J 5* ( N 51 ) 3
J 4* ( N 42 ) d ( N 42 , N 51 ) J 5* ( N 51 ) 4
15 January 2014 © H. T. Hoàng - HCMUT 72
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 3: có nhiều lựa
chọn, từ nút N3i phải
chọn
ọ đường g đi đến
đích qua nút N4j nào
tối ưu đoạn quỹ đạo
cuối
ối J 3* ( N 3i ) ?
J 3* ( N 3i ) mind ( N 3i , N 4 j ) J 4* ( N 4 j )
j
Từ nút
d ( N 3i , N 4j ) J *
4 (N4 j ) * Quyết định
J ( N 3i )
3 đi đến
N3i N 41 N 42
N 31 1+3=4 4+4=8 4 N41 (H)
N 32 6+3=9 3+4=7 7 N42 ((I))
N 33 3+3=6 3+4=7 6 N41 (H)
15 January 2014 © H. T. Hoàng - HCMUT 73
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 2: tìm đường
tối ưu từ nút N2i đến
nút đích N51 (tức nút J 3* ( N 31 ) 4
J), sử dụng kết
ế quả J 3* ( N 32 ) 7
tối ưu đoạn cuối tìm J 3* ( N 33 ) 6
được ở bước 3
J 2* ( N 2i ) mind ( N 2i , N 3 j ) J 3* ( N 3 j )
j
Từ nút
d ( N 2i , N 3 j ) J 3* ( N 3 j ) * Quyết định
J ( N 2i )
2 đi đến
N2i N 31 N 32 N 33
N 21 7+4=11 4+7=11 6+6=12 11 N 31 hoặc N 32
N 22 3+4=7 2+7=9 4+6=10 7 N 31
N 23 4+4=8 1+7=8 5+6=11 8 N 31 hoặc N 32
15 January 2014 © H. T. Hoàng - HCMUT 74
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Thí dụ tìm đường ngắn nhất dùng DP (tt)
Bước 1: tìm đường
tối ưu từ nút N11 (tức J 2* ( N 21 ) 11
nút A)) đến nút đích J 2* ( N 22 ) 7
N51 (tức nút J), sử J 2* ( N 23 ) 8
dụng kết quả tối ưu
đ
đoạn cuối
ối tì
tìm đ
được
ở bước 2
J1* ( N11 ) min d ( N11 , N 2 j ) J 2* ( N 2 j )
j
Từ d ( N11 , N 2 j ) J 2* ( N 2 j ) *
Quyết
Q ết định
J ( N11 )
1 đi đến
N 21 N 22 N 23
N11 2+11=13 4+7=11 2+8=10 10 N 23
Vò xuôi:
Vòng ôi đi từ bước
b ớ 1 đến
đế bbước
ớ 5 để rút
út ra đường
đ ờ đi tối ưu
Kết luận:
ố ưu: N11 N 23 N 31 N 41 N 51
Đường đi tối
hoặc: N11 N 23 N 32 N 42 N 51
với J N* ( x ( N )) ( N , x N )
Bước 2: Giải phương trình Bellman qua 2 vòng:
Vòng ngược: k N 1 0 tìm u ( k ) phụ thuộc x (k )
*
Thay u* (k
Tha (k ) vào
ào mô hình toán của đối ttượng
ợng để tính được
đ ợc
trạng thái tối ưu ở thời điểm (k+1)
x (k 1) f ( x (k ),
) u* (k ))
với: J 4* ( x(4)) 0
u ( 3)
J 3* ( x(3)) min x 2 (3) u 2 (3) (do J 4* ( x(4)) 0 )
Lời giải: u * (3) x(3) (để thỏa mãn điều kiện ràng buộc)
J 3* ( x(3)) 2 x 2 (3)
u (0) 8 8 21
2 2
5 20
Với k = 0: u (0) x(0)
*
21 21
1 1 20 32
x(1) ( x(0) u (0)) 4
*
2 2 21 21
x(1) 8
Với k = 1: u * (1)
4 21
1 1 32 8 12
x(2) ( x(1) u (1))
*
2 2 21 21 21
2 2 21 21
20 8 4 4
Kết luận: Chuổi tín hiệu ĐK tối ưu là: u ; ; ; *
21 21 21 21
26 2 416
Chỉỉ tiêu chất
ấ lượng tối
ố ưu: J min J 0* ( x(0)) x (0)
21 21
15 January 2014 © H. T. Hoàng - HCMUT 88
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Qui hoạch động giải bài toán ĐK tối ưu liên tục
Cho đối tượng mô tả bởi phương trình trạng thái:
x (t ) f ( x (t ), u(t ), t )
ạ g thái đầu: x (0) x0 , trạng
Trạng ạ g thái cuối: x (t f ) x f
Bài toán điều khiển tối ưu: tìm tín hiệu điều khiển u(t) sao cho:
tf
J (u) ( x (t f )) L( x (t ), u(t ), t )dt min ((*))
ti
Đặt: Hàm mục tiêu tối ưu đoạn quỹ đạo cuối từ thời điểm ti, trạng
thái xi đến thời điểm cuối tf, trạng thái cuối x(tf) là
J (ti , xi ) min ( x (t f )) L( x (t ), u(t ), t )dt
tf
*
u(t ) ti
Nếu tồn tại lời giải tối ưu của bài toán ((*)) thì hàm mục tiêu tối ưu đoạn quỹ
đạo cuối phải thỏa mãn phương trình Hamilton-Jacobi-Bellman:
T
J (t , x )
*
J (t , x ) *
i L( x, u, t )
min f ( x, u, t )
t u(t )
x
15 January 2014 © H. T. Hoàng - HCMUT 89
CuuDuongThanCong.com https://fb.com/tailieudientucntt
ĐIỀU CHỈNH TOÀN PHƯƠNG TUYẾN TÍNH
(Linear Quadratic Regulator – LQR)
x
H
0 T
H (t ) L( x, u , t ) (t ) f ( x , u, t )
15 January 2014 © H. T. Hoàng - HCMUT 92
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Cách tìm lời giải tối ưu
Rút u(t) từ (3):
u(t ) R 1 B T (t ) (4)
Th (4) vào
Thay à (1),
(1) tta đượ
được
x (t ) Ax (t ) BR 1 B T (t ) (5)
Kết
ế hợp (5) và (2), ta được phương trình vi phân:
x (t ) A BR 1 B T x (t )
(t ) Q A (t )
(6)
Giải phương trình vi phân (6), tìm được x(t) và (t)
Thay (t) vào (4) tìm được lời giải tối ưu
Tí hiệu
Tín hiệ điều khiể tối ưu: u* (t ) K (t ) x (t )
điề khiển
trong đó: K (t ) R 1 B T P (t )
và P(t) là nghiệm bán xác định dương của phương trình vi phân Ricatti:
P PA AT P Q PBR 1 B T P
P (t f ) M
0 p1 0 0 2 0 1 p22 p2 p3
0
2
0 p2 p1 p2 0 0 2 p2 p3 p3
1 2 1
2 p2 p1 p2 p3
2 2 0
1 1
p1 p2 p3 2 p2 p32
2 2
15 January 2014 © H. T. Hoàng - HCMUT 98
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Điều khiển LQR liên tục – Thí dụ 2
1 2
2 2 p 2 0 p1 2 2
1 2 2 2
p1 p2 p3 0 p2 2 P
2 p 2 2 2 2 2
2 p2 1 p32 0 3
2
Viết lại
ạ chỉ tiêu chất lượng:
ợ g
1 2 0 x1
J ([ x1 x2 ] 1 u 2
(t ))dt
20 0 1 x2
R
Q
15 January 2014 © H. T. Hoàng - HCMUT 100
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Điều khiển LQR liên tục – Thí dụ 3
Phương trình đại số Ricatti:
PA AT P Q PBR 1 B T P 0
p1 p2 0 1 0 1 p1 p2 2 0
p2 p3 1 2 1 2 p2
p3 0 1
p p 2 0 p1 p2
1 0 1 0
p2 p3 1 p2
p3
p2 p1 2 p2 p2 p3 2 0 p22 p2 p3
2
0
p3 p2 2 p3 p1 2 p2 p2 2 p3 0 1 p2 p3 p3
2 p2 2 p22 p1 2 p2 p3 p2 p3
2
0
p3 p1 2 p2 p2 p3 2 p2 4 p3 1 p3
2 p2 2 p22 0 p1 2.403
p 2 p p p p 0 (chọn các
1 2 3 2 3 p2 0.732
p p1 2 p2 p2 p3 0 p 0.542 nghiệm
g ệ dương)
g)
3
2 p2 4 p3 1 p32 0 3
2.403 0.732
P
0.732 0.542
Độ lợi hồi tiếp trạng thái:
2.403 0.732
K R B P K 0 1
1 T
K [0.732 0.542]
0.732 0.542
x1 (t )
Luật điều khiển tối ưu: u (t ) Kx (t ) [0.732 0.542]
*
x (t )
2
u * (t ) 0.732 x1 (t ) 0.542 x2 (t )
15 January 2014 © H. T. Hoàng - HCMUT 102
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Bài toán LQR rời rạc
Cho đối tượng tuyến tính rời rạc mô tả bởi phương trình trạng thái:
x (k 1) Ad x (k ) Bd u(k ) (*)
t
trong đó: x (k ) [ x1 (k ),
đó ) xn (k )]T: vector
) x2 (k ),..., t trạng
t thái
u(k ) [u1 (k ), u2 (k ),..., um (k )]T: vector tín hiệu điều khiển
Bài toán
á đặ
đặt ra là tìm
ì tín
í hiệu
hiệ điều
điề khiển
khiể u(k)
(k) điều
điề chỉnh
hỉ h hệ thống
hố từ ừ
trạng thái đầu x (0) x0 bất kỳ về trạng thái cuối x(N) = 0 sao cho
tối thiểu chỉ tiêu chất lượng
ợ g dạng
ạ g toàn phương:
p g
1 T 1 N 1 T
J (u) x ( N ) Mx ( N ) x (k )Qx (k ) uT (k ) Ru(k )
2 2 k 0
0
Tí hiệu
Tín hiệ điều khiể tối ưu: u* (k ) K (k ) x (k )
điề khiển
trong đó:
1
K (k ) B P (k 1) Bd R BdT P (k 1) Ad
T
d
và P(k) là nghiệm bán xác định dương của phương trình Ricatti:
P ( k ) A P ( k 1) P ( k 1) Bd B P ( k 1) Bd R
T
d
T
d 1
BdT P ( k 1) Ad Q
P (N ) M
Nghiệm phương trình Ricatti rời rạc: lần lượt thay k ( N 1) 0
vao phương trình Ricatti sẽ tìm được P(k)
và P là nghiệm bán xác định dương của phương trình đại số Ricatti:
P A P PBd B P Bd R
T
d T
d
1
BdT P Ad Q
Chú ý: trong trường hợp này K và P là không phụ thuộc k
Giá trị cực tiểu của chỉ tiêu chất lượng: J min x T (0) Px (0)
15 January 2014 © H. T. Hoàng - HCMUT 105
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Lời giải bài toán LQR thời gian vô hạn dùng Matlab
Nghiệm phương trình đại số Ricatti liên tục (continuous algebraic
Ricatti equation – care)
>> P=care(A,B,Q,R)
( Q )
Lời giải bài toán LQR (Linear quadratic Regulator – LQR) liên tục
>> K=lqr(A,B,Q,R)
Nghiệm
hi phương
h trình
ì h đại
đ i sốố Ricatti
i i rờiời rạc(discrete
(di algebraic
l b i Ricatti
i i
equation – dare)
>> P P=dare(A
dare(A,B,Q,R)
B Q R)
Lời giải bài toán LQR (Linear quadratic Regulator – LQR) rời rạc
>> K=dlqr(A,B,Q,R)
15 January 2014 © H. T. Hoàng - HCMUT 106
CuuDuongThanCong.com https://fb.com/tailieudientucntt
BỘ LỌC KALMAN
xˆ (t ) [ Axˆ (t ) Bu (t )] L[ y (t ) yˆ (t )]
Bộ lọc Kalman liên tục:
yˆ (t ) Cxˆ (t )
Trong đó L là độ lợi của bộ lọc Kalman:
L C T RN1
với là nghiệm của phương trình Ricatti:
A AT C T RN1C Q N 0
15 January 2014 © H. T. Hoàng - HCMUT 109
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Sơ đồ khối bộ lọc Kalman liên tục
u(t) x(t) ()
y(t)
x (t ) Ax (t ) Bu (t ) C
L
+
xˆ (t )
B ++
+ C
yˆ (t )
xˆ (t ) Axˆ (t ) Bu (t ) L( y (t ) yˆ (t ))
Bộ lọc Kalman:
yˆ (t ) Cxˆ (t )
0 1 p1 p2 p1 p2 0 1 0.2 0
1 2 p2
p3 p2
p3 1 2 0 0.1
p1 p2 1 1 p1 p2
1 0 0
p2 p3 0 0.01 p2
p3
p2 p3 p2 p1 2 p2 0.2 0
p1 2 p2
p2 2 p3 p3 p2 2 p3 0 0.1
p12 p1 p2
100 2 0
p1 p2 p2
L +
++ 1
xˆ (t )
Bd z Cd
+ yˆ (t )
Ad
Trong đó:
L(k ) Ad (k )C C d (k )C RN
T
d
T
d 1
+
L
xˆ (t )
B ++
+ C
yˆ (t )
Thiết kế dù
dùng Matlab:
M tl b
>> K = lqr(A,B,Q,R)
Tùy theo độ lớn tương đối giữa trọng số Q và R mà hệ
thống có đáp ứng quá độ và năng lượng tiêu tốn khác nhau.
Muốn trạng thái đáp ứng nhanh tăng thành phần Q tương
ứng
Muốn giảm năng lượng tăng R
[rad],[rad/s]
1 0 0 0
0
0 1 0 0 -0.5
Q
0 1 2 3 4 5 6
1
0 0 1 0 x
x
m/s]
0.5
0 0 0 1
[m],[m
0
-0.5
R 1 10
0 1 2 3 4 5 6
u
5
[N]
-5
Góc lệ
Gó lệchh con lắ
lắc 0 1 2 3 4 5 6
Time [s]
được giữ cân bằng
tốt, tuyy nhiên vị trí xe K= [34.3620 10.7009 1.000 2.4109]
dao động khá lớn
15 January 2014 © H. T. Hoàng - ÐHBK TPHCM 128
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Kết quả mô phỏng điều khiển LQR hệ con lắc ngược
0
0.5
[rad],[rad/s]
0
1 0 00 -0.5
0 1 0 0 -1
Q
0 1 2 3 4 5 6
2
0 0 100 0 x
x
m/s]
1
0 0 0 1
[m],[m
0
-1
R 1 20
0 1 2 3 4 5 6
u
10
Tăng trọng số q33
[N]
0
(tương ứng với vị trí -10
xe) vị trí xe ít dao 0 1 2 3
Time [s]
4 5 6
0.5
[rad],[rad/s]
0
1 0 00 -0.5
0 1 0 0 -1
Q
0 1 2 3 4 5 6
2
0 0 100 0 x
x
m/s]
1
0 0 0 1
[m],[m
0
-1
R 1 0 1 2 3 4 5 6
20
u
10
Khuyết điểm của bộ
[N]
0
điều khiển LQR là -10
10
nếu có nhiễu đo 0 1 2 3
Time [s]
4 5 6
Thiết
ế kế
ế dùng Matlab:
>> K = lqr(A,B,Q,R)
>> L = lqe(A,G,C,QN,RN)
q ( , , ,Q , ) %G là ma trận
ậ đơn vịị
Bộ lọc Kalman
Q N 0.000001I 6.5617 0.0571
21.5437 0.1876
0.001 0
L
RN 0.5713 0.1470
0 0 .01
1.9568 0.0271
(Do ta giả sử không có nhiễu hệ thống nên chọn QN rất bé.
bé Hai
thành phần của RN chính là phương sai của nhiễu đo lường)
15 January 2014 © H. T. Hoàng - ÐHBK TPHCM 132
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Mô phỏng điều khiển LQG hệ con lắc ngược
[rad],[rad/s]
0
-1
-2
0 1 2 3 4 5 6
2
x
x
[m],[m/s]
-2
0 1 2 3 4 5 6
10
u
0
[N]
-10
0 1 2 3 4 5 6
Time [s]
Bộ lọc Kalman ước lượng trạng thái và lọc nhiễu, nhờ vậy mà
đáp ứng của hệ thống điều khiển LQG tốt hơn LQR trong
trường hợp hệ thống có nhiễu
15 January 2014 © H. T. Hoàng - ÐHBK TPHCM 134
CuuDuongThanCong.com https://fb.com/tailieudientucntt
MỘT SỐ CÔNG THỨC CẦN NHỚ
Hằng
ằ sốố C được xác định dựa vào điều
ề kiện biên.
Cách 1: (t ) e At L1 ( sI A) 1
Cách 2:(t ) e At C0 I C1 A C2 A2 Cn 1 An 1
thay các trị riêng i của ma trận A (nghiệm của det(I A) 0 )
vào phương trình trên sẽ tính được các hệ số Ci
15 January 2014 © H. T. Hoàng - HCMUT 141
CuuDuongThanCong.com https://fb.com/tailieudientucntt
Nghiệm của phương trình trạng thái (tt)
Các trường hợp riêng của phương trình vi phân bậc 1:
Nếu B=0: x (t ) Ax (t )
x(t ) (t ) x(t0 ) e A(t t0 ) x(t0 )
Nếu u=1: x (t ) Ax (t ) B
t
x(t ) (t ) x(t0 ) (t ) Bd
t0
Sau khi học xong chương 3, sinh viên phải có khả năng:
Giải bài toán tối ưu động không ràng buộc và có ràng buộc
Thành
Thà h lậ
lập các
á bài ttoán
á điề
điều khiể
khiển tối ưu động
độ
Giải bài toán tối ưu động liên tục dùng phương pháp biến
phân
Giải bài toán tối ưu rời rạc dùng phương pháp qui hoạch
động
Thiết
ế kếế bộ điều
ề khiểnể LQR, bộ lọc Kalman, bộ điều
ề khiển
ể
LQG