Professional Documents
Culture Documents
Dieu Khien Toi Uu
Dieu Khien Toi Uu
Dieu Khien Toi Uu
Chương 2
Hệ thống ñiều khiển như hình trên bao gồm các phần tử chủ yếu : ñối tượng
ñiều khiển ( ðTðK ) , cơ cấu ñiều khiển ( CCðK ) và vòng hồi tiếp ( K ) .
Với các ký hiệu :
r : tín hiệu ñầu vào, mục tiêu ñiều khiển, ñáp ứng mong muốn của hệ thống.
u : tín hiệu ñiều khiển, luật ñiều khiển.
x : tín hiệu ñầu ra, ñáp ứng ra của hệ thống.
ε = r – x : sai lệch của hệ thống.
f : tín hiệu nhiễu
Chỉ tiêu chất lượng J của một hệ thống có thể ñược ñánh giá theo sai lệch
của ñại lượng ñược ñiều khiển x so với trị ñáp ứng mong muốn r , lượng quá
ñiều khiển ( trị số cực ñại xmax so với trị số xác lập x ( ∞ ) tính theo phần
trăm ) , thời gian quá ñộ … hay theo một chỉ tiêu hỗn hợp trong ñiều kiện
làm việc nhất ñịnh như hạn chế về công suất , tốc ñộ , gia tốc … Do ñó việc
chọn một luật ñiều khiển và cơ cấu ñiều khiển ñể ñạt ñược chế ñộ làm việc
tối ưu J ñạt cực trị còn tùy thuộc vào lượng thông tin ban ñầu mà ta có ñược.
Ở ñây chúng ta có thể thấy ñược sự khác biệt về kết quả nhận ñược chất
lượng tối ưu khi lượng thông tin ban ñầu thay ñổi ( Hình 2.2 ) .
Trang 125
Chương 2: ðiều khiển tối ưu
Khi tín hiệu ñiều khiển u giới hạn trong miền [u1,u2] , ta có ñược giá trị tối
ưu cực ñại J1∗ của chỉ tiêu chất lượng J ứng với tín hiệu ñiều khiển u1∗ .
Khi tín hiệu ñiều khiển u không bị ràng buộc bởi ñiều kiện u1 ≤ u ≤ u2 , ta
có ñược giá trị tối ưu J 2∗ > J1∗ ứng với u2∗ . Như vậy giá trị tối ưu thực sự
bây giờ là J 2∗ .
Tổng quát hơn , khi ta xét bài toán trong một miền [um , un ] nào ñó và tìm
ñược giá trị tối ưu J i∗ thì ñó là giá trị tối ưu cục bộ . Nhưng khi bài toán
không có ñiều kiện ràng buộc ñối với u thì giá trị tối ưu là
J ∗ = extremum( J i∗ ) với J i∗ là các giá trị tối ưu cục bộ , giá trị J ∗ chính là
giá trị tối ưu toàn cục .
Trang 126
Chương 2: ðiều khiển tối ưu
ðể thành lập bài toán tối ưu thì yêu cầu ñầu tiên là hệ thống phải có ñặc tính
phi tuyến có cực trị .
Bước quan trọng trong việc thành lập một hệ tối ưu là xác ñịnh chỉ tiêu chất
lượng J . Nhiệm vụ cơ bản ở ñây là bảo ñảm cực trị của chỉ tiêu chất lượng
J . Ví dụ như khi xây dựng hệ tối ưu tác ñộng nhanh thì yêu cầu ñối với hệ
là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá ñộ nhỏ nhất , nghĩa là cực tiểu hóa thời gian quá ñộ . Hay khi tính toán
ñộng cơ tên lửa thì chỉ tiêu chất lượng là vượt ñược khoảng cách lớn nhất
với lượng nhiên liệu ñã cho .
Chỉ tiêu chất lượng J phụ thuộc vào tín hiệu ra x(t) , tín hiệu ñiều khiển u(t)
và thời gian t . Bài toán ñiều khiển tối ưu là xác ñịnh tín hiệu ñiều khiển u(t)
làm cho chỉ tiêu chất lượng J ñạt cực trị với những ñiều kiện hạn chế nhất
ñịnh của u và x .
Chỉ tiêu chất lượng J thường có dạng sau :
T
J = ∫ L[ x(t ), u (t ), t ]dt
0
Trong ñó L là một phiếm hàm ñối với tín hiệu x , tín hiệu ñiều khiển u và
thời gian t .
Lấy ví dụ về bài toán ñiều khiển ñộng cơ ñiện một chiều kích từ ñộc lập
Φ kt = const với tín hiệu ñiều khiển u là dòng ñiện phần ứng iu và tín hiệu ra
x là góc quay ϕ của trục ñộng cơ .
Trang 127
Chương 2: ðiều khiển tối ưu
Trang 128
Chương 2: ðiều khiển tối ưu
Trang 129
Chương 2: ðiều khiển tối ưu
∂L / ∂u1
∆ ∂L ∂L / ∂u 2
Lu = (2.2)
∂u M
∂L / ∂u m
và ñạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma trận
Hessian ) :
2
∆ ∂ L
∂2L
Luu = (2.3)
∂u 2 ∂u i ∂u j
Nhắc lại : Luu là xác ñịnh dương ( hoặc âm ) nếu như các giá trị riêng của nó
là dương ( hoặc âm ) , không xác ñịnh nếu các giá trị riêng của nó vừa có
dương vừa có âm nhưng khác 0 , và sẽ là bán xác ñịnh nếu tồn tại giá trị
riêng bằng 0 . Vì thế nếu Luu = 0 , thì thành phần thứ hai sẽ không hoàn
toàn chỉ ra ñược loại của ñiểm cực trị .
Trang 130
Chương 2: ðiều khiển tối ưu
chỉ tiêu chất lượng L(x,u) ñạt giá trị nhỏ nhất và thỏa mãn ñồng thời các
phương trình ñiều kiện ràng buộc .
f ( x, u ) = 0 (2.7)
Vector trạng thái x ñược xác ñịnh từ một giá trị u cho trước bằng mối quan
hệ (2.7) , vì thế f là một hệ gồm n phương trình vô hướng , f ∈ R n .
ðể tìm ñiều kiện cần và ñủ của giá trị cực tiểu , ñồng thời thỏa mãn
f ( x, u ) = 0 , ta cần làm chính xác như trong phần trước . ðầu tiên ta khai
triển dL dưới dạng chuỗi Taylor , sau ñó xác ñịnh số hạng thứ nhất và thứ
hai là Lu & Luu.
∂L
= Lu (2.13)
∂u dx =0
ðể thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi df = 0 ,
ta cần có :
Lu − f uT f x−T L x = 0 (2.14)
ðây là ñiều kiện cần ñể có giá trị cực tiểu . Trước khi ñi tìm ñiều kiện ñủ ,
chúng ta hãy xem xét thêm một vài phương pháp ñể có ñược (2.14) .
Viết (2.8) và (2.9) dưới dạng:
dL LTx LTu dx
df = = 0 (2.15)
f x f u du
Trang 131
Chương 2: ðiều khiển tối ưu
Hệ phương trình tuyến tính này xác ñịnh một ñiểm dừng , và phải có một
[ ]T
kết quả dx T du T . ðiều này chỉ xảy ra nếu ma trận hệ số (n +1) × (n + m )
có hạng nhỏ hơn n+1 . Có nghĩa là các hàng của ma trận tuyến tính với nhau
ñể tồn tại một vector λ có n số hạng như sau:
T L LTu
T
[ ]
1 λ . x =0 (2.16)
f x fu
Hay:
LTx + λT f x = 0 (2.17)
LTu + λT f u = 0 (2.18)
Giải (2.17) ta ñược λ :
λT = − LTx f x−1 (2.19)
và thay vào (2.18) ñể có ñược (2.14) .
Vector λ ∈ R n ñược gọi là thừa số Lagrange , và nó sẽ là công cụ hữu ích
cho chúng ta sau này . ðể hiểu thêm ý nghĩa của thừa số Lagrange ta xét du
= 0 , từ (2.8) và (2.9) ta khử dx ñể ñược :
dL = LTx f x−1df (2.20)
Vì vậy:
∂L
= (LTx f x−1 ) = −λ
T
(2.21)
∂f du =0
Do ñó -λ là ñạo hàm riêng của L với biến ñiều khiển u là hằng số . ðiều này
nói lên tác dụng của hàm chỉ tiêu chất lượng với biến ñiều khiển không ñổi
khi ñiều kiện ràng buộc thay ñổi .
Như là một cách thứ ba ñể tìm ñược (2.14), ta phát triển thêm ñể sử dụng
cho các phân tích trong những phần sau. Kết hợp ñiều kiện ràng buộc và
hàm chỉ tiêu chất lượng ñể thành lập hàm Hamilton .
H ( x, u, λ ) = L( x, u ) + λT f ( x, u ) (2.22)
Với λ ∈ R là thừa số Lagrange chưa xác ñịnh . Muốn chọn x , u , λ ñể có
n
Trang 132
Chương 2: ðiều khiển tối ưu
Sau ñó ta xác ñịnh x với giá trị của u ñã có bằng phương trình ñiều kiện ràng
buộc f ( x, u ) = 0 . Trong trường hợp này hàm Hamilton tương ñương với
hàm chỉ tiêu chất lượng:
H f =0 = L (2.26)
Nhắc lại : nếu f = 0 , ta sẽ tìm ñược dx theo du từ (2.10) . Ta không nên xét
mối quan hệ giữa du và dx ñể thuận tiện trong việc chọn λ sao cho :
Hx = 0 (2.27)
ðạo hàm (2.22) theo x:
∂H
= L x + f xT λ = 0 (2.28)
∂x
hay λT = − LTx f x−1 .
Nếu giữ nguyên (2.25) và (2.27) từ (2.23):
dL = dH = H uT du (2.29)
Vì H = L, ñể có ñược ñiểm dừng ta phải áp ñặt ñiều kiện:
Hu = 0 (2.30)
Tóm lại , ñiều kiện cần ñể có ñược ñiểm cực tiểu của L(x,u) thỏa mãn ñiều
kiện ràng buộc f(x,u) = 0 gồm có :
∂H
= f =0 (2.31a)
∂λ
∂H
= L x + f xT λ = 0 (2.31b)
∂x
∂H
= Lu + f uT λ = 0 (2.31c)
∂u
Với H ( x,u, λ ) xác ñịnh bởi (2.22) . Cách thường dùng là từ 3 phương trình
ñã cho xác ñịnh x , λ , và u theo thứ tự tương ứng . So sánh 2 phương trình
(2.31b) và (2.31c) ta thấy chúng tương ứng với 2 phương trình (2.17) và
(2.18) .
Trong nhiều ứng dụng , chúng ta không quan tâm ñến giá trị của λ , tuy
nhiên ta vẫn phải ñi tìm giá trị của nó vì ñó là một biến trung gian cho phép
chúng ta xác ñịnh các ñại lượng cần tìm là u , x và giá trị nhỏ nhất của L .
Ưu ñiểm của thừa số Lagrange có thể tóm tắt như sau : trên thực tế , hai ñại
lượng dx và du không phải là hai ñại lượng biến thiên ñộc lập với nhau ,
theo (2.10) . Bằng cách ñưa ra một thừa số bất ñịnh λ , chúng ta chọn λ sao
cho dx và du có thể ñược xem là hai ñại lượng biến thiên ñộc lập với nhau .
Lấy ñạo hàm riêng của H lần lượt theo các biến như trong (2.31) , như thế ta
sẽ có ñược ñiểm dừng .
Trang 133
Chương 2: ðiều khiển tối ưu
Khi ñưa ra thừa số Lagrange , chúng ta có thể thay thế bài toán tìm giá trị
nhỏ nhất của L(x,u) với ñiều kiện ràng buộc f(x,u) = 0 , thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,λ) không có ñiều kiện ràng buộc .
ðiều kiện ñã (2.31) xác ñịnh một ñiểm dừng . Ta sẽ tiếp tục chứng minh ñây
là ñiểm cực tiểu như ñã thực hiện trong phần trước .
Viết chuỗi Taylor mở rộng cho ñộ biến thiên của L và f như sau :
dx 1 L L xu dx
[ ]
dL = LTx LTu + dx T du T xx [ ]
+ O(3) (2.32)
du 2 Lux Luu du
dx 1 f f xu dx
df = [ f x f u ] + dx T [ ]
du T xx
f uu du
+ O(3) (2.33)
du 2 f ux
Với:
∂2 f ∆
f xu =
∂u∂x
ðể ñưa ra hàm Hamilton , ta sử dụng các phương trình sau :
dL dx 1 H
H xu dx
[1 λT ] [
= H xT ]
H uT + dx T [ ]
du T xx
H uu du
+ O(3)
df du 2 H ux
(2.34)
Bây giờ , ñể có ñược ñiểm dừng ta cần có f = 0 , và ñồng thời thành phần
thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du . Vì f = 0
nên df = 0 , và ñiều này ñòi hỏi H x = 0 và H u = 0 như trong (2.31) .
ðể tìm ñiều kiện ñủ cho ñiểm cực tiểu , chúng ta xét ñến thành phần thứ hai .
ðầu tiên , ta cần xem mối quan hệ giữa dx và du trong (2.34) . Giả sử rằng
chúng ta ñang ở ñiểm cực trị nên H x = 0 , H u = 0 và df = 0 . Từ (2.10)
suy ra:
dx = − f x−1 f u du + O(2) (2.35)
Thay vào (2.34) ta ñược :
1 H H xu − f x−1 f u
2
[
dL = du T − f uT f x−T I xx ] du + O(3) (2.36)
H ux H uu I
ðể ñảm bảo ñây là ñiểm cực tiểu , dL trong (2.36) phải dương với mọi sự
biến thiên của du . ðiều này ñược ñảm bảo nếu như ma trận uốn với f luôn
bằng 0 là xác ñịnh dương .
∆ H H xu − f x−1 f u
f
Luu [
= Luu f = − f uT f x−T I xx ]
(2.37)
H ux H uu I
= H uu − f uT f x−T H xu − H ux f x−1 f u + f uT f x−T H xx f x−1 f u
Trang 134
Chương 2: ðiều khiển tối ưu
Lưu ý rằng nếu ñiều kiện ràng buộc f ( x, u ) = 0 với mọi x và u thì (2.37)
ñược rút lại thành Luu ở phương trình (2.3) .
Nếu (2.37) là xác ñịnh âm ( hoặc không xác ñịnh ) thì ñiểm dừng sẽ là ñiểm
cực ñại ( hoặc ñiểm yên ngựa ) .
2.1.3 Ví dụ
Tối ưu hóa không có ñiều kiện ràng buộc
Ví dụ 2.1 : Không gian toàn phương .
Cho u ∈ R 2 và :
1 q q12
L(u ) = u T 11 u + [s1 s 2 ]u (1)
2 q12 q 22
∆ 1
= u T Qu + S T u (2)
2
ðiểm cực trị ñược xác ñịnh bởi :
Lu = Qu + S = 0 (3)
u ∗ = −Q −1 S (4)
với u* dùng ñể chỉ biến ñiều khiển tối ưu.
Loại của ñiểm cực trị ñược xác ñịnh bằng cách xét ma trận hessian
Luu = Q (5)
ðiểm u* là cực tiểu nếu Luu > 0 ( q11 > 0 và q11 q 22 − q122 > 0 ) . Là ñiểm cực
ñại nếu Luu < 0 ( q11 < 0 và q11 q 22 − q122 > 0 ) . Nếu Q < 0 , thì u* là ñiểm
yên ngựa . Nếu Q = 0 , thì u* là ñiểm kỳ dị , chúng ta không thể xác ñịnh
ñược ñó là cực tiểu hay cực ñại từ Luu .
Bằng cách thay (4) vào (2) ta sẽ tìm ñược giá trị của hàm chỉ tiêu chất lượng
như sau :
∆ 1 1
L* = L(u * ) = S T Q −1QQ −1 S − S T Q −1 S = − S T Q −1 S (6)
2 2
Giả sử cho L như sau:
1 T 1 1
L= u u + [0 1]u (7)
2 1 2
Khi ñó giá trị u tối ưu sẽ là:
2 − 1 0 1
u * = − = (8)
1 1 1 − 1
Trang 135
Chương 2: ðiều khiển tối ưu
là một cực tiểu , vì Luu > 0 . Từ (6) giá trị nhỏ nhất của L là L* = -1/2 .
Các ñường ñồng mức của L(u) trong (7) ñược vẽ trong Hình 2.4 , với u = [u1
u2]T . Các mũi tên là gradient .
u + u2
Lu = Qu + S = 1 (9)
u1 + 2u 2 + 1
Lưu ý rằng gradient luôn luôn vuông góc với các ñường ñồng mức và có
hướng là hướng tăng L(u) .
Chúng ta dùng dấu “*” ñể chỉ giá trị tối ưu của u và L cần tìm . Tuy nhiên ta
thường bỏ qua dấu “*” .
Trang 136
Chương 2: ðiều khiển tối ưu
∂L
= u1 + 2u 2 + 1 = 0 (2b)
∂u 2
Trang 137
Chương 2: ðiều khiển tối ưu
Lx x + u
L = x + 2u + 1 (10)
u
Tại ñiểm cực tiểu (3,-2) , grad L(x,u) sẽ có giá trị :
L x 1
L = 0 (11)
u
Cần lưu ý rằng gradf và gradL tương ñương với nhau tại ñiểm dừng . Có
nghĩa là ñiểm cực tiểu xuất hiện khi ñiều kiện ràng buộc (2) là ñường tiếp
tuyến của các ñường ñồng mức của L. Di chuyển hướng dọc theo ñường
thẳng f = 0 sẽ làm tăng giá trị của L .
Ta tìm ñược giá trị của L tại ñiểm cực tiểu bằng cách thay x = 3, u = -2 vào
(1) , ta ñược L*=0,5 .
Vì λ = -1 , giữ nguyên giá trị u = -2 , thay ñổi ñiều kiện ràng buộc df ( dịch
chuyển ñường thẳng trong Hình 2.5 về phía phải ) sẽ làm tăng L(x,u) với dL
= -λdf = df .
Ví dụ 2.4 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính - Trường hợp vô hướng .
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
1 x2 y 2
L( x, u ) = 2 + 2 (1)
2a b
Với ñiều kiện ràng buộc tuyến tính :
f ( x, u ) = x + mu − c (2)
2
Các ñường ñồng mức của L(x,u) là những ellip; nếu L(x,u) = l /2, thì bán
kính trục chính và bán kính trục phụ là al và bl . ðiều kiện ràng buộc f(x,u)
là một họ các ñường thẳng chứa thông số c . Xem Hình 2.6 ( lưu ý rằng u là
biến ñộc lập , với x ñược xác ñịnh bởi f(x,u) = 0 ) .
Hàm Hamilton là :
1 x2 u2
H = 2 + 2 + λ ( x + mu − c) (3)
2a b
Và ñiều kiện ñể có ñiểm dừng :
H λ = x + mu − c = 0 (4)
x
Hx = 2 + λ = 0 (5)
a
u
H u = 2 + λm = 0 (6)
b
Trang 138
Chương 2: ðiều khiển tối ưu
Hình2.5 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u) .
Hình 2.6 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u).
ðể giải hệ phương trình này , trước hết ta sử dụng phương trình (6) ñể ñưa
ra biến ñiều khiển tối ưu theo thừa số Lagrange .
u = −b 2 mλ (7)
Bây giờ thay phương trình (7) vào (4) ñể khử u , kết hợp với (5) và ñược
viết lại :
1 − b 2 m 2 x c
1 = (8)
2 1 λ 0
a
Giải ra ta ñược giá trị của ñiểm dừng :
a 2c
x= 2 (9)
a + b2m2
Trang 139
Chương 2: ðiều khiển tối ưu
c
λ=− (10)
2
a + b2m2
Thay (9) , (10) vào (7) , ta có ñược giá trị u tối ưu :
b 2 mc
u= 2 (11)
a + b2m2
ðể xác ñịnh ñiểm dừng là cực tiểu , dùng (2.37) ñể tìm ra ma trận uốn :
1 m2
f
Luu = 2 + 2 (12)
b a
Luuf > 0 vì vậy ta tìm ñược một ñiểm cực tiểu .
Thay (9) và (11) vào (1) ta ñược giá trị tối ưu của hàm chỉ tiêu chất lượng :
1 c2
L* = (13)
2 a2 + b2m2
ðể kiểm chứng (2.21) , lưu ý rằng:
∂L* ∂L*
= = −λ (14)
∂f du =0 ∂c
Gradf trong miền (u,x) là :
f u m
f = 1 (15)
x
ñược biểu diễn trong Hình 2.6 . GradL là :
u
Lu b 2
L = x (16)
x
a2
và tại ñiểm dừng (11) , (9) sẽ có giá trị :
*
Lu m c
L = 1 2 2 2
(17)
x a +b m
ðiều này tương ứng với (15) , vì vậy ñiểm dừng xuất hiện khi f(x,u) = 0 là
ñường tiếp tuyến với một ñường ñồng mức của L(x,u) .
Ví dụ 2.5 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính .
Bây giờ ta tổng quát hóa ví dụ 2.4 với vector x ∈ R n , u ∈ R m , f ∈ R n ,
λ ∈ Rn .
Xét hàm chỉ tiêu chất lượng dạng toàn phương:
Trang 140
Chương 2: ðiều khiển tối ưu
1 T 1
L= x Qx + u T Ru (1)
2 2
với ñiều kiện ràng buộc tuyến tính :
f = x + Bu + c = 0 (2)
với Q , R và B là các ma trận , c là vector n hàng . Giả sử Q ≥ 0 và R > 0
( với Q , R là ma trận ñối xứng ) . Các ñường ñồng mức của L(x,u) là các
ñường ellip trong không gian , và f(x,u)=0 là mặt phẳng cắt ngang qua
chúng . ðiểm dừng xuất hiện khi gradf và gradL song song với nhau .
Hàm Hamilton là :
1 1
H = x T Qx + u T Ru + λT ( x + Bu + c) (3)
2 2
và các ñiều kiện ñể có ñiểm dừng là :
H λ = x + Bu + c = 0 (4)
H x = Qx + λ = 0 (5)
H u = Ru + B λ = 0T
(6)
ðể giải các phương trình trên , ñầu tiên ta dùng ñiều kiện (6) ñể tìm u theo
λ:
u = − R −1 B T λ (7)
Từ (5) ta có :
λ = −Qx (8)
Kết hợp với (4) ta ñược :
λ = QBu + Qc (9)
dùng kết quả này thay vào (7) cho ta :
u = − R −1 B T (QBu + Qc) (10)
hay : ( −1 T
)
I + R B QB u = − R B Qc −1 T
(R + B T
QB )u = − B
Qc T
(11)
T T
Vì R > 0 và B QB ≥ 0 , chúng ta có thể tìm nghịch ñảo của (R + B QB) và vì
thế giá trị u tối ưu là :
u = −( R + B T QB) −1 B T Qc (12)
So sánh kết quả này với (11) trong ví dụ 2.4 .
Thay (12) vào (4) và (9) cho ta giá trị trạng thái tối ưu và thừa số Lagrange
tối ưu :
( (
x = − I − B R + BT QB )
−1
)
BT Q c (13)
( B Q) c
−1
λ = Q − QB ( R + BT QB ) T
(14)
Bằng bổ ñề của nghịch ñảo ma trận :
Trang 141
Chương 2: ðiều khiển tối ưu
λ = (Q −1 + BR −1 B T ) c
−1
(15)
nếu Q ≠ 0 . Các kết quả trên sẽ rút lại thành kết quả của ví dụ 2.4 trong
trường hợp vô hướng .
ðể xác ñịnh biến ñiều khiển (12) là một cực tiểu , ta sử dụng (2.37) ñể xác
ñịnh ma trận uốn là xác ñịnh dương với giá trị của R và Q ñược giới hạn .
f
Luu = R + B T QB (16)
Sử dụng (12) và (13) thế vào (1) ta có ñược giá trị tối ưu :
1
[ ( −1
L* = c T Q − QB R + B T QB B T Q c
2
) ] (17)
1
L* = c T λ (18)
2
∂L *
Vì thế: =λ (19)
∂c
Trang 142
Chương 2: ðiều khiển tối ưu
Hình 2.7 : Bài toán với nhiều ñiều kiện ràng buộc .
ðưa ra một thừa số Lagrange cho mỗi ñiều kiện ràng buộc , hàm Hamilton
là :
1 1
H = ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 + λ1 ( y1 − ax12 − bx1 − d ) + λ 2 ( y 2 − x 2 − c) (7)
2 2
Khi ñó , ñể có ñiểm dừng ta cần có :
H x1 = x1 − x 2 − 2aλ1 x1 − bλ1 = 0 (8)
H x2 = − x1 + x2 − λ2 = 0 (9)
H y1 = y1 − y 2 + λ1 = 0 (10)
H y2 = − y1 + y 2 + λ2 = 0 (11)
H λ1 = y1 − ax12 − bx1 − d = 0 (12)
H λ2 = y 2 − x2 − c = 0 (13)
Giải (12) ñể có ñược y1 như sau :
y1 = ax12 + bx1 + d (14)
Từ (9) và (11) , ta có :
λ2 = x 2 − x1 = y1 − y 2 (15)
và sử dụng (14) với y 2 = x 2 + c từ (13) có ñược kết quả sau :
Trang 143
Chương 2: ðiều khiển tối ưu
Ví dụ 2.7 :
Moät con taøu ñang di chuyeån vôùi vaän toác 10 haûi lyù
moät giôø theo phöông hôïp vôùi phöông baéc moät goùc
30o (laáy theo chieàu kim ñoàng hoà) ñeå ñeán moät hoøn
ñaûo. Giaû söû raèng taïi thôøi ñieåm t = 0, con taøu ñang ôû vò
trí caùch hoøn ñaûo 30 haûi lyù veà phía Baéc vaø 20 haûi lyù
veà phía ñoâng (töùc laø con taøu leäch khoûi phöông di
chuyeån ban ñaàu). Baøi toaùn ñaët ra laø xaùc ñònh ñieåm
gaàn nhaát treân phöông di chuyeån ban ñaàu maø con taøu
caàn trôû veà ñeå ñi tôùi hoøn ñaûo. Tìm khoaûng caùch töø hoøn
ñaûo ñeán ñieåm gaàn nhaát vaø thôøi gian ñeán ñöôïc ñieåm ñoù.
Giải:
Caùch 1: giaûi baèng phöông phaùp hình hoïc: N
My M
Trong ∆ MMxO: 30
MM x 30
tg∠MOM x = = = 1.5 ⇒ ∠MOM x = 56.30 300
OM x 20
OM = MM x2 + OM x2 = 20 2 + 30 2 = 36.0555 Mx
O 20
Trang 144
Chương 2: ðiều khiển tối ưu
Trong ∆ MNO:
⇒ ∠MN O = 900 − 56.30 − 300 = 3.690
NM
sin ∠MON = ⇒ NM = 36.0555*sin3.690 = 2.32
OM
Vaäy khoaûng caùch ngaén nhaát laø NM = 2.32 miles
Goïi t laø thôøi gian taøu ñi töø ñieåm M tôùi ñieåm gaàn nhaát N.
d 2.32
t = min = = 0.232 (hours )
v 10
Trang 145
Chương 2: ðiều khiển tối ưu
Ví dụ 2.8:
Tìm ñieåm A baát kyø thuoäc ñöôøng thaúng d trong khoâng gian sao cho khoaûng
caùch töø goác toaï ñoä O ñeán A laø nhoû nhaát. Ñöôøng thaúng d trong khoâng gian
cho bôûi heä phöông trình:
3x + 2 y + z = 1
d
x + 2 y − 3z = 4
Giaûi:
Caùch 1: duøng phöông phaùp hình hoïc giaûi tích:
• u : vector chỉ phương của ñường thẳng d:
2 1 1 3 3 2
u = , , = (− 8,10,4)
u d 2 − 3 − 3 1 1 2
A • Gọi A là ñiểm thuộc d, có tọa ñộ:
7 −3
A(0, , ) , (cho xA=0 ta tính yA, zA)
H 8 4
• Khoaûng caùch ngaén nhaát töø O ñeán d:
[AO ,u ]
O d (OA min) = d (O , d ) = OH =
u
−7 3 3 −7
[AO,u ] = ( 8 4' 4
0
,
0
8 ) = (−11,−6,−7)
10 4 4 −8 −8 10
x
O
Trang 146
Chương 2: ðiều khiển tối ưu
S
Kieåm tra
Keát thuùc
Quan saùt treân hình veõ ta thaáy khoaûng caùch ta muoán toái öu hoaù ñoù laø ñoaïn
OA, trong ñoù A chaïy treân ñöôøng thaúng d.
⇒ OA2 = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2
Vì O laø goác toaï ñoä ⇒ O(0,0,0).
⇒ OA2 = (x2)2 + (y2)2 + (z2)2
Phiếm haøm toái öu: L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 (1)
Baøi toaùn vôùi 2 ñieàu kieän raøng buoäc laø:
f1(x2,y2,z2)=3x2 + 2y2 + z2 -1= 0 (2)
f2(x2,y2,z2)=x2 + 2y2 – 3z2 - 4=0 (3)
Thaønh laäp haøm Hamilton:
H(x2,y2,z2,λ1,λ2) = x22 + y22 + z22 + λ1 f1(x2,y2,z2) + λ2 f2(x2,y2,z2)
Trang 147
Chương 2: ðiều khiển tối ưu
Trang 148
Chương 2: ðiều khiển tối ưu
− 7λ1 − 2λ2 − 1 = 0
(15)
− 2λ1 − 7λ2 − 4 = 0
1 − 26
Giaûi heä phöông trình (15) ta tìm ñöôïc: λ1= ; λ2=
45 45
Thay giaù trò λ1, λ2 vaøo (10), (11), (12) ta coù
23 5 79
x2 = ; y2 = ; z 2 = .
90 9 90
x2 = 0.255; y2 = 0.555, z2 = -0.877.
L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 = 1.142
Vaäy ta xaùc ñònh ñöôïc ñieåm toái öu A(x2,y2,z2).
Khoaûng caùch giöõa ñieåm A ñeán goác toaï ñoä laø:
OA= x 22 + y 22 + z 22 = 1.069.
Kieåm tra laïi:
Coù nhieàu phöông phaùp kieåm tra laïi keát quaû treân laø cöïc tieåu:
- phöông phaùp kieåm tra ma traän uoán Luu, tuy nhieân ôû baøi taäp treân
phieám haøm toái öu L theo 3 bieán neân vieäc xaùc ñònh ma traän uoán
phöùc taïp.
- Phöông phaùp thöû sai:
• So saùnh giaù trò toïa ñoä, khoaûng caùch tính ñöôïc baèng phuông phaùp
thöû sai vôùi giaù trò maø ta duøng phöông phaùp bieán phaân coå ñieån
Euler_Lagrange.
• Ñeå kieåm tra ñaây laø cöïc tieåu cuïc boä hay toaøn phaàn ta cho phạm vi
thay ñoåi cuûa ñieåm A roäng hôn.
Ví dụ 2.9 :
a. Chöùng toû giaù trò min cuûa haøm x2y2z2 treân maët caàu x2+y2+z2= r2 laø
(r2/3)3
b. Chöùng toû raèng giaù trò cöïc ñaïi cuûa haøm x2+y2+z2 treân maët
x2y2z2=(r2/3)3 laø r2
Giaûi:
a.Duøng phöông phaùp Euler Lagrange:
Choïn phiếm haøm toái öu laø : L(x,y,z) = x2y2z2 (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y,z) = x +y +z - r = 0
Thaønh laäp haøm Hamilton :
H(x,y,z) = x2y2z2 + λ(x2+y2+z2 - r2)
Trang 149
Chương 2: ðiều khiển tối ưu
Trang 150
Chương 2: ðiều khiển tối ưu
Ví dụ 2.10 :
a. Tìm hình chöõ nhaät noäi tieáp hình elips coù chu vi lôùn nhaát.
b. Tìm hình chöõ nhaät noäi tieáp elips coù dieän tích lôùn nhaát .
Giaûi
a. Giaûi baèng phöông phaùp Euler – Lagrange :
Phiếm haøm toái öu laø: L(x,y) = 4(x+y) (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y) = x /a + y /b -1 = 0
Khi ñoù haøm Hamilton seõ laø: H(x,y,λ ) = 4(x+y) + λ (x2/a2 + y2/b2 -1)
Tìm caùc ñieåm döøng döïa vaøo caùc ñieàu kieän sau:
Hλ = x2/a2 + y2/b2 -1 = 0 (1)
2
Hx = 4 + 2λx/a = 0 (2)
2
Hy = 4 + 2λy/b = 0 (3)
2
Töø (2) x = -2a /λ
Töø (3) y = -2b2/λ
Thay x, y vaøo (1) ta coù:
2 2
−2 a 2 2 − 2b 2 2
⇔ /a + / b −1 = 0
λ λ
⇔ 4( a 2 + b 2 ) = λ 2
⇔ λ = ±2 a 2 + b 2
a2 b2
Vôùi λ = 2 a 2 + b 2 ta tìm ñöôïc x = - ;y=-
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L1= -4 a 2 + b 2 < 0, khoâng toàn taïi
Trang 151
Chương 2: ðiều khiển tối ưu
a2 b2
Với λ = -2 a 2 + b 2 ta tìm ñöôïc x = ;y=
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L2= 4 a 2 + b 2 > 0
Kieåm tra laïi L2 laø max
Hyy = 2λ /b2 ; Hxx = 2λ /a2 ; Hxy = Hyx = 0
f x 2 x / a 2
f = 2
y 2 y / b
2λ 2 y a 2 2λ a 2 2 y
⇒ L yy
f
= H yy + f yT f x−T H xx f x−1 f y = + . . . .
b2 b2 2x a2 2x b2
2λ a2 y2
= (1 + )
b2 b2 x2
ÖÙng vôùi L2, λ = -2 a 2 + b 2 < 0 thì L yy
f
< 0, suy ra L2 laø max
Trang 152
Chương 2: ðiều khiển tối ưu
a b a b a b
Vậy 4 ñieåm : A( , ), B( ,- ), C(- ,- ) vaø
2 2 2 2 2 2
a b
D(- , ) laø boán ñænh cuûa moät hình chöõ nhaät. Do tính chaát laëp laïi
2 2
a b
khi x chaïy heát hình elips, neân ta chæ choïn ñieåm A( , ) naèm goùc
2 2
phaàn tö thöù nhaát, vaø ta xeùt ñieåm cöïc trò taïi ñieåm naøy.
a b
D(- , ) a b
2 2 A( , )
2 2
a b
a b B( ,- )
C(- ,- ) 2 2
2 2
Trang 153
Chương 2: ðiều khiển tối ưu
có cực trị .
L là hàm có ñạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó .
ðể thống nhất , ở ñây ta lấy t0 = 0 và t1 = T .
Biến ñổi của J do δu tạo nên là :
∆J (u + δu ) = J (u + δu ) − J (u )
T T
= ∫ L(u + δu, u& + δu& , t )dt − ∫ L(u, u& , t )dt
0 0
T
= ∫ [ L(u + δu, u& + δu& , t ) − L(u, u& , t )]dt (2.39)
0
Phân tích (2.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J
ta ñược :
T
∂L(u, u&, t ) ∂L(u, u&, t )
∆J (u , δu ) = ∫ [( )δu + ( )δu& ]dt (2.40)
0
∂u ∂u&
vì δu và δu& liên hệ nhau bởi :
T
δu (t ) = ∫ δu& (t )dt + δu (0)
0
Xem δu là hàm biến ñổi ñộc lập , biểu thức (2.40) có thể biến ñổi ñể chỉ
chứa δu bằng cách lấy tích phân những thành phần chứa δu& :
Trang 154
Chương 2: ðiều khiển tối ưu
T
∂L(u , u&, t ) T ∂L(u, u& , t ) d ∂L(u, u& , t )
δJ (u, δu ) = δu 0 + ∫ [ − ]δudt... (2.41)
∂u& 0
∂u dt ∂u&
Từ ñiều kiện ñã cho δu(0) = δ(T) = 0 , phần ñầu của vế phải ở biểu thức
(2.41) bằng 0 .
Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị ñối với u*
thì :
∆J (u * , δu ) = 0 (2.42)
ðó là ñiều kiện cơ bản của phép tính biến phân .
Từ các biểu thức (2.41) , (2.42) ta có :
∂L(u * , u& * , t ) d ∂L(u * , u& * , t )
T
δJ (u , δu ) = ∫ [
*
− ]δudt = 0 (2.43)
0
∂u dt ∂u&
Từ ñó có thể rút ra phương trình Euler_Lagrange :
∂L(u, u&, t ) d ∂L(u, u& , t )
− =0 (2.44a)
∂u dt ∂u&
Hoặc có thể viết ñơn giản :
∂L d ∂L
− =0 (2.44b)
∂u dt ∂u&
mà λi(t) với i = 1,2,…,n là hàm Lagrange .Vì giới hạn thỏa mãn với mọi t
nên hàm Lagrange phụ thuộc thời gian .
Tương tự như trên ta có phương trình Euler_Lagrange tổng quát :
∂La (u, u& , λ , t ) d ∂La (u, u&, λ , t )
− =0 (2.47)
∂u dt ∂u&
n
mà La (u, u&, λ , t ) = L(u, u&, t ) + ∑ λi (t )ϕ i (u, u& , t ) (2.48)
i =1
Khi ñiều kiện ràng buộc có dạng :
T
∫ψ
0
i (u , u&, t )dt = qi (2.49)
Trang 155
Chương 2: ðiều khiển tối ưu
Trong trường hợp này , λi là các hệ số không phụ thuộc thời gian .
Khi có ñiều kiện ràng buộc dạng (2.45) hoặc (2.49) phải giải (n+1) phương
trình ñể xác ñịnh y*(t) và λi*(t) với i=1,2,…,n .
Phương trình Euler_Lagrange với tín hiệu ñiều khiển bị hạn chế
Trong phần trên ta chỉ ñề cập tới bài toán mà trong ñó tín hiệu ñiều khiển
không có giới hạn nào ràng buộc . Trong thực tế , thường gặp tín hiệu ñiều
khiển có ràng buộc dạng u ≤ 1 .
ðiều kiện cần ñể có cực trị : khi u(t) là ñường cực trị thì u+δu và u-δu là
những hàm cho phép . Bây giờ ta so sánh trị số phiếm hàm ở ñường cực trị
với trị số của nó ở hàm u+δu và u-δu . Nếu miền biến ñổi của u(t) là kín và
u(t) ở ngoài biên thì một trong các hàm u+δu hoặc u-δu sẽ ra ngoài miền
cho phép .
Một trong các biện pháp khắc phục khó khăn trên là ñường cực trị ở biên và :
u ≥ ϕ (t ) (2.51)
Ví dụ , nếu u ≤ 1 , ñiều kiện u ≥ ϕ (t ) nghĩa là ϕ (t ) ≤ −1 . ðổi biến ta có :
z2 = u − ϕ (2.52)
thì biến mới z sẽ không có ñiều kiện hạn chế và biên giới của biến u tương
T
ñương với z = 0 . Bây giờ chỉ tiêu chất lượng J (u ) = ∫ L(u, u& , t )dt có biến
0
mới u = z2 + ϕ , từ ñó :
u& = 2 zz& + ϕ&
và chỉ tiêu chất lượng J có dạng :
T
J = ∫ L[ z 2 + ϕ ,2 zz& + ϕ& , t ]dt (2.53)
0
Vì không có ñiều kiện hạn chế nên phương trình Euler_Lagrange có dạng :
∂L d ∂L
− =0 (2.54)
∂z dt ∂z&
∂L ∂L ∂u ∂L ∂u& ∂L ∂L
Ở ñây = + = 2z + 2 z&
∂z ∂u ∂z ∂u& ∂z ∂u ∂u&
∂L ∂L ∂u ∂L ∂u& ∂L
= + = 2z
∂z& ∂u ∂z& ∂u& ∂z& ∂u&
d ∂L d ∂L ∂L
= 2z( )+ 2 z&
dt ∂z& dt ∂u& ∂u&
Trang 156
Chương 2: ðiều khiển tối ưu
và (2.54) sẽ có dạng :
∂L ∂L d ∂L ∂L
2z + 2 z& − 2 z − 2 z& = 0
∂u ∂u& dt ∂u& ∂u&
∂L d ∂L
hay : 2 z − =0 (2.55)
∂u dt ∂u&
Phương trình trên thỏa mãn với z = 0 , nghĩa là ñường cực trị có những giá
trị biên và phương trình Euler_Lagrange vẫn là phiếm hàm xuất phát :
∂L d ∂L
− =0
∂u dt ∂u&
2. Ví dụ
Ví dụ 2.11 :
du1
Tìm quá trình tối ưu x* = u&2 và u2* = ñể cực tiểu hóa chỉ tiêu chất lượng
dt
J:
T
J (u ) = ∫ (u&2 )2 dt (1)
0
với ñiều kiện ñầu :
T
∫ u (t )dt = θ
0
2 0 (2)
∫ψ
0
i (u, u& , t )dt = qi (4)
Trang 157
Chương 2: ðiều khiển tối ưu
Trang 158
Chương 2: ðiều khiển tối ưu
T
12θ 02
còn ở ví dụ ta ñang xét : J = ∫ ( x∗ ) 2 dt = (16)
0
T3
J a 16
Nghĩa là chúng khác nhau = = 1.33 lần .
J 12
Hình 2.8 : ðặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ
tác ñộng nhanh (b) .
Ví dụ 2.12 :
Xét bài toán tối ưu tác ñộng nhanh với ñiều kiện ñầu :
T
∫ u dt = θ
0
2 0 (1)
∫ (u& )
2
2 dt = q0 (2)
0
ðiều kiện biên :
u2 (0) = u2 (T ) = 0 (3)
Với bài toán tác ñộng nhanh , từ (2.49) và (2.50) ta có thể viết :
L(u2 , u2 , λ1 , λ2 ) = 1 + λ1u2 + λ2 (u&2 ) 2 (4)
Phương trình Euler_Lagrange :
∂L d ∂L
− =0 (5)
∂u2 dt ∂u&2
⇒ λ1 − 2λ2u&&2 = 0 (6)
Trang 159
Chương 2: ðiều khiển tối ưu
λ1
⇒ u&&2 = (7)
2λ2
Lấy tích phân biểu thức trên ta ñược :
λ1
u&2 (t ) = x(t ) = t + c1 (8)
2λ2
λ1 2
u2 (t ) = t + c1t + c2 (9)
4λ2
λ1
Kết hợp (9) với ñiều kiện u2 (0) = 0 suy ra : c2 = 0 và c1 = − T .
4λ2
2θ0 λ1
Và ñiều kiện u2 (T ) = 0 ta có : c1 = − T
T 2 6λ2
λ1 24θ
⇒ = − 30 (10)
λ2 T
6θ
⇒ c1 = 20 (11)
T
Thế vào (8) , (9) ñược :
6θ0 12θ0
u&2∗ (t ) = x∗ (t ) = − 3 t (12)
T2 T
6θ 6θ
u2∗ (t ) = 20 t − 30 t 2 (13)
T T
So sánh với ví dụ trước , ta thấy quá trình tối ưu là hoàn toàn giống nhau.
Ví dụ 2.13:
Xét ñối tượng có mô hình toán học gần ñúng như sau :
x& i = f i ( x, δ i (t )) + g k ( x )u * i = 1, n; k ∈ [1, n] (1)
Trong ñó x = ( x1 , x 2 ,..., x n ) – vector trạng thái ; g k ( x ) - hàm phi tuyến
T
∂J d ∂J
Giả thuyết Euler-Lagrange: − =0
∂Ψ dt ∂ψ&
=> Ψ − Ψ && = 0 => Ψ ( s )(1 − s 2 ) = 0 => Ψ ( s )(1 − s )(1 + s ) = 0
ðiều kiện cực tiểu : Ψ ( s )(1 + s ) = 0
Trang 160
Chương 2: ðiều khiển tối ưu
Trong ñó Ψ là hàm số khả vi hoặc tuyến tính từng ñoạn và Ψ (0) = 0 . Hàm
Ψ ñược lựa chọn dựa trên các yêu cầu về ñộng học của hệ thống . Luật ñiều
khiển u ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J có thể ñược xác ñịnh
bằng cách giải phương trình Euler :
Ψ+Ψ & =0 (3)
ðạo hàm của hàm số Ψ có dạng :
n n
dΨ ∂Ψ ∂Ψ &
=∑ x& i + ∑ δi (4)
dt i =1 dxi i =1 dδ i
Giải phương trình (3) kết hợp với (5) , xác ñịnh luật ñiều u * khiển ñảm bảo
cực tiểu hoá hàm mục tiêu J và ñịnh hướng ñộng học hệ thống chuyển
ñộng theo xu hướng lim Ψ ( x ) → 0 :
t →∞
−1
1 ∂Ψ n n
∂Ψ &
Ψ + ∑ f i ( x, δ i ) + ∑
*
u =− δi (6)
g k ( x ) ∂xi i =1 i =1 ∂δ i
i≠k
∂Ψ
Lưu ý rằng luật ñiều khiển u * chỉ có nghĩa khi: g k ( x ) ≠ 0 và ≠0 .
∂x k
Phương trình ñồng trạng thái (costate epuation):
Giả sử một hệ thống phi tuyến ñược mô tả bởi phương trình biến trạng thái:
x& (t ) = f ( x, u , t ) với t ≥ t 0 và t0 cố ñịnh
Với biến trạng thái x(t ) ∈ R n , luật ñiều khiển u (t ) ∈ R m và hàm chỉ tiêu chất
lượng J, x(t ) ∈ R n
T
J = Φ ( x(T ), T ) + ∫ L( x(t ), u (t ), t )dt
t0
ðiều khiển tối ưu là tìm ra tìm ra luật ñiều khiển u*(t) trong khoảng thời
gian xác ñịnh [t0,T] ñể J ñạt cực tiểu. Với hàm trạng thái cuối là:
Ψ ( x(T ), T ) = 0 Với Ψ ∈ R p (*)
T
x = r r& θ θ&
Trang 161
Chương 2: ðiều khiển tối ưu
T
µ
Vậy hàm trạng thái cuối là: Ψ ( x(T ), T ) = r&(T ) − R r&(T ) θ&(T ) −
R3
Với r là bán kính, θ là vị trí góc, R: là bán kính của quỹ ñạo tròn.
Với µ = GM ,G: hằng số gia tốc trọng trường tác ñộng lên vật khối lượng M.
Kết hợp hai ñiều kiện ràng buộc x& (t ) = f ( x, u , t ) và (*) ñể thêm vào chỉ tiêu
chất luợng J. Do phương trình biến trạng thái xét trong khỏang t ∈ [ t0 ,T ] ,
ñòi hỏi thừa số Lagrange λ (t ) ∈ R n là hàm thời gian. Và do (*) xét tại 1 thời
ñiểm, ta cần ñưa ra hệ số nhân kết hợp ν ∈ R p . Chỉ tiêu chất lượng ñược
thêm vào là:
T
J ' = Φ( x(T ), T ) + ν Tψ ( x (T ), T ) + ∫ [L ( x , u, t ) + λ T (t )( f (t )( x, u, t ) − x& )]dt
t0
T
+∫ [(Hx + λ&)T δ x + HuTδ u − λTδ x& + (Hλ − x& )T δλ ]dt
t0
Trang 162
Chương 2: ðiều khiển tối ưu
ðể hàm chỉ tiêu chất lượng J’ ñạt giá trị nhỏ nhất thì dJ’=0, cho tất cả các hệ
số dν , δ x, δ u và δλ trong biểu thức (**) bằng 0.
Ví dụ 2.14 :
Xác ñịnh ñiều khiển tối ưu bằng phương pháp tính gần ñúng.
Cho hệ phi tuyến sau: x& = − x 3 + u
1
Với ñiều kiện x(0) =
2
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
a. Viết phương trình trạng thái và ñồng trạng thái, ñiều kiện xác lập, ñiều
kiện biên. Khử u(t) từ phương trình trạng thái và ñồng trạng thái.
b. Chứng minh rằng nếu x(t) có giá trị nhỏ trong ñoạn [0,2] thì gía trị gần
ñúng của nghiệm phương trình ñồng trạng thái là: λ = x − x 3 .
c. Với giá trị vừa tính ñược ở trên, tính biến trạng thái x(t).
d. Tìm hàm ñiều khiển tối ưu gần ñúng.
Trang 163
Chương 2: ðiều khiển tối ưu
Chú ý: ðể tính giá trị gần ñúng ở câu c thì giá trị x(t) phải nhỏ.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Xét hệ phi tuyến: x& = − x 3 + u
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
Lập hàm Hamilton:
1
H ( x, u, t ) = L( x, u, t ) + λT f ( x, u , t ) = ( x 2 + u 2 ) + λT (− x 3 + u )
2
∂H
Phương trình biến trạng thái: x& = = −x3 + u (1)
∂λ
& ∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ = = + λ = x − 3x 2 λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = =u+λ (3)
∂u
ðiều kiện biên:
1
+ ðiều kiện ñầu x(0) =
2
+ ðiều kiện cuối thỏa mãn
1
[ x(T ) − λ ]T T dx(T ) + [ ( x 2 + u 2 ) + λT (− x 3 + u )] T dT = 0
2
Thời gian cuối T=2 nên dT = 0 suy ra: x(2) − λ (2) = 0 ⇔ x(2) = λ (2)
Từ phương trình (3) ta có u = −λ , thay vào phương trình (1) ta ñược
phương trình biến trạng thái: x& = − x 3 − λ
.
Từ (2) ta có phương trình ñồng trạng thái: − λ = x − 3x 2 λ
x& = − x 3 − λ
b. Từ hệ phương trình
− λ& = x − 3x 2 λ
λ = − x& − x
3
⇔ λ = ∫ (−3 x 5 − x)dt − x 3
Triển khai Maclorank biểu thức 3 x 5 + x tại ñiểm x(t) nhỏ lân cận ñiểm 0:
∫ (−3x − x)dt ≈ x .
5
Với những giá trị của x(t) nhỏ trong khoảng thời gian [0,2] nên: λ = x − x 3
Trang 164
Chương 2: ðiều khiển tối ưu
Ví dụ 2.15:
Cho hệ thống giảm xóc của ô tô có phương trình tóan học:
m&y& + ky = u
trạng thái ñaàu y(0)=0, y& (0) = 0 tới trạng thái cuối y(T)=h, y& (T ) = 0 . Với
T
1
hàm chỉ tiêu chất lượng J = ∫ u 2 dt .
20
Trong ñó:
m- khối lượng, k- hệ số ñàn hồi, u- lực tác dụng theo hướng lên trên
y- lượng dịch chuyển theo phương ñứng
a. Viết phương trình biến trạng thái với : x = [ y y& ]
T
b. Viết phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên.
Khử u(t) từ phương trình trạng thái và phương trình ñồng trạng thái.
c. Tìm nghiệm phương trình ñồng trạng thái khi biết giá trị λ(T). Tìm biến
trạng thái x(t) khi biết λ(0) và biết x(0).
d. Sử dụng ñiều kiện biên ñể tìm λ(0) với m=k=1; T=2; h= - 3
e. Tìm luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu.
f. Chứng tỏ rằng x * (T ) = [h 0] thỏa mãn yêu cầu.
T
Giải:
a. Heä phöông trình traïng thaùi:
x&1 = x 2
x1 = y
ðặt: → k 1
x 2 = y& x& 2 = − m x1 + m u
x&1 0 1 x1 0
Phương trình trạng thái của hệ thống: = k + 1 u
&
x
2 m − 0 x 2 m
Trang 165
Chương 2: ðiều khiển tối ưu
b. Phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên:
u2
Lập hàm Hamilton: H = + λT ( Ax + Bu )
2
∂H
Phương trình biến trạng thái: x& = = Ax + Bu (1)
∂λ
∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ& = = + λ = AT λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = = u + BT λ (3)
∂u
ðiều kiện biên: ñiều kiện ñầu x(0) = y (0) = 0 , ñiều kiện cuối λ (T ) = 0
Từ phương trình (3): u = − B T λ , thay vào biểu thức (1) và (2) ta ñược:
x& = Ax − B T Bλ .
Từ phương trình (2): − λ& = AT λ
d. Tìm λ(0):
Từ phương trình (4) và ñiều kiện bài toán ta có
BT B
x(T ) = −
2A
[ ]
λ (T ) e 2 AT − 1 = h = −3
6A
⇔ λ (T ) = T
B B(e 2 AT − 1)
3 Ae − At 3A
*
⇒ λ (t ) = T ⇒ λ (0) = T (5)
B B sinh( AT ) B B sinh(2 A)
Trang 166
Chương 2: ðiều khiển tối ưu
0 1 0
Trong ñó: A = ,B =
− 1 0 1
e. Luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu:
Từ (5) suy ra luật ñiều khiển tối ưu:
3 Ae − At − 3 Ae − At
u * (t ) = − B T λ* (t ) = − B T T =
B B sinh( AT ) B sinh( AT )
Quỹ ñạo trạng thái tối ưu
BT B BT B.3Ae− At 3e− At e AT sinh(At)
x* (t ) = − λ * (t)e AT sinh(At) = − T e AT sinh(At) = −
A B B.Asinh(AT) sinh(AT)
(6)
f. Chứng minh x (T ) = [h 0] thỏa yêu cầu:
* T
3e − AT e AT sinh( AT )
Từ (6) → x * (T ) = − = −3
sinh( AT )
Vậy x * (T ) = [− 3 0]
T
Ví dụ 2.16 :
Cho hệ thống rôøi raïc: x k +1 = x k u k + 1
1 N −1 2
Hàm chỉ tiêu chất lượng: J = ∑ u k , N=2, x2=0
2 k =0
a. Viết lại phương trình trạng thái và phương trình ñồng trạng thái bằng
phương pháp khử uk.
b. Giả sử cho λ2 , tìm λ0 , λ1 theo λ2 và các biến trạng thái. Sử dụng biểu
thức này ñể biểu diễn x2 theo λ2 và x0 . Từ ñó tìm một phương trình bậc
4, ẩn λ2 , theo trạng thái x0.
c. Nếu x0 = 1, biến trạng thái & luật ñiều khiển tối ưu và chỉ tiêu chất lượng
tối ưu.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k ) (1)
u k2
H k ( xk , u k ) =
+ ( x k u k + 1)λTk +1 (2)
2
∂H k
Phương trình trạng thái: x k +1 = = xk u k + 1 (3)
∂λ k +1
Trang 167
Chương 2: ðiều khiển tối ưu
∂H k
Phương trình thừa số Lagrange: λ k = = u k λTk +1 (4)
∂x k
∂H k
ðiều kiện tĩnh: 0 = = u k + x k λTk +1 (5)
∂u k
Từ (5) ta suy ra uk : u k = − x k λTk +1
Thế uk vào (3) và (4), ta ñược phương trình trạng thái và thừa số Lagrange
không phụ thuộc uk như sau:
λk = − x k λ2k +1 và x k +1 = − x k2 λ k +1 + 1
c. Tìm biến trạng thái, luật ñiều khiển tối ưu, và chỉ tiêu chất lượng tối ưu
Trường hợp 1:
Với ñiều kiện x0 = 1,Ta ñược phương trình sau: λ42 + 2λ22 λ2 + λ2 − 1 = 0
Giải phương trình ñược các nghiệm như sau:
λ2 _ 1 = 0.5249 λ2 _ 2 = 1.49
Trang 168
Chương 2: ðiều khiển tối ưu
Trang 169
Chương 2: ðiều khiển tối ưu
u1 = − x1λ2 = −0.325
1 N −1 2
Chỉ tiêu chất lượng J của hệ thống: J 2 = ∑ u k = u 02 + u12 = 0.125
2 k =0
So sánh 2 trường hợp theo chỉ tiêu chất lượng tối ưu J * của hệ thống
ta chọn trường hợp 2.
Kết luận
Trạng thái tối ưu: ⇔ x1 = 0.62
λ = −0.1444
Thừa số Lagrange tối ưu: ⇔ 0
λ1 = 0.38
u 0 = − x0 λ1 = −0.38
Giá trị luật ñiều khiển tối ưu: ⇔
u1 = − x1λ2 = −0.325
Chỉ tiêu chất lượng tối ưu J* của hệ thống: ⇔ J * = u 02 + u12 = 0.125
Ví dụ 2.17 :
Cho hệ thống có phương trình rời rạc như sau: x k +1 = ax k + bu k
trong ñó xk , uk là các ñại lượng vô hướng và hàm chỉ tiêu chất lượng :
1 1 N −1
J = S N xN3 + ∑ (qxk3 + ruk3 )
3 3 k =0
a. Viết phương trình trạng thái của hệ thống, phương trình ñồng trạng thái
và biểu thức ñiều kiện dừng.
b. Khi nào ta có thể giải ñược uk? Với ñiều kiện ñó viết lại công thức trạng
thái hệ thống không có uk.
c. Giải bài toán ñiều khiển vòng hở ( với xN cố ñịnh, SN =0 và q=0).
Giải:
a. Phương trình trạng thái, ñồng trạng thái và biểu thức ñiều kiện dừng.
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k )
1
= (qx k3 + ru k3 ) + λ k +1 (ax k + bu k ) (1)
3
∂H k
Phương trình trạng thái của hệ thống: x k +1 = = ax k + bu k (2)
∂λ k +1
∂H k
Phương trình ñồng trạng thái: λ k = = qx k2 + λ k +1 a (3)
∂x k
∂H k
ðiều kiện dừng: 0 = = ru k2 + bλ k +1 (4)
∂u k
Trang 170
Chương 2: ðiều khiển tối ưu
bλ k +1
⇒ u k2 = − (5)
r
∂φ ∂H i T
ðiều kiện biên: ( − λ N ) T dx N = 0 và ( ) dxi = 0
∂x N ∂xi
Trang 171
Chương 2: ðiều khiển tối ưu
Xét ñiều kiện biên: vì trạng thái ñầu x 0 cố ñịnh nên dx 0 = 0 suy ra
∂H i T
thoả ñiều kiện ( ) dxi = 0 . ðồng thời trạng thái cuối x N = rN cũng
∂xi
∂φ
cố ñịnh nên dx N = 0 suy ra thoả ( − λ N ) T dx N = 0 .
∂x N
Phương trình (11) có thể ñược viết lại khi thay k = N:
3
− N
1 2 1− a 2
x N = a N x0 + Mλ N a (3 N −3)1 2
3
(12)
−
1− a 2
1 2
Có thể viết lại: x N = a x 0 + Vλ NN
(13)
3
− N
2 1− a
2
Với: V = Ma (3 N −3)1 3
(14)
−
1− a 2
rN − a N x0 2
Thay x N = rN vào (13) ta ñược: λ N = ( ) luôn dương (15)
V
Suy ra b phải âm theo ñiều kiện có nghĩa của u k .
rN − a N x0 2
Từ công thức (15) và (10) xác ñịnh ñược λ k : λ k = a N −k ( ) (16)
V
Từ ñó xác ñịnh u k : u k∗ = −
bλk +1 rN − a N x0 ba N −k −1 (17)
= −
r V r
∗
Với u k khi k chạy từ 0 ñến N-1, sẽ lái hệ thống từ ñiểm ñầu x 0 ñến
ñiểm cuối x N = rN sao cho hàm chỉ tiêu chất lượng ñạt giá trị tối thiểu.
* * * (rN − a N x0 ) a N −k −1 1 − a −3
*
2
x k +1 = ax + bu = ax + ( ) (19)
− a −3 2 1 − a 3N 2
k k k
Trang 172
Chương 2: ðiều khiển tối ưu
3
− k
1− a 2
Suy ra: x k* = a k x 0 + Da ( N + 2 k −3)1 2 ( 3
) (21)
−
1− a 2
*
Vậy x là sự kết hợp tuyến tính biến ñổi theo thời gian của x 0 và rN .
k
∗
Hàm chỉ tiêu chất lượng của hệ thống ứng với u k :
3N
−
1 N −1 3 1 r (rN − a N x0 ) 3 (−b) 3 / 2 ( N −1)3 / 2 1 − a 2
J 0* = ∑ ru k* = a
3 k =0 3 V3 r 3/ 2 −
3
1− a 2
Trang 173
Chương 2: ðiều khiển tối ưu
Giải:
-1
Hình 2.9 : Luật ñiều khiển năng lượng tiêu hao tối thiểu .
Liệt kê các trạng thái k từ 0 ñến 4 trong quá trình ra quyết ñịnh như
Hình 2.9 (ñầu mũi tên và con số trong khung bước ñầu có thể chưa cần
quan tâm). Tại mỗi giá trị k = 0,1,....N − 1 phải có một quyết ñịnh , và
N là trạng thái cuối .
Số hàng: n = 2
Số cột : m = 2
Trang 174
Chương 2: ðiều khiển tối ưu
Vậy số cấp: N = n + m = 2 + 2 =4
ði từ cấp 0 ñến cấp 4, tại các nút ta xét chi phí tiêu hao (CPTH) là nhỏ
nhất (theo nguyên lý tối ưu của Bellman):
• Cấp 0 (k=N=4):
Nút i: CPTH = 0, do mới bắt ñầu ñi.
• Cấp 1 (k=3):
Nút f: CPTH = 4 + 0 = 4, 4 : giá trị tiêu hao khi ñi từ i ñến f
Nút h: CPTH = 2 + 0 = 2
• Cấp 2 (k=2):
Nút c: CPTH = 3 + 4 = 7
Nút e: CPTH = 4 + 3 = 7, từ f ñến e
CPTH = 2 + 2 = 4, từ h ñến e
Do chi phí tiêu là nhỏ nhất nên: CPTH = 4, từ h ñến e
Nút g: CPTH = 2 + 4 = 6, từ h ñến g
• Cấp 3 (k=1):
Nút b: CPTH = 7 + 2 = 9, từ c ñến b
CPTH = 4 + 1 = 5, từ e ñến b
Do chi phí tiêu là nhỏ nhất nên: CPTH = 5, từ e ñến b
Nút d: CPTH = 4 + 3 = 7, từ e ñến d
CPTH = 6 + 2 = 8, từ g ñến d
Do chi phí tiêu là nhỏ nhất nên: CPTH = 7, từ h ñến e
• Cấp 4 (k=0):
Nút a: CPTH = 5 + 3 = 8, từ b ñến a
CPTH = 7 + 1 = 8, từ d ñến a
Do chi phí tiêu bằng nhau trên 2 quãng ñường nên: CPTH =
8, từ b ñến a hay từ d ñến a
Như vậy bằng cách lần lượt giảm k từ N ñến 0, kết quả CPTH ñã tính tại các
cấp ñược biểu diễn như Hình 2.9.
Chú ý rằng khi k = 0, luật ñiều khiển có thể là u0 = 1 hoặc u0 = −1 cùng cho
chi phí là 8 ; luật ñiều khiển khi k = 0 là duy nhất .
Vậy có hai ñường ñi từ a ñến i với cùng một chi phí là 8 :
a → b → e → h → i ( ñường nét ñậm ) và a → d → e → h → i ( ñường nét
ñứt ) . Hiển nhiên giải pháp tối ưu trong quy hoạch ñộng là không duy nhất .
Cuối cùng chúng ta chỉ ra rằng nguyên lý tối ưu của Bellman giúp giảm số
lượng phép tính toán cần thiết bằng cách giảm số lượng các lựa chọn có thể
thực hiện .
Trang 175
Chương 2: ðiều khiển tối ưu
2. Hệ rời rạc
Phương pháp quy hoạch ñộng cũng có thể dễ dàng áp dụng cho hệ phi tuyến
Ngoài ra , nếu có càng nhiều ñiều kiện ràng buộc ñối với tín hiệu ñiều khiển
và biến trạng thái thì ta có ñược lời giải càng ñơn giản .
ðặt :
xk +1 = f k ( xk , uk ) (2.56)
với số mũ k trên f thể hiện sự thay ñổi theo thời gian . Giả ñịnh kết hợp với
hàm chỉ tiêu chất lượng :
N −1
J i ( xi ) = φ ( N , xN ) + ∑ Lk ( xk , uk ) (2.57)
k =i
với [i, N ] là thời gian lấy mẫu . Chúng ta cần chỉ ra sự phụ thuộc của J ñối
với trạng thái và thời gian ñầu .
Giả sử ta ñã có ñược tổn hao tối ưu J k∗+1 ( xk +1 ) từ thời ñiểm k + 1 ñến thời
ñiểm cuối N ứng với những phương án khả thi xk +1 , và chuỗi các phương
án tối ưu từ thời ñiểm k + 1 ñến N cho mọi xk +1 .
Tại thời ñiểm k , nếu ta áp dụng một luật ñiều khiển u k bất kỳ và sử dụng
một chuỗi luật ñiều khiển tối ưu kể từ vị trí k + 1 , lúc ñó tổn hao sẽ là :
J k = Lk ( xk , uk ) + J k∗+1 ( xk +1 ) (2.58)
với xk là trạng thái ở thời ñiểm k , và xk +1 ñược cho bởi (2.56) . Theo
nguyên lý Bellman thì tổn hao tối ưu từ thời ñiểm k sẽ là :
(
J k∗ ( xk ) = min Lk ( xk , uk ) + J k∗+1 ( xk +1 )
uk
)(2.59)
và luật ñiều khiển tối ưu u k* tại thời ñiểm k là u k làm cho tổn hao ñạt cực
tiểu .
Phương trình (2.59) chính là nguyên lý tối ưu cho hệ rời rạc . Vai trò quan
trọng của nó là có thể cho phép chúng ta tối ưu hóa một vector ñiều khiển
tại thời ñiểm a bằng cách tính ngược từ N.
Trong thực tế, ta có thể ñịnh rõ các ñiều kiện ràng buộc ñược thêm vào
chẳng hạn như yêu cầu luật ñiều khiển u k thuộc về một tập hợp các luật
ñiều khiển ñược chấp nhận .
Ví dụ 2.18 :
Xét hệ :
x k +1 = x k + u k (1)
có hàm chỉ tiêu chất lượng :
Trang 176
Chương 2: ðiều khiển tối ưu
1 N −1 2
J 0 = xN2 +∑ uk
2 k =0
(2)
với thời ñiểm cuối cùng N = 2 . Tín hiệu ñiều khiển bị ràng buộc lấy các giá
trị :
uk = −1, −0.5, 0, 0.5,1 (3)
và biến trạng thái bị ràng buộc lấy các giá trị :
xk = 0, 0.5,1,1.5 (4)
ðiều kiện ràng buộc ñối với tín hiệu ñiều khiển không phải là không có lý
do , tín hiệu ñiều khiển tối ưu thời gian tối thiểu chỉ lấy các giá trị ±1 ( ví dụ
2.17 ), trong khi tín hiệu ñiều khiển tối ưu nhiên liệu tối thiểu nhận các giá
trị 0 , ±1 . ðiều kiện ràng buộc ñối với biến trạng thái trong bài toán này
cũng hợp lý , vì nếu trạng thái ban ñầu lấy một trong các giá trị chấp nhận
ñược (4) , thì dưới ảnh hưởng của các tín hiệu ñiều khiển cho phép (3) các
trạng thái sau ñó sẽ lấy các giá trị nguyên và bán nguyên . ðiều kiện ràng
buộc (4) có thể viết lại là x0 = 0, 0.5,1,1.5 và
0 ≤ xk ≤ 1.5 (5)
ðây là ñiều kiện xác thực và ràng buộc biên ñộ về trạng thái , thường là hợp
lý trong các tình huống vật lý .
Bây giờ , bài toán ñiều khiển tối ưu là tìm dãy tín hiệu ñiều khiển chấp nhận
ñược u0∗ , u1∗ sao cho chỉ tiêu chất lượng J 0 ñạt giá trị cực tiểu trong khi tạo
ra quỹ ñạo trạng thái chấp nhận ñược x0∗ , x1∗ , x2∗ . Chúng ta muốn uk∗ ñược xác
ñịnh như là luật ñiều khiển hồi tiếp trạng thái .
Theo (2.58) ta có :
1
J k = uk2 + J k∗+1 (6)
2
⇒ J k∗ = min ( J k ) (7)
uk
∗
ðể tìm u và J ứng với mỗi xk . Ta xuất phát từ trạng thái cuối cùng .
k
∗
k
k = N = 2 : J 2∗ = x2∗2
Ứng với mỗi giá trị xN = 0, 0.5,1,1.5 ta có các giá trị J N∗ = 0, 0.25,1, 2.25 .
k = 1 : J1 = u22 / 2 + J 2∗
- x1 = 1.5 : vì x2 = x1 + u1 và 0 ≤ x2 ≤ 1.5 nên ta chỉ xét các giá trị u1 ≤ 0
u1 = 0 ⇒ x2 = 1.5 + 0 = 1.5 ⇒ J 2∗ = 2.25
⇒ J1 = u22 / 2 + J 2∗ = 0 2 / 2 + 2.25 = 2.25
u1 = −0.5 ⇒ x2 = 1.5 + ( −0.5) = 1 ⇒ J 2∗ = 1
Trang 177
Chương 2: ðiều khiển tối ưu
2
⇒ J1 = ( −0.5 ) / 2 + 1 = 1.125
u1 = −1 ⇒ x2 = 1.5 + ( −1) = 0.5 ⇒ J 2∗ = 0.25
2
⇒ J1 = ( −1) / 2 + 0.25 = 0.75
Như vậy , tín hiệu ñiều khiển tối ưu với x1 = 1.5 là u1∗ = −1 và tổn hao tối
ưu là J1∗ = 0.75 . Ta có ñược sơ ñồ như sau với mũi tên chỉ ra trạng thái tối
ưu .
Tương tự như vậy cho các trường hợp còn lại của x1 . Tiếp tục với trạng
thái k = 0 . Cuối cùng ta sẽ ñược lưới kết quả như Hình 2.10.
ðể rời rạc hệ thống với chu kỳ lấy mẫu τ giây, ta có thể sử dụng hàm xấp
xỉ bậc 1 :
x& (kτ ) = ( xk +1 − xk ) / τ (2.62)
Viết (2.60) dưới dạng :
xk +1 = xk + τ f ( xk , uk , kτ ) (2.63)
ðể cho ñơn giản ta ñịnh nghĩa : xk x ( kτ ) , uk u ( kτ )
ðịnh nghĩa hàm rời rạc :
f k ( xk , uk ) xk + τ f ( xk , uk , kτ ) (2.64)
Khi ñó ta có thể viết :
Trang 178
Chương 2: ðiều khiển tối ưu
xk +1 = f k ( xk , uk ) (2.65)
Phương trình này ñúng với (2.56) .
ðể rời rạc hoá hàm chỉ tiêu , ta có thể viết :
N −1 ( k +1)τ
J ( 0 ) = φ ( x (T ) , T ) + ∑ ∫τ L ( x ( t ) , u ( t ) , t ) dt (2.66)
k =0 k
Hình 2.10 : Lưới kết quả của bài toán tối ưu giải bằng phương pháp quy
hoạch ñộng cho ví dụ 2.18 .
Trang 179
Chương 2: ðiều khiển tối ưu
T
Trong ñó : N= (2.67)
τ
Sử dụng hàm xấp xỉ bậc 1 cho mỗi ñại lượng tích phân :
N −1
J ( 0 ) = φ ( x (T ) , T ) + ∑τ L ( xk , uk , kτ ) (2.68)
k =0
ðịnh nghĩa hàm rời rạc :
J0 J ( 0)
φ S ( N , xN ) φ ( x ( Nτ ) , Nτ )
Lk ( xk , uk ) τ L ( xk , uk , kτ ) (2.69)
Khi ñó ta có :
N −1
J ( 0 ) = φ S ( N , xN ) + ∑ Lk ( xk , uk ) (2.70)
k =0
ðây là công thức (2.57) .
Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu
chất lượng dạng toàn phương :
x& = Ax + Bu (2.71)
T
1 1
2 20
(
J ( 0 ) = xT (T ) S (T ) x (T ) + ∫ xT Qx + uT Ru dt )
(2.72)
Sử dụng hàm xấp xỉ bậc nhất ñể rời rạc hoá hệ thống trở thành :
xk +1 = ( I + Aτ ) xk + Bτ uk (2.73)
1 T 1 N −1
J ( 0) = xN S N xN + ∑ xkT Q S xk + ukT R S uk
( ) (2.74)
2 2 k =0
Trong ñó :
SN S ( Nτ ) (2.75)
Q S = Qτ (2.76)
S
R = Rτ (2.77)
Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xầp xỉ Euler (2.73)
bằng cách sử dụng chính xác phương trình trạng thái (2.71) bao gồm bộ lấy
mẫu và khâu giữ bậc 1 :
x k +1 = A S x k + B S u k (2.78)
Trong ñó :
A S = e Aτ (2.79)
Trang 180
Chương 2: ðiều khiển tối ưu
τ
B S = ∫ e Aτ B dt( ) (2.80)
0
Trang 181
Chương 2: ðiều khiển tối ưu
Yêu cầu tối ưu biểu thức (2.87) ñược gọi nguyên lý cực tiểu Pontryagin : “
Hàm Hamilton phải ñược cực tiểu hóa ở tất cả các giá trị u cho giá trị tối
ưu của trạng thái và biến trạng thái ”.
Chúng ta sẽ thấy nguyên lý cực tiểu hữu dụng như thế nào . ðặc biệt chú ý
không thể nói rằng biểu thức H ( x∗ , u ∗ , λ ∗ ) ≤ H ( x, u, λ , t ) chắc chắn phải
ñúng .
Ví dụ 2.19 :
Tối ưu hóa với những ràng buộc
Giả sử chúng ta muốn tối ưu cực tiểu hàm :
1
L = u2 – 2u + 1 (1)
2
Với ñiều kiện : u ≤1 (2)
Xem Hình 2.11 .
Nguyên lý cực tiểu: L(u*) ≤ L(u) thỏa ∀u (3)
L(u)
u
-1 0 1 2
-1/2
-1
Trang 182
Chương 2: ðiều khiển tối ưu
và :
L(2) = -1 (8)
nhỏ hơn (5) ; nhưng u=2 thì không nằm trong khoản u ≤ 1 .
Trang 183
Chương 2: ðiều khiển tối ưu
Nếu λT(t)B là giá trị dương , chúng ta nên chọn u(t) = -1 làm cho λT(t)Bu(t)
có giá trị âm nhất . Mặt khác , nếu λT(t)B là giá trị âm , chúng ta nên chọn
u(t) ở giá trị cực ñại là giá trị 1 ñể giá trị λT(t)Bu(t) càng âm càng tốt . Nếu
giá trị λT(t)Bu(t) bằng zero tại thời ñiểm t , khi ñó u(t) có thể nhận bất cứ giá
trị nào tại thời ñiểm này .
Quan hệ giữa ñiều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm
sgn(w) :
1 w>0
sgn ( w ) = ( −1,1) w = 0 (2.94)
−1 w < 0
Khi ñó hàm ñiều khiển tối ưu ñược cho bởi :
(
u * (t ) = − sgn BT λ (t ) ) (2.95)
u* ñược biểu diễn dưới dạng biến trạng thái , với hệ tuyến tính dạng toàn
phương .
Giá trị BTλ(t) ñược gọi là hàm chuyển ñổi . Một hàm chuyển ñổi mẫu và bộ
ñiều khiển tối ưu ñược diễn tả ở Hình 2.12 . Khi hàm chuyển ñổi này ñổi
dấu , bộ ñiều khiển chuyển từ cực trị này ñến cực trị khác . Bộ ñiều khiển
trong hình ñược chuyển ñổi bốn lần . ðiều khiển thời gian tối thiểu tuyến
tính tối ưu luôn bão hòa khi nó chuyển ñổi tại vị trí giữa các giá trị cực trị ,
cho nên ñược gọi là ñiều khiển Bang-bang .
Nếu bộ ñiều khiển là một vector có m phần tử , theo nguyên lý cực tiểu ta
chọn các thành phần ui(t) bằng 1 , nếu các thành phần BiTλ(t) là giá trị âm ;
và bằng -1 nếu BiTλ(t) là giá trị dương , với Bi là cột thứ i của B . Phương
pháp ñiều khiển này tạo thành một giá trị :
m
λT (t ) Bu (t ) = ∑ u i (t ) BiT λ (t ) (2.96)
i =1
Trang 184
Chương 2: ðiều khiển tối ưu
Nếu hệ thống là bất biến theo thời gian , ta sẽ có ñược quả ñơn giản và bộ
ñiều khiển thời gian tối ưu là duy nhất .
Hệ thống bất biến theo thời gian trong biểu thức (2.88) có thể ñạt ñược nếu
chỉ có một ma trận
U n = B AB K An −1 B (2.99)
nxn
cấp n . Nếu bi là cột thứ i của B ∈ R , khi ñó hệ thống là bình thường nếu :
[
U = B AB ... A n−1 B ] (2.100)
cấp n cho mỗi giá trị i = 1 , 2 , … , m ; mà khi thành lập cho mỗi giá trị
riêng biệt u , u ∈ Rm .
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến ñến trạng thái cuối
cố ñịnh x(T) với hàm ñiều khiển thỏa [u (t )] ≤ 1 . Khi ñó :
1. nếu trạng thái cuối x(T) bằng zero , khi ñó sẽ tồn tại bộ ñiều khiển thời
gian tối thiểu nếu hệ thống không có cực với phần thực dương ( ví dụ
không có cực trên mặt phẳng phía bên phải ) .
2. cho bất kỳ giá trị x(T) cố ñịnh , nếu tồn tại ñáp án cho bài toán tối ưu thời
gian thì nó là duy nhất .
3. cuối cùng , nếu hệ thống có n cực thực và nếu tồn tại bộ ñiều khiển tối ưu
thời gian thì mỗi thành phần ui(t) của bộ ñiều khiển tối ưu thời gian thay
ñổi n-1 lần .
Ví dụ 2.20 :
ðiều khiển Bang-Bang
Cho hệ thống tuân theo ñịnh luật Newton :
y& = v (1)
v& = u (2)
với y là vị trí tọa ñộ và v là vận tốc, u là gia tốc . Trạng thái là x = [y u]T .
Cho gia tốc ngõ vào u ràng buộc bởi :
u (t ) ≤ 1 (3)
Trang 185
Chương 2: ðiều khiển tối ưu
Mục ñích ñiều khiển là ñưa trạng thái từ ñiểm ban ñầu bất kỳ ( y ( 0 ) , v ( 0 ) )
ñến ñiểm gốc trong thời gian T ngắn nhất . Trạng thái cuối ñược cố ñịnh tại :
y (T )
ϕ (x(T),T) = =0 (4)
v(T )
Lập hàm Hamilton (2.91) :
H = 1 + λ yv + λ vu (5)
T
λ = [λy λv] là biến trạng thái .
Từ hệ phương trình Hamilton ta có :
∂H ∂L ∂f T
− λ& = = + λ
∂x ∂x ∂x
H ( x, u , t ) = L( x, u, t ) + λT f ( x, u, t )
x& (t ) = f ( x, u , t )
dλ y ∂H
=−
dt ∂y
∂H
λ&y = − =0 (6)
∂y
∂H
λ&v = − = −λ y (7)
∂v
ðiều kiện tiếp tuyến :
0 = H (T ) = 1 + λ y ( T ) v (T ) + λv (T ) u ( T ) (8)
hoặc dùng công thức (4) ,
λv (T ) u (T ) = −1 (9)
Nguyên lý cực tiểu Pontryagin cần ñến phương trình (2.97) , hoặc :
u ( t ) = − sgn ( λv ( t ) ) (10)
vì thế thành phần biến trạng thái λv(t) là hàm chuyển ñổi . ðể xác ñịnh bộ
ñiều khiển tối ưu , ta chỉ cần xác ñịnh λv(t) .
Giải phương trình (6) và (7) với thời gian cuối T :
λy ( t ) = const λ y (11)
λv ( t ) = λv (T ) + (T − t ) λy (12)
Dùng công thức (9) và giá trị u ∗ ( t ) bão hòa tại giá trị 1 hoặc –1 , ta ñược :
u ∗ (T ) = 1 và λv∗ (T ) = −1 (13)
hoặc :
u ∗ (T ) = −1 và λv∗ (T ) = 1 (14)
Trang 186
Chương 2: ðiều khiển tối ưu
Có nhiều khả năng cho hàm chuyển ñổi λv∗ ( t ) , tuỳ thuộc vào giá trị của
λv∗ (T ) và λy . Vài khả năng của hàm chuyển ñổi λv∗ ( t ) ñược diễn tả trong
Hình 2.13 . Giá trị λv∗ (T ) ∈ (y(0) , v(0)) . Chú ý rằng λv∗ ( t ) là tuyến tính ,
và cắt ngang trục tọa ñộ .
Ta cần xác ñịnh phương pháp chuyển ñổi ñể bộ ñiều khiển tối ưu luôn ñúng,
ñồng thời cũng phải xác ñịnh thời ñiểm chuyển ñổi tS ( xem Hình 2.13 ) .
Kết luận: ñối với hệ bậc 2 (ví dụ 2.20) hàm λ không chuyển ñổi lần nào
hoặc chuyển ñổi một lần duy nhất từ dương sang âm hoặc từ âm sang dương,
u ≤ 1.
Xét 2 tín hiệu ñiều khiển chấp nhận ñược : u ( t ) = 1 với ∀t hoặc u ( t ) = −1
với ∀t . Do cả 2 trường hợp u ñều là hằng số nên khi kết hợp phương trình
trạng thái (2) và (1) ta ñược :
v ( t ) = v ( 0 ) + ut (15)
1
y ( t ) = y ( 0 ) + v ( 0 ) t + ut 2 (16)
2
ðể loại bỏ thời gian biến thiên , từ dùng biểu thức (15) ta có ñược :
t = ( v (t ) − v ( 0)) / u
và sau ñó thay vào biểu thức (16) suy ra :
Trang 187
Chương 2: ðiều khiển tối ưu
( y ( t ) − y ( 0 ) ) u = v ( 0 ) ( v ( t ) − v ( 0 ) ) + 12 ( v ( t ) − v ( 0 ) )
2
(17)
ðây là một parabol ñi qua tọa ñộ ( y ( 0 ) , v ( 0 ) ) và khi trạng thái ban ñầu
biến thiên ta vẽ ñược một họ parabol . ðồ thị mặt phẳng pha phản ánh trạng
thái biến thiên diễn tả cho trường hợp u = 1 và u = -1 ở Hình 2.14 . Họ quỹ
ñạo ñi từ dưới lên trên ứng với trường hợp u = 1 , và họ quỹ ñạo ñi từ trên
xuống dưới ứng với u = -1 . Mũi tên chỉ hướng tăng của thời gian .
Như ñã trình bày ở trên , tín hiệu ñiều khiển tối ưu u ( t ) là một hàm không
ñổi từng ñoạn, lấy giá trị ±1 và có nhiều nhất là hai ñoạn không ñổi . Do ñó,
nếu ban ñầu trong một khoảng thời gian nào ñó u ( t ) lấy giá trị +1 và sau ñó
là -1 thì họ quỹ ñạo pha gồm hai ñoạn của các parabol nối tiếp nhau, trong
ñó ñoạn parabol thứ hai là ñường parabol chạy về gốc toạ ñộ. Như vậy,
ñường cong hợp bởi hai nhánh parabol (ñường ñứt nét trên Hình 2.14) là
quỹ ñạo cuối ñưa trạng thái về gốc toạ ñộ , ñường cong ñó ñược gọi là
ñường chuyển ñổi và có phương trình là :
1 2 v<0
2 v
y= (18)
1
− v 2
v>0
2
Theo nguyên lý cực tiểu, chỉ có những quỹ ñạo trên là tối ưu và từ một ñiểm
của mặt phẳng pha chỉ có một quỹ ñạo tối ưu chạy về gốc tọa ñộ .
u= -1
u= 1
Trang 188
Chương 2: ðiều khiển tối ưu
Trang 189
Chương 2: ðiều khiển tối ưu
Ví dụ 2.21 :
0 1 0
x& = 2 x+ u u (t ) ≤ 1
− w 0 1
a. Giải phương trình biến trạng thái. Dùng nguyên lý cực tiểu Pontryagin
ñể tìm luật ñiều khiển tối ưu.
b. Vẽ quỹ ñạo pha cho trường hợp u = 1 và u = -1
c. Tìm ñường cong chuyển ñổi và luật ñiều khiển hồi tiếp cho thời gian tối
thiểu
Giải:
a. Phương trình biến trạng thái:
Mục ñích: ñưa trạng thái từ ñiểm ban ñầu bất kỳ (x1(0),x2(0)) ñến ñiểm
gốc trong thời gian ngắn nhất.
0 1 0
Phương trình trạng thái của hệ thống: x& = x+ 1 u (1)
− w
2
0
Hệ (1) có dạng: x& = Ax + Bu
0 1 0
Trong ñó: A = 2 , B = 1
− w 0
x&1 0 1 x1 0
Hệ (1) có thể ñược viết lại: = 2 + u
x& 2 − w 0 x2 1
x&1 = x2
⇔ 2
(2)
x& 2 = − w x1 + u
T
Chỉ tiêu chất lượng: J = ∫ L[ x(t ), u (t ), t ]dt = T ⇒ L[x(t),u(t),t] = 1
0
Trang 190
Chương 2: ðiều khiển tối ưu
Vậy ta tìm ñược luật ñiều khiển tối ưu cho bài toán phụ thuộc vào biến
1, λ2 < 0
trạng thái λ2 (t ) như sau: u * (t ) = indefinited , λ2 = 0
− 1, λ2 > 0
& ∂H 2
− λ1 = ∂x = − w λ 2
Hệ phương trình ñồng trạng thái: 1
∂H
− λ&2 = = λ1
∂x 2
λ&1 = w 2 λ2
Viết lại hệ trên: ⇒ λ1 = −λ&2 ⇒ λ&1 = −λ&&2 = w 2 λ2
&
λ2 = −λ1
⇔ λ&&2 + w 2 λ 2 = 0
Giải phương trình trên ta ñược: λ2 = c1 cos wt + c 2 sin wt
Mà λ = −λ& , nên: λ = c sin wt − c cos wt
1 2 1 1 2
λ = c1 sin wt − c 2 cos wt
Nghiệm phương trình ñồng trạng thái là: 1
λ2 = c1 cos wt + c 2 sin wt
1, λ2 < 0
*
Luật ñiều khiển của hệ thống: u (t ) = indefinited , λ2 = 0
− 1, λ2 > 0
Hình 1
Tín hiệu ñiều khiển chỉ có giá trị là 1 hoặc –1. Do phương trình biến
trạng thái có dạng hàm dao ñộng tuần hoàn với chu kỳ 2π. Và tại thời
Trang 191
Chương 2: ðiều khiển tối ưu
ñiểm là bội của π, tín hiệu ñiều khiển sẽ chuyển trạng thái từ -1 sang 1
hoặc ngược lại mặc dù chúng ta không biết ñược giá trị của c1 và c2.
( ) 2
⇔ w 2 x1 − u + x 22 = K 2
Nếu chọn w=1, ta có phương trình tham số như sau:
x1 − u = K cos θ
(x1 − u )2 + x22
= K2 ⇔ với –2π≤θ≤2π (4)
x 2 = K sin θ
ðây chính là phương trình ñường tròn tâm (u,0), bán kính K. Do ñó khi
K thay ñổi, ta sẽ có quỹ ñạo là những ñường tròn ñồng tâm (tâm (1,0)
khi luật ñiều khiển u(t)=1 và tâm (-1,0) khi luật ñiều khiển u(t)=-1).
Trong ñó hằng số K cũng ñược xác ñịnh từ ñiều kiện ñầu cho trước x(0)
= x0 nào ñoù.
Hình 2
Trang 192
Chương 2: ðiều khiển tối ưu
1 >
0.5
>
x2
-0.5
-1 <
-1.5
-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x1
Hình 3
Mặc khác, luật ñiều khiển tối ưu là hàm dao ñộng tuần hoàn với chu kỳ
2π. Do ñó quỹ ñạo tối ưu (ñường cong chuyển ñổi) là một chuỗi với hai
nửa ñường tròn như Hình 4.
Trang 193
Chương 2: ðiều khiển tối ưu
>
x2
0
-2
-4
-6
-6 -4 -2 0 2 4 6
x1
Hình 4
0 ** ***
*** *** **
*
*
** **** < < *
** **<
** **
-2 ** *
** **
*** **
*** ****
**** **
****** ****
-4 ***********
-6
-8
-8 -6 -4 -2 0 2 4 6 8
x1
Hình 5
Trang 194
Chương 2: ðiều khiển tối ưu
Hình 6
Trang 195
Chương 2: ðiều khiển tối ưu
T m
J ( t0 ) = ∫ ∑ ci ui ( t ) dt (2.102)
t0 i =1
Khi ñó chúng ta cho phép khả năng tiêu thụ nhiên liệu của m ñầu vào ui(t)
bởi trọng số vô hướng ci . Ta ñịnh nghĩa trị tuyệt ñối của vector :
u1
u = M (2.103)
u
m
( ñịnh nghĩa này tương tự (2.90) ) và vector C = [c1 c2 … cm]T . Ta có :
T
J ( t0 ) = ∫ C T u ( t ) dt (2.104)
t0
Trang 196
Chương 2: ðiều khiển tối ưu
ta có thể viết lại chỉ tiêu chất lượng theo dạng sau :
1 + biT λ
ui ui ≥ 0
biT λui ci
qi ( t ) ui + = (2.111)
ci 1 − bi λ u
T
ui ≤ 0
c i
i
T
Nếu Bi λ/ci bằng 1 , khi ñó một vài giá trị không xác ñịnh dương của ui(t) sẽ
làm qi trong (2.111) bằng zero ; nếu BiTλ/ci bằng -1 , khi ñó một vài giá trị
không xác ñịnh âm của ui(t) sẽ làm qi bằng zero . Do ñó bài toán nhiên liệu
tối thiểu có luật ñiều khiển giống như một bài toán phi tuyến .
Biến trạng thái hồi tiếp là :
1 Bi λ (t ) / ci < −1
T
nonnegative
Bi λ (t ) / ci = −1
T
ui ( t ) = 0 − 1 < Bi λ (t ) / ci < 1
T
(2.112)
nonpositive Bi λ (t ) / ci = 1
T
-1 Bi λ (t ) / ci > 1
T
Trang 197
Chương 2: ðiều khiển tối ưu
Nếu bài toán nhiên liệu tối thiểu là chuẩn và bộ ñiều khiển nhiên liệu tối
thiểu tồn tại , khi ñó nó là duy nhất .
Ở ví dụ kế ta sẽ xem xét một số vấn ñề của bài toán nhiên liệu tối thiểu .
Ví dụ 2.22 :
ðiều khiển Bang-off-bang
Hệ thống ñược mô tả :
y& = v (1)
v& = u (2)
với x = [ y v ]
T
. ðiều kiện ràng buộc của ngõ vào :
u (t ) ≤ 1 (3)
Giả sử ta xác ñịnh ñược trạng thái ñầu (y(0),v(0)) . Ta ñược :
y[T ]
ψ ( x(T ), T ) = =0 (4)
v[T ]
Chỉ tiêu chất lượng với yêu cầu nhiên liệu tối thiểu :
T
J (0) = ∫ u (t )dt (5)
0
Ta chưa chú ý ñến trạng thái thời gian cuối T hoặc tự do hoặc ràng buộc,
mặc dù cuối cùng ta cũng sẽ xét ñến cả 2 trường hợp .
Hàm Hamilton :
H = u + λ y v + λv u (6)
Trong ñó λ = λ y[ λv ]T . Do ñó phương trình ñồng trạng thái là :
λ&y = 0 (7)
λ&v = −λ y (8)
ðiều kiện tiếp tuyến yêu cầu :
0 = H (T ) = u (T ) + λv (T )u (T ) (9)
Từ (4) , (7) , (8) ta suy ra :
λy ( t ) = const λ y (10)
λv ( t ) = λv (T ) + (T − t ) λy (11)
Thành phần biến trạng thái λv(t) là tuyến tính . Tùy thuộc vào biến chưa biết
λy và λv(T) ( chúng tuỳ thuộc vào giá trị của trạng thái ñầu ) , λv(t) có thể là
hằng số (λy = 0) , có thể tăng (λy < 0) hoặc giảm (λy > 0) . Xem Hình 2.13 .
Nguyên lý cực tiểu Pontryagin yêu cầu :
u (t ) = − dez (λv (t )) (12)
Trang 198
Chương 2: ðiều khiển tối ưu
Trang 199
Chương 2: ðiều khiển tối ưu
Hình 2.15 : Quỹ ñạo mặt phẳng pha trong trường hợp u = 0 .
Trang 200
Chương 2: ðiều khiển tối ưu
Hình 2.17 : Quỹ ñạo trạng thái nhiên liệu tối thiểu .
Trang 201
Chương 2: ðiều khiển tối ưu
0 = y (T ) = y ( t2 ) + v ( t2 )(T − t2 ) +
(T − t2 ) (23)
2
trong ñó ta có sử dụng ñiều kiện biên (4) .
Thế (18) , (20) vào (22) , ta ñược :
t 2 = v0 + T − t1 (24)
Thế (18) , (19) , (20) , (21) , (24) vào (23) và ñơn giản hóa , cho ra kết quả :
v
2
Trang 202
Chương 2: ðiều khiển tối ưu
phương pháp biến phân cổ ñiển bị hạn chế khả năng sử dụng trong thực tế
rất nhiều .
ðối với hệ thống gián ñoạn tốt nhất ta nên áp dụng phương pháp quy hoạch
ñộng của Bellman . ðặc biệt với các bài toán tối ưu phức tạp dùng máy tính
số tác ñộng nhanh giải quyết bằng phương pháp này rất có hiệu quả . Tuy
nhiên , do hàm mô tả tín hiệu ñiều khiển tìm ñược theo bảng số liệu rời rạc
nên biểu thức giải tích của tín hiệu ñiều khiển chỉ là gần ñúng . Phương
pháp quy hoạch ñộng còn gặp hạn chế khi áp dụng ñối với hệ thống liên tục
vì rất khó giải phương trình Bellman .
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có ñiều
kiện ràng buộc bất kể ñiều kiện ràng buộc cho theo hàm liên tục hoặc hàm
gián ñoạn . Nhưng ñối với bài toán tối ưu phi tuyến thì nguyên lý cực tiểu
Pontryagin lại gặp khó khăn , ñặc biệt trong việc xác ñịnh các hàm phụ
λi (t ) ñể cho hàm H ñạt cực ñại .
2.3 ðIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM
DẠNG TOÀN PHƯƠNG
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng
hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương .
2.3.1 Ổn ñịnh Lyapunov ñối với hệ thống tuyến tính
Tiêu chuẩn ổn ñịnh thứ hai của Lyapunov ( ñiều kiện ñủ )
Xét hệ thống ñược mô tả bởi phương trình trạng thái :
x& = f ( x1 , x 2 ,..., x n )
Nếu tìm ñược một hàm V(x) với mọi biến trạng thái x1 , x2 ,…, xn là một hàm
dV (x )
xác ñịnh dấu dương , sao cho ñạo hàm của nó dựa theo phương
dt
trình vi phân của chuyển ñộng bị nhiễu cũng là hàm xác ñịnh dấu , song trái
dấu với hàm V(x) thì chuyển ñộng không bị nhiễu sẽ ổn ñịnh tiệm cận .
V ( x).V& ( x) < 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh tiệm cận.
V ( x).V& ( x) = 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh .
V ( x).V& ( x) > 0 : với mọi biến trạng thái xi , i = 1, n hệ thống không ổn ñịnh .
Phương trình Lyapunov
Xét hệ tuyến tính mô tả bởi phương trình trạng thái (hệ Autonom_hệ tự trị):
x& = Ax (2.115)
Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J :
∞
J = ∫ xT Qxdt (2.116)
0
với Q là ma trận vuông xác ñịnh dương .
Trang 203
Chương 2: ðiều khiển tối ưu
2.3.2 ðiều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn
phương _ Phương trình Riccati ñối với hệ liên tục
Xét hệ thống có tác ñộng ngoài ( u ≠ 0 ):
x& = Ax + Bu (2.122)
Chúng ta cần tìm ma trận K của vector ñiều khiển tối ưu :
u (t ) = − Kx(t ) (2.123)
thỏa mãn chỉ tiêu chất lượng J ñạt giá trị cực tiểu :
Trang 204
Chương 2: ðiều khiển tối ưu
∞
(
J = ∫ x T Qx + u T Ru dt ) (2.124)
0
Trong ñó Q là ma trận xác ñịnh dương ( hoặc bán xác ñịnh dương ) , R là ma
trận xác ñịnh dương . Chú ý : thành phần thứ hai ở phần bên phải phương
trình (2.124) xác ñịnh lượng năng lượng tiêu tốn của tín hiệu ñiều khiển .
Chúng ta sẽ chứng minh luật ñiều khiển tuyến tính cho bởi phương trình
(2.123) là luật ñiều khiển tối ưu . Khi ñó , nếu ma trận K ñược xác ñịnh ñể
tối thiểu hoá chỉ tiêu chất lượng J thì luật ñiều khiển u(t) sẽ tối ưu với mọi
trạng thái ban ñầu x(0) .
Từ (2.122) và (2.123) ta có :
x& = Ax − BKx = ( A − BK )x (2.125)
Thay u (t ) = − Kx(t ) vào phương trình (2.124) :
∞
(
J = ∫ x T Qx + x T K T RKx dt )
0
∞
(2.126)
(
= ∫ x T Q + K T RK xdt )
0
Bây giờ ta chọn hàm năng lượng :
V ( x) = xT Sx V ( x) ≥ 0, ∀x (2.127)
với S là ma trận vuông xác ñịnh dương .
⇒ & + xT Sx&
V& ( x) = x&T Sx + xT Sx
= xT ( A − BK )T Sx + xT Sx& + xT S ( A − BK ) x
= xT ( A − BK )T S + S& + S ( A − BK ) x (2.128)
Do V(x) xác ñịnh dương , nên ñể hệ thống ổn ñịnh thì V& ( x) phải là xác ñịnh
âm . Ta ñặt :
d T
V& ( x) =
dt
( )
x Sx = − xT (Q + K T RK ) x
(
( do Q và R là ma trận xác ñịnh dương nên ma trận Q + K T RK cũng là xác)
ñịnh dương , từ ñó V& ( x) sẽ là xác ñịnh âm ) .
xT Q + K T RK x = − xT ( A − BK ) S + S ( A − BK ) + S& x
( ) T
⇒
T
Q + K RK = ( A − BK ) S + S ( A − BK ) + S
T & (2.129)
Theo tiêu chuẩn ổn ñịnh thứ hai của Lyapunov , nếu ma trận (A-BK) ổn ñịnh
thì sẽ tồn tại một ma trận xác ñịnh dương S thoả mãn phương trình (2.129) .
Chỉ tiêu chất lượng bây giờ có thể ñược xác ñịnh như sau :
Trang 205
Chương 2: ðiều khiển tối ưu
∞
( )
J = ∫ x T Qx + u T Ru dt = − x T Sx
∞
0
= − x(∞ ) Sx(∞ ) + x(0) Sx(0)
T T
( )
AT − K T B T S + S ( A − BK ) + S& + Q + K T T T TK = 0
Phương trình trên có thể viết lại như sau :
[
AT S + SA + TK − T T ( ) −1
][
T
( ) −1
]
B T S − SBR −1 B T S + Q + S& = 0
B T S TK − T T
(2.130)
Chỉ tiêu chất lượng J ñạt giá trị cực tiểu khi biểu thức :
[ ( ) −1
x T TK − T T B T S TK − T T ][
T
( )
−1
]
BT S x
ñạt giá trị cực tiểu .
1− a2
Hệ hở: Q=0, u k* = 2N
(rN − a N x0 )a N −k −1
b(1 − a )
Hệ ổn ñịnh: rN = 0.
Khi ñó :
( ) BS
TK = T T
−1 T
⇒ K = T −1 T T
(T ) B S = R
−1−1 T
B S (2.131)
Phương trình (2.131) cho ta ma trận tối ưu K . Như vậy , luật ñiều khiển tối
ưu cho bài toán ñiều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng
cho bởi phương trình (2.131) là tuyến tính và có dạng :
u (t ) = − Kx(t ) = − R −1 B T Sx(t ) (2.132)
Ma trận S khi ñó phải thỏa mãn phương trình (1.130) ñược viết lại như sau :
A T S + SA − SBR −1 B T S + Q = − S& (2.133)
Phương trình (2.133) ñược gọi là phương trình Riccati .
Khi S không thay ñổi theo thời gian S& = 0 , ta có phương trình ñại số
Riccati ( ARE : Algebraic Riccati Equation ) :
AT S + SA − SBR −1 B T S + Q = 0 (2.134)
Trang 206
Chương 2: ðiều khiển tối ưu
Chỉ tiêu chất lượng J ñược ñịnh nghĩa trong khoảng [1,N] có dạng :
1 1 N −1
J = xNT SN x N + ∑ ( xKT QK xK + uKT RK uK ) (2.136)
2 2 K =i
Hàm Hamilton:
1
H K = ( x TK QK x K + u KT RK u K ) + λTK +1 ( AK x K + BK u K ) (2.137)
2
Xét hệ rời rạc và phương trình ñồng trạng thái:
∂H K
x k +1 = = AK x K + BK u K (2.138)
∂λ K +1
∂H K
λk = = QK x K + AKT λ K +1 (2.139)
∂x K
ðiều kiện biên (Stationarity condition):
∂H K
0= = RK u K + BKT λ K +1 (2.140)
∂u K
Theo 2.140 : u K = − R k− 1 B KT λ K +1 (2.141)
λk = QK x K + AKT λ K +1 (2.144)
1 T
Do hàm ma trận trọng lượng có dạng: φ = xN S N xN
2
Vì k ≤ N , ta có: λk = S k xk (2.146)
−1
Thế 2.146 vào 2.143 ta ñược: x k +1 = AK x K − BK R B S k +1 x k +1
k
T
K
Trang 207
Chương 2: ðiều khiển tối ưu
Hay: Sk = Ak S k +1 − Sk +1 Bk Bk Sk +1 Bk + Rk Bk Sk +1 Ak + Qk
−1 T
T
T
( )
Phương trình trên chính là phương trình Riccati cho hệ rời rạc . Khi Sk ≠ 0
với ∀k , ta có thể dùng bổ ñề ma trận nghịch ñảo ñể viết lại phương trình
trên như sau :
( )
S k = AkT S k−+11 + Bk Rk−1 BkT Ak + Qk
Khi ñó , luật ñiều khiển tối ưu của tín hiệu ñiều khiển có dạng :
u K = − Rk−1 BKT λk +1 = − Rk−1 BKT S k +1 xk +1 (2.148)
Thế 2.135 vào 2.148:
u K = − Rk−1 BKT S k +1 ( AK xk + BK u k )
Hay:
( I + Rk−1 BKT S k +1 BK )u K = − Rk−1 BKT S k +1 AK xk
−1
Vậy luật ñiều khiển uk là: u K = −( BK S k +1 BK + Rk ) BK S k +1 AK xk
T T
Trang 208
Chương 2: ðiều khiển tối ưu
2.3.4 Các bước giải bài toán toàn phương tuyến tính
Bước 1 :
Thành lập hệ phương trình trạng thái :
x& = Ax + Bu
c = Dx
Xác ñịnh các thông số A , B , D .
Bước 2 :
Xác ñịnh ma trận trọng lượng Q , R từ chỉ tiêu chất lượng J cho dưới dạng
toàn phương tuyến tính .
Bước 3 :
Tìm nghiệm S của phương trình Riccati :
- ðối với hệ liên tục : − S& = AT S + SA − SBR −1BT S + Q
- ðối với hệ rời rạc :
Sk = AkT S k +1 − Sk +1 Bk BkT Sk +1 Bk + Rk BkT Sk +1 Ak + Qk
−1
( )
Bước 4 :
Chỉ tiêu chất lượng tối ưu ñối với hệ dừng :
J = xT ( 0 ) Sx ( 0 )
min
Bước 5 :
Luật ñiều khiển tối ưu :
- ðối với hệ liên tục : u = − R −1BT Sx
−1
- ðối với hệ rời rạc : uk = − ( BkT Sk +1Bk + Rk ) BkT Sk +1 Ak xk
Ví dụ 2.23:
Cho hệ thống như hình vẽ .
Trang 209
Chương 2: ðiều khiển tối ưu
Trang 210
Chương 2: ðiều khiển tối ưu
Ví dụ 2.24 :
Xác ñịnh luật ñiều khiển tối ưu rời rạc biết hệ thống có ñối tượng ñiều khiển
mô tả bởi phương trình trạng thái sau :
0 1 0
x& ( t ) = x (t ) + u (t ) (1)
0 −0.1 0.01
Trang 211
Chương 2: ðiều khiển tối ưu
N −1
Chỉ tiêu chất lượng : J = ∑ x12k + 0.001uk2
( ) (2)
k =0
Chu kỳ lấy mẫu T = 0.5 sec , N = 50 .
Ta dễ dàng xác ñịnh ñược phương trình trạng thái hệ rời rạc từ phương trình
trạng thái hệ liên tục :
xk +1 = Ad xk + Bd uk
yk = Cd xk
1 0.488 0.00123
với : Ad = , Bd = , Cd = [1 0]
0 0.951 0.00488
Nghiệm của bài toán tối ưu ñược tính theo (2.138) và (2.139) :
K k = ( BkT S k +1 Bk + Rk ) −1 BkT S k +1 Ak (3)
( )
(4)
1 0
với : Ak = Ad , Bk = Bd , Qk = , Rk = 0.001
0 0
Ta tính ñược K49 = 0 khi biết S50 = 0 . Tiếp theo ta tính giá trị S49 :
1 0
S49 = Q49 = (5)
0 0
Tiếp tục với K48 và S48 :
−1
1 0 0.00123
K 48 = [ 0.00123 0.00488] + 0.001 .[ 0.00123 0.00488] .
0 0 0.00488
1 0 1 0.488
0 0 0 0.951 = [1.228 0.599] (6)
1 0 1 0 1 0 0.00123 1 0
S48 = − [ 0.00123 0.00488] .
0.488 0.951 0 0 0 0 0.00488 0 0
1 0 1 0.488 1 0
−1
0.00123
0.00488 + 0.001 [ 0.00123 0.00488 ] 0 0 0 0.951 + 0 0
0.9985 0.4873
= (7)
0.4873 0.2378
Tiếp tục tính toán nhờ máy tính , ta sẽ xác ñịnh ñược với k = 39 ma trận Kk
sẽ hội tụ về giá trị [25 63] .Vậy ñiều khiển tối ưu cuối cùng là :
uk = − [ 25 63] xk (8)
Trang 212
Chương 2: ðiều khiển tối ưu
Ví dụ 2.25
x&1 = x 2
Hệ thống Newton:
x& 2 = u
T
1 1
Hàm chỉ tiêu chất lượng J = x T (T ).x(T ) + ∫ ( x T x + ru 2 )dt
2 20
Trong ñó x = [x1 x 2 ]
T
S1 S& 2 0 0 0 S1 1 S 22
& S 2 .S 3 1 0
⇔ − = + − +
& & S 32 0 1
S 2 S 3 S 1 S 2 0 S 2 r S 2 S 3
Trang 213
Chương 2: ðiều khiển tối ưu
S& S& 2 0 S1 1 S 22 S 2 .S 3 1 0
⇔ − 1 = − +
& & S 32 0 1
S 2 S 3 S1 2 S 2 r S 2 S 3
& 1 2
− S 1 = − r S 2 + 1
& 1
⇔ − S 2 = S1 − S 2 .S 3 (2)
r
& 1 2
− S 3 = 2 S 2 − r S 3 + 1
Phương trình (2) là phương trình Riccati vi phân vô hướng.
c. Sử dụng Matlab viết chương trình tìm và mô phỏng ñiều khiển tối ưu.
* Hệ thống ñược mô phỏng như sau:
u
x2
x1
1 1
1
s s
Constant Integrator1 Integrator y
Noise
K1 Noise2
Gain
K2
Gain1
Chọn R=1
*Chương trình trong Matlab:
A = [0 1; 0 0];
Trang 214
Chương 2: ðiều khiển tối ưu
B = [0; 1];
C = [1 0];
Q = [1 0;0 1];
R = 1;
%=====GIAI PHUONG TRINH RICCATI=====
[K,S] = lqr(A,B,Q,R);
%========MO PHONG TOI UU=========
x1=y(:,2);
subplot(211);
plot(x1,'r');
title('KET QUA MO PHONG DAP UNG RA Y(t)');
subplot(212);
plot(u(:,2),'r');
title('KET QUA MO PHONG DIEU KHIEN TOI UU U(t)');
*Kết quả tính toán và mô phỏng ñược thể hiện:
K=[1.0000 1.7321]
S =[1.7321 1.0000; 1.0000 1.7321]
d. Công thức giải tích cho nghiệm và hệ số khuếch ñại Riccati trạng thái xác
lập:
Ở trạng thái xác lập khi giá trị T = t → ∞ ta có S&1 = S& 2 = S& 3 = 0
Trang 215
Chương 2: ðiều khiển tối ưu
& 1 2 1 2
− S 1 = − r S 2 + 1 = 0 − r S 2 + 1 = 0
1 1
Hay: − S& 2 = S1 − S 2 .S 3 = 0 ⇔ S1 − S 2 .S 3 = 0
r r
& 1 2 1 2
− S 3 = 2 S 2 − r S 3 + 1 = 0 2 S 2 − r S 3 + 1 = 0
1
S 22 = r S2 = r S 1 (∞ ) = r 2r r + r
1 r
1
⇔ S1 = S 2 S 3 ⇔ S1 = r 2r r + r ⇔ S 2 (∞ ) = r (4)
r r S (∞) = 2r r + r
S 3 = 2rS 2 + r S3 = 2r r + r 3
Biểu thức (4) là biểu thức giải tích của nghiệm Riccati trạng thái xác lập.
Thay các giá trị của S(t) ở biểu thức (4) vào phương trình (3) ñã tìm ở câu
b ta có:
1
k1 (t ) = r
r (5)
1
k 2 (t ) = 2r r + r
r
Biểu thức (5) là biểu thức giải tích của hàm hồi tiếp của hệ thống ở trạng
thái xác lập
Ví dụ 2.26:
x&1 = x 2
Thieát keá boä baùm cho heä thoáng ñöôïc cho bôûi:
x& 2 = u
∞
1
Haøm chæ tieâu chaát löôïng: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Vôùi mong muoán bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Cho troïng soá
q=10, r=1.
a. Xaùc ñònh luật ñiều khiển u(t).
b. Neáu r(t)=u-1(t), giaûi tìm u(t) neáu x(0)=0ñ
Giải:
a. Xaùc ñònh luaät ñieàu khieån vôùi tín hieäu ñaàu vaøo r(t)=1(t):
x&1 = x 2
Xét hệ thống:
x& 2 = u
Trang 216
Chương 2: ðiều khiển tối ưu
∞
1
Vôùi: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Trong ñoù: q- v2>0 vôùi mong muoán muoán x1(t) baùm theo moät tham chieáu
r(t) cho q = 10, r =1.
Heä thoáng ñaõ cho coù theå vieát laïi döôùi daïng:
∞
1
x& = Ax + Bu ; J = ∫ ( x T Qx + u T Ru )dt ; Cx(t ) = r (t )
20
0 1 0 1 ν 1 ν
Vôùi A = , B = 1 , C = [
1 0 ] , Q = ν q = ν 10 , R = 1
0 0
Giaûi phöông trình Riccati ñeå tìm S:
.
− S = AT S + SA − SBR T B T S + Q
Thieát keá heä thoáng phaûn hoài aâm neân khi S khoâng thay ñoåi theo thôøi gian
− s12 . s 21 = −1
− . = −v
⇔ s11 s12 s 22
s11 − s 22 . s12 = −v
s + s − s = −10
12 21 22
Choïn caùc giaù trò cuûa ma traän S sao cho S xaùc ñònh döông. Nghiệm của
phương trình trên là:
2 3 − v 1
S=
1 2 3
Trang 217
Chương 2: ðiều khiển tối ưu
Trang 218
Chương 2: ðiều khiển tối ưu
∞
1 1 1 1
J=
20∫ ( x T Qx + u T Ru ) = − x T Sx |∞0 = − x(∞) T Sx(∞) + x T (0) Sx(0)
2 2 2
Keát quaû:
K x = [0.6093 2.1079]
K r = 0.6131
x 0 =[0 0]'
x ∞ =[1 0]'
J = -1.0981
x1
Vaäy luaät ñieàu khieån: u = −[k1 k 2] − K r .u −1 (t )
x2
Chæ tieâu chaát löôïng: J = -1.0981
Trang 219
Chương 2: ðiều khiển tối ưu
Ở ñây ta sẽ sử dụng hàm lsqlin ( Optimization Toolbox ) với kết quả là giá
2 2
trị tối ưu của x ñể f ( x) = Cx − D ñạt giá trị nhỏ nhất ( Cx − D là norm
của ma trận vuông [Cx − D ] ) .
Cùng các ñiều kiện ràng buộc :
Ax ≤ B
Aeq.x = Beq
Cần lập các thông số C , D , A , B , Aeq , Beq ñể nhập vào theo cú pháp :
x = lsqlin(C, D, A, B, Aeq, beq)
Chương trình :
C = [1/(18^(1/2)) 0;0 1/(8^(1/2))];
D = [0;0];
Aeq = [1 1];
Beq = [1];
x = lsqlin(C, D, [], [], Aeq, Beq)
Chúng ta sẽ ñược kết quả :
x = 0.6923
0.3077
2.4.2 ðiều khiển tối ưu cánh tay máy hồi tiếp góc θ
Xét mô hình cánh tay máy hai ñoạn như hình :
Vị trí ñiểm cuối của cánh tay hai ñoạn ñược cho bởi phương trình sau :
x = L1 cos (θ1 ) + L2 cos (θ1 + θ 2 )
y = L1 sin (θ1 ) + L2 sin (θ1 + θ 2 )
θ&& A B T1 E
Phương trình ñộng lực học : 1 = +
&&
θ 2 C D T2 F
Trang 220
Chương 2: ðiều khiển tối ưu
T
trong ñó T = [T1 T2 ] là tín hiệu ñiều khiển .
Với các trạng thái :
x1 = θ1
x = x& = θ&
2 1 1
x3 = θ 2
x4 = x&3 = θ&2
x&1 = x2
x& = AT + BT − E
⇒ 2 1 2
x&3 = x4
x&4 = CT1 + DT2 − F
( & 2 + Ψ2 + Ψ
J = ∫ Ψ12 + Ψ 1 2
& 2 dt
2 )
0
Ψ = e + K1e&1
Với phiếm hàm dạng : 1 1
Ψ 2 = e2 + K 2 e&2
e = θ r −θ
với 1 1r 1
e2 = θ 2 − θ 2
θ1r ,θ 2r là góc ñặt của θ1 ,θ 2
e& = −θ&1 = − x2
⇒ 1
&
e&2 = −θ 2 = − x4
e = −θ&&1 = − x&2
&&
⇒ 1
e2 = −θ&&2 = − x&4
&&
ðể ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J thì T1 , T2 là nghiệm của hệ
phương trình sau :
Ψ1 + Ψ& =0
1
&
Ψ 2 + Ψ 2 = 0
Giải hệ phương trình trên ta ñược :
−1
T1 K1 A K1 B e1 + EK1 − x2 ( K1 + 1)
T = K C K D e + FK − x K + 1
2 2 2 2 2 4( 2 )
Tín hiệu ñiều khiển T ñược tính toán bằng chương trình Giai_PT.m
Trang 221
Chương 2: ðiều khiển tối ưu
Chương trình :
Thông số ñầu vào cho hệ thống (file thongso.m) :
global m1 m2 L1 L2 a1 a2 I1 I2
m1 = 3.6745;
m2= 1.0184;
L1= 0.6519 ;
L2= 0.6019;
a1= 0.3365 ;
a2= 0.2606;
I1= 0.370 ;
I2= 0.081;
Trang 222
Chương 2: ðiều khiển tối ưu
Trang 223
Chương 2: ðiều khiển tối ưu
Trang 224
Chương 2: ðiều khiển tối ưu
Hình 1a
Code hình 1a:
t=0:pi/100:2*pi; t=0:pi/100:2*pi;
x=1+1*cos(t); % tam (1,0) x=1+2*cos(t); % tam (1,0)
bankinh 1 bankinh 2
y=0+1*sin(t); y=0+2*sin(t);
plot(x,y,'r') plot(x,y,'g')
%--------------- %---------------
hold on hold on
Trang 225
Chương 2: ðiều khiển tối ưu
t=0:pi/100:2*pi; y=0+4*sin(t);
x=1+3*cos(t); % tam (1,0) plot(x,y,'b')
bankinh 3 %---------------
y=0+3*sin(t); hold on
plot(x,y,'r--') xlabel('x1')
%--------------- ylabel('x2')
hold on
t=0:pi/100:2*pi; axis([-6 5 -5 5])
x=1+4*cos(t); % tam (1,0)
bankinh 4
:
Hình 1b
Hình 1a vaø hình 1b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 1b:
t=0:pi/100:2*pi; y=0+2*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'g')
bankinh 1 %---------------
y=0+1*sin(t); hold on
plot(x,y,'r') t=0:pi/100:2*pi;
%--------------- x=-1+3*cos(t); % tam (-1,0)
hold on bankinh 3
t=0:pi/100:2*pi; y=0+3*sin(t);
x=-1+2*cos(t); % tam (-1,0) plot(x,y,'r--')
bankinh 2 %---------------
Trang 226
Chương 2: ðiều khiển tối ưu
hold on plot(x,y,'b')
t=0:pi/100:2*pi; hold on
x=-1+4*cos(t); % tam (-1,0) xlabel('x1')
bankinh 4 ylabel('x2')
y=0+4*sin(t); axis([-6 5 -5 5])
Roõ raøng quyõ ñaïo traïng thaùi toái öu chæ coù theå ñöôïc taïo ta töø caùc cung cuûa
nhöõng ñöôøng troøn
Trang 227
Chương 2: ðiều khiển tối ưu
Hình 3: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 3:
t=0:pi/100:pi; y=0+2.5*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'r')
bankinh 1 hold on
y=0+1*sin(t); %--------------
plot(x,y,'c') t=0:-pi/100:-pi;
hold on x=1+1*cos(t); % tam (1,0)
t=0:pi/100:pi; bankinh 1
x=-3+1*cos(t); % tam (-3,0) y=0+1*sin(t);
bankinh 1 plot(x,y,'b')
y=0+1*sin(t); hold on
plot(x,y,'g') xlabel('x1')
hold on ylabel('x2')
%-------------- axis([-5 3 -3 3])
t=-0.39:pi/100:2.78 grid
x=-1+2.5*cos(t); % tam (-1,0)
bankinh 2.5
Trang 228
Chương 2: ðiều khiển tối ưu
Hình 5 : Ñöôøng chuyeån ñoåi giaù trò cuûa tín hieäu ñieàu khieån toái öu
Trang 229
Chương 2: ðiều khiển tối ưu
y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'k') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:-pi/100:-pi; x=-5+1*cos(t); % tam (-5,0)
x=5+1*cos(t); % tam (5,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'k')
plot(x,y,'b') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:pi/100:pi; x=-7+1*cos(t); % tam (-3,0)
x=-1+1*cos(t); % tam (-1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'b')
plot(x,y,'g') hold on
hold on %--------------
%-------------- xlabel('x1')
t=0:pi/100:pi; ylabel('x2')
x=-3+1*cos(t); % tam (-3,0) axis([-10 10 -4 4])
bankinh 1 grid
y=0+1*sin(t);
Trang 230
Chương 2: ðiều khiển tối ưu
Hình 6a
Hình 6b
Hình 6a vaø hình 6b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 6b:
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
Trang 231
Chương 2: ðiều khiển tối ưu
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
Hình 6c
Hình 6a, hình 6b, hình 6c : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái
öu
Code hình 6c:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
Trang 232
Chương 2: ðiều khiển tối ưu
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
Trang 233
Chương 2: ðiều khiển tối ưu
Hình 8: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 8:
t=0:-pi/100:-pi; x=x-12;
x=4*cos(t); y=2*sin(t);
x=x+4; plot(x,y,'g')
y=2*sin(t); hold on
plot(x,y,'k') t=-0.505:pi/100:2.649
hold on x=8*cos(t);
t=0:pi/100:pi; x=x-4;
x=4*cos(t); y=4*sin(t);
x=x-4; plot(x,y,'b')
y=2*sin(t); hold on
plot(x,y,'r') xlabel('x1')
hold on ylabel('x2')
t=0:pi/100:pi; axis([-20 20 -10 10])
x=4*cos(t); grid
Trang 234
Chương 2: ðiều khiển tối ưu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
[K,S] = lqr(A,B,Q,R)
Keát quaû:
K =[1.0000 3.4641]
S =[ 2.1962 1.0000; 1.0000 3.4641]
Chöông trình giaûi phöông trình vi phaân:
function Vp=ssequi(t,V)
global D
Vp=D*V;
% Giai phuong trinh vi phan tim V
global D
D = -(A-B*K)'
v0 = [0.535 1.887]';
t0 = 0;
tf = 0.05;
nt = 5000;
t = linspace(t0,tf,nt);
options = odeset('reltol',1.0e-6);
[tn,v] = ode23('ssequi',[t0,tf],v0,options);
Vs = v';
V = Vs(:,end)
Keát quaû:
V =[0.6373 2.2120]T
Trong chöông trình giaûi phöông trình vi phaân ta phaûi choïn ñieàu kieän
ñaàu V0 sao cho vôùi ñieàu kieän ñaàu V0 ta coù keát quaû cuoái cuûa V duøng ñeå
tìm luaät ñieàu khieån thoaû ñieàu kieän x1(t) baùm theo r(t).
Tìm P từ ma trận V:
v2=V(2,:)
P=v2^3/3
Keát quaû:
P = 3.6078
Tìm luaät ñieàu khieån u(t):
Trang 235
Chương 2: ðiều khiển tối ưu
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
Keát quaû:
Kx =[0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
x1
Vaäy luaät ñieàu khieån laø: u = −[k1 k 2] − Kr.r
x2
b. Nếu r(t)=u-1(t) , giải tìm u(t) khi x(0)=0.
function Vp=ssequi(t,V)
global D
Vp=D*V;
%----------------------------------------
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
% Dung thuat toan lqr de tim K,S
[K,S] = lqr(A,B,Q,R)
%Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.535 1.887]';
t0=0;
tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Trang 236
Chương 2: ðiều khiển tối ưu
Vs=v';
V=Vs(:,end)
v2=V(2,:)
% Tinh P
% ===========================
P=v2^3/3
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j =(-x_vocung'*S*x_vocung + x0'*S*x0)/2
Keát quaû:
Kx = [0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
x0=[0 0]'
x_vocung =[1 0]'
j = -1.0981
x1
Vaäy luaät ñieàu khieån: u = −[k1 k 2] − Kr.u −1 (t )
x
2
Chæ tieâu chaát löôïng : J = -1.0981
c. Moâ phoûng
1/ Trong tröôøng hôïp x(0)=0; r(t)=u-1(t)
Sô ñoà moâ phoûng khi coù nhieãu ño:
Trang 237
Chương 2: ðiều khiển tối ưu
Trang 238
Chương 2: ðiều khiển tối ưu
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
%Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0 )/2
% Goi mo hinh simulink
%===============================
sim('mophong')
%===============================
% Ve dap ung ra x1
figure;
subplot(2,1,1);
plot(x1(:,2),'b');
hold on;
%===============================
% Ve tin hieu vao r
plot(r(:,2),'r');
axis([0 60 -2 2]);
legend('x1','r')
title('KET QUA MO PHONG')
hold on;
% ==============================
% Ve sai so
Trang 239
Chương 2: ðiều khiển tối ưu
subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu u-1(t) vôùi thôøi gian oån
ñònh 17sec, khoâng coù voït loá.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 240
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Khi coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-
1(t) vôùi thôøi gian oån ñònh 17sec, khoâng coù voït loá nhöng khoâng theå loaïi
boû ñöôïc phöông sai nhieãu. Traïng thaùi ban ñaàu x1(t) ñöôïc naâng leân moät
löôïng ñuùng baèng giaù trò trung bình nhieãu.
Moâ phoûng khi coù nhieãu heä thoáng:
Keát quaû moâ phoûng khi coù nhieãu heä thoáng vôi giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Nhaän xeùt: coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-1(t)
vôùi thôøi gian oån ñònh 17sec, khoâng voït loá vaø traïng thaùi ñaàu x1(t) khoâng
thay ñoåi. Tuy nhieân vaãn bò aûnh höôûng cuûa phöông sai nhieãu.
2. Trong tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1)
Trang 241
Chương 2: ðiều khiển tối ưu
%===================================
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
mean=0.5; % Gia tri trung binh cua nhieu
variance = 0.0001; % Phuong sai nhieu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
%===================================
% Giai tim K,S bang thuat toan lqr
[K,S] = lqr(A,B,Q,R)
%===================================
% Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.5338 1.8899]';
t0=0;
Trang 242
Chương 2: ðiều khiển tối ưu
tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
% Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[1 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0)/2
Trang 243
Chương 2: ðiều khiển tối ưu
hold on;
% ==============================
% Ve sai so
subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')
Keát quaû:
K =[ 1.0000 3.4641]
S = [2.1962 1.0000; 1.0000 3.4641]
V = [0.6362 2.2155]T
P = 3.6250
Kx =[ 0.6112 2.1100]
k1 = 0.6112
k2 = 2.1100
Kr = 0.6112
x0 = [1 0]T
x_vocung = [1 0]T
j= 0
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 244
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät
tieâu ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân
khoâng trieät tieâu ñöôïc phöông sai nhieãu.
Sô ñoà moâ phoûng tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1) coù nhieãu heä
thoáng:
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 245
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät tieâu
ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân khoâng
trieät tieâu ñöôïc phöông sai nhieãu
Ñeå coù cô sôû so saùnh ta moâ phoûng trong tröôøng hôïp tín hieäu vaøo laø hình
sin hoaëc xung vuoâng.
Sô ñoà moâ phoûng hoaøn toaøn gioáng nhö treân chæ khaùc khoái nguoàn.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:
0.5
-0.5
-1
-1.5
-2
0 10 20 30 40 50 60 70 80 90 100
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r
0.5
-0.5
-1
-1.5
-2
0 20 40 60 80 100 120 140 160 180 200
Trang 246
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu ôû möùc ñuùng baèng giaù trò trung bình cuûa nhieãu.
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:
0.5
-0.5
-1
-1.5
-2
0 10 20 30 40 50 60 70 80 90 100
Nhận xét: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu. Traïng thaùi ban ñaàu x1(t)=0;
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r
0.5
-0.5
-1
-1.5
-2
0 20 40 60 80 100 120 140 160 180 200
Nhận xét: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu baèng 0.
Trang 247
Chương 2: ðiều khiển tối ưu
2. Hệ rời rạc
Xét hệ vô hướng :
xk +1 = axk + buk
với chỉ tiêu chất lượng :
1 1 N −1
Ji = sN xN2 + ∑ qxk2 + ruk2
( )
2 2 k =i
a = 1.05 , b = 0.01 , q = r = 1 , x0 = 10 , N = 100 . Chúng ta sẽ xét hai trường
hợp sN = 5 và sN = 500 bằng chương trình dex ñể tìm các quỹ ñạo tối ưu .
Chương trình :
function [x,u,K,S] = dex
a = 1.05;
b = 0.01;
q = 1;
r = 1;
x0 = 10;
s = 5;
N = 100;
S(N+1) = s;
for k = N:-1:1
K(k) = ( a * b * s ) / ( r + s * b^2 );
s = q + ( r * s * a^2 ) / ( r + s * b^2 );
S(k) = s;
end
x(1) = x0;
for k = 1:N
u(k) = -K(k) * x(k);
x(k+1) = a * x(k) + b * u(k);
end
Trang 248
Chương 2: ðiều khiển tối ưu
Trang 249
Chương 2: ðiều khiển tối ưu
Trang 250
Chương 2: ðiều khiển tối ưu
Trang 251
Chương 2: ðiều khiển tối ưu
(& 2 dt
J = ∫ Ψ2 + Ψ )
0
Hãy chứng minh hàm biến số phụ Ψ ñược xác ñịnh từ ñiều kiện cực tiểu của
J như sau :
Ψ+Ψ & =0
3. Phát biểu nguyên lý tối ưu của Bellman . Trình bày ý tưởng giải quyết bài
toán tối ưu của phương pháp quy hoạch ñộng .
4. Trình bày nguyên lý cực tiểu của Pontryagin
5. Phát biểu tiêu chuẩn ổn ñịnh thứ hai của Lyapunov .
6. Ứng dụng Lyapunov trong bài toán LQR liên tục .
7. Chứng minh ma trận Q là ma trận xác ñịnh dương:
Q = x12 + 4 x 22 + x32 + 2 x1 x 2 − 6 x 2 x3 − 2 x1 x3
8. Chứng minh ma trận Q là ma trận xác ñịnh âm:
Q = − x12 − 3 x 22 − 11x32 + 2 x1 x 2 − 4 x 2 x3 − 2 x1 x3
9. Viết một số hàm Lyapunov cho hệ thống sau:
x&1 − 1 1 x1
x& = 2 − 3 x
2 2
Xác ñịnh tính ổn ñịnh của hệ thống.
10. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = − x1 − 2 x 2 + 2
x& 2 = x1 − 4 x 2 − 1
11. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = x1 + 3x 2
x& 2 = −3x1 − 2 x 2 − 3x3
x& 3 = x1
Trang 252
Chương 2: ðiều khiển tối ưu
sao cho khoảng cách từ (x , y) ñến ñiểm có toạ ñộ (2,2) là ngắn nhất . Tính
khoảng cách ñó .
13. a. Tìm hình chữ nhật có diện tích lớn nhất với chu vi p. Nghĩa là tìm x
và y thoả mãn cực ñại hoá hàm :
L( x, y ) = xy
với ñiều kiện ràng buộc : f ( x, y ) = 2 x + 2 y − p = 0
b. Tìm hình chữ nhật có chu vi nhỏ nhất với diện tích cho trước là a 2 .
Nghĩa là cực tiểu hoá hàm :
L ( x, y ) = 2 x + 2 y
với ñiều kiện ràng buộc : f ( x, y ) = xy − a 2 = 0
14. Cho hệ thống :
. 2 2 1
x= x + u
1 0 3
Tìm các giá trị tối ưu x∗ , u ∗ , L∗ thoả mãn cực tiểu chỉ tiêu chất lượng :
1 1 0 1 2 1
L = xT x + uT u
2 0 2 2 1 1
15. Cho hệ thống :
d2y
=u
dt 2
Tìm tín hiệu ñiều khiển u thoả mãn cực tiểu chỉ tiêu chất lượng :
1
1
J = ∫ µ u&&2 + ρ u dt
−1
2
với các ñiều kiện ñầu :
y (−1) = y (1) = 0
y& (−1) = y& (1) = 0
16. Cho hệ thống :
di − R u
= i+
dt L L
i: dòng ñiện
Trang 253
Chương 2: ðiều khiển tối ưu
1
J = ∫ u 2 dt
0
với x(0) = 0 và x(1) = 2 .
c. Tìm quỹ ñạo trạng thái tối ưu .
17. Cho hệ thống :
xk +1 = xk uk + uk2
với chỉ tiêu chất lượng:
N −1
J 0 = xN2 + ∑ xk uk
k =0
Cho N = 2 . Tín hiệu ñiều khiển chỉ nhận các giá trị : uk = 1 hoặc uk = −1 .
xk nhận các giá trị -1, 0, 1, 2 .
a. Sử dụng phương pháp quy hoạch ñộng ñể tìm luật ñiều khiển hồi tiếp
trạng thái tối ưu .
b.Với x0 = 2 , hãy tìm tổn hao tối ưu, luật ñiều khiển và quỹ ñạo trạng
thái .
18. Xét hệ tác ñộng nhanh có dạng sau :
d 2x
+x=u
dt 2
u ≤1
Tìm quỹ ñạo pha tối ưu ñể ñưa hệ về gốc toạ ñộ từ một ñiểm bất kỳ .
19. Cho hệ thống :
x&1 = x2
x&2 = u
∞
1
( )
J = ∫ x12 + 2vx1 x2 + qx22 + u 2 dt
20
( )
với q − v 2 > 0 .
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
c. Vẽ quỹ ñạo nghiệm số của hệ thống khi q thay ñổi từ 0 ñến ∞ . Với
giá trị nào của q thì hệ thống ổn ñịnh .
20. Cho hệ thống :
x&1 = x1 + u
x& 2 = − x1 + x2
Trang 254
Chương 2: ðiều khiển tối ưu
∞
1
J = ∫ ( x12 + x 22 + ru 2 ) dt
20
1
với r = .
10
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
21. Cho hệ thống :
x&1 = x2
x&2 = − ax1 − 2 x2 + u
và chỉ tiêu chất lượng :
∞
1
( )
J = ∫ 2 x12 + x22 + u 2 dt
20
a. Vẽ quỹ ñạo nghiệm số của hệ hở khi a thay ñổi từ 0 ñến ∞ . Với giá
trị nào của a thì hệ thống ổn ñịnh .
b. Với a = -8 tìm lời giải cho phương trình ñại số Riccati và hệ số K .
22. Xét hệ rời rạc :
xk +1 = 2 xk + uk
a. Tìm lời giải xk với k = 0 ; 5 nếu x0 = 3 .
b. Xác ñịnh luật uk tổn hao năng lượng tối thiểu ñể ñưa hệ thống từ x0 = 3
về x5 = 0 . Vẽ quỹ ñạo trạng thái tối ưu. Chỉ tiêu chất lượng hệ hở
(q=0):
1 N −1
J = ∑ uk2
2 k =0
c. Tìm luật hồi tiếp trạng thái Kk tối ưu sao cho chỉ tiêu chất lượng J ñạt cực
tiểu :
4
J = 5 x52 + 0.5∑ xk2 + uk2
( )
k =0
Tính hàm tổn thất J tối ưu với k = 0 ; 5 .
23. Xét hệ rời rạc :
xk +1 = axk + buk
1 1 N −1
J = sN xN3 + ∑ qxk3 + ruk3
( )
3 3 k =0
với xk , uk là vô hướng .
a. Tìm phương trình trạng thái, phương trình ñồng trạng thái và ñiều kiện
tĩnh .
Trang 255
Chương 2: ðiều khiển tối ưu
b. Khi nào thì ta có thể tìm ñược luật ñiều khiển tối ưu uk . Với ñiều kiện
ñó , hãy khử uk trong phương trình trạng thái .
c. Tìm lời giải bài toán ñiều khiển vòng hở (trạng thái cuối xN cố ñịnh,
sN = 0 , q = 0 ) .
24. Cho hệ thống ñược mô tả bởi hệ phương trình trạng thái:
y& = v
u (t ) ≤ 1
v& = u
Vẽ quỹ ñạo pha tối ưu ñưa hệ từ trạng thái ban ñầu về gốc tọa ñộ với thời
gian ngắn nhất trong các trường hợp sau ñây:
a. x1(0) = 4, x2(0) = 3
b. x1(0) = 4, x2(0) =- 3
c. x1(0) = -4, x2(0) = -3
d. x1(0) = -4, x2(0) = 3
1. Giải với luật ñiều khiển Bang Bang.
2. Giải với luật ñiều khiển Bang off Bang, T = 45 s
25. Moät taøu chôû haøng goàm ba loaïi sau :
Troïng löôïng w(lb) Giaù thaønh v($)
Maùy röûa cheùn 100 360
Maùy giaët 125 475
Tuû laïnh 250 1000
Ñaët uk laø soá maùy ñöôïc taûi leân taøu cho ba loaïi treân : k=1,2,3
u1 = soá tuû laïnh ñöôïc chôû leân taøu , u2 = soá maùy giaët & u3 = soá maùy röûa
cheùn. wk laø troïng löôïng ,vk laø giaù thaønh .
Ñaët xk laø taûi troïng cho pheùp ñoái vôùi töøng loaïi haøng .
Yeâu caàu haøm chæ tieâu J laø cöïc ñaïi:
3
J = ∑ vk uk
k =1
Vôùi ñieàu kieän raøng buoäc laø taûi troïng ( W ) toái ña taøu ñöôïc pheùp chôû laø
730 lb
3
∑w u
k =1
k k ≤W
Trang 256