Professional Documents
Culture Documents
Chuong 2 DieuKhienToiUuDong Phan4
Chuong 2 DieuKhienToiUuDong Phan4
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
Phương pháp quy học động do Bellman đề xuất năm 1957.
Là thuật toán xác định dãy giá trị điều khiển tối u(k) đề chỉ
tiêu chất lượng J đạt min.
Nguyên lý của phương pháp: Mỗi đoạn cuối của quỹ đạo trạng
thái tối ưu cũng là một quỹ đạo trạng thái tối ưu.
Ví dụ: Tìm đường ngắn nhất từ A đến Z:
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Phân chia đường thành các 5 bước:
1
12/14/2018
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
-Ký hiệu:
+ Nki là nút thứ i ở bước k
+
k
J∗(Nki) là khoảng cách ngắn nhất từ nút Nki đến nút đích Z
+ d(Nki, Nk+1,j) là khoảng cách từ nút Nki đến nút Nk+1,j
-Phương trình Bellman: J∗ k Nki = min d(Nki , Nk+1,j )+Jk∗+1 Nk+1,j
-Vậy ta phải tìm khoảng cách ngắn nhất từ nút đầu đến nút đích là: J∗1 N11
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Giải: Làm từ vòng ngược:
- Đi từ bước 5: J∗(N51)
5
=0
- Đi từ bước 4: J∗(N41)
4
=min d(N41, N51)+J∗
5
N51 =2
J∗(N42)
4
=min d(N42, N51)+J∗
5
N51 =4
Bước 4 này thì tại mỗi nút ta vẫn chỉ có 1 lựa chọn
2
12/14/2018
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Đi từ bước 3: J∗(N3i)
3
=min d(N3i, N4j)+J∗
4
N4j
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Đi từ bước 2: J∗(N2i)
2
=min d(N2i, N3j)+J∗
3
N3j
Điểm đi d(N2i , N3j )+J∗ ∗ N3j J ∗ (N ) Điểm đến tối
3 2 ∗ 2i
Điểm
N2i d(N2i, N3j)+J3 J2(N Điểm
ưuđến
đi N31(6) N32(7) N33(8) tối
N21 N31( N32( N33(
6+6=12 4+7=11 3+8=11 11 N32Hoặc N33
NN
22 2+6=8 3+7=10 4+8=12 8 N31
NN23 2+6=8 1+7=8 5+8=13 8 N31 hoặc N32
N
3
12/14/2018
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Đi từ bước 1: J∗(N11)
1
=min d(N11, N2j)+J∗
2
N2j
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Vậy đường đi tối ưu là: N11→ N22→ N31→ N42→ N51 Với J*=10.
4
12/14/2018
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
Bài tập: Tìm đường đi tối ưu
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Đi từ bước 6: J∗(N61)
6
=0;6 J∗(N62) =0
- Đi từ bước 5: J∗(N5i)
5
=min d(N5i, N6j)+J∗
6
N6j
5
12/14/2018
2.4 ĐKhiển T/Ưu Liên Tục Bằng Phương Pháp Phương Pháp Quy Hoạch động
- Đi từ bước 4: J∗(N4i)
4
=min d(N4i, N5j)+J∗
5
N5j
6
12/14/2018
Cách giải: Áp dụng nguyên lý tối ưu của Bellman, tìm quỹ đạo tối ưu từng đoàn từ điểm cuối xN ngượ
Hàm mục tiêu tối ưu cho đoạn từ điểm x k đến điểm cuối:
Vậy: J∗(x
k
k )= nin L x k , uk+ J∗(x k + 1 )(Phương
k+1
trình Bellman)
Ta có: min J = J∗(
O x 0 ), Vậy giải PT Bellman theo vòng ngược
k=N-1→0 sẽ tìm được nghiệm tối ưu.
J∗(x
k k )= nin L x k , u k + J∗
k+1(x k + 1 )
- Giải phương trình Bellman:
Theo vòng ngược ta tìm được u∗(k) phụ thuộc x k
Theo vòng xuôi, kết hợp với điều kiện đầu x 0 ta sẽ tìm
được cụ thể u∗(k) và x k
7
12/14/2018
3 x 3 = 2. x2 3
=>J∗
8
12/14/2018
9
12/14/2018
1
12/14/2018
J = ∑3x12
k=O k + x22 k đạt min
Bài 2:
Tìm đường đi tối ưu
Bài 1:
Xét đối tượng
x1 k + 1 = x1 k +2. x2 k x2 k + 1 = x2 k +u k /2
Xác định tín hiệu điều khiển tối ưu u∗(k) để hệ thống đi từ trạng
thái x 0 = [1 2] đến x 4 = [0 0]để:
1
12/14/2018
x1 k + 1 = x1 k +2. x2 k x2 k + 1 = x2 k +u k /2
x 0 = [1 2] đến x 4 = [0 0] , J = ∑3
Thực hiện vòng ngược:
k=O x12 k + x22 k
k=3 ta có:
J∗(x
3 3 )= nin x12 3 + x22 3 4+ J∗(x 4 )=
min x12 3 + x22 3
Với điều kiện ràng buộc:
x1 4 = x1 3 +2. x2 3 =0
x2 4 = x2 3 +u 3 /2=0
3 = −2. x2 3
=>u∗
=>J∗
3 x 3= 5. x22(3)
x1 k + 1 = x1 k +2. x2 k x2 k + 1 = x2 k +u k /2
x 0 = [1 2] đến x 4 = [0 0] , J = ∑3
Thực hiện vòng ngược:
k=O x12 k + x22 k
k=2 ta có:
J∗(x
2 2 )= nin x12 2 + x22 2 3+ J∗(x 3 )=
min x12 2 + x22 2 + 5. x22(3) =
Với điều kiện ràng buộc:
x1 3 = x1 2 +2. x2 2
x2 3 = x2 2 +u 2 /2
=>J∗(x
2 2 )=min x12 2 + x22 2 + 5. x2 2 +u 22 /2
2 = −2. x2 2
=>u∗
=>J∗
2 x 2= x12 2 + x22 2
1
12/14/2018
x1 k + 1 = x1 k +2. x2 k x2 k + 1 = x2 k +u k /2
x1 k + 1 = x1 k +2. x2 k x2 k + 1 = x2 k +u k /2
x 0 = [1 2] đến x 4 = [0 0] , J = ∑3
k=O x12 k + x22 kThực
hiện vòng ngược:
k=0 ta có:
J∗(x
O 0 )= nin x12 0 + x22 0 1 + J∗(x 1 )=
min x12 0 + x22 0 + 2. x12 1 + 5. x22 1 +4. x1 1 . x2 1=
Với điều kiện ràng buộc:
x1 1 = x1 0 +2. x2 0
x2 1 = x2 0 +u 0 /2
=>J∗(x
O 0 )=min … …
O = −2. x2 0
=>u∗
O x 0 =⋯ ….
=>J∗