Professional Documents
Culture Documents
LÝ THUYẾT
ðIỀU KHIỂN HIỆN ðẠI
Lyù thuyeát ñieàu khieån töï ñoäng vaø Lyù thuyeát ñieàu khieån hieän ñaïi laø
hai moân hoïc ñaëc thuø cuûa ngaønh Ñieàu khieån töï ñoäng.
Phöông phaùp phaân tích vaø thieát keá heä thoáng trong mieàn thôøi gian
vaø taàn soá ñöôïc trình baøy trong giaùo trình Lyù thuyeát ñieàu khieån töï ñoäng.
Caùch tieáp caän döïa treân caùc coâng thöùc toaùn hoïc hay nhöõng ñònh luaät khoa
hoïc ñeå moâ taû heä thoáng ñaõ ñöôïc giaûn löôïc nhöõng yeáu toá baát ñònh vaø phöùc
taïp thöôøng cho ñaùp soá raát chính xaùc. Tuy nhieân yeáu ñieåm chính cuûa caùch
tieáp caän naøy laø phaûi tìm ra coâng thöùc toaùn hoïc hay gæa töôûng nhöõng ñieàu
kieän vaän haønh heä thoáng cho gioáng vôùi thöïc teá , maø ñieàu naøy khoâng theå
thöïc hieän theo caùch kinh ñieån thoâng thöôûng. Khi heä thoáng phöùc taïp caùch
tieáp caän thaønh coâng laø ñieàu khieån tích hôïp, keát hôïp ñöôïc caùc phöông
phaùp ñieàu khieån kinh ñieån, hieän ñaïi vôùi coâng ngheä tính toaùn meàm mang
tính thoâng minh.
Muïc ñích cuûa baøi toaùn ñieàu khieån laø naâng cao chaát löôïng cuûa heä
thoáng, caøi ñaët caùc boä ñieàu khieån ñaûm baûo chæ tieâu chaát löôïng toái öu trong
caùc ñieàu kieän raøng buoäc hoaëc heä thoáng ñöôïc thieát keá phaûi coù tính thích
nghi vaø beàn vöõng trong moâi tröôøng laøm vieäc luoân bieán ñoäng.
Quyeån saùch Lyù thuyeát ñieàu khieån hieän ñaïi goàm 4 chöông.
Chöông 1 Coâng ngheä tính toùan meàm
trình baøy caùc khaùi nieäm cô baûn vaø moät soá öùng duïng coâng ngheä tính toaùn
meàm trong ñieàu khieån. Trình töï thieát keá boä ñieàu khieån môø, môø toái öu,
caùc boä môø thích nghi, nhaän daïng vaø ñieàu khieån duøng maïng nô-ron, giaûi
thuaät di truyeàn tìm kieám lôøi giaûi toái öu ñöôïc ñeà caäp qua caùc ví duï minh
hoïa mang tính giôùi thieäu toång quan.
Chöông 2 Ñieàu khieån toái öu
Ñaëc ñieåm cöïc trò cuûa heä thoáng khi xaây döïng baøi toaùn toái öu vaø
thaønh laäp haøm chæ tieâu chaát löôïng, haøm Hamilton. Caùc phöông phaùp toái
öu ñöôïc trình baøy laø phöông phaùp bieán phaân coå ñieån Euler-Lagrange,
nguyeân lyù cöïc ñaïi Pontryagin, qui hoaïch ñoäng Bellman vaø ñieàu khieån toái
öu tuyeán tính daïng toaøn phöông LQR. Nhaän xeùt & choïn löïa giaûi phaùp toái
öu cho baøi toaùn . Caùc ví duï minh hoïa ñöôïc trình baøy theo nhieàu caùch giaûi
khaùc nhau vaø ñöôïc kieåm chöùng baèng chöông trình moâ phoûng trong
MATLAB.
Chöông 3 Ñieàu khieån thích nghi
Khaùi nieäm veà ñieàu khieån thích nghi, öôùc löôïng tham soá vaø phaân
loaïi heä thoáng thích nghi. Heä thích nghi moâ hình tham chieáu vôùi luaät MIT
laø troïng taâm cuûa chöông, ñöôïc dieãn giaûi qua caùc ví duï thieát keá boä môø
thích nghi, nô-ron môø thích nghi cho heä thoáng ñoäng. Heä töï chænh ñònh
STR giaùn tieáp vaø tröïc tieáp vôùi nhieãu tieàn ñònh & nhieãu ngaãu nhieân. Kyõ
thuaät chænh ñònh vaø lòch trình ñoä lôïi ñöôïc trình baøy ôû phaàn cuoái chöông.
Thoâng qua caùc ví duï töø ñôn giaûn ôû chöông 1 ñeán caùc ví duï phöùc taïp ôû
chöông 3 baøi toaùn thieát keá boä ñieàu khieån thích nghi ñöôïc laøm saùng toû
daàn. Phöông phaùp thieát keá duøng lyù thuyeát oån ñònh Lyapunov ñöôïc xem laø
giaûi phaùp khaû thi trong vieäc kieåm soaùt tính oån ñònh cuûa heä thoáng thích
nghi.
Chöông 4 Ñieàu khieån beàn vöõng
Khaùi nieäm ñieàu khieån beàn vöõng, caùc pheùp toaùn cô baûn trong khaûo
saùt tính beàn vöõng cuûa heä SISO vaø MIMO. Boä quan saùt, boä loïc Kalman,
giaûi thuaät thieát keá vaø ví duï minh hoïa ñöôïc dieãn giaûi trong phöông phaùp
LQG. Ñieàu khieån beàn vöõng H∞ ñöôïc trình baøy qua bieåu ñoà Bode ña bieán,
haøm nhaïy vaø haøm buø nhaïy, thuû tuïc thieát keá naén daïng voøng LSDP, ví duï
thieát keá H∞ caùnh tay meàm deûo .Thieát keá toái öu H2 ñöôïc ñeà caäp trong ví
duï öùng duïng giaûi thuaät di truyeàn .
Maëc duø ñaõ coá gaéng söu taàm nhieàu taøi lieäu cuûa caùc Tröôøng Ñaïi
Hoïc trong nöôùc vaø treân theá giôùi, song noäi dung quyeån saùch khoù traùnh
khoûi nhöõng thieáu soùt vaø haïn cheá.
Taùc giaû xin chaân thaønh caûm ôn caùc Thaày giaùo, Coâ giaùo Boä moân
Ñieàu khieån töï ñoäng, caùc em sinh vieân, Ban coâng taùc Giaùo trình Tröôøng
Ñaïi Hoïc Baùch Khoa vaø Nhaø Xuaát baûn Ñaïi Hoïc Quoác Gia Tp HCM ñaõ
taïo ñieàu kieän vaø giuùp ñôõ nhieät tình ñeå hoaøn thaønh quyeån saùch naøy.
Taùc giaû chaân thaønh caûm ôn nhöõng yù kieán ñoùng goùp cuûa caùc baïn
ñoïc xa gaàn ñeå quyeån saùch ñöôïc hoaøn thieän hôn.
Thö goùp yù xin göûi veà Boä moân Ñieàu khieån töï ñoäng-Khoa Ñieän-Ñieän töû
Tröôøng Ñaïi Hoïc Baùch Khoa – ÑHQG Tp HCM.
Ñòa chæ 268 Lyù Thöôøng Kieät, Quaän 10, Tp HCM
Ñieän thoïai : 08 - 8654357
Email : ntpha@hcmut.edu.vn
phuonghagv@yahoo.com
Taùc giaû
Mục lục
1.5. Sự kết hợp các thành phần của tính toán mềm........................108
1.5.1. Kết hợp mạng nơ-ron nhân tạo và logic mờ ........................108
1.5.2. Kết hợp giải thuật di truyền và logic mờ .............................109
1.5.3. Kết hợp mạng nơ-ron và giải thuật di truyền.......................110
2.3 ðiều khiển tối ưu các hệ tuyến tính với phiếm hàm dạng toàn
phương ..........................................................................................203
2.3.1 Ổn ñịnh Lyapunov ñối với hệ thống tuyến tính....................203
2.3.2 ðiều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng
toàn phương _ Phương trình Riccati ñối với hệ liên tục.......204
2.3.3 Phương trình Riccati ñối với hệ rời rạc ................................206
2.3.4 Các bước giải bài toán toàn phương tuyến tính ....................209
2.3.5 Nhận xét................................................................................219
Chương 1
Trang 5
Chương 1 : Công nghệ tính toán mềm
Trong thực tế cuộc sống, các bài toán liên quan ñến hoạt ñộng nhận
thức, trí tuệ của con người ñều hàm chứa những ñại lượng, thông tin mà bản
chất là không chính xác, không chắc chắn, không ñầy ñủ. Ví dụ: sẽ chẳng
bao giờ có các thông tin, dữ liệu cũng như các mô hình toán ñầy ñủ và chính
xác cho các bài toán dự báo thời tiết. Nhìn chung con người luôn ở trong bối
cảnh là không có thông tin ñầy ñủ và chính xác cho các hoạt ñộng ra quyết
ñịnh của bản thân mình.
Trong lĩnh vực khoa học kĩ thuật cũng vậy, các hệ thống phức tạp
trên thực tế thường không thể mô tả ñầy ñủ và chính xác bởi các phương
trình toán học truyền thống. Kết quả là những cách tiếp cận kinh ñiển dựa
trên kỹ thuật phân tích và các phương trình toán học nhanh chóng tỏ ra
không còn phù hợp. Vì thế, công nghệ tính toán mềm chính là một giải pháp
trong lĩnh vực này.
Trang 6
Chương 1 : Công nghệ tính toán mềm
cho các hệ ra quyết ñịnh. Tại Nhật logic mờ ñược ứng dụng vào nhà máy xử
lý nước của Fuji Electronic vào 1983, hệ thống xe ñiện ngầm của Hitachi
vào 1987.
Lý thuyết mờ ra ñời ở Mỹ, ứng dụng ñầu tiên ở Anh nhưng phát triển mạnh
mẽ nhất là ở Nhật. Trong lĩnh vực Tự ñộng hoá logic mờ ngày càng ñược
ứng dụng rộng rãi. Nó thực sự hữu dụng với các ñối tượng phức tạp mà ta
chưa biết rõ hàm truyền, logic mờ có thể giải quyết các vấn ñề mà ñiều
khiển kinh ñiển không làm ñược.
Một cách tổng quát, một hệ thống mờ là một tập hợp các qui tắc dưới dạng
If … Then … ñể tái tạo hành vi của con người ñược tích hợp vào cấu trúc
ñiều khiển của hệ thống.
Việc thiết kế một hệ thống mờ mang rất nhiều tính chất chủ quan, nó tùy
thuộc vào kinh nghiệm và kiến thức của người thiết kế. Ngày nay, tuy kỹ
thuật mờ ñã phát triển vượt bậc nhưng vẫn chưa có một cách thức chính quy
và hiệu quả ñể thiết kế một hệ thống mờ. Việc thiết kế vẫn phải dựa trên
một kỹ thuật rất cổ ñiển là thử - sai và ñòi hỏi phải ñầu tư nhiều thời gian ñể
có thể ñi tới một kết quả chấp nhận ñược.
ðể hiểu rõ khái niệm “MỜ” là gì ta hãy thực hiện phép so sánh sau :
Trong toán học phổ thông ta ñã học khá nhiều về tập hợp, ví dụ như tập các
số thực R, tập các số nguyên tố P={2,3,5,...}… Những tập hợp như vậy ñược
gọi là tập hợp kinh ñiển hay tập rõ, tính “RÕ” ở ñây ñược hiểu là với một
tập xác ñịnh S chứa n phần tử thì ứng với phần tử x ta xác ñịnh ñược một giá
trị y=S(x).
Giờ ta xét phát biểu thông thường về tốc ñộ một chiếc xe môtô : chậm,
trung bình, hơi nhanh, rất nhanh. Phát biểu “CHẬM” ở ñây không ñược chỉ
rõ là bao nhiêu km/h, như vậy từ “CHẬM” có miền giá trị là một khoảng
nào ñó, ví dụ 5km/h – 20km/h chẳng hạn. Tập hợp L={chậm, trung bình, hơi
nhanh, rất nhanh} như vậy ñược gọi là một tập các biến ngôn ngữ. Với mỗi
thành phần ngôn ngữ xk của phát biểu trên nếu nó nhận ñược một khả năng
µ(xk) thì tập hợp F gồm các cặp (x, µ(xk)) ñược gọi là tập mờ.
Trang 7
Chương 1 : Công nghệ tính toán mềm
µF(x) : B → [0 1]
trong ñó : µF gọi là hàm thuộc , B gọi là tập nền.
MXð
Hình1.1:
• ðộ cao tập mờ F là giá trị h = SupµF(x), trong ñó supµF(x) chỉ giá trị nhỏ
nhất trong tất cả các chặn trên của hàm µF(x).
• Miền xác ñịnh của tập mờ F, ký hiệu là S là tập con thoả mãn :
S = SuppµF(x) = { x∈B | µF(x) > 0 }
• Miền tin cậy của tập mờ F, ký hiệu là T là tập con thoả mãn :
T = { x∈B | µF(x) = 1 }
• Các dạng hàm thuộc (membership function) trong logic mờ
Có rất nhiều dạng hàm thuộc như : Gaussian, PI-shape, S-shape, Sigmoidal,
Z-shape …
0.8
0.6
0.4
0.2
0.8
0.6
0.4
0.2
Trang 8
Chương 1 : Công nghệ tính toán mềm
Biến ngôn ngữ là phần tử chủ ñạo trong các hệ thống dùng logic mờ. Ở ñây
các thành phần ngôn ngữ của cùng một ngữ cảnh ñược kết hợp lại với nhau.
ðể minh hoạ về hàm thuộc và biến ngôn ngữ ta xét ví dụ sau :
Xét tốc ñộ của một chiếc xe môtô, ta có thể phát biểu xe ñang chạy:
- Rất chậm (VS)
- Chậm (S)
- Trung bình (M)
- Nhanh (F)
- Rất nhanh (VF)
Những phát biểu như vậy gọi là biến ngôn ngữ của tập mờ. Gọi x là giá trị
của biến tốc ñộ, ví dụ x =10km/h, x = 60km/h … Hàm thuộc tương ứng của
các biến ngôn ngữ trên ñược ký hiệu là :
µVS(x), µS(x), µM(x), µF(x), µVF(x)
µ
VS S M F VF
1
0.75
0.25
0 20 40 60 65 80 100 tốc ñộ
Hình 1.2:
Như vậy biến tốc ñộ có hai miền giá trị :
- Miền các giá trị ngôn ngữ :
N = { rất chậm, chậm, trung bình, nhanh, rất nhanh }
- Miền các giá trị vật lý :
V = { x∈B | x ≥ 0 }
Biến tốc ñộ ñược xác ñịnh trên miền ngôn ngữ N ñược gọi là biến ngôn ngữ.
Với mỗi x∈B ta có hàm thuộc :
x → µX = { µVS(x), µS(x), µM(x), µF(x), µVF(x) }
Ví dụ hàm thuộc tại giá trị rõ x = 65km/h là :
µX(65) = { 0;0;0.75;0.25;0 }
Trang 9
Chương 1 : Công nghệ tính toán mềm
Trang 10
Chương 1 : Công nghệ tính toán mềm
Trang 11
Chương 1 : Công nghệ tính toán mềm
6. Giải mờ
Giải mờ là quá trình xác ñịnh giá trị rõ ở ñầu ra từ hàm thuộc µB’(y) của
tập mờ B’. Có 2 phương pháp giải mờ :
1. Phương pháp cực ñại
Các bước thực hiện :
- Xác ñịnh miền chứa giá trị y’, y’ là giá trị mà tại ñó µB’(y) ñạt Max
G = { y∈Y | µB’(y) = H }
- Xác ñịnh y’ theo một trong 3 cách sau :
+ Nguyên lý trung bình
+ Nguyên lý cận trái
+ Nguyên lý cận phải
µ
G
y1 y2
Hình 1.3:
y1 + y 2
• Nguyên lý trung bình : y’ =
2
• Nguyên lý cận trái : chọn y’ = y1
• Nguyên lý cận phải : chọn y’ = y2
2. Phương pháp trọng tâm
ðiểm y’ ñược xác ñịnh là hoành ñộ của ñiểm trọng tâm miền ñược bao bởi
trục hoành và ñường µB’(y).
Công thức xác ñịnh :
∫ yµ ( y)dy
S
y’ = trong ñó S là miền xác ñịnh của tập mờ B’
∫ µ (y)dy
S
Trang 12
Chương 1 : Công nghệ tính toán mềm
m m m
∫S y ∑
k =1
µ B 'k ( y ) dy
∑ ( yµ B 'k ( y )dy )
k =1
∑M
k =1
k
y’ = m
= = m
(1.1)
m
∫∑µ B 'k ( y )dy ∑ ∫ µ B ' y ( y )dy
∑A k
S k =1 k =1 S k =1
trong ñó Mi = ∫ yµ
S
B 'k ( y )dy và Ai = ∫µ
S
B 'k ( y )dy i=1,2,…,m
m1 m2 y
a b
Xét riêng cho trường hợp các hàm thuộc dạng hình thang như hình trên :
H
Mk = (3m22 − 3m12 + b 2 − a 2 + 3m2 b + 3m1a)
6
H
Ak = (2m2 – 2m1 + a + b)
2
Chú ý hai công thức trên có thể áp dụng cả cho luật Max-Min
♦ Phương pháp ñộ cao
Từ công thức (1.1), nếu các hàm thuộc có dạng Singleton thì ta ñược:
m
∑y
k =1
k Hk
y’ = m
với Hk = µB’k(yk)
∑H
k =1
k
Trang 13
Chương 1 : Công nghệ tính toán mềm
7. Mô hình mờ Tagaki-Sugeno
Mô hình mờ mà ta nói ñến trong các phần trước là mô hình Mamdani. Ưu
ñiểm của mô hình Mamdani là ñơn giản, dễ thực hiện nhưng khả năng mô tả
hệ thống không tốt. Trong kỹ thuật ñiều khiển người ta thường sử dụng mô
hình mờ Tagaki-Sugeno (TS).
Tagaki-Sugeno ñưa ra mô hình mờ sử dụng cả không gian trạng thái mờ lẫn
mô tả linh hoạt hệ thống. Theo Tagaki/Sugeno thì một vùng mờ LXk ñược
mô tả bởi luật :
Rsk : If x = LXk Then x& = A( x k ) x + B( x k )u (1.2)
Luật này có nghĩa là: nếu véctơ trạng thái x nằm trong vùng LXk thì hệ thống
ñược mô tả bởi phương trình vi phân cục bộ x& = A( x k ) x + B( x k )u . Nếu
toàn bộ các luật của hệ thống ñược xây dựng thì có thể mô tả toàn bộ trạng
thái của hệ trong toàn cục. Trong (1.2) ma trận A(xk) và B(xk) là những ma
trận hằng của hệ thống ở trọng tâm của miền LXk ñược xác ñịnh từ các
chương trình nhận dạng. Từ ñó rút ra ñược :
x& = ∑ wk ( A( x k ) x + B( x k )u ) (1.3)
với wk(x) ∈ [0 , 1] là ñộ thoả mãn ñã chuẩn hoá của x* ñối với vùng mờ LXk
Luật ñiều khiển tương ứng với (1.2) sẽ là :
Rck : If x = LXk Then u = K(xk)x
Và luật ñiều khiển cho toàn bộ không gian trạng thái có dạng:
N
u = ∑ wk K ( x k ) x (1.4)
k =1
Trang 14
Chương 1 : Công nghệ tính toán mềm
1 1
0.7 0.75
0.3 0.35
0 4 10 0 60 100
Trang 15
Chương 1 : Công nghệ tính toán mềm
Xét bộ ñiều khiển mờ MISO sau, với véctơ ñầu vào X = [u1 ... u n ]
T
u2
R1 If … Then…
H1
X y’
Rn If … Then …
Hn
Hình 1.4:
X e u y
BðK MỜ ðỐI TƯỢNG
THIẾT BỊ ðO
Hình 1.5:
Trang 16
Chương 1 : Công nghệ tính toán mềm
4. Ví dụ minh họa:
Ví dụ 1.2:
ðể ñiều khiển tự ñộng máy ñiều hoà nhiệt ñộ bằng kỹ thuật logic mờ, người
ta dùng hai cảm biến: Trong phòng là cảm biến nhiệt Ti , bên ngoài là cảm
biến nhiệt To. Việc ñiều hoà nhiệt ñộ thông qua ñiều khiển tốc ñộ quạt làm
lạnh máy ñiều hoà. Biết rằng:
- Tầm nhiệt ñộ quan tâm là [0oC - 50oC ]
- Tốc ñộ quạt là v ∈ [0 – 600 vòng/ phút ]
Hãy tính tốc ñộ quạt trong trường hợp sau:
Ti = 270C T0 = 320C
Trang 17
Chương 1 : Công nghệ tính toán mềm
Ti,To : {Lạnh ,Vừa ,Nóng) tương ứng với {20, 25, 30oC)
V : {Zero, Chậm, Trung bình ,Nhanh, Max) tương ứng với {0, 150,
300, 450, 600 vòng/phút}
Ngõ ra:
Trang 18
Chương 1 : Công nghệ tính toán mềm
To
Lạnh Vừa Nóng
Ti
Lạnh Zero Chậm Trung bình
Vừa Chậm Trung bình Nhanh
m1 m2 y
a b
H
Mk = (3m22 − 3m12 + b 2 − a 2 + 3m2 b + 3m1a)
6
H
Ak = (2m2 – 2m1 + a + b)
2
m
∑M
k =1
k
y’ = m
= 530 vòng/phút
∑A
k =1
k
Trang 19
Chương 1 : Công nghệ tính toán mềm
∑y
k =1
k Hk
y’ = m
với Hk = µB’k(yk)
∑H
k =1
k
420
400
380
360
340
320
300
280
53 54 55 56 57 58 59 60 61 62
Trang 20
Chương 1 : Công nghệ tính toán mềm
500
400
300
200
100
0
50 52 54 56 58 60 62 64 66 68
Nhận xét:
-ðồ thị tốc ñộ quạt tăng tuyến tính khi vẽ theo Ti hoặc To
-Nếu cả 2 Ti và To thay ñổi bất kì thì ñồ thị (Ti +To,V) cũng tăng tuyến tính
và các ñiểm khác nằm ñối xứng 2 bên của ñường thẳng ñó.
-Kết quả ñiều khiển chấp nhận ñược.
Nếu vẫn chưa ñáp ứng ñược chất lượng ñề ra (sai số, ñộ vọt lố ..), ta có thể
tăng số phân cấp của các biến ngôn ngữ. Tuy nhiên, nếu tăng quá mức sẽ
dẫn ñến tình trạng quá khớp. Ví dụ:
Chọn các biến ngôn ngữ: Ti,To: {Rất lạnh, Lạnh,Vừa , Nóng, Rất nóng}
tương ứng với các nhiệt ñộ{15,20,25,30,35}
Tốc ñộ quạt vẫn là: {Zero ,Chậm ,Trung bình, Nhanh, Max}
To
Rất lạnh Lạnh Vừa Nóng Rất nóng
Ti
Rất lạnh Zero Zero Zero Chậm TB
Lạnh Zero Chậm Chậm TB Nhanh
Vừa Zero Chậm TB Nhanh Max
Nóng Chậm TB Nhanh Nhanh Max
Rất nóng TB Nhanh Max Max Max
Khi ñó, ta cũng sẽ thu ñược kết quả tương tự như trên.
Ví dụ 1.3:
Thiết kế bộ mờ ñiều khiển nhiệt ñộ.Bộ mờ có 2 ngõ vào là sai lệch e(t) [ET]
và ñạo hàm sai lệch de(t) [DET],một ngõ ra là ñạo hàm công suất [DP].
Trang 21
Chương 1 : Công nghệ tính toán mềm
Biết rằng:
_ Lò nhiệt có công suất là 5KW, tầm ño max là 200 0C, sai số là ± 5%.
_ Tầm thay ñổi của DET là -10 0 C / s → 10 0 C / s
_ Tầm thay ñổi của DP là -100W/s → 100W/s
Hãy tính côg suất cung cấp cho lò trong trường hợp sau:
ET= 80C DET= 9 0 C / s
Lời giải:
Bước 1: Xác ñịnh các biến ngôn ngữ vào – ra
ET = Tñặt – Tño
DET (i+1) = ( ET(i+1) – ET(i))/T
DP(i+1) = (P(i+1) – P(i))/T
P(i+1)= P(i)+DP(i+1)*T ≤ Pmax = 5KW
Trang 22
Chương 1 : Công nghệ tính toán mềm
DET
DP
N3 N2 N1 Z P1 P2 P3
N3 N3 N3 N3 N3 N2 N1 Z
N2 N3 N2 N2 N2 N1 Z P1
N1 N3 N2 N1 N1 Z P1 P2
Z N3 N2 N1 Z P1 P2 P3
P1 N2 N1 Z P1 P1 P2 P3
ET
P2 N1 Z P1 P2 P2 P2 P3
P3 Z P1 P2 P3 P3 P3 P3
Trang 23
Chương 1 : Công nghệ tính toán mềm
Ví dụ 1.4:
Dùng ñiều khiển mờ ñể ñiều khiển hệ thống bơm xả nước tự ñộng. Hệ thống
sẽ duy trì ñộ cao bồn nước ở một giá trị ñặt trước như mô hình bên dưới.
♦Mô hình :
Ba bộ ñiều khiển mờ (control) sẽ ñiều khiển : bơm, van1, van2 sao cho mực
nước ở 2 bồn ñạt giá trị ñặt trước (set).
Trang 24
Chương 1 : Công nghệ tính toán mềm
♦Sơ ñồ simulink:
Trang 25
Chương 1 : Công nghệ tính toán mềm
Trang 26
Chương 1 : Công nghệ tính toán mềm
DE Khối controller1
ERROR DB DM ZR IM IB
NB OF OF NC
NM OS
ZR OF OS NC CS CF
PM CS
PB NC CF CF
DE Khối controller2
ERROR DB DM ZR IM IB
NB CF CF NC
NM CS
ZR CF CS NC OS OF
PM OS
PB NC OF OF
+ Khối “control3”
ðây là khối ñiều tiết lưu lượng cho bồn 2, ta ñưa ra mức ưu tiên như sau :
Khi sai lệch bồn 1 lớn thì van2 sẽ ñiều tiết ñể sai lệch này nhỏ rồi mới ñến
bồn 2.
If error1=NB and de1=DB Then control=CF
If error1=NB and de1=DM Then control=CS
If error1=NB and de1=ZR Then control=CS
If error1=NM and de1=DB Then control=CS
Trang 27
Chương 1 : Công nghệ tính toán mềm
Trang 28
Chương 1 : Công nghệ tính toán mềm
z (m)
Có thể nói trong lĩnh vực ñiều khiển, bộ PID ñược xem như một giải pháp
ña năng cho các ứng dụng ñiều khiển Analog cũng như Digital. Theo một
nghiên cứu cho thấy có khoảng hơn 90% các bộ ñiều khiển ñược sử dụng
hiện nay là bộ ñiều khiển PID. Bộ ñiều khiển PID nếu ñược thiết kế tốt có
khả năng ñiều khiển hệ thống với chất lượng quá ñộ tốt (ñáp ứng nhanh, ñộ
vọt lố thấp) và triệt tiêu ñược sai số xác lập.
Việc thiết kế bộ PID kinh ñiển thường dựa trên phương pháp Zeigler-
Nichols, Offerein, Reinish … Tuy nhiên nếu ñối tượng ñiều khiển là phi
tuyến thì bộ ñiều khiển PID kinh ñiển không thể ñảm bảo chất lượng ñiều
khiển tại mọi ñiểm làm việc. Do ñó ñể ñiều khiển các ñối tượng phi tuyến
ngày nay người ta thường dùng kỹ thuật hiệu chỉnh PID mềm (dựa trên
phầm mềm), ñây chính là cơ sở của thiết kế PID mờ hay PID thích nghi.
Trang 29
Chương 1 : Công nghệ tính toán mềm
Hình 1.7
a1 thời gian
+ Lân cận a1 ta cần luật ðK mạnh ñể rút ngắn thời gian lên, do vậy chọn: KP
lớn, KD nhỏ và KI nhỏ.
Trang 30
Chương 1 : Công nghệ tính toán mềm
+ Lân cận b1 ta tránh vọt lố lớn nên chọn: KP nhỏ, KD lớn, KI nhỏ.
+ Lân cận c1 và d1 giống như lân cận a1 và b1.
ET
0
-12 -8 -4 0 4 8 12 C
Trang 31
Chương 1 : Công nghệ tính toán mềm
µ
N31 N21 N11 ZE1 P11 P21 P31
DET
0
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 C/s
µ
Z S M L U
KD
0 0.25 0.5 0.75 1 KP
µ
L1 L2 L3 L4 L5
Trang 32
Chương 1 : Công nghệ tính toán mềm
KP DET
N31 N21 N11 ZE1 P11 P21 P31
N3 U U U U U U U
N2 L L L L L L L
N1 M M M M M M M
ET ZE Z Z Z Z Z Z Z
P1 M M M M M M M
P2 L L L L L L L
P3 U U U U U U U
KD DET
N31 N21 N11 ZE1 P11 P21 P31
N3 Z Z Z Z Z Z Z
N2 M M M M M M M
N1 L L L L L L L
ET ZE U U U U U U U
P1 L L L L L L L
P2 M M M M M M M
P3 Z Z Z Z Z Z Z
KI DET
N31 N21 N11 ZE1 P11 P21 P31
N3 L1 L1 L1 L1 L1 L1 L1
N2 L3 L2 L2 L1 L2 L2 L3
N1 L4 L3 L2 L1 L2 L3 L4
ET ZE L5 L4 L3 L2 L3 L4 L5
P1 L4 L3 L2 L1 L2 L3 L4
P2 L3 L2 L2 L1 L2 L2 L3
P3 L1 L1 L1 L1 L1 L1 L1
Trang 33
Chương 1 : Công nghệ tính toán mềm
Tham số
PID mờ
t (s)
Trang 34
Chương 1 : Công nghệ tính toán mềm
1.2.4. Hệ mờ lai
Hệ mờ lai (Fuzzy Hybrid) là một hệ thống ñiều khiển tự ñộng trong ñó thiết
bị ñiều khiển bao gồm: phần ñiều khiển kinh ñiển và phần hệ mờ
Bộ tiền
BỘ ðK ðỐI TƯỢNG
Xử lý mờ
Hình1.8
2. Hệ mờ lai cascade
∆u
BðK MỜ
x BðK + u y
KINH ðIỂN ðỐI TƯỢNG
Hình 1.9
3. Công tắc mờ
ðiều khiển hệ thống theo kiểu chuyển ñổi khâu ñiều khiển có tham số ñòi
hỏi thiết bị ñiều khiển phải chứa ñựng tất cả các cấu trúc và tham số khác
nhau cho từng trường hợp. Hệ thống sẽ tự chọn khâu ñiều khiển có tham số
phù hợp với ñối tượng.
x y
Bộ ñiều khiển 1 ðối tượng
u
Hình 1.10
Trang 35
Chương 1 : Công nghệ tính toán mềm
Ví dụ 1.6:
Hãy xét sự khác biệt khi sử dụng bộ tiền xử lý mờ ñể ñiều khiển ñối tượng
K
gồm khâu có vùng không nhạy là ∆u nối tiếp với khâu G ( s ) = .
s (1 + 0.2s )
Chọn BðK PI với tham số KP = 10, TI = 0.3sec.
ðối tượng
x E + 1 -∆u y
Bộ mờ KR + G(s)
∆x TI s ∆u
DE
Sử dụng Simulink kết hợp với toolbox FIS Editor của Matlab ñể mô phỏng
hệ thống trên.
ðáp ứng hệ thống khi không có bộ mờ:
Thử với các giá trị ∆u và K khác nhau cho thấy ñặc tính ñộng của hệ sẽ xấu
ñi khi vùng chết rộng hoặc hệ số khuếch ñại lớn. ðể hiệu chỉnh ñặc tính
ñộng của hệ thống ta ñưa vào bộ lọc mờ như hình vẽ ở trên.
Trang 36
Chương 1 : Công nghệ tính toán mềm
Xây dựng luật ñiều khiển với 2 ñầu vào và một ñầu ra như sau:
DE
∆x NB NS ZE PS PB
NB NB NS
NS NS NS NS ZE
E ZE NB NS ZE PS PB
PS PS PS PS PS
PB PB PS PB
Tất cả 18 luật có khuôn dạng như sau:
Nếu E = x1 và DE = x2 Thì ∆x = x3
Trong ñó x1, x2, x3 ∈ {NB, NS, ZE, PS, PB}
µ µ
NB NS ZE PS PB NB NS ZE PS PB
-1 0 1 E -1 0 1 ∆x
-20 0 20 DE
Từ hai ñồ thị trên ta thấy ñược bộ mờ ñã cải thiện rất tốt ñặc tính ñộng của
hệ thống. Thử với nhiều ∆u khác nhau ta sẽ thấy ñáp ứng hầu như không
phụ thuộc vào ∆u .
Trang 37
Chương 1 : Công nghệ tính toán mềm
Trang 38
Chương 1 : Công nghệ tính toán mềm
∑
2 N +1
k =1
yµ Ak ( y )
u = − f ( y) = −
∑
2 N +1
k =1
µ A ( y)
k
Trang 39
Chương 1 : Công nghệ tính toán mềm
≤ 0 → l k = 1,2,..., N k
l1 ...lm
y k = 0 → l k = N k + 1 (1.8)
≥ 0 → l = N + 2,...,2 N + 1
k k k
• Bước 3: Chọn luật hợp thành tích, giải mờ theo phương pháp trung bình
trọng số, ta ñược luật ñiều khiển:
∑ ...∑l
2 N1 +1 2 N m +1 m
l1 =1
y kl1 ...lm (∏i =1 µ Ali ( y i ))
m =1
uk = − f k ( y) = − i
(1.9)
∑ ...∑l
2 N1 +1 m m
=1 ∏i =1 A i
l1 =1
( µ l ( y i ))
m i
với k=1,2,…,m.
∑ ...∑l
2 N1 +1 2 N n +1 n
l1 =1
y kl1 ...lm (∏i =1 µ Ali ( xi ))
n =1
uk = − f k ( x) = − i
(1.12)
∑ ...∑l
2 N1 +1 2 N n +1 n
l1 =1
(∏i =1 µ Ali ( xi ))
n =1 i
bl ( x) =
∏ i =1
µ A ( xi )
li
i
(1.13)
∑ ...∑
2 N1 +1 2 N n +1 n
l1 =1 l n =1
(∏i =1 µ Ali ( xi ))
i
n
với li = 1,2,…,2Ni+1; l = 1,2,…,N và N = ∏i =1 (2 N i + 1) . Ta ñịnh nghĩa
ma trận thông số Θ ∈ Rm × N như sau :
Trang 40
Chương 1 : Công nghệ tính toán mềm
[
Θ = − Θ1T ,−Θ T2 ,...,−Θ Tm ]T
(1.14)
với Θ Tk ∈ R 1× N chứa N thông số y kl1 ...ln , có bậc giống như bl(x). Ta viết lại tín
hiệu ñiều khiển mờ dạng u = (u1,u2,..,um)T = (-f1(x),…,-fn(x))T như sau:
u = Θb(x) (1.15)
Giờ ta giả sử Θ = Θ(t). Thay (1.15) vào (1.10) và (1.11) ta ñược :
x& (t ) = Ax(t ) + BΘ(t )b[x(t )] (1.16)
và hàm chỉ tiêu chất lượng là :
T
[
J = x (T ) Mx(T ) + ∫ x T (t )Qx(t ) + b T ( x(t ))Θ T (t ) RΘ(t )b( x(t )) dt
T
] (1.17)
0
Vì vậy vấn ñề cần giải quyết bây giờ là xác ñịnh Θ(t) tối ưu ñể cự tiểu hoá J.
Xét hàm Hamilton:
H ( x, Θ, p ) = x T Qx + b T ( x)Θ T RΘb( x) + p T [ Ax + BΘb( x)] (1.18)
∂H
Ta có: = 2 RΘb( x)b T ( x) + B T pb T ( x) = 0
∂Θ
1
Suy ra : Θ = − R −1 B T pb T ( x)[b( x)b T ( x)]−1 (1.19)
2
Thay (1.19) vào (1.18) ta ñược:
H ∗ ( x, p) = x T Qx + p T Ax + [α 2 ( x) − α ( x)] p T BR −1 B T p (1.20)
1 T
trong ñó: α ( x) = b ( x)[b( x)b T ( x)] −1 b( x) (1.21)
2
Áp dụng nguyên lý cực tiểu Pontryagin ta ñược:
∂H ∗
x& = = Ax + 2[α 2 ( x) − α ( x)]BR −1 B T p (1.22)
∂p
∂H ∗ ∂α ( x) T
p& = − = −2Qx − AT p − [2α ( x) − 1] p BR −1 B T p (1.23)
∂x ∂x
Giải hai phương trình vi phân (1.21) và (1.22) ta sẽ ñược x*(t) và p*(t), từ ñó
ta xác ñịnh ñược:
1
Θ ∗ (t ) = − R −1 B T p ∗ (t )b T ( x ∗ (t ))[b( x ∗ (t ))b T ( x ∗ (t ))]−1 (1.24)
2
Trang 41
Chương 1 : Công nghệ tính toán mềm
Và bộ mờ tối ưu sẽ là:
u ∗ = Θ ∗ (t )b( x) (1.25)
Các bước ñể thiết kế BðK mờ tối ưu:
• Bước 1: Xác ñịnh hàm thuộc µ Ali ( xi ) , với li = 1,2,…,2Ni+1 và I = 1,…,n.
i
r u
O θ
Hình 1.13
Thiết kế BðK mờ ñể ñiều khiển quả bóng di chuyển từ ñiểm gốc O ñến mục
tiêu (vị trí ñặt) cách O khoảng r. Chọn biến trạng thái như sau:
x = (r , r&, θ , θ&) T = ( x , x , x , x ) T và y = r = x1
1 2 3 4
ip
Trang 42
Chương 1 : Công nghệ tính toán mềm
mục tiêu
ñiều khiển
ðối tượng
Bộ ðK mờ
Bộ ðK giám sát
Hình 1.14
Trang 43
Chương 1 : Công nghệ tính toán mềm
Giả sử |x(t)| ≤ Mx, ∀x với Mx = const. Khi thêm bộ giám sát thì tín hiệu ñiều
khiển hệ thống sẽ là:
u = ufuzz(x) + I*us(x) (1.27)
trong ñó I* = 1 nếu |x(t)| ≥ Mx, I* = 0 nếu |x(t)| < Mx. Ta cần thiết kế bộ
giám sát us(t).
Thay (1.27) vào (1.26) ta ñược:
x(n) = f(x) + g(x)ufuzz(x) + g(x)I*us(x) (1.28)
U U
Giả sử ta luôn xác ñịnh ñược hai hàm f (x) và gL(x) sao cho |f(x)| ≤ f (x) và
0 < gL(x) ≤ g(x).
1
ðặt : u∗ =
g ( x)
[
− f ( x) − k T x ] (1.29)
0 1 0 0 ... 0 0
0 0 1 0 ... 0 0
ðặt A = ... ... ... ... ... ... ...
0 00 0 0 ... 0 1
− k n − k n−1 ... ... ... − k 2 − k1
0
...
b=
0
g
Viết (1.30) dạng véctơ :
x& = Ax + b[u fuzz − u ∗ + I ∗u s ] (1.31)
1 T
Xét hàm Lyapunov : V = x Px (1.32)
2
Trong ñó P là ma trận ñối xứng xác ñịnh dương thoả phương trình
Lyapunov : AT P + PA = −Q (1.33)
Từ (1.31), (1.33) và xét trường hợp |x| ≥ Mx , ta có:
Trang 44
Chương 1 : Công nghệ tính toán mềm
1
V& = − x T Qx + x T Pb[u fuzz − u ∗ + u s ] ≤ x T Pb ( u fuzz + u ∗ ) + x T Pbu s (1.34)
2
Ta cần tìm us ñể V& ≤ 0 , kết hợp phương trình trên với (4.6.25) ta ñựơc:
1
u s = − sign( x T Pb) ( f U + k T x ) + u fuzz (1.35)
gL
Thay (1.35) vào (1.34) ta sẽ ñược V& ≤ 0 .
• Ví dụ 1.8:
Thiết kế hệ thống có bộ giám sát ñể giữ cân bằng cho con lắc ngược.
θ& = x 2
θ=x1
l
mgsinθ
mc u
Hình 1.15
Trang 45
Chương 1 : Công nghệ tính toán mềm
Trang 46
Chương 1 : Công nghệ tính toán mềm
Trang 47
Chương 1 : Công nghệ tính toán mềm
Với luật ñiều khiển như vậy, hệ thống sẽ ổn ñịnh theo tiêu chuẩn Lyapunov,
lúc này mọi quỹ ñạo trạng thái của hệ thống bên ngoài mặt trượt sẽ ñược
ñưa về mặt trượt và duy trì một cách bền vững.
x2= x&
S=0
x1
Trang 48
Chương 1 : Công nghệ tính toán mềm
ra của hệ thống.
Mục tiêu của ñiều khiển là xác ñịnh luật ñiều khiển u ñể ngõ ra của hệ thống
bám theo quỹ ñạo mong muốn yd(t) với sai số nhỏ nhất.
Luật ñiều khiển u gồm 2 thành phần:
u = ueq + us (1.50)
Thành phần ueq ñược thiết kế như sau:
1 ˆ
u eq (t ) =
gˆ
[ ]
− f ( X , t ) + &y&d (t ) − λe , (λ>0) (1.51)
g1
α=
g0
Luật ñiều khiển mờ ñược thiết kế như sau:
u − (t ), → S < 0
u (t ) = + (1.53)
u (t ), → S > 0
Trong ñó:
[
u − (t ) = u eq (t ) + kgˆ −1 α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ]
u + (t ) = u eq (t ) − kgˆ −1 [α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ] (1.54)
(k ≥ 1)
Trang 49
Chương 1 : Công nghệ tính toán mềm
∑ β (S )u (t )
i =1
i
i
u (t ) = r
(1.56)
∑ β (S )
i =1
i
Với r : số luật mờ
n
β i (S ) = ∏ µ A (S ) i
j
j =1
Mô hình:
Hình 1.18 minh hoạ một hệ thống nâng vật bằng từ trường, từ trường ñược
tạo ra từ cuộn dây quấn quanh lõi thép, cuộn dây nhận áp ñiều khiển u.
Trang 50
Chương 1 : Công nghệ tính toán mềm
m = mg − C
dt h
Trong ñó:
h : vị trí hòn bi (m)
v : vận tốc hòn bi (m/s)
i : dòng ñiện qua cuộn dây (A)
u : ñiện áp cung cấp cho cuộn dây (V)
R, L : ñiện trở và ñiện cảm cuộn dây (Ω, H)
C : hằng số lực từ (Nm2/A2)
m : khối lượng hòn bi (Kg)
g : gia tốc trọng trường. (m/s2)
ðiện cảm của cuộn dây là một hàm phi tuyến phụ thuộc vào vị trí của hòn bi
2C
L(h) = L1 + (1.58)
h
L1 là ñiện cảm của cuộn dây khi hòn bi ở rất xa.
Chọn biến trạng thái như sau:
Trang 51
Chương 1 : Công nghệ tính toán mềm
x1 = h, x2 = v, x3 = i (1.59)
Véctơ trạng thái của hệ thống X = (x1, x2, x3)T
Từ (1.57), (1.58) và (1.59) ta ñược phương trình trạng thái:
&
x1 = x 2
2
C x3
x& 2 = g − (1.60)
m x1
x& 3 = R x3 + 2C x 2 x3 + 1 u
L L x12 L
ðiểm cân bằng của hệ thống là nghiệm của hệ ( x&1 = 0, x& 2 = 0, x& 3 = 0)
gm
Giải ra ñược Xb = [x1b, 0, x3b ] T , với x3b = x1b
C
Gọi Xd = [ x1d, x2d, x3d ] T là véctơ trạng thái mong muốn.
Mục tiêu của hệ thống là ñưa X tiến về Xd với sai số nhỏ nhất.
Trang 52
Chương 1 : Công nghệ tính toán mềm
ðặt
2 C
g ( z) = − ( g − z 3 )u
L( z1 + x1d ) m
(1.63)
f ( z ) = 2( g − z ) z 2 1 − 2C R
+
3
z1 + x1d L( z1 + x1d ) L
Từ (1.62) và (1.63) ta ñược mô hình ñộng học của hệ thống trong hệ toạ ñộ
mới như sau:
z& 1 = z 2
z& 2 = z 3 (1.64)
z& = f ( z ) + g ( z )u
3
Ngõ ra của hệ thống trong hệ tọa ñộ mới là:
e = z1 = x1 − x1d (1.65)
Trang 53
Chương 1 : Công nghệ tính toán mềm
1
u= [− f ( z ) − a1 z 3 − a0 z 2 − Wsign( z3 + a1 z 2 + a0 z1 )] (1.72)
g ( z)
Thay (1.72) vào (1.71) ta ñược:
S& = −Wsign ( z 3 + a1 z 2 + a 0 z1 ) = −Wsign ( S ) (1.73)
Nếu chọn W là hằng số dương thì ta sẽ ñược SS& < 0 . Do vậy biến trạng thái
Z sẽ hội tụ về zero khi t → ∞ thoả yêu cầu ñề ra.
Ta có thể viết lại mặt trượt S dưới dạng hàm của x1, x2, x3 như sau:
2
Cx
S = g − 3 + a1 x 2 + a0 ( x1 − x1d ) (1.74)
m x1
Và luật ñiều khiển u là:
1 C x3
2 2
C x3
u = − f1 − a1 g − − a0 x2 − Wsign g − + a1x2 + a0 ( x1 − x1d )
g1 m x1 m x1
(1.75)
Mô phỏng Matlab:
Các thông số mô phỏng của hệ thống
Khối lượng hòn bi m = 11.87g, bán kính R = 7.14mm, một nam châm ñiện,
ñiện trở cuộn dây R = 28.7Ω, ñiện kháng L1 = 0.65H, hằng số lực từ
C=1.4×10- 4Nm2A2.
Sơ ñồ Simulink
Trang 54
Chương 1 : Công nghệ tính toán mềm
Hình 1.19: Vị trí và áp ñiều khiển khi tín hiệu ñặt biến thiên
Hình 1.20: Vị trí và áp ñiều khiển khi tín hiệu ñặt là hằng số
Trang 55
Chương 1 : Công nghệ tính toán mềm
1 C x3
2
u = − f1 − a1 g − − a0 x2 − Wsign(S )
g1 m x1
với S ñược xác ñịnh từ (1.74), f1 và g1 ñược xác ñịnh từ (1.67).
Do trong luật ñiều khiển có hàm sign nên gây ra hiện tượng dao ñộng, ñể
khắc phục nhược ñiểm này ta thêm khâu xử lý mờ trong bộ ñiều khiển ñể
thay thế cho hàm sign.
Chọn luật ñiều khiển u = ueq + us , với:
1 C x3
2
u eq =
− f 1 − a1 g − − a 0 x 2 (1.76)
g1 m x1
Trang 56
Chương 1 : Công nghệ tính toán mềm
Bước 3: Giải mờ
Bằng phương pháp giải mờ trọng tâm, luật ñiều khiển u ñược xác ñịnh:
5
∑β u
i =1
i
i
u= 5
(1.77)
∑β
i =1
i
Sơ ñồ Simulink
Trang 57
Chương 1 : Công nghệ tính toán mềm
Trang 58
Chương 1 : Công nghệ tính toán mềm
Trang 59
Chương 1 : Công nghệ tính toán mềm
Kết luận
- Việc thêm BðK mờ ñã triệt tiêu hiện tượng dao ñộng.
- ðáp ứng hệ thống tốt hơn.
- Chọn 5 tập mờ là thích hợp nhất khi xây dựng BðK mờ.
Trang 60
Chương 1 : Công nghệ tính toán mềm
1.3.1. Cấu trúc mạng nơron nhân tạo (Artifical Neural Networks - ANN):
Bộ não con người có khoảng 1011 ÷ 1012 nơ-ron. Mỗi nơ- ron có thể liên kết
với 104 nơ-ron khác thông qua các khớp nối (dendrite). Các nơ- ron nhận tín
hiệu ñiện từ các khớp nối và khi sự tổng hợp của các tín hiệu này vượt quá
một ngưỡng cho phép thì nơ-ron sẽ kích hoạt một tín hiệu ñiện ở
ngõ ra ñể truyền tới trục nơ-ron (axon) và dẫn ñến các nơ-ron khác.
Mạng nơ-ron nhân tạo cũng hoạt ñộng dựa theo cách thức của bộ não con
người nhưng ở cấp ñộ ñơn giản hơn.
Trang 61
Chương 1 : Công nghệ tính toán mềm
Mạng nơron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh
con người. Mạng nơron gồm vô số các nơron liên kết với nhau như hình sau
Nhân Axon
n
Khớp nối
Trang 62
Chương 1 : Công nghệ tính toán mềm
• Hàm kích hoạt (activation function): là hàm xử lý tín hiệu ngõ ra.
Kí hiệu: f(.)
Một số kiểu hàm kích hoạt thông dụng :
Hàm nấc:
0, u<0
y = f (u ) =
1, u≥0
Trang 63
Chương 1 : Công nghệ tính toán mềm
Hàm dấu:
− 1, u<0
y = f (u ) =
1, u≥0
• Theo số lớp:
o Mạng một lớp (mạng ñơn nơ-ron): mạng chỉ gồm 1 nơ-ron
o Mạng nhiều lớp (mạng ña nơ-ron): mạng gồm nhiều nơ-ron
Trang 64
Chương 1 : Công nghệ tính toán mềm
o Mạng truyền thẳng (mạng nuôi tiến): các tín hiệu trong mạng
chỉ truyền theo một chiều từ ngõ vào ñến ngõ ra.
o Mạng hồi quy (mạng nuôi lùi): các tín hiệu hồi tiếp từ ngõ ra
trở về ngõ vào.
x1
y
x2
Trang 65
Chương 1 : Công nghệ tính toán mềm
Luật học củng cố: không như học có giám sát ñược cung cấp mục
tiêu trước (mỗi tín hiệu ngõ vào sẽ có một tín hiệu ra tương ứng), luật học
củng cố chỉ ñược cung cấp theo mức (Ví dụ: “ñúng” hoặc “sai”). Bởi vì
trong thực tế không phải lúc nào ta cũng có ñầy ñủ thông tin về ñối tượng.
Vì vậy, kiểu học củng cố sẽ thích hợp nhất cho những ứng dụng ñiều khiển
hệ thống.
Trang 66
Chương 1 : Công nghệ tính toán mềm
Luật học không có giám sát: trọng số và ngưỡng phân cực chỉ ñược
hiệu chỉnh ñối với ngõ vào. Không có mục tiêu ngõ ra ñược ñặt trước. Có vẻ
như ñiều này thiếu thực tế, vì làm sao huấn luyện ñược mạng nếu không biết
nó sẽ làm gì? Hầu hết những thuật toán này sẽ tự phát hiện các ñặc ñiểm,
các mối tương quan giữa các mẫu dữ liệu vào và mã hóa thành dữ liệu ra.
ðiều này rất hữu ích trong những ứng dụng như lượng tử hoá vector.
1.3.4. Mạng truyền thẳng một lớp (mạng perceptron ñơn giản):
Perceptron có hàm kích hoạt là hàm hardlim (hàm giới hạn cứng):
Trang 67
Chương 1 : Công nghệ tính toán mềm
Nhận xét:
Mỗi nơ-ron trong mạng sẽ chia không gian ngõ vào thành 2 miền: một
miền bao gồm các ngõ vào sao cho ngõ ra bằng 1 và một miền bao gồm các
ngõ vào sao cho ngõ ra bằng 0. Vì vậy, ta cần khảo sát ñường phân chia
giữa những miền này.
Trang 68
Chương 1 : Công nghệ tính toán mềm
ðể tìm ñường thẳng này, có thể tìm giao ñiểm của nó với trục p1 và p2.
Tìm giao ñiểm với trục p2, ñặt p1=0:
Khi ñó, ta tìm ñược ñường phân chia như hình sau:
Miền tương ứng với ngõ ra bằng 1 ñược xác ñịnh bằng cách kiểm tra thử
một ñiểm.Với p=[2 0]T, ngõ ra sẽ là:
Vậy ngõ ra của mạng sẽ bằng 1 ở miền bên trên và bên phải của ñường phân
chia. Miền này ñược tô ñậm ở hình trên
ðối với những ñiểm trên ñường phân chia, tích 1wTp
luôn không ñổi. Có nghĩa là những vector ngõ vào p này
phải có cùng hình chiếu lên vector trọng số. Vậy chúng
phải nằm trên cùng một ñường thẳng trực giao với
Trang 69
Chương 1 : Công nghệ tính toán mềm
vector trọng số. Hơn nữa, những vector ở miền tô ñậm của hình trên sẽ có
tích 1wTp lớn hơn –b, còn ở miền còn lại thì tích 1wTp sẽ nhỏ hơn.Vì vậy
vector trọng số 1w sẽ luôn hướng về miền có ngõ ra bằng 1.
Sau khi ñã chọn vector trọng số ñúng hướng, ngưỡng phân cực ñược
tính bằng cách chọn một ñiểm trên ñường biên và cho thoả phương trình
ñường phân chia.
Ví dụ 1.10:
Thiết kế mạng perceptron thực hiện hàm chức năng cổng AND. Các cặp ngõ
vào và mục tiêu của cổng AND là:
Cuối cùng, chọn một ñiểm trên ñường phân chia p=[1.5 0]T và tính ngưỡng
phân cực b bằng cách thế vào phương trình:
Có thể kiểm tra lại ñáp ứng của mạng với một cặp ngõ vào/mục tiêu. Nếu
thử với p2, ngõ ra sẽ là:
Ta thấy ngõ ra trùng với mục tiêu t2. Kiểm tra cho tất cả các ngõ vào còn lại,
ta thấy chúng ñều phân loại ñúng.
Chú ý : ñối với mạng perceptron ña nơ-ron, mỗi nơ-ron có một ñường phân
chia. ðường phân chia cho nơ-ron thứ i là:
Một perceptron ñơn neutron có thể phân vector ngõ vào thành 2 loại vì ngõ
ra của nó có thể là 0 hoặc 1. Mạng perceptron ña neutron có thể phân ngõ
vào thành nhiều loại, mỗi loại ñại diện bởi một ngõ ra khác nhau. Vì mỗi
Trang 70
Chương 1 : Công nghệ tính toán mềm
phần tử của vector ngõ ra có thể bằng 0 hoặc 1, nên có tổng cộng 2S loại ngõ
vào với S là số neutron.
Mạng perceptron dùng ñể giải bài toán này cần có 2 ngõ vào và 1 ngõ ra.
ðưa vector ngõ vào vào mạng perceptron, bắt ñầu với p1:
Ngõ ra chưa ñúng với giá trị mong muốn (t1 = 1),
nghĩa là ñường phân chia không chính xác.Ta cần
thay vector trọng số ñể nó hướng về p1 nhiều hơn.
Trang 71
Chương 1 : Công nghệ tính toán mềm
Một cách khác là cộng p1 vào 1w. Việc cộng thêm sẽ làm cho 1w hướng về
p1 nhiều hơn. Luật này có thể ñược viết như sau:
Ta thấy p1 ñã ñược phân loại ñúng. Tương tự cho các ngõ vào còn lại
Ngõ ra chưa ñúng với giá trị mong muốn (t2 = 0). Ta cần
ñưa 1w ra xa p1 hơn, bằng cách ñổi luật:
Trang 72
Chương 1 : Công nghệ tính toán mềm
Ta cũng có thể hợp nhất 3 luật thành một biểu thức ñơn giản:
Có thể áp dụng luật này ñể huấn luyện ngưỡng phân cực (thay p =1)
Luật perceptron ñược viết gọn lại thành hệ thống ma trận kí hiệu như sau:
Với qui ước rằng: ngõ ra yêu cầu sẽ bằng 0 khi mẫu vào là “quả cam”
ngõ ra yêu cầu sẽ bằng 1 khi mẫu vào là “quả táo”
Trang 73
Chương 1 : Công nghệ tính toán mềm
ðầu tiên, chúng ta sẽ khởi ñộng ma trận trọng số và ngưỡng phân cực:
Trang 74
Chương 1 : Công nghệ tính toán mềm
Lần lặp thứ 3 sẽ bắt ñầu với vectơ ngõ vào của lần lặp ñầu tiên:
Nhận xét: Neáu tieáp tuïc vôùi caùc laàn laëp keá, ta seõ nhaän ra raèng: giôø ñaây, caû
hai vector ngoõ vaøo ñeàu ñaõ ñöôïc phaân loaïi chính xaùc. Thuaät toùan (caùc pheùp
laëp) treân ñaõ hoäi tuï veà cuøng moät ñaùp aùn.
a i = hardlim (n i ) = hardlim ( iW T p + bi )
1 wT
T
w
Ma trận trọng số: W = 2
M
s w T
T
ðường biên ranh giới: i w p + bi = 0
ðường ranh giới luôn vuông góc (trực giao) với vectơ trọng số.
Trang 75
Chương 1 : Công nghệ tính toán mềm
Ví dụ: Phương pháp Widrow-Hoff tính toán sai lệch giữa ngõ ra mong
muốn với ngõ ra thật sự của mạng:
∆ = d(t) – y(t)
Sau ñó cập nhật trọng số của mạng theo luật:
wi (t + 1) = wi (t ) − α∆xi (t )
Trong ñó:
d(t) là ngõ ra mong muốn và y(t) là ngõ ra của mạng
α là hệ số thích nghi ( 0 < α < 1)
Widrow gọi những mạng sử dụng thuật toán trên là mạng thích nghi tuyến
tính (Adaptive Linear Neural, ADALINE). Việc kết nối nhiều mạng
ADALINE lại với nhau tạo nên một cấu trúc gọi là mạng MADALINE
(many ADALINE). Thuật toán huấn luyện các mạng này xuất phát từ việc
cố gắng tìm một ñường thẳng phân chia 2 vùng không gian của bài toán.
Tuy nhiên, có rất nhiều trường hợp các vùng không gian không thể phân
chia tuyến tính ñược.
Một ví dụ kinh ñiển cho loại bài toán này cổng logic XOR. Các ngõ vào và
ra của cổng XOR ñược thể hiện như sau:
ðể giải quyết các bài toán trên ta phải sử dụng mạng truyền thẳng nhiều lớp.
Trang 76
Chương 1 : Công nghệ tính toán mềm
Giải thuật lan truyền ngược huấn luyện mạng nơ-ron nhiều lớp:
Tập dữ liệu ñã cho có n mẫu (xn,dn), với mỗi n, xn là tín hiệu ñầu vào, dn là
ñầu ra mong muốn. Quá trình học là việc thực hiện cực tiểu hoá hàm G sau:
N
1
∑G ∑
N
G= n , với Gn = q −1
( yq( x n ) − dq( x n )) 2
n =1 N
Q là số nút tại lớp ra của mạng.
Trọng số liên kết mạng ñược ñiều chỉnh theo phép lặp sau :
∂G
w(k + 1) = w(k ) − η , trong ñó η >0 là hằng số tốc ñộ học.
∂w
Thuật toán lan truyền ngược ñề cập ở các phần trên ñã ñược ứng dụng rất
rộng rãi trong việc huấn luyện các mạng nơ-ron.Tuy nhiên, nó vẫn mắc phải
2 khuyết ñiểm cố hữu là: tốc ñộ hội tụ chậm và dễ bị rơi vào các vùng cực
trị cục bộ. Hai khuyết ñiểm này có thể hạn chế bằng việc lựa chọn tối ưu
tốc ñộ học (hệ số η ) và sử dụng bổ sung hệ số momentum vào luật học:
Tuy có thể ñược cải thiện phần nào chất lượng học nhưng rõ ràng ñiều này
vẫn chưa ñủ ñể có thể ứng dụng giải thuật lan truyền ngược vào thực tế do
tốc ñộ hội tụ chậm của nó. Và những hạn chế này có thể ñược khắc phục khi
sử dụng mạng hàm cơ sở xuyên tâm.
Trang 77
Chương 1 : Công nghệ tính toán mềm
z1
m11 w11
m12 w21
m1m wn1
wi1
wiq yi
wil
Các phương trình toán truyền tín hiệu từ lớp vào ñến lớp ra của mạng:
Ngõ ra của nơ-ron thứ q (thuộc lớp ẩn):
2
− X − mq
2σ
zq = e q
Trang 78
Chương 1 : Công nghệ tính toán mềm
Thuật toán huấn luyện mạng RBF, bao gồm các bước sau:
Bước 1: Chọn tốc ñộ học η > 0 , chọn sai số cực ñại Emax
Bước 2: ðặt giá trị ñầu: E = 0; k=1
Gán giá trị ngẫu nhiên cho các trọng số wiq(k)
Bước 3: Tính ngõ ra của mạng với tín hiệu vào là x(k):
2
− x ( k ) − mq
2σ q
z q (k ) = e
l
yi (k ) = ∑ wiq (k ) z q (k ) ( i = 1, n ; q = 1, l )
q =1
Trang 79
Chương 1 : Công nghệ tính toán mềm
Nhận xét:
Mạng RBF không bị ảnh hưởng bởi vấn ñề cực trị cục bộ. Tuy
nhiên, RBF thường ñáp ứng chậm trong giai ñoạn nhớ do có một lượng lớn
nơron ở lớp ẩn. Nhưng ta có thể cải thiện vấn ñề này bằng việc chọn tâm và
ñộ phân tán phù hợp.
Nhờ khả năng xấp xỉ các hàm phi tuyến bất kì với ñộ chính xác tuỳ
ý, mạng nơron, ñặc biệt là mạng RBF là công cụ quan trọng cho mô hình
hoá hệ thống và cho ñiều khiển thích nghi các hệ thống phi tuyến.
Nhận dạng thông số chính là quá trình luyện mạng. Tín hiệu sai số
e= y−~ y là cơ sở cho luyện mạng, ∆ là thời gian trễ.
Trang 80
Chương 1 : Công nghệ tính toán mềm
+ ðiều khiển với mô hình tham chiếu và sai số lan truyền qua ðTðK
Trang 81
Chương 1 : Công nghệ tính toán mềm
3. Ứng dụng mạng RBF ñể nhận dạng hệ ñộng lực học phi tuyến
Xét hệ ñộng học phi tuyến của ðTðK
x& = f ( x) + g ( x)u (1.79)
Giả sử ðTðK là ổn ñịnh vòng hở, véctơ trạng thái x là quan sát ñược. Cần
tìm mô hình xấp xỉ (1.79). Chọn A∈Rn x m là ma trận ổn ñịnh, ta viết lại
(1.79) dạng :
x& = Ax + ( f ( x) − Ax) + g ( x)u
Theo tính chất xấp xỉ của mạng RBF cho hàm phi tuyến: Nếu số lượng các
nút trong lớp ẩn là ñủ lớn thì f(x) - Ax và g(x) có thể xấp xỉ bằng các mạng
RBF sau:
f(x)- Ax = W*S(x) và g(x) = V*S(x)
trong ñó W* ∈ Rn x N và V* ∈ Rn x N là các ma trận trọng số của các tổ hợp
tuyến tính trên. N xác ñịnh số lượng nút trong một lớp RBF của mạng.
S(x) = [ S1, S2, …, SN ] T, véctơ các hàm cơ sở sau:
1
(
S k = x − Ck
2
+ρ 2
k )
−
2
, với k = 1, 2, 3,…N
Tâm Ck ∈ Rn và ñộ rộng ρk ∈ Rn ñược biết trước. Ta viết lại (1.79) như sau:
x& = Ax + W * S ( x) + V * S ( x)u
Vậy mô hình của ñối tượng có thể ñược mô tả bằng phương trình:
~
x& = A~x + WS ( x) + VS ( x)u
trong ñó W ∈ R , V ∈ Rn x N là các ma trận ước lượng của W*, V*, ~
nxN
x ∈Rn
là ước lượng trạng thái của x. Gọi
xe = ~ x − x , We = W*-W, Ve = V*-V
Phương trình sai số ước lượng sẽ là :
x& e = Axe + We S ( x) + Ve S ( x)u (1.80)
Trang 82
Chương 1 : Công nghệ tính toán mềm
n
V&ij = − S j ∑ Pik xek u
k =1
V& = − pS x u
ij j ei
q
Từ phương trình Lyapunov rút ra : p = >0.
2a
ðể hội tụ ñến trọng số thực, hệ ñộng lực phải có ñủ giàu thông tin ở ñầu
vào. Vì thế ña số ñầu vào ñược chọn ngẫu nhiên.
Trang 83
Chương 1 : Công nghệ tính toán mềm
1.3.7.Thuật toán học trực tuyến cấu trúc,thông số mạng nơron mờ ñộng
Hầu hết các thuật toán chỉnh ñịnh cấu trúc và thông số cho mạng nơ-ron mờ
ñều là học off-line. Quá trình học off-line (có giám sát) ñòi hỏi phải cung
cấp trước mẫu dữ liệu vào ra và việc học thông qua các vòng lặp huấn luyện
Do ñược cung cấp trước toàn bộ thông tin về hệ thống, cộng với ưu thế về
mặt thời gian (do off-line nên các vấn ñề về tốc ñộ học và thời gian học là
không quan trọng) và tài nguyên tính toán nên hầu hết các thuật toán học
off-line ñều cho chất lượng mạng tốt (tính ñặc trưng cao, sai số thấp, cấu
trúc ñơn giản…).
Vậy thì tại sao phải là on-line khi off-line ñã quá ñầy ñủ? Trong lĩnh vực
ñiều khiển tự ñộng, bài toán ñiều khiển ñối tượng khi ñặc tính ñộng học của
ñối tượng thay ñổi ñã dành ñược sự quan tâm của nhiều người. Thực tế ñã
chứng minh không phải bất kỳ một ñối tượng nào cũng mô hình hóa hoàn
toàn ñược (do ñặc tính phức tạp của nó) và khi ñã mô hình hóa ñược cũng
chưa chắc sẽ sử dụng ñược (vì ñặc tính ñối tượng không phải là bất biến
theo thời gian). ðể giải quyết bài toán này, người ta nghĩ ngay ñến các
phương pháp ñiều khiển thích nghi. Mạng nơ-ron mờ với khả năng tự học
của một mạng nơ-ron và tính ñặc trưng cao của một hệ mờ là lời giải thích
hợp nhất cho bài toán trên.
Trang 84
Chương 1 : Công nghệ tính toán mềm
Tập hợp r ngõ vào này trong một thời ñiểm tạo thành một vector ngõ vào:
Trong ñó : Ai : tập các giá trị ngôn ngữ của ngõ vào xi ,
aij : số mờ thứ jcủa ngõ vào thứ i với hàm liên thuộc dạng Gauss.
Ngõ ra của một nút thuộc lớp 2 sau khi mờ hóa:
với cij và σ j là tâm và bề rộng hàm liên thuộc Gauss thứ j của ngõ vào xi.
Nếu ñặt: Cj = [c1j … crj]T là vector chứa tâm hàm liên thuộc của luật thứ j
Trang 85
Chương 1 : Công nghệ tính toán mềm
Ta có thể thấy mỗi nút trong lớp này cũng là một hàm RBF của vector ngõ
vào X với tâm là vector Cj và bề rộng là σ j
Lớp 4 (lớp chuẩn hóa)
Lớp 4 gồm u nút, mỗi nút trong lớp này làm nhiệm vụ chuẩn hóa ngõ ra của
1 nút ở lớp 3 tương ứng theo công thức:
2. Thuật toán học cấu trúc và thông số on-line cho mạng DFNN
Khái niệm về học on-line:
ðây là một quá trình học có giám sát. Ban ñầu, cấu trúc mạng là hoàn toàn
“rỗng”, chỉ có các nơ-ron lớp vào và lớp ra (ñây là những nơ-ron cố ñịnh
trong suốt quá trình học). Học on-line, có nghĩa là mạng sẽ không ñược
cung cấp trước một tập mẫu dữ liệu vào- ra, các mẫu dữ liệu vào ra này sẽ
ñến với mạng ngay trong quá trình học, từng mẫu từng mẫu một. Do ñó,
mạng buộc phải hoàn tất một quá trình tính toán (chỉnh ñịnh cấu trúc và
thông số) trước khi lại tiếp tục nhận ñược một mẫu dữ liệu vào ra mới. Quá
trình học on-line là quá trình tiếp diễn không ngừng, từ mẫu dữ liệu vào ra
ñầu tiên cho ñến khi hệ thống ngừng hoạt ñộng hoặc mạng ñược lệnh ngừng
học. Vì vậy, thuật toán học on-line phải thỏa mãn các yêu cầu sau: tốc ñộ
hội tụ nhanh, cấu trúc mạng tinh gọn (số thông số ít) và có thể vận hành
trong ñiều kiện tài nguyên tính toán hạn chế.
Trang 86
Chương 1 : Công nghệ tính toán mềm
Khi mạng nhận ñược mẫu dữ liệu tiếp theo, quá trình chỉnh ñịnh thông số sẽ
ñược tiến hành trong mỗi chu kỳ lấy mẫu thông qua thuật toán bình phương
tối thiểu ñệ quy. Quá trình chỉnh ñịnh cấu trúc chỉ xảy ra khi:
• sai số ngõ ra của mạng tương ñối lớn
• khả năng ñặc trưng dữ liệu ñầu vào của mạng kém – mạng sẽ ñược
bổ sung thêm nơ-ron luật.
Sau một thời gian, các nơ-ron luật mới thêm vào do khả năng ñặc trưng tốt
hơn sẽ vô hiệu hóa sự ảnh hưởng của các nơ-ron luật cũ trước ñó. Các nơ-
ron luật cũ này sẽ bị xóa bỏ khỏi mạng bằng kỹ thuật giản lược ñể giữ cho
cấu trúc mạng ñược tinh gọn. Quá trình này cứ tiếp tục cho ñến mẫu dữ liệu
vào ra cuối cùng mà mạng nhận ñược.
Thuật toán học cho mạng DFNN bao gồm 2 quá trình chính: quá trình chỉnh
ñịnh cấu trúc và quá trình chỉnh ñịnh thông số
et = dt − yt (1.85)
Trang 87
Chương 1 : Công nghệ tính toán mềm
Nếu như et > ke thì thỏa mãn ñiều kiện thứ nhất ñể phát sinh luật
mới. Ở ñây, ke là hệ số không cố ñịnh mà giảm dần theo thời gian:
với 0 < β < 1 ñược gọi là hằng số suy giảm, emax là sai số tối ña và
emin là ñộ chính xác mong muốn.
• Khoảng cách tối thiểu: với mỗi mẫu dữ liệu vào ra thu thập ñược tại
thời ñiểm t ( X t , dt ) , tính các khoảng cách tương ñối giữa vector
ngõ vào X và tâm các hàm liên thuộc Cj:
md j = X t − C j (j = 1,2,..,u) (1.87)
Nếu như md min = md J > kd , có nghĩa là ngõ vào hiện tại không thể
ñược ñặt trưng bởi các luật mờ của hệ thống hiện tại, thì thỏa mãn
ñiều kiện thứ hai ñể phát sinh luật mới. Ở ñây, kd là hệ số không cố
ñịnh mà giảm dần theo thời gian:
kd = max d max × γ t , d min (1.88)
với 0 < γ < 1 ñược gọi là hằng số suy giảm, d max và d min là khoảng
cách tối ña và tối thiểu tùy thuộc vào từng ñối tượng.
Có 4 trường hợp có thể xảy ra:
• Trường hợp 1: et ≤ ke , md min ≤ kd . ðiều này thể hiện mạng ñã ñặc
trưng rất tốt cho mẫu dữ liệu hiện tại ( X t , dt ) . Do ñó không thực
hiện bất cứ thay ñổi nào trong mạng hoặc chỉ thực hiện việc chỉnh
ñịnh thông số mệnh ñề kết luận.
• Trường hợp 2: et ≤ ke , md min > kd . Mặc dù mẫu dữ liệu hiện tại
( X t , dt ) không ñược ñặt trưng tốt nhưng mạng vẫn mô tả ñúng ñối
tượng. ðiều này xảy ra khi mẫu dữ liệu ( X t , dt ) không mang nhiều
thông tin mô tả ñối tượng. Do ñó không thực hiện bất cứ thay ñổi
nào trong mạng hoặc chỉ thực hiện việc chỉnh ñịnh thông số mệnh ñề
kết luận.
Trang 88
Chương 1 : Công nghệ tính toán mềm
σ1 = σ 0 (i = 1,2,..,r)
Trang 89
Chương 1 : Công nghệ tính toán mềm
với σ 0 là hằng số xác ñịnh tùy thuộc vào miền xác ñịnh của X .
- Kỹ thuật giản lược
ðôi khi, một luật mới có thể ñược tạo ra khi thỏa mãn 2 ñiều kiện
phát sinh luật nhưng sau ñó lại ñóng góp không ñáng kể ñến khả năng nhận
dạng của mạng. Những luật dư thừa như vậy không những làm tăng khối
lượng tính toán của hệ thống mà còn có thể ảnh hưởng ñến chất lượng nhận
dạng của mạng DFNN. Do ñó, một ñòi hỏi ñặt ra là làm thế nào ñể giản lược
những luật thừa này ñể tối giản ñến mức thấp nhất có thể bộ luật của hệ
thống (từ ñó tối thiểu số thông số của mạng) mà vẫn giữ nguyên chất lượng
nhận dạng của mạng. Trong quá trình học on-line của mạng DFNN, một kỹ
thuật giản lược dựa trên thuật toán Error Reduction Ratio (ERR) ñược sử
dụng ñể tự ñộng loại bỏ những luật thừa như sau:
Cho n cặp mẫu dữ liệu vào ra (Xk, dk), k = 1,2,…,n. ðặt:
ψ 11 ψ 11 x11 L ψ 11 xr1 ψ u1 ψ u1 x11 L ψ u1 xr1
PSI = M M O M L M M O M (1.91)
ψ 1n ψ 1n x1n L ψ 1n xrn ψ un ψ un x1n L ψ un xrn
Trang 90
Chương 1 : Công nghệ tính toán mềm
Theo phương trình (1.99) có thể thấy thành phần gi 2 qiT qi ñặc trưng
cho sự ñóng góp của vector cơ sở qi ñến bình phương ngõ ra mong muốn.
Do ñó, có thể ñịnh nghĩa các tỉ số erri ñể ñặc trưng cho sự ñóng góp này
như sau:
gi 2 qiT qi
erri = (i = 1,2,…,u(r+1)) (1.100)
DT D
Trang 91
Chương 1 : Công nghệ tính toán mềm
Chuyển vector ERRi = err1 err2 L erru ( r +1) ∈ ℜ1×u ( r +1) sang ma
T
trận ∆ = [δ1 δ 2 L δ u ] ∈ ℜu×( r +1) với hàng thứ j của ∆ tương ứng với
luật thứ j của mạng DFNN. ðể tính mức ñộ ñóng góp của luật thứ j vào ngõ
ra của hệ thống, ñịnh nghĩa:
δ jδ j T
ηj = (1.102)
r +1
Nếu η j < kerr với kerr là một hằng số xác ñịnh, có nghĩa là luật thứ j của
mạng ñóng góp không ñáng kể ñến ngõ ra của hệ thống trong n tập mẫu dữ
liệu. Do ñó, luật thứ j của mạng có thể ñược xóa bỏ.
Trang 92
Chương 1 : Công nghệ tính toán mềm
Trang 93
Chương 1 : Công nghệ tính toán mềm
Trang 94
Chương 1 : Công nghệ tính toán mềm
Quá trình này ñược thực hiện dựa trên bánh xe quay roulette (bánh xe sổ
xố) với các rãnh ñược ñịnh kích thước theo ñộ thích nghi. Kỹ thuật này
ñược gọi là lựa chọn cha mẹ theo bánh xe roulette. Bánh xe roulette ñược
xây dựng như sau (giả ñịnh rằng, các ñộ thích nghi ñều dương, trong trường
hợp ngược lại thì ta có thể dùng một vài phép biến ñổi tương ứng ñể ñịnh lại
tỷ lệ sao cho các ñộ thích nghi ñều dương).
- Tính ñộ thích nghi fi, i=1÷ n của mỗi nhiễm sắc thể trong quần thể hiện
hành,với n là kích thước của quần thể (số nhiễm sắc thể trong quần thể).
n
- Tìm tổng giá trị thích nghi toàn quần thể: F = ∑ f i
i =1
fi
- Tính xác suất chọn pi cho mỗi nhiễm sắc thể: pi =
F
i
- Tính vị trí xác suất qi của mỗi nhiễm sắc thể: qi = ∑ p j
j =1
Tiến trình chọn lọc ñược thực hiện bằng cách quay bánh xe roulette n lần,
mỗi lần chọn một nhiễm sắc thể từ quần thể hiện hành vào quần thể mới
theo cách sau:
- Phát sinh ngẫu nhiên một số r trong khoảng [0÷1] khi quay bánh xe.
- Nếu r < q1 thì chọn nhiễm sắc thể ñầu tiên; ngược lại thì chọn nhiễm
sắc thể thứ i sao cho qi-1 < r ≤ qi
Ví dụ 1.11: Xét bài toán dân số có 6 nhiễm sắc thể với chuỗi mã hóa và
hệ số thích nghi tương ứng cho trong bảng 1.
Bảng 1: Các nhiễm sắc thể và các giá trị thích nghi
Trang 95
Chương 1 : Công nghệ tính toán mềm
6
Giá trị tổng thích nghi toàn quần thể là : F = ∑ f i = 50
i =1
fi
Tính xác suất chọn pi cho mỗi nhiễm sắc thể: pi =
F
i
Tính vị trí xác suất qi của mỗi nhiễm sắc thể: qi = ∑ p j
j =1
Nhiễm sắc Chuổi mã Trị thích nghi Xác suất chọn Vị trí xác suất
thể hóa f(i) pi qi
Bây giờ ta quay bánh xe roulette 6 lần, mỗi lần chọn một nhiễm sắc thể cho
quần thể mới. Giá trị ngẫu nhiên của 6 số trong khoảng [0÷1] và các nhiễm
sắc thể tương ứng ñược chọn ñược cho trong bảng 2.
Trang 96
Chương 1 : Công nghệ tính toán mềm
Ta thấy:
Lần 1: r1 = 0.55 > q1 = 0.16 và q3 < r <q4 nên ta chọn NST 4
Lần 2 : r2 = 0.1 < q1 = 0.16 nên ta chọn NST 1
Tương tự cho các lần quay còn lại, ta có sẽ ñược một quần thể mới.
Ta thấy, có thể sẽ có một số nhiễm sắc thể ñược chọn nhiều lần, các nhiễm
sắc thể có ñộ thích nghi cao hơn sẽ có nhiều bản sao hơn, các nhiễm sắc thể
có ñộ thích nghi kém nhất thì dần dần chết ñi.
Sau khi lựa chọn ñược quần thể mới, bước tiếp theo trong thuật toán di
truyền là thực hiện các phép toán lai ghép và ñột biến.
2. Lai ghép (Crossover)
Phép lai là quá trình hình thành nhiễm sắc thể mới trên cơ sở các nhiễm sắc
thể cha - mẹ, bằng cách ghép một hay nhiều ñoạn gen của hai (hay nhiều)
nhiễm sắc thể cha - mẹ với nhau. Phép lai xảy ra với xác suất pc, ñược thực
hiện như sau:
- ðối với mỗi nhiễm sắc thể trong quần thể mới, phát sinh ngẫu nhiên
một số r trong khoảng [0÷1], nếu r < pc thì nhiễm sắc thể ñó ñược chọn
ñể lai ghép.
- Ghép ñôi các nhiễm sắc thể ñã chọn ñược một cách ngẫu nhiên, ñối với
mỗi cặp nhiễm sắc thể ñược ghép ñôi, ta phát sinh ngẫu nhiên một số
nguyên pos trong khoảng [0÷m-1] (m là tổng chiều dài của một nhiễm
sắc thể - tổng số gen). Số pos cho biết vị trí của ñiểm lai. ðiều này ñược
minh họa như sau:
Trang 97
Chương 1 : Công nghệ tính toán mềm
Như vậy phép lai này tạo ra hai chuỗi mới, mỗi chuổi ñều ñược thừa hưởng
những ñặc tính lấy từ cha và mẹ của chúng. Mặc dù phép lai ghép sử dụng
lựa chọn ngẫu nhiên, nhưng nó không ñược xem như là một lối ñi ngẫu
nhiên qua không gian tìm kiếm. Sự kết hợp giữa tái sinh và lai ghép làm cho
thuật toán di truyền hướng việc tìm kiếm ñến những vùng tốt hơn.
Trang 98
Chương 1 : Công nghệ tính toán mềm
kiếm ngẫu nhiên, với tỷ lệ ñột biến cao, thuật toán di truyền sẽ còn xấu hơn
phương pháp tìm kiếm ngẫu nhiên.
Sau quá trình tái sinh, lai và ñột biến, quần thể mới tiếp tục ñược tính toán
các giá trị thích nghi, sự tính toán này ñược dùng ñể xây dựng phân bố xác
suất (cho tiến trình tái sinh tiếp theo), nghĩa là, ñể xây dựng lại bánh xe
roulette với các rãnh ñược ñịnh kích thước theo các giá trị thích nghi hiện
hành. Phần còn lại của thuật toán di truyền chỉ là sự lặp lại chu trình của
những bước trên.
Trang 99
Chương 1 : Công nghệ tính toán mềm
Bước 5: Nếu chưa tìm ñược giải pháp tối ưu thì trở lại bước 3. Nếu mục tiêu
tìm kiếm ñã ñạt ñược thì dừng lại. Báo cáo kết quả.
Trang 100
Chương 1 : Công nghệ tính toán mềm
Bước 2: Tìm hàm số thích nghi và tính hệ số thích nghi cho từng ñáp số.
Ta chọn hàm số thích nghi sau: f(X) = 1000 – (X2 – 64)
Vậy, ñáp số nào có hệ số thích nghi f gần bằng 1000 nhất thì ñó là ñáp số.
Bước 3: ta thấy, hệ số thích nghi của các ñáp số vẫn còn cách xa 1000.
Do ñó, cần tạo ra các ñáp số mới bằng cách biến hóa các ñáp số cũ. Ta thấy
số 4 và 10 có hệ số thích nghi cao hơn nên ñược chọn ñể tạo sinh và biến
hóa. ðồng thời số 21 và 24 có hệ số thích nghi thấp sẽ bị loại.
Giả sử ta lai ghép hai số 4 và 10 theo hình sau:
Trang 101
Chương 1 : Công nghệ tính toán mềm
Bước 5: May mắn chúng ta ñã tìm ñược kết quả là X = 8 với hệ số thích
nghi cao nhất là 1000.
Vậy kết quả của bài toán là X = 8.
Ví dụ 1.13:
Tìm giá trị cực ñại của hàm sau:
f ( x1 , x 2 ) = 21.5 + x1 × sin(4πx1 ) + x 2 × sin(20πx 2 )
Với − 3.0 ≤ x1 ≤ 12.1 và 4.1 ≤ x 2 ≤ 5.8
Giả sử kích thước quần thể là 20, các xác suất di truyền tương ứng là
pc = 0.25 và pm = 0.01
Giải:
Bước 1: Chúng ta sử dụng hệ nhị phân ñể xây dựng mô hình bài toán
Giả sử ta cần chính xác ñến 4 số lẻ thì số khoảng mà mỗi biến cần là:
Biến x1: {12.1 – ( -3.0 )} × 10000 = 151000 khoảng
⇒ số bit cần dùng ñể mã hóa cho biến x1 là 18 bit
v1 = 100110100000001111 111010011011111
v2 = 111000100100110111 001010100011010
v3 = 000010000011001000 001010111011101
v4 = 100011000101101001 111000001110010
v5 = 000111011001010011 010111111000101
v6 = 000101000010010101 001010111111011
v7 = 001000100000110101 111011011111011
Trang 102
Chương 1 : Công nghệ tính toán mềm
v8 = 100001100001110100 010110101100111
v9 = 100000000101100010 110000001111100
v10 = 000001111000110000 011010000111011
v11 = 011001111110110101 100001101111000
v12 = 110100010111101101 000101010000000
v13 = 111011111010001000 110000001000110
v14 = 010010011000001010 100111100101001
v15 = 111011101101110000 100011111011110
v16 = 110011110000011111 100001101001011
v17 = 011010111111001111 010001101111101
v18 = 011101000000001110 100111110101101
v19 = 000101010011111111 110000110001100
v20 = 101110010110011110 011000101111110
Bước 2: Giải mã và tính hệ số thích nghi (lấy NST thứ 1 làm ví dụ)
Mã hóa NST:
v1 = 100110100000001111 111010011011111
12.1 − (−3.0)
x1 = -3.0 + dec(100110100000001111) × = 6.0845
218 − 1
5.8 − 4.1
x2 = 4.1 + dec(111010011011111) × 15 = 5.6522
2 −1
f1 26.0196
Xác suất chọn p1 : p1 = = = 0.067
F 387.7768
i 1
Vị trí xác suất q1: qi = ∑ p j ⇒ q1 = ∑ p j = p1 = 0.067
j =1 j =1
Ta lần lượt tính giá trị của các NST còn lại. Ghi kết quả vào bảng.
Trang 103
Chương 1 : Công nghệ tính toán mềm
Tạo sinh: Xây dựng hệ thống bánh xe rulét cho tiến trình chọn lọc.
Quay bánh xe rulét 20 lần, phát sinh ngẫu nhiên 20 số (r) trong khoảng [0 1]
Mỗi lần quay chọn 1 NST mới (xem lại cách chọn NST ở phần trên)
Lần quay 1 2 3 4 5 6
Số ngẫu nhiên 0.514 0.175 0.308 0.534 0.947 0.171
NST ñược chọn v11 v4 v7 v11 v19 v4
Lần 7 8 9 10 11 12 13
r 0.702 0.226 0.494 0.424 0.704 0.389 0.277
NST v15 v5 v11 v3 v15 v9 v6
Lần 14 15 16 17 18 19 20
r 0.368 0.983 0.005 0.765 0.646 0.767 0.780
NST v8 v20 v1 v10 v13 v15 v16
Trang 104
Chương 1 : Công nghệ tính toán mềm
Ta thấy các NST v’2 ,v’11 ,v’13 ,v’18 ñược chọn ñể lai tạo. Ở ñây, chúng ta có
số NST cần ñược lai tạo là một số chẵn nên ta có thể bắt cặp dễ dàng.
Trường hợp tổng số NST cần lai tạo là số lẻ thì ta có thể cộng thêm một
NST ngoại hoặc lấy bớt ñi một NST một cách ngẫu nhiên.
Ta giả sử kết hợp (v’2 ,v’11) và (v’13 ,v’18). ðối với mỗi cặp NST sẽ phát
sinh một số nguyên ngẫu nhiên pos trong khoảng [1 32].
Số pos cho biết vị trí của ñiểm lai tạo.
Trang 105
Chương 1 : Công nghệ tính toán mềm
Vị trí bit Số ngẫu nhiên Nhiễm sắc thể thứ Vị trí bit trong NST
112 0.0002 4 13
349 0.0099 11 19
418 0.0088 13 22
429 0.0054 13 33
603 0.0028 19 9
Ta thấy có 4 NST bị ñột biến. Trong ñó, NST thứ 13 bị ñột biến ở 2 vị trí.
Sau khi ñột biến, quần thể hiện hành là:
v1 = 011001111110110101 100001101111000
v2 = 100011000101110000 100011111011110
v3 = 001000100000110101 111011011111011
v4 = 011001111110010101 100001101111000
v5 = 000101010011111111 110000110001100
v6 = 100011000101101001 111000001110010
v7 = 111011101101110000 100011111011110
v8 = 000111011001010011 010111111000101
v9 = 011001111110110101 100001101111000
Trang 106
Chương 1 : Công nghệ tính toán mềm
Như vậy ta ñã hoàn thành xong một vòng lặp (nghĩa là một thế hệ).
Ta tính toán tương tự cho vòng lặp kế. Kết quả thu ñược từ quần thể mới là:
Tổng ñộ thích nghi: F = 447.049 cao hơn so với quần thể trước (387.77).
NST tốt nhất v11 có ñộ thích nghi là 33.35 tốt hơn NST tốt nhất v11 của
quần thể trước là 30.06.
Nhận xét:
Cứ tiếp tục như thế, cá thể “trội hơn cả“ sẽ ñược lưu trữ tại một vị trí riêng
biệt. bằng cách này, thuật giải có thể duy trì ñược cá thể tốt nhất tìm ñược
trong suốt quá trình (không có nghĩa là tốt nhất trong quần thể cuối cùng).
Trang 107
Chương 1 : Công nghệ tính toán mềm
1.5. Sự kết hợp các thành phần của tính toán mềm
Ba thành phần chính của tính toán mềm có thể sử dụng hoàn toàn ñộc lập
với nhau, tuy nhiên thực tế ñã cho thấy việc kết hợp các thành phần này với
nhau sẽ làm tăng ñáng kể chất lượng của thuật toán.
Có 3 kiểu kết hợp tương ñối phổ biến :
Trang 108
Chương 1 : Công nghệ tính toán mềm
Mạng nơ-ron có khuyết ñiểm lớn là tính chất “hộp ñen” của nó. Dữ liệu
ñược ñưa vào mạng, quá trình tính toán xảy ra và cho kết quả ở ngõ ra. Tuy
vậy, ta không biết một cách chính xác chuyện gì ñã xảy ra.
Logic mờ thì ngược lại, các tập luật của chúng rất gần gũi với tri thức con
người. Tuy nhiên, logic mờ lại không có ñược khả năng tự học của mạng
nơ-ron. Các luật mờ và hàm liên thuộc chỉ có thể ñược ñiều chỉnh bằng tay.
Vì thế, sự kết hợp mạng nơron và ñiều khiển mờ ñã vô hình chung xóa bỏ
những khuyết ñiểm của chúng, tạo ra bộ ñiều khiển mờ - nơron có ưu ñiểm
vượt trội.
Khi hệ thống quá phức tạp (hoặc giá trị ngõ vào hoặc ngõ ra không ño lường
ñược), ta không thể xây dựng cấu trúc bộ mờ bằng kiến thức chuyên gia
cũng như không thể huấn luyện nó bằng mạng nơ-ron. Nếu như, việc ñánh
giá chất lượng của hệ thống là không quá khó và có thể xem như một hàm
thích nghi thì ta có thể sử dụng giải thuật di truyền ñể chỉnh ñịnh bộ mờ.
Các hệ quy tắc và hàm liên thuộc của bộ mờ ñược mã hóa thành các chuỗi
nhiễm sắc thể. Giải thuật di truyền ñược dùng ñể tạo ra lời giải tối ưu. ðó
chính là các thông số và tập luật làm cho chất lượng của hệ thống tối ưu.
Trang 109
Chương 1 : Công nghệ tính toán mềm
Một trong những ứng dụng thành công là việc phân tích nguyên nhân làm
xuất hiện các vết nứt trong các công trình xây dựng bằng ñá. ðây là một
lĩnh vực ñòi hỏi rất nhiều kiến thức chuyên gia và phụ thuộc vào nhiều ñặc
tính khác nhau. Hệ thống mờ ñược dùng có ngõ vào là 42 ñặc tính ño lường
ñược ñể xác ñịnh lý do chính từ 6 khả năng. Do hệ thống có số lượng thông
số quá lớn và cũng quá phức tạp, việc xây dựng bộ luật và xác ñịnh các hàm
liên thuộc cho hệ thống bằng tay là một ñiều gần không có tính khả thi. Giải
thuật di truyền ñã ñược vận dụng và ñem lại kết quả tương ñối tốt với tỉ lệ
sai số nhỏ hơn 4%.
Giải thuật di truyền ñòi hỏi ta phải xác ñịnh các hàm thích nghi. Tuy nhiên,
ñôi khi việc xác ñịnh hàm thích nghi hợp lý là một ñiều không thể. Ví dụ khi
dùng giải thuật di truyền ñể chỉnh ñịnh thông số cho bộ ñiều khiển của một
hệ thống phức tạp. Khi ñó, hàm thích nghi chính là chất lượng ñiều khiển
của toàn hệ thống. Thông số này chỉ có thể ñạt ñược bằng cách thử nghiệm
từng bộ ñiều khiển (từng cá thể) trên hệ thống thực. ðiều này gây tốn kém
về mặt thời gian và kinh tế.
Trong những trường hợp như vậy, mạng nơ-ron có thể ñược dùng ñể xây
dựng hàm thích nghi cho giải thuật di truyền. Thế mạnh của mạng nơ-ron là
khả năng nhận dạng do nó có thể xấp xỉ bất kỳ hàm phi tuyến nào. Sau khi
nhận dạng ñược mô hình hệ thống, mạng nơ-ron có thể thay thế việc thử
nghiệm trên hệ thống thực bằng việc mô phỏng trên máy tính. ðiều này
khiến giải thuật di truyền thực thi nhanh hơn do việc mô phỏng trên máy
tính ñược thực hiện hoàn toàn tự ñộng và cho kết quả nhanh chóng.
Một ứng dụng của kỹ thuật này là trong ngành công nghiệp thép. Việc dự
báo ñặc tính cơ của hợp kim thép khi ñược cung cấp các thông số về thành
phần kim loại và nhiệt ñộ tôi là một việc không dễ dàng. Các nhà nghiên
cứu tại ñại học Sheffield ñã huấn luyện một mạng nơ-ron dựa trên những
thông tin này và ñặc tính cơ ño ñạt ñược ñể xây dựng mô hình dự báo ñặc
tính hợp kim. Mạng nơ-ron này sau ñó ñược dùng như một hàm thích nghi
trong giải thuật di truyền ñể phát triển các thiết kế hợp kim mới với những
ñặc tính mong muốn.
Trang 110
Chương 1 : Công nghệ tính toán mềm
Ví dụ: Ta sẽ xem xét việc ứng dụng GA ñể huấn luyện mạng nơron truyền
thẳng ña lớp nhằm giải quyết bài toán XOR quen thuộc.
Ở ñây, ta sử dụng hàm kích hoạt trong mạng là hàm sigmoid vô cực.
Chuỗi nhiễm sắc thể (NST) ñược mã hóa dưới dạng (w1, w2 , …, w9 ). Trong
ñó, mỗi phần tử là một trọng số có giá trị thực. Phần tử nhỏ nhất mà quá
trình lai ghép và ñột biến ñiều khiển chính là các trọng số.
Giả sử, toán tử lai ghép ñược dùng là lai ghép ñều. Ta thực hiện quá trình
theo các bước sau:
Trước tiên, ta chọn ngẫu nhiên nc vị trí của phần tử trong NST.
Sau ñó thực hiện việc trao ñổi lẫn nhau giữa các phần tử tại những vị
trí ñã chọn ở trên.
Thông thường số lượng các phần tử ñược trao ñổi nc ñược chọn bằng một
phần hai tổng số các phần tử trong NST.
Toán tử ñột biến xảy ra với xác suất bằng 1.0 trên các cá thể chọn lựa khi
các cá thể ñó không tham gia vào hoạt ñộng lai ghép. Như vậy, nếu xác suất
lai ghép của một cặp cá thể là pc thì xác suất ñột biến sẽ là (1 - pc ).
Toán tử ñột biến sẽ làm tăng các phần tử thêm một giá trị bằng ∆ w, giá trị
này sẽ ñược chọn ngẫu nhiên trong khoảng xác ñịnh cho trước.
Trang 111
Chương 1 : Công nghệ tính toán mềm
Chọn ra các cặp ñể ứng dụng những toán tử di truyền (giống như
giải thuật chuẩn hóa.
Chọn ra những cá thể tồn tại cho lần tạo sinh kế tiếp. Sau khi các
toán tử di truyền tạo ra những cá thể mới, những cá thể tồn tại sẽ
ñược chọn từ những cá thể mới ñược tạo ra và những cá thể hiện tại.
Giá trị thích nghi sẽ ñược tính toán và gán ñến tất cả các cá thể. Sau
ñó, các cá thể dùng cho lần tạo sinh kế sẽ ñược chọn với xác suất
tương ứng với giá trị thích nghi của chúng. Kích cỡ quần thể của
những lần tạo sinh sau ñó cũng ñược giữ cố ñịnh (bằng một phần hai
quần thể thử nghiệm).
Bây giờ, ta sẽ ứng dụng GA ñược mô tả như trên vào mạng nơron (như
hình) ñể giải quyết bài toán XOR.
Giả sử rằng:
x1, x2 và y chỉ nhận hai giá trị là 0.1 hoặc 0.9 tương ứng với TRUE
hoặc FALSE. Kích cỡ quần thể là 20.
Giá trị khởi tạo ban ñầu là các số nguyên trong khoảng [ -10, 10 ].
Xác suất lai ghép pc = 0.7 và số vị trí lai ghép nc = 4.
Giá trị ñột biến ∆ w là một số nguyên ngẫu nhiên trong miền [-3, 3].
Toán tử ñột biến ñược ñiều chỉnh sao cho từng trong số không vượt quá
miền giới hạn [-10, 10] và bảo quản ñược kích cỡ của không gian tìm kiếm.
Giá trị thích nghi ñược tính dựa vào hàm lỗi, chính là trị tuyệt ñối của tổng
các sai lệch ngõ ra trên 4 mẫu XOR.
Sau 30 lần tạo sinh, ta sẽ có một mạng nơrơn hợp lý với giá trị hàm lỗi nhỏ
hơn 0.05 (giá trị thích nghi lớn hơn 20).
Trang 112
Chương 1 : Công nghệ tính toán mềm
Ngành ñiều khiển học ñã ra ñời và phát triển từ rất sớm, ñặc biệt là trong 2
thập niên gần ñây việc ứng dụng Lý thuyết mờ và Mạng nơron ñã tạo ra
nhiều phương pháp ñiều khiển mới với ñặc tính “linh hoạt” và “thông
minh” hơn. Công nghệ mờ và công nghệ mạng nơron là hai trụ cột chính ñể
tạo nên công nghệ tích hợp mới, công nghệ tính toán mềm (Soft computing).
Trang 113
Chương 1 : Công nghệ tính toán mềm
Thiết kế hệ thống ñiều khiển neuron mờ hệ con lắc ngược dựa trên
phương pháp tiếp cận sai số phân cấp mờ.
x 2
x
y = [1 0] 1
x2
Trong ñó:
u là lực tác dụng (tín hiệu ñiều khiển)
d là nhiễu ngoài tiền ñịnh (giả sử là tín hiệu sóng vuông với biên ñộ
+/- 0.1 và chu kì 2π.
Ngõ ra của hệ là y và tín hiệu ngõ ra mong muốn là ym =(π/30).sin(t)
Nhiệm vụ ñiều khiển của ta là ñiều khiển trạng thái y = x của hệ thống bám
theo quỹ ñạo của tín hiệu mong muốn ym.
1. Bài toán ñiều khiển thích nghi:
Xem xét hệ phi tuyến một ngõ vào - một ngõ ra (SISO) bậc n có dạng sau:
.
x = Ax + B( f (x) + g (x)u + d ) (1)
y = CT x
Trong ñó: A là ma trận dạng thường, B T = [0 0 .. 0 1], C T = [1 0 ... 0 0]
f(.) và g(.) là hàm phi tuyến chưa biết của hệ thống.
u∈R vaø y∈R là hàm ngõ vào và ngõ ra của hệ tương ứng
Cho x = ( x, x ,..., x (n−1) )T = ( x1 , x2 ,..., xn )T ∈ R n là vectơ trạng thái của hệ và
(1)
giả thiết là không ño ñược hoàn toàn, và cho d là nhiễu giới hạn bên ngoài.
ðể hệ (1) là ñiều khiển ñược, chúng ta yêu cầu g (x) ≠ 0 và không mất tính
tổng quát, giả thiết rằng | g (x) |> 0 .
Xét một ngõ ra hệ thống y là ño ñược và tín hiệu mong muốn cho trước ym.
Giả thiết y m , y m(1) ,..., y m( n −1) là ràng buộc và ño ñược tương ứng. Mục tiêu
ñiều khiển là tìm kiếm luật ñiều khiển u(t) ñể ngõ ra thực y(t) tiệm cận ñến
Trang 114
Chương 1 : Công nghệ tính toán mềm
ngõ ra mong muốn ym(t). Vectơ sai số bám theo e và vectơ sai số ước lượng
ñược ñịnh nghĩa như sau:
e = y m − x,
(2)
eˆ = y m − xˆ
Trong ñoù y m = y m , y m(1) ,..., y m( n−1) , e = (e, e (1) ,..., e ( n−1) ) ,
x̂ vaø ê ký hiệu ước lượng của x và e tương ứng.
n
Với ∀x∈R , | g (x) |> 0 , nhiệm vụ của ñiều khiển là sử dụng ngõ vào và ngõ
ra của hệ thống ñể thiết kế luật cập nhật của bộ ñiều khiển neuron mờ u =
u (y | θ f , θ g ) và vectơ thông số θ f vaø θ g . ðiều này phải thỏa mãn rằng tất
cả các biến có trong hệ thống ñiều khiển vòng kín là bị chặn và sai số bám
theo phải càng nhỏ càng tốt thỏa chỉ tiêu ràng buộc.Theo tiêu chuẩn ổn ñịnh
Lyapunov và dựa trên tiếp cận tương ñương chắc chắn, ta có luật ñiều khiển
là:
1
u= [− fˆ (xˆ ) + y m(n) + KTc eˆ − uC ] (3)
ˆ
gˆ (x)
Trong ñó: hàm fˆ (xˆ ) và gˆ (xˆ ) là ước lượng của hàm phi tuyến f(x) và g(x),
K T = (k n , k n −1 ,..., k1 ) là vectơ ñộ lợi hồi tiếp và uc là tín hiệu ñiều khiển bù
nhiễu bên ngoài và sai số ước lượng. Ta chọn KT ñể ña thức ñặc tính
(A - BKT) là Hurwitz, nghĩa là cực ñặc tính nằm bên trái mặt phẳng phức.
ðể ñạt ñược luật thích nghi cần xác ñịnh nguyên tắc chỉnh θ f , vaø θ g , ta xét
hàm Lyapunov :
1 T 1 %T % 1 %T %
V= e% Pe% + .θ f θ f + .θ g θ g
2 2γ 1 2γ 2
Trong ñó: θ%f = θ f − θ *f ,θ%g = θ g − θ g* , γ1 và γ2 là các giá trị vô hướng dương
và P = PT ≥ 0 là ma trận xác ñịnh dương thỏa phương trình Lyapunov ðạo
hàm theo thời gian của V, ta ñược:
1 1 1 & 1 &
V& = e%& TPe% + e% T Pe%& + θ%fTθ%f + θ%gTθ%g
2 2 γ1 γ2
Theo tiêu chuẩn ổn ñịnh Lyapunov, V& ≤ 0 , ta có luật thích nghi θ& ,θ& . f g
θ&f = −γ 1e Pbξ ( x )θ
T
Trang 115
Chương 1 : Công nghệ tính toán mềm
Trong lớp 3(lớp luật) ñộ mạnh cháy của luật ñược cho bởi:
n n
ψ Fl ( xi ) = ∏ µ F ( xi )
i i
l ψ Gl ( xi ) = ∏ µ G ( xi )
i
l
i
i =1 i =1
Lớp 4, lớp ngõ ra của mạng tiền ñề thực hiện tính toán chuẩn hóa của ñộ
mạnh cháy bởi:
n
n
l
∏µ
i =1
Fil
( xi )
ψ Fl ( xi ) ∏µ Gil
( xi )
ψ Gl ( xi )
ξ (x) =
f M n
= M
i
ξ gl (x) = M
i =1
n
= M
i
∑ (∏ µF l ( xi ))
l =1 i =1
i
∑ψ Fl ( xi )
l =1
i ∑ (∏ µG l ( xi )) i
∑ψ Gl ( xi ) i
l =1 i =1 l =1
Trang 116
Chương 1 : Công nghệ tính toán mềm
Hình 1.26 Caáu truùc cuûa maïng neuron môø döïa treân giaûi thuaät FHEA
Trang 117
Chương 1 : Công nghệ tính toán mềm
Trang 118
Chương 1 : Công nghệ tính toán mềm
Nhận xét:
Quĩ ñạo trạng thái x1(t) bám theo ym khá tốt, tuy nhiên luật ñiều khiển u(t)
có tần số dao ñộng cao.Sai số ngõ ra Eout tiến ñến 0 sau 20 giây.
Trang 119
Chương 1 : Công nghệ tính toán mềm
5. Kết luận:
Tóm tắt kết quả ñieàu khieån neuron môø vôùi giaûi thuaät FHEA cho heä con laéc
ngöôïc ñöôïc ñeà nghò.
1. Trong sô ñoà ñieàu khieån neuron môø heä con laéc ngöôïc , haøm phi
tuyeán f vaø g ñöôïc xaáp xæ baèng maïng neuron môø döïa treân tieáp caän sai soá ngoõ
ra môø phaân caáp . Maïng neuron môø FHEA ñöôïc hoïc vaø huaán luyeän tröôùc
döïa vaøo taäp maãu vaøo ra trong caùch thöùc khoâng tröïc tuyeán.
2. Giaù trò troïng soá laø phi tuyeán vì heä con laéc ngöôïc laø phi tuyeán , f
vaø g phi tuyeán theo.
3. Keát quaû moâ phoûng ñaõ chöùng minh raèng giaûi thuaät FHEA coù theå
caûi thieän tính hieäu quaû cuûa xaáp xæ baùm theo cho heä phi tuyeán chöa bieát. Vôùi
nhieãu tieàn ñònh, ngoõ ra coøn baùm theo tín hieäu mong muoán. Neáu ñöa vaøo
nhieãu ngaãu nhieân thì ñieàu khieån baùm theo maát oån ñònh.
4. Boä ñieàu khieån neuron môø cho keát quaû moâ phoûng toát trong giôùi
haïn troïng löôïng con laéc m vaø chieàu daøi con laéc L=2l: m thay ñoåi töø 0.1kg
ñeán 0.3kg, vaø L thay ñoåi töøø 1m ñeán 5m.
5. Keát quaû duøng giaûi thuaät FHEA cho keát quaû moâ phoûng toát hôn vaø
nhanh hôn duøng maïng neuron môø singleton.
Trang 120
Chương 1 : Công nghệ tính toán mềm
7. Thiết kế bộ mờ ñiều khiển nhiệt ñộ. Bộ mờ có 2 ngõ vào là sai lệch e(t)
[ET] và ñạo hàm sai lệch de(t) [DET], một ngõ ra là ñạo hàm công suất
[DP]. Biết rằng:
_ Lò nhiệt có công suất là 5KW, tầm ño max là 200 0C, sai số là ± 5%.
_ Tầm thay ñổi của DET là -10 0 C / s → 10 0 C / s
_ Tầm thay ñổi của DP là -100W/s → 100W/s
Hãy tính côg suất cung cấp cho lò trong các trường hợp sau:
1. ET= 80C DET= 9 0 C / s
2. ET= 20C DET= 9 0 C / s
3. ET= 70C DET= -7 0 C / s
Trang 121
Chương 1 : Công nghệ tính toán mềm
Trang 122
Chương 1 : Công nghệ tính toán mềm
1. Vẽ sơ ñồ mạng perceptron cho bài toán.Có bao nhiêu ngõ vào yêu cầu
2. Biểu diễn các cặp ngõ vào/ra trên ñồ thị. Bài này có thể giải bằng sơ
ñồ mạng vừa thiết kế ở trên không ? Tại sao?
12. Cho bài toán phân loại với các cặp vào/ra như sau:
4. Trong 4 vectơ trên, vectơ nào cho kết quả phân loại giống nhau
(không phụ thuộc vào W và b). Tại sao?
1. Viết biểu thức chuyển ñổi từ hàm hardlim() sang hàm hardlims()
2. Hai mạng neutron có cấu trúc W và b như nhau: mạng thứ nhất sử
dụng hàm nấc thường hardlim(), mạng thứ hai sử dụng hàm nấc ñối xứng
hardlims(). Với cùng giá trị ñầu vào p và cùng sử dụng luật học perceptron
thì vectơ W có giá trị như nhau cho cả hai mạng không?
3. Nếu sự biến ñổi của W là khác nhau thì chúng khác nhau như thế nào.
Tại sao?
Trang 123
Chương 1 : Công nghệ tính toán mềm
4. Giữ nguyên giá trị ban ñầu W và b (giá trị ñầu của mạng perceptron
sử dụng hàm hardlim()). Hãy tạo một thuật toán cho mạng perceptron sử
dụng hàm hardlims() ñể hai mạng trên luôn ñáp ứng như nhau khi huấn
luyện trên cùng một dữ liệu.
17. Khi ño trọng lượng và chiều dài của tai thỏ và gấu ta thu ñược các vectơ:
Trong ñó:
Phần tử thứ nhất của vectơ ngõ vào là trọng lượng
Phần tử thứ hai của vectơ ngõ vào là chiều dài của tai
Chuẩn ngõ ra 0 ứng với thỏ
Chuẩn ngõ ra 1 ứng với gấu
1. Dùng Matlab ñể ñặt giá trị ñầu và huấn luyện mạng giải bài toán.
2. Dùng Matlab ñể kiểm tra giá trị W và b ñạt ñược dựa vào các vectơ
ngõ vào.
3. Thay ñổi giá trị các ngõ vào sao cho bài toán có lời giải (tức là tồn tại
ñường phân chia tuyến tính). Sau ñó huấn luyện lại mạng này.
18. Sau ñây là một dạng khác của luật học perceptron:
19. Dùng Simulink ñể mô phỏng các hệ thống “Quả bóng và ñòn bẩy”,
“Con lắc ngược”, hệ thống ñiều khiển nhiệt ñộ dùng PID mờ.
20. Tham khảo các ví dụ trong phần Help/Fuzzy Control Toolbox của
Matlab.
21.Xây dựng M-file, s-funtion trong Simulink cho hệ thống.
Trang 124
Chương 2: ðiều khiển tối ưu
Chương 2
Hệ thống ñiều khiển như hình trên bao gồm các phần tử chủ yếu : ñối tượng
ñiều khiển ( ðTðK ) , cơ cấu ñiều khiển ( CCðK ) và vòng hồi tiếp ( K ) .
Với các ký hiệu :
r : tín hiệu ñầu vào, mục tiêu ñiều khiển, ñáp ứng mong muốn của hệ thống.
u : tín hiệu ñiều khiển, luật ñiều khiển.
x : tín hiệu ñầu ra, ñáp ứng ra của hệ thống.
ε = r – x : sai lệch của hệ thống.
f : tín hiệu nhiễu
Chỉ tiêu chất lượng J của một hệ thống có thể ñược ñánh giá theo sai lệch
của ñại lượng ñược ñiều khiển x so với trị ñáp ứng mong muốn r , lượng quá
ñiều khiển ( trị số cực ñại xmax so với trị số xác lập x ( ∞ ) tính theo phần
trăm ) , thời gian quá ñộ … hay theo một chỉ tiêu hỗn hợp trong ñiều kiện
làm việc nhất ñịnh như hạn chế về công suất , tốc ñộ , gia tốc … Do ñó việc
chọn một luật ñiều khiển và cơ cấu ñiều khiển ñể ñạt ñược chế ñộ làm việc
tối ưu J ñạt cực trị còn tùy thuộc vào lượng thông tin ban ñầu mà ta có ñược.
Ở ñây chúng ta có thể thấy ñược sự khác biệt về kết quả nhận ñược chất
lượng tối ưu khi lượng thông tin ban ñầu thay ñổi ( Hình 2.2 ) .
Trang 125
Chương 2: ðiều khiển tối ưu
Khi tín hiệu ñiều khiển u giới hạn trong miền [u1,u2] , ta có ñược giá trị tối
ưu cực ñại J1∗ của chỉ tiêu chất lượng J ứng với tín hiệu ñiều khiển u1∗ .
Khi tín hiệu ñiều khiển u không bị ràng buộc bởi ñiều kiện u1 ≤ u ≤ u2 , ta
có ñược giá trị tối ưu J 2∗ > J1∗ ứng với u2∗ . Như vậy giá trị tối ưu thực sự
bây giờ là J 2∗ .
Tổng quát hơn , khi ta xét bài toán trong một miền [um , un ] nào ñó và tìm
ñược giá trị tối ưu J i∗ thì ñó là giá trị tối ưu cục bộ . Nhưng khi bài toán
không có ñiều kiện ràng buộc ñối với u thì giá trị tối ưu là
J ∗ = extremum( J i∗ ) với J i∗ là các giá trị tối ưu cục bộ , giá trị J ∗ chính là
giá trị tối ưu toàn cục .
Trang 126
Chương 2: ðiều khiển tối ưu
ðể thành lập bài toán tối ưu thì yêu cầu ñầu tiên là hệ thống phải có ñặc tính
phi tuyến có cực trị .
Bước quan trọng trong việc thành lập một hệ tối ưu là xác ñịnh chỉ tiêu chất
lượng J . Nhiệm vụ cơ bản ở ñây là bảo ñảm cực trị của chỉ tiêu chất lượng
J . Ví dụ như khi xây dựng hệ tối ưu tác ñộng nhanh thì yêu cầu ñối với hệ
là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá ñộ nhỏ nhất , nghĩa là cực tiểu hóa thời gian quá ñộ . Hay khi tính toán
ñộng cơ tên lửa thì chỉ tiêu chất lượng là vượt ñược khoảng cách lớn nhất
với lượng nhiên liệu ñã cho .
Chỉ tiêu chất lượng J phụ thuộc vào tín hiệu ra x(t) , tín hiệu ñiều khiển u(t)
và thời gian t . Bài toán ñiều khiển tối ưu là xác ñịnh tín hiệu ñiều khiển u(t)
làm cho chỉ tiêu chất lượng J ñạt cực trị với những ñiều kiện hạn chế nhất
ñịnh của u và x .
Chỉ tiêu chất lượng J thường có dạng sau :
T
J = ∫ L[ x(t ), u (t ), t ]dt
0
Trong ñó L là một phiếm hàm ñối với tín hiệu x , tín hiệu ñiều khiển u và
thời gian t .
Lấy ví dụ về bài toán ñiều khiển ñộng cơ ñiện một chiều kích từ ñộc lập
Φ kt = const với tín hiệu ñiều khiển u là dòng ñiện phần ứng iu và tín hiệu ra
x là góc quay ϕ của trục ñộng cơ .
Trang 127
Chương 2: ðiều khiển tối ưu
Trang 128
Chương 2: ðiều khiển tối ưu
Trang 129
Chương 2: ðiều khiển tối ưu
∂L / ∂u1
∆ ∂L ∂L / ∂u 2
Lu = (2.2)
∂u M
∂L / ∂u m
và ñạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma trận
Hessian ) :
2
∆ ∂ L
∂2L
Luu = (2.3)
∂u 2 ∂u i ∂u j
Nhắc lại : Luu là xác ñịnh dương ( hoặc âm ) nếu như các giá trị riêng của nó
là dương ( hoặc âm ) , không xác ñịnh nếu các giá trị riêng của nó vừa có
dương vừa có âm nhưng khác 0 , và sẽ là bán xác ñịnh nếu tồn tại giá trị
riêng bằng 0 . Vì thế nếu Luu = 0 , thì thành phần thứ hai sẽ không hoàn
toàn chỉ ra ñược loại của ñiểm cực trị .
Trang 130
Chương 2: ðiều khiển tối ưu
chỉ tiêu chất lượng L(x,u) ñạt giá trị nhỏ nhất và thỏa mãn ñồng thời các
phương trình ñiều kiện ràng buộc .
f ( x, u ) = 0 (2.7)
Vector trạng thái x ñược xác ñịnh từ một giá trị u cho trước bằng mối quan
hệ (2.7) , vì thế f là một hệ gồm n phương trình vô hướng , f ∈ R n .
ðể tìm ñiều kiện cần và ñủ của giá trị cực tiểu , ñồng thời thỏa mãn
f ( x, u ) = 0 , ta cần làm chính xác như trong phần trước . ðầu tiên ta khai
triển dL dưới dạng chuỗi Taylor , sau ñó xác ñịnh số hạng thứ nhất và thứ
hai là Lu & Luu.
∂L
= Lu (2.13)
∂u dx =0
ðể thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi df = 0 ,
ta cần có :
Lu − f uT f x−T L x = 0 (2.14)
ðây là ñiều kiện cần ñể có giá trị cực tiểu . Trước khi ñi tìm ñiều kiện ñủ ,
chúng ta hãy xem xét thêm một vài phương pháp ñể có ñược (2.14) .
Viết (2.8) và (2.9) dưới dạng:
dL LTx LTu dx
df = = 0 (2.15)
f x f u du
Trang 131
Chương 2: ðiều khiển tối ưu
Hệ phương trình tuyến tính này xác ñịnh một ñiểm dừng , và phải có một
[ ]T
kết quả dx T du T . ðiều này chỉ xảy ra nếu ma trận hệ số (n +1) × (n + m )
có hạng nhỏ hơn n+1 . Có nghĩa là các hàng của ma trận tuyến tính với nhau
ñể tồn tại một vector λ có n số hạng như sau:
T L LTu
T
[ ]
1 λ . x =0 (2.16)
f x fu
Hay:
LTx + λT f x = 0 (2.17)
LTu + λT f u = 0 (2.18)
Giải (2.17) ta ñược λ :
λT = − LTx f x−1 (2.19)
và thay vào (2.18) ñể có ñược (2.14) .
Vector λ ∈ R n ñược gọi là thừa số Lagrange , và nó sẽ là công cụ hữu ích
cho chúng ta sau này . ðể hiểu thêm ý nghĩa của thừa số Lagrange ta xét du
= 0 , từ (2.8) và (2.9) ta khử dx ñể ñược :
dL = LTx f x−1df (2.20)
Vì vậy:
∂L
= (LTx f x−1 ) = −λ
T
(2.21)
∂f du =0
Do ñó -λ là ñạo hàm riêng của L với biến ñiều khiển u là hằng số . ðiều này
nói lên tác dụng của hàm chỉ tiêu chất lượng với biến ñiều khiển không ñổi
khi ñiều kiện ràng buộc thay ñổi .
Như là một cách thứ ba ñể tìm ñược (2.14), ta phát triển thêm ñể sử dụng
cho các phân tích trong những phần sau. Kết hợp ñiều kiện ràng buộc và
hàm chỉ tiêu chất lượng ñể thành lập hàm Hamilton .
H ( x, u, λ ) = L( x, u ) + λT f ( x, u ) (2.22)
Với λ ∈ R là thừa số Lagrange chưa xác ñịnh . Muốn chọn x , u , λ ñể có
n
Trang 132
Chương 2: ðiều khiển tối ưu
Sau ñó ta xác ñịnh x với giá trị của u ñã có bằng phương trình ñiều kiện ràng
buộc f ( x, u ) = 0 . Trong trường hợp này hàm Hamilton tương ñương với
hàm chỉ tiêu chất lượng:
H f =0 = L (2.26)
Nhắc lại : nếu f = 0 , ta sẽ tìm ñược dx theo du từ (2.10) . Ta không nên xét
mối quan hệ giữa du và dx ñể thuận tiện trong việc chọn λ sao cho :
Hx = 0 (2.27)
ðạo hàm (2.22) theo x:
∂H
= L x + f xT λ = 0 (2.28)
∂x
hay λT = − LTx f x−1 .
Nếu giữ nguyên (2.25) và (2.27) từ (2.23):
dL = dH = H uT du (2.29)
Vì H = L, ñể có ñược ñiểm dừng ta phải áp ñặt ñiều kiện:
Hu = 0 (2.30)
Tóm lại , ñiều kiện cần ñể có ñược ñiểm cực tiểu của L(x,u) thỏa mãn ñiều
kiện ràng buộc f(x,u) = 0 gồm có :
∂H
= f =0 (2.31a)
∂λ
∂H
= L x + f xT λ = 0 (2.31b)
∂x
∂H
= Lu + f uT λ = 0 (2.31c)
∂u
Với H ( x,u, λ ) xác ñịnh bởi (2.22) . Cách thường dùng là từ 3 phương trình
ñã cho xác ñịnh x , λ , và u theo thứ tự tương ứng . So sánh 2 phương trình
(2.31b) và (2.31c) ta thấy chúng tương ứng với 2 phương trình (2.17) và
(2.18) .
Trong nhiều ứng dụng , chúng ta không quan tâm ñến giá trị của λ , tuy
nhiên ta vẫn phải ñi tìm giá trị của nó vì ñó là một biến trung gian cho phép
chúng ta xác ñịnh các ñại lượng cần tìm là u , x và giá trị nhỏ nhất của L .
Ưu ñiểm của thừa số Lagrange có thể tóm tắt như sau : trên thực tế , hai ñại
lượng dx và du không phải là hai ñại lượng biến thiên ñộc lập với nhau ,
theo (2.10) . Bằng cách ñưa ra một thừa số bất ñịnh λ , chúng ta chọn λ sao
cho dx và du có thể ñược xem là hai ñại lượng biến thiên ñộc lập với nhau .
Lấy ñạo hàm riêng của H lần lượt theo các biến như trong (2.31) , như thế ta
sẽ có ñược ñiểm dừng .
Trang 133
Chương 2: ðiều khiển tối ưu
Khi ñưa ra thừa số Lagrange , chúng ta có thể thay thế bài toán tìm giá trị
nhỏ nhất của L(x,u) với ñiều kiện ràng buộc f(x,u) = 0 , thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,λ) không có ñiều kiện ràng buộc .
ðiều kiện ñã (2.31) xác ñịnh một ñiểm dừng . Ta sẽ tiếp tục chứng minh ñây
là ñiểm cực tiểu như ñã thực hiện trong phần trước .
Viết chuỗi Taylor mở rộng cho ñộ biến thiên của L và f như sau :
dx 1 L L xu dx
[ ]
dL = LTx LTu + dx T du T xx [ ]
+ O(3) (2.32)
du 2 Lux Luu du
dx 1 f f xu dx
df = [ f x f u ] + dx T [ ]
du T xx
f uu du
+ O(3) (2.33)
du 2 f ux
Với:
∂2 f ∆
f xu =
∂u∂x
ðể ñưa ra hàm Hamilton , ta sử dụng các phương trình sau :
dL dx 1 H
H xu dx
[1 λT ] [
= H xT ]
H uT + dx T [ ]
du T xx
H uu du
+ O(3)
df du 2 H ux
(2.34)
Bây giờ , ñể có ñược ñiểm dừng ta cần có f = 0 , và ñồng thời thành phần
thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du . Vì f = 0
nên df = 0 , và ñiều này ñòi hỏi H x = 0 và H u = 0 như trong (2.31) .
ðể tìm ñiều kiện ñủ cho ñiểm cực tiểu , chúng ta xét ñến thành phần thứ hai .
ðầu tiên , ta cần xem mối quan hệ giữa dx và du trong (2.34) . Giả sử rằng
chúng ta ñang ở ñiểm cực trị nên H x = 0 , H u = 0 và df = 0 . Từ (2.10)
suy ra:
dx = − f x−1 f u du + O(2) (2.35)
Thay vào (2.34) ta ñược :
1 H H xu − f x−1 f u
2
[
dL = du T − f uT f x−T I xx ] du + O(3) (2.36)
H ux H uu I
ðể ñảm bảo ñây là ñiểm cực tiểu , dL trong (2.36) phải dương với mọi sự
biến thiên của du . ðiều này ñược ñảm bảo nếu như ma trận uốn với f luôn
bằng 0 là xác ñịnh dương .
∆ H H xu − f x−1 f u
f
Luu [
= Luu f = − f uT f x−T I xx ]
(2.37)
H ux H uu I
= H uu − f uT f x−T H xu − H ux f x−1 f u + f uT f x−T H xx f x−1 f u
Trang 134
Chương 2: ðiều khiển tối ưu
Lưu ý rằng nếu ñiều kiện ràng buộc f ( x, u ) = 0 với mọi x và u thì (2.37)
ñược rút lại thành Luu ở phương trình (2.3) .
Nếu (2.37) là xác ñịnh âm ( hoặc không xác ñịnh ) thì ñiểm dừng sẽ là ñiểm
cực ñại ( hoặc ñiểm yên ngựa ) .
2.1.3 Ví dụ
Tối ưu hóa không có ñiều kiện ràng buộc
Ví dụ 2.1 : Không gian toàn phương .
Cho u ∈ R 2 và :
1 q q12
L(u ) = u T 11 u + [s1 s 2 ]u (1)
2 q12 q 22
∆ 1
= u T Qu + S T u (2)
2
ðiểm cực trị ñược xác ñịnh bởi :
Lu = Qu + S = 0 (3)
u ∗ = −Q −1 S (4)
với u* dùng ñể chỉ biến ñiều khiển tối ưu.
Loại của ñiểm cực trị ñược xác ñịnh bằng cách xét ma trận hessian
Luu = Q (5)
ðiểm u* là cực tiểu nếu Luu > 0 ( q11 > 0 và q11 q 22 − q122 > 0 ) . Là ñiểm cực
ñại nếu Luu < 0 ( q11 < 0 và q11 q 22 − q122 > 0 ) . Nếu Q < 0 , thì u* là ñiểm
yên ngựa . Nếu Q = 0 , thì u* là ñiểm kỳ dị , chúng ta không thể xác ñịnh
ñược ñó là cực tiểu hay cực ñại từ Luu .
Bằng cách thay (4) vào (2) ta sẽ tìm ñược giá trị của hàm chỉ tiêu chất lượng
như sau :
∆ 1 1
L* = L(u * ) = S T Q −1QQ −1 S − S T Q −1 S = − S T Q −1 S (6)
2 2
Giả sử cho L như sau:
1 T 1 1
L= u u + [0 1]u (7)
2 1 2
Khi ñó giá trị u tối ưu sẽ là:
2 − 1 0 1
u * = − = (8)
1 1 1 − 1
Trang 135
Chương 2: ðiều khiển tối ưu
là một cực tiểu , vì Luu > 0 . Từ (6) giá trị nhỏ nhất của L là L* = -1/2 .
Các ñường ñồng mức của L(u) trong (7) ñược vẽ trong Hình 2.4 , với u = [u1
u2]T . Các mũi tên là gradient .
u + u2
Lu = Qu + S = 1 (9)
u1 + 2u 2 + 1
Lưu ý rằng gradient luôn luôn vuông góc với các ñường ñồng mức và có
hướng là hướng tăng L(u) .
Chúng ta dùng dấu “*” ñể chỉ giá trị tối ưu của u và L cần tìm . Tuy nhiên ta
thường bỏ qua dấu “*” .
Trang 136
Chương 2: ðiều khiển tối ưu
∂L
= u1 + 2u 2 + 1 = 0 (2b)
∂u 2
Trang 137
Chương 2: ðiều khiển tối ưu
Lx x + u
L = x + 2u + 1 (10)
u
Tại ñiểm cực tiểu (3,-2) , grad L(x,u) sẽ có giá trị :
L x 1
L = 0 (11)
u
Cần lưu ý rằng gradf và gradL tương ñương với nhau tại ñiểm dừng . Có
nghĩa là ñiểm cực tiểu xuất hiện khi ñiều kiện ràng buộc (2) là ñường tiếp
tuyến của các ñường ñồng mức của L. Di chuyển hướng dọc theo ñường
thẳng f = 0 sẽ làm tăng giá trị của L .
Ta tìm ñược giá trị của L tại ñiểm cực tiểu bằng cách thay x = 3, u = -2 vào
(1) , ta ñược L*=0,5 .
Vì λ = -1 , giữ nguyên giá trị u = -2 , thay ñổi ñiều kiện ràng buộc df ( dịch
chuyển ñường thẳng trong Hình 2.5 về phía phải ) sẽ làm tăng L(x,u) với dL
= -λdf = df .
Ví dụ 2.4 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính - Trường hợp vô hướng .
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
1 x2 y 2
L( x, u ) = 2 + 2 (1)
2a b
Với ñiều kiện ràng buộc tuyến tính :
f ( x, u ) = x + mu − c (2)
2
Các ñường ñồng mức của L(x,u) là những ellip; nếu L(x,u) = l /2, thì bán
kính trục chính và bán kính trục phụ là al và bl . ðiều kiện ràng buộc f(x,u)
là một họ các ñường thẳng chứa thông số c . Xem Hình 2.6 ( lưu ý rằng u là
biến ñộc lập , với x ñược xác ñịnh bởi f(x,u) = 0 ) .
Hàm Hamilton là :
1 x2 u2
H = 2 + 2 + λ ( x + mu − c) (3)
2a b
Và ñiều kiện ñể có ñiểm dừng :
H λ = x + mu − c = 0 (4)
x
Hx = 2 + λ = 0 (5)
a
u
H u = 2 + λm = 0 (6)
b
Trang 138
Chương 2: ðiều khiển tối ưu
Hình2.5 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u) .
Hình 2.6 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u).
ðể giải hệ phương trình này , trước hết ta sử dụng phương trình (6) ñể ñưa
ra biến ñiều khiển tối ưu theo thừa số Lagrange .
u = −b 2 mλ (7)
Bây giờ thay phương trình (7) vào (4) ñể khử u , kết hợp với (5) và ñược
viết lại :
1 − b 2 m 2 x c
1 = (8)
2 1 λ 0
a
Giải ra ta ñược giá trị của ñiểm dừng :
a 2c
x= 2 (9)
a + b2m2
Trang 139
Chương 2: ðiều khiển tối ưu
c
λ=− (10)
2
a + b2m2
Thay (9) , (10) vào (7) , ta có ñược giá trị u tối ưu :
b 2 mc
u= 2 (11)
a + b2m2
ðể xác ñịnh ñiểm dừng là cực tiểu , dùng (2.37) ñể tìm ra ma trận uốn :
1 m2
f
Luu = 2 + 2 (12)
b a
Luuf > 0 vì vậy ta tìm ñược một ñiểm cực tiểu .
Thay (9) và (11) vào (1) ta ñược giá trị tối ưu của hàm chỉ tiêu chất lượng :
1 c2
L* = (13)
2 a2 + b2m2
ðể kiểm chứng (2.21) , lưu ý rằng:
∂L* ∂L*
= = −λ (14)
∂f du =0 ∂c
Gradf trong miền (u,x) là :
f u m
f = 1 (15)
x
ñược biểu diễn trong Hình 2.6 . GradL là :
u
Lu b 2
L = x (16)
x
a2
và tại ñiểm dừng (11) , (9) sẽ có giá trị :
*
Lu m c
L = 1 2 2 2
(17)
x a +b m
ðiều này tương ứng với (15) , vì vậy ñiểm dừng xuất hiện khi f(x,u) = 0 là
ñường tiếp tuyến với một ñường ñồng mức của L(x,u) .
Ví dụ 2.5 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính .
Bây giờ ta tổng quát hóa ví dụ 2.4 với vector x ∈ R n , u ∈ R m , f ∈ R n ,
λ ∈ Rn .
Xét hàm chỉ tiêu chất lượng dạng toàn phương:
Trang 140
Chương 2: ðiều khiển tối ưu
1 T 1
L= x Qx + u T Ru (1)
2 2
với ñiều kiện ràng buộc tuyến tính :
f = x + Bu + c = 0 (2)
với Q , R và B là các ma trận , c là vector n hàng . Giả sử Q ≥ 0 và R > 0
( với Q , R là ma trận ñối xứng ) . Các ñường ñồng mức của L(x,u) là các
ñường ellip trong không gian , và f(x,u)=0 là mặt phẳng cắt ngang qua
chúng . ðiểm dừng xuất hiện khi gradf và gradL song song với nhau .
Hàm Hamilton là :
1 1
H = x T Qx + u T Ru + λT ( x + Bu + c) (3)
2 2
và các ñiều kiện ñể có ñiểm dừng là :
H λ = x + Bu + c = 0 (4)
H x = Qx + λ = 0 (5)
H u = Ru + B λ = 0T
(6)
ðể giải các phương trình trên , ñầu tiên ta dùng ñiều kiện (6) ñể tìm u theo
λ:
u = − R −1 B T λ (7)
Từ (5) ta có :
λ = −Qx (8)
Kết hợp với (4) ta ñược :
λ = QBu + Qc (9)
dùng kết quả này thay vào (7) cho ta :
u = − R −1 B T (QBu + Qc) (10)
hay : ( −1 T
)
I + R B QB u = − R B Qc −1 T
(R + B T
QB )u = − B
Qc T
(11)
T T
Vì R > 0 và B QB ≥ 0 , chúng ta có thể tìm nghịch ñảo của (R + B QB) và vì
thế giá trị u tối ưu là :
u = −( R + B T QB) −1 B T Qc (12)
So sánh kết quả này với (11) trong ví dụ 2.4 .
Thay (12) vào (4) và (9) cho ta giá trị trạng thái tối ưu và thừa số Lagrange
tối ưu :
( (
x = − I − B R + BT QB )
−1
)
BT Q c (13)
( B Q) c
−1
λ = Q − QB ( R + BT QB ) T
(14)
Bằng bổ ñề của nghịch ñảo ma trận :
Trang 141
Chương 2: ðiều khiển tối ưu
λ = (Q −1 + BR −1 B T ) c
−1
(15)
nếu Q ≠ 0 . Các kết quả trên sẽ rút lại thành kết quả của ví dụ 2.4 trong
trường hợp vô hướng .
ðể xác ñịnh biến ñiều khiển (12) là một cực tiểu , ta sử dụng (2.37) ñể xác
ñịnh ma trận uốn là xác ñịnh dương với giá trị của R và Q ñược giới hạn .
f
Luu = R + B T QB (16)
Sử dụng (12) và (13) thế vào (1) ta có ñược giá trị tối ưu :
1
[ ( −1
L* = c T Q − QB R + B T QB B T Q c
2
) ] (17)
1
L* = c T λ (18)
2
∂L *
Vì thế: =λ (19)
∂c
Trang 142
Chương 2: ðiều khiển tối ưu
Hình 2.7 : Bài toán với nhiều ñiều kiện ràng buộc .
ðưa ra một thừa số Lagrange cho mỗi ñiều kiện ràng buộc , hàm Hamilton
là :
1 1
H = ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 + λ1 ( y1 − ax12 − bx1 − d ) + λ 2 ( y 2 − x 2 − c) (7)
2 2
Khi ñó , ñể có ñiểm dừng ta cần có :
H x1 = x1 − x 2 − 2aλ1 x1 − bλ1 = 0 (8)
H x2 = − x1 + x2 − λ2 = 0 (9)
H y1 = y1 − y 2 + λ1 = 0 (10)
H y2 = − y1 + y 2 + λ2 = 0 (11)
H λ1 = y1 − ax12 − bx1 − d = 0 (12)
H λ2 = y 2 − x2 − c = 0 (13)
Giải (12) ñể có ñược y1 như sau :
y1 = ax12 + bx1 + d (14)
Từ (9) và (11) , ta có :
λ2 = x 2 − x1 = y1 − y 2 (15)
và sử dụng (14) với y 2 = x 2 + c từ (13) có ñược kết quả sau :
Trang 143
Chương 2: ðiều khiển tối ưu
Ví dụ 2.7 :
Moät con taøu ñang di chuyeån vôùi vaän toác 10 haûi lyù
moät giôø theo phöông hôïp vôùi phöông baéc moät goùc
30o (laáy theo chieàu kim ñoàng hoà) ñeå ñeán moät hoøn
ñaûo. Giaû söû raèng taïi thôøi ñieåm t = 0, con taøu ñang ôû vò
trí caùch hoøn ñaûo 30 haûi lyù veà phía Baéc vaø 20 haûi lyù
veà phía ñoâng (töùc laø con taøu leäch khoûi phöông di
chuyeån ban ñaàu). Baøi toaùn ñaët ra laø xaùc ñònh ñieåm
gaàn nhaát treân phöông di chuyeån ban ñaàu maø con taøu
caàn trôû veà ñeå ñi tôùi hoøn ñaûo. Tìm khoaûng caùch töø hoøn
ñaûo ñeán ñieåm gaàn nhaát vaø thôøi gian ñeán ñöôïc ñieåm ñoù.
Giải:
Caùch 1: giaûi baèng phöông phaùp hình hoïc: N
My M
Trong ∆ MMxO: 30
MM x 30
tg∠MOM x = = = 1.5 ⇒ ∠MOM x = 56.30 300
OM x 20
OM = MM x2 + OM x2 = 20 2 + 30 2 = 36.0555 Mx
O 20
Trang 144
Chương 2: ðiều khiển tối ưu
Trong ∆ MNO:
⇒ ∠MN O = 900 − 56.30 − 300 = 3.690
NM
sin ∠MON = ⇒ NM = 36.0555*sin3.690 = 2.32
OM
Vaäy khoaûng caùch ngaén nhaát laø NM = 2.32 miles
Goïi t laø thôøi gian taøu ñi töø ñieåm M tôùi ñieåm gaàn nhaát N.
d 2.32
t = min = = 0.232 (hours )
v 10
Trang 145
Chương 2: ðiều khiển tối ưu
Ví dụ 2.8:
Tìm ñieåm A baát kyø thuoäc ñöôøng thaúng d trong khoâng gian sao cho khoaûng
caùch töø goác toaï ñoä O ñeán A laø nhoû nhaát. Ñöôøng thaúng d trong khoâng gian
cho bôûi heä phöông trình:
3x + 2 y + z = 1
d
x + 2 y − 3z = 4
Giaûi:
Caùch 1: duøng phöông phaùp hình hoïc giaûi tích:
• u : vector chỉ phương của ñường thẳng d:
2 1 1 3 3 2
u = , , = (− 8,10,4)
u d 2 − 3 − 3 1 1 2
A • Gọi A là ñiểm thuộc d, có tọa ñộ:
7 −3
A(0, , ) , (cho xA=0 ta tính yA, zA)
H 8 4
• Khoaûng caùch ngaén nhaát töø O ñeán d:
[AO ,u ]
O d (OA min) = d (O , d ) = OH =
u
−7 3 3 −7
[AO,u ] = ( 8 4' 4
0
,
0
8 ) = (−11,−6,−7)
10 4 4 −8 −8 10
x
O
Trang 146
Chương 2: ðiều khiển tối ưu
S
Kieåm tra
Keát thuùc
Quan saùt treân hình veõ ta thaáy khoaûng caùch ta muoán toái öu hoaù ñoù laø ñoaïn
OA, trong ñoù A chaïy treân ñöôøng thaúng d.
⇒ OA2 = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2
Vì O laø goác toaï ñoä ⇒ O(0,0,0).
⇒ OA2 = (x2)2 + (y2)2 + (z2)2
Phiếm haøm toái öu: L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 (1)
Baøi toaùn vôùi 2 ñieàu kieän raøng buoäc laø:
f1(x2,y2,z2)=3x2 + 2y2 + z2 -1= 0 (2)
f2(x2,y2,z2)=x2 + 2y2 – 3z2 - 4=0 (3)
Thaønh laäp haøm Hamilton:
H(x2,y2,z2,λ1,λ2) = x22 + y22 + z22 + λ1 f1(x2,y2,z2) + λ2 f2(x2,y2,z2)
Trang 147
Chương 2: ðiều khiển tối ưu
Trang 148
Chương 2: ðiều khiển tối ưu
− 7λ1 − 2λ2 − 1 = 0
(15)
− 2λ1 − 7λ2 − 4 = 0
1 − 26
Giaûi heä phöông trình (15) ta tìm ñöôïc: λ1= ; λ2=
45 45
Thay giaù trò λ1, λ2 vaøo (10), (11), (12) ta coù
23 5 79
x2 = ; y2 = ; z 2 = .
90 9 90
x2 = 0.255; y2 = 0.555, z2 = -0.877.
L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 = 1.142
Vaäy ta xaùc ñònh ñöôïc ñieåm toái öu A(x2,y2,z2).
Khoaûng caùch giöõa ñieåm A ñeán goác toaï ñoä laø:
OA= x 22 + y 22 + z 22 = 1.069.
Kieåm tra laïi:
Coù nhieàu phöông phaùp kieåm tra laïi keát quaû treân laø cöïc tieåu:
- phöông phaùp kieåm tra ma traän uoán Luu, tuy nhieân ôû baøi taäp treân
phieám haøm toái öu L theo 3 bieán neân vieäc xaùc ñònh ma traän uoán
phöùc taïp.
- Phöông phaùp thöû sai:
• So saùnh giaù trò toïa ñoä, khoaûng caùch tính ñöôïc baèng phuông phaùp
thöû sai vôùi giaù trò maø ta duøng phöông phaùp bieán phaân coå ñieån
Euler_Lagrange.
• Ñeå kieåm tra ñaây laø cöïc tieåu cuïc boä hay toaøn phaàn ta cho phạm vi
thay ñoåi cuûa ñieåm A roäng hôn.
Ví dụ 2.9 :
a. Chöùng toû giaù trò min cuûa haøm x2y2z2 treân maët caàu x2+y2+z2= r2 laø
(r2/3)3
b. Chöùng toû raèng giaù trò cöïc ñaïi cuûa haøm x2+y2+z2 treân maët
x2y2z2=(r2/3)3 laø r2
Giaûi:
a.Duøng phöông phaùp Euler Lagrange:
Choïn phiếm haøm toái öu laø : L(x,y,z) = x2y2z2 (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y,z) = x +y +z - r = 0
Thaønh laäp haøm Hamilton :
H(x,y,z) = x2y2z2 + λ(x2+y2+z2 - r2)
Trang 149
Chương 2: ðiều khiển tối ưu
Trang 150
Chương 2: ðiều khiển tối ưu
Ví dụ 2.10 :
a. Tìm hình chöõ nhaät noäi tieáp hình elips coù chu vi lôùn nhaát.
b. Tìm hình chöõ nhaät noäi tieáp elips coù dieän tích lôùn nhaát .
Giaûi
a. Giaûi baèng phöông phaùp Euler – Lagrange :
Phiếm haøm toái öu laø: L(x,y) = 4(x+y) (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y) = x /a + y /b -1 = 0
Khi ñoù haøm Hamilton seõ laø: H(x,y,λ ) = 4(x+y) + λ (x2/a2 + y2/b2 -1)
Tìm caùc ñieåm döøng döïa vaøo caùc ñieàu kieän sau:
Hλ = x2/a2 + y2/b2 -1 = 0 (1)
2
Hx = 4 + 2λx/a = 0 (2)
2
Hy = 4 + 2λy/b = 0 (3)
2
Töø (2) x = -2a /λ
Töø (3) y = -2b2/λ
Thay x, y vaøo (1) ta coù:
2 2
−2 a 2 2 − 2b 2 2
⇔ /a + / b −1 = 0
λ λ
⇔ 4( a 2 + b 2 ) = λ 2
⇔ λ = ±2 a 2 + b 2
a2 b2
Vôùi λ = 2 a 2 + b 2 ta tìm ñöôïc x = - ;y=-
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L1= -4 a 2 + b 2 < 0, khoâng toàn taïi
Trang 151
Chương 2: ðiều khiển tối ưu
a2 b2
Với λ = -2 a 2 + b 2 ta tìm ñöôïc x = ;y=
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L2= 4 a 2 + b 2 > 0
Kieåm tra laïi L2 laø max
Hyy = 2λ /b2 ; Hxx = 2λ /a2 ; Hxy = Hyx = 0
f x 2 x / a 2
f = 2
y 2 y / b
2λ 2 y a 2 2λ a 2 2 y
⇒ L yy
f
= H yy + f yT f x−T H xx f x−1 f y = + . . . .
b2 b2 2x a2 2x b2
2λ a2 y2
= (1 + )
b2 b2 x2
ÖÙng vôùi L2, λ = -2 a 2 + b 2 < 0 thì L yy
f
< 0, suy ra L2 laø max
Trang 152
Chương 2: ðiều khiển tối ưu
a b a b a b
Vậy 4 ñieåm : A( , ), B( ,- ), C(- ,- ) vaø
2 2 2 2 2 2
a b
D(- , ) laø boán ñænh cuûa moät hình chöõ nhaät. Do tính chaát laëp laïi
2 2
a b
khi x chaïy heát hình elips, neân ta chæ choïn ñieåm A( , ) naèm goùc
2 2
phaàn tö thöù nhaát, vaø ta xeùt ñieåm cöïc trò taïi ñieåm naøy.
a b
D(- , ) a b
2 2 A( , )
2 2
a b
a b B( ,- )
C(- ,- ) 2 2
2 2
Trang 153
Chương 2: ðiều khiển tối ưu
có cực trị .
L là hàm có ñạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó .
ðể thống nhất , ở ñây ta lấy t0 = 0 và t1 = T .
Biến ñổi của J do δu tạo nên là :
∆J (u + δu ) = J (u + δu ) − J (u )
T T
= ∫ L(u + δu, u& + δu& , t )dt − ∫ L(u, u& , t )dt
0 0
T
= ∫ [ L(u + δu, u& + δu& , t ) − L(u, u& , t )]dt (2.39)
0
Phân tích (2.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J
ta ñược :
T
∂L(u, u&, t ) ∂L(u, u&, t )
∆J (u , δu ) = ∫ [( )δu + ( )δu& ]dt (2.40)
0
∂u ∂u&
vì δu và δu& liên hệ nhau bởi :
T
δu (t ) = ∫ δu& (t )dt + δu (0)
0
Xem δu là hàm biến ñổi ñộc lập , biểu thức (2.40) có thể biến ñổi ñể chỉ
chứa δu bằng cách lấy tích phân những thành phần chứa δu& :
Trang 154
Chương 2: ðiều khiển tối ưu
T
∂L(u , u&, t ) T ∂L(u, u& , t ) d ∂L(u, u& , t )
δJ (u, δu ) = δu 0 + ∫ [ − ]δudt... (2.41)
∂u& 0
∂u dt ∂u&
Từ ñiều kiện ñã cho δu(0) = δ(T) = 0 , phần ñầu của vế phải ở biểu thức
(2.41) bằng 0 .
Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị ñối với u*
thì :
∆J (u * , δu ) = 0 (2.42)
ðó là ñiều kiện cơ bản của phép tính biến phân .
Từ các biểu thức (2.41) , (2.42) ta có :
∂L(u * , u& * , t ) d ∂L(u * , u& * , t )
T
δJ (u , δu ) = ∫ [
*
− ]δudt = 0 (2.43)
0
∂u dt ∂u&
Từ ñó có thể rút ra phương trình Euler_Lagrange :
∂L(u, u&, t ) d ∂L(u, u& , t )
− =0 (2.44a)
∂u dt ∂u&
Hoặc có thể viết ñơn giản :
∂L d ∂L
− =0 (2.44b)
∂u dt ∂u&
mà λi(t) với i = 1,2,…,n là hàm Lagrange .Vì giới hạn thỏa mãn với mọi t
nên hàm Lagrange phụ thuộc thời gian .
Tương tự như trên ta có phương trình Euler_Lagrange tổng quát :
∂La (u, u& , λ , t ) d ∂La (u, u&, λ , t )
− =0 (2.47)
∂u dt ∂u&
n
mà La (u, u&, λ , t ) = L(u, u&, t ) + ∑ λi (t )ϕ i (u, u& , t ) (2.48)
i =1
Khi ñiều kiện ràng buộc có dạng :
T
∫ψ
0
i (u , u&, t )dt = qi (2.49)
Trang 155
Chương 2: ðiều khiển tối ưu
Trong trường hợp này , λi là các hệ số không phụ thuộc thời gian .
Khi có ñiều kiện ràng buộc dạng (2.45) hoặc (2.49) phải giải (n+1) phương
trình ñể xác ñịnh y*(t) và λi*(t) với i=1,2,…,n .
Phương trình Euler_Lagrange với tín hiệu ñiều khiển bị hạn chế
Trong phần trên ta chỉ ñề cập tới bài toán mà trong ñó tín hiệu ñiều khiển
không có giới hạn nào ràng buộc . Trong thực tế , thường gặp tín hiệu ñiều
khiển có ràng buộc dạng u ≤ 1 .
ðiều kiện cần ñể có cực trị : khi u(t) là ñường cực trị thì u+δu và u-δu là
những hàm cho phép . Bây giờ ta so sánh trị số phiếm hàm ở ñường cực trị
với trị số của nó ở hàm u+δu và u-δu . Nếu miền biến ñổi của u(t) là kín và
u(t) ở ngoài biên thì một trong các hàm u+δu hoặc u-δu sẽ ra ngoài miền
cho phép .
Một trong các biện pháp khắc phục khó khăn trên là ñường cực trị ở biên và :
u ≥ ϕ (t ) (2.51)
Ví dụ , nếu u ≤ 1 , ñiều kiện u ≥ ϕ (t ) nghĩa là ϕ (t ) ≤ −1 . ðổi biến ta có :
z2 = u − ϕ (2.52)
thì biến mới z sẽ không có ñiều kiện hạn chế và biên giới của biến u tương
T
ñương với z = 0 . Bây giờ chỉ tiêu chất lượng J (u ) = ∫ L(u, u& , t )dt có biến
0
mới u = z2 + ϕ , từ ñó :
u& = 2 zz& + ϕ&
và chỉ tiêu chất lượng J có dạng :
T
J = ∫ L[ z 2 + ϕ ,2 zz& + ϕ& , t ]dt (2.53)
0
Vì không có ñiều kiện hạn chế nên phương trình Euler_Lagrange có dạng :
∂L d ∂L
− =0 (2.54)
∂z dt ∂z&
∂L ∂L ∂u ∂L ∂u& ∂L ∂L
Ở ñây = + = 2z + 2 z&
∂z ∂u ∂z ∂u& ∂z ∂u ∂u&
∂L ∂L ∂u ∂L ∂u& ∂L
= + = 2z
∂z& ∂u ∂z& ∂u& ∂z& ∂u&
d ∂L d ∂L ∂L
= 2z( )+ 2 z&
dt ∂z& dt ∂u& ∂u&
Trang 156
Chương 2: ðiều khiển tối ưu
và (2.54) sẽ có dạng :
∂L ∂L d ∂L ∂L
2z + 2 z& − 2 z − 2 z& = 0
∂u ∂u& dt ∂u& ∂u&
∂L d ∂L
hay : 2 z − =0 (2.55)
∂u dt ∂u&
Phương trình trên thỏa mãn với z = 0 , nghĩa là ñường cực trị có những giá
trị biên và phương trình Euler_Lagrange vẫn là phiếm hàm xuất phát :
∂L d ∂L
− =0
∂u dt ∂u&
2. Ví dụ
Ví dụ 2.11 :
du1
Tìm quá trình tối ưu x* = u&2 và u2* = ñể cực tiểu hóa chỉ tiêu chất lượng
dt
J:
T
J (u ) = ∫ (u&2 )2 dt (1)
0
với ñiều kiện ñầu :
T
∫ u (t )dt = θ
0
2 0 (2)
∫ψ
0
i (u, u& , t )dt = qi (4)
Trang 157
Chương 2: ðiều khiển tối ưu
Trang 158
Chương 2: ðiều khiển tối ưu
T
12θ 02
còn ở ví dụ ta ñang xét : J = ∫ ( x∗ ) 2 dt = (16)
0
T3
J a 16
Nghĩa là chúng khác nhau = = 1.33 lần .
J 12
Hình 2.8 : ðặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ
tác ñộng nhanh (b) .
Ví dụ 2.12 :
Xét bài toán tối ưu tác ñộng nhanh với ñiều kiện ñầu :
T
∫ u dt = θ
0
2 0 (1)
∫ (u& )
2
2 dt = q0 (2)
0
ðiều kiện biên :
u2 (0) = u2 (T ) = 0 (3)
Với bài toán tác ñộng nhanh , từ (2.49) và (2.50) ta có thể viết :
L(u2 , u2 , λ1 , λ2 ) = 1 + λ1u2 + λ2 (u&2 ) 2 (4)
Phương trình Euler_Lagrange :
∂L d ∂L
− =0 (5)
∂u2 dt ∂u&2
⇒ λ1 − 2λ2u&&2 = 0 (6)
Trang 159
Chương 2: ðiều khiển tối ưu
λ1
⇒ u&&2 = (7)
2λ2
Lấy tích phân biểu thức trên ta ñược :
λ1
u&2 (t ) = x(t ) = t + c1 (8)
2λ2
λ1 2
u2 (t ) = t + c1t + c2 (9)
4λ2
λ1
Kết hợp (9) với ñiều kiện u2 (0) = 0 suy ra : c2 = 0 và c1 = − T .
4λ2
2θ0 λ1
Và ñiều kiện u2 (T ) = 0 ta có : c1 = − T
T 2 6λ2
λ1 24θ
⇒ = − 30 (10)
λ2 T
6θ
⇒ c1 = 20 (11)
T
Thế vào (8) , (9) ñược :
6θ0 12θ0
u&2∗ (t ) = x∗ (t ) = − 3 t (12)
T2 T
6θ 6θ
u2∗ (t ) = 20 t − 30 t 2 (13)
T T
So sánh với ví dụ trước , ta thấy quá trình tối ưu là hoàn toàn giống nhau.
Ví dụ 2.13:
Xét ñối tượng có mô hình toán học gần ñúng như sau :
x& i = f i ( x, δ i (t )) + g k ( x )u * i = 1, n; k ∈ [1, n] (1)
Trong ñó x = ( x1 , x 2 ,..., x n ) – vector trạng thái ; g k ( x ) - hàm phi tuyến
T
∂J d ∂J
Giả thuyết Euler-Lagrange: − =0
∂Ψ dt ∂ψ&
=> Ψ − Ψ && = 0 => Ψ ( s )(1 − s 2 ) = 0 => Ψ ( s )(1 − s )(1 + s ) = 0
ðiều kiện cực tiểu : Ψ ( s )(1 + s ) = 0
Trang 160
Chương 2: ðiều khiển tối ưu
Trong ñó Ψ là hàm số khả vi hoặc tuyến tính từng ñoạn và Ψ (0) = 0 . Hàm
Ψ ñược lựa chọn dựa trên các yêu cầu về ñộng học của hệ thống . Luật ñiều
khiển u ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J có thể ñược xác ñịnh
bằng cách giải phương trình Euler :
Ψ+Ψ & =0 (3)
ðạo hàm của hàm số Ψ có dạng :
n n
dΨ ∂Ψ ∂Ψ &
=∑ x& i + ∑ δi (4)
dt i =1 dxi i =1 dδ i
Giải phương trình (3) kết hợp với (5) , xác ñịnh luật ñiều u * khiển ñảm bảo
cực tiểu hoá hàm mục tiêu J và ñịnh hướng ñộng học hệ thống chuyển
ñộng theo xu hướng lim Ψ ( x ) → 0 :
t →∞
−1
1 ∂Ψ n n
∂Ψ &
Ψ + ∑ f i ( x, δ i ) + ∑
*
u =− δi (6)
g k ( x ) ∂xi i =1 i =1 ∂δ i
i≠k
∂Ψ
Lưu ý rằng luật ñiều khiển u * chỉ có nghĩa khi: g k ( x ) ≠ 0 và ≠0 .
∂x k
Phương trình ñồng trạng thái (costate epuation):
Giả sử một hệ thống phi tuyến ñược mô tả bởi phương trình biến trạng thái:
x& (t ) = f ( x, u , t ) với t ≥ t 0 và t0 cố ñịnh
Với biến trạng thái x(t ) ∈ R n , luật ñiều khiển u (t ) ∈ R m và hàm chỉ tiêu chất
lượng J, x(t ) ∈ R n
T
J = Φ ( x(T ), T ) + ∫ L( x(t ), u (t ), t )dt
t0
ðiều khiển tối ưu là tìm ra tìm ra luật ñiều khiển u*(t) trong khoảng thời
gian xác ñịnh [t0,T] ñể J ñạt cực tiểu. Với hàm trạng thái cuối là:
Ψ ( x(T ), T ) = 0 Với Ψ ∈ R p (*)
T
x = r r& θ θ&
Trang 161
Chương 2: ðiều khiển tối ưu
T
µ
Vậy hàm trạng thái cuối là: Ψ ( x(T ), T ) = r&(T ) − R r&(T ) θ&(T ) −
R3
Với r là bán kính, θ là vị trí góc, R: là bán kính của quỹ ñạo tròn.
Với µ = GM ,G: hằng số gia tốc trọng trường tác ñộng lên vật khối lượng M.
Kết hợp hai ñiều kiện ràng buộc x& (t ) = f ( x, u , t ) và (*) ñể thêm vào chỉ tiêu
chất luợng J. Do phương trình biến trạng thái xét trong khỏang t ∈ [ t0 ,T ] ,
ñòi hỏi thừa số Lagrange λ (t ) ∈ R n là hàm thời gian. Và do (*) xét tại 1 thời
ñiểm, ta cần ñưa ra hệ số nhân kết hợp ν ∈ R p . Chỉ tiêu chất lượng ñược
thêm vào là:
T
J ' = Φ( x(T ), T ) + ν Tψ ( x (T ), T ) + ∫ [L ( x , u, t ) + λ T (t )( f (t )( x, u, t ) − x& )]dt
t0
T
+∫ [(Hx + λ&)T δ x + HuTδ u − λTδ x& + (Hλ − x& )T δλ ]dt
t0
Trang 162
Chương 2: ðiều khiển tối ưu
ðể hàm chỉ tiêu chất lượng J’ ñạt giá trị nhỏ nhất thì dJ’=0, cho tất cả các hệ
số dν , δ x, δ u và δλ trong biểu thức (**) bằng 0.
Ví dụ 2.14 :
Xác ñịnh ñiều khiển tối ưu bằng phương pháp tính gần ñúng.
Cho hệ phi tuyến sau: x& = − x 3 + u
1
Với ñiều kiện x(0) =
2
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
a. Viết phương trình trạng thái và ñồng trạng thái, ñiều kiện xác lập, ñiều
kiện biên. Khử u(t) từ phương trình trạng thái và ñồng trạng thái.
b. Chứng minh rằng nếu x(t) có giá trị nhỏ trong ñoạn [0,2] thì gía trị gần
ñúng của nghiệm phương trình ñồng trạng thái là: λ = x − x 3 .
c. Với giá trị vừa tính ñược ở trên, tính biến trạng thái x(t).
d. Tìm hàm ñiều khiển tối ưu gần ñúng.
Trang 163
Chương 2: ðiều khiển tối ưu
Chú ý: ðể tính giá trị gần ñúng ở câu c thì giá trị x(t) phải nhỏ.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Xét hệ phi tuyến: x& = − x 3 + u
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
Lập hàm Hamilton:
1
H ( x, u, t ) = L( x, u, t ) + λT f ( x, u , t ) = ( x 2 + u 2 ) + λT (− x 3 + u )
2
∂H
Phương trình biến trạng thái: x& = = −x3 + u (1)
∂λ
& ∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ = = + λ = x − 3x 2 λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = =u+λ (3)
∂u
ðiều kiện biên:
1
+ ðiều kiện ñầu x(0) =
2
+ ðiều kiện cuối thỏa mãn
1
[ x(T ) − λ ]T T dx(T ) + [ ( x 2 + u 2 ) + λT (− x 3 + u )] T dT = 0
2
Thời gian cuối T=2 nên dT = 0 suy ra: x(2) − λ (2) = 0 ⇔ x(2) = λ (2)
Từ phương trình (3) ta có u = −λ , thay vào phương trình (1) ta ñược
phương trình biến trạng thái: x& = − x 3 − λ
.
Từ (2) ta có phương trình ñồng trạng thái: − λ = x − 3x 2 λ
x& = − x 3 − λ
b. Từ hệ phương trình
− λ& = x − 3x 2 λ
λ = − x& − x
3
⇔ λ = ∫ (−3 x 5 − x)dt − x 3
Triển khai Maclorank biểu thức 3 x 5 + x tại ñiểm x(t) nhỏ lân cận ñiểm 0:
∫ (−3x − x)dt ≈ x .
5
Với những giá trị của x(t) nhỏ trong khoảng thời gian [0,2] nên: λ = x − x 3
Trang 164
Chương 2: ðiều khiển tối ưu
Ví dụ 2.15:
Cho hệ thống giảm xóc của ô tô có phương trình tóan học:
m&y& + ky = u
trạng thái ñaàu y(0)=0, y& (0) = 0 tới trạng thái cuối y(T)=h, y& (T ) = 0 . Với
T
1
hàm chỉ tiêu chất lượng J = ∫ u 2 dt .
20
Trong ñó:
m- khối lượng, k- hệ số ñàn hồi, u- lực tác dụng theo hướng lên trên
y- lượng dịch chuyển theo phương ñứng
a. Viết phương trình biến trạng thái với : x = [ y y& ]
T
b. Viết phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên.
Khử u(t) từ phương trình trạng thái và phương trình ñồng trạng thái.
c. Tìm nghiệm phương trình ñồng trạng thái khi biết giá trị λ(T). Tìm biến
trạng thái x(t) khi biết λ(0) và biết x(0).
d. Sử dụng ñiều kiện biên ñể tìm λ(0) với m=k=1; T=2; h= - 3
e. Tìm luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu.
f. Chứng tỏ rằng x * (T ) = [h 0] thỏa mãn yêu cầu.
T
Giải:
a. Heä phöông trình traïng thaùi:
x&1 = x 2
x1 = y
ðặt: → k 1
x 2 = y& x& 2 = − m x1 + m u
x&1 0 1 x1 0
Phương trình trạng thái của hệ thống: = k + 1 u
&
x
2 m − 0 x 2 m
Trang 165
Chương 2: ðiều khiển tối ưu
b. Phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên:
u2
Lập hàm Hamilton: H = + λT ( Ax + Bu )
2
∂H
Phương trình biến trạng thái: x& = = Ax + Bu (1)
∂λ
∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ& = = + λ = AT λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = = u + BT λ (3)
∂u
ðiều kiện biên: ñiều kiện ñầu x(0) = y (0) = 0 , ñiều kiện cuối λ (T ) = 0
Từ phương trình (3): u = − B T λ , thay vào biểu thức (1) và (2) ta ñược:
x& = Ax − B T Bλ .
Từ phương trình (2): − λ& = AT λ
d. Tìm λ(0):
Từ phương trình (4) và ñiều kiện bài toán ta có
BT B
x(T ) = −
2A
[ ]
λ (T ) e 2 AT − 1 = h = −3
6A
⇔ λ (T ) = T
B B(e 2 AT − 1)
3 Ae − At 3A
*
⇒ λ (t ) = T ⇒ λ (0) = T (5)
B B sinh( AT ) B B sinh(2 A)
Trang 166
Chương 2: ðiều khiển tối ưu
0 1 0
Trong ñó: A = ,B =
− 1 0 1
e. Luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu:
Từ (5) suy ra luật ñiều khiển tối ưu:
3 Ae − At − 3 Ae − At
u * (t ) = − B T λ* (t ) = − B T T =
B B sinh( AT ) B sinh( AT )
Quỹ ñạo trạng thái tối ưu
BT B BT B.3Ae− At 3e− At e AT sinh(At)
x* (t ) = − λ * (t)e AT sinh(At) = − T e AT sinh(At) = −
A B B.Asinh(AT) sinh(AT)
(6)
f. Chứng minh x (T ) = [h 0] thỏa yêu cầu:
* T
3e − AT e AT sinh( AT )
Từ (6) → x * (T ) = − = −3
sinh( AT )
Vậy x * (T ) = [− 3 0]
T
Ví dụ 2.16 :
Cho hệ thống rôøi raïc: x k +1 = x k u k + 1
1 N −1 2
Hàm chỉ tiêu chất lượng: J = ∑ u k , N=2, x2=0
2 k =0
a. Viết lại phương trình trạng thái và phương trình ñồng trạng thái bằng
phương pháp khử uk.
b. Giả sử cho λ2 , tìm λ0 , λ1 theo λ2 và các biến trạng thái. Sử dụng biểu
thức này ñể biểu diễn x2 theo λ2 và x0 . Từ ñó tìm một phương trình bậc
4, ẩn λ2 , theo trạng thái x0.
c. Nếu x0 = 1, biến trạng thái & luật ñiều khiển tối ưu và chỉ tiêu chất lượng
tối ưu.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k ) (1)
u k2
H k ( xk , u k ) =
+ ( x k u k + 1)λTk +1 (2)
2
∂H k
Phương trình trạng thái: x k +1 = = xk u k + 1 (3)
∂λ k +1
Trang 167
Chương 2: ðiều khiển tối ưu
∂H k
Phương trình thừa số Lagrange: λ k = = u k λTk +1 (4)
∂x k
∂H k
ðiều kiện tĩnh: 0 = = u k + x k λTk +1 (5)
∂u k
Từ (5) ta suy ra uk : u k = − x k λTk +1
Thế uk vào (3) và (4), ta ñược phương trình trạng thái và thừa số Lagrange
không phụ thuộc uk như sau:
λk = − x k λ2k +1 và x k +1 = − x k2 λ k +1 + 1
c. Tìm biến trạng thái, luật ñiều khiển tối ưu, và chỉ tiêu chất lượng tối ưu
Trường hợp 1:
Với ñiều kiện x0 = 1,Ta ñược phương trình sau: λ42 + 2λ22 λ2 + λ2 − 1 = 0
Giải phương trình ñược các nghiệm như sau:
λ2 _ 1 = 0.5249 λ2 _ 2 = 1.49
Trang 168
Chương 2: ðiều khiển tối ưu
Trang 169
Chương 2: ðiều khiển tối ưu
u1 = − x1λ2 = −0.325
1 N −1 2
Chỉ tiêu chất lượng J của hệ thống: J 2 = ∑ u k = u 02 + u12 = 0.125
2 k =0
So sánh 2 trường hợp theo chỉ tiêu chất lượng tối ưu J * của hệ thống
ta chọn trường hợp 2.
Kết luận
Trạng thái tối ưu: ⇔ x1 = 0.62
λ = −0.1444
Thừa số Lagrange tối ưu: ⇔ 0
λ1 = 0.38
u 0 = − x0 λ1 = −0.38
Giá trị luật ñiều khiển tối ưu: ⇔
u1 = − x1λ2 = −0.325
Chỉ tiêu chất lượng tối ưu J* của hệ thống: ⇔ J * = u 02 + u12 = 0.125
Ví dụ 2.17 :
Cho hệ thống có phương trình rời rạc như sau: x k +1 = ax k + bu k
trong ñó xk , uk là các ñại lượng vô hướng và hàm chỉ tiêu chất lượng :
1 1 N −1
J = S N xN3 + ∑ (qxk3 + ruk3 )
3 3 k =0
a. Viết phương trình trạng thái của hệ thống, phương trình ñồng trạng thái
và biểu thức ñiều kiện dừng.
b. Khi nào ta có thể giải ñược uk? Với ñiều kiện ñó viết lại công thức trạng
thái hệ thống không có uk.
c. Giải bài toán ñiều khiển vòng hở ( với xN cố ñịnh, SN =0 và q=0).
Giải:
a. Phương trình trạng thái, ñồng trạng thái và biểu thức ñiều kiện dừng.
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k )
1
= (qx k3 + ru k3 ) + λ k +1 (ax k + bu k ) (1)
3
∂H k
Phương trình trạng thái của hệ thống: x k +1 = = ax k + bu k (2)
∂λ k +1
∂H k
Phương trình ñồng trạng thái: λ k = = qx k2 + λ k +1 a (3)
∂x k
∂H k
ðiều kiện dừng: 0 = = ru k2 + bλ k +1 (4)
∂u k
Trang 170
Chương 2: ðiều khiển tối ưu
bλ k +1
⇒ u k2 = − (5)
r
∂φ ∂H i T
ðiều kiện biên: ( − λ N ) T dx N = 0 và ( ) dxi = 0
∂x N ∂xi
Trang 171
Chương 2: ðiều khiển tối ưu
Xét ñiều kiện biên: vì trạng thái ñầu x 0 cố ñịnh nên dx 0 = 0 suy ra
∂H i T
thoả ñiều kiện ( ) dxi = 0 . ðồng thời trạng thái cuối x N = rN cũng
∂xi
∂φ
cố ñịnh nên dx N = 0 suy ra thoả ( − λ N ) T dx N = 0 .
∂x N
Phương trình (11) có thể ñược viết lại khi thay k = N:
3
− N
1 2 1− a 2
x N = a N x0 + Mλ N a (3 N −3)1 2
3
(12)
−
1− a 2
1 2
Có thể viết lại: x N = a x 0 + Vλ NN
(13)
3
− N
2 1− a
2
Với: V = Ma (3 N −3)1 3
(14)
−
1− a 2
rN − a N x0 2
Thay x N = rN vào (13) ta ñược: λ N = ( ) luôn dương (15)
V
Suy ra b phải âm theo ñiều kiện có nghĩa của u k .
rN − a N x0 2
Từ công thức (15) và (10) xác ñịnh ñược λ k : λ k = a N −k ( ) (16)
V
Từ ñó xác ñịnh u k : u k∗ = −
bλk +1 rN − a N x0 ba N −k −1 (17)
= −
r V r
∗
Với u k khi k chạy từ 0 ñến N-1, sẽ lái hệ thống từ ñiểm ñầu x 0 ñến
ñiểm cuối x N = rN sao cho hàm chỉ tiêu chất lượng ñạt giá trị tối thiểu.
* * * (rN − a N x0 ) a N −k −1 1 − a −3
*
2
x k +1 = ax + bu = ax + ( ) (19)
− a −3 2 1 − a 3N 2
k k k
Trang 172
Chương 2: ðiều khiển tối ưu
3
− k
1− a 2
Suy ra: x k* = a k x 0 + Da ( N + 2 k −3)1 2 ( 3
) (21)
−
1− a 2
*
Vậy x là sự kết hợp tuyến tính biến ñổi theo thời gian của x 0 và rN .
k
∗
Hàm chỉ tiêu chất lượng của hệ thống ứng với u k :
3N
−
1 N −1 3 1 r (rN − a N x0 ) 3 (−b) 3 / 2 ( N −1)3 / 2 1 − a 2
J 0* = ∑ ru k* = a
3 k =0 3 V3 r 3/ 2 −
3
1− a 2
Trang 173
Chương 2: ðiều khiển tối ưu
Giải:
-1
Hình 2.9 : Luật ñiều khiển năng lượng tiêu hao tối thiểu .
Liệt kê các trạng thái k từ 0 ñến 4 trong quá trình ra quyết ñịnh như
Hình 2.9 (ñầu mũi tên và con số trong khung bước ñầu có thể chưa cần
quan tâm). Tại mỗi giá trị k = 0,1,....N − 1 phải có một quyết ñịnh , và
N là trạng thái cuối .
Số hàng: n = 2
Số cột : m = 2
Trang 174
Chương 2: ðiều khiển tối ưu
Vậy số cấp: N = n + m = 2 + 2 =4
ði từ cấp 0 ñến cấp 4, tại các nút ta xét chi phí tiêu hao (CPTH) là nhỏ
nhất (theo nguyên lý tối ưu của Bellman):
• Cấp 0 (k=N=4):
Nút i: CPTH = 0, do mới bắt ñầu ñi.
• Cấp 1 (k=3):
Nút f: CPTH = 4 + 0 = 4, 4 : giá trị tiêu hao khi ñi từ i ñến f
Nút h: CPTH = 2 + 0 = 2
• Cấp 2 (k=2):
Nút c: CPTH = 3 + 4 = 7
Nút e: CPTH = 4 + 3 = 7, từ f ñến e
CPTH = 2 + 2 = 4, từ h ñến e
Do chi phí tiêu là nhỏ nhất nên: CPTH = 4, từ h ñến e
Nút g: CPTH = 2 + 4 = 6, từ h ñến g
• Cấp 3 (k=1):
Nút b: CPTH = 7 + 2 = 9, từ c ñến b
CPTH = 4 + 1 = 5, từ e ñến b
Do chi phí tiêu là nhỏ nhất nên: CPTH = 5, từ e ñến b
Nút d: CPTH = 4 + 3 = 7, từ e ñến d
CPTH = 6 + 2 = 8, từ g ñến d
Do chi phí tiêu là nhỏ nhất nên: CPTH = 7, từ h ñến e
• Cấp 4 (k=0):
Nút a: CPTH = 5 + 3 = 8, từ b ñến a
CPTH = 7 + 1 = 8, từ d ñến a
Do chi phí tiêu bằng nhau trên 2 quãng ñường nên: CPTH =
8, từ b ñến a hay từ d ñến a
Như vậy bằng cách lần lượt giảm k từ N ñến 0, kết quả CPTH ñã tính tại các
cấp ñược biểu diễn như Hình 2.9.
Chú ý rằng khi k = 0, luật ñiều khiển có thể là u0 = 1 hoặc u0 = −1 cùng cho
chi phí là 8 ; luật ñiều khiển khi k = 0 là duy nhất .
Vậy có hai ñường ñi từ a ñến i với cùng một chi phí là 8 :
a → b → e → h → i ( ñường nét ñậm ) và a → d → e → h → i ( ñường nét
ñứt ) . Hiển nhiên giải pháp tối ưu trong quy hoạch ñộng là không duy nhất .
Cuối cùng chúng ta chỉ ra rằng nguyên lý tối ưu của Bellman giúp giảm số
lượng phép tính toán cần thiết bằng cách giảm số lượng các lựa chọn có thể
thực hiện .
Trang 175
Chương 2: ðiều khiển tối ưu
2. Hệ rời rạc
Phương pháp quy hoạch ñộng cũng có thể dễ dàng áp dụng cho hệ phi tuyến
Ngoài ra , nếu có càng nhiều ñiều kiện ràng buộc ñối với tín hiệu ñiều khiển
và biến trạng thái thì ta có ñược lời giải càng ñơn giản .
ðặt :
xk +1 = f k ( xk , uk ) (2.56)
với số mũ k trên f thể hiện sự thay ñổi theo thời gian . Giả ñịnh kết hợp với
hàm chỉ tiêu chất lượng :
N −1
J i ( xi ) = φ ( N , xN ) + ∑ Lk ( xk , uk ) (2.57)
k =i
với [i, N ] là thời gian lấy mẫu . Chúng ta cần chỉ ra sự phụ thuộc của J ñối
với trạng thái và thời gian ñầu .
Giả sử ta ñã có ñược tổn hao tối ưu J k∗+1 ( xk +1 ) từ thời ñiểm k + 1 ñến thời
ñiểm cuối N ứng với những phương án khả thi xk +1 , và chuỗi các phương
án tối ưu từ thời ñiểm k + 1 ñến N cho mọi xk +1 .
Tại thời ñiểm k , nếu ta áp dụng một luật ñiều khiển u k bất kỳ và sử dụng
một chuỗi luật ñiều khiển tối ưu kể từ vị trí k + 1 , lúc ñó tổn hao sẽ là :
J k = Lk ( xk , uk ) + J k∗+1 ( xk +1 ) (2.58)
với xk là trạng thái ở thời ñiểm k , và xk +1 ñược cho bởi (2.56) . Theo
nguyên lý Bellman thì tổn hao tối ưu từ thời ñiểm k sẽ là :
(
J k∗ ( xk ) = min Lk ( xk , uk ) + J k∗+1 ( xk +1 )
uk
)(2.59)
và luật ñiều khiển tối ưu u k* tại thời ñiểm k là u k làm cho tổn hao ñạt cực
tiểu .
Phương trình (2.59) chính là nguyên lý tối ưu cho hệ rời rạc . Vai trò quan
trọng của nó là có thể cho phép chúng ta tối ưu hóa một vector ñiều khiển
tại thời ñiểm a bằng cách tính ngược từ N.
Trong thực tế, ta có thể ñịnh rõ các ñiều kiện ràng buộc ñược thêm vào
chẳng hạn như yêu cầu luật ñiều khiển u k thuộc về một tập hợp các luật
ñiều khiển ñược chấp nhận .
Ví dụ 2.18 :
Xét hệ :
x k +1 = x k + u k (1)
có hàm chỉ tiêu chất lượng :
Trang 176
Chương 2: ðiều khiển tối ưu
1 N −1 2
J 0 = xN2 +∑ uk
2 k =0
(2)
với thời ñiểm cuối cùng N = 2 . Tín hiệu ñiều khiển bị ràng buộc lấy các giá
trị :
uk = −1, −0.5, 0, 0.5,1 (3)
và biến trạng thái bị ràng buộc lấy các giá trị :
xk = 0, 0.5,1,1.5 (4)
ðiều kiện ràng buộc ñối với tín hiệu ñiều khiển không phải là không có lý
do , tín hiệu ñiều khiển tối ưu thời gian tối thiểu chỉ lấy các giá trị ±1 ( ví dụ
2.17 ), trong khi tín hiệu ñiều khiển tối ưu nhiên liệu tối thiểu nhận các giá
trị 0 , ±1 . ðiều kiện ràng buộc ñối với biến trạng thái trong bài toán này
cũng hợp lý , vì nếu trạng thái ban ñầu lấy một trong các giá trị chấp nhận
ñược (4) , thì dưới ảnh hưởng của các tín hiệu ñiều khiển cho phép (3) các
trạng thái sau ñó sẽ lấy các giá trị nguyên và bán nguyên . ðiều kiện ràng
buộc (4) có thể viết lại là x0 = 0, 0.5,1,1.5 và
0 ≤ xk ≤ 1.5 (5)
ðây là ñiều kiện xác thực và ràng buộc biên ñộ về trạng thái , thường là hợp
lý trong các tình huống vật lý .
Bây giờ , bài toán ñiều khiển tối ưu là tìm dãy tín hiệu ñiều khiển chấp nhận
ñược u0∗ , u1∗ sao cho chỉ tiêu chất lượng J 0 ñạt giá trị cực tiểu trong khi tạo
ra quỹ ñạo trạng thái chấp nhận ñược x0∗ , x1∗ , x2∗ . Chúng ta muốn uk∗ ñược xác
ñịnh như là luật ñiều khiển hồi tiếp trạng thái .
Theo (2.58) ta có :
1
J k = uk2 + J k∗+1 (6)
2
⇒ J k∗ = min ( J k ) (7)
uk
∗
ðể tìm u và J ứng với mỗi xk . Ta xuất phát từ trạng thái cuối cùng .
k
∗
k
k = N = 2 : J 2∗ = x2∗2
Ứng với mỗi giá trị xN = 0, 0.5,1,1.5 ta có các giá trị J N∗ = 0, 0.25,1, 2.25 .
k = 1 : J1 = u22 / 2 + J 2∗
- x1 = 1.5 : vì x2 = x1 + u1 và 0 ≤ x2 ≤ 1.5 nên ta chỉ xét các giá trị u1 ≤ 0
u1 = 0 ⇒ x2 = 1.5 + 0 = 1.5 ⇒ J 2∗ = 2.25
⇒ J1 = u22 / 2 + J 2∗ = 0 2 / 2 + 2.25 = 2.25
u1 = −0.5 ⇒ x2 = 1.5 + ( −0.5) = 1 ⇒ J 2∗ = 1
Trang 177
Chương 2: ðiều khiển tối ưu
2
⇒ J1 = ( −0.5 ) / 2 + 1 = 1.125
u1 = −1 ⇒ x2 = 1.5 + ( −1) = 0.5 ⇒ J 2∗ = 0.25
2
⇒ J1 = ( −1) / 2 + 0.25 = 0.75
Như vậy , tín hiệu ñiều khiển tối ưu với x1 = 1.5 là u1∗ = −1 và tổn hao tối
ưu là J1∗ = 0.75 . Ta có ñược sơ ñồ như sau với mũi tên chỉ ra trạng thái tối
ưu .
Tương tự như vậy cho các trường hợp còn lại của x1 . Tiếp tục với trạng
thái k = 0 . Cuối cùng ta sẽ ñược lưới kết quả như Hình 2.10.
ðể rời rạc hệ thống với chu kỳ lấy mẫu τ giây, ta có thể sử dụng hàm xấp
xỉ bậc 1 :
x& (kτ ) = ( xk +1 − xk ) / τ (2.62)
Viết (2.60) dưới dạng :
xk +1 = xk + τ f ( xk , uk , kτ ) (2.63)
ðể cho ñơn giản ta ñịnh nghĩa : xk x ( kτ ) , uk u ( kτ )
ðịnh nghĩa hàm rời rạc :
f k ( xk , uk ) xk + τ f ( xk , uk , kτ ) (2.64)
Khi ñó ta có thể viết :
Trang 178
Chương 2: ðiều khiển tối ưu
xk +1 = f k ( xk , uk ) (2.65)
Phương trình này ñúng với (2.56) .
ðể rời rạc hoá hàm chỉ tiêu , ta có thể viết :
N −1 ( k +1)τ
J ( 0 ) = φ ( x (T ) , T ) + ∑ ∫τ L ( x ( t ) , u ( t ) , t ) dt (2.66)
k =0 k
Hình 2.10 : Lưới kết quả của bài toán tối ưu giải bằng phương pháp quy
hoạch ñộng cho ví dụ 2.18 .
Trang 179
Chương 2: ðiều khiển tối ưu
T
Trong ñó : N= (2.67)
τ
Sử dụng hàm xấp xỉ bậc 1 cho mỗi ñại lượng tích phân :
N −1
J ( 0 ) = φ ( x (T ) , T ) + ∑τ L ( xk , uk , kτ ) (2.68)
k =0
ðịnh nghĩa hàm rời rạc :
J0 J ( 0)
φ S ( N , xN ) φ ( x ( Nτ ) , Nτ )
Lk ( xk , uk ) τ L ( xk , uk , kτ ) (2.69)
Khi ñó ta có :
N −1
J ( 0 ) = φ S ( N , xN ) + ∑ Lk ( xk , uk ) (2.70)
k =0
ðây là công thức (2.57) .
Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu
chất lượng dạng toàn phương :
x& = Ax + Bu (2.71)
T
1 1
2 20
(
J ( 0 ) = xT (T ) S (T ) x (T ) + ∫ xT Qx + uT Ru dt )
(2.72)
Sử dụng hàm xấp xỉ bậc nhất ñể rời rạc hoá hệ thống trở thành :
xk +1 = ( I + Aτ ) xk + Bτ uk (2.73)
1 T 1 N −1
J ( 0) = xN S N xN + ∑ xkT Q S xk + ukT R S uk
( ) (2.74)
2 2 k =0
Trong ñó :
SN S ( Nτ ) (2.75)
Q S = Qτ (2.76)
S
R = Rτ (2.77)
Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xầp xỉ Euler (2.73)
bằng cách sử dụng chính xác phương trình trạng thái (2.71) bao gồm bộ lấy
mẫu và khâu giữ bậc 1 :
x k +1 = A S x k + B S u k (2.78)
Trong ñó :
A S = e Aτ (2.79)
Trang 180
Chương 2: ðiều khiển tối ưu
τ
B S = ∫ e Aτ B dt( ) (2.80)
0
Trang 181
Chương 2: ðiều khiển tối ưu
Yêu cầu tối ưu biểu thức (2.87) ñược gọi nguyên lý cực tiểu Pontryagin : “
Hàm Hamilton phải ñược cực tiểu hóa ở tất cả các giá trị u cho giá trị tối
ưu của trạng thái và biến trạng thái ”.
Chúng ta sẽ thấy nguyên lý cực tiểu hữu dụng như thế nào . ðặc biệt chú ý
không thể nói rằng biểu thức H ( x∗ , u ∗ , λ ∗ ) ≤ H ( x, u, λ , t ) chắc chắn phải
ñúng .
Ví dụ 2.19 :
Tối ưu hóa với những ràng buộc
Giả sử chúng ta muốn tối ưu cực tiểu hàm :
1
L = u2 – 2u + 1 (1)
2
Với ñiều kiện : u ≤1 (2)
Xem Hình 2.11 .
Nguyên lý cực tiểu: L(u*) ≤ L(u) thỏa ∀u (3)
L(u)
u
-1 0 1 2
-1/2
-1
Trang 182
Chương 2: ðiều khiển tối ưu
và :
L(2) = -1 (8)
nhỏ hơn (5) ; nhưng u=2 thì không nằm trong khoản u ≤ 1 .
Trang 183
Chương 2: ðiều khiển tối ưu
Nếu λT(t)B là giá trị dương , chúng ta nên chọn u(t) = -1 làm cho λT(t)Bu(t)
có giá trị âm nhất . Mặt khác , nếu λT(t)B là giá trị âm , chúng ta nên chọn
u(t) ở giá trị cực ñại là giá trị 1 ñể giá trị λT(t)Bu(t) càng âm càng tốt . Nếu
giá trị λT(t)Bu(t) bằng zero tại thời ñiểm t , khi ñó u(t) có thể nhận bất cứ giá
trị nào tại thời ñiểm này .
Quan hệ giữa ñiều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm
sgn(w) :
1 w>0
sgn ( w ) = ( −1,1) w = 0 (2.94)
−1 w < 0
Khi ñó hàm ñiều khiển tối ưu ñược cho bởi :
(
u * (t ) = − sgn BT λ (t ) ) (2.95)
u* ñược biểu diễn dưới dạng biến trạng thái , với hệ tuyến tính dạng toàn
phương .
Giá trị BTλ(t) ñược gọi là hàm chuyển ñổi . Một hàm chuyển ñổi mẫu và bộ
ñiều khiển tối ưu ñược diễn tả ở Hình 2.12 . Khi hàm chuyển ñổi này ñổi
dấu , bộ ñiều khiển chuyển từ cực trị này ñến cực trị khác . Bộ ñiều khiển
trong hình ñược chuyển ñổi bốn lần . ðiều khiển thời gian tối thiểu tuyến
tính tối ưu luôn bão hòa khi nó chuyển ñổi tại vị trí giữa các giá trị cực trị ,
cho nên ñược gọi là ñiều khiển Bang-bang .
Nếu bộ ñiều khiển là một vector có m phần tử , theo nguyên lý cực tiểu ta
chọn các thành phần ui(t) bằng 1 , nếu các thành phần BiTλ(t) là giá trị âm ;
và bằng -1 nếu BiTλ(t) là giá trị dương , với Bi là cột thứ i của B . Phương
pháp ñiều khiển này tạo thành một giá trị :
m
λT (t ) Bu (t ) = ∑ u i (t ) BiT λ (t ) (2.96)
i =1
Trang 184
Chương 2: ðiều khiển tối ưu
Nếu hệ thống là bất biến theo thời gian , ta sẽ có ñược quả ñơn giản và bộ
ñiều khiển thời gian tối ưu là duy nhất .
Hệ thống bất biến theo thời gian trong biểu thức (2.88) có thể ñạt ñược nếu
chỉ có một ma trận
U n = B AB K An −1 B (2.99)
nxn
cấp n . Nếu bi là cột thứ i của B ∈ R , khi ñó hệ thống là bình thường nếu :
[
U = B AB ... A n−1 B ] (2.100)
cấp n cho mỗi giá trị i = 1 , 2 , … , m ; mà khi thành lập cho mỗi giá trị
riêng biệt u , u ∈ Rm .
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến ñến trạng thái cuối
cố ñịnh x(T) với hàm ñiều khiển thỏa [u (t )] ≤ 1 . Khi ñó :
1. nếu trạng thái cuối x(T) bằng zero , khi ñó sẽ tồn tại bộ ñiều khiển thời
gian tối thiểu nếu hệ thống không có cực với phần thực dương ( ví dụ
không có cực trên mặt phẳng phía bên phải ) .
2. cho bất kỳ giá trị x(T) cố ñịnh , nếu tồn tại ñáp án cho bài toán tối ưu thời
gian thì nó là duy nhất .
3. cuối cùng , nếu hệ thống có n cực thực và nếu tồn tại bộ ñiều khiển tối ưu
thời gian thì mỗi thành phần ui(t) của bộ ñiều khiển tối ưu thời gian thay
ñổi n-1 lần .
Ví dụ 2.20 :
ðiều khiển Bang-Bang
Cho hệ thống tuân theo ñịnh luật Newton :
y& = v (1)
v& = u (2)
với y là vị trí tọa ñộ và v là vận tốc, u là gia tốc . Trạng thái là x = [y u]T .
Cho gia tốc ngõ vào u ràng buộc bởi :
u (t ) ≤ 1 (3)
Trang 185
Chương 2: ðiều khiển tối ưu
Mục ñích ñiều khiển là ñưa trạng thái từ ñiểm ban ñầu bất kỳ ( y ( 0 ) , v ( 0 ) )
ñến ñiểm gốc trong thời gian T ngắn nhất . Trạng thái cuối ñược cố ñịnh tại :
y (T )
ϕ (x(T),T) = =0 (4)
v(T )
Lập hàm Hamilton (2.91) :
H = 1 + λ yv + λ vu (5)
T
λ = [λy λv] là biến trạng thái .
Từ hệ phương trình Hamilton ta có :
∂H ∂L ∂f T
− λ& = = + λ
∂x ∂x ∂x
H ( x, u , t ) = L( x, u, t ) + λT f ( x, u, t )
x& (t ) = f ( x, u , t )
dλ y ∂H
=−
dt ∂y
∂H
λ&y = − =0 (6)
∂y
∂H
λ&v = − = −λ y (7)
∂v
ðiều kiện tiếp tuyến :
0 = H (T ) = 1 + λ y ( T ) v (T ) + λv (T ) u ( T ) (8)
hoặc dùng công thức (4) ,
λv (T ) u (T ) = −1 (9)
Nguyên lý cực tiểu Pontryagin cần ñến phương trình (2.97) , hoặc :
u ( t ) = − sgn ( λv ( t ) ) (10)
vì thế thành phần biến trạng thái λv(t) là hàm chuyển ñổi . ðể xác ñịnh bộ
ñiều khiển tối ưu , ta chỉ cần xác ñịnh λv(t) .
Giải phương trình (6) và (7) với thời gian cuối T :
λy ( t ) = const λ y (11)
λv ( t ) = λv (T ) + (T − t ) λy (12)
Dùng công thức (9) và giá trị u ∗ ( t ) bão hòa tại giá trị 1 hoặc –1 , ta ñược :
u ∗ (T ) = 1 và λv∗ (T ) = −1 (13)
hoặc :
u ∗ (T ) = −1 và λv∗ (T ) = 1 (14)
Trang 186
Chương 2: ðiều khiển tối ưu
Có nhiều khả năng cho hàm chuyển ñổi λv∗ ( t ) , tuỳ thuộc vào giá trị của
λv∗ (T ) và λy . Vài khả năng của hàm chuyển ñổi λv∗ ( t ) ñược diễn tả trong
Hình 2.13 . Giá trị λv∗ (T ) ∈ (y(0) , v(0)) . Chú ý rằng λv∗ ( t ) là tuyến tính ,
và cắt ngang trục tọa ñộ .
Ta cần xác ñịnh phương pháp chuyển ñổi ñể bộ ñiều khiển tối ưu luôn ñúng,
ñồng thời cũng phải xác ñịnh thời ñiểm chuyển ñổi tS ( xem Hình 2.13 ) .
Kết luận: ñối với hệ bậc 2 (ví dụ 2.20) hàm λ không chuyển ñổi lần nào
hoặc chuyển ñổi một lần duy nhất từ dương sang âm hoặc từ âm sang dương,
u ≤ 1.
Xét 2 tín hiệu ñiều khiển chấp nhận ñược : u ( t ) = 1 với ∀t hoặc u ( t ) = −1
với ∀t . Do cả 2 trường hợp u ñều là hằng số nên khi kết hợp phương trình
trạng thái (2) và (1) ta ñược :
v ( t ) = v ( 0 ) + ut (15)
1
y ( t ) = y ( 0 ) + v ( 0 ) t + ut 2 (16)
2
ðể loại bỏ thời gian biến thiên , từ dùng biểu thức (15) ta có ñược :
t = ( v (t ) − v ( 0)) / u
và sau ñó thay vào biểu thức (16) suy ra :
Trang 187
Chương 2: ðiều khiển tối ưu
( y ( t ) − y ( 0 ) ) u = v ( 0 ) ( v ( t ) − v ( 0 ) ) + 12 ( v ( t ) − v ( 0 ) )
2
(17)
ðây là một parabol ñi qua tọa ñộ ( y ( 0 ) , v ( 0 ) ) và khi trạng thái ban ñầu
biến thiên ta vẽ ñược một họ parabol . ðồ thị mặt phẳng pha phản ánh trạng
thái biến thiên diễn tả cho trường hợp u = 1 và u = -1 ở Hình 2.14 . Họ quỹ
ñạo ñi từ dưới lên trên ứng với trường hợp u = 1 , và họ quỹ ñạo ñi từ trên
xuống dưới ứng với u = -1 . Mũi tên chỉ hướng tăng của thời gian .
Như ñã trình bày ở trên , tín hiệu ñiều khiển tối ưu u ( t ) là một hàm không
ñổi từng ñoạn, lấy giá trị ±1 và có nhiều nhất là hai ñoạn không ñổi . Do ñó,
nếu ban ñầu trong một khoảng thời gian nào ñó u ( t ) lấy giá trị +1 và sau ñó
là -1 thì họ quỹ ñạo pha gồm hai ñoạn của các parabol nối tiếp nhau, trong
ñó ñoạn parabol thứ hai là ñường parabol chạy về gốc toạ ñộ. Như vậy,
ñường cong hợp bởi hai nhánh parabol (ñường ñứt nét trên Hình 2.14) là
quỹ ñạo cuối ñưa trạng thái về gốc toạ ñộ , ñường cong ñó ñược gọi là
ñường chuyển ñổi và có phương trình là :
1 2 v<0
2 v
y= (18)
1
− v 2
v>0
2
Theo nguyên lý cực tiểu, chỉ có những quỹ ñạo trên là tối ưu và từ một ñiểm
của mặt phẳng pha chỉ có một quỹ ñạo tối ưu chạy về gốc tọa ñộ .
u= -1
u= 1
Trang 188
Chương 2: ðiều khiển tối ưu
Trang 189
Chương 2: ðiều khiển tối ưu
Ví dụ 2.21 :
0 1 0
x& = 2 x+ u u (t ) ≤ 1
− w 0 1
a. Giải phương trình biến trạng thái. Dùng nguyên lý cực tiểu Pontryagin
ñể tìm luật ñiều khiển tối ưu.
b. Vẽ quỹ ñạo pha cho trường hợp u = 1 và u = -1
c. Tìm ñường cong chuyển ñổi và luật ñiều khiển hồi tiếp cho thời gian tối
thiểu
Giải:
a. Phương trình biến trạng thái:
Mục ñích: ñưa trạng thái từ ñiểm ban ñầu bất kỳ (x1(0),x2(0)) ñến ñiểm
gốc trong thời gian ngắn nhất.
0 1 0
Phương trình trạng thái của hệ thống: x& = x+ 1 u (1)
− w
2
0
Hệ (1) có dạng: x& = Ax + Bu
0 1 0
Trong ñó: A = 2 , B = 1
− w 0
x&1 0 1 x1 0
Hệ (1) có thể ñược viết lại: = 2 + u
x& 2 − w 0 x2 1
x&1 = x2
⇔ 2
(2)
x& 2 = − w x1 + u
T
Chỉ tiêu chất lượng: J = ∫ L[ x(t ), u (t ), t ]dt = T ⇒ L[x(t),u(t),t] = 1
0
Trang 190
Chương 2: ðiều khiển tối ưu
Vậy ta tìm ñược luật ñiều khiển tối ưu cho bài toán phụ thuộc vào biến
1, λ2 < 0
trạng thái λ2 (t ) như sau: u * (t ) = indefinited , λ2 = 0
− 1, λ2 > 0
& ∂H 2
− λ1 = ∂x = − w λ 2
Hệ phương trình ñồng trạng thái: 1
∂H
− λ&2 = = λ1
∂x 2
λ&1 = w 2 λ2
Viết lại hệ trên: ⇒ λ1 = −λ&2 ⇒ λ&1 = −λ&&2 = w 2 λ2
&
λ2 = −λ1
⇔ λ&&2 + w 2 λ 2 = 0
Giải phương trình trên ta ñược: λ2 = c1 cos wt + c 2 sin wt
Mà λ = −λ& , nên: λ = c sin wt − c cos wt
1 2 1 1 2
λ = c1 sin wt − c 2 cos wt
Nghiệm phương trình ñồng trạng thái là: 1
λ2 = c1 cos wt + c 2 sin wt
1, λ2 < 0
*
Luật ñiều khiển của hệ thống: u (t ) = indefinited , λ2 = 0
− 1, λ2 > 0
Hình 1
Tín hiệu ñiều khiển chỉ có giá trị là 1 hoặc –1. Do phương trình biến
trạng thái có dạng hàm dao ñộng tuần hoàn với chu kỳ 2π. Và tại thời
Trang 191
Chương 2: ðiều khiển tối ưu
ñiểm là bội của π, tín hiệu ñiều khiển sẽ chuyển trạng thái từ -1 sang 1
hoặc ngược lại mặc dù chúng ta không biết ñược giá trị của c1 và c2.
( ) 2
⇔ w 2 x1 − u + x 22 = K 2
Nếu chọn w=1, ta có phương trình tham số như sau:
x1 − u = K cos θ
(x1 − u )2 + x22
= K2 ⇔ với –2π≤θ≤2π (4)
x 2 = K sin θ
ðây chính là phương trình ñường tròn tâm (u,0), bán kính K. Do ñó khi
K thay ñổi, ta sẽ có quỹ ñạo là những ñường tròn ñồng tâm (tâm (1,0)
khi luật ñiều khiển u(t)=1 và tâm (-1,0) khi luật ñiều khiển u(t)=-1).
Trong ñó hằng số K cũng ñược xác ñịnh từ ñiều kiện ñầu cho trước x(0)
= x0 nào ñoù.
Hình 2
Trang 192
Chương 2: ðiều khiển tối ưu
1 >
0.5
>
x2
-0.5
-1 <
-1.5
-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x1
Hình 3
Mặc khác, luật ñiều khiển tối ưu là hàm dao ñộng tuần hoàn với chu kỳ
2π. Do ñó quỹ ñạo tối ưu (ñường cong chuyển ñổi) là một chuỗi với hai
nửa ñường tròn như Hình 4.
Trang 193
Chương 2: ðiều khiển tối ưu
>
x2
0
-2
-4
-6
-6 -4 -2 0 2 4 6
x1
Hình 4
0 ** ***
*** *** **
*
*
** **** < < *
** **<
** **
-2 ** *
** **
*** **
*** ****
**** **
****** ****
-4 ***********
-6
-8
-8 -6 -4 -2 0 2 4 6 8
x1
Hình 5
Trang 194
Chương 2: ðiều khiển tối ưu
Hình 6
Trang 195
Chương 2: ðiều khiển tối ưu
T m
J ( t0 ) = ∫ ∑ ci ui ( t ) dt (2.102)
t0 i =1
Khi ñó chúng ta cho phép khả năng tiêu thụ nhiên liệu của m ñầu vào ui(t)
bởi trọng số vô hướng ci . Ta ñịnh nghĩa trị tuyệt ñối của vector :
u1
u = M (2.103)
u
m
( ñịnh nghĩa này tương tự (2.90) ) và vector C = [c1 c2 … cm]T . Ta có :
T
J ( t0 ) = ∫ C T u ( t ) dt (2.104)
t0
Trang 196
Chương 2: ðiều khiển tối ưu
ta có thể viết lại chỉ tiêu chất lượng theo dạng sau :
1 + biT λ
ui ui ≥ 0
biT λui ci
qi ( t ) ui + = (2.111)
ci 1 − bi λ u
T
ui ≤ 0
c i
i
T
Nếu Bi λ/ci bằng 1 , khi ñó một vài giá trị không xác ñịnh dương của ui(t) sẽ
làm qi trong (2.111) bằng zero ; nếu BiTλ/ci bằng -1 , khi ñó một vài giá trị
không xác ñịnh âm của ui(t) sẽ làm qi bằng zero . Do ñó bài toán nhiên liệu
tối thiểu có luật ñiều khiển giống như một bài toán phi tuyến .
Biến trạng thái hồi tiếp là :
1 Bi λ (t ) / ci < −1
T
nonnegative
Bi λ (t ) / ci = −1
T
ui ( t ) = 0 − 1 < Bi λ (t ) / ci < 1
T
(2.112)
nonpositive Bi λ (t ) / ci = 1
T
-1 Bi λ (t ) / ci > 1
T
Trang 197
Chương 2: ðiều khiển tối ưu
Nếu bài toán nhiên liệu tối thiểu là chuẩn và bộ ñiều khiển nhiên liệu tối
thiểu tồn tại , khi ñó nó là duy nhất .
Ở ví dụ kế ta sẽ xem xét một số vấn ñề của bài toán nhiên liệu tối thiểu .
Ví dụ 2.22 :
ðiều khiển Bang-off-bang
Hệ thống ñược mô tả :
y& = v (1)
v& = u (2)
với x = [ y v ]
T
. ðiều kiện ràng buộc của ngõ vào :
u (t ) ≤ 1 (3)
Giả sử ta xác ñịnh ñược trạng thái ñầu (y(0),v(0)) . Ta ñược :
y[T ]
ψ ( x(T ), T ) = =0 (4)
v[T ]
Chỉ tiêu chất lượng với yêu cầu nhiên liệu tối thiểu :
T
J (0) = ∫ u (t )dt (5)
0
Ta chưa chú ý ñến trạng thái thời gian cuối T hoặc tự do hoặc ràng buộc,
mặc dù cuối cùng ta cũng sẽ xét ñến cả 2 trường hợp .
Hàm Hamilton :
H = u + λ y v + λv u (6)
Trong ñó λ = λ y[ λv ]T . Do ñó phương trình ñồng trạng thái là :
λ&y = 0 (7)
λ&v = −λ y (8)
ðiều kiện tiếp tuyến yêu cầu :
0 = H (T ) = u (T ) + λv (T )u (T ) (9)
Từ (4) , (7) , (8) ta suy ra :
λy ( t ) = const λ y (10)
λv ( t ) = λv (T ) + (T − t ) λy (11)
Thành phần biến trạng thái λv(t) là tuyến tính . Tùy thuộc vào biến chưa biết
λy và λv(T) ( chúng tuỳ thuộc vào giá trị của trạng thái ñầu ) , λv(t) có thể là
hằng số (λy = 0) , có thể tăng (λy < 0) hoặc giảm (λy > 0) . Xem Hình 2.13 .
Nguyên lý cực tiểu Pontryagin yêu cầu :
u (t ) = − dez (λv (t )) (12)
Trang 198
Chương 2: ðiều khiển tối ưu
Trang 199
Chương 2: ðiều khiển tối ưu
Hình 2.15 : Quỹ ñạo mặt phẳng pha trong trường hợp u = 0 .
Trang 200
Chương 2: ðiều khiển tối ưu
Hình 2.17 : Quỹ ñạo trạng thái nhiên liệu tối thiểu .
Trang 201
Chương 2: ðiều khiển tối ưu
0 = y (T ) = y ( t2 ) + v ( t2 )(T − t2 ) +
(T − t2 ) (23)
2
trong ñó ta có sử dụng ñiều kiện biên (4) .
Thế (18) , (20) vào (22) , ta ñược :
t 2 = v0 + T − t1 (24)
Thế (18) , (19) , (20) , (21) , (24) vào (23) và ñơn giản hóa , cho ra kết quả :
v
2
Trang 202
Chương 2: ðiều khiển tối ưu
phương pháp biến phân cổ ñiển bị hạn chế khả năng sử dụng trong thực tế
rất nhiều .
ðối với hệ thống gián ñoạn tốt nhất ta nên áp dụng phương pháp quy hoạch
ñộng của Bellman . ðặc biệt với các bài toán tối ưu phức tạp dùng máy tính
số tác ñộng nhanh giải quyết bằng phương pháp này rất có hiệu quả . Tuy
nhiên , do hàm mô tả tín hiệu ñiều khiển tìm ñược theo bảng số liệu rời rạc
nên biểu thức giải tích của tín hiệu ñiều khiển chỉ là gần ñúng . Phương
pháp quy hoạch ñộng còn gặp hạn chế khi áp dụng ñối với hệ thống liên tục
vì rất khó giải phương trình Bellman .
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có ñiều
kiện ràng buộc bất kể ñiều kiện ràng buộc cho theo hàm liên tục hoặc hàm
gián ñoạn . Nhưng ñối với bài toán tối ưu phi tuyến thì nguyên lý cực tiểu
Pontryagin lại gặp khó khăn , ñặc biệt trong việc xác ñịnh các hàm phụ
λi (t ) ñể cho hàm H ñạt cực ñại .
2.3 ðIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM
DẠNG TOÀN PHƯƠNG
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng
hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương .
2.3.1 Ổn ñịnh Lyapunov ñối với hệ thống tuyến tính
Tiêu chuẩn ổn ñịnh thứ hai của Lyapunov ( ñiều kiện ñủ )
Xét hệ thống ñược mô tả bởi phương trình trạng thái :
x& = f ( x1 , x 2 ,..., x n )
Nếu tìm ñược một hàm V(x) với mọi biến trạng thái x1 , x2 ,…, xn là một hàm
dV (x )
xác ñịnh dấu dương , sao cho ñạo hàm của nó dựa theo phương
dt
trình vi phân của chuyển ñộng bị nhiễu cũng là hàm xác ñịnh dấu , song trái
dấu với hàm V(x) thì chuyển ñộng không bị nhiễu sẽ ổn ñịnh tiệm cận .
V ( x).V& ( x) < 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh tiệm cận.
V ( x).V& ( x) = 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh .
V ( x).V& ( x) > 0 : với mọi biến trạng thái xi , i = 1, n hệ thống không ổn ñịnh .
Phương trình Lyapunov
Xét hệ tuyến tính mô tả bởi phương trình trạng thái (hệ Autonom_hệ tự trị):
x& = Ax (2.115)
Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J :
∞
J = ∫ xT Qxdt (2.116)
0
với Q là ma trận vuông xác ñịnh dương .
Trang 203
Chương 2: ðiều khiển tối ưu
2.3.2 ðiều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn
phương _ Phương trình Riccati ñối với hệ liên tục
Xét hệ thống có tác ñộng ngoài ( u ≠ 0 ):
x& = Ax + Bu (2.122)
Chúng ta cần tìm ma trận K của vector ñiều khiển tối ưu :
u (t ) = − Kx(t ) (2.123)
thỏa mãn chỉ tiêu chất lượng J ñạt giá trị cực tiểu :
Trang 204
Chương 2: ðiều khiển tối ưu
∞
(
J = ∫ x T Qx + u T Ru dt ) (2.124)
0
Trong ñó Q là ma trận xác ñịnh dương ( hoặc bán xác ñịnh dương ) , R là ma
trận xác ñịnh dương . Chú ý : thành phần thứ hai ở phần bên phải phương
trình (2.124) xác ñịnh lượng năng lượng tiêu tốn của tín hiệu ñiều khiển .
Chúng ta sẽ chứng minh luật ñiều khiển tuyến tính cho bởi phương trình
(2.123) là luật ñiều khiển tối ưu . Khi ñó , nếu ma trận K ñược xác ñịnh ñể
tối thiểu hoá chỉ tiêu chất lượng J thì luật ñiều khiển u(t) sẽ tối ưu với mọi
trạng thái ban ñầu x(0) .
Từ (2.122) và (2.123) ta có :
x& = Ax − BKx = ( A − BK )x (2.125)
Thay u (t ) = − Kx(t ) vào phương trình (2.124) :
∞
(
J = ∫ x T Qx + x T K T RKx dt )
0
∞
(2.126)
(
= ∫ x T Q + K T RK xdt )
0
Bây giờ ta chọn hàm năng lượng :
V ( x) = xT Sx V ( x) ≥ 0, ∀x (2.127)
với S là ma trận vuông xác ñịnh dương .
⇒ & + xT Sx&
V& ( x) = x&T Sx + xT Sx
= xT ( A − BK )T Sx + xT Sx& + xT S ( A − BK ) x
= xT ( A − BK )T S + S& + S ( A − BK ) x (2.128)
Do V(x) xác ñịnh dương , nên ñể hệ thống ổn ñịnh thì V& ( x) phải là xác ñịnh
âm . Ta ñặt :
d T
V& ( x) =
dt
( )
x Sx = − xT (Q + K T RK ) x
(
( do Q và R là ma trận xác ñịnh dương nên ma trận Q + K T RK cũng là xác)
ñịnh dương , từ ñó V& ( x) sẽ là xác ñịnh âm ) .
xT Q + K T RK x = − xT ( A − BK ) S + S ( A − BK ) + S& x
( ) T
⇒
T
Q + K RK = ( A − BK ) S + S ( A − BK ) + S
T & (2.129)
Theo tiêu chuẩn ổn ñịnh thứ hai của Lyapunov , nếu ma trận (A-BK) ổn ñịnh
thì sẽ tồn tại một ma trận xác ñịnh dương S thoả mãn phương trình (2.129) .
Chỉ tiêu chất lượng bây giờ có thể ñược xác ñịnh như sau :
Trang 205
Chương 2: ðiều khiển tối ưu
∞
( )
J = ∫ x T Qx + u T Ru dt = − x T Sx
∞
0
= − x(∞ ) Sx(∞ ) + x(0) Sx(0)
T T
( )
AT − K T B T S + S ( A − BK ) + S& + Q + K T T T TK = 0
Phương trình trên có thể viết lại như sau :
[
AT S + SA + TK − T T ( ) −1
][
T
( ) −1
]
B T S − SBR −1 B T S + Q + S& = 0
B T S TK − T T
(2.130)
Chỉ tiêu chất lượng J ñạt giá trị cực tiểu khi biểu thức :
[ ( ) −1
x T TK − T T B T S TK − T T ][
T
( )
−1
]
BT S x
ñạt giá trị cực tiểu .
1− a2
Hệ hở: Q=0, u k* = 2N
(rN − a N x0 )a N −k −1
b(1 − a )
Hệ ổn ñịnh: rN = 0.
Khi ñó :
( ) BS
TK = T T
−1 T
⇒ K = T −1 T T
(T ) B S = R
−1−1 T
B S (2.131)
Phương trình (2.131) cho ta ma trận tối ưu K . Như vậy , luật ñiều khiển tối
ưu cho bài toán ñiều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng
cho bởi phương trình (2.131) là tuyến tính và có dạng :
u (t ) = − Kx(t ) = − R −1 B T Sx(t ) (2.132)
Ma trận S khi ñó phải thỏa mãn phương trình (1.130) ñược viết lại như sau :
A T S + SA − SBR −1 B T S + Q = − S& (2.133)
Phương trình (2.133) ñược gọi là phương trình Riccati .
Khi S không thay ñổi theo thời gian S& = 0 , ta có phương trình ñại số
Riccati ( ARE : Algebraic Riccati Equation ) :
AT S + SA − SBR −1 B T S + Q = 0 (2.134)
Trang 206
Chương 2: ðiều khiển tối ưu
Chỉ tiêu chất lượng J ñược ñịnh nghĩa trong khoảng [1,N] có dạng :
1 1 N −1
J = xNT SN x N + ∑ ( xKT QK xK + uKT RK uK ) (2.136)
2 2 K =i
Hàm Hamilton:
1
H K = ( x TK QK x K + u KT RK u K ) + λTK +1 ( AK x K + BK u K ) (2.137)
2
Xét hệ rời rạc và phương trình ñồng trạng thái:
∂H K
x k +1 = = AK x K + BK u K (2.138)
∂λ K +1
∂H K
λk = = QK x K + AKT λ K +1 (2.139)
∂x K
ðiều kiện biên (Stationarity condition):
∂H K
0= = RK u K + BKT λ K +1 (2.140)
∂u K
Theo 2.140 : u K = − R k− 1 B KT λ K +1 (2.141)
λk = QK x K + AKT λ K +1 (2.144)
1 T
Do hàm ma trận trọng lượng có dạng: φ = xN S N xN
2
Vì k ≤ N , ta có: λk = S k xk (2.146)
−1
Thế 2.146 vào 2.143 ta ñược: x k +1 = AK x K − BK R B S k +1 x k +1
k
T
K
Trang 207
Chương 2: ðiều khiển tối ưu
Hay: Sk = Ak S k +1 − Sk +1 Bk Bk Sk +1 Bk + Rk Bk Sk +1 Ak + Qk
−1 T
T
T
( )
Phương trình trên chính là phương trình Riccati cho hệ rời rạc . Khi Sk ≠ 0
với ∀k , ta có thể dùng bổ ñề ma trận nghịch ñảo ñể viết lại phương trình
trên như sau :
( )
S k = AkT S k−+11 + Bk Rk−1 BkT Ak + Qk
Khi ñó , luật ñiều khiển tối ưu của tín hiệu ñiều khiển có dạng :
u K = − Rk−1 BKT λk +1 = − Rk−1 BKT S k +1 xk +1 (2.148)
Thế 2.135 vào 2.148:
u K = − Rk−1 BKT S k +1 ( AK xk + BK u k )
Hay:
( I + Rk−1 BKT S k +1 BK )u K = − Rk−1 BKT S k +1 AK xk
−1
Vậy luật ñiều khiển uk là: u K = −( BK S k +1 BK + Rk ) BK S k +1 AK xk
T T
Trang 208
Chương 2: ðiều khiển tối ưu
2.3.4 Các bước giải bài toán toàn phương tuyến tính
Bước 1 :
Thành lập hệ phương trình trạng thái :
x& = Ax + Bu
c = Dx
Xác ñịnh các thông số A , B , D .
Bước 2 :
Xác ñịnh ma trận trọng lượng Q , R từ chỉ tiêu chất lượng J cho dưới dạng
toàn phương tuyến tính .
Bước 3 :
Tìm nghiệm S của phương trình Riccati :
- ðối với hệ liên tục : − S& = AT S + SA − SBR −1BT S + Q
- ðối với hệ rời rạc :
Sk = AkT S k +1 − Sk +1 Bk BkT Sk +1 Bk + Rk BkT Sk +1 Ak + Qk
−1
( )
Bước 4 :
Chỉ tiêu chất lượng tối ưu ñối với hệ dừng :
J = xT ( 0 ) Sx ( 0 )
min
Bước 5 :
Luật ñiều khiển tối ưu :
- ðối với hệ liên tục : u = − R −1BT Sx
−1
- ðối với hệ rời rạc : uk = − ( BkT Sk +1Bk + Rk ) BkT Sk +1 Ak xk
Ví dụ 2.23:
Cho hệ thống như hình vẽ .
Trang 209
Chương 2: ðiều khiển tối ưu
Trang 210
Chương 2: ðiều khiển tối ưu
Ví dụ 2.24 :
Xác ñịnh luật ñiều khiển tối ưu rời rạc biết hệ thống có ñối tượng ñiều khiển
mô tả bởi phương trình trạng thái sau :
0 1 0
x& ( t ) = x (t ) + u (t ) (1)
0 −0.1 0.01
Trang 211
Chương 2: ðiều khiển tối ưu
N −1
Chỉ tiêu chất lượng : J = ∑ x12k + 0.001uk2
( ) (2)
k =0
Chu kỳ lấy mẫu T = 0.5 sec , N = 50 .
Ta dễ dàng xác ñịnh ñược phương trình trạng thái hệ rời rạc từ phương trình
trạng thái hệ liên tục :
xk +1 = Ad xk + Bd uk
yk = Cd xk
1 0.488 0.00123
với : Ad = , Bd = , Cd = [1 0]
0 0.951 0.00488
Nghiệm của bài toán tối ưu ñược tính theo (2.138) và (2.139) :
K k = ( BkT S k +1 Bk + Rk ) −1 BkT S k +1 Ak (3)
( )
(4)
1 0
với : Ak = Ad , Bk = Bd , Qk = , Rk = 0.001
0 0
Ta tính ñược K49 = 0 khi biết S50 = 0 . Tiếp theo ta tính giá trị S49 :
1 0
S49 = Q49 = (5)
0 0
Tiếp tục với K48 và S48 :
−1
1 0 0.00123
K 48 = [ 0.00123 0.00488] + 0.001 .[ 0.00123 0.00488] .
0 0 0.00488
1 0 1 0.488
0 0 0 0.951 = [1.228 0.599] (6)
1 0 1 0 1 0 0.00123 1 0
S48 = − [ 0.00123 0.00488] .
0.488 0.951 0 0 0 0 0.00488 0 0
1 0 1 0.488 1 0
−1
0.00123
0.00488 + 0.001 [ 0.00123 0.00488 ] 0 0 0 0.951 + 0 0
0.9985 0.4873
= (7)
0.4873 0.2378
Tiếp tục tính toán nhờ máy tính , ta sẽ xác ñịnh ñược với k = 39 ma trận Kk
sẽ hội tụ về giá trị [25 63] .Vậy ñiều khiển tối ưu cuối cùng là :
uk = − [ 25 63] xk (8)
Trang 212
Chương 2: ðiều khiển tối ưu
Ví dụ 2.25
x&1 = x 2
Hệ thống Newton:
x& 2 = u
T
1 1
Hàm chỉ tiêu chất lượng J = x T (T ).x(T ) + ∫ ( x T x + ru 2 )dt
2 20
Trong ñó x = [x1 x 2 ]
T
S1 S& 2 0 0 0 S1 1 S 22
& S 2 .S 3 1 0
⇔ − = + − +
& & S 32 0 1
S 2 S 3 S 1 S 2 0 S 2 r S 2 S 3
Trang 213
Chương 2: ðiều khiển tối ưu
S& S& 2 0 S1 1 S 22 S 2 .S 3 1 0
⇔ − 1 = − +
& & S 32 0 1
S 2 S 3 S1 2 S 2 r S 2 S 3
& 1 2
− S 1 = − r S 2 + 1
& 1
⇔ − S 2 = S1 − S 2 .S 3 (2)
r
& 1 2
− S 3 = 2 S 2 − r S 3 + 1
Phương trình (2) là phương trình Riccati vi phân vô hướng.
c. Sử dụng Matlab viết chương trình tìm và mô phỏng ñiều khiển tối ưu.
* Hệ thống ñược mô phỏng như sau:
u
x2
x1
1 1
1
s s
Constant Integrator1 Integrator y
Noise
K1 Noise2
Gain
K2
Gain1
Chọn R=1
*Chương trình trong Matlab:
A = [0 1; 0 0];
Trang 214
Chương 2: ðiều khiển tối ưu
B = [0; 1];
C = [1 0];
Q = [1 0;0 1];
R = 1;
%=====GIAI PHUONG TRINH RICCATI=====
[K,S] = lqr(A,B,Q,R);
%========MO PHONG TOI UU=========
x1=y(:,2);
subplot(211);
plot(x1,'r');
title('KET QUA MO PHONG DAP UNG RA Y(t)');
subplot(212);
plot(u(:,2),'r');
title('KET QUA MO PHONG DIEU KHIEN TOI UU U(t)');
*Kết quả tính toán và mô phỏng ñược thể hiện:
K=[1.0000 1.7321]
S =[1.7321 1.0000; 1.0000 1.7321]
d. Công thức giải tích cho nghiệm và hệ số khuếch ñại Riccati trạng thái xác
lập:
Ở trạng thái xác lập khi giá trị T = t → ∞ ta có S&1 = S& 2 = S& 3 = 0
Trang 215
Chương 2: ðiều khiển tối ưu
& 1 2 1 2
− S 1 = − r S 2 + 1 = 0 − r S 2 + 1 = 0
1 1
Hay: − S& 2 = S1 − S 2 .S 3 = 0 ⇔ S1 − S 2 .S 3 = 0
r r
& 1 2 1 2
− S 3 = 2 S 2 − r S 3 + 1 = 0 2 S 2 − r S 3 + 1 = 0
1
S 22 = r S2 = r S 1 (∞ ) = r 2r r + r
1 r
1
⇔ S1 = S 2 S 3 ⇔ S1 = r 2r r + r ⇔ S 2 (∞ ) = r (4)
r r S (∞) = 2r r + r
S 3 = 2rS 2 + r S3 = 2r r + r 3
Biểu thức (4) là biểu thức giải tích của nghiệm Riccati trạng thái xác lập.
Thay các giá trị của S(t) ở biểu thức (4) vào phương trình (3) ñã tìm ở câu
b ta có:
1
k1 (t ) = r
r (5)
1
k 2 (t ) = 2r r + r
r
Biểu thức (5) là biểu thức giải tích của hàm hồi tiếp của hệ thống ở trạng
thái xác lập
Ví dụ 2.26:
x&1 = x 2
Thieát keá boä baùm cho heä thoáng ñöôïc cho bôûi:
x& 2 = u
∞
1
Haøm chæ tieâu chaát löôïng: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Vôùi mong muoán bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Cho troïng soá
q=10, r=1.
a. Xaùc ñònh luật ñiều khiển u(t).
b. Neáu r(t)=u-1(t), giaûi tìm u(t) neáu x(0)=0ñ
Giải:
a. Xaùc ñònh luaät ñieàu khieån vôùi tín hieäu ñaàu vaøo r(t)=1(t):
x&1 = x 2
Xét hệ thống:
x& 2 = u
Trang 216
Chương 2: ðiều khiển tối ưu
∞
1
Vôùi: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Trong ñoù: q- v2>0 vôùi mong muoán muoán x1(t) baùm theo moät tham chieáu
r(t) cho q = 10, r =1.
Heä thoáng ñaõ cho coù theå vieát laïi döôùi daïng:
∞
1
x& = Ax + Bu ; J = ∫ ( x T Qx + u T Ru )dt ; Cx(t ) = r (t )
20
0 1 0 1 ν 1 ν
Vôùi A = , B = 1 , C = [
1 0 ] , Q = ν q = ν 10 , R = 1
0 0
Giaûi phöông trình Riccati ñeå tìm S:
.
− S = AT S + SA − SBR T B T S + Q
Thieát keá heä thoáng phaûn hoài aâm neân khi S khoâng thay ñoåi theo thôøi gian
− s12 . s 21 = −1
− . = −v
⇔ s11 s12 s 22
s11 − s 22 . s12 = −v
s + s − s = −10
12 21 22
Choïn caùc giaù trò cuûa ma traän S sao cho S xaùc ñònh döông. Nghiệm của
phương trình trên là:
2 3 − v 1
S=
1 2 3
Trang 217
Chương 2: ðiều khiển tối ưu
Trang 218
Chương 2: ðiều khiển tối ưu
∞
1 1 1 1
J=
20∫ ( x T Qx + u T Ru ) = − x T Sx |∞0 = − x(∞) T Sx(∞) + x T (0) Sx(0)
2 2 2
Keát quaû:
K x = [0.6093 2.1079]
K r = 0.6131
x 0 =[0 0]'
x ∞ =[1 0]'
J = -1.0981
x1
Vaäy luaät ñieàu khieån: u = −[k1 k 2] − K r .u −1 (t )
x2
Chæ tieâu chaát löôïng: J = -1.0981
Trang 219
Chương 2: ðiều khiển tối ưu
Ở ñây ta sẽ sử dụng hàm lsqlin ( Optimization Toolbox ) với kết quả là giá
2 2
trị tối ưu của x ñể f ( x) = Cx − D ñạt giá trị nhỏ nhất ( Cx − D là norm
của ma trận vuông [Cx − D ] ) .
Cùng các ñiều kiện ràng buộc :
Ax ≤ B
Aeq.x = Beq
Cần lập các thông số C , D , A , B , Aeq , Beq ñể nhập vào theo cú pháp :
x = lsqlin(C, D, A, B, Aeq, beq)
Chương trình :
C = [1/(18^(1/2)) 0;0 1/(8^(1/2))];
D = [0;0];
Aeq = [1 1];
Beq = [1];
x = lsqlin(C, D, [], [], Aeq, Beq)
Chúng ta sẽ ñược kết quả :
x = 0.6923
0.3077
2.4.2 ðiều khiển tối ưu cánh tay máy hồi tiếp góc θ
Xét mô hình cánh tay máy hai ñoạn như hình :
Vị trí ñiểm cuối của cánh tay hai ñoạn ñược cho bởi phương trình sau :
x = L1 cos (θ1 ) + L2 cos (θ1 + θ 2 )
y = L1 sin (θ1 ) + L2 sin (θ1 + θ 2 )
θ&& A B T1 E
Phương trình ñộng lực học : 1 = +
&&
θ 2 C D T2 F
Trang 220
Chương 2: ðiều khiển tối ưu
T
trong ñó T = [T1 T2 ] là tín hiệu ñiều khiển .
Với các trạng thái :
x1 = θ1
x = x& = θ&
2 1 1
x3 = θ 2
x4 = x&3 = θ&2
x&1 = x2
x& = AT + BT − E
⇒ 2 1 2
x&3 = x4
x&4 = CT1 + DT2 − F
( & 2 + Ψ2 + Ψ
J = ∫ Ψ12 + Ψ 1 2
& 2 dt
2 )
0
Ψ = e + K1e&1
Với phiếm hàm dạng : 1 1
Ψ 2 = e2 + K 2 e&2
e = θ r −θ
với 1 1r 1
e2 = θ 2 − θ 2
θ1r ,θ 2r là góc ñặt của θ1 ,θ 2
e& = −θ&1 = − x2
⇒ 1
&
e&2 = −θ 2 = − x4
e = −θ&&1 = − x&2
&&
⇒ 1
e2 = −θ&&2 = − x&4
&&
ðể ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J thì T1 , T2 là nghiệm của hệ
phương trình sau :
Ψ1 + Ψ& =0
1
&
Ψ 2 + Ψ 2 = 0
Giải hệ phương trình trên ta ñược :
−1
T1 K1 A K1 B e1 + EK1 − x2 ( K1 + 1)
T = K C K D e + FK − x K + 1
2 2 2 2 2 4( 2 )
Tín hiệu ñiều khiển T ñược tính toán bằng chương trình Giai_PT.m
Trang 221
Chương 2: ðiều khiển tối ưu
Chương trình :
Thông số ñầu vào cho hệ thống (file thongso.m) :
global m1 m2 L1 L2 a1 a2 I1 I2
m1 = 3.6745;
m2= 1.0184;
L1= 0.6519 ;
L2= 0.6019;
a1= 0.3365 ;
a2= 0.2606;
I1= 0.370 ;
I2= 0.081;
Trang 222
Chương 2: ðiều khiển tối ưu
Trang 223
Chương 2: ðiều khiển tối ưu
Trang 224
Chương 2: ðiều khiển tối ưu
Hình 1a
Code hình 1a:
t=0:pi/100:2*pi; t=0:pi/100:2*pi;
x=1+1*cos(t); % tam (1,0) x=1+2*cos(t); % tam (1,0)
bankinh 1 bankinh 2
y=0+1*sin(t); y=0+2*sin(t);
plot(x,y,'r') plot(x,y,'g')
%--------------- %---------------
hold on hold on
Trang 225
Chương 2: ðiều khiển tối ưu
t=0:pi/100:2*pi; y=0+4*sin(t);
x=1+3*cos(t); % tam (1,0) plot(x,y,'b')
bankinh 3 %---------------
y=0+3*sin(t); hold on
plot(x,y,'r--') xlabel('x1')
%--------------- ylabel('x2')
hold on
t=0:pi/100:2*pi; axis([-6 5 -5 5])
x=1+4*cos(t); % tam (1,0)
bankinh 4
:
Hình 1b
Hình 1a vaø hình 1b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 1b:
t=0:pi/100:2*pi; y=0+2*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'g')
bankinh 1 %---------------
y=0+1*sin(t); hold on
plot(x,y,'r') t=0:pi/100:2*pi;
%--------------- x=-1+3*cos(t); % tam (-1,0)
hold on bankinh 3
t=0:pi/100:2*pi; y=0+3*sin(t);
x=-1+2*cos(t); % tam (-1,0) plot(x,y,'r--')
bankinh 2 %---------------
Trang 226
Chương 2: ðiều khiển tối ưu
hold on plot(x,y,'b')
t=0:pi/100:2*pi; hold on
x=-1+4*cos(t); % tam (-1,0) xlabel('x1')
bankinh 4 ylabel('x2')
y=0+4*sin(t); axis([-6 5 -5 5])
Roõ raøng quyõ ñaïo traïng thaùi toái öu chæ coù theå ñöôïc taïo ta töø caùc cung cuûa
nhöõng ñöôøng troøn
Trang 227
Chương 2: ðiều khiển tối ưu
Hình 3: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 3:
t=0:pi/100:pi; y=0+2.5*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'r')
bankinh 1 hold on
y=0+1*sin(t); %--------------
plot(x,y,'c') t=0:-pi/100:-pi;
hold on x=1+1*cos(t); % tam (1,0)
t=0:pi/100:pi; bankinh 1
x=-3+1*cos(t); % tam (-3,0) y=0+1*sin(t);
bankinh 1 plot(x,y,'b')
y=0+1*sin(t); hold on
plot(x,y,'g') xlabel('x1')
hold on ylabel('x2')
%-------------- axis([-5 3 -3 3])
t=-0.39:pi/100:2.78 grid
x=-1+2.5*cos(t); % tam (-1,0)
bankinh 2.5
Trang 228
Chương 2: ðiều khiển tối ưu
Hình 5 : Ñöôøng chuyeån ñoåi giaù trò cuûa tín hieäu ñieàu khieån toái öu
Trang 229
Chương 2: ðiều khiển tối ưu
y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'k') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:-pi/100:-pi; x=-5+1*cos(t); % tam (-5,0)
x=5+1*cos(t); % tam (5,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'k')
plot(x,y,'b') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:pi/100:pi; x=-7+1*cos(t); % tam (-3,0)
x=-1+1*cos(t); % tam (-1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'b')
plot(x,y,'g') hold on
hold on %--------------
%-------------- xlabel('x1')
t=0:pi/100:pi; ylabel('x2')
x=-3+1*cos(t); % tam (-3,0) axis([-10 10 -4 4])
bankinh 1 grid
y=0+1*sin(t);
Trang 230
Chương 2: ðiều khiển tối ưu
Hình 6a
Hình 6b
Hình 6a vaø hình 6b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 6b:
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
Trang 231
Chương 2: ðiều khiển tối ưu
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
Hình 6c
Hình 6a, hình 6b, hình 6c : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái
öu
Code hình 6c:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
Trang 232
Chương 2: ðiều khiển tối ưu
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
Trang 233
Chương 2: ðiều khiển tối ưu
Hình 8: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 8:
t=0:-pi/100:-pi; x=x-12;
x=4*cos(t); y=2*sin(t);
x=x+4; plot(x,y,'g')
y=2*sin(t); hold on
plot(x,y,'k') t=-0.505:pi/100:2.649
hold on x=8*cos(t);
t=0:pi/100:pi; x=x-4;
x=4*cos(t); y=4*sin(t);
x=x-4; plot(x,y,'b')
y=2*sin(t); hold on
plot(x,y,'r') xlabel('x1')
hold on ylabel('x2')
t=0:pi/100:pi; axis([-20 20 -10 10])
x=4*cos(t); grid
Trang 234
Chương 2: ðiều khiển tối ưu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
[K,S] = lqr(A,B,Q,R)
Keát quaû:
K =[1.0000 3.4641]
S =[ 2.1962 1.0000; 1.0000 3.4641]
Chöông trình giaûi phöông trình vi phaân:
function Vp=ssequi(t,V)
global D
Vp=D*V;
% Giai phuong trinh vi phan tim V
global D
D = -(A-B*K)'
v0 = [0.535 1.887]';
t0 = 0;
tf = 0.05;
nt = 5000;
t = linspace(t0,tf,nt);
options = odeset('reltol',1.0e-6);
[tn,v] = ode23('ssequi',[t0,tf],v0,options);
Vs = v';
V = Vs(:,end)
Keát quaû:
V =[0.6373 2.2120]T
Trong chöông trình giaûi phöông trình vi phaân ta phaûi choïn ñieàu kieän
ñaàu V0 sao cho vôùi ñieàu kieän ñaàu V0 ta coù keát quaû cuoái cuûa V duøng ñeå
tìm luaät ñieàu khieån thoaû ñieàu kieän x1(t) baùm theo r(t).
Tìm P từ ma trận V:
v2=V(2,:)
P=v2^3/3
Keát quaû:
P = 3.6078
Tìm luaät ñieàu khieån u(t):
Trang 235
Chương 2: ðiều khiển tối ưu
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
Keát quaû:
Kx =[0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
x1
Vaäy luaät ñieàu khieån laø: u = −[k1 k 2] − Kr.r
x2
b. Nếu r(t)=u-1(t) , giải tìm u(t) khi x(0)=0.
function Vp=ssequi(t,V)
global D
Vp=D*V;
%----------------------------------------
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
% Dung thuat toan lqr de tim K,S
[K,S] = lqr(A,B,Q,R)
%Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.535 1.887]';
t0=0;
tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Trang 236
Chương 2: ðiều khiển tối ưu
Vs=v';
V=Vs(:,end)
v2=V(2,:)
% Tinh P
% ===========================
P=v2^3/3
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j =(-x_vocung'*S*x_vocung + x0'*S*x0)/2
Keát quaû:
Kx = [0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
x0=[0 0]'
x_vocung =[1 0]'
j = -1.0981
x1
Vaäy luaät ñieàu khieån: u = −[k1 k 2] − Kr.u −1 (t )
x
2
Chæ tieâu chaát löôïng : J = -1.0981
c. Moâ phoûng
1/ Trong tröôøng hôïp x(0)=0; r(t)=u-1(t)
Sô ñoà moâ phoûng khi coù nhieãu ño:
Trang 237
Chương 2: ðiều khiển tối ưu
Trang 238
Chương 2: ðiều khiển tối ưu
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
%Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0 )/2
% Goi mo hinh simulink
%===============================
sim('mophong')
%===============================
% Ve dap ung ra x1
figure;
subplot(2,1,1);
plot(x1(:,2),'b');
hold on;
%===============================
% Ve tin hieu vao r
plot(r(:,2),'r');
axis([0 60 -2 2]);
legend('x1','r')
title('KET QUA MO PHONG')
hold on;
% ==============================
% Ve sai so
Trang 239
Chương 2: ðiều khiển tối ưu
subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu u-1(t) vôùi thôøi gian oån
ñònh 17sec, khoâng coù voït loá.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 240
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Khi coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-
1(t) vôùi thôøi gian oån ñònh 17sec, khoâng coù voït loá nhöng khoâng theå loaïi
boû ñöôïc phöông sai nhieãu. Traïng thaùi ban ñaàu x1(t) ñöôïc naâng leân moät
löôïng ñuùng baèng giaù trò trung bình nhieãu.
Moâ phoûng khi coù nhieãu heä thoáng:
Keát quaû moâ phoûng khi coù nhieãu heä thoáng vôi giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Nhaän xeùt: coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-1(t)
vôùi thôøi gian oån ñònh 17sec, khoâng voït loá vaø traïng thaùi ñaàu x1(t) khoâng
thay ñoåi. Tuy nhieân vaãn bò aûnh höôûng cuûa phöông sai nhieãu.
2. Trong tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1)
Trang 241
Chương 2: ðiều khiển tối ưu
%===================================
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
mean=0.5; % Gia tri trung binh cua nhieu
variance = 0.0001; % Phuong sai nhieu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
%===================================
% Giai tim K,S bang thuat toan lqr
[K,S] = lqr(A,B,Q,R)
%===================================
% Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.5338 1.8899]';
t0=0;
Trang 242
Chương 2: ðiều khiển tối ưu
tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
% Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[1 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0)/2
Trang 243
Chương 2: ðiều khiển tối ưu
hold on;
% ==============================
% Ve sai so
subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')
Keát quaû:
K =[ 1.0000 3.4641]
S = [2.1962 1.0000; 1.0000 3.4641]
V = [0.6362 2.2155]T
P = 3.6250
Kx =[ 0.6112 2.1100]
k1 = 0.6112
k2 = 2.1100
Kr = 0.6112
x0 = [1 0]T
x_vocung = [1 0]T
j= 0
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 244
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät
tieâu ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân
khoâng trieät tieâu ñöôïc phöông sai nhieãu.
Sô ñoà moâ phoûng tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1) coù nhieãu heä
thoáng:
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r
-1
-2
0 10 20 30 40 50 60
SAI SO
1
error
0.5
-0.5
-1
0 10 20 30 40 50 60
Trang 245
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät tieâu
ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân khoâng
trieät tieâu ñöôïc phöông sai nhieãu
Ñeå coù cô sôû so saùnh ta moâ phoûng trong tröôøng hôïp tín hieäu vaøo laø hình
sin hoaëc xung vuoâng.
Sô ñoà moâ phoûng hoaøn toaøn gioáng nhö treân chæ khaùc khoái nguoàn.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:
0.5
-0.5
-1
-1.5
-2
0 10 20 30 40 50 60 70 80 90 100
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r
0.5
-0.5
-1
-1.5
-2
0 20 40 60 80 100 120 140 160 180 200
Trang 246
Chương 2: ðiều khiển tối ưu
Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu ôû möùc ñuùng baèng giaù trò trung bình cuûa nhieãu.
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:
0.5
-0.5
-1
-1.5
-2
0 10 20 30 40 50 60 70 80 90 100
Nhận xét: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu. Traïng thaùi ban ñaàu x1(t)=0;
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r
0.5
-0.5
-1
-1.5
-2
0 20 40 60 80 100 120 140 160 180 200
Nhận xét: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu baèng 0.
Trang 247
Chương 2: ðiều khiển tối ưu
2. Hệ rời rạc
Xét hệ vô hướng :
xk +1 = axk + buk
với chỉ tiêu chất lượng :
1 1 N −1
Ji = sN xN2 + ∑ qxk2 + ruk2
( )
2 2 k =i
a = 1.05 , b = 0.01 , q = r = 1 , x0 = 10 , N = 100 . Chúng ta sẽ xét hai trường
hợp sN = 5 và sN = 500 bằng chương trình dex ñể tìm các quỹ ñạo tối ưu .
Chương trình :
function [x,u,K,S] = dex
a = 1.05;
b = 0.01;
q = 1;
r = 1;
x0 = 10;
s = 5;
N = 100;
S(N+1) = s;
for k = N:-1:1
K(k) = ( a * b * s ) / ( r + s * b^2 );
s = q + ( r * s * a^2 ) / ( r + s * b^2 );
S(k) = s;
end
x(1) = x0;
for k = 1:N
u(k) = -K(k) * x(k);
x(k+1) = a * x(k) + b * u(k);
end
Trang 248
Chương 2: ðiều khiển tối ưu
Trang 249
Chương 2: ðiều khiển tối ưu
Trang 250
Chương 2: ðiều khiển tối ưu
Trang 251
Chương 2: ðiều khiển tối ưu
(& 2 dt
J = ∫ Ψ2 + Ψ )
0
Hãy chứng minh hàm biến số phụ Ψ ñược xác ñịnh từ ñiều kiện cực tiểu của
J như sau :
Ψ+Ψ & =0
3. Phát biểu nguyên lý tối ưu của Bellman . Trình bày ý tưởng giải quyết bài
toán tối ưu của phương pháp quy hoạch ñộng .
4. Trình bày nguyên lý cực tiểu của Pontryagin
5. Phát biểu tiêu chuẩn ổn ñịnh thứ hai của Lyapunov .
6. Ứng dụng Lyapunov trong bài toán LQR liên tục .
7. Chứng minh ma trận Q là ma trận xác ñịnh dương:
Q = x12 + 4 x 22 + x32 + 2 x1 x 2 − 6 x 2 x3 − 2 x1 x3
8. Chứng minh ma trận Q là ma trận xác ñịnh âm:
Q = − x12 − 3 x 22 − 11x32 + 2 x1 x 2 − 4 x 2 x3 − 2 x1 x3
9. Viết một số hàm Lyapunov cho hệ thống sau:
x&1 − 1 1 x1
x& = 2 − 3 x
2 2
Xác ñịnh tính ổn ñịnh của hệ thống.
10. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = − x1 − 2 x 2 + 2
x& 2 = x1 − 4 x 2 − 1
11. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = x1 + 3x 2
x& 2 = −3x1 − 2 x 2 − 3x3
x& 3 = x1
Trang 252
Chương 2: ðiều khiển tối ưu
sao cho khoảng cách từ (x , y) ñến ñiểm có toạ ñộ (2,2) là ngắn nhất . Tính
khoảng cách ñó .
13. a. Tìm hình chữ nhật có diện tích lớn nhất với chu vi p. Nghĩa là tìm x
và y thoả mãn cực ñại hoá hàm :
L( x, y ) = xy
với ñiều kiện ràng buộc : f ( x, y ) = 2 x + 2 y − p = 0
b. Tìm hình chữ nhật có chu vi nhỏ nhất với diện tích cho trước là a 2 .
Nghĩa là cực tiểu hoá hàm :
L ( x, y ) = 2 x + 2 y
với ñiều kiện ràng buộc : f ( x, y ) = xy − a 2 = 0
14. Cho hệ thống :
. 2 2 1
x= x + u
1 0 3
Tìm các giá trị tối ưu x∗ , u ∗ , L∗ thoả mãn cực tiểu chỉ tiêu chất lượng :
1 1 0 1 2 1
L = xT x + uT u
2 0 2 2 1 1
15. Cho hệ thống :
d2y
=u
dt 2
Tìm tín hiệu ñiều khiển u thoả mãn cực tiểu chỉ tiêu chất lượng :
1
1
J = ∫ µ u&&2 + ρ u dt
−1
2
với các ñiều kiện ñầu :
y (−1) = y (1) = 0
y& (−1) = y& (1) = 0
16. Cho hệ thống :
di − R u
= i+
dt L L
i: dòng ñiện
Trang 253
Chương 2: ðiều khiển tối ưu
1
J = ∫ u 2 dt
0
với x(0) = 0 và x(1) = 2 .
c. Tìm quỹ ñạo trạng thái tối ưu .
17. Cho hệ thống :
xk +1 = xk uk + uk2
với chỉ tiêu chất lượng:
N −1
J 0 = xN2 + ∑ xk uk
k =0
Cho N = 2 . Tín hiệu ñiều khiển chỉ nhận các giá trị : uk = 1 hoặc uk = −1 .
xk nhận các giá trị -1, 0, 1, 2 .
a. Sử dụng phương pháp quy hoạch ñộng ñể tìm luật ñiều khiển hồi tiếp
trạng thái tối ưu .
b.Với x0 = 2 , hãy tìm tổn hao tối ưu, luật ñiều khiển và quỹ ñạo trạng
thái .
18. Xét hệ tác ñộng nhanh có dạng sau :
d 2x
+x=u
dt 2
u ≤1
Tìm quỹ ñạo pha tối ưu ñể ñưa hệ về gốc toạ ñộ từ một ñiểm bất kỳ .
19. Cho hệ thống :
x&1 = x2
x&2 = u
∞
1
( )
J = ∫ x12 + 2vx1 x2 + qx22 + u 2 dt
20
( )
với q − v 2 > 0 .
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
c. Vẽ quỹ ñạo nghiệm số của hệ thống khi q thay ñổi từ 0 ñến ∞ . Với
giá trị nào của q thì hệ thống ổn ñịnh .
20. Cho hệ thống :
x&1 = x1 + u
x& 2 = − x1 + x2
Trang 254
Chương 2: ðiều khiển tối ưu
∞
1
J = ∫ ( x12 + x 22 + ru 2 ) dt
20
1
với r = .
10
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
21. Cho hệ thống :
x&1 = x2
x&2 = − ax1 − 2 x2 + u
và chỉ tiêu chất lượng :
∞
1
( )
J = ∫ 2 x12 + x22 + u 2 dt
20
a. Vẽ quỹ ñạo nghiệm số của hệ hở khi a thay ñổi từ 0 ñến ∞ . Với giá
trị nào của a thì hệ thống ổn ñịnh .
b. Với a = -8 tìm lời giải cho phương trình ñại số Riccati và hệ số K .
22. Xét hệ rời rạc :
xk +1 = 2 xk + uk
a. Tìm lời giải xk với k = 0 ; 5 nếu x0 = 3 .
b. Xác ñịnh luật uk tổn hao năng lượng tối thiểu ñể ñưa hệ thống từ x0 = 3
về x5 = 0 . Vẽ quỹ ñạo trạng thái tối ưu. Chỉ tiêu chất lượng hệ hở
(q=0):
1 N −1
J = ∑ uk2
2 k =0
c. Tìm luật hồi tiếp trạng thái Kk tối ưu sao cho chỉ tiêu chất lượng J ñạt cực
tiểu :
4
J = 5 x52 + 0.5∑ xk2 + uk2
( )
k =0
Tính hàm tổn thất J tối ưu với k = 0 ; 5 .
23. Xét hệ rời rạc :
xk +1 = axk + buk
1 1 N −1
J = sN xN3 + ∑ qxk3 + ruk3
( )
3 3 k =0
với xk , uk là vô hướng .
a. Tìm phương trình trạng thái, phương trình ñồng trạng thái và ñiều kiện
tĩnh .
Trang 255
Chương 2: ðiều khiển tối ưu
b. Khi nào thì ta có thể tìm ñược luật ñiều khiển tối ưu uk . Với ñiều kiện
ñó , hãy khử uk trong phương trình trạng thái .
c. Tìm lời giải bài toán ñiều khiển vòng hở (trạng thái cuối xN cố ñịnh,
sN = 0 , q = 0 ) .
24. Cho hệ thống ñược mô tả bởi hệ phương trình trạng thái:
y& = v
u (t ) ≤ 1
v& = u
Vẽ quỹ ñạo pha tối ưu ñưa hệ từ trạng thái ban ñầu về gốc tọa ñộ với thời
gian ngắn nhất trong các trường hợp sau ñây:
a. x1(0) = 4, x2(0) = 3
b. x1(0) = 4, x2(0) =- 3
c. x1(0) = -4, x2(0) = -3
d. x1(0) = -4, x2(0) = 3
1. Giải với luật ñiều khiển Bang Bang.
2. Giải với luật ñiều khiển Bang off Bang, T = 45 s
25. Moät taøu chôû haøng goàm ba loaïi sau :
Troïng löôïng w(lb) Giaù thaønh v($)
Maùy röûa cheùn 100 360
Maùy giaët 125 475
Tuû laïnh 250 1000
Ñaët uk laø soá maùy ñöôïc taûi leân taøu cho ba loaïi treân : k=1,2,3
u1 = soá tuû laïnh ñöôïc chôû leân taøu , u2 = soá maùy giaët & u3 = soá maùy röûa
cheùn. wk laø troïng löôïng ,vk laø giaù thaønh .
Ñaët xk laø taûi troïng cho pheùp ñoái vôùi töøng loaïi haøng .
Yeâu caàu haøm chæ tieâu J laø cöïc ñaïi:
3
J = ∑ vk uk
k =1
Vôùi ñieàu kieän raøng buoäc laø taûi troïng ( W ) toái ña taøu ñöôïc pheùp chôû laø
730 lb
3
∑w u
k =1
k k ≤W
Trang 256
Chương 3 ðiều khiển thích nghi
Chương 3
“Thích nghi là quá trình thay ñổi thông số và cấu trúc hay tác ñộng ñiều
khiển trên cơ sở lượng thông tin có ñược trong quá trình làm việc với mục
ñích ñạt ñược một trạng thái nhất ñịnh, thường là tối ưu khi thiếu lượng
thông tin ban ñầu cũng như khi ñiều kiện làm việc thay ñổi” hay :
“ðiều khiển thích nghi là tổng hợp các kĩ thuật nhằm tự ñộng chỉnh ñịnh các
bộ ñiều chỉnh trong mạch ñiều khiển nhằm thực hiện hay duy trì ở một mức
ñộ nhất ñịnh chất lượng của hệ khi thông số của quá trình ñược ñiều khiển
không biết trước hay thay ñổi theo thời gian”.
Kết luận
Trang 257
Chương 3 ðiều khiển thích nghi
1. Giới thiệu
2. Bình phương cực tiểu và hồi qui
3. Hệ thống ñộng
4. Các ñiều kiện thực nghiệm
5. Các ví dụ
6. Các kết luận
Có thể phân loại các hệ thích nghi theo các tiêu chuẩn sau :
1. Hệ thích nghi mô hình tham chiếu ( MRAS )
2. Bộ tự chỉnh ñịnh ( STR )
3. Lịch trình ñộ lợi
4. Hệ tự học
5. Hệ tự tổ chức
Trang 258
Chương 3 ðiều khiển thích nghi
• Tự chỉnh ñịnh
• Lịch trình ñộ lợi
• Thích nghi liên tục
Trang 259
Chương 3 ðiều khiển thích nghi
ym
Mô hình
uc
u y
Bộ ñiều khiển ðối tượng
Hình 3.2 Sơ ñồ khối của một hệ thống thích nghi mô hình tham chiếu
Mô hình chuẩn sẽ cho ñáp ứng ngõ ra mong muốn ñối với tín hiệu ñặt (yêu
cầu). Hệ thống có một vòng hồi tiếp thông thường bao gồm ñối tượng và bộ
ñiều khiển. Sai số e là sai lệch giữa ngõ ra của hệ thống và của mô hình
chuẩn e = y - ym. Bộ ñiều khiển có thông số thay ñổi dựa vào sai số này. Hệ
thống có hai vòng hồi tiếp: hồi tiếp trong là vòng hồi tiếp thông thường và
vòng hồi tiếp bên ngoài hiệu chỉnh tham số cho vòng hồi tiếp bên trong.
Vòng hồi tiếp bên trong ñược giả sử là nhanh hơn vòng hồi tiếp bên ngoài.
Hình 3.2 là mô hình MRAS ñầu tiên ñược ñề nghị bởi Whitaker vào năm
1958 với hai ý tưởng mới ñược ñưa ra: Trước hết sự thực hiện của hệ thống
ñược xác ñịnh bởi một mô hình, thứ hai là sai số của bộ ñiều khiển ñược
chỉnh bởi sai số giữa mô hình chuẩn và hệ thống. Mô hình chuẩn sử dụng
Trang 260
Chương 3 ðiều khiển thích nghi
trong hệ thích nghi bắt nguồn từ hệ liên tục sau ñó ñược mở rộng sang hệ rời
rạc có nhiễu ngẫu nhiên.
Chương này tập trung vào ý tưởng cơ bản. ðể vấn ñề ñược trình bày một
cách rõ ràng, ta chỉ tập trung vào cấu hình trong hình 3.2 ñược gọi là hệ
MRAS song song . ðây là một trong nhiều cách có thể xây dựng mô hình
chuẩn. Chương này ñề cập chính ñến hệ liên tục theo phương pháp trực tiếp
có nghĩa là tham số ñược cập nhật một cách trực tiếp.
e uC − y
Khâu tích phân
∂e
−
∂θ γ θ u
π s
π
Trang 261
Chương 3 ðiều khiển thích nghi
Trong phương trình này e là sai số của mô hình e = y – ym. Các thành phần
của vector ∂e/∂θ là ñạo hàm ñộ nhạy của sai số ñối với các thông số chỉnh
ñịnh θ.Thông số γ xác ñịnh tốc ñộ thích nghi. Luật MIT có thể ñược giải
thích như sau. Giả sử rằng các thông số θ thay ñổi chậm hơn nhiều so với
các biến khác của hệ thống. ðể bình phương sai số là bé nhất, cần thay ñổi
các thông số theo hướng gradient âm của bình phương sai số e2.
Giả sử muốn thay ñổi thông số của bộ ñiều khiển sao cho sai số giữa ngõ ra
của ñối tượng và của mô hình chuẩn tiến tới zero. ðặt e là sai số và θ là
thông số hiệu chỉnh. Chỉ tiêu chất lượng :
1 2
J(θ ) = e (3.1)
2
ñể làm cho J(θ) MIN thì cần phải thay ñổi các thông số theo hướng âm của
gradient J, có nghĩa là :
∂θ ∂J ∂e
= −γ = − γe (3.2)
∂t ∂θ ∂θ
Giả sử rằng các thông số cần thay ñổi θ thay ñổi chậm hơn nhiều so với các
∂e
biến khác của hệ thống. Vì vậy ñạo hàm ñược tính với giả thiết θ là
∂θ
∂e
hằng số. Biểu thức ñạo hàm gọi là hàm ñộ nhạy của hệ thống. Luật ñiều
∂θ
∂e
chỉnh theo phương trình (3.2) với là ñộ nhạy thì có liên hệ giống như
∂θ
luật MIT. Cách chọn hàm tổn thất theo phương trình (3.1) có thể là tuỳ ý.
Nếu chọn
J(θ ) = e (3.3)
Khi ñó luật hiệu chỉnh sẽ là :
dθ ∂e
= −γ sign(e) (3.4)
dt ∂θ
Hoặc
dθ ∂e
= − γ sign sign(e)
dt ∂θ
ðây gọi là giải thuật dấu - dấu. Hệ rời rạc sử dụng giải thuật này ñược ứng
dụng trong viễn thông nơi ñòi hỏi tính toán nhanh và thực hiện ñơn giản.
Trang 262
Chương 3 ðiều khiển thích nghi
Phương trình (3.2) còn ñược áp dụng trong trường hợp có nhiều thông số
∂e
hiệu chỉnh, khi ñó θ trở thành một vector và là gradient của sai số ñối
∂θ
với các thông số tương ứng. Ứng dụng của luật MIT ñược biểu diễn bằng
hai ví dụ sau :
Trang 263
Chương 3 ðiều khiển thích nghi
ds 0 1 (3.7)
= γ y e
dt p + am
Ví dụ trên chỉ cách sử dụng luật MIT ñể tạo ñược luật hiệu chỉnh thông số.
Kết quả mô phỏng hệ MRAS trong ví dụ 3.2 các với thông số như sau:
a = 1, b = 0.5, am = 2 và bm = 2.
Tín hiệu vào là sóng vuông với biên ñộ bằng 1 và γ = 2.
Trang 264
Chương 3 ðiều khiển thích nghi
ðáp ứng của ngõ ra y, ngõ ra tham chiếu ym và tín hiệu ñiều khiển u.
Nhận xét:
Hệ thống vòng kín ñã ñạt ñến ñáp ứng mong muốn chỉ sau một thời
gian ngắn.
Tốc ñộ hội tụ phụ thuộc vào hai thông số là γ và b
ðiều ñáng quan tâm nhất qua ví dụ trên là cách mà luật MIT ñược sử dụng
ñể hiệu chỉnh các thông số.
Nó không nhất thiết ñòi hỏi phải có một mô hình kèm theo hoàn hảo.
Và quá trình này có thể áp dụng cho hệ phi tuyến.
Ví dụ này ñã sử dụng lại cấu trúc như hình 3.3. Có 2 bộ nhân ñược
∂e
sử dụng.Trong ñó: bộ nhân thứ nhất là của e và , và phương
∂θ
trình 3.7 cung cấp thông số cho bộ nhân thứ hai.
Việc xấp xỉ là rất quan trọng bởi vì nếu xấp xỉ tốt ta sẽ có ñược luật
hiệu chỉnh thông số ñáng tin cậy.
Luật MIT sẽ ñạt hiệu quả cao nếu như ta chọn ñộ thích nghi γ nhỏ. Tuy
nhiên, giới hạn này còn tùy thuộc vào biên ñộ của tín hiệu chuẩn cũng như
là ñộ lợi của hệ thống. Trong một số trường hợp, luật MIT có thể làm mất
tính ổn ñịnh của hệ thống. Do ñó, khi sử dụng luật hiệu chỉnh ta cũng cần
phải quan tâm ñến tính ổn ñịnh của hệ thống.
Trang 265
Chương 3 ðiều khiển thích nghi
Lấy tích phân phương trình (3.7) sẽ cho ra các tham số và ñược truyền ñến
bộ ñiều khiển sử dụng phép nhân thứ hai.
3. Sự xấp xỉ là cần thiết ñể có ñược luật ñiều khiển hiệu chỉnh tham số thực
tế.
Luật MIT có thể thực hiện tốt nếu ñộ lợi thích nghi γ là nhỏ. ðộ lớn γ tuỳ
thuộc vào biên ñộ của tín hiệu chuẩn và ñộ lợi của ñối tượng. Vì vậy không
thể có một giới hạn cố ñịnh ñảm bảo an toàn do ñó luật MIT có thể cho một
hệ vòng kín không an toàn. Luật hiệu chỉnh bổ sung có thể ñược dùng bằng
lí thuyết ổn ñịnh. Những luật này tương tự luật MIT nhưng các hàm ñộ nhạy
thì ñương nhiên là khác. Ý này ñược trình bày nhiều hơn trong mục 3.2.4
Phương pháp gradient ñược dùng bởi Whitaker ñầu tiên cho hệ MRAS.
Phương pháp này dựa vào giả sử tham số của bộ hiệu chỉnh thay ñổi chậm
hơn các biến khác của hệ thống. Giả sử này thừa nhận có sự ổn ñịnh giả cần
thiết cho việc tính toán ñộ nhạy và cho cơ cấu hiệu chỉnh thích nghi.
Phương pháp tiếp cận gradient không cho kết quả cần thiết cho hệ thống kín
ổn ñịnh. Bộ quan sát ñược ñưa ra ñể áp dụng lý thuyết ổn ñịnh Lyapunov
và lí thuyết bị ñộng ñược dùng ñể bổ sung cho cơ cấu thích nghi.
ðối với hệ thống có tham số ñiều chỉnh ñược như trong hình 3.2, phương
pháp thích nghi sử dụng mô hình chuẩn cho một cách hiệu chỉnh tham số
tổng quát ñể có ñược hàm truyền hệ thống vòng kín gần với mô hình. ðây
gọi là vấn ñề mô hình kèm theo. Một câu hỏi ñặt ra là chúng ta làm cho sai
Trang 266
Chương 3 ðiều khiển thích nghi
lệch nhỏ như thế nào, ñiều này phụ thuộc bởi mô hình, hệ thống và tín hiệu
ñặt. Nếu có thể làm cho sai số bằng 0 ñối với mọi tín hiệu yêu cầu thì gọi là
mô hình kèm theo hoàn hảo.
Trang 267
Chương 3 ðiều khiển thích nghi
Hình 3.4 Hệ vòng kín với bộ ñiều khiển tuyến tính tổng quát
Khử u ở 2 phương trình (3.8) và (3.10) ñược phương trình sau cho hệ thống
vòng kín :
( AR + BS ) y = BTu c (3.11)
ðể ñạt ñược ñáp ứng vòng kín mong muốn, thì AR + BS phải chia hết cho
Am, các zero của ñối tượng, khi cho B = 0, sẽ là zero của hệ kín nếu không
bị khử bởi cực vòng kín.
Bởi vì các ñiểm zero không ổn ñịnh không thể bị khử nên có thể phân tích
thành B = B+B-, trong ñó B+ chứa những thành phần có thể khử ñi, B- là
thành phần còn lại.
Theo phương trình (3.11) AR + BS là ña thức ñặc trưng của hệ thống ñược
phân tích thành ba thành phần : khử zero của ñối tượng:B+ ; cực mong muốn
của mô hình ñược cho bởi Am; các cực của bộ quan sát A0. Vì thế :
AR + BS = B+A0Am (3.12)
gọi là phương trình Diophantine ( hay là phương trình nhận dạng Benzout).
Vì B+ có thể khử nên :
R = B + R1 (3.13)
Chia phương trình (3.12) cho B+ sẽ ñược:
A .R1 + B -.S = A0Am (3.14)
Vì yêu cầu là phải giống ñáp ứng mong muốn nên tử số (3.11) phải chia hết
cho Bm, nếu không thì sẽ không có lời giải cho bài toán thiết kế. Vì vậy :
Bm = B -.B’m (3.15)
T = A0B’m
ðiều kiện ñể ñảm bảo tồn tại lời giải là :
bậc( A0) ≥ 2 bậc(A) - bậc( Am) - bậc(B+) - 1
Trang 268
Chương 3 ðiều khiển thích nghi
Trang 269
Chương 3 ðiều khiển thích nghi
BT B u
e = uC − m C
AR + BS Am
∂e BTAp k −i Bp k −i
→ = − u C = − u i = 1,. . , k
∂ri ( AR + BS ) 2 AR + BS
∂e BTBp l −i Bp l −i
= − u = − y
∂s i ( AR + BS ) 2
C
AR + BS i = 0, K , l
∂e Bp m −i
= uC i = 0,…,m
∂t i AR + BS
Trong ñó k = bậc(R), l = bậc(S), m = bậc(T).
Vế phải các phương trình trên còn chứa A, B là các thông số chưa biết nên
không tính ñược các hàm ñộ nhạy. Một cách xấp xỉ ñể có ñược luật cập nhật
có thực tế là:
AR + BS ≈ A0AmB+
Suy ra các hàm ñộ nhạy:
∂e B − p k −i
≈ − u
∂ri A0 Am
Tương tự cho si và ti
Tuy nhiên vế phải vẫn còn B- là chưa biết. Nếu tất cả các zero ñều ñược
khử, khi ñó ta có B- = b0. Nếu dấu của b0 biết ñược thì có thể thực hiện
ñược luật cập nhật thông số. Thành phần b0 có thể ñược bao gồm trong cả γ.
Nên có thể suy ra luật cập nhật hiệu chỉnh các thông số như sau:
dri p k −i
= γe u i = 1,…, k = bậc(R )
dt A0 Am
ds i p l −i
= γe y i = 0,..., l = bậc(S)
dt A0 Am
dt i p m −i
= − γe uC i = 0,..., m = bậc(T)
dt A0 Am
Trang 270
Chương 3 ðiều khiển thích nghi
Nhận xét:
1
- Cần phải xây dựng 3 trạng thái của bộ lọc cho luật hiệu chỉnh trên.
A0 Am
1
- Sự thay ñổi các tham số này tỉ lệ với tích sai số e và tín hiệu bộ lọc
A0 Am
- ðể có ñược luật ñiều chỉnh các tham số trên cần phải giả sử các zero phải
ổn ñịnh và dấu của b0 phải ñược biết.
- Có thể tránh ñược giả sử này bằng cách sử dụng các thuật toán phức tạp
hơn như ước lượng trạng thái…
Trang 271
Chương 3 ðiều khiển thích nghi
dθ ∂e
= − γe = − γu c2 (θ − θ 0 )
dt ∂θ
Lời giải cho phương trình vi phân ở trên là:
θ (t ) = θ 0 + [θ (0) − θ 0 ] e −γI t
(*)
t
Trong ñó: It = ∫ u c2 (τ )dτ
0
θ0G(s)
-
γ e
- π Σ
s
θ ðối tượng +
y
uc u
π G(s)
Trang 272
Chương 3 ðiều khiển thích nghi
Ở ví dụ trên ñộ biến thiên tham số θ tỉ lệ với bình phương tín hiệu ñiều
khiển uc. ðiều này hợp lí trong một số trường hợp là khi tín hiệu ñiều khiển
uc càng lớn thì càng dễ phát hiện giá trị bị sai của θ.
Tuy nhiên ñộ thay ñổi của tham số ñiều chỉnh phụ thuộc vào biên ñộ của tín
hiệu ñiều khiển có thể dẫn ñến không ổn ñịnh. Ví dụ sau ñây cho luật ñiều
khiển không phụ thuộc vào uc:
Ví dụ 3.4
Giả sử hệ thống có mô hình ở hình 3.6:
ym
θ0 G
-
Mô hình Gm e
uc Σ π
y +
π G
θ γ
-
s
Hình 3.6 Hệ thống thích nghi mô hình tham chiếu cho việc chỉnh ñịnh ñộ lợi
nuôi tiến
Vấn ñề là ñiều chỉnh θ → θ 0. Giả sử hàm truyền ñược cho bởi:
1
G (s) =
s 2
+ a1 s + a 2
Trang 273
Chương 3 ðiều khiển thích nghi
Sai số e = G(p)( θ - θ 0 ) uc
Trong ñó p biểu thị cho phép lấy ñạo hàm. Vì vậy:
∂e y
= G(p)uc = m0
∂θ θ
ðiều chỉnh tham số theo luật MIT:
dθ ∂e y γ′
= − γ ′e = − γ ′e m0 = − γ e y m với γ =
dt ∂θ θ θ0
Hệ thống ñiều khiển thích nghi vì vậy biểu diễn ñược bởi các phương trình
vi phân sau:
d 2 ym dy
2
+ a1 m + a 2 y m = θ 0 u c (I)
dt dt
d2y dy
2
+ a1 + a2 y = θ uc (II)
dt dt
dθ
= − γ e ym = − γ ( y − ym ) ym (III)
dt
Phương trình (I) có thể giải ñược nếu cho sẵn hàm uc , xem như biến ym biết
trước
ðạo hàm (II) ta ñược:
d3y d2y dy dθ du
3
+ a1 2
+ a2 = u c + θ (t ) c
dt dt dt dt dt
Trang 274
Chương 3 ðiều khiển thích nghi
• ðặt vấn ñề
• Giải thuật
• Thiết kế
• Kết quả mô phỏng
• Luật hiệu chỉnh bổ sung
• ðiều kiện hoạt ñộng ổn ñịnh
• Kết luận
Trang 275
Chương 3 ðiều khiển thích nghi
Trang 276
Chương 3 ðiều khiển thích nghi
Biểu thức trên chỉ ra rằng ñể hệ thống ñạt ñược hàm truyền ñạt mong muốn
thì hệ số k của bộ ñiều khiển phải liên tục ñược cập nhật theo thông số b của
quá trình. Nếu ñiều này không thỏa mãn, bộ ñiều khiển sẽ không làm tốt
chức năng ñiều khiển của nó. ðiều này ñược minh họa bằng kết quả mô
phỏng bộ ñiều khiển P trên với hệ số tỉ lệ k = 0.2:
• Như vậy, bộ ñiều khiển kinh ñiển không thể tự cập nhật hệ số tỉ lệ k
theo thông số b của quá trình. Do ñó không thể sử dụng ñể ñiều khiển
quá trình ñược. Vấn ñề ñặt ra là thiết kế một bộ ñiều khiển sao cho nó
có thể thích nghi với quá trình khi thông số b thay ñổi theo thời gian
trong một khoảng tương ñối rộng. Bộ ñiều khiển thích nghi mô hình
tham chiếu (MRAS) có thể giải quyết bài toán này.
Trang 277
Chương 3 ðiều khiển thích nghi
Phương pháp thiết kế ñược chọn là phương pháp tiếp cận Gradient.
Sơ ñồ khối tổng quát của hệ thống với bộ ñiều khiển thích nghi
2. Giải thuật:
Hàm truyền ñạt vòng hở của quá trình:
Y (s) b
G (s) = = (2.1)
U ( s ) s ( s + 1)
⇔ ( s + s )Y ( s ) = bU ( s )
2
⇒ ( p 2 + p) y = bu (2.2)
d
Trong ñó p là toán tử vi phân
dt
Luật ñiều khiển:
u = k ( uc − y ) (2.3)
Thay (2.3) vào (2.2) ta ñược:
⇒ ( p 2 + p) y = bk ( uc − y )
⇔ (p 2
)
+ p + bk y = bkuc (2.4)
bk
⇔ y= uc (2.5)
p + p + bk
2
Trang 278
Chương 3 ðiều khiển thích nghi
∂e b( p 2 + p )
⇒ = 2 uc (2.7)
∂k ( p + p + bk )2
⇔ ( p + p + 1) y = u
2
m c (2.9)
uc
⇔ ym = (2.10)
p + p +1
2
Khi hàm truyền ñạt của hệ thống ñạt tới hàm truyền ñạt mong muốn thì
phương trình (2.4) sẽ ñạt tới phương trình mong muốn (2.9):
( p 2 + p + bk ) y = bkuc ≡ ( p 2 + p + 1) ym = uc
Hay: bk = 1 . Do ñó phương trình (2.8) có thể xấp xỉ:
dk b( p 2 + p )
= −γ ' ( y − ym ) 2 u
2 c
(2.11)
dt ( p + p + 1)
Hơn nữa, ñặt γ = γ 'b , một lần nữa phương trình (2.11) có thể xấp xỉ:
dk p2 + p
= −γ ( y − ym ) 2 uc (2.12)
( p + p + 1)
2
dt
Một câu hỏi ñặt ra là 2 phép xấp xỉ này ảnh hưởng như thế nào tới
chất lượng ñiều khiển. Như ñã biết, hàm truyền ñạt vòng kín của hệ thống
chỉ có thể hội tụ về hàm truyền ñạt vòng kín mong muốn khi thông số γ
ñược chọn ñủ nhỏ. Phép xấp xỉ γ = γ 'b ñã gộp thông số b thay ñổi theo thời
gian vào γ , hay nói cách khác γ cũng trở thành thay ñổi theo thời gian.
Trang 279
Chương 3 ðiều khiển thích nghi
γ tượng trưng cho tốc ñộ hội tụ về hàm truyền ñạt vòng kín mong
muốn của hệ thống (tốc ñộ thích nghi). Do ñó, nếu γ nhỏ (khi thông số b
nhỏ), hệ thống sẽ hội tụ chậm. Nếu γ lớn (khi thông số b lớn), tính ổn ñịnh
của hệ thống sẽ không ñược bảo ñảm và hệ thống sẽ không ñiều khiển ñược.
Như vậy, bộ ñiều khiển chỉ có thể thích nghi khi thông số b của quá trình
thay ñổi trong một giới hạn cho phép.
Phép xấp xỉ bk = 1 không ảnh hưởng ñáng kể ñến chất lượng ñiều
khiển vì một khi hệ thống vòng kín tiến ñến hàm truyền ñạt mong muốn thì
phép xấp xỉ này cũng tiến ñến một phép toán chính xác.
Nói tóm lại, tính ổn ñịnh của hệ thống phụ thuộc nhiều vào thông số
b của quá trình. Việc lựa chọn thông số γ ' của bộ ñiều khiển thích nghi phải
căn cứ vào tầm thay ñổi của thông số b khi hệ thống hoạt ñộng.
3. Thiết kế:
Trong ñó:
• Khối Process: quá trình cần ñiều khiển
Y (s) b
G (s) = =
U ( s ) s ( s + 1)
• Khối Model: hàm truyền ñạt mong muốn của hệ thống vòng kín
Y ( s) 1
Gm ( s) = m = 2
U c ( s) s + s + 1
Trang 280
Chương 3 ðiều khiển thích nghi
Giả sử tầm thay ñổi của b là [ 0.1 ÷ 10] , tốc ñộ hội tụ γ ' = 0.1 , tín
hiệu kích thích uc là xung vuông lưỡng cực có biên ñộ ±1 và tần số 0.01Hz:
Tín hiệu kích thích ñầu vào và ñáp ứng ñầu ra mong muốn
Trang 281
Chương 3 ðiều khiển thích nghi
b = 0.1 b=1
b=5 b = 10
Trang 282
Chương 3 ðiều khiển thích nghi
Nhận xét:
Khi b nhỏ thì hệ thống chậm hội tụ về mô hình mong muốn, khi b
càng lớn thì tốc ñộ hội tụ càng tăng lên (Như ñã phân tích ở mục 2).
Tuy nhiên khi b tăng ñến một mức nào ñó hệ thống sẽ bị mất tính ổn
ñịnh. ðiều này sẽ ñược ñề cập ở mục 6.
Trang 283
Chương 3 ðiều khiển thích nghi
Nhận xét: Khi tín hiệu vào có biên ñộ nhỏ, tốc ñộ hội tụ của hệ thống rất
chậm, khi biên ñộ vào tăng lên, tốc ñộ hội tụ cũng tăng lên (theo tỉ lệ bình
phương) tương ứng. Khi biên ñộ vào ñạt ñến 6 thì hệ thống gần như không
ổn ñịnh nữa và xuất hiện các xung vọt lố không khống chế ñược. Rõ ràng
ñiều này ñã hạn chế rất lớn tầm ñiều khiển của hệ thống. Nhược ñiểm này
có thể khắc phục ñược bằng luật hiệu chỉnh thông số bổ sung:
∂e ∂e
e
dk ∂k ∂k
= −γ T
= −γ e 2
(5.2)
dt ∂e ∂e ∂e
α + α +
∂k ∂k ∂k
Trong ñó: α là một số dương nhỏ tùy ý (chọn α = 0.00001 ) ñưa vào ñể
tránh cho mẫu số của phương trình (5.2) bằng 0 và:
∂e p2 + p p2 + p
≈ 2 uc = uc
∂k ( p + p + 1)2 p 4 + 2 p3 + 3 p 2 + 2 p + 1
Từ phương trình (5.2), khối Adjustment mechanism thiết kế lại như sau:
Kết quả mô phỏng khi uc thay ñổi với luật hiệu chỉnh thông số bổ sung:
Trang 284
Chương 3 ðiều khiển thích nghi
Nhận xét:
Rõ ràng khi có luật hiệu chỉnh thông số bổ sung ñã cho kết quả tốt
và ổn ñịnh hơn hẳn. Tốc ñộ hội tụ về mô hình mong muốn của hệ thống hầu
như không còn phụ thuộc vào biên ñộ tín hiệu vào. Kết quả là về mặt lý
thuyết tầm ñiều khiển của hệ thống có thể mở rộng ñến bất kỳ giá trị uc nào.
thì hệ thống vẫn hoạt ñộng ổn ñịnh trong trường hợp không có nhiễu.
Dựa vào (6.1) ta có thể chọn tốc ñộ hội tụ γ ' thích hợp với sự thay
ñổi của thông số quá trình. Chẳng hạn nếu biết ñược khi vận hành, thông số
2
b của quá trình ñạt giá trị cực ñại bmax = 50 có thể chọn γ ' = = 0.04 ñể
bmax
ñảm bảo tính ổn ñịnh của việc ñiều khiển.
Trang 285
Chương 3 ðiều khiển thích nghi
Thật khó ñể ñưa ra một ước lượng chính xác ñể ñánh giá tác ñộng của nhiễu
ñối với tính ổn ñịnh của hệ thống. Một cách tương ñối, khi tốc ñộ hội tụ γ '
càng nhỏ thì hệ thống càng bền vững với nhiễu (và yếu tố ñánh ñổi là hệ
thống chậm hội tụ về hàm truyền mong muốn). Do ñó, khi có nhiễu tác ñộng
vào hệ thống, chỉ có thể chọn γ ' bằng cách thử - sai: cho thông số b ñạt giá
trị bmax và tăng dần γ ' ñến giá trị γ 'max (khi hệ thống ñạt ñến biên giới ổn
ñịnh). Nếu chọn γ ' < 0.8γ 'max sẽ ñảm bảo tính ổn ñịnh của hệ thống.
Giả sử nhiễu tác ñộng vào hệ thống có kỳ vọng = 0.5 và phương sai
= 0.05, hệ thống khi hoạt ñộng có bmax = 10, tín hiệu kích thích ñầu vào uc là
xung vuông lưỡng cực biên ñộ ±20 , tần số 0.01Hz. Cần xác ñịnh giá trị
γ 'max của bộ ñiều khiển thích nghi sao cho hệ thống vẫn ổn ñịnh.
γ 'max = 0.005
Trang 286
Chương 3 ðiều khiển thích nghi
γ 'max = 0.002
• Hệ thống chịu tác ñộng của nhiễu ño lường:
γ 'max = 0.0025
Hệ thống chịu tác ñộng của nhiễu ñầu vào, nhiễu ñầu ra và nhiễu ño lường:
γ 'max = 0.0008
Trang 287
Chương 3 ðiều khiển thích nghi
7. Kết luận:
Bộ ñiều khiển thích nghi mô hình tham chiếu (MRAS) với phương pháp tiếp
cận gradient có thể giải quyết tốt vấn ñề ñiều khiển hệ thống khi thông số hệ
thống thay ñổi. Hơn nữa, với luật hiệu chỉnh thông số bổ sung thay thế cho
luật hiệu chỉnh thông số MIT có thể nâng cao hơn nữa tính ổn ñịnh và tầm
ñiều khiển của hệ thống. Tuy bộ ñiều khiển là thích nghi nhưng tính thích
nghi chỉ có thể thỏa mãn trong một ñiều kiện làm việc giới hạn, phải chấp
nhận ñánh ñổi giữa tính ổn ñịnh của hệ thống với tốc ñộ hội tụ về giá trị
ñúng của thông số cần ñiều khiển.
Ví dụ 3.6:
1. ðặt vấn ñề:
Cho hệ thống:
1 B
G (s) = = Với a là thông số chưa biết. (1)
s( s + a) A
Xác ñịnh bộ ñiều khiển có thể cho hệ thống vòng kín sau:
ω2 B
Gm ( s) = 2 = m (2)
s + 2ςωs + ω 2
Am
Xác ñịnh các bộ ñiều kiện thích nghi mô hình mẫu dựa trên phương pháp
gradient và lý thuyết ổn ñịnh.
2. Giải thuật:
Luật ñiều khiển tuyến tính có dạng: Ru = Tu c − Sy (3)
Trang 288
Chương 3 ðiều khiển thích nghi
B A
Ta có: y = u ⇒u= y Thay u vào (3), ta ñược:
A B
( AR + BS ) y = BTu c (4)
Ta có: B = B + B − = 1 ⇒ B+ = B− = 1
ðể có hệ thống vòng kín như mong muốn thì ( AR + BS ) phải chia hết
cho Am ,ña thức này phải chứa Am B + và có bậc lớn hơn bằng bậc của Am B + .
Phương trình Diophantine:
AR + BS = B + A0 Am (5)
Với R = B + R1 . Khử B + trong (5) ta ñược:
AR1 + B − S = A0 Am (6)
s ( s + a ) R1 + S = A0 ( s + 2ςωs + ω )
2 2
Ta chọn:
R1 = 1 ⇒ R = B + R1 = 1
A0 = 1
S = s0 s + ω 2
⇒ s 2 + as + s 0 s + ω 2 = s 2 + 2ςωs + ω 2 ⇒ a + s 0 = 2ςω
ðể (4) có dạng (2) thì:
Bm = B − Bm′ = ω 2
T = A0 Bm′
Với: B − = 1 ⇒ Bm′ = ω 2 và T = A0 Bm′ = ω 2
Như vậy, ta có bộ ñiều khiển tuyến tính như sau:
Trang 289
Chương 3 ðiều khiển thích nghi
Nếu tham số a của hệ thống ñược biết trước, ta có thể tính ñược s 0 theo
công thức sau: s 0 = 2ςω − a .
Ví dụ a = 2, và giả sử hệ thống mong muốn có ς = 0,7 và ω = 2
⇒ s 0 = 2ςω − a = 0.8
Với a = 2
Trang 290
Chương 3 ðiều khiển thích nghi
Nhận xét:
Khi a = 2, s 0 = 0.8 : bộ ñiều khiển cho ñáp ứng hệ thống ñúng như yêu cầu.
Nhưng trong thực tế thông số a thay ñổi theo thời gian, làm cho bộ ñiều
khiển không cho kết quả như mong muốn (với a = 0.2, hệ thống bị dao ñộng
và với a = 20, hệ thống không ñáp ứng kịp).
Như vậy, bộ ñiều khiển tuyến tính cổ ñiển không thể tự cập nhật hệ
số s0 theo thông số a của hệ thống nên không thể sử dụng ñể ñiều khiển quá
trình có thông số thay ñổi theo thời gian.
Bộ ñiều khiển thích nghi sẽ giải quyết ñược bài toán này. Ở ñây ta
xem xét bộ ñiều khiển thích nghi mô hình tham chiếu (MRAS).
3. Thiết kế:
Hệ thống thích nghi mô hình tham chiếu
Trong hệ thống, cơ cấu hiệu chỉnh sẽ thay ñổi các thông số của bộ ñiều
khiển sao cho ngõ ra y của ñối tượng giống với ngõ ra ym của mô hình.
Ta sử dụng phương pháp gradient ñể xây dựng luật cập nhật thông số cho
cơ cấu hiệu chỉnh.
ðịnh nghĩa sai số:
e = y − ym
Ta phải thay ñổi thông số của bộ ñiều khiển sao cho sai số e này về 0.
Xét chuẩn:
1
J (θ ) = e 2
2
ðể làm cho J nhỏ thì chiều thay ñổi của thông số là chiều âm gia số của J,
như sau:
dθ ∂J ∂e
= −γ = −γe
dt ∂θ ∂θ
Trang 291
Chương 3 ðiều khiển thích nghi
Khi hàm truyền ñạt của hệ thống ñạt tới hàm truyền ñạt mong muốn thì:
s 2 + (a + s 0 ) s + ω 2 ≈ s 2 + 2ςωs + ω 2
hay a + s0 ≈ 2ςω ⇒ s0 ≈ 2ςω − a
∂e −s
Do ñó: = 2 y
∂s 0 s + 2ςωs + ω 2
Suy ra:
ds0 ∂e s
= −γe = γe 2 y
dt ∂s0 s + 2ςωs + ω 2
Tương tự ví dụ 3.5, tính ổn ñịnh hay không của hệ thống phụ thuộc nhiều
vào thông số a của quá trình. Việc lựa chọn thông số γ của bộ ñiều khiển
thích nghi phải căn cứ vào tầm thay ñổi của thông số a khi hệ thống hoạt
ñộng.
Trang 292
Chương 3 ðiều khiển thích nghi
5. Kết luận:
Bộ ñiều khiển thích nghi chỉ cho kết quả tốt trong một ñiều kiện làm
việc giới hạn, phải chấp nhận ñánh ñổi giữa tính ổn ñịnh của hệ thống với
tốc ñộ hội tụ về giá trị ñúng của thông số cần ñiều khiển.
Ví dụ 3.7:
1. ðặt vấn ñề:
Heä thoáng ñaõ cho coù daïng:
B b.q
y= .u = .u (1)
A ( s + a )( s + p )
Thiết kế bộ ñiều khiển sao cho hệ thoáng mong muoán :
Bm ω2
ym = .uc = 2 .uc (2)
Am s + 2.ξ .ω.s + ω 2
2. Giải thuật:
Ta coù thoûa ñieàu kieän :
Trang 293
Chương 3 ðiều khiển thích nghi
Trang 294
Chương 3 ðiều khiển thích nghi
r1 = 2.ξ .ω + a − a − p
0
ω2 ω 2 .a0
Ñoàng nhaát thöùc ta coù: t0 = ; t1 =
b.q b.q
Thay R, T vaø S vaøo (3) ta ñöôïc boä ñieàu khieån cuûa heä thoáng coù daïng:
( s + r1 ).u ( s ) = t0 .uc .( s ) − ( s0 .s + s1 ). y ( s )
Trong tröôøng hôïp naøy ta coù tính s1 khi bieát t0, s0, vaø r1. tuy nhieân tham soá
q ñaõ bieát thöôøng xuaát hieän vôùi tham soá khoâng bieát b
Vôùi a0 = p töø phöông trình (5) ta coù
Trang 295
Chương 3 ðiều khiển thích nghi
Ta coù :
A ' (s) = s+a
S ' (s) = s0
T ' = t0
S .B.T '
T − uc
A.R ' + B.S ' AT . '
u = = .uc
R A.R ' + B.S '
3. Thiết kế:
Sai số là : e = y - ym
Baây giôø caàn phaûi xaùc ñònh caùc ñaïo haøm rieâng cuûa sai soá ñoái vôùi töøng tham
soá hieäu chænh ñeå tìm luaät chænh ñònh thoâng soá caùc haøm ñoä nhaïy.
Thay y vaø ym vaøo coâng thöùc e = y – ym vaø tính ñaïo haøm rieâng theo töøng
bieán to, so, ro ta seõ coù.
∂e B B
= .uc ≈ .uc
∂t0 A′.R + B.S ′ Am
∂e B.T ′.B B B
=− .uc = − .y ≈ − .y
∂s0 ( A′.R + B.S ′)2
A′.R + B.S ′ Am
∂e A′.B.T ' A′ A′ A′ B B
=− .uc = − .y ≈ − .y = − . .u = − .u
∂r1 ( A′.R + B.S ′ ) A′.R + B.S ′ Am ( s + p)
2
Am Am A
Trang 296
Chương 3 ðiều khiển thích nghi
Trang 297
Chương 3 ðiều khiển thích nghi
Trong ñoù khoái moâ hình tham chieáu coù daïng sau:
Trang 298
Chương 3 ðiều khiển thích nghi
Trang 299
Chương 3 ðiều khiển thích nghi
Trang 300
Chương 3 ðiều khiển thích nghi
Trang 301
Chương 3 ðiều khiển thích nghi
Nhaän Xeùt:
+Trong tröôøng hôïp coù nhieãu thì luaät MIT bò aûnh höôûng cuûa nhieãu vaø
noù khoâng theå loaïi ñöôïc nhieãu.
+Thoâng soá γ xaùc ñònh toác ñoä thích.
+Luaät MIT coù theå thöïc hieän toát neáu ñoä lôïi thích nghi γ laø nhoû. Ñoä lôùn
γ tuøy thuoäc vaøo bieân ñoä cuûa tín hieäu chuaån vaø ñoä lôïi cuûa ñoái töôïng.
+Ñoä giaûm coù ñöôïc baèng luaät MIT ñöôïc quyeát ñònh bôûi tham soá γ , soá
naøy do ngöôøi duøng choïn.
Trang 302
Chương 3 ðiều khiển thích nghi
∂e B
.u
dr1 ∂r1 Am .( s + p)
= −γ .e. T
= γ .e. T
dt ∂e ∂e A A
α + . α + .u . .u
∂r1 ∂r1 Am .( s + p) Am .( s + p)
∂e B
.y
ds0 ∂s0 Am
= −γ .e. T
= γ .e. T
(8)
dt ∂e ∂e B B
α + . α + .y . .y
∂s0 ∂s0 Am Am
∂e B
.uc
dt0 ∂t0 Am
= −γ .e. T
= −γ .e. T
dt ∂e ∂e B B
α + α + .uc .uc
∂t0 ∂t0 Am Am
Sô ñoà khoái moâ phoûng heä thoáng theo luaät MIT söûa ñoåi
Trong ñoù khoái moâ hình tham chieáu coù daïng sau:
Trang 303
Chương 3 ðiều khiển thích nghi
Trang 304
Chương 3 ðiều khiển thích nghi
Trang 305
Chương 3 ðiều khiển thích nghi
Trang 306
Chương 3 ðiều khiển thích nghi
4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω = , α = 0.1
(Ts * ξ )
− Choïn p = 2 vaø q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:
6. Kết luận:
Khi thieát keá heä MRAS baäc 2 baèng luaät MIT ta thaáy keát quaû khaù toát vôùi tín
hieäu vaøo laø baát kyø vaø trong tröôøng hôïp coù nhieãu ñaàu vaøo, nhieãu ñaàu ra hay
nhieãu ño löôøng thì moâ hình cho keát quaû töông ñoái toát. Tuy nhieân vôùi möùc
Trang 307
Chương 3 ðiều khiển thích nghi
nhieãu quaù lôùn thì ta cuõng khoâng theå cho keát quaû toát nhaát ñöôïc nhöng coù
theå loaïi nhieãu baèng caùch chænh α , γ ñeå coù keát quaû töông ñoái.
Öu ñieåm
Loaïi ñöôïc nhieãu
Thieát keá cho heä thoáng coù caùc thoâng soá thay ñoåi khoâng bieát tröôùc
Thích nghi vôùi söï thay ñoåi cuûa ñoái töôïng
Moät soá ñieåm caàn chuù yù:
Trong quaù trình laøm vieäc ñeå heä thoáng vaãn ñaït caùc chæ tieâu nhö
thieát keá ban ñaàu thì phaûi giaû thuyeát raèng ñoái töôïng khoâng töï
thay ñoåi töùc laø ñoä chính xaùc moâ hình vaãn giöõ nguyeân (ñieàu naøy
thöïc teá khoâng ñaït ñöôïc), do phaàn lôùn caùc moâ hình ñeàu chöùa
trong noù moät sai leäch nhaát ñònh so vôùi ñoái töôïng trong quaù trình
laøm vieäc.
Haèng soá γ giöõ vai troø quyeát ñònh ñeán toác ñoä hoäi tuï hay phaân kyø
cuûa thuaät toaùn chænh ñònh, daãn ñeán phuï thuoäc nhieàu vaøo γ vaø
choïn γ raát kho.ù
Phöông phaùp tieäm caän Gradient khoâng cho keát quaû caàn thieát
cho heä thoáng kín oån ñònh.
Phöông phaùp naøy caàn thieát cho caùc tham soá cuûa moâ hình ñoái
töôïng ñeå tính toaùn ñoä nhaïy. Tuy nhieân ñieàu naøy khoâng coù thöïc
vaø do ñoù coù theå söû duïng phöông phaùp xaáp xæ hay baèng caùc boä
öôùc löôïng thoâng soá.
Trang 308
Chương 3 ðiều khiển thích nghi
ðể tập trung vào vấn ñề chính tránh những chi tiết không cần thiết, tự hiệu
chỉnh ñộ lợi nuôi tiến của hệ thống ñược biết trước ñược dùng trong mục
này. Hệ thống dùng ở ñây giống như ở hình 3.6 nhưng cơ cấu thích nghi thì
khác. Vấn ñề là tìm luật hồi tiếp ñể bảo ñảm sai số e = y – ym trong hình 3.6
tiến ñến 0, cần biết rằng vấn ñề ñiều khiển hệ thống với ñặc tính ñộng học
biết trước và hệ số ñộ lợi chưa biết thì không quá khó. Vấn ñề riêng biệt
ñược chọn ñể trình bày ý tưởng hơn là trình bày một vấn ñề thực tế. Một khi
ý tưởng cơ bản ñược phát triển, sự mở rộng ñến những cấu hình tổng quát
thì tương ñối dễ hiểu hơn, chi tiết ñược trình bày trong TLTK[1].
Trang 309
Chương 3 ðiều khiển thích nghi
là hàm xác ñịnh âm. ðiều này cho thấy rằng V(x) tăng liên tục theo ñường
cong bất kì; vì vậy V(x) là hàm Lyapunov. Hàm V(x) trở thành vô hạn với
ñộ lệch vô hạn từ trạng thái cân bằng, trạng thái cân bằng ở gốc của hệ
thống là ổn ñịnh tiệm cận trong vùng rộng.
Chú ý rằng nếu chúng ta ñể V(x) nhận giá trị hằng số 0, C1, C2,. . . (0 < C1 <
C2 <. . . ), thì V(x) = 0 tương ứng với gốc của trạng thái ñối tượng và V(x) =
C1, V(x) = C2, . . .mô tả những vòng tròn không so sánh kèm theo gốc của
trạng thái ñối tượng, như minh họa ở hình 3.8. Cũng cần chú ý rằng V(x) là
bán kính vô tận, hoặc V(x) → ∞ khi ||x||→ ∞.
Trang 310
Chương 3 ðiều khiển thích nghi
Khi vòng tròn V(x) = Ck nằm hoàn toàn trong vòng tròn V(x) = Ck+1, một
ñường cong ñại diện ñi qua vùng biên giới của các ñường viền V từ ngoài
vào trong. Từ ñây, biểu diễn hình học của hàm Lyapunov có thể ñược phát
biểu như sau: V(x) là thước ño khoảng cách của biến trạng thái x từ gốc toạ
ñộ của trạng thái trung gian. Nếu khoảng cách giữa gốc và biến trạng thái
tức thời x(t) tăng liên tục khi t tăng {V[x(t)] < 0 } thì x(t) → 0.
Quỹ ñạo (1) trên hình 3.8 là chuyển ñộng ổn ñịnh tiệm cận về gốc tọa ñộ,
song không thoả tiêu chuẩn ổn ñịnh thứ 2 của Lyapunov: hàm V& (x) không
phải là hàm xác ñịnh âm với mọi biến trạng thái x. Tiêu chuẩn ổn ñịnh thứ 2
của Lyapunov là ñiều kiện ñủ, không phải là ñiều kiện cần ñể ñánh giá tính
ổn ñịnh của nghiệm phương trình vi phân phi tuyến. Nếu thoả tiêu chuẩn thì
hệ ổn ñịnh. Nếu không thoả, vấn ñề kết luận về tính ổn ñịnh còn bỏ ngõ, phụ
thuộc vào:
1.Chọn hàm V(x)
2.Chọn biến trạng thái x
x2
(2) (1)
V=C3
V=C2
V=C1 x1
V tăng
Hình 3.8 Các vòng tròn hằng số V và hai quĩ ñạo ổn ñịnh
Trang 311
Chương 3 ðiều khiển thích nghi
Xét bài toán như trong ví dụ 3.2. Khi tham số của ñối tượng ñược biết luật
ñiều khiển theo phương trình 3.6 cho kết quả mong muốn. Một hệ thích nghi
sử dụng mô hình chuẩn mà có thể tìm ra các hệ số t0 và s0 khi tham số a, b
không ñược biết có thể ñạt ñược như sau :
Sai số : e = y - ym
Lấy ñạo hàm và sử dụng phương trình (3.5), (3.14) và mô hình mong muốn
ñể khử ñạo hàm y và ym , ta ñược :
de
= -ame + (am – a – b s 0 )y + (b t 0 - bm)uc
dt
Chú ý rằng sai số e sẽ tiến ñến 0 nếu các tham số này bằng với giá trị mong
muốn. Bây giờ ta cần cố gắng xây dựng một cơ cấu hiệu chỉnh tham số sao
cho các thông số t0 và s0 tiến ñến giá trị mong muốn. Sử dụng cho mục ñích
này, hàm Lyapunov có dạng :
1 2 1 1
V(e, t 0 , s 0 ) = [e + (b s 0 + a - am)2 + (b t 0 – bm)2]
2 bγ bγ
Hàm này sẽ bằng 0 khi e = 0 và các tham số bộ ñiều khiển bằng với giá trị
tối ưu. ðạo hàm của V là :
dV de 1 ds 1 dt
=e + (b s 0 + a – am) 0 + ( b t 0 - bm) 0
dt dt γ dt γ dt
1 ds 0 1 dt
= -ame2 + ( bs 0 + a – am )( - γye ) + ( bt 0 – bm )( 0 + γuce )
γ dt γ dt
Nếu các tham số ñược cập nhập bởi:
dt 0
= -γuce (3.17)
dt
Trang 312
Chương 3 ðiều khiển thích nghi
ds 0
= γye
dt
ta ñược
dV
= − am e 2
dt
Như vậy:
Hàm V sẽ giảm khi e khác 0. Vì vậy có thể kết luận là sai số e sẽ tiến về 0.
Tuy nhiên cần chú ý là các tham số t0 và s0 sẽ hội tụ ñến giá trị cân bằng nếu
không có các ñiều kiện khác tác ñộng vào. Vì vậy luật này tương tự như luật
MIT nhưng ñộ nhạy ñược thay ñổi bởi tín hiệu khác.
Luật hiệu chỉnh các thông số làm ổn ñịnh cho hệ thống mà các biến trạng
thái có thể ño lường ñược xây dựng bằng sự tổng quát hoá trực tiếp của kĩ
thuật dùng trong ví dụ sau .
Luật hiệu chỉnh theo phương trình 3.17 ñạt ñược bằng cách áp dụng lý
thuyết ổn ñịnh tương tự như bằng luật MIT ( so sánh với ví dụ 3.2) trong cả
hai trường hợp, luật hiệu chỉnh có thể viết như sau :
dθ
=γϕe
dt
với θ là vector các tham số , ϕ = [-uc y] T khi sử dụng luật theo Lyapunov
và
ϕ = [-uc y] T/(p + am)
nếu sử dụng luật MIT vector ϕ có thể ñược giải thích như là giá trị âm của
gradient hàm tổn thất.
Phương pháp Lyapunov bây giờ ñược áp dụng cho việc hiệu chỉnh hệ ñộ lợi
nuôi tiến.
Ví dụ 3.10
Ở ñây chỉ xét vấn ñề hiệu chỉnh ñộ lợi nuôi tiến. Sai số ñược cho bởi
e = G(p)( θ - θ 0 )uc
giới thiệu một không gian trạng thái biểu thị cho hàm truyền G. Quan hệ
giữa tham số θ và sai số e ñược viết bởi:
dx
= Ax + B(θ − θ 0 )u c (3.18)
dt
Trang 313
Chương 3 ðiều khiển thích nghi
e = Cx
Nếu hệ ñồng nhất x& = Ax là ổn ñịnh tiệm cận và có tồn tại 2 ma trận P và Q
xác ñịnh dương sao cho:
AT P + PA = − Q (3.19)
Chọn hàm Lyapunov như sau :
1
V= [γxTPx + (θ - θ 0)2]
2
ðạo hàm V và sử dụng phương trình sai phân 3.18 ñược :
dV γ dx T dx dθ
= ( Px + x T P ) + (θ − θ 0 )
dt 2 dt dt dt
Sử dụng phương trình 3.18 ta ñược :
dV γ
= {[Ax + B u c (θ - θ 0)] TPx + xTP[Ax + B u c (θ - θ 0)]}
dt 2
dθ
+(θ - θ 0)
dt
γ dθ
= - xTQx + (θ - θ 0)( + γ u c BTPx)
2 dt
Trang 314
Chương 3 ðiều khiển thích nghi
Kết quả mô phỏng của hệ thống thu ñược như hình 3.9. Trong ñó:
Hình (a): ðáp ứng ngõ ra của hệ thống và ngõ ra của mô hình chuẩn.
Hình (b): Tín hiệu ñiều khiển.
Hình (c): Sai số e = y - ym
Nhận xét:
Các ña thức P1, P2, Q và A0 ñược lựa chọn sao cho tốc ñộ hội tụ của
y về ym là nhanh nhất. Mặc dù ngõ ra của hệ thống ở cuối quá trình mô
phỏng vẫn chưa tiến ñến giá trị tối ưu nhưng sai số là rất bé (hình (c)).
Ứng với luật ñiều khiển trên thì tại thời ñiểm t = 150s hệ thống vòng
kín có một cực thực là – 1.95 và hai cực ảo tương ứng với ω = 0.84 và
ς = 0.78 , so với ña thức A0Am có một cực thực là – 2 và hai cực ảo tương
ứng với ω = 1 và ς = 0.7 ,
Trang 315
Chương 3 ðiều khiển thích nghi
Trang 316
Chương 3 ðiều khiển thích nghi
Trang 317
Chương 3 ðiều khiển thích nghi
δe
l ce
me•
l1
m1
l c1 •
q1
Trang 318
Chương 3 ðiều khiển thích nghi
q&&1 + e′ q&&2 − e′ 2 cos(q 2 )q&&1 + cos(q 2 )q&&2 + Y1 2 sin( q 2 )q&&1 + sin(q 2 )q&&2 + Y2
0 q&&1 + q&&2 cos(q 2 )q&&1 + Y3 sin(q 2 )q&&1 + Y4
θ = (θ1 , θ 2 , θ 3 , θ 4 )T
τ 1 − e1e2 cos(q1 )
T =
τ2
với e′ = e2 cos(q1 ) và τ 1 , τ 2 là các moment tác dụng vào. ðặc tính ñộng học
có thể ñược viết dưới dạng tuyến tính theo các tham số với giả sử là tất cả
các trạng thái và gia tốc có thể ño lường ñược.
Ví dụ có thể ñược tổng quát hoá và phương trình (3.21) có thể ñược viết
thành:
T − H ′(q)q&& − C ′(q, q& )q& − G ′(q) = ϕ T (q, q& , q&&)θ 0
với H ′, C ′, G ′ và ϕ là biết trước hay có thể ño lường ñược. Dù là mô hình
không tuyến tính, nó vẫn tuyến tính theo các tham số có thể thay ñổi. Một
ñiều quan trọng là kiến thức biết trước ñược dùng và hệ thống ñó không
xem như là mô hình hộp ñen với tham số thay ñổi theo thời gian. Mô hình
thì vẫn còn chưa thoả mãn bởi vì gia tốc phải ñược ño cùng với vị trí và vận
tốc.
ðặt quĩ ñạo tham khảo cho vị trí và vận tốc là qm và q& m . ðưa ra phương
trình Lyapunov như sau:
1 ~& T
V =
2
( ~ ~
q H (q)q~& + q~ T K p q~ + θ T Γθ )
~
Trong ñó: q~ = q − q m , q~& = q& − q& m , θ = θ − θ 0 ; K p và Γ là những ma
trận xác ñịnh dương. Lấy vi phân V , sử dụng phương trình (3.21a) cho ta:
1 ~ ~&
V& = q~& T H q&~& + q~& T H& q~& + q~& T K p q~ + θ T Γθ
2
~ ~&
= q~& T ( H q&& − H q&&m + Cq~& + K p q~ ) + θ T Γθ
~ ~&
= q~& T (T − G − H q&&m − Cq& m + K p q~) + θ T Γθ
ðưa ra luật ñiều khiển:
T = H ′ q&&m + C ′q& m + G ′ − K p q~ − K d q~& (3.21b)
Trang 319
Chương 3 ðiều khiển thích nghi
Luật ñiều khiển bao gồm thành phần nuôi tiến từ thành phần ñã biết của mô
hình và thành phần tỉ lệ và hồi tiếp vận tốc, nghĩa là:
~ ~ ~ ~ ~&
V& = q~& T ( H q&&m − C q& m + G − K d q~& ) + θ T Γθ
Trong ñó:
~
H (q) = H ′(q) − H (q)
~
C (q, q& ) = C ′(q, q& ) − C (q, q& )
~
G (q) = G ′(q) − G (q)
ðặt:
~ ~ ~ ~
H q&&m − Cq& m + G = ϕ mT θ
ðặt ñược như vậy là do mô hình tuyến tính ñối với các tham số. Hơn nữa
ϕ m = ϕ m (q, q& , q& m , q&&m ) có nghĩa là chỉ có gia tốc của mô hình phải ñược
biết, không phải là gia tốc thực. Dẫn ñến:
~ ~&
V& = − q~& T K d q~& + θ T (Γθ + ϕ mT q~& )
ñề nghị cập nhật thông số:
~&
θ& = θ = − Γ −1ϕ mT q~& = − Γ −1ϕ mT (q& − q& m ) (3.21c)
Hàm V thoả tính chất của hàm Lyapunov là xác ñịnh dương và ñạo hàm:
V& = − q~& K q~& d
là bán xác ñịnh âm. ðiều này có nghĩa là hệ vòng kín ổn ñịnh và vận tốc khi
xác lập bằng không. Bộ ñiều khiển cũng có thể ñược bổ sung ñể ñảm bảo là
sai số vị trí bằng 0.
Luật ñiều khiển theo phương trình (3.21b) và tham số ñược cập nhật theo
phương trình (3.21c) là các hàm của biến q, q& , q m , q& m và q&&m , nhưng gia tốc
của khớp nối không cần thiết phải ño ñược. ðể ý rằng luật ñiều khiển là
trường hợp ñặc biệt của hệ MRA tổng quát với e = q& − q& m .
Trang 320
Chương 3 ðiều khiển thích nghi
Trang 321
Chương 3 ðiều khiển thích nghi
• PID
• Vị trí cực
• LQG (Linear Quadratic Gaussian)
Bộ tự chỉnh ñịnh (STR) dựa trên quan ñiểm phân tích, ñánh giá các thông
số chưa biết. Ý tưởng cơ bản ñược minh hoạ trong hình 3.10 . Các thông số
chưa biết ñược ñánh giá trực tuyến (on-line) bằng cách dùng phương pháp
ước lượng ñệ qui. Các thông số ước lượng ñược xem như là thông số thực,
ñộ không tin cậy của các ước lượng là bỏ qua. ðây gọi là qui tắc tương
ñồng nhất ñịnh (certainty equivalence principle).
Bộ tự chỉnh ñịnh
Các tham
số bộ
ñiều khiển
Tham chiếu
Bộ ñiều
khiển Quá trình
Ngõ ra
Ngõ vào
Nhiều phương pháp ước lượng khác nhau có thể ñược vận dụng như xấp xỉ
ước ñoán, bình phương tối thiểu..... Khối ‘design’ ở hình 3.10 tượng trưng
Trang 322
Chương 3 ðiều khiển thích nghi
cho bài giải trực tuyến các bài toán thiết kế hệ thống với các thông số chưa
biết trước. ðây là bài toán thiết kế cơ bản. ðiển hình cho phương pháp này
là phương pháp khác biệt cực tiểu, bình phương tuyến tính, ñặt cực, model
– following. Phương pháp thiết kế ñược lựa chọn phụ thuộc vào ñặc tính
của hệ thống vòng kín. Mục tiêu của mục này là ñưa ra quan ñiểm cơ bản
và tính chất của các bộ tự chỉnh ñịnh. Bộ tự chỉnh ñịnh ban ñầu chỉ áp dụng
cho các hệ thống lấy mẫu dữ liệu, nhưng các thuật toán liên tục và hỗn hợp
(hybrid) cũng ñược phát triển.
Trong mục này, giả sử hệ thống là SISO :
A(q)y(t) = B(q)u(t) + C(q)e(t) (3.24)
y : ñầu ra
u : ñầu vào
{e(t)} : chuỗi phân bố Gausse
A, B, C : các ña thức theo q (toán tử sai phân tới).
Giả thiết bậcA = bậcC = n và bậcA - bậcC = d0. Quá trình ñiều khiển
thường ñược mô tả ở dạng toán tử q-1. ða thức ñặc tính có dạng:
A* ( z ) = z n A( z −1 )
n = bậcA. Khi ñó mô hình (3.24) ñược mô tả như sau:
A* (q −1 ) y (t ) = B * (q −1 )u (t − d 0 ) + C * (q −1 )e(t )
Bộ tự chỉnh ñịnh dựa trên quan ñiểm ước lượng các thông số của quá trình.
Phương pháp dễ hiễu là ước lượng các thông số của hàm truyền của quá
trình và nhiễu (thuật toán thích nghi gián tiếp). Các thông số của bộ chỉnh
ñịnh sẽ không ñược cập nhật trực tiếp mà là gián tiếp thông qua ước lượng
mô hình của hệ thống. Bộ ñiều khiển thích nghi loại này dựa trên phương
pháp bình phương tối thiểu và ñiều khiển bám theo (Kalman 1958). Phương
pháp này không dựa vào ñặc tính vòng kín của hệ thống.
Các thông số của bộ chỉnh ñịnh cũng có thể ước lượng trực tiếp gọi là thuật
toán thích nghi trực tiếp. Cả 2 phương pháp trực tiếp và gián tiếp ñều gọi là
ñiều khiển tự chỉnh ñịnh.
Trang 323
Chương 3 ðiều khiển thích nghi
Xét trường hợp xác ñịnh (e(t) = 0). Nhiều phương pháp ñệ qui ñã ñề cập có
thể ñược sử dụng ñể ước lượng các thông số của A, B.
Tính hội tụ
Nếu tín hiệu ñầu vào ñược kích thích ñầy ñủ và cấu trúc của mô hình cần
ước lượng thích hợp thì các ước lượng sẽ hội tụ ñến một giá trị thực nếu hệ
thống vòng kín ổn ñịnh. ðiều kiện hội tụ cho các phương pháp khác nhau là
khác nhau.
Trong cả 2 trường hợp nhiễu xác ñịnh (e(t) = 0) và nhiễu ngẫu nhiên (e(t) ≠
không ) thì ñiều kiện hội tụ phụ thuộc tín hiệu ñầu vào, quá trình và nhiễu
của hệ thống. Tín hiệu ñiều khiển u(t) ñược phát ñi qua khâu hồi tiếp. ðiều
này làm phức tạp việc phân tích nhưng nó cần thiết ñể yêu cầu hệ thống
vòng kín phải ổn ñịnh. Trong MRAS việc phân biệt tính hội tụ sẽ ñược ñề
cập rõ hơn ở chương 6 (TLTK[1]).
Bài toán thiết kế nền tảng cho những hệ thống biết trước
Nhiều phương pháp thiết kế ñược sử dụng trong các bộ tự chỉnh ñịnh phụ
thuộc vào ñặc tính của hệ thống vòng kín. Phương pháp thiết kế thường sử
dụng là ñặt cực (pole placement). Phương pháp dựa theo mô hình mẫu
(mode – following) và phương pháp ñặt cực ñã ñược ñề cập ở phần 3.2 và
phụ lục A (TLTK[1]).
Trang 324
Chương 3 ðiều khiển thích nghi
Xét mô hình của hệ thống có phương trình (3.24) và ñáp ứng của hệ thống
vòng kín mong muốn là :
Am(q).y(t) = Bm(q).uc(t) (3.29)
Bộ ñiều khiển là:
R(q)u (t ) = T (q)u c (t ) − S (q) y (t ) (3.30)
R1 và S là giải pháp cho phương trình Diophantine
AR1 + B − S = A0 Am (3.31)
trong ñó
B = B+ B− (3.32)
Bm = B − Bm′ (3.33)
T = A0 Bm′ (3.34)
R = B + R1 (3.35)
Một vài ñiều kiện phải thoả mãn ñể chắc rằng bộ ñiều khiển là nhân quả
(causal) (xem phụ lục A TLTK[1] ). Các phương trình ở trên là cơ bản cho
nhiều bài toán thiết kế khác nhau.
Trang 325
Chương 3 ðiều khiển thích nghi
Trang 326
Chương 3 ðiều khiển thích nghi
tín hiệu ñiều khiển do việc khử zero. Dao ñộng này là kết quả của
sự chọn lựa kém trong bài toán thiết kế cơ bản chứ không phải phụ
thuộc vào bộ tự chỉnh ñịnh. Dao ñộng này có thể tránh ñược bằng
cách thay ñổi thiết kế mà không khử zero của hệ thống thực ( chẳng
hạn Bm = B).
Hình 3.13 chỉ ra kết quả khi thay ñổi thiết kế không có zero nào bị
khử. ðáp ứng của hệ thống vòng kín bây giờ ñã ñược thoả mãn.
Hình 3.11 Tín hiệu ñầu ra và tín hiệu ñiều khiển của hệ thống thực khi sử
dụng bộ tự chỉnh ñịnh gián tiếp.
Hình 3.12 Kết quả mô phỏng việc ước lượng thông số.
Trang 327
Chương 3 ðiều khiển thích nghi
Hình 3.13 Tương tự hình 3.11 nhưng với hệ thống không khử ñiểm zero.
Trang 328
Chương 3 ðiều khiển thích nghi
Hình 3.14 Ngõ ra và tín hiệu ñiều khiển của hệ thống khi sử dụng bộ tự
chỉnh ñịnh gián tiếp dựa trên ñiều khiển sai lệch cực tiểu
Hình 3.15 Hàm chi phí của hệ thống khi sử dụng bộ tự chỉnh ñịnh gián tiếp
và ñiều khiển sai lệch cực tiểu tối ưu
Trang 329
Chương 3 ðiều khiển thích nghi
Khi sử dụng bộ ñiều khiển sai lệch cực tiểu tối ưu và bộ tự chỉnh ñịnh gián
tiếp. ðường cong cho tổn hao tích luỹ của STR gần với ñường cong tối ưu.
ðiều này có nghĩa bộ tự chỉnh ñịnh gần như tối ưu ngoại trừ khoảng t quá
ñộ khi khởi ñộng.
Tóm tắt : Thuật toán tự chỉnh ñịnh gián tiếp là những ứng dụng ñơn giản
của ý tưởng tự chỉnh ñịnh. Chúng có thể ñược áp dụng tới nhiều phương
pháp thiết kế bộ ñiều khiển và ước lượng thông số. Có 3 khó khăn chính
với phương pháp này. Phân tích tính ổn ñịnh là phức tạp bởi vì các thông số
chỉnh ñịnh phụ thuộc vào các thông số ñã ước lượng. Thường thì cần phải
giải các phương trình tuyến tính trong các thông số bộ ñiều khiển. Lộ trình
từ các thông số quá trình ñến các thông số tự chỉnh có thể có các ñiểm kì dị.
ðiều này xảy ra trong các phương pháp thiết kế dựa vào phương pháp ñặt
cực, chẳng hạn, nếu mô hình ñã ước lượng có chung cực và zero. Các cực
và zero chung cần phải loại bỏ trước khi tiến hành phương pháp ñặt cực. Do
ñó việc phân tích tính ổn ñịnh chỉ thực hiện trong một số ít trường hợp. ðể
ñảm bảo các thông số hội tụ ñến các giá trị chính xác thì cấu trúc của mô
hình phải chính xác và tín hiệu ñầu vào phải kích thích liên tục.
Trang 330
Chương 3 ðiều khiển thích nghi
phương trình 3.34 , tín hiệu ñiều khiển ñược tính từ phương trình 3.30 . Lưu
ý mô hình ở phương trình 3.36 là phi tuyến trừ phi B- là hằng số.
Cách khác ñể thông số hoá là viết mô hình ở phương trình 3.36 như:
A0 Am y = Ru + Sy + R1Ce (3.37)
Trong ñó
R = B−R và
S = B−S
Chú ý ña thức R ở phương trình (3.36) là monic (ña thức có hệ số ở bậc cao
nhất bằng 1) nhưng R ở phương trình (3.37) thì không phải monic. Các ña
thức R và S có một thừa số chung tượng trưng cho các zero tắt kém. Thừa
số chung này nên khử bỏ trước khi tính toán luật ñiều khiển.
Trang 331
Chương 3 ðiều khiển thích nghi
b0
ε (t ) = [Ru (t ) + Sy (t ) − Tu c (t )] + R1C e(t )
A0 Am A0 Am
Bây giờ ta xem xét các trường hợp khác nhau. ðầu tiên giả sử e = 0. ða
thức quan sát có thể ñược chọn tự do, khi dùng mô hình liên tục theo thời
gian thì ñiều cần thiết phải giả sử b0/(A0Am) là SPR (Strictly Positive Real =
Thực dương chặt) ñể ñạt ñược một MRAS ổn ñịnh. Ta cũng cần lưu ý rằng
hàm truyền có các hệ số là số thực dương thoả ñiều kiện cần ñể ổn ñịnh
ñược gọi là PR (Positive Real). Hàm là SPR nếu nó ổn ñịnh với ñộ dự trữ ε
dương nhỏ tuỳ ý. Một ñiều kiện tương tự cũng là cần thiết cho các mô hình
rời rạc theo thời gian. Viết lại mô hình như sau:
u (t ) y (t ) u (t )
ε (t ) = b0 [ R + S − T c ]
A0 Am A0 Am A0 Am
= b0 [ R *u f (t − d 0 ) + S * y f (t − d 0 ) − T *u cf (t − d 0 )]
trong ñó
1
u f (t ) = u (t )
A (q ) Am* (q −1 )
*
0
−1
1
y f (t ) = y (t )
A (q ) Am* (q −1 )
*
0
−1
1
u cf (t ) = u c (t )
A (q ) Am* (q −1 )
*
0
−1
ðiều này tương ứng với trường hợp P = Q = A0Am ở phần 3.2 . Tính hội tụ
bây giờ sẽ phụ thuộc vào dấu của b0. ðiều này chỉ ra mối liên hệ giữa
MRAS và STR.
• Thuật toán 3.3 - Bộ tự chỉnh trực tiếp với nhiễu xác ñịnh
Dữ liệu : Cho trước giới hạn thấp nhất của thời gian trễ d0 và dấu của b0,
ñáp ứng xung hàm truyền vòng kín mong muốn b0/A*m và ña thức quan sát
mong muốn A0.
Bước 1 : Ước lượng các hệ số của ña thức R*, S*, và T* ở phương trình 3.38
dùng phương pháp ước lượng ñệ qui.
Bước 2 : Tính tín hiệu ñiều khiển từ :
R*u(t) = - S*y(t) + T*uc(t)
Trang 332
Chương 3 ðiều khiển thích nghi
• Các bộ ñiều khiển thay ñổi cực tiểu và mức trung bình di chuyển
(Minimum – Variance and Moving – average)
Các thuật toán ñiều khiến trong trường hợp nhiễu ngẫu nhiên cho hệ thống
ñược mô tả bởi phương trình 3.24 sẽ ñược xem xét. ðầu tiên giả sử mô hình
biết trước, e là một nhiễu ngẫu nhiên và uc = 0. ða thức của bộ quan sát tối
ưu cho mô hình ở phương trình 3.24 là A0 = C. Tiêu chuẩn thiết kế là thay
ñổi cực tiểu hoặc trung bình di chuyển.
Nếu quá trình là cực tiểu pha, bộ chỉnh ñịnh thay ñổi cực tiểu ñược cho bởi:
R*(q -1)u(t) = - S*(q -1)y(t) (3.39)
Trong ñó R* và S* là nghiệm có bậc cực tiểu của phương trình Diophantine
A* (q -1)R* (q -1) + q – d 0 B* (q -1)S*(q -1) = B* (q-1)C* (q -1) (3.40)
với d0 = Bậc (A) - Bậc (B). Bộ ñiều khiển thay ñổi cực tiểu tương ứng với
mô hình mong muốn với một khoảng trễ d0 bước, A*m = 1. Từ phương trình
3.40 thì R* phải chia hết cho B* :
R* = R*1.B*
Trong ñó : Bậc(R1) = d0 – 1. Phương trình 3.40 ñược viết lại :
A*R*1 + q − d 0 S* = C*
C*y(t) = A*R*1y(t) + S*y(t – d0)
= B*R*1u(t – d0) + S*y(t – d0) + R*1C*e(t)
= R*u(t – d0) + S*y(t – d0) + R*1C*e(t)
phương trình này có thể ñược viết lại :
1
y(t + d0) = *
[R*u(t) + S*y(t)] + R*1e(t + d0) (3.41)
C
Trang 333
Chương 3 ðiều khiển thích nghi
với bộ ñiều khiển ở phương trình 3.39 thì ñầu ra của hệ thống vòng kín trở
thành :
y(t) = R*1(q-1).e(t)
Ngõ ra vì vậy là một trung bình di chuyển với bậc (d0 -1). Trong Cström
(1970) chỉ ra rằng bộ chỉnh ñịnh sẽ cực tiểu sự thay ñổi ngõ ra. Một ñặc
ñiểm quan trọng là ngõ ra trở thành một trung bình di chuyển bậc (d0 – 1).
Chú ý số tự nhiên d0 ñược diễn tả như là số mẫu trôi qua ñể ñầu ra thay ñổi
khi ñầu vào thay ñổi.
Bộ ñiều khiển thay ñổi cực tiểu có hạn chế là tất cả các zero của quá trình
ñều bị khử. ðiều này có nghĩa sẽ là khó khăn nếu B có các zero bên ngoài
vòng tròn ñơn vị. Các khó khăn này sẽ tránh ñược ở bộ ñiều khiển trung
bình di chuyển. Bộ ñiều khiển này làm cho ngõ ra có bậc lớn hơn (d0 – 1).
Bộ ñiều khiến ñược ñề xuất như sau: thừa số B+ và B- trong B với B+ có các
zero tắt nhanh ( zero well – damped). Xác ñịnh R* và S* từ :
A*R* + q- d 0 B*S* = B+ *C*
Phương trình 3.41 cho ta:
1
y(t + d) = *
[R*u(t) + S*y(t)] + R*1e(t + d) (3.42)
C
Trong ñó:
R * = R1* B +
Vì ngõ ra ñược ñiều khiển là một quá trình trung bình di chuyển với bậc (d
– 1) nên chúng ta gọi là ñiều khiển trung bình di chuyển. Chú ý không có
zero nào bị khử nếu B+ * = 1, có nghĩa d = bậc (A) = n.
Cả 2 luật ñiều khiển thay ñổi cực tiểu và trung bình di chuyển dẫn ñến mô
hình tương ñương của phương trình 3.41 và 3.42 . Sự khác nhau duy nhất là
ở giá trị của d mà sẽ ñiều khiển số zero của quá trình bị khử. Với d = d0 =
Bậc(A) - Bậc(B) : tất cả zero bị khử. Với d = Bậc(A) : không có zero nào bị
khử.
Lọc với A*0 trong phương trình 3.38 cũng có thể tạo ra mô hình của phương
trình 3.42 :
A0* *
y(t + d) = [R uf(t) + S*yf(t)] + R*1e(t + d) (3.43)
C*
Nếu B+ chứa tất cả các zero ổn ñịnh của hệ thống thì nó sẽ tương ứng như
bộ ñiều khiển thay ñổi cực tiểu cận tối ưu trong Cström (1970)
Trang 334
Chương 3 ðiều khiển thích nghi
1
yf (t) = y(t)
A (q −1 )
*
0
θ T = [r0. . . rk s 0 . . .sl]
Bước 2: Tính luật ñiều khiển
R * (q −1 )u (t ) = − S * (q −1 ) y (t ) (3.45)
* *
Với R và S ñược thay bằng các ước lượng tương ứng trong bước 1.
Lặp lại các bước 1 và 2 ở mỗi chu kì lấy mẫu.
Chú ý: Thông số r 0 có thể ước lượng hoặc giả sử biết trước. Ở các trường
hợp sau ñể thuận lợi ta viết R* như sau:
R*(q -1) = r 0 (1 + r1' q − 1 + . . . + rk' q − k )
Và sử dụng
ε(t) = y(t) – r0 uf(t – d) - ϕT(t – d) θˆ (t – 1)
Trang 335
Chương 3 ðiều khiển thích nghi
1
ϕT = [r0 u (t − 1) L r0 u (t − k ) y (t ) L y (t − l )
A (q −1 )
*
0
θ T = [r1' . . . rk' s0 . . . sl ]
Tính chất tiệm cận
Mô hình ở phương trình 3.41 và 3.42 ñược diễn tả như là việc thông số hoá
lại mô hình ở phương trình 3.24 . Chúng tương ñồng với mô hình ở phương
trình 3.44 trong thuật toán 3.4 nếu A0 ñược chọn bằng C. Vector hồi qui
không tương quan với sai số và phương pháp ước lượng bình phương tối
thiểu sẽ hội tụ tới thông số thật. Một kết quả ñáng kinh ngạc là cũng tự
chỉnh ñịnh chính xác khi A0 ≠ C. Kết quả sau chỉ ra các thông số tự chỉnh
ñịnh chính xác có gía trị tương ñồng với thuật toán 3.4 khi A0 ≠ C.
Chứng minh: Mô hình của phương trình 3.44 có thể ñược viết lại:
y(k + d) = ϕT(k)θ + ε(k + d)
và luật ñiều khiển trở thành:
ϕ T (k )θˆ(k + d ) = 0
Tại một trạng thái cân bằng, các thông số ước lượng θˆ là những hằng số.
Hơn nữa, chúng thoả mãn các phương trình chuẩn, trong trường hợp này
ñược viết lại như sau:
1 t 1 t
∑ ϕ ( k ) y ( k + d ) = ∑ ϕ (k )ϕ T (k )θˆ(t + d )
t k =1 t k =1
Sử dụng luật ñiều khiển
Trang 336
Chương 3 ðiều khiển thích nghi
1 t 1 t
lim ∑ ϕ (k ) y (k + d ) = lim ∑ ϕ (k )ϕ T (k )[θˆ(t + d ) − θˆ(k + d )]
t→∞ t t→∞ t
k =1 k =1
Nếu thông số ước lượng θˆ(t ) hội tụ khi t → ∞ , và các vector hồi qui bị
giới hạn thì vế phải sẽ tiến tới zero. Phương trình 3.46 bây giờ kéo theo
A0* = 1 và xác ñịnh về sự hồi qui vector trong thuật toán 3.4
Trang 337
Chương 3 ðiều khiển thích nghi
Cωy (τ ) = ω (t + τ ) y (t )
các phương trình trên có thể ñược viết lại:
r0 r1 r2 L rk 0 L 0
0 r0 r1 r2 L rk
M O O O O O
Cωy (d + k + l )
0 L 0 r0 r1 r2 L rk
M
= 0
s0 s1 s2 L sl 0 L 0
C ( d )
ωy
0 s0 s1 s2 L sl
M O O O O O
0 L 0 s 0 s1 s 2 L s l
Cωy(τ ) = 0 τ = d, d + 1, . . . , d + k + l
Hàm tương quan thoả mãn phương trình:
F*(q -1)Cωy(τ ) = 0 τ ≥ 0
Hệ thống phương trình 3.49 có bậc
n + k = n + max(k,l)
Nếu
k+ l + 1 ≥ n + max(k, l)
hoặc tương ñương với
min(k, l) ≥ n – 1
dẫn ñến
Cωy(τ ) = 0 τ = d, d + 1,...
là ñiều cần chứng minh.
Trang 338
Chương 3 ðiều khiển thích nghi
y(t) = ϕ Tf (t − d 0 )θ
Trong thuật toán gián tiếp, các thông số ñược ước lượng bằng các thông số
của bộ chỉnh ñịnh. Phương pháp bình phương cực tiểu ñược sử dụng cho
việc ước lượng và ε(t) ñược viết lại:
ε(t) = y(t) - yˆ (t ) = y (t ) − ϕ T (t − d )θˆ
f (3.50)
0
Ví dụ 3.15 - Bộ tự chỉnh ñịnh trực tiếp với thay ñổi cực tiểu
Mô hình của quá trình ở phương trình 3.44 là :
y(t + 1) = r0 u (t ) + s 0 y (t ) + ε (t + 1)
Giả sử r0 cố ñịnh tới giá trị r̂0 = 1. Chú ý ñiều này khác với giá trị
thật là bằng 3. Thông số s0 ñược ước lượng dùng phương pháp bình phương
cực tiểu.
Trang 339
Chương 3 ðiều khiển thích nghi
Hình 3.17
Hình 3.17 biểu diễn tỉ số sˆ0 / rˆ0 , nó nhanh chóng hội tụ ñến một giá trị của
bộ ñiều khiển thay ñổi cực tiểu tối ưu thậm chí r̂0 không bằng giá trị thật
của nó.
Hình 3.18
Hình 3.18 biểu diễn hàm tổn hao khi dùng bộ tự chỉnh ñịnh và bộ ñiều
khiển thay ñổi cực tiểu tối ưu.
Trang 340
Chương 3 ðiều khiển thích nghi
không cực tiểu pha như ñược minh họa ở phần “Bộ chỉnh ñịnh trực tiếp”.
Nhiều cách khác ñể có ñiều khiển dự báo sẽ ñược ñề cập trong tài liệu, một
vài trong số này sẽ ñược thảo luận và phân tích. Cũng như ñối với các thuật
toán trước, xác ñịnh bài toán ñiều khiển cơ bản là rất quan trọng ñể hiểu rõ
các tính chất tiệm cận của thuật toán. Trước tiên ta sẽ phân tích trường hợp
các thông số là biết trước.
Thuật toán ñiều khiển dự báo dựa trên một mô hình của quá trình giả thuyết
và các tín hiệu ñiều khiển ở tương lai. ðiều này tạo ra một chuỗi các tín hiệu
ñiều khiển. Chỉ có một tín hiệu ñầu tiên là ñược áp dụng cho quá trình và
một chuỗi các tín hiệu ñiều khiển mới ñược tính toán khi thực hiện phép ño
ñạc mới. ðây gọi là bộ ñiều khiển lùi tầm (receding – horizon controller).
Dự báo ngõ ra
Ý tưởng cơ bản trong các thuật toán ñiều khiển dự báo là viết lại mô hình
quá trình ñể có ñược một biểu thức rõ ràng cho ngõ ra ở một thời ñiểm
tương lai. Xét mô hình :
A* (q -1) y(t) = B* (q -1) u(t – d0) (3.52)
* -1 * -1 –d
1 = A (q )F (q ) + q G*d(q -1) (3.53)
Trong ñó
bậc( F*d ) = d – 1
bậc( G*d) = n – 1
Chỉ số d là tầm dự báo với d bước. Giả sử d ≥ d0. Việc ñồng nhất ña thức ở
phương trình 3.52 ñược dùng ñể dự báo ngõ ra ở d bước phía trước. Vì vậy :
y(t + d) = A*F*d y(t + d) + G*d y(t) = B*F*d u(t + d – d0) + G*d y(t)
B* (q -1)F*d (q -1) = R*d (q -1) + q – (d - d 0 + 1) R *d (q -1)
Bậc(R*d) = d – d0
Bậc( R *d) = n – 2
Các hệ số của R*d là những giới hạn d – d0 + 1 ñầu tiên của ñáp ứng xung
của hệ thống vòng hở. ðiều này có thể thấy như sau:
Gd*
q - d 0 B*/A* = q - d 0 B*(F*d + q − d )
A*
Trang 341
Chương 3 ðiều khiển thích nghi
B * (q −1 )Gd* (q −1 ) – ( d d0 )
= q − d 0 Rd* (q −1 ) + q – ( d + 1) Rd* (q -1) + q +
(3.54)
A* (q −1 )
y( t + d) = Rd* (q −1 ) u(t + d – d0) + Rd* (q -1) u(t – 1) + G*d (q – 1) y(t)
= Rd* (q −1 ) u(t + d – d0) + y d (t) (3.55)
Rd* (q −1 ) u(t + d – d0) phụ thuộc vào u(t), . . . , u(t + d – d0), y d (t) là hàm
của u(t – 1), u(t – 2),... và y(t), y(t -1)....Biến y d (t) ñược hiểu như là ñiều
kiện dự báo của y(t + d) với giả sử u(t) và các tín hiệu ñiều khiển tương lai
là zero. Ngõ ra ở thời ñiểm (t + d) vì vậy phụ thuộc vào các tín hiệu ñiều
khiển tương lai ( nếu d > d0), tín hiệu ñiều khiển, các ngõ vào và ngõ ra ở
thời ñiểm trước. Cũng có thể giả sử tín hiệu ñiều khiển duy trì hằng số:
u(t) = u(t + d) = .... = u(t + d – d0) (3.56)
Cách khác ñể xác ñịnh luật ñiều khiển là mang y(t + d) ñến một giá trị mong
muốn trong khi cực tiểu mục tiêu ñiều khiển theo tầm dự báo:
t+d
∑ u (k )
k =t
2
(3.57)
Trang 342
Chương 3 ðiều khiển thích nghi
phân tới là cần thiết ñể có thể quan sát các cực ban ñầu. Phương trình 3.53
ñược viết lại theo toán tử sai phân tới như sau:
q n + d - 1 = A(q)Fd(q) + Gd(q) (3.59)
ða thức ñặc tính của hệ thống vòng kín là:
P(q) = A(q) [q n – 1Rd(1) + Rd (q) ] + Gd (q) B(q)
Bậc(P) = Bậc(A) + n - 1 = 2n – 1
Phương trình thiết kế 3.59 có thể ñược sử dụng ñể viết lại hàm P(q):
B(q)q n + d - 1 = A(q) B(q)Fd(q) + Gd (q) B(q)
= A(q)[q n -1 Rd (q) + Rd (q)] + Gd (q) B(q)
Vì vậy :
A(q) Rd (q) + Gd (q) B(q) = B(q) q n + d -1 - A(q)q n – 1Rd(q)
Cho ta :
P(q) = q n – 1A(q)Rd(1) + q n – 1[qd B(q) - A(q)Rd(q)]
Nếu hệ thống ổn ñịnh thì các số hạng phía sau của 3.54 sẽ biến mất khi
d → ∞.
Do ñó: lim P(q) = q n -1 A(q)Rd(1) nếu A(z) là một ña thức ổn ñịnh.
d →∞
Trang 343
Chương 3 ðiều khiển thích nghi
ad a d (a − 1)
u(t) = - y(t) = - y(t)
b(1 + a + ... + a d −1 ) b(a d − 1)
Phương trình ñặc tính của hệ thống vòng kín là:
a d (a − 1)
P(q) = q – a +
ad −1
có cực:
ad − a
pd = d
a −1
Vị trí của cực ñược cho bởi:
0 ≤ pd < a a ≤ 1 (hệ thống ổn ñịnh)
Ví dụ cũng cho thấy ñể việc quan sát là ñầy ñủ thì tầm dự báo phải từ 5 – 10
mẫu.
Cũng có thể tổng quát hoá kết quả ở ví dụ 3.16 cho các hệ thống bậc cao
hơn. ðối với các hệ thống thay ñổi chậm hoặc không ổn ñịnh thì ñáp ứng
vòng kín của nó sẽ rất chậm khi tăng tầm dự báo. Vì vậy giới hạn ở (3.56)
khi ñó sẽ là không hữu ích.
Trang 344
Chương 3 ðiều khiển thích nghi
∑r 2
di
µ = i =0
rdν
Sử dụng ñịnh nghĩa y d (t ) cho ta:
µu(t) = ym(t + d) - Rd* u(t – 1) - Gd* y(t)
hoặc
y m (t + d ) − Gd* y (t ) y (t + d + n − 1) − Gd (q ) y (t )
u(t) = = m (3.60)
µ + q Rd
−1 *
µq n −1 + Rd (q)
Sử dụng phương trình 3.60 và mô hình của phương trình 3.52 cho ña thức
ñặc tính vòng kín:
P(q) = A(q) [q n - 1µ + Rd (q)] + Gd(q)B(q)
Phương trình này có dạng như 3.58 với Rd(1) ñược thay bằng µ. ðiều này có
nghĩa các cực vòng kín tiến gần tới zero của q n – 1A(q) khi A(q) là ổn ñịnh
Trang 345
Chương 3 ðiều khiển thích nghi
Ở ví dụ này, bộ ñiều khiển nỗ lực cực tiểu sẽ tạo ra một hệ thống vòng kín
tốt hơn nếu ñiều khiển tương lai ñược giả sử là hằng số.
Trong ñó ∆ = 1 – q -1 là toán tử vi phân. Sự lựa chọn các giá trị khác nhau
của N1, N2, Nu sẽ ñưa ra các phương pháp khác nhau.
Phương pháp ñiều khiển dự báo tổng quát ñược minh hoạ bằng cách dùng
hàm tổn hao 3.60 và mô hình quá trình:
A*(q)y(t) = B*(q -1)u(t – d0) + e(t) / ∆ (3.62)
Trang 346
Chương 3 ðiều khiển thích nghi
Trang 347
Chương 3 ðiều khiển thích nghi
Trang 348
Chương 3 ðiều khiển thích nghi
r0 0 L 0
r
1 r0 L 0
M O M
R1 =
L r0
M M
rN − 1 rN − 2 L rN − N u
Ma trận lấy nghịch ñảo bây giờ có bậc NuxNu. Ngõ ra và các tầm ñiều khiển
ñược chọn như sau:
N1: Nếu thời gian trễ biết trước thì N1 = d0, ngược lại chọn N1 = 1.
N2: Tầm ngõ ra cực ñại N2 ñược chọn sao cho N2h có giá trị bằng với thời
gian lên của hệ thống, trong ñó h là thời gian lấy mẫu của bộ ñiều khiển.
Nu: Thường Nu = 1 sẽ có ñược kết quả tốt ñối với những hệ thống ñơn giản.
ðối với các hệ thống phức tạp, Nu ít nhất phải bằng với số cực không ổn
ñịnh hoặc số cực gây dao ñộng tắt yếu.
ðể bộ ñiều khiển dự báo tổng quát có khả năng thích nghi thì ñiều cần thiết
là phải ước lượng A* và B* ở mỗi bước thời gian. Các giá trị dự báo ứng với
các tầm dự báo khác nhau sẽ ñược tính toán và tính tín hiệu ñiều khiển ở
phương trình 3.66 . Bộ ñiều khiển dự báo thích nghi vì vậy sẽ là một thuật
toán ñiều khiển gián tiếp. Phương trình 3.64 ñược tính bằng cách ñệ qui ñể
ñơn giản khối lượng tính toán.Cuối cùng, Nu thường có giá trị nhỏ ñể ma
trận nghịch ñảo có bậc thấp.
Tín hiệu ñiều khiển ∆u(t) từ phương trình 3.66 là:
∆u = [ 1 0 . . . 0] [R1TR1 + ρ I ] – 1R1T[ym - y ]
= [α1 . . . αN] [ym - y ]
Hơn nữa, từ phương trình 3.62 , sử dụng phương trình 3.54
R1* A* ∆ d 0 − 1 *
q + G
R1 ∆u (t − 1) + G1 y (t )
* *
B*
1
y = M = M y(t)
R ∆u (t − 1) + G y (t )
RN A ∆ q d0 − 1 + G *
* * * *
N N
B *
N
Trang 349
Chương 3 ðiều khiển thích nghi
R * A* ∆ q d 0 − 1 + B * G *
1 1
A*∆ + [α1 . . . αN] M
* * d0 − 1
R N A ∆ q + B *G N*
ðồng nhất phương trình 3.63 cho ta:
B* = A*∆ B*F*d + q – dGd* B*
= A*∆[ Rd* + q – ( d - d 0 + 1) Rd* ] + q − d G d* B *
ðiều này cho ta phương trình ñặc tính:
( B * − A* ∆ R1* )q
A*∆ + [α1 . . . αN] M
( B * − A * ∆ R * ) q N
N
N
= A*∆ + ∑ α q ( B −A ∆ R
i =1
i
i * * *
i ) (3.67)
Phương trình 3.67 cho ra một biểu thức của phương trình ñặc tính vòng kín
nhưng vẫn còn khó khăn ñể ñưa ra một kết luận tổng quát về tính chất của
hệ thống vòng kín ngay cả khi quá trình ñã biết trước.
Nếu Nu = 1 thì:
ri
αi = N
ρ + ∑ r j2
j =1
Nếu ρ ñủ lớn, hệ thống vòng kín sẽ không ổn ñịnh khi hệ thống vòng hở
không ổn ñịnh. Tuy nhiên nếu cả 2 tầm ñiều khiển và tầm dự báo ñều tăng
thì bài toán sẽ tương tự như bài toán ñiều khiển LQ với tầm cố ñịnh và do
ñó nó sẽ có ñặc tính ổn ñịnh tốt hơn.
Trang 350
Chương 3 ðiều khiển thích nghi
nhau và các phương pháp thiết kế khác nhau ta sẽ có ñược các bộ tự chỉnh
với các tính chất khác nhau. Trong phần này ta chỉ ñề cập ý tưởng cơ bản và
các tính chất tiệm cận. Tính hội tụ của ước lượng và tính ổn ñịnh của hệ
thống sẽ ñược thảo luận trong chương 6 (TLTK[1]).
Khía cạnh quan trọng nhất của các bộ tự chỉnh ñịnh là ñưa ra các thông số
hoá. Một thông số hoá lại có thể ñạt ñược bằng cách sử dụng mô hình hệ
thống và ñáp ứng vòng kín mong muốn. Mục tiêu của việc thông số hoá lại
là ñể thực hiện ước lượng trực tiếp các thông số của bộ ñiều khiển sao cho
mô hình mới tuyến tính với các thông số.
Chỉ có vài thuật toán tự chỉnh ñịnh ñược ñề cập và giải quyết trong phần
này. Việc kết hợp các phương pháp ước lượng khác nhau và vấn ñề thiết kế
cơ bản sẽ tạo ra các thuật toán với các tính chất khác nhau. Mục tiêu của
phần này là ñưa ra một cảm nhận cách phát triển và phân tích các thuật toán.
Khi thực hiện một bộ tự chỉnh thì việc lựa chọn bài toán thiết kế cơ bản là
rất quan trọng. Một phương pháp thiết kế mà không phù hợp cho hệ thống
biết trước thì cũng sẽ không tốt hơn khi hệ thống chưa biết trước.
Bộ tự chỉnh ñịnh cũng có khả năng áp dụng cho các hệ thống MIMO.
Trường hợp MIMO là rất khó ñể phân tích. Khó khăn chính là xác ñịnh
ñược kiến thức ñầu tiên cần thiết trong hệ MIMO là gì.
Cũng tương ñối ñơn giản khi ñưa ra một thuật toán tự chỉnh tương ứng với
bộ tự chỉnh ñịnh trực tiếp tổng quát ở các trường hợp hạn chế khi các ma
trận tương tác của hệ thống ñã biết trước.
Trang 351
Chương 3 ðiều khiển thích nghi
của quá trình. Khái niệm này gọi là lịch trình ñộ lợi, vì mô hình ñầu tiên
ñược sử dụng chỉ ñể ñiều chỉnh ñộ lợi của quá trình.
Trang 352
Chương 3 ðiều khiển thích nghi
1
−
N (α )
G(jω)
Trang 353
Chương 3 ðiều khiển thích nghi
Bộ ñiều khiển Kc / Ku Ti / Tu Td / Tu Tp / Tu
P 0.5 1
PI 0.4 0.8 1.4
PID 0.6 0.5 0.12 0.85
Thực nghiệm:
PID
A
u y
∑ Quá trình
T
Relay
-1
Trang 354
Chương 3 ðiều khiển thích nghi
e1
e3
e2
Tp
Trang 355
Chương 3 ðiều khiển thích nghi
Các thông số
bộ ñiều khiển
Lịch trình ðiều
ñộ lợi kiện vận
Tín hiệu hành
vào
Trang 356
Chương 3 ðiều khiển thích nghi
Thật khó ñể tìm luật chung cho việc thiết kế bộ ñiều chỉnh theo lịch trình ñộ
lợi. Vấn ñề chính là việc quyết ñịnh các biến sử dụng làm biến lịch trình. Rõ
ràng các tín hiệu phụ phải phản ánh ñiều kiện vận hành của ñối tượng. Sẽ có
những trình bày lí tưởng ñơn giản cho các tham số bộ ñiều chỉnh liên quan
ñến các biến lịch trình. Vì thế cần có kiến thức tốt về hệ ñộng học của quá
trình nếu lịch trình ñộ lợi ñược sử dụng. Các khái niệm tổng quát sau có thể
phục vụ cho mục ñích này.
- Tuyến tính hoá cơ cấu dẫn ñộng phi tuyến.
- Lập trình ñộ lợi dựa vào ño ñạc các biến phụ
- Vận hành dựa vào hiệu suất
- Các phép biến ñổi phi tuyến.
Các khái niệm này ñược minh hoạ trong các ví dụ sau.
Ví dụ 3.18
Xem hệ thống với 1 valse phi tuyến.Tính phi tuyến ñược giả sử là:
v = f(u) = u4 ,u ≥0
Quá trình
yr c u v G0(s) y
∑ PI fˆ −1 f
-1
Hình (a)
ðặt fˆ −1
là hàm ngược xấp xỉ của ñặc tính valse. ðể bù cho tính phi tuyến,
ngõ ra của bộ ñiều chỉnh ñược cung cấp thông qua hàm này trước khi nó
ñược áp vào valse (xem hình (a)). ta có quan hệ : v = f(u) = f [ fˆ − 1 (c)]
Với c là ngõ ra của bộ ñiều chỉnh PI. Hàm f [ fˆ − 1 (c)] có ñộ lợi ít thay ñổi
hơn hàm f.
Nếu fˆ − 1 chính xác là hàm ngược của f thì : v = c. Giả sử f(u) = u4 ñược
xấp xỉ bởi 2 ñường thẳng: một ñường nối từ ñiểm (0 , 0) ñến ñiểm (1.3 , 3)
và ñường thẳng thứ hai nối giữa 2 ñiểm (1.3 , 3) và (2 , 16), ñược vẽ trong
hình (b) .
Trang 357
Chương 3 ðiều khiển thích nghi
v
20
15 fˆ
10
f
5
u
0
0.5 1 1.5 2
Hình (b)
yr
0.3
y
0.2
0 20 40 60 80 100
yr
1.1
0 20 40 60 80 100
yr
5.1
y
5
0 20 40 60 80 100
Hình (c)
Trang 358
Chương 3 ðiều khiển thích nghi
Khi ñó:
0.433c , 0≤c≤3
fˆ − 1 (c) =
0.0538c + 1.139 , 3 ≤ c ≤ 16
Hình (c) cho thấy sự thay ñổi của ñáp ứng quá ñộ tại 3 ñiều kiện vận hành
khác nhau khi sử dụng hàm fˆ − 1 như hình (a) . Ta thấy ñặc tuyến của hệ
thống vòng kín là rất tốt. Dùng hàm ngược fˆ − 1 trong hệ thống sẽ cho ñáp
ứng bằng phẳng hơn trong các bài toán ñiều khiển valse phi tuyến.
Ví dụ trên ñã cho thấy tính ñơn giản và tiện dụng trong việc bù cho hệ
thống phi tuyến tĩnh biết trước. Trong thực tế thường xấp xỉ hệ phi tuyến
bằng một vài ñoạn thẳng (nhiều hơn 2). Có nhiều bộ ñiều khiển vòng ñơn
thương mại sử dụng phương pháp bù này. Trong ví dụ trên không có sự ño
ñạc nào của ñiều kiện vận hành ngoài trừ việc ñiều chỉnh ngõ ra. Trong các
trường hợp khác, tính phi tuyến ñược xác ñịnh từ sự ño ñạc một vài biến số.
Dòng chảy
Mở nhanh
tuyến tính
Mở tính theo %
Vị trí
Trang 359
Chương 3 ðiều khiển thích nghi
B C
FIC
FT
LIC
LT
Trang 360
Chương 3 ðiều khiển thích nghi
So với ñiều khiển mờ không thích nghi thì ñiều khiển mờ thích nghi có
những ưu ñiểm và khuyết ñiểm sau:
Trang 361
Chương 3 ðiều khiển thích nghi
- Ưu ñiểm:
o Khả năng thích nghi tốt do nó có thể tự ñiều chỉnh ñể thích
nghi với sự thay ñổi của môi trường.
o Không cần thông tin ñầy ñủ về ñối tượng do luật thích nghi
sẽ tự học các thuộc tính ñộng của ñối tượng trong quá trình
vận hành.
- Khuyết ñiểm:
o Rất khó trong việc phân tích kết quả ñiều khiển vì tính phi
tuyến và sự thay ñổi liên tục theo thời gian của hệ thống.
o Chi phí lắp ñặt cao hơn.
ym
Mô hình tham chiếu
r u y
ðối tượng
e
Bộ ñiều khiển mờ
θ
Luật thích nghi
Hình 3.21 θ& = h(θ , e)
Trong ñó:
- Mô hình tham chiếu: xác ñịnh ñáp ứng mong ñợi của hệ thống.
- ðối tượng: chứa các thành phần thông số và cấu trúc chưa biết.
- Bộ ñiều khiển mờ: là hệ thống mờ với thông số θ ñiều chỉnh ñược.
- Luật thích nghi: dùng ñiều chỉnh thông số θ sao cho ngõ ra của ñối
tượng y(t) tiến ñến ngõ ra ym(t) của mô hình tham chiếu.
Trang 362
Chương 3 ðiều khiển thích nghi
x ( n ) = f ( x, x& , &&
x,..., x ( n−1) ) + g( x, x& , &&
x,..., x ( n −1) ).u( x ) (3.68)
y=x (3.69)
Trong ñó:
f(x) và g(x) là hai hàm mô tả ñối tượng chưa ñược xác ñịnh rõ ràng
u ∈ R là ñầu vào, y ∈ R là ñầu ra,
x = (x1,x2,…,xn)T là véctơ trạng thái (giả sử là có thể ño ñược)
ðể hệ thống ở (3.68) ñiều khiển ñược, chúng ta cần có g(x) ≠ 0.
Giả thiết g(x) > 0 và ta biết ñược chặn trên, chặn dưới của g(x):
0 < g ( x ) ≤ g ( x ) ≤ g ( x) < ∞ (3.70)
Giả thiết tốc ñộ biến thiên của g(x) bị chặn, tức là tồn tại hàm Dg(x) liên tục
sao cho g& ( x) ≤ D g ( x) . Bài toán ñặt ra là thiết kế bộ ñiều khiển hồi tiếp
trạng thái ñể lái ngõ ra y của ñối tượng bám theo quĩ ñạo mong muốn ym.
Hay nói cách khác là phải giảm tối ña sai số giữa ngõ ra ñối tượng và ngõ ra
của mô hình tham chiếu.
Do ñó ta ñặt :
e = ym − y = ym − x với e = (e, e&,..., e( n−1) )T
k = (k n , k n −1 ,..., k1 ) T
Các hệ số ki ñược chọn như sau:
∆( s) = s ( n−1) + k1 s ( n −2) + ... + k n− 2 s + k n −1 (3.71)
ða thức trên ñược gọi là ña thức Hurwitz, nghĩa là tất cả nghiệm của
phương trình ∆(s) = 0 ñều nằm bên trái mặt phẳng phức.
Ta chọn luật ñiều khiển như sau:
u∗ =
1
g ( x)
[
− f ( x) + y m( n ) + k T e ] (3.72)
Trang 363
Chương 3 ðiều khiển thích nghi
Ngoài ra, ta cũng có thể sử dụng phối hợp cả 2 cách trên. ðây gọi là phương
pháp ñiều khiển thích nghi mờ hỗn hợp.
BðK mờ
ˆ
u I = [− f ( x | θ f ) + y m( n ) + k T e] / gˆ ( x | θ g )
θf, θg
Luật thích nghi
ðiều kiện
ban ñầu θ f = −γ 1e T Pbξ
&
θf(0), θg(0) θ&g = −γ 2 e T Pbηu I
Trang 364
Chương 3 ðiều khiển thích nghi
• Thiết kế BðK mờ
Mặc dù f(x) và g(x) là các hàm chưa biết nhưng nó ñược mô tả bởi luật mờ
IF-THEN ở (3.73) và (3.74). Vì thế, ta có thể thay f(x) và g(x) bởi hệ mờ
fˆ ( x) và gˆ ( x) tuân theo luật mờ trên.
Tuy nhiên, fˆ ( x) và gˆ ( x) chỉ là phép xấp xỉ của f(x) và g(x). Do ñó ñể nâng
cao ñộ chính xác, ta phải ñể một số thông số của fˆ ( x) và gˆ ( x) tự do.
Giả sử ta chọn hai thông số θ f ∈ R f và θ g ∈ R g là tự do, ta ký hiệu như
M M
u = uI =
1
gˆ ( x | θ g )
[
− fˆ ( x | θ f ) + y m( n ) + k T e ] (3.75)
uI ñược gọi là tín hiệu ñiều khiển tương ñương chắc chắn.(do fˆ ( x)
và gˆ ( x) là các thông số tính toán ñược).
ðể xây dựng BðK (3.75) ta phải xác ñịnh fˆ ( x | θ f ) và gˆ ( x | θ g ) , ñiều này
ñược thực hiện qua 2 bước sau:
Bước 1: Với mỗi biến xi (i=1,2,…,n), ñịnh nghĩa pi tập mờ Aili ( li=1,…,pi )
và qi tập mờ Bili ( li=1,…,qi ).
Trong ñó: Fi r ( r = 1, 2, …, Lf) và Gis và Ds (s = 1, 2, … Lg ) lần lượt là các
trường hợp ñặc biệt của các tập mờ Aili , Bili .
Bước 2:
Xác ñịnh hệ mờ fˆ ( x | θ f ) từ ∏
n
i =1
pi ; luật mờ có dạng:
∏
n
Xác ñịnh hệ mờ gˆ ( x | θ g ) từ i =1
qi ; luật mờ có dạng:
∑ ...∑ y (∏
p1 pn n
l1 ...l n
f µ A ( xi ))
li
fˆ ( x | θ f
l1 =1 l n =1 i =1
)= i
(3.76)
∑ ...∑ (∏ µ
p1 pn n
l1 =1 l n =1 i =1 Al i
( xi ))
i
Trang 365
Chương 3 ðiều khiển thích nghi
∑ ...∑ y (∏
q1 qn n
l1 =1 l n =1
l1 ...l n
g i =1
µ B ( xi ))
li
gˆ ( x | θ g )= i
(3.77)
∑ ...∑ (∏ µ
q1 qn n
l1 =1 l n =1 i =1 B li
( xi ))
i
Cho y lf1 ...ln và y gl1 ...ln là các thông số tự do. Vì thế ta có thể dồn vào θf và θg ,
ta viết lại (3.76) và (3.77) như sau:
fˆ ( x | θ f ) = θ Tf ξ ( x) (3.78)
gˆ ( x | θ g ) = θ gTη ( x) (3.79)
∏ ∏
n n
Trong ñó ξ(x) lf véctơ i =1
pi chiều và η(x) là véctơ i =1
qi chiều, với
thành phần l1…ln ñược cho bởi:
∏ µ (x )
n
i =1 Aili i
ξ l ...l ( x) = (3.80)
∑ ...∑ (∏ µ
1 n p1 pn n
l1 =1 ln =1 i =1 Aili
( xi ))
∏ µ (x )
n
i =1 Bili i
η l ...l ( x) = (3.81)
∑ ...∑ (∏ µ
1 n q1 qn n
l1 =1 ln =1 i =1 Bili
( xi ))
Ta thấy các thông số θf và θg ñược chọn dựa theo luật mờ (3.73) và (3.74).
Các thông số này sẽ ñược ñạt các giá trị ban ñầu và sau ñó thay ñổi liên tục.
Trong phần kế, chúng ta sẽ thiết kế luật thích nghi cho θf và θg ñể ñạt ñược
cực tiểu hóa sai số e.
• Thiết kế luật thích nghi
Thay (3.75) vào (3.68) và sau một vài biến ñổi ta ñược:
[ f ] [
e ( n ) = − k T e + fˆ ( x |θ ) − f ( x) + gˆ ( x | θ ) − g ( x) u g ] I (3.82)
ðặt :
0 1 0 0 ... 0 0
0 0
0 1 0 ... 0 0 ...
A = ... ... ... ... ... ... ... , , b = (3.83)
0
0 0 0 0 ... 0 1
− k n − k n −1 ... ... ... ... − k1 1
Trang 366
Chương 3 ðiều khiển thích nghi
θ g∗ = arg minn n sup ˆ
g ( x | θ g ) − g ( x ) (3.86)
θ g ∈R ∏ qi
i =1
X ∈R
Trang 367
Chương 3 ðiều khiển thích nghi
Ví dụ 3.19
Làm lại ví dụ 1.8 (trang 45) ñiều khiển con lắc ngược có sử dụng phương
pháp mờ thích nghi gián tiếp và so sánh kết quả ñạt ñược. Trong ñó:
Mô hình con lắc ngược như hình 1.15
Phương trình trạng thái cho bởi (1.36) và (1.37)
Chọn k1 = 2 và k2 = 1 ñể ( s2 + k1s + k2 ) là ổn ñịnh
10 0
Chọn Q =
0 10
15 5
Giải phương trình Lyapunov ta ñược P =
5 15
Ta chọn: p1 = p2 = q1 = q2 = 5 và A1l = A2l = B1l = B2l (l = 1, 2, …5) với
x1 + π / 6 2 x1 + π / 12 2
µ A1 ( x1 ) = exp − ; µ A2 ( x1 ) = exp −
π / 24 π / 24
1 1
x1 2 x1 − π / 12 2
µ A3 ( x1 ) = exp− ; µ A4 ( x1 ) = exp −
π / 24 π / 24
1 1
x1 − π / 6 2
µ A5 ( x1 ) = exp − ; x1 ∈ [− π / 6, π / 6]
π / 24
1
Trang 368
Chương 3 ðiều khiển thích nghi
Nhận xét : Khi không có tín hiệu ñiều khiển, tức u = 0 thì gia tốc của góc
θ = x1 tương ñương f(x1,x2). Vậy ta có nhận xét:
x1 càng lớn thì f( x1, x2 ) càng lớn
Bây giờ, ta sẽ ñi xây dựng luật mờ cho f(x1,x2). Do (x1,x2) = (0,0) là ñiểm
cân bằng của hệ thống nên ta có luật ñầu tiên:
R 1f : Nếu x1 = A13 và x2 = A23 Thì f(x1,x2) ≈ 0
Từ hình vẽ mô hình con lắc ngược ta thấy gia tốc của x1 tỷ lệ với trọng lực
mgsin(x1), ta có thể chọn f(x1,x2) = α sin(x1) . Ta thấy: f(x1,x2) ñạt max khi
x1 = π / 2 nên có thể chọn α = 16. Ta ñược luật mờ cho f(x1,x2) như sau:
R 2f : Nếu x1 = A11 và x2 = A23 Thì f(x1,x2) ≈ -8
R 3f : Nếu x1 = A12 và x2 = A23 Thì f(x1,x2) ≈ -4
R 4f : Nếu x1 = A14 và x2 = A23 Thì f(x1,x2) ≈ 4
R 5f : Nếu x1 = A15 và x2 = A23 Thì f(x1,x2) ≈ 8
Những luật này sẽ ñược dùng ñể xác ñịnh giá trị ñầu θ f (0)
Luật mờ cho f(x1,x2)
-8 -4 0 4 8
-4
-8 0 4 8
-4
-8 0 4 8
-4
-8 0 4 8
-8 -4 0 4 8
Tiếp theo ta xác ñịnh luật mờ cho hàm g(x1,x2), hàm g xác ñịnh ñộ mạnh
của luật ñiều khiển u, ta có nhận xét sau:
x1 càng nhỏ thì g(x1,x2) càng lớn
Trang 369
Chương 3 ðiều khiển thích nghi
Trang 370
Chương 3 ðiều khiển thích nghi
BðK MỜ
uD = θ Tξ(x)
θ
ðiều kiện ñầu LUẬT THÍCH NGHI
θ(0) θ& = γe T p nξ ( x)
• Thiết kế BðK mờ
Hệ mờ u = uD(x|θ ) ñược thiết kế theo 2 bước sau:
+ Bước 1: Với mỗi biến xi (i=1,2,…,n) ta ñịnh nghĩa mi tập mờ Ailii
(li=1,2,…,mi) . và Pi r (r = 1,2,…,Lu) là một trường hợp ñặc biệt.
∏
n
+ Bước 2: Xây dựng hệ mờ uD(x|θ) từ i =1
mi , luật mờ có dạng:
Trang 371
Chương 3 ðiều khiển thích nghi
Sử dụng luật hợp thành tích, mờ hoá singleton, giải mờ theo phương pháp
trung bình trọng số, ta ñược:
∑ ...∑ y [∏
m1 mn n
l1 =1 l n =1
l1 ...l n
u i =1
µ A ( x i )]
li
uD (x | θ ) = i
(3.98)
∑ ...∑ [∏ µ
m1 mn n
l1 =1 l n =1 i =1 Al i
( x i )]
i
Chọn yul1 ...ln như thông số có thể chỉnh ñịnh và ta ñưa yul1 ...ln vào thành phần
của véctơ thông số θ, từ ñó luật ñiều khiển ñược xác ñịnh:
u D ( x | θ ) = θ T ξ ( x) (3.99)
Trang 372
Chương 3 ðiều khiển thích nghi
ðạo hàm (3.105) và sử dụng các biểu thức (3.104) và (3.106) ta ñược:
1 b
V& = − e T Qe + e T Pb[(θ ∗ − θ ) T ξ ( x) − w] − (θ ∗ − θ ) T θ& (3.107)
2 γ
Xem pn là cột cuối của ma trận P, từ b = (0,…,0,b)T, ta có eTPb = eTpnb.
Ta viết lại (3.107) như sau:
1 b
V& = − e T Qe + (θ ∗ − θ ) T [γe T p nξ ( x) − θ&] − e T p n bw (3.108)
2 γ
Từ (3.108) ñể thoả mãn V& < 0 ta chọn luật thích nghi như sau:
θ& = γe T p ξ (x) n (3.109)
Ví dụ 3.20:
Cho hệ thống phi tuyến bậc nhất:
1 − e − x(t )
x& (t ) = + u (t ) (*)
1 + e − x(t )
Thiết kế BðK mờ thích nghi trực tiếp ñể ñưa x(t) hội tụ về zero.
1 − e − x (t )
Khi u(t) ≡ 0 thì: x& (t ) = < 0 khi x < 0 và
1 + e − x (t )
1 − e − x (t )
x& (t ) = > 0 khi x > 0 nên hệ (*) là không ổn ñịnh.
1 + e − x (t )
Chọn γ = 1 và ñịnh nghĩa các tập mờ như sau:
Trang 373
Chương 3 ðiều khiển thích nghi
Hình 3.26 ðiều khiển mờ thích nghi trực tiếp khi không có luật mờ
Hình 3.27 ðiều khiển mờ thích nghi trực tiếp khi có luật mờ
Trang 374
Chương 3 ðiều khiển thích nghi
Nhận xét:
Theo kết quả mô phỏng thu ñược từ hai hình 3.26 và hình 3.27 ta thấy
Bộ ñiều khiển mờ thích nghi trực tiếp có thể dùng ñể ñiều chỉnh ñối
tượng trở về zero mà không cần sử dụng ñến luật mờ.
Nếu bộ ñiều khiển mờ thích nghi trực tiếp có sử dụng kèm theo luật
ñiều khiển mờ thì sẽ cho tốc ñộ hội tụ nhanh hơn nhiều.
COM
Vi xử lý PWM
ðộng cơ DC Encoder
(AT89C52)
Tốc ñộ thực y
Hình 3.28
3.3.274.3
Mô hình gồm có :
1. ðộng cơ DC 14V, tốc ñộ Max 2100vòng/phút, làm việc không tải.
2. Cảm biến tốc ñộ Incremental 200xung/vòng.
3. Vi xử lý AT89C52, tấn số xung clock 11.059MHz, chu kỳ máy
12
TVXL = ( s ) , có nhiệm vụ ño tốc ñộ ñộng cơ gửi về máy tính
11.059.000
ñiều khiển áp cấp cho ñộng cơ bằng phương pháp PWM.
4. Chu kỳ PWM = 1024 × TVXL (≈1.1ms), chu kỳ lấy mẫu
46.080×TVXL (≈50ms), tốc ñộ port nối tiếp 19200Kbps.
Trang 375
Chương 3 ðiều khiển thích nghi
ym − y
5. Hệ số thích nghi γ thay ñổi tuỳ thuộc vào sai lệch ε = . Khi
ym
sai lệch ε≥1% thì γ = γ0, khi ε<1% thì γ = γ0/10, với γ0 ñã chọn trước.
Trang 376
Chương 3 ðiều khiển thích nghi
3. Giải mờ:
Chọn thiết bị hợp thành Max – Product , phương pháp giải mờ ñộ cao.
Giá trị rõ ñầu ra PWM ñiều khiển ñộng cơ:
m1 m2
∑∑ θi, j .µ1i (x 1 ).µ 2j (x 2 )
i=1 j=1
u= (3.110)
m1 m2
∑∑ ( ) (x 2 )µ1i x 1 .µ 2j
i=1 j=1
∆θ i , j = γ .E T . p2 .ξ i , j ( x1 , x2 )
(3.111)
θ i , j (k + 1) = θ i , j (k ) + ∆θ i
Trong ñó:
θi,j : Thông số cần cập nhật ở luật hợp thành thứ (i,j).
E = (e, e&) : Véctơ sai số, với sai số e = ym – y , với ym là vận tốc ñặt.
p2 : là cột thứ 2 của ma trận P có ñược từ phương trình Ricatti (3.106).
0 1
Với A= , k1, k2 ñược chọn sao cho phương trình
k1 k 2
s2+k1s+k2=0 có nghiệm nằm bên trái mặt phẳng phức.
Các thí nghiệm trong bài ñược chọn với s = −0.1 ± j 20 .
γ>0 là hệ số cập nhật
µ1i ( x1 ).µ 2i ( x 2 )
ξ i , j ( x1 , x 2 ) = m1 m2
: hệ số xác ñịnh từ vế IF của luật hợp
∑∑ µ (x ).µ (x )
k =1 l =1
k
1 1
l
2 2
Trang 377
Chương 3 ðiều khiển thích nghi
Ghi chú : Trong các ñồ thị bên dưới, ñường liền nét là tốc ñộ mong muốn
ym ñường còn lại là tốc ñộ thực.
2π
Trường hợp 1: Chọn γ0 = 0.5; y m = 1400 + 500 sin( t ) , θi,j = 20, với
120
i = 1…m1, j = 1…m2. Các tập mờ cho bởi Hình 3.29 và Hình 3.30
Trang 378
Chương 3 ðiều khiển thích nghi
Trang 379
Chương 3 ðiều khiển thích nghi
2π
Trường hợp 2: γ0 = 0.5 ; y m = 1400 + 500 sin( t ) ( trường hợp 2a) và
30
2π
y m = 1400 + 500 sin( t ) (trường hợp 2b); θi,j = 20, với i = 1..5, j = 1..5.
60
Các tập mờ vẫn như trường hợp 1. (Xem kết quả ở Hình 3.32)
Nhận xét: Với cùng hệ số cập nhật và các giá trị ban ñầu θI,j, khi tốc ñộ
mong muốn ym biến thiên nhanh hơn thì tốc ñộ thức y không bám theo kịp
dẫn ñến sai số lớn. Do luật cập nhật phụ thuộc vào ym nên ta cần hiệu chỉnh
lại thông số γ0 cho phù hợp.
Trang 380
Chương 3 ðiều khiển thích nghi
Trang 381
Chương 3 ðiều khiển thích nghi
2π
Trường hợp 4: γ0 = 2.5; y m = 1400 + 500 sin( t ) ; θi,j ñược chọn như bảng
60
bên dưới, sử dụng 7 tập mờ cho biến tốc ñộ và 5 tập mờ cho biến gia tốc.
BIẾN NGÔN NGỮ GIA TỐC
µ 21 (x2 ) µ 22 ( x2 ) µ 23 ( x2 ) µ14 ( x1 ) µ 25 ( x 2 )
µ11 ( x1 ) 10 10 10 10 10
BIẾN µ12 (x1 ) 10 10 10 10 10
NGÔN µ13 ( x1 ) 20 20 20 20 20
NGỮ µ14 ( x1 ) 30 30 30 30 30
TỐC µ15 ( x1 ) 45 45 45 45 45
ðỘ µ16 ( x1 ) 60 60 60 60 60
µ17 ( x1 ) 80 80 80 80 80
Trang 382
Chương 3 ðiều khiển thích nghi
Fkeùo
δ
u* =
1
b
[
− f ( x) + y m( n ) + K T E ]
với: e = y m − y = y m − x = (e, e&,..., e ( n −1) ) T và k = (k n , k n −1 ,..., k1 ) T
s n + k1 s n −1 + K + k n = 0 có tất cả các nghiệm nằm bên trái trục ảo của mặt
phẳng phức.
Với luật ñiều khiển u * , các thành phần phi tuyến của ñối tượng bị triệt tiêu.
Thành phần K T E ñược ñưa vào ñể ñảm bảo sai số ngõ ra vẫn hội tụ về 0
trong trường hợp trạng thái ban ñầu của ñối tượng không làm cho ngõ ra y
bám ngay ngõ ra mong muốn y m .
Do thành phần f(x) và b chưa xác ñịnh nên luật ñiều khiển u * cho ñối tượng
ñược xem là chưa biết. Trong bộ ñiều khiển mờ thích nghi trực tiếp, một hệ
thống mờ ñược sử dụng ñể tìm ra hay xấp xỉ luật ñiều khiển mong muốn u *
chưa biết này.
Trang 384
Chương 3 ðiều khiển thích nghi
4. Thiết kế luật thích nghi (luật cập nhật, chỉnh ñịnh thông số)
Với bộ ñiều khiển mờ thích nghi trực tiếp, luật chỉnh ñịnh thông số ñể
vector thông số θ hội tụ về vector thông số lí tưởng θ* (nghĩa là uD(X, θ) hội
tụ về uD(X, θ*) là xấp xỉ của u* với sai số xấp xỉ nhỏ nhất ε), ñược xác ñịnh
theo tiêu chuẩn ổn ñịnh Lyapunov.
Xét biểu thức Lyapunov (3.104) cho hệ thống mờ thích nghi trực tiếp uD(X,
θ) dùng cho ñối tượng ñược mô tả trong phương trình sau:
1 T b *
V (E) = E PE + (θ − θ ) T (θ * − θ )
2 2γ
với:
- γ > 0 là một hằng số, ñược gọi là hệ số cập nhật hay hằng số hội tụ.
- P ∈ R n x n là ma trận thực, xác ñịnh dương thoả mãn phương trình:
ΛT P + PΛ = − Q
Trong ñó, Q ∈ R n x n là ma trận thực, dương ñược chọn trước.
Theo tiêu chuẩn ổn ñịnh Lyapunov, với V (E ) xác ñịnh dương và V& (E ) xác
ñịnh âm thì sai số E sẽ tiến về 0, hay giá trị ngõ ra y sẽ bám theo giá trị ngõ
ra y m mong muốn, khi ñó xác ñịnh ñược luật thích nghi (3.109):
θ& = γE T p nξ ( X )
m xe i
+ J e a xe = e M e − ∑ Fload (V xe )
g rW
Trong ñó:
- m xe = G0 + Gt là trọng lượng toàn bộ của ôtô, [N].
- a xe là gia tốc ôtô, [m/s2].
- V xe là vận tốc ôtô, [m/s].
- ne là tốc ñộ ñộng cơ, [rpm] (vòng/phút).
Trang 385
Chương 3 ðiều khiển thích nghi
Trang 386
Chương 3 ðiều khiển thích nghi
1 Throttle Position
Throttle Position 1
Traction Force -K- 3.6 1
s
Vehicle Velocity Vehicle Velocity
Vehicle Integrator
m/s to km/h
Power Train Model Inertia
1
0 f(u)
s
Integrator Gain Climbing Load
Lookup Table
1
Road Load
1 1/3.6 f(u)
Vehicle Velocity
Road_Load
km/h to m/s
0 1/3.6
Wind
km/h to m/s2
Power Train
Loss Torque
2 1/3.6 f(u) -K-
Vehicle Velocity
Power Train Loss
km/h to m/s Transmission 2
Trang 387
Chương 3 ðiều khiển thích nghi
Vận tốc ban ñầu của ôtô là 40km/h, ôtô sẽ ñược ñiều khiển ñạt vận tốc ổn
ñịnh 60km/h sau 20s bằng bộ ñiều khiển PID và bộ ñiều khiển mờ thích
nghi trực tiếp (DAF – Direct Adaptive Fuzzy).
Cả 2 bộ ñiều khiển ñược xây dựng với giả thiết ñã có bộ ñiều khiển ñộ mở
cánh bướm ga lí tưởng, ñiều khiển chính xác ñộ mở cánh bướm ga với thời
gian quá ñộ rất bé.
P Part
1
1 1.2 1
s
Demand Velocity Throttle Position
Integrator I Part Saturation1
2
Actual Velocity
du/dt 5
Derivative D Part
Trang 388
Chương 3 ðiều khiển thích nghi
µ11 (x 1 ) 1 1 1 1 1
µ12 (x 1 ) 15 15 15 15 15
Biến ngôn
ngữ µ13 (x 1 ) 30 30 30 30 30
ACTUAL
VELOCITY µ14 (x 1 ) 48 48 48 48 48
Bảng 3.1 Bảng luật hợp thành của bộ ñiều khiển mờ thích nghi trực tiếp
Trang 389
Chương 3 ðiều khiển thích nghi
0 1
4. Chọn ma trận Λ =
− 0.01 − 0.1
10 0
5. Chọn ma trận Q =
0 10
6. Chọn hệ số γ = 1.
Hình 3.41 5 tập mờ µ1i ( x) , i =1..5, của Hình 3.42 5 tập mờ µ 2i (x), i =
ngõ vào Actual Velocity 1..5, của ngõ vào Acceleration
100
Engine throttle position (%)
80
60
40
20
0
4
2 120
100
0 80
60
-2 40
20
-4 0
Acceleration (m/s2) Vehicle velocity (km/h)
Hình 3.43 ðặc tính làm việc của bộ ñiều khiển mờ thích nghi trực tiếp khi
mới ñược khởi tạo
Trang 390
Chương 3 ðiều khiển thích nghi
VEHICLE VELOCITY (km/h) vs. TIME (s) VEHICLE VELOCITY (km/h) vs. TIME (s)
100 100
Demand velocity Demand velocity
90 Result with DAF controller 90 Result with DAF controller
Result with PID controller Result with PID controller
80 80
70 70
V e h ic le v e lo c ity (k m /h )
V e h ic le v e lo c ity (k m /h )
60 60
50 50
40 40
30 30
20 20
10 10
0 0
0 10 20 30 40 50 60 70 80 90 100 110 120 0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s) Time (s)
Trang 391
Chương 3 ðiều khiển thích nghi
ENGINE THROTTLE POSITION (%) vs. TIME (s) ENGINE THROTTLE POSITION (%) vs. TIME (s)
110 110
Result with DAF controller Result with DAF controller
100 Result with PID controller 100
Result with PID controller
E n g in e th r o ttle p o s itio n (% ) 90 90
E n g in e th ro ttle p o s itio n (% )
80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 10
0 0
0 10 20 30 40 50 60 70 80 90 100 110 120 0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s) Time (s)
100 100
E n g in e th ro ttle p o s itio n (% )
E n g in e th r o tt le p o s itio n (% )
80 80
60 60
40 40
20 20
0 0
4 4
2 120 2 120
100 100
0 80 0 80
60 60
-2 40 -2 40
20 20
2
-4 0 2
-4 0
Acceleration (m/s ) Vehicle velocity (km/h) Acceleration (m/s ) Vehicle velocity (km/h)
Trường hợp 1 (hình 3.44) và 2 (hình 3.45), vận tốc ôtô (a), ñộ mở bướm ga
(b) và ñặc tính làm việc của bộ ñiều khiển sau khi xác lập
Hình 3.46: Vận tốc (a) và ñộ mở bướm ga (b) khi ôtô lên và xuống dốc 5° ở
trường hợp 9
Trang 392
Chương 3 ðiều khiển thích nghi
80
70
Vehicle velocity (km/h)
60
50
40
30
20
10
0
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)
Hình 3.46.a
70
60
50
40
30
20
10
0
-10
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)
Hình 3.46.b
Trang 393
Chương 3 ðiều khiển thích nghi
Nhận xét:
- Bộ ñiều khiển DAF với cấu trúc và những thông số ñược chọn thích hợp
ñã cho kết quả ñiều khiển tốt trong các trường hợp ñược khảo sát. Vận tốc
ôtô ñược ñiều khiển với sai số xác lập bằng 0, ít vọt lố, không bị dao ñộng,
hệ thống không bị mất ổn ñịnh trong quá trình ñiều khiển.
- Với cùng một bộ giá trị ban ñầu của các thông số, dù có sự thay ñổi về
tải trọng tác dụng xe, hao mòn trong hệ thống truyền ñộng hay ñộng cơ, ảnh
hưởng của gió, sự thay ñổi về ñộ dốc của mặt ñường, bộ ñiều khiển DAF
vẫn tự chỉnh ñịnh ñược các thông số và ñảm bảo chất lượng ñiều khiển tốt.
- Do luật chỉnh ñịnh thông số ñược xây dựng trên tiêu chuẩn ổn ñịnh
Lyapunov và vận tốc ôtô ñược ñiều chỉnh bám theo hàm dốc, mục tiêu ñặt
ra trong các trường hợp khảo sát này chỉ là luôn duy trì vận tốc ôtô không
ñổi ở giá trị 60 km/h; và ñảm bảo hệ thống làm việc không bị mất ổn ñịnh
hay bị trải qua những giai ñoạn mất ổn ñịnh. Những mục tiêu khác như ñộng
cơ tiêu hao ít nhiên liệu nhất, hay gia tốc ôtô phải nằm trong giới hạn cho
phép ñể ñem lại cảm giác thoải mái, êm dịu cho người ñi xe không thực hiện
ñược.
3.6.1. ðiều khiển thích nghi dựa trên mô hình ngược DFNN
Một ñối tượng bất kỳ có thể ñược ñiều khiển ñể bám theo một tín hiệu ñặt
bất kỳ bằng việc cung cấp tín hiệu ñặt này tới một bộ ñiều khiển mà ñặc tính
ñộng học của nó là nghịch ñảo của ñặc tính ñộng học ñối tượng.
Trang 394
Chương 3 ðiều khiển thích nghi
Giả sử ñối tượng cần ñiều khiển ñược mô tả bằng phương trình sai phân:
3.6.2. Quy trình ñiều khiển thích nghi với mạng DFNN
Quy trình này bao gồm 2 bước ñộc lập: nhận dạng on-line mô hình ngược
ñối tượng và ñiều khiển thích nghi ñối tượng.
ðây là quá trình chỉnh ñịnh on-line cấu trúc và thông số cho mạng DFNN
(dựa trên thuật toán ñã ñề cập trong chương 1) sao cho mạng có khả năng
mô tả ñược ñặc tính ñộng học ngược của ñối tượng cần ñiều khiển.
Muốn vậy, tín hiệu ngõ vào cung cấp cho ñối tượng phải ñủ giàu thông tin
ñể tạo tín hiệu ñáp ứng ngõ ra của ñối tượng cũng ñủ giàu thông tin. Các tập
mẫu vào – ra như vậy sẽ giúp cho quá trình nhận dạng on-line mau hội tụ về
mô hình ngược gần ñúng nhất của ñối tượng.
Sau khi ñã hoàn tất quá trình nhận dạng on-line mô hình ngược. ðể có thể
ứng dụng ñược mô hình ngược trên vào ñiều khiển thì bộ ñiều khiển phải có
Trang 395
Chương 3 ðiều khiển thích nghi
khả năng thích nghi với những thay ñổi trong ñặc tính ñộng học ngược của
ñối tượng và với nhiễu. Do ñó, bên cạnh quá trình ñiều khiển ñối tượng thì
mạng DFNN vẫn phải tiếp tục tiến hành song song quá trình tự học on-line
mô hình ngược của ñối tượng.
Về bản chất, quá trình học on-line này hoàn toàn tương tự như ở bước 1.
Tuy nhiên, do ñược thừa hưởng một cấu trúc mạng gần như hoàn chỉnh cho
việc mô tả ñặc tính ñộng học ngược của ñối tượng từ bước 1 nên trên thực
tế, quá trình chỉnh ñịnh cấu trúc mạng DFNN rất khó xảy ra ở bước 2 (trừ
khi có sự thay ñổi rất lớn trong ñặc tính ñộng học của ñối tượng dẫn ñến ñối
tượng gần như trở thành một ñối tượng mới thì quá trình chỉnh ñịnh cấu trúc
mới có khả năng xảy ra). Vì vậy, trong bước này chủ yếu chỉ xảy ra quá
trình chỉnh ñịnh thông số mệnh ñề kết luận của mạng.
Với quá trình chỉnh ñịnh thông số, mạng DFNN vẫn ñảm bảo ñược khả
năng thích nghi với những thay ñổi không quá lớn trong ñặc tính ñộng học
ngược của ñối tượng. Trong trường hợp ñối tượng thay ñổi quá lớn có thể
dẫn tới cần phải thay ñổi cấu trúc mạng thì nên tiến hành lại bước 1 ñể nhận
dạng một mô hình ngược mới hoàn toàn về ñối tượng.
Quá trình ñiều khiển thích nghi hệ ñộng bao gồm 2 giai ñoạn:
• Giai ñoạn ñiều khiển: quá trình tính toán ñược lan truyền từ tín hiệu
ñặt, qua mạng DFNN, ñến tín hiệu ngõ ra của mạng (tín hiệu ñiều khiển).
Trang 396
Chương 3 ðiều khiển thích nghi
• Giai ñoạn thích nghi: các dữ liệu ngõ vào (tín hiệu ñiều khiển) và
ngõ ra của ñối tượng ñược sử dụng ñể chỉnh ñịnh các thông số mệnh ñề kết
luận của mạng.
Chú ý:
Theo mô hình trên, mặc dù hai giai ñoạn trên ñược biểu diễn bằng hai mạng
DFNN, mỗi mạng thực hiện một chức năng riêng biệt, tuy nhiên trên thực tế
thì chỉ cần sử dụng một cấu trúc mạng DFNN nhưng tích hợp cả hai giai
ñoạn trên vào quá trình thực thi của thuật toán mạng (do trong giai ñoạn
thích nghi ñã bỏ qua quá trình chỉnh ñịnh cấu trúc mạng).
Trên thực tế, ñối với một số ñối tượng ñiều khiển phức tạp, không phải bất
cứ khâu phi tuyến nào trong ñặc tính ñộng học ngược của ñối tượng cũng có
thể nhận dạng và mô hình hóa ñược. ðiều này dẫn ñến sai số cấu trúc trong
mô hình.
Mặc khác, sai số còn xuất hiện trong mô hình do các nhiễu. Nhiễu làm
thông tin thu thập cho quá trình nhận dạng (các mẫu dữ liệu vào – ra) bị sai
lệch dẫn ñến sự không chính xác trong mô hình nhận dạng. Ngoài ra, tương
tự như bất kỳ một thuật toán chỉnh ñịnh thông số nào khác, do ñặc tính
Trang 397
Chương 3 ðiều khiển thích nghi
chỉnh ñịnh on-line nên các thông số chỉnh ñịnh trong mỗi chu kỳ lấy mẫu có
thể dao ñộng với một biên ñộ nhỏ xung quanh giá trị chính xác của nó. Sự
dao ñộng này cũng có thể dẫn ñến sai số ngõ ra mô hình. ðể khắc phục các
sai số trên, lưu ñồ ñiều khiển thích nghi cần phải ñược bổ sung một bộ ñiều
khiển phụ PD kinh ñiển (bộ ñiều khiển tỉ lệ, vi phân):
Tùy theo sai số ngõ ra mà bộ ñiều khiển phụ này sẽ bù vào tín hiệu ñiều
khiển thu ñược từ ngõ ra mạng DFNN một lượng thích hợp. Bộ ñiều khiển
phụ PD này còn có thể hỗ trợ tích cực cho quá trình ñiều khiển tại thời ñiểm
ñặc tính ñộng học của ñối tượng vừa mới thay ñổi và bộ ñiều khiển mô hình
ngược chưa kịp thích nghi với ñặc tính ñộng học mới.
Trang 398
Chương 3 ðiều khiển thích nghi
Giải pháp:
Sử dụng 2 mạng DFNN ñể nhận dạng on-line mô hình ngược từng bồn nước
Mạng DFNN nhận dạng mô hình ngược bồn 1: mạng ñiều khiển
Mạng DFNN nhận dạng mô hình ngược bồn 2: mạng dự báo
Mô hình Simulink của hệ bồn nước nối tiếp với các nhiễu ño lường ở ngõ ra
Hệ phương trình toán liên tục của hệ bồn nước nối tiếp:
Trang 399
Chương 3 ðiều khiển thích nghi
Phương trình trên có thể viết lại bằng cách sử dụng một hàm phi tuyến g{.}:
Ta thấy quan hệ giữa ngõ vào u và ngõ ra h2 là một quan hệ có trễ (trễ 1
chu kỳ lấy mẫu). Mô hình có trễ là một mô hình không tồn tại mô hình
ngược (mô hình bất khả ñảo – noninvertible model).
Vì thế, ta sẽ khắc phục bằng cách tách ñối tượng ra làm 2 bồn riêng biệt.
Khi ñó, quan hệ vào ra của mỗi bồn là một quan hệ không có trễ:
ðể nhận dạng mô hình ngược của mỗi bồn nước thì phương trình viết lại là:
Trong ñó: f 1−1 (.) và f 2−1 (.) là cấu trúc mạng DFNN nhận dạng mô hình
ngược của bồn 1 và bồn 2 tương ứng.
Trang 400
Chương 3 ðiều khiển thích nghi
Do hệ bồn chứa nước là hệ ñáp ứng tương ñối chậm nên u có thể ñược chọn
là dãy xung vuông biên ñộ ngẫu nhiên với chu kỳ ñủ lớn 0V ≤ u ≤ 12V
Lưu ñồ nhận dạng mô hình ngược hệ bồn chứa nước nối tiếp
Mô hình ngược 2 bồn ñược tiến hành nhận dạng trong ñiều kiện có nhiễu ño
lường ở cả h1 và h2 (là sự dao ñộng của mặt nước khi lấy mẫu). Chu kỳ lấy
mẫu nhận dạng là 2s, tương ứng với 1500 mẫu dữ liệu. Tiết diện các van khi
nhận dạng là a1 = 2 cm2 và a2 = 0.5 cm2. Kết quả của quá trình nhận dạng:
Trang 401
Chương 3 ðiều khiển thích nghi
Sự phát sinh nơ-ron luật và sai số ngõ ra quá trình nhận dạng
∧ ∧
Ngõ ra mạng DFNN bồn 1 ( u ) và bồn 2 ( h1 ) trong quá trình nhận dạng
Trang 402
Chương 3 ðiều khiển thích nghi
ðối với các ñối tượng có khâu trễ, tuy không ño lường trực tiếp ñược nhưng
ngõ vào có thể dự báo ñược. Mô hình ngược của bồn ñược viết lại như sau:
Khi thay các tín hiệu ngõ ra tương lai h2(k+2) và h2(k+1) bằng các tín hiệu
ngõ ra mong muốn (tín hiệu ñặt) r(k+2) và r(k+1), có thể dự báo ñược ñộ
cao mực nước bồn 2 tại thời ñiểm tiếp theo trong tương lai là:
Trang 403
Chương 3 ðiều khiển thích nghi
Bên cạnh quá trình ñiều khiển (sử dụng mô hình ngược), quá trình nhận
dạng thông số on-line của 2 mạng vẫn phải ñược tiếp tục tiến hành song
song ñể tạo khả năng thích nghi cho quá trình ñiều khiển.
Ta tiến hành khảo sát các trường hợp ñiều khiển khi thông số van thay ñổi:
ðiều khiển không thích nghi khi thông số các van thay ñổi
Khi ñiều khiển, 1000s ñầu tiên thông số 2 van vẫn giữ nguyên như bước 1
(a1 = 2 cm2 và a2 = 0.5 cm2 ). Tiết diện van thông và van xả chỉ thay ñổi ñến
Trang 404
Chương 3 ðiều khiển thích nghi
giá trị mới là a1 = 1 cm2 và a2 = 0.8 cm2 từ giây thứ 1001 ñến khi kết thúc
quá trình ñiều khiển (3000s)..
Quá trình ñiều khiển không thích nghi với tín hiệu ñặt có dạng vuông, sin
Nhận xét:
Ban ñầu, khi ñặc tính ñộng học ñối tượng không thay ñổi, ñối tượng ñược
ñiều khiển rất chính xác.Tuy nhiên, khi ñặc tính ñộng học ñối tượng bắt ñầu
thay ñổi, do không có sự thích nghi, bộ ñiều khiển ñược huấn luyện ở bước
1 tỏ ra không còn phù hợp với ñặc tính ñộng học ngược mới của ñối tượng
và quá trình ñiều khiển xuất hiện sai số ñiều khiển tương ñối lớn.
ðiều khiển thích nghi khi thông số các van thay ñổi
Quá trình ñiều khiển tương tự như trường hợp trên. Tuy nhiên, thuật toán
ñiều khiển thực thi luôn cả giai ñoạn ñiều khiển và giai ñoạn thích nghi.
Trang 405
Chương 3 ðiều khiển thích nghi
Quá trình ñiều khiển thích nghi với tín hiệu ñặt có dạng vuông, sin
Nhận xét:
Bộ ñiều khiển thích nghi mô hình ngược có thể ñiều khiển chính xác ñối
tượng ngay cả khi thông số ñối tượng thay ñổi và với mọi dạng tín hiệu ñặt.
Tại thời ñiểm ñặc tính ñộng học ñối tượng thay ñổi, sai số ñiều khiển có thể
tương ñối lớn do quá trình huấn luyện chưa kịp thích nghi. Tuy nhiên, chỉ
sau một thời gian ngắn huấn luyện on-line, bộ ñiều khiển mô hình ngược ñã
có thể thích nghi ñược với ñặc tính ñộng học ngược mới của ñối tượng.
Ta sẽ xem xét sự ảnh hưởng của bộ ñiều khiển phụ PD trong cả 2 quá trình:
ñiều khiển thích nghi và ñiều khiển không thích nghi.
Quá trình ñiều khiển thích nghi có và không có bộ ñiều khiển phụ PD
Trang 406
Chương 3 ðiều khiển thích nghi
Quá trình ñiều khiển không thích nghi có và không có bộ ñiều khiển phụ PD
Nhận xét:
Trong cả 2 trường hợp, ta thấy khi không có bộ ñiều khiển phụ PD hỗ trợ,
quá trình thích nghi tỏ ra chậm hơn. Thật ra, tốc ñộ thích nghi là như nhau.
Tuy nhiên, khi bộ ñiều khiển mô hình ngược chưa kịp thích nghi với ñặc
tính ñộng học mới thì bộ ñiều khiển phụ PD ñã hỗ trợ rất nhiều trong việc
ñiều khiển ñối tượng, hạn chế phần lớn sai số ñiều khiển.
Như vậy, bộ ñiều khiển phụ PD ñã giúp cho việc ổn ñịnh hóa và nâng cao
chất lượng ñiều khiển của hệ thống.
Trang 407
Chương 3 ðiều khiển thích nghi
Trang 408
Chương 3 ðiều khiển thích nghi
x1 = y
x2 = x&1 = y&
Sao cho hệ kín có hàm truyền là:
1
Gk (s) =
1 + 3s
11. Ứng dụng Matlab mô phỏng ví dụ 3.9 và ví dụ 3.10 dùng lý thuyết ổn
ñịnh Lyapunov.
12. Bộ tự chỉnh ñịnh STR gián tiếp.
13. Ứng dụng Matlab mô phỏng ví dụ 3.13: Bộ tự chỉnh ñịnh gián tiếp với
nhiễu xác ñịnh.
14. Dùng Matlab mô phỏng ví dụ 3.14: Bộ tự chỉnh ñịnh gián tiếp với nhiễu
ngẫu nhiên.
15. Bộ tự chỉnh ñịnh STR trực tiếp.
16. ðiều khiển dự báo thích nghi.
17. So sánh giữa MRAS và STR.
28. Chỉnh ñịnh tự ñộng.
19. Lịch trình ñộ lợi.
20. Dùng Matlab mô phỏng ví dụ 3.11 ñể kiểm ñịnh lại kết quả hình 3.19.
21. Ứng dụng Matlab mô phỏng ví dụ 3.12: Tay máy hai khớp nối
22. Dùng Matlab mô phỏng ví dụ 3.19: Bộ ñiều khiển mờ thích nghi gián
tiếp cho hệ con lắc ngược.
23. Dùng Matlab mô phỏng ví dụ 3.20: Bộ ñiều khiển mờ thích nghi trực
tiếp.
24. Cho quá trình ñược mô tả bởi:
50
G ( s) =
s(s + 4)
Và có chỉ tiêu chất lượng như sau:
∫ (( y − u ) )
∞
2
c + ρ u2 dt
0
Trang 409
Chương 3 ðiều khiển thích nghi
Hay
s0 p + s1
u(t ) = − ( y − uc )
p + r1
Sử dụng phương pháp gradients tối ưu hóa một cách chính xác các thông số
của hệ thống từ mô hình ước lượng quá trình.
25. Cho quá trình ñược mô tả bởi:
x& = A(θ ) x + B(θ )uc
y = C (θ ) x
Và mô hình kèm theo là:
x& m = Am xm + Bm uc
y m = Cm x m
Giả sử rằng: bậc của quá trình và bậc của mô hình kèm theo là giống nhau.
Và tất cả các trạng thái ñều ổn ñịnh.
(a) Tìm ñiều kiện ñể có thể ñạt ñược các trạng thái trong mô hình hoàn
hảo kèm theo.
(ñặt e = x – xm )
(b) Sử dụng lý thuyết Lyapunov ñể ñạt ñược cơ cấu chỉnh ñịnh ổn ñịnh
(xác ñịnh A& (θ ) và B& (θ ) )
(Gợi ý:
Sử dụng hàm Lyapunov sau:
V = eT Pe + tr ( A − Am )T Qa ( A − Am ) + tr (Bm − B)T Qb ( Bm − B)
Trong ñó:
e = x − xm ).
Trang 410
Chương 4 : ðiều khiển bền vững
Chương 4
Cho tập mô hình có sai số P∆ và một tập các chỉ tiêu chất lượng, giả sử
P0 ∈ P∆ là mô hình danh ñịnh dùng ñể thiết kế bộ ñiều khiển K.Hệ thống
hồi tiếp vòng kín ñược gọi là có tính :
- Ổn ñịnh danh ñịnh: nếu K ổn ñịnh nội với mô hình danh ñịnh P0
- Ổn ñịnh bền vững: nếu K ổn ñịnh nội với mọi mô hình thuộc P∆
- Chất lượng danh ñịnh: nếu các mục tiêu chất lượng ñược thỏa ñối với mô
hình danh ñịnh P0
Trang 411
Chương 4 : ðiều khiển bền vững
- Chất lượng bền vững: nếu các mục tiêu chất lượng ñược thỏa ñối với mọi
mô hình thuộc P∆
Mục tiêu bài toán ổn ñịnh bền vững là tìm bộ ñiều khiển không chỉ ổn ñịnh
mô hình danh ñịnh P0 mà còn ổn ñịnh một tập các mô hình có sai số P∆
4.1.2 Chuẩn của tín hiệu
4.1.2.1 Khái niệm chuẩn
Trong ñiều khiển nói riêng cũng như trong các công việc có liên quan ñến
tín hiệu nói chung,thông thường ta không làm việc chỉ riêng với một tín hiệu
hoặc một vài tín hiệu ñiển hình mà ngược lại phải làm việc với một tập gồm
rất nhiều các tín hiệu khác nhau. Khi phải làm việc với nhiều tín hiệu khác
nhau như vậy chắc chắn ta sẽ gặp bài toán so sánh các tín hiệu ñể chọn lọc
ra ñược những tín hiệu phù hợp cho công việc.
Các khái niệm như tín hiệu x1(t) tốt hơn tín hiệu x2(t) chỉ thực sự có nghĩa
nếu như chúng cùng ñược chiếu theo một tiêu chuẩn so sánh nào ñó. Cũng
như vậy nếu ta khẳng ñịnh rằng x1(t) lớn hơn x2(t) thì phải chỉ rõ phép so
sánh lớn hơn ñó ñược hiểu theo nghĩa nào, x1(t) có giá trị cực ñại lớn hơn ,
có năng lượng lớn hơn hay x1(t) chứa nhiều thông tin hơn x2(t)…..Nói một
cách khác ,trước khi so sánh x1(t) với x2(t) chúng ta phải gắn cho mỗi một
tín hiệu một giá trị ñánh giá tín hiệu theo tiêu chuẩn so sánh ñược lựa chọn .
ðịnh nghĩa: Cho một tín hiệu x(t) và một ánh xạ x(t) →||x(t)|| ∈ R+ chuyển
x(t) thành một số thực dương ||x(t)||.Số thực dương này sẽ ñược gọi là chuẩn
của x(t) nếu nó thỏa mãn:
a. ||x(t)|| ≥ 0 và ||x(t)|| = 0 khi và chỉ khi x(t) =0 (4.1)
b. ||x(t)+y(t)|| ≤ ||x(t)|| + ||y(t)|| ∀ x(t), y(t) (4.2)
c. ||ax(t)|| = |a|.||x(t)|| ∀ x(t) và ∀a ∈ R . (4.3)
4.1.2.2 Một số chuẩn thường dùng trong ñiều khiển cho một tín hiệu x(t):
∞
- Chuẩn bậc 1: || x(t ) ||1 = ∫ | x(t ) |dt (4.4)
−∞
∫ | x(t ) |
2
- Chuẩn bậc 2: || x(t ) || 2 = dt . (4.5)
−∞
Trang 412
Chương 4 : ðiều khiển bền vững
Bình phương chuẩn bậc hai chính là giá trị ño năng lượng của tín hiệu x(t).
∞
-Chuẩn bậc p: || x(t ) || p = ∫ | x(t ) | với p ∈ N (4.6)
p
p dt
−∞
∑x
2
x 2
= i (4.9)
i =1
Trang 413
Chương 4 : ðiều khiển bền vững
ðịnh lí 4.1: (Parseval) Chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier
X(j ω ) của nó có quan hệ :
∞ ∞
1
|| x(t ) || 22 = ∫ | x(t ) |2 dt = ∫ | X ( jω ) |
2
dω (4.11)
−∞
2π −∞
Cho tín hiệu nhân quả causal x(t). Gọi X(s) là ảnh Laplace của nó .Giả sử
rằng X(s) có dạng thực -hữu tỷ với bậc của ña thức tử số không lớn hơn bậc
ña thức mẫu số ,tức là:
B( s ) b0 + b1 s + ..... + bm s m
X (s) = = với m < n (4.12)
A( s ) a0 + a1 s + ..... + an s n
ðịnh lí 4.2: Xét tín hiệu nhân quả causal x(t) có X(s) dạng (4.12) .ðể chuẩn
bậc 1 của x(t) là một số hữu hạn ||x(t)||1= K < ∞ thì ñiều kiện cần và ñủ là tất
cả các ñiểm cực của X(s) phải nằm bên trái trục ảo (có phần thực âm) .
4.1.3 ðại số ma trận
4.1.3.1 Một số ma trận thường gặp:
- Một ma trận A=(aij) có số hàng bằng số cột ñược gọi là ma trận vuông.
ðường chéo nối các phần tử aii trong ma trận vuông ñược gọi là ñường chéo
chính .ðường chéo còn lại ñược gọi là ñường chéo phụ.
a11 a12 L a1n
a a22 L a2 n
A=
21
(4.13)
M M M M
an1 a n 2 L ann
- Một ma trận vuông A=(aij) có aij = 0 khi i ≠ j ,tức là các phần tử không
nằm trên ñường chéo chính ñều bằng 0, ñược gọi là ma trận ñường chéo. Ma
trận ñường chéo ñược ký hiệu bởi:
a11 0 L 0
0 a 22 L 0
A= = diag(aij) (4.14)
M M M M
0 0 L ann
Trang 414
Chương 4 : ðiều khiển bền vững
1 0 L 0
0 1 L 0
- Ma trận ñường chéo I = diag(1) = gọi là ma trận ñơn vị.
M M M M
0 0 L 1
- Ma trận vuông A=(aij) có aij = 0 khi i > j (hoặc i < j) ñược gọi là ma trận
tam giác
+ Ma trận tam giác dưới
a11 0 L 0
a a 22 L 0
A= 21 (4.15)
M M M M
an1 an 2 L a nn
Trang 415
Chương 4 : ðiều khiển bền vững
Một ma trận vuông A ∈ R n×n ñược gọi là ma trận trực giao nếu ATA=AAT=I
4.1.3.3 Hạng của ma trận:
Cho n vector vi i=1,2,…,n Chúng sẽ ñược gọi là ñộc lập tuyến tính nếu ñẳng
thức a1v1+a2v2+…….+anvn=0 trong ñó ai là những số thực (hoặc phức) sẽ
ñúng khi và chỉ khi a1 = a2 = …..=an = 0
Xét một ma trận A=(aij) bất kì có m hàng và n cột .Nếu trong số m vector
hàng có nhiều nhất p ≤ m vector ñộc lập tuyến tính và trong số n vector cột
có nhiều nhất q ≤ n vector ñộc lập tuyến tính thì hạng ma trận ñươc hiểu là:
Rank(A) = min{p,q}
Một ma trận vuông A kiểu (n × n) sẽ ñược gọi là không suy biến nếu
Rank(A)=n .Ngược lại nếu Rank(A) <n thì A ñược nói là ma trận suy biến
Hạng ma trận có các tính chất sau:
- Rank(A) = min{p,q} (4.17)
- Rank(AB) ≤ rank(A) và rank(AB) ≤ rank(B) (4.18)
- Rank(A + B) ≤ rank(A) + rank(B) (4.19)
- Nếu B không suy biến thì rank(AB) = rank(B) (4.20)
4.1.3.4 Ma trận nghịch ñảo:
Cho ma trận A=(aij),i=1,2,…,m ; j=1,2,…,n,trong ñó aij là những số thực
(hoặc phức),nói cách khác A ∈ Rm × n(hoặc A ∈ Cm × n ).Nếu tồn tại một ma
trận B thỏa mãn :
AB = BA = I (ma trận ñơn vị) (4.21)
Thì ma trận B ñược gọi là ma trận nghịch ñảo của A và ký hiệu là B = A-1.
Trang 416
Chương 4 : ðiều khiển bền vững
Do phải tồn tại cả hai phép nhân AA-1 và A-1A cho ra kết quả có cùng kiểu
nên ma trận A phải là một ma trận vuông,tức là phải có m = n.Hơn nữa do
det(I) = 1 ≠ 0 nên:
det(A)det(A-1) ≠ 0 => det(A) ≠ 0 và det(A-1) ≠ 0. (4.22)
Vậy A phải là ma trận không suy biến.
Ma trận nghịch ñảo A-1 của A có tính chất sau:
- Ma trận nghịch ñảo A-1 của A là duy nhất (4.23)
- Tập hợp tất cả các ma trận vuông cùng kiểu và không suy biến cùng với
phép nhân ma trận tạo thành một nhóm (không giao hoán). (4.24)
a b 1 d − b
- Nghịch ñảo ma trận kiểu (2 × 2): A −1 = = (4.25)
c d det( A) − c a
- (AB)-1 = B-1A-1 (4.26)
- (A-1)T = (AT)-1 (4.27)
1
- Nếu A = diag(ai) và không suy biến thì A-1 = diag (4.28)
ai
Aadj
- A-1 = (4.29)
det( A)
trong ñó Aadj là ma trận có các phần tử a i j = (-1)i+jdet(Aij) với Aij là ma trận
thu ñược từ A bằng cách bỏ ñi hàng thứ j và như cột thứ i.
- Cho ma trận A ∈ Rn × n không suy biến . Nếu U ∈ Rn × m và V ∈ Rn × m là
hai ma trận làm cho (I+VTA-1U) cũng không suy biến thì
(A+UVT)-1 = A-1 – A-1U(I+VTA-1U)-1VTA-1 (4.30)
A1 A2
- Cho ma trận vuông A = không suy biến,trong ñó A1,A2,A3,A4
A3 A4
cũng là các ma trận.
Nếu A1 không suy biến và B = A4 – A3A1-1A2 cũng không suy biến thì
−1
A A2 A1 −1 + A −11 A2 B −1 A3 A1 −1 − A1 A2 B −1
−1
A = 1
−1
= (4.31)
A3 A4 − B −1 A3 A1
−1
B −1
Trang 417
Chương 4 : ðiều khiển bền vững
Nếu A4 không suy biến và C = A1 – A2A4-1A3 cũng không suy biến thì
−1
A A2 C −1 − C −1 A2 A4
−1
A = 1
−1
= −1
(4.32)
A3 A4 −1
− A4 A3 AC
−1 −1 −1
A4 + A4 A3 C −1 A2 A3
4.1.3.5 Vết của ma trận:
Cho ma trận vuông A=(aij) ,i,j=1,2,……,n kiểu (nxn).Vết của A ñược hiểu
là tổng giá trị các phần tử trên ñường chéo chính của A và ñược ký hiệu
bằng trace(A):
m
trace= ∑ aii (4.33)
i =1
Trang 418
Chương 4 : ðiều khiển bền vững
∂ ∂
F(X )= F ( X ) (4.41)
∂X ∂xij
Cho A và B là những ma trận phức với không gian tương thích .Một số công
thức ñạo hàm :
∂
Trace ( AXB ) = AT B T (4.42)
∂X
∂
Trace ( X k
) = k(X k −1 T
) (4.43)
∂X
∂
Trace ( XBX T ) = 2 XB (B = BT ) (4.44)
∂X
∂
( X T AX ) = AX + A T X (4.45)
∂X
∂
Trace ( AX T B ) = BA (4.46)
∂X
4.1.3.8 Chuẩn của ma trận:
Người ta cần ñến chuẩn của ma trận là nhằm phục vụ việc khảo sát tính giải
tích của nó.Có nhiều chuẩn khác nhau cho một ma trận A=(aij)
,i=1,2,…,m;j=1,2,…,n.
Những chuẩn thông thường ñược sử dụng:
- Chuẩn 1 của ma trận A
m
A 1 = max ∑ aij (4.47)
1≤ j ≤ n
i =1
A 2 = max λi ( A* A) (4.48)
1≤i ≤ n
Trang 419
Chương 4 : ðiều khiển bền vững
n
A ∞ = max ∑ aij (4.49)
1≤i ≤ m
j =1
σ i ( A) = λi ( A* A) i = 1,2,...k (4.51)
với k = min{m, l} .
Nếu chúng ta biểu diễn ma trận A dưới dạng A(s) và ñặt s = jω
(0 ≤ ω < ∞) , thì trị suy biến của A( jω ) là một hàm của ω và ñược gọi là
ñộ lợi chính của A(s). Ở ñây chúng ta giả sử rằng σ i ñược sắp xếp theo thứ
tự sao cho σ i ≥ σ i +1 . Như vậy, σ 1 là trị suy biến lớn nhất và σ k là trị suy
biến nhỏ nhất. Ký hiệu σ là trị suy biến lớn nhất và σ là trị suy biến nhỏ
nhất.
Ta có:
σ ( A) = max σ i ( A) = max λi ( A* A)
= A2 (4.52)
Ax 2
với A 2 = sup .
x 2
ðộ lợi của hệ ña biến nằm giữa ñộ lợi chính lớn nhất và nhỏ nhất.
Trong Matlab tìm trị suy biến của ma trận A dùng lệnh svd(A)
Ví dụ: Cho ma trận A:
Trang 420
Chương 4 : ðiều khiển bền vững
9 4
>> A = 6 8 ;
2 7
>> S =svd(A)
S=
[14.9359
5.1883]
S: vector của các giá trị suy biến của ma trận A
121 98
A* A =
98 129
λ2 − 250λ + 6005 = 0
λ1, 2 = +125 ± 98.082
σ ( A) = 26.918 = 5.1883
Ý nghĩa vật lý của σ , σ : với mọi giá trị tần số ω giá trị suy biến nhỏ nhất
phải thỏa ñiều kiện của tiêu chuẩn tối ưu LQ: σ [ I + KG ( jω )] ≥ 1
Im
1 Re
0 ω=∞ ω =0
σ [1 + KG ( jω )]
Trang 421
Chương 4 : ðiều khiển bền vững
Im
1 Re
0 ω =∞ ω =0
PM
σ [1 + KG ( jω )]
Im
1 1 Re
1
0 60
σ [1 + KG ( jω )]
Trang 422
Chương 4 : ðiều khiển bền vững
+ e1
w1 G
+
+
K + w2
e2
ðịnh nghĩa :
Hệ hồi tiếp hình 4.2 ñược gọi là ổn ñịnh nội nếu tất cả các hàm truyền ñạt từ
w1, w2 ñến e1, e2 ñều ổn ñịnh.
ðiều kiện ổn ñịnh nội chặt hơn ñiều kiện ổn ñịnh dựa trên hàm truyền vào-
ra thông thường, vì nó tránh việc khử các cực và zero không ổn ñịnh giữa
các khâu liên tiếp nhau. Khi thành lập hàm truyền vào-ra, có thể xảy ra hiện
tượng khử cực và zero không ổn ñịnh của các khâu liên tiếp nhau. Như vậy,
ñiều kiện ổn ñịnh nội bảo ñảm các tín hiệu bên trong hệ thống ñều hữu hạn
khi tín hiệu vào là hữu hạn.
Ví dụ, ta khảo sát ñiều kiện ổn ñịnh nội của hệ thống hình 4.2:
Trang 423
Chương 4 : ðiều khiển bền vững
e ( I − KG ) −1 ( I − KG ) −1 K w1
Suy ra: 1 = −1 −1
e2 ( I − GK ) G ( I − GK ) w2
ðiều kiện ổn ñịnh nội của hệ là các hàm truyền ( I − KG )−1 , ( I − KG )−1 K ,
r u y
G
-
Trang 424
Chương 4 : ðiều khiển bền vững
v w
∆
c. M ∞
= σ ( M ( jω )) < 1 ∀ω (4.56)
4.1.7.2 ðiều kiện ổn ñịnh bền vững ñối với sai số cộng:
Với ∆ A ( s ) = δ A ( s )∆( s ), σ (∆( jω )) ≤ 1 ∀ω , (4.57)
v w
∆
M
δA
+
K G
-
Trang 425
Chương 4 : ðiều khiển bền vững
hay
v( s ) = −[ I + K ( s )G ( s )]−1 K ( s )δ A ( s ) w( s ) (4.59)
vậy
K ( s )δ A ( s )
M ( s) = − (4.60)
[ I + K ( s )G ( s )]
Kết luận: Hệ thống vòng kín hình 4.5 ổn ñịnh bền vững khi và chỉ khi:
K ( s )δ A ( s )
σ ( jω ) =||M(s)||∞= <1 (4.61)
[ I + K ( s )G ( s )] ∞
4.1.7.3 ðiều kiện ổn ñịnh bền vững ñối với sai số nhân ở ñầu ra
v w
∆
M
δ0
+
K G
-
Trang 426
Chương 4 : ðiều khiển bền vững
vậy
G ( s ) K ( s )δ O ( s )
M =− (4.65)
I + G( s) K ( s)
Kết luận: Hệ thống vòng kín hình 4.6 ổn ñịnh bền vững khi và chỉ khi:
G ( s ) K ( s )δ O ( s )
<1 (4.66)
I + G(s) K (s) ∞
Ngõ ra y là ngõ ra hồi tiếp và ño ñược. Ngõ ra z là ñiều khiển ñược. Tín
hiệu nhiễu w là nhiễu hệ thống và v là nhiễu ño .
Tín hiệu v và w là những quá trình nhiễu trắng .Trạng thái ban ñầu của x(0)
ñược giả sử là một vector ngẫu nhiên .
Biến trạng thái x(t)∈ Rn, ngõ ra ño ñược y(t) ∈ Rp và ngõ ra ñiều khiển ñược
z(t) ∈ Rm là những quá trình ngẫu nhiên. Biểu thức sai số toàn phương:
z T (t )Qz (t ) + u T (t ) Ru (t ) t≥0 (4.68)
là nhỏ.
Trang 427
Chương 4 : ðiều khiển bền vững
ðây là vấn ñề ñiều khiển tuyến tính nhiễu loạn. Khoảng thời gian [0 T] là
xác ñịnh nhưng thật sự chúng ta xem xét trường hợp T → ∞ . Tại bất kỳ thời
gian t toàn bộ tín hiệu ño ñược ở quá khứ ñược giả sử có giá trị cho hồi
tiếp. Hình (4.7) làm rõ trường hợp này :
z
u
SYSTEM
+
+ y
v
CONTROLLER
Trang 428
Chương 4 : ðiều khiển bền vững
ngõ ra yˆ (t ) = Cxˆ (t ) .Thành phần thêm vào L [ y (t ) − Cxˆ (t )] cung cấp một sự
ñiều chỉnh chủ ñộng ngay khi sai số của sự quan sát là khác 0.
u z
SYSTEM
y
+
L
-
ŷ
SYSTEM
MODEL x̂
Hình (4.8) cho thấy cấu trúc của bộ quan sát .ðịnh nghĩa :
~
x (t ) = x(t ) − xˆ (t ) (4.72)
là sai số ước lượng trạng thái. Phương trình vi phân của ~
x nhận ñược sau
khi trừ (4.70) cho (4.71) :
x&% (t ) = ( A − LC ) x% (t ) t ∈ R (4.73)
Nếu hệ thống (4.70) ñược tìm thấy thì tồn tại ma trận ñộ lợi L mà sai số hệ
thống (4.73) là ổn ñịnh. Nếu sai số hệ thống là ổn ñịnh thì
x (t ) → 0 khi t → ∞ cho bất kỳ sai số ~
~ x (0). Vì vậy
xˆ (t ) t
→∞
→ x(t ) (4.74)
Trạng thái ước lượng hội tụ về trạng thái thực.
Trong Matlab dùng hai lệnh acker và place ñể tính ma trận L của khâu
quan sát trạng thái :
L= acker(AT,CT,p)
L= place(AT,CT,p)
AT : Chuyển vị của ma trận A
CT : Chuyển vị của ma trận C
p : Khai báo các ñiểm cực mong muốn
Trang 429
Chương 4 : ðiều khiển bền vững
w(t) v(t)
u x& x y
B ∫ C
A Hệ thống
~
y
L
-
x&ˆ x̂ ŷ
B ∫ C
A Bộ lọc Kalman
Trang 430
Chương 4 : ðiều khiển bền vững
Giá trị trung bình hay mong muốn của z ñược xác ñịnh như sau:
∞
E{z}= ∫ ξ ƒ z ( ξ )d ξ (4.80)
−∞
Trang 431
Chương 4 : ðiều khiển bền vững
ñược minh họa ở hình 4.10 .Vì vậy những vector ngẫu nhiên lấy giá trị gần
với z có xác suất lớn nhất và xác suất sẽ giảm khi lấy giá trị xa z .Nhiều
biến ngẫu nhiên là Gaussian.
Nếu vector ngẫu nhiên là một hàm của thời gian ñược gọi là một quá trình
ngẫu nhiên ñược tượng trưng là z(t). Khi ñó PDF có thể thay ñổi theo thời
gian và chúng ta viết là ƒ z ( ξ ,t). ðiều ñó có thể tưởng tượng rằng PDF ở
hình 4.10 thay ñổi theo thời gian. Trong tình huống này, giá trị mong ñợi và
ma trận hiệp phương sai là những hàm thời gian vì thế chúng có thể biểu
diễn z (t) và P z (t).
fz( ξ )
Trang 432
Chương 4 : ðiều khiển bền vững
Nhiều quá trình ngẫu nhiên z(t) quan trọng có PDF bất biến theo thời gian
ðó là những quá trình tĩnh, thậm chí chúng là hàm thời gian ngẫu nhiên vẫn
có trị trung bình và hiệp phương sai là hằng số.
ðặc trưng cho liên hệ giữa hai quá trình ngẫu nhiên z(t) và x(t), có thể sử
dụng PDF kết hợp ƒ zx (ς , ξ , t1 , t 2 ) , tượng trưng cho xác xuất mà (z(t1), x(t2))
ở trong vùng vi phân d ς × d ξ ở giữa ( ς , ξ ). Giả sử rằng các quá trình z(t)
và x(t) là liên kết tĩnh , PDF kết hợp không là hàm của cả hai thời gian t 1 và
t 2 nhưng nó chỉ dựa vào sai biệt (t 1 - t 2 ).
Trong nhiều trường hợp tĩnh, giá trị mong muốn của hàm hai biến g(z,x)
ñược xác ñịnh bởi:
+∞
E {g ( z (t1 ), x(t 2 )) }= ∫ g( ς , ξ )ƒ zx ( ς , ξ ,t 1 - t 2 )d ς d ξ (4.84)
−∞
Do ñó, ma trận tương quan chéo của hai quá trình không tĩnh mà ñược xác
ñịnh bởi
{
R zx (t, τ )=E z (t ) x T (τ )} (4.86)
Xem như z(t 1 ) và z(t 2 ) như là hai quá trình ngẫu nhiên của quá trình tĩnh,
hàm tự tương quan z(t) ñược xác ñịnh như sau:
{
R z ( τ )=E z (t + τ ) z T (t ) } (4.87)
Hàm tự tương quan ñem ñến cho ta vài thông tin quan trọng về quá trình
ngẫu nhiên z(t). Thí dụ như :
[{ }]
trace [R z (0)] =trace E z (t ) z T (t ) =E { z (t ) } (4.88)
tương ñương với tổng năng lượng của quá trình z(t).
Nếu
R zx (τ ) = 0 (4.89)
Trang 433
Chương 4 : ðiều khiển bền vững
Giả sử x(0) có thể ñược thay thế bằng các ñại lượng biết trước x 0 (giá trị
trung bình của x(0)) và hiệp phương sai P 0 , có thể biểu diễn như sau :
x (0) ≈ (x 0 ,P 0 ) (4.91)
Như vậy không thể giả sử w(t) và v(t) có trị trung bình bằng 0 ñược. Giả sử
rằng nhiễu quá trình và nhiễu ño là nhiễu trắng, do vậy:
{ }
R w ( τ )=E w(t + τ ) wT (t ) = Wδ (τ ) (4.92)
Rv ( τ )=E {v(t + τ )v (t )} = Vδ (τ )
T
(4.93)
Ma trận mật ñộ phổ W và V sẽ ñược giả sử ñã biết trước.Theo tính chất của
hàm tự tương quan, W và V là bán xác ñịnh dương. Giả sử thêm rằng V là
không suy biến.Tóm lại, có thể giả sử rằng :
w(t) ≈ (0,W), W≥0 (4.94)
v(t) ≈ (0,V), V>0 (4.95)
Việc giả sử w(t) và v(t) là nhiễu trắng trong một vài ứng dụng có thể là xấu.
Thí dụ như nhiễu ở tần số thấp. Tuy nhiên, giả sử rằng w(t) không là nhiễu
trắng, có thể xác ñịnh ñược một hệ thống:
Trang 434
Chương 4 : ðiều khiển bền vững
.
x& 0 =A w x w +B w n (4.96)
w=C w x w +D w n (4.97)
có nhiễu trắng ngõ vào là n(t) và ngõ ra là w(t). Chúng ñược gọi là các bộ
lọc nắn nhiễu . Những ñặc tính ñộng này có thể kết hợp với phương trình
của ñối tượng (4.75), (4.76) ñể có ñược ñặc tính ñộng ñược hiệu chỉnh là:
x& A γC w x B γDw
x& = 0 A x + 0 u + B n (4.98)
w w w w
y= [C 0] x + v (4.99)
x w
Hệ thống ñiều chỉnh này có nhiễu quá trình n(t) là nhiễu trắng. Một thủ tục
tương tự có thể làm theo các bước như thế nếu v(t) không phải là nhiễu
trắng. Do ñó, có thể mô tả một hệ thống với nhiễu không phải nhiễu trắng
dưới dạng một hệ thống ñiều chỉnh với nhiễu quá trình và nhiễu ño lường là
nhiễu trắng.
Xác ñịnh hệ thống (4.96), (4.97) miêu tả nhiễu không phải là nhiễu trắng
w(t) (hoặc v(t)) dựa trên phân tích mật ñộ phổ của nhiễu w(t). Chi tiết xem
Lewis (1986 )
Bây giờ thiết kế bộ ước lượng cho hệ thống (4.75), (4.76) dưới những giả sử
ñã ñược liệt kê. Cho bộ quan sát có dạng như sau:
xˆ& = Axˆ + Bu + L( y − yˆ ) (4.100)
Trang 435
Chương 4 : ðiều khiển bền vững
≡A0 ~
x + γ w-Lv (4.104)
chú ý rằng sai số hệ thống xảy ra khi có sự tham gia của nhiễu quá trình và
nhiễu ño lường . Ngõ ra của sai số hệ thống có thể ñược cho bởi ỹ=y- ŷ ñể:
ỹ=C ~x (4.105)
Hiệp phương sai của sai số ñược cho bởi:
P(t)=E ~
x~
{ }xT (4.106)
thay ñổi theo thời gian. Do ñó, ~ x (t) là quá trình ngẫu nhiên không tĩnh.
Hiệp phương sai của sai số là thước ño sự không chắc chắn trong ước lượng.
Những giá trị càng nhỏ cho P(t) ñồng nghĩa với việc ước luợng càng tốt hơn
vì những sai số ñược phân bố càng gần với trị trung bình bằng 0 nếu P(t) là
nhỏ hơn.
Nếu bộ quan sát là ổn ñịnh tiệm cận và w(t) và v(t) là quá trình tĩnh khi ñó
sai số ~
x (t) sẽ thực sự tiến ñến trạng thái ổn ñịnh với trị trung bình và hiệp
phương sai là hằng số. ðộ lợi L sẽ ñược chọn lựa ñể làm tối thiểu hiệp
phương sai cũa sai số P. Vì vậy, ñộ lợi tối ưu L sẽ là ma trận hằng của ñộ lợi
bộ quan sát
Trước khi xác ñịnh ñộ lợi tối ưu L, chúng ta sẽ tính toán giá trị trung bình và
hiệp phương sai của sai số ước lượng của ~ x (t). Sử dụng (4.104) và sự tuyến
tính của phép toán mong muốn:
{}
E ~x& = A E{~
0 x } + γE{w} − LE{v} (4.107)
d
Vì thế E {~
x }=A 0 E{~
x} (4.108)
dt
Do ñó, E {~
x }là lượng biến ñổi theo thời gian tuân theo phương trình vi phân
với ma trận hệ thống A .Nếu A =A-LC là ổn ñịnh thì E {~
0 0 x }luôn bền vững
tại giá tri tĩnh zero. Khi ñó
E{~x } = E{x}− E{xˆ} = E{x}− xˆ (4.109)
Theo trừơng hợp này ước lượng x̂ (t) tiến tới E{x(t)} .Như vậy ước lượng
này ñược cho là không lệch. Cũng như theo (4.109), giá trị trung bình của
Trang 436
Chương 4 : ðiều khiển bền vững
sai số ban ñầu ~ x (0) bằng với giá trị zero nếu như bộ quan sát (4.101) có giá
trị ñầu x̂ (0)= x0 với x 0 là giá trị trung bình của x(0)
Nếu như nhiễu quá trình w(t) hoặc nhiễu ño ñược v(t) có giá trị trung bình
không phải là zero thì theo (4.107) giá trị E {~ x } của trạng thái tĩnh cũng
không bằng zero. Trong trường hợp này x̂ (t) không ñến ñược ổn ñịnh tiệm
cận ñể ñạt ñược trạng thái thật x(t), nhưng có ñược một khoảng offset bằng
giá trị hằng- E {~
x }. Khi ñó trạng thái ước lượng là bị lệch.
ðể xác ñịnh P, chú ý rằng lời giải phương trình (4.104) ñược cho :
t t
x(t)=e A0 J x(0)- ∫ e A0 (t −τ ) Lv(τ )dτ + ∫ e A0 (t −τ )γ w(τ )dτ (4.110)
0 0
Tìm ma trận tương quan chéo R v~x (t,t) và R w~x (t,t) sử dụng (4.110) và giả sử
rằng x(0) (và cả ~
x (0)), w(t) và v(t) là trực giao. Do ñó
Chú ý rằng
R v (t, τ ) =V δ (t − τ ) (4.112)
Nhưng tích phân (4.111) có giá trị giới hạn trên là t. Xung ñơn vị có thể
ñược biểu hiện như sau
1 t
δ (t ) = lim Π( ) (4.113)
T →0 T T
ở ñây hàm xung vuông:
T
1 t 1, t <
Π( ) = 2 (4.114)
T T 0 , o th e r w is e
ñược ñặt tại trung tâm t = 0.
Vì vậy, ta chỉ xét một nửa vùng δ (t − τ ) tại bên trái τ =t. Do ñó từ (4.111)
ñược suy ra:
1
R v~x (t , t ) = − VLT (4.115)
2
Trang 437
Chương 4 : ðiều khiển bền vững
Tương tự,
R w~x (t , t ) = E w(t ) ~
{ }
x T (t )
t
{ }
= ∫ E w(t ) wT (τ ) γ T e A0 ( t −τ ) dτ
T
hoặc
0
1
R w~x (t , t ) = Wγ T (4.116)
2
Phương trình ñạo hàm cho P(t)=E ~
x~xT { }
& d~
x ~T ~ d~
xT
P (t)=E x = E x (4.117)
dt dt
Theo (4.104) , (4.115) và (4.116) ta có :
d~
x T 1 1
E ~ x = ( A − LC ) P + LVLT + γWγ T (4.118)
dt 2 2
dx% T 1 1
E x% = P( A − LC ) + LVL + γ W γ (4.119)
T T T
dt 2 2
Từ (4.118) và (4.119)
P& = A0 P + PA0T + LVLT + γWγ T (4.120)
Cho bất kì L ñể (A-LC) là ổn ñịnh ,chúng ta giải (4.120) tìm P(t) sử dụng
ñiều kiện ñầu là P(0) = P0 với P0 là hiệp phương sai của trạng thái ñầu mà
nó tượng trưng cho tính không chắc chắn trong ước lượng ñầu xˆ (0) = x0
Thực sự những ñộ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số ~ x (t)
càng gần với trị trung bình bằng 0.Do ñó P(t) là thước ño chất lượng của bộ
quan sát và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn
Chúng ta nói rằng P là thước ño sự không chắc chắn trong ước lượng .
P(t) tiến tới giá trị trạng thái bền vững P khi t → ∞ ngay khi A0 là ổn ñịnh
tiệm cận.Tại trạng thái bền vững thì P& = 0 , (4.120) trở thành phương trình
ñại số
0= A0 P + PA0T + LVLT + γWγ T (4.121)
Trang 438
Chương 4 : ðiều khiển bền vững
Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác ñịnh
dương ñược xác ñịnh từ (4.121). ðể ñộ lợi của bộ quan sát là hằng số, có thể
chọn lựa L ñể làm tối thiểu hoá hiệp phương sai của sai số P trạng thái bền
vững.
Ta có chỉ tiêu chất lượng (PI = Performance Index)
1
J= trace( P) (4.122)
2
Do ñó nếu P nhỏ thì J sẽ nhỏ. ðể chọn L sao cho J ñạt ñược tối thiểu phải
thỏa mãn phương trình (4.121), xác ñịnh hàm Hamiltonian
1 1
H= trace( P) + trace( gS ) (4.123)
2 2
Trong ñó
g =A 0 P+PA T0 +LVL T + γ W γ T
(4.124)
Trang 439
Chương 4 : ðiều khiển bền vững
Giả sử (C,A) là có thể quan sát ñược và (A, γ W ) là có thể tìm ñược .Khi
ñó ARE tìm ñược ma trận xác ñịnh dương duy nhất P .Hơn nữa,sai số hệ
thống (4.104) sử dụng ñộ lợi kalman cho bởi (4.128) với P là ma trận xác
ñịnh dương duy nhất của ARE là ổn ñịnh tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa
vời so với thực tế.
Tóm lại:
Mô hình hệ thống: x& = Ax + Bu (4.132)
y=Cx (4.133)
x(0)~(x 0 ,P 0 ) , w(t) ~(0,W), v(t) ~(0,V)
w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0)
Giá trị ñầu
x̂ (0)= x 0 (4.134)
Trang 440
Chương 4 : ðiều khiển bền vững
Trang 441
Chương 4 : ðiều khiển bền vững
Trang 442
Chương 4 : ðiều khiển bền vững
4.2.5 Ví dụ:
Mô hình con lắc ngược (xem ví dụ 1.8 ở chương 1)
Chúng ta sẽ viết chương trình mô phỏng ñặc tính ñộng của ñối tượng
Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến, ñể có thể ñiều khiển hệ
con lắc ngược bằng phương pháp LQG chúng ta cần tuyến tính hóa mô hình
hệ thống. Giả sử góc θ nhỏ ñể có thể xấp xỉ sin θ bằng 0,cos θ bằng 1 và
•2
cũng giả sử θ nhỏ ñể θ θ ≈ 0 .Với các ñiều kiện trên,chúng ta có thể tuyến
tình hoá các phương trình phi tuyến:
•• ••
( M + m) x + ml θ = u
•• ••
m x + ml θ = mgθ
x1 = θ
•
x 2 = θ
ðặt các biến trạng thái: (4.144)
x3 = x
•
x 4 = x
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái
như sau:
•
x1 = x 2
• M +m 1
x 2 = gx1 − u
Ml Ml
• (4.145)
x 3 = x4
x• = − m gx + 1 u
4 Ml
1
M
Viết lại dưới dạng ma trận
o 0 1 0 0 0
x1 M + m x1 1
• g 0 0 0 −
x 2 = Ml x 2 + Ml u (4.146)
• 0 0 0 1 x 3 0
x3
• − m g x4 1
x 4 M 0 0 0 M
Trang 443
Chương 4 : ðiều khiển bền vững
Thiết kế LQG:
Lọc Kalman:
- Bộ quan sát:
Nếu không có ñường phản hồi qua L thì ~ x không tiệm cận về x ñược vì
vậy L ñược chọn sao cho ~ x x
Bộ quan sát ñược thiết kế theo giả thuyết
Giả sử ta có hệ thống:
•
x = Ax + Bu + γω ω ,ν : nhiễu (4.150)
y = Cx + ν
Trang 444
Chương 4 : ðiều khiển bền vững
{ }
E ν .ω T = 0 ⇒ ν , ω ñộc lập nhau
Bộ quan sát có phương trình trạng thái:
x&ˆ = Axˆ + Bu + L( y − yˆ )
(4.151)
yˆ = Cxˆ
u •
x = Α x + Bu + γω
y
y = Cx + Du + v
- +
+
B
+ ∫ C
+ ∧
y
~
x = x − xˆ ⇒ ~x& = A~
x + γω − L(Cx + ν − Cxˆ )
⇒~ x& = A~x + γω − L(C~x −ν ) (4.152)
⇒~
x& = ( A − LC ) ~
x + γω − Lν
Lọc Kalman ñược xây dựng trên cơ sở:xác ñịnh L sao cho kỳ vọng toán
{ }
E x T x cực tiểu.
⇒ L = PC T V −1 (4.153)
Trong ñó P là nghiệm của phương trình Riccati
PAT + AP + γ W γ T − PC T V −1CP = 0
W = E{ω .ω T } (4.154)
V = E{v.vT }
Trang 445
Chương 4 : ðiều khiển bền vững
•
u x = Ax + Bu + γω y
y = Cx
-
- +
B
+
∫ C
+ -
+
Kc
ðiều khiển LQG là kết hợp ñiều khiển LQR với lọc Kalman .
Bước 1:Thiết kế ñiều khiển LQR=>KC
Bước 2:Thiết kế bộ lọc Kalman =>L
Biên ñộ của ma trận hàm truyền toàn phương H(jω) tại bất kỳ một tần số
jω nào, phụ thuộc vào hướng tín hiệu kích thích ñầu vào.Biên ñộ của ma
Trang 446
Chương 4 : ðiều khiển bền vững
trận hàm truyền H( jω ) ñược bao phía trên bởi giá trị suy biến cực ñại, kí
hiệu σ ( H ( jω )) , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu
σ ( H ( jω )) . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này.
Hình 4.14 Biểu ðồ Bode Biên ñộ hệ MIMO của giá trị suy biến
trong miền tần số
Trang 447
Chương 4 : ðiều khiển bền vững
Ví dụ:
ðể minh họa sự khác biệt giữa ñồ thị trị suy biến hệ MIMO và giản ñồ
Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là
ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống
vòng hở 2 ngõ vào/2 ngõ ra là:
14.8
H 11 ( s ) =
s ( s + 0.0163)( s + 3.615)( s + 20.2)
− 36.9s ( s + 2.237)[(s + 0.55) 2 + 2.49 2 ]
H 12 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[(s + 0.4225) 2 + 3.063 2 ]
− 2.65s ( s + 2.573)( s − 2.283)
H 21 ( s ) =
s ( s + 0.0163)( s + 3.615)( s + 20.2)[(s + 0.4225) 2 + 3.063 2 ]
− 0.79[(s + 0.139) 2 + 0.446 2 ]
H 22 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[( s + 0.4225) 2 + 3.063 2 ]
Trang 448
Chương 4 : ðiều khiển bền vững
vững ñựơc ñưa ra trong hệ thống hệ MIMO dưới dạng giá trị trị suy biến
cực tiểu là lớn tại tần số thấp ( cho chất lượng bền vững) và giá trị trị suy
biến cực ñại là nhỏ tại tần số cao (cho ổn ñịnh bền vững ). Sự không tương
thích giữa hai ñồ thị 4.15 và 4.16 chỉ ra rằng ñường bao ñặc tính tần số của
hệ MIMO không có thể hòan tòan mô tả ñúng những biểu ñồ Bode của hệ
SISO riêng biệt.
e u uG
r + G + y
K̂
-
+
n
Hình 4.17: Sơ ñồ hệ thống hồi tiếp âm
Trang 449
Chương 4 : ðiều khiển bền vững
Lưu ý: ðể liên hệ với phần lý thuyết ñiều khiển kinh ñiển, trong mục này ta
phân tích sơ ñồ ñiều khiển hồi tiếp âm, với bộ ñiều khiển là K̂ ( K̂ = -K ở mô
hình hồi tiếp dương)
Các quan hệ truyền ñạt của hệ thống vòng kín ñược thể hiện qua các biểu
thức sau:
GKˆ GKˆ G 1
y= r− n+ di + d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
Kˆ Kˆ GKˆ Kˆ
u= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
Kˆ Kˆ 1 Kˆ
uG = r− n+ di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
1 1 G 1
e= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
ðịnh nghĩa các hàm nhạy, hàm bù nhạy và ñộ lợi vòng như sau:
1
- Hàm nhạy : S =
1 + GKˆ
GKˆ
- Hàm bù nhạy : T =
1 + GKˆ
y = Tr − Tn + GSdi + Sd (4.156)
u = Kˆ Sr − Kˆ Sn − Td i − Kˆ Sd (4.157)
ˆ − KSn
uG = KSr ˆ + Sd − KSd
ˆ (4.158)
i
e = Sr − Sn − GSd i − Sd (4.159)
Trang 450
Chương 4 : ðiều khiển bền vững
Từ (4.156) – (4.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống
vòng kín.Từ phương trình (4.156) ta thấy rằng:
- ðể giảm ảnh hưởng của nhiễu ñầu ra d lên ñầu ra y, hàm nhạy S cần phải
nhỏ.
- ðể giảm ảnh hưởng của nhiễu ño n lên ñầu ra y, hàm bù nhạy T cần phải
nhỏ. Tương tự, từ phương trình (4.158), ñể làm giảm ảnh hưởng của nhiễu
ñầu vào di, hàm nhạy S cần phải nhỏ.
Nhưng từ ñịnh nghĩa ,hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như
sau:
S+T=1 (4.160)
Do ñó, S và T không thể ñồng thời nhỏ. ðể giải quyết mâu thuẫn này,
người ta dựa vào ñặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập
trung chủ yếu ở vùng tần số thấp, còn nhiễu ño n tập trung chủ yếu ở vùng
tần số cao.
Như vậy, ñể hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ trong
vùng tần số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, ñiều kiện
ñể hệ ít nhạy ñối với nhiễu di là |S| và | Kˆ S | nhỏ trong vùng tần số mà di tập
trung, cụ thể là vùng tần số thấp.
Ta có:
Suy ra:
1 1 1
≤ ≤ , nếu | GKˆ |>1
| GK | +1 1 + GKˆ
ˆ ˆ
| GK | −1
hay:
1 1
≤ S ≤ ,nếu L >1
L +1 L −1
Từ ñó, ta thấy:
Trang 451
Chương 4 : ðiều khiển bền vững
S <<1 ⇔ L >>1
G 1
GS = ≈
1 + GKˆ | Kˆ |
Kˆ 1
| Kˆ S | = ≈
1 + GKˆ G
Trang 452
Chương 4 : ðiều khiển bền vững
không có nghiệm ở nửa phải mặt phẳng phức. Ta thấy rằng, ñiều này sẽ
ñược thỏa nếu như ∆T ñủ nhỏ, hay |T| phải nhỏ ở vùng tần số mà ∆ tập
trung, cụ thể là vùng tần số cao.
ðể ý rằng, nếu |L| rất lớn thì |T| ≈ 1 và |S| ≈ 0. Do ñó, từ (4.156) ta thấy
nếu như L( jω ) lớn ở trong một dải tần số rộng, thì nhiễu ño n cũng sẽ
truyền qua hệ thống trong vùng tần số ñó, nghĩa là:
y= Tr − Tn + GSd i + Sd ≈ (r - n)
vì rằng nhiễu ño n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu ñộ lợi
vòng lớn ở ngoài vùng băng thông của G, nghĩa là L( jω ) >>1 trong khi
G ( jω ) <<1, thì có thể làm cho tín hiệu ñiều khiển quá lớn, gây bão hòa ở
cơ cấu chấp hành. ðiều này có thể ñược lý giải từ (4.157) như sau:
1
u= Kˆ S (r − n − d ) − Td i ≈ (r − n − d ) − d i
|G|
Phương trình trên cho thấy nhiễu tải và nhiễu ño sẽ ñược khuyếch ñại lên
khi mà vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông của
1
G, vì ñối với dải tần số mà G ( jω ) <<1 thì >>1.
G ( jω )
Tương tự, biên ñộ của bộ ñiều khiển, | K̂ |, không ñược quá lớn trong vùng
tần số mà ñộ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ
khi ñộ lợi vòng nhỏ ( L( jω ) <<1), thì
u= Kˆ S (r − n − d ) − Ti d i = Kˆ (r − n − d )
Do ñó, một ñiều cần lưu ý khi thiết kế là | K̂ | không ñược lớn quá khi ñộ lợi
vòng nhỏ.
Từ những ñiều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau ñây:
- ðể ñảm bảo mục tiêu chất lượng trong một vùng tần số nào ñó, cụ thể là
vùng tần số thấp (0, ω l ), hệ thống cần phải có:
Trang 453
Chương 4 : ðiều khiển bền vững
- ðể ñảm bảo tính bền vững và có khả năng triệt nhiễu ño tốt trong một
vùng tần số nào ñó, cụ thể là vùng tần số cao ( ω h , ∞ ),hệ thống cần phải có :
| GKˆ |<< 1 , | Kˆ |≤ M
trong ñó M có trị số không quá lớn.
Những ý tưởng thiết kế này ñược minh họa trong hình 4.18. Những tần số
ω l , ω h ñược xác ñịnh tùy thuộc vào từng ứng dụng cụ thể, và những thông
tin về ñặc tính của nhiễu tải, nhiễu ño, sai lệch mô hình.
Hình 4.18: ðộ lợi vòng và các ràng buộc tần số thấp và tần số cao.
Những ñiều phân tích trên ñây là cơ sở cho một kỹ thuật thiết kế ñiều khiển:
ñó là thủ tục thiết kế nắn dạng vòng (LSDP_Loop Shaping Design
Proceduce). Mục tiêu nắn dạng vòng là tìm ra một bộ ñiều khiển sao cho ñộ
lợi vòng |L| tránh ñược các vùng giới hạn (xem hình 4.18) chỉ ñịnh bởi các
ñiều kiện về chất lượng và bền vững.
Trang 454
Chương 4 : ðiều khiển bền vững
- là hàm giải tích (phân tích ñược thành chuỗi lũy thừa), và
- bị chặn, tức tồn tại giá trị M dương nào ñó ñể G ( s) ≤ M có phần thực
dương.
Tập con ñặc biệt của H∞ mà trong ñiều khiển bền vững rất ñược quan tâm là
tập hợp gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H∞, tức là các
hàm hữu tỷ phức G(s)∈ H∞ với các hệ số là những số thực dạng
b0 + b1 s + L + bm s m
G (s) =
1 + a1 s + L + an s n
trong ñó ai,bj ∈ R, ký hiệu là RH∞.
Trong lý thuyết hàm phức, người ta chỉ ra ñược rằng: một hàm thực – hữu tỷ
G(s) bất kỳ sẽ thuộc RH∞ khi và chỉ khi
- lim G ( s) < ∞ , hay G (∞) bị chặn (khi m≤n),ñược gọi là hàm hợp thức và
s →∞
- G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác
G(s) không có ñiểm cực với Re(s) ≥ 0.Một hàm G(s) có tính chất như vậy
gọi là hàm bền.
Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng
phức bị chặn khi s → ∞ mà còn thỏa mãn (khi m<n)
lim | G ( s ) |= 0
s →∞
Chuẩn H∞ của một hệ thống SISO G(s) ∈ RH∞ ñược ñịnh nghĩa như sau:
G ∞
= sup { G ( jω ) } (4.161)
ω
Trang 455
Chương 4 : ðiều khiển bền vững
ðịnh nghĩa 1:
Các ma trận hàm truyền ñạt N% , M
% ∈ RH∞ tạo thành một phân tích coprime
bên trái của G nếu và chỉ nếu:
% vuông, và det( M
a. M % )≠0 (4.162)
b. G = M% −1 N% (4.163)
c.∃ V, U ∈ RH∞ sao cho: % + NU
MV % =I (4.164)
ðịnh nghĩa 2:
Nếu N% , M
% là phân tích coprime bên trái của G ñồng thời thỏa:
% ∗ + MM
NN % ∗=I (4.165)
thì ñược gọi là phân tích coprime bên trái chuẩn.
Một ñối tượng G có thể có vô số phân tích coprime bên trái, nhưng chỉ có
một phân tích coprime bên trái chuẩn
Xác ñịnh phân tích coprime bên trái chuẩn
Phân tích coprime bên trái chuẩn có thể ñược xác ñịnh từ mô hình trạng thái
của G và nghiệm của phương trình Riccati. Giả sử A, B, C, D là mô hình
trạng thái của G, ký hiệu là:
A B
G= (4.166)
C D
trong ñó: G ( s ) = C ( sI − A) −1 B + D . ðể xác ñịnh phân tích coprime bên trái,
trước tiên ta cần phải tìm nghiệm của phương trình Riccati sau:
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0
(4.167)
*
trong ñó R ≡ I + DD . Phương trình này có tên là Phương trình Riccati lọc
tổng quát (GFARE – Generalized Filter Algebraic Riccati Equation). Sau ñó
áp dụng ñịnh lí 3.3 ñể tính N% , M % .
A B
ðịnh lý 4.3: Cho G = . Phân tích coprime bên trái chuẩn của G
C D
ñược xác ñịnh như sau:
Trang 456
Chương 4 : ðiều khiển bền vững
A + HC B + HD A + HC H
N% = −1 2 % = −1 2 (4.168)
R −1 2
−1 2 ; M
R C R D R C
trong ñó Z là nghiệm xác ñịnh dương duy nhất của GFARE, R = I + DD∗ ,
và H = −( ZC ∗ + BD∗ ) R −1 .
Sai số mô hình phân tích coprime bên trái
Sau ñây, ta ñịnh nghĩa sai số mô hình phân tích coprime bên trái. Giả sử G
là mô hình ñối tượng, ( N% , M
% ) là một phân tích coprime bên trái của G. Hệ
có sai số mô hình phân tích coprime bên trái chuẩn ñược ñịnh nghĩa như
sau:
G∆ = ( M% + ∆ M ) −1 ( N% + ∆ N ) (4.169)
trong ñó ∆N, ∆M ∈ RH∞ là các hàm truyền chưa biết thể hiện phần sai số
trong mô hình danh ñịnh. Họ mô hình có sai số là một tập Gε ñịnh nghĩa
như sau:
{
% + ∆ )−1 ( N% + ∆ ) :
Gε = ( M M N [∆M , ∆N ] ∞
<ε } (4.170)
∆N ∆M
+ -
N% % −1
M
+ +
Hình 4.19: Biểu diễn sai số mô hình phân tích coprime bên trái
Mục tiêu của ñiều khiển bền vững là tìm bộ ñiều khiển K ổn ñịnh hóa không
chỉ mô hình danh ñịnh G, mà cả họ mô hình Gε .
Ưu ñiểm của cách biểu diễn sai số mô hình trên ñây so với biểu diễn sai số
cộng và sai số nhân là số cực không ổn ñịnh có thể thay ñổi do tác ñộng của
sai số mô hình
Trang 457
Chương 4 : ðiều khiển bền vững
∆N ∆M
+
u +
w N% % −1
M
+ +
+
K + d
y
Hình 4.20: Sơ ñồ phân tích ổn ñịnh bền vững với mô hình có sai số LCF
ðịnh lý 4.4:
K % −1
b. ( I − GK ) −1 M ≤γ (4.171)
I ∞
ðịnh lý 4.4 có thể phát biểu một cách tương ñương dưới dạng một bài toán
tối ưu như sau:
ðịnh lý 4.5:
Trang 458
Chương 4 : ðiều khiển bền vững
K % −1
inf ( I − GK ) −1 M ≤γ (4.172)
K I
∞
trong ñó infimum ñược thực hiện trong tất cả các bộ ñiều khiển K ổn ñịnh
hóa G.
trong ñó ( N% , M
% ) là phân tích coprime bên trái của G. Và theo ñịnh lý 4.4,
nếu tìm ñược bộ ñiều khiển K, thì K sẽ ổn ñịnh hóa ñối tượng có sai số G∆,
với ∆ = [ ∆ M ∆ N ] ∞ < 1 γ .
Nếu phát biểu dưới dạng một bài toán tối ưu H∞ (ñối với hệ thống hình 4.20)
thì ta có bài toán tối ưu H∞ như sau:
Bài toán tối ưu H∞
Tìm bộ ñiều khiển K (nếu tồn tại) ổn ñịnh hóa ñối tượng danh ñịnh G và
cực tiểu hóa chuẩn H∞ sau ñây:
K −1 % −1
I ( I − GK ) M (4.174)
∞
trong ñó ( N% , M
% ) là phân tích coprime bên trái của G.
Bài toán tối ưu H∞ phức tạp ở chỗ phải thực hiện cực tiểu hóa chuẩn (4.174)
trong ñiều kiện tồn tại bộ ñiều khiển K ổn ñịnh hóa hệ thống. ðể giải quyết
vấn ñề này, thông thường người ta giải bài toán ổn ñịnh bền vững với một
giá trị γ cho trước, rồi sau ñó thực hiện quá trình lặp γ ñể tìm giá trị γmin.
Glover và McFarlane ñã sử dụng bài toán mở rộng Nehari (Nehari
extension problem), và dạng phân tích coprime chuẩn của mô hình ñối
tượng ñể tìm ra lời giải không gian trạng thái cho bài toán tối ưu H∞ mà
không cần phải thực hiện quá trình lặp γ ñể tìm γmin. Hơn nữa, từ cách tiếp
Trang 459
Chương 4 : ðiều khiển bền vững
cận này, tác giả có thể tính ñược ñộ dự trữ ổn ñịnh cực ñại εmax ( = 1 γ min )
một cách chính xác.
Phần sau ñây chỉ trình bày một số kết quả chính mà Glover và McFarlane ñã
thực hiện.
ðịnh lý 4.6: Bộ ñiều khiển K ổn ñịnh hóa hệ thống và thỏa
K −1 % −1
I ( I − GK ) M ≤γ (4.175)
∞
nếu và chỉ nếu K có một phân tích coprime bên phải: K = UV −1 với U, V ∈
RH∞ thỏa
− N% ∗ U 12
% ∗ + ≤ (1 − γ −2 ) (4.176)
M V ∞
ðịnh lý 4.7:
a. Lời giải tối ưu của bài toán ổn ñịnh bền vững ñối với mô hình phân tích
coprime bên trái chuẩn cho kết quả:
−1 2
K
K
I
% −1
inf ( I − GK )−1 M
∞
{
= 1 − N% %
M
2
H } (4.177)
trong ñó infimum ñược thực hiện trong tất cả các bộ ñiều khiển ổn ñịnh hóa
hệ thống.
b. ðộ dự trữ ổn ñịnh cực ñại là
−1 2
{
ε max = 1 − N% %
M
2
H } >0 (4.178)
− N% ∗ U
% ∗ + = N% %
M (4.179)
M V ∞
H
Trang 460
Chương 4 : ðiều khiển bền vững
- Việc xác ñịnh bộ ñiều khiển tối ưu H∞ có thể ñược thực hiện thông qua bài
toán mở rộng Nehari (Nehari extension).
Bài toán tối ưu con
ðộ dự trữ ổn ñịnh cực ñại cho ta một cận dưới của γ, ñó là γmin = 1/εmax.
Việc giải bài toán tối ưu H∞ với γ > γmin cho kết quả là một tập các bộ ñiều
khiển ổn ñịnh hóa K sao cho
K −1 % −1
I ( I − GK ) M ≤γ (4.180)
∞
ðây chính là bài toán tối ưu con (suboptimal problem). Lời giải dạng không
gian trạng thái của bài toán này ñược xác ñịnh theo các bước như sau :
Bước 1: Giải hai phương trình Riccati GCARE và GFARE.
Phương trình GCARE (Generalized Control Algebraic Riccati Equation)
có dạng:
( A − BS −1 D∗C )∗ X + X ( A − BS −1 D∗C ) − XBS −1 B ∗ X + C ∗ ( I − DS −1 D∗ )C = 0
(4.181)
trong ñó: S = I + D ∗ D .
Phương trình GFARE là phương trình trình bày ở trên.
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0
trong ñó R = I + DD ∗ .
Bước 2: Tính giá trị γ nhỏ nhất có thể ñạt ñược.
γ min = (1 + λmax ( ZX ))1 2
trong ñó λmax ( • ) là trị riêng lớn nhất, X và Z lần lượt là nghiệm của
GCARE và GFARE.
Bước 3: Chọn γ > γ min . Thông thường, chọn γ lớn hơn γmin một chút; chẳng
hạn, γ = 1.05γ min .
Bước 4: Bộ ñiều khiển trung tâm có biểu diễn trạng thái ñược xác ñịnh như
sau
Trang 461
Chương 4 : ðiều khiển bền vững
A + BF + γ 2W1∗−1 ZC ∗ (C + DF ) γ 2W1∗−1 ZC ∗
K0 = (4.182)
B∗ X − D∗
trong ñó X và Z là lần lượt là nghiệm của các phương trình GCARE và
GFARE,
F = − S −1 ( D∗C + B ∗ X ) , và W1 = I + ( XZ − γ 2 I ) .
Công thức tính γ min ở bước 2 ñược dẫn ra từ công thức (4.177) trong ñịnh lý
% ) coprime bên trái chuẩn thì N% M
4.7. Nếu ( N% , M % có thể ñược
H
xác ñịnh từ nghiệm của hai phương trình Riccati GCARE và GFARE như
sau:
2
N% %
M = λmax ( XZ ( I + ZX ) −1 ) (4.183)
H
Trang 462
Chương 4 : ðiều khiển bền vững
Nếu γ min quá lớn thì trở về bước 1. (Thông thường 1< γ min <5 thì chấp nhận
ñược)
Bước 3: Chọn γ > γ min , tổng hợp bộ ñiều khiển K ∞ sao cho
K ∞ −1
~
−1
I (I − Gs K ∞ ) M s ≤γ
∞
K = W1 K ∞ W2
Trang 463
Chương 4 : ðiều khiển bền vững
W1 G W2
Gs
W1 G W2
K∞
W1 K∞ W2
Nhận xét:
-Khác với phương pháp thiết kế nắn dạng vòng cổ ñiển (nắn dạng hàm S
và T), ở ñây ta không cần quan tâm ñến tính ổn ñịnh vòng kín, cũng như
thông tin về pha của ñối tượng danh ñịnh, vì ñiều kiện ổn ñịnh nội ñã ñược
ñảm bảo trong bài toán ổn ñịnh bền vững H ∞ ở bước 3.
- Thủ tục thiết kế sử dụng thích hợp cho các ñối tượng ổn ñịnh, không ổn
ñịnh, cực tiểu pha, không cực tiểu pha; ñối tượng chỉ cần thỏa mãn yêu cầu
tối thiểu cho mọi thiết kế là không có các chế ñộ ẩn. Cụ thể là nếu ñối tượng
Trang 464
Chương 4 : ðiều khiển bền vững
không cực tiểu pha thì các hạn chế về chất lượng ñiều khiển vẫn thể hiện
trong thủ tục thiết kế quả giá trị của γ min .
4.3.4.2 Sơ ñồ ñiều khiển:
Trên ñây ta chỉ quan tâm ñến vòng ñiều khiển, không quan tâm ñến vị trí
tín hiệu ñặt ñược ñưa vào vòng ñiều khiển như thế nào. Thông thường, tín
hiệu ñặt ñưa vào vòng ñiều khiển như hình 4.22 với hồi tiếp ñơn vị.
+ y
r K G
-
+
r W2 K∞ W1 G
- y
Hình 4.23: Sơ ñồ ñiều khiển hồi tiếp ñơn vị với bộ ñiều khiển ñạt ñược
từ LDSP
Trang 465
Chương 4 : ðiều khiển bền vững
K ∞ (0)W2 (0) W1 G
r y
+
K∞ W2
Hình 4.24: Sơ ñồ ñiều khiển cải tiến với bộ ñiều khiển ñạt ñược từ
LDSP
Khi tín hiệu ñặt ñược ñưa vào hệ thống tại vị trí giữa hai khối K ∞ và W1, ta
cần bổ sung một bộ tiền bổ chính ñể ñảm bảo ñộ lợi tĩnh bằng 1 (hình 4.24).
Hàm truyền vòng kín từ tín hiệu ñặt r ñến ñầu ra y trở thành:
G ( s )W1 ( s )
y(s)= K ∞ (0)W2 (0)r ( s ) (4.184)
1 − G (s ) K (s)
trong ñó:
K ∞ (0)W2 (0) = lim K ∞ ( s )Ws ( s ) (4.185)
s →0
Theo kinh nghiệm, ñiều khiển theo sơ ñồ hình 4.24 sẽ cho ñáp ứng quá ñộ
tốt hơn; ñiều khiển theo sơ ñồ hồi tiếp ñơn vị như hình 4.23 thường cho ñáp
ứng quá ñộ, có ñộ vọt lố lớn. Nguyên nhân là trong sơ ñồ 4.24 tín hiệu ñặt
không trực tiếp kích thích ñặc tính ñộng của K ∞ . Theo thủ tục thiết kế
LSDP, K ∞ lại ñược xác ñịnh qua lại bài toán ổn ñịnh bền vững, trong ñó ta
không thể trực tiếp can thiệp vào vị trí ñiểm cực – zero ñược, mà mọi ñặc
tính mong muốn ta chỉ có thể ñưa vào hệ thống thông qua các hàm nắn dạng
W1 và W2.
4.3.4.3 Lựa chọn các hàm nắn dạng W1,W2:
Việc lựa chọn các hàm nắn dạng trong thủ tục thiết kế LSDP nói chung là
dựa vào kinh nghiệm của người thiết kế. Tuy nhiên, ñối với từng ñối tượng
cụ thể, người ta thường ñưa ra các hướng chọn hàm nắn dạng thích hợp.
Thông thường, W2 ñược chọn có dạng ma trận ñường chéo với các phần tử
trên ñường chéo là các hằng số nhằm ñặt trọng số lên các tín hiệu ra của ñối
tượng. W1 thường là tích của hai thành phần: WP và WA; trong ñó, WA là bộ
tách kênh (decoupler), WP có dạng ñường chéo ñược chọn sao cho thỏa hiệp
Trang 466
Chương 4 : ðiều khiển bền vững
các mục tiêu chất lượng và ổn ñịnh bền vững của hệ thống, và thường có
chứa khâu tích phân ñể ñảm bảo sai số xác lập bằng 0.
ðối với hệ SISO, việc lựa chọn các hàm nắn dạng ñơn giản hơn: W2 thường
ñược chọn bằng 1, và W1 ñược chọn sao cho thỏa hiệp ñược các mục tiêu
chất lượng và ổn ñịnh bền vững của hệ thống.
~
Ở ñây ta ký hiệu H ( jω ) =HT(- jω )
Ta có :
+∞
1 ~
H 2
= trace ∫
2Π −∞
H ( jω ) H ( jω )dω (4.189)
Gọi là chuẩn H2 của hệ thống .Nếu nhiễu trắng w có mật ñộ W = I thì trị
trung bình của ngõ ra toàn phương E{ y T (t ) y (t )} tương ñương với bình
phương của chuẩn H2 của hệ thống
4.4.2 Tối ưu H2
Vấn ñề tối ưu H2 ñược thể hiện dưới dạng ma trận chuyển ñổi. Chúng ta giả
sử rằng Q = I, và R = I, phiếm hàm chất lượng LQG là
Trang 467
Chương 4 : ðiều khiển bền vững
lim E[ z T (t ) z (t ) + u T (t )u (t )] (4.190)
t →∞
Sự giả sử này không làm mất ñi tính tổng quát bởi vì bằng cách biến ñổi
thang tỷ lệ các thông số z và u chỉ tiêu chất lượng luôn có thể chuyển thành
hình thức này .
Cho hệ thống vòng hở :
x& = Ax + Bu + γw (4.191)
z = Dx (4.192)
y = Cx + v (4.193)
Có ma trận chuyển ñổi
z = D ( sI − A) −1 γ w + D ( sI − A) −1 Bu (4.194)
14 4244 3 14 4244 3
G11 ( s ) G12 ( s )
y = C ( sI − A) −1 γ w + C ( sI − A) − 1Bu + v (4.195)
14 4244 3 144244 3
G21 ( s ) G22 ( s )
Kết nối hệ thống như hình (4.25) với một bộ ñiều khiển Ce chúng ta có cân
bằng của tín hiệu :
u w
z
Ce G
-
+ v
y +
Hình 4.25 : Hệ thống hồi tiếp với ngõ vào và ngõ ra nhiễu loạn
u = −C e y = −C e (G21 w + G22 u + v)
u = − ( I + C e G22 ) −1 C e G21 w− ( I + C e G22 ) −1 C e v (4.196)
144424443 144 42444 3
H 21 ( s ) H 22 ( s )
Từ z = G11 w + G12 u ta có :
z = G11 − G12 ( I + C e G22 ) −1 C e G21 w− G12 ( I + C e G22 ) −1 C e v (4.197)
144444244444 3 144424443
H11 ( s ) H12 ( s )
Hay
Trang 468
Chương 4 : ðiều khiển bền vững
z H 11 ( s ) H 12 ( s ) w
u = H ( s ) H ( s ) v (4.198)
14 21
4 4242244 3
H (s)
Từ (4.198) theo ta có :
T
z (t ) z (t )
lim E ( z (t ) z (t ) + u (t )u (t )) = lim E (
T T
)
t →∞ t →∞
u (t ) u (t )
+∞
1 ~
= trace
2π ∫ H ( jω )H ( jω )dω
−∞
(4.199)
2
= H 2
Vì vậy giải quyết vấn ñề LQG là cực tiểu hoá chuẩn H2 của hệ thống vòng
kín hình (4.25) với (w,v) như ngõ vào và (z,u) như ngõ ra.
Cấu hình của hình (4.25) là trường hợp ñặc biệt của cấu hình hình (4.26).Ở
hình (4.26) v là ngõ vào mở rộng (w và v trong hình (4.25)).Tín hiệu z là tín
hiệu sai số (lý tưởng bằng 0)(z và u trong hình (4.25)).Thêm vào ñó u là ngõ
vào ñiều khiển và y là ngõ ra quan sát .G là ñối tượng tổng quát và Ce là bộ
ñiều khiển .
v z
G
u y
Ce
Trang 469
Chương 4 : ðiều khiển bền vững
ðầu tiên, xem xét lời giải với hồi tiếp trạng thái .Khảo sát hai phương trình :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.204)
I z (t )
E{z T (t ) z (t )} = E z0T (t ) u T (t ) T [ I D12 ] 0
D12 u (t )
(4.207)
I D12 z0 (t )
= E z0T (t ) uT (t ) T
D12 D12 D12 u (t )
T
ðây là vấn ñề bộ ñiều chỉnh tuyến tính với thành phần chéo ở ngõ ra và ngõ
vào .Nó có lời giải nếu hệ thống x& (t ) = Ax(t ) + B2 u (t ) , z 0 (t ) = C1 x(t ) là ổn
ñịnh và tìm ñược, ma trận trọng lượng
I D12
D T (4.208)
12 D12T D12
Trang 470
Chương 4 : ðiều khiển bền vững
Là xác ñịnh dương. ðiều kiện cần và ñủ cho (4.208) là D12T D12 không suy
biến .Lời giải của vấn ñề ñiều chỉnh là luật hồi tiếp trạng thái:
u (t ) = − Kx(t ) (4.209)
Nếu trạng thái là không có giá trị cho hồi tiếp thì cần ñược ước lượng với
một bộ lọc Kalman. Xem xét hai phương trình :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.210)
y (t ) = C 2 x(t ) + D21v(t ) + D22 u (t ) (4.211)
Phương trình thứ hai có thể trở thành dạng chuẩn cho bộ lọc Kalman nếu
coi y(t) – D22u(t) như là biến quan sát hơn là y(t).Nếu biểu thị nhiễu sự quan
sát là v (t ) = D21v(t ) thì :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.212)
y (t ) − D22 u (t ) = C 2 x(t ) + v (t ) (4.213)
Xác ñịnh một hệ thống nhiễu với những thành phần nhiễu tương quan chéo
chúng ta có:
v(t + τ ) T I
E [ ]
v (t ) v T (t ) = E v(t + τ )v T (t ) I [ T
D21 ]
v (t + τ ) D21
(4.214)
I D21T
= T
δ (τ )
D21 D21 D21
Giả sử rằng hệ thống x& (t ) = Ax(t ) + B1v(t ) , y (t ) = C 2 x(t ) là ổn ñịnh và tìm
ñược , và ma trận mật ñộ
I D21T
T
(4.215)
D21 D21 D21
xác ñịnh dương. ðiều kiện cần và ñủ cho(4.215) là D21 D21 T
không suy biến
Khi ñó sẽ tồn tại một bộ lọc Kalman :
x&ˆ (t ) = Axˆ (t ) + B2 u (t ) + L[( y (t ) − C 2 xˆ (t ) − D22 u (t )] (4.216)
Ma trận ñộ lợi L ñược tìm từ thủ tục thiết kế bộ lọc Kalman. Vấn ñề hồi tiếp
ngõ ra ñược lấy :
u (t ) = − Kxˆ (t ) (4.217)
K giống như ñộ lợi hồi tiếp trạng thái ở (4.209)
Trang 471
Chương 4 : ðiều khiển bền vững
Dưới những giả sử này bộ ñiều khiển hồi tiếp ngõ ra tối ưu là
xˆ& (t ) = Axˆ (t ) + B 2 u (t ) + L[ y (t ) − C 2 xˆ (t ) − D22 u (t )] (4.221)
u (t ) = − Kxˆ (t ) (4.222)
Ma trận ñộ lợi hồi tiếp trạng thái và bộ quan sát là :
K = ( D12T D12 ) −1 ( B2T X + D12T C1 ) , L = (YC2T + B1 D21 T
)( D21 D21T −1
) (4.223)
Ma trận ñối xứng X,Y là nghiệm xác ñịnh dương duy nhất của phương trình
ñại số Riccati:
AT X + XA + C1T C1 − ( XB2 + C1T D12 )( D12T D12 ) −1 ( B2T X + D12T C1 ) = 0
T −1
AY + AY T + B1 B1T − (YC2T + B1 D21
T
)( D21 D21 ) (C 2Y + D21 B1T ) = 0
(4.224)
Trang 472
Chương 4 : ðiều khiển bền vững
M=1 m=0.1
b=0.0036 k=0.091
x& = Ax + Bu
y = Cx + Du
0 1 0 0
−k 0
−b k b 0
A =
m m m m
; B= 0
0 0 0 1
k b −k −b 1
M M
M M M
1 0 0 0 0
C = 0 0 1 0 ; D = 0
0 0 0 0 1
Trang 473
Chương 4 : ðiều khiển bền vững
Từ sơ ñồ khối trên, ta thấy rằng cấu trúc của bộ ñiều khiển LQG chính là bộ
ñiều khiển LQR kết hợp với bộ ước lượng Kalman và có xét ñến nhiễu quá
trình w(k) và nhiễu ño lường v(k).
Phương trình Biến Trạng Thái của hệ rời rạc khi có xét ñến nhiễu như sau:
x(k + 1) = Φx(k ) + Γu (k ) + w(k )
y (k ) = Cx(k ) + Du (k ) + v(k )
Sơ ñồ mô phỏng hệ thống:
Trang 474
Chương 4 : ðiều khiển bền vững
Trang 475
Chương 4 : ðiều khiển bền vững
2
x
1
0 θ x0
Mô hình biểu diễn trạng thái của ñối tượng (n=3) có dạng như sau:
0 0 0 0 1 0 0 0 0
0 0 0 0 0 1 0 0 0
0 0 0 0 0 0 1 0 0
0 0 0 0 0 0 0 1 0
x& = x + T
0 u12 u13 u14 0 0 0 0 u11
0 u22 u23 u24 0 0 0 0 u21
0 u32 u33 0 0 0 0 u
34
31
0 u42 u43 u44 0 0 0 0 u41
y = [l3 0 0 1 0 0 0 0] x
Trang 476
Chương 4 : ðiều khiển bền vững
T
Vectơ trạng thái ñược ñịnh nghĩa: x = θ q1 q2 q3 θ& q&1 q&2 q&3
dθ
trong ñó:θ : góc quay của trục motor, θ& =
dt
dqi
qi : chuyển vị (ñộ biến dạng) của nút I, q& i =
dt
G 0 ( s ) = C ( sI − A) −1 B + D
990679.4792 (s+598.2) (s-598.2) (s+167.2) (s-167.2)
G0 ( s ) =
s (s + 1.309e004) (s 2 + 1.215e005) (s 2 + 93.16s + 8.678e005)
2 2
Thông thường ,trước khi ñưa mô hình vào sử dụng ,cần phải sửa ñổi mô
hình dựa trên biểu ñồ Bode.
990679.4792 (s+598.2) (s-598.2) (s+167.2) (s-167.2)
G (s) = 2 2 2 2
(s+1e-006) (s + 11.44s + 1.309e004) (s + 34.86s + 1.215e005) (s + 93.16s + 8.678e005)
Ta sử dụng G(s) làm mô hình danh ñịnh và sử dụng thủ tục LSDP thiết kế
bộ ñiều khiển
Sơ ñồ mô phỏng:
Trang 477
Chương 4 : ðiều khiển bền vững
W1, W2 Các hàm nắn dạng chỉ ñịnh trong thủ tục LSDP
Kinf Bộ ñiều khiển K ∞ ñạt ñược sau bước 3 của thủ tục
LSDP.
Flexible Link Khối giả lập ñối tượng ñiều khiển. Lẽ ra khối này
chỉ có một ñầu vào – một ñầu ra, nhưng phần hoạt
hình (animation) cần lấy trạng thái của ñối tượng
ñể vẽ, nên khối này còn có các ñầu ra phụ q
(chuyển vị nút) và Theta (góc quay của trục).
Disturbance Khối tạo nhiễu tải, phát tín hiệu có dạng hàm nấc
âm.
Noise Khối tạo nhiễu ño.
Load Nạp dữ liệu từ file loaddata.m ñể mô phỏng.
Design W1 (Raw) Kích hoạt công cụ hỗ trợ thiết kế sơ bộ hàm nắn
dạng W1.
Design W1 (Fine) Kích hoạt công cụ hỗ trợ thiết kế cho phép tinh
chỉnh hàm nắn dạng W1.
Plot G/W1/Gs/L/ST Khi nhấp kép chuột vào những khối này, Matlab sẽ
vẽ biểu ñồ Bode các hàm tương ứng.
Info Hiển thị thông tin hệ thống lên Workspace.
Trang 478
Chương 4 : ðiều khiển bền vững
Sử dụng: Người thiết kế chỉ ñịnh các ñiểm gãy (ñiểm chỉ ñịnh), các ñiểm
này sẽ tự ñộng ñược nối với nhau bằng các ñoạn thẳng tạo nên dạng chỉ
ñịnh, sau ñó ñiền bậc mong muốn của W1 vào ô Bậc của W1, và nhấn nút
Xấp xỉ ñể MATLAB phát sinh W1. Sau khi có ñược W1, người thiết kế cần
phải tinh chỉnh lại hàm này bằng công cụ Design W1 (Fine).
Trang 479
Chương 4 : ðiều khiển bền vững
Design W1 (Fine)
Công cụ này ñược xây dựng dựa trên giao diện ñồ họa của JF Whidborne và
SJ King. Design W1 (Fine) có thể ñược sử dụng ñộc lập, hoặc sử dụng ñể
tinh chỉnh dạng của W1 ñạt ñược sau khi sử dụng Design W1 (Raw). Design
W1 (Fine) có giao diện như sau:
Sử dụng: Nếu Design W1 (Fine) ñược sử dụng ñộc lập, thì lúc khởi ñộng W1
= 1; nếu ñược sử dụng sau Design W1 (Raw), thì W1 sẽ thừa kế kết quả ñạt
ñược từ Design W1 (Raw). Người thiết kế có thể thêm/bớt cực-zero, dịch
chuyển cực-zero thêm/bớt khâu tích phân, hay thay ñổi ñộ lợi của W1 bằng
các công cụ ở bên phải giao diện. Sau cùng, người thiết kế nhấn nút Tính
Kinf ñể tổng hợp bộ ñiều khiển. Hộp thoại xuất hiện sau khi nhấn nút Tính
Trang 480
Chương 4 : ðiều khiển bền vững
Kinf cho biết thông tin về giá trị γ min ñạt ñược, và ñưa ra 3 lựa chọn cho
người dùng chọn.
Nhấn nút Trở về ñể quay lại giao diện Design W1 (Fine) hiệu chỉnh W1.
Nhấn nút ðáp ứng nấc nếu muốn xem ñáp ứng với ñầu vào hàm nấc thang
ñơn vị của ñối tượng danh ñịnh. Nhấn nút Mô phỏng, kết quả thiết kế (Kinf,
W1) sẽ ñược chuyển vào Workspace ñể chạy mô phỏng.
Load
Khi nhấp kép chuột lên khối Load, Simulink sẽ gọi loaddata.m. Tệp này
chứa toàn bộ thông số thiết kế của hệ thống. Người thiết kế có thể ñặt hàm
nắn dạng W1 vào tệp này nếu muốn thiết kế “bằng số”
Sau bước thiết kế, Kinf và W1 ñược nạp vào Workspace dưới dạng mô hình
Trang 481
Chương 4 : ðiều khiển bền vững
Trang 482
Chương 4 : ðiều khiển bền vững
4.5.3 ðiều khiển bền vững H∞ với bài toán bồn nước
Xét hệ thống có sơ ñồ như hình vẽ với ñối tượng ñiều khiển là bồn nước.
Hàm truyền gồm 3 thành phần chưa biết là : ñộ lợi K, thời gian trễ λ và
thời hằng τ. Khi ta thay ñổi 3 giá trị này thì hàm truyền của ñối tượng ñã
bị thay ñổi.
Yêu cầu của bài toán là: tìm giá trị của Wm và Pnom.
Mục ñích của bài toán không chỉ dừng lại ở việc tìm Wm và Pnom mà là
tìm một bộ ñiều khiển C(s) sao cho hệ thống danh ñịnh vòng kín (không
tính ∆) ổn ñịnh ñồng thời hệ thống vòng kín cũng ổn ñịnh dưới tác ñộng
của sai số mô hình .
Trang 483
Chương 4 : ðiều khiển bền vững
(5)
K e − λS
Chọn Pnom là : Pnom = (6)
1+ τs
Ta tiếp tục ñịnh nghĩa :
(7)
Ta có :
P( s ) − Pnom ( s ) (8)
= Wm ( s )∆, ∆ ∞ ≤1
Pnom ( s )
Chuẩn ∞ :
P ( jω ) − Pnom ( jω ) (9)
= Wm ( jω ) ∆
Pnom ( jω ) ∞
∞
Vì : ∆ ≤1
∞
P( jω ) − Pnom ( jω )
Nên : ≤ Wm ( jω ) (10)
Pnom ( jω ) ∞
∞
Trang 484
Chương 4 : ðiều khiển bền vững
⇒ Ke − λS (1 + τ s ) (12)
− λS
−1 ≤ Wm ( jω ) ∞
(1 + τs ) K e ∞
Mà chuẩn ||G||∞ chính là khoảng cách lớn nhất từ tâm tọa ñộ mặt phẳng
phức tới một ñiểm trên ñường ñặc tính tần biên – pha của G(s).
Vì bài toán ta ñang xét là hệ SISO nên ta có : G ∞ = sup G ( jω )
K + δK
Suy ra : Wm (s) ≥ τ s + 1 e −δλS − 1 (13)
K τ + δτ s + 1
( )
Mở rộng của bài toán (sơ ñồ hình 2):
Bộ ñiều khiển C(s) có thể là bộ ñiều khiển PID hay các khâu sớm trễ
pha.
Sai số mô hình ∆(s) ñược xem như ổn ñịnh nhưng không biết rõ ràng.
Giả sử ∆(s) bị chặn như sau :
∆ ( S ) ≤ Wm ( s ) , ∀ω ∈ [0, ∞) (14)
Wm(s) là hàm chặn trên của ∆(s), ổn ñịnh và biết trước.
Kết quả ổn ñịnh bền vững cho thấy rằng nếu bộ ñiều khiển C(s) ñược
chọn sao cho hệ danh ñịnh vòng kín (không tính ∆(s)) trong hình trên ổn
ñịnh tiệm cận và thỏa mãn bất ñẳng thức sau :
Pnom ( s )C ( s)Wm ( S )
<1 (15)
1 + Pnom C ( s ) ∞
thì hệ thống vòng kín cũng ổn ñịnh dưới tác ñộng của sai số mô hình
∆(s). Bất ñẳng thức (15) chính là ñiều kiện ổn ñịnh bền vững (chuẩn H∞)
của hệ thống.
Như vậy, mục tiêu của bài toán tổng hợp bộ ñiều khiển C(s) thỏa mãn
ñiều kiện ràng buộc ổn ñịnh bền vững (15).
Giải:
Trước tiên ta tìm khoảng giới hạn của ñộ lợi K, thời gian trễ λ và thời
hằng τ.
K ∈ [1, 599] , λ ∈ [1, 143] , τ ∈ [1, 1439]
Ta có :
K = 300 λ = 72 τ = 720
δK = 299 δλ = 71 δτ = 719
Từ biểu thức (13 ) :
K + δK τ s + 1
Wm ( s) ≥ e −δλS − 1
( )
K τ + δτ s + 1
Trang 485
Chương 4 : ðiều khiển bền vững
Vẽ biểu ñồ bode biên cho vế phải và tìm giá trị chặn trên của nó ñể cho
ra ñường bao của biểu ñồ bode biên khi các giá trị δK , δλ , δτ lần lượt
chạy, tức là từ các giá trị trung bình ta tỏa ra xung quanh ñể tìm tầm giới
hạn của nó.
Với các thông số ñược chọn như trên, qua nhiều lần thử nghiệm, kết quả
Wm chặn trên khi các thông số δK , δλ , δτ chạy là :
3.2( s + 0.035)
Wm = (16)
s + 0.08
Bây giờ ta thiết kế bộ ñiều khiển C(s) ñiều khiển bền vững ổn ñịnh vòng
kín. ðể ñơn giản, chọn bộ hiệu chỉnh sớm pha có dạng:
a ( s + b)
C ( s) = (17)
cs + 1
Chọn:
b = 1 / τ = 1 / 720 = 0.0014 , vì thời hằng là 720 giây lớn, chọn b
ñể triệt tiêu thời hằng này.
c = 10 : c lúc này là thời hằng mới nên ta chỉ cần chọn nhỏ.
a =1/ K =1/300: Vì ta xét ñiều kiện vòng kín khi ∆ = 0 ( mô hình
danh ñịnh ) có ổn ñịnh không và ñồng thời ñiều kiện ổn ñịnh bền
vững phải thoả. Ở ñây thiết kế của chúng ta dựa vào biểu ñồ
Nyquist ñể xem xét tính ổn ñịnh, từ ñó tìm ra a. Khi a càng lớn
thì càng làm cho chuẩn vô cùng của biểu thức ñiều kiện bền
vững vượt xa 1, không thoả với ñiều kiện.
Lúc này, ñiều kiện ổn ñịnh vòng kín ñược thỏa. Vậy :
0.0033( s + 0.0014)
C ( s) =
10 s + 1
Sơ ñồ mô phỏng:
Trang 486
Chương 4 : ðiều khiển bền vững
Trang 487
Chương 4 : ðiều khiển bền vững
Hình 4: ðặc tính biên tần của Wm ( jω ) và K + δK τ s + 1 −δλS
e −1 ,
K
( )
τ + δτ s + 1
K + δK τ s + 1
Hình 5: ðặc tính biên tần của Wm ( jω ) và −δλS − 1 ,
K τ + δτ s + 1 e
( )
với δK = 299, δτ = 1, δλ = 1 : 71 .
Hình 6: ðặc tính biên tần của Wm ( jω ) và K + δK τ s + 1 −δλS
−1 ,
τ + δτ s + 1 e
( )
K
với δK = 1 : 299, δτ = 1, δλ = 71
Trang 488
Chương 4 : ðiều khiển bền vững
Khi ∆ càng lớn ( gần 1) thì vùng không chắc chắn của hệ thống càng
tăng, ứng với những ñường cong Nyquist phía ngoài. ðiều ñó cũng nói
lên ñược rằng sự thay ñổi của ∆ chính là sự thay ñổi của ñối tượng.
• Biểu ñồ Nyquist của (15) và ñáp ứng ngõ ra của hệ thống:
Hình 8: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 0 .
Trang 489
Chương 4 : ðiều khiển bền vững
Hình 9: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 0.5 .
Hình 10: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = −0.3 .
Trang 490
Chương 4 : ðiều khiển bền vững
Hình 11: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 1 .
Hình 12: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi có nhiễu.
Nhìn vào biểu ñồ Nyquist của ñiều kiện bền vững ta nhận thấy rõ ràng giá
trị sup của biểu thức (15) ñược thoả và ñáp ứng ngõ ra hệ thống xung quanh
giá trị khi ∆ =0. Ta nói rằng hệ thống ñã ổn ñịnh bền vững.
Trang 491
Chương 4 : ðiều khiển bền vững
Kết luận:
Như vậy, vấn ñề của bài toán ñiều khiển bền vững là xác ñịnh cho ñược giá
trị chặn trên của ∆( s ) chính là sự thay ñổi lớn nhất của ñối tượng. Một khi
ñã xác ñịnh ñược rồi thì vấn ñề còn lại của chúng ta là việc thiết kế bộ ñiều
khiển thoả ñiều kiện bền vững. Và bộ ñiều khiển chỉ ñiều khiển bền vững
ñược trong một vùng chọn trước của các giá trị thay ñổi là K, λ , τ . Vượt ra
ngoài phạm vi giới hạn ñó thì sự ổn ñịnh bền vững là không chắc chắn hay
nói cách khác là hệ thống không còn bền vững nữa. Có nhiều cách thiết kế
bộ ñiều khiển C(s) như dùng phương pháp GA của ñiều khiển thông minh
ñể thiết kế bộ C(s) PID chẳng hạn. Ở ñây, ta thiết kế bộ hiệu chỉnh sớm pha
vì nó ñơn giản. Kết quả ñạt ñược khá tốt và ta ñã giải quyết ñược yêu cầu
của bài toán ñặt ra.
4.5.4 Ứng dụng thuật toán GA thiết kế bộ ñiều khiển PID tối ưu H2/H∞
1. Giới thiệu:
Bài toán kết hợp ñiều khiển H2/H∞ bao gồm việc thiết kế một bộ ñiều khiển
ổn ñịnh nội sao cho cực tiểu phiếm hàm chất lượng H2 và thỏa mãn ràng
buộc ổn ñịnh bền vững H∞ . Trong ví dụ này một thủ tục ñược ñề nghị thiết
kế bộ ñiều khiển PID nhằm ñạt ñược chất lượng tối ưu H2/H∞.
Bước ñầu tiên dựa theo tiêu chuẩn ổn ñịnh Routh-Hurwitz, xác ñịnh ñiều
kiện ñối với các thông số của bộ ñiều khiển PID ñể hệ thống vòng kín ổn
ñịnh. Bước thứ hai, xác ñịnh miền ổn ñịnh của bộ ñiều khiển PID, ñồng thời
thỏa mãn ràng buộc H∞. Trong bước ba, bài toán thiết kế trở thành bài toán
tìm một ñiểm trong không gian tìm ñược ở bước hai, ñể tìm cực tiểu phiếm
hàm H2. Thường thì cần phải xem xét bài toán cực tiểu một hàm có tính phi
tuyến cao, và tồn tại nhiều ñiểm cực tiểu cục bộ.
2. Mô tả bài toán
Cho hệ thống ñiều khiển PID như trong Hình 1. ðối tượng P(s) chịu tác
ñộng của nhiễu là ∆0(s), bộ ñiều khiển PID có dạng như sau:
C (s ) = k 1 + k 2 / s + k 3s (1)
+ e u
r C(s) [1+∆0(s)] P0(s) y
-
Trang 492
Chương 4 : ðiều khiển bền vững
Nhiễu ñối tượng ∆0(s) ñược xem như ổn ñịnh nhưng không biết rõ ràng.Giả
sử ∆0(s) bị chặn như sau:
PO ( s )C ( s )δ O ( s )
<1 (3)
I + PO ( s )C ( s ) ∞
thì hệ thống vòng kín trong Hình 1 cũng ổn ñịnh dưới tác ñộng của sai số
mô hình ∆0(s). Bất ñẳng thức (3) chính là ñiều kiện ổn ñịnh bền vững (chuẩn
H∞) của hệ thống, từ ñịnh nghĩa chuẩn H∞:
A( s ) ∞
≡ sup A( jω ) (4)
ω ∈( 0 ,∞ )
ðiều kiện ổn ñịnh bền vững (3) ñược viết lại như sau:
P0 ( s )C ( s )δ 0 ( s ) P0 (− jω ) P0 ( jω )C (− jω )C ( jω )δ 0 (− jω )δ 0 ( jω )
= sup
1 + P( s) 0 C ( s ) ∞
ω∈[ 0 ,∞ ) (1 + P0 (− jω )C (− jω ))(1 + P0 ( jω )C ( jω ))
β (ω ) β (ω )
= sup = sup <1 (5)
α (ω ) ω∈[ 0 ,∞ ) α (ω )
ω∈[ 0,∞ )
Việc quét ω trong [0,∞) ñể tìm giá trị lớn nhất của β(ω)/α(ω) trong (5)
không phải là công việc dễ dàng. Thực tế, giá trị lớn nhất của β(ω)/α(ω) chỉ
xảy ra ở những ñiểm thỏa mãn phương trình sau:
dβ (ω ) dα (ω )
α (ω ) − β (ω )
d β (ω ) dω dω = 0
= (6)
dω α (ω ) α 2 (ω )
Trang 493
Chương 4 : ðiều khiển bền vững
Với kết quả trên, ràng buộc ổn ñịnh bền vững (3) tương ñương với:
β (λ i )
max <1 (8)
λi α (λ i )
Tuy nhiên, trong nhiên trong nhiều trường hợp nếu chỉ ổn ñịnh bền vững
không thì chất lượng của hệ thống không ñạt yêu cầu. Vì vậy việc hiệu
chỉnh tối ưu trong nhiều ứng dụng thực tế là cần thiết. Ví dụ này ñề cập ñến
phương pháp hiệu chỉnh tối ưu ñược thực hiện trên phiếm hàm H2:
∞
min ∫ e 2 (t )dt (9)
C
0
1
j∞
j∞
1 B( s) B(− s)
= min
k1 , k 2 , k 3 2πj ∫
− j∞
A( s ) A(− s )
ds (11)
m
A(s) và B(s) có thể ñược biểu diễn như sau: A( s ) = ∑ a k s k ,
k =0
m −1
B( s ) = ∑ bk s k ; phương trình (11) ñược viết lại như sau:
k =0
Trang 494
Chương 4 : ðiều khiển bền vững
m−1 k m −1 k
j∞ ∑ bk s ∑ bk ( − s )
1 k =0 k =0 ds
2πj −∫j∞ m
J m ( k1 , k 2 , k 3 ) = (12)
m
∑ a k s k ∑ a k (− s ) k
k =0 k =0
Phương trình (12) có thể ñược giải nhờ lý thuyết thặng dư, giá trị của
Jm(k1,k2,k3) có thể tìm ñược trong Newton, 1957.
Phiếm hàm H2 có dạng như sau:
J m = min J m (k1 , k 2 , k 3 ) (13)
k1 , k 2 , k 3
Jm(k1, k2, k3) là hàm số của các thông số PID (k1, k2, k3), m là bậc ñối tượng.
Từ sự phân tích trên, bài toán thiết kế bộ ñiều khiển PID, kết hợp H2/H∞ trở
thành bài toán xác ñịnh bộ ñiều khiển PID ñể cực tiểu (13) dưới ràng buộc
ổn ñịnh bền vững (8). Một phương pháp hiệu quả ñể ñạt ñược lời giải tòan
cục trong bài tóan kết hợp H2/H∞ vẫn ñang ñược nhiều người quan tâm.
Trong phần tiếp theo chúng ta sẽ xem xét thuật tóan di truyền, và ứng dụng
thuật tóan này ñể giải quyết bài tóan ñiều khiển tích hợp H2/H∞ .
3. Phương pháp thiết kế
Phần này sẽ trình bày phương pháp xác ñịnh các thông số (k1, k2, k3) của bộ
ñiều khiển PID cho hai bài toán trên bằng thuật toán di truyền, sao cho ñạt
ñược giá trị cực tiểu của phiếm hàm H2, ñồng thời thỏa mãn ràng buộc ổn
ñịnh bền vững H∞.
3.1. Biểu diễn nhiễm sắc thể
Thuật toán di truyền làm việc trên các nhiễm sắc thể (những chuỗi số), chứ
không phải chính bản thân thông số ñó. Mỗi tập thông số (k1, k2, k3) của bộ
ñiều khiển PID sẽ ñược mã hóa và ghép lại thành một nhiễm sắc thể. Việc
mã hóa có thể ñược thực hiện bằng những chuổi số nhị phân hoặc thập phân.
Trong ví dụ này, sử dụng phương pháp mã hóa thập phân.
3.2. Hàm thích nghi và hàm ñánh giá
Hàm ñánh giá ñược ñịnh nghĩa như sau:
Trang 495
Chương 4 : ðiều khiển bền vững
Vế phải của (14) là phiếm hàm H2 mà chúng ta muốn cực tiểu, hàm ñánh giá
chỉ ñược xác ñịnh trong miền ổn ñịnh (D) của hệ thống.
Mục tiêu của chúng ta là tìm (k1, k2, k3) trong D ñể cực tiểu (14). Tương ứng
với mỗi nhiễm sắc thể ta sẽ có ñược một giá trị của hàm ñánh giá E(k1,k2,
k3). Sau ñó giá trị ñánh giá ñược ánh xạ thành giá trị thích nghi F(k1,k2, k3)
ñể cho phù hợp với thuật toán di truyền (tìm kiếm giá trị cực ñại). Quá trình
tìm kiếm giá trị nhỏ nhất của Jm(k1, k2, k3) tương ứng với quá trình tìm kiếm
giá trị lớn nhất của F(k1, k2, k3). Nhiễm sắc thể có Jm(k1, k2,k3) nhỏ hơn sẽ có
giá trị thích nghi lớn hơn.
Mối liên hệ giữa hàm thích nghi và hàm ñánh giá ñược biểu diễn như sau:
β ( λi )
− E (k1 , k 2 , k 3 ) + b khi max <1
λi α (λ i )
F ( k1 , k 2 , k 3 ) = (15)
0 β ( λi )
khi max ≥1
λ iα (λ i )
Ở ñây dấu trừ ñược sử dụng ñể chuyển bài toán cực tiểu thành bài toán cực
ñại, giá trị của b ñược chọn sao cho giá trị của hàm thích nghi luôn luôn
dương. ðối với các nhiễm sắc thể không thỏa mãn ñiều kiện (8), giá trị của
hàm thích nghi sẽ ñược gán bằng 0 (giá trị nhỏ nhất), vì vậy các nhiễm sắc
thể này sẽ không tồn tại trong thế hệ sau.
3.3. Các bước thực hiện
Từ sự phân tích trên, quá trình thiết kế bao gồm các bước sau:
(1) Bước 1: Áp dụng tiêu chuẩn Routh-Hurwitz, xác ñịnh ñiều kiện của các
hệ số PID ñể hệ thống vòng kín ổn ñịnh.
(2) Bước 2: Xác ñịnh miền ổn ñịnh (D) của ba thông số (k1, k2, k3).
(3) Bước 3: Thiết lập các thông số của thuật toán di truyền: xác suất lai, xác
suất ñột biến, kích thước quần thể, số thế hệ tối ña, ñiều kiện dừng,…
(4) Bước 4: Khởi tạo quần thể, mã hóa nhiễm sắc thể.
Trang 496
Chương 4 : ðiều khiển bền vững
Với ngõ vào là hàm nấc, ta có thể dễ dàng tính ñược e(s), β (ω ) và α (ω ) .
Trong ví dụ này ta có m = 4, vì vậy phiếm hàm H2 của hệ thống là J4:
b32 (−a02a3 + a0a1a2 ) + (b22 − 2b1b3 )a0a1a4 + (b12 − 2b0b2 )a0a3a4 + b02 (−a1a42 + a2a3a4 )
J4 =
2a0a4 (−a0a32 − a12a4 + a1a2a3 )
1.8k1k3 − 2k2 + 4
=
7.2k1k3 − 3.6k12 − 8k2
Thuật toán di truyền bắt ñầu bằng việc tạo ngẫu nhiên một quần thể bao
gồm 200 nhiễm sắc thể, sau 15 thế hệ, tìm ñược bộ ñiều khiển PID thích hợp
với các thông số như sau, k1 = 3, k2 = 0.1, k3 = 30.
Hình 2: Chuẩn H2
Trang 497
Chương 4 : ðiều khiển bền vững
Trang 498
Chương 4 : ðiều khiển bền vững
d(t)
+ n(t)
0 1 0 0 0
1 0 0
x& = 0 − 3 0 x + 1 0u, z = x
0 0 1
0 0 0 0 1
Và bộ ñiều khiển K(s)=2I2
a. Tìm ñộ lợi vòng ña biến GK(j ω )
b. Tìm hàm nhạy và hàm bù nhạy
c. Tìm hàm truyền vòng kín từ r(t) ñến z(t) và các cực của vòng
kín
14. Thiết kế LQG dùng Matlab mô phỏng mô hình con lắc ngược
Trang 499
Chương 4 : ðiều khiển bền vững
u
ω G
K y d
1
7 8 s + 1 0 7 8 −1
Với: G =
6 7 0 2 6 7
s + 2
a. Vẽ ñường cong Nyquist với giá trị riêng của G.
b. Chứng minh rằng G có mối liên hệ trạng thái sau:
− 1 0 7 − 8 7 8
x& = x+ u, y= x
0 − 2 − 12 14 6 7 0
k
c. Bằng cách ñánh giá tuyến tính của det(sI – A – BKC), với K = 1
0 k2
Chứng minh rằng 3 – 50k2 + 47k1 > 0 là ñiều kiện cần ñể hệ thống ổn
ñịnh.
Chú ý: ñể ñơn giản hoá phép tính, ta ñặt k1 = k + δ và k 2 = k − δ .
16. Thiết kế LQG cho hệ thống sau:
x&1 1 1 x1 1 0 0
x& = 0 1 x + σ 1 0ω + 1u
2 2
ρ ( x1 + x 2 )
z=
u
x
y = [1 0] 1 + [0 1]ω
x2
a. Chứng minh rằng bộ ñiều khiển tối ưu ñược cho bởi:
αβ (1 − 2s )
k= 2
s + (α + β − 2) s + 1 + αβ
Với: α = 2 + 4 + ρ ; β = 2 + 4 + σ
b. Chỉ tiêu chất lượng tối ưu là gì? Chỉ tiêu chất lượng tối ưu thay ñổi
như thế nào với σ và ρ ?
Trang 500