You are on page 1of 503

ðẠI HỌC QUỐC GIA TP HỒ CHÍ MINH

TRƯỜNG ðẠI HỌC BÁCH KHOA

NGUYỄN THỊ PHƯƠNG HÀ

LÝ THUYẾT
ðIỀU KHIỂN HIỆN ðẠI

NHÀ XUẤT BẢN ðẠI HỌC QUỐC GIA


TP HỒ CHÍ MINH - 2007
LÔØI NOÙI ÑAÀU

Lyù thuyeát ñieàu khieån töï ñoäng vaø Lyù thuyeát ñieàu khieån hieän ñaïi laø
hai moân hoïc ñaëc thuø cuûa ngaønh Ñieàu khieån töï ñoäng.
Phöông phaùp phaân tích vaø thieát keá heä thoáng trong mieàn thôøi gian
vaø taàn soá ñöôïc trình baøy trong giaùo trình Lyù thuyeát ñieàu khieån töï ñoäng.
Caùch tieáp caän döïa treân caùc coâng thöùc toaùn hoïc hay nhöõng ñònh luaät khoa
hoïc ñeå moâ taû heä thoáng ñaõ ñöôïc giaûn löôïc nhöõng yeáu toá baát ñònh vaø phöùc
taïp thöôøng cho ñaùp soá raát chính xaùc. Tuy nhieân yeáu ñieåm chính cuûa caùch
tieáp caän naøy laø phaûi tìm ra coâng thöùc toaùn hoïc hay gæa töôûng nhöõng ñieàu
kieän vaän haønh heä thoáng cho gioáng vôùi thöïc teá , maø ñieàu naøy khoâng theå
thöïc hieän theo caùch kinh ñieån thoâng thöôûng. Khi heä thoáng phöùc taïp caùch
tieáp caän thaønh coâng laø ñieàu khieån tích hôïp, keát hôïp ñöôïc caùc phöông
phaùp ñieàu khieån kinh ñieån, hieän ñaïi vôùi coâng ngheä tính toaùn meàm mang
tính thoâng minh.
Muïc ñích cuûa baøi toaùn ñieàu khieån laø naâng cao chaát löôïng cuûa heä
thoáng, caøi ñaët caùc boä ñieàu khieån ñaûm baûo chæ tieâu chaát löôïng toái öu trong
caùc ñieàu kieän raøng buoäc hoaëc heä thoáng ñöôïc thieát keá phaûi coù tính thích
nghi vaø beàn vöõng trong moâi tröôøng laøm vieäc luoân bieán ñoäng.
Quyeån saùch Lyù thuyeát ñieàu khieån hieän ñaïi goàm 4 chöông.
Chöông 1 Coâng ngheä tính toùan meàm
trình baøy caùc khaùi nieäm cô baûn vaø moät soá öùng duïng coâng ngheä tính toaùn
meàm trong ñieàu khieån. Trình töï thieát keá boä ñieàu khieån môø, môø toái öu,
caùc boä môø thích nghi, nhaän daïng vaø ñieàu khieån duøng maïng nô-ron, giaûi
thuaät di truyeàn tìm kieám lôøi giaûi toái öu ñöôïc ñeà caäp qua caùc ví duï minh
hoïa mang tính giôùi thieäu toång quan.
Chöông 2 Ñieàu khieån toái öu
Ñaëc ñieåm cöïc trò cuûa heä thoáng khi xaây döïng baøi toaùn toái öu vaø
thaønh laäp haøm chæ tieâu chaát löôïng, haøm Hamilton. Caùc phöông phaùp toái
öu ñöôïc trình baøy laø phöông phaùp bieán phaân coå ñieån Euler-Lagrange,
nguyeân lyù cöïc ñaïi Pontryagin, qui hoaïch ñoäng Bellman vaø ñieàu khieån toái
öu tuyeán tính daïng toaøn phöông LQR. Nhaän xeùt & choïn löïa giaûi phaùp toái
öu cho baøi toaùn . Caùc ví duï minh hoïa ñöôïc trình baøy theo nhieàu caùch giaûi
khaùc nhau vaø ñöôïc kieåm chöùng baèng chöông trình moâ phoûng trong
MATLAB.
Chöông 3 Ñieàu khieån thích nghi
Khaùi nieäm veà ñieàu khieån thích nghi, öôùc löôïng tham soá vaø phaân
loaïi heä thoáng thích nghi. Heä thích nghi moâ hình tham chieáu vôùi luaät MIT
laø troïng taâm cuûa chöông, ñöôïc dieãn giaûi qua caùc ví duï thieát keá boä môø
thích nghi, nô-ron môø thích nghi cho heä thoáng ñoäng. Heä töï chænh ñònh
STR giaùn tieáp vaø tröïc tieáp vôùi nhieãu tieàn ñònh & nhieãu ngaãu nhieân. Kyõ
thuaät chænh ñònh vaø lòch trình ñoä lôïi ñöôïc trình baøy ôû phaàn cuoái chöông.
Thoâng qua caùc ví duï töø ñôn giaûn ôû chöông 1 ñeán caùc ví duï phöùc taïp ôû
chöông 3 baøi toaùn thieát keá boä ñieàu khieån thích nghi ñöôïc laøm saùng toû
daàn. Phöông phaùp thieát keá duøng lyù thuyeát oån ñònh Lyapunov ñöôïc xem laø
giaûi phaùp khaû thi trong vieäc kieåm soaùt tính oån ñònh cuûa heä thoáng thích
nghi.
Chöông 4 Ñieàu khieån beàn vöõng
Khaùi nieäm ñieàu khieån beàn vöõng, caùc pheùp toaùn cô baûn trong khaûo
saùt tính beàn vöõng cuûa heä SISO vaø MIMO. Boä quan saùt, boä loïc Kalman,
giaûi thuaät thieát keá vaø ví duï minh hoïa ñöôïc dieãn giaûi trong phöông phaùp
LQG. Ñieàu khieån beàn vöõng H∞ ñöôïc trình baøy qua bieåu ñoà Bode ña bieán,
haøm nhaïy vaø haøm buø nhaïy, thuû tuïc thieát keá naén daïng voøng LSDP, ví duï
thieát keá H∞ caùnh tay meàm deûo .Thieát keá toái öu H2 ñöôïc ñeà caäp trong ví
duï öùng duïng giaûi thuaät di truyeàn .
Maëc duø ñaõ coá gaéng söu taàm nhieàu taøi lieäu cuûa caùc Tröôøng Ñaïi
Hoïc trong nöôùc vaø treân theá giôùi, song noäi dung quyeån saùch khoù traùnh
khoûi nhöõng thieáu soùt vaø haïn cheá.
Taùc giaû xin chaân thaønh caûm ôn caùc Thaày giaùo, Coâ giaùo Boä moân
Ñieàu khieån töï ñoäng, caùc em sinh vieân, Ban coâng taùc Giaùo trình Tröôøng
Ñaïi Hoïc Baùch Khoa vaø Nhaø Xuaát baûn Ñaïi Hoïc Quoác Gia Tp HCM ñaõ
taïo ñieàu kieän vaø giuùp ñôõ nhieät tình ñeå hoaøn thaønh quyeån saùch naøy.
Taùc giaû chaân thaønh caûm ôn nhöõng yù kieán ñoùng goùp cuûa caùc baïn
ñoïc xa gaàn ñeå quyeån saùch ñöôïc hoaøn thieän hôn.
Thö goùp yù xin göûi veà Boä moân Ñieàu khieån töï ñoäng-Khoa Ñieän-Ñieän töû
Tröôøng Ñaïi Hoïc Baùch Khoa – ÑHQG Tp HCM.
Ñòa chæ 268 Lyù Thöôøng Kieät, Quaän 10, Tp HCM
Ñieän thoïai : 08 - 8654357
Email : ntpha@hcmut.edu.vn
phuonghagv@yahoo.com
Taùc giaû
Mục lục

Chương 1: CÔNG NGHỆ TÍNH TOÁN MỀM ........................................5


1.1. Giới thiệu về công nghệ tính toán mềm ........................................6

1.2. ðiều khiển mờ .................................................................................6


1.2.1. Khái niệm cơ bản.....................................................................7
1.2.2. Bộ ñiều khiển mờ...................................................................15
1.2.3. Thiết kế PID mờ ....................................................................29
1.2.4. Hệ mờ lai ...............................................................................35
1.2.5. Ứng dụng ñiều khiển mờ trong thiết kế hệ thống ..................38

1.3. Mạng nơron nhân tạo...................................................................60


1.3.1. Cấu trúc mạng nơron nhân tạo...............................................60
1.3.2. Phân loại mạng nơron nhân tạo .............................................64
1.3.3. Các phương pháp huấn luyện mạng nơ-ron...........................66
1.3.4. Mạng truyền thẳng một lớp ...................................................67
1.3.5. Mạng truyền thẳng nhiều lớp ................................................77
1.3.6. Nhận dạng mô hình và ñiều khiển sử dụng mạng nơron .......80
1.3.7. Thuật toán học trực tuyến cấu trúc, thông số mạng nơron
mờ ñộng .........................................................................84
1.3.8. Kết luận..................................................................................93

1.4. Thuật toán di truyền (GA) ...........................................................94


1.4.1. Giới thiệu ...............................................................................94
1.4.2. Các phép toán của thuật toán di truyền..................................94
1.4.3. Cấu trúc của thuật toán di truyền tổng quát ...........................99
1.4.4. Ví dụ minh họa ....................................................................100
1.4.5. Kết luận................................................................................107

1.5. Sự kết hợp các thành phần của tính toán mềm........................108
1.5.1. Kết hợp mạng nơ-ron nhân tạo và logic mờ ........................108
1.5.2. Kết hợp giải thuật di truyền và logic mờ .............................109
1.5.3. Kết hợp mạng nơ-ron và giải thuật di truyền.......................110

1.6. Hệ thống ñiều khiển tích hợp.....................................................113


1.6.1. Khái niệm.............................................................................113
1.6.2. Một số hệ thống tích hợp .....................................................113
1.6.3. Ứng dụng thuật toán GA thiết kế bộ ñiều khiển PID
tối ưu H2/H∞ ................................................................114

Câu hỏi ôn tập và bài tập ................................................................124

Chương 2 ðIỀU KHIỂN TỐI ƯU.........................................................125


2.1 Chất lượng tối ưu.........................................................................125
2.1.1 ðặc ñiểm của bài toán tối ưu ................................................125
2.1.2 Xây dụng bài toán tối ưu ......................................................129
2.1.3 Ví dụ .....................................................................................135

2.2 Các phương pháp ñiều khiển tối ưu...........................................154


2.2.1 Phương pháp biến phân cổ ñiển Euler_Lagrange .................154
2.2.2 Phương pháp quy hoạch ñộng Belman .................................173
2.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton ..........................181
2.2.4 Nhận xét................................................................................202

2.3 ðiều khiển tối ưu các hệ tuyến tính với phiếm hàm dạng toàn
phương ..........................................................................................203
2.3.1 Ổn ñịnh Lyapunov ñối với hệ thống tuyến tính....................203
2.3.2 ðiều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng
toàn phương _ Phương trình Riccati ñối với hệ liên tục.......204
2.3.3 Phương trình Riccati ñối với hệ rời rạc ................................206
2.3.4 Các bước giải bài toán toàn phương tuyến tính ....................209
2.3.5 Nhận xét................................................................................219

2.4 Ứng dụng Matlab giải bài toán tối ưu........................................219


2.4.1 Tối ưu hoá tĩnh......................................................................219
2.4.2 ðiều khiển tối ưu cánh tay máy hồi tiếp góc θ .....................220
2.4.3 Hệ thống tác ñộng nhanh ......................................................225
2.4.4 LQR liên tục và rời rạc .........................................................234

Câu hỏi ôn tập và bài tập ..................................................................252

Chương 3: ðIỀU KHIỂN THÍCH NGHI..............................................257


3.1 Khái niệm .....................................................................................257
3.1.1 ðịnh nghĩa ............................................................................257
3.1.2 Nhận dạng hệ thống ..............................................................257
3.1.3 Ước lượng tham số thích nghi thời gian thực .......................258
3.1.4 Phân loại ...............................................................................258
3.1.5 Ứng dụng ..............................................................................259

3.2 Hệ thích nghi mô hình tham chiếu – MRAS .............................260


3.2.1 Sơ ñồ chức năng ..................................................................260
3.2.2 Luật MIT ..............................................................................261
3.2.3 Nội dung, phương pháp thiết kế MRAS ...............................266
3.2.4 Thiết kế MRAS dùng lý thuyết ổn ñịnh của Lyapunov........308
3.2.5 Kết luận ................................................................................320

3.3 Bộ tự chỉnh ñịnh...........................................................................321


3.3.1 ðặt vấn ñề ............................................................................321
3.3.2 Bộ tự chỉnh ñịnh gián tiếp.....................................................323
3.2.3 Bộ tự chỉnh ñịnh trực tiếp .....................................................330
3.3.4 Kết nối giữa MRAS và STR .................................................338
3.3.5 ðiều khiển dự báo thích nghi................................................340
3.3.6 Kết luận.................................................................................350

3.4 Chỉnh ñịnh tự ñộng và lịch trình ñộ lợi .....................................351


3.4.1 Giới thiệu ..............................................................................351
3.4.2 Kỹ thuật chỉnh ñịnh ..............................................................352
3.4.3 Lịch trình ñộ lợi ....................................................................355
3.4.4 Xây dựng lịch trình ...............................................................356
3.4.5 Ứng dụng .............................................................................359
3.4.6 Kết luận.................................................................................361

3.5. ðiều khiển mờ thích nghi ...........................................................361


3.5.1. ðiều khiển hồi tiếp tuyến tính hóa.......................................362
3.5.2. Thiết kế BðK mờ thích nghi gián tiếp ................................364
3.5.3. Thết kế BðK mờ thích nghi trực tiếp ..................................371
3.5.4. Một số ứng dụng..................................................................375

3.6. ðiều khiển thích nghi hệ ñộng mạng DFNN ............................394


3.6.1. ðiều khiển thích nghi dựa trên mô hình ngược DFNN .......394
3.6.2. Quy trình ñiều khiển thích nghi với mạng DFNN ...............395
3.6.3. ðiều khiển thích nghi hệ ñộng với khâu PD bù sai số.........397
3.6.4. Ví dụ minh họa ....................................................................398

Câu hỏi ôn tập và bài tập ........................................................................408


Chương 4 ðIỀU KHIỂN BỀN VỮNG..................................................411
4.1 Giới thiệu ......................................................................................411
4.1.1 Khái niệm ñiều khiển bền vững............................................411
4.1.2 Chuẩn của tín hiệu ................................................................412
4.1.3 ðại số ma trận.......................................................................414
4.1.4 Trị suy biến của ma trận – ñộ lợi chính ................................420
4.1.5 Ổn ñịnh nội ...........................................................................423
4.1.6 ðịnh lý ñộ lợi nhỏ.................................................................424
4.1.7 Ổn ñịnh bền vững .................................................................424

4.2 Phương pháp LQG ......................................................................427


4.2.1 ðặt vấn ñề .............................................................................427
4.2.2 Bộ quan sát ...........................................................................428
4.2.3 Bộ lọc Kalman ......................................................................430
4.2.4 Giải thuật thiết kế LQG ........................................................441
4.2.5 Ví dụ .....................................................................................443

4.3 ðiều khiển bền vững H∞ ..............................................................446


4.3.1 Biểu ñồ Bode ña biến............................................................446
4.3.2 Hàm nhạy và hàm bù nhạy ...................................................449
4.3.3 Thiết kế bền vững H∞ ...........................................................454
4.3.4 Nắn dạng vòng H∞ ................................................................462

4.4 Thiết kế tối ưu H2 .........................................................................467


4.4.1 ðặt vấn ñề .............................................................................467
4.4.2 Tối ưu H2 ..............................................................................467
4.4.3 Vấn ñề H2 và lời giải của nó .................................................469

4.5 Ứng dụng trong Matlab ..............................................................472


4.5.1 LQG hệ lò xo ñệm ................................................................472
4.5.2 Thiết kế H∞ cánh tay mềm dẻo .............................................476
4.5.3 ðiều khiển bền vững H∞ với bài toán bồn nước...................483
4.5.4 Ứng dụng thuật toán GA thiết kế bộ ñiều khiển PID tối ưu
H2/H∞ ................................................................................492

Câu hỏi ôn tập và bài tập ........................................................................499

Tài liệu tham khảo ...................................................................................501


Chương 1 : Công nghệ tính toán mềm

Chương 1

CÔNG NGHỆ TÍNH TOÁN MỀM


( Soft Computing technology )

Vài nét về lịch sử phát triển lý thuyết ñiều khiển .


- Phương pháp biến phân cổ ñiển Euler_Lagrange 1766 .
- Tiêu chuẩn ổn ñịnh Lyapunov 1892 .
- Trí tuệ nhân tạo 1950 .
- Hệ thống ñiều khiển máy bay siêu nhẹ 1955 .
- Nguyên lý cực tiểu Pontryagin 1956 .
- Phương pháp quy hoạch ñộng Belman 1957 .
- ðiều khiển tối ưu tuyến tính dạng toàn
phương LQR ( LQR : Linear Quadratic
Regulator ) .
- ðiều khiển kép Feldbaum 1960 .
- Thuật toán di truyền 1960 .
- Nhận dạng hệ thống 1965 .
- Logic mờ 1965 .
- Luật ñiều khiển hệ thống thích nghi mô hình tham chiếu MRAS và bộ tự
chỉnh ñịnh STR 1970 ( MRAS : Model-Reference Adaptive System , STR :
Self-Tuning Regulator ) .
- Hệ tự học Tsypkin 1971 .
- Sản phẩm công nghiệp 1982 .
- Lý thuyết bền vững 1985 .
- Công nghệ tính toán mềm và ñiều khiển tích hợp 1985 .

Trang 5
Chương 1 : Công nghệ tính toán mềm

1.1. Giới thiệu về công nghệ tính toán mềm

Trong thực tế cuộc sống, các bài toán liên quan ñến hoạt ñộng nhận
thức, trí tuệ của con người ñều hàm chứa những ñại lượng, thông tin mà bản
chất là không chính xác, không chắc chắn, không ñầy ñủ. Ví dụ: sẽ chẳng
bao giờ có các thông tin, dữ liệu cũng như các mô hình toán ñầy ñủ và chính
xác cho các bài toán dự báo thời tiết. Nhìn chung con người luôn ở trong bối
cảnh là không có thông tin ñầy ñủ và chính xác cho các hoạt ñộng ra quyết
ñịnh của bản thân mình.
Trong lĩnh vực khoa học kĩ thuật cũng vậy, các hệ thống phức tạp
trên thực tế thường không thể mô tả ñầy ñủ và chính xác bởi các phương
trình toán học truyền thống. Kết quả là những cách tiếp cận kinh ñiển dựa
trên kỹ thuật phân tích và các phương trình toán học nhanh chóng tỏ ra
không còn phù hợp. Vì thế, công nghệ tính toán mềm chính là một giải pháp
trong lĩnh vực này.

Một số ñặc ñiểm của công nghệ tính toán mềm:


• Tính toán mềm căn cứ trên các ñặc ñiểm, hành vi của con người và
tự nhiên ñể ñưa ra các quyết ñịnh hợp lý trong ñiều kiện không chính
xác và không chắc chắn.
• Các thành phần của tính toán mềm có sự bổ sung, hỗ trợ lẫn nhau.
• Tính toán mềm là một hướng nghiên cứu mở, bất kỳ một kỹ thuật
mới nào ñược tạo ra từ việc bắt chước trí thông minh của con người
ñều có thể trở thành một thành phần mới của tính toán mềm.
Công nghệ tính toán mềm bao gồm 3 thành phần chính:
 ðiều khiển mờ
 Mạng nơ-ron nhân tạo
 Lập luận xác suất ( thuật giải di truyền và lý thuyết hỗn mang..).
Ta sẽ ñi vào phân tích từng thành phần của công nghệ tính toán mềm.

1.2. ðiều khiển mờ


Trong công nghệ tính toán mềm, thành phần phát triển vượt bậc nhất và
ñược ứng dụng rộng rãi nhất ñó là logic mờ.
Khái niệm về logic mờ ñược giáo sư L.A Zadeh ñưa ra lần ñầu tiên năm
1965, tại trường ðại học Berkeley, bang California - Mỹ. Từ ñó lý thuyết
mờ ñã ñược phát triển và ứng dụng rộng rãi.
Năm 1970 tại trường Mary Queen, London – Anh, Ebrahim Mamdani ñã
dùng logic mờ ñể ñiều khiển một máy hơi nước mà ông không thể ñiều khiển
ñược bằng kỹ thuật cổ ñiển. Tại ðức Hann Zimmermann ñã dùng logic mờ

Trang 6
Chương 1 : Công nghệ tính toán mềm

cho các hệ ra quyết ñịnh. Tại Nhật logic mờ ñược ứng dụng vào nhà máy xử
lý nước của Fuji Electronic vào 1983, hệ thống xe ñiện ngầm của Hitachi
vào 1987.
Lý thuyết mờ ra ñời ở Mỹ, ứng dụng ñầu tiên ở Anh nhưng phát triển mạnh
mẽ nhất là ở Nhật. Trong lĩnh vực Tự ñộng hoá logic mờ ngày càng ñược
ứng dụng rộng rãi. Nó thực sự hữu dụng với các ñối tượng phức tạp mà ta
chưa biết rõ hàm truyền, logic mờ có thể giải quyết các vấn ñề mà ñiều
khiển kinh ñiển không làm ñược.

1.2.1 Khái niệm cơ bản

Một cách tổng quát, một hệ thống mờ là một tập hợp các qui tắc dưới dạng
If … Then … ñể tái tạo hành vi của con người ñược tích hợp vào cấu trúc
ñiều khiển của hệ thống.
Việc thiết kế một hệ thống mờ mang rất nhiều tính chất chủ quan, nó tùy
thuộc vào kinh nghiệm và kiến thức của người thiết kế. Ngày nay, tuy kỹ
thuật mờ ñã phát triển vượt bậc nhưng vẫn chưa có một cách thức chính quy
và hiệu quả ñể thiết kế một hệ thống mờ. Việc thiết kế vẫn phải dựa trên
một kỹ thuật rất cổ ñiển là thử - sai và ñòi hỏi phải ñầu tư nhiều thời gian ñể
có thể ñi tới một kết quả chấp nhận ñược.

ðể hiểu rõ khái niệm “MỜ” là gì ta hãy thực hiện phép so sánh sau :
Trong toán học phổ thông ta ñã học khá nhiều về tập hợp, ví dụ như tập các
số thực R, tập các số nguyên tố P={2,3,5,...}… Những tập hợp như vậy ñược
gọi là tập hợp kinh ñiển hay tập rõ, tính “RÕ” ở ñây ñược hiểu là với một
tập xác ñịnh S chứa n phần tử thì ứng với phần tử x ta xác ñịnh ñược một giá
trị y=S(x).
Giờ ta xét phát biểu thông thường về tốc ñộ một chiếc xe môtô : chậm,
trung bình, hơi nhanh, rất nhanh. Phát biểu “CHẬM” ở ñây không ñược chỉ
rõ là bao nhiêu km/h, như vậy từ “CHẬM” có miền giá trị là một khoảng
nào ñó, ví dụ 5km/h – 20km/h chẳng hạn. Tập hợp L={chậm, trung bình, hơi
nhanh, rất nhanh} như vậy ñược gọi là một tập các biến ngôn ngữ. Với mỗi
thành phần ngôn ngữ xk của phát biểu trên nếu nó nhận ñược một khả năng
µ(xk) thì tập hợp F gồm các cặp (x, µ(xk)) ñược gọi là tập mờ.

1. ðịnh nghĩa tập mờ


Tập mờ F xác ñịnh trên tập kinh ñiển B là một tập mà mỗi phần tử của nó là
một cặp giá trị (x,µF(x)), với x∈ X và µF(x) là một ánh xạ :

Trang 7
Chương 1 : Công nghệ tính toán mềm

µF(x) : B → [0 1]
trong ñó : µF gọi là hàm thuộc , B gọi là tập nền.

2. Các thuật ngữ trong logic mờ


µ
miền tin cậy
1

MXð
Hình1.1:
• ðộ cao tập mờ F là giá trị h = SupµF(x), trong ñó supµF(x) chỉ giá trị nhỏ
nhất trong tất cả các chặn trên của hàm µF(x).
• Miền xác ñịnh của tập mờ F, ký hiệu là S là tập con thoả mãn :
S = SuppµF(x) = { x∈B | µF(x) > 0 }
• Miền tin cậy của tập mờ F, ký hiệu là T là tập con thoả mãn :
T = { x∈B | µF(x) = 1 }
• Các dạng hàm thuộc (membership function) trong logic mờ
Có rất nhiều dạng hàm thuộc như : Gaussian, PI-shape, S-shape, Sigmoidal,
Z-shape …

trapmf gbellmf trimf gaussmf gauss2mf smf


1

0.8

0.6

0.4

0.2

zmf psigmf dsigmf pimf sigmf


1

0.8

0.6

0.4

0.2

Trang 8
Chương 1 : Công nghệ tính toán mềm

3. Biến ngôn ngữ

Biến ngôn ngữ là phần tử chủ ñạo trong các hệ thống dùng logic mờ. Ở ñây
các thành phần ngôn ngữ của cùng một ngữ cảnh ñược kết hợp lại với nhau.
ðể minh hoạ về hàm thuộc và biến ngôn ngữ ta xét ví dụ sau :
Xét tốc ñộ của một chiếc xe môtô, ta có thể phát biểu xe ñang chạy:
- Rất chậm (VS)
- Chậm (S)
- Trung bình (M)
- Nhanh (F)
- Rất nhanh (VF)
Những phát biểu như vậy gọi là biến ngôn ngữ của tập mờ. Gọi x là giá trị
của biến tốc ñộ, ví dụ x =10km/h, x = 60km/h … Hàm thuộc tương ứng của
các biến ngôn ngữ trên ñược ký hiệu là :
µVS(x), µS(x), µM(x), µF(x), µVF(x)
µ

VS S M F VF
1

0.75
0.25

0 20 40 60 65 80 100 tốc ñộ
Hình 1.2:
Như vậy biến tốc ñộ có hai miền giá trị :
- Miền các giá trị ngôn ngữ :
N = { rất chậm, chậm, trung bình, nhanh, rất nhanh }
- Miền các giá trị vật lý :
V = { x∈B | x ≥ 0 }
Biến tốc ñộ ñược xác ñịnh trên miền ngôn ngữ N ñược gọi là biến ngôn ngữ.
Với mỗi x∈B ta có hàm thuộc :
x → µX = { µVS(x), µS(x), µM(x), µF(x), µVF(x) }
Ví dụ hàm thuộc tại giá trị rõ x = 65km/h là :
µX(65) = { 0;0;0.75;0.25;0 }

Trang 9
Chương 1 : Công nghệ tính toán mềm

4. Các phép toán trên tập mờ


Cho X,Y là hai tập mờ trên không gian nền B, có các hàm thuộc tương ứng
là µX, µY , khi ñó :
- Phép hợp hai tập mờ : X∪
∪Y
+ Theo luật Max µX∪Y(b) = Max{ µX(b) , µY(b) }
+ Theo luật Sum µX∪Y(b) = Min{ 1, µX(b) + µY(b) }
+ Tổng trực tiếp µX∪Y(b) = µX(b) + µY(b) - µX(b).µY(b)
- Phép giao hai tập mờ : X∩∩Y
+ Theo luật Min µX ∩ Y(b) = Min{ µX(b) , µY(b) }
+ Theo luật Lukasiewicz µX ∩ Y(b) = Max{0, µX(b)+µY(b)-1}
+ Theo luật Prod µX ∩ Y(b) = µX(b).µY(b)
- Phép bù tập mờ : µ X (b) = 1- µX(b)
c

5. Luật hợp thành

A. Mệnh ñề hợp thành


Ví dụ ñiều khiển mực nước trong bồn chứa, ta quan tâm ñến 2 yếu tố :
+ Mực nước trong bồn L = {rất thấp, thấp, vừa}
+ Góc mở van ống dẫn G = {ñóng, nhỏ, lớn}
Ta có thể suy diễn cách thức ñiều khiển như thế này :
Nếu mực nước = rất thấp Thì góc mở van = lớn
Nếu mực nước = thấp Thì góc mở van = nhỏ
Nếu mực nước = vừa Thì góc mở van = ñóng
Trong ví dụ trên ta thấy có cấu trúc chung là “Nếu A thì B” . Cấu trúc này
gọi là mệnh ñề hợp thành, A là mệnh ñề ñiều kiện, C = A⇒ B là mệnh ñề
kết luận.
ðịnh lý Mamdani :
“ðộ phụ thuộc của kết luận không ñược lớn hơn ñộ phụ thuộc ñiều kiện”
Nếu hệ thống có nhiều ñầu vào và nhiều ñầu ra thì mệnh ñề suy diễn có
dạng tổng quát như sau :
If N = ni and M = mi and … Then R = ri and K = ki and ….

B. Luật hợp thành mờ


Luật hợp thành là tên gọi chung của mô hình biểu diễn một hay nhiều hàm
thuộc cho một hay nhiều mệnh ñề hợp thành.

Trang 10
Chương 1 : Công nghệ tính toán mềm

Các luật hợp thành cơ bản


+ Luật Max – Min
+ Luật Max – Prod
+ Luật Sum – Min
+ Luật Sum – Prod

a. Thuật toán xây dựng mệnh ñề hợp thành cho hệ SISO


Luật mờ cho hệ SISO có dạng “If A Then B”
Chia hàm thuộc µA(x) thành n ñiểm xi , i = 1,2,…,n
Chia hàm thuộc µB(y) thành m ñiểm yj , j = 1,2,…,m
Xây dựng ma trận quan hệ mờ R
 µ R ( x1, y1) ... ... µ R ( x1, ym)   r11 ... ... r1m 
 µ ( x 2, y1) ... ... µ R ( x 2, ym) r 21 ... ... r 2m
R=  =
R

 ... ... ... ...   ... ... ... ... 


   
 µ R ( xn, y1) ... ... µ R ( xn, ym)   rn1 ... ... rnm 
Hàm thuộc µB’(y) ñầu ra ứng với giá trị rõ ñầu vào xk có giá trị
µB’(y) = aT.R , với aT = { 0,0,0,…,0,1,0….,0,0 }. Số 1 ứng với vị trí thứ k.
Trong trường hợp ñầu vào là giá trị mờ A’ thì µB’(y) là :
µB’(y) = { l1,l2,l3,…,lm } với lk=maxmin{ai,rik }.

b. Thuật toán xây dựng mệnh ñề hợp thành cho hệ MISO


Luật mờ cho hệ MISO có dạng :
“If cd1 = A1 and cd2 = A2 and … Then rs = B”
Các bước xây dựng luật hợp thành R :
• Rời rạc các hàm thuộc µA1(x1), µA2(x2), … , µAn(xn), µB(y)
• Xác ñịnh ñộ thoả mãn H cho từng véctơ giá trị rõ ñầu vào x={c1,c2,…,cn}
trong ñó ci là một trong các ñiểm mẫu của µAi(xi). Từ ñó suy ra
H = Min{ µA1(c1), µA2(c2), …, µAn(cn) }
• Lập ma trận R gồm các hàm thuộc giá trị mờ ñầu ra cho từng véctơ giá trị
mờ ñầu vào: µB’(y) = Min{ H, µB(y) } hoặc µB’(y) = H. µB(y)

Trang 11
Chương 1 : Công nghệ tính toán mềm

6. Giải mờ
Giải mờ là quá trình xác ñịnh giá trị rõ ở ñầu ra từ hàm thuộc µB’(y) của
tập mờ B’. Có 2 phương pháp giải mờ :
1. Phương pháp cực ñại
Các bước thực hiện :
- Xác ñịnh miền chứa giá trị y’, y’ là giá trị mà tại ñó µB’(y) ñạt Max
G = { y∈Y | µB’(y) = H }
- Xác ñịnh y’ theo một trong 3 cách sau :
+ Nguyên lý trung bình
+ Nguyên lý cận trái
+ Nguyên lý cận phải

µ
G

y1 y2

Hình 1.3:
y1 + y 2
• Nguyên lý trung bình : y’ =
2
• Nguyên lý cận trái : chọn y’ = y1
• Nguyên lý cận phải : chọn y’ = y2
2. Phương pháp trọng tâm
ðiểm y’ ñược xác ñịnh là hoành ñộ của ñiểm trọng tâm miền ñược bao bởi
trục hoành và ñường µB’(y).
Công thức xác ñịnh :

∫ yµ ( y)dy
S
y’ = trong ñó S là miền xác ñịnh của tập mờ B’
∫ µ (y)dy
S

Trang 12
Chương 1 : Công nghệ tính toán mềm

♦Phương pháp trọng tâm cho luật Sum-Min


Giả sử có m luật ñiều khiển ñược triển khai, ký hiệu các giá trị mờ ñầu ra
của luật ñiều khiển thứ k là µB’k(y) thì với quy tắc Sum-Min hàm thuộc sẽ là
m
µB’(y) = ∑µ
k =1
B 'k ( y ) , và y’ ñược xác ñịnh :

 m  m m

∫S  y ∑
k =1
µ B 'k ( y ) dy

∑ ( yµ B 'k ( y )dy )
k =1
∑M
k =1
k
y’ = m
= = m
(1.1)
m  
∫∑µ B 'k ( y )dy ∑  ∫ µ B ' y ( y )dy 
  ∑A k
S k =1 k =1  S  k =1

trong ñó Mi = ∫ yµ
S
B 'k ( y )dy và Ai = ∫µ
S
B 'k ( y )dy i=1,2,…,m

m1 m2 y

a b
Xét riêng cho trường hợp các hàm thuộc dạng hình thang như hình trên :
H
Mk = (3m22 − 3m12 + b 2 − a 2 + 3m2 b + 3m1a)
6
H
Ak = (2m2 – 2m1 + a + b)
2
Chú ý hai công thức trên có thể áp dụng cả cho luật Max-Min
♦ Phương pháp ñộ cao
Từ công thức (1.1), nếu các hàm thuộc có dạng Singleton thì ta ñược:
m

∑y
k =1
k Hk
y’ = m
với Hk = µB’k(yk)
∑H
k =1
k

ðây là công thức giải mờ theo phương pháp ñộ cao.

Trang 13
Chương 1 : Công nghệ tính toán mềm

7. Mô hình mờ Tagaki-Sugeno
Mô hình mờ mà ta nói ñến trong các phần trước là mô hình Mamdani. Ưu
ñiểm của mô hình Mamdani là ñơn giản, dễ thực hiện nhưng khả năng mô tả
hệ thống không tốt. Trong kỹ thuật ñiều khiển người ta thường sử dụng mô
hình mờ Tagaki-Sugeno (TS).
Tagaki-Sugeno ñưa ra mô hình mờ sử dụng cả không gian trạng thái mờ lẫn
mô tả linh hoạt hệ thống. Theo Tagaki/Sugeno thì một vùng mờ LXk ñược
mô tả bởi luật :
Rsk : If x = LXk Then x& = A( x k ) x + B( x k )u (1.2)
Luật này có nghĩa là: nếu véctơ trạng thái x nằm trong vùng LXk thì hệ thống
ñược mô tả bởi phương trình vi phân cục bộ x& = A( x k ) x + B( x k )u . Nếu
toàn bộ các luật của hệ thống ñược xây dựng thì có thể mô tả toàn bộ trạng
thái của hệ trong toàn cục. Trong (1.2) ma trận A(xk) và B(xk) là những ma
trận hằng của hệ thống ở trọng tâm của miền LXk ñược xác ñịnh từ các
chương trình nhận dạng. Từ ñó rút ra ñược :
x& = ∑ wk ( A( x k ) x + B( x k )u ) (1.3)
với wk(x) ∈ [0 , 1] là ñộ thoả mãn ñã chuẩn hoá của x* ñối với vùng mờ LXk
Luật ñiều khiển tương ứng với (1.2) sẽ là :
Rck : If x = LXk Then u = K(xk)x
Và luật ñiều khiển cho toàn bộ không gian trạng thái có dạng:
N
u = ∑ wk K ( x k ) x (1.4)
k =1

Từ (1.2) và (1.3) ta có phương trình ñộng học cho hệ kín:


x& = ∑ w k ( x) wl ( x)( A( x k ) + B( x k ) K ( x l )) x
Ví dụ 1.1:
Một hệ TS gồm hai luật ñiều khiển với hai ñầu vào x1,x2 và ñầu ra y.
R1 : If x1 = BIG and x2 = MEDIUM Then y1 = x1-3x2
R2 : If x1 = SMALL and x2 = BIG Then y2 = 4+2x1
ðầu vào rõ ño ñược là x1* = 4 và x2* = 60. Từ hình bên dưới ta xác ñịnh
ñược :
LXBIG(x1*) = 0.3 và LXBIG(x2*) = 0.35
LXSMALL(x1*) = 0.7 và LXMEDIUM(x2*) = 0.75

Trang 14
Chương 1 : Công nghệ tính toán mềm

Từ ñó xác ñịnh ñược :


Min(0.3 ; 0.75)=0.3 và Min(0.35 ; 0.7)=0.35
y1 = 4-3×60 = -176 và y2 = 4+2×4 = 12
Như vậy hai thành phần R1 và R2 là (0.3 ; -176) và (0.35 ; 12). Theo phương
pháp tổng trọng số trung bình ta có:
0.3 × (−176) + 0.35 × 12
y= = −74.77
0.3 + 0.35

1 1
0.7 0.75
0.3 0.35
0 4 10 0 60 100

1.2.2. Bộ ñiều khiển mờ


1. Cấu trúc một bộ ñiều khiển mờ

Sơ ñồ khối bộ ñiều khiển mờ

Một bộ ñiều khiển mờ gồm 3 khâu cơ bản:


+ Khâu mờ hoá
+ Thực hiện luật hợp thành
+ Khâu giải mờ

Trang 15
Chương 1 : Công nghệ tính toán mềm

Xét bộ ñiều khiển mờ MISO sau, với véctơ ñầu vào X = [u1 ... u n ]
T
u2

R1 If … Then…
H1
X y’
Rn If … Then …

Hn

Hình 1.4:

2. Nguyên lý ñiều khiển mờ

luật ñiều khiển

e Giao diện µ Thiết bị B Giao diện y’


ñầu vào hợp thành ñầu ra

X e u y
BðK MỜ ðỐI TƯỢNG

THIẾT BỊ ðO

Hình 1.5:

♦ Các bước thiết kế hệ thống ñiều khiển mờ.


+ Giao diện ñầu vào gồm các khâu: mờ hóa và các khâu hiệu chỉnh như
tỷ lệ, tích phân, vi phân …
+ Thiếp bị hợp thành : sự triển khai luật hợp thành R
+ Giao diện ñầu ra gồm : khâu giải mờ và các khâu giao diện trực tiếp
với ñối tượng.

Trang 16
Chương 1 : Công nghệ tính toán mềm

3. Thiết kế bộ ñiều khiển mờ


• Các bước thiết kế:
B1 : ðịnh nghĩa tất cả các biến ngôn ngữ vào/ra.
B2 : Xác ñịnh các tập mờ cho từng biến vào/ra (mờ hoá).
+ Miền giá trị vật lý của các biến ngôn ngữ.
+ Số lượng tập mờ.
+ Xác ñịnh hàm thuộc.
+ Rời rạc hoá tập mờ.
B3 : Xây dựng luật hợp thành.
B4 : Chọn thiết bị hơp thành.
B5 : Giải mờ và tối ưu hoá.
• Những lưu ý khi thiết kế BðK mờ
- Không bao giờ dùng ñiều khiển mờ ñể giải quyết bài toán mà có thể dễ
dàng thực hiện bằng bộ ñiều khiển kinh ñiển.
- Không nên dùng BðK mờ cho các hệ thống cần ñộ an toàn cao.
- Thiết kế BðK mờ phải ñược thực hiện qua thực nghiệm.
• Phân loại các BðK mờ
i. ðiều khiển Mamdani (MCFC)
ii. ðiều khiển mờ trượt (SMFC)
iii. ðiều khiển tra bảng (CMFC)
iv. ðiều khiển Tagaki/Sugeno (TSFC)

4. Ví dụ minh họa:

Ví dụ 1.2:
ðể ñiều khiển tự ñộng máy ñiều hoà nhiệt ñộ bằng kỹ thuật logic mờ, người
ta dùng hai cảm biến: Trong phòng là cảm biến nhiệt Ti , bên ngoài là cảm
biến nhiệt To. Việc ñiều hoà nhiệt ñộ thông qua ñiều khiển tốc ñộ quạt làm
lạnh máy ñiều hoà. Biết rằng:
- Tầm nhiệt ñộ quan tâm là [0oC - 50oC ]
- Tốc ñộ quạt là v ∈ [0 – 600 vòng/ phút ]
Hãy tính tốc ñộ quạt trong trường hợp sau:
Ti = 270C T0 = 320C

Trang 17
Chương 1 : Công nghệ tính toán mềm

Giải bài toán theo ñúng trình tự:

Bước 1: Xác ñịnh các biến ngôn ngữ vào – ra

Bước 2: Xác ñịnh tập mờ cho từng biến vào/ra

Ti,To : {Lạnh ,Vừa ,Nóng) tương ứng với {20, 25, 30oC)
V : {Zero, Chậm, Trung bình ,Nhanh, Max) tương ứng với {0, 150,
300, 450, 600 vòng/phút}

Hàm thuộc: ta chọn hàm thuộc là hàm tam giác


Ngõ vào:

Ngõ ra:

Xét trường hợp: Ti = 270C T0 = 320C


Ta có:
µ(270C) = {0 ; 0.6 ; 0.4}
µ(320C) = {0 ; 0 ; 1 }

Trang 18
Chương 1 : Công nghệ tính toán mềm

Bước 3: Xây dựng luật hợp thành mờ

To
Lạnh Vừa Nóng
Ti
Lạnh Zero Chậm Trung bình
Vừa Chậm Trung bình Nhanh

Nóng Trung bình Nhanh Max

Bước 4: Giải mờ và tối ưu hóa


• Chọn thiết bị hợp thành Max – Min:
µ(270C) = {0 ; 0.6 ; 0.4}
µ(320C) = {0 ; 0 ; 1 }
Luật max – min cho ta: Nhanh : 0.6
Max : 0.4
• Giải mờ:
♦ Phương pháp trọng tâm:
µ

m1 m2 y

a b
H
Mk = (3m22 − 3m12 + b 2 − a 2 + 3m2 b + 3m1a)
6
H
Ak = (2m2 – 2m1 + a + b)
2
m

∑M
k =1
k
y’ = m
= 530 vòng/phút
∑A
k =1
k

Trang 19
Chương 1 : Công nghệ tính toán mềm

♦ Phương pháp ñộ cao:


m

∑y
k =1
k Hk
y’ = m
với Hk = µB’k(yk)
∑H
k =1
k

0.6 × 450 + 0.4 × 600


y’ = = 510 vòng/phút
0.6 + 0.4

Bước 5: Vẽ ñồ thị và nhận xét


ðồ thị tốc ñộ quạt theo Ti
460
Do thi toc do quat (uu tien theo Ti)
440

420

400

380

360

340

320

300

280
53 54 55 56 57 58 59 60 61 62

ðồ thị tốc ñộ quạt theo To

Trang 20
Chương 1 : Công nghệ tính toán mềm

ðồ thị tốc ñộ quạt khi Ti và To thay ñổi


Do thi toc do quat khi Ti va To thay doi
600

500

400

300

200

100

0
50 52 54 56 58 60 62 64 66 68

Nhận xét:
-ðồ thị tốc ñộ quạt tăng tuyến tính khi vẽ theo Ti hoặc To
-Nếu cả 2 Ti và To thay ñổi bất kì thì ñồ thị (Ti +To,V) cũng tăng tuyến tính
và các ñiểm khác nằm ñối xứng 2 bên của ñường thẳng ñó.
-Kết quả ñiều khiển chấp nhận ñược.

Nếu vẫn chưa ñáp ứng ñược chất lượng ñề ra (sai số, ñộ vọt lố ..), ta có thể
tăng số phân cấp của các biến ngôn ngữ. Tuy nhiên, nếu tăng quá mức sẽ
dẫn ñến tình trạng quá khớp. Ví dụ:
Chọn các biến ngôn ngữ: Ti,To: {Rất lạnh, Lạnh,Vừa , Nóng, Rất nóng}
tương ứng với các nhiệt ñộ{15,20,25,30,35}
Tốc ñộ quạt vẫn là: {Zero ,Chậm ,Trung bình, Nhanh, Max}

To
Rất lạnh Lạnh Vừa Nóng Rất nóng
Ti
Rất lạnh Zero Zero Zero Chậm TB
Lạnh Zero Chậm Chậm TB Nhanh
Vừa Zero Chậm TB Nhanh Max
Nóng Chậm TB Nhanh Nhanh Max
Rất nóng TB Nhanh Max Max Max
Khi ñó, ta cũng sẽ thu ñược kết quả tương tự như trên.

Ví dụ 1.3:
Thiết kế bộ mờ ñiều khiển nhiệt ñộ.Bộ mờ có 2 ngõ vào là sai lệch e(t) [ET]
và ñạo hàm sai lệch de(t) [DET],một ngõ ra là ñạo hàm công suất [DP].

Trang 21
Chương 1 : Công nghệ tính toán mềm

Biết rằng:
_ Lò nhiệt có công suất là 5KW, tầm ño max là 200 0C, sai số là ± 5%.
_ Tầm thay ñổi của DET là -10 0 C / s → 10 0 C / s
_ Tầm thay ñổi của DP là -100W/s → 100W/s
Hãy tính côg suất cung cấp cho lò trong trường hợp sau:
ET= 80C DET= 9 0 C / s

Lời giải:
Bước 1: Xác ñịnh các biến ngôn ngữ vào – ra

ET = Tñặt – Tño
DET (i+1) = ( ET(i+1) – ET(i))/T
DP(i+1) = (P(i+1) – P(i))/T
 P(i+1)= P(i)+DP(i+1)*T ≤ Pmax = 5KW

Bước 2: Xác ñịnh tập mờ cho từng biến vào/ra

ET = { N3, N2, N1, ZERO, P1, P2, P3 }


DET = { N3, N2, N1, ZERO, P1, P2, P3 }
DP = { N3, N2, N1, ZERO, P1, P2, P3 }
P = { ZERO, P1, P2, P3, MAX }

Trang 22
Chương 1 : Công nghệ tính toán mềm

Bước 3: Xây dựng luật hợp thành mờ

DET
DP
N3 N2 N1 Z P1 P2 P3
N3 N3 N3 N3 N3 N2 N1 Z
N2 N3 N2 N2 N2 N1 Z P1
N1 N3 N2 N1 N1 Z P1 P2
Z N3 N2 N1 Z P1 P2 P3
P1 N2 N1 Z P1 P1 P2 P3
ET
P2 N1 Z P1 P2 P2 P2 P3
P3 Z P1 P2 P3 P3 P3 P3

Bước 4: Giải mờ và tối ưu hóa


• Chọn thiết bị hợp thành Max – Min:
Xét trường hợp: ET = 80C ; DET = 90C/s
µ(80C) = {0 ; 0 ; 0 ; 0 ; 0 ; 0.6 ; 0.4 }
µ(90C/s) = {0 ; 0 ; 0 ; 0 ; 0 ; 0.3 ; 0.7 }
Luật max – min cho ta:
ET: µ = 0.6 min
DET: µ = 0.3 0.3 P2
ET: µ = 0.4 min
DET: µ = 0.7 0.4 P3
ET: µ = 0.4 min max
DET: µ = 0.3 0.3 P3 0.6 P3
ET: µ = 0.6 min
DET: µ = 0.7 0.6 P3

Trang 23
Chương 1 : Công nghệ tính toán mềm

0.3P 2 + 0.6 P3 0.6 *100 + 0.3 * 200 / 3


Vậy DP = = = 88.89 W/S
0.6 + 0.3 0.6 + 0.3
Theo lý thuyết:
ET = 100C P = 5 KW
ET = 80C P = 4 KW
Do DP có 4 phân cấp dương nhưng P lại có 5 phân cấp dương nên sẽ có 2
trường hợp. Theo luật ñiều khiển mờ ta có:
• Chọn DP = { ZERO, P1, P2, P3 } ≡ { ZERO, P1, P2, P3 }= P
0.6 * 5 / 2 + 0.4 *15 / 4
P= = 3 KW
1
• Chọn DP = { ZERO, P1, P2, P3 } ≡ { P1, P2, P3, MAX }= P
0.6 *15 / 4 + 0.4 * 5
P= = 4.25 KW
1
Ta chọn P = 4.25 KW vì nó gần với giá trị lý thuyết hơn.
P = 4.25 + DP.T.10-3 < 5 KW
⇒ T < 8.4s
Ta chọn T = 8s ⇒ P = 4.96 KW
Ta tính giá trị T trong trường hợp xấu nhất ( ETmax ) và giữ nguyên giá trị
này trong suốt quá trình tính toán ñể so sánh kết quả.

Ví dụ 1.4:
Dùng ñiều khiển mờ ñể ñiều khiển hệ thống bơm xả nước tự ñộng. Hệ thống
sẽ duy trì ñộ cao bồn nước ở một giá trị ñặt trước như mô hình bên dưới.
♦Mô hình :

Ba bộ ñiều khiển mờ (control) sẽ ñiều khiển : bơm, van1, van2 sao cho mực
nước ở 2 bồn ñạt giá trị ñặt trước (set).

Trang 24
Chương 1 : Công nghệ tính toán mềm

♦Sơ ñồ simulink:

♦Sơ ñồ khối ñiều khiển:

Trang 25
Chương 1 : Công nghệ tính toán mềm

♦Thiết lập hệ thống ñiều khiển mờ :


•Xác ñịnh các ngõ vào/ra :
+ Có 4 ngõ vào gồm : sai lệch e1, e2; ñạo hàm sai lệch de1, de2
+ Có 3 ngõ ra gồm : control1, control2, control3
•Xác ñịnh biến ngôn ngữ :
Sai lệch E = {âm lớn, âm nhỏ, bằng không, dương nhỏ, dương lớn}
E = {NB, NM, ZR, PM, PB}
ðạo hàm D = {giảm nhanh, giảm vừa, không ñổi, tăng vừa, tăng nhanh}
D = {DF, DM, ZR, IM, IP}
ðiều khiển C = {ñóng nhanh,ñóng chậm,không ñổi,mở chậm,mở nhanh}
C = {CF, CS, NC, OS, OF}
•Luật ñiều khiển :
+ Khối “controller1” và “controller2” :
(Hai khối này chỉ khác nhau ở luật hợp thành)

Trang 26
Chương 1 : Công nghệ tính toán mềm

Luật hợp thành mờ Max – Min

DE Khối controller1
ERROR DB DM ZR IM IB
NB OF OF NC
NM OS
ZR OF OS NC CS CF
PM CS
PB NC CF CF
DE Khối controller2
ERROR DB DM ZR IM IB
NB CF CF NC
NM CS
ZR CF CS NC OS OF
PM OS
PB NC OF OF

+ Khối “control3”
ðây là khối ñiều tiết lưu lượng cho bồn 2, ta ñưa ra mức ưu tiên như sau :
Khi sai lệch bồn 1 lớn thì van2 sẽ ñiều tiết ñể sai lệch này nhỏ rồi mới ñến
bồn 2.
If error1=NB and de1=DB Then control=CF
If error1=NB and de1=DM Then control=CS
If error1=NB and de1=ZR Then control=CS
If error1=NM and de1=DB Then control=CS

Trang 27
Chương 1 : Công nghệ tính toán mềm

If error1=PB and de1=IB Then control=OF


If error1=PB and de1=IM Then control=OF
If error1=PB and de1=ZR Then control=OF
If error1=PM and de1=IB Then control= OF
If error1≠NB and error2=NB and de1≠DB and de2=DB Then control=OF
If error1≠NB and error2=NB and de1≠DB and de2=DM Then control=OF
If error1≠NB and error2=NB and de1≠DB and de2=ZR Then control=OF
If error1≠NB and error2=NM and de1≠DB and de2=DB Then control=OS
If error1≠NB and error2=NM and de1≠DB and de2=DM Then control=OS
If error1≠PB and error2=PB and de1≠IB and de2=IB Then control=CF
If error1≠PB and error2=PB and de1≠IM and de2=IB Then control=CS

•Kết quả ñáp ứng với các thông số hệ thống :


- Chiều cap bồn height=1m
- Diện tích ñáy area = 0.125m2
- Lưu lượng max pump maxflow = 1lit/s
- Diện tích ống dẫn pipe area = 0.001m2

mức nước ñặt Zdat=[0.5 0.3]


mức nước ban ñầu Zinit=[0 0]
z (m)

thời gian (s)

Trang 28
Chương 1 : Công nghệ tính toán mềm

mức nước ñặt Zdat=[0.5 0.4]


mức nước ban ñầu Zinit=[0.8 0]

z (m)

thời gian (s)

1.2.3. Thiết kế PID mờ

Có thể nói trong lĩnh vực ñiều khiển, bộ PID ñược xem như một giải pháp
ña năng cho các ứng dụng ñiều khiển Analog cũng như Digital. Theo một
nghiên cứu cho thấy có khoảng hơn 90% các bộ ñiều khiển ñược sử dụng
hiện nay là bộ ñiều khiển PID. Bộ ñiều khiển PID nếu ñược thiết kế tốt có
khả năng ñiều khiển hệ thống với chất lượng quá ñộ tốt (ñáp ứng nhanh, ñộ
vọt lố thấp) và triệt tiêu ñược sai số xác lập.
Việc thiết kế bộ PID kinh ñiển thường dựa trên phương pháp Zeigler-
Nichols, Offerein, Reinish … Tuy nhiên nếu ñối tượng ñiều khiển là phi
tuyến thì bộ ñiều khiển PID kinh ñiển không thể ñảm bảo chất lượng ñiều
khiển tại mọi ñiểm làm việc. Do ñó ñể ñiều khiển các ñối tượng phi tuyến
ngày nay người ta thường dùng kỹ thuật hiệu chỉnh PID mềm (dựa trên
phầm mềm), ñây chính là cơ sở của thiết kế PID mờ hay PID thích nghi.

1. Sơ ñồ ñiều khiển sử dụng PID mờ :

Trang 29
Chương 1 : Công nghệ tính toán mềm

Mô hình toán của bộ PID:


t
de(t )
u(t) = Kpe(t) + K I ∫ e( x)dx + K D
0
dt
KI
GPID(s) = K P + + KDs
s
Các tham số KP, KI, KD ñược chỉnh ñịnh theo từng bộ ñiều khiển mờ riêng
biệt dựa trên sai lệch e(t) và ñạo hàm de(t). Có nhiều phương pháp khác
nhau ñể chỉnh ñịnh bộ PID ( xem các phần sau) như là dựa trên phiếm hàm
mục tiêu, chỉnh ñịnh trực tiếp, chỉnh ñịnh theo Zhao, Tomizuka và Isaka …
Nguyên tắc chung là bắt ñầu với các trị KP, KI, KD theo Zeigler-Nichols, sau
ñó dựa vào ñáp ứng và thay ñổi dần ñể tìm ra hướng chỉnh ñịnh thích hợp.

2. Luật chỉnh ñịnh PID:


Tín hiệu ra
c1
ñặt d1
b1 b2
a2

Hình 1.7
a1 thời gian
+ Lân cận a1 ta cần luật ðK mạnh ñể rút ngắn thời gian lên, do vậy chọn: KP
lớn, KD nhỏ và KI nhỏ.

Trang 30
Chương 1 : Công nghệ tính toán mềm

+ Lân cận b1 ta tránh vọt lố lớn nên chọn: KP nhỏ, KD lớn, KI nhỏ.
+ Lân cận c1 và d1 giống như lân cận a1 và b1.

Ví dụ 1.5: Ví dụ ứng dụng Matlab


Xây dựng bộ PID mờ ñể ñiều khiển lò nhiệt. Hàm truyền lò nhiệt theo
Ke −Ts K
Zeigler-Nichols : G(s) = , tuyến tính hoá G(s) = .
Ls + 1 (Ts + 1)( Ls + 1)
Các bước thiết kế :
1. Xác ñịnh biến ngôn ngữ:
• ðầu vào : 2 biến
+ Sai lệch: ET = ðo - ðặt / ðặt - ðo
ET (i + 1) − E (i )
+ Tốc ñộ tăng DET = , với T là chu kỳ lấy mẫu.
T
• ðầu ra : 3 biến
K p max − K p
+ KP hệ số tỷ lệ ( K 0p = )
K p − K p min
+ KI hệ số tích phân
+ KD hệ số vi phân
• Số lượng biến ngôn ngữ
ET = {âm nhiều, âm vừa, âm ít, zero, dương ít, dương vừa, dương nhiều}
ET = { N3, N2, N1, ZE, P1, P2, P3 }
DET = { âm nhiều, âm vừa, âm ít, zero, dương ít, dương vừa, dương nhiều}
DET = { N31, N21, N11, ZE1, P11, P21, P31 }
KP/KD = { zero, nhỏ, trung bình, lớn, rất lớn } = {Z, S, M, L,U}
KI = {mức 1,mức 2,mức 3,mức 4, mức 5} = {L1,L2,L3,L4,L5}
µ
N3 N2 N1 ZE P1 P2 P3

ET
0
-12 -8 -4 0 4 8 12 C

Trang 31
Chương 1 : Công nghệ tính toán mềm

µ
N31 N21 N11 ZE1 P11 P21 P31

DET
0
-0.6 -0.4 -0.2 0 0.2 0.4 0.6 C/s

µ
Z S M L U

KD
0 0.25 0.5 0.75 1 KP

µ
L1 L2 L3 L4 L5

1 1.2 1.4 1.6 1.8 KI

2. Luật hợp thành:

Có tổng cộng là 7x7x3=147 luật IF … THEN

Trang 32
Chương 1 : Công nghệ tính toán mềm

Luật chỉnh ñịnh KP:

KP DET
N31 N21 N11 ZE1 P11 P21 P31
N3 U U U U U U U
N2 L L L L L L L
N1 M M M M M M M
ET ZE Z Z Z Z Z Z Z
P1 M M M M M M M
P2 L L L L L L L
P3 U U U U U U U

Luật chỉnh ñịnh KD:

KD DET
N31 N21 N11 ZE1 P11 P21 P31
N3 Z Z Z Z Z Z Z
N2 M M M M M M M
N1 L L L L L L L
ET ZE U U U U U U U
P1 L L L L L L L
P2 M M M M M M M
P3 Z Z Z Z Z Z Z

Luật chỉnh ñịnh KI:

KI DET
N31 N21 N11 ZE1 P11 P21 P31
N3 L1 L1 L1 L1 L1 L1 L1
N2 L3 L2 L2 L1 L2 L2 L3
N1 L4 L3 L2 L1 L2 L3 L4
ET ZE L5 L4 L3 L2 L3 L4 L5
P1 L4 L3 L2 L1 L2 L3 L4
P2 L3 L2 L2 L1 L2 L2 L3
P3 L1 L1 L1 L1 L1 L1 L1

Trang 33
Chương 1 : Công nghệ tính toán mềm

Biểu diễn luật chỉnh ñịnh KP trong không gian

3. Chọn luật và giải mờ


+ Chọn luật hợp thành theo quy tắc Max-Min
+ Giải mờ theo phương pháp trọng tâm.
4. Kết quả mô phỏng
Với các thông số : K=1; T=60; L=720
Từ ñây theo Zeigler-Nichols ta tìm ra ñược bộ ba thông số {KP, KI, KD }
ðồ thị dưới ñây sẽ cho ta thấy sự khác biệt của ñiều khiển mờ so với ñiều
khiển kinh ñiển.
Tham số theo
T (0C)
Zeigler-Nichols

Tham số
PID mờ

t (s)

Trang 34
Chương 1 : Công nghệ tính toán mềm

1.2.4. Hệ mờ lai
Hệ mờ lai (Fuzzy Hybrid) là một hệ thống ñiều khiển tự ñộng trong ñó thiết
bị ñiều khiển bao gồm: phần ñiều khiển kinh ñiển và phần hệ mờ

Các dạng hệ mờ lai phổ biến:


1. Hệ mờ lai không thích nghi

Bộ tiền
BỘ ðK ðỐI TƯỢNG
Xử lý mờ

Hình1.8

2. Hệ mờ lai cascade

∆u
BðK MỜ

x BðK + u y
KINH ðIỂN ðỐI TƯỢNG

Hình 1.9
3. Công tắc mờ
ðiều khiển hệ thống theo kiểu chuyển ñổi khâu ñiều khiển có tham số ñòi
hỏi thiết bị ñiều khiển phải chứa ñựng tất cả các cấu trúc và tham số khác
nhau cho từng trường hợp. Hệ thống sẽ tự chọn khâu ñiều khiển có tham số
phù hợp với ñối tượng.

Bộ ñiều khiển n BðK MỜ

x y
Bộ ñiều khiển 1 ðối tượng
u

Hình 1.10

Trang 35
Chương 1 : Công nghệ tính toán mềm

Ví dụ 1.6:
Hãy xét sự khác biệt khi sử dụng bộ tiền xử lý mờ ñể ñiều khiển ñối tượng
K
gồm khâu có vùng không nhạy là ∆u nối tiếp với khâu G ( s ) = .
s (1 + 0.2s )
Chọn BðK PI với tham số KP = 10, TI = 0.3sec.

ðối tượng
x E + 1 -∆u y
Bộ mờ KR + G(s)
∆x TI s ∆u
DE

Sử dụng Simulink kết hợp với toolbox FIS Editor của Matlab ñể mô phỏng
hệ thống trên.
ðáp ứng hệ thống khi không có bộ mờ:

Thử với các giá trị ∆u và K khác nhau cho thấy ñặc tính ñộng của hệ sẽ xấu
ñi khi vùng chết rộng hoặc hệ số khuếch ñại lớn. ðể hiệu chỉnh ñặc tính
ñộng của hệ thống ta ñưa vào bộ lọc mờ như hình vẽ ở trên.

Trang 36
Chương 1 : Công nghệ tính toán mềm

Xây dựng luật ñiều khiển với 2 ñầu vào và một ñầu ra như sau:
DE
∆x NB NS ZE PS PB
NB NB NS
NS NS NS NS ZE
E ZE NB NS ZE PS PB
PS PS PS PS PS
PB PB PS PB
Tất cả 18 luật có khuôn dạng như sau:
Nếu E = x1 và DE = x2 Thì ∆x = x3
Trong ñó x1, x2, x3 ∈ {NB, NS, ZE, PS, PB}
µ µ
NB NS ZE PS PB NB NS ZE PS PB

-1 0 1 E -1 0 1 ∆x
-20 0 20 DE

Từ hai ñồ thị trên ta thấy ñược bộ mờ ñã cải thiện rất tốt ñặc tính ñộng của
hệ thống. Thử với nhiều ∆u khác nhau ta sẽ thấy ñáp ứng hầu như không
phụ thuộc vào ∆u .

Trang 37
Chương 1 : Công nghệ tính toán mềm

1.2.5. Ứng dụng ñiều khiển mờ trong thiết kế hệ thống


• ðiều khiển mờ không thích nghi (Nonadaptive Fuzzy Control)
• ðiều khiển mờ thích nghi (Adaptive Fuzzy Control)
ðiều khiển mờ thích nghi sẽ ñược xem xét ở chương 3 (ðiều khiển thích
nghi). Ở ñây, chúng ta chỉ nghiên cứu về ðiều khiển mờ không thích nghi.
1. Bộ ñiều khiển mờ tuyến tính ổn ñịnh SISO
Phương trình biến trạng thái của hệ SISO
x& (t ) = Ax(t ) + bu (t )
y (t ) = cx(t )
u (t ) = − f [ y (t )]
Thay phương trình cuối vào hai phương trình trên ta ñược hệ mờ vòng kín:

Thiết kế BðK mờ ổn ñịnh SISO


• Bước 1: Giả sử y(t) có miền giá trị là khoảng U=[α β], chia U ra 2N+1
khoảng Ak như hình vẽ bên dưới:

Trang 38
Chương 1 : Công nghệ tính toán mềm

• Bước 2: Thành lập 2N+1 luật mờ IF – THEN có khuôn dạng


IF y = Ak THEN u = Bk
trong ñó k = 1,2,….,2N+1 và trọng tâm y của khoảng mờ Bk là:
≤ 0 → k = 1,..., N

y = 0 → k = N + 1 (1.5)
≥ 0 → k = N + 2,...,2 N + 1

• Bước 3: Chọn luật hợp thành tích, giải mờ theo phương pháp trung bình
trọng số, ta có luật ñiều khiển như sau:


2 N +1
k =1
yµ Ak ( y )
u = − f ( y) = −

2 N +1
k =1
µ A ( y)
k

với y thoả (1.5) và µ Ak ( y ) ñược nêu trong Hình 1.12.


2. Bộ ðK mờ tuyến tính ổn ñịnh MIMO
Phương trình biến trạng thái của hệ MIMO:
x& (t ) = Ax(t ) + Bu (t )
(1.6)
y (t ) = Cx(t )
Giả sử hệ có m ñầu vào và m ñầu ra thì u(t) = (u1(t),…,um(t))T có dạng :
uk(t) = - fk[y(t)] (1.7)
với k=1,2,…,m và fk[y(t)] là hệ mờ m ñầu vào 1 ñầu ra.
Mô hình hệ thống có cấu trúc như Hình 1.11, nhưng thay cho các số b,c bởi
các ma trận B,C, hàm vô hướng f bởi véctơ f = (f1,f2,…,fm)T.
Thiết kế BðK mờ ổn ñịnh MIMO
• Bước 1: Giả sử ñầu ra yk(t) có miền giá trị là Uk = [αk βk], với k=1,…,m.
Chia Uk ta 2N+1 khoảng Akli và thiết lập hàm thuộc như Hình F.2
• Bước 2: Thành Lập m nhóm luật mờ IF – THEN, nhóm thứ k chứa
m
∏i =1 (2 N k + 1) luật dạng:
IF y1= A1l1 And …. And ym= Amlm , THEN u= Bkl1 ...lm
Trong ñó li=1,2,…,2Nk+1; k=1,2,…,m và trọng số y kl1 ...lm của tập mờ Bkl1 ...lm
ñựơc chọn như sau:

Trang 39
Chương 1 : Công nghệ tính toán mềm

≤ 0 → l k = 1,2,..., N k
l1 ...lm 
y k = 0 → l k = N k + 1 (1.8)
≥ 0 → l = N + 2,...,2 N + 1
 k k k

• Bước 3: Chọn luật hợp thành tích, giải mờ theo phương pháp trung bình
trọng số, ta ñược luật ñiều khiển:

∑ ...∑l
2 N1 +1 2 N m +1 m
l1 =1
y kl1 ...lm (∏i =1 µ Ali ( y i ))
m =1
uk = − f k ( y) = − i
(1.9)
∑ ...∑l
2 N1 +1 m m
=1 ∏i =1 A i
l1 =1
( µ l ( y i ))
m i

với k=1,2,…,m.

3. Bộ ñiều khiển mờ tối ưu


Phương trình trạng thái
x& (t ) = Ax(t ) + Bu (t )
(1.10)
x(0) = x 0
với x ∈ Rn và u ∈ Rm, và chỉ tiêu chất lượng dạng toàn phương:
T
[
J = x T (T ) Mx(T ) + ∫ x T (t )Qx(t ) + u T (t ) Ru (t ) dt ] (1.11)
0
n×n n×n
với M ∈ R ,Q∈R , R ∈ Rm × m là các ma trận xác ñịnh dương.
Ta xác ñịnh u(t) dạng như (1.9), với u(t) = (u1,u2,…,um)T

∑ ...∑l
2 N1 +1 2 N n +1 n
l1 =1
y kl1 ...lm (∏i =1 µ Ali ( xi ))
n =1
uk = − f k ( x) = − i
(1.12)
∑ ...∑l
2 N1 +1 2 N n +1 n
l1 =1
(∏i =1 µ Ali ( xi ))
n =1 i

Chúng ta cần xác ñịnh thông số y kl1 ...ln ñể cực tiểu J.


Ta ñịnh nghĩa hàm mờ cơ sở b(x) = (b1(x), …, bN(x))T với:
n

bl ( x) =
∏ i =1
µ A ( xi )
li
i
(1.13)
∑ ...∑
2 N1 +1 2 N n +1 n
l1 =1 l n =1
(∏i =1 µ Ali ( xi ))
i

n
với li = 1,2,…,2Ni+1; l = 1,2,…,N và N = ∏i =1 (2 N i + 1) . Ta ñịnh nghĩa
ma trận thông số Θ ∈ Rm × N như sau :

Trang 40
Chương 1 : Công nghệ tính toán mềm

[
Θ = − Θ1T ,−Θ T2 ,...,−Θ Tm ]T
(1.14)
với Θ Tk ∈ R 1× N chứa N thông số y kl1 ...ln , có bậc giống như bl(x). Ta viết lại tín
hiệu ñiều khiển mờ dạng u = (u1,u2,..,um)T = (-f1(x),…,-fn(x))T như sau:
u = Θb(x) (1.15)
Giờ ta giả sử Θ = Θ(t). Thay (1.15) vào (1.10) và (1.11) ta ñược :
x& (t ) = Ax(t ) + BΘ(t )b[x(t )] (1.16)
và hàm chỉ tiêu chất lượng là :
T
[
J = x (T ) Mx(T ) + ∫ x T (t )Qx(t ) + b T ( x(t ))Θ T (t ) RΘ(t )b( x(t )) dt
T
] (1.17)
0

Vì vậy vấn ñề cần giải quyết bây giờ là xác ñịnh Θ(t) tối ưu ñể cự tiểu hoá J.
Xét hàm Hamilton:
H ( x, Θ, p ) = x T Qx + b T ( x)Θ T RΘb( x) + p T [ Ax + BΘb( x)] (1.18)
∂H
Ta có: = 2 RΘb( x)b T ( x) + B T pb T ( x) = 0
∂Θ
1
Suy ra : Θ = − R −1 B T pb T ( x)[b( x)b T ( x)]−1 (1.19)
2
Thay (1.19) vào (1.18) ta ñược:
H ∗ ( x, p) = x T Qx + p T Ax + [α 2 ( x) − α ( x)] p T BR −1 B T p (1.20)
1 T
trong ñó: α ( x) = b ( x)[b( x)b T ( x)] −1 b( x) (1.21)
2
Áp dụng nguyên lý cực tiểu Pontryagin ta ñược:
∂H ∗
x& = = Ax + 2[α 2 ( x) − α ( x)]BR −1 B T p (1.22)
∂p
∂H ∗ ∂α ( x) T
p& = − = −2Qx − AT p − [2α ( x) − 1] p BR −1 B T p (1.23)
∂x ∂x
Giải hai phương trình vi phân (1.21) và (1.22) ta sẽ ñược x*(t) và p*(t), từ ñó
ta xác ñịnh ñược:
1
Θ ∗ (t ) = − R −1 B T p ∗ (t )b T ( x ∗ (t ))[b( x ∗ (t ))b T ( x ∗ (t ))]−1 (1.24)
2

Trang 41
Chương 1 : Công nghệ tính toán mềm

Và bộ mờ tối ưu sẽ là:
u ∗ = Θ ∗ (t )b( x) (1.25)
Các bước ñể thiết kế BðK mờ tối ưu:
• Bước 1: Xác ñịnh hàm thuộc µ Ali ( xi ) , với li = 1,2,…,2Ni+1 và I = 1,…,n.
i

Chọn dạng hàm thuộc là Gaussian.


• Bước 2: Tính hàm mờ cơ sở bl(x) theo (1.13) và tính α(x) theo (1.21), xác
∂α ( x)
ñịnh trị ñạo hàm : .
∂x
• Bước 3: Giải (1.22) và (1.23) ñể ñược x*(t) và p*(t), tính Θ*(t) theo (1.24)
với t∈[0 T].
• Bước 4: Xác ñịnh BðK mờ tối ưu từ (1.25)
Ví dụ 1.7:
Hãy thiết kế và mô phỏng hệ thống “Quả bóng và ñòn bẩy” như hình vẽ sau:

r u

O θ

Hình 1.13

Thiết kế BðK mờ ñể ñiều khiển quả bóng di chuyển từ ñiểm gốc O ñến mục
tiêu (vị trí ñặt) cách O khoảng r. Chọn biến trạng thái như sau:
x = (r , r&, θ , θ&) T = ( x , x , x , x ) T và y = r = x1
1 2 3 4

Phương trình biến trạng thái ñược chọn là:


 x&1   x2  0 
 x&  α ( x x 2 − β sin x3 ) 0
 2 =  1 4
+ u
 x& 3   x4  0 
     
 x& 4   0  1
Chọn M=0, Q=I, R=I, Ni=2 với i=1,2,3,4. Chọn hàm thuộc dạng:
µ A ( xi ) = exp[−2( xi − xil ) 2 ]
li
i

ip

Trang 42
Chương 1 : Công nghệ tính toán mềm

Trong ñó i=1, 2, 3, 4; li=1, 2, 3, 4, 5 và xili = a i + bi (li − 1) với a1 = a2= - 2,


a3=a4=-1, b1=b2=1, b3=b4=0.5.
Chọn α = 0.7143, β = 9.81. Kết quả mô phỏng với 3 mục tiêu khác nhau:

mục tiêu

ñiều khiển

4. ðiều khiển mờ có hệ thống giám sát

ðối tượng

Bộ ðK mờ

Bộ ðK giám sát

Hình 1.14

• Thiết kế bộ giám sát


Xét hệ thống phi tuyến ñược cho bởi phương trình vi phân:
x ( n ) = f ( x, x& ,..., x ( n −1) ) + g ( x, x&,..., x ( n−1) )u (1.26)
trong ñó x = ( x, x& ,..., x ( n −1) ) T là véctơ trạng thái ra, u ∈ R là tín hiệu ñiều
khiển, f và g là các hàm chưa biết, giả thiết g > 0.Giả sử ta ñã có BðK mờ:
u = ufuzz(x)

Trang 43
Chương 1 : Công nghệ tính toán mềm

Giả sử |x(t)| ≤ Mx, ∀x với Mx = const. Khi thêm bộ giám sát thì tín hiệu ñiều
khiển hệ thống sẽ là:
u = ufuzz(x) + I*us(x) (1.27)
trong ñó I* = 1 nếu |x(t)| ≥ Mx, I* = 0 nếu |x(t)| < Mx. Ta cần thiết kế bộ
giám sát us(t).
Thay (1.27) vào (1.26) ta ñược:
x(n) = f(x) + g(x)ufuzz(x) + g(x)I*us(x) (1.28)
U U
Giả sử ta luôn xác ñịnh ñược hai hàm f (x) và gL(x) sao cho |f(x)| ≤ f (x) và
0 < gL(x) ≤ g(x).
1
ðặt : u∗ =
g ( x)
[
− f ( x) − k T x ] (1.29)

Trong ñó k = (kn,kn-1,..,k1)T ∈R. Ta viết lại (1.28) như sau:


[
x ( n ) = −k T x + g u fuzz − u ∗ + I ∗u s ] (1.30)

 0 1 0 0 ... 0 0 
 0 0 1 0 ... 0 0 

ðặt A =  ... ... ... ... ... ... ... 
 
 0 00 0 0 ... 0 1 
− k n − k n−1 ... ... ... − k 2 − k1 

0
...
b= 
0
 
g 
Viết (1.30) dạng véctơ :
x& = Ax + b[u fuzz − u ∗ + I ∗u s ] (1.31)
1 T
Xét hàm Lyapunov : V = x Px (1.32)
2
Trong ñó P là ma trận ñối xứng xác ñịnh dương thoả phương trình
Lyapunov : AT P + PA = −Q (1.33)
Từ (1.31), (1.33) và xét trường hợp |x| ≥ Mx , ta có:

Trang 44
Chương 1 : Công nghệ tính toán mềm

1
V& = − x T Qx + x T Pb[u fuzz − u ∗ + u s ] ≤ x T Pb ( u fuzz + u ∗ ) + x T Pbu s (1.34)
2
Ta cần tìm us ñể V& ≤ 0 , kết hợp phương trình trên với (4.6.25) ta ñựơc:
 1 
u s = − sign( x T Pb)  ( f U + k T x ) + u fuzz  (1.35)
 gL 
Thay (1.35) vào (1.34) ta sẽ ñược V& ≤ 0 .

• Ví dụ 1.8:
Thiết kế hệ thống có bộ giám sát ñể giữ cân bằng cho con lắc ngược.

θ& = x 2
θ=x1

l
mgsinθ

mc u

Hình 1.15

Phương trình trạng thái:


x&1 = x 2 (1.36)
mlx 22 cos x1 sin x1 cos x1
g sin x1 −
mc + m mc + m
x& 2 = 2
+ u (1.37)
4 m cos x1 4 m cos 2 x1
l( − ) l( − )
3 mc + m 3 mc + m
Thiết kế bộ giám sát
ðầu tiên ta tìm fU và gL, ta có

mlx 22 cos x1 sin x1 0.25 2


g sin x1 − 9.8 + x2
mc + m 1.1
f ( x1 , x 2 ) = ≤ = 15.78 + 0.0366 x 22
4 m cos x1 2
2 0.05
l( − ) −
3 mc + m 3 1.1

Trang 45
Chương 1 : Công nghệ tính toán mềm

chọn f U ( x1 , x 2 ) = 15.78 + 0.0366 x 22


ðể con lắc ổn ñịnh thì góc x1 = θ ≤ 200. Suy ra Mx = 200.
cos 20 0
g ( x1 , x 2 ) ≥ = 1.1
2 0.05 2 0
1.1( + cos 20 )
3 1.1
chọn gL(x1,x2) = 1.1
Chọn các thông số thiết kế như sau:
10 0 
a = π/18, k1 = 2, k2 = 1 , Q =  
 0 10
15 5 
Giải phương trình Lyapunov (1.33) ta ñược : P =  
 5 15
Thiết kế BðK mờ ñể ñược ufuzz(x).
Từ (1.35) ta sẽ ñược BðK có giám sát hệ con lắc ngược.
Dùng simulink của matlab chạy mô phỏng ta sẽ thấy ñược tính ưu việt khi
có và không sử dụng bộ giám sát.

5. ðiều khiển mờ trượt

1. Nguyên lý ñiều khiển trượt


Xét hệ thống phi tuyến
x ( n ) = f ( X ) + g ( X )u (1.38)
y(t) = x(t)
trong ñó u là tín hiệu ñiều khiển, x là tín hiệu ra, X = ( x, x&,..., x ( n −1) ) T là
véctơ trạng thái. Trong (1.38) f(X) là hàm chưa biết và bị chặn bởi một hàm
ñã biết:
f ( X ) = fˆ ( X ) + ∆f ( X ) (1.39)
và ∆f ( X ) ≤ F ( X ) (1.40)
0 < g0 < g(X) <g1 (1.41)
trong ñó fˆ ( X ), F ( X ) ñã biết, g0, g1 là các hằng số dương.
ðối với mục tiêu ñiều khiển ổn ñịnh hệ thống thì chúng ta cần xác ñịnh luật
ñiều khiển hồi tiếp u = u(X) sao cho ngõ ra của hệ thống x → 0 khi t → ∞ .

Trang 46
Chương 1 : Công nghệ tính toán mềm

ðể làm ñược ñiều này ta ñưa ra hàm trượt sau:


d n−1 x d n−2 x dx
S= n −1
+ a n−2 n− 2
+ ... + a1 + a0 x (1.42)
dt dt dt
trong ñó n là bậc của ñối tượng.
Các hệ số a0, a1, … , an-2 phải ñược chọn sao cho ña thức ñặc trưng của
phương trình vi phân S=0 là ña thức Hurwitz.
Phương trình S=0 mô tả một mặt trong không gian trạng thái n chiều gọi là
mặt trượt ( Sliding surface).
Ta cần xác ñịnh luật ñiều khiển u sao cho S → 0 ñể có x → 0.
ðối với ñiều khiển bám mục tiêu, ta cần xác ñịnh luật ñiều khiển u = u(X)
sao cho trạng thái của hệ thống vòng kín sẽ bám theo trạng thái mong muốn
(
X d = x d , x& d ,..., x d( n−1) )
T

Gọi e là sai lệch giữa tín hiệu ra và tín hiệu ñặt:


(
e = X − X d = e, e&,..., e ( n −1) )
T

Mục tiêu ñiều khiển là triệt tiêu e khi t → ∞.


ðịnh nghĩa hàm trượt :
d n −1e d n−2 e de
S (e ) =n −1
+ a n−2 n−2
+ ... + a1 + a0 e (1.43)
dt dt dt
trong ñó n là bậc của ñối tượng ñiều khiển, các hệ số a0, a1, … an-2 ñược
chọn sao cho ña thức ñặc trưng của S(e)=0 là ña thức Hurwitz.
Sử dụng phương pháp Lyapunov, chọn hàm V xác ñịnh dương như sau:
1 2
V= S (1.44)
2
⇒ V& = SS& (1.45)
ðể V& xác ñịnh âm ta chọn luật ñiều khiển u sao cho:
Khi S>0 thì S& <0
Khi S<0 thì S& >0
Do vậy với hàm trượt S(e) ta xác ñịnh luật ñiều khiển u thoả:
dS
sign( S ) < 0 (1.46)
dt

Trang 47
Chương 1 : Công nghệ tính toán mềm

Với luật ñiều khiển như vậy, hệ thống sẽ ổn ñịnh theo tiêu chuẩn Lyapunov,
lúc này mọi quỹ ñạo trạng thái của hệ thống bên ngoài mặt trượt sẽ ñược
ñưa về mặt trượt và duy trì một cách bền vững.

x2= x&
S=0

x1

Hình 1.16 Mặt trượt bậc hai

2. Hệ thống ñiều khiển trượt mờ


Xét hệ thống (1.38), ta cần xác ñịnh luật ñiều khiển u ñể ñưa ngõ ra của hệ
thống bám theo theo giá trị mong muốn cho trước y(t) → yd(t) hay nói cách
( )
khác là e (i ) = y (i ) − y d( i ) → 0 , i = 0,1,…,n-1
Dựa vào ñặt tính của bộ ñiều khiển trượt ta cần thực hiện hai bước sau:
Bước 1: Chọn mặt trượt S
Bước 2: Thiết kế luật ñiều khiển cho hệ thống rơi vào mặt trượt S = 0 và
duy trì ở chế ñộ này mãi mãi.
Gọi (
e(t ) = (e1 (t ), e2 (t ),..., en (t ) ) = e(t ), e&(t ),..., e ( n −1) (t )
T
)
T

Chọn hàm trượt:


d n −1e d n−2 e de
S (e) = n −1 + bn − 2 n − 2 + ... + b1 + b0 e (1.47)
dt dt dt
Trong ñó b0, b1,…,bn-2 ñược chọn sao cho nghiệm của ña thức ñặc trưng
p n −1 + bn− 2 p n −2 + ... + b1 p + b0 = 0 ñều nằm bên trái mặt phẳng phức.
Mặt trượt S ñược cho bởi phương trình S(e) = 0, luật ñiều khiển u ñược
dS
chọn sao cho sign( S ) < 0 .
dt

Trang 48
Chương 1 : Công nghệ tính toán mềm

3. Thiết kế bộ ñiều khiển mờ trượt bậc hai


Xét hệ thống phi tuyến bậc hai sau:
&x& = f ( X ) + g ( X )u (1.48)
y=x (1.49)
trong ñó X = (x, x& ) là véctơ trạng thái, u là ngõ vào ñiều khiển y(t) là ngõ
T

ra của hệ thống.
Mục tiêu của ñiều khiển là xác ñịnh luật ñiều khiển u ñể ngõ ra của hệ thống
bám theo quỹ ñạo mong muốn yd(t) với sai số nhỏ nhất.
Luật ñiều khiển u gồm 2 thành phần:
u = ueq + us (1.50)
Thành phần ueq ñược thiết kế như sau:
1 ˆ
u eq (t ) =

[ ]
− f ( X , t ) + &y&d (t ) − λe , (λ>0) (1.51)

Thành phần us ñược chọn là:


1
u s (t ) ≥

[α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ] (1.52)

Trong ñó fˆ ( X , t ) là giá trị ước lượng của f(X,t)


F(X,t) là cân trên của sai số ước lượng
0 < g0 < g(X) < g1
gˆ = g 0 g1

g1
α=
g0
Luật ñiều khiển mờ ñược thiết kế như sau:
u − (t ), → S < 0
u (t ) =  + (1.53)
u (t ), → S > 0
Trong ñó:
[
u − (t ) = u eq (t ) + kgˆ −1 α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ]
u + (t ) = u eq (t ) − kgˆ −1 [α ( F ( X , t ) + η ) + (α − 1) u eq (t ) ] (1.54)
(k ≥ 1)

Trang 49
Chương 1 : Công nghệ tính toán mềm

Hệ qui tắc mờ có khuôn dạng như sau:


R1 : Nếu S<0 Thì u 1 (t ) = u − (t )
R2 : Nếu S>0 Thì u 2 (t ) = u + (t ) (1.55)
Chọn luật hợp thành tích, giải mờ theo phương pháp trọng tâm, luật ñiều
khiển u ñược xác ñịnh như sau:
r

∑ β (S )u (t )
i =1
i
i

u (t ) = r
(1.56)
∑ β (S )
i =1
i

Với r : số luật mờ
n
β i (S ) = ∏ µ A (S ) i
j
j =1

µ A (S ) là hàm thuộc có dạng Gaussian như sau:


i
j

Hình 1.17 : Dạng hàm thuộc ñể mờ hóa


S

4. Thiết kế BðK mờ trượt cho hệ thống nâng vật trong từ trường

Mô hình:
Hình 1.18 minh hoạ một hệ thống nâng vật bằng từ trường, từ trường ñược
tạo ra từ cuộn dây quấn quanh lõi thép, cuộn dây nhận áp ñiều khiển u.

Trang 50
Chương 1 : Công nghệ tính toán mềm

Hình 1.18 : Hệ thống nâng vật trong từ trường

Phương trình toán mô tả hệ thống


 dh
 =v
 dt
 d ( L(h)i )
u = Ri + (1.57)
 dt
 dv i
2

m = mg − C  
 dt h
Trong ñó:
h : vị trí hòn bi (m)
v : vận tốc hòn bi (m/s)
i : dòng ñiện qua cuộn dây (A)
u : ñiện áp cung cấp cho cuộn dây (V)
R, L : ñiện trở và ñiện cảm cuộn dây (Ω, H)
C : hằng số lực từ (Nm2/A2)
m : khối lượng hòn bi (Kg)
g : gia tốc trọng trường. (m/s2)
ðiện cảm của cuộn dây là một hàm phi tuyến phụ thuộc vào vị trí của hòn bi
2C
L(h) = L1 + (1.58)
h
L1 là ñiện cảm của cuộn dây khi hòn bi ở rất xa.
Chọn biến trạng thái như sau:

Trang 51
Chương 1 : Công nghệ tính toán mềm

x1 = h, x2 = v, x3 = i (1.59)
Véctơ trạng thái của hệ thống X = (x1, x2, x3)T
Từ (1.57), (1.58) và (1.59) ta ñược phương trình trạng thái:

&
 x1 = x 2
 2
 C  x3 
 x& 2 = g −   (1.60)
 m  x1 
  
 x& 3 = R x3 + 2C  x 2 x3  + 1 u
 L L  x12  L
ðiểm cân bằng của hệ thống là nghiệm của hệ ( x&1 = 0, x& 2 = 0, x& 3 = 0)

gm
Giải ra ñược Xb = [x1b, 0, x3b ] T , với x3b = x1b
C
Gọi Xd = [ x1d, x2d, x3d ] T là véctơ trạng thái mong muốn.
Mục tiêu của hệ thống là ñưa X tiến về Xd với sai số nhỏ nhất.

Thiết kế BðK trượt


Thực hiện phép ñổi trục như sau:


 z1 = x1 − x1d
 (1.61)
z2 = x2
 2
 z = g − C  x 3 
 3
 m  x1 
Lúc này ta cần xác ñịnh luật ñiều khiển u sao cho Z = (z1, z2, z3)T tiến về
(0,0,0)T khi t → ∞, khi ấy X → Xd.
Kết hợp (1.60), (1.61) và một số phép biến ñổi ta ñược:


 z&1 = z 2
 (1.62)
 z& 2 = z 3

 z& = 2(g − z ) z 2 
1 −
2C  R
 +  −
2 C
( g − z 3 )u
3 
 3  z1 + x1d  L ( z1 + x1d )  L  L( z1 + x1d ) m

Trang 52
Chương 1 : Công nghệ tính toán mềm

ðặt
 2 C
g ( z) = − ( g − z 3 )u
 L( z1 + x1d ) m
 (1.63)
 f ( z ) = 2( g − z )  z 2 1 − 2C  R
 + 
 3  
  z1 + x1d  L( z1 + x1d )  L 
Từ (1.62) và (1.63) ta ñược mô hình ñộng học của hệ thống trong hệ toạ ñộ
mới như sau:
 z& 1 = z 2

 z& 2 = z 3 (1.64)
 z& = f ( z ) + g ( z )u
 3
Ngõ ra của hệ thống trong hệ tọa ñộ mới là:
e = z1 = x1 − x1d (1.65)

Mối quan hệ ngõ vào và ngõ ra:


e (3) = f ( z ) + g ( z )u (1.66)
Hai hàm f(z), g(z) tương ứng trong hệ toạ ñộ ban ñầu là f1(x), g1(x):
 2C  x 2 x32  2C  R  x3 
2

 f1 ( x) = 1 −  +   
 m  x13  Lx1  L  x1  
   (1.67)
 2Cx3
 g1 ( x ) = −
 Lmx12
Ta viết lại (1.66) trong hệ toạ ñộ ban ñầu:
e (3) = f1 ( x) + g1 ( x)u (1.68)
Chọn mặt trượt như sau:
S = &e& + a1e& + a0 e (1.69)
Với a1, a0 ñược chọn sao cho ña thức ñặt trưng của phương trình S = 0 là
Hurwitz.
Từ (1.69) và (1.64) ta ñược:
S = z 3 + a1 z 2 + a 0 z1 (1.70)
Lấy ñạo hàm của S theo thời gian ta ñược:
S& = z&3 + a1 z& 2 + a 0 z&1 = f ( z ) + g ( z )u + a1 z 3 + a 0 z 2 (1.71)
Chọn luật ñiều khiển u như sau:

Trang 53
Chương 1 : Công nghệ tính toán mềm

1
u= [− f ( z ) − a1 z 3 − a0 z 2 − Wsign( z3 + a1 z 2 + a0 z1 )] (1.72)
g ( z)
Thay (1.72) vào (1.71) ta ñược:
S& = −Wsign ( z 3 + a1 z 2 + a 0 z1 ) = −Wsign ( S ) (1.73)
Nếu chọn W là hằng số dương thì ta sẽ ñược SS& < 0 . Do vậy biến trạng thái
Z sẽ hội tụ về zero khi t → ∞ thoả yêu cầu ñề ra.
Ta có thể viết lại mặt trượt S dưới dạng hàm của x1, x2, x3 như sau:
2
Cx 
S = g −  3  + a1 x 2 + a0 ( x1 − x1d ) (1.74)
m  x1 
Và luật ñiều khiển u là:
1  C  x3    
2 2
C  x3 

u = − f1 − a1 g −   − a0 x2 − Wsign g −   + a1x2 + a0 ( x1 − x1d ) 

g1   m  x1    m  x1  
    
(1.75)

Mô phỏng Matlab:
Các thông số mô phỏng của hệ thống
Khối lượng hòn bi m = 11.87g, bán kính R = 7.14mm, một nam châm ñiện,
ñiện trở cuộn dây R = 28.7Ω, ñiện kháng L1 = 0.65H, hằng số lực từ
C=1.4×10- 4Nm2A2.

Sơ ñồ Simulink

Trang 54
Chương 1 : Công nghệ tính toán mềm

Kết quả mô phỏng:

Hình 1.19: Vị trí và áp ñiều khiển khi tín hiệu ñặt biến thiên

Hình 1.20: Vị trí và áp ñiều khiển khi tín hiệu ñặt là hằng số

Trang 55
Chương 1 : Công nghệ tính toán mềm

Thiết kế BðK trượt mờ cho hệ thống nâng vật trong từ trường


Trong phần thiết kế BðK trượt ta ñã biết luật ñiều khiển u như sau:

1   C  x3   
2

u = − f1 − a1 g −   − a0 x2 − Wsign(S )
g1   m  x1   
   
với S ñược xác ñịnh từ (1.74), f1 và g1 ñược xác ñịnh từ (1.67).
Do trong luật ñiều khiển có hàm sign nên gây ra hiện tượng dao ñộng, ñể
khắc phục nhược ñiểm này ta thêm khâu xử lý mờ trong bộ ñiều khiển ñể
thay thế cho hàm sign.
Chọn luật ñiều khiển u = ueq + us , với:

1   C  x3   
2

u eq = 
− f 1 − a1 g −   − a 0 x 2  (1.76)
g1   m  x1   
   

Các bước xây dựng bộ mờ:


Bước 1: Mờ hoá mặt trượt S

Hình 1.21:Hàm thuộc với 5 tập mờ


Bước 2: Xây dựng hệ qui tắc mờ:
R1: If S is zero Then u1 = ueq
R2: If S is pos Then u2 = ueq + C0
R3: If S is lpos Then u3 = ueq + C1
R4: If S is neg Then u4 = ueq – C0
R5: If S is lneg Then u5 = ueq – C1
C0, C1 là các hằng số dương C0 > C1

Trang 56
Chương 1 : Công nghệ tính toán mềm

Bước 3: Giải mờ
Bằng phương pháp giải mờ trọng tâm, luật ñiều khiển u ñược xác ñịnh:
5

∑β u
i =1
i
i

u= 5
(1.77)
∑β
i =1
i

Trong ñó βi là ñộ ñúng của qui tắc thứ i :


β1 = µ zero ( S )
β 2 = µ pos ( S )
β 3 = µ lpos ( S ) (1.78)
β 4 = µ neg ( S )
β 5 = µ ln eg ( S )

Sơ ñồ Simulink

Trang 57
Chương 1 : Công nghệ tính toán mềm

Kết quả mô phỏng

•Sử dụng 3 tập mờ, chọn C0 = 350.

Hình 1.22: Vị trí và áp ðK khi tín hiệu ñặt là xung vuông

Hình 1.23 Vị trí và áp ðK khi tín hiệu ñặt là hằng số

Trang 58
Chương 1 : Công nghệ tính toán mềm

•Sử dụng 5 tập mờ, chọn C0 =100 và C1 = 350.

Hình 1.24 Vị trí và áp ðK khi tín hiệu ñặt là xung vuông

Hình 1.25: Vị trí và áp ðK khi tín hiệu ñặt là hằng số

Trang 59
Chương 1 : Công nghệ tính toán mềm

•Sử dụng 7 tập mờ, chọn C0 = 100, C1 = 200 và C2 = 350.

Hình 1.26: Vị trí và áp ðK khi tín hiệu ñặt là xung vuông

Hình 1.27: Vị trí và áp ðK khi tín hiệu ñặt là hằng số

Kết luận
- Việc thêm BðK mờ ñã triệt tiêu hiện tượng dao ñộng.
- ðáp ứng hệ thống tốt hơn.
- Chọn 5 tập mờ là thích hợp nhất khi xây dựng BðK mờ.

Trang 60
Chương 1 : Công nghệ tính toán mềm

1.3. Mạng nơron nhân tạo


Những năm 40 của thế kỷ 20, với mong muốn chế tạo những cỗ máy
thông minh có chức năng như bộ não con người, các nhà nghiên cứu ñã phát
triển những mô hình phần cứng (sau ñó là phần mềm) ñơn giản về các nơ-
ron sinh học và cơ chế tương tác của chúng. McCulloh và Pitts là những
người ñầu tiên ñã xuất bản một công trình nghiên cứu có tính hệ thống về
mạng nơ- ron nhân tạo.
ðến những năm 50 và 60, một nhóm các nhà nghiên cứu ñã kết hợp
những kiến thức về sinh học và tâm thần học ñể tạo ra một mạng nơ-ron
nhân tạo hoàn chỉnh ñầu tiên. Ban ñầu ñược chế tạo dưới dạng một mạch
ñiện tử, sau ñó các mạng nơ-ron ñược chuyển thành các chương trình mô
phỏng trên máy tính có mức ñộ linh hoạt cao hơn.
Trong thời gian gần ñây mạng nơ-ron phát triển mạnh mẽ với các nghiên
cứu của Rosenblatt, Widrow và Hoff về các mạng nơ-ron nhiều lớp phức
tạp. Mặt khác, do khả năng của phần cứng máy tính tăng lên rất nhiều cũng
góp phần vào sự phát triển của lĩnh vực nghiên cứu này. Mạng nơ-ron nhân
tạo ñược ứng dụng trong nhiều lĩnh vực như: nhận dạng, phân loại, xử lý
ảnh, các hệ thống ñiều khiển, dự báo….

1.3.1. Cấu trúc mạng nơron nhân tạo (Artifical Neural Networks - ANN):
Bộ não con người có khoảng 1011 ÷ 1012 nơ-ron. Mỗi nơ- ron có thể liên kết
với 104 nơ-ron khác thông qua các khớp nối (dendrite). Các nơ- ron nhận tín
hiệu ñiện từ các khớp nối và khi sự tổng hợp của các tín hiệu này vượt quá
một ngưỡng cho phép thì nơ-ron sẽ kích hoạt một tín hiệu ñiện ở
ngõ ra ñể truyền tới trục nơ-ron (axon) và dẫn ñến các nơ-ron khác.

Cấu trúc một nơ-ron sinh học

Mạng nơ-ron nhân tạo cũng hoạt ñộng dựa theo cách thức của bộ não con
người nhưng ở cấp ñộ ñơn giản hơn.

Trang 61
Chương 1 : Công nghệ tính toán mềm

Mạng nơron là sự tái tạo bằng kỹ thuật những chức năng của hệ thần kinh
con người. Mạng nơron gồm vô số các nơron liên kết với nhau như hình sau

Nhân Axon
n

Khớp nối

Hai ñặc tính cơ bản của mạng nơron là:


+ Quá trình tính toán ñược tiến hành song song và phân tán trên nhiều
nơron gần như ñồng thời.
+ Tính toán thực chất là quá trình học, chứ không phải theo sơ ñồ ñịnh
sẵn từ trước.
Mô hình toán của mạng nơron nhân tạo :
Một mạng nơron nhân tạo gồm 3 thuộc tính: trọng số kết nối, ngưỡng
và hàm kích hoạt.

Ta ñặt: X = [x1, x2, …, xn]T là cường ñộ của vector ngõ vào.


Ngõ ra của mạng ñược tính theo công thức:
 n 
( )
y = f  ∑ w j x j − θ  = f W T X − θ
 j =1 

Trang 62
Chương 1 : Công nghệ tính toán mềm

Trọng số kết nối:


W = [w1, w2, …, wn]T

Ngưỡng (ngưỡng phân cực – bias): Kí hiệu: θ


Ngưỡng là giá trị biên ñộ ñộ lệch, nó ảnh hưởng ñến sự kích hoạt ngõ ra của
nơ-ron theo công thức:
u = X TW − θ

Hàm kích hoạt


Quá trình xử lý thông tin gồm: xử lý tín hiệu ñầu vào và tín hiệu ñầu ra
• Hàm tổng (u): dùng ñể kết hợp và xử lý các thông tin ở ñầu vào
Một số dạng hàm tổng thường gặp:
Hàm tuyến tính (linear fuction):
 n 
u =  ∑ w j x j  − θ = W T X − θ
 j =1 
Hàm toàn phương (quadratic fuction):
 n 
u =  ∑ w j x 2 j  − θ
 j =1 
Hàm cầu (spherical function):
 1 n
2 1
u =  2 ∑ (x j − w j )  − θ = 2 ( X − W ) T ( X − W ) − θ
ρ j =1  ρ
Thông thường, hàm tổng ñược sử dụng nhiều nhất là hàm tuyến tính.

• Hàm kích hoạt (activation function): là hàm xử lý tín hiệu ngõ ra.
Kí hiệu: f(.)
Một số kiểu hàm kích hoạt thông dụng :
Hàm nấc:
0, u<0
y = f (u ) = 
1, u≥0

Trang 63
Chương 1 : Công nghệ tính toán mềm

Hàm dấu:
− 1, u<0
y = f (u ) = 
1, u≥0

Hàm tuyến tính (linear fuction):


y = f (u) = α .u
Với α là hệ số góc của hàm.

Hàm tuyến tính bão hòa:


− 1, u < −1

y = f (u ) = u, −1 ≤ u < 1
1, u ≥1

Hàm dạng S (Sigmoid) ñơn cực:


1
y = f (u ) =
1 + e − λu

Với: λ là hệ số dạng của hàm sigmoid

Hàm dạng S lưỡng cực:


2
y = f (u ) = −1
1 + e −λu

1.3.2. Phân loại mạng nơron nhân tạo:


Các loại mạng có thể ñược phân loại dựa trên các tính chất của nó:

• Theo số lớp:
o Mạng một lớp (mạng ñơn nơ-ron): mạng chỉ gồm 1 nơ-ron
o Mạng nhiều lớp (mạng ña nơ-ron): mạng gồm nhiều nơ-ron

Trang 64
Chương 1 : Công nghệ tính toán mềm

o Mạng truyền thẳng (mạng nuôi tiến): các tín hiệu trong mạng
chỉ truyền theo một chiều từ ngõ vào ñến ngõ ra.
o Mạng hồi quy (mạng nuôi lùi): các tín hiệu hồi tiếp từ ngõ ra
trở về ngõ vào.

Mạng truyền thẳng 1 lớp Mạng hồi quy 1 lớp

x1
y
x2

Lớp vào Lớp bị che Lớp ra


Mạng truyền thẳng nhiều lớp

Lớp vào Lớp bị che Lớp ra


Mạng hồi quy nhiều lớp
1.3.3. Các phương pháp huấn luyện mạng nơ-ron:

Trang 65
Chương 1 : Công nghệ tính toán mềm

Có hai kiểu học:


 Học thông số (Parameter Learning): dùng ñể cập nhật các trọng số
liên kết giữa các tế bào nơ-ron và ngưỡng phân cực trong mạng.
 Học cấu trúc (Structure Learning): dùng ñể thay ñổi cấu trúc mạng
bao gồm cả tế bào nơ-ron và cách liên kết giữa chúng.
Ta có thể sử dụng riêng rẽ hay ñồng thời cả hai kiểu học trên. Tuy nhiên, ở
ñây ta chỉ ñề cập ñến kiểu học thông số. Có 3 luật học thông số:
 Luật học có giám sát:
Cho tập các dữ liệu vào – ra: {x1, d1} , {x2, d2} , … ,{xQ, dQ}
Ban ñầu các trọng số của mạng ñược chọn bất kỳ. Khi có ngõ vào mạng xq ,
ngõ ra của mạng yq ñược so sánh với ngõ ra mục tiêu dq. Luật học dựa vào
sai số eq = dq – yq hiệu chỉnh trọng số và ngưỡng phân cực của mạng ñể ñưa
ngõ ra về gần với mục tiêu.

 Luật học củng cố: không như học có giám sát ñược cung cấp mục
tiêu trước (mỗi tín hiệu ngõ vào sẽ có một tín hiệu ra tương ứng), luật học
củng cố chỉ ñược cung cấp theo mức (Ví dụ: “ñúng” hoặc “sai”). Bởi vì
trong thực tế không phải lúc nào ta cũng có ñầy ñủ thông tin về ñối tượng.
Vì vậy, kiểu học củng cố sẽ thích hợp nhất cho những ứng dụng ñiều khiển
hệ thống.

Trang 66
Chương 1 : Công nghệ tính toán mềm

 Luật học không có giám sát: trọng số và ngưỡng phân cực chỉ ñược
hiệu chỉnh ñối với ngõ vào. Không có mục tiêu ngõ ra ñược ñặt trước. Có vẻ
như ñiều này thiếu thực tế, vì làm sao huấn luyện ñược mạng nếu không biết
nó sẽ làm gì? Hầu hết những thuật toán này sẽ tự phát hiện các ñặc ñiểm,
các mối tương quan giữa các mẫu dữ liệu vào và mã hóa thành dữ liệu ra.
ðiều này rất hữu ích trong những ứng dụng như lượng tử hoá vector.

1.3.4. Mạng truyền thẳng một lớp (mạng perceptron ñơn giản):

Thuật toán học perceptron:


Vào cuối những năm 1950, Frank Rosenblatt và một số nhà nghiên
cứu khác ñã phát triển một loại mạng neutron gọi là perceptron. Rosenblatt
ñã giới thiệu một luật học ñể huấn luyện mạng perceptron giải quyết một số
vấn ñề nhận dạng kiểu mẫu. Mạng perceptron sẽ học từ những ñáp ứng mà
ta ñưa vào. Nó cũng có thể học khi ñựơc cho những giá trị trọng số và phân
cực ngẫu nhiên.
Ngày nay, mạng perceptron vẫn ñược xem là một mạng quan trọng vì tính
nhanh và chính xác ñối với những vấn ñề mà nó có thể giải quyết.
1. Cấu trúc mạng perceptron
Mạng perceptron tổng quát có cấu trúc như hình :

Perceptron có hàm kích hoạt là hàm hardlim (hàm giới hạn cứng):

Trang 67
Chương 1 : Công nghệ tính toán mềm

Ma trận trọng số:

Ngõ ra của mạng:

Nhận xét:
Mỗi nơ-ron trong mạng sẽ chia không gian ngõ vào thành 2 miền: một
miền bao gồm các ngõ vào sao cho ngõ ra bằng 1 và một miền bao gồm các
ngõ vào sao cho ngõ ra bằng 0. Vì vậy, ta cần khảo sát ñường phân chia
giữa những miền này.

2. Cách xác ñịnh ñường phân chia ranh giới:


Có 2 cách xác ñịnh :
 Cách 1: Dựa vào phương trình ñường phân chia: i w T p + bi = 0
Ví dụ 1.9:
Khảo sát mạng Mạng Perceptron ñơn neutron như hình

Ngõ ra của mạng là:

Trang 68
Chương 1 : Công nghệ tính toán mềm

Phương trình ñường phân chia :

Ta chọn trọng số và ngưỡng phân cực:

ðường phân chia lúc này là:

ðể tìm ñường thẳng này, có thể tìm giao ñiểm của nó với trục p1 và p2.
Tìm giao ñiểm với trục p2, ñặt p1=0:

Tìm giao ñiểm với trục p1, ñặt p2=0:

Khi ñó, ta tìm ñược ñường phân chia như hình sau:

Miền tương ứng với ngõ ra bằng 1 ñược xác ñịnh bằng cách kiểm tra thử
một ñiểm.Với p=[2 0]T, ngõ ra sẽ là:

Vậy ngõ ra của mạng sẽ bằng 1 ở miền bên trên và bên phải của ñường phân
chia. Miền này ñược tô ñậm ở hình trên

 Cách 2: Dựa vào ñồ thị:


Ta chú ý rằng ñường phân chia luôn trực giao với 1w
như hình bên. ðường phân chia ñựơc ñịnh nghĩa là:

ðối với những ñiểm trên ñường phân chia, tích 1wTp
luôn không ñổi. Có nghĩa là những vector ngõ vào p này
phải có cùng hình chiếu lên vector trọng số. Vậy chúng
phải nằm trên cùng một ñường thẳng trực giao với

Trang 69
Chương 1 : Công nghệ tính toán mềm

vector trọng số. Hơn nữa, những vector ở miền tô ñậm của hình trên sẽ có
tích 1wTp lớn hơn –b, còn ở miền còn lại thì tích 1wTp sẽ nhỏ hơn.Vì vậy
vector trọng số 1w sẽ luôn hướng về miền có ngõ ra bằng 1.
Sau khi ñã chọn vector trọng số ñúng hướng, ngưỡng phân cực ñược
tính bằng cách chọn một ñiểm trên ñường biên và cho thoả phương trình
ñường phân chia.

Ví dụ 1.10:
Thiết kế mạng perceptron thực hiện hàm chức năng cổng AND. Các cặp ngõ
vào và mục tiêu của cổng AND là:

Ta chọn một ñường thẳng phân vòng trắng và vòng


ñen ra 2 miền như hình bên.
Tiếp theo ta chọn vector trọng số trực giao với ñường
phân chia:

Cuối cùng, chọn một ñiểm trên ñường phân chia p=[1.5 0]T và tính ngưỡng
phân cực b bằng cách thế vào phương trình:

Có thể kiểm tra lại ñáp ứng của mạng với một cặp ngõ vào/mục tiêu. Nếu
thử với p2, ngõ ra sẽ là:

Ta thấy ngõ ra trùng với mục tiêu t2. Kiểm tra cho tất cả các ngõ vào còn lại,
ta thấy chúng ñều phân loại ñúng.

Chú ý : ñối với mạng perceptron ña nơ-ron, mỗi nơ-ron có một ñường phân
chia. ðường phân chia cho nơ-ron thứ i là:

Một perceptron ñơn neutron có thể phân vector ngõ vào thành 2 loại vì ngõ
ra của nó có thể là 0 hoặc 1. Mạng perceptron ña neutron có thể phân ngõ
vào thành nhiều loại, mỗi loại ñại diện bởi một ngõ ra khác nhau. Vì mỗi

Trang 70
Chương 1 : Công nghệ tính toán mềm

phần tử của vector ngõ ra có thể bằng 0 hoặc 1, nên có tổng cộng 2S loại ngõ
vào với S là số neutron.

3. Luật học perceptron


Luật học perceptron thuộc loại luật học có giám sát.
Bài toán thử nghiệm:
Cho các cặp ngõ vào và mục tiêu của bài toán là:

Mạng perceptron dùng ñể giải bài toán này cần có 2 ngõ vào và 1 ngõ ra.

Xây dựng luật học


Trước hết ta gán các giá trị khởi ñầu cho thông số của mạng.
Chọn b = 0 và 1w bất kỳ:

ðưa vector ngõ vào vào mạng perceptron, bắt ñầu với p1:

Ngõ ra chưa ñúng với giá trị mong muốn (t1 = 1),
nghĩa là ñường phân chia không chính xác.Ta cần
thay vector trọng số ñể nó hướng về p1 nhiều hơn.

Ta có thể ñặt 1w = p1. Cách này ñơn giản và ñảm bảo


p1 sẽ ñược phân loại ñúng. Tuy nhiên nó không thể
giải quyết những bài toán có dạng như hình bên. Bởi
vì mỗi lần vector này không ñược phân loại ñúng thì
trọng số sẽ hoán ñổi qua lại và không thể giải bài toán.

Trang 71
Chương 1 : Công nghệ tính toán mềm

Một cách khác là cộng p1 vào 1w. Việc cộng thêm sẽ làm cho 1w hướng về
p1 nhiều hơn. Luật này có thể ñược viết như sau:

Áp dụng tính giá trị mới cho 1w:

Ta thấy p1 ñã ñược phân loại ñúng. Tương tự cho các ngõ vào còn lại

Với ngõ vào p2, ngõ ra tương ứng là:

Ngõ ra chưa ñúng với giá trị mong muốn (t2 = 0). Ta cần
ñưa 1w ra xa p1 hơn, bằng cách ñổi luật:

Áp dụng vào bài toán ta ñược:

Kiểm tra tiếp vector p3:

ðường biên không phân loại ñúng p3.


Cần phải tiếp tục hiệu chỉnh 1w:

Hình bên cho thấy mạng perceptron ñã học ñược cách


phân loại ñúng với 3 vector ngõ vào trên. Nếu ñưa vào
mạng 1 ngõ vào, nó sẽ cho ra ngõ ra ñúng với phân loại.
Từ ñây ta có luật thứ 3 và cũng là cuối cùng: nếu mạng
phân loại ñúng thì giữ nguyên 1w.

Trang 72
Chương 1 : Công nghệ tính toán mềm

Tóm lại ta có 3 luật cho tất cả các trường hợp:

Thống nhất luật học:


Ta ñặt e là sai số của mạng perceptron: e = t – a
Ta có thể viết lại 3 luật trên như sau:

Ta cũng có thể hợp nhất 3 luật thành một biểu thức ñơn giản:

Có thể áp dụng luật này ñể huấn luyện ngưỡng phân cực (thay p =1)

Huấn luyện mạng Perceptron ña neutron:


Chúng ta có thể tổng quát hóa qui luật cập nhật vectơ trọng số cho mạng
perceptron ña neutron.
Công thức ñể cập nhật hàng thứ i của ma trận trọng số:

Công thức ñể cập nhật hàng thứ i vectơ phân cực:

Luật perceptron ñược viết gọn lại thành hệ thống ma trận kí hiệu như sau:

Ví dụ 1.10: Ví dụ về luật học perceptron


Bài toán nhận biết quả táo/quả cam. Các vectơ mẫu ngõ vào/ra là:

Với qui ước rằng: ngõ ra yêu cầu sẽ bằng 0 khi mẫu vào là “quả cam”
ngõ ra yêu cầu sẽ bằng 1 khi mẫu vào là “quả táo”

Trang 73
Chương 1 : Công nghệ tính toán mềm

Cảm biến hình dạng: 1 : tròn


-1 : không tròn

Cảm biến bề mặt: 1 : nhẵn


-1 : xù xì

Cảm biến trọng lượng: 1 : nặng hơn 1 pound


-1 : nhẹ hơn 1 pound

ðầu tiên, chúng ta sẽ khởi ñộng ma trận trọng số và ngưỡng phân cực:

 Ta ñưa vectơ ngõ vào p1 ñến hệ thống mạng:

Sau ñó, chúng ta tính toán sai số:

Trọng số ñược cập nhật là:

Ngưỡng phân cực ñược cập nhật là:

Kết thúc lần lặp ñầu tiên.

 Lần lặp thứ 2 của luật perceptron sẽ là:

Trang 74
Chương 1 : Công nghệ tính toán mềm

 Lần lặp thứ 3 sẽ bắt ñầu với vectơ ngõ vào của lần lặp ñầu tiên:

Nhận xét: Neáu tieáp tuïc vôùi caùc laàn laëp keá, ta seõ nhaän ra raèng: giôø ñaây, caû
hai vector ngoõ vaøo ñeàu ñaõ ñöôïc phaân loaïi chính xaùc. Thuaät toùan (caùc pheùp
laëp) treân ñaõ hoäi tuï veà cuøng moät ñaùp aùn.

Tóm tắt thuật toán:


Cấu trúc mạng tế bào-Perceptron

a i = hardlim (n i ) = hardlim ( iW T p + bi )
1 wT 
 T
w
Ma trận trọng số: W =  2 
M
 
 s w T 
T
ðường biên ranh giới: i w p + bi = 0
ðường ranh giới luôn vuông góc (trực giao) với vectơ trọng số.

Trang 75
Chương 1 : Công nghệ tính toán mềm

Luật học tế bào - Perceptron:


W new = W old + epT
b new = b old + e
với: e = t – a.

4. Hạn chế của luật học Perceptron:


Mạng perceptron phân loại chính xác các vectơ ngõ vào bằng một ñường
thẳng tuyến tính. Do ñó, mạng perceptron sẽ gặp khó khăn khi giải các bài
toán không thể phân chia tuyến tính ñược. Vì thế, ngoài mạng perceptron,
còn có nhiều phương pháp thích nghi trọng số khác cũng ñược sử dụng.

Ví dụ: Phương pháp Widrow-Hoff tính toán sai lệch giữa ngõ ra mong
muốn với ngõ ra thật sự của mạng:
∆ = d(t) – y(t)
Sau ñó cập nhật trọng số của mạng theo luật:
wi (t + 1) = wi (t ) − α∆xi (t )
Trong ñó:
d(t) là ngõ ra mong muốn và y(t) là ngõ ra của mạng
α là hệ số thích nghi ( 0 < α < 1)
Widrow gọi những mạng sử dụng thuật toán trên là mạng thích nghi tuyến
tính (Adaptive Linear Neural, ADALINE). Việc kết nối nhiều mạng
ADALINE lại với nhau tạo nên một cấu trúc gọi là mạng MADALINE
(many ADALINE). Thuật toán huấn luyện các mạng này xuất phát từ việc
cố gắng tìm một ñường thẳng phân chia 2 vùng không gian của bài toán.
Tuy nhiên, có rất nhiều trường hợp các vùng không gian không thể phân
chia tuyến tính ñược.
Một ví dụ kinh ñiển cho loại bài toán này cổng logic XOR. Các ngõ vào và
ra của cổng XOR ñược thể hiện như sau:

ðể giải quyết các bài toán trên ta phải sử dụng mạng truyền thẳng nhiều lớp.

Trang 76
Chương 1 : Công nghệ tính toán mềm

1.3.5. Mạng truyền thẳng nhiều lớp ( Multilayer perceptron _ MLP ) :


ðể khắc phục những khó khăn ñối với những bài toán có mẫu phân chia
không tuyến tính, mạng nơ-ron nhiều lớp ñược sử dụng. Có rất nhiều công
trình nghiên cứu về mạng MLP và ñã cho thấy nhiều ưu ñiểm của mạng này.
Mạng MLP là một giải pháp hữu hiệu cho việc mô hình hoá, ñặc biệt với
quá trình phức tạp hoặc cơ chế chưa rõ ràng. Nó không ñòi hỏi phải biết
trước dạng hoặc tham số. Mạng MLP là cơ sở cho thuật toán lan truyền
ngược và khả năng xấp xỉ liên tục.
1. Thuật toán lan truyền ngược (Back Propagation _BP):
Giải thuật lan truyền ngược ñược ñặt ra bởi Rumelhart, McClelland và
Williams vào những năm 80 của thế kỷ 20 là một trong những giải thuật phổ
biến ñể huấn luyện mạng nơ-ron nhiều lớp. ðây cũng là một kiểu học có
giám sát. Trọng số của mỗi nơ-ron ñược chỉnh ñịnh theo hướng tỉ lệ với sai
số của nơ-ron mà nó kết nối. Việc lan truyền ngược những sai số này từ ngõ
ra ñến ngõ vào của mạng có thể chỉnh ñịnh tất cả các trọng số của mạng.

Giải thuật lan truyền ngược huấn luyện mạng nơ-ron nhiều lớp:
Tập dữ liệu ñã cho có n mẫu (xn,dn), với mỗi n, xn là tín hiệu ñầu vào, dn là
ñầu ra mong muốn. Quá trình học là việc thực hiện cực tiểu hoá hàm G sau:
N
1
∑G ∑
N
G= n , với Gn = q −1
( yq( x n ) − dq( x n )) 2
n =1 N
Q là số nút tại lớp ra của mạng.
Trọng số liên kết mạng ñược ñiều chỉnh theo phép lặp sau :
∂G
w(k + 1) = w(k ) − η , trong ñó η >0 là hằng số tốc ñộ học.
∂w
Thuật toán lan truyền ngược ñề cập ở các phần trên ñã ñược ứng dụng rất
rộng rãi trong việc huấn luyện các mạng nơ-ron.Tuy nhiên, nó vẫn mắc phải
2 khuyết ñiểm cố hữu là: tốc ñộ hội tụ chậm và dễ bị rơi vào các vùng cực
trị cục bộ. Hai khuyết ñiểm này có thể hạn chế bằng việc lựa chọn tối ưu
tốc ñộ học (hệ số η ) và sử dụng bổ sung hệ số momentum vào luật học:

Trong ñó: α là hệ số momentum

Tuy có thể ñược cải thiện phần nào chất lượng học nhưng rõ ràng ñiều này
vẫn chưa ñủ ñể có thể ứng dụng giải thuật lan truyền ngược vào thực tế do
tốc ñộ hội tụ chậm của nó. Và những hạn chế này có thể ñược khắc phục khi
sử dụng mạng hàm cơ sở xuyên tâm.

Trang 77
Chương 1 : Công nghệ tính toán mềm

2. Mạng hàm cơ sở xuyên tâm (Radial basis functions _ RBF)


Mạng RBF có thể ñược huấn luyện nhanh chóng và do có cấu trúc mạng ñặc
biệt nên mạng RBF rất ít khi rơi vào các vùng cực trị cục bộ.
Cấu trúc mạng RBF: Mạng RBF cũng là một mạng truyền thẳng ba lớp
 Lớp ẩn sử dụng:
- Hàm tổng ngõ vào có dạng hàm cầu.
− x2
2σ q
- Hàm kích hoạt là hàm Gauss có dạng: ϕ ( x) = e
 Lớp ra sử dụng:
- Hàm tổng ngõ vào là hàm tuyến tính.
- Hàm kích hoạt là hàm kích hoạt ñơn vị.
Trong mạng RBF thì ngưỡng của các nơron là bằng 0.

z1
m11 w11
m12 w21
m1m wn1
wi1
wiq yi
wil

Lớp vào Lớp ẩn Lớp ra

Các phương trình toán truyền tín hiệu từ lớp vào ñến lớp ra của mạng:
 Ngõ ra của nơ-ron thứ q (thuộc lớp ẩn):
2
− X − mq

zq = e q

Trong ñó: X là vector ngõ vào


mq là tâm hàm RBF (trọng số của nơ-ron lớp ẩn thứ q)
σ q là bề rộng hàm RBF của nơ-ron ẩn thứ q
X − mq = ( x − mq ) T ( x − mq ) khoảng cách Euclide

Trang 78
Chương 1 : Công nghệ tính toán mềm

Ngõ ra của nơron lớp ẩn

 Ngõ ra của nơ-ron thứ i (thuộc lớp ra):


l
y i = ∑ wiq z q ( i = 1, n ; q = 1, l )
q =1

 Hàm năng lượng sai số:


1 n
E = ∑ (d i − y i ) 2
2 i =1

Khi sử dụng mạng RBF, ta cần chú ý các ñiểm sau:


o Lựa chọn dạng hàm kích hoạt ϕ phù hợp với mô hình.
o Tính toán số lượng tâm tối ưu. Nếu nhiều tâm quá sẽ không ñủ dữ
liệu ñể huấn luyện mạng, còn nếu tâm ít quá sẽ cho mô hình sai lệch.
o Tìm vị trí tâm và số lượng dữ liệu thích hợp ñể huấn luyện mạng.

Thuật toán huấn luyện mạng RBF, bao gồm các bước sau:
Bước 1: Chọn tốc ñộ học η > 0 , chọn sai số cực ñại Emax
Bước 2: ðặt giá trị ñầu: E = 0; k=1
Gán giá trị ngẫu nhiên cho các trọng số wiq(k)

Bước 3: Tính ngõ ra của mạng với tín hiệu vào là x(k):
2
− x ( k ) − mq
2σ q
z q (k ) = e
l
yi (k ) = ∑ wiq (k ) z q (k ) ( i = 1, n ; q = 1, l )
q =1

Trang 79
Chương 1 : Công nghệ tính toán mềm

Cập nhật trọng số cho lớp ra của mạng:


wiq (k + 1) = wiq (k ) + η (d i (k ) − y i (k )) z q (k )
Tính sai số tích lũy:
1 n
E = E + ∑ (d i (k ) − yi (k )) 2
2 i =1
Thực hiện vòng lặp ở bước 3 với k chạy từ 1 ñến K.

Bước 4: Kết thúc một chu trình huấn luyện


Nếu E < Emax thì kết thúc quá trình học
Nếu E > Emax thì gán E = 0 ; K = 1 và trở lại bước 3.

Nhận xét:
Mạng RBF không bị ảnh hưởng bởi vấn ñề cực trị cục bộ. Tuy
nhiên, RBF thường ñáp ứng chậm trong giai ñoạn nhớ do có một lượng lớn
nơron ở lớp ẩn. Nhưng ta có thể cải thiện vấn ñề này bằng việc chọn tâm và
ñộ phân tán phù hợp.
Nhờ khả năng xấp xỉ các hàm phi tuyến bất kì với ñộ chính xác tuỳ
ý, mạng nơron, ñặc biệt là mạng RBF là công cụ quan trọng cho mô hình
hoá hệ thống và cho ñiều khiển thích nghi các hệ thống phi tuyến.

1.3.6. Nhận dạng mô hình và ñiều khiển sử dụng mạng nơron


1. Nhận dạng thông số mô hình

Nhận dạng thông số chính là quá trình luyện mạng. Tín hiệu sai số
e= y−~ y là cơ sở cho luyện mạng, ∆ là thời gian trễ.

2. ðiều khiển sử dụng mạng nơron


Ta có nhiều cấu trúc ñiều khiển sử dụng mạng nơron khác nhau. Có thể kể
ñến một số cấu trúc ñiều khiển như sau:

Trang 80
Chương 1 : Công nghệ tính toán mềm

+ ðiều khiển theo vòng hở

+ ðiều khiển theo vòng kín

+ ðiều khiển với mô hình tham chiếu và sai số lan truyền qua ðTðK

+ ðiều khiển theo thời gian vượt quá (over time)

Trang 81
Chương 1 : Công nghệ tính toán mềm

+ Bộ ñiều khiển với quyết ñịnh hỗ trợ của mạng nơron

3. Ứng dụng mạng RBF ñể nhận dạng hệ ñộng lực học phi tuyến
Xét hệ ñộng học phi tuyến của ðTðK
x& = f ( x) + g ( x)u (1.79)
Giả sử ðTðK là ổn ñịnh vòng hở, véctơ trạng thái x là quan sát ñược. Cần
tìm mô hình xấp xỉ (1.79). Chọn A∈Rn x m là ma trận ổn ñịnh, ta viết lại
(1.79) dạng :
x& = Ax + ( f ( x) − Ax) + g ( x)u
Theo tính chất xấp xỉ của mạng RBF cho hàm phi tuyến: Nếu số lượng các
nút trong lớp ẩn là ñủ lớn thì f(x) - Ax và g(x) có thể xấp xỉ bằng các mạng
RBF sau:
f(x)- Ax = W*S(x) và g(x) = V*S(x)
trong ñó W* ∈ Rn x N và V* ∈ Rn x N là các ma trận trọng số của các tổ hợp
tuyến tính trên. N xác ñịnh số lượng nút trong một lớp RBF của mạng.
S(x) = [ S1, S2, …, SN ] T, véctơ các hàm cơ sở sau:
1

(
S k = x − Ck
2
+ρ 2
k )

2
, với k = 1, 2, 3,…N
Tâm Ck ∈ Rn và ñộ rộng ρk ∈ Rn ñược biết trước. Ta viết lại (1.79) như sau:
x& = Ax + W * S ( x) + V * S ( x)u
Vậy mô hình của ñối tượng có thể ñược mô tả bằng phương trình:
~
x& = A~x + WS ( x) + VS ( x)u
trong ñó W ∈ R , V ∈ Rn x N là các ma trận ước lượng của W*, V*, ~
nxN
x ∈Rn
là ước lượng trạng thái của x. Gọi
xe = ~ x − x , We = W*-W, Ve = V*-V
Phương trình sai số ước lượng sẽ là :
x& e = Axe + We S ( x) + Ve S ( x)u (1.80)

Trang 82
Chương 1 : Công nghệ tính toán mềm

Thuật toán nhận dạng sử dụng hàm Lyapunov:


1 T 1 1
L ( x e , We , V e ) = xe Px e + Tr (WeT We ) + Tr (VeT Ve ) (1.81)
2 2 2
với P là ma trận ñối xứng xác ñịnh dương. Có thể xác ñịnh ma trận Q ñối
xứng xác ñịnh dương thoả phương trình Lyapunov sau:
PA+ATP = - Q.
Thay (1.80) vào (1.81) và lấy ñạo hàm ta ñược:
1 1 1
L& = xeT (PA + AT P) xe + S T ( x)WeT Pxe + S T (x)VeT Pxeu + Tr(W&eT We ) + Tr(V&eT Ve )
2 2 2
Chọn : Tr (W& T W ) = − S T ( x)W T Px
e e e e (1.82)
Tr (V&eT Ve ) = − S T ( x)VeT Pxe u (1.83)
1
thì : L& ( x e , We , Ve ) = − xeT Qxe (1.84)
2
Do các ma trận W* và V* là ma trận hằng nên từ (1.82), (1.83) ta suy ra
thuật nhận dạng mô hình như sau:
n
W& ij = − S j ∑ Pik xek
k =1

n
V&ij = − S j ∑ Pik xek u
k =1

với i = 1,2,…,N và j = 1,2,…,N, Pij là phần tử của ma trận Lyapunov P.


Từ (1.81) ta thấy rằng L(xe,We,Ve) ≥ 0
Từ (1.84) nhận ñược L& ( x e , We , Ve ) ≤ 0
Vì vậy xe(t)→ 0, We → 0, Ve → 0, hoặc x& → x , W→ W*, V→ V* khi t→ ∞.
ðể tính toán ñơn giản có thể chọn :
A = aI, Q = qI, P = pI, với a > 0, q > 0 và I là ma trận ñơn vị
Khi ñó thuật toán nhận dạng mô hình ñơn giản như sau:
W& = − pS x
ij j ei

V& = − pS x u
ij j ei

q
Từ phương trình Lyapunov rút ra : p = >0.
2a
ðể hội tụ ñến trọng số thực, hệ ñộng lực phải có ñủ giàu thông tin ở ñầu
vào. Vì thế ña số ñầu vào ñược chọn ngẫu nhiên.

Trang 83
Chương 1 : Công nghệ tính toán mềm

1.3.7.Thuật toán học trực tuyến cấu trúc,thông số mạng nơron mờ ñộng
Hầu hết các thuật toán chỉnh ñịnh cấu trúc và thông số cho mạng nơ-ron mờ
ñều là học off-line. Quá trình học off-line (có giám sát) ñòi hỏi phải cung
cấp trước mẫu dữ liệu vào ra và việc học thông qua các vòng lặp huấn luyện
Do ñược cung cấp trước toàn bộ thông tin về hệ thống, cộng với ưu thế về
mặt thời gian (do off-line nên các vấn ñề về tốc ñộ học và thời gian học là
không quan trọng) và tài nguyên tính toán nên hầu hết các thuật toán học
off-line ñều cho chất lượng mạng tốt (tính ñặc trưng cao, sai số thấp, cấu
trúc ñơn giản…).
Vậy thì tại sao phải là on-line khi off-line ñã quá ñầy ñủ? Trong lĩnh vực
ñiều khiển tự ñộng, bài toán ñiều khiển ñối tượng khi ñặc tính ñộng học của
ñối tượng thay ñổi ñã dành ñược sự quan tâm của nhiều người. Thực tế ñã
chứng minh không phải bất kỳ một ñối tượng nào cũng mô hình hóa hoàn
toàn ñược (do ñặc tính phức tạp của nó) và khi ñã mô hình hóa ñược cũng
chưa chắc sẽ sử dụng ñược (vì ñặc tính ñối tượng không phải là bất biến
theo thời gian). ðể giải quyết bài toán này, người ta nghĩ ngay ñến các
phương pháp ñiều khiển thích nghi. Mạng nơ-ron mờ với khả năng tự học
của một mạng nơ-ron và tính ñặc trưng cao của một hệ mờ là lời giải thích
hợp nhất cho bài toán trên.

1. Cấu trúc mạng nơ-ron mờ ñộng:


Mạng nơ-ron mờ ñộng (Dynamic Fuzzy Neural Network – DFNN) có cấu
trúc dựa trên nền tảng mạng nơ-ron sử dụng hàm cơ sở xuyên tâm (mạng
RBF). ðiểm khác nhau cơ bản giữa DFNN và mạng RBF là ở số lớp nơ-ron
trong mạng: DFNN gồm 5 lớp (mạng RBF chỉ có 3 lớp). Tuy nhiên, DFNN
và mạng RBF có sự tương ñồng về mặt phương trình toán học truyền tín
hiệu trong mạng. ðặc tính “ñộng” (dynamic) của DFNN thể hiện ở cấu trúc
mạng – nó ñược tinh gọn gần như tối ña (số lượng nơ-ron ở lớp 3 của mạng
bằng với số ngõ vào) và nhờ vậy nó có thể dễ dàng thay ñổi cấu trúc của
mình trong khi vẫn ñảm bảo ñược khả năng ñặc trưng vốn có của một mạng
nơ-ron mờ mà vẫn hạn chế ñến mức thấp nhất sự xáo trộn trong số luợng
thông số của mạng.
Về mặt chức năng, mạng DFNN tương ñương với một hệ thống suy luận mờ
Takagi – Sugeno – Kang (TSK). ðể ñơn giản nhưng vẫn không mất tính
tổng quát, ta chỉ xét mạng DFNN nhiều ngõ vào – một ngõ ra. Các kết quả
nhận ñược hoàn toàn có thể ứng dụng ñối với mạng nhiều ngõ vào – nhiều
ngõ ra. Cấu trúc một mạng DFNN gồm 5 lớp:
 Lớp 1 (lớp vào)
Lớp vào gồm r nút, mỗi nút tương ứng với 1 ngõ vào xi (i = 1,2,..,r). Những
nút này thực hiện việc chuyển tín hiệu trực tiếp từ ngõ vào ñến lớp 2.

Trang 84
Chương 1 : Công nghệ tính toán mềm

Tập hợp r ngõ vào này trong một thời ñiểm tạo thành một vector ngõ vào:

 Lớp 2 (lớp mờ hóa)


Mỗi biến ngôn ngữ ngõ vào xi ñược ñặc trưng bởi u giá trị ngôn ngữ

Trong ñó : Ai : tập các giá trị ngôn ngữ của ngõ vào xi ,
aij : số mờ thứ jcủa ngõ vào thứ i với hàm liên thuộc dạng Gauss.
Ngõ ra của một nút thuộc lớp 2 sau khi mờ hóa:

với cij và σ j là tâm và bề rộng hàm liên thuộc Gauss thứ j của ngõ vào xi.

 Lớp 3 (lớp ñiều kiện/lớp luật mờ)


Lớp 3 có u luật mờ (nơron), mỗi luật mờ là sự kết hợp của r ngõ ra từ lớp 2:

Ngõ ra của mỗi nút trong lớp 3:

Nếu ñặt: Cj = [c1j … crj]T là vector chứa tâm hàm liên thuộc của luật thứ j

Trang 85
Chương 1 : Công nghệ tính toán mềm

Ta có thể thấy mỗi nút trong lớp này cũng là một hàm RBF của vector ngõ
vào X với tâm là vector Cj và bề rộng là σ j
 Lớp 4 (lớp chuẩn hóa)
Lớp 4 gồm u nút, mỗi nút trong lớp này làm nhiệm vụ chuẩn hóa ngõ ra của
1 nút ở lớp 3 tương ứng theo công thức:

 Lớp 5 (lớp ra)


Lớp này là tổng có trọng số của các ngõ ra ở lớp 4:

2. Thuật toán học cấu trúc và thông số on-line cho mạng DFNN
Khái niệm về học on-line:
ðây là một quá trình học có giám sát. Ban ñầu, cấu trúc mạng là hoàn toàn
“rỗng”, chỉ có các nơ-ron lớp vào và lớp ra (ñây là những nơ-ron cố ñịnh
trong suốt quá trình học). Học on-line, có nghĩa là mạng sẽ không ñược
cung cấp trước một tập mẫu dữ liệu vào- ra, các mẫu dữ liệu vào ra này sẽ
ñến với mạng ngay trong quá trình học, từng mẫu từng mẫu một. Do ñó,
mạng buộc phải hoàn tất một quá trình tính toán (chỉnh ñịnh cấu trúc và
thông số) trước khi lại tiếp tục nhận ñược một mẫu dữ liệu vào ra mới. Quá
trình học on-line là quá trình tiếp diễn không ngừng, từ mẫu dữ liệu vào ra
ñầu tiên cho ñến khi hệ thống ngừng hoạt ñộng hoặc mạng ñược lệnh ngừng
học. Vì vậy, thuật toán học on-line phải thỏa mãn các yêu cầu sau: tốc ñộ
hội tụ nhanh, cấu trúc mạng tinh gọn (số thông số ít) và có thể vận hành
trong ñiều kiện tài nguyên tính toán hạn chế.

Thuật toán học on-line cho mạng DFNN:


Khi mẫu dữ liệu vào ra ñầu tiên vào mạng sẽ xác lập một cấu trúc ban ñầu
cho mạng – mạng có 1 nơ-ron luật.

Trang 86
Chương 1 : Công nghệ tính toán mềm

Khi mạng nhận ñược mẫu dữ liệu tiếp theo, quá trình chỉnh ñịnh thông số sẽ
ñược tiến hành trong mỗi chu kỳ lấy mẫu thông qua thuật toán bình phương
tối thiểu ñệ quy. Quá trình chỉnh ñịnh cấu trúc chỉ xảy ra khi:
• sai số ngõ ra của mạng tương ñối lớn
• khả năng ñặc trưng dữ liệu ñầu vào của mạng kém – mạng sẽ ñược
bổ sung thêm nơ-ron luật.

Sau một thời gian, các nơ-ron luật mới thêm vào do khả năng ñặc trưng tốt
hơn sẽ vô hiệu hóa sự ảnh hưởng của các nơ-ron luật cũ trước ñó. Các nơ-
ron luật cũ này sẽ bị xóa bỏ khỏi mạng bằng kỹ thuật giản lược ñể giữ cho
cấu trúc mạng ñược tinh gọn. Quá trình này cứ tiếp tục cho ñến mẫu dữ liệu
vào ra cuối cùng mà mạng nhận ñược.

Thuật toán học cho mạng DFNN bao gồm 2 quá trình chính: quá trình chỉnh
ñịnh cấu trúc và quá trình chỉnh ñịnh thông số

A. Giai ñoạn chỉnh ñịnh cấu trúc on-line:


- Tiêu chuẩn phát sinh luật
ðể một luật mới (một neural ở lớp 3) ñược phát sinh thì hệ thống phải thỏa
mãn 2 ñiều kiện:
• Sai số hệ thống: với mỗi mẫu dữ liệu vào ra thu thập ñược tại thời
ñiểm t ( X t , dt ) , tính sai số của hệ thống:

et = dt − yt (1.85)

với yt là ngõ ra của mạng DFNN

Trang 87
Chương 1 : Công nghệ tính toán mềm

Nếu như et > ke thì thỏa mãn ñiều kiện thứ nhất ñể phát sinh luật
mới. Ở ñây, ke là hệ số không cố ñịnh mà giảm dần theo thời gian:

ke = max emax × β t , emin  (1.86)

với 0 < β < 1 ñược gọi là hằng số suy giảm, emax là sai số tối ña và
emin là ñộ chính xác mong muốn.
• Khoảng cách tối thiểu: với mỗi mẫu dữ liệu vào ra thu thập ñược tại
thời ñiểm t ( X t , dt ) , tính các khoảng cách tương ñối giữa vector
ngõ vào X và tâm các hàm liên thuộc Cj:
md j = X t − C j (j = 1,2,..,u) (1.87)

Tìm J = arg min ( md j )


j

Nếu như md min = md J > kd , có nghĩa là ngõ vào hiện tại không thể
ñược ñặt trưng bởi các luật mờ của hệ thống hiện tại, thì thỏa mãn
ñiều kiện thứ hai ñể phát sinh luật mới. Ở ñây, kd là hệ số không cố
ñịnh mà giảm dần theo thời gian:
kd = max  d max × γ t , d min  (1.88)

với 0 < γ < 1 ñược gọi là hằng số suy giảm, d max và d min là khoảng
cách tối ña và tối thiểu tùy thuộc vào từng ñối tượng.
Có 4 trường hợp có thể xảy ra:
• Trường hợp 1: et ≤ ke , md min ≤ kd . ðiều này thể hiện mạng ñã ñặc
trưng rất tốt cho mẫu dữ liệu hiện tại ( X t , dt ) . Do ñó không thực
hiện bất cứ thay ñổi nào trong mạng hoặc chỉ thực hiện việc chỉnh
ñịnh thông số mệnh ñề kết luận.
• Trường hợp 2: et ≤ ke , md min > kd . Mặc dù mẫu dữ liệu hiện tại
( X t , dt ) không ñược ñặt trưng tốt nhưng mạng vẫn mô tả ñúng ñối
tượng. ðiều này xảy ra khi mẫu dữ liệu ( X t , dt ) không mang nhiều
thông tin mô tả ñối tượng. Do ñó không thực hiện bất cứ thay ñổi
nào trong mạng hoặc chỉ thực hiện việc chỉnh ñịnh thông số mệnh ñề
kết luận.

Trang 88
Chương 1 : Công nghệ tính toán mềm

• Trường hợp 3: et > ke , md min ≤ kd . Mặc dù mẫu dữ liệu hiện tại


( X t , dt )
ñược ñặt trưng tốt bởi hàm RBF ở lớp 3 gần nhất nhưng
mạng không thể mô tả ñúng ñối tượng, có nghĩa là thông số các hàm
RBF hiện tại chưa ñúng. Do ñó, quá trình chỉnh ñịnh thông số mệnh
ñề mệnh ñề kết luận phải ñược thực hiện.
• Trường hợp 4: et > ke , md min > kd . Cấu trúc mạng DFNN hiện tại
không ñủ khả năng mô hình hóa ñối tượng, do ñó phải thực hiện việc
phát sinh một luật mới.
- Thông số ban ñầu cho luật mới
Sau khi một luật mới ñã ñược phát sinh, vấn ñề tiếp theo là làm thế
nào ñể xác ñịnh các thông số ban ñầu cho luật mới này. Các thông số của
T
một luật mới thứ u+1 bao gồm vector vị trí Cu +1 = c1(u +1) , c2(u +1) ,..., cr (u +1) 
và bề rộng σ u +1 của các hàm RBF mới ở lớp 3. Trong mạng DFNN, bề rộng
của một hàm RBF ảnh hưởng rất lớn ñến tính ñặc trưng của mạng. Nếu 2
hàm RBF kế cận nhau không chồng lấp hợp lý lên nhau thì một ngõ vào có
vị trí ở giữa 2 hàm này sẽ không ñược ñặc trưng tốt và ngõ ra của mạng sẽ
chứa ñựng rất ít thông tin về ngõ vào này. Trong khi ñó, nếu bề rộng của
hàm RBF quá lớn thì các ngõ vào xung quanh hàm RBF này luôn cho giá trị
mờ hóa là 1 và ngõ ra của mạng cũng sẽ bị ảnh hưởng rất ít bởi ngõ vào này.
Cả 2 trường hợp trên ñều cho kết quả là mô hình nhận dạng ñược sẽ không
mô tả tốt hệ thống thực. Trên sơ sở ñó, các thông số cho luật mới có thể
ñược chọn như sau:
Cu +1 = X t (1.89)

σ u +1 = knr × md min (i = 1,2,…,r) (1.90)


với knr là hệ số chồng lấp (thường ñược chọn trong khoảng 1.05 ñến 1.2).
Với cách cấp phát thông số ban ñầu như trên sẽ ñảm bảo tính chồng lấp hợp
lý của hàm RBF mới ñược tạo.
Ban ñầu mạng chưa tồn tại bất cứ hàm RBF nào, khi mẫu dữ liệu
ñầu tiên ( X 1 , d1 ) ñược thu thập, mạng sẽ phát sinh luật ñầu tiên. Và các
thông số ban ñầu cho luật này cũng có thể ñược cấp phát theo (1.89) và
(1.90) như sau:
C1 = X 1

σ1 = σ 0 (i = 1,2,..,r)

Trang 89
Chương 1 : Công nghệ tính toán mềm

với σ 0 là hằng số xác ñịnh tùy thuộc vào miền xác ñịnh của X .
- Kỹ thuật giản lược
ðôi khi, một luật mới có thể ñược tạo ra khi thỏa mãn 2 ñiều kiện
phát sinh luật nhưng sau ñó lại ñóng góp không ñáng kể ñến khả năng nhận
dạng của mạng. Những luật dư thừa như vậy không những làm tăng khối
lượng tính toán của hệ thống mà còn có thể ảnh hưởng ñến chất lượng nhận
dạng của mạng DFNN. Do ñó, một ñòi hỏi ñặt ra là làm thế nào ñể giản lược
những luật thừa này ñể tối giản ñến mức thấp nhất có thể bộ luật của hệ
thống (từ ñó tối thiểu số thông số của mạng) mà vẫn giữ nguyên chất lượng
nhận dạng của mạng. Trong quá trình học on-line của mạng DFNN, một kỹ
thuật giản lược dựa trên thuật toán Error Reduction Ratio (ERR) ñược sử
dụng ñể tự ñộng loại bỏ những luật thừa như sau:
Cho n cặp mẫu dữ liệu vào ra (Xk, dk), k = 1,2,…,n. ðặt:
ψ 11 ψ 11 x11 L ψ 11 xr1 ψ u1 ψ u1 x11 L ψ u1 xr1 

PSI =  M M O M L M M O M  (1.91)
ψ 1n ψ 1n x1n L ψ 1n xrn ψ un ψ un x1n L ψ un xrn 

W = [α10 ...α1r ...α u 0 ...α ur ] ∈ℜu ( r +1)×1 (1.92)


T
Y = [ y (1) L y (n) ] ∈ℜn×1 (1.93)
Trong ñó:
PSI ∈ ℜu ( r +1)×1 : là ma trận chứa các phần tử hồi quy
(1.94)
W ∈ℜu ( r +1)×1 : là vector thông số mệnh ñề kết luận
Có thể xem ngõ ra mong muốn của mạng như một mô hình hồi quy tuyến
tính như sau:
D = Y + E = PSI × W + E (1.95)
Với:
T
E = [ e(1) L e(n) ] là sai số ngõ ra với giả thiết là nhiễu trắng
trung bình bằng 0
T
D = [ d (1) L d (n) ] ∈ ℜn×1 là ngõ ra mong muốn của hệ thống.

Trang 90
Chương 1 : Công nghệ tính toán mềm

Với ma trận PSI bất kỳ có số hàng lớn hơn số cột ( n > u (r + 1) ), có


thể dùng phép phân ly nhanh QR ñể chuyển ma trận PSI sang ma trận chứa
các vector cơ sở trực giao:
PSI = QA (1.96)
Trong ñó:
Q =  q1 q2 L qu ( r +1)  ∈ ℜn×u ( r +1) có các cột là các vector trực
giao nhau ( QT Q = I )

A ∈ ℜu ( r +1)×u ( r +1) là ma trận tam giác trên


Phép biến ñổi trên giúp dễ dàng tính mức ñộ ñóng góp của mỗi vector cơ sở
trực giao qi tới ngõ ra mong muốn của hệ thống.
Từ (1.96) và (1.95):
D = QAW + E = QG + E (1.97)
với G = AW .
Dùng phương pháp bình phương tối thiểu tuyến tính ñể giải phương trình
(1.97) suy ra G = (QT Q) −1 QT D ∈ ℜu ( r +1)×1
hay:
qiT D
gi = (i = 1,2,…,u(r+1)) (1.98)
qiT qi
Do các vector qi và q j trực giao nhau khi i ≠ j , tổng bình phương ngõ ra
mong muốn cho bởi công thức:
u ( r +1)
DT D = ∑
i =1
gi 2 qiT qi + E T E (1.99)

Theo phương trình (1.99) có thể thấy thành phần gi 2 qiT qi ñặc trưng
cho sự ñóng góp của vector cơ sở qi ñến bình phương ngõ ra mong muốn.
Do ñó, có thể ñịnh nghĩa các tỉ số erri ñể ñặc trưng cho sự ñóng góp này
như sau:
gi 2 qiT qi
erri = (i = 1,2,…,u(r+1)) (1.100)
DT D

Trang 91
Chương 1 : Công nghệ tính toán mềm

Thay (1.98) vào (1.100). Suy ra:


(qiT D) 2 (qiT D)2
erri = = (i = 1,2,…,u(r+1)) (1.101)
qiT qi DT D DT D
Phương trình (1.101) cung cấp một cách thức ñơn giản nhưng hiệu
quả ñể tính mức ñộ ñóng góp vào ngõ ra của các phần tử hồi quy. Ý nghĩa
của (1.101) là erri tượng trưng cho sự tương quan giữa qi và D. Nếu erri
lớn có nghĩa qi có ñóng góp ñáng kể ñến ngõ ra hệ thống.

Chuyển vector ERRi = err1 err2 L erru ( r +1)  ∈ ℜ1×u ( r +1) sang ma
T
trận ∆ = [δ1 δ 2 L δ u ] ∈ ℜu×( r +1) với hàng thứ j của ∆ tương ứng với
luật thứ j của mạng DFNN. ðể tính mức ñộ ñóng góp của luật thứ j vào ngõ
ra của hệ thống, ñịnh nghĩa:

δ jδ j T
ηj = (1.102)
r +1
Nếu η j < kerr với kerr là một hằng số xác ñịnh, có nghĩa là luật thứ j của
mạng ñóng góp không ñáng kể ñến ngõ ra của hệ thống trong n tập mẫu dữ
liệu. Do ñó, luật thứ j của mạng có thể ñược xóa bỏ.

B. Chỉnh ñịnh thông số mệnh ñề kết luận


Mục tiêu của việc chỉnh ñịnh thông số mệnh ñề kết luận là tối thiểu bình
phương sai số nhận dạng của mạng:
1 2
E= [ d (t ) − y(t )] (1.103)
2
Các thông số mệnh ñề kết luận có thể chỉnh ñịnh thông qua phương pháp
bình phương tối thiểu ñệ quy (Recursive Least Square RLS) như sau:
• Bước 1: Tính sai số nhận dạng
e(t ) = d (t ) − y (t ) (1.104)
• Bước 2: cập nhật hệ số quên λ
λ (t ) = λ (t − 1) + [1 − λ (t − 1)] ∆λ (1.105)

với ∆λ là một hằng số dương xác ñịnh

Trang 92
Chương 1 : Công nghệ tính toán mềm

• Bước 3: tính ma trận tạm


P(t − 1) PSI nT
L(t ) = (1.106)
λ (t ) + PSI n P(t − 1) PSI nT
với PSI n là hàng thứ n của ma trận PSI trong phương trình (1.91)
• Bước 4: cập nhật ma trận hiệp phương sai P(t )
P(t − 1) − L(t ) PSI n P(t − 1)
P(t ) = (1.107)
λ (t )
trong ñó P(0) = µ I với µ là số dương lớn và I là ma trận ñơn vị
u (r + 1) × u (r + 1)
• Bước 5: cập nhật vector thông số mệnh ñề kết luận W (t )
W (t ) = W (t − 1) + L(t )e(t ) với W (0) = 0 (1.108)

1.3.8. Kết luận


Sau khi ñã nghiên cứu về mạng nơ-ron nhân tạo, ta thấy mặc dù có rất nhiều
cấu trúc mạng cũng như thuật toán huấn luyện mạng khác nhau nhưng giữa
chúng vẫn có một vài ñiểm chung quan trọng như:
- Khả năng của mạng nơ-ron nhân tạo không do lập trình sẵn mà ñạt
ñược từ quá trình huấn luyện mạng. Huấn luyện mạng là quá trình hiệu
chỉnh các trọng số kết nối giữa các nơ-ron trong mạng sao cho mạng có thể
ñáp ứng chính xác với các mẫu dữ liệu ngõ vào.
- Có hai kỹ thuật học ñược sử dụng chủ yếu là học giám sát và học
không giám sát. Kỹ thuật học giám sát yêu cầu cần phải ñược cung cấp các
cặp mẫu dữ liệu vào-ra.
- Một mạng sau khi ñược huấn luyện thành công có khả năng tổng
quát hóa (ñặc trưng hóa) cao: nó có thể ñáp ứng chính xác với ngõ vào mà
nó chưa từng gặp trước ñó.
- Thời gian huấn luyện mạng còn tùy thuộc vào kiến trúc, thuật toán
học và chức năng của mạng. Thông thường, việc huấn luyện mạng nơ-ron
ñòi hỏi nhiều thời gian.
- Khả năng của mạng tùy thuộc vào số lượng nơ-ron dùng trong
mạng. Một cách tổng quát, mạng có càng nhiều nơ-ron thì khả năng của
mạng càng cao (nhưng thời gian huấn luyện mạng là rất lớn) và ngược lại.

Trang 93
Chương 1 : Công nghệ tính toán mềm

1.4. Thuật toán di truyền (GA)


1.4.1 Giới thiệu
Thuật toán di truyền là thuật toán tối ưu ngẫu nhiên dựa trên cơ chế chọn lọc
tự nhiên và tiến hóa di truyền. Nguyên lý cơ bản của thuật toán di truyền ñã
ñược Holland giới thiệu vào năm 1962. Cơ sở toán học ñã ñược phát triển từ
cuối những năm 1960 và ñã ñược giới thiệu trong quyển sách ñầu tiên của
Holland, Adaptive in Natural and Artificial Systems. Thuật toán di truyền
ñược ứng dụng ñầu tiên trong hai lĩnh vực chính: tối ưu hóa và học tập của
máy. Trong lĩnh vực tối ưu hóa thuật toán di truyền ñược phát triển nhanh
chóng và ứng dụng trong nhiều lĩnh vực khác nhau như tối ưu hàm, xử lý
ảnh, bài toán hành trình người bán hàng, nhận dạng hệ thống và ñiều khiển.
Thuật toán di truyền cũng như các thuật toán tiến hóa nói chung, hình thành
dựa trên quan niệm cho rằng, quá trình tiến hóa tự nhiên là quá trình hoàn
hảo nhất, hợp lý nhất và tự nó ñã mang tính tối ưu. Quan niệm này có thể
xem như một tiên ñề ñúng, không chứng minh ñược, nhưng phù hợp với
thực tế khách quan. Quá trình tiến hóa thể hiện tính tối ưu ở chỗ, thế hệ sau
bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện hơn) thế hệ trước bởi tính
kế thừa và ñấu tranh sinh tồn.

• Các tính chất ñặc thù của thuật toán di truyền


 GA lập luận mang tính chất ngẫu nhiên (stochastic) thay vì xác ñịnh
(deterministic) như toán học giải tích.
 GA xét duyệt toàn bộ các giải pháp, sau ñó lựa chọn giải pháp tốt
nhất dựa trên hệ số thích nghi.
 GA chỉ tập trung vào giải pháp (dãy số tượng trưng cho giải pháp)
mà không cần quan tâm ñến chi tiết vấn ñề.
 GA thích hợp cho việc tìm ñiều kiện tối ưu cho việc ñiều hành và
phân nhóm những giải pháp có ñược.

1.4.2 Các phép toán của thuật toán di truyền


1. Tái sinh (Reproduction)
Tái sinh là quá trình chọn quần thể mới thỏa phân bố xác suất dựa trên ñộ
thích nghi. ðộ thích nghi là một hàm gán một giá trị thực cho cá thể trong
quần thể. Các cá thể có ñộ thích nghi lớn sẽ có nhiều bản sao trong thế hệ
mới. Hàm thích nghi có thể không tuyến tính,không ñạo hàm, không liên tục
bởi vì thuật toán di truyền chỉ cần liên kết hàm thích nghi với các chuỗi số.

Trang 94
Chương 1 : Công nghệ tính toán mềm

Quá trình này ñược thực hiện dựa trên bánh xe quay roulette (bánh xe sổ
xố) với các rãnh ñược ñịnh kích thước theo ñộ thích nghi. Kỹ thuật này
ñược gọi là lựa chọn cha mẹ theo bánh xe roulette. Bánh xe roulette ñược
xây dựng như sau (giả ñịnh rằng, các ñộ thích nghi ñều dương, trong trường
hợp ngược lại thì ta có thể dùng một vài phép biến ñổi tương ứng ñể ñịnh lại
tỷ lệ sao cho các ñộ thích nghi ñều dương).
- Tính ñộ thích nghi fi, i=1÷ n của mỗi nhiễm sắc thể trong quần thể hiện
hành,với n là kích thước của quần thể (số nhiễm sắc thể trong quần thể).
n
- Tìm tổng giá trị thích nghi toàn quần thể: F = ∑ f i
i =1

fi
- Tính xác suất chọn pi cho mỗi nhiễm sắc thể: pi =
F
i
- Tính vị trí xác suất qi của mỗi nhiễm sắc thể: qi = ∑ p j
j =1

Tiến trình chọn lọc ñược thực hiện bằng cách quay bánh xe roulette n lần,
mỗi lần chọn một nhiễm sắc thể từ quần thể hiện hành vào quần thể mới
theo cách sau:
- Phát sinh ngẫu nhiên một số r trong khoảng [0÷1] khi quay bánh xe.
- Nếu r < q1 thì chọn nhiễm sắc thể ñầu tiên; ngược lại thì chọn nhiễm
sắc thể thứ i sao cho qi-1 < r ≤ qi

Ví dụ 1.11: Xét bài toán dân số có 6 nhiễm sắc thể với chuỗi mã hóa và
hệ số thích nghi tương ứng cho trong bảng 1.
Bảng 1: Các nhiễm sắc thể và các giá trị thích nghi

Nhiễm sắc thể Chuổi mã hóa Trị thích nghi f(i)


1 01110 8
2 11000 15
3 00100 2
4 10010 5
5 01100 12
6 00011 8

Trang 95
Chương 1 : Công nghệ tính toán mềm

6
 Giá trị tổng thích nghi toàn quần thể là : F = ∑ f i = 50
i =1

fi
 Tính xác suất chọn pi cho mỗi nhiễm sắc thể: pi =
F
i
 Tính vị trí xác suất qi của mỗi nhiễm sắc thể: qi = ∑ p j
j =1

Kết quả thu ñược ñiền vào bảng 2:


Bảng 2: Kết qủa tính toán cho các nhiễm sắc thể

Nhiễm sắc Chuổi mã Trị thích nghi Xác suất chọn Vị trí xác suất
thể hóa f(i) pi qi

1 01110 8 0.16 0.16


2 11000 15 0.3 0.46
3 00100 2 0.04 0.5
4 10010 5 0.1 0.6
5 01100 12 0.24 0.84
6 00011 8 0.16 1

Bây giờ ta quay bánh xe roulette 6 lần, mỗi lần chọn một nhiễm sắc thể cho
quần thể mới. Giá trị ngẫu nhiên của 6 số trong khoảng [0÷1] và các nhiễm
sắc thể tương ứng ñược chọn ñược cho trong bảng 2.

Trang 96
Chương 1 : Công nghệ tính toán mềm

Bảng 2: Quần thể mới


Số lần quay 1 2 3 4 5 6
Số ngẫu nhiên 0.55 0.1 0.95 0.4 0.8 0.7
Nhiễm sắc thể 4 1 6 2 5 5

Ta thấy:
Lần 1: r1 = 0.55 > q1 = 0.16 và q3 < r <q4 nên ta chọn NST 4
Lần 2 : r2 = 0.1 < q1 = 0.16 nên ta chọn NST 1
Tương tự cho các lần quay còn lại, ta có sẽ ñược một quần thể mới.
Ta thấy, có thể sẽ có một số nhiễm sắc thể ñược chọn nhiều lần, các nhiễm
sắc thể có ñộ thích nghi cao hơn sẽ có nhiều bản sao hơn, các nhiễm sắc thể
có ñộ thích nghi kém nhất thì dần dần chết ñi.
Sau khi lựa chọn ñược quần thể mới, bước tiếp theo trong thuật toán di
truyền là thực hiện các phép toán lai ghép và ñột biến.
2. Lai ghép (Crossover)
Phép lai là quá trình hình thành nhiễm sắc thể mới trên cơ sở các nhiễm sắc
thể cha - mẹ, bằng cách ghép một hay nhiều ñoạn gen của hai (hay nhiều)
nhiễm sắc thể cha - mẹ với nhau. Phép lai xảy ra với xác suất pc, ñược thực
hiện như sau:
- ðối với mỗi nhiễm sắc thể trong quần thể mới, phát sinh ngẫu nhiên
một số r trong khoảng [0÷1], nếu r < pc thì nhiễm sắc thể ñó ñược chọn
ñể lai ghép.
- Ghép ñôi các nhiễm sắc thể ñã chọn ñược một cách ngẫu nhiên, ñối với
mỗi cặp nhiễm sắc thể ñược ghép ñôi, ta phát sinh ngẫu nhiên một số
nguyên pos trong khoảng [0÷m-1] (m là tổng chiều dài của một nhiễm
sắc thể - tổng số gen). Số pos cho biết vị trí của ñiểm lai. ðiều này ñược
minh họa như sau:

Trang 97
Chương 1 : Công nghệ tính toán mềm

- Chuyển ñổi các gen nằm sau vị trí lai.

Như vậy phép lai này tạo ra hai chuỗi mới, mỗi chuổi ñều ñược thừa hưởng
những ñặc tính lấy từ cha và mẹ của chúng. Mặc dù phép lai ghép sử dụng
lựa chọn ngẫu nhiên, nhưng nó không ñược xem như là một lối ñi ngẫu
nhiên qua không gian tìm kiếm. Sự kết hợp giữa tái sinh và lai ghép làm cho
thuật toán di truyền hướng việc tìm kiếm ñến những vùng tốt hơn.

3. ðột biến (Mutation)


ðột biến là hiện tượng cá thể con mang một (số) tính trạng không có trong
mã di truyền của cha mẹ. Phép ñột biến xảy ra với xác suất pm, nhỏ hơn rất
nhiều so với xác suất lai pc.
Theo nghiên cứu của Kenneth De Jong thì:
 Tỉ lệ lai ghép trung bình : 0.6
 Tỉ lệ ñột biến : 0.001
 Tỉ lệ tạo sinh : 0.399
Mỗi gen trong tất cả các nhiễm sắc thể có cơ hội bị ñột biến như nhau, nghĩa
là ñối với mỗi nhiễm sắc thể trong quần thể hiện hành (sau khi lai) và ñối
với mỗi gen trong nhiễm sắc thể, quá trình ñột biến ñược thực hiện như sau:
- Phát sinh ngẫu nhiên một số r trong khoảng [0÷1]
- Nếu r < pm, thì ñột biến gen ñó.
ðột biến làm tăng khả năng tìm ñược lời giải gần tối ưu của thuật toán di
truyền. ðột biến không ñược sử dụng thường xuyên vì nó là phép toán tìm

Trang 98
Chương 1 : Công nghệ tính toán mềm

kiếm ngẫu nhiên, với tỷ lệ ñột biến cao, thuật toán di truyền sẽ còn xấu hơn
phương pháp tìm kiếm ngẫu nhiên.
Sau quá trình tái sinh, lai và ñột biến, quần thể mới tiếp tục ñược tính toán
các giá trị thích nghi, sự tính toán này ñược dùng ñể xây dựng phân bố xác
suất (cho tiến trình tái sinh tiếp theo), nghĩa là, ñể xây dựng lại bánh xe
roulette với các rãnh ñược ñịnh kích thước theo các giá trị thích nghi hiện
hành. Phần còn lại của thuật toán di truyền chỉ là sự lặp lại chu trình của
những bước trên.

• Hàm thích nghi (Fitness)


Ta xây dựng hàm thích nghi f(x) nhận giá trị không âm. Có 2 trường hợp:
 ðối với bài toán tìm cực tiểu hàm g(x)
C max − g ( x) khi g ( x) < C max
f ( x) = 
0 khi g ( x) ≥ C max
Có thể lấy Cmax là giá trị g lớn nhất trong quần thể hiện tại.

 ðối với bài toán tìm cực ñại hàm g(x)


u ( x) + C min khi u ( x) + C min > 0
f ( x) = 
0 khi u ( x) + C min ≤ 0
Có thể lấy Cmin là trị tuyệt ñối của u bé nhất trong quần thể hiện tại.

1.4.3 Cấu trúc của thuật toán di truyền tổng quát


Thuật toán di truyền bao gồm các bước sau:
Bước 1: Khởi tạo quần thể các nhiễm sắc thể. Chọn mô hình cho giải pháp
của vấn ñề. Chỉ ñịnh cho mỗi giải pháp một ký hiệu.
Bước 2: Tìm hàm thích nghi và xác ñịnh giá trị thích nghi của từng nhiễm
sắc thể.
Bước 3: Sao chép lại các nhiễm sắc thể dựa vào giá trị thích nghi của chúng
(tạo sinh) và tạo ra những nhiễm sắc thể mới bằng các phép toán di
truyền (lai ghép hay ñột biến).
Bước 4: Tính hệ số thích nghi cho các thành viên mới ñể loại bỏ những
thành viên không phù hợp trong quần thể.

Trang 99
Chương 1 : Công nghệ tính toán mềm

Bước 5: Nếu chưa tìm ñược giải pháp tối ưu thì trở lại bước 3. Nếu mục tiêu
tìm kiếm ñã ñạt ñược thì dừng lại. Báo cáo kết quả.

1.4.4 Ví dụ minh họa:


Ví dụ 1.12: Tìm ñáp số cho phương trình X2 = 64. ðây là một bài toán ñơn
giản ñể giúp ta có thể hiểu rõ hơn các bước của thuật toán di truyền.
Giải bài toán di truyền theo các bước sau:
 Bước 1: Chúng ta sử dụng hệ nhị phân ñể xây dựng mô hình bài toán.
Ta dùng 4 bit nhị phân ñể mã hóa cho các ñáp số của bài toán. Giả sử ta
không biết ñáp số của bài toán, ta sẽ chọn 4 số trong các ñáp số có thể có
và ký hiệu cho các ñáp số ñó.

Trang 100
Chương 1 : Công nghệ tính toán mềm

Bảng chọn lựa:


Thứ tự Nhị phân Thập phân
1 0 0100 4
2 1 0101 21
3 0 1010 10
4 1 1000 24

 Bước 2: Tìm hàm số thích nghi và tính hệ số thích nghi cho từng ñáp số.
Ta chọn hàm số thích nghi sau: f(X) = 1000 – (X2 – 64)
Vậy, ñáp số nào có hệ số thích nghi f gần bằng 1000 nhất thì ñó là ñáp số.

Khảo sát kết quả tính ñược:

Thập phân Hệ số thích


Thứ tự Nhị phân X2 - 64
(X) nghi f(x)
1 0 0100 4 - 48 952
2 1 0101 21 377 623
3 0 1010 10 36 964
4 1 1000 24 512 488

 Bước 3: ta thấy, hệ số thích nghi của các ñáp số vẫn còn cách xa 1000.
Do ñó, cần tạo ra các ñáp số mới bằng cách biến hóa các ñáp số cũ. Ta thấy
số 4 và 10 có hệ số thích nghi cao hơn nên ñược chọn ñể tạo sinh và biến
hóa. ðồng thời số 21 và 24 có hệ số thích nghi thấp sẽ bị loại.
Giả sử ta lai ghép hai số 4 và 10 theo hình sau:

 Bước 4: Tính hệ số thích nghi cho quần thể mới


Thập phân Hệ số thích
Thứ tự Nhị phân X2 - 64
(X) nghi f(x)
1 0 0100 4 - 48 952
2 0 1010 10 36 964
3 0 1000 8 0 1000
4 0 0110 6 28 968

Trang 101
Chương 1 : Công nghệ tính toán mềm

 Bước 5: May mắn chúng ta ñã tìm ñược kết quả là X = 8 với hệ số thích
nghi cao nhất là 1000.
Vậy kết quả của bài toán là X = 8.

Ví dụ 1.13:
Tìm giá trị cực ñại của hàm sau:
f ( x1 , x 2 ) = 21.5 + x1 × sin(4πx1 ) + x 2 × sin(20πx 2 )
Với − 3.0 ≤ x1 ≤ 12.1 và 4.1 ≤ x 2 ≤ 5.8

Giả sử kích thước quần thể là 20, các xác suất di truyền tương ứng là
pc = 0.25 và pm = 0.01

Giải:

 Bước 1: Chúng ta sử dụng hệ nhị phân ñể xây dựng mô hình bài toán

Giả sử ta cần chính xác ñến 4 số lẻ thì số khoảng mà mỗi biến cần là:
Biến x1: {12.1 – ( -3.0 )} × 10000 = 151000 khoảng
⇒ số bit cần dùng ñể mã hóa cho biến x1 là 18 bit

Biến x2: {5.8 – ( 4.1 )} × 10000 = 17000 khoảng


⇒ số bit cần dùng ñể mã hóa cho biến x1 là 15 bit

Vậy chiều dài của một nhiễm sắc thể là m = 15 + 18 = 33 bit

Ký hiệu NST thứ i là vi = ( x1 , x2 ) với i = 1,20


Tiếp theo ta tiến hành khởi tạo quần thể một cách ngẫu nhiên:

v1 = 100110100000001111 111010011011111
v2 = 111000100100110111 001010100011010
v3 = 000010000011001000 001010111011101
v4 = 100011000101101001 111000001110010
v5 = 000111011001010011 010111111000101
v6 = 000101000010010101 001010111111011
v7 = 001000100000110101 111011011111011

Trang 102
Chương 1 : Công nghệ tính toán mềm

v8 = 100001100001110100 010110101100111
v9 = 100000000101100010 110000001111100
v10 = 000001111000110000 011010000111011
v11 = 011001111110110101 100001101111000
v12 = 110100010111101101 000101010000000
v13 = 111011111010001000 110000001000110
v14 = 010010011000001010 100111100101001
v15 = 111011101101110000 100011111011110
v16 = 110011110000011111 100001101001011
v17 = 011010111111001111 010001101111101
v18 = 011101000000001110 100111110101101
v19 = 000101010011111111 110000110001100
v20 = 101110010110011110 011000101111110

 Bước 2: Giải mã và tính hệ số thích nghi (lấy NST thứ 1 làm ví dụ)

Mã hóa NST:
v1 = 100110100000001111 111010011011111
12.1 − (−3.0)
x1 = -3.0 + dec(100110100000001111) × = 6.0845
218 − 1
5.8 − 4.1
x2 = 4.1 + dec(111010011011111) × 15 = 5.6522
2 −1

Tính trị thích nghi:


f (x1,x2 ) = f (6.0845 ; 5.6522) = 26.0196
Ta lần lượt tính giá trị thích nghi của các NST còn lại.
20
Giá trị tổng thích nghi toàn quần thể : F = ∑ f i = 387.7768
i =1

f1 26.0196
Xác suất chọn p1 : p1 = = = 0.067
F 387.7768
i 1
Vị trí xác suất q1: qi = ∑ p j ⇒ q1 = ∑ p j = p1 = 0.067
j =1 j =1

Ta lần lượt tính giá trị của các NST còn lại. Ghi kết quả vào bảng.

Trang 103
Chương 1 : Công nghệ tính toán mềm

Bảng kết quả thu ñược:


Trị thích nghi Xác suất Vị trí xác
NST X1 X2
f ( x1,x2 ) chọn pi suất qi
1 6.0845 5.6522 26.0196 0.067 0.067
2 10.3484 4.3802 7.5800 0.019 0.086
3 -2.5166 4.3904 19.6263 0.050 0.137
4 5.2786 5.5934 17.4067 0.044 0.181
5 -1.2551 4.7345 25.3411 0.065 0.247
6 -1.8117 4.3919 18.1004 0.046 0293
7 -0.9915 5.6803 16.0208 0.041 0.335
8 4.9106 4.7030 17.9597 0.046 0.381
9 0.7954 5.3814 16.1278 0.041 0.423
10 -2.5548 4.7937 21.2784 0.054 0.478
11 3.1300 4.9961 23.4107 0.060 0.538
12 9.3561 4.2395 15.0116 0.038 0.577
13 11.1346 5.3786 27.3167 0.070 0.647
14 1.3359 5.1513 19.8762 0.051 0.698
15 11.0890 5.0545 30.0602 0.077 0.776
16 9.2116 4.9937 23.9672 0.061 0.837
17 3.3675 4.5713 13.6961 0.035 0.873
18 3.8430 5.1582 15.4141 0.039 0.812
19 -1.7466 5.3955 20.0959 0.051 0.964
20 7.9359 4.7573 13.6669 0.035 1.000

 Tạo sinh: Xây dựng hệ thống bánh xe rulét cho tiến trình chọn lọc.
Quay bánh xe rulét 20 lần, phát sinh ngẫu nhiên 20 số (r) trong khoảng [0 1]
Mỗi lần quay chọn 1 NST mới (xem lại cách chọn NST ở phần trên)

Lần quay 1 2 3 4 5 6
Số ngẫu nhiên 0.514 0.175 0.308 0.534 0.947 0.171
NST ñược chọn v11 v4 v7 v11 v19 v4

Lần 7 8 9 10 11 12 13
r 0.702 0.226 0.494 0.424 0.704 0.389 0.277
NST v15 v5 v11 v3 v15 v9 v6

Lần 14 15 16 17 18 19 20
r 0.368 0.983 0.005 0.765 0.646 0.767 0.780
NST v8 v20 v1 v10 v13 v15 v16

Trang 104
Chương 1 : Công nghệ tính toán mềm

Như vậy, quần thể mới ñược chọn là:

v’1 = 011001111110110101 100001101111000


v’2 = 100011000101101001 111000001110010
v’3 = 001000100000110101 111011011111011
v’4 = 011001111110110101 100001101111000
v’5 = 000101010011111111 110000110001100
v’6 = 100011000101101001 111000001110010
v’7 = 111011101101110000 100011111011110
v’8 = 000111011001010011 010111111000101
v’9 = 011001111110110101 100001101111000
v’10 = 000010000011001000 001010111011101
v’11 = 111011101101110000 100011111011110
v’12 = 100000000101100010 110000001111100
v’13 = 000101000010010101 001010111111011
v’14 = 100001100001110100 010110101100111
v’15 = 101110010110011110 011000101111110
v’16 = 100110100000001111 111010011011111
v’17 = 000001111000110000 011010000111011
v’18 = 111011111010001000 110000001000110
v’19 = 111011101101110000 100011111011110
v’20 = 110011110000011111 100001101001011

 Quá trình lai ghép: xác suất lai pc = 0.25


ðối với mỗi NST trong quần thể mới phát sinh ngẫu nhiên một số r trong
khoảng [0 1]. Nếu r < 0.25 thì ta chọn một NST cho trước ñể lai tạo.
Giả sử thứ tự của các số ngẫu nhiên là:
0.822 0.151 0.625 0.314 0.346
0.917 0.519 0.401 0.606 0.785
0.031 0.869 0.166 0.574 0.758
0.581 0.389 0.200 0.355 0.826

Ta thấy các NST v’2 ,v’11 ,v’13 ,v’18 ñược chọn ñể lai tạo. Ở ñây, chúng ta có
số NST cần ñược lai tạo là một số chẵn nên ta có thể bắt cặp dễ dàng.
Trường hợp tổng số NST cần lai tạo là số lẻ thì ta có thể cộng thêm một
NST ngoại hoặc lấy bớt ñi một NST một cách ngẫu nhiên.

Ta giả sử kết hợp (v’2 ,v’11) và (v’13 ,v’18). ðối với mỗi cặp NST sẽ phát
sinh một số nguyên ngẫu nhiên pos trong khoảng [1 32].
Số pos cho biết vị trí của ñiểm lai tạo.

Trang 105
Chương 1 : Công nghệ tính toán mềm

• Cặp NST (v’2 ,v’11): giả sử pos = 9

v’’2 = 100011000 101110000 100011111011110


v’’11 = 111011101 101101001 111000001110010

• Cặp NST (v’13 ,v’18): giả sử pos = 20

v’’13 = 000101000010010101 11 0000001000110


v’’18 = 111011111010001000 00 1010111111011

 Phép toán ñột biến: xác suất ñột biến pm = 0.01


Toàn bộ quần thể có: 33 × 20 = 660 bit
Như vậy, trung bình có 6.6 ñột biến trong mỗi thế hệ. Vì mỗi bit ñều có cơ
hội ñột biến ngang nhau nên ta phát sinh ngẫu nhiên số r trong khoảng [0 1].
Nếu bit nào r < 0.01 thì xảy ra ñột biến ở bit ñó. Giả sử có 5 vị trí ñột biến:

Vị trí bit Số ngẫu nhiên Nhiễm sắc thể thứ Vị trí bit trong NST
112 0.0002 4 13
349 0.0099 11 19
418 0.0088 13 22
429 0.0054 13 33
603 0.0028 19 9

Ta thấy có 4 NST bị ñột biến. Trong ñó, NST thứ 13 bị ñột biến ở 2 vị trí.
Sau khi ñột biến, quần thể hiện hành là:

v1 = 011001111110110101 100001101111000
v2 = 100011000101110000 100011111011110
v3 = 001000100000110101 111011011111011
v4 = 011001111110010101 100001101111000
v5 = 000101010011111111 110000110001100
v6 = 100011000101101001 111000001110010
v7 = 111011101101110000 100011111011110
v8 = 000111011001010011 010111111000101
v9 = 011001111110110101 100001101111000

Trang 106
Chương 1 : Công nghệ tính toán mềm

v10 = 000010000011001000 001010111011101


v11 = 111011101101101001 011000001110010
v12 = 100000000101100010 110000001111100
v13 = 000101000010010101 110100001000111
v14 = 100001100001110100 010110101100111
v15 = 101110010110011110 011000101111110
v16 = 100110100000001111 111010011011111
v17 = 000001111000110000 011010000111011
v18 = 111011111010001000 001010111111011
v19 = 111011100101110000 100011111011110
v20 = 110011110000011111 100001101001011

Như vậy ta ñã hoàn thành xong một vòng lặp (nghĩa là một thế hệ).
Ta tính toán tương tự cho vòng lặp kế. Kết quả thu ñược từ quần thể mới là:
Tổng ñộ thích nghi: F = 447.049 cao hơn so với quần thể trước (387.77).
NST tốt nhất v11 có ñộ thích nghi là 33.35 tốt hơn NST tốt nhất v11 của
quần thể trước là 30.06.

 Nhận xét:
Cứ tiếp tục như thế, cá thể “trội hơn cả“ sẽ ñược lưu trữ tại một vị trí riêng
biệt. bằng cách này, thuật giải có thể duy trì ñược cá thể tốt nhất tìm ñược
trong suốt quá trình (không có nghĩa là tốt nhất trong quần thể cuối cùng).

1.4.5. Kết luận:


Thuật toán di truyền ñã chứng tỏ tính hữu ích của nó khi ñược ứng dụng
rộng rãi trong nhiều lĩnh vực khác nhau của cuộc sống.
Trong lĩnh vực ñiều khiển tự ñộng, thuật toán di truyền có thể ñược sử
dụng ñể xác ñịnh thông số tối ưu cho các bộ ñiều khiển. Thông số bộ ñiều
khiển ñược mã hóa thành các nhiễm sắc thể, thông qua mô phỏng, các
nhiễm sắc thể này ñược ñánh giá và lựa chọn thông qua mức ñộ thích nghi
của chúng (cũng chính là các chỉ tiêu chất lượng của hệ thống). Kết quả của
thuật toán sẽ cho một bộ ñiều khiển có thông số tốt nhất.
Trong y học, cấu trúc của các chất hóa học ñược mã hóa thành các
nhiễm sắc thể hoặc ñồ thị. Thuật toán di truyền sẽ lai ghép, lựa chọn ñể tạo
ra các nhiễm sắc thể mới (các chất hóa học mới). Và trong thực tế ñã có rất
nhiều loại thuốc mới ñược tạo ra như vậy.

Trang 107
Chương 1 : Công nghệ tính toán mềm

1.5. Sự kết hợp các thành phần của tính toán mềm
Ba thành phần chính của tính toán mềm có thể sử dụng hoàn toàn ñộc lập
với nhau, tuy nhiên thực tế ñã cho thấy việc kết hợp các thành phần này với
nhau sẽ làm tăng ñáng kể chất lượng của thuật toán.
Có 3 kiểu kết hợp tương ñối phổ biến :

Sự kết hợp các thành phần của tính toán mềm

1.5.1 Kết hợp mạng nơ-ron nhân tạo và logic mờ (neuro-fuzzy)


Những ưu nhược ñiểm của mạng nơron và ñiều khiển mờ:

Tính chất Mạng Nơron Bộ ñiều khiển mờ


Thông qua trọng số ñược ðược thể hiện ngay
Thể hiện tri thức
thể hiện ẩn trong mạng tại luật hợp thành
Từ kinh nghiệm
Nguồn của tri thức Từ các mẫu học
chuyên gia
Xử lý thông tin ðịnh lượng và ñịnh
ðịnh lượng
không chắc chắn tính
Trong nơron và trọng số
Trong luật hợp thành
Lưu giữ tri thức của từng ñường ghép nối
và hàm thuộc
nơron
Khả năng cập nhật
và nâng cao kiến Thông qua quá trình học Không có
thức
Tính nhạy cảm với
những thay ñổi của Thấp Cao
mô hình

Trang 108
Chương 1 : Công nghệ tính toán mềm

Mạng nơ-ron có khuyết ñiểm lớn là tính chất “hộp ñen” của nó. Dữ liệu
ñược ñưa vào mạng, quá trình tính toán xảy ra và cho kết quả ở ngõ ra. Tuy
vậy, ta không biết một cách chính xác chuyện gì ñã xảy ra.

Logic mờ thì ngược lại, các tập luật của chúng rất gần gũi với tri thức con
người. Tuy nhiên, logic mờ lại không có ñược khả năng tự học của mạng
nơ-ron. Các luật mờ và hàm liên thuộc chỉ có thể ñược ñiều chỉnh bằng tay.

Vì thế, sự kết hợp mạng nơron và ñiều khiển mờ ñã vô hình chung xóa bỏ
những khuyết ñiểm của chúng, tạo ra bộ ñiều khiển mờ - nơron có ưu ñiểm
vượt trội.

Mạng nơron Bộ ñiều khiển mờ


Vào • Xử lý tín hiệu nơron vào Ra
• Ước lượng trạng thái • ðiều khiển
• Dự báo trạng thái • Ra quyết ñịnh
• Nhận dạng hệ thống

Kiến trúc kiểu mẫu của một hệ mờ-nơron


Hệ thống nơ-ron mờ sử dụng thuật toán học của mạng nơ-ron nhiều lớp ñể
chỉnh ñịnh thông số và cấu trúc của bộ mờ. ðiều này có nghĩa là bộ mờ có
thể tự xây dựng chính nó (không cần kiến thức chuyên gia về ñối tượng mà
nó mô hình hóa) khi ñược cung cấp những tập mẫu dữ liệu giàu thông tin.
Cấu trúc xây dựng xong có thể dễ dàng “biên dịch” sang ngôn ngữ luật gần
gũi với con người.
ðây là sự kết hợp ñầy hiệu quả trong kỹ thuật tính toán mềm

1.5.2. Kết hợp giải thuật di truyền và logic mờ (genetic fuzzy)

Khi hệ thống quá phức tạp (hoặc giá trị ngõ vào hoặc ngõ ra không ño lường
ñược), ta không thể xây dựng cấu trúc bộ mờ bằng kiến thức chuyên gia
cũng như không thể huấn luyện nó bằng mạng nơ-ron. Nếu như, việc ñánh
giá chất lượng của hệ thống là không quá khó và có thể xem như một hàm
thích nghi thì ta có thể sử dụng giải thuật di truyền ñể chỉnh ñịnh bộ mờ.

Các hệ quy tắc và hàm liên thuộc của bộ mờ ñược mã hóa thành các chuỗi
nhiễm sắc thể. Giải thuật di truyền ñược dùng ñể tạo ra lời giải tối ưu. ðó
chính là các thông số và tập luật làm cho chất lượng của hệ thống tối ưu.

Trang 109
Chương 1 : Công nghệ tính toán mềm

Một trong những ứng dụng thành công là việc phân tích nguyên nhân làm
xuất hiện các vết nứt trong các công trình xây dựng bằng ñá. ðây là một
lĩnh vực ñòi hỏi rất nhiều kiến thức chuyên gia và phụ thuộc vào nhiều ñặc
tính khác nhau. Hệ thống mờ ñược dùng có ngõ vào là 42 ñặc tính ño lường
ñược ñể xác ñịnh lý do chính từ 6 khả năng. Do hệ thống có số lượng thông
số quá lớn và cũng quá phức tạp, việc xây dựng bộ luật và xác ñịnh các hàm
liên thuộc cho hệ thống bằng tay là một ñiều gần không có tính khả thi. Giải
thuật di truyền ñã ñược vận dụng và ñem lại kết quả tương ñối tốt với tỉ lệ
sai số nhỏ hơn 4%.

1.5.3. Kết hợp mạng nơ-ron và giải thuật di truyền

 Kết hợp mạng nơ-ron với giải thuật di truyền

Giải thuật di truyền ñòi hỏi ta phải xác ñịnh các hàm thích nghi. Tuy nhiên,
ñôi khi việc xác ñịnh hàm thích nghi hợp lý là một ñiều không thể. Ví dụ khi
dùng giải thuật di truyền ñể chỉnh ñịnh thông số cho bộ ñiều khiển của một
hệ thống phức tạp. Khi ñó, hàm thích nghi chính là chất lượng ñiều khiển
của toàn hệ thống. Thông số này chỉ có thể ñạt ñược bằng cách thử nghiệm
từng bộ ñiều khiển (từng cá thể) trên hệ thống thực. ðiều này gây tốn kém
về mặt thời gian và kinh tế.

Trong những trường hợp như vậy, mạng nơ-ron có thể ñược dùng ñể xây
dựng hàm thích nghi cho giải thuật di truyền. Thế mạnh của mạng nơ-ron là
khả năng nhận dạng do nó có thể xấp xỉ bất kỳ hàm phi tuyến nào. Sau khi
nhận dạng ñược mô hình hệ thống, mạng nơ-ron có thể thay thế việc thử
nghiệm trên hệ thống thực bằng việc mô phỏng trên máy tính. ðiều này
khiến giải thuật di truyền thực thi nhanh hơn do việc mô phỏng trên máy
tính ñược thực hiện hoàn toàn tự ñộng và cho kết quả nhanh chóng.

Một ứng dụng của kỹ thuật này là trong ngành công nghiệp thép. Việc dự
báo ñặc tính cơ của hợp kim thép khi ñược cung cấp các thông số về thành
phần kim loại và nhiệt ñộ tôi là một việc không dễ dàng. Các nhà nghiên
cứu tại ñại học Sheffield ñã huấn luyện một mạng nơ-ron dựa trên những
thông tin này và ñặc tính cơ ño ñạt ñược ñể xây dựng mô hình dự báo ñặc
tính hợp kim. Mạng nơ-ron này sau ñó ñược dùng như một hàm thích nghi
trong giải thuật di truyền ñể phát triển các thiết kế hợp kim mới với những
ñặc tính mong muốn.

Trang 110
Chương 1 : Công nghệ tính toán mềm

 Kết hợp giải thuật di truyền với mạng nơ-ron

Ví dụ: Ta sẽ xem xét việc ứng dụng GA ñể huấn luyện mạng nơron truyền
thẳng ña lớp nhằm giải quyết bài toán XOR quen thuộc.

Ở ñây, ta sử dụng hàm kích hoạt trong mạng là hàm sigmoid vô cực.
Chuỗi nhiễm sắc thể (NST) ñược mã hóa dưới dạng (w1, w2 , …, w9 ). Trong
ñó, mỗi phần tử là một trọng số có giá trị thực. Phần tử nhỏ nhất mà quá
trình lai ghép và ñột biến ñiều khiển chính là các trọng số.
Giả sử, toán tử lai ghép ñược dùng là lai ghép ñều. Ta thực hiện quá trình
theo các bước sau:
 Trước tiên, ta chọn ngẫu nhiên nc vị trí của phần tử trong NST.
 Sau ñó thực hiện việc trao ñổi lẫn nhau giữa các phần tử tại những vị
trí ñã chọn ở trên.
Thông thường số lượng các phần tử ñược trao ñổi nc ñược chọn bằng một
phần hai tổng số các phần tử trong NST.

Toán tử ñột biến xảy ra với xác suất bằng 1.0 trên các cá thể chọn lựa khi
các cá thể ñó không tham gia vào hoạt ñộng lai ghép. Như vậy, nếu xác suất
lai ghép của một cặp cá thể là pc thì xác suất ñột biến sẽ là (1 - pc ).
Toán tử ñột biến sẽ làm tăng các phần tử thêm một giá trị bằng ∆ w, giá trị
này sẽ ñược chọn ngẫu nhiên trong khoảng xác ñịnh cho trước.

Trang 111
Chương 1 : Công nghệ tính toán mềm

Có hai kiểu chọn lọc có thể ñược sử dụng:

 Chọn ra các cặp ñể ứng dụng những toán tử di truyền (giống như
giải thuật chuẩn hóa.
 Chọn ra những cá thể tồn tại cho lần tạo sinh kế tiếp. Sau khi các
toán tử di truyền tạo ra những cá thể mới, những cá thể tồn tại sẽ
ñược chọn từ những cá thể mới ñược tạo ra và những cá thể hiện tại.
Giá trị thích nghi sẽ ñược tính toán và gán ñến tất cả các cá thể. Sau
ñó, các cá thể dùng cho lần tạo sinh kế sẽ ñược chọn với xác suất
tương ứng với giá trị thích nghi của chúng. Kích cỡ quần thể của
những lần tạo sinh sau ñó cũng ñược giữ cố ñịnh (bằng một phần hai
quần thể thử nghiệm).

Các kỹ thuật ñiều chỉnh và phân chia cũng ñược dùng:


f ’ = af + b
Trong ñó:
f là giá trị thích nghi gốc; f ’ là giá trị thích nghi ñã ñiều chỉnh
Hệ số a và b ñược chọn sao cho:
'
favg = favg
'
và fmax = Cmult favg
Ở ñây, Cmult là số lượng con cháu dự tính tạo ra từ cá thể thích nghi nhất (giả
sử ta chọn bằng 2).

Bây giờ, ta sẽ ứng dụng GA ñược mô tả như trên vào mạng nơron (như
hình) ñể giải quyết bài toán XOR.
Giả sử rằng:

 x1, x2 và y chỉ nhận hai giá trị là 0.1 hoặc 0.9 tương ứng với TRUE
hoặc FALSE. Kích cỡ quần thể là 20.
 Giá trị khởi tạo ban ñầu là các số nguyên trong khoảng [ -10, 10 ].
 Xác suất lai ghép pc = 0.7 và số vị trí lai ghép nc = 4.
 Giá trị ñột biến ∆ w là một số nguyên ngẫu nhiên trong miền [-3, 3].

Toán tử ñột biến ñược ñiều chỉnh sao cho từng trong số không vượt quá
miền giới hạn [-10, 10] và bảo quản ñược kích cỡ của không gian tìm kiếm.
Giá trị thích nghi ñược tính dựa vào hàm lỗi, chính là trị tuyệt ñối của tổng
các sai lệch ngõ ra trên 4 mẫu XOR.
Sau 30 lần tạo sinh, ta sẽ có một mạng nơrơn hợp lý với giá trị hàm lỗi nhỏ
hơn 0.05 (giá trị thích nghi lớn hơn 20).

Trang 112
Chương 1 : Công nghệ tính toán mềm

1.6. Hệ thống ñiều khiển tích hợp

Ngành ñiều khiển học ñã ra ñời và phát triển từ rất sớm, ñặc biệt là trong 2
thập niên gần ñây việc ứng dụng Lý thuyết mờ và Mạng nơron ñã tạo ra
nhiều phương pháp ñiều khiển mới với ñặc tính “linh hoạt” và “thông
minh” hơn. Công nghệ mờ và công nghệ mạng nơron là hai trụ cột chính ñể
tạo nên công nghệ tích hợp mới, công nghệ tính toán mềm (Soft computing).

1.6.1. Khái niệm


Một số phương pháp ñược sử dụng trong ngành ñiều khiển học:
ðK Kinh ñiển & Hiện ñại ðK Thông minh
PID GA
Tối ưu Nơron
Thích nghi Mờ
Bền vững …
Mỗi phương pháp ñều có những ñiểm mạnh và hạn chế nhất ñịnh, vì vậy
người ta thường có xu hướng kết hợp chúng lại với nhau ñể tạo ra một mô
hình ñiều khiển có khả năng ñáp ứng cao với các ñòi hỏi thực tế. Việc kết
hợp này ñã cho ra một phương pháp ñiều khiển mới ñó là ñiều khiển tích
hợp.
ðiều khiển tích hợp : ðiều khiển kết hợp phương pháp kinh ñiển hoặc hiện
ñại với phương pháp ñiều khiển thông minh.

1.6.2. Một số hệ thống tích hợp


• ðiều khiển sử dụng PID mờ
• ðiều khiển mờ - thích nghi, mờ - tối ưu.
• Sử dụng hệ mờ - nơron ñể nhận dạng & tối ưu hệ thống.
• Ứng dụng thuật toán GA trong thiết kế hệ thống ñiều khiển.
………………..
Ở phần 1.2.3 ta ñã trình bày về cách thiết kế bộ PID mờ, phần 1.2.5 ñã nói
về việc tích hợp công nghệ mờ trong ñiều khiển. Ở phần sau chúng ta sẽ
thiết kế hệ thống ñiều khiển neuron mờ hệ con lắc ngược dựa trên phương
pháp tiếp cận sai số phân cấp mờ.

Trang 113
Chương 1 : Công nghệ tính toán mềm

Thiết kế hệ thống ñiều khiển neuron mờ hệ con lắc ngược dựa trên
phương pháp tiếp cận sai số phân cấp mờ.

Chúng ta xét mô hình con lắc ngược như ở ví dụ 1.8:


Với giả thiết:
 Khối lượng xe mc = 1 kg
 Khối lượng vật m = 0.1 kg
 Chiều dài của vật 2l = 1 m
Phương trình ñộng của hệ con lắc ngược ñược cho như (1.36) và (1.37):
. 
 x1  = 0 1  x1  + 0 ( f ( x , x ) + g ( x , x ).u + d )
 .  0 0  x 2  1  1 2 1 2

 x 2 
x 
y = [1 0] 1 
 x2 
Trong ñó:
 u là lực tác dụng (tín hiệu ñiều khiển)
 d là nhiễu ngoài tiền ñịnh (giả sử là tín hiệu sóng vuông với biên ñộ
+/- 0.1 và chu kì 2π.
 Ngõ ra của hệ là y và tín hiệu ngõ ra mong muốn là ym =(π/30).sin(t)
Nhiệm vụ ñiều khiển của ta là ñiều khiển trạng thái y = x của hệ thống bám
theo quỹ ñạo của tín hiệu mong muốn ym.
1. Bài toán ñiều khiển thích nghi:
Xem xét hệ phi tuyến một ngõ vào - một ngõ ra (SISO) bậc n có dạng sau:
.
x = Ax + B( f (x) + g (x)u + d ) (1)
y = CT x
Trong ñó: A là ma trận dạng thường, B T = [0 0 .. 0 1], C T = [1 0 ... 0 0]
f(.) và g(.) là hàm phi tuyến chưa biết của hệ thống.
u∈R vaø y∈R là hàm ngõ vào và ngõ ra của hệ tương ứng
Cho x = ( x, x ,..., x (n−1) )T = ( x1 , x2 ,..., xn )T ∈ R n là vectơ trạng thái của hệ và
(1)

giả thiết là không ño ñược hoàn toàn, và cho d là nhiễu giới hạn bên ngoài.
ðể hệ (1) là ñiều khiển ñược, chúng ta yêu cầu g (x) ≠ 0 và không mất tính
tổng quát, giả thiết rằng | g (x) |> 0 .
Xét một ngõ ra hệ thống y là ño ñược và tín hiệu mong muốn cho trước ym.
Giả thiết y m , y m(1) ,..., y m( n −1) là ràng buộc và ño ñược tương ứng. Mục tiêu
ñiều khiển là tìm kiếm luật ñiều khiển u(t) ñể ngõ ra thực y(t) tiệm cận ñến

Trang 114
Chương 1 : Công nghệ tính toán mềm

ngõ ra mong muốn ym(t). Vectơ sai số bám theo e và vectơ sai số ước lượng
ñược ñịnh nghĩa như sau:
e = y m − x,
(2)
eˆ = y m − xˆ
Trong ñoù y m = y m , y m(1) ,..., y m( n−1) , e = (e, e (1) ,..., e ( n−1) ) ,
x̂ vaø ê ký hiệu ước lượng của x và e tương ứng.
n
Với ∀x∈R , | g (x) |> 0 , nhiệm vụ của ñiều khiển là sử dụng ngõ vào và ngõ
ra của hệ thống ñể thiết kế luật cập nhật của bộ ñiều khiển neuron mờ u =
u (y | θ f , θ g ) và vectơ thông số θ f vaø θ g . ðiều này phải thỏa mãn rằng tất
cả các biến có trong hệ thống ñiều khiển vòng kín là bị chặn và sai số bám
theo phải càng nhỏ càng tốt thỏa chỉ tiêu ràng buộc.Theo tiêu chuẩn ổn ñịnh
Lyapunov và dựa trên tiếp cận tương ñương chắc chắn, ta có luật ñiều khiển
là:
1
u= [− fˆ (xˆ ) + y m(n) + KTc eˆ − uC ] (3)
ˆ
gˆ (x)
Trong ñó: hàm fˆ (xˆ ) và gˆ (xˆ ) là ước lượng của hàm phi tuyến f(x) và g(x),
K T = (k n , k n −1 ,..., k1 ) là vectơ ñộ lợi hồi tiếp và uc là tín hiệu ñiều khiển bù
nhiễu bên ngoài và sai số ước lượng. Ta chọn KT ñể ña thức ñặc tính
(A - BKT) là Hurwitz, nghĩa là cực ñặc tính nằm bên trái mặt phẳng phức.
ðể ñạt ñược luật thích nghi cần xác ñịnh nguyên tắc chỉnh θ f , vaø θ g , ta xét
hàm Lyapunov :
1 T 1 %T % 1 %T %
V= e% Pe% + .θ f θ f + .θ g θ g
2 2γ 1 2γ 2
Trong ñó: θ%f = θ f − θ *f ,θ%g = θ g − θ g* , γ1 và γ2 là các giá trị vô hướng dương
và P = PT ≥ 0 là ma trận xác ñịnh dương thỏa phương trình Lyapunov ðạo
hàm theo thời gian của V, ta ñược:
1 1 1 & 1 &
V& = e%& TPe% + e% T Pe%& + θ%fTθ%f + θ%gTθ%g
2 2 γ1 γ2
Theo tiêu chuẩn ổn ñịnh Lyapunov, V& ≤ 0 , ta có luật thích nghi θ& ,θ& . f g

θ&f = −γ 1e Pbξ ( x )θ
T

θ&g = −γ 2 e T Pbη ( x)u I


Chúng ta sẽ nghiên cứu vấn ñề này rõ hơn trong phần ðiều khiển mờ thích
nghi ở chương 3 .

Trang 115
Chương 1 : Công nghệ tính toán mềm

2. Cơ sở lý thuyết mạng Neuron mờ:


Cấu hình xấp xỉ hàm neuron mờ ñược ñề nghị như hình 1.26. Mạng gồm có
hai phần: mạng tiền ñề và mạng kết quả. Mạng tiền ñề là mạng neuron
truyền thẳng 4 lớp ñể ñáp ứng yêu cầu của luật mờ và tạo ra ñộ mạnh cháy
chuẩn hóa như là ngõ ra ñể thể hiện cấp ñộ quan trọng của luật mờ. Mạng
neuron kết quả thực hiện việc học và giải mờ ở ngõ ra.
A. Mạng tiền ñề:
Mỗi nút lớp 2 (lớp mờ hóa) thực hiện tính tóan của hàm thành viên:
  x − xl 
2
   x − x l 2 
 
( x i ) = exp  −   µ G ( xi ) = exp  −  i l  
i fi
µF 
gi
i
l

  σ fil  l
  σ gi  

i

    
Trong lớp 3(lớp luật) ñộ mạnh cháy của luật ñược cho bởi:
n n
ψ Fl ( xi ) = ∏ µ F ( xi )
i i
l ψ Gl ( xi ) = ∏ µ G ( xi )
i
l
i
i =1 i =1
Lớp 4, lớp ngõ ra của mạng tiền ñề thực hiện tính toán chuẩn hóa của ñộ
mạnh cháy bởi:
n
n

l
∏µ
i =1
Fil
( xi )
ψ Fl ( xi ) ∏µ Gil
( xi )
ψ Gl ( xi )
ξ (x) =
f M n
= M
i
ξ gl (x) = M
i =1
n
= M
i

∑ (∏ µF l ( xi ))
l =1 i =1
i
∑ψ Fl ( xi )
l =1
i ∑ (∏ µG l ( xi )) i
∑ψ Gl ( xi ) i
l =1 i =1 l =1

B. Mạng kết quả:


Lớp vào của mạng kết quả lấy hệ số trọng lượng w lf ñể nối với lớp ẩn. Ngõ
−l
ra mạng y ñược tính như là tổng trọng số trung bình của y f thông qua hiệu
chỉnh hệ số trọng lượng bởi giải thuật tiếp cận sai số phân cấp mờ (fuzzy
hierarchy error approach algorithm - FHEA). ðộ mạnh cháy của luật thứ l
ψ Fl (x) ñược chuyển như là biến ngõ ra hFl i của lớp 1 của mạng kết quả bởi
phép tính ñơn giản. Lớp 2 thực hiện tính toán giá trị trọng số luật w lf , y lf
trong ñó kết quả của luật mờ thứ l ñược ñịnh nghĩa là hàm tuyến tính của
biến lớp vào hFl i của mạng kết quả, nghĩa là:
Luaät l: If x1 is A1l and x2 is A2l and .. and xn is Anl Then y lf = w lf . hFl i
Ta chỉ cần tính giá trị trọng số w lf của ñộ mạnh cháy thứ l cho mỗi luật
ñược tác ñộng bởi giải thuật FHEA. Lớp 3 là lớp ngõ ra của mạng kết quả
cũng là ngõ ra của toàn thể mạng. Ngõ ra của mạng ñược cho bởi:
M M
y = ∑ ξ f y lf = ∑ ξ f ( w lf hFl i )
l =1 l =1

Trang 116
Chương 1 : Công nghệ tính toán mềm

Hình 1.26 Caáu truùc cuûa maïng neuron môø döïa treân giaûi thuaät FHEA

Trang 117
Chương 1 : Công nghệ tính toán mềm

Giải thuật cập nhật trọng số wj ñược ñề xuất:


Vì mạng neuron mờ ñược cho ở hình 1.26 chủ yếu là mạng truyền thẳng
nhiều lớp, nên có thể thiết kế giải thuật FHEA với giải thuật suy giảm ñộ
dốc ñể học thông số dùng tiếp cận lan truyền sai số.
Giả sử hàm tổn thất sai số E ñược cho bởi:
1
E = ( y m − y) 2
2
Ta dùng giải thuật lan truyền ngược sai số và giải thuật tối ưu ñộ dốc bậc 1
ñể chỉnh thông số wj.
ðầu tiên, thực hiện các bước ñể xác ñịnh sai số học:
∂E ∂E
δ ( 3) = − ( 3)
=− = ym − y
∂net ∂y
∂E
Tính :
∂w j
∂E ∂E ∂net ( 2 )
= ( 2)
. = −δ ( 2) h j
∂w j ∂net ∂w j
Trong ñó:
(2)
∂E ∂E ∂net(3) ∂f (netj ) (3)
δj(2) = − (2) = − (3) . . =δ ξ j
∂netj ∂net ∂f (net(j2) ) ∂net(j2)
∂E
Suy ra: = ( y − y m ).ξ j .h j
∂w j
Giải thuật học ñể chỉnh trọng số là:
∂E
w j (k + 1) = w j (k ) − η , j = 1,2,..., M
∂w j
Trong ñó: tốc ñộ học η là hằng số dương ( 0 < η < 1 ).
Giải thuật:
Bước 1: Khởi ñộng thông số con lắc.
Xây dựng tập mẫu từ sơ ñồ ñiềư khiển thích nghi.
Bước 2: Trọng số ñược cập nhật trong quá trình huấn luyện mạng
với tập mẫu nhận ñược từ bước 1.
Bước 3: Xây dựng hàm S-function ñể mô tả ñặc tính phi tuyến, bất
ổn ñịnh của ñối tượng.
Bước 4: Kết nối sơ ñồ Simulink ñiều khiển neuron mờ với S-
function với các thông số ñối tượng thay ñổi (m và l ), có
nhiễu tiền ñịnh và nhiễu ngẫu nhiên.
Bước 5: So sánh kết quả nhận ñược với các kết quả ñã công bố.

Trang 118
Chương 1 : Công nghệ tính toán mềm

4. Kết quả mô phỏng:

Giả sử với ñiều kiện ban ñầu là x(0)=(-0.15, 0)T.


Ñieàu khieån neuron môø thích nghi heä con laéc ngöôïc

Hình 1.27 Hình 1.28


Quĩ ñạo trạng thái x1(t) Quỹ ñạo tín hiệu ñiều khiển u(t)

Hình 1.29 Hình 1.30


Sai số ngõ ra bám Eout cho Quỹ ñạo trạng thái x1(t) khi dùng
ñiều khiển bám theo giải thuật Singleton

Nhận xét:
Quĩ ñạo trạng thái x1(t) bám theo ym khá tốt, tuy nhiên luật ñiều khiển u(t)
có tần số dao ñộng cao.Sai số ngõ ra Eout tiến ñến 0 sau 20 giây.

Trang 119
Chương 1 : Công nghệ tính toán mềm

So sánh với mạng neuron mờ singleton:


Trong phần này hàm S-function thực hiện mô phỏng mạng neuron mờ
singleton thay cho giải thuật FHEA.
Kết quả mô phỏng thu ñược ở hình 1.30, ta thấy x1 bám theo ym cũng khá tốt
khi dùng mạng neuron mờ singleton thay cho giải thuật FHEA. Tuy nhiên
so sánh 2 kết quả thu ñược từ hình 1.27 và hình 1.30 ta thấy dùng giải thuật
FEHA tốt hơn dùng mạng neuron mờ Singleton.

5. Kết luận:
Tóm tắt kết quả ñieàu khieån neuron môø vôùi giaûi thuaät FHEA cho heä con laéc
ngöôïc ñöôïc ñeà nghò.
1. Trong sô ñoà ñieàu khieån neuron môø heä con laéc ngöôïc , haøm phi
tuyeán f vaø g ñöôïc xaáp xæ baèng maïng neuron môø döïa treân tieáp caän sai soá ngoõ
ra môø phaân caáp . Maïng neuron môø FHEA ñöôïc hoïc vaø huaán luyeän tröôùc
döïa vaøo taäp maãu vaøo ra trong caùch thöùc khoâng tröïc tuyeán.
2. Giaù trò troïng soá laø phi tuyeán vì heä con laéc ngöôïc laø phi tuyeán , f
vaø g phi tuyeán theo.
3. Keát quaû moâ phoûng ñaõ chöùng minh raèng giaûi thuaät FHEA coù theå
caûi thieän tính hieäu quaû cuûa xaáp xæ baùm theo cho heä phi tuyeán chöa bieát. Vôùi
nhieãu tieàn ñònh, ngoõ ra coøn baùm theo tín hieäu mong muoán. Neáu ñöa vaøo
nhieãu ngaãu nhieân thì ñieàu khieån baùm theo maát oån ñònh.
4. Boä ñieàu khieån neuron môø cho keát quaû moâ phoûng toát trong giôùi
haïn troïng löôïng con laéc m vaø chieàu daøi con laéc L=2l: m thay ñoåi töø 0.1kg
ñeán 0.3kg, vaø L thay ñoåi töøø 1m ñeán 5m.
5. Keát quaû duøng giaûi thuaät FHEA cho keát quaû moâ phoûng toát hôn vaø
nhanh hôn duøng maïng neuron môø singleton.

Trang 120
Chương 1 : Công nghệ tính toán mềm

CÂU HỎI ÔN TẬP VÀ BÀI TẬP

1. Nêu rõ mô hình ñiều khiển mờ theo Mamdani và theo Tagaki/Sugeno. So


sánh ưu nhược ñiểm hai mô hình ñó.
2. Các bước thiết kế một bộ ñiều khiển mờ. Vì sao nói ñiều khiển mờ là ñiều
khiển dựa trên kinh nghiệm ?
3. Nguyên lý chỉnh ñịnh thông số của bộ PID mờ. Ứng dụng trong ñiều
khiển nhiệt ñộ.
4. Thế nào là mạng nơron nhân tạo ? Nêu nội dung của thuật toán lan truyền
ngược.
5. Vì sao phải kết hợp mạng nơron và hệ mờ ? Nêu sơ ñồ kiểu mẫu của một
hệ mờ - nơron. Ứng dụng mạng RBF trong nhận dạng hệ thống phi tuyến.
6. ðể ñiều khiển tự ñộng máy ñiều hoà nhiệt ñộ bằng kỹ thuật logic mờ,
người ta dùng hai cảm biến: Trong phòng là cảm biến nhiệt Ti , bên ngoài là
cảm biến nhiệt To. Việc ñiều hoà nhiệt ñộ thông qua ñiều khiển tốc ñộ quạt
làm lạnh máy ñiều hoà. Biết rằng:
- Tầm nhiệt ñộ quan tâm là [0oC - 50oC ]
- Tốc ñộ quạt là v ∈ [0 – 600 vòng/ phút ]
Hãy tính tốc ñộ quạt trong các trường hợp sau:
1. Ti = 210C T0 = 280C
2. Ti = 300C T0 = 350C
3. Ti = 260C T0 = 330C

Nhận xét kết quả của các trường hợp trên.

7. Thiết kế bộ mờ ñiều khiển nhiệt ñộ. Bộ mờ có 2 ngõ vào là sai lệch e(t)
[ET] và ñạo hàm sai lệch de(t) [DET], một ngõ ra là ñạo hàm công suất
[DP]. Biết rằng:
_ Lò nhiệt có công suất là 5KW, tầm ño max là 200 0C, sai số là ± 5%.
_ Tầm thay ñổi của DET là -10 0 C / s → 10 0 C / s
_ Tầm thay ñổi của DP là -100W/s → 100W/s
Hãy tính côg suất cung cấp cho lò trong các trường hợp sau:
1. ET= 80C DET= 9 0 C / s
2. ET= 20C DET= 9 0 C / s
3. ET= 70C DET= -7 0 C / s

Trang 121
Chương 1 : Công nghệ tính toán mềm

8. Cho một ñối tượng lò nhiệt có hàm truyền :


4.228
G(S ) = 2
( S + 0.5)( S + 1.64 S + 8.456)
a. Tính thông số bộ PID theo Zeigler-Nichols, tính POT, ts .
b. Thiết kế bộ PID mờ thoả mãn các ñiều kiện sau: POT < 10% và ts < 5
Biết rằng:
- Nhiệt ñộ ñặt Ts = 2000C
- Sai số emax = ± 5%
- DET ∈ [ -10 +10 ] ( 0C/s )
- Công suất của lò nhiệt P = 5KW
Tìm KP, KI, KD và tính công suất trong các trường hợp sau:
1. ET = 80C DET = 90C/s
2. ET = 20C DET = 20C/s
3. ET = 80C DET = - 90C/s
Nhận xét kết quả ñạt ñược.
9. Xét hệ thống phi tuyến bậc hai như sau:
&x& + α (t ) x& 2 cos 3x = u
trong ñó α(t) chưa biết và 1 ≤ α(t) ≤ 2.
Thiết kế BðK trượt u ñể x bám theo quỹ ñạo mong muốn xd.
10. Cho hệ thống :
x&1 = sin x 2 + x 2 t + 1
x& 2 = α 1 (t ) x14 cos x 2 + α 2 (t )u
Trong ñó α1(t) và α2(t) là hai hàm chưa biết và : | α1(t)| ≤ 10, 1 ≤ α2(t) ≤ 2.
Thiết kế BðK mờ trượt với trạng thái vòng kín x1(t) ñược cho bởi trạng thái
mong muốn xd(t).
11. Cho bài toán phân loại với các cặp vào/ra như sau:

Trang 122
Chương 1 : Công nghệ tính toán mềm

1. Vẽ sơ ñồ mạng perceptron cho bài toán.Có bao nhiêu ngõ vào yêu cầu
2. Biểu diễn các cặp ngõ vào/ra trên ñồ thị. Bài này có thể giải bằng sơ
ñồ mạng vừa thiết kế ở trên không ? Tại sao?

12. Cho bài toán phân loại với các cặp vào/ra như sau:

1. Thiết kế mạng single-neutron perceptron (SNP) ñể giải bài toán này.


Vẽ ñồ thị các vectơ vào/ra, từ ñó chọn vectơ trọng số W.
2. Kiểm tra lại mạng vừa thiết kế với 4 vectơ ngõ vào trên.
3. Dùng mạng trên ñể phân loại 4 vectơ sau:

4. Trong 4 vectơ trên, vectơ nào cho kết quả phân loại giống nhau
(không phụ thuộc vào W và b). Tại sao?

13. Giải lại bài toán 12 bằng bất phương trình


14. Giải lại bài toán 12 bằng cách sử dụng luật perceptron với giá trị ñầu là:
W(0) = [0 0] và b(0) = 0
15.Chứng minh bằng toán học rằng không thể giải bài toán sau bằng mạng
single-neutron perceptron hai ngõ vào:

(Gợi ý: dùng bất ñẳng thức).


16. Sử dụng hàm hardlim() bằng hàm hardlims(), tức là giá trị ngõ ra sẽ là
[-1 1] thay vì [0 1].
a=hardlim(n)

1. Viết biểu thức chuyển ñổi từ hàm hardlim() sang hàm hardlims()
2. Hai mạng neutron có cấu trúc W và b như nhau: mạng thứ nhất sử
dụng hàm nấc thường hardlim(), mạng thứ hai sử dụng hàm nấc ñối xứng
hardlims(). Với cùng giá trị ñầu vào p và cùng sử dụng luật học perceptron
thì vectơ W có giá trị như nhau cho cả hai mạng không?
3. Nếu sự biến ñổi của W là khác nhau thì chúng khác nhau như thế nào.
Tại sao?

Trang 123
Chương 1 : Công nghệ tính toán mềm

4. Giữ nguyên giá trị ban ñầu W và b (giá trị ñầu của mạng perceptron
sử dụng hàm hardlim()). Hãy tạo một thuật toán cho mạng perceptron sử
dụng hàm hardlims() ñể hai mạng trên luôn ñáp ứng như nhau khi huấn
luyện trên cùng một dữ liệu.

17. Khi ño trọng lượng và chiều dài của tai thỏ và gấu ta thu ñược các vectơ:

Trong ñó:
Phần tử thứ nhất của vectơ ngõ vào là trọng lượng
Phần tử thứ hai của vectơ ngõ vào là chiều dài của tai
Chuẩn ngõ ra 0 ứng với thỏ
Chuẩn ngõ ra 1 ứng với gấu
1. Dùng Matlab ñể ñặt giá trị ñầu và huấn luyện mạng giải bài toán.
2. Dùng Matlab ñể kiểm tra giá trị W và b ñạt ñược dựa vào các vectơ
ngõ vào.
3. Thay ñổi giá trị các ngõ vào sao cho bài toán có lời giải (tức là tồn tại
ñường phân chia tuyến tính). Sau ñó huấn luyện lại mạng này.

18. Sau ñây là một dạng khác của luật học perceptron:

Trong ñó: α ñược gọi là tốc ñộ học


Chứng minh giải thuật này hội tụ. Kết quả có ñòi hỏi gì về giới hạn của α
không? Giải thích.

19. Dùng Simulink ñể mô phỏng các hệ thống “Quả bóng và ñòn bẩy”,
“Con lắc ngược”, hệ thống ñiều khiển nhiệt ñộ dùng PID mờ.
20. Tham khảo các ví dụ trong phần Help/Fuzzy Control Toolbox của
Matlab.
21.Xây dựng M-file, s-funtion trong Simulink cho hệ thống.

Trang 124
Chương 2: ðiều khiển tối ưu

Chương 2

ðIỀU KHIỂN TỐI ƯU


2.1 CHẤT LƯỢNG TỐI ƯU
2.1.1 ðặc ñiểm của bài toán tối ưu
1. Khái niệm
Một hệ ñiều khiển ñược thiết kế ở chế ñộ làm việc tốt nhất là hệ luôn ở trạng
thái tối ưu theo một tiêu chuẩn chất lượng nào ñó ( ñạt ñược giá trị cực trị ) .
Trạng thái tối ưu có ñạt ñược hay không tùy thuộc vào yêu cầu chất lượng
ñặt ra , vào sự hiểu biết về ñối tượng và các tác ñộng lên ñối tượng , vào
ñiều kiện làm việc của hệ ñiều khiển …
Một số ký hiệu sử dụng trong chương 2.

Hình 2.1: Sơ ñồ hệ thống ñiều khiển .

Hệ thống ñiều khiển như hình trên bao gồm các phần tử chủ yếu : ñối tượng
ñiều khiển ( ðTðK ) , cơ cấu ñiều khiển ( CCðK ) và vòng hồi tiếp ( K ) .
Với các ký hiệu :
r : tín hiệu ñầu vào, mục tiêu ñiều khiển, ñáp ứng mong muốn của hệ thống.
u : tín hiệu ñiều khiển, luật ñiều khiển.
x : tín hiệu ñầu ra, ñáp ứng ra của hệ thống.
ε = r – x : sai lệch của hệ thống.
f : tín hiệu nhiễu
Chỉ tiêu chất lượng J của một hệ thống có thể ñược ñánh giá theo sai lệch
của ñại lượng ñược ñiều khiển x so với trị ñáp ứng mong muốn r , lượng quá
ñiều khiển ( trị số cực ñại xmax so với trị số xác lập x ( ∞ ) tính theo phần
trăm ) , thời gian quá ñộ … hay theo một chỉ tiêu hỗn hợp trong ñiều kiện
làm việc nhất ñịnh như hạn chế về công suất , tốc ñộ , gia tốc … Do ñó việc
chọn một luật ñiều khiển và cơ cấu ñiều khiển ñể ñạt ñược chế ñộ làm việc
tối ưu J ñạt cực trị còn tùy thuộc vào lượng thông tin ban ñầu mà ta có ñược.
Ở ñây chúng ta có thể thấy ñược sự khác biệt về kết quả nhận ñược chất
lượng tối ưu khi lượng thông tin ban ñầu thay ñổi ( Hình 2.2 ) .

Trang 125
Chương 2: ðiều khiển tối ưu

Hình 2.2 : Tối ưu cục bộ và tối ưu toàn cục .

Khi tín hiệu ñiều khiển u giới hạn trong miền [u1,u2] , ta có ñược giá trị tối
ưu cực ñại J1∗ của chỉ tiêu chất lượng J ứng với tín hiệu ñiều khiển u1∗ .
Khi tín hiệu ñiều khiển u không bị ràng buộc bởi ñiều kiện u1 ≤ u ≤ u2 , ta
có ñược giá trị tối ưu J 2∗ > J1∗ ứng với u2∗ . Như vậy giá trị tối ưu thực sự
bây giờ là J 2∗ .
Tổng quát hơn , khi ta xét bài toán trong một miền [um , un ] nào ñó và tìm
ñược giá trị tối ưu J i∗ thì ñó là giá trị tối ưu cục bộ . Nhưng khi bài toán
không có ñiều kiện ràng buộc ñối với u thì giá trị tối ưu là
J ∗ = extremum( J i∗ ) với J i∗ là các giá trị tối ưu cục bộ , giá trị J ∗ chính là
giá trị tối ưu toàn cục .

ðiều kiện tồn tại cực trị :


• ðạo hàm bậc một của J theo u phải bằng 0 :
∂J
=0
∂u
• Xét giá trị ñạo hàm bậc hai của J theo u tại ñiểm cực trị :
∂2J
> 0 : ñiểm cực trị là cực tiểu
∂u 2
∂2J
< 0 : ñiểm cực trị là cực ñại
∂u 2
2. ðiều kiện thành lập bài toán tối ưu

Trang 126
Chương 2: ðiều khiển tối ưu

ðể thành lập bài toán tối ưu thì yêu cầu ñầu tiên là hệ thống phải có ñặc tính
phi tuyến có cực trị .
Bước quan trọng trong việc thành lập một hệ tối ưu là xác ñịnh chỉ tiêu chất
lượng J . Nhiệm vụ cơ bản ở ñây là bảo ñảm cực trị của chỉ tiêu chất lượng
J . Ví dụ như khi xây dựng hệ tối ưu tác ñộng nhanh thì yêu cầu ñối với hệ
là nhanh chóng chuyển từ trạng thái này sang trạng thái khác với thời gian
quá ñộ nhỏ nhất , nghĩa là cực tiểu hóa thời gian quá ñộ . Hay khi tính toán
ñộng cơ tên lửa thì chỉ tiêu chất lượng là vượt ñược khoảng cách lớn nhất
với lượng nhiên liệu ñã cho .
Chỉ tiêu chất lượng J phụ thuộc vào tín hiệu ra x(t) , tín hiệu ñiều khiển u(t)
và thời gian t . Bài toán ñiều khiển tối ưu là xác ñịnh tín hiệu ñiều khiển u(t)
làm cho chỉ tiêu chất lượng J ñạt cực trị với những ñiều kiện hạn chế nhất
ñịnh của u và x .
Chỉ tiêu chất lượng J thường có dạng sau :
T
J = ∫ L[ x(t ), u (t ), t ]dt
0
Trong ñó L là một phiếm hàm ñối với tín hiệu x , tín hiệu ñiều khiển u và
thời gian t .
Lấy ví dụ về bài toán ñiều khiển ñộng cơ ñiện một chiều kích từ ñộc lập
Φ kt = const với tín hiệu ñiều khiển u là dòng ñiện phần ứng iu và tín hiệu ra
x là góc quay ϕ của trục ñộng cơ .

Hình 2.3 : ðộng cơ ñiện một chiều kích từ ñộc lập .

Ta có phương trình cân bằng moment của ñộng cơ :



k M iu − M c = M q (1)
dt

ω= (2)
dt

Trang 127
Chương 2: ðiều khiển tối ưu

trong ñó k M = CM Φ = const ; Mq là moment quán tính ; ω là tốc ñộ góc ;ϕ là


góc quay . Giả sử bỏ qua phụ tải trên trục ñộng cơ ( M c = 0 ) thì :
d 2ϕ
kM iu = M q (3)
dt 2
Nếu xét theo thời gian tương ñối bằng cách ñặt :
τ = t kM / M q
thì (3) có dạng :
d 2ϕ
= iu (4)
dτ 2
Từ ñó ta có :
d 2x
=u (5)
dτ 2
Vậy phương trình trạng thái của ñộng cơ ñiện là một phương trình vi phân
cấp hai với tín hiệu ñiều khiển u là dòng ñiện phần ứng iư, tín hiệu ra là góc
quay ϕ .
• Bài toán tối ưu tác ñộng nhanh ( thời gian tối thiểu ) :
Tìm luật ñiều khiển u(t) với ñiều kiện hạn chế u ≤ 1 ñể ñộng cơ quay từ vị
trí ban ñầu có góc quay và tốc ñộ ñều bằng 0 ñến vị trí cuối cùng có góc
quay bằng ϕ0 và tốc ñộ bằng 0 với một khoảng thời gian ngắn nhất .
Vì cần thời gian ngắn nhất nên chỉ tiêu chất lượng J sẽ là :
T
J = ∫ L[ x(t ), u (t ), t ]dt = T
0

Rõ ràng từ phương trình trên ta phải có L[ x(t ), u (t ), t ] = 1 .


Như vậy , ñối với bài toán tối ưu tác ñộng nhanh thì chỉ tiêu chất lượng J có
dạng :
T
J = ∫ 1dt = T
0

• Bài toán năng suất tối ưu :


Năng suất ở ñây ñược xác ñịnh bởi góc quay lớn nhất của ñộng cơ trong thời
gian T nhất ñịnh . Khi ñó chỉ tiêu chất lượng J có dạng :
T T
J = ∫ L[ x(t ), u (t ), t ]dt = ϕT − ϕ0 = ∫ ϕ& (t )dt
0 0

Do ñó L[ x(t ), u (t ), t ] = ϕ& (t ) = x& (t ) và ta sẽ có chỉ tiêu chất lượng J ñối với


bài toán năng suất tối ưu như sau : T
J = ∫ x& ( t )dt
0

Trang 128
Chương 2: ðiều khiển tối ưu

• Bài toán năng lượng tối thiểu :


Tổn hao năng lượng trong hệ thống :
T
Q = ∫ U u iu dt
0
Dựa vào phương trình cân bằng ñiện áp :
U u = iu Ru + keω

và phương trình cân bằng moment : k M iu − M c = M q
dt
Ta tính ñược :
T T
ke M c
Q = ∫ U u iu dt = (ϕT − ϕ0 ) + ∫ Ru iu2 dt
0
k M 0
ðể có ñược tiêu hao năng lượng tối thiểu , ta chỉ cần tìm cực tiểu của J :
T T
J = ∫ L[ x(t ), u (t ), t ]dt = ∫ iu2 dt
0 0
Mà dòng ñiện phần ứng iu ở ñây chính là tín hiệu ñiều khiển u . Vì vậy chỉ
tiêu chất lượng J ñối với bài toán năng lượng tối thiểu có dạng :
T
J = ∫ u 2 (t )dt
0

3. Tối ưu hoá tĩnh và ñộng


Chúng ta cần phân biệt hai dạng bài toán tối ưu hoá tĩnh và tối ưu hóa ñộng .
Tối ưu hóa tĩnh là bài toán không phụ thuộc vào thời gian . Còn ñối với tối
ưu hóa ñộng thì thời gian cũng là một biến mà chúng ta cần phải xem xét
ñến .

2.1.2 Xây dụng bài toán tối ưu


1. Tối ưu hóa không có ñiều kiện ràng buộc
Một hàm chỉ tiêu chất lượng vô hướng L ( u ) ñược cho trước là một hàm
của một vector ñiều khiển hay một vector quyết ñịnh u ∈ R m . Chúng ta cần
chọn giá trị của u sao cho L(u) ñạt giá trị nhỏ nhất .
ðể giải bài toán tối ưu , ta viết chuỗi Taylor mở rộng cho ñộ biến thiên của
L(u) như sau :
1
dL = LTu du + du T Luu du + O(3) (2.1)
2
Với O(3) là số hạng thứ 3. Grad của L theo u là một vector m cột :

Trang 129
Chương 2: ðiều khiển tối ưu

 ∂L / ∂u1 
 
∆ ∂L  ∂L / ∂u 2 
Lu = (2.2)
∂u  M 
 
∂L / ∂u m 
và ñạo hàm cấp 2 của L theo u là một ma trận m x m ( còn gọi là ma trận
Hessian ) :
2
∆ ∂ L
 ∂2L 
Luu =   (2.3)
∂u 2  ∂u i ∂u j 

Luu ñược gọi là ma trận uốn .


Một ñiểm cực trị hoặc ñiểm dừng xuất hiện khi sự biến thiên dL với thành
phần thứ nhất tiến về 0 với mọi biến thiên du trong quá trình ñiều khiển . Vì
vậy , ñể có ñiểm cực trị thì :
Lu = 0 (2.4)
Giả sử ñang ở tại ñiểm cực trị , có Lu = 0 như (2.4) . ðể ñiểm cực trị trở
thành ñiểm cực tiểu , chúng ta cần có :
1
dL = du T Luu du + O(3) (2.5)
2
là xác ñịnh dương với mọi sự biến thiên du . ðiều này ñược ñảm bảo nếu ma
trận uốn Luu là xác ñịnh dương :
Luu > 0 (2.6)
Nếu Luu là xác ñịnh âm thì ñiểm cực trị chính là ñiểm cực ñại ; còn nếu Luu
là không xác ñịnh thì ñiểm cực trị chính là ñiểm yên ngựa . Nếu Luu là bán
xác ñịnh thì chúng ta sẽ xét ñến thành phần bậc cao hơn trong (2.1) ñể xác
ñịnh ñược loại của ñiểm cực trị .

Nhắc lại : Luu là xác ñịnh dương ( hoặc âm ) nếu như các giá trị riêng của nó
là dương ( hoặc âm ) , không xác ñịnh nếu các giá trị riêng của nó vừa có
dương vừa có âm nhưng khác 0 , và sẽ là bán xác ñịnh nếu tồn tại giá trị
riêng bằng 0 . Vì thế nếu Luu = 0 , thì thành phần thứ hai sẽ không hoàn
toàn chỉ ra ñược loại của ñiểm cực trị .

2. Tối ưu hóa với các ñiều kiện ràng buộc


Cho hàm chỉ tiêu chất lượng vô hướng L( x, u ) , với vector ñiều khiển
u ∈ R m và vector trạng thái x ∈ R n . Bài toán ñưa ra là chọn u sao cho hàm

Trang 130
Chương 2: ðiều khiển tối ưu

chỉ tiêu chất lượng L(x,u) ñạt giá trị nhỏ nhất và thỏa mãn ñồng thời các
phương trình ñiều kiện ràng buộc .
f ( x, u ) = 0 (2.7)
Vector trạng thái x ñược xác ñịnh từ một giá trị u cho trước bằng mối quan
hệ (2.7) , vì thế f là một hệ gồm n phương trình vô hướng , f ∈ R n .
ðể tìm ñiều kiện cần và ñủ của giá trị cực tiểu , ñồng thời thỏa mãn
f ( x, u ) = 0 , ta cần làm chính xác như trong phần trước . ðầu tiên ta khai
triển dL dưới dạng chuỗi Taylor , sau ñó xác ñịnh số hạng thứ nhất và thứ
hai là Lu & Luu.

Thừa số Lagrange và hàm Hamilton .


Tại ñiểm cực trị , dL với giá trị thứ nhất bằng 0 với mọi sự biến thiên của
du khi df bằng 0 . Như vậy chúng ta cần có:
dL = LTu du + LTx dx = 0 (2.8)
df = f u du + f x dx = 0 (2.9)
Từ (2.7) ta xác ñịnh ñược x từ giá trị u ñã có, ñộ biến thiên dx ñược xác ñịnh
bởi (2.9) từ giá trị biến thiên du với ñiều kiện ma trận Jacobi là không kỳ dị
f x ≠ 0 . Như vậy , ma trận Jacobi fx không kỳ dị và :
dx = − f x−1 f u du (2.10)
Thay dx vào (2.8) ta ñược :
dL = ( LTu − LTx f x−1 f u )du (2.11)
ðạo hàm riêng của L theo u chứa hằng số f ñược cho bởi phương trình :
∂L
∂u df =0
( )
T
= LTu − LTx f x−1 f u = Lu − f uT f x−T L x (2.12)

với f x−T = ( f x−1 ) . Lưu ý rằng :


T

∂L
= Lu (2.13)
∂u dx =0
ðể thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi df = 0 ,
ta cần có :
Lu − f uT f x−T L x = 0 (2.14)
ðây là ñiều kiện cần ñể có giá trị cực tiểu . Trước khi ñi tìm ñiều kiện ñủ ,
chúng ta hãy xem xét thêm một vài phương pháp ñể có ñược (2.14) .
Viết (2.8) và (2.9) dưới dạng:
dL   LTx LTu   dx 
 df  =    = 0 (2.15)
   f x f u  du 

Trang 131
Chương 2: ðiều khiển tối ưu

Hệ phương trình tuyến tính này xác ñịnh một ñiểm dừng , và phải có một
[ ]T
kết quả dx T du T . ðiều này chỉ xảy ra nếu ma trận hệ số (n +1) × (n + m )
có hạng nhỏ hơn n+1 . Có nghĩa là các hàng của ma trận tuyến tính với nhau
ñể tồn tại một vector λ có n số hạng như sau:
T L LTu 
T
[ ]
1 λ . x =0 (2.16)
 f x fu 
Hay:
LTx + λT f x = 0 (2.17)
LTu + λT f u = 0 (2.18)
Giải (2.17) ta ñược λ :
λT = − LTx f x−1 (2.19)
và thay vào (2.18) ñể có ñược (2.14) .
Vector λ ∈ R n ñược gọi là thừa số Lagrange , và nó sẽ là công cụ hữu ích
cho chúng ta sau này . ðể hiểu thêm ý nghĩa của thừa số Lagrange ta xét du
= 0 , từ (2.8) và (2.9) ta khử dx ñể ñược :
dL = LTx f x−1df (2.20)
Vì vậy:
∂L
= (LTx f x−1 ) = −λ
T
(2.21)
∂f du =0
Do ñó -λ là ñạo hàm riêng của L với biến ñiều khiển u là hằng số . ðiều này
nói lên tác dụng của hàm chỉ tiêu chất lượng với biến ñiều khiển không ñổi
khi ñiều kiện ràng buộc thay ñổi .
Như là một cách thứ ba ñể tìm ñược (2.14), ta phát triển thêm ñể sử dụng
cho các phân tích trong những phần sau. Kết hợp ñiều kiện ràng buộc và
hàm chỉ tiêu chất lượng ñể thành lập hàm Hamilton .
H ( x, u, λ ) = L( x, u ) + λT f ( x, u ) (2.22)
Với λ ∈ R là thừa số Lagrange chưa xác ñịnh . Muốn chọn x , u , λ ñể có
n

ñược ñiểm dừng , ta tiến hành các bước sau .


ðộ biến thiên của H theo các ñộ biến thiên của x , u , λ ñược viết như sau :
dH = H xT dx + H uT du + H λT dλ (2.23)
∂H
Lưu ý rằng : Hλ = = f ( x, u ) (2.24)
∂λ
Giả sử chúng ta chọn các giá trị của u thỏa mãn:
Hλ = 0 (2.25)

Trang 132
Chương 2: ðiều khiển tối ưu

Sau ñó ta xác ñịnh x với giá trị của u ñã có bằng phương trình ñiều kiện ràng
buộc f ( x, u ) = 0 . Trong trường hợp này hàm Hamilton tương ñương với
hàm chỉ tiêu chất lượng:
H f =0 = L (2.26)
Nhắc lại : nếu f = 0 , ta sẽ tìm ñược dx theo du từ (2.10) . Ta không nên xét
mối quan hệ giữa du và dx ñể thuận tiện trong việc chọn λ sao cho :
Hx = 0 (2.27)
ðạo hàm (2.22) theo x:
∂H
= L x + f xT λ = 0 (2.28)
∂x
hay λT = − LTx f x−1 .
Nếu giữ nguyên (2.25) và (2.27) từ (2.23):
dL = dH = H uT du (2.29)
Vì H = L, ñể có ñược ñiểm dừng ta phải áp ñặt ñiều kiện:
Hu = 0 (2.30)
Tóm lại , ñiều kiện cần ñể có ñược ñiểm cực tiểu của L(x,u) thỏa mãn ñiều
kiện ràng buộc f(x,u) = 0 gồm có :
∂H
= f =0 (2.31a)
∂λ
∂H
= L x + f xT λ = 0 (2.31b)
∂x
∂H
= Lu + f uT λ = 0 (2.31c)
∂u
Với H ( x,u, λ ) xác ñịnh bởi (2.22) . Cách thường dùng là từ 3 phương trình
ñã cho xác ñịnh x , λ , và u theo thứ tự tương ứng . So sánh 2 phương trình
(2.31b) và (2.31c) ta thấy chúng tương ứng với 2 phương trình (2.17) và
(2.18) .
Trong nhiều ứng dụng , chúng ta không quan tâm ñến giá trị của λ , tuy
nhiên ta vẫn phải ñi tìm giá trị của nó vì ñó là một biến trung gian cho phép
chúng ta xác ñịnh các ñại lượng cần tìm là u , x và giá trị nhỏ nhất của L .
Ưu ñiểm của thừa số Lagrange có thể tóm tắt như sau : trên thực tế , hai ñại
lượng dx và du không phải là hai ñại lượng biến thiên ñộc lập với nhau ,
theo (2.10) . Bằng cách ñưa ra một thừa số bất ñịnh λ , chúng ta chọn λ sao
cho dx và du có thể ñược xem là hai ñại lượng biến thiên ñộc lập với nhau .
Lấy ñạo hàm riêng của H lần lượt theo các biến như trong (2.31) , như thế ta
sẽ có ñược ñiểm dừng .

Trang 133
Chương 2: ðiều khiển tối ưu

Khi ñưa ra thừa số Lagrange , chúng ta có thể thay thế bài toán tìm giá trị
nhỏ nhất của L(x,u) với ñiều kiện ràng buộc f(x,u) = 0 , thành bài toán tìm
giá trị nhỏ nhất của hàm Hamilton H(x,u,λ) không có ñiều kiện ràng buộc .
ðiều kiện ñã (2.31) xác ñịnh một ñiểm dừng . Ta sẽ tiếp tục chứng minh ñây
là ñiểm cực tiểu như ñã thực hiện trong phần trước .
Viết chuỗi Taylor mở rộng cho ñộ biến thiên của L và f như sau :
 dx  1 L L xu   dx 
[ ]
dL = LTx LTu   + dx T du T  xx [ ]
   + O(3) (2.32)
du  2  Lux Luu  du 
 dx  1 f f xu   dx 
df = [ f x f u ]  + dx T [ ]
du T  xx
f uu  du 
+ O(3) (2.33)
du  2  f ux
Với:
∂2 f ∆
f xu =
∂u∂x
ðể ñưa ra hàm Hamilton , ta sử dụng các phương trình sau :

dL   dx  1 H
H xu   dx 
[1 λT ]  [
= H xT ]
H uT   + dx T [ ]
du T  xx
H uu  du 
+ O(3)
 df  du  2  H ux
(2.34)
Bây giờ , ñể có ñược ñiểm dừng ta cần có f = 0 , và ñồng thời thành phần
thứ nhất của dL bằng 0 với mọi sự biến thiên của dx và du . Vì f = 0
nên df = 0 , và ñiều này ñòi hỏi H x = 0 và H u = 0 như trong (2.31) .
ðể tìm ñiều kiện ñủ cho ñiểm cực tiểu , chúng ta xét ñến thành phần thứ hai .
ðầu tiên , ta cần xem mối quan hệ giữa dx và du trong (2.34) . Giả sử rằng
chúng ta ñang ở ñiểm cực trị nên H x = 0 , H u = 0 và df = 0 . Từ (2.10)
suy ra:
dx = − f x−1 f u du + O(2) (2.35)
Thay vào (2.34) ta ñược :
1 H H xu  − f x−1 f u 
2
[
dL = du T − f uT f x−T I  xx ]   du + O(3) (2.36)
 H ux H uu   I 
ðể ñảm bảo ñây là ñiểm cực tiểu , dL trong (2.36) phải dương với mọi sự
biến thiên của du . ðiều này ñược ñảm bảo nếu như ma trận uốn với f luôn
bằng 0 là xác ñịnh dương .
∆ H H xu  − f x−1 f u 
f
Luu [
= Luu f = − f uT f x−T I  xx ]  
(2.37)
 H ux H uu   I 
= H uu − f uT f x−T H xu − H ux f x−1 f u + f uT f x−T H xx f x−1 f u

Trang 134
Chương 2: ðiều khiển tối ưu

Lưu ý rằng nếu ñiều kiện ràng buộc f ( x, u ) = 0 với mọi x và u thì (2.37)
ñược rút lại thành Luu ở phương trình (2.3) .
Nếu (2.37) là xác ñịnh âm ( hoặc không xác ñịnh ) thì ñiểm dừng sẽ là ñiểm
cực ñại ( hoặc ñiểm yên ngựa ) .

2.1.3 Ví dụ
Tối ưu hóa không có ñiều kiện ràng buộc
Ví dụ 2.1 : Không gian toàn phương .
Cho u ∈ R 2 và :
1 q q12 
L(u ) = u T  11 u + [s1 s 2 ]u (1)
2 q12 q 22 
∆ 1
= u T Qu + S T u (2)
2
ðiểm cực trị ñược xác ñịnh bởi :
Lu = Qu + S = 0 (3)
u ∗ = −Q −1 S (4)
với u* dùng ñể chỉ biến ñiều khiển tối ưu.
Loại của ñiểm cực trị ñược xác ñịnh bằng cách xét ma trận hessian
Luu = Q (5)
ðiểm u* là cực tiểu nếu Luu > 0 ( q11 > 0 và q11 q 22 − q122 > 0 ) . Là ñiểm cực
ñại nếu Luu < 0 ( q11 < 0 và q11 q 22 − q122 > 0 ) . Nếu Q < 0 , thì u* là ñiểm
yên ngựa . Nếu Q = 0 , thì u* là ñiểm kỳ dị , chúng ta không thể xác ñịnh
ñược ñó là cực tiểu hay cực ñại từ Luu .
Bằng cách thay (4) vào (2) ta sẽ tìm ñược giá trị của hàm chỉ tiêu chất lượng
như sau :
∆ 1 1
L* = L(u * ) = S T Q −1QQ −1 S − S T Q −1 S = − S T Q −1 S (6)
2 2
Giả sử cho L như sau:
1 T 1 1 
L= u u + [0 1]u (7)
2 1 2
Khi ñó giá trị u tối ưu sẽ là:
2 − 1 0  1 
u * = −   =   (8)
1 1  1 − 1

Trang 135
Chương 2: ðiều khiển tối ưu

là một cực tiểu , vì Luu > 0 . Từ (6) giá trị nhỏ nhất của L là L* = -1/2 .
Các ñường ñồng mức của L(u) trong (7) ñược vẽ trong Hình 2.4 , với u = [u1
u2]T . Các mũi tên là gradient .
 u + u2 
Lu = Qu + S =  1  (9)
u1 + 2u 2 + 1
Lưu ý rằng gradient luôn luôn vuông góc với các ñường ñồng mức và có
hướng là hướng tăng L(u) .
Chúng ta dùng dấu “*” ñể chỉ giá trị tối ưu của u và L cần tìm . Tuy nhiên ta
thường bỏ qua dấu “*” .

Hình 2.4 : Các ñường ñồng mức và vector gradient .

Ví dụ 2.2 : Tối ưu hóa bằng tính toán vô hướng .


Phần trên chúng ta ñã ñề cập phương pháp giải bài toán tối ưu bằng cách sử
dụng các vector và gradient . Sau ñây ta sẽ tiếp cận bài toán với một cách
nhìn khác , xem chúng như là những ñại lượng vô hướng .
ðể chứng minh , ta xét (7) ở dạng:
1
L(u1 , u 2 ) = u12 + u1u 2 + u 22 + u 2 (1)
2
Với u1 ,u 2 là các ñại lượng vô hướng . ðiểm cực trị xuất hiện khi ñạo hàm
riêng của L theo tất cả các ñối số phải bằng 0 :
∂L
= u1 + u 2 = 0 (2a)
∂u1

Trang 136
Chương 2: ðiều khiển tối ưu

∂L
= u1 + 2u 2 + 1 = 0 (2b)
∂u 2

Giải hệ phương trình trên ta ñược : u1 = 1, u 2 = −1 (3)


Vậy , ñiểm cực trị là (1 ,-1) .
Biểu thức (1) là một dạng mở rộng của biểu thức (7) trong ví dụ 2.1 , như
vậy chúng ta vừa tìm ñược một kết quả tương tự bằng một cách khác .

Tối ưu hóa có ñiều kiện ràng buộc


Ví dụ 2.3 : Không gian toàn phương với ñiều kiện ràng buộc tuyến tính .
Giả sử hàm chỉ tiêu chất lượng ñược cho bởi ví dụ 2.1 với các ñại lượng vô
hướng u1 ,u 2 ñược thay thế bằng x, u :
1 1 1  x   x
L( x, u ) = [x u ]    + [0 1]  (1)
2 1 2 u  u 
Với ñiều kiện ràng buộc :
f ( x, u ) = x − 3 = 0 (2)
Hàm Hamilton sẽ là :
1
H = L + λT f = x 2 + xu + u 2 + u + λ ( x − 3) (3)
2
với λ là một ñại lượng vô hướng . ðiều kiện ñể có ñiểm dừng theo (2.31) là :
Hλ = x − 3 = 0 (4)
Hx = x +u + λ = 0 (5)
H u = x + 2u + 1 = 0 (6)
Giải (4) , (5) , (6) ta ñược : x = 3 , u = -2 , λ = -1 . ðiểm dừng là :
(x, u )∗ = (3,−2) (7)
ðể xác ñịnh (7) là ñiểm cực tiểu , tìm ma trận uốn theo (2.3) :
f
Luu =2 (8)
>= 0 , vì thế ( x, u ) = (3,−2 ) là ñiểm cực tiểu .
f ∗
Luu
Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc (2) ñược vẽ trong
Hình 2.5 .
Grad của f(x,u) trong hệ tọa ñộ (x,u) ñược viết như sau:
 f x  1
 f  = 0  (9)
 u  
ñược vẽ trong Hình 2.5 . Và grad của L(x,u) :

Trang 137
Chương 2: ðiều khiển tối ưu

 Lx   x + u 
 L  =  x + 2u + 1 (10)
 u  
Tại ñiểm cực tiểu (3,-2) , grad L(x,u) sẽ có giá trị :
 L x  1
 L  = 0  (11)
 u  
Cần lưu ý rằng gradf và gradL tương ñương với nhau tại ñiểm dừng . Có
nghĩa là ñiểm cực tiểu xuất hiện khi ñiều kiện ràng buộc (2) là ñường tiếp
tuyến của các ñường ñồng mức của L. Di chuyển hướng dọc theo ñường
thẳng f = 0 sẽ làm tăng giá trị của L .
Ta tìm ñược giá trị của L tại ñiểm cực tiểu bằng cách thay x = 3, u = -2 vào
(1) , ta ñược L*=0,5 .
Vì λ = -1 , giữ nguyên giá trị u = -2 , thay ñổi ñiều kiện ràng buộc df ( dịch
chuyển ñường thẳng trong Hình 2.5 về phía phải ) sẽ làm tăng L(x,u) với dL
= -λdf = df .

Ví dụ 2.4 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính - Trường hợp vô hướng .
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
1  x2 y 2 
L( x, u ) =  2 + 2  (1)
2a b 
Với ñiều kiện ràng buộc tuyến tính :
f ( x, u ) = x + mu − c (2)
2
Các ñường ñồng mức của L(x,u) là những ellip; nếu L(x,u) = l /2, thì bán
kính trục chính và bán kính trục phụ là al và bl . ðiều kiện ràng buộc f(x,u)
là một họ các ñường thẳng chứa thông số c . Xem Hình 2.6 ( lưu ý rằng u là
biến ñộc lập , với x ñược xác ñịnh bởi f(x,u) = 0 ) .
Hàm Hamilton là :
1  x2 u2 
H =  2 + 2  + λ ( x + mu − c) (3)
2a b 
Và ñiều kiện ñể có ñiểm dừng :
H λ = x + mu − c = 0 (4)
x
Hx = 2 + λ = 0 (5)
a
u
H u = 2 + λm = 0 (6)
b

Trang 138
Chương 2: ðiều khiển tối ưu

Hình2.5 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u) .

Hình 2.6 : Các ñường ñồng mức của L(x,u) và ñiều kiện ràng buộc f(x,u).

ðể giải hệ phương trình này , trước hết ta sử dụng phương trình (6) ñể ñưa
ra biến ñiều khiển tối ưu theo thừa số Lagrange .
u = −b 2 mλ (7)
Bây giờ thay phương trình (7) vào (4) ñể khử u , kết hợp với (5) và ñược
viết lại :
 1 − b 2 m 2   x  c 
1  = (8)
 2 1  λ  0
a 
Giải ra ta ñược giá trị của ñiểm dừng :
a 2c
x= 2 (9)
a + b2m2

Trang 139
Chương 2: ðiều khiển tối ưu

c
λ=− (10)
2
a + b2m2
Thay (9) , (10) vào (7) , ta có ñược giá trị u tối ưu :
b 2 mc
u= 2 (11)
a + b2m2
ðể xác ñịnh ñiểm dừng là cực tiểu , dùng (2.37) ñể tìm ra ma trận uốn :
1 m2
f
Luu = 2 + 2 (12)
b a
Luuf > 0 vì vậy ta tìm ñược một ñiểm cực tiểu .
Thay (9) và (11) vào (1) ta ñược giá trị tối ưu của hàm chỉ tiêu chất lượng :
1 c2
L* = (13)
2 a2 + b2m2
ðể kiểm chứng (2.21) , lưu ý rằng:
∂L* ∂L*
= = −λ (14)
∂f du =0 ∂c
Gradf trong miền (u,x) là :
 f u  m
 f  = 1 (15)
 x  
ñược biểu diễn trong Hình 2.6 . GradL là :
u 
 Lu   b 2 
L  =  x  (16)
 x  
a2 
và tại ñiểm dừng (11) , (9) sẽ có giá trị :
*
 Lu  m  c
L  =  1  2 2 2
(17)
 x   a +b m
ðiều này tương ứng với (15) , vì vậy ñiểm dừng xuất hiện khi f(x,u) = 0 là
ñường tiếp tuyến với một ñường ñồng mức của L(x,u) .

Ví dụ 2.5 : Hàm chỉ tiêu chất lượng dạng toàn phương với ñiều kiện ràng
buộc tuyến tính .
Bây giờ ta tổng quát hóa ví dụ 2.4 với vector x ∈ R n , u ∈ R m , f ∈ R n ,
λ ∈ Rn .
Xét hàm chỉ tiêu chất lượng dạng toàn phương:

Trang 140
Chương 2: ðiều khiển tối ưu

1 T 1
L= x Qx + u T Ru (1)
2 2
với ñiều kiện ràng buộc tuyến tính :
f = x + Bu + c = 0 (2)
với Q , R và B là các ma trận , c là vector n hàng . Giả sử Q ≥ 0 và R > 0
( với Q , R là ma trận ñối xứng ) . Các ñường ñồng mức của L(x,u) là các
ñường ellip trong không gian , và f(x,u)=0 là mặt phẳng cắt ngang qua
chúng . ðiểm dừng xuất hiện khi gradf và gradL song song với nhau .
Hàm Hamilton là :
1 1
H = x T Qx + u T Ru + λT ( x + Bu + c) (3)
2 2
và các ñiều kiện ñể có ñiểm dừng là :
H λ = x + Bu + c = 0 (4)
H x = Qx + λ = 0 (5)
H u = Ru + B λ = 0T
(6)
ðể giải các phương trình trên , ñầu tiên ta dùng ñiều kiện (6) ñể tìm u theo
λ:
u = − R −1 B T λ (7)
Từ (5) ta có :
λ = −Qx (8)
Kết hợp với (4) ta ñược :
λ = QBu + Qc (9)
dùng kết quả này thay vào (7) cho ta :
u = − R −1 B T (QBu + Qc) (10)
hay : ( −1 T
)
I + R B QB u = − R B Qc −1 T

(R + B T
QB )u = − B
Qc T
(11)
T T
Vì R > 0 và B QB ≥ 0 , chúng ta có thể tìm nghịch ñảo của (R + B QB) và vì
thế giá trị u tối ưu là :
u = −( R + B T QB) −1 B T Qc (12)
So sánh kết quả này với (11) trong ví dụ 2.4 .
Thay (12) vào (4) và (9) cho ta giá trị trạng thái tối ưu và thừa số Lagrange
tối ưu :

( (
x = − I − B R + BT QB )
−1
)
BT Q c (13)

( B Q) c
−1
λ = Q − QB ( R + BT QB ) T
(14)
Bằng bổ ñề của nghịch ñảo ma trận :

Trang 141
Chương 2: ðiều khiển tối ưu

λ = (Q −1 + BR −1 B T ) c
−1
(15)
nếu Q ≠ 0 . Các kết quả trên sẽ rút lại thành kết quả của ví dụ 2.4 trong
trường hợp vô hướng .
ðể xác ñịnh biến ñiều khiển (12) là một cực tiểu , ta sử dụng (2.37) ñể xác
ñịnh ma trận uốn là xác ñịnh dương với giá trị của R và Q ñược giới hạn .
f
Luu = R + B T QB (16)
Sử dụng (12) và (13) thế vào (1) ta có ñược giá trị tối ưu :
1
[ ( −1
L* = c T Q − QB R + B T QB B T Q c
2
) ] (17)
1
L* = c T λ (18)
2
∂L *
Vì thế: =λ (19)
∂c

Ví dụ 2.6 : Bài toán với nhiều ñiều kiện ràng buộc .


Tìm khoảng cách nhỏ nhất giữa parabol :
y = ax 2 + bx + d (1)
với ñường thẳng :
y = x+c (2)
Xem Hình 2.7 .
Trong bài toán này sẽ có hai ñiều kiện ràng buộc :
f1 ( x1 , y1 ) = y1 − ax12 − bx1 − d = 0 (3)
Và : f 2 ( x2 , y 2 ) = y 2 − x2 − c = 0 (4)
với ( x1 , y1 ) là 1 ñiểm trên parabol và ( x 2 , y 2 ) là 1 ñiểm trên ñường thẳng .
Chúng ta chọn hàm chỉ tiêu chất lượng là một nửa của bình phương khoảng
cách giữa 2 ñiểm này .
1 1
L( x1 , x 2 , y1 , y 2 ) = ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 (5)
2 2
ðể giải bài toán này , ta xử lý bằng cách ñặt :
∆ f  ∆ x  ∆y 
f = 1  , x = 1  , u = 1  (6)
 f2   x2   y2 
và sử dụng cách tiếp cận vector ; tuy nhiên , sự kết hợp giữa một ñiều kiện
ràng buộc tuyến tính và một ñiều kiện phi tuyến sẽ làm phức tạp thêm bài
toán . Thay vào ñó ta sẽ sử dụng các ñại lượng vô hướng .

Trang 142
Chương 2: ðiều khiển tối ưu

Hình 2.7 : Bài toán với nhiều ñiều kiện ràng buộc .

ðưa ra một thừa số Lagrange cho mỗi ñiều kiện ràng buộc , hàm Hamilton
là :
1 1
H = ( x1 − x 2 ) 2 + ( y1 − y 2 ) 2 + λ1 ( y1 − ax12 − bx1 − d ) + λ 2 ( y 2 − x 2 − c) (7)
2 2
Khi ñó , ñể có ñiểm dừng ta cần có :
H x1 = x1 − x 2 − 2aλ1 x1 − bλ1 = 0 (8)
H x2 = − x1 + x2 − λ2 = 0 (9)
H y1 = y1 − y 2 + λ1 = 0 (10)
H y2 = − y1 + y 2 + λ2 = 0 (11)
H λ1 = y1 − ax12 − bx1 − d = 0 (12)
H λ2 = y 2 − x2 − c = 0 (13)
Giải (12) ñể có ñược y1 như sau :
y1 = ax12 + bx1 + d (14)
Từ (9) và (11) , ta có :
λ2 = x 2 − x1 = y1 − y 2 (15)
và sử dụng (14) với y 2 = x 2 + c từ (13) có ñược kết quả sau :

Trang 143
Chương 2: ðiều khiển tối ưu

x 2 − x1 = ax12 + bx1 + d − x 2 − c (16)


Khi ñó :
1
x2 =
2
(
ax12 + (b + 1) x1 + d − c) (17)
Theo (10) và (11) , λ1 = -λ2 , vậy từ (15) và (17) ta có :
λ1 = x1 − x 2
1
(
λ1 = − ax12 + (b − 1) x1 + d − c
2
) (18)
Cuối cùng , chú ý rằng (8) là :
(2ax1 + (b − 1))λ1 = 0 (19)
hay :
( )
(2ax1 + (b − 1)) ax12 + (b − 1) x1 + d − c = 0 (20)
Phương trình bậc 3 (20) ñược giải ñể có giá trị tối ưu x1* từ giá trị a, b, c, d
cho trước . Nếu ñường thẳng cắt ngang qua parabol thì giao ñiểm sẽ là kết
quả tối ưu ( khi ñó λ1=λ2=0 ) ; ngược lại , sẽ có chỉ một cặp gần nhau nhất
(x1,x2) , (y1,y2) . Một khi tìm ñược x1 thì ta sẽ tìm ñược x2 , y1 và y2 lần lượt
theo các phương trình (17) , (14) và (15) . Thay các giá trị tối ưu này vào (5)
sẽ cho chúng ta khoảng cách ngắn nhất là 2L * .

Ví dụ 2.7 :
Moät con taøu ñang di chuyeån vôùi vaän toác 10 haûi lyù
moät giôø theo phöông hôïp vôùi phöông baéc moät goùc
30o (laáy theo chieàu kim ñoàng hoà) ñeå ñeán moät hoøn
ñaûo. Giaû söû raèng taïi thôøi ñieåm t = 0, con taøu ñang ôû vò
trí caùch hoøn ñaûo 30 haûi lyù veà phía Baéc vaø 20 haûi lyù
veà phía ñoâng (töùc laø con taøu leäch khoûi phöông di
chuyeån ban ñaàu). Baøi toaùn ñaët ra laø xaùc ñònh ñieåm
gaàn nhaát treân phöông di chuyeån ban ñaàu maø con taøu
caàn trôû veà ñeå ñi tôùi hoøn ñaûo. Tìm khoaûng caùch töø hoøn
ñaûo ñeán ñieåm gaàn nhaát vaø thôøi gian ñeán ñöôïc ñieåm ñoù.
Giải:
Caùch 1: giaûi baèng phöông phaùp hình hoïc: N
My M
Trong ∆ MMxO: 30
MM x 30
tg∠MOM x = = = 1.5 ⇒ ∠MOM x = 56.30 300
OM x 20
OM = MM x2 + OM x2 = 20 2 + 30 2 = 36.0555 Mx
O 20
Trang 144
Chương 2: ðiều khiển tối ưu

Trong ∆ MNO:
⇒ ∠MN O = 900 − 56.30 − 300 = 3.690
NM
sin ∠MON = ⇒ NM = 36.0555*sin3.690 = 2.32
OM
Vaäy khoaûng caùch ngaén nhaát laø NM = 2.32 miles

Caùch 2: duøng phöông phaùp Euler_Lagrange:


Yeâu caàu: tìm khoaûng caùch ngaén nhaát töø ñieåm M(20, 30) ñeán ñöôøng
thaúng y = 3 x
ðieàu kieän raøng buoäc : f ( x, y ) = y − 3 x = 0
Trong ñoù (x, y) laø moät ñieåm thuoäc ñöôøng thaúng.
Choïn haøm chæ tieâu chaát löôïng laø bình phöông khoaûng caùch giöõa 2
2 2
ñieåm trong maët phaúng: L ( x, y ) = ( x − 20 ) + ( y − 30 )
2 2
(
Haøm Hamilton laø : H ( x, y, λ ) = ( x − 20 ) + ( y − 30 ) + λ y − 3 x )
Xaùc ñònh ñieåm döøng :
H λ = y − 3x = 0
H x = 2 ( x − 20 ) − 3λ = 0
H y = 2 ( y − 30 ) + λ = 0
 x = 18 ( miles )

Giaûi heä phöông trình treân tìm ñöôïc :  y = 31.177 ( miles )
λ = −2.354

Vaäy ñieåm caàn tìm coù toaï ñoä laø N (18, 31.177 ) .
Khoaûng caùch ngaén nhaát :

d min = LN = (18 − 20) 2 + (31.177 − 30) 2 ≈ 2.32 (mile )


Goïi D laø khoaûng caùch töø hoøn ñaûo tôùi ñieåm N. Khi ñoù :
D = x N2 + y N2 = (18) 2 + (31.177) 2 ≈ 36 (mile )

Goïi t laø thôøi gian taøu ñi töø ñieåm M tôùi ñieåm gaàn nhaát N.
d 2.32
t = min = = 0.232 (hours )
v 10

Trang 145
Chương 2: ðiều khiển tối ưu

Ví dụ 2.8:
Tìm ñieåm A baát kyø thuoäc ñöôøng thaúng d trong khoâng gian sao cho khoaûng
caùch töø goác toaï ñoä O ñeán A laø nhoû nhaát. Ñöôøng thaúng d trong khoâng gian
cho bôûi heä phöông trình:
3x + 2 y + z = 1
d
 x + 2 y − 3z = 4
Giaûi:
Caùch 1: duøng phöông phaùp hình hoïc giaûi tích:
• u : vector chỉ phương của ñường thẳng d:
2 1 1 3 3 2
u =  , ,  = (− 8,10,4)

u d  2 − 3 − 3 1 1 2 
A • Gọi A là ñiểm thuộc d, có tọa ñộ:
7 −3
A(0, , ) , (cho xA=0 ta tính yA, zA)
H 8 4
• Khoaûng caùch ngaén nhaát töø O ñeán d:
[AO ,u ]
O d (OA min) = d (O , d ) = OH =
u
−7 3 3 −7
[AO,u ] = ( 8 4' 4
0
,
0
8 ) = (−11,−6,−7)
10 4 4 −8 −8 10

Ñeå khoaûng caùch laø nhoû nhaát thì: OA = OH


(−11) 2 + (−6) 2 + (−7) 2 206
Khi ñoù: d (OA min) = = = 1.0697
(−8) 2 + 10 2 + 4 2 180

Caùch 2: duøng phöông phaùp Euler_Lagrange:


Theo ñeà baøi ta coù hình veõ: y
d

x
O

Trang 146
Chương 2: ðiều khiển tối ưu

Yêu cầu thiết kế

Xaùc ñònh phieám


haøm L(x2,y2,z2)

Thaønh laäp haøm Hamilton ñeå bieán


baøi toaùn coù ñieàu kieän raøng buoäc
trôû thaønh khoâng raøng buoäc

Tính ñaïo haøm Hx2, Hy2


Hz2,Hλ1, Hλ2 cho baèng 0

Xaùc ñònh λ1,λ2


Vaø ñieåm toái öu A(x2,y2,z2)

S
Kieåm tra

Keát thuùc

Quan saùt treân hình veõ ta thaáy khoaûng caùch ta muoán toái öu hoaù ñoù laø ñoaïn
OA, trong ñoù A chaïy treân ñöôøng thaúng d.
⇒ OA2 = (x2 – x1)2 + (y2 – y1)2 + (z2 – z1)2
Vì O laø goác toaï ñoä ⇒ O(0,0,0).
⇒ OA2 = (x2)2 + (y2)2 + (z2)2
Phiếm haøm toái öu: L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 (1)
Baøi toaùn vôùi 2 ñieàu kieän raøng buoäc laø:
f1(x2,y2,z2)=3x2 + 2y2 + z2 -1= 0 (2)
f2(x2,y2,z2)=x2 + 2y2 – 3z2 - 4=0 (3)
Thaønh laäp haøm Hamilton:
H(x2,y2,z2,λ1,λ2) = x22 + y22 + z22 + λ1 f1(x2,y2,z2) + λ2 f2(x2,y2,z2)

Trang 147
Chương 2: ðiều khiển tối ưu

= x22 + y22 + z22 + λ1(3x2 + 2y2 + z2 -1) +


λ2(x2 + 2y2 -3z2 - 4) (4)
Ñieàu kieän caàn ñeå coù ñieåm cöïc tieåu cuûa L(x2,y2,z2) thoaû maõn ñieàu kieän
raøng buoäc f(x2,y2,z2)=0 khi:
∂H
= f =0
∂λ
∂H
= Lx 2 + f xT2 λ = 0
∂x2
∂H
= Lu + f yT2 λ = 0
∂y2
∂H
= Lz 2 + f zT2 λ = 0
∂z2
Xaùc ñònh ñieåm döøng:
∂H
H x2 = = 2 x 2 + 3λ1 + λ 2 = 0 (5)
∂x2
∂H
H y2 = = 2 y 2 + 2λ1 + 2λ 2 = 0 (6)
∂y 2
∂H
H z2 = = 2 z 2 + λ1 − 3λ2 = 0 (7)
∂z 2
∂H
H λ1 = = 3x2 + 2 y 2 + z 2 − 1 = 0 (8)
∂λ1
∂H
H λ2 = = x2 + 2 y 2 − 3 z 2 − 4 = 0 (9)
∂λ2
Töø (5), (6), (7) nhaän ñuôïc:
1
x2 = (− 3λ1 − λ2 ) (10)
2
1
z 2 = (− λ1 + 3λ 2 ) (11)
2
y 2 = −λ1 − λ2 (12)
Thay x2, y2, z2 vaøo phöông trình (8),(9) ta coù
3
(− 3λ1 − λ2 ) + 2(− λ1 − λ2 ) + 1 (− λ1 + 3λ2 ) − 1 = 0 (13)
2 2
1
(− 3λ1 − λ2 ) + 2(− λ1 − λ2 ) − 3 (− λ1 + 3λ2 ) − 4 = 0 (14)
2 2

Trang 148
Chương 2: ðiều khiển tối ưu

− 7λ1 − 2λ2 − 1 = 0
 (15)
− 2λ1 − 7λ2 − 4 = 0
1 − 26
Giaûi heä phöông trình (15) ta tìm ñöôïc: λ1= ; λ2=
45 45
Thay giaù trò λ1, λ2 vaøo (10), (11), (12) ta coù
23 5 79
x2 = ; y2 = ; z 2 = .
90 9 90
x2 = 0.255; y2 = 0.555, z2 = -0.877.
L(x2,y2,z2) = OA2 = (x2)2 + (y2)2 + (z2)2 = 1.142
Vaäy ta xaùc ñònh ñöôïc ñieåm toái öu A(x2,y2,z2).
Khoaûng caùch giöõa ñieåm A ñeán goác toaï ñoä laø:
OA= x 22 + y 22 + z 22 = 1.069.
Kieåm tra laïi:
Coù nhieàu phöông phaùp kieåm tra laïi keát quaû treân laø cöïc tieåu:
- phöông phaùp kieåm tra ma traän uoán Luu, tuy nhieân ôû baøi taäp treân
phieám haøm toái öu L theo 3 bieán neân vieäc xaùc ñònh ma traän uoán
phöùc taïp.
- Phöông phaùp thöû sai:
• So saùnh giaù trò toïa ñoä, khoaûng caùch tính ñöôïc baèng phuông phaùp
thöû sai vôùi giaù trò maø ta duøng phöông phaùp bieán phaân coå ñieån
Euler_Lagrange.
• Ñeå kieåm tra ñaây laø cöïc tieåu cuïc boä hay toaøn phaàn ta cho phạm vi
thay ñoåi cuûa ñieåm A roäng hôn.

Ví dụ 2.9 :
a. Chöùng toû giaù trò min cuûa haøm x2y2z2 treân maët caàu x2+y2+z2= r2 laø
(r2/3)3
b. Chöùng toû raèng giaù trò cöïc ñaïi cuûa haøm x2+y2+z2 treân maët
x2y2z2=(r2/3)3 laø r2
Giaûi:
a.Duøng phöông phaùp Euler Lagrange:
Choïn phiếm haøm toái öu laø : L(x,y,z) = x2y2z2 (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y,z) = x +y +z - r = 0
Thaønh laäp haøm Hamilton :
H(x,y,z) = x2y2z2 + λ(x2+y2+z2 - r2)

Trang 149
Chương 2: ðiều khiển tối ưu

Xaùc ñònh ñieåm cöïc trò:


Hλ = x2+y2+z2 - r2 = 0 (1)
2 2
Hx = 2xy z + 2λx = 0 (2)
2 2
Hy = 2yx z + 2λy = 0 (3)
2 2
Hz = 2zx y + 2λz = 0 (4)
Töø (2)  2x(y2z2 + λ ) = 0, Vôùi x ≠ 0, ta coù : y2z2 + λ = 0 (5)
Töø (3)  2y(x2z2 + λ ) = 0, Vôùi y ≠ 0, ta coù : x2z2 + λ = 0 (6)
2 2 2 2
Töø (4)  2z(x y + λ ) = 0, Vôùi z ≠ 0, ta coù : x y + λ = 0 (7)
2 2 2 2 2 2 2 2 2
Töø (5), (6) vaø (7) ta coù : λ = - y z = -x z = -x y  x = y = z (8)
2 2 2 2
Töø (1) vaø (8)  x = y = z = r /3
Theá toïa ñoä x, y, z vaøo (*) ta ñöôïc giaù trò cuûa phiếm haøm toái öu:
L(x,y,z) = (r2/3)3.
Kieåm tra L laø max hay min :
Choïn moät ñieåm baát kyø trong khoâng gian thuoäc f(x,y,z) = 0 coù toïa ñoä
khaùc ñieàu kieän : x2 = y2 = z2 = r2/3. Ta choïn ñieåm M(1, 1, r2 − 2 ) ,
ñieàu kieän r ≥ 2
 LM = (r2 -2)
Kieåm tra baát ñaúng thöùc: L= (r2/3)3 < LM = r2 – 2
⇔ r5 – 27r2 + 54 < 0 . Ñaúng thöùc naøy luoân bò sai vôùi moïi r ≥ 2 . Do
ñoù taïi toïa ñoä thoûa ñieàu kieän x2 = y2 = z2 = r2/3 thì L luoân laø giaù trò cöïc
ñaïi.

b.Duøng phöông phaùp Euler Lagrange:


Phiếm haøm toái öu laø : L(x,y,z) = x2+y2+z2
Ñieàu kieän raøng buoäc : f(x,y,z) = x2y2z2 – (r2/3)3 = 0
Thaønh laäp haøm Hamilton: H(x,y,z,λ) = x2+y2+z2 + λ( x2y2z2 – (r2/3)3)
Tìm ñieåm cöïc trò baèng caùch cho caùc ñaïo rieâng cuûa H baèng 0.
Hx = 2x + 2λxy2z2 = 0 (9)
Hy = 2y + 2λyx2z2 = 0 (10)
Hz = 2z + 2λzx2y2 = 0 (11)
2 2 2 2 3
Hλ = x y z – (r /3) = 0 (12)
Vôùi (x,y,z) ≠ (0,0,0) thì ta coù :
λ = - 1/(x2y2) = -1/(y2z2) = -1/(x2z2)
 x2 = y2 = z2.
Töø (12) ta coù toïa ñoä ñieåm döøng : x2 = y2 = z2 = r2/3

Trang 150
Chương 2: ðiều khiển tối ưu

Taïi ñieåm döøng ta coù : L (x,y,z) = r2


Kieåm chöùng L laø giaù trò lôùn nhaát.
Choïn moät ñieåm baát kyø coù toïa ñoä thuoäc maët x2y2z2=(r2/3)3 khoâng thoûa
ñieàu kieän: x2 = y2 = z2 = r2/3
Choïn ñieåm M[1, 1, (r 2 / 3) 3 ]
Khi ñoù LM(x,y,z) = 2 + r6/27
Ta caàn chæ ra raèng : 2 + r6/27 < r2
Baát ñaúng thöùc töông ñöông : r2(r4 – 27) < -54. Deã daøng thaáy ñöôïc baát
ñaúng thöùc luoân sai vôùi moïi r ( vì r2 luoân >= 0). Chính vì theá taïi ñieåm
döøng phieám haøm toái öu phaûi ñaït giaù trò cöïc tieåu.

Ví dụ 2.10 :
a. Tìm hình chöõ nhaät noäi tieáp hình elips coù chu vi lôùn nhaát.
b. Tìm hình chöõ nhaät noäi tieáp elips coù dieän tích lôùn nhaát .
Giaûi
a. Giaûi baèng phöông phaùp Euler – Lagrange :
Phiếm haøm toái öu laø: L(x,y) = 4(x+y) (*)
2 2 2 2
Ñieàu kieän raøng buoäc laø: f(x,y) = x /a + y /b -1 = 0
Khi ñoù haøm Hamilton seõ laø: H(x,y,λ ) = 4(x+y) + λ (x2/a2 + y2/b2 -1)
Tìm caùc ñieåm döøng döïa vaøo caùc ñieàu kieän sau:
Hλ = x2/a2 + y2/b2 -1 = 0 (1)
2
Hx = 4 + 2λx/a = 0 (2)
2
Hy = 4 + 2λy/b = 0 (3)
2
Töø (2)  x = -2a /λ
Töø (3)  y = -2b2/λ
Thay x, y vaøo (1) ta coù:
2 2
 −2 a 2  2  − 2b 2  2
⇔  /a +  / b −1 = 0
 λ   λ 
⇔ 4( a 2 + b 2 ) = λ 2
⇔ λ = ±2 a 2 + b 2
a2 b2
Vôùi λ = 2 a 2 + b 2 ta tìm ñöôïc x = - ;y=-
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L1= -4 a 2 + b 2 < 0, khoâng toàn taïi

Trang 151
Chương 2: ðiều khiển tối ưu

a2 b2
Với λ = -2 a 2 + b 2 ta tìm ñöôïc x = ;y=
a2 + b2 a2 + b2
Khi ñoù thay x, y vaøo (*) ta coù : L2= 4 a 2 + b 2 > 0
Kieåm tra laïi L2 laø max
Hyy = 2λ /b2 ; Hxx = 2λ /a2 ; Hxy = Hyx = 0
 f x  2 x / a 2 
f  =  2
 y  2 y / b 
2λ 2 y a 2 2λ a 2 2 y
⇒ L yy
f
= H yy + f yT f x−T H xx f x−1 f y = + . . . .
b2 b2 2x a2 2x b2
2λ a2 y2
= (1 + )
b2 b2 x2
ÖÙng vôùi L2, λ = -2 a 2 + b 2 < 0 thì L yy
f
< 0, suy ra L2 laø max

b. Giaûi baèng phöông phaùp Euler – Lagrange :


Phiếm haøm toái öu laø : L = 4.x.y (**)
Ñieàu kieän raøng buoäc : f(x,y) = x2/a2 + y2/b2 -1 = 0
Haøm Hamilton laø : H(x,y,λ ) = 4xy + λ (x2/a2 + y2/b2 -1)
Tìm caùc ñieåm döøng döïa vaøo caùc ñieàu kieän sau:
Hλ = x2/a2 + y2/b2 -1 = 0 (4)
Hx = 4y + 2λx/a2 = 0 (5)
Hy = 4x+ 2λy/b2 = 0 (6)
Töø (5)  2y = -λ x/a2 (7)
Theá (7) vaøo (6) ta ñöôïc :
(6) ⇔ x(4 – λ2/a2b2) = 0 . Töø (4) vaø (5) suy ra x phaûi khaùc 0.
Neân (6) ⇔ λ = ± 2ab
Thay λ vaøo (7) ta ñöôïc :
• Tröôøng hôïp λ = 2ab : (7) ⇔ y = -bx/a
a b
Töø (4)  x2/a2 + x2/a2 = 1  x = ± y= m
2 2
• Tröôøng hôïp λ = -2ab : (7) ⇔ y = bx/a
a b
Töø (4)  x2/a2 + x2/a2 = 1  x = ± y=±
2 2

Trang 152
Chương 2: ðiều khiển tối ưu

a b a b a b
Vậy 4 ñieåm : A( , ), B( ,- ), C(- ,- ) vaø
2 2 2 2 2 2
a b
D(- , ) laø boán ñænh cuûa moät hình chöõ nhaät. Do tính chaát laëp laïi
2 2
a b
khi x chaïy heát hình elips, neân ta chæ choïn ñieåm A( , ) naèm goùc
2 2
phaàn tö thöù nhaát, vaø ta xeùt ñieåm cöïc trò taïi ñieåm naøy.

a b
D(- , ) a b
2 2 A( , )
2 2

a b
a b B( ,- )
C(- ,- ) 2 2
2 2

Theá toïa ñoä A vaøo phiếm haøm (**) ta coù : L = 2ab.


Kieåm tra taïi A, phiếm haøm ñaït cöïc trò.
Ta coù :
Hxx = 2λ/a2 ; Hyy = 2λ/b2 ; Hxy = Hyx = 4
 f x  2 x / a 2 
f = 2
 y  2 y / b 
⇒ L yy
f
= H yy − f yT f x−T H xy − H yx f x−1 f y + f yT f x−T H xx f x−1 f y
2λ 2y a2 a 2 2 y 2 y a 2 2λ a 2 2 y
= 2
−4 2 −4 + . . . .
b b 2x 2x b 2 b 2 2x a 2 2x b 2
2λ a2 x2 a2 x
= 2 (1 + 2 ) − 8
b b y2 b2 y
a b
Vôùi λ = -2ab, x= ,y= ta coù :
2 2
L yyf = −16a / b < 0. Vaäy L phaûi laø max.

Trang 153
Chương 2: ðiều khiển tối ưu

2.2 CÁC PHƯƠNG PHÁP ðIỀU KHIỂN TỐI ƯU


2.2.1 Phương pháp biến phân cổ ñiển Euler_Lagrange
1. Giới thiệu
Nhiệm vụ của ñiều khiển tối ưu là giải bài toán tìm cực trị của phiếm hàm
L[ x(t ), u (t )] bằng cách chọn tín hiệu ñiều khiển u(t) với những ñiều kiện
hạn chế của ñại lượng ñiều khiển và tọa ñộ pha. Một trong những công cụ
toán học ñể xác ñịnh cực trị là phương pháp biến phân cổ ñiển
Euler_Lagrange.
ðường cực trị là những hàm trơn còn phiếm hàm cùng các ñiều kiện hạn chế
là những hàm phi tuyến . Do ñó phương pháp này không thể áp dụng cho
những trường hợp mà tín hiệu ñiều khiển có thể là các hàm gián ñoạn .
Trường hợp không có ñiều kiện ràng buộc
Cho u(t) là hàm thuộc lớp hàm có ñạo hàm bậc nhất liên tục . Trong mặt
phẳng (u,t) cho hai ñiểm (t0,u0) và (t1,u1) . Cần tìm quỹ ñạo nối hai ñiểm này
sao cho tích phân theo quỹ ñạo u = u& (t ) cho bởi :
t1

J (u ) = ∫ L(u, u& , t )dt (2.38)


t0

có cực trị .
L là hàm có ñạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó .
ðể thống nhất , ở ñây ta lấy t0 = 0 và t1 = T .
Biến ñổi của J do δu tạo nên là :
∆J (u + δu ) = J (u + δu ) − J (u )
T T
= ∫ L(u + δu, u& + δu& , t )dt − ∫ L(u, u& , t )dt
0 0
T
= ∫ [ L(u + δu, u& + δu& , t ) − L(u, u& , t )]dt (2.39)
0
Phân tích (2.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J
ta ñược :
T
∂L(u, u&, t ) ∂L(u, u&, t )
∆J (u , δu ) = ∫ [( )δu + ( )δu& ]dt (2.40)
0
∂u ∂u&
vì δu và δu& liên hệ nhau bởi :
T
δu (t ) = ∫ δu& (t )dt + δu (0)
0

Xem δu là hàm biến ñổi ñộc lập , biểu thức (2.40) có thể biến ñổi ñể chỉ
chứa δu bằng cách lấy tích phân những thành phần chứa δu& :

Trang 154
Chương 2: ðiều khiển tối ưu

T
∂L(u , u&, t ) T ∂L(u, u& , t ) d ∂L(u, u& , t )
δJ (u, δu ) = δu 0 + ∫ [ − ]δudt... (2.41)
∂u& 0
∂u dt ∂u&

Từ ñiều kiện ñã cho δu(0) = δ(T) = 0 , phần ñầu của vế phải ở biểu thức
(2.41) bằng 0 .
Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị ñối với u*
thì :
∆J (u * , δu ) = 0 (2.42)
ðó là ñiều kiện cơ bản của phép tính biến phân .
Từ các biểu thức (2.41) , (2.42) ta có :
∂L(u * , u& * , t ) d ∂L(u * , u& * , t )
T
δJ (u , δu ) = ∫ [
*
− ]δudt = 0 (2.43)
0
∂u dt ∂u&
Từ ñó có thể rút ra phương trình Euler_Lagrange :
∂L(u, u&, t ) d ∂L(u, u& , t )
− =0 (2.44a)
∂u dt ∂u&
Hoặc có thể viết ñơn giản :
∂L d ∂L
− =0 (2.44b)
∂u dt ∂u&

Trường hợp có ñiều kiện ràng buộc


Nếu ngoài chỉ tiêu chất lượng (2.38) còn có các ñiều kiện ràng buộc dạng :
ϕ i (u, u&, t ) = 0 t ∈ [0, T ] , i = 1, n (2.45)
thì chỉ tiêu chất lượng J có dạng :
T n
J a (u, λi ) = ∫ [ L(u, u&, t ) + ∑ λi (t )ϕ i (u, u&, t )]dt (2.46)
0 i =1

mà λi(t) với i = 1,2,…,n là hàm Lagrange .Vì giới hạn thỏa mãn với mọi t
nên hàm Lagrange phụ thuộc thời gian .
Tương tự như trên ta có phương trình Euler_Lagrange tổng quát :
∂La (u, u& , λ , t ) d ∂La (u, u&, λ , t )
− =0 (2.47)
∂u dt ∂u&
n
mà La (u, u&, λ , t ) = L(u, u&, t ) + ∑ λi (t )ϕ i (u, u& , t ) (2.48)
i =1
Khi ñiều kiện ràng buộc có dạng :
T

∫ψ
0
i (u , u&, t )dt = qi (2.49)

Trang 155
Chương 2: ðiều khiển tối ưu

thì phương trình Euler_Lagrange tổng quát (2.47) có phiếm hàm :


n
La (u, u&, λ , t ) = L(u, u&, t ) + ∑ λiψ (u, u& , t ) (2.50)
i =1

Trong trường hợp này , λi là các hệ số không phụ thuộc thời gian .
Khi có ñiều kiện ràng buộc dạng (2.45) hoặc (2.49) phải giải (n+1) phương
trình ñể xác ñịnh y*(t) và λi*(t) với i=1,2,…,n .
Phương trình Euler_Lagrange với tín hiệu ñiều khiển bị hạn chế
Trong phần trên ta chỉ ñề cập tới bài toán mà trong ñó tín hiệu ñiều khiển
không có giới hạn nào ràng buộc . Trong thực tế , thường gặp tín hiệu ñiều
khiển có ràng buộc dạng u ≤ 1 .
ðiều kiện cần ñể có cực trị : khi u(t) là ñường cực trị thì u+δu và u-δu là
những hàm cho phép . Bây giờ ta so sánh trị số phiếm hàm ở ñường cực trị
với trị số của nó ở hàm u+δu và u-δu . Nếu miền biến ñổi của u(t) là kín và
u(t) ở ngoài biên thì một trong các hàm u+δu hoặc u-δu sẽ ra ngoài miền
cho phép .
Một trong các biện pháp khắc phục khó khăn trên là ñường cực trị ở biên và :
u ≥ ϕ (t ) (2.51)
Ví dụ , nếu u ≤ 1 , ñiều kiện u ≥ ϕ (t ) nghĩa là ϕ (t ) ≤ −1 . ðổi biến ta có :
z2 = u − ϕ (2.52)
thì biến mới z sẽ không có ñiều kiện hạn chế và biên giới của biến u tương
T
ñương với z = 0 . Bây giờ chỉ tiêu chất lượng J (u ) = ∫ L(u, u& , t )dt có biến
0

mới u = z2 + ϕ , từ ñó :
u& = 2 zz& + ϕ&
và chỉ tiêu chất lượng J có dạng :
T
J = ∫ L[ z 2 + ϕ ,2 zz& + ϕ& , t ]dt (2.53)
0
Vì không có ñiều kiện hạn chế nên phương trình Euler_Lagrange có dạng :
∂L d ∂L
− =0 (2.54)
∂z dt ∂z&
∂L ∂L ∂u ∂L ∂u& ∂L ∂L
Ở ñây = + = 2z + 2 z&
∂z ∂u ∂z ∂u& ∂z ∂u ∂u&
∂L ∂L ∂u ∂L ∂u& ∂L
= + = 2z
∂z& ∂u ∂z& ∂u& ∂z& ∂u&
d ∂L d ∂L ∂L
= 2z( )+ 2 z&
dt ∂z& dt ∂u& ∂u&

Trang 156
Chương 2: ðiều khiển tối ưu

và (2.54) sẽ có dạng :
∂L ∂L d ∂L ∂L
2z + 2 z& − 2 z − 2 z& = 0
∂u ∂u& dt ∂u& ∂u&
 ∂L d ∂L 
hay : 2 z − =0 (2.55)
 ∂u dt ∂u& 
Phương trình trên thỏa mãn với z = 0 , nghĩa là ñường cực trị có những giá
trị biên và phương trình Euler_Lagrange vẫn là phiếm hàm xuất phát :
∂L d ∂L
− =0
∂u dt ∂u&

2. Ví dụ
Ví dụ 2.11 :
du1
Tìm quá trình tối ưu x* = u&2 và u2* = ñể cực tiểu hóa chỉ tiêu chất lượng
dt
J:
T
J (u ) = ∫ (u&2 )2 dt (1)
0
với ñiều kiện ñầu :
T

∫ u (t )dt = θ
0
2 0 (2)

và ñiều kiện biên :


u2 (0) = u2 (T ) = 0 (3)
ðiều kiện ñầu có dạng :
T

∫ψ
0
i (u, u& , t )dt = qi (4)

Phương trình Euler_Lagrange có dạng tổng quát :


∂L d ∂L
− =0 (5)
∂u2 dt ∂u&2
với phiếm hàm :
L(u2 , u&2 , λ1 ) = u&22 + λ1u2 (6)
Từ 2 phương trình trên ta có :
λ1 − 2u&&2 = 0 (7)
Do ñó :
λ1
u&&2 = (8)
2

Trang 157
Chương 2: ðiều khiển tối ưu

Lấy tích phân , ta có :


λ1
u& 2 = x = t + c1
2
λ1
t 2 + c1t + c 2
u 2 (t ) = (9)
4
ðể xác ñịnh λ1 , c1 , c 2 ta dùng các ñiều kiện biên :
u 2 (0) = 0 ⇒ c 2 = 0
λ1
u 2 (T ) = T 2 + c1T = 0
4
và ñiều kiện ñầu :
T
λ1 c1 2
∫u
0
2
12
(t )dt = T3 +
2
T = θ0

Từ 2 phương trình trên ta xác ñịnh :


24θ 0
λ1 = − (10)
T3

c1 = 20 (11)
T
Từ ñó quá trình tối ưu là :
6θ0 12θ0
u&2∗ (t ) = x∗ (t ) =
− 3 t (12)
T2 T
6θ 6θ
u2∗ (t ) = 20 t − 30 t 2 (13)
T T
tương ứng với Hình 2.8(a) . ðiều khiển tối ưu x * (t ) biến ñổi tuyến tính còn
u2∗ là hàm parabol .
Ta thử so sánh tổn hao năng lượng của trường hợp này với trường hợp bài
toán tối ưu tác ñộng nhanh có ñặc tính thời gian như Hình 2.8(b) . Cả hai
trường hợp ñều có cùng giá trị θ0 , tương ứng với phần gạch sọc . Ta có thể
xác ñịnh ua theo (2) :
T /2
u T2
θ0 = 2 ∫ (ua .t )dt = a
0
4

ua = 20 (14)
T
Như vậy tổn hao năng lượng tương ứng với :
T
16θ 2
J a = ∫ ua2 dt = 30 (15)
0
T

Trang 158
Chương 2: ðiều khiển tối ưu

T
12θ 02
còn ở ví dụ ta ñang xét : J = ∫ ( x∗ ) 2 dt = (16)
0
T3
J a 16
Nghĩa là chúng khác nhau = = 1.33 lần .
J 12

Hình 2.8 : ðặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ
tác ñộng nhanh (b) .

Ví dụ 2.12 :
Xét bài toán tối ưu tác ñộng nhanh với ñiều kiện ñầu :
T

∫ u dt = θ
0
2 0 (1)

∫ (u& )
2
2 dt = q0 (2)
0
ðiều kiện biên :
u2 (0) = u2 (T ) = 0 (3)
Với bài toán tác ñộng nhanh , từ (2.49) và (2.50) ta có thể viết :
L(u2 , u2 , λ1 , λ2 ) = 1 + λ1u2 + λ2 (u&2 ) 2 (4)
Phương trình Euler_Lagrange :
∂L d ∂L
− =0 (5)
∂u2 dt ∂u&2
⇒ λ1 − 2λ2u&&2 = 0 (6)

Trang 159
Chương 2: ðiều khiển tối ưu

λ1
⇒ u&&2 = (7)
2λ2
Lấy tích phân biểu thức trên ta ñược :
λ1
u&2 (t ) = x(t ) = t + c1 (8)
2λ2
λ1 2
u2 (t ) = t + c1t + c2 (9)
4λ2
λ1
Kết hợp (9) với ñiều kiện u2 (0) = 0 suy ra : c2 = 0 và c1 = − T .
4λ2
2θ0 λ1
Và ñiều kiện u2 (T ) = 0 ta có : c1 = − T
T 2 6λ2
λ1 24θ
⇒ = − 30 (10)
λ2 T

⇒ c1 = 20 (11)
T
Thế vào (8) , (9) ñược :
6θ0 12θ0
u&2∗ (t ) = x∗ (t ) = − 3 t (12)
T2 T
6θ 6θ
u2∗ (t ) = 20 t − 30 t 2 (13)
T T
So sánh với ví dụ trước , ta thấy quá trình tối ưu là hoàn toàn giống nhau.
Ví dụ 2.13:
Xét ñối tượng có mô hình toán học gần ñúng như sau :
x& i = f i ( x, δ i (t )) + g k ( x )u * i = 1, n; k ∈ [1, n] (1)
Trong ñó x = ( x1 , x 2 ,..., x n ) – vector trạng thái ; g k ( x ) - hàm phi tuyến
T

tường minh ; f i ( x, δ i (t )) - hàm phi tuyến không tường minh ; δ i (t ) - các


nhiễu ngẫu nhiên ; u - tín hiệu ñiều khiển .
Chọn hàm chỉ tiêu chất lượng có dạng :

[ 2 & ( x )2 dt
J = ∫ Ψ (x ) + Ψ ] → Min (2)
0

∂J d  ∂J 
Giả thuyết Euler-Lagrange: −  =0
∂Ψ dt  ∂ψ& 
=> Ψ − Ψ && = 0 => Ψ ( s )(1 − s 2 ) = 0 => Ψ ( s )(1 − s )(1 + s ) = 0
ðiều kiện cực tiểu : Ψ ( s )(1 + s ) = 0

Trang 160
Chương 2: ðiều khiển tối ưu

Trong ñó Ψ là hàm số khả vi hoặc tuyến tính từng ñoạn và Ψ (0) = 0 . Hàm
Ψ ñược lựa chọn dựa trên các yêu cầu về ñộng học của hệ thống . Luật ñiều
khiển u ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J có thể ñược xác ñịnh
bằng cách giải phương trình Euler :
Ψ+Ψ & =0 (3)
ðạo hàm của hàm số Ψ có dạng :
n n
dΨ ∂Ψ ∂Ψ &
=∑ x& i + ∑ δi (4)
dt i =1 dxi i =1 dδ i

Kết hợp (4) và (1) ta có :


n n
dΨ ∂Ψ
=∑ ( f i (x, δ i ) + g k (x )u ) + ∑ ∂Ψ δ&i
dt i =1 dxi i =1 dδ i
n n (5)
∂Ψ ∂Ψ ∂Ψ &
=∑ f i ( x, δ i ) + g k ( x )u + ∑ δi
i =1 dx i dxi i =1 dδ i
i≠k

Giải phương trình (3) kết hợp với (5) , xác ñịnh luật ñiều u * khiển ñảm bảo
cực tiểu hoá hàm mục tiêu J và ñịnh hướng ñộng học hệ thống chuyển
ñộng theo xu hướng lim Ψ ( x ) → 0 :
t →∞

−1  
1  ∂Ψ   n n
∂Ψ & 
 Ψ + ∑ f i ( x, δ i ) + ∑
*
u =−  δi (6)
g k ( x )  ∂xi   i =1 i =1 ∂δ i

 i≠k 
∂Ψ
Lưu ý rằng luật ñiều khiển u * chỉ có nghĩa khi: g k ( x ) ≠ 0 và ≠0 .
∂x k
Phương trình ñồng trạng thái (costate epuation):
Giả sử một hệ thống phi tuyến ñược mô tả bởi phương trình biến trạng thái:
x& (t ) = f ( x, u , t ) với t ≥ t 0 và t0 cố ñịnh
Với biến trạng thái x(t ) ∈ R n , luật ñiều khiển u (t ) ∈ R m và hàm chỉ tiêu chất
lượng J, x(t ) ∈ R n
T
J = Φ ( x(T ), T ) + ∫ L( x(t ), u (t ), t )dt
t0

ðiều khiển tối ưu là tìm ra tìm ra luật ñiều khiển u*(t) trong khoảng thời
gian xác ñịnh [t0,T] ñể J ñạt cực tiểu. Với hàm trạng thái cuối là:
Ψ ( x(T ), T ) = 0 Với Ψ ∈ R p (*)
T
x = r r& θ θ& 

Trang 161
Chương 2: ðiều khiển tối ưu

T
 µ 
Vậy hàm trạng thái cuối là: Ψ ( x(T ), T ) = r&(T ) − R r&(T ) θ&(T ) − 
 R3 
Với r là bán kính, θ là vị trí góc, R: là bán kính của quỹ ñạo tròn.
Với µ = GM ,G: hằng số gia tốc trọng trường tác ñộng lên vật khối lượng M.
Kết hợp hai ñiều kiện ràng buộc x& (t ) = f ( x, u , t ) và (*) ñể thêm vào chỉ tiêu
chất luợng J. Do phương trình biến trạng thái xét trong khỏang t ∈ [ t0 ,T ] ,
ñòi hỏi thừa số Lagrange λ (t ) ∈ R n là hàm thời gian. Và do (*) xét tại 1 thời
ñiểm, ta cần ñưa ra hệ số nhân kết hợp ν ∈ R p . Chỉ tiêu chất lượng ñược
thêm vào là:
T
J ' = Φ( x(T ), T ) + ν Tψ ( x (T ), T ) + ∫ [L ( x , u, t ) + λ T (t )( f (t )( x, u, t ) − x& )]dt
t0

Hàm Hamilton ñược xác ñịnh: H ( x, u , t ) = L( x, u, t ) + λT f ( x, u, t )


Viết lại hàm trên:
T
J ' = Φ( x(T ), T ) + ν Tψ ( x (T ), T ) + ∫ [H ( x(t ), u(t ), t ) − λ T x& ]dt
t0

Sự tăng lên của J’ là hàm của sự tăng thêm x, λ , ν , u, t sử dụng luật


Leibniz, ta có:
dJ ' = (Φ x +ψ xTν )T dx |T +(Φ t +ψ tTν )dt |T +ψ T |T dν
+(H − λ T x& )dt |T −(H − λ T x& )dt |t0
T
+ ∫ [H xT δ x + HuT δ u − λ T δ x& + (Hλ − x& )T δλ ]dt
t0
T T
Mà: & = −λ T δ x |T +λ T δ x |t0 + ∫ λ&T δ xdt
− ∫ λ T δ xdt (a)
t0 t0

Theo ñịnh nghĩa: dx (T ) = δ x (T ) + x& (T )dT , với dT là nhỏ (b)


Thế (a), (b) vào biểu thức dJ’, ta ñược:
dJ ' = (Φx +ψ xTν − λ )T dx |T +(Φt +ψ tTν + H − λ T x& + λ T x& )dt |T +ψ T |T dν
−(H − λ T x& + λ T x& )dt |t +λ T dx)dt |t (**)
0 0

T
+∫ [(Hx + λ&)T δ x + HuTδ u − λTδ x& + (Hλ − x& )T δλ ]dt
t0

( δ x: biến thiên của x)

Trang 162
Chương 2: ðiều khiển tối ưu

ðể hàm chỉ tiêu chất lượng J’ ñạt giá trị nhỏ nhất thì dJ’=0, cho tất cả các hệ
số dν , δ x, δ u và δλ trong biểu thức (**) bằng 0.

Trình töï thieát keá boä ñieàu khieån toái öu


Với hệ thống có dạng: x& (t ) = f ( x, u , t ) với t ≥ t 0 và t0 cố ñịnh
T
Hàm chỉ tiêu chất lượng: J = Φ ( x(T ), T ) + ∫ L( x(t ), u (t ), t )dt
t0

Hàm ràng buộc trạng thái cuối: ψ ( x(T ), T ) = 0


Hàm Hamilton: H ( x, u , t ) = L( x, u, t ) + λT f ( x, u, t )
∂H
Phương trình trạng thái: x& = = f ( x, u , t ) với t ≥ t 0
∂λ
∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ& = = + λ với t ≤ T
∂x ∂x ∂x
∂H ∂L ∂f T
ðiều kiện xác lập: 0 = = + λ
∂u ∂u ∂u
ðiều kiện biên:
Với ñiều kiện ñầu x(t0) thì ñiều kiện cuối thỏa mãn phương trình sau:
(φ x + ψ xTν − λ ) T T dx(T ) + (φt + ψ tTν + H ) T dT = 0 trong ñóν ∈ R p
Trong vài trường hợp thời gian cuối T cố ñịnh, thì dT=0 khi ñó phương trình
∂φ
trên trở thành: λ (T ) = T
∂x

Ví dụ 2.14 :
Xác ñịnh ñiều khiển tối ưu bằng phương pháp tính gần ñúng.
Cho hệ phi tuyến sau: x& = − x 3 + u
1
Với ñiều kiện x(0) =
2
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
a. Viết phương trình trạng thái và ñồng trạng thái, ñiều kiện xác lập, ñiều
kiện biên. Khử u(t) từ phương trình trạng thái và ñồng trạng thái.
b. Chứng minh rằng nếu x(t) có giá trị nhỏ trong ñoạn [0,2] thì gía trị gần
ñúng của nghiệm phương trình ñồng trạng thái là: λ = x − x 3 .
c. Với giá trị vừa tính ñược ở trên, tính biến trạng thái x(t).
d. Tìm hàm ñiều khiển tối ưu gần ñúng.

Trang 163
Chương 2: ðiều khiển tối ưu

Chú ý: ðể tính giá trị gần ñúng ở câu c thì giá trị x(t) phải nhỏ.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Xét hệ phi tuyến: x& = − x 3 + u
2
1 2 1
Hàm chỉ tiêu chất lượng dạng toàn phương: J = x (2) + ∫ ( x 2 + u 2 )dt
2 20
Lập hàm Hamilton:
1
H ( x, u, t ) = L( x, u, t ) + λT f ( x, u , t ) = ( x 2 + u 2 ) + λT (− x 3 + u )
2
∂H
Phương trình biến trạng thái: x& = = −x3 + u (1)
∂λ
& ∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ = = + λ = x − 3x 2 λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = =u+λ (3)
∂u
ðiều kiện biên:
1
+ ðiều kiện ñầu x(0) =
2
+ ðiều kiện cuối thỏa mãn
1
[ x(T ) − λ ]T T dx(T ) + [ ( x 2 + u 2 ) + λT (− x 3 + u )] T dT = 0
2
Thời gian cuối T=2 nên dT = 0 suy ra: x(2) − λ (2) = 0 ⇔ x(2) = λ (2)
Từ phương trình (3) ta có u = −λ , thay vào phương trình (1) ta ñược
phương trình biến trạng thái: x& = − x 3 − λ
.
Từ (2) ta có phương trình ñồng trạng thái: − λ = x − 3x 2 λ

 x& = − x 3 − λ
b. Từ hệ phương trình 
− λ& = x − 3x 2 λ
λ = − x& − x
3

Ta có  ⇔ ∫ λ&dt = ∫ (−3 x 5 − x)dt − ∫ 3 x 2 x&dt


&
− λ = x − 3 x (− x& − x )
2 3

⇔ λ = ∫ (−3 x 5 − x)dt − x 3
Triển khai Maclorank biểu thức 3 x 5 + x tại ñiểm x(t) nhỏ lân cận ñiểm 0:
∫ (−3x − x)dt ≈ x .
5

Với những giá trị của x(t) nhỏ trong khoảng thời gian [0,2] nên: λ = x − x 3

Trang 164
Chương 2: ðiều khiển tối ưu

c. Với λ = x − x 3 thay vào phương trình (1): x& = − x 3 − ( x − x 3 ) = − x


1 1
x(t ) = Ce − t với ñiều kiện x(0)=1/2 ta có: x(0) = Ce 0 = ⇔ C =
1 2 2
Vậy x(t ) = e −t
2
d. Với x(t) nhỏ ta có λ = x − x 3
1 −t 1 −3t
Theo kết quả câu trên: λ (t ) = x(t ) − x 3 (t ) ⇔ λ (t ) = e − e
2 8
1 1
Và: u (t ) = −λ (t ) = e −3t − e −t
8 2

Ví dụ 2.15:
Cho hệ thống giảm xóc của ô tô có phương trình tóan học:
m&y& + ky = u
trạng thái ñaàu y(0)=0, y& (0) = 0 tới trạng thái cuối y(T)=h, y& (T ) = 0 . Với
T
1
hàm chỉ tiêu chất lượng J = ∫ u 2 dt .
20
Trong ñó:
m- khối lượng, k- hệ số ñàn hồi, u- lực tác dụng theo hướng lên trên
y- lượng dịch chuyển theo phương ñứng
a. Viết phương trình biến trạng thái với : x = [ y y& ]
T

b. Viết phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên.
Khử u(t) từ phương trình trạng thái và phương trình ñồng trạng thái.
c. Tìm nghiệm phương trình ñồng trạng thái khi biết giá trị λ(T). Tìm biến
trạng thái x(t) khi biết λ(0) và biết x(0).
d. Sử dụng ñiều kiện biên ñể tìm λ(0) với m=k=1; T=2; h= - 3
e. Tìm luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu.
f. Chứng tỏ rằng x * (T ) = [h 0] thỏa mãn yêu cầu.
T

Giải:
a. Heä phöông trình traïng thaùi:
 x&1 = x 2
 x1 = y 
ðặt:  → k 1
 x 2 = y&  x& 2 = − m x1 + m u

 x&1   0 1  x1   0 
Phương trình trạng thái của hệ thống:   =  k   +  1  u
&
x
 2  m − 0   x 2   m 

Trang 165
Chương 2: ðiều khiển tối ưu

b. Phương trình ñồng trạng thái, ñiều kiện xác lập và ñiều kiện biên:
u2
Lập hàm Hamilton: H = + λT ( Ax + Bu )
2
∂H
Phương trình biến trạng thái: x& = = Ax + Bu (1)
∂λ
∂H ∂L ∂f T
Phương trình ñồng trạng thái: − λ& = = + λ = AT λ (2)
∂x ∂x ∂x
∂H
ðiều kiện dừng: 0 = = u + BT λ (3)
∂u
ðiều kiện biên: ñiều kiện ñầu x(0) = y (0) = 0 , ñiều kiện cuối λ (T ) = 0
Từ phương trình (3): u = − B T λ , thay vào biểu thức (1) và (2) ta ñược:
x& = Ax − B T Bλ .
Từ phương trình (2): − λ& = AT λ

c. Nghiệm phương trình ñồng trạng thái:


Từ phương trình : − λ& = Aλ ta có λ (t ) = e A(T −t ) λ (T )
Thay vào phương trình trạng thái ta ñược:
x& = Ax − B T Bλ = Ax − B T Be A(T −t ) λ (T )
x(0) B T B AT 1 1
Biến ñổi Laplace: X ( s) = − e (− + )
s+ A A 2( s + A) 2( s − A)
BT B
Biến ñổi ngược Laplace: x(t ) = e − AT
x(0) − λ (T )e AT sinh( At )
A
e At − e − At
Trong ñó sinh( At ) =
2
BT B
x(T ) = −
2A
[
λ (T ) e 2 AT − 1 ] (4)

d. Tìm λ(0):
Từ phương trình (4) và ñiều kiện bài toán ta có
BT B
x(T ) = −
2A
[ ]
λ (T ) e 2 AT − 1 = h = −3
6A
⇔ λ (T ) = T
B B(e 2 AT − 1)
3 Ae − At 3A
*
⇒ λ (t ) = T ⇒ λ (0) = T (5)
B B sinh( AT ) B B sinh(2 A)

Trang 166
Chương 2: ðiều khiển tối ưu

 0 1 0 
Trong ñó: A =   ,B =  
− 1 0 1

e. Luật ñiều khiển tối ưu và quỹ ñạo trạng thái tối ưu:
Từ (5) suy ra luật ñiều khiển tối ưu:
3 Ae − At − 3 Ae − At
u * (t ) = − B T λ* (t ) = − B T T =
B B sinh( AT ) B sinh( AT )
Quỹ ñạo trạng thái tối ưu
BT B BT B.3Ae− At 3e− At e AT sinh(At)
x* (t ) = − λ * (t)e AT sinh(At) = − T e AT sinh(At) = −
A B B.Asinh(AT) sinh(AT)
(6)
f. Chứng minh x (T ) = [h 0] thỏa yêu cầu:
* T

3e − AT e AT sinh( AT )
Từ (6) → x * (T ) = − = −3
sinh( AT )
Vậy x * (T ) = [− 3 0]
T

Ví dụ 2.16 :
Cho hệ thống rôøi raïc: x k +1 = x k u k + 1
1 N −1 2
Hàm chỉ tiêu chất lượng: J = ∑ u k , N=2, x2=0
2 k =0
a. Viết lại phương trình trạng thái và phương trình ñồng trạng thái bằng
phương pháp khử uk.
b. Giả sử cho λ2 , tìm λ0 , λ1 theo λ2 và các biến trạng thái. Sử dụng biểu
thức này ñể biểu diễn x2 theo λ2 và x0 . Từ ñó tìm một phương trình bậc
4, ẩn λ2 , theo trạng thái x0.
c. Nếu x0 = 1, biến trạng thái & luật ñiều khiển tối ưu và chỉ tiêu chất lượng
tối ưu.
Giải:
a. Phương trình trạng thái và phương trình ñồng trạng thái:
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k ) (1)
u k2
H k ( xk , u k ) =
+ ( x k u k + 1)λTk +1 (2)
2
∂H k
Phương trình trạng thái: x k +1 = = xk u k + 1 (3)
∂λ k +1

Trang 167
Chương 2: ðiều khiển tối ưu

∂H k
Phương trình thừa số Lagrange: λ k = = u k λTk +1 (4)
∂x k
∂H k
ðiều kiện tĩnh: 0 = = u k + x k λTk +1 (5)
∂u k
Từ (5) ta suy ra uk : u k = − x k λTk +1
Thế uk vào (3) và (4), ta ñược phương trình trạng thái và thừa số Lagrange
không phụ thuộc uk như sau:
λk = − x k λ2k +1 và x k +1 = − x k2 λ k +1 + 1

b. Tìm phương trình bậc 4, ẩn λ2 , theo trạng thái x0.


Theo kết quả trên: λ k = − x k λ2k +1 và x k +1 = − x k2 λ k +1 + 1
Theo công thức quy nạp: λ0 = − x0 λ12 , λ1 = − x1λ22 , x 2 = − x12 λ 2 + 1
Với ñiều kiện x2 =0 thì: x 2 = − x12 λ 2 + 1 = 0 ⇒ x1 = ± 1
λ2

Thế x1 vừa tìm ñược vào λ1 = − x1λ22 ta suy ra: λ1 = m λ2 λ2


 x1 = − x 02 λ1 + 1
Ta có hệ phương trình:  2
(6)
 x 2 = − x1 λ2 + 1
 x = ± x 02 λ 2 λ 2 + 1
Thế λ1 và x1 vào (6):  1 2
 x 2 = − x1 λ 2 + 1
Vậy x2 biểu diễn theo λ2 và x0 là:

x 2 = − x04 λ42 − 2 x 02 λ22 λ2 − λ2 + 1 với x1 = x 02 λ2 λ2 + 1


x 2 = − x04 λ42 + 2 x02 λ22 λ2 − λ2 + 1 với x1 = − x02 λ2 λ2 + 1

Cho x2 = 0, ta ñược phương trình bậc bốn, ẩn λ2 theo x0

x04 λ42 + 2 x02 λ22 λ2 + λ2 − 1 = 0 với x1 = x02 λ2 λ2 + 1 (Trường hợp 1)


x04 λ42 − 2 x02 λ22 λ2 + λ2 − 1 = 0 với x1 = − x02 λ2 λ2 + 1 (Trường hợp 2)

c. Tìm biến trạng thái, luật ñiều khiển tối ưu, và chỉ tiêu chất lượng tối ưu
Trường hợp 1:
Với ñiều kiện x0 = 1,Ta ñược phương trình sau: λ42 + 2λ22 λ2 + λ2 − 1 = 0
Giải phương trình ñược các nghiệm như sau:
λ2 _ 1 = 0.5249 λ2 _ 2 = 1.49

Trang 168
Chương 2: ðiều khiển tối ưu

λ2 _ 3 = −0.3439 + 1.3584i λ2 _ 6 = 0.3438 − 0.6253i


λ2 _ 4 = −0.3439 − 1.3584i λ2 _ 7 = −1.0076 + 0.513i
λ2 _ 5 = 0.3438 + 0.6253i λ2 _ 8 = −1.0076 − 0.513i
Từ tập nghiệm của λ2 ta chọn ñược λ2 tối ưu là λ2 = 0.5249
Kết hợp λ2 = 0.5249 , x0 = 1 và N = 2
Ta có ñược daõy thừa số Lagrange như sau:
λ1 = −λ2 λ2 ⇒ λ1 = −0.38
λ0 = − x0 λ12 ⇒ λ0 = −0.1444
Trạng thái x1:
x1 = − x02 λ1 + 1 = 1.38
u k = − x k λTk +1 Do λTk +1 là ñại lương vô hướng nên λTk +1 = λ k +1
u 0 = − x0 λ1 = 0.38
u1 = − x1λ2 = −0.724
1 N −1 2
Chỉ tiêu chất lượng J của hệ thống: J 1 = ∑ u k = u 02 + u12 = 0.3343
2 k =0
Trường hợp 2:
Với ñiều kiện x0 = 1, ta ñược phương trình sau: λ42 − 2λ22 λ2 + λ2 − 1 = 0
Giải phương trình ñược các nghiệm như sau:
λ2 _ 1 = 0.5249 λ2 _ 5 = 0.3438 + 0.6253i
λ2 _ 2 = 1.49 λ2 _ 6 = 0.3438 − 0.6253i
λ2 _ 3 = −0.3439 + 1.3584i λ2 _ 7 = −1.0076 + 0.513i
λ2 _ 4 = −0.3439 − 1.3584i λ2 _ 8 = −1.0076 − 0.513i
Từ tập nghiệm của λ2 ta chọn ñược λ2 tối ưu là λ2 = 0.5249
Kết hợp λ2 = 0.5249 , x0 = 1 và N = 2
Ta có ñược daõy thừa số Lagrange như sau:
λ1 = λ2 λ2 ⇒ λ1 = 0.38
λ0 = − x0 λ12 ⇒ λ0 = −0.1444
Trạng thái x1:
x1 = − x02 λ1 + 1 = 0.62
u k = − x k λTk +1 Do λTk +1 là ñại lương vô hướng nên λTk +1 = λ k +1
u 0 = − x0 λ1 = −0.38

Trang 169
Chương 2: ðiều khiển tối ưu

u1 = − x1λ2 = −0.325
1 N −1 2
Chỉ tiêu chất lượng J của hệ thống: J 2 = ∑ u k = u 02 + u12 = 0.125
2 k =0
So sánh 2 trường hợp theo chỉ tiêu chất lượng tối ưu J * của hệ thống
ta chọn trường hợp 2.
Kết luận
Trạng thái tối ưu: ⇔ x1 = 0.62
λ = −0.1444
Thừa số Lagrange tối ưu: ⇔  0
 λ1 = 0.38
 u 0 = − x0 λ1 = −0.38
Giá trị luật ñiều khiển tối ưu: ⇔ 
u1 = − x1λ2 = −0.325
Chỉ tiêu chất lượng tối ưu J* của hệ thống: ⇔ J * = u 02 + u12 = 0.125

Ví dụ 2.17 :
Cho hệ thống có phương trình rời rạc như sau: x k +1 = ax k + bu k
trong ñó xk , uk là các ñại lượng vô hướng và hàm chỉ tiêu chất lượng :
1 1 N −1
J = S N xN3 + ∑ (qxk3 + ruk3 )
3 3 k =0
a. Viết phương trình trạng thái của hệ thống, phương trình ñồng trạng thái
và biểu thức ñiều kiện dừng.
b. Khi nào ta có thể giải ñược uk? Với ñiều kiện ñó viết lại công thức trạng
thái hệ thống không có uk.
c. Giải bài toán ñiều khiển vòng hở ( với xN cố ñịnh, SN =0 và q=0).
Giải:
a. Phương trình trạng thái, ñồng trạng thái và biểu thức ñiều kiện dừng.
Lập hàm Hamilton: H k ( x k , u k ) = Lk ( x k , u k ) + λTk +1 f k ( x k , u k )
1
= (qx k3 + ru k3 ) + λ k +1 (ax k + bu k ) (1)
3
∂H k
Phương trình trạng thái của hệ thống: x k +1 = = ax k + bu k (2)
∂λ k +1
∂H k
Phương trình ñồng trạng thái: λ k = = qx k2 + λ k +1 a (3)
∂x k
∂H k
ðiều kiện dừng: 0 = = ru k2 + bλ k +1 (4)
∂u k

Trang 170
Chương 2: ðiều khiển tối ưu

bλ k +1
⇒ u k2 = − (5)
r
∂φ ∂H i T
ðiều kiện biên: ( − λ N ) T dx N = 0 và ( ) dxi = 0
∂x N ∂xi

b. Viết lại công thức trạng thái hệ thống không có uk.



Từ phương trình (5) ta rút ra: u k = ± − k +1 (6)
r
ðiều kiện ñể giải ñược uk là biểu thức trong căn dương. Nếu trọng số
ñiều khiển r dương thì b và λ k +1 phải trái dấu.
Với ñiều kiện ñó ta có biểu thức trạng thái hệ thống không có uk:

x k +1 = ax k + b(± − k +1 ) (7)
r

c. Giải bài toán ñiều khiển vòng hở


Từ công thức (6) ta chỉ cần tìm ñược λ k +1 thì ta có thể xác ñịnh luật ñiều
khiển tối ưu.
ðể xác ñịnh λ k +1 ta tiến hành các bứơc sau:
bλk +1 bλ
Xét trường hợp u k = − , ta có: x k +1 = ax k + b(± − k +1 )
r r
−b 1 2
ðặt M = b suy ra x k +1 = ax k + Mλk +1 (8)
r
1 N −1 3
Và J = ∑ ruk
3 k =0
Phương trình (3) ñược viết lại: λk = λk +1 a (9)
N −k
Từ (9) có thể viết lại theo λ N : λ k = a λN (10)
Ta xác ñịnh λ N thông qua biểu thức quan hệ giữa λ N và x N . Thế (10)
1 2
vào (8) ta ñược biểu thức : x k +1 = ax k + Ma ( N − k −1)1 2 λ N
3
− k
2 1− a
2
1 2
Viết lại biểu thức trên: x k = a k x 0 + Mλ N a ( N + 2 k −3)1 3
(11)

1− a 2

ðể xác ñịnh ñược λ N ta dựa vào ñiều kiện biên.

Trang 171
Chương 2: ðiều khiển tối ưu

Xét ñiều kiện biên: vì trạng thái ñầu x 0 cố ñịnh nên dx 0 = 0 suy ra
∂H i T
thoả ñiều kiện ( ) dxi = 0 . ðồng thời trạng thái cuối x N = rN cũng
∂xi
∂φ
cố ñịnh nên dx N = 0 suy ra thoả ( − λ N ) T dx N = 0 .
∂x N
Phương trình (11) có thể ñược viết lại khi thay k = N:
3
− N
1 2 1− a 2
x N = a N x0 + Mλ N a (3 N −3)1 2
3
(12)

1− a 2

1 2
Có thể viết lại: x N = a x 0 + Vλ NN
(13)
3
− N
2 1− a
2
Với: V = Ma (3 N −3)1 3
(14)

1− a 2

rN − a N x0 2
Thay x N = rN vào (13) ta ñược: λ N = ( ) luôn dương (15)
V
Suy ra b phải âm theo ñiều kiện có nghĩa của u k .
rN − a N x0 2
Từ công thức (15) và (10) xác ñịnh ñược λ k : λ k = a N −k ( ) (16)
V
Từ ñó xác ñịnh u k : u k∗ = −
bλk +1 rN − a N x0 ba N −k −1 (17)
= −
r V r

Với u k khi k chạy từ 0 ñến N-1, sẽ lái hệ thống từ ñiểm ñầu x 0 ñến
ñiểm cuối x N = rN sao cho hàm chỉ tiêu chất lượng ñạt giá trị tối thiểu.

(17) có thể viết lại: u k∗ =


(r
− a N x0 ) a N −k −1 1 − a −3 / 2
N
(18)
− ba −3 / 2 1 − a 3N / 2

Vậy trong trường hợp trạng thái cuối cố ñịnh thì u k ñộc lập với trọng số

ñiều khiển r. u k còn gọi là ñiều khiển vòng hở. Nó chỉ phụ thuộc vào
ñiều kiện ñầu và ñiều kiện cuối mà không phụ thuộc vào trạng thái trung
gian x k .
Tiếp theo ta xác ñịnh trạng thái tối ưu x k* và J 0* với ảnh hưởng u k .

* * * (rN − a N x0 ) a N −k −1 1 − a −3
*
2
x k +1 = ax + bu = ax + ( ) (19)
− a −3 2 1 − a 3N 2
k k k

Trang 172
Chương 2: ðiều khiển tối ưu

Viết lại (19): x k*+1 = ax k* + D a N −k −1 (20)


−3 2
(rN − a x0 ) 1 − a
N
Với : D = ( )
− a −3 2 1 − a 3N 2

3
− k
1− a 2
Suy ra: x k* = a k x 0 + Da ( N + 2 k −3)1 2 ( 3
) (21)

1− a 2

*
Vậy x là sự kết hợp tuyến tính biến ñổi theo thời gian của x 0 và rN .
k

Hàm chỉ tiêu chất lượng của hệ thống ứng với u k :
3N

1 N −1 3 1 r (rN − a N x0 ) 3 (−b) 3 / 2 ( N −1)3 / 2 1 − a 2
J 0* = ∑ ru k* = a
3 k =0 3 V3 r 3/ 2 −
3
1− a 2

2.2.2 Phương pháp quy hoạch ñộng Bellman


1. Giới thiệu
Phương pháp quy hoạch ñộng ñược dựa trên nguyên lý tối ưu sơ khai của
Bellman :
Một chiến lược tối ưu có tính chất không phụ thuộc vào những quyết ñịnh
trước ñó ( ví dụ như những luật ñiều khiển ) song các quyết ñịnh còn lại
phải cấu thành nên chiến lược tối ưu có liên quan với kết quả của những
quyết ñịnh truớc ñó .
Nguyên lý tối ưu của Bellman : “ Bất kỳ một ñoạn cuối cùng nào của quỹ
ñạo tối ưu cũng là một quỹ ñạo tối ưu ” .
Nguyên lý này giới hạn xem xét trên một số các chỉ tiêu tối ưu . Nó chỉ ra
rằng phương án tối ưu phải ñược xác ñịnh từ trạng thái cuối ñi ngược về
trước ñó .
ðiều kiện áp dụng : nguyên lý tối ưu Bellman là một phương pháp số , chỉ
áp dụng ñược khi hệ thống có phân cấp ñiều khiển và ta biết trước sơ ñồ
mắt lưới ñược xây dựng bằng thực nghiệm .
Ví dụ ñơn giản sau sẽ chỉ ra những vấn ñề mấu chốt của phương pháp này.
Bài toán ñường bay của máy bay
Một máy bay bay theo hướng từ trái sang phải qua các ñiểm a, b, c… tượng
trưng cho các thành phố với mức nhiên liệu cần thiết ñể hoàn tất mỗi chặng
ñường ñược liệt kê ở hình 2.9. Chúng ta sẽ dùng nguyên lý tối ưu của
Bellman ñể giải bài toán cực tiểu hóa nhiên liệu tiêu hao .

Trang 173
Chương 2: ðiều khiển tối ưu

Giải:

-1

Hình 2.9 : Luật ñiều khiển năng lượng tiêu hao tối thiểu .

Liệt kê các trạng thái k từ 0 ñến 4 trong quá trình ra quyết ñịnh như
Hình 2.9 (ñầu mũi tên và con số trong khung bước ñầu có thể chưa cần
quan tâm). Tại mỗi giá trị k = 0,1,....N − 1 phải có một quyết ñịnh , và
N là trạng thái cuối .
Số hàng: n = 2
Số cột : m = 2

Trang 174
Chương 2: ðiều khiển tối ưu

Vậy số cấp: N = n + m = 2 + 2 =4
ði từ cấp 0 ñến cấp 4, tại các nút ta xét chi phí tiêu hao (CPTH) là nhỏ
nhất (theo nguyên lý tối ưu của Bellman):
• Cấp 0 (k=N=4):
 Nút i: CPTH = 0, do mới bắt ñầu ñi.
• Cấp 1 (k=3):
 Nút f: CPTH = 4 + 0 = 4, 4 : giá trị tiêu hao khi ñi từ i ñến f
 Nút h: CPTH = 2 + 0 = 2
• Cấp 2 (k=2):
 Nút c: CPTH = 3 + 4 = 7
 Nút e: CPTH = 4 + 3 = 7, từ f ñến e
CPTH = 2 + 2 = 4, từ h ñến e
Do chi phí tiêu là nhỏ nhất nên: CPTH = 4, từ h ñến e
 Nút g: CPTH = 2 + 4 = 6, từ h ñến g
• Cấp 3 (k=1):
 Nút b: CPTH = 7 + 2 = 9, từ c ñến b
CPTH = 4 + 1 = 5, từ e ñến b
Do chi phí tiêu là nhỏ nhất nên: CPTH = 5, từ e ñến b
 Nút d: CPTH = 4 + 3 = 7, từ e ñến d
CPTH = 6 + 2 = 8, từ g ñến d
Do chi phí tiêu là nhỏ nhất nên: CPTH = 7, từ h ñến e
• Cấp 4 (k=0):
 Nút a: CPTH = 5 + 3 = 8, từ b ñến a
CPTH = 7 + 1 = 8, từ d ñến a
Do chi phí tiêu bằng nhau trên 2 quãng ñường nên: CPTH =
8, từ b ñến a hay từ d ñến a

Như vậy bằng cách lần lượt giảm k từ N ñến 0, kết quả CPTH ñã tính tại các
cấp ñược biểu diễn như Hình 2.9.
Chú ý rằng khi k = 0, luật ñiều khiển có thể là u0 = 1 hoặc u0 = −1 cùng cho
chi phí là 8 ; luật ñiều khiển khi k = 0 là duy nhất .
Vậy có hai ñường ñi từ a ñến i với cùng một chi phí là 8 :
a → b → e → h → i ( ñường nét ñậm ) và a → d → e → h → i ( ñường nét
ñứt ) . Hiển nhiên giải pháp tối ưu trong quy hoạch ñộng là không duy nhất .
Cuối cùng chúng ta chỉ ra rằng nguyên lý tối ưu của Bellman giúp giảm số
lượng phép tính toán cần thiết bằng cách giảm số lượng các lựa chọn có thể
thực hiện .

Trang 175
Chương 2: ðiều khiển tối ưu

2. Hệ rời rạc
Phương pháp quy hoạch ñộng cũng có thể dễ dàng áp dụng cho hệ phi tuyến
Ngoài ra , nếu có càng nhiều ñiều kiện ràng buộc ñối với tín hiệu ñiều khiển
và biến trạng thái thì ta có ñược lời giải càng ñơn giản .
ðặt :
xk +1 = f k ( xk , uk ) (2.56)
với số mũ k trên f thể hiện sự thay ñổi theo thời gian . Giả ñịnh kết hợp với
hàm chỉ tiêu chất lượng :
N −1
J i ( xi ) = φ ( N , xN ) + ∑ Lk ( xk , uk ) (2.57)
k =i

với [i, N ] là thời gian lấy mẫu . Chúng ta cần chỉ ra sự phụ thuộc của J ñối
với trạng thái và thời gian ñầu .

Giả sử ta ñã có ñược tổn hao tối ưu J k∗+1 ( xk +1 ) từ thời ñiểm k + 1 ñến thời
ñiểm cuối N ứng với những phương án khả thi xk +1 , và chuỗi các phương
án tối ưu từ thời ñiểm k + 1 ñến N cho mọi xk +1 .
Tại thời ñiểm k , nếu ta áp dụng một luật ñiều khiển u k bất kỳ và sử dụng
một chuỗi luật ñiều khiển tối ưu kể từ vị trí k + 1 , lúc ñó tổn hao sẽ là :
J k = Lk ( xk , uk ) + J k∗+1 ( xk +1 ) (2.58)
với xk là trạng thái ở thời ñiểm k , và xk +1 ñược cho bởi (2.56) . Theo
nguyên lý Bellman thì tổn hao tối ưu từ thời ñiểm k sẽ là :
(
J k∗ ( xk ) = min Lk ( xk , uk ) + J k∗+1 ( xk +1 )
uk
)(2.59)

và luật ñiều khiển tối ưu u k* tại thời ñiểm k là u k làm cho tổn hao ñạt cực
tiểu .
Phương trình (2.59) chính là nguyên lý tối ưu cho hệ rời rạc . Vai trò quan
trọng của nó là có thể cho phép chúng ta tối ưu hóa một vector ñiều khiển
tại thời ñiểm a bằng cách tính ngược từ N.
Trong thực tế, ta có thể ñịnh rõ các ñiều kiện ràng buộc ñược thêm vào
chẳng hạn như yêu cầu luật ñiều khiển u k thuộc về một tập hợp các luật
ñiều khiển ñược chấp nhận .

Ví dụ 2.18 :
Xét hệ :
x k +1 = x k + u k (1)
có hàm chỉ tiêu chất lượng :

Trang 176
Chương 2: ðiều khiển tối ưu

1 N −1 2
J 0 = xN2 +∑ uk
2 k =0
(2)

với thời ñiểm cuối cùng N = 2 . Tín hiệu ñiều khiển bị ràng buộc lấy các giá
trị :
uk = −1, −0.5, 0, 0.5,1 (3)
và biến trạng thái bị ràng buộc lấy các giá trị :
xk = 0, 0.5,1,1.5 (4)
ðiều kiện ràng buộc ñối với tín hiệu ñiều khiển không phải là không có lý
do , tín hiệu ñiều khiển tối ưu thời gian tối thiểu chỉ lấy các giá trị ±1 ( ví dụ
2.17 ), trong khi tín hiệu ñiều khiển tối ưu nhiên liệu tối thiểu nhận các giá
trị 0 , ±1 . ðiều kiện ràng buộc ñối với biến trạng thái trong bài toán này
cũng hợp lý , vì nếu trạng thái ban ñầu lấy một trong các giá trị chấp nhận
ñược (4) , thì dưới ảnh hưởng của các tín hiệu ñiều khiển cho phép (3) các
trạng thái sau ñó sẽ lấy các giá trị nguyên và bán nguyên . ðiều kiện ràng
buộc (4) có thể viết lại là x0 = 0, 0.5,1,1.5 và
0 ≤ xk ≤ 1.5 (5)
ðây là ñiều kiện xác thực và ràng buộc biên ñộ về trạng thái , thường là hợp
lý trong các tình huống vật lý .
Bây giờ , bài toán ñiều khiển tối ưu là tìm dãy tín hiệu ñiều khiển chấp nhận
ñược u0∗ , u1∗ sao cho chỉ tiêu chất lượng J 0 ñạt giá trị cực tiểu trong khi tạo
ra quỹ ñạo trạng thái chấp nhận ñược x0∗ , x1∗ , x2∗ . Chúng ta muốn uk∗ ñược xác
ñịnh như là luật ñiều khiển hồi tiếp trạng thái .
Theo (2.58) ta có :
1
J k = uk2 + J k∗+1 (6)
2
⇒ J k∗ = min ( J k ) (7)
uk

ðể tìm u và J ứng với mỗi xk . Ta xuất phát từ trạng thái cuối cùng .
k

k

k = N = 2 : J 2∗ = x2∗2
Ứng với mỗi giá trị xN = 0, 0.5,1,1.5 ta có các giá trị J N∗ = 0, 0.25,1, 2.25 .
k = 1 : J1 = u22 / 2 + J 2∗
- x1 = 1.5 : vì x2 = x1 + u1 và 0 ≤ x2 ≤ 1.5 nên ta chỉ xét các giá trị u1 ≤ 0
u1 = 0 ⇒ x2 = 1.5 + 0 = 1.5 ⇒ J 2∗ = 2.25
⇒ J1 = u22 / 2 + J 2∗ = 0 2 / 2 + 2.25 = 2.25
u1 = −0.5 ⇒ x2 = 1.5 + ( −0.5) = 1 ⇒ J 2∗ = 1

Trang 177
Chương 2: ðiều khiển tối ưu

2
⇒ J1 = ( −0.5 ) / 2 + 1 = 1.125
u1 = −1 ⇒ x2 = 1.5 + ( −1) = 0.5 ⇒ J 2∗ = 0.25
2
⇒ J1 = ( −1) / 2 + 0.25 = 0.75
Như vậy , tín hiệu ñiều khiển tối ưu với x1 = 1.5 là u1∗ = −1 và tổn hao tối
ưu là J1∗ = 0.75 . Ta có ñược sơ ñồ như sau với mũi tên chỉ ra trạng thái tối
ưu .

Tương tự như vậy cho các trường hợp còn lại của x1 . Tiếp tục với trạng
thái k = 0 . Cuối cùng ta sẽ ñược lưới kết quả như Hình 2.10.

3. Phương pháp ñiều khiển số


Chúng ta có thể rời rạc hóa , giải bài toán tối ưu cho hệ rời rạc và sau ñó
dùng khâu giữ bậc không ñể tạo ra tín hiệu ñiều khiển số .
Cho hệ thống :
x& = f ( x, u , t ) (2.60)
Với hàm chỉ tiêu chất lượng :
T
J ( 0 ) = φ ( x (T ) , T ) + ∫ L ( x ( t ) , u ( t ) , t ) dt (2.61)
0

ðể rời rạc hệ thống với chu kỳ lấy mẫu τ giây, ta có thể sử dụng hàm xấp
xỉ bậc 1 :
x& (kτ ) = ( xk +1 − xk ) / τ (2.62)
Viết (2.60) dưới dạng :
xk +1 = xk + τ f ( xk , uk , kτ ) (2.63)
ðể cho ñơn giản ta ñịnh nghĩa : xk x ( kτ ) , uk u ( kτ )
ðịnh nghĩa hàm rời rạc :
f k ( xk , uk ) xk + τ f ( xk , uk , kτ ) (2.64)
Khi ñó ta có thể viết :

Trang 178
Chương 2: ðiều khiển tối ưu

xk +1 = f k ( xk , uk ) (2.65)
Phương trình này ñúng với (2.56) .
ðể rời rạc hoá hàm chỉ tiêu , ta có thể viết :
N −1 ( k +1)τ
J ( 0 ) = φ ( x (T ) , T ) + ∑ ∫τ L ( x ( t ) , u ( t ) , t ) dt (2.66)
k =0 k

Hình 2.10 : Lưới kết quả của bài toán tối ưu giải bằng phương pháp quy
hoạch ñộng cho ví dụ 2.18 .

Trang 179
Chương 2: ðiều khiển tối ưu

T
Trong ñó : N= (2.67)
τ
Sử dụng hàm xấp xỉ bậc 1 cho mỗi ñại lượng tích phân :
N −1
J ( 0 ) = φ ( x (T ) , T ) + ∑τ L ( xk , uk , kτ ) (2.68)
k =0
ðịnh nghĩa hàm rời rạc :
J0 J ( 0)
φ S ( N , xN ) φ ( x ( Nτ ) , Nτ )
Lk ( xk , uk ) τ L ( xk , uk , kτ ) (2.69)
Khi ñó ta có :
N −1
J ( 0 ) = φ S ( N , xN ) + ∑ Lk ( xk , uk ) (2.70)
k =0
ðây là công thức (2.57) .
Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu
chất lượng dạng toàn phương :
x& = Ax + Bu (2.71)
T
1 1
2 20
(
J ( 0 ) = xT (T ) S (T ) x (T ) + ∫ xT Qx + uT Ru dt )
(2.72)

Sử dụng hàm xấp xỉ bậc nhất ñể rời rạc hoá hệ thống trở thành :
xk +1 = ( I + Aτ ) xk + Bτ uk (2.73)
1 T 1 N −1
J ( 0) = xN S N xN + ∑ xkT Q S xk + ukT R S uk
( ) (2.74)
2 2 k =0
Trong ñó :
SN S ( Nτ ) (2.75)
Q S = Qτ (2.76)
S
R = Rτ (2.77)

Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xầp xỉ Euler (2.73)
bằng cách sử dụng chính xác phương trình trạng thái (2.71) bao gồm bộ lấy
mẫu và khâu giữ bậc 1 :
x k +1 = A S x k + B S u k (2.78)
Trong ñó :
A S = e Aτ (2.79)

Trang 180
Chương 2: ðiều khiển tối ưu

τ
B S = ∫ e Aτ B dt( ) (2.80)
0

Công thức Caley-Hamilton : e Aτ = C 0 I + C1 A + ... + C n −1 A n−1


Khi ñó hệ thống này ñã ñược rời rạc hoá, phương pháp quy hoạch ñộng có
thể ñược áp dụng ñể tính u k* như trong phần rời rạc. ðiều khiển số áp dụng
trong thực tế ñược thể hiện như sau :
u ( t ) = uk∗ , kτ ≤ t ≤ ( k + 1)τ (2.81)
ðể sử dụng phương pháp quy hoạch ñộng, biến trạng thái và giá trị ñiều
khiển trước hết phải ñược lượng tử hoá & ñược giới hạn theo một số tập giá
trị có thể chấp nhận. Mức ñộ lượng tử càng tốt thì tín hiệu số càng chính
xác; tuy nhiên khi số lượng có thể chấp nhận ñược của xk và uk tăng thì khối
lượng tính toán ñể tìm u k* cũng tăng theo. Vấn ñề này có thể nhanh chóng
gây khó khăn kể cả ñối với các máy tính lớn .

2.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton


1. Nguyên lý cực tiểu của Pontryagin.
Cho hệ thống :
x& = f ( x, u , t ) (2.82)
Kết hợp hàm chỉ tiêu chất lượng :
T
J (t 0 ) = φ ( x(T ), T ) + ∫ L( x, u, t )dt (2.83)
t0

Trạng thái cuối phải thỏa :


Ψ ( x (T ) , T ) = 0 (2.84)
và x(t0) ñã ñược cho trước .
ðiều kiện ñể bài toán tối ưu là :
∂H
=0 (2.85)
∂u
với H ( x, u , λ , t ) = L ( x , u , t ) + λ T f ( x, u , t ) (2.86)
Giả sử hàm ñiều khiển u(t) là ràng buộc trong một vùng giới hạn cho phép ,
có nghĩa là giá trị yêu cầu có ñộ lớn nhỏ hơn giá trị ñã cho . ðiều kiện
dừng thay bằng ñiều kiện tổng quát :
H ( x∗ , u ∗ , λ ∗ , t ) ≤ H ( x∗ , u ∗ + ∂u, λ ∗ , t ) Thỏa tất cả giá trị δ u
Dấu * thể hiện chỉ số chất lượng tối ưu . Mà bất kỳ sự biến thiên nào trong
bộ ñiều khiển tối ưu xảy ra tại thời ñiểm t ( trong khi trạng thái và biến trạng
thái nếu ñược duy trì ) sẽ tăng ñến giá trị của hàm Hamilton . ðiều kiện này
ñược viết như sau:
H ( x ∗ , u ∗ , λ ∗ , t ) ≤ H ( x∗ , u , λ ∗ , t ) Thỏa tất cả giá trị u (2.87)

Trang 181
Chương 2: ðiều khiển tối ưu

Yêu cầu tối ưu biểu thức (2.87) ñược gọi nguyên lý cực tiểu Pontryagin : “
Hàm Hamilton phải ñược cực tiểu hóa ở tất cả các giá trị u cho giá trị tối
ưu của trạng thái và biến trạng thái ”.
Chúng ta sẽ thấy nguyên lý cực tiểu hữu dụng như thế nào . ðặc biệt chú ý
không thể nói rằng biểu thức H ( x∗ , u ∗ , λ ∗ ) ≤ H ( x, u, λ , t ) chắc chắn phải
ñúng .

Ví dụ 2.19 :
Tối ưu hóa với những ràng buộc
Giả sử chúng ta muốn tối ưu cực tiểu hàm :
1
L = u2 – 2u + 1 (1)
2
Với ñiều kiện : u ≤1 (2)
Xem Hình 2.11 .
Nguyên lý cực tiểu: L(u*) ≤ L(u) thỏa ∀u (3)
L(u)

u
-1 0 1 2

-1/2
-1

Vuøng coù theå ñieàu khieån


Hình 2.11 : Tối ưu hoá với nhiều ñiều kiện ràng buộc .

Dễ dàng thấy ñược giá trị tối ưu của u là :


u* = 1 (4)
Giá trị tối ưu của L là :
1
L* = L(1) = - (5)
2
Giá trị nhỏ nhất không ràng buộc tìm ñược bằng cách giải :
∂L
= u -2 = 0 (6)
∂u
nhận ñược :
u=2 (7)

Trang 182
Chương 2: ðiều khiển tối ưu

và :
L(2) = -1 (8)
nhỏ hơn (5) ; nhưng u=2 thì không nằm trong khoản u ≤ 1 .

2. ðiều khiển Bang-Bang


Chúng ta hãy thảo luận bài toán tối thiểu thời gian tuyến tính với ngõ vào
ràng buộc . Cho hệ thống :
x& = Ax + Bu (2.88)
với chỉ tiêu chất lượng :
T
J(t0) = ∫ 1dt (2.89)
t0
Với T tự do . Giả sử hàm ñiều khiển phải thỏa mãn ñiều kiện sau :
u (t ) ≤ 1 ∀t ∈ [t0 , T ] (2.90)
Bài toán tối ưu ñặt ra là tìm tín hiệu ñiều khiển u(t) ñể cực tiểu hoá J(t0) ,
thỏa mãn ñiều kiện (2.90) với ∀t , ñi từ trạng thái x(t0) ñến trạng thái cuối
cùng x(T) thỏa công thức (2.84) của hàm ψ .
Hàm Hamilton cho vấn ñề này là :
H = L + λ T f = 1 + λ T ( Ax + Bu ) (2.91)
∂H
ñiều kiện dừng ñược tìm thấy là : 0 = = BTλ (2.92)
∂u
Nó không chứa u bởi vì hàm Hamilton tuyến tính ñối với u . Rõ ràng , ñể H
cực tiểu chúng ta nên chọn u(t) sao cho λT(t)Bu(t) càng nhỏ càng tốt ( có
nghĩa là giá trị càng xa về phía bên trái trên trục tọa ñộ thực ; λTBu = - ∞ là
giá trị nhỏ nhất ) . Nếu không có sự ràng buộc nào trên u(t) , thì ñiều này sẽ
cho ra những giá trị vô hạn ( dương hoặc âm ) của những biến ñiều khiển .
Với kết quả này , bài toán tối ưu ñặt ra phải có những ñiều kiện ràng buộc
ñối với tín hiệu ñiều khiển .
Theo nguyên lý cực tiểu Pontryagin (2.87) , hàm ñiều khiển tối ưu u*(t) phải
thỏa mãn :
1 + (λ ∗ )T ( Ax∗ + Bu ∗ ) ≤ 1 + (λ ∗ )T ( Ax∗ + Bu )
⇒ (λ ∗ )T Bu ∗ ≤ (λ ∗ )T Bu (2.93)
ñối với tất cả giá trị u(t) cho phép . ðiều kiện này cho phép chúng ta biểu
diễn u*(t) dưới dạng biến trạng thái . ðể thấy ñiều này , trước tiên chúng ta
thảo luận về trường hợp một ngõ vào .
ðặt u(t) là một ñại lượng vô hướng và ñặt b tượng trưng cho vector ngõ vào .
Trong trường hợp này dễ dàng chọn u*(t) ñể tối thiểu λT(t) Bu(t) . ( Chú ý :
giá trị nhỏ nhất nghĩa là λT(t)Bu(t) nhận một giá trị càng gần - ∞ càng tốt ) .

Trang 183
Chương 2: ðiều khiển tối ưu

Nếu λT(t)B là giá trị dương , chúng ta nên chọn u(t) = -1 làm cho λT(t)Bu(t)
có giá trị âm nhất . Mặt khác , nếu λT(t)B là giá trị âm , chúng ta nên chọn
u(t) ở giá trị cực ñại là giá trị 1 ñể giá trị λT(t)Bu(t) càng âm càng tốt . Nếu
giá trị λT(t)Bu(t) bằng zero tại thời ñiểm t , khi ñó u(t) có thể nhận bất cứ giá
trị nào tại thời ñiểm này .
Quan hệ giữa ñiều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm
sgn(w) :
 1 w>0

sgn ( w ) = ( −1,1) w = 0 (2.94)

 −1 w < 0
Khi ñó hàm ñiều khiển tối ưu ñược cho bởi :
(
u * (t ) = − sgn BT λ (t ) ) (2.95)
u* ñược biểu diễn dưới dạng biến trạng thái , với hệ tuyến tính dạng toàn
phương .
Giá trị BTλ(t) ñược gọi là hàm chuyển ñổi . Một hàm chuyển ñổi mẫu và bộ
ñiều khiển tối ưu ñược diễn tả ở Hình 2.12 . Khi hàm chuyển ñổi này ñổi
dấu , bộ ñiều khiển chuyển từ cực trị này ñến cực trị khác . Bộ ñiều khiển
trong hình ñược chuyển ñổi bốn lần . ðiều khiển thời gian tối thiểu tuyến
tính tối ưu luôn bão hòa khi nó chuyển ñổi tại vị trí giữa các giá trị cực trị ,
cho nên ñược gọi là ñiều khiển Bang-bang .
Nếu bộ ñiều khiển là một vector có m phần tử , theo nguyên lý cực tiểu ta
chọn các thành phần ui(t) bằng 1 , nếu các thành phần BiTλ(t) là giá trị âm ;
và bằng -1 nếu BiTλ(t) là giá trị dương , với Bi là cột thứ i của B . Phương
pháp ñiều khiển này tạo thành một giá trị :
m
λT (t ) Bu (t ) = ∑ u i (t ) BiT λ (t ) (2.96)
i =1

càng nhỏ càng tốt với mọi t ∈ [t 0 , T ] .


Ta có thể viết :
u ∗ (t ) = − sgn( BT λ (t )) (2.97)
nếu chúng ta ñịnh nghĩa hàm sgn cho vector w như sau :
v = sgn(w) nếu vi = sgn(w) cho mỗi i (2.98)
vi , wi là những thành phần của v và w .
Thành phần BiTλ(t) của hàm chuyển ñổi BTλ(t) có thể bằng zero trên một
khoảng thời gian hữu hạn . Nếu ñiều ñó xảy ra , thành phần ui(t) của bộ ñiều
khiển tối ưu không ñịnh nghĩa ñược bởi biểu thức (2.93) . ðó gọi là ñiều
kiện kỳ dị . Nếu ñiều ñó không xảy ra , thì bộ ñiều khiển thời gian tối ưu
ñược gọi là bình thường .

Trang 184
Chương 2: ðiều khiển tối ưu

Nếu hệ thống là bất biến theo thời gian , ta sẽ có ñược quả ñơn giản và bộ
ñiều khiển thời gian tối ưu là duy nhất .

Hình 2.12 : Hàm chuyển ñổi mẫu và bộ ñiều khiển tối ưu .

Hệ thống bất biến theo thời gian trong biểu thức (2.88) có thể ñạt ñược nếu
chỉ có một ma trận
U n =  B AB K An −1 B  (2.99)
nxn
cấp n . Nếu bi là cột thứ i của B ∈ R , khi ñó hệ thống là bình thường nếu :
[
U = B AB ... A n−1 B ] (2.100)
cấp n cho mỗi giá trị i = 1 , 2 , … , m ; mà khi thành lập cho mỗi giá trị
riêng biệt u , u ∈ Rm .
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến ñến trạng thái cuối
cố ñịnh x(T) với hàm ñiều khiển thỏa [u (t )] ≤ 1 . Khi ñó :
1. nếu trạng thái cuối x(T) bằng zero , khi ñó sẽ tồn tại bộ ñiều khiển thời
gian tối thiểu nếu hệ thống không có cực với phần thực dương ( ví dụ
không có cực trên mặt phẳng phía bên phải ) .
2. cho bất kỳ giá trị x(T) cố ñịnh , nếu tồn tại ñáp án cho bài toán tối ưu thời
gian thì nó là duy nhất .
3. cuối cùng , nếu hệ thống có n cực thực và nếu tồn tại bộ ñiều khiển tối ưu
thời gian thì mỗi thành phần ui(t) của bộ ñiều khiển tối ưu thời gian thay
ñổi n-1 lần .
Ví dụ 2.20 :
ðiều khiển Bang-Bang
Cho hệ thống tuân theo ñịnh luật Newton :
y& = v (1)
v& = u (2)
với y là vị trí tọa ñộ và v là vận tốc, u là gia tốc . Trạng thái là x = [y u]T .
Cho gia tốc ngõ vào u ràng buộc bởi :
u (t ) ≤ 1 (3)

Trang 185
Chương 2: ðiều khiển tối ưu

Mục ñích ñiều khiển là ñưa trạng thái từ ñiểm ban ñầu bất kỳ ( y ( 0 ) , v ( 0 ) )
ñến ñiểm gốc trong thời gian T ngắn nhất . Trạng thái cuối ñược cố ñịnh tại :
 y (T )
ϕ (x(T),T) =   =0 (4)
 v(T ) 
Lập hàm Hamilton (2.91) :
H = 1 + λ yv + λ vu (5)
T
λ = [λy λv] là biến trạng thái .
Từ hệ phương trình Hamilton ta có :
∂H ∂L ∂f T
− λ& = = + λ
∂x ∂x ∂x
H ( x, u , t ) = L( x, u, t ) + λT f ( x, u, t )
x& (t ) = f ( x, u , t )
dλ y ∂H
=−
dt ∂y
∂H
λ&y = − =0 (6)
∂y
∂H
λ&v = − = −λ y (7)
∂v
ðiều kiện tiếp tuyến :
0 = H (T ) = 1 + λ y ( T ) v (T ) + λv (T ) u ( T ) (8)
hoặc dùng công thức (4) ,
λv (T ) u (T ) = −1 (9)
Nguyên lý cực tiểu Pontryagin cần ñến phương trình (2.97) , hoặc :
u ( t ) = − sgn ( λv ( t ) ) (10)
vì thế thành phần biến trạng thái λv(t) là hàm chuyển ñổi . ðể xác ñịnh bộ
ñiều khiển tối ưu , ta chỉ cần xác ñịnh λv(t) .
Giải phương trình (6) và (7) với thời gian cuối T :
λy ( t ) = const λ y (11)
λv ( t ) = λv (T ) + (T − t ) λy (12)
Dùng công thức (9) và giá trị u ∗ ( t ) bão hòa tại giá trị 1 hoặc –1 , ta ñược :
u ∗ (T ) = 1 và λv∗ (T ) = −1 (13)
hoặc :
u ∗ (T ) = −1 và λv∗ (T ) = 1 (14)

Trang 186
Chương 2: ðiều khiển tối ưu

Có nhiều khả năng cho hàm chuyển ñổi λv∗ ( t ) , tuỳ thuộc vào giá trị của
λv∗ (T ) và λy . Vài khả năng của hàm chuyển ñổi λv∗ ( t ) ñược diễn tả trong
Hình 2.13 . Giá trị λv∗ (T ) ∈ (y(0) , v(0)) . Chú ý rằng λv∗ ( t ) là tuyến tính ,
và cắt ngang trục tọa ñộ .
Ta cần xác ñịnh phương pháp chuyển ñổi ñể bộ ñiều khiển tối ưu luôn ñúng,
ñồng thời cũng phải xác ñịnh thời ñiểm chuyển ñổi tS ( xem Hình 2.13 ) .

Hình 2.13 : Các hàm chuyển ñổi λv(t) có thể có .

Kết luận: ñối với hệ bậc 2 (ví dụ 2.20) hàm λ không chuyển ñổi lần nào
hoặc chuyển ñổi một lần duy nhất từ dương sang âm hoặc từ âm sang dương,
u ≤ 1.
Xét 2 tín hiệu ñiều khiển chấp nhận ñược : u ( t ) = 1 với ∀t hoặc u ( t ) = −1
với ∀t . Do cả 2 trường hợp u ñều là hằng số nên khi kết hợp phương trình
trạng thái (2) và (1) ta ñược :
v ( t ) = v ( 0 ) + ut (15)
1
y ( t ) = y ( 0 ) + v ( 0 ) t + ut 2 (16)
2
ðể loại bỏ thời gian biến thiên , từ dùng biểu thức (15) ta có ñược :
t = ( v (t ) − v ( 0)) / u
và sau ñó thay vào biểu thức (16) suy ra :

Trang 187
Chương 2: ðiều khiển tối ưu

( y ( t ) − y ( 0 ) ) u = v ( 0 ) ( v ( t ) − v ( 0 ) ) + 12 ( v ( t ) − v ( 0 ) )
2
(17)

ðây là một parabol ñi qua tọa ñộ ( y ( 0 ) , v ( 0 ) ) và khi trạng thái ban ñầu
biến thiên ta vẽ ñược một họ parabol . ðồ thị mặt phẳng pha phản ánh trạng
thái biến thiên diễn tả cho trường hợp u = 1 và u = -1 ở Hình 2.14 . Họ quỹ
ñạo ñi từ dưới lên trên ứng với trường hợp u = 1 , và họ quỹ ñạo ñi từ trên
xuống dưới ứng với u = -1 . Mũi tên chỉ hướng tăng của thời gian .
Như ñã trình bày ở trên , tín hiệu ñiều khiển tối ưu u ( t ) là một hàm không
ñổi từng ñoạn, lấy giá trị ±1 và có nhiều nhất là hai ñoạn không ñổi . Do ñó,
nếu ban ñầu trong một khoảng thời gian nào ñó u ( t ) lấy giá trị +1 và sau ñó
là -1 thì họ quỹ ñạo pha gồm hai ñoạn của các parabol nối tiếp nhau, trong
ñó ñoạn parabol thứ hai là ñường parabol chạy về gốc toạ ñộ. Như vậy,
ñường cong hợp bởi hai nhánh parabol (ñường ñứt nét trên Hình 2.14) là
quỹ ñạo cuối ñưa trạng thái về gốc toạ ñộ , ñường cong ñó ñược gọi là
ñường chuyển ñổi và có phương trình là :
 1 2 v<0
 2 v
y= (18)
1
− v 2
v>0
 2
Theo nguyên lý cực tiểu, chỉ có những quỹ ñạo trên là tối ưu và từ một ñiểm
của mặt phẳng pha chỉ có một quỹ ñạo tối ưu chạy về gốc tọa ñộ .
u= -1

u= 1

Hình 2.14 : Qui tắc ñiều khiển hồi tiếp .

Trang 188
Chương 2: ðiều khiển tối ưu

Phương trình tọa ñộ pha (hình 2.14):


dy v v2
= ⇒ udy = vdv ⇒ uy = +C
dv u 2
v2 v2
u=1: y= + C , u=-1: y= − +C
2 2
Bây giờ chúng ta sẽ ñi tìm thời gian tối thiểu tới ñích với trạng thái ban ñầu
( y ( 0) , v ( 0)) .
Giả sử rằng trạng thái ñầu nằm trên ñường cong chuyển ứng với u = -1 , sau
ñó chuyển sang u = 1 rồi về gốc tọa ñộ . Khi ñó luật ñiều khiển u = -1 ñược
áp dụng ñầu tiên ñể ñưa trạng thái từ ( y ( 0 ) , v ( 0 ) ) dọc theo ñường parabol
ñể ñến ñường cong chuyển ñổi . Tại ñiểm chuyển ñổi ( I ) ứng với thời ñiểm
chuyển ñổi tS , tín hiệu ñiều khiển chuyển thành u = 1 và ñưa trạng thái về
gốc toạ ñộ .
Chúng ta có thể xác ñịnh thời ñiểm chuyển ñổi ts khi trạng thái nằm trên
ñường cong này . Dùng công thức (15) và (16) với u = -1 suy ra :
t2
y (t ) = y ( 0) + v ( 0) t −
2
2 2
v (t ) v ( 0) t2
= = − v ( 0) t +
2 2 2
2
v (0)
⇒ t 2 − 2v ( 0 ) t + − y ( 0) = 0 (19)
2
Thời ñiểm chuyển ñổi sẽ là :
v2 ( 0)
tS = v ( 0 ) + y ( 0 ) + (20)
2
Áp dụng (15) tại ñiểm chuyển ñổi ta có :
v ( tS ) = v ( 0 ) − tS (21)
Cũng sử dụng (15) ñối với thời gian còn lại (T − tS ) ( bây giờ u = 1 ) :
0 = v (T ) = v ( tS ) + (T − tS ) (22)
Từ (21) và (22) ta tính ñược thời gian cực tiểu ñến ñích :
T = 2t S − v ( 0 )
Hoặc :
v2 ( 0)
T = v ( 0) + 2 y (0) + (23)
2

Trang 189
Chương 2: ðiều khiển tối ưu

Ví dụ 2.21 :
 0 1 0 
x& =  2  x+  u u (t ) ≤ 1
 − w 0 1
a. Giải phương trình biến trạng thái. Dùng nguyên lý cực tiểu Pontryagin
ñể tìm luật ñiều khiển tối ưu.
b. Vẽ quỹ ñạo pha cho trường hợp u = 1 và u = -1
c. Tìm ñường cong chuyển ñổi và luật ñiều khiển hồi tiếp cho thời gian tối
thiểu
Giải:
a. Phương trình biến trạng thái:
Mục ñích: ñưa trạng thái từ ñiểm ban ñầu bất kỳ (x1(0),x2(0)) ñến ñiểm
gốc trong thời gian ngắn nhất.
 0 1 0 
Phương trình trạng thái của hệ thống: x& =  x+ 1 u (1)
− w
2
0  
Hệ (1) có dạng: x& = Ax + Bu
 0 1 0 
Trong ñó: A =  2  , B = 1 
 − w 0  
 x&1   0 1  x1  0
Hệ (1) có thể ñược viết lại:   =  2    +  u
 x& 2  − w 0  x2  1
 x&1 = x2
⇔  2
(2)
 x& 2 = − w x1 + u
T
Chỉ tiêu chất lượng: J = ∫ L[ x(t ), u (t ), t ]dt = T ⇒ L[x(t),u(t),t] = 1
0

Hàm Hamilton: H ( x(t ), u (t ), λ (t )) = L[ x(t ), u (t ), t ] + λT f ( x(t ), u (t ))


Suy ra H ( x(t ), u (t ), λ (t )) = 1 + λT ( Ax(t ) + Bu (t ))
với λT (t ) = [λ1 (t ) λ 2 (t )]: vectơ ñồng trạng thái
 x&   x2 
Do ñó: H = 1 + [λ1 λ2 ] 1  = 1 + [λ1 λ2 ] 2 
 x& 2  − w x1 + u 
(
H = 1 + λ1 x 2 + λ 2 − w 2 x1 + u )
∂H
Ta có
∂u
( )
= λ 2 = b T λ , u * (t ) = − sgn b T λ = − sgn (λ 2 )

Trang 190
Chương 2: ðiều khiển tối ưu

Vậy ta tìm ñược luật ñiều khiển tối ưu cho bài toán phụ thuộc vào biến
 1, λ2 < 0

trạng thái λ2 (t ) như sau: u * (t ) = indefinited , λ2 = 0
 − 1, λ2 > 0

 & ∂H 2
− λ1 = ∂x = − w λ 2
Hệ phương trình ñồng trạng thái:  1
∂H
 − λ&2 = = λ1
 ∂x 2
λ&1 = w 2 λ2
Viết lại hệ trên:  ⇒ λ1 = −λ&2 ⇒ λ&1 = −λ&&2 = w 2 λ2
&
 λ2 = −λ1
⇔ λ&&2 + w 2 λ 2 = 0
Giải phương trình trên ta ñược: λ2 = c1 cos wt + c 2 sin wt
Mà λ = −λ& , nên: λ = c sin wt − c cos wt
1 2 1 1 2

 λ = c1 sin wt − c 2 cos wt
Nghiệm phương trình ñồng trạng thái là:  1
λ2 = c1 cos wt + c 2 sin wt
 1, λ2 < 0
* 
Luật ñiều khiển của hệ thống: u (t ) = indefinited , λ2 = 0
 − 1, λ2 > 0

Hình 1
Tín hiệu ñiều khiển chỉ có giá trị là 1 hoặc –1. Do phương trình biến
trạng thái có dạng hàm dao ñộng tuần hoàn với chu kỳ 2π. Và tại thời

Trang 191
Chương 2: ðiều khiển tối ưu

ñiểm là bội của π, tín hiệu ñiều khiển sẽ chuyển trạng thái từ -1 sang 1
hoặc ngược lại mặc dù chúng ta không biết ñược giá trị của c1 và c2.

b. Vẽ quỹ ñạo pha cho trường hợp u = 1 và u = -1


Từ phương trình trạng thái (2), ta có:
x&1 x2
= 2
x& 2 − w x1 + u
( )
⇔ w 2 x1 − u x&1 + x 2 x& 2 = 0 (3)

( ) 2
⇔ w 2 x1 − u + x 22 = K 2
Nếu chọn w=1, ta có phương trình tham số như sau:
 x1 − u = K cos θ
(x1 − u )2 + x22
= K2 ⇔  với –2π≤θ≤2π (4)
 x 2 = K sin θ
ðây chính là phương trình ñường tròn tâm (u,0), bán kính K. Do ñó khi
K thay ñổi, ta sẽ có quỹ ñạo là những ñường tròn ñồng tâm (tâm (1,0)
khi luật ñiều khiển u(t)=1 và tâm (-1,0) khi luật ñiều khiển u(t)=-1).
Trong ñó hằng số K cũng ñược xác ñịnh từ ñiều kiện ñầu cho trước x(0)
= x0 nào ñoù.

Hình 2

Trang 192
Chương 2: ðiều khiển tối ưu

c. ðường cong chuyển ñổi và luật ñiều khiển hồi tiếp:


Xác ñịnh ñường cong chuyển ñổi:
Yêu cầu: từ moät ñieåm quyõ ñaïo ñầu bất kỳ cần chuyeån ñoäng về gốc toạ
ñộ trong khoảng thời gian ngắn nhất có thể ñược. Ñieåm quyõ ñaïo sẽ di
chuyển trên các ñường tròn theo chiều kim ñồng hồ ñể về gốc toạ ñộ.
Do ñó quỹ ñạo tối ưu cuối cùng phải ñi theo cung tròn có tâm (1,0) hoặc
là (-1,0) tuỳ theo luật ñiều khiển u.
+ Nếu trạng thái x(t) giao với ñường tròn (1,0), thì quỹ ñạo tối ưu phải
ñi theo nửa ñường tròn dưới (với luật ñiều khiển u=1).
+ Nếu trạng thái giao với ñường tròn (-1,0), quỹ ñạo tối ưu phải ñi theo
nữa ñường tròn trên (với luật ñiều khiển u=-1)
Từ hai ñiều kiện trên, ta có quỹ ñạo cuối tối ưu là hai nữa ñường tròn
tâm (±1,0) và bán kính 1 trong khoảng thời gian là 2π.
Optimal trajectory
2
^
1.5

1 >
0.5

>
x2

-0.5

-1 <
-1.5

-2
-2 -1.5 -1 -0.5 0 0.5 1 1.5 2
x1

Hình 3
Mặc khác, luật ñiều khiển tối ưu là hàm dao ñộng tuần hoàn với chu kỳ
2π. Do ñó quỹ ñạo tối ưu (ñường cong chuyển ñổi) là một chuỗi với hai
nửa ñường tròn như Hình 4.

Trang 193
Chương 2: ðiều khiển tối ưu

Luật ñiều khiển hồi tiếp tối ưu:


Optimal trajectories
6
^
4

> > >

>
x2
0

< < <

-2

-4

-6
-6 -4 -2 0 2 4 6
x1

Hình 4

Optimal Trajectories for time-optimal harmonic oscillator problem


8
^
6 *
* * ** *** * *** ** * * *
** * ** *
**
**
4 **
**
**
**
2 ******* **
* *
********** *********** **
> >*** > **
** ** *
*** ** **
>
x2

0 ** ***
*** *** **
*
*
** **** < < *
** **<
** **
-2 ** *
** **
*** **
*** ****
**** **
****** ****
-4 ***********

-6

-8
-8 -6 -4 -2 0 2 4 6 8
x1

Hình 5

Trang 194
Chương 2: ðiều khiển tối ưu

Vẽ quỹ ñạo pha cho trường hợp u(t)=1 và u(t)=-1


Từ phương trình trạng thái (2), ta có:
x&1 x2
= 2
x& 2 − w x1 + u
( )
⇔ w 2 x1 − u x&1 + x 2 x& 2 = 0 (3)
Nếu chọn w=1, ta có phương trình tham số như sau:
 x1 − u = K cos θ
(x1 − u )2 + x22 = K 2 ⇔  với –2π≤θ≤2π (4)
 x2 = K sin θ
ðây là phương trình ñường tròn tâm (u,0), bán kính K. Do ñó khi K
thay ñổi, ta sẽ có quỹ ñạo là những ñường tròn ñồng tâm (tâm (1,0) khi
luật ñiều khiển u(t)=1 và tâm (-1,0) khi luật ñiều khiển u(t)=-1).
Trong ñó hằng số K ñược xác ñịnh từ ñiều kiện ñầu cho trước x(0) = x0
nào ñó.

Hình 6

3. ðiều khiển Bang-Off-Bang


Ở phần này chúng ta sẽ thảo luận bài toán ñiều khiển nhiên liệu tối thiểu
tuyến tính với ñầu vào bị ràng buộc .
Xét hệ thống :
x& = Ax + Bu (2.101)
Giả ñịnh rằng nhiên liệu ñược sử dụng trong mỗi thành phần của ñầu vào tỉ
lệ với ñộ lớn của thành phần ấy , ta ñịnh nghĩa hàm ñánh giá :

Trang 195
Chương 2: ðiều khiển tối ưu

T m
J ( t0 ) = ∫ ∑ ci ui ( t ) dt (2.102)
t0 i =1

Khi ñó chúng ta cho phép khả năng tiêu thụ nhiên liệu của m ñầu vào ui(t)
bởi trọng số vô hướng ci . Ta ñịnh nghĩa trị tuyệt ñối của vector :
 u1 
 
u = M  (2.103)
u 
 m
( ñịnh nghĩa này tương tự (2.90) ) và vector C = [c1 c2 … cm]T . Ta có :
T
J ( t0 ) = ∫ C T u ( t ) dt (2.104)
t0

Giả ñịnh rằng bài toán thỏa : u ( t ) ≤ 1 (2.105)


Ta muốn tìm luật ñiều khiển ñể tối thiểu J(t0) , thỏa (2.105) và ñưa x(t0) về
trạng thái cuối thỏa (2.84) với hàm Ψ ñã cho . Thời gian cuối T có thể tự do
hoặc ràng buộc . Chúng ta sẽ thảo luận kỹ hơn ở ví dụ . Lưu ý rằng thời gian
T ít nhất phải bằng thời gian tối thiểu ñể ñưa x(t0) về trạng thái cuối x(T)
thỏa (2.84) .
Hàm Hamilton :
H = C T u + λT ( Ax + Bu ) (2.106)
Theo nguyên lý cực tiểu (2.87) , bài toán ñiều khiển tối ưu phải thỏa :
C T u * + (λ* ) T ( Ax * + Bu * ) ≤ C T u + (λ* ) T ( Ax * + Bu ) (2.107)
với mọi giá trị u(t) . Vì trạng thái tối ưu và biến trạng thái xuất hiện ở cả hai
vế của bất ñẳng thức , ta yêu cầu :
C T u * + (λ* ) T Bu * ≤ C T u + (λ* ) T Bu (2.108)
với mọi u(t) .
ðể xác ñịnh u*(t) từ biến trạng thái λ(t) thỏa mãn (2.108) , ta giả sử rằng m
thành phần của bộ ñiều khiển là ñộc lập lẫn nhau (i=1,…,m) . Tất cả các giá
trị ui(t) phải thỏa bất ñẳng thức vô hướng :
* (λ* ) T Bi u * (λ* ) T Bi u i
ui + ≤ ui + (2.109)
ci ci
Với bi biểu diễn thành phần cột thứ i của ma trận B . Bây giờ ta phải tìm ra
cách thức ñể chọn giá trị ui*(t) từ λT(t)Bi .
Với :
u ui ≥ 0
ui =  i (2.110)
− u i u i ≤ 0

Trang 196
Chương 2: ðiều khiển tối ưu

ta có thể viết lại chỉ tiêu chất lượng theo dạng sau :
 1 + biT λ 
  ui ui ≥ 0
biT λui  ci 
qi ( t ) ui + = (2.111)
ci  1 − bi λ  u
T
ui ≤ 0
 c  i
 i 
T
Nếu Bi λ/ci bằng 1 , khi ñó một vài giá trị không xác ñịnh dương của ui(t) sẽ
làm qi trong (2.111) bằng zero ; nếu BiTλ/ci bằng -1 , khi ñó một vài giá trị
không xác ñịnh âm của ui(t) sẽ làm qi bằng zero . Do ñó bài toán nhiên liệu
tối thiểu có luật ñiều khiển giống như một bài toán phi tuyến .
Biến trạng thái hồi tiếp là :
 1 Bi λ (t ) / ci < −1
T

 nonnegative
Bi λ (t ) / ci = −1
T

ui ( t ) =  0 − 1 < Bi λ (t ) / ci < 1
T
(2.112)
 nonpositive Bi λ (t ) / ci = 1
T

 -1 Bi λ (t ) / ci > 1
T

Nếu chúng ta ñịnh nghĩa hàm vùng chết ( dead zone ) :


 −1 w < −1
 −1;0
( ) w = −1
dez ( w ) =  0 −1 < w < 1 (2.113)
 ( 0;1) w =1

 1 w >1
Ta có thể viết lại bài toán nhiên liệu tối thiểu như sau :
 bi T λ (t ) 
u i (t ) = − dez  

i = 1,2,..., m (2.114)
 ci 
mỗi thành phần u(t) hoặc bão hòa hoặc bằng zero , ta gọi ñiều này là luật
ñiều khiển bang-off-bang .
Nếu BiTλ(t)/ci bằng 1 hoặc –1 vượt quá một khoảng thời gian xác ñịnh khác
zero . Trong trường hợp này , nguyên lý cực tiểu sẽ không xác ñịnh ñược
các thành phần ui(t) . ðây gọi là những khoảng kỳ dị . Nếu BiTλ(t)/ci bằng 1
hoặc –1 chỉ tại một khoảng thời gian xác ñịnh , ñây là bài toán nhiên liệu tối
thiểu chuẩn .
Bài toán ñiều khiển nhiên liệu tối thiểu là chuẩn nếu |A| ≠ 0 và nếu hệ thống
là chuẩn. Có nghĩa là nếu Ui ñược ñịnh nghĩa bởi (2.100) là không kỳ dị với
i=1,…,m.

Trang 197
Chương 2: ðiều khiển tối ưu

Nếu bài toán nhiên liệu tối thiểu là chuẩn và bộ ñiều khiển nhiên liệu tối
thiểu tồn tại , khi ñó nó là duy nhất .
Ở ví dụ kế ta sẽ xem xét một số vấn ñề của bài toán nhiên liệu tối thiểu .

Ví dụ 2.22 :
ðiều khiển Bang-off-bang
Hệ thống ñược mô tả :
y& = v (1)
v& = u (2)
với x = [ y v ]
T
. ðiều kiện ràng buộc của ngõ vào :
u (t ) ≤ 1 (3)
Giả sử ta xác ñịnh ñược trạng thái ñầu (y(0),v(0)) . Ta ñược :
 y[T ]
ψ ( x(T ), T ) =  =0 (4)
 v[T ]
Chỉ tiêu chất lượng với yêu cầu nhiên liệu tối thiểu :
T
J (0) = ∫ u (t )dt (5)
0
Ta chưa chú ý ñến trạng thái thời gian cuối T hoặc tự do hoặc ràng buộc,
mặc dù cuối cùng ta cũng sẽ xét ñến cả 2 trường hợp .
Hàm Hamilton :
H = u + λ y v + λv u (6)
Trong ñó λ = λ y[ λv ]T . Do ñó phương trình ñồng trạng thái là :
λ&y = 0 (7)
λ&v = −λ y (8)
ðiều kiện tiếp tuyến yêu cầu :
0 = H (T ) = u (T ) + λv (T )u (T ) (9)
Từ (4) , (7) , (8) ta suy ra :
λy ( t ) = const λ y (10)
λv ( t ) = λv (T ) + (T − t ) λy (11)
Thành phần biến trạng thái λv(t) là tuyến tính . Tùy thuộc vào biến chưa biết
λy và λv(T) ( chúng tuỳ thuộc vào giá trị của trạng thái ñầu ) , λv(t) có thể là
hằng số (λy = 0) , có thể tăng (λy < 0) hoặc giảm (λy > 0) . Xem Hình 2.13 .
Nguyên lý cực tiểu Pontryagin yêu cầu :
u (t ) = − dez (λv (t )) (12)

Trang 198
Chương 2: ðiều khiển tối ưu

do ñó ñiều khiển tối ưu là :


 1 λv (t ) < −1
 [0;1] λv (t ) = −1

u (t ) =  0 − 1 < λv (t ) < 1 (13)
[- 1;0] λv (t ) = 1

 - 1 λv (t ) > 1
Nói về tính tuyến tính của λv(t) , chúng ta thấy rằng u = 1 không thể chuyển
ngay thành u = -1 mà không qua giá trị trung gian u = 0 . Luật ñiều khiển có
thể chấp nhận là ñiều khiển tối ưu nếu thỏa những yêu cầu này .
Bây giờ chúng ta sẽ xác ñịnh luật ñiều khiển tối ưu và ñi tìm những thời
ñiểm lúc bộ ñiều khiển chuyển ñổi sang giá trị mới .
Bỏ qua những khoảng thời gian riêng biệt khác , có 3 giá trị của u(t) là : -1 ,
0 , 1 . Hình 2.14 cho ta quỹ ñạo mặt phẳng pha khi u = 1 và u = -1 .
Nếu u(t) = 0 ∀t , khi ñó trạng thái xác ñịnh bởi :
v (t ) = v ( 0) (14)
y (t ) = y ( 0) + v (0) t (15)
Những ñường nằm ngang của hằng số v trong quỹ ñạo mặt phẳng pha ñược
cho ở Hình 2.15 .
Quỹ ñạo mặt phẳng pha trong trường hợp u = 0 là những ñường mà việc tiêu
thụ nhiên liệu là zero . ðể nhiên liệu sử dụng là tối thiểu , chúng ta sẽ cho hệ
thống di chuyển theo ñường u = 1 hoặc –1 , dẫn trạng thái ñến một trong
những ñường nằm ngang . Sau ñó di chuyển dọc theo ñường nằm ngang
ñến vị trí chuyển ñổi qua ñường u = -1 hoặc 1 ñể dẫn trạng thái tiến về zero .
ðể thấy ñược luật ñiều khiển Bang-off-bang , chúng ta kết hợp quỹ ñạo của
hai Hình 2.14 và 2.15 ñược Hình 2.16 .
Phần tiếp theo chúng ta sẽ thảo luận riêng những tình huống cho hai vấn ñề
thời gian cuối tự do và cố ñịnh .

Trang 199
Chương 2: ðiều khiển tối ưu

Hình 2.15 : Quỹ ñạo mặt phẳng pha trong trường hợp u = 0 .

Hình 2.16 : Luật ñiều khiển Bang-Off-Bang .

Trang 200
Chương 2: ðiều khiển tối ưu

Hình 2.17 : Quỹ ñạo trạng thái nhiên liệu tối thiểu .

Thời gian cuối tự do :


Với trường hợp thời gian cuối tự do , khi ñó luật ñiều khiển của bài toán
nhiên liệu tối thiểu sẽ không tồn tại .
Thời gian cuối cố ñịnh :
Cho trạng thái ñầu như ñã mô tả ở Hình 2.17 . ðối với bài toán thời gian tối
thiểu thì thời gian cuối nhỏ nhất là :
v 2 (0)
Tmin = v(0) + y (0) + (16)
2
Giả ñịnh rằng thời gian T của bài toán nhiên liệu tối thiểu ñược cố ñịnh tại
giá trị :
T > Tmin (17)
Khi ñó luật ñiều khiển của bài toán nhiên liệu tối thiểu là : -1 , 0 , 1 với thời
gian chuyển ñổi t1 và t2 ñã ñược xác ñịnh .
Từ 0 < t < t1 , u(t) = -1 , biểu thức (15) và (16) trong ví dụ Bang-bang trở
thành :
v1 = v ( t1 ) = v0 − t1 (18)
t12
y ( t1 ) = y ( 0 ) + v ( 0 ) t1 − (19)
2
Từ t1 < t < t2 , u(t) = 0 , ta có phương trình trạng thái :
v ( t2 ) = v1 (20)
y ( t2 ) = y ( t1 ) + v1 ( t2 − t1 ) (21)
Từ t2 < t < T , u(t) = 1 , ta ñược :
0 = v (T ) = v ( t2 ) + (T − t2 ) (22)

Trang 201
Chương 2: ðiều khiển tối ưu

0 = y (T ) = y ( t2 ) + v ( t2 )(T − t2 ) +
(T − t2 ) (23)
2
trong ñó ta có sử dụng ñiều kiện biên (4) .
Thế (18) , (20) vào (22) , ta ñược :
t 2 = v0 + T − t1 (24)
Thế (18) , (19) , (20) , (21) , (24) vào (23) và ñơn giản hóa , cho ra kết quả :
 v 
2

t1 − (v0 + T )t1 +  y 0 + v0T + 0  = 0


2
(25)
 2 
với nghiệm :
(v0 + T ) ± (v0 − T )2 − (4 y0 + 2v0 2 )
t= (26)
2
từ (24) và thực tế thì t1 < t2 , ta có :
(v0 + T ) − (v0 − T )2 − (4 y0 + 2v0 2 )
t1 = (27)
2
và :
(v0 + T ) + (v0 − T )2 − (4 y0 + 2v0 2 )
t2 = (28)
2
vì T > Tmin nên dấu của biểu thức trong căn là dương .
Chúng ta có thể biểu diễn bài toán nhiên liệu tối thiểu này thành dạng vòng
hở như sau :
− 1 t < t1

u (t ) =  0
*
t1 ≤ t ≤ t 2 (29)
1 t2 < t

tùy thuộc vào biểu thức (18) và (27) , giá trị nhỏ nhất của v(t) có thể ñạt tới
theo sự ảnh hưởng của bộ ñiều khiển là một số âm .
(v0 − T ) + (v0 − T )2 − (4 y0 + 2v0 2 )
v1 = (30)
2

2.2.4 Nhận xét :


Phương pháp biến phân cổ ñiển Euler_Lagrange thuận lợi khi giải bài toán
tối ưu mà phiếm hàm có dạng phi tuyến , còn tín hiệu ñiều khiển là những
hàm trơn mà ta có thể dự ñoán trước dựa trên bản chất vật lý của chúng .
Phương pháp này gặp nhiều khó khăn khi áp dụng cho các trường hợp mà
tín hiệu ñiều khiển có thể là hàm gián ñoạn . Trên thực tế ta thường gặp bài
toán tối ưu mà tín hiệu ñiều khiển lại là hàm liên tục từng ñoạn , cho nên

Trang 202
Chương 2: ðiều khiển tối ưu

phương pháp biến phân cổ ñiển bị hạn chế khả năng sử dụng trong thực tế
rất nhiều .
ðối với hệ thống gián ñoạn tốt nhất ta nên áp dụng phương pháp quy hoạch
ñộng của Bellman . ðặc biệt với các bài toán tối ưu phức tạp dùng máy tính
số tác ñộng nhanh giải quyết bằng phương pháp này rất có hiệu quả . Tuy
nhiên , do hàm mô tả tín hiệu ñiều khiển tìm ñược theo bảng số liệu rời rạc
nên biểu thức giải tích của tín hiệu ñiều khiển chỉ là gần ñúng . Phương
pháp quy hoạch ñộng còn gặp hạn chế khi áp dụng ñối với hệ thống liên tục
vì rất khó giải phương trình Bellman .
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có ñiều
kiện ràng buộc bất kể ñiều kiện ràng buộc cho theo hàm liên tục hoặc hàm
gián ñoạn . Nhưng ñối với bài toán tối ưu phi tuyến thì nguyên lý cực tiểu
Pontryagin lại gặp khó khăn , ñặc biệt trong việc xác ñịnh các hàm phụ
λi (t ) ñể cho hàm H ñạt cực ñại .

2.3 ðIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM
DẠNG TOÀN PHƯƠNG
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng
hợp các hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương .
2.3.1 Ổn ñịnh Lyapunov ñối với hệ thống tuyến tính
Tiêu chuẩn ổn ñịnh thứ hai của Lyapunov ( ñiều kiện ñủ )
Xét hệ thống ñược mô tả bởi phương trình trạng thái :
x& = f ( x1 , x 2 ,..., x n )
Nếu tìm ñược một hàm V(x) với mọi biến trạng thái x1 , x2 ,…, xn là một hàm
dV (x )
xác ñịnh dấu dương , sao cho ñạo hàm của nó dựa theo phương
dt
trình vi phân của chuyển ñộng bị nhiễu cũng là hàm xác ñịnh dấu , song trái
dấu với hàm V(x) thì chuyển ñộng không bị nhiễu sẽ ổn ñịnh tiệm cận .
V ( x).V& ( x) < 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh tiệm cận.
V ( x).V& ( x) = 0 : với mọi biến trạng thái xi , i = 1, n hệ thống ổn ñịnh .
V ( x).V& ( x) > 0 : với mọi biến trạng thái xi , i = 1, n hệ thống không ổn ñịnh .
Phương trình Lyapunov
Xét hệ tuyến tính mô tả bởi phương trình trạng thái (hệ Autonom_hệ tự trị):
x& = Ax (2.115)
Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J :

J = ∫ xT Qxdt (2.116)
0
với Q là ma trận vuông xác ñịnh dương .

Trang 203
Chương 2: ðiều khiển tối ưu

Chọn hàm năng lượng V(x) xác ñịnh dương :


V ( x ) = xT Sx (2.117)
trong ñó ma trận S là ma trận vuông xác ñịnh dương . V& ( x ) có dạng :
&
V& ( x ) = x& T Sx + xT Sx& + xT Sx
T
&
= ( Ax ) Sx + xT S ( Ax ) + xT Sx
= xT AT Sx + xT SAx + xT Sx&
(
= xT AT S + SA + S& x )
Do V(x) xác ñịnh dương , nên ñể hệ thống ổn ñịnh thì V& ( x) phải là xác ñịnh
âm .Ta chọn V& ( x) = − xT Qx ( do Q là ma trận xác ñịnh dương nên V& ( x) sẽ
là xác ñịnh âm ) .
⇒ (
Q = − AT S + SA + S& ) (2.118)
ðiều kiện cần và ñủ ñể trạng thái cân bằng x = 0 ổn ñịnh tiệm cận : cho
trước bất kỳ một ma trận xác ñịnh dương Q và ma trận A ổn ñịnh , tồn tại
một ma trận xác ñịnh dương S thoả mãn phương trình :
AT S + SA + S& = −Q
⇒ − S& = AT S + SA + Q (2.119)
Phương trình (2.119) ñược gọi là phương trình Lyapunov .
Khi S không thay ñổi theo thời gian S& = 0 , ta có phương trình ñại số
Lyapunov :
0 = AT S + SA + Q (2.120)
Chỉ tiêu chất lượng J ñược tính như sau :


J = ∫ xT Qxdt = − xT Sx = − xT ( ∞ ) Sx ( ∞ ) + xT ( 0 ) Sx ( 0 )
0
0

Khi tất cả các phần tử của ma trận A âm , ta có x ( ∞ ) → 0 . Do ñó :


J = xT ( 0 ) Sx ( 0 ) (2.121)

2.3.2 ðiều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn
phương _ Phương trình Riccati ñối với hệ liên tục
Xét hệ thống có tác ñộng ngoài ( u ≠ 0 ):
x& = Ax + Bu (2.122)
Chúng ta cần tìm ma trận K của vector ñiều khiển tối ưu :
u (t ) = − Kx(t ) (2.123)
thỏa mãn chỉ tiêu chất lượng J ñạt giá trị cực tiểu :

Trang 204
Chương 2: ðiều khiển tối ưu


(
J = ∫ x T Qx + u T Ru dt ) (2.124)
0
Trong ñó Q là ma trận xác ñịnh dương ( hoặc bán xác ñịnh dương ) , R là ma
trận xác ñịnh dương . Chú ý : thành phần thứ hai ở phần bên phải phương
trình (2.124) xác ñịnh lượng năng lượng tiêu tốn của tín hiệu ñiều khiển .
Chúng ta sẽ chứng minh luật ñiều khiển tuyến tính cho bởi phương trình
(2.123) là luật ñiều khiển tối ưu . Khi ñó , nếu ma trận K ñược xác ñịnh ñể
tối thiểu hoá chỉ tiêu chất lượng J thì luật ñiều khiển u(t) sẽ tối ưu với mọi
trạng thái ban ñầu x(0) .
Từ (2.122) và (2.123) ta có :
x& = Ax − BKx = ( A − BK )x (2.125)
Thay u (t ) = − Kx(t ) vào phương trình (2.124) :

(
J = ∫ x T Qx + x T K T RKx dt )
0

(2.126)
(
= ∫ x T Q + K T RK xdt )
0
Bây giờ ta chọn hàm năng lượng :
V ( x) = xT Sx V ( x) ≥ 0, ∀x (2.127)
với S là ma trận vuông xác ñịnh dương .
⇒ & + xT Sx&
V& ( x) = x&T Sx + xT Sx
= xT ( A − BK )T Sx + xT Sx& + xT S ( A − BK ) x
= xT ( A − BK )T S + S& + S ( A − BK )  x (2.128)
Do V(x) xác ñịnh dương , nên ñể hệ thống ổn ñịnh thì V& ( x) phải là xác ñịnh
âm . Ta ñặt :
d T
V& ( x) =
dt
( )
x Sx = − xT (Q + K T RK ) x

(
( do Q và R là ma trận xác ñịnh dương nên ma trận Q + K T RK cũng là xác)
ñịnh dương , từ ñó V& ( x) sẽ là xác ñịnh âm ) .
xT Q + K T RK x = − xT ( A − BK ) S + S ( A − BK ) + S&  x
( ) T

 
T
Q + K RK = ( A − BK ) S + S ( A − BK ) + S
T & (2.129)
Theo tiêu chuẩn ổn ñịnh thứ hai của Lyapunov , nếu ma trận (A-BK) ổn ñịnh
thì sẽ tồn tại một ma trận xác ñịnh dương S thoả mãn phương trình (2.129) .
Chỉ tiêu chất lượng bây giờ có thể ñược xác ñịnh như sau :

Trang 205
Chương 2: ðiều khiển tối ưu


( )
J = ∫ x T Qx + u T Ru dt = − x T Sx

0
= − x(∞ ) Sx(∞ ) + x(0) Sx(0)
T T

Lưu ý rằng x(∞ ) = 0


⇒ J = x(0 ) Sx(0 )
T

ðặt R = T T , phương trình (1.129) trở thành :


T

( )
AT − K T B T S + S ( A − BK ) + S& + Q + K T T T TK = 0
Phương trình trên có thể viết lại như sau :
[
AT S + SA + TK − T T ( ) −1
][
T
( ) −1
]
B T S − SBR −1 B T S + Q + S& = 0
B T S TK − T T
(2.130)
Chỉ tiêu chất lượng J ñạt giá trị cực tiểu khi biểu thức :
[ ( ) −1
x T TK − T T B T S TK − T T ][
T
( )
−1
]
BT S x
ñạt giá trị cực tiểu .
1− a2
Hệ hở: Q=0, u k* = 2N
(rN − a N x0 )a N −k −1
b(1 − a )
Hệ ổn ñịnh: rN = 0.
Khi ñó :
( ) BS
TK = T T
−1 T

⇒ K = T −1 T T
(T ) B S = R
−1−1 T
B S (2.131)
Phương trình (2.131) cho ta ma trận tối ưu K . Như vậy , luật ñiều khiển tối
ưu cho bài toán ñiều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng
cho bởi phương trình (2.131) là tuyến tính và có dạng :
u (t ) = − Kx(t ) = − R −1 B T Sx(t ) (2.132)
Ma trận S khi ñó phải thỏa mãn phương trình (1.130) ñược viết lại như sau :
A T S + SA − SBR −1 B T S + Q = − S& (2.133)
Phương trình (2.133) ñược gọi là phương trình Riccati .
Khi S không thay ñổi theo thời gian S& = 0 , ta có phương trình ñại số
Riccati ( ARE : Algebraic Riccati Equation ) :
AT S + SA − SBR −1 B T S + Q = 0 (2.134)

2.3.3 Phương trình Riccati ñối với hệ rời rạc


Xét hệ rời rạc :
xk +1 = Ak xk + Bk uk (2.135)
với xk ∈ R n và uk ∈ R m .

Trang 206
Chương 2: ðiều khiển tối ưu

Chỉ tiêu chất lượng J ñược ñịnh nghĩa trong khoảng [1,N] có dạng :
1 1 N −1
J = xNT SN x N + ∑ ( xKT QK xK + uKT RK uK ) (2.136)
2 2 K =i
Hàm Hamilton:
1
H K = ( x TK QK x K + u KT RK u K ) + λTK +1 ( AK x K + BK u K ) (2.137)
2
Xét hệ rời rạc và phương trình ñồng trạng thái:
∂H K
x k +1 = = AK x K + BK u K (2.138)
∂λ K +1
∂H K
λk = = QK x K + AKT λ K +1 (2.139)
∂x K
ðiều kiện biên (Stationarity condition):
∂H K
0= = RK u K + BKT λ K +1 (2.140)
∂u K
Theo 2.140 : u K = − R k− 1 B KT λ K +1 (2.141)

Thế uk từ phương trình 2.141 vào phương trình 2.138, ta ñược:


x k +1 = AK x K − BK Rk−1 BKT λ K +1 (2.142)

Vậy từ 2.142 và 2.139, ta có ñược:


x k +1 = AK x K − BK Rk−1 BKT λ K +1 (2.143)

λk = QK x K + AKT λ K +1 (2.144)

Từ 2.141 ta có luật ñiều khiển:


u K = − R k− 1 B KT λ K +1 (2.145)

Trạng thái ñầu x(t0) về trạng thái cuối tự do ta có dx(T ) ≠ 0 và dT = 0 vì


∂φ
vậy: λ N = = S N xN
∂x N

1 T
Do hàm ma trận trọng lượng có dạng: φ = xN S N xN
2
Vì k ≤ N , ta có: λk = S k xk (2.146)
−1
Thế 2.146 vào 2.143 ta ñược: x k +1 = AK x K − BK R B S k +1 x k +1
k
T
K

Suy ra: x k +1 = ( I + BK Rk−1 BKT S k +1 ) −1 AK x K (2.147)

Trang 207
Chương 2: ðiều khiển tối ưu

Thế 2.146 vào 2.144 ta ñược: S k x k = QK x K + AKT S K +1 x k +1

Thế 2.147 vào: S k x k = QK x K + AKT S K +1 ( I + BK Rk−1 BKT S k +1 ) −1 AK x K

ðơn giản xk ta ñược: S k = QK + AKT S K +1 ( I + BK Rk−1 BKT S k +1 ) −1 AK

Hay: Sk = Ak  S k +1 − Sk +1 Bk Bk Sk +1 Bk + Rk Bk Sk +1  Ak + Qk
−1 T
T

T
( ) 
Phương trình trên chính là phương trình Riccati cho hệ rời rạc . Khi Sk ≠ 0
với ∀k , ta có thể dùng bổ ñề ma trận nghịch ñảo ñể viết lại phương trình
trên như sau :
( )
S k = AkT S k−+11 + Bk Rk−1 BkT Ak + Qk
Khi ñó , luật ñiều khiển tối ưu của tín hiệu ñiều khiển có dạng :
u K = − Rk−1 BKT λk +1 = − Rk−1 BKT S k +1 xk +1 (2.148)
Thế 2.135 vào 2.148:
u K = − Rk−1 BKT S k +1 ( AK xk + BK u k )
Hay:
( I + Rk−1 BKT S k +1 BK )u K = − Rk−1 BKT S k +1 AK xk
−1
Vậy luật ñiều khiển uk là: u K = −( BK S k +1 BK + Rk ) BK S k +1 AK xk
T T

ðộ lợi Kalman ñược xác ñịnh như sau:


K K = ( BKT S k +1 BK + Rk ) −1 BKT S k +1 AK
Vì vậy uk có dạng như sau: uk = − K k xk (2.149)
Tóm lại:
Xét hệ rời rạc :
xk +1 = Ak xk + Bk uk
với xk ∈ R n và uk ∈ R m .
Chỉ tiêu chất lượng J ñược ñịnh nghĩa trong khoảng [1,N] có dạng :
N −1
J i = ∑ xkT Qk xk + ukT Rk uk
( )
k =i
Khi ñó , luật ñiều khiển tối ưu của tín hiệu ñiều khiển có dạng :
uk = − K k xk
với Kk ñược xác ñịnh như sau :
K k = ( BkT S k +1 Bk + Rk ) −1 BkT S k +1 Ak

Trang 208
Chương 2: ðiều khiển tối ưu

Trong ñó Sk phải thoả mãn phương trình :


S k = AkT ( S k−+11 + Bk Rk−1 BkT ) Ak + Qk

2.3.4 Các bước giải bài toán toàn phương tuyến tính
Bước 1 :
Thành lập hệ phương trình trạng thái :
 x& = Ax + Bu

 c = Dx
Xác ñịnh các thông số A , B , D .
Bước 2 :
Xác ñịnh ma trận trọng lượng Q , R từ chỉ tiêu chất lượng J cho dưới dạng
toàn phương tuyến tính .
Bước 3 :
Tìm nghiệm S của phương trình Riccati :
- ðối với hệ liên tục : − S& = AT S + SA − SBR −1BT S + Q
- ðối với hệ rời rạc :
Sk = AkT  S k +1 − Sk +1 Bk BkT Sk +1 Bk + Rk BkT Sk +1  Ak + Qk
−1


( ) 
Bước 4 :
Chỉ tiêu chất lượng tối ưu ñối với hệ dừng :
J = xT ( 0 ) Sx ( 0 )
min
Bước 5 :
Luật ñiều khiển tối ưu :
- ðối với hệ liên tục : u = − R −1BT Sx
−1
- ðối với hệ rời rạc : uk = − ( BkT Sk +1Bk + Rk ) BkT Sk +1 Ak xk
Ví dụ 2.23:
Cho hệ thống như hình vẽ .

Hình 2.18 : Hệ thống ñiều khiển .


Tìm giá trị ζ > 0 sao cho khi tín hiệu vào r(t) = 1(t) thì chỉ tiêu chất lượng :

J = ∫ (e 2 + µe& 2 )dt ( µ > 0 ) (1)
0+
ñạt cực tiểu .

Trang 209
Chương 2: ðiều khiển tối ưu

Từ hình vẽ ta tìm ñược :


C (s) 1
= 2 (2)
R( s ) s + 2ζs + 1
hoặc có dạng :
c&& + 2ζc& + c = r (3)
ðối với tín hiệu sai lệch e , ta có :
e&& + 2ζe& + e = &r& + 2ζr& (4)
Với r(t) = 1(t) , ta có r&(0+ ) = 0 , r& & (0+ ) = 0 . Do ñó , với t ≥ 0 + ta sẽ có :
e&& + 2ζe& + e = 0 , e(0+ ) = 1 , e&(0+) = 0 (5)
Bây giờ , chúng ta ñặt các biến trạng thái như sau :
x1 = e (6)
x2 = x&1 = e& (7)
Khi ñó phương trình trạng thái là :
x& = Ax (8)
0 1 
với A= 
− 1 − 2ζ 
Chỉ tiêu chất lượng J có thể viết lại như sau :
∞ ∞
J = ∫ (e 2 + µe& 2 )dt = ∫ ( x12 + µx 22 )dt
0+ 0+

1 0   x1 
= ∫ [x
0+
1 x 2 ]    dt
0 µ   x 2 

= ∫ x T Qxdt (9)
0+
Nếu ma trận A ổn ñịnh thì chỉ tiêu chất lượng J có thể xác ñịnh từ (1.129) :
J = x T (0+ ) Sx(0+ ) (10)
với S là nghiệm của phương trình Lyapunov :
AT S + SA = −Q (11)
Phương trình ñược viết lại như sau :
0 − 1   s11 s12   s11 s12   0 1  − 1 0 
1 − 2ζ   s  +   =  (12)
   21 s 22   s 21 s 22  − 1 − 2ζ   0 − µ 
Phương trình trên tương ñương với hệ phương trình sau :
− s 21 − s12 = −1 (13)
− s 22 + s11 − 2ζs12 = 0 (14)
s11 − 2ζs 21 − s 22 = 0 (15)

Trang 210
Chương 2: ðiều khiển tối ưu

s12 − 2ζs 22 + s 21 − 2ζs 22 = − µ (16)


Giải hệ phương trình trên ta ñược :
 1+ µ 1 
ζ + 4ζ 2 
S=  (17)
 1 1+ µ 
 2 4ζ 
Chỉ tiêu chất lượng J ñược viết lại :
J = x T (0+ ) Sx(0+ )
 1+ µ  2 1+ µ 2
=  ζ +  x1 (0+ ) + x1 (0+ ) x 2 (0+) + x 2 (0 + ) (18)
 4ζ  4ζ
Thế các ñiều kiện ñầu x1 (0+) = 1 , x 2 (0+) = 0 vào (18) ta tìm ñược :
1+ µ
J =ζ + (19)

ðể tìm cực trị của J ta cho ñạo hàm của J theo ζ bằng 0 :
∂J 1+ µ
= 1− =0 (20)
∂ζ 4ζ 2
1+ µ
ζ = (21)
2
1+ µ
Xét ñạo hàm bậc hai của J theo ζ tại ζ = :
2
∂2 J 1+ µ
=
∂ζ 2 2ζ 3
1+ µ 2
= 3
= >0 (22)
 1+ µ  1+ µ
2
 2 
 
Như vậy, chỉ tiêu chất lượng J sẽ ñạt cực tiểu tại giá trị tối ưu ζ = 1 + µ / 2
J min = 1 + µ (23)

Ví dụ 2.24 :
Xác ñịnh luật ñiều khiển tối ưu rời rạc biết hệ thống có ñối tượng ñiều khiển
mô tả bởi phương trình trạng thái sau :
0 1   0 
x& ( t ) =   x (t ) +   u (t ) (1)
0 −0.1  0.01

Trang 211
Chương 2: ðiều khiển tối ưu

N −1
Chỉ tiêu chất lượng : J = ∑ x12k + 0.001uk2
( ) (2)
k =0
Chu kỳ lấy mẫu T = 0.5 sec , N = 50 .
Ta dễ dàng xác ñịnh ñược phương trình trạng thái hệ rời rạc từ phương trình
trạng thái hệ liên tục :
xk +1 = Ad xk + Bd uk
yk = Cd xk
1 0.488 0.00123
với : Ad =   , Bd =   , Cd = [1 0]
0 0.951 0.00488
Nghiệm của bài toán tối ưu ñược tính theo (2.138) và (2.139) :
K k = ( BkT S k +1 Bk + Rk ) −1 BkT S k +1 Ak (3)

Sk = AkT  S k +1 − Sk +1 Bk BkT Sk +1 Bk + Rk BkT Sk +1  Ak + Qk


−1


( ) 
(4)

1 0 
với : Ak = Ad , Bk = Bd , Qk =   , Rk = 0.001
0 0 
Ta tính ñược K49 = 0 khi biết S50 = 0 . Tiếp theo ta tính giá trị S49 :
1 0 
S49 = Q49 =   (5)
0 0 
Tiếp tục với K48 và S48 :
−1
 1 0  0.00123 
K 48 =  [ 0.00123 0.00488]     + 0.001 .[ 0.00123 0.00488] .
 0 0  0.00488 
 1 0  1 0.488 
0 0  0 0.951 = [1.228 0.599] (6)
  
 1 0   1 0  1 0   0.00123  1 0 
S48 =     −     [ 0.00123 0.00488]  .
0.488 0.951  0 0  0 0  0.00488  0 0 
1 0   1 0.488 1 0 
−1
 0.00123 
0.00488 + 0.001 [ 0.00123 0.00488 ] 0 0  0 0.951 + 0 0 
         
0.9985 0.4873
=  (7)
 0.4873 0.2378
Tiếp tục tính toán nhờ máy tính , ta sẽ xác ñịnh ñược với k = 39 ma trận Kk
sẽ hội tụ về giá trị [25 63] .Vậy ñiều khiển tối ưu cuối cùng là :
uk = − [ 25 63] xk (8)

Trang 212
Chương 2: ðiều khiển tối ưu

Ví dụ 2.25
x&1 = x 2
Hệ thống Newton:
x& 2 = u
T
1 1
Hàm chỉ tiêu chất lượng J = x T (T ).x(T ) + ∫ ( x T x + ru 2 )dt
2 20
Trong ñó x = [x1 x 2 ]
T

a.Viết phương trình Riccati với 3 phương trình vi phân vô hướng.


b.Tìm hàm truyền hồi tiếp của hệ thống.
c.Sử dụng Matlab ñể viết chương trình tìm và mô phỏng ñiều khiển tối ưu.
d.Tìm công thức giải tích cho nghiệm và hệ số khuếch ñại Riccati trạng thái
xác lập.
Giải:
a. Phương trình Riccati
x&1 = x 2 0 1  0 
Theo bài toán ñã cho ⇔ x& =   x +  u
x& 2 = u 0 0  1
T
1 T 1
Hàm chỉ tiêu chất lượng J = x (T ).x(T ) + ∫ ( x T x + ru 2 )dt
2 20
0 1  0  1 0 1
Ta có : A =   , B=  , Q=  , R −1 =
0 0  1  0 1  r
Phương trình Riccati ñại số có dạng
− S& = AT .S + S . A − S .B.R −1 .B T .S + Q
0 0  0 1  1 0 
− S& =  .S + S .  − S .  [0 1].S (1)
1 0 0 0  r 1 
 S (t ) S 2 (t )
ðặt S (t ) =  1 
 S 2 (t ) S 3 (t ) 
Thay vào phương trình (1) ta có:
S& S&  0 0S1 S2  S1 S2 0 1 S1 S2  1 0 0 S1 S2  1 0
− 1 2  =   +   −     + 
& &
S2 S3  1 0S2 S3  S2 S3 0 0 S2 S3  r 0 1S2 S3  0 1
 S& S& 2   0 0  0 S1  1 0 S 2   S1 S 2  1 0
⇔ − 1 = + − +
S& S&   S1 S 2  0 S 2  r 0 S 3   S 2 S 3  0 1
 2 3

 S1 S& 2   0 0  0 S1  1  S 22
& S 2 .S 3  1 0
⇔ − =  +  −  + 
& & S 32  0 1
 S 2 S 3   S 1 S 2  0 S 2  r  S 2 S 3

Trang 213
Chương 2: ðiều khiển tối ưu

 S& S& 2   0 S1  1  S 22 S 2 .S 3  1 0
⇔ − 1  =  −  + 
& & S 32  0 1
 S 2 S 3   S1 2 S 2  r  S 2 S 3
 & 1 2
− S 1 = − r S 2 + 1

 & 1
⇔ − S 2 = S1 − S 2 .S 3 (2)
 r
 & 1 2
− S 3 = 2 S 2 − r S 3 + 1

Phương trình (2) là phương trình Riccati vi phân vô hướng.

b. Tìm hàm truyền hồi tiếp của hệ thống:


Hàm hồi tiếp của hệ thông có dạng: K (t ) = [k1 (t ) k 2 (t )]
1
[0 1]. 1 2 
S S
Ta có K = R −1 .B T .S , hay K (t ) =
r S 2 S 3 
 1
1  k1 (t ) = r S 2 (t ) ( 3)
⇔ [k1 k 2 ] = [S 2 S 3 ] ⇔ 
r 1
k 2 (t ) = S 3 (t )
 r
Phương trình (3) là biểu thức hàm truyền hồi tiếp của hệ thống.

c. Sử dụng Matlab viết chương trình tìm và mô phỏng ñiều khiển tối ưu.
* Hệ thống ñược mô phỏng như sau:
u
x2

x1
1 1
1
s s
Constant Integrator1 Integrator y

Noise

K1 Noise2

Gain

K2

Gain1

Chọn R=1
*Chương trình trong Matlab:
A = [0 1; 0 0];

Trang 214
Chương 2: ðiều khiển tối ưu

B = [0; 1];
C = [1 0];
Q = [1 0;0 1];
R = 1;
%=====GIAI PHUONG TRINH RICCATI=====
[K,S] = lqr(A,B,Q,R);
%========MO PHONG TOI UU=========
x1=y(:,2);
subplot(211);
plot(x1,'r');
title('KET QUA MO PHONG DAP UNG RA Y(t)');
subplot(212);
plot(u(:,2),'r');
title('KET QUA MO PHONG DIEU KHIEN TOI UU U(t)');
*Kết quả tính toán và mô phỏng ñược thể hiện:
K=[1.0000 1.7321]
S =[1.7321 1.0000; 1.0000 1.7321]

d. Công thức giải tích cho nghiệm và hệ số khuếch ñại Riccati trạng thái xác
lập:
Ở trạng thái xác lập khi giá trị T = t → ∞ ta có S&1 = S& 2 = S& 3 = 0

Trang 215
Chương 2: ðiều khiển tối ưu

 & 1 2  1 2
− S 1 = − r S 2 + 1 = 0 − r S 2 + 1 = 0
 
 1  1
Hay: − S& 2 = S1 − S 2 .S 3 = 0 ⇔ S1 − S 2 .S 3 = 0
 r  r
 & 1 2  1 2
− S 3 = 2 S 2 − r S 3 + 1 = 0 2 S 2 − r S 3 + 1 = 0
 
  1
S 22 = r  S2 = r  S 1 (∞ ) = r 2r r + r
 1  r
1 
⇔  S1 = S 2 S 3 ⇔ S1 = r 2r r + r ⇔  S 2 (∞ ) = r (4)
 r  r  S (∞) = 2r r + r
S 3 = 2rS 2 + r  S3 = 2r r + r  3

Biểu thức (4) là biểu thức giải tích của nghiệm Riccati trạng thái xác lập.
Thay các giá trị của S(t) ở biểu thức (4) vào phương trình (3) ñã tìm ở câu
b ta có:
 1
 k1 (t ) = r
 r (5)
1
k 2 (t ) = 2r r + r
 r
Biểu thức (5) là biểu thức giải tích của hàm hồi tiếp của hệ thống ở trạng
thái xác lập

Ví dụ 2.26:
x&1 = x 2
Thieát keá boä baùm cho heä thoáng ñöôïc cho bôûi:
x& 2 = u

1
Haøm chæ tieâu chaát löôïng: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Vôùi mong muoán bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Cho troïng soá
q=10, r=1.
a. Xaùc ñònh luật ñiều khiển u(t).
b. Neáu r(t)=u-1(t), giaûi tìm u(t) neáu x(0)=0ñ
Giải:
a. Xaùc ñònh luaät ñieàu khieån vôùi tín hieäu ñaàu vaøo r(t)=1(t):
x&1 = x 2
Xét hệ thống:
x& 2 = u

Trang 216
Chương 2: ðiều khiển tối ưu


1
Vôùi: J = ∫ ( x12 + 2νx1 x 2 + qx 22 + u 2 )dt
20
Trong ñoù: q- v2>0 vôùi mong muoán muoán x1(t) baùm theo moät tham chieáu
r(t) cho q = 10, r =1.
Heä thoáng ñaõ cho coù theå vieát laïi döôùi daïng:

1
x& = Ax + Bu ; J = ∫ ( x T Qx + u T Ru )dt ; Cx(t ) = r (t )
20
0 1  0   1 ν  1 ν 
Vôùi A =   , B = 1  , C = [
1 0 ] , Q = ν q  = ν 10 , R = 1
0 0       
Giaûi phöông trình Riccati ñeå tìm S:
.
− S = AT S + SA − SBR T B T S + Q
Thieát keá heä thoáng phaûn hoài aâm neân khi S khoâng thay ñoåi theo thôøi gian

0 0 s11 s  = s s  0


12 11 12
1 s11 s  0[1 0] s s  +1
12 11 12
v
1 0  − =0
  s21 s  s s  0
22 21 22
0 s21 s  1
22 s s  v
21 22
10
thì phöông trình ñaïi soá Riccati là:
AT S + SA − SBR T B T S + Q = 0 (1)
Thế A, B, C, Q, R vào (1), ta ñược:
0 0  0 s11 s12 . s 21 s s 12 22
 −1 − v 
⇔ + − = 
 s11 s 12  0 s 21  s22 s21 s s 22 22  − v − 10
 − s .s s11 − s s  −1 − v 
⇔ =
12 21 12 22

 s11− s s 21
 22 s12 + s 21s s 22
 − v − 10
22 

 − s12 . s 21 = −1

 − . = −v
⇔  s11 s12 s 22
 s11 − s 22 . s12 = −v
s + s − s = −10
 12 21 22

Choïn caùc giaù trò cuûa ma traän S sao cho S xaùc ñònh döông. Nghiệm của
phương trình trên là:
2 3 − v 1 
S= 
 1 2 3

Trang 217
Chương 2: ðiều khiển tối ưu

Xaùc ñònh ñoä lôïi hoài tieáp K:


2 3 − v 1 
K = R −1BT .S = [ 0 1]   = 1 2 3 
 1 2 3 
Giaûi tìm V töø phöông trình: −V& = ( A − BK )T V (2)
 v1
Giaû söû V =  
v 2 
Ta vieát laïi bieåu thöùc (2) döôùi daïng ma traän:
 .   0 1 0
T
  v1   0 1 0 0    v1 
T
v
 .  = − 
1
v 
[ ]  
 0 0 − 1 1 2 3  v  = − 0 0 − 1 2 3   v 
 2        2      2 
 .  0 1   v1 
v
Phöông trình treân ñöôïc bieán ñoåi thaønh:  .1  =   
v   − 1 2 3  v 2 
 2
Trong chöông trình giaûi phöông trình vi phaân ta phaûi choïn ñieàu kieän
ñaàu V0 sao cho vôùi V0 ñaõ choïn ta coù keát quaû cuoái cuûa V duøng ñeå tìm
luaät ñieàu khieån thoaû ñieàu kieän x1(t) baùm theo r(t).
T T
Với V0 = [ 0.535 1.887] ⇒ V= [ 0.6373 2.2120 ]
Giaûi tìm P:
0  v  v  v3
P& = V T BR −1 B T V = [v1v 2 ] [0 1] 1  = [0 v 2 ] 1  = v 22 ⇒ P = 2
1  v 2  v 2  3
Tìm luaät ñieàu khieån u(t):
Sau khi giaûi tìm ñöôïc caùc ma traän S,K,V,P ta hoaøn toaøn tìm ñöôïc luaät
ñieàu khieån u(t): u = −( K − R −1 B T VP −1V T ) x − R −1 B T VP −1 r (T )
Keát quaû:
K x =[0.6093 2.1079]
K r = 0.6131
 x1 
Vaäy luaät ñieàu khieån laø: u = −[k1 k 2]  − K r .r
 x2 
b. Neáu r(t)=u-1(t), giaûi tìm u(t) neáu x(0)=0:
Khi heä thoáng xaùc laäp x1(t) = 1 vaø x2(t) = 0 vì vaäy ta coù x(∞) = [1 0] T
Chæ tieâu chaát löôïng J ñöôïc tính:

Trang 218
Chương 2: ðiều khiển tối ưu


1 1 1 1
J=
20∫ ( x T Qx + u T Ru ) = − x T Sx |∞0 = − x(∞) T Sx(∞) + x T (0) Sx(0)
2 2 2
Keát quaû:
K x = [0.6093 2.1079]
K r = 0.6131
x 0 =[0 0]'
x ∞ =[1 0]'
J = -1.0981
 x1 
Vaäy luaät ñieàu khieån: u = −[k1 k 2]  − K r .u −1 (t )
 x2 
Chæ tieâu chaát löôïng: J = -1.0981

2.3.5 Nhận xét


Phương trình Riccati dùng ñể tổng hợp các hệ tuyến tính với chỉ tiêu chất
lượng dạng toàn phương . Với cách giải quyết này , ta vừa ñảm bảo ñược
tính ổn ñịnh của hệ thống ( do cách chọn hàm năng lượng V(x) theo tiêu
chuẩn ổn ñịnh thứ hai của Lyapunov ) , vừa cực tiểu hoá ñược chỉ tiêu chất
lượng J theo yêu cầu bài toán ñặt ra .
Tuy nhiên , có vài ñiểm ta cần chú ý : ñối với bài toán áp dụng phương trình
Riccati thì việc chọn ma trận trọng lượng thích hợp ở chỉ tiêu chất lượng rất
quan trọng vì nó ảnh hưởng rất nhiều ñến kết quả tính toán . Bên cạnh ñó ,
khi xét hệ rời rạc phải ñảm bảo sự hội tụ của Kk ; nếu không thì cần phải
tăng số trạng thái , khi ñó khối lượng tính toán cũng tăng rất nhiều , chỉ phù
hợp khi giải bằng máy tính .

2.4 ỨNG DỤNG MATLAB GIẢI BÀI TOÁN TỐI ƯU


2.4.1 Tối ưu hoá tĩnh
Bài toán chỉ tiêu chất lượng dạng toàn phương và ñiều kiện ràng buộc tuyến
tính _ Trường hợp vô hướng (ví dụ 2.4)
Cho a = 3 , b = 2 , m = 1 , c = 1 . Với : x(1) = x , x(2) = u . Khi ñó bài toán
trở thành tìm giá trị tối thiểu của :
x(1) 2 x(2) 2
f ( x) = +
18 8
với ñiều kiện ràng buộc :
g ( x) = x(1) + x(2) − 1 = 0

Trang 219
Chương 2: ðiều khiển tối ưu

Ở ñây ta sẽ sử dụng hàm lsqlin ( Optimization Toolbox ) với kết quả là giá
2 2
trị tối ưu của x ñể f ( x) = Cx − D ñạt giá trị nhỏ nhất ( Cx − D là norm
của ma trận vuông [Cx − D ] ) .
Cùng các ñiều kiện ràng buộc :
Ax ≤ B
Aeq.x = Beq
Cần lập các thông số C , D , A , B , Aeq , Beq ñể nhập vào theo cú pháp :
x = lsqlin(C, D, A, B, Aeq, beq)

Chương trình :
C = [1/(18^(1/2)) 0;0 1/(8^(1/2))];
D = [0;0];
Aeq = [1 1];
Beq = [1];
x = lsqlin(C, D, [], [], Aeq, Beq)
Chúng ta sẽ ñược kết quả :
x = 0.6923
0.3077

2.4.2 ðiều khiển tối ưu cánh tay máy hồi tiếp góc θ
Xét mô hình cánh tay máy hai ñoạn như hình :

Vị trí ñiểm cuối của cánh tay hai ñoạn ñược cho bởi phương trình sau :
x = L1 cos (θ1 ) + L2 cos (θ1 + θ 2 )
y = L1 sin (θ1 ) + L2 sin (θ1 + θ 2 )
θ&&   A B   T1   E 
Phương trình ñộng lực học :  1  =   + 
&&
θ 2  C D  T2   F 

Trang 220
Chương 2: ðiều khiển tối ưu

T
trong ñó T = [T1 T2 ] là tín hiệu ñiều khiển .
Với các trạng thái :
 x1 = θ1
 x = x& = θ&
 2 1 1

 x3 = θ 2
 x4 = x&3 = θ&2
 x&1 = x2
 x& = AT + BT − E

⇒ 2 1 2

 x&3 = x4
 x&4 = CT1 + DT2 − F

Chọn chỉ tiêu chất lượng J có dạng :


( & 2 + Ψ2 + Ψ
J = ∫ Ψ12 + Ψ 1 2
& 2 dt
2 )
0

 Ψ = e + K1e&1
Với phiếm hàm dạng :  1 1
Ψ 2 = e2 + K 2 e&2
 e = θ r −θ
với  1 1r 1
e2 = θ 2 − θ 2
θ1r ,θ 2r là góc ñặt của θ1 ,θ 2
 e& = −θ&1 = − x2
⇒ 1
&
e&2 = −θ 2 = − x4
e = −θ&&1 = − x&2
 &&
⇒ 1
e2 = −θ&&2 = − x&4
&&
ðể ñảm bảo cực tiểu hoá chỉ tiêu chất lượng J thì T1 , T2 là nghiệm của hệ
phương trình sau :
 Ψ1 + Ψ& =0
1
 &
Ψ 2 + Ψ 2 = 0
Giải hệ phương trình trên ta ñược :
−1
 T1   K1 A K1 B   e1 + EK1 − x2 ( K1 + 1) 
T  =  K C K D  e + FK − x K + 1 
 2  2 2   2 2 4( 2 )
Tín hiệu ñiều khiển T ñược tính toán bằng chương trình Giai_PT.m

Trang 221
Chương 2: ðiều khiển tối ưu

Chương trình :
Thông số ñầu vào cho hệ thống (file thongso.m) :
global m1 m2 L1 L2 a1 a2 I1 I2
m1 = 3.6745;
m2= 1.0184;
L1= 0.6519 ;
L2= 0.6019;
a1= 0.3365 ;
a2= 0.2606;
I1= 0.370 ;
I2= 0.081;

Chương trình tìm tín hiệu ñiều khiển (file Giai_PT.m) :


function [C]= Giai_PT (theta1, theta2, theta1_dot, theta2_dot, e1, e2)
% Nhap thong so cho canh tay
m1 = 3.6745; m2 = 1.0184;
L1 = 0.6519; L2 = 0.6019;
a1 = 0.3365; a2 = 0.2606;
I1 = 0.370; I2 = 0.081;
K1 = 0.5; K2 = 0.8;
m11 = m1*a1*a1+m2*(L1*L1+2*L1*a2*cos(theta2)+a2*a2)+I1+I2;
m12 = m2*a2*(a2+L1*cos(theta2))+I2;
m22 = m2*a2*a2+I2;
n1=m2*L1*a2*sin(theta2)*(2*theta1_dot*theta2_dot+theta2_dot*theta2
_dot);
n2 = m2*L1*a2*sin(theta2)*theta1_dot*theta1_dot;
A = [m11 m12; m12 m22];
B = [n1; n2];
A = inv(A);
B = A*B;
A = [K1*A(1,1) K1*A(1,2); K2*A(2,1) K2*A(2,2)];
B = [e1+B(1,1)*K1-theta1_dot*(K1+1); e2+B(2,1)*K2-
theta2_dot*(K2+1)];
C = inv(A)*B;
u1 = C(1,1);
u2 = C(2,1);

Trang 222
Chương 2: ðiều khiển tối ưu

Kết quả mô phỏng :

Vị trí ñặt thay ñổi theo hàm xung với θ1

Vị trí ñặt thay ñổi theo hàm xung với θ2

Trang 223
Chương 2: ðiều khiển tối ưu

Trang 224
Chương 2: ðiều khiển tối ưu

2.4.3 Hệ thống tác ñộng nhanh:


Giải lại ví dụ 2.21 bằng Mathlab:
Giaûi
Xeùt ω = 1:
Hình 1a moâ taû hoï caùc ñöôøng troøn öùng vôùi nhöõng giaù trò khaùc nhau cuûa k1
vaø k2, töùc laø öùng vôùi nhöõng ñieåm traïng thaùi ban ñaàu x(0) = x0 khaùc nhau
cuûa ñoái töôïng. Chieàu cuûa caùc ñöôøng troøn naøy ñöôïc xaùc ñònh töø quan heä
dx1
= x 2 raèng khi x2 > 0 thì x1 phaûi taêng vaø ngöôïc laïi khi x2 < 0 thì x1 phaûi
dt
giaûm.

Hình 1a
Code hình 1a:
t=0:pi/100:2*pi; t=0:pi/100:2*pi;
x=1+1*cos(t); % tam (1,0) x=1+2*cos(t); % tam (1,0)
bankinh 1 bankinh 2
y=0+1*sin(t); y=0+2*sin(t);
plot(x,y,'r') plot(x,y,'g')
%--------------- %---------------
hold on hold on

Trang 225
Chương 2: ðiều khiển tối ưu

t=0:pi/100:2*pi; y=0+4*sin(t);
x=1+3*cos(t); % tam (1,0) plot(x,y,'b')
bankinh 3 %---------------
y=0+3*sin(t); hold on
plot(x,y,'r--') xlabel('x1')
%--------------- ylabel('x2')
hold on
t=0:pi/100:2*pi; axis([-6 5 -5 5])
x=1+4*cos(t); % tam (1,0)
bankinh 4

:
Hình 1b
Hình 1a vaø hình 1b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 1b:
t=0:pi/100:2*pi; y=0+2*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'g')
bankinh 1 %---------------
y=0+1*sin(t); hold on
plot(x,y,'r') t=0:pi/100:2*pi;
%--------------- x=-1+3*cos(t); % tam (-1,0)
hold on bankinh 3
t=0:pi/100:2*pi; y=0+3*sin(t);
x=-1+2*cos(t); % tam (-1,0) plot(x,y,'r--')
bankinh 2 %---------------

Trang 226
Chương 2: ðiều khiển tối ưu

hold on plot(x,y,'b')
t=0:pi/100:2*pi; hold on
x=-1+4*cos(t); % tam (-1,0) xlabel('x1')
bankinh 4 ylabel('x2')
y=0+4*sin(t); axis([-6 5 -5 5])
Roõ raøng quyõ ñaïo traïng thaùi toái öu chæ coù theå ñöôïc taïo ta töø caùc cung cuûa
nhöõng ñöôøng troøn

Hình 2: Quyõ ñaïo cuoái cuûa traïng thaùi toái öu


Code hình 2:
t=0:pi/100:pi; x=-1+1*cos(t); % tam (-1,0)
x=-1+1*cos(t); % tam (-1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'r') hold on
hold on t=0:-pi/100:-pi;
t=0:-pi/100:-pi; x=1+1*cos(t); % tam (1,0)
x=1+1*cos(t); % tam (1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'b')
plot(x,y,'b') xlabel('x1')
xlabel('x1') ylabel('x2')
t=0:pi/100:pi;

Trang 227
Chương 2: ðiều khiển tối ưu

Hình 3: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 3:
t=0:pi/100:pi; y=0+2.5*sin(t);
x=-1+1*cos(t); % tam (-1,0) plot(x,y,'r')
bankinh 1 hold on
y=0+1*sin(t); %--------------
plot(x,y,'c') t=0:-pi/100:-pi;
hold on x=1+1*cos(t); % tam (1,0)
t=0:pi/100:pi; bankinh 1
x=-3+1*cos(t); % tam (-3,0) y=0+1*sin(t);
bankinh 1 plot(x,y,'b')
y=0+1*sin(t); hold on
plot(x,y,'g') xlabel('x1')
hold on ylabel('x2')
%-------------- axis([-5 3 -3 3])
t=-0.39:pi/100:2.78 grid
x=-1+2.5*cos(t); % tam (-1,0)
bankinh 2.5

Trang 228
Chương 2: ðiều khiển tối ưu

Hình 4 : Xaây döïng quyõ ñaïo traïng thaùi toái öu

Hình 5 : Ñöôøng chuyeån ñoåi giaù trò cuûa tín hieäu ñieàu khieån toái öu

Code hình 4 và hình 5:


t=0:-pi/100:-pi; hold on
x=1+1*cos(t); % tam (1,0) %--------------
bankinh 1 t=0:-pi/100:-pi;
y=0+1*sin(t); x=3+1*cos(t); % tam (3,0)
plot(x,y,'r') bankinh 1

Trang 229
Chương 2: ðiều khiển tối ưu

y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'k') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:-pi/100:-pi; x=-5+1*cos(t); % tam (-5,0)
x=5+1*cos(t); % tam (5,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'k')
plot(x,y,'b') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:pi/100:pi; x=-7+1*cos(t); % tam (-3,0)
x=-1+1*cos(t); % tam (-1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'b')
plot(x,y,'g') hold on
hold on %--------------
%-------------- xlabel('x1')
t=0:pi/100:pi; ylabel('x2')
x=-3+1*cos(t); % tam (-3,0) axis([-10 10 -4 4])
bankinh 1 grid
y=0+1*sin(t);

Töông töï khi ω = 0.5:


Code hình 6a:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid

Trang 230
Chương 2: ðiều khiển tối ưu

Hình 6a

Hình 6b
Hình 6a vaø hình 6b : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái öu
Code hình 6b:
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')

Trang 231
Chương 2: ðiều khiển tối ưu

hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid

Hình 6c
Hình 6a, hình 6b, hình 6c : hoï caùc ñöôøng troøn taïo ra quyõ ñaïo traïng thaùi toái
öu
Code hình 6c:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')

Trang 232
Chương 2: ðiều khiển tối ưu

hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid

Hình 7: Quyõ ñaïo cuoái cuûa traïng thaùi toái öu


Code hình 7:
t=0:pi/100:pi; y=2*sin(t);
x=4*cos(t); plot(x,y,'b')
x=x-4; hold on
y=2*sin(t);
plot(x,y,'r') xlabel('x1')
hold on ylabel('x2')
t=-pi:pi/100:0; axis([-10 10 -5 5])
x=4*cos(t); grid
x=x+4;

Trang 233
Chương 2: ðiều khiển tối ưu

Hình 8: Xaây döïng ñoaïn gaàn cuoái cuûa quyõ ñaïo traïng thaùi toái öu
Code hình 8:
t=0:-pi/100:-pi; x=x-12;
x=4*cos(t); y=2*sin(t);
x=x+4; plot(x,y,'g')
y=2*sin(t); hold on
plot(x,y,'k') t=-0.505:pi/100:2.649
hold on x=8*cos(t);
t=0:pi/100:pi; x=x-4;
x=4*cos(t); y=4*sin(t);
x=x-4; plot(x,y,'b')
y=2*sin(t); hold on
plot(x,y,'r') xlabel('x1')
hold on ylabel('x2')
t=0:pi/100:pi; axis([-20 20 -10 10])
x=4*cos(t); grid

2.4.4 LQR liên tục và rời rạc


1. Hệ liên tục:
Giải lại ví dụ 2.26 bằng Mathlab:
Giải:
a. Xaùc ñònh heä thoáng vôùi leänh vaøo u(t):
Tính S vaø K baèng thuaät toaùn LQR trong Matlab:
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)

Trang 234
Chương 2: ðiều khiển tối ưu

A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
[K,S] = lqr(A,B,Q,R)
Keát quaû:
K =[1.0000 3.4641]
S =[ 2.1962 1.0000; 1.0000 3.4641]
Chöông trình giaûi phöông trình vi phaân:
function Vp=ssequi(t,V)
global D
Vp=D*V;
% Giai phuong trinh vi phan tim V
global D
D = -(A-B*K)'
v0 = [0.535 1.887]';
t0 = 0;
tf = 0.05;
nt = 5000;
t = linspace(t0,tf,nt);
options = odeset('reltol',1.0e-6);
[tn,v] = ode23('ssequi',[t0,tf],v0,options);
Vs = v';
V = Vs(:,end)
Keát quaû:
V =[0.6373 2.2120]T
Trong chöông trình giaûi phöông trình vi phaân ta phaûi choïn ñieàu kieän
ñaàu V0 sao cho vôùi ñieàu kieän ñaàu V0 ta coù keát quaû cuoái cuûa V duøng ñeå
tìm luaät ñieàu khieån thoaû ñieàu kieän x1(t) baùm theo r(t).
Tìm P từ ma trận V:
v2=V(2,:)
P=v2^3/3
Keát quaû:
P = 3.6078
Tìm luaät ñieàu khieån u(t):

Trang 235
Chương 2: ðiều khiển tối ưu

Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
Keát quaû:
Kx =[0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
 x1 
Vaäy luaät ñieàu khieån laø: u = −[k1 k 2]  − Kr.r
 x2 
b. Nếu r(t)=u-1(t) , giải tìm u(t) khi x(0)=0.
function Vp=ssequi(t,V)
global D
Vp=D*V;
%----------------------------------------
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
% Dung thuat toan lqr de tim K,S
[K,S] = lqr(A,B,Q,R)
%Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.535 1.887]';
t0=0;
tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);

Trang 236
Chương 2: ðiều khiển tối ưu

Vs=v';
V=Vs(:,end)
v2=V(2,:)
% Tinh P
% ===========================
P=v2^3/3
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j =(-x_vocung'*S*x_vocung + x0'*S*x0)/2
Keát quaû:
Kx = [0.6093 2.1079]
k1 = 0.6093
k2 = 2.1079
Kr = 0.6131
x0=[0 0]'
x_vocung =[1 0]'
j = -1.0981
 x1 
Vaäy luaät ñieàu khieån: u = −[k1 k 2]  − Kr.u −1 (t )
x
 2
Chæ tieâu chaát löôïng : J = -1.0981
c. Moâ phoûng
1/ Trong tröôøng hôïp x(0)=0; r(t)=u-1(t)
Sô ñoà moâ phoûng khi coù nhieãu ño:

Trang 237
Chương 2: ðiều khiển tối ưu

Chöông trình moâ phoûng:


function Vp=ssequi(t,V)
global D
Vp=D*V;
%===================================
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
mean=0; % Gia tri trung binh cua nhieu
variance = 0; % Phuong sai nhieu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
%===================================
% Giai phuong trinh Riccati
[K,S] = lqr(A,B,Q,R)
%===================================
%Giai phuong trinh vi phan tim v
global D
D=-(A-B*K)'
v0=[0.535 1.887]';
t0=0;
tf=0.05;
nt=5000;

Trang 238
Chương 2: ðiều khiển tối ưu

t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
%Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[0 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0 )/2
% Goi mo hinh simulink
%===============================
sim('mophong')
%===============================
% Ve dap ung ra x1
figure;
subplot(2,1,1);
plot(x1(:,2),'b');
hold on;
%===============================
% Ve tin hieu vao r
plot(r(:,2),'r');
axis([0 60 -2 2]);
legend('x1','r')
title('KET QUA MO PHONG')
hold on;
% ==============================
% Ve sai so

Trang 239
Chương 2: ðiều khiển tối ưu

subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')

Keát quaû moâ phoûng khi chöa coù nhieãu:


KET QUA MO PHONG
2
x1
1 r

-1

-2
0 10 20 30 40 50 60

SAI SO
1
error
0.5

-0.5

-1
0 10 20 30 40 50 60

Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu u-1(t) vôùi thôøi gian oån
ñònh 17sec, khoâng coù voït loá.

Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r

-1

-2
0 10 20 30 40 50 60

SAI SO
1
error
0.5

-0.5

-1
0 10 20 30 40 50 60

Trang 240
Chương 2: ðiều khiển tối ưu

Nhaän xeùt: Khi coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-
1(t) vôùi thôøi gian oån ñònh 17sec, khoâng coù voït loá nhöng khoâng theå loaïi
boû ñöôïc phöông sai nhieãu. Traïng thaùi ban ñaàu x1(t) ñöôïc naâng leân moät
löôïng ñuùng baèng giaù trò trung bình nhieãu.
Moâ phoûng khi coù nhieãu heä thoáng:

Keát quaû moâ phoûng khi coù nhieãu heä thoáng vôi giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r

-1

-2
0 10 20 30 40 50 60

SAI SO
1
error
0.5

-0.5

-1
0 10 20 30 40 50 60

Nhaän xeùt: coù nhieãu ño bieán traïng thaùi x1(t) vaãn baùm theo tín hieäu u-1(t)
vôùi thôøi gian oån ñònh 17sec, khoâng voït loá vaø traïng thaùi ñaàu x1(t) khoâng
thay ñoåi. Tuy nhieân vaãn bò aûnh höôûng cuûa phöông sai nhieãu.
2. Trong tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1)

Trang 241
Chương 2: ðiều khiển tối ưu

Sô ñoà moâ phoûng khi coù nhieãu ño:

Chöông trình moâ phoûng:


function Vp=ssequi(t,V)
global D
Vp=D*V;

%===================================
q = 10; % Trong so q da cho
v = 1.2679; % v duoc chon sao cho 0 < v < sqrt(q)
mean=0.5; % Gia tri trung binh cua nhieu
variance = 0.0001; % Phuong sai nhieu
A = [0 1; 0 0];
B = [0; 1];
C = [1 0];
Q = [1 v;v q];
R = 1;
%===================================
% Giai tim K,S bang thuat toan lqr
[K,S] = lqr(A,B,Q,R)
%===================================
% Giai phuong trinh vi phan tim V
global D
D=-(A-B*K)'
v0=[0.5338 1.8899]';
t0=0;

Trang 242
Chương 2: ðiều khiển tối ưu

tf=0.05;
nt=5000;
t=linspace(t0,tf,nt);
options=odeset('reltol',1.0e-6);
[tn,v]=ode23('ssequi',[t0,tf],v0,options);
Vs=v';
V=Vs(:,12)
v2=V(2,:)
P=v2^3/3
% Tinh do loi hoi tiep
%===============================
Kx=K-inv(R)*B'*V*inv(P)*V'
k1=Kx(1,1)
k2=Kx(1,2)
Kr=inv(R)*B'*V*inv(P)
% Tính chi tieu chat luong
%=============================
x0=[1 0]'
x_vocung=[1 0]'
j=(-x_vocung'*S*x_vocung + x0'*S*x0)/2

% Goi mo hinh simulink


%===============================
sim('mophong_c')
%===============================
% Ve dap ung ra x1
figure;
subplot(2,1,1);
plot(x1(:,2),'b');
hold on;
%===============================
% Ve tin hieu vao r
plot(r(:,2),'r');
axis([0 60 -2 2]);
legend('x1','r')
title('KET QUA MO PHONG')

Trang 243
Chương 2: ðiều khiển tối ưu

hold on;
% ==============================
% Ve sai so
subplot(2,1,2);
plot(x1(:,2)-r(:,2),'k')
axis([0 60 -1 1]);
legend('error')
title('SAI SO')
Keát quaû:
K =[ 1.0000 3.4641]
S = [2.1962 1.0000; 1.0000 3.4641]
V = [0.6362 2.2155]T
P = 3.6250
Kx =[ 0.6112 2.1100]
k1 = 0.6112
k2 = 2.1100
Kr = 0.6112
x0 = [1 0]T
x_vocung = [1 0]T
j= 0
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r

-1

-2
0 10 20 30 40 50 60

SAI SO
1
error
0.5

-0.5

-1
0 10 20 30 40 50 60

Trang 244
Chương 2: ðiều khiển tối ưu

Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät
tieâu ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân
khoâng trieät tieâu ñöôïc phöông sai nhieãu.
Sô ñoà moâ phoûng tröôøng hôïp x(0)=[1 0]T; r(t)=u-1(t-1) coù nhieãu heä
thoáng:

Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 :
KET QUA MO PHONG
2
x1
1 r

-1

-2
0 10 20 30 40 50 60

SAI SO
1
error
0.5

-0.5

-1
0 10 20 30 40 50 60

Trang 245
Chương 2: ðiều khiển tối ưu

Nhaän xeùt: Bieán traïng thaùi x1(t) luoân baùm theo tín hieäu vaøo r(t) trieät tieâu
ñöôïc nhieãu trung bình trôû veà traïng thaùi xaùc laäp x1=1,tuy nhieân khoâng
trieät tieâu ñöôïc phöông sai nhieãu
Ñeå coù cô sôû so saùnh ta moâ phoûng trong tröôøng hôïp tín hieäu vaøo laø hình
sin hoaëc xung vuoâng.
Sô ñoà moâ phoûng hoaøn toaøn gioáng nhö treân chæ khaùc khoái nguoàn.
Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:

KET QUA MO PHONG


2
x1
1.5 r

0.5

-0.5

-1

-1.5

-2
0 10 20 30 40 50 60 70 80 90 100

Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu.

Keát quaû moâ phoûng khi coù nhieãu ño với giaù trò trung bình µ = 0.5 phöông
sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r

0.5

-0.5

-1

-1.5

-2
0 20 40 60 80 100 120 140 160 180 200

Trang 246
Chương 2: ðiều khiển tối ưu

Nhaän xeùt: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu ôû möùc ñuùng baèng giaù trò trung bình cuûa nhieãu.
Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø xung vuoâng:

KET QUA MO PHONG


2
x1
1.5 r

0.5

-0.5

-1

-1.5

-2
0 10 20 30 40 50 60 70 80 90 100

Nhận xét: Bieán traïng thaùi x1(t) baùm theo ñöôïc tín hieäu vaøo nhöng coù
thôøi gian oån ñònh töông ñoái lôùn. Coù theå hieäu chænh ñeå giaûm thôøi gian oån
ñònh nhöng sẽ taêng ñoä voït loá. Traïng thaùi ban ñaàu ôû möùc ñuùng baèng giaù
trò trung bình cuûa nhieãu. Traïng thaùi ban ñaàu x1(t)=0;

Keát quaû moâ phoûng khi coù nhieãu heä thoáng với giaù trò trung bình µ = 0.5
phöông sai λ = 0.0001 tín hieäu vaøo laø hình sin:
KET QUA MO PHONG
2
x1
1.5 r

0.5

-0.5

-1

-1.5

-2
0 20 40 60 80 100 120 140 160 180 200

Nhận xét: Bieán traïng thaùi x1(t) baùm theo tín hieäu r(t). Traïng thaùi ban
ñaàu baèng 0.

Trang 247
Chương 2: ðiều khiển tối ưu

2. Hệ rời rạc
Xét hệ vô hướng :
xk +1 = axk + buk
với chỉ tiêu chất lượng :
1 1 N −1
Ji = sN xN2 + ∑ qxk2 + ruk2
( )
2 2 k =i
a = 1.05 , b = 0.01 , q = r = 1 , x0 = 10 , N = 100 . Chúng ta sẽ xét hai trường
hợp sN = 5 và sN = 500 bằng chương trình dex ñể tìm các quỹ ñạo tối ưu .

Chương trình :
function [x,u,K,S] = dex
a = 1.05;
b = 0.01;
q = 1;
r = 1;
x0 = 10;
s = 5;
N = 100;
S(N+1) = s;
for k = N:-1:1
K(k) = ( a * b * s ) / ( r + s * b^2 );
s = q + ( r * s * a^2 ) / ( r + s * b^2 );
S(k) = s;
end
x(1) = x0;
for k = 1:N
u(k) = -K(k) * x(k);
x(k+1) = a * x(k) + b * u(k);
end

Trang 248
Chương 2: ðiều khiển tối ưu

Giá trị tuần tự sk (sN = 5)

ðộ lợi hồi tiếp tối ưu Kk (sN = 5)

Trang 249
Chương 2: ðiều khiển tối ưu

Quỹ ñạo trạng thái tối ưu xk* (sN = 5)

Giá trị tuần tự sk (sN = 500)

Trang 250
Chương 2: ðiều khiển tối ưu

ðộ lợi hồi tiếp tối ưu Kk (sN = 500)

Quỹ ñạo trạng thái tối ưu xk* (sN = 500)

Trang 251
Chương 2: ðiều khiển tối ưu

CÂU HỎI ÔN TẬP VÀ BÀI TẬP


1. Trình bày phương pháp biến phân cổ ñiển Euler_Lagrange cho các
trường hợp : không có ñiều kiện ràng buộc , có ñiều kiện ràng buộc và khi
tín hiệu ñầu vào bị hạn chế .
2. Chỉ tiêu chất lượng ở ví dụ 2.13 có dạng :

(& 2 dt
J = ∫ Ψ2 + Ψ )
0
Hãy chứng minh hàm biến số phụ Ψ ñược xác ñịnh từ ñiều kiện cực tiểu của
J như sau :
Ψ+Ψ & =0
3. Phát biểu nguyên lý tối ưu của Bellman . Trình bày ý tưởng giải quyết bài
toán tối ưu của phương pháp quy hoạch ñộng .
4. Trình bày nguyên lý cực tiểu của Pontryagin
5. Phát biểu tiêu chuẩn ổn ñịnh thứ hai của Lyapunov .
6. Ứng dụng Lyapunov trong bài toán LQR liên tục .
7. Chứng minh ma trận Q là ma trận xác ñịnh dương:
Q = x12 + 4 x 22 + x32 + 2 x1 x 2 − 6 x 2 x3 − 2 x1 x3
8. Chứng minh ma trận Q là ma trận xác ñịnh âm:
Q = − x12 − 3 x 22 − 11x32 + 2 x1 x 2 − 4 x 2 x3 − 2 x1 x3
9. Viết một số hàm Lyapunov cho hệ thống sau:
 x&1  − 1 1   x1 
 x&  = 2 − 3  x 
 2   2 
Xác ñịnh tính ổn ñịnh của hệ thống.
10. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = − x1 − 2 x 2 + 2
x& 2 = x1 − 4 x 2 − 1
11. Xác ñịnh tính ổn ñịnh của trạng thái cân bằng cho hệ thống sau:
x&1 = x1 + 3x 2
x& 2 = −3x1 − 2 x 2 − 3x3
x& 3 = x1

12. Tìm ñiểm (x,y) thuộc parabol :


y = x 2 + 3x − 6

Trang 252
Chương 2: ðiều khiển tối ưu

sao cho khoảng cách từ (x , y) ñến ñiểm có toạ ñộ (2,2) là ngắn nhất . Tính
khoảng cách ñó .
13. a. Tìm hình chữ nhật có diện tích lớn nhất với chu vi p. Nghĩa là tìm x
và y thoả mãn cực ñại hoá hàm :
L( x, y ) = xy
với ñiều kiện ràng buộc : f ( x, y ) = 2 x + 2 y − p = 0
b. Tìm hình chữ nhật có chu vi nhỏ nhất với diện tích cho trước là a 2 .
Nghĩa là cực tiểu hoá hàm :
L ( x, y ) = 2 x + 2 y
với ñiều kiện ràng buộc : f ( x, y ) = xy − a 2 = 0
14. Cho hệ thống :
. 2 2 1
x=  x +  u
1 0  3
Tìm các giá trị tối ưu x∗ , u ∗ , L∗ thoả mãn cực tiểu chỉ tiêu chất lượng :
1 1 0  1  2 1
L = xT   x + uT  u
2 0 2  2 1 1
15. Cho hệ thống :
d2y
=u
dt 2
Tìm tín hiệu ñiều khiển u thoả mãn cực tiểu chỉ tiêu chất lượng :
1
1 
J = ∫  µ u&&2 + ρ u  dt
−1 
2 
với các ñiều kiện ñầu :
y (−1) = y (1) = 0
y& (−1) = y& (1) = 0
16. Cho hệ thống :

di − R u
= i+
dt L L
i: dòng ñiện

Cho R = 1Ω, L = 1H.


a. Tìm phương trình trạng thái của hệ thống .
b. Tìm ñiều khiển tối ưu ñể cực tiểu chỉ tiêu chất lượng J :

Trang 253
Chương 2: ðiều khiển tối ưu

1
J = ∫ u 2 dt
0
với x(0) = 0 và x(1) = 2 .
c. Tìm quỹ ñạo trạng thái tối ưu .
17. Cho hệ thống :
xk +1 = xk uk + uk2
với chỉ tiêu chất lượng:
N −1
J 0 = xN2 + ∑ xk uk
k =0

Cho N = 2 . Tín hiệu ñiều khiển chỉ nhận các giá trị : uk = 1 hoặc uk = −1 .
xk nhận các giá trị -1, 0, 1, 2 .
a. Sử dụng phương pháp quy hoạch ñộng ñể tìm luật ñiều khiển hồi tiếp
trạng thái tối ưu .
b.Với x0 = 2 , hãy tìm tổn hao tối ưu, luật ñiều khiển và quỹ ñạo trạng
thái .
18. Xét hệ tác ñộng nhanh có dạng sau :
d 2x
+x=u
dt 2
u ≤1
Tìm quỹ ñạo pha tối ưu ñể ñưa hệ về gốc toạ ñộ từ một ñiểm bất kỳ .
19. Cho hệ thống :
x&1 = x2
x&2 = u

1
( )
J = ∫ x12 + 2vx1 x2 + qx22 + u 2 dt
20
( )
với q − v 2 > 0 .
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
c. Vẽ quỹ ñạo nghiệm số của hệ thống khi q thay ñổi từ 0 ñến ∞ . Với
giá trị nào của q thì hệ thống ổn ñịnh .
20. Cho hệ thống :
x&1 = x1 + u
x& 2 = − x1 + x2

Trang 254
Chương 2: ðiều khiển tối ưu


1
J = ∫ ( x12 + x 22 + ru 2 ) dt
20
1
với r = .
10
a. Tìm lời giải cho phương trình Riccati ñại số .
b. Tìm ñiều khiển tối ưu và hệ thống vòng kín tối ưu .
21. Cho hệ thống :
x&1 = x2
x&2 = − ax1 − 2 x2 + u
và chỉ tiêu chất lượng :

1
( )
J = ∫ 2 x12 + x22 + u 2 dt
20
a. Vẽ quỹ ñạo nghiệm số của hệ hở khi a thay ñổi từ 0 ñến ∞ . Với giá
trị nào của a thì hệ thống ổn ñịnh .
b. Với a = -8 tìm lời giải cho phương trình ñại số Riccati và hệ số K .
22. Xét hệ rời rạc :
xk +1 = 2 xk + uk
a. Tìm lời giải xk với k = 0 ; 5 nếu x0 = 3 .
b. Xác ñịnh luật uk tổn hao năng lượng tối thiểu ñể ñưa hệ thống từ x0 = 3
về x5 = 0 . Vẽ quỹ ñạo trạng thái tối ưu. Chỉ tiêu chất lượng hệ hở
(q=0):
1 N −1
J = ∑ uk2
2 k =0
c. Tìm luật hồi tiếp trạng thái Kk tối ưu sao cho chỉ tiêu chất lượng J ñạt cực
tiểu :
4
J = 5 x52 + 0.5∑ xk2 + uk2
( )
k =0
Tính hàm tổn thất J tối ưu với k = 0 ; 5 .
23. Xét hệ rời rạc :
xk +1 = axk + buk
1 1 N −1
J = sN xN3 + ∑ qxk3 + ruk3
( )
3 3 k =0
với xk , uk là vô hướng .
a. Tìm phương trình trạng thái, phương trình ñồng trạng thái và ñiều kiện
tĩnh .

Trang 255
Chương 2: ðiều khiển tối ưu

b. Khi nào thì ta có thể tìm ñược luật ñiều khiển tối ưu uk . Với ñiều kiện
ñó , hãy khử uk trong phương trình trạng thái .
c. Tìm lời giải bài toán ñiều khiển vòng hở (trạng thái cuối xN cố ñịnh,
sN = 0 , q = 0 ) .
24. Cho hệ thống ñược mô tả bởi hệ phương trình trạng thái:
 y& = v
 u (t ) ≤ 1
 v& = u
Vẽ quỹ ñạo pha tối ưu ñưa hệ từ trạng thái ban ñầu về gốc tọa ñộ với thời
gian ngắn nhất trong các trường hợp sau ñây:
a. x1(0) = 4, x2(0) = 3
b. x1(0) = 4, x2(0) =- 3
c. x1(0) = -4, x2(0) = -3
d. x1(0) = -4, x2(0) = 3
1. Giải với luật ñiều khiển Bang Bang.
2. Giải với luật ñiều khiển Bang off Bang, T = 45 s
25. Moät taøu chôû haøng goàm ba loaïi sau :
Troïng löôïng w(lb) Giaù thaønh v($)
Maùy röûa cheùn 100 360
Maùy giaët 125 475
Tuû laïnh 250 1000
Ñaët uk laø soá maùy ñöôïc taûi leân taøu cho ba loaïi treân : k=1,2,3
u1 = soá tuû laïnh ñöôïc chôû leân taøu , u2 = soá maùy giaët & u3 = soá maùy röûa
cheùn. wk laø troïng löôïng ,vk laø giaù thaønh .
Ñaët xk laø taûi troïng cho pheùp ñoái vôùi töøng loaïi haøng .
Yeâu caàu haøm chæ tieâu J laø cöïc ñaïi:
3
J = ∑ vk uk
k =1

Vôùi ñieàu kieän raøng buoäc laø taûi troïng ( W ) toái ña taøu ñöôïc pheùp chôû laø
730 lb
3

∑w u
k =1
k k ≤W

1. Thaønh laäp phöông trình traïng thaùi


2. Tìm chieán löôïc taûi haøng toái öu nhaèm ñaït J max.

Trang 256
Chương 3 ðiều khiển thích nghi

Chương 3

ðIỀU KHIỂN THÍCH NGHI

3.1 Khái niệm


3.1.1 ðịnh nghĩa

“Thích nghi là quá trình thay ñổi thông số và cấu trúc hay tác ñộng ñiều
khiển trên cơ sở lượng thông tin có ñược trong quá trình làm việc với mục
ñích ñạt ñược một trạng thái nhất ñịnh, thường là tối ưu khi thiếu lượng
thông tin ban ñầu cũng như khi ñiều kiện làm việc thay ñổi” hay :
“ðiều khiển thích nghi là tổng hợp các kĩ thuật nhằm tự ñộng chỉnh ñịnh các
bộ ñiều chỉnh trong mạch ñiều khiển nhằm thực hiện hay duy trì ở một mức
ñộ nhất ñịnh chất lượng của hệ khi thông số của quá trình ñược ñiều khiển
không biết trước hay thay ñổi theo thời gian”.

Hệ thống ñược mô tả trong hình dưới ñây gồm 2 vòng:


- Vòng hồi tiếp thông thường
- Vòng hồi tiếp ñiều khiển thích nghi

Kết luận

1. ðiều khiển thích nghi liên quan ñến:


- Sự thay ñổi của quá trình ñộng học
- Sự thay ñổi của các nhiễu lên hệ thống
2. Các hệ thống thích nghi là phi tuyến

3.1.2 Nhận dạng hệ thống

• Làm thế nào ñể có ñược mô hình?

Trang 257
Chương 3 ðiều khiển thích nghi

- Vật lí (hộp trắng)


- Kinh nghiệm (hộp ñen)
- Kết hợp ( hộp xám)
• Kế hoạch hoá thực nghiệm
• Chọn lựa cấu trúc mô hình
- Các hàm chuyển ñổi
- ðáp ứng xung
- Các mô hình trạng thái
• Tham số thích nghi
- Thống kê
- Các vấn ñề nghịch ñảo(Inverse Problems)
• Sự hợp lí

3.1.3 Ước lượng tham số thích nghi thời gian thực

1. Giới thiệu
2. Bình phương cực tiểu và hồi qui
3. Hệ thống ñộng
4. Các ñiều kiện thực nghiệm
5. Các ví dụ
6. Các kết luận

3.1.4 Phân loại

Có thể phân loại các hệ thích nghi theo các tiêu chuẩn sau :
1. Hệ thích nghi mô hình tham chiếu ( MRAS )
2. Bộ tự chỉnh ñịnh ( STR )
3. Lịch trình ñộ lợi
4. Hệ tự học
5. Hệ tự tổ chức

Trang 258
Chương 3 ðiều khiển thích nghi

3.1.5 Ứng dụng

• Tự chỉnh ñịnh
• Lịch trình ñộ lợi
• Thích nghi liên tục

Quá trình ñộng học

Biến ñổi Hằng số

Sử dụng bộ ñiều khiển với Sử dụng bộ biến ñổi với


các thông số biến ñổi các thông số hằng

Sự biến thiên Sự biến thiên


không biết trước biết trước

Sử dụng bộ ñiều Sử dụng lịch trình


khiển thích nghi ñộ lợi

Hình 3.1 Sơ ñồ các ứng dụng

Trang 259
Chương 3 ðiều khiển thích nghi

3.2 Hệ thích nghi mô hình tham chiếu – MRAS


(Model Reference Adaptive Systems)

3.2.1 Sơ ñồ chức năng


Hệ thống thích nghi sử dụng mô hình chuẩn là một trong những phương
pháp chính của ñiều khiển thích nghi. Nguyên lí cơ bản ñược trình bày ở
hình 3.2

ym
Mô hình

Tham số ñiều khiển


Cơ cấu hiệu chỉnh

uc
u y
Bộ ñiều khiển ðối tượng

Hình 3.2 Sơ ñồ khối của một hệ thống thích nghi mô hình tham chiếu

Mô hình chuẩn sẽ cho ñáp ứng ngõ ra mong muốn ñối với tín hiệu ñặt (yêu
cầu). Hệ thống có một vòng hồi tiếp thông thường bao gồm ñối tượng và bộ
ñiều khiển. Sai số e là sai lệch giữa ngõ ra của hệ thống và của mô hình
chuẩn e = y - ym. Bộ ñiều khiển có thông số thay ñổi dựa vào sai số này. Hệ
thống có hai vòng hồi tiếp: hồi tiếp trong là vòng hồi tiếp thông thường và
vòng hồi tiếp bên ngoài hiệu chỉnh tham số cho vòng hồi tiếp bên trong.
Vòng hồi tiếp bên trong ñược giả sử là nhanh hơn vòng hồi tiếp bên ngoài.
Hình 3.2 là mô hình MRAS ñầu tiên ñược ñề nghị bởi Whitaker vào năm
1958 với hai ý tưởng mới ñược ñưa ra: Trước hết sự thực hiện của hệ thống
ñược xác ñịnh bởi một mô hình, thứ hai là sai số của bộ ñiều khiển ñược
chỉnh bởi sai số giữa mô hình chuẩn và hệ thống. Mô hình chuẩn sử dụng

Trang 260
Chương 3 ðiều khiển thích nghi

trong hệ thích nghi bắt nguồn từ hệ liên tục sau ñó ñược mở rộng sang hệ rời
rạc có nhiễu ngẫu nhiên.
Chương này tập trung vào ý tưởng cơ bản. ðể vấn ñề ñược trình bày một
cách rõ ràng, ta chỉ tập trung vào cấu hình trong hình 3.2 ñược gọi là hệ
MRAS song song . ðây là một trong nhiều cách có thể xây dựng mô hình
chuẩn. Chương này ñề cập chính ñến hệ liên tục theo phương pháp trực tiếp
có nghĩa là tham số ñược cập nhật một cách trực tiếp.

3.2.2 Luật MIT (Massachusetts Institude Technology)


( MIT = Massachusetts Institute Technology : Viện công nghệ
Massachusetts)

e uC − y
Khâu tích phân

∂e

∂θ γ θ u
π s
π

Hình 3.3 Mô hình sai số


Hệ thống thích nghi mô hình tham chiếu ñầu tiên ñược ñưa ra ñể giải quyết
vấn ñề: các ñặc ñiểm của một mô hình tham chiếu yêu cầu ngõ ra là quá
trình lí tưởng cần có ñáp ứng ñối với tín hiệu ñiều khiển như thế nào. ðồ thị
minh họa trong hình 3.2. Trong trường hợp này, mô hình tham chiếu mang
tính song song hơn là nối tiếp, giống như cho SOAS (Self Oscillating
Adaptive Systems). Bộ ñiều khiển có thể ñược xem như bao gồm hai vòng:
một vòng phía trong gọi là vòng hồi tiếp thông thường có quá trình và bộ
ñiều khiển. Các thông số của bộ ñiều khiển ñược chỉnh ñịnh bởi vòng ngoài
sao cho sai số e giữa ngõ ra y và ngõ ra mô hình ym là nhỏ nhất. Vì vậy vòng
ngoài còn ñược gọi là vòng chỉnh ñịnh. Vấn ñề là xác ñịnh cơ cấu chỉnh
ñịnh cho hệ thống ổn ñịnh, nghĩa là sai số bằng zero. ðiều này không thể
thực hiện ñược. Cơ cấu chỉnh ñịnh với thông số sau ñược gọi là luật MIT,
ñược sử dụng cho hệ MRAS ñầu tiên:
dθ ∂e
= −γ e
dt ∂θ

Trang 261
Chương 3 ðiều khiển thích nghi

Trong phương trình này e là sai số của mô hình e = y – ym. Các thành phần
của vector ∂e/∂θ là ñạo hàm ñộ nhạy của sai số ñối với các thông số chỉnh
ñịnh θ.Thông số γ xác ñịnh tốc ñộ thích nghi. Luật MIT có thể ñược giải
thích như sau. Giả sử rằng các thông số θ thay ñổi chậm hơn nhiều so với
các biến khác của hệ thống. ðể bình phương sai số là bé nhất, cần thay ñổi
các thông số theo hướng gradient âm của bình phương sai số e2.
Giả sử muốn thay ñổi thông số của bộ ñiều khiển sao cho sai số giữa ngõ ra
của ñối tượng và của mô hình chuẩn tiến tới zero. ðặt e là sai số và θ là
thông số hiệu chỉnh. Chỉ tiêu chất lượng :
1 2
J(θ ) = e (3.1)
2
ñể làm cho J(θ) MIN thì cần phải thay ñổi các thông số theo hướng âm của
gradient J, có nghĩa là :
∂θ ∂J ∂e
= −γ = − γe (3.2)
∂t ∂θ ∂θ
Giả sử rằng các thông số cần thay ñổi θ thay ñổi chậm hơn nhiều so với các
∂e
biến khác của hệ thống. Vì vậy ñạo hàm ñược tính với giả thiết θ là
∂θ
∂e
hằng số. Biểu thức ñạo hàm gọi là hàm ñộ nhạy của hệ thống. Luật ñiều
∂θ
∂e
chỉnh theo phương trình (3.2) với là ñộ nhạy thì có liên hệ giống như
∂θ
luật MIT. Cách chọn hàm tổn thất theo phương trình (3.1) có thể là tuỳ ý.
Nếu chọn
J(θ ) = e (3.3)
Khi ñó luật hiệu chỉnh sẽ là :
dθ ∂e
= −γ sign(e) (3.4)
dt ∂θ
Hoặc
dθ  ∂e 
= − γ sign  sign(e)
dt  ∂θ 
ðây gọi là giải thuật dấu - dấu. Hệ rời rạc sử dụng giải thuật này ñược ứng
dụng trong viễn thông nơi ñòi hỏi tính toán nhanh và thực hiện ñơn giản.

Trang 262
Chương 3 ðiều khiển thích nghi

Phương trình (3.2) còn ñược áp dụng trong trường hợp có nhiều thông số
∂e
hiệu chỉnh, khi ñó θ trở thành một vector và là gradient của sai số ñối
∂θ
với các thông số tương ứng. Ứng dụng của luật MIT ñược biểu diễn bằng
hai ví dụ sau :

Ví dụ 3.1 - Hiệu chỉnh ñộ lợi nuôi tiến


Xét vấn ñề hiệu chỉnh ñộ lợi nuôi tiến với mô hình và ñối tượng ñều có hàm
truyền là G(S). Sai số là:
e = y – ym = G(p)θ uc – G(p)θ° uc
với uc là tín hiệu ñặt, ym là ngõ ra mô hình, y là ngõ ra ñối tượng, θ là thông
số hiệu chỉnh, và p = d/dt là toán tử vi phân. ðộ nhạy khi ấy bằng :
∂e
= G(p)uc = ym /θ°
∂θ
Luật MIT ñược cho :

= - γ’yme/θ°
dt
Nếu dấu của θ° ñược biết, khi ấy ñưa ra γ = γ’/θ°
Sự thay ñổi của tham số θ tỉ lệ với tích sai số e và ngõ ra của mô hình ym.
Ví dụ trên không dùng việc xấp xỉ : Khi luật MIT ñược áp dụng vào những
vấn ñề phức tạp hơn thì cần phải có xấp xỉ ñể tính ñược ñộ nhạy.

Ví dụ 3.2 MRAS cho hệ bậc nhất


Xét hệ thống ñược mô tả bởi phương trình:
dy
= − ay + bu (3.5)
dt
với u là biến ñiều khiển, y là ngõ ra ñược ño lường.
Giả sử mong muốn có ñược hệ vòng kín ñược mô tả bởi:
dy m
= - amym + bmuc
dt
Mô hình kèm theo hoàn hảo có thể ñạt ñược với bộ ñiều khiển :

Trang 263
Chương 3 ðiều khiển thích nghi

u(t) = t 0 uc(t) – s 0 y(t) (3.6)


với tham số t0 = bm / b ; s0 = (am – a)/b
Chú ý hồi tiếp sẽ là dương nếu am < a, nghĩa là mô hình mong muốn thì
chậm hơn quá trình. ðể áp dụng luật MIT , sử dụng sai số e = y – ym , với y
là ngõ ra hệ kín.
Theo phương trình (3.5) và (3.6) thì:
bt 0
y = uc
p + a + bs 0
với p là toán tử vi phân. ðộ nhạy có thể tính ñược bằng cách lấy ñạo hàm
riêng phần theo tham số của bộ ñiều khiển s0 và t0 :
∂e b
= uc
∂t 0 p + a + bs 0
∂e b 2t0 b
= - u = -
2 c
y
∂s 0 ( p + a + bs 0 ) p + a + bs 0
Các công thức này không thể dùng vì thông số ñối tượng a và b chưa biết.
Vì vậy cần phải làm xấp xỉ ñể có ñược luật hiệu chỉnh tham số thực tế. ðể
thực hiện ñiều này, ñầu tiên cần quan sát với giá trị tối ưu của tham số bộ
ñiều khiển, ta có :
p + a + bs0 = p + am
Hơn nữa cần chú ý là b có thể ñược bao gồm trong hệ số tốc ñộ thích nghi γ.
Bởi vì nó xuất hiện trong tích γb, ñiều này ñòi hỏi dấu của b phải ñược biết.
Sau khi xấp xỉ, luật cập nhật các tham số ñiều khiển có ñược là:
dt 0  1 
= − γ  u c e
dt  p + am 

ds 0  1  (3.7)
= γ  y e
dt  p + am 

Ví dụ trên chỉ cách sử dụng luật MIT ñể tạo ñược luật hiệu chỉnh thông số.
Kết quả mô phỏng hệ MRAS trong ví dụ 3.2 các với thông số như sau:
 a = 1, b = 0.5, am = 2 và bm = 2.
 Tín hiệu vào là sóng vuông với biên ñộ bằng 1 và γ = 2.

Trang 264
Chương 3 ðiều khiển thích nghi

ðáp ứng của ngõ ra y, ngõ ra tham chiếu ym và tín hiệu ñiều khiển u.
Nhận xét:
 Hệ thống vòng kín ñã ñạt ñến ñáp ứng mong muốn chỉ sau một thời
gian ngắn.
 Tốc ñộ hội tụ phụ thuộc vào hai thông số là γ và b
ðiều ñáng quan tâm nhất qua ví dụ trên là cách mà luật MIT ñược sử dụng
ñể hiệu chỉnh các thông số.
 Nó không nhất thiết ñòi hỏi phải có một mô hình kèm theo hoàn hảo.
Và quá trình này có thể áp dụng cho hệ phi tuyến.
 Ví dụ này ñã sử dụng lại cấu trúc như hình 3.3. Có 2 bộ nhân ñược
∂e
sử dụng.Trong ñó: bộ nhân thứ nhất là của e và , và phương
∂θ
trình 3.7 cung cấp thông số cho bộ nhân thứ hai.
 Việc xấp xỉ là rất quan trọng bởi vì nếu xấp xỉ tốt ta sẽ có ñược luật
hiệu chỉnh thông số ñáng tin cậy.
Luật MIT sẽ ñạt hiệu quả cao nếu như ta chọn ñộ thích nghi γ nhỏ. Tuy
nhiên, giới hạn này còn tùy thuộc vào biên ñộ của tín hiệu chuẩn cũng như
là ñộ lợi của hệ thống. Trong một số trường hợp, luật MIT có thể làm mất
tính ổn ñịnh của hệ thống. Do ñó, khi sử dụng luật hiệu chỉnh ta cũng cần
phải quan tâm ñến tính ổn ñịnh của hệ thống.

Trang 265
Chương 3 ðiều khiển thích nghi

Vài tính chất sau cần chú ý:


1. Không cần thiết ñòi hỏi một mô hình kèm theo hoàn hảo. Các thủ tục có
thể ñược áp dụng cho hệ phi tuyến. Phương pháp này cũng có thể ñược dùng
ñể ñiều khiển cho hệ biết trước một phần.
∂e
2. Cấu trúc như hình 3.3 có một phép nhân giữa e và .
∂θ

Lấy tích phân phương trình (3.7) sẽ cho ra các tham số và ñược truyền ñến
bộ ñiều khiển sử dụng phép nhân thứ hai.
3. Sự xấp xỉ là cần thiết ñể có ñược luật ñiều khiển hiệu chỉnh tham số thực
tế.
Luật MIT có thể thực hiện tốt nếu ñộ lợi thích nghi γ là nhỏ. ðộ lớn γ tuỳ
thuộc vào biên ñộ của tín hiệu chuẩn và ñộ lợi của ñối tượng. Vì vậy không
thể có một giới hạn cố ñịnh ñảm bảo an toàn do ñó luật MIT có thể cho một
hệ vòng kín không an toàn. Luật hiệu chỉnh bổ sung có thể ñược dùng bằng
lí thuyết ổn ñịnh. Những luật này tương tự luật MIT nhưng các hàm ñộ nhạy
thì ñương nhiên là khác. Ý này ñược trình bày nhiều hơn trong mục 3.2.4

3.2.3 Nội dung, phương pháp thiết kế MRAS


Có ba phương pháp cơ bản ñể phân tích và thiết kế hệ MRAS :
•Phương pháp tiếp cận Gradient
•Hàm Lyapunov
•Lý thuyết bị ñộng

Phương pháp gradient ñược dùng bởi Whitaker ñầu tiên cho hệ MRAS.
Phương pháp này dựa vào giả sử tham số của bộ hiệu chỉnh thay ñổi chậm
hơn các biến khác của hệ thống. Giả sử này thừa nhận có sự ổn ñịnh giả cần
thiết cho việc tính toán ñộ nhạy và cho cơ cấu hiệu chỉnh thích nghi.
Phương pháp tiếp cận gradient không cho kết quả cần thiết cho hệ thống kín
ổn ñịnh. Bộ quan sát ñược ñưa ra ñể áp dụng lý thuyết ổn ñịnh Lyapunov
và lí thuyết bị ñộng ñược dùng ñể bổ sung cho cơ cấu thích nghi.
ðối với hệ thống có tham số ñiều chỉnh ñược như trong hình 3.2, phương
pháp thích nghi sử dụng mô hình chuẩn cho một cách hiệu chỉnh tham số
tổng quát ñể có ñược hàm truyền hệ thống vòng kín gần với mô hình. ðây
gọi là vấn ñề mô hình kèm theo. Một câu hỏi ñặt ra là chúng ta làm cho sai

Trang 266
Chương 3 ðiều khiển thích nghi

lệch nhỏ như thế nào, ñiều này phụ thuộc bởi mô hình, hệ thống và tín hiệu
ñặt. Nếu có thể làm cho sai số bằng 0 ñối với mọi tín hiệu yêu cầu thì gọi là
mô hình kèm theo hoàn hảo.

Mô hình kèm theo


Vấn ñề mô hình kèm theo có thể ñược giải quyết bằng thiết kế phân số cực
(miêu tả ngắn gọn về thiết kế phân cực ñược cho trong phụ lục A
(TLTK[1])). Mô hình kèm theo là cách ñơn giản ñể thiết lập hay giải một
vấn ñề ñiều khiển tuỳ ñộng. Mô hình sử dụng có thể là tuyến tính hay phi
tuyến. Các tham số trong hệ thống ñược hiệu chỉnh ñể có ñược y càng gần
với ym càng tốt ñối với một tập các tín hiệu vào. Phương pháp thích nghi là
một công cụ thiết kế hệ MRAS, vấn ñề này ñược trình bày trong mục 3.2.4.
Mặc dù mô hình kèm theo hoàn hảo chỉ có thể ñạt ñược trong ñiều kiện lý
tưởng nhưng phân tích trường hợp này sẽ cho hiểu biết sâu sắc vào vấn ñề
thiết kế.
Xét hệ 1 ñầu vào,1 ñầu ra có thể là liên tục hay rời rạc có phương trình:
B
y(t) = u (t ) (3.8)
A
với u là tín hiệu ñiều khiển, y là ngõ ra. Kí hiệu A, B là những ña thức theo
biến S hay Z. Giả sử bậc của A ≥ bậc của B nghĩa là hệ thống là hợp thức
(ñối với hệ liên tục) và nhân quả ñối với hệ rời rạc. Giả sử hệ số bậc cao
nhất của A là 1.Tìm bộ ñiều khiển sao cho quan hệ giữa tín hiệu ñặt uc và tín
hiệu ra mong muốn ym ñược cho bởi :
Bm
ym = u c (t ) (3.9)
Am
với Am, Bm cũng là những ña thức theo biến S hoặc Z.
Luật ñiều khiển tổng quát ñược cho bởi :
Ru = Tu c − Sy (3.10)
với R, S, T là các ña thức. Luật ñiều khiển này ñược xem như vừa có thành
phần hồi tiếp âm với hàm truyền –S/R và thành phần nuôi tiến với hàm
truyền T/R. Xem hình 3.4

Trang 267
Chương 3 ðiều khiển thích nghi

Bộ ñiều khiển Quá trình


uC
u y
Ru = Tu C − Sy B
A

Hình 3.4 Hệ vòng kín với bộ ñiều khiển tuyến tính tổng quát

Khử u ở 2 phương trình (3.8) và (3.10) ñược phương trình sau cho hệ thống
vòng kín :
( AR + BS ) y = BTu c (3.11)
ðể ñạt ñược ñáp ứng vòng kín mong muốn, thì AR + BS phải chia hết cho
Am, các zero của ñối tượng, khi cho B = 0, sẽ là zero của hệ kín nếu không
bị khử bởi cực vòng kín.
Bởi vì các ñiểm zero không ổn ñịnh không thể bị khử nên có thể phân tích
thành B = B+B-, trong ñó B+ chứa những thành phần có thể khử ñi, B- là
thành phần còn lại.
Theo phương trình (3.11) AR + BS là ña thức ñặc trưng của hệ thống ñược
phân tích thành ba thành phần : khử zero của ñối tượng:B+ ; cực mong muốn
của mô hình ñược cho bởi Am; các cực của bộ quan sát A0. Vì thế :
AR + BS = B+A0Am (3.12)
gọi là phương trình Diophantine ( hay là phương trình nhận dạng Benzout).
Vì B+ có thể khử nên :
R = B + R1 (3.13)
Chia phương trình (3.12) cho B+ sẽ ñược:
A .R1 + B -.S = A0Am (3.14)
Vì yêu cầu là phải giống ñáp ứng mong muốn nên tử số (3.11) phải chia hết
cho Bm, nếu không thì sẽ không có lời giải cho bài toán thiết kế. Vì vậy :
Bm = B -.B’m (3.15)
T = A0B’m
ðiều kiện ñể ñảm bảo tồn tại lời giải là :
bậc( A0) ≥ 2 bậc(A) - bậc( Am) - bậc(B+) - 1

Trang 268
Chương 3 ðiều khiển thích nghi

bậc( Am) - bậc (Bm) ≥ bậc( A) - bậc(B)


Những ñiều kiện này ñược cho trong phụ lục A (TLTK[1]).
Giả sử tất cả các zero ñều bị khử, khi ñó có thể viết (3.14) lại như sau :
A0Am = AR1 + b0S
Nhân 2 vế cho y và dùng thêm phương trình (3.8) ta ñược :
A0.Am.y = BR1u + b0Sy
= b0(Ru + Sy) (3.16)
Các thông số ở vế trái ñã biết, vế phải chưa biết. ða thức T có ñược trực tiếp
từ phương trình (3.15). Các tham số mô hình của phương trình (3.16) bây
giờ có thể ñược dùng ñể ước lượng các tham số chưa biết của bộ ñiều khiển
(chương 3 TLTK[1]). ðiều này dẫn ñến hệ MRAS trực tiếp. Lời giải tổng
quát ñược trình bày trong chương 4 TLTK[1].

Hệ tuyến tính tổng quát


Hệ SISO ñược mô tả bởi phương trình sau:
Ay = Bu
Với ñặc tính hệ thống mong muốn ñạt ñược là:
Amym = Bmuc
Bộ ñiều khiển:
Ru = Tuc - Sy (*)
Hệ vòng kín ñược mô tả:
BT
y = uC
AR + BS
Thay y vào (*) ta tính ñược:
AT
u = uC
AR + BS
Sai số là: e = y - ym
Bây giờ cần phải xác ñịnh các ñạo hàm riêng của sai số ñối với từng tham số
hiệu chỉnh ñể tìm luật chỉnh ñịnh thông số các hàm ñộ nhạy.
ðặt ri , si , ti là các hệ số của ña thức R, S, T. Các hàm ñộ nhạy ñược cho
bởi:

Trang 269
Chương 3 ðiều khiển thích nghi

BT B u
e = uC − m C
AR + BS Am
∂e BTAp k −i Bp k −i
→ = − u C = − u i = 1,. . , k
∂ri ( AR + BS ) 2 AR + BS
∂e BTBp l −i Bp l −i
= − u = − y
∂s i ( AR + BS ) 2
C
AR + BS i = 0, K , l

∂e Bp m −i
= uC i = 0,…,m
∂t i AR + BS
Trong ñó k = bậc(R), l = bậc(S), m = bậc(T).
Vế phải các phương trình trên còn chứa A, B là các thông số chưa biết nên
không tính ñược các hàm ñộ nhạy. Một cách xấp xỉ ñể có ñược luật cập nhật
có thực tế là:
AR + BS ≈ A0AmB+
Suy ra các hàm ñộ nhạy:
∂e B − p k −i
≈ − u
∂ri A0 Am
Tương tự cho si và ti
Tuy nhiên vế phải vẫn còn B- là chưa biết. Nếu tất cả các zero ñều ñược
khử, khi ñó ta có B- = b0. Nếu dấu của b0 biết ñược thì có thể thực hiện
ñược luật cập nhật thông số. Thành phần b0 có thể ñược bao gồm trong cả γ.
Nên có thể suy ra luật cập nhật hiệu chỉnh các thông số như sau:
dri p k −i
= γe u i = 1,…, k = bậc(R )
dt A0 Am
ds i p l −i
= γe y i = 0,..., l = bậc(S)
dt A0 Am
dt i p m −i
= − γe uC i = 0,..., m = bậc(T)
dt A0 Am

Trang 270
Chương 3 ðiều khiển thích nghi

Nhận xét:
1
- Cần phải xây dựng 3 trạng thái của bộ lọc cho luật hiệu chỉnh trên.
A0 Am
1
- Sự thay ñổi các tham số này tỉ lệ với tích sai số e và tín hiệu bộ lọc
A0 Am
- ðể có ñược luật ñiều chỉnh các tham số trên cần phải giả sử các zero phải
ổn ñịnh và dấu của b0 phải ñược biết.
- Có thể tránh ñược giả sử này bằng cách sử dụng các thuật toán phức tạp
hơn như ước lượng trạng thái…

• Tiêu chuẩn cực tiểu hoá


- Luật MIT có thể ñược sử dụng cho các hàm tổn thất khác.
- Luật hiệu chỉnh các thams số có thể ñạt ñược bằng cách tính gradient
hàm tổn thất ñối với các tham số và sự thay ñổi các tham số phải ngược
dấu với gradient.
- Phương pháp này cần biết các tham số của mô hình ñối tượng ñể tính
toán ñộ nhạy. Tuy nhiên ñiều này là không có thực và do ñó có thể sử
dụng phương pháp xấp xỉ hay bằng các bộ ước lượng thông số.

Sai số và sự hội tụ tham số


Hệ thống thích nghi sử dụng mô hình chuẩn dựa vào ý tưởng là làm cho sai
số e = y – ym tiến tới zero. ðiều này không có nghĩa là các tham số ñiều
khiển tiến tới giá trị ñúng của nó (ví dụ như trường hợp tín hiệu = 0).

Ví dụ 3.3 Hội tụ sai số


Giả sử hệ thống có sơ ñồ như hình 3.5:
Ngõ ra: y = u
Luật ñiều khiển: u = θ uc
Mô hình: ym = θ 0uc
Sai số: e = y – ym = θuc - θ 0uc = (θ - θ 0)uc
Luật hiệu chỉnh tham số theo phương pháp gradient:

Trang 271
Chương 3 ðiều khiển thích nghi

dθ ∂e
= − γe = − γu c2 (θ − θ 0 )
dt ∂θ
Lời giải cho phương trình vi phân ở trên là:

θ (t ) = θ 0 + [θ (0) − θ 0 ] e −γI t
(*)
t
Trong ñó: It = ∫ u c2 (τ )dτ
0

θ (0) là giá trị ban ñầu của θ.


Và vì vậy sai số e trở thành:

e(t) = uc(t) [θ (0) − θ 0 ] e −γI t


Do It >0 nên khi t→∞ thì e(t) →0 ngay cả khi tín hiệu ñiều khiển uc(t) → 0.
Mô hình
ym

θ0G(s)

-
γ e
- π Σ
s

θ ðối tượng +
y
uc u
π G(s)

Hình 3.5 Mô hình hội tụ sai số


Giá trị giới hạn của θ phụ thuộc vào tính chất của uc(τ) (hội tụ hoặc phân
kì) ( do θ(t) tính theo biểu thức (*) ).
Ví dụ trên cho biết ñược sai số e → 0 tuy nhiên tham số θ không tiến ñến
giá trị ñúng của nó. ðây là tính chất của hệ thống thích nghi sử dụng mô
hình chuẩn. ðiều kiện chính xác ñể hội tụ tham số là tín hiệu kích thích
phải luôn tồn tại.

Trang 272
Chương 3 ðiều khiển thích nghi

Ổn ñịnh của vòng ñiều khiển thích nghi

Ở ví dụ trên ñộ biến thiên tham số θ tỉ lệ với bình phương tín hiệu ñiều
khiển uc. ðiều này hợp lí trong một số trường hợp là khi tín hiệu ñiều khiển
uc càng lớn thì càng dễ phát hiện giá trị bị sai của θ.
Tuy nhiên ñộ thay ñổi của tham số ñiều chỉnh phụ thuộc vào biên ñộ của tín
hiệu ñiều khiển có thể dẫn ñến không ổn ñịnh. Ví dụ sau ñây cho luật ñiều
khiển không phụ thuộc vào uc:

Ví dụ 3.4
Giả sử hệ thống có mô hình ở hình 3.6:

ym
θ0 G
-
Mô hình Gm e
uc Σ π

y +
π G

θ γ
-
s

Cơ cấu hiệu chỉnh

Hình 3.6 Hệ thống thích nghi mô hình tham chiếu cho việc chỉnh ñịnh ñộ lợi
nuôi tiến
Vấn ñề là ñiều chỉnh θ → θ 0. Giả sử hàm truyền ñược cho bởi:
1
G (s) =
s 2
+ a1 s + a 2

Trang 273
Chương 3 ðiều khiển thích nghi

Sai số e = G(p)( θ - θ 0 ) uc
Trong ñó p biểu thị cho phép lấy ñạo hàm. Vì vậy:
∂e y
= G(p)uc = m0
∂θ θ
ðiều chỉnh tham số theo luật MIT:
dθ ∂e y γ′
= − γ ′e = − γ ′e m0 = − γ e y m với γ =
dt ∂θ θ θ0
Hệ thống ñiều khiển thích nghi vì vậy biểu diễn ñược bởi các phương trình
vi phân sau:
d 2 ym dy
2
+ a1 m + a 2 y m = θ 0 u c (I)
dt dt
d2y dy
2
+ a1 + a2 y = θ uc (II)
dt dt

= − γ e ym = − γ ( y − ym ) ym (III)
dt
Phương trình (I) có thể giải ñược nếu cho sẵn hàm uc , xem như biến ym biết
trước
ðạo hàm (II) ta ñược:
d3y d2y dy dθ du
3
+ a1 2
+ a2 = u c + θ (t ) c
dt dt dt dt dt

Thay (III) vào ta ñược:


d3y d2y dy du
+ a1 + a2 = − γ ( y − y m ) y m u c + θ (t ) c
dt dt dt dt
du c
= − γ y m (t )u c (t ) y (t ) + γ y m2 (t )u c + θ (t )
dt
Suy ra:
d3y d2y dy du
3
+ a1 2
+ a2 + γu c (t ) y m (t ) y (t ) = θ (t ) c + γu c (t ) y m2 (t )
dt dt dt dt
ðây là phương trình vi phân tuyến tính biến thiên theo thời gian.
ðể hiểu ñược hệ thống, ta thực hiện cách thử như sau:

Trang 274
Chương 3 ðiều khiển thích nghi

- ðầu tiên giả sử u c là hằng số u c0


- Ngõ ra mô hình khi ñó sẽ có giá trị cân bằng là y m0 .
Giả sử cơ cấu hiệu chỉnh thích nghi ñược nối vào khi ñạt ñến ñiểm cân bằng
(trạng thái cân bằng). Khi ñó phương trình (II) ở trên sẽ có các hệ số hằng
và có lời giải trạng thái cân bằng là:
y (t ) = y m0 = θ 0 u c0 / a 2
γ′
ổn ñịnh nếu a1 a 2 > γu c0 y m0 = (u c0 ) 2
a2
Luật hiệu chỉnh bổ sung
Những hiểu biết có ñược từ việc tính toán trong ví dụ 3.3 chỉ ra rằng cần
phải bổ sung cho luật MIT. Luật MIT là phương pháp gradient cơ bản. ðộ
giảm có ñược bằng luật MIT ñược quyết ñịnh bởi tham số γ, số này là do
người dùng chọn.
Có thể ñạt ñược phương pháp gradient bổ sung mà tỉ lệ hiệu chỉnh không
phụ thuộc vào biên ñộ của tín hiệu (ñặt) yêu cầu. Một khả năng là làm chuẩn
hoá và thay thế luật MIT bởi:
∂e
e
dθ ∂θ
= −γ T
dt  ∂e   ∂e 
α +    
 ∂θ   ∂θ 
Tham số α > 0 ñược ñưa vào ñể tránh trường hợp chia cho 0.
Có thể nhận thấy rằng tỉ lệ hiệu chỉnh tham số phụ thuộc vào biên ñộ của tín
hiệu yêu cầu một lượng nhỏ bởi vì do nhiễu ño lường.

Trình tự giải quyết bài toán ñiều khiển thích nghi:

• ðặt vấn ñề
• Giải thuật
• Thiết kế
• Kết quả mô phỏng
• Luật hiệu chỉnh bổ sung
• ðiều kiện hoạt ñộng ổn ñịnh
• Kết luận

Trang 275
Chương 3 ðiều khiển thích nghi

Một số ví dụ minh họa:


Ví dụ 3.5:
1. ðặt vấn ñề:

Xét một quá trình có hàm truyền:


Y (s) b
G (s) = =
U ( s ) s ( s + 1)

Trong ñó: b: thông số thay ñổi theo thời gian.


Y(s): ñầu ra quá trình
U(s): ñầu vào quá trình
Cần thiết kế bộ ñiều khiển sao cho hàm truyền ñạt của ñáp ứng vòng kín hệ
thống thể hiện hàm truyền ñạt mong muốn:
Y ( s) 1
Gm ( s) = m = 2
U c ( s) s + s + 1
Trong ñó: Ym ( s ) : ñầu ra mong muốn
U c ( s ) : ñầu vào hệ thống

• Nếu dùng bộ ñiều khiển kinh ñiển:


Giả sử ta dùng bộ ñiều khiển P kinh ñiển ñể thực hiện yêu cầu trên

Hàm truyền ñạt vòng kín của hệ thống:


Y ( s) kG ( s ) kb
Gc ( s ) = = = 2
U c ( s ) 1 + kG ( s ) s + s + kb
Ta chọn hệ số tỉ lệ k ñể Gc ( s ) tiến ñến hàm truyền ñạt mong muốn Gm ( s ) :
kb 1
Gc ( s ) = 2 ≡ Gm ( s ) = 2
s + s + kb s + s +1
1
Suy ra: kb = 1 hay k =
b

Trang 276
Chương 3 ðiều khiển thích nghi

Biểu thức trên chỉ ra rằng ñể hệ thống ñạt ñược hàm truyền ñạt mong muốn
thì hệ số k của bộ ñiều khiển phải liên tục ñược cập nhật theo thông số b của
quá trình. Nếu ñiều này không thỏa mãn, bộ ñiều khiển sẽ không làm tốt
chức năng ñiều khiển của nó. ðiều này ñược minh họa bằng kết quả mô
phỏng bộ ñiều khiển P trên với hệ số tỉ lệ k = 0.2:

k = 0.2, b = 5, sai số bình phương trung bình = 0

k = 0.2, b = 1, số bình phương trung bình = 0.6758

k = 0.2, b = 0.5, số bình phương trung bình = 2.7388

• Như vậy, bộ ñiều khiển kinh ñiển không thể tự cập nhật hệ số tỉ lệ k
theo thông số b của quá trình. Do ñó không thể sử dụng ñể ñiều khiển
quá trình ñược. Vấn ñề ñặt ra là thiết kế một bộ ñiều khiển sao cho nó
có thể thích nghi với quá trình khi thông số b thay ñổi theo thời gian
trong một khoảng tương ñối rộng. Bộ ñiều khiển thích nghi mô hình
tham chiếu (MRAS) có thể giải quyết bài toán này.

Trang 277
Chương 3 ðiều khiển thích nghi

Phương pháp thiết kế ñược chọn là phương pháp tiếp cận Gradient.

Sơ ñồ khối tổng quát của hệ thống với bộ ñiều khiển thích nghi

2. Giải thuật:
Hàm truyền ñạt vòng hở của quá trình:
Y (s) b
G (s) = = (2.1)
U ( s ) s ( s + 1)
⇔ ( s + s )Y ( s ) = bU ( s )
2

⇒ ( p 2 + p) y = bu (2.2)
d
Trong ñó p là toán tử vi phân
dt
Luật ñiều khiển:
u = k ( uc − y ) (2.3)
Thay (2.3) vào (2.2) ta ñược:
⇒ ( p 2 + p) y = bk ( uc − y )
⇔ (p 2
)
+ p + bk y = bkuc (2.4)
bk
⇔ y= uc (2.5)
p + p + bk
2

Sai số của hệ thống vòng kín:


e = y − ym (2.6)
Từ phương trình (2.5) suy ra ñộ nhạy của sai số theo hệ số tỉ lệ k:
∂e ∂y b( p 2 + p + bk ) − b 2 k
= = uc
∂k ∂k ( p 2 + p + bk ) 2

Trang 278
Chương 3 ðiều khiển thích nghi

∂e b( p 2 + p )
⇒ = 2 uc (2.7)
∂k ( p + p + bk )2

Do ñó, theo MIT, luật cập nhật hệ số tỉ lệ k có dạng:


dk ∂e  b( p 2 + p ) 
= −γ ' e = −γ ' ( y − ym )  2 u
2 c
(2.8)
dt ∂k  ( p + p + bk ) 
Phương trình (2.8) không thể sử dụng trực tiếp ñể cập nhật hệ số tỉ lệ k của
bộ ñiều khiển ñược do thông số b của quá trình là không biết ñược. Do ñó
phải sử dụng phép xấp xỉ ñể loại bỏ ñi thông số chưa biết này.
Hàm truyền ñạt mong muốn của hệ thống vòng kín:
Y ( s) 1
Gm ( s) = m = 2
U c ( s) s + s + 1
⇔ ( s + s + 1) Y (s) = U (s)
2
m c

⇔ ( p + p + 1) y = u
2
m c (2.9)
uc
⇔ ym = (2.10)
p + p +1
2

Khi hàm truyền ñạt của hệ thống ñạt tới hàm truyền ñạt mong muốn thì
phương trình (2.4) sẽ ñạt tới phương trình mong muốn (2.9):
( p 2 + p + bk ) y = bkuc ≡ ( p 2 + p + 1) ym = uc
Hay: bk = 1 . Do ñó phương trình (2.8) có thể xấp xỉ:
dk  b( p 2 + p ) 
= −γ ' ( y − ym )  2 u
2 c
(2.11)
dt  ( p + p + 1) 
Hơn nữa, ñặt γ = γ 'b , một lần nữa phương trình (2.11) có thể xấp xỉ:
dk  p2 + p 
= −γ ( y − ym )  2 uc  (2.12)
 ( p + p + 1)
2
dt 

Phương trình (2.12) ñã loại bỏ thông số b qua 2 phép xấp xỉ do ñó có thể sử


dụng ñể cập nhật hệ số tỉ lệ k của bộ ñiều khiển.

Một câu hỏi ñặt ra là 2 phép xấp xỉ này ảnh hưởng như thế nào tới
chất lượng ñiều khiển. Như ñã biết, hàm truyền ñạt vòng kín của hệ thống
chỉ có thể hội tụ về hàm truyền ñạt vòng kín mong muốn khi thông số γ
ñược chọn ñủ nhỏ. Phép xấp xỉ γ = γ 'b ñã gộp thông số b thay ñổi theo thời
gian vào γ , hay nói cách khác γ cũng trở thành thay ñổi theo thời gian.

Trang 279
Chương 3 ðiều khiển thích nghi

γ tượng trưng cho tốc ñộ hội tụ về hàm truyền ñạt vòng kín mong
muốn của hệ thống (tốc ñộ thích nghi). Do ñó, nếu γ nhỏ (khi thông số b
nhỏ), hệ thống sẽ hội tụ chậm. Nếu γ lớn (khi thông số b lớn), tính ổn ñịnh
của hệ thống sẽ không ñược bảo ñảm và hệ thống sẽ không ñiều khiển ñược.
Như vậy, bộ ñiều khiển chỉ có thể thích nghi khi thông số b của quá trình
thay ñổi trong một giới hạn cho phép.

Phép xấp xỉ bk = 1 không ảnh hưởng ñáng kể ñến chất lượng ñiều
khiển vì một khi hệ thống vòng kín tiến ñến hàm truyền ñạt mong muốn thì
phép xấp xỉ này cũng tiến ñến một phép toán chính xác.
Nói tóm lại, tính ổn ñịnh của hệ thống phụ thuộc nhiều vào thông số
b của quá trình. Việc lựa chọn thông số γ ' của bộ ñiều khiển thích nghi phải
căn cứ vào tầm thay ñổi của thông số b khi hệ thống hoạt ñộng.

3. Thiết kế:

Trong ñó:
• Khối Process: quá trình cần ñiều khiển
Y (s) b
G (s) = =
U ( s ) s ( s + 1)

• Khối Model: hàm truyền ñạt mong muốn của hệ thống vòng kín
Y ( s) 1
Gm ( s) = m = 2
U c ( s) s + s + 1

Trang 280
Chương 3 ðiều khiển thích nghi

• Khối Regulator: luật ñiều khiển


u = k (uc − y )

• Khối Adjustment mechanism: là khối quan trọng nhất của bộ ñiều


khiển thích nghi, có chức năng hiệu chỉnh hệ số tỉ lệ k của khối
Regulator theo luật cập nhật thông số MIT
dk  p2 + p 
= −γ ( y − ym )  2 u
2 c
dt  ( p + p + 1) 
dk  p2 + p 
Suy ra: = −γ ( y − ym )  4 uc 
 p + 2p + 3p + 2p +1 
3 2
dt

4. Kết quả mô phỏng:

Giả sử tầm thay ñổi của b là [ 0.1 ÷ 10] , tốc ñộ hội tụ γ ' = 0.1 , tín
hiệu kích thích uc là xung vuông lưỡng cực có biên ñộ ±1 và tần số 0.01Hz:
Tín hiệu kích thích ñầu vào và ñáp ứng ñầu ra mong muốn

Trang 281
Chương 3 ðiều khiển thích nghi

ðáp ứng ñầu ra hệ thống khi thông số b thay ñổi:

b = 0.1 b=1

b=5 b = 10

Trang 282
Chương 3 ðiều khiển thích nghi

Nhận xét:
Khi b nhỏ thì hệ thống chậm hội tụ về mô hình mong muốn, khi b
càng lớn thì tốc ñộ hội tụ càng tăng lên (Như ñã phân tích ở mục 2).
Tuy nhiên khi b tăng ñến một mức nào ñó hệ thống sẽ bị mất tính ổn
ñịnh. ðiều này sẽ ñược ñề cập ở mục 6.

5. Luật hiệu chỉnh bổ sung:


Thay (2.5) và (2.10) vào luật hiệu chỉnh thông số (2.12) ở mục 1 ta ñược:
dk  bk 1   p2 + p  2
= −γ  2 − 2  2 u
2  c
(5.1)
dt  p + p + bk p + p + 1   ( p + p + 1) 
Phương trình (2.13) cho thấy tốc ñộ hội tụ của k phụ thuộc vào bình phương
biên ñộ của tín hiệu vào uc. ðây là hiệu ứng không mong muốn. ðiều này có
thể minh họa qua việc ñiều khiển hệ thống với tín hiệu kích thích ñầu vào uc
là xung vuông lưỡng cực có biên ñộ thay ñổi trong khoảng [0.1 ÷ 6] , tần
số γ ' = 0.01 Hz và thông số của quá trình không ñổi b = 5:

ðáp ứng ñầu ra hệ thống khi uc = ±0.1

ðáp ứng ñầu ra hệ thống khi uc = ±2 và uc = ±6

Trang 283
Chương 3 ðiều khiển thích nghi

Nhận xét: Khi tín hiệu vào có biên ñộ nhỏ, tốc ñộ hội tụ của hệ thống rất
chậm, khi biên ñộ vào tăng lên, tốc ñộ hội tụ cũng tăng lên (theo tỉ lệ bình
phương) tương ứng. Khi biên ñộ vào ñạt ñến 6 thì hệ thống gần như không
ổn ñịnh nữa và xuất hiện các xung vọt lố không khống chế ñược. Rõ ràng
ñiều này ñã hạn chế rất lớn tầm ñiều khiển của hệ thống. Nhược ñiểm này
có thể khắc phục ñược bằng luật hiệu chỉnh thông số bổ sung:
∂e ∂e
e
dk ∂k ∂k
= −γ T
= −γ e 2
(5.2)
dt  ∂e   ∂e   ∂e 
α +    α + 
 ∂k   ∂k   ∂k 
Trong ñó: α là một số dương nhỏ tùy ý (chọn α = 0.00001 ) ñưa vào ñể
tránh cho mẫu số của phương trình (5.2) bằng 0 và:
∂e p2 + p p2 + p
≈ 2 uc = uc
∂k ( p + p + 1)2 p 4 + 2 p3 + 3 p 2 + 2 p + 1

Từ phương trình (5.2), khối Adjustment mechanism thiết kế lại như sau:

Kết quả mô phỏng khi uc thay ñổi với luật hiệu chỉnh thông số bổ sung:

ðáp ứng ñầu ra hệ thống khi uc = ±0.1 và uc = ±2

Trang 284
Chương 3 ðiều khiển thích nghi

ðáp ứng ñầu ra hệ thống khi uc = ±6 và uc = ±50

Nhận xét:
Rõ ràng khi có luật hiệu chỉnh thông số bổ sung ñã cho kết quả tốt
và ổn ñịnh hơn hẳn. Tốc ñộ hội tụ về mô hình mong muốn của hệ thống hầu
như không còn phụ thuộc vào biên ñộ tín hiệu vào. Kết quả là về mặt lý
thuyết tầm ñiều khiển của hệ thống có thể mở rộng ñến bất kỳ giá trị uc nào.

6. ðiều kiện hoạt ñộng ổn ñịnh:

Có 3 yếu tố ảnh hưởng ñến tính ổn ñịnh của hệ thống ñó là:


 Biên ñộ tín hiệu uc (khắc phục bằng luật hiệu chỉnh thông số)
 Tốc ñộ hội tụ thật sự γ
 Nhiễu tác ñộng vào hệ thống

a. Giới hạn của tích số γ = γ 'b :


Nếu γ quá lớn có thể làm hệ thống mất ổn ñịnh. Do ñó, việc lựa chọn γ '
tùy thuộc vào tầm thay ñổi của b sao cho γ = γ 'b vẫn còn ñủ nhỏ khi b ñạt
ñến giá trị cực ñại. Giả sử hệ thống không chịu sự tác ñộng của nhiễu, chọn
γ ' = 1 và cho thông số b tăng dần, ñến khi b ñạt ñến giá trị bmax = 2.5 thì hệ
thống bắt ñầu mất ổn ñịnh hay nói cách khác, khi:
γ = γ ' b ≤ 2.5 * 0.8 = 2 = γ max (0.8 là hệ số an toàn) (6.1)

thì hệ thống vẫn hoạt ñộng ổn ñịnh trong trường hợp không có nhiễu.

Dựa vào (6.1) ta có thể chọn tốc ñộ hội tụ γ ' thích hợp với sự thay
ñổi của thông số quá trình. Chẳng hạn nếu biết ñược khi vận hành, thông số
2
b của quá trình ñạt giá trị cực ñại bmax = 50 có thể chọn γ ' = = 0.04 ñể
bmax
ñảm bảo tính ổn ñịnh của việc ñiều khiển.

Trang 285
Chương 3 ðiều khiển thích nghi

ðáp ứng ñầu ra hệ thống khi b = 1 và bmax = 50 γ ' = 0.04

b. Hệ thống chịu tác ñộng của nhiễu:

Thật khó ñể ñưa ra một ước lượng chính xác ñể ñánh giá tác ñộng của nhiễu
ñối với tính ổn ñịnh của hệ thống. Một cách tương ñối, khi tốc ñộ hội tụ γ '
càng nhỏ thì hệ thống càng bền vững với nhiễu (và yếu tố ñánh ñổi là hệ
thống chậm hội tụ về hàm truyền mong muốn). Do ñó, khi có nhiễu tác ñộng
vào hệ thống, chỉ có thể chọn γ ' bằng cách thử - sai: cho thông số b ñạt giá
trị bmax và tăng dần γ ' ñến giá trị γ 'max (khi hệ thống ñạt ñến biên giới ổn
ñịnh). Nếu chọn γ ' < 0.8γ 'max sẽ ñảm bảo tính ổn ñịnh của hệ thống.

Giả sử nhiễu tác ñộng vào hệ thống có kỳ vọng = 0.5 và phương sai
= 0.05, hệ thống khi hoạt ñộng có bmax = 10, tín hiệu kích thích ñầu vào uc là
xung vuông lưỡng cực biên ñộ ±20 , tần số 0.01Hz. Cần xác ñịnh giá trị
γ 'max của bộ ñiều khiển thích nghi sao cho hệ thống vẫn ổn ñịnh.

• Hệ thống chịu tác ñộng của nhiễu ñầu vào:

γ 'max = 0.005

Trang 286
Chương 3 ðiều khiển thích nghi

• Hệ thống chịu tác ñộng của nhiễu ñầu ra:

γ 'max = 0.002
• Hệ thống chịu tác ñộng của nhiễu ño lường:

γ 'max = 0.0025
Hệ thống chịu tác ñộng của nhiễu ñầu vào, nhiễu ñầu ra và nhiễu ño lường:

γ 'max = 0.0008

Trang 287
Chương 3 ðiều khiển thích nghi

7. Kết luận:

Bộ ñiều khiển thích nghi mô hình tham chiếu (MRAS) với phương pháp tiếp
cận gradient có thể giải quyết tốt vấn ñề ñiều khiển hệ thống khi thông số hệ
thống thay ñổi. Hơn nữa, với luật hiệu chỉnh thông số bổ sung thay thế cho
luật hiệu chỉnh thông số MIT có thể nâng cao hơn nữa tính ổn ñịnh và tầm
ñiều khiển của hệ thống. Tuy bộ ñiều khiển là thích nghi nhưng tính thích
nghi chỉ có thể thỏa mãn trong một ñiều kiện làm việc giới hạn, phải chấp
nhận ñánh ñổi giữa tính ổn ñịnh của hệ thống với tốc ñộ hội tụ về giá trị
ñúng của thông số cần ñiều khiển.

Ví dụ 3.6:
1. ðặt vấn ñề:
Cho hệ thống:
1 B
G (s) = = Với a là thông số chưa biết. (1)
s( s + a) A
Xác ñịnh bộ ñiều khiển có thể cho hệ thống vòng kín sau:
ω2 B
Gm ( s) = 2 = m (2)
s + 2ςωs + ω 2
Am
Xác ñịnh các bộ ñiều kiện thích nghi mô hình mẫu dựa trên phương pháp
gradient và lý thuyết ổn ñịnh.

2. Giải thuật:
Luật ñiều khiển tuyến tính có dạng: Ru = Tu c − Sy (3)

với R, S , T là các ña thức. Có thể vẽ lại như sau:

Trang 288
Chương 3 ðiều khiển thích nghi

B A
Ta có: y = u ⇒u= y Thay u vào (3), ta ñược:
A B
( AR + BS ) y = BTu c (4)
Ta có: B = B + B − = 1 ⇒ B+ = B− = 1
ðể có hệ thống vòng kín như mong muốn thì ( AR + BS ) phải chia hết
cho Am ,ña thức này phải chứa Am B + và có bậc lớn hơn bằng bậc của Am B + .
Phương trình Diophantine:
AR + BS = B + A0 Am (5)
Với R = B + R1 . Khử B + trong (5) ta ñược:
AR1 + B − S = A0 Am (6)
s ( s + a ) R1 + S = A0 ( s + 2ςωs + ω )
2 2

Ta chọn:
R1 = 1 ⇒ R = B + R1 = 1
A0 = 1
S = s0 s + ω 2
⇒ s 2 + as + s 0 s + ω 2 = s 2 + 2ςωs + ω 2 ⇒ a + s 0 = 2ςω
ðể (4) có dạng (2) thì:
Bm = B − Bm′ = ω 2
T = A0 Bm′
Với: B − = 1 ⇒ Bm′ = ω 2 và T = A0 Bm′ = ω 2
Như vậy, ta có bộ ñiều khiển tuyến tính như sau:

Luật ñiều khiển có dạng:


u = ω 2 u c − ( s0 s + ω 2 ) y
Phương trình của hệ kín:
( AR + BS ) y = BTu c ⇒ ( s 2 + as + s 0 s + ω 2 ) y = ω 2 u c
ω2
⇒y= uc
s 2 + (a + s 0 ) s + ω 2

Trang 289
Chương 3 ðiều khiển thích nghi

Thiết kế theo mô hình cổ ñiển:

Nếu tham số a của hệ thống ñược biết trước, ta có thể tính ñược s 0 theo
công thức sau: s 0 = 2ςω − a .
Ví dụ a = 2, và giả sử hệ thống mong muốn có ς = 0,7 và ω = 2
⇒ s 0 = 2ςω − a = 0.8
Với a = 2

Với a = 0.2 Với a = 20

Trang 290
Chương 3 ðiều khiển thích nghi

Nhận xét:
Khi a = 2, s 0 = 0.8 : bộ ñiều khiển cho ñáp ứng hệ thống ñúng như yêu cầu.
Nhưng trong thực tế thông số a thay ñổi theo thời gian, làm cho bộ ñiều
khiển không cho kết quả như mong muốn (với a = 0.2, hệ thống bị dao ñộng
và với a = 20, hệ thống không ñáp ứng kịp).
Như vậy, bộ ñiều khiển tuyến tính cổ ñiển không thể tự cập nhật hệ
số s0 theo thông số a của hệ thống nên không thể sử dụng ñể ñiều khiển quá
trình có thông số thay ñổi theo thời gian.
Bộ ñiều khiển thích nghi sẽ giải quyết ñược bài toán này. Ở ñây ta
xem xét bộ ñiều khiển thích nghi mô hình tham chiếu (MRAS).

3. Thiết kế:
Hệ thống thích nghi mô hình tham chiếu

Trong hệ thống, cơ cấu hiệu chỉnh sẽ thay ñổi các thông số của bộ ñiều
khiển sao cho ngõ ra y của ñối tượng giống với ngõ ra ym của mô hình.
Ta sử dụng phương pháp gradient ñể xây dựng luật cập nhật thông số cho
cơ cấu hiệu chỉnh.
ðịnh nghĩa sai số:
e = y − ym
Ta phải thay ñổi thông số của bộ ñiều khiển sao cho sai số e này về 0.
Xét chuẩn:
1
J (θ ) = e 2
2
ðể làm cho J nhỏ thì chiều thay ñổi của thông số là chiều âm gia số của J,
như sau:
dθ ∂J ∂e
= −γ = −γe
dt ∂θ ∂θ

Trang 291
Chương 3 ðiều khiển thích nghi

Với hệ ñã cho, ta có:


∂e − ω 2s −s
= uc = y
∂s 0 [
s 2 + (a + s0 ) s + ω 2 ]
2
s + (a + s 0 ) s + ω 2
2

Khi hàm truyền ñạt của hệ thống ñạt tới hàm truyền ñạt mong muốn thì:
s 2 + (a + s 0 ) s + ω 2 ≈ s 2 + 2ςωs + ω 2
hay a + s0 ≈ 2ςω ⇒ s0 ≈ 2ςω − a
∂e −s
Do ñó: = 2 y
∂s 0 s + 2ςωs + ω 2
Suy ra:
ds0 ∂e s
= −γe = γe 2 y
dt ∂s0 s + 2ςωs + ω 2
Tương tự ví dụ 3.5, tính ổn ñịnh hay không của hệ thống phụ thuộc nhiều
vào thông số a của quá trình. Việc lựa chọn thông số γ của bộ ñiều khiển
thích nghi phải căn cứ vào tầm thay ñổi của thông số a khi hệ thống hoạt
ñộng.

4. Kết quả mô phỏng:

Thiết kế theo mô hình thích nghi

Trang 292
Chương 3 ðiều khiển thích nghi

Kết quả mô phỏng thu ñược:


Với γ = 0.1 , a = 2: Với γ = 0.1 , a = 0.2:

Với γ = 0.1 , a = 20: Với γ = 1 , a = 20

5. Kết luận:
Bộ ñiều khiển thích nghi chỉ cho kết quả tốt trong một ñiều kiện làm
việc giới hạn, phải chấp nhận ñánh ñổi giữa tính ổn ñịnh của hệ thống với
tốc ñộ hội tụ về giá trị ñúng của thông số cần ñiều khiển.

Ví dụ 3.7:
1. ðặt vấn ñề:
Heä thoáng ñaõ cho coù daïng:
B b.q
y= .u = .u (1)
A ( s + a )( s + p )
Thiết kế bộ ñiều khiển sao cho hệ thoáng mong muoán :
Bm ω2
ym = .uc = 2 .uc (2)
Am s + 2.ξ .ω.s + ω 2
2. Giải thuật:
Ta coù thoûa ñieàu kieän :

Trang 293
Chương 3 ðiều khiển thích nghi

− baäc (A) = baäc (A m )

− Baäc (B) = baäc (B m )

− Baäc (A 0 ) = baäc (A) -baäc (B + ) -1 = 2-0-1=1

Vaäy ta choïn: A0 (s) = s + a0


Caáu truùc boä ñieàu khieån theo phöông phaùp ñaët cöïc coù daïng:
R.u = T.uc – S.y (3)
Khi ñoù phöông trình PT Diophantine coù daïng:
A.R + B.S = Am.A0 (4)
Trong ñoù ta coù: A= (s+a)(s+p) B= b.q
Am = s 2 + 2.ξ .ω.s + ω 2 Bm = ω 2

Vaø choïn caùc ña thöùc: R( s) = s + r1 A0 ( s ) = s + a0


S ( s) = s0 .s + s1 T ( s ) = t0

Khi ñoù (4) seõ laø:


( s + a )( s + p )( s + r1 ) + b.q.( s0 s + s1 ) = ( s 2 + 2.ξ .ω.s + ω 2 )( s + a0 ) (5)

⇔ s 3 + (r1 + p + a ).s 2 + ( p.r1 + a.r1 + a. p + b.q.s0 ).s + a. p.r1 + b.q.s1 =

s3 + (a0 + 2.ξ .ω ).s 2 + (2.ξ .ω.a0 + ω 2 ).s + ω 2 .a0

Ñoàng nhaát thöùc 2 veá theo s3, s2, s1. s 0 ta ñöôïc:


(r1 + p + a) = (a0 + 2.ξ .ω )

⇔ ( p.r1 + a.r1 + a. p + b.q.s0 ) = (2.ξ .ω.a0 + ω 2 )

a. p.r1 + b.q.s1 = ω .a0
2

Trang 294
Chương 3 ðiều khiển thích nghi


r1 = 2.ξ .ω + a − a − p
 0

 2.ξ .ω − (a0 − p − a) + ω 2 + a 2 + a. p + p 2 − ( p + a).a0


2
⇒  s0 =
 b.q
 a .ω − 2.ξ .ω.a. p − a.a0 p + a 2 . p + a. p 2
2
 s1 = 0
 b.q

Maët khaùc ta coù ña thöùc:


A0 .Bm ω 2 .( s + a0 ) ω2 ω 2 .a0
T= ⇒ T (s) = = .s +
B b.q b.q b.q
Maø: T ( s ) = t 0 .s + t1

ω2 ω 2 .a0
Ñoàng nhaát thöùc ta coù: t0 = ; t1 =
b.q b.q
Thay R, T vaø S vaøo (3) ta ñöôïc boä ñieàu khieån cuûa heä thoáng coù daïng:
( s + r1 ).u ( s ) = t0 .uc .( s ) − ( s0 .s + s1 ). y ( s )

⇔ s.u ( s ) + r1.u ( s ) = t0 .uc ( s ) − s0 .s. y ( s ) − s1. y ( s )


du dy
⇔ + r1.u = t0 .uc − s1. y − s0 . (6)
dt dt
Coù 4 thoâng soá maø ta caàn xaùc ñònh r1, t0, s0, s1 maø ta caàn xaùc ñònh
Vì tham soá p ñaõ bieát neân ta choïn ña thöùc:
A0 ( s ) = s + p
Vaø thay s = -p vaøo phöông trình (5) ta seõ coù
− s0 . p + s1 = 0
⇒ s1 = p.s0

Trong tröôøng hôïp naøy ta coù tính s1 khi bieát t0, s0, vaø r1. tuy nhieân tham soá
q ñaõ bieát thöôøng xuaát hieän vôùi tham soá khoâng bieát b
Vôùi a0 = p töø phöông trình (5) ta coù

Trang 295
Chương 3 ðiều khiển thích nghi

( s + a )( s + r1 ) + b.q.s0 = s 2 + 2.ξ .ω.s + ω 2

Ta coù :
A ' (s) = s+a
S ' (s) = s0
T ' = t0

Ta coù heä thoáng voøng kín ñöôïc moâ taû bôûi


B.T ′
y= .u c
A′.R + B.S ′
Thay y vaøo (3) ta tính ñược:

 S .B.T ' 
 T −  uc
 A.R ' + B.S '  AT . '
u = = .uc
R A.R ' + B.S '

3. Thiết kế:

Sai số là : e = y - ym
Baây giôø caàn phaûi xaùc ñònh caùc ñaïo haøm rieâng cuûa sai soá ñoái vôùi töøng tham
soá hieäu chænh ñeå tìm luaät chænh ñònh thoâng soá caùc haøm ñoä nhaïy.
Thay y vaø ym vaøo coâng thöùc e = y – ym vaø tính ñaïo haøm rieâng theo töøng
bieán to, so, ro ta seõ coù.
∂e B B
= .uc ≈ .uc
∂t0 A′.R + B.S ′ Am
∂e B.T ′.B B B
=− .uc = − .y ≈ − .y
∂s0 ( A′.R + B.S ′)2
A′.R + B.S ′ Am
∂e A′.B.T ' A′ A′ A′ B B
=− .uc = − .y ≈ − .y = − . .u = − .u
∂r1 ( A′.R + B.S ′ ) A′.R + B.S ′ Am ( s + p)
2
Am Am A

Trang 296
Chương 3 ðiều khiển thích nghi

Vaäy ta coù luaät hieäu chænh MIT rule nhö sau :


dr
1 = γ .  1 
.u  .e
dt  ( s + p). Am 
ds0  1 
= γ . . y  .e (7)
dt  Am 
dt0  1 
= −γ .  .uc  .e
dt  Am 

Sô ñoà khoái heä thoáng

4. Kết quả mô phỏng:

Trang 297
Chương 3 ðiều khiển thích nghi

Trong ñoù khoái moâ hình tham chieáu coù daïng sau:

Khoái cô caáu hieäu chænh coù daïng sau:

Trang 298
Chương 3 ðiều khiển thích nghi

Khoái boä ñieàu khieån coù daïng sau:

Khoái ñoái töôïng ñieàu khieån coù daïng sau:

*Tröôøng hôïp khoâng coù nhieãu:


Choïn caùc tham soá ñieàu chænh nhö sau:
4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω =
(Ts * ξ )
− Choïn p = 2 vaø q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Trang 299
Chương 3 ðiều khiển thích nghi

Mit Rule for γ =1 and Amplitude = ± 1


Nhaän Xeùt:
+Trong tröôøng hôïp bieân ñoä baèng ± 1 thì luaät MIT cho keát quaû töông ñoái
toát .Sai soá giöõa ngoõ ra cuûa ñoái töôïng vaø cuûa moâ hình chuaån tieán ñeán Zero.

Choïn caùc tham soá ñieàu chænh nhö sau:


4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω =
(Ts * ξ )
− Choïn p = 2 vaø q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Trang 300
Chương 3 ðiều khiển thích nghi

Mit Rule for γ =1 and Amplitude = ± 0.1


Nhaän Xeùt:
Trong tröôøng hôïp bieân ñoä baèng ± 0.1 thì luaät MIT cho keát quaû khoâng toát,
phuï thuoäc vaøo bieân ñoä cuûa tín hieäu (ñaët) yeâu caàu. Sai soá giöõa ngoõ ra cuûa
ñoái töôïng vaø cuûa moâ hình chuaån khoâng tieán ñeán Zero.
*Tröôøng hôïp coù nhieãu:
Choïn caùc tham soá ñieàu chænh nhö sau:
− Choïn Mean = 0.01, Var = 0.5
4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω =
(Ts * ξ )
− Choïn p = 2 vaø q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Trang 301
Chương 3 ðiều khiển thích nghi

Mit Rule for γ =1 and Amplitude = ± 1

Nhaän Xeùt:
+Trong tröôøng hôïp coù nhieãu thì luaät MIT bò aûnh höôûng cuûa nhieãu vaø
noù khoâng theå loaïi ñöôïc nhieãu.
+Thoâng soá γ xaùc ñònh toác ñoä thích.
+Luaät MIT coù theå thöïc hieän toát neáu ñoä lôïi thích nghi γ laø nhoû. Ñoä lôùn
γ tuøy thuoäc vaøo bieân ñoä cuûa tín hieäu chuaån vaø ñoä lôïi cuûa ñoái töôïng.
+Ñoä giaûm coù ñöôïc baèng luaät MIT ñöôïc quyeát ñònh bôûi tham soá γ , soá
naøy do ngöôøi duøng choïn.

5. Luật hiệu chỉnh bổ sung:


Ta có:
∂e
dθ ∂θ
= −γ .e. T
dt  ∂e   ∂e 
α +   . 
 ∂θ   ∂θ 
Vôùi caùc thoâng soá chænh ñònh laø r1, so vaø t0 ta seõ coù MIT boå sung nhö sau:

Trang 302
Chương 3 ðiều khiển thích nghi

∂e B
.u
dr1 ∂r1 Am .( s + p)
= −γ .e. T
= γ .e. T
dt  ∂e   ∂e   A   A 
α +   .  α + .u  .  .u 
 ∂r1   ∂r1   Am .( s + p)   Am .( s + p) 
∂e B
.y
ds0 ∂s0 Am
= −γ .e. T
= γ .e. T
(8)
dt  ∂e   ∂e   B   B 
α +  .  α +  .y  . .y 
 ∂s0   ∂s0   Am   Am 
∂e B
.uc
dt0 ∂t0 Am
= −γ .e. T
= −γ .e. T
dt  ∂e   ∂e   B   B 
α +    α +  .uc   .uc 
 ∂t0   ∂t0   Am   Am 

Sô ñoà khoái moâ phoûng heä thoáng theo luaät MIT söûa ñoåi

Trong ñoù khoái moâ hình tham chieáu coù daïng sau:

Trang 303
Chương 3 ðiều khiển thích nghi

Khoái cô caáu hieäu chænh coù daïng sau:

Khoái boä ñieàu khieån coù daïng sau:

Khoái ñoái töôïng ñieàu khieån coù daïng sau:

Trang 304
Chương 3 ðiều khiển thích nghi

Keát quaû moâ phoûng theo luaät MIT söûa ñoåi

*Tröôøng hôïp khoâng coù nhieãu:


Choïn caùc tham soá ñieàu chænh nhö sau:
4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω = , α =1
(Ts * ξ )
− Choïn p = 2, q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Modified Mit Rule for γ =1 and Amplitude = ± 1


Nhaän Xeùt:
Trong tröôøng hôïp bieân ñoä baèng ± 1 thì luaät MIT boå sung cho keát quaû
töông ñoái toát. Sai soá giöõa ngoõ ra cuûa ñoái töôïng vaø cuûa moâ hình chuaån tieán
ñeán Zero.

Trang 305
Chương 3 ðiều khiển thích nghi

Choïn caùc tham soá ñieàu chænh nhö sau:


4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω = , α =0.01
(Ts * ξ )
− Choïn p = 2, q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Modified Mit Rule for γ =1 and Amplitude = ± 0.1


Nhaän Xeùt:
Trong tröôøng hôïp bieân ñoä baèng ± 1 thì luaät MIT boå sung cho keát quaû
töông ñoái toát, khoâng phuï thuoäc vaøo bieân ñoä cuûa tín hieäu (ñaët) yeâu caàu. Sai
soá giöõa ngoõ ra cuûa ñoái töôïng vaø cuûa moâ hình chuaån tieán ñeán Zero.

*Tröôøng hôïp coù nhieãu:


− Choïn Mean = 0.01, Var = 0.5

Trang 306
Chương 3 ðiều khiển thích nghi

4
− Choïn Ts = 3s, ξ = 0.707, γ =1, ω = , α = 0.1
(Ts * ξ )
− Choïn p = 2 vaø q= (3/2)*p
− Choïn a,b thay ñoåi theo tyû leä b=3*a vôùi a=1
Khi ñoù ta coù keát quaû moâ phoûng nhö sau:

Modified Mit Rule for γ =1 and Amplitude = ± 1


Nhaän Xeùt:
+Tham soá α aûnh höôûng raát lôùn ñoái vôùi luaät hieäu chænh vaø vieäc choïn tham
soá α cuõng raát khoù. Tham soá α > 0 ñeå traùnh tröôøng hôïp chia heát cho 0.
+Coù theå ñaït ñöôïc Luaät MIT boå sung maø tæ leä hieäu chænh khoâng phuï thuoäc
vaøo bieân ñoä cuûa tín hieäu (ñaët) yeâu caàu.
+Coù theå nhaän thaáy raèng tæ leä hieäu chænh tham soá phuï thuoäc vaøo bieân ñoä
cuûa tín hieäu yeâu caàu moät löôïng nhoû bôûi vì do nhieãu ño löôøng.

6. Kết luận:
Khi thieát keá heä MRAS baäc 2 baèng luaät MIT ta thaáy keát quaû khaù toát vôùi tín
hieäu vaøo laø baát kyø vaø trong tröôøng hôïp coù nhieãu ñaàu vaøo, nhieãu ñaàu ra hay
nhieãu ño löôøng thì moâ hình cho keát quaû töông ñoái toát. Tuy nhieân vôùi möùc

Trang 307
Chương 3 ðiều khiển thích nghi

nhieãu quaù lôùn thì ta cuõng khoâng theå cho keát quaû toát nhaát ñöôïc nhöng coù
theå loaïi nhieãu baèng caùch chænh α , γ ñeå coù keát quaû töông ñoái.
Öu ñieåm
 Loaïi ñöôïc nhieãu
 Thieát keá cho heä thoáng coù caùc thoâng soá thay ñoåi khoâng bieát tröôùc
 Thích nghi vôùi söï thay ñoåi cuûa ñoái töôïng
Moät soá ñieåm caàn chuù yù:
 Trong quaù trình laøm vieäc ñeå heä thoáng vaãn ñaït caùc chæ tieâu nhö
thieát keá ban ñaàu thì phaûi giaû thuyeát raèng ñoái töôïng khoâng töï
thay ñoåi töùc laø ñoä chính xaùc moâ hình vaãn giöõ nguyeân (ñieàu naøy
thöïc teá khoâng ñaït ñöôïc), do phaàn lôùn caùc moâ hình ñeàu chöùa
trong noù moät sai leäch nhaát ñònh so vôùi ñoái töôïng trong quaù trình
laøm vieäc.
 Haèng soá γ giöõ vai troø quyeát ñònh ñeán toác ñoä hoäi tuï hay phaân kyø
cuûa thuaät toaùn chænh ñònh, daãn ñeán phuï thuoäc nhieàu vaøo γ vaø
choïn γ raát kho.ù
 Phöông phaùp tieäm caän Gradient khoâng cho keát quaû caàn thieát
cho heä thoáng kín oån ñònh.
 Phöông phaùp naøy caàn thieát cho caùc tham soá cuûa moâ hình ñoái
töôïng ñeå tính toaùn ñoä nhaïy. Tuy nhieân ñieàu naøy khoâng coù thöïc
vaø do ñoù coù theå söû duïng phöông phaùp xaáp xæ hay baèng caùc boä
öôùc löôïng thoâng soá.

3.2.4 Thiết kế MRAS dùng lý thuyết ổn ñịnh của Lyapunov


Với luật hiệu chỉnh tham số có ñược từ phương pháp Gradient ñược trình
bày trong mục 3.2.3 lấy gần ñúng là ñể có ñược luật hiệu chỉnh tham số dựa
vào kinh nghiệm có vẻ hợp lí rồi chúng ta thử chỉ ra rằng sai số mô hình sẽ
tiến ñến 0. Một khả năng khác ñể có ñược vòng ngoài của hệ thống thích
nghi sử dụng mô hình chuẩn là tìm ra luật hiệu chỉnh mà ñảm bảo sai số tiến
về 0. Những nghiên cứu cho luật hiệu chỉnh như vậy ñã ñược thực hiện
trong một khoảng thời gian dài. Ý tưởng cơ bản ñể thiết kế luật hiệu chỉnh
dựa vào lý thuyết ổn ñịnh ñược trình bày trong mục này và ñược thể hiện
theo lịch sử phát triển.

Trang 308
Chương 3 ðiều khiển thích nghi

ðể tập trung vào vấn ñề chính tránh những chi tiết không cần thiết, tự hiệu
chỉnh ñộ lợi nuôi tiến của hệ thống ñược biết trước ñược dùng trong mục
này. Hệ thống dùng ở ñây giống như ở hình 3.6 nhưng cơ cấu thích nghi thì
khác. Vấn ñề là tìm luật hồi tiếp ñể bảo ñảm sai số e = y – ym trong hình 3.6
tiến ñến 0, cần biết rằng vấn ñề ñiều khiển hệ thống với ñặc tính ñộng học
biết trước và hệ số ñộ lợi chưa biết thì không quá khó. Vấn ñề riêng biệt
ñược chọn ñể trình bày ý tưởng hơn là trình bày một vấn ñề thực tế. Một khi
ý tưởng cơ bản ñược phát triển, sự mở rộng ñến những cấu hình tổng quát
thì tương ñối dễ hiểu hơn, chi tiết ñược trình bày trong TLTK[1].

Phương pháp thứ hai của Lyapunov


Minh họa bằng ñồ thị phương pháp Lyapunov
Hình 3.7 (a), (b) và (c) biểu diễn các trạng thái cân bằng và những ñường
cong tiêu biểu tương ứng ñối với hệ thống ổn ñịnh, ổn ñịnh tiệm cận và
không ổn ñịnh. Trong hình 3.7 (a), (b) hoặc (c), vùng S(δ) giới hạn cho
trạng thái ban ñầu x0, và vùng S(ε) tương ứng với giới hạn cho qũi ñạo xuất
phát tại x0.
Chú ý rằng những ñịnh nghĩa ñã ñược ñề cập trước ñây không chỉ ra chính
xác vùng của ñiều kiện cho phép ban ñầu. Vì vậy các ñịnh nghĩa áp dụng
cho vùng lân cận của trạng thái cân bằng (là trạng thái tại ñó mọi ñạo hàm
ñều triệt tiêu), trừ khi S(ε) tương ứng với trạng thái ban ñầu của ñối tượng.
Chú ý là trong hình 3.7 (c), ñường cong rời vùng S(ε) và dẫn ñến trạng thái
cân bằng không ổn ñịnh. Tuy nhiên, chúng ta không thể nói rằng ñường
cong sẽ ñi ñến vô tận bởi vì nó có thể ñến gần một vòng tròn giới hạn phía
ngoài vùng S(ε). (Nếu một hệ thống tuyến tính bất biến theo thời gian là
không ổn ñịnh, các ñường cong bắt ñầu gần với trạng thái cân bằng không
ổn ñịnh ñi ñến vô cực. Nhưng trong trường hợp của hệ thống phi tuyến, ñiều
này thật sự không cần thiết).
Sự hiểu biết về các ñịnh nghĩa ñã nói ở trên là yêu cầu tối thiểu ñể hiểu việc
phân tích ổn ñịnh của các hệ thống tuyến tính và phi tuyến có mặt trong
phần này. Chú ý rằng những ñịnh nghĩa này không chỉ hạn chế ở các khái
niệm về sự ổn ñịnh của một trạng thái cân bằng. Thực ra, những cách ñịnh
nghĩa khác cũng ñược sử dụng.Chẳng hạn, trong các lí thuyết ñiều khiển
thông thường hoặc kinh ñiển, chỉ có các hệ thống ổn ñịnh tiệm cận mới
ñược gọi là hệ thống ổn ñịnh, còn các hệ thống khác ổn ñịnh theo Lyapunov,
nhưng không ổn ñịnh tiệm cận, ñược gọi là không ổn ñịnh.

Trang 309
Chương 3 ðiều khiển thích nghi

S(ε) S(ε) S(ε)

S(δ) S(δ) S(δ)

•x0 •x0 •x0

(a) (b) (c)


Hình 3.7 (a) Trạng thái cân bằng ổn ñịnh
(b)Trạng thái cân bằng tiệm cận
(c)Trạng thái cân bằng không ổn ñịnh
Ví dụ 3.8 Xét hệ thống ñược mô tả bởi phương trình trạng thái sau:
x&1 = x2 - x1( x12 + x 22 )
x& 2 = - x1 - x2( x12 + x 22 )
Trạng thái cân bằng (ñạo hàm = 0) tại gốc tọa ñộ (x1 = 0, x2 = 0). Nếu chúng
ta ñịnh nghĩa một hàm vô hướng V(x) như sau:
V(x) = x12 + x 22
là hàm xác ñịnh dương, sao cho ñạo hàm theo thời gian hàm V(x) theo một
ñường cong bất kì
V& (x) = 2 x x& + 2 x x&
1 1 2 2
2 2 2
= -2( x + x )
1 2

là hàm xác ñịnh âm. ðiều này cho thấy rằng V(x) tăng liên tục theo ñường
cong bất kì; vì vậy V(x) là hàm Lyapunov. Hàm V(x) trở thành vô hạn với
ñộ lệch vô hạn từ trạng thái cân bằng, trạng thái cân bằng ở gốc của hệ
thống là ổn ñịnh tiệm cận trong vùng rộng.
Chú ý rằng nếu chúng ta ñể V(x) nhận giá trị hằng số 0, C1, C2,. . . (0 < C1 <
C2 <. . . ), thì V(x) = 0 tương ứng với gốc của trạng thái ñối tượng và V(x) =
C1, V(x) = C2, . . .mô tả những vòng tròn không so sánh kèm theo gốc của
trạng thái ñối tượng, như minh họa ở hình 3.8. Cũng cần chú ý rằng V(x) là
bán kính vô tận, hoặc V(x) → ∞ khi ||x||→ ∞.

Trang 310
Chương 3 ðiều khiển thích nghi

Khi vòng tròn V(x) = Ck nằm hoàn toàn trong vòng tròn V(x) = Ck+1, một
ñường cong ñại diện ñi qua vùng biên giới của các ñường viền V từ ngoài
vào trong. Từ ñây, biểu diễn hình học của hàm Lyapunov có thể ñược phát
biểu như sau: V(x) là thước ño khoảng cách của biến trạng thái x từ gốc toạ
ñộ của trạng thái trung gian. Nếu khoảng cách giữa gốc và biến trạng thái
tức thời x(t) tăng liên tục khi t tăng {V[x(t)] < 0 } thì x(t) → 0.
Quỹ ñạo (1) trên hình 3.8 là chuyển ñộng ổn ñịnh tiệm cận về gốc tọa ñộ,
song không thoả tiêu chuẩn ổn ñịnh thứ 2 của Lyapunov: hàm V& (x) không
phải là hàm xác ñịnh âm với mọi biến trạng thái x. Tiêu chuẩn ổn ñịnh thứ 2
của Lyapunov là ñiều kiện ñủ, không phải là ñiều kiện cần ñể ñánh giá tính
ổn ñịnh của nghiệm phương trình vi phân phi tuyến. Nếu thoả tiêu chuẩn thì
hệ ổn ñịnh. Nếu không thoả, vấn ñề kết luận về tính ổn ñịnh còn bỏ ngõ, phụ
thuộc vào:
1.Chọn hàm V(x)
2.Chọn biến trạng thái x

x2
(2) (1)

V=C3

V=C2

V=C1 x1

V tăng

Hình 3.8 Các vòng tròn hằng số V và hai quĩ ñạo ổn ñịnh

Trang 311
Chương 3 ðiều khiển thích nghi

Ví dụ thiết kế MRAS dùng Lyapunov


Giả sử tất cả các biến trạng thái của hệ thống ñều ño lường ñược, ñịnh lý về
ổn ñịnh của Lyapunov có thể dùng ñể thiết kế luật ñiều khiển thích nghi
ñảm bảo sự ổn ñịnh cho hệ thống vòng kín, ví dụ sau trình bày ý tưởng này.

Ví dụ 3.9 Hệ MRAS bậc nhất dựa vào lý thuyết ổn ñịnh.

Xét bài toán như trong ví dụ 3.2. Khi tham số của ñối tượng ñược biết luật
ñiều khiển theo phương trình 3.6 cho kết quả mong muốn. Một hệ thích nghi
sử dụng mô hình chuẩn mà có thể tìm ra các hệ số t0 và s0 khi tham số a, b
không ñược biết có thể ñạt ñược như sau :

Sai số : e = y - ym

Lấy ñạo hàm và sử dụng phương trình (3.5), (3.14) và mô hình mong muốn
ñể khử ñạo hàm y và ym , ta ñược :
de
= -ame + (am – a – b s 0 )y + (b t 0 - bm)uc
dt
Chú ý rằng sai số e sẽ tiến ñến 0 nếu các tham số này bằng với giá trị mong
muốn. Bây giờ ta cần cố gắng xây dựng một cơ cấu hiệu chỉnh tham số sao
cho các thông số t0 và s0 tiến ñến giá trị mong muốn. Sử dụng cho mục ñích
này, hàm Lyapunov có dạng :
1 2 1 1
V(e, t 0 , s 0 ) = [e + (b s 0 + a - am)2 + (b t 0 – bm)2]
2 bγ bγ
Hàm này sẽ bằng 0 khi e = 0 và các tham số bộ ñiều khiển bằng với giá trị
tối ưu. ðạo hàm của V là :
dV de 1 ds 1 dt
=e + (b s 0 + a – am) 0 + ( b t 0 - bm) 0
dt dt γ dt γ dt
1 ds 0 1 dt
= -ame2 + ( bs 0 + a – am )( - γye ) + ( bt 0 – bm )( 0 + γuce )
γ dt γ dt
Nếu các tham số ñược cập nhập bởi:
dt 0
= -γuce (3.17)
dt

Trang 312
Chương 3 ðiều khiển thích nghi

ds 0
= γye
dt
ta ñược
dV
= − am e 2
dt
Như vậy:
Hàm V sẽ giảm khi e khác 0. Vì vậy có thể kết luận là sai số e sẽ tiến về 0.
Tuy nhiên cần chú ý là các tham số t0 và s0 sẽ hội tụ ñến giá trị cân bằng nếu
không có các ñiều kiện khác tác ñộng vào. Vì vậy luật này tương tự như luật
MIT nhưng ñộ nhạy ñược thay ñổi bởi tín hiệu khác.
Luật hiệu chỉnh các thông số làm ổn ñịnh cho hệ thống mà các biến trạng
thái có thể ño lường ñược xây dựng bằng sự tổng quát hoá trực tiếp của kĩ
thuật dùng trong ví dụ sau .
Luật hiệu chỉnh theo phương trình 3.17 ñạt ñược bằng cách áp dụng lý
thuyết ổn ñịnh tương tự như bằng luật MIT ( so sánh với ví dụ 3.2) trong cả
hai trường hợp, luật hiệu chỉnh có thể viết như sau :

=γϕe
dt
với θ là vector các tham số , ϕ = [-uc y] T khi sử dụng luật theo Lyapunov

ϕ = [-uc y] T/(p + am)
nếu sử dụng luật MIT vector ϕ có thể ñược giải thích như là giá trị âm của
gradient hàm tổn thất.
Phương pháp Lyapunov bây giờ ñược áp dụng cho việc hiệu chỉnh hệ ñộ lợi
nuôi tiến.

Ví dụ 3.10
Ở ñây chỉ xét vấn ñề hiệu chỉnh ñộ lợi nuôi tiến. Sai số ñược cho bởi
e = G(p)( θ - θ 0 )uc
giới thiệu một không gian trạng thái biểu thị cho hàm truyền G. Quan hệ
giữa tham số θ và sai số e ñược viết bởi:
dx
= Ax + B(θ − θ 0 )u c (3.18)
dt

Trang 313
Chương 3 ðiều khiển thích nghi

e = Cx
Nếu hệ ñồng nhất x& = Ax là ổn ñịnh tiệm cận và có tồn tại 2 ma trận P và Q
xác ñịnh dương sao cho:
AT P + PA = − Q (3.19)
Chọn hàm Lyapunov như sau :
1
V= [γxTPx + (θ - θ 0)2]
2
ðạo hàm V và sử dụng phương trình sai phân 3.18 ñược :
dV γ dx T dx dθ
= ( Px + x T P ) + (θ − θ 0 )
dt 2 dt dt dt
Sử dụng phương trình 3.18 ta ñược :
dV γ
= {[Ax + B u c (θ - θ 0)] TPx + xTP[Ax + B u c (θ - θ 0)]}
dt 2

+(θ - θ 0)
dt
γ dθ
= - xTQx + (θ - θ 0)( + γ u c BTPx)
2 dt

Nếu luật hiệu chỉnh tham số ñược chọn là :



= − γu c B T Px (3.20)
dt
thì ñạo hàm của hàm Lyapunov sẽ âm khi x ≠ 0. Với luật hiệu chỉnh theo
phương trình 3.20 vector trạng thái x và cả sai số e = Cx vì vậy sẽ tiến ñến
không.Tuy nhiên chú ý là sai số tham số θ - θ 0 không cần thiết là phải tiến
ñến không.

Ví dụ hệ bậc hai MRAS


K
Ví dụ 3.11 Xét G(s) =
s( s + a)
Bm ω2
và mô hình là Gm(s) = = 2
Am s + 2ςωs + ω 2

Trang 314
Chương 3 ðiều khiển thích nghi

ña thức A0, R, S và T ñược chọn bởi :


A0(s) = s + a0
R(s) = s + r1
S(s) = s 0 s + s1
T(s) = t 0 s + t1
Phương trình Diophantine 3.7 cho lời giải sau :
r1 = 2ζω + a0 - a
s 0 = (2ζω a0 + ω2 - a r1 )/K
s1 = a0ω 2/ K
t 0 = ω 2/ K
t1 = a 0 ω 2 / K
ñể ñơn giản hóa, ta chọn : Q(s) = A0(s).Am(s)
P1(s) = Am(s)
P2(s) = A0(s)
Mô phỏng hệ bậc hai MRAS trong ví dụ 3.11 với các thông số như sau:
γ = 1, ζ = 0.7, ω = 1, a0 = 2, a =1 và K = 2.
Giả sử rằng bˆ = b .
0 0

Kết quả mô phỏng của hệ thống thu ñược như hình 3.9. Trong ñó:
 Hình (a): ðáp ứng ngõ ra của hệ thống và ngõ ra của mô hình chuẩn.
 Hình (b): Tín hiệu ñiều khiển.
 Hình (c): Sai số e = y - ym
Nhận xét:
Các ña thức P1, P2, Q và A0 ñược lựa chọn sao cho tốc ñộ hội tụ của
y về ym là nhanh nhất. Mặc dù ngõ ra của hệ thống ở cuối quá trình mô
phỏng vẫn chưa tiến ñến giá trị tối ưu nhưng sai số là rất bé (hình (c)).
Ứng với luật ñiều khiển trên thì tại thời ñiểm t = 150s hệ thống vòng
kín có một cực thực là – 1.95 và hai cực ảo tương ứng với ω = 0.84 và
ς = 0.78 , so với ña thức A0Am có một cực thực là – 2 và hai cực ảo tương
ứng với ω = 1 và ς = 0.7 ,

Trang 315
Chương 3 ðiều khiển thích nghi

Hình 3.9 Kết quả mô phỏng của hệ thống trong ví dụ 3.11

Hệ thống MRAS rời rạc


Hệ MRAS ñã ñược thực hiện cho hệ liên tục không có nhiễu, nhưng có thể
thực hiện ñược MRAS cho hệ rời rạc. Thuật giải ở trên có thể ñược dùng
cho trường hợp hệ rời rạc. Bộ ước lượng có thể dựa vào chuẩn bình phương
tối thiểu. Phần này ñể dành trình bày trong bộ ñiều khiển tự chỉnh ñịnh trong
phần 3.3
MRAS cho hệ thống chỉ biết ñược từng phần
Trong phần trước ta ñã giả sử tất cả mô hình của ñối tượng là chưa
biết.Trong một số trường hợp ñặc tính ñộng học của hệ thống ñược biết một
phần, còn lại là không biết. Sự biết trước này có thể ñược kết hợp vào hệ
MRAS. ðiều này có thể thực hiện tuỳ thuộc chủ yếu vào tham số và cấu
trúc của mô hình ñối tượng. Phương pháp này ñược minh họa bằng ví dụ .

Trang 316
Chương 3 ðiều khiển thích nghi

ðiều khiển thích nghi cho tay máy


Giả sử các biến trạng thái ñược ño lường ñầy ñủ, có thể tìm ñược một biến
sai số tuyến tính ñối với các tham số, ñiều này làm dễ dàng trong việc xây
dựng hệ thích nghi sử dụng mô hình chuẩn ổn ñịnh. ðiều này ñược minh
họa bằng việc ñiều khiển tay máy khi mà ñặc tính ñộng học là phi tuyến.
Một thao tác trực tiếp ñược mô tả bởi mô hình :
H(q) q&& + C(q, q& ) q& + G(q) = T (3.21)
với q là vector tọa ñộ tổng quát. H là ma trận quán tính, C là ma trận tắt, G
là vector trọng trường. Biến ñiều khiển là moment ñặt vào cơ cấu chấp
hành.Phương trình mô tả tay máy có tính chất :
1 d
( q& TH q& ) = q& TH( q ) q&& + q& TC( q, q& ) q& = q& T( T – G ) (3.21a)
2 dt
ðiều này ñược giải thích là ñạo hàm của ñộng năng q& TH q& bằng với công
suất ñược cung cấp bởi cơ cấu chấp hành và moment trọng lực.
Ví dụ 3.12: Tay máy hai khớp nối
Xét tay máy hai khớp nối với tải chưa biết trong hình dưới ñây. Khớp nối
thứ hai với tải chưa biết ñược xem như là có thêm một khớp nối với 4 tham
số chưa biết: khối lượng me, moment quán tính Ie, khoảng cách từ trọng tâm
ñến khớp nối thứ hai l ce , góc δe so với khâu liên kết thứ hai. Hệ thống ñược
mô tả bởi phương trình (3.21) với
θ1 + 2θ 3 cos q 2 + 2θ 4 sin q 2 θ 2 + θ 3 cos q 2 + θ 4 sin q 2 
H =  
 θ 2 + θ 3 cos q 2 + θ 4 sin q 2 θ2 

θ 3Y1+ θ 4Y2 + (θ1 − θ 2 + e1 )e2 cos q1 


G =  
 θ 3Y3 + θ 4Y4 
với:
Y1 = − 2 sin(q 2 )q&1 q& 2 − sin(q 2 )q& 22
Y2 = 2 cos(q 2 )q&1 q& 2 + cos(q 22 )
Y3 = sin(q 2 )q&12 + e2 cos(q1 + q 2 )
Y4 = − cos(q 2 )q&12 + e2 sin(q1 + q 2 )
e1 = m1l1l c1 − m1l c21
e2 = g / l1

Trang 317
Chương 3 ðiều khiển thích nghi

δe

l ce
me•

l1

m1

l c1 •
q1

Tay máy hai khớp nối với tải chưa biết


với g là gia tốc thường và bốn tham số chưa biết θ1 , L , θ 4 là những hàm có
các tham số vật lý chưa biết.
θ1 = I 1 + m1l c21 + I e + me l ce2 + me l12
θ 2 = I 1 + me l ce2
θ 3 = me l1l ce cos δ e
θ 4 = me l1l ce sin δ e
Bốn tham số chưa biết me , I e , l ce và δ e ñược xác ñịnh duy nhất bởi
θ1 , L , θ 4 . Hệ thống có thể ñược viết lại:
ϕ T (q, q& , q&&)θ = T
với ϕ T ñược cho bởi:

Trang 318
Chương 3 ðiều khiển thích nghi

 q&&1 + e′ q&&2 − e′ 2 cos(q 2 )q&&1 + cos(q 2 )q&&2 + Y1 2 sin( q 2 )q&&1 + sin(q 2 )q&&2 + Y2 
 
 0 q&&1 + q&&2 cos(q 2 )q&&1 + Y3 sin(q 2 )q&&1 + Y4 

θ = (θ1 , θ 2 , θ 3 , θ 4 )T
τ 1 − e1e2 cos(q1 ) 
T =  
 τ2 
với e′ = e2 cos(q1 ) và τ 1 , τ 2 là các moment tác dụng vào. ðặc tính ñộng học
có thể ñược viết dưới dạng tuyến tính theo các tham số với giả sử là tất cả
các trạng thái và gia tốc có thể ño lường ñược.
Ví dụ có thể ñược tổng quát hoá và phương trình (3.21) có thể ñược viết
thành:
T − H ′(q)q&& − C ′(q, q& )q& − G ′(q) = ϕ T (q, q& , q&&)θ 0
với H ′, C ′, G ′ và ϕ là biết trước hay có thể ño lường ñược. Dù là mô hình
không tuyến tính, nó vẫn tuyến tính theo các tham số có thể thay ñổi. Một
ñiều quan trọng là kiến thức biết trước ñược dùng và hệ thống ñó không
xem như là mô hình hộp ñen với tham số thay ñổi theo thời gian. Mô hình
thì vẫn còn chưa thoả mãn bởi vì gia tốc phải ñược ño cùng với vị trí và vận
tốc.
ðặt quĩ ñạo tham khảo cho vị trí và vận tốc là qm và q& m . ðưa ra phương
trình Lyapunov như sau:
1 ~& T
V =
2
( ~ ~
q H (q)q~& + q~ T K p q~ + θ T Γθ )
~
Trong ñó: q~ = q − q m , q~& = q& − q& m , θ = θ − θ 0 ; K p và Γ là những ma
trận xác ñịnh dương. Lấy vi phân V , sử dụng phương trình (3.21a) cho ta:
1 ~ ~&
V& = q~& T H q&~& + q~& T H& q~& + q~& T K p q~ + θ T Γθ
2
~ ~&
= q~& T ( H q&& − H q&&m + Cq~& + K p q~ ) + θ T Γθ
~ ~&
= q~& T (T − G − H q&&m − Cq& m + K p q~) + θ T Γθ
ðưa ra luật ñiều khiển:
T = H ′ q&&m + C ′q& m + G ′ − K p q~ − K d q~& (3.21b)

Trang 319
Chương 3 ðiều khiển thích nghi

Luật ñiều khiển bao gồm thành phần nuôi tiến từ thành phần ñã biết của mô
hình và thành phần tỉ lệ và hồi tiếp vận tốc, nghĩa là:
~ ~ ~ ~ ~&
V& = q~& T ( H q&&m − C q& m + G − K d q~& ) + θ T Γθ
Trong ñó:
~
H (q) = H ′(q) − H (q)
~
C (q, q& ) = C ′(q, q& ) − C (q, q& )
~
G (q) = G ′(q) − G (q)
ðặt:
~ ~ ~ ~
H q&&m − Cq& m + G = ϕ mT θ
ðặt ñược như vậy là do mô hình tuyến tính ñối với các tham số. Hơn nữa
ϕ m = ϕ m (q, q& , q& m , q&&m ) có nghĩa là chỉ có gia tốc của mô hình phải ñược
biết, không phải là gia tốc thực. Dẫn ñến:
~ ~&
V& = − q~& T K d q~& + θ T (Γθ + ϕ mT q~& )
ñề nghị cập nhật thông số:
~&
θ& = θ = − Γ −1ϕ mT q~& = − Γ −1ϕ mT (q& − q& m ) (3.21c)
Hàm V thoả tính chất của hàm Lyapunov là xác ñịnh dương và ñạo hàm:
V& = − q~& K q~& d

là bán xác ñịnh âm. ðiều này có nghĩa là hệ vòng kín ổn ñịnh và vận tốc khi
xác lập bằng không. Bộ ñiều khiển cũng có thể ñược bổ sung ñể ñảm bảo là
sai số vị trí bằng 0.
Luật ñiều khiển theo phương trình (3.21b) và tham số ñược cập nhật theo
phương trình (3.21c) là các hàm của biến q, q& , q m , q& m và q&&m , nhưng gia tốc
của khớp nối không cần thiết phải ño ñược. ðể ý rằng luật ñiều khiển là
trường hợp ñặc biệt của hệ MRA tổng quát với e = q& − q& m .

3.2.5 Kết luận


Các ý tưởng cơ bản dựa trên MRAS ñã ñược trình bày trong phần này bao
gồm :

Trang 320
Chương 3 ðiều khiển thích nghi

1. Phương pháp gradient


2. Thiết kế theo Lyapunov và siêu ổn ñịnh
3. Số gia sai số
Trong mọi trường hợp luật cập nhật tham số cho dưới dạng :

= γϕε (3.22)
dt
hay dưới dạng chuẩn hoá :
dθ ϕε
=γ (3.23)
dt α + ϕ Tϕ
Trong phương pháp gradient, vector ϕ là giá trị âm của gradient sai số theo
các tham số. Ước lượng thông số hay xấp xỉ có thể ñược dùng trong
phương pháp gradient. Trong những trường hợp khác ϕ là vector lùi có
ñược bằng cách lọc ngõ vào, ra và tín hiệu ñặt. Số hạng ε là số gia sai số
ñược giải thích là sai số dự báo của vấn ñề ước lượng.Thường dùng số gia
sai số tuyến tính theo các thông số.
Phương pháp gradient linh hoạt và ñơn giản ñể áp dụng vào mọi cấu trúc hệ
thống. Cách tính toán ñòi hỏi phải xác ñịnh ñược hàm ñộ nhạy bởi vì luật
hiệu chỉnh dựa vào việc tính gradient, có thể khẳng ñịnh là phương pháp sẽ
hội tụ, ñược cho bởi ñộ lợi thích nghi γ ñược chọn là ñủ nhỏ. Hơn nữa, giá
trị ban ñầu của tham số phải chọn ñể hệ thống vòng kín là ổn ñịnh. Phương
pháp này sẽ gây không ổn ñịnh nếu hệ số ñộ lợi thích nghi lớn. Vấn ñề là
khó tìm ñược giới hạn ổn ñịnh trước.
Hệ MRAS tổng quát ñược ñưa ra dựa vào việc thiết kế mô hình kèm theo.
Thuật giải này bao gồm những trường hợp ñặc biệt của việc thiết kế MRAS
ñã ñược trình bày trong các phần trên. Việc ước lượng tham số có thể ñược
thực hiện với nhiều cách khác so với phương trình 3.22 và 3.23.

3.3 Bộ tự chỉnh ñịnh (STR – Self Tuning Regulator)


3.3.1 ðặt vấn ñề
Sự tương ñương chắc chắn
Thông số ước lượng
• Phương pháp gradient
• Bình phương cực tiểu
Các phương pháp thiết kế bộ ñiều khiển

Trang 321
Chương 3 ðiều khiển thích nghi

• PID
• Vị trí cực
• LQG (Linear Quadratic Gaussian)
Bộ tự chỉnh ñịnh (STR) dựa trên quan ñiểm phân tích, ñánh giá các thông
số chưa biết. Ý tưởng cơ bản ñược minh hoạ trong hình 3.10 . Các thông số
chưa biết ñược ñánh giá trực tuyến (on-line) bằng cách dùng phương pháp
ước lượng ñệ qui. Các thông số ước lượng ñược xem như là thông số thực,
ñộ không tin cậy của các ước lượng là bỏ qua. ðây gọi là qui tắc tương
ñồng nhất ñịnh (certainty equivalence principle).

Bộ tự chỉnh ñịnh

ðặc tính Các tham số quá trình

Thiết kế bộ Sự thích nghi


ñiều khiển

Các tham
số bộ
ñiều khiển
Tham chiếu

Bộ ñiều
khiển Quá trình
Ngõ ra
Ngõ vào

Hình 3.10 Mô hình tự chỉnh ñịnh

Nhiều phương pháp ước lượng khác nhau có thể ñược vận dụng như xấp xỉ
ước ñoán, bình phương tối thiểu..... Khối ‘design’ ở hình 3.10 tượng trưng

Trang 322
Chương 3 ðiều khiển thích nghi

cho bài giải trực tuyến các bài toán thiết kế hệ thống với các thông số chưa
biết trước. ðây là bài toán thiết kế cơ bản. ðiển hình cho phương pháp này
là phương pháp khác biệt cực tiểu, bình phương tuyến tính, ñặt cực, model
– following. Phương pháp thiết kế ñược lựa chọn phụ thuộc vào ñặc tính
của hệ thống vòng kín. Mục tiêu của mục này là ñưa ra quan ñiểm cơ bản
và tính chất của các bộ tự chỉnh ñịnh. Bộ tự chỉnh ñịnh ban ñầu chỉ áp dụng
cho các hệ thống lấy mẫu dữ liệu, nhưng các thuật toán liên tục và hỗn hợp
(hybrid) cũng ñược phát triển.
Trong mục này, giả sử hệ thống là SISO :
A(q)y(t) = B(q)u(t) + C(q)e(t) (3.24)
y : ñầu ra
u : ñầu vào
{e(t)} : chuỗi phân bố Gausse
A, B, C : các ña thức theo q (toán tử sai phân tới).
Giả thiết bậcA = bậcC = n và bậcA - bậcC = d0. Quá trình ñiều khiển
thường ñược mô tả ở dạng toán tử q-1. ða thức ñặc tính có dạng:
A* ( z ) = z n A( z −1 )
n = bậcA. Khi ñó mô hình (3.24) ñược mô tả như sau:
A* (q −1 ) y (t ) = B * (q −1 )u (t − d 0 ) + C * (q −1 )e(t )
Bộ tự chỉnh ñịnh dựa trên quan ñiểm ước lượng các thông số của quá trình.
Phương pháp dễ hiễu là ước lượng các thông số của hàm truyền của quá
trình và nhiễu (thuật toán thích nghi gián tiếp). Các thông số của bộ chỉnh
ñịnh sẽ không ñược cập nhật trực tiếp mà là gián tiếp thông qua ước lượng
mô hình của hệ thống. Bộ ñiều khiển thích nghi loại này dựa trên phương
pháp bình phương tối thiểu và ñiều khiển bám theo (Kalman 1958). Phương
pháp này không dựa vào ñặc tính vòng kín của hệ thống.
Các thông số của bộ chỉnh ñịnh cũng có thể ước lượng trực tiếp gọi là thuật
toán thích nghi trực tiếp. Cả 2 phương pháp trực tiếp và gián tiếp ñều gọi là
ñiều khiển tự chỉnh ñịnh.

3.3.2 Bộ tự chỉnh ñịnh gián tiếp


Trong phần này, giả sử mô hình của hệ thống có phương trình 3.24. Cách
dễ dàng nhất là tạo bộ tự chỉnh ñịnh theo như phần 3.3.1 ñể ước lượng các
thông số của ña thức A, B, C.

Trang 323
Chương 3 ðiều khiển thích nghi

Xét trường hợp xác ñịnh (e(t) = 0). Nhiều phương pháp ñệ qui ñã ñề cập có
thể ñược sử dụng ñể ước lượng các thông số của A, B.

θ T = [b0 b1 ... bm a1 ... an ]


ϕT(t – 1) = [u( t – d0) ... u(t – d0 – m ) – y(t – 1) ... – y(t – n)]
trong ñó n − m = d 0 . Khi ñó bộ ước lượng bình phương cực tiểu ñược
cho bởi:
ˆ ˆ
θ (t ) = θ (t − 1) + K (t )ε (t ) (3.25)
ˆ
ε (t ) = y(t ) − ϕ T (t − 1)θ (t − 1) (3.26)
−1
K (t ) = P(t − 1)ϕ (t − 1) λ + ϕ T (t − 1)P(t − 1)ϕ (t − 1) (3.27)

P(t ) =  I − K (t )ϕ T (t − 1) P(t − 1) / λ (3.28)


Trong trường hợp nhiễu là ngẫu nhiên, phương pháp bình phương tối thiểu
cho ra các ước lượng sai lệch nếu C(q) ≠ qn. Lúc này, chúng ta phải dùng
các phương pháp như cực ñại ñệ qui, bình phương cực tiểu tổng quát.

Tính hội tụ
Nếu tín hiệu ñầu vào ñược kích thích ñầy ñủ và cấu trúc của mô hình cần
ước lượng thích hợp thì các ước lượng sẽ hội tụ ñến một giá trị thực nếu hệ
thống vòng kín ổn ñịnh. ðiều kiện hội tụ cho các phương pháp khác nhau là
khác nhau.
Trong cả 2 trường hợp nhiễu xác ñịnh (e(t) = 0) và nhiễu ngẫu nhiên (e(t) ≠
không ) thì ñiều kiện hội tụ phụ thuộc tín hiệu ñầu vào, quá trình và nhiễu
của hệ thống. Tín hiệu ñiều khiển u(t) ñược phát ñi qua khâu hồi tiếp. ðiều
này làm phức tạp việc phân tích nhưng nó cần thiết ñể yêu cầu hệ thống
vòng kín phải ổn ñịnh. Trong MRAS việc phân biệt tính hội tụ sẽ ñược ñề
cập rõ hơn ở chương 6 (TLTK[1]).

Bài toán thiết kế nền tảng cho những hệ thống biết trước
Nhiều phương pháp thiết kế ñược sử dụng trong các bộ tự chỉnh ñịnh phụ
thuộc vào ñặc tính của hệ thống vòng kín. Phương pháp thiết kế thường sử
dụng là ñặt cực (pole placement). Phương pháp dựa theo mô hình mẫu
(mode – following) và phương pháp ñặt cực ñã ñược ñề cập ở phần 3.2 và
phụ lục A (TLTK[1]).

Trang 324
Chương 3 ðiều khiển thích nghi

Xét mô hình của hệ thống có phương trình (3.24) và ñáp ứng của hệ thống
vòng kín mong muốn là :
Am(q).y(t) = Bm(q).uc(t) (3.29)
Bộ ñiều khiển là:
R(q)u (t ) = T (q)u c (t ) − S (q) y (t ) (3.30)
R1 và S là giải pháp cho phương trình Diophantine
AR1 + B − S = A0 Am (3.31)
trong ñó
B = B+ B− (3.32)
Bm = B − Bm′ (3.33)
T = A0 Bm′ (3.34)
R = B + R1 (3.35)
Một vài ñiều kiện phải thoả mãn ñể chắc rằng bộ ñiều khiển là nhân quả
(causal) (xem phụ lục A TLTK[1] ). Các phương trình ở trên là cơ bản cho
nhiều bài toán thiết kế khác nhau.

∗ Một kiểu mẫu cho một bộ tự chỉnh ñịnh gián tiếp


Bộ tự chỉnh ñịnh gián tiếp dựa trên thiết kế ñặt cực có thể biểu diễn trong
thuật toán sau:

Thuật toán 3.1 - Bộ tự chỉnh ñịnh gián tiếp


Dữ liệu : Hàm truyền ñáp ứng xung vòng kín mong muốn Bm/Am và ña thức
quan sát mong muốn A0 ñược cho trước.
Bước 1: Ước lượng các hệ số của ña thức A, B, C trong phương trình (3.24)
dùng phương pháp bình phương tối thiểu từ các phương trình (3.25) – (3.28)
Bước 2: Thay A, B, C bằng các ước lượng ñạt ñược ở bước 1 và giải
phương trình (3.31) ñể tìm R1, S. Tính R bằng phương trình (3.35) và T
bằng phương trình (3.34).
Bước 3 : Tính tín hiệu ñiều khiển từ phương trình (3.30)
Lặp lại bước 1, 2, 3 ở mỗi chu kì lấy mẫu.

Trang 325
Chương 3 ðiều khiển thích nghi

Một số vấn ñề cần chú ý với thuật toán này :


+ Bậc của các ña thức ở phương trình 3.24 hoặc giới hạn bậc cao nhất phải
biết trước.
+ Thừa số chung của các ước lượng A, B có khả năng giải ñược phương
trình 3.31
+ Phải ñảm bảo hệ thống vòng kín là ổn ñịnh.
+ Các tín hiệu nên kích thích liên tục ñể ñảm bảo sự hội tụ các thông số.

Ví dụ 3.13 Bộ tự chỉnh ñịnh gián tiếp với nhiễu xác ñịnh


Xét hệ thống có hàm truyền :
1
G(s) =
s ( s + 1)
Hàm truyền này ñược xem như là mô hình cơ bản của ñộng cơ. Hàm truyền
ñáp ứng xung với chu kì lấy mẫu h = 0.5 là :
B 0 . 107 q + 0 . 090 0.107(q + 0.84)
H(q) = = 2 =
A q − 1 . 61 q + 0 . 61 (q − 1)(q − 0.61)
Hệ thống ñược lấy mẫu có 1 zero = -0.84 bên trong vòng tròn ñơn vị với hệ
số tắt nhỏ. Giả sử hệ thống vòng kín mong muốn là :
Bm 0.18
= 2
Am q − 1.32q + 0.50
ðiều này tương ứng với hệ thống có tần số dao ñộng tự nhiên 1 rad/sec và
hệ số tắt ζ = 0.7
Giả sử ña thức quan sát là :
A0 = (q – 0.5)2

Mô phỏng hệ thống trong ví dụ 3.13.


Kết quả mô phỏng ñược mô tả ở hình (3.11), (3.12) và (3.13).
 Hình 3.11 biểu diễn tín hiệu ñầu ra và tín hiệu ñiều khiển của hệ
thống thực khi một bộ tự chỉnh ñịnh gián tiếp ñược sử dụng với
phương pháp bình phương cực tiểu và zero z = - 0.84 của hệ thống
thực bị khử.
 Hình 3.12 chỉ ra việc ước lượng các thông số của hệ thống hội tụ
nhanh ñến các thông số của mô hình thực. Có sự dao ñộng lớn của

Trang 326
Chương 3 ðiều khiển thích nghi

tín hiệu ñiều khiển do việc khử zero. Dao ñộng này là kết quả của
sự chọn lựa kém trong bài toán thiết kế cơ bản chứ không phải phụ
thuộc vào bộ tự chỉnh ñịnh. Dao ñộng này có thể tránh ñược bằng
cách thay ñổi thiết kế mà không khử zero của hệ thống thực ( chẳng
hạn Bm = B).
 Hình 3.13 chỉ ra kết quả khi thay ñổi thiết kế không có zero nào bị
khử. ðáp ứng của hệ thống vòng kín bây giờ ñã ñược thoả mãn.

Hình 3.11 Tín hiệu ñầu ra và tín hiệu ñiều khiển của hệ thống thực khi sử
dụng bộ tự chỉnh ñịnh gián tiếp.

Hình 3.12 Kết quả mô phỏng việc ước lượng thông số.

Trang 327
Chương 3 ðiều khiển thích nghi

Hình 3.13 Tương tự hình 3.11 nhưng với hệ thống không khử ñiểm zero.

Ví dụ 3.14 Bộ tự chỉnh ñịnh với nhiễu ngẫu nhiên :


Xét hệ thống ñược mô tả như sau :
y(t) + ay(t – 1) = bu(t – 1) + e(t) + c e(t – 1)
với a = - 0.9, b = 3, c = -0.3. Bài toán thiết kế cơ bản ñược sử dụng là ñiều
khiển sai lệch cực tiểu. Bộ ñiều khiển sai lệch cực tiểu ñược cho như sau :
c−a
u(t) = - y(t) = - 0.2y(t)
b
ðiều này dẫn ñến hệ thống vòng kín : y(t) = e(t)
Phương pháp cực ñại ñệ qui ñược sử dụng ñể ước lượng các thông số chưa
biết a, b và c. Các ước lượng ñạt ñược từ phương trình 3.25 – 3.28 với :
θ T = [b a c]
ϕ T (t − 1) = [u (t − 1) − y (t − 1)ε (t − 1)]
ε (t ) = y (t ) − ϕ T (t − 1)θˆ(t − 1)
Bộ ñiều khiển là:
u (t ) = − sˆ0 (t ) y (t )
cˆ(t ) − aˆ (t )
sˆ0 (t ) =
bˆ(t )

Trang 328
Chương 3 ðiều khiển thích nghi

Mô phỏng bộ tự chỉnh ñịnh trong ví dụ 3.14.

Hình 3.14 Ngõ ra và tín hiệu ñiều khiển của hệ thống khi sử dụng bộ tự
chỉnh ñịnh gián tiếp dựa trên ñiều khiển sai lệch cực tiểu

Hình 3.15 Hàm chi phí của hệ thống khi sử dụng bộ tự chỉnh ñịnh gián tiếp
và ñiều khiển sai lệch cực tiểu tối ưu

Hình 3.16 Biểu diễn thông số sˆ0 (t ) của bộ ñiều khiển.

Trang 329
Chương 3 ðiều khiển thích nghi

Hình 3.15 biểu diễn hàm chi phí :


t
V(t) = ∑y
i =1
2
(i )

Khi sử dụng bộ ñiều khiển sai lệch cực tiểu tối ưu và bộ tự chỉnh ñịnh gián
tiếp. ðường cong cho tổn hao tích luỹ của STR gần với ñường cong tối ưu.
ðiều này có nghĩa bộ tự chỉnh ñịnh gần như tối ưu ngoại trừ khoảng t quá
ñộ khi khởi ñộng.
Tóm tắt : Thuật toán tự chỉnh ñịnh gián tiếp là những ứng dụng ñơn giản
của ý tưởng tự chỉnh ñịnh. Chúng có thể ñược áp dụng tới nhiều phương
pháp thiết kế bộ ñiều khiển và ước lượng thông số. Có 3 khó khăn chính
với phương pháp này. Phân tích tính ổn ñịnh là phức tạp bởi vì các thông số
chỉnh ñịnh phụ thuộc vào các thông số ñã ước lượng. Thường thì cần phải
giải các phương trình tuyến tính trong các thông số bộ ñiều khiển. Lộ trình
từ các thông số quá trình ñến các thông số tự chỉnh có thể có các ñiểm kì dị.
ðiều này xảy ra trong các phương pháp thiết kế dựa vào phương pháp ñặt
cực, chẳng hạn, nếu mô hình ñã ước lượng có chung cực và zero. Các cực
và zero chung cần phải loại bỏ trước khi tiến hành phương pháp ñặt cực. Do
ñó việc phân tích tính ổn ñịnh chỉ thực hiện trong một số ít trường hợp. ðể
ñảm bảo các thông số hội tụ ñến các giá trị chính xác thì cấu trúc của mô
hình phải chính xác và tín hiệu ñầu vào phải kích thích liên tục.

3.2.3 Bộ tự chỉnh ñịnh trực tiếp


Khối lượng tính toán cho các thuật toán ở phần trước tốn nhiều thời gian và
tính ổn ñịnh rất khó ñể phân tích. Nhiều thuật toán khác ñược ñề xuất ñể
việc tính toán thiết kế ñơn giản hơn. Ý tưởng là dùng các ñặc tính, các cực
và zero mong muốn ñể viết lại mô hình hệ thống sao cho các bước thiết kế
là không ñáng kể. ðiều này dẫn tới việc thông số hoá lại mô hình.
Nhân phương trình Diophantine (3.31) với y(t) và dùng mô hình có phương
trình 3.24 thì :
A0 Am y(t ) = R1 Ay(t ) + B − Sy(t )
= R1Bu(t ) + B − Sy(t ) + R1Ce(t ) (3.36)
= B − [ Ru(t ) + Sy(t )] + R1Ce(t )
Chú ý rằng phương trình 3.36 có thể ñược xem như là một mô hình của hệ
thống ñược thông số hoá trong B-, R và S. Việc ước lượng các thông số này
tạo ra các ña thức R và S của bộ chỉnh ñịnh một cách trực tiếp. Kết hợp

Trang 330
Chương 3 ðiều khiển thích nghi

phương trình 3.34 , tín hiệu ñiều khiển ñược tính từ phương trình 3.30 . Lưu
ý mô hình ở phương trình 3.36 là phi tuyến trừ phi B- là hằng số.
Cách khác ñể thông số hoá là viết mô hình ở phương trình 3.36 như:
A0 Am y = Ru + Sy + R1Ce (3.37)
Trong ñó
R = B−R và
S = B−S
Chú ý ña thức R ở phương trình (3.36) là monic (ña thức có hệ số ở bậc cao
nhất bằng 1) nhưng R ở phương trình (3.37) thì không phải monic. Các ña
thức R và S có một thừa số chung tượng trưng cho các zero tắt kém. Thừa
số chung này nên khử bỏ trước khi tính toán luật ñiều khiển.

• Thuật toán 3.2 - Bộ tự chỉnh ñịnh trực tiếp :


Bước 1: Ước lượng các hệ số của ña thức R và S ở mô hình phương trình
(3.37).
Bước 2: Khử các thừa số chung trong R và S ñể ñạt ñược R và S.
Bước 3: Tính tín hiệu ñiều khiển từ phương trình 3.30 mà R và S có ñược ở
bước 2.
Lặp lại bước 1, 2, 3 ở mỗi chu kì lấy mẫu.
Thuật toán này tránh việc ước lượng phi tuyến nhưng cần phải ước lượng
nhiều thông số hơn khi dùng phương trình 3.36 vì các thông số của ña thức
B- ñược ước lượng 2 lần. Bước 2 do ñó rất khó thực hiện.
Vì việc ước lượng các thông số ở phương trình 3.36 tương ñối khó nên ta
xét trường hợp ñặc biệt B- là hằng số. Giả sử tất cả các zero có thể bị khử
( B − = b0 )
A0 Am y(t ) = b0 [ Ru(t ) + Sy(t )] + R1Ce(t ) (3.38)
ðáp ứng mong muốn như sau:
Am y m (t ) = b0Tu c (t )
Trong ñó:
bậc(A) = n và A0 chia hết cho T. Sai số ε(t) = y(t) - ym ñược cho bởi:

Trang 331
Chương 3 ðiều khiển thích nghi

b0
ε (t ) = [Ru (t ) + Sy (t ) − Tu c (t )] + R1C e(t )
A0 Am A0 Am
Bây giờ ta xem xét các trường hợp khác nhau. ðầu tiên giả sử e = 0. ða
thức quan sát có thể ñược chọn tự do, khi dùng mô hình liên tục theo thời
gian thì ñiều cần thiết phải giả sử b0/(A0Am) là SPR (Strictly Positive Real =
Thực dương chặt) ñể ñạt ñược một MRAS ổn ñịnh. Ta cũng cần lưu ý rằng
hàm truyền có các hệ số là số thực dương thoả ñiều kiện cần ñể ổn ñịnh
ñược gọi là PR (Positive Real). Hàm là SPR nếu nó ổn ñịnh với ñộ dự trữ ε
dương nhỏ tuỳ ý. Một ñiều kiện tương tự cũng là cần thiết cho các mô hình
rời rạc theo thời gian. Viết lại mô hình như sau:
u (t ) y (t ) u (t )
ε (t ) = b0 [ R + S − T c ]
A0 Am A0 Am A0 Am
= b0 [ R *u f (t − d 0 ) + S * y f (t − d 0 ) − T *u cf (t − d 0 )]

trong ñó
1
u f (t ) = u (t )
A (q ) Am* (q −1 )
*
0
−1

1
y f (t ) = y (t )
A (q ) Am* (q −1 )
*
0
−1

1
u cf (t ) = u c (t )
A (q ) Am* (q −1 )
*
0
−1

ðiều này tương ứng với trường hợp P = Q = A0Am ở phần 3.2 . Tính hội tụ
bây giờ sẽ phụ thuộc vào dấu của b0. ðiều này chỉ ra mối liên hệ giữa
MRAS và STR.

• Thuật toán 3.3 - Bộ tự chỉnh trực tiếp với nhiễu xác ñịnh
Dữ liệu : Cho trước giới hạn thấp nhất của thời gian trễ d0 và dấu của b0,
ñáp ứng xung hàm truyền vòng kín mong muốn b0/A*m và ña thức quan sát
mong muốn A0.
Bước 1 : Ước lượng các hệ số của ña thức R*, S*, và T* ở phương trình 3.38
dùng phương pháp ước lượng ñệ qui.
Bước 2 : Tính tín hiệu ñiều khiển từ :
R*u(t) = - S*y(t) + T*uc(t)

Trang 332
Chương 3 ðiều khiển thích nghi

Lặp lại các bước 1, 2 ở mỗi chu kì lấy mẫu.


Thuật toán này tương ứng với bộ ñiều khiển thích nghi dùng mô hình chuẩn
ở phần 3.2 . Chú ý thuật toán yêu cầu b0 phải biết trước. Nếu không biết
trước b0 thì cũng có thể ước lượng ñược bằng cách thay phương trình 3.38
bằng :
A0Amy(t) = Ru(t) + Sy(t) +R1C.e(t)
mà R bây giờ không phải là monic.

• Các bộ ñiều khiển thay ñổi cực tiểu và mức trung bình di chuyển
(Minimum – Variance and Moving – average)

Các thuật toán ñiều khiến trong trường hợp nhiễu ngẫu nhiên cho hệ thống
ñược mô tả bởi phương trình 3.24 sẽ ñược xem xét. ðầu tiên giả sử mô hình
biết trước, e là một nhiễu ngẫu nhiên và uc = 0. ða thức của bộ quan sát tối
ưu cho mô hình ở phương trình 3.24 là A0 = C. Tiêu chuẩn thiết kế là thay
ñổi cực tiểu hoặc trung bình di chuyển.
Nếu quá trình là cực tiểu pha, bộ chỉnh ñịnh thay ñổi cực tiểu ñược cho bởi:
R*(q -1)u(t) = - S*(q -1)y(t) (3.39)
Trong ñó R* và S* là nghiệm có bậc cực tiểu của phương trình Diophantine
A* (q -1)R* (q -1) + q – d 0 B* (q -1)S*(q -1) = B* (q-1)C* (q -1) (3.40)
với d0 = Bậc (A) - Bậc (B). Bộ ñiều khiển thay ñổi cực tiểu tương ứng với
mô hình mong muốn với một khoảng trễ d0 bước, A*m = 1. Từ phương trình
3.40 thì R* phải chia hết cho B* :
R* = R*1.B*
Trong ñó : Bậc(R1) = d0 – 1. Phương trình 3.40 ñược viết lại :
A*R*1 + q − d 0 S* = C*
C*y(t) = A*R*1y(t) + S*y(t – d0)
= B*R*1u(t – d0) + S*y(t – d0) + R*1C*e(t)
= R*u(t – d0) + S*y(t – d0) + R*1C*e(t)
phương trình này có thể ñược viết lại :
1
y(t + d0) = *
[R*u(t) + S*y(t)] + R*1e(t + d0) (3.41)
C

Trang 333
Chương 3 ðiều khiển thích nghi

với bộ ñiều khiển ở phương trình 3.39 thì ñầu ra của hệ thống vòng kín trở
thành :
y(t) = R*1(q-1).e(t)
Ngõ ra vì vậy là một trung bình di chuyển với bậc (d0 -1). Trong Cström
(1970) chỉ ra rằng bộ chỉnh ñịnh sẽ cực tiểu sự thay ñổi ngõ ra. Một ñặc
ñiểm quan trọng là ngõ ra trở thành một trung bình di chuyển bậc (d0 – 1).
Chú ý số tự nhiên d0 ñược diễn tả như là số mẫu trôi qua ñể ñầu ra thay ñổi
khi ñầu vào thay ñổi.
Bộ ñiều khiển thay ñổi cực tiểu có hạn chế là tất cả các zero của quá trình
ñều bị khử. ðiều này có nghĩa sẽ là khó khăn nếu B có các zero bên ngoài
vòng tròn ñơn vị. Các khó khăn này sẽ tránh ñược ở bộ ñiều khiển trung
bình di chuyển. Bộ ñiều khiển này làm cho ngõ ra có bậc lớn hơn (d0 – 1).
Bộ ñiều khiến ñược ñề xuất như sau: thừa số B+ và B- trong B với B+ có các
zero tắt nhanh ( zero well – damped). Xác ñịnh R* và S* từ :
A*R* + q- d 0 B*S* = B+ *C*
Phương trình 3.41 cho ta:
1
y(t + d) = *
[R*u(t) + S*y(t)] + R*1e(t + d) (3.42)
C
Trong ñó:
R * = R1* B +
Vì ngõ ra ñược ñiều khiển là một quá trình trung bình di chuyển với bậc (d
– 1) nên chúng ta gọi là ñiều khiển trung bình di chuyển. Chú ý không có
zero nào bị khử nếu B+ * = 1, có nghĩa d = bậc (A) = n.
Cả 2 luật ñiều khiển thay ñổi cực tiểu và trung bình di chuyển dẫn ñến mô
hình tương ñương của phương trình 3.41 và 3.42 . Sự khác nhau duy nhất là
ở giá trị của d mà sẽ ñiều khiển số zero của quá trình bị khử. Với d = d0 =
Bậc(A) - Bậc(B) : tất cả zero bị khử. Với d = Bậc(A) : không có zero nào bị
khử.
Lọc với A*0 trong phương trình 3.38 cũng có thể tạo ra mô hình của phương
trình 3.42 :
A0* *
y(t + d) = [R uf(t) + S*yf(t)] + R*1e(t + d) (3.43)
C*
Nếu B+ chứa tất cả các zero ổn ñịnh của hệ thống thì nó sẽ tương ứng như
bộ ñiều khiển thay ñổi cực tiểu cận tối ưu trong Cström (1970)

Trang 334
Chương 3 ðiều khiển thích nghi

Bộ tự chỉnh ñịnh thay ñổi cực tiểu và trung bình di chuyển


Thuật toán 3.4 - Thuật toán tự chỉnh ñịnh trực tiếp cơ bản

Dữ liệu : Cho trước khoảng dự báo d. Gọi k và l tương ứng là số thông số


trong R* và S*.
Bước 1: Ước lượng các hệ số của ña thức R* và S*
y(t + d) = R*(q -1)uf(t) + S*(q -1)yf(t) + ε(t + d) (3.44)
trong ñó : R*(q -1) = r0 + r1q -1 +. . . + rkq –k
S*(q -1) = s0 + s1q -1 + . . . + slq –l

1
uf (t) = u(t)
A (q −1 )
*
0

1
yf (t) = y(t)
A (q −1 )
*
0

sử dụng các phương trình 3.25 – 3.28 với


ε(t) = y(t) - R*uf (t – d) – S*yf (t – d) = y(t) - ϕT(t – d) θˆ (t – 1)
1
ϕT = [u(t) . . . u(t – k) y(t) . . . y(t – l)]
A (q −1 )
*
0

θ T = [r0. . . rk s 0 . . .sl]
Bước 2: Tính luật ñiều khiển
R * (q −1 )u (t ) = − S * (q −1 ) y (t ) (3.45)
* *
Với R và S ñược thay bằng các ước lượng tương ứng trong bước 1.
Lặp lại các bước 1 và 2 ở mỗi chu kì lấy mẫu.
Chú ý: Thông số r 0 có thể ước lượng hoặc giả sử biết trước. Ở các trường
hợp sau ñể thuận lợi ta viết R* như sau:
R*(q -1) = r 0 (1 + r1' q − 1 + . . . + rk' q − k )
Và sử dụng
ε(t) = y(t) – r0 uf(t – d) - ϕT(t – d) θˆ (t – 1)

Trang 335
Chương 3 ðiều khiển thích nghi

1
ϕT = [r0 u (t − 1) L r0 u (t − k ) y (t ) L y (t − l )
A (q −1 )
*
0

θ T = [r1' . . . rk' s0 . . . sl ]
Tính chất tiệm cận
Mô hình ở phương trình 3.41 và 3.42 ñược diễn tả như là việc thông số hoá
lại mô hình ở phương trình 3.24 . Chúng tương ñồng với mô hình ở phương
trình 3.44 trong thuật toán 3.4 nếu A0 ñược chọn bằng C. Vector hồi qui
không tương quan với sai số và phương pháp ước lượng bình phương tối
thiểu sẽ hội tụ tới thông số thật. Một kết quả ñáng kinh ngạc là cũng tự
chỉnh ñịnh chính xác khi A0 ≠ C. Kết quả sau chỉ ra các thông số tự chỉnh
ñịnh chính xác có gía trị tương ñồng với thuật toán 3.4 khi A0 ≠ C.

ðịnh lí 3.1 – Tính chất tiệm cận


Xét thuật toán 3.4 với A*0 = 1 dùng phương pháp ước lượng bình phương
cực tiểu. Thông số b0 = r0 có thể cố ñịnh hoặc ñược ước lượng. Giả sử
vector hồi qui có giới hạn, và các ước lượng là hội tụ. Hệ thống vòng kín
ñạt ñược trong ñiều kiện giới hạn có ñặc ñiểm
y (t + τ ) y (t ) = 0 τ = d , d + 1,..., d + l
(3.46)
y (t + τ )u (t ) = 0 τ = d , d + 1,..., d + k
trong ñó dấu gạch chỉ giá trị trung bình theo thời gian; k, l là số các thông
số ước lượng trong R* và S*.

Chứng minh: Mô hình của phương trình 3.44 có thể ñược viết lại:
y(k + d) = ϕT(k)θ + ε(k + d)
và luật ñiều khiển trở thành:
ϕ T (k )θˆ(k + d ) = 0
Tại một trạng thái cân bằng, các thông số ước lượng θˆ là những hằng số.
Hơn nữa, chúng thoả mãn các phương trình chuẩn, trong trường hợp này
ñược viết lại như sau:
1 t 1 t
∑ ϕ ( k ) y ( k + d ) = ∑ ϕ (k )ϕ T (k )θˆ(t + d )
t k =1 t k =1
Sử dụng luật ñiều khiển

Trang 336
Chương 3 ðiều khiển thích nghi

1 t 1 t
lim ∑ ϕ (k ) y (k + d ) = lim ∑ ϕ (k )ϕ T (k )[θˆ(t + d ) − θˆ(k + d )]
t→∞ t t→∞ t
k =1 k =1

Nếu thông số ước lượng θˆ(t ) hội tụ khi t → ∞ , và các vector hồi qui bị
giới hạn thì vế phải sẽ tiến tới zero. Phương trình 3.46 bây giờ kéo theo
A0* = 1 và xác ñịnh về sự hồi qui vector trong thuật toán 3.4

ðịnh lí 3.2 – Tính chất tiệm cận 2


Giả sử thuật toán 3.4 với phương pháp ước lượng bình phương cực tiểu
ñược áp dụng cho phương trình 3.24 và:
min(k, l) ≥ n – 1 (3.47)
Có nghĩa tín hiệu ra là quá trình có mức trung bình di chuyển bậc (d -1).
Nếu các ước lượng tiệm cận của R và S liên quan với nhau, nghiệm trạng
thái cân bằng là:
y (t + τ ) y (t ) = 0 τ = d, d + 1,..... (3.48)

Chứng minh: Hệ thống vòng kín ñược mô tả như sau:


R *u (t ) = − Sy (t )
A* y(t) = B*u(t – d0) + C*e(t)
Vì vậy
(A*R* + q − d0
B*S*)y = R*C*e
(A*R* + q − d0
B*S*)u = − S *C * e
Tín hiệu ω ñược ñịnh nghĩa
(A*R* + q − d0
B*S*)ω = C*e (3.49)
Vì vậy:
y = R *ω và u = − S *ω
ðiều kiện của phương trình 3.46 ñưa ñến
Rω (t + τ ) y (t ) = 0 τ = d, d + 1, ..., d + l
Sω (t + τ ) y (t ) = 0 τ = d, d + 1, ..., d + k
ðặt

Trang 337
Chương 3 ðiều khiển thích nghi

Cωy (τ ) = ω (t + τ ) y (t )
các phương trình trên có thể ñược viết lại:
r0 r1 r2 L rk 0 L 0
0 r0 r1 r2 L rk 
 
M O O O O O 
  Cωy (d + k + l )
0 L 0 r0 r1 r2 L rk  
M

= 0
s0 s1 s2 L sl 0 L 0  
   C ( d ) 
 ωy 
0 s0 s1 s2 L sl 
M O O O O O 
 
0 L 0 s 0 s1 s 2 L s l 
Cωy(τ ) = 0 τ = d, d + 1, . . . , d + k + l
Hàm tương quan thoả mãn phương trình:

F*(q -1)Cωy(τ ) = 0 τ ≥ 0
Hệ thống phương trình 3.49 có bậc
n + k = n + max(k,l)
Nếu
k+ l + 1 ≥ n + max(k, l)
hoặc tương ñương với
min(k, l) ≥ n – 1
dẫn ñến
Cωy(τ ) = 0 τ = d, d + 1,...
là ñiều cần chứng minh.

3.3.4 Kết nối giữa MRAS và STR


Các hệ thống thích nghi dùng mô hình chuẩn trực tiếp ñã ñược ñề cập trong
phần 3.2. Trong phụ lục A (TLTK[1]) cũng chỉ ra mô hình kèm theo và ñặt
cực là liên quan với nhau. Bây giờ chúng ta sẽ chứng tỏ bộ chỉnh ñịnh trực
tiếp dùng phương pháp ñặt cực ở thuật toán 3.2 là tương ñương với một
MRAS. Trong trường hợp nhiễu xác ñịnh, khi B- là hằng số, mô hình của
quá trình ñược viết lại như sau:

Trang 338
Chương 3 ðiều khiển thích nghi

y(t) = ϕ Tf (t − d 0 )θ
Trong thuật toán gián tiếp, các thông số ñược ước lượng bằng các thông số
của bộ chỉnh ñịnh. Phương pháp bình phương cực tiểu ñược sử dụng cho
việc ước lượng và ε(t) ñược viết lại:
ε(t) = y(t) - yˆ (t ) = y (t ) − ϕ T (t − d )θˆ
f (3.50)
0

Thông số cập nhật có thể ñược viết lại:


θˆ(t ) = θˆ(t − 1) + P(t )ϕ Tf (t − d 0 )ε (t ) (3.51)
Chú ý rằng theo phương trình 3.50 thì
ϕ Tf (t − d 0 ) = − gradθ ε (t )
Vector ϕ Tf (t − d 0 ) diễn tả như là ñạo hàm của ñộ nhạy. Việc cập nhật
thông số ở phương trình 3.51 là một phiên bản rời rạc theo thời gian của
luật MIT. Sự khác biệt chính là sai số mô hình e(t) = y(t) - ym(t) ñược
thay bằng giá trị thặng dư ε(t) và ñộ lợi γ ở MRAS ñược thay bằng ma trận
P(t) cho ở phương trình 3.28. P làm thay ñổi hướng của gradient và tạo ra
một chiều dài bước thích hợp. Ngược lại, luật MIT cũng có thể xem như là
một thuật toán gradient ñể cực tiểu e2, phương trình 3.51 dược xem như là
một phương pháp Newton ñể cực tiểu ε2(t). Giá trị thặng dư ε ñược xem
như số gia sai số.
Chú ý rằng trong các kĩ thuật nhận dạng như các bộ tự chỉnh ñịnh chúng ta
thường cố gắng ñạt ñược một kiểu mẫu tương tự với
y (t ) = ϕ Tf θ
Với phương pháp mô hình chuẩn thì thường xuyên chỉ có thể ñạt một mô
hình kiểu y (t ) = G ( p)(ϕ Tf θ )
Với G(p) là SPR.

Ví dụ 3.15 - Bộ tự chỉnh ñịnh trực tiếp với thay ñổi cực tiểu
Mô hình của quá trình ở phương trình 3.44 là :
y(t + 1) = r0 u (t ) + s 0 y (t ) + ε (t + 1)
Giả sử r0 cố ñịnh tới giá trị r̂0 = 1. Chú ý ñiều này khác với giá trị
thật là bằng 3. Thông số s0 ñược ước lượng dùng phương pháp bình phương
cực tiểu.

Trang 339
Chương 3 ðiều khiển thích nghi

Luật ñiều khiển trở thành:


sˆ0
u (t ) = − y (t )
rˆ0
Mô phỏng cho ví dụ 3.15
Kết quả mô phỏng ñược biểu diễn ở hình 3.17 và hình 3.18

Hình 3.17
Hình 3.17 biểu diễn tỉ số sˆ0 / rˆ0 , nó nhanh chóng hội tụ ñến một giá trị của
bộ ñiều khiển thay ñổi cực tiểu tối ưu thậm chí r̂0 không bằng giá trị thật
của nó.

Hình 3.18
Hình 3.18 biểu diễn hàm tổn hao khi dùng bộ tự chỉnh ñịnh và bộ ñiều
khiển thay ñổi cực tiểu tối ưu.

3.3.5 ðiều khiển dự báo thích nghi


Thuật toán 3.4 là cách ñể thực hiện một bộ ñiều khiển với tầm dự báo thay
ñổi. Bài toán ñiều khiển cơ bản là bộ ñiều khiển trung bình di chuyển. Bộ
ñiều khiển trung bình di chuyển cũng có thể áp dụng ñược cho các hệ thống

Trang 340
Chương 3 ðiều khiển thích nghi

không cực tiểu pha như ñược minh họa ở phần “Bộ chỉnh ñịnh trực tiếp”.
Nhiều cách khác ñể có ñiều khiển dự báo sẽ ñược ñề cập trong tài liệu, một
vài trong số này sẽ ñược thảo luận và phân tích. Cũng như ñối với các thuật
toán trước, xác ñịnh bài toán ñiều khiển cơ bản là rất quan trọng ñể hiểu rõ
các tính chất tiệm cận của thuật toán. Trước tiên ta sẽ phân tích trường hợp
các thông số là biết trước.
Thuật toán ñiều khiển dự báo dựa trên một mô hình của quá trình giả thuyết
và các tín hiệu ñiều khiển ở tương lai. ðiều này tạo ra một chuỗi các tín hiệu
ñiều khiển. Chỉ có một tín hiệu ñầu tiên là ñược áp dụng cho quá trình và
một chuỗi các tín hiệu ñiều khiển mới ñược tính toán khi thực hiện phép ño
ñạc mới. ðây gọi là bộ ñiều khiển lùi tầm (receding – horizon controller).

Dự báo ngõ ra
Ý tưởng cơ bản trong các thuật toán ñiều khiển dự báo là viết lại mô hình
quá trình ñể có ñược một biểu thức rõ ràng cho ngõ ra ở một thời ñiểm
tương lai. Xét mô hình :
A* (q -1) y(t) = B* (q -1) u(t – d0) (3.52)
* -1 * -1 –d
1 = A (q )F (q ) + q G*d(q -1) (3.53)
Trong ñó
bậc( F*d ) = d – 1
bậc( G*d) = n – 1

Chỉ số d là tầm dự báo với d bước. Giả sử d ≥ d0. Việc ñồng nhất ña thức ở
phương trình 3.52 ñược dùng ñể dự báo ngõ ra ở d bước phía trước. Vì vậy :
y(t + d) = A*F*d y(t + d) + G*d y(t) = B*F*d u(t + d – d0) + G*d y(t)
B* (q -1)F*d (q -1) = R*d (q -1) + q – (d - d 0 + 1) R *d (q -1)
Bậc(R*d) = d – d0
Bậc( R *d) = n – 2

Các hệ số của R*d là những giới hạn d – d0 + 1 ñầu tiên của ñáp ứng xung
của hệ thống vòng hở. ðiều này có thể thấy như sau:
Gd*
q - d 0 B*/A* = q - d 0 B*(F*d + q − d )
A*

Trang 341
Chương 3 ðiều khiển thích nghi

B * (q −1 )Gd* (q −1 ) – ( d d0 )
= q − d 0 Rd* (q −1 ) + q – ( d + 1) Rd* (q -1) + q +
(3.54)
A* (q −1 )
y( t + d) = Rd* (q −1 ) u(t + d – d0) + Rd* (q -1) u(t – 1) + G*d (q – 1) y(t)
= Rd* (q −1 ) u(t + d – d0) + y d (t) (3.55)
Rd* (q −1 ) u(t + d – d0) phụ thuộc vào u(t), . . . , u(t + d – d0), y d (t) là hàm
của u(t – 1), u(t – 2),... và y(t), y(t -1)....Biến y d (t) ñược hiểu như là ñiều
kiện dự báo của y(t + d) với giả sử u(t) và các tín hiệu ñiều khiển tương lai
là zero. Ngõ ra ở thời ñiểm (t + d) vì vậy phụ thuộc vào các tín hiệu ñiều
khiển tương lai ( nếu d > d0), tín hiệu ñiều khiển, các ngõ vào và ngõ ra ở
thời ñiểm trước. Cũng có thể giả sử tín hiệu ñiều khiển duy trì hằng số:
u(t) = u(t + d) = .... = u(t + d – d0) (3.56)

Cách khác ñể xác ñịnh luật ñiều khiển là mang y(t + d) ñến một giá trị mong
muốn trong khi cực tiểu mục tiêu ñiều khiển theo tầm dự báo:
t+d

∑ u (k )
k =t
2
(3.57)

ðiều khiển không thay ñổi theo thời gian:


Chọn ngõ ra ñược dự báo bằng với ngõ ra mong muốn ym và giả sử vẫn giữ
phương trình 3.56 :
[R*d(1) + q -1 Rd* (q -1)]u(t) + G*d (q – 1) y(t) = ym(t + d)
Luật ñiều khiển là:
y m (t + d ) − Gd* (q −1 ) y (t )
u(t) = (3.58)
Rd* (1) + Rd* (q −1 )q −1
Tín hiệu ñiều khiển này sẽ ñược sử dụng cho quá trình. Ở lần lấy mẫu kế
tiếp, một phép ño mới ñạt ñược và luật ñiều khiển ở 3.58 dược sử dụng tiếp.
Chú ý giá trị của tín hiệu ñiều khiển thay ñổi theo thời gian chứ không phải
cố ñịnh. Ở ñây ta sử dụng qui tắc ñiều khiển lùi tầm. Chú ý luật ñiều khiển
là không ñổi ngược với bộ ñiều khiển LQ cố ñịnh tầm.
Bây giờ chúng ta sẽ phân tích hệ thống vòng kín khi sử dụng phương trình
3.58 ñể ñiều khiển quá trình 3.52.Việc thực hiện các phép tính ở toán tử sai

Trang 342
Chương 3 ðiều khiển thích nghi

phân tới là cần thiết ñể có thể quan sát các cực ban ñầu. Phương trình 3.53
ñược viết lại theo toán tử sai phân tới như sau:
q n + d - 1 = A(q)Fd(q) + Gd(q) (3.59)
ða thức ñặc tính của hệ thống vòng kín là:
P(q) = A(q) [q n – 1Rd(1) + Rd (q) ] + Gd (q) B(q)
Bậc(P) = Bậc(A) + n - 1 = 2n – 1
Phương trình thiết kế 3.59 có thể ñược sử dụng ñể viết lại hàm P(q):
B(q)q n + d - 1 = A(q) B(q)Fd(q) + Gd (q) B(q)
= A(q)[q n -1 Rd (q) + Rd (q)] + Gd (q) B(q)
Vì vậy :
A(q) Rd (q) + Gd (q) B(q) = B(q) q n + d -1 - A(q)q n – 1Rd(q)
Cho ta :
P(q) = q n – 1A(q)Rd(1) + q n – 1[qd B(q) - A(q)Rd(q)]
Nếu hệ thống ổn ñịnh thì các số hạng phía sau của 3.54 sẽ biến mất khi
d → ∞.
Do ñó: lim P(q) = q n -1 A(q)Rd(1) nếu A(z) là một ña thức ổn ñịnh.
d →∞

Ví dụ 3.16 - ðiều khiển dự báo


Xét quá trình :
y(t + 1) = ay(t) + bu(t)
Phương trình 3.59 cho ta :
qd = (q – a)(q d – 1 + f1q d – 2 + . . . + fd – 1) + g0
Vì vậy:
F(q) = q d – 1 + aq d – 2 + a2q d – 3 +. . . + a d – 1
G(q) = a d
Rd(q) = bF(q)
Rd (q) = 0
và khi ym = 0, luật ñiều khiển trở thành:

Trang 343
Chương 3 ðiều khiển thích nghi

ad a d (a − 1)
u(t) = - y(t) = - y(t)
b(1 + a + ... + a d −1 ) b(a d − 1)
Phương trình ñặc tính của hệ thống vòng kín là:
a d (a − 1)
P(q) = q – a +
ad −1
có cực:
ad − a
pd = d
a −1
Vị trí của cực ñược cho bởi:
0 ≤ pd < a a  ≤ 1 (hệ thống ổn ñịnh)

0 ≤ pd < 1 a  > 1 ( hệ thống không ổn ñịnh)


Cực vòng kín với các giá trị khác nhau của a và b ñược chỉ ở hình sau:

Ví dụ cũng cho thấy ñể việc quan sát là ñầy ñủ thì tầm dự báo phải từ 5 – 10
mẫu.
Cũng có thể tổng quát hoá kết quả ở ví dụ 3.16 cho các hệ thống bậc cao
hơn. ðối với các hệ thống thay ñổi chậm hoặc không ổn ñịnh thì ñáp ứng
vòng kín của nó sẽ rất chậm khi tăng tầm dự báo. Vì vậy giới hạn ở (3.56)
khi ñó sẽ là không hữu ích.

Nỗ lực ñiều khiển cực tiểu


Thuật toán ñiều khiển là sẽ mang y(t + d) tới ym(t + d) trong khi cực tiểu
phương trình 3.57 . Phương trình 3.55 ñược viết lại:

Trang 344
Chương 3 ðiều khiển thích nghi

y(t + d) = R*d(q -1)u(t + d – d0) + y d (t )


= rd 0 u(t + υ) + . . .+ rdυu(t) + y d (t )
υ = d – d0. Giới thiệu hàm Lagrange:
2J = u(t)2 + . . .+ u(t + υ)2 + 2λ[ym(t + d) - y d (t ) - R*d(q -1) u(t + υ)]
Cho ñạo hàm riêng ñối với các biến u(t), . . . ,u(t + υ) và λ bằng 0 ta ñược:
u(t) = λrdυ
.
.
.
u(t + υ) = λ rd 0
ym(t + d) - y d (t ) = rd 0 u(t + υ) + . . . + rdυ u(t)
Các phương trình này cho ta:
y m (t + d ) − y d (t )
u(t) =
µ
trong ñó:
ν

∑r 2
di
µ = i =0

rdν
Sử dụng ñịnh nghĩa y d (t ) cho ta:
µu(t) = ym(t + d) - Rd* u(t – 1) - Gd* y(t)
hoặc
y m (t + d ) − Gd* y (t ) y (t + d + n − 1) − Gd (q ) y (t )
u(t) = = m (3.60)
µ + q Rd
−1 *
µq n −1 + Rd (q)
Sử dụng phương trình 3.60 và mô hình của phương trình 3.52 cho ña thức
ñặc tính vòng kín:
P(q) = A(q) [q n - 1µ + Rd (q)] + Gd(q)B(q)
Phương trình này có dạng như 3.58 với Rd(1) ñược thay bằng µ. ðiều này có
nghĩa các cực vòng kín tiến gần tới zero của q n – 1A(q) khi A(q) là ổn ñịnh

Trang 345
Chương 3 ðiều khiển thích nghi

và khi d → ∞. ðiều gì sẽ xảy ra khi hệ thống không ổn ñịnh Hãy xét ví dụ


sau ñây:

Ví dụ 3.17 - ðiều khiển nỗ lực cực tiểu


Xét hệ thống tương tự như ví dụ 3.16 . Bộ ñiều khiển nỗ lực cực tiểu trong
trường hợp này ñược cho bởi:
1 + a 2 + ... + a 2( d −1) b(a 2 d − 1)
µ = b =
a d −1 a d −1 (a 2 − 1)
cho ta ( khi ym = 0)
ad a 2 d −1 (a 2 − 1)
u(t) = - y(t) = - y(t)
µ b(a 2 d − 1)
Cực của hệ thống vòng kín là:
a 2 d −1 (a 2 − 1) a 2 d −1 − a
pd = a - =
a 2d − 1 a 2d − 1
cho ta:
lim pd = a | a | ≤ 1 (hệ thống ổn ñịnh)
d →∞

lim pd = 1/a | a | > 1 (hệ thống không ổn ñịnh)


d →∞

Ở ví dụ này, bộ ñiều khiển nỗ lực cực tiểu sẽ tạo ra một hệ thống vòng kín
tốt hơn nếu ñiều khiển tương lai ñược giả sử là hằng số.

ðiều khiển dự báo tổng quát:


Các bộ ñiều khiển dự báo ñề cập từ trước chỉ xem xét giá trị ngõ ra chỉ ở
một thời ñiểm ở tương lai. Nhiều tổng quát hoá khác nhau của ñiều khiển dự
báo ñược ñề xuất mà trong ñó hàm tổn hao là cực tiểu:
N2 Nu
J(N1, N2, Nu) = E{ ∑ [ y (t + k ) − y m (t + k )]2 + ∑ ρ∆u (t + k − 1) 2 }
k = N1 k =1
(3.61)

Trong ñó ∆ = 1 – q -1 là toán tử vi phân. Sự lựa chọn các giá trị khác nhau
của N1, N2, Nu sẽ ñưa ra các phương pháp khác nhau.
Phương pháp ñiều khiển dự báo tổng quát ñược minh hoạ bằng cách dùng
hàm tổn hao 3.60 và mô hình quá trình:
A*(q)y(t) = B*(q -1)u(t – d0) + e(t) / ∆ (3.62)

Trang 346
Chương 3 ðiều khiển thích nghi

Mô hình này ñược gọi là CARIMA ( Controlled AutoRegressive


Intergrating Moving Average). Nó có thuận lợi là bộ ñiều khiển bản thân sẽ
chứa một khâu tích phân. Giống như phương trình 3.53 ta có ñồng nhất:
1 = A*(q)F*d(q - 1)(1 – q -1) + q –d G*d (q – 1) (3.63)
Công thức này ñược sử dụng ñể xác ñịnh ngõ ra ở d bước kế tiếp:
y(t + d) = F*dB* ∆u(t + d – d0) + G*dy(t) + F*de(t + d)
F*d có bậc d -1. Bộ dự báo với sai số quân phương tối ưu với ngõ ra ñược ño
ñạc ñến thời ñiểm t và chuỗi ngõ vào bất kì là:
yˆ (t + d ) = F*dB* ∆u(t + d – d0) + G*dy(t) (3.64)
Giả sử ñầu ra mong muốn ym(t + k), k = 1, 2, ...là có sẵn. Hàm tổn hao ở
3.61 sẽ ñược cực tiểu ñể cho ra một chuỗi các tín hiệu ñiều khiển ở tương
lai. Chú ý giá trị mong ñợi ở 3.61 sẽ có ñược tương ứng với dữ liệu có ñược
tới thời ñiểm t với giả sử các ño ñạc ở tương lai không có sẵn. ðiều này có
nghĩa chỉ có thừa số ñầu tiên của chuỗi ñiều khiển là ñược sử dụng. Các
phép toán sẽ lặp lại khi có ñược một ño ñạc mới. Bộ ñiều khiển với kết quả
như thế gọi là ñiều khiển hồi tiếp tối ưu vòng hở. Như tên của nó, giả sử sử
dụng hồi tiếp nhưng nó chỉ ñược tính toán chỉ dựa vào thông tin có sẵn ở
thời ñiểm hiện tại. Dùng phương trình 3.55 :

y(t + 1) = R*1(q – 1) ∆u(t + 1 – d0) + y1 (t) + F1*e(t + 1)


y(t + 2) = R*2(q – 1) ∆u(t + 2 – d0) + y 2 (t) + F2*e(t + 2)
.
.
.
y(t + N) = R*N(q – 1) ∆u(t + N – d0) + y N (t) + FN* e(t + N)
Mỗi giá trị ngõ ra bao gồm các tín hiệu ñiều khiển ở tương lai ( nếu d > d0),
ngõ vào ño ñược và tín hiệu nhiễu ở tương lai. Các phương trình ở trên có
thể ñược viết lại:
y = R∆u + y + e
trong ñó:
y = [y(t + 1) . . . y(t + N)] T
∆u = [∆u(t + 1 – d0) . . . ∆u(t + N – d0)] T
y = [ y 1(t) . . . y N(t)] T

Trang 347
Chương 3 ðiều khiển thích nghi

e = [F1*e(t + 1) . . . FN* e(t + N)] T


Từ phương trình 3.54 ta thấy các hệ số của R*d chính là (d – d0 + 1) số hạng
ñầu của ñáp ứng xung q –d 0 B*/ (A*∆) và cũng giống như (d – d0 +1) số hạng
–d 0
ñầu của ñáp ứng bước q B*/ A*. Do ñó ma trận R là ma trận tam giác
dưới:
r0 0 K 0
 
r1 r0 L 0
R = 
M O M
 
rN − 1 rN − 2 L r0 
Nếu hệ thống có thời gian trễ (d0 > 1) thì (d0 – 1) hàng ñầu của R sẽ là zero.
Gọi:
ym = [ym(t + 1) . . . ym(t + N)] T
Giá trị mong ñợi của hàm tổn hao ñược viết lại:
J(1, N, N) = E{( y – ym)T(y – ym) + ρ∆uT∆u}
= (R∆u + y - ym)T(R∆u + y - ym) + ρ∆uT∆u
Cực tiểu hoá biểu thức này theo ∆u ta ñược:
∆u = (RTR + ρ I ) – 1RT(ym - y ) (3.65)
Thành phần ñầu trong ∆u là ∆u(t) là tín hiệu ñiều khiển ứng dụng cho hệ
thống. Chú ý bộ ñiều khiển tự ñộng có một khâu tích phân. ðiều này là cần
thiết ñể bù cho số hạng nhiễu sai lệch ở phương trình 3.62
Việc tính toán phương trình 3.65 liên quan tới ma trận nghịch ñảo NxN, mà
N là tầm dự báo của hàm tổn hao. ðể giảm khối lượng tính toán thì ta có thể
giới hạn các tín hiệu ñiều khiển ở tương lai. Chẳng hạn, ta giả sử việc tăng
tín hiệu ñiều khiển là bằng zero sau Nu bước (Nu < N):
∆u (t + k – 1) = 0 với k > Nu
ðiều này có nghĩa tín hiệu ñiều khiển sau Nu bước sẽ là hằng số. So sánh
với ñiều kiện khống chế ở phương trình 3.57 . Luật ñiều khiển ( phương
trình 3.65) sẽ thay ñổi:
∆u = (R1TR1 + ρ I ) – 1R1T(ym - y ) (3.66)
R1 là ma trận NxNu

Trang 348
Chương 3 ðiều khiển thích nghi

r0 0 L 0 
r 
1 r0 L 0 
M O M 
R1 =  
 L r0 
M M 
 
rN − 1 rN − 2 L rN − N u 

Ma trận lấy nghịch ñảo bây giờ có bậc NuxNu. Ngõ ra và các tầm ñiều khiển
ñược chọn như sau:
N1: Nếu thời gian trễ biết trước thì N1 = d0, ngược lại chọn N1 = 1.
N2: Tầm ngõ ra cực ñại N2 ñược chọn sao cho N2h có giá trị bằng với thời
gian lên của hệ thống, trong ñó h là thời gian lấy mẫu của bộ ñiều khiển.
Nu: Thường Nu = 1 sẽ có ñược kết quả tốt ñối với những hệ thống ñơn giản.
ðối với các hệ thống phức tạp, Nu ít nhất phải bằng với số cực không ổn
ñịnh hoặc số cực gây dao ñộng tắt yếu.
ðể bộ ñiều khiển dự báo tổng quát có khả năng thích nghi thì ñiều cần thiết
là phải ước lượng A* và B* ở mỗi bước thời gian. Các giá trị dự báo ứng với
các tầm dự báo khác nhau sẽ ñược tính toán và tính tín hiệu ñiều khiển ở
phương trình 3.66 . Bộ ñiều khiển dự báo thích nghi vì vậy sẽ là một thuật
toán ñiều khiển gián tiếp. Phương trình 3.64 ñược tính bằng cách ñệ qui ñể
ñơn giản khối lượng tính toán.Cuối cùng, Nu thường có giá trị nhỏ ñể ma
trận nghịch ñảo có bậc thấp.
Tín hiệu ñiều khiển ∆u(t) từ phương trình 3.66 là:
∆u = [ 1 0 . . . 0] [R1TR1 + ρ I ] – 1R1T[ym - y ]
= [α1 . . . αN] [ym - y ]
Hơn nữa, từ phương trình 3.62 , sử dụng phương trình 3.54
 R1* A* ∆ d 0 − 1 * 
 q + G 
 R1 ∆u (t − 1) + G1 y (t )
* *
B*
1

   
y =  M  =  M  y(t)
 R ∆u (t − 1) + G y (t )   
 RN A ∆ q d0 − 1 + G * 
* * * *
 N N 
 B * 
N

Hệ thống vòng kín có phương trình ñặc tính:

Trang 349
Chương 3 ðiều khiển thích nghi

 R * A* ∆ q d 0 − 1 + B * G * 
 1 1

A*∆ + [α1 . . . αN]  M 
 * * d0 − 1 
 R N A ∆ q + B *G N* 
ðồng nhất phương trình 3.63 cho ta:
B* = A*∆ B*F*d + q – dGd* B*
= A*∆[ Rd* + q – ( d - d 0 + 1) Rd* ] + q − d G d* B *
ðiều này cho ta phương trình ñặc tính:
 ( B * − A* ∆ R1* )q 
 
A*∆ + [α1 . . . αN]  M 
( B * − A * ∆ R * ) q N 
 N 

N
= A*∆ + ∑ α q ( B −A ∆ R
i =1
i
i * * *
i ) (3.67)

Phương trình 3.67 cho ra một biểu thức của phương trình ñặc tính vòng kín
nhưng vẫn còn khó khăn ñể ñưa ra một kết luận tổng quát về tính chất của
hệ thống vòng kín ngay cả khi quá trình ñã biết trước.
Nếu Nu = 1 thì:
ri
αi = N
ρ + ∑ r j2
j =1

Nếu ρ ñủ lớn, hệ thống vòng kín sẽ không ổn ñịnh khi hệ thống vòng hở
không ổn ñịnh. Tuy nhiên nếu cả 2 tầm ñiều khiển và tầm dự báo ñều tăng
thì bài toán sẽ tương tự như bài toán ñiều khiển LQ với tầm cố ñịnh và do
ñó nó sẽ có ñặc tính ổn ñịnh tốt hơn.

3.3.6 Kết luận


Trong phần này chúng ta ñã xem xét nhiều bộ tự chỉnh ñịnh khác nhau. Ý
tưởng cơ bản là ước lượng các thông số chưa biết của hệ thống và thiết kế
bộ ñiều khiển. Các thông số ước lượng giả sử bằng với thông số thực khi
thiết kế bộ ñiều khiển. Thỉnh thoảng cũng bao gồm các ước lượng chưa chắc
chắn vào trong thiết kế. Bằng cách kết hợp các phương pháp ước lượng khác

Trang 350
Chương 3 ðiều khiển thích nghi

nhau và các phương pháp thiết kế khác nhau ta sẽ có ñược các bộ tự chỉnh
với các tính chất khác nhau. Trong phần này ta chỉ ñề cập ý tưởng cơ bản và
các tính chất tiệm cận. Tính hội tụ của ước lượng và tính ổn ñịnh của hệ
thống sẽ ñược thảo luận trong chương 6 (TLTK[1]).
Khía cạnh quan trọng nhất của các bộ tự chỉnh ñịnh là ñưa ra các thông số
hoá. Một thông số hoá lại có thể ñạt ñược bằng cách sử dụng mô hình hệ
thống và ñáp ứng vòng kín mong muốn. Mục tiêu của việc thông số hoá lại
là ñể thực hiện ước lượng trực tiếp các thông số của bộ ñiều khiển sao cho
mô hình mới tuyến tính với các thông số.
Chỉ có vài thuật toán tự chỉnh ñịnh ñược ñề cập và giải quyết trong phần
này. Việc kết hợp các phương pháp ước lượng khác nhau và vấn ñề thiết kế
cơ bản sẽ tạo ra các thuật toán với các tính chất khác nhau. Mục tiêu của
phần này là ñưa ra một cảm nhận cách phát triển và phân tích các thuật toán.
Khi thực hiện một bộ tự chỉnh thì việc lựa chọn bài toán thiết kế cơ bản là
rất quan trọng. Một phương pháp thiết kế mà không phù hợp cho hệ thống
biết trước thì cũng sẽ không tốt hơn khi hệ thống chưa biết trước.
Bộ tự chỉnh ñịnh cũng có khả năng áp dụng cho các hệ thống MIMO.
Trường hợp MIMO là rất khó ñể phân tích. Khó khăn chính là xác ñịnh
ñược kiến thức ñầu tiên cần thiết trong hệ MIMO là gì.
Cũng tương ñối ñơn giản khi ñưa ra một thuật toán tự chỉnh tương ứng với
bộ tự chỉnh ñịnh trực tiếp tổng quát ở các trường hợp hạn chế khi các ma
trận tương tác của hệ thống ñã biết trước.

3.4 Chỉnh ñịnh tự ñộng và lịch trình ñộ lợi


3.4.1 Giới thiệu
1. Chỉnh ñịnh và thích nghi
2. Kiến thức ñầu tiên
3. Giá trị ban ñầu của bộ ñiều khiển thích nghi
4. ðiều khiển PID
5. Các vấn ñề vận hành
6. Giao tiếp ñiều khiển
Một loại ñặc biệt của thích nghi vòng hở hay sự thay ñổi các tham số bộ
ñiều chỉnh ñược ñề cập trong phần này. Trong nhiều trường hợp, có thể biết
ñược sự thay ñổi ñộng học của quá trình theo các ñiều kiện vận hành.
Nguồn gốc của sự thay ñổi ñộng học có thể là tính phi tuyến. Có thể thay
ñổi tham số của bộ ñiều khiển bằng cách giám sát các ñiều kiện vận hành

Trang 351
Chương 3 ðiều khiển thích nghi

của quá trình. Khái niệm này gọi là lịch trình ñộ lợi, vì mô hình ñầu tiên
ñược sử dụng chỉ ñể ñiều chỉnh ñộ lợi của quá trình.

3.4.2 Kỹ thuật chỉnh ñịnh


1. Phương pháp Zeigler – Nichols
Luật ñiều khiển PID:
 1
t
de 
u (t ) = K c e(t ) +


Ti 0
e( s )ds + Td 
dt 
2. Phương pháp ñáp ứng quá ñộ
Mô hình 3 thông số:
k
G (s) = e − sL
1 + sT
Phương pháp ñáp ứng nấc:

Phương pháp Zeigler – Nichols:


Bộ ñiều khiển aKc Ti / L Td / L Tp / L
P 1 4
PI 0.9 3 5.7
PID 1.2 2 0.5 3.4

Trang 352
Chương 3 ðiều khiển thích nghi

Những khó khăn ñối với phương pháp Zeigler – Nichols:


- Khó xác ñịnh các thông số
- Tắt quá chậm
- Hai thông số thì không ñủ
Phương pháp diện tích:

3. Phương pháp ñáp ứng tần số


Ý tưởng: Cho chạy bộ ñiều khiển tỉ lệ, tăng ñộ lợi cho ñến khi hệ thống bắt
ñầu dao ñộng. Quan sát “ðộ lợi Ku giới hạn” và “Chu kỳ giới hạn Tu ”.
Lặp lại: Xác ñịnh ñặc tính ñáp ứng tần số.

1

N (α )

G(jω)

Trang 353
Chương 3 ðiều khiển thích nghi

Các thông số bộ ñiều khiển:

Bộ ñiều khiển Kc / Ku Ti / Tu Td / Tu Tp / Tu
P 0.5 1
PI 0.4 0.8 1.4
PID 0.6 0.5 0.12 0.85

Thực nghiệm:

PID

A
u y
∑ Quá trình
T

Relay

-1

Kết quả thực tế


- Thông tin biết trước?
- Bắt ñầu thực nghiệm như thế nào?
- Hồi tiếp ñến biên ñộ giới hạn của dao ñộng.
- Hiệu chỉnh luật Zeigler – Nichols:
• Thay ñổi các giá trị trong bảng.
• Sử dụng 3 thông số: Ku, Tu và Kp.
- Làm sao ñể ñương ñầu với nhiễu ñược
• Nhiễu tải
• Nhiễu ño
• Từ trễ

Trang 354
Chương 3 ðiều khiển thích nghi

Sự lặp lại trực tuyến


Ý tưởng: Tìm các nét ñặc trưng của ñáp ứng trực tuyến ñối với ñiểm ñặt
hoặc các nhiễu tải.
Hiệu chỉnh bộ ñiều khiển dựa trên các ñặc tính quan sát ñược.

e1

e3

e2
Tp

ðặc tính: hệ số tắt ξ và ñộ vọt lố σ


e3 − e2 e2
ξ= σ = −
e1 − e2 e1
Bộ ñiều khiển hiệu chỉnh dựa trên luật thử và sai.
Dễ dàng ñối với PI và khó khăn hơn ñối với PID.
• Thông tin biết trước
• Tiền chỉnh ñịnh

3.4.3 Lịch trình ñộ lợi


Ví dụ các biến lịch trình
• Tốc ñộ sản xuất
• Tốc ñộ máy
• Số tỉ lệ và áp lực ñộng
Thỉnh thoảng có thể tìm thấy những biến ñổi phụ có tương quan tốt với
những thay ñổi của quá trình ñộng học. Vì thế có thể làm giảm ảnh hưởng
của tham số biến ñộng chỉ ñơn giản bằng việc thay ñổi tham số của bộ ñiều
chỉnh như các hàm của các biến phụ (xem hình 3.10)

Trang 355
Chương 3 ðiều khiển thích nghi

Các thông số
bộ ñiều khiển
Lịch trình ðiều
ñộ lợi kiện vận
Tín hiệu hành
vào

Bộ ñiều khiển Quá Ngõ ra


trình
Tín hiệu
ñiều khiển

Hình 3.20 Mô hình lịch trình ñộ lợi


Lịch trình ñộ lợi có thể ñược xem như hệ thống ñiều khiển hồi tiếp mà ñộ
lợi hồi tiếp ñược chỉnh bởi bộ bù ñược cung cấp trước.

Ưu, khuyết ñiểm của lịch trình ñộ lợi


Mặt hạn chế của lịch trình ñộ lợi là bù vòng hở. Không có hồi tiếp ñể bù cho
sai số lịch trình. Hạn chế khác của lịch trình ñộ lợi là việc thiết kế tốn nhiều
thời gian. Tham số bộ ñiều chỉnh phải ñược chọn cho nhiều ñiều kiện vận
hành và ñặc tính kĩ thuật phải ñược kiểm tra bằng nhiều quá trình mô phỏng.
Những khó khăn này tránh ñược nếu lịch trình dựa vào các phép chuyển ñổi
phi tuyến.
Lịch trình ñộ lợi có ưu ñiểm là các tham số bộ ñiều chỉnh có thể ñáp ứng rất
nhanh với sự thay ñổi của quá trình. Khi không có ước lượng tham số, nhân
tố giới hạn phụ thuộc vào tốc ñộ ñáp ứng các phép ño phụ với sự thay ñổi
của quá trình.

3.4.4 Xây dựng lịch trình


• Lựa chọn các biến lịch trình
• Hoàn thiện việc thiết kế ñiều khiển cho những ñiều kiện vận hành khác
nhau.
• Sử dụng việc chỉnh ñịnh tự ñộng.
• Sự biến ñổi.

Trang 356
Chương 3 ðiều khiển thích nghi

Thật khó ñể tìm luật chung cho việc thiết kế bộ ñiều chỉnh theo lịch trình ñộ
lợi. Vấn ñề chính là việc quyết ñịnh các biến sử dụng làm biến lịch trình. Rõ
ràng các tín hiệu phụ phải phản ánh ñiều kiện vận hành của ñối tượng. Sẽ có
những trình bày lí tưởng ñơn giản cho các tham số bộ ñiều chỉnh liên quan
ñến các biến lịch trình. Vì thế cần có kiến thức tốt về hệ ñộng học của quá
trình nếu lịch trình ñộ lợi ñược sử dụng. Các khái niệm tổng quát sau có thể
phục vụ cho mục ñích này.
- Tuyến tính hoá cơ cấu dẫn ñộng phi tuyến.
- Lập trình ñộ lợi dựa vào ño ñạc các biến phụ
- Vận hành dựa vào hiệu suất
- Các phép biến ñổi phi tuyến.
Các khái niệm này ñược minh hoạ trong các ví dụ sau.

Ví dụ 3.18
Xem hệ thống với 1 valse phi tuyến.Tính phi tuyến ñược giả sử là:
v = f(u) = u4 ,u ≥0

Quá trình

yr c u v G0(s) y
∑ PI fˆ −1 f

-1

Hình (a)
ðặt fˆ −1
là hàm ngược xấp xỉ của ñặc tính valse. ðể bù cho tính phi tuyến,
ngõ ra của bộ ñiều chỉnh ñược cung cấp thông qua hàm này trước khi nó
ñược áp vào valse (xem hình (a)). ta có quan hệ : v = f(u) = f [ fˆ − 1 (c)]
Với c là ngõ ra của bộ ñiều chỉnh PI. Hàm f [ fˆ − 1 (c)] có ñộ lợi ít thay ñổi
hơn hàm f.
Nếu fˆ − 1 chính xác là hàm ngược của f thì : v = c. Giả sử f(u) = u4 ñược
xấp xỉ bởi 2 ñường thẳng: một ñường nối từ ñiểm (0 , 0) ñến ñiểm (1.3 , 3)
và ñường thẳng thứ hai nối giữa 2 ñiểm (1.3 , 3) và (2 , 16), ñược vẽ trong
hình (b) .

Trang 357
Chương 3 ðiều khiển thích nghi

v
20

15 fˆ
10
f
5

u
0
0.5 1 1.5 2
Hình (b)
yr
0.3

y
0.2

0 20 40 60 80 100
yr
1.1

0 20 40 60 80 100
yr
5.1

y
5

0 20 40 60 80 100
Hình (c)

Trang 358
Chương 3 ðiều khiển thích nghi

Khi ñó:
 0.433c , 0≤c≤3

fˆ − 1 (c) = 
0.0538c + 1.139 , 3 ≤ c ≤ 16

Hình (c) cho thấy sự thay ñổi của ñáp ứng quá ñộ tại 3 ñiều kiện vận hành
khác nhau khi sử dụng hàm fˆ − 1 như hình (a) . Ta thấy ñặc tuyến của hệ
thống vòng kín là rất tốt. Dùng hàm ngược fˆ − 1 trong hệ thống sẽ cho ñáp
ứng bằng phẳng hơn trong các bài toán ñiều khiển valse phi tuyến.
Ví dụ trên ñã cho thấy tính ñơn giản và tiện dụng trong việc bù cho hệ
thống phi tuyến tĩnh biết trước. Trong thực tế thường xấp xỉ hệ phi tuyến
bằng một vài ñoạn thẳng (nhiều hơn 2). Có nhiều bộ ñiều khiển vòng ñơn
thương mại sử dụng phương pháp bù này. Trong ví dụ trên không có sự ño
ñạc nào của ñiều kiện vận hành ngoài trừ việc ñiều chỉnh ngõ ra. Trong các
trường hợp khác, tính phi tuyến ñược xác ñịnh từ sự ño ñạc một vài biến số.

3.4.5 Ứng dụng


Lịch trình ñộ lợi là phương pháp rất hữu dụng. Nó yêu cầu phải có kiến thức
tốt về quá trình và các biến phụ có thể ñược ño ñạc. Một thuận lợi lớn của
phương pháp này là bộ ñiều chỉnh thích nghi (ñáp ứng) nhanh khi các ñiều
kiện thay ñổi. Một số ứng dụng như: ñịnh hướng cho tàu, kiểm soát nồng ñộ
pH, kiểm soát khí ñốt, ñiều khiển ñộng cơ và ñiều khiển bay.
ðặc ñiểm của van

Dòng chảy
Mở nhanh

tuyến tính

Mở tính theo %

Vị trí

Trang 359
Chương 3 ðiều khiển thích nghi

ðặc tính van phụ thuộc vào việc cài ñặt.


A

B C

Lịch trình cho ngõ ra bộ ñiều khiển

FIC

FT

Lịch trình cho biến quá trình

LIC

LT

Trang 360
Chương 3 ðiều khiển thích nghi

Lịch trình cho biến ngoài

3.4.6 Kết luận


Lịch trình ñộ lợi là cách tốt ñể bù cho ñặc tính phi tuyến biết trước. Bộ ñiều
chỉnh có thể phản ứng nhanh với sự thay ñổi của các ñiều kiện. Mặt hạn chế
của kĩ thuật này là thiết kế tốn nhiều thời gian nếu không dùng phép chuyển
ñổi phi tuyến và tự ñộng chỉnh ñịnh. Mặt hạn chế khác là các tham số ñiều
khiển ñược thay ñổi trong vòng hở, không có hồi tiếp từ ñặc tính làm việc
của hệ thống. Phương pháp này không thể dùng ñược nếu ñặc tính ñộng học
của quá trình hoặc nhiễu không ñược biết trước ñầy ñủ, chính xác.

3.5. ðiều khiển mờ thích nghi (Adaptive Fuzzy Control)


Trong thực tế, hầu như các ñối tượng ñều có thông số thay ñổi không dự
ñoán trước ñược do ảnh hưởng của ñiều kiện làm việc. Nếu ta chỉ dùng các
bộ ñiều khiển mờ không thích nghi (ñã ñề cập trong phần 1.2.5_chương 1)
ñể ñiều khiển hệ thống thì sẽ không khống chế tốt ñối tượng. Vì vậy, ñiều
khiển mờ cần phải có tính thích nghi ñể tạo nên một hệ thống ñiều khiển
trong ñó thông số và cấu trúc của bộ ñiều khiển thay ñổi trong quá trình vận
hành nhằm giữ vững chất lượng ñiều khiển của hệ thống khi có sự hiện diện
của các yếu tố bất ñịnh cũng như sự thay ñổi thông số trong hệ thống.

So với ñiều khiển mờ không thích nghi thì ñiều khiển mờ thích nghi có
những ưu ñiểm và khuyết ñiểm sau:

Trang 361
Chương 3 ðiều khiển thích nghi

- Ưu ñiểm:
o Khả năng thích nghi tốt do nó có thể tự ñiều chỉnh ñể thích
nghi với sự thay ñổi của môi trường.
o Không cần thông tin ñầy ñủ về ñối tượng do luật thích nghi
sẽ tự học các thuộc tính ñộng của ñối tượng trong quá trình
vận hành.

- Khuyết ñiểm:
o Rất khó trong việc phân tích kết quả ñiều khiển vì tính phi
tuyến và sự thay ñổi liên tục theo thời gian của hệ thống.
o Chi phí lắp ñặt cao hơn.

• Mô hình cơ bản của BðK mờ thích nghi:

ym
Mô hình tham chiếu

r u y
ðối tượng
e
Bộ ñiều khiển mờ

θ
Luật thích nghi
Hình 3.21 θ& = h(θ , e)

Trong ñó:
- Mô hình tham chiếu: xác ñịnh ñáp ứng mong ñợi của hệ thống.
- ðối tượng: chứa các thành phần thông số và cấu trúc chưa biết.
- Bộ ñiều khiển mờ: là hệ thống mờ với thông số θ ñiều chỉnh ñược.
- Luật thích nghi: dùng ñiều chỉnh thông số θ sao cho ngõ ra của ñối
tượng y(t) tiến ñến ngõ ra ym(t) của mô hình tham chiếu.

3.5.1. ðiều khiển hồi tiếp tuyến tính hoá:


Xét bài toán ñiều khiển hệ phi tuyến SISO bậc n có quan hệ vào/ra ñược mô
tả bởi phương trình vi phân sau:

Trang 362
Chương 3 ðiều khiển thích nghi

x ( n ) = f ( x, x& , &&
x,..., x ( n−1) ) + g( x, x& , &&
x,..., x ( n −1) ).u( x ) (3.68)
y=x (3.69)
Trong ñó:
f(x) và g(x) là hai hàm mô tả ñối tượng chưa ñược xác ñịnh rõ ràng
u ∈ R là ñầu vào, y ∈ R là ñầu ra,
x = (x1,x2,…,xn)T là véctơ trạng thái (giả sử là có thể ño ñược)
ðể hệ thống ở (3.68) ñiều khiển ñược, chúng ta cần có g(x) ≠ 0.
Giả thiết g(x) > 0 và ta biết ñược chặn trên, chặn dưới của g(x):
0 < g ( x ) ≤ g ( x ) ≤ g ( x) < ∞ (3.70)
Giả thiết tốc ñộ biến thiên của g(x) bị chặn, tức là tồn tại hàm Dg(x) liên tục
sao cho g& ( x) ≤ D g ( x) . Bài toán ñặt ra là thiết kế bộ ñiều khiển hồi tiếp
trạng thái ñể lái ngõ ra y của ñối tượng bám theo quĩ ñạo mong muốn ym.
Hay nói cách khác là phải giảm tối ña sai số giữa ngõ ra ñối tượng và ngõ ra
của mô hình tham chiếu.
Do ñó ta ñặt :
 e = ym − y = ym − x với e = (e, e&,..., e( n−1) )T
 k = (k n , k n −1 ,..., k1 ) T
Các hệ số ki ñược chọn như sau:
∆( s) = s ( n−1) + k1 s ( n −2) + ... + k n− 2 s + k n −1 (3.71)
ða thức trên ñược gọi là ña thức Hurwitz, nghĩa là tất cả nghiệm của
phương trình ∆(s) = 0 ñều nằm bên trái mặt phẳng phức.
Ta chọn luật ñiều khiển như sau:
u∗ =
1
g ( x)
[
− f ( x) + y m( n ) + k T e ] (3.72)

Thay (3.72) vào (3.68) ta có ñược :


e ( n ) + k1e ( n −1) + ... + k n e = 0
Ta sẽ chọn k sao cho e(t) → 0 khi t → ∞ . Và khi ấy y(t) → y, tức là tín hiệu
y(t) tiệm cận bám theo tín hiệu chuẩn ym(t) với sai số bằng 0.
Tuy nhiên do f(x) và g(x) là hàm chưa biết nên bộ ñiều khiển lý tưởng
(3.72) không thể thực hiện ñược. Bài toán ñặt ra là nhận dạng luật ñiều
khiển (3.72). Có hai cách ñể giải quyết bài toán trên:
 ðiều khiển thích nghi mờ gián tiếp: nhận dạng trực tiếp f(x) và g(x)
và dựa vào kết quả nhận dạng ñó ñể tính u*(t).
 ðiều khiển thích nghi mờ trực tiếp: nhận dạng trực tiếp luật ñiều
khiển lý tưởng u*(t).

Trang 363
Chương 3 ðiều khiển thích nghi

Ngoài ra, ta cũng có thể sử dụng phối hợp cả 2 cách trên. ðây gọi là phương
pháp ñiều khiển thích nghi mờ hỗn hợp.

3.5.2. Thiết kế BðK mờ thích nghi gián tiếp


ym
ðối tượng
(n)
x =f(x)+g(x)u, y=x

BðK mờ
ˆ
u I = [− f ( x | θ f ) + y m( n ) + k T e] / gˆ ( x | θ g )

θf, θg
Luật thích nghi
ðiều kiện
ban ñầu θ f = −γ 1e T Pbξ
&
θf(0), θg(0) θ&g = −γ 2 e T Pbηu I

Hình 3.22: Hệ thống ðK mờ thích nghi gián tiếp

• ðặt vấn ñề:


Cho một ñối tượng phi tuyến có phương trình trạng thái như (3.68)
Mục tiêu của việc ñiều khiển là thiết kế một tín hiệu ñiều khiển hồi tiếp u
= u (x| θ ) và luật thích nghi dùng ñể ñiều chỉnh thông số θ sao cho ngõ ra
của hệ thống y(t) → ym(t) của mô hình tham chiếu.
Với lưu ý: f(x) và g(x) là hai hàm mô tả ñối tượng chưa ñược xác ñịnh rõ
ràng. Vì thế ta sẽ xây dựng một luật mờ IF-THEN ñể có thể mô tả ñáp ứng
vào ra của f(x) và g(x).
Giả sử f(x) và g(x) ñược biểu diễn tả qua luật mờ:
If x1 = F1r and … and xn = Fnr Then f(x) = Cr (3.73)
If x1 = G1s and … and xn = Gns Then g(x) = Ds (3.74)
Trong ñó: Fi r , Cr, Gis và Ds là các tập mờ
r = 1, 2, …, Lf s = 1, 2, … Lg
Kế ñến ta sẽ ñi thiết kế bộ ñiều khiển mờ.

Trang 364
Chương 3 ðiều khiển thích nghi

• Thiết kế BðK mờ
Mặc dù f(x) và g(x) là các hàm chưa biết nhưng nó ñược mô tả bởi luật mờ
IF-THEN ở (3.73) và (3.74). Vì thế, ta có thể thay f(x) và g(x) bởi hệ mờ
fˆ ( x) và gˆ ( x) tuân theo luật mờ trên.
Tuy nhiên, fˆ ( x) và gˆ ( x) chỉ là phép xấp xỉ của f(x) và g(x). Do ñó ñể nâng
cao ñộ chính xác, ta phải ñể một số thông số của fˆ ( x) và gˆ ( x) tự do.
Giả sử ta chọn hai thông số θ f ∈ R f và θ g ∈ R g là tự do, ta ký hiệu như
M M

sau : fˆ ( x) = fˆ ( x | θ ) và gˆ ( x) = gˆ ( x | θ ) , thay vào (3.80) ta ñược:


f g

u = uI =
1
gˆ ( x | θ g )
[
− fˆ ( x | θ f ) + y m( n ) + k T e ] (3.75)

uI ñược gọi là tín hiệu ñiều khiển tương ñương chắc chắn.(do fˆ ( x)
và gˆ ( x) là các thông số tính toán ñược).
ðể xây dựng BðK (3.75) ta phải xác ñịnh fˆ ( x | θ f ) và gˆ ( x | θ g ) , ñiều này
ñược thực hiện qua 2 bước sau:
Bước 1: Với mỗi biến xi (i=1,2,…,n), ñịnh nghĩa pi tập mờ Aili ( li=1,…,pi )
và qi tập mờ Bili ( li=1,…,qi ).
Trong ñó: Fi r ( r = 1, 2, …, Lf) và Gis và Ds (s = 1, 2, … Lg ) lần lượt là các
trường hợp ñặc biệt của các tập mờ Aili , Bili .
Bước 2:
Xác ñịnh hệ mờ fˆ ( x | θ f ) từ ∏
n
i =1
pi ; luật mờ có dạng:

If x1 = A1l1 and …. and xn = Anln , Then fˆ = E l1 ...ln


n
Xác ñịnh hệ mờ gˆ ( x | θ g ) từ i =1
qi ; luật mờ có dạng:

If x1 = B1l1 and ….and xn = Bnln , Then gˆ = H l1 ...ln


Chọn thiết bị hợp thành tích, hàm mờ dạng singleton, giải mờ theo phương
pháp trung bình trọng số, ta ñược:

∑ ...∑ y (∏
p1 pn n
l1 ...l n
f µ A ( xi ))
li

fˆ ( x | θ f
l1 =1 l n =1 i =1
)= i
(3.76)
∑ ...∑ (∏ µ
p1 pn n
l1 =1 l n =1 i =1 Al i
( xi ))
i

Trang 365
Chương 3 ðiều khiển thích nghi

∑ ...∑ y (∏
q1 qn n
l1 =1 l n =1
l1 ...l n
g i =1
µ B ( xi ))
li

gˆ ( x | θ g )= i
(3.77)
∑ ...∑ (∏ µ
q1 qn n
l1 =1 l n =1 i =1 B li
( xi ))
i

Cho y lf1 ...ln và y gl1 ...ln là các thông số tự do. Vì thế ta có thể dồn vào θf và θg ,
ta viết lại (3.76) và (3.77) như sau:
fˆ ( x | θ f ) = θ Tf ξ ( x) (3.78)

gˆ ( x | θ g ) = θ gTη ( x) (3.79)

∏ ∏
n n
Trong ñó ξ(x) lf véctơ i =1
pi chiều và η(x) là véctơ i =1
qi chiều, với
thành phần l1…ln ñược cho bởi:

∏ µ (x )
n
i =1 Aili i
ξ l ...l ( x) = (3.80)
∑ ...∑ (∏ µ
1 n p1 pn n
l1 =1 ln =1 i =1 Aili
( xi ))

∏ µ (x )
n
i =1 Bili i
η l ...l ( x) = (3.81)
∑ ...∑ (∏ µ
1 n q1 qn n
l1 =1 ln =1 i =1 Bili
( xi ))

Ta thấy các thông số θf và θg ñược chọn dựa theo luật mờ (3.73) và (3.74).
Các thông số này sẽ ñược ñạt các giá trị ban ñầu và sau ñó thay ñổi liên tục.
Trong phần kế, chúng ta sẽ thiết kế luật thích nghi cho θf và θg ñể ñạt ñược
cực tiểu hóa sai số e.
• Thiết kế luật thích nghi
Thay (3.75) vào (3.68) và sau một vài biến ñổi ta ñược:
[ f ] [
e ( n ) = − k T e + fˆ ( x |θ ) − f ( x) + gˆ ( x | θ ) − g ( x) u g ] I (3.82)
ðặt :
 0 1 0 0 ... 0 0 
 0 0
 0 1 0 ... 0 0  ...
A =  ... ... ... ... ... ... ... , , b =   (3.83)
  0
 0 0 0 0 ... 0 1   
− k n − k n −1 ... ... ... ... − k1  1 

Ta viết lại (3.83) dạng véctơ:


{[ ] [
e& = Ae + b fˆ ( x | θ f ) − f ( x) + gˆ ( x | θ g ) − g ( x) u I ] } (3.84)

Trang 366
Chương 3 ðiều khiển thích nghi

ðịnh nghĩa các thông số tối ưu như sau:


 
θ ∗f = arg min sup fˆ ( x | θ f ) − f ( x)  (3.85)
θ f ∈R ∏i =1
n
pi  X ∈R n 

 
θ g∗ = arg minn  n sup ˆ
g ( x | θ g ) − g ( x )  (3.86)
θ g ∈R ∏ qi 
i =1
X ∈R 

Như vậy, fˆ ( x | θ ∗f ) và gˆ ( x | θ g∗ ) sẽ là các xấp xỉ tốt nhất (min-max) của f(x)


và g(x) trong tất cả các giá trị cho ở công thức (3.76) và (3.77).

ðịnh nghĩa sai số xấp xỉ cực tiểu:


[ f ] [
w = fˆ ( x | θ ∗ ) − f ( x) + gˆ ( x | θ ∗ ) − g ( x) u g ] I (3.87)
Sử dụng w, ta viết lại (3.84) như sau:
{[ ] [
e& = Ae + b fˆ ( x | θ f ) − fˆ ( x | θ ∗f ) + gˆ ( x | θ g ) − gˆ ( x | θ g∗ ) u I + w ] } (3.88)
Thay (3.78) và (3.79) vào (3.87) ta ñược phương trình ñộng học vòng kín
diễn tả mối liên hệ giữa sai số e và thông số θf và θg .
[
e& = Ae + b (θ f − θ ∗f ) T ξ ( x) + (θ g −θ g∗ ) T η ( x)u I + w ] (3.89)
Ta cần tìm luật thích nghi ñể chỉnh ñịnh θf và θg sao cho sai số e, và các sai
số θ f − θ ∗f , θ g − θ g∗ ñạt giá trị nhỏ nhất. Xét phương trình lyapunov:
1 T 1 1
V= e Pe + (θ f −θ ∗f ) T (θ f −θ ∗f ) + (θ g − θ g∗ ) T (θ g − θ g∗ ) (3.90)
2 2γ 1 2γ 2
Trong ñó: γ1 và γ2 là các hằng số dương,
P là ma trận xác ñịnh dương thoả phương trình:
ATP + PA = - Q
với Q là ma trận ( n × n ) xác ñịnh dương và ma trận A ñược cho bởi (3.83)
Lấy ñạo hàm V dọc theo quỹ ñạo hệ thống ta ñược:
1
2
1
V& = − e T Pe + e T Pbw + (θ f − θ ∗f ) T θ& f + γ 1e T Pbξ ( x)
γ1
[ ]
+
1
γ2
[
(θ g − θ g∗ ) T θ&g + γ 2 e T Pbη ( x)u I ] (3.91)

Trang 367
Chương 3 ðiều khiển thích nghi

Việc cực tiểu hoá e, θ f − θ ∗f , θ g − θ g∗ , tương ñương với cực tiểu V, ta sẽ


1
chọn luật thích nghi sao cho V& < 0 . Do − e T Pe < 0 nên ta chọn hệ mờ sao
2
cho w là rất nhỏ. Tốt nhất ta chọn luật thích nghi ñể hai số hạng cuối ở công
thức (3.91) bằng 0.
θ& = −γ e T Pbξ ( x)
f 1 (3.92)

θ&g = −γ 2 e T Pbη ( x)u I (3.93)


Phương pháp này gọi là phương pháp tổng hợp Lyapunov.
Hai phương trình (3.92) và (3.93) chính là luật thích nghi cần tìm.

Ví dụ 3.19
Làm lại ví dụ 1.8 (trang 45) ñiều khiển con lắc ngược có sử dụng phương
pháp mờ thích nghi gián tiếp và so sánh kết quả ñạt ñược. Trong ñó:
 Mô hình con lắc ngược như hình 1.15
 Phương trình trạng thái cho bởi (1.36) và (1.37)
 Chọn k1 = 2 và k2 = 1 ñể ( s2 + k1s + k2 ) là ổn ñịnh
10 0 
 Chọn Q =  
 0 10
15 5 
 Giải phương trình Lyapunov ta ñược P =  
 5 15
Ta chọn: p1 = p2 = q1 = q2 = 5 và A1l = A2l = B1l = B2l (l = 1, 2, …5) với
  x1 + π / 6  2    x1 + π / 12  2 
µ A1 ( x1 ) = exp −   ; µ A2 ( x1 ) = exp −   
  π / 24     π / 24  
1 1

  x1  2    x1 − π / 12  2 
µ A3 ( x1 ) = exp−   ; µ A4 ( x1 ) = exp −   
  π / 24     π / 24  
1 1

  x1 − π / 6  2 
µ A5 ( x1 ) = exp −   ; x1 ∈ [− π / 6, π / 6]
  π / 24  
1

Do tầm của f (x1,x2) quá lớn so với g (x1,x2) nên ta chọn: γ 1 = 50 ; γ 2 = 1

Trang 368
Chương 3 ðiều khiển thích nghi

Nhận xét : Khi không có tín hiệu ñiều khiển, tức u = 0 thì gia tốc của góc
θ = x1 tương ñương f(x1,x2). Vậy ta có nhận xét:
x1 càng lớn thì f( x1, x2 ) càng lớn
Bây giờ, ta sẽ ñi xây dựng luật mờ cho f(x1,x2). Do (x1,x2) = (0,0) là ñiểm
cân bằng của hệ thống nên ta có luật ñầu tiên:
R 1f : Nếu x1 = A13 và x2 = A23 Thì f(x1,x2) ≈ 0
Từ hình vẽ mô hình con lắc ngược ta thấy gia tốc của x1 tỷ lệ với trọng lực
mgsin(x1), ta có thể chọn f(x1,x2) = α sin(x1) . Ta thấy: f(x1,x2) ñạt max khi
x1 = π / 2 nên có thể chọn α = 16. Ta ñược luật mờ cho f(x1,x2) như sau:
R 2f : Nếu x1 = A11 và x2 = A23 Thì f(x1,x2) ≈ -8
R 3f : Nếu x1 = A12 và x2 = A23 Thì f(x1,x2) ≈ -4
R 4f : Nếu x1 = A14 và x2 = A23 Thì f(x1,x2) ≈ 4
R 5f : Nếu x1 = A15 và x2 = A23 Thì f(x1,x2) ≈ 8
Những luật này sẽ ñược dùng ñể xác ñịnh giá trị ñầu θ f (0)
Luật mờ cho f(x1,x2)
-8 -4 0 4 8
-4
-8 0 4 8
-4
-8 0 4 8
-4
-8 0 4 8
-8 -4 0 4 8

Tiếp theo ta xác ñịnh luật mờ cho hàm g(x1,x2), hàm g xác ñịnh ñộ mạnh
của luật ñiều khiển u, ta có nhận xét sau:
x1 càng nhỏ thì g(x1,x2) càng lớn

Trang 369
Chương 3 ðiều khiển thích nghi

Tương tự như hàm f(x1,x2) ta có luật mờ cho hàm g(x1,x2):


1.26 1.36 1.46 1.36 1.26
1.26 1.36 1.46 1.36 1.26
1.26 1.36 1.46 1.36 1.26
1.26 1.36 1.46 1.36 1.26
1.26 1.36 1.46 1.36 1.26
Mô phỏng kết quả ví dụ 3.19
Hình 3.23 và hình 3.24 biểu diễn tín hiệu x1(t) so với ngõ ra lý tưởng ym(t)
của hệ thống trong 2 ñiều kiện ñầu khác nhau:
Trong ñó: x1(t) ñược biểu diễn bằng ñường ñậm
ym(t) ñược biểu diễn bằng ñường ñứt nét

Hình 3.23 Giá trị ñầu: x(0) = (−π / 60,0)

Hình 3.24 Giá trị ñầu: x(0) = (π / 60,0)

Trang 370
Chương 3 ðiều khiển thích nghi

3.5.2. Thết kế BðK mờ thích nghi trực tiếp


Hình 3.25 ym

u=uD ðỐI TƯỢNG


x(n) = f(x) + bu, y = x

BðK MỜ
uD = θ Tξ(x)

θ
ðiều kiện ñầu LUẬT THÍCH NGHI
θ(0) θ& = γe T p nξ ( x)

• ðặt vấn ñề:


Cho một ñối tượng phi tuyến có phương trình trạng thái như sau:
x ( n ) = f ( x, x&,..., x ( n−1) ) + bu (3.94)
y=x (3.95)
Trong ñó: f là hàm ñã biết b là hằng số dương chưa biết. Ta cần thiết kế
BðK u = u(x|θ ) dựa trên hệ mờ và luật thích nghi ñể chỉnh ñịnh thông số θ.
Luật mờ có dạng như sau:
IF x1 = P1r và … và xn = Pnr , THEN u = Qr (3.96)
Trong ñó: Pi r và Qr là các tập mờ, r = 1,2,…,Lu.

• Thiết kế BðK mờ
Hệ mờ u = uD(x|θ ) ñược thiết kế theo 2 bước sau:
+ Bước 1: Với mỗi biến xi (i=1,2,…,n) ta ñịnh nghĩa mi tập mờ Ailii
(li=1,2,…,mi) . và Pi r (r = 1,2,…,Lu) là một trường hợp ñặc biệt.


n
+ Bước 2: Xây dựng hệ mờ uD(x|θ) từ i =1
mi , luật mờ có dạng:

IF x1= A1l1 and … and xn= A1ln , THEN uD = S l1 ...ln (3.97)


Trong ñó li = 1,2,…,mi , i = 1,2,..,n và S l1 ...ln bằng với Qr trong (3.96)

Trang 371
Chương 3 ðiều khiển thích nghi

Sử dụng luật hợp thành tích, mờ hoá singleton, giải mờ theo phương pháp
trung bình trọng số, ta ñược:

∑ ...∑ y [∏
m1 mn n
l1 =1 l n =1
l1 ...l n
u i =1
µ A ( x i )]
li

uD (x | θ ) = i
(3.98)
∑ ...∑ [∏ µ
m1 mn n
l1 =1 l n =1 i =1 Al i
( x i )]
i

Chọn yul1 ...ln như thông số có thể chỉnh ñịnh và ta ñưa yul1 ...ln vào thành phần
của véctơ thông số θ, từ ñó luật ñiều khiển ñược xác ñịnh:
u D ( x | θ ) = θ T ξ ( x) (3.99)

• Thiết kế luật thích nghi


Xem u* như là BðK lý tưởng như (3.72), với g(x) = b, ta ñược:
e ( n ) = − k T e + b[u ∗ − u D ( x | θ )] (3.100)
Ma trận A ñược ñịnh nghĩa như (3.83), b = (0,…,0,b)T,
Ta viết lại (3.100) dạng véctơ như sau:
e& = Ae + b[u ∗ − u D ( x | θ )] (3.101)

ðịnh nghĩa thông số tối ưu θ* :


 
θ ∗ = arg minχ sup u D ( x | θ ) − u ∗  (3.102)
θ ∈R  x∈R n 
với χ = ∏i =1 mi
n

Sai số xấp xỉ cực tiểu là:


w = uD(x|θ*) – u* (3.103)
Từ (3.99) và (3.103) ta viết lại (3.107) như sau:
e& = Ae + b(θ ∗ − θ ) T ξ ( x) − bw (3.104)
Xét phương trình Lyapunov
1 T b ∗
V= e Pe + (θ − θ ) T (θ ∗ − θ ) (3.105)
2 2γ
trong ñó P là ma trận xác ñịnh dương thoả:
AT P + PA = −Q (3.106)

Trang 372
Chương 3 ðiều khiển thích nghi

ðạo hàm (3.105) và sử dụng các biểu thức (3.104) và (3.106) ta ñược:
1 b
V& = − e T Qe + e T Pb[(θ ∗ − θ ) T ξ ( x) − w] − (θ ∗ − θ ) T θ& (3.107)
2 γ
Xem pn là cột cuối của ma trận P, từ b = (0,…,0,b)T, ta có eTPb = eTpnb.
Ta viết lại (3.107) như sau:
1 b
V& = − e T Qe + (θ ∗ − θ ) T [γe T p nξ ( x) − θ&] − e T p n bw (3.108)
2 γ
Từ (3.108) ñể thoả mãn V& < 0 ta chọn luật thích nghi như sau:
θ& = γe T p ξ (x) n (3.109)

Ví dụ 3.20:
Cho hệ thống phi tuyến bậc nhất:
1 − e − x(t )
x& (t ) = + u (t ) (*)
1 + e − x(t )
Thiết kế BðK mờ thích nghi trực tiếp ñể ñưa x(t) hội tụ về zero.
1 − e − x (t )
Khi u(t) ≡ 0 thì: x& (t ) = < 0 khi x < 0 và
1 + e − x (t )
1 − e − x (t )
x& (t ) = > 0 khi x > 0 nên hệ (*) là không ổn ñịnh.
1 + e − x (t )
Chọn γ = 1 và ñịnh nghĩa các tập mờ như sau:

Xây dựng 2 luật mờ như sau:


NẾU x=N2, THÌ u(x) = PB
NẾU x=P2, THÌ u(x) = NB

Trang 373
Chương 3 ðiều khiển thích nghi

Trong ñó: µPB(u) = exp(-(u-2)2) và µNB(u) = exp(-(u+2)2).


.
Nếu x âm thì tín hiệu ñiều khiển u(x) sẽ càng dương ñể ñảm bảo x > 0 .
.
Nếu x dương thì tín hiệu ñiều khiển u(x) sẽ càng âm ñể ñảm bảo x < 0 .

Mô phỏng kết quả:


Ta tiến hành mô phỏng ñể thấy ñược ñáp ứng trong hai trường hợp có và
không có luật mờ. Giả sử ñiều kiện ban ñầu là x(0) = 1.

Hình 3.26 ðiều khiển mờ thích nghi trực tiếp khi không có luật mờ

Hình 3.27 ðiều khiển mờ thích nghi trực tiếp khi có luật mờ

Trang 374
Chương 3 ðiều khiển thích nghi

Nhận xét:
Theo kết quả mô phỏng thu ñược từ hai hình 3.26 và hình 3.27 ta thấy
 Bộ ñiều khiển mờ thích nghi trực tiếp có thể dùng ñể ñiều chỉnh ñối
tượng trở về zero mà không cần sử dụng ñến luật mờ.
 Nếu bộ ñiều khiển mờ thích nghi trực tiếp có sử dụng kèm theo luật
ñiều khiển mờ thì sẽ cho tốc ñộ hội tụ nhanh hơn nhiều.

3.5.4. Một số ứng dụng

Ví dụ 3.21: Xây dựng BðK tốc ñộ ñộng cơ DC

MÔ HÌNH BðK TỐC ðỘ ðỘNG CƠ DC


Máy tính Tốc ñộ mong muốn ym
(Bộ ñiều khiển mờ
thích nghi trực tiếp)

COM

Vi xử lý PWM
ðộng cơ DC Encoder
(AT89C52)

Tốc ñộ thực y

Hình 3.28
3.3.274.3
Mô hình gồm có :
1. ðộng cơ DC 14V, tốc ñộ Max 2100vòng/phút, làm việc không tải.
2. Cảm biến tốc ñộ Incremental 200xung/vòng.
3. Vi xử lý AT89C52, tấn số xung clock 11.059MHz, chu kỳ máy
12
TVXL = ( s ) , có nhiệm vụ ño tốc ñộ ñộng cơ gửi về máy tính
11.059.000
ñiều khiển áp cấp cho ñộng cơ bằng phương pháp PWM.
4. Chu kỳ PWM = 1024 × TVXL (≈1.1ms), chu kỳ lấy mẫu
46.080×TVXL (≈50ms), tốc ñộ port nối tiếp 19200Kbps.

Trang 375
Chương 3 ðiều khiển thích nghi

ym − y
5. Hệ số thích nghi γ thay ñổi tuỳ thuộc vào sai lệch ε = . Khi
ym
sai lệch ε≥1% thì γ = γ0, khi ε<1% thì γ = γ0/10, với γ0 ñã chọn trước.

Xây dựng BðK mờ thích nghi trực tiếp


1. Xác ñịnh biến ngôn ngữ
•Hai ngõ vào:
Tốc ñộ x1 (vòng/phút), có tầm giá trị từ 0…2000 vòng/phút, ñược
chuẩn hoá về [0…1].
Hàm thuộc µ1i ( x1 ) dạng Gaussian, với i=1…m1, m1 là số lượng tập mờ
Gia tốc x2 (vòng/phút/giây), có tầm giá trị từ - 4500…4500 (v/p/g),
ñược chuẩn hoá về [-1…1].
Hàm thuộc µ 2j ( x 2 ) dạng Gaussian,với j=1…m2, m2 là số lượng tập mờ
•Một ngõ ra:
ðộ rộng xung PWM (%), ký hiệu là u, có tầm giá trị 0…100%.
Hàm thuộc dạng Singleton θi,j, với i=1…m1, j=1…m2.

Bảng luật hợp thành:


BIẾN NGÔN NGỮ GIA TỐC
µ12 (x 2 ) µ 22 (x 2 ) µ 32 (x 2 ) … µ 2 2 (x 2 )
m

BIẾN µ11 (x 1 ) θ1,1 θ1,2 θ1,3 … θ1,m2


NGÔN µ12 (x1 ) θ 2,1 θ 2,2 θ 2,3 … θ 2,m2
NGỮ
µ13 (x 1 ) θ 3,1 θ 3,2 θ 3,3 … θ 3,m2
TỐC
… … … … … …
µ1 1 (x 1 ) θ m1 , j θ m1 ,2 θ m1 ,3 θ m1 , j
ðỘ m …

2. Luật hợp thành:


Xét luật hợp thành thứ (i,j), với i = 1…m1, j = 1…m2
IF x1 ∈ µ1i ( x1 ) AND x 2 ∈ µ 2i ( x 2 ) THEN u = θ i , j

Trang 376
Chương 3 ðiều khiển thích nghi

3. Giải mờ:
Chọn thiết bị hợp thành Max – Product , phương pháp giải mờ ñộ cao.
Giá trị rõ ñầu ra PWM ñiều khiển ñộng cơ:

m1 m2
∑∑ θi, j .µ1i (x 1 ).µ 2j (x 2 )
i=1 j=1
u= (3.110)
m1 m2
∑∑ ( ) (x 2 )µ1i x 1 .µ 2j
i=1 j=1

4. Luật cập nhật thông số:

 ∆θ i , j = γ .E T . p2 .ξ i , j ( x1 , x2 )
 (3.111)
θ i , j (k + 1) = θ i , j (k ) + ∆θ i
Trong ñó:
θi,j : Thông số cần cập nhật ở luật hợp thành thứ (i,j).
E = (e, e&) : Véctơ sai số, với sai số e = ym – y , với ym là vận tốc ñặt.
p2 : là cột thứ 2 của ma trận P có ñược từ phương trình Ricatti (3.106).
0 1 
Với A=  , k1, k2 ñược chọn sao cho phương trình
k1 k 2 
s2+k1s+k2=0 có nghiệm nằm bên trái mặt phẳng phức.
Các thí nghiệm trong bài ñược chọn với s = −0.1 ± j 20 .
γ>0 là hệ số cập nhật
µ1i ( x1 ).µ 2i ( x 2 )
ξ i , j ( x1 , x 2 ) = m1 m2
: hệ số xác ñịnh từ vế IF của luật hợp
∑∑ µ (x ).µ (x )
k =1 l =1
k
1 1
l
2 2

thành thứ (i,j).

Trang 377
Chương 3 ðiều khiển thích nghi

Kết quả mô phỏng và nhận xét:

Ghi chú : Trong các ñồ thị bên dưới, ñường liền nét là tốc ñộ mong muốn
ym ñường còn lại là tốc ñộ thực.

Trường hợp 1: Chọn γ0 = 0.5; y m = 1400 + 500 sin( t ) , θi,j = 20, với
120
i = 1…m1, j = 1…m2. Các tập mờ cho bởi Hình 3.29 và Hình 3.30

Hình 3.29: Các tập mờ µ 2j ( x) của biến ngôn


ngữ gia tốc.

Hình 3.30: Các tập


mờ µ1i ( x) của biến
ngôn ngữ tốc ñộ.

Trang 378
Chương 3 ðiều khiển thích nghi

a. Giá trị PWM b. Sai số ngõ ra

c. ðáp ứng ngõ ra của mô d. ðáp ứng ñược phóng to

Hình 3.31: Kết quả ñiều khiển của Trường hợp 1.

Nhận xét: Từ các ñồ thị ở Hình 3.31 ta thấy rằng:


Ở tốc ñộ thấp, giá trị PWM thay ñổi ít nhưng tốc ñộ thay ñổi nhiều; ở
tốc ñộ cao giá trị PWM thay ñổi nhiều nhưng tốc ñộ thay ñổi ít.
Bộ ñiều khiển mờ ban ñầu ñược thiết kế mà không dựa trên nhiều
thông tin về ñối tượng, nhưng chất lượng ñiều khiển là khá tốt dù ñối
tượng là phi tuyến.

Trang 379
Chương 3 ðiều khiển thích nghi

a. ðáp ứng trường hợp 2a b. ðáp ứng trường hợp 2b

c. Sai số trường hợp 2a d. Sai số trường hợp 2b

Hình 3.32: Kết quả ñiều khiển của Trường hợp 2


Trường hợp 2: γ0 = 0.5 ; y m = 1400 + 500 sin( t ) ( trường hợp 2a) và
30

y m = 1400 + 500 sin( t ) (trường hợp 2b); θi,j = 20, với i = 1..5, j = 1..5.
60
Các tập mờ vẫn như trường hợp 1. (Xem kết quả ở Hình 3.32)

Nhận xét: Với cùng hệ số cập nhật và các giá trị ban ñầu θI,j, khi tốc ñộ
mong muốn ym biến thiên nhanh hơn thì tốc ñộ thức y không bám theo kịp
dẫn ñến sai số lớn. Do luật cập nhật phụ thuộc vào ym nên ta cần hiệu chỉnh
lại thông số γ0 cho phù hợp.

Trang 380
Chương 3 ðiều khiển thích nghi

a. ðáp ứng khi γ0 = 0.2 b. ðáp ứng khi γ0 = 0.5

c. ðáp ứng khi γ0 = 0.8 d. ðáp ứng khi γ0 = 1.2

Hình 3.33: Kết quả ñiều khiển Trường hợp 3



Trường hợp 3: θi,j = 20; với i =1..5, j = 1..5; y m = 1400 + 500 sin( t ) , các
60
tập mờ như Trường hợp 1, γ0 lần lượt là 0.2, 0.5, 0.8, 1.2.
Nhận xét:
Việc tăng γ0 sẽ làm cho luật cập nhật nhạy hơn với sai số, do vậy ñáp
ứng hệ thống sẽ tốt hơn.
Tuy vậy ở tốc ñộ thấp, khi γ0 tăng sẽ làm cho tốc ñộ ñộng cơ bị dao
ñộng lớn hơn. Sự dao ñộng tỷ lệ thuận với việc tăng γ0 .
Bằng kinh nghiệm qua các trường hợp ñã xét ta thấy rằng ñáp ứng tốc ñộ
phụ thuộc vào nhiều yếu tố như: số lượng tập mờ, hệ số γ0, θi,j, tốc ñộ biến
thiên của tốc ñộ mong muốn…Từ ñó ta ñưa ra việc lựa chọn các thông số
cho phù hợp ñể tối ưu ñáp ứng của hệ thống.

Trang 381
Chương 3 ðiều khiển thích nghi


Trường hợp 4: γ0 = 2.5; y m = 1400 + 500 sin( t ) ; θi,j ñược chọn như bảng
60
bên dưới, sử dụng 7 tập mờ cho biến tốc ñộ và 5 tập mờ cho biến gia tốc.
BIẾN NGÔN NGỮ GIA TỐC
µ 21 (x2 ) µ 22 ( x2 ) µ 23 ( x2 ) µ14 ( x1 ) µ 25 ( x 2 )
µ11 ( x1 ) 10 10 10 10 10
BIẾN µ12 (x1 ) 10 10 10 10 10
NGÔN µ13 ( x1 ) 20 20 20 20 20
NGỮ µ14 ( x1 ) 30 30 30 30 30
TỐC µ15 ( x1 ) 45 45 45 45 45
ðỘ µ16 ( x1 ) 60 60 60 60 60
µ17 ( x1 ) 80 80 80 80 80

Hình 3.34: Kết quả ñiều khiển trường hợp 4

Trang 382
Chương 3 ðiều khiển thích nghi

Kết luận chung


ðối tượng ñộng cơ DC ñược ñiều khiển bằng phương pháp PWM là ñối
tượng phi tuyến. Một BðK mờ thích nghi ñược thiết kế hợp lý sẽ ñiều khiển
tốc ñộ của ñộng cơ bám theo nhiều dạng tốc ñộ mong muốn khác nhau.
Những kinh nghiệm, thông tin ñã biết về ñối tượng sẽ rất hữu ích trong việc
tìm ra BðK thích nghi tối ưu.
Các thông số quyết ñịnh chất lượng hệ thống là : hệ số γ0, giá trị ban ñầu θi,j,
tín hiệu mong muốn ym …Với mỗi thông số có một tác dụng riêng, việc tìm
ra bộ thông số tối ưu cần dựa vào kinh nghiệm và kiến thức về hệ thống ñiều
khiển.

Ví dụ 3.22: Mô hình Hệ thống ga tự ñộng trên ôtô


1. ðộng lực học của ôtô trên ñường:
Ôtô vận hành trên ñường nhờ moment sinh ra từ ñộng cơ, thông qua hệ
thống truyền ñộng, chuyển thành lực kéo tiếp tuyến tại các bánh xe chủ
ñộng ñẩy ôtô dịch chuyển lên phía trước. Lực kéo tiếp tuyến này luôn cân
bằng với các lực cản tác ñộng vào ôtô theo ñịnh luật I Newton:
Fkéo = Fcản lăn + Fcản khi ñộng + Fcản leo dốc + Fcản quán tính
Tổng các lực cản ñối với ôtô không phụ thuộc tuyến tính vào vận tốc của
ôtô và các thành phần lực cản này có những hệ số phụ thuộc vào ñiều kiện
làm việc của ôtô như loại ñường, ñộ mấp mô, ñộ nghiêng của mặt ñường,
loại lốp xe, nhiệt ñộ môi trường, gió, tải trọng của xe, tình trạng của ñộng
cơ, của hệ thống truyền ñộng, ñộ mòn của lốp…Các ñiều kiện làm việc này
không cố ñịnh mà thay ñổi mỗi khi ôtô vận hành và trong lúc ôtô vận hành.

Fcaûn khí ñoäng

Fkeùo
δ

Fcaûn laên baùnh tröôùc


Fcaûn laên baùnh sau

Hình 3.35 ðộng lực học của ôtô trên ñường


Trang 383
Chương 3 ðiều khiển thích nghi

2.Phương trình trạng thái:


ðối tượng vận hành trên ñường là một ñối tượng phi tuyến chỉ bao gồm một
tín hiệu ñiều khiển vào là ñộ mở cánh bướm ga của ñộng cơ ( hay vị trí bàn
ñạp ga trên ôtô), và một ñầu ra là vận tốc ôtô. Các trạng thái của ñối tượng
là vận tốc và gia tốc. Dựa theo phương trình trạng thái (3.94) và (3.95), ñặc
tính của ñối tượng này có thể ñược biểu diễn bởi hệ phương trình vi phân
tuyến tính bậc 2 ở dạng chính tắc:
 x1 = v xe
x = x&1
 2

 x& 2 = f ( x1 , x 2 ) + b.α , (b > 0)
y = x1

với f ( x1 , x 2 ) là hàm phi tuyến chưa biết và b > 0 là giá trị chưa biết, α là ñộ
mở bướm ga của ñộng cơ. Cả f ( x1 , x 2 ) và b phụ thuộc vào ñiều kiện làm
việc, chế ñộ vận hành, tình trạng của ñộng cơ, hệ thống truyền ñộng của ôtô.

3. Luật ñiều khiển ñối tượng:


Luật ñiều khiển ñối tượng dựa trên tuyến tính hoá hồi tiếp ñể ngõ ra y của
ñối tượng bám sát ngõ ra mong muốn ym có dạng như (3.72):

u* =
1
b
[
− f ( x) + y m( n ) + K T E ]
với: e = y m − y = y m − x = (e, e&,..., e ( n −1) ) T và k = (k n , k n −1 ,..., k1 ) T
s n + k1 s n −1 + K + k n = 0 có tất cả các nghiệm nằm bên trái trục ảo của mặt
phẳng phức.
Với luật ñiều khiển u * , các thành phần phi tuyến của ñối tượng bị triệt tiêu.
Thành phần K T E ñược ñưa vào ñể ñảm bảo sai số ngõ ra vẫn hội tụ về 0
trong trường hợp trạng thái ban ñầu của ñối tượng không làm cho ngõ ra y
bám ngay ngõ ra mong muốn y m .
Do thành phần f(x) và b chưa xác ñịnh nên luật ñiều khiển u * cho ñối tượng
ñược xem là chưa biết. Trong bộ ñiều khiển mờ thích nghi trực tiếp, một hệ
thống mờ ñược sử dụng ñể tìm ra hay xấp xỉ luật ñiều khiển mong muốn u *
chưa biết này.

Trang 384
Chương 3 ðiều khiển thích nghi

4. Thiết kế luật thích nghi (luật cập nhật, chỉnh ñịnh thông số)
Với bộ ñiều khiển mờ thích nghi trực tiếp, luật chỉnh ñịnh thông số ñể
vector thông số θ hội tụ về vector thông số lí tưởng θ* (nghĩa là uD(X, θ) hội
tụ về uD(X, θ*) là xấp xỉ của u* với sai số xấp xỉ nhỏ nhất ε), ñược xác ñịnh
theo tiêu chuẩn ổn ñịnh Lyapunov.
Xét biểu thức Lyapunov (3.104) cho hệ thống mờ thích nghi trực tiếp uD(X,
θ) dùng cho ñối tượng ñược mô tả trong phương trình sau:
1 T b *
V (E) = E PE + (θ − θ ) T (θ * − θ )
2 2γ
với:
- γ > 0 là một hằng số, ñược gọi là hệ số cập nhật hay hằng số hội tụ.
- P ∈ R n x n là ma trận thực, xác ñịnh dương thoả mãn phương trình:
ΛT P + PΛ = − Q
Trong ñó, Q ∈ R n x n là ma trận thực, dương ñược chọn trước.
Theo tiêu chuẩn ổn ñịnh Lyapunov, với V (E ) xác ñịnh dương và V& (E ) xác
ñịnh âm thì sai số E sẽ tiến về 0, hay giá trị ngõ ra y sẽ bám theo giá trị ngõ
ra y m mong muốn, khi ñó xác ñịnh ñược luật thích nghi (3.109):
θ& = γE T p nξ ( X )

Mô hình ñộng lực học ôtô trên ñường


ðặc tính ñộng học của ôtô trên ñường ñược mô tả qua phương trình sau:

 m xe  i
 + J e a xe = e M e − ∑ Fload (V xe )
 g  rW
Trong ñó:
- m xe = G0 + Gt là trọng lượng toàn bộ của ôtô, [N].
- a xe là gia tốc ôtô, [m/s2].
- V xe là vận tốc ôtô, [m/s].
- ne là tốc ñộ ñộng cơ, [rpm] (vòng/phút).

Trang 385
Chương 3 ðiều khiển thích nghi

- α là vị trí (ñộ mở) cánh bướm ga, [%].


- ie = i4i0 là tỉ số truyền lực của hệ thống truyền ñộng.
- Me là moment xoắn có ích do ñộng cơ sinh ra, [N.m].
- ∑ Fload = Froadload + Floss + Fslope là tổng các lực cản ñối với hệ
thống truyền ñộng của ôtô, [N].
- Froadload = F2Vv2 + F1Vv + F0 là tổng các lực do chuyển ñộng trên
ñường, bao gồm lực cản lăn giữa lốp và mặt ñường, lực cản khí
ñộng, [N].
- Floss = Fl3 Vv3 + Fl2 Vv2 + Fl1Vv + Fl0 là lực cản do tổn thất cơ giới
trong hệ thống truyền ñộng, [N].
- Fslope = m xe .g . sin(Grade) là lực cản leo dốc, [N].

ðặc tính moment theo tốc ñộ và ñộ mở bướm ga của ñộng cơ

Trang 386
Chương 3 ðiều khiển thích nghi

1 Throttle Position
Throttle Position 1
Traction Force -K- 3.6 1
s
Vehicle Velocity Vehicle Velocity
Vehicle Integrator
m/s to km/h
Power Train Model Inertia

Vehicle Velocity Road Load

Road Load Model

Hình 3.36 Mô hình ñộng lực học ôtô trên ñường

1
0 f(u)
s
Integrator Gain Climbing Load
Lookup Table
1
Road Load

1 1/3.6 f(u)
Vehicle Velocity
Road_Load
km/h to m/s

0 1/3.6

Wind
km/h to m/s2

Hình 3.37 Mô hình lực cản trên ñường


2-D T(u)
1 Engine
Torque
Throttle Position Engine -K- -K- 1
Speed
-K- Traction Force
Engine Age
Transmission 1
Saturation Engine
km/h to rpm

Power Train
Loss Torque
2 1/3.6 f(u) -K-
Vehicle Velocity
Power Train Loss
km/h to m/s Transmission 2

Hình 3.38 Mô hình hệ thống truyền lực của ôtô

Trang 387
Chương 3 ðiều khiển thích nghi

3. Hai bộ ñiều khiển hệ thống ga tự ñộng trên ô tô

Vận tốc ban ñầu của ôtô là 40km/h, ôtô sẽ ñược ñiều khiển ñạt vận tốc ổn
ñịnh 60km/h sau 20s bằng bộ ñiều khiển PID và bộ ñiều khiển mờ thích
nghi trực tiếp (DAF – Direct Adaptive Fuzzy).
Cả 2 bộ ñiều khiển ñược xây dựng với giả thiết ñã có bộ ñiều khiển ñộ mở
cánh bướm ga lí tưởng, ñiều khiển chính xác ñộ mở cánh bướm ga với thời
gian quá ñộ rất bé.

A. Bộ ñiều khiển PID: KP = 2 ; KI = 1.2 ; KD = 5

P Part

1
1 1.2 1
s
Demand Velocity Throttle Position
Integrator I Part Saturation1

2
Actual Velocity
du/dt 5

Derivative D Part

Hình 3.39 Bộ ñiều khiển PID

B. Bộ ñiều khiển mờ thích nghi trực tiếp


Bộ ñiều khiển mờ thích nghi trực tiếp có những ñặc ñiểm sau:
1. Ngõ vào: 2 ngõ vào
a. Actual Velocity
- Tầm giá trị: 0…120km/h
- 5 tập mờ như hình 2.18
b.Acceleration
- Tầm giá trị: -4…4m/s2.
- 5 tập mờ như hình 2.19
2. Ngõ ra: 1 ngõ ra
- Tên biến ngôn ngữ: Trottle Position

Trang 388
Chương 3 ðiều khiển thích nghi

- Tầm giá trị: 0…100%


- 25 tập mờ dạng singleton, là các thông số ñược ñiều chỉnh của hệ thích
nghi.

Hình 3.40 Bộ ñiều khiển mờ thích nghi trực tiếp (DAF)


3. Bảng luật hợp thành với giá trị ban ñầu của các thông số
Biến ngôn ngữ ACCELERATION
µ12 (x 2 ) µ 22 (x 2 ) µ 32 (x 2 ) µ 24 (x 2 ) µ 52 (x 2 )

µ11 (x 1 ) 1 1 1 1 1

µ12 (x 1 ) 15 15 15 15 15
Biến ngôn
ngữ µ13 (x 1 ) 30 30 30 30 30
ACTUAL
VELOCITY µ14 (x 1 ) 48 48 48 48 48

µ15 (x 1 ) 100 100 100 100 100

Bảng 3.1 Bảng luật hợp thành của bộ ñiều khiển mờ thích nghi trực tiếp

Trang 389
Chương 3 ðiều khiển thích nghi

 0 1
4. Chọn ma trận Λ = 
− 0.01 − 0.1
10 0 
5. Chọn ma trận Q =  
0 10
6. Chọn hệ số γ = 1.

Hình 3.41 5 tập mờ µ1i ( x) , i =1..5, của Hình 3.42 5 tập mờ µ 2i (x), i =
ngõ vào Actual Velocity 1..5, của ngõ vào Acceleration

100
Engine throttle position (%)

80

60

40

20

0
4
2 120
100
0 80
60
-2 40
20
-4 0
Acceleration (m/s2) Vehicle velocity (km/h)

Hình 3.43 ðặc tính làm việc của bộ ñiều khiển mờ thích nghi trực tiếp khi
mới ñược khởi tạo

Trang 390
Chương 3 ðiều khiển thích nghi

4. So sánh kết quả ñiều khiển


1. Trường hợp 1: Age = 100%, Gt = 100kg, vwind = 0 km/h, ôtô ñi trên ñường
bằng Grade = 0° (xem hình 2.21).
2. Trường hợp 2: Age = 100%, Gt = 500kg, vwind = 0 km/h, ôtô ñi trên ñường
bằng Grade = 0° (xem hình 2.22).
3. Trường hợp 3: Age = 100%, Gt = 100kg, vwind = 30 km/h, ôtô ñi trên
ñường bằng Grade = 0°.
4. Trường hợp 4: Age = 100%, Gt = 500kg, vwind = 30 km/h, ôtô ñi trên
ñường bằng Grade = 0°.
5. Trường hợp 5: Age = 85%, Gt = 100kg, vwind = 0 km/h, ôtô ñi trên ñường
bằng Grade = 0°.
6. Trường hợp 6: Age = 85%, Gt = 500kg, vwind = 0 km/h, ôtô ñi trên ñường
bằng Grade = 0°.
7. Trường hợp 7: Age = 85%, Gt = 100kg, vwind = 30 km/h, ôtô ñi trên ñường
bằng Grade = 0°.
8. Trường hợp 8: Age = 85%, Gt = 500kg, vwind = 30 km/h, ôtô ñi trên ñường
bằng Grade = 0°.
9. Trường hợp 9: Age = 100%, Gt = 300kg, vwind = 30 km/h, ôtô lên và
xuống dốc Grade = 5°.
10. Trường hợp 10: Age = 85%, Gt = 300kg, vwind = 30 km/h, ôtô lên và
xuống dốc Grade = 5°.

VEHICLE VELOCITY (km/h) vs. TIME (s) VEHICLE VELOCITY (km/h) vs. TIME (s)
100 100
Demand velocity Demand velocity
90 Result with DAF controller 90 Result with DAF controller
Result with PID controller Result with PID controller
80 80

70 70
V e h ic le v e lo c ity (k m /h )

V e h ic le v e lo c ity (k m /h )

60 60

50 50

40 40

30 30

20 20

10 10

0 0
0 10 20 30 40 50 60 70 80 90 100 110 120 0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s) Time (s)

Hình 3.44.a Hình 3.45.a

Trang 391
Chương 3 ðiều khiển thích nghi

ENGINE THROTTLE POSITION (%) vs. TIME (s) ENGINE THROTTLE POSITION (%) vs. TIME (s)
110 110
Result with DAF controller Result with DAF controller
100 Result with PID controller 100
Result with PID controller
E n g in e th r o ttle p o s itio n (% ) 90 90

E n g in e th ro ttle p o s itio n (% )
80 80
70 70
60 60
50 50
40 40

30 30

20 20

10 10

0 0
0 10 20 30 40 50 60 70 80 90 100 110 120 0 10 20 30 40 50 60 70 80 90 100 110 120
Time (s) Time (s)

Hình 3.44.b Hình 3.45.b

100 100
E n g in e th ro ttle p o s itio n (% )
E n g in e th r o tt le p o s itio n (% )

80 80

60 60

40 40

20 20

0 0
4 4
2 120 2 120
100 100
0 80 0 80
60 60
-2 40 -2 40
20 20
2
-4 0 2
-4 0
Acceleration (m/s ) Vehicle velocity (km/h) Acceleration (m/s ) Vehicle velocity (km/h)

Hình 3.44.c Hình 3.45.c

Trường hợp 1 (hình 3.44) và 2 (hình 3.45), vận tốc ôtô (a), ñộ mở bướm ga
(b) và ñặc tính làm việc của bộ ñiều khiển sau khi xác lập

Hình 3.46: Vận tốc (a) và ñộ mở bướm ga (b) khi ôtô lên và xuống dốc 5° ở
trường hợp 9

Trang 392
Chương 3 ðiều khiển thích nghi

VEHICLE VELOCITY (km/h) vs. DISTANCE (m)


100
Result with DAF controller
90 Result with PID controller

80

70
Vehicle velocity (km/h)
60

50

40

30

20

10

0
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)

Hình 3.46.a

ENGINE THROTTLE POSITION (%) vs. DISTANCE (m)


110
Result with DAF controller
100
Result with PID controller
90
80
Engine throttle position (%)

70
60

50
40
30
20

10
0
-10
0 1000 2000 3000 4000 5000 6000 7000
Distance (m)

Hình 3.46.b

Trang 393
Chương 3 ðiều khiển thích nghi

Nhận xét:
- Bộ ñiều khiển DAF với cấu trúc và những thông số ñược chọn thích hợp
ñã cho kết quả ñiều khiển tốt trong các trường hợp ñược khảo sát. Vận tốc
ôtô ñược ñiều khiển với sai số xác lập bằng 0, ít vọt lố, không bị dao ñộng,
hệ thống không bị mất ổn ñịnh trong quá trình ñiều khiển.
- Với cùng một bộ giá trị ban ñầu của các thông số, dù có sự thay ñổi về
tải trọng tác dụng xe, hao mòn trong hệ thống truyền ñộng hay ñộng cơ, ảnh
hưởng của gió, sự thay ñổi về ñộ dốc của mặt ñường, bộ ñiều khiển DAF
vẫn tự chỉnh ñịnh ñược các thông số và ñảm bảo chất lượng ñiều khiển tốt.
- Do luật chỉnh ñịnh thông số ñược xây dựng trên tiêu chuẩn ổn ñịnh
Lyapunov và vận tốc ôtô ñược ñiều chỉnh bám theo hàm dốc, mục tiêu ñặt
ra trong các trường hợp khảo sát này chỉ là luôn duy trì vận tốc ôtô không
ñổi ở giá trị 60 km/h; và ñảm bảo hệ thống làm việc không bị mất ổn ñịnh
hay bị trải qua những giai ñoạn mất ổn ñịnh. Những mục tiêu khác như ñộng
cơ tiêu hao ít nhiên liệu nhất, hay gia tốc ôtô phải nằm trong giới hạn cho
phép ñể ñem lại cảm giác thoải mái, êm dịu cho người ñi xe không thực hiện
ñược.

3.6. ðiều khiển thích nghi hệ ñộng mạng DFNN:


Trên thực tế, hầu hết các ñối tượng cần ñiều khiển là những hệ thống phi
tuyến phức tạp và ñặc tính ñộng học của chúng luôn biến ñổi theo thời gian.
Việc ñiều khiển chúng chỉ có thể dựa trên một kỹ thuật duy nhất là ñiều
khiển thích nghi. Trong thời gian gần ñây, các bộ ñiều khiển nơ-ron mờ
thích nghi với sự kết hợp các ưu ñiểm của logic mờ và mạng nơ-ron ñược
xem là giải pháp hiệu quả nhất ñể giải quyết những vấn ñề trên.

3.6.1. ðiều khiển thích nghi dựa trên mô hình ngược DFNN

Một ñối tượng bất kỳ có thể ñược ñiều khiển ñể bám theo một tín hiệu ñặt
bất kỳ bằng việc cung cấp tín hiệu ñặt này tới một bộ ñiều khiển mà ñặc tính
ñộng học của nó là nghịch ñảo của ñặc tính ñộng học ñối tượng.

Phương pháp ñiều khiển dựa trên mô hình ngược

Trang 394
Chương 3 ðiều khiển thích nghi

Giả sử ñối tượng cần ñiều khiển ñược mô tả bằng phương trình sai phân:

với (.) g là 1 hàm phi tuyến bất kỳ


Bộ ñiều khiển ñược huấn luyện ñể học mô hình ngược của ñối tượng:

3.6.2. Quy trình ñiều khiển thích nghi với mạng DFNN
Quy trình này bao gồm 2 bước ñộc lập: nhận dạng on-line mô hình ngược
ñối tượng và ñiều khiển thích nghi ñối tượng.

 Bước 1: Nhận dạng on-line mô hình ngược ñối tượng

ðây là quá trình chỉnh ñịnh on-line cấu trúc và thông số cho mạng DFNN
(dựa trên thuật toán ñã ñề cập trong chương 1) sao cho mạng có khả năng
mô tả ñược ñặc tính ñộng học ngược của ñối tượng cần ñiều khiển.
Muốn vậy, tín hiệu ngõ vào cung cấp cho ñối tượng phải ñủ giàu thông tin
ñể tạo tín hiệu ñáp ứng ngõ ra của ñối tượng cũng ñủ giàu thông tin. Các tập
mẫu vào – ra như vậy sẽ giúp cho quá trình nhận dạng on-line mau hội tụ về
mô hình ngược gần ñúng nhất của ñối tượng.

Nhận dạng on-line mô hình ngược ñối tượng

 Bước 2: ðiều khiển thích nghi hệ ñộng

Sau khi ñã hoàn tất quá trình nhận dạng on-line mô hình ngược. ðể có thể
ứng dụng ñược mô hình ngược trên vào ñiều khiển thì bộ ñiều khiển phải có

Trang 395
Chương 3 ðiều khiển thích nghi

khả năng thích nghi với những thay ñổi trong ñặc tính ñộng học ngược của
ñối tượng và với nhiễu. Do ñó, bên cạnh quá trình ñiều khiển ñối tượng thì
mạng DFNN vẫn phải tiếp tục tiến hành song song quá trình tự học on-line
mô hình ngược của ñối tượng.
Về bản chất, quá trình học on-line này hoàn toàn tương tự như ở bước 1.
Tuy nhiên, do ñược thừa hưởng một cấu trúc mạng gần như hoàn chỉnh cho
việc mô tả ñặc tính ñộng học ngược của ñối tượng từ bước 1 nên trên thực
tế, quá trình chỉnh ñịnh cấu trúc mạng DFNN rất khó xảy ra ở bước 2 (trừ
khi có sự thay ñổi rất lớn trong ñặc tính ñộng học của ñối tượng dẫn ñến ñối
tượng gần như trở thành một ñối tượng mới thì quá trình chỉnh ñịnh cấu trúc
mới có khả năng xảy ra). Vì vậy, trong bước này chủ yếu chỉ xảy ra quá
trình chỉnh ñịnh thông số mệnh ñề kết luận của mạng.
Với quá trình chỉnh ñịnh thông số, mạng DFNN vẫn ñảm bảo ñược khả
năng thích nghi với những thay ñổi không quá lớn trong ñặc tính ñộng học
ngược của ñối tượng. Trong trường hợp ñối tượng thay ñổi quá lớn có thể
dẫn tới cần phải thay ñổi cấu trúc mạng thì nên tiến hành lại bước 1 ñể nhận
dạng một mô hình ngược mới hoàn toàn về ñối tượng.

ðiều khiển thích nghi hệ ñộng

Quá trình ñiều khiển thích nghi hệ ñộng bao gồm 2 giai ñoạn:
• Giai ñoạn ñiều khiển: quá trình tính toán ñược lan truyền từ tín hiệu
ñặt, qua mạng DFNN, ñến tín hiệu ngõ ra của mạng (tín hiệu ñiều khiển).

Trang 396
Chương 3 ðiều khiển thích nghi

• Giai ñoạn thích nghi: các dữ liệu ngõ vào (tín hiệu ñiều khiển) và
ngõ ra của ñối tượng ñược sử dụng ñể chỉnh ñịnh các thông số mệnh ñề kết
luận của mạng.

Chú ý:
Theo mô hình trên, mặc dù hai giai ñoạn trên ñược biểu diễn bằng hai mạng
DFNN, mỗi mạng thực hiện một chức năng riêng biệt, tuy nhiên trên thực tế
thì chỉ cần sử dụng một cấu trúc mạng DFNN nhưng tích hợp cả hai giai
ñoạn trên vào quá trình thực thi của thuật toán mạng (do trong giai ñoạn
thích nghi ñã bỏ qua quá trình chỉnh ñịnh cấu trúc mạng).

3.6.3. ðiều khiển thích nghi hệ ñộng với khâu PD bù sai số

Trên thực tế, ñối với một số ñối tượng ñiều khiển phức tạp, không phải bất
cứ khâu phi tuyến nào trong ñặc tính ñộng học ngược của ñối tượng cũng có
thể nhận dạng và mô hình hóa ñược. ðiều này dẫn ñến sai số cấu trúc trong
mô hình.

ðiều khiển thích nghi hệ ñộng với khâu PD bù sai số

Mặc khác, sai số còn xuất hiện trong mô hình do các nhiễu. Nhiễu làm
thông tin thu thập cho quá trình nhận dạng (các mẫu dữ liệu vào – ra) bị sai
lệch dẫn ñến sự không chính xác trong mô hình nhận dạng. Ngoài ra, tương
tự như bất kỳ một thuật toán chỉnh ñịnh thông số nào khác, do ñặc tính

Trang 397
Chương 3 ðiều khiển thích nghi

chỉnh ñịnh on-line nên các thông số chỉnh ñịnh trong mỗi chu kỳ lấy mẫu có
thể dao ñộng với một biên ñộ nhỏ xung quanh giá trị chính xác của nó. Sự
dao ñộng này cũng có thể dẫn ñến sai số ngõ ra mô hình. ðể khắc phục các
sai số trên, lưu ñồ ñiều khiển thích nghi cần phải ñược bổ sung một bộ ñiều
khiển phụ PD kinh ñiển (bộ ñiều khiển tỉ lệ, vi phân):

Tùy theo sai số ngõ ra mà bộ ñiều khiển phụ này sẽ bù vào tín hiệu ñiều
khiển thu ñược từ ngõ ra mạng DFNN một lượng thích hợp. Bộ ñiều khiển
phụ PD này còn có thể hỗ trợ tích cực cho quá trình ñiều khiển tại thời ñiểm
ñặc tính ñộng học của ñối tượng vừa mới thay ñổi và bộ ñiều khiển mô hình
ngược chưa kịp thích nghi với ñặc tính ñộng học mới.

3.6.4. Ví dụ minh họa:


Ví dụ 3.23:
Sử dụng công cụ Simulink của MATLAB 7.0 ñể xây dựng mô hình và thuật
toán ñiều khiển thích nghi hệ bồn nước nối tiếp có thông số các van thay ñổi

Mô hình thực của hệ bồn chứa nước nối tiếp

ðặt vấn ñề:


Mục tiêu của thuật toán là ñiều khiển ñộ cao mực nước ở bồn 2 theo tín hiệu
ñặt. Về bản chất, hệ mô hình bồn chứa nước nối tiếp là hệ SISO:

 Ngõ vào: ñiện áp ñiều khiển máy bơm [u(t)]


 Ngõ ra: ñộ cao mực nước bồn 2 [h2(t)]
 Thông số thay ñổi: tiết diện 2 van [a1,a2]

Trang 398
Chương 3 ðiều khiển thích nghi

Giải pháp:

Sử dụng 2 mạng DFNN ñể nhận dạng on-line mô hình ngược từng bồn nước
 Mạng DFNN nhận dạng mô hình ngược bồn 1: mạng ñiều khiển
 Mạng DFNN nhận dạng mô hình ngược bồn 2: mạng dự báo

Mô hình Simulink của hệ bồn nước nối tiếp với các nhiễu ño lường ở ngõ ra

Hệ phương trình toán liên tục của hệ bồn nước nối tiếp:

Quy trình nhận dạng và ñiều khiển

 Bước 1: Nhận dạng on-line mô hình ngược


Rời rạc hóa phương trình toán liên tục của hệ bồn nước:

Trang 399
Chương 3 ðiều khiển thích nghi

Trong ñó: T là chu kỳ lấy mẫu dữ liệu.

Tổng quát và ñơn giản hóa hệ trên ta có:

Từ phương trình (2) ta có:

Phương trình trên có thể viết lại bằng cách sử dụng một hàm phi tuyến g{.}:

Ta thấy quan hệ giữa ngõ vào u và ngõ ra h2 là một quan hệ có trễ (trễ 1
chu kỳ lấy mẫu). Mô hình có trễ là một mô hình không tồn tại mô hình
ngược (mô hình bất khả ñảo – noninvertible model).
Vì thế, ta sẽ khắc phục bằng cách tách ñối tượng ra làm 2 bồn riêng biệt.

Khi ñó, quan hệ vào ra của mỗi bồn là một quan hệ không có trễ:

ðể nhận dạng mô hình ngược của mỗi bồn nước thì phương trình viết lại là:

Trong ñó: f 1−1 (.) và f 2−1 (.) là cấu trúc mạng DFNN nhận dạng mô hình
ngược của bồn 1 và bồn 2 tương ứng.

Trang 400
Chương 3 ðiều khiển thích nghi

Do hệ bồn chứa nước là hệ ñáp ứng tương ñối chậm nên u có thể ñược chọn
là dãy xung vuông biên ñộ ngẫu nhiên với chu kỳ ñủ lớn 0V ≤ u ≤ 12V

Lưu ñồ nhận dạng mô hình ngược hệ bồn chứa nước nối tiếp

Mô hình ngược 2 bồn ñược tiến hành nhận dạng trong ñiều kiện có nhiễu ño
lường ở cả h1 và h2 (là sự dao ñộng của mặt nước khi lấy mẫu). Chu kỳ lấy
mẫu nhận dạng là 2s, tương ứng với 1500 mẫu dữ liệu. Tiết diện các van khi
nhận dạng là a1 = 2 cm2 và a2 = 0.5 cm2. Kết quả của quá trình nhận dạng:

Các hàm liên thuộc lớp 2 cấu trúc mạng DFNN

Trang 401
Chương 3 ðiều khiển thích nghi

Sự phát sinh nơ-ron luật và sai số ngõ ra quá trình nhận dạng

∧ ∧
Ngõ ra mạng DFNN bồn 1 ( u ) và bồn 2 ( h1 ) trong quá trình nhận dạng

Trang 402
Chương 3 ðiều khiển thích nghi

 Bước 2: ðiều khiển thích nghi hệ ñộng

ðối với các ñối tượng có khâu trễ, tuy không ño lường trực tiếp ñược nhưng
ngõ vào có thể dự báo ñược. Mô hình ngược của bồn ñược viết lại như sau:

Khi thay các tín hiệu ngõ ra tương lai h2(k+2) và h2(k+1) bằng các tín hiệu
ngõ ra mong muốn (tín hiệu ñặt) r(k+2) và r(k+1), có thể dự báo ñược ñộ
cao mực nước bồn 2 tại thời ñiểm tiếp theo trong tương lai là:

Trang 403
Chương 3 ðiều khiển thích nghi

Tín hiệu ñiều khiển tại thời ñiểm hiện tại:

Bên cạnh quá trình ñiều khiển (sử dụng mô hình ngược), quá trình nhận
dạng thông số on-line của 2 mạng vẫn phải ñược tiếp tục tiến hành song
song ñể tạo khả năng thích nghi cho quá trình ñiều khiển.
Ta tiến hành khảo sát các trường hợp ñiều khiển khi thông số van thay ñổi:

 ðiều khiển không thích nghi khi thông số các van thay ñổi

Khi ñiều khiển, 1000s ñầu tiên thông số 2 van vẫn giữ nguyên như bước 1
(a1 = 2 cm2 và a2 = 0.5 cm2 ). Tiết diện van thông và van xả chỉ thay ñổi ñến

Trang 404
Chương 3 ðiều khiển thích nghi

giá trị mới là a1 = 1 cm2 và a2 = 0.8 cm2 từ giây thứ 1001 ñến khi kết thúc
quá trình ñiều khiển (3000s)..

Quá trình ñiều khiển không thích nghi với tín hiệu ñặt có dạng vuông, sin

Nhận xét:
Ban ñầu, khi ñặc tính ñộng học ñối tượng không thay ñổi, ñối tượng ñược
ñiều khiển rất chính xác.Tuy nhiên, khi ñặc tính ñộng học ñối tượng bắt ñầu
thay ñổi, do không có sự thích nghi, bộ ñiều khiển ñược huấn luyện ở bước
1 tỏ ra không còn phù hợp với ñặc tính ñộng học ngược mới của ñối tượng
và quá trình ñiều khiển xuất hiện sai số ñiều khiển tương ñối lớn.

 ðiều khiển thích nghi khi thông số các van thay ñổi

Quá trình ñiều khiển tương tự như trường hợp trên. Tuy nhiên, thuật toán
ñiều khiển thực thi luôn cả giai ñoạn ñiều khiển và giai ñoạn thích nghi.

Trang 405
Chương 3 ðiều khiển thích nghi

Quá trình ñiều khiển thích nghi với tín hiệu ñặt có dạng vuông, sin

Nhận xét:
Bộ ñiều khiển thích nghi mô hình ngược có thể ñiều khiển chính xác ñối
tượng ngay cả khi thông số ñối tượng thay ñổi và với mọi dạng tín hiệu ñặt.
Tại thời ñiểm ñặc tính ñộng học ñối tượng thay ñổi, sai số ñiều khiển có thể
tương ñối lớn do quá trình huấn luyện chưa kịp thích nghi. Tuy nhiên, chỉ
sau một thời gian ngắn huấn luyện on-line, bộ ñiều khiển mô hình ngược ñã
có thể thích nghi ñược với ñặc tính ñộng học ngược mới của ñối tượng.

 Vai trò của bộ ñiều khiển phụ PD kinh ñiển:

Ta sẽ xem xét sự ảnh hưởng của bộ ñiều khiển phụ PD trong cả 2 quá trình:
ñiều khiển thích nghi và ñiều khiển không thích nghi.

Quá trình ñiều khiển thích nghi có và không có bộ ñiều khiển phụ PD

Trang 406
Chương 3 ðiều khiển thích nghi

Quá trình ñiều khiển không thích nghi có và không có bộ ñiều khiển phụ PD

Nhận xét:
Trong cả 2 trường hợp, ta thấy khi không có bộ ñiều khiển phụ PD hỗ trợ,
quá trình thích nghi tỏ ra chậm hơn. Thật ra, tốc ñộ thích nghi là như nhau.
Tuy nhiên, khi bộ ñiều khiển mô hình ngược chưa kịp thích nghi với ñặc
tính ñộng học mới thì bộ ñiều khiển phụ PD ñã hỗ trợ rất nhiều trong việc
ñiều khiển ñối tượng, hạn chế phần lớn sai số ñiều khiển.
Như vậy, bộ ñiều khiển phụ PD ñã giúp cho việc ổn ñịnh hóa và nâng cao
chất lượng ñiều khiển của hệ thống.

Trang 407
Chương 3 ðiều khiển thích nghi

CÂU HỎI ÔN TẬP VÀ BÀI TẬP

1. Thế nào là ñiều khiển thích nghi ?


2. Tại sao phải ñiều khiển thích nghi ?
3. Lưu ñồ giải thuật thiết kế luật MIT?
4. Xét tính ổn ñịnh của vòng ñiều khiển thích nghi trong ví dụ 3.4, ứng
dụng Matlab mô phỏng kết quả thu ñược trong hai trường hợp:
1. Sử dụng luật MIT.
2. Sử dụng luật hiệu chỉnh bổ sung.
5. Hệ thích nghi mô hình tham chiếu MRAS ?
- Sơ ñồ nguyên lý.
- Nội dung phương pháp gradient và lưu ñồ giải thuật.
6. Ứng dụng Matlab mô phỏng ví dụ 3.2: MRAS cho hệ bậc nhất.
7. Thiết kế MRAS dùng lý thuyết ổn ñịnh Lyapunov.
8. Thế nào là thiết kế bộ ñiều khiển hồi tiếp tuyến tính ngõ ra?
9. Xét hệ thống bậc 2 không dao ñộng có hàm truyền ñạt như sau:
k
G ( s) =
s(a0 + a1s + s2 )
Trong ñó:
a0 , a1 , k là những tham số (dương) chưa biết và phụ thuộc vào t. Ta ñiều
khiển ñối tượng này bằng bộ PID tự chỉnh gián tiếp và một bộ tiền xử lý ñể
làm giảm ñộ vọt lố của hệ kín.
1. Thiết kế cơ cấu chỉnh ñịnh các tham số cho hai bộ ñiều khiển trên.
2. Xác ñịnh các giả thiết cần phải có về tốc ñộ thay ñổi các tham số
a0 , a1 , k (nhanh/chậm như thế nào) ñể hệ thống thích nghi trên làm việc ñạt
chất lượng yêu cầu?
10. Xét ñối tượng bất ñịnh có hàm truyền:
k Y ( s)
G ( s) = =
1 + Ts U (s)
Trong ñó: k, T là hai hằng số dương chưa biết.
Thiết kế bộ ñiều khiển thích nghi ngõ ra u = − kx
Với x là biến trạng thái

Trang 408
Chương 3 ðiều khiển thích nghi

x1 = y
x2 = x&1 = y&
Sao cho hệ kín có hàm truyền là:
1
Gk (s) =
1 + 3s
11. Ứng dụng Matlab mô phỏng ví dụ 3.9 và ví dụ 3.10 dùng lý thuyết ổn
ñịnh Lyapunov.
12. Bộ tự chỉnh ñịnh STR gián tiếp.
13. Ứng dụng Matlab mô phỏng ví dụ 3.13: Bộ tự chỉnh ñịnh gián tiếp với
nhiễu xác ñịnh.
14. Dùng Matlab mô phỏng ví dụ 3.14: Bộ tự chỉnh ñịnh gián tiếp với nhiễu
ngẫu nhiên.
15. Bộ tự chỉnh ñịnh STR trực tiếp.
16. ðiều khiển dự báo thích nghi.
17. So sánh giữa MRAS và STR.
28. Chỉnh ñịnh tự ñộng.
19. Lịch trình ñộ lợi.
20. Dùng Matlab mô phỏng ví dụ 3.11 ñể kiểm ñịnh lại kết quả hình 3.19.
21. Ứng dụng Matlab mô phỏng ví dụ 3.12: Tay máy hai khớp nối
22. Dùng Matlab mô phỏng ví dụ 3.19: Bộ ñiều khiển mờ thích nghi gián
tiếp cho hệ con lắc ngược.
23. Dùng Matlab mô phỏng ví dụ 3.20: Bộ ñiều khiển mờ thích nghi trực
tiếp.
24. Cho quá trình ñược mô tả bởi:
50
G ( s) =
s(s + 4)
Và có chỉ tiêu chất lượng như sau:

∫ (( y − u ) )

2
c + ρ u2 dt
0

Biết rằng, luật ñiều khiển có dạng:


u(t ) = −s0 ( y − uc )

Trang 409
Chương 3 ðiều khiển thích nghi

Hay
s0 p + s1
u(t ) = − ( y − uc )
p + r1
Sử dụng phương pháp gradients tối ưu hóa một cách chính xác các thông số
của hệ thống từ mô hình ước lượng quá trình.
25. Cho quá trình ñược mô tả bởi:
x& = A(θ ) x + B(θ )uc
y = C (θ ) x
Và mô hình kèm theo là:
x& m = Am xm + Bm uc
y m = Cm x m
Giả sử rằng: bậc của quá trình và bậc của mô hình kèm theo là giống nhau.
Và tất cả các trạng thái ñều ổn ñịnh.
(a) Tìm ñiều kiện ñể có thể ñạt ñược các trạng thái trong mô hình hoàn
hảo kèm theo.
(ñặt e = x – xm )
(b) Sử dụng lý thuyết Lyapunov ñể ñạt ñược cơ cấu chỉnh ñịnh ổn ñịnh
(xác ñịnh A& (θ ) và B& (θ ) )
(Gợi ý:
Sử dụng hàm Lyapunov sau:
V = eT Pe + tr ( A − Am )T Qa ( A − Am ) + tr (Bm − B)T Qb ( Bm − B)
Trong ñó:
e = x − xm ).

Trang 410
Chương 4 : ðiều khiển bền vững

Chương 4

ðIỀU KHIỂN BỀN VỮNG

4.1 Giới thiệu


4.1.1 Khái niệm ñiều khiển bền vững
Hệ thống ñiều khiển bền vững làm cho chất lượng của sản phẩm luôn ổn
ñịnh, không phụ thuộc vào sự thay ñổi của ñối tượng cũng như của nhiễu tác
ñộng lên hệ thống. Mục ñích của ñiều khiển bền vững là thiết kế các bộ ñiều
khiển K duy trì ổn ñịnh bền vững không chỉ với mô hình danh ñịnh của ñối
tượng (P0) mà còn thỏa với một tập mô hình có sai số ∆ so với mô hình
chuẩn ( P∆ ).

P0 :Mô hình chuẩn (mô hình danh


ñịnh)
P∆ :Mô hình thực tế với sai lệch
∆ so với mô hình chuẩn

Hình 4.1 : Mô hình ñiều khiển bền vững

Cho tập mô hình có sai số P∆ và một tập các chỉ tiêu chất lượng, giả sử
P0 ∈ P∆ là mô hình danh ñịnh dùng ñể thiết kế bộ ñiều khiển K.Hệ thống
hồi tiếp vòng kín ñược gọi là có tính :
- Ổn ñịnh danh ñịnh: nếu K ổn ñịnh nội với mô hình danh ñịnh P0
- Ổn ñịnh bền vững: nếu K ổn ñịnh nội với mọi mô hình thuộc P∆
- Chất lượng danh ñịnh: nếu các mục tiêu chất lượng ñược thỏa ñối với mô
hình danh ñịnh P0

Trang 411
Chương 4 : ðiều khiển bền vững

- Chất lượng bền vững: nếu các mục tiêu chất lượng ñược thỏa ñối với mọi
mô hình thuộc P∆
Mục tiêu bài toán ổn ñịnh bền vững là tìm bộ ñiều khiển không chỉ ổn ñịnh
mô hình danh ñịnh P0 mà còn ổn ñịnh một tập các mô hình có sai số P∆
4.1.2 Chuẩn của tín hiệu
4.1.2.1 Khái niệm chuẩn
Trong ñiều khiển nói riêng cũng như trong các công việc có liên quan ñến
tín hiệu nói chung,thông thường ta không làm việc chỉ riêng với một tín hiệu
hoặc một vài tín hiệu ñiển hình mà ngược lại phải làm việc với một tập gồm
rất nhiều các tín hiệu khác nhau. Khi phải làm việc với nhiều tín hiệu khác
nhau như vậy chắc chắn ta sẽ gặp bài toán so sánh các tín hiệu ñể chọn lọc
ra ñược những tín hiệu phù hợp cho công việc.
Các khái niệm như tín hiệu x1(t) tốt hơn tín hiệu x2(t) chỉ thực sự có nghĩa
nếu như chúng cùng ñược chiếu theo một tiêu chuẩn so sánh nào ñó. Cũng
như vậy nếu ta khẳng ñịnh rằng x1(t) lớn hơn x2(t) thì phải chỉ rõ phép so
sánh lớn hơn ñó ñược hiểu theo nghĩa nào, x1(t) có giá trị cực ñại lớn hơn ,
có năng lượng lớn hơn hay x1(t) chứa nhiều thông tin hơn x2(t)…..Nói một
cách khác ,trước khi so sánh x1(t) với x2(t) chúng ta phải gắn cho mỗi một
tín hiệu một giá trị ñánh giá tín hiệu theo tiêu chuẩn so sánh ñược lựa chọn .
ðịnh nghĩa: Cho một tín hiệu x(t) và một ánh xạ x(t) →||x(t)|| ∈ R+ chuyển
x(t) thành một số thực dương ||x(t)||.Số thực dương này sẽ ñược gọi là chuẩn
của x(t) nếu nó thỏa mãn:
a. ||x(t)|| ≥ 0 và ||x(t)|| = 0 khi và chỉ khi x(t) =0 (4.1)
b. ||x(t)+y(t)|| ≤ ||x(t)|| + ||y(t)|| ∀ x(t), y(t) (4.2)
c. ||ax(t)|| = |a|.||x(t)|| ∀ x(t) và ∀a ∈ R . (4.3)
4.1.2.2 Một số chuẩn thường dùng trong ñiều khiển cho một tín hiệu x(t):

- Chuẩn bậc 1: || x(t ) ||1 = ∫ | x(t ) |dt (4.4)
−∞

∫ | x(t ) |
2
- Chuẩn bậc 2: || x(t ) || 2 = dt . (4.5)
−∞

Trang 412
Chương 4 : ðiều khiển bền vững

Bình phương chuẩn bậc hai chính là giá trị ño năng lượng của tín hiệu x(t).

-Chuẩn bậc p: || x(t ) || p = ∫ | x(t ) | với p ∈ N (4.6)
p
p dt
−∞

- Chuẩn vô cùng: || x(t ) || ∞ = sup | x(t ) | (4.7)


t

ñây là biên ñộ hay ñỉnh của tín hiệu


Khái niệm chuẩn trong ñịnh nghĩa trên không bị giới hạn là chỉ cho một tín
hiệu x(t) mà còn ñược áp dụng ñược cho cả vector tín hiệu gồm nhiều phần
tử và mỗi phần tử lại là một tín hiệu.
Xét một vector tín hiệu:
 x1 (t ) 
 
x(t) = M 
 x (t ) 
 n 
- Chuẩn 1 của vector x:
n
x 1 = ∑ xi (4.8)
i =1

- Chuẩn 2 của vector x:


n

∑x
2
x 2
= i (4.9)
i =1

- Chuẩn vô cùng của vector x:


x ∞
= max xi (4.10)
i =1, 2 ,...,n

4.1.2.3 Quan hệ của chuẩn với ảnh Fourier và ảnh Laplace:


ðể phục vụ mục ñích sử dụng khái niệm chuẩn vào ñiều khiển ,ta cần quan
tâm tới mối liên quan giữa chuẩn tín hiệu x(t) là ||x(t)|| với ảnh Fourier
X(j ω ) cũng như ảnh Laplace X(s) của nó.

Trang 413
Chương 4 : ðiều khiển bền vững

ðịnh lí 4.1: (Parseval) Chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier
X(j ω ) của nó có quan hệ :
∞ ∞
1
|| x(t ) || 22 = ∫ | x(t ) |2 dt = ∫ | X ( jω ) |
2
dω (4.11)
−∞
2π −∞

Cho tín hiệu nhân quả causal x(t). Gọi X(s) là ảnh Laplace của nó .Giả sử
rằng X(s) có dạng thực -hữu tỷ với bậc của ña thức tử số không lớn hơn bậc
ña thức mẫu số ,tức là:
B( s ) b0 + b1 s + ..... + bm s m
X (s) = = với m < n (4.12)
A( s ) a0 + a1 s + ..... + an s n
ðịnh lí 4.2: Xét tín hiệu nhân quả causal x(t) có X(s) dạng (4.12) .ðể chuẩn
bậc 1 của x(t) là một số hữu hạn ||x(t)||1= K < ∞ thì ñiều kiện cần và ñủ là tất
cả các ñiểm cực của X(s) phải nằm bên trái trục ảo (có phần thực âm) .
4.1.3 ðại số ma trận
4.1.3.1 Một số ma trận thường gặp:
- Một ma trận A=(aij) có số hàng bằng số cột ñược gọi là ma trận vuông.
ðường chéo nối các phần tử aii trong ma trận vuông ñược gọi là ñường chéo
chính .ðường chéo còn lại ñược gọi là ñường chéo phụ.
 a11 a12 L a1n 
a a22 L a2 n 
A= 
21
(4.13)
 M M M M 
 
an1 a n 2 L ann 

- Một ma trận vuông A=(aij) có aij = 0 khi i ≠ j ,tức là các phần tử không
nằm trên ñường chéo chính ñều bằng 0, ñược gọi là ma trận ñường chéo. Ma
trận ñường chéo ñược ký hiệu bởi:
a11 0 L 0
0 a 22 L 0 
A=  = diag(aij) (4.14)
 M M M M 
 
0 0 L ann 

Trang 414
Chương 4 : ðiều khiển bền vững

1 0 L 0
0 1 L 0
- Ma trận ñường chéo I = diag(1) =  gọi là ma trận ñơn vị.
M M M M
 
0 0 L 1
- Ma trận vuông A=(aij) có aij = 0 khi i > j (hoặc i < j) ñược gọi là ma trận
tam giác
+ Ma trận tam giác dưới
 a11 0 L 0
a a 22 L 0 
A=  21 (4.15)
 M M M M 
 
an1 an 2 L a nn 

+ Ma trận tam giác trên


a11 a12 L a1n 
0 a 22 L a2 n 
A=  (4.16)
 M M M M 
 
0 0 L ann 

4.1.3.2 Các phép tính về ma trận:


- Phép cộng / trừ: Cho hai ma trận A=(aij) và B=(bij) cùng có m hàng và n
cột .Tổng hay hiệu A ± B = C =(cij) của chúng ñược ñịnh nghĩa là một ma
trận cũng có m hàng và n cột với các phần tử
cij = aij + bij i=1,2,…..,m và j=1,2,…..,n.
- Phép nhân với số thực: Cho ma trận A=(aij) có m hàng và n cột và một số
vô hướng thực(phức) x tùy ý .Tích B = xA = Ax = (bij) ñược hiểu là ma trận
cũng có m hàng và n cột với các phần tử
Bij = x.aij i=1,2,….m và j=1,2,…..,n
- Phép chuyển vị: Ma trận chuyển vị của ma trận A=(aij) với m hàng và n cột
là ma trận AT = (aji) có n hàng và m cột ñược tạo từ ma trận A qua việc hoán
chuyển hàng thành cột và ngược lại cột thành hàng.
- Phép nhân ma trận: Cho ma trận A=(aik) có m hàng và p cột và ma trận
B=(bkj) có p hàng và n cột ,tức là :

Trang 415
Chương 4 : ðiều khiển bền vững

+ A=(aik) i=1,2,....,m và k=1,2,….,p


+ B=(bkj) k=1,2,….,p và j=1,2,…..,n
Tích AB = C =(cij) của chúng là một ma trận có m hàng và n cột với các
phần tử
p
Cij = ∑a
k =1
ik bkj

Một ma trận vuông A ∈ R n×n ñược gọi là ma trận trực giao nếu ATA=AAT=I
4.1.3.3 Hạng của ma trận:
Cho n vector vi i=1,2,…,n Chúng sẽ ñược gọi là ñộc lập tuyến tính nếu ñẳng
thức a1v1+a2v2+…….+anvn=0 trong ñó ai là những số thực (hoặc phức) sẽ
ñúng khi và chỉ khi a1 = a2 = …..=an = 0
Xét một ma trận A=(aij) bất kì có m hàng và n cột .Nếu trong số m vector
hàng có nhiều nhất p ≤ m vector ñộc lập tuyến tính và trong số n vector cột
có nhiều nhất q ≤ n vector ñộc lập tuyến tính thì hạng ma trận ñươc hiểu là:
Rank(A) = min{p,q}
Một ma trận vuông A kiểu (n × n) sẽ ñược gọi là không suy biến nếu
Rank(A)=n .Ngược lại nếu Rank(A) <n thì A ñược nói là ma trận suy biến
Hạng ma trận có các tính chất sau:
- Rank(A) = min{p,q} (4.17)
- Rank(AB) ≤ rank(A) và rank(AB) ≤ rank(B) (4.18)
- Rank(A + B) ≤ rank(A) + rank(B) (4.19)
- Nếu B không suy biến thì rank(AB) = rank(B) (4.20)
4.1.3.4 Ma trận nghịch ñảo:
Cho ma trận A=(aij),i=1,2,…,m ; j=1,2,…,n,trong ñó aij là những số thực
(hoặc phức),nói cách khác A ∈ Rm × n(hoặc A ∈ Cm × n ).Nếu tồn tại một ma
trận B thỏa mãn :
AB = BA = I (ma trận ñơn vị) (4.21)
Thì ma trận B ñược gọi là ma trận nghịch ñảo của A và ký hiệu là B = A-1.

Trang 416
Chương 4 : ðiều khiển bền vững

Do phải tồn tại cả hai phép nhân AA-1 và A-1A cho ra kết quả có cùng kiểu
nên ma trận A phải là một ma trận vuông,tức là phải có m = n.Hơn nữa do
det(I) = 1 ≠ 0 nên:
det(A)det(A-1) ≠ 0 => det(A) ≠ 0 và det(A-1) ≠ 0. (4.22)
Vậy A phải là ma trận không suy biến.
Ma trận nghịch ñảo A-1 của A có tính chất sau:
- Ma trận nghịch ñảo A-1 của A là duy nhất (4.23)
- Tập hợp tất cả các ma trận vuông cùng kiểu và không suy biến cùng với
phép nhân ma trận tạo thành một nhóm (không giao hoán). (4.24)
a b  1  d − b
- Nghịch ñảo ma trận kiểu (2 × 2): A −1 =   =   (4.25)
 c d  det( A) − c a 
- (AB)-1 = B-1A-1 (4.26)
- (A-1)T = (AT)-1 (4.27)
1
- Nếu A = diag(ai) và không suy biến thì A-1 = diag   (4.28)
 ai 
Aadj
- A-1 = (4.29)
det( A)
trong ñó Aadj là ma trận có các phần tử a i j = (-1)i+jdet(Aij) với Aij là ma trận
thu ñược từ A bằng cách bỏ ñi hàng thứ j và như cột thứ i.
- Cho ma trận A ∈ Rn × n không suy biến . Nếu U ∈ Rn × m và V ∈ Rn × m là
hai ma trận làm cho (I+VTA-1U) cũng không suy biến thì
(A+UVT)-1 = A-1 – A-1U(I+VTA-1U)-1VTA-1 (4.30)
 A1 A2 
- Cho ma trận vuông A =  không suy biến,trong ñó A1,A2,A3,A4
 A3 A4 
cũng là các ma trận.
Nếu A1 không suy biến và B = A4 – A3A1-1A2 cũng không suy biến thì
−1
A A2   A1 −1 + A −11 A2 B −1 A3 A1 −1 − A1 A2 B −1 
−1

A = 1
−1
=  (4.31)
 A3 A4   − B −1 A3 A1
−1
B −1 

Trang 417
Chương 4 : ðiều khiển bền vững

Nếu A4 không suy biến và C = A1 – A2A4-1A3 cũng không suy biến thì
−1
A A2   C −1 − C −1 A2 A4
−1

A = 1
−1
= −1 
(4.32)
 A3 A4  −1
− A4 A3 AC
−1 −1 −1
A4 + A4 A3 C −1 A2 A3 
4.1.3.5 Vết của ma trận:
Cho ma trận vuông A=(aij) ,i,j=1,2,……,n kiểu (nxn).Vết của A ñược hiểu
là tổng giá trị các phần tử trên ñường chéo chính của A và ñược ký hiệu
bằng trace(A):
m
trace= ∑ aii (4.33)
i =1

Vết của ma trận có các tính chất:


a. trace(AB) = trace(BA) (4.34)
-1
b. trace(S AS) = trace(A) với S là ma trận không suy biến bất kì (4.35)
4.1.3.6 Giá trị riêng và vector riêng:
Số thực λ ñược gọi là giá trị riêng và vector x ñược gọi là vector riêng bên
phải ứng với giá trị riêng λ của A thỏa mãn:
Ax = λ x ∀ x (4.36)
⇔ (A - λ I)x = 0 ∀ x (4.37)
Giá trị riêng và vector riêng của ma trận A có những tính chất sau:
a. Hai ma trận tương ñương A và S-1AS luôn cùng giá trị riêng, nói cách
khác giá trị riêng của ma trận bất biến với phép biến ñổi tương ñương:
det(A- λ I)=det(S-1AS- λ I) (4.38)
b. Các giá trị riêng của ma trận bất biến với phép chuyển vị, tức là:
det(A- λ I)=det(AT- λ I) (4.39)
c. Nếu A không suy biến thì AB và BA có cùng các giá trị riêng ,tức là:
det(AB- λ I)=det(BA- λ I) (4.40)
T
d. Nếu A là ma trận ñối xứng (A =A) thì các vector riêng ứng với những giá
trị riêng khác nhau sẽ trực giao với nhau
Trong Matlab ,sử dụng hàm eig(A) ñể tìm ma trận riêng và vector riêng.

Trang 418
Chương 4 : ðiều khiển bền vững

4.1.3.7 Tính toán ma trận:


Cho ma trận X = (xij) ∈ Cm × n là một ma trận thực (hoặc phức) và F(X) ∈ C
là một vô hướng thực hoặc phức của X .ðạo hàm của F(X) ñối với X ñược
ñịnh nghĩa

∂  ∂ 
F(X )=  F ( X ) (4.41)
∂X  ∂xij 
Cho A và B là những ma trận phức với không gian tương thích .Một số công
thức ñạo hàm :


Trace ( AXB ) = AT B T (4.42)
∂X

Trace ( X k
) = k(X k −1 T
) (4.43)
∂X

Trace ( XBX T ) = 2 XB (B = BT ) (4.44)
∂X

( X T AX ) = AX + A T X (4.45)
∂X

Trace ( AX T B ) = BA (4.46)
∂X
4.1.3.8 Chuẩn của ma trận:
Người ta cần ñến chuẩn của ma trận là nhằm phục vụ việc khảo sát tính giải
tích của nó.Có nhiều chuẩn khác nhau cho một ma trận A=(aij)
,i=1,2,…,m;j=1,2,…,n.
Những chuẩn thông thường ñược sử dụng:
- Chuẩn 1 của ma trận A
m
A 1 = max ∑ aij (4.47)
1≤ j ≤ n
i =1

- Chuẩn 2 của ma trận A

A 2 = max λi ( A* A) (4.48)
1≤i ≤ n

- Chuẩn vô cùng của ma trận A

Trang 419
Chương 4 : ðiều khiển bền vững

n
A ∞ = max ∑ aij (4.49)
1≤i ≤ m
j =1

- Chuẩn Euclide của ma trận A (chuẩn Frobenius)


2
A F
= ∑∑ ai j
ij = trace( AT A) (4.50)

với A* là ma trận chuyển vị và lấy liên hiệp. λi ( A* A) là trị riêng của ma


trận A* A là một số thực không âm.
4.1.4 Trị suy biến của ma trận – ñộ lợi chính(Principal gain)
Trị suy biến của ma trận A(m x l) ñược ký hiệu là σ i (A) ñược ñịnh nghĩa
như sau:

σ i ( A) = λi ( A* A) i = 1,2,...k (4.51)

với k = min{m, l} .
Nếu chúng ta biểu diễn ma trận A dưới dạng A(s) và ñặt s = jω
(0 ≤ ω < ∞) , thì trị suy biến của A( jω ) là một hàm của ω và ñược gọi là
ñộ lợi chính của A(s). Ở ñây chúng ta giả sử rằng σ i ñược sắp xếp theo thứ
tự sao cho σ i ≥ σ i +1 . Như vậy, σ 1 là trị suy biến lớn nhất và σ k là trị suy
biến nhỏ nhất. Ký hiệu σ là trị suy biến lớn nhất và σ là trị suy biến nhỏ
nhất.
Ta có:

σ ( A) = max σ i ( A) = max λi ( A* A)

= A2 (4.52)

Ax 2
với A 2 = sup .
x 2

ðộ lợi của hệ ña biến nằm giữa ñộ lợi chính lớn nhất và nhỏ nhất.
Trong Matlab tìm trị suy biến của ma trận A dùng lệnh svd(A)
Ví dụ: Cho ma trận A:

Trang 420
Chương 4 : ðiều khiển bền vững

9 4
>> A = 6 8  ;
2 7

>> S =svd(A)
S=
[14.9359
5.1883]
S: vector của các giá trị suy biến của ma trận A
121 98 
A* A =  
 98 129
λ2 − 250λ + 6005 = 0
λ1, 2 = +125 ± 98.082

σ ( A) = max 223.082 = 14.9359

σ ( A) = 26.918 = 5.1883
Ý nghĩa vật lý của σ , σ : với mọi giá trị tần số ω giá trị suy biến nhỏ nhất
phải thỏa ñiều kiện của tiêu chuẩn tối ưu LQ: σ [ I + KG ( jω )] ≥ 1

Im

1 Re
0 ω=∞ ω =0

σ [1 + KG ( jω )]

Biểu ñồ phân bố cực cho tiêu chuẩn tối ưu LQ

Trang 421
Chương 4 : ðiều khiển bền vững

Im

1 Re
0 ω =∞ ω =0

PM
σ [1 + KG ( jω )]

Xác ñịnh ñộ dữ trữ pha của hệ ña biến

Im

1 1 Re
1
0 60

σ [1 + KG ( jω )]

ðộ dữ trữ pha ñảm bảo của LQR

Trang 422
Chương 4 : ðiều khiển bền vững

4.1.5 Ổn ñịnh nội


Ổn ñịnh nội là yêu cầu cơ bản ñối với một hệ thống hồi tiếp thực. Ý nghĩa
của ổn ñịnh nội là khi ñầu vào hệ thống bằng không thì tất cả các trạng thái
hệ thống ñều phải về không từ mọi giá trị ban ñầu. Mọi hệ thống tự ñộng
ñều phải bảo ñảm ổn ñịnh nội mới hoạt ñộng ñược.

+ e1
w1 G
+
+
K + w2
e2

Hình 4.2 : Sơ ñồ hệ thống dùng ñể phân tích ổn ñịnh nội

ðịnh nghĩa :
Hệ hồi tiếp hình 4.2 ñược gọi là ổn ñịnh nội nếu tất cả các hàm truyền ñạt từ
w1, w2 ñến e1, e2 ñều ổn ñịnh.
ðiều kiện ổn ñịnh nội chặt hơn ñiều kiện ổn ñịnh dựa trên hàm truyền vào-
ra thông thường, vì nó tránh việc khử các cực và zero không ổn ñịnh giữa
các khâu liên tiếp nhau. Khi thành lập hàm truyền vào-ra, có thể xảy ra hiện
tượng khử cực và zero không ổn ñịnh của các khâu liên tiếp nhau. Như vậy,
ñiều kiện ổn ñịnh nội bảo ñảm các tín hiệu bên trong hệ thống ñều hữu hạn
khi tín hiệu vào là hữu hạn.
Ví dụ, ta khảo sát ñiều kiện ổn ñịnh nội của hệ thống hình 4.2:

e1 = w1 + Ke2 = w1 + Kw2 + KGe1


⇒ e1 = ( I − KG ) −1 w1 + ( I − KG ) −1 Kw2
e2 = w2 + Ge1 = w2 + Gw1 + GKe2
⇒ e2 = ( I − GK ) −1 Gw1 + ( I − GK ) −1 w2

Trang 423
Chương 4 : ðiều khiển bền vững

 e   ( I − KG ) −1 ( I − KG ) −1 K   w1 
Suy ra:  1  =  −1 −1   
e2  ( I − GK ) G ( I − GK )   w2 

ðiều kiện ổn ñịnh nội của hệ là các hàm truyền ( I − KG )−1 , ( I − KG )−1 K ,

( I − GK ) −1 G , ( I − GK )−1 ñều ổn ñịnh.

4.1.6 ðịnh lý ñộ lợi nhỏ (Small Gain Theorem)


Cho hệ thống ñược biểu diễn như hình 4.3: Gọi λi là trị riêng của G

r u y
G
-

Hình 4.3 : Hệ thống hồi tiếp vòng kín


ðịnh lý ñộ lợi nhỏ ñược phát biểu như sau:
Giả thiết rằng G(s) ổn ñịnh, ρ(G(jω)) là bán kính phổ của G(jω). Hệ thống
vòng kín ổn ñịnh nếu ρ (G ( jω )) = max( λi ) < 1 , hoặc G( jω ) ∞ < 1, ∀ω

ðối với hệ SISO thì


ρ (G ( jω )) = G ( jω ) < 1 (4.53)
ðịnh lý ñộ lợi nhỏ chỉ là ñiều kiện ñủ ñể xét ổn ñịnh của hệ thống. ðiểm
mạnh của ñịnh lí này là nó không yêu cầu những thông tin chi tiết về hệ
thống.Vì vậy nó không chỉ ứng dụng ñược cho hệ thống tuyến tính bất biến
theo thời gian mà còn ứng dụng ñược cho hệ thống phi tuyến, thay ñổi theo
thời gian.
4.1.7 Ổn ñịnh bền vững

4.1.7.1 ðịnh lý ổn ñịnh bền vững


ðây là mô hình cơ bản dùng ñể phân tích tính ổn ñịnh bền vững của một hệ
thống. Nếu hệ danh ñịnh ổn ñịnh thì M ổn ñịnh và ∆ là sai số có thể làm
cho hệ thống mất ổn ñịnh. ðịnh lý sau thiết lập ñiều kiện của M ñể cho hệ
thống vẫn ổn ñịnh dưới ảnh hưởng của ∆

Trang 424
Chương 4 : ðiều khiển bền vững

v w

Hình 4.4 : Sơ ñồ cấu trúc phân tích ổn ñịnh bền vững


ðịnh lý ổn ñịnh bền vững:
Giả sử M và ∆ ổn ñịnh, hệ thống vòng kín hình 4.4 sẽ ổn ñịnh khi và chỉ khi
biểu ñồ cực của ñường cong Nyquist det(I-M∆) không bao ñiểm gốc. Khi ñó
hệ thống vòng kín sẽ ổn ñịnh bền vững với mọi ∆ (σ (∆) ≤ 1) nếu và chỉ nếu
khi một trong các ñiều kiện sau thỏa mãn:
a. Det ( I − M∆( jω )) ≠ 0 ∀ω , ∀∆ (σ ≤ 1) (4.54)

b. ρ ( M∆( jω )) < 1 ∀ω , ∀∆ (σ ≤ 1) (4.55)

c. M ∞
= σ ( M ( jω )) < 1 ∀ω (4.56)

4.1.7.2 ðiều kiện ổn ñịnh bền vững ñối với sai số cộng:
Với ∆ A ( s ) = δ A ( s )∆( s ), σ (∆( jω )) ≤ 1 ∀ω , (4.57)
v w

M
δA
+
K G
-

Hình 4.5 : Sai số cộng


Ta có: v( s ) = − K ( s )[δ A ( s ) w( s ) + G ( s )v( s )] (4.58)

Trang 425
Chương 4 : ðiều khiển bền vững

hay
v( s ) = −[ I + K ( s )G ( s )]−1 K ( s )δ A ( s ) w( s ) (4.59)
vậy
K ( s )δ A ( s )
M ( s) = − (4.60)
[ I + K ( s )G ( s )]

Kết luận: Hệ thống vòng kín hình 4.5 ổn ñịnh bền vững khi và chỉ khi:
K ( s )δ A ( s )
σ ( jω ) =||M(s)||∞= <1 (4.61)
[ I + K ( s )G ( s )] ∞

4.1.7.3 ðiều kiện ổn ñịnh bền vững ñối với sai số nhân ở ñầu ra

v w

M
δ0
+
K G
-

Hình 4.6 : Sai số nhân ở ñầu ra

Với ∆ O ( s) = δ O ( s)∆( s), σ (∆( jω )) ≤ 1 ∀ω , (4.62)


Ta có:
v( s ) = −G ( s ) K ( s )[δ O ( s ) w( s ) + v( s )] (4.63)
hay
v( s ) = −[ I + G ( s ) K ( s )]−1 G ( s ) K ( s )δ O ( s ) w( s ) (4.64)

Trang 426
Chương 4 : ðiều khiển bền vững

vậy
G ( s ) K ( s )δ O ( s )
M =− (4.65)
I + G( s) K ( s)
Kết luận: Hệ thống vòng kín hình 4.6 ổn ñịnh bền vững khi và chỉ khi:

G ( s ) K ( s )δ O ( s )
<1 (4.66)
I + G(s) K (s) ∞

4.2 Phương pháp LQG (Linear Quadratic Gaussian)


4.2.1 ðặt vấn ñề
Cho hệ thống
x& (t ) = Ax(t ) + Bu (t ) + γw(t )
y (t ) = Cx(t ) + v(t )
(4.67)
z (t ) = Dx(t )
t∈R

Ngõ ra y là ngõ ra hồi tiếp và ño ñược. Ngõ ra z là ñiều khiển ñược. Tín
hiệu nhiễu w là nhiễu hệ thống và v là nhiễu ño .
Tín hiệu v và w là những quá trình nhiễu trắng .Trạng thái ban ñầu của x(0)
ñược giả sử là một vector ngẫu nhiên .
Biến trạng thái x(t)∈ Rn, ngõ ra ño ñược y(t) ∈ Rp và ngõ ra ñiều khiển ñược
z(t) ∈ Rm là những quá trình ngẫu nhiên. Biểu thức sai số toàn phương:
z T (t )Qz (t ) + u T (t ) Ru (t ) t≥0 (4.68)

là một quá trình ngẫu nhiên.


Vấn ñề của ñiều khiển hệ thống là giá trị mong ñợi của tích phân
T

∫ E [z (t )Qz (t ) + u T (t ) Ru (t )]dt (4.69)


T

là nhỏ.

Trang 427
Chương 4 : ðiều khiển bền vững

ðây là vấn ñề ñiều khiển tuyến tính nhiễu loạn. Khoảng thời gian [0 T] là
xác ñịnh nhưng thật sự chúng ta xem xét trường hợp T → ∞ . Tại bất kỳ thời
gian t toàn bộ tín hiệu ño ñược ở quá khứ ñược giả sử có giá trị cho hồi
tiếp. Hình (4.7) làm rõ trường hợp này :

z
u
SYSTEM
+
+ y
v

CONTROLLER

Hình 4.7 : Hồi tiếp LQG


4.2.2 Bộ quan sát
Xem xét hệ thống quan sát :
x& (t ) = Ax(t ) + Bu(t )
y(t ) = Cx(t ) (4.70)
n
x (t ) ∈ R
ðây là hệ thống (4.67) nhưng không có nhiễu hệ thống w và nhiễu ño v.
Trạng thái x của hệ thống (4.70) không thể sử dụng ñược trực tiếp bởi vì chỉ
ngõ ra y là ño ñược. Xây dựng lại trạng thái với sự chính xác tùy ý bởi việc
kết nối một bộ quan sát :

x&ˆ (t ) = Axˆ (t ) + Bu (t ) + L[ y (t ) − Cxˆ (t )] t ∈ R (4.71)


Tín hiệu xˆ (t ) là một ước lượng của trạng thái x(t). Nó thỏa mãn phương
trình vi phân trạng thái của hệ thống (4.70) với thành phần thêm vào
L [ y (t ) − Cxˆ (t )] . L là ma trận ñộ lợi quan sát cần ñược lựa chọn phù hợp. Sai
số quan sát y(t) − Cxˆ (t ) là sự khác nhau giữa ngõ ra ño ñược thực tế y(t) và

Trang 428
Chương 4 : ðiều khiển bền vững

ngõ ra yˆ (t ) = Cxˆ (t ) .Thành phần thêm vào L [ y (t ) − Cxˆ (t )] cung cấp một sự
ñiều chỉnh chủ ñộng ngay khi sai số của sự quan sát là khác 0.

u z
SYSTEM
y
+
L
-

SYSTEM
MODEL x̂

Hình 4.8 : Cấu trúc của một bộ quan sát

Hình (4.8) cho thấy cấu trúc của bộ quan sát .ðịnh nghĩa :
~
x (t ) = x(t ) − xˆ (t ) (4.72)
là sai số ước lượng trạng thái. Phương trình vi phân của ~
x nhận ñược sau
khi trừ (4.70) cho (4.71) :
x&% (t ) = ( A − LC ) x% (t ) t ∈ R (4.73)
Nếu hệ thống (4.70) ñược tìm thấy thì tồn tại ma trận ñộ lợi L mà sai số hệ
thống (4.73) là ổn ñịnh. Nếu sai số hệ thống là ổn ñịnh thì
x (t ) → 0 khi t → ∞ cho bất kỳ sai số ~
~ x (0). Vì vậy

xˆ (t ) t
→∞
→ x(t ) (4.74)
Trạng thái ước lượng hội tụ về trạng thái thực.
Trong Matlab dùng hai lệnh acker và place ñể tính ma trận L của khâu
quan sát trạng thái :
L= acker(AT,CT,p)
L= place(AT,CT,p)
AT : Chuyển vị của ma trận A
CT : Chuyển vị của ma trận C
p : Khai báo các ñiểm cực mong muốn

Trang 429
Chương 4 : ðiều khiển bền vững

4.2.3 Bộ lọc Kalman


4.2.3.1 ðặt vấn ñề:
Bộ lọc Kalman là một bộ quan sát ñược sử dụng cho các ứng dụng yêu cầu
xây dựng lại hệ phương trình trạng thái khi tính ñến ảnh hưởng của nhiễu ño
ñược.
Phương trình trạng thái của ñối tượng :
x& =Ax+Bu+ γ w (4.75)
y=Cx+v (4.76)
với trạng thái x(t) ∈ R n ,ngõ vào ñiều khiển u(t) ∈ R m , và ngõ ra ño lường
y(t) ∈ R p .Tín hiệu w(t) là nhiễu quá trình chưa biết trước tác ñộng làm nhiễu
hệ thống.Tín hiệu v(t) là một nhiễu ño không xác ñịnh ñược , làm suy giảm
việc ño lường chẳng hạn như nhiễu cảm biến.Giá trị ban ñầu x(0), nhiễu
w(t) hoặc v(t) không biết ñược chính xác.Giả sử x(0), w(t) và v(t) ñều trực
giao qua lại với nhau.

w(t) v(t)

u x& x y
B ∫ C

A Hệ thống

~
y
L
-
x&ˆ x̂ ŷ
B ∫ C

A Bộ lọc Kalman

Hình 4.9 : Bộ quan sát trạng thái của Kalman

Trang 430
Chương 4 : ðiều khiển bền vững

Gọi xˆ (t ) là ước lượng của x .


Phương trình trạng thái của khâu lọc Kalman :
xˆ& = Axˆ + Bu + L( y − yˆ )
(4.77)
yˆ = Cxˆ
Mục tiêu của thiết kế bộ lọc Kalman : Tìm ñộ lợi ước lượng L ñể có sự ước
lượng tối ưu trong sự hiện diện của nhiễu w(t) và v(t)
Sai số ước lượng: ~x (t ) = x(t ) − xˆ (t ) (4.78)
ðộ lợi L sẽ ñược chọn sao cho giá trị trung bình của sai số ước lượng toàn
phương là bé nhất .
4.2.3.2 Cơ sở toán học:
Lý thuyết xác suất:
Từ phương trình (4.75) ñược thêm vào bởi nhiễu quá trình, trạng thái x(t)
bây giờ cũng là một quá trình ngẫu nhiên như là y(t). ðể khảo sát những
ñặc tính thông thường của quá trình ngẫu nhiên cần nhắc lại một số khái
niệm lý thuyết xác suất (Papoulis 1984). Mặc dù w(t) và v(t) là những ñại
lượng ngẫu nhiên không biết ñược, nhưng cần biết một vài ñặc ñiểm ñể hỗ
trợ việc thiết kế các bộ ñiều khiển. Chẳng hạn như có thể biết ñược giá trị
trung bình hoặc tổng năng lượng của chúng.
Cho vector ngẫu nhiên z ∈ R n ,f z ( ξ ) là hàm mật ñộ xác suất (PDF) của z.
ðại lượng PDF ñặc trưng cho xác suất mà z lấy giá trị bên trong vùng vi
phân d ξ ñặt giữa ξ .
Giá trị mong muốn của hàm g(z) của vector ngẫu nhiên ñược xác ñịnh như
sau :

E {g (z )} = ∫ g (ξ ) ƒ( ξ )d ξ (4.79)
−∞

Giá trị trung bình hay mong muốn của z ñược xác ñịnh như sau:

E{z}= ∫ ξ ƒ z ( ξ )d ξ (4.80)
−∞

ñược ký hiệu bằng z . Chú ý rằng z ∈ R n .

Trang 431
Chương 4 : ðiều khiển bền vững

Hiệp phương sai của z ñược cho bởi


{
P z =E ( z − z )( z − z ) T } (4.81)

Chú ý rằng P z là ma trận hằng n×n


Phần quan trọng của vector ngẫu nhiên ñược ñặc trưng bởi Gaussian hoặc
nomal PDF
1 − −
− ( ξ − z ) T / 2 P −1 ( ξ − z ) / 2
ƒ z ( ξ )= e (4.82)
(2 ∏) n | Pz |

Trong trường hợp vô hướng n = 1 , (4.82) trở thành:


1 2
f z (ξ ) = e − (ξ − z ) / 2 Pz
(4.83)
2ΠPz

ñược minh họa ở hình 4.10 .Vì vậy những vector ngẫu nhiên lấy giá trị gần
với z có xác suất lớn nhất và xác suất sẽ giảm khi lấy giá trị xa z .Nhiều
biến ngẫu nhiên là Gaussian.
Nếu vector ngẫu nhiên là một hàm của thời gian ñược gọi là một quá trình
ngẫu nhiên ñược tượng trưng là z(t). Khi ñó PDF có thể thay ñổi theo thời
gian và chúng ta viết là ƒ z ( ξ ,t). ðiều ñó có thể tưởng tượng rằng PDF ở
hình 4.10 thay ñổi theo thời gian. Trong tình huống này, giá trị mong ñợi và
ma trận hiệp phương sai là những hàm thời gian vì thế chúng có thể biểu
diễn z (t) và P z (t).

fz( ξ )

Hình 4.10 : Gaussian PDF

Trang 432
Chương 4 : ðiều khiển bền vững

Nhiều quá trình ngẫu nhiên z(t) quan trọng có PDF bất biến theo thời gian
ðó là những quá trình tĩnh, thậm chí chúng là hàm thời gian ngẫu nhiên vẫn
có trị trung bình và hiệp phương sai là hằng số.
ðặc trưng cho liên hệ giữa hai quá trình ngẫu nhiên z(t) và x(t), có thể sử
dụng PDF kết hợp ƒ zx (ς , ξ , t1 , t 2 ) , tượng trưng cho xác xuất mà (z(t1), x(t2))
ở trong vùng vi phân d ς × d ξ ở giữa ( ς , ξ ). Giả sử rằng các quá trình z(t)
và x(t) là liên kết tĩnh , PDF kết hợp không là hàm của cả hai thời gian t 1 và
t 2 nhưng nó chỉ dựa vào sai biệt (t 1 - t 2 ).
Trong nhiều trường hợp tĩnh, giá trị mong muốn của hàm hai biến g(z,x)
ñược xác ñịnh bởi:
+∞
E {g ( z (t1 ), x(t 2 )) }= ∫ g( ς , ξ )ƒ zx ( ς , ξ ,t 1 - t 2 )d ς d ξ (4.84)
−∞

Ma trận tương quan chéo ñược xác ñịnh bởi


{
R zx ( τ )=E z (t + τ ) x T (t ) } (4.85)

Do ñó, ma trận tương quan chéo của hai quá trình không tĩnh mà ñược xác
ñịnh bởi
{
R zx (t, τ )=E z (t ) x T (τ )} (4.86)

Xem như z(t 1 ) và z(t 2 ) như là hai quá trình ngẫu nhiên của quá trình tĩnh,
hàm tự tương quan z(t) ñược xác ñịnh như sau:
{
R z ( τ )=E z (t + τ ) z T (t ) } (4.87)
Hàm tự tương quan ñem ñến cho ta vài thông tin quan trọng về quá trình
ngẫu nhiên z(t). Thí dụ như :
[{ }]
trace [R z (0)] =trace E z (t ) z T (t ) =E { z (t ) } (4.88)

tương ñương với tổng năng lượng của quá trình z(t).
Nếu
R zx (τ ) = 0 (4.89)

Trang 433
Chương 4 : ðiều khiển bền vững

z(t) và x(t) ñược gọi là trực giao với nhau.


Nếu
R z ( τ )=P δ (τ ) (4.90)
trong ñó P là ma trận hằng và δ (t) là xung Dirac, thì z(t) là trực giao với
z(t + τ ) với các giá trị τ ≠ 0. ðiều này có nghĩa là giá trị của quá trình z(t)
tại thời ñiểm t không có sự liên hệ với giá trị tại các thời ñiểm τ ≠ t. Vì vậy
z(t) ñược gọi là nhiễu trắng .Ví dụ như nhiễu nhiệt ở mạch ñiện nguyên
nhân vì sự chuyển ñộng nhiệt ở các electron ở ñiện trở .
Chú ý rằng Pδ(0) là hiệp phương sai của z(t). P ñược gọi là ma trận mật ñộ
phổ.Thỉnh thoảng nó cũng ñược xem như là ma trận hiệp phương sai

4.2.2.3 Thiết kế bộ lọc Kalman:

Giả sử x(0) có thể ñược thay thế bằng các ñại lượng biết trước x 0 (giá trị
trung bình của x(0)) và hiệp phương sai P 0 , có thể biểu diễn như sau :

x (0) ≈ (x 0 ,P 0 ) (4.91)
Như vậy không thể giả sử w(t) và v(t) có trị trung bình bằng 0 ñược. Giả sử
rằng nhiễu quá trình và nhiễu ño là nhiễu trắng, do vậy:
{ }
R w ( τ )=E w(t + τ ) wT (t ) = Wδ (τ ) (4.92)
Rv ( τ )=E {v(t + τ )v (t )} = Vδ (τ )
T
(4.93)

Ma trận mật ñộ phổ W và V sẽ ñược giả sử ñã biết trước.Theo tính chất của
hàm tự tương quan, W và V là bán xác ñịnh dương. Giả sử thêm rằng V là
không suy biến.Tóm lại, có thể giả sử rằng :
w(t) ≈ (0,W), W≥0 (4.94)
v(t) ≈ (0,V), V>0 (4.95)
Việc giả sử w(t) và v(t) là nhiễu trắng trong một vài ứng dụng có thể là xấu.
Thí dụ như nhiễu ở tần số thấp. Tuy nhiên, giả sử rằng w(t) không là nhiễu
trắng, có thể xác ñịnh ñược một hệ thống:

Trang 434
Chương 4 : ðiều khiển bền vững

.
x& 0 =A w x w +B w n (4.96)

w=C w x w +D w n (4.97)

có nhiễu trắng ngõ vào là n(t) và ngõ ra là w(t). Chúng ñược gọi là các bộ
lọc nắn nhiễu . Những ñặc tính ñộng này có thể kết hợp với phương trình
của ñối tượng (4.75), (4.76) ñể có ñược ñặc tính ñộng ñược hiệu chỉnh là:

 x&   A γC w   x   B  γDw 
 x&  = 0 A   x  + 0 u +  B  n (4.98)
 w  w  w     w

y= [C 0]  x  + v (4.99)
 x w 

Hệ thống ñiều chỉnh này có nhiễu quá trình n(t) là nhiễu trắng. Một thủ tục
tương tự có thể làm theo các bước như thế nếu v(t) không phải là nhiễu
trắng. Do ñó, có thể mô tả một hệ thống với nhiễu không phải nhiễu trắng
dưới dạng một hệ thống ñiều chỉnh với nhiễu quá trình và nhiễu ño lường là
nhiễu trắng.
Xác ñịnh hệ thống (4.96), (4.97) miêu tả nhiễu không phải là nhiễu trắng
w(t) (hoặc v(t)) dựa trên phân tích mật ñộ phổ của nhiễu w(t). Chi tiết xem
Lewis (1986 )
Bây giờ thiết kế bộ ước lượng cho hệ thống (4.75), (4.76) dưới những giả sử
ñã ñược liệt kê. Cho bộ quan sát có dạng như sau:
xˆ& = Axˆ + Bu + L( y − yˆ ) (4.100)

hoặc x&ˆ = ( A − LC ) xˆ + Bu + Ly (4.101)

Hàm thời gian x̂ (t) là ước lượng trạng thái và


ŷ = E {Cx + v} = C x̂ (4.102)
là ước lượng của ngõ ra y(t).
ðộ lợi của bộ ước lượng L phải ñược chọn ñể cung cấp ước lượng tối ưu
trong sự hiện diện của nhiễu w(t) và v(t). ðể chọn L, chúng ta sẽ phải xác
ñịnh sai số ước lượng:
~
x (t)=x(t)- x̂ (t) (4.103)

Trang 435
Chương 4 : ðiều khiển bền vững

Sử dụng( 4.75) và (4.100) sai số hệ thống là :


~
x& =(A-LC) ~
x + γ w-Lv

≡A0 ~
x + γ w-Lv (4.104)

chú ý rằng sai số hệ thống xảy ra khi có sự tham gia của nhiễu quá trình và
nhiễu ño lường . Ngõ ra của sai số hệ thống có thể ñược cho bởi ỹ=y- ŷ ñể:
ỹ=C ~x (4.105)
Hiệp phương sai của sai số ñược cho bởi:
P(t)=E ~
x~
{ }xT (4.106)
thay ñổi theo thời gian. Do ñó, ~ x (t) là quá trình ngẫu nhiên không tĩnh.
Hiệp phương sai của sai số là thước ño sự không chắc chắn trong ước lượng.
Những giá trị càng nhỏ cho P(t) ñồng nghĩa với việc ước luợng càng tốt hơn
vì những sai số ñược phân bố càng gần với trị trung bình bằng 0 nếu P(t) là
nhỏ hơn.
Nếu bộ quan sát là ổn ñịnh tiệm cận và w(t) và v(t) là quá trình tĩnh khi ñó
sai số ~
x (t) sẽ thực sự tiến ñến trạng thái ổn ñịnh với trị trung bình và hiệp
phương sai là hằng số. ðộ lợi L sẽ ñược chọn lựa ñể làm tối thiểu hiệp
phương sai cũa sai số P. Vì vậy, ñộ lợi tối ưu L sẽ là ma trận hằng của ñộ lợi
bộ quan sát
Trước khi xác ñịnh ñộ lợi tối ưu L, chúng ta sẽ tính toán giá trị trung bình và
hiệp phương sai của sai số ước lượng của ~ x (t). Sử dụng (4.104) và sự tuyến
tính của phép toán mong muốn:
{}
E ~x& = A E{~
0 x } + γE{w} − LE{v} (4.107)

d
Vì thế E {~
x }=A 0 E{~
x} (4.108)
dt
Do ñó, E {~
x }là lượng biến ñổi theo thời gian tuân theo phương trình vi phân
với ma trận hệ thống A .Nếu A =A-LC là ổn ñịnh thì E {~
0 0 x }luôn bền vững
tại giá tri tĩnh zero. Khi ñó
E{~x } = E{x}− E{xˆ} = E{x}− xˆ (4.109)
Theo trừơng hợp này ước lượng x̂ (t) tiến tới E{x(t)} .Như vậy ước lượng
này ñược cho là không lệch. Cũng như theo (4.109), giá trị trung bình của

Trang 436
Chương 4 : ðiều khiển bền vững

sai số ban ñầu ~ x (0) bằng với giá trị zero nếu như bộ quan sát (4.101) có giá
trị ñầu x̂ (0)= x0 với x 0 là giá trị trung bình của x(0)
Nếu như nhiễu quá trình w(t) hoặc nhiễu ño ñược v(t) có giá trị trung bình
không phải là zero thì theo (4.107) giá trị E {~ x } của trạng thái tĩnh cũng
không bằng zero. Trong trường hợp này x̂ (t) không ñến ñược ổn ñịnh tiệm
cận ñể ñạt ñược trạng thái thật x(t), nhưng có ñược một khoảng offset bằng
giá trị hằng- E {~
x }. Khi ñó trạng thái ước lượng là bị lệch.
ðể xác ñịnh P, chú ý rằng lời giải phương trình (4.104) ñược cho :
t t
x(t)=e A0 J x(0)- ∫ e A0 (t −τ ) Lv(τ )dτ + ∫ e A0 (t −τ )γ w(τ )dτ (4.110)
0 0

Tìm ma trận tương quan chéo R v~x (t,t) và R w~x (t,t) sử dụng (4.110) và giả sử
rằng x(0) (và cả ~
x (0)), w(t) và v(t) là trực giao. Do ñó

R v~x (t,t)=E v(t ) ~


{ } { }
t
x T (t ) =- ∫ E v(t )v T (τ ) LT e A0 ( t −τ ) dτ
T
(4.111)
0

Chú ý rằng
R v (t, τ ) =V δ (t − τ ) (4.112)

Nhưng tích phân (4.111) có giá trị giới hạn trên là t. Xung ñơn vị có thể
ñược biểu hiện như sau
1 t
δ (t ) = lim Π( ) (4.113)
T →0 T T
ở ñây hàm xung vuông:
 T
1 t 1, t <
Π( ) =  2 (4.114)
T T  0 , o th e r w is e

ñược ñặt tại trung tâm t = 0.
Vì vậy, ta chỉ xét một nửa vùng δ (t − τ ) tại bên trái τ =t. Do ñó từ (4.111)
ñược suy ra:
1
R v~x (t , t ) = − VLT (4.115)
2

Trang 437
Chương 4 : ðiều khiển bền vững

Tương tự,
R w~x (t , t ) = E w(t ) ~
{ }
x T (t )
t
{ }
= ∫ E w(t ) wT (τ ) γ T e A0 ( t −τ ) dτ
T
hoặc
0

1
R w~x (t , t ) = Wγ T (4.116)
2
Phương trình ñạo hàm cho P(t)=E ~
x~xT { }
&  d~
x ~T  ~ d~
xT 
P (t)=E  x  = E  x  (4.117)
 dt   dt 
Theo (4.104) , (4.115) và (4.116) ta có :
 d~
x T 1 1
E ~ x  = ( A − LC ) P + LVLT + γWγ T (4.118)
 dt  2 2

 dx% T  1 1
E  x%  = P( A − LC ) + LVL + γ W γ (4.119)
T T T

 dt  2 2

Từ (4.118) và (4.119)
P& = A0 P + PA0T + LVLT + γWγ T (4.120)

Cho bất kì L ñể (A-LC) là ổn ñịnh ,chúng ta giải (4.120) tìm P(t) sử dụng
ñiều kiện ñầu là P(0) = P0 với P0 là hiệp phương sai của trạng thái ñầu mà
nó tượng trưng cho tính không chắc chắn trong ước lượng ñầu xˆ (0) = x0
Thực sự những ñộ lợi cho kết quả P(t) càng nhỏ thì càng tốt vì sai số ~ x (t)
càng gần với trị trung bình bằng 0.Do ñó P(t) là thước ño chất lượng của bộ
quan sát và ma trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn
Chúng ta nói rằng P là thước ño sự không chắc chắn trong ước lượng .
P(t) tiến tới giá trị trạng thái bền vững P khi t → ∞ ngay khi A0 là ổn ñịnh
tiệm cận.Tại trạng thái bền vững thì P& = 0 , (4.120) trở thành phương trình
ñại số
0= A0 P + PA0T + LVLT + γWγ T (4.121)

Trang 438
Chương 4 : ðiều khiển bền vững

Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác ñịnh
dương ñược xác ñịnh từ (4.121). ðể ñộ lợi của bộ quan sát là hằng số, có thể
chọn lựa L ñể làm tối thiểu hoá hiệp phương sai của sai số P trạng thái bền
vững.
Ta có chỉ tiêu chất lượng (PI = Performance Index)
1
J= trace( P) (4.122)
2
Do ñó nếu P nhỏ thì J sẽ nhỏ. ðể chọn L sao cho J ñạt ñược tối thiểu phải
thỏa mãn phương trình (4.121), xác ñịnh hàm Hamiltonian
1 1
H= trace( P) + trace( gS ) (4.123)
2 2
Trong ñó
g =A 0 P+PA T0 +LVL T + γ W γ T
(4.124)

Và S là ma trận n×n thừa số Lagrange không xác ñịnh


ðể làm tối thiểu hoá J và thoả mãn g=0, ñiều này có thể làm tương ñương là
tối thiểu H nhưng không cần ñiều kiện nào. ðiều kiện cần thiết ñể tối thiểu
hóa ñược cho bởi
∂H
= A0 P + PA0T + LVLT + γWγ T = 0 (4.125)
∂S
∂H
= A0T S + SA0 + I = 0 (4.126)
∂P
1 ∂H
= SLV − SPC T = 0 (4.127)
2 ∂P
Nếu A 0 =A-LC là ổn ñịnh và S là xác ñịnh dương .Theo (4.127)

L=PC T V-1 (4.128)


Thay thế giá trị L vào phương trình (4.125)
( A − PC T V −1C ) P + P( A − PC T V −1C ) T + PC T V −1CP + γWγ T =0 (4.129)

Trang 439
Chương 4 : ðiều khiển bền vững

hoặc AP+PA T + γ W γ T -PC T V −1 CP = 0 (4.130)


ðể xác ñịnh ñộ lợi bộ quan sát tối ưu L, chúng ta có thể giải phương trình
(4.130) tìm hiệp phương sai của sai số P và sau ñó sử dụng (4.128) ñể tính
toán L. Phương trình ma trận toàn phương (4.130) ñược gọi là phương trình
Riccati ñại số. Có nhiều cách giải (4.130) ñể tìm P.ðộ lợi tối ưu L xác ñịnh
nhờ sử dụng (4.128) gọi là ñộ lợi Kalman và bộ quan sát ñược xây dựng gọi
là bộ lọc Kalman .Trạng thái bền vững ở ñây chỉ ñến một sự thật rằng mặc
dù ñộ lợi tối uu làm tối thiểu hoá P(t) là biến ñổi theo thời gian, chúng ta ñã
chọn lựa ñộ lợi tối ưu mà nó làm tổi thiểu sai số tương quan trạng thái bền
vững ñể ñạt ñược ñộ lợi quan sát là hằng số
Bộ lọc Kalman với trạng thái bền vững là bộ ước lượng tốt nhất với các ñộ
lợi là hằng số. Nếu như nhiễu quá trình w(t) và nhiễu ño ñược v(t) là nhiễu
Gaussian nó cũng là bộ ước luợng trạng thái bền vững tối ưu cho bất kì hình
thức nào.
Ước lượng ngõ ra:
~
y (t ) = y (t ) − yˆ (t ) = y (t ) − Cxˆ (t ) (4.131)

Giả sử (C,A) là có thể quan sát ñược và (A, γ W ) là có thể tìm ñược .Khi
ñó ARE tìm ñược ma trận xác ñịnh dương duy nhất P .Hơn nữa,sai số hệ
thống (4.104) sử dụng ñộ lợi kalman cho bởi (4.128) với P là ma trận xác
ñịnh dương duy nhất của ARE là ổn ñịnh tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm.Tuy nhiên vị trí thực sự rất xa
vời so với thực tế.
Tóm lại:
Mô hình hệ thống: x& = Ax + Bu (4.132)
y=Cx (4.133)
x(0)~(x 0 ,P 0 ) , w(t) ~(0,W), v(t) ~(0,V)

w(t) và v(t) là nhiễu trắng quá trình trực giao với nhau và với x(0)
Giá trị ñầu
x̂ (0)= x 0 (4.134)

Phương trình ARE của hiệp phương sai sai số

Trang 440
Chương 4 : ðiều khiển bền vững

AP +PA T +γWγ T − PC T V −1CP = 0 (4.135)


ðộ lợi Kalman
L=PC T V −1 (4.136)
ðặc tính ñộng học ước lượng:

x&ˆ = Axˆ + Bu + L( y − Cxˆ ) (4.137)


Bộ lọc Kalman cần thiết giả sử rằng V>0 khi ñó nhiễu ño sẽ làm sai lệch tất
cả tín hiệu ño. Nếu có một vài tín hiệu nhiễu ño tự do thì một bộ lọc phức
tạp ñược biết ñến như bộ lọc Deyst ñược sử dụng ñể giải quyết vấn ñề này.
Hơn nữa giả sử rằng (A, γ W ) tìm ñược có nghĩa là nhiễu quá trình kích
thích tất cả các trạng thái
Trong Matlab sử dụng lệnh Kalman tính khâu lọc Kalman liên tục từ mô
hình sys của ñối tượng:
[kest,L,P] = kalman(sys,W,V[,N,sensor,known])
W,V là các ma trận hiệp phương sai mô tả ñặc ñiểm nhiễu hệ thống và nhiễu
ño lường.
N :mặc ñịnh bằng 0
Hai vector sensor,known :chứa chỉ số của các biến ra ño ñược và các ñầu
vào ta biết.
Kết quả tính kest :chính là mô hình trạng thái của khâu lọc Kalman
Ma trận L :ma trận bộ lọc Kalman phản hồi sai lệch quan sát.
P :là ma trận hiệp phương sai của sai lệch tĩnh
4.2.4 Giải thuật thiết kế LQG
Bộ ñiều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman cùng ñược
sử dụng với nhau ñể thiết kế bộ ñiều chỉnh ñộng. Thủ tục này ñược gọi là
thiết kế bộ tuyến tính toàn phương Gaussian (LQG). ðiều thuận lợi quan
trọng của việc thiết kế LQG là cấu trúc của bộ hiệu chỉnh ñược cho bởi thủ
tục mà không cần phải biết trước. ðiều này làm cho việc thiết kế các bộ
LQG rất có ích trong ñiều khiển các hệ thống hiện ñại phức tạp (ví dụ như
ñiều khiển không gian và hàng không ) khi cấu trúc bộ hiệu chỉnh không
biết trước ñược.

Trang 441
Chương 4 : ðiều khiển bền vững

Giả sử phương trình ño lường ngõ ra ñược cho bởi


x& = Ax + Bu + γw (4.138)
y = Cx+v (4.139)
với x(t)∈ Rn , u(t) là bộ ñiều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là
nhiễu ño. Giả sử phương trình hồi tiếp trạng thái ñầy ñủ
u = -Kx+r (4.140)
ñã ñược thiết kế, với r(t) là ngõ vào chuẩn. ðộ lợi trạng thái hồi tiếp là K
ñược chọn bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR .Nếu phương
trình ñiều khiển (4.140) ñược thay vào (4.138) thì hệ thống ñiều khiển
vòng kín ñược tìm thấy như sau:
x& = ( A − BK ) x + Br + γw (4.141)
Thiết kế hồi tiếp trạng thái ñầy ñủ rất ñược quan tâm nếu các ñiều kiện
ñược giữ ổn ñịnh thì hệ thống vòng kín ñảm bảo sẽ ổn ñịnh.Hơn nữa,sử
dụng hồi tiếp trạng thái tất cả các nghiệm cực của phương trình (A-BK) có
thể ñặt tuỳ ý như mong muốn .Kết quả các phương trình thiết kế của hồi tiếp
trạng thái ñơn giản hơn phương trình cho hồi tiếp ngõ ra . Tuy nhiên luật
ñiều khiển (4.140) không thể thực hiện khi tất cả các trạng thái không thể ño
ñược.
Giả sử bộ quan sát hoặc bộ lọc Kalman
xˆ = ( A − LC ) xˆ + Bu + Ly (4.142)
ñã ñược thiết kế. ðó là ñộ lợi L của bộ lọc ñược tìm ra bằng những kĩ thuật
ñã thảo luận nhằm cung cấp các ước lượng trạng thái. Khi ñó tất cả các
trạng thái không thể ño và ñiều khiển (4.140) không thể thực hiện trong thực
tế, giả sử rằng ước lượng hồi tiếp xˆ (t ) thay thế các trạng thái thực x(t), luật
ñiều khiển hồi tiếp là
u = -K x̂ +r (4.143)
Nếu K ñược chọn sử dụng phương trình Riccati LQR và L ñược chọn bởi
sử dụng bộ lọc Kalman. Thủ tục này ñược gọi là thiết kế LQG.
ðiều quan trọng của các kết quả này là trạng thái hồi tiếp của K và ñộ lợi
của bộ quan sát L có thể ñược thiết kế riêng biệt.

Trang 442
Chương 4 : ðiều khiển bền vững

4.2.5 Ví dụ:
Mô hình con lắc ngược (xem ví dụ 1.8 ở chương 1)
Chúng ta sẽ viết chương trình mô phỏng ñặc tính ñộng của ñối tượng
Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến, ñể có thể ñiều khiển hệ
con lắc ngược bằng phương pháp LQG chúng ta cần tuyến tính hóa mô hình
hệ thống. Giả sử góc θ nhỏ ñể có thể xấp xỉ sin θ bằng 0,cos θ bằng 1 và
•2
cũng giả sử θ nhỏ ñể θ θ ≈ 0 .Với các ñiều kiện trên,chúng ta có thể tuyến
tình hoá các phương trình phi tuyến:
•• ••
( M + m) x + ml θ = u
•• ••
m x + ml θ = mgθ
 x1 = θ
 •
 x 2 = θ
ðặt các biến trạng thái:  (4.144)
 x3 = x
 •
 x 4 = x
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái
như sau:
•
 x1 = x 2
• M +m 1
x 2 = gx1 − u
 Ml Ml
• (4.145)
 x 3 = x4

 x• = − m gx + 1 u
 4 Ml
1
M
Viết lại dưới dạng ma trận
 o  0 1 0 0 0 
 x1   M + m   x1   1 
•   g 0 0 0    − 
 x 2  =  Ml   x 2  +  Ml  u (4.146)
•   0 0 0 1   x 3  0 
x3      
 •  − m g   x4   1 
 x 4   M 0 0 0  M 

Trang 443
Chương 4 : ðiều khiển bền vững

Phương trình ở ngõ ra,chúng ta giả sử hai trường hợp:


1 0 0 0   x1 
0 1 0 0   x 2 
y= (4.147)
0 0 1 0   x3 
  
0 0 0 1   x4 
Nếu chỉ ño ñược hai biến trạng thái (vị trí x và góc lệch θ )thì :
 x1 
 
1 0 0 0  x 2 
y=  (4.148)
0 0 1 0   x 3 
 
 x4 
Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số nhưsau:M=1kg,l=1m
Lấy giá trị gia tốc trọng trường g=9.8m/s2
Phương trình (4.146) trở thành:
• 
 x 1  0 1 0 0   x1  0 
•    
 x 2  =  10.78 0 0 0   x 2  − 1
 •  0 + u (4.149)
0 0 1   x 3  0 
x3      
 •  − 0.98 0 0 0   x 4  1 
 x 4 

Thiết kế LQG:
Lọc Kalman:
- Bộ quan sát:
Nếu không có ñường phản hồi qua L thì ~ x không tiệm cận về x ñược vì
vậy L ñược chọn sao cho ~ x x
Bộ quan sát ñược thiết kế theo giả thuyết
Giả sử ta có hệ thống:
 •
x = Ax + Bu + γω ω ,ν : nhiễu (4.150)

 y = Cx + ν

v, ω là các nhiễu trắng có phân bố gaussian với


{ }
E ν .ν T = V > 0
E {ω.ω } = W > 0
T

Trang 444
Chương 4 : ðiều khiển bền vững

{ }
E ν .ω T = 0 ⇒ ν , ω ñộc lập nhau
Bộ quan sát có phương trình trạng thái:
 x&ˆ = Axˆ + Bu + L( y − yˆ )
 (4.151)
 yˆ = Cxˆ

u •
x = Α x + Bu + γω
y
y = Cx + Du + v

- +
+
B
+ ∫ C
+ ∧
y

Hình 4.12 Bộ lọc Kalman

~
x = x − xˆ ⇒ ~x& = A~
x + γω − L(Cx + ν − Cxˆ )
⇒~ x& = A~x + γω − L(C~x −ν ) (4.152)
⇒~
x& = ( A − LC ) ~
x + γω − Lν
Lọc Kalman ñược xây dựng trên cơ sở:xác ñịnh L sao cho kỳ vọng toán
{ }
E x T x cực tiểu.
⇒ L = PC T V −1 (4.153)
Trong ñó P là nghiệm của phương trình Riccati
PAT + AP + γ W γ T − PC T V −1CP = 0
W = E{ω .ω T } (4.154)
V = E{v.vT }

Trang 445
Chương 4 : ðiều khiển bền vững

Bộ ñiều khiển LQG (Linear Quadratic Gaussian):


Trong bộ ñiều khiển LQ ta hồi tiếp trạng thái tuy nhiên trong thực tế nhiều
khi ta phải quan sát ñể lấy ñược biến trạng thái ước lượng (do không ño
ñược) và hồi tiếp trạng thái ước lượng => LQG


u x = Ax + Bu + γω y
y = Cx
-

- +
B
+
∫ C
+ -
+

Kc

Hình 4.13: Bộ ñiều khiển LQG

ðiều khiển LQG là kết hợp ñiều khiển LQR với lọc Kalman .
Bước 1:Thiết kế ñiều khiển LQR=>KC
Bước 2:Thiết kế bộ lọc Kalman =>L

4.3 ðiều khiển bền vững H∞


4.3.1 Biểu ðồ Bode ða Biến (Multivariable Bode Plot)

Biên ñộ của ma trận hàm truyền toàn phương H(jω) tại bất kỳ một tần số
jω nào, phụ thuộc vào hướng tín hiệu kích thích ñầu vào.Biên ñộ của ma

Trang 446
Chương 4 : ðiều khiển bền vững

trận hàm truyền H( jω ) ñược bao phía trên bởi giá trị suy biến cực ñại, kí
hiệu σ ( H ( jω )) , phía dưới bởi giá trị suy biến cực tiểu của nó, kí hiệu
σ ( H ( jω )) . Chính vì vậy,chúng ta cần tính toán hai giá trị ràng buộc này.

Ví dụ: Biểu ðồ Bode Biên ðộ Hệ MIMO:


Giả sử hệ thống ña biến:
− 1 − 2 0 0 1 0
 2 −1 0  0 0 
0
x& =  x+ u = Ax + Bu
0 0 − 3 − 8 0 1 
   
0 0 8 − 3 0 0  (4.155)
1 0 0 0 
y=  x = Cx ,
 0 0 0 0
có hàm truyền hệ MIMO 2 × 2 là:
H ( s ) = C ( sI − A) −1 B = N ( s ) D −1 ( s )
Với: D( s ) = s 4 + 8s 3 + 90 s 2 + 176s + 165
1 0 3 7 0 2 79 0  73 0 
N (s) =   s + 0 5 s +  0 15 s +  0 15 .
0 1       
Hàm H(s) là ma trận 2 × 2 , nó có hai giá trị suy biến. Chú ý rằng giá trị suy
biến là liên tục, ngọai trừ gía trị suy biến cực ñại và cực tiểu. Những giá trị
suy biến có thể giao nhau , ñược minh chứng bằng hình học.

Hình 4.14 Biểu ðồ Bode Biên ñộ hệ MIMO của giá trị suy biến
trong miền tần số
Trang 447
Chương 4 : ðiều khiển bền vững

Trong Malab dùng hàm sigma(H)

Ví dụ:
ðể minh họa sự khác biệt giữa ñồ thị trị suy biến hệ MIMO và giản ñồ
Bode hệ SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là
ma trận vuông có hạng 2. Hàm truyền hệ SISO riêng biệt trong hệ thống
vòng hở 2 ngõ vào/2 ngõ ra là:
14.8
H 11 ( s ) =
s ( s + 0.0163)( s + 3.615)( s + 20.2)
− 36.9s ( s + 2.237)[(s + 0.55) 2 + 2.49 2 ]
H 12 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[(s + 0.4225) 2 + 3.063 2 ]
− 2.65s ( s + 2.573)( s − 2.283)
H 21 ( s ) =
s ( s + 0.0163)( s + 3.615)( s + 20.2)[(s + 0.4225) 2 + 3.063 2 ]
− 0.79[(s + 0.139) 2 + 0.446 2 ]
H 22 ( s ) =
( s + 0.0163)( s + 1)( s + 3.615)( s + 20.2)[( s + 0.4225) 2 + 3.063 2 ]

Hình 4.15: Biểu ñồ Bode Biên ðộ hệ thống SISO


Mặc khác, hình 4.16 là các giá trị trị suy biến của hệ ña biến. Chú ý rằng,
theo ñồ thị này không thể dễ dàng bằng trực quan tức thời nhận thấy cách
liên kết ñồ thị của hệ SISO ở hình 4.15 .Những ñường bao bảo ñảm sự bền

Trang 448
Chương 4 : ðiều khiển bền vững

vững ñựơc ñưa ra trong hệ thống hệ MIMO dưới dạng giá trị trị suy biến
cực tiểu là lớn tại tần số thấp ( cho chất lượng bền vững) và giá trị trị suy
biến cực ñại là nhỏ tại tần số cao (cho ổn ñịnh bền vững ). Sự không tương
thích giữa hai ñồ thị 4.15 và 4.16 chỉ ra rằng ñường bao ñặc tính tần số của
hệ MIMO không có thể hòan tòan mô tả ñúng những biểu ñồ Bode của hệ
SISO riêng biệt.

Hình 4.16:Các giá trị trị suy biến của hệ thống


4.3.2 Hàm nhạy và hàm bù nhạy
Khảo sát ñặc tính của hệ thống hồi tiếp ñiển hình, từ ñó ñưa ra ý tưởng thiết
kế thỏa hiệp giữa mục tiêu chất lượng và ñiều khiển bền vững nhằm thỏa
mãn các yêu cầu thiết kế.
Xét hệ thống hồi tiếp âm như hình 4.17, trong ñó d i là nhiễu ñầu vào, d là
nhiễu ñầu ra, n là nhiễu ño.
di d

e u uG
r + G + y

-

+
n
Hình 4.17: Sơ ñồ hệ thống hồi tiếp âm

Trang 449
Chương 4 : ðiều khiển bền vững

Lưu ý: ðể liên hệ với phần lý thuyết ñiều khiển kinh ñiển, trong mục này ta
phân tích sơ ñồ ñiều khiển hồi tiếp âm, với bộ ñiều khiển là K̂ ( K̂ = -K ở mô
hình hồi tiếp dương)
Các quan hệ truyền ñạt của hệ thống vòng kín ñược thể hiện qua các biểu
thức sau:
GKˆ GKˆ G 1
y= r− n+ di + d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ

Kˆ Kˆ GKˆ Kˆ
u= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ

Kˆ Kˆ 1 Kˆ
uG = r− n+ di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
1 1 G 1
e= r− n− di − d
1 + GKˆ 1 + GKˆ 1 + GKˆ 1 + GKˆ
ðịnh nghĩa các hàm nhạy, hàm bù nhạy và ñộ lợi vòng như sau:

1
- Hàm nhạy : S =
1 + GKˆ

GKˆ
- Hàm bù nhạy : T =
1 + GKˆ

- ðộ lợi vòng: L = GKˆ

Các ñẳng thức trên ñược viết gọn lại:

y = Tr − Tn + GSdi + Sd (4.156)

u = Kˆ Sr − Kˆ Sn − Td i − Kˆ Sd (4.157)

ˆ − KSn
uG = KSr ˆ + Sd − KSd
ˆ (4.158)
i

e = Sr − Sn − GSd i − Sd (4.159)

Trang 450
Chương 4 : ðiều khiển bền vững

Từ (4.156) – (4.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống
vòng kín.Từ phương trình (4.156) ta thấy rằng:
- ðể giảm ảnh hưởng của nhiễu ñầu ra d lên ñầu ra y, hàm nhạy S cần phải
nhỏ.
- ðể giảm ảnh hưởng của nhiễu ño n lên ñầu ra y, hàm bù nhạy T cần phải
nhỏ. Tương tự, từ phương trình (4.158), ñể làm giảm ảnh hưởng của nhiễu
ñầu vào di, hàm nhạy S cần phải nhỏ.
Nhưng từ ñịnh nghĩa ,hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như
sau:
S+T=1 (4.160)
Do ñó, S và T không thể ñồng thời nhỏ. ðể giải quyết mâu thuẫn này,
người ta dựa vào ñặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập
trung chủ yếu ở vùng tần số thấp, còn nhiễu ño n tập trung chủ yếu ở vùng
tần số cao.
Như vậy, ñể hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ trong
vùng tần số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, ñiều kiện
ñể hệ ít nhạy ñối với nhiễu di là |S| và | Kˆ S | nhỏ trong vùng tần số mà di tập
trung, cụ thể là vùng tần số thấp.
Ta có:

| GKˆ | −1 ≤ | 1 + GKˆ | ≤ | GKˆ | +1

Suy ra:

1 1 1
≤ ≤ , nếu | GKˆ |>1
| GK | +1 1 + GKˆ
ˆ ˆ
| GK | −1

hay:

1 1
≤ S ≤ ,nếu L >1
L +1 L −1

Từ ñó, ta thấy:

Trang 451
Chương 4 : ðiều khiển bền vững

S <<1 ⇔ L >>1

Hơn nữa, nếu L >> 1, thì:

G 1
GS = ≈
1 + GKˆ | Kˆ |

Kˆ 1
| Kˆ S | = ≈
1 + GKˆ G

Như vậy, ñối với ñầu ra y:


- ðể giảm thiểu ảnh hưởng của d, ñộ lợi vòng L phải lớn (nghĩa là |L|>> 1)
trong vùng tần số mà d tập trung;
- ðể giảm thiểu ảnh hưởng của di, biên ñộ bộ ñiều khiển phải ñủ lớn K̂ >> 1
trong vùng tần số mà di tập trung.
Tương tự, ñối với ñầu vào (u G )
- ðể giảm thiểu ảnh hưởng của di, L phải lớn (nghĩa là |L|>> 1) trong vùng
tần số mà di tập trung.
- ðể giảm thiểu ảnh hưởng của d, biên ñộ ñối tượng (không thay ñổi ñược
trong thiết kế ñiều khiển) phải ñủ lớn (|G|>> 1) trong vùng tần số mà d tập
trung.
Tóm lại, một trong những mục tiêu thiết kế là ñộ lợi vòng (và cả ñộ lợi của
bộ ñiều khiển, nếu ñược) phải lớn trong vùng tần số mà d và di tập trung, cụ
thể là vùng tần số thấp.
Sau ñây, ta xét ảnh hưởng của sai lệch mô hình lên hệ thống hồi tiếp. Giả
sử mô hình ñối tượng có sai số nhân là (I + ∆ )G, với ∆ ổn ñịnh, và hệ
thống kín ổn ñịnh danh ñịnh (ổn ñịnh khi ∆ =0). Hệ thống kín có sai số mô
hình sẽ ổn ñịnh nếu:
  ∆GKˆ 
det (1 + (1 + ∆ )GKˆ )=det (1 + GKˆ )1 +  =det(1+ GKˆ )det(1+ ∆T )
ˆ 
  1 + GK 

Trang 452
Chương 4 : ðiều khiển bền vững

không có nghiệm ở nửa phải mặt phẳng phức. Ta thấy rằng, ñiều này sẽ
ñược thỏa nếu như ∆T ñủ nhỏ, hay |T| phải nhỏ ở vùng tần số mà ∆ tập
trung, cụ thể là vùng tần số cao.
ðể ý rằng, nếu |L| rất lớn thì |T| ≈ 1 và |S| ≈ 0. Do ñó, từ (4.156) ta thấy
nếu như L( jω ) lớn ở trong một dải tần số rộng, thì nhiễu ño n cũng sẽ
truyền qua hệ thống trong vùng tần số ñó, nghĩa là:
y= Tr − Tn + GSd i + Sd ≈ (r - n)
vì rằng nhiễu ño n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu ñộ lợi
vòng lớn ở ngoài vùng băng thông của G, nghĩa là L( jω ) >>1 trong khi
G ( jω ) <<1, thì có thể làm cho tín hiệu ñiều khiển quá lớn, gây bão hòa ở
cơ cấu chấp hành. ðiều này có thể ñược lý giải từ (4.157) như sau:
1
u= Kˆ S (r − n − d ) − Td i ≈ (r − n − d ) − d i
|G|
Phương trình trên cho thấy nhiễu tải và nhiễu ño sẽ ñược khuyếch ñại lên
khi mà vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông của
1
G, vì ñối với dải tần số mà G ( jω ) <<1 thì >>1.
G ( jω )

Tương tự, biên ñộ của bộ ñiều khiển, | K̂ |, không ñược quá lớn trong vùng
tần số mà ñộ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ
khi ñộ lợi vòng nhỏ ( L( jω ) <<1), thì

u= Kˆ S (r − n − d ) − Ti d i = Kˆ (r − n − d )

Do ñó, một ñiều cần lưu ý khi thiết kế là | K̂ | không ñược lớn quá khi ñộ lợi
vòng nhỏ.
Từ những ñiều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau ñây:
- ðể ñảm bảo mục tiêu chất lượng trong một vùng tần số nào ñó, cụ thể là
vùng tần số thấp (0, ω l ), hệ thống cần phải có:

| GKˆ |>> 1 , | Kˆ | >>1

Trang 453
Chương 4 : ðiều khiển bền vững

- ðể ñảm bảo tính bền vững và có khả năng triệt nhiễu ño tốt trong một
vùng tần số nào ñó, cụ thể là vùng tần số cao ( ω h , ∞ ),hệ thống cần phải có :

| GKˆ |<< 1 , | Kˆ |≤ M
trong ñó M có trị số không quá lớn.
Những ý tưởng thiết kế này ñược minh họa trong hình 4.18. Những tần số
ω l , ω h ñược xác ñịnh tùy thuộc vào từng ứng dụng cụ thể, và những thông
tin về ñặc tính của nhiễu tải, nhiễu ño, sai lệch mô hình.

Hình 4.18: ðộ lợi vòng và các ràng buộc tần số thấp và tần số cao.

Những ñiều phân tích trên ñây là cơ sở cho một kỹ thuật thiết kế ñiều khiển:
ñó là thủ tục thiết kế nắn dạng vòng (LSDP_Loop Shaping Design
Proceduce). Mục tiêu nắn dạng vòng là tìm ra một bộ ñiều khiển sao cho ñộ
lợi vòng |L| tránh ñược các vùng giới hạn (xem hình 4.18) chỉ ñịnh bởi các
ñiều kiện về chất lượng và bền vững.

4.3.3 Thiết kế bền vững H∞


4.3.3.1 Mô tả không gian H∞ và RH∞
Không gian vector Hardy có chuẩn vô cùng, ký hiệu là H∞, là không gian
các hàm phức G(s) của biến phức s (s ∈C) mà trong nửa hở mặt phẳng phức
bên phải (miền có phần thực của biến s lớn hơn 0) thỏa mãn:

Trang 454
Chương 4 : ðiều khiển bền vững

- là hàm giải tích (phân tích ñược thành chuỗi lũy thừa), và
- bị chặn, tức tồn tại giá trị M dương nào ñó ñể G ( s) ≤ M có phần thực
dương.
Tập con ñặc biệt của H∞ mà trong ñiều khiển bền vững rất ñược quan tâm là
tập hợp gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H∞, tức là các
hàm hữu tỷ phức G(s)∈ H∞ với các hệ số là những số thực dạng
b0 + b1 s + L + bm s m
G (s) =
1 + a1 s + L + an s n
trong ñó ai,bj ∈ R, ký hiệu là RH∞.
Trong lý thuyết hàm phức, người ta chỉ ra ñược rằng: một hàm thực – hữu tỷ
G(s) bất kỳ sẽ thuộc RH∞ khi và chỉ khi
- lim G ( s) < ∞ , hay G (∞) bị chặn (khi m≤n),ñược gọi là hàm hợp thức và
s →∞

- G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác
G(s) không có ñiểm cực với Re(s) ≥ 0.Một hàm G(s) có tính chất như vậy
gọi là hàm bền.
Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng
phức bị chặn khi s → ∞ mà còn thỏa mãn (khi m<n)
lim | G ( s ) |= 0
s →∞

Chuẩn H∞ của một hệ thống SISO G(s) ∈ RH∞ ñược ñịnh nghĩa như sau:
G ∞
= sup { G ( jω ) } (4.161)
ω

Như vậy, chuẩn vô cùng G ∞


chính là khoảng cách lớn nhất từ tâm tọa ñộ
mặt phẳng phức tới một ñiểm trên ñường ñặc tính tần biên – pha của G(jω).

4.3.3.2 Sai số mô hình phân tích coprime


Phần này trình bày một số kết quả về phân tích coprime bên trái LCF (Left
Coprime Factorization). Ta cũng có thể suy ra kết quả tương tự ñối với
phân tích coprime bên phải nhờ vào tính ñối ngẫu.

Trang 455
Chương 4 : ðiều khiển bền vững

ðịnh nghĩa 1:
Các ma trận hàm truyền ñạt N% , M
% ∈ RH∞ tạo thành một phân tích coprime
bên trái của G nếu và chỉ nếu:
% vuông, và det( M
a. M % )≠0 (4.162)

b. G = M% −1 N% (4.163)
c.∃ V, U ∈ RH∞ sao cho: % + NU
MV % =I (4.164)
ðịnh nghĩa 2:
Nếu N% , M
% là phân tích coprime bên trái của G ñồng thời thỏa:
% ∗ + MM
NN % ∗=I (4.165)
thì ñược gọi là phân tích coprime bên trái chuẩn.
Một ñối tượng G có thể có vô số phân tích coprime bên trái, nhưng chỉ có
một phân tích coprime bên trái chuẩn
Xác ñịnh phân tích coprime bên trái chuẩn
Phân tích coprime bên trái chuẩn có thể ñược xác ñịnh từ mô hình trạng thái
của G và nghiệm của phương trình Riccati. Giả sử A, B, C, D là mô hình
trạng thái của G, ký hiệu là:
A B
G=  (4.166)
C D 
trong ñó: G ( s ) = C ( sI − A) −1 B + D . ðể xác ñịnh phân tích coprime bên trái,
trước tiên ta cần phải tìm nghiệm của phương trình Riccati sau:
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0
(4.167)
*
trong ñó R ≡ I + DD . Phương trình này có tên là Phương trình Riccati lọc
tổng quát (GFARE – Generalized Filter Algebraic Riccati Equation). Sau ñó
áp dụng ñịnh lí 3.3 ñể tính N% , M % .

A B
ðịnh lý 4.3: Cho G =   . Phân tích coprime bên trái chuẩn của G
 C D 
ñược xác ñịnh như sau:

Trang 456
Chương 4 : ðiều khiển bền vững

 A + HC B + HD   A + HC H 
N% =  −1 2  % =  −1 2 (4.168)
R −1 2 
−1 2 ; M
 R C R D  R C
trong ñó Z là nghiệm xác ñịnh dương duy nhất của GFARE, R = I + DD∗ ,
và H = −( ZC ∗ + BD∗ ) R −1 .
Sai số mô hình phân tích coprime bên trái
Sau ñây, ta ñịnh nghĩa sai số mô hình phân tích coprime bên trái. Giả sử G
là mô hình ñối tượng, ( N% , M
% ) là một phân tích coprime bên trái của G. Hệ
có sai số mô hình phân tích coprime bên trái chuẩn ñược ñịnh nghĩa như
sau:
G∆ = ( M% + ∆ M ) −1 ( N% + ∆ N ) (4.169)

trong ñó ∆N, ∆M ∈ RH∞ là các hàm truyền chưa biết thể hiện phần sai số
trong mô hình danh ñịnh. Họ mô hình có sai số là một tập Gε ñịnh nghĩa
như sau:

{
% + ∆ )−1 ( N% + ∆ ) :
Gε = ( M M N [∆M , ∆N ] ∞
<ε } (4.170)

∆N ∆M

+ -

N% % −1
M
+ +

Hình 4.19: Biểu diễn sai số mô hình phân tích coprime bên trái

Mục tiêu của ñiều khiển bền vững là tìm bộ ñiều khiển K ổn ñịnh hóa không
chỉ mô hình danh ñịnh G, mà cả họ mô hình Gε .
Ưu ñiểm của cách biểu diễn sai số mô hình trên ñây so với biểu diễn sai số
cộng và sai số nhân là số cực không ổn ñịnh có thể thay ñổi do tác ñộng của
sai số mô hình

Trang 457
Chương 4 : ðiều khiển bền vững

4.3.3.3 Bài toán ổn ñịnh bền vững H∞:


Xét hệ hồi tiếp hình 4.20

∆N ∆M
+
u +
w N% % −1
M
+ +

+
K + d
y

Hình 4.20: Sơ ñồ phân tích ổn ñịnh bền vững với mô hình có sai số LCF

ðịnh lý 4.4:

G = M% −1 N% là mô hình danh ñịnh; G∆ = ( M% + ∆ M ) −1 ( N% + ∆ N ) là mô hình


% , N% ) là phân tích coprime bên trái của G; M
có sai số; ( M % , N% , ∆ , ∆
M N

∈ RH∞. Hệ ổn ñịnh bền vững với mọi ∆ [∆M ∆N ] thỏa


[∆M ∆N ] ∞
< 1 γ nếu và chỉ nếu:
a.Hệ (G, K) ổn ñịnh nội, và

K  % −1
b.   ( I − GK ) −1 M ≤γ (4.171)
I ∞

ðịnh lý 4.4 có thể phát biểu một cách tương ñương dưới dạng một bài toán
tối ưu như sau:

ðịnh lý 4.5:

ðối tượng G∆ = ( M% + ∆ M ) −1 ( N% + ∆ N ) , với [∆M ∆N ] ∞


< 1 γ , ổn ñịnh

hóa bền vững ñược nếu và chỉ nếu:

Trang 458
Chương 4 : ðiều khiển bền vững

K  % −1
inf   ( I − GK ) −1 M ≤γ (4.172)
K I
  ∞

trong ñó infimum ñược thực hiện trong tất cả các bộ ñiều khiển K ổn ñịnh
hóa G.

Bài toán ổn ñịnh bền vững


Cho trước giá trị γ, tìm bộ ñiều khiển K (nếu tồn tại) ổn ñịnh hóa ñối tượng
danh ñịnh G, và thỏa:
K  −1 % −1
 I  ( I − GK ) M ≤γ (4.173)
  ∞

trong ñó ( N% , M
% ) là phân tích coprime bên trái của G. Và theo ñịnh lý 4.4,
nếu tìm ñược bộ ñiều khiển K, thì K sẽ ổn ñịnh hóa ñối tượng có sai số G∆,
với ∆ = [ ∆ M ∆ N ] ∞ < 1 γ .
Nếu phát biểu dưới dạng một bài toán tối ưu H∞ (ñối với hệ thống hình 4.20)
thì ta có bài toán tối ưu H∞ như sau:
Bài toán tối ưu H∞
Tìm bộ ñiều khiển K (nếu tồn tại) ổn ñịnh hóa ñối tượng danh ñịnh G và
cực tiểu hóa chuẩn H∞ sau ñây:
K  −1 % −1
 I  ( I − GK ) M (4.174)
  ∞

trong ñó ( N% , M
% ) là phân tích coprime bên trái của G.

Bài toán tối ưu H∞ phức tạp ở chỗ phải thực hiện cực tiểu hóa chuẩn (4.174)
trong ñiều kiện tồn tại bộ ñiều khiển K ổn ñịnh hóa hệ thống. ðể giải quyết
vấn ñề này, thông thường người ta giải bài toán ổn ñịnh bền vững với một
giá trị γ cho trước, rồi sau ñó thực hiện quá trình lặp γ ñể tìm giá trị γmin.
Glover và McFarlane ñã sử dụng bài toán mở rộng Nehari (Nehari
extension problem), và dạng phân tích coprime chuẩn của mô hình ñối
tượng ñể tìm ra lời giải không gian trạng thái cho bài toán tối ưu H∞ mà
không cần phải thực hiện quá trình lặp γ ñể tìm γmin. Hơn nữa, từ cách tiếp

Trang 459
Chương 4 : ðiều khiển bền vững

cận này, tác giả có thể tính ñược ñộ dự trữ ổn ñịnh cực ñại εmax ( = 1 γ min )
một cách chính xác.
Phần sau ñây chỉ trình bày một số kết quả chính mà Glover và McFarlane ñã
thực hiện.
ðịnh lý 4.6: Bộ ñiều khiển K ổn ñịnh hóa hệ thống và thỏa
K  −1 % −1
 I  ( I − GK ) M ≤γ (4.175)
  ∞

nếu và chỉ nếu K có một phân tích coprime bên phải: K = UV −1 với U, V ∈
RH∞ thỏa

 − N% ∗  U  12
 % ∗ +  ≤ (1 − γ −2 ) (4.176)
 M  V  ∞

ðịnh lý 4.7:
a. Lời giải tối ưu của bài toán ổn ñịnh bền vững ñối với mô hình phân tích
coprime bên trái chuẩn cho kết quả:
−1 2
K 
K
I
% −1
inf   ( I − GK )−1 M

{
= 1 −  N% %
M 
2

H } (4.177)

trong ñó infimum ñược thực hiện trong tất cả các bộ ñiều khiển ổn ñịnh hóa
hệ thống.
b. ðộ dự trữ ổn ñịnh cực ñại là
−1 2

{
ε max = 1 −  N% %
M 
2

H } >0 (4.178)

c. Các bộ ñiều khiển tối ưu ñều có dạng: K = UV −1 , với U, V ∈ RH∞ thỏa

 − N% ∗  U 
 % ∗ +  =  N% %
M  (4.179)
M  V  ∞
H

Các ñịnh lý trên cho ta những nhận xét sau:


- ðộ dự trữ ổn ñịnh cực ñại có thể ñược tính trực tiếp từ công thức (4.178)

Trang 460
Chương 4 : ðiều khiển bền vững

- Việc xác ñịnh bộ ñiều khiển tối ưu H∞ có thể ñược thực hiện thông qua bài
toán mở rộng Nehari (Nehari extension).
Bài toán tối ưu con
ðộ dự trữ ổn ñịnh cực ñại cho ta một cận dưới của γ, ñó là γmin = 1/εmax.
Việc giải bài toán tối ưu H∞ với γ > γmin cho kết quả là một tập các bộ ñiều
khiển ổn ñịnh hóa K sao cho
K  −1 % −1
 I  ( I − GK ) M ≤γ (4.180)
  ∞

ðây chính là bài toán tối ưu con (suboptimal problem). Lời giải dạng không
gian trạng thái của bài toán này ñược xác ñịnh theo các bước như sau :
Bước 1: Giải hai phương trình Riccati GCARE và GFARE.
Phương trình GCARE (Generalized Control Algebraic Riccati Equation)
có dạng:
( A − BS −1 D∗C )∗ X + X ( A − BS −1 D∗C ) − XBS −1 B ∗ X + C ∗ ( I − DS −1 D∗ )C = 0
(4.181)
trong ñó: S = I + D ∗ D .
Phương trình GFARE là phương trình trình bày ở trên.
( A − BD∗ R −1C ) Z + Z ( A − BD∗ R −1C )∗ − ZC ∗ S −1CZ + B ( I − D∗ R −1 D) B ∗ = 0

trong ñó R = I + DD ∗ .
Bước 2: Tính giá trị γ nhỏ nhất có thể ñạt ñược.
γ min = (1 + λmax ( ZX ))1 2

trong ñó λmax ( • ) là trị riêng lớn nhất, X và Z lần lượt là nghiệm của
GCARE và GFARE.
Bước 3: Chọn γ > γ min . Thông thường, chọn γ lớn hơn γmin một chút; chẳng
hạn, γ = 1.05γ min .
Bước 4: Bộ ñiều khiển trung tâm có biểu diễn trạng thái ñược xác ñịnh như
sau

Trang 461
Chương 4 : ðiều khiển bền vững

 A + BF + γ 2W1∗−1 ZC ∗ (C + DF ) γ 2W1∗−1 ZC ∗ 
K0 =   (4.182)
 B∗ X − D∗ 
trong ñó X và Z là lần lượt là nghiệm của các phương trình GCARE và
GFARE,
F = − S −1 ( D∗C + B ∗ X ) , và W1 = I + ( XZ − γ 2 I ) .
Công thức tính γ min ở bước 2 ñược dẫn ra từ công thức (4.177) trong ñịnh lý
% ) coprime bên trái chuẩn thì  N% M
4.7. Nếu ( N% , M % có thể ñược
  H
xác ñịnh từ nghiệm của hai phương trình Riccati GCARE và GFARE như
sau:
2
 N% %
M  = λmax ( XZ ( I + ZX ) −1 ) (4.183)
H

Từ ñó ta suy ra giá trị γmin:


−1
γ min = ε max = (1 + λmax ( ZX ))1 2

ðây chính là công thức tính γ min ở bước 2.


Ta thấy rằng ñối với bài toán ổn ñịnh bền vững cho mô hình phân tích
coprime bên trái chuẩn, ta chỉ cần tìm nghiệm của các phương trình GFARE
và GCARE là ñủ ñể tính ñược giá trị γ min mà không cần phải thực hiện thủ
tục lặp γ.
Trong bước 3, ta chọn γ > γ min nhằm ñể bảo ñảm sự tồn tại của bộ ñiều
khiển có khả năng ổn ñịnh hóa hệ thống.
Trong trường hợp bài toán tối ưu, γ = γ min , thì ma trận W1 trong (4.182) suy
biến. Và do ñó, (4.182) sẽ không áp dụng ñược. Tuy nhiên nếu ta chọn γ
gần γ min (ví dụ γ = 1.05 γ min ) thì kết quả bài toán tối ưu con và bài toán tối
ưu sẽ khác nhau không ñáng kể.

4.3.4 Nắn dạng vòng H∞


4.3.4.1 Thủ tục thiết kế nắn dạng vòng H ∞ :
(LSDP – Loop Shaping Design Procedure)

Trang 462
Chương 4 : ðiều khiển bền vững

Nắn dạng vòng H ∞ ( H ∞ loop shaping) là một kỹ thuật thiết kế do


McFarlane và Glover ñề xuất năm 1988. Kỹ thuật thiết kế này kết hợp ý
tưởng nắn dạng vòng (phần hàm nhạy và hàm bù nhạy) và bài toán ổn ñịnh
bền vững H ∞ . Nắn dạng vòng thực hiện sự thỏa hiệp giữa mục tiêu chất
lượng và mục tiêu ổn ñịnh bền vững, trong khi bài toán tối ưu H ∞ ñảm bảo
tính ổn ñịnh nội cho hệ vòng kín.
Kỹ thuật thiết kế gồm hai phần chính:
a. Nắn dạng vòng: chỉ ñịnh dạng hàm truyền hở của ñối tượng danh ñịnh.
b. Ổn ñịnh bền vững H ∞ : giải bài toán ổn ñịnh bền vững H ∞ dạng phân
tích coprime cho ñối tượng ñã ñược nắn dạng ở trên.
Thủ tục thiết kế nắn dạng vòng (LSDP)
Giả sử mô hình danh ñịnh của ñối tượng G, bộ ñiều khiển cần tìm là K
Bước 1: Chọn các hàm nắn dạng W1,W2. Tính Gs: Gs = W2GW1.
(Lưu ý là chọn W1,W2 sao cho GS không chứa các chế ñộ ẩn (zero – cực
không ổn ñịnh khử nhau))
Bước 2: Tìm nghiệm Xs,Zs của GCARE và GFARE ứng với GS.
1/ 2
Tính γ min = (1 + λ max (Z S X S )) , trong ñó λ max (.) là trị riêng lớn nhất

Nếu γ min quá lớn thì trở về bước 1. (Thông thường 1< γ min <5 thì chấp nhận
ñược)
Bước 3: Chọn γ > γ min , tổng hợp bộ ñiều khiển K ∞ sao cho

K ∞  −1
~
−1
 I (I − Gs K ∞ ) M s ≤γ
  ∞

(Việc xác ñịnh K ∞ ñã ñược trình bày ở phần 4.3)


Bước 4: Bộ ñiều khiển K cần tìm ñược tính theo công thức:

K = W1 K ∞ W2

Trang 463
Chương 4 : ðiều khiển bền vững

Thủ tục thiết kế ñược minh họa trong hình 4.21

W1 G W2

Gs

W1 G W2

K∞

W1 K∞ W2

Hình 4.21: Thủ tục thiết kế H ∞ loop shaping

Nhận xét:
-Khác với phương pháp thiết kế nắn dạng vòng cổ ñiển (nắn dạng hàm S
và T), ở ñây ta không cần quan tâm ñến tính ổn ñịnh vòng kín, cũng như
thông tin về pha của ñối tượng danh ñịnh, vì ñiều kiện ổn ñịnh nội ñã ñược
ñảm bảo trong bài toán ổn ñịnh bền vững H ∞ ở bước 3.
- Thủ tục thiết kế sử dụng thích hợp cho các ñối tượng ổn ñịnh, không ổn
ñịnh, cực tiểu pha, không cực tiểu pha; ñối tượng chỉ cần thỏa mãn yêu cầu
tối thiểu cho mọi thiết kế là không có các chế ñộ ẩn. Cụ thể là nếu ñối tượng

Trang 464
Chương 4 : ðiều khiển bền vững

không cực tiểu pha thì các hạn chế về chất lượng ñiều khiển vẫn thể hiện
trong thủ tục thiết kế quả giá trị của γ min .
4.3.4.2 Sơ ñồ ñiều khiển:
Trên ñây ta chỉ quan tâm ñến vòng ñiều khiển, không quan tâm ñến vị trí
tín hiệu ñặt ñược ñưa vào vòng ñiều khiển như thế nào. Thông thường, tín
hiệu ñặt ñưa vào vòng ñiều khiển như hình 4.22 với hồi tiếp ñơn vị.

+ y
r K G
-

Hình 4.22: Sơ ñồ ñiều khiển hồi tiếp ñơn vị


Nếu bộ ñiều khiển K ñạt ñược từ thủ tục nắn dạng vòng H ∞ , thì K ∞ và các
hàm nắn dạng W1, W2 có thể ñược tách ra riêng rẽ, và nhờ ñó ta có thể có
các sơ ñồ ñiều khiển khác nhau.
Hình 4.23 là sơ ñồ ñiều khiển với bộ ñiều khiển thiết kế theo thủ tục LSDP.
Ta có thể thay ñổi sơ ñồ này một chút như hình 4.24, mà không làm thay ñổi
dạng vòng L.

+
r W2 K∞ W1 G
- y

Hình 4.23: Sơ ñồ ñiều khiển hồi tiếp ñơn vị với bộ ñiều khiển ñạt ñược

từ LDSP

Trang 465
Chương 4 : ðiều khiển bền vững

K ∞ (0)W2 (0) W1 G
r y
+

K∞ W2

Hình 4.24: Sơ ñồ ñiều khiển cải tiến với bộ ñiều khiển ñạt ñược từ
LDSP
Khi tín hiệu ñặt ñược ñưa vào hệ thống tại vị trí giữa hai khối K ∞ và W1, ta
cần bổ sung một bộ tiền bổ chính ñể ñảm bảo ñộ lợi tĩnh bằng 1 (hình 4.24).
Hàm truyền vòng kín từ tín hiệu ñặt r ñến ñầu ra y trở thành:
G ( s )W1 ( s )
y(s)= K ∞ (0)W2 (0)r ( s ) (4.184)
1 − G (s ) K (s)
trong ñó:
K ∞ (0)W2 (0) = lim K ∞ ( s )Ws ( s ) (4.185)
s →0

Theo kinh nghiệm, ñiều khiển theo sơ ñồ hình 4.24 sẽ cho ñáp ứng quá ñộ
tốt hơn; ñiều khiển theo sơ ñồ hồi tiếp ñơn vị như hình 4.23 thường cho ñáp
ứng quá ñộ, có ñộ vọt lố lớn. Nguyên nhân là trong sơ ñồ 4.24 tín hiệu ñặt
không trực tiếp kích thích ñặc tính ñộng của K ∞ . Theo thủ tục thiết kế
LSDP, K ∞ lại ñược xác ñịnh qua lại bài toán ổn ñịnh bền vững, trong ñó ta
không thể trực tiếp can thiệp vào vị trí ñiểm cực – zero ñược, mà mọi ñặc
tính mong muốn ta chỉ có thể ñưa vào hệ thống thông qua các hàm nắn dạng
W1 và W2.
4.3.4.3 Lựa chọn các hàm nắn dạng W1,W2:
Việc lựa chọn các hàm nắn dạng trong thủ tục thiết kế LSDP nói chung là
dựa vào kinh nghiệm của người thiết kế. Tuy nhiên, ñối với từng ñối tượng
cụ thể, người ta thường ñưa ra các hướng chọn hàm nắn dạng thích hợp.
Thông thường, W2 ñược chọn có dạng ma trận ñường chéo với các phần tử
trên ñường chéo là các hằng số nhằm ñặt trọng số lên các tín hiệu ra của ñối
tượng. W1 thường là tích của hai thành phần: WP và WA; trong ñó, WA là bộ
tách kênh (decoupler), WP có dạng ñường chéo ñược chọn sao cho thỏa hiệp

Trang 466
Chương 4 : ðiều khiển bền vững

các mục tiêu chất lượng và ổn ñịnh bền vững của hệ thống, và thường có
chứa khâu tích phân ñể ñảm bảo sai số xác lập bằng 0.
ðối với hệ SISO, việc lựa chọn các hàm nắn dạng ñơn giản hơn: W2 thường
ñược chọn bằng 1, và W1 ñược chọn sao cho thỏa hiệp ñược các mục tiêu
chất lượng và ổn ñịnh bền vững của hệ thống.

4.4 Thiết kế tối ưu H2


4.4.1 ðặt vấn ñề
Xét hệ thống ổn ñịnh
x& (t ) = Ax(t ) + Bw(t )
y (t ) = Cx(t ) (4.186)
t∈R
Hệ thống có ma trận hàm truyền H(s) = C(sI-A)-1B. Giả sử rằng tín hiệu w
{ }
là nhiễu trắng với hiệp phương sai E w(t + τ ) wT (t ) = Wδ (τ ) .Ngõ ra y của
hệ thống là một quá trình nhiễu tĩnh với ma trận mật ñộ phổ.
S (ω ) = H ( jω )WH T (− jω ) (4.187)
Do ñó trị trung bình ngõ ra toàn phương :
+∞ +∞
1 1 ~
{ }
E y T (t ) y (t ) = trace ∫
2Π −∞
S (ω )dω = trace ∫
2Π −∞
H ( jω )WH ( jω )dω (4.188)

~
Ở ñây ta ký hiệu H ( jω ) =HT(- jω )
Ta có :
+∞
1 ~
H 2
= trace ∫
2Π −∞
H ( jω ) H ( jω )dω (4.189)

Gọi là chuẩn H2 của hệ thống .Nếu nhiễu trắng w có mật ñộ W = I thì trị
trung bình của ngõ ra toàn phương E{ y T (t ) y (t )} tương ñương với bình
phương của chuẩn H2 của hệ thống

4.4.2 Tối ưu H2
Vấn ñề tối ưu H2 ñược thể hiện dưới dạng ma trận chuyển ñổi. Chúng ta giả
sử rằng Q = I, và R = I, phiếm hàm chất lượng LQG là

Trang 467
Chương 4 : ðiều khiển bền vững

lim E[ z T (t ) z (t ) + u T (t )u (t )] (4.190)
t →∞

Sự giả sử này không làm mất ñi tính tổng quát bởi vì bằng cách biến ñổi
thang tỷ lệ các thông số z và u chỉ tiêu chất lượng luôn có thể chuyển thành
hình thức này .
Cho hệ thống vòng hở :
x& = Ax + Bu + γw (4.191)
z = Dx (4.192)
y = Cx + v (4.193)
Có ma trận chuyển ñổi
z = D ( sI − A) −1 γ w + D ( sI − A) −1 Bu (4.194)
14 4244 3 14 4244 3
G11 ( s ) G12 ( s )

y = C ( sI − A) −1 γ w + C ( sI − A) − 1Bu + v (4.195)
14 4244 3 144244 3
G21 ( s ) G22 ( s )

Kết nối hệ thống như hình (4.25) với một bộ ñiều khiển Ce chúng ta có cân
bằng của tín hiệu :

u w
z
Ce G
-
+ v
y +

Hình 4.25 : Hệ thống hồi tiếp với ngõ vào và ngõ ra nhiễu loạn

u = −C e y = −C e (G21 w + G22 u + v)
u = − ( I + C e G22 ) −1 C e G21 w− ( I + C e G22 ) −1 C e v (4.196)
144424443 144 42444 3
H 21 ( s ) H 22 ( s )

Từ z = G11 w + G12 u ta có :
z = G11 − G12 ( I + C e G22 ) −1 C e G21 w− G12 ( I + C e G22 ) −1 C e v (4.197)
144444244444 3 144424443
H11 ( s ) H12 ( s )

Hay

Trang 468
Chương 4 : ðiều khiển bền vững

 z   H 11 ( s ) H 12 ( s )   w
u  =  H ( s ) H ( s )  v  (4.198)
  14 21
4 4242244 3  
H (s)

Từ (4.198) theo ta có :
T
 z (t )   z (t ) 
lim E ( z (t ) z (t ) + u (t )u (t )) = lim E ( 
T T
  )
t →∞ t →∞
u (t ) u (t )
+∞
1 ~
= trace
2π ∫ H ( jω )H ( jω )dω
−∞
(4.199)

2
= H 2

Vì vậy giải quyết vấn ñề LQG là cực tiểu hoá chuẩn H2 của hệ thống vòng
kín hình (4.25) với (w,v) như ngõ vào và (z,u) như ngõ ra.
Cấu hình của hình (4.25) là trường hợp ñặc biệt của cấu hình hình (4.26).Ở
hình (4.26) v là ngõ vào mở rộng (w và v trong hình (4.25)).Tín hiệu z là tín
hiệu sai số (lý tưởng bằng 0)(z và u trong hình (4.25)).Thêm vào ñó u là ngõ
vào ñiều khiển và y là ngõ ra quan sát .G là ñối tượng tổng quát và Ce là bộ
ñiều khiển .

v z
G
u y

Ce

Hình 4.26: Vấn ñề chuẩn H2


4.4.3 Vấn ñề chuẩn H2 và lời giải của nó

Vấn ñề tối ưu chuẩn H2 là lựa chọn bộ ñiều khiển K ở hình (4.26) ñể :


a. Ổn ñịnh với hệ thống vòng kín và
b. Cực tiểu hoá chuẩn H2 của hệ thống vòng kín (với v là vào, z là ngõ ra)
Sơ ñồ hình 4.26 ñược mô tả bởi hệ phương trình trang thái sau:
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.200)

Trang 469
Chương 4 : ðiều khiển bền vững

z (t ) = C1 x(t ) + D11v(t ) + D12 u (t ) (4.201)

y (t ) = C 2 x(t ) + D21v(t ) + D22 u (t ) (4.202)


Vấn ñề tối ưu H2 có thể ñược giải quyết bởi việc dẫn tới vấn ñề LQG. Giải
quyết vấn ñề tối ưu H2 như thể là vấn ñề LQG. ðó là , cực tiểu hoá :
{ }
E z T (t ) z (t ) (4.203)
Giả sử rằng v là nhiễu trắng ngõ vào với ma trận mật ñộ V=I.

Hồi tiếp trạng thái:

ðầu tiên, xem xét lời giải với hồi tiếp trạng thái .Khảo sát hai phương trình :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.204)

z (t ) = C1 x(t ) + D11v(t ) + D12 u (t ) (4.205)


Nếu D11 ≠ 0 thì ngõ ra z có thành phần nhiễu trắng . ðiều này có thể làm cho
trung bình ngõ ra toàn phương (4.203) không xác ñịnh. Vì vậy chúng ta giả
sử rằng D11 = 0 . Dưới sự giả sử này chúng ta có :
C x(t )  z (t )
z (t ) = C1 x(t ) + D12 u (t ) = [I D12 ] 1  = [I D12 ] 0  (4.206)
 u (t )   u (t ) 
với z0(t) = C1x(t). Do ñó

 I   z (t ) 
E{z T (t ) z (t )} = E  z0T (t ) u T (t )   T  [ I D12 ]  0 
 D12   u (t ) 
(4.207)
 I D12   z0 (t ) 
= E  z0T (t ) uT (t )   T  
 D12 D12 D12   u (t ) 
T

ðây là vấn ñề bộ ñiều chỉnh tuyến tính với thành phần chéo ở ngõ ra và ngõ
vào .Nó có lời giải nếu hệ thống x& (t ) = Ax(t ) + B2 u (t ) , z 0 (t ) = C1 x(t ) là ổn
ñịnh và tìm ñược, ma trận trọng lượng

 I D12 
D T (4.208)
 12 D12T D12 

Trang 470
Chương 4 : ðiều khiển bền vững

Là xác ñịnh dương. ðiều kiện cần và ñủ cho (4.208) là D12T D12 không suy
biến .Lời giải của vấn ñề ñiều chỉnh là luật hồi tiếp trạng thái:
u (t ) = − Kx(t ) (4.209)

Hồi tiếp ngõ ra :

Nếu trạng thái là không có giá trị cho hồi tiếp thì cần ñược ước lượng với
một bộ lọc Kalman. Xem xét hai phương trình :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.210)
y (t ) = C 2 x(t ) + D21v(t ) + D22 u (t ) (4.211)
Phương trình thứ hai có thể trở thành dạng chuẩn cho bộ lọc Kalman nếu
coi y(t) – D22u(t) như là biến quan sát hơn là y(t).Nếu biểu thị nhiễu sự quan
sát là v (t ) = D21v(t ) thì :
x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.212)
y (t ) − D22 u (t ) = C 2 x(t ) + v (t ) (4.213)
Xác ñịnh một hệ thống nhiễu với những thành phần nhiễu tương quan chéo
chúng ta có:
 v(t + τ )  T  I 
E  [ ]
v (t ) v T (t ) = E   v(t + τ )v T (t ) I [ T
D21 ]
v (t + τ )  D21 
(4.214)
 I D21T

= T 
δ (τ )
 D21 D21 D21 
Giả sử rằng hệ thống x& (t ) = Ax(t ) + B1v(t ) , y (t ) = C 2 x(t ) là ổn ñịnh và tìm
ñược , và ma trận mật ñộ
 I D21T

 T 
(4.215)
 D21 D21 D21 
xác ñịnh dương. ðiều kiện cần và ñủ cho(4.215) là D21 D21 T
không suy biến
Khi ñó sẽ tồn tại một bộ lọc Kalman :
x&ˆ (t ) = Axˆ (t ) + B2 u (t ) + L[( y (t ) − C 2 xˆ (t ) − D22 u (t )] (4.216)
Ma trận ñộ lợi L ñược tìm từ thủ tục thiết kế bộ lọc Kalman. Vấn ñề hồi tiếp
ngõ ra ñược lấy :
u (t ) = − Kxˆ (t ) (4.217)
K giống như ñộ lợi hồi tiếp trạng thái ở (4.209)

Trang 471
Chương 4 : ðiều khiển bền vững

Xem xét vấn ñề tối ưu H2 cho ñối tượng tổng quát :


x& (t ) = Ax(t ) + B1v(t ) + B2 u (t ) (4.218)
z (t ) = C1 x(t ) + D12 u (t ) (4.219)
y (t ) = C 2 x(t ) + D21v(t ) + D22 u (t ) (4.220)
Giả sử :
• Hệ thống x& (t ) = Ax(t ) + B2 u (t ) , y (t ) = C 2 x(t ) là ổn ñịnh và tìm ñược
.
 A − sI B1 
• Ma trận  có hạng ñầy ñủ các hàng ngang cho mọi
 C2 D21 
s = jω và D21 có hạng ñầy ñủ các hàng ngang
 A − sI B2 
• Ma trận  có hạng ñầy ñủ các cột cho mọi s = jω và
 C1 D12 
D12 có hạng ñầy ñủ các cột

Dưới những giả sử này bộ ñiều khiển hồi tiếp ngõ ra tối ưu là
xˆ& (t ) = Axˆ (t ) + B 2 u (t ) + L[ y (t ) − C 2 xˆ (t ) − D22 u (t )] (4.221)
u (t ) = − Kxˆ (t ) (4.222)
Ma trận ñộ lợi hồi tiếp trạng thái và bộ quan sát là :
K = ( D12T D12 ) −1 ( B2T X + D12T C1 ) , L = (YC2T + B1 D21 T
)( D21 D21T −1
) (4.223)

Ma trận ñối xứng X,Y là nghiệm xác ñịnh dương duy nhất của phương trình
ñại số Riccati:
AT X + XA + C1T C1 − ( XB2 + C1T D12 )( D12T D12 ) −1 ( B2T X + D12T C1 ) = 0
T −1
AY + AY T + B1 B1T − (YC2T + B1 D21
T
)( D21 D21 ) (C 2Y + D21 B1T ) = 0
(4.224)

4.5 Ứng dụng trong MABLAB


4.5.1 LQG hệ lò xo ñệm
Xét hệ thống lò xo ñệm như hình vẽ sau:

Trang 472
Chương 4 : ðiều khiển bền vững

Với các thông số của hệ thống như sau:

M=1 m=0.1

b=0.0036 k=0.091

Biến trạng thái của hệ thống: x = [d d& y y& ]T

Phương trình Biến Trạng Thái của hệ liên tục:

 x& = Ax + Bu

 y = Cx + Du

với ma trận Biến Trạng Thái ñược cho như sau:

 0 1 0 0 
 −k 0
 −b k b  0
 
A = 
m m m m
; B= 0 
0 0 0 1   
 
 k b −k −b  1
 M  M 
M M M 

1 0 0 0  0 
C = 0 0 1 0  ; D = 0 
0 0 0 0  1 

Thời gian lấy mẫu: T=0.4(s)

Trang 473
Chương 4 : ðiều khiển bền vững

Khảo sát hệ thống trên dùng phương pháp LQG.

Sơ ñồ khối của một bộ ñiều khiển LQG như sau:

Từ sơ ñồ khối trên, ta thấy rằng cấu trúc của bộ ñiều khiển LQG chính là bộ
ñiều khiển LQR kết hợp với bộ ước lượng Kalman và có xét ñến nhiễu quá
trình w(k) và nhiễu ño lường v(k).
Phương trình Biến Trạng Thái của hệ rời rạc khi có xét ñến nhiễu như sau:
 x(k + 1) = Φx(k ) + Γu (k ) + w(k )

 y (k ) = Cx(k ) + Du (k ) + v(k )

với luật ñiều khiển: u (k ) = − Kxˆ (k )

Sơ ñồ mô phỏng hệ thống:

Trang 474
Chương 4 : ðiều khiển bền vững

KẾT QUẢ: ðáp ứng của hệ thống

Trang 475
Chương 4 : ðiều khiển bền vững

4.5.2 Thiết kế H∞ cánh tay mềm dẻo


Xét thanh ñồng chất, khối lượng phân bố ñều, chiều dài là L. Thanh ñược
chia thành 3 phần tử có ñộ dài bằng nhau h = L 3 .
y0
y
3

2
x
1
0 θ x0

Hình 4.27 : Thanh mềm dẻo ñược chia thành 3 phần tử


Chiều dài thanh: l = 0.98 m, khối lượng thanh: m = 0.35 kg, ñộ cứng biến
dạng: EI = 72.2 N.m2, quán tính trục ñộng cơ: IH = 0.025 kg.m2

Dùng phương pháp phần tử hữu hạn và phương trình Euler-Lagrange mô


hình hóa cánh tay mềm dẻo.

Mô hình biểu diễn trạng thái của ñối tượng (n=3) có dạng như sau:

0 0 0 0 1 0 0 0 0
0 0 0 0 0 1 0 0  0
  
0 0 0 0 0 0 1 0 0
   
0 0 0 0 0 0 0 1 0
x& =  x +  T
0 u12 u13 u14 0 0 0 0  u11 
   
0 u22 u23 u24 0 0 0 0 u21 
0 u32 u33 0 0 0 0 u 
 34
  31 
0 u42 u43 u44 0 0 0 0  u41 

y = [l3 0 0 1 0 0 0 0] x

Trang 476
Chương 4 : ðiều khiển bền vững

T
Vectơ trạng thái ñược ñịnh nghĩa: x = θ q1 q2 q3 θ& q&1 q&2 q&3 


trong ñó:θ : góc quay của trục motor, θ& =
dt

dqi
qi : chuyển vị (ñộ biến dạng) của nút I, q& i =
dt

Hàm truyền ñạt của ñối tượng:

G 0 ( s ) = C ( sI − A) −1 B + D
990679.4792 (s+598.2) (s-598.2) (s+167.2) (s-167.2)
G0 ( s ) =
s (s + 1.309e004) (s 2 + 1.215e005) (s 2 + 93.16s + 8.678e005)
2 2

Thông thường ,trước khi ñưa mô hình vào sử dụng ,cần phải sửa ñổi mô
hình dựa trên biểu ñồ Bode.
990679.4792 (s+598.2) (s-598.2) (s+167.2) (s-167.2)
G (s) = 2 2 2 2
(s+1e-006) (s + 11.44s + 1.309e004) (s + 34.86s + 1.215e005) (s + 93.16s + 8.678e005)

Ta sử dụng G(s) làm mô hình danh ñịnh và sử dụng thủ tục LSDP thiết kế
bộ ñiều khiển
Sơ ñồ mô phỏng:

Trang 477
Chương 4 : ðiều khiển bền vững

Chú thích các khối trong sơ ñồ:


Step Khối tạo tín hiệu ñặt là hàm nấc thang ñơn vị.
Gain Bộ tiền xử lý, hệ số khuếch ñại = - K ∞ (0)W2 (0) .

W1, W2 Các hàm nắn dạng chỉ ñịnh trong thủ tục LSDP
Kinf Bộ ñiều khiển K ∞ ñạt ñược sau bước 3 của thủ tục
LSDP.
Flexible Link Khối giả lập ñối tượng ñiều khiển. Lẽ ra khối này
chỉ có một ñầu vào – một ñầu ra, nhưng phần hoạt
hình (animation) cần lấy trạng thái của ñối tượng
ñể vẽ, nên khối này còn có các ñầu ra phụ q
(chuyển vị nút) và Theta (góc quay của trục).
Disturbance Khối tạo nhiễu tải, phát tín hiệu có dạng hàm nấc
âm.
Noise Khối tạo nhiễu ño.
Load Nạp dữ liệu từ file loaddata.m ñể mô phỏng.
Design W1 (Raw) Kích hoạt công cụ hỗ trợ thiết kế sơ bộ hàm nắn
dạng W1.
Design W1 (Fine) Kích hoạt công cụ hỗ trợ thiết kế cho phép tinh
chỉnh hàm nắn dạng W1.
Plot G/W1/Gs/L/ST Khi nhấp kép chuột vào những khối này, Matlab sẽ
vẽ biểu ñồ Bode các hàm tương ứng.
Info Hiển thị thông tin hệ thống lên Workspace.

Trang 478
Chương 4 : ðiều khiển bền vững

Công cụ hỗ trợ thiết kế


Design W1 (Raw)
Công cụ này ñược sửa lại từ công cụ shapemag.m của MATLAB cho tiện sử
dụng với phần mô phỏng ñiều khiển trong luận án này. Design W1 (Raw) có
giao diện như sau:

Sử dụng: Người thiết kế chỉ ñịnh các ñiểm gãy (ñiểm chỉ ñịnh), các ñiểm
này sẽ tự ñộng ñược nối với nhau bằng các ñoạn thẳng tạo nên dạng chỉ
ñịnh, sau ñó ñiền bậc mong muốn của W1 vào ô Bậc của W1, và nhấn nút
Xấp xỉ ñể MATLAB phát sinh W1. Sau khi có ñược W1, người thiết kế cần
phải tinh chỉnh lại hàm này bằng công cụ Design W1 (Fine).

Trang 479
Chương 4 : ðiều khiển bền vững

Design W1 (Fine)

Công cụ này ñược xây dựng dựa trên giao diện ñồ họa của JF Whidborne và
SJ King. Design W1 (Fine) có thể ñược sử dụng ñộc lập, hoặc sử dụng ñể
tinh chỉnh dạng của W1 ñạt ñược sau khi sử dụng Design W1 (Raw). Design
W1 (Fine) có giao diện như sau:

Sử dụng: Nếu Design W1 (Fine) ñược sử dụng ñộc lập, thì lúc khởi ñộng W1
= 1; nếu ñược sử dụng sau Design W1 (Raw), thì W1 sẽ thừa kế kết quả ñạt
ñược từ Design W1 (Raw). Người thiết kế có thể thêm/bớt cực-zero, dịch
chuyển cực-zero thêm/bớt khâu tích phân, hay thay ñổi ñộ lợi của W1 bằng
các công cụ ở bên phải giao diện. Sau cùng, người thiết kế nhấn nút Tính
Kinf ñể tổng hợp bộ ñiều khiển. Hộp thoại xuất hiện sau khi nhấn nút Tính

Trang 480
Chương 4 : ðiều khiển bền vững

Kinf cho biết thông tin về giá trị γ min ñạt ñược, và ñưa ra 3 lựa chọn cho
người dùng chọn.

Nhấn nút Trở về ñể quay lại giao diện Design W1 (Fine) hiệu chỉnh W1.
Nhấn nút ðáp ứng nấc nếu muốn xem ñáp ứng với ñầu vào hàm nấc thang
ñơn vị của ñối tượng danh ñịnh. Nhấn nút Mô phỏng, kết quả thiết kế (Kinf,
W1) sẽ ñược chuyển vào Workspace ñể chạy mô phỏng.
Load
Khi nhấp kép chuột lên khối Load, Simulink sẽ gọi loaddata.m. Tệp này
chứa toàn bộ thông số thiết kế của hệ thống. Người thiết kế có thể ñặt hàm
nắn dạng W1 vào tệp này nếu muốn thiết kế “bằng số”

Sau bước thiết kế, Kinf và W1 ñược nạp vào Workspace dưới dạng mô hình

trạng thái. ðể chạy mô phỏng, nhấn nút .

Kết quả mô phỏng:

Chọn hàm nắn dạng:


150.51 (s + 0.9) 2
W1 ( s ) =
s (s + 10) 2 ( s + 2)

Kết quả thiết kế:

Trang 481
Chương 4 : ðiều khiển bền vững

Giá trị γ nhỏ nhất: γ min = 3.68.


Chọn γ = 1.05 γ min = 3.86
Bộ ñiều khiển ñạt ñược:
-131.7524 (s+10.17) (s+9.817) (s+2.146) (s 2 + 1.103s + 0.4046)
K∞ =
(s+35.13) (s+16.61) (s 2 + 1.799s + 0.8091) (s 2 + 11.61s + 96.32)

ðáp ứng của hệ thống:


r(t) là tín hiệu ñặt, y(t) vị trí ñầu mút, u(t) là ñiện áp ñiều khiển, q(t) là
ñộ dịch chuyển ngang của ñầu mút.

Hình 3.28: ðáp ứng quá ñộ của hệ thống

Trang 482
Chương 4 : ðiều khiển bền vững

4.5.3 ðiều khiển bền vững H∞ với bài toán bồn nước
Xét hệ thống có sơ ñồ như hình vẽ với ñối tượng ñiều khiển là bồn nước.

Hình 1: Mô hình bồn nước

Quan hệ giữa chiều cao h và ñiện áp ñiều khiển van u là : h = Pu (1)


− λS
Ke
Trong ñó : P = [1 + ∆Wm]Pnom = (2)
1 + τs

Hình 2: Sơ ñồ hệ thống kín phản hồi -1 ñơn vị

Hàm truyền gồm 3 thành phần chưa biết là : ñộ lợi K, thời gian trễ λ và
thời hằng τ. Khi ta thay ñổi 3 giá trị này thì hàm truyền của ñối tượng ñã
bị thay ñổi.
Yêu cầu của bài toán là: tìm giá trị của Wm và Pnom.
Mục ñích của bài toán không chỉ dừng lại ở việc tìm Wm và Pnom mà là
tìm một bộ ñiều khiển C(s) sao cho hệ thống danh ñịnh vòng kín (không
tính ∆) ổn ñịnh ñồng thời hệ thống vòng kín cũng ổn ñịnh dưới tác ñộng
của sai số mô hình .

Trang 483
Chương 4 : ðiều khiển bền vững

Phân tích bài toán:


Mô tả bồn nước trên theo sơ ñồ khối hệ hở là :

P = [(1 + ∆Wm)Pnom] Với ||∆||∞ ≤ 1 (3)


− λS
Ke
Trong ñó : P= (4)
1 + τs
Chọn tầm giới hạn của K, λ và τ.
Giả sử ta tìm ñược: K ∈ [Kmin, Kmax], λ ∈ [λmin, λmax], τ ∈ [τmin, τmax]
ðịnh nghĩa :

(5)
K e − λS
Chọn Pnom là : Pnom = (6)
1+ τs
Ta tiếp tục ñịnh nghĩa :

(7)
Ta có :
P( s ) − Pnom ( s ) (8)
= Wm ( s )∆, ∆ ∞ ≤1
Pnom ( s )
Chuẩn ∞ :
P ( jω ) − Pnom ( jω ) (9)
= Wm ( jω ) ∆
Pnom ( jω ) ∞

Vì : ∆ ≤1

P( jω ) − Pnom ( jω )
Nên : ≤ Wm ( jω ) (10)
Pnom ( jω ) ∞

Áp dụng vào bài toán ta có :


P ( jω ) (11)
− 1 ≤ Wm ( jω ) ∞
Pnom ( jω ) ∞

Trang 484
Chương 4 : ðiều khiển bền vững

⇒ Ke − λS (1 + τ s ) (12)
− λS
−1 ≤ Wm ( jω ) ∞
(1 + τs ) K e ∞
Mà chuẩn ||G||∞ chính là khoảng cách lớn nhất từ tâm tọa ñộ mặt phẳng
phức tới một ñiểm trên ñường ñặc tính tần biên – pha của G(s).
Vì bài toán ta ñang xét là hệ SISO nên ta có : G ∞ = sup G ( jω )
 K + δK 
Suy ra : Wm (s) ≥   τ s + 1 e −δλS − 1 (13)
 K  τ + δτ s + 1 
( )
 
Mở rộng của bài toán (sơ ñồ hình 2):
Bộ ñiều khiển C(s) có thể là bộ ñiều khiển PID hay các khâu sớm trễ
pha.
Sai số mô hình ∆(s) ñược xem như ổn ñịnh nhưng không biết rõ ràng.
Giả sử ∆(s) bị chặn như sau :
∆ ( S ) ≤ Wm ( s ) , ∀ω ∈ [0, ∞) (14)
Wm(s) là hàm chặn trên của ∆(s), ổn ñịnh và biết trước.
Kết quả ổn ñịnh bền vững cho thấy rằng nếu bộ ñiều khiển C(s) ñược
chọn sao cho hệ danh ñịnh vòng kín (không tính ∆(s)) trong hình trên ổn
ñịnh tiệm cận và thỏa mãn bất ñẳng thức sau :
Pnom ( s )C ( s)Wm ( S )
<1 (15)
1 + Pnom C ( s ) ∞
thì hệ thống vòng kín cũng ổn ñịnh dưới tác ñộng của sai số mô hình
∆(s). Bất ñẳng thức (15) chính là ñiều kiện ổn ñịnh bền vững (chuẩn H∞)
của hệ thống.
Như vậy, mục tiêu của bài toán tổng hợp bộ ñiều khiển C(s) thỏa mãn
ñiều kiện ràng buộc ổn ñịnh bền vững (15).
Giải:
Trước tiên ta tìm khoảng giới hạn của ñộ lợi K, thời gian trễ λ và thời
hằng τ.
K ∈ [1, 599] , λ ∈ [1, 143] , τ ∈ [1, 1439]
Ta có :
K = 300 λ = 72 τ = 720
δK = 299 δλ = 71 δτ = 719
Từ biểu thức (13 ) :
 K + δK  τ s + 1 
Wm ( s) ≥   e −δλS − 1
( )
 K  τ + δτ s + 1 
  

Trang 485
Chương 4 : ðiều khiển bền vững

Vẽ biểu ñồ bode biên cho vế phải và tìm giá trị chặn trên của nó ñể cho
ra ñường bao của biểu ñồ bode biên khi các giá trị δK , δλ , δτ lần lượt
chạy, tức là từ các giá trị trung bình ta tỏa ra xung quanh ñể tìm tầm giới
hạn của nó.
Với các thông số ñược chọn như trên, qua nhiều lần thử nghiệm, kết quả
Wm chặn trên khi các thông số δK , δλ , δτ chạy là :
3.2( s + 0.035)
Wm = (16)
s + 0.08
Bây giờ ta thiết kế bộ ñiều khiển C(s) ñiều khiển bền vững ổn ñịnh vòng
kín. ðể ñơn giản, chọn bộ hiệu chỉnh sớm pha có dạng:
a ( s + b)
C ( s) = (17)
cs + 1
Chọn:
b = 1 / τ = 1 / 720 = 0.0014 , vì thời hằng là 720 giây lớn, chọn b
ñể triệt tiêu thời hằng này.
c = 10 : c lúc này là thời hằng mới nên ta chỉ cần chọn nhỏ.
a =1/ K =1/300: Vì ta xét ñiều kiện vòng kín khi ∆ = 0 ( mô hình
danh ñịnh ) có ổn ñịnh không và ñồng thời ñiều kiện ổn ñịnh bền
vững phải thoả. Ở ñây thiết kế của chúng ta dựa vào biểu ñồ
Nyquist ñể xem xét tính ổn ñịnh, từ ñó tìm ra a. Khi a càng lớn
thì càng làm cho chuẩn vô cùng của biểu thức ñiều kiện bền
vững vượt xa 1, không thoả với ñiều kiện.
Lúc này, ñiều kiện ổn ñịnh vòng kín ñược thỏa. Vậy :
0.0033( s + 0.0014)
C ( s) =
10 s + 1
Sơ ñồ mô phỏng:

Trước tiên, ta mô phỏng kết quả tìm Wm . Cho ω =0.0001:0.2:100

Trang 486
Chương 4 : ðiều khiển bền vững

Khi δτ chạy, kết quả như sau:

Hình 3: ðặc tính biên tần của Wm ( jω ) và  K + δK  τ s + 1  ,


  e −δλS − 1
( )
 K  τ + δτ s + 1 
 
với δτ = 1:719, δK = 299 , δλ = 71 .
3.2( s + 0.035)
Wm = (ñường màu ñỏ) . Giá trị này không những thỏa trong
s + 0.08
trường hợp này mà còn thỏa trong các trường hợp khi δK , δλ chạy. Cụ thể
là :

Trang 487
Chương 4 : ðiều khiển bền vững

 
Hình 4: ðặc tính biên tần của Wm ( jω ) và  K + δK  τ s + 1  −δλS
e −1 ,


K

( )
 τ + δτ s + 1 

với δK = 299, δτ = 719, δλ = 1 : 71 .

 K + δK  τ s + 1 
Hình 5: ðặc tính biên tần của Wm ( jω ) và    −δλS − 1 ,
 K  τ + δτ s + 1 e
( )
  
với δK = 299, δτ = 1, δλ = 1 : 71 .

 
Hình 6: ðặc tính biên tần của Wm ( jω ) và  K + δK  τ s + 1  −δλS
−1 ,
  τ + δτ s + 1 e
( )

K
 
với δK = 1 : 299, δτ = 1, δλ = 71

Trang 488
Chương 4 : ðiều khiển bền vững

• Biểu ñồ Nyquist của mô hình ñối tượng :

Hình 7: Biểu ñồ Nyquist của P∆ với ∆ = 0 : 0.1 : 1 .

Khi ∆ càng lớn ( gần 1) thì vùng không chắc chắn của hệ thống càng
tăng, ứng với những ñường cong Nyquist phía ngoài. ðiều ñó cũng nói
lên ñược rằng sự thay ñổi của ∆ chính là sự thay ñổi của ñối tượng.
• Biểu ñồ Nyquist của (15) và ñáp ứng ngõ ra của hệ thống:

Hình 8: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 0 .

Trang 489
Chương 4 : ðiều khiển bền vững

Hình 9: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 0.5 .

Hình 10: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = −0.3 .

Trang 490
Chương 4 : ðiều khiển bền vững

Hình 11: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi ∆ = 1 .

Hình 12: Biểu ñồ Nyquist của ñiều kiện bền vững và ñáp ứng nấc của
hệ thống khi có nhiễu.

Nhìn vào biểu ñồ Nyquist của ñiều kiện bền vững ta nhận thấy rõ ràng giá
trị sup của biểu thức (15) ñược thoả và ñáp ứng ngõ ra hệ thống xung quanh
giá trị khi ∆ =0. Ta nói rằng hệ thống ñã ổn ñịnh bền vững.

Trang 491
Chương 4 : ðiều khiển bền vững

Kết luận:
Như vậy, vấn ñề của bài toán ñiều khiển bền vững là xác ñịnh cho ñược giá
trị chặn trên của ∆( s ) chính là sự thay ñổi lớn nhất của ñối tượng. Một khi
ñã xác ñịnh ñược rồi thì vấn ñề còn lại của chúng ta là việc thiết kế bộ ñiều
khiển thoả ñiều kiện bền vững. Và bộ ñiều khiển chỉ ñiều khiển bền vững
ñược trong một vùng chọn trước của các giá trị thay ñổi là K, λ , τ . Vượt ra
ngoài phạm vi giới hạn ñó thì sự ổn ñịnh bền vững là không chắc chắn hay
nói cách khác là hệ thống không còn bền vững nữa. Có nhiều cách thiết kế
bộ ñiều khiển C(s) như dùng phương pháp GA của ñiều khiển thông minh
ñể thiết kế bộ C(s) PID chẳng hạn. Ở ñây, ta thiết kế bộ hiệu chỉnh sớm pha
vì nó ñơn giản. Kết quả ñạt ñược khá tốt và ta ñã giải quyết ñược yêu cầu
của bài toán ñặt ra.

4.5.4 Ứng dụng thuật toán GA thiết kế bộ ñiều khiển PID tối ưu H2/H∞
1. Giới thiệu:
Bài toán kết hợp ñiều khiển H2/H∞ bao gồm việc thiết kế một bộ ñiều khiển
ổn ñịnh nội sao cho cực tiểu phiếm hàm chất lượng H2 và thỏa mãn ràng
buộc ổn ñịnh bền vững H∞ . Trong ví dụ này một thủ tục ñược ñề nghị thiết
kế bộ ñiều khiển PID nhằm ñạt ñược chất lượng tối ưu H2/H∞.
Bước ñầu tiên dựa theo tiêu chuẩn ổn ñịnh Routh-Hurwitz, xác ñịnh ñiều
kiện ñối với các thông số của bộ ñiều khiển PID ñể hệ thống vòng kín ổn
ñịnh. Bước thứ hai, xác ñịnh miền ổn ñịnh của bộ ñiều khiển PID, ñồng thời
thỏa mãn ràng buộc H∞. Trong bước ba, bài toán thiết kế trở thành bài toán
tìm một ñiểm trong không gian tìm ñược ở bước hai, ñể tìm cực tiểu phiếm
hàm H2. Thường thì cần phải xem xét bài toán cực tiểu một hàm có tính phi
tuyến cao, và tồn tại nhiều ñiểm cực tiểu cục bộ.
2. Mô tả bài toán
Cho hệ thống ñiều khiển PID như trong Hình 1. ðối tượng P(s) chịu tác
ñộng của nhiễu là ∆0(s), bộ ñiều khiển PID có dạng như sau:
C (s ) = k 1 + k 2 / s + k 3s (1)
+ e u
r C(s) [1+∆0(s)] P0(s) y
-

Hình 1: Hệ thống ñiều khiển PID với sai số nhân ở ñầu ra

Trang 492
Chương 4 : ðiều khiển bền vững

Nhiễu ñối tượng ∆0(s) ñược xem như ổn ñịnh nhưng không biết rõ ràng.Giả
sử ∆0(s) bị chặn như sau:

∆ 0 ( jω ) < δ 0 ( jω ) , ∀ω ∈ [0, ∞), (2)

δ0 (jω) là hàm chặn trên của ∆0(jω), ổn ñịnh và biết trước.


Kết quả ổn ñịnh bền vững cho thấy rằng nếu bộ ñiều khiển C(s) ñược chọn
sao cho hệ thống danh ñịnh vòng kín (không tính ∆0(s)) trong Hình 1 ổn
ñịnh tiệm cận và thỏa mãn bất ñẳng thức sau:

PO ( s )C ( s )δ O ( s )
<1 (3)
I + PO ( s )C ( s ) ∞

thì hệ thống vòng kín trong Hình 1 cũng ổn ñịnh dưới tác ñộng của sai số
mô hình ∆0(s). Bất ñẳng thức (3) chính là ñiều kiện ổn ñịnh bền vững (chuẩn
H∞) của hệ thống, từ ñịnh nghĩa chuẩn H∞:

A( s ) ∞
≡ sup A( jω ) (4)
ω ∈( 0 ,∞ )

ðiều kiện ổn ñịnh bền vững (3) ñược viết lại như sau:

P0 ( s )C ( s )δ 0 ( s ) P0 (− jω ) P0 ( jω )C (− jω )C ( jω )δ 0 (− jω )δ 0 ( jω )
= sup
1 + P( s) 0 C ( s ) ∞
ω∈[ 0 ,∞ ) (1 + P0 (− jω )C (− jω ))(1 + P0 ( jω )C ( jω ))

β (ω ) β (ω )
= sup = sup <1 (5)
α (ω ) ω∈[ 0 ,∞ ) α (ω )
ω∈[ 0,∞ )

Việc quét ω trong [0,∞) ñể tìm giá trị lớn nhất của β(ω)/α(ω) trong (5)
không phải là công việc dễ dàng. Thực tế, giá trị lớn nhất của β(ω)/α(ω) chỉ
xảy ra ở những ñiểm thỏa mãn phương trình sau:
dβ (ω ) dα (ω )
α (ω ) − β (ω )
d β (ω ) dω dω = 0
= (6)
dω α (ω ) α 2 (ω )

Trang 493
Chương 4 : ðiều khiển bền vững

Do ñó, chỉ cần tìm nghiệm λi của phương trình:


dβ (ω ) dα (ω ) n
α (ω ) − β (ω ) = ∏ (ω − λi ) = 0 (7)
dω dω i =1

Với kết quả trên, ràng buộc ổn ñịnh bền vững (3) tương ñương với:

β (λ i )
max <1 (8)
λi α (λ i )

Tuy nhiên, trong nhiên trong nhiều trường hợp nếu chỉ ổn ñịnh bền vững
không thì chất lượng của hệ thống không ñạt yêu cầu. Vì vậy việc hiệu
chỉnh tối ưu trong nhiều ứng dụng thực tế là cần thiết. Ví dụ này ñề cập ñến
phương pháp hiệu chỉnh tối ưu ñược thực hiện trên phiếm hàm H2:

min ∫ e 2 (t )dt (9)
C
0

với e(t) là sai số ñiều chỉnh trong hệ thống Hình 1.


R( s)
E ( s) = (10)
1 + P0 ( s )C ( s )

Theo nguyên lý Parseval, chúng ta có:



J = min ∫ e 2 (t )dt
C
0

1
j∞

= min E (− s)E (s)ds


k1 ,k2 ,k3 2π j −∫j∞

j∞
1 B( s) B(− s)
= min
k1 , k 2 , k 3 2πj ∫
− j∞
A( s ) A(− s )
ds (11)

m
A(s) và B(s) có thể ñược biểu diễn như sau: A( s ) = ∑ a k s k ,
k =0
m −1
B( s ) = ∑ bk s k ; phương trình (11) ñược viết lại như sau:
k =0

Trang 494
Chương 4 : ðiều khiển bền vững

 m−1 k  m −1 k 
j∞  ∑ bk s  ∑ bk ( − s ) 
1  k =0  k =0  ds
2πj −∫j∞  m
J m ( k1 , k 2 , k 3 ) = (12)
 m

 ∑ a k s k  ∑ a k (− s ) k 
 k =0  k =0 
Phương trình (12) có thể ñược giải nhờ lý thuyết thặng dư, giá trị của
Jm(k1,k2,k3) có thể tìm ñược trong Newton, 1957.
Phiếm hàm H2 có dạng như sau:
J m = min J m (k1 , k 2 , k 3 ) (13)
k1 , k 2 , k 3

Jm(k1, k2, k3) là hàm số của các thông số PID (k1, k2, k3), m là bậc ñối tượng.
Từ sự phân tích trên, bài toán thiết kế bộ ñiều khiển PID, kết hợp H2/H∞ trở
thành bài toán xác ñịnh bộ ñiều khiển PID ñể cực tiểu (13) dưới ràng buộc
ổn ñịnh bền vững (8). Một phương pháp hiệu quả ñể ñạt ñược lời giải tòan
cục trong bài tóan kết hợp H2/H∞ vẫn ñang ñược nhiều người quan tâm.
Trong phần tiếp theo chúng ta sẽ xem xét thuật tóan di truyền, và ứng dụng
thuật tóan này ñể giải quyết bài tóan ñiều khiển tích hợp H2/H∞ .
3. Phương pháp thiết kế
Phần này sẽ trình bày phương pháp xác ñịnh các thông số (k1, k2, k3) của bộ
ñiều khiển PID cho hai bài toán trên bằng thuật toán di truyền, sao cho ñạt
ñược giá trị cực tiểu của phiếm hàm H2, ñồng thời thỏa mãn ràng buộc ổn
ñịnh bền vững H∞.
3.1. Biểu diễn nhiễm sắc thể
Thuật toán di truyền làm việc trên các nhiễm sắc thể (những chuỗi số), chứ
không phải chính bản thân thông số ñó. Mỗi tập thông số (k1, k2, k3) của bộ
ñiều khiển PID sẽ ñược mã hóa và ghép lại thành một nhiễm sắc thể. Việc
mã hóa có thể ñược thực hiện bằng những chuổi số nhị phân hoặc thập phân.
Trong ví dụ này, sử dụng phương pháp mã hóa thập phân.
3.2. Hàm thích nghi và hàm ñánh giá
Hàm ñánh giá ñược ñịnh nghĩa như sau:

Trang 495
Chương 4 : ðiều khiển bền vững

E (k1 , k 2 , k 3 ) = J m (k1 , k 2 , k 3 ), k1 , k 2 , k 3 ∈ D (14)

Vế phải của (14) là phiếm hàm H2 mà chúng ta muốn cực tiểu, hàm ñánh giá
chỉ ñược xác ñịnh trong miền ổn ñịnh (D) của hệ thống.
Mục tiêu của chúng ta là tìm (k1, k2, k3) trong D ñể cực tiểu (14). Tương ứng
với mỗi nhiễm sắc thể ta sẽ có ñược một giá trị của hàm ñánh giá E(k1,k2,
k3). Sau ñó giá trị ñánh giá ñược ánh xạ thành giá trị thích nghi F(k1,k2, k3)
ñể cho phù hợp với thuật toán di truyền (tìm kiếm giá trị cực ñại). Quá trình
tìm kiếm giá trị nhỏ nhất của Jm(k1, k2, k3) tương ứng với quá trình tìm kiếm
giá trị lớn nhất của F(k1, k2, k3). Nhiễm sắc thể có Jm(k1, k2,k3) nhỏ hơn sẽ có
giá trị thích nghi lớn hơn.
Mối liên hệ giữa hàm thích nghi và hàm ñánh giá ñược biểu diễn như sau:

 β ( λi )
− E (k1 , k 2 , k 3 ) + b khi max <1
 λi α (λ i )
F ( k1 , k 2 , k 3 ) =  (15)
0 β ( λi )
 khi max ≥1

λ iα (λ i )

Ở ñây dấu trừ ñược sử dụng ñể chuyển bài toán cực tiểu thành bài toán cực
ñại, giá trị của b ñược chọn sao cho giá trị của hàm thích nghi luôn luôn
dương. ðối với các nhiễm sắc thể không thỏa mãn ñiều kiện (8), giá trị của
hàm thích nghi sẽ ñược gán bằng 0 (giá trị nhỏ nhất), vì vậy các nhiễm sắc
thể này sẽ không tồn tại trong thế hệ sau.
3.3. Các bước thực hiện
Từ sự phân tích trên, quá trình thiết kế bao gồm các bước sau:
(1) Bước 1: Áp dụng tiêu chuẩn Routh-Hurwitz, xác ñịnh ñiều kiện của các
hệ số PID ñể hệ thống vòng kín ổn ñịnh.
(2) Bước 2: Xác ñịnh miền ổn ñịnh (D) của ba thông số (k1, k2, k3).
(3) Bước 3: Thiết lập các thông số của thuật toán di truyền: xác suất lai, xác
suất ñột biến, kích thước quần thể, số thế hệ tối ña, ñiều kiện dừng,…
(4) Bước 4: Khởi tạo quần thể, mã hóa nhiễm sắc thể.

Trang 496
Chương 4 : ðiều khiển bền vững

(5) Bước 5: Tính λi từ phương trình (7).


(6) Bước 6: Tính giá trị thích nghi cho từng cá thể theo biểu thức (15).
(7) Bước 7: Thực hiện các phép toán di truyền.
(8) Bước 8: Kiểm tra ñiều kiện dừng, nếu ñiều kiện dừng chưa thỏa mãn thì
quay lại bước 5.
4. Ví dụ minh hoạ
Cho hệ thống ñiều khiển như hình 1, ñối tượng P0(s) có hàm truyền như sau:
1.8
P0 ( s ) = 2
s ( s + 2)
0.1
Sai lệch mô hình ∆0(s), bị chặn như sau: ∆ 0 ( s ) ≤ 2
s + 0.1s + 10

Với ngõ vào là hàm nấc, ta có thể dễ dàng tính ñược e(s), β (ω ) và α (ω ) .
Trong ví dụ này ta có m = 4, vì vậy phiếm hàm H2 của hệ thống là J4:
b32 (−a02a3 + a0a1a2 ) + (b22 − 2b1b3 )a0a1a4 + (b12 − 2b0b2 )a0a3a4 + b02 (−a1a42 + a2a3a4 )
J4 =
2a0a4 (−a0a32 − a12a4 + a1a2a3 )
1.8k1k3 − 2k2 + 4
=
7.2k1k3 − 3.6k12 − 8k2
Thuật toán di truyền bắt ñầu bằng việc tạo ngẫu nhiên một quần thể bao
gồm 200 nhiễm sắc thể, sau 15 thế hệ, tìm ñược bộ ñiều khiển PID thích hợp
với các thông số như sau, k1 = 3, k2 = 0.1, k3 = 30.

Hình 2: Chuẩn H2

Trang 497
Chương 4 : ðiều khiển bền vững

Hình 3: ðáp ứng nấc của hệ thống.


Sự hội tụ của phiếm hàm H2 ñược trình bày trong Hình 2. ðáp ứng nấc của
hệ thống ñược trình bày cho hai trường hợp: hệ danh ñịnh và hệ thống có sai
số mô hình (hình 3). Kết quả cho thấy bộ ñiều khiển ñược thiết kế có thể
ñiều khiển thành công hệ thống chịu tác ñộng của nhiễu.
5. Kết luận:
Ví dụ trên ñã giới thiệu một phương pháp thiết kế bộ ñiều khiển PID, kết
hợp với ñiều khiển H2/H∞ bằng thuật toán di truyền. Việc tối ưu hóa toàn
cục gần như ñạt ñược bằng các phép toán di truyền tái sinh, ñột biến và lai.
Kết quả thấy rằng có thể áp dụng phương pháp này ñể thiết kế bộ ñiều khiển
PID tối ưu H2/H∞ một cách ñơn giản, trong trường hợp hệ thống chịu tác
ñộng của nhiễu.

Trang 498
Chương 4 : ðiều khiển bền vững

CÂU HỎI ÔN TẬP VÀ BÀI TẬP

1. Khái niệm ñiều khiển bền vững


2. Chuẩn tín hiệu
3. Chuẩn ma trận
4. ðịnh nghĩa vết ma trận ,tính chất, trị suy biến của ma trận-ñộ lợi
chính.
5. Khái niệm ổn ñịnh nội , ổn ñịnh bền vững và ñịnh lý ñộ lợi nhỏ
6. ðiều khiển bền vững LQG (Sơ ñồ nguyên lý , bộ quan sát,bộ lọc
Kalman , giải thuật thiết kế)
7. Biểu ñồ Bode cho hệ ña biến
8. Hàm nhạy và bù nhạy
9. Sai số mô hình phân tích coprime
10. Thiết kế bền vững H ∞
11. Nắn dạng vòng H ∞
12. Thiết kế tối ưu H2
13. Cho hệ thống:

d(t)

s(t) u(t) + z(t)


+ +
K G
r(t)
-

+ n(t)

ðối tượng G(s) ñược mô tả:

0 1 0 0 0 
  1 0 0
x& = 0 − 3 0 x + 1 0u, z =  x
 0 0 1 
0 0 0 0 1
Và bộ ñiều khiển K(s)=2I2
a. Tìm ñộ lợi vòng ña biến GK(j ω )
b. Tìm hàm nhạy và hàm bù nhạy
c. Tìm hàm truyền vòng kín từ r(t) ñến z(t) và các cực của vòng
kín
14. Thiết kế LQG dùng Matlab mô phỏng mô hình con lắc ngược

Trang 499
Chương 4 : ðiều khiển bền vững

15. Cho hệ thống như hình vẽ:

u
ω G

K y d

 1 
7 8   s + 1 0  7 8 −1
Với: G =  
6 7   0 2  6 7

 s + 2
a. Vẽ ñường cong Nyquist với giá trị riêng của G.
b. Chứng minh rằng G có mối liên hệ trạng thái sau:
− 1 0   7 − 8 7 8 
x& =   x+  u, y= x
 0 − 2 − 12 14  6 7  0
k
c. Bằng cách ñánh giá tuyến tính của det(sI – A – BKC), với K =  1 
 0 k2 
Chứng minh rằng 3 – 50k2 + 47k1 > 0 là ñiều kiện cần ñể hệ thống ổn
ñịnh.
Chú ý: ñể ñơn giản hoá phép tính, ta ñặt k1 = k + δ và k 2 = k − δ .
16. Thiết kế LQG cho hệ thống sau:
 x&1  1 1  x1  1 0 0 
 x&  = 0 1  x  + σ 1 0ω + 1u
 2   2     
 ρ ( x1 + x 2 )
z= 
 u 
x 
y = [1 0] 1  + [0 1]ω
x2 
a. Chứng minh rằng bộ ñiều khiển tối ưu ñược cho bởi:
αβ (1 − 2s )
k= 2
s + (α + β − 2) s + 1 + αβ
Với: α = 2 + 4 + ρ ; β = 2 + 4 + σ
b. Chỉ tiêu chất lượng tối ưu là gì? Chỉ tiêu chất lượng tối ưu thay ñổi
như thế nào với σ và ρ ?

Trang 500

You might also like