TLHT Các Phương Pháp Điều Khiển Hệ Phi Tuyến (Final)

BỘ CÔNG THƯƠNG
TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP
Nguyễn Hải Bình ( chủ biên)

Võ Thu Hà
TÀI LIỆU HỌC TẬP

CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN HỆ PHI TUYẾN
(Lưu hành nội bộ)
Hà Nội – 2022
1
LỜI NÓI ĐẦU
Tài liệu học tập Các phương pháp điều khiển hệ phi tuyến được biên soạn theo kế
hoạch đào tạo và chương trình môn học các phương pháp điều khiển hệ phi tuyến của
ngành CNKT Điều khiển và Tự động hoá, trường Đại học Kinh tế - Kỹ thuật Công nghiệp.
Nội dung tài liệu gồm 6 chương chính:
Chương 1: Tổng quan về các phương pháp điều khiển phi tuyến.
Chương 2: Các phương pháp khảo sát và thiết kế hệ phi tuyến.
Chương 3 : Điều khiển tối ưu.
Chương 4: Điều khiển bền vững.
Chương 5: Điều khiển thích nghi.
Chương 6: Một số ví dụ về thiết kế hệ thống điều khiển nâng cao
Nhóm tác giả chân thành cảm ơn Ban Giám hiệu trường Đại học Kinh tế - Kỹ thuật
Công nghiệp, Khoa Điện, Bộ môn điều khiển và Tự động hóa đã động viên và tạo mọi điều
kiện thuận lợi để nhóm tác giả viết tài liệu học tập. Trong quá trình biên soạn không tránh
khỏi còn nhiều sai sót, tác giả mong nhận được ý kiến đóng góp của các bạn đồng nghiệp
và đọc giả để tài liệu được hoàn thiện hơn.
Địa chỉ: Khoa Điện, Trường Đại học Kinh tế Kỹ thuật Công nghiệp, 456 Minh Khai, Hai
Bà Trưng, Hà nội.
Website: khoadien.uneti.edu.vn.
Email: khoadien@uneti.edu.vn.
Ngày 28 tháng 3 năm 2022
2
MỤC LỤC
LỜI NÓI ĐẦU ..................................................................................................................... 2
MỤC LỤC ........................................................................................................................... 3
DANH MỤC HÌNH VẼ .............................................................................................. …7
CHƯƠNG I: TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN PHI TUYẾN ... 14
1.1. HẠN CHẾ CỦA LÝ THUYẾT ĐIỀU KHIỂN TUYẾN TÍNH KINH ĐIỂN ...... 14
1.2. GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN HIỆN ĐẠI ................... 16
1.2.1. Điều khiển phi tuyến ....................................................................................... 16
1.2.2. Điều khiển tối ưu ............................................................................................ 16
1.2.3. Điều khiển bền vững ....................................................................................... 17
1.2.4. Điều khiển thích nghi ...................................................................................... 18
1.2.5. Lựa chọn các phương pháp điều khiển ........................................................... 18
1.3 VÍ DỤ VỀ HỆ PHI TUYẾN ................................................................................... 21
CHƯƠNG 2: CÁC PHƯƠNG PHÁP KHẢO SÁT VÀ THIẾT KẾ HỆ PHI TUYẾN .... 26
2.1. KHÁI NIỆM VỀ HỆ PHI TUYẾN ........................................................................ 26
2.1.1. Khái niệm ........................................................................................................ 26
2.1.2. Tính chất và đặc điểm riêng của phi tuyến ..................................................... 27
2.2. PHƯƠNG PHÁP MẶT PHẲNG PHA .................................................................. 29
2.3. PHƯƠNG PHÁP TUYẾN TÍNH HÓA GẦN ĐÚNG........................................... 32
2.4. PHƯƠNG PHÁP TUYẾN TÍNH HÓA ĐIỀU HÒA............................................. 36
2.4.1 Khái niệm ......................................................................................................... 36
2.4.2 Hàm mô tả hay hệ số khuếch đại phức của khâu phi tuyến ............................. 37
2.5. PHƯƠNG PHÁP TUYẾN TÍNH HÓA TỪNG ĐOẠN ........................................ 45
2.5.1. Đặt vấn đề ....................................................................................................... 45
2.5.2. Ví dụ ứng dụng ............................................................................................... 45
2.6. TIÊU CHUẨN LYAPUNOV ................................................................................ 47
2.6.1. Khái niệm về ổn định ...................................................................................... 47
2.6.2. Phương pháp thứ nhất của Lyapunov ............................................................. 49
2.6.3. Phương pháp thứ hai của Lyapunov ............................................................... 52
2.7. TIÊU CHUẨN ỔN ĐỊNH TUYỆT ĐỐI V. M. POPOV ....................................... 59
2.8. ĐIỀU KHIỂN HỒI TIẾP TUYẾN TÍNH HÓA .................................................... 65
2.8.1. Nội dung phương pháp ................................................................................... 65
2.8.2. Trình tự thiết kế hệ thống điều khiển hồi tiếp tuyến tính hoá......................... 68
2.8.3. Ứng dụng Malab mô phỏng hệ thống điều khiển hồi tiếp tuyến tính hóa ...... 68
3
2.9. ĐIỀU KHIỂN TRƯỢT .......................................................................................... 71
2.9.1. Nội dung phương pháp ................................................................................... 71
2.9.2. Trình tự thiết kế bộ điều khiển trượt bám quỹ đạo ......................................... 73
2.9.3. Ứng dụng Matlab mô phỏng hệ thống điều khiển trượt ................................. 76
CHƯƠNG 3: ĐIỀU KHIỂN TỐI ƯU ............................................................................... 81
3.1 CHẤT LƯỢNG TỐI ƯU ........................................................................................ 81
3.1.1 Đặc điểm của bài toán tối ưu ........................................................................... 81
3.1.2 Xây dụng bài toán tối ưu .................................................................................. 85
3.1.3. Các ví dụ minh họa ......................................................................................... 90
3.2. CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN TỐI ƯU .................................................... 96
3.2.1. Phương pháp biến phân cổ điển Euler_Lagrange ........................................... 96
3.2.2. Phương pháp quy hoạch động Bellman ........................................................ 103
3.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton ................................................... 111
3.3. ĐIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM DẠNG TOÀN
PHƯƠNG .................................................................................................................... 118
3.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính ............................................. 118
3.3.2. Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương.
Phương trình Riccati đối với hệ liên tục. ................................................................ 119
3.3.3 Phương trình Riccati đối với hệ rời rạc ......................................................... 122
3.3.4. Các bước giải bài toán toàn phương tuyến tính ............................................ 124
3.4. ỨNG DỤNG MATLAB GIẢI BÀI TOÁN TỐI ƯU .......................................... 128
3.4.1 Tối ưu hoá tĩnh ............................................................................................... 128
3.4.2. Điều khiển tối ưu cánh tay máy hồi tiếp góc θ ............................................. 129
3.4.3. Hệ thống tác động nhanh .............................................................................. 132
CHƯƠNG 4: ĐIỀU KHIỂN BỀN VỮNG ...................................................................... 143
4.1. GIỚI THIỆU ........................................................................................................ 143
4.1.1 Khái niệm điều khiển bền vững ..................................................................... 143
4.1.2 Chuẩn của tín hiệu ......................................................................................... 144
4.1.3 Đại số ma trận ................................................................................................ 146
4.1.4. Trị suy biến của ma trận – độ lợi chính ( Princical gain) ............................. 150
4.1.5. Ổn định nội ................................................................................................... 151
4.1.6. Định lý độ lợi nhỏ ( Small Gain Theorem) ................................................... 152
4.1.7. Ổn định bền vững.......................................................................................... 152
4.2. PHƯƠNG PHÁP LQG (Linear Quadratic Gaussian) .......................................... 154
4
4.2.1 Đặt vấn đề ...................................................................................................... 154
4.2.2 Bộ quan sát ..................................................................................................... 155
4.2.3. Bộ lọc Kalman .............................................................................................. 156
4.2.4 Giải thuật thiết kế LQG ................................................................................. 166
4.2.5 Ví dụ: ............................................................................................................. 167
4.3. ĐIỀU KHIỂN BỀN VỮNG H ........................................................................... 171
4.3.1 Biểu đồ Bode Đa Biến (Multivariable Bode Plot) ......................................... 171
4.3.2 Hàm nhạy và hàm bù nhạy ............................................................................ 173
4.3.3 Thiết kế bền vững H ................................................................................... 177
4.4. THIẾT KẾ TỐI ƯU H 2 ....................................................................................... 186
4.4.1. Đặt vấn đề...................................................................................................... 186
4.4.2. Tối ưu H 2 ..................................................................................................... 187
4.4.3.Vấn đề chuẩn H 2 và lời giải của nó ............................................................... 188
4.5. ỨNG DỤNG MABLAB MÔ PHỎNG HỆ THỐNG ĐIỀU KHIỂN BỀN VỮNG
..................................................................................................................................... 191
4.5.1. LQG hệ lò xo đệm......................................................................................... 191
4.5.2. Thiết kế H cánh tay mềm dẻo ....................................................................... 193
CHƯƠNG 5: ĐIỀU KHIỂN THÍCH NGHI ............................................................... 201
5.1. KHÁI NIỆM ......................................................................................................... 201
5.1.1. Định nghĩa ..................................................................................................... 201
5.1.2. Phân loại các sơ đồ điều khiển thích nghi..................................................... 201
5.2. ƯỚC LƯỢNG CÁC THAM SỐ THÍCH NGHI THỜI GIAN THỰC ................ 203
5.2.1. Giới thiệu ...................................................................................................... 203
5.2.2. Mô hình hồi quy tuyến tính........................................................................... 203
5.2.3. Bình phương cực tiểu và hồi quy .................................................................. 204
5.2.4. Ước lượng tham số hệ thống động................................................................ 213
5.2.5. Các điều kiện thực nghiệm ........................................................................... 218
5.3. HỆ THÍCH NGHI THEO MÔ HÌNH CHUẨN – MRAS(MODEL REFERENCE
ADAPTIVE SYSTEMS) ............................................................................................ 220
5.3.1. Sơ đồ chức năng ............................................................................................ 220
5.3.3. Nội dung, phương pháp thiết kế MRAS ....................................................... 224
5.4. HỆ ĐIỀU KHIỂN TỰ CHỈNH ĐỊNH (STR – SeLF Tuning Regulator) ............ 234
5.4.1. Khái niệm về hệ điều khiển tự chỉnh định .................................................... 234
5.4.2. Bộ tự chỉnh định gián tiếp ............................................................................. 236
5
5.5. ĐIỀU KHIỂN HOẠCH ĐỊNH ĐỘ LỢI .............................................................. 240
5.5.1. Khái niệm ...................................................................................................... 240
5.5.2. Thiết kế bộ điều khiển hoạch định độ lợi ..................................................... 241
5.6. ỨNG DỤNG MABLAB MÔ PHỎNG HỆ THỐNG ĐIỀU KHIỂN THÍCH NGHI
..................................................................................................................................... 245
5.6.1. Điều khiển thích nghi theo mô hình chuẩn ................................................... 245
5.6.2. Điều khiển tự chỉnh gián tiếp ........................................................................ 249
CHƯƠNG 6: MỘT SỐ VÍ DỤ THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN NÂNG CAO255
6.1. GIỚI THIỆU ĐỐI TƯỢNG ĐIỀU KHIỂN ......................................................... 255
6.1.1. Hệ tay máy .................................................................................................... 255
6.1.2. Hệ truyền động khớp nối mềm ..................................................................... 263
6.2. THIẾT KẾ BỘ ĐIỀU KHIỂN LQG .................................................................... 265
6.3. THIẾT KẾ BỘ QUAN SÁT TRẠNG THÁI KALMAN .................................... 268
6.3.1. Bộ quan sát trạng thái ................................................................................... 268
6.3.2. Bộ quan sát trạng thái Kalman ...................................................................... 268
6.3.3. Thiết kế bộ quan sát trạng thái Kalman cho hệ thống khớp mềm ................ 270
6.4. THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI BẰNG PHƯƠNG PHÁP
TỐI ƯU HÀM MỤC TIÊU DÙNG BỘ LỌC KALMAN(LQG – Linear Quadratic
Gaussian) ĐIỀU KHIỂN KHỚP MỀM. ..................................................................... 275
6.4.1 Thiết kế bộ điều chỉnh phản hồi trạng thái LQR sử dụng bộ ước lượng trạng thái
Kalman điều khiển khớp mềm. ............................................................................... 275
6.4.2. Thực hiện mô phỏng bộ điều khiển đã thiết kế............................................. 279
6.5. Thiết kế bộ điều khiển thích nghi ......................................................................... 287
TÀI LIỆU THAM KHẢO ........................................................................................... 293
6
DANH MỤC HÌNH VẼ
Hình 1. 1: Cần trục, tay máy.............................................................................................. 15
Hình 1. 2: Lái tàu ............................................................................................................... 15
Hình 1. 3: Điều khiển máy bay .......................................................................................... 15
Hình 1. 4 : Điều khiển quá trình ........................................................................................ 16
Hình 1. 5: Điều khiển bền vững mô hình sai số nhân ....................................................... 17
Hình 1. 6: Điều khiển bền vững mô hình sai số cộng ....................................................... 18
Hình 1. 7: Sơ đồ khối tổng quát hệ điều khiển thích nghi ................................................. 18
Hình 1. 8: Hệ thống điều khiển oto ................................................................................... 19
Hình 1. 9: Điều khiển mực nước trong bồn ....................................................................... 19
Hình 1. 10: Điều khiển hệ tay máy .................................................................................... 20
Hình 1. 11: Hệ con lắc ngược ............................................................................................ 21
Hình 1. 12: Sơ đồ thân tự do của hệ con lắc ngược trên xe............................................... 21
Hình 2. 1:a) Đặc tính bão hòa; b) Đặc tính vùng chết; c) Vòng từ trễ ; d) Đáp ứng vòng
kín của một hệ thống với nhảy cộng hưởng ...................................................................... 28
Hình 2. 2:Các dạng quỹ đạo pha của hệ bậc 2 .................................................................. 30
Hình 2. 3: Các quỹ đạo khảo sát và quỹ đạo chuyển động của phi thuyền ....................... 33
Hình 2. 4: Đặc tính động cơ được điều khiển bằng role, trường hợp 1............................. 35
Hình 2. 5: Đặc tính động cơ được điều khiển bằng role, trường hợp 2............................. 35
Hình 2. 6: Hệ phi tuyến không có tác động kích thích bên ngoài ..................................... 36
Hình 2. 7:Hệ phi tuyến với kích thích đầu vào là sóng điều hòa ...................................... 36
Hình 2. 8:Hàm có vùng chết .............................................................................................. 39
Hình 2. 9: Khâu bão hòa .................................................................................................... 39
Hình 2. 10: Khâu rơle 3 vị trí có trễ .................................................................................. 40
Hình 2. 11:Khâu rơle 3 vị trí có trễ ................................................................................... 41
Hình 2. 12: Ví dụ hàm truyền hệ hở của 1 hệ phi tuyến.................................................... 43
Hình 2. 13: Hệ phi tuyến đặc tính rơle 3 vị trí không trễ với phần tuyến tính .................. 44
Hình 2. 14: Hệ điều khiển hồi tiếp chứa bão hòa .............................................................. 45
Hình 2. 15: Đáp ứng bậc thang của hệ bão hòa được tính bằng phân tích tuyến tính từng
đoạn ................................................................................................................................... 46
7
Hình 2. 16: Biểu diễn hình học định nghĩa ổn định chuyển động ..................................... 48
Hình 2. 17: Sơ đồ tùy động đơn giản................................................................................. 50
Hình 2. 18: Đáp ứng miền thời gian của một hệ cơ học đơn giản..................................... 53
Hình 2. 19: Mặt phẳng pha của một hệ cơ học đơn giản ................................................... 54
Hình 2. 20: Quỹ hằng số năng lượng trên mặt phẳng pha minh hoạ sự gia tăng năng
lượng theo thời gian ........................................................................................................... 55
Hình 2. 21:Sự thay đổi năng lượng và tốc độ năng lượng theo thời gian ......................... 55
Hình 2. 22: Hàm xác định dương ...................................................................................... 56
Hình 2. 23:Hệ điều khiển hồi tiếp phi tuyến được đề cập bởi Popov ............................... 59
Hình 2. 24:Vùng giới hạn của phi tuyến ........................................................................... 60
Hình 2. 25:Đặc tính phi tuyến có từ trễ thụ động .............................................................. 61
Hình 2. 26: Đặc tính phi tuyến có từ trễ tích cực ............................................................. 62
Hình 2. 27: Phương pháp Popov khi q là xác định ............................................................ 63
Hình 2. 28: Đường Popov trong mặt phẳng G*( jω) đối với trường hợp q ≥ 0 ................ 63
Hình 2. 29: Đường Popov trong mặt phẳng ...................................................................... 64
Hình 2. 30:Ví dụ hệ thống điều khiển phi tuyến ............................................................... 64
Hình 2. 31: Đặc tính tần số G*(jW) cho ví dụ hình 2.30 .................................................. 65
Hình 2. 32: Sơ đồ điều khiển hồi tiếp tuyến tính hóa ........................................................ 66
Hình 2. 33: Luật điều khiển hồi tiếp tuyến tính hóa .......................................................... 67
Hình 2. 34: Bộ điều khiển bám cho đối tượng đã được tuyến tính hóa ............................ 67
Hình 2. 35: Mô phỏng hệ thống điều khiển hồi tiếp tuyến tính hóa .................................. 70
Hình 2. 36: Mô phỏng khối hồi tiếp tuyến tính hóa .......................................................... 70
Hình 2. 37: Mô phỏng khối điều khiển bám...................................................................... 70
Hình 2. 38:Kết quả mô phỏng khi tín hiệu đặt là xung vuông .......................................... 70
Hình 2. 39:Kết quả mô phỏng khi tín hiệu đặt hình sin .................................................... 71
Hình 2. 40: Quỹ đạo pha lý tưởng của hệ bậc 2 chuyển động trên mặt trượt về gốc tọa độ
........................................................................................................................................... 73
Hình 2. 41: Quỹ đạo pha thực tế dao động quanh mặt trượt về gốc tọa độ,gây nên hiện
tượng chattering ................................................................................................................. 73
Hình 2. 42:Hàm sign(x) ..................................................................................................... 74
Hình 2. 43:Hàm sat() ......................................................................................................... 74
8
Hình 2. 44:Hệ con lắc ........................................................................................................ 76
Hình 2. 45: Mô phỏng khối điều khiển trượt ..................................................................... 77
Hình 2. 46: Kết quả mô phỏng khi tín hiệu chuẩn là xung vuông (m=0.1kg) .................. 78
Hình 2. 47: Kết quả mô phỏng khi tín hiệu chuẩn là xung vuông (m=10kg) ................... 78
Hình 3. 1:Sơ đồ hệ thống điều khiển ................................................................................. 81

Hình 3. 2: Tối ưu cục bộ và tối ưu toàn cục ...................................................................... 82
Hình 3. 3: Động cơ điện một chiều kích từ độc lập........................................................... 83
Hình 3. 4: Các đường đồng mức và vector gradient ......................................................... 91
Hình 3. 5:Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u) ....................... 93
Hình 3. 6: Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u) ...................... 94
Hình 3. 7: Đặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ .................. 101
Hình 3. 8:Luật điều khiển năng lượng tiêu hao tối thiểu................................................. 104
Hình 3. 9:a)Mũi tên chỉ ra trạng thái tối ưu, b)Lưới kết quả của bài toán tối ưu giải bằng
phương pháp quy hoạch động cho ví dụ 3.7.................................................................... 108
Hình 3. 10: Tối ưu hoá với nhiều điều kiện ràng buộc.................................................... 112
Hình 3. 11:Hàm chuyển đổi mẫu và bộ điều khiển tối ưu............................................... 114
Hình 3. 12: Hệ thống điều khiển ví dụ 3.9 ...................................................................... 124
Hình 3. 13:Mô hình cánh tay máy hai đoạn .................................................................... 129
Hình 3. 14: Kết quả mô phỏng vị trí đặt thay đổi theo hàm xung với θ1 ........................ 131
Hình 3. 15: Kết quả mô phỏng vị trí đặt thay đổi theo hàm xung với θ2 ........................ 132
Hình 3. 16:Sơ đồ Simulink cho tay máy hai giai đoạn .................................................... 132
Hình 3. 17: Họ các đường cong tạo ra quỹ đạo trạng thái tối ưu .................................... 133
Hình 3. 18: Quỹ đạo cuối của trạng thái tối ưu ............................................................... 134
Hình 3. 19: Xây dựng đoạn gần cuối của quỹ đạo trạng thái tối ưu ................................ 135
Hình 3. 20: Xây dựng quỹ đạo trạng thái tối ưu .............................................................. 136
Hình 3. 21: Đường chuyển đổi giá trị của tín hiệu điều khiển tối ưu .............................. 136
Hình 3. 22: Họ các đường tròn tạo ra quỹ đạo trạng thái tối ưu...................................... 138
Hình 3. 23: Quỹ đạo cuối của trạng thái tối ưu ............................................................... 140
Hình 3. 24:Xây dựng đoạn gần cuối của quỹ đạo trạng thái tối ưu ................................. 140
9
Hình 4. 1: Mô hình điều khiển bền vững......................................................................... 143
Hình 4. 2: Sơ đồ hệ thống dùng để phân tích ổn định nội ............................................... 151
Hình 4. 3: Hệ thống hồi tiếp vòng kín ............................................................................. 152
Hình 4. 4: Sơ đồ cấu trúc phân tích ổn định bền vững .................................................... 152
Hình 4. 5: Sai số cộng...................................................................................................... 153
Hình 4. 6: : Sai số nhân ở đầu ra ..................................................................................... 154
Hình 4. 7: Hồi tiếp LQG .................................................................................................. 155
Hình 4. 8: Cấu trúc của một bộ quan sát ......................................................................... 156
Hình 4. 9: Bộ quan sát trạng thái của Kalman ................................................................. 157
Hình 4. 10: Gaussian PDF ............................................................................................... 159
Hình 4. 11: Mô hình con lắc ngược ................................................................................. 167
Hình 4. 12: Bộ lọc Kalman .............................................................................................. 170
Hình 4. 13: Bộ điều khiển LQG ...................................................................................... 170
Hình 4. 14:Biểu đồ Bode Biên độ hệ MIMO của giá trị suy biến trong miền tần số ...... 171
Hình 4. 15: Biểu đồ Bode biên độ hệ thống SISO .......................................................... 172
Hình 4. 16:Các giá trị suy biến của hệ thống .................................................................. 173
Hình 4. 17: Sơ đồ hệ thống hồi tiếp âm ........................................................................... 173
Hình 4. 18: Độ lợi vòng và các ràng buộc tần số thấp và tần số cao .............................. 177
Hình 4. 19: Biểu diễn sai số mô hình phân tích coprime bên trái ................................... 179
Hình 4. 20: Sơ đồ phân tích ổn định bền vững với mô hình có sai số LCF .................... 180
Hình 4. 21: Thủ tục thiết kế H∞ loop shaping ................................................................ 185
Hình 4. 22: Sơ đồ điều khiển hồi tiếp đơn vị .................................................................. 185
Hình 4. 23: Sơ đồ điều khiển hồi tiếp đơn vị với bộ điều khiển đạt được từ LDSP ....... 185
Hình 4. 24: Sơ đồ điều khiển cải tiến với bộ điều khiển đạt được từ LDSP ................... 185
Hình 4. 25:Hệ thống hồi tiếp với ngõ vào và ngõ ra nhiễu loạn ..................................... 187
Hình 4. 26: Vấn đề chuẩn H2 .......................................................................................... 188
Hình 4. 27: Hệ thống lò xo đệm ...................................................................................... 191
Hình 4. 28: Sơ đồ khối của bộ điều khiển LQG .............................................................. 192
Hình 4. 29:Sơ đồ mô phỏng hệ thống .............................................................................. 193
10
Hình 4. 30:Đáp ứng của hệ thống .................................................................................... 193
Hình 4. 31: Thanh mềm dẻo được chia thành 3 phần tử ................................................. 194
Hình 4. 32: Sơ đồ mô phỏng............................................................................................ 195
Hình 4. 33: Thiết kế hàm nắn dạng W1 ........................................................................... 196
Hình 4. 34: Thiết kế nắn dạng vòng Hi - inf ................................................................... 197

Hình 4. 35: Tổng hợp bộ điều khiển ................................................................................ 197
Hình 4. 36: Đáp ứng quá độ của hệ thống ....................................................................... 199
Hình 5. 1: Sơ đồ khối tổng quát hệ thống điều khiển thích nghi ..................................... 201
Hình 5. 2:Sơ đồ khối tổng quát hệ điều khiển thích nghi theo mô hình chuẩn ............... 202
Hình 5. 3:Sơ đồ khối tổng quát hệ điều khiển tự chỉnh định........................................... 202
Hình 5. 4: Sơ đồ khối tổng quát hệ điều khiển hoạch định độ lợi ................................... 202
Hình 5. 5: Mô hình toán của đối tượng ........................................................................... 203
Hình 5. 6:Sơ đồ khối thể hiện khâu ước lượng cho mô hình FIR ................................... 214
Hình 5. 7: Sơ đồ khối của ước lượng bình phương cực tiểu dựa vào sai số ngõ ra ........ 216
Hình 5. 8: Sơ đồ khối của khâu ước lượng với bộ lọc .................................................... 217
Hình 5. 9: Sơ đồ khối của một hệ thích nghi mô hình chuẩn .......................................... 220
Hình 5. 10: Mô hình sai số .............................................................................................. 221
Hình 5. 11:Hệ vòng kín với bộ điều khiển tuyến tính tổng quát ..................................... 225
Hình 5. 12: Mô hình hội tụ sai số .................................................................................... 228
Hình 5. 13: Hệ thống thích nghi mô hình tham chiếu cho việc chỉnh định độ lợi nuôi tiến
......................................................................................................................................... 229
Hình 5. 14: Sơ đồ mô phỏng bằng Matlab Simulink ví dụ 5.8........................................ 233
Hình 5. 15: Đáp ứng của hệ thống trong ví dụ 5.8 .......................................................... 234
Hình 5. 16: Mô hình tự chỉnh định .................................................................................. 235
Hình 5. 17: Ví dụ 5.9 ....................................................................................................... 236
Hình 5. 18:Mô phỏng hệ thống điều khiển PI thích nghi gián tiếp ................................. 239
Hình 5. 19: Khối ước lượng bình phương tối thiểu đệ quy ............................................. 239
Hình 5. 20: Bộ điều khiển PI với các hệ số tính theo thông số của đối tượng ............... 240
Hình 5. 21: Đáp ứng của hệ thống ................................................................................... 240
11
Hình 5. 22: Sơ đồ khối điều khiển hoạch định độ lợi ...................................................... 241
Hình 5. 23:Hệ thống xe – lò xo ví dụ 5.10 ...................................................................... 241
Hình 5. 24: Sơ đồ khối hệ thống điều khiển hoạch định độ lợi theo mô hình chuẩn sau khi
thiết kế ............................................................................................................................. 243
Hình 5. 25: Sơ đồ mô phỏng hệ thống điều khiển hoạch định độ lợi theo mô hình chuẩn
......................................................................................................................................... 244
Hình 5. 26: Kết quả điều khiển khi chưa hoạch định độ lợi ............................................ 244
Hình 5. 27: Kết quả điều khiển khi hoạch định độ lợi .................................................... 245
Hình 5. 28: Sơ đồ mô phỏng Matlab ............................................................................... 247
Hình 5. 29: Kết quả mô phỏng khi b=0.1 ........................................................................ 247
Hình 5. 30:Kết quả mô phỏng khi b=1 ............................................................................ 248
Hình 5. 31: Kết quả mô phỏng khi b=5 ........................................................................... 248
Hình 5. 32: Mô hình chuẩn sau khi thiết kế .................................................................... 251
Hình 5. 33:Mô phỏng hệ thống điều khiển tự chỉnh gián tiếp theo mô hình chuẩn ........ 251
Hình 5. 34:Khối bình phương tối thiểu đệ quy................................................................ 252
Hình 5. 35: Bộ điều khiển theo mô hình chuẩn ............................................................... 252
Hình 5. 36: Đáp ứng của hệ thống ................................................................................... 253
Hình 6. 1: Hình vẽ 3 khớp của Robot có gắn các hệ trục ................................................ 255
Hình 6. 2: Mô hình khớp mềm hệ thống 2 khối .............................................................. 263
Hình 6. 3: Mô hình toán học khới nối mềm .................................................................... 264
Hình 6. 4: Nguyên lý thiết kế bộ điều khiển phản hồi âm trạng thái .............................. 266
Hình 6. 5: Kết quả thiết kế bộ điều khiển phản hồi âm trạng thái theo tiêu chuẩn tối ưu
hàm mục tiêu tuyến tính bình phương(LQ). .................................................................... 267
Hình 6. 6: Mô hình cơ bản của bộ quan sát trạng thái Luenberger ................................. 268
Hình 6. 7: Mô hình bộ quan sát Kalman ......................................................................... 269
Hình 6. 8: Mô tả toán học đối tượng khớp mềm ............................................................. 271
Hình 6. 9: Sơ đồ bộ quan sát trạng thái Kalman ............................................................. 272
Hình 6. 10: Sơ đồ mô phỏng bộ lọc Kalman ................................................................... 273
Hình 6. 11: Tốc độ động cơ thực và ước lượng............................................................... 274
Hình 6. 12: Tốc độ tải thực và ước lượng ....................................................................... 274
12
Hình 6. 13: Mô men xoắn thực và ước lượng ................................................................. 274
Hình 6. 14: Mô men tải thực và ước lượng ..................................................................... 275
Hình 6. 15:Bộ điều chỉnh LQG ....................................................................................... 276
Hình 6. 16: Hệ thống điều khiển LQG để điều khiển khớp mềm ................................... 277
Hình 6. 17: Sơ đồ Simulink mô phỏng hệ thống điều khiển LQG cho khớp mềm ......... 280
Hình 6. 18: Sơ đồ Simulink hệ thống khớp mềm ............................................................ 280
Hình 6. 19: Sơ đồ Simulink mô phỏng bộ lọc Kalman ước lượng trạng thái ................. 281
Hình 6. 20: Đặc tính tốc độ động cơ thực và tốc độ động cơ quan sát............................ 281
Hình 6. 21: Đặc tính tốc độ tải thực và tốc độ tải quan sát ............................................. 282
Hình 6. 22: Đặc tính mô men xoắn thực và mô men xoắn quan sát................................ 282
Hình 6. 23:Đặc tính mô men tải thực và mô men tải quan sát ........................................ 283
Hình 6. 24: Đáp ứng tốc độ tải và tốc độ động cơ hệ điều khiển phản hồi trạng thái dùng
bộ lọc Kalman theo tiêu chuẩn tối ưu hàm mục tiêu ....................................................... 284
Hình 6. 25:Mô phỏng hệ điều khiển khớp mềm bằng bộ PI ........................................... 284
Hình 6. 26:Đáp ứng tốc độ tải và tốc độ động cơ hệ điều chỉnh PI thông thường với
KP=0,078, KI=0,6. .......................................................................................................... 285
Hình 6. 27: Đặc tính tốc độ khi thay đổi trọng số  ....................................................... 286
Hình 6. 28: Đặc tính tốc độ khi thay đổi ......................................................................... 286
Hình 6. 29: Đặc tính tốc độ khi thay đổi  .................................................................... 287
Hình 6. 30: Cấu trúc cơ bản của hệ thống điều khiển thích nghi .................................... 287
Hình 6. 31: Sai lệch giữa và q của các góc khớp............................................................ 289
Hình 6. 32: Sai lệch giữa và q của các góc khớp............................................................ 290
13
CHƯƠNG I
TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN PHI TUYẾN
MỤC TIÊU CỦA CHƯƠNG
Cung cấp cho sinh viên lịch sử phát triển của lý thuyết điều khiển, hạn chế
của lý thuyết điều khiển kinh điển, giới thiệu về các phương pháp điều khiển hệ phi tuyến.
1.1. HẠN CHẾ CỦA LÝ THUYẾT ĐIỀU KHIỂN TUYẾN TÍNH KINH ĐIỂN
Lý thuyết điều khiển kinh điển (trước năm 1960) mô tả hệ thống trong miền tần số
(phép biến đổi Fourier) và mặt phẳng s (phép biến đổi Laplace). Do dựa trên các phép biến
đổi này, lý thuyết điều khiển kinh điểm chủ yếu áp dụng cho hệ tuyến tính bất biến theo
thời gian, mặc dù có một vài mở rộng để áp dụng cho hệ phi tuyến, ví dụ phương pháp hàm
mô tả. Lý thuyết điều khiển kinh điển thích hợp để thiết kế hệ thống một ngõ vào – một
ngõ ra (SISO: single input/single output), rất khó áp dụng cho các hệ thống nhiều ngõ vào
– nhiều ngõ ra (MIMO: multi input/multi output) và các hệ thống biến đổi theo thời gian.
Các phương pháp phân tích và thiết kế hệ thống trong lý thuyết điều khiển kinh điển
gồm có phương pháp Nyquist, đồ thị Bode và phương pháp quỹ đạo nghiệm số. Để thiết
kế hệ thống dùng phương pháp Nyquist và Bode cần mô tả hệ thống dưới dạng đáp ứng
tần số (đáp ứng biên độ và đáp ứng pha), đây là một thuận lợi vì đáp ứng tần số có thể đo
được bằng thực nghiệm. Mô tả hệ thống cần để thiết kế dùng phương pháp quỹ đạo nghiệm
số là hàm truyền, hàm truyền cũng có thể tính được từ đáp ứng tần số. Hàm truyền của các
hệ thống phức tạp được tính bằng cách sử dụng sơ đồ khối hay sơ đồ dòng tín hiệu. Mô tả
chính xác đặc tính động học bên trong hệ thống là không cần thiết đối với các phương pháp
thiết kế kinh điển, chỉ có quan hệ giữa ngõ vào và ngõ ra là quan trọng.
Các khâu hiệu chỉnh đơn giản như hiệu chỉnh vi tích phân tỉ lệ PID ( Proportional
Intergral Derivative), hiệu chỉnh sớm trễ pha…thường được sử dụng trong các hệ thống
điều khiển kinh điển. Ảnh hưởng của các khâu hiệu chỉnh này đến biểu đồ Nyquist, biểu
đồ Bode và quỹ đạo nghiệm số có thể thấy được dễ dàng, nhờ đó có thể dễ dàng lựa chọn
được khâu hiệu chỉnh thích hợp.
Chất lượng điều khiển theo lý thuyết điều khiển tuyến tính kinh điển có một số hạn
chế sau:
- Không tối ưu
- Chất lượng điều khiển giảm nếu đối tượng phi tuyến làm việc trong phạm vi rộng
- Chất lượng điều khiển không đảm bảo khi tham số của đối tượng thay đổi
- Không đảm bảo đạt được chất lượng thiết kế nếu mô hình của đối tượng có yếu tố
không chắc chắn.
Một số đối tượng phức tạp khó áp dụng lý thuyết điều khiển kinh điển
14
Hình 1. 1: Cần trục, tay máy
Hình 1. 2: Lái tàu
Hình 1. 3: Điều khiển máy bay
15
Hình 1. 4 : Điều khiển quá trình
1.2. GIỚI THIỆU VỀ CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN HIỆN ĐẠI
Từ năm 1960 đến nay, kỹ thuật thiết kế hệ thống điều khiển hiện đại dựa trên miền
thời gian. Mô tả toán học dùng để phân tích và thiết kế hệ thống là phương trình trạng thái.
Mô hình không gian trạng thái có ưu điểm là mô tả được đặc tính động học bên trong hệ
thống (các biến trạng thái) và có thể dễ dàng áp dụng cho hệ MIMO và hệ thống biến đổi
theo thời gian. Lý thuyết điều khiển hiện đại ban đầu được phát triển chủ yếu cho hệ tuyến
tính, sau đó được mở rộng cho hệ phi tuyến bằng cách sử dụng lý thuyết của Lyapunov.
Bộ điều khiển được sử dụng chủ yếu trong thiết kế hệ thống điều khiển hiện đại là bộ điều
khiển hồi tiếp trạng thái.
1.2.1. Điều khiển phi tuyến
Cơ sở toán học của lý thuyết điều khiển phi tuyến đã ra đời từ thế kỷ 19, từ sau năm
1960 điều khiển phi tuyến phát triển rất mạnh.
Các phương pháp phân tích hệ thống điều khiển phi tuyến bao gồm:
- Phương pháp hàm mô tả
- Phương pháp mặt phẳng pha
- Phương pháp tuyến tính hóa gần đúng
- Phân tích ổn định Lyapunov…
Các phương pháp thiết kế hệ thống điều khiển phi tuyến:
- Điều khiển hồi tiếp tuyến tính hóa
- Điều khiển trượt…
1.2.2. Điều khiển tối ưu
Điều khiển tối ưu là phương pháp điều khiển trong đó bộ điều khiển được thiết kế
sao cho tối thiểu một hàm chỉ tiêu chất lượng
16
Điều khiển tối ưu được phát triển dựa trên cơ sở toán học: phương pháp biến phân(
Bernoulli, Euler, Lagrange, Weiertrass..)
Từ những năm 1950, điều khiển tối ưu phát triển mạnh mẽ và trở thành một lĩnh
vực độc lập:
- Phương pháp quy hoạch động do Richard Bellman đưa ra trong thập niên 1950
- Nguyên lý cực tiểu Pontryagin do Lev Pontryagin và các đồng sự đưa ra trong thập
niên 1950
- Bài toán điều chỉnh toàn phương tuyến tính và lọc Kalman do Rudolf Kallman đưa
ra trong những năm 1960: lọc Kalman, bài toán điều chỉnh toàn phương tuyến tính LQR,
điều khiển tối ưu ngẫu nhiên LQG
Có nhiều loại bài toán điều khiển tối ưu tùy theo loại đối tượng điều khiển, miền
thời gian liên tục hay rời rạc, chỉ tiêu chất lượng, bài toán tối ưu có ràng buộc hay không.
Điều khiển tối ưu tĩnh: chỉ tiêu chất lượng không phụ thuộc thời gian
Điều khiển tối ưu động: chỉ tiêu chất lượng phụ thuộc thời gian
Trước khi máy tính số ra đời, chỉ có thể giải được một số ít bài toán điều khiển tối
ưu đơn giản. Máy tính số ra đời cho phép ứng dụng lý thuyết điều khiển tối ưu vào nhiều
bài toàn phức tạp.
Ngày nay, điều khiển tối ưu được ứng dụng trong nhiều lĩnh vực: không gian, điều
khiển quá trình, Robot…
1.2.3. Điều khiển bền vững
Điều khiển bền vững là phương pháp điều khiển trong đó bộ điều khiển được thiết
kế sao cho tính ổn định và chất lượng của hệ thống vẫn đảm bảo khi các yếu tố không chắc
chắn hoặc nhiễu loạn nằm trong giới hạn định trước.
Năm 1950 là sự phát triển của điều khiển tối ưu H 2 (hay LQG)
Năm 1982 là sự phát triển bài toán điều khiển H  , phương pháp chỉnh độ lợi vòng
Năm 1984 (Doyle) và năm 1987 (Francis) : điều khiển tối ưu H  trong không gian
trạng thái.
Sơ đồ khối thiết kế hệ thống điều khiển bền vững:
Hình 1. 5: Điều khiển bền vững mô hình sai số nhân
17
Hình 1. 6: Điều khiển bền vững mô hình sai số cộng
1.2.4. Điều khiển thích nghi
Điều khiển thích nghi là phương pháp điều khiển trong đó các thông số bộ điều
khiển được điều chỉnh tự động khi điều kiện làm việc thay đổi nhằm đạt được chất lượng
tối ưu
Nhưng năm 1950 hệ thống điều khiển theo mô hình tham chiếu
Cuối thập niên 1960 sự tiến bộ của lý thuyết điều khiển đóng góp vào sự phát triển
của lý thuyết điều khiển thích nghi (mô tả không giang trạng thái, lý thuyết ổn định
Lyapunov, quy hoạch động
Thập niên 1970 và những năm đầu 1980 : chứng minh tính ổn định của hệ thống
thích nghi
Cuối thập niên 1970 và những năm đầu 1980: chứng minh tính bền vững của bộ
điều khiển thích nghi
Gần đây: phát triển các giải thuật điều khiển học
Hình 1. 7: Sơ đồ khối tổng quát hệ điều khiển thích nghi

1.2.5. Lựa chọn các phương pháp điều khiển
Tùy theo các đối tượng cùng các yêu cầu cụ thể mà có thể lựa chọn phương pháp
điều khiển phù hợp
18
Ta lấy một số ví dụ sau:
a) Điều khiển oto:
Hình 1. 8: Hệ thống điều khiển oto

Phương trình vi phân mô tả hệ thống:
dv(t)
M  Bv(t)  f (t)
dt
Nên chọn phương pháp điều khiển nào:
- Khi mô hình chính xác, thông số của xe không đổi
- Khi muốn tối thiểu năng lượng tiêu tốn
- Khi thông số của xe thay đổi
- Khi có sai số mô hình ( mô hình không chắc chắn)
b) Điều khiển mực nước trong bồn
Hình 1. 9: Điều khiển mực nước trong bồn

với
a: Tiết diện van xả
A: Tiết diện ngang của bồn
g: Gia tốc trọng trường
k: Hệ số công suất bơm
C D : Hệ số xả
Phương trình vi phân mô tả hệ:

1
y  (ku(t)  aCD 2gy(t))
A
Nên chọn phương pháp điều khiển nào:
19
- Khi điều khiển ổn định hóa
- Khi điều khiển bám theo tín hiệu đặt trong miền làm việc rộng
- Khi thông số của bồn thay đổi
- Khi có sai số mô hình
c) Điều khiển hệ tay máy
Hình 1. 10: Điều khiển hệ tay máy

Với:
J: Moment quán tính của cánh tay máy
M: Khối lượng của cánh tay máy
m: Khối lượng vật nặng
l: Chiều dài cánh tay máy
lC : Khoảng cách từ trọng tâm tay máy đến trục quay
B: Hệ số ma sát nhớt
g: Gia tốc trọng trường
u(t) : Moment tác động lên trục quay của cánh tay máy
(t) : Góc quay (vị trí) của cánh tay máy
Phương trình vi phân mô tả hệ :

B (ml  MlC ) 1
(t)   (t)  g cos   u(t)
(J  ml2 ) (J  ml 2 ) (J  ml 2 )
Nên chọn phương pháp điều khiển nào :
- Khi điều khiển tay máy trong phạm vi rộng
- Khi khối lượng vật nặng thay đổi
- Khi mô hình không chắc chắn
- Khi muốn tối ưu năng lượng tiêu tốn và đáp ứng nhanh
20
1.3 VÍ DỤ VỀ HỆ PHI TUYẾN
Hệ con lắc ngược ở hình vẽ (hình 1.10). Hệ gồm có thanh cứng và xe trên đó thanh
được treo. Xe di chuyển trên đường ray tới phải hay trái, phụ thuộc vào lực tác động vào
xe. Thanh chỉ có một bậc tự do (quay quanh điểm treo ). Nhiệm vụ điều khiển chính là giữ
con lắc cân bằng thẳng đứng và xe trong phạm vi đường ray
Hình 1. 11: Hệ con lắc ngược

Giả sử khối lượng vật nặng tập trung ở giữa con lắc, xem xét con lắc trên xe minh
họa ở hình 1.10. Chúng ta ký hiệu  là góc so với phương thẳng đứng, L = 21, m và J là
chiều dài, khối lượng và moment quán tính ở tâm trong lượng con lắc; M thể hiện khối
lượng xe, và G thể hiện tâm trọng lượng con lắc. Tọa độ theo trục hoành và trục tung của
con lắc được cho bởi:
L
xX sin   X  lsin  (1)
2
L
y cos   lcos  (2)
2
.
Hình 1. 12: Sơ đồ thân tự do của hệ con lắc ngược trên xe

Sơ đồ thân tự do của xe và con lắc được minh họa ở hình 1.11, trong đó Fx và Fy
thể hiện lực phản ứng tại điểm trục. Xem xét con lắc ngược trước.
21
Tổng lực ta có các phương trình sau :
Fx  mX  ml cos   ml2 sin  (3)
Fy  mg  ml sin   ml2 cos  (4)
Fy lsin   Fx lcos   J (5)
Xem xét lực phương ngang tác động lên xe, ta có:
MX  f x  Fx (6)
Thay (6) vào (3), ta được:
(M  m)X  ml(cos )  ml(sin )2  f x (7)
Sử dụng (3), (4), (7) và tính toán rút gọn, ta đạt được
4
mXcos   ml   mgsin   f x (8)
3
Phương trình (7) và (8) mô tả động lực học hệ con lắc ngược. Định nghĩa biến trạng
thái: x1   và x 2  
Ta suy ra:
g sin   aml2 sin  cos   a cos f x

4l
 aml  cos  
2
3
Hay  
 M  m  gsin   ml2 sin  cos   cos f x
(9)
4l  M  m 
 ml  cos  
2
3
Trong đó chúng ta thay:
mL2 1
J và a 
12 Mm
Vị trí xe:
f x  ml sin()2  cos() 
X
Mm
Hay
4 4
f x  mlsin()2  mgsin()cos()
X 3 3 (10)
4
 M  m   m  cos  2
3
Trong đó thông số con lắc là: Khối lượng xe M = 1 kg, khối lượng con lắc m = 0,1
kg, nửa chiều dài con lắc 1 = 0,5 m (chiều dài con lắc L = 2 = 1m), gia tốc trọng trường
g  9.8(m / s 2 ) .
22
Phương trình (9) và (10) được dùng mô tả đặc tính động của đối tượng.
Phương trình phi tuyến (7) và (8) mô tả hệ.
Để điều khiển PID ta phải tuyến tính hóa hệ tại vị trí cân bằng   0 . Giả sử góc 
đủ nhỏ để   0 chúng ta xấp xỉ sin   0 , cos   1 và 2  0 . Khi đó thay các xấp xỉ
này vào (7) và (8) ta có :
 M  m  X  ml  f x (11)
4
MX  ml  mg (12)
3
Trước tiên chúng ta tìm hàm truyền của hệ con lắc ngược. Lấy biến đổi Laplace hai
về (11) và (12) với điều kiện đầu zero ta được :
 M  m  s2 .X(s)  mls2(s)  u (13)
4
Ms2 .X(s)  mls 2 (s)  mg(s) (14)
3
Vì (s) là góc lệch so với phương thẳng đứng, như là hàm của trạng thái X(s). Giải
phương trình (14) ta được:
 g 4l 
X(s)   2   (s) (15)
s 3
Thay phương trình (15) vào (13) và sắp xếp lại ta được:
(s) 1
 (16)
U(s)  4(M  m)l  2
 ml   s  (M  m)g
 3 
Biểu diễn hệ ở dạng không gian trạng thái, ta được:
 x1  

x 2  
 (17)
x3  x
x  x
 4
(M  m)g  u
 (18)
4l(M  m)
 ml
3
Phương trình tuyến tính hóa có thể viết lại như sau:
23
 (M  m)g 1
 x  x  u
2
4l(M  m) 1
4
  ml l(M  m)  ml
 3 3
 (19)
x   mg 4
x1  u
 4
1 (4M  m)
 (4M  m)
3
Viết (19) dưới dạng ma trận ta được (20):
 0 1 0 0
 (M  m)g 

 x1   4l(M  m) 0 0 0  x
x    ml  1
 2    x2 
3
   (20)
x3   0 0 0 1  x3 
     x 4 
x4  mg
 1 0 0 0
 (4M  m) 
 3 
 0 
 1 
 
 4 l(M  m)  ml 
 3 
 
 0 
 4 
 
 (4M  m) 
Vì ta xét vị trí xe và vị trí góc của con lắc, ngõ ra như sau:
 x1 
 
 y1 (t)  1 0 0 0   x 2  0 
 y (t)   0 0 0 1  x   0  u (21)
 2    3  
 
x4 
Thay đổi giá trị M=1kg; m=0,1kg; l=0,5m; g= 9,8 m / s 2 và (21), ta được:
 x1   0 1 0 0   x1   0 
 x   15,78 0 0 0   x 2   1,463
 2     u (22)
 x3   0 0 0 1  x3   0 
      
 x 4   0,717 0 0 0   x 4   0,975 
24
CÂU HỎI ÔN TẬP CHƯƠNG 1
1. Trình bày các hạn chế của lý thuyết điều khiển kinh điển.
2. Trình bày các phương pháp điều khiển hiện đại, cho ví dụ minh họa.
3. Cho hệ con lắc ngược ở hình vẽ (hình 1.10), điều khiển giữ con lắc cân bằng
thẳng đứng và xe trong phạm vi đường ray với các thông số:. Hệ con lắc ngược ở hình vẽ
(hình 1.10). Hệ gồm có thanh cứng và xe trên đó thanh được treo. Xe di chuyển trên đường
ray tới phải hay trái, phụ thuộc vào lực tác động vào xe. Thanh chỉ có một bậc tự do (quay
quanh điểm treo) với các thông số khối lượng xe M = 1 kg, khối lượng con lắc m = 0,5 kg,
nửa chiều dài con lắc 1 = 0,5 m (chiều dài con lắc L = 2 = 1m), gia tốc trọng trường g =
9,8 m / s 2 . Yêu cầu: điều khiển để giữ con lắc cân bằng thẳng đứng và xe trong phạm vi
đường ray.
25
CHƯƠNG 2
CÁC PHƯƠNG PHÁP KHẢO SÁT VÀ THIẾT KẾ HỆ PHI TUYẾN

Cung cấp cho sinh viên kiến thức về : khái niệm, tính chất, các đặc điểm riêng của
hệ phi tuyến, các phương pháp phân tích và thiết hệ thống điều khiển phi tuyến.
2.1. KHÁI NIỆM VỀ HỆ PHI TUYẾN

2.1.1. Khái niệm
Các phương pháp phân tích thiết kế hệ điều khiển hồi tiếp đã biết trước đây chỉ áp
dụng được cho hệ tuyến tính bất biến theo thời gian, đó là các hệ được biểu diễn bằng
phương trình vi phân tuyến tính hệ số hàng. Trong thực tế các hệ tuyến tính chỉ tuyến tính
trên một tầm nào đó. Ở vài mức độ tất cả các hệ vật lý đều phi tuyến. Vì vậy, vấn đề quan
trọng là mỗi hệ có một phương pháp riêng để phân tích với mức độ phi tuyến khác nhau.
Bất cứ nỗ lực nào nhằm hạn chế nghiêm ngặt sự suy xét ở hệ tuyến tính chỉ có thể
dẫn đến làm phức tạp nghiêm trọng trong thiết kế hệ thống. Để làm việc tuyến tính trên
một tầm biến đổi rộng về biên độ tín hiệu và tần số, Đòi hỏi các phần tử có chất lượng cực
kỳ cao. Một hệ như thế không thực tế trên quan điểm giá cả, kích thước và khối lượng. Hơn
nữa, có thể nhận ra sự thu hẹp tuyến tính hạn chế nghiêm trọng các đặc tính của hệ.
Thực tế hoạt động tuyến tính yêu cầu chỉ cho sai lệch nhỏ quanh điểm làm việc tĩnh.
Trạng thái bão hòa của các dụng cụ khuếch đại có sai lệch lớn so với điểm làm việc tĩnh,
sự hiện diện phi tuyến dưới hình thức các vùng ( dead zone) cho sai lệch nhỏ quanh điểm
làm việc tĩnh có thể chấp nhận được. Trong cả hai trường hợp, người ta cố giới hạn các ảnh
hưởng phi tuyến đến mức có thể chấp nhận được, bởi vì thực tế không thể loại trừ hoàn
toàn vấn đề này.
Trên thực tế các phi tuyến có thể được đưa vào trong hệ một cách chủ ý để bù lại
ảnh hưởng của các phi tuyến không mong muốn khác hoặc là để đạt được chất lượng tốt
hơn so với việc hiệu chỉnh chỉ bằng các phần tử tuyến tính. Ví dụ đơn giản về phi tuyến có
chủ định là việc sử dụng đệm phi tuyến để tối ưu hóa đáp ứng là một hàm của sai số.
Mục đích của chương này là nghiên cứu các đặc điểm của phi tuyến, trình bày các
phương pháp phân tích và phương pháp thiết hệ thống điều khiển phi tuyến.
Chúng ta cần nhận thấy rằng các phương pháp phân tích phi tuyến không tiến bộ
nhanh như kỹ thuật phân tích hệ tuyến tính. Nói một cách so sánh, ở thời điểm hiện tại các
phương pháp phân tích hệ phi tuyến vẫn còn trong giai đoạn phát triển. Tuy nhiên, các
phương pháp khác nhau trong chương này có thể cho phép phân tích và tổng hợp hệ điều
khiển phi tuyến một cách định lượng.
26
2.1.2. Tính chất và đặc điểm riêng của phi tuyến
Một vài tính chất vốn có của hệ tuyến tính, làm đơn giản rất nhiều lời giải cho loại
hệ thống này, không có hiệu lực đối với hệ phi tuyến.
Tính chất xếp chồng (superposition) là tính chất cơ bản và là cơ sở xác định một hệ
tuyến tính. Nguyên lý xếp chồng phát biểu rằng nếu c1(t) là đáp ứng của hệ đối với r1(t) và
c2(t) là đáp ứng của hệ đối với r2(t), khi đó đáp ứng của hệ đối với a1r1 (t)  a 2r2 (t) là
a1c1(t)  a 2c2 (t) . Nguyên lý xếp chồng không áp dụng cho hệ phi tuyến, vì vậy, vài thủ
tục (procedure) toán học dùng trong thiết kế hệ tuyến tính không dùng được cho hệ phi
tuyến.
Sự ổn định của hệ tuyến tính chỉ phụ thuộc vào các thông số của hệ. Thế nhưng, sự
ổn định của hệ phi tuyến lại phụ thuộc vào điều kiện và bản chất của tín hiệu vào như các
thông số của hệ. Người ta không thể hy vọng một hệ phi tuyến cho một đáp ứng ổn định
với lại tính hiệu này lại có đáp ứng ổn định với loại tín hiệu khác. Các hệ phi tuyến ổn định
đối với tín hiệu rất nhỏ hay rất lớn, nhưng không thể cả hai.
Đáp ứng đầu ra của một hệ tuyến tính, được kích thích bởi tín hiệu sin, có cùng tần
số như đầu vào mặc dù biên độ và pha của nó có thể khác. Trong khi đó tín hiệu ra của hệ
phi tuyến thường bao gồm các thành phân tần số cơ bản, họa tần và có thể không chứa tần
số đầu vào.
Đối với hệ tuyến tính hoán chuyển hai phần tử trong một tầng không ảnh hưởng đến
hoạt động. Điều này không đúng nếu một phần tử là phi tuyến.
Câu hỏi về sự ổn định là xác định rõ ràng đối với hệ tuyến tính hệ số hằng: một hệ
hoặc là không ổn định hoặc ổn định. Một hệ tuyến tính không ổn định có tín hiệu ra tăng
dần không giới hạn hoặc theo hàm mũ hoặc ở chế độ dao động với đường bao của dao động
tăng theo hàm mũ.
Các đặc điểm riêng của hệ phi tuyến:
Mục này mô tả chi tiết vài đặc điểm cá biệt của hệ phi tuyến. Chúng ta sẽ bàn một
cách chi tiết: chu trình giới hạn, tự kích cứng và mềm, nhảy cộng hưởng và tạo hài phụ.
Các chu trình giới hạn là các dao động với biên độ và chu kì cố định xảy ra trong hệ
phi tuyến. Tùy theo dao động phân kỳ hay hội tụ do các điều kiện đặt ra, chu trình giới hạn
có thể ổn định hoặc không ổn định. Có khả năng các hệ ổn định có điều kiện gồm cả một
chu trình giới hạn ổn định và một chu trình giới hạn không ổn định. Sự xuất hiện các chu
trình giới hạn trong hệ phi tuyến dẫn đến phải xác định sự ổn định trong các thành phần
biên độ chấp nhận được bởi vì một dao động phi tuyến rất nhỏ có thể gây ra nguy hại cho
sự hoạt động của hệ thống.
Dao động tự kích xuất hiện trong hệ thống ổn định với sự hiện diện của các tín hiệu
rất nhỏ gọi là dao động tự kích mềm. Dao động tự kích xuất hiện trong hệ thống không ổn
định với sự xuất hiện các tín hiệu rất lớn là tự kích cứng. Vì các dao động mềm và cứng có
thể xảy ra nên các kỹ sư điều khiển phải xác định cho hệ khi thiết kế. Một hệ điều khiển
27
hồi tiếp bao gồm các phần tử có đặc tính bão hòa minh họa ở hình 2.1a, có thể tượng trưng
cho tự kích mềm. Một hệ điều khiển hồi tiếp chứa một phần tử có đặc tính vùng như minh
họa ở hình 2.1b, có thể tượng trưng cho tự kích cứng.
Từ trễ là một hiện tượng phi tuyến thường liên quan đến đặc tính đường cong từ
tính hoặc khe hở của bộ bánh răng. Một đường cong từ tính thông dụng mà đường đi của
nó phụ thuộc lực từ H đang tăng hay giảm được trình bày ở hình 2.1c.
Nhảy cộng hưởng là một dạng khác của từ trễ. Bản thân nó biểu diễn đáp ứng tần
số vòng kín được minh họa hình 2.1d. Khi tăng tần số  và biên độ ngõ vào R được giữ
cố định đáp ứng sẽ đi theo đường cong AFB. Tại điểm B, một thay đổi nhỏ về tần số dẫn
đến việc nhảy gián đoạn đến điểm C. Sau đó đáp ứng theo đường cong đến điểm D khi gia
tăng tần số. Từ điểm D tần số được giảm xuống đáp ứng theo đường cong đến điểm A khi
giảm thêm tần số. Quan sát từ sự mô tả này, đáp ứng thật sự không bao giờ đi theo đoạn
BE. Phần này của đường cong tiêu biểu cho trạng thái cân bằng không ổn định. Để hiện
tượng cộng hưởng xảy ra phải là hệ bậc hai hoặc cáo hơn.
Hình 2. 1:a) Đặc tính bão hòa; b) Đặc tính vùng chết; c) Vòng từ trễ ; d) Đáp ứng vòng
kín của một hệ thống với nhảy cộng hưởng
Phát sinh hài phụ đề cập đến các hệ phi tuyến mà tín hiệu ra của nó chứa các hài
phụ của tần số kích thích dạng sin của tín hiệu vào. Việc chuyển hoạt động ở hài phụ thường
xảy ra hoàn toàn ngẫu nhiên.
Tất cả các kỹ thuật dùng để phân tích hệ phi tuyến đều phụ thuộc vào tính nghiêm
ngặt của hệ phi tuyến và bậc của hệ ở trạng thái suy xét. Trong chương này, chúng ta sẽ
xét các kỹ thuật có hiệu quả và thông dụng, minh họa các ứng dụng thực tế của chúng.
28
Chương này sẽ dẫn ra các kết luận và các hướng dẫn chọn phương pháp thích hợp cho việc
phân tích và thiết kế các bài toán cụ thể đối với hệ phi tuyến.
Việc phân tích các hệ phi tuyến gắn với sự tồn tại và ảnh hưởng của chu trình giới
hạn, tự kích mềm và cứng, từ trễ, nhảy cộng hưởng và tạo hài phụ. Hơn nữa, phải xác định
đáp ứng đối với các hàm đầu vào đặc trưng. Khó khăn chính cho việc phân tích hệ phi
tuyến là không có kỹ thuật riêng nào áp dụng tổng quát cho tất cả các bài toán.
Hệ thống gần phi tuyến, sai biệt so với phi tuyến không quá lớn, cho phép sử dụng
phương pháp xấp xỉ tuyến tính. Hàm mô tả gần đúng có thể áp dụng cho các hệ phi tuyến
bậc bất kỳ nào và thường dùng để phát hiện dao động trong hệ. Cách giải quyết sẽ đơn giản
hơn nhiều nếu giả định ngõ vào đối với hệ phi tuyến là sin và chỉ chứa thành phần tần số
có ý nghĩa ở đầu ra thành phần có cùng tần số với ngõ vào.
Các hệ phi tuyến thường được xấp xỉ bằng vài vùng tuyến tính. Phương pháp tuyến
tính từng đoạn cho phép phân đoạn tuyến tính hóa bất cứ phi tuyến nào đối với hệ bậc bất
kỳ. Phương pháp mặt phẳng pha là một kỹ thuật đắc lực để phân tích đáp ứng của một hệ
phi tuyến bậc hai. Các phương pháp ổn định của Lyapunov là các kỹ thuật mạnh mẽ để xác
định ở trạng thái xác lập của hệ phi tuyến dựa trên tổng quát hóa các khái niệm năng lượng.
Phương pháp Popov rất hữu hiệu cho việc xác định sự ổn định hệ phi tuyến bất biến theo
thời gian. Tiêu chuẩn đường tròn tổng quát hóa có thể áp dụng cho hệ phi tuyến biến thiên
theo thời gian mà phần tuyến tính không nhất thiết phải ổn định ở vòng hở.
Hệ bậc rất cao có vài phi tuyến ít khi xử lý bằng các khái niệm phân tích chung. Vấn
đề này yêu cầu dùng các phương pháp số sử dụng máy tính để giải quyết. Tuy nhiên, lời
giải chỉ có giá trị đối với bài toán cụ thể được đề cập. Khó có thể mở rộng kết quả và có
được cách giải quyết chung để dùng cho các bài toán khác.
Phương pháp mô phỏng thường dùng để kiểm tra lần cuối sự ổn định của hệ điều
khiển phi tuyến. Phương pháp này sẽ giúp khắc phục nhiều yếu tố như: không để ý chính
xác tính hiệu lực của giả thiết do các khó khăn trong quá trình phân tích vì hệ phức tạp.
2.2. PHƯƠNG PHÁP MẶT PHẲNG PHA
Mặt phẳng pha và tính chất của nó
Xét hệ phi tuyến bậc hai (n=2) được mô tả ở dạng hai phương trình vi phân bậc nhất
với các biến trạng thái x1, x2:
. dx1
x1   f1 (x1, x 2 )
dt (2.1)
. dx
x 2  2  f 2 (x1, x 2 )
dt
Hoặc được mô tả dưới dạng một phương trình
dx 2 f 2 (x1, x 2 )
 (2.2)
dx1 f1 (x1, x 2 )
29
Với các điều kiện ban đầu x1(0) & x2(0)
Hình 2. 2:Các dạng quỹ đạo pha của hệ bậc 2
Bảng 1.1 : Các dạng quỹ đạo pha và đáp ứng pha
30
31
2.3. PHƯƠNG PHÁP TUYẾN TÍNH HÓA GẦN ĐÚNG
Trong các hệ gần tuyến tính, sai lệch so với tuyến tính không quá lớn, phương pháp
xấp xỉ tuyến tính cho phép mở rộng các khái niệm tuyến tính thông thường. Sự xấp xỉ này
thường nhận rằng các đặc điểm của hệ thay đổi từ điểm làm việc này sang điểm làm việc
khác, nhưng giả định sự tuyến tính trong lân cận của điểm làm việc riêng. Kỹ thuật xấp xỉ
tuyến tính thường được kỹ sư sử dụng phổ biến và có thể quen thuộc hơn đối với độc giả
so với các tên lý thuyết tín hiệu nhỏ hay lý thuyết về dao động nhỏ.
Phương pháp xấp xỉ tuyến tính được dùng khi kết quả một lượng nhỏ phi tuyến có
thể nghiên cứu bằng cách phân tích cho rằng các biến dao động hay thay đổi quanh giá trị
trung bình của biến. Điều này được trình bày như sau:
d n y(t) d n 1y(t) dy(t) dy(t) d n 1y(t)
An  A n 1  ...  A  A y(t)  f (y(t), ,...,  x(t) (2.3)
dt n 1 dt n 1
1 0
dt n dt dt
Trong đó: x(t) là tín hiệu vào của hệ
t là thời gian và biến độc lập
y(t) là biến phụ thuộc và là tín hiệu ra của hệ
An, An-1, An-2, ….A0 là các hệ số
 là hằng số chỉ độ phi tuyến hiện thời
dy(t) d n 1y(t)
f (y(t), ,..., là một hàm phi tuyến
dt dt n 1
Mở rộng lời giải đối với phương trình vi phân này cho các phi tuyến nhỏ, được viết
dưới dạng chuỗi lũy thừa của  :
y(t)  y(0) (t)  y(1) (t)  2 y(2) (t)  3y(3) (t)  ... (2.4)
32
Từ phương trình (2.4), y(t) có thể suy luận như là kết hợp các thành phần tuyến tính
y (0) (t) và các yếu tố sai lệnh y(1) (t)  2 y(2) (t)  3y(3) (t)  ...
Giả sử  là nhỏ, các thành phần phi tuyến không ảnh hưởng nghiêm trọng đến hoạt
động của hệ thống.
Hình 2. 3: Các quỹ đạo khảo sát và quỹ đạo chuyển động của phi thuyền
Giả sử phương trình của hệ thống được cho bởi
x(t)  f (x(t), u(t)) (2.5)

trong đó hàm f là phi tuyến
Hình 2.3 minh họa quỹ đạo khảo sát của phi thuyền không gian (nét liền) thỏa mãn
phương trình:
x(t)  f (x(t), u(t)) (2.6)

Chỉ số o được viết ở phía trên đề cập thông số xuất hiện dọc theo quỹ đạo tham
chiếu. Những thông số khảo sát này quan hệ với các thông số của quỹ đạo thực ( nét đứt)
như sau:
x(t)  x o (t)  x(t) (2.7)
u(t)  u o (t)  u(t) (2.8)
Hình 2.3 minh họa các quỹ đạo chuẩn và quỹ đạo thực, trạng thái thực x(t) bị lệch
khỏi trạng thái x o (t) một đoạn (t) . Một cách trực giác, điều này có nghĩa là quỹ đạo
thực của phi thuyền không gian bị lệch hay sai lệch nhỏ so với quỹ đạo tham chiếu mong
muốn. Vecto u(t) biểu thị cho sự sai lệch của đầu vào điều khiển so với đầu vào u o (t)
tham chiếu theo yêu cầu hệ thống có đáp ứng mong muốn x o (t) .
Mối quan hệ nào mà chúng ta có thể rút ra từ x o (t) , x(t) , u o (t) , u(t) . Phương
.
trình phi tuyến cơ bản của hệ x(t)  f (x(t), u(t)) , u(t) có thể biểu diễn như sau:
. .
d o
(x (t)  x(t))  x o (t)   x(t)  f (x o (t),u o (t)  u(t)) (2.9)
dt
33
Bởi vì giả thiết dao động thật sự của hệ là nhỏ, ta có thể khai triển thành phần thứ j
của phương trình thành chuỗi Taylor quanh quỹ đạo khảo sát:
. . f j f j
x oj (t)   x j (t)  f j (x o (t),u o (t))  x1(t)  ...  x m (t)
x1 x m
(2.10)
f j f j
 u1 (t)  ...  u m (t)
u1 u m
Dùng phương trình (2.9) ta có thể viết lại (2.10)
f j f j f j f j
x j  ( )o x1 (t)  ...  ( ) o x m (t)  ( ) o u1(t)  ...  ( ) o u m (t) (2.11)
x1 x m u1 u m
ở đây j=1, 2, 3,…,n
Phương trình (2.11) có thể đơn giản bằng ma trận Jacobian được định nghĩa như
sau:
f1 f1 f1
...
x1 x 2 x m
f 2 f 2 f 2
...
x1 x 2 x m
A (2.12)
. . . .
. . . .
f n f n f n
...
x1 x 2 x m x xo
u u o
f1 f1 f1

...
u1 u 2 x m
f 2 f 2 f 2
...
u1 u 2 u m
B (2.13)
. . . .
. . . .
f n f n f n
...
u1 u 2 u m x x o
u u o
Cần lưu ý là tất cả các đạo hàm trong ma trận Jacobian đều được đánh giá dọc theo
quỹ đạo khảo sát thực của phi thuyền không gian. Dựa trên ma trận Jacobian phương trình
(2.11) có thể viết lại dưới dạng đơn giản hơn:
.
 x(t)  Ax(t)  Au(t) (2.14)
34
Hình 2. 4: Đặc tính động cơ được điều khiển bằng role, trường hợp 1
Phương trình hệ quả này rất quan trọng. Nó cho thấy phương trình vi phân mô tả sai
lệch quanh quỹ đạo khảo sát là xấp xỉ tuyến tính, mặc dù hệ phương trình vi phân cơ sở
mô tả quỹ đạo bay khảo sát là phi tuyến.
Ta có thể tuyến tính hóa một hệ nếu có thể tương thích hoạt động của nó như một
hệ tuyến tính. Để chứng minh điều này, chúng ta hãy xét rơle hai vị trí điều khiển vòng
quay của động cơ theo mỗi chiều. Giả sử điện áp điều khiển cung cấp bởi rơle đến động
cơ, ec(t) được cho bởi:
ec (t)  Esin t (2.15)
Và momen động cơ, T(t) dạng sóng vuông do hoạt động đóng ngắt. Cả ec(t) và T(t)
đều được minh họa trên hình 2.4. Quan sát trên hình vẽ giá trị trung bình của cả hai hàm là
0.
Sau đó ta giả sử rằng điện áp điều khiển có giá trị trung bình Eo , ở đây:
ec (t)  Eo  Esin t (2.16)
Đối với trường hợp này, momen là hàm tuần hoàn có giá trị trung bình To khác
không, bởi đoạn ec(t) là dương hoặc âm không cân bằng, hình 2.5. Chú ý Eo cũng là một
hàm của thời gian, giả thiết nó thay đổi rất chậm so với  . Hơn nữa giả sử Eo< E có thể
dễ dàng chỉ ra giá trị trung bình To cho bởi đẳng thức:
2T
To  Eo (2.17)
E
Vì vậy, giá trị trung bình của momen To tỉ lệ giá trị trung bình của điện áp điều
khiển.
Hình 2. 5: Đặc tính động cơ được điều khiển bằng role, trường hợp 2
Đây là kết quả rất quan trọng. Nó chỉ ra rằng bằng một phần tử phi tuyến như rơle,
một mối quan hệ tuyến tính có thể đạt được giữa giá trị trung bình của điện áp điều khiển
35
và giá trị trung bình của momen động cơ gia tăng. Kỹ thuật tuyến tính hóa cơ bản được
dùng để lấy giá trị trung bình của áp điều khiển cho role như một đầu vào và chồng lên nó
một hàm thời gian hình sin có biên độ và tần số liên quan với đầu vào.
Trong mục sau, chúng ta sẽ mở rộng các khái niệm tuyến tính hóa và cố gắng áp
dụng chúng vào các hệ phi tuyến. Mặc dù khái niệm hàm truyền không thể áp dụng cho hệ
phi tuyến, nhưng một đặc tính truyền đạt xấp xỉ tương đương được rút ra cho một dụng cụ
phi tuyến có thể tính toán như là hàm truyền đạt trong các hoàn cảnh cụ thể. Ta định nghĩa
các đặc tính truyền đạt gần đúng này là hàm mô tả. Đây là khái niệm hữu ích và thường
được sử dụng trong thực tế.
2.4. PHƯƠNG PHÁP TUYẾN TÍNH HÓA ĐIỀU HÒA
2.4.1. Khái niệm
Phương pháp tuyến tính hóa điều hòa hay còn được gọi là phương pháp hàm mô tả
đã xuất hiện đồng thời trong vòng một tháng của năm 1948 ở nhiều nước Nga, Mỹ, Anh
Việc dùng hàm mô tả là một cố gắng để mở rộng gần đúng hàm truyền đạt rất đắc
lực của hệ tuyến tính sang hệ phi tuyến. Phương pháp tuyến tính hóa điều hòa là phương
pháp khảo sát trong miền tần số đã được ứng dụng cho các hệ phi tuyến bậc cao (n  2) do
dễ thực hiện và tương đối giống tiêu chuẩn Nyquist.
Ý tưởng cơ bản của phương pháp như sau: xét một hệ phi tuyến (không có tác động
kích thích bên ngoài) gồm hai phần tử phi tuyến và tuyến tính.
Hình 2. 6: Hệ phi tuyến không có tác động kích thích bên ngoài
Hình 2. 7: Hệ phi tuyến với kích thích đầu vào là sóng điều hòa
Để khảo sát khả năng tồn tại dao động tuần hoàn không tắt trong hệ, ở đầu khâu phi
tuyến ta cho tác động sóng điều hòa biên độ X m ,tần số góc  : x  t   X m sin  t  ABC .
Tín hiệu ra khâu phi tuyến sẽ chứa tần số cơ bản  và các họa tần 2,3...
Giả thuyết rằng khâu tuyến tính là bộ lọc tần số cao, các họa tần bậc cao so với tần
số cơ bản là không đáng kể thỏa mãn điều kiện biên độ sóng hài cơ bản là trội hơn hẳn
36
z mk G  jk
(2.18)
z m1 G  j
Trong đó: K là số các họa tần; Z là tín hiệu ra
Zm là biên độ đỉnh sóng tuần hoàn
Tín hiệu ở ngõ ra khâu tuyến tính thỏa điều kiện bộ lọc (2.18) bỏ qua các sóng hài
bậc cao Ym1,Ym2 ... và chỉ tính sóng họa tần cơ bản bậc một ta có biểu thức gần đúng
y  t   Ym1 sin  t   
 là góc lệch pha của tín hiệu ra so với tín hiệu vào.
Ta có phương trình giữa hai tín hiệu vào ra như sau
xt  yt  0
Điều kiện câ bằng khi thỏa điều kiện lọc:
y  t   Ym1 sin  t    (2.19)
X m  Ym1
 (2.20)
 
Phương trình (2.19) và (2.20) được gọi là phương trình cân bằng điều hòa, phương
trình đầu cân bằng biên độ, còn phương trình thứ hai cân bằng ha của dao đông tuần hoàn.
Phương pháp tuyến tính hóa điều hòa là một phương pháp gần đúng có thể giải
quyết được hai nhóm bài toán cơ bản sau:
a) Khảo sát chế độ tự dao động của hệ phi tuyến
b) Khảo sát điều kiện tồn tại chế độ tự dao động trong hệ phi tuyến
Trong trường hợp điều kiện lọc (2.18) không thỏa mãn tín hiệu ra không thể tính
gần đúng chỉ chứa tần số cơ bản được, tùy từng trường hợp cụ thể phải kiểm nghiệm lại
kết quả bằng thực nghiệm hoặc khẳng định trên mô hình toán hoặc vật lý của hệ thống.
Trong một số trường hợp phương pháp tuyến tính hóa gần đúng có thể cho kết quả sai về
câu hỏi có hay không dao dộng tuần hoàn trong hệ phi tuyến. Đối với trường hợp này có
thể dùng phương pháp tuyến tính điều hòa có tính đến các họa tần bậc cao để chứng minh
kết quả nhận được từ thực nghiệm.
2.4.2 Hàm mô tả hay hệ số khuếch đại phức của khâu phi tuyến
a) Định nghĩa
Hàm mô tả hay hệ số khuếch đại phức của khâu phi tuyến là tỉ số của thành phần
sóng hài cơ bản của tín hiệu ra khâu phi tuyến trên biên độ tín hiệu sin của tín hiệu vào
x  t   M sin t
Z1 A1  jB1
N  Xm    (2.21)
Xm M
37
Z1 - thành phần cơ bản  ( bậc một ) của tín hiệu ra khâu phi tuyến
X m - biên độ tín hiệu sin của tín hiệu vào khâu phi tuyến.
Phân tích dạng sóng ngõ ra bằng chuỗi Fourier cho bởi biểu thức
A 0 k  k 
n  t     A k cos  kt    Bk sin  kt  (2.22)
2 k 1 k 1
T/2
2
Trong đó: A k   n(t)sin  kt  d  t ,k  0,1,2...
T  T/2
(2.23)
T/2
2
Bk   n(t)cos  kt  d  t ,k  0,1,2...
T  T/2
Do chỉ sử dụng họa tần cơ bản nên ta có
T/2
2
A1   n(t)sin  kt  d  t 
T  T/2
(2.24)
T/2
2
B1   n(t)cos  kt  d  t 
T  T/2
Chú ý: Nếu hàm lẻ không có trễ B1  0
Nếu hàm lẻ có trễ B1  0
D là vùng chết; H là vùng trễ
b) Hàm mô tả của các khâu phi tuyến điển hình
- Hàm có vùng chết
Vì hàm trên là hàm lẻ, nên ta có B1  0

2
A1 
4
 
 Msin  t   D  sin  t  dt

4M   1  cos(2t)  D
2

  
 

2
  sin(t) dt
 M 

M sin(2t) D
 (2(t  )  4 cos(t)) 2
2 2 M

M 2  sin(2)
 (  2  sin(2)  4cos  sin )  M(1  )
2 
2  sin(2)
Do đó: N 1

38
Hình 2. 8: Hàm có vùng chết
- Khâu bão hòa
Hình 2. 9: Khâu bão hòa
39
Do hàm lẻ nên ta có B1  0
   

4 2
4  2 
A1   F(t)sin(t)dt    Msin 2 (t)dt   Dsin(t)dt 
0  0  
 
  

4  1  cos(2t) 2 
   M( )dt   Dsin(t)dt 
 0 2  
 
 
4 M sin(2t) 
 ( t  )  Dcos(t) 2 

 2 2 0 
  
M M
  2  2sin(2)  4sin  cos   2  sin(2)
 
1
Vậy: N   2  sin(2) 

- Rơle ba vị trí có trễ
Hình 2. 10: Khâu rơle 3 vị trí có trễ
40
- Khâu so sánh có trễ ( Trigger Shmitt không đảo )
 
4 4
A1 
  V0 max sin(t)dt B1 
  V0 max cos(t)dt
 
2  2 
A1  (V0 max cos(t)) B1  (V0 max sin(t))
   
4V0 max 4V0 max
A1  cos  B1  sin 
 
4V
N  0 max (cos   jsin )
AVH
1 M M
sin   ,A  
A D VH
Hình 2. 11: Khâu rơle 3 vị trí có trễ
- Hàm bậc hai đối xứng

 x 2 (x  0)
F x   
 x (x  0)
2
 M 2 sin 2 (t)(sin(t)  0)
Y
M sin (t)(sin(t)  0)
2 2
Y là hàm lẻ, nên B1  0
41

2
4
A1 
0 M 2 sin 2 (t)sin(t)dt
4 2
A1 
 0 M 2 (1  cos 2 (t))d(cos(t))
0
4M 2 cos3 (t)
A1  (cos(t)  
 3
2
4M  1  8M
2 2
A1  1 
  3  3
8M
Vậy: N
3
- Hàm bậc ba
Tương tự hàm bậc hai trên
Hàm bậc ba cũng là hàm lẻ nên B1  0
F(x)  x 3
Y  M 3 sin 3 (t)
Ta có:
2
1
A1  M sin 3 (t)sin(t)d(t)
3
 0
2
M3 1  cos(4t)
A1 
4  (1  2cos(2t)  2
)d(t)
0
M 3cos(t)
3
sin(t) 2
A1  (  sin(t)  )
4 2 8 0
M3 3M 3
A1  (3) 
4 4
3M 2
Vậy: N
4
- Ví dụ: Hàm truyền hở của phần tuyến tính một hệ phi tuyến
K
G( j)H( j) 
j(1  0,5j)(1  0,1j)
Phương trình đặc tính của phần tuyến tính liên tục có hệ số khuếch đại bằng K
42
A(s)  s(1  0,5s)(1  0,1s)  K
A(s)  0,05s3  0,6s 2  s  K
Hệ số khuếch đại giới hạn được xác định theo tiêu chuẩn Hurwitz cho hệ bậc ba là:
 2  0,6  0,05K gh  0  K gh  12
Đường cong Nyquist cho ba trường hợp K khác nhau được vẽ ở hình 2.12. Giao
điểm của đồ thị - 1/N(M) với đường cong Nyquist của phần tuyến tính G( j) có K=17 ký
hiệu là điểm B. Tại điểm B tồn tại dao động không ổn định vi đi theo chiều tăng của biên
độ theo đặc tính – 1/N(M) của khâu phi tuyến, chuyển động từ vùng ổn định (gạch sọc bên
trái G( j) sang vùng không ổn định của phần tuyến tính G( j) . Ngược lại, chế độ dao
động là ổn định, nếu đi theo chiều tăng của biên độ đặc tính – 1/N(M) của khâu phi tuyến,
chuyển từ vùng không ổn định sang ổn định của phần tuyến tính G( j)
Hình 2. 12: Ví dụ hàm truyền hệ hở của 1 hệ phi tuyến
Trong trường hợp K=2, đặc tính -1/N của khâu phi tuyến nằm hoàn toàn ở vùng ổn
định của G( j) , 0     , kết luận hệ phi tuyến là ổn định ở trạng thái cân bằng:
R(t)  0
- Ví dụ: Hệ phi tuyến đặc tính rơle 3 vị trí không trễ với phần tuyến tính:
K
G(s) 
s(1  0.2s)(1  2s)
Phi tuyến tính hình 1.17 có D = 0,1; h = 0; K1  6
Phương trình cân bằng điều hòa gần đúng:
1  G( j)N(M)  0
43
Hình 2. 13: Hệ phi tuyến đặc tính rơle 3 vị trí không trễ với phần tuyến tính
Giải bằng phương pháp đồ thị, trướcc tiên tìm  - là tần số dao động tại B

 arctg0,2  artg2  
2
Suy ra   1,58sec 1
D
Đặt  A ; tính A từ (2.25) ta có:
M
A1  1,1 
  M1  0,11;M 2  0,259
A 2  2,59
Phương trình (2.25) viết cho ví dụ cụ thể khi
D = 0 (rơle 2 vị trí )
4K1
G( j)  1  0
M
4K1
Tại điểm B ta có: G( j )  1  0
M
4,6
Hay (0,0364)  1  0
M
Suy ra M  0, 278
Kết luận: Trong trường hợp rơ le 3 ở vị trí không trễ, dao động ổn định tại điểm B
có biên độ A 2  2,59 ; tần số   1,58sec 1 . Nếu giữ nguyên phần tuyến tính, thay
khâu phi tuyến là rơ le 2, vị trí D = 0 ta có chế độ dao động tại B là:
m(t)  0,278sin1,58t chế độ tự dao động
44
2.5. PHƯƠNG PHÁP TUYẾN TÍNH HÓA TỪNG ĐOẠN
2.5.1. Đặt vấn đề
Xấp xỉ bất cứ phi tuyến nào đồng nghĩa với việc phân đoạn tuyến tính từng khúc là
công cụ có hiệu quả cho việc phân tích. Mỗi đoạn dẫn đến phương trình vi phân tuyến tính
tương ứng đơn giản hơn. Phương pháp này, không hạn chế cho hệ gần tuyến tính có ích lợi
là tạo ra lời giải thích chính xác cho bất cứ bậc phi tuyến nào nếu bản thân phi tuyến có thể
tuyến tính hóa từng đoạn hay có thể xấp xỉ bằng các đoạn tuyến tính. Ta sẽ chứng minh
ứng dụng của nó qua ví dụ sau:
2.5.2. Ví dụ ứng dụng
Hình 2. 14: Hệ điều khiển hồi tiếp chứa bão hòa
Hình 2.14 minh họa một hệ điều khiển hồi tiếp đơn giản chứa bộ tích phân và bộ
khuếch đại bão hòa. Độ lợi bộ khuếch đại là 5 trong một tầm điện áp 1V . Đối với các
điện áp vào lớn hơn, bộ khuếch đại bão hòa. Hoàn toàn rõ ràng có hai vùng hoạt động tuyến
tính phân biệt của bộ khuếch đại. Mỗi vùng hoạt động tuyến tính này có thể xem xét một
cách độc lập bằng phương pháp tuyến tính hóa từng đoạn để có được đáp ứng tổng hợp của
hệ thống.
Đối với vùng không bão hòa, đẳng thức hoạt động hệ thống là
c(t)  r(t)  c(t) (2.26)
f (t)  5c(t) (2.27)
c(t)   f (t)dt (2.28)
Suốt quá trình bão hòa, phương trình (2.26) và (2.28) vẫn có giá trị. Tuy nhiên (2.27)
thay đổi thành
f (t)  5 khi e(t)  1 (2.29)
f (t)  5 khi e(t)  1 (2.30)
Giả sử điều kiện đầu là không và đầu vào hàm nấc 10V, biểu thức đầu ra trong vùng
hoạt động bão hòa csat (t) được cho bởi
45
t
csat (t)   5dt  5t (2.31)
0
Biểu thức đầu ra trong suốt khu vực không bão hòa được cho bởi
t
dcus (t)
cus (t)  5 10  c  dt hoặc  5c  50 (2.32)
0
dt
Thời gian t1 là thời gian mà ở đó bộ khuếch đại làm việc tuyến tính chưa bão hòa.
Khi c  9,e  1, t1 là 1,8sec. Dùng các kỹ thuật thông thường tính đáp số cho phương trình
(2.32):
cus (t)  10  e 5(t 1.8) (2.33)
Giá trị ban đầu đối với vùng này, cus (0) , giống giá trị cuối cùng của vùng bão hòa
csat (1,8)  9 . Sự liên tục ở ngõ ra là do tác động của bộ tích phân. Vì vậy, đáp số tổng hợp
đối với bài toán này, có được bằng phân tích tuyến tính từng khúc là
csat (t)  5t khi 0  t  1,8 (2.34)
cus (t)  10  e 5(t 1,8) (2.35)
Đáp ứng của hệ đối với đầu vào hàm nấc 10V được vẽ trên hình 2.15
Phương pháp tuyến tính từng đoạn trong bài trên có thể mở rộng sang các phi tuyến
phức tạp khác. Cần lưu ý là các điều kiện biên giữa các vùng tuyến tính là liên tục tại bất
cứ thời điểm nào, hàm truyền đạt theo sau phi tuyến là một hàm hữu tỉ riêng. Phương trình
vi phân dẫn ra trên mỗi vùng phân đoạn là tuyến tính và có thể giải được dễ dàng bằng các
kỹ thuật tuyến tính thông dụng.
Hình 2. 15: Đáp ứng bậc thang của hệ bão hòa được tính bằng phân tích tuyến tính từng
đoạn
46
2.6. TIÊU CHUẨN LYAPUNOV
2.6.1. Khái niệm về ổn định
Đối với hệ tuyến tính bất kỳ một quá trình quá độ nào cũng có thể xem xét ở dạng
tổng của thành phần quá độ hay còn gọi là tự do và thành phần cưỡng bức. Hệ tuyến tính
được gọi là ổn định nếu thành phần quá độ tiến tới không khi thời gian tiến tới vô cùng.
Vấn đề xét ổn định hệ phi tuyến phức tạp hơn rất nhiều vì không áp dụng được
nguyên lý xếp chồng và trong hệ thống có khả năng xuất hiện tự dao động. Tính chất của
hệ phi tuyến là có nhiều trạng thái cân bằng, song hệ tuyến tính chỉ có một trạng thái cân
bằng. Tính ổn định của hệ phi tuyến phụ thuộc vào biên độ tín hiệu tác động vào hệ.
Phụ thuộc vào sự có mặt của tín hiệu tác động vào hệ mà tất cả các hệ thống được
chia thành hai loại thuần nhất và không thuần nhất. Trong hệ thuần nhất không có tín hiệu
tác động vào hệ. Đặc tính cơ bản đặc thù cho hệ phi tuyến thuần nhất hai quá trình cân
bằng và tự dao động. Đối với hệ phi tuyến không thuần nhất tồn tại khái niệm ổn định của
quá trình sinh ra do tác động bên ngoài.
Hệ phi tuyến ở trạng thái cân bằng có thể ổn định trong phạm vi hẹp, phạm vi rộng
và toàn cục phụ thuộc vào vùng sai lệch cho phép khỏi trạng thái cân bằng. Ngoài ra đối
với hệ phi tuyến vấn đề ổn định còn bao gồm ổn định của chuyển động và ổn định của quỹ
đạo.
Trong thực tế không tránh khỏi sự tác động của các nhiễu, nên bài toán ổn định
chuyển động có ý nghĩa rất quan trọng về mặt lý thuyết cũng như về mặt thực tiễn. Chính
vì lẽ đó mà nhiều nhà cơ học và toán học lỗi lạc đã tập trung nghiên cứu vấn đề này. Vào
năm 1892 trong luận văn tiến sĩ khoa học “Bài toán tổng quát về ổn định chuyển động” A.
M. Lyapunov đã đặt bài toán ổn định chuyển động dưới dạng tổng quát nhất và đưa ra
những phương pháp chặt chẽ, độc đáo, rất có hiệu lực để giải quyết bài toán. Công trình
nổi tiếng này là điểm xuất phát của nhiều công trình nghiên cứu về lý thuyết ổn định cho
đến ngày nay.
Để xác định một cách ổn định việc sử dụng phương trình biến trạng thái dạng
thường
x  Ax  Bu cho hệ tuyến tính (2.36)
Và x  f (x, t, u) cho hệ phi tuyến (2.37)

Ký hiệu chuyển động không bị nhiễu là x*  t,u  t  , x o 
Chuyển động bị kích thích có dạng x  t,u  t   , x o  x o
Đặc trưng cho độ lệch của chuyển động bị nhiễu so với chuyển động không bị nhiễu
là x  x  x
*
47
Xác định trị tuyệt đối của hiệu hai véctơ tương ứng với chuyển động bị nhiễu và
không bị nhiễu
x  x   x  x   
2 2 2
x  x*  * *
 ...  x  x* (2.38)
Phương trình viết cho độ lệch

x  x12  x 22  x 32  ...  x n2 (2.39)
Hình 2. 16: Biểu diễn hình học định nghĩa ổn định chuyển động
Định nghĩa: Chuyển động không bị nhiễu được gọi là ổn định nếu với mọi số dương
 nhỏ tùy ý cho trước, có thể tìm được một số dương     sao cho với mọi độ lệch của
chuyển động bị nhiễu so với chuyển động không bị nhiễu tại thời điểm đầu thỏa mãn điều
kiện
x  x*  
cũng sẽ thỏa mãn tại mọi thời điểm sau t  t o
x  x*   (2.40)
Trên hình 2.16 biểu diễn về mặt hình học định nghĩa ổn định chuyển động. Kí hiệu
p là khoảng cách giữa hai quỹ đạo không bị nhiễu (1) và quỹ đạo bị nhiễu (2).
Quỹ đạo khép kín (1) là ổn định nếu với mọi số dương  nhỏ tùy ý, có thể tìm được
một số dương δ   sao cho p không vượt ra khỏi giới hạn  .
Nếu chuyển động không bị nhiễu ổn định và nếu thỏa mãn điều kiện
48
lim x  x*  0 (2.41)
t 
thì chuyển động không bị nhiễu được gọi là ổn định tiệm cận.
Bài toán ổn định chuyển động theo nghiên cứu của Lyapunov có một số đặc điểm
sau:
- Ổn định được xét đối với các nhiễu đặt lên điều kiện ban đầu.
- Sự ổn định được xét trong khoảng thời gian hữu hạn, nhưng lớn tùy ý.
- Các nhiễu được giả thiết là bé.
2.6.2. Phương pháp thứ nhất của Lyapunov
Để giải quyết bài toán ổn định chuyển động, Lyapunov đã xây dựng những phương
pháp riêng, độc đáo, chúng có thể phân thành hai loại chủ yếu. Loại thứ nhất bao gồm
những phương pháp khảo sát trực tiếp chuyển động bị nhiễu dựa trên việc xác định các
nghiệm tổng quát hoặc nghiệm riêng của phương trình vi phân của chuyển động bị nhiễu.
Hệ thống ổn định hay không ổn định được xác định từ lời giải này. Sử dụng phương pháp
tuyến tính hóa viết phương trình vi phân phi tuyến của chuyển động bị nhiễu bằng một hệ
phương trình tuyến tính gần đúng đã bỏ qua các số hạng bậc cao, về thực chất là thay thế
một bài toán này bằng một bài toán khác mà chúng có thể không có tính chất nào chung
với nhau. Tuy nhiên cũng có trường hợp trong đó tính ổn định hoặc không ổn định của
nghiệm phương trình gần đúng thứ nhất có thể biết được sự ổn định hay không ổn định của
phương trình phi tuyến. Hay nói cách khác, đáp số gần đúng trong phương pháp thứ nhất
của Lyapunov thường cung cấp thông tin hữu ích về tính ổn định của chuyển động bị nhiễu.
Giả thiết phi tuyến là đơn vị và tồn tại đạo hàm ở mỗi cấp trong lân cận điểm cân
bằng (). Hàm phi tuyến:
x  fi  x  ;i  1,n (2.42)
Có thể khai triển thành chuỗi Taylor như sau
fi f
i  x1  i x 2  ...  (2.43)
x1 x x x 2 x x c
c
Hay x1  Ax (2.44)

f1 f1
...
x1 x 2
f 2 f 2
Với A  ... (2.45)
x1 x 2
... ... ...
x xc
Thành lập phương trình đặc trưng tương ứng với phương trình xấp xỉ tuyến tính
49
det  SI  A   0 (2.46)
Với I là ma trận đơn vị có rank là n (bậc của phương trình)
Lyapunov chứng minh rằng nếu nghiệm của phương trình đặc trưng (2.46) có phần
thực khác không thì các phương trình xấp xỉ tuyến tính luôn cho đáp số đúng đối với câu
hỏi ổn định của hệ phi tuyến.
Nếu tất cà các nghiệm của phương trình đặc trưng có phần thực âm thì hệ phi tuyến
sẽ ổn định trong phạm vi hẹp.
ReSi  0,i  1, n (2.47)
Nếu chỉ có một trong số các nghiệm của phương trình đặc trưng có phần thực dương
thì hệ phi tuyến không ổn định.
Nếu có dù chỉ là một nghiệm của phương trình đặc trưng có phần thực bằng không
và tất cả nghiệm còn lại đều có phần thực âm thì không thể kết luận về tính ổn định của hệ
phi tuyến theo đánh giá nghiệm của phương trình tuyến tính gần đúng được.
Hình 2. 17: Sơ đồ tùy động đơn giản
Ví dụ: Xét một hệ tùy động đơn giản có sơ đồ như hình hình 2.17.
U N  sin  (đặc tính phi tuyến)
K
Hàm truyền của động cơ: G  s   (2.48)
s  Ts  1
UM – điện áp tương ứng với momen tải đặt vào động cơ.
Xét ổn định của hệ ở trạng thái cân bằng theo phương pháp thứ nhất của Lyapunov
Thành lập phương trình cho hệ
dx1
Đặt x1   ta có  x2
dt
dx1 K 1 K
  Sin x1  x 2  U M (2.49)
dt T T T
dx1 x f
Hay  f  x  ;x  1 ;f  x   1 (2.50)
dt x2 f2
50
Phương trình chứa thành phần sinx, do đó là phương trình phi tuyến. Trạng thái cân
bằng được định nghĩa
dx f 0
 0; do vậy 1 (2.51)
dt f2  0
Phương trình trạng thái cân bằng:
x2  0 (2.52)
sin x1  U M  U M  1 (2.53)
Sử dụng phương pháp thứ nhất để khảo sát đối với phi tuyến nhỏ
f1 f 2
0 1
x1 x1
A  K 1 (2.54)
f 2 f 2  cos x1 
T T
x1 x 2
 1 K
det  sI  A   s  s    cos x1  0 (2.55)
 T T
Xét các trường hợp cụ thể:
1) U M  0 ( ) không có tác động nhiễu
Từ phương trình của trạng thái cân bằng ta có
sin x1  U M  0 (2.56)
 x1  2m(0, 2, 4....)
cos x1  1
Phương trình đặc trưng có dạng:
 1 K
ss     0 (2.57)
 T T
Với K > 0, ReS1,2 < 0 theo tieâu chuaån Huwitz
Áp dụng phương pháp thứ nhất Lyapunov, hệ ổn định trong phạm vi hẹp.
*  x1  (2m  1); m- là số nguyên bất kỳ
cos x1  1
Phương trình đặc trưng có dạng
 1 K
ss     0 (2.58)
 T T
Một nghiệm có phần thực dương và một nghiệm có phần thực âm, áp dụng phương
pháp thứ nhất kết luận hệ không ổn định trong phạm vi hẹp và điểm cân bằng không ổn
định trong phạm vi hẹp
2) U M  1 (2.59)
51
sin x1  U M  1
cos x1  0
Phương trình đặc trưng có dạng
 1
ss    0 (2.60)
 T
1
Một nghiệm s1  0 và mọt nghiệm s    0 không áp dụng được phương
T
pháp thứ nhất của Lyapunov.
Nhấn mạnh quan trọng là phương pháp thứ nhất của Lyapunov xác định sự ổn định
trong lân cận tực thời của điểm cân bằng.
2.6.3. Phương pháp thứ hai của Lyapunov
Một trong những phương pháp có hiệu lực nhất để khảo sát bài toán ổn định chuyển
động là phương pháp thứ hai hay còn gọi là phương pháp trực tiếp của Lyapunov. Theo
phương pháp này tiêu chuẩn ổn định chuyển động có thể áp dụng trực tiếp vào hệ phương
trình vi phân của chuyển động bị nhiễu mà không thông qua việc tích phân hệ phương
trình.
Giá trị của phương pháp thứ hai không chỉ ở việc xác lập những tiêu chuẩn ổn định
của chuyển động mà còn ở chỗ nó cho phép xác định miền biến thiên của các thông số,
xác định thời gian chuyển tiếp và đánh giá chất lượng điều chỉnh trong các hệ thống tự
động.
Phương pháp này dựa trên hàm V  x1, x 2 ...x n  có tính chất đặc biệt là có thể so sánh
với tổng động năng và thế năng và khảo sát đạo hàm toàn phần theo thời gian dV/dt, trong
đó các biến x1, x 2 ...x n là biến trạng thái của phương trình vi phân mô tả chuyển động bị
nhiễu.
Định lý Lyapunov về ổn định tiệm cận
Nếu tìm được một hàm V(x) với mỗi biến trạng thái x1, x 2 ...x n là một hàm xác định
dV  x 
dấu dương, sao cho đạo hàm của nó dt dựa theo phương trình vi phân của chuyển
động bị nhiễu:
x  f (x1, x 2 ...x n ) (2.61)

cũng là hàm xác định dấu, song trai dấu với hàm V(x) thì chuyển động không bị nhiễu sẽ
ổn định tiệm cận.
Ta giới thiệu phương pháp thứ hai của Lyapunov qua ví dụ minh họa một hệ cơ học
khối lượng (M)-lò xo (K)-bộ giảm chấn (B) đơn giản có thể biểu diễn bằng phương trình
bậc hai:
52
d2x  t 
dx(t)
M B Kx  t   f  t  (2.62)
dt 2 dt
Giả sử M = B = K = 1 và f  t   0; ta có
xt  xt  xt  0 (2.63)
Đặt x1  t   x(t);x 2 (t)  x(t); ta có
x1  t   x 2 (t) (2.64)
x 2 (t)   x1 (t)  x 2 (t) (2.65)

Hệ tuyến tính đơn giản này có thể giải dễ dàng. Giả sử các điều kiện đầu:
x1  0   1 (2.66)
x 2 0  0 (2.67)
Khi đó các đáp án số có dạng sau:
x1  t   1,15e t/2 sin(0,866t   / 3) (2.68)
x 2  t   1,15e t/2 sin(0,866t) (2.69)

Các phương trình (2.67) và (2.68) được vẽ trong miền thời gian ở hình 2.18 và ở
mặt phẳng pha ở hình 2.19. Hai hình này hoàn toàn xác định sự ổn định của hệ thống cơ
học đơn giản này. Hệ thống là ổn định và trạng thái x t1( ), x t2( ) hoạt động như đã chỉ ra.
Hình 2. 18: Đáp ứng miền thời gian của một hệ cơ học đơn giản
53
Hình 2. 19: Mặt phẳng pha của một hệ cơ học đơn giản
Bây giờ, ta hãy xét hệ thống đơn giản này trên quan điểm năng lượng. Tổng năng
lượng lưu trữ được cho bởi:
1 1
V  t   Kx12  t   Mx 22  t  (2.70)
2 2
Do K=M=1 trong ví dụ đơn giản
1 1
V  t   x12  t   x 22  t  (2.71)
2 2
Tổng năng lượng này bị tiêu tán dưới dạng nhiệt ở bộ giảm chấn tại vận tốc
V  t   Bx1  t  x 2  t   Bx 22  t  (2.72a)
Do B=1 ta được V  t    x 22  t  (2.72b)

Phương trình (2.71) xác định quỹ tích của năng lượng tích trữ hàng số ở mặt phẳng
x1 (t) và x 2 (t) . Với ví dụ đơn giản này, chúng chuyển động vòng tròn. Nhận xét từ phương
trình (2.73) là vận tốc năng lượng luôn luôn âm và do đó các đường tròn này phải ngày
càng nhỏ dần theo thời gian. Hình 2.20 minh họa đặc điểm này trên mặt phẳng pha đối với
ví dụ đơn giản đã cho ta có thể xác định thời gian thay đổi của V(t) và V(t) một cách tường
minh bằng cách thay thế phương trình (2.68) và (2.69) vào phương trình (2.72a) và (2.72b).
Kết quả như sau sau:
V  t   0 ,667 e t [sin 2 (0,866t )  sin 2 (0,866t   / 3)] (2.73a)
V  T    1 333 e t sin 2 (0 ,866t ) (2.73b)
Hình 2.20 minh họa thời gian thay đổi của V(t) và V(t) . So sánh hình 2.19 và 2.20,
ta kết luận năng lượng tích trữ tổng cộng tiến đến không khi thời gian tiến ra vô cùng. Điều
này ngụ ý rằng hệ thống là tiệm cắt ổn định, nghĩa là trạng thái sẽ trở về gốc từ bất cứ điểm
54
x(t) nào trong vùng R xung quanh gốc. Ổn định tiếp cận là một dạng ổn định được chú ý
của các kỹ sư điều khiển bởi vì nó loại trừ dao động giới hạn ổn định
Hình 2.20: Hình 2.21

Hình 2. 20: Quỹ hằng số năng lượng trên mặt phẳng pha minh hoạ sự gia tăng năng
lượng theo thời gian
Hình 2. 21:Sự thay đổi năng lượng và tốc độ năng lượng theo thời gian
Sự ổn định của các hệ phi tuyến phụ thuộc vào trạng thái không gian riêng trong đó
vectơ trạng thái được thêm vào đối với dạng và độ lớn của đầu vào. Vì vậy, sự ổn định của
các hệ phi tuyến cũng có thể phân loại trên cơ sở vùng như sau:
a) Ổn định cục bộ hay ổn định trong phạm vi nhỏ
b) Ổn định hữu hạn
c) Ổn định toàn bộ
Một hệ phi tuyến được biểu thị là ổn định cục bộ nếu nó giữ nguyên tình trạng trong
một vùng rất nhỏ quanh một điểm bất thường khi đưa vào một dao động nhỏ.
Ổn định hữu hạn đề cập đến một hệ thống trở lại điểm bất thường từ bất cứ điểm
x(t) nào trong khu vực R kích thước hữu hạn bao quanh nó.
Hệ thống được gọi là ổn định toàn bộ nếu khu vực R bao gồm toàn bộ không gian
trạng thái hữu hạn. Sự ổn định của mỗi loại khác nhau của bộ, hữu hạn hoặc toàn bộ không
loại trừ các dao động giới hạn, nhưng chỉ trừ tình huống có thể tồn tại điểm trạng thái có
xu hướng di chuyển đến vô cùng. Nếu điểm trạng thái đến gần điểm bất thường khi thời
gian tiến ra vô cùng, đối với bất cứ điều kiện ban đầu nào trong vùng đang được xem xét,
lúc đó hệ thống được mô tả là ổn định tiệm cận. Ổn định tiệm cận phân loại trừ dao động
giới hạn ổn định là một điều kiện cân bằng động học có thể xảy ra. Điều kiện mạnh nhất
có thể được đặt lên một hệ điều khiển phi tuyến với các thông số bất biến theo thời gian là
ổn định tiệm cận toàn bộ.
Yếu tố chính trong phép phân tích này là việc chọn hàm năng lượng V(t):
55
1 1
V  t   x12  t   x 22  t  (2.74)
2 2
Hàm này có hai tính chất rất thú vị. Thứ nhất, nó luôn dương đối với các giá trị khác
không của x1 (t) và x 2 (t) .Thứ hai, nó bằng không khi x1 (t)  x 2 (t)  0 . Một hàm vô
hướng có các tính chất này gọi là hành xác định dương. Bằng cách thêm V(t) như một
chiều thứ ba đối với mặt phẳng x1(t) và x2(t), hàm xác định dương V(x1,x2) xuất hiện là
mặt ba chiều làm thành dạng hình chén như minh họa trên hình 2.22
Hình 2. 22: Hàm xác định dương
Định lý ổn định của Lyapunov: Bây giờ có thể được tóm tắt cho không gian trạng
thái n chiều: Một hệ động lực bậc n là ổn định tiệm cận nếu hàm xác định dương V(t) được
tìm thấy có đạo hàm theo thời gian là âm dọc theo quỹ đạo của hệ thống. Trong thực tế dễ
tìm một hàng xác định dương nhưng thêm vào đó hàm V có đạo hàm dV/dt < 0 dọc theo
các quỹ đạo lại rất khó tìm.
Dạng toàn phương của hàm V(x)
1 n n
V  x    qijx i x j;
2 i1 j1
 qij  q ji  (2.75)
Định lý Sylvester: Điều kiện cần và đủ để dạng toàn phương V(x) là hàm xác định
dương là tất cả các định thức đường chéo chính của ma trận đối xứng Q phải dương:
q11 q12 q13
Q  q 21 q 22 q 23 ;q ij  q ji
q 33 q 32 q 33
q11 q12
1  q11  0;  2 
Nghĩa là q 21 q 22 (2.76)
n  0
56
Nếu hàm V(x) là hàm xác định âm thì điều kiện (2.76) được thay thế bằng điều kiện
1;  2 ;....;  n  0 (2.77)
Dạng bình phương của hàm V(x)
V  x   x TQ x (2.78)
Q là ma trận đối xứng qij = qji
Với n = 2
q11 q12
Q ;q 21  q12
q 21 q 22
q11 q12
Điều hiện để hàm V(x) xác định dương theo định lý Sylvester là: Q  vì
q 21 q 22
1  q11  0
 2  q11q 22  q12
2
0
Hàm V(x) là hàm xác định dương.
Ví dụ: V  x    x1  x 2   x12  2x1x 2  x12
2
1 1 1  1
Q ;
1 1 0  0
Không thỏa mãn định lý Sylvester ∆2 = 0 hàm V(x) là hàm có dấu không đổi: V x( )
= 0 tại x1 = x2 = 0 và x1 = −x2
Phương pháp thứ hai của Lyapunov là điều kiện đủ, nếu điều kiện thỏa mãn thì hệ
ổn định. Nếu như điều kiện không thỏa mãn thì không thể kết luận hệ thống ổn định hay
không. Trong trường hợp này vấn đề ổn định chưa có lời giải. Một hàm Lyapunov V(x)
đối với bất kì một hàm cụ thể nào không phải là duy nhất. Do đó, nếu một hàm riêng V
không thành công trọng việc hứng minh một hệ cụ thể ổn định hay không, không có nghĩa
là không thể tìm ra một hàm V khác để xác định được tính ổn định của hệ.
Chọn hàm V(x) là hàm xác định dương sao cho:
dV
*  0 : hệ ổn định
dt
dV
* là hàm xác định âm
dt
Hệ ổn định tiệm cận
dV
* không âm không dương. Vấn đề về ổn định của hệ còn để ngỏ.
dt
Ghi chú: Phương pháp trực tiếp của Lyapunov phụ thuộc vào
- Cách chọn biến trạng thái
57
- Cách chọn hàm Lyapunov
Định lý về không ổn định
Cho hệ thống bậc hai được mô tả bởi hệ phương trình biến trạng thái:


 x1  x 2  x1 x1  x 2
2 2


1 2 
x  x  x x 2  x 2
 2 1 2 
(2.79)
Cho hàm V(x) để xét tính ổn định của hệ
Định lý: Nếu tìm được một hàm V(x) sao cho đạo hàm dV dt dựa vào phương trình
vi phân của chuyển động bị nhiễu là hàm xác định dấu, còn trong lân cận tùy ý bé của các
gốc tọa độ có những điểm tại đó hàm V lấy giá trị cùng dấu với V thì chuyển động không
bị nhiễu không ổn định.
Áp dụng cho ví dụ minh họa, chọn hàm V
V
1 2
2

x1  x 22  (2.80)
V  x1 x1  x 2 x 2
Thế phương trình (2.79) vào (2.80) ta được
V  x1x 2  x12 (x12  x 22 )  x 22 (x12  x 22 )  x1x 2

(2.81)
V  (x12  x 22 ) 2
là hàm xác định dương, cũng như hàm V, điều kiện không ổn định thỏa mãn cho ví dụ
được nêu.
Nếu hệ được mô tả bằng phương trình biến trạng thái ở dạng chính tắc
y1  1y1
(2.82)
y2   2 y2
chọn hàm V  y12  y 2 2 là hàm xác định dương.

V  2 1y12   2 y 22  (2.83)
Nếu chọn hàm V có dạng

V  2 1y12   2 y 22 
thì V  4 y y 2
1 1 1   2 y 2 y 22  (2.84)
58

V  4 12 y12   22 y 22  (2.85)
Hàm V (2.85) là hàm xác định dương, điều kiện để hàm V (2.84) cũng là hàm xác
định dương là
1  0  2  0
Điều kiện không ổn định của chuyển động cũng chủ là điều kiện đủ. Câu trả lời về
tính ổn định hoàn toàn phụ thuộc vào cách chọn biến trạng thái và cách chọn hàm V
Trước năm 1940 phương pháp thứ hai của Lyapunov hầu như chưa được áp dụng.
Sau năm 1940 phương pháp này bắt đầu được sử dụng để phân tích các hệ điều khiển phi
tuyến . Ngày nay kết quả của nó và của nhiều công trình khoa học nghiên cứu về lý thuyết
ổn định được phát triển sau này, đã được đưa vào áp dụng ngày càng rộng rãi trong nhiều
ngành như vật lý, thiên văn, hóa học và cả sinh vật và đặc biệt trong các ngành kĩ thuật
hiện đại như kỹ thuật điện tử, điều khiển tự động
2.7. TIÊU CHUẨN ỔN ĐỊNH TUYỆT ĐỐI V. M. POPOV
Một tiêu chuẩn ổn định lý thú và rất mạnh đối với các hệ phi tuyến bất biến theo
thời gian được giới thiệu vào năm 1959 do nhà toán học người Rumani V.M Popov. Ổn
định tuyệt đối được gọi là ổn định tiệm cận của trạng thái cân bằng trong toàn bộ đối với
những phi tuyến thuộc một thể loại xác định. Tiêu chuẩn tần số của Popov là điều kiện đủ
để xét ổn định tiệm cận các hệ hồi tiếp vòng đơn (Hình 2.23).
Hình 2. 23:Hệ điều khiển hồi tiếp phi tuyến được đề cập bởi Popov
Phương pháp này được Popov phát triển từ đầu, có thể áp dụng cho các hệ hồi tiếp
vòng đơn chứa phẩn tử tuyến tính và phi tuyến bất biến theo thời gian. Điểm nổi bật quan
trọng của phương pháp Popov là nó có thể áp dụng được cho các hệ thống bậc cao .
Ngay khi đã biết được đáp ứng tần số của phần tử tuyến tính có thể xác định sự ổn
định của hệ thống điều khiển phi tuyến. Đó chính là sự mở rộng biểu đồ Nyquist sang hệ
phi tuyến.
Mục này trình bày tiêu chuẩn ổn định Popov với khái niệm về sự ràng buộc dưới
dạng bất đẳng thức cho phần phi tuyến, phần gắn với đồ thị tần số biến dạng của phần tử
tuyến tính. Đặc điểm nổi bật quan trọng nhất và hấp dẫn nhất của tiêu chuẩn Popov là nó
chia sẻ tất cả các đặc tính tần số mong muốn của phương pháp Nyquist.
59
Để giới thiệu phương pháp Popov, ta xét hệ phi tuyến được minh họa ở hình 2.23.
Đầu vào khảo sát r(t) được giả thiết là bằng không. Do đó đáp ứng của hệ thống này có thể
biểu diễn như sau:
e  t   eo  t    g  t    u    d
t
(2.86a)
0
trong đó: g  t   L1 G  s   đáp ứng kích thích đơn vị
eo  t  – đáp ứng điều kiện ban đầu

Trong phép phân tích này phần tử phi tuyến N[e(t)] thỏa mãn điều kiện giới hạn
riêng. Ta giả sử mối liên hệ vào ra của phần tử phi tuyến được giới hạn nằm trong vùng
minh họa trên hình 2.24.
Hình 2. 24:Vùng giới hạn của phi tuyến
Điều kiện giới hạn cho phần tử phi tuyến:

0  N e  t    K (2.86b)
và u  t   N e  t   e  t 
Tại mọi thời điểm t tồn tại giá trị giới hạn
u  t   u m   nếu e  t   em (2.87)
Giả thiết duy nhất liên quan đến phần tử tuyến tính G(s) là đáp ứng đầu ra ổn định
bậc n.
Trường hợp phần tuyến tính khôn ổn định, phải dùng phương pháp hiệu chỉnh để
đưa về ổn định, sau đó mới xét theo tiêu chuẩn Popov.
Phương pháp Popov liên quan đến hoạt động tiệm cận của tín hiệu điều khiển u(t)
và ngõ ra –e(t) của phần tử tuyến tính. Do đó thêm vào các định nghĩa ổn định tiệm cận,
ổn định cục bộ, ổn định hữu hạn, ổn định toàn bộ đã giới thiệu ở mục 2.6 kết hợp với tiêu
chuẩn ổn định Lyapunov, đây ta quan tâm đến điều khiển tiệm cận và đầu ra tiệm cận.
Điều khiển tiệm cận bậc n tồn tại nếu một giá trị thực n có thể được tìm thấy cho mỗi tập
các điều kiện bạn đầu như sau:
60

 nt
 [e u(t)]2dt   (2.88)
0
Đầu ra tiệm cận bậc n tồn tại nếu một giả trị thực n được tìm thấy cho bởi tập các
điều kiện ban đầu như

 nt
 [e e(t)]2dt   (2.89)
0
Các định nghĩa ổn định này có thể làm rõ bằng các bổ đề như sau :
Nếu phần tử tuyến tính G(s) của hình 2.24 là ổn định đầu ra bậc n, đầu vào và đầu
ra của phần tử phi tuyến được giới hạn, thỏa mãn phương trình (2.87) và hệ thống hồi tiếp
là điều khiển tiện cận bậc n, khi đó
lim e nt e(t)  0 (2.90)
t 
Vì vậy nếu bổ đề này là thỏa, e(t) hội tụ về zero nhanh hơn e−nt đối với n > 0.
Định lý cơ bản của Popov được dựa trên hệ thống điều khiển hồi tiếp minh họa ở
hình 2.23.
Hình 2. 25: Đặc tính phi tuyến có từ trễ thụ động
Giả sử hệ thống tuyến tính là ổn định.

Định lý phát biểu rằng đối với hệ thống hồi tiếp là ổn định tuyệt đối, khi
0  N[e  t ]  K (2.91)
đủ để một số thực q tồn tại sao cho đối với tất cả ω thực ≥ 0 và một số nhỏ tùy ý
  0 điều kiện sau được thỏa mãn:
Re 1  jq  G  j  1 / K    0 (2.92)
Hệ thức (2.92) là tiêu chuẩn Popov.

Tùy theo dạng phi tuyến hiện diện, các giới hạn về q và K là bắt buộc:
a) Đối với phi tuyến đơn trị bất biến theo thời gian
−∞ < q < ∞ nếu 0 < K < ∞
61
0 ≤ q < ∞ nếu K = ∞
b) Đối với phi tuyến có từ trễ thụ động (xem hình 2.26)
−∞ < q ≤ 0 và 0 < K < ∞
c) Đối với phi tuyến có từ trễ tích cực ( xem hình 2.27)
0 ≤ q < ∞ và 0 < K ≤ ∞
d) Đối với phi tuyến biến thiên theo thời gian: q = 0 (xem hình 2.28)
Kiểm tra bốn dạng phi tuyến có thể có này nói lên rằng định lý cho phép một sự
trao đổi giữa các yêu cầu đối với các phần tử phi tuyến và tuyến tính.
Ta hãy viết lại (2.92) như sau
1
ReG  j    qimG  j (2.93)
K
Hệ thức (2.93) phát biểu rằng với mỗi ω đồ thị Nyquist của G  j phải nằm bên
phải của đường thẳng
1
ReG  j    qImG  j (2.94)
K
Đường thằng này được gọi là đường Popov được minh hoạ ở hình 2.23.
Góc α và β là
  tan 1q
1 (2.95)
  tan 1
q
Hình 2. 26: Đặc tính phi tuyến có từ trễ tích cực
62
Hình 2. 27: Phương pháp Popov khi q là xác định
Rõ ràng độ dốc của đường thẳng này phụ thuộc vào ω.

Sự ổn định phụ thuộc vào việc chọn giá trị q sao cho đối với mỗi tần số ω, G (jω)
nằm bên phải của đường thẳng Popov có độ dốc phụ thuộc vào tần số (2.95).
Để tìm đường Popov không nhạy cảm theo tần số, sử dụng phép biến đổi:
G* ( j)  ReG j( ) jImG j() (2.96)
trong đó G*( jω) là đặc tình tần số đã được sửa đổi (phần ảo của G j( ω) được nhân
thêm ω của phần tuyến tính nguyên thủy ban đầu G j( ω). Do đó phương trình (2.92) có thể
viết lại
1
ReG* ( j)   qImG* j() (2.97)
K
Hình 2. 28: Đường Popov trong mặt phẳng G*( jω) đối với trường hợp q ≥ 0
Trong mặt phẳng G*( jω) đường Popov được xác định
1
ReG* ( j)    qImG* j() (2.98)
K
63
và không nhạy cảm theo tần số. Đường Popov trong mặt phẳng G*( jω) được minh họa ở
hình 2.24 và 2.25. Góc  được định nghĩa như sau:   tan 1 q (2.99)
Chú ý từ các hình 2.24 và 2.25 qũy tích G*( jω) đi qua bên phải của tiếp tuyến
đến quỹ tích ở điểm mà G*( jω) giao với trục thực âm. Điểm này có giá trị -1/K. Do
đó K biểu thị độ lợi cho phép cực đại đối với hệ thống. Đối với trường hợp mà q=0,
biểu thức đường Popov rút gọn và hệ thống là ổn định nếu nó bên phải của đường
thẳng đứng đi qua điểm -1/K như hình 2.29
Hình 2. 29: Đường Popov trong mặt phẳng
* Chú ý trường hợp q = 0, đường thằng Popov vuông góc với trục hoành tại điểm -
1/K (Hình 2.29).
Ví dụ: Xét hệ minh họa ở hình 2.30. Đối với phần tử tuyến tính, đáp ứng điều kiện
đầu eo(t) được cho bởi:
e0  t   e10e t  e20e2t  e30e3t (2.99)
trong đó e10,e20 phụ thuộc vào điều kiện đầu.
Hình 2. 30:Ví dụ hệ thống điều khiển phi tuyến
Đáp ứng xung đơn vị g(t) được cho bởi

g(t)  0,5e t  e2t  0,5e3t  u  t  (2.100)
64
Với u(t) là hàm nấc đơn vị 1(t). Phương trình (2.100) chỉ ra rằng phần tử tuyến tính
cho kết quả ổn định và thỏa một trong những điều kiện cần thiết để sử dụng phương pháp
Popov. Đặc tính tần số đã sửa đổi G*( jω) của phần tuyến tính được vẽ ở hình 2.27. Từ
biểu đồ này kết luận rằng nếu phần tử phi tuyến đơn trị và nếu q = 0,5 thì điều kiện Popov
thỏa mãn khi 0 < K ≤ 60
Kết luận: Phương pháp Popov đưa ra điều kiện chính xác và đủ để xác định điều
kiện ổn định tuyệt đối của hệ thống hồi tiếp có cấu hình minh họa ở hình 2.31, với các giới
hạn bắt buộc cho một lớp phi tuyến nào đó và phần tuyến tính là ổn định. Bất đẳng thức
(2.92) đối với thành phần G j( ω) và một hằng số thực q là yếu tố then chốt của kỹ thuật
này. Phương pháp Popov chia sẻ tất cả cá đặc tính tần số của phương pháp Nyquist và dễ
dàng áp dụng vào các hệ thống bậc cao.
Hình 2. 31: Đặc tính tần số G*(jW) cho ví dụ hình 2.30
Tiêu chuẩn đường tròn tổng quát hóa – phương pháp Popov mở rộng sang các dạng
hệ thống khác, mà không nhất thiết bị giới hạn rcacs hệ có phần tuyến tính ổn định và phi
tuyến bất biến theo thời gian.
2.8. ĐIỀU KHIỂN HỒI TIẾP TUYẾN TÍNH HÓA
2.8.1. Nội dung phương pháp
Xét đối tượng phi tuyến SISO bậc n mô tả bởi phương trình trạng thái:

x  f (x)  g(x)u

 y  h(x)
Trong đó:
65
x   x1 x 2 .... x n  n là vecto trạng thái của hệ thống
T
u  là tín hiệu vào

y  là tín hiệu ra
f (x)  n ,g(x) n là vector hàm trơn mô tả động học của hệ thống
h(x) là hàm trơn mô tả quan hệ giữa biến trạng thái và tín hiệu ra.
Bài toán đặt ra là điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt yd (t)
* Ý tưởng thiết kế bộ điều khiển hồi tiếp tuyến tính hóa
Hình 2. 32: Sơ đồ điều khiển hồi tiếp tuyến tính hóa
Hai vòng điều khiển:

-Vòng điều khiển trong: Bộ điều khiển hồi tiếp tuyến tính hoá, biến đổi hệ phi tuyến
thành hệ tuyến tính.
-Vòng điều khiển ngoài: Bộ điều khiển bám, thiết kế dựa vào lý thuyết điều khiển
tuyến tính thông thường.
Nếu đối tượng có bậc tương đối bằng n, bằng cách lấy đạo hàm của phương trình
(2) n lần, có thể biểu diễn quan hệ vào ra của đối tượng dưới dạng:
y(n)  a(x)  b(x)u
Trong đó: a(x)  Lnf h(x), b(x)  Lg Lnf 1h(x)  0
h(x)  h(x) h(x) 
 f1(x),...f n (x) 
T
Với: Lf h(x)  .f (x)   ,...,
x  x1 x n 
(đạo hàm Lie của hàm h( x ) dọc theo vector f ( x) )
Lkf 1h(x)
Lkf h(x)  .f (x)
x
Lkf h(x)
Lg Lkf h(x)  .g(x)
x
1
* Luật điều khiển hồi tiếp tuyến tính hoá: u(x)   a(x)  v(t)
b(x)
66
Hình 2. 33: Luật điều khiển hồi tiếp tuyến tính hóa
Đối tượng phi tuyến với tín hiệu vào u(t) được biến đổi thành đối tượng tuyến tính
với tín hiệu vào là v(t) , ta thiết kế bộ điều khiển tuyến tính cho đối tượng đã tuyến tính
hoá.
* Bộ điều khiển bám cho đối tượng đã được tuyến tính hóa
Hình 2. 34: Bộ điều khiển bám cho đối tượng đã được tuyến tính hóa
+ Sai số: e  yd  y
+ Bộ điều khiển bám: v  y(n)  (n 1)  k 2e(n 2)  ...  k n e 

d  k1e  
Giả thiết: Tín hiệu chuẩn ( tín hiệu đặt) khả vi bị chặn đến bậc n
+ Đặc tính động học sai số: (s n  k1s n 1  k 2s n 2  ...  k n )E(s)  0
+ Đa thức đặc trưng: (s)  s n  k1s n 1  k 2s n 2  ...  k n
+ Chọn k i (i  1,n) sao cho  (s) là đa thức Hurwitz, tức là tất cả các nghiệm của
phương trình  (x)  0 đều nằm bên trái mặt phẳng phức.
67
 Hệ thống kín ổn định và e(t)  0 khi t   . Chú ý vị trí cực của (s)  0
quyết định đáp ứng quá độ trong quá trình tiến về 0 của e(t) .
+Thuật toán điều khiển bám v(t) đòi hỏi tín hiệu đặt yd (t) phải khả vi bị chặn đến
bặc n.
+Tín hiệu đặt có dạng xung: đạo hàm tại thời điểm tín hiệu đặt chuyển trạng thái là
vô cùng lớn làm cho tín hiệu điều khiển vô cùng lớn.Trong trường hợp này cần phải cho
tín hiệu đặt r(t) qua bộ lọc thông thấp bậc n để được tín hiệu đặt mới khả vi hữa hạn. Tuy
nhiên việc thêm bộ lọc ở đầu vào có thể làm chậm đáp ứng của hệ thống.
+ Kết quả điều khiển không tốt, thậm chí hệ thống không ổn định nếu mô hình dùng
để thiết kế bộ điều khiển hồi tiếp tuyến tính hoá không mô tả chính xác đặc tính động cơ
học của đối tượng.
2.8.2. Trình tự thiết kế hệ thống điều khiển hồi tiếp tuyến tính hoá.
Bước 1: Biểu diễn quan hệ vào ra của đối tượng phi tuyến dưới dạng:
y(n)  a(x)  b(x)u
Bước 2: Viết biểu thức bộ điều khiển hồi tiếp tuyến tính hoá:
1
u(x)   a(x)  v(t)
b(x)
Bước 3: Viết biểu thức bộ điều khiển bám:
v  y(n)  (n 1)  k 2e(n 2)  ...  k n e 
d   k1e 
Với: e  yd  y
Bước 4: Chọn các thông số của bộ điều khiển bám sao cho:
(x)  s n  k1s n 1  k 2s n 2  ...  k n
là đa thức Hurwitz, đồng thời thoả mãn yêu cầu về chất lượng quá độ
Bước 5: Thiết kế bộ lọc thông thấp tín hiệu vào để đảm bảo tín hiệu chuẩn yd (t)
khả vi bị chặn đến bậc n .
2.8.3. Ứng dụng Malab mô phỏng hệ thống điều khiển hồi tiếp tuyến tính hóa
Cho đối tượng phi tuyến mô tả bởi phương trình trạng thái:

 x1  2 x1  3 x2  sin( x1 )

 x 2   x cos(x )  ucos(2x )
 2 1 1
y  x1
Hãy thiết kế bộ điều khiển hồi tiếp tuyến tính hoá sao cho hệ kín có cặp cực phức
tại 3  j3
Giải:
68
+ Bước 1: Tính đạo hàm của tín hiệu ra
. .
y  x1
.
 y  2x1  3x 2  sin(x1 )
.. . . . . .
 y  2 x1  3x 2  x1 cos(x1)  ( 2  cos(x1)) x1  3x 2
..
 y  (2  cos(x1 ))(2x1  3x 2  sin(x1 ))  3x 2 cos(x1 )  3u cos(2x1)
..
 y  4x1  6x 2  2sin(x1 )  2x1 cos(x1)  sin(x1)cos(x1)  3u cos(2x1 )
..
 y  a(x)  b(x)u (1)
Với: a(x)  4x1  6x 2  2sin(x1)  2x1 cos(x1)  sin(x1)cos(x1)
b(x)  3cos(2x1)
+Bước 2: Viết biểu thức bộ điều khiển hồi tiếp tuyến tính hoá:
1
u  a(x)  v  (2)
b(x)
Thay (1) vào (2), ta được hệ tuyến tính:
..
yv (3)
+Bước 3: Viết biểu thức bộ điều khiển bám tuyến tính:
.. .
v  yd  (k1 e k 2e) (4)
+Bước 4: Tính thông số bộ điều khiển bám:
Thay (3) vào (4), ta được đặc tính động học sai số:
.. . .
y  yd  (k1 e k 2e)
.. .
 e k1 e k 2e  0
Phương trình đặc tính động học sai số:
s 2  k1s  k 2  0 (5)
Phương trình đặc tính động học sai số mong muốn:
(s  3  j3)(s  3  j3)  0
 s 2  6s  18  0 (6)
Cân bằng (5) và (6), ta được:
k1  6,k 2  18
69
Hình 2. 35: Mô phỏng hệ thống điều khiển hồi tiếp tuyến tính hóa
Hình 2. 36: Mô phỏng khối hồi tiếp tuyến tính hóa
Hình 2. 37: Mô phỏng khối điều khiển bám
Hình 2. 38: Kết quả mô phỏng khi tín hiệu đặt là xung vuông
70
Hình 2. 39: Kết quả mô phỏng khi tín hiệu đặt hình sin
Nhận xét: Kết quả mô phỏng ta thấy tín hiệu ra bám rất tốt theo tín hiệu đặt là
xung vuông hoặc hình sin.
2.9. ĐIỀU KHIỂN TRƯỢT
2.9.1. Nội dung phương pháp
Xét đối tượng phi tuyến SISO bậc n mô tả bởi phương trình trạng thái:

 x  f (x)  g(x)u

 y  h(x)

Trong đó:
x   x1 x 2 .... x n  n là vecto trạng thái của hệ thống
T
u  là tín hiệu vào

y  là tín hiệu ra
f (x)  n ,g(x) n là vector hàm trơn mô tả động học của hệ thống h(x) 
là hàm trơn mô tả quan hệ giữa biến trạng thái và tín hiệu ra.
Bài toán đặt ra là điều khiển tín hiệu ra y (t ) bám theo tín hiệu đặt yd (t )
Nếu đối tượng có bậc tương đối bằng n, bằng cách lấy đạo hàm của phương trình
(2) n lần , có thể biểu diễn quan hệ vào ra của đối tượng dưới dạng:
y(n)  a(x)  b(x)u
Trong đó: a(x)  Lnf h(x)
b(x)  Lg Lnf 1h(x)  0
71
h(x)  h(x) h(x) 
 f1(x),...f n (x) 
T
Với: Lf h(x)  .f (x)   ,...,
x  x1 x n 
Lkf 1h(x)
Lkf h(x)  .f (x)
x
Lkf h(x)
Lg Lkf h(x)  .g(x)
x
Sai số: e(t)  yd (t)  y(t)
Đặt:   e(n 1)  k1e(n 2)  ....  k n 2 e k n 1e
Trong đó k i được chọn sao cho  (s)  s n 1  k1s 2  ...  k n 2 e  k n 1 e là đa thức

Hurwitz, vị trí nghiệm của s  0 quyết định đặc tính quá độ quá trình e(t)  0 khi   0
  0 gọi là mặt trượt,
 (s) gọi là đa thức đặc trưng của mặt trượt
 (s) 1
  n 1 n 2

E(s)

s  k1s  ...  k n 2s  k n 1
Bài toán điều khiển tín hiệu ra y(t) bám theo tín hiệu đặt yd (t) được chuyển thành
bài toán tìm tín hiệu điều khiển u(t) sao cho   0
1 2
Chọn hàm Lyapunov: V  
2
. .
Đạo hàm Lyapunov: V  
.
Để   0 cần chọn tín hiệu điều khiển u(t) sao cho V  0
.
Do   e(n 1)  k1e(n 2)  ...  k n 2 e k n 1e
. .. .
Nên:   e(n)  k1e(n 1)  ...  k n 2 e k n 1 e
. .. .
   u (n)
d y
(n)
 k1e(n 1)  ...  k n 2 e k n 1 e
Chú ý rằng: y(n)  a(x)  b(x)u
. .. .
(n 1)
 y(n)
d  a(x)  b(x)u  k1e  ...  k n 2 e k n 1 e
Luật điều khiển trượt:
.
Chọn u(t) sao cho:    Ksign() (K>0)
1  (n 1) 
u  a(x)  y (n)
d  k1e  ...  k n 2 e  k n 1 e  Ksign() 
b(x)  
72
Với luật điều khiển trên, ta có:
. .
V    Ksign()  K 
.
 V  0   0
0
e0
Quỹ đạo pha của hệ thống điều khiển trượt:
Hình 2. 40: Quỹ đạo pha lý tưởng của hệ bậc 2 chuyển động trên mặt trượt về gốc tọa độ
Hình 2. 41: Quỹ đạo pha thực tế dao động quanh mặt trượt về gốc tọa độ,gây nên hiện
tượng chattering
2.9.2. Trình tự thiết kế bộ điều khiển trượt bám quỹ đạo

+ Bước 1: Biểu diễn quan hệ vào ra của đối tượng phi tuyến dưới dạng:
y n  a(x)  b(x)u
.
+ Bước 2: Chọn mặt trượt:   e(n 1)  k1e(n 2)  ...  k n 2 e k n 1e
Trong đó k i được chọn sao cho (x)  s n 1  k1s n 2  ...  k n 2s  k n 1 là đa thức
Hurwitz; nghiệm của  (x)  0 càng nằm xa trục ảo thì e(t)  0 càng nhanh khi   0
+ Bước 3: Viết biểu thức bộ điều khiển trượt:
73
1  (n 1)
.. 
u a(x)  yd  k1e
(n)
 ...  k n 2 e 
b(x)  
Trong đó: K>0. K càng lớn thì   0 càng nhanh.
+Bước 4: Thiết kế bộ lọc thông thấp tín hiệu vào để đảm bảo tín hiệu chuẩn yd (t)
khả vi bị chặn đến bậc n
Chú ý
+ Có thể thay hàm sign() bằng hàm sat () hoặc các hàm trơn để giảm hiện tượng
chattering.
Hình 2. 42:Hàm sign(x)
Hình 2. 43:Hàm sat()
+ Có nhiều phiên bản điều khiển trượt khác nhau tuỳ theo mô tả toán học của đối
tượng phi tuyến và yêu cầu điều khiển.
+ Nguyên tắc cơ bản khi thiết kế luật điều khiển trượt là:
-Định nghĩa tín hiệu trượt là hàm của sai số bám hoặc trạng thái của hệ thống.
-Chọn hàm Lyapunov là hàm toàn phương của mặt trượt
-Chọn tín hiệu điều khiển sao cho đạo hàm của hàm Lyapunov luôn âm
+ Điều khiển trượt- Ví dụ 1
- Xét hệ con lắc mô tả bởi PTVP:
.. .
ml2 (t)  B (t)  mglsin   u(t)
- Chọn m  0.1(kg) l  1(m) B  0.01(N.m.s / rad)
74
- Hãy thiết kế bộ điều khiển trượt để điều khiển góc lệch của con lắc bám theo tín
hiệu đặt.
Giải
.
- Đặt các biến trạng thái là x1  ; x 2   , tín hiệu ra là y    x1
- Bước 1: Tính đạo hàm của tín hiệu ra:
. .
y  x1
.. .
y  x1  x 2
.. g B 1
 y   sin(x1 )  2 x 2  2 u
l ml ml
..
 y  a(x)  b(x)u
g B 1
Với : a(x)   sin(x1)  x2, b(x) 
l ml2 ml2
.
- Bước 2: Biểu thức mặt trượt:   e k1e
Đa thức đặc trưng của mặt trượt:
.
  e k1e
Đa thức đặc trưng của mặt trượt: s  k1  0
Chọn cực của mặt trượt tại -500, suy ra: k1  500
- Bước 3: Viết biểu thức bộ điều khiển trượt:
1  .. . 
u  a(x)  y  k e  Ksign( )
b(x)  
d 1

Chọn: K=1000
- Bước 4: Thiết kế bộ lọc tín hiệu vào: chọn bộ lọc thông thấp bậc 2 để tín hiệu
yd (t) khả vi bị chặn đến đạo hàm bậc 2. Hàm truyền của bộ lọc là:
1
GLF ( s) 
(0.03s  1) 2
+ Tín hiệu ra của đối tượng bám theo tín hiệu chuẩn r(t) rất tốt.
+ Bộ điều khiển trượt rất bền vững với sai số mô hình. Khi khối lượng vật nặng tăng
10 lần (1kg) chất lượng điều khiển gần như không bị ảnh hưởng.
75
+ Khuyết điểm của bộ điều khiển trượt là hiện tượng “chattering” (= tín hiệu điều
khiển dao động với tần số cao). Hiện tượng này có thể làm giảm tuổi thọ các cơ cấu cơ khí.
+ Khi thay thế hàm sign() bằng hàm sat(), hiện tượng chattering bị loại bỏ hoàn
toàn, trong khi đó tính bền vững và chất lượng điều khiển của hệ thống điều khiển trượt
vẫn đảm bảo.
2.9.3. Ứng dụng Matlab mô phỏng hệ thống điều khiển trượt
Xét hệ con lắc như hình vẽ
Hình 2. 44: Hệ con lắc
Phương trình vi phân mô tả hệ:

.. .
ml2 (t)  B (t)  mglsin   u(t)
-Chọn m  0.1(kg), l  1(m), B  0.01(N.m.s / rad)
Thiết kế bộ điều khiển trượt để điều khiển góc lệch của con lắc bám theo tín hiệu đặt
Giải
.
-Đặt các biến trạng thái là x1  ; x 2   , tín hiệu ra là y    x1
- Bước 1: Tính đạo hàm của tín hiệu ra:
. .
y  x1
.. .
y  x1  x 2
.. g B 1
 y   sin(x1 )  2 x 2  2 u
l ml ml
..
 y  a(x)  b(x)u (a)
g B 1
Với : a(x)   sin(x1)  x2 , b(x) 
l ml2 ml2
.
- Bước 2: Biểu thức mặt trượt:   e k1e với: e  yd  y
Đa thức đặc trưng của mặt trượt:
.
  e k1e
76
Đa thức đặc trưng của mặt trượt: s  k1  0
Chọn cực của mặt trượt tại -500, suy ra: k1  500
- Bước 3: Viết biểu thức bộ điều khiển trượt:
1  .. . 
u   a(x)  y d  k1  Ksign() 
e
b(x)  
Chọn: K=10
- Bước 4: Thiết kế bộ lọc tín hiệu vào
Chọn bộ lọc thông thấp bậc 2 để tín hiệu yd (t) khả vi bị chặn đến đạo hàm bậc 2.
Hàm truyền của bộ lọc là:
1
GLF ( s) 
(0.03s  1) 2
Hình 2. 45: Mô phỏng khối điều khiển trượt
77
Kết quả mô phỏng khi tín hiệu chuẩn là xung vuông:
Hình 2. 46: Kết quả mô phỏng khi tín hiệu chuẩn là xung vuông (m=0.1kg)
Tín hiệu ra của đối tượng bám theo tín hiệu chuẩn r(t) rất tốt.
Hình 2. 47: Kết quả mô phỏng khi tín hiệu chuẩn là xung vuông (m=10kg)
Bộ điều khiển trượt rất bền vững với sai số mô hình. Khi khối lượng vật nặng tăng
10 lần ( 1kg) chất lượng điều khiển gần như không bị ảnh hưởng.
+ Khuyết điểm của bộ điều khiển trượt là hiện tượng “chattering” (= tín hiệu điều
khiển dao động với tần số cao). Hiện tượng này có thể làm giảm tuổi thọ các cơ cấu cơ khí.
+ Khi thay thế hàm sign() bằng hàm sat(), hiện tượng chattering bị loại bỏ hoàn toàn,
trong khi đó tính bền vững và chất lượng điều khiển của hệ thống điều khiển trượt vẫn đảm
bảo.
78
Câu 1: Trình bày tính chất và đặc điểm riêng của hệ phi tuyến ?
Câu 2: Trình bày đặc điểm các hàm mô tả của khâu phi tuyến ?
Câu 3: Trình bày nội dung phương pháp thứ nhất của Lyapunov ?
Câu 4: Trình bày nội dung phương pháp thứ hai của Lyapunov ?
Câu 5: Nêu các bước thiết kế hệ thống điều khiển hồi tiếp tuyến tính hóa?
Câu 6: Nêu trình tự thiết kế hệ thống điều khiển trượt?
Câu 7: Cho hệ phi tuyến có sơ đồ như sau:
Hàm truyền của khâu tuyến tính là:

10
G(s) 
s(0.2s  1)(2s  1)
Khâu phi tuyến là khâu rowle 3 vị trí có trễ:
a) Hãy tìm điều kiện để trong hệ phi tuyến có dao động

b) Hãy xác định biên độ và tần số dao động khi Vm  6,D  0.1
Câu 8: Cho hệ thống mô tả bởi phương trình trạng thái

 x1   x1  x 2  x 2 (x1  x 2 )
2 2

 x 2   x  x  x (x 2  x 2 )
 1 2 1 1 2
Hãy xác định trạng thái cân bằng của hệ thống và đánh giá tính ổn định của hệ
thống tại trạng thái cân bằng
79
Câu 9: Cho đối tượng phi tuyến mô tả bởi phương trình trạng thái:

 x1  2x1  3x 2  sin(x1 )

 x 2   x cos(x )  ucos(2x )
 2 1 1
y  x1
Hãy thiết kế bộ điều khiển hồi tiếp tuyến tính hoá sao cho hệ kín có cặp cực phức
tại 5  j5
Câu 10: Cho hệ thống có sơ đồ khối như hình vẽ:
K
- Hàm truyền đạt của khâu tuyến tính: W(s) 
s2
B khi x 0
- Khâu phi tuyến là khâu rơ le hai vị trí : f (x)  
B khi x0
Xét sự ổn định của hệ ở trạng thái cân bằng theo tiêu chuẩn Lyapunov ?
Câu 11 : Dùng phương pháp Lyapunov xác định điều kiện ổn định của hệ được mô
tả bởi phương trình vi phân phi tuyến :
2
x(t)  K1[ x (t)+ x (t)]+K 2 x 2 (t)  x(t)  0
Nếu :
a) K1  0,K 2  0
b) K1  0,K 2  0
c) K1  0,K 2  0
80
CHƯƠNG 3
ĐIỀU KHIỂN TỐI ƯU
Sau khi học xong chương này, sinh viên có thể nắm được :
- Chất lượng tối ưu
- Các phương pháp điều khiển tối ưu
- Điều khiển tối ưu các hệ thống tuyến tính với phiếm hàm dạng toàn phương
3.1 CHẤT LƯỢNG TỐI ƯU

3.1.1 Đặc điểm của bài toán tối ưu
a) Khái niệm
Một hệ điều khiển được thiết kế ở chế độ làm việc tốt nhất là hệ luôn ở trạng thái
tối ưu theo một tiêu chuẩn chất lượng nào đó ( đạt được giá trị cực trị). Trạng thái tối ưu
có đạt được hay không tùy thuộc vào yêu cầu chất lượng đặt ra, vào sự hiểu biết về đối
tượng và các tác động lên đối tượng, vào điều kiện làm việc của hệ điều khiển ...
.
Hình 3. 1:Sơ đồ hệ thống điều khiển
Hệ thống điều khiển như hình trên bao gồm các phần tử chủ yếu: đối tượng điều
khiển ( ĐTĐK), cơ cấu điều khiển ( CCĐK ) và vòng hồi tiếp ( K ).
Với các ký hiệu:
r : tín hiệu đầu vào, mục tiêu điều khiển, đáp ứng mong muốn của hệ thống.
u : tín hiệu điều khiển, luật điều khiển.
x : tín hiệu đầu ra, đáp ứng ra của hệ thống.
ε = r – x : sai lệch của hệ thống.
f : tín hiệu nhiễu
Chỉ tiêu chất lượng J của một hệ thống có thể được đánh giá theo sai lệch của đại
lượng được điều khiển x so với trị đáp ứng mong muốn r, lượng quá điều khiển (trị số cực
đại x max so với trị số xác lập x(∞) tính theo phần trăm), thời gian quá độ … hay theo một
chỉ tiêu hỗn hợp trong điều kiện làm việc nhất định như hạn chế về công suất, tốc độ, gia
tốc … Do đó việc chọn một luật điều khiển và cơ cấu điều khiển để đạt được chế độ làm
việc tối ưu J đạt cực trị còn tùy thuộc vào lượng thông tin ban đầu mà ta có được.
81
Ở đây chúng ta có thể thấy được sự khác biệt về kết quả nhận được chất lượng tối
ưu khi lượng thông tin ban đầu thay đổi ( Hình 3.2 ) .
Hình 3. 2: Tối ưu cục bộ và tối ưu toàn cục
Khi tín hiệu điều khiển u giới hạn trong miền [u1,u2], ta có giá trị tối ưu cực đại J1*
của chỉ tiêu chất lượng J ứng với tín hiệu điều khiển u*1.
Khi tín hiệu điều khiển u không bị ràng buộc bởi điều kiện u1  u  u 2 , ta có được
giá trị tối ưu J*2  J1* ứng với u *2 . Như vậy giá trị tối ưu thực sự bây giờ là J*2
Tổng quát hơn, khi ta xét bài toán trong một miền  u m u n  nào đó và tìm được
giá trị tối ưu J*i thì đó là giá trị tối ưu cục bộ . Nhưng khi bài toán không có điều kiện ràng
buộc đối với u thì giá trị tối ưu là J* =extremum( J*i ) với J*i là các giá trị tối ưu cục bộ, giá
trị J* chính là giá trị tối ưu toàn cục.
Điều kiện tồn tại cực trị:
- Đạo hàm bậc một của J theo u phải bằng 0:
J
0
u
- Xét giá trị đạo hàm bậc hai của J theo u tại hau điểm cực trị:
 2J
 0 : Điểm cực trị là cực tiểu
u 2
 2J
 0 : Điểm cực trị là cực đại
u 2
b) Điều kiện thành lập bài toán tối ưu
Để thành lập bài toán tối ưu thì yêu cầu đầu tiên là hệ thống phải có đặc tính phi
tuyến có cực trị .
Bước quan trọng trong việc thành lập một hệ tối ưu là xác định chỉ tiêu chất lượng
J. Nhiệm vụ cơ bản ở đây là bảo đảm cực trị của chỉ tiêu chất lượng J. Ví dụ như khi xây
dựng hệ tối ưu tác động nhanh thì yêu cầu đối với hệ là nhanh chóng chuyển từ trạng thái
này sang trạng thái khác với thời gian quá độ nhỏ nhất, nghĩa là cực tiểu hóa thời gian quá
độ. Hay khi tính toán động cơ tên lửa thì chỉ tiêu chất lượng là vượt được khoảng cách lớn
82
nhất với lượng nhiên liệu đã cho. Chỉ tiêu chất lượng J phụ thuộc vào tín hiệu ra x(t), tín
hiệu điều khiển u(t) và thời gian t. Bài toán điều khiển tối ưu là xác định tín hiệu điều khiển
u(t) làm cho chỉ tiêu chất lượng J đạt cực trị với những điều kiện hạn chế nhất định của u
và x.
Chỉ tiêu chất lượng J thường có dạng sau :
T
J   L[x(t),u(t), t]dt
0
Trong đó L là một phiếm hàm đối với tín hiệu x, tín hiệu điều khiển u và thời gian
t.
Lấy ví dụ về bài toán điều khiển động cơ điện một chiều kích từ độc lập  kt  const
với tín hiệu điều khiển u là dòng điện phần ứng i u và tín hiệu ra x là góc quay ϕ của trục
động cơ .
Hình 3. 3: Động cơ điện một chiều kích từ độc lập
Ta có phương trình cân bằng moment của động cơ:

d
k Mi u  M c  M q (1)
dt
d
 (2)
dt
Trong đó k M  C M   const, M q là moment quán tính;  là tốc độ góc;  là góc
quay. Giả sử bỏ qua phụ tải trên trục động cơ ( Mc=0) thì:
d 2
k Mi u  M q 2 (3)
dt
Nếu xét theo thời gian tương đối bằng cách đặt :
  t k M / Mq
Thì (3) có dạng:
d 2
 iu (4)
d2
Từ đó ta có:
83
d2x
u (5)
d2
Vậy phương trình trạng thái của động cơ điện là một phương trình vi phân cấp hai
với tín hiệu điều khiển u là dòng điện phần ứng iư, tín hiệu ra là góc quay  .
Bài toán tối ưu tác động nhanh ( thời gian tối thiểu ):
Tìm luật điều khiển u(t) với điều kiện hạn chế |u| 1 để động cơ quay từ vị trí ban
đầu có góc quay và tốc độ đều bằng 0 đến vị trí cuối cùng có góc quay bằng  và tốc độ
bằng 0 với một khoảng thời gian ngắn nhất. Vì cần thời gian ngắn nhất nên chỉ tiêu chất
lượng J sẽ là:
T
J   L[x(t),u(t), t]dt  T
0
Rõ ràng từ phương trình trên ta phải có L[x(t),u(t), t]dt  1
Như vậy , đối với bài toán tối ưu tác động nhanh thì chỉ tiêu chất lượng J có dạng :
T
J  1dt  T
0
Bài toán năng suất tối ưu

Năng suất ở đây được xác định bởi góc quay lớn nhất của động cơ trong thời gian
T nhất định. Khi đó chỉ tiêu chất lượng J có dạng:
T T
J   L[x(t),u(t), t]dt  r  0   (t)dt
0 0
 
Do đó L[x(t),u(t), t]= (t)  x(t) và ta sẽ có chỉ tiêu chất lượng J đối với bài toán
năng suất tối ưu như sau :
T
J   x(t)dt
0
Bài toán năng lượng tối thiểu:

Tổn hao năng lượng trong hệ thống :
T
Q   U u i u dt
0
Dựa vào phương trình cân bằng điện áp :

U u  i u R u  k e
d
và phương trình cân bằng moment : k Mi u  Mc  Mq
dt
Ta tính được:
84
T k eMc T
Q   U ui u dt  (T  0 )   R ui u2 dt
0 kM 0
Để có được tiêu hao năng lượng tối thiểu, ta chỉ cần tìm cực tiểu của J:
T T
J   L[x(t),u(t), t]dt   i 2u dt
0 0
Mà dòng điện phần ứng i u ở đây chính là tín hiệu điều khiển u. Vì vậy chỉ tiêu chất
lượng J đối với bài toán năng lượng tối thiểu có dạng :
T
J   u 2 (t)dt
0
c. Tối ưu hoá tĩnh và động

Chúng ta cần phân biệt hai dạng bài toán tối ưu hoá tĩnh và tối ưu hóa động. Tối ưu
hóa tĩnh là bài toán không phụ thuộc vào thời gian. Còn đối với tối ưu hóa động thì thời
gian cũng là một biến mà chúng ta cần phải xem xét đến .
3.1.2 Xây dụng bài toán tối ưu
a) Tối ưu hóa không có điều kiện ràng buộc
Một hàm chỉ tiêu chất lượng vô hướng L(u) được cho trước là một hàm của một
vector điều khiển hay một vector quyết định u ∈ Rm. Chúng ta cần chọn giá trị của u sao
cho L(u) đạt giá trị nhỏ nhất.
Để giải bài toán tối ưu , ta viết chuỗi Taylor mở rộng cho độ biến thiên của L(u) như
sau :
1
dL  LTu du  du T Luu du  O(3) (3.1)
2
Với O(3) là số hạng thứ 3. Grad của L theo u là một vector m cột :
L / u1 
 
L L / u 2 
Lu  (3.2)
u  
 
L / u m 
và đạo hàm cấp 2 của L theo u là một ma trận m x m (còn gọi là ma trận Hessian) :
 2L   2L 
Luu   (3.3)
u 2  u iu j 
L uu được gọi là ma trận uốn .
Một điểm cực trị hoặc điểm dừng xuất hiện khi sự biến thiên dL với thành phần thứ
nhất tiến về 0 với mọi biến thiên du trong quá trình điều khiển. Vì vậy, để có điểm cực trị
thì :
85
Lu  0 (3.4)
Giả sử đang ở tại điểm cực trị, có L u  0 như (3.4), để điểm cực trị trở thành điểm
cực tiểu, chúng ta cần có :
1
dL  du T Luu du  O(3) (3.5)
2
là xác định dương với mọi sự biến thiên du. Điều này được đảm bảo nếu ma trận
uốn L uu là xác định dương :
Luu  0 (3.6)
Nếu Luu là xác định âm thì điểm cực trị chính là điểm cực đại; còn nếu Luu là không
xác định thì điểm cực trị chính là điểm yên ngựa. Nếu Luu là bán xác định thì chúng ta sẽ
xét đến thành phần bậc cao hơn trong (2.1) để xác định được loại của điểm cực trị.
Nhắc lại: L uu là xác định dương (hoặc âm) nếu như các giá trị riêng của nó là dương
(hoặc âm), không xác định nếu các giá trị riêng của nó vừa có dương vừa có âm nhưng
khác 0, và sẽ là bán xác định nếu tồn tại giá trị riêng bằng 0. Vì thế nếu L uu  0 thì thành
phần thứ hai sẽ không hoàn toàn chỉ ra được loại của điểm cực trị .
b) Tối ưu hóa với các điều kiện ràng buộc
Cho hàm chỉ tiêu chất lượng vô hướng L(x,u), với vector điều khiển u ∈ Rm và
vector trạng thái x ∈ Rn . Bài toán đưa ra là chọn u sao cho hàm chỉ tiêu chất lượng L(x,u)
đạt giá trị nhỏ nhất và thỏa mãn đồng thời các phương trình điều kiện ràng buộc :
f(x,u) (3.7)
Vector trạng thái x được xác định từ một giá trị u cho trước bằng mối quan hệ (3.7),
vì thế f là một hệ gồm n phương trình vô hướng f  R
n
Để tìm điều kiện cần và đủ của giá trị cực tiểu, đồng thời thỏa mãn f (x,u)  0 , ta
cần làm chính xác như trong phần trước. Đầu tiên ta khai triển dL dưới dạng chuỗi Taylor,
sau đó xác định số hạng thứ nhất và thứ hai là L u & L uu
Thừa số Lagrange và hàm Hamilton .
Tại điểm cực trị, dL với giá trị thứ nhất bằng 0 với mọi sự biến thiên của du khi df
bằng 0. Như vậy chúng ta cần có:
dL  LTu du  L x Tdx  0 (3.8)
dL  f u du  f x dx  0 (3.9)
Từ (3.7) ta xác định được x từ giá trị u đã có, độ biến thiên dx được xác định bởi
(3.9) từ giá trị biến thiên du với điều kiện ma trận Jacobi là không kỳ dị f x  0 .Như vậy,
Như vậy , ma trận Jacobi f x không kỳ dị và :
dx  f x 1f u du (3.10)
Thay dx vào (3.8) ta được :
86
dL  (L u T  L x Tf x 1f u )du (3.11)
Đạo hàm riêng của L theo u chứa hằng số f được cho bởi phương trình :
L
 (L u T  L x T f x 1f u )T  L u  f u T f x  T L x (3.12)
u df 0
Với f x  T  (f x 1 )T . Lưu ý rằng:
L
 Lu (3.13)
u dx 0
Để thành phần thứ nhất của dL bằng không với giá trị du tùy ý khi df=0, ta cần
có :
L u  f uT f x T L x  0 (3.14)
Đây là điều kiện cần để có giá trị cực tiểu. Trước khi đi tìm điều kiện đủ, chúng ta
hãy xem xét thêm một vài phương pháp để có được (3.14) .
Viết (3.8) và (3.9) dưới dạng:
dL   LTx LTu  dx 
df       0 (3.15)
   fx f u  du 
Hệ phương trình tuyến tính này xác định một điểm dừng và phải có một kết quả
T
dx T du T  . Điều này chỉ xảy ra nếu ma trận số (n  1)x(n  m) có hạng nhỏ

hơn n  1 . Có nghĩa là các hàng của ma trận tuyến tính với nhau để tồn tại một vector 
có n số hạng như sau:
T  Lx Lu T 
T
1   0 (3.16)
  f
 x fu 
Hay
L x T  Tf x  0 (3.17)
Lu T  Tf u  0 (3.18)
Giải (3.17) ta được λ :
 T  L x T f x 1 (3.19)
và thay vào (3.18) để có được (3.14) .
Vector λ ∈ Rn được gọi là thừa số Lagrange và nó sẽ là công cụ hữu ích cho chúng
ta sau này. Để hiểu thêm ý nghĩa của thừa số Lagrange ta xét du  0 , từ (3.8) và (3.9) ta
khử dx để được:
dL  L x T f x 1df (3.20)
Vì vậy:
87
L
 (L x T f x 1 )T   (3.21)
u du 0
Do đó  là đạo hàm riêng của L với biến điều khiển u là hằng số. Điều này nói lên
tác dụng của hàm chỉ tiêu chất lượng với biến điều khiển không đổi khi điều kiện ràng buộc
thay đổi.
Như là một cách thứ ba để tìm được (3.14), ta phát triển thêm để sử dụng cho các
phân tích trong những phần sau. Kết hợp điều kiện ràng buộc và hàm chỉ tiêu chất lượng
để thành lập hàm Hamilton .
H(x,u, )  L(x,u)   Tf (x,u) (3.22)
với   R n là thừa số Lagrange chưa xác định. Muốn chọn x, u, λ để có được điểm
dừng, ta tiến hành các bước sau :
Độ biến thiên của H theo các độ biến thiên của x , u , λ được viết như sau :
dH  H x Tdx  H u Tdu  H  Td (3.23)
H
Lưu ý rằng: H   f (x,u) (3.24)

Giả sử chúng ta chọn các giá trị của u thỏa mãn:
H  0 (3.25)
Sau đó ta xác định x với giá trị của u đã có bằng phương trình điều kiện ràng buộc
f (x,u) = 0. Trong trường hợp này hàm Hamilton tương đương với hàm chỉ tiêu chất lượng:
H f 0  L (3.26)
Nhắc lại: nếu f = 0 , ta sẽ tìm được dx theo du từ (3.10). Ta không nên xét mối
quan hệ giữa du và dx để thuận tiện trong việc chọn  sao cho :
Hx  0 (3.27)
Đạo hàm (3.22) theo x:
H
 Lx  f x T  0 (3.28)
x
Hay  T  L x T f x 1
Nếu giữ nguyên (3.25) và (3.27) từ (3.23):
dL  dH  H u T du (3.29)
Vì H = L, để có được điểm dừng ta phải áp đặt điều kiện:
Hu  0 (3.30)
Tóm lại , điều kiện cần để có được điểm cực tiểu của L(x,u) thỏa mãn điều kiện ràng
buộc f(x,u) = 0 gồm có :
88
H
f 0 (3.31a)

H
 Lx  f x T  0 (3.31b)
x
H
 Lu  f u T  0 (3.31c)
u
với H(x,u, ) xác định bởi (3.22). Cách thường dùng là từ 3 phương trình đã cho
xác định x, λ và u theo thứ tự tương ứng. So sánh 2 phương trình (3.31b) và (3.31c) ta thấy
chúng tương ứng với 2 phương trình (3.17) và (3.18) .
Trong nhiều ứng dụng, chúng ta không quan tâm đến giá trị của λ, tuy nhiên ta vẫn
phải đi tìm giá trị của nó vì đó là một biến trung gian cho phép chúng ta xác định các đại
lượng cần tìm là u, x và giá trị nhỏ nhất của L. Ưu điểm của thừa số Lagrange có thể tóm
tắt như sau: trên thực tế, hai đại lượng dx và du không phải là hai đại lượng biến thiên độc
lập với nhau theo (3.10). Bằng cách đưa ra một thừa số bất định λ, chúng ta chọn λ sao cho
dx và du có thể được xem là hai đại lượng biến thiên độc lập với nhau .
Lấy đạo hàm riêng của H lần lượt theo các biến như trong (3.31), như thế ta sẽ có
được điểm dừng .
Khi đưa ra thừa số Lagrange, chúng ta có thể thay thế bài toán tìm giá trị nhỏ nhất
của L(x,u) với điều kiện ràng buộc f (x,u)  0 thành bài toán tìm giá trị nhỏ nhất của hàm
Hamilton H(x,u, ) không có điều kiện ràng buộc .
Điều kiện đã (3.31) xác định một điểm dừng, ta sẽ tiếp tục chứng minh đây là điểm
cực tiểu như đã thực hiện trong phần trước .
Viết chuỗi Taylor mở rộng cho độ biến thiên của L và f như sau :
dx  1 L L xu  dx 
dL   L x T Lu T     dx T du T   xx  O(3)
Luu  du 
(3.32)
du  2  Lux
dx  1 L L xu  dx 
df   L x Lu     dx T du T   xx  O(3)
Luu  du 
(3.33)
du  2  Lux
 2f
với: f xu
ux
Để đưa ra hàm Hamilton, ta sử dụng các phương trình sau :
dL  dx  1 H H xu  dx 
1 T      H x T H u T     dx T du T   xx  O(3) (3.34)
  df
 

du  2  H ux H uu  du 
Bây giờ , để có được điểm dừng ta cần có f = 0, và đồng thời thành phần thứ nhất
của dL bằng 0 với mọi sự biến thiên của dx và du. Vì f = 0 nên df = 0, và điều này đòi hỏi
H x = 0 và Hu = 0 như trong (3.31) .
89
Để tìm điều kiện đủ cho điểm cực tiểu, chúng ta xét đến thành phần thứ hai. Đầu
tiên, ta cần xem mối quan hệ giữa dx và du trong (3.34). Giả sử rằng chúng ta đang ở điểm
cực trị nên H x  0,H u  0 và df  0 . Từ (3.10) suy ra:
dx  f x 1f u du  O(2) (3.35)
Thay vào (3.24) ta được :
1 H H xu   f x 1f u 
dL  du T  f u Tf x T 1  xx    O(3)
H uu   I 
(3.36)
2  H ux
Để đảm bảo đây là điểm cực tiểu, dL trong (3.36) phải dương với mọi sự biến thiên
của du. Điều này được đảm bảo nếu như ma trận uốn với f luôn bằng 0 là xác định dương.
H H xu   f x 1f u 
Lfuu   f u T f x  T I   xx  
H uu   I 
L uu f
 H ux (3.37)
 H uu  f u T f x  T H xu  H ux f x 1f u  f u Tf x  T H xx f x 1f u
Lưu ý rằng nếu điều kiện ràng buộc f (x,u) = 0 với mọi x và u thì (3.37) được rút lại
thành L uu ở phương trình (3.3).
Nếu (3.37) là xác định âm (hoặc không xác định ) thì điểm dừng sẽ là điểm cực đại
(hoặc điểm yên ngựa).
3.1.3. Các ví dụ minh họa
a) Tối ưu hóa không có điều kiện ràng buộc
* Ví dụ 3.1 : Không gian toàn phương .
Cho u ∈ R2 và :
1 q q 
L(u)  u T  11 12  u  s1 s 2  u (1)
2 q12 q 22 
1 T
u Qu  ST u (2)
2
Điểm cực trị được xác định bởi :
Lu  Qu  S  0 (3)
u*  Q1S(**) (4)
với u* dùng để chỉ biến điều khiển tối ưu.
Loại của điểm cực trị được xác định bằng cách xét ma trận Hessian
Luu  Q (5)
Điểm u* là cực tiểu nếu L uu  0(q11  0;q11q 22  q12
2
 0) , là điểm cực đại nếu
L uu  0(q11  0;q11q 22  q12
2
 0) . Nếu |Q| < 0 thì u* là điểm yên ngựa. Nếu |Q|=0 thì u*
là điểm kỳ dị, chúng ta không thể xác định được đó là cực tiểu hay cực đại từ L uu
90
Bằng cách thay (4) vào (2) ta sẽ tìm được giá trị của hàm chỉ tiêu chất lượng như
sau:
1 1
L* L(u* )  STQ1QQ1S  STQ1S   STQ 1S (6)
2 2
Giả sử cho L như sau:
1 1 1 
L  uT  u  0 1 u
2 1 2
(7)
Khi đó giá trị u tối ưu sẽ là:

 2 1 0 1 
u*     1    1 (8)
 1 1    
là một cực tiểu , vì L uu > 0 và ta có giá trị nhỏ nhất của L là L* = -1/2. Các đường
đồng mức của L(u )trong g được vẽ trong hình 3.4, với u   u1 u 2  Các mũi tên là
T
gradient.
 u1  u 2 
Lu  Qu  S   
 u1  2u 2  1
Hình 3. 4: Các đường đồng mức và vector gradient
Lưu ý rằng gradient luôn luôn vuông góc với các đường đồng mức và có hướng là
hướng tăng L(u).
Chúng ta dùng dấu “*” để chỉ giá trị tối ưu của u và L cần tìm. Tuy nhiên ta thường
bỏ qua dấu “*” .
91
* Ví dụ 3.2: Tối ưu hóa bằng tính toán vô hướng .
Phần trên chúng ta đã đề cập phương pháp giải bài toán tối ưu bằng cách sử dụng
các vector và gradient. Sau đây ta sẽ tiếp cận bài toán với một cách nhìn khác, xem chúng
như là những đại lượng vô hướng.
Để chứng minh, ta xét ở dạng:
1
L(u1,u 2 )  u12  u1u 2  u 22  u 2
2
với u1,u 2 là các đại lượng vô hướng. Điểm cực trị xuất hiện khi đạo hàm riêng của
L theo tất cả các đối số phải bằng 0:
L
 u1  u 2  0
u1
L
 u1  2u 2  1  0
u 2
Giải hệ phương trình trên ta được : u1  1,u 2  1
Vậy điểm cực trị là (1, 1) .
b) Tối ưu hóa có điều kiện ràng buộc
* Ví dụ 3.3 : Không gian toàn phương với điều kiện ràng buộc tuyến tính .
Giả sử hàm chỉ tiêu chất lượng được cho bởi ví dụ 3.1 với các đại lượng vô hướng
u1,u 2 được thay thế bằng x,u :
1 1 1   x  x 
L(x,u)   x u       0 1   (1)
2 1 2  u  u 
Với điều kiện ràng buộc :
f (x,u) = x − 3 = 0 (2)
Hàm Hamilton sẽ là :
1
H  L   Tf  x 2  xu  u 2  u  (x  3) (3)
2
với λ là một đại lượng vô hướng. Điều kiện để có điểm dừng theo (3.31) là :
H λ= x − 3 = 0 (4)
Hx = x+ u + λ = 0 (5)
Hx = x + 2u +1 = 0 (6)
Giải (4), (5), (6) ra ta được: x = 3, u = -2, λ = -1, điểm dừng là:
 x, u *  (3, 2) (7)
Để xác định điểm cực tiểu , tìm ma trận uốn:
Lfuu  2 (8)
92
Lfuu  0 , vì thế (x,u)*=(3,-2) là điểm cực tiểu.
Các đường đồng mức của L(x,u) và điều kiện ràng buộc (2) được vẽ trong hình 3.5
Hình 3. 5:Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u)
Grad của f(x,u) trong hệ tọa độ (x,u) được viết như sau:
f x  0 
f   1  (9)
 u  
và được vẽ trong hình 3.5.
Lx   x  u 
Grad của L(x,u) :    (10)
 Lu   x  2u  1
Tại điểm cực tiểu (3,-2) , grad L(x,u) sẽ có giá trị :
f x  1 
f   0  (11)
 u  
Cần lưu ý rằng gradf và gradL tương đương với nhau tại điểm dừng. Có nghĩa là
điểm cực tiểu xuất hiện khi điều kiện ràng buộc (2) là đường tiếp tuyến của các đường
đồng mức của L. Di chuyển hướng dọc theo đường thẳng f = 0 sẽ làm tăng giá trị của L .
Ta tìm được giá trị của L tại điểm cực tiểu bằng cách thay x = 3, u = -2 vào (1) , ta
được L*=0,5 .
Vì λ = -1, giữ nguyên giá trị u = -2, thay đổi điều kiện ràng buộc df (dịch chuyển
đường thẳng trong hình 3.5 về phía phải) sẽ làm tăng L(x,u) với dL = -λdf = df
* Ví dụ 3.4 : Hàm chỉ tiêu chất lượng dạng toàn phương với điều kiện ràng buộc tuyến tính
- Trường hợp vô hướng .
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
93
1  x 2 y2 
L(x,u)   2  2  (1)
2 a b 
Với điều kiện ràng buộc tuyến tính :
f (x,u) = x + mu – c (2)
l2
Các đường đồng mức của L(x,u) là những ellip; nếu L(x,u)  thì bán kính trục
2
chính và bán kính trục phụ là al và bl, điều kiện ràng buộc f(x,u) là một họ các đường
thẳng chứa thông số c.
Xem hình 3.6 (lưu ý rằng u là biến độc lập, với x được xác định bởi f(x,u) = 0).
Hàm Hamilton là :
1  x2 u2 
H   2  2   (x  mu  c) (3)
2 a b 
Và điều kiện để có điểm dừng :
H  x  mu  c (4)
x
Hx  0 (5)
a2
u
H u  2  m  0 (6)
b
Hình 3. 6: Các đường đồng mức của L(x,u) và điều kiện ràng buộc f(x,u)
Để giải hệ phương trình này, trước hết ta sử dụng phương trình (6) để đưa ra biến
điều khiển tối ưu theo thừa số Lagrange.
u  b2m (7)
94
Bây giờ thay phương trình (7) vào (4) để khử u, kết hợp với (5) và được viết lại:
1 b2m 2 
   x   c 
1     (8)
1    0
 a 2 
Giải ra ta được giá trị của điểm dừng:
a 2c
x 2 (9)
a  b2m2
c
 2 (10)
a  b2m2
Thay (9), (10) vào (6), ta có được giá trị u tối ưu:
b 2mc
u (11)
a 2  b2m2
để xác định điểm dừng là cực tiểu, dùng (3.37) để tìm ra ma trận uốn :
1 m2
Lfuu  2 2 (12)
b a
Lfuu  0 vì vậy ta tìm được điểm cực tiểu.
Thay (9) và (11) vào (1) ta được giá trị tối ưu của hàm chỉ tiêu chất lượng :
1 c2
L*  (13)
2 a 2  b2m 2
Để kiểm chứng (3.21), lưu ý rằng:
L* L*
   (14)
f du 0
c
Gradf trong miền (u,x) là :
f x   m 
f   1  (15)
 u  
được biểu diễn trong hình 3.6 GradL là :
u
Lu   b2 
L    x  (16)
 x  
 a 2 
và tại điểm dừng (11), (9) sẽ có giá trị :
*
L u  m c
    2 (17)
 L x  1  a  b m
2 2
95
điều này tương ứng với (15), vì vậy điểm dừng xuất hiện khi f(x,u) = 0 là đường
tiếp tuyến với một đường đồng mức của L(x,u) .
3.2. CÁC PHƯƠNG PHÁP ĐIỀU KHIỂN TỐI ƯU
3.2.1. Phương pháp biến phân cổ điển Euler_Lagrange
a) Giới thiệu
Nhiệm vụ của điều khiển tối ưu là giải bài toán tìm cực trị của phiếm hàm L[x(t),u(t)]
bằng cách chọn tín hiệu điều khiển u(t) với những điều kiện hạn chế của đại lượng điều
khiển và tọa độ pha. Một trong những công cụ toán học để xác định cực trị là phương pháp
biến phân cổ điển Euler_Lagrange.
Đường cực trị là những hàm trơn còn phiếm hàm cùng các điều kiện hạn chế là
những hàm phi tuyến. Do đó phương pháp này không thể áp dụng cho những trường hợp
mà tín hiệu điều khiển có thể là các hàm gián đoạn.
Trường hợp không có điều kiện ràng buộc
Cho u(t) là hàm thuộc lớp hàm có đạo hàm bậc nhất liên tục. Trong mặt phẳng (u,t)
cho hai điểm (t0,u0) và (t1,u1), cần tìm quỹ đạo nối hai điểm này sao cho tích phân theo quỹ

đạo u  u(t) cho bởi J(u) có cực trị với J(u):
t1 
J(u)   L(u,u, t)dt (3.38)
t0
L là hàm có đạo hàm riêng bậc một và bậc hai liên tục với mọi biến của nó. Để
thống nhất ở đây ta lấy t 0  0 và t1  T .
Biến đổi của J do δu tạo nên là :
J(u  u)  J(u  u)  J(u)
T   T 
  L(u u,u   u, t)dt   L(u,u, t)dt (3.39)
0 0
T   
  [L(u u,u   u, t)  L(u,u, t)]dt
0
Phân tích (2.39) theo chuỗi Taylor và chỉ khảo sát thành phần bậc một của J ta được:
 
T T
L(u,u, t) L(u,u, t) 
J(u, u)   [( )u   [( 
) u ]dt (3.40)
u
0 0 u
 T 

Vì δu và δ u liên hệ nhau bởi : u(t)   u(t)dt  u(0)
0
96
Xem δu là hàm biến đổi độc lập, biểu thức (3.40) có thể biến đổi để chỉ chứa δu

bằng cách lấy tích phân những thành phần chứa δ u :
  
T
L(u,u, t) L(u,u, t) d L(u,u, t)
u 0   [
T
J(u, u)  
 
]udt... (3.41)
u dt
u 0 u
Từ điều kiện đã cho δu(0) = δ(T) = 0, phần đầu của vế phải ở biểu thức (3.41) bằng
0. Nếu gia số δJ của chỉ tiêu chất lượng J tồn tại và nếu J có cực trị đối với u* thì :
∆J (u*,δu) = 0 (3.42)
Đó là điều kiện cơ bản của phép tính biến phân.
Từ các biểu thức (3.41), (3.42) ta có:
 
T
L(u*,u *, t) d L(u,u, t)
J(u*, u)   [  
]udt  0 (3.43)
u dt
0 u
Từ đó có thể rút ra phương trình Euler_Lagrange:
 
L(u,u, t) d L(u,u, t)
 
0 (3.44a)
u dt
u
Hoặc có thể viết đơn giản :
L d L
 0 (3.44b)
u dt 
u
Trường hợp có điều kiện ràng buộc
Nếu ngoài chỉ tiêu chất lượng (3.38) còn có các điều kiện ràng buộc dạng :
i (u,u, t)  0 t  0,T , i  1,n (3.45)

thì chỉ tiêu chất lượng J có dạng :
T n
J a (u, i )   [L(u,u, t)    i (t)i (u,u, t)]dt (3.46)
0 i 1
mà i (t) với i = 1,2,…,n là hàm Lagrange. Vì giới hạn thỏa mãn với mọi t nên hàm
Lagrange phụ thuộc thời gian. Tương tự như trên ta có phương trình Euler_Lagrange tổng
quát :
La (u,u, , t) d La (u,u, , t)
 0 (3.47)
u dt u
n
Mà La (u,u, , t)  La (u,u, t)   i (t)i (u,u, t) (3.48)
i 1
97
T
Khi điều kiện ràng buộc có dạng:  i (u,u, t)dt  qi (3.49)
0
thì phương trình Euler_Lagrange tổng quát (3.47) có phiếm hàm :

n
La (u,u, , t)  La (u,u, t)   i(u,u, t) (3.50)
i 1
Trong trường hợp này  i là các hệ số không phụ thuộc thời gian .
Khi có điều kiện ràng buộc dạng (3.45) hoặc (3.49) phải giải (n+1) phương trình để
xác định y*(t) và *i (t) với i=1,2,…,n .
Phương trình Euler_Lagrange với tín hiệu điều khiển bị hạn chế
Trong phần trên ta chỉ đề cập tới bài toán mà trong đó tín hiệu điều khiển không có
giới hạn nào ràng buộc. Trong thực tế thường gặp tín hiệu điều khiển có ràng buộc dạng
|u| 1.
Điều kiện cần để có cực trị: khi u(t) là đường cực trị thì u+δu và u-δu là những hàm
cho phép. Bây giờ ta so sánh trị số phiếm hàm ở đường cực trị với trị số của nó ở hàm u+δu
và u-δu. Nếu miền biến đổi của u(t) là kín và u(t) ở ngoài biên thì một trong các hàm u+δu
hoặc u-δu sẽ ra ngoài miền cho phép.
Một trong các biện pháp khắc phục khó khăn trên là đường cực trị ở biên và :
u  (t) (3.51)
Ví dụ, nếu |u|≤ 1, điều kiện u  (t) nghĩa là (t)  1 . Đổi biến ta có :
z2  u   (3.52)
thì biến mới z sẽ không có điều kiện hạn chế và biên giới của biến u tương đương
T 
với z = 0. Bây giờ chỉ tiêu chất lượng J(u)   L(u,u, t)dt có biến mới u  z 2   , từ đó:
0
u  2zz  
Và chỉ tiêu chất lượng J có dạng :
T
J   L[z 2 +,2zz  , t]dt (3.53)
0
Vì không có điều kiện hạn chế nên phương trình Euler_Lagrange có dạng :
L d L
 0 (3.54)
z dt z
98
L L u L u L L
   2z  2z
z u z u z u u
L L u L u L
Ở đây:    2z
z u z u z u
d L d L L
 2z( ) 2z
dt z dt u u
và (3.54) sẽ có dạng :
L L d L L
2z  2z  2z  2z  0
u u dt u u
 L d L 
Hay: 2z   0 (3.55)
 u dt u 
Phương trình trên thỏa mãn với z = 0, nghĩa là đường cực trị có những giá trị biên
và phương trình Euler_Lagrange vẫn là phiếm hàm xuất phát:
L d L
 0
u dt u
b) Ví dụ
* Ví dụ 3.5:
du1
Tìm quá trình tối ưu x*  u 2 ,u 2*  để cực tiểu hóa chỉ tiêu chất lượng J :
dt
T
J(u)   (u 2 ) 2dt (1)
0
với điều kiện đầu :

T
 u 2 (t)dt  0 (2)
0
và điều kiện biên :

u 2 (0)  u 2 (T)  0 (3)
điều kiện đầu có dạng :
T 
 i (u,u, t)dt  qi (4)
0
Phương trình Euler_Lagrange có dạng tổng quát :

L d L
 0 (5)
u 2 dt u 2
với phiếm hàm:
L(u 2 ,u 2 , 1 )  u 22  1u 2 (6)
99
Từ 2 phương trình trên ta có :
1  2u 2  0 (7)
1
Do đó: u2  (8)
2
Lấy tích phân, ta có:
1
u2  x  t  c1
2 (9)

u 2 (t)  1 t 2  c1t  c 2
4
Để xác định 1,c1,c2 ta dùng các điều kiện biên :
u 2 (0)  0  c 2  0
1 2
u 2 (T)  T  c1T  0
4
và điều kiện đầu :
T
1 3 c1 2
 u 2 (t)dt  12
T  T  0
2
0
Từ 2 phương trình trên ta xác định :

240
1   (10)
T3
60
c1  2 (11)
T
Từ đó quá trình tối ưu là :
60 120
u*2 (t)  x * (t)  2  3 t (12)
T T
60 60 2
u*2 (t)  t  t (13)
T2 T3
tương ứng với hình 3.7(a) điều khiển tối ưu x*(t) biến đổi tuyến tính còn u *2 là hàm
parabol .
100
Hình 3. 7: Đặc tính thời gian của hệ tổn hao năng lượng tối thiểu (a) và hệ
tác động nhanh (b).
Ta thử so sánh tổn hao năng lượng của trường hợp này với trường hợp bài toán tối
ưu tác động nhanh có đặc tính thời gian như hình 3.7(b). Cả hai trường hợp đều có cùng
giá trị θ0, tương ứng với phần gạch sọc. Ta có thể xác định ua theo (b) :
T/2
uaT2
0  2  (u a .t)dt 
4
0 (14)
40
ua 
T2
Như vậy tổn hao năng lượng tương ứng với :
T
1602
Ja   u a2dt  3 (15)
0
T
T
 2 1202
còn ở ví dụ ta đang xét : J   (x ) dt  3 (16)
0
T
J a 16
Nghĩa là chúng khác nhau:   1.33 lần.
J 12
* Ví dụ 3.6:
Xét bài toán tối ưu tác động nhanh với điều kiện đầu :
101
T
 u 2dt  0 (1)
0
T
 (u 2 ) dt  q 0
2
(2)
0
điều kiện biên :

u 2 (0)  u 2 (T)  0 (3)
Với bài toán tác động nhanh, từ (3.49) và (3.50) ta có thể viết :
L(u 2 ,u 2 , 1,  2 )  1  1u 2   2 (u 2 ) 2 (4)
Phương trình Euler_Lagrange :
L d L
 0 (5)
u 2 dt u 2
 1  2 2u 2  0 (6)
1
 u2  (7)
2 2
Lấy tích phân biểu thức trên ta được :
1
u 2 (t)  x(t)  t  c1 (8)
2 2
1 2
u 2 (t)  t  c1t  c 2 (9)
4 2
1
Kết hợp (9) với điều kiện u 2 (0)  0 suy ra : c2  0;c1   T
4 2
20 1
Và điều kiện u 2 (T)  0 ta có: c1   T
T 2 6 2
1 24
   30 (10)
2 T
60
 c1  (11)
T2
Thế vào (8) , (9) được :
60 120
u*2 (t)  x * (t)   3 t (12)
T2 T
6 6
u*2 (t)  20 t  30 t 2 (13)
T T
So sánh với ví dụ trước ta thấy quá trình tối ưu là hoàn toàn giống nhau.
102
3.2.2. Phương pháp quy hoạch động Bellman
a) Giới thiệu
Phương pháp quy hoạch động được dựa trên nguyên lý tối ưu sơ khai của Bellman:
Một chiến lược tối ưu có tính chất không phụ thuộc vào những quyết định trước đó
(ví dụ như những luật điều khiển) song các quyết định còn lại phải cấu thành nên chiến
lược tối ưu có liên quan với kết quả của những quyết định truớc đó .
Nguyên lý tối ưu của Bellman: “Bất kỳ một đoạn cuối cùng nào của quỹ đạo tối ưu
cũng là một quỹ đạo tối ưu” .
Nguyên lý này giới hạn xem xét trên một số các chỉ tiêu tối ưu. Nó chỉ ra rằng
phương án tối ưu phải được xác định từ trạng thái cuối đi ngược về trước đó .
Điều kiện áp dụng: nguyên lý tối ưu Bellman là một phương pháp số, chỉ áp dụng
được khi hệ thống có phân cấp điều khiển và ta biết trước sơ đồ mắt lưới được xây dựng
bằng thực nghiệm.
Ví dụ đơn giản sau sẽ chỉ ra những vấn đề mấu chốt của phương pháp này.
Bài toán đường bay của máy bay
Một máy bay bay theo hướng từ trái sang phải qua các điểm a, b, c… tượng trưng
cho các thành phố với mức nhiên liệu cần thiết để hoàn tất mỗi chặng đường được liệt kê
ở hình 3.8. Chúng ta sẽ dùng nguyên lý tối ưu của Bellman để giải bài toán cực tiểu hóa
nhiên liệu tiêu hao .
103
Hình 3. 8: Luật điều khiển năng lượng tiêu hao tối thiểu
Liệt kê các trạng thái k từ 0 đến 4 trong quá trình ra quyết định như hình 3.8 (đầu
mũi tên và con số trong khung bước đầu có thể chưa cần quan tâm). Tại mỗi giá trị k = 1,0
,....N −1 phải có một quyết định và N là trạng thái cuối.
Số hàng: n = 2
Số cột : m = 2
Vậy số cấp: N = n + m = 2 + 2 =4
Đi từ cấp 0 đến cấp 4, tại các nút ta xét chi phí tiêu hao (CPTH) là nhỏ nhất (theo
nguyên lý tối ưu của Bellman):
• Cấp 0 (k=N=4):
- Nút i: CPTH = 0, do mới bắt đầu đi.
• Cấp 1 (k=3):
- Nút f: CPTH = 4 + 0 = 4, 4 : giá trị tiêu hao khi đi từ i đến f
- Nút h: CPTH = 2 + 0 = 2
• Cấp 2 (k=2):
- Nút c: CPTH = 3 + 4 = 7
- Nút e: CPTH = 4 + 3 = 7, từ f đến e
CPTH = 2 + 2 = 4, từ h đến e
Do chi phí tiêu là nhỏ nhất nên: CPTH = 4, từ h đến e
- Nút g: CPTH = 2 + 4 = 6, từ h đến g
• Cấp 3 (k=1):
- Nút b: CPTH = 7 + 2 = 9, từ c đến b
CPTH = 4 + 1 = 5, từ e đến b
Do chi phí tiêu là nhỏ nhất nên: CPTH = 5, từ e đến b
- Nút d: CPTH = 4 + 3 = 7, từ e đến d
CPTH = 6 + 2 = 8, từ g đến d
Do chi phí tiêu là nhỏ nhất nên: CPTH = 7, từ h đến e
104
• Cấp 4 (k=0):
- Nút a: CPTH = 5 + 3 = 8, từ b đến a
CPTH = 7 + 1 = 8, từ d đến a
Do chi phí tiêu bằng nhau trên 2 quãng đường nên: CPTH = 8, từ b đến a hay
từ d đến a
Như vậy bằng cách lần lượt giảm k từ N đến 0, kết quả CPTH đã tính tại các cấp
được biểu diễn như hình 3.8.
Chú ý rằng khi k = 0, luật điều khiển có thể là u 0  1 hoặc u 0  1 cùng cho chi phí
là 8 ; luật điều khiển khi k = 0 là duy nhất.
Vậy có hai đường đi từ a đến i với cùng một chi phí là 8:
a → b → e → h → i ( đường nét đậm ) và a → d → e → h → i (đường nét đứt).
Hiển nhiên giải pháp tối ưu trong quy hoạch động là không duy nhất. Cuối cùng chúng ta
chỉ ra rằng nguyên lý tối ưu của Bellman giúp giảm số lượng phép tính toán cần thiết bằng
cách giảm số lượng các lựa chọn có thể thực hiện .
b) Hệ rời rạc
Phương pháp quy hoạch động cũng có thể dễ dàng áp dụng cho hệ phi tuyến. Ngoài
ra nếu có càng nhiều điều kiện ràng buộc đối với tín hiệu điều khiển và biến trạng thái thì
ta có được lời giải càng đơn giản .
Đặt : x k 1  f k (x k ,u k ) (3.56)
với số mũ k trên f thể hiện sự thay đổi theo thời gian . Giả định kết hợp với hàm chỉ
tiêu chất lượng :
N 1
Ji (x i )  (N, x N )   Lk (x k ,u k ) (3.57)
k i
với [i , N] là thời gian lấy mẫu. Chúng ta cần chỉ ra sự phụ thuộc của J đối với trạng
thái và thời gian đầu .
Giả sử ta đã có được tổn hao tối ưu J*k 1 (x k 1 ) từ thời điểm k +1 đến thời điểm cuối
N ứng với những phương án khả thi x k 1 , và chuỗi các phương án tối ưu từ thời điểm k
+1 đến N cho mọi x k 1 .
Tại thời điểm k , nếu ta áp dụng một luật điều khiển uk bất kỳ và sử dụng một chuỗi
luật điều khiển tối ưu kể từ vị trí k +1, lúc đó tổn hao sẽ là :
J k  Lk (x k ,u k )  J*k 1(x k 1) (3.58)
với xk là trạng thái ở thời điểm k, và xk+1 được cho bởi (3.56) . Theo nguyên lý
Bellman thì tổn hao tối ưu từ thời điểm k sẽ là :
J*k (x k )  min(Lk (x k ,u k )  J*k 1(x k 1)) (3.59)
uk
105
và luật điều khiển tối ưu u*k tại thời điểm k là u làm cho tổn hao đạt cực tiểu
Phương trình (3.59) chính là nguyên lý tối ưu cho hệ rời rạc. Vai trò quan trọng của
nó là có thể cho phép chúng ta tối ưu hóa một vector điều khiển tại thời điểm a bằng cách
tính ngược từ N.
Trong thực tế, ta có thể định rõ các điều kiện ràng buộc được thêm vào chẳng hạn
như yêu cầu luật điều khiển uk thuộc về một tập hợp các luật điều khiển được chấp nhận .
* Ví dụ 3.7:
Xét hệ : x k 1  x k  u k (1)
có hàm chỉ tiêu chất lượng :
1 N1 2
J 0  x 2N   uk
2 k 0
(2)
với thời điểm cuối cùng N = 2. Tín hiệu điều khiển bị ràng buộc lấy các giá trị:
u k  1, 0.5,0,0.5,1 (3)
và biến trạng thái bị ràng buộc lấy các giá trị :
x k  0,0.5,1,1.5 (4)
Điều kiện ràng buộc đối với tín hiệu điều khiển không phải là không có lý do, tín
hiệu điều khiển tối ưu thời gian tối thiểu chỉ lấy các giá trị ±1, trong khi tín hiệu điều khiển
tối ưu nhiên liệu tối thiểu nhận các giá trị 0 , ±1. điều kiện ràng buộc đối với biến trạng thái
trong bài toán này cũng hợp lý, vì nếu trạng thái ban đầu lấy một trong các giá trị chấp
nhận được (4), thì dưới ảnh hưởng của các tín hiệu điều khiển cho phép (3) các trạng thái
sau đó sẽ lấy các giá trị nguyên và bán nguyên, điều kiện ràng buộc (4) có thể viết lại là:
x 0  0,0.5,1,1.5 và 0  x k  1.5 (5)
Đây là điều kiện xác thực và ràng buộc biên độ về trạng thái, thường là hợp lý trong
các tình huống vật lý. Bây giờ, bài toán điều khiển tối ưu là tìm dãy tín hiệu điều khiển
chấp nhận được u*0 ,u1* sao cho chỉ tiêu chất lượng J 0 đạt giá trị cực tiểu trong khi tạo ra
quỹ đạo trạng thái chấp nhận được x*0 , x1* , x*2 . Chúng ta muốn u *k được xác định như là
luật điều khiển hồi tiếp trạng thái .
Theo (3.58) ta có :
1
J k  u k2  J*k 1 (6)
2
 J*k  min(J k ) (7)
uk
Để tìm u *k và J*k ứng với mỗi x k . Ta xuất phát từ trạng thái cuối cùng:
2
k = N = 2 : J*2  x*2
Ứng với mỗi giá trị x N  0,0.5,1,1.5 ta có các giá trị J*N  0,0.25,1,2.25
106
k = 1 : J1  u 22 / 2  J*2
x1  1.5 : vì x 2  x1  u1 và 0  x 2  1.5 nên ta chỉ xét các giá trị u1  0
u1  0  x 2  1.5  0  1.5  J*2  2.25
 J1  u 22 / 2  J*2  02 / 2  2.25  2.25
u1  0.5  x 2  1.5  (0.5)  1  J*2  1
 J1  (0.5) 2 / 2  1  1.125
u1  1  x 2  1.5  (1)  0.5  J*2  0.25
 J1  (1) 2 / 2  0.25  0.75
Như vậy, tín hiệu điều khiển tối ưu với x1  1.5 là u1*  1 và tổn hao tối ưu là
J1*  0.75 . Ta có được sơ đồ như sau với mũi tên chỉ ra trạng thái tối ưu như hình 3.9a
Hình 3.9a: Mũi tên chỉ ra trạng thái tối ưu

Tương tự như vậy cho các trường hợp còn lại của x1. Tiếp tục với trạng thái k=0
Cuối cùng ta sẽ được lưới kết quả như hình 3.9b.
107
Hình 3.9b: Lưới kết quả của bài toán tối ưu giải bằng phương pháp quy hoạch
động cho ví dụ 3.7
Hình 3. 9:a)Mũi tên chỉ ra trạng thái tối ưu, b)Lưới kết quả của bài toán tối ưu giải bằng
phương pháp quy hoạch động cho ví dụ 3.7
108
c) Phương pháp điều khiển số
Chúng ta có thể rời rạc hóa, giải bài toán tối ưu cho hệ rời rạc và sau đó dùng khâu
giữ bậc không để tạo ra tín hiệu điều khiển số .
Cho hệ thống :
x  f (x,u, t) (3.60)
Với hàm chỉ tiêu chất lượng :
T
J(0)    x(T),T    L(x(t),u(t), t)dt (3.61)
0
Để rời rạc hệ thống với chu kỳ lấy mẫu τ giây, ta có thể sử dụng hàm xấp xỉ bậc1
x k 1  x k
x(k)  (3.62)

Viết (3.60) dưới dạng :
x k 1  x k  f (x k ,u k ,k) (3.63)
để cho đơn giản ta định nghĩa : x k  x(k),u k  u(k)
định nghĩa hàm rời rạc: f k (x k ,u k )  x k  f (x k ,u k ,k) (3.64)
Khi đó ta có thể viết :
x k 1  f k (x k ,u k ) (3.65)
Phương trình này đúng với (3.56) .
Để rời rạc hoá hàm chỉ tiêu , ta có thể viết :
N 1 (k 1) 
J(0)    x(T),T     L(x(t),u(t), t)dt (3.66)
k 0 k
T
Trong đó: N  (3.67)

Sử dụng hàm xấp xỉ bậc 1 cho mỗi đại lượng tích phân :
N1
J(0)    x(T),T    L(x k ,u k ,k) (3.68)
k 0
Định nghĩa hàm rời rạc :

J 0  J(0)
s (N, x N )  (x(N), N)
Lk (x k ,u k )  L(x k ,u k ,k) (3.69)
Khi đó ta có:
109
N 1
J(0)    N, x N    Lk (x k ,u k )
s
(3.70)
k 0
đây là công thức (3.57) .

Trong trường hợp hệ thống tuyến tính bất biến theo thời gian với chỉ tiêu chất lượng
dạng toàn phương :
x  Ax  Bu (3.71)
T
1 1
J(0)  x T (T)S(T)x(T)   (x TQx  u T Ru)dt (3.72)
2 20
Sử dụng hàm xấp xỉ bậc nhất để rời rạc hoá hệ thống trở thành :
x k 1  (I  A)x k  Bu k (3.73)
1 1 N1
J(0)  x TNSN x N   (sTk Qs x k  u Tk R s u k ) (3.74)
2 2 k 0
Trong đó:
SN  S(N) (3.75)
Q s  Q (3.76)
R s  R (3.77)
Tuy nhiên trong trường hợp này ta có thể làm tốt hơn xầp xỉ Euler (2.73) bằng cách
sử dụng chính xác phương trình trạng thái (3.71) bao gồm bộ lấy mẫu và khâu giữ bậc 1 :
x k 1  As x k  Bs u k (3.78)
Trong đó:
As  eA (3.79)

B   (e AB)dt
s
(3.80)
0
Công thức Caley-Hamilton : eA  C0I  C1A  ...  Cn 1A n 1

Khi đó hệ thống này đã được rời rạc hoá, phương pháp quy hoạch động có thể được
áp dụng để tính u *k như trong phần rời rạc. điều khiển số áp dụng trong thực tế được thể
hiện như sau :
u(t)  u*k , k  t  (k  1) (3.81)
Để sử dụng phương pháp quy hoạch động, biến trạng thái và giá trị điều khiển trước
hết phải được lượng tử hoá và được giới hạn theo một số tập giá trị có thể chấp nhận. Mức
độ lượng tử càng tốt thì tín hiệu số càng chính xác; tuy nhiên khi số lượng có thể chấp nhận
được của xk và uk tăng thì khối lượng tính toán để tìm u *k cũng tăng theo. Vấn đề này có
thể nhanh chóng gây khó khăn kể cả đối với các máy tính lớn.
110
3.2.3 Nguyên lý cực tiểu Pontryagin _ Hamilton
a) Nguyên lý cực tiểu của Pontryagin.
Cho hệ thống :
x  f (x,u, t) (3.82)
Kết hợp hàm chỉ tiêu chất lượng :
T
J(t 0 )    x(T),T    L(x,u, t)dt (3.83)
t0
Trạng thái cuối phải thỏa :

Ψ (x (T), T) =0 (3.84)
và x(t 0 ) đã được cho trước.
Điều kiện để bài toán tối ưu là :
H
0 (3.85)
u
Với H(x,u, , t)  L(x,u, t)   f (x,u, t) (3.86)
Giả sử hàm điều khiển u(t) là ràng buộc trong một vùng giới hạn cho phép, có nghĩa
là giá trị yêu cầu có độ lớn nhỏ hơn giá trị đã cho. Điều kiện dừng thay bằng điều kiện tổng
quát :
H(x* ,u* ,  , t)  H(x *,u *  u, *, t) thỏa tất cả giá trị δu
Dấu * thể hiện chỉ số chất lượng tối ưu. Mà bất kỳ sự biến thiên nào trong bộ điều
khiển tối ưu xảy ra tại thời điểm t (trong khi trạng thái và biến trạng thái nếu được duy trì)
sẽ tăng đến giá trị của hàm Hamilton. Điều kiện này được viết như sau:
H(x* ,u* ,  , t)  H(x *,u *, *, t) thỏa tất cả giá trị u (3.87)
Yêu cầu tối ưu biểu thức (3.87) được gọi nguyên lý cực tiểu Pontryagin: “Hàm
Hamilton phải được cực tiểu hóa ở tất cả các giá trị u cho giá trị tối ưu của trạng thái và
biến trạng thái ”.
Chúng ta sẽ thấy nguyên lý cực tiểu hữu dụng như thế nào, đặc biệt chú ý không thể
nói rằng biểu thức H(x* ,u* ,  )  H(x,u, , t) chắc chắn phải đúng.
*Ví dụ 3.8:
Tối ưu hóa với những ràng buộc
Giả sử chúng ta muốn tối ưu cực tiểu hàm :
1
L  u 2  2u  1 (1)
2
Với điều kiện : |u| ≤ 1 (2)
Xem hình 3.10 .
111
Nguyên lý cực tiểu: L(u*) ≤ L(u) thỏa ∀u (3)
Hình 3. 10: Tối ưu hoá với nhiều điều kiện ràng buộc
Dễ dàng thấy được giá trị tối ưu của u là :

u*=1 (4)
Giá trị tối ưu của L là :
1
L*  L(1)   (5)
2
Giá trị nhỏ nhất không ràng buộc tìm được bằng cách giải :
L
u20 (6)
u
Nhận được: u=2 (7)
Và L(2) = -1 (8)
nhỏ hơn (5); nhưng u=2 thì không nằm trong khoản |u| ≤ 1.
b) Điều khiển Bang-Bang
Chúng ta hãy thảo luận bài toán tối thiểu thời gian tuyến tính với ngõ vào ràng buộc
Cho hệ thống :
x  Ax  Bu (3.88)
với chỉ tiêu chất lượng :
T
J(t 0 )   1dt (3.89)
t0
với T tự do. Giả sử hàm điều khiển phải thỏa mãn điều kiện sau :
u(t)  1 t   t 0 ,T  (3.90)
Bài toán tối ưu đặt ra là tìm tín hiệu điều khiển u(t) để cực tiểu hoá J(t 0 ) thỏa mãn
điều kiện (3.90) với ∀t đi từ trạng thái x(t 0 ) đến trạng thái cuối cùng x(T) thỏa công thức
(3.84) của hàm ψ .
Hàm Hamilton cho vấn đề này là :
112
H  L  Tf  1   T  Ax  Bu  (3.91)
H
điều kiện dừng được tìm thấy là : 0  BT (3.92)
u
Nó không chứa u bởi vì hàm Hamilton tuyến tính đối với u. Rõ ràng, để H cực tiểu
chúng ta nên chọn u(t) sao cho   (t)Bu(t) càng nhỏ càng tốt (có nghĩa là giá trị càng xa
về phía bên trái trên trục tọa độ thực; T Bu   là giá trị nhỏ nhất). Nếu không có sự
ràng buộc nào trên u(t) thì điều này sẽ cho ra những giá trị vô hạn (dương hoặc âm) của
những biến điều khiển.
Với kết quả này, bài toán tối ưu đặt ra phải có những điều kiện ràng buộc đối với
tín hiệu điều khiển.
Theo nguyên lý cực tiểu Pontryagin (3.87), hàm điều khiển tối ưu u* (t) phải thỏa
mãn :
      Ax 
T T
1  * Ax*  Bu*  1  * *
 Bu
       Bu
T T
*
Bu* *
(3.93)
đối với tất cả giá trị u(t) cho phép. Điều kiện này cho phép chúng ta biểu diễn u*(t)
dưới dạng biến trạng thái. Để thấy điều này, trước tiên chúng ta thảo luận về trường hợp
một ngõ vào.
Đặt u(t) là một đại lượng vô hướng và đặt b tượng trưng cho vector ngõ vào. Trong
trường hợp này dễ dàng chọn u*(t) để tối thiểu λT(t) Bu(t). (Chú ý : giá trị nhỏ nhất nghĩa
là λT(t)Bu(t) nhận một giá trị càng gần - ∞ càng tốt).
Nếu λT(t)B là giá trị dương, chúng ta nên chọn u(t) = -1 làm cho λT(t)Bu(t) có giá
trị âm nhất. Mặt khác, nếu λT(t)B là giá trị âm , chúng ta nên chọn u(t) ở giá trị cực đại là
giá trị 1 để giá trị λT(t)Bu(t) càng âm càng tốt. Nếu giá trị λT(t)Bu(t) bằng zero tại thời điểm
t, khi đó u(t) có thể nhận bất cứ giá trị nào tại thời điểm này .
Quan hệ giữa điều khiển tối ưu và biến trạng thái có thể biểu diễn bằng hàm sgn(w):
1 w 0

sgn(w)  ( 1,1) w 0 (3.94)
1 w0

Khi đó hàm điều khiển tối ưu được cho bởi :
u*(t) = − sgn(BT λ(t)) (3.95)
u* được biểu diễn dưới dạng biến trạng thái, với hệ tuyến tính dạng toàn phương
Giá trị BTλ(t) được gọi là hàm chuyển đổi. Một hàm chuyển đổi mẫu và bộ điều
khiển tối ưu được diễn tả ở hình 3.11. Khi hàm chuyển đổi này đổi dấu, bộ điều khiển
chuyển từ cực trị này đến cực trị khác. Bộ điều khiển trong hình được chuyển đổi bốn lần,
113
điều khiển thời gian tối thiểu tuyến tính tối ưu luôn bão hòa khi nó chuyển đổi tại vị trí
giữa các giá trị cực trị, cho nên được gọi là điều khiển Bang-bang.
Nếu bộ điều khiển là một vector có m phần tử, theo nguyên lý cực tiểu ta chọn các
thành phần u i (t)  1 nếu các thành phần BiT (t) là giá trị âm và bằng -1 nếu BiT (t) là giá
trị dương, với Bi là cột thứ i của B. Phương pháp điều khiển này tạo thành một giá trị :
m
 (t)Bu(t)   u i (t)BiT(t)
T
(3.96)
i 1
càng nhỏ càng tốt với mọi t [t 0 ,T]
Ta có thể viết :
u* (t)   sgn(BT(t)) (3.97)
nếu chúng ta định nghĩa hàm sgn cho vector w như sau :
v = sgn(w) nếu vi  sgn(w) cho mỗi i (3.98)
vi , w i là những thành phần của v và w .
Thành phần BiTλ(t) của hàm chuyển đổi BTλ(t) có thể bằng zero trên một khoảng
thời gian hữu hạn. Nếu điều đó xảy ra, thành phần u i (t) của bộ điều khiển tối ưu không
định nghĩa được bởi biểu thức (3.93), đó gọi là điều kiện kỳ dị. Nếu điều đó không xảy ra,
thì bộ điều khiển thời gian tối ưu được gọi là bình thường.
Nếu hệ thống là bất biến theo thời gian, ta sẽ có được quả đơn giản và bộ điều khiển
thời gian tối ưu là duy nhất.
Hình 3. 11:Hàm chuyển đổi mẫu và bộ điều khiển tối ưu
Hệ thống bất biến theo thời gian trong biểu thức (3.88) có thể đạt được nếu chỉ có
một ma trận cấp n:
U n   B AB ... A n 1B (3.99)
Nếu Bi là cột thứ i của B  R , khi đó hệ thống là bình thường nếu :

nxn
U   B AB ... A n 1B (3.100)
114
cấp n cho mỗi giá trị i = 1 , 2 , … , m; mà khi thành lập cho mỗi giá trị riêng biệt u,
u∈Rm .
Giả sử hệ thống bình thường và ta muốn dẫn x(t0) tiến đến trạng thái cuối cố định
x(T) với hàm điều khiển thỏa [u(t)]≤ 1. Khi đó :
- Nếu trạng thái cuối x(T) bằng zero, khi đó sẽ tồn tại bộ điều khiển thời gian tối
thiểu nếu hệ thống không có cực với phần thực dương (ví dụ không có cực trên mặt phẳng
phía bên phải).
- Cho bất kỳ giá trị x(T) cố định, nếu tồn tại đáp án cho bài toán tối ưu thời gian thì
nó là duy nhất
- Cuối cùng, nếu hệ thống có n cực thực và nếu tồn tại bộ điều khiển tối ưu thời gian
thì mỗi thành phần u i (t) của bộ điều khiển tối ưu thời gian thay đổi n  1
c) Điều khiển Bang – Off - Bang
Ở phần này chúng ta sẽ thảo luận bài toán điều khiển nhiên liệu tối thiểu tuyến tính
với đầu vào bị ràng buộc .
Xét hệ thống :
x  Ax  Bu (3.101)
Giả định rằng nhiên liệu được sử dụng trong mỗi thành phần của đầu vào tỉ lệ với
độ lớn của thành phần ấy, ta định nghĩa hàm đánh giá :
T m
J(t 0 )    ci u i (t)dt (3.102)
t 0 i 1
Khi đó chúng ta cho phép khả năng tiêu thụ nhiên liệu của m đầu vào u i (t) bởi
trọng số vô hướng c i . Ta định nghĩa trị tuyệt đối của vector :
 u1 
 
u   (3.103)
u 
 m
và vector C   c1 c 2 ... c m  .
T
Ta có:
T
J(t 0 )   CT u(t) dt (3.104)
t0
Giả định rằng bài toán thỏa : |u(t)| ≤ 1 (3.105)

Ta muốn tìm luật điều khiển để tối thiểu J(t0), thỏa (3.105) và đưa x(t0) về trạng thái
cuối thỏa (2.84) với hàm Ψ đã cho . Thời gian cuối T có thể tự do hoặc ràng buộc . Chúng
ta sẽ thảo luận kỹ hơn ở ví dụ . Lưu ý rằng thời gian T ít nhất phải bằng thời gian tối thiểu
để đưa x(t0) về trạng thái cuối x(T) thỏa (3.84) .
115
Hàm Hamilton :
H  CT | u |  T (Ax  Bu) (3.106)
Theo nguyên lý cực tiểu (3.87), bài toán điều khiển tối ưu phải thỏa:
CT | u* | ( )T (Ax*  Bu* )  CT | u | ( )T (Ax *  Bu) (3.107)
với mọi giá trị u(t). Vì trạng thái tối ưu và biến trạng thái xuất hiện ở cả hai vế của
bất đẳng thức, ta yêu cầu:
CT | u* | ( )T Bu*  CT | u | ( )T Bu (3.108)
với mọi u(t) .
Để xác định u*(t) từ biến trạng thái λ(t) thỏa mãn (3.108), ta giả sử rằng m thành
phần của bộ điều khiển là độc lập lẫn nhau (i=1,…,m). Tất cả các giá trị u i (t) phải thỏa
bất đẳng thức vô hướng:
(* )T Bi u* (* )T Bi u i
u*i  | u i |  (3.109)
ci ci
Với Bi biểu diễn thành phần cột thứ i của ma trận B. Bây giờ ta phải tìm ra cách
thức để chọn giá trị u*i (t) từ  T  t  Bi .
Với :
u i ui  0
| u i |  (3.110)
u i ui  0
ta có thể viết lại chỉ tiêu chất lượng theo dạng sau :
 1  biT  
  ui ui  0
biT u i  ci 
qi (t) | u i |   (3.111)
ci  1  bi  
T
 c  ui ui  0
 i 
BiT 
Nếu bằng 1, khi đó một vài giá trị không xác định dương của u i (t) sẽ làm qi
ci
BiT 
trong (3.111) bằng zero; nếu bằng -1 khi đó một vài giá trị không xác định âm của
ci
u i (t) sẽ làm qi bằng zero. Do đó bài toán nhiên liệu tối thiểu có luật điều khiển giống như
một bài toán phi tuyến.
Biến trạng thái hồi tiếp là :
116
BiT  (t) / ci  1
 1
nonnegative BiT  (t) / ci  1

u i (t)   0 1  BiT  (t) / ci  1 (3.112)
 nonpositive
 BiT  (t) / ci  1
 1 BiT  (t) / ci  1
Nếu chúng ta định nghĩa hàm vùng chết ( dead zone ) :
 1 w  1
(1;0) w  1

dez(w)   0 1  w  1 (3.113)
 (0;1) w 1

 1 w 1
Ta có thể viết lại bài toán nhiên liệu tối thiểu như sau :
 BiT (t) 
u i (t)  dez   i  1,2,...m (3.114)
 ci 
mỗi thành phần u(t) hoặc bão hòa hoặc bằng zero, ta gọi điều này là luật điều khiển
bang-off-bang .
BiT 
Nếu bằng 1 hoặc –1 vượt quá một khoảng thời gian xác định khác zero. Trong
ci
trường hợp này, nguyên lý cực tiểu sẽ không xác định được các thành phần u i (t) . đây gọi
BiT 
là những khoảng kỳ dị. Nếu bằng 1 hoặc -1 chỉ tại một khoảng thời gian xác định,
ci
đây là bài toán nhiên liệu tối thiểu chuẩn.
Bài toán điều khiển nhiên liệu tối thiểu là chuẩn nếu |A| ≠ 0 và nếu hệ thống là
chuẩn. Có nghĩa là nếu U i được định nghĩa bởi (3.100) là không kỳ dị với i = 1 , … , m .
Nếu bài toán nhiên liệu tối thiểu là chuẩn và bộ điều khiển nhiên liệu tối thiểu tồn
tại , khi đó nó là duy nhất .
*Nhận xét :
Phương pháp biến phân cổ điển Euler_Lagrange thuận lợi khi giải bài toán tối ưu
mà phiếm hàm có dạng phi tuyến, còn tín hiệu điều khiển là những hàm trơn mà ta có thể
dự đoán trước dựa trên bản chất vật lý của chúng. Phương pháp này gặp nhiều khó khăn
khi áp dụng cho các trường hợp mà tín hiệu điều khiển có thể là hàm gián đoạn. Trên thực
tế ta thường gặp bài toán tối ưu mà tín hiệu điều khiển lại là hàm liên tục từng đoạn, cho
nên phương pháp biến phân cổ điển bị hạn chế khả năng sử dụng trong thực tế rất nhiều .
117
Đối với hệ thống gián đoạn tốt nhất ta nên áp dụng phương pháp quy hoạch động
của Bellma, đặc biệt với các bài toán tối ưu phức tạp dùng máy tính số tác động nhanh giải
quyết bằng phương pháp này rất có hiệu quả. Tuy nhiên, do hàm mô tả tín hiệu điều khiển
tìm được theo bảng số liệu rời rạc nên biểu thức giải tích của tín hiệu điều khiển chỉ là gần
đúng. Phương pháp quy hoạch động còn gặp hạn chế khi áp dụng đối với hệ thống liên tục
vì rất khó giải phương trình Bellman.
Nguyên lý cực tiểu Pontryagin áp dụng tốt cho các bài toán tối ưu có điều kiện ràng
buộc bất kể điều kiện ràng buộc cho theo hàm liên tục hoặc hàm gián đoạn. Nhưng đối với
bài toán tối ưu phi tuyến thì nguyên lý cực tiểu Pontryagin lại gặp khó khăn , đặc biệt trong
việc xác định các hàm phụ λi (t) để cho hàm H đạt cực đại .
3.3. ĐIỀU KHIỂN TỐI ƯU CÁC HỆ TUYẾN TÍNH VỚI PHIẾM HÀM DẠNG TOÀN
PHƯƠNG
Trong phần này chúng ta sẽ xem xét phương pháp xây dựng bài toán tổng hợp các
hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương .
3.3.1 Ổn định Lyapunov đối với hệ thống tuyến tính
Tiêu chuẩn ổn định thứ hai của Lyapunov ( điều kiện đủ )
Xét hệ thống được mô tả bởi phương trình trạng thái :
x  f (x1, x 2 ,..., x n )
Nếu tìm được một hàm V(x) với mọi biến trạng thái x1, x 2 ,..., x n là một hàm xác
dV(x)
định dấu dương, sao cho đạo hàm của nó dựa theo phương trình vi phân của chuyển
dt
động bị nhiễu cũng là hàm xác định dấu, song trái dấu với hàm V(x) thì chuyển động không
bị nhiễu sẽ ổn định tiệm cận .
V(x).V(x)  0 : với mọi biến trạng thái x i ,i  1,n hệ thống ổn định tiệm cận.
V(x).V(x)  0 : với mọi biến trạng thái x i ,i  1,n hệ thống ổn định .
V(x).V(x)  0 : với mọi biến trạng thái x i ,i  1,n hệ thống không ổn định.
Phương trình Lyapunov
Xét hệ tuyến tính mô tả bởi phương trình trạng thái (hệ Autonom_hệ tự trị):
x  Ax (3.115)
Yêu cầu cực tiểu hoá chỉ tiêu chất lượng J :

J   x TQxdt (3.116)
0
Với Q là ma trận vuông xác định dương.

Chọn hàm năng lượng V(x) xác định dương : V(x)  x TSx (3.117)
118
trong đó ma trận S là ma trận vuông xác định dương. V(x) có dạng:
V(x)  x TSx  x TSx  x T Sx
 (Ax)T Sx  x TS(Ax)  x T Sx
 x T A TSx  x TSAx  x T Sx
 x T (A TS  x TSA  x T S)
Do V(x) xác định dương, nên để hệ thống ổn định thì V(x) phải là xác định âm. Ta
chọn V(x)   x T Qx (do Q là ma trận xác định dương nên V(x) sẽ là xác định âm )
 Q  (A TS  SA  S) (3.118)
điều kiện cần và đủ để trạng thái cân bằng x = 0 ổn định tiệm cận: cho trước bất kỳ
một ma trận xác định dương Q và ma trận A ổn định, tồn tại một ma trận xác định dương
S thoả mãn phương trình :
A TS  SA  S  Q
(3.119)
  S  A S  SA  Q
T
Phương trình (3.119) được gọi là phương trình Lyapunov .
Khi S không thay đổi theo thời gian S  0 , ta có phương trình đại số Lyapunov :
0  A TS  SA  Q (3.120)
Chỉ tiêu chất lượng J được tính như sau :


J   x T Qxdt   x TSx 0   x T ()Sx()  x T (0)Sx(0)
0
Khi tất cả các phần tử của ma trận A âm, ta có x(∞ )→ 0 . Do đó :

J  x T (0)Sx(0) (3.121)
3.3.2. Điều khiển tối ưu hệ tuyến tính với chỉ tiêu chất lượng dạng toàn phương.
Phương trình Riccati đối với hệ liên tục.
Xét hệ thống có tác động ngoài ( u ≠ 0 ):
x  Ax  Bu (3.122)
Chúng ta cần tìm ma trận K của vector điều khiển tối ưu :
u(t) = −Kx(t) (3.123)
thỏa mãn chỉ tiêu chất lượng J đạt giá trị cực tiểu :
119

J   (x T Qx  u T Ru)dt (3.124)
0
Trong đó Q là ma trận xác định dương (hoặc bán xác định dương), R là ma trận xác
định dương. Chú ý: thành phần thứ hai ở phần bên phải phương trình (3.124) xác định
lượng năng lượng tiêu tốn của tín hiệu điều khiển. Chúng ta sẽ chứng minh luật điều khiển
tuyến tính cho bởi phương trình (3.123) là luật điều khiển tối ưu. Khi đó, nếu ma trận K
được xác định để tối thiểu hoá chỉ tiêu chất lượng J thì luật điều khiển u(t) sẽ tối ưu với
mọi trạng thái ban đầu x(0).
Từ (3.122) và (3.123) ta có :
x  Ax  BKx  (A  BK)x (3.125)

Thay u(t)  Kx(t) vào phương trình (3.124):

J   (x T Qx  x T K T RKx)dt
0
(3.126)

  x T (Q  K T RK)xdt
0
Bây giờ ta chọn hàm năng lượng :

V(x)  x TSx V(x)  0, x (3.127)
với S là ma trận vuông xác định dương .
V(x)  x TSx  x TSx  x TSx
 x T (A  BK)T Sx  x TSx  x TS(A  BK)x (3.128)
 xT (A  BK)T S  S  S(A  BK)  x
Do V(x) xác định dương nên để hệ thống ổn định thì V(x) phải là xác định âm. Ta
đặt :
d T
V(x)  (x Sx)   x T (Q  K T RK)x
dt
(do Q và R là ma trận xác định dương nên ma trận (Q  K T RK) cũng là xác định
dương, từ đó V(x) sẽ là xác định âm ).

 
 x T (Q  K T RK)x   x T (A  BK)T S  S(A  BK)  S x
 
Q  K T RK  (A  BK)T S  S(A  BK)  S (3.129)
120
Theo tiêu chuẩn ổn định thứ hai của Lyapunov, nếu ma trận (A-BK) ổn định thì sẽ
tồn tại một ma trận xác định dương S thoả mãn phương trình (3.129).
Chỉ tiêu chất lượng bây giờ có thể được xác định như sau :


J   (x T Qx  u T Ru)dt   x TSx   x() T Sx()  x(0) T Sx(0)
0
0
Lưu ý rằng x(∞) = 0

=> J  x(0)T Sx(0)
Đặt R  T TT , phương trình (3.129) trở thành :
(A T  K T BT )S  S(A  BK)  S Q  K TT TTK  0

Phương trình trên có thể viết lại như sau :
T
ATS  SA  TK  (TT )1 BTS TK  (TT )1 BTS  SBR 1BTS  Q  S  0 (3.130)
Chỉ tiêu chất lượng J đạt giá trị cực tiểu khi biểu thức :
T
x T TK  (TT )1 BTS TK  (T T ) 1 BTS x
đạt giá trị cực tiểu .
1  a2
Hệ hở: Q=0, u*k  (rN  a N x 0 )a Nk 1
b(1  a )
2N
Hệ ổn định: rN  0
Khi đó:
TK  (T T ) 1 BTS
(3.131)
 K  T  1(T T ) 1 BTS  R 1BTS
Phương trình (3.131) cho ta ma trận tối ưu K. Như vậy, luật điều khiển tối ưu cho
bài toán điều khiển tối ưu dạng toàn phương với chỉ tiêu chất lượng cho bởi phương trình
(3.131) là tuyến tính và có dạng :
u(t)  Kx(t)  R 1BTSx(t) (3.132)
Ma trận S khi đó phải thỏa mãn phương trình (3.130) được viết lại như sau :
ATS  SA  SBR 1BTS  Q   S (3.133)

Phương trình (3.133) được gọi là phương trình Riccati .
Khi S không thay đổi theo thời gian S  0 , ta có phương trình đại số Riccati (ARE
: Algebraic Riccati Equation ) :
A TS  SA  SBR 1BTS  Q  0 (3.134)
121
3.3.3. Phương trình Riccati đối với hệ rời rạc
Xét hệ rời rạc :
x k 1  A k x k  Bk u k (3.135)
Với x k  R n và u k  R m
Chỉ tiêu chất lượng J được định nghĩa trong khoảng [1,N] có dạng :
1 T 1 N1 T
J  x NSN x N   (x K QK x K  u TK R K u K ) (3.136)
2 2 K i
Hàm Hamilton:
1
H K  (x TK Q K x K  u TK R K u K )   TK 1 (A K x K  BK u K ) (3.137)
2
Xét hệ rời rạc và phương trình đồng trạng thái:
H K
x k 1   A K x K  BK u K (3.138)
 K 1
H K
k   Q K x K  A TK  K 1 (3.139)
x K
Điều kiện biên (Stationarity condition):
H K
0  R K u K  BTK  K 1 (3.140)
u K
1 T
Theo (3.140) : u K   R K BK  K 1 (3.141)
Thế u K từ phương trình (3.142) vào phương trình (3.138), ta được:
1 T
x K 1  A K x K  BK R K BK  K 1 (3.142)
Vậy từ (3.142) và (3.139), ta có được:
1 T
x K 1  A K x K  BK R K BK  K 1 (3.143)
 k  Q K x K  A TK  K 1 (3.144)
Từ (3.141) ta có luật điều khiển:
1 T
u K  R K BK  K 1 (3.145)
Trạng thái đầu x(t 0 ) về trạng thái cuối tự do ta có dx(T)  0 và dT  0 vì vậy:

K   SN x N
x N
1 T
Do hàm ma trận trọng lượng có dạng:   x NS N x N
2
Vì k  N , ta có:  K  SK x K (3.146)
1 T
Thế (3.146) vào (3.143) ta được: x k 1  A K x K  BK R K BKSk 1x k 1
1 T
Suy ra: x k 1  (I  BK R K BKSk 1 ) 1 A K x K (3.147)
122
Thế (3.146) vào (3.144) ta được: SK x K  Q K x K  A TKSk 1x k 1
1 T
Thế (3.147)vào: SK x K  Q K x K  A TKSk 1 (I  BK R K BKSk 1 ) 1 A K x K
1 T
đơn giản x K ta được: SK  Q K  A TKSk 1 (I  BK R K BKSk 1 ) 1 A K
Hay: SK  A TK Sk 1  Sk 1BK (BK BTKSk 1  R K ) 1 BTKSk 1  A K  Q K
Phương trình trên chính là phương trình Riccati cho hệ rời rạc. Khi SK ≠ 0 với ∀k
, ta có thể dùng bổ đề ma trận nghịch đảo để viết lại phương trình trên như sau :
SK  A TK (Sk11  BK R K
1 T
BK )A K  Q K
Khi đó, luật điều khiển tối ưu của tín hiệu điều khiển có dạng :
1 T 1 T
u K  R K BK  K 1   R K BKSk 1x k 1 (3.148)
Thế (3.135) vào (3.148):
1 T
u K  R K BKSk 1 (A K x k  BK u k )
1 T 1 T
(I  BK R K BKSk 1 )u K  R K BKSk 1A K x k
Vậy luật điều khiển u K là: u K  (BK BTKSk 1  R K ) 1 BTKSk 1A K x k
độ lợi Kalman được xác định như sau:
K K  (BK BTKSk 1  R K ) 1 BTKSk 1A K
Vì vậy u K có dạng như sau: u K  K k x k (3.149)
Tóm lại:
Xét hệ rời rạc :
x k 1  A K x K  BK u K
Với x k  R n và u k  R m
Chỉ tiêu chất lượng J được định nghĩa trong khoảng [1,N] có dạng :
N 1
J   (x TK QK x K  u TK R K u K )
K i
Khi đó , luật điều khiển tối ưu của tín hiệu điều khiển có dạng :
u k  K k x k
với K k được xác định như sau :
K K  (BK BTKSk 1  R K ) 1 BTKSk 1A K
Trong đó Sk phải thoả mãn phương trình :
Sk  A Tk (Sk 11  Bk R k1BTK )A k  Q k
123
3.3.4. Các bước giải bài toán toàn phương tuyến tính
Bước 1 :
Thành lập hệ phương trình trạng thái :

x  Ax  Bu

 c  Dx
Xác định các thông số A, B, D.
Bước 2 :
Xác định ma trận trọng lượng Q, R từ chỉ tiêu chất lượng J cho dưới dạng toàn
phương tuyến tính .
Bước 3 :
Tìm nghiệm S của phương trình Riccati :
- Đối với hệ liên tục :  S  ATS  SA  SBR 1BTS  Q

- Đối với hệ rời rạc :
SK  A TK Sk 1  Sk 1BK (BK BTKSk 1  R K ) 1 BTKSk 1  A K  Q K
Bước 4 :
Chỉ tiêu chất lượng tối ưu đối với hệ dừng :
J  x T (0)Sx(0)
min
Bước 5 :
Luật điều khiển tối ưu :
- Đối với hệ liên tục : u  R 1BTSx
- Đối với hệ rời rạc : u  (BK BTKSk 1  R K ) 1 BTKSk 1A k x k
*Ví dụ 3.9:
Cho hệ thống như hình vẽ .
Hình 3. 12: Hệ thống điều khiển ví dụ 3.9
Tìm giá trị ζ > 0 sao cho khi tín hiệu vào r(t) = 1(t) thì chỉ tiêu chất lượng đạt cực
tiểu :
124
 2
J  (e   e )dt (  0)
2
(1)
0
Từ hình vẽ ta tìm được:

C(s) 1
 2 (2)
R(s) s  2s  1
hoặc có dạng:
c 2 c c  r (3)
đối với tín hiệu sai lệch e, ta có:
e 2 e e  r  2 r (4)
Với r(t) = 1(t) ta có r(0)  0, r(0)  0 , do đó với t ≥ 0 + ta sẽ có :
e 2 e e  0 , e(0)  0,e(0)  1 (5)

Bây giờ , chúng ta đặt các biến trạng thái như sau :
x=e (6)
x 2  x1  e (7)
Khi đó phương trình trạng thái là :
x1  Ax (8)
0 1 
Với A 
 1 2 
Chỉ tiêu chất lượng J có thể viết lại như sau :
 2 
J  (e   e )dt   (x1  x 2 )dt
2 2 2
0 0

1 0   x1 
   x1 x2      dt
0    x 2 
(9)
0

 x
T
Qxdt
0
Nếu ma trận A ổn định thì chỉ tiêu chất lượng J có thể xác định từ (3.129):
J  x T (0)Sx(0) (10)
với S là nghiệm của phương trình Lyapunov :
ATS  SA  Q (l1)
Phương trình được viết lại như sau :
125
0 1   s11 s12   s11 s12   0 1   1 0 
1 2  s           0   (12)
   21 22   21 22  
s s s 1 2   
Phương trình trên tương đương với hệ phương trình sau :
s 21  s 21  1 (13)
s 22  s11  2s12  0 (14)
s11  2s 21  s 22  0 (15)
s12  2s 22  s 21  2s 22   (16)
Giải hệ phương trình trên ta được :
 1  1 
   4 2 
S  (17)
 1 1  
 2 4 

Chỉ tiêu chất lượng J được viết lại :
J  x T (0)Sx(0)
 1   2 1  2
=   x1 (0)  x1 (0)  x 2 (0)  x 2 (0) (18)
 4  4
Thế các điều kiện đầu x1 (0)  1, x 2 (0)  0 vào (18) ta tìm được :
 1  
J   
4 
(19)

để tìm cực trị của J ta cho đạo hàm của J theo ζ bằng 0 :
J 1 
 1 2  0 (20)
 4
1 
 (21)
2
1 
Xét đạo hàm bậc hai của J theo  tại   :
2
 2J 1  

 2 2 3
1  2
  0 (22)
 1  
3
1 
2  
 2 
1 
Như vậy, chỉ tiêu chất lượng J sẽ đạt cực tiểu tại giá trị tối ưu  
2
J  1  (23)
min
126
* Ví dụ 3.10:
Xác định luật điều khiển tối ưu rời rạc biết hệ thống có đối tượng điều khiển
mô tả bởi phương trình trạng thái sau :
0 1   0 
x(t)    x(t)    u(t) (1)
0 0.1 0.01
N 1
Chỉ tiêu chất lượng : J   (x12k  0.001u 2k ) (2)
k 0
Chu kỳ lấy mẫu T = 0.5 sec, N = 50 .

Ta dễ dàng xác định được phương trình trạng thái hệ rời rạc từ phương trình trạng
thái hệ liên tục :
x k 1  A d x k  Bd u k
y k  Cd x k
1 0.488 0.00123
Với: A d    , Bd  0.00488 ,Cd  1 0
0 0.951  
Nghiệm của bài toán tối ưu được tính theo (3.128) và (3.139):
K k  (BTk Sk 1Bk  R k ) 1 BTk Sk 1A k (3)
Sk  A Tk Sk 1  Sk 1Bk (BTk Sk 1Bk  R k ) 1 BTk Sk 1  A k  Q k (4)
1 0 
Với: A k  Ad , Bk  Bd ,Qk    , R k  0.001
0 0 
Ta tính được K49 = 0 khi biết S50 = 0. Tiếp theo ta tính giá trị S49 :
1 0 
S49  Q49    (5)
0 0 
Tiếp tục với K48 và S48:
1
 1 0  0.00123 
K 48    0.00123 0.00488      0.001 . 0.00123 0.00488.
 0 0  0.00488 
1 0 1 0.488
0 0 0 0.951  1.228 0.599 (6)
  
 1 0   1 0  1 0  0.00123  1 0  0.00123 
S48   
  
      0.00123 0.00488  0 0  0.00488
.  0.001 
0.488 0.951  0 0  0 0  0.00488      
1 0    1 0.488 1 0   0.9985 0.4873
0.00123 0.00488          (7)
0 0    0 0.951 0 0    0.4873 0.2378
Tiếp tục tính toán nhờ máy tính, ta sẽ xác định được với k = 39 ma trận Kk sẽ hội tụ về giá
trị [25 63].Vậy điều khiển tối ưu cuối cùng là:
127
uk    25 63 x k (8)
*Nhận xét
Phương trình Riccati dùng để tổng hợp các hệ tuyến tính với chỉ tiêu chất lượng
dạng toàn phương. Với cách giải quyết này , ta vừa đảm bảo được tính ổn định của hệ thống
( do cách chọn hàm năng lượng V(x) theo tiêu chuẩn ổn định thứ hai của Lyapunov ) , vừa
cực tiểu hoá được chỉ tiêu chất lượng J theo yêu cầu bài toán đặt ra .
Tuy nhiên, có vài điểm ta cần chú ý: đối với bài toán áp dụng phương trình Riccati
thì việc chọn ma trận trọng lượng thích hợp ở chỉ tiêu chất lượng rất quan trọng vì nó ảnh
hưởng rất nhiều đến kết quả tính toán. Bên cạnh đó, khi xét hệ rời rạc phải đảm bảo sự hội
tụ của K k ; nếu không thì cần phải tăng số trạng thái, khi đó khối lượng tính toán cũng tăng
rất nhiều, chỉ phù hợp khi giải bằng máy tính.
3.4. ỨNG DỤNG MATLAB GIẢI BÀI TOÁN TỐI ƯU
3.4.1 Tối ưu hoá tĩnh
Bài toán chỉ tiêu chất lượng dạng toàn phương và điều kiện ràng buộc tuyến tính
trường hợp vô hướng (ví dụ 3.4)
Xét hàm chỉ tiêu chất lượng dạng toàn phương :
1  x 2 y2 
L(x, u)   2  2 
2 a b 
Với điều kiện ràng buộc tuyến tính :
f (x,u) = x + mu – c
Cho a = 3, b = 2, m = 1, c = 1. Với : x(1) = x , x(2) = u. Khi đó bài toán trở thành
tìm giá trị tối thiểu của:
x(1)2 x(2)2
f (x)  
18 8
Với điều kiện ràng buộc: g(x) = x (1) + x (2) −1 = 0
Ở đây ta sẽ sử dụng hàm lsqlin (Optimization Toolbox) với kết quả là giá trị tối ưu
2 2
của x để f (x)  Cx  D đạt giá trị nhỏ nhất ( Cx  D là norm của ma trận vuông [Cx −
D])
Ax  B
Cùng các điều kiện ràng buộc :
Aeq.x  Beq
Cần lập các thông số C, D, A, B, Aeq, Beq để nhập vào theo cú pháp :
x = lsqlin(C, D, A, B, Aeq, beq)
Chương trình :
C = [1/(18^(1/2)) 0;0 1/(8^(1/2))];
D = [0;0];
128
Aeq = [1 1];
Beq = [1];
x = lsqlin(C, D, [], [], Aeq, Beq)
Chúng ta sẽ được kết quả :
x = 0.6923
0.3077
3.4.2. Điều khiển tối ưu cánh tay máy hồi tiếp góc θ
Xét mô hình cánh tay máy hai đoạn như hình :
Hình 3. 13:Mô hình cánh tay máy hai đoạn
Vị trí điểm cuối của cánh tay hai đoạn được cho bởi phương trình sau :
x  L1 cos(1 )  L 2 cos  1  2 
x  L1 sin(1 )  L 2 sin  1  2 
1   A B  T1   E 
Phương trình động lực học :        
2  C D  T2   F 
trong đó T  T1 T2  là tín hiệu điều khiển.
T
Với các trạng thái:

 x1  1

 x 2  x1  1

 x 3  2
x  x  
 4 3 2
 x1  x 2
 x  AT  BT  E
 2

1 2
x3  x 4
 x 4  CT1  DT2  F
129
Chọn chỉ tiêu chất lượng J có dạng:

 
J   12  12   22   22 dt
0
1  e1  K1e1
Với phiếm hàng dạng: 
 2  e 2  K 2e 2

e1  1  1
r
với 
e 2   2   2
r

1r ,  r2 là góc đặt của θ1 , θ2
e1  1   x 2

e 2  2   x 4
e1  1   x 2

e 2  2   x 4
để đảm bảo cực tiểu hoá chỉ tiêu chất lượng J thì T1, T2 là nghiệm của hệ phương
trình sau :
1  1  0

 2   2  0
Giải hệ phương trình trên ta được :
1
 T1   K1A K1B   e1  EK1  x 2 (K1  1) 
 T    K C K D   e  FK  x (K  1) 
 2  2 2   2 2 4 2 
Tín hiệu điều khiển T được tính toán bằng chương trình Giai_PT.m
Chương trình :
Thông số đầu vào cho hệ thống (file thongso.m) :
global m1 m2 L1 L2 a1 a2 I1 I2
m1 = 3.6745;
m2= 1.0184;
L1= 0.6519 ;
L2= 0.6019;
a1= 0.3365 ;
a2= 0.2606;
I1= 0.370 ;
I2= 0.081;
Chương trình tìm tín hiệu điều khiển (file Giai_PT.m) :
function [C]= Giai_PT (theta1, theta2, theta1_dot, theta2_dot, e1, e2)
130
% Nhap thong so cho canh tay
m1 = 3.6745; m2 = 1.0184;
L1 = 0.6519; L2 = 0.6019;
a1 = 0.3365; a2 = 0.2606;
I1 = 0.370; I2 = 0.081;
K1 = 0.5; K2 = 0.8;
m11 = m1*a1*a1+m2*(L1*L1+2*L1*a2*cos(theta2)+a2*a2)+I1+I2;
m12 = m2*a2*(a2+L1*cos(theta2))+I2;
m22 = m2*a2*a2+I2;
n1=m2*L1*a2*sin(theta2)*(2*theta1_dot*theta2_dot+theta2_dot*theta2_dot);
n2 = m2*L1*a2*sin(theta2)*theta1_dot*theta1_dot;
A = [m11 m12; m12 m22];
B = [n1; n2];
A = inv(A);
B = A*B;
A = [K1*A(1,1) K1*A(1,2); K2*A(2,1) K2*A(2,2)];
B = [e1+B(1,1)*K1-theta1_dot*(K1+1); e2+B(2,1)*K2-
theta2_dot*(K2+1)];
C = inv(A)*B;
u1 = C(1,1);
u2 = C(2,1);
Kết quả mô phỏng :
Hình 3. 14: Kết quả mô phỏng vị trí đặt thay đổi theo hàm xung với θ1
131
Hình 3. 15: Kết quả mô phỏng vị trí đặt thay đổi theo hàm xung với θ2
Hình 3. 16:Sơ đồ Simulink cho tay máy hai giai đoạn
3.4.3. Hệ thống tác động nhanh

Cho hệ thống có phương trình trạng thái:
 0 1 1 
x 2  x  0  u u(t)  1
w 0  
- Giải phương trình biến trạng thái. Dùng nguyên lý cực tiểu Pontryagin để tìm luật
điều khiển tối ưu
- Vẽ quỹ đạo pha cho trường hợp u  1 và u  1
132
- Tìm đường cong chuyển đổi và luật điều khiển hồi tiếp cho thời gian tối thiểu
a)
b)
Hình 3. 17: Họ các đường cong tạo ra quỹ đạo trạng thái tối ưu
Xét w = 1
Hình 3.17 mô tả họ các đường tròn ứng với những giá trị khác nhau của k1 và k 2 ,
tức là ứng với những điểm trạng thái ban đầu x(0) = x 0 khác nhau của đối tượng. Chiều
dx1
của các đường tròn này được xác định từ quan hệ  x 2 rằng khi x 2  0 thì x1 phải tăng
dt
và ngược lại khi x 2 <0 thì x1 phải giảm.
Code hình 3.17a:
t=0:pi/100:2*pi; t=0:pi/100:2*pi;
x=1+1*cos(t); % tam (1,0) x=1+2*cos(t); % tam (1,0)
bankinh 1 bankinh 2
y=0+1*sin(t); y=0+2*sin(t);
plot(x,y,'r') plot(x,y,'g')
%--------------- %---------------
hold on hold on
t=0:pi/100:2*pi; y=0+4*sin(t);
x=1+3*cos(t); % tam (1,0) plot(x,y,'b')
bankinh 3 %---------------
y=0+3*sin(t); hold on
plot(x,y,'r--') xlabel('x1')
%--------------- ylabel('x2')
hold on axis([-6 5 -5 5])
t=0:pi/100:2*pi;
x=1+4*cos(t); % tam (1,0)
bankinh 4
133
Code hình 3.17b:
t=0:pi/100:2*pi; y=0+2*sin(t);
x=-1+1*cos(t); % tam (- plot(x,y,'g')
1,0) %---------------
bankinh 1 hold on
y=0+1*sin(t); t=0:pi/100:2*pi;
plot(x,y,'r') x=-1+3*cos(t); % tam (-
%--------------- 1,0)
hold on bankinh 3
t=0:pi/100:2*pi; y=0+3*sin(t);
x=-1+2*cos(t); % tam (- plot(x,y,'r--')
1,0) %---------------
bankinh 2 plot(x,y,'b')
hold on hold on
t=0:pi/100:2*pi; xlabel('x1')
x=-1+4*cos(t); % tam (- ylabel('x2')
1,0) axis([-6 5 -5 5])
bankinh 4
y=0+4*sin(t);
Rõ ràng quỹ đạo trạng thái tối ưu chỉ có thể được tạo ra từ các cung của những
đường tròn.
Hình 3. 18: Quỹ đạo cuối của trạng thái tối ưu
Code hình 3.18:
134
t=0:pi/100:pi; x=-1+1*cos(t); % tam (-
x=-1+1*cos(t); % tam (- 1,0)
1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'r') hold on
hold on t=0:-pi/100:-pi;
t=0:-pi/100:-pi; x=1+1*cos(t); % tam (1,0)
x=1+1*cos(t); % tam (1,0) bankinh 1
bankinh 1 y=0+1*sin(t);
y=0+1*sin(t); plot(x,y,'b')
plot(x,y,'b') xlabel('x1')
xlabel('x1') ylabel('x2')
t=0:pi/100:pi;
Hình 3. 19: Xây dựng đoạn gần cuối của quỹ đạo trạng thái tối ưu
Code hình 3.19:

t=0:pi/100:pi; y=0+2.5*sin(t);
x=-1+1*cos(t); % tam (- plot(x,y,'r')
1,0) hold on
bankinh 1 %--------------
y=0+1*sin(t); t=0:-pi/100:-pi;
plot(x,y,'c') x=1+1*cos(t); % tam (1,0)
hold on bankinh 1
t=0:pi/100:pi; y=0+1*sin(t);
135
x=-3+1*cos(t); % tam (- plot(x,y,'b')
3,0) hold on
bankinh 1 xlabel('x1')
y=0+1*sin(t); ylabel('x2')
plot(x,y,'g') axis([-5 3 -3 3])
hold on grid
%--------------
t=-0.39:pi/100:2.78
x=-1+2.5*cos(t); % tam (-
1,0)
bankinh 2.5
Hình 3. 20: Xây dựng quỹ đạo trạng thái tối ưu
Hình 3. 21: Đường chuyển đổi giá trị của tín hiệu điều khiển tối ưu
136
Code hình 3.20 và hình 3.21:
=0:-pi/100:-pi; hold on
x=1+1*cos(t); % tam (1,0) %--------------
bankinh 1 t=0:-pi/100:-pi;
y=0+1*sin(t); x=3+1*cos(t); % tam (3,0)
plot(x,y,'r') bankinh 1
y=0+1*sin(t); plot(x,y,'r')
plot(x,y,'k') hold on
hold on %--------------
%-------------- t=0:pi/100:pi;
t=0:-pi/100:-pi; x=-5+1*cos(t); % tam (-
x=5+1*cos(t); % tam (5,0) 5,0)
bankinh 1 bankinh 1
y=0+1*sin(t); y=0+1*sin(t);
plot(x,y,'b') plot(x,y,'k')
hold on hold on
%-------------- %--------------
t=0:pi/100:pi; t=0:pi/100:pi;
x=-1+1*cos(t); % tam (- x=-7+1*cos(t); % tam (-
1,0) 3,0)
bankinh 1 bankinh 1
y=0+1*sin(t); y=0+1*sin(t);
plot(x,y,'g') plot(x,y,'b')
hold on hold on
%-------------- %--------------
t=0:pi/100:pi; xlabel('x1')
x=-3+1*cos(t); %tam (- ylabel('x2')
3,0) axis([-10 10 -4 4])
bankinh 1 grid
y=0+1*sin(t);
Tương tự khi ω = 0.5:
Code hình 3.22a:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
137
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
(a) (b)
(c)
Hình 3. 22: Họ các đường tròn tạo ra quỹ đạo trạng thái tối ưu
Code hình 3.22b:

ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
138
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
Code hình 3.22c:
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1-(1/0.5^2))^2-16')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-4')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-8')
hold on
ezplot('(x2^2)/(0.5^2)+(x1+(1/0.5^2))^2-16')
hold on
%-----------------------------
xlabel('x1')
ylabel('x2')
axis([-10 10 -3 3])
grid
139
Hình 3. 23: Quỹ đạo cuối của trạng thái tối ưu
Code hình 3.23:

t=0:pi/100:pi; y=2*sin(t);
x=4*cos(t); plot(x,y,'b')
x=x-4; hold on
y=2*sin(t); xlabel('x1')
plot(x,y,'r') ylabel('x2')
hold on axis([-10 10 -5 5])
t=-pi:pi/100:0; grid
x=4*cos(t);
x=x+4;
Hình 3. 24:Xây dựng đoạn gần cuối của quỹ đạo trạng thái tối ưu
140
Code hình 3.24:
t=0:-pi/100:-pi; x=x-12;
x=4*cos(t); y=2*sin(t);
x=x+4; plot(x,y,'g')
y=2*sin(t); hold on
plot(x,y,'k') t=-0.505:pi/100:2.649
hold on x=8*cos(t);
t=0:pi/100:pi; x=x-4;
x=4*cos(t); y=4*sin(t);
x=x-4; plot(x,y,'b')
y=2*sin(t); hold on
plot(x,y,'r') xlabel('x1')
hold on ylabel('x2')
t=0:pi/100:pi; axis([-20 20 -10 10])
x=4*cos(t); grid
Câu 1: Trình bày phương pháp biến phân cổ điển Euler_Lagrange cho các trường
hợp: không có điều kiện ràng buộc , có điều kiện ràng buộc và khi tín hiệu đầu vào bị hạn
chế .
Câu 2: Phát biểu nguyên lý tối ưu của Bellman . Trình bày ý tưởng giải quyết bài
toán tối ưu của phương pháp quy hoạch động .
Câu 3: Trình bày nguyên lý cực tiểu của Pontryagin
Câu 4: Chứng minh ma trận Q là ma trận xác định dương:
Q  x12  4 x22  x32  2 x1 x2  6 x2 x3  2 x1 x3
Câu 5: Chứng minh ma trận Q là ma trận xác định âm:

Q   x12  3x22  11x32  2 x1 x2  4 x2 x3  2 x1 x3
Câu 6: Viết một số hàm Lyapunov cho hệ thống sau:
 x1   1 1   x1 
 x    2 3  x 
 2   2
Xác định tính ổn định của hệ thống.
Câu 7 : Tìm điểm (x,y) thuộc parabol :
y  x 2  3x  6
sao cho khoảng cách từ (x , y) đến điểm có toạ độ (2,2) là ngắn nhất . Tính khoảng
cách đó .
141
Câu 8: Cho hệ thống :
 2 2 1 
x  x   u
1 0  3
Tìm các giá trị tối ưu x* u* L* thoả mãn cực tiểu chỉ tiêu chất lượng :
1 T 1 0  1  2 1
L x   x  uT 
2 1 1
u
2 0 2 
Câu 9: Cho hệ thống :
d2y
u
dt 2
Tìm tín hiệu điều khiển u thoả mãn cực tiểu chỉ tiêu chất lượng :
1 
1
J    u 2   u  dt
1  
2
với các điều kiện đầu :
y (1)  y (1)  0
y (1)  y (1)  0
142
CHƯƠNG 4
ĐIỀU KHIỂN BỀN VỮNG
Cung cấp cho sinh viên các kiến thức về:
- Khái niệm về điều khiển bền vững
- Các tiêu chuẩn của tín hiệu và định lý về độ lớn
- Phương pháp LQG
4.1. GIỚI THIỆU
4.1.1 Khái niệm điều khiển bền vững
Hệ thống điều khiển bền vững làm cho chất lượng của sản phẩm luôn ổn định, không
phụ thuộc vào sự thay đổi của đối tượng cũng như của nhiễu tác động lên hệ thống. Mục
đích của điều khiển bền vững là thiết kế các bộ điều khiển K duy trì ổn định bền vững
không chỉ với mô hình danh định của đối tượng (P0) mà còn thỏa với một tập mô hình có
sai số so với mô hình chuẩn ( P ).
P0 :Mô hình chuẩn ( mô hình danh định)
P : Mô hình thực tế với sai lệch
 so với mô hình chuẩn
Hình 4. 1: Mô hình điều khiển bền vững

Cho tập mô hình có sai số P và một tập các chỉ tiêu chất lượng, giả sử P0  P là
mô hình danh định dùng để thiết kế bộ điều khiển K. Hệ thống hồi tiếp vòng kín được gọi
là:
- Ổn định danh định: nếu K ổn định nội với mô hình danh định P0
- Ổn định bền vững: nếu K ổn định nội với mô hình thuộc P
- Chất lượng danh định: nếu các mục tiêu chất lượng được thỏa đối với mô hình
danh định P0
143
- Chất lượng bền vững: nếu các mục tiêu chất lượng được thỏa đối với mô hình
thuộc P
Mục tiêu bài toán ổn định bền vững là tìm bộ điều khiển không ổn định mô hình
danh định P0 mà còn ổn định một tập các mô hình có sai số P
4.1.2 Chuẩn của tín hiệu
a) Khái niệm chuẩn
Trong điều khiển nói riêng cũng như trong các công việc có liên quan đến tín hiệu
nói chung, thông thường ta không làm việc chỉ riêng với một tín hiệu hoặc một vài tín hiệu
điển hình mà ngược lại phải làm việc với một tập gồm rất nhiều các tín hiệu khác nhau.
Khi phải làm việc với nhiều tín hiệu khác nhau như vậy chắc chắn ta sẽ gặp bài toán so
sánh các tín hiệu để chọn lọc ra được những tín hiệu phù hợp cho công việc.
Các khái niệm như tín hiệu x1(t) tốt hơn tín hiệu x2(t) chỉ thực sự có nghĩa nếu như
chúng cùng được chiếu theo một tiêu chuẩn so sánh nào đó. Cũng như vậy nếu ta khẳng
định rằng x1(t) lớn hơn x2(t) thì phải chỉ rõ phép so sánh lớn hơn đó được hiểu theo nghĩa
nào, x1(t) có giá trị cực đại lớn hơn, có năng lượng lớn hơn hay x1(t) chứa nhiều thông tin
hơn x2(t)…..Nói một cách khác ,trước khi so sánh x1(t) với x2(t) chúng ta phải gắn cho mỗi
một tín hiệu một giá trị đánh giá tín hiệu theo tiêu chuẩn so sánh được lựa chọn .
Định nghĩa: Cho một tín hiệu x(t) và một ánh xạ x(t) → x(t)  R  chuyển x(t)
thành một số thực dương ||x(t)||. Số thực dương này sẽ được gọi là chuẩn của x(t) nếu nó
thỏa mãn:
a. ||x(t)|| ≥ 0 và ||x(t)|| = 0 khi và chỉ khi x(t) =0 (4.1)
b. ||x(t)+y(t)|| ≤ ||x(t)|| + ||y(t)||  x(t), y(t) (4.2)
c. ||ax(t)|| = |a|.||x(t)|| x(t) x(t) và a  R (4.3)
b) Một số chuẩn thường dùng trong điều khiển cho một tín hiệu x(t):

- Chuẩn bậc 1: x(t) 1   x(t)dt (4.4)



2
- Chuẩn bậc 2: x(t) 2  x(t) dt (4.5)

Bình phương chuẩn bậc hai chính là giá trị đo năng lượng của tín hiệu x(t)


p
- Chuẩn bậc p: x(t) p
p x(t) dt với p  N (4.6)

- Chuẩn vô cùng: x(t) 
 sup x(t) (4.7)
Đây là biên độ hay đỉnh của tín hiệu
144
Khái niệm chuẩn trong định nghĩa trên không bị giới hạn là chỉ cho một tín hiệu x(t) mà
còn được áp dụng được cho cả vector tín hiệu gồm nhiều phần tử và mỗi phần tử lại là một tín
hiệu.
Xét một vector tín hiệu:
 x1 (t) 
 
 . 

x(t)  x(t)  . 
 
. 
 x (t) 
 n 
- Chuẩn 1 của vector x:
n
x 1   xi (4.8)
i 1
- Chuẩn 2 của vector x:

n 2
x2  xi (4.9)
i 1
- Chuẩn vô cùng của vector x:
x 
 max x i (4.10)
i 1,2,...n
b) Quan hệ của chuẩn với ảnh Fourier và ảnh Laplace

Để phục vụ mục đích sử dụng khái niệm chuẩn vào điều khiển, ta cần quan tâm tới
mối liên quan giữa chuẩn tín hiệu x(t) là ||x(t)|| với ảnh Fourier X( j) cũng như ảnh
Laplace X(s) của nó.
Định lí 4.1: (Parseval) Chuẩn bậc hai của một tín hiệu x(t) và ảnh Fourier X( j)
của nó có quan hệ:
 
1
x(t)   x(t) dt   X( j ) d
2 2 2
(4.11)
2

2 
Cho tín hiệu nhân quả causal x(t). Gọi X(s) là ảnh Laplace của nó. Giả sử rằng X(s)
có dạng thực - hữu tỷ với bậc của đa thức tử số không lớn hơn bậc đa thức mẫu số, tức là:
B(s) b0  b1s  ...  b ms m
X(s)   với m<n (4.12)
A(s) a 0  a1s  ...  a ns n
Định lí 4.2: Xét tín hiệu nhân quả causal x(t) có X(s) dạng (4.12). Để chuẩn bậc 1
của x(t) là một số hữu hạn ||x(t)||1= K < thì điều kiện cần và đủ là tất cả các điểm cực của
X(s) phải nằm bên trái trục ảo (có phần thực âm) .
145
4.1.3 Đại số ma trận
a) Một số ma trận thường gặp:
- Một ma trận A=(aij) có số hàng bằng số cột được gọi là ma trận vuông. Đường
chéo nối các phần tử aii trong ma trận vuông được gọi là đường chéo chính. Đường chéo
còn lại được gọi là đường chéo phụ.
 a11 a12 ... a1n 
a a 22 ... a 2n 
A   21  (4.13)
 ... ... ... ... 
 
a n1 a n 2 ... a nn 
- Một ma trận vuông A=(aij) có aij = 0 khi i ≠ j ,tức là các phần tử không nằm trên
đường chéo chính đều bằng 0, được gọi là ma trận đường chéo. Ma trận đường chéo được
ký hiệu bởi:
a11 0 ... 0
0 a ... 0 
A 22   diag(a ) (4.14)
 ... ... ... ...  ij
 
0 0 ... a nn 
1 0 ... 0 
0 1 ... 0 
- Một ma trận chéo I= diag(1)    gọi là ma trận đơn vị
... ... ... ...
 
0 0 ... 1 
- Ma trận vuông A=(aij) có aij = 0 khi i > j (hoặc i < j) được gọi là ma trận tam giác.
+ Ma trận tam giác dưới
 a11 0 ... 0
a a 22 ... 0 
A   21  (4.15)
 ... ... ... ... 
 
a n1 a n 2 ... a nn 
+ Ma trận tam giác trên
a11 a12 ... a1n 
0 a ... a 2n 
A 22  (4.16)
 ... ... ... ... 
 
0 0 ... a nn 
146
b) Các phép tính về ma trận:
- Phép cộng / trừ: Cho hai ma trận A=(aij) và B=(bij) cùng có m hàng và n cột Tổng
hay hiệu A ± B = C =(cij) của chúng được định nghĩa là một ma trận cũng có m hàng và n
cột với các phần tử
cij = aij + bij i=1,2,…..,m và j=1,2,…..,n.
- Phép nhân với số thực: Cho ma trận A=(aij) có m hàng và n cột và một số vô hướng
thực(phức) x tùy ý .Tích B = xA = Ax = (bij) được hiểu là ma trận cũng có m hàng và n cột
với các phần tử
Bij = x.aij i=1,2,….m và j=1,2,…..,n
-Phép chuyển vị: Ma trận chuyển vị của ma trận A=(aij) với m hàng và n cột là ma
trận AT = (aji) có n hàng và m cột được tạo từ ma trận A qua việc hoán chuyển hàng thành
cột và ngược lại cột thành hàng.
- Phép nhân ma trận: Cho ma trận A=(aik) có m hàng và p cột và ma trận B=(bkj) có
p hàng và n cột ,tức là:
+ A=(aik) i=1,2, ,m và k=1,2,….,p
+ B=(bkj) k=1,2,….,p và j=1,2,…,n
Tích AB = C =(cij) của chúng là một ma trận có m hàng và n cột với các phần tử
p
Cij   a ik b kj
k 1
Một ma trận vuông A  R nxn được gọi là ma trận trực giao nếu AT A  AAT  I
c) Hạng của ma trận
Cho n vector vi n  1,2,...,n chúng sẽ được gọi là độc lập tuyến tính nếu đẳng thức
a1v1  a 2 v2  ...  a n v n  0 trong đó ai là những số thực (hoặc phức) sẽ đúng khi và chỉ
khi a1 = a2 = …..=an = 0
Xét một ma trận A=(aij) bất kì có m hàng và n cột. Nếu trong số m vector hàng có
nhiều nhất p ≤ m vector độc lập tuyến tính và trong số n vector cột có nhiều nhất q ≤ n
vector độc lập tuyến tính thì hạng ma trận đươc hiểu là:
Rank(A) = min{p,q}
Một ma trận vuông A kiểu (nxn) sẽ được gọi là không suy biến nếu Rank(A)=n.
Ngược lại nếu Rank (A)<n thì A được nói là ma trận suy biến. Hạng ma trận có các tính
chất sau:
- Rank(A) = min{p,q} (4.17)
- Rank(AB) ≤ rank(A) và rank(AB) ≤ rank(B) (4.18)
- Rank(A + B) ≤ rank(A) + rank(B) (4.19)
147
- Nếu B không suy biến thì rank(AB) = rank(B) (4.20)
c) Ma trận nghịch đảo:

Cho ma trận A=(aij),i=1,2,…,m ; j=1,2,…,n,trong đó aij là những số thực hoặc
phức), nói cách khác A  R hoặc A  C
mxn mxn
. Nếu tồn tại một ma trận B thỏa mãn :
AB=BA=I (ma trận đơn vị ) (4.21)
Thì ma trận B được gọi là ma trận nghịch đảo của A và ký hiệu B= A 1
Do phải tồn tại cả hai phép nhân AA-1 và A-1A cho ra kết quả có cùng kiểu nên ma
trận A phải là một ma trận vuông, tức là phải có m = n. Hơn nữa do det(I)  1  0 và
det(A  1)  0 nên:
det(A)det(A  1)  0  det(A)  0 và det(A  1)  0 (4.22)
Vậy A phải là ma trận không suy biến. Ma trận nghịch đảo A-1 của A có tính chất
sau:
- Ma trận nghịch đảo A-1 của A là duy nhất (4.23)
- Tập hợp tất cả các ma trận vuông cùng kiểu và không suy biến cùng với phép nhân
ma trận tạo thành một nhóm (không giao hoán). (4.24)
a b  1  d b 
- Nghịch đảo ma trận (2x2): A 1       (4.25)
 c d  det(A)  c a 
1
- (AB)  B1A 1 (4.26)
1 T T 1
- (A )  (A ) (4.27)
1
- Nếu A  diag(a i ) và không suy biến thì A 1  diag   (4.28)
 ai 
1 A adj
-A  (4.29)
det(A)
trong đó A adj là ma trận có các phần tử a ij  (1)i j det(Aij ) với Aij là ma trận thu
được từ A bằng cách bỏ đi hàng thứ j và như cột thứ i.
- Cho ma trận A  R không suy biến . Nếu U  R nxn và V  R nxn là hai ma trận
nxn
làm cho (I  V T A 1U) cũng không suy biến thì:

(A  UV T ) 1  A 1  A 1U(I  V T A 1U) 1 V T A 1 (4.30)
 A1 A 2 
- Cho ma trận vuông A    không suy biến, trong đó A1 , A 2 , A3 , A 4 cũng là
 A 3 A 4 
ma trận
Nếu A1 không suy biến và B  A 4  A3A11A 2 cũng không suy biến thì
148
1
1 A A2   A11  A11A 2B1A3A11 A11A 2B1 
 1   (4.31)
A 4 
A
 A3  B1A3A11 B1 
Nếu A 4 không suy biến và C  A1  A 2A 41A3 cũng không suy biến thì
1
1 A A2   C1 C1A 2A 4 1 
 1  
A 4 
A (4.32)
1 1
 A3  A 4 A3AC A 41  A 41A3C1A 2A31 
d) Vết của ma trận:
Cho ma trận vuông A=(aij), i, j=1,2,……,n kiểu (nxn).Vết của A được hiểu là tổng
giá trị các phần tử trên đường chéo chính của A và được ký hiệu bằng trace(A):
m
trace   a ii (4.33)
i 1
Vết của ma trận có các tính chất:

+ trace(AB) = trace(BA) (4.34)
+ trace(S-1AS) = trace(A) với S là ma trận không suy biến bất kì (4.35)
e) Giá trị riêng và vector riêng:
Số thực  được gọi là giá trị riêng và vector x được gọi là vector riêng bên phải ứng
với giá trị riêng  của A thỏa mãn:
Ax  x x (4.36)
(A  I)x  0 x (4.37)
Giá trị riêng và vector riêng của ma trận A có những tính chất sau:
- Hai ma trận tương đương A và S-1AS luôn cùng giá trị riêng, nói cách khác giá trị
riêng của ma trận bất biến với phép biến đổi tương đương:
det(A   I)  det(S1AS   I) (4.38)
- Các giá trị riêng của ma trận bất biến với phép chuyển vị, tức là:
det(A   I)  det(A T   I) (4.39)
- Nếu A không suy biến thì AB và BA có cùng các giá trị riêng ,tức là:
det(AB   I)  det(BA   I) (4.40)
- Nếu A là ma trận đối xứng (AT=A) thì các vector riêng ứng với những giá trị riêng
khác nhau sẽ trực giao với nhau
Trong Matlab, sử dụng hàm eig(A) để tìm ma trận riêng và vector riêng.
f) Tính toán ma trận
Cho ma trận X  (x ij )  Cmxn là một ma trận thực (hoặc phức) và Fx  C là một vô
hướng thực hoặc phức của X. Đạo hàm của F(X) đối với X được định nghĩa :
149
   
F(X)   F(X  (4.41)
X  x ij 
Cho A và B là những ma trận phức với không gian tương thích .Một số công thức
đạo hàm :

Trace(AXB)  AT BT (4.42)
X

Trace(X k )  k(X k 1)T (4.43)
X

Trace(XBXT )  2XB (B  BT ) (4.44)
X

Trace(XT AX)  AX  AT X (4.45)
X

Trace(AXT B)  BA (4.46)
X
g) Chuẩn của ma trận:
Người ta cần đến chuẩn của ma trận là nhằm phục vụ việc khảo sát tính giải tích của
nó. Có nhiều chuẩn khác nhau cho một ma trận A=(aij) i=1,2,…,m;j=1,2,…,n.
Những chuẩn thông thường được sử dụng:
- Chuẩn 1 của ma trận A
m
A 1  max  a ij (4.47)
1 jn
i 1
- Chuẩn 2 của ma trận A

A 2  max i (AA) (4.48)
1 jn
- Chuẩn vô cùng của ma trận A

n
A 
 max  a ij (4.49)
1i  m
j1
- Chuẩn Euclide của ma trận A (chuẩn Frobenius)

2
A F
  a ij  trance(A T A) (4.50)
i j

Với A là ma trận chuyển vị và lấy liên hiệp i (AA) là giá trị riêng của ma trận
AA là một số thực không âm.
4.1.4. Trị suy biến của ma trận – độ lợi chính ( Princical gain)
Trị suy biến của ma trận A (m  l) được ký hiệu là  i (A) được định nghĩa như sau:
150
 i (A)  i (AA) i=1,2,…,k (4.51)
Với k=min{m,l}
Nếu chúng ta biểu diễn ma trận A dưới dạng A(s) và đặt s  j (0    ) , thì trị
suy của biến A( j ) là một hàm của  và được gọi là độ lợi chính của A(s) . Ở đây chúng
ta giả sử rằng  i được sắp xếp theo thứ tự sao cho  i   i1 . Như vậy  i là trị suy biến
lớn nhất. Kí hiệu  là trị suy biến lớn nhất và  là trị suy nhỏ nhất.
Ta có:
 (A)  max  (A)  max i (AA)  A 2
(4.52)
Ax
với A 2
 sup 2
x 2
Độ lợi của hệ đa biến nằm giữa độ lợi chính lớn nhất và nhỏ nhất.
Trong Matlab tìm trị suy biến của ma trận A dùng lệnh svd(A)
4.1.5. Ổn định nội
Ổn định nội là yêu cầu cơ bản đối với một hệ thống hồi tiếp thực. Ý nghĩa của ổn
định nội là khi đầu vào hệ thống bằng không thì tất cả các trạng thái hệ thống đều phải về
không từ mọi giá trị ban đầu. Mọi hệ thống tự động đều phải bảo đảm ổn định nội mới hoạt
động được.
Hình 4. 2: Sơ đồ hệ thống dùng để phân tích ổn định nội
Định nghĩa:
Hệ hồi tiếp hình 4.2 được gọi là ổn định nội nếu tất cả các hàm truyền đạt từ w1, w2
đến e1, e2 đều ổn định. Điều kiện ổn định nội chặt hơn điều kiện ổn định dựa trên hàm
truyền vào- ra thông thường, vì nó tránh việc khử các cực và zero không ổn định giữa các
khâu liên tiếp nhau. Khi thành lập hàm truyền vào-ra, có thể xảy ra hiện tượng khử cực và
zero không ổn định của các khâu liên tiếp nhau. Như vậy, điều kiện ổn định nội bảo đảm
các tín hiệu bên trong hệ thống đều hữu hạn khi tín hiệu vào là hữu hạn.
Ví dụ, ta khảo sát điều kiện ổn định nội của hệ thống hình 4.2:
151
e1  1  Ke2  1  K2  KGe1
 e1  (I  KG) 11  (I  KG) 1 K2
e2  2  Ge1  2  G1  (I  GK) 12
1
 e1   (I  KG) (I  KG) 1 K   1 
Suy ra:      
 2  (I  GK) G (I  GK)  2 
e 1 1
Điều kiện ổn định nội của hệ là hàm truyền:

(I  KG) 1,(I  KG) 1 K,(I  GK) 1G,(I  GK) 1 đều ổn định
4.1.6. Định lý độ lợi nhỏ ( Small Gain Theorem)
Cho hệ thống được biểu diễn như hình 4.3, gọi  i là trị riêng của G
Hình 4. 3: Hệ thống hồi tiếp vòng kín

Định lý độ lợi nhỏ được phát biểu như sau: Giả thiết rằng G(s) ổn định, (G( j))
là bán kính phổ của G( j ) . Hệ thống vòng kín ổn định nếu  (G( j ))  max( i )  1 ,
hoặc G( j ) 
 1, 
Đối với hệ SISO thì
 (G( j ))  G( j )  1 (4.53)
Định lý độ lợi nhỏ chỉ là điều kiện đủ để xét ổn định của hệ thống. Điểm mạnh của
định lí này là nó không yêu cầu những thông tin chi tiết về hệ thống. Vì vậy nó không chỉ
ứng dụng được cho hệ thống tuyến tính bất biến theo thời gian mà còn ứng dụng được cho
hệ thống phi tuyến, thay đổi theo thời gian.
4.1.7. Ổn định bền vững
Định lý ổn định bền vững
Hình 4. 4: Sơ đồ cấu trúc phân tích ổn định bền vững
152
Đây là mô hình cơ bản dùng để phân tích tính ổn định bền vững của một hệ thống.
Nếu hệ danh định ổn định thì M ổn định và  là sai số có thể làm cho hệ thống mất ổn
định. Định lý sau thiết lập điều kiện của M để cho hệ thống vẫn ổn định dưới ảnh hưởng
của 
Định lý ổn định và bền vững:
Giả sử M và  ổn định, hệ thống vòng kín hình 4.4 sẽ ổn định khi và chỉ khi biểu
đồ cực của đường cong Nyquist det(I  M) không bao điểm gốc. Khi đó hệ thống vòng
kín sẽ ổn định bền vững với mọi ( ()  1) nếu và chỉ nếu khi một trong các điều kiện
sau thỏa mãn:
- Det(I  M( j )  0,  , (  1) (4.54)
-  (M( j ))  1,  , (  1) (4.55)
- M 
  (M( j ))  1,  (4.56)
- Điều kiện ổn định bền vững đối với sai số cộng:

Với  A (s)   A (s)(s), (( j ))  1 (4.57)
Hình 4. 5: Sai số cộng
Ta có: v(s)  K(s)[ A (s)(s)  G(s)v(s)] (4.58)

Hay
v(s)  [I  K(s)G(s)]1 K(s) (s) (s) (4.59)
Vậy
K(s) A (s)
M(s)   (4.60)
[I  K(s)G(s)]
Kết luận: Hệ thống vòng kín hình 4.5 ổn định bền vững khi và chỉ khi:
K(s) A (s)
 ( j )  M(s) 
 1 (4.61)
[I  K(s)G(s) 
- Điều kiện ổn định bền vững đối với sai số nhân ở đầu ra
153
Hình 4. 6: : Sai số nhân ở đầu ra
Với  0 (s)   0 (s)(s),  ( ( j ))  1 (4.62)

Ta có:
v(s)  G(s)K(s)[ 0 (s) (s)  v(s)] (4.63)
Hay
v(s)  [I  G(s)K(s)]1G(s)K(s) 0 (s) (s) (4.64)
Vậy
G(s)K(s) 0 (s)
M (4.65)
I  G(s)K(s)
Kết luận: Hệ thống vòng kín hình 4.6 ổn định bền vững khi và chỉ khi:
G(s)K(s) 0 (s)
1 (4.66)
I  G(s)K(s) 
4.2. PHƯƠNG PHÁP LQG (Linear Quadratic Gaussian)

4.2.1 Đặt vấn đề
Cho hệ thống
.
x(t)  Ax(t)  Bu(t)   (t)
y(t)  Cx(t)  v(t) (4.67)
z(t)  Dx(t)
tR
Ngõ ra y là ngõ ra hồi tiếp và đo được. Ngõ ra z là điều khiển được. Tín hiệu nhiễu
w là nhiễu hệ thống và v là nhiễu đo .
Tín hiệu v và w là những quá trình nhiễu trắng. Trạng thái ban đầu của x(0) được
giả sử là một vector ngẫu nhiên.
Biến trạng thái x(t) Rn, ngõ ra đo được y(t) Rp và ngõ ra điều khiển được z(t) Rm
là những quá trình ngẫu nhiên. Biểu thức sai số toàn phương:
z T (t)Qz(t)  u T (t)Ru(t), t  0 (4.68)
là một quá trình ngẫu nhiên .
154
Vấn đề của điều khiển hệ thống là giá trị mong đợi của tích phân là nhỏ:
T
 E[z (t)Qz(t)  u T (t)Ru(t)]dt

T
(4.69)
0
Đây là vấn đề điều khiển tuyến tính nhiễu loạn. Khoảng thời gian [0 T] là xác định
nhưng thật sự chúng ta xem xét trường hợp T   . Tại bất kỳ thời gian t toàn bộ tín hiệu
đo được ở quá khứ được giả sử có giá trị cho hồi tiếp. Hình (4.7) làm rõ trường hợp này :
Hình 4. 7: Hồi tiếp LQG
4.2.2. Bộ quan sát

Xem xét hệ thống quan sát:

x(t)  Ax(t)  Bu(t)
y(t)  Cx(t) (4.70)
x(t)  R n
Đây là hệ thống (4.67) nhưng không có nhiễu hệ thống w và nhiễu đo v. Trạng thái
x của hệ thống (4.70) không thể sử dụng được trực tiếp bởi vì chỉ ngõ ra y là đo được. Xây
dựng lại trạng thái với sự chính xác tùy ý bởi việc kết nối một bộ quan sát :

x(t)  Ax(t)  Bu(t)  L[y(t)  Cx(t)], t  R (4.71)

Tín hiệu x̂(t) là một ước lượng của trạng thái x(t). Nó thỏa mãn phương trình
vi phân trạng thái của hệ thống (4.70) với thành phần thêm vào L[ y(t) Cx̂(t)]. L là ma
trận độ lợi quan sát cần được lựa chọn phù hợp. Sai số quan sát y(t) Cx̂(t) là sự khác
nhau giữa ngõ ra đo được thực tế y(t) và ngõ ra ŷ(t) Cx̂(t) .Thành phần thêm vào L[
y(t) Cx̂(t)] cung cấp một sự điều chỉnh chủ động ngay khi sai số của sự quan sát là khác
0.
155
Hình 4. 8: Cấu trúc của một bộ quan sát
Hình 4.8 cho thấy cấu trúc của bộ quan sát định nghĩa
x(t)  x(t)  x(t) (4.72)
là sai số ước lượng trạng thái. Phương trình vi phân của x nhận được sau khai trừ (4.70)
cho (4.71):

x(t)  (A  LC)x(t), t  R (4.73)
Nếu hệ thống (4.70) được tìm thấy thì tồn tại ma trận độ lợi L mà sai số hệ thống
(4.73) là ổn định. Nếu sai số hệ thống là ổn định thì x(t)  0 khi t   cho bất kỳ sai số
x(0) . Vì vậy
t 
x(t)   x(t) (4.74)
Trạng thái ước lượng hội tụ về trạng thái thực
Trong Matlab dùng hai lệnh acker và place để tính toán ma trận L của khâu quan sát
trạng thái:
L  ac ker(A T , CT , p)
L  place(A T , CT , p)
AT :Chuyển vị của ma trận A
CT : Chuyển vị của ma trận C
P: Khai báo các điểm cực mong muốn
4.2.3. Bộ lọc Kalman
a) Đặt vấn đề:
Bộ lọc Kalman là một bộ quan sát được sử dụng cho các ứng dụng yêu cầu xây dựng
lại hệ phương trình trạng thái khi tính đến ảnh hưởng của nhiễu đo được.
Phương trình trạng thái của đối tượng :
x  Ax  Bu  w (4.75)
y  Cx  v (4.76)
156
Với trạng thái x  t   R n , ngõ vào điều khiển u  t   R m , ngõ ra đo lường y  t   R p
Tín hiệu w  t  là nhiễu quá trình chưa biết trước tác động làm nhiễu hệ thống. Tín hiệu
v  t  là một nhiễu đo không xác định được, làm suy giảm việc đo lường chẳng hạn như
nhiễu cảm biến. Giá trị ban đầu x  0  , nhiễu w  t  hoặc v  t  không biết được chính xác.
Giả sử x  0  , w  t  và v  t  đều trực giao qua lại lẫn nha
w(t) v(t)

u x& x y
B ∫ C
A Hệ thống
~y
L
-
x&ˆ xˆ yˆ
B ∫ C
A Bộ lọc Kalman
Hình 4. 9: Bộ quan sát trạng thái của Kalman
Gọi x̂  t  là ước lượng của x

Phương trình trạng thái của khâu lọc Kalman:
xˆ  Axˆ  Bu  L(y  y)
ˆ
(4.77)
yˆ  Cxˆ
Mục tiêu thiết kế bộ lọc Kalman: Tìm độ lợi ước lượng L để có sự ước lượng tối ưu
trong sự hiện diện của nhiễu w  t  và v  t 
Sai số ước lượng: x  t   x  t   x(t)
ˆ (4.78)
Độ lợi L sẽ được chọn sao cho giá trị trung bình của sai số ước lượng toàn phương
là bé nhất
157
b) Cơ sở toán học:
Lý thuyết xác suất:
Từ phương trình (4.75) được thêm vào bởi nhiễu quá trình, trạng thái x(t) bấy giờ
cũng là một quá trình ngẫu nhiên như là y(t). Để khảo sát những đặc tính thông thường của
quá trình ngẫu nhiên cần nhắc lại một số khái niệm lý thuyết xác xuất (Papoulis 1984).
Mặc dù w  t  và v  t  là những đại lượng ngẫu nhiên không biết được, nhưng cần biết một
vài đặc điểm để hỗ trợ việc thiết kế các bộ điều khiển. Chẳng hạn như có thể biết được giá
trị trung bình hoặc tổng năng lượng của chúng.
Cho vector ngẫu nhiên z  R , f z    là hàm mật độ xác suất (PDF) của z.
n
Đại lượng PDF đặc trưng cho xác suất mà z lấy giá trị bên trong vùng vi phân d
đặt giữa  .
Giá trị mong muốn của hàm g(z) của vector ngẫu nhiên được xác định như sau:

E g(z)   g()f ()d (4.79)

Giá trị trung bình hay mong muốn của z được xác định như sau:

E z   f z ()d (4.80)

Được kí hiệu bằng z . Chú ý rằng z  R

n
Hiệp phương sai của z đươc cho bởi


Pz  E (z  z)(z  z)T  (4.81)
Chú ý rằng Pz là ma trận hằng n  n

Phần quan trọng của vector ngẫu nhiên được đặc trưng bởi Gausian hoặc nomal
PDF
1 /2P 1 (  z )/2
e( z )
T
f z ()  (4.82)
 2 
n
Pz
Trong trường hợp vô hướng n=1, (4.82) trở thành:
1   z 2 /2Pz
fz    e (4.83)
2 Pz
Được minh họa ở hình 4.10. Vì vậy những vector ngẫu nhiên lấy giá trị gần với z
có xác suất lớn nhất và xác suất sẽ giảm khi lấy giá trị xa z . Nhiều biến ngẫu nhiên là
Gaussian.
158
fz( )
Hình 4. 10: Gaussian PDF
Nếu vector ngẫu nhiên là một hàm của thời gian được gọi là một quá trình ngẫu
nhiên được tượng trưng là z(t). Khi đó PDF có thể thay đổi theo thời gian và chúng ta viết
f z  , t  . Điều đó có thể tưởng tượng rằng PDF ở hình4.10 thay đổi theo thời gian. Trong
tình huống này, giá trị mong đợi và ma trận hiệp phương sai là những hàm thời gian vì thế
chúng có thể biểu diễn z  t  và Pz  t 
Nhiều quá trình ngẫu nhiên z(t) quan trọng có PDF bất biến theo thời gian
Đó là những quá trình tĩnh, thậm chí chúng là hàm thời gian ngẫu nhiên vẫn có trị
trung bình và hiệp phương sai là hằng số.
Đặc trung cho liên hệ giữa hai quá trình ngẫu nhiên z(t) và x  t  , có thể sử dụng
 
PDF kết hợp f zx  , , t1, t 2  , tượng trưng cho xác xuất mà z  t1  , x  t 2  ở trong vùng vi
phân d  d ở giữa  ,   . Giả sử rằng các quá trình z(t) và x  t  là liên kết tĩnh, PDF
kết hợp không là hàm của cả hai thời gian t1 và t 2 nhưng nó chỉ dựa vào sai biệt  t1  t 2 
.
Trong nhiều trường hợp tĩnh, giá trị mong muốn của hàm hai biến g(z, x) được xác
định bởi:

   g  ,  f zx  , , t1  t 2  dd
E g  z  t1  , x  t 2    (4.84)

Ma trận tương quan chéo được xác định bởi


R zx     E z  t    x T  t   (4.85)
Do đó, ma trận tương quan chéo của hai quá trình không tĩnh mà được xác định bởi

R zx  t,    E z  t  x T     (4.86)
Xem như z  t1  và z  t 2  như là hai quá trình ngẫu nhiên của quá trình tĩnh, hàm tự
tương quan z(t) được xác định như sau:
159

R z    E z  t    zT  t   (4.87)
Hàm tự tương quan đem đến cho ta vài thông tin quan trọng về quá trình ngẫu nhiên.
Thí dụ như:
  
trace  R z  0    trace  E z  t  z T  t    E z  t 
   (4.88)
Tương đương với tổng năng lượng của quá trình z(t) .
Nếu
R zx     0 (4.89)
z  t  và x  t  được gọi là trực giao với nhau
Nếu
R z     P    (4.90)
trong đó P là ma trận hằng và   t  là xung Dirac, thì z  t  là trực giao với z  t   
với các giá trị   0 . Điều này có nghĩa là giá trị của quá trình z  t  tại thời điểm t không
có sự liên hệ với giá trị tại các thời điểm   t . Vì vậy z  t  được gọi là nhiễu trắng. Ví dụ
như nhiễu nhiệt ở mạch điện nguyên nhân vì sự chuyển động nhiệt ở các electron ở điện
trở.
Chú ý rằng P  0  là hiệp phương sai của z  t  . P được gọi là ma trận mật độ phổ.
Thỉnh thoảng nó cũng được xem như là ma trận hiệp phương sai.
c) Thiết kế bộ lọc Kalman:
Giả sử x  0  có thể được thay thế bằng các đại lượng biết trước x 0 ( giá trị trung
bình của x  0  và hiệp phương sai của P0 . Có thể biểu diễn như sau:
x  0    x 0 , P0  (4.91)
Như vậy không thể giả sử w  t  và v  t  có trị trung bình bằng 0 được. Giả sử rằng
nhiễu quá trình và nhiễu đo là nhiễu trắng, do vậy:
 
R w     E w  t    w T  t   W    (4.92)
Rv    Ev  t    v  t   V   
T
(4.93)
Ma trận mật độ phổ W và V sẽ được giả sử đã biết trước. Theo tính chất của hàm tự
tương quan, W vad V là bán xác định dương. Giả sử thêm rằng V là không suy biến. Tóm
lại, có thể giả sử rằng:
w  t    0, W  , W0 (4.94)
v  t    0, V  , V0 (4.95)
Việc giả sử w  t  và v  t  là nhiễu trắng trong một vài ứng dung có thể là xấu.
160
Thí dụ như nhiễu ở tần số thấp. Tuy nhiên, giả sử rằng w  t  không là nhiễu trắng,
có thể xác định được một hệ thống:
x 0  A w x w  Bw n (4.96)
w  Cw x w  D w n (4.97)
Có nhiễu trắng ngõ vào là n  t  và ngõ ra là w  t  . Chúng được gọi là các bộ lọc
nắn nhiễu. Những đặc tính động này có thể kết hợp với phương trình của đối tượng (4.75),
(4.76) để có được đặc tính động hiệu chỉnh là:
 x   A Cw   x   B  D w 
 
x   0 A  x   0  u   B n (4.98)
 w  w  w    w
x
y   C 0    v (4.99)
x w 
Hệ thống điều chỉnh này có nhiễu quá trình n  t  là nhiễu trắng. Một thủ tục tương
tự có thể làm theo các bước như thế nếu v  t  không phải là nhiễu trắng. Do đó, có thể mô
tả một hệ thống với nhiễu không phải nhiễu trắng dưới dạng một hệ thống điều chỉnh với
nhiễu quá trình và nhiễu đo lường là nhiễu trắng.
Xác định hệ thống (4.96), (4.97) miêu tả nhiễu không phải là nhiễu trắng w  t  hoặc
v  t  dựa trên phân tích mật độ phổ của nhiễu w  t  . Chi tiết xem Lewis (1986)
Bây giờ thiết kế bộ ước lượng cho hệ thống (4.75), (4.76) dưới những giả sử đã
được liệt kê. Cho bộ quan sát có dạng như sau:
x  Ax+Bu+L(y-y)
ˆ ˆ (4.100)
Hoặc xˆ  (A  LC)xˆ  Bu  Ly (4.101)
Hàm thời gian x̂  t  là ước lượng trạng thái và
yˆ  E Cx  v  Cxˆ (4.102)
Là ước lượng của ngõ ra y  t 
Độ lợi của bộ ước lượng L phải được chọn để cung cấp ước lượng tối ưu trong sự
hiện diện của nhiễu w  t  và v  t  . Để chọn L, chúng ta sẽ phải xác định sai số ước lượng:
x  t   x  t   xˆ  t  (4.103)
Sử dụng(4.75) và (4.100) sai số hệ thống là:
x   A  LC  x  w  Lv
(4.104)
 A0 x  w  Lv
Chú ý rằng sai số hệ thống xảy ra khi có sự tham gia của nhiễu quá trình và nhiễu
đo lường. Ngõ ra của sai số hệ thống có thể được cho bởi y  y  yˆ để:
161
y  Cx (4.105)
Hiệp phương sai của sai số được cho bởi:
 
P  t   E xx T (4.106)
thay đổi theo thời gian. Do đó, x  t  là quá trình ngẫu nhiên không tĩnh. Hiệp phương sai
của sai số là thước đo sự không chắc chắn trong ước lượng. Những giá trị càng nhỏ cho
P  t  đồng nghĩa với việc ước lượng càng tốt hơn vì những sai số được phân bố càng gần
với giá trị trung bình bằng 0 nếu P  t  là nhỏ hơn.
Nếu bộ quan sát là ổn định tiệm cận và w  t  và v  t  là quá trình tĩnh khi đó sai số
x  t  sẽ thực sự tiến đến trạng thái ổn định với trị trung bình và hiệp phương sai là hằng
số. Độ lợi L sẽ được chọn lựa để làm tối thiểu hiệp phương sai của sai số P. Vì vậy, độ lợi
tối ưu L sẽ là ma trận hằng của độ lợi bộ quan sát.
Trước khi xác định độ lợi tối ưu L, chúng ta sẽ tính toán giá trị trung bình và hiệp
phương sai của sai số ước lượng của x  t  . Sử dụng (4.104) và sự tuyến tính của phép toán
mong muốn:

E x  A 0 E x  E w  LE v (4.107)
d
Vì thế E x  A0E x (4.108)
dt
Do đó, E x là lượng biến đổi theo thời gian tuân theo phương trình vi phân với ma
trận hệ thống A 0 . Nếu A0  A  LC là ổn định thì E x luôn bền vững tại giá trị tĩnh
zero. Khi đó
E x  E x  E xˆ   E x  xˆ (4.109)
 
Theo trường hợp này ước lượng x̂  t  tiến tới E x  t  . Như vậy ước lượng này
được cho là không lệch. Cũng như theo (4.109), giá trị trung bình của sai số ban đầu x  0 
bằng với giá trị zero nếu như bộ quan sát (4.101) có giá trị đầu x̂  0   x 0 với x 0 là giá trị
trung bình của x  0 
Nếu như nhiễu quá trình w  t  hoặc nhiễu đo được v  t  có giá trị trung bình không
phải zero thì theo (4.107) giá trị E x của trạng thái tĩnh cũng không bằng zero. Trong
trường hợp này x̂  t  không đến được ổn định tiệm cận để đạt được trạng thái thật x  t  ,
nhưng có được một khoảng offset bằng giá trị hằng  E x . Khi đó trạng thái ước lượng
là bị lệch.
Để xác định P, chú ý rằng lời giải thích phương trình (4.104) được cho:
t t
xt  e AoJ
x 0   e A0 (t )
Lv()d   eA0 (t ) w()d (4.110)
0 0
162
Tìm ma trận tương quan chéo R vx (t, t) và R wx (t, t) sử dụng (4.110) và giả sử rằng
x  0  và cả x  0  , w  t  và v  t  là trực giao. Do đó
t
  t     E v  t  vT    LTe A
T( t  )
R vx (t, t)  E v  t  x T 0
d (4.111)
0
Chú ý rằng
R v  t,    V  t    (4.112)
Nhưng tích phân (4.111) có giá trị giới hạn trên là t. Xung đơn vị có thể được biểu
hiện như sau
1 t
  t   lim
T 0 T
  
T
(4.113)
Ở đây hàm xung vuông:

 T
1 1 1 t
( )   2 (4.114)
T T 
0 otherwise
Được đặt tại trung tâm t=0
Vì vậy, ta chỉ xét một nửa vùng   t    tại bên trái   t . Do đó từ (4.111) được
suy ra:
1
R vx  t, t    VLT (4.115)
2
Tương tự

R wx  t, t   E w  t  x T  t  
t

  E w  t  w T     Te  A 0T  t  
d hoặc
0
1
R wx  t, t   W T (4.116)
2
Phương trình đạo hàm cho P  t   E xx T  
 dx T   dx T 
P  t   E  x   E x  (4.117)
 dt   dt 
Theo (4.104), (4.115) và (4.116) ta có:
 dx  1 1
E  x T    A  LC  P  LVLT  w T (4.118)
 dt  2 2
163
 dx  1 1
E  x   P  A  LC   LVLT  w T
T
(4.119)
 dt  2 2
Từ (4.118) và (4.119)
P  A 0P  PA T0  LVLT  w T (4.120)
Cho bất kì L để (A-LC) là ổn định, chúng ta giải (4.120) tìm P  t  sử dụng điều kiện
đầu là P  0   P0 với P0 là hiệp phương sai của trạng thái đầu mà nó tượng trưng cho tính
không chắc chắn trong ước lượng đầu x̂  0   x 0 .
Thực sự những độ lợi cho kết quả P  t  càng nhỏ thì càng tốt vì sai số x  t  càng
gần với trị trung bình bằng 0. Do đó P  t  là thước đo chất lượng của bộ quan sát và ma
trận hiệp phương sai càng nhỏ thì bộ quan sát càng tốt hơn . Chúng ta nói rằng P là thước
đo sự không chắc chắn trong ước lượng.
P  t  tiến tới giá trị trạng thái bền vững P khi t   ngay khi A 0 là ổn định tiệm
cận. Tại trạng thái bền vững thì P  0 , (4.120) trở thành phương trình đại số
0  A 0P  PA T0  LVLT  w T (4.121)
Hiệp phương sai của sai số trạng thái bền vững là ma trận bán xác định dương được
xác định từ (4.121). Để độ lợi của bộ quan sát là hằng số, có thể chọn lựa L để làm tối thiểu
hóa hiệp phương sai của sai số P trạng thái bền vững.
Ta có chỉ tiêu chất lượng (PI=Performance Index)
1
J  trace  P  (4.122)
2
Do đó nếu P nhỏ thì J sẽ nhỏ. Để chọn L sao cho J đạt được tối thiểu phải thỏa mãn
phương trình (4.121), xác định hàm Hamiltonian
1 1
H  trace  P   trace  gS (4.123)
2 2
Trong đó
g  A 0P  PA 0T  LVLT  w T (4.124)
Và S là ma trận n  n thừa số Lagrange không xác định
Để hàm tối thiểu hóa J và thỏa mãn g=0, điều nay có thể làm tương đương là tối
thiểu H nhưng không cần điều kiện nào. Điều kiện cần thiết để tối thiểu hóa được cho bởi
H
 A0P  PA0T  LVLT  w T  0 (4.125)
S
H
 AT0S  SA0  1  0 (4.126)
P
1 H
 SLV  SPCT  0 (4.127)
2 P
164
Nếu A0  A  LC là ổn định và S là xác định dương. Theo (4.127)
L  PCT V 1 (4.128)
Thay thế giá trị L vào phương trình (4.125)
   
T
A  PCT V 1C P  P A  PCT V 1C  PCT V 1CP  w T  0 (4.129)
Hoặc AP  PA T  W T  PCT V 1CP  0 (4.130)

Để xác định độ lợi bộ quan sát tối ưu L, chúng ta có thể giải phương trình (4.130)
tìm hiệp phương sai của sai số P và sau đó sử dụng (4.128) để tính toán L. Phương trình
ma trận toàn phương (4.130) được gọi là phương trình Riccati đại số. Có nhiều cách giải
(4.130) để tìm P. Độ lợi tối ưu L xác định nhờ sử dụng (4.128) gọi là độ lợi Kalman và bộ
quan sát được xây dựng gọi là bộ lọc Kalman. Trạng thái bền vững ở đây chỉ đến một sự
thật rằng mặc dù độ lợi tối ưu làm tối thiểu hóa P  t  là biến đổi theo thời gian, chúng ta đã
chọn lựa độ lợi tối ưu mà nó làm tối thiểu sai số tương quan trạng thái bền vững để đạt
được độ lợi quan sát là hằng số
Bộ lọc Kalman với trạng thái bền vững là bộ ước lượng tốt nhất với các độ lợi là
hằng số. Nếu như nhiễu quá trình w  t  và nhiễu đo được v  t  là nhiễu Gaussian nó cũng
là ước lượng trạng thái bền vững tối ưu cho bất kì hình thức nào.
Ước lượng ngõ ra
y  t   y  t   yˆ  t   y  t   Cxˆ  t  (4.131)
 
Giả sử (C,A) là có thể quan sát được và A, , W là có thể tìm được. Khi đó ARE
tìm được ma trận xác định dương duy nhất P. Hơn nữa, sai số hệ thống (4.104) sử dụng độ
lợi Kalman cho bởi (4.128) với P là ma trận xác định dương duy nhất của ARE là ổn định
tiệm cận.
Một cách chắc rằng nhiễu hệ thống sẽ giảm. Tuy nhiên vị trí thực sự rất xa vời so
với thực tế.
Tóm lại:
Mô hình hệ thống: x  Ax  Bu (4.132)
y  Cx (4.133)
x 0  x 0 ,P0  , w  t   0, W  , v  t   0,V 
w  t  và v  t  là nhiễu trắng quá trình trực giao nhau và với x  0 
Giá trị đầu
x̂  0   x 0 (4.134)
Phương trình ARE của hiệp phương sai số
AP  PA T  W T  PCT V 1CP  0 (4.135)
165
Độ lợi Kalman
L  PCT V 1 (4.136)
Đặc tính động học ước lượng:
xˆ  Ax+Bu+L
ˆ  y  Cxˆ  (4.137)
Bộ lọc Kalman cần thiết giả sử rằng V>0 khi đó nhiễu đo sẽ làm sai lệch tất cả tín
hiệu đo. Nếu có một vài tín hiệu nhiễu tự do thì một bộ lọc phức tạp được biết đến như bộ
lọc Deyst được sử dụng để giải quyết vấm đề này. Hơn nữa giả sử rằng (A, , W) tìm được
có nghĩa là nhiễu quá trình kích thích tất cả các trạng thái
Trong Matlab sử dụng lệnh Kalman tính khâu lọc Kalman liên tục từ mô hình sys
của đối tượng:
 kest,L,P  kalman  sys, W,V , N,sensor,known 
W,V là các ma trận hiệp phương sai mô tả đặc điểm nhiễu hệ thống và nhiễu đo
lường
N: mặc định bằng 0
Hai vector sensor, known: chứa chỉ số của các biến ra đo được và các đầu vào ta
biết
Kết quả tính kest: chính là mô hình trạng thái của khâu lọc Kalman
Ma trận L: ma trận bộ lọc Kalman phản hồi sai lệch quan sát
P: là ma trận hiệp phương sai của sai lệch tĩnh
4.2.4. Giải thuật thiết kế LQG
Bộ điều chỉnh toàn phương tuyến tính (LQR) và bộ lọc Kalman cùng được sử dụng
với nhau để thiết kế bộ điều chỉnh động. Thủ tục này được gọi là thiết kế bộ tuyến tính toàn
phương Gaussian (LQG). Điều thuận lợi quan trọng của việc thiết kế LQG là cấu trúc của
bộ hiệu chỉnh được cho bởi thủ tục mà không cần phải biết trước. Điều này làm cho việc
thiết kế các bộ LQG rất có ích trong điều khiển các hệ thống hiện đại phức tạp ( ví dụ như
điều khiển không gian và hàng không ) khi cấu trúc bộ hiệu chỉnh không biết trước được.
Giả sử phương trình đo lường ngõ ra được cho bởi
x  Ax  Bu  w (4.138)
y  Cx  v (4.139)
Với x(t)  R n ,u(t) là bộ điều khiển ngõ vào, w(t) là nhiễu quá trình, và v(t) là
nhiễu đo. Giả sử phương trình hồi tiếp trạng thái đầy đủ
u  Kx  r (4.140)
Đã được thiết kế, với r(t) là ngõ vào chuẩn. Độ lợi trạng thái hồi tiếp K được chọn
bởi một số kỹ thuật chẳng hạn như kỹ thuật LQR. Nếu phương trình điều khiển (4.140)
được thay vào (4.138) thì hệ thống điều khiển vòng kín được tìm thấy như sau:
166
x   A  BK  x  Br  w
(4.141)
Thiết kế hồi tiếp trạng thái đầy đủ rất được quan tâm nếu các điều kiện được giữ ổn
định thì hệ thống vòng kín đảm bảo sẽ ổn định. Hơn nữa, sử dụng hồi tiếp trạng tháí tất cả
các nghiệm cực của phương trình (A-BK) có thể đặt tùy ý như mong muốn. Kết quả các
phương trình thiết kế của hồi tiếp trạng thái đơn giản hơn phương trình cho hồi tiếp ngõ ra.
Tuy nhiên luật điều khiển (4.140) không thể thực hiện khi tất cả các trạng thái không thể
đo được.
Giả sử bộ quan sát hoặc bộ lọc Kalman
xˆ   A  LC  xˆ  Bu  Ly
(4.142)
Đã được thiết kế. Đó là độ lợi của bộ loc được tìm ra bằng những kĩ thuật đã thảo
luận nhằm cung cấp các ước lượng trạng thái. Khi đó tất cả các trạng thái không thể đo và
điều khiển (4.140) không thể thực hiện tròn thực tế, giả sử rằng ước lượng hồi tiếp x̂  t 
thay thế các trạng thái thực x  t  , luật điều khiển hồi tiếp là
u  Kxˆ  r (4.143)
Nếu K được chọn sử dụng phương trình Riccati LQR và L được chọn bởi sử dụng
bộ lọc Kalman. Thủ tục này được gọi là thiết kế LQG
Điều quan trọng của các kết quả này là một trạng thái hồi tiếp của K và độ lợi của
quan sát L có thể được thiết kế riêng biệt.
4.2.5 Ví dụ:
Xét mô hình con lắc ngược như hình 4.11.
Hình 4. 11: Mô hình con lắc ngược
Chúng ta sẽ viết chương trình mô phỏng đặc tính động của đối tượng
Chúng ta thấy rằng hệ con lắc ngược là hệ phi tuyến, để có thể điều khiển hệ con
lắc ngược bằng phương pháo LQG chúng ta cần tuyến tính hóa mô hình hệ thống. Giả sử
góc  nhỏ để có thể xấp xỉ sin  bằng 0, cos bằng 1 và cũng giả sử  nhỏ để   0 .
2
Với các điều kiện trên, chúng ta có thể tuyến tính hóa các phương trình phi tuyến:
 M  m  x  ml  u
mx  ml  mg
Đặt các biến trạng thái:
167
 x1  

 x 2  

x3  x

 x 4  x (4.144)
Kết hợp với hai phương trình trên ta suy ra hệ phương trình biến trạng thái như sau:
 x1  x 2

 x 2  M  m gx1  1 u
 Ml Ml
 (4.145)
x3  x 4
 m 1
x 4   gx1  u
 Ml M
Viết lại dưới dạng ma trận
 0 1 0 0   0 
 x1   Mm   x1   1 
x   g 0 0 0     
 
2  Ml 0   2    Ml  u
x
(4.146)
 x3   0 0 0 1   x3   0 
      
x4    m g 0 0 0   x4   1 
 M   M 
Phương trình ở ngõ ra, chúng ta giả sử sử hai trường hợp:
1 0 0 0   x1 
0 1 0 0   x 2 
y  (4.147)
0 0 1 0  x 3 
  
0 0 0 1  x 4 
Nếu chỉ đo được hai biến trạng thái ( vị trí x và góc lệch  ) thì:
 x1 
 
1 0 0 0   x 2 
y  (4.148)
0 0 1 0  x 3 
 
x4 
Chúng ta sẽ khảo sát hệ con lắc ngược có các thông số như sau: M=1kg, l=1m
Lấy giá trị gia tốc trọng trường g  9.8(m / s )

2
Phương trình (4.146) trở thành:
168
 x1   0 1 0 0   x1   0 
 x  10.78 0 0 0   x 2   1
 2      u (4.149)
 x3   0 0 0 1  x3   0 
      
 x 4   0.98 0 0 0  x 4   1 
Thiết kế LQG:
Lọc Kalman:
Bộ quan sát:
Nếu không có đường phản hồi qua L thì x không tiệm tiệm cận về x được vì vậy L
được chọn sao cho x  x
Bộ quan sát được thiết kế theo giả thuyết
Giả sử ta có hệ thống:
 x  Ax  Bu  
 (4.150)
 y  Cx  v
với , v là nhiễu trắng có phân bố gausian với:
 
E v.vT  V  0
E .   W  0
T
 
E v.T  0  v,  độc lập nhau
Bộ quan sát có phương trình trạng thái:
 xˆ  Ax+Bu+L
ˆ  y  yˆ 
 (4.151)
 yˆ  Cxˆ
x  x  xˆ  x  Ax+  L  Cx  v  Cxˆ 
 x  Ax    L  Cx  v  (4.152)
 x   A  LC  x    Lv
 
Lọc Kalman được xây dựng trên cơ sở xác định L sao cho kỳ vọng toán E x T x
cực tiểu.
 L  PCT V 1 (4.153)
Trong đó P là nghiệm của phương trình Riccati
PA T  AP  W T  PCT V 1CP  0
 
W  E .T (4.154)
V  E v.v 
T
169

u y
x  Ax  Bu 
- 
y  Cx
-
B
+ ∫ C
-
+
+
A
Kc
Hình 4. 12: Bộ lọc Kalman
Bộ điều khiển LQG (Linear Quadractic Gaussian):

Trong bộ điều khiển LQ ta hồi tiếp trạng thái tuy nhiên trong thực tế nhiều khi ta
phải quan sát để lấy được biến trạng thái ước lượng (do không đo được ) và hồi tiếp trạng
thái ước lượng  LQG

u y
x  Ax  Bu  
y  Cx
-
-
B
+
∫ C
+ -
+
Kc
Hình 4. 13: Bộ điều khiển LQG
Điều khiển LQG là kết hợp điều khiển LQR với lọc Kalman.
Bước 1: Thiết kế điều khiển LQR  K C
Bước 2: Thiết kế bộ lọc Kalman  L
170
4.3. ĐIỀU KHIỂN BỀN VỮNG H
4.3.1 Biểu đồ Bode Đa Biến (Multivariable Bode Plot)
Biên độ của ma trận hàm truyền toàn phương H  j tại bất kỳ một tần số j nào,
phụ thuộc vào hướng tín hiệu kích thích đầu vào. Biên độ của ma trận hàm truyền H  j
 
được bao phía trên bởi giá trị suy biến cực đại, kí hiệu  H  j , phía dưới bởi giá trị
 
suy biến cực tiểu của nó, kí hiệu  H  j . Chính vì vậy, chúng ta cần tính toán hai giá
trị ràng buộc này.
Ví dụ: Biểu đồ Bode Biên Độ Hệ MIMO
Giả sử hệ thống đa biến:
 1 2 0 0  1 0
 2 1 0 0  0 0
x   x  u  Ax  Bu (4.155)
 0 0 3 8 0 1
   
 0 0 8 3 0 0
1 0 0 0 
y  x  Cx,
0 0 0 0 
Có hàm truyền hệ MIMO 2  2 là:
1
H  s   C  sl  A  B  N  s  D 1  s 
Với: D  s   s 4  8s3  90s 2  176s  165
1 0 3 7 0 2 79 0  73 0 
N s     s  0 5 s   0 15 s   0 15
 0 1       
Hàm H  s  là ma trận 2  2 , nó có gias trị suy biến. Chú ý rằng giá trị suy biến là
liên tục, ngoại trừ giá trị suy biến cực đại và cực tiểu. Những giá trị suy biến có thể giao
nhau, được minh chứng bằng hình học.
Hình 4. 14:Biểu đồ Bode Biên độ hệ MIMO của giá trị suy biến trong miền tần số
171
Trong Matlab dùng hàm sigma(H)
Ví dụ:
Để minh họa sự khác biệt giữa đồ thị trị suy biến hệ MIMO và giản đồ Bode hệ
SISO riêng biệt, xét hệ thống sau. Hàm truyền của hệ thống này là ma trận vuông có hạng
2. Hàm truyền hệ SISO riêng biệt trong hệ thống vòng hở 2 ngõ vào/2 ngõ ra là:
14.8
H11  s  
s  s  0.0163 s  3.615  s  20.2 
36.9s  s  2.237   s  0.55   2.492 

2
H12  s    
 s  0.0163 s  1 s  3.615  s  20.2   s  0.4225 2  3.0632 
2.65s  s  2.573 s  2.283
H 21  s  
s  s  0.0163 s  3.615  s  20.2   s  0.4225   3.0632 
2
 
0.79s  s  0.139   0.446 2 
2
H 22  s    
 s  0.0163 s  1 s  3.615  s  20.2   s  0.4225 2  3.0632 
Hình 4. 15: Biểu đồ Bode biên độ hệ thống SISO

Mặt khác, hình 4.16 là các giá trị suy biến của hệ đa biến. Chú ý rằng, theo đồ thị
này không thể dễ dàng bằng trực quan tức thời nhận thấy cách liên kết đồ thị của hệ SISO
ở hình 4.15. Những đường bao bảo đảm sự bền vững được đưa ra trong hệ thống hệ MIMO
dưới dangh giá trị trị suy biến cực tiểu là lớn tại tần số thấp ( cho chất lượng bền vững ) và
giá trị suy biến cực đại là nhỏ tại tần số cáo ( cho ổn định bền vững ). Sự không tương thích
172
giữa hai đồ thị 4.15 và 4.16 chỉ ra rằng đường bao đặc tính tần số của hệ MIMO không có
thể hoàn toàn mô tả đúng những biểu đồ Bode của hệ SISO riêng biệt
Hình 4. 16 :Các giá trị suy biến của hệ thống
4.3.2. Hàm nhạy và hàm bù nhạy

Khảo sát đặc tính của hệ thống hồi tiếp điển hình, từ đó đưa ra ý tưởng thiết kế thỏa
hiệp giữa mục tiêu chất lượng và điều khiển bền vững nhằm thỏa mãn các yêu cấu thiết kế.
Xét hệ thống hồi tiếp âm như hình 4.17, trong đó di là nhiễu đầu vào, d là nhiễu đầu
ra, n là nhiễu đo.
Hình 4. 17: Sơ đồ hệ thống hồi tiếp âm
Lưu ý: Để liên hệ với phần lý thuyết điều khiển kinh điển, trong mục này ta phân
tích sơ đồ điều khiển hồi tiếp âm, với bộ điều khiển là K̂ ( K̂   K ở mô hình hồi tiếp
dương )
Các quan hệ truyền đạt của hệ thống vòng kín được thể hiện qua các biểu thức sau:
173
GK ˆ GK ˆ G 1
y r n di  d
1  GK ˆ 1  GK ˆ 1  GK ˆ 1  GK ˆ
Kˆ Kˆ GK ˆ Kˆ
u r n di  d
1  GK ˆ 1  GK ˆ 1  GK ˆ 1  GK ˆ
Kˆ Kˆ 1 ˆ
K
uG  r n di  d
1  GK ˆ 1  GK ˆ 1  GK ˆ 1  GK ˆ
1 1 G 1
e r n di  d
1  GK ˆ 1  GK ˆ 1  GK ˆ 1  GK ˆ
Định nghĩa các hàm nhạy, hàm bù nhạy và độ lợi vòng như sau:
1
- Hàm nhạy: S 
1  GK ˆ
GK ˆ
- Hàm bù nhạy: T 
1  GK ˆ
- Độ lợi vòng: L  GK ˆ
Các đẳng thức viết gọn lại:
y  Tr  Tn  GSdi  Sd (4.156)
ˆ  KSn
u  KSr ˆ  Td  KSd
ˆ (4.157)
i
ˆ  KSn
u G  KSr ˆ  Sd  KSd
ˆ (4.158)
i
e  Sr  Sn  GSdi  Sd (4.159)
Từ (4.156) – (4.159), ta có thể rút ra các mục tiêu chất lượng của hệ thống vòng kín.
Từ phương trình (4.156) ta thấy rằng:
- Để giảm ảnh hưởn của nhiễu đầu ra d lên đầu ra y, hàm nhạy s cần phải nhỏ
- Để giảm ảnh hưởng của nhiễu đo n lên đầu ra y, hàm bù nhạy T cần phải nhỏ.
Tương tự, từ phương trình (4.158), để làm giảm ảnh hưởng của nhiễu đầu vào di hàm nhạy
S cần phải nhỏ.
Nhưng từ định nghĩa, hàm nhạy và hàm bù nhạy có quan hệ ràng buộc như sau:
S + T=1 (4.160)
Do đó, S và T không thể đồng thời nhỏ. Để giải quyết mâu thuẫn này, người ta
dựa vào đặc tính tần số của các tín hiệu nhiễu. Nhiễu tải d, di tập trung chủ yếu ở vùng
tần số thâp, còn nhiễu đo n tập trung chủ yếu ở vùng tần số cao.
Như vậy, để hệ ít bị ảnh hưởng bởi d, thì S và GS cần phải nhỏ tròn vùng tần
số mà d tập trung, cụ thể là vùng tần số thấp. Tương tự, điều kiện để hệ ít nhảy đối với
nhiễu di là S và K̂S nhỏ trong vùng tần số mà di tập trung, cụ thể là vùng tần số thấp.
Ta có:
174
ˆ  1  1  GK
GK ˆ  GK
ˆ 1
Suy ra:
1 1 1 ˆ 1
  , nếu GK
ˆ ˆ ˆ
GK  1 1  GK GK  1
Hay:
1 1
S , nếu L  1
L 1 L 1
Từ đó ta thấy:
S 1 L 1
Hơn nữa, nếu L 1 , thì:
 G  1
GS   
ˆ  K
1  GK ˆ
 K̂  1
K̂S   
 ˆ G
 1 GK 
Như vậy, đối với đầu ra y:
- Để giảm thiểu ảnh hưởng của d, độ lợi vòng L phải lớn ( nghĩa là L 1 ) trong
vùng tần số mà d tập trung
- Để giảm thiểu ảnh hưởng của di , biên độ bộ điều khiển phải đủ lớn K̂ 1 trong
vùng tần số mà di tập trung
Tương tự, đối với đầu vào  u G 
- Để giảm thiểu ảnh hưởng của di , L phải đủ lớn( nghĩa là L 1 ) trong vùng
tần số mà di tập trung
- Để giảm thiểu ảnh hưởng của d, biên độ đối tượng ( không thay đổi được trong
 
thiết kế điều khiển ) phải đủ lớn G 1 trong vùng tần số mà d tập trung,
Tóm lại, một trong những mục tiêu thiết kế là độ lợi vòng ( và cả độ lợi của bộ điều
khiển, nếu được) phải lớn trong vùng tần số mà d và di tập trung, cụ thể là vùng tần số thấp
Sau đây, ta xét ảnh hưởng của sai lệch mô hình lên hệ thống hồi tiếp. Giả sử mô
hình đổi tượng có sai số nhân là      G , với  ổn định và hệ thống kín ổn định danh
định ( ổn định khi  =0). Hệ thống kín có sai số mô hình sẽ ổn định nếu:
  ˆ 
GK
  
det 1  1    GK  det  1  GK 1 
ˆ ˆ
ˆ   
ˆ det(1  T)
   det 1  GK
  1  GK  
175
Không có nghiệm ở nửa phải mặt phẳng phức. Ta thấy rằng, điều này sẽ được thỏa
mãn nhưư T đủ nhỏ, hay T phải nhỏ ở vùng tần số mà  tập trung, cụ thể là vùng tần
số cao.
Để ý rằng, nếu L rất lớn thì T  1 và S  0 . Do đó, từ (4.156) ta thấy nếu như
L  j lớn ở tròn một dải tần số rộng, thì nhiễu đo n cũng sẽ truyền qua hệ thống trong
vùng tần số đó, nghĩa là:
y  Tr  Tn  GSd i  Sd   r  n 
Vì rằng nhiễu đo n tập trung chủ yếu ở vùng tần số cao. Hơn nữa, nếu độ lợi vòng
lớn ở ngoài vùng băng thông của G, nghĩa là L  j 1 trong khi G  j 1 , thì có thể
làm cho tín hiệu điều khiển quá lớn, gây bão hòa ở cơ cấu chấp hành. Điều này có thể được
lý giải từ (4.157) như sau:
ˆ  r  n  d   Td  1  r  n  d   d
u  KS i i
G
Phương trình trên cho thấy nhiễu tải và nhiễu đo sẽ được khuếch đại lên khi mà
vùng tần số mà nó tập trung vượt ra ngoài phạm vi băng thông G, vì đối với dải tần số mà
1
G  j 1 thì 1
G  j
Tương tự biên độ của bộ điều khiển, K̂ không được quá lớn trong vùng tần số mà
độ lợi vòng nhỏ nhằm tránh làm bão hòa cơ cấu chấp hành. Vì lẽ khi độ lợi vòng nhỏ
 L  j   1 , thì
ˆ
u  KS(r ˆ  n  d)
 n  d)  Tid i  K(r
Do đó, một điều cần lưu ý khi thiết kế là K̂ không được lớn quá khi độ lợi vòng
nhỏ.
Từ những điều trình bày ở trên, ta tổng kết lại các ý tưởng thiết kế sau đây:
- Để đảm bảo mục tiêu chất lượng trong một vùng tần số nào đó, cụ thể là vùng
tần số thấp  0,l  , hệ thống cần phải có:
ˆ
GK ˆ
1, K 1
- Để đảm bảo tính bêền vững và có khả năng triệt nhiễu đo tốt trong một vùng tần
số nào đó, cụ thể là vùng tần số cao  h ,   , hệ thống cần phải có:
ˆ
GK ˆ M
1, K
Trong đó M có trị số không quá lơn
176
Những ý tưởng thiết kế này được minh họa trong hình 4.18. Những tần số l , h
được xác định tùy thuộc vào từng ứng dụng cụ thể, và những thông tin của nhiễu tải, nhiễu
đo, sai lệch mô hình.
Những điều phân tích trên đây là cơ sở cho một kỹ thuật thiết kế điều khiển:
Hình 4. 18: Độ lợi vòng và các ràng buộc tần số thấp và tần số cao
Đó là thủ tục thiết kế dạng vòng ( LSDP_Loop Shaping Design Proceduce ). Mục
tiêu nắn dạng vòng là tìm ra mộ bộ điều khiển sao cho độ lợi vòng L tránh được các vùng
giới hạn ( xem hình 4.18) chỉ định bởi các điều kiện về chất lượng và bền vững
4.3.3 Thiết kế bền vững H
a) Mô tả không gian H và RH 
Không gian vector Hardy có chuẩn vô cùng, ký hiệu là H , là không gian các hàm
phức G(s) của biến phức s (s ∈C) mà trong nửa hở mặt phẳng phức bên phải (miền có phần
thực của biến s lớn hơn 0) thỏa mãn:
- là hàm giải tích (phân tích được thành chuỗi lũy thừa)
- bị chặn, tức tồn tại giá trị M dương nào đó để G(s)  M có phần thực dương.
Tập con đặc biệt của H∞ mà trong điều khiển bền vững rất được quan tâm là tập hợp
gồm các hàm G(s) thực - hữu tỷ (real-rational) thuộc H , tức là các hàm hữu tỷ phức
G(s)  H với các hệ số là những số thực dạng:
b0  b1s  ...  b ms m
G(s) 
1  a1s  ...  a ns n
trong đó ai ,bj ∈ R, ký hiệu là RH  .
Trong lý thuyết hàm phức, người ta chỉ ra được rằng: một hàm thực – hữu tỷ G(s)
bất kỳ sẽ thuộc RH  khi và chỉ khi
- lim G(s)   , hay G() bị chặn (khi m  n ),được gọi là hàm hợp thức và
s
177
- G(s) không có cực trên nửa kín mặt phẳng phức bên phải. Nói cách khác G(s)
không có điểm cực với Re(s)  0 .Một hàm G(s) có tính chất như vậy gọi là hàm bền.
Nếu hàm truyền hợp thức G(s) không những ở nửa hở bên phải mặt phẳng phức bị
chặn khi s   mà còn thỏa mãn (khi m  n )
lim G(s)  0
s
Chuẩn H của một hệ thống SISO G(s) ∈ RH  được định nghĩa như sau:
G 


 sup G  j  (4.161)
Như vậy, chuẩn vô cùng G 

chính là khoảng cách lớn nhất từ tâm tọa độ mặt
phẳng phức tới một điểm trên đường đặc tính tần biên – pha của G(jω).
b) Sai số mô hình phân tích coprime
Phần này trình bày một số kết quả về phân tích coprime bên trái LCF (Left Coprime
Factorization). Ta cũng có thể suy ra kết quả tương tự đối với phân tích coprime bên phải
nhờ vào tính đối ngẫu.
Định nghĩa 1:
Các ma trận hàm truyền đạt N, M  RH  N, M  RH  det(M)  0 tạo thành một

phân tích coprime bên trái của G nếu và chỉ nếu:
1
a. M vuông, và det(M)  0 G  M N V, U  RH M V  N U  I (4.162)
1
b. G  M N (4.163)
c. V, U  RH sao cho: M V  N U  I (4.164)

Định nghĩa 2:
Nếu N,M là phân tích coprime bên trái của G đồng thời thỏa:
N N  M M   I (4.165)
thì được gọi là phân tích coprime bên trái chuẩn.
Một đối tượng G có thể có vô số phân tích coprime bên trái, nhưng chỉ có một phân
tích coprime bên trái chuẩn
Xác định phân tích coprime bên trái chuẩn
Phân tích coprime bên trái chuẩn có thể được xác định từ mô hình trạng thái của G
và nghiệm của phương trình Riccati. Giả sử A, B, C, D là mô hình trạng thái của G, ký
hiệu là:
A B 
G  (4.166)
 C D
178
1 1
trong đó: G  s   C  sI  A  B  D G  s   C  sI  A  B  D . Để xác định
phân tích coprime bên trái, trước tiên ta cần phải tìm nghiệm của phương trình Riccati sau:
     

A  BDR 1C Z  Z A  BDR 1C  ZCS1CZ  B I  DR 1D B  0 (4.167)
trong đó R ≡ I + DD* . Phương trình này có tên là Phương trình Riccati lọc tổng
quát (GFARE – Generalized Filter Algebraic Riccati Equation). Sau đó áp dụng định lí 3.3
để tính N,M .
Định lý 4.3: Cho , phân tích coprime bên trái chuẩn của G Được xác
định như sau
(4.168)

trong đó Z là nghiệm xác định dương duy nhất của GFARE, R  I  DD , và

H   ZC  BD R 1 . 
Sai số mô hình phân tích coprime bên trái
Sau đây, ta định nghĩa sai số mô hình phân tích coprime bên trái. Giả sử G là mô
hình đối tượng, ( N,M ) là một phân tích coprime bên trái của G. Hệ có sai số mô hình
phân tích coprime bên trái chuẩn được định nghĩa như sau:
G  (M   M ) 1 (N   N ) (4.169)
trong đó ∆N, ∆M ∈ RH∞ là các hàm truyền chưa biết thể hiện phần sai số trong mô
hình danh định. Họ mô hình có sai số là một tập Gε định nghĩa như sau
 
G   (M   M ) 1 (N   N ) :   M ,  N     (4.170)

 
Hình 4. 19: Biểu diễn sai số mô hình phân tích coprime bên trái
Mục tiêu của điều khiển bền vững là tìm bộ điều khiển K ổn định hóa không chỉ mô
hình danh định G, mà cả họ mô hình Gε .
Ưu điểm của cách biểu diễn sai số mô hình trên đây so với biểu diễn sai số cộng và
sai số nhân là số cực không ổn định có thể thay đổi do tác động của sai số mô hình
179
c) Bài toán ổn định bền vững H
Xét hệ hồi tiếp hình 4.20
Hình 4. 20: Sơ đồ phân tích ổn định bền vững với mô hình có sai số LCF
Định lý 4.4:
G  M 1 N là mô hình danh định; G   (M   M ) 1 (N   N ) là mô hình có sai
số; (M, N) là phân tích coprime bên trái của G; M, N,  M ,  N  RH  . Hệ ổn định bền
1
vững với mọi    M  N  thỏa   M N   nếu và chỉ nếu:
 
a.Hệ (G, K) ổn định nội, và
K  1
b.    I  GK  M
1
 (4.171)
I 
Định lý 4.4 có thể phát biểu một cách tương đương dưới dạng một bài toán tối ưu
như sau:
Định lý 4.5:
1
Đối tượng G   (M   M ) 1 (N   N ) , với   M N   , ổn định hóa bền
 
vững được nếu và chỉ nếu:
K  1
inf    I  GK  M 1  (4.172)
K I

trong đó infimum ñược thực hiện trong tất cả các bộ điều khiển K ổn định hóa G.
Bài toán ổn định bền vững
Cho trước giá trị γ, tìm bộ điều khiển K (nếu tồn tại) ổn định hóa đối tượng danh
định G, và thỏa:
K  1
 I   I  GK  M
1
 (4.173)
  
180
trong đó (N, M) là phân tích coprime bên trái của G. Và theo định lý 4.4, nếu tìm
1
được bộ điều khiển K, thì K sẽ ổn định hóa đối tượng có sai số G∆, với M N  
 
Nếu phát biểu dưới dạng một bài toán tối ưu H∞ (đối với hệ thống hình 4.20) thì ta
có bài toán tối ưu H∞ như sau:
Bài toán tối ưu H∞
Tìm bộ điều khiển K (nếu tồn tại) ổn định hóa đối tượng danh định G và cực tiểu
hóa chuẩn H∞ sau đây:
K  1
 I   I  GK  M
1
(4.174)
  
trong đó (N, M) là phân tích coprime bên trái của G.

Bài toán tối ưu H∞ phức tạp ở chỗ phải thực hiện cực tiểu hóa chuẩn (4.174) trong
điều kiện tồn tại bộ điều khiển K ổn định hóa hệ thống. Để giải quyết vấn đề này, thông
thường người ta giải bài toán ổn định bền vững với một giá trị γ cho trước, rồi sau đó thực
hiện quá trình lặp γ để tìm giá trị γmin.
Glover và McFarlane đã sử dụng bài toán mở rộng Nehari (Nehari extension
problem), và dạng phân tích coprime chuẩn của mô hình đối tượng để tìm ra lời giải không
gian trạng thái cho bài toán tối ưu H∞ mà không cần phải thực hiện quá trình lặp γ để tìm
γmin. Hơn nữa, từ cách tiếp cận này, tác giả có thể tính được độ dự trữ ổn định cực đại
 1 
max    một cách chính xác.
  min 
Phần sau đây chỉ trình bày một số kết quả chính mà Glover và McFarlane đã thực
hiện.
Định lý 4.6: Bộ điều khiển K ổn định hóa hệ thống và thỏa
K  1
 I   I  GK  M
1
 (4.175)
  
nếu và chỉ nếu K có một phân tích coprime bên phải: K  UV 1 với U, V ∈ RH∞
thỏa
 
 N   U 
1
   V   
1  
2 2
(4.176)
 M   
  
Định lý 4.7:
181
a. Lời giải tối ưu của bài toán ổn định bền vững đối với mô hình phân tích coprime
bên trái chuẩn cho kết quả:
1
K  1
   
2 2
inf    I  GK  M 1  1   N M   (4.177)
K I
    H 
trong đó infimum được thực hiện trong tất cả các bộ điều khiển ổn định hóa hệ
thống.
b. Độ dự trữ ổn định cực đại là
1
   
2 2
 max  1   N M   0 (4.178)
   H 
c. Các bộ điều khiển tối ưu ñều có dạng: K  UV 1 , với U, V ∈ RH∞ thỏa

 
 N   U   
   V   N M (4.179)
 M      H
  
Các định lý trên cho ta những nhận xét sau:

- Độ dự trữ ổn định cực đại có thể được tính trực tiếp từ công thức (4.178)
- Việc xác định bộ điều khiển tối ưu H∞ có thể được thực hiện thông qua bài toán
mở rộng Nehari (Nehari extension).
Bài toán tối ưu con
Độ dự trữ ổn định cực đại cho ta một cận dưới của γ, đó là γmin = 1/εmax. Việc giải
bài toán tối ưu H∞ với γ > γmin cho kết quả là một tập các bộ ñiều khiển ổn định hóa K sao
cho
K  1
I  I  GK  M 1  (4.180)
  
Đây chính là bài toán tối ưu con (suboptimal problem). Lời giải dạng không gian
trạng thái của bài toán này ñược xác ñịnh theo các bước như sau :
Bước 1: Giải hai phương trình Riccati GCARE và GFARE.
Phương trình GCARE (Generalized Control Algebraic Riccati Equation) có dạng:
(A  BS1DC) X  X(A  BS1DC)  XBS1BX  C (I  DS1D )C  0 (4.181)
trong đó: S  I  DD .
Phương trình GFARE là phương trình trình bày ở trên.
(A  BDR 1C)Z  Z(A  BDR 1C)  ZCS1CZ  B(I  DR 1D)B  0
182
trong đó R  I  DD .
Bước 2: Tính giá trị γ nhỏ nhất có thể đạt được.
1
 min  (1   max (ZX)) 2
trong đó λmax (•) là trị riêng lớn nhất, X và Z lần lượt là nghiệm của GCARE và
GFARE.
Bước 3: Chọn min γ > γmin . Thông thường, chọn γ lớn hơn γmin một chút; chẳng hạn,
γ=1.05γmin .
Bước 4: Bộ điều khiển trung tâm có biểu diễn trạng thái được xác định như sau
(4.182)
trong đó X và Z là lần lượt là nghiệm của các phương trình GCARE và GFARE,
F  S1 (DC  BX) và W1  I  (XZ   2I) .
Công thức tính γmin ở bước 2 được dẫn ra từ công thức (4.177) trong định lý 4.7.
 
Nếu (N, M) coprime bên trái chuẩn thì  N M có thể được xác định từ nghiệm của
  H
hai phương trình Riccati GCARE và GFARE như sau:
 
 N M    max (XZ(I  ZX) 1 ) (4.183)
  H
Từ đó ta suy ra giá trị γmin:

1
1
 min   max  (1   max (ZX)) 2
Đây chính là công thức tính γmin ở bước 2.
Ta thấy rằng đối với bài toán ổn định bền vững cho mô hình phân tích coprime bên
trái chuẩn, ta chỉ cần tìm nghiệm của các phương trình GFARE và GCARE là đủ để tính
được giá trị min γ mà không cần phải thực hiện thủ tục lặp γ.
Trong bước 3, ta chọn min γ >γmin nhằm để bảo đảm sự tồn tại của bộ điều khiển có
khả năng ổn định hóa hệ thống.
Trong trường hợp bài toán tối ưu, γ= γmin , thì ma trận W1 trong (4.182) suy biến.
Và do đó, (4.182) sẽ không áp dụng được. Tuy nhiên nếu ta chọn γ gần γmin (ví dụ min γ
=1.05γ ) thì kết quả bài toán tối ưu con và bài toán tối ưu sẽ khác nhau không đáng kể.
d) Nắn dạng vòng H∞
* Thủ tục thiết kế nắn dạng vòng H∞ : (LSDP – Loop Shaping Design Procedure)
183
Nắn dạng vòng H∞ ( H∞ loop shaping) là một kỹ thuật thiết kế do McFarlane và
Glover đề xuất năm 1988. Kỹ thuật thiết kế này kết hợp ý tưởng nắn dạng vòng (phần hàm
nhạy và hàm bù nhạy) và bài toán ổn định bền vững H∞ . Nắn dạng vòng thực hiện sự thỏa
hiệp giữa mục tiêu chất lượng và mục tiêu ổn định bền vững, trong khi bài toán tối ưu H∞
đảm bảo tính ổn định nội cho hệ vòng kín.
Kỹ thuật thiết kế gồm hai phần chính:
a. Nắn dạng vòng: chỉ định dạng hàm truyền hở của đối tượng danh định.
b. Ổn định bền vững H∞ : giải bài toán ổn định bền vững H∞ dạng phân tích coprime
cho đối tượng đã được nắn dạng ở trên.
Thủ tục thiết kế nắn dạng vòng (LSDP)
Giả sử mô hình danh định của đối tượng G, bộ điều khiển cần tìm là K
Bước 1: Chọn các hàm nắn dạng W1,W2. Tính Gs: Gs  W2GW1
(Lưu ý là chọn W1,W2 sao cho GS không chứa các chế độ ẩn (zero – cực không ổn
định khử nhau))
Bước 2: Tìm nghiệm Xs,Zs của GCARE và GFARE ứng với GS.
1
Tính  min  (1   max (ZSXS )) 2 , trong đó λ max (.) là trị riêng lớn nhất
Nếu γmin quá lớn thì trở về bước 1. (Thông thường 1< γ min <5 thì chấp nhận được)
Bước 3; Chọn    min tổng hợp bộ điều khiển K∞ sao cho
K  1 1
 I  (I  G s K  ) M s 
  
(Việc xác định K∞ đã được trình bày ở phần 4.3)

Bước 4: Bộ điều khiển K cần tìm được tính theo công thức:
K  W1K  W2
Thủ tục thiết kế được minh họa trong hình 4.21
184
Hình 4. 21: Thủ tục thiết kế H∞ loop shaping
Nhận xét:
- Khác với phương pháp thiết kế nắn dạng vòng cổ điển (nắn dạng hàm S và T), ở
đây ta không cần quan tâm đến tính ổn định vòng kín, cũng như thông tin về pha của đối
tượng danh định, vì điều kiện ổn định nội đã được đảm bảo trong bài toán ổn định bền
vững H∞ ở bước 3.
- Thủ tục thiết kế sử dụng thích hợp cho các đối tượng ổn định, không ổn định, cực
tiểu pha, không cực tiểu pha; đối tượng chỉ cần thỏa mãn yêu cầu tối thiểu cho mọi thiết kế
là không có các chế độ ẩn. Cụ thể là nếu đối tượng không cực tiểu pha thì các hạn chế về
chất lượng điều khiển vẫn thể hiện trong thủ tục thiết kế quả giá trị của γmin .
* Sơ đồ điều khiển:
Trên đây ta chỉ quan tâm đến vòng điều khiển, không quan tâm đến vị trí tín hiệu
đặt được đưa vào vòng điều khiển như thế nào. Thông thường, tín hiệu đặt đưa vào vòng
điều khiển như hình 4.22 với hồi tiếp đơn vị.
Hình 4. 22: Sơ đồ điều khiển hồi tiếp đơn vị
Nếu bộ điều khiển K đạt được từ thủ tục nắn dạng vòng H∞ , thì K∞ và các hàm nắn
dạng W1, W2 có thể được tách ra riêng rẽ, và nhờ đó ta có thể có các sơ đồ điều khiển khác
nhau.
Hình 4.23 là sơ đồ điều khiển với bộ điều khiển thiết kế theo thủ tục LSDP. Ta có
thể thay đổi sơ đồ này một chút như hình 4.24, mà không làm thay đổi dạng vòng L.
Hình 4. 23: Sơ đồ điều khiển hồi tiếp đơn vị với bộ điều khiển đạt được từ LDSP
Hình 4. 24: Sơ đồ điều khiển cải tiến với bộ điều khiển đạt được từ LDSP
185
Khi tín hiệu đặt được đưa vào hệ thống tại vị trí giữa hai khối K∞ và W1, ta cần bổ
sung một bộ tiền bổ chính để đảm bảo độ lợi tĩnh bằng 1 (hình 4.24). Hàm truyền vòng kín
từ tín hiệu đặt r đến đầu ra y trở thành:
G(s)W1 (s)
y(s)  K  (0)W2 (0)r(s) (4.184)
1  G(s)K(s)
trong đó: K  (0)W2 (0)  lim K  (s)Ws (s) (4.185)
s0
Theo kinh nghiệm, điều khiển theo sơ đồ hình 4.24 sẽ cho đáp ứng quá độ tốt hơn;
điều khiển theo sơ đồ hồi tiếp đơn vị như hình 4.23 thường cho đáp ứng quá độ, có độ vọt
lố lớn. Nguyên nhân là trong sơ đồ 4.24 tín hiệu đặt không trực tiếp kích thích đặc tính
động của K∞ . Theo thủ tục thiết kế LSDP, K∞ lại được xác định qua lại bài toán ổn định
bền vững, trong đó ta không thể trực tiếp can thiệp vào vị trí điểm cực – zero được, mà mọi
đặc tính mong muốn ta chỉ có thể đưa vào hệ thống thông qua các hàm nắn dạng W1 và
W2.
* Lựa chọn các hàm nắn dạng W1,W2:
Việc lựa chọn các hàm nắn dạng trong thủ tục thiết kế LSDP nói chung là dựa vào
kinh nghiệm của người thiết kế. Tuy nhiên, đối với từng đối tượng cụ thể, người ta thường
đưa ra các hướng chọn hàm nắn dạng thích hợp. Thông thường, W2 được chọn có dạng ma
trận đường chéo với các phần tử trên đường chéo là các hằng số nhằm đặt trọng số lên các
tín hiệu ra của đối tượng. W1 thường là tích của hai thành phần: WP và WA; trong đó, WA
là bộ tách kênh (decoupler), WP có dạng đường chéo được chọn sao cho thỏa hiệp các mục
tiêu chất lượng và ổn định bền vững của hệ thống, và thường có chứa khâu tích phân để
đảm bảo sai số xác lập bằng 0. Đối với hệ SISO, việc lựa chọn các hàm nắn dạng đơn giản
hơn: W2 thường được chọn bằng 1, và W1 được chọn sao cho thỏa hiệp được các mục tiêu
chất lượng và ổn định bền vững của hệ thống.
4.4. THIẾT KẾ TỐI ƯU H 2
4.4.1. Đặt vấn đề
Xét hệ thống ổn định
.
x(t)  Ax(t)  Bw(t)
y(t)  Cx(t) (4.186)
tR
Hệ thống có ma trận hàm truyền H(s)  C(sI  A) 1 B . Giả sử rằng tín hiệu w là
 
nhiễu trắng với hiệp phương sai E w(t  )w (t)  W() . Ngõ ra y của hệ thống là
T
một quá trình nhiễu tĩnh với ma trận mật độ phổ.

S()  H( j)WH T (  j) (4.187)
Do đó trị trung bình ngõ ra toàn phương:
186


E y (t)y(t)  trace
T

1
 H( j)d)W H( j)d)
2 
(4.188)
Ở đây ký hiệu H( j)  H T (  j)

Ta có:

1
H 2  trace  H( j) H( j)d
2  
(4.189)
Gọi là chuẩn H2 của hệ thống. Nếu nhiễu trắng w có mật độ W=I thì trị trung bình
 T

của ngõ ra toàn phương E y (t)y(t) tương đương với bình phương của chuẩn H2 của hệ
thống
4.4.2. Tối ưu H 2
Vấn đề tối ưu H2 được thể hiện dưới dạng ma trận chuyển đổi. Chúng ta giả sử rằng
Q = I, và R = I, phiếm hàm chất lượng LQG là
lim E  z T (t)z(t)  u T (t)u(t)  (4.190)
t 
Sự giả sử này không làm mất đi tính tổng quát bởi vì bằng cách biến đổi thang tỷ lệ
các thông số z và u chỉ tiêu chất lượng luôn có thể chuyển thành hình thức này .
Cho hệ thống vòng hở :
.
x  Ax  Bu  w (4.191)
z  Dx (4.192)
y  Cx  v (4.193)
Có ma trận chuyển đổi
z  D(sI  A) 1   w+ D(sI  A) 1 Bu (4.194)
G11 (s) G12 (s)
y  C(sI  A) 1  w+C(sI  A)  1Bu  v (4.195)

G 21 (s) G 22 (s)
Kết nối hệ thống như hình (4.25) với một bộ điều khiển Ce chúng ta có cân bằng
của tín hiệu :
Hình 4. 25:Hệ thống hồi tiếp với ngõ vào và ngõ ra nhiễu loạn
187
u  Ce y  Ce (G 21w  G 22u  v)
u  (I  CeG 22 ) 1 CeG 21 w (I  CeG 22 ) 1Ce v (4.196)
H 21 (s) H 22 (s)
Từ z  G11w  G12u ta có:

z  G11  G12 (I  CeG 22 ) 1 CeG 21 w-G12 (I  CeG 22 ) 1Ce v (4.197)
H11 (s) H12 (s)
Hay
 z   H11 (s) H12 (s)   w 
 u    H (s) H (s)   v  (4.198)
   21 22  
H(s)
Từ (4.198) theo ta có:

T
 z(t)   z(t) 
lim E(z (t)z(t)  u (t)u(t))  lim E( 
T T
  )
t  t   u(t)   u(t) 

1
 trace  H( j) H( j)d
2  
(4.199)
2
 H 2
Vì vậy giải quyết vấn đề LQG là cực tiểu hoá chuẩn H2 của hệ thống vòng kín hình
(4.25) với (w,v) như ngõ vào và (z,u) như ngõ ra.
Cấu hình của hình (4.25) là trường hợp đặc biệt của cấu hình hình (4.26).Ở hình
(4.26) v là ngõ vào mở rộng (w và v trong hình (4.25)).Tín hiệu z là tín hiệu sai số (lý tưởng
bằng 0) (z và u trong hình (4.25)).Thêm vào đó u là ngõ vào điều khiển và y là ngõ ra quan
sát .G là đối tượng tổng quát và Ce là bộ điều khiển .
Hình 4. 26: Vấn đề chuẩn H2

4.4.3.Vấn đề chuẩn H 2 và lời giải của nó
Vấn đề tối ưu chuẩn H2 là lựa chọn bộ điều khiển K ở hình (4.26) để :
a. Ổn định với hệ thống vòng kín và
b. Cực tiểu hoá chuẩn H2 của hệ thống vòng kín (với v là vào, z là ngõ ra)
188
Sơ đồ hình 4.26 được mô tả bởi hệ phương trình trang thái sau:
.
x(t)  Ax(t)  B1v(t)  B2u(t) (4.200)
z(t)  C1x(t)  D11v(t)  D12u(t) (4.201)
y(t)  C2 x(t)  D21v(t)  D22u(t) (4.202)
Vấn đề tối ưu H2 có thể được giải quyết bởi việc dân tới vấn đề LQG. Giải quyết
vấn đề tối ưu H2 như thể là vấn đề LQG. Đó là, cực tiểu hóa:

E zT (t)z(t)  (4.203)
Giả sử rằng v là nhiễu trắng ngõ vào với ma trận V=I.

Hồi tiếp trạng thái:
Đầu tiên, xem xét lời giải với hồi tiesp trạng thái. Khảo sát hai phương trình:
.
x(t)  Ax(t)  B1v(t)  B2u(t) (4.204)
z(t)  C1x(t)  D11v(t)  D12u(t) (4.205)
Nếu D11 ≠ 0 thì ngõ ra z có thành phần nhiễu trắng . Điều này có thể làm cho trung
bình ngõ ra toàn phương (4.203) không xác định. Vì vậy chúng ta giả sử rằng D11 = 0 .
Dưới sự giả sử này chúng ta có :
C x(t)   z 0 (t) 
z(t)  C1x(t)  D12u(t)   I D12   1    I D 
12   (4.206)
 u(t)   u(t) 
Với z0 (t)  C1x(t) . Do đó
 I   z (t) 
 
E z T (t)z(t)  E  z T0 (t) u T (t)   T   I D12   0 
 u(t) 
 D12 
(4.207)
 I D12   z 0 (t) 
 E  z T0 (t) u T (t)   T T  
 D12 D12 D12   u(t) 
Đây là vấn đề bộ điều chỉnh tuyến tính với thành phần chéo ở ngõ ra và ngõ vào .Nó
.
có lời giải nếu hệ thống x(t)  Ax(t)  B2u(t),z 0 (t)  C1x(t) là ổn định và tìm được, ma
trận trọng lượng
 I D12 
 T T  (4.208)
 D12 D12 D12 
T
Là xác định dương. Điều kiện cần và đủ cho (4.208) là D12 D12 không suy biến
.Lời giải của vấn đề điều chỉnh là luật hồi tiếp trạng thái:
u(t)  Kx(t) (4.209)
Hồi tiếp ngõ ra :
189
Nếu trạng thái là không có giá trị cho hồi tiếp thì cần được ước lượng với một bộ
lọc Kalman. Xem xét hai phương trình :
.
x(t)  Ax(t)  B1v(t)  B2u(t) (4.210)
y(t)  C2 x(t)  D21v(t)  D22u(t) (4.211)
Phương trình thứ hai có thể trở thành dạng chuẩn cho bộ lọc Kalman nếu coi
y(t) – D22u(t) như là biến quan sát hơn là y(t).Nếu biểu thị nhiễu sự quan sát là

v(t)  D 21v(t) thì :
.
x(t)  Ax(t)  B1v(t)  B2u(t) (4.212)

y(t)  D 22u(t)  C 2 x(t)  v(t) (4.213)
Xác định một hệ thống nhiễu với những thành phần nhiễu tương quan chéo chúng
ta có:
 v(t  )   I 
E   vT (t) v  T (t)   E   v(t  )v T (t) I D T21 
 v(t  )   
 D 21 
(4.214)
 I DT21 
   ( )
 D 21 D 21D 21 
T
.
Giả sử rằng hệ thống x(t)  Ax(t)  B1v(t), y(t)  C 2x(t) là ổn định và tìm được,
và ma trận mật độ
 I DT21 
  (4.215)
 D 21 D 21D 21 
T
Xác định dương. Điều kiện cần và đủ cho (4.215) là D 21DT21 không suy biến
Khi đó sẽ tồn tại một bộ lọc Kalman:
.
    
x(t)  A x(t)  B2u(t)  L (y(t)  C 2 x(t)  D 22u(t)  (4.216)
 
Ma trận độ lợi L được tìm từ thủ tục thiết kế bộ lọc Kalman. Vấn đề hồi tiếp ngõ ra
được lấy:

u(t)   K x(t) (4.217)
K giống như độ lợi hồi tiếp trạng thái ở (4.209)
Xem xét vấn đề tối ưu H2 cho đối tượng tổng quát :
190
.
x(t)  Ax(t)  B1v(t)  B2u(t) (4.218)
z(t)  C1x(t)  D12u(t) (4.219)
y(t)  C2 x(t)  D21v(t)  D22u(t) (4.220)
Giả sử:
.
- Hệ thống x(t)  Ax(t)  B1v(t), y(t)  C 2x(t) là ổn định và tìm được
 A  sI B1 
- Ma trận   có hạng đầy đủ các hàng ngang cho mọi s  j và D21
 2C D 21 
có hạng đầy đủ các hàng ngang
 A  sI B2 
Ma trận   có hạng đầy đủ các hàng ngang cho mọi s  j và D12 có
 1C D1 
2
hạng đầy đủ các cột
Dưới những giả sử này bộ điều khiển hồi tiếp ngõ ra tối ưu là
.
    
x(t)  A x(t)  B2u(t)  L (y(t)  C 2 x(t)  D 22u(t)  (4.221)
 

u(t)   K x(t) (4.222)
Ma trận độ lợi hồi tiếp trạng thái và bộ quan sát là:
K  (D12
T
D12 ) 1 (BT2 X  D12
T
C1 ),L  (YCT2  B1DT21 )(D 21DT21 ) 1 (4.223)
Ma trận đối xứng X,Y là nghiệm định dương duy nhất của phương trình đại số
Riccati:
AT X  XA  C1TC1  (XB2  C1T D12 )(D12
T
D12 )(BT2 X  DT2 C1)  0
(4.224)
AY  AYT  B1B1T  (YCT2  B1DT21 )(D21DT21) 1 (C2Y  D 21B1T )  0
4.5. ỨNG DỤNG MABLAB MÔ PHỎNG HỆ THỐNG ĐIỀU KHIỂN BỀN VỮNG
4.5.1. LQG hệ lò xo đệm
Xét hệ thống lò xo đệm như hình vẽ sau:
Hình 4. 27: Hệ thống lò xo đệm

191
Với các thông số của hệ thống như sau:
M 1 m  0.1
b  0.0036 k  0.091
T
Biến trạng thái của hệ thống: X  d d y y 

, ,
 
Phương trình Biến Trạng Thái của hệ liên tục:
 ,
 x  Ax  Bu

 y  Cx  Du

với ma trận Biến Trạng Thái được cho như sau:
 0 1 0 0 
 k 0
 b k b  0
 
A
m m m m
B 0 
 0 0 0 1 
   
 k b k b  1
 M  M 
M M M 
1 0 0 0  0 
C  0 0 1 0  D   0 
 
0 0 0 0  1 
Thời gian lấy mẫu: T=0.4(s)
Khảo sát hệ thống trên dùng phương pháp LQG.
Sơ đồ khối của một bộ điều khiển LQG như sau:
Hình 4. 28: Sơ đồ khối của bộ điều khiển LQG
Từ sơ đồ khối trên, ta thấy rằng cấu trúc của bộ điều khiển LQG chính là bộ điều
khiển LQR kết hợp với bộ ước lượng Kalman và có xét đến nhiễu quá trình w(k) và nhiễu
đo lường v(k).
Phương trình biến trạng thái của hệ rời rạc khi có xét đến nhiễu như sau:
192
 x  k  1  x  k   u  k   w  k 

 y  k   Cx  k   Du  k   v  k 

Với luật điều khiển: u  k   K x  k 
Sơ đồ mô phỏng hệ thống:
Hình 4. 29:Sơ đồ mô phỏng hệ thống
Hình 4. 30:Đáp ứng của hệ thống

4.5.2. Thiết kế H cánh tay mềm dẻo
Xét thanh đồng chất, khối lượng phân bố đều, chiều dài là L. Thanh được chia thành
3 phần tử có độ dài bằng nhau h  L / 3.
Chiều dài thanh: l  0.98m , khối lượng thanh: m  0.35 kg , độ cứng biến dạng:
EI  72.2 N. m2 , quán tính trục động cơ: IH  0.025 kg.m2
193
Dùng phương pháp phần tử hữu hạn và phương trình Euler-Lagrange mô hình hóa
cánh tay mềm dẻo.
y0
y
3
2
x
1
0  x0
Hình 4. 31: Thanh mềm dẻo được chia thành 3 phần tử
Mô hình biểu diện trạng thái của đối tượng (n=3) có dạng như sau:
0 0 0 0 1 0 0 0  0 
0 0 0 0 0 1 0 0   0 
  
0 0 0 0 0 0 1 0  0 
   
 0 0 0 0 0 0 0 1 0
x   T
,
x
0 u u 13 u 14 0 0 0 0 u 12 
 12
0 u 22 u 23 u 24 0 0 0 0   u 12 
0 0 0 0 0  
 u 32 u 33 u 34   u 12 
 u 42 u 43 u 44
0 0 0 0 0   u 12 
y  13 0 0 1 0 0 0 0 x
Vectơ trạng thái được định nghĩa
T
x   q1 q 2 q3  q1 q 2 q3 
, , , ,
 
d ,
Trong đó: : góc quay của trục motor,  
dt
.
dq
q :chuyển vị (độ biến dạng ) của nút l , q  i
dt
Hàm truyền đạt của đối tượng:
G 0 (s)  C(sI  A) 1 B  D
Thông thường trước khi đưa mô hình vào sử dụng, cần phải sửa đội mô hình dựa
trên biểu đồ Bode.
990679.4792  s  598.2  s  598.2  s  167.2 s  167.2 
G s 
 s  1e  006   s  11.44s  1.309e004  s 2  34.86s  1.215e005  s 2  93.16s  8.678e005
2 2
194
Ta sử dụng G(s) làm mô hình danh định và sử dụng thủ tục LSDP thiết kế bộ điều khiển
Sơ đồ mô phỏng:
Hình 4. 32: Sơ đồ mô phỏng
Bảng 4.1: Chú thích các khối trong sơ đồ:

Step Khối tạo tín hiệu đặt là hàm bậc thang đơn vị.
Gain Bộ tiền xử lý, hệ số khuếch đại  K()W2 (0) .
W1, W2 Các hàm nắn dạng chỉ định trong thủ tục LSDP
Kinf Bộ điều khiển K  đạt được sau bước 3 của thủ tục LSDP.
Flexible Link Khối giả lập đối tượng điều khiển. Lẽ ra khối này chỉ có một đầu vào
– một đầu ra, nhưng phần hoạt hình (animation) cần lấy trạng thái của
đối tượng để vẽ, nên khối này còn có các đầu ra phụ q (chuyển vị nút)
và Theta (góc quay của trục).
Disturbance Khối tạo nhiễu tải, phát tín hiệu có dạng hàm nấc âm.
Noise Khối tạo nhiễu đo.

Load Nạp dữ liệu từ file loaddata.m để mô phỏng.
Design W1 Kích hoạt công cụ hỗ trợ thiết kế sơ bộ hàm nắn dạng W1.
(Raw)
Design W1 Kích hoạt công cụ hỗ trợ thiết kế cho phép tính chỉnh hàm nắn dạng
(Fine) W1.
Plot Khi nhấp kép chuột vào những khối này, Matlab sẽ vẽ biểu đồ Bode
G/W1/Gs/L/ST các hàm tương ứng.
195
Info Hiển thị thông tin hệ thống lên Workspace.
Công cụ hỗ trợ thiết kế
Design W1 (Raw) Công cụ này được sửa lại từ công cụ shapemag.m của MATLAB
cho tiện sử dụng với phần mô phỏng điều khiển này. Design W1 (Raw) có giao diện như
sau:
Hình 4. 33: Thiết kế hàm nắn dạng W1
Sử dụng: Người thiết kế chỉ định các điểm gãy (điểm chỉ định), các điểm này sẽ
tự động được nối với nhau bằng các đọan thẳng tạo nên dạng chỉ định, sau đó điền bậc
mong muốn của W1 vào ô Bậc của W1, và nhấn nút xấp xỉ để MATLAB phát sinh W1.
Sau khi có được W1, người thiết kế cần phải tinh chỉnh lại hàm này bằng công cụ Design
W1 (Fine).
Design W1 (Fine)
Công cụ này được xây dựng dựa trên dao diện đồ họa của JF Whidborne và SJ
King. Design W1 (Fine) có thể được sử dụng độc lập hoặc sử dụng để tinh chỉnh dạng của
W1 đạt được sau khi sử dụng Design W1 (Raw). Design W1 (Fine) có giao diện như sau:
196
Hình 4.34 : Hi  inf
Hình 4. 34: Thiết kế nắn dạng vòng Hi - inf
Sử dụng: Nếu Design W1 (Fine) được sử dụng độc lập, thì lúc khởi động W1=1;
nếu được sử dụng sau Design W1 (Raw), thì W1 sẽ thừa kế kết quả đạt được từ Design
W1 (Raw). Người thiết kế có thể thêm/bớt cực-zero, dịch chuyển cực-zero thêm/bớt khâu
tích phân, hay thay đổi độ lợi của W1 bằng các công cụ ở bên phải giao diện. Sau cùng,
người thiết kế nhấn nút Tính Kinf để tổng hợp bộ điều khiển. Hộp thoại xuất hiện sau khi
nhấn nút tính Kinf cho biết thông tin về giá trị đạt được và đưa ra 3 lựa chọn cho người
dùng chọn.
Hình 4. 35: Tổng hợp bộ điều khiển
Nhấn nút Trở về để quay lại giao diện Design W1 (Fine) hiểu chỉnh W1. Nhấn nút
đáp ứng nấc nếu muốn xem đáp ứng với đầu vào hàm nấc thang đơn vị của đối tượng
danh định.
197
Nhấn nút Mô phỏng, kết quả thiết kế (Kinf,W1) sẽ được chuyển vào Workspace để
chạy mô phỏng.
Load
Khi nhấp kép chuột lên khối Load, Simulink sẽ gọi loaddata.m. Tệp này
chứa toàn bộ thông số thiết kế của hệ thống. Người thiết kế có thể ñặt hàm nắn dạng
W1 vào tệp này nếu muốn thiết kế “bằng số”
Sau bước thiết kế, Kinf và W1 được nạp vào Workspace dưới dạng mô hình
trạng thái. Để chạy mô phỏng, nhấn nút .
Kết quả mô phỏng:
Chọn hàm nắn dạng:
150.51 s  0.9 
2
w1  s  
s  s  10   s  2 
2
Kết quả thiết kế:

Giá trị  nhỏ nhất:  min  3.68.
Chọn   1.05 min  3.86
Bộ điều khiển đạt được:
131.7524  s  10.17  s  2.146  s  9.817  s 2  1.103s  0.4046 
K 
 s  35.13 s  16.61  s 2
 1.799s  0.80891 s 2  11.61s  96.32 
Đáp ứng của hệ thống:
r(t) là tín hiệu đặt, y(t) vị trí đầu mút, u(t) là điện áp điều khiển, q(t) là độ dịch
chuyển ngang của đầu mút.
198
Hình 4. 36: Đáp ứng quá độ của hệ thống

Câu 1: Khái niệm điều khiển bền vững
Câu 2: Định nghĩa vết ma trận ,tính chất, trị suy biến của ma trận độ lợi
chính.
Câu 3: Khái niệm ổn định nội , ổn định bền vững và định lý độ lợi nhỏ
Câu 4: Điều khiển bền vững LQG (Sơ đồ nguyên lý, bộ quan sát, bộ lọc Kalman,
giải thuật thiết kế)
Câu 5: Cho hệ thống:
Đối tượng G  s  được mô tả:
199
0 1 0  0 0 
1 0 0 
x  0 3 0  x  1 0  u , z  
,
x
0 0 0  0 1   0 0 1 
Và bộ điều khiển K  s   2I2

a. Tìm độ lợi vòng đa biến GK(j  )
b. Tìm hàm chạy và hàm bù chạy
c. Tìm hàm truyền vòng kín r  t  đến z  t  và các cực của vòng k
200
CHƯƠNG 5
ĐIỀU KHIỂN THÍCH NGHI
Cung cấp cho sinh viên các kiến thức về:
- Khái niệm về điều khiển thích nghi
- Cách ước lượng tham số thích nghi thời gian thực
- Các phương pháp thiết kế bộ điều khiển thích nghi
5.1. KHÁI NIỆM
5.1.1. Định nghĩa
Thích nghi là quá trình thay đổi thông số và cấu trúc hay tác động điều khiển trên
cơ sở lượng thông tin có được trong quá trình làm việc với mục đích đạt được một trạng
thái nhất định, thườHình 5. 1ng là tối ưu khi thiếu lượng thông tin ban đầu cũng như khi
điều kiện làm việc thay đổi’’ hay:
Điều khiển thích nghi là tổng hợp các kĩ thuật nhằm tự động chỉnh định các bộ điều
chỉnh nhằm thực hiện hay duy trì ở 1 số mức độ nhất định chất lượng của hệ khi thông số
của quá trình được điều khiển không biết trước hay thay đổi theo thời gian.
Hệ thống điều khiển thích nghi có hai vòng hồi tiếp:
Vòng điều khiển hồi tiếp thông thường
Vòng hồi tiếp điều khiển thích nghi ( hồi tiếp chỉnh định thông số)
Sơ đồ khối tổng quát hệ thống điều khiển thích nghi
Hình 5. 1: Sơ đồ khối tổng quát hệ thống điều khiển thích nghi
5.1.2. Phân loại các sơ đồ điều khiển thích nghi

Điều khiển thích nghi trực tiếp: thông số của bộ điều khiển cần được chỉnh định trực
tiếp mà không cần phải nhận dạng đặc tính động học của đối tượng
Điều khiển thích nghi gián tiếp: trước tiên phải ước lượng thông số của đối tượng,
sau đó dựa vào thông số này để tính toán các thông số của bộ điều khiển
201
Các sơ đồ điều khiển thích nghi thông dụng:
- Hệ thích nghi theo mô hình chuẩn (Model Reference Adaptive System – MRAS)
Hình 5. 2: Sơ đồ khối tổng quát hệ điều khiển thích nghi theo mô hình chuẩn
- Hệ điều khiển tự chỉnh định (Self Tuning Regulator – STR)
Hình 5. 3: Sơ đồ khối tổng quát hệ điều khiển tự chỉnh định
- Điều khiển hoạch định độ lợi (Gain Scheduling Control)
Hình 5. 4: Sơ đồ khối tổng quát hệ điều khiển hoạch định độ lợi
202
5.2. ƯỚC LƯỢNG CÁC THAM SỐ THÍCH NGHI THỜI GIAN THỰC
5.2.1. Giới thiệu
Xác định các tham số của hệ thống là chìa khoá trong điều khiển thích nghi. Ước
lượng tham số hồi quy xuất hiện dưới dạng sơ đồ được thể hiện trọng bộ tự chỉnh định
(STR) (hình 5.3). Ước lượng tham số cũng xuất hiện dưới dạng sơ đồ ẩn trong bộ điều
khiển thích nghi mô hình chuẩn ( hình 5.2)
Thật là hữu ích nếu xem xét ước lượng tham số trong phạm vi nhận dạng hệ thống.
Các bước quan trọng của nhận dạng hệ thống là lựa chọn cấu trúc mô hình, thiết kế thí
nghiệm, ước lượng tham số và đánh giá. Vì nhận dạng hệ thống được thực hiện một cách
tự động trong điều khiển thích nghi nên cần phải hiểu rõ các khía cạnh của vấn đề này.
Việc lựa chọn cấu trúc và tham số hoá mô hình là vấn đề cơ bản. Các mô hình hàm truyền
đơn giản sẽ được dùng trong chương này. Các vấn đề nhận dạng được đơn giản hoá một
cách đáng kể nếu mô hình là tuyến tính theo các tham số.
Thiết kế thí nghiệm rất quan trọng cho việc nhận dạng hệ thống. Trong điều khiển,
điều này chính là lựa chọn tín hiệu vào. Việc chọn lựa tín hiệu vào căn cứ vào những hiểu
biết về hệ thống cũng như mục đích sử dụng của mô hình. Trong điều khiển thích nghi,
vấn đề trở nên phức tạp hơn vì tín hiệu vào để điều khiển hệ thống thường lấy từ tín hiệu
hồi tiếp. Trong một số trường hợp điều này sẽ dẫn đến việc ước lượng tham số là không
duy nhất. Một số trường hợp khác cần đưa thêm tín hiệu nhiễu vào hệ thống. Trong điều
khiển thích nghi, các tham số của hệ thống thay đổi liên tục, do đó cần có các phương pháp
ước lượng cập nhật các tham số một cách hồi quy. Trong bài toán nhận dạng, kiểm định
các kết quả là rất quan trọng, đặc biệt là đối với điều khiển thích nghi.
Phương pháp bình phương cực tiểu là một phương pháp cơ bản để ước lượng các
tham số. Phương pháp này trở nên đơn giản nếu mô hình tuyến tính theo các tham số có
thể được tính dưới dạng giải tích.
5.2.2. Mô hình hồi quy tuyến tính
Cho hệ thống có tín hiệu đầu vào là u(t), tín hiệu đầu ra là y(t)
e(t)

u(t) y(t)
Hệ thống
Hình 5. 5: Mô hình toán của đối tượng
Giả sử ta thu thập được N mẫu dữ liệu:

ZN  u(1), y(1),...,u(N), y(N) (5.1)
Bài toán đặt ra là ước lượng thông số của đối tượng dựa vào dữ liệu vào ra thu thập
được.
203
Giả sử quan hệ giữa tín hiệu vào và tín hiệu ra có thể mô tả bằng phương trình sai
phân :
y(t)  a1y(t  1)  ...  a n y(t  n)  b1u(t  1)  ...  b mu(t  m)  e(t) (5.2)
 y(t)  a1y(t  1)  ...  a n y(t  n)  b1u(t  1)  ...  b mu(t  m)  e(t) (5.3)
Kí hiệu:
   a1 ... a n b1 ... b m 
T
(t)    y(t  1) ...  y(t  n) u(t  1) ... u(t  m) 

T
Với kí hiệu như trên thì phương trình (5.3) được viết dưới dạng:
y(t)  T (t)  e(t) (5.4)
Biểu thức (5.4) cho thấy ta có thể tính được giá trị tín hiệu ngõ ra y(t) khi biết các
tham số của hệ thống, tín hiệu vào, tín hiệu ra trong quá khứ và nhiễu tác động vào hệ
thống.
Tuy nhiên nhiễu e(t) không biết trước nên ta chỉ có thể dự báo tín hiệu ngõ ra của
hệ thống khi biết tín hiệu vào và tín hiệu ra trong quá khứ. Để nhấn mạnh giá trị dự báo
phụ thuộc tham số  ta viết bộ dự báo dưới dạng:
^
y(t, )  T (t) (5.5)
Biểu thức (5.5) gọi là cấu trúc của mô hình
Vecto  gọi là vecto tham số
Vecto (t) gọi là vecto hồi quy ( do (t) gồm tín hiệu vào và tín hiệu ra trong quá
khứ), các thành phần của vecto (t) gọi là các phần tử hồi quy.
Mô hình dự báo có dạng (5.5) gọi là mô hình hồi quy tuyến tính (Linear Regression)
5.2.3. Bình phương cực tiểu và hồi quy
Nguyên lý bình phương cực tiểu nói rằng các tham số chưa biết của một mô hình
toán sẽ được chọn theo cách sau: Tổng bình phương sai khác giữa giá trị quan sát thực và
giá trị tính toán nhân với các số đo độ chính xác là cực tiểu
Phương pháp bình phương cực tiểu được áp dụng cho rất nhiều vấn đề. Nó đặc biệt
trở nên đơn giản khi áp dụng cho mô hình toán được viết dưới dạng sau:
y(i)  1 (i)10  2 (i)02  ...  n (i)0n  T (i)0 (5.6)
trong đó y là biến quan sát được, 10 , 02 ,..., 0n là các tham số của mô hình cần xác định, và
1, 2 ,..., n là các hàm đã biết. Kí hiệu:
T (i)   1 (i) 2 (i) ... n (i) 
0  10 02 ... 0n 
204
Các hàm i được gọi là biến hồi quy hay vecto hồi quy, mô hình (5.6) được gọi là

mô hình hồi quy. Các biến quan sát được và vecto hồi quy y(i), (i),i  1,2,..., t thu được
từ thực nghiệm. Vấn đề là xác định các tham số của mô hình sao cho ngõ ra tính được từ
mô hình (5.6) gần với các biến đo được của y(i) theo hướng bình phương cực tiểu. Các
tham số  nên được chọn để cực tiểu hoá hàm chỉ tiêu bình phương cực tiểu sau:
1 t
V(, t)  
2 i1
(y(i)  T (i)) 2 (5.7)
Vì các biến đo được y tuyến tính theo các tham số 0 và chỉ tiêu bình phương cực
tiểu có dạng toàn phương, lời giải có thể viết dưới dạng giải tích. Ký hiệu:
Y(t)   y(1) y(2) ... y(t) 
T
E(t)   (1) (2) ... (t) 

T
 T (1) 
  (5.8)
 (t)   
T (t) 
 
t
1
P(t)  ( (t)(t))
T
 (  (i)T (i)) 1
i 1
Trong đó sai số (i) được định nghĩa bởi:
^
(i)  y(i)  y(i)  y(i)  T (i)
Với các kí hiệu này, hàm chỉ tiêu (5.7) được viết lại dưới dạng:
1 t 2 1 1
V(, t)    (i)  E T E  E
2
2 i1 2 2
^
Trong đó: E  Y  Y  Y   (5.9)
* Định lý 5.1: Ước lượng bình phương cực tiểu
^
Hàm 5.7 là cực tiểu khi tham số ước lượng  thoả mãn:
^
T    T Y (5.10)
^
Nếu ma trận   không suy biến, ước lượng  là duy nhất:
T
^
  ( T  ) 1  T Y (5.11)
Chứng minh : hàm chỉ tiêu (5.7)có thể viết lại dưới dạng :
205
2V(, t)  E T E  (Y  )
 YT Y  YT   TT Y   TT
(5.12a)
Vì hàm  T  luôn luôn xác định không âm , nên hàm V là cực tiểu. Hàm chỉ tiêu
có dạng toàn phương theo  . Cực tiểu có thể tìm được bằng nhiều cách. Có thể lấy
gradient phương trình (5.7) theo  . Phương trình (5.10) được thoả mã khi gradient bằng
zero. Một cách khác nữa là ta viết (5.7) dưới dạng sau :
2V(, t)  Y T Y  Y T   T  T Y  T  T 
 Y T  ( T  ) 1  T Y  Y T  ( T  ) 1  T Y
(5.12b)
1
 Y (1   (  )  )Y
T T T
 (0  ( T  ) 1  T Y)T  T  (0  ( T ) 1  T Y)
Số hạng đầu tiên bên tay phải dấu “=”không phụ thuộc vào θ. Số hạng thứ 2 luôn
luôn dương .Cực tiểu thu được khi :

θ=  = ( T  ) 1  T Y (5.13)
Chú ý 1: Phương trình (5.10) được gọi là phương trình chuẩn. Phương trình (5.11)
có thể được viết lại như sau :
    
 t 1 t t
(t)   (i)T (i)  (i)y(i)  P(t)  (i)y(i) (5.14)
i 1 i 1 i 1
Chú ý 2 : Điều kiện để ma trận  T  khả nghịch được gọi là điều kiện kích thích
Chú ý 3 : Chỉ tiêu bình phương cực tiểu đặt trọng số của tất cả các sai số ε(i) là
như nhau.
Đặt trọng số cho các sai số khác nhau bằng cách thay đổi hàm chỉ tiêu (3.7) thành;
1
V  ET WE (5.15)
2
Trong đó W là ma trận đường chéo chứa các trọng số. Ước lượng bình phương
cực tiểu sẽ là :

(t)  ( T W ) 1  T WY (5.16)
* Định lí 3.2: Tính chất thống kê của ước lượng bình phương cực tiểu
Xét ước lượng trong (5.11) và gỉa thiết rằng dữ liệu được tạo ra từ (5.4) trong đó
{e(i),i=1,2,…} là chuỗi các biến ngẫu nhiên phân bố đều, độc lập với φ, có trung bình
bằng zero, phương sai bằng  2 .Gọi E là kỳ vọng toán học và cov là hiệp phương sai của
biến ngẫu nhiên .
Nếu   không suy biến, khi đó :
T
206

E (t)  0 (5.17)

cov (t)   2 ( T  ) 1 (5.18)

 2 (t)  2V(, t) / (t  n) là ước lượng không phân cực của  2

Trong đó n là tham số trong θ và  và t là số điểm dữ liệu.

Định lý chỉ ra rằng các ước lượng là không phân cực, E  (t)= 0 . Hơn nữa, các
ước lượng hội tụ đến giá trị thực khi số quan sát tăng đến vô hạn. Tính chất này gọi là
tính nhất quán (consistency). Bằng cách phân tích variance của các thông số ước lượng
tham số. Kết quả (5.18) được dùng để xác định phương sai của tham số ước lượng giảm
như thế nào khi tăng số mẫu quan sát. Ví dụ sau minh hoạ điều này.
* Tính toán hồi quy : Trong điều khiển thích nghi, các mẫu quan sát được tuần tự theo
thời gian. Sẽ là cần thiết khi các phép toán được thực hiện một cách đệ quy để tiết kiệm
thời gian tính toán. Việc tính toán các ước lượng bình phương cực tiểu có thể được sắp
xếp theo cách mà các kết quả thu được ở thời điểm t-1 được dùng để ước lượng các tham
số tại thời điểm t. Lời giải (5.11) cho bài toán bình phương cực tiểu được viết lại dưới

dạng hồi quy. Kí hiệu (t  1) là ước lượng bình phương cực tiểu dựa vào (t-1) phép đo
trước đó. Giả thiết  T  không suy biến với mọi t. Định nghĩa P(t) trong (5.8) cho thấy
:
t t 1
P 1 (t)   T  t    t    (i)T (i)   (i)T (i)  (i)T (t)
i 1 i 1
 P 1 (t  1)    t  T (t) (5.19)

Theo (5.14) ta có ước lượng bình phương cực tiểu (t) :

 t   t 1 
(t)  P(t)   (i)y(i)   P(t)   (i)y(i)    t  y  t  
 i1   i1 
Từ (5.14) và (5.19) ta có :
t 1   
 (i)y(i)  P (t  1) (t  1)  P (t) (t  1)    t   (t) (t  1)
1 1 T
i 1
Khi đó ước lượng tại thời điểm t có thể được viết lại như sau :
  
(t)  (t  1)  P(t)  t  T (t) (t  1)  P(t)  t  y(t)
  
 (t  1)  P(t)  t  y(t)  T (t) (t  1)  (t  1)  K(t)(t)
Trong đó :
K(t)=P(t)φ(t)
207

ε(t)=y(t) T (t) (t  1)
ε(t) có thể được hiểu như là sai số trong việc dự báo tín hiệu y(t) dựa trên ước

lượng (t  1)
Để đưa ra các phương trình hồi quy để tính toán, bổ đề ma trận nghịch đảo được
sử dụng
* Bổ đề 3.1: Bổ đề ma trận nghịch đảo
Cho A, C và C1  DA 1B là các ma trận không suy biến. Khi đó, A+BCD là
khả nghịch và
(A  BCD1 )  A 1  A 1B(C1  DA 1B) 1 DA 1
 I  BCDA 1  B(C 1  DA 1B) 1 DA 1
BCDA 1B(C 1  DA 1B) 1 DA 1
 I  BCDA 1  BC(C 1  DA 1B)(C 1  DA 1B) 1 DA 1
I
Áp dụng bổ đề 3.1 vào phương trình (5.19) ta được :
P(t)  ( T (t)(t)) 1  ( T (t  1)(t  1)    t   T (t)) 1
 (P(t  1) 1    t   T (t)) 1
 P(t  1)  P(t  1)  t  (I  T  t  P(t  1)(t)) 1 T  t  P(t  1)
Suy ra:
K(t)=P(t)φ(t)= P(t-1)φ(t)(I+ T  t  P(t  1)(t)) 1
Các phép toán hồi quy cho ước lưọng bình phương cực tiểu được tóm tắt lại thành
định lý sau.
* Định lý 3.3 Ước lượng bình phương cực tiểu (RLS)(Recursive Least Squares)
Giả thiết ma trận (t) là toàn hạng,   không suy biến với mọi t  t 0 . Cho
T

trước (t 0 ) , P( t 0 )= T (t 0 ) , ước lượng bình phương cực tiểu được thể hiện bằng các
phép toán đệ quy sau :
 
P(t)  t  y(t)  T (t)  (t  1)  K(t)(t) (t  1) (5.20)
K(t)  P(t)  t   P(t  1)  t  (I  T  t  P(t  1)(t)) 1 (5.21)
P(t)  P(t  1)  P(t  1)(t)(I  T  t  P(t  1)(t)) 1T (t)P(t  1)

 (t  K(t)T (t))P(t  1) (5.22)
208

Chú ý 1 : Từ phương trình (5.20) ta thấy ước lượng (t) thu được bằng cách thêm

một lượng hiệu chỉnh vào ước lượng trước đó (t  1) với một trọng số K(t). Lượng hiệu

chỉnh này tỉ lệ với y(t)   (t) (t  1) , trong đó đại lượng sau là dự báo tín hiệu y ở thời
T
điểm t bằng mô hình (5.3). Trọng số K(t) cho biết mức độ hiệu chỉnh ước lượng nhiều
hay ít
Chú ý 2: Khâu ước lượng bình phương cực tiểu ở trên có thể quy tương đương về
bộ lọc Kalman của hệ sau :
(t  1)  (t)
y(t)  T (t)  e(t) (5.23)
Chú ý 3: Các phép toán đệ quy ở trên có thể được dẫn ra từ hàm chỉ tiêu V ở
phương trình (5.7):
2V(, t)  2V(, t)   2 (, t)
= Y T (t  1)(1  (t  1)( T (t  1)(t  1)) 1(t  1))Y(t  1)
 
(  (t  1))T  T (t  1)  t  1 (  (t  1)
 y(t)  T  t  )T (y(t)  T (t)) (5.24)
Đại lượng đầu tiên ở vế phải độc lập với θ, hai đại lượng còn lại phụ thuộc vào θ.
Dễ dàng cực tiểu hoá V(θ,t) theo θ.
P(t) chỉ được định nghĩa khi ma trận  T  không suy biến. Để thiết lập điều kiện
đầu cho bài toán, ta chọn thời điểm ban đầu t 0 sao cho  T  t 0    t 0  không suy biến.
Khi đó điều kiện của bài toán sẽ là :

P  t 0   T  t 0    t 0  

  t 0   P  t 0  T  t 0  Y  t 0 
Các phép toán hồi quy có thể được sử dụng từ thời điểm t 0 trở đi. Nếu các phép
toán hồi quy được bắt đầu với điều kiện đầu P(t)  P0 , P0 xác định dương, thì:
P(t)  (P01   T  t  (t)) 1
Để P(t) có thể gần  T  t  (t)) 1 , ta chọn P0 đủ lớn.Về mặt ý nghĩa vật lí, có thể
giải thích việc lựa chọn P0 đủ lớn như sau. Giả thiết ta chưa biết gì về các tham số của hệ
thống, để khởi động bài toán ước lượng ta cần chọn một điều kiện đầu P0 sao cho nó không
ảnh hưởng gì tới tính hiểu biết trước (prior information) các tham số cần ước lượng, mà
P(t) chính là nghịch đảo của ma trận thông tin   . Nghĩa là P0 càng lớn thì ma trận
T
thông tin càng nhỏ, dữ liệu vào /ra ban đầu nghèo thông tin
209
P0 và 0 cũng có thể được chọn dựa trên những kiến thức đã biết về các tham số
của hệ thống( nếu có ). Các P0 và 0 này có thể tính được từ việc ước lượng tham số không
thời gian thực (batch parameter estimation), rồi dùng làm điều kiện đầu cho ước lượng
tham số thời gian thực (real-time parameter estimation).
* Các tham số hệ thống thay đổi theo thời gian: Trong đó mô hình bình phương cực
tiểu (5.6), các tham số 0 được gỉa thiết là hằng. Trong một số vấn đề điều khiển thích
nghi, các tình huống mà ở đó tham số của hệ thống thay đổi theo thời gian được quan tâm.
Có hai trường hợp được dùng để mở rộng phương pháp bình phương cực tiểu. Trường
hợp thứ nhất là phân đoạn tiến trình. Ở cách này, các tham số sẽ bị thay đổi đột ngột khi
chuyển tiếp giữa các phân đoạn. Ma trận P sẽ được thiết lập lại giá trị ban đầu P0 cho mỗi
phân đoạn. Trường hợp thứ hai, các tham số thay đổi chậm theo thời gian, hàm chỉ tiêu có
thể được viết dưới dạng :
1 t t i
V(, t)    (y(i)   (i))
T 2
(5.25)
2 i1
Trong đó λ là hệ số quên ,0< λ≤1(λ=0.9). Phương trình (5.25) cho thấy trọng số
của dữ liệu thay đổi theo thời gian. Dữ liệu càng gần nhất thì trọng số càng gần đơn vị
nhất, dữ liệu cách n thời điểm trước đó sẽ có trọng số là λ. Có thể hiểu điều này như sau:
do các tham số hệ thống thay đổi theo thời gian, nên mô hình bình phương cực tiểu (5.6)
càng đúng cho dữ liệu càng gần thời điểm đang xét nhất. Phương pháp naỳ được gọi là
mức độ quên theo hàm mũ .
* Định lý 3.4: Ước lượng bình phương cực tiểu với mức độ quên theo hàm mũ

Giả thiết rằng ma trận (t) toàn hạng với mọi t  t 0 . Ước lượng tham số  được
tính bằng phép toán hồi quy :
  
(t)  (t  1)  K(t)(y(t)  T (t) (t  1))
K(t)  P(t)  t   P(t  1)  t  IT (t)P(t  1)(t)) 1
(5.26)
P(t)  (I  K(t)T (t))P(t  1)
Một bất lợi của phương pháp này là dữ liệu bị bỏ quên dù là P(t)  t   0 . Điều
này ngụ ý rằng y(t) không chứa đựng bất kì thông tin mới nào về tham số θ. Trong trường
hợp này, ma trận P(t) gia tăng theo hàm số mũ với tốc độ λ
Một phương pháp khác để giải quyết vấn đề thay đổi theo thời gian của các tham
số hệ thống đó là đưa ra một mô hình toán thay đổi theo thời gian. Các tham số thay đổi
theo thời gian có thể thu được bằng cách thay thế phương trình đầu tiên ở (5.23) với mô
hình :
(t  1)   v(t)  v(t)
210
Trong đó  v là ma trận đã biết, v(t) là nhiễu trắng. Trường hợp  v  I tương ứng
với mô hình có các tham số là các quá trình Wiener chuyển dịch.
* Các giải thuật đơn giản hoá : Giải thuật bình phương cực tiểu trong định lí 3.3 có hai

biến trạng thái  và P được cập nhật từng bước. Khi số bước (n) càng lớn thì việc tính
toán ma trận P sẽ gây trở ngại trong việc tính toán. Có nhiều giải thuật đơn giản hoá, tránh
việc tính toán ma trận P, bù lại là tốc độ hội tụ hơi chậm hơn. Giải thuật hình chiếu của
Kaczmarz là một giải thuật khá đơn giản. Để mô tả giải thuật này, xét các tham số chưa
biết như là một phần tử của không gian R n .
Một phép đo :
y(t)  T  t   (5.27)
xác định hình chiếu của vecto tham số θ lên vecto   t  , n phép đo φ(1), φ(2)…. φ(n) là
cần thiết để xác định tham số θ là duy nhất.
Giả thiết rằng ta đã có ước lượng tham số ở thời điểm (t-1) là (t  1) và phép đo
mới y(t) như ở 5.27 cũng thu được. Vì y(t) chứa thông tin chỉ trên phương (t) trong không
gian tham số, một cách tự nhiên ta có thể lựa chọn giá trị ước lượng mới (t) cực tiểu hóa
(t)  (t  1) với điều kiện rằng buộc (5.27 ). Như vậy hàm chỉ tiêu V có toán tử
Lagrrange  .
1
   (t)  (t  1)   (y  t     t  (t))
T
V (t)  (t  1) T
2
Lấy đạo hàm V theo  và 
(t) (t  1)    t   0
y  t   T  t  (t )  0
Giải hai hệ phuong trình trên ta có
 t 
(t)  (t  1) 
  t   t 
T 
y  t   T  t  (t  1)  (5.28)
Công thức cập nhật ước lượng tham số này được gọi là giải thuật Kaczmarz. Ta có
thể thay đổi trọng số hiệu chỉnh bằng cách đưa vào hệ số nhân  .
  t 
(t)  (t  1) 
  t   t 
T 
y  t   T  t  (t  1) 
Để tránh gặp rắc rối khi   t   0 , mẫu số của trọng số hiệu chỉnh được thay
bằng T  t    t   ,a >0 ta được giải thuật hình chiếu như sau:
* Giải thuật 3.1: Giải thuật hình chiếu của Kaczamarz
  t 
(t)  (t  1) 
   t t 
T 
y  t   T  t  (t  1)  (5.29)
211
Trong đó 0<   0,0    2 <2
Chú ý 1: trong một số tài liệu, đây gọi lả giải thuật hình chiếu chuẩn hóa.
Chú ý 2: biên của tham số  cho ở trên được giải thích như sau. Giả thiết dữ liệu
được tạo ra từ (5.29) với tham số   0 . Sai số ước lượng:   0  
Thõa mãn phương trình :   t   A  t    t  1
  t  T  t 
Trong đó At  I 
    t  T  t 
Ma trận A có giá trị riêng là
  (1   )T 

  T 
Để sai số ước lượng tiến về zero thì giá trị riêng của ma trận A phải nhỏ hơn 1 ( 
<1). Điều này được thõa mãn khi 0<  <2. Giá trị riêng khác của ma trận A=1
Giải thuật hình chiếu giả thiết rằng dữ liệu được (5.27) tạo ra không có sai số. Khi
dữ liệu tạo ra sai số ngẫu nhiên, một giải thuật đơn giản hóa được cho bởi:

(t)  (t  1)  P(t)  t  y  t   T  t  (t  1)  (5.30)
1
 t 
Trong đó: P  t     T  i    i  
 i 1 
Đây là giải thuật xấp xỉ quá trình ngẫu nhiên. Lưu ý rằng P  t    T là vô hướng
khi y(t) vô hướng. ơn giản hơn nữa là giải thuật bình phương trung bình cực tiểu (LMS).

(t)  (t  1)    t  y  t   T  t  (t  1)  (5.31)
trong đó  là hệ số.
* Mô hình liên tục theo thời gian: Trong sơ đồ hồi quy, các biến được đánh chỉ số theo
tham số t rời rạc. Trong1 số trường hợp sử dụng các quan sát liên tục theo thời gian. Phương
trình (5.6) vẫn được sử dụng, i được giả thiết là 1 số biến thực. Tham số hệ thống được xác
định khi hàm chỉ tiêu được cực tiểu hoa
t

V()   e  a(t ) y     T    2 d  (5.32)
0
Tham số ,   0 , tương ứng với hệ số quên  trong (5.25). Bằng một vài phép
toán, hàm chỉ tiêu được cực tiểu khi:
 t a(t )  t
 e         d    t    ea(t )    y    d
T
(5.33)
 
0  0
Ước lượng thu được duy nhất khi ma trận khả nghịch
212
t
R(t)   e  a(t )    T    d (5.34)
0
Ta cũng có thể thu được các phương trình hồi quy bằng cách tạo ra đạo hàm phương
trình (5.33). Ước lượng cho bởi định lý sau.
* Định lý 3.5: Uớc lượng bình phương cực tiểu liên tục theo thời gian
Giả thiết R(t) trong (5.34) là khả nghịch với mọi t. Ước lượng cực tiểu hóa thoả:
^
d
 P  t   t  e t  (5.35)
dt
e  t   y  t   T  t    t  (5.36)
dP  t 
 P  t   P  t    t  T  t  (5.37)
dt
Chú ý 1: ma trận R  t   P  t  thoả
1
dR
 R  T
dt
Chú ý 2: cũng có các giải thuật đơn giản hóa. Giải thuật hình chiếu tương ứng với
(5.30) và (5.31) được cho bởi phương trình (5.30) với:
1
t 
P(t)    T       d 
0 
5.2.4. Ước lượng tham số hệ thống động
Phương pháp bình phương cực tiểu cũng có thể được dùng để ước lượng các tham
số của mô hình hệ thông động. Tùy từng đặc tính của mô hình và việc tham số hóa mà có
các đặc biệt để ước lượng các tham số.
* Mô hình đáp ứng xung hữu hạn(FIR):
Một hệ thống động học tuyến tính bất biế theo thời gian được mô tả 1 cách duy nhất
bằng đáp ứng xung. Một cách tổng quát, đáp ứng xung có vô hạn. Đối với hệ thống ổn
kính, đáp ứng xung sẽ tiến nhanh về zero theo hàm mũ và có thể rút gọn. Điều này tương
ứng với tham số của mô hình có thể giảm đi. Tuy nhiên, nếu thời gian lấy mẫu là nhỏ so
với thời hằng bé nhất của hệ thống, thì số tham số cần thiết của mô hình phải lớn. Mô hình
đáp ứng xung hữu hạn được mô tả như sau:
y  t   b1u  t  1  b 2u  t  2   ....b n u  t  n  (5.38)
hay y  t   T  t  1 
trong đó T   b1....b n 
213
T  t  1   u  t  1....u  t  n  
Mô hình này giống với mô hình hồi quy, ngoại trừ chỉ có số t trong vector hồi quy.
Rất thuận tiện nếu ta quy ước vevtor hồi quy với thời điểm gần nhất của dữ liệu xuất hiện
trong nó. Mô hình (5.38) phù hợp với công thức bình phương cực tiểu.
Ước lượng tham số có thể biểu diễn bằng sơ đồ khối như trong hình 5.6 . Khâu ước
lượng này có thể xem như một hệ thống với ngõ vào là u và y, ngõ ra là  . Vì tín hiệu :
y  t   b1 (t  1)u  t  1  ...  b n (t  1)u  t  n 
Có sẵn trong hệ thống, ta có thể xem y  t  như là ngõ ra. Mà y  t  là ước lượng của
y, nên khâu ước lượng hồi quy có thể được diễn giải như một bộ lọc thích nghi để ước
lượng y. y

y
u 
Bộ lọc FIR -1 
Cơ cấu
chỉnh định
Hình 5. 6: Sơ đồ khối thể hiện khâu ước lượng cho mô hình FIR
(Finite Impulse Response)
* Mô hình hàm truyền

Phương pháp bình phương cực tiểu có thể được sử dụng để nhận dạng các tham số
của mô hình hàm truyền :
A q  y  t   Bq  u  t  (5.39)
Trong đó q là toán tử dịch tới và A  q  và B  q  là các đa thức.
A  q   q n  a1q n 1  ...a n
B  q   b1q m1  b 2q m2  ...b m
Mô hình hàm truyền (5.39) có thể được viết dưới dạng phương trình sai phân.
y  t   a1y  t  1  ....  a n y  t  n   b1u  t  m  n  1  ....  b mu(t  n)
Giả thiết rằng chuỗi tín hiệu vào {u(1), u(2),...., u(t)} tác động vào hệ thống và chuỗi
tín hiệu ra {y(1), y(2),...., y(t)} quan sát được. Giả thiết vector tham số:
T  (a1...a n b1...b m )
và vector hồi quy
T  t  1    y  t  1  ...  y  t  n  u  t  m  n  1  ...  u  t  n  
214
Mô hình trên được viết lại như sau:
y  t   T  t  1 
Ta thấy tín hiệu ngõ ra ở các thời điểm trước đó xuất hiện trong vector hồi quy. Mô
hình này được gọi là mô hình tự hồi quy. Ước lượng tham số có thể thu được bằng cách áp
dụng phương pháp bình phương cực tiểu. Trong đó ma trận  cho bởi:
 T  n  
 
 
T  t  1 
 
Nếu ta sử dụng các tính chất thống kê của ước lượng bình phương cực tiểu, ta thấy
rằng phương pháp này làm việc tốt khi nhiễu là trắng khi thêm vào vế bên phải của mô
hình (5.39):
A q  y  t   Bq  u  t   e  t  n 
Khi đó phương pháp này đươc gọi là phương pháp sai số phương trình. Nếu nhiễu
trắng được thêm vào mô hình (5.39) dưới dạng :
B q 
yt   u t   et 
A q
Phương pháp này được goi là phương pháp sai số ngõ ra . Để mô tả phương pháp
này cho u và y là ngõ vào /ra của 1 hệ thống có quan hệ vào/ra như sau:
^ ^ ^
y(t)  a1 y(t  1)  ....  a n y(t  n)  b1u(t  m  n  1)  .....  b mu(t  n)
Quan hệ này được viết lại thành:
^
B(q)
y(t)  U(t)
A(q)
Để xác định các tham số ta đi cực tiểu hóa hàm chỉ tiêu :
t ^
 (y(k)  y(k)) 2
k 1
^
trong đó y(t)  y(t)  e(t). Vấn đề này có thể được giải quyết bằng phương pháp
bình phương cực tiểu mà lời giải cho bởi:
^ ^
(t)  (t  1)  P(t)(t  1)(t)
trong đó:
^ ^
T (t  1)  ( y(t  1)  ...  y(t  n)u(t  m  n  1)...u(t  n))
^
(t)  y(t)   (t  1) (t  1)
T
215
Khâu ước lượng được biểu diễn ở sơ đồ khối hình 5.7.
y

u y 
Mô hình quá trình -1 
Cơ cấu
chỉnh định
Hình 5. 7: Sơ đồ khối của ước lượng bình phương cực tiểu dựa vào sai số ngõ ra
* Hàm truyền liên tục theo thời gian

Xét mô hình liên tục theo thời gian có dạng:
dn y d n 1y d m1u
 a1 n 1  ....  a n y  b1 m1  ....  b mu
dt n dt dt
được viết lại như sau :
A(p)y(t)  B(p)u(t) (5.41)
trong đó A(p) và B(p) là các đa thức thức theo các toán tử đạo hàm p= d/dt .
n
Trong đa số trường hợp, ta không thể tính p y(t) bởi vì phải lấy đạo hàm cấp n
của tín hiệu. Do đó mô hình (5.41) được viết lại như sau :
A(p)yf (t)  B(p)u f (t) (5.42)
Trong đó:
yf (t)  H f (p)y(t)
u f (t)  H f (p)u(t)
Hf (p) là một hàm truyền ổn định với các cực lớn hơn bằng n ( xem hình 5.8).Ta
kí hiệu:
  (a1...a n b1...b m )T
T (t)  (p n 1yf ...  yf p m1u f ...u f )
 (p n 1H f (p)y...  H f (p)y p m1H f (p)u...H f (p)u)
Mô hình biểu diễn bởi (5.42) được viết lại như sau:
p n yf (t)  p n H f (p)y(t)  T (t)
Bằng cách thực thi bộ lọc H f , ta có thể sử dụng chỉ một bộ lọc để tạo ra tất cả các
tín hiệu p H f p(y), i=0,…,n và một bộ lọc khác để tạo ra p H f p(u), i=0,…,m-1. Lúc này
phương pháp bình phương cực tiểu áp dụng được, vì đây là mô hình hồi quy.
216

Tham số ước lượng 
Bộ
Hf Hf
ước lượng
pi H f (p)u pi H f (p)y

Quá trình
Ngõ vào u động học Ngõ ra y
Hình 5. 8: Sơ đồ khối của khâu ước lượng với bộ lọc H f
* Mô hình phi tuyến:

Mô hình phi tuyến được giới hạn ở chỗ nó vẫn tuyến tính theo các tham số, các
vector hồi quy để có thể phi tuyến. Điều này đảm bảo mô hình vẫn có thể viết được dưới
dạng mô hình hồi quy. Ví dụ sau đây là minh họa ý tưởng này.
Ví dụ 5.1: Hệ thống phi tuyến
Xét mô hình:
y(t)  ay(t  1)  b1u(t  1)  b 2 sin(u(t  1))
T
Đặt:   (a b1 b 2 )
và T (t)  ( y(t) u(t) sin(u(t – 1))
Mô hình trên có thể viết dưới dạng:
y(t)=  (t  1)
T
Mô hình này tuyến tính theo các tham số, do đó có thể áp dụng phương pháp bình
phương cực tiểu dưới dạng  .
* Sự thống nhất các giải thuật :
Các giải thuật hồi quy đã trình bày khá tương tự nhau. Chúng có thể được mô tả
bằng các phương trình:
^ ^
(t)  (t  1)  P(t)(t  1)(t)
1 P(t  1)(t  1)T (t  1)P(t  1) 
P(t)   P(t  1)  
   T (t  1)P(t  1)(t  1) 
trong đó  , ,  thay đổi tùy từng phương pháp.
217
5.2.5. Các điều kiện thực nghiệm
Đặc tính của dữ liệu sử dụng trong ước lượng thông số hệ thống có tính chất quyết
định đối với tính chất của ước lượng. Ví dụ, rõ dàng rằng sẽ không thu được các thông số
hữu ích nếu tất cả các tín hiệu là zero. Vấn đề kinh nghiệm đối với tùng hệ thống tự động
cụ thể là rất quan trọng.
Ví dụ 5.2: Sự suy giảm phương sai của tham số ước lượng
Xét trường hợp mô hình y(i)  T (i)0  e(i) chỉ có một tham số cần ước lượng.
Gọi t là số mẫu quan sát được. Phương sai của tham số ước lượng được cho bởi:
^ 2
cov   t
 2 (k)
k 1
Nó tuỳ thuộc vào thay đổi của (k) khi k tăng. Kí hiệu a b để chỉ a và b có tỉ lệ
với nhau.
t
a) (t) ek ,   0 :  2 (k) hội tụ đến một hằng số, do đó phương sai của ước lượng
k 1
tiến về hằng số
const a  0.5
t 
b) (t) e k ,   0 :  2 (k) log t a  0.5 phương sai tiến về zero nếu a  0.5
k 1  l2a
t a  0.5
c) (t) 1 phương sai tiến về zero với tốc độ như 1 / t
d) (t) t a ,   0 : Phương sai tiến về zero với tốc độ như t (l2a)
e) (t) eat ,   0 : Phương sai tiến về zero với tốc độ như e 2at
Ví dụ này chỉ ra rằng độ chính xác của tham số ước lượng phụ thuộc vào biến đổi
của vecto hồi quy (k) . Phương sai sẽ không tiến về zero khi tăng mẫu số quan sát nếu
vecto hồi quy giảm chậm hơn t 0.5 . Trong các trường hợp thông thường, khi vecto hồi
quy có cùng thang bậc độ lớn, phương sai giảm theo 1 / t . Phương sai giảm nhanh hơn
nữa nếu vecto hồi quy tăng theo thời gian. Về mặt ý nghĩa vật lý, có thể hiểu điều này
như sau: khi dữ liệu vào/ra tăng theo độ giàu thông tin theo thời gian thì ước lượng càng
chính xác, phương sai càng giảm.
Khi ước lượng nhiều tham số, tốc độ hội tụ của từng tham số ước lượng sẽ khác
nhau và liên quan đến cấu trúc ma trận ( T ) 1 trong 5.6.
Ví dụ 5.3. Xét dữ liệu tạo bởi mô hình : y(t)  b  e(t) t  1,2,...N trong đó e(t) là
chuỗi các biến ngẫu nhiên độc lập. Giả thiết rằng có một sai số lớn tại điểm t  2 , đó là
e(2)  a . Tham số b trong mô hình y(t)  b được ước lượng bởi phương pháp bình
phương cực tiểu RLS như sau:
218
^ ^ ^
(t)  (t  1)  K(t)(y(t)  T (t  1)), T (t)  1
^ ^
 (t  1)  K(t)(y(t)  (t  1)) (1)
K(t)  P(t)(t)  P(t)

P(t  1)(t) P(t  1) (2)
P(t)  P(t  1)  T (t)P(t  1) 
1   (t)P(t  1)(t)
T
1  P(t  1)
P(0) được khởi động với một giá trị rất lớn, do đó P(t) trong phương trình (2) sẽ
có giá trị P(t) 1 . Từ (1) ta thấy khi y(t) nhận một tín hiệu sai số khá lớn e(2)  a thì giá
trị cập nhật của ước lượng tại thời điểm đó sẽ biến động mạnh. Nghĩa là ước lượng nhạy
với nhiễu, giá trị ước lượng thu được sẽ không chính xác. Đây chính là nhược điểm của
phương pháp ước lượng tham số theo thời gian thực.
5.2.6. Các kết luận
Các ưu điểm của phương pháp ước lượng tham số theo thời gian thực:
1. Các tham số được ước lượng theo thời gian thực, mà không cần phải xử lý toàn
bộ tập dữ liệu khi dữ liệu đo kế tiếp thêm vào;
2. Có khả năng bám đuổi tham số thay đổi theo thời gian;
3. Chỉ ra được cấu trúc mô hình nào không phù hợp cũng như khả năng nhận dạng
dựa trên sự thay đổi theo thười gian của tham số ước lượng và sai số ước lượng;
4. Các kết quả ước lượng tham số trung gian thật sự hữu ích cho việc đanh giá tính
hiệu quả của các dạng tín hiệu vào khác nhau cũng như xác định độ dài thời gian cần cho
việc kích thích hệ thống. Điều này cũng giúp cho việc điều tra hỏng hóc của hệ thống trở
nên dễ dàng.
Các nhực điểm của phương pháp ước lượng tham số theo thời gian thực:
1. Cấu trúc mô hình phải được chọn trước và giữ cố định, chỉ cho các tham số thay
đổi theo thời gian;
2. Nhiều phương pháp dùng để ước lượng tham số gặp phải một vấn đề gọi là “
covariance windup ”. Ở đó, phương sai ước lượng liên tục giảm theo thời gian bất chấp có
hay không các kích thích tác động lên hệ thống. Điều này dẫn tới sai số chủ quan cho các
tham số ước lượng;
3. Có một sự thỏa hiện giữa thời gian tính các tham số ước lượng với độ trơn của
tham số ước lượng. Điều này liên quan đến bộ nhớ dữ liệu, hay là dữ liệu gần nhất được
đối xử như thế nào so với dữ liệu cũ. Vấn đề này được thể hiện dưới dạng hệ số quên trong
phép toán cập nhật ước lượng. Khi hệ thống quên càng bé, dữ liệu cũ ít được quan tâm hơn
dữ liệu mới, bộ nhớ không cần nhiều, thời gian tính nhanh, nhưng trọng số cập nhật ước
lượng cao (do tỷ lệ theo hàm mũ với hệ số quên) nên ước lượng chênh lệch nhiều so với
ước lượng cũ (ước lượng không trơn). Ngược lại cho trường hợp hệ số quên lớn.
219
4. Khoảng thời gian kích thích hệ thống thấp hoặc khoảng có kích thích nào lên hệ
thống, kết hợp với bộ nhớ dữ liệu có hạn có thể dẫn đến một số đề tính toán số ở một vài
phương pháp.
5. Nhiệm vụ xử lí dữ liệu trước khi nhận dạng ( như phân tích độ tương thích dữ
liệu, mịn hóa dữ liệu…) thường không được thực hiện trong thời gian thực.
6. Nhạy với nhiễu. Ví dụ: điều kiện hoạt động của các chuyến bay thường là bay
bằng, nghĩa là các biến trạng thái cà điều khiển gần như là hằng số. Trong khoảng thời gian
này, nội dung (độ giàu thông tin) của dữ liệu dưới mức nhiễu động. Phương pháp ước
lượng hồi quy tuyến tính theo thời gian thực sẽ gặp vấn đề, kết quả ước lượng sẽ không
chính xác trừ khi ta phải thêm vào một lượng phạt (pernalty factor) trong hàm chỉ tiêu đề
để chống lại sự biến đổi đột ngột giá trị ước lượng tham số khỏi giá trị tham số thực đã biết
(priori values ).
5.3. HỆ THÍCH NGHI THEO MÔ HÌNH CHUẨN – MRAS(MODEL REFERENCE
ADAPTIVE SYSTEMS)
5.3.1. Sơ đồ chức năng
Hệ thống thích nghi sử dụng mô hình chuẩn là một trong những phương pháp chính
của điều khiển thích nghi. Nguyên lý cơ bản được trình bày ở hình 5.9
y
Mô hình
y
Tham số điều khiển ư
Cơ cấu hiệu chỉnh
e ư y
y Bộ điều khiển Đối tượng
ư
Hình 5. 9: Sơ đồ khối của một hệ thích nghi mô hình chuẩn
Mô hình chuẩn sẽ cho đáp ứng ngõ ra mong muốn đối với tín hiệu đặt (yêu cầu). Hệ
thống có 1 vòng hồi tiếp thông thường bao gồm đối tượng và bộ điều khiển . Sai số e là sai
lệch giữa ngõ ra của hệ thống và của mô hình chuẩn e  y  ym . Bộ điều khiển có thông
số thay đổi dựa vào sai số này. Hệ thống có 2 vòng hồi tiếp: hồi tiếp trong là vòng hồi tiếp
thông thường và vòng hồi tiếp bên ngoài hiệu chỉnh tham số cho vòng hồi tiếp bên trong.
Vòng hồi tiếp bên trong được giả sử là nhanh hơn vòng hồi tiếp bên ngoài.
Hình 5.9 là mô hình MRAS đầu tiên được đề nghị bởi Whitaker vào năm 1958
với 2 ý tưởng mới được đưa ra: Trước hết sự thực hiện của hệ thống được xác định bởi một
mô hình, thứ hai là sai số của bộ điều khiển được chỉnh bởi sai số giữa mô hình chuẩn và
220
hệ thống. Mô hình chuẩn sử dựng trong hệ thích nghi bắt nguồn từ hệ liên tục sau đó được
mở rộng sang hệ rời rạc có nhiễu ngẫu nhiên.
Chương này tập trung vào ý tưởng cơ bản. Để vấn đề được trình bày một cách rõ
ràng, ta chỉ tập trung vào cấu hình trong hình 5.9 được gọi là hệ MRAS song song. Đây là
một trong nhiều cách có thể xây dựng mô hình chuẩn. Chương này đề cập chính đến hệ
liên tục theo phương pháp trực tiếp có nghĩa là tham số được cập nhật một cách trực tiếp.
5.3.2. Luật MIT (Massachusetts Institude Technology)
Hình 5. 10: Mô hình sai số
Hệ thống thích nghi mô hình tham chiếu đầu tiên được đưa ra để giải quyết vấn đề:
các đặc điểm của một số mô hình tham chiếu yêu cầu ngõ ra là quá trình lí tưởng cần có
đáp ứng đối với tín hiệu điều khiển như thế nào. Đồ thị minh họa trong hình 5.10. Trong
trường hợp này, mô hình tham chiếu mang tính song song hơn nối tiếp, giống như cho
SOAS (Self Oscillating adaptive Systems). Bộ điều khiển có thể được xem như bao gồm
hai vòng: một vòng phía trong gọi là vòng hồi tiếp thông thường có quá trình và bộ điều
khiển. Các thông số của bộ điều khiển được chỉnh định bởi vòng ngoài sao cho sai số e
giữa ngõ ra y và ngõ ra mô hình ym là nhỏ nhất. Vì vậy vòng ngoài còn được gọi là vòng
chỉnh định. Vấn đề là xác định cơ cấu chỉnh định cho hệ thống ổn định, nghĩa là sai số bằng
zero. Điều này không thể thực hiện được. Cơ cấu chỉnh định với thông số sau được gọi là
luật MIT, được sử dụng cho hệ MRAS đầu tiên
d e
 e (5.43)
dt 
Trong phương trình này e là sai số của mô hình e  y  ym . Các thành phần của
vector e /  là đạo hàm độ nhạy của sai số đối với các thông số chỉnh định  . Thông số
 xác định tốc độ thích nghi. Luật MIT có thể giải thích như sau. Gỉa sử rằng các thông số
 thay đổi chậm hơn so với các biến khác của hệ thống. Để bình phương sai số là bé nhất,
2
cần thay đổi các thông số theo hướng gradient âm của bình phương sai số e .
Giả sử muốn thay đổi thông số của bộ điều khiển sao cho sai số giữ ngõ ra của đối
tượng và của mô hình chuẩn tiến tới zero. Đặt e là sai số và  là thông số hiệu chỉnh. Chỉ
tiêu chất lượng:
1
J    e2 (5.44)
2
221
Để làm cho J   min thì cần phải thay đổi các thông số theo hướng âm của gradient
J , có nghĩa là:
 J e
   e (5.45)
t  
Giả sử rằng các thông số cần thay đổi  thay đổi chậm hơn nhiều hơn số với các
e
biến khác của hệ thống. Vì vậy đạo hàm được tính với giả thiết  là hằng số. Biểu

e
thức đạo hàm gọi là hàm độ nhạy của hệ thống. Luật điều chỉnh theo phương trình

e
(5.45) với là độ nhạy thì có liên hệ giống như luật MIT. Cách chọn hàm tổn thất theo

phương trình (5.44) có thể là tùy ý. Nếu chọn
J    e (5.46)
Khi đó luật hiệu chỉnh sẽ là :
d e
  sign  e  (5.47)
dt 
d  e 
Hoặc  sign   sign  e 
dt   
Đây gọi là giải thuật dấu – dấu. Hệ rời rạc sử dụng giải thuật này được ứng dụng
trong viễn thông nơi đòi hỏi tính toán nhanh và thực hiện đơn giản.
Phương trình (5.45) còn được áp dụng trong trường hợp có nhiều thông số hiệu
e
chỉnh, khi đó  trở thành 1 vector là gradient của sai số đối với các thông số tương

ứng. Ứng dụng của luật MIT được biểu diễn bằng 2 ví dụ sau:
Ví dụ 5.4: Hiệu chỉnh độ lợi nuôi tiến
Xét vấn đề hiệu chỉnh độ lợi nuôi tiến với mô hình và đối tượng đều có hàm truyền
G(s). Sai số là:
e  y  ym  G  p  u C  G  p  0Uc
Với u C là tín hiệu đặt, y m là ngõ ra mô hình, y là ngõ ra đối tượng,  là thông số
hiệu chỉnh, và p  d / dt là toán tử vi phân. Độ nhạy khi ấy bằng:
e
 G  p  u C  ym / 0

d e
Luật MIT được cho:   y ' ym 0
dt 
Nếu dấu của 0 được biết , khi ấy đưa ra    '/ 0 .
Sự thay đổi của tham số  tỉ lệ với tích sai số e và ngõ ra của mô hình y m
222
Ví dụ trên không dùng việc xấp xỉ: khi luật MIT được áp dựng vào những vấn đề
phức tạo hơn thì cần phải có xấp xỉ để tính được độ nhạy.
Ví dụ 5.5. MRAS cho hệ bậc nhất
Xét hệ thống được mô tả bởi phương trình:
dy
 ay  bu
dt
Với u là biến điều khiển, y là ngõ ra được đo lường.
Giả sử mong muốn có được hệ vòng kín được mô tả bởi:
dym
 a m y m  b m u c
dt
Mô hình kèm theo hoàn hảo có thể đạt được với bộ điều khiển :
u  t   t 0u c  t   s0 y  t 
Với tham số t o  b m / b , s0  (a m  a) / b
Chú ý hồi tiếp sẽ là dương nếu a m <a, nghĩa là mô hình mong muốn thì chậm hơn
quá trình. Để áp dụng luật MIT, sử dụng sai số e  y  y m ,với y là ngõ ra hệ kín.
Ta có:
bt 0
y uc
p  a  bs0
Với p là toán tử vi phân. Độ nhạy có thể tính được bằng cách lấy đạo hàm riêng
phần tham số của bộ điều khiển s 0 và t 0 :
e b
 uC
t 0 p  a  bs0
e b 2 t 0 b
 u  y
s0 (p  a  bs0 ) 2 p  a  bs0
c
Các công thức này không thể dùng vì thông số đối tượng a và b chưa biết. Vì vậy
cần phải làm xấp xỉ để có được luật hiệu chỉnh tham số thực tế. Để thực hiện điều này, đầu
tiên cần quan sát với mỗi giá trị tối ưu của tham số bộ điều khiển, ta có:
p  a  bs 0  p  a m
Hơn nữa cần chú ý là b có thể được bao gồm trọng hệ số tốc độ thích nghi  . Bởi
vì nó xuất hiện trong tích b ,điều này đòi hỏi dấu của b phải được biết. Sau khi xấp xỉ,
luật cập nhật các tham số điều khiển có được là:
dt 0 1
  ( u c )e
dt p  am
dt 0 1
 ( y)e
dt p  am
223
Ví dụ trên chỉ cách sử dụng luật MIT để tạo được luật hiệu chỉnh thông số.
5.3.3. Nội dung, phương pháp thiết kế MRAS
Có 3 phương pháp cơ bản để phân tích và thiết kế hệ MRAS:
- Phương pháp tiếp cận gradient
- Hàm Lyapunov
- Lý thuyết bị động
Phương pháp gradient được dùng bởi Whitaker đầu tiên cho hệ MRAS. Phương
pháp này dựa vào giả sử tham số của bộ hiệu chỉnh thay đổi chậm hơn các biến khác của
hệ thống. Giả sử này thừa nhận có sự ổn định giả cần thiết cho việc tính toán độ nhạy và
cho cơ cấu hiệu chỉnh thích nghi. Phương pháp tiếp cận gradien không cho kết quả cần
thiết cho hệ thống kín ổn định. Bộ quan sát được đưa ra để áp dụng lý thuyết ổn định
Lyapunov và lý thuyết bị động được dùng để bổ sung cho cơ cấu thích nghi.
Đối với hệ thống có tham số điều chỉnh được như trong hình 5.9, phương pháp
thích nghi sử dụng mô hình chuẩn cho một cách hiệu chỉnh tham số tổng quan sát để có
được hàm trên hệ thống vòng kín gần với mô hình. Đây gọi là vấn đề mô hình kèm theo.
Một câu hỏi đặt ra là chúng ta làm cho sai lệch nhỏ như thế nào, điều này phụ thuộc vào
mô hình hệ thống và tín hiệu đặt. Nếu có thể làm cho sai số bằng 0 đối với mọi tín hiệu yêu
cầu gọi là mô hình kèm theo hoàn hảo.
Xét hệ một đầu vào, một đầu ra có thể là liên tục hay rời rạc có phương trình:
B
yt  ut (5.48)
A
với u(t) là tín hiệu điều khiển, y(t) là ngõ ra. Ký hiệu A, B là những đa thức theo
biến s hay z. giả sử bậc của A  B nghĩa là hệ thống là hợp phức (đối với hệ liên tục) và
nhân quả đối với hệ rời rạc. Giả sử hệ số bậc cao nhất của A là 1. Tìm bộ điều khiển sao
cho quan hệ giữa tín hiệu đặt u C và tín hiệu ra mong muốn y m được cho bởi:
Bm
y m (t)  u c (t) (5.49)
Am
Với A m , Bm cũng là đa thức theo biến s hoặc z.
Luật điều khiển tổng quát được cho bởi:
Ru(t)  Tu C (t)  Sy(t) (5.50)
Với R, S, T là các đa thức. Luật điều khiển này được xem như vừa có thành phần
hồi tiếp âm với hàm truyền -S/R và thành phần nuôi tiến với hàm truyền T/R như hình 5.11
224
Bộ điều khiển Quá
trình y
uc u B
Ru = Tuc - Sy
A
Hình 5. 11:Hệ vòng kín với bộ điều khiển tuyến tính tổng quát
Khử u ở 2 phương trình (5.48) và (5.50) được phương trình sau cho hệ thống vòng
kín:
(AR  BS)y  BTu C (5.51)
Để đạt được đáp ứng vòng kín mong muốn, thì AR + BS phải chia hết cho A m , các
zero của đối tượng, khi cho B = 0, sẽ là zero của hệ nếu không bị khử bởi cực vòng kín.
Bởi vì các điểm zero không ổn định không thể bị khử nên có thể phân tích thành
 
B  B B , Trong đó B chứa những thành phần có thể dùng zero khử cực, B là thành
phần còn lại.
Theo phương trình (5.51) AR+BS là đa thức đặc trưng của hệ thống được phân tích
thành 3 thành phần: khử zero của đối tượng B ; cực mong muốn của mô hình được cho
bởi A m ; các cực của bộ quan sát A 0
Vì thế : AR+BS=B A 0A m (5.52)
gọi là phương trình Diophantine (hay là phương trình nhận dạng Benzout). Vì B có thể
khử nên:
R  B R1 (5.53)
Chia phương trình (5.51) cho B sẽ được:
A.R1  B .S  A 0A m (5.54)
Vì yêu cầu là phải giống đáp án ứng mong muốn nên tử số (5.51) phải chia hết cho
Bm , nếu không thì sẽ không có lời giải cho bài toán thiết kế. Vì vậy:
Bm  B .B'm (5.55)
T  A 0B'm
Điều kiện để đảm bảo đảm bảo tồn tại lời giải là :
Bậc (A 0 )  2 )bậc (A)- bậc( A m ) - bậc ( B )-1
Bậc( A m ) - bậc ( Bm ) ≥ bậc (A) - bậc (B)
Giả sử tất cả các zero đều khử , khi đó có thể viết (5.54) lại như sau
A0A m  AR1  b0S
225
Nhân 2 vế cho y và dùng phương trình (5.48) ta được :
A0A m y  BR1u  b0Sy  b0 (Ru  Sy) (5.56)
Các thông số ở vế trái đã biết, vế phải chưa biết. Đa thức T có được trực tiếp từ
phương trình (5.55). Các tham số mô hình của phương trình (5.56) bây giờ có thể được
dùng để ước lượng các tham số chưa biết của bộ điều khiển. Điều này dẫn đến hệ MRAS
trực tiếp.
*Hệ tuyến tính tổng quát
Hệ SISO được mô tả bởi phương trình sau:
Ay = Bu
Với đặc tính hệ thống mong muốn đạt được : A m ym  Bmu c
Bộ điều khiển : Ru  Tu c  Sy (*)
BT
Hệ vòng kín được mô tả: y  uC
AR  BS
AT
Thay y vào (*) ta tính được: u  uC
AR  BS
Sai số e  y  ym
Bây giờ cần phải xác định các đạo hàm riêng của sai số đối với từng số hiệu chỉnh
để tìm luật chỉnh định thông số các hàm độ nhạy.
Đặt ri ,si , t i là các hệ số của đa thức R, S, T. Các hàm độ nhạy được cho bởi:
BT B u
e uC  m C
AR  BS Am
e BTAp k i Bp k i
  u   u i  1,...k
ri AR  BS
C
(AR  BS) 2
e BTBpli Bpli
 uC   y i  0,...,l
si (AR  BS) 2 AR  BS
e Bp mi
 uc i  0,...,m
t i AR  BS
Trong đó k=bậc (R),l=bậc(S), m=bậc(T).
Vế phải các phương trình trên còn chứa A, B là các thông số chưa biết nên không
tính được các hàm độ nhạy. Một cách xấp xỉ để có được luật cập nhật có thực tế là :
AR  BS  A 0A m B
Suy ra các hàm độ nhạy :
226
e B p k i
 u
ri A0A m
Tương tự cho si và t i
Tuy nhiên vế phải vẫn còn B là chưa biết. Nếu tất cả các zero đều được khử, khi
đó ta có B  b0 . Nếu dấu của b 0 biết được thì có thể thực hiện được luật cập nhật thông
số, thành phần b 0 có thể bao gồm trong cả  . Nên có thể suy ra luật cập nhật hiệu chỉnh
thông số như sau:
dri p k i
 e u i=0,……k= bậc (R)
dt A 0A m
ds i pli
 e y i=0,1…l=bậc (S)
dt A 0A m
dt i p mi
 e uC i=0,…..,m=bậc(T)
dt A0A m
*Nhận xét :
1
- Cần phải xây dựng 3 trạng thái của bộ lọc cho luật hiệu chỉnh trên.
A0Am
1
- Sự thay đổi các tham số này tỉ lệ với tích sai số e và tín hiệu bộ lọc
A0Am
- Để có được luật điều chỉnh các tham số trên cần phải giả sử các zero phải ổn định
và dấu của b 0 phải được biết
- Có thể tránh được giả sử này bằng cách sử dụngcác thuật toán phức tạp hơn như
ước lượng trạng
* Tiêu chuẩn cực tiểu hóa
- Luật MIT có thể được sử dụng cho các hàm tổn thất khác.
- Luật hiệu chỉnh các thams số có thể đạt được bằng cách tính gradient hàm tổn thất
đối với các tham số và sự thay đổi các tham số phải ngược dấu với gradient.
- Phương pháp này cần biết các tham số của mô hình đối tượng để tính toán độ
nhạy. Tuy nhiên điều này là không có thực và do đó có thể sử dụng phương pháp xấp xỉ
hay bằng các bộ ước lượng thông số.
* Sai số và sự hội tụ tham số
Hệ thống thích nghi sử dụng mô hình chuẩn dựa vào ý tưởng là làm cho sai số
e  y  ym tiến tới zero. Điều này không có nghĩa là các tham số điều khiển tiến tới giá trị
đúng của nó (ví dụ như trường hợp tín hiệu = 0).
227
Ví dụ 5.6: Hội tụ sai số
Giả sử hệ thống có sơ đồ như hình 5.12:
Mô hình
ym
0G(s)
-
 e
  
G s
+
Đối tượng
uc u y
 G(s)
Hình 5. 12: Mô hình hội tụ sai số
Ngõ ra: y=u

Luật điều khiển : u  u c
Mô hình: y m  0 u c
Sai số: e  y  ym  u c  0u c  (  0 )u c
Luật hiệu chỉnh tham số theo phương pháp gradient
d e
 e  u c2 (  0 )
dt 
Lời giải cho phương trình vi phân ở trên là:
  t   0  [(0)  0 ]eIt (*)
t
Trong đó I t   u c2    d
0
  0  là giá trị ban đầu của 
Và vì vậy sai số e trở thành :
e(t)  u c  t [  0   0 ]eIt
Do I t  0 nên khi t   thì e(t)  0 ngay cả khi tín hiệu điều khiển u c (t)  0
Giá trị giới hạn của  phụ thuộc vào tính chất của u c () (hội tụ hoặc phân kì) ( do
(t) tính theo biểu thức (*) ).
Ví dụ trên cho biết được sai số e → 0 tuy nhiên tham số 0 không tiến đến giá trị
đúng của nó. Đây là tính chất của hệ thống thích nghi sử dụng mô hình chuẩn. Điều kiện
chính xác để hội tụ tham số là tín hiệu kích thích phải luôn tồn tại.
228
* Ổn định của vòng điều khiển thích nghi
Ở ví dụ trên độ biến thiên tham số  tỉ lệ với bình phương tín hiệu điều khiển u c .
Điều này hợp lí trong một số trường hợp là khi tín hiệu điều khiển u c càng lớn thì càng dễ
phát hiện giá trị bị sai của  .
Tuy nhiên độ thay đổi của tham số điều chỉnh phụ thuộc vào biên độ của tín hiệu
điều khiển có thể dẫn đến không ổn định. Ví dụ sau đây cho luật điều khiển không phụ
thuộc vào u c :
Ví dụ 5 .7: Giả sử hệ thống có mô hình ở hình 5.13
ym
0 G
Mô hình G1:1 -
e
uc
 
+
y
 G
 

s
Cơ cấu hiệu chỉnh
Hình 5. 13: Hệ thống thích nghi mô hình tham chiếu cho việc chỉnh định độ lợi nuôi tiến
Vấn đề là điều chỉnh   0 . Giả sử hàm truyền được cho bởi

1
G(S) 
s  a1s  a 2
2
Sai số e  G  p     0  u c trong đó p biểu thị cho phép lấy đạo hàm.

Vì vậy:
e y
 G(p)u c  m0
 
Điều chỉnh tham số theo luật MIT:
d e y '
  'e   'e m0  ey m với 
dt   0
Hệ thống điều khiển thích nghi vì vậy biểu diễn được bởi các phương trình vi phân
sau:
d 2 ym dy
2
 a 1 m  a 2 y m  0 u c (1)
dt dt
229
d2 y dy
2
 a1  a 2 y  u c (2)
dt dt
d
 eym   (y  y m )y m (3)
dt
Phương trình (1) có thể giải được nếu cho sẵn hàm u c , xem như biến y m biết trước
Đạo hàm (2) ta được
d3 y d2 y dy d du
3
 a1 2  a 2  uc   t  c
dt dt dt dt dt
Thay vào (3) ta được :
d3 y d2y dy du
 a1  a2   (y  y m )y m u c  (t) c
dt dt dt dt
du c
  (y m (t)u c (t)y(t)  y m2 (t)u c  (t)
dt
Suy ra :
d3 y d2 y dy du
3
 a 1 2
 a 2  u c (t)y m (t)y  t     t  c  u c (t)y m2  t 
dt dt dt dt
Đây là phương trình vi phân tuyến tính biến thiên theo thời gian. Để hiểu được hệ
thống ta thực hiện cách thử như sau:
- Đầu tiên giả sử u c là hằng số u 0c
- Ngõ ra mô hình khi đó sẽ có giá trị cân bằng là y 0m
Giả sử cơ cấu hiệu chỉnh thích nghi được nối vào khi đạt đến điểm cân bằng (trạng
thái cân bằng ). Khi đó phương trình (2) ở trên sẽ có các hệ số hằng và có lời giải trạng thái
cân bằng là:
y  t   y 0m  0 u c0 / a 2
' 0 2
ổn định nếu a1a 2 > u 0c y0m  (u c )
a2
* Luật hiệu chỉnh bổ sung
Những hiểu biết có được từ việc tính toán trong ví dụ 5.6 chỉ ra rằng cần phải bổ
sung cho luật MIT. Luật MIT là phương pháp gradient cơ bản. Độ giảm có được bằng luật
MIT được quyết định bởi tham số  , số này là do người dùng chọn.
Có thể đạt được phương pháp gradient bổ sung mà tỉ lệ hiệu chỉnh không phụ thuộc
vào biên độ của tín hiệu (đặt) yêu cầu. Một khả năng là làm chuẩn hóa và thay thế luật MIT
bởi:
230
e
e
d 
  T
dt  e   e 
   
     
Tham số   0 được đưa vào để tránh trường hợp chia cho 0
Có thể nhận thấy rằng tỷ lệ hiệu chỉnh tham số phụ thuộc vào biên độ của tín hiệu
yêu cầu một lượng nhỏ bởi vì do nhiễu đo lường.
* Trình tự thiết kế bộ điều khiển thích nhi theo mô hình chuẩn
B B
Đối tượng y(t)  u(t) Mô hình chuẩn y(t)  m u c (t)
A Am
Bước 1: Phân tích B dưới dạng : B  B B
Bước 2: Kiểm tra mô hình chuẩn có thoả mãn điều kiện tồn tại lời giải
Bm  B  B'm
Bậc (A m ) - Bậc( (Bm )  Bậc (A) - Bậc( (B)
Bước 3: Chọn bậc của A 0
Bậc (A0 )  2Bậc (A) - Bậc( (A m ) - Bậc( (B )  1
Bước 4: Chọn bậc của R, T, S:
bậc (R)  bậc (A0 )  bậc (A m )  bậc (A)  bậc (B )
mT  bậc (T)  bậc (A0 )  bậc (B'm )
m 2  bậc (S)  min  bậc (R),[ bậc (A0 )  bậc (A m ) - bậc (B )] 
Bước 5: Viết cụ thể luật MIT gần đúng cập nhật từng thông số sử dụng công thức
dt i sgn(b0 )p mT i
 e( uc ) (i  0,...,m T )
dt A 0A m
dsi sgn(b0 )p ms i
 e( ) (i  0,...,ms )
dt A 0A m
dri sgn(b0 )p n R i
 e( u) (i  0,...,n R )
dt A 0A m
Bước 6: Mô phỏng hệ thống, chọn hệ số  phù hợp
Chú ý: Trong một số trường hợp đơn giản, khi có thể xác định được ngay bộ điều
khiển có cấu trúc phù hợp thì không cần thực hiện bước 1 đến bước 4. Sử dụng luật MIT
tổng quát để rút ra luật cập nhật thông số.
231
b
Ví dụ 5.8: Cho đối tượng điều khiển : y(t)  u(t) , giả sử ta không biết chính xác a
sa
và b
Yêu cầu: thiết kế hệ thống điều khiển thích nghi sao cho đáp ứng của hệ thống bám
2
theo mô hình chuẩn : ym (t)  u c (t)
sa
Giải

B  1

Bước 1: Phân tích B dưới dạng : B  B B  

B  b
Bước 2: Kiểm tra mô hình chuẩn có thoả mãn điều kiện tồn tại lời giải
2
Bm  B  B'm  B'm 
b
Bước 3: Chọn bậc của A 0

 2 1  0 1  0
 Chọn A0  1
Bước 4: Chọn bậc của R, T, S:
bậc (R)  bậc (A0 )  bậc (A m )  bậc (A)  bậc (B )  0  1  1  0  0
mT  bậc (T)  bậc (A0 )  bậc (B'm )
m 2  bậc (S)  min  bậc (R),[ bậc (A0 )  bậc (A m ) - bậc (B )] 
 min 0,[0+1-0]  0
 Luật điều khiển: r0u(t)  t 0u c (t)  s0 y(t)
Không mất tính tổng quát, chọn r0  1
Vecto thông số cần cập nhật là:   [t 0 ,s0 ]T
Bước 5: Viết cụ thể luật MIT gần đúng cập nhật từng thông số
dt 0 1 1
 e( u c )  e( uc )
dt s  am s2
ds0 1 1
 e( y)  e( y)
dt s  am s2
trong đó sai số giữa ngõ ra đối tượng và ngõ ra mô hình chuẩn: e(t)  y(t)  y m (t)
Sơ đồ mô phỏng bằng Matlab Simulink :
232
Hình 5. 14: Sơ đồ mô phỏng bằng Matlab Simulink ví dụ 5.8
233
Hình 5. 15: Đáp ứng của hệ thống trong ví dụ 5.8
Kết quả điều khiển thích nghi: sau 1 vài chu kỳ cập nhật thông số, đáp ứng của hệ
thống điều khiển đã bán rất tốt theo mô hình chuẩn
5.4. HỆ ĐIỀU KHIỂN TỰ CHỈNH ĐỊNH (STR – SeLF Tuning Regulator)
5.4.1. Khái niệm về hệ điều khiển tự chỉnh định
Quá trình thiết kế hệ thống điều khiển gồm hai bước chính:
- Mô hình hoá/ nhận dạng mô hình của đối tượng
- Thiết kế bộ điều khiển (có thể là PID, phân bố cực, toàn phương tuyến tính – LQ,
điều khiển theo mô hình chuẩn – MRC,…) dựa trên mô hình tính toán đã nhận dạng
Hệ điều khiển tự chỉnh định là hệ thống được thiết kế nhằm thực hiện trực tuyến
đồng thời hai nhiệm vụ:
- Nhận dạng thông số mô hình
- Tính toán luật điều khiển
Bộ tự chỉnh định (STR) dựa trên quan điểm phân tích, đánh giá các thông số chưa
biết ý tưởng cơ bản được minh họa trong hình 5.16. Các thông số chưa biết được đánh giá
trực tuyến (on-line) bằng cách dùng phương pháp ước lượng đệ quy. Các thông số ước
lượng được xem như là thông số thực, độ không tin cậy của các ước lượng là bỏ qua. Đây
gọi là qui tắc tương đồng nhất định
234
Hình 5. 16: Mô hình tự chỉnh định
Nhiều phương pháp ước lượng khác nhau có thể được vận dụng như xấp xỉ ước
đoán, bình phương tối thiểu,..Khối ‘thiết kế’ ở hình 5.16 tượng trưng cho bài giải trực tuyến
các bài toán thiết kế hệ thống với các thông số chưa biết trước. Đây là bài toán thiết kế cơ
bản. Điển hình cho phương pháp này là phương pháp bình phương cực tiểu, bình phương
tuyến tính , đặt cực, model- following. Phương pháp thiết kế được lựa chọn phụ thuộc vào
đặc tính của hệ thống vòng kín. Mục tiêu của mục này là đưa ra quan điểm cơ bản và tính
chất của các bộ tự chỉnh định. Bộ tự chỉnh định ban đầu chỉ áp dụng cho các hệ thống lấy
mẫu dữ liệu, nhưng các thuật toán liên tục và hỗn hợp cũng được phát triển.
Trong mục này giả sử hệ thống là SISO:
A(q)y(t)  B(q)u(t)  C(q)e(t) (5.57)
Trong đó: y(t) là tín hiệu ra,; u(t) là tín hiệu vào; e(t) là chuỗi phân bố Gausse; A,
B, C là các đa thức theo q (toán tử sai phân tới).
Giả thiết bậc A = bậc C = n và bậc A – bậc C = d 0
Quá trình điều khiển thường được mô tả ở dạng toán tử q 1 . Đa thức đặc tính có
dạng:
A* (z)  z n A(z 1 ) với n = bậc A
Khi đó mô hình (5.16) được mô tả như sau :
A* (q 1 )y(t)  B* (q 1)u(t  d 0 )  C* (q 1)e(t)
Bộ tự chỉnh đinh dựa trên quan điểm ước lược các thông số của quá trình. Phương
pháp dễ hiểu là ước lượng các thông số của hàm truyền của quá trình và nhiễu (thuật toán
thích nghi gián tiếp). Các thông số của bộ chỉnh định sẽ không được cập nhật trực tiếp mà
là gián tiếp thông qua ước lượng mô hình của hệ thống. Bộ điều khiển thích nghi loại này
235
dựa trên phương pháp bình phương tối thiểu và điều khiển bám theo (Kalman 1958).
Phương pháp này không dựa vào đặc tính vòng kín của hệ thống .
Các thông số của bộ chỉnh định cũng có thể ước lượng trực tiếp gọi là thuật toán
thích nghi trực tiếp. Cả hai phương pháp trực tiếp và gián tiếp đều gọi là điều khiển tự
chỉnh định .
5.4.2. Bộ tự chỉnh định gián tiếp
Trình tự thiết kế bộ điều khiển tự chỉnh định gián tiếp
Bước 1: Viết các công thức ước lượng bình phương tối thiểu đệ quy để cập nhật trực
tuyến thông số của đối tượng (hàm truyền hoặc phương trình trạng thái)
Bước 2: Viết biểu thức xác định luật điều khiển là hàm của tham số của đối tượng
đã cập nhật ở bước 1
- Điều khiển PID
- Điều khiển theo mô hình chuẩn
- Điều khiển phân bố cực
- Điều khiển LQR
-…
Bước 3: Mô phỏng hoặc thực nghiệm chọn hệ số quên của giải thuật ước lượng bình
phương tối thiểu phù hợp
Ví dụ 5.9: Cho đối tượng bậc 1 có thông số chưa biết, rời rạc hoá đối tượng với chu kỳ lấy
mẫu T  0.1s ta được hàm truyền có dạng:
b
y(k)  u(k)
qa
Hãy thiết kế bộ điều khiển PI tự chỉnh sao cho hệ thống kín có cặp cực phức với
  0.707 và n  4
Hình 5. 17: Ví dụ 5.9
236
Giải
Bước 1: Xây dựng các công thức ước lượng trực tuyến thông số hàm truyền rời rạc
của đối tượng:
Ta có:
Y(z) b bz 1
G(z)   
U(z) z  a 1  az 1
 (1  az 1 )Y(z)  bz 1U(z)
1

Z
y(k)  az 1y(k  1)  bu(k  1)
Đặt :
(k)    y(k  1) u(k  1) 
T
  a b
T
 y(k)  T (k)
Thuật toán ước lượng bình phương tối thiểu đệ qui:
^ ^
(k)  (k  1)  L(k)(k)
^
(k)  y(k)   (k) (k  1)
T
P(k  1)(k)
L(k) 
  T (k)P(k  1)(k)
1 P(k  1)(k)T (k)P(k  1)
P(k)  [P(k-1)- ]
   T (k)P(k  1)(k)
Trong đó:
^
0  rand(2,1)
P(0)  I 2x2
Chạy thuật toán ước lượng tham số trực tuyến, ở thời điểm k ta được:
^ ^ ^ 
(k)  a b 
 
Bước 2: Thiết kế bộ điều khiển PI dựa vào thông số hàm truyền nhận dạng ở bước
1
Hàm truyền bộ điều khiển PI:
K IT z  1
G C (z)  K P 
2 z 1
237
Phương trình đặc trưng của hệ kín:
1  G C (z)G(z)  0
^
K T z 1 b (
 1  (K P  I )( )  0
2 z 1 ^
za
^ ^ ^ ^ ^ ^
 z 2  (b K P  0.25b K I  a  1)z  (0.25b K I  b K P  a)  0 (1)
Cặp cực phức mong muốn:
*
z12  re  j
r  e Tn  0.754
  Tn 1  2  0.2828(rad)
 z12
*
 re  j  0.754e  j0.2828
 z12
*
 re  j  0.724  j0.21
Phương trình đặc trưng mong muốn:
(z  z1* )(z  z*2 )  0
 (z  0.724  j2.1)(z  0.724  j2.1)  0
 z 2  1.4474z  0.568  0 (2)
Cân bằng (1) và (2) ta được:
^ ^ ^
b K P  0.25b K I  a  1  1.447
 ^ ^ ^
0.25b K  b K  a  0.568
 I P
 ^
K I  1.21 / b

^ ^
K  (0.508  a) / b
 P
238
Hình 5. 18: Mô phỏng hệ thống điều khiển PI thích nghi gián tiếp
Hình 5. 19: Khối ước lượng bình phương tối thiểu đệ quy
239
Hình 5. 20: Bộ điều khiển PI với các hệ số tính theo thông số của đối tượng
Hình 5. 21: Đáp ứng của hệ thống
Đáp ứng của hệ kín sau 1 chu kỳ điều khiển đạt được chất lượng mong muốn
tương ứng với cặp cực phức đã chọn
5.5. ĐIỀU KHIỂN HOẠCH ĐỊNH ĐỘ LỢI
5.5.1. Khái niệm
Hoạch định độ lợi là một phương pháp điều khiển đơn giản áp dụng để điều khiển
đối tượng phi tuyến hoặc đối tượng có thông số thay đổi theo điều kiện làm việc
240
Trong một số trường hợp có thể đo được các biến có liên quan chặt chẽ đến sự thay
đổi đặc tính động của đối tượng. Những biến này có thể được sử dụng để thay đổi thông
số của bộ điều khiển, theo công thức tính toán trước
Thông số bộ điều khiển có thể được tính toán trước cho các điểm làm việc khác
nhau và lưu trữ trong bộ nhớ
Sơ đồ khối điều khiển hoạch định độ lợi:
Hình 5. 22: Sơ đồ khối điều khiển hoạch định độ lợi
5.5.2. Thiết kế bộ điều khiển hoạch định độ lợi

Không có phương pháp tổng quát thiết kế bộ điều khiển hoạch định độ lợi, mỗi lớp
đối tượng có đặc thù cần xem xét riêng
Vấn đề chính là xác định biến nào được sử dụng làm biến hoạch định độ lợi
Biến hoạch định phải phản ánh được đặc tính phi tuyến hoặc đặc tính thay đổi theo
điều kiện làm việc của đối tượng
Biến hoạch định phải biến đổi chậm
Phương pháp thiết kế bộ điều khiển hoạch định độ lợi thường sử dụng bao gồm
các bước:
- Chọn biến hoặc các biến hoạch đinh
- Tuyến tính hoá mô hình đối tượng quanh một số điểm làm việc
- Thiết kế bộ điều khiển tuyến tính cho mỗi điểm làm việc sử dụng mô hình tuyến
tính tương ứng
- Khi vận hành, nội suy thông số thông số bộ điều khiển dựa trên giá trị của biến
hoạch định
Ví dụ 5.10: Cho hệ thống xe – lò xo như hình vẽ.
Hình 5. 23: Hệ thống xe – lò xo ví dụ 5.10

241
Quan hệ vào ra của hệ thống mô tả bởi phương trình vi phân :
m y(t)  b y(t)  ky(t)  u(t)

1/ m
G(s) 
s 2  (2 / m)s  (5 / m)
trong đó u(t) là tín hiệu vào (lực điều khiển), y(t) là tín hiệu ra (vị trí xe), m  0.5  5(kg)
là khối lượng xe (khối lượng xe thay đổi trong quá trình vận hành),
b  2N.s / m,k  5N / m là độ cứng của lò xò
Yêu cầu: Giả sử có thể đo được khối lượng vật nặng, hãy thiết kế bộ điều khiển
hoạch định độ lợi sao cho hệ thống bám theo mô hình chuẩn
1
G m (s) 
s 2  2s  1
Giải
Thiết kế bộ điều khiển theo mô hình chuẩn, thông số bộ điều khiển phụ thuộc biến
hoạch định là khối lượng của vật nặng

B  1

Phân tích B dưới dạng : B  B B  

B  1 / m
Kiểm tra các điều kiện tồn tại bộ ĐK theo mô hình chuẩn
Bm  B  B'm  B'm  m
Chọn bậc của A 0

 Chọn A0  1  A0  s  5
Chọn bậc của R 1 và S :
bậc (R1 )  bậc (A0 )  bậc (A m )  bậc (A)  1  2  2  1
bậc (S)  min [ bậc (R1 )  bậc (B )] [bậc (A0 ) + bậc (A m ) - bậc (B )]}
 min [1+0],[1+2-0]  1
R1  r0s  r1

S  s0s  s1
Tính R 1 và S bằng cách giải phương trình Diophantine
242
AR1  BS  A 0A m
2 5 1
 (s 2  s  )(r0s  r1 )  (s 0s  s1)  (s  5)(s 2  2s  1)
m m m
2 5 2 1 5 1
 r0s3  ( r0  r1 )s 2  ( r0  r1  s 0 )s  ( r1  s1)
m m m m m m
 s  7s  11s  5
3 2
r0  1 r0  1
 2 
( r0  r1 )  7 r1  7  2
 m  m
5 2 1  4
r 
m 0 m 1 m 0 r  s  11  0
s  11m   19
  m
 5 r  1 s 5 s  5m  10  35
 m 1
m
1  1 m
Tính R và T :
R  R1B  R  (s  r1)
T  A0B'm  T  (s  5)m
Hình 5. 24: Sơ đồ khối hệ thống điều khiển hoạch định độ lợi theo mô hình chuẩn sau khi
thiết kế
243
Hình 5. 25: Sơ đồ mô phỏng hệ thống điều khiển hoạch định độ lợi theo mô hình chuẩn
Hình 5. 26: Kết quả điều khiển khi chưa hoạch định độ lợi
Kết quả điều khiển khi chưa hoạch định độ lợi với bộ điều khiển MRC được thiết
kế dựa vào giá trị m0  1kg . Chất lượng điều khiển càng kém khi khối lượng vật nặng
càng sai lệch so với giá trị m 0
244
Hình 5. 27: Kết quả điều khiển khi hoạch định độ lợi
Kết quả điều khiển khi hoạch định độ lợi bộ điều khiển MRC theo khối lượng vật
nặng. Chất lượng điều khiển bám theo mô hình chuẩn rất tốt dù bất chấp sự thay đổi khối
lượng của vật nặng.
5.6. ỨNG DỤNG MABLAB MÔ PHỎNG HỆ THỐNG ĐIỀU KHIỂN THÍCH NGHI
5.6.1. Điều khiển thích nghi theo mô hình chuẩn
b
Xét một đối tượng điều khiển: y(t)  u(t)
s(s  1)
trong đó:
+ b là thông số chưa biết của đối tượng và thay đổi theo thời gian, giả sử b thay đổi
trong miền [0.1  10]
+ y(t) : đầu ra quá trình
+ u(t) : đầu vào quá trình
Yêu cầu: Thiết kế hệ thống điều khiển thích nghi sao cho đáp ứng của hệ thống bám
theo mô hình chuẩn :
1
ym (t)  u c (t)
s2  s  1
trong đó: y m (t) : đầu ra mong muốn, u c (t) : đầu vào hệ thống
Giải
Dễ thấy bộ điều khiển tỉ lệ: u(t)  K(u c (t)  y(t)) là phù hợp với bài toán này vì
tín hiệu ra của hệ thống kín là:
Kb
y(t) 
s  s  Kb
2
245
 có thể chỉnh được K để đáp ứng hệ kín giống mô hình chuẩn
Sai số giữa tín hiệu ra của hệ kín và tín hiệu ra của mô hình:
bK 1
e(t)  - 2 u c (t)
s  s  Kb s  s  1
2
Luật MIT cập nhật thông số bộ điều khiển:

dK e e b(s 2  s)
 e trong đó :  2 uc
dt K K (s  s  bK) 2
Dễ thấy rằng:
s2  s
u(t)  2 u c (t)
s  s  bK
K b
  e( 2 u(t))
t s  s  bK
Chú ý là không thể dùng công thức trên để cập nhật thông số bộ điều khiển vì ta
không biết b
Xấp xỉ luật MIT : chú ý rằng trạng thái tối ưu, đa thức đặc trưng của hệ thống điều
khiển vòng kín đồng nhất bằng đa thức đặc trưng của mô hình chuẩn, tức là:
s2  s  Kb  s 2  s  1
Gộp thông số b ở tử số của các công thức cập nhật thông số bộ điều khiển vào hệ
số thích nghi 
 Luật MIT gần đúng cập nhật thông số bộ điều khiển như sau:
K 1
 e( 2 u)
t s  s 1
Chọn   0.1
Ta có sơ đồ mô phỏng Matlab hệ thống như sau:
246
Hình 5. 28: Sơ đồ mô phỏng Matlab
Hình 5. 29: Kết quả mô phỏng khi b=0.1
247
Hình 5. 30:Kết quả mô phỏng khi b=1
Hình 5. 31: Kết quả mô phỏng khi b=5
248
5.6.2. Điều khiển tự chỉnh gián tiếp
Cho đối tượng bậc 2 có thông số chưa biết, rời rạc hoá đối tượng với chu kỳ lấy
mẫu T  0.2(s) ta được hàm truyền có dạng:
b1q  b 2
y(k) 
q 2  a1q  a 2
Hãy thiết kế bộ điều khiển tự chỉnh gián tiếp sao cho đáp ứng của hệ thống kín
bám theo mô hình chuẩn:
4
G m (s) 
s  4s  4
2
Giải
Rời rạc hoá mô hình chuẩn, ta được:
 G (s)  0.0615z  0.0471
G m (z)  (1  z 1 )Z  m   2
 s  z  1.341z  0.449
Bước 1: Xây dựng các công thức ước lượng trực tuyến thông số hàm truyền rời
rạc, ta có:
Y(z) b1z  b 2 b1z 1  b 2z 2
G(z)   
U(z) z 2  a1z  a 2 1  a1z 1  a 2z 2
 (1  a1z 1  a 2z 2 )Y(z)  (b1z 1  b 2z 2 )U(z)
1

Z
y(k)  a1y(k  1)  a 2 y(k  2)  b1u(k  1)  b 2u(k  1)
Đặt :
(k)    y(k  1)  y(k  2) u(k  1) u(k  2) 
T
   a1 a 2 b1 b 2 
T
 y(k)  T (k)
Thuật toán ước lượng thông số đối tượng:
^ ^
  (k  1)  L(k)(k)
^
(k)  y(k)  T (k) (k  1)
P(k  1)(k)
L(k) 
  T (k)P(k  1)(k)
1 P(k  1)(k)T (k)P(k  1)
P(k)  [P(k-1)- ]
   T (k)P(k  1)(k)
Trong đó:
249
^
0  rand(4,1)
P(0)  I 4x4
Chạy thuật toán ước lượng tham số trực tuyến, ở thời điểm k ta được:
^ ^ ^ ^ ^ 
(k)  a1 a 2 b1 b 2 
 
Bước 2: Thiết kế bộ điều khiển theo mô hình chuẩn dựa vào thông số hàm truyền
nhận dạng ở bước 1
B  q  b 2 / b
 
Phân tích B dưới dạng : B  B B  

B  b1
Kiểm tra các điều kiện tồn tại bộ ĐK theo mô hình chuẩn
Bm  B  B'm  B'm  (0.0615q  0.471) / b1
Chọn bậc của A 0

 Chọn bậc của A 0 bằng 0  A0  1
Chọn bậc của R 1 và S :
bậc (R1 )  bậc (A0 )  bậc (A m )  bậc (A)  0  2  2  0
bậc (S)  min [ bậc (R1 )  bậc (B )] [bậc (A0 ) + bậc (A m ) - bậc (B )]}
 min [0+1],[0+2-0]  1
R1  r0

S  s0q  s1
Tính R 1 và S bằng cách giải phương trình Diophantine
AR1  BS  A 0A m
^ ^ ^
 (q 2  a1 q  a 2 )r0  b1 (s 0q  s1 )  q 2  1.341q  0.449
^ ^ ^ ^
 r0q 2  (a1 r0  b1 s 0 )q  (a 2 r0  b1 s1)  q 2  1.341q  0.449
r0  1

 ^ ^
 s0  (1.341  a1 ) / b1
 ^ ^
s1  (0.449  a 2 ) / b1
250
Tính R và T :
^ ^ ^

R  R1B  R  (q  b 2 / b1)
^ ^
T  A 0B'm  T  (0.0615z  0.0471 / b1 )
Kết luận: Hệ thống điều khiển tự chỉnh gián tiếp theo mô hình chuẩn sau khi thiết
kế:
Hình 5. 32: Mô hình chuẩn sau khi thiết kế
Hình 5. 33: Mô phỏng hệ thống điều khiển tự chỉnh gián tiếp theo mô hình chuẩn
251
Hình 5. 34: Khối bình phương tối thiểu đệ quy
Hình 5. 35: Bộ điều khiển theo mô hình chuẩn
252
Hình 5. 36: Đáp ứng của hệ thống
Đáp ứng của hệ kín bám theo mô hình chuẩn rất tốt sau vài chu kỳ cập nhật thông
số của đối tượng.

Câu 1: Thế nào là điều khiển thích nghi, tại sao phải điều khiển thích nghi?
Câu 2: Thế nào là ước lượng tham số theo thời gian thực?
Câu 3: Trình bày hệ thích nghi mô hình MRAS
- Sơ đồ nguyên lý
- Nội dung phương pháp Gradient và lưu đồ giải thuật
Câu 4: So sánh giữa MRAS và STR
Câu 5: Cho quá trình được mô tả bởi :
K
G(s) 
s(s  a)
253
Và có chỉ tiêu chất lượng như sau:

1
J   (y  u c ) 2  u 2 )dt  MIN (  0)
20
Biết rằng, luật điều khiển có dạng:
u(t)  s0 (y  u c )
s0p  s1
Hay: u(t)   (y  u c )
p  r1
Sử dụng các phương pháp tối ưu hoá một cách chính xác các thông số của bộ điều
khiển từ mô hình ước lượng quá trình
Câu 6: Cho quá trình:
B(z) z  1.2
H(z)   2
A(z) z  z  0.25
Hệ thống kín có một cực tương ứng với phương trình đặc trưng trong miền thời
gian s  2s  1  (s  1) 2
2
Tương ứng với: A m (z)  z 2  a m1z  a m2

a m1  (e1  e1 )  2e1
Với 
2
a m2  e
Tính toán bộ điều khiển STR trực tiếp có bậc nhỏ nhất. Bộ điều khiển phải có
khâu tích phân và hệ số khuếch đại tính là 1.
Câu 7: Thiết kế MRAS cho quá trình có hàm truyền:
b q
G(s)  .
sa sp
Trong đó p và q đã biết trước, hàm truyền vòng kín mong muốn có dạng:
2
G m (s)  2
s  2s  2
Hệ số tắt  và tần số dao động tự nhiên  được cho bởi người thiết kế.
254
CHƯƠNG 6
MỘT SỐ VÍ DỤ THIẾT KẾ HỆ THỐNG ĐIỀU KHIỂN NÂNG CAO

Cung cấp cho sinh viên một số ví dụ minh hoạ cụ thể về thiết kế hệ thống điều
khiển nâng cao
6.1. GIỚI THIỆU ĐỐI TƯỢNG ĐIỀU KHIỂN

6.1.1. Hệ tay máy
*. Các bước thực hiện bài toán động học thuận cho robot Almega 16:
a) Xác định số khớp và số thanh nối
3 khớp đầu của robot Almega 16 là 3 khớp quay với 4 thanh nối và đế
b) Gắn lên các thanh nối các hệ trục tọa độ như hình 6.1
Hình 6. 1: Hình vẽ 3 khớp của Robot có gắn các hệ trục
Các thông số động học được xác định theo phương pháp Danevit-Hartenberg theo
bảng sau:
θi di ai αi
1 θ*1 d1 0 900
2 θ*2 0 a2 0
3 θ*3 0 a3 0
255
) Các ma trận A như sau:
cos1 0 sin 1 0 cos2  sin 2 0 a 2cos2 
   
sin 1 0 cos1 0 sin 2 cos2 0 a 2 sin 2 
A1   A2  
 0 1 0 d1   0 0 1 0 
   
 0 0 0 1   0 0 0 1 
cos3  sin 3 0 a 3cos3 

 
sin 3 cos3 0 a 3 sin 3 
A3  
 0 0 1 0 
 
 0 0 0 1 
Nhân các ma trận A1, A 2 , A3 ta được ma trận biểu diễn vị trí và hướng của khâu tác
động cuối của Robot như sau:
T3  A1A 2 A3
cos 1 cos 23  cos 1 sin 23 sin 1 cos 1 (cos 23a 3  cos 2a 2 ) 
 sin  cos  sin 1 sin 23  cos 1 sin 1 (cos 23a 3  cos 2a 2 ) 
T3   1 23
(6.1)
 sin 23 cos 23 0 sin 23a 3  sin 2a 2  d1 
 
 0 0 0 1 
Trong đó: cosθ23 = cos(θ2 + θ3)
*. Các bước thực hiện bài toán động học ngược cho Robot Almega 16
Giả sử vị trí khâu tác động cuối của Robot đã biết thể hiện bằng ma trận T3 như sau:
n x ox ax px 
 
ny oy ay py 
T3  
n oz az pz 
 z 
 0 0 0 1 
Theo bài toán động học thuận thì ma trận T3 cũng được xác định như sau:
T3  A1A 2 A3
Nên ta có:
n x ox ax px 
n oy ay p y 
T3  
y
 A1A 2 A3 (6.2)
nz oz az pz 
 
 0 0 0 1 
256
Nhân trước hai vế với A11 :
cos1 sin 1 0 0 
 
0 0 1 d1 
A1  
1
sin  cos1 0 0 
 1

 0 0 0 1 
cos 1 sin 1 0 0  n x 0x ax px 
 0  py 
0 1 d1   n y 0y ay

VT  6.2    .
 sin 1  cos 1 0 0  nz 0z az pz 
   
 0 0 0 1   0 0 0 1 
cos 1.n x  sin 1.n y cos 1.0x  sin 1 .0 y cos 1.a x  sin 1 .a y cos 1.p x  sin 1 .p y 
 
p z  d1
  
nz oz az
sin 1.n x  cos 1.n y sin 1.o x  cos 1.o y sin 1.a x  cos 1.a y sin 1.p x  cos 1.p y 
 
 0 0 0 1 
cos 23  sin 23 0 a 2 .cos2  a 3 .cos 23 

 sin  cos 23 0 a 2 .sin 2  a 3 .sin 23 
VP(6.2)   23 
 0 0 1 0 
 
 0 0 0 1 
Cân bằng các phần tử tương đương ở 2 vế của (6.1):
sin 1p x  cos 1p y  0  1  ATAN2(p y , p x )
sin 23  n z 
 23  ATAN2(n z , cos 1n x  sin 1n y )
cos23  cos 1n x  sin 1n y 
a 2 cos 2  a 3 cos 23  cos 1p x  sin 1p y 

a 2 sin 2  a 3 sin 23  p z  d1 
 cos 1p x  sin 1p y  a 3 cos 23 p z  d1  a 3 sin 23 
 2  ATAN2  , 
 a 2 a2 
 3  23  2
*. Các bước thực hiện bài toán Thiết lập mô hình động lực học cho Robot ALMEGA
16.
Tính động năng của các thanh nối
257
a) Tính động năng thanh nối thứ nhất
.
X c = 0  X c2 = 0
 1  .
Yc1 = 0  Y c2 = 0  Vc1  0
2
Pc1
 .
 Zc1 = lc1  Zc 2 = 0

2
1 .
 K1  I θ1
2 1
b) Tính động năng thanh nối thứ hai

. . .
X
 c2 = -l sin  sin  θ  l cos  cos  θ
X c = lc cos 2 sin 1 c2 2 1 2 c2 2 1 1
 2 2 .
 . .
Pc2 Yc2 = lc2 cos 2 cos 1  Y c2 = -lc2 sin 2 cos 1 θ 2  lc2 cos 2 sin 1 θ1
 .
 Zc2 = d1  lc2 sin 2
.
 Zc = l cos  θ 2
 2 c2 2
. 2 . 2 . 2 . .
X c2 = lc2 sin 2 sin 1 θ 2  lc2 cos 2 cos 1 θ1  2lc2 sin 2 sin 1 cos 2 cos 1 θ1 θ 2
2 2 2 2 2 2 2

. 2 . 2 . 2 . .
 Y c2 = lc2 2 sin 2 2 cos 12 θ 2  lc2 2 cos 2 2 sin 12 θ1  2lc2 2 sin 2 cos 1 cos 2 sin 1 θ1 θ 2
 2
. . 2
Z
 2 c = l c2
2
cos  2
2 2θ

. 2 . 2 . 2
 Vc 2  X c2  Y c2  Zc2
2
. 2 . 2
 lc2 (θ 2  cos 2 θ1 )
2 2
. . 2 2 2
1 1 .
 K 2 = m2lc2 2 (θ 2  cos 2 2 θ1 )  I2 θ 2
2 2
c) Tính động năng thanh nối thứ ba
258
X c = cos 1 cos(2  3 )lc  cos 2a 2 
 3  3 

Pc3 Yc3 = sin 1 cos(2  3 )lc3  cos 2a 2 

 Zc3 = sin(2  3 )lc3  sin 2a 2  d1

. 2 . 2 . 2
 Vc 3  X c3  Y c3  Zc3
2
. 2 2 . . . 2 . . .
 θ1 cos(2
  3 )lc3  cos 2a 2   (θ 2  θ3 ) lc3 2 2
 θ2 a 22  2 cos 3 (θ 2  θ3 ) θ 2 lc3 a 2
1 .
 
2 . . . 2
2
 K 3 = m3 θ1 cos(2  3 )lc3  cos 2a 2  (θ 2  θ3 ) 2 lc3 2  θ 2 a 2 2 
2 
. .  .
1 . .
 2 cos 3 (θ 2  θ3 ) θ 2 lc3 a 2   I3 (θ 2  θ3 ) 2
 2
Tính thế năng của các thanh nối
Pi  mi GiT 0 Pc
i
Trong đó:
Pi : là thế năng của thanh nối thứ i
mi : là khối lượng của thanh nối thứ i
G iT : là vecto trong truong
0
Pc : là vị trí của trọng tâm của thanh nối thứ i trong hệ tọa độ cố địn
i
a) Tính thế năng thanh nối thứ nhất

0
 
P1  m1 0 0 1 g  0   m1glc1
l 
 c1 
b) Tính thế năng thanh nối thứ hai

 lc cos 2 sin 1 
 2 
P2  m 2  0 0 1 g lc2 cos 2 cos 1   m 2g d1  lc2 sin 2
 
 
d 
 1 c2 l sin  2 
259
c) Tính thế năng thanh nối thứ ba
cos 1 cos(2  3 )lc  cos 2a 2  

  3 
P3  m3  0 0 1 g  sin 1 cos(2  3 )lc3  cos 2a 2  
 sin(   )l  sin  a  d 
 2 3 c3 2 2 1 


 m3g sin(2  3 )lc3  sin 2a 2  d1 
Thiết lập hàm Lagrange
Phương trình Lagrange như sau:
L  (K1  K 2  K 3 )  (P1  P2  P3 )
1 .
 
2 2 2 2 2
1 . 1 . . 1 . 2
L  I1 θ1  m 2lc2 2 (θ 2  cos 2 2 θ1 )  I 2 θ 2  m3 θ1 cos(2  3 )lc3  cos 2a 2 
2 2 2 2 
. . . . 2 . .  1 . .
 (θ 2  θ3 ) lc3  θ 2 a 2 2  2 cos 3 (θ 2  θ3 ) θ 2 lc3 a 2   I3 (θ 2  θ3 ) 2  m1glc1 
2 2
 2
  
 m 2g d1  lc2 sin 2  m3g sin(2  3 )lc3  sin 2a 2  d1 
 
2
1.
L  θ1  I  m l 2 cos  2  m cos(   )l  cos  a 2 
2  1 2 c2 2 3 2 3 c3 2 2 

 
2 2
1. 1.
 θ 2  m 2lc2 2  m3 lc3 2  a 2 2  2 cos 3lc3 a 2  I 2  I3   θ3 m3lc3 2  I3 
2   2
   
. .
 θ 2 θ3  m3 lc3 2  cos 3lc3 a 2  I3   m1glc1  m 2g d1  lc2 sin 2
 

 m3g sin(2  3 )lc3  sin 2a 2  d1 
Thiết lập phương trình Lagrange
Ta có phương trình:
d L L
M  
dt . i
dθi
Tính toán từng thành phần trong phương trình
260
d L

 I  m l 2 cos  2  m cos(   )l  cos  a 2 

..
 θ 1  1 2 c2 2 3 2 3 c3 2 2 
dt .
d θ1 
  
. .
 θ1 θ 2  2m 2lc2 2 cos 2 sin 2  2m3 cos(2  3 )lc3  cos 2a 2 sin(2  3 )lc3  sin 2a 2 
 
 
. .
 θ1 θ3 2m3 cos(2  3 )lc3  cos 2a 2 sin(2  3 )lc3
d L
 
..
 θ 2  m 2lc  m3 lc  a 2  2 cos 3lc a 2  I 2  I3  
2 2 2
dt .  2 3 3 
d θ2
 
.. . . . 2
 θ3  m3 lc3 2  cos 3lc3 a 2  I3   2 θ 2 θ3 m3 sin 3lc3 a 2  θ 3 m3lc3 sin 3a 2
 
d L .. 
   
.. . .
 θ 2 m  l 2
 cos  l a  I   θ 3 m l 2
 I  θ 2 θ 3 m3 sin 3lc a 2
dt .  3 c3 3 c3 2 3 3 c3 3 3
d θ3
L
 0
1
L
 
. 2
  θ1  m 2lc2 cos 2 sin 2  m3 cos(2  3 )lc3  cos 2a 2 sin(2  3 )lc3 
2 

 sin 2a 2    2m 2glc2 cos 2  m3g cos(2  3 )lc3  cos 2a 2 
L
 
. 2 . . .
  θ1 m3 sin(2  3 )lc3 cos(2  3 )lc3  cos 2a 2  sin 3 (θ 2  θ 3 ) θ 2 lc3 a 2 
3
 m3g cos(2  3 )lc3
Như vậy
261
 
 
.. 2
M1  θ1  I1  m 2lc 2 cos 2 2  m3 cos(2  3 )lc  cos 2a 2 
 2 3

 
. .
 θ1 θ 2  2m 2lc 2 cos 2 sin 2  2m3 cos(2  3 )lc  cos 2a 2 sin(2  3 )l c 
 2 3 3
 
. .
 sin 2a 2    θ1 θ3 2m3 cos(2  3 )lc  cos 2a 2 sin(2  3 )lc
3 3
   
.. ..
M 2  θ 2  m 2lc 2  m3 lc 2  a 2 2  2cos 3lc a 2  I 2  I3   θ3  m3 lc 2  cos 3lc a 2 
 2 3 3   3 3
. . . 2 . 2
 I3   2θ 2 θ3 m3 sin 3lc a 2  θ3 m3lc sin 3a 2  θ1  m 2lc 2 cos 2 sin 2 

3 3  2

+m3 cos(2  3 )lc  cos 2a 2 sin(2  3 )lc  sin 2a 2 
3 3   
 2m 2glc cos 2  m3g cos(2  3 )lc  cos 2a 2
2
 3

   
.. .. . .
M 3  θ 2  m3 lc 2  cos 3lc a 2  I3   θ3 m3lc 2  I3  θ 2 θ 3 m3 sin 3lc a 2
 3 3  3 3
 
. 2 . 2
 θ1 m3 sin(2  3 )lc cos(2  3 )lc  cos 2a 2  θ 2 m3 sin 3lc a 2 

3 3 3
. .
 θ3 θ 2 m3 sin 3lc a 2  m3g cos(2  3 )lc
3 3
Phương trình động lực học dưới dạng ma trận trạng thái
   .. 
c23 lc3 c2 a2 
I  m l 2 c 2  m 2  θ 
1 2 c2 2 3 0 0   1
 M1    .. 
 
M2   

0 m2lc2 2  m3  lc3 2 a 22  2c3 lc3 a 2  I2  I3  
m3  lc3 2 c3 lc3 a 2  I3  θ2 
M       
 3    .. 
  2  2   θ3 
 0 m3  lc3 c3 lc3 a 2  I3 m3lc3  I3  
    
 2
 2m2lc2 c2 s2  m3

c23 lc3 c2 a 2 s23 lc3 s2 a 2  . . 


2m3 c23 lc3 c2 a 2 s23 lc3  
. . 
 0 
. .

 0  θ1 θ2   0  θ1 θ3   2m3 s3 lc3 a 2  θ2 θ3
     

0 
0  0 
   
   
 
 0  2 
0  2  0  2  0 

 . . .
    
2    g
  m2lc2 c2 s2  m3 c23 lc3 c2 a 2 s23 lc3 s2 a 2  θ1   0  θ2  - m3lc3 s3 a 2  θ3  2m2lc2 c2 m3 c23 lc3 c2 a 2 
       
 
  m s l a
m3 s23 lc3 c23 lc3 c2 a 2  3 3 c3 2   0  
m3 c23 lc3

 
 
262
Nhận xét:
Phương trình mô tả động lực học Robot n link là hệ phương trình vi phân phi tuyến
bởi vì:
Kết quả tính toán phương trình động lực học của Robot Almega 16 cho thấy robot
này là một hệ MIMO phi tuyến mạnh, các tương tác chéo thể hiện rõ nét, ma trận quán tính
M(q), vectơ trọng trường G(q) đều phụ thuộc vào biến khớp q còn vectơ tương hỗ và ly
tâm H(q, q) phụ thuộc cả vào biến khớp q, tốc độ q(t) , cho thấy thành phần M (q), G(q)
làm ảnh hưởng lớn đến độ ổn định và độ chính xác vị trí của Robot còn thành phần H(q, q)
làm ảnh hưởng lớn khi robot di chuyển với tốc độ cao.
Hơn nữa, việc xác định chính xác được mô hình của Robot công nghiệp lại gặp nhiều
khó khăn. Đó là do sự phức tạp trong việc xác định giá trị về khối lượng, mômen cũng như
kích thước hình học của robot. Cho nên các tham số động lực học của một hệ thống Robot
được coi là tham số không xác định hoặc xác định không chính xác như sau:
p   m1,m2 ,...,mn ,I1,I2 ,...,In 
T
Trong đó: mn - Khối lượng của khớp n, In - mômen quán tính của khớp n,
Về mặt toán học, nếu vi phân cấp hai của các tham số không phải là hằng số thì sẽ
tồn tại vi phân cấp cao hơn, nên các quá trình biến đổi sẽ phi tuyến.
6.1.2. Hệ truyền động khớp nối mềm
Khớp nối mềm trong truyền động là khớp nối giữa trục động cơ và trục tải. Đó là
các khớp nối không có độ cứng tuyệt đối như các bánh răng, các trục dài tải lớn, các kẹp
nối mềm, các dây đai, các dây xích, các khớp làm bằng các vật liệu có tính co giãn... Mô
hình của các khớp này có thể là các hệ thống nhiều khối, tuy nhiên để cho đơn giản chỉ
khảo sát hệ thống 2 khối. Khớp nối mềm được mô hình hoá đơn giản bằng một lò xo có độ
cứng K s như hình vẽ 6.2.
Hình 6. 2: Mô hình khớp mềm hệ thống 2 khối
Trong đó TM là mô men điện từ của động cơ, (Nm)

TL là mô men tải (Nm)
JM là mô men quán tính của ro to động cơ (kgm2)
Ks là độ cứng của lò xo (Nm/rad)
bs là hệ số mô men nhớt (Nms/rad)
263
JL là mô men quán tính của tải (kgm2)
Gọi  M là tốc độ góc động cơ (rad/s)
L là tốc độ góc của tải (rad/s)
 M là vị trí động cơ (rad)
 L là vị trí tải (rad)
Mô men được truyền từ động cơ đến tải qua lò xo, mô men này gồm 2 thành phần.
Một thành phần tỉ lệ với sai lệch vị trí giữ động cơ và tải (  M -  L ) và một thành phần tỉ lệ
với sai lệch giữa tốc độ động cơ và tải (  M -  L ).
Phương trình động học cho điểm trên trục động cơ:
dM
TM  J M  b s (M  L )  K s ( M   L ) (6.3)
dt
Phương trình động học cho điểm trên tải:
dL
b s (M  L )  K s ( M   L )  J L  TL (6.4)
dt
Từ 2 phương trình 6.3 và 6.4 trên có thể thiết lập được mô hình toán học của khớp
nối mềm như hình 6.3 dưới đây.
TM + M M
1 1 1
JM s s
- -
bs +
K
-
s
1 1 1 +
JM s s -
TL + +
-
- L L
Hình 6. 3: Mô hình toán học khới nối mềm

Động cơ sinh ra mô men TM để kéo tải, tốc độ quay của động cơ là  M . Sau đây sẽ
dẫn ra hàm truyền từ mô men TM đến tốc độ động cơ  M từ 2 phương trình động học (6.3)
và (6.4)
Từ (6.3) và (6.4) chuyển sang ảnh laplace được:
264
M (s)  L (s)
TM  J M sM (s)  b s (M (s)  L (s))  K s ( ) (6.5)
s
M (s)  L (s)
b s (M (s)  L (s))  K s ( )  J L sL (s) (6.6)
s
Coi TL=0;
Ks K
Từ (6.6) có: (J L s  b s  )L (s)  (b s  s )M (s)
s s
bss  K s
==> L (s)  M (s) (6.7)
J Ls  bss  K s
2
Ks K
Từ (6.5) có: TM  (J M s  b s  )M (s)  (b s  s )L (s)
s s
J Ls 2  bss  K s b s  Ks
==> TM   M (s)  s  L (s) (6.8)
s s
Thế  L (s) từ (6.7) vào (6.8) được
J Ls 2  bss  K s (b s s  K s ) 2
TM  M (s)  M (s)
s s( J L s 2  b s s  K s )
(J L s 2  b s s  K s ) 2  (b s s  K s ) 2
==> TM  M (s)
s( J L s 2  b s s  K s )
s(J L J M s 2  (J L  J M )(b s s  K s ))
TM  M (s) (6.9)
(J L s 2  b s s  K s )
Từ (6.9) có phương trình hàm truyền:
 M (s) 1 J Ls 2  bss  K s
 .( ) (6.10)
TM (s) (J L  J M )s J L J M 2
s  bss  K s
JL  JM
Tương tự có thể tính được hàm truyền từ mô men động cơ đến tốc độ tải:
L (s) 1 bss  K s
 .( ) (6.11)
TM (s) (J L  J M )s J L J M 2
s  bss  K s
JL  JM
Bây giờ xét ảnh hưởng của các thành phần bs, Ks, JL/JM đến hiện tượng cộng hưởng cơ học.
6.2. THIẾT KẾ BỘ ĐIỀU KHIỂN LQG
Một phương pháp quan trọng hay được sử dụng để thiết kế hệ thống điều khiển trạng
thái là phương pháp dựa trên cơ sở tiêu chuẩn tích phân tối ưu tuyến tính LQ (Linear
Quadratic). Theo phương pháp này, các tham số của khâu điều khiển được chọn xuất phát
từ nỗ lực tìm cực tiểu cho một hàm chất lượng Q (còn gọi là phiếm hàm hay hàm mục tiêu).
Cho hệ thống có mô hình:
265
dx
 Ax  Bu , A là ma trận vuông n x n, B là ma trận n x r (6.12)
dt
Thông thường, nếu hệ thống ổn định thì khi không bị kích thích hệ sẽ luôn có xu
hướng tiến về điểm trạng thái 0 (quá trình tự do tắt dần). Đó là điểm trạng thái mà khi
dx
không có tác động từ bên ngoài (u = 0) hệ sẽ nằm nguyên tại đó (  0 ). Những điểm
dt
trạng thái mà hệ nằm nguyên tại đó khi không bị kích thích được gọi là điểm cân bằng.
Như vậy, rõ ràng điểm trạng thái cân bằng phải là nghiệm của:
Ax=0 (6.13)
Và nếu có giả thiết A là ma trận không suy biến thì hệ thống tuyến tính (6.12) luôn
chỉ có một điểm cân bằng là gốc toạ độ 0.
Hình 6. 4: Nguyên lý thiết kế bộ điều khiển phản hồi âm trạng thái
Xét bài toán tìm bộ điều khiển K tĩnh, phản hồi âm trạng thái như hình 6.4 để điều
khiển đối tượng (6.12). Nhiệm vụ ở đây là thiết kế bộ điều khiển sao cho sau khi đối tượng
bị nhiễu đánh bật ra khỏi vị trí cân bằng (hay điểm làm việc) đến một trạng thái x0 nào đó,
bộ điều khiển K sẽ kéo được hệ từ x0 về gốc toạ độ 0 (hay điểm làm việc cũ) và trong quá
trình trở lại này sự tổn hao năng lượng được đánh giá bởi phiếm hàm mục tiêu:

1
2 0
Q( x , u )  ( x T Ex  u T Fu)dt (6.14)
là nhỏ nhất. Bài toán này gọi là bài toán LQR.

Để bài toán có nghiệm, trong (6.14) ma trận E được giả thiết là ma trận đối xứng
xác định không âm và F là ma trận đối xứng xác định dương, tức là:
ET  E,a T Ea  0 với mọi véc tơ a.
FT  F,a T Fa  0 với mọi véc tơ a và aTFa = 0 khi và chỉ khi a=0.
Do mục đích đặt ra của bài toán có chứa nhiệm vụ là bộ điều khiển phải đưa hệ đi
được từ mọi điểm trạng thái tuỳ ý x0 về gốc toạ độ 0 (hay điểm trạng thái làm việc cũ) nên
nếu tồn tại một bộ điều khiển K thoả mãn nhiệm vụ đặt ra, thì chắc chắn K sẽ làm cho hệ
thống kín ổn định (theo tiêu chuẩn Lyapunov). Nói cách khác với K tìm được, ma trận A
– BK của hệ kín (phản hồi âm) sẽ có trị riêng nằm bên trái trục ảo.
Theo [10] thì khi u(t) là tín hiệu điều khiển tối ưu thì tín hiệu đó phải thoả mãn:
u(t)  F1BT p(t) (6.15)
266
Trong đó p(t) là tín hiệu thoả mãn phương trình:
dp
dt

  A T p  Ex  (6.16)
Do u(t) và p(t) có mối quan hệ tĩnh (6.15), u(t) và x(t) cũng có mối quan hệ tĩnh
u(t)  Kx(t) (6.17)
nên giữa p(t) và x(t) cũng phải có quan hệ tĩnh tương ứng. Nếu gọi quan hệ đó là:
p(t)   Rx(t) (6.18)
Từ (6.16) sẽ có:
R
dx dp

dt dt
  
  A T p  Ex  E  A T R x  (6.19)

 - R Ax  Bu   E  A T R x  ( thay
dx
dt
 Ax  Bu vào)
 - R Ax  BF -1B T p   E  A T R x (thay u(t)=F-1BTp vào)

 - RA  RBF-1B T R x  E  A T R x (thay p(t)= -Rx vào)
 RBF-1BT R - RA - A T R  E (6.20)
Phương trình (6.20) cuối cùng là công thức cho phép xác định quan hệ R (tĩnh) phải
có giữa p(t) và x(t). Nó gọi là phương trình Riccatti.
Với R xác định theo phương trình (6.20) bộ điều khiển K cần tìm sẽ là:
u(t) = F-1BTp(t) = -F-1BTRx(t)
 K=F-1BTR (6.21)
Như vậy thuật toán tìm bộ điều khiển K tối ưu cho phản hồi âm trạng thái gồm:
- Xác định ma trận R đối xứng dương, xác định dương là nghiệm của phương trình
Riccati (6.20)
- Xác định K từ R theo (6.21): K=F-1BTR
và sơ đồ điều khiển lúc này trở thành:
Hình 6. 5: Kết quả thiết kế bộ điều khiển phản hồi âm trạng thái theo tiêu chuẩn tối ưu
hàm mục tiêu tuyến tính bình phương(LQ).
267
Ý nghĩa của các ma trận trọng lượng E, F trong công thức (6.14):
Việc lựa chọn ma trận trọng lượng có ý nghĩa quan trọng đối với đáp ứng của hệ
thống. Sự lựa chọn này cần phải thoả hiệp giữa thời gian đáp ứng của hệ thống và cố gắng
điều khiển. Nếu chọn E, F sao cho tỷ lệ E/F là hằng số thì hệ thống đáp ứng không đổi.
Ma trận E càng lớn thì hệ thống đáp ứng càng nhanh, trạng thái X về zero càng
nhanh. Năng lượng điều khiển lớn. Thiết kế hệ điều khiển cần đáp ứng nhanh.
Ma trận F càng lớn thì năng lượng điều khiển nhỏ nhưng đáp ứng hệ thống chậm,
phù hợp để thiết kế cho các quá trình chậm.
Việc nghiên cứu lý thuyết thiết kế bộ điều khiển phản hồi trạng thái LQR sẽ là cơ
sở lý thuyết để thực hiện thiết kế bộ quan sát trạng thái Kalman và bộ điều khiển LQG ở
các phần tiếp theo.
6.3. THIẾT KẾ BỘ QUAN SÁT TRẠNG THÁI KALMAN
6.3.1. Bộ quan sát trạng thái
Điều khiển phản hồi trạng thái cho chất lượng điều chỉnh tốt, nhưng các trạng thái
không phải lúc nào cũng đo được hoặc phải tốn rất nhiều sensor. Do đó hiện nay có phương
pháp ước lượng trạng thái của hệ thống bằng cách dùng các bộ quan sát trạng thái.
Mô hình cơ bản của một bộ quan sát trạng thái Luenberger như hình 6.6
Hệ thống
u
“A, B” “C” y
x
x̂
C
A, B
L
Bộ quan sát
-
ŷ trạng thái
Hình 6. 6: Mô hình cơ bản của bộ quan sát trạng thái Luenberger
Trong đó bộ quan sát được xây dựng như một mô hình của hệ thống. Tín hiệu ra
của mô hình được so sánh với tín hiệu đo về từ thiết bị đo, sai lệch này được qua hệ số
quan sát L phản hồi về làm cho tín hiệu quan sát bám theo tín hiệu thực.
6.3.2. Bộ quan sát trạng thái Kalman
Với các bộ quan sát trạng thái thông thường như bộ quan sát Luenberger, phải sau
khoảng thời gian T nhất định mới phát hiện được sự thay đổi trạng thái x(t) trong đối tượng.
Điều này đã hạn chế khả năng ứng dụng của nó, tức là nó chỉ sử dụng được khi nhiễu tác
268
động vào hệ thống là nhiễu tức thời và khoảng thời gian giữa hai lần tác động không được
nhỏ hơn T.
Đã có lúc người ta tìm cách nâng cao khả năng ứng dụng cho bộ quan sát Luenberger
bằng cách giảm thời gian quan sát T thông qua việc chọn trị riêng càng xa trục ảo về phía
trái. Song điều này gặp hạn chế bởi khả năng tích hợp bộ quan sát. Vì không bao giờ có
thể tích hợp được một thiết bị kỹ thuật có hằng số thời gian nhỏ tuỳ ý (hằng số thời gian
càng nhỏ trị riêng nằm càng xa trục ảo về phía trái). Những thiết bị có hằng số thời gian
nhỏ đến mức có thể bỏ qua được (quán tính gần bằng 0) là không tồn tại trong thực tế.
Để loại bỏ nhược điểm này của bộ quan sát Luenberger một cách triệt để. Kalman
đã đề nghị phải xét luôn sự tham gia của tín hiệu nhiễu nx(t) và ny(t) của đối tượng trong
quá trình xác định ma trận L của bộ quan sát. Nói cách khác mô hình mô tả của đối tượng
phải thấy được sự tham gia của tín hiệu nhiễu.
Hình 6. 7: Mô hình bộ quan sát Kalman
Xét đối tượng bị nhiễu nx(t), ny(t) tác động, mô tả bởi:

 dx
  Ax  Bu  n x
 dt (6.22)
y  Cx  n y

Hai tín hiệu ngẫu nhiên nx(t), ny(t) được giả thiết:
- Chúng là tín hiệu ngẫu nhiên egodic.
- Chúng có kỳ vọng (giá trị trung bình) bằng 0, tức là mnx= mny=0.
- Hàm hỗ tương quan của chúng có dạng xung dirac:

rn x ()  M n x n x
T
  N ()
x
()  Mn   N ()

T
(6.23)
rn y y ny y
trong đó M[-] là ký hiệu phép lấy giá trị trung bình (kỳ vọng), Nx, Ny là hai ma trận hằng.
- Chúng không tương quan với nhau, ny(t) không tương quan với trạng thái x(t) và
nx(t) không tương quan với x(  ) ở thời điểm trước đó (  <t), tức là:
M[ nxnyT ] = M [ ny xT ] = M [ nxxT(  )] =  (6.24)
269
Mô hình của bộ quan sát Kalman:
 dx̂
  Ax̂  Bu  L( y  ŷ)
 dt (6.25)

 ŷ  Cx̂
Tìm ma trận L để sao cho phiếm hàm Q sau đạt cực tiểu:
 Me 
n
2
Q= M [ eTe ] = i (6.26)
i 1
Trong đó e(t) = x(t) - x̂ ( t ) . Từ (6.25) và (6.26) có:

de d(x  x)ˆ
  A(x  x)ˆ  n x  LC(x  x)
ˆ  Ln y
dt dt
 (A  LC)e  n x  Ln y
Suy ra :
t
(A LC)t
e(t)  e e0   e(A LC)(t )  n x ( )  Ln y ( )  d (6.27)
0
Thay (6.27) vào (6.26) có để ý đến giả thiết về nx và ny, sau đó tìm L để Q có giá trị
Q Q
nhỏ nhất bằng cách xác định nghiệm của   , với là ký hiệu chỉ ma trận Jacobi
L L
của Q sẽ được:
L=PCTNy-1 [8] (6.28)
Trong đó P là nghiệm của phương trình Riccati:
PCTNy-1CP - PAT - AP = Nx (6.29)
Như vậy, thuật toán xác định ma trận hệ số bộ lọc L hoàn toàn giống như việc thiết
kế bộ điều khiển phản hồi trạng thái (bài toán LQR), trong đó vai trò của đối tượng (6.12)
nay được thay bằng:
dx
 A T x  CT u (6.30)
dt
tức là hệ đối ngẫu với nó nhưng không có nhiễu, và hàm mục tiêu (6.14) thì được thay bởi:

1
Qk=  ( x T N x x  u T N y u )dt (6.31)
20
Từ đây có thuật toán thiết kế bộ quan sát Kalman gồm các bước:
1) Xác định ma trận Nx và Ny là ma trận hàm tương quan của nx(t) và ny(t).
2) Thiết kế bộ điều khiển phản hồi âm L cho bộ quan sát
3) Thay L tìm được vào (6.25) để có bộ quan sát.
6.3.3. Thiết kế bộ quan sát trạng thái Kalman cho hệ thống khớp mềm
Từ mô tả toán học của hệ thống khớp mềm ở mục 6.1.2, với sự bỏ qua hệ số cản bs
trong mô hình được mô hình mới như hình 6.8 sau:
270
Hình 6. 8: Mô tả toán học đối tượng khớp mềm
Mô men tải TL thường có dạng bậc thang, hoặc thay đổi chậm nên coi T L  0 .
Ta có hệ phương trình sau:
 1 1
 m   J Ts  J TM
 M M
 1 1
 l 
JL
Ts  TL
JL
(6.32)

T s  K s  m  K s  l

T L  0
Từ hệ phương trình (6.32) và xét cả nhiễu vào đối tượng, viết được phương trình
trạng thái của hệ thống khớp mềm:
x  Ax  Bu  n x
 (6.33)
 y  Cx  n y
Phương trình trạng thái cho bộ quan sát:
x̂  Ax̂  Bu  L( y  ŷ)
 (6.34)
 ŷ  Cx̂
Trong đó:
 1 
0 0 0  1 

JM
 J 
1  1  M
A=  0 0 , B=  0  , C= [1 0 0 0],
 JL JL 
K  0 
 Ks 0 0  
 s   0 
 0 0 0 0 
x = [  M  L Ts TL]T, y =  M là trạng thái và đầu ra thực.
x̂ = [ 
ˆM 
ˆ L T̂s T̂L ]T, ŷ = ̂ M là trạng thái và đầu ra ước lượng.
u = TM, là tín hiệu điều khiển (mô men động cơ)

L là hệ số bộ quan sát Kalman, được tính toán dựa vào tiêu chuẩn tối ưu: sao cho
hàm tương quan M(x - x̂) T (x - x̂) của sai lệch ước lượng đạt cực tiểu. L đã được xác định
theo (6.28) vaà (6.29):
271
L  PCT N y 1
Ở đây: P là ma trận nghiệm của phương trình Riccati:
PCTNy-1CP - PAT - AP = Nx
Nx, Ny là hai ma trận hằng, xác định bằng thực nghiệm.
Sơ đồ nguyên lý bộ quan sát như hình 6.9 sau:
Hình 6. 9: Sơ đồ bộ quan sát trạng thái Kalman
Thay số tính toán bộ quan sát bằng chương trình Matlab, và có sơ đồ mô phỏng bộ
lọc Kalman như hình 6.10 sau:
272
Mô hình đối tượng có nhiễu tác động
Nhiễu Nhiễu Nhiễu
gauss(nx) gauss(nx) TL gauss(nx)
TM m Ts -
1 1 1 1
Ks 1
JM s s JL s
- -
l
Nhiễu
gauss(ny)
Bộ quan sát trạng thái

-
L4
L1 L3 L2
s
1 + 1 ̂ m + 1 - T̂L 1 + 1 ̂ l
Ks
TM JM s s JL s
- -
Hình 6. 10: Sơ đồ mô phỏng bộ lọc Kalman

T Riccati bằng Matlab. T
Các hệ số L tối ưu tính toán được nhờ giải phương trình
M
1 0 0 0 M
0 
1 0 0
Nếu thực nghiệm tính toán ra: Nx=  , Ny=1;
0 0 1 0
 
0 0 0 1
%Giai phuong trinh Riccati
[P,L,G]=care(A',C',Nx,Ny)
%He so phan hoi Kalman
L=P*C'*(1/Ny)
L1=L(1)
L2=L(2)
L3=L(3)
L3=L(3)
273
L4=L(4)
Kết quả L=[203.9370 236.3926 -1.5502 -1.0000]
Kết quả mô phỏng ở hình 6.11, 6.12, 6.13, 6.14 dưới đây cho thấy bộ quan sát ước
lượng trạng thái khá chính xác khi có tác động của nhiễu. Các tín hiệu ước lượng bám sát
tín hiệu thực. Khi mô phỏng đặt mô men động cơ bằng 0,1 Nm. Sau 1s thì cho mô men tải
bằng 0,1 Nm vào. Lấy nhiễu là nhiễu trắng phân bố gauss có hàm tương quan bằng 1.
Hình 6. 11: Tốc độ động cơ thực và ước lượng
Hình 6. 12: Tốc độ tải thực và ước lượng
Hình 6. 13: Mô men xoắn thực và ước lượng
274
Hình 6. 14: Mô men tải thực và ước lượng
Sau khi thiết kế xong bộ quan sát trạng thái Kalman, dưới đây sẽ trình bày một
phương pháp điều khiển phản hồi trạng thái tối ưu theo tiêu chuẩn hàm mục tiêu (LQG).
6.4. THIẾT KẾ BỘ ĐIỀU KHIỂN PHẢN HỒI TRẠNG THÁI BẰNG PHƯƠNG PHÁP
TỐI ƯU HÀM MỤC TIÊU DÙNG BỘ LỌC KALMAN(LQG – Linear Quadratic
Gaussian) ĐIỀU KHIỂN KHỚP MỀM.
6.4.1 Thiết kế bộ điều chỉnh phản hồi trạng thái LQR sử dụng bộ ước lượng trạng
thái Kalman điều khiển khớp mềm.
Ở mục 6.3.3 đã thiết kế bộ quan sát trạng thái Kalman. Sau đây sẽ thiết kế bộ điều
khiển phản hồi trạng thái cho hệ thống khớp mềm bằng phương pháp tối ưu hàm mục tiêu
dạng bình phương tuyến tính (LQR). Lý thuyết thiết kế phương pháp này đã trình bày ở
trên. Sau đây ứng dụng vào thiết kế bộ điều khiển cho hệ thống khớp mềm.
Mục đích bộ điều chỉnh là duy trì tín hiệu ra ở lân cận trị số không khi có nhiễu tác
động ( khi không đưa tín hiệu đặt vào). Đối tượng được điều khiển bởi nhiễu quá trình nx.
Bộ điều chỉnh dựa vào nhiễu đo được yv=y+ny để tạo nên tín hiệu điều khiển u.
Phương trình trạng thái của hệ thống khớp mềm có tính đến nhiễu.
 ( t )  AX(t)  Bu  ET  Gn
X L x
(6.34)
Y( t )  CX( t )  n y
Trong đó đầu ra hệ thống là Y=  M , véctơ trạng thái X=[  M  L Ts]T
Với Ts mô men xoắn, u=TM mô men động cơ, nu và ny là nhiễu quá trình và nhiễu
đo lường.
275
 1 
0 0 - J   1 
J   0 
 M
  
 1   
M
1
Ma trận quan sát: A  0 0 , Ma trận điều khiển:    , E=   ,C=[1 0 0]
JL 
B 0
   JL 
   
K s - K s 0   0
   0 
 
 
Bộ điều chỉnh LQG ( Tuyến tính- Bình phương – Gauss) gồm có hệ số hồi tiếp tối
ưu K và bộ ước lượng trạng thái Kalman
Mô hình tổng quát hệ thống được thể hiện trên hình vẽ 6.15
Hình 6. 15:Bộ điều chỉnh LQG

Hàm mục tiêu dạng:

J(u)   (xˆ T QC xˆ  u T R C u)dt (6.35)
0
Trong đó QC, RC là các ma trận trọng số do người thiết kế xác định theo chỉ tiêu chất lượng
và yêu cầu điều khiển.
Để đầu ra  m không có sai lệch tĩnh, cho thêm khâu tích phân, do đó hệ điều khiển
thể hiện như hình vẽ 6.16 dưới đây:
276
Kt
kd
Bộ lọc
k3 Kal_
man
k2
k1
Hình 6. 16: Hệ thống điều khiển LQG để điều khiển khớp mềm
Trong thiết kế hệ thống một biến, nếu yref và TL có giá trị trạng thái tĩnh không đổi,
thành phần điều khiển tích phân có thể đem lại tính ổn định cho hệ thống với sai lệch tĩnh
bằng 0 (y  yref khi t   ).
Để giải quyết vấn đề thiết kế này, trước tiên định nghĩa một biến trạng thái mới:
t
p =  ( y  y ref )dt (6.36)
0
Từ (6.36) và phương trình trạng thái (6.34) với việc bỏ qua nhiễu có:
 x  Ax  Bu  ETL
 (6.37)
 p  Cx  y ref
Viết lại dạng ma trận, với việc tăng thêm biến trạng thái:
 x  A 0  x  B E 0   TL 
p    C 0  p    0  u   0  1  y  (6.38)
          ref 
Khi TL và yref là hằng số, ở trạng thái tĩnh x  0, p  0 , nghĩa là hệ thống ổn định.
Điều đó đồng nghĩa với việc ở trạng thái tĩnh xs, ps và us phải thoả mãn phương trình sau:
E 0   TL  A 0  x s  B
 0  1  y     C 0  p    0  u s (6.39)
   ref    s   
Trừ vế theo vế phương trình này với (6.38) được:
277
 x  A 0  x  x s  B
p    C 0  p  p    0  (u  u s ) (6.40)
    s  
Bây giờ định nghĩa thêm biến trạng thái mới, biểu diễn sự sai khác với trạng thái
tĩnh:
z  x  x   z   x 
z =  1   s
 , z   1     , q = u - us (6.41)
z 2   p  p s z 2   p 
Do đó (6.40) trở thành:
~ ~ ~ A 0 ~ B
z  Az  Bq A , B   0  (6.42)
 C 0  
Ý nghĩa của kết quả này là bằng việc xác định sai lệch của trạng thái tĩnh như là
những biến trạng thái và biến điều khiển, khi đó vấn đề thiết kế sẽ được đưa về dạng bài
toán phản hồi trạng thái tối ưu LQR.
Từ (6.42), hàm chất lượng J và đầu vào điều khiển q được viết lại như sau:


J   z T Qz  Rq 2 dt  (6.43)
0
q  K q z
Trong đó : Kq được viết lại như sau, và dùng (6.41) có:
K q  K 1 K 2 

q  K 1 z1  K 2 z 2 (6.44)
u  u  K ( x  x )  K (p  p )
 s 1 s 2 s
Những trạng thái tĩnh phải tương tự với những trạng thái khác, do đó thay thế p bởi
phương trình (6.38) vào và đầu vào điều khiển u trở thành:
t
u  K1x  K 2p  K1x  K 2  (y  y ref )dt (6.45)
0
Ở đây đặt: K1   k1 k2 k 3  ,K 2  K I , do đó u trở thành:
t
U    k1 k 2 k 3 M L Ts   K I  (M  ref )dt
T
(6.46)
0
Nếu ma trận QC và RC được biểu diễn dưới dạng như (6.47) sau đây để thoả mãn
đối tượng điều khiển là hệ thống 2 khối:
  0 0
     0 0
QC    ;R C   (6.47)
0 0 0 0
 
0 0 0 
Thì hàm chất lượng J sẽ trở thành (6.48) sau:
278

J=   M   L 2   L  ref 2  p  p s 2   u  u s 2 dt (6.48)
0
Trong đó: : Trọng số cho việc khử rung

 : Trọng số cho yêu cầu bám theo lệch
 : Trọng số cho sai lệch tĩnh
 : Trọng số cho đầu vào điều khiển
Những trọng số  ,  ,  , và  có thể được lựa chọn bằng phương pháp thử theo đặc
tính thiết kế mong muốn thông qua phương pháp mô phỏng.
Vì mômen tải TL có dạng bậc thang, dẫn đến hệ truyền động dễ thay đổi đột ngột,
thậm chí sẽ gây hiện tượng dao động xoắn dẫn đến hệ thống mất ổn định. Khi có thêm hệ
số phản hồi kd cho mômen tải sẽ cải thiện đặc tính hệ thống. Hệ số khuếch đại kd được
chọn để đặt biến trạng thái z2 ở trạng thái tĩnh tới 0, kd được chọn bằng 1/Kt[7].
6.4.2. Thực hiện mô phỏng bộ điều khiển đã thiết kế.
Các tham số của khớp mềm:
Mô men quán tính của động cơ: JM=7,455.10-5 Kgm2
Mô men quán tính của tải: JL=8,878.10-5 Kgm2
Độ cứng của trục: Ks=0,28 N/rad
Ks
Tần số cộng hưởng: r = = 83 rad/s
J M J L /(J M  J L )
Tần số chống cộng hưởng:  ar  K s / J L  56 rad/s
Ma trận trạng thái:

 1 
0 0  0  1 

JM
 J 
~  1 ~  0M 
0  ; Ma trận điều khiển: B
A 0 0 = ;
 JL 
K  0 
 Ks 0 0  
 s   0 
1 0 0 0 
Tính ma trận phản hồi trạng thái:

~
K  Q-1CBT R , Trong đó R là nghiệm phương trình Ricatti:
~ -1~ ~ ~
RBQC BT R - RA - AT R  R C
Dùng chương trình Matlab giải phương trình Riccati tính các hệ số phản hồi K theo
~ ~
các ma trận của hệ thống A , B và ma trận tiêu chuẩn chất lượng: QC và RC. Sau đó thực
hiện mô phỏng bằng simulink để chọn QC, và RC tối ưu.
279
1
500 Ki Kt Tm wl
s
Constant Ki Integrator2 Saturation Kt
Tl wm Scope
Step
He_thong
-K-
k1
-K- wl_e
wm
k2
-K- Ts_e
k3
Tm
kd Tl_e
kd Kalman_filter
Hình 6. 17: Sơ đồ Simulink mô phỏng hệ thống điều khiển LQG cho khớp mềm
1 Ks 1
1 1
Tm Jm.s s Jl.s wl
Transfer Fcn Transfer Fcn1 Transfer Fcn2
2
wm
2
Tl
Scope
Hình 6. 18: Sơ đồ Simulink hệ thống khớp mềm
280
1
wm Tl_e
1
l4
s 3
l1 Tl_e
l2
l3
Ts_e
wm_e 1
1 1
Ks -K- s
2 -K- s s
Tm wl_e
1
wl_e
2
Ts_e
Hình 6. 19: Sơ đồ Simulink mô phỏng bộ lọc Kalman ước lượng trạng thái
Để tính ra ma trận phản hồi trạng phải giải phương trình Ricatti, việc giải phương
trình này thực hiện bằng hàm trong thư viện của Matlab (phụ lục).
Chỉnh định các tham số của ma trận trọng lượng trong quá trình mô phỏng tìm được
thông số tối ưu: =0,68,  =1,  =730,  =1
Kết quả ma trận phản hồi trạng thái:
K=[0,8328 0,6167 227,6583 27,0185]
Do đó: k1= 0,8328; k2 = 0,6167; k3 = 227,6583 ; Ki = 27,0185
Với các hệ số phản hồi trạng thái tối ưu này kết hợp với các hệ số của bộ lọc Kalman
đã thiết kế, thực hiện mô phỏng có: đặc tính tốc độ động cơ thực - tốc động cơ quan sát,
tốc độ tải thực - tốc độ tải quan sát, Mô men xoắn thực - mô men xoắn quan sát, mô men
tải thực - mô men tải quan sát, như các hình vẽ dưới đây.
Hình 6. 20: Đặc tính tốc độ động cơ thực và tốc độ động cơ quan sát
281
Từ hình vẽ 6.20 thấy rằng: tốc độ động cơ thực và tốc độ động cơ quan sát bám sát
nhau, không phân biệt được trên hình vẽ.
Hình 6. 21: Đặc tính tốc độ tải thực và tốc độ tải quan sát
Từ hình vẽ 6.21, tốc độ tải quan sát bám sát tốc độ tải thực. Chỉ trong thời gian rất
ngắn khi có nhiễu tải TL thì tốc độ quan sát lệch tốc độ thực, sau đó bộ quan sát đã tự động
điều chỉnh và tốc độ tải quan sát lại bám sát tốc độ tải thực.
Hình 6. 22: Đặc tính mô men xoắn thực và mô men xoắn quan sát
Hình 6.22 cho thấy mô men xoắn thực và quan sát bám sát nhau, chỉ khi có nhiễu
tải thì có sai lệch rất nhỏ trong thời gian rất ngắn.
282
Hình 6. 23:Đặc tính mô men tải thực và mô men tải quan sát
Hoàn toàn như tốc độ tải thực - quan sát, mô men xoắn thực - quan sát, mô men tải
thực và quan sát bám nhau, chỉ khi nhiễu tải lúc ban đầu, khi đó bộ quan sát ở thời kỳ quá
độ nên có sự trễ pha trong thời gian rất ngắn. Sau đó quan sát hoàn toàn chính xác.
Từ các đặc tính mô phỏng các trạng thái thực và ước lượng trên chứng minh rằng
bộ quan sát Kalman đã thiết kế là chính xác.
Sau đây là kết quả mô phỏng đáp ứng tốc độ của động cơ và tải hệ thống khớp mềm
điều chỉnh bằng bộ điều chỉnh phản hồi trạng thái LQG. Kết quả này được so sánh với kết
quả đáp ứng tốc độ khi dùng bộ điều chỉnh PI thông thường.
Đặt tốc độ là 500rad/s tương ứng với tốc độ định mức động cơ servo trên phòng thí
nghiệm, mô men tải đặt bằng 0,2Nm (mô men định mức động cơ bằng 0,35Nm)
283
Hình 6. 24: Đáp ứng tốc độ tải và tốc độ động cơ hệ điều khiển phản hồi trạng thái dùng
bộ lọc Kalman theo tiêu chuẩn tối ưu hàm mục tiêu
Nhận xét: Đáp ứng quá độ tốt, thời gian quá độ nhanh ( 0,15s), hầu như không có
quá điều chỉnh. Tốc độ động cơ và tải không bị dao động.
Sơ đồ hệ thống điều khiển khớp mềm dùng bộ PI thông thường:
Ts
Tm wm
1 Ks 1
500 PID Kt wl
Jm.s s Jl.s
wr
Scope
TL
Hình 6. 25:Mô phỏng hệ điều khiển khớp mềm bằng bộ PI
284
Hình 6. 26:Đáp ứng tốc độ tải và tốc độ động cơ hệ điều chỉnh PI thông thường với
KP=0,078, KI=0,6.
Nhận xét: Từ hình 6.26 thấy: tốc độ tải và động cơ dao động lớn, độ quá điều chỉnh
lớn (25%), thời gian quá độ lớn (0,25s)
So sánh hai bộ điều chỉnh:
Từ hình 6.24 và 6.26 cho thấy đáp ứng tốc độ động cơ và tải của khi dùng bộ điều
chỉnh LQG tốt hơn hẳn khi dùng bộ PI. Khi dùng bộ LQG: Đáp ứng quá độ nhanh
(Tqd=0,15s), độ quá điều chỉinh rất nhỏ(   0%). Khi dùng bộ PI: Đáp ứng quá độ chậm
(Tqd=0,25s), độ quá điều chỉnh lớn(   25%). Do ảnh hưởng của đối tượng khớp mềm nên
khi dùng bộ điều chỉnh PI tốc độ động cơ và tải dao động quanh nhanh trước khi xác lập.
Bộ điều chỉnh LQG đã loại bỏ được dao động này. Như vậy dùng bộ điều chỉnh LQG là
một phương pháp hữu hiệu để điều khiển hệ thống khớp mềm.
Việc tổng hợp bộ điều chỉnh phản hồi trạng thái LQG cho hệ thống khớp mềm dựa
trên cơ sở tối ưu hàm tổn thất QC (6.47). Trong quá trình mô phỏng chọn các hệ số trọng
lượng , , ,  để có đáp ứng đầu ra mong muốn. Giữ nguyên trọng số đầu vào  và thay
đổi các trọng số còn lại.
- Khi tăng trọng số khử rung  thì tốc độ động cơ và tải giảm sự dao động .
- Khi tăng trọng số yêu cầu bám theo lệch  thì tốc độ động cơ và tải tiến đến xác
lập nhanh hơn.
- Khi tăng trọng số sai lệch tĩnh  thì sai lệch tĩnh về 0 nhanh, tuy nhiên nếu tăng
quá thì hệ sẽ dao động (do hệ số Ki của bộ điều chỉnh tăng quá lớn).
285
Việc lựa chọn các tham số này thực hiện bằng mô phỏng. Các hình vẽ dưới đây nói
nên tác dụng của các trọng số. Với mỗi một hình sẽ có hai đặc tính khi thay đổi một trọng
số trong khi các trọng số còn lại không đổi.
Hình 6. 27: Đặc tính tốc độ khi thay đổi trọng số 
Trên hình 6.27, hình bên phải  lớn hơn, độ dao động của tốc độ động cơ nhỏ hơn
hình bên trái.
  0,68;   0,5;   730;   1   0,68;   0,8;   730;   1

Hình 6. 28: Đặc tính tốc độ khi thay đổi
Trên hình 6.28, hình bên phải  lớn hơn, tốc độ về giá trị đặt nhanh hơn hình bên
trái.
286
  0,68;   1;   320;   1   0,68;   1;   600;   1
Hình 6. 29: Đặc tính tốc độ khi thay đổi 
Trên hình 6.29, hình bên phải  lớn hơn, tốc độ tiến đến xác lập nhanh hơn hình bên
trái.
Như vậy với sự thay đổi nhiều thông số khi thiết kế hệ điều khiển phản hồi trạng
thái sẽ tìm được thông số tối ưu cho đối tượng. Bộ điều khiển phản hồi trạng thái dùng bộ
lọc Kalman đáp ứng được yêu cầu cao trong hệ điều khiển khớp mềm như tốc độ đáp ứng
nhanh, độ quá điều chỉnh nhỏ và giảm được dao động cộng hưởng.
6.5. Thiết kế bộ điều khiển thích nghi
Phương pháp điều khiển thích nghi nói chung là ước lượng các tham số chưa xác
định, dựa trên các tín hiệu đầu vào, đầu ra của hệ thống trong quá trình làm việc và sử dụng
các tham số chỉnh định để tính toán các tín hiệu điều khiển cập nhật thích nghi .
Các tính chất của bộ điều khiển thích nghi: Cấu trúc cố định, thường dựa vào cấu
trúc điều khiển kinh điển, tham số điều khiển không cố định sẽ được đánh giá lại sau mỗi
chu kỳ lấy mẫu thông qua luật cập nhật thích nghi sau đó chỉnh định lại trong bộ điều khiển
thích nghi. Tín hiệu này được đưa tới bộ điều khiển trực tiếp, biểu diễn hình 6.30.
q τ dk
Bộ điều khiển Đối tượng điều
thích nghi khiển TMCN q
qd
pˆ (t) Luật cập nhật

Thích nghi
Hình 6. 30: Cấu trúc cơ bản của hệ thống điều khiển thích nghi
Có nhiều phương pháp điều khiển thích nghi khác nhau như điều khiển thích nghi
theo mô hình chuẩn, điều khiển thích nghi theo mô hình cơ sở, điều khiển thích nghi giả
định rõ…, ngoài ra còn các luật điều khiển thích nghi kết hợp với các luật điều khiển khác
287
để khai thác triệt để ưu điểm và loại bỏ nhược điểm của chúng với mục đích nâng cao chất
lượng điều khiển như điều khiển thích nghi bền vững, điều khiển thích nghi dùng bộ quan
sát trạng thái , ….
Xác định lượng mômen điều khiển cho tay máy với mục đích là điều khiển góc khớp
thực q(t) bám chính xác theo góc khớp mong muốn qd(t).
*Tuyến tính hóa chính xác mô hình động lực học
Xuất phát từ phương trình động lực học tổng quát của tay máy được xác định:
τ = M  q  .q + C(q,q)q + G(q) + F(q) + τ d (6.49)
Sử dụng bộ điều khiển với đầu vào u khi F(q) = 0 và τ d = 0 :
τ = M  q  .u + C(q,q)q + G(q) (6.50)
ta sẽ có với tính không suy biến của ma trận đối xứng xác định dương M(q) :
q=u (6.51)
tức là hệ kín trở thành tuyến tính dạng tích phân bậc hai.
Hệ tuyến tính dạng tích phân bậc hai (6.50) có thể điều khiển ổn định bằng các bộ
điều khiển vòng. Ưu điểm là biến hệ phi tuyến ràng buộc thành hệ tuyến tính độc lập, dễ
dàng thiết kế theo các phương pháp kinh điển của hệ thống tuyến tính đảm bảo độ chính
xác chuyển động theo yêu cầu nhưng nhược điểm lớn của bộ điều khiển vòng ngoài là phải
biết được chính xác các thông số động lực học và phụ thuộc vào những giá trị tính toán của
các bộ tham số tính toán.Vì vậy để xác định được lượng mômen truyền động cần thiết lên
các khớp di chuyển theo quỹ đạo, bền vững theo sự thay đổi tham số, có khả năng bù sự
thay đổi của tải và khử được các thành phần phi tuyến cũng như phân ly đặc tính động lực
học của các thanh nối tay máy thì cần phải sử dụng bộ điều khiển có khả năng chỉnh định
được các thông số động lực học của tay máy trong quá trình chuyển động, giả thiết bằng
phương pháp điều khiển thích nghi giả định rõ.
* Điều khiển thích nghi giả định rõ : Sử dụng mô hình tay máy có chứa tham số hằng bất
định p luôn được viết tách riêng ra được thành, với giả thiết F(q) = 0 và τ d = 0 :
τ = M(q,p)q + C(q,q,p)q + G(q,p) = Y(q,q,q)p (6.52)
Trong đó: Y(q,q,q) - ma trận xác định n x n.
Để nâng cao độ ổn định (6.52) được thay bằng các bộ điều khiển có tham gia KP,
KD vòng ngoài như sau:
ˆ ˆ q d +K Pe + K De + C(q,q,p)q
τ = M(q,p) ˆ ˆ ˆ = Y(q,q, q)pˆ
ˆ + G(q,p) (6.53)
Trong đó:
ˆ ˆ ˆ ˆ ˆ ˆ - các thành phần ước lượng của M(q,p), C(q,q,p)
M(q,p),C(q,q,p),G(q,p)
, G(q,p),
p̂ - thành phần chỉnh định của mô hình tay máy;
288
e = qd - q - sai số vị trí của khớp tay máy;
e = qd - q - sai số vận tốc của khớp tay máy.
Kết hợp phương trình (6.52), (6.53) được phương trình động lực học kín của TM
ˆ ˆ q + K e + K e  + C(q,q,p)q
M(q,p)q + C(q,q,p)q + G(q,p) = M(q,p) d
ˆ
P
ˆ ˆ
ˆ + G(q,p) D (6.54)
ˆ ˆ phía trái (6.54) xác định được:
Trừ M(q,p)q
ˆ ˆ  e + K P e + K D e  = EM (q,ep )q + EC (q,q,ep )q + EG (q,ep ) = Y(q,q,q)ep
M(q,p) (6.55)
Trong đó:
ˆ E = G - G,
ˆ E = C - C,
EM = M - M, ˆ e = p - pˆ (6.56)
C G p
Từ (6.55) suy ra:  e + K P e + K D e  = M

ˆ Y(q,q,q)e -1
p (6.57)
-1
Với giả thiết M̂ tồn tại xác định được (6.57).
Nhận xét: Với bản chất của phương pháp giả định rõ và tuyến tính hóa chính xác
mô hình động lực học, hệ bám thích nghi theo nguyên tắc điều khiển nhờ mô hình ngược
(6.57).
Ưu điểm: Hệ điều khiển phân ly được từng trục chuyển động đảm bảo sai lệch các
góc khớp so với giá trị đặt, nhanh chóng tiến đến 0 và hệ không còn dao động khi điều
chỉnh lượng mômen điều khiển τ dk tác động vào từng trục khớp khác nhau.
qd1 qd2
q1
q2
K P1 =4 K P2 =4
K D1 =4 K D2 =4
qd3
q3
K P3 =4
K D3 =4
Hình 6. 31: Sai lệch giữa và q của các góc khớp
289
-1
Nhược điểm: Khi mô hình ngược M̂ lớn dẫn đến lượng mômen điều khiển τ dk
tác động vào từng trục khớp sẽ lớn dẫn đến các thuộc tính phương trình động lực học nằm
ngoài giới hạn cho phép thì hệ dao động, sai số giữa các góc khớp thực với các góc khớp
đặt lớn.
K P2 =4
K D 2 =4
K P1 =4
K D1 =4
K P3 =4
K D3 =4
Hình 6. 32: Sai lệch giữa và q của các góc khớp

ˆ t ) , tức là tìm quy
Kết luận: Trong (6.57) cho thấy, cần phải tìm cách chỉnh định p(
ˆ t ) để có được e(t)  0 khi t   sẽ nghiên cứu và ứng dụng một thuật
luật thay đổi p(
toán điều khiển thích nghi cụ thể là điều khiển thích nghi Li-Slotine cho đối tượng nghiên
cứu trong là Robot Almega 16

Câu 1: Cho hệ tay máy một bậc tự do
290
Trong đó:
u(t) là mô mem điều khiển (tín hiệu vào) (N.m)
 là góc quay của tay máy (tín hiệu ra) (rad)
i(t) là dòng điện qua cuộn dây (A)
M  1kg là khối lượng của tay máy (phần quay)
J  0.05kg.m 2 là mô-men quán tính của tay máy
lC  0.15(m) là khoảng cách từ trục quay đến trọng tâm khớp quay
l  0.4(m) là chiều dài tay máy
m  0.1(kg) là khối lượng vật nặng cần gắp
g  9.8(m / s 2 ) là gia tốc trọng trường
Phương trình vi phân mô tả đặc tính động học hệ tay máy:
B (ml  MlC ) 1
 (t)  gsin   u(t)
(J  ml )
2
(J  ml )
2
(J  ml 2 )
Yêu cầu của bài toán : điều khiển góc quay của tay máy bám theo tín hiệu đặt
Câu 2: Hệ nâng bi trong từ trường
Trong đó:
u(t) là điện áp cấp cho cuộn dây (tín hiệu vào) (V)
y(t)là vị trí viên bi (tín hiệu ra) (m)
i(t) là dòng điện qua cuộn dây (A)
M  0.01kg là khối lượng của viên bi
R  30() là điện trở của cuộn dây
L  0.1(H) là điện cảm của cuộn dây
g  9.8(m / s 2 ) là gia tốc trọng trường
Phương trình vi phân mô tả đặc tính động học hệ nâng bi trong từ trường:
291
 d 2 y(t) i 2 (t)
M  Mg 
 dt y(t)

L di(t)  Ri(t)  u(t)
 dt
Yêu cầu của bài toán: Điều khiển vị trí viên bi treo lơ lửng trong từ trường bám
theo tín hiệu đặt.
292
TÀI LIỆU THAM KHẢO
[1]. Nguyễn Thị Phương Hà, Huỳnh Thái Hoàng, Lý thuyết điều khiển tự động, NXB
Đại học Quốc gia TP Hồ Chí Minh, (2018).
[2]. Nguyễn Thị Phương Hà, Lý thuyết điều khiển hiện đại, NXB Đại học Quốc gia
TP Hồ Chí Minh, (2016).
[3]. Nguyễn Duy Anh, Lý thuyết điều khiển hiện đại, NXB Khoa học và Kỹ thuật,
(2016).
[4]. Nguyễn Doãn Phước, Phân tích và điều khiển hệ phi tuyến, NXB Bách Khoa –
Hà Nội (2012).
[5] Nguyễn Phùng Quang, Matlab và Simulink ( dành cho kỹ sư điều khiển tự động);
NXB Khoa học và Kỹ thuật (2004)
293
294

uT
Ru
Ngõ
K 

Đối
p B
yK
Hình Đóng
Khâu
QuálCơ
Tham
Mô
1Bộ
0i1
Ngõ lBộ
sref
s_e
L
L_e
tmH u
sIG(s)
_y _=Bộ
G(s)
cH
kd
ee yk
fe
-1
uGye-điều
u
+ cấu
etượng
ư vào
(p)y
(p)u
m f
123cyư
hình
-trình
lọc ytải
6.30.
6.31.
Tu
ratích
sốcyu-
ref
y
ước
điều
chỉnh
hiệu
ước sđộng
JACấu
sSai
quáMs
L  sG
skhiển
phân
FIR
Sy
vào lượng
chỉnh
lệch
khiển
trình
1:1
lượng
định
học
trúc
Bộcơ bản lọc
giữa
 d
q và
của hệKal_
Gq của các
thống góc man khớp điều
khiển
thích nghi
295

TLHT Các Phương Pháp Điều Khiển Hệ Phi Tuyến (Final)

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

TLHT Các Phương Pháp Điều Khiển Hệ Phi Tuyến (Final)

Uploaded by

Copyright:

Available Formats

BỘ CÔNG THƯƠNG

TRƯỜNG ĐẠI HỌC KINH TẾ - KỸ THUẬT CÔNG NGHIỆP

Nguyễn Hải Bình ( chủ biên)

TÀI LIỆU HỌC TẬP

Hình 3. 1:Sơ đồ hệ thống điều khiển ................................................................................. 81

Hình 4. 34: Thiết kế nắn dạng vòng Hi - inf ................................................................... 197

Hình 1. 2: Lái tàu

Hình 1. 3: Điều khiển máy bay

Hình 1. 5: Điều khiển bền vững mô hình sai số nhân

Hình 1. 7: Sơ đồ khối tổng quát hệ điều khiển thích nghi

Hình 1. 8: Hệ thống điều khiển oto

Hình 1. 9: Điều khiển mực nước trong bồn

Phương trình vi phân mô tả hệ:

Hình 1. 10: Điều khiển hệ tay máy

Phương trình vi phân mô tả hệ :

Hình 1. 11: Hệ con lắc ngược

Hình 1. 12: Sơ đồ thân tự do của hệ con lắc ngược trên xe

MỤC TIÊU CỦA CHƯƠNG

2.1. KHÁI NIỆM VỀ HỆ PHI TUYẾN

Hình 2. 2:Các dạng quỹ đạo pha của hệ bậc 2

Giả sử phương trình của hệ thống được cho bởi

x(t)  f (x(t), u(t)) (2.5)

x(t)  f (x(t), u(t)) (2.6)

f1 f1 f1

- Khâu bão hòa

Hình 2. 9: Khâu bão hòa

Hình 2. 10: Khâu rơle 3 vị trí có trễ

Hình 2. 11: Khâu rơle 3 vị trí có trễ

- Hàm bậc hai đối xứng

Y là hàm lẻ, nên B1  0

Hình 2. 12: Ví dụ hàm truyền hệ hở của 1 hệ phi tuyến

Hình 2. 14: Hệ điều khiển hồi tiếp chứa bão hòa

x  Ax  Bu cho hệ tuyến tính (2.36)

Và x  f (x, t, u) cho hệ phi tuyến (2.37)

Chuyển động bị kích thích có dạng x  t,u  t   , x o  x o

Phương trình viết cho độ lệch

Hay x1  Ax (2.44)

Hình 2. 17: Sơ đồ tùy động đơn giản

x  f (x1, x 2 ...x n ) (2.61)

xt  xt  xt  0 (2.63)

Đặt x1  t   x(t);x 2 (t)  x(t); ta có

x 2 (t)   x1 (t)  x 2 (t) (2.65)

x 2  t   1,15e t/2 sin(0,866t) (2.69)

V  t   Bx1  t  x 2  t   Bx 22  t  (2.72a)

Do B=1 ta được V  t    x 22  t  (2.72b)

V  T    1 333 e t sin 2 (0 ,866t ) (2.73b)

Hình 2.20: Hình 2.21

Hình 2. 22: Hàm xác định dương

V  x1x 2  x12 (x12  x 22 )  x 22 (x12  x 22 )  x1x 2

Nếu chọn hàm V có dạng

trong đó: g  t   L1 G  s   đáp ứng kích thích đơn vị

eo  t  – đáp ứng điều kiện ban đầu

Hình 2. 24:Vùng giới hạn của phi tuyến

Điều kiện giới hạn cho phần tử phi tuyến:

Hình 2. 25: Đặc tính phi tuyến có từ trễ thụ động

Giả sử hệ thống tuyến tính là ổn định.

Hệ thức (2.92) là tiêu chuẩn Popov.

Hình 2. 26: Đặc tính phi tuyến có từ trễ tích cực

Rõ ràng độ dốc của đường thẳng này phụ thuộc vào ω.

Hình 2. 29: Đường Popov trong mặt phẳng

Hình 2. 30:Ví dụ hệ thống điều khiển phi tuyến

Đáp ứng xung đơn vị g(t) được cho bởi

Hình 2. 31: Đặc tính tần số G*(jW) cho ví dụ hình 2.30

u  là tín hiệu vào