You are on page 1of 93

BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC

VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ


-----------------------------

Nguyễn Văn Tính

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN


ĐIỀU KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH
HƯỞNG CỦA TRƯỢT BÁNH XE

LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

Hà Nội – 2018

1
BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC
VÀ CÔNG NGHỆ VIỆT NAM

HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ


-----------------------------

Nguyễn Văn Tính

NGHIÊN CỨU PHÁT TRIỂN MỘT SỐ THUẬT TOÁN


ĐIỀU KHIỂN RÔ BỐT DI ĐỘNG CÓ TÍNH ĐẾN ẢNH
HƯỞNG CỦA TRƯỢT BÁNH XE

Chuyên ngành: Kỹ thuật điều khiển và tự động hóa


Mã số: 9.52.02.16

LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỀU KHIỂN VÀ TỰ ĐỘNG HÓA

NGƯỜI HƯỚNG DẪN KHOA HỌC:


1. TS. Phạm Minh Tuấn

Hà Nội – 2018

2
LỜI CAM ĐOAN

Tôi xin cam đoan rằng đây là công trình nghiên cứu của riêng tôi. Các kết quả
được viết chung với các tác giả khác đều được sự đồng ý của họ trước khi đưa vào
luận án. Các kết quả trong luận án là trung thực và chưa từng công bố trong bất kỳ
công trình nào khác.

Tác giả luận án

Nguyễn Văn Tính

3
LỜI CẢM ƠN

Trước tiên, Tôi không biết nói gì hơn ngoài việc bày tỏ lòng ngưỡng mộ, kính
trọng và biết ơn sâu sắc tới PGS.TSKH. Phạm Thượng Cát và TS. Phạm Minh Tuấn,
hai người Thầy đáng kính đã dìu dắt, định hướng, tận tình hướng dẫn, truyền cảm
hứng, và thắp sáng đam mê nghiên cứu khoa học để tôi vượt qua rất nhiều gian nan
thử thách trên con đường chinh phục khoa học hàn lâm để hôm nay Tôi có thể hoàn
thành luận án đúng tiến độ và chất lượng theo quy định của Bộ Giáo dục và Đào tạo.

Tôi xin gửi lời cảm ơn chân thành tới Ban Lãnh đạo Học viện Khoa học và
Công nghệ, Viện Công nghệ thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt
Nam, Phòng Công nghệ tự động hóa đã tạo điều kiện thuận lợi cho Tôi trong quá
trình học tập và nghiên cứu khoa học hàn lâm của Tôi.

Tôi xin cảm ơn các cán bộ đồng nghiệp Phòng Công nghệ Tự động hóa - Viện
Công nghệ thông tin. Đặc biệt, Tôi muốn gửi lời tri ân để bày tỏ lòng ngưỡng mộ và
kính trọng sâu sắc tới PGS.TS. Thái Quang Vinh, một Cán bộ đồng nghiệp bậc tiền
bối rất bao dung và đáng kính đã luôn động viên Tôi trong những lúc gian nan sóng
gió để Tôi luôn vững tâm và kiên định trên con đường nghiên cứu khoa học hàn lâm,
tạo mọi điều kiện thuận lợi nhất để Tôi có thể tập trung nghiên cứu khoa học và học
tập tiếp thu kiến thức hàn lâm trong quá trình làm nghiên cứu sinh tiến sĩ.

Cuối cùng, tôi xin chân thành cảm ơn đến gia đình, người thân, các bạn đồng
nghiệp - những người luôn dành cho tôi những tình cảm nồng ấm, luôn động viên và
sẻ chia những lúc khó khăn trong cuộc sống và tạo điều kiện tốt nhất để tôi có thể
hoàn thành quá trình nghiên cứu tiến sĩ.

Hà Nội, ngày 24 tháng 10 năm 2018

Tác giả luận án

Nguyễn Văn Tính

4
MỤC LỤC

DANH MỤC CÁC BẢNG.......................................................................................... 7

DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ ..................................................................... 8

DANH MỤC CÁC KÝ HIỆU................................................................................... 10

DANH MỤC CÁC CHỮ VIẾT TẮT ....................................................................... 12

MỞ ĐẦU ................................................................................................................... 13

Tính cấp thiết của đề tài ......................................................................................... 13


Các vấn đề nghiên cứu của luận án........................................................................ 13
Đối tượng nghiên cứu ............................................................................................ 14
Mục đích nghiên cứu ............................................................................................. 14
Phương pháp nghiên cứu ....................................................................................... 14
Ý nghĩa khoa học và thực tiễn của đề tài ............................................................... 14
Bố cục của luận án ................................................................................................. 15
CHƯƠNG 1. TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC ...................................... 16

1.1. Đặt vấn đề .................................................................................................... 16


1.2. Tình hình nghiên cứu trong nước ................................................................ 18
1.3. Tình hình nghiên cứu ngoài nước ................................................................ 19
1.4. Mô hình động học ........................................................................................ 21
1.5. Mô hình động lực học .................................................................................. 23
1.6. Kết luận Chương 1 ....................................................................................... 26
CHƯƠNG 2. THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA TRÊN
MẠNG NƠ RON BA LỚP ....................................................................................... 28

2.1. Đặt vấn đề .................................................................................................... 28


2.2. Cấu trúc mạng nơ ron ba lớp ....................................................................... 29
2.3. Phát biểu bài toán ........................................................................................ 30
2.4. Mô tả biến đầu ra và FTE ............................................................................ 31
2.5. Cấu trúc bộ điều khiển ................................................................................. 33
2.7. Kết quả mô phỏng........................................................................................ 38
2.8. Kết luận Chương 2 ....................................................................................... 41

5
CHƯƠNG 3. THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN
MẠNG SÓNG GAUSSIAN ..................................................................................... 43

3.1. Đặt vấn đề .................................................................................................... 43


3.2. Mô tả cấu trúc của mạng sóng Gaussian ..................................................... 45
3.3. Thiết kế luật điều khiển động học ............................................................... 46
3.4. Thiết kế luật điều khiển động lực học ......................................................... 47
3.5. Phân tích tính ổn định .................................................................................. 50
3.6. Kết quả mô phỏng........................................................................................ 55
3.7. Kết luận chương 3 ....................................................................................... 59
CHƯƠNG 4. THIẾT KẾ LUẬT ĐIỀU KHIỂN THÍCH NGHI BACKSTEPPING
HỘI TỤ HỮU HẠN Ở CẤP ĐỘ ĐỘNG LỰC HỌC ............................................... 60

4.1. Đặt vấn đề .................................................................................................... 60


4.2. Mô tả cấu trúc của RBFNN ......................................................................... 62
4.3. Thiết kế luật điều khiển động học ............................................................... 64
4.4. Thiết kế luật điều khiển động lực học ......................................................... 65
4.5. Phân tích tính ổn định .................................................................................. 67
4.6. Kết quả mô phỏng........................................................................................ 72
4.7. Kết luận Chương 4 ....................................................................................... 77
KẾT LUẬN VÀ KIẾN NGHỊ................................................................................... 79

Những nội dung nghiên cứu chính của luận án ..................................................... 79


Những đóng góp của luận án ................................................................................. 79
Định hướng nghiên cứu phát triển ......................................................................... 80
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ................................................. 81

TÀI LIỆU THAM KHẢO ......................................................................................... 82

PHỤ LỤC. SƠ ĐỒ KHỐI MATLAB/SIMULINK CỦA CÁC HỆ THỐNG ĐIỀU


KHIỂN VÒNG KÍN .................................................................................................. 87

6
DANH MỤC CÁC BẢNG

Bảng 2.1. Các tham số của rô bốt di động [21]. .......................................................39


Bảng 2.2. So sánh các điểm khác biệt giữa hai phương pháp điều khiển ................42

7
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 1.1. Mối liên hệ giữa các bài toán nghiên cứu trong lĩnh vực rô bốt di động. 17
Hình 1.2. Mô tả góc trượt trên xe tự hành kiểu 4 bánh bị trượt bánh xe..................20
Hình 1.3. Một rô bốt di động và hiện tượng trượt bánh xe. ....................................21
Hình 2.1. Cấu trúc của mạng nơ ron 3 lớp. ..............................................................28
Hình 2.2. Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY. ..................30
Hình 2.3. Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín. ............................32
Hình 2.4. Đồ thị của các tốc độ trượt theo thời gian. ...............................................38
Hình 2.5. So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1. ..............40
Hình 2.6. So sánh các sai lệch bám vị trí trong Ví dụ 4.1. .......................................40
Hình 2.7. Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển. .....41
Hình 3.1. Sơ đồ khối của phương pháp điều khiển trong chương 3........................44
Hình 3.2. Cấu trúc của mạng sóng Gaussian – GWN. .............................................44
Hình 3.3. So sánh các quỹ đạo trong ví dụ 3.1. ........................................................56
Hình 3.4. So sánh các sai lệch bám vị trí e1,2 trong Ví dụ 3.1 giữa hai phương pháp
điều khiển trong Chương 2 và Chương 3. .................................................................57
Hình 3.5. So sánh mô men quay giữa hai phương pháp điều khiển. ........................58
Hình 3.6. Đánh giá hiệu quả của biện pháp xử lý chattering ở cả hai bánh xe. .......58
Hình 4.1. Khả năng đáp ứng của động cơ đối với đầu ra của bộ điều khiển. ..........60
Hình 4.2. Sơ đồ khối của phương pháp điều khiển trong Chương 4. ......................63
Hình 4.3. Cấu trúc mạng nơ ron RBFNN. ................................................................63
Hình 4.4. So sánh hiệu năng bám quỹ đạo giữa phương pháp điều khiển mới này
với phương pháp điều khiển ở Chương 3..................................................................73
Hình 4.5. So sánh sai lệch vị trí giữa 2 phương pháp điều khiển. ............................75
Hình 4.6. so sánh sai lệch bám vận tốc góc ở bánh PHẢI và bánh TRÁI giữa hai
phương pháp điều khiển. ...........................................................................................76
Hình 4.7. So sánh các mô men quay của hai phương pháp điều khiển. ...................77
Hình P.1. Sơ đồ khối Matlab/Simulink mô tả mô hình của rô bốt di động..............87
Hình P.2. Sơ đồ khối mô tả mô hình động lực học của rô bốt di động. ...................87
Hình P.3. Sơ đồ khối mô tả mô hình động học của rô bốt di động. .........................88
Hình P.4. Sơ đồ khối Matlab/Simulink của luật điều khiển ở Chương 2, 3, 4. .......88
Hình P.5. Sơ đồ khối của bộ điều khiển trong Chương 2. .......................................89
8
Hình P.6. Sơ đồ khối của mạng nơ ron 3 lớp (với tên nhãn neural network) trong
Chương 2. ..................................................................................................................89
Hình P.7. Sơ đồ khối bộ điều khiển kiểu backstepping ở các Chương 3 và 4. ........90
Hình P.8. Sơ đồ khối bộ điều khiển ở vòng động lực học phía trong ở Chương 3. .90
Hình P.9. Sơ đồ khối mô tả thành phần bền vững cấp động lực học ở Chương 3. ..91
Hình P.10. Sơ đồ khối của bộ điều khiển động học phía ngoài trong Chương 3. ....91
Hình P.11. Sơ đồ khối của thành phần bền vững động học trong Chương 3. ..........91
Hình P.12. Sơ đồ khối của bộ điều khiển ở vòng động lực học trong Chương 4. ...92
Hình P.13. sơ đồ khối của thành phần bền vững động lực học trong Chương 4. ....92
Hình P.14. Sơ đồ khối của bộ điều khiển động học phía ngoài ở Chương 4. ..........93
Hình P.15. Sơ đồ khối của thành phần bền vững động học ở Chương 4. ................93

9
DANH MỤC CÁC KÝ HIỆU

Ký hiệu Ý nghĩa Đơn vị

r Bán kính mỗi bánh xe chủ động m

R Vận tốc góc của bánh phải rad/s

L Vận tốc góc của bánh trái rad/s

b Một nửa khoảng cách giữa hai bánh xe chủ động m

 Vận tốc tịnh tiến của rô bốt di động khi không tồn tại m/s
trượt bánh xe

 Vận tốc tịnh tiến của rô bốt di động khi có tồn tại trượt m/s
bánh xe

 Vận tốc góc của rô bốt di động khi không tồn tại trượt rad/s
bánh xe

 Vận tốc góc của rô bốt di động khi có tồn tại trượt bánh rad/s
xe

M trung điểm của trục nối hai bánh xe chủ động

G Trọng tâm của phần cứng rô bốt di động

a Khoảng cách giữa M và G m

 Tọa độ hướng của rô bốt di động rad

10
L Tọa độ trượt dọc của bánh trái m

R Tọa độ trượt dọc của bánh phải m

 Tọa độ của trượt ngang dọc theo trục bánh xe m

ζ   1,  2 
T
Véc tơ tọa độ của mục tiêu trong hệ tọa độ body M-XY m

ζd  C ,0 Véc tơ mong muốn của ζ   1,  2 


T T m

R Mô men quay ở bánh phải N.m

L Mô men quay ở bánh trái N.m

mG Khối lượng phần cứng rô bố di động kg

mW Khối lượng mỗi bánh xe chủ động kg

IG Mô men quán tính của phần cứng quanh trục thẳng đứng kg.m2
đi xuyên qua trọng tâm G

IW Mô men quán tính của bánh xe quanh trục quay kg.m2

ID Mô men quán tính của bánh xe quanh trục bán kính kg.m2

11
DANH MỤC CÁC CHỮ VIẾT TẮT

GWN Gaussian Wavelet Network- mạng sóng Gaussian

RBFNN Radial Basis Function Neural Network

UUB Uniformly Ultimately Bounded (Bị chặn đều bền vững)

WMR Wheeled Mobile Robot – rô bốt di động kiểu bánh xe

FTE Filtered Tracking Errors – Các sai số bám được lọc

12
MỞ ĐẦU

Tính cấp thiết của đề tài


Có một sự thật không thể phủ nhận rằng các rô bốt di động có khả năng làm
việc trong một phạm vi rộng và có thể thao tác tự động một cách thông minh mà
không cần bất cứ sự tác động nào từ con người. Đặc biệt, chúng có khả năng thay thế
con người trong các nhiệm vụ khó khăn và nguy hiểm như tìm kiếm cứu nạn, cứu
hỏa, tìm kiếm và tháo gỡ bom mìn, vận chuyển vật liệu trong môi trường độc hại,
thám hiểm, trinh sát, giám sát an ninh, vân vân … với chi phí rẻ hơn nhiều so với
người. Bởi vậy, chúng được ứng dụng ngày càng phổ biến trong các lĩnh vực như
công nghiệp, giải trí, chăm sóc sức khỏe, logistics, …

Có rất nhiều loại rô bốt di động khác nhau như rô bốt di động kiểu chân sinh
học, rô bốt di động kiểu bánh xích, rô bốt di động kiểu bánh xe, … Mỗi loại đều có
những đặc điểm phi tuyến cố hữu riêng và trong từng ứng dụng cụ thể đều có những
ưu, nhược điểm nhất định. Cụ thể, ưu điểm của rô bốt di động kiểu chân là có khả
năng di chuyển trên địa hình gồ ghề như cầu thang, đồi núi, … nhưng lại phức tạp về
mặt cấu trúc cũng như phương pháp điều khiển, chẳng hạn như mỗi chân rô bốt phải
có số bậc tự do đủ lớn để tạo ra khả năng di động, phải có khả năng nâng hạ trọng
lượng của chính rô bốt, vân vân. Rô bốt di động kiểu bánh xích và kiểu bánh xe không
có khả năng leo trèo vượt địa hình gồ ghề như kiểu chân nhưng lại có cấu trúc đơn
giản cũng như có khả năng vận chuyển hàng hóa khối lượng lớn với chi phí năng
lượng rẻ hơn. So với rô bốt kiểu bánh xích, rô bốt kiểu bánh xe được ứng dụng phổ
biến hơn rất nhiều trong thực tiễn. Do vậy, đề tài này tập trung nghiên cứu các bài
toán thiết kế các luật điều khiển cho rô bốt di động kiểu bánh xe.

Các vấn đề nghiên cứu của luận án

Tác giả tập trung nghiên cứu các phương pháp điều khiển mới để bù trượt cho
rô bốt di động khi tồn tại trượt bánh xe, bất định mô hình, và nhiễu ngoài.

13
Đối tượng nghiên cứu
Để dễ dàng kiểm chứng tính đúng đắn và hiệu năng của các luật điều khiển
được đề xuất, rô bốt di động 03 bánh xe được lựa chọn làm đối tượng nghiên cứu. Cụ
thể, rô bốt di động kiểu 03 bánh xe này bao gồm 02 bánh chủ động điều khiển vi
phân, 01 bánh thụ động được sử dụng để làm điểm tựa tạo thế cân bằng trọng lực.

Mục đích nghiên cứu


Đề xuất một số phương pháp điều khiển mới để bù ảnh hưởng tiêu cực của bất
định mô hình, nhiễu ngoài, và trượt bánh xe.

Phương pháp nghiên cứu


Phương pháp nghiên cứu được thể hiện qua trình tự công việc như sau:
 Phân tích và xây dựng mô hình động học và động lực học của rô bốt di
động khi tồn tại các bất định mô hình, nhiễu ngoài, và trượt bánh xe.
 Nghiên cứu, phân tích các phương pháp điều khiển tiên tiến trong và
ngoài nước cho rô bốt di động trong sự hiện diện của bất định mô hình,
nhiễu ngoài, và trượt bánh xe. Sau đó, đề xuất các phương pháp điều
khiển mới.
 Chứng minh tính đúng đắn và hiệu quả của các phương pháp điều khiển
mới bằng tiêu chuẩn ổn định Lyapunov và bổ đề Barbalat.
 Tiến hành kiểm chứng các phương pháp điều khiển nói trên băng công
cụ Matlab/Simulink.

Ý nghĩa khoa học và thực tiễn của đề tài


Ý nghĩa khoa học: Xây dựng các phương pháp điều khiển mới cho rô bốt di
động để bù ảnh hưởng tiêu cực của bất định mô hình, nhiễu ngoài, và trượt bánh xe.

Ý nghĩa thực tiễn: Các phương pháp điều khiển được đề xuất trong luận án
này có thể được triển khai ứng dụng cho các rô bốt di động trong nhà kho với mặt sàn
trơn hoặc có thể được triển khai ứng dụng cho các xe tự hành trong các nông trường
với nền đất ẩm ướt dễ trơn trượt.

14
Bố cục của luận án
Chương 1: Trình bày tổng quan các nghiên cứu trong và ngoài nước liên quan
đến nội dung nghiên cứu của luận án trong những năm gần đây. Sau đó, mô hình toán
học của rô bốt di động được xây dựng trong điều kiện tồn tại trượt bánh xe.

Chương 2: Thiết kế luật điều khiển bám thích nghi dựa trên một mạng nơ ron
ba lớp.

Chương 3: Thiết kế luật điều khiển backstepping bền vững thích nghi dựa trên
mạng sóng Gaussian.

Chương 4: Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động
lực học.

15
CHƯƠNG 1. TỔNG QUAN VÀ MÔ HÌNH TOÁN HỌC

1.1. Đặt vấn đề


Trước khi thiết kế các luật điều khiển thì các nhà nghiên cứu cần phải có kiến
thức tổng quan về các kết quả nghiên cứu trên khắp thế giới về chủ đề này và cũng
phải có hiểu biết về mô hình động học cũng như động lực học của đối tượng cần điều
khiển. Do vậy, nội dung của chương này mô tả khái quát về tổng quan kết quả nghiên
cứu liên quan đến chủ đề của luận án. Sau đó, các mô hình động học và động lực học
của rô bốt di động chịu ảnh hưởng tiêu cực của trượt bánh xe được xây dựng.

Các rô bốt di động kiểu bánh xe được trang bị các phần tử chấp hành, các cảm
biến, một máy tính on-board, … để nó có khả năng di chuyển tự động thông minh mà
không cần sự tác động từ con người. Nghiên cứu về rô bốt di động được chia ra làm
4 bài toán chính: thiết kế quỹ đạo, điều khiển chuyển động, định vị, và truyền thông.
Chúng có thể được mô tả như Hình 1.1.

Bài toán định vị là bài toán phối kết hợp các cảm biến để ước lượng vị trí,
hướng, vận tốc, và gia tốc của rô bốt di động trong thời gian thực.

Bài toán truyền thông là bài toán thiết lập kênh giao tiếp giữa rô bốt di động
này với rô bốt di động khác hoặc giữa rô bốt di động với các thiết bị khác trong môi
trường hoạt động.

Thiết kế quỹ đạo là một bài toán quan trọng trong lĩnh vực rô bốt di động, đặc
biệt trong môi trường có nhiều vật cản. Trong bài toán này, bộ điều khiển cần tìm ra
một quỹ đạo tối ưu để rô bốt di động đi từ điểm xuất phát đến điểm đích mà không
có va chạm với bất kỳ vật cản nào. Hơn nữa, khi một rô bốt di động chạy theo các
quỹ đạo được xây dựng từ trước một cách lặp đi lặp lại, tìm kiếm quỹ đạo phù hợp
nhất cũng ảnh hưởng tới tính hiệu quả và chi phí năng lượng của nó, đặc biệt là các
xe nông nghiệp. Bởi vậy, thiết kế quỹ đạo có thể được xem như một dạng của bài
toán tối ưu trong điều kiện có các ràng buộc nhất định như tránh vật cản, ... Bài toán
thiết kế quỹ đạo có thể được chia làm hai lớp: thiết kế quỹ đạo toàn cục và thiết kế
quỹ đạo cục bộ. Trong thiết kế quỹ đạo toàn cục, toàn bộ thông tin về môi trường
hoạt động của rô bốt di động đều được biết, bởi vậy quỹ đạo được thiết kế tĩnh từ

16
trước và môi trường không có sự thay đổi theo thời gian. Trong khi đó, trong thiết kế
quỹ đạo cục bộ, chỉ một phần thông tin về môi trường được biết hoặc không có chút
thông tin nào về môi trường. Trong phương pháp thiết kế quỹ đạo cục bộ, quỹ đạo
luôn được thiết kế động dựa theo thông tin cảm biến về các vật cản được thu thập
online. Bởi vậy, phương pháp thiết kế quỹ đạo cục bộ là phù hợp hơn và có ý nghĩa
thực tiễn hơn phương pháp toàn cục, bởi vì môi trường thường thay đổi theo thời gian
và rất khó để được mô tả chính xác từ trước.

Sau khi quỹ đạo được thiết kế, bài toán điều khiển chuyển động được chú ý
đến để làm sao cho rô bốt phải bám theo quỹ đạo vừa được thiết kế. Bài toán thiết kế
quỹ đạo kết hợp với bài toán điều khiển chuyển động được gọi là bài toán navigation.

Bài toán điều khiển chuyển động cực kỳ quan trọng trong lĩnh vực rô bốt di
động, bởi vì hiệu năng của các luật điều khiển ảnh hưởng trực tiếp đến hiệu quả của
các ứng dụng rô bốt di động trong sản xuất và đời sống. Do vậy, bài toán này được
lựa chọn làm mục tiêu nghiên cứu của luận án này.

Hiểu biết về môi trường và


vị trí điểm đích mong muốn
Thông tin về vị trí,
hướng, vận tốc, …
được thu thập từ
các cảm biến Thiết kế quỹ đạo

Thông tin
Điều khiển
Định vị cảm biến về
chuyển động
môi trường
Navigation

Truyền thông Phần cứng rô


bốt di động

Hình 1.1. Mối liên hệ giữa các bài toán nghiên cứu trong lĩnh vực rô bốt di động.

17
Trong những thập kỷ gần đây, bài toán điều khiển chuyển động cho rô bốt di
động kiểu bánh xe đã thu hút sự chú ý của các nhà khoa học trên khắp thế giới. Hiển
nhiên, rô bốt di động là một trong số các hệ thống chịu ràng buộc nonholonomic [1].
Hơn nữa, nó lại là một hệ thống phi tuyến nhiều vào- nhiều ra [2]. Nhờ có sự tiến bộ
của lý thuyết cũng như kỹ thuật điều khiển, đã có rất nhiều phương pháp điều khiển
khác nhau được áp dụng để thiết kế các luật điều khiển cho rô bốt di động như: điều
khiển trượt [3, 4], điều khiển bền vững [5], điều khiển thích nghi [6-8], điều khiển
backstepping [9-10], tuyến tính hóa phản hồi đầu ra [11] … Các luật điều khiển này
đã được thiết kế với giả thiết “bánh xe chỉ lăn mà không trượt”.

Tuy nhiên, trong thực tiễn ứng dụng, điều kiện các bánh xe chỉ lăn mà không
trượt lại có thể thường xuyên bị vi phạm. Tức là đã xảy ra hiện tượng trượt bánh xe
[12-13].

Có rất nhiều nguyên nhân gây ra hiện tượng này như rô bốt di chuyển trên mặt
sàn có lực ma sát yếu, lực ly tâm khi rô bốt chuyển động theo đường vòng cung, ….
Trượt bánh xe là một trong số các nhân tố chính gây ra sự giảm sút hiệu năng điều
khiển nghiêm trọng. Do vậy, trong các tình huống như vậy, nếu muốn cải thiện hiệu
năng điều khiển, thì cần phải thiết kế một bộ điều khiển có khả năng bù trượt bánh
xe.

1.2. Tình hình nghiên cứu trong nước

Ở Việt Nam, đến nay, đã có rất nhiều nghiên cứu về xe tự hành như nhóm tác
giả ở Đại học Giao Thông Vận Tải nghiên cứu về rô bốt di động di chuyển kiểu bầy
đàn [14-15].
Các nhóm tác giả ở Đại học Cần Thơ [16], Đại học Thái Nguyên [17] nghiên
cứu về điều khiển xe tự cân bằng, …

Một nhóm nghiên cứu ở Đại học Bách Khoa Hà Nội đã nghiên cứu về xây
dựng mô hình cho một ô tô điện 04 bánh khi có tính đến tương tác bánh xe - mặt
đường [18].

Tuy nhiên, chưa có nhiều kết quả nghiên cứu về điều khiển bù trượt bánh xe
cho rô bốt di động được công bố.

18
1.3. Tình hình nghiên cứu ngoài nước

Trên thế giới, đã có rất nhiều báo cáo nghiên cứu về điều khiển bù trượt bánh
xe cho rô bốt di động. Bởi vì trượt bánh xe có thể làm hệ thống mất ổn định hoặc
giảm hiệu năng điều khiển nghiêm trọng nên nó phải được ngăn chặn. Thông thường,
để điều khiển bù trượt bánh xe, các thông tin đo lực ma sát và tốc độ trượt phải luôn
được cập nhật theo thời gian thực và chính xác. Cụ thể, trong [12] các tác giả đã bù
trượt bánh xe bằng cách bù tỷ số trượt bánh xe. Các gia tốc kế đã được sử dụng trong
[13] để bù trượt bánh xe trong thời gian thực. Nghiên cứu trong [19] đã phát triển một
bộ điều khiển bền vững xử lý cả tốc độ trượt lẫn gia tốc trượt bằng cách sử dụng hệ
tọa độ của độ phẳng vi phân. Trong [20], các tác giả đã đề xuất một hệ thống điều
khiển phanh để chống trượt ngang cho bánh xe máy bay thương mại bằng phương
pháp backstepping. Trong [21], Sidek và cộng sự đã phát triển một bộ điều khiển
tuyến tính hóa vào ra để biểu diễn mối quan hệ giữa mô men quay ở động cơ chấp
hành với hàm số lực kéo của trượt bánh xe. Nghiên cứu trong [22-23], các tác giả đã
xử lý trượt bánh xe như một nhiễu bị chặn tác động lên trạng thái hệ thống điều khiển.
Trong [24], một bộ điều khiển kiểu chế độ trượt rời rạc được sử dụng cho nhiệm vụ
bám quỹ đạo dưới điều kiện tồn tại trơn trượt bánh xe. Trong [25], các tác giả đã tách
riêng trượt dọc và trượt ngang, rồi sau đó thiết kế các luật điều khiển riêng rẽ để lần
lượt bù trượt dọc và trượt ngang. Các kỹ thuật đo khác nhau để ước lượng tốc độ trượt
bánh xe đã được báo cáo trong các bài báo [26-28]. Trong [29], mô hình ma sát giữa
bánh xe và mặt đường được khảo sát rất tỷ mỷ và một hệ thống giám sát và ước lượng
hệ số ma sát được đề xuất. Tuy nhiên, hệ thống giám sát này rất phức tạp và cần đến
sự phối kết hợp của nhiều cảm biến tinh vi đắt tiền. Do vậy, giá thành của hệ thống
giám sát ma sát này cũng rất đắt.

Trong [30], các tác giả đã mô hình hóa rô bốt di động như một hệ thống động
lực học bậc ba kèm theo một ràng buộc nonholonomic bậc hai. Các phép đo của trượt
bánh xe được giả sử là có sẵn để thiết kế luật điều khiển. Nhược điểm của giả sử này
là sự đòi hỏi các phép đo bổ sung như gyroscope, gia tốc kế, bộ ước lượng hệ số ma
sát … Trong [31], một bộ điều khiển bám bền vững đã được đề xuất mà ở đó nhiễu
ngoài, trượt bánh xe, đã được ước lượng nhờ sử dụng một bộ quan sát trạng thái mở
rộng. Trong [32], tác giả đề xuất một bộ điều khiển dựa trên một bộ ước lượng nhiễu

19
ngoài do trượt bánh xe gây ra. Trong [33], một bộ điều khiển thích nghi bám được đề
xuất cho rô bốt di động trong sự hiện diện của các ngoại lực và trượt bánh xe. Các
bất định do trượt bánh xe và ngoại lực được bù bằng một mạng nơ ron ba lớp với một
luật cập nhật trọng số linh hoạt. Luật cập nhật trọng số linh hoạt này được xây dựng
dựa trên nguyên lý làm một hàm mục tiêu đạt giá trị nhỏ nhất.

Góc
trượt Trục dọc Bánh
Bánh
xe
xe
Xe tự hành 4 bánh

Hình 1.2. Mô tả góc trượt trên xe tự hành kiểu 4 bánh bị trượt bánh xe.

Các phương pháp điều khiển dựa vào tín hiệu định vị toàn cầu được nghiên
cứu và đề xuất trong [34-35] lần lượt cho các bài toán bám mục tiêu di động và bám
đường của một rô bốt di động kiểu bánh xe bốn bánh.

Đối với xe tự hành trong nông nghiệp, phần lớn các phương pháp điều khiển
phải dựa vào giá trị đo của góc trượt, một góc được tạo bởi giữa trục dọc của xe tự
hành với hướng véc tơ tịnh tiến như Hình 1.2. Năm 2009, Lenain và các cộng sự đã
giới thiệu một bộ quan sát góc trượt hỗn hợp động học và động lực học trong [36].
Trong [37-38], các phương pháp ước lượng góc trượt dựa trên một bộ lọc Kalman
mở rộng đã được đề xuất. Sau đó, góc trượt đã được ước lượng cho các thí nghiệm
chuyển động khác nhau. Năm 2009, Grip và cộng sự [39] đã xây dựng một bộ quan
sát góc trượt phi tuyến bằng cách sử dụng các đặc tính động học và động lực học của
một xe tự hành. Nhờ có bộ quan sát này mà góc trượt và các tham số ma sát đã được
ước lượng trong thời gian thực. Cụ thể, các gia tốc trong các hướng dọc và ngang,
vận tốc góc, góc điều hướng, thông tin vận tốc góc đã được sử dụng cho quá trình
ước lượng này. Tuy nhiên, phương pháp ước lượng này chưa được kiểm chứng qua
một rô bốt thực mà chỉ dừng lại ở bước mô phỏng máy tính.

20
1.4. Mô hình động học

Xét một rô bốt di động kiểu bánh xe chịu ràng buộc nonholonomic như Hình
1.3. Cụ thể, G(xG, yG) là vị trí của tâm khối của phần cứng rô bốt di động. M(xM, yM)
là trung điểm của đoạn trục thẳng nối hai bánh xe. F1, F2 là các ma sát dọc giữa bánh
phải và bánh trái với mặt sàn. F3 là tổng lực ma sát tác động theo hướng ngang ở hai
điểm tiếp xúc của hai bánh xe với mặt sàn.
F4 và  lần lượt là ngoại lực và ngoại mô men tác động lên phần cứng di động
ở điểm G. b là một nửa khoảng cách giữa hai bánh xe. a là khoảng cách giữa điểm M
và điểm G. θ là tọa độ hướng của rô bốt di động.

F3 L
Bánh thụ
Bánh trái F4 động
F2

Trục bánh G
a θ
xe
M
R
2b
Phần cứng
Bánh phải
F1 


Hình 1.3. Một rô bốt di động và hiện tượng trượt bánh xe.

Khi không tồn tại trượt bánh xe, vận tốc tịnh tiến  và vận tốc góc  lần lượt
được tính như sau [22]:

 

r R  L 
 2
 (1.1)

 

r R  L 

 2b
trong đó R ,L lần lượt là tọa độ góc của bánh phải và bánh trái.

Bởi vậy, động học của rô bốt di động này được biểu diễn như sau [4]:

21
 xM   cos 

 yM   sin  (1.2)
  

Ràng buộc nonholonomic của rô bốt di động đảm bảo hai yếu tố như sau:

 Hướng của chuyển động tịnh tiến luôn vuông góc với trục nối hai bánh
xe chủ động.
 Cả chuyển động tịnh tiến lẫn chuyển động quay đều hoàn toàn phụ
thuộc vào chuyển động lăn của hai bánh xe chủ động.
Cụ thể, ràng buộc này có thể được biểu diễn toán học như sau [32]

0  rR  xM cos  yM sin   b (1.3)

0  rL  xM cos  yM sin   b (1.4)

0   xM sin   yM cos (1.5)

Mặt khác, khi tồn tại trượt bánh xe, vận tốc tịnh tiến theo hướng dọc được tính
như sau:
R L
  (1.6)
2
trong đó  R ,  L lần lượt là các tọa độ trượt dọc của bánh phải và bánh trái. Tiếp theo,
vận tốc góc thực của nó được tính như sau:
R L
 (1.7)
2b

Ta định nghĩa  là tọa độ của trượt ngang dọc theo trục bánh xe (xem Hình
1.3). Mô hình động học của rô bốt di động trong tình huống này là [30]:

 xM   cos    sin 

 yM   sin    cos (1.8)
  

Vì hiện tượng trượt, các ràng buộc nonholonomic bị biến dạng như sau [32]:
 R  rR  xM cos  yM sin   b (1.9)

 L  rL  xM cos  yM sin   b (1.10)

22
   xM sin   yM cos (1.11)

1.5. Mô hình động lực học

Các đạo hàm theo thời gian của các tọa độ Đề Các của trọng tâm G được tính
như sau [21]:
xG   cos  sin   a sin  (1.12)
yG   sin    cos  a cos (1.13)

Gọi mG là khối lượng của phần cứng rô bốt, I G là hệ số mô men quán tính
của phần cứng này quanh trục thẳng đứng đi qua G. Động năng của phần cứng này
được tính như sau [21]:
1
2
2
 2 1
KG  mG xG  yG  I G
2
2
 (1.14)

Các động năng của bánh phải và bánh trái lần lượt được tính như sau [21]:
1

K R  mW  rR   R      I WR  I D
1 1
2 2 2 2
(1.15)
2   2 2
1

K L  mW  rL   L      I WL  I D
1 1
2 2 2 2
(1.16)
2   2 2
trong đó I W , I D lần lượt là hệ số mô men quán tính của mỗi bánh xe xung quanh
trục quay và trục đường kính; r là bán kính của mỗi bánh xe.
Tổng động năng của hệ thống là [21]:

K  KG  K R  K L (1.17)

Đặt q   xG , yG , , ,  R ,  L ,R ,L  là véc tơ của tọa độ suy rộng Lagrange.


T

Các phương trình ràng buộc nonholonomic có thể được biểu diễn lại như sau [21]:

A q  q  0 (1.18)

cos sin 
T
b 0 1 0 r 0 
với A  q   cos sin  b 0 0 1 0 r  .
  sin  cos  a 1 0 0 0 0 

23
Rõ ràng thế năng của toàn hệ thống bằng không. Do vậy, hàm Lagrange L
chính bằng tổng động năng của cả cơ hệ này, tức L = K. Tiếp theo, phương trình
Lagrange có thể được viết như sau [21]:

d  L  L
   τd  Nτ  AT λ (1.19)
dt  q  q

trong đó λ  1, 2 , 3  là véc tơ của các lực ràng buộc nonholonomic. Rõ ràng rằng
T

1, 2 và 3 không được biết. τ   R , L  là véc tơ đầu vào với  R , L lần lượt là
T

mô men điều khiển ở bánh phải và bánh trái. τd là véc tơ biểu diễn cả bất định mô

hình và nhiễu ngoài (F4 và ). N là một ma trận đầu vào. Giải phương trình Lagrange
này, ta thu được kết quả sau [21]:

Mq  τd  Nτ  A  q  λ
T
(1.20)
T
0 0 0 0 0 0 1 0 
trong đó, N   ,
0 0 0 0 0 0 0 1 

 mG 0 0 0 0 0 0 0 
 0 mG 0 0 0 0 0 0 
 0 0 IG  2 I D 0 0 0 0 0 
 
 0 0 0 2mW 0 0 0 0 
M 0 0 0 0 mW 0 mW r 0  .
 0 0 0 0 0 mW 0 mW r 
 
 0 0 0 0 mW r 0 mW r 2  I W 0 
 0 mW r  I W 
2
 0 0 0 0 mW r 0

Mặt khác, ta dễ dàng có được phương trình sau [21]:


q  S1  q  v  S2  q  γ  S3  q  (1.21)

trong đó v  R ,L  , γ   R ,  L  .


T T

S1  q  , S2  q  , và S3  q  được biểu diễn lần lượt như sau [21]:

24
 r ar  r ar 
 2 cos   2b sin    2 cos   2b sin   
   
 r sin   ar cos   r ar 
 2   2 sin   2b cos   
2b   
 r r 
S1     ,
 2b 2b 
 0 0 
 0 0 
 0 0 
 1 0 
 
 0 1 

 1 a  1 a 
 2 cos   2b sin    2 cos   2b sin   
      sin  
 1 sin   a cos   1 a   cos  
 2   2 sin   2b cos     0 
2b   
 1 1   
S2     , S  1 
 2b 2b  3
 0 
 0 0   0 
 1 0   0 
 0 1   
   0 
 0 0 
 0 0 

Tính đạo hàm của (1.21), ta đạt được:


q  S1  q  v  S1  q  v  S2  q  γ  S2  q  γ  S3  q   S3 q  (1.22)

Bởi vì S1T  q  AT  q   023 , S1T  q  S1  q   022 , S1T  q  N  I 22 , trong đó

I i j là một ma trận đơn vị ij, và 0i j là một ma trận không ij. Thay (1.22) vào

(1.20), và sau đó nhân kết quả của phương trình mới với S1T  q  , ta được [21]:

Mv  Bv  Bv  Qγ  C  G  τ d  τ (1.23)

Trong đó τ d  S1  q  τd ,

m m 
M  S1T MS1   11 12  ,
 m12 m11 

 r 2 a 2r 2  r 2
m11  mG   2   2  IG  2ID   mW r 2  I W ,
 4 4b  4b

25
 r 2 a 2r 2  r 2
m12  mG   2   2  IG  2ID 
 4 4b  4b

Q Q  r 1
Q  S1TMS 2   11 12  , C  S1T MS3  mG    ,
Q12 Q11  2 1

r  a2  r r  a2  r
Q11  mG 1  2    IG  2ID  , Q12  mG 1   I  2ID  ,
4  b  4b 4  b2  4b G

ar  1  ar 2  0 1 
G  S1T MS3  mG  T
 
2b  1 0
, B S MS m , và
2b  1 1 1 G

ar 2  0 1     L
B  S1T MS1  mG   , với   R L ,   R .
2b  1 0 2 2

Đặc điểm 1: Ma trận M có tính khả nghịch và xác định dương và thỏa mãn
bất phương trình sau:
2 2
M1 x  xTMx  M2 x

với M1 và M2 lần lượt là giá trị chặn trên và chặn dưới của ma trận M và thỏa mãn
M2  M1  0 .

Đặc điểm 2: Ma trận M  2B  v   có tính đối xứng lệch, tức là

xT M  2B  v  x  0 với x  R 21 .

1.6. Kết luận Chương 1

Tóm lại, bài toán điều khiển bù trượt bánh xe cho rô bốt di động có ý nghĩa cả
trong thực tiễn ứng dụng lẫn trong lý thuyết điều khiển học. Đã có rất nhiều nhà khoa
học trên khắp thế giới đã dành thời gian nghiên cứu và giải quyết vấn đề này. Tuy
nhiên, phần lớn các nghiên cứu được thực hiện dưới giả thiết rằng góc trượt [36-39]
và hệ số ma sát giữa bánh xe và mặt đường [29] luôn được đo chính xác trong thời
gian thực. Hiển nhiên, các đại lượng gồm gia tốc tịnh tiến, gia tốc góc, vận tốc tịnh
tiến, vận tốc góc đều có thể được đo trực tiếp một cách dễ dàng qua các cảm biến
rẻ tiền, nhưng góc trượt và hệ số ma sát lại rất khó để đo [40]. Để đo được các tín
hiệu này chính xác và đảm bảo tin cậy, hệ thống phải được tích hợp thêm các cảm

26
biến phức tạp và đắt tiền [40]. Ví dụ, để đo góc trượt, thì các tác giả trong [36-39]
phải sử dụng các bộ ước lượng rất phức tạp đòi hỏi sự phối kết hợp của nhiều cảm
biến tinh vi đắt tiền. Tiếp theo, để ước lượng hệ số ma sát, các tác giả trong [29] phải
dùng đến một hệ thống giám sát lực ma sát giữa bánh xe và mặt đường. Hệ thống này
có cấu trúc rất phức tạp và đòi hỏi sự phối kết hợp của rất nhiều cảm biến tinh vi đắt
tiền với nhau.

Các phương pháp điều khiển được đề xuất trong luận án sẽ hướng tới không
sử dụng các cảm biến đo góc trượt và hệ số ma sát. Thay vào đó, ảnh hưởng tiêu
cực từ trượt bánh xe lên hiệu năng điều khiển bám sẽ được bù một cách gián tiếp
trong các bộ điều khiển.

Ở chương này, mô hình động học và động lực học của rô bốt 3 bánh xe chịu
tác động nhiễu ngoài, trượt bánh xe đã được xây dựng thành công. Các mô hình này
sẽ được sử dụng để thiết kế các luật điều khiển bù trượt bánh xe, bất định mô hình,
và nhiễu ngoài ở các chương sau.
Nội dung của Chương này được trích dẫn từ tài liệu công bố số 3.

27
CHƯƠNG 2. THIẾT KẾ LUẬT ĐIỀU KHIỂN BÁM THÍCH NGHI DỰA
TRÊN MẠNG NƠ RON BA LỚP

2.1. Đặt vấn đề

Sau khi có được mô hình động học và động lực học như ở Chương 1, ở Chương
2 này, một phương pháp điều khiển bám thích nghi dựa trên mạng nơ ron ba lớp được
thiết kế để điều khiển rô bốt di động kiểu bánh xe trong điều kiện tồn tại trượt bánh
xe.

Vì lý do luật điều khiển trong [33] được thiết kế trong hệ tọa độ toàn cục OXY
nên nó yêu cầu phải đo các vận tốc trong hệ toàn cục này. Nhiệm vụ đo vận tốc này
đã được giải quyết bằng bộ quan sát supper-twisting. Kết quả ước lượng từ bộ quan
sát này có thể chứa sai lệch tích lũy trong quá trình vận hành rô bốt. Nên khả năng
triển khai ứng dụng của phương pháp điều khiển trong [33] vẫn bị hạn chế.

Để tránh nhược điểm này, bộ điều khiển mới được đề xuất ở đây được thiết kế
trong hệ tọa độ thân rô bốt MXY. Khi đó, các biến vận tốc của rô bốt có thể được đo
trực tiếp thông qua các cảm biến rẻ tiền nhưng có độ tin cậy cao. Bên cạnh đó, các
vận tốc và gia tốc của trượt bánh xe đều không cần phải đo. Thay vào đó, các ảnh
hưởng tiêu cực của chúng sẽ được bù bằng một luật điều khiển có sử dụng mạng nơ
ron ba lớp.

v1 w1
x1 v11 w11 y1
1 ∑

v2 w2
x2 w22 y2

vN2 wN3

xN1 wN2N3 yN3


Lớp đầu vào Lớp ẩn Lớp đầu ra

Hình 2.1. Cấu trúc của mạng nơ ron 3 lớp.

28
2.2. Cấu trúc mạng nơ ron ba lớp

Hiển nhiên rằng các mạng nơ ron nhân tạo có khả năng xấp xỉ các hàm phi
tuyến đủ trơn với một độ chính xác tùy ý [8]. Trong tiểu mục này, một mạng nơ ron
nhân tạo 3 lớp được giới thiệu khái quát. Như được minh họa trong Hình 2.1, đầu ra

của của mạng nơ ron này được tính như sau y  W, V    y1, y2 ,..., yN3 
T

 
 WTσ V T x trong đó x  1, x1, x2 ,..., xN1 
T
là véc tơ đầu vào, W   wij  và

V  vij  lần lượt là các ma trận trọng số mạng nơ ron kết nối từ lớp đầu vào tới lớp

ẩn và từ lớp ẩn tới lớp đầu ra (xem Hình 2.1).

 
T T
Tiếp theo σ  z   1,  z1  ,  z2  ,..., z N1  với z   z1, z2 ,..., z N1  và
 
  zi  là hàm lõi của mạng nơ ron 3 lớp này. Trong Chương này, hàm lõi này được
lựa chọn là kiểu sigmoid như sau:
1
  zi   (2.1)
1  exp  zi 

Để chi tiết hơn, ta biểu diễn đầu ra thứ i của mạng nơ ron này như sau:

 
N2
yi    wij vj   k 11 v jk xk    wi , i  1,2, , N1
N
  (2.2)
j 1

trong đó N1, N 2 và N 3 lần lượt là số lượng của các nơ ron lớp đầu vào, lớp ẩn, và
lớp đầu ra. Tiếp theo, wij và vij là các trọng số linh hoạt có thể được điều chỉnh online.

 wj và  vi lần lượt là các giá trị điều chỉnh trực tiếp của lớp ẩn và lớp đầu ra.

Đáng chú ý rằng 1 đã được gán như phần tử thứ nhất của véc tơ x, điều này
T
cho phép ta định nghĩa véc tơ v1,v 2 ,...,vN1  như hàng thứ nhất của ma trận V.

T
Tương tự,   z  chứa 1 như phần tử thứ nhất để  w1, w2 ,..., wN2  được tích

hợp như hàng thứ nhất của ma trận W. Vì thế, bất kỳ sự điều chỉnh nào của W và V
đều bao gồm sự điều chỉnh của tất cả wij , vij ,  wj , và  vi .

29
Xét một hàm liên tục f  x  : R N1  R N3 . Tồn tại các ma trận trọng số lý

tưởng, W* và V , sao cho

 
f  x   W*Tσ VT x  ε (2.3)

trong đó ε là véc tơ của các sai lệch xấp xỉ tối ưu.

Giả sử 2.1: ε là bị chặn [8]. Cụ thể, ε  b với b là một hằng số dương hữu

hạn nào đó.

Coi f x, W 
ˆ ,V  
ˆ  y x, W
ˆ ,V
ˆ W 
ˆ Tσ V  
ˆ T x là một ước lượng của f(x). Trong

đó Ŵ và V̂ lần lượt là các ma trận ước lượng của W* và V ; chúng đều được cập
nhật online bởi các thuật toán điều chỉnh trọng số online.

 
Để thuận tiện, ta ký hiệu σ  σ V* x và σˆ  σˆ V
T
 
ˆ T x . Véc tơ sai số xấp xỉ

hàm được định nghĩa như sau:


f  f  x   fˆ x, W 
ˆ ,V  
ˆ  W Tσ V T x  ε  W
* 
ˆ Tσ V
ˆ Tx  (2.4)

2.3. Phát biểu bài toán

Trục OY
Trục
MX
Trục 2
MY
yD D (mục tiêu)
yP P

yM
M

C 1

O xM xP xD Trục OX

Hình 2.2. Tọa độ của mục tiêu trong hệ tọa độ gắn thân rô bốt M-XY.

30
Gọi D(xD, yD) là mục tiêu đang di chuyển theo một quỹ đạo mong muốn với
một vận tốc tịnh tiến được định nghĩa trước (xem Hình 2.2). Không mất tính tổng
quát, phương trình chuyển động của D được mô tả như sau:
 xD  TD .t  R cos(.t )  x0
 (2.5)
 yD   TD .t  R sin(.t )  y0
trong đó , TD, R, , x0, y0 là các hằng số biểu diễn tham số của phương trình chuyển
động của mục tiêu.
Chú ý 2.1: trong Hình 2.2, ta ký hiệu (xP, yP) là vị trí của điểm P, (xP, yP, ) là
một véc tơ mô tả cả vị trí và hướng thực của rô bốt di động. Sự hiện diện của trượt
bánh xe (cả trượt dọc và trượt ngang) khiến cho bài toán điều khiển rô bốt di động
sao cho cả vị trí và hướng thực (xP, yP, ) bám theo vị trí và hướng mong muốn (xPd,
yPd, d) không thể được giải quyết với một hiệu năng có thể chấp nhận được [32].
Nhưng, nếu ta điều khiển rô bốt sao cho vị trí thực (xP, yP) bám theo mục tiêu D(xD,
yD) thì bài toán điều khiển hoàn toàn có thể được giải quyết mặc dù tồn tại cả trượt
dọc và trượt ngang [32].

2.4. Mô tả biến đầu ra và FTE

Một véc tơ của các biến đầu ra được mô tả trong hệ tọa độ M-XY như sau:
    cos sin    xD  xM 
ζ   1  
cos   yD  yM 
(2.6)
 2    sin 
Đạo hàm bậc nhất của (2.6) được tính như sau:
 cos sin    xD 
ζ  hv    χ (2.7)
  sin  cos   yD 
 1  r  1  r 
R    2  1    2  1 
trong đó v    , h   b  2  b  2  ,
L    r 1
r 
 2b 
1
2b

 R   L 
    L
χ   2    2  R .
    1  2b
  

Đạo hàm bậc hai của (2.6) được biểu diễn như sau:

31
ζ  hv  Ψ1  Ψ2 (2.8)

 x cos  yD sin   xD  sin   yD  cos 


trong đó Ψ1  hv   D ,
  xD sin   yD cos  xD  cos  yD  sin  

    xD sin   yD cos 


Ψ2   .
   xD cos  yD sin  

Chú ý 2.2: Nếu  1  0 , thì h là một ma trận khả nghịch.

Gọi ζ d là véc tơ mong muốn của ζ . Dựa vào yêu cầu bài toán điều khiển bám

C 
nói trên và Hình 2.2, hoàn toàn có thể tính được ζ d    .
0
Một véc tơ sai lệch bám vị trí được định nghĩa như sau:
e 
e =  1   ζ - ζd (2.9)
e2 

Một véc tơ FTE (filtered tracking errors) được định nghĩa như sau:

φ = e + Λe (2.10)

trong đó Λ là một ma trận đường chéo, hằng, xác định dương, và có thể được lựa
chọn tùy ý.

Mục tiêu
(xD, yD) Phương  Mạng nơ v
trình (2.14) ron ba lớp

-
Phương e WMR
Bộ điều chịu
trình (2.6) + khiển trượt
bánh xe

Hình 2.3. Sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín.

32
2.5. Cấu trúc bộ điều khiển

Trước tiên, sơ đồ khối của toàn bộ hệ thống điều khiển vòng kín được đề xuất
như Hình 2.3.

Nếu ma trận h khả nghịch, thì ta có thể biểu diễn lại (2.8) như sau:


v  h1 ζ - Ψ1 - Ψ 2  (2.11)

Mặt khác, phương trình (1.23) có thể được viết lại như sau:
Mv  τ  Bv  d (2.12)

trong đó d  Qγ  C  G  Bv  τ d .

Thay thế (2.11) vào (2.12) được phương trình sau:

 
Mh1 ζ  Ψ1  τ  Bv  d  Mh 1Ψ 2 (2.13)

Ψ 2 trong (2.13) phụ thuộc trực tiếp vào vận tốc và gia tốc trượt bánh xe, nên
nó là bất định. Vì thế, để biểu diễn (2.13) theo động lực học của biến FTE φ , một
biến phụ được đề xuất như sau:


κ = h1 ζd  Λe  Ψ1  (2.14)

Cộng Mκ vào cả hai vế của phương trình (2.13) và sau đó kết hợp kết quả với
(2.10) và (2.14) được phương trình sau:

Mh1φ  τ  Mκ  Bv  d  Mh1Ψ2 (2.15)

Bởi vì rất khó để xác định chính xác các tham số của mô hình động lực học
của WMR này như khối lượng, mô men quán tính… Nên không thể biểu diễn chính
xác các biểu thức chứa các tham số này. Vì vậy, ta viết lại (2.15) như sau:
ˆ 1φ  τ  Mh1φ  Mκ  Bv  d  Mh1Ψ
Mh (2.16)
2

ˆ với M̂ là một ma trận ước lượng của M.


trong đó M  M  M

33
Chú ý 2.3: Trong thực tiễn, các vận tốc trượt bánh xe phụ thuộc vào vận tốc
dài và vận tốc góc của rô bốt di động [32].

ˆ 1 được như sau


Nhân cả hai vế của (2.16) với hM
ˆ 1τ  f  x   Ξ
φ  hM (2.17)

trong đó f  x   hM
ˆ 1 Mh 1φ  Mκ  Bv  . Véc tơ x được sử dụng để tính f(x) có
 
thể được xác định như sau
T
x  1 vT κ T  (2.18)

ˆ 1  d  τ   Ψ biểu
Rõ ràng, x có thể được đo dễ dàng. Hơn nữa, Ξ  hM d 2

thị các bất định mô hình và nhiễu ngoài.

Tiếp theo, ta có thể chọn một luật điều khiển bằng phương pháp tính mô men
như sau:

ˆ 1 Kφ  fˆ x, W
τ  Mh

ˆ ,V 
ˆ 
  (2.19)

trong đó K là một ma trận 22 hằng, đường chéo, và xác định dương và được lựa


chọn tùy ý. fˆ x, W 
ˆ là đầu ra của mạng nơ ron để xấp xỉ f  x  như được mô tả
ˆ ,V

trong (2.4).

Thay thế (2.19) vào (2.17) và sau đó kết hợp kết quả với (2.4) được kết quả
sau

ˆ Tσˆ  Ξ
φ  Kφ  W*Tσ  ε  W (2.20)

Mặt khác, ta có thể khai triển chuổi Taylor xung quanh V̂ đối với một x đã
được biết trước như sau:

σ  σˆ  σV T x  O V T x  (2.21)


σ V T x 
trong đó σ 
V
ˆ
V V  
và O V T x biểu thị thành phần bậc hai và cao hơn trong

ˆ.
chuỗi Taylor, V  V*  V

34
 
Ta ký hiệu σ  σ - σˆ  σV T x  O V T x . Lấy cả hai vế (2.21) cộng và trừ W*Tσˆ

và ŴTσ được kết quả sau:


ˆ Tσ  ε  Ξ
φ  Kφ  WTσ  WTσˆ  W (2.22)
ˆ .
trong đó W  W*  W

Bây giờ, chuỗi Taylor được sử dụng để xấp xỉ σ trong (2.22). Bởi vậy, động
lực học của véc tơ sai lệch bám lọc được biểu diễn như sau:

 ˆ Tx  W
φ  Kφ  WT σˆ  σV 
ˆ TσV T x  ε  Ξ  δ (2.23)

 
trong đó δ  WTσV T x  W*TO V T x bất định do các thành phần bậc cao trong chuỗi

Taylor.
Trong Chương này, luật cập nhật trọng số mạng nơ ron được đề xuất như sau:

W 
ˆ  H σφ
1 ˆ
T ˆ T xφT   φ W
 σV ˆ  (2.24)

V 2 
ˆ  H xφT W
ˆ Tσ   φ V
ˆ  (2.25)

trong đó H1 là một ma trận hằng  N2  1  N3 , xác định dương, H 2 là một ma trận

hằng  N1  1  N2 , xác định dương,  là một hằng số dương. Tất cả H1 , H 2 , và 

đều có thể được lựa chọn tùy ý. Các số hạng đầu tiên trong (2.24) và (2.25) là các
ˆ và
thành phần lan truyền ngược thuần túy, các số hạng cuối, H1 φ W
ˆ , là các thành phần e-modification [8] được sử dụng để đảm bảo các giá
H 2 φ V

trị trọng số ước lượng Ŵ và V̂ bị chặn.

2.6. Phân tích tính ổn định

Giả sử 2.2: Ξ và δ trong (2.23) đều bị chặn [8]. Tức, tồn tại các hằng số thực
dương b và b lần lượt thỏa mãn Ξ  b và δ  b .

Định nghĩa 2.1: Để thuận tiện, ta định nghĩa các ma trận Z*  diag  W* , V*  ,

ˆ  diag W
Z    
ˆ , và Z  diag W, V . Trong đó diag    là ký tự của một ma trận
ˆ ,V

đường chéo.

35
Giả sử 2.3: ma trận tham số lý tưởng bị chặn bởi một giá trị chặn trên như sau:
Z F
 ZM trong đó  F là ký hiệu của chuẩn Frobenius [8].

Đáng chú ý ở đây rằng ZM chỉ được sử dụng cho mục đích phân tích tính ổn
định của hệ thống.

Định lý 2.1: Đối với một rô bốt di động chịu ảnh hưởng của trượt bánh xe như
được minh họa bởi mô hình động học (1.8) và mô hình động lực học (1.23), nếu luật
điều khiển được mô tả bởi Hình 2.3 với tín hiệu đầu vào điều khiển được lựa chọn
bởi (2.19) và các luật cập nhật trọng số mạng nơ ron được lựa chọn bởi (2.24) và
(2.25), thì theo tiêu chuẩn Lyapunov và đinh lý LaSalle mở rộng [8], tín ổn định của
toàn bộ hệ thống điều khiển vòng kín được đảm bảo để đạt được một hiệu năng bám
mong muốn mà ở đó véc tơ sai lệch bám vị trí lọc φ sẽ hội tụ về một lân cận nhỏ tùy
ý của không trong khi tất cả các tín hiệu trong hệ thống điều khiển đều bị chặn kiểu
UUB.

Chứng minh: một hàm ứng viên Lyapunov được định nghĩa như sau:
1
2
1
2
1

V  φTφ  tr WT H11W  tr V T H 21V
2
   (2.26)

trong đó tr(.) định nghĩa vết của ma trận.


ˆ và V  V
Lấy đạo hàm của (2.26) theo thời gian với chú ý rằng W  W ˆ

tạo ra:

 ˆ  tr V T H 1V
V  φTφ  tr WT H11W 2
ˆ
   (2.27)

Thay thế (2.23) vào (2.27) được:

 
V  φT  Kφ  WT σˆ  σV T x  W TσV T x  ε + Ξ + δ 
 

   tr  V 
(2.28)
 tr W T ˆ
H11W T ˆ
H 21V

T

T T T

Chú ý rằng φ W σˆ  σV x  tr  W σˆ  σV x φ  ,
T T
   

φT WTσVT x  tr  VT xφT WTσ  , và φT WTσˆ  tr WTσφ 


ˆ T nên (2.28) được viết lại 
thành

36
V  φT  Kφ  ε + Ξ + δ   tr  W T H11W
 
ˆ  σφ ˆ T xφT 
ˆ T  σV
 
 
(2.29)
 tr  V T H 21V ˆ Tσ 
ˆ  xφT W
 

Thay thế (2.22) và (2.23) vào (2.27) ta được

V  φT  Kφ  ε + Ξ + δ    φ tr ZT Z
ˆ   (2.30)

ˆ , ta có thể viết bất phương trình sau:


Hiển nhiên rằng Z  Z*  Z


tr ZT Z 
ˆ Z Z  Z
M F
2
F
(2.31)

Căn cứ vào các Giả sử 2.1-2.3, ta có thể viết bất phương trình sau:

V  φ   K min φ  b  b + b   ZM Z  Z
 F  2
F  (2.32)

trong đó Kmin là trị riêng nhỏ nhất của K.

Bởi vì thực tế rằng ZM Z


F

2
1 2
ZM  Z
2
F  nên ta có thể viết bất phương trình
sau:
 1 2 1 2 
V  φ   K min φ   Z  b  b + b   ZM  (2.33)
 2 F 2

Quan sát (2.33) ta nhận thấy V được đảm bảo xác định âm miễn sao biểu thức
trong ngoặc mang dấu âm. Cụ thể, V  0 được đảm bảo nếu bất phương trình sau là
đúng:
1 2 1
K min φ   Z  b  b  b   ZM
2
(2.34)
2 F 2

Áp dụng tiêu chuẩn Lyapunov và định lý mở rộng của LaSalle, φ và Z được


đảm bảo bị chặn kiểu UUB trong một tập kín như sau:
 1 2 1 2 
UB  φ, Z K min φ   Z  b  b  b   ZM  (2.35)
 2 F 2 

Hơn nữa, đáng chú ý rằng φ có thể được làm nhỏ một cách tùy ý thông qua

chọn K phù hợp. Cụ thể, nếu K càng lớn thì φ càng nhỏ. Tiếp theo, bởi vì φ và Z
bị chặn nên tất cả các tín hiệu trong hệ thống điều khiển vòng kín đều bị chặn.
37
2.7. Kết quả mô phỏng

Để minh họa tính đúng đắn của luật điều khiển trong chương này, các mô
phỏng máy tính bằng phần mềm Matlab/Simulink đã được thực hiện. Rô bốt di động
được mô tả bởi các tham số trong Bảng 3.1. Hơn nữa, vì mục đích so sánh, phương
pháp của Hoang và cộng sự trong [33] cũng được mô phỏng trong cùng một điều
kiện, cụ thể là tồn tại các bất định mô hình và nhiễu ngoài (tức τ d  0 ; M  0 ), hơn
nữa các tốc độ và gia tốc trượt bánh xe không được đo.

Không mất tính tổng quát, giả sử rằng τ d  3  sin  0,5t  2,5  cos  0,4t 
T

ˆ  0,7M , và vận tốc trượt bánh xe được biểu diễn như Hình 3.4. Ở thời điểm
và M
ban đầu, vị trí và hướng được giả lập trong hệ O-XY là xM  0 m, yM  0 m, và
   / 6 rad.
6 0 2 0
Các tham số thiết kế được lựa chọn như sau: K   , Λ
 2 
.
0 6 0
Đối với mạng nơ ron, để đơn giản trong xây dựng mô hình mạng nơ ron mà
không giảm đi ý nghĩa xấp xỉ hàm phi tuyến bất định, lớp ẩn được lựa chọn có 10 nơ
ron, bởi vậy các ma trận hệ số được lựa chọn như sau H1  diag 10 112 ,

H2  diag 8510 và   0.5 .

Hình 2.4. Đồ thị của các tốc độ trượt theo thời gian.

38
Bảng 2.1. Các tham số của rô bốt di động [21].

Tên biến Ý nghĩa Giá trị


r Bán kính bánh xe 0,065 (m)
b Một nửa trục nối hai bánh xe chủ động 0,375 (m)
Hệ số mô men quán tính của phần cứng rô bốt di động 15,625
IG
quanh trục thẳng đứng đi qua G. (kg.m2)
IW Mô men quán tính của bánh xe xung quanh trục bánh 0,0025
xe (kg.m2)
ID Mô men quán tính của mỗi bánh xe quanh trục thẳng 0,005
đứng đi qua tâm bánh xe (kg.m2)
mG Khối lượng phần cứng 30 kg
mW Khối lượng mỗi bánh xe 1 kg
C Khoảng cách giữa M và P 0,5 m
a Khoảng cách giữa M và G 0,3 m

Các giá trị ban đầu của các ma trận trọng số nơ ron được khởi tạo là các số

1) như sau ˆ   rand  0;1


W
ngẫu nhiên trong khoảng (0; 0  112 và

ˆ   rand  0;1 .
V0  510
Dưới đây là một ví dụ mô phỏng đã được thực hiện bằng công cụ
Matlab/Simulink.
Ví dụ 2.1: Mục tiêu D di chuyển theo một đường tròn với phương trình chuyển
động được mô tả như sau:
 xD  2  3cos(0, 2t )
 (2.36)
 yD  0,5  3sin(0, 2t )
Các kết quả mô phỏng cho Ví dụ này được minh họa trong các Hình 2.5, 2.6,
2.7 và 2.8. Trong Hình 2.5, chúng ta có thể dễ dàng thấy rằng phương pháp được đề
xuất trong Chương 2 này tỏ ra hiệu quả hơn phương pháp điều khiển của Hoang Ngoc
Bach trong [33] trong việc bám quỹ đạo khi tồn tại trượt bánh xe và bất định mô hình.

39
Hình 2.5. So sánh hiệu năng bám giữa hai phương pháp trong Ví dụ 4.1.

Hình 2.6. So sánh các sai lệch bám vị trí trong Ví dụ 4.1.

Để tiện việc so sánh, sai lệch bám vị trí trong [33] được quy đổi từ hệ tọa độ
toàn cục OXY sang hệ tọa độ gắn liền thân rô bốt MXY. Hình 2.6 đã thể hiện phép
so sánh sai lệch vị trí của hai phương pháp này trong hệ tọa độ MXY. Cụ thể, trong
trạng thái xác lập, mặc dù sai bám e1 của hai phương pháp là tương đương nhau với
giá trị độ lớn khoảng 0,005 (m), nhưng sai lệch bám vị trí e2 trong phương pháp mới
này nhỏ hơn so với phương pháp của Hoang và cộng sự [33] với giá lớn nhất lần lượt
là: 0,01 và 0,04 (m).

Hình 2.7 minh họa kết quả so sánh mô men điều khiển giữa hai phương pháp.
Về cơ bản, trong giai đoạn quá độ, hai phương pháp này đòi hỏi mô men điều khiển
tương đồng nhau. Trong giai đoạn xác lập, phương pháp trong [33] đòi hỏi biên độ
40
mô men điều khiển lớn hơn so với phương pháp được đề xuất. Tức là, phương pháp
điều khiển mới này sẽ tiết kiệm năng lượng hơn so với phương pháp [33].

Cần chú ý rằng các sai số bám vị trí đã hội tụ về lân cận không, bởi vậy ζ hội
tụ về lân cận ζ d . Hệ quả,  1 hội tụ về lân cận C. Do đó, theo Chú ý 2.2, ma trận h
luôn khả nghịch.

Hình 2.7. Các mô men quay trong Ví dụ 4.1 giữa hai phương pháp điều khiển.

2.8. Kết luận Chương 2

Tóm tại, trong chương này, một bộ điều khiển bám thích nghi được đề xuất
dựa trên một mạng nơ ron 3 lớp với một luật cập nhật trong số mạng nơ ron online.
Nhờ bộ điều khiển được đề xuất này, rô bốt di động đã bám theo một quỹ đạo mong
muốn với một hiệu năng bám tốt trong sự hiện diện của bất định mô hình, nhiễu ngoài,
và trượt bánh xe. Sai lệch bám vị trí đã hội tụ về lân cận không và được điều chỉnh
nhỏ tùy ý. Các kết quả mô phỏng đã thể hiện ưu điểm vượt trội so với phương pháp
trong [33]. Cụ thể, phương pháp điều khiển mới này vừa bám quỹ đạo chính xác hơn
lại vừa tiết kiệm năng lượng hơn so với phương pháp trong [33].

41
Để minh họa các điểm khác biệt giữa hai phương pháp điều khiển này, Bảng
2.2 được lập ra như sau:

Bảng 2.2. So sánh các điểm khác biệt giữa hai phương pháp điều khiển

Phương pháp trong [33] Phương pháp mới ở chương 2

Luật điều khiển được thiết kế trong hệ Luật điều khiển được thiết kế trong hệ
tọa độ toàn cục OXY. tọa độ gắn thân rô bốt MXY.

Luật cập nhật các trọng số mạng nơ ron Luật cập nhật các trọng số được thực
được thực hiện thông quá các toán tử hiện thông qua thông qua tiêu chuẩn
gradient để tối thiểu hóa một hàm mục Lyapunov để đảm bảo tính ổn định của
tiêu. hệ thống điều khiển vòng kín.

Các vận tốc tịnh tiến của rô bốt di động Các vận tốc tịnh của rô bốt di động trong
trong hệ OXY được ước lượng thông hệ MXY được đo trực tiếp thông các các
qua bộ quan sát supper-twisting. Độ tin cảm biến tốc độ rẻ tiền và có độ tin cậy
cậy không cao do sai số tích lũy của cao.
thuật toán.

Nội dung Chương này được trích dẫn từ tài liệu công bố số 4.

42
CHƯƠNG 3. THIẾT KẾ LUẬT ĐIỀU KHIỂN BACKSTEPPING DỰA TRÊN
MẠNG SÓNG GAUSSIAN

3.1. Đặt vấn đề

Mặc dù phương pháp điều khiển ở Chương 3 đã tỏ ra hiệu quả khi bù bất định
mô hình và nhiễu ngoài, nhưng độ chính xác điều khiển (véc tơ sai lệch bám vị trí e)
chưa thực sự cao so với kỳ vọng của các nhiệm vụ yêu cầu khắt khe về độ chính xác.
Lý do có thể là:

 trong phương pháp điều khiển đó, đã không có sự phân chia nhiệm vụ
một cách rõ ràng. Cụ thể, ở đâu (thành phần điều khiển nào) là để xử lý
(bù) ảnh hưởng tiêu cực của trượt bánh xe? Và ở đâu (thành phần điều
khiển nào) là để xử lý (bù) bất định mô hình và nhiễu ngoài ở cấp độ
động lực học.
 Hoặc trong hệ thống điều khiển đó, không có thành phần điều khiển bền
vững, nên tiêu chuẩn ổn định chỉ là UUB. Cụ thể, các sai lệch điều khiển
chỉ được đảm bảo sẽ hội tụ về một miền kín lân cận không, chứ không
phải hội tụ về không.

Do vậy, ở Chương 3 này, một phương pháp điều khiển bám bền vững thích
nghi dựa trên kỹ thuật backstepping [8] (tạo tác động ngược từ động học vào động
lực học) cho rô bốt di động để bù trượt bánh xe, bất định mô hình, và nhiễu ngoài. Sơ
đồ khối của hệ thống điều khiển vòng kín được mô tả như Hình 3.1.

Cụ thể, hệ thống này gồm 2 vòng điều khiển kín. Vòng ngoài chứa bộ điều
khiển động học. Trong bộ điều khiển động học này, thành phần bền vững động học
được sử dụng để bù ảnh hưởng tiêu cực của trượt bánh xe. Vòng kín phía trong chứa
bộ điều khiển động lực học. Đầu ra của bộ điều khiển động học cũng chính là đầu
vào của vòng điều khiển động lực học phía trong. Ở đây, mạng sóng Gausian
(Gaussian wavelet network – GWN) được sử dụng để xấp xỉ các hàm động lực học
phi tuyến không được xác định trước do không biết trước mô hình động lực học của
rô bốt di động. Thành phần bền vững động lực học được sử dụng để bù ảnh hưởng
tiêu cực của bất định mô hình, nhiễu ngoài, và sai số xấp xỉ hàm không thể tránh khỏi
do số lượng hữu hạn các hàm sóng cơ sở trong lớp ẩn của GWN.

43
Bền vững động lực học

Bộ điều Bộ điều Rô
khiển khiển động bôt di
- - dộng
động học lực học
+ +

Mạng sóng
Gaussian
Bền vững
động học

Phương
trình (2.6)

Hình 3.1. Sơ đồ khối của phương pháp điều khiển trong chương 3.

Hệ số dãn
nở
x1


Phép Tịnh tiến

Hệ số dãn
nở
xn 

Hình 3.2. Cấu trúc của mạng sóng Gaussian – GWN.

44
3.2. Mô tả cấu trúc của mạng sóng Gaussian

Cấu trúc của mạng sóng Gaussian được mô tả trong Hình 3.2. Nếu mạng này
chứa p hàm sóng cơ sở thì đầu ra của nó được tính như sau:
p
f k  x    w j j  x  với j = 1,…, p (3.1)
j

trong đó x   x1,..., xn  là véc tơ đầu vào; w j biểu thị một trọng số;  j  x  biểu thị
T

một hàm sóng đa chiều và được tạo thành bởi tích của các hàm sóng đơn chiều [41]
như sau:
 j  x    j  x1  j  x2  ... j  xn  (3.2)

 1 2
trong đó  j  xi   i  xi  exp   ij2 xi  cij   với i  xi   1  ij2  xi  cij  .
2

 2 

ij và cij lần lượt là hệ số giãn nở và tịnh tiến.

Để tiện trong trình bày, mỗi hàm sóng cơ sở của mạng GWN này được minh
họa như sau:
 1 n 2 2

 j  x  j ξ j ,  x  c j   
   x  exp    ij xi  cij 
 2 i 1 
 (3.3)

n T T
trong đó   x    i  xi  , ξ j  1 j  pj  , c j  c1 j c pj  .
i 1

Bởi vậy, đầu ra của GWN (3.1) được viết lại dưới dạng véc tơ như sau:
f  x, W, ξ, c   WT ψ  x, ξ, c  (3.4)
T
trong đó W   wij  , ξ  11, , n1, , 1 p , , np  ,
pm

T
c  c11, ,cn1, ,c1 p , ,cnp  ,

ψ  x, ξ, c    1  x, ξ, c  , 2  x, ξ, c  ,..., j  x, ξ, c  ,... p  x, ξ, c  .


T

Nhờ vào khả năng xấp xỉ mạnh mẽ của mạng GWN [41], nếu như đã cho trước
một hàm trơn bất kỳ f  x  thì sẽ tồn tại một ma trận trọng số tối ưu W , các véc tơ

tối ưu ξ  và c sao cho

45
f  x   W*T ψ  x, ξ* , c*   ε (3.5)

trong đó ε mô tả một véc tơ của các sai lệch xấp xỉ tối ưu.

Giả sử 3.1: tất cả W* , ξ* , và c* đều bị chặn bởi các giá trị hằng số dương. Cụ

thể, đặt Wm ,  m , và cm lần lượt là các giá trị chặn trên của W* , ξ* , và c* . Bởi vậy,

hiển nhiên rằng W* F


 Wm , ξ
*
  m , và c* F
 cm với  F minh họa chuẩn
F

Frobenius [41].

Để thuận tiện trong trình bày, một ma trận mới được định nghĩa như sau Z 

diag  W , diag  ξ  , diag  c  với diag(.) minh họa một ma trận đường chéo.

diag  ξ  , diag  c  lần lượt là các ma trận đường chéo với các phần tử trong đường

chéo là các phần tử của ξ  và c . Dựa trên Giả sử 5.1, rõ ràng rằng Z cũng bị chặn

bởi một hằng số Z m . Cụ thể, ta có Z*  Zm .


F

Giả sử 3.2: véc tơ sai lệch xấp xỉ tối ưu bị chặn bởi một giá trị hằng số dương
 m . Nói cách khác, chúng ta có thể viết rằng ε   m .

 
ˆ , ξˆ , cˆ là đầu ra thực của GWN để xấp xỉ f  x  trong (3.5). Bởi vậy,
Coi fˆ x, W

ta có thể viết:

 
ˆ , ξˆ , cˆ  W
fˆ x, W 
ˆ T ψ x, ξˆ , cˆ  (3.6)

3.3. Thiết kế luật điều khiển động học

Tương tự như Chương 2, Chương này cũng sẽ giải quyết bài toán điều khiển
như được phát biểu trong mục 2.3.

Trước tiên, đạo hàm bậc nhất của ζ trong (2.6) được viết lại như sau:

 cos sin    xD 
ζ  hv   χ
cos   yD 
(3.7)
  sin 
trong đó χ , h được tính tương tư như trong (2.7).

46
Giả sử 3.3: Các tọa độ xD , yD cùng với các đạo hàm bậc 1 và 2 của chúng
đều bị chặn.

Giả sử 3.4: Tất cả các tốc độ trượt bánh xe đều bị chặn. Bởi vậy, tồn tại một
hằng số dương biết trước  sao cho χ   .

Bởi vì vận tốc của các tọa độ trượt bánh xe không được đo nên χ trong (3.7)
là bất định. Ví thế, luật điều khiển động học trong phương pháp điều khiển này được
đề xuất như sau


1
t
 cos sin    xD  
v c  h   Λe  Λ I  ed  ζd      r 
cos   yD 
 (3.8)
 0   sin  
trong đó v c là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v ; r là thành
phần bền vững động học được đề xuất như sau để bù ảnh hưởng tiêu cực của trượt
bánh xe.
e
r (3.9)
e
trong đó  là hệ số của thành phần bền vững động học và được xem như giá trị chặn
trên của χ như trong Giả sử 3.4.

t
Tiếp theo, Λ I  ed chính là thành phần tích phân được sử dụng để khử sai lệch
0

tĩnh trong trạng thái ổn định. Λ I là một ma trận đường chéo, hằng, xác định dương,
và có thể được lựa chọn tùy ý.

Thay thế v trong (3.7) bởi v c trong (3.8) thu được kết quả sau:
t
e   Λe  Λ I  ed  χ  r (3.10)
0

3.4. Thiết kế luật điều khiển động lực học

Định nghĩa một hàm động lực học phi tuyến trơn và không được biết như sau:
f  x   Mvc  B  v  vc (3.11)

T
với x   vTc , v Tc , v T  là đầu vào của GWN.
47
Cộng (3.11) vế theo vế với (1.23) dẫn đến
Ms  τ  B  v  s  f  x   δ (3.12)

với δ  Qγ  C  G  τ d  Bv ;

và s  v  vc là véc tơ của các sai lệch bám vận tốc.

Do thực tế rằng không thể có được kết quả tính toán chính xác các tham số
động lực học của rô bốt di động từ trước, nên không thể tính được chính xác f  x 

trong (3.12).

Bởi vậy, ta đề xuất một đầu vào điều khiển như sau.


ˆ , ξˆ , cˆ  dˆ
τ  Ks  fˆ x, W  (3.13)

trong đó K là một ma trân đường chéo xác định dương và có thể được lựa chọn tùy

 
ˆ , ξˆ , cˆ là đầu ra của GWN như được mô tả trong (3.6) và được sử dụng để
ý. fˆ x, W

xấp xỉ f  x  ; d̂ minh họa thành phần bền vững động lực học được sử dụng để khử

tổng bất định do sai số xấp xỉ của GWN, bất định mô hình động lực học, và nhiễu
ngoài không được xác định, vân vân.

Sử dụng đầu vào điều khiển (3.13) thì (3.12) sẽ trở thành
Ms  B  v  s  Ks  f  ε  δ  dˆ (3.14)


với f  f  x, W* , ξ* , c*   fˆ x, W 
ˆ , ξˆ , cˆ .

 
ˆ  ψ x, ξˆ , cˆ , ψ*  ψ  x, ξ* , c*  . Hơn nữa, ta biểu
Để thuận tiện, ta viết tắt ψ

thị véc tơ sai lệch xấp xỉ hàm như sau:


ˆ Tψ
f  W*T ψ*  W ˆ (3.15)

ˆ và ŴT ψ sẽ dẫn dến như sau


Cộng và trừ (3.15) với cả hai số hạng W*T ψ

f  WT ψ  W T ψ ˆ Tψ
ˆ W (3.16)
ˆ ,ψ  ψ  ψ
với W  W*  W ˆ.
*

Bây giờ, chuỗi khai triển Taylor được áp dụng để xấp xỉ ψ trong (3.16) như
sau.

48
ψ  ΩTξ  ΞTc  O ξ, c   (3.17)

 
với ξ  ξ*  ξˆ , c  c*  cˆ , O ξ, c là các số hạng bậc cao trong chuỗi Taylor; Ω và

Ξ biểu diễn các ma trận Jacobian được định nghĩa như sau:

   2  p 
Ω 1  (3.18)
 ξ ξ ξ  ˆ
ξ ξ

   2  p 
Ξ 1  (3.19)
 c c c  ˆ
cc

 j  j
Chi tiết hơn, và được tính toán chi tiết như sau:
ξ c

T
 j   j  j 
0 0 0 0 (3.20)
ξ  j 1n 1 j  nj  p  j n 

T
 j   j  j 
0 0 0 0 (3.21)
c  j 1n c1 j cnj  p  j n 

Thay thế (3.17) vào (3.16) dẫn đến

  
ˆ  ΩTξˆ  ΞTcˆ  W
f  WT ψ ˆ T ΩTξ  ΞTc  φ  (3.22)

với Q  W Ω ξ*
T T
 + Ξ c   W O  ξ, c  .
T
*
T
*

Thay thế (3.22) vào (3.14) dẫn đến

Ms  B  v  s  Ks  W T ψ 
ˆ  ΩTξˆ  ΞTcˆ 
(3.23)

ˆ T ΩTξ  ΞTc  d  dˆ
W 
với d  Q + δ  ε .

Thành phần bền vững động lực học d̂ trong (3.23) được đề xuất như sau:
s
dˆ   (3.24)
s

trong đó  là hằng số dương và được lựa chọn sao cho thỏa mãn Giả sử 3.5 như sau.

49
Giả sử 3.5: Thành phần bất định động lực học d trong (3.23) bị chặn và thỏa
mãn bất phương trình sau:
1
d     Z m2 (3.25)
2
với  là một hằng số dương được lựa chọn tùy ý. Tất nhiên,  ,  , và Z m thỏa
mãn bất phương trình sau.
1
   Z m2 (3.26)
2
Tiếp theo, các luật cập nhật cho các tham số của GWN được đề xuất thông qua
các tín hiệu có thể đo được như sau.

W W  
ˆ  H ψˆ  ΩTξˆ  ΞTcˆ sT   H s W
W
ˆ (3.27)

ξˆ  H ΩWs
ˆ   H s ξˆ
 (3.28)

ˆ   H s cˆ
cˆ  HcΞWs (3.29)
c

trong đó HW , H , H c là các ma trận đường chéo, xác định dương và có thể được

lựa chọn tùy ý.

3.5. Phân tích tính ổn định

Định lý 3.1. Xét rô bốt di động trong sự hiện diện của trượt bánh xe, bất định
mô hình, và nhiễu ngoài với mô hình động học (1.8) và mô hình động lực học (1.23),
các Giả sử 3.1 -3.5 đúng. Nếu luật điều khiển được đề xuất như Hình 5.1 với luật
điều khiển động học (3.8), luật điều khiển động lực học (3.13), và các luật cập nhật
trọng số cho GWN như (3.27), (3.28), và (3.29), thì các véc tơ sai lệch điều khiển
bám, e và s , sẽ hội tụ tiệm cận về 0 khi t   , và hơn nữa tất cả các tín hiệu trong
hệ thống điều khiển vòng kín được đảm bảo bị chặn với t  0 .

Chứng minh. một hàm ứng viên Lyapunov được chọn như sau
T
1 1t  t  1
V  eTe    ed  Λ I   ed   sT Ms
2 2  0 


0
 2
 (3.30)
1

 tr W T HW
2
1 1
 1
W  ξ T H1ξ  cT H c1c,
2 2
với tr(.) là vết của ma trận.
50
Tính đạo hàm của (3.30) được phương trình sau
 t  1
V  e  e  Λ I  ed   sT Ms  sT Ms
T
  2
 0  (3.31)
 
W  ξ T H1ξˆ  cT H c1cˆ
1 ˆ
 tr W T HW

Thay thế (3.10), (3.23), (3.27)-(3.29) vào (3.31) và chú ý đến Đặc điểm 2 trong
Chương 1 dẫn đến.

V  eT Λe  eT χ  eTr  sT d  dˆ  
sT  KsT  W T ψ
 ˆ T ΩTξ  ΞTc 
ˆ  ΩTξˆ  ΞTcˆ  W
   
(3.32)
 tr  W T ψ
 
ˆ  ΩTξˆ  ΞTcˆ sT   s Wˆ 
 

ξ T ΩWs ˆ   s ξˆ  cT ΞWs ˆ   s cˆ   
Thay thế (3.9) và (3.24) vào (3.32) được

V  eT Λe  eT χ   e  sTd   s

sT  Ks  W T ψˆ  ΩTξˆ  ΞTcˆ  W


 
ˆ T ΩTξ  ΞTc 
   
 
(3.33)
 tr  W T ψˆ  ΩTξˆ  ΞTcˆ sT   s W
ˆ
 

ξ T ΩWs ˆ T   s ξˆ  cT ΞWs ˆ   s cˆ   
Áp dụng các Giả sử 3.4 và 3.5, rồi rút gọn (3.33) được
1
V  eT Λe  sTKs   s Z m2   s  tr ZT Zˆ 
2     (3.34)


ˆ  diag W
với Z 
ˆ , ξˆ , cˆ và Z  Z  Z
*
ˆ.

Tiếp theo, hiển nhiên rằng

tr ZT Z   
ˆ  tr  ZT Z  Z   Z Z
*  m   F
 Z
2
F
(3.35)

1 2 1 2
Do thực tế rằng xy  x  y luôn đúng với x, y R , nên (3.35) được
2 2
suy luận tiếp ra bất phương trình sau

 2
m 
ˆ  1 Z2  1 Z
tr ZT Z
2
2
F
(3.36)

51
Thay thế (3.36) vào (3.34) được
1 2
V  eT Λe  sTKs   s Z (3.37)
2 F

Rõ ràng rằng V  0 với  s , e , và Z . Áp dụng tiêu chuẩn Lyapunov, ta có

V  t   V  0  . Bởi vậy, nếu s , e , W , ξ , c đã bị chặn ở thời điểm ban đầu t = 0 thì

tất cả chúng sẽ được đảm bảo bị chặn với mọi t > 0. Hệ quả, v c , ζ , Ŵ , ξ̂ , ĉ , và τ
bị chặn với mọi t > 0.

Nếu chỉ sử dụng tiêu chuẩn Lyapunov thì ta chỉ có thể chứng minh được rằng
hệ thống điều khiển vòng kín đã ổn định, và hệ quả là các tín hiệu trong hệ thống bị
chặn. Lý do là vì đạo hàm bậc nhất của hàm ứng viên Lypunov V được lựa chọn ở
trên là xác định bán âm trên miền khảo sát toàn cục.

Nhưng yêu cầu đặt ra của bài toán điều khiển là các sai lệch điều khiển phải
hội tụ tiệm cận về không. Để kiểm chứng khả năng hội tụ về không của các biến sai
lệch điều khiển (cụ thể là véc tơ sai lệch vị trí e và sai lệch vận tốc góc s), ta phải sử
dụng thêm một công cụ nữa là bổ đề Barbalat [42].

Để áp dụng bổ đề Barbalat, ta định nghĩa một hàm ứng viên Lyapunov khác
như sau
t
V2  V   V    eT   Λe    sT   Ks    d (3.38)
0

Đạo hàm (3.38) được


V2  eT Λe  sTKs (3.39)

Bây giờ ta kiểm tra tính liên tục đều của V2 mà đạo hàm của nó được tính như
sau.
V2  2eT Λe  2sTKs (3.40)

Từng số hạng trong (3.10) và (3.23) đều bị chặn. Bởi vậy, V2 được đảm bảo

bị chặn, tức V2 là liên tục đều.

Theo bổ đề Barbalat [42], ta có thể kết luận rằng V2  0 khi t   . Do đó,

cả e và s hội tụ tiệm cận về không.

52
Chứng minh kết thúc ở đây.

Chú ý 3.1. Để khử hiện tượng chattering trong v c (ở cấp độ động học), ta thay
thế (3.9) bởi luật bền vững mới sau:

 e
 e nếu e 

r (3.41)
e e 
 nếu
 

trong đó  là một hằng số thực dương rất nhỏ và có thể được lựa chọn tùy ý.

Bây giờ, ta kiểm tra tính ổn định của vòng điều khiển động học kín phía ngoài
khi e   bằng cách chọn một hàm ứng viên Lyapunov như sau.

T
1 T 1t  t 
V3  e e    ed  Λ I   ed  (3.42)
2 2  0 


0


Đạo hàm (5.43) dẫn đến

 t 
V3  e  e  Λ I  ed 
T (3.43)
 
 0 
Thay thế (3.10) và (3.41) vào (3.43) trong trường hợp e   , ta được

  
V3  eT  Λe  χ  e  (3.44)
  
Dựa vào Giả sử 5.4, dễ dàng có được bất phương trình sau

  
V3   e   min   e    (3.45)
  
trong đó  min là trị riêng nhỏ nhất của Λ .

Quan sát (3.45) thì thấy rõ ràng rằng V3 được đảm bảo xác định âm miễn sao

số hạng trong dấu ngoặc xác định dương. Cụ thể, V3 xác định âm nếu bất phương
trình sau đúng.

 
  min    e   (3.46)
 

53
Bởi vậy, theo tiêu chuẩn Lyapunov và định lý Lasalle mở rộng [42], e bị chặn
đều kiểu UUB trong một tập kín như sau:


   

Ue  e  R 21   min   e    (3.47)

   

Rõ ràng rằng e có thể được làm nhỏ một cách tùy ý bằng cách lựa chọn Λ
phù hợp. Cụ thể, nếu Λ càng lớn thì e càng nhỏ.

Chú ý 3.2. Tương tự, với mục đích khử hiện tượng chattering của vòng động
lực học, (3.24) được thay bằng phương trình sau.

 s s 
  s
nếu
dˆ   (3.48)
 s nếu s 
 

trong đó  là một hằng số dương rất nhỏ biểu diễn một lớp biên lân cận không và có
thể được lựa chọn tùy ý.
Trong trường hợp s   , dựa trên tiêu chuẩn Lyapunov và định lý mở rộng

của LaSalle [42], s được đảm bảo bị chặn đều trong một tập kín như sau:

   1 2 
Us  s  R 21  K min    Z  s   (3.49)
   2 F

trong đó K min là trị riêng nhỏ nhất của K. Hơn nữa, cần chú ý rằng s có thể được

giữ nhỏ một cách tùy ý bằng cách lựa chọn K phù hợp. Ví dụ, nếu K càng lớn thì s
càng nhỏ.

54
3.6. Kết quả mô phỏng

Trong phần này, một mô phỏng được thực hiện để kiểm chứng tính đúng đắn
và hiệu năng của phương pháp điều khiển được đề xuất trong Chương này. Cần nhấn
mạnh rằng không có bất kỳ thông tin nào được biết trước về mô hình động lực học
của rô bốt di động.

Hơn nữa, một mô phỏng của phương pháp điều khiển trong Chương 2 cũng
được thực hiện để so sánh hiệu năng điều khiển, phân tích ưu nhược điểm giữa hai
phương pháp điều khiển với nhau.

Vì mục đích so sánh, cả hai phương pháp này đều được thực hiện dưới một
điều kiện có tính thực tiễn cao rằng bên cạnh chú ý đến sự tồn tại của bất định mô
hình và nhiễu ngoài, các phép đo vận tốc và gia tốc trượt bánh xe được bỏ qua. Cụ

thể, ta giả sử rằng: τ d  3  sin(0,5t ) 2,5  cos  0,4t 


T
(N.m) , và hơn nữa trượt

bánh xe giữa các bánh xe và mặt sàn cũng được giả sử như Hình 2.4.

Các hệ số điều khiển được chọn như sau: K = diag([7, 7]), Λ  diag [2, 2] ,

ΛI  diag [0,1 0,1] ,   0,005 ,   0,005 .

Để đơn giản trong quá trình xây dựng mô hình mô phỏng toán học trong
Matlab/Simulink của mạng GWN, cấu trúc của nó được chọn như sau: 6 đầu vào, 10
hàm sóng (p =10), 2 đầu ra. Các ma trận được chọn như sau: HW  I1010 ,
H  Hc  10I 6060 ,   0,1 . Các giá trị ban đầu của các trọng số được chọn ngẫu

ˆ  0   rand  0; 1 , cˆ  0   ξˆ  0   rand  0;1 .


nhiên là W 210 601

Vị trí và hướng ban đầu của rô bốt di động trong hệ O-XY là


 2
 xM  0  ; yM  0  ;  0   0  m  ,0  m  ,  rad  . Bởi vậy, vị trí ban đầu của điểm
 3 
 C 3C 
P là:  xP  0  ; yP  0      ,  (m) .
 2 2 

55
Ví dụ 3.1: Mục tiêu D đã di chuyển trên quỹ đạo cong như sau.

 xD  2  3cos  0, 2t 
 (3.50)
 yD  0,5  3sin  0, 2t 
Các kết quả mô phỏng của cả hai phương pháp được minh họa trong các Hình
3.3, 3.4, và 3.5.

Hình 3.3. So sánh các quỹ đạo trong ví dụ 3.1.

Nếu chỉ xem Hình 3.3, ta có thể lầm tưởng rằng hiệu năng của hai phương
pháp điều khiển này là tương đương nhau. Nhưng khi xem Hình 3.4, ta dễ dàng thấy
rằng các sai lệch bám vị trí e1,2 của Phương pháp điều khiển mới nhỏ hơn rất nhiều
so với phương pháp cũ trong Chương 2. Cụ thể, các giá trị lớn nhất của e1,2 của
phương pháp mới trong giai đoạn xác lập lần lượt là 1.103 và 0,6.10-3 (m). Trong
khi đó, đối với phương pháp cũ trong Chương 2, các giá trị tương ứng lần lượt là:
1,5.10-2 và -1,2.10-2 (m).

Bởi vậy, khả năng xấp xỉ của GWN và khả năng bền vững của các thành
phần điều khiển bền vững đã tạo ưu điểm vượt trội cho phương pháp điều khiển
mới này so với phương pháp cũ trong Chương 2.

Rất cần thiết để chú ý rằng trong các Hình 3.4, véc tơ các sai lệch bám vị trí, e
trong (2.8), đã hội tụ tiệm cận về không. Bởi vậy,  1 đã hội tụ tiệm cận về hằng số C.
Tức là, ma trận h trong (2.9) luôn khả nghịch. Do vậy, ta có thể kết luận rằng luật
điều được đề xuất trong Định lý 3.1 là đúng.

56
Tuy nhiên, nhược điểm của phương pháp mới này là rằng: để có được hiệu
năng bám tốt hơn Chương 2 như vậy, phương pháp mới được đề xuất trong Chương
5 này đã phải đòi hỏi mô men quay lớn ở các tín hiệu đầu vào điều khiển. Kết quả từ
Hình 3.5 đã thể hiện rất rõ ràng. Cụ thể, phương pháp mới này đòi hỏi các đầu vào
điều khiển lớn tại thời điểm ban đầu với các giá trị lần lượt là 100 (N.m) ở bánh phải
và 80 (N.m) ở bánh trái. Trong khi đó, với phương pháp ở Chương 2, tại thời điểm
ban đầu, các mô men điều khiển lần lượt là 63 (N.m) ở bánh phải và 38 (N.m) ở bánh
trái.

a) b)

c) d)
Hình 3.4. So sánh các sai lệch bám vị trí e1,2 trong Ví dụ 3.1 giữa hai phương pháp
điều khiển trong Chương 2 và Chương 3.
a, b) So sánh e1,2 trong toàn bộ quá trình mô phỏng;
c, d) so sánh e1,2 trong trạng thái xác lập từ 3(s) đến 10 (s).

57
Cuối cùng nhưng không kém phần quan trọng, để đánh giá hiệu quả của các
biện pháp khử chattering trong các Chú ý 3.1 và 3.2, ta thực hiện lại mô phỏng Ví dụ
3.1 với các luật điều khiển động học (3.9) và động lực học (3.24) sau đó so sánh với
kết quả mô phỏng tương ứng với các luật (3.41) trong Chú ý 3.1 và (3.48) trong Chú
ý 3.2. Kết quả từ Hình 3.6 cho thấy hiệu quả xử lý chattering được thể hiện rất rõ ràng
ở cả hai bánh xe. Khi chattering được xử lý phù hợp thì giá thành (chi phí năng lượng)
vận hành hệ thống điều khiển vòng kín này sẽ được giảm xuống, và đồng thời tuổi
thọ của các phần tử chấp hành tại các bánh xe sẽ kéo dài hơn rất nhiều.

a) b)
Hình 3.5. So sánh mô men quay giữa hai phương pháp điều khiển.

a) Mô men quay ở bánh phải; b) Mô men quay ở bánh trái.

Hình 3.6. Đánh giá hiệu quả của biện pháp xử lý chattering ở cả hai bánh xe.

a) So sánh mô men ở bánh phải. b) So sánh mô men ở bánh trái.

58
3.7. Kết luận chương 3

Trong chương này, một bộ điều khiển bám dựa trên kỹ thuật backstepping và
mạng sóng Gaussian GWN với các luật cập nhật tham số động đã được sử dụng để
cho phép rô bốt di động bám theo một quỹ đạo cho trước trong điều kiện tồn tại trượt
bánh xe, bất định mô hình và nhiễu ngoài. Với phương pháp này, không cần phải biết
trước mô hình động lực học của rô bốt di động và cũng như không cần phải đào tạo
tĩnh trước các trọng số của GWN. Hai thành phần bền vững đã được sử dụng để tạo
tính bền vững của toàn bộ hệ thống điều khiển. Cụ thể, một thành phần bền vững ở
vòng điều khiển kín phía ngoài được sử dụng để bù ảnh hưởng tiêu cực của trượt bánh
xe, thành phần bền vững còn lại ở vòng điều khiển kín phía trong được sử dụng để
bù ảnh hưởng của bất định mô hình, nhiễu ngoài và cả sai số xấp xỉ của GWN. Tính
ổn định của toàn hệ thống điều khiển được đảm bảo bằng tiêu chuẩn Lyapunov. Các
kết quả mô phỏng đã kiểm chứng tính đúng đắn và hiệu quả của phương pháp điều
khiển mới này.

Tuy nhiên, nhược điểm của phương pháp này là đòi hỏi tín hiệu điều khiển đầu
vào (mô men quay) ở thời điểm ban đầu rất lớn.

Nội dung của Chương 3 này được trích dẫn từ bài báo công bố số 7.

59
CHƯƠNG 4. THIẾT KẾ LUẬT ĐIỀU KHIỂN THÍCH NGHI
BACKSTEPPING HỘI TỤ HỮU HẠN Ở CẤP ĐỘ ĐỘNG LỰC HỌC

4.1. Đặt vấn đề

Như ta đã biết, nhược điểm của phương pháp điều khiển ở Chương 3 là đòi hỏi
mô men điều khiển quá lớn ở thời điểm ban đầu, cụ thể là 100 và 80 N.m. Điều này
có thể dẫn đến nguy cơ bão hòa động cơ ở phần tử chấp hành [43].

Nguy cơ bão hòa động cơ là một hiện tượng xảy ra khi khả năng cung cấp tối
đa mô men quay ở phần tử chấp hành (động cơ) nhỏ hơn yêu cầu ở đầu ra của bộ điều
khiển. Tức là, nếu mệnh lệnh ở đầu ra bộ điều khiển vượt quá ngưỡng bão hòa, thì
động cơ sẽ không đáp ứng được yêu cầu về độ lớn mô men quay của mệnh lệnh điều
khiển đó (xem Hình 4.1).

Nếu hiện tượng này xảy ra thì khả năng ứng dụng của luật điều khiển vào hệ
thống điều khiển vòng kín sẽ bị méo mó và hiệu năng điều khiển bị suy giảm một
cách rõ rệt và thậm chí gây ra mất ổn định toàn hệ thống [44].

Nhược điểm của luật điều khiển ở Chương 3 cũng là lý do để một luật điều
khiển mới ở Chương 4 này được đề xuất thêm.

Yêu cầu của bài toán điều khiển ở Chương 4 được đặt ra là như sau. Trong khi
vẫn đảm bảo độ chính xác điều khiển bám quỹ đạo như ở Chương 3, nhưng bộ điều
khiển mới phải khử được nhược điểm của Chương 3 về yêu cầu mô men quá lớn ở
thời điểm ban đầu (cụ thể là 100 N.m và 80 N.m).

Bộ điều C A A
Động cơ
khiển
Ngưỡng bão hòa

C
Ký hiệu viết tắt:
C - Mệnh lệnh từ đầu ra bộ điều khiển
A – Đáp ứng thực tế của động cơ Ngưỡng bão hòa

Hình 4.1. Khả năng đáp ứng của động cơ đối với đầu ra của bộ điều khiển.

60
Trong [43], hiện tượng bão hòa động cơ được tránh bằng cách tính trước giá
trị lớn nhất của tín hiệu điều khiển rồi sau đó đem so sánh với ngưỡng bão hòa của
động cơ. Nếu giá trị lớn nhất này nhỏ hơn ngưỡng bão hòa thì các tham số thiết kế
được lựa chọn là phù hợp. Nhưng ngược lại, nếu giá trị lớn nhất này lớn hơn ngưỡng
bão hòa thì quá trình thiết kế bộ điều khiển bị coi như là thất bại.

Khác với [43], ở Chương này, hiện tượng bão hòa động cơ được xử lý một
cách gián tiếp thông qua luật điều khiển đảm bảo tính hội tụ hữu hạn của sai lệch điều
khiển ở cấp độ động lực học. Cụ thể hơn, trong giai đoạn quá độ, do sai lệch điều
khiển rất lớn, nên biểu thức tính mô men được tính theo một hàm phi tuyến của sai
lệch điều khiển sao cho giá trị mô men được tính trong giai đoạn này càng nhỏ càng
tốt.

Tương tự Chương 3, ở Chương 4 này, một phương pháp điều khiển bám bền
vững thích nghi dựa trên kỹ thuật backstepping cho rô bốt di động để bù trượt bánh
xe, bất định mô hình, và nhiễu ngoài được đề xuất. Sơ đồ khối của hệ thống điều
khiển vòng kín được mô tả như Hình 4.2.

So với Chương 3, một số khác biệt được liệt kê như sau:

 Giá trị mô men điều khiển được đòi hỏi ở thời điểm ban đầu nhỏ hơn.
 Mục tiêu của phương pháp điều khiển mới này là sai lệch điều khiển ở vòng
kín phía trong (sai lệch bám vận tốc góc s) được đảm bảo hội tụ về không
sau một khoảng thời gian hữu hạn (hội tụ hữu hạn ở cấp độ động lực học)
thay vì hội tụ tiệm cận như ở Chương 3 (hội tụ về không khi t ).
 Hơn nữa, ở Chương 3, để lựa chọn phù hợp các hệ số hằng cho các thành
phần bền vững, đòi hỏi phải biết trước các giá trị chặn trên của tốc độ trượt
bánh xe, của bất định mô hình và cả nhiễu ngoài. Tuy nhiên, trong thực tiễn,
rất khó để biết trước các giá trị chặn trên này. Trong khi đó, trong phương
pháp mới ở đây, không cần phải biết trước các giá trị chặn trên đó bởi vì
các hệ số của các thành phần bền vững được tự động cập nhật động một
cách linh hoạt trong quá trình vận hành hệ thống điều khiển vòng kín.

61
4.2. Mô tả cấu trúc của RBFNN

Rõ ràng rằng mạng RBFNN đã đơn giản hóa và làm thuận tiện các thủ tục xấp
xỉ các hàm trơn phi tuyến không biết trước do mô hình động lực học của các đối
tượng điều khiển không được xác định từ trước. Bởi vậy, nó đã được áp dụng trong
nhiều bài toán khác nhau trong kỹ thuật điều khiển. Ví dụ, các tác giả trong [12] đã
áp dụng mạng này để xấp xỉ các hàm động lực học liên tục nhưng bất định của một
rô bốt di động.
Tuy nhiên, theo như thẩm định của Lewis và cộng sự trong [45], các trọng số
của mạng nơ ron sẽ không thể được đảm bảo bị chặn nếu như luật cập nhật các trọng
số là thuật toán lan truyền ngược thuần túy. Ví dụ, luật cập nhật trọng số nơ ron trong
[45-47] là các thuật lan truyền ngược thuần túy.
Từ các kết quả trên, một luật cập nhật trọng số online cải tiến cho mạng
RBFNN được đề xuất. Cụ thể, một thành phần e-modification [45] đã được sử dụng
trong luật cập nhật các trọng số mạng nơ ron online để đảm bảo tính bị chặn của
chúng.
Như được thấy trong Hình 4.3, cấu trúc của RBFNN bao gồm 3 lớp: lớp đầu
vào, lớp ẩn, và lớp đầu ra. Lớp đầu vào rất đơn giản. Trong lớp này, véc tơ đầu vào
T
được định nghĩa bởi: x   x1,..., xN1  trong đó N1 là số nút đầu vào. Lớp ẩn chứa N2

nơ ron. Mỗi nơ ron được biểu diễn bởi một hàm lõi. Trong Chương này, hàm lõi dạng
Gaussian được đề xuất như sau:

 1 2
 i  x   exp   x  ξ i  với i = 1,…, N2 . (4.1)
 2 i2 
trong đó ξ i ,  i lần lượt là tâm và độ rộng của hàm Gaussian của nơ ron lớp ẩn thứ i.
Lớp đầu ra được tạo thành thông qua một tổ hợp tuyến tính của các trọng số
và các hàm lõi. Cụ thể, biểu thức của nút đầu ra thứ j được biểu diễn như sau
N2
y j  W j 0  W ji i  x  với i = 1,…, N2 . (4.2)
i 1

ở đây, đáng chú ý rằng Wj0 biểu diễn giá trị tác động trực tiếp của nút đầu ra thứ j;
trọng số Wji liên kết nơ ron lớp ẩn thứ i với nơ ron đầu ra thứ j.

62
Thành phần bền
vững động lực học

Bộ điều Rô bốt
e khiển Bộ điều di động
- động học khiển động bị trượt
- lực học bánh xe
+ +

Thành phần RBFNN


bền vững
động học

Phương
trình (2.6)

Hình 4.2. Sơ đồ khối của phương pháp điều khiển trong Chương 4.

x1

Lớp đầu vào Lớp đầu ra


Lớp ẩn

Hình 4.3. Cấu trúc mạng nơ ron RBFNN.

Véc tơ đầu ra của RBFNN được biểu diễn như sau:

y  WT σ  x  (4.3)

T
trong đó y   y1,..., yN3  biểu diễn véc tơ đầu ra bao gồm tất cả các nút đầu ra với

N3 là số nút đầu ra. Hơn nữa, W chứa cả các giá trị tác động trực tiếp và các trọng số.
63
σ  x   1,1  x  ,..., N2  x  biểu diễn véc tơ của các hàm lõi của lớp ẩn. Đáng chú
T

ý rằng 1 đã được gán vào phần tử thứ nhất của σ  x  . Điều này có thể được giải thích

bởi thực tế W chứa cả Wj0 và các trọng số Wij của RBFNN.

Đối với bất kỳ một véc tơ hàm liên tục và bị chặn nào f  x  : R N1  R N3 , tồn

tại một ma trận tối ưu W sao cho

f  x   WTσ  ε (4.4)

trong đó ε là véc tơ sai lệch xấp xỉ tối ưu. Để thuận tiện, ta định nghĩa σ  σ  x  .

Giả sử 4.1: ma trận W là bị chặn bởi một hằng số dương không được biết nào
đó. Cụ thể, giả sử WM là một giá trị chặn trên của W, ta có W F
 WM với  F là

chuẩn Frobenius [12].

Giả sử 4.2: Véc tơ xấp xỉ tối ưu ε trong (4.4) bị chặn bởi một hằng số dương
 M nào đó [46-47]. Nói cách khác, ta có thể viết rằng ε   M .

 
ˆ là đầu ra thực tế của RBFNN để xấp xỉ f  x  trong (4.4). Cụ thể,
Đặt fˆ x, W

ta có thể viết:


fˆ x, W 
ˆ W
ˆ Tσ (4.5)

4.3. Thiết kế luật điều khiển động học

Tương tự như Chương 2, Chương này cũng sẽ giải quyết bài toán điều khiển
như được phát biểu trong mục 3.3.

Xuất phát từ (3.8) trong chương 3, luật điều khiển động học trong phương pháp
điều khiển này được đề xuất như sau:

 1
t
 cos sin    xD  
v c  h   Λe  Λ I  ed  ζd    ˆ
χ  (4.6)

 0   sin  cos   yD  
trong đó v c là véc tơ mong muốn của véc tơ các vận tốc góc bánh xe v , Λ là một
ma trận đường chéo, hằng, xác định dương, và có thể được lựa chọn tùy ý, χ̂ là thành
phần bền vững động học được đề xuất như sau
64
e
χˆ  ˆ (3.7)
e

trong đó ̂ là hệ số của thành phần bền vững động học và được cập nhật online như
sau:

ˆ  H e (3.8)

trong đó H là một hệ số dương và cũng được lựa chọn tùy ý.

t
Tiếp theo, Λ I  ed chính là thành phần tích phân được sử dụng để khử sai lệch
0

tĩnh trong trạng thái ổn định. Λ I là một ma trận đường chéo, hằng, xác định dương,
và có thể được lựa chọn tùy ý.

Thay thế v trong (3.8) bởi v c trong (4.6) thu được kết quả sau:

t
e   Λe  Λ I  ed  χ  χˆ (4.9)
0

4.4. Thiết kế luật điều khiển động lực học

Ta định nghĩa một véc tơ hàm động lực học phi tuyến trơn không được biết
như sau:

f  x   Mvc  B  v  vc (4.10)

T
với v c được tính trong (4.6) và x   vTc , v Tc , v T  là đầu vào của RBFNN và có thể

được đo dễ dàng.

Cộng (4.10) vế theo vế vào (1.23) dẫn đến

Ms  τ  B  v  s  f  x   δ (4.11)

trong đó, s  v  vc là véc tơ của các sai lệch bám vận tốc góc,

δ  Bv  Qγ  C  G  τ d .

Vì không biết trước mô hình động lực học của rô bốt di động, nên ta không thể
biết f  x  một cách chính xác. Bởi vậy, ta đề xuất đầu vào điều khiển như sau:
65


τ  Ksig  s   fˆ x, W
ˆ  dˆ  (4.12)

trong đó K là một ma trận hằng xác định dương và có thể được lựa chọn tùy ý.


fˆ x, W ˆ Tσ là đầu ra của RBFNN (4.3) và được sử dụng để xấp xỉ f  x  . Tiếp
ˆ W

theo,

   T
sig  s    s1 sign  s1  , s2 sign  s2   (4.13)
 

với  là một hằng số dương thỏa mãn 0    1 ; d̂ biểu diễn thành phần bền vững
động lực học được sử dụng để bù tổng bất định gồm bất định mô hình, nhiễu ngoài,
và sai số xấp xỉ hàm do số lượng hữu hạn của các nơ ron lớp ẩn gây ra.

Sử dụng đầu vào điều khiển (4.12) khiến động lực học của s trong (4.11) trở
thành


Ms  B  v  s  Ksig  s   f  δ  dˆ (4.14)


với f  f  x   fˆ x, W 
ˆ .

Thay thế (4.4) và (4.5) vào (4.14) thu được


Ms  B  v  s  Ksig  s   WTσ  d  dˆ (4.15)

với d  δ  ε .

Bây giờ, thành phần bền vững động lực học d̂ được định nghĩa như sau:

 1 2  s
dˆ   ˆ   WM  (4.16)
 2  s

trong đó  là một hằng số dương và có thể được lựa chọn tùy ý. ̂ là hệ số bền
vững động lực học và được cập nhật động như sau:

̂   s (4.17)

với  là một hằng số dương và cũng được lựa chọn tùy ý.

Giả sử 4.3: thành phần bất định d trong (4.15) bị chặn như sau

d  (4.18)

66
trong đó  là một hằng số dương nhưng không được biết.

Một luật cập nhật trọng số RBFNN cải tiến được đề xuất như sau:

ˆ  HσsT   H s W
W ˆ (4.19)

trong đó H là một ma trận hằng, đường chéo, xác định dương, và có thể được lựa
chọn tùy ý. Số hạng đầu trong (4.19) chính là luật lan truyền ngược thuần túy; số hạng
thứ hai là e-modification [45].

4.5. Phân tích tính ổn định

Định lý 4.1: Chú ý đến một rô bốt di động trong sự hiện diện của trượt bánh
xe, bất định mô hình, và nhiễu ngoài với mô hình động học (1.8) và động lực học
(1.23). Các Giả sử 3.3-3.4 và 4.1-4.3 được thỏa mãn. Nếu phương pháp điều khiển
được đề xuất như Hình 6.2 với luật điều khiển động học (4.6), luật điều khiển động
lực học (4.12), thành phần bền vững động học (4.7), thành phần bền vững động lực
học (4.16), và các luật cập nhật động (4.8), (4.17), và (4.19) được đề xuất, thì véc tơ
sai lệch bám vận tốc góc s hội tụ về không trong một thời gian hữu hạn, véc tơ sai
lệch vị trí e hội tụ tiệm cận về 0 khi t   , các tín hiệu điều khiển được đảm bảo
luôn bị chặn.

Chứng minh: một hàm ứng viên Lyapunov được chọn như sau:

T
1 1t  t  1
V4  eTe    ed  Λ I   ed   sT Ms
2 2  0 


0
 2
 (4.20)
1
2
 1
2
 1
 tr W T H 1W  H 1  2   1 2
2
ˆ ,     ˆ .
với tr(.) là biểu thức vết của ma trận,     
ˆ ,   ˆ
ˆ ,   
Tính đạo hàm của (4.20) kèm theo chú ý rằng W  W
thì thu được kết quả sau:

 t  1
V4  e  e  Λ I  ed   sT Ms  sT Ms
T
  2
 0  (4.21)

 
ˆ  H 1 ˆ   1ˆ
 tr W T H 1W

67
Thay thế (4.8), (4.9), (4.15), (4.17), và (4.19) vào (4.21) kèm theo chú ý đến
Đặc điểm 2 ở Chương 1 thu được kết quả sau:

V4  eT Λe  eT χ  eT χˆ   e   s  sT d  dˆ  
(4.22)

T 
  
s  Ksig  s   WTσ   tr  WT σsT   s W
ˆ 
 
Thay thế (4.7) và (4.16) vào (4.22) dẫn đến

V4  eT Λe  eT χ  ˆ e   e
1
 s  sTd  ˆ s   s WM 2
(4.23)
2
 
 
sT Ksig  s   W Tσ  tr  W T σsT   s W

ˆ .
 
T T T T
 
Chú ý rằng s W σ  tr W σs và rút gọn (4.23) dẫn đến

V4  eT Λe  eT χ   e  sTd   s
(4.24)
1
  s WM
2
2 
 sT Ksig  s    s tr W T W
ˆ  
Dựa trên các Giả sử 3.3-3.4 và 4.1-4.3, ta có thể viết các bất phương trình sau:

eT χ   e (4.25)

sTd   s (4.26)


tr WT W  
 M F

ˆ  tr  WT W  W   W W  W 2
F
(4.27)

1 2 1 2
Hơn nữa do thực tế rằng bất phương trình xy  x  y luôn đúng với mọi
2 2
x, y  R nên từ (4.27) ta có bất phương trình sau

 
ˆ  1 W2  1 W
tr WT W
2
M
2
2
F
(4.28)

Thay thế (4.25), (4.26), và (4.28) vào (4.24) dẫn đến

 1
V4  eT Λe  sTKsig  s    s W
2
(4.29)
2 F

68
Rõ ràng rằng V4  0 với  s , e , và W . Áp dụng tiêu chuẩn Lyapunov, ta có

V4  t   V4  0  . Bởi vậy, nếu s , e, W ,  , và  bị chặn ở thời điểm ban đầu t = 0, thì

tất cả chúng sẽ bị chặn ở mọi t > 0. Hệ quả là v c , ζ , W , ̂ , và ̂ bị chặn ở t  0.

Tương tự như chương 3, áp dụng bổ đề Barbalat [42] thì ta cũng có thể chứng
minh tính hội tụ tiệm cận về không của sai lệch vị trí e.

Bây giờ, để kiểm chứng tính hội tụ hữu hạn của véc tơ sai lệch bám vận tốc s,
ta định nghĩa một hàm ứng viên Lyapunov khác như sau.

1
V5  sT Ms (4.30)
2
Đạo hàm bậc nhất của (4.30) được tính như sau:

1
V5  sT Ms  sTMs (6.31)
2

Thay thế (4.15) vào (4.31) kèm theo chú ý đến Đặc điểm 2 trong Chương 1
dẫn đến


V5  sT Ksig  s   WTσ  d  dˆ  (4.32)
 

Từ Giả sử 4.3 và (4.16), dẫn đến

   1 2 
V5  sTKsig  s   s  WTσ     ˆ   WM  (4.33)
  2 

Bởi thực tế rằng W σ bị chặn [12] và hơn nữa ̂ luôn tăng mỗi khi s  0,
T

nên nếu như ˆ  0  và  trong (4.17) được chọn đủ lớn, thì bất phương trình sau luôn

đúng hoặc sẽ đúng sau một khoảng thời gian ngắn.

ˆ 1 2 
WTσ        WM 0 (4.34)
 2 
Bởi vậy,


V5  sTKsig  s  (4.35)

Căn cứ vào kết quả nghiên cứu trong [46] và Đặc điểm 1 ở Chương 1, ta có

69
thể dễ dàng viết ra bất phương trình sau:

1  /2
 2 
V5
1  /2
V5   K min  
(4.36)
 M2 

trong đó K min là trị riêng nhỏ nhất của K.


Bởi vậy, thời gian cần thiết [46] để s hội tụ về không là:

1  /2
V5  0 
ts 
1  /2
 2 
K min 
1    (4.37)

 M2  2

với V5  0  là giá trị ban đầu của V5 .

Chú ý 4.1. Để khử hiện tượng chattering trong v c (đầu ra của bộ điều khiển
động học), ta thay thế (4.7) bởi phương trình sau:

ˆ e
 e nếu e 

χˆ   (4.38)
 ˆ e
  nếu e 

trong đó  là một giá trị thực hằng rất nhỏ và có thể được lựa chọn tùy ý. Nó biểu
diễn lớp biên ở lân cận không. Bởi vậy, (4.8) được thay thế

 e nếu e 
ˆ   (4.39)
 0 nếu e 

Bây giờ, ta kiểm tra tính ổn định của vòng điều khiển kín cấp độ động học mỗi
khi e   bằng cách lựa chọn một hàm Lyapunov khác như sau:

T
1t  t 
1
2
 
V7  eTe    ed  Λ I   ed 
2  0   
(4.40)
 0 
Tính đạo hàm của (4.40) được phương trình sau:

 t 
V7  e  e  Λ I  ed 
T (4.41)
 
 0 

70
Thay thế (4.9) và (4.38) trong trường hợp e   vào (4.41) được

 ˆ  (4.42)
V7  eT  Λe  χ  e 
  

Áp dụng Giả sử 3.4, ta thu được bất đẳng thức sau

 ˆ   (4.43)
V7   e   min   e   
  

Quan sát (4.43) bộc lộ rằng V7 được đảm bảo mang giá trị âm nếu số hạng

trong dấu ngoặc mang giá trị dương. Cụ thể, V7 mang giá trị âm nếu bất đẳng thức
sau đúng.

 ˆ  (4.44)

 min   e 
  
Bởi vậy, theo tiêu chuẩn Lyapunov và định lý mở rộng LaSalle [42], véc tơ sai
lệch vị trí e được đảm bảo bị chặn trong một tập kín như sau:


  ˆ  

Ue  e  R 21   min   e    (4.45)

   

Hơn nữa, e có thể được điều chỉnh nhỏ tùy ý bằng cách lựa chọn Λ phù
hợp. Cụ thể,  min càng lớn thì, e càng nhỏ.

Chú ý 4.2. Tương tự, để loại bỏ hiện tượng chattering ở vòng điều khiển động
lực học, (4.16) được thay thế bởi phương trình sau:

 ˆ 1 2  s
   2  WM  s nếu s 
 
dˆ   (4.46)
  ˆ  1  W 2  s s 
  M nếu
 2 
trong đó  là một hằng số dương nhỏ miêu tả độ dày lớp biên lân cận không và có
thể được lựa chọn tùy ý. Vì vậy, để đảm bảo tính bị chặn của ̂ , (4.17) được thay thế
bởi phương trình sau:

71
 s nếu s 
ˆ   (4.47)
 0 nếu s 

Trong trường hợp s   , theo tiêu chuẩn Lyapunov và định lý LaSalle mở

rộng, ta hoàn toàn khẳng định được s bị chặn trong một tập kín như sau:


  ˆ  

Us  s  R 21  K min   s    (4.48)

   

trong đó K min là trị riêng nhỏ nhất của K. Hơn nữa, đáng chú ý rằng s có thể được
điều chỉnh nhỏ tùy ý bằng cách chọn K phù hợp. Cụ thể, K min càng lớn thì s càng
nhỏ.

4.6. Kết quả mô phỏng

Trong phần này, ta thực hiện một mô phỏng để kiểm chứng tính đúng đắn và
hiệu năng của phương pháp điều khiển được đề xuất trong Chương này. Hơn nữa,
trong mô phỏng này, ta sẽ so sánh hiệu năng bám của phương pháp mới được đề xuất
này với phương pháp điều khiển cũ trong Chương 3.

Vì mục đích so sánh, cả hai phương pháp này đều được thiết kế với cùng các
hệ số điều khiển và được thực hiện dưới một điều kiện có tính thực tiễn cao rằng
bên cạnh chú ý đến sự tồn tại của bất định mô hình và nhiễu ngoài, các vận tốc và gia
tốc trượt bánh xe không được đo.

Cụ thể, không mất tính tổng quát, ta giả sử rằng:

τ d  3  sin(0,5t ) 2,5  cos  0,4t  (N.m), và hơn nữa trượt bánh xe giữa
T

các bánh xe và mặt sàn được giả sử như Hình 2.4.

Các hệ số điều khiển được lựa chọn như K = diag([8, 8]); Λ  diag [2, 2]

1
ΛI  diag [0,1 0,1] ;   ;   0,005 ;   0,01; ˆ  0   1,5 ; ˆ  0   0,15 ;
3
H    0,1 . Kiến trúc của RBFNN được xác định như sau: 6 nút đầu vào, 40 nơ ron
trong lớp ẩn, và 2 nút đầu ra. Các hệ số của luật cập nhật trong số mạng nơ ron
H  2I 4141 ;   0,1 .
72
Vị trí và hướng ban đầu của rô bốt trong hệ toàn cục O-XY được lựa chọn như
sau  xM  0  , yM  0  ,  0   0  m  ,0  m  ,0  rad  . Do vậy, vị trí ban đầu của điểm

 
P là  xP , yP     1 C, 3 C   m  . Các giá trị ban đầu của các trọng số mạng RBFNN
 2 2 
ˆ  0   rand  0;1
được chọn ngẫu nhiên bởi W .
241

Ví dụ 4.1: Mục tiêu D chuyển động theo phương trình sau.


 xD  2  3cos  0, 2t 
 (4.49)
 yD  1  3sin  0, 2t 

Các kết quả mô phỏng được biểu diễn trong các Hình 4.4, 4.5, 4.6, và 4.7.

Cụ thể, Hình 4.4 thể hiện rằng sai lệch bám vị trí trong mặt phẳng O-XY của
hai phương pháp điều khiển là tương đồng nhau.

Hình 4.4. So sánh hiệu năng bám quỹ đạo giữa phương pháp điều khiển mới này
với phương pháp điều khiển ở Chương 3.

Hình 4.5 thể hiện so sánh sai lệch bám vị trí e (được định nghĩa trong (2.6))
giữa hai phương pháp điều khiển. Hình 4.5.a) và 4.5.b) minh họa kết quả so sánh toàn
bộ tiến trình của các biến e1,2 . Ta thấy có vẻ như hai phương pháp này cho kết quả

tương đồng nhau về sai lệch bám vị trí. Nhưng khi quan sát các Hình 4.5.c) và 4.5.d)
thì ta có thể thấy rằng, trong trạng thái xác lập, phương pháp mới ở Chương 4 cho
kết quả tốt hơn phương pháp cũ ở Chương 3. Cụ thể, trong trạng thái xác lập, sai lệch
vị trí lớn nhất ở bánh phải và bánh trái của phương pháp mới lần lượt là 2,2.10-3 và

73
1,55.103 (m) . Trong khi đó, với phương pháp ở Chương 3, các con số tương ứng lần
lượt là: 3.10-3 (m) và 2,3.10-3 (m).

Khi xét đến véc tơ sai lệch bám vận tốc góc s, được định nghĩa trong (3.12) và
(4.11), trong vòng điều khiển động lực học như Hình 4.6, thì rõ ràng rằng trong giai
đoạn xác lập, sai các sai lệch bám vận tốc góc s1,2 của phương pháp điều khiển mới
nhỏ hơn rất nhiều so với phương pháp ở Chương 3. Cụ thể, các giá trị lớn nhất của
s1,2 trong trạng thái xác lập ở Chương 4 đều là khoảng 5.10-3 (rad/s), trong khi đó
các giá trị tương ứng ở Chương 3 đều là khoảng 2,5.10-2 (rad/s). Lý do là, xét về định
tính, phương pháp điều khiển mới ở đây đã đảm bảo tính hội tụ hữu hạn [46] ở cấp
độ động lực học, nghĩa là, sai lệch điều khiển bám tốc độ góc s được đảm sẽ hội tụ
về không sau một khoảng thời gian hữu hạn t s được tính trong (4.37) thay vì chỉ hội

tụ tiệm cận (s  0 khi t  ) như ở Chương 3.

Cuối cùng và quan trọng nhất, khi xét đến các tín hiệu đầu vào điều khiển  R,L

(mô men quay) như trong Hình 4.7 thì rõ ràng rằng tại thời điểm ban đầu, các mô
men quay của phương pháp mới nhỏ hơn rất nhiều so với phương pháp ở Chương 3.
Cụ thể, tại thời điểm 0(s), các giá trị mô men quay tại các bánh phải và trái trong
phương pháp Chương 4 lần lượt là 30 (N.m) và 25 (N.m). Nhưng đối với phương
pháp trong Chương 3, thì các giá trị tương ứng lần lượt là 100 (N.m) và 80 (N.m).
Các các đòi hỏi giá trị mô men nhỏ tại thời điểm ban đầu trong phương pháp mới sẽ
làm giảm nguy cơ bão hòa động cơ, hạ thấp giá thành cho chi phí đầu tư động cơ chấp
hành.

74
a) b)

c) d)

Hình 4.5. So sánh sai lệch vị trí giữa 2 phương pháp điều khiển.

a) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí e1 ;
b) So sánh toàn bộ tiến trình biến thiên của sai lệch vị trí e2 ;
c) So sánh trạng thái xác lập của e1 , khảo sát trong thời gian từ 2(s) đến 8(s);
d) So sánh trạng thái xác lập của e2 , khảo sát trong thời gian từ 2(s) đến 8(s).

75
a) b)

c) d)

Hình 4.6. so sánh sai lệch bám vận tốc góc ở bánh PHẢI và bánh TRÁI giữa hai
phương pháp điều khiển.

a) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh phải s1 ;
b) so sánh toàn bộ tiến trình của sai lệch bám tốc độ góc ở bánh trái s2 ;
c) so sánh TRẠNG THÁI XÁC LẬP của s1 ;
d) so sánh TRẠNG THÁI XÁC LẬP của s2 ;

76
a) b)

Hình 4.7. So sánh các mô men quay của hai phương pháp điều khiển.

a) So sánh mô men quay  R ở bánh phải.


b) So sánh mô men quay  L ở bánh trái.

4.7. Kết luận Chương 4

Trong Chương này, một bộ điều khiển bám thích nghi bền vững dựa trên một
RBFNN với một luật cập nhật trọng số động đã được phát triển để cho phép một rô
bốt di động bám theo một quỹ đạo mong muốn với một hiệu năng bám mong muốn
mặc dù tồn tại trượt bánh xe, bất định mô hình, và nhiễu ngoài.
Với phương pháp điều khiển mới này thì không cần phải biết trước mô hình
động lực học của rô bốt di động này. Hơn nữa, cũng không cần phải đào tạo trước các
trọng số của RBFNN bởi vì chúng có thể được khởi tạo một cách dễ dàng và được
cập nhật động một cách linh hoạt trong quá trình vận hành hệ thống điều khiển vòng
kín. Các thành phần bền vững cũng như các trọng số RBFNN được đảm bảo bị chặn.
Nhờ có phương pháp điều khiển này, một hiệu năng bám mong muốn đã được thỏa
mãn. Cụ thể, bên cạnh sự hội tụ tiệm cận về không của các sai lệch bám vị trí được
đảm bảo, sai lệch bám vận tốc góc s được đảm bảo hội tụ về không sau một khoảng
thời gian hữu hạn ts được tính trong (4.37). Kết quả mô phỏng đã chứng minh tính
đúng đắn cũng như các ưu điểm của phương pháp điều khiển mới này.

Tóm lại, luật điều khiển hội tụ hữu hạn ở cấp độ động lực học đã khắc phục
được những nhược điểm của phương pháp điều khiển ở Chương 3. Cụ thể là:

77
 giảm được nguy cơ bão hòa động cơ tại thời điểm ban đầu.

 nâng cao độ chính xác ở cấp độ động lực học trong trạng thái xác lập
của hệ thống điều khiển.

 không cần phải xác định trước các giá trị chặn trên của các thành phần
bất định mô hình, nhiễu ngoài và tốc độ trượt bánh xe.

78
KẾT LUẬN VÀ KIẾN NGHỊ

Sau khi tổng hợp nội dung trong các Chương 1, 2, 3, và 4, một số kết luận chính
được đúc kết như sau:
Những nội dung nghiên cứu chính của luận án

 Phân tích tổng quan, thực trạng, xu thế phát triển của các phương pháp điều
khiển cho rô bốt di động kiểu bánh xe để bám theo một quỹ đạo mong muốn
được định nghĩa trước.

 Phân tích các nguyên nhân và ảnh hưởng tiêu cực của các loại bất định mô
hình, nhiễu ngoài, và trượt bánh xe.

 Xây dựng mô hình động học, động lực học của rô bốt di động khi xét ảnh
hưởng tiêu cực của trượt bánh xe lên chuyển động của rô bốt.
 Xây dựng 03 luật điều khiển khác nhau để bù ảnh hưởng của trượt bánh xe
lên rô bốt di động. Cụ thể, một phương pháp điều khiển chỉ gồm 1 vòng kín,
hai phương pháp điều khiển còn lại gồm 2 vòng kín. Tính ổn định của hệ
thống điều khiển được đảm bảo bằng tiêu chuẩn Lyapunov và bổ đề Barbalat.
 Thực hiện các mô phỏng máy tính bằng công cụ MATLAB/Simulink để kiểm
chứng tính đúng đắn của các luật điều khiển được đề xuất trong luận án.

Những đóng góp của luận án

Công bố 07 bài báo tại hội nghị trong nước, hội nghị quốc tế, tạp chí khoa học
trong nước và tạp chí quốc tế thuộc danh mục SCI và SCI-E liên quan đến luận án.

Luận án có 03 đóng góp khoa học như sau:

 Thiết kế luật điều khiển thích nghi dựa trên một mạng nơ ron ba lớp
(chương 2).

 Thiết kế luật điều khiển bám bền vững thích nghi sử dụng kỹ thuật
backstepping và mạng sóng Gaussian (chương 3).

 Thiết kế luật điều khiển backstepping hội tụ hữu hạn ở cấp động lực học
(chương 4).

79
Định hướng nghiên cứu phát triển

 Tiếp tục nghiên cứu phát triển các phương pháp điều khiển mới cho rô bốt di
động bám theo quỹ đạo mong muốn.

 Xây dựng hệ thống thực nghiệm để kiểm chứng các luật điều khiển được đề
xuất.

80
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ

1. Nguyễn Văn Tính, Phạm Thượng Cát, Phạm Minh Tuấn, “Mô hình hóa và điều
khiển rô bốt di động non-holonomic có trượt ngang”, Kỷ yếu hội nghị toàn quốc
lần thư 3 về Điều khiển và Tự động hóa – VCCA, 2015, Thái Nguyên, 103-108.
2. N. V. Tinh, N. T. Linh, P. T. Cat, P. M. Tuan, M. N. Anh, N. P. Anh, Modeling
and Feedback Linearization Control of a Nonholonomic Wheeled Mobile Robot
with Longitudinal, Lateral Slips, In: Proc. 2016 IEEE International Conference
on Automation Science and Enginerring, TX, USA, 996-1001.
3. Tinh Nguyen, Hung Linh Le, Neural network-based adaptive tracking control
for a nonholonomic wheeled mobile robot subject to unknown slips, Journal of
Computer Science and Cybernetics, Vietnam Academy of Science and
Technology, 2017, 33(1), 1-17.
4. Tinh Nguyen, Linh Le, “Neural network-based adaptive tracking control for a
nonholonomic wheeled mobile robot with unknown wheel slips, model
uncertainties, and unknown bounded disturbances”, Turkish Journal of
Electrical Engineering & Computer Sciences, 2018, 26, 378-392.
5. Tinh Nguyen, Kiem Nguyentien, Tuan Do, Tuan Pham, Neural Network-based
Adaptive Sliding Mode Control Method for Tracking of a Nonholonomic
Wheeled Mobile Robot with Unknown Wheel Slips, Model Uncertainties, and
Unknown Bounded External Disturbances, Acta Polytechnica Hungarica, 2018,
15(2), 103-123.
6. Kiem Nguyentien, Linh Le, Tuan Do, Tinh Nguyen, Minhtuan Pham, Robust
control for a wheeled mobile robot to track a predefined trajectory in the
presence of unknown wheel slips, Vietnam Journal of Mechanics, Vietnam
Academy of Science and Technology, 2018, 40(2), 141 –154.
7. Nguyen Tinh, Thuong Hoang, Minhtuan Pham & Namphuong Dao, A Gaussian
wavelet network-based robust adaptive tracking controller for a wheeled mobile
robot with unknown wheel slips, International Journal of Control, 2018,
DOI: 10.1080/00207179.2018.1458156.

81
TÀI LIỆU THAM KHẢO

1. L. Xin, Q. Wang, J. She, Y. Li, Robust adaptive tracking control of wheeled


mobile robot, Robotics and Autonomous Systems, 2016, 78, 36-48.
2. Y. Li, Z. Wang, and L. Zhu, Adaptive Neural Network PID Sliding Mode
Dynamic Control of Nonholonomic Mobile Robot, Proceedings of the 2010
IEEE International Conference on Information and Automation, Harbin, China,
2010, 753-757.
3. D. K. Chwa, Sliding-mode tracking control of nonholonomic wheeled mobile
robots in polar coordinates, IEEE Transactions on Control Systems
Technology, 2004, 12 (4), 637–644.
4. B. Park, S. Yoo, J Park, Y. Choi, Adaptive neural sliding mode control of
nonholonomic wheeled mobile robots with model uncertainty, IEEE
Transactions on Control Systems Technology, 2009, 17(1), 207-214.
5. Z. Jiang, Robust exponential regulation of nonholonomic systems with
uncertainties, Automatica, 2000, 36(2), 189-209.
6. T. Fukao, H. Nakagawa, N. Adachi, Adaptive tracking control of a
nonholonomic mobile robot, IEEE Transactions on Robotics and Automation,
2000, 16 (5), 609–615.
7. W. Dong, K. Kuhnert, Robust adaptive control of nonholonomic mobile robot
with parameter and nonparameter uncertainties, IEEE Transactions on
Robotics, 2005, 21(2), 261-266.
8. R. Fierro, F. L. Lewis, Control of a Nonholonomic Mobile Robot Using Neural
Networks, IEEE Trans Neural Networks, 1998, 9(4), 589-600.
9. Y. Kanayama, Y. Kimura, F. Miyazaki, T. Noguchi. A stable tracking control
method for an autonomous mobile robot, Proceedings of the 1990 IEEE
International Conference on Robotics and Automation. Cincinnati, OH, USA:
IEEE, 1990, 384-389.
10. Z.-P Jiang, H. Nijmeijer, Tracking control of mobile robots: A case study in
backstepping, Automatica, 1997, 33(7), 1393-1399.
11. D. Kim, J. Oh, Tracking control of a two-wheeled mobile robot using input–
output linearization, Control Engineering Practice, 1999, 7, 369–373.

82
12. H. Gao, X. Song, L. Ding, K. Xia, N. Li, Z. Deng, Adaptive motion control of
wheeled mobile robot with unknown slippage, International Journal of Control,
2014, 87, 1513–1522.
13. M. Seyr, S. Jakubek, Proprioceptive Navigation, Slip Estimation and Slip
Control for Autonomous Wheeled Mobile Robots, in: Proceedings of the IEEE
Conference on Robotics, Automation and Mechatronics, 2006, 1–6.
14. Lê Thị Thúy Nga, Lê Hùng Lân, Điều khiển robot bầy đàn tránh vật cản và tìm
kiếm mục tiêu, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa
VCCA, 2015, 87-93.
15. Lê Hùng Lân, Lê Thị Thúy Nga, Phân tích sự ổn định tụ bầy của robot bầy đàn
sử dụng hàm hút/đẩy mờ, Tạp chí Khoa học Giao thông Vận tải, 2013, 10, 88-
93.
16. Nguyễn Văn Khanh, Trần Văn Hùng, Điều khiển thời gian thực robot hai bánh
tự cân bằng sử dụng bộ điều khiển PID mờ tự chỉnh, Hội nghị toàn quốc lần thứ
3 về Điều khiển và Tự động hóa VCCA, 2015, 70-77.
17. Nguyễn Hữu Công, Vũ Ngọc Kiên, Điều khiển cân bằng xe hai bánh tự cân
bằng sử dụng thuật toán giảm bậc mô hình, Hội nghị toàn quốc lần thứ 3 về
Điều khiển và Tự động hóa VCCA, 2015, 61-69.
18. Nguyễn Dũng, Nguyễn Bảo Huy, Võ Duy Thành, Tạ Cao Minh, Mô hình hóa ô
tô điện bằng phương pháp EMR với mô hình mở rộng của tương tác bánh xe –
mặt đường, Hội nghị toàn quốc lần thứ 3 về Điều khiển và Tự động hóa VCCA,
2015, 117-122.
19. J.-C. Ryu, S.K. Agrawal, Differential flatness-based robust control of mobile
robots in the presence of slip, The International Journal of Robotics Research,
2011, 30(4), 463–475.
20. Y. Qiu, X. Liang, Z. Dai, Backstepping dynamic surface control for an anti-skid
braking system, Control Engineering Practice, 2015, 42, 140–152.
21. N. Sidek, N. Sarkar, Dynamic modeling and control of nonholonomic mobile
robot with lateral slip. Proceedings of 3rd International Conference on Systems,
2008, 35-40.

83
22. I. Motte, G.A. Campion, Slow manifold approach for the control of mobile
robots not satisfying the kinematic constraints, IEEE Transactions on Robotics
and Automation, 2000, 16(6), 875-880.
23. A. Matveev, M. Hoy, J. Katupitiya, A. Savkin, Nonlinear sliding mode control
of an unmanned agricultural tractor in the presence of sliding and control
saturation, Robotics and Autonomous Systems, 2013, 61, 973–987.
24. M. Corradini, G. Orlando, Experimental testing of a discrete time sliding mode
controller for trajectory tracking of a wheeled mobile robot in the presence of
skidding effects, Journal of Robotic Systems, 2002, 19, 177–188.
25. H. Khan, J. Iqbal, K. Baizid, T. Zielinska, Longitudinal and lateral slip control
of autonomous wheeled mobile robot for trajectory tracking, Frontiers of
Information and Technology & Electronic Engineering, 2015, 16(2), 166-172.
26. L. Chang Boon, W. Danwei, Integrated Estimation for Wheeled Mobile Robot
posture, velocities, and wheel skidding perturbations, in: Proceedings of the
IEEE International Conference on Robotics and Automation, 2007, 2355–2360.
27. C. C. Ward, K. Iagnemma, Model-Based Wheel Slip Detection for Outdoor
Mobile Robots, IEEE International Conference on Robotics and Automation,
2007, 2724 – 2729.
28. G. Baffet, A. Charara, J. Stephant, Sideslip angle, lateral force and road fricion
estimation in simulations and experiments, Proceedings of IEEE International
Conference on Control Applications, 2006, 903-908.
29. L. Li, F.Y. Wang, Integrated Longitudinal and lateral tire/road friction
modeling and monitoring for vehicle motion control, IEEE Transaction on
Intelligent Transportation Systems, 2006, 7(1), 1-19.
30. Y. Tian, N. Sarkar, Control of a mobile robot subject to wheel slip, Journal of
Intelligent and Robotic Systems, 2014, 74, 915–929.
31. H. Kang, Y. Kim, C. Hyun, M. Park, Generalized extended state observer
approach to robust tracking control for wheeled mobile robot with skidding and
slipping, International Journal of Advanced Robotic Systems 2013, 10, 1–10.
32. S. Yoo, Approximation-based adaptive control for a class of mobile robots with
unknown skidding and slipping, International Journal of Control, Automation
and Systems, 2012, 10, 703–710.
84
33. N Hoang, H Kang, Neural network-based adaptive tracking control of mobile
robots in the presence of wheel slip and external disturbance force,
Neurocomputing, 2016, 188, 12-22.
34. C. B. Low, D. Wang, GPS-based path following control for a car-like wheeled
mobile robot with skidding and slipping, IEEE Transactions on Control Systems
Technology 2008, 16, 340–347.
35. C. B. Low, D. Wang, GPS-based tracking control for a car-like wheeled mobile
robot with skidding and slipping, IEEE/ASME Transactions on Mechatronics,
2008, 13, 480–484.
36. R. Lenain, B. Thuilot, C. Cariou, P. Martinet, Mixed kinematic and dynamic
sideslip angle observer for accurate control of fast off-road mobile robots,
Journal of Field Robotics, 2010, 27(2), 181-196.
37. B. Chen, F. Hsieh. Sideslip angle estimation using extended Kalman filter,
Vehicle System Dynamics, 2008, 46, 353-364.
38. G. Bayar, M. Bergerman, E. Konukseven, A. Koku, Improving the trajectory
tracking performance of autonomous orchard vehicles using wheel slip
compensation, Biosystems Engineering, 2016, 146, 149-164.
39. H. Grip, L. Imsland, T. Johansen, J. Kalkkuhl, A. Suissa, Vehicle sideslip
estimation: design, implementation and experimental validation, IEEE Control
Systems Magazine, 2009, 29(5), 36-52.
40. J. Dakhlallah, S. Glaser, S. Mammar, Y. Sebsadji, Tire-Road Forces Estimation
Using Extended Kalman Filter and Sideslip Angle Evaluation, Proceedings of
2008 American Control Conference, Washington, USA, June 11-13, 2008,
4597- 4602.
41. C. Lin, Adaptive tracking controller design for robotic systems using Gaussian
wavelet networks. IEE Proceedings - Control Theory and Applications, 2002,
149(4), 316–322.
42. J. Slotine, W. Li, Applied Nonlinear Control, Prentice- Hall, 1991, Englewood
Cliffs, New Jersey, USA.
43. J. Huang, C. Wen, Wei Wang, Z. Jiang. Adaptive stabilization and tracking
control of a nonholonomic mobile robot with input saturation and disturbance.
Systems & Control Letters, 2013, 62, 234–241.
85
44. N. Perez-Arancibia, T. Tsao, J. Gibson, Saturation-induced instability and its
avoidance in adaptive control of hard disk drives, IEEE Transactions Control
System Technology, 2010, 18, 368–382.
45. F. Lewis, A. Yesildirek, A., K. Liu. Multilayer Neural-Net Robot Controller
with Guaranteed Tracking Performance, IEEE Transactions on Neural
Networks, 1996, 7(2), 388-399.
46. L. Wang, T. Chai, L. Zhai, Neural network-based terminal sliding mode control
of robotic manipulators including actuator dynamics, IEEE Transaction on
Industrial Electronics, 2009, 56(9), 3296-3304.
47. A. K. Pamosoaji, P. T. Cat, K. Hong, Sliding-mode and proportional-derivative-
type motion control with radial basis function neural network based estimators
for wheeled vehicles, International Journal of Systems Sciences, 2014, 45(12).

86
PHỤ LỤC. SƠ ĐỒ KHỐI MATLAB/SIMULINK CỦA CÁC HỆ THỐNG
ĐIỀU KHIỂN VÒNG KÍN

Các sơ đồ khối Matlab/Simulink để mô phỏng các luật điều khiển trong các
chương 2, ,3, và 4 được thể hiển như sau:

Hình P.1. Sơ đồ khối Matlab/Simulink mô tả mô hình của rô bốt di động.

Hình P.2. Sơ đồ khối mô tả mô hình động lực học của rô bốt di động.

87
Hình P.3. Sơ đồ khối mô tả mô hình động học của rô bốt di động.

Hình P.4. Sơ đồ khối Matlab/Simulink của luật điều khiển ở Chương 2, 3, 4.

88
Hình P.5. Sơ đồ khối của bộ điều khiển trong Chương 2.

Hình P.6. Sơ đồ khối của mạng nơ ron 3 lớp (với tên nhãn neural network) trong
Chương 2.

89
Hình P.7. Sơ đồ khối bộ điều khiển kiểu backstepping ở các Chương 3 và 4.

Hình P.8. Sơ đồ khối bộ điều khiển ở vòng động lực học phía trong ở Chương 3.

90
Hình P.9. Sơ đồ khối mô tả thành phần bền vững cấp động lực học ở Chương 3.

Hình P.10. Sơ đồ khối của bộ điều khiển động học phía ngoài trong Chương 3.

Hình P.11. Sơ đồ khối của thành phần bền vững động học trong Chương 3.

91
Hình P.12. Sơ đồ khối của bộ điều khiển ở vòng động lực học trong Chương 4.

Hình P.13. sơ đồ khối của thành phần bền vững động lực học trong Chương 4.

92
Hình P.14. Sơ đồ khối của bộ điều khiển động học phía ngoài ở Chương 4.

Hình P.15. Sơ đồ khối của thành phần bền vững động học ở Chương 4.

93

You might also like