You are on page 1of 7

Họ và tên: Nguyễn Đức Hoàng Anh MSSV: 20212686

TỔNG QUAN VỀ NHỮNG ỨNG DỤNG CỦA MẠNG NƠ-


RON TRONG ĐIỀU KHIỂN
Nguyễn Hoài Nam
1. ĐẶT VẤN ĐỀ
Mạng nơ-ron ra đời từ những năm 1940 bởi McCulloch và Pitts. Hai
tác giả này là những người đầu tiên đưa ra một mô hình toán học của nơ-ron.
Với mô hình này, các đầu vào của nơ ron được nhân với các trọng số, sau đó
được đưa vào bộ tổng. Đầu ra của bộ tổng sẽ được so sánh với một giá trị
ngưỡng để xác định đầu ra của nơ-ron có kích thích hay không. Mạng nơ-
ron này đã được chứng tỏ là có khả năng xấp xỉ các hàm lô gíc và hàm đại
số. Sau đó mạng nơ-ron nhiều lớp được đưa ra vào những năm 1960, tuy
nhiên,ở giai đoạn đó chưa có phương pháp huấn luyện mạng nào để có thể
huấn luyện được mạng nhiều lớp. Do đó,có một khoảng thời gian dài những
nghiên cứu về mạng nơ-ron gần như bế tắc. Cho đến năm 1986, Rumelhart
and McClelland đã đưa ra thuật toán lan truyền ngược để huấn luyện mạng
nơ-ron. Từ đó những nghiên cứu về mạng nơ-ron lại bắt đầu bùng nổ. Dựa
trên cơ sở thuật toán lan truyền ngược, đã có rất nhiều phương pháp huấn
luyện mạng khác nhau như hạ nhanh nhất, hướng liên hợp, hiệu chỉnh hệ số
học và Marquardt. Thuật toán Marquardt ra đời từ năm 1963 bởi tác giả
Marquardt. Ông đã phát triển thuật toán dựa trên nghiên cứu của
Levenberg. Hagan đã chỉ ra rằng thuật toán Marquardt hiệu quả hơn hẳn
so với các phương pháp khác đặc biệt về tốc độ hội tụ khi kích thước của
mạng nơ-ron lên tới hàng trăm thông số. Mặc dù mạng nơ-ron ra đời từ rất
lâu và đã được ứng dụng rộng rãi và thành công trong các lĩnh vực như phân
loại mẫu, nhận dạng mẫu, xấp xỉ dữ liệu, nhưng những ứng dụng trong lĩnh
vực nhận dạng và điều khiển các hệ thống động học vẫn còn khá mới mẻ và
ít được quan tâm. Cho đến những năm đầu của thập kỷ 90, mạng nơ-
ron mới được nghiên cứu và ứng dụng vào nhận dạng và điều khiển. Mạng
nơ-ron có thể được sử dụng như mô hình cho đối tượng hoặc bộ điều khiển.
Lớp các mạng nơ-ron này thường là mạng nơ-ron động học và có hồi qui.
Có nhiều cấu trúc điều khiển sử dụng mạng nơ-ron khác nhau đã được
đề xuất. Trong bài báo này, chỉ một số dạng chính được trình bày, như là
điều khiển dự báo, điều khiển tuyến tính hóa phản hồi và điều khiển tham
chiếu mô hình. Việc lựa chọn cấu trúc cho mạng nơ-ron như thế nào trước
khi huấn luyện mạng cũng là một vấn đề rất quan trọng. Nếu cấu trúc mạng
hợp lý ta có thể huấn luyện được mạng, ngược lại ta sẽ không thể huấn luyện
mạng. Hiện tại chưa có phương pháp lựa chọn cấu trúc mạng một cách tổng
quát cho bài toán nhận dạng đối tượng bất kỳ, tuy nhiên cũng có những kỹ
thuật được sử dụng để chỉnh định cấu trúc mạng trong quá trình
huấn luyện mạng như thêm hoặc bớt nơ-ron, lựa chọn cấu trúc mạng sử
dụng giải thuật di truyền. Việc huấn luyện mạng có thể bắt đầu bằng một cấu
trúc mạng đơn giản nhất, sau đó tăng dần số nơ-ron hoặc bắt đầu bằng một
cấu trúc mạng lớn, sau đó sẽ bỏ dần số nơ-ron đi. Ngoài ra, giải thuật di
truyền, phương pháp phân loại mẫu cũng có thể được sử dụng để lựa
chọncấu trúc mạng. Nội dung tiếp theo của bài báo được trình bày như sau.
Phần hai sẽ giới thiệu về cấu trúc mạng nơ-ron động học và phương pháp
huấn luyện mạng này. Phần tiếp theo sẽ trình bày về các cấu trúc hệ thống
điều khiển dựa trên cơ sở mạng nơ ron. Phần cuối sẽ đưa ra những nhận xét,
gợi ý và kết luận.
2. MẠNG NƠ-RON ĐỘNG HỌC
2.1. Cấu trúc mạng nơ-ron động học

Hình1.Ví dụ về mạng nơ-ron hồi quy


Hình 1 là một ví dụ về mạng nơ-ron động học hồi quy. Mạng này gồm
có 2 lớp, mỗi lớp 1 và 2 có số nơ-ron lần lượt là 1Svà 2S. 1fvà 2flần lượt là
các véc tơ hàm truyền của lớp 1 và lớp 2. 1bvà 2blần lượt là các véc tơ bias
của lớp 1 và lớp 2. Các khối ,Wi jL(layer weight) là cácma trận trọng số liên
kết giữa đầu ra của lớp thứ j với đầu vào của lớp thứ i. Các khối ,IWi j(input
weight) là cácma trận trọng số liên kết giữa đầu vào thứ j với đầu vào của
lớp thứ i. Đối với mạng truyền thẳng, người ta đã chứng minh được
rằng mạng này có thể xấp xỉ một hàm phi tuyến bất kỳ với độ chính xác bất
kỳ. Tuy nhiên với mạng nơ-ron hồi quy thì việc huấn luyện mạng trở lên khó
khăn hơn rất nhiều vì có hồi tiếp. Tại mỗi thời điểm t, các đầu ra của mạng ở
thời gian trước đó được phản hồi về đầu vào của lớp trước. Nhưng do đầu ra
của mạng chưa đúng, do đó giá trị phản hồi về cũng chưa đúng, dẫn tới đầu
ra của mạng nơ-ron càng không đúng. Quá trình hồi tiếp này cứ lặp đi lặp lại
làmcho đầu ra của mạng nơ-ron càng có sai số lớn hơn so với giá trị đầu ra
mẫu. Nếu các tham số của mạng lại rơi vào vùng không ổn định thì đầu ra
của mạng lại tiến tớigiá trị lớn hơn hoặc vô cùng, điều này càng làm cho
mạng nơ-ron khó huấn luyện hơn nữa. Mặt khác việc tính đạo hàm đầu ra
của mạng theo các tham số liên quan tới hồi tiếp cũng phức tạp hơn rất nhiều
so với mạng truyền thẳng.
Mạng nơ-ron động học hồi qui có thể được dùng như mô hình toán
học cho các đối tượng động học và phi tuyến khi thiết kế các bộ điều khiển
dự báo và điều khiển tham chiếu theo mô hình. Mạng này cũng có thể được
sử dụng như bộ điều khiển nơ-ron theo phương pháp điều khiển tham chiếu
mô hình.
2.2. Huấn luyện mạng nơ-ron động học
Huấn luyện mạng nơ ron động học hồi qui gồm 2 giai đoạn: mạng hở
và mạng kín. Mạng hở được hình thành bằng cách bỏ đường hồi tiếp từ đầu
ra của mạng nơ-ron quay trở về đầu vào của lớp ra hoặc các lớp trước đó.
Khi đó mạng hở sẽ có thêm một đầu vào. Để tiện sử dụng, chúng ta có thể
đặt tên cho đầu vào phụ này là đầu vào hở. Đầu vào này thực chất là đầu ra
của mạng nơ-ron ban đầu. Khi huấn luyện mạng hở thay vì sử dụng đầu ra
của mạng làm tín hiệu vào mẫu cho đầu vào hở chúng ta sẽ sử dụng đầu ra
mẫu.
3. HỆ THỐNG ĐIỀU KHIỂN DỰA TRÊN MẠNG NƠ-RON

Trong phần này, hai ứng dụng của mạng nơ-ron trong lĩnh vực điều
khiển sẽ được trình bày: điều khiển dự báo vàđiều khiển tham chiếu mô
hình. Cả hai bài toán này đều liên quan tới việc sử dụng mạng-ron động học
làm mô hình toán học cho đối tượng. Trên cơ sở đó các bộ điều khiển nơ-ron
sẽ được thiết kế. Việc huấn luyện mạng nơ-ron động này sẽ được thực hiện
giống như ở phần 2.2. Tập mẫu được dùng để huấn luyện mạng được thu
thập từ các đầu vào và ra của đối tượng. Thường đầu vào mẫu sẽ là một tín
hiệu có dạng là một chuỗi các hàm bước nhẩy có biên độ và độ rộng ngẫu
nhiên. Phần tiếp theo, các bộ điều khiển dự báo và bộ điều khiển tham chiếu
theo mô hình sẽ được giới thiệu.
3.1. Điều khiển dự báo
Trên hình 2 là sơ đồ cấu trúc của hệ thống điều khiển dự báo sử dụng
mạng nơ-ron. Cấu trúc này giống hoàn toàn với cấu trúc hệ thống điều khiển
dự báo thông thường, chỉ có một điểm khác đó là mô hình đối tượng và bộ
điều khiển đều là các mạng nơ-ron động học. Đối với điều khiển dự báo, mô
hình đối tưởng cần phải được xây dựng đủ độ tin cậy và chính xác để đảm
bảo chất lượng của hệ thốngkín. Điều này sẽ được đảm bảo bởi vì mạng nơ-
ron là một bộ xấp xỉ vạn năng. Vấn đề khó khăn là huấn luyện mạng nơ-ron
động học, bởi vì các điểm giả cực trị sẽ ngăn cản việc tìm đúng điểm cực trị.
Khi có mô hình toán là mạng nơ-ron có đủ độ chính xác, bộ điều khiển nơ-
ron sẽ được tính toán dựa trên các phương pháp tối ưu để tìm ra tín hiệu điều
khiển tối ưu sao cho đầu ra của đối tượng bám theo đầu ra của mô hình mẫu.
Quá trình chỉnhđịnh các tham số của bộ điều khiển nơ-ron sẽ diễn ra liên tục
sau mỗi chu kỳ lấy mẫu.

Hình 2.Sơ đồ cấu trúc hệ thống điều khiển dự báo sử dụng mạng nơ-ron.
Ưu điểm của cấu trúc điều khiển dự báo dựa trên mạng nơ-ron
là không phải xây dựng mô hình toán của đối tượng từ các định luật cơ bản
và nhận dạng các tham số của mô hình này.
Nhược điểm của hệ thống chính là việc tránh các điểm giả cực trị
trong quá trình huấn luyện mạng động để đảm bảo độ chính xác của mô hình
mạng nơ-ron.
3.2. Điểu khiển tham chiếu mô hình
Đối với cấu trúc hệ thống này ta phải huấn luyện cả mạng nơ-ron của
đối tượng và mạng nơ-ron của bộ điều khiển. Tuy nhiên tập mẫu của bộ điều
khiển nơ-ron sẽ được thu thập từ mô hình mẫu. Còn tập mẫu cho mô hình
nơ-ron của đối tượng thì vẫn được thu thập từ đầu vào ra của đối tượng thật.

Đầu tiên ta sẽ huấn luyện mạng nơ-ron của đối tượng. Đầu vào mẫu
có dạng là một chuỗi các hàm bước nhẩy có biên độ ngẫu nhiên trong
khoảng giá trị cho phép của đầu vào và độ dài củamỗi hàm bước nhẩycũng
ngẫu nhiên. Tín hiệu vào mẫu này sẽ được tác động lên đối tượng, sau đó ta
sẽ tiến hành đo đầu ra tương ứng của đối tượng. Bộ tín hiệu vào ra mẫu này
sẽ dùng để huấn luyện mạng nơ-ron của đối tượng. Trong thực tế,nếu đối
tượng đang làm việc, chúng ta có thể thu thập bộ tín hiệu mẫu vào ra bằng
cách đo các đầu vào và đầu ra của đối tượng.
Sau khi huấn luyện xong mạng nơ-ron của đối tượng ta sẽ kết hợp
mạng này với mạng nơ-ron của bộ điều khiển thành một mạng nơ-ron mới,
trong đó các tham số của mạng nơ-ron của bộ điều khiển chưa được huấn
luyện. Khi huấn luyện mạng mới này thì các tham số của mạng nơ-ron của
đối tượng sẽ được giữ nguyên, chỉ cập nhật và thay đổi các tham số của
mạng nơ-ron của bộ điều khiển. Để huấn luyện mạng nơ-ron mới, ta cần
phải có một bộ dữ liệu mẫu, trong đó đầu vào mẫu sẽ là giá trị đặt mẫu r, còn
đầu ra mẫu sẽ được lấy từ đầu ra của mô hình mẫu. Mô hình mẫu là một mô
hình toán học mà đầu ra của nó thể hiện các giá trị mong muốn của đầu ra
đối tượng. Thường mô hình mẫu được chọnlà một hệ thống ổn định, có thời
gian xác lập và độ quá điều chỉnh nhỏ vàphù hợp với đối tượng cần điều
khiển. Hệ thống mẫu này thường là hệ tuyến tính.
Phương pháp điều khiển này phù hợp với bài toán ổn định đầu ra của
đối tượng theo giá trị đặt trước và trong trường hợp ta không có hoặc không
xây được mô hình toán của đối tượng từ các phương kháp khác.
4. KẾT LUẬN
Trong bài báo này, mạng nơ-ron động học và phương pháp huận luyện mạng
này đã được giới thiệu. Các phương pháp mới để tránh các điểm giả cực trị
trong quá trình huấn luyện mạng cũng được tóm tắt và trình bày lại. Trên cơ
sở đó một số ứng dụng của mạng nơ-ron động học trong nhận dạng và điều
khiển đã được khái quát. Ưu điểm của các bộ điều khiển nơ-ron ở đây là
không cần mô hình toán của đối tượng, do đó không cần phải xây dựng mô
hình toán và nhận dạng các tham số của mô hình. Việc này sẽ giảm chi phí
và thời gian cho việc thiết kế bộ điều khiển. Tuy nhiên,nhược điểm chính
của bộ điều khiển nơ-ron là các điểm giả cực trị. Nghiên cứu tiếp theo sẽ
hướng tới các phương pháp tránh các điểm giả cực trị cho một lớp mạng nơ-
ron cụ thể.

You might also like