You are on page 1of 6

Họ và tên: Nguyễn Hữu An mssv:20212665

Lớp: ĐK-TĐH 06

TỔNG QUAN VỀ NHỮNG ỨNG DỤNG CỦA MẠNG


NƠ-RON TRONG ĐIỀU KHIỂN

1. ĐẶT VẤN ĐỀ

Mạng nơ-ron ra đời từ những năm 1940 bởi McCulloch và Pitts . Hai tác giả này là
những người đầu tiên đưa ra một mô hình toán học của nơ-ron. Với mô hình
này, các đầu vào của nơ ron được nhân với các trọng số, sau đó được đưa vào bộ
tổng. Đầu ra của bộ tổng sẽ được so sánh với một giá trị ngưỡng để xác định đầu ra
của nơ-ron có kích thích hay không. Mạng nơ-ron này đã được chứng tỏ là có khả
năng xấp xỉ các hàm lô gíc và hàm đại số. Sau đó mạng nơ-ron nhiều lớp được đưa
ra vào những năm 1960, tuy nhiên, ở giai đoạn đó chưa có phương pháp huấn
luyện mạng nào để có thể huấn luyện được mạng nhiều lớp. Hagan đã chỉ ra rằng
thuật toán Marquardt hiệu quả hơn hẳn so với các phương pháp khác đặc biệt về
tốc độ hội tụ khi kích thước của mạng nơ-ron lên tới hàng trăm thông số. Mặc dù
mạng nơ-ron ra đời từ rất lâu và đã được ứng dụng rộng rãi và thành công trong
các lĩnh vực như phân loại mẫu, nhận dạng mẫu, xấp xỉ dữ liệu, nhưng những ứng
dụng trong lĩnh vực nhận dạng và điều khiển các hệ thống động học vẫn còn khá
mới mẻ và ít được quan tâm. Cho đến những năm đầu của thập kỷ 90, mạng nơ-ron
mới được nghiên cứu và ứng dụng vào nhận dạng và điều khiển , , . Mạng nơ-ron
có thể được sử dụng như mô hình cho đối tượng hoặc bộ điều khiển. Lớp các mạng
nơ-ron này thường là mạng nơ-ron động học và có hồi qui. Để huấn luyện mạng
hồi qui này người ta thường sử dụng thuật toán lan truyền ngược . Horn đã chỉ ra
rằng khi huấn luyện một lớp mạng hồi qui sẽ gặp những khó khăn vì có rất nhiều
vùng giả cực trị . Tác giả này đã sử dụng phương pháp phân tích các nghiệm của
đa thức ngẫu nhiên để phân tích những nguyên nhân gây ra các vùng giả cực trị
này. Có nhiều cấu trúc điều khiển sử dụng mạng nơ-ron khác nhau đã được đề
xuất. Trong bài báo này, chỉ một số dạng chính được trình bày, như là điều khiển
dự báo, điều khiển tuyến tính hóa phản hồi và điều khiển tham chiếu mô
hình . Việc lựa chọn cấu trúc cho mạng nơ-ron như thế nào trước khi huấn luyện
mạng cũng là một vấn đề rất quan trọng. Nếu cấu trúc mạng hợp lý ta có thể huấn
luyện được mạng, ngược lại ta sẽ không thể huấn luyện mạng. Hiện tại chưa có
phương pháp lựa chọn cấu trúc mạng một cách tổng quát cho bài toán nhận dạng
đối tượng bất kỳ, tuy nhiên cũng có những kỹ thuật được sử dụng để chỉnh định
cấu trúc mạng trong quá trình huấn luyện mạng như thêm hoặc bớt nơ-ron, lựa
chọn cấu trúc mạng sử dụng giải thuật di truyền.

2. MẠNG NƠ-RON ĐỘNG HỌC


2.1. Cấu trúc mạng nơ-ron động học

Hình 1. Ví dụ về mạng nơ-ron hồi quy.

Mạng nơ ron động học gồm nhiều lớp, trong đó đầu ra của mỗi lớp có thể được
phản hồi trở về đầu vào của lớp đó hoặc các lớp trước thông qua khối trễ
TDL . Khối trễ này gồm nhiều khâu trễ có hàm truyền là 1/z được mắc nối tiếp với
nhau.
Nếu đầu vào của khối TDL là u thì đầu ra của nó sẽ là các tín hiệu đầu vào và tín
hiệu đầu vào trong quá khứ u , u , ..., u , với m là số khâu trễ mắc nối tiếp trong
khối TDL.
Các khối LWi , j là các ma trận trọng số liên kết giữa đầu ra của lớp thứ j với đầu
vào của lớp thứ i. Các khối IWi , j là các ma trận trọng số liên kết giữa đầu vào thứ
j với đầu vào của lớp thứ i. Đối với mạng truyền thẳng, người ta đã chứng minh
được rằng mạng này có thể xấp xỉ một hàm phi tuyến bất kỳ với độ chính xác bất
kỳ . Quá trình hồi tiếp này cứ lặp đi lặp lại làm cho đầu ra của mạng nơ-ron càng
có sai số lớn hơn so với giá trị đầu ra mẫu. Nếu các tham số của mạng lại rơi vào
vùng không ổn định thì đầu ra của mạng lại tiến tới giá trị lớn hơn hoặc vô
cùng, điều này càng làm cho mạng nơ-ron khó huấn luyện hơn nữa.

2.2. Huấn luyện mạng nơ-ron động học

Huấn luyện mạng nơ ron động học hồi qui gồm 2 giai đoạn: mạng hở và mạng
kín. Mạng hở được hình thành bằng cách bỏ đường hồi tiếp từ đầu ra của mạng nơ-
ron quay trở về đầu vào của lớp ra hoặc các lớp trước đó.

Giả sử ta có một tập hợp các đầu vào và ra mẫu dùng để huấn luyện mạng lần lượt
là:

P = {p k }; T = {t k }; k = 1: N .
Như vậy, tập mẫu đầu vào dùng để huấn luyện mạng hở sẽ là P = {p k ; t k };
k = 1: N , còn tập mẫu đầu ra vẫn được giữ nguyên.
Khi đó các trọng số liên kết giữa đầu ra của mạng với lớp thứ i của mạng
LWi , o sẽ trở thành các trọng số liên kết giữa đầu vào hở với lớp thứ

i IWi,2 . Nói các khác:

IWi,2 = LWi ,o (1)


trong đó i biểu diễn lớp thứ i, 2 biểu diễn đầu vào hở, o biểu diễn đầu ra của
mạng, IW là trọng số đầu vào (Input Weight), LW là trọng số lớp (Layer
Weight).

Giả sử mạng có nhiều khối TDL liên kết giữa đầu vào và đầu ra với các lớp. Gọi
mi là số khâu trễ của khối TDL thứ i liên kết giữa đầu vào hoặc đầu ra của mạng
với một lớp nào đó của mạng. Đặt d  max mi , i  1: M , trong đó M là số khối
TDL của mạng. Như
vậy, để tính toán đầu ra của mạng ta phải có d điều kiện đầu cho các khối TDL.

Khi đó

Để huấn luyện mạng kín, chúng ta không thể sử dụng toàn bộ tập mẫu như huấn
luyện mạng hở. Mỗi khi đưa một tín hiệu đầu vào mẫu tới mạng nơ-ron ta sẽ thu
được đầu ra của mạng nơ-ron tương ứng, giá trị này sẽ được so sánh với đầu ra
mẫu, trên cơ sở sai lệch sẽ hiệu chỉnh các thông số của mạng. Với bộ thông số mới
của mạng sẽ cho giá trị đầu ra của mạng gần đúng với đầu ra mẫu. Do đó, vẫn có
sai số giữa đầu ra của mạng với đầu ra mẫu. Khi chúng ta cho mẫu tiếp theo vào
mạng nơ-ron thì tín hiệu đầu ra của mạng ở thời điểm trước đó sẽ được phản hồi
trở về đầu vào của lớp trước. Do giá trị này không đúng, đầu ra của mạng nơ-ron
càng có sai số lớn hơn so với đầu ra mẫu. Nếu như số khâu trễ càng nhiều, thì đầu
ra của mạng nơ-ron càng có sai số lớn hơn nữa vì các giá trị của đầu ra trong quá
khứ cũng có sai số. Sai số này càng được tích lũy khi mà số mẫu đưa vào mạng
tăng lên.
Như vậy, thay vì ta dùng tất cả các mẫu để huấn luyện mạng kín một lúc, ta sẽ chia
tập mẫu thành các tập con có số mẫu nhỏ hơn, chẳng hạn c mẫu

3. HỆ THỐNG ĐIỀU KHIỂN DỰA TRÊN CƠ SỞ MẠNG NƠ-RON


Trên cơ sở đó các bộ điều khiển nơ-ron sẽ được thiết kế. Phần tiếp theo, các bộ
điều khiển dự báo và bộ điều khiển tham chiếu theo mô hình sẽ được giới thiệu.

3.1. Điều khiển dự báo

Trên hình 2 là sơ đồ cấu trúc của hệ thống điều khiển dự báo sử dụng mạng nơ-
ron. Vấn đề khó khăn là huấn luyện mạng nơ-ron động học, bởi vì các điểm giả
cực trị sẽ ngăn cản việc tìm đúng điểm cực trị. Quá trình chỉnh định các tham số
của bộ điều khiển nơ-ron sẽ diễn ra liên tục sau mỗi chu kỳ lấy mẫu.
Ưu điểm của cấu trúc điều khiển dự báo dựa trên mạng nơ-ron là không phải xây
dựng mô hình toán của đối tượng từ các định luật cơ bản và nhận dạng các tham số
của mô hình này.
Hình 2. Sơ đồ cấu trúc hệ thống điều khiển dự báo sử dụng mạng nơ-ron.
3.2. Điều khiển tham chiếu mô hình

Hình 3. Sơ đồ cấu trúc hệ thống điều khiển theo mô hình mẫu sử dụng mạng nơ-ron.

Đối với cấu trúc hệ thống này ta phải huấn luyện cả mạng nơ-ron của đối tượng và
mạng nơ-ron của bộ điều khiển. Tuy nhiên tập mẫu của bộ điều khiển nơ-ron sẽ
được thu thập từ mô hình mẫu. Còn tập mẫu cho mô hình nơ-ron của đối tượng thì
vẫn được thu thập từ đầu vào ra của đối tượng thật
Tín hiệu vào mẫu này sẽ được tác động lên đối tượng, sau đó ta sẽ tiến hành đo đầu
ra tương ứng của đối tượng. Bộ tín hiệu vào ra mẫu này sẽ dùng để huấn luyện
mạng nơ-ron của đối tượng. Trong thực tế, nếu đối tượng đang làm việc, chúng ta
có thể thu thập bộ tín hiệu mẫu vào ra bằng cách đo các đầu vào và đầu ra của đối
tượng.
Khi huấn luyện mạng mới này thì các tham số của mạng nơ-ron của đối tượng sẽ
được giữ nguyên, chỉ cập nhật và thay đổi các tham số của mạng nơ-ron của bộ
điều khiển. Để huấn luyện mạng nơ-ron mới, ta cần phải có một bộ dữ liệu
mẫu, trong đó đầu vào mẫu sẽ là giá trị đặt mẫu r, còn đầu ra mẫu sẽ được lấy từ
đầu ra của mô hình mẫu. Mô hình mẫu là một mô hình toán học mà đầu ra của nó
thể hiện các giá trị mong muốn của đầu ra đối tượng.

4. KẾT LUẬN
Trong bài báo này, mạng nơ-ron động học và phương pháp huận luyện mạng này
đã được giới thiệu. Các phương pháp mới để tránh các điểm giả cực trị trong quá
trình huấn luyện mạng cũng được tóm tắt và trình bày lại. Trên cơ sở đó một số
ứng dụng của mạng nơ-ron động học trong nhận dạng và điều khiển đã được khái
quát. Nghiên cứu tiếp theo sẽ hướng tới các phương pháp tránh các điểm giả cực trị
cho một lớp mạng nơ-ron cụ thể.

You might also like