Mạng Neural Và Ứng Dụng Trong Điều Khiển Tự Động

1
LỜI CAM ĐOAN

Nội dung của báo cáo này đã trình bày khái niệm cơ bản về mạng nơron và
một số phương pháp ứng dụng mạng nơron để nhận dạng đối tượng. Dưới sự chỉ bảo và
hướng dẫncủa PGS. TS. Hoàng Mạnh Thắng tác giả đã nghiên cứu tìm hiểu một số
phương pháp ứng dụng mạng nơron để nhận dạng đối tượng. Từ đó, nghiên cứu và
xây dựng ứng dụng mạng nơron trong điều khiển thích nghi, điều khiển dự đoán và
điều khiển phản hồi (đã mô phỏng thành công một số kết quả thực tế). Tôi xin cam
đoan những nội dung của luận văn này là hoàn toàn trung thực, chính xác và chưa
được ai công bố trong các công trình khoa học nào khác.
TÁC GIẢ
2
LỜI CẢM ƠN
Để hoàn thành quá trình nghiên cứu được trình bày trong luận văn, em xin
gửi lời cảm ơn đến các thầy cô giáo tại Viện Điện tử - Viễn thông đã tạo điều kiện
giúp em hoàn thiện đồ án tốt nghiệp này. Em xin gửi lời cảm ơn sâu sắc nhất đến
thầy PGS. TS. Hoàng Mạnh Thắng đã trực tiếp hướng dẫn em hoàn thành luận văn
với sự nhiệt tình và ân cần chỉ bảo, đồng thời cung cấp cho em những kiến thức
chuyên môn để em có thể hoàn thiện luận văn tốt nghiệp.
Cuối cùng, tôi xin gửi lời cảm ơn chân thành đến gia đình, bạn bè và người
thân, những người đã bên cạnh và động viên tôi trong suốt quá trình học tập và hoàn
thành luận văn.
TÁC GIẢ
3
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................................... 2
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ......................................................... 6
DANH MỤC HÌNH ẢNH ........................................................................................................ 7
LỜI NÓI ĐẦU ........................................................................................................................... 9
CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH MẠNG NƠRON.......................................... 10
1.1 Giới thiệu về mạng nơron nhân tạo ..................................................................11
1.1.1 Mạng nơron nhân tạo là gì?........................................................................11
1.1.2 Lịch sử phát triển mạng nơron ...................................................................11
1.1.3 So sánh mạng nơron với máy tính truyền thống .........................................14
1.2. Nơron sinh học và nơron nhân tạo ..................................................................15
1.2.1 Nơron sinh học ..........................................................................................15
1.2.2 Nơron nhân tạo ..........................................................................................16
1.3 Mô hình mạng nơron .......................................................................................18
1.3.1 Các kiểu mô hình mạng nơron ...................................................................19
1.3.2 Perceptron..................................................................................................21
1.3.3 Mạng nhiều tầng truyền thẳng (MLP) ........................................................22
1.4. Kết luận chương 1 ..........................................................................................21
CHƯƠNG 2: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG NHẬN
DẠNG....................................................................................................................................... 24
2.1 Các phương pháp ứng dụng mạng nơron trong nhận dạng ...............................24
2.1.1 Khái quát chung.........................................................................................24
2.1.2 Các phương pháp nhận dạng ......................................................................27
2.1.2.1.1 Phương pháp lặp bình phương cực tiểu ...................................................29
2.1.2.1.2 Phương pháp xấp xỉ ngẫu nghiên. ...........................................................30
2.1.2.1.3 Phương pháp lọc Kalman mở rộng..........................................................30
2.1.2.1.4 Phương pháp tìm kiếm trực tiếp ..............................................................37
2.1.2.1.5 Phương pháp sử dụng hàm nhạy..............................................................38
2.1.3 Mô tả toán học của đối tựợng ở rời rạc.......................................................40
4
2.1.4 Mô hình dùng mạng nơron.........................................................................44
2.1.5 Tính gần đúng hàm số dùng mạng nơron. ..................................................47
2.1.6 Mô hình mạng nơron trong nhận dạng và điều khiển..................................48
2.2. Kết luận chương 2 ..........................................................................................82
CHƯƠNG 3: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG ĐIỀU
KHIỂN...................................................................................................................................... 52
3.1 Ứng dụng mạng neural vào điều khiển dự đoán ..............................................52
3.1.1 Hệ thống nhận dạng ...................................................................................52
3.1.2 Mạng dự đoán............................................................................................54
3.1.3 Ứng dụng mạng nơron dự đoán vào hệ thống Magnetic Levitation ............55
3.2 Ứng dụng mạng nơron vào điều khiển thích nghi [1] .......................................59
3.2.1 Xác định các Model NARMA-L2 [2].........................................................60
3.2.2 Sử dụng các khối điều khiển NARMA-L2 [2]............................................63
3.2.3 Kết quả thực nghiệm trên MATLAB [3] ....................................................66
3.3 Mạng nơron trong điều khiển phản hồi [4].......................................................79
3.3.1 Phản hồi tuyến tính của hệ thống phi tuyến dùng mạng nơron....................80
3.3.2 Ứng dụng mạng nơron trong mạng phản hồi ..............................................81
3.4. Kết luận chương 3 ..........................................................................................82
TỔNG KẾT.............................................................................................................................. 82
TÀI LIỆU THAM KHẢO....................................................................................................... 83
5
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
STT Ký hiệu Diễn giải
1 Artificial Intelligence Trí tuệ nhân tạo
2 Artificial Neural Nơron nhân tạo
3 Artificial Neural Network (ANN) Mạng nơron nhân tạo
4 Axon Sợi trục ra
5 Bias Độ lệch (ngưỡng)
6 Cell body Thân tế bào
7 Character Recognition Nhận dạng kí tự
8 Data Filtering Lọc dữ liệu
9 Dendrites Nhánh vào hình cây
10 Institute of Electrical and Electronic Viện các kỹ sư điện và điện tử
Engineer (IEEE)
11 Input signals Các tín hiệu vào
12 Language Processing Xử lý ngôn ngữ
13 Least Mean Squares (LMS) Tối thiểu bình phương trung bình
14 Multiple Adaptive Linear Elements Thành phần tuyến tính thích nghi
15 Many input many output (MIMO) Hệ nhiều đầu vào nhiều đầu ra
16 Multi Layer Perceptron (MLP) Mạng nhiều tầng truyền thẳng
17 Neural Networks for Computing Mạng neuron dùng trong tin học
18 Output Layer Lớp ra
19 Organization of Behavior Hành vi tổ chức
20 Voice Recognition Nhận dạng tiếng nói
21 Pattern Recognition Nhận dạng mẫu
22 Signal Processing Xử lý tín hiệu
23 Summing function Bộ tổng
24 Synaptic weight Trọng số liên kết
25 Transfer function Hàm truyền
6
DANH MỤC HÌNH ẢNH
Hình 1.1: Cấu trúc của một nơron sinh học điển hình ...........................................15
Hình 1.2: Nơron nhân tạo......................................................................................16
Hình 1.3: Mạng tự kết hợp.....................................................................................19
Hình 1.4: Mạng kết hợp khác kiểu .........................................................................20
Hình 1.5: Mạng truyền thẳng.................................................................................20
Hình 1.6: Mạng phản hồi.......................................................................................21
Hình 1.7: Perceptron.............................................................................................21
Hình 1.8: Mạng MLP tổng quát.............................................................................22
Hình 2.1: Điều khiển theo nguyên tắc phản hồi đầu ra ..........................................24
Hình 2.2: Quy trình nhận dạng hệ thống ...............................................................27
Hình 2.3: Sơ đồ tổng quát nhận dạng thông số mô hình.........................................34
Hình 2.4: Nhận dạng theo phương pháp gradient..................................................36
Hình 2.5: Mô hình dạng 1......................................................................................42
Hình 2.6: Mô hình dạng 2......................................................................................42
Hình 2.7: Mô hình dạng 3......................................................................................43
Hình 2.8: Mô hình dạng 4......................................................................................43
Hình 2.9: Mô hình nhận dạng kiểu truyền thẳng....................................................44
Hình 2.10: Mô hình nhận dạng kiểu song song......................................................45
Hình 2.11: Mô hình nhận dạng kiểu nối tiếp-song song.........................................46
Hình 2.12: Mô hình nhận dạng ngược trực tiếp .....................................................47
Hình 2.13, 2.14, 2.15, 2.16: Mô hình mạng nơron .................................................50
Hình 3.1: Nhận dạng thực vật................................................................................52
Hình 3.2: Mô hình mạng nơron thực vật................................................................53
Hình 3.3: Mạng nơron điều khiển dự đoán ............................................................54
Hình 3.4: Hệ thống Magnetic Levitation................................................................55
Hình 3.5: Dữ liệu huấn luyện có chiều rộng xung dài............................................57
Hình 3.6: Huấn luyện dữ liệu có độ rộng xung ngắn..............................................57
Hình 3.7: Dữ liệu huấn luyện với hỗn hợp độ rộng xung .......................................58
Hình 3.8: Phản ứng Maglev và hành động kiểm soát bằng cách sử dụng điều khiển
dự đoán .................................................................................................................58
Hình 3.9: Cấu trúc một mạng nơron......................................................................62
Hình 3.10: Sơ đồ khối của bộ điều khiển NARMA-L2 ............................................62
Hình 3.11: Bộ điều khiển thực hiện với mô hình nhận dạng NARMA-L2................63
Hình 3.12: Sơ đồ điều khiển vị trí nam châm vĩnh cửu...........................................64
7
Hình 3.13: Các Simulink biên soạn với các mô hình..............................................65
Hình 3.14: Cửa sổ cho phép tạo mô hình NARMA-L2 ...........................................65
Hình 3.15: Đồ thị vị trí mẫu và vị trí sau khi đã điều khiển...................................66
Hình 2.16: Sơ đồ khối mô tả động cơ điện một chiều.............................................67
Hình 3.17: Sơ đồ mạng nơron truyền thẳng nhiều lớp điều khiển thích nghi vị trí
động cơ điện một chiều khi có tải thay đổi.............................................................67
Hình 3.18: Bảng điều khiển nhận dạng tín hiệu vị trí động cơ một chiều NARMA-L2
..............................................................................................................................68
Hình 3.19: Dữ liệu vào ra của tín hiệu vị trí động cơ một chiều ............................68
Hình 3.20: Xuất dữ liệu làm việc ...........................................................................69
Hình 3.21: Nhập dữ liệu vào bộ điều khiển............................................................69
Hình 3.22: Huấn luyện đối tượng với dư liệu đã nhập vào.....................................70
Hình 3.23: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2.........................70
Hình 3.24: Dữ liệu xác nhận cho bộ điều khiển NN NARMA-L2............................71
Hình 3.25: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2 .............................71
Hình 3.26: Đồ thị vị trí mẫu qd..............................................................................72
(nét mảnh) và vị trí sau khi đã điều khiển q (nét đậm) ...........................................72
Hình 3.27: Đồ thị điện áp điều khiển .....................................................................72
Hình 3.28: Đồ thị mômen tải MC (Nm)..................................................................73
Hình 3.29: Sơ đồ khối mô tả động cơ điện một chiều khi có R, MC thay đổi .........74
Hình 3.30: Dữ liệu vào ra của tín hiệu vị trí động cơ một chiều ............................75
..............................................................................................................................75
Hình 3.32: Huấn luyện đối tượng với dư liệu đã nhập vào.....................................76
Hình 3.33: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2.........................76
Hình 3.34: Dữ liệu xác nhận cho bộ điều khiển NN NARMA-L2............................77
Hình 3.35: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2 .............................77
Hình 3.36: Đồ thị điện áp điều chỉnh u..................................................................77
Hình 3.37: Đồ thị điện trở R ..................................................................................78
Hình 3.38: Đồ thị mômen tải MC (Nm)..................................................................78
Hình 3.39: Đồ thị vị trí mẫu qd (nét mảnh) và vị trí sau khi đã điều khiển q .........79
(nét đậm) ...............................................................................................................79
Hình 3.40: Phản hồi tuyến tính điều khiển mạng nơron .........................................81
8
LỜI NÓI ĐẦU
Ngày nay do tiến bộ của khoa học kỹ thuật trong điện tử và tin học, các hệ
thống điều khiển tự động được phát triển và có sự thay đổi lớn. Công nghệ vi mạch
phát triển khiến cho việc sản xuất các thiết bị điện tử ngày càng hoàn thiện. Các bộ
biến đổi điện tử trong các hệ thống không những đáp ứng được khả năng tác động
nhanh, độ chính xác cao mà còn góp phần giảm kích thước và hạ giá thành của hệ
thống. Đặc biệt trong những thập kỷ gần đây trước sự phát triển mạnh mẽ và ngày
càng hoàn thiện của lý thuyết mạng nơ ron truyền thẳng nhiều lớp đã và đang mở ra
một kỷ nguyên mới ngành điều khiển. Tuy là ngành kỹ thuật điều khiển non trẻ
nhưng những ứng dụng trong công nghiệp của điều khiển mạng nơ ron rất rộng rãi
như trong nhận dạng, phân loại sản phẩm, xử lý tiếng nói, chữ viết và điều khiển hệ
thống, điều khiển rô bốt. Tới nay đã có rất nhiều sản phẩm công nghiệp được tạo ra
và nhờ kỹ thuật điều khiển mạng nơ ron, rất nhiều nước trên thế giới đã thành công.
Để điều khiển chính xác đối tượng khi chưa biết rõ được thông số, trước tiên
ta phải hiểu rõ đối tượng đó. Đối với đối tượng có thông số thay đổi như động cơ
một chiều và có tải thay đổi, ta cần thực hiện nhận dạng đặc tính vào ra của nó để
đảm bảo tạo ra tín hiệu điều khiển thích nghi được lựa chọn chính xác hơn.
Chính vì thế mà việc đi sâu nghiên cứu và áp dụng lý thuyết điều khiển nơ
ron truyền thẳng nhiều lớp trong điều khiển thích nghi vị trí động cơ một chiều khi
có thông số và tải thay đổi có ý nghĩa khoa học rất lớn.
Đề tài này nghiên cứu ứng dụng mạng nơ ron truyền thẳng nhiều lớp (bộ
điều khiển NARMA-L2) trong điều khiển thích nghi vị trí động cơ điện một chiều
khi có thông số và tải thay đổi.
Do kiến thức còn hạn hẹp và thời gian thực hiện chưa được nhiều nên luận
văn này còn rất nhiều sai sót, hạn chế. Vì vậy tôi mong nhận được nhiều sự góp ý để
đề tài được hoàn thiện hơn.
Em xin gửi lời cảm ơn chân thành nhất tới thầy giáo PGS.TS. Hoàng Mạnh
Thắng đã nhiệt tình, tận tụy hướng dẫn giúp em hoàn thành đề tài này.
9
Em xin chân thành cảm ơn !
10
CHƯƠNG 1: TỔNG QUAN VỀ MÔ HÌNH MẠNG NƠRON
1.1 Giới thiệu về mạng nơron nhân tạo
1.1.1 Mạng nơron nhân tạo là gì?
Định nghĩa: Mạng nơron nhân tạo, ArtificialNeural Network (ANN) gọi tắt
là mạng nơron, neural network, là một mô hình xử lý thông tin phỏng theo cách
thức xử lý thông tin của các hệ nơron sinh học. Nó được tạo lên từ một số lượng lớn
các phần tử (gọi là phần tử xử lý hay nơron) kết nối với nhau thông qua các liên kết
(gọi là trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề
cụ thể nào đó.
Một mạng nơron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhận
dạng mẫu, phân loại dữ liệu...) thông qua một quá trình học từ tập các mẫu huấn
luyện. Về bản chất, học chính là quá trình hiệu chỉnh trọng số liên kết giữa các
nơron.
1.1.2 Lịch sử phát triển mạng nơron
Các nghiên cứu về bộ não con người đã được tiến hành từ hàng nghìn năm
nay. Cùng với sự phát triển của khoa học kĩ thuật đặc biệt là những tiến bộ trong
ngành điện tử hiện đại, việc con người bắt đầu nghiên cứu các nơron nhân tạo là
hoàn toàn tự nhiên. Sự kiện đầu tiên đánh dấu sự ra đời của mạng nơron nhân tạo
diễn ra vào năm 1943 khi nhà thần kinh học Warren McCulloch và nhà toán học
Walter Pitts viết bài báo mô tả cách thức các nơron hoạt động. Họ cũng đã tiến hành
xây dựng một mạng nơron đơn giản bằng các mạch điện. Các nơron của họ được
xem như là các thiết bị nhị phân với ngưỡng cố định. Kết quả của các mô hình này
là các hàm logic đơn giản chẳng hạn như “a OR b” hay “a AND b”.
Tiếp bước các nghiên cứu này, năm 1949 Donald Hebb cho xuất bản cuốn
sách Organization of Behavior. Cuốn sách đã chỉ ra rằng các nơron nhân tạo sẽ trở
lên hiệu quả hơn sau mỗi lần chúng được sử dụng.
Những tiến bộ của máy tính đầu những năm 1950 giúp cho việc mô hình hóa
các nguyên lý của những lý thuyết liên quan tới cách thức con người suy nghĩ đã trở
11
thành hiện thực. Nathanial Rochester sau nhiều năm làm việc tại các phòng thí
nghiệm nghiên cứu của IBM đã có những nỗ lực đầu tiên để mô phỏng một mạng
nơron. Trong thời kì này tính toán truyền thống đã đạt được những thành công rực
rỡ trong khi đó những nghiên cứu về nơron còn ở giai đoạn sơ khai. Mặc dù vậy
những người ủng hộ triết lý “thinking machines” (các máy biết suy nghĩ) vẫn tiếp
tục bảo vệ cho lập trường của mình.
Năm 1956 dự án Dartmouth nghiên cứu về trí tuệ nhân tạo (Artificial
Intelligence) đã mở ra thời kỳ phát triển mới cả trong lĩnh vực trí tuệ nhân tạo lẫn mạng
nơron. Tác động tích cực của nó là thúc đẩy hơn nữa sự quan tâm của các nhà khoa học
về trí tuệ nhân tạo và quá trình xử lý ở mức đơn giản của mạng nơron trong bộ não con
người.
Những năm tiếp theo của dự án Dartmouth, John von Neumann đã đề xuất
việc mô phỏng các nơron đơn giản bằng cách sử dụng rơle điện áp hoặc đèn chân
không. Nhà sinh học chuyên nghiên cứu về nơron Frank Rosenblatt cũng bắt đầu
nghiên cứu về Perceptron. Sau thời gian nghiên cứu này Perceptron đã được cài đặt
trong phần cứng máy tính và được xem như là mạng nơron lâu đời nhất còn được sử
dụng đến ngày nay. Perceptron một tầng rất hữu ích trong việc phân loại một tập
các đầu vào có giá trị liên tục vào một trong hai lớp. Perceptron tính tổng có trọng
số các đầu vào, rồi trừ tổng này cho một ngưỡng và cho ra một trong hai giá trị
mong muốn có thể. Tuy nhiên Perceptron còn rất nhiều hạn chế, những hạn chế này
đã được chỉ ra trong cuốn sách về Perceptron của Marvin Minsky và Seymour
Papert viết năm 1969.
Năm 1959, Bernard Widrow và Marcian Hoff thuộc trường đại học Stanford
đã xây dựng mô hình ADALINE (ADAptive LINear Elements) và MADALINE.
(Multiple ADAptive LINear Elements). Các mô hình này sử dụng quy tắc học
Least-Mean-Squares (LMS: Tối thiểu bình phương trung bình). MADALINE là
mạng nơron đầu tiên được áp dụng để giải quyết một bài toán thực tế. Nó là một bộ
lọc thích ứng có khả năng loại bỏ tín hiệu dội lại trên đường dây điện thoại. Ngày
nay mạng nơron này vẫn được sử dụng trong các ứng dụng thương mại.
12
Năm 1974 Paul Werbos đã phát triển và ứng dụng phương pháp học lan
truyền ngược (back-propagation). Tuy nhiên phải mất một vài năm thì phương pháp
này mới trở lên phổ biến. Các mạng lan truyền ngược được biết đến nhiều nhất và
được áp dụng rộng dãi nhất nhất cho đến ngày nay.
Thật không may, những thành công ban đầu này khiến cho con người nghĩ
quá lên về khả năng của các mạng nơron. Chính sự cường điệu quá mức đã có
những tác động không tốt đến sự phát triển của khoa học và kỹ thuật thời bấy giờ
khi người ta lo sợ rằng đã đến lúc máy móc có thể làm mọi việc của con người.
Những lo lắng này khiến người ta bắt đầu phản đối các nghiên cứu về mạng neuron.
Thời kì tạm lắng này kéo dài đến năm 1981.
Năm 1982 trong bài báo gửi tới viện khoa học quốc gia, John Hopfield bằng
sự phân tích toán học rõ ràng, mạch lạc, ông đã chỉ ra cách thức các mạng nơron
làm việc và những công việc chúng có thể thực hiện được. Cống hiến của Hopfield
không chỉ ở giá trị của những nghiên cứu khoa học mà còn ở sự thúc đẩy trở lại các
nghiên cứu về mạng neuron.
Cũng trong thời gian này, một hội nghị với sự tham gia của Hoa Kỳ và Nhật
Bản bàn về việc hợp tác/cạnh tranh trong lĩnh vực mạng nơron đã được tổ chức tại
Kyoto, Nhật Bản. Sau hội nghị, Nhật Bản đã công bố những nỗ lực của họ trong
việc tạo ra máy tính thế hệ thứ 5. Tiếp nhận điều đó, các tạp chí định kỳ của Hoa Kỳ
bày tỏ sự lo lắng rằng nước nhà có thể bị tụt hậu trong lĩnh vực này. Vì thế, ngay
sau đó, Hoa Kỳ nhanh chóng huy động quĩ tài trợ cho các nghiên cứu và ứng dụng
mạng neuron.
Năm 1985, viện vật lý Hoa Kỳ bắt đầu tổ chức các cuộc họp hàng năm về
mạng neuron ứng dụng trong tin học (Neural Networks for Computing).
Năm 1987, hội thảo quốc tế đầu tiên về mạng neuron của Viện các kỹ sư điện
và điện tử IEEE (Institute of Electrical and Electronic Engineer) đã thu hút hơn
1800 người tham gia.
Ngày nay, không chỉ dừng lại ở mức nghiên cứu lý thuyết, các nghiên cứu
ứng dụng mạng nơron để giải quyết các bài toán thực tế được diễn ra ở khắp mọi
13
nơi. Các ứng dụng mạng nơron ra đời ngày càng nhiều và ngày càng hoàn thiện
hơn. Điển hình là các ứng dụng: xử lý ngôn ngữ (Language Processing), nhận dạng
kí tự (Character Recognition), nhận dạng tiếng nói (Voice Recognition), nhận dạng
mẫu (Pattern Recognition), xử lý tín hiệu (Signal Processing), lọc dữ liệu (Data
Filtering)...
1.1.3 So sánh mạng nơron với máy tính truyền thống
Các mạng nơron có cách tiếp cận khác trong giải quyết vấn đề so với máy
tính truyền thống. Các máy tính truyền thống sử dụng cách tiếp cận theo hướng giải
thuật, tức là máy tính thực hiện một tập các chỉ lệnh để giải quyết một vấn đề. Vấn
đề được giải quyết phải được biết và phát biểu dưới dạng một tập chỉ lệnh không
nhập nhằng. Những chỉ lệnh này sau đó phải được chuyển sang một chương trình
ngôn ngữ bậc cao và chuyển sang mã máy để máy tính có thể hiểu được.
Trừ khi các bước cụ thể mà máy tính cần tuân theo được chỉ ra rõ ràng, máy
tính sẽ không làm được gì cả. Điều đó giới hạn khả năng của các máy tính truyền
thống ở phạm vi giải quyết các vấn đề mà chúng ta đã hiểu và biết chính xác cách
thực hiện. Các máy tính sẽ trở lên hữu ích hơn nếu chúng có thể thực hiện được
những việc mà bản thân con người không biết chính xác là phải làm như thế nào.
Các mạng nơron xử lý thông tin theo cách thức giống như bộ não con người.
Mạng được tạo nên từ một số lượng lớn các phần tử xử lý được kết nối với nhau
làm việc song song để giải quyết một vấn đề cụ thể. Các mạng nơron học theo mô
hình, chúng không thể được lập trình để thực hiện một nhiệm vụ cụ thể. Các mẫu
phải được chọn lựa cẩn thận nếu không sẽ rất mất thời gian, thậm chí mạng sẽ hoạt
động không đúng. Điều hạn chế này là bởi vì mạng tự tìm ra cách giải quyết vấn đề,
thao tác của nó không thể dự đoán được.
Các mạng nơron và các máy tính truyền thống không cạnh tranh nhau mà bổ
sung cho nhau. Có những nhiệm vụ thích hợp hơn với máy tính truyền thống, ngược
lại có những nhiệm vụ lại thích hợp hơn với các mạng nơron. Thậm chí rất nhiều
nhiệm vụ đòi hỏi các hệ thống sử dụng tổ hợp cả hai cách tiếp cận để thực hiện
14
được hiệu quả cao nhất (thông thường một máy tính truyền thống được sử dụng để
giám sát mạng nơron).
1.2. Nơron sinh học và nơron nhân tạo
1.2.1 Nơron sinh học
Qua quá trình nghiên cứu về bộ não, người ta thấy rằng: bộ não con người
bao gồm khoảng 1011 nơron tham gia vào khoảng 1015 kết nối trên các đường
truyền. Mỗi đường truyền này dài khoảng hơn một mét. Các nơron có nhiều đặc
điểm chung với các tế bào khác trong cơ thể, ngoài ra chúng còn có những khả năng
mà các tế bào khác không có được, đó là khả năng nhận, xử lý và truyền các tín hiệu
điện hóa trên các đường mòn nơron, các con đường này tạo nên hệ thống giao tiếp
của bộ não.
Hình 1.1: Cấu trúc của một nơron sinh học điển hình
Mỗi nơron sinh học có 3 thành phần cơ bản:
• Các nhánh vào hình cây ( dendrites)
• Thân tế bào (cell body)
• Sợi trục ra (axon)
Các nhánh hình cây truyền tín hiệu vào đến thân tế bào. Thân tế bào tổng hợp
và xử lý cho tín hiệu đi ra. Sợi trục truyền tín hiệu ra từ thân tế bào này sang nơron
khác. Điểm liên kết giữa sợi trục của nơron này với nhánh hình cây của nơron khác
gọi là synapse. Liên kết giữa các nơron và độ nhạy của mỗi synapse được xác định
15
bởi quá trình hóa học phức tạp. Một số cấu trúc của nơron được xác định trước lúc
sinh ra. Một số cấu trúc được phát triển thông qua quá trình học. Trong cuộc đời cá
thể, một số liên kết mới được hình thành, một số khác bị hủy bỏ.
Như vậy nơron sinh học hoạt động theo cách thức sau: nhận tín hiệu đầu vào,
xử lý các tín hiệu này và cho ra một tín hiệu output. Tín hiệu output này sau đó
được truyền đi làm tín hiệu đầu vào cho các nơron khác.
Dựa trên những hiểu biết về nơron sinh học, con người xây dựng nơron nhân
tạo với hy vọng tạo nên một mô hình có sức mạnh như bộ não.
1.2.2 Nơron nhân tạo
Một nơron là một đơn vị xử lý thông tin và là thành phần cơ bản của một
mạng nơron. Cấu trúc của một nơron được mô tả trên hình dưới.
Hình 1.2: Nơron nhân tạo

Các thành phần cơ bản của một nơron nhân tạo bao gồm:
♦ Tập các đầu vào: Là các tín hiệu vào (input signals) của nơron, các tín
hiệu này thường được đưa vào dưới dạng một vector N chiều.
♦ Tập các liên kết: Mỗi liên kết được thể hiện bởi một trọng số (gọi là trọng
số liên kết – Synaptic weight). Trọng số liên kết giữa tín hiệu vào thứ j với nơron k
thường được kí hiệu là w kj. Thông thường, các trọng số này được khởi tạo một cách
ngẫu nhiên ở thời điểm khởi tạo mạng và được cập nhật liên tục trong quá trình học
mạng.
16
♦ Bộ tổng (Summing function): Thường dùng để tính tổng của tích các đầu
vào với trọng số liên kết của nó.
♦ Ngưỡng (còn gọi là một độ lệch - bias): Ngưỡng này thường được đưa vào
như một thành phần của hàm truyền.
♦ Hàm truyền (Transfer function) : Hàm này được dùng để giới hạn phạm vi
đầu ra của mỗi nơron. Nó nhận đầu vào là kết quả của hàm tổng và ngưỡng đã cho.
Thông thường, phạm vi đầu ra của mỗi nơron được giới hạn trong đoạn [0,1] hoặc
[-1, 1]. Các hàm truyền rất đa dạng, có thể là các hàm tuyến tính hoặc phi tuyến.
Việc lựa chọn hàm truyền nào là tuỳ thuộc vào từng bài toán và kinh nghiệm của
người thiết kế mạng. Một số hàm truyền thường sử dụng trong các mô hình mạng
nơron được đưa ra trong bảng 1 .
♦ Đầu ra: Là tín hiệu đầu ra của một nơron, với mỗi nơron sẽ có tối đa là
một đầu ra.
Xét về mặt toán học, cấu trúc của một nơron k, được mô tả bằng cặp biểu
thức sau:
[Công thức]
Trong đó: x , x ..., x : là các tín hiệu vào; (w , w k2…..wkp là các trọng số
1 2 p k1 )
liên kết của nơron thứ k;u là hàm tổng; b là một ngưỡng; f là hàm truyền và y là
k k k
tín hiệu đầu ra của nơron.

Như vậy tương tự như nơron sinh học, nơron nhân tạo cũng nhận các tín hiệu
đầu vào, xử lý (nhân các tín hiệu này với trọng số liên kết, tính tổng các tích thu
được rồi gửi kết quả tới hàm truyền), và cho một tín hiệu đầu ra (là kết quả của hàm
truyền).
17
Bảng 1: Một số hàm truyền thông dụng
Hàm truyền Đồ thị Định nghĩa
Symmetrical Hard
Limit (hardlims)
Linear (purelin)
Saturating Linear
(satlin)
Log-Sigmoid (logsig)
1.3 Mô hình mạng nơron

Mặc dù mỗi nơron đơn lẻ có thể thực hiện những chức năng xử lý thông tin
nhất định, sức mạnh của tính toán nơron chủ yếu có được nhờ sự kết hợp các nơron
trong một kiến trúc thống nhất. Một mạng nơron là một mô hình tính toán được xác
định qua các tham số: kiểu nơron (như là các nút nếu ta coi cả mạng nơron là một
đồ thị), kiến trúc kết nối (sự tổ chức kết nối giữa các nơron) và thuật toán học (thuật
toán dùng để học cho mạng).
Về bản chất một mạng nơron có chức năng như là một hàm ánh xạ F: X →
Y, trong đó X là không gian trạng thái đầu vào (input state space) và Y là không
18
gian trạng thái đầu ra (output state space) của mạng. Các mạng chỉ đơn giản là làm
nhiệm vụ ánh xạ các vector đầu vào x ∈ X sang các vector đầu ra y ∈ Y thông qua
“bộ lọc” (filter) các trọng số. Tức là y = F(x) = s(W, x), trong đó W là ma trận trọng
số liên kết. Hoạt động của mạng thường là các tính toán số thực trên các ma trận.
1.3.1 Các kiểu mô hình mạng nơron
Cách thức kết nối các nơron trong mạng xác định kiến trúc (topology) của
mạng. Các nơron trong mạng có thể kết nối đầy đủ (fully connected) tức là mỗi
nơron đều được kết nối với tất cả các nơron khác, hoặc kết nối cục bộ (partially
connected) chẳng hạn chỉ kết nối giữa các nơron trong các tầng khác nhau. Người ta
chia ra hai loại kiến trúc mạng chính:
♦ Tự kết hợp (autoassociative): là mạng có các nơron đầu vào cũng là các
nơron đầu ra. Mạng Hopfield là một kiểu mạng tự kết hợp.
Hình 1.3: Mạng tự kết hợp

♦ Kết hợp khác kiểu (heteroassociative): là mạng có tập nơron đầu vào và
đầu ra riêng biệt. Perceptron, các mạng Perceptron nhiều tầng (MLP: MultiLayer
Perceptron), mạng Kohonen, … thuộc loại này.
19
Hình 1.4: Mạng kết hợp khác kiểu
Ngoài ra tùy thuộc vào mạng có các kết nối ngược (feedback connections) từ
các nơron đầu ra tới các nơron đầu vào hay không, người ta chia ra làm 2 loại kiến
trúc mạng.
♦ Kiến trúc truyền thẳng (feedforward architechture): là kiểu kiến trúc mạng
không có các kết nối ngược trở lại từ các nơron đầu ra về các nơron đầu vào; mạng
không lưu lại các giá trị output trước và các trạng thái kích hoạt của nơron. Các
mạng nơron truyền thẳng cho phép tín hiệu di chuyển theo một đường duy nhất; từ
đầu vào tới đầu ra, đầu ra của một tầng bất kì sẽ không ảnh hưởng tới tầng đó. Các
mạng kiểu Perceptron là mạng truyền thẳng.
Hình 1.5: Mạng truyền thẳng

♦ Kiến trúc phản hồi (Feedback architecture): là kiểu kiến trúc mạng có các
kết nối từ nơron đầu ra tới nơron đầu vào. Mạng lưu lại các trạng thái trước đó, và
trạng thái tiếp theo không chỉ phụ thuộc vào các tín hiệu đầu vào mà còn phụ thuộc
vào các trạng thái trước đó của mạng. Mạng Hopfield thuộc loại này.
20
Hình 1.6: Mạng phản hồi
1.3.2 Perceptron
Perceptron là mạng nơron đơn giản nhất, nó chỉ gồm một nơron, nhận đầu
vào là vector có các thành phần là các số thực và đầu ra là một trong hai giá trị +1
hoặc -1.
Hình 1.7: Perceptron

Đầu ra của mạng được xác định như sau: mạng lấy tổng có trọng số các
thành phần của vector đầu vào, kết quả này cùng ngưỡng b được đưa vào hàm
truyền (Perceptron dùng hàm Hard-limit làm hàm truyền) và kết quả của hàm truyền
sẽ là đầu ra của mạng.
Hoạt động của Perceptron có thể được mô tả bởi cặp công thức sau:
Y = f(u - b) = Hardlimit (u - b); Y nhận giá trị +1 nếu u - b>0, ngược lại Y
nhận giá trị -1.
Perceptron cho phép phân loại chính xác trong trường hợp dữ liệu có thể
phân chia tuyến tính (các mẫu nằm trên hai mặt đối diện của một siêu phẳng). Nó
21
cũng phân loại đúng đầu ra các hàm AND, OR và các hàm có dạng đúng khi n trong
m đầu vào của nó đúng (n ≤ m). Nó không thể phân loại được đầu ra của hàm XOR.
1.3.3 Mạng nhiều tầng truyền thẳng (MLP)
Mô hình mạng nơron được sử dụng rộng rãi nhất là mô hình mạng nhiều tầng
truyền thẳng (MLP: Multi Layer Perceptron). Một mạng MLP tổng quát là mạng có
n (n≥2) tầng (thông thường tầng đầu vào không được tính đến): trong đó gồm một
tầng đầu ra (tầng thứ n) và (n-1) tầng ẩn.
Hình 1.8: Mạng MLP tổng quát

Kiến trúc của một mạng MLP tổng quát có thể mô tả như sau:
♦ Đầu vào là các vector (x1, x2, ..., xp) trong không gian p chiều, đầu ra là
các vector (y1, y2, ..., yq) trong không gian q chiều. Đối với các bài toán phân loại,
p chính là kích thước của mẫu đầu vào, q chính là số lớp cần phân loại. Xét ví dụ
trong bài toán nhận dạng chữ số: với mỗi mẫu ta lưu tọa độ (x,y) của 8 điểm trên
chữ số đó, và nhiệm vụ của mạng là phân loại các mẫu này vào một trong 10 lớp
tương ứng với 10 chữ số 0, 1, …, 9. Khi đó p là kích thước mẫu và bằng 8 x 2 = 16;
q là số lớp và bằng 10.
♦ Mỗi nơron thuộc tầng sau liên kết với tất cả các nơron thuộc tầng liền trước
nó.
♦ Đầu ra của nơron tầng trước là đầu vào của nơron thuộc tầng liền sau nó.
Hoạt động của mạng MLP như sau: tại tầng đầu vào các nơron nhận tín hiệu
vào xử lý (tính tổng trọng số, gửi tới hàm truyền) rồi cho ra kết quả (là kết quả của
hàm truyền); kết quả này sẽ được truyền tới các nơron thuộc tầng ẩn thứ nhất; các
22
nơron tại đây tiếp nhận như là tín hiệu đầu vào, xử lý và gửi kết quả đến tầng ẩn thứ
2;…; quá trình tiếp tục cho đến khi các nơron thuộc tầng ra cho kết quả.
Một số kết quả đã được chứng minh:
♦ Bất kì một hàm Boolean nào cũng có thể biểu diễn được bởi một mạng
MLP 2 tầng trong đó các nơron sử dụng hàm truyền sigmoid.
♦ Tất cả các hàm liên tục đều có thể xấp xỉ bởi một mạng MLP 2 tầng sử
dụng hàm truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính cho các
nơron tầng ra với sai số nhỏ tùy ý.
♦ Mọi hàm bất kỳ đều có thể xấp xỉ bởi một mạng MLP 3 tầng sử dụng hàm
truyền sigmoid cho các nơron tầng ẩn và hàm truyền tuyến tính cho các nơron tầng ra.
1.4. Kết luận chương 1

Qua phân tích tổng quan về mạng nơ ron nhân tạo ở chương một, ta thấy mô
hình mạng nơ ron có tính chất sau:
- Là hệ phi tuyến
- Là hệ xử lý song song
- Là hệ học và thích nghi: Mạng được luyện từ các số liệu quá khứ, có khả
năng tự chỉnh khi số liệu đầu vào bị mất.
- Là hệ nhiều biến, nhiều đầu vào, nhiều đầu ra rất tiện dùng khi điều khiển
đối tượng có nhiều biến số.
Vì vậy nó có ý nghĩa rất quan trọng trong quá trình nhận dạng và điều khiển
thích nghi đối tượng có tính chất phi tuyến và phụ tải thay đổi.
23
CHƯƠNG 2: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG
NHẬN DẠNG
2.1 Các phương pháp ứng dụng mạng nơron trong nhận dạng
2.1.1 Khái quát chung
2.1.1.1 Đặtvấnđề
Tạisaophảinhậndạng?Đểhiểurõvấnđềtaxétmộtbàitoánđiềukhiển
theonguyêntắcphảnhồinhưtrênhình2.1.
Hình 2.1: Điều khiển theo nguyên tắc phản hồi đầu ra
Muốn tổng hợp được bộ điều khiển cho đối tượng hệ kín có được chất lượng
như mong muốn thì trước tiên phải hiểu biết về đối tượng, tức là cần phải có một
mô hình toán học mô tả đối tượng. Không thể điều khiển đối tượng khi không hiểu
biết hoặc hiểu sai lệch về nó. Kết quả tổng hợp bộ điều khiển phụ thuộc rất nhiều
vào mô hình mô tả đối tượng. Mô hình càng chính xác, hiệu suất công việc càng
cao.
Việc xây dựng mô hình cho đối tượng được gọi là mô hình hóa. Người ta
thường phân chia các phương pháp mô hình hóa ra làm hai loại:
- Phương pháp lý thuyết.
- Phương pháp thực nghiệm.
Phương pháp lý thuyết là phương pháp thiết lập mô hình dựa trên các định
luật có sẵn về quan hệ vật lý bên trong và quan hệ giao tiếp với môi trường bên
ngoài của đối tượng. Các quan hệ này được mô tả theo quy luật lý – hóa, quy luật
cân bằng,… dưới dạng những phương trình toán học.
Trong các trường hợp mà ở đó sự hiểu biết về những quy luật giao tiếp bên
trong đối tượng cũng về mối quan hệ giữa đối tượng với môi trường bên ngoài
không được đầy đủ để có thể xây dựng được một mô hình hoàn chỉnh, nhưng ít nhất
từ đó có thể cho biết các thông tin ban đầu về dạng mô hình thì tiếp theo người ta
24
phải áp dụng phương pháp thực nghiệm để hoàn thiện nốt việc xây dựng mô hình
đối tượng trên cơ sở quan sát tín hiệu vào u(t) và ra y(t) của đối tượng sao cho mô
hình thu được bằng phương pháp thực nghiệm thỏa mãn các yêu cầu của phương
pháp lý thuyết đề ra. Phương pháp thực nghiệm đó được gọi là nhận dạng hệ thống
điều khiển.
Như vậy khái niệm nhận dạng hệ thống điều khiển được hiểu là sự bổ sung
cho việc mô hình hóa đối tượng mà ở đó lượng thông tin ban đầu về đối tượng điều
khiển không đầy đủ.
2.1.1.2 Định nghĩa
Nhận dạng hệ thống là xây dựng mô hình toán học của hệ (cấu trúc – tham
số) dựa trên các dữ liệu thực nghiệm đo được. Quá trình nhận dạng là quá trình hiệu
chỉnh các tham số của mô hình sao cho tín hiệu ra của mô hình tiến tới tín hiệu đo
được của hệ thống.
Khái niệm về bài toán nhận dạng được Zadeh định nghĩa vào năm 1962 với
hai điểm cơ bản sau:
- Nhận dạng là phương pháp thực nghiệm nhằm xác định một mô hình cụ thể
trong lớp các mô hình thích hợp trên cơ sở quan sát các tín hiệu vào ra.
- Mô hình tìm được phải có sai số với đối tượng là nhỏ nhất.
Theo định nghĩa này thì những bài toán nhận dạng sẽ phải được phân biệt với
nhau ở ba điểm chính, đó là:
- Lớp mô hình thích hợp. Chẳng hạn lớp các mô hình tuyến tính không có
cấu trúc (không biết bậc của mô hình) hoặc có cấu trúc, lớp các loại mô hình lưỡng
tuyến tính.
- Loại tín hiệu quan sát được (tiền định/ngẫu nhiên).
- Phương thức mô tả sai lệch giữa mô hình thực và đối tượng.
2.1.1.3 Sơ lược về sự phát triển của các phương pháp nhận dạng.
Sự phát triển của nhận dạng trong lĩnh vực điều khiển tự động trong 60 năm
trở lại đây có thể chia thành ba giai đoạn như sau:
25
- Giai đoạn 1: (khoảng 1960-1975) được đánh dấu bằng nhận dạng các mô
hình không tham số cho đối tượng điều khiển tuyến tính mà trọng tâm là thiết lập
hàm trọng hay đặc tính tần biên – pha dưới dạng một dãy giá trị (phức). Kiến thức
lý thuyết cần thiết cho giai đoạn này phần lớn được xây dựng trên cơ sở lý thuyết
hàm phức và phân tích phổ tín hiệu.
- Giai đoạn 2: Được đặc trưng bởi sự ra đời của lớp mô hình liên tục hoặc rời
rạc có tham số và được gọi là giai đoạn nhận dạng tham số mô hình. Thông tin lý
thuyết ở đây đủ để người ta có thể lựa chọn được bậc (hay cấu trúc) cho mô hình
liên tục hay rời rạc. Nhiệm vụ nhận dạng trong giai đoạn này là xác định giá trị các
tham số của mô hình đó với hướng nghiên cứu tập trung là xét tính hội tụ các
phương pháp và ảnh hưởng của nhiễu và kết quả.
- Giai đoạn 3: (Khoảng 1990 đến nay) được đánh dấu bằng nhận dạng mô
hình động học liên tục phi tuyến và nhận dạng mô hình tham số cho hệ nhiều chiều.
Dần dần trong giai đoạn này người ta cũng chuyển hướng đi vào nhận dạng
các hệ thống suy biến.
2.1.1.4 Các bước cơ bản để nhận dạng hệ thống.
Nhận dạng hệ thống là ước lượng mô hình của hệ thống dựa trên các dữ liệu
vào ra quan sát được.
Để xác định được mô hình của hệ thống từ các dữ liệu quan sát này ta phải có:
- Số liệu vào – ra.
- Tập các đầu vào tham gia vào mô hình.
- Tiêu chí lựa chọn mô hình.
Quy trình nhận dạng gồm các bước sau:
Bước 1: Thu thập số liệu vào – ra từ hệ thống.
Bước 2: Khảo sát số liệu. Lựa chọn phần có ích trong số liệu thu được, có thể
sử dụng bộ lọc nếu cần.
Bước 3: Lựa chọn và xác định cấu trúc mô hình.
Bước 4: Tính toán mô hình tốt nhất trong các dạng cấu trúc tìm được theo số
liệu vào ra và tiêu chí lựa chọn.
26
Bước 5: Khảo sát tính năng của mô hình tìm được.
Nếu mô hình cho chất lượng tốt thì dùng. Ngược lại thì quay về bước 3 để
tìm mô hình khác. Có thể phải tìm phương pháp ước lượng khác (bước 4) hoặc thu
thập thêm số liệu vào – ra (bước 1 và 2).
Quy trình nhận dạng hệ thống có thể biểu diễn theo sơ đồ hình 2.2.
Hình 2.2: Quy trình nhận dạng hệ thống

2.1.2 Các phương pháp nhận dạng
Các phương pháp nhận dạng được phân loại theo các phương pháp như sau:
- Phân loại dựa trên cơ sở các phần tử hệ thống:
+ Phân loại theo hệ thống nhận dạng S.
+ Phân loại theo tín hiệu vào u.
+ Phân loại theo tiêu chuẩn nhận dạng.
- Phân loại theo phương pháp cập nhật dữ liệu của hệ thống.
+ Phương pháp nhận dạng đệ quy.
27
Thông số nhận dạng được tính toán trực tiếp theo mỗi thời điểm. Nghĩa là
nếu có giá trị  () được cập nhật tại thời điểm t, thì giá trị của  ( + 1) được xác
định từ  (). Phương pháp nhận dạng đệ quy có đặc trưng sau:
- Là bộ phận chính của hệ thống thích nghi.

- Đòi hỏi cần có bộ nhớ.
- Thuật toán có thể được thay đổi dễ dàng.
- Tại bước tính toán đầu tiên có thể tìm được ra lỗi của thuật toán khi hệ
thống có sự thay đổi thông số đủ lớn.
Có 2 dạng nhận dạng đệ quy:
- Nhận dạng On-line
- Nhận dạng Off-line
- Phương pháp nhận dạng không tham số và nhận dạng tham số
+ Nhận dạng không tham số: là phương pháp nhận dạng mà mô hình để nhận
dạng là các đường cong quá độ hoặc các hàm và véc tơ tham số không nhất thiết
phải có kích thước hữu hạn. Nhận dạng không tham số thường dùng các phương
pháp như: phân tích hàm quá độ h(t), phân tích tần số, phân tích hàm tương quan,
phân tích phổ…
+ Nhận dạng tham số từ mô hình AR, MA, ARMA… Người ta đưa vào hệ
thống tín hiệu vào xác định u(t) sau đó đo tín hiệu ra y(t). Người ta mô tả hệ thống
bằng một mô hình tham số và dùng phương pháp bình phương tối thiểu để hiệu
chỉnh sao cho đánh giá của véc tơ tham số trùng với véc tơ tín hiệu ra của hệ thống.
28
Phương pháp này thường dùng nhận dạng các hệ phức tạp, khi đó đối tượng
được coi là “hộp đen”, vì vậy phương pháp nhận dạng có tên là nhận dạng “hộp
đen”.
2.1.2.1 Nhận dạng On-line.
Trong phương pháp nhận dạng đệ quy nếu không cần đòi hỏi dữ liệu vào-ra
đầy đủ ở mỗi thời điểm thì được gọi là phương pháp nhận dạng on-line.
Nhận dạng on-line vì thế được xem như là phương pháp dễ thực hiện cho
việc tính toán. Nhận dạng on-line được sử dụng trong nhiều lĩnh vực như: nhận
dạng thích nghi, học thích nghi, lọc phi tuyến…
Trong chế độ on-line, mô hình phải thật đơn giản, số các thông số chọn đủ
nhỏ và cấu trúc mô hình tuyến tính theo thông số.
Thuật toán nhận dạng on-line được xây dựng sao cho trên mỗi bước tính
không cần xử lý lại toàn bộ chuỗi quan sát, có nghĩa là sử dụng lại quá trình lặp.
Nhận dạng thông số hệ thống on-line có một số phương pháp sau:
2.1.2.1.1 Phương pháp lặp bình phương cực tiểu
Hệ thống có thể mô tả bằng hệ phương trình sai phân tuyến tính theo thông
số hoặc điều khiển như sau:
x(k+1) = (k)P(k) + w(k) (2.1)
z(k) = x(k) + v(k) (2.2)
Trong đó: (x, u, k)
Sơ đồ nhận dạng có tính đến hệ số trọng cho các quan sát trong quá khứ theo
luật hàm exponent:
(k) = +K(k)[x(k-1) – ϕ(k) (k - 1)] (2.3)
29
K(k) = P(k - 1) ϕ T(k) [ϕ (k)P(k - 1)ϕ T (k) + ] -1 (2.4)
P(k) = [1 – K(k)ϕ (k)]P(k - 1) (2.5)
Trong đó:
: là khoảng cách giữa hai quan sát
: là thời gian đặc trưng cho khoảng ảnh hưởng tiếp tục của quan sát lên quá trình
2.1.2.1.2 Phương pháp xấp xỉ ngẫu nghiên.
Thuật toán có dạng sau:
(k + 1) = (k) + 0.5ρ(k) PJ (2.6)
Trong đó ρ(k) là vecto thông số hiệu chỉnh thỏa mãn các điều kiện sau:
ρ(k) ≥ 0; ;
J = e2 (k + 1)
e(k + 1) = x (k + 1) - k + 1) (k)
Như vậy (2.3) có thể viết dưới dạng:
(k + 1) = (k) + ρ(k) k)[x(k+1) - k+1) (k)] (2.7)
Thuật toán xấp xỉ ngẫu nhiên đơn giản hơn thuật toán lặp bình phương cực tiểu, tuy
nhiên kém chính xác hơn.
2.1.2.1.3 Phương pháp lọc Kalman mở rộng.
Lọc Kalman là thuật toán xử lý thông tin sử dụng đầy đủ thông tin tiên
nghiệm (cấu trúc, thông số, các đặc trưng thống kê của nhiễu trạng thái và nhiễu
quan sát, các dữ liệu về điều kiện ban đầu…) Nếu trạng thái hóa véc tơ thông số
30
P(k+1) = P(k), ta có véc tơ trạng thái mở rộng:
y(k + 1) = [x(k + 1), P(k + 1)] T(2.8)
Và như vậy bộ lọc Kalman mở rộng có thể được sử dụng để xác định đồng
thời trạng thái và thông số.
Giả sử hệ thống có động học:
x(k + 1) = k)[x(k), u(k), P1(k),k] + w(k) (2.9)
z(k) = h [x(k), u(k), P2(k), k] + v(k) (2.10)
Trong đó:
E{w(j)} = 0; E{v(j)} = 0
cov{w(k), w(j)} = vv (k)δ(k - j) (2.11)
Nếu biết cấu trúc ∅ và h và các thông số mô hình P1, P2 thì bộ lọc Kalman
cho kết quả lọc:
(k + 1) = (k + ) +
+ k(k+1){z(k+1) – h[ (k + )], u(k + 1), P 2(k), k+1]} (2.12)

Trong đó dự báo
(k + 1/k) = k)[ (k), u(k), P 1(k), k] (2.13)
Ma trận hiệp phương sai của sai số dự báo thỏa mãn phương trình:
Vx (k + 1/k) = Vx (k) +
Vw (k)(2.14)
Ma trận hiệp phương sai của sai số lọc thỏa mãn phương trình:
V x (k + 1) = Vx (k + 1/k) –
31
V x (k + 1/k) *
* Vx (k + 1/k) *
* V x (k + 1/k)-1 *
* Vx (k + 1/k) (2.15)
Hệ số Kalman được tính bằng biểu thức sau:
K(k +1) = Vx (k + 1) Vx -1 (k + 1)
(2.16)
Các biểu thức ban đầu:
= E {x0 } và Vx (0) = Vx (0) (2.17)
Do các véc tơ thống số P1(k), P2(k) thay đổi theo thời gian chưa biết trước
nên cần thiết nhận dạng thông số cùng với trạng thái. Tuy nhiên phải giả thuyết rằng
P1(k) và P2(k) trong khoảng thời gian đủ ngắn là không đổi (có nghĩa là đối tượng
gần dừng). Khi đó véc tơ mở rộng có thể viết dưới dạng sau:
y(k+1) = = + (2.18)
Sử dụng thuật toán (2.11) đến (2.16) đánh giá đồng thời thông số và trạng
thái hệ thống với véc tơ trạng thái mở rộng (2.17).
Phương pháp trên chỉ có hiệu quả khi tính phi tuyến thấp.
2.1.2.2 Nhận dạng off-line
Ngược lại với phương pháp on-line, phương pháp nhận dạng off-line sử dụng
đồng thời tất cả các dữ liệu. Nhận dạng off-line sử dụng khi cần thiết sử lý một
32
“mớ” tín hiệu cùng một lúc. Tuy nhiên nhận dạng thông số OFF-LINE có nhược
điểm chung sau đây:
- Mất thông tin do phép rời rạc hóa.
- Khó thể hiện bằng phần cứng trên thực tế.
- Khi số thông số lớn (>3) khó xác định chính xác véc tơ thông số.
- Không sử dụng được khi hệ không dừng.
Xét bài toán nhận dạng off-line mô hình với cấu trúc cho trước như sau
33
 Bài toán nhận dạng thông số off-line:
Quan sát được các véc tơ z(t) bao gồm véc tơ trạng thái với nhiễu tác động
v(t) và đầu vào u(t) như sau:
Z(t)=h[x(t),u(t),v(t),P2(t)] (2.19)
Ở đây P2(t) là các thông số chưa biết của hệ thống.
Véc tơ trạng thái của hệ được mô tả bởi phương trình:
() =  [( ) , ( ) , () , 1 ( ) , ] (2.20)
Trong đó w(t) là véc tơ nhiễu tác động từ bên ngoài. Cần xác định thông số
mô hình đảm bảo cực trị một tiêu chuẩn nhận dạng. Sơ đồ tổng quát có dạng biểu
diễn ở hình 2.3:
Hình 2.3: Sơ đồ tổng quát nhận dạng thông số mô hình

Véc tơ thông số P(t) = [P1(t), P2(t)] có thể chứa các hệ số của phương trình
vi phân, phương trình quan sát và đồng thời có thể có các đặc trưng thống kê của
nhiễu v(t), w(t).
2.1.2.2.1 Phương pháp xấp xỉ vi phân.
Nếu lấy vi phân giá trị các biến tại các thời điểm, thì có thể xây dựng hệ
phương trình tuyến tính được giải bằng các phương pháp bình phương cực tiểu đối
34
với véc tơ cần tìm P. Nếu x(t), x (), u(t) là các hàm đã biết thì phương trình (2.20)
có thể viết dưới dạng:
= (2.21)
Trong đó là ước lượng của được tính theo phương trình mô hình.
Phương pháp bình phương cực tiểu cho kết quả sau:
= [ AT A] -1AT (t) (2.22)
Phương pháp xấp xỉ vi phân thuận tiện nhưng có một số nhược điểm sau:
- Phải có đạo hàm của x(t) theo thời gian.
- Khi có nhiễu tác động thì kết quả nhận được là xấp xỉ trung bình bình
phương đến  () mà không phải là x(t).
- Khi không đo được toàn bộ véc tơ trạng thái thì phương pháp trên không
dùng được.
2.1.2.2.2 Phương pháp Gradient.
Giả thuyết rằng mô hình phi tuyến (2.19) và (2.20) được biểu diễn dưới dạng
rời rạc. Cần xác định véc tở thông số P sao cho x(t) với độ chính xác cho trước phù
hợp với z(t) dưới tác động của điều khiển u(t).
So sánh x(t) với z(t) ta có thể dẫn đến tiêu chuẩn sai số J bao gồm hiệu các
đầu ra của mô hình và đối tượng (hệ thống):
J= (2.23)
35
Trong đó H là hàm và thường được chọn dưới dạng tổng bình phương các
phần véc tơ sai số. Cấu trúc hệ nhận dạng theo phương pháp gradient như hình 2.4.
Hình 2.4: Nhận dạng theo phương pháp gradient

Thuật toán nhận dạng Gradient như sau:
+ Cho các giá trị ban đầu P0.
+ Giải các phương trình sai phân hoặc vi phân và xác định được J.
+ Đồng thời xác định được /
+ Thông tin nhận được về hướng gradient được sử dụng tùy theo từng trường
hợp để xây dựng thuật toán tìm véc tơ thông số P.
Thuật toán gradient lặp đơn giản nhất để xác định thông số P, là phương
pháp hạ nhanh nhất. Hướng của phương pháp hạ nhanh nhất ngược với hướng
gradient và ở điểm ban đầu trùng với hướng trong đó tiêu chuẩn sai số giảm nhanh
nhất được mô tả bằng véc tơ:
]T (2.24)
36
(2.25)
Lưu ý rằng  thường được xấp xỉ như sau:
= (2.26)
Hằng số C trong phương trình (2.25) xác định bước thay đổi véc tơ thông số
theo hướng gradient. Nếu cho C quá lớn thì tiêu chuẩn sai số nhận dạng J thực tế
cũng có thể rất lớn. Ngược lại chọn C quá nhỏ thì tốc độ hội tụ có thể quá chậm. Vì
vậy cần chọn C = C* tối ưu theo nghĩa cực tiểu theo hướng ngược với gradient:
( + C*Δ) =  [J( +  Δ )] (2.27)
Để tìm C* có thể sử dụng các phương pháp tối ưu thông thường.

2.1.2.2.3 Phương pháp tìm kiếm trực tiếp
Phương pháp này không yêu cầu biết trước các giá trị đạo hàm (sai phân)
như các phương pháp gradient và xấp xỉ đạo hàm. Mặc dù phương pháp tìm kiếm
hội tụ chậm hơn so với các phương pháp khác nhưng trên thực tế được sử dụng khá
nhiều do tính đơn giản và dễ sử dụng của nó.
Bản chất của phương pháp dựa trên giả thuyết rằng độ lệch của véc tơ thông
số ở những bước tìm kiếm đúng đắn trước đó có thể dẫn đến những thành công ở
bước sau.
Đầu tiên chọn giá trị ban đầu của véc tơ thông số và tính toán hàm mục tiêu
tìm kiếm J(0). Sau đó tiến hành xem xét (với bước tính toán cho trước) các hướng
37
phù hợp với tất cả các thành phần của véc tơ thông số. Nếu J(k) < J(0) thì chọn lại
giá trị ban đầu mới và dịch chuyển “sơ đồ” tính toán sang tọa độ gốc mới và lặp lại
chu trình tìm kiếm cho tới khi tìm được giá trị cực tiểu J*.
= + (2.28)
là các tọa độ gốc mới và cũ.
2.1.2.2.4 Phương pháp tựa tuyến tính

Phương pháp tựa tuyến tính kết hợp với phương pháp bình phương cực tiểu
có thể nhận dạng véc tơ thông số chính xác hơn khi biết giá trị xấp xỉ của nó.
Giả sử hệ được mô tả bằng phương trình sau:
(t) = f [x, u, P, t], x(0) = x0 (2.29)
Nếu tuyến tính hóa vế phải biểu thức (2.28) qua chuỗi Taylor thì có thể tìm P
đơn giản bằng phương pháp bình phương cực tiểu ở trên. Tuy nhiên cần bổ xung
một hệ phương trình đánh giá thông số cho (2.28) như sau:
i = 0; pi (0) = pi 0 ; i=1, 2,..,m
Như vậy mô hình đánh giá (2.27) được mở rộng với:
xT = [x1, x2,.., x v, p 1, p2,…, pm]
UT = [u 1, u2,..,u v, 0,.. 0]
f T = [f 1(x, u, t), f 2 (x, u, t),…,f v(x, u, t), 0,…,0]
x0 = [x10, x20,…,x v0, p10, p 20,…,pm0]
Ta có thể dung phương pháp xấp xỉ vi phân ở những bước đầu tiên của thuật
toán tựa tuyến tính.
2.1.2.2.5 Phương pháp sử dụng hàm nhạy.
Đây là phương pháp trực giác cho phép xác định thông số tương đối chính
xác. Giả sử hệ có dạng (2.27). Hàm ma trận nhạy của đầu ra hệ thống được xác định
bằng
(2.30)
38
Hoặc:
Kết hợp (2.25) và (2.28) có thể viết:
(2.31)
(2.32)
Lấy tích phân (2.32) nhận được phục vụ cho quá trình nhận dạng.
2.1.2.3 Nhận dạng theo thời gian thực.
Trong phương pháp nhận dạng đệ quy nếu thông số của mô hình có đầy đủ
cho mỗi thời điểm được quan sát theo thời gian thực, gọi là phương pháp nhận dạng
theo thời gian thực. Nó được sử dụng cho nhận dạng thông số hệ thống biến đổi
chậm thời gian. Để xác định thông số (t+1) trên cơ sở N cặp tín hiệu vào-ra, phải
thực hiện liên tiếp thủ tục nhận dạng dữ liệu tín hiệu vào-ra với bậc phù hợp. Thuật
toán có dạng:
(2.33)
Với e(t) là sai lệch tại thời điểm t; Γ() là số phụ thuộc vào đối tượng nhận
dạng tại thời điểm t.

Phương pháp nhận dạng đối tượng theo đặc tính vào-ra, là điểm mạnh về ứng
dụng của mạng nơron. Sử dụng mạng nơron để nhận dạng đối tượng có nhiều ưu
điểm hơn so với phương pháp nhận dạng truyền thống vì:
Mạng nơron là hệ học và thích nghi có khả năng học on-line từ các số liệu
quá khứ, do đó kết quả nhận dạng có thể đạt được độ chính xác rất cao. Mạng nơron
là hệ xử lý song song do đó tốc độ tính toán cao, mà các phương pháp nhận dạng
39
truyền thống khó có thể đạt được. Mặt khác mạng nơron là hệ MIMO (many input
many output), do đó rất tiện dùng khi nhận dạng cho đối tượng nhiều biến. Tóm lại
bản chất “HỌC” mạng nơron có một trong những ứng dụng rất đặc trưng đó là nhận
dạng đối tượng căn cứ vào đặc tính vào-ra của nó.
Luận văn này quan tâm đến điều khiển thích nghi hệ thống, do đó sử dụng
phương pháp nhận dạng quỹ đạo theo thời gian thực, theo đặc điểm vào-ra của đối
tượng.
2.1.3 Mô tả toán học của đối tựợng ở rời rạc
Phương trình không gian trạng thái của đối tượng được biểu diễn ở dạng:
(2.34)
Trong đó:
Tương ứng với hệ có p đầu vào, m đầu ra có bậc n với ui(t) là các đầu vào,
xi(t) là các biến trạng thái và yi(t) là các đầu ra của hệ. véc tơ bậc R nxRpvà
bậc R. Véc tơ x(t) biểu thị trạng thái của hệ thống theo thời gian t và được xác định
tại thời điểm t0<t và đầu vào u được định nghĩa trong khoảng [t0, t]. Đầu ra y(t) là
hàm phụ thuộc trạng thái x(t). Phương trình trạng thái viết ở dạng rời rạc:
( + 1) =  [ () , (  )] ;
 = Ψ ; (2.35)
40
Trong đó: u(.), x(.), y(.) là các biến ở dạng rời rạc. Nếu (2.35) là dạng tuyến
tính ta được:
(  + 1) = ( ) + ( ) ;
 () = ( ) ;
Với A, B, C là các ma trận tương ứng với cấp (nxn), (nxp), (mxn).
* Đối tượng tuyến tính
Cho hệ tuyến tính bất biến thời gian với thông số chưa biết, đối với hệ một
đầu vào, một đầu ra (Single Input, Sing Output – SISO) để điều khiển và quan sát
đối tượng, ma trận A, B và C của đối tượng ở dạng rời rạc được cho ở dạng.
(2.36)
Trong đó i, j là các hằng số chưa biết; m n.
Tín hiệu ra yp(k+1) là tổ hợp tuyến tính của các giá trị quá khứ của cả tín
hiệu đầu vào u(k-j) (j = 0, 1, 2,…, m-1) và tín hiệu đầu ra yp(k-i) (i = 1, 2, …, n)
* Đối tượng phi tuyến
Có 4 dạng đối tượng phi tuyến rời rạc biểu diễn như sau:
- Dạng 1:
(2.37)
41
Hình 2.5: Mô hình dạng 1
yp(k+1) phụ thuộc tuyến tính vào giá trị quá khứ yp(k-1) (i = 0, 1, …, n-1) và
phụ thuộc phi tuyến vào giá trị quá khứ đầu vào u(k),…, u(k-m+1).
- Dạng 2:
(2.38)

Yp(k+1) phụ thuộc tuyến tính vào giá trị quá khứ đầu vào u(k-i)
(i = 0,1,…,m-1), phụ thuộc phi tuyến vào giá trị quá khứ ra yp(k), …, yp(k-
n+1).
- Dạng 3:
Yp(k+1) =f [yp (k),yp (k-1) ,…,yp( k-n+1) , +g[u(k) ,u(k-1) ,…,u(k-m+1) ], (2.39)
42
yp(k+1) phụ thuộc phi tuyến vào các giá trị quá khứ đầu vào u(k),..u(k-m+1),
phụ thuộc phi tuyến vào giá trị quá khứ ra yp(k), yp(k-1),…,yp(k-n+1).
- Dạng 4:
yp (k+1) =f[ yp( k) ,yp(k-1) ,…,yp( k-n+1) ,]+ [u(k) ,u(k-1) ,…,u(k-m+1) ,] ;( 2.40)

yp(k+1) phụ thuộc phi tuyến vào giá trị đầu ra quá khứ và phụ thuộc các giá
trị đầu vào cùng các giá trị quá khứ của nó. Với u(k), yp(k) là các cặp tín hiệu vào-
ra của đối tượng tại thời điểm k; m ≤ n.
Các phi tuyến f(.), g(.) chưa biết của đối tượng, cần được tính toán gần đúng
bởi mạng nơron có độ chính xác mong muốn.
43
Số lượng các lớp, số nơron ở mỗi lớp và các mối liên kết giữa các nơron mỗi
lớp với nhau của mạng nơron nhận dạng được chọn cần phù hợp với độ chính xác
và đặc tính vào-ra của hàm phi tuyến tương ứng của đối tượng đã cho.
2.1.4 Mô hình dùng mạng nơron
2.1.4.1 Mô hình nhận dạng kiểu truyền thẳng (Forward Modelling)
Hình 2.9: Mô hình nhận dạng kiểu truyền thẳng

Mạng nơron nhận dạng nối song song với đối tượng, sai lệch e giữa đầu ra
của đối tượng yp và đầu ra của mạng nơron được sử dụng làm tín hiệu học sửa
trọng số cho mạng nơron (hình 2.9) có dạng sau:
* Mô hình dạng song song
- Với đối tượng tuyến tính:
Trong đó:
là các thông số nhận

dạng của (2.36).
- Với đối tượng phi tuyến
+ Dạng 1:
(2.42)
+ Dạng 2:
44
(2.43)
+ Dạng 3:
(2.44)
+ Dạng 4:
(2.45)
Hình 2.10: Mô hình nhận dạng kiểu song song

Hình 2.10 là mô hình nhận dạng kiểu song song. Ở đây mô hình nhận dạng
đặt song song với mẫu. Việc nhận dạng ở đây là ước lượng các tham số cũng
như các trọng số của mạng nơron sử dụng thuật toán lan truyền ngược động dựa vào
sai lệch e(k) giữa lượng ra của mô hình và lượng ra thực yp(k).
Trong cấu trúc này, vấn đề ổn định của hệ nhận dạng sử dụng mạng nơron
như đã nói chưa đảm bảo chắc chắn và chưa được chứng minh. Vì vậy khi sử dụng
mô hình song song sẽ không đảm bảo chắc chắn rằng các tham số sẽ hội tụ hoặc là
sai lệch đầu ra sẽ tiến tới không.
* Mô hình nối tiếp – song song
- Đối tượng tuyến tính:
+ Dạng 1:
45
(2.47)
+ Dạng 2:
(2.48)
+ Dạng 3:
(2.49)
+ Dạng 4:
(2.50)
Hình 2.11: Mô hình nhận dạng kiểu nối tiếp-song song

Hình 2.11 là mô hình nhận dạng nối tiếp-song song. Nó có nhiều ưu điểm
hơn mô hình song song. Có tốc độ hội tụ cao, từ giả thuyết hệ ổn định BIBO nên tất
cả các tín hiệu của quá trình nhận dạng (như các tín hiệu vào của mạng nơron) cũng
bị giới hạn. Trong mô hình không tồn tại mạch vòng phản hồi, nhưng có thể dung
thuật toán lan truyền ngược để điều chỉnh các tham số của hệ để làm giảm các phép
tính toán. Kết thúc quá trình sẽ dẫn tới sai số đầu ra tiến tới giá trị rất nhỏ, vì vậy 
46
() = . Mô hình nhận dạng nối tiếp-song song có thể thay thế bằng mô hình
song song mà không ảnh hưởng lớn. Mô hình nối tiếp-song song được chú trọng
hơn trong nghiên cứu.
1.4.2 Mô hình ngược trực tiếp (Direct Inverse Modelling)
Tín hiệu ra của đối tượng yp là tín hiệu vào của mạng nơron. Tín hiệu ra
ngược được so sánh với tín hiệu đặt ở đầu vào và sai lệch e được sử dụng là tín hiệu
luyện mạng nơron hình 2.12.
Hình 2.12: Mô hình nhận dạng ngược trực tiếp

2.1.5 Tính gần đúng hàm số dùng mạng nơron.
Theo định lý Weierstrass có thể sử dụng các đa thức trong các sơ đồ khác
nhau để tính toán gần đúng với độ chính xác tùy ý các hàm liên tục.
Đã có một số kết quả về việc sử dụng mạng nơron truyền thẳng nhiều lớp có
một hay nhiều lớp ẩn, với a(,) dạng sigmoid để tính toán gần đúng các hàm liên tục.
Có thể thay thế hàm f(x) liên tục thuộc R n bằng mạng nơron đủ rộng:
(2.51)
Với W, V là véc tơ trọng số của tầng vào và tầng ẩn của mạng nơron.
Sai lệch:
 = ( ) –
47
Định nghĩa 1:
Hàm  gọi là hàm mục tiêu của mạng nơron để mô tả đối tượng f(x) nếu
thỏa mãn điều kiện e = 0 với mọi x thuộc Rn .
- Hàm được gọi là hàm mục tiêu gần đúng của mạng nơron nếu thỏa
mãn điều kiện e ≤ với mọi x thuộc Rn; là sai số cho phép.
Định nghĩa 2:
Các véc tơ N, W, V thuộc Rn được gọi là số nơron và trọng số lý tưởng của
mạng nơron nếu thỏa mãn hàm mục tiêu.
Định lý:
Cho (x) là hàm số đơn điệu, liên tục. Cho S thuộc Rn và  (1,…,  ) là
các giá trị thực trong S. Cho > 0. Sẽ tồn tại các số nguyên dương N và các hằng
số thuộc Rn là: ci, I (i = 1, 2,…,N); wij (i = 1, 2,…,N; j = 1, 2,…,N) sao cho:
(2.52)
Thỏa mãn: f( )|
Mạng (2.52) có 1 lớp ẩn, kết quả tương tự cho mạng nhiều lớp ẩn.
2.1.6 Mô hình mạng nơron trong nhận dạng và điều khiển.
Giả thuyết rằng mạng nơron đủ rộng để có thể biểu diễn hàm số với độ chính
xác cần thiết.
48
Bốn loại mô hình mạng sau đây được dùng để nhận dạng và điều khiển hệ
phi tuyến, trong đó N, N1, N2 là các mạng nơron. W(z) có dạng:
- Khâu trễ d bước:
- Tổng hạn chế trong thời gian
- Hàm hữu tỉ:

+ Mô hình 1 (Hình 2.13):
Tín hiệu ra: y = W(z).v = W(z).N(u)
wij là trọng số; v là tín hiệu ra của mạng N;

Sai lệch: e(t) = y(t) – yd(t)
+ Mô hình 2: (Hình 2.14)
 = 1 = 1(W(). 2 u)
Với mạng N 2 ta có:
wij là trọng số của mạng N1 ;v là tín hiệu vào của mạng N1

y = Nv = N(u + W(z))
49
là tổng các đạo hàm; là các ma trận Jacobian
y = N1v = N1 [N2u +W(z).y];
Mô hình giống như mô hình 2.15 nhưng phía trước có thêm mạng nơron N2
nhưng không làm ảnh hưởng đến sự tính toán xác định các thông số của mạng N 1:
Hình 2.13, 2.14, 2.15, 2.16: Mô hình mạng nơron
50
- Chương 2 đã tóm tắt một số phương pháp ứng dụng mạng nơ ron để nhận
dạng đối tượng. Nổi lên là hai phương pháp nhận dạng on-line và nhận dạng off-
line. Trong đó phương pháp nhận dạng off-line có nhiều ưu điểm, nó có thể sử dụng
đồng thời tất cả các dữ liệu. Nhận dạng off-line sử dụng khi cần thiết phải xử lý rất
nhiều tín hiệu cùng một lúc.
- Sử dụng mạng nơ ron nhận dạng đối tượng có nhiều ưu điểm hơn so với
phương pháp nhận dạng truyền thống. Mạng nơ ron là hệ học và thích nghi có khả
năng học on-line hoặc off-line từ các số liệu quá khứ, do đó kết quả nhận dạng có
thể đạt độ chính xác cao. H ơn nữa mạng nơ ron còn là hệ nhiều đầu vào, do đó rất
tiện dụng khi nhận dạng cho đối tượng nhiều biến.
- Với phương pháp nhận dạng truyền thống, thời gian xử lý chậm, không có
cấu trúc xử lý song song, không có khả năng học và ghi nhớ.
- Mạng nơ ron truyền thẳng nhiều lớp có cấu tạo đơn giản và luật học lan
truyền ngược rất nổi tiếng, nó tương đối dễ thực hiện và có hiệu quả cao phù hợp
với thực hiện quá trình học cho các đối tượng tuyến tính.
51
CHƯƠNG 3: CÁC PHƯƠNG PHÁP ỨNG DỤNG MẠNG NƠRON TRONG
ĐIỀU KHIỂN
3.1 Ứng dụng mạng neural vào điều khiển dự đoán
Có một số biến thể của bộ điều khiển mạng nơron dự đoán được dựa trên mô
hình dự đoán tuyến tính. Mạng lưới nơron điều khiển dự đoán sử dụng một mô hình
mạng của một nhà máy phi tuyến để dự đoán hiệu suất nhà máy trong tương lai. Bộ
điều khiển sau đó tính toán đầu vào điều khiển sẽ tối ưu hóa hiệu suất cây trồng trên
một thời gian định trong tương lai. Bước đầu tiên trong mô hình điều khiển dự
phòng là để xác định mô hình mạng nơron thực vật (hệ thống nhận dạng). Tiếp theo,
các mô hình nhà máy được sử dụng bởi các bộ điều khiển để dự đoán hiệu suất
trong tương lai. Phần tiếp theo mô tả các quá trình nhận dạng hệ thống. Tiếp theo là
một mô tả về quá trình tối ưu và một ứng dụng của điều khiển dự đoán.
3.1.1 Hệ thống nhận dạng
Giai đoạn đầu tiên của mô hình điều khiển dự đoán là để huấn luyện một
mạng nơron để đại diện cho sự phát triển về phía trước của nhà máy. Các lỗi dự báo
giữa sản lượng cây trồng và nơron sản lượng mạng được sử dụng như là các tín hiệu
huấn luyện về mạng nơron. Quá trình này được đại diện bởi hình 2.17.
Hình 3.1: Nhận dạng thực vật

Một mô hình tiêu chuẩn được sử dụng để nhận dạng phi tuyến là bình
Nonlinear tự hồi-Di chuyển (NARMA) mô hình:
52
y( k+d) = h[ y(k), y(k-1 ),…, y(k-n+1 ) ,u(k),u(k-1),…,u(k-m+1)]
Đó là hệ thống đầu vào, đầu ra là các hệ thống và là sự chậm trễ hệ thống (sẽ
sử dụng sự chậm trễ của 1 cho các dự đoán người điều khiển). Đối với giai đoạn xác
định sẽ huấn luyện một mạng lưới nơron để xấp xỉ hàm phi tuyến. Cấu trúc của mô
hình mạng nơron thực vật được đưa ra trong hình 2.18, nơi các khối có nhãn TDL
đang khai thác đường chậm mà lưu trữ trước giá trị của tín hiệu đầu vào. Phương
trình cho mô hình nhà máy được cho bởi
Các chức năng được thực hiện bởi các mạng nơron và là vector chứa tất cả
các trọng mạng.
Hình 3.2: Mô hình mạng nơron thực vật

Mặc dù có sự chậm trễ trong mạng này, họ chỉ xảy ra ở các đầu vào mạng, và
mạng không chứa các vòng lặp thông tin phản hồi. Đối với những lý do này, các mô
hình mạng thần kinh nơron có thể được huấn luyện sử dụng các phương pháp lan
truyền ngược cho các mạng phản hồi. Điều quan trọng là các dữ liệu huấn luyện bao
gồm toàn bộ các nhà máy hoạt động, bởi vì chúng ta biết từ cuộc thảo luận trước mà
mạng nơron phi tuyến không suy chính xác. Các đầu vào cho mạng lưới này là một
vector chiều kết quả đầu ra của nhà máy trước và đầu vào. Nó là không gian này
phải được bao quát đầy đủ của dữ liệu huấn luyện.
53
3.1.2 Mạng dự đoán
Các mô hình phương pháp điều khiển dự đoán dựa trên đường chân trời lùi.
Mô hình mạng nơron dự đoán nhà máy phản ứng trên một đường thời gian quy
định. Các dự đoán được sử dụng bởi một chương trình tối ưu hóa tính toán để xác
định sự kiểm soát tín hiệu là giảm thiểu các tiêu chí chất lượng sau đây trên đường
chân trời quy định.
Ở đây N1, N2, và Nu xác định các chân trời hơn mà lỗi theo dõi và kiểm soát
các lỗi được đánh giá. Các biến là tín hiệu điều khiển dự đoán, được đáp ứng mong
muốn và là phản ứng mô hình mạng. Các giá trị xác định những đóng góp của tổng
các bình phương của các số gia điều khiển có trên các chỉ số hiệu suất. Sơ đồ khối
sau đây minh họa quá trình điều khiển mô hình dự đoán
Bộ điều khiển bao gồm các nhà máy mô hình mạng nơron và các khối tối ưu
hóa. Các khối tối ưu xác định các giá trị của để giảm tối thiểu, và sau đó là tối ưu là
đầu vào cho nhà máy.
Hình 3.3: Mạng nơron điều khiển dự đoán
54
3.1.3 Ứng dụng mạng nơron dự đoán vào hệ thống Magnetic Levitation
Bây giờ chứng minh điều khiển dự đoán bằng cách áp dụng nó cho một vấn
đề thử nghiệm đơn giản. Trong vấn đề kiểm tra này, mục tiêu là để kiểm soát vị trí
của một nam châm treo trên một nam châm điện, nam châm mà là hạn chế để nó chỉ
có thể di chuyển theo hướng thẳng đứng, như thể hiện trong hình 3.4.
Hình 3.4: Hệ thống Magnetic Levitation

Các phương trình chuyển động của nam châm là:
Với y(t) là khoảng cách của nam châm trên các nam châm điện, là dòng điện
chạy trong các nam châm điện, i(t) là khối lượng của nam châm, và M là hằng số
hấp dẫn. Các tham số là hệ số ma sát nhớt được xác định bằng vật liệu mà di chuyển
nam châm, và g là một hằng số lĩnh vực thế mạnh đó được xác định bởi số vòng dây
trên nam châm điện và sức mạnh của nam châm. Đối với mô phỏng, hiện nay được
phép dao động trong khoảng 0-4 amps, và khoảng thời gian lấy mẫu cho các bộ điều
khiển là 0.01 giây. Các giá trị tham số được thiết lập, và M =3.
Β = 12, α = 15, g = 9.9
Bước đầu tiên trong quá trình thiết kế điều khiển là sự phát triển của mô hình
nhà máy. Các màn trình diễn của các bộ điều khiển mạng lưới nơron phụ thuộc rất
nhiều vào độ chính xác của việc xác định nhà máy. Trong phần này chúng ta sẽ bắt
55
đầu với một cuộc thảo luận về một số các thủ tục có thể được sử dụng để dễ nhận
nhà máy chính xác.
Như với hệ thống nhận dạng tuyến tính, chúng ta cần phải đảm bảo rằng các
đầu vào nhà máy là đủ. Đối với hộp đen phi tuyến xác định, chúng ta cũng cần phải
chắc chắn rằng các yếu tố đầu vào và đầu ra hệ thống bao gồm các phạm vi hoạt
động cho các bộ điều khiển sẽ được được áp dụng. Đối với các ứng dụng này, cần
thu thập dữ liệu huấn luyện trong khi áp đầu vào ngẫu nhiên mà bao gồm một loạt
các xung biên độ và thời gian ngẫu nhiên. Thời gian và biên độ của xung phải được
chọn lựa cẩn thận để sản xuất chính xác.
Nếu xác định là nghèo nàn, sau đó hệ thống kiểm soát kết quả có thể thất bại.
Hiệu suất điều khiển có xu hướng thất bại trong cả hai trạng thái ổn định hoạt động,
hoặc hoạt động thoáng qua, hoặc cả hai. Khi hiệu suất trạng thái ổn định là nghèo
nàn, nó rất hữu ích để tăng thời gian của đầu vào xung. Thật không may, trong một
tập dữ liệu huấn luyện, nếu chúng ta có quá nhiều dữ liệu trong điều kiện trạng thái
ổn định, dữ liệu huấn luyện có thể không là đại diện của hành vi thực vật điển hình.
Điều này là do thực tế các tín hiệu đầu vào và đầu ra không bao gồm đầy đủ các khu
vực có nghĩa là sẽ được kiểm soát. Điều này sẽ dẫn đến hiệu suất kém. Chúng ta cần
chọn các dữ liệu huấn luyện, do đó đã tiến hành sản xuất nhiều hơn và hiệu suất
trạng thái ổn định. Ví dụ sau đây sẽ minh họa cho các buổi biểu diễn của các dự
đoán bộ điều khiển khi chúng ta sử dụng các phạm vi khác nhau cho các độ rộng
xung của tín hiệu đầu vào để tạo ra các dữ liệu huấn luyện.
Thấy rằng nó mất khoảng 4,5 giây cho các hệ thống bay lên từ để đạt được
trạng thái ổn định trong điều kiện mở vòng. Vì thế, trước tiên chúng ta xác định một
phạm vi rộng xung của 0.01 <  < 5. Các mô hình mạng thần kinh thực vật được sử
dụng ba giá trị chậm trễ của hiện tại (m=3) Và ba bị trì hoãn các giá trị của vị trí
nam châm (n=3) là đầu vào vào mạng, và 10 tế bào nơron được sử dụng trong các
lớp ẩn. Sau khi huấn luyện mạng lưới với các bộ dữ liệu thể hiện trong hình 2.21,
các kết quả mạng lưới hệ thống nơron điều khiển dự đoán không ổn định.
56
Hình 3.5: Dữ liệu huấn luyện có chiều rộng xung dài.
Dựa trên những phản ứng kém của bộ điều khiển ban đầu, xác định rằng các
dữ liệu huấn luyện không cung cấp bảo hiểm đáng kể. Do đó cần thay đổi phạm vi
của độ rộng xung đầu vào, như thể hiện trong hình 3.5. Từ con số này, chúng ta có
thể nhìn thấy rằng các dữ liệu huấn luyện dày đặc hơn và cung cấp bảo hiểm rộng
của không gian đầu vào mô hình nhà máy hơn so với tập dữ liệu đầu tiên. Sau huấn
luyện các mạng sử dụng tập dữ liệu này, kết quả là hệ thống điều khiển dự đoán ổn
định, mặc dù nó dẫn đến các lỗi lớn.
Hình 3.6: Huấn luyện dữ liệu có độ rộng xung ngắn

Trong thử nghiệm thứ ba, kết hợp độ rộng xung ngắn và chiều rộng xung dài
(trạng thái ổn định) dữ liệu. Các xung dài được tập trung chỉ trong một số phạm vi
của các kết quả đầu ra của nhà máy. Ví dụ chọn để có dữ liệu trạng thái ổn định
trong phạm vi mà những lỗi theo dõi từ các trường hợp trước đây đã lớn. Các tín
hiệu đầu vào và đầu ra được thể hiện trong hình 3.7. Bộ điều khiển kết quả thực
hiện tốt trong cả hai điều kiện trạng thái ổn định.
57
Hình 3.7: Dữ liệu huấn luyện với hỗn hợp độ rộng xung
Các biểu đồ trái cho thấy các tín hiệu tham chiếu và vị trí của nam châm cho
bộ điều khiển dự báo (sử dụng các mạng nơron được huấn luyện với các số liệu thể
hiện trong hình 3.7 và các thông số thiết lập để điều khiển
N2 = 15, NU = 3. = 0.01
Lỗi trạng thái ổn định là rất nhỏ, và việc thực hiện thoáng qua là đủ ở tất cả
các vùng thử nghiệm. Chúng tôi tìm thấy sự ổn định đó là ảnh hưởng mạnh mẽ bởi
việc lựa chọn  . Như chúng ta giảm  , tín hiệu điều khiển có xu hướng thay đổi
đột ngột hơn, tạo ra một sản lượng nhà máy mạnh hơn. Như với tuyến tính điều
khiển dự phòng, khi chúng ta tăng quá nhiều, các hành động kiểm soát là quá mịn
và phản ứng chậm. Các hành động kiểm soát ví dụ này được thể hiện trong đồ thị
dưới bên phải của 3.8.
Hình 3.8: Phản ứng Maglev và hành động kiểm soát bằng cách sử dụng điều khiển
dự đoán
58
3.2 Ứng dụng mạng nơron vào điều khiển thích nghi [1]
Điều khiển thích nghi là tổng hợp các kỹ thuật điều khiển nhằm tự động
chỉnh định các bộ điều chỉnh trong mạch điều khiển nhằm thực hiện hay duy trì ở
một mức độ nhất định, chất lượng của hệ khi thông số của quá trình được điều khiển
không biết trước hay thay đổi theo thời gian. Từ khoảng 40 năm trở lại đây, lý
thuyết điều khiển thích nghi đã thành một môn khoa học, được áp dụng nhiều trong
kỹ thuật làm cải thiện chất lượng, tăng năng suất, hạ giá thành sản phẩm, giảm chi
phí năng lượng…
* Phân loại hệ thích nghi: Căn cứ vào các tiêu chuẩn
- Căn cứ vào đặc tính đối tượng mà phân ra các loại:
+ Hệ cực trị: bản thân đối tượng có đặc tính cực đại hay cực tiểu.
+ Hệ giải tích: cực trị được hình thành một cách gián tiếp.
- Tùy thuộc vào nguồn thông tin về đối tượng mà phân ra các loại:
+ Điều khiển trực tiếp: Điều khiển không thông qua nhận dạng.
+ Điều khiển gián tiếp: Điều khiển thông qua nhận dạng.
- Căn cứ vào có hay không có mô hình mẫu trong hệ thống mà phân ra các
loại: Hệ học; Hệ tự học.
- Căn cứ vào dạng của mạch thích nghi mà phân ra các loại: Hệ có mạch
thích nghi hở; Hệ có mạch thích nghi kín.
- Căn cứ vào độ phức tạp của mạch tự chỉnh mà phân ra các loại:
+ Hệ tự chỉnh: Mạch tự chỉnh chỉ thay đổi thông số.
+ Hệ tự tổ chức: Mạch tự chỉnh thay đổi cả thông số và cấu trúc.
Ngoài ra còn có nhiều tiêu chuẩn phân loại khác.
Các mạng nơron điều khiển được mô tả trong phần này được gọi bằng hai tên
khác nhau: điều khiển tuyến tính phản hồi và kiểm soát NARMA-L2. Nó được gọi
là phản hồi tuyến tính khi model máy có một hình thức đặc biệt (hình thức đồng).
Nó được gọi là kiểm soát NARMA-L2 khi các mô hình nhà máy có thể được xấp xỉ
bởi các hình thức tương tự. Ý tưởng trung tâm của loại điều khiển này là để biến đổi
động lực học phi tuyến vào hệ thống động lực tuyến tính bằng cách hủy bỏ các phi
59
tuyến. Phần này bắt đầu bằng cách trình bày các mô hình hệ thống biểu mẫu đồng
hành và cho thấy làm thế nào bạn có thể sử dụng một mạng lưới thần kinh để xác
định mô hình này. Sau đó, nó mô tả cách các mô hình mạng thần kinh được xác
định có thể được sử dụng để phát triển một bộ điều khiển. Tiếp theo là một ví dụ về
cách sử dụng các khối điều khiển NARMA-L2.
3.2.1 Xác định các Model NARMA-L2 [2]
Như với mô hình điều khiển dự đoán, bước đầu tiên trong việc sử dụng tuyến
tính hóa điều khiển phản hồi (hoặc NARMA-L2) là để xác định các hệ thống được
kiểm soát. Cần đào tạo một mạng lưới nơron để đại diện cho sự phát triển về phía
trước của hệ thống. Bước đầu tiên là chọn một cấu trúc mô hình để sử dụng. Một
mô hình chuẩn được sử dụng để đại diện cho các hệ thống phi tuyến tổng quát thời
gian rời rạc là (NARMA) mô hình tự hồi quy trung bình chuyển động phi tuyến:
y (k + d) = N [y (k), y (k - 1), ..., y (k - n + 1), u (k), u (k - 1), ..., u (k - n + 1)]
Điều kiện u (k) là hệ thống đầu vào, và y (k) là đầu ra của hệ thống. Đối với
giai đoạn nhận dạng, bạn có thể đào tạo một mạng lưới nơron để xấp xỉ hàm phi
tuyến N. Đây là thủ tục nhận dạng sử dụng cho mạng nơron dự đoán
Nếu bạn muốn đầu ra hệ thống làm theo một số quỹ đạo tham khảo y (k +
d) = y r (k + d), bước tiếp theo là phát triển một bộ điều khiển phi tuyến có dạng:
u (k) = G [y (k), y (k - 1), ..., y (k - n + 1), yr (k + d), u (k - 1), ..., u (k - m + 1)]
Vấn đề với việc sử dụng bộ điều khiển này là nếu muốn huấn luyện một
mạng lưới thần kinh để tạo ra các chức năng G để giảm thiểu lỗi bình phương trung
bình, cần phải sử dụng lan truyền ngược động ([NaPa91] hoặc [HaJe99]). Điều này
có thể khá chậm. Một giải pháp, bởi Narendra và Mukhopadhyay [đề xuất năm
1997], là sử dụng mô hình gần đúng để đại diện cho hệ thống. Bộ điều khiển được
sử dụng trong phần này dựa trên mô hình gần đúng NARMA-L2:
Y(k + d) = f [y (k), y (k - 1), ..., y (k - n + 1), u (k - 1), ..., u (k - m + 1) ] +
G[y (k), y (k - 1), ..., y (k - n + 1), u (k - 1), ..., u (k - m + 1)] ⋅ u (k)
60
Mô hình này là hình thức đồng hành, mà điều khiển đầu vào tiếp theo u (k)
không được chứa bên trong các phi tuyến. Ưu điểm của hình thức này có thể giải
quyết cho các đầu vào điều khiển là nguyên nhân gây ra hệ thống để thực hiện theo
các tài liệu tham khảo y (k + d) = y r (k + d). Bộ điều khiển kết quả sẽ có các hình
thức:
Sử dụng phương trình này có thể trực tiếp gây ra các vấn đề thực hiện, bởi vì
phải xác định các đầu vào điều khiển u (k) dựa trên đầu ra tại cùng một thời gian, y
(k). Vì vậy, thay vào đó, sử dụng các mô hình:
y (k + d) = f [y (k), y (k - 1), ..., y (k - n + 1), u (k), u (k - 1), ..., u (k - n +
1)]+ G [y (k), ..., y (k - n + 1), u (k), ..., u (k - n + 1)] ⋅ u (k + 1)
Điều kiện d ≥ 2. Hình dưới đây cho thấy cấu trúc của một đại diện mạng lưới
thần kinh.
61
Hình 3.9: Cấu trúc một mạng nơron
Sử dụng mô hình NARMA-L2, bạn có thể có được bộ điều khiển
Đó là có thể thực hiện cho d ≥ 2. Hình dưới đây là một sơ đồ khối của bộ
điều khiển NARMA-L2.
Hình 3.10: Sơ đồ khối của bộ điều khiển NARMA-L2

Đây là bộ điều khiển có thể thực hiện với mô hình nhận dạng NARMA-L2,
62
như trong hìnhsau.
Hình 3.11: Bộ điều khiển thực hiện với mô hình nhận dạng NARMA-L2
3.2.2 Sử dụng các khối điều khiển NARMA-L2 [2]
Phần này cho thấy cách điều khiển NARMA-L2 được huấn luyện. Bước đầu
tiên là để sao chép các khối NARMA-L2 khiển từ thư viện khối mạng nơron cho
Simulink ® Editor. Bước này được bỏ qua trong các ví dụ sau đây.
Một mô hình ví dụ được cung cấp với các phần mềm Neural Network
Toolbox cho thấy việc sử dụng các bộ điều khiển NARMA-L2. Trong ví dụ này,
mục tiêu là để kiểm soát vị trí của một nam châm treo trên một nam châm điện, nam
châm mà là hạn chế để nó chỉ có thể di chuyển theo hướng thẳng đứng, như trong
hình dưới đây
63
Hình 3.12: Sơ đồ điều khiển vị trí nam châm vĩnh cửu
Các phương trình của chuyển động cho hệ thống này:
Điều kiện y (t) là khoảng cách của nam châm trên các nam châm điện, i (t) là
dòng chảy trong các nam châm điện, M là khối lượng của nam châm, và g là hằng
số hấp dẫn. Các β tham số là hệ số ma sát nhớt được xác định bằng các vật liệu mà
di chuyển nam châm, và α là một hằng số lĩnh vực thế mạnh đó được xác định bởi
số vòng dây trên nam châm điện và sức mạnh của nam châm.
Để chạy ví dụ này:
- Bắt đầu MATLAB ®.
- Gõ narmamaglev trong cửa sổ MATLAB Command. Lệnh này sẽ mở ra các
Simulink biên soạn với các mô hình sau đây. Khối NARMA-L2 kiểm soát là đã có
trong mô hình.
64
Hình 3.13: Các Simulink biên soạn với các mô hình
- Nhấn 2 lần vào khối NARMA-L2. Điều này sẽ mở ra cửa sổ sau. Cửa sổ
này cho phép bạn để đào tạo các mô hình NARMA-L2. Không có cửa sổ riêng biệt
cho bộ điều khiển, bởi vì bộ điều khiển được xác định trực tiếp từ mô hình, không
giống như các bộ điều khiển mô hình dự đoán.
Hình 3.14: Cửa sổ cho phép tạo mô hình NARMA-L2
65
- Cửa sổ này hoạt động giống như các cửa sổ nhận dạng thực vật khác, vì vậy
quá trình đào tạo không được lặp đi lặp lại. Thay vào đó, mô phỏng các điều khiển
NARMA-L2.
- Quay trở lại Simulink Editor và khởi động mô phỏng bằng cách chọn tùy
chọn danh mục Simulation> Run. Khi chạy mô phỏng, sản lượng cây trồng và các
tín hiệu tham chiếu được hiển thị, như trong hình dưới đây.
Hình 3.15: Đồ thị vị trí mẫu và vị trí sau khi đã điều khiển
3.2.3 Kết quả thực nghiệm trên MATLAB [3]
3.2.3.1 Số liệu
Chọn động cơ một chiều kích từ độc lập có số liệu như sau: Pđm = 32(KW),
Uđm = 220(V), Iđm = 170(A), wđm = 1500(v/ph), Rư∑ = 0,0779(Ω),
Lư∑ =0,0049(H),
GD2 = 2,8(kgm2), làm việc với phụ tải Mc(Nm)và J(Kgm 2) thay đổi trong
vùngphụ tải nhỏ. Máy phát tốc mã hiệu 7-100 có U đm =1500(V/P), U đm=100(V),
Iđm =0,08(A),
RH=200(Ω). Máy biến dòng loại 100/5(A). Bộ chỉnh lưu sơ đồ cầu bapha.
66
3.2.3.1.1 Kết quả mô phỏng khi có tải thay đổi
Dựa trên những mô tả động lực học của động cơ điện một chiều và số liệu trên
ta tính toán được thông số của đối tượng và tổng hợp trong sơ đồ khối sau và được
ghi vào phai có tên “doituong”.
Hình 2.16: Sơ đồ khối mô tả động cơ điện một chiều

Từ đó tiến hành nhận dạng và huấn luyện đối tượng thông qua bộ điều khiển
NARMA-L2 như trong hình3.17
Hình 3.17: Sơ đồ mạng nơron truyền thẳng nhiều lớp điều khiển thích nghi vị trí
động cơ điện một chiều khi có tải thay đổi
67
Ở bảng điều khiển nhận dạng tín hiệu trên có thể điều chỉnh các thông số giá
trị cần thiết lập trong động cơ một chiều NARMA – L2. Sau khi thiết lập các giá trị
như trên hình thì ta được sơ đồ tín hiệu điện đầu vào và đầu ra trong động cơ như
hình 3.19
Hình 3.19: Dữ liệu vào ra của tín hiệu vị trí động cơ một chiều
Với dữ liệu đầu vào và đầu ra của tín hiệu vị trí động cơ một chiều thì người
dùng cũng có thể xuất dữ liệu làm việc bằng cách chọn Export Data.
68
Hình 3.20: Xuất dữ liệu làm việc
Nếu người dùng đã có sẵn dữ liệu thì có thể chọn Import Data để chọn file dữ
liệu (hình 3.21)
Hình 3.21: Nhập dữ liệu vào bộ điều khiển
69
Hình 3.22: Huấn luyện đối tượng với dư liệu đã nhập vào
Hình 3.23: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2
70
Hình 3.24: Dữ liệu xác nhận cho bộ điều khiển NN NARMA-L2
Qua mô phỏng được thể hiện bởi hình 3.23 và 3.24 có thể nhận thấy rằng, dữ
liệu huấn luyện ban đầu khá dày đặc và đồ thị không đều. Qua quá trình huấn luyện,
thu được dữ liệu xác nhận đã thoáng hơn và loại bỏ những đối tượng dư thừa, đồng
thời đồ thì đều hơn.
Hình 3.25: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2
71
Hình 3.26: Đồ thị vị trí mẫu qd
(nét mảnh) và vị trí sau khi đã điều khiển q (nét đậm)
Sau khi dữ liệu đầu vào được điều khiển qua mạng nơron đã có các giá trị
trải đều hơn trên đồ thị. Sau đây là đồ thị điện áp điều khiển và đồ thị mômen tải
MC (Nm)
Hình 3.27: Đồ thị điện áp điều khiển
72
Hình 3.28: Đồ thị mômen tải MC (Nm)
3.2.2.3 Kết quả mô phỏng khi có thông số và sự thay đổi
Động cơ điện một chiều khi làm việc với tải thay đổi, làm dòng điện phần
ứng thay đổi theo yêu cầu của tải, dẫn đến nhiệt độ động cơ và mức độ từ hóa của
lõi thép thay đổi, do đó làm cho điện trở phần ứng R, điện cảm L của động cơ thay
đổi theo. Từ đó một vấn đề đặt ra là cần có một giải pháp nào đó để tạo ra một bộ
điều chỉnh thông minh có khả năng điều chỉnh thích nghi vị trí của động cơ điện
một chiều khi làm việc với tải và các thông số điện trở phần ứng R và điện cảm L
thay đổi. Trong báo cáo này nghiên cứu bộ điều khiển thích nghi vị trí động cơ một
chiều khi có điện trở phần ứng R và mômen tải MC thayđổi.
73
Hình 3.29: Sơ đồ khối mô tả động cơ điện một chiều khi có R, MC thay đổi
Khi có sự thay đổi về đầu vào ra (Hình 3.30) và cách thiết lập các thông số
sẽ có những thay đổi ở Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2,
Dữ liệu xác nhận cho bộ điều khiển NN NARMA-L2, Dữ liệu kiểm tra cho bộ
điều khiển NN NARMA-L2, Đồ thị điện áp điều chỉnh u, Đồ thị điện trở R,….
Với giá trị mới được thay đổi, quan sát sự khác nhau với lần mô phỏng đầu tiên
qua các hình.
74
Hình 3.30: Dữ liệu vào ra của tín hiệu vị trí động cơ một chiều
75
Hình 3.32: Huấn luyện đối tượng với dư liệu đã nhập vào
Hình 3.33: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2
76
Hình 3.34: Dữ liệu xác nhận cho bộ điều khiển NN NARMA-L2
Hình 3.35: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2
Hình 3.36: Đồ thị điện áp điều chỉnh u
77
Hình 3.37: Đồ thị điện trở R
Hình 3.38: Đồ thị mômen tải MC (Nm)
78
Hình 3.39: Đồ thị vị trí mẫu qd (nét mảnh) và vị trí sau khi đã điều khiển q
(nét đậm)
3.3 Mạng nơron trong điều khiển phản hồi [4]
Trong phần này, mục tiêu là để thiết kế một bộ điều khiển mạng nơron phản
hồi tạo nên một hệ thống robot để làm theo, hoặc theo dõi, một quỹ đạo theo quy
định hoặc đường dẫn. Sự năng động của robot là chưa biết, và có thể rối loạn. Tính
năng động của một n Robot tay máy có thể được diễn tả như [Lewis, Dawson,
Abdallah 2004]
Với NQ (t) ∈R vector biến chung, M (q) là một ma trận quán tính, Vm một
ma trận hướng tâm, G (q) một vector trọng lực, và F (.) đại diện cho điều kiện ma
sát. Giáp rối loạn không rõ và lỗi mô hình được ký hiệu là d τ và mô-men xoắn điều
khiển đầu vào là τ (t).
79
Với một quỹ đạo mong muốn cánh tay n qd (t) ∈ R xác định các lỗi theo dõi e
(t) q (t) q (t) = d - và các lọc lỗi theo dõi r = e & + Λe, nơi Λ = Λ> 0 T. Một chế độ đa
dạng trượt được xác định bởi r (t) = 0. Bộ điều khiển theo dõi mạng nơron được thiết
kế sử dụng một cách tiếp cận thông tin phản hồi tuyến tính để đảm bảo rằng r (t) là
buộc vào một khu vực đa dạng này. Xác định các chức năng Robot phi tuyến.
Với x vector được biết đến (t) của tín hiệu đo phù hợp quy định tại các điều
khoản của e (t), q d (t). Các đầu vào vector x của mạng nơron có thể được lựa chọn,
ví dụ như:
3.3.1 Phản hồi tuyến tính của hệ thống phi tuyến dùng mạng nơron
Nhiều hệ thống quan tâm trong công nghiệp, hàng không vũ trụ, và các ứng
dụng DoD ở dạng x = f (x) + g (x) u + d, với d (t) là một rối loạn bị chặn không rõ,
và các chức năng phi tuyến f (x) chưa biết, và g (x) không rõ, nhưng bị chặn dưới
bởi một giá trị tích cực được biết đến. Sử dụng phi tuyến ổn định kỹ thuật chứng
minh như những vấn đề ở trên, người ta có thể thiết kế một đầu vào điều khiển của
biểu mẫu:
Rằng có hai phần, một phần phản hồi tuyến tính uc (t), cộng với một phần ur
(t). Bây giờ, hai mạng nơron được yêu cầu để sản xuất hai ước tính f^ (x), f^(g) của
các chức năng chưa biết.
Bộ điều khiển này được hiển thị trong hình 3.38. Khối lượng cập nhật mạng
nơron cho f(x) được đưa ra chính xác như trong (hình 3.38). Để điều chỉnh g của
mạng nơron, một công thức tương tự (hình 3.38) là cần thiết, nhưng nó phải được
80
sửa đổi để đảm bảo rằng đầu ra g (x) của mạng nơron thứ hai được bảo đảm đi từ số
không, để giữ sự kiểm soát u (t) hữu hạn.
Hình 3.40: Phản hồi tuyến tính điều khiển mạng nơron
3.3.2 Ứng dụng mạng nơron trong mạng phản hồi
Hầu hết các bộ điều khiển phản hồi hiện nay được thực hiện trên máy tính kỹ
thuật số. Điều này đòi hỏi các đặc điểm kỹ thuật của thuật toán điều khiển trong thời
gian rời rạc hoặc dạng kỹ thuật số [Lewis 1992]. Để thiết kế bộ điều khiển như vậy,
một thể xem xét các động thái thời gian rời rạc x (k + 1) = f (x (k)) + g (x (k)) u (k),
với hàm f (.) và g (.). Bộ điều khiển kỹ thuật số có nguồn gốc mạng nơron trong tình
huống này vẫn còn có những hình thức của thông tin phản hồi bộ điều khiển tuyến
tính thể hiện trong hình 2.57.
Người ta có thể điều chỉnh được thuật toán, cho một thời gian rời rạc điều
khiển mạng lưới nơron với N lớp, mà hệ thống bảo đảm sự ổn định và vững mạnh
[Lewis, Jagannathan, và Yesildirek 1999]. Đối với các lớp thứ thì các bản cập nhật
trọng lượng có dạng:
Điều kiện là các chức năng đầu ra của lớp i, 0 <Γ <1 là một tham số thiết kế, và
Với r (k) là một lỗi tìm được. Thuật toán điều chỉnh này có hai phần: Hai
điều kiện đầu tiên tương ứng với một thuật toán Gradient thường được sử dụng
81
trong mạng nơron. Thời hạn cuối cùng là một thuật ngữ robustifying thời gian rời
rạc mà đảm bảo rằng các trọng số trong mạng nơron vẫn bị chặn.
- Dựa trên kết quả nghiên cứu của các tài liệu, luận văn đã đi sâu phân tích được
sự đúng đắn của việc sử dụng khối điều khiển NARMA-L2 với luật học thích nghi tạo ra
tín hiệu điều khiển để đạt được sai lệch trung bình bình phương trong giới hạn cho phép.
Nghĩa là tín hiệu ra của đối tượng bám sát theo tín hiệu điều khiển vị trí của sơ đồ điều
khiển thích nghi vị trí động cơ điện một chiều khi có thông số và tải thay đổi.
TỔNG KẾT
Báo cáo đã trình bày một số khái niệm cơ bản về mạng nơron nhân tạo, một
hệ thống hoạt động dựa trên sự bắt chước não người, tuy nhiên, nó có hoạt động
đơn giản hơn rất nhiều so với não người. Điểm nỗi bật của mạng nơron nhân tạo là
khả năng học và nhớ.
Trong báo cáo còn nghiên cứu tìm hiểu một số phương pháp ứng dụng mạng
nơron để nhận dạng đối tượng. Tìm hiểu sâu hơn về ứng dụng mạng nowrron trong
điều khiển thích nghi (Adaptive) và điều khiển dự đoán (predictive), điều khiển
phản hồi (feeedback). Ngoài ra, mô phỏng một số kết quả thực tế.
Qua quá trình học tập và nghiên cứu về mạng nơron nhân tạo và ứng dụng
của nó trong tự động hóa em đã tiếp thu thêm được một lượng kiến thức quý báu
cho bản thân. Tuy nhiên dù bản thân đã hết sức cố gắng nhưng do thời gian nghiên
cứu, trình độ năng lực, kinh nghiệm thực tiễn còn nhiều hạn chế nên bài tập này khó
tránh khỏi những sai sót. Kính mong được sự giúp đỡ, chỉ bảo của thầy giáo và các
bạn để bài tập được hoàn thiện hơn.
82
TÀI LIỆU THAM KHẢO
Tiếng Việt
[1]. Phạm Hữu Đức Dục, (1999), Nghiên cứu ứng dụng mạng nơ ron trong
điều khiển thích nghi hệ thống có thông số biến thiên, Luận án Tiến sĩ Kỹ thuật.
[2].Phạm Hữu Đức Dục, Nguyễn Công Hiền, (2005), Ứng dụng của bộ điều
khiển nơ ron mờ trong điều khiển thích nghi vị trí động cơ điện một chiều, Tuyển
tập các báo cáo Khoa học tại hội nghị Toàn quốc lần thứ VI về tự động hóa, 101-
106.
[3]. Phạm Hữu Đức Dục, Nguyễn Công Hiền, (2005), Nghiên cứ ứng dụng
mạng nơ ron mờ điều khiển thích nghi rôbốt hai khâu, Tuyển tập các báo cáo Khoa
học tại hội nghị Toàn quốc lần thứ VI về tự động hóa, 107-112.
[4]. Bùi Quốc Khánh, Nguyễn Văn Liễn, Phạm Quốc Hải, Dương Văn Nghi,
(2008), Điều chỉnh tự động truyền động điện, Nhà xuất bản Khoa học và kỹ thuật.
[5]. Nguyễn Doãn Phước, Phan Xuân Minh, Nhận dạng hệ thống điều khiển.
Nhà xuất bản Khoa học và kỹ thuật, Hà Nội 2001.
Tiếng Anh
[6]. M.Norgaard, O.Ravn, N.K. Poulsen and L.K. Hansen. Neural Network
for Modelling and Control of Dynamic System. Springer 2000.
[7].http://www.mathworks.com/help/nnet/ug/design-narma-l2-neural-
controller-in-simulink.html. Lần truy cập cuối: 01/04/2016.
83

Mạng Neural Và Ứng Dụng Trong Điều Khiển Tự Động

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Mạng Neural Và Ứng Dụng Trong Điều Khiển Tự Động

Uploaded by

Copyright:

Available Formats

1

LỜI CAM ĐOAN

Hình 1.2: Nơron nhân tạo

tín hiệu đầu ra của nơron.

1.3 Mô hình mạng nơron

Hình 1.3: Mạng tự kết hợp

Hình 1.5: Mạng truyền thẳng

Hình 1.7: Perceptron

Hình 1.8: Mạng MLP tổng quát

1.4. Kết luận chương 1

Hình 2.2: Quy trình nhận dạng hệ thống

- Là bộ phận chính của hệ thống thích nghi.

(k) = +K(k)[x(k-1) – ϕ(k) (k - 1)] (2.3)

P(k) = [1 – K(k)ϕ (k)]P(k - 1) (2.5)

cho kết quả lọc:

+ k(k+1){z(k+1) – h[ (k + )], u(k + 1), P 2(k), k+1]} (2.12)

() =  [( ) , ( ) , () , 1 ( ) , ] (2.20)

Hình 2.3: Sơ đồ tổng quát nhận dạng thông số mô hình

có thể viết dưới dạng:

phương đến  () mà không phải là x(t).

Hình 2.4: Nhận dạng theo phương pháp gradient

+ Đồng thời xác định được /

Lưu ý rằng  thường được xấp xỉ như sau:

( + C*Δ) =  [J( +  Δ )] (2.27)

Để tìm C* có thể sử dụng các phương pháp tối ưu thông thường.

là các tọa độ gốc mới và cũ.

2.1.2.2.4 Phương pháp tựa tuyến tính

Kết hợp (2.25) và (2.28) có thể viết:

dạng tại thời điểm t.

Hình 2.6: Mô hình dạng 2

Hình 2.8: Mô hình dạng 4

Hình 2.9: Mô hình nhận dạng kiểu truyền thẳng

là các thông số nhận

Hình 2.10: Mô hình nhận dạng kiểu song song

Hình 2.11: Mô hình nhận dạng kiểu nối tiếp-song song

Hình 2.12: Mô hình nhận dạng ngược trực tiếp

thỏa mãn điều kiện e = 0 với mọi x thuộc Rn .

- Tổng hạn chế trong thời gian

- Hàm hữu tỉ:

wij là trọng số; v là tín hiệu ra của mạng N;

Với mạng N 2 ta có:

wij là trọng số của mạng N1 ;v là tín hiệu vào của mạng N1

+ Mô hình 3 (Hình 2.15):

Hình 2.13, 2.14, 2.15, 2.16: Mô hình mạng nơron

Hình 3.1: Nhận dạng thực vật

Hình 3.2: Mô hình mạng nơron thực vật

Hình 3.3: Mạng nơron điều khiển dự đoán

Hình 3.4: Hệ thống Magnetic Levitation

Hình 3.6: Huấn luyện dữ liệu có độ rộng xung ngắn

G[y (k), y (k - 1), ..., y (k - n + 1), u (k - 1), ..., u (k - m + 1)] ⋅ u (k)

1)]+ G [y (k), ..., y (k - n + 1), u (k), ..., u (k - n + 1)] ⋅ u (k + 1)

Hình 3.10: Sơ đồ khối của bộ điều khiển NARMA-L2

Hình 3.14: Cửa sổ cho phép tạo mô hình NARMA-L2

Hình 2.16: Sơ đồ khối mô tả động cơ điện một chiều

Hình 3.21: Nhập dữ liệu vào bộ điều khiển

Hình 3.23: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2

Hình 3.25: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2

Hình 3.27: Đồ thị điện áp điều khiển

Hình 3.33: Dữ liệu huấn luyện cho bộ điều khiển NN NARMA-L2

Hình 3.35: Dữ liệu kiểm tra cho bộ điều khiển NN NARMA-L2

Hình 3.36: Đồ thị điện áp điều chỉnh u

Hình 3.38: Đồ thị mômen tải MC (Nm)

You might also like