You are on page 1of 3

Mạng neural nhân tạo:

Mạng neural nhân tạo hay thường gọi ngắn gọn là mạng neural (tiếng Anh là
Artificial Neural network - ANN hay Neural Network) là một mô hình toán
học hay mô hình tính toán được xây dựng dựa trên các mạng neural sinh học. Nó gồm
có một nhóm các neural nhân tạo (nút) nối với nhau, và xử lý thông tin bằng cách
truyền theo các kết nối và tính giá trị mới tại các nút (cách tiếp cận connectionism đối
với tính toán). Trong nhiều trường hợp, mạng neural nhân tạo là một hệ thống thích
ứng (adaptive system) tự thay đổi cấu trúc của mình dựa trên các thông tin bên ngoài
hay bên trong chảy qua mạng trong quá trình học.
Trong thực tế sử dụng, nhiều mạng neural là các công cụ mô hình hóa dữ liệu thống
kê phi tuyến. Chúng có thể được dùng để mô hình hóa các mối quan hệ phức tạp giữa
dữ liệu vào và kết quả hoặc để tìm kiếm các dạng/mẫu trong dữ liệu.
Lợi thế lớn nhất của mạng neural nhân tạo là khả năng được sử dụng như một cơ chế
xấp xỉ hàm tùy ý mà 'học' được từ các dữ liệu quan sát. Tuy nhiên, sử dụng chúng
không đơn giản như vậy, và một sự hiểu biết tương đối tốt về các lý thuyết cơ bản là
điều cần thiết.

 Chọn mô hình: điều này sẽ phụ thuộc vào cách trình bày dữ liệu và các ứng
dụng. Mô hình quá phức tạp có xu hướng dẫn đến những thách thức trong việc
học.
 Thuật toán học: có rất nhiều sự thỏa thận giữa các thuật toán học. Hầu hết các
thuật toán sẽ làm việc tốt với các siêu tham số (hyperparameter) đúng để huấn
luyện trên một tập hợp dữ liệu cố định cụ thể. Tuy nhiên, việc lựa chọn và điều
chỉnh một thuật toán để huấn luyện trên dữ liệu không nhìn thấy yêu cầu một số
lượng đáng kể các thử nghiệm.
 Mạnh mẽ: nếu các mô hình, hàm chi phí và thuật toán học được lựa chọn một
cách thích hợp, thì ANN sẽ cho kết quả có thể vô cùng mạnh mẽ
Mạng neural tích chập

Mạng nơron tích chập (còn gọi là ConvNet / CNN) là một thuật toán Deep Learning
có thể lấy hình ảnh đầu vào, gán độ quan trọng (các trọng số - weights và độ lệch -
bias có thể học được) cho các đặc trưng/đối tượng khác nhau trong hình ảnh và có thể
phân biệt được từng đặc trưng/đối tượng này với nhau.

Phương pháp nơron tích chập có năng lực để hiểu được các mức độ phụ thuộc
không gian và tạm thời giữa các pixel trong dữ liệu ảnh thông qua các bộ lọc ứng
dụng đặc trưng. Kiến trúc này có hiệu suất tốt hơn cho tập dữ liệu dạng hình ảnh do
làm giảm được số lượng tham số liên quan và khả năng tái sử dụng (reusability) các
trọng số. Nói cách khác, mô hình mạng nơron tích chập có thể được huấn luyện để
hiểu được sự tinh tế của hình ảnh tốt hơn các mô hình khác.

Bài toán nhận diện vật thể


Là bài toán thị giác máy tính nhằm phát hiện các đối tượng của một lớp đối tượng
nhất định ( chẳng hạn con người, tòa nhà, ô tô,…) trong hình ảnh và các video.

Các phương pháp nhận diện đối tượng thường sử dụng các phương pháp mạng nơ ron
tích chập được huấn luyện nhằm thực hiện một số tác vụ cụ thể. Các mạng neural
thường được sử dụng trong bài toán nhận diện vật thể:

 You Only Look One ( YOLO)


 Retina-Net
 Deformable convolutional networks
 R-CNN, Fast R-CNN, Faster R-CNN

Trong bài nghiên cứu này chúng tôi sẽ sử dụng phương pháp Faster R-CNN để nhận
diện được người trong hình ảnh trích xuất từ camera, ưu điểm của phương pháp là tốc
độ xử lý nhanh, phù hợp với tác vụ nhận diện yêu cầu tốc độ xử lý thời gian thực

You might also like