You are on page 1of 19

TRÍ TUỆ NHÂN TẠO

TRONG BOBOT
NHẬN DIỆN, PHÂN LOẠI RÁC
SINH HOẠT
Môn học : Trí tuệ nhân tạo trong robot
GVHD : TS. Nguyễn Xuân Thuận
TS. Hoàng Hồng Hải

Sinh viên thực hiện


Nguyễn Quang Sáng - 20184600
Vương Sỹ Phúc - 20184579
1. Lý do chọn đề tài:

• Phân loại rác ở Việt Nam chưa được chú trọng.

3
2. Mục tiêu:
• Hoàn thành đề tài.
• Nhận biết và phân loại được các sản phẩm rác như: đồ
nhựa, chai lọ thủy tinh, pin và rác hữu cơ,….

4
3.Cơ sở lý thuyết mạng
• Về Google Colab:

Google Colab (Google Colaboratory) là trang web online  cho hỗ trợ chạy code Python
trực tiếp thông qua trình duyệt , phù hợp với Data analysis (phân tích dữ liệu),
machine learning (máy học) và giáo dục.
Không đòi hỏi cấu hình máy tính mà sử dụng tài nguyên máy tính từ các hệ thống sẵn có
(CPU, GPUs, TPUs)

5
3.Cơ sở lý thuyết mạng
• Về mạng nơ ron tích chập (CNN- Convolution Neural Network)

- Giới thiệu:
+Trong mạng neural, mô hình mạng neural tích chập (CNN) là 1 trong những mô
hình để nhận dạng và phân loại hình ảnh. 

+CNN phân loại hình ảnh bằng cách lấy 1 hình ảnh đầu vào, xử lý và phân loại nó theo
các hạng mục nhất định.
Máy tính coi hình ảnh đầu vào là 1 mảng pixel ,dựa trên độ phân giải hình ảnh, máy
tính sẽ thấy H x W x D (H: Chiều cao, W: Chiều rộng, D: Độ dày)

Mảng ma trận RGB 6x6x3 (3 -giá trị RGB)

6
3.Cơ sở lý thuyết mạng

+Mô hình CNN để training và kiểm tra, mỗi hình ảnh đầu vào sẽ chuyển nó qua 1 loạt các
lớp tích chập với các bộ lọc (Kernals), tổng hợp lại các lớp được kết nối đầy đủ (Full
Connected) và áp dụng hàm Softmax để phân loại đối tượng có giá trị xác suất giữa 0 và 1

 Luồng CNN để xử lý hình ảnh đầu vào và phân loại các đối tượng dựa trên giá trị

7
3.Cơ sở lý thuyết mạng
-Lớp tích chập (Convolution Layer)

Mỗi nơ ron tích chập(filter/kernel) chỉ kết nối cục bộ với dữ liệu đầu vào, là lớp đầu tiên
để trích xuất các tính năng từ hình ảnh đầu vào Chiều sâu của nơ-ron tích chập bằng
chiều sâu của khối dữ liệu đầu vào

Nơ ron tích chập trượt từ trái sang phải, từ trên xuống dưới khối dữ liệu đầu vào và tính
toán để sinh ra một bản đồ kích hoạt ( activation map )

8
3.Cơ sở lý thuyết mạng

-Bước nhảy ( Stride )

Stride là số pixel thay đổi trên ma trận đầu vào. Khi stride là 1 thì ta di chuyển các kernel
1 pixel. Khi stride là 2 thì ta di chuyển các kernel đi 2 pixel và tiếp tục như vậy.

-Đường viền (Padding)

Đôi khi kernel không phù hợp với hình ảnh đầu vào,ta có thể chèn thêm các số 0 vào 4
đường biên của hình ảnh (zero padding).

9
3.Cơ sở lý thuyết mạng

Giả sử có thêm nơ-ron tích chập khác thì nó cũng hoạt động tương tự và sinh ra bản
đồ kích hoạt thứ hai( trọng số khác nhau) Các bản đồ kích hoạt ghép với nhau thành
một “ảnh mới”

Mạng nơ-ron tích chập là một dãy các lớp tích chập nối liên tiếp nhau xen kẽ bởi các hàm
kích hoạt (ví dụ ReLU)

10
3.Cơ sở lý thuyết mạng
-Hàm phi tuyến (ReLU)

ReLU viết tắt của Rectified Linear Unit, là 1 hàm phi tuyến. Với đầu ra là: ƒ (x) = max (0, x) ,
nó chuyển các giá trị âm thành 0 và giữ nguyên giá trị dương

-Lớp gộp (Pooling Layer)

Giúp giảm độ phân giải của khối dữ liệu để giảm bộ nhớ và khối lượng tính toán
Hoạt động độc lập trên từng bản đồ kích hoạt
Pooling có thể có nhiều loại khác nhau: Max Pooling ,Average Pooling ,Sum Pooling

11
3.Cơ sở lý thuyết mạng

Lớp gộp max pooling giúp mạng biểu diễn bất biến đối với các thay đổi tịnh tiến
(translation invariance) hoặc biến dạng (deformation invariance) của dữ liệu đầu vào

Max pooling lấy phần tử lớn nhất từ ma trận đối tượng

12
3.Cơ sở lý thuyết mạng

• Đầu vào của lớp tích chập là hình ảnh


• Chọn đối số, áp dụng các bộ lọc với các bước nhảy, padding nếu cần. Thực hiện tích chập
cho hình ảnh và áp dụng hàm kích hoạt ReLU cho ma trận hình ảnh.
• Thực hiện MaxPooling để giảm kích thước cho hình ảnh.
• Thêm nhiều lớp tích chập sao cho phù hợp
• Xây dựng đầu ra và dữ liệu đầu vào thành 1 lớp được kết nối đầy đủ (Full Connected)
• Sử dụng hàm kích hoạt để tìm đối số phù hợp và phân loại hình ảnh.

13
4.Code và kết quả thu được

14
4.Code và kết quả thu được

15
4.Code và kết quả thu được

16
4.Code và kết quả thu được

17
4.Code và kết quả thu được

18
THANK YOU !

19

You might also like