Professional Documents
Culture Documents
(CNN) Lenet5
(CNN) Lenet5
MẠNG LENET-5
I. Giới thiệu kiến trúc mạng Lenet-5
II. Cấu trúc Lenet-5
III. Ứng dụng Lenet-5
IV. Kết luận
I. Giới thiệu kiến trúc mạng Lenet-5
L
o Là một mạng nơ-ron tích chập nhiều lớp dùng để phân loại hình ảnh
E
N o Được tạo ra bởi Yann LeCun và các cộng sự vào năm 1998
E o Dùng để nhận diện kí tự viết tay (chữ số) và in bằng máy
T o Là 1 trong những mạng tích chập (CNN) đầu tiên và là cơ sở thiết kế
5 cho các mạng sau này
II. Cấu trúc Lenet-5
Gồm 5 lớp chính: 2 lớp tích chập và 2 lớp kết nối đầy đủ và 1 ngõ ra
Ngoài ra còn 2 lấy mẫu xuông (lớp gộp trung bình)
1. Lớp 1 (lớp tích chập) Lớp tích chập
(convolutional layers)
Input 32x32x1 C1: feature maps
14 x 14 x 6
- Kích thước hình ảnh thay đổi từ 28x28x6 thành 14x14x6 (kích thước feature maps giảm ½)
- Số noron = 14 x 14 x 6 = 1176
- Thông số học = (1 + 1) x 6 = 12
- Số kết nối = 14 x 14 x 30 = 5880
3. Lớp 3 (lớp tích chập) Lớp tích chập C3: feature maps
(convolutional layers)
- n = 14 x 14 𝒏 + 𝟐𝒑 − 𝒇 𝒏 + 𝟐𝒑 − 𝒇
+𝟏 × +𝟏
- Filter size = f = 5 x 5 𝒔 𝒔
- Strides = s = 1 𝟏𝟒 + 𝟐. 𝟎 − 𝟓 𝟏𝟒 + 𝟐. 𝟎 − 𝟓
+𝟏 × +𝟏
- Padding = p = 0 𝟏 𝟏
- Số bộ lọc: 16
10 x 10 x 16
- Kích thước hình ảnh thay đổi từ 14x14x6 thành 10x10x16
- Số noron = 14 x 14 x 6 = 1176
- Thông số học = [6 * (5*5*3 + 1)] + [6 * (5*5*4 + 1)] + [3 * (5*5*4 + 1)] + [1 * (5*5*6 + 1)]
= 1516
- Số kết nối = 10 x 10 x 1516 = 151600
3. Lớp 3 (lớp tích chập)
1. Lấy đầu vào từ 3 feature maps từ S2:
- 6 lớp tích chập đầu tiên của C3 được thực hiện với sự kết hợp này.
2. Lấy đầu vào từ 4 feature maps từ S2:
- 6 lớp tích chập tiếp theo của C3 được thực hiện với sự kết hợp này.
3. Lấy đầu vào từ 4 feature maps từ S2:
- 3 lớp tích chập C3 tiếp theo được thực hiện với sự kết hợp này.
4. Lấy tất cả các feature maps S2:
- Lớp cuối cùng của C3 được thực hiện với sự kết hợp này.
Filter size = f = 2 x 2
Số filters = 16
Strides = s = 2
Padding = p = 0
n = 10 𝒏 + 𝟐𝒑 − 𝒇 𝒏 + 𝟐𝒑 − 𝒇
+𝟏 × +𝟏
𝒔 𝒔
𝟏𝟎 + 𝟐. 𝟎 − 𝟐 𝟏𝟎 + 𝟐. 𝟎 − 𝟐
+𝟏 × +𝟏
𝟐 𝟐
5 x 5 x 16
Strides = s = 1
Padding = p = 0 1 x 1 x 120
n=5
Mỗi đơn vị trong số 120 đơn vị trong C5 được kết nối với tất cả 400 nút (5x5x16) trong lớp thứ
tư S4
Số noron = 1 x 1 x 120 = 120
Thông số học = (5 x 5 x 16 + 1) x 120 = 48120
Số kết nối = 48120 x 1 x 1 = 48120
6. Lớp 6 (kết nối đầy đủ) - Lớp F6 bao gồm 84 noron kết nối
F6: layer
hoàn toàn với lớp C5.
- Ở đây điểm sản phẩm giữa vector
đầu vào và vector trọng số được thực
hiện và sau đó cộng thêm bias.
- Kết quả sau đó được truyền hàm
kích hoạt