Professional Documents
Culture Documents
0 1 2 3 4 5 6 7
0 1 1 0 0 0 0 0 0
1 1 0 0 0 0 0 0 0
2 1 0 0 0 1 0 1 0
3 0 1 0 0 1 0 1 1
4 0 1 0 1 1 0 1 1
5 1 1 0 1 1 0 1 0
6 1 0 0 1 1 0 1 0
7 0 0 0 1 1 1 0 0
f
Ghi chú: Ghi kết quả vào 2 ma trận ảnh 𝑁4 (𝑝), 𝑁8 (𝑝)
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
𝑁4 (𝑝) 𝑁8 (𝑝)
Bài 2: Xác định khoảng cách Euclide: 𝐷𝑒 (𝑝, 𝑞) = √(𝑥 − 𝑠)2 + (𝑦 − 𝑡)2, khoảng cách khối: 𝐷4 (𝑝, 𝑞) = |𝑥 − 𝑠| + |𝑦 − 𝑡|, khoảng cách bàn cờ: 𝐷8 (𝑝, 𝑞) =
𝑚𝑎𝑥(|𝑥 − 𝑠|, |𝑦 − 𝑡|).
0 1 2 3 4 5 6 7
0 10 10 40 40 20 20 20 10
1 10 10 40 40 20 20 20 10
2 10 40 40 10 10 20 20 10
3 10 10 10 10 10 20 20 10
4 30 30 30 20 20 20 40 30
5 30 30 20 20 20 40 40 30
6 30 30 30 30 40 40 40 30
7 10 10 40 40 20 20 20 10
𝐷𝑒 (10,20) = √(… − ⋯ )2 + (… − ⋯ )2
𝐷4 (10,20) = |… − ⋯ | + |… − ⋯ |
𝐷8 (10,20) = 𝑚𝑎𝑥(|… − ⋯ |, |… − ⋯ |)
𝐷𝑚 (10,20) = ⋯
0 1 2 3 4 5 6 7
0 1 1 0 0 0 0 0 0
1 1 0 0 0 0 0 0 0
2 1 1 0 0 1 0 1 0
3 0 1 0 0 1 0 1 0
4 0 1 0 1 1 0 1 0
5 0 1 0 1 1 0 1 0
6 0 0 0 1 1 0 1 0
7 0 0 0 1 1 1 0 0
f
Ghi chú: Ghi kết quả vào 2 ma trận ảnh 𝑁4 (𝑝), 𝑁8 (𝑝)
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
𝑁4 (𝑝) 𝑁8 (𝑝)
a. Gán nhãn đối tượng trong ảnh f theo 𝑁4 (𝑝), 𝑁8 (𝑝)
b. Xác định liên kiết 4 và 8: N4(p), N8(p) trên ảnh f từ p(0,0) đến q(5,1) và p(2,4) đến q(7,3)
− Khoảng cách Dm: Là đường liên kết m ngắn nhất giữa các pixel (v{1})
R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40
Ghi chú: Ghi kết quả vào 3 ma trận ảnh
H S I
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0 0
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
7 7 7
Bài 6: Cho ảnh xám sau,
0 1 2 3 4 5 6 7
0 10 10 40 40 20 20 20 10
1 10 10 40 40 20 20 20 10
2 10 40 40 10 10 20 20 10
3 10 10 10 10 10 20 20 10
4 30 30 30 20 20 20 40 30
5 30 30 20 20 20 40 40 30
6 30 30 30 30 40 40 40 30
7 10 10 40 40 20 20 20 10
- Tính Convolutional layer: Tạo ảnh đầu vào cho mạng CNN (Convolutional neural network) để phát hiện các điểm trên ảnh, sử dụng ma trận
cấu trúc W tương ứng như đã học, cho hệ số bias = 1. Ghi chú: Ghi kết quả vào ma trận ảnh
0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
- Tính average pooling layer size = (2,2), stride=2, padding=1
- Tính max pooling với size = (3,3), stride=1, padding=1
Ghi chú: Ghi kết quả vào 2 ma trận ảnh
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
average pooling max pooling
R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40
- Tạo ảnh đầu vào cho mạng CNN (Convolutional neural network) để phát hiện các điểm trên ảnh, cho hệ số bias = 1
Ghi chú: Ghi kết quả vào ma trận ảnh
0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
g
- Tính average pooling layer size= (2,2), stride=2, padding=1
- Tính max pooling với size= (3,3), stride=1, padding=1
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
average pooling max pooling
Bài 8: Cho ảnh nhị phân A có kích thước 4x4 như sau:
1 𝑉33 𝑎ℎ
1 𝑉33 𝑎ℎ
2 2 0
0 1 2
a. Tính tích chập cho ảnh tương ứng với phần tử cấu trúc S, Cho hệ số bias =1.
b. Tính average pooling layer size= (2,2), stride=2, padding=1 đặt tên ảnh kết quả là A
c. Chọn ngưỡng 𝛿 = 𝑔𝑖á𝑡𝑟ị𝑡𝑟𝑢𝑛𝑔𝑏ì𝑛ℎ𝑐á𝑐𝑚ứ𝑐𝑥á𝑚𝑡𝑟𝑜𝑛𝑔ả𝑛ℎ𝐴, chuyển ảnh 𝐴 sang ảnh nhị phân.
1, 𝐴(𝑥, 𝑦) ≥ 𝛿
𝑔(𝑥, 𝑦) = {
0𝑒𝑙𝑠𝑒
d. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4)𝑋2 (2 × 2)𝑋2 𝑥1 𝑊1 𝑦𝑑 = 1
(2 × 2) × 2 (1 × 1)𝑋2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3
1 𝑉33 𝑎ℎ
Lớp chập 1 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính
0 1 0 0 0 0
𝑊1 = [0 1 0], 𝑊2 = [1 1 1]
0 1 0 0 0 0
Lớp gộp 1 (max-pooling 2x2, s=1, p=0),
Các phần tử cấu trúc tương ứng của ba kênh màu RGB như sau
a. Tính tích chập cho ảnh tương ứng với 3 phần tử cấu trúc RGB, Cho hệ số bias =1.
b. Tính average pooling layer size= (2,2), stride=2, padding=1 đặt tên ảnh kết quả là A
c. Chọn ngưỡng 𝛿 = 𝑔𝑖á𝑡𝑟ị𝑡𝑟𝑢𝑛𝑔𝑏ì𝑛ℎ𝑐á𝑐𝑚ứ𝑐𝑥á𝑚𝑡𝑟𝑜𝑛𝑔ả𝑛ℎ𝐴, chuyển ảnh 𝐴 sang ảnh nhị phân.
1, 𝐴(𝑥, 𝑦) ≥ 𝛿
𝑔(𝑥, 𝑦) = {
0𝑒𝑙𝑠𝑒
d. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4)𝑋2 (2 × 2)𝑋2 𝑥1 𝑊1 𝑦𝑑 = 1
(2 × 2) × 2 (1 × 1)𝑋2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3
1 𝑉33 𝑎ℎ