You are on page 1of 14

BÀI TẬP CHƯƠNG 6

Bài 1: Xác định liên kiết 4 và 8: N4(p), N8(p) trên ảnh f

0 1 2 3 4 5 6 7
0 1 1 0 0 0 0 0 0
1 1 0 0 0 0 0 0 0
2 1 0 0 0 1 0 1 0
3 0 1 0 0 1 0 1 1
4 0 1 0 1 1 0 1 1
5 1 1 0 1 1 0 1 0
6 1 0 0 1 1 0 1 0
7 0 0 0 1 1 1 0 0
f

Ghi chú: Ghi kết quả vào 2 ma trận ảnh 𝑁4 (𝑝), 𝑁8 (𝑝)

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
𝑁4 (𝑝) 𝑁8 (𝑝)
Bài 2: Xác định khoảng cách Euclide: 𝐷𝑒 (𝑝, 𝑞) = √(𝑥 − 𝑠)2 + (𝑦 − 𝑡)2, khoảng cách khối: 𝐷4 (𝑝, 𝑞) = |𝑥 − 𝑠| + |𝑦 − 𝑡|, khoảng cách bàn cờ: 𝐷8 (𝑝, 𝑞) =
𝑚𝑎𝑥(|𝑥 − 𝑠|, |𝑦 − 𝑡|).

0 1 2 3 4 5 6 7
0 10 10 40 40 20 20 20 10
1 10 10 40 40 20 20 20 10
2 10 40 40 10 10 20 20 10
3 10 10 10 10 10 20 20 10
4 30 30 30 20 20 20 40 30
5 30 30 20 20 20 40 40 30
6 30 30 30 30 40 40 40 30
7 10 10 40 40 20 20 20 10

𝐷𝑒 (10,20) = √(… − ⋯ )2 + (… − ⋯ )2

𝐷4 (10,20) = |… − ⋯ | + |… − ⋯ |

𝐷8 (10,20) = 𝑚𝑎𝑥(|… − ⋯ |, |… − ⋯ |)

𝐷𝑚 (10,20) = ⋯

Họ và tên thí sinh ………………….…………………; MSSV: ………………STT:...

Bài 3: Cho ảnh f như sau

0 1 2 3 4 5 6 7
0 1 1 0 0 0 0 0 0
1 1 0 0 0 0 0 0 0
2 1 1 0 0 1 0 1 0
3 0 1 0 0 1 0 1 0
4 0 1 0 1 1 0 1 0
5 0 1 0 1 1 0 1 0
6 0 0 0 1 1 0 1 0
7 0 0 0 1 1 1 0 0
f
Ghi chú: Ghi kết quả vào 2 ma trận ảnh 𝑁4 (𝑝), 𝑁8 (𝑝)

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
𝑁4 (𝑝) 𝑁8 (𝑝)
a. Gán nhãn đối tượng trong ảnh f theo 𝑁4 (𝑝), 𝑁8 (𝑝)

b. Xác định liên kiết 4 và 8: N4(p), N8(p) trên ảnh f từ p(0,0) đến q(5,1) và p(2,4) đến q(7,3)

c. Tính khoảng cách:

− Khoảng cách Euclide: 𝐷𝑒 (𝑝, 𝑞) = √(𝑥 − 𝑠)2 + (𝑦 − 𝑡)2

− Khoảng cách City - Block: 𝐷4 (𝑝, 𝑞) = |𝑥 − 𝑠| + |𝑦 − 𝑡|

− Khoảng cách Chess - Board: 𝐷8 (𝑝, 𝑞) = 𝑚𝑎𝑥(|𝑥 − 𝑠|, |𝑦 − 𝑡|)

− Khoảng cách Dm: Là đường liên kết m ngắn nhất giữa các pixel (v{1})

d. Gom nhóm đối tượng trong ảnh f theo N4(p), N8(p)

e. Xác định tâm hình học của

− Đối tượng thứ 1 theo nhóm 𝑁4 (𝑝)

− Đối tượng thứ 2 theo nhóm 𝑁8 (𝑝)


Bài 4: Biến đổi ảnh màu RGB f thành ảnh xám g
R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40
Ghi chú: Ghi kết quả vào 2 ma trận ảnh
0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
g

Áp dụng công thức sau: g = 0.3R + 0.59G + 01.1B


Bài 5: Biến đổi ảnh màu f có 3 kênh màu RGB thành ảnh trong không gian màu HSI

R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40
Ghi chú: Ghi kết quả vào 3 ma trận ảnh

H S I
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0 0
1 1 1
2 2 2
3 3 3
4 4 4
5 5 5
6 6 6
7 7 7
Bài 6: Cho ảnh xám sau,

0 1 2 3 4 5 6 7
0 10 10 40 40 20 20 20 10
1 10 10 40 40 20 20 20 10
2 10 40 40 10 10 20 20 10
3 10 10 10 10 10 20 20 10
4 30 30 30 20 20 20 40 30
5 30 30 20 20 20 40 40 30
6 30 30 30 30 40 40 40 30
7 10 10 40 40 20 20 20 10
- Tính Convolutional layer: Tạo ảnh đầu vào cho mạng CNN (Convolutional neural network) để phát hiện các điểm trên ảnh, sử dụng ma trận
cấu trúc W tương ứng như đã học, cho hệ số bias = 1. Ghi chú: Ghi kết quả vào ma trận ảnh

0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
- Tính average pooling layer size = (2,2), stride=2, padding=1
- Tính max pooling với size = (3,3), stride=1, padding=1
Ghi chú: Ghi kết quả vào 2 ma trận ảnh

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
average pooling max pooling

Bài 7: Cho ảnh màu RGB sau

R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40
- Tạo ảnh đầu vào cho mạng CNN (Convolutional neural network) để phát hiện các điểm trên ảnh, cho hệ số bias = 1
Ghi chú: Ghi kết quả vào ma trận ảnh

0 1 2 3 4 5 6 7
0
1
2
3
4
5
6
7
g
- Tính average pooling layer size= (2,2), stride=2, padding=1
- Tính max pooling với size= (3,3), stride=1, padding=1

Ghi chú: Ghi kết quả vào 2 ma trận ảnh

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 0
1 1
2 2
3 3
4 4
5 5
6 6
7 7
average pooling max pooling

Bài 8: Cho ảnh nhị phân A có kích thước 4x4 như sau:

a. Hãy chuyển ảnh 𝐴 sang ảnh nhị phân


b. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4) × 2 (2 × 2) × 2 𝑊1 𝑦𝑑 = 1
(2 × 2) × 2 𝑥1
(1 × 1) × 2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3

1 𝑉33 𝑎ℎ

Lớp chập 1 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


0 1 0 0 0 0
𝑊1 = [0 1 0], 𝑊2 = [1 1 1]
0 1 0 0 0 0
Lớp gộp 1 (max-pooling 2x2, s=1, p=0),

Lớp chập 2 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


1 0 0
𝑊 = [0 1 0]
0 0 1
Lớp gộp 2 (max-pooling 2x2, s=1, p=0),

Thông số mạng truyền thẳng:


1 2 0
𝑉(0) = [0 1 1], 𝑊(0) = [0 0 1]𝑇 , 𝜂 = 0.1,
0 0 1
𝑎𝑜 (𝑛𝑒𝑡) = 𝑛𝑒𝑡, 𝑎ℎ (𝑛𝑒𝑡) = tanh⁡(𝑛𝑒𝑡)
Tính trọng số mạng được cập nhật ở bước tiếp theo? 𝑉(1), 𝑊(1)
Bài 9: Cho ảnh xám A có kích thước 4x4 như sau:
10 150 50 125
25 180 125 225
75 95 120 50
150 45 150 225

a. Chọn ngưỡng 𝛿 = 100, chuyển ảnh 𝐴 sang ảnh nhị phân.


1, 𝐴(𝑥, 𝑦) ≥ 𝛿
𝑔(𝑥, 𝑦) = {
0⁡𝑒𝑙𝑠𝑒
b. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4)X2 (2 × 2)𝑋2 𝑥1 𝑊1 𝑦𝑑 = 1
2×2×2 (1 × 1)𝑋2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3

1 𝑉33 𝑎ℎ

Lớp chập 1 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


0 1 0 0 0 0
𝑊1 = [0 1 0], 𝑊2 = [1 1 1]
0 1 0 0 0 0
Lớp gộp 1 (max-pooling 2x2, s=1, p=0),

Lớp chập 2 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


1 0 0
𝑊 = [0 1 0]
0 0 1
Lớp gộp 2 (max-pooling 2x2, s=1, p=0),

Thông số mạng truyền thẳng:


1 2 0
𝑉(0) = [0 1 1], 𝑊(0) = [0 0 1]𝑇 , 𝜂 = 0.1,
0 0 1
𝑎𝑜 (𝑛𝑒𝑡) = 𝑛𝑒𝑡, 𝑎ℎ (𝑛𝑒𝑡) = tanh⁡(𝑛𝑒𝑡)
Tính trọng số mạng được cập nhật ở bước tiếp theo? 𝑉(1), 𝑊(1)
Bài 10: Cho ảnh xám sau
0 1 2 3 4 5 6 7
0 10 10 40 40 20 20 20 10
1 10 10 40 40 20 20 20 10
2 10 40 40 10 10 20 20 10
3 10 10 10 10 10 20 20 10
4 30 30 30 20 20 20 40 30
5 30 30 20 20 20 40 40 30
6 30 30 30 30 40 40 40 30
7 10 10 40 40 20 20 20 10

Với phần tử cấu trúc S như sau


0 1 2

2 2 0

0 1 2

a. Tính tích chập cho ảnh tương ứng với phần tử cấu trúc S, Cho hệ số bias =1.
b. Tính average pooling layer size= (2,2), stride=2, padding=1 đặt tên ảnh kết quả là A
c. Chọn ngưỡng 𝛿 = 𝑔𝑖á⁡𝑡𝑟ị⁡𝑡𝑟𝑢𝑛𝑔⁡𝑏ì𝑛ℎ⁡𝑐á𝑐⁡𝑚ứ𝑐⁡𝑥á𝑚⁡𝑡𝑟𝑜𝑛𝑔⁡ả𝑛ℎ⁡𝐴, chuyển ảnh 𝐴 sang ảnh nhị phân.
1, 𝐴(𝑥, 𝑦) ≥ 𝛿
𝑔(𝑥, 𝑦) = {
0⁡𝑒𝑙𝑠𝑒
d. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4)𝑋2 (2 × 2)𝑋2 𝑥1 𝑊1 𝑦𝑑 = 1
(2 × 2) × 2 (1 × 1)𝑋2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3

1 𝑉33 𝑎ℎ
Lớp chập 1 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính
0 1 0 0 0 0
𝑊1 = [0 1 0], 𝑊2 = [1 1 1]
0 1 0 0 0 0
Lớp gộp 1 (max-pooling 2x2, s=1, p=0),

Lớp chập 2 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


1 0 0
𝑊 = [0 1 0]
0 0 1
Lớp gộp 2 (max-pooling 2x2, s=1, p=0),

Thông số mạng truyền thẳng:


1 2 0
𝑉(0) = [0 1 1], 𝑊(0) = [0 0 1]𝑇 , 𝜂 = 0.1,
0 0 1
𝑎𝑜 (𝑛𝑒𝑡) = 𝑛𝑒𝑡, 𝑎ℎ (𝑛𝑒𝑡) = tanh⁡(𝑛𝑒𝑡)
Tính trọng số mạng được cập nhật ở bước tiếp theo? 𝑉(1), 𝑊(1)

Bài 11: Cho ảnh màu RGB sau


R G B
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
0 10 10 20 20 20 24 24 24 0 52 52 57 55 56 52 51 52 0 12 12 40 40 20 20 20 20
1 10 10 10 20 20 24 24 24 1 50 49 51 50 52 53 58 50 1 12 12 40 40 20 20 20 20
2 10 10 10 20 20 23 24 24 2 51 51 52 52 56 57 60 51 2 10 40 40 10 10 20 20 20
3 20 20 20 20 20 23 23 23 3 48 50 51 49 53 59 63 48 3 10 10 10 10 10 20 20 20
4 20 20 80 80 23 23 23 23 4 49 51 52 55 58 64 67 49 4 30 30 30 20 20 20 40 40
5 20 80 80 80 14 14 14 23 5 14 15 15 16 16 16 17 14 5 30 30 20 20 20 40 40 40
6 80 80 80 80 14 14 14 14 6 51 51 52 52 56 57 60 51 6 30 30 30 30 40 40 40 40
7 10 10 20 20 20 24 24 24 7 48 50 51 49 53 59 63 48 7 30 30 30 30 40 40 40 40

Các phần tử cấu trúc tương ứng của ba kênh màu RGB như sau
a. Tính tích chập cho ảnh tương ứng với 3 phần tử cấu trúc RGB, Cho hệ số bias =1.
b. Tính average pooling layer size= (2,2), stride=2, padding=1 đặt tên ảnh kết quả là A
c. Chọn ngưỡng 𝛿 = 𝑔𝑖á⁡𝑡𝑟ị⁡𝑡𝑟𝑢𝑛𝑔⁡𝑏ì𝑛ℎ⁡𝑐á𝑐⁡𝑚ứ𝑐⁡𝑥á𝑚⁡𝑡𝑟𝑜𝑛𝑔⁡ả𝑛ℎ⁡𝐴, chuyển ảnh 𝐴 sang ảnh nhị phân.
1, 𝐴(𝑥, 𝑦) ≥ 𝛿
𝑔(𝑥, 𝑦) = {
0⁡𝑒𝑙𝑠𝑒
d. Dùng mạng CNN có cấu trúc sau:
𝑉11
4×4 (4 × 4)𝑋2 (2 × 2)𝑋2 𝑥1 𝑊1 𝑦𝑑 = 1
(2 × 2) × 2 (1 × 1)𝑋2 𝑉13
𝑦
𝑊2
𝑥2 𝑎𝑜
𝑊3

1 𝑉33 𝑎ℎ

Lớp chập 1 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


0 1 0 0 0 0
𝑊1 = [0 1 0], 𝑊2 = [1 1 1]
0 1 0 0 0 0
Lớp gộp 1 (max-pooling 2x2, s=1, p=0),

Lớp chập 2 với 2 Kernel, 𝑝 = 1, 𝑠 = 1, hàm tác động là tuyến tính


1 0 0
𝑊 = [0 1 0]
0 0 1
Lớp gộp 2 (max-pooling 2x2, s=1, p=0),

Thông số mạng truyền thẳng:


1 2 0
𝑉(0) = [0 1 1], 𝑊(0) = [0 0 1]𝑇 , 𝜂 = 0.1,
0 0 1
𝑎𝑜 (𝑛𝑒𝑡) = 𝑛𝑒𝑡, 𝑎ℎ (𝑛𝑒𝑡) = tanh⁡(𝑛𝑒𝑡)
Tính trọng số mạng được cập nhật ở bước tiếp theo? 𝑉(1), 𝑊(1)

You might also like