You are on page 1of 17

Lý thuyết

A. Hệ màu
1. Mô hình màu:
- Mô hình màu (hay hệ màu, không gian màu) là một hệ thống các quy tắc để tạo ra
tất cả các màu sắc từ một nhóm nhỏ các màu cơ bản
- Một vài mô hình màu cơ bản:
+ RGB: cho các màn hình màu, camera màu,…
+ CMY và CMYK: in màu
+ HSV và HSL:
2. Khác nhau CMY và RGB
- CMY: là hệ màu trừ, sử dụng trong in ấn, sử dụng mực để hiển thị màu, màu là kết
quả của ánh sáng bị phản xạ dựa trên việc trộn màu:
Cyan + Magenta + Yellow = Black
- RGB: là dựa vào phân phối màu cộng, sử dụng cho các màn hình màu, camera
màu
Khác nhau:
CMY RGB
Hệ màu trừ Hệ màu cộng
Biểu diễn được mọi màu trong phổ nhìn Không thể biểu diễn mọi màu trên phổ
thấy nhìn thấy
Phức tạp, cần phải ghi nhớ mối quan hệ Đơn giản và được sử dụng rộng rãi
giữa 2 không gian
***
Sử dụng CMY vì: Nó biểu diễn được mọi màu trong phổ nhìn thấy
Chuyển RGB sang CMY: CMY = 111 - RGB
***
- Phối màu cộng: là việc tạo nên các màu sắc bằng cách chồng vào nhau ánh sáng
phát ra từ vài nguồn sáng. Hai tia cùng cường độ thuộc 2 trong 3 màu gốc nói trên
chồng lên nhau sẽ được màu thứ cấp
+ Đỏ + Lục = Vàng, Đỏ + Lam = Hồng xẫm, Lam + Lục = Xanh lơ
+ Thường dùng trong các màn hình màu, camera, … như mô hình RGB
- Phối màu trừ: là việc tạo nên các màu sắc bằng cách trộn màu như: thuốc nhuộm,
mực, các chất màu tự nhiên,…
+ Đỏ + Vàng = Da cam, Đỏ + Lam = Tím, Lam + vàng = Lục, Đỏ + Lam + Lục =
Đen
+ Thường sử dụng trong in ấn như mô hình CMY
3. Hệ màu HSV và HSL:
- Vì nó dễ hình dung hơn và mô tả chính xác hơn các giá trị của màu
- Ý nghĩa:
+ H: Hue cường độ sáng
+ S: Saturation độ bão hòa
+ V: Value giá trị cường độ sáng
+ L: Lightness độ sáng
4. Mô hình lưu trữ
Mô hình raster Mô hình vector
Khái niệm Sử dụng mạng lưới các ô vuông Lưu trữ cặp tọa độ các đối
(ma trận) để thể hiện thế giới thực: tượng để thể hiện các đối tượng:
điểm (pixel), đường (chuỗi pixel), Điểm (1 cặp tọa độ), đường (1
vùng (nhóm pixel) chuỗi cặp tọa độ), vùng (1 chuỗi
cặp tọa độ và tọa độ đầu và cuối
trùng nhau)
Kích cỡ Kích cỡ không nhỏ (phụ thuộc vào Không phụ thuộc vào kích cỡ,
kích cỡ) có thể zoom tùy ý
Sử dụng Sử dụng trong in ấn Thuận lợi cho lưu trữ và thiết kế
Dùng để biểu diễn bề mặt, nén ảnh Mô tả vị trí, phạm vi của các
BMP, TIF đối tượng trong không gian, phổ
biến trong đồ họa

Không sử dụng nhiều vì: Bắt


buộc phải sử dụng ảnh thật mới
có thể tính toán tạo ảnh vector
nhưng việc tính toán các tỉ lệ
vector là phức tạp
5. Tại sao kỹ thuật nửa cường độ (halftone) được dùng trong in ấn? Và ý tưởng cơ
bản của kỹ thuật nửa cường độ là gì?
- Kỹ thuật nửa cường độ là quá trình mô phỏng các sắc thái của màu xám bằng cách
thay đổi các kích thước chấm đen nhỏ sắp xếp theo một mô hình chung
- Kỹ thuật này sử dụng trong in ấn vì:
+ Nó tiết kiệm hơn khi sử dụng dải màu mà vẫn cho kết quả tương tự ( mắt thường
không thể phân biệt được sự khác nhau giữa 2 điểm ảnh nếu đi xa)
- Ý tưởng:
+ Lợi dụng nguyên lý thu nhận ảnh ở xa của mắt. lúc đó mắt không thể nhìn được
các điểm ảnh 1 cách cụ thể mà chỉ thấy cường độ trung bình của vùng ảnh
+ Ảnh được tạo bởi các điểm ảnh. Mỗi điểm ảnh là 1 hình vuống trắng bao quanh
1 chấm đen. Tùy vào kích thước và số lượng chấm đen mà vùng ảnh đó có màu
trắng, đen hoặc xám.
6. Để in ảnh đa cấp xám với chỉ mực mầu đen cần sử dụng kỹ thuật gì? Khuếch tán
lỗi hỗ trợ được gì cho kỹ thuật này? Khuếch tán lỗi hơn gì tách ngưỡng thông
thường?
- Ta dùng kĩ thuật nửa cường độ (halftone)
- Khuếch tán lỗi giúp chuyển ảnh đa cấp xám về ảnh đen trắng vì từ ảnh đen trắng
mới có thể in được
- Khuếch tán lỗi hơn gì tách ngưỡng thông thường ở: Khuếch tán lỗi giúp giảm lỗi
do quá trình tách ngưỡng gây ra (vì mực chỉ in đc đen trắng) và đảm bảo bức ảnh
không bị khác đi quá nhiều.
7. Khuếch tán lỗi là gì? Khuếch tán lỗi một chiều khác gì khuếch tán lỗi hai chiều?
Khuếch tán lỗi hai chiều khắc phục được điểm yếu gì của khuếch tán lỗi một
chiều?
- Khuếch tán lỗi là 1 dạng của kỹ thuật nửa cường độ được sử dụng để chuyển ảnh
mẫu liên tục sang dạng nửa cường độ để vận chuyển và in ấn .
- Khuếch tán lỗi 1 chiều sẽ quét ảnh lần lượt từng dòng và từng điểm ảnh, phần dư
sẽ bị bỏ đi khi hết dòng. Còn khuếch tán lỗi 2 chiều thì phần dư sẽ có 1 phần bị
khuếch tán xuống cả dòng dưới.
- Khuếch tán lỗi 1 chiều thường để lại những đường thẳng dọc không mong muốn,
vì thế Khuếch tán lỗi 2 chiều giảm các lỗi này.
8. Với ảnh đa mức xám thì tăng giảm độ sáng của ảnh như thế nào? Chúng ta phải sử
dụng toán tử loại nào đề thực hiện phép toán này?
- Thực hiện bằng cách tăng/giảm 1 giá trị c tại mỗi điểm trong ảnh. Nếu giá trị thay
đổi đó < 0 => gán nó = 0 , nếu >255 => gán nó 255
- Toán tử sử dụng: là toán tử điểm (là những phép toán không phụ thuộc vào vị trí
điểm ảnh)
9. Cân bằng tần suất là gì? Tại sao phải cân bằng tần suất?
- Ảnh I là ảnh cân bằng lý tưởng là ảnh có độ tương phản cao, tức là nếu với mọi
mức xám g, g’ thì ta có: h(g) = h(g’) với h(g) và tần xuất của mức xám g
- Cân bằng tần xuất giúp ảnh có độ tương phản cao (giúp phân bố đều các mức
xám)
10. Biến đổi cửa sổ di chuyển hay còn gọi là biến đổi cuộn là biến đối sử dụng toán tử
gì? Ý tưởng cơ bản của biến đổi này là gì?
- Sử dụng toán tử không gian
- Ý tưởng:
+ Giá trị điểm ảnh kết quả chỉ phụ thuộc vào giá trị điểm ảnh lân cận và phép toán
được áp dụng (các giá trị pixel gần nhau thường có sự tương đồng nhau)
+ Cửa sổ di chuyển được dùng như phép trung gian nhằm thực hiện nâng cao chất
lượng ảnh hoặc áp dụng thuật toán lên cả bức ảnh (lọc, nhân chập,…)
11. Mô hình nhiễu là gì? Tại sao phải sử dụng mô hình nhiễu.
- Mô hình nhiễu biểu thị sự liên quan giữa ảnh bị nhiễu, ảnh gốc và thành phần
nhiễu: g(x, y) = f(x, y) + n(x, y)
- Tại vì nếu ta có thể ước đoán được mô hình nhiễu bức ảnh thì có thể khôi phục
ảnh về ban đầu
12. Biên là gì? Phát hiện biên trực tiếp, gián tiếp là gì? Nêu một vài ví dụ về cách
phát hiện biên gián tiếp?
- Biên là các thay đổi đáng kể của cường độ xám trong một bức ảnh.
- Phát hiện biên trực tiếp là làm nổi biên dựa vào sự biến thiên của cấp xám, kết quả
thu được là ảnh biên.
Ví dụ: ta sử dụng pp Gadient – đạo hàm bậc 1
- Phát hiện biên gián tiếp dựa vào các thuộc tính khác như màu sắc, cấu trúc, hoặc
đặc điểm không gian
Ví dụ: Sử dụng không gian màu để phân tách các kênh màu (RGB, HSV, LAB) và
áp dụng ngưỡng trên mỗi kênh để xác định biên
13. Biên là gì? Nhiễu là gi? Làm thế nào để phân biệt biên và nhiễu?
- Biên là các thay đổi đáng kể cường độ xám trong bức ảnh
- Nhiễu là những biến động ngẫu nhiêu, không mong muốn của ảnh
Phân biệt:
+ Biên thường có hình dạng và cấu trúc rõ ràng, theo dõi ranh giới giữa các đối
tượng.
+ Nhiễu thường không tuân theo các cấu trúc hay hình dạng rõ ràng, xuất hiện
ngẫu nhiên trong ảnh.
14. Tại sao chúng ta phải nén ảnh? Nén dữ liệu nói chung và nén ảnh nói riêng khác
nhau cơ bản ở điểm gì
- Nén ảnh để giảm kích thước ảnh giúp dễ dàng lưu trữ, truyền tải hơn.
- Khác biệt giữa nén dữ liệu nói chung và nén ảnh nói riêng chủ yếu nằm ở cách
chúng được thực hiện và các thuật toán sử dụng. Nén dữ liệu nói chung có thể áp
dụng cho nhiều loại dữ liệu khác nhau, trong khi nén ảnh thường sử dụng các
phương pháp và thuật toán chuyên biệt để giảm kích thước mà vẫn giữ được đặc
tính hình ảnh quan trọng. Các thuật toán nén ảnh thường tận dụng tính không gian
màu, sự lặp lại trong ảnh, và các đặc trưng quan trọng để giảm kích thước mà
không làm mất nhiều thông tin quan trọng.
Phần 2 Đ

1. Lọc trung vị khác với lọc trung bình khác với lọc trung bình k giá trị gần nhất như
thế nào? Nên chọn từng phép lọc trong từng trường hợp như thế nào?
Lọc trung bình Lọc trung vi Lọc trung bình k giá
trị gần nhất
Khái niệm Là phép lọc cửa sổ di Là phép lọc cửa sổ Lấy trung bình cộng
chuyển, đơn giản là di chuyển, mỗi pixel của k giá trị gần nhất
lấy trung bình tất cả được thay thế bằng cảu các pixel láng
các pixel trong vùng các giá trị giữa trong giềng
lân cận xung quanh các pixel láng giềng.
giá trị tâm

TH sử dụng Dùng trong TH muốn Dùng trong TH Dùng trong TH


quan tâm đến tất cả muốn quan tâm xem muốn quan tâm đến
các điểm ảnh xung “phần lớn” các điểm các điểm ảnh cùng
quanh ảnh xung quanh nó loại (có giá trị gần
như thế nào. Phù nhất)
hợp loại bỏ nhiễu
muối tiêu

2. Phát hiện biên bằng đạo hàm dựa trên nguyên lý gì? Ma trận (-1 1) có ý nghĩa gì?
- Phát hiện biên bằng đạo hàm dựa trên nguyên lý: Sự biến đổi đột ngột về các mức
xám tại điểm biên -> dựa vào cực đại của đạo hàm, ta có kĩ thuật dò biên cục bộ
- Ý nghĩa ma trận (-1, 1):
3. Phát hiện biên bằng đạo hàm dựa trên nguyên lý gì? Nêu ba loại ma trận nhân
chập có thể tìm biên. Với mỗi ma trận hãy nêu nguyên lý và các bước tiếp theo
nếu có để có biên rõ ràng.
- 3 loại ma trận:
+ Toán tử Roberts: sử dụng 2 mặt nạ nhân chập xấp xỉ đạo hàm theo hướng x và y
10
0 -1
0 -1
10
Tính đạo hàm theo x,
Tính đạo hàm theo y
Tính độ lớn G
+ Toán tử Sobel
+ Toán tử Prewit
4. Canny có mấy bước, là những bước gì? Bước nào trong Canny là quan trọng nhất,
tại sao?
- Cac bước:
1. Smoothing (làm mịn): Sử dụng bộ lọc Gaussian để giảm nhiễu cho ảnh.
2. Gradient operator: Tính độ lớn và hướng của gradient theo trục x và y sử dụng
toán tử roberts hoặc Sobel.
3. Non-maximum suppression: Loại bỏ những điểm không đạt giá trị cực đại.
4. Hysteresis thresholding: Phân ngưỡng kép để tìm ra điểm đầu và cuối của biên
- Bước quan trọng nhất: là bước 4. Vì việc xác định ngưỡng T ảnh hưởng lớn đến kết quả
cuối cùng. Nếu ngưỡng quá cao, có thể bỏ lỡ các cạnh quan trọng; ngược lại, nếu ngưỡng
quá thấp, có thể xuất hiện nhiễu.
5. Phân vùng dùng thuật toán đối xứng nền là kỹ thuật gì? Dựa vào điều gì trong các
bức ảnh đầu vào cho phép thuật toán trả về kết quả đúng nhất?
6. Phân vùng sử dụng thuật toán tam giác là gì? Ý tưởng cơ bản của thuật toán này là
gì? Trong trường hợp nào thì thuật toán này không nên sử dụng?
7. Kỹ thuật tách cây tứ phân và hợp cũng như tách-hợp trong phân vùng dựa vào ý
tưởng gì? Yếu tố gì đánh giá tính chính xác cũng như tính thống nhất của thuật
toán?
8. Kỹ thuật K trung bình là kỹ thuật gì, ý tưởng cơ bản là gì? Yếu tố gì có ảnh hưởng
rất lớn tới hiệu suất của k trung bình?
9. Kỹ thuật K láng giềng là kỹ thuật gì? K láng giềng thường được sử dụng để làm
gì? Ý tưởng căn bản nhất của K láng giềng là gì?
10. Mạng Hopfield là gì? Mạng Hopfield có cấu tạo như thế nào? Mô tả sơ bộ hoạt
động của mạng Hopfield.
11. Mạng Kohonen có tên gọi khác là gì? Tại sao chúng ta gọi mạng Kohonen như
vậy? Ý tưởng cơ bản của mạng Kohonen là gì? Ở khía cạnh nào mạng Kohonen
mô phỏng não người?
12. 2.15(D) Mã hóa loạt dài RLC là gì? Trong trường hợp nào mã hóa loạt dài sẽ tăng
kích thước dự
13. liệu được mã hóa?
14. 2.16(D) Biến đổi Cosin trong nén JPEG nhằm mục đích gì? Và bước nào trong
nén JPEG sẽ làm
15. cho quá trình nén ảnh là không bảo toàn?
Bài tập
Câu 3.1
a. Biểu đồ tần xuất
g 0 1 2 3 4 5 6 7 8 9
h(g) 4 5 6 6 4 4 4 0 1 2
b. f(g) = |g-4|
Ta có
f(0) = 4, f(1) = 3, f(2) = 2,
f(3) = 1, f(4) = 0, f(5) = 1, f(6) = 2,
f(7) = 3, f(8) = 4, f(9) = 5
Tính biểu đồ tần xuất h’(q)
q = 0: {f(g = 4)} => h’(q = 0) = h(g = 4) = 4
q = 1: {f(g = 3), f(g = 5)} => h’(q = 1) = h(g = 3) + h(g = 5) = 10
q = 2: {f(g = 2), f(g = 6)} => h’(q = 2) = h(g = 2) + h(g = 6) = 10
q = 3: {f(g = 1), f(g = 7)} => h’(q = 3) = h(g = 1) + h(g = 7) = 5
q = 4: {f(g = 0), f(g = 8)} => h’(q = 4) = h(g = 0) + h(g = 8) = 5
q = 5: {f(g = 9)} => h’(q = 5) = h(g = 9) = 2
Vậy
q 0 1 2 3 4 5
h’(q) 4 10 10 5 5 2

Câu 3.3
a. Biểu đồ tần xuất
g 0 1 2 3 4 5 6 8 9
h(g) 4 5 6 6 4 4 4 1 2

b. Làm trơn
W −1
2
1
Công thức hsmooth (g)=
W
∑ h( g−w)
−W −1
w=
2

Hsmooth(g): tần suất sau khi làm trơn


H(g): tần suất gốc
W: tỉ số (thường chọn tỉ số lẻ)
Với W = 3
1
1
hsmooth (g)= ∑ h (g−w)
3 w=−1
1
hsmooth(0) = * (h(1) + h(0)) = 3
3
1
hsmooth(1) = * (h(2) + h(1) + h(0)) = 5
3
1
hsmooth(2) = * (h(3) + h(2)+ h(1)) = 6
3

…..
1
hsmooth(9) = * (h(9) + h(8)) =1
3

Vậy với W=3:


g 0 1 2 3 4 5 6 8 9
hsmooth(g) 3 5 6 5 5 4 3 1 1

Với W = 5
2
1
hsmooth (g)= ∑ h (g−w)
5 w=−2

g 0 1 2 3 4 5 6 8 9
hsmooth(g) 3 4 5 5 5 4 3 1 1

Câu 3.4

a. Cân bằng tần xuất

Ta có: n = 36, L’ = 6
k r(k) n(k) P(r(k)) S(k)
0 r(0) = 0 5 5/36 5*(5/36) = 1
1 r(1) = 1 11 11/36 5*(5/36 + 11/36) = 2
2 r(2) = 2 7 7/36 5*(5/36 + 11/36 + 7/36)= 3
3 r(3) = 3 7 7/36 =4
4 r(4) = 4 5 5/36 =5
5 r(5) = 5 1 1/36 =5
Vậy I’ =
4 2 5 5 3 4
4 3 3 1 5 2
2 3 4 2 1 2
5 2 1 3 5 5
4 2 1 2 1 2
3 2 4 3 2 4

b. Ảnh được gọi là ảnh cân bằng lý tưởng là ảnh có độ tương phản cao tức là mọi
mức xám đều có tần xuất xuất hiện như nhau
Vì h’(1) = 5 khác h’(2) =11 nên ảnh I’ không phải ảnh cân bằng lý tưởng
Câu 3.7: Khuếch tán

Câu 3.10 Phép co, dãn

Phép co
X(-)B : = 1 nếu B hit X
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 1 1 0
0 0 0 0 1 1 0 0
0 0 0 1 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0
Phép dãn: X(+)B: =1 nếu B fit X
1 1 1 1 1 1 1 0
1 1 1 0 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1
1 1 1 1 1 1 1 1

Phép mở: XoB = [X(-)B](+)B


Phép đóng: X.B = [X(+)B](-)
Câu 4.1
a. Nhân chập
Tính Ix
4 0 0 0 0 0 -4
6 13 13 0 -13 -13 -6
6 24 23 3 -23 -27 -6
6 37 36 3 -36 -40 -6
6 24 23 3 -23 -27 -6
6 13 13 0 -13 -13 -6
4 0 0 0 0 0 -4

Tính Iy
4 6 6 6 6 6 4
0 13 26 39 26 13 0
0 11 21 35 24 14 0
0 0 0 0 0 0 0
0 -11 -21 -35 -24 -14 0
0 -13 -26 -39 -26 -13 0
-4 -6 -6 -6 -6 -6 -4

I1 = Ix + Iy
8 6 6 6 6 6 0
6 26 39 39 13 0 -6
6 35 44 38 1 -13 -6
6 37 36 3 -36 -40 -6
6 13 2 -32 -47 -41 -6
6 0 -13 -39 -39 -26 -6
0 0 0 0 0 0 -8

b. Tính I2 = I * Hz
10 6 6 6 6 6 10
6 -13 -26 -39 -26 -13 6
6 -24 70 43 67 -27 6
6 -37 56 -23 50 -40 6
6 -24 70 43 67 -27 6
6 -13 -26 -39 -26 -13 10
10 6 6 6 6 6 10
c. 2 ảnh I1 và I2 chưa là ảnh biên vì ảnh biên là ảnh được xử lý về ảnh đen trắng. Để
được ảnh biên thì ta có thể phân ngưỡng bức ảnh đó với ngưỡng T nào đó. Nếu
<=T => 0 ngược lại 1
4. 3: Khác nhau: I1’ là ảnh biên kiểu dốc thoải, còn I2’ là ảnh biên kiểu mái nhà
Câu 4.6

a. Tìm ngưỡng tự động


k pi P1(k) m(k) MG phi
0 1/48 1/48 0 3 0.2
1 9/48 10/48 1*(9/48) = 0.1875 3 1.16
2 17/48 27/47 0.1875 + 2* 17/48 = 3 2.55
0.896
3 6/48 33/48 1.27 3 2.92
4 4/48 37/48 1.60 3 2.84
5 5/48 42/48 2.125 3 2.29
6 3/48 45/48 2.5 3 1.67
7 1/48 46/48 2.66 3 1.32
8 1/48 47/48 2.8 3 0.77
9 1/48 1 3 3 0
Vậy ngưỡng T = 3
b. Sẽ có những trường hợp có thể tìm được nhiều ngưỡng khác nhau, ta sẽ lấy trung
bình tổng các ngưỡng
Câu 4.8

a. Thuật toán đẳng liệu


Chọn ngưỡng To = 5
T1 = ½(445/171 + 956/135) = 4.84
Lấy ngưỡng T1 = 4
T2 = 4.16
Lấy ngưỡng T2 = 4
T3 = 4.16
T3 = T2 => ngưỡng T = 4

b. Thuật toán đối xứng nền


Phi = maxp – (p% - maxp)
Ta có:
Maxp = 6
Q = ∑ pixel = 101
Độ chính xác 91%
 Số pixel từ 0 -> p là: 101 * 91% =92 (1)
7
 ∑ h (i )=91 (2)
i=0

Từ 1, 2 => p = 7
Vậy ngưỡng T = maxp – (p - maxp) = 6 – ( 7 - 6) = 5
c. H
Câu 4.9

a.
- Mã hóa
output index String
2 4 10-00
0 5 00-11
3 6 11-00
5 7 00-11-10
2 8 10-01
1 9 01-11
3 10 11-11
6 11 11-00-11
3 12 11-01
1 13 01-01
9 14 01-11-10
4
Kết quả: 2 – 0 – 3 – 5 – 2 – 1 – 3 – 6 – 3 – 1 – 9 – 4
- Giải mã
output index String
10
00 4 10-00
11 5 00-11
00-11 6 11-00
10 7 00-11-10
01 8 10-01
11 9 01-11
11-00 10 11-11
11 11 11-00-11
01 12 11-01
01-11 13 01-01
10-00 14 01-11-10

Chú ý: nếu chưa có: output = đầu ra trc + ký tự đầu tiên của đầu ra trước
b. LZW
- Ý tưởng: là tạo ra từ điển (1 bảng) các chuỗi được sử dụng trong phiên truyền
thông.
- Vấn đề: Bộ mã hóa và giải mã LZW cùng xây dựng 1 bộ từ điển trong quá trình
nhận dữ liệu
- Cách giải quyết: Nếu cả bên gửi và nhận đều có bản copy cuối của từ điển thì các
chuỗi đã gặp trc đó sẽ thay thế bằng mục lục của chúng để làm giảm lượng thông
tin cần truyền.

You might also like