You are on page 1of 59

LỜI CAM ĐOAN

Tôi xin cam đoan đây là kết quả nghiên cứu của riêng tôi. Các kết quả đưa
ra là trung thực và chưa từng được ai công bố trong bất kỳ một tài liệu nào khác.
Tôi xin cam đoan tất cả những thông tin được trích dẫn trong luận văn đã
được ghi rõ nguồn gốc.
Hải Phòng, ngày 07 tháng 9 năm 2015

i
LỜI CẢM ƠN
Để hoàn thành cuốn luận văn tốt nghiệp này, tôi xin được gửi lời cảm ơn
đến toàn thể các thầy cô thuộc khoa Công nghệ thông tin đã tận tình giảng dạy
trong suốt thời gian vừa qua đặc biệt là thầy TS. Nguyễn Duy Trường Giang-
người luôn nhiệt tình và nghiêm khắc trong quá trình dạy và hướng dẫn để tôi có
thể hoàn thành cuốn luận văn này.
Một lần nữa, tôi xin chân thành cảm ơn!

ii
MỤC LỤC
LỜI CAM ĐOAN................................................................................................... i
LỜI CẢM ƠN ....................................................................................................... ii
DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU ....................................................... v
DANH MỤC CÁC BẢNG................................................................................... vi
DANH MỤC CÁC HÌNH ................................................................................... vii
MỞ ĐẦU ............................................................................................................... 1
1. Tính cấp thiết của đề tài ............................................................................... 1
2. Mục tiêu của đề tài ....................................................................................... 2
3. Đối tượng và phạm vi nghiên cứu ............................................................... 2
4. Phương pháp nghiên cứu ............................................................................. 2
5. Dự kiến kết quả đạt được ............................................................................. 2
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG .............................. 3
ỨNG DỤNG CỦA NÓ ......................................................................................... 3
1.1. Giới thiệu chung ....................................................................................... 3
1.2. Ứng dụng của XLA .................................................................................. 5
1.3. Các vấn đề cơ bản trong XLA .................................................................. 7
1.3.1. PEL và ảnh số ..................................................................................... 7
1.3.2. Độ phân giải của ảnh .......................................................................... 8
1.3.4. Mức xám của ảnh ............................................................................... 9
1.3.5. Tăng cường ảnh .................................................................................. 9
1.3.6. Khôi phục ảnh .................................................................................. 10
1.3.7. Phân tích ảnh .................................................................................... 11
1.3.8. Nén ảnh............................................................................................. 12
CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN ................................................... 13
2.1. Lọc song phương .................................................................................... 13
2.1.1. Giới thiệu .......................................................................................... 14
2.1.2. Ý tưởng ............................................................................................. 16
2.1.3. Trường hợp Gaussian ....................................................................... 18
2.1.4. Lọc song phương so với phạm vi ..................................................... 19
2.1.5. Lọc song phương với ảnh đen trắng ................................................. 21

iii
2.1.6. Lọc song phương với ảnh màu ......................................................... 24
2.2. Bộ lọc NLM ............................................................................................ 26
2.2.1. Giới thiệu .......................................................................................... 26
2.2.2. Phương pháp nhiễu ........................................................................... 28
2.2.3. Bộ lọc Gaussian ................................................................................ 28
2.2.4. Lọc lân cận ....................................................................................... 28
2.2.5. Thuật toán NLM ............................................................................... 29
2.3. So sánh hiệu quả của các bộ lọc ............................................................. 32
2.4. Bộ lọc làm sắc nét tuyến tính (Linear sharpen) ...................................... 35
2.4.1. Mục đích và ý nghĩa ......................................................................... 35
2.4.2. Bộ lọc làm sắc nét tuyến tính ........................................................... 35
2.5. Kỹ thuật cân bằng màu ........................................................................... 38
2.5.1. Giới thiệu .......................................................................................... 38
2.5.2. Giả thiết Gray World ........................................................................ 38
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC KHÔNG
GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU ...................................................... 40
3.1. Mục đích ................................................................................................. 40
3.2. Xây dựng chương trình thử nghiệm ....................................................... 40
3.2.1. Giới thiệu về OpenCV ...................................................................... 40
3.2.2. Các bước tiến hành ........................................................................... 41
3.3. Kết quả thực nghiệm............................................................................... 46
3.3.1. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh đen trắng trong chương trình thực nghiệm .............................. 46
3.3.2. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân bằng
màu với ảnh màu trong chương trình thực nghiệm ...................................... 48
KẾT LUẬN ......................................................................................................... 51
TÀI LIỆU THAM KHẢO ................................................................................... 52

iv
DANH MỤC TỪ VIẾT TẮT VÀ KÝ HIỆU
Chữ viết tắt Diễn giải
NLM Bộ lọc Non local-mean
PEL Điểm ảnh (Picture Element)
CNTT Công nghệ thông tin
XLA Xử lý ảnh

v
DANH MỤC CÁC BẢNG
Số bảng Tên bảng Trang
2.1 Báo cáo lỗi trung bình 35

vi
DANH MỤC CÁC HÌNH
Số hình Tên hình Số trang
1.1 Quá trình xử lý ảnh 4
1.2 Nhận dạng biển số xe 5
1.3 Hình ảnh mạch trước và sau khi được làm nổi 6
1.4 Ứng dụng của XLA trong công nghiệp 6
1.5 Ảnh giấu tin 7
1.6 Sự phân bố PEL 8
1.7 Độ tương phản của ảnh 10
1.8 Khôi phục ảnh 11
1.9 Kết quả của một phép dò biên 12
2.1 Ví dụ về hoạt động của bộ lọc không gian 13
2.2 Lọc song phương 18
2.3 Biểu đồ cường độ ảnh 20
2.4 Lọc song phương với các sigma khác nhau 22
2.5 Ví dụ về lọc song phương 23
2.6 Lọc song phương với ảnh đen trắng 23
2.7 Lọc song phương với ảnh màu 25
2.8 Lọc song phương với ảnh màu 26
2.9 Sơ đồ NLM 30
2.10 Sự phân bố trọng số trong NLM 31
2.11 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 33
2.12 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 33
2.13 Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên 35
2.14 Bộ lọc linear sharpen 36
2.15 Ví dụ cho ứng dụng của OpenCV 37
2.16 Cân bằng màu Gray-world 39
3.1 Ứng dụng của OpenCV về dò cạnh 40
3.2 Thực nghiệm với ảnh đen trắng 46
3.3 Cân bằng màu với ảnh đen trắng 47
3.4 Thực nghiệm với ảnh màu 49
3.5 Cân bằng màu với ảnh màu 50

vii
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Công nghệ thông tin (CNTT) đang giữ một vai trò quan trọng không chỉ
trong các ngành công nghiệp, quân sự, nghiên cứu, giải trí…mà ngay cả trong
đời sống và nhu cầu ngày ngày của con người. Có rất nhiều các chuyên ngành
khác nhau trong công nghệ công tin và trong số đó XLA là một chuyên ngành
quan trọng và đã có từ rất lâu đời.
Xử lý ảnh (XLA) là một lĩnh vực mang tínhcông nghệvà khoa học. Nó là
một ngành khoa học mới mẻ so với nhiều ngành khoa học khác nhưng tốc độ
phát triển của nó rất nhanh, thu hút các trung tâm nghiên cứu, ứng dụng, đặc biệt
là máy tính chuyên dụng dành riêng cho nó.XLA được ứng dụng để đáp ứng nhu
cầu thiết yếu của con người và xã hội. Các ứng dụng nổi bật của XLA như nhận
dạng vân tay, phục chế ảnh, giám sát thực thể, nhận dạng khuôn mặtdựng ảnh
3D…đã đem lại nhiều lợi ích trong nhiều lĩnh vực.
Con người thu nhận thông tin bằng thị giác, vì thế bất cứ ai cũng mong
muốn thu nhận được hình ảnh có chất lượng tốt. Để có được những hình ảnh
như vậy, bức ảnh ban đầu phải trải qua rất nhiều công đoạn và rất nhiều các kỹ
thuật được sử dụng để thay đổi và giúp nó có chất lượng tốt hơn như làm trơn,
làm sắc nét, lọc nhiễu, cân bằng màu…. Tiêu biểu và quan trọng trong số đó là
sử dụng các bộ lọc không gian.
Hình ảnh thu được từ các thiết bị thu nhận số như camera, camcoder
thường bị ảnh hưởng bởi các nhiễu và điều kiện sáng nên có thể bị mờ, quá tối
hoặc quá sáng hoặc không nhấn mạnh được đối tượng chụp. Điều đó gây khó
khăn rất nhiều cho các công tác học tập, nghiên cứu và ứng dụng thực tiễn, nó
khiến cho hiệu quả công việc giảm và độ chính xác không cao đặc biệt là trong
các lĩnh vực đòi hỏi sự tỉ mỉ và chính xác. Để khắc phục điều này, các bộ lọc
không gian như lọc song phương, lọc Nonlocal-mean (NLM) và Linear sharpen
cùng kỹ thuật cân bằng màu sắc là những giải pháp tốt.
Xuất phát từ thực tế đó, tôi lựa chọn đề tài: “Cải thiện chất lượng ảnh dựa
trên các bộ lọc không gian”. Đây là vấn đề đã và đang được quan tâm và hứa

1
hẹn sẽ được tiếp tục phát triển trong tương lai phù hợp với thực tiễn và cuộc
sống, đặc biệt là trong giai đoạn đất nước đang từng bước phát triển và đi lên,
CNTT đang thực sự bùng nổ như ngày nay.
2. Mục tiêu của đề tài
Mục tiêu của đề tài là sử dụngcác bộ lọc không gian, kỹ thuật cân bằng
màu để nâng cao chất lượng hình ảnh từ các ảnh tĩnh và video. Từ một bức ảnh
đầu vào với chất lượng hình ảnh kém như bị nhiễu, mờ, không sắc nét, màu sắc
xa với thực tế, sau khi sử dụng các bộ lọc không gian và kỹ thuật cân bằng màu
sẽ đưa ra một kết quả tốt hơn: sắc nét, mượt,đảm bảo được các đường nét ban
đầu không mất đi và màu sắc gần hơn với thực tế.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của đề tài:
 Các bộ lọc không gian: Lọc song phương, NLM, Linear sharpen tập
trung chủ yếu vào các thuật toán được sử dụng trong bộ lọc và cách thức hoạt
động của chúng.
 Kỹ thuật cân bằng màu sắc
Phạm vi nghiên cứu:
 Dựa trên các lý thuyết chung về XLA để giải thích và đưa ra những
phương pháp cụ thể.
 Lý thuyết về các bộ lọc không gian và các khái niệm liên quan
 Chương trình thử nghiệm
4. Phương pháp nghiên cứu
Trước tiên, nghiên cứu sẽ đưa ra các lý thuyết về XLA và các bộ lọc không
gian, kỹ thuật cân bằng màu được đề cập đến.Dựa trên nền tảng lý thuyết để xây
dựng một chương trình thử nghiệmvới ảnh tĩnh và video.
5. Dự kiến kết quả đạt được
Đưa ra được kết quả nghiên cứu về mặt lý thuyết: Ý nghĩa và ứng dụng của
XLA nói chung và các bộ lọc không gian, kỹ thuật cân bằng màu nói riêng trong
khoa học công nghệ và đời sống.Đưa ra được kết quả của việc áp dụng lý thuyết
trên vào các hình ảnh thực tế thông qua chương trình thử nghiệm.

2
CHƯƠNG I: GIỚI THIỆU CHUNG VỀ XLA VÀ NHỮNG
ỨNG DỤNG CỦA NÓ
1.1. Giới thiệu chung
Khoảng hơn mười năm trở lại đây, XLA đã được đưa vào giảng dạy trong
chương trình đại học ở nước ta. Nó là môn học có liên quan đến nhiều lĩnh vực
và cần nhiều kiến thức cơ sở khác nhau. Đầu tiên là xử lý tín hiệu số, đây là một
môn học cơ bản cho xử lý tín hiệu chung, các khái niệm về các bộ lọc hữu
hạn,tích chập, các biến đổi Fourier, Laplace, … Thứ hai, các công cụ toán như
đại số tuyến tính, sác xuất thống kê. Bên cạnh đó là một số kiến thức cần thiết
như trí tuệ nhân tao, mạng nơ ron nhân tạo cũng được nhắc đến trong quá trình
phân tích và nhận dạng ảnh. Tiền đề của các phương pháp XLA là các ứng
dụng: nâng cao chất lượng ảnh và phân tích ảnh. Ứng dụng đi đầu được biết đến
là nâng cao chất lượng ảnh báo truyền qua cáp từ London đến NewYork từ
những năm 1920.
Nâng cao chất lượng ảnh có liên quan đến việc phân bố mức sáng và độ
phân giải của ảnh. Nâng cao chất lượng ảnh phát triển vào khoảng những năm
1955. Điều này là vì sau chiến tranh thế giới thứ hai, máy tính phát triển nhanh
tạo điều kiện thuận lợi cho quá trình XLA số phát triển. Năm 1964, máy tính đã
có khả năng xử lý, nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ cụ thể là: làm nổi đường biên, lưu ảnh. Từ năm 1964 đến nay, các phương
tiện nâng cao và xử lý nâng cao chất lượng, nhận dạng ảnh đã phát triển không
ngừng. Các phương pháp tri thức nhân tạo như các thuật toán xử lý cải
tiến,mạng nơ ron nhân tạo, các công cụ nén ảnh đã ngày càng được áp dụng
rộng rãi và gặt hái được nhiều kết quả khả quan. Trước đây ảnh thu qua Camera
là các ảnh tương tự (loại Camera ống CCIR). Gần đây, với sự phát triển của
công nghệ, ảnh được lấy ra từ camera là ảnh đen trắng hoặc màu, sau đó nó
được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. (Ví dụ điển
hình là máy ảnh số). Mặt khác, ảnh cũng có thể tiếp nhận qua vệ tinh, có thể
được quét từ ảnh chụp bằng máy quét ảnh.

3
Quá trình XLA:

Nhận dạng và
Thu nhận ảnh Biến đổi ảnh
nội suy

Cơ sở tri Cơ sở tri Cơ sở tri


thức thức thức

Hình 1.1: Quá trình XLA


 Thu nhận ảnh: Ảnh có thể được nhận qua camera màu hoặc đen trắng.
Thường ảnh nhận qua camera là ảnh tương tự (camera ống chuẩn CCIR với tần
số 1/25, 25 dòngmỗi ảnh), cũng có loại camera đã số hoá (như loại CCD) là loại
photodiot tạo cường độ sáng tại mỗi PEL. Thường dùng nhất là camera loại quét
dòng, ảnh tạo ra có dạng hai chiều. Chất lượng một ảnh thu được phụ thuộc chủ
yếu vào thiết bị thu và môi trường (ánh sáng, phong cảnh)
 Biến đổi ảnh: Sau bước thu nhận, ảnh được biến đổi bằng việc sử dụng
các kỹ thuật nâng cao chất lượng ảnh để thu được ảnh có chất lượng tốt, chứa
đựng nhiều thông tin và có thể quan sát bằng mắt.
 Nhận dạng và nội suy ảnh: Nhận dạng ảnh là quá trình xác định ảnh.
Quá trình này thu được bằng cách so sánh với mẫu chuẩn đã được học (hoặc
lưu) từ trước. Nội suy là phán đoán dựa trên ý nghĩa trên cơ sở nhận dạng. Ví
dụ: một loạt nét gạch ngang và chữ số trên phong bì có thể được nội suy thành
loại mã điện thoại. Có nhiều cách phân loai ảnh khác nhau về ảnh. Theo lý
thuyết về nhận dạng, các mô hình toán học về ảnh được phân loại theo hai dạng
nhận dạng ảnh cơ bản: Nhận dạng theo cấu trúc vànhận dạng theo tham số. Một
số đối tượng nhận dạng phổ biến hiện nay được áp dụng trong khoa học và công

4
nghệ là: nhận dạng văn bản (Text),nhận dạng ký tự (chữ in, chữ ký điện tửchữ
viết tay), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt người…
Ảnh là một đối tượng khá phức tạp về độ sáng tối, đường nét, dung lượng
PEL, môi trường để thu ảnh phong phú kèm theo nhiễu. Trong nhiều khâu phân
tích và XLA ngoài việc đơn giản hóa các phương pháp toán học đảm bảo tiện lợi
cho xử lý, người ta mong muốn học hỏi quy trình tiếp nhận và XLA theo cách
của con người. Trong các bước xử lý đó, nhiều khâu đã xử lý theo các phương
pháp trí tuệ con người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
1.2. Ứng dụng của XLA
XLA có ứng dụng trong việc lưu trữ dữ liệu, tra cứu thông tin: Để giảm
dung lượng lưu trữ ảnh, ảnh được nén dưới dạng *.jpg, *tif...
Ứng dụng trong việc nhận dạng: Nhận dang khuôn mặt, vân tay, chữ số, ký
tự, biển số xe…Ứng dụng trong việc xác thực: Xác thực đăng nhập windown 8
bằng hình ảnh…

Hình 1.2: Nhận dạng biển số xe


Trong y học, XLA cũng có vai trò rất quan trọng trong việc đưa ra những
hình ảnh có chất lượng cao, rõ nét, giúp cho việc chẩn đoán bệnh khách quan,
nhanh chóng và chính xác hơn. Trong đó, việc làm nổi các chi tiết trong ảnh là
một trong những ứng dụng quan trọng và có ỹ nghĩa.

5
Hình 1.3: Hình ảnh mạch trước và sau khi được làm nổi (từ trái qua phải)
Trong công nghiệp, XLA có ứng dụng trong việc xấy dựng các hệ thống
máy nhìn công nghiệp để kiểm tra và điều khiển các sản phẩm: Hệ thống phân
tích hình ảnh nhằm phát hiện bọt khí bên trong vật thể được đúc bằng nhựa, phát
hiện các linh kiện không đạt tiêu chuẩn trong sản xuất, từ camera quan sát, đếm
được sản phẩm dựa vào hệ thống đếm sản phẩm.

Hình 1.4: Ứng dụng của XLA trong công nghiệp

6
XLA còn có ứng dụng hiệu quả trong việc dấu dữ liệu để phục vụ cho việc
trao đổi thông tin mật. Cụ thể như : Dấu tin trong ảnh, dấu video trong ảnh hay
dấu ảnh trong ảnh.

Hình 1.5: Ảnh giấu tin : Ảnh bên trái là được giấu tin, đoạn văn bản bên
phải là đoạn văn bản được giấu trong ảnh
1.3. Các vấn đề cơ bản trong XLA
1.3.1. PEL và ảnh số
Gốc của ảnh hay gọi là ảnh tự nhiê là ảnh liên tục về độ sáng và không
gian. Để xử lý bằng máy tính (số) thì hình ảnh cần phải được số hoá. Sự biến đổi
gần đúng một ảnh liên tục thành một tập điểm phù hợp với ảnh thật về độ sáng
(mức xám)và vị trí (không gian) gọi là số hóa ảnh. Khoảng cách giữa các PEL
này được thiết lập sao cho mắt người không thể phân biệt được ranh giới giữa
chúng. Mỗi một điểm như vậy gọi là điểm ảnh (PEL: Picture Element) hay gọi
tắt là Pixel. Trong phạm vi ảnh hai chiều, mỗi pixel ứng với tọa độ (x, y).
Định nghĩa: PEL (pixel) là một phần tử có toạ độ (x, y) của ảnh số với độ
màu hoặc xám nhất định. Kích thước và khoảng cách giữa các PEL đó được
chọn phù hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi một phần tử trong ma trận
được xem là một phần tử ảnh.
Ảnh số là tập hợp các PEL với mức xám phù hợp dùng để mô tả ảnh gần
với ảnh thật.

7
1.3.2. Độ phân giải của ảnh
Định nghĩa: Độ phân giải của ảnh là mật độ PEL được ấn định trên một ảnh
số.
Theo định nghĩa, khoảng cách giữa các PEL phải được thiết lập sao cho
mắt người thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách phù hợp
tạo nên một mật độ phân bố, đó chính là độ phân giải và được phân bố theo trục
y và trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA là một lưới điểm theo
chiều ngang màn hình: 320 điểm theo chiều dọc * 200 PEL (320*200). Thực tế
là, cùng màn hình CGA 12 inh ta nhận thấy mịn hơn màn hình CGA 17 inh độ
phân giải 320*200. Lý do là vì cùng một mật độ (độ phân giải) nhưng diện tích
màn hình rộng hơn thì độ mịn (liên tục của các PEL) kém hơn.

Hình 1.6: Sự phân bố PEL: Số lượng PEL phân bố tăng dần trên cùng một
kích thước ảnh

8
1.3.4. Mức xám của ảnh
Một PEL (một pixel) có hai đặc trưng cơ bản là độ xám của nóvà vị trí (x,
y) của PEL. Dưới đây là một số khái niệm và thuật ngữ thường được đề cập tới
trong XLA.
Định nghĩa: Mức xám của PEL là cường độ sáng của PEL được gán bằng
giá trị số tại điểm đó.
 Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256. Mức 256
là mức phổ dụng nhất.
 Ảnh đen trắng: là ảnh có hai màu trắng và đen(không chứa màu khác)
với mức xám ở các PEL có thể khác nhau.
 Ảnh nhị phân: ảnh chỉ có 2 mức trắng đen phân biệt tức là dùng 1 bit
mô tả 21 mức khác nhau. Nói theo một cách khác: mỗi PEL của ảnh nhị phân
chỉ có thể là 1 hoặc 0.
 Ảnh màu: trong phạm vi lý thuyết ba màu RBG(Red, Blue, Green) để
tạo nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các
giá trị màu: 28*3=224≈ 16,7 triệu màu.
1.3.5. Tăng cường ảnh
Tăng cường ảnh là việc giảm nhiễu ảnh, tăng độ tương phản giữa các cấu
trúc. Các kỹ thuật tăng cường ảnh còn tăng cường các thuộc tính cảm nhận làm
cho ảnh tốt lên, tiện phục vụ cho các xử lý tiếp theo.

Các kỹ thuật tăng cường ảnh gồm kỹ thuật phi tuyến, tuyến tính, thích
nghi, cố định, kỹ thuật dựa vào pixel hay kỹ thuật đa mức. Các kỹ thuật được
chia làm hai nhóm: Nhóm tăng cường ảnh trong miền không gian và nhóm phục
hồi ảnh trong miền tần số.

Các thao tác chính: Làm sắc nét đường biên, lọc phi tuyến, lọc tuyến tính,
phóng to, thu nhỏ, làm trơn, thay đổi độ tương phản, sửa đổi mức xám đồ…

 Thay đổi độ tương phản: Trong thực tế, khi hai đối tượng có cùng độ sáng
đặt ở hai nền khác nhau thì sẽ cho ta những cảm nhận khác nhau. Chính vì vậy,
độ tương phản thể hiện sự thay đổi độ sáng của đối tượng so với nền, hiểu theo

9
một cách khác thì độ tương phản là độ nổi của PEL so hay một vùng ảnh so với
nền. Do điều kiện sáng tối khác nhau hay do biến động của bộ cảm nhận ảnh
mà ảnh của độ tương phản khác nhau. Để thay đổi độ tương phản của ảnh thì ta
phải thay đỏi biên độ trên toàn dải bằng cách biến đổi tuyến tính biên độ đầu
vào hay phi tuyến.
 Lọc tuyến tính: Bao gồm lọc thông thấp, đồng hình và trung bình, loại lọc
này được dùng cho các loại nhiễu phân bố khắp ảnh (nhiễu cộng và nhiễu
nhân).
 Lọc phi tuyến: Bao gồm lọc trung vị, giả trung vị và lọc ngoài. Loại lọc
này dùng cho các loại nhiễu gây đột biến tại một PEL (nhiễu xung).

a b
Hình 1.7: Độ tương phản của ảnh. a: ảnh có độ tương phản cao, b:
ảnh có độ tương phản thấp

1.3.6. Khôi phục ảnh


Mục đích: Khôi phục lại ảnh ban đầu, loại bỏ các biến dạng ra khỏi ảnh tùy
theo nguyên nhân gây ra biến dạng. Kỹ thuật được sử dụng để khôi phục lại hình
ảnh như làm giảm mờ, nhiễu và áp dụng các bộ lọc tuyến tính, không gian…để
có được ảnh gần nhất với ảnh gốc. Nguyên nhân gây ra sự suy giảm ảnh có rất
nhiều và khôi phục ảnh là một trong những lĩnh vực quan trọng trong xử lý hình
ảnh. Nguyên nhân của sự suy giảm thường bao gồm mờ và nhiễu. Mờ có thể do
đối tượng trong hình ảnh bị mất nét khi phơi sáng, trong khi chuyển động mờ có
thể được gây ra khi một đối tượng di chuyển so với máy ảnh khi phơi sáng. Mục
đích của phục hồi hình ảnh là để " bù" hoặc "khôi phục" sai hỏng- những cái đã
làm suy giảm hình ảnh. Suy giảm có nhiều hình thức như chuyển động làm mờ,
nhiễu, mất tiêu cự camera... Trong trường hợp như làm mờ chuyển động, có thể

10
đưa ra một ước lượng rất tốt so với mờ thực tế và "khôi phục" mờ để khôi phục
lại hình ảnh gốc. Trường hợp ảnh bị lỗi bởi nhiễu, có thể thực hiện bù nhiễu.

Hình 1.8: Khôi phục ảnh. Từ trái qua phải: phần ảnh trước và sau khi được khôi phục
1.3.7. Phân tích ảnh
Mục đích: Đưa ra ra các đặc trưng của ảnh, xây dựng mối quan hệ giữa
chúng dựa vào các đặc trưng cục bộ.Tìm biên, tách biên, , phân vùng ảnh,làm
mảnh đường biên và phân loại đối tượng là các thao tác chính trong phân tích
ảnh. Các phương pháp chính là phát hiện biên cục bộ, dò biên theo quy hoạch
động, phân vùng theo miền đồng nhất, phân vùng dựa theo đường biên.
Như chúng ta biết, biên là vẫn đề chủ yếu trong phân tích ảnh vì các kỹ thuật
phân đoạn ảnh dựa trên biên là chủ yếu. Tập hợp các điểm biên tạo lên biên của
hình ảnh, mỗi PEL có thể xem là điểm biên nếu có sự thay đổi mức xám đột
ngột ở đó. Có hai phương pháp phát hiện biên chính là: Phát hiện biên gián tiếp
và phát hiện biên trực tiếp.
Biên ảnh là những vùng có cường độ tương phản mạnh, dò biên giúp lọc ra
những thông tin hữu ích trong ảnh mà vẫn giữ được những thuộc tính cấu trúc
của hình ảnh. Gradient và Laplacian là hai phương pháp dò biên cơ bản.
Gradient dò biên bằng việc tìm kiếm giá trị lớn nhất và giá trị bé nhất trong đạo
hàm bậc nhất của ảnh, còn Laplacian thì tìm kiếm các vạch không trong đạo
hàm bậc hai của ảnh.

11
Hình 1.9:Kết quả của một phép dò biên
1.3.8. Nén ảnh

Nén ảnh là một kỹ thuật mã hoá các ảnh số hoá để giảm số lượng các bit
dữ liệu cần thiết để biểu diễn ảnh, giảm đi chi phí trong việc lưu trữ ảnh và chi
phí về mặt thời gian để truyền ảnh đi xa trong truyền thông nhưng vẫn đảm bảo
được chất lượng của ảnh.

Nén ảnh thực hiện được là do: thông tin trong bức ảnh không phải là ngẫu
nhiên mà có trật tự, tổ chức.Vì thế nếu làm rõ được trật tự, cấu trúc đó thì sẽ biết
phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và gửi đi với số
lượng bit ít hơn so với ảnh gốc mà vẫn đảm thông tin có được một cách đầy đủ.
Ở bên nhận quá trình giải mã sẽ sắp xếp và tổ chức lại được bức ảnh xấp xỉ gần
chính xác so với ảnh gốc nhưng vẫn thỏa mãn chất lượng yêu cầu.

Nén ảnh có được bằng cách loại bỏ các phần dư thừa trong ảnh đã được số
hoá. Dư thừa có thể là dư thừa về cấp xám, dư thừa thông tin về không gian hay
dư thừa về thời gian.

Có hai phương pháp nén ảnh cơ bản là: Nén không mất thông tin, nén mất thông
tin
 Nén mất thông tin: Khai thác các thông tin dư thừa và các thông tin
không liên quan
 Nén không mất thông tin: Khai tác các thông tin dư thừa
Hiện nay có một số chuẩn nén hay dùng như: JPEG, MPEG…

12
CHƯƠNG II: CÁC BỘ LỌC KHÔNG GIAN
Trong quá trình XLA chúng ta có thể sử dụng các mặt nạ không gian
nhằm làm thay đổi cấu trúc ảnh gọi là các bộ lọc không gian.

Một bộ lọc không gian là một hoạt động ảnh mà trong đó mỗi giá trị
PEL𝐼(𝑢, 𝑣) bị thay thế bởi một hàm của cường độ các PEL trong vùng lân cận
của (𝑢, 𝑣)

Hình 2.1: Ví dụ về hoạt động của bộ lọc không gian

Bên cạnh việc giảm nhiễu, làm mượt hình ảnh,các bộ lọc không gian còn
làm sắc nét các chi tiết và giữ lại những cấu trúc đẹp trong hình ảnh. Dưới đây là
các bộ lọc được đề cập đến trong đề tài.
2.1. Lọc song phương
Song phương là một bộ lọc vừa làm mượt ảnh đồng thời vẫn giữ được các
đường nét của ảnh bằng sự kết hợp phi tuyến tính của các giá trị PEL lân cận.
Phương pháp này không lặp đi lặp lại, cu ̣c bô ̣ và đơn giản. Nó kết hợp các mức
mức xám hoặc màu sắc dựa trên cả sự mật thiết hình học và tương tự về trắc
quang của chúng, và ưu tiên giá trị gần hơn giá trị xa trong cả miền và phạm vi.
Ngược lại với các bộ lọc hoạt động riêng biệt trên ba dải của một ảnh màu, bộ
lọc song phương có thể thực thi các số liệu cơ bản về nhận thức màu CIE-Lab,
làm mịn màu, và giữ gìn các đường nét để phù hơ ̣p với nhâ ̣n thức của con người.
Ngoài ra, trong sự tương phản với việc lọc tiêu chuẩn, lọc song phương không
tạo ra màu sắc ảo dọc theo các đường nét trong ảnh màu mà làm giảm màu sắc
ảo xuất hiện trong hình ảnh ban đầu.

13
2.1.1. Giới thiệu
Lo ̣c có lẽ là hoạt động cơ bản nhất của XLA và thị giác máy tính. Trong ý
nghĩa rô ̣ng của thuật ngữ "lọc", các giá trị của hình ảnh được lọc tại một điểm là
một hàm của các giá trị ảnh đầu vào trong một tâ ̣p hơ ̣p giá tri ̣ lân câ ̣n của cùng
một vị trí. Đặc biệt, lọc thông thấp Gaussian tính toán trung bình các giá trị PEL
được đánh trọng số trong một tâ ̣p hơ ̣p giá tri ̣ lân câ ̣n, trong đó, trọng số giảm
theo khoảng cách từ khu trung tâm lân câ ̣n. Mặc dù những lời giải thích chính
thức và mang tính định lượng về việc suy giảm trọng số đã được đưa ra, theo
trực giác hình ảnh thường thay đổi từ từ trong không gian, vì thế các PEL gầ n
nhau có thể có các giá trị tương tự, và vì vậy việc tiń h trung bình chúng là thích
hợp. Giá trị nhiễu làm hỏng các PEL ở gần nó là có ít tương quan lẫn nhau hơn
so với giá trị tín hiệu, vì vâ ̣y nhiễu được lấy trung bình trong khi tín hiệu được
giữ nguyên. Các giả định về các biến thể không gian thất bại tại các đường nét
những cái bị làm mờ đi bởi bộ lọc thông thấp. Nhiều nỗ lực đã được cống hiến
để giảm ảnh hưởng không mong muốn này. Một câu hỏi đặt ra là: Làm thế nào
chúng ta có thể ngăn chặn viê ̣c trung bình hóa trên các đường nét, trong khi vẫn
trung bình hóa trong các khu vực cần làm mịn?
Sự khuếch tán bất đẳng hướng là một câu trả lời phổ biến: biến hình ảnh
cu ̣c bô ̣ được đo tại mọi điểm, và giá trị PEL được tính trung bình từ các vùng
lân cận nơi mà kích thước và hình dạng của nó phụ thuộc vào biến cu ̣c bô ̣.
Phương pháp khuếch tán tính trung bình trên các vùng miền được mở rộng bằng
cách giải quyết từng phần phương trình vi phân, và đươ ̣c lặp đi lặp lại. Viê ̣c lặp
đi lặp lại có thể làm tăng các vấn đề về tính ổn định và tùy thuộc vào hiệu quả
của kỹ thuật tính toán. Một phương pháp không lặp đi lặp lại được đề xuất cho
việc duy trì độ mịn của đường nét.
Nếu ba dải màu sắc hình ảnh được lọc riêng rẽ ra từ một cái khác, màu sắc
bị hỏng gần đường biên ảnh. Trong thực tế, các dải khác nhau có mức độ khác
nhau của sự tương phản, và chúng được làm mịn khác nhau. Làm mịn tách biệt
xáo trộn sự cân bằng màu sắc, và sự kết hợp màu sắc không mong đơ ̣i xuất hiện.
Nhưng với bộ lọc song phương, nó có thể hoạt động trên ba dải cùng một lúc,

14
và có thể đưa ra một cách rõ ràng rằng màu sắc nào là tương tự và màu sắc nào
là không .
Ý tưởng lọc song phương cơ bản là để thực hiện trong phạm vi của một
hình ảnh những gì mà các bộ lọc truyền thống làm trong phạm vi của nó. Hai
PEL có thể được gép với nhau để chiếm vị trí không gian kế bên, hoặc có thể là
tương tự như nhau để có các giá trị kế bên, có thể trong một cách có ý nghĩa về
mặt nhận thức. Việc gắn kết liên quan đến vùng lân cận trong miền, tương tự với
vùng lân cận trong phạm vi. Lọc truyền thống là lọc miền, thực thi việc gắn kết
bằ ng việc đánh trọng số các giá trị PEL với hệ số dưới với khoảng cách. Tương
tự như vậy, chúng tôi xác định phạm vi lọc mà trong đó trung bình giá tri ̣ PEL
với trọng số phân rã không giống nhau. Lọc phạm vi là phi tuyến vì trọng số
của chúng phụ thuộc vào cường độ hoặc màu sắc hình ảnh. Tính toán, chúng có
vẻ gì phức tạp hơn các bộ lọc tiêu chuẩn không tách rời. Nhưng quan trọng nhất,
chúng có thể giữ lại các đường nét hình ảnh.
Miền không gian vẫn là một khái niệm rất quan trọng. Trong thực tế, chúng
ta thấy rằ ng lọc phạm vi tự nó làm biến dạng bản đồ màu sắc của hình ảnh. Khi
kết hợp lọc phạm vi và miền, thấy rằ ng sự kết hợp là khá thú vị. Đó gọi là lọc
song phương. Do lọc song phương giả định một khái niệm rõ ràng về khoảng
cách trong phạm vi và trong giới ha ̣n chức năng ảnh, chúng có thể được áp dụng
cho bất kỳ chức năng nào khi mà hai khoảng cách có thể được xác định. Đặc
biệt, bộ lọc song phương có thể được áp dụng cho ảnh màu dễ dàng như áp dụng
cho ảnh đen trắng. Các không gian màu CIE-Lab tạo ra không gian màu sắc với
một phương pháp có ý nghĩa nhâ ̣n thức tương tự màu sắc, trong đó khoảng cách
Euclide ngắn tương quan mạnh mẽ với màu sắc mà con người có thể phân biệt.
Vì vậy, nếu chúng ta sử dụng số liệu này trong bộ lọc song phương, hình ảnh sẽ
được làm mịn và đường nét được giữ theo cách đó được điều chỉnh tới cách thể
hiêṇ của con người. Chỉ có màu sắc tương tự về nhận thức được tính trung bình
với nhau, và chỉ những đường nét có tính nhận thức và có thể nhìn thấy mới
được giữ lại. Các khái niệm về lọc song phương sẽ được đề cập dưới đây.

15
2.1.2. Ý tưởng
Một bộ lọc miền thông thấp áp dụng cho hình ảnh f (x) đưa ra một hình ảnh
được xác định như sau:
∞ ∞
−1
𝒉(𝒙) = 𝑘𝑑 (𝑥) ∫ ∫ 𝒇(𝛿)𝑐(𝛿, 𝒙)𝑑𝛿 (2.1)
−∞ −∞

Trong đó c (𝛿; x) đo sự tương đồ ng về mă ̣t hình ho ̣c giữa trung tâm vùng
lân cận x và một điểm gần đó 𝛿 .Phông chữ đâ ̣m cho f và h nhấn mạnh thực tế
rằng cả hình ảnh đầu vào vàđầu ra có thể đa băng tần. Nếu bộ lọc thông thấp giữ
lại các thành phần dc của tín hiệu thông thấp chúng ta có được:
∞ ∞
𝑘𝑑 (𝒙) = ∫ ∫ 𝑐(𝛿, 𝒙)𝑑𝛿 (2.2)
−∞ −∞

Nếu bộ lọc là thay đổi bất biến, c (𝛿; x) chỉ là một hàm của sự khác biệt
vector 𝛿 − 𝑥, và 𝑘𝑑 là không đổi.
Lọc phạm vi được định nghĩa tương tự:
∞ ∞
−1
𝒉(𝒙) = 𝑘𝑑 (𝑥) ∫ ∫ 𝒇(𝛿)𝑠(𝒇(𝛿), 𝒇(𝑥))𝑑𝛿 (2.3)
−∞ −∞

Ngoại trừ rằng 𝑠(𝑓(𝛿), 𝑓(𝑥)) đo sự tương quang giữa các PEL ở trung tâm
vùng ảnh x và của một điểm gần đó. Như vậy, các hàm tương tự s hoạt động
trong phạm vi của hàm hình ảnh f, trong khi hàm ghép c hoạt động trong miền
của f. Việc chuẩn hóa hằng số (2) được thay thế bởi:
∞ ∞
𝑘𝑟 (𝒙) = ∫ ∫ 𝑠(𝑓(𝛿), 𝑓(𝒙))𝑑𝛿 (2.4)
−∞ −∞

Trái với những gì xảy ra với các hàm tương đồ ng c, chuẩ n hóa cho các hàm
tương tự s phụ thuộc vào hàm hình ảnh f. Chúng ta nói rằng các hàm tương tự s
là không thiên vị nếu nó chỉ phụ thuộc vào sự khác biệt 𝑓(𝜉) − 𝑓(𝑥). Sự phân
bố không gian của các cường độ ảnh không có vai trò trong lọc phạm vi được
thực hiện bởi chính nó. Kết hợp cường độ từ toàn bộ ảnh, tuy nhiên, làm ít hơn,
vì giá trị hình ảnh xa x nên không ảnh hưởng đến giá trị cuối cùng tại x. Ngoài
ra, lọc phạm vi chỉ đơn thuần là thay đổi bản đồ màu của một hình ảnh, và do đó
ít được sử dụng . Các giải pháp thích hợp là kết hợp lọc miền và lọc phạm vi,

16
qua đó thực thi cả hai miền hình học và trắc quang. Lọc kết hợp có thể được mô
tả như sau:
∞ ∞
−1
𝐡(𝐱) = k (𝐱) ∫ ∫ f(δ)c(δ, 𝐱)s(𝐟(δ), 𝐟(𝐱))dδ (2.5)
−∞ −∞

Với chuẩ n hóa


∞ ∞
𝑘(𝑥) = ∫ ∫ 𝑐(𝛿, 𝑥)𝑠(𝑓(𝛿), 𝑓(𝛿), 𝑓(𝑥)) (2.6)
−∞ −∞

Kết hợp lọc miền và phạm vi sẽ được thể hiện như lọc song phương. Nó
thay thế các giá trị PEL tại x với trung bình của các giá trị PEL tương tự lân cận.
Trong khu vực được làm min,
̣ giá trị PEL trong một vùng tương đồ ng nhỏ
tương tự như các khu khác, và các hàm tương tự được chuẩ n hóa 𝑘 −1 s là giố ng
nhau. Như một hệ quả, các bộ lọc song phương đóng vai trò cơ bản như một bộ
lọc miền tiêu chuẩn, những khác biệt tương quan yếu giữa các giá trị PEL gây ra
bởi nhiễu.
Bây giờ một ranh giới rõ ràng giữa một vùng tối và vùng sáng, như trong
hình 2.2(a). Khi bộ lọc song phương được tập trung, nói rằng, trên một PEL ở
bên sáng của đường biên, các hàm tương tự s của các giá trị giả định gần 1 cho
các PEL trên cùng một bên, và gần 0 cho các PEL ở bên tối. Các hàm tương tự
được thể hiện trong hình 2.2(b) cho một bộ lọc hỗ trợ 23 × 23 tập trung hai
PEL bên phải của các bước trong hình 2.2(a). Việc chuẩn hóa thuật ngữ 𝑘(𝑥)
đảm bảo rằng các trọng số cho tất cả các PEL tăng thêm một. Kết quả là, các bộ
lọc thay thế các PEL sáng trung tâm bằng trung bình của các PEL sáng trong
vùng lân cận của nó, và về cơ bản bỏ qua các PEL tối. Ngược lại, khi bộ lọc tập
trung vào một PEL tối, các PEL sáng được bỏ qua thay thế. Vì vậy, như thể hiện
trong hình 2.2(c), viê ̣c lọc được thực hiện tốt tại các ranh giới, nhờ vào thành
phần của lọc miền, và các cạnh sắc nét được giữ lại đồng thời, nhờ thành phần
của lọc phạm vi.

17
Hình 2.2: Lọc song phương. (a) Một bước cấp độ màu xám 100 bị nhiễu
loạn bởi nhiễu Gaussian với 𝜎 = 10 các mức xám. (b) Kết hợp trọng số tương
tự 𝑐(𝛿, 𝑥)𝑠(𝑓(𝛿), 𝑓(𝑥)) cho một vùng lân cận 23 × 23 tập trung hai PEL-bên
phải của bước (a). Các thành phần của lọc phạm vi ngăn chặn hiệu quả các
PEL trên bên tối. (c) Bước (a) sau khi lọc song phương với 𝜎𝑟 = 50 mức xám và
𝜎𝑑 = 5 PEL.
2.1.3. Trường hợp Gaussian
Một trường hợp đơn giản và quan trọng của lọc song phương là lọc
Gaussian thay đổi bất biến, trong đó cả hai hàm tương đồ ng 𝑐(𝛿, 𝑥) và hàm
tương tự 𝑠(𝜙, 𝑓) là những hàm Gaussian của khoảng cách Euclide giữa các đối
số đó. Cụ thể hơn, c là đối xứng xuyên tâm
1 𝑑(𝜉,𝑥) 2
− ( )
𝑐(𝜉, 𝑥) = 𝑒 2 𝜎𝑑
(2.7)
Trong đó :
𝑑(𝜉, 𝑥) = 𝑑(𝜉 − 𝑥) = ||𝜉 − 𝑥||
là khoảng cách Euclide giữa 𝜉 𝑣à 𝑥. Hàm tương tự s là hoàn toàn giống như c:
1 𝛿(𝑓(𝜉),𝑓(𝑥)) 2
− ( )
𝑠(𝜉, 𝑥) = 𝑒 2 𝜎𝑟 (2.8)
Trong đó :
𝛿(𝜙, 𝑓) = 𝛿(𝜙 − 𝑓) = ||𝜙 − 𝑓|| (2.9)
là một phương pháp đo phù hợp của khoảng cách giữa hai giá trị cường độ
𝜙 và f. Trong các trường hợp vô hướng, điều này có thể đơn giản là chênh lệch
tuyệt đối của sự khác biệt PEL hay vì nhiễu tăng với cường độ ảnh, một phiên
bản phụ thuộc cường độ của nó.

18
Sự mở rộng hình học 𝜎𝑑 trong miền được lựa chọn dựa trên số lươ ̣ng
mong muốn của lọc thông thấp. Một lươ ̣ng lớn 𝜎𝑑 sẽ làm mờ nhiều hơn, có
nghĩa là, nó kết hợp các giá trị từ vị trí xa hình ảnh. Ngoài ra, nếu một hình ảnh
được thu nhỏ hoặc phóng to, 𝜎𝑑 phải được điều chỉnh cho phù hợp để có được
kết quả tương đương. Tương tự như vậy, sự mở rộng trắc quang 𝜎𝑟 trong phạm
vi hình ảnh được thiết lập để đạt được số lươ ̣ng mong muốn các PEL được kết
hợp. Có thể nói, PEL có giá trị gầ n hơn với cái khác 𝜎𝑟 được trộn lẫn với nhau
và giá trị xa hơn 𝜎𝑟 thì không. Nếu ảnh bị khuếch đại hoặc suy giảm, 𝜎𝑟 phải
được điều chỉnh cho phù hợp để kết quả không thay đổi.
2.1.4. Lọc song phương so với phạm vi
Khi ta kết hợp việc lọc phạm vi với việc lọc miền để ta ̣o ra các bộ lọc song
phương. Ta thấy rằng sự kết hợp này là điều cần thiết. Để kí hiệu đơn giản, lý
thuyết giới hạn với hình ảnh đen trắng, nhưng những kết quả tương tự vẫn áp
dụng tốt cho hình ảnh gồm nhiều dả. Điểm chính ở đây là cho thấy việc lọc
phạm vi chỉ đơn thuần là thay đổi bản đồ xám của ảnh được áp dụng. Đây là một
hệ quả trực tiếp của thực tế là một bộ lọc phạm vi không có khái niệm về không
gian.
Hãy xem 𝑣(𝜙) là được sự phân bố tần số của các mức xám trong những
hình ảnh đầu vào. Trong trường hợp rời rạc 𝑣(𝜙) là biểu đồ các cấp độ màu xám
𝜙: là một số nguyên điển hình nằm trong dải từ 0 đến 255, và 𝑣(𝜙) là một phần
của PEL có giá trị màu xám của 𝜙. Trong trường hợp liên tục 𝑣(𝜙)𝑑(𝜙) là một
phần của vùng ảnh có giá trị xám giữa 𝜙 và 𝜙 + 𝑑𝜙.
Thao tác đơn giản, bỏ qua cho sự thiếu hụt về không gian, chỉ ra rằng các
biểu thức cho bộ lọc phạm vi có thể được kết hợp như sau:

ℎ = ∫ 𝜙𝜏( 𝜙, 𝑓)𝑑𝜙 (2.10)
0

Trong đó :
𝑠(𝜙,𝑓)𝑣(𝜙)
𝜏(𝜙, 𝑓) = ∞ (2.11)
∫0 𝑠(𝜙,𝑓)𝑣(𝜙)𝑑𝜙

19
độc lập với vị trí x. Phương trình (7) cho thấy việc lọc phạm vi là một chuyển
đổi đơn giản về mức độ xám. Các ánh xạ hạt nhân 𝜏(𝜙, 𝑓) là hàm mật độ, trong
đó nó là không âm và có đơn vị tích phân. Nó bằng với biểu đồ 𝑣(𝜙) được
đánh trọng số hàm tương tự s được tập trung tại f và chuẩn hóa cho đơn vị diện
tích. Trong đó 𝜏 chính thức là một hàm mật độ.

Hình 2.3: Biểu đồ cường độ ảnh(a)Mộtbiểu đồ ảnh đơn thức 𝑣 (solid), và


chức năng tương tự Gaussian s(nét đứt). Sản phẩm chuẩn hóa của chúng 𝜏
(chấm) là bị lệch sang bên phải. (b) Biểu đồ (solid) của cường độ ảnh cho các
bước trong hình 2.2(a) và (nét đứt) cho ảnh được lọc trong hình 2.2(c). (c) Biểu
đồ của cường độ ảnh cho ảnh trong hình 2.6(a)(solid) và cho các ảnh đầu ra với
𝜎𝑟 =100, 𝜎𝑑 =3 (nét đứt) và với 𝜎𝑟 =100, 𝜎𝑑 =10 (chấm) từ hình 2.4.
Trong thực tế, giả sử rằng các biểu đồ 𝑣(𝑓) của hình ảnh đầu vào là một
đường cong đứt như trong hình 2.3 (a), và xem xét giá trị đầu vào của f nằm ở cả
hai bên của đường cong hình chuông này. Trong đó các hàm tương tự đối xứng s
đươ ̣c tâ ̣p trung tại f, trên sườn lên của biểu đồ, các sản phẩm 𝑠𝑣 sản xuất mật độ
lệch 𝜏(𝜙, 𝑓). Ở phía bên trái của chiếc chuông, 𝜏 bị nghiêng về bên phải, và
ngược lại. Kể từ khi chuyển đổi giá trị ℎ là trung bình của mật độ lệch này,
chúng ta có ℎ > 𝑓 ở phía bên trái và ℎ < 𝑓 ở phía bên phải. Như vậy, hai cánh
của biểu đồ được nén lại với nhau.
Lúc đầu, kết quả cho thấy rằng lọc phạm vi là một ánh xạ đơn giản của bản
đồ màu xám dường như làm cho lọc phạm vi khá không hiệu quả. Mọi thứ khác
đi khi lọc phạm vi được kết hợp với bộ lọc miền để tạo thành lọc song phương,
như thể hiện trong phương trình (5) và (6). Trong thực tế, xem xét đầu tiên một
hàm miền tương đồ ng c là hằng số trong một cửa sổ tâm tại x, và là 0 ở chỗ

20
khác. Sau đó, các bộ lọc song phương chỉ đơn giản là một bộ lọc phạm vi áp
dụng cho các cửa sổ. Ảnh được lọc vẫn là kết quả của một ánh xạ cu ̣c bô ̣ của
bản đồ màu xám, nhưng rất thú vị, bởi vìánh xạ là khác nhau tại các điểm khác
nhau trong hình ảnh.
2.1.5. Lọc song phương với ảnh đen trắng
Chúng ta tiếp tục phân tích hiệu suất của bô ̣ lo ̣c song phương trên hình ảnh
đen trắng. Hình 2.6(a) và 2.6(b) bên đưới cho thấy khả năng của bộ lọc song
phương cho việc loại bỏ các cấu trúc. Một số lượng lượng tử hóa mức xám có
thể được nhìn thấy trong hình 2.6(b), nhưng điều này là do quá trình in ấn,
không phải bởi bộ lọc. Những hình ảnh "đơn giản hóa" minh họa bằng hình
2.6(b) có thể cho thấy ích lợicủa việc nén dữ liệu mà không mất đặc tính hình
dạng tổng thể trong các ứng dụng như truyền hình ảnh, chỉnh sửa hình ảnh và
thao tác, mô tả hình ảnh cho phục hồi. Chú ý rằng trong bức ảnh con vượn châu
Phi thì râu của nó mỏng hơn so với cửa sổ của bộ lọc và vẫn còn sắc nét sau khi
lọc. Các giá trị cường độ PEL tối được tính trung bình từ cả hai phía của râu,
trong khi các PEL sáng từ râu được bỏ qua bởi vì các thành phần phạm vi của bộ
lọc. Ngược lại, khi các bộ lọc tập trung ở đâu đó trên râu thì chỉ có giá trị PEL
tại râu được tính trung bình với nhau.
Hình 2.4 cho thấy ảnh hưởng của các giá trị khác nhau của thông số 𝜎𝑑 và
𝜎𝑟 trên ảnh kết quả. Các hàng tương ứng với số lượng khác nhau của lọc miền,
cột là số lươ ̣ng khác nhau của lọc phạm vi. Khi giá trị của hằng số lọc phạm vi
𝜎𝑟 là lớn (100 hoặc 300) đối với các giá trị phạm vi tổng thể trong ảnh (từ 1 đến
254), các thành phần phạm vi của các bộ lọc có tác dụng rất ít tới 𝜎𝑑 : tất cả các
giá trị PEL trong bất kỳ khu vực có cùng trọng số từ lọc phạm vi, và lọc miền
hoạt động như một bộ lọc Gaussian chuẩn. Hiệu ứng này có thể được nhìn thấy
trong hai cột cuối cùng của hình 2.4. Đối với giá trị nhỏ hơn thông số lọc dải 𝜎𝑟
(10 hoặc 30), lọc phạm vi chiếm ưu thế về mặt nhận thức, vì nó duy trì đường
nét.
Tuy nhiên, cho 𝜎𝑑 = 10, chi tiết hình ảnh đã được loại bỏ bởi giá trị nhỏ
hơn 𝜎𝑑 lại xuất hiện. Điều này dường như là nghịch lý hiệu quả có thể được

21
nhận thấy ở hàng cuối cùng của hình 2.4, và trong mẫu đặc biệt ấn tượng cho 𝜎𝑟
= 100, 𝜎𝑑 = 10 này hình ảnh sinh động hơn ở trên, mặc dù hơi mờ. Đây là kết
quả của việc chuyển đổi bản đồ màu xám và kết quả nén biểu đồ. Trong thực tế,
𝜎𝑑 = 10 là một Gaussian rộng, và bộ lọc song phương một bộ lọc phạm vi. Vì
giá trị cường độ chỉ được ánh xạ bởi một bộ lọc phạm vi, việc mất đi các chi tiết
không xảy ra. Hơn nữa, kể từ khi một bộ lọc phạm vi nén các biểu đồ hình ảnh,
những hình ảnh đầu ra dường như là mơ hồ. Hình 2.3(c) cho thấy các biểu đồ
cho các hình ảnh đầu vào và cho hai hình ảnh đầu ra cho 𝜎𝑟 = 100, 𝜎𝑑 = 3, và
cho 𝜎𝑟 =100, 𝜎𝑑 = 10. Hiệu quả nén là hiển nhiên.

Hình 2.4: Chi tiết từ hình 2.6(a) được xử lý với các bộ lọc song phương với các
giá trị phạm vi và các thông số miền khác nhau

Lọc song phương với các thông số 𝜎𝑟 = 3 và 𝜎𝑟 = 50 giá trị cường độ


PELđược áp dụng cho các hình ảnh trong hình 2.5(a) và 2.5(b). Chú ý rằng hầu
hết các cấu trúc tốt đã được lọc đi, và tất cả các đường nét là sắc nét như trong
ảnh gốc.

22
Về thời gian tính toán, các bộ lọc song phương chậm hơn hai lần so với
một bộ lọc miền không phân chia của cùng một kích thước. Các thành phần dải
phụ thuộc phi tuyến trên hình ảnh, và không thể tách rời. Một thủ thuật đơn giản
mà giảm thời tính toán đáng kể là để tính trước tất cả các giá trị cho các hàm
tương tự 𝑠(𝜙, 𝑓). Trong trường hợp Gaussian, nếu các hình ảnh có các mức n,
có 2n + 1 giá trị có thể gán cho s, một cho mỗi giá trị có thể có của sự khác biệt
𝜙 − 𝑓.

Hình 2.5: Ảnh trước (a)𝜎𝑟 = 3 và sau (b)𝜎𝑟 = 50 trong lọc song phương

(a) (b)
Hình 2.6: Trước (a) và sau (b) khi lọc song phương

23
2.1.6. Lọc song phương với ảnh màu
Đối với hình ảnh đen trắng, cường độ giữa hai mức xám bất kỳ vẫn là các
mức xám. Như một hệ quả, khi làm mịn hình ảnh đen trắng với một bộ lọc thông
thấp tiêu chuẩn, các mức xám trung bình được sản sinh trên các cạnh, do đó tạo
ra hình ảnh mờ. Với các ảnh màu, một biến chứng phát sinh thêm từ thực tế là
giữa hai màu bất kỳ có một màu khác, màu sắc thường khá khác nhau. Ví dụ,
giữa màu xanh và màu đỏ có sắc thái khác nhau của màu hồng và màu tím. Do
đó, đáng lo ngại là dải màu sắc có thể được tạo ra khi làm mịn qua màu sắc của
cạnh. Những hình ảnh được làm mượt không chỉ trông mờ, cũ mà nó cũng thể
hiện hào quang kỳ lạ quanh đối tượng. Hình 2.7(a) trong các tấm màu cho thấy
một chi tiết từ một hình ảnh với một chiếc áo khoác đỏ chống lại một bầu trời
xanh. Ngay cả trong hình ảnh không bị mờ này, một dòng màu hồng tím mỏng
có thể nhìn thấy, và đang gây ra bởi sự kết hợp của các ống kình làm mờ và
trung bình PEL. Trong thực tế, các PEL dọc theo đường biên, khi chiếu lại vào
khung cảnh, giao cắt cả áo khoác đỏ và bầy trời xanh, và các kết quả màu sắc là
mức trung bình hồng của màu đỏ và màu xanh. Khi làm mịn, hiệu ứng này được
nhấn mạnh, như là mở rộng, vùng màu hồng tím mờ trong hình 2.7(b) cho thấy
điều đó.
Để giải quyết khó khăn này, việc làm mượt ảnh mà vẫn giữ lại đường nét
có thể được áp dụng cho các thành phần màu đỏ, xanh lá cây, và màu xanh của
hình ảnh riêng biệt. Tuy nhiên, cường độ qua các cạnh trong ba dải màu trên về
tổng thể là khác nhau. Kết quả làm mịn riêng biệt trong một dải màu hồng tím
thậm chí còn rõ hơn trong bản gốc, như thể hiện trong hình 2.7(c). Tuy nhiên
các dải màu hồng tím không được mở rộng như là trong phiên bản làm mờ tiêu
chuẩn của hình 2.7(b).
Một kết quả tốt hơn có thể đạt được với bộ lọc song phương. Trong thực tế,
một bộ lọc song phương cho phép kết hợp ba dải màu thích hợp, và đo khoảng
cách trắc quang giữa các PEL trong không gian được kết hợp. Hơn nữa, khoảng
cách kết hợp này có thể được thực hiện mô ̣t cách phù hợp chặt chẽ để nhận biết
sự khác biệt bằng cách sử dụng khoảng cách Euclide trong không gian màu sắc
CIE-lab. Không gian này được dựa trên một phần thân lớn của dữ liệu vật lý liên
quan đến thí nghiệm màu sắc phù hợp được thực hiện bởi các quan sát của con
người. Trong không gian này, khoảng cách Euclide nhỏ tương quan mạnh mẽ
với nhận thức sai lệch màu sắc như thực nghiệm về một "trung bình" màu sắc

24
bình thường theo quan sát của con người. Như vậy, trong một nghĩa nào đó, lọc
song phương được thực hiện trong không gian màu CIE-Lab là loại tự nhiên
nhất của việc lọc cho hình ảnh màu: chỉ về mặt nhận thức màu sắc tương tự
được tính trung bình với nhau, và chỉ về mặt nhận thức cạnh quan trọng mới
được bảo tồn. Hình 2.7(d) cho thấy hình ảnh thu được từ làm mịn song phương
của hình ảnh trong hình 2.7(a). Các dải màu hồng đã bị thu hẹp đáng kể, và
không có màu sắc không liên quan xuất hiện. Hình 2.8(c) trong các tấm màu cho
thấy kết quả của năm lầ n lặp đi lặp lại của bộ lọc song phương của hình ảnh
trong hình 2.8(a). Trong khi một sự lặp lại duy nhất tạo ra một hình ảnh rõ ràng
hơn hình 2.8(b)) so với bản gốc, và có lẽ là đủ cho hầu hết các nhu cầu XLA,
nhiều lần lặp lại có tác dụng của làm phẳng các màu sắc trong một hình ảnh một
cách đáng kể, nhưng mà không làm mờ cạnh. Những hình ảnh thu được có bản
đồ mày nhỏ hơn nhiều, và các hiệu ứng của bộ lọc song phương dễ thấy khi hiển
thị trên một trang in. Chú ý chi tiết hoạt hình giống như sự xuất hiện của hình
2.8(c). Tất cả các bóng và cạnh được bảo tồn, nhưng hầu hết cácbóngđã biến
mất, và không có màu sắc "mới" được đưa ra bằng việc lọc.

Hình 2.7: Một chi tiết từ một hình ảnh với một màu đỏ chống lại
Cả một vùng xanh.Các đường màu hồng mỏng ở (a) được lan truyền và làm mờ
bằng cách lọc thông thấp thông thường (b). Lọc song phương riêng biệt (c) của các
thành phần màu đỏ, xanh lá cây, màu xanh làm sắc dải màu hồng, nhưng không thu
nhỏ nó. Kết hợp lọc song phương (d) trong không gian màu CIE-Lab, thu nhỏ các dải
màu hồng, và không đưa ra màu sắc giả.

25
Hình 2.8: Một ảnh màu và phiên bản được làm mượt song phương của nó sau khi
lặp đi lặp lại 1 lần (b) và 5 lần (c)
2.2. Bộ lọc NLM
2.2.1. Giới thiệu
NLM là một thuật toán trong XLA cho việc lọc nhiễu trong hình ảnh dựa
trên việc tính toán giá trị trung bình không cục bộ của tất cả các PEL trong ảnh.
Mục đích của phương pháp lọc nhiễu là khôi phục lại hình ảnh ban đầu từ một
phép đo nhiễu.
𝑣(𝑖) = 𝑢(𝑖) + 𝑛(𝑖) (2.12)

26
Trong đó 𝑣(𝑖) là giá trị quan sát được, 𝑢(𝑖) là giá trị gốc và 𝑛(𝑖) là tổng
hợp của nhiễu tại một PEL𝑖. Các đơn giản nhất để mô hình hóa tác động của
nhiễu trên một ảnh số là thêm nhiễu trắng Gaussian. Như vậy, 𝑛(𝑖) lúc này sẽ là
các giá trị Gaussian.
Nhiều phương pháp đã được đề xuất để loại bỏ nhiễu và khôi phục ảnh thật
𝑢. Mặc dù chúng có thể khác nhau về công cụ nhưng phần lớn nhận xét cho rằng
chúng giống nhau: Lọc nhiễu được thực hiện bằng việc tính toán giá trị trung
bình của các PEL.
Về mặt hình thức, một phương pháp lọc nhiễu 𝐷ℎ được định nghĩa như sau:
𝑣 = 𝐷ℎ 𝑉 + 𝑛(𝐷ℎ , 𝑣)
Trong đó, 𝑣 là ảnh nhiễu, ℎ là một tham số lọc phụ thuộc vào độ lệch chuẩn
của nhiễu. Theo lý tưởng, 𝐷ℎ 𝑉 mượt hơn so với 𝑣 và 𝑛(𝐷ℎ , 𝑣) giống như việc
thực hiện một nhiễu trắng.
Các phương pháp lọc nhiễu không nên thay đổi các chi tiết trong ảnh gốc.
Ngày nay, đa số các phương pháp lọc nhiễu làm giảm hoặc loại bỏ các chi tiết
đẹp và kết cấu của ảnh gốc. Để đi chi tiết hơn về điều này, phương pháp nhiễu
đã được giới thiệu và phân tích. Phương pháp nhiễu được định nghĩa là sự khác
biệt giữa ảnh gốc 𝑢 và ảnh đã bị nhiễu của nó.
NLM là một thuật toán được đề xuất và nghiên cứu, nó được xác định theo
công thức đơn giản:
1 −𝐺𝑎 ∗|𝑢(𝑥+.)−𝑢(𝑦+.)|2 (0)
𝑁[𝑢](𝑥)= ∫ 𝑒 𝑢(𝑦)𝑑(𝑦) (2.13)
𝑐(𝑥) 𝛺 ℎ2

1 −𝐺𝑎 ∗|𝑢(𝑥+.)−𝑢(𝑦+.)|2 (0)


Trong đó, ∈ 𝛺, ∫ 𝑒 𝑑𝑧 là một hằng số, 𝐺𝑎 là nhân
𝑐(𝑥) 𝛺 ℎ2

gaussian và ℎ hoạt động như một thông số lọc. Công thức này nói rằng giá trị bị
nhiễu tại 𝑥 là trung bình các giá trị của tất cả các điểm mà lân cận gaussian của
nó giống như lân cận của 𝑥. Sự khác biệt chính của thuật toán NLM đối với bộ
lọc cục bộ hoặc các bộ lọc miền tần số là việc sử dụng có hệ thống tất cả các sự
tự dự đoán có thể có mà hình ảnh có khả năng cung cấp.

27
2.2.2. Phương pháp nhiễu
Định nghĩa 1: Phương pháp nhiễu.
Xem 𝑢 là một ảnh và 𝐷ℎ là một toán tử lọc nhiễu phụ thuộc vào một tham
số lọc ℎ. Phương pháp nhiễu là sự khác biệt của hình ảnh:
𝑢 − 𝐷ℎ 𝑢
Thuật toán lọc nhiễu không nên áp dụng trên những hình ảnh không nhiễu.
Vì thế phương pháp nhiễu có thể có hiệu quả thấp với một vài loại hình ảnh
được giả định. Nếu một phương pháp nhiễu hoạt động tốt, phương pháp này
phải khiến hình ảnh trông giống như có nhiễu ngay cả khi hình ảnh ban đầu
không hề có nhiễu.
2.2.3. Bộ lọc Gaussian
Bộ lọc ảnh tuyến tính đẳng hướng tóm tắt lại tính chập của hình ảnh bằng
một nhân đối xứng tuyến tính.Mô hình của các nhân tất yếu giống như nhân
Gaussian. Phương trình Gaussian trong không gian:

1 −|𝑥|2
𝑥 → 𝐺ℎ (𝑥) = 𝑒 4ℎ2 (2.14)
(4𝜋ℎ2 )
Trong đó, 𝐺ℎ có tiêu chuẩn sai lệch ℎ và nó có thể dễ dàng thấy được.
Định lý 1 (Gabor 1960) Các phương pháp nhiễu ảnh của tích chậpvới một
hạt nhân gaussian 𝐺ℎ là:
𝑢 − 𝐺ℎ ∗ 𝑢 = −ℎ2 ∆𝑢 + 𝑜(ℎ2 ) cho ℎ vừa đủ nhỏ.
Phương pháp nhiễu Gaussian bằng 0 trong các phần hài hòa của hình ảnh
và rất lớn ở biên. Như một hệ quả, các tích chập Gaussian tối ưu trong các phần
phẳng của hình ảnh nhưng lại mờ tại biên.
2.2.4. Lọc lân cận
Lọc lân cận là bộ lọc khôi phục một PEL bằng cách lấy trung bình của các
giá trị PEL lân cận với một giá trị mức xám tương tự. Yaroslavsky (1985) tính
trung bình các PEL có một giá trị mức xám tương tự và thuộc các vùng không
gian lân cận 𝐵𝑝 (𝑥).

28
1 |𝑢(𝑦)−𝑢(𝑥)|2

𝑌𝑁𝐹ℎ,𝑝 𝑢(𝑥) = ∫ 𝑢(𝑦)𝑒 ℎ2 𝑑𝑦, (2.15)
𝐶(𝑥) 𝐵𝑝(𝑥)
|𝑢(𝑦)−𝑢(𝑥)|2

Trong đó, 𝑥𝜖𝞨, 𝑪(𝒙) = ∫𝐵 𝑢(𝑦)𝑒 ℎ2 𝑑𝑦, là hệ số chuẩn hóa và h
𝑝 (𝑥)

là một thông số lọc.


Các bộ lọc Yaroslavsky ít được biết đến hơn các phiên bản gần đây, cụ thể
là các bộ lọc SUSAN (1995) [14] và song phương bộ lọc (1998) [15]. Cả hai
thuật toán, thay vì xem xét một không gian lân cận cố định Bρ (x) thì cân nhắc
khoảng cách để tham chiếu PEL x.
1 |𝑦−𝑥|2 |𝑢(𝑦)−𝑢(𝑥)|2
− 2 −
𝑆𝑁𝐹ℎ,𝑝 𝑢(𝑥) = ∫ 𝑢(𝑦)𝑒 𝑝 𝑒 ℎ2 𝑑𝑦 (2.16)
𝐶(𝑥) 𝛺
|𝑦−𝑥|2 |𝑢(𝑦)−𝑢(𝑥)|2
− −
Trong đó 𝐶(𝑥) = ∫𝛺 𝑢(𝑦)𝑒 𝑝2 𝑒 ℎ2 𝑑𝑦 là hệ số chuẩn hóa và ρ
bây giờ là một tham số lọc không gian. Trong thực tế, không có sự khác biệt
giữa YNFh, ρ và SNFh, ρ. Nếu chênh lệch mức xám giữa hai khu vực lớn hơn ℎ,
cả hai thuật toán tính toán trung bình các PEL thuộc các khu vực tương tự giống
như sự tham chiếu PEL. Do đó, các thuật toán không làm mờ đường nét, đó là
mục tiêu chính của nó.
Vấn đề với các bộ lọc này là việc so sánh chỉ các giá trị mức xám trong một
PEL đơn không quá mạnh khi những giá trị này là nhiễu. Lọc lân cận cũng tạo
ra những cú sốc có thể được biện minh bằng các tính toán của phương pháp
nhiễu của nó.
2.2.5. Thuật toán NLM
2.2.5.1. Giới thiệu
Đưa vào một ảnh có nhiễu rời rạc 𝑣 = {𝑣(𝑖)|𝑖 ∈ 𝐼}, giá trị được đánh giá
NL[𝑣](𝑖), cho 1 PEL i được tính toán bằng trung bình trọng số của tất cả các
PEL.

𝑁𝐿[𝑣](𝑖) = ∑ 𝑤(𝑖, 𝑗)𝑣(𝑗), (2.17)


𝑖∈𝐼

Trong đó tập hợp các trọng số {𝑤(𝑖, 𝑗)}𝑗 phụ thuộc vào sự giống nhau giữa
các PEL i và j, với điều kiện 0 ≤ 𝑤(𝑖, 𝑗) ≤ 1 𝑣à ∑𝑗 𝑤(𝑖, 𝑗) = 1.

29
Sự giống nhau giữa 2 PEL i và j phụ thuộc vào sự giống nhau của vector
mức độ cường độ xám 𝑣(𝑁𝑖 ) 𝑣à 𝑣(𝑁𝑗 ), trong đó 𝑁𝑘 biểu thị lân cận vuông của
kích thước cố định và được tập trungtại 1 PEL k. Sự giống nhau này được đo
bằng hàm giảm của khoảng cách Euclidean có trọng số, ||𝑣(𝑁𝑖 ) − 𝑣(𝑁𝑗 )||22,𝑎 ,
trong đó a>0 là độ sai lệch tiêu chuẩn của nhân Gaussian. Ứng dụng của khoảng
cách Euclidean tới các vùng lân cận nhiễu đưa ra đẳng thức sau,
𝐸||𝑣(𝑁𝑖 ) − 𝑣(𝑁𝑗 )||22,𝑎 = ||𝑢(𝑁𝑖 ) − 𝑢(𝑁𝑗 )||22,𝑎 + 2𝜎 2 (2.18)
Đẳng thức thể hiện sự chắc chắn của thuật toán trong khoảng cách
Euclidean kỳ vọng bảo tồn được trật tự giữa các PEL tương tự.

Hình 2.9: Sơ đồ của NLM. Những PEL lân cận tương tự cung cấp những
trọng số lớn nhỏ khác nhau trong các vùng lân cận
Những PEL trong vùng lân cận với mức xám tương tự 𝑣(𝑁𝑖 ) có các trọng
số lớn hơn trung bình, nhìn hình 18. Những trọng số đó được định nghĩa như:
2
1 −||𝑣(𝑁𝑖)−𝑣(𝑁𝑗 )||2,𝑎
𝑤(𝑖, 𝑗) = 𝑒 ℎ2 (2.19)
𝑍(𝑖)
Trong đó Z(i) là hằng số chuẩn hóa
||𝑣(𝑁𝑖 )−𝑣(𝑁𝑗 )||2
2,𝑎

𝑍(𝑖) = ∑ 𝑒 ℎ2 (2.20)
𝑗

30
Và thông số h hoạt động như một góc độ của bộ lọc. Nó điều khiển sự suy
giảm của hàm mũ và từ đó sự suy giảm của các trọng số như một hàm của các
khoảng cách Euclideam
NLM không chỉ so sánh mức độ xám trong điểm đơn mà còn hình học hóa
hình trạng trong toàn bộ vùng lân cận. Thực tế chấp nhận sự so sánh mạnh mẽ
hơn các bộ lọc lân cận. Hình 2.9 minh hóa thực tế đó, PEL𝑞 3 có giá trị mức xám
giống PEL𝑝 nhưng các vùng lân cận khác nhau nhiều và từ đó trọng số 𝑤(𝑝, 𝑞 3 )
gần bằng 0.

Hình 2.10: Sự hiển thị của sự phân bố trọng số NLM được sử dụng để ước
lượng PEL trung tâm của tất cả các hình ảnh. Các trọng số đi từ 1 (trắng) đến 0
(màu đen).
2.2.5.2. Tính nhất quán của NLM
Theo các giả thuyết tính dừng, cho một PELi, các thuật toán NLM hội tụ
với kỳ vọng có điều kiện của i một lần quan sát được một lân cận của nó. Trong
trường hợp này, số lượng các điều kiện có tính dừng nói lên rằng kích thước của
hình ảnh lớn dần lên thì ta có thể tìm thấy nhiều bản vá lỗi tương tự cho tất cả
các chi tiết của hình ảnh.
Xem V là một trường ngẫu nhiên và giả thiết rằng ảnh nhiễu v là một phép
thể hiện của V, Xem Z là chuỗi các biến ngẫu nhiên 𝑍𝑖 = { 𝑌𝑖 , 𝑋𝑖 } trong đó 𝑌𝑖 =
𝑉(𝑖) là giá trị thực và 𝑋𝑖 = 𝑉(𝑁𝑖 \{𝑖}) là ℝ𝑝 . NLM là một ước lượng của kỳ
vọng có điều kiện𝑟(𝑖) = [𝐸|𝑌𝑖 |𝑋𝑖 = 𝑣(𝑁𝑖 \{𝑖})].

31
Định lý 4 (Định lý kỳ vọng có điều kiện) Xem 𝑍 = {𝑉(𝑖), 𝑉(𝑁𝑖 \{𝑖})} cho
𝑖 = 1,2, … là một quá trình trộn và đứng yên chặt chẽ. Hãy xem 𝑁𝐿𝑛 biểu thị
thuật toán NLM áp dụng cho các chuỗi 𝑍𝑛 = {𝑉(𝑖), 𝑉(𝑁𝑖 {𝑖})}𝑛𝑖=1 . Tiếp theo
|𝑁𝐿𝑛 (𝑗) − 𝑟(𝑗)| → 0
𝑐ℎ𝑜 𝑗𝜖 {1, … , 𝑛}
Định lý này nói lên một điều rằng các thuật toán NLM điều chỉnh hình ảnh
nhiễu tốt hơn là việc cố gắng để tách nhiễu (dao động) từ các ảnh gốc (mịn).
Trong trường hợp đó một mô hình nhiễu trắng phụ gia được giả định, kết
quả tiếp theo cho thấy sự kỳ vọng có điều kiện là các hàm của V (𝑁𝑖 \ {i}) tối
thiểu hóa lỗi vuông có nghĩa với những hình ảnh thật u.
Định lý 5: Xem V, U, N là các trường ngẫu nhiên, V=U+N, trong đó là là
nhiễu trắng độc tín hiệu, một phát biểu được đưa ra:
𝐸[𝑉(𝑖)|𝑋𝑖 = 𝑥] = 𝐸[𝑈(𝑖)|𝑋𝑖 = 𝑥] 𝑐ℎ𝑜 𝑡ấ𝑡 𝑐ả 𝑖𝜖 𝐼 𝑣à 𝑥𝜖 ℝ𝑝 (2.21)
Các biến ngẫu nhiên được kỳ vọng 𝐸[𝑢(𝑖)|𝑉(𝑁𝑖 {𝑖})] là một hàm của
𝑉(𝑁𝑖 {𝑖}) cái mà tối thiểu hóa lỗi vuông có nghĩa.
min 𝐸[𝑈(𝑖) − 𝑔(𝑉(𝑁𝑖 {𝑖}))]2
𝑔

Liên kết về mặt lý thuyết giữa 2 thuật toán đang được tiếp tục và sẽ được
đưa ra trong tương lai.

2.3. So sánh hiệu quả của các bộ lọc


Bây giờ chúng ta sẽ so sánh các bộ lọc làm mịn cục bộ và các thuật toán
NLM theo ba tiêu chí được xác định rõ: Phương pháp nhiễu, chất lượng hình
ảnh của ảnh được phục và các lỗi bình phương trung bình, đó là sự khác biệt
Euclide giữa những hình ảnh được phục hồi và ảnh thật.
Đối với mục đích tính toán của thuật toán NLM, chúng ta có thể giới hạn
tìm kiếm của những cửa sổ tương tự trong cửa sổ tìm kiếm lớn với kích thước S
× S PEL. Trong tất cả các thử nghiệm, một cửa sổ tìm kiếm 21 × 21 PEL và một
vùng lân cận vuông tương tự 𝑁𝑖 7 × 7 PEL. Nếu 𝑁 2 là số lượng PEL của hình
ảnh, khi đó độ phức tạp của thuật toán là khoảng 49 × 441 × 𝑁 2 .

32
Cửa sổ tương tự 7 × 7 phải đủ lớn đối với nhiễu và đủ nhỏ để giữ lại các chi
tiết và cấu trúc của hình ảnh. Các tham số lọc h có được cố định là 10 * σ khi
một nhiễu với độ lệch chuẩn σ được thêm vào. Do sự phân rã nhanh chóng của
các hạt nhân theo cấp số nhân, khoảng cách Euclide lớn dẫn và gần như không
trọng số và hoạt động như là một ngưỡng tự động, xem hình 2.10.

Hình 2.11: Thực nghiệm về lọc nhiễu trên một kết cấu tự nhiên. Từ trái qua
phải: Ảnh bị nhiễu (độ lệch chuẩn 35), bộ lọc Gaussian, lọc trung bình và thuật
toán NLM

Hình 2.12: Thực nghiệm về phương pháp nhiễu trên một ảnh tự nhiên. Hiển
thị sự khác biệt của ảnh 𝑢 − 𝐷ℎ (𝑢). Từ trái qua phải và từ trên xuống dưới: Ảnh
gốc, lọc Gaussian, lọc bất đẳng thức, tối thiểu hóa tổng biến thiên, lọc lân cận
và thuật toán NLM.
Những công thức này được chứng thực bởi các thí nghiệm trực quan của
Hình 2.12. Hình này hiển thị các phương pháp nhiễu cho hình ảnh Lena tiêu
chuẩn, sự khác biệt của ảnh u − Dh (u), trong đó tham số h được cố định để loại
bỏ nhiễu của độ lệch chuẩn 2.5. Phương pháp nhiễu giúp chúng ta hiểu hiệu
suấtvà hạn chế của các thuật toán giảm nhiễu, vì chi tiết bị gỡbỏ hay kết cấu có

33
một phương pháp nhiễu lớn. Chúng tôi nhìn thấy trong hình 2.12, phương pháp
nhiễu NLMkhông đưa ra bất kỳ cấu trúc hình học nào đáng chú ý. Hình 2.10
giải thích thuộc tính này vì nó cho thấy cách mà thuật toánNLM chọn một cấu
hình trọng số thích nghi với hình học cục bộ và không cục bộ trong và ngoài của
hình ảnh.
Chỉ có mắt người mới có khả năng quyết định chất lượng của ảnh đã được
cải thiện từ phương pháp nhiễu hay chưa. Chúng tôi đưa ra một số thực nghiệm
về giảm nhiễu so sánh với thuật toán NLM với bộ lọc làm mịn cục bộ. Tất cả
các thí nghiệm đã được mô phỏng bằng cách thêm một nhiễu trắng gaussian với
độ lệch chuẩn σ so với ảnh ban đầu. Sự hiện diện phi hiện vật, sự tái thiết chính
xác của các cạnh, kết cấu và chi tiết.
Do tính chất của thuật toán, trường hợp thuận lợi nhất cho NLM là trường
hợp vân kết cấu hoặc tuần hoàn. Trong tình huống này, với mọi PEL i, chúng ta
có thể tìm thấy một tập hợp lớn các mẫu với một cấu hình rất giống nhau. Xem
hình 2.10(e) cho một ví dụ về sự phân bố trọng số của thuật toán NLMcho một
hình ảnh tuần hoàn. Hình 2.11 so sánh hiệu suất của NLM và các bộ lọc làm mịn
cục bộ cho một kết cấu tự nhiên.
Hình ảnh tự nhiên cũng có đủ phần dư thừa để phải được khôi phục bởi
NLM. Khu vực bằng phẳng có một số lượng lớn các cấu hình tương tự nằm bên
trong cùng một đối tượng, xem hình 2.10(a). Cạnh thẳng hoặc cong có một hàng
đầy đủ các PEL với cấu hình tương tự, xem Hình 2.10(b) và (c). Ngoài ra, hình
ảnh tự nhiên cho phép chúng ta tìm thấy nhiều cấu hình tương tự các PEL xa,
như hình 2.10(f) cho thấy.Hình 2.13 cho thấy một thử nghiệm trên hình ảnh tự
nhiên. Thử nghiệm này phải được so sánh với hình 2.12, nơi hiển thịphương
pháp nhiễu của hình ảnh ban đầu. Các cấu trúc bị mờ hoặc bị suy thoáicủa hình
ảnh được khôi phục trùng với cấu trúc đáng chú ý của phương pháp nhiễu của
nó.
Cuối cùng Bảng 2.1 hiển thị lỗi bình phương trung bình cho các thí nghiệm
giảm nhiễu được đưa ra. Tính toán số này là một trong những mục tiêu lớn nhất,
vì nó không dựa vào bất kỳ giải thích thị giác. Tuy nhiên, lỗi này không phải là
tính toán trong một vấn đề thực sự và một lỗi nhỏ bình phương trung bình không

34
đảm bảo chất lượng hiển thị cao. Vì vậy, tất cả các thảo luận tiêu chuẩn ở trên
trên khá cần thiết để so sánh hiệu suất của thuật toán.

Bảng 2.1: Bảng báo lỗi bình phương trung bình. Một lỗi nhỏ bình phương
trung bình chỉ ra rằng ước tính là gần với bức ảnh gốc.

Hình 2.13:Thực nghiệm về lọc nhiễu trên kết cấu tự nhiên. Từ trái qua
phải, từ trên xuống dưới: Ảnh bị nhiễu (độ lệch chuẩn 20), bộ lọc Gaussian, lọc
bất đẳng thức, tổng biến thiên, lọc lân cận và thuật toán NLM. Các chi tiết bị
loại bỏ phải được so sánh với phương pháp nhiễu ở hình 2.12.
2.4. Bộ lọc làm sắc nét tuyến tính (Linear sharpen)
2.4.1. Mục đích và ý nghĩa
Mục đích của tăng cường đường nét ảnh là làm nổi bật các chi tiết đẹp
trong hình ảnh hay khôi phục lại những chi tiết đã bị mờ do lỗi hay kết quả từ
một phương pháp làm mượt nào đó. Tăng cường đường nét ảnh liên quan tới
việc làm sắc nét các đường biên ngoài của các đối tượng và các đặc trưng liên
quan đến nền tảng của chúng.
Việc tăng cường đường nét ảnh có rất nhiều ứng dụng trong thực tế như: In
ấn điện tử, hình ảnh y tế, kiểm tra công nghiệp, phát hiện mục tiêu trong các vũ
khí thông minh…
2.4.2. Bộ lọc làm sắc nét tuyến tính
XLA trong miền không gian được thể hiện như: 𝑔(𝑥, 𝑦) = 𝐻{𝑓(𝑥, 𝑦)}

35
Hình 2.14: XLA trong miền không gian
Trong đó f là ảnh đầu vào, g là ảnh đầu ra, H là một toán tử của f được xác
định trên một số điểm lân cận của PEL(𝑥, 𝑦). Các điểm lân cận của PEL(𝑥, 𝑦)
cho ảnh f, được thể hiện như một vector cột 𝑤(𝑥, 𝑦) của các giá trị PEL:
Ví dụ xem xét một cửa sổ lân cận 3 × 3 với PEL(𝑥, 𝑦) được quan tâm.
𝑓(𝑥 − 1, 𝑦 − 1)
𝑓(𝑥, 𝑦 − 1)
𝑓(𝑥 + 1, 𝑦 − 1)
𝑓(𝑥 − 1, 𝑦
𝑤(𝑥, 𝑦) = 𝑓(𝑥, 𝑦) (3.1)
𝑓(𝑥 + 1, 𝑦)
𝑓(𝑥 − 1, 𝑦 + 1)
𝑓(𝑥, 𝑦 + 1)
(𝑓(𝑥 + 1, 𝑦 + 1))
Trường hợp không có khuếch đại:
 Chi tiết nổi lên(Emboss)=Chi tiết gốc(Original)-Chi tiết được làm
mượt(Smooth)
 Chi tiết sắc nét= Chi tiết gốc+ Chi tiết nổi lên= 2*Chi tiết gốc-Chi tiết
được làm mượt
Trường hợp có khuếch đại:
 Chi tiết sắc nét= Chi tiết gốc+A*Chi tiết nổi lên=(1+A)*Chi tiết gốc-
A*Chi tiết được làm mượt
Ví dụ: Xem xét đến mặt lạ h với kích thước 3 × 3

36
A=0

A=1

A=2

Hình 2.15:Bộ lọc Linear sharpen. Từ trên xuống dưới tương ứng với khuếch đại
A=0, A=1, A=2
Làm sắc nét đường có thể đạt được bằng cách lấy trung bình một khuếch
đại A của vùng lân cận từ một khuếch đại rộng hơn 1 +A của trung tâm vùng
lân cận

37
2.5.Kỹ thuật cân bằng màu
2.5.1. Giới thiệu
Cân bằng màu sắc là một cơ chế phát hiện màu sắc độc lập của nguồn
sáng. Nguồn sáng đưa ra nhiều sắc thái màu trong ảnh kỹ thuật số được chụp lại.
Để giải quyết vấn đề cân bằng màu, một phương pháp tiêu chuẩn là ước lượng
màu sắc của ánh sáng hiện hành và bước tiếp theo là loại bỏ nó. Sau khi màu sắc
của ánh sáng trong từng kênh thu được, mỗi PEL màu được chuẩn hóa bởi một
hệ số tỉ lệ.
Hai trong số những kỹ thuật đơn giản thường được sử dụng để ước lượng
màu sắc của ánh sánglà Gray-World và thuật toán Max-RGB . Hai phương pháp
này sẽ làm việc tốt trong thực tế nếu màu sắc hình ảnh trung bình là xám hoặc
tối đa là trắng.
2.5.2. Giả thiết Gray World
Cân bằng trắng
Cân bằng trắng là quá trình thay đổi màu sắc của bức ảnh sao cho màu sắc
đúng với thực tế nhất, nói cách khác là chỉnh sửa màu trắng trên hình đúng
chính xác là màu trắng mà mắt người cảm nhận - đúng như tên của nó. Các
nguồn ánh sáng khác nhau tương ứng với các màu sắc khác nhau.
Giả thiết Gray World là một phương pháp cân bằng trắng, cho rằng màu
hình ảnh trung bình của bạn là một màu xám trung hòa. Giả thiết Gray World
giữ khi chúng ta màu sắc được phân phối tốt trong hình ảnh. Giả sử rằng chúng
ta có màu sắc trong hình ảnh được phân phối tốt, màu tương phản trung bình
được giả định là màu sắc của ánh sáng. Do đó, chúng ta có thể ước tính độ rọi
sắc thái màu bằng cách nhìn vào màu sắc trung bình và so sánh nó với màu xám.
Thuật toán Gray world đưa ra ước tính của độ rọi bằng cách tính trung
bình mỗi kênh của hình ảnh.
Một trong những phương pháp chuẩn hóa là trung bình của ba thành phần
được sử dụng như dự toán độ rọi của hình ảnh. Để chuẩn hóa hình ảnh của kênh
𝑎𝑣𝑔
i, giá trị PEL được thu nhỏ lại bởi 𝑠1 = , trong đó, 𝑎𝑣𝑔𝑖 là kênh trung
𝑎𝑣𝑔𝑖

bình và 𝑎𝑣𝑔$ là ước lượng độ rọi.

38
Một phương pháp chuẩn hóa khác là chuẩn hóa các kênh tối đa bằng cách
mở rộng quy mô bằng $𝑠_𝑖$
max(𝑎𝑣𝑔𝑅 ,𝑎𝑣𝑔𝐺 ,𝑎𝑣𝑔𝐵 )
𝑟𝑖 = (3.2)
𝑎𝑣𝑔𝑖

Một phương pháp chuẩn hóa khác là chuẩn hóa các kênh tối đa bằng cách
mở rộng quy mô bằng tiêu chuẩn $𝑚_𝑖$

𝑚𝑖 = √(𝑎𝑣𝑔𝑖 ∗ 𝑎𝑣𝑔𝑟 + 𝑎𝑣𝑔𝑔 ∗ 𝑎𝑣𝑔𝑔 + 𝑎𝑣𝑔𝑏 ∗ 𝑎𝑣𝑔𝑏 ) (3.3)

max(𝑚𝑅 ,𝑚𝐺 ,𝑚𝐵 )


𝑟𝑖 = (3.4)
𝑚𝑖

a. Gray-world-RGB b. Gray-world-Edge
Hình 2.16: Cân bằng màu

39
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM VỚI CÁC BỘ LỌC
KHÔNG GIAN VÀ KỸ THUẬT CÂN BẰNG MÀU
3.1. Mục đích
Nền tảng lý thuyết đã phần nào cho chúng ta thấy hiệu quả của các bộ lọc
không gian và kỹ thuật cân bằng màu trong việc cải thiện chất lượng ảnh tĩnh và
video. Tuy nhiên, để hiểu và có những ý tưởng tích cực phát triển trong tương
lai trong lĩnh vực XLAthì một chương trình thử nghiệm các thuật toán trên là
cần thiết.
Chương trình thử nghiệm sẽ trình bày kết quả trực quan của các bộ lọc từ
đầu vào là các ảnh tĩnh và video.
3.2. Xây dựng chương trình thử nghiệm
3.2.1. Giới thiệu về OpenCV
OpenCV là một thư viện thị giác máy tính nguồn mở được phát triển
chính với Intel. Intel đưa ra phiên bản OpenCV lần đầu tiên năm 1999. Ban đầu
nó yêu cầu phải có thư viện XLA của Intel. Sau đó vì sự lệ thuộc này mà họ đã
phải gỡ bỏ và hiện nay chúng ta có thể sử dụng thư viện này hoàn toàn độc lập.
Nó miễn phí cho thương mại và nghiên cứu. Nó có nhiều ứng dụng như : nhận
dạng mặt, dò tìm mặt, phát hiện mặt… nó thể hiện sự đa dạng của trí tuệ nhân
tạo (AI). Bên cạnh đó nó còn cải thiện rất nhiều các thuật toán cở bản của thị
giác máy như các hàm API cấp thấp hơn.

Hình 3.1:Một ví dụ về ứng dụng của OpenCV về dò cạnh


Cấu trúc OpenCV gồm nhiều module. CXCORE bao gồm các kiểu dữ
liệu cơ bản là rõ ràng. Ví dụ cấu trúc dự liệu về điểm,ảnh, hình chữ nhật được

40
xác định trong file cxtypes.h. CXCORE chứa các phép toán đại số tuyến tính và
thống kê, các hàm lưu trữ lâu dài và các lỗi thao tác. Một điều lạ là các hàm đồ
họa được cho việc vẽ ảnh cũng được lưu trữ tại đây.CV chứa đựng quá trình
XLA và các phương pháp đánh giá khá sơ bộ kích thước ảnh. Những hàm tính
toán hình học cũng được lưu trữ tại đây.
Hiện tại, thư viện hỗ trợ những hạng mục sau:
 Chụp thời gian thực
 Nhập tập tin video
 Xử lý hình ảnh cơ bản (độ sáng, độ tương phản, ngưỡng, ...)
 Phát hiện đối tượng (khuôn mặt, cơ thể, ...)
 Phát hiện đốm
3.2.2. Các bước tiến hành
3.2.2.1. Làm việc với file ảnh

Đọc file ảnh

Dữ liệu của một chương trình XLA với ảnh thu nhận từ các thiết bị ghi thì
hay được lưu dưới dạng file ảnh hoặc video với các format khác nhau. OpenCV
hỗ trợ đọc hầu hết các format phổ biến (.jpg,.png,.bmp, …), còn về video thì
trên hệ thống có ngôn ngữnào, OpenCV có thể đọc được format đó, tuy nhiên thì
phổ biến nhất vẫn là các file đuôi avi. Với chương trình C++ hàm đọc file ảnh
dùng lớp Mat, cụ thể như sau:

Ví dụ: Mat src = imread("Cameraman.bmp",1);


Trong đó:
 Filename: Tên của ảnh đầu vào
 Flags: Xác định kiểu màu của một ảnh được tải
o CV_LOAD_IMAGE_ANYDEPTH: Trả về ảnh 16-bit/32-bit
khi ảnh đầu vào có depth phù hợp, nếu không thì sẽ chuyển
đổi nó về 8-bit

41
o CV_LOAD_IMAGE_COLOR: Luôn chuyển đổi ảnh về một
màu
o CV_LOAD_IMAGE_GRAYSCALE: Luôn chuyển đổi ảnh
về một màu xám
o Flag>0: Trả về ảnh 3 kênh màu
o Flag=0: Trả về một ảnhmột màu xám
o Flag<0: Trả về ảnh đầu vào như ảnh với kênh alpha
Hàm imread tải một ảnh từ specified file và trả về kết quả. Nếu ảnh không
thể được đọc (bởi lỗi file, quyền không phù hợp, định dạng không được hỗ trợ
hoặc không hợp lệ), hàm sẽ trả về một ma trận rỗng (Mat::data==NULL). Hiện
tại, những định dạng dưới đây được hỗ trợ:
 Windows bitmaps: *.bmp, *.dib (luôn được hỗ trợ)
 JPEG files: *.jpge, *.jpg, *jpe
 Đồ họa Portable Network: *.png
 Định dạng ảnh Portable: *.pbm, *.pgm, *.ppm (luôn được hỗ trợ)
 TIFF files: *.tiff, *.tif
Chú ý: Trong trường hợp của ảnh màu, ảnh được giải mã sẽ có các kênh
được lưu trong lựa chọn B G R.
Ghi file ảnh
Hàm ghi file ảnh cụ thể như sau:

Ví dụ: imwrite("noise.bmp",snoise);
Trong đó:
 Filename: Tên file
 Img: ảnh được lưu
 Params: Format đặc thù lưu trữ các thông số được giải mã như một cặp:
paramId_1, paramValue_1, paramId_2, paramValue_2,… Các thông số
được hỗ trợ như dưới:

42
o Với JPEG: CV_IMWRITE_JPEG_QUALITY, từ 0 đến 100 (càng
cao càng tốt). Giá trị mặc định là 95.
o Với PNG: CV_IMWRITE_PNG_COMPRESSION, từ 0 đến 9. Giá
trị càng cao thì kích thước càng nhỏ và thời gian nén càng dài. Mặc
định là giá trị 3.
o Với PPM, PGM, PBM: CV_IMWRITE_PXM_BINARY, giá trị 0
hoặc 1. Mặc định là 1.
Hàm imwrite lưu ảnh thành file cụ thể. Format ảnh được chọn dựa trên
đuôi mở rộng của file ảnh. Chỉ có ảnh 8-bit (or 16-bit không dấu (CV_16U)
trong trường hợp của PNG, JPEG 2000, TIFF) kênh đơn hoặc kênh 3 (với lựa
chọn kênh ‘BGR’ ) có thể được lưu bằng việc sử dụng hàm này. Ngoài các
trường hợp trên có thể sử dụng Mat::convertTo() và cvtColor() để chuyển đổi nó
trước khi lưu. Hoặc sử dụng chức năng vạn năng FileStorage I/O để lưu ảnh
thành định dạng XML hay YAML.
Imwrite có thể lưu ảnh PNG với kênh alpha. Đề làm được điều đó, tạo
ảnh BGRA kênh 4 8-bit (hoặc 16-bit), trong đó, kênh alpha là cuối. Những PEL
trong suốt hoàn toàn có alpha bằng 0, những PEL đục hoàn toàn, alpha bằng
255/65535.

3.2.2.2. Làm việc với file video

Một đoạn hay một file video hoàn chỉnh về cơ bản sẽ được dựng lên bằng
các chuỗi hình ảnh liên tiếp cùng nhau, đó chính là những chuyển động mà
chúng ta nhìn thấy được trong video. Những bức ảnh này được gọi là frame -
khung hình, mỗi giây càng có nhiều frame thì chất lượng của video càng tốt.
Nạp file video
VideoCapture (khi đó ảnh đọc sẽ là đối tượng của lớp Mat) là một cấu
trúc dùng để đọc các frame của một file video hoặc từ một webcam.

Trong đó:

43
 Filename: tên của tệp video được mở (ví dụ: sammy.avi) hoặc
chuỗi ảnh (ví dụ: ìm_%02d.jpg, cụ thể là các mẫu này sẽ được đọc
như là: img_00.jpg, img_01.jpg, img_03.jpg,…)
 Device: id của thiết bị quay video. Nếu có một camera đã kết nối,
sự chuyển tác là 0.
Mở file video hoặc thiết bị quay video

Trong đó:
 Filename: Tên của file video đã được mở hoặc chuỗi ảnh.
 Device: id của thiết bị quay video đã mở
Đầu tiên gọi phương thức VideoCapture::release() để đóng file hoặc
camera vừa được mở.

Nếu việc gọi hàm VideoCapture hay VideoCapture::open trước đó thành


công, phương thức trả về kết quả là true.
Đóng file video hoặc thiết bị quay

Phương thức này tự động được gọi để thoát khỏi hai phương thức
VidepCapture::open() và VideoCapture.
Bắt khung hình từ file video hoặc thiết bị quay

Phương pháp hayhàm bắt các khung hình kế tiếp từ tập tin video haythiết
bị thu hình và trảvề ảnh thật (non-zero) nếu thành công.
Công dụng chính của hàm này là trong môi trường nhiều camera, đặc biệt
là khi các máy ảnh không có đồng bộ hóa phần cứng. Khi đó, bạn gọi
VideoCapture::grab() cho mỗi máy ảnh và tiếp theo là gọi phương thức
VideoCapture:: retrieve () để giải mã và nhận được khung từ mỗi camera.
Giải mã và trả về các khung hình được bắt

44
Phương pháp hayhàmnày giải mã và trả lại khung đượcbắt. Nếu không có
các khung nào đã được bắt(máy ảnh đã được ngắt kết nối, hoặc không có khung
hình trong file video), các phương pháp trả về false và các hàm trả lại con trỏ
NULL.
Bắt, giải mã và trả về các khung hình tiếp theo

Phương pháp hay chức năng này kết hợp với VideoCapture::grap() và
VideoCapture::retrieve() trong một lần gọi. Đây là phương pháp thuận tiện nhất
cho việc đọc file videp và lấy dữ liệu từ việc giải mã và trả về khung hình được
bắt. Nếu không có khung hình nào, phương pháp trả về false và hàm trả về con
trỏ NULL.
Khởi tạo

Trong đó:
 Filename: Tên của file video xuất ra
 Fourcc: 4 ký tự dùng để nén các khung hình
 Fps: Tốc độ khung hình của chuỗi video được tạo
 Framesize: Kích thước của các khung hình video
 isColor: Nếu nó không bằng 0, các bộ mã hóa sẽ mã hóa các khung
hình màu, không thì chúng sẽ làm việc với khung màu xám.
Ghi video

Trong đó:
 Writer: Cấu trúc video writer
 Image: Khung hình được ghi
Hàm hay phương pháp này ghi ảnh thành file video. Nó phải có cùng kích
thước giống như khi được mở.

45
3.3. Kết quả thực nghiệm
3.3.1. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân
bằng màu với ảnh đen trắng trong chương trình thực nghiệm

a: Ảnh gốc b: Ảnh nhiễu (hạt tiêu)

c: Ảnh lọc gaussian d: Ảnh lọc linearsharpen

e: Ảnh lọc song phương f: Ảnh lọc NLM

Hình 3.2: Thực nghiệm với ảnh đen trắng

46
a: Ảnh gốc b: Ảnh tương phản mạnh

c: Ảnh Gray-world-RGB d: Ảnh Gray-edge

Hình 3.3: Cân bằng màu ảnh đen trắng

47
3.3.2. Một số hình ảnh cho các bộ lọc không gian và kỹ thuật cân
bằng màu với ảnh màu trong chương trình thực nghiệm

a: Ảnh màu gốc b: Ảnh màu bị nhiễu

c: Ảnh màu lọc gaussian d: Ảnh màu linearsharpen

48
a: Ảnh màu lọc song phương a: Ảnh màu lọc NLM

Hình 3.4: Thực nghiệm với ảnh màu

c: Ảnh màu gốc d: Ảnh màu có độ tương


phản cao

49
e: Ảnh màu Gray-RGB f: Ảnh màu Gray-Edge
Hình 3.5: Cân bằng màu với ảnh màu

50
KẾT LUẬN
Cuốn luận văn này khép lại không chỉ với những kết quả đạt được về mặt
lý thuyết và thực nghiệm về các bộ lọc không gian trong việc cải thiện chất
lượng ảnh và video. Hơn thế nữa, nó còn mở ra nhiều hướng phát triển và suy
nghĩ mới trong lĩnh vực XLA nói chung và cải thiện chất lượng hình ảnh nói
riêng. Có không ít các bộ lọc có hiệu quả cao trong việc cải thiện tương tự, tuy
nhiên việc sử dụng và kết hợp chúng như thế nào để có được kết quả tốt nhất
luôn luôn là một vấn đề được quan tâm.
Trải qua một thời gian không ngắn học tập và nghiên cứu, cùng với sự
hướng dẫn và chỉ dạy tận tình của thầy TS. Nguyễn Duy Trường Giang, tôi đã
hoàn thành cuốn luận văn này. Mặc dù cách tiếp nhận và giải quyết vấn đề của
tôi còn chưa thực sự sâu sắc cộng thêm những thiếu sót không thể tránh khỏi
trong luận văn. Vì vậy, tôi rất mong nhận được sự thông cảm và những ý kiến
đóng góp từ phía các thầy cô cùng toàn thể các anh chị để tôi có thể hoàn thiện
cuốn luận văn này và có hướng phát triển trong thời gian tới.
Tôi xin chân thành cảm ơn!

51
TÀI LIỆU THAM KHẢO
1. Phạm Việt Bình- Đỗ Năng Toàn (2007)- Giáo trình xử lý ảnh- Nhà xuất
bản Đại học Hà nội
2. Đào Xuân Nam (2015)- Giáo trình phân tích và xử lý ảnh- Nhà xuất bản
Bách Khoa Hà Nội
3. Richard Szeliski (2010)- Computer Vision Algorithms and
Applications- Springer
4. Websites:
- http://docs.opencv.org
- http://www.codeproject.com
- https://4fire.wordpress.com
- http://opencv.jp
- http://web.stanford.edu
- http://opencvexamples.blogspot.com

52

You might also like