Professional Documents
Culture Documents
ĐỀ TÀI
BIÊN VÀ PHƯƠNG PHÁP DÒ BIÊN ẢNH
Các đặc trưng của ảnh thường gồm: mật độ xám, phân bổ xác xuất, phân bồ
không gian, biên ảnh. Các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên.
Do đó, biên có tầm quan trọng đặc biệt trong qua trình phân tích ảnh.
1.2. Biên và các kỹ thuật dò biên
Trong phần này chúng ta sẽ đề cập đến một số nội dung: khái niệm về biên, phân loại
các phương pháp phát hiện biên và qui trình phát hiện biên.
1.2.1. Khái niệm về biên
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu
dựa vào biên.
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức xám.
Tập hợp các điểm biên tạo thành biên hay đường bao ảnh của ảnh (boundary).
Thí dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có
ít nhất một điểm trắng là lân cận.
Để hình dung tầm quan trọng của biên ta xét ví dụ sau: Khi người hoạ sĩ vẽ một cái
bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như cái mặt bàn, chân bàn mà không
cần thêm các chi tiết khác, người xem đã có thể nhận ra nó là một cái bàn. Nếu ứng
dụng của ta là phân lớp nhận diện đối tượng, thì coi như nhiệm vụ đã hoàn thành. Tuy
nhiên nếu đòi hỏi thêm về các chi tiết khác như vân gỗ hay màu sắc, thì với chừng ấy
thông tin là chưa đủ.
Nhìn chung về mặt toán học người ta coi điểm biên của ảnh là điểm có sự biến đổi
đột ngột về độ xám. Như vậy phát hiện biên một cách lý tưởng là xác định được tất cả
các đường bao trong các đối tượng. Định nghĩa toán học của biên ở trên là cơ sở cho
các kỹ thuật phát hiện biên. Điều quan trọng là sự biến thiên mức xám giữa các ảnh
trong một vùng thường là nhỏ, trong khi đó biến thiên mức xám của điểm vùng giáp
ranh (khi qua biên) lại khá lớn.
1.2.2. Phân loại các kỹ thuật phát hiện biên
Xuất phát từ định nghĩa toán học của biên người ta thường sử dụng 2 phương pháp
phát hiện biên sau:
a) Phương pháp phát hiện biên trực tiếp:
Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ
sáng của điểm ảnh. kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật
đạo hàm. Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient;
nếu lấy đạo hàm bậc hai ta có kỹ thuật Laplace. Hai phương pháp trên được gọi là
phương pháp dò biên cục bộ. ngoài ra người ta còn sử dụng phương pháp “đi theo
đường bao”: Dựa vào nguyên lý quy hoạch hoạt động và được gọi là phương pháp dò
biên tổng thể.
b) Phương pháp gián tiếp:
Nếu bằng cách nào đấy, ta phân được ảnh thành các vùng thì đường phân ranh giữa
các vùng đó chính là biên.Việc phân vùng ảnh thường dựa vào kết cấu (texture) bề mặt
của ảnh.
Cũng cần lưu ý rằng, kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của
nhau. Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lớp xong
có nghĩa là đã phân vùng được ảnh. Và ngược lại, khi phân vùng, ảnh đã phân lập
được thành các đối tượng, ta có thể phát hiện được biên. Phương pháp dò biên trực
tiếp tỏ ra khá hiệu quả vì ít chịu ảnh hưởng của nhiễu. song nếu sự biến thiên độ sáng
không đột ngột, phương pháp này lại kém hiệu quả. Phương pháp dò biên gián tiếp tuy
có khó cài đặt song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ.
1.2.3. Qui trình phát hiện biên trực tiếp
a) Khử nhiễu ảnh
Vì ảnh thu nhận thường có nhiễu, nên bước đầu tiên là phải khử nhiễu. Việc khử nhiễu
được thực hiện bằng các kỹ thuật khử nhiễu khác nhau.
b) Làm nổi biên
Tiếp theo là làm nổi biên bởi các toán tử đạo hàm
c) Định vị điểm biên
Vì các kỹ thuật làm nổi biên có hiệu ứng phụ là tăng nhiễu , do vậy sẽ có một số
điểm biên giả cần loại bỏ.
d) Liên kết và trích chọn biên
Như đã nói, phát hiện biên và phân vùng ảnh là một bài toán đối ngẫu. Vì thế cũng có
thể phát hiện biên thông qua việc phân vùng ảnh.
1.3. Một số phương pháp phát hiện biên cục bộ
a) Phương pháp gradient
Phương pháp gradient là phương pháp dò biên cục bộ dựa vào cực đại của đạo hàm.
Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá
trị của điểm ảnh theo hai hướng x và y. Các thành phần của gradient được tính bởi:
với dx là khoảng cách giữa các điểm theo hướng x ( khoảng các tính bằng số
điểm) và tương tự với dy. Trên thực tế, người ta hay dùng với dx = dy = 1
Trong kỹ thuật gradient, người ta chia thành 2 kỹ thuật (do dùng 2 toán tử khác
nhau): kỹ thuật gradient và kỹ thuật la bàn. kỹ thuật gradient dùng toán tử gradient lấy
đạo hàm theo hai hướng; còn kỹ thuật la bàn lấy đạo hàm theo 8 hướng chính: Bắc,
Nam, Đông ,Tây và Đông Bắc, Tây Bắc, Đông Nam, Tây Nam.
a.1) Kỹ thuật gradient
Kỹ thuật này sử dụng một cặp mặt nạ H1 và H2 trực giao ( theo 2 hướng vuông góc).
Nếu định nghĩa g1,g2 là gradient tương ứng theo 2 hướng x và y, thì biên độ của
gradient, ký hiệu là g tại điểm (m,n) được tính theo công thức:
Giả sử Gx và Gy là 2 ma trận điểm ảnh thu được sau khi nhân chập với 2 mặt nạ theo
hai hướng tương ứng. Ma trận điểm ảnh G được tính xấp xỉ theo công thức sau:
G=|Gx| + |Gy|
* Thuật toán dò biên theo phương pháp Gradient như sau: ( Viết trên ngôn ngữ
Visual C++ 6.0)
Đầu vào: ma trận ảnh cần tìm biên
mặt nạ I1 và I2
Đầu ra: Một ma trận ảnh (chứa các đường biên được tìm thấy).
Giải thuật
// Gradient Algorithm
For (mỗi điểm ảnh của ảnh)
If (Nếu điểm ảnh nẳm trên đường viền ảnh)
Gán giá trị các điểm ảnh trên đường viền ảnh =0 (hoặc bằng màu nền ảnh).
else
{
- Tính xấp xỉ Gradient theo chiều x (Gx): nhân chập với mặt nạ I1
-Tính xấp xỉ Gradient theo chiều y (Gy): nhân chập với mặt nạ I2
-Tính giá trị điểm ảnh theo công thức xấp xỉ G: G=|Gx|+ |Gy|
- Nếu giá trị điểm ảnh lớn hơn chỉ số màu của ảnh thì gán giá trị ảnh là giá trị màu
lớn nhất.
}
Để dễ hiểu, phần dưới đây sẽ minh hoạ thêm về giải thuật này:
Trong đó:
b22=(a11*m11)+ (a12*m12)+ (a12*m13)+ (a21*m21) + (a22*m22) + (a23*m23) +
(a31*m31)+ (a32*m32)+ (a33*m33).
Các giá trị nằm trên đường viền được gán =0 (hay giá trị màu nền).
(b11,b12,...b1n,b11....bn1,b1n...bnn, bn1...bnn)
Đây là công thức tính Gx và Gy
Để tính giá trị điểm ảnh đầu ra, sử dụng công thức: G=|Gx|+ |Gy|
2.2. Phương pháp dò biên theo kỹ thuật Laplace
Kỹ thuật Laplace dò biên theo cách tính xấp xỉ đạo hàm bậc hai dựa
trên một mặt nạ. Chương trình sử dụng mặt nạ H2 trong cách dò biên theo kỹ
thuật Laplace.
Gọi G là ma trận điểm thu được sau khi nhân chập ma trận điểm ảnh (của ảnh cần tìm
biên )với mặt nạ H2.
G chính là ma trận điểm ảnh chứa các đường biên cần tìm.
* Thuật toán dò biên
Đầu vào: ma trận ảnh cần tìm biên:
mặt nạ H2
Đầu ra: Một ma trận ảnh (chứa các đường biên được tìm thấy).
Giải thuật
// Laplace Algorithm
For (mỗi điểm ảnh của ảnh)
If (Nếu điểm ảnh nẳm trên đường viền ảnh)
Gán giá trị các điểm ảnh trên đường viền ảnh =0 (hoặc bằng màu nền ảnh).
else
{
- Tính xấp xỉ Laplace G: nhân chập với mặt nạ I1
- Nếu giá trị điểm ảnh lớn hơn chỉ số màu của ảnh thì gán giá trị ảnh là giá trị màu
lớn nhất.
}
2.3. Phương pháp dò biên gián tiếp
Dựa trên kỹ thuật phân vùng ảnh, Phương pháp này dò biên theo sự thay đổi mức xám
màu của ảnh. Nếu những điểm ảnh nào có cùng màu hoặc có màu khác nhưng khoảng
cách màu nằm trong phạm vi cho phép, đồng thời nằm kề nhau sẽ tạo thành
một vùng.
* Định nghĩa khoảng cách màu:
Khoảng cách màu là một khái niệm để chỉ sự khác nhau về giá trị màu của các điểm
ảnh.
Giả sử a và b là 2 giá trị màu của 2 điểm ảnh. Khoảng cách màu d của a và b được tính
như sau:
d(a,b)=|Ra-Rb| + |Ga-Gb| + |Ba-Bb|
Trong đó Ra: là giá trị màu đỏ tại điểm ảnh
Ga: là giá trị màu xanh (green)tại điểm ảnh
Ba: là giá trị màu xanh da trời (blue) tại điểm ảnh.
Nếu khoảng cách màu d=0 thì 2 điểm ảnh đó có cùng màu. Đường biên giữ các vùng
chính là các đường biên cần tìm
* Thuật toán tìm đường biên dựa trên sự biến thiên giá trị màu của các điểm
ảnh.
Đầu vào: Ma trận điểm ảnh, khoảng cách màu tối thiểu
Đầu ra: Ma trận điểm ảnh mới (chứa các đường biên tìm thấy).
Giải thuật:
For (mỗi điểm ảnh của ảnh)
{
- Tính khoảng cách màu của điểm ảnh với các điểm ảnh lân cận: Tính theo 8
hướng của điểm ảnh
If (Nếu có một khoảng cách màu lớn hơn khoảng cách màu cho phép)
{
- Ghi nhận điểm ảnh này là một điểm biên mới.
}
}