Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 1-
Lời mở đầu

Trong thực tế hình dạng thƣờng đƣợc chú trọng hơn kích thƣớc và con ngƣời
nhận ra các đối tƣợng xung quanh cũng chủ yếu thông qua hình dạng. Chính vì vậy,
biểu diễn hình dạng là một vấn đề quan trọng và không thể thiếu trong quá trình nhận
dạng đối tƣợng. Trong xử lý ảnh số ta sử dụng các phép toán hình thái để giải quyết
vấn đề này.
Các phép toán hình thái không những quan trọng trong lĩnh vực toán học mà còn
rất quan trọng trong lĩnh vực Công Nghệ Thông Tin nói chung và xử lý ảnh số nói
riêng: giúp ta giải quyết các bài toán nhƣ tìm biên ảnh, lọc nhiễu trên ảnh, cải thiện
chất lƣợng hình ảnh, nối các nét đứt trong văn bản đã xuống cấp và phát hiện đối
tƣợng chuyển động và nhiều các ứng dụng các nữa.
Chính vì vậy em đã lựa chọn đề tài “Tìm hiểu các phép toán hình thái và ứng
dụng”.
Mục tiêu của đồ án là tìm hiểu các phép toán hình thái và ứng dụng vào xử lý các
đối tƣợng trong hình ảnh.
Ban đầu em đã tìm đọc các tài liệu và sách báo có nội dung liên quan đến các
khái niệm trong đề tài, sau đó đƣa ra phƣơng hƣớng, và rút ra kết luận cho riêng mình
để thực hiện đề tài.
Báo cáo đồ án gồm 58 trang, đƣợc chia làm 4 chƣơng:
Chương I. Tổng quan về xử lý ảnh: Chƣơng này gồm có các khái niệm ban đầu
về xử lý ảnh số, lịch sử phát triển, các ứng dụng, tầm quan trọng, và các bƣớc đƣợc
thực hiện trong quá trình xử lý ảnh.
Chương II. Khái niệm về phép toán hình thái: Chƣơng này gồm có các khái
niệm về phép toán hình thái, từ cơ bản đến những khái niệm nâng cao và ứng dụng
trong thực tế. Đầu tiên là các khái niệm tập hợp nhƣ các quan hệ phép hợp, phép giao,
phép bù… sau đó là các phép toán logic liên quan đến quá trình xử lý ảnh nhị phân, để
tiện cho việc phân tích và chứng minh các công thức chính của phép toán hình thái.
Toàn bộ chƣơng tập trung làm rõ các khái niệm về: Phép co nhị phân, phép giãn nhị
phân, phép đóng ảnh, phép mở ảnh, phép trúng hoặc trƣợt (Hit-or-Miss), Phép trích
biên, Phép làm đầy, phép tách các thành phần liên thông, phép bao lồi, phép làm mảnh
và tìm xƣơng.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 2-
Chương III. Các ứng dụng của phép toán hình thái: Chƣơng này nêu rõ các
ứng dụng của phép toán hình thái đã tìm hiểu trong xử lý ảnh.
Chương IV. Cài đặt chương trình thử nghiệm: Trên cơ sở lý thuyết đã tìm
hiểu em xây dựng chƣơng trình xử lý ảnh sử dụng các phép toán: phép co nhị phân,
phép giãn nhị phân, phép đóng ảnh, phép mở ảnh, và tìm xƣơng làm mảnh các đối
tƣợng trên ảnh nhị phân.
Kết Luận.






















Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 3-



Lời cảm ơn !


Đầu tiên em xin chân thành cảm ơn PGS. TS. Ngô Quốc Tạo - người đã trực tiếp
hướng dẫn và định hướng giúp em có thể nhanh chóng tiếp cận, nắm bắt kiến thức và
hoàn thành đề tài ”Các phép toán hình thái và ứng dụng”.
Em xin gửi lời cảm ơn tới khoa Công Nghệ Thông Tin- Trường Đại Học Điện
Lực, vì đã tạo điều kiện thuận lợi cho em trong suốt quá trình học tập tại trường.
Em xin gửi lời cảm ơn tới toàn thể thầy cô giáo khoa Công Nghệ Thông Tin -
Trường Đại Học Điện Lực, đã tận tình giảng dạy trang bị cho em những kiến thức quý
báu trong những năm học vừa qua.
Em xin gửi lời cảm ơn đến những người thân trong gia đình, bạn bè đã động viên
và tạo mọi điều kiện giúp chúng em trong quá trình học tập cũng như trong cuộc sống.
Mặc dù em đã cố gắng hoàn thành tốt đề tài nhưng cũng không thể tránh khỏi
những sai sót nhất định, rất mong được sự thông cảm và chia sẻ cùng quý Thầy Cô và
bạn bè.



Em xin chân thành cảm ơn!
Hà Nội, Ngày 15 tháng 06 năm 2009
Sinh viên thực hiện
ĐÀO BẢO LINH





Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 4-

MỤC LỤC

Lời mở đầu ................................................................................................................................. 1
Lời cảm ơn ! ................................................................................................................................ 3
DANH MỤC HÌNH VẼ BẢNG BIỂU SỬ DỤNG TRONG ĐỒ ÁN ............................... 6
CHƢƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH ......................................................................... 8
1.1. Sơ lƣợc về nguồn gốc của xử lý ảnh số ....................................................................... 8
1.2. Khái niệm về xử lý ảnh số ........................................................................................... 9
1.3. Quá trình xử lý ảnh .......................................................................................................... 9
CHƢƠNG II. KHÁI NIỆM VỀ PHÉP TOÁN HÌNH THÁI ................................................... 11
2.1. Khái niệm cơ bản ........................................................................................................... 11
2.2. Các phép toán Logic liên quan đến ảnh nhị phân .......................................................... 15
2.3. Phép giãn nhị phân (Dilation) ........................................................................................ 18
2.4. Phép co nhị phân (Erosion) ........................................................................................... 20
2.5. Một số tính chất của phép toán hình thái ....................................................................... 23
2.5.1. Các mệnh đề ........................................................................................................... 23
2.5.2. Định lý .................................................................................................................... 24
2.5.3. Hệ quả ..................................................................................................................... 24
2.6. Phép mở ảnh (Opening) và phép đóng ảnh (Closing) ................................................... 25
2.6.1. Phép mở ảnh ........................................................................................................... 25
2.6.2. Phép đóng ảnh ........................................................................................................ 27
2.6.3. Các tính chất của Phép mở ảnh và phép đóng ảnh ................................................. 29
2.7. Phép Biến đổi trúng hoặc trƣợt (Hit-or-Miss) ............................................................... 30
2.8. Các thuật toán cơ bản của hình thái học ........................................................................ 31
2.8.1. Trích biên ( Boundary Extraction ) ........................................................................ 31
2.8.2. Làm đầy (Region Filling) ....................................................................................... 32
2.8.3. Tách các thành phần liên thông (Extraction of Connected Components) .............. 33
2.8.4. Bao Lồi (Convex Hull) ........................................................................................... 34
2.8.5. Làm mảnh(Thinning) .............................................................................................. 36
2.8.6. Tìm khung xƣơng (Skeletonization) ....................................................................... 38
CHƢƠNG III. ỨNG DỤNG CỦA PHÉP TOÁN HÌNH THÁI .............................................. 40
3.1. Sử dụng phép toán hình thái trong ƣớc lƣợng độ nghiêng văn bản ............................... 40
3.1.1. Mô tả phƣơng pháp ................................................................................................. 42
3.1.2. Áp dụng phép toán hình thái .................................................................................. 42
3.2. Ứng dụng phép toán hình thái trong tách dòng văn bản ................................................ 44
3.2.1. Sử dụng phép toán hình thái để tô lem dòng văn bản ............................................. 44
CHƢƠNG IV. CÀI ĐẶT CHƢƠNG TRÌNH .......................................................................... 46
4.1. Giới thiệu chƣơng trình ................................................................................................. 46
4.2. Hƣớng dẫn sử dụng ....................................................................................................... 47
4.3. Thực Nghiệm ................................................................................................................. 48
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 5-
Kết luận .................................................................................................................................... 53
Tài liệu tham khảo: ................................................................................................................... 54




























Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 6-
DANH MỤC HÌNH VẼ BẢNG BIỂU SỬ DỤNG TRONG ĐỒ ÁN


Hình 1.1: Bức ảnh đầu tiên về mặt trăng của cơ quan vũ trụ mỹ NASA. Vào lúc 9:09
phút sáng ngày 31/6/1964. (Digital Image processing second edition, Tr 18) ................... 9
Hình 1.2: Các giai đoạn chính trong xử lý ảnh. ................................................................ 10
Hình 2.1: Ảnh và đối tƣợng trong ảnh. ............................................................................. 12
Hình 2.2: Quan hệ giữa hai tập hợp .................................................................................. 13
Hình 2.3: Phép biến đổi của tập hợp................................................................................. 14
Bảng 2.1: Ba phép toán logic cơ bản: ............................................................................... 15
Hình 2.4: Một số phép toán logic giữa các hình ảnh nhị phân. ........................................ 16
Hình 2.5: Một vài thí dụ về các phần tử cấu trúc. ............................................................ 17
Hình 2.6: Phép giãn nhị phân. .......................................................................................... 19
Hình 2.7: Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân. ............................ 20
Hình 2.8: Phép co nhị phân trên hai đối tượng. ............................................................... 21
Hình 2.9: Quá trình lọc đối tƣợng sử dụng phép co nhị phân và phép giãn nhị phân. ..... 22
Hình 2.10: Ứng dụng của phép co ảnh dƣới dạng số nhị phân. ....................................... 23
Hình 2.11: Quá trình thực hiệp phép mở ảnh. .................................................................. 26
Hình 2.12: Phép mở ảnh trên phƣơng diện ý nghĩa hình học. .......................................... 27
Hình 2.13: Quá trình thực hiện phép đóng ảnh. ............................................................... 28
Hình 2.14: Minh họa phép đóng ảnh trên phƣơng diện ý nghĩa hình học. ....................... 29
Hình 2.15: Minh họa phép biến đổi trúng hoặc trƣợt ....................................................... 30
Hình 2.16: Quá trình tìm biên của đối tƣợng trên ảnh nhị phân. ...................................... 32
Hình 2.17: Quá trình làm đầy đối tƣợng trong ảnh. ......................................................... 33
Hình 2.18: Quá trình tách các thành phần liên thông trong ảnh bằng phép toán hình thái.
.......................................................................................................................................... 34
Hình 2.19: Một quá trình trong phép bao lồi. ................................................................... 35
Hình 2.20: Phép bao lồi đối với đối tƣợng trong ảnh. ...................................................... 36
Hình 2.21: Quá trình làm mảnh đối tƣợng trong hình ảnh. ............................................ 38
Hình 2.22: Quá trình thực hiện thuật toán tìm xƣơng. ..................................................... 39
Hình 3.1: Các dòng văn bản có xu hƣớng dính lại với nhau do ảnh hƣởng của dấu ........ 41
Hình 3.2: Những khoảng góc nghiêng khác nhau đƣợc sử dụng để ƣớc lƣợng góc
nghiêng phù hợp cho phần tử cấu trúc. ............................................................................. 43
Hình 3.3: Một vài ví dụ của việc sử dụng phép đóng và mở với những phần tử cấu trúc
nghiêng. Hình 3.3a và 3.3d là những ảnh đƣa vào ban đầu. Hình 3.3b và 3.3e là những
kết quả của việc áp dụng bƣớc tiền xử lý, ƣớc lƣợng thô, và phép đóng tƣơng ứng với
hình 3.3a và 3.3d. Hình 3.3c và 3.3f là những kết quả của việc áp dụng phép mở tƣơng
ứng với hình 3.3b và 3.3e. ................................................................................................ 44
Hình 3.5: Hai dòng văn bản đã đƣợc tô lem. .................................................................... 45
Hình 3.6: (a) Một dòng cắt nhƣng không mở rộng biên, (b) Dòng cắt đã đƣợc mở rộng
biên. .................................................................................................................................. 45
Hình 4.1: Thực nghiệm giãn nhị phân hình ảnh với cấu trúc 4x4. ................................... 48
Hình 4.2: Thực hiện giãn nhị phân hình ảnh với phần tử cấu trúc 7x7. ........................... 49
Hình 4.3: Thực nghiệm phép co nhị phân trên hình ảnh với phần tử cấu trúc 4x4. ......... 49
Hình 4.4: Thực nghiệm phép mở ảnh trên hình ảnh với phần tử cấu trúc tròn 7x7. ........ 50
Hình 4.5: Thực nghiệm mở ảnh làm trơn góc của đối tƣợng trong ảnh nhị phân. ........... 50
Hình 4.6: Thực nghiệm phép mở ảnh với phần tử cấu trúc hình chữ thập, kích thƣớc 7x7.
.......................................................................................................................................... 51
Hình 4.7: Thực nghiệm phép đóng ảnh trên phần tử cấu trúc tròn 7x7. ........................... 51
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 7-
Hình 4.8: Thực nghiệm phép đóng ảnh với phần tử cấu trúc hình dạng chữ thập, kích
thƣớc 7x7. ......................................................................................................................... 52
Hình 4.9: Thực nghiệm tìm xƣơng đối tƣợng trên ảnh nhị phân. ..................................... 52
Hình 4.10: Thực nghiệm tìm biên của đối tƣợng. ............................................................ 52











































Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 8-
CHƢƠNG I. TỔNG QUAN VỀ XỬ LÝ ẢNH

Trong nghành khoa học máy tính, xử lý ảnh là một dạng của xử lý tín hiệu cho
đầu vào là một ảnh hoặc các frame của phim ảnh. Đầu ra có thể là một hình ảnh, hoặc
tập hợp các ký tự hoặc các tham số liên quan tới hình ảnh. Thƣờng thì kỹ thuật xử lý
ảnh có liên quan tới xử lý tín hiệu hai chiều và đƣợc áp dụng bằng một chuẩn riêng về
kỹ thuật xử lý ảnh cho nó. Các khái niệm cơ bản để xử lý tín hiệu nhƣ, khái niệm về
tích chập, các biến đổi Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Ngoài ra còn
cần tới các công cụ toán học nhƣ đại số tuyến tính, sác xuất, thống kê. Và một số kiến
thức cần thiết nhƣ Trí tuệ nhân tao, Mạng nơ ron nhân tạo cũng đƣợc đề cập trong quá
trình phân tích và nhận dạng ảnh.
Sơ lƣợc về nguồn gốc của xử lý ảnh số
Các phƣơng pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lƣợng
ảnh và phân tích ảnh. Ứng dụng đầu tiên đƣợc biết đến là nâng cao chất lƣợng ảnh
trong nghành công nghiệp báo chí, những bức ảnh này đƣợc truyền qua dây cáp ngầm
giữa hai thành phố Luân đôn và New York. Từ những năm 1920, hệ thống Bartlane
đƣợc giới thiệu, đó là một hệ thống truyền ảnh số qua dây cáp giúp giảm thiểu thời
gian truyền hình ảnh, cụ thể thƣờng thì để truyền một hình ảnh qua biển Alantic mất
tới hơn một tuần thì qua hệ thống này chỉ mất hơn 3 giờ đồng hồ . Đây một hệ thống
chuyên dụng đã đƣợc trang bị để mã hóa các bức ảnh thành một dạng tín hiệu sau đó
truyền qua hệ thống dây cáp, ở đầu nhận tín hiệu sẽ có một hệ thống chuyên dụng để
giải mã và khôi phục lại chúng.
Vấn đề mới nảy sinh là chất lƣợng của các bức ảnh số này có liên quan tới
phƣơng thức in và phân bố mức sáng, độ phân giải của ảnh. vào khoảng những năm
1955 việc nâng cao chất lƣợng ảnh cũng đƣợc phát triển để giải quyết vấn đề này. Các
kỹ thuật xử lý ảnh không ngừng đƣợc cải thiện trong những năm tiếp theo. Nhƣng điều
quan trọng là nghành công nghệ máy vi tính cũng không ngừng đƣợc phát triển, đáp
ứng tốt nhu cầu của công nghệ, giá thành ngày càng giảm, theo đó tốc độ xử lý cũng
đƣợc cải thiện lên nhiều. Cùng với những đỏi hỏi khoa học nghiên cứu không gian tạo
động lực thúc đẩy cho kỹ thuật xử lý ảnh phát triển. Cụ thể, vào năm 1964, Những bức
ảnh đầu tiên chụp bề mặt mặt trăng đã đƣợc truyền về trái đất từ vệ tinh Ranger 7,
những bức ảnh này đã đƣợc máy tính xử lý và nâng cao chất lƣợng nhƣ làm nổi đƣờng
biên, và lƣu trữ ảnh.
Từ năm 1964 đến nay, các ứng dụng của xử lý ảnh ngày càng đƣợc mở rộng
ngoài các ứng dụng trong thăm dò nghiên cứu vũ trụ, các kỹ thuật xử lý ảnh còn đƣợc
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 9-
sử dụng trong nhiều mục đích khác nhau. Hầu hết các bài toán đặt ra đều là phân tích
và nâng cao chất lƣợng ảnh.Ta có thể kể đến một vài ứng dụng nhƣ: Thăm dò địa chất,
sinh học, y học, hóa học, vật lý…


Hình 1.1: Bức ảnh đầu tiên về mặt trăng của cơ quan vũ trụ mỹ NASA. Vào lúc 9:09
phút sáng ngày 31/6/1964. (Digital Image processing second edition, Tr 18)
Khái niệm về xử lý ảnh số
Một hình ảnh có thể đƣợc định nghĩa trên hệ trục tọa độ bởi hàm
( , ) f x y
với x và
y là các tọa độ. Vị trí mỗi điểm ảnh đƣợc xác định bởi các cặp tọa độ (x,y) trên hệ trục
tọa độ, biên độ của mỗi điểm ảnh thì đƣợc gọi là một cƣờng độ hoặc mức xám(Gray
lever). Ta có thể xem ảnh số nhƣ một ma trận các điểm có chỉ số hàng chỉ số cột, mỗi
phần tử thuộc ma trận này đƣợc gọi là một điểm ảnh (Pixel). Đối với ảnh xám, mỗi
điểm ảnh tƣơng ứng với một mức xám nhất định(256 mức xám).
1.3. Quá trình xử lý ảnh
Xử lý ảnh bao gồm nhiều lĩnh vực khác nhau: Phần cứng phần mềm và các cơ sở
lý thuyết. Hệ thống xử lý ảnh cho phép tiếp cận khung cảnh hoặc ảnh ở đầu vào. Thực
hiện một dãy các xử lý đa dạng để tạo ra một ảnh đa dạng ở đầu ra mang những thông
tin cần thiết, từ đó rút ra đƣợc các đặc trƣng cho phép hiểu đƣợc khung cảnh hoặc ảnh.
Các phƣơng pháp và kỹ thuật xử lý ảnh nhằm thiết kế các hệ thống máy có khả
năng nhìn và hiểu đƣợc hình ảnh nhƣ con ngƣời, giúp con ngƣời quan sát đƣợc những
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 10-
nơi mà họ không thể tới đƣợc. Xử lý ảnh là một quá trình phức tạp đa dạng và liên
quan đến nhiều lĩnh vực khác nhau , sau đây là quá trình xử lý ảnh cơ bản.

Hình 1.2: Các giai đoạn chính trong xử lý ảnh.

Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể đƣợc thu nhận qua máy ảnh/máy
quay phim(Camera) theo dạng tín hiệu tƣơng tự, hoặc cũng có thể là tín hiệu số hóa,
hay tranh ảnh đƣợc quét bằng máy scanner. Tiếp theo là quá quá trình số hóa
(Digitalizer) để biến đổi tín hiệu tƣơng tự sang tín hiệu rời rạc(lấy mẫu) và số hóa bằng
lƣợng hóa, trƣớc khi chuyển sang giai đoạn xử lý, phân tích và lƣu trữ lại.
Mục đích của xử lý ảnh là :
- Biến đổi và làm đẹp ảnh.
- Tự động phân tích nhận dạng ảnh hay đoán nhận ảnh và đánh giá các nội dung
của ảnh.
Nhận dạng ảnh là quá trình liên quan đến mô tả các đối tƣợng mà ngƣời ta muốn
đặc tả về nó. Quá trình nhận dạng ảnh thƣờng đi sau quá trình trích chọn các đặc tính
chủ yếu của đối tƣợng. Có hai kiểu đối tƣợng là:
- Mô tả theo tham số ( Nhận dạng theo tham số ).
- Mô tả theo cấu trúc ( Nhận dạng theo cấu trúc ).
Nhận biết và đánh giá nội dung của ảnh là phân tích hình ảnh thành những phần
riêng để phân biệt đối tƣợng này với đối tƣợng khác. Dựa vào đó ta có thể mô tả cấu
trúc của hình ảnh ban đầu.
Có một số phƣơng pháp để nhận dạng ảnh cơ bản nhƣ nhận dạng biên của đối
tƣợng trên ảnh, tách cạnh và phân đoạn hình ảnh… kỹ thuật này đƣợc sử dụng nhiều
trong y học (xử lý tế bào, nhiễm sắc thể ).

Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 11-
CHƢƠNG II. KHÁI NIỆM VỀ PHÉP TOÁN HÌNH THÁI

Hiểu một cách đầy đủ thì “Morphology” là hình thái học và cấu trúc của đối
tƣợng, hay nó mô tả những phạm vi và các mối quan hệ giữa các thành phần trong một
đối tƣợng. Hình thái học quá quen thuộc trong các lĩnh vực ngôn ngữ học và sinh học.
Trong ngôn ngữ học, hình thái học là sự nghiên cứu về cấu trúc của từ, tập hợp từ,
câu… và đó cũng là một lĩnh vực nghiên cứu nhiều năm nay. Còn trong sinh học, hình
thái học lại chú trọng tới hình dạng của một cá thể hơn, chẳng hạn có thể phân tích
hình dạng của một chiếc lá để từ đó có thể nhận dạng đƣợc đó là loại cây gì; nghiên
cứu hình dạng của một nhóm vi khuẩn, dựa trên các đặc điểm nhận dạng để phân biệt
chúng thuộc nhóm vi khuẩn nào… Tùy theo trƣờng hợp cụ thể mà có cách phân lớp
phù hợp với nó: Có thể phân lớp dựa trên những hình dạng của mặt cắt nhƣ (Elip,
tròn…), kiểu và mức độ của những hình dạng bất quy tắc (lồi, lõm, …), những cấu
trúc trong (lỗ, đƣờng thẳng, đƣờng cong, …) mà đã đƣợc tích lũy qua nhiều năm quan
sát.
Tính khoa học của Hình thái học số mới chỉ thực sự phát huy khả năng của nó kể
từ khi máy tính điện tử số ra đời và làm cho hình thái học trở lên thông dụng, có nhiều
tính năng mới. Những đối tƣợng trong Hình thái học ta có thể coi nhƣ là tập hợp của
các điểm ảnh, nhóm lại theo cấu trúc ma trận hai triều. Những thao tác toán học rời rạc
trên tập hợp điểm đó đƣợc sử dụng để làm rõ những nét đặc trƣng riêng của hình dạng
đối tƣợng, do vậy có thể tính toán đƣợc hay nhận biết đƣợc chúng một cách dễ dàng.
Phần lớn các phép toán hình thái học đƣợc định nghĩa từ hai phép toán cơ bản là phép
toán co nhị phân (Erosion) và phép toán giãn nhị phân (Dilation) .
Phép toán cơ sở đƣợc kết hợp với một đối tƣợng là tiêu chuẩn của các phép toán
tập hợp nhƣ phép hợp (Union), Phép giao (InterSection), và phép bù (Complement)
cộng với phép tịnh tiến nào đó. Vì vậy trong phần tiếp theo sẽ trình bày các khái niệm
về tập hợp thƣờng đƣợc sử dụng trong phép toán hình thái.
2.1. Khái niệm cơ bản
Ta đã định nghĩa ảnh nhị phân là tập hợp các điểm ảnh có tọa độ a(x,y). Chúng ta
còn có định nghĩa khác về ảnh, theo quan sát thì có thể xem ảnh nhƣ tập hợp các tọa
độ rời rạc hoặc liên tục.
Theo một định nghĩa nào đó thì, tập hợp này tƣơng ứng với các điểm ảnh thuộc
về các đối tƣợng hiện hữu trong ảnh.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 12-

Hình 2.1: Ảnh và đối tượng trong ảnh.

Hình vẽ cho thấy hai đối tƣợng, hay hai tập hợp A và B trong ảnh. Ở đây ta cần
phải xác định hệ trục tọa độ nhƣ trong hình, quan tâm đến giá trị các điểm ảnh cấu
thành lên đối tƣợng trong ảnh và đƣợc giới hạn trên không gian rời rạc

.
Đầu tiên, ta có A là một tập hợp trong không gian rời rạc

. Nếu a = (a
1
, a
2
) là
một phần tử của tập hợp A thì ta có thể viết nhƣ sau:
a A e (0.1)
Nhƣ thế, nếu a không phải là một phần tử của tập hợp A thì ta viết:
a A e (0.2)
Tập hợp mà không có phần tử gọi là tập hợp rỗng hoặc tập hợp trống và đƣợc
biểu thị bằng ký tự C.
Tập hợp A đƣợc xác định bởi nội dung nằm trong 2 dấu ngoặc nhọn { } - .
Các phần tử của tập hợp có liên quan đến ở trong chƣơng này là những tọa độ
của các pixel đại diện cho đối tƣợng hoặc các đặc trƣng khác đƣợc quan tâm trong một
hình ảnh.
Thí dụ, khi ta viết một công thức:
{ } w| w , C d d D = = ÷ e (0.3)
Tập hợp C là tập hợp gồm các phần tử w, nhƣ vậy w đƣợc hình thành khi nhân
từng tọa độ của các phần tử trong tập hợp D với -1.
Nếu mỗi phần tử của tập hợp A cũng là một phần tử trong tập hợp B thì ta có thể
nói A là tập con của B, và đƣợc biểu thị nhƣ sau:
A B _ , (0.4)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 13-
Hợp (Union) của hai tập hợp A và B là tập hợp của các phần tử thuộc A, B hoặc
cả A và B, đƣợc biểu thị nhƣ sau:
C A B = , (0.5)
Nhƣ vậy giao (Intersection) của hai tập hợp A và B là tập hợp các phần tử thuộc
cả A và B, đƣợc biểu thị nhƣ sau:
D A B = · , (0.6)
Hai tập hợp A và B trở thành phân chia (Disjoint) hoặc loại trừ lẫn nhau (
Mutually exclusive) nếu chúng có chung các phần tử, nhƣ trong trƣờng hợp sau:
A B · =C, (0.7)


Hình 2.2: Quan hệ giữa hai tập hợp
a) Giao giữa tập hợp A và tập hợp B; b) Hợp giữa tập hợp A và tập hợp B; c) Phần bù
tuyệt đối của A; d) Phần bù tƣơng đối của tập hợp A trong tập hợp B ( Phép trừ hai tập
hợp A và B).
Phần bù tuyệt đối (complement) của một tập hợp A là tập hợp các phần tử
không bao gồm các phần tử trong A:
{ } w|w A
c
A = e , (0.8)
) a
B
A
A
B B
A
A
B
A
A
B
A B ·
A B ÷
( )
c
A
A
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 14-
Phần bù tƣơng đối (difference) của tập hợp A trong tập hợp B đƣợc biểu thị là A
– B nhƣ trong biểu thức sau:

{ } w| w , w A B A B A B ÷ = e e = · , (0.9)
Với w là tập hợp các phần tử thuộc tập hợp A nhƣng không thuộc tập hợp B,
khái niệm này đƣợc minh họa trên Hình 2.2(d). Phần có màu là kết quả của phép toán
giữa hai tập hợp.
Sau đây là hai định nghĩa cần bổ sung vì nó đƣợc sử dụng rộng rãi trong phép
toán hình thái, nhƣng nói chung là vẫn chƣa tìm đƣợc cái căn bản trên thuyết tập hợp.
Phản xạ (reflection) của tập hợp B đƣợc biểu thị là
̂
, và đƣợc định nghĩa bằng
biểu thức sau:

{ } w| w , B b b B = = ÷ e , (0.10)
Nghĩa là phần tử w đƣợc hình thành khi nhân từng tọa độ của tập hợp B với -1
khi đó vị trí tƣơng đối giữa các điểm trong tập hợp B có xu hƣớng đối ngƣợc lại so với
ban đầu, gọi là tính phản xạ của tập hợp. Hay nói cách khác tập hợp B sẽ quay quanh
gốc tọa độ một góc 180
o
.
Một điểm z(z
1
,z
2
) thuộc tập hợp A, khi z tịnh tiến thì phép tịnh tiến của tập hợp
A đƣợc biểu thị là
( )
z
A , và đƣợc định nghĩa bằng biểu thức sau:
( ) { } | ,
z
A c c a z a A = = + e , (0.11)
Khi một điểm z có tọa độ z(z
1
,z
2
) hình thành trong tập hợp A tịnh tiến một lƣợng
là z thì tập hợp A cũng tịnh tiến theo hƣớng của điểm z với một lƣợng tƣơng đƣơng.
Hình 2.3 cho thấy hai định nghĩa trên và sử dụng hai tập hợp A và B ở Hình 2.3, chấm
màu đen trên hình vẽ là để biểu thị phản xạ của tập hợp B và sự tịnh tiến của 1 điểm từ
tập hợp A.

(Some basic concept from set theory/ Digital image processing Second
Edition, tr 520~521)

Hình 2.3: Phép biến đổi của tập hợp
( )
z
A
) a
) b
1
z
B A
B
.
2
z
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 15-
a) Tịnh tiến của tập hợp A từ một điểm z; b) Phản xạ của tập hợp B.
Lƣu ý: Những phần tử riêng lẻ hợp thành B không chỉ có các điểm ảnh mà còn có
các vector khi chúng có vị trí tọa độ xác định với điểm gốc [0,0].
Bảng 2.1: Ba phép toán logic cơ bản:

p q p .q p v q
p ÷
0 0 0 0 1
0 1 0 1 1
1 0 0 1 0
1 1 1 1 0

2.2. Các phép toán Logic liên quan đến ảnh nhị phân
Các phép toán logic đƣợc sử dụng trong xử lý ảnh là AND( .), OR( v ), và NOT(
÷). Thuộc tính của các phép toán này đã đƣợc minh họa trong Bảng 2.1. Các phép
toán đó là cung cấp đầy đủ các chức năng, chúng có thể đƣợc kết hợp dƣới bất kỳ dạng
nào của phép toán logic.
Toán tử logic đƣợc thực hiện trên một điểm ảnh bằng điểm ảnh cơ sở giữa các
điểm ảnh tƣơng ứng của hai hoặc nhiều hình ảnh(Ngoại trừ NOT, đó là toán tử trên
các điểm ảnh của một hình ảnh đơn giản ). Bởi vì toán tử AND của hai biến nhị phân
chỉ là 1 khi cả hai biến là 1, vì vậy trong một hình ảnh ở bất kỳ vị trí nào thì với toán
tử AND giữa các điểm ảnh tƣơng ứng, ta thu đƣợc kết quả là 1 khi và chỉ khi các điểm
ảnh đầu vào đều có giá trị là 1. Hình 2.4 là ví dụ để minh họa cho các phép toán logic,
phần có màu xẫm là phần có giá trị là 1, phần màu trắng là phần có giá trị là 0. Các
phép toán logic khác đƣợc xây dựng dựa trên các phép toán đã đƣợc định nghĩa từ
bảng 2.1. Cho một ví dụ: Phép toán XOR ( dựa trên phép toán AND và NOT ), giá trị
của nó là 1 nếu giá trị của một trong hai điểm ảnh có giá trị là 1(Không phải là cả hai),
và giá trị của nó là 0 khi cả hai điểm ảnh đều có giá trị là 0 hoặc 1. Phép toán này khác
phép toán OR, giá trị trả về sẽ là 1 khi một trong hai điểm ảnh đầu vào là 1, hoặc khi
cả hai điểm ảnh đầu vào là 1. Phép toán NOT-AND chỉ trả về giá trị là 0 khi cả hai
điểm ảnh đầu vào là 1.



Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 16-
A B
A
( ) NOT A
NOT
A B
AND
OR
A B
XOR
A B
NOT
AND
÷
( ) ( ) A AND B
( ) ( ) A OR B
( ) ( ) A XOR B
( ) ( ) A N AND B ÷

Hình 2.4: Một số phép toán logic giữa các hình ảnh nhị phân.
Phần có màu xẫm có các giá trị là 1, và phần màu trắng có các giá trị là 0.
Phép toán hình thái cung cấp hai phép toán cơ bản là phép giãn nhị phân và phép
co nhị phân, hai phép toán này là cơ sở ban đầu cho nhiều thuật toán về hình thái khác.
Để đi vào tìm hiểu các phép toán hình thái, đầu tiên ta làm quen với một số khái
niệm quan trọng thƣờng đƣợc sử dụng trong bài viết.
Phần tử cấu trúc (Constructing elements): Đôi khi đƣợc gọi là một nhân (Kernel).
Nhƣng thuật ngữ này thƣờng đƣợc sử dụng cho các đối tƣợng trong tích chập
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 17-
(Convolutions). Các phần tử cấu trúc thƣờng đƣợc quy định theo một mẫu riêng dựa
trên tọa độ của một số điểm có liên quan tới đối tƣợng nào đó. Ta có thể quan sát ví dụ
từ hình minh họa phía dƣới, đó là các mẫu đặc trƣng cho các phần tử cấu trúc có kích
thƣớc khác nhau.


Hình 2.5: Một vài thí dụ về các phần tử cấu trúc.
Ở Hình 2.5 có đƣa ra hai kiểu phần tử cấu trúc đặc trƣng có kích thƣớc là 3x3 và
9x9, các vòng tròn đánh dấu gốc của phần tử cấu trúc ở hai kiểu này khác nhau, nhƣng
đều có đặc điểm chung là vòng đánh dấu tâm điểm luôn đƣợc đặt ở điểm có tọa độ ở
trung tâm của phần tử cấu trúc.
Lƣu ý: Ở mỗi tọa độ điểm trên phần tử cấu trúc đều có thể có một giá trị riêng.
Một thí dụ đơn giản nhất về ứng dụng của phần tử cấu trúc, nhƣ sử dụng vào phép co
với ảnh nhị phân. Ngoài ra còn có nhiều các phần tử cấu trúc phức tạp phục vụ cho các
mục đích khác, chẳng hạn nhƣ sử dụng để tìm xƣơng hoặc ứng dụng cho các phép toán
hình thái trên ảnh xám.
Một điểm quan trọng nữa cần lƣu ý là các phần tử cấu trúc cũng có thể có dạng
hình chữ nhật, hình tròn… Trên ví dụ minh họa thì trong các phần tử cấu trúc có một
số điểm bị bỏ trống, về bản chất thì những chỗ bỏ trống có thể coi nhƣ có giá trị là 0
hoặc một giá trị nào đó không thuộc phân tử cấu trúc, nếu đƣa vào sẽ gây khó hiểu với
nội dung cần đề cập, nên ở đây các phần tử đó đƣợc để trống.
Khi một phép toán hình thái đƣợc thực hiện thì các gốc của phần tử cấu trúc
thƣờng dịch chuyển lần lƣợt trên các điểm ảnh. Và khi đó giá trị của các điểm ảnh vừa
đƣợc quét qua sẽ đƣợc so sánh với nhau, các kết quả thu đƣợc sau khi so sánh phụ
thuộc vào phép toán hình thái đang đƣợc sử dụng.


1
1 1
1 1
1 1 1
1
1 1
1
1
1
1 1 1 1
1
1 1 1
1 1 1 1 1
1 1 1 1 1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1 1 1 1 1 1
1 1 1 1 1
1
1
1
1
1
1 1
1 1
1 1 1 1 1
1
1
1
1
1
1
0
0
1
1
1
1
1
10
1
1

Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 18-
2.3. Phép giãn nhị phân (Dilation)
Tập hợp B thƣờng thì đƣợc coi nhƣ là một phần tử cấu trúc(structuring element)
trong giãn nhị phân, cũng nhƣ trong các phép toán hình thái khác, tập hợp A là tập hợp
các phần tử của hình ảnh gốc.
Với A và B là các tập hợp trong

, thì phép giãn nhị phân của A theo B ( A B © )
đƣợc định nghĩa qua công thức sau:
|
z
A B z B A
.
¦ ¹
| |
© = · = C
´ ` |
\ .
¹ )
, (0.12)
Nhƣ vậy phép giãn nhị phân của tập hợp A bởi phần tử cấu trúc B là tập hợp của
tất cả các điểm z (z là tâm điểm của phần tử cấu trúc B trên tập hợp A) sao cho phản xạ
của B
z
giao với tập A tại ít nhất một điểm. Hay nói cách khác, phép giãn nhị phân là sự
chồng chéo từ ít nhất một phần tử từ phản xạ của phần tử cấu trúc B với tập hợp A.
Đồng thời các phần tử này phải là tập con của tập hợp A.
Công thức (1.12) có thể đƣợc viết lại :
|
z
A B z B A A
.
¦ ¹
| |
© = · _
´ ` |

\ .
¹ )
, (0.13)
Phép giãn nhị phân của tập hợp A bởi tập hợp B là tồn tại các điểm w thuộc

sao cho w là tổng của hai điểm tƣơng ứng bất kỳ thuộc tập hợp A và tập hợp B, định
nghĩa này đƣợc mô tả qua công thức :

{ }
2
w Z | w , , A B a b a A b B © = e = + e e , (0.14)
Tổng quát hơn, nếu A là một hình ảnh và B là phần tử cấu trúc có tâm điểm nằm
trên hình ảnh A, khi đó phép giãn của hình ảnh A bởi phần tử cấu trúc B có thể đƣợc
hiểu nhƣ quỹ tích của các điểm đƣợc phủ bởi phần tử cấu trúc B khi tâm điểm của B di
chuyển trên cạnh của hình ảnh A.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 19-

Hình 2.6: Phép giãn nhị phân.
Hình 2.6a gồm:
+ Tập hợp A có hai cạnh bên kích thƣớc là d.
+ Phần tử cấu trúc vuông B kích thƣớc d/4, trƣờng hợp này thì phần tử cấu trúc
B và tƣơng phản của nó bằng nhau vì B có tập hợp các phần tử đối xứng nhau qua tâm
điểm (dấu chấm đen ở giữa).
+ Cuối cùng là kết quả của phép giãn nhị phân giữa tập hợp A và phần tử cấu
trúc B.
Hình 2.6b cũng gồm những thành phần tƣơng tự nhƣng với phần tử cấu trúc B
là hình chữ nhật, nhƣng cho ta một kết khác. Nhƣ vậy, mỗi kiểu phần tử cấu trúc khác
nhau sẽ cho ta một kết quả khác nhau, sau khi thuật toán đƣợc thi hành.
Từ đó ta có công thức:

b
b B
A B A
e
© = , (0.15)
Để thực tế hóa những lý thuyết đã nêu trên, ta coi những phần tử cấu trúc nhƣ
một mẫu sẵn và dịch chuyển tịnh tiến trên bề mặt hình ảnh. Khi gốc của phần tử cấu
) a
) b
d/8 d/8
d/4
d/4
d
d
d
d
d
d
d
d
d/8 d/8
d/8
d/8
d/2
d/4
d/4
d/4
Hướng
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 20-
trúc (chấm đen ở tâm điểm) khớp với điểm ảnh tại cạnh của hình ảnh thì các điểm ảnh
tƣơng ứng với với gốc này sẽ đƣợc đánh dấu và thay thế. Sau khi toàn bộ điểm ảnh đã
đƣợc quét qua bởi phần tử cấu trúc thì, thao tác giãn hình ảnh đƣợc hoàn tất.
Một ví dụ về phép giãn trên một hình ảnh nhị phân sử dụng phần tử cấu trúc
dạng ma trận vuông 3x3 nhƣ sau:

Hình 2.7: Quá trình quét của phần tử cấu trúc trên hình ảnh nhị phân.
Ở ví dụ trên ta các điểm ảnh màu trắng mang giá trị là 1 là các điểm thuộc đối
tƣợng đang cần quan tâm trên ảnh, và phần màu đen mang giá trị 0 là phần nằm ngoài
đối tƣợng. Khi thuật toán đƣợc thi hành thì phần tử cấu trúc sẽ lần lƣợt quét qua các
điểm ảnh ngoài cùng( Đi theo đƣờng kẻ màu đỏ trên hình vẽ ) của đối tƣợng sau đó
thay thế các điểm ảnh trên đối tƣợng này theo mẫu phần tử cấu trúc. Từ đó ta ứng
dụng để nối các nét bi đứt gẫy của đoạn văn do quá trình xuống cấp, với khoảng cách
lớn nhất của các nét bị đứt gãy tầm hai điểm ảnh.
2.4. Phép co nhị phân (Erosion)
Ta cũng xét tập hợp A và tập hợp B (Phần tử cấu trúc) trong

, thì phép co nhị
phân của tập hợp A bởi phần tử cấu trúc B đƣợc kí hiệu A B và viết dƣới dạng công
thức nhƣ sau:
A B =
( ) { }
|
z
z B A _ , (0.16)
Với { } ,
z
B b z b B = + e , (0.17)
Phép co nhị phân của tập hợp A bởi phần tử cấu trúc B là tập hợp các điểm z (z
nằm ở tâm điểm của phần tử cấu trúc B) sao cho B
z
là tập con của A.
Xét hình vẽ sau:
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 21-

Hình 2.8: Phép co nhị phân trên hai đối tƣợng.
Hình 2.8a gồm:
+ Tập hợp A có hai cạnh bên kích thƣớc là d.
+ Phần tử cấu trúc vuông B kích thƣớc d/4(Dấu chấm đen ở giữa là tâm điểm).
+ Cuối cùng là kết quả của phép co nhị phân giữa tập hợp A và phần tử cấu trúc
B.
Phần có màu nhạt hơn là kết quả sau khi thực hiện co hình ảnh bởi phần tử cấu
trúc B. Hình 2.8b gồm những thành phần tƣơng tự nhƣng với phần tử cấu trúc B là
hình chữ nhật, và cho ta một kết quả khác.
Vậy phép co nhị phân của ảnh A với phần tử cấu trúc B là quỹ tích các điểm
đƣợc tạo ra bởi tâm điểm của phần tử cấu trúc B khi tịnh tiến trên hình ảnh A.
Từ đó ta có công thức:
A B
B
b B
A
÷
e
= , (0.18)
Phép co nhị phân và giãn nhị phân có thể đƣợc với nhau qua phép bù và phép
phản xạ của tập hợp, luận lý này sẽ đƣợc minh họa qua công thức sau:
(A B)
c
=A
c
© B
.
, (0.19)
Ta chứng minh công thức trên là đúng:
d/8
d/4
d/2
d
Hướng
3d/4
d/8
d/4
d
d
d
d/8 d/8
3d/
4
d/8
d/8
d/
2
d/4
d/4
d/2
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 22-
Từ công thức co nhị phân ta có:
(A B)
c
=
( ) { }
|
z
z B A _
c
, (0.20)
Nếu tập hợp B
z
là tập con tập hợp A thì ta có, B
z
·A
c
=C, cho nên, trong trƣờng
hợp này ta sẽ có:
(A B)
c
=
( ) { }
|
c
z
z B A · = C
c
, (0.21)
Vì phần bù của phép giãn nhị phân giữa tập hợp A và tập hợp B luôn thỏa mãn:
(B
z
·A
c
=C)
c
= B
z
·A
c
= C
cho nên:
(A B)
c
=
( ) { }
|
c
z
z B A · = C
Mặt khác theo công thức 1.12 ta có:
|
z
A B z B A
.
¦ ¹
| |
© = · = C
´ ` |
\ .
¹ )

Suy ra: (A B)
c
= A
c
© B
.
, .+
Nhƣ vậy, phần bù của phép co nhị phân giữa tập hợp A và Phần tử cấu trúc B là
phép giãn nhị phân giữa phần bù của tập hợp A với phản xạ của phần tử cấu trúc B.
Một ứng dụng quan trọng của phép co nhị phân là dùng để loại trừ các chi tiết
không cần thiết trên hình ảnh. Thí dụ, Trên một hình ảnh , ta có các đối tƣợng có cỡ
tƣơng ứng 1,4,6 và 11 điểm ảnh, Bây giờ nếu muốn loại trừ các đối tƣợng nhỏ không
cần thiết trên ảnh, chỉ để lại các đối tƣợng có kích thƣớc lớn, nhƣ trong hình vẽ đối
tƣợng ta cần giữ lại là những đối tƣợng có kích thƣớc 11 điểm ảnh. Ta sẽ sử dung phần
tử cấu trúc có kích thƣớc 10x10 điểm ảnh để thực hiện phép co nhị phân ( Erosion ).
Kết quả sẽ chỉ còn lại 3 đối tƣợng có kích thƣớc 1 điểm ảnh(Hình 2.9b). Sau đó để các
đối tƣợng trở lại kích thƣớc ban đầu ta sử dụng phép giãn nhị phân( Dilation ) với
phần tử cấu trúc có kích cỡ tƣơng ứng (Hình 2.9c).


Hình 2.9: Quá trình lọc đối tượng sử dụng phép co nhị phân và phép giãn nhị phân.
) b ) a ) c
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 23-
Quá trình thực hiện có thể đƣợc minh họa rõ ràng qua hình vẽ sau:


Hình 2.10: Ứng dụng của phép co ảnh dưới dạng số nhị phân.
a) Hình ảnh ban đầu; b) Hình ảnh quá trình co nhị phân trên đối tƣợng với phần
tử cấu trúc 10x10, phần tử đƣợc tô dậm màu sẽ có giá trị 1 sau quá trình co nhị phân;
c) Phóng to đối tƣợng và giá trị của đối tƣợng sau quá trình co nhị phân với phần tử
cấu trúc 10x10.
2.5. Một số tính chất của phép toán hình thái
Để thuận tiện trong việc cài đặt ta có thể phân tích và đơn giản hóa các mẫu phức
tạp, dƣới đây là một số tính chất cơ sở của phép toán hình thái.
2.5.1. Các mệnh đề
-Mệnh đề 1: Tính chất gia tăng
a) ' X X X _ ¬ B _ ' X B , B ¬
' , X B X B © _ © B ¬
b) ' B B X _ ¬ B _ ' X B , X ¬
', X B X B © _ © X ¬
-Mệnh đề 2: Tính chất phân phối với phép
a) ( ) ( ) ( ), X B B X B X B ' ' © = © ©
b) X ( ) B B' =( X B ) ( X B' ),
- Mệnh đề 3: Tính chất phân phối với phép giao
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 24-
( X · Y ) B =( X B ) · (Y B ),
- Mệnh đề 4: Tính chất kết hợp
a) ( ) ( ), X B B X B B ' ' © © = © ©
b) ( X B ) B' = X ( B B' © ),
2.5.2. Định lý
Giả sử, X là một đối tƣợng trong ảnh, B là phần tử cấu trúc, khi đó X sẽ bị chặn
trên và chặn dƣới bởi tập close của X theo B.
Ta có, ( ) X B © B _ X _( X B ) © B ,
Chứng minh,
Ta có: ,
x
x X B X B ¬ e ¬ _ © (Vì
x
x X
X B B
e
© = )
( ) x X B ¬ e © B (Theo định nghĩa của phép co),
( ) X B ¬ © B X _ , (0.22)
Mặt khác, y ¬ e(X B ) © B ,
Suy ra: x X - e B sao cho,
x
y B e ( Vì (X B ) © B =
x
x X B
B
e
)
,
x
B X y X ¬ e ¬ e
Suy ra: ( X X _ ) , B B © (0.23)
Từ (1.22) và (1.23) ta có:
( ) X B © B X _ _( X B ) B © ,


2.5.3. Hệ quả
Tính Bất biến:
a) ( ( ) X B © B ) B © =( ) X B © ,
b) ( (X B ) B © ) B =(X B ),
Thật vậy, từ định lý trên ta có: ( ) X X B _ © B ,
Do đó, theo tính chất gia tăng ta có:
(( ) X B X B ¬ © _ © B ) B © , (0.24)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 25-
Mặt khác cũng theo định lý trên ta có: ( X B ) B © _ X X ¬
(( X ¬ B ) B © ) B X _ B , (0.25)
Từ (1.24) và (1.25) ta có:
(( ) X B ¬ © B ) B © = X B © .
Và (( X B ) B © ) B = X B
.

(Phát triển kỹ thuật dò biên, phát hiện biên và ứng dụng/Tr. 15)

2.6. Phép mở ảnh (Opening) và phép đóng ảnh (Closing)
Ở các chủ đề trên đã nêu một số khái niệm cũng nhƣ phƣơng thức giãn nhị phân
và co nhị phân các đối tƣợng trên một ảnh. Sau đây là hai khái niệm cũng rất quan
trọng trong phép toán hình thái, đó là phép mở ảnh (Opening) và phép đóng ảnh
(Closing). Phép mở ảnh và phép đóng ảnh là hai phép toán đƣợc mở rộng từ hai phép
toán hình thái cơ bản là phép co nhị phân và phép dãn nhị phân. Phép mở ảnh thƣờng
làm trơn biên của đối tƣợng trong ảnh, nhƣ loại bỏ những phần nhô ra có kích thƣớc
nhỏ. Phép đóng ảnh cũng tƣơng tự làm trơn biên của đối tƣợng trong ảnh nhƣng ngƣợc
với phép mở. Phép toán này thƣờng làm hợp nhất các đoạn gẫy hẹp, loại bỏ các lỗ
hổng nhỏ và làm đầy các khe hở trong chu tuyến.
2.6.1. Phép mở ảnh
Bài toán đặt ra là làm thể nào để có thể làm trơn biên của đối tƣợng loại bỏ
những điểm nhô thừa, có kích thƣớc nhỏ không cần thiết. Từ đó, ta đặt ra giải pháp
nhƣ sau: Sử dụng phép co nhị phân, lƣợc bỏ các điểm ảnh bên gần phía ngoài bề mặt
đối tƣợng, chỉ để lại chỉ giữ lại các phần tử cơ bản cấu hình lên hình dạng của đối
tƣợng. Từ các phần tử sau khi co nhị phân ta ta sẽ sử dụng phép giãn nhị phân để tác
động lên đối tƣợng. Cuối cùng ta sẽ có đối tƣợng mới từ các phần tử cơ bản đó, đối
tƣợng này sẽ đáp ứng đƣợc yêu cầu bài toán đặt ra.
Nhƣ vậy, để thực hiện phép đóng ảnh ta phải trải qua hai giai đoạn là co ảnh và
giãn ảnh. Đầu tiên sử dụng phép co và phần tử cấu trúc có kích thƣớc tƣơng ứng để tác
động lên đối tƣợng trong ảnh đúng theo yêu cầu. Tƣơng tự với phép giãn nhị phân ta
sẽ thu đƣợc kết quả (Hình 3.0).
Với tập hợp A là đối tƣợng trong hình ảnh và B là phần tử cấu trúc, ( ) là ký hiệu
của phép mở ảnh giữa tập hợp A và phần tử cấu trúc B, phép mở ảnh đƣợc xác định
bởi công thức:
A B = (A ⊖ B)⊕B, (0.26)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 26-

Hình 2.11: Quá trình thực hiệp phép mở ảnh.

Trên phƣơng diện ý nghĩa hình học, giả sử ta có phần tử cấu trúc B dạng một
hình tròn, Khi đó biên của tập hợp A B gồm quỹ tích các điểm thuộc biên của phần tử
cấu trúc B, khi B tịnh tiến trên đƣờng biên tập hợp A, và cách biên của tập hợp A
khoảng cách xa nhất (Hình 2.12), hình 2.12a là đối tƣợng ban đầu, hình 2.12c là đối
tƣợng sau khi thực hiện phép mở ảnh. Tất cả các hƣớng góc ngoài đều đƣợc làm trơn,
trong khi những góc hƣớng vào trong đều không bị ảnh hƣởng. Những chô nhọn nhỏ
thừa nhô ra sẽ bị lƣợc bỏ.
Từ luận điểm này ta có công thức:

x
x
B A
A B B
_
= , (0.26)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 27-

Hình 2.12: Phép mở ảnh trên phương diện ý nghĩa hình học.

Khu vực tô đậm là đối tƣợng mới sau khi thực hiện phép toán; khu vực trong viền nét đứt là
đối tƣợng cũ trƣớc khi thực hiện phép toán.
2.6.2. Phép đóng ảnh
Tƣơng tự nhƣ phép mở ảnh, nhƣng quá trình thực hiện phép đóng ảnh có xu
hƣớng ngƣợc lại, với mục đích, lấp đầy những chỗ thiếu hụt của đối tƣợng trên ảnh
dựa vào các phần tử cơ bản ban đầu.
Với tập hợp A là đối tƣợng trong ảnh, B là phần tử cấu trúc.
( ) - là ký hiệu phép
đóng ảnh. Khi đó phép đóng ảnh của tập hợp A bởi Phần tử cấu trúc B, kí hiệu là
( ) A B - , xác định bởi:
( ) A B - =( ) A B © B , (1.28)
Cho một hình ảnh nhị phân, với đối tƣợng trong ảnh có những khu vực bị đứt
gãy, không liền mạch. Để khắc phục hiện tƣợng này ta áp dụng phép đóng ảnh, với A
là đối tƣợng ban đầu, B là phần tử cấu trúc có kích thƣớc 3x3 (Hình 2.13a). Khi áp
dụng phép đóng ảnh, đầu tiên đối tƣợng này sẽ đƣợc mở rộng bằng phép giãn nhị phân
theo phần tử cấu trúc B. Lúc này những khu vực thiếu hụt sẽ đƣợc bù lên, và khu vực
đứt sẽ đƣợc nối lại (Hình 2.13b). Sau đó áp dụng phép co nhị phân để đƣa đối tƣợng
về trạng thái ban đầu (Hình 2.13c).

) a
) b ) c
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 28-

Hình 2.13: Quá trình thực hiện phép đóng ảnh.
Trên phƣơng diện ý nghĩa hình học tƣơng tự nhƣ phép mở ảnh, ngoại trừ việc
phần tử cấu trúc trong phép đóng ảnh này có cách thức thực hiện đối nghịch với phép
mở ảnh.
Cho một đối tƣợng trong ảnh tƣơng tự nhƣ đối tƣợng ở hình 2.12. Khi thực hiện
phép đóng ảnh thì hình tròn(phần tử cấu trúc) có xu hƣớng quét bên ngoài đƣờng biên
của đối tƣơng(Hình 2.14).

) a
) b ) c


A B ©
A
1
B

) a
) b
) c
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 29-
Hình 2.14: Minh họa phép đóng ảnh trên phương diện ý nghĩa hình học.
Quan sát trên hình vẽ ta có thể thấy các góc hƣớng vào của đối tƣợng đƣợc làm
trơn, các góc hƣớng ra thì không có tác động gì. Độ lõm do phần tử cấu trúc tạo ra ở
bên trái đối tƣợng nhỏ hơn bên phải, vì thế kích thƣớc phần tử cấu trúc cũng rất quan
trọng trong độ trơn của góc.
Một điểm w đƣợc coi là một phần tử của ( A B - ) khi và chỉ khi
z
B A · = C, với
mọi w
z
B e khi
z
B tịnh tiến.
Nhƣ trong quan hệ giữa phép giãn nhị phân và phép co nhị phân. Phần bù của
phép đóng giữa hai tập hợp là phép mở giữa phép bù và phép phản xạ của hai tập hợp;
tức là:
(A • B)
c
= (A
c

̂
), (1.29)
2.6.3. Các tính chất của Phép mở ảnh và phép đóng ảnh
*Tính chất 1: Đối với phép mở ảnh
a) A B A _ ,
c) Nếu C D _ thì C B D B _ ,
d) ( ) A B B A B = ,

*Tính chất 2: Đối với phép đóng ảnh
a) A A B _ - ,
b) Nếu C D _ thì C B D B - _ - ,
c) ( ) A B B A B - - = - ,
d) A B - Khi và chỉ khi
z
B A · = C,

Các tính chất trên giải thích các kết quả nhận đƣợc khi phép toán mở và đóng ảnh
đƣợc sử dụng để xây dựng lọc phép toán hình thái. Thí dụ, xét cấu trúc lọc của phép
mở ảnh. Khi đó tính chất (1a) chỉ ra kết quả sẽ là tập hợp con của tập hợp ban đầu.
Tính chất (1b) nghĩa là tính đơn điệu đƣợc bảo toàn. Tính chất 1c cho thấy phép toán
mở ảnh chỉ đƣợc sử dụng không hơn 1 lần, những lần sau kết quả vẫn giữ nguyên.
Tƣơng tự đối với phép đóng ảnh.

Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 30-
2.7. Phép Biến đổi trúng hoặc trƣợt (Hit-or-Miss)
Phép biến đổi “trúng hoặc trƣợt” đƣợc đƣa ra bởi Serra và là một công cụ cơ bản
để ứng dụng vào phát hiện hình dạng của đối tƣợng.
Cho phần tử cấu trúc B với B=(B
1
,B
2
), trong đó B
1
là tập hợp đƣợc tạo từ các
phần tử của B đƣợc liên kết với đối tƣợng (B
1 _
A) , và B
2
là tập hợp đƣợc tạo từ các
phần tử của B với bục đích liên kết tới phần bù của đối tƣợng (B
2 _
c
A
). Hay nói cách
khác, nếu cho B
1
là phần tử cấu trúc đƣợc áp dụng lên đối tƣợng, thì B
2
sẽ là phần tử
cấu trúc đƣợc cấu tạo từ các phần tử nằm trên phần bù của phần tử cấu trúc B
1
. Với
điều kiện này, tùy thuộc vào cách chọn phần tử cấu trúc B
1
và B
2
mà chúng ta sẽ có
nhiều đối tƣợng mới khác nhau với các cặp phần tử cấu trúc tƣơng ứng. Chính vì vậy,
“trúng hoặc trƣợt” là phép biến đổi cơ sở để xây dựng các thuật toán nhƣ: Thuật toán
bao lồi, làm mảnh …
Với
A s* B là ký hiệu của “trúng hoặc trƣợt” giữa tập hợp A và phần tử cấu trúc
B. Khi đó trúng hoặc trƣợt đƣợc định nghĩa nhƣ sau:
A s*B=(A B
1
) ·( A
c
B
2
), (1.30)
Lƣu ý, phép co nhị phân của phần bù của A và tập hợp B
2
là một trƣờng hợp đặc
biệt của trúng hoặc trƣợt bởi vì phần tử cấu trúc lên tập hợp B
2
là rỗng.
Mặt khác ( A
c
B
2
) = ( A©
̂

)
c
nên công thức (1.30) có thể đƣợc viết lại nhƣ sau:
A s*B=(A B
1
) · ( A©
̂

)
c
, (1.31)
Suy ra: A s*B=(A B
1
) - ( A©
̂

), (1.32)


Hình 2.15: Minh họa phép biến đổi trúng hoặc trượt
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 31-
A là đối tƣợng trong ảnh (tập hợp các phần có nhãn là 1 và đƣợc bôi đậm); A
c

Bù của A trong ảnh; B
1
, B
2
Phần tử cấu trúc; A
1
: Kết quả của phép co nhị phân giữa
phần tử cấu trúc B
1
và A; A
2
: Kết quả của phép giãn nhị phân giữa phần tử cấu trúc B
2

với Phần bù của A.
2.8. Các thuật toán cơ bản của hình thái học
Ứng dụng chủ yếu của hình thái học đối với ảnh nhị phân là phân tích các thành
phần của ảnh, chính vì nó rất có hiệu quả trong biểu diễn và mô tả hình dạng đối tƣợng
cho nên phần này sẽ tập trung đƣa ra các thuật toán về hình thái để trích đƣờng biên,
các thành phần liên thông, đƣờng bao lồi, hay tìm xƣơng làm mảnh.
2.8.1. Trích biên ( Boundary Extraction )
Với ảnh đầu vào là ảnh xám, thì ta có thể xử lý phân đoạn ảnh bằng các ngƣỡng
của ảnh. Trong hình ảnh mỗi điểm ảnh có giá trị xám riêng, giá trị này đƣợc giới hạn
trong khoản 0 tới 255. Vì vậy ta có thể thông qua lƣợc đồ màu để lựa chọn các mức
xám thích hợp. Khi chuyển sang ảnh nhị phân các điểm ảnh có giá trị lơn hơn ngƣỡng
này đều đƣợc gán là 255 hoặc nếu không thì sẽ đƣợc gán là 0. ngƣợc lại những điểm
ảnh nào có giá trị nằm trong ngƣỡng đều đƣợc đặt là 1, những điểm ảnh này là điểm
ảnh cấu thành đối tƣợng trong ảnh nhị phân.
Trong ảnh nhị phân, đối tƣợng đƣợc cấu thành bởi các điểm ảnh liên thông có giá
trị là 1, Xét một thí dụ ở hình 2.16 có 9 điểm ảnh dọc, 9 điểm ảnh ngang. Những điểm
ảnh tạo lên biên là những điểm ảnh thuộc đối tƣợng đó nhƣng trong 8 điểm lân cận
phải có ít nhất một điểm ảnh có giá trị là 0.
Biên của tập hợp A phụ thuộc vào kích thƣớc của phần tử cấu trúc. Độ dày của
đƣờng viền bao quanh đối tƣợng phụ thuộc vào kích thƣớc của phần từ cấu trúc. Cho 1
thí dụ, nếu một phần tử cấu trúc có kích thƣớc 3x3 sinh ra độ dày đƣờng viền là 1 thì
với phần tử cấu trúc có kích thƣớc 5x5 sẽ sinh ra đƣờng viền của đối tƣợng có độ dày
là 3.
Khi đó, biên của tập hợp A, ký hiệu là A c , đƣợc xác định bởi công thức:
( A A A c = ÷ ) B , (1.33

Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 32-

Hình 2.16: Quá trình tìm biên của đối tượng trên ảnh nhị phân.

2.8.2. Làm đầy (Region Filling)
Làm đầy vùng của một đối tƣợng từ biên là bổ xung giá trị 1 vào toàn bộ vùng ở
phía bên trong biên của đối tƣợng. Cho một ảnh nhị phân A, các điểm ảnh ở biên của
đối tƣợng trong hình ảnh A có giá trị là 1 và các điểm ảnh khác có giá trị là 0. Ta bắt
đầu quá trình làm đầy bằng cách gán giá trị 1 vào điểm ảnh p ở bên trong biên của đối
tƣợng, sau đó lặp đi lặp lại phép giãn nhị phân giữa điểm ảnh với phần tử cấu trúc B
dƣới giới hạn đặt ra bởi phép bù của tập hợp A (A
c
). Bởi vì nếu hạn chế không đƣợc
đặt thì chƣơng trình sẽ lặp đi lặp lại phép gán này, dẫn tới sảy ra hiện tƣợng tràn qua
các cùng khác trên ảnh, thậm chí toàn bộ ảnh.
Với X
0
=p và B là phần tử cấu trúc, phép làm đầy vùng trong ảnh sẽ đƣợc xác
định bởi công thức:
X
k
=(X
k-1 ©
B)
c
A · , Với k=1,2,3,…k-1. (1.34)
Thuật toán sẽ dừng khi X
k
=X
k-1
.
Thí dụ, ở hình 2.17, A là ảnh ban đầu chỉ chứa biên của đối tƣợng ( giá trị là 1 ),
B là phần tử cấu trúc có kích thƣớc 3x3 và hình dạng chữ thập.
Khi đó thuật toán sẽ thực hiện lần lƣợt theo trình tự nhƣ sau:
Bƣớc 1: Thuật toán sẽ gán giá trị 1 cho một điểm ảnh p bên trong vùng biên.
Bƣớc 2: Áp dụng phép giãn nhị phân từ điểm ảnh p với phần tử cấu trúc B, đồng
thời lấy giao của kết quả phép giãn với phần bù của tập hợp A. Nhƣ vậy, sau khi lấy
giao của hai tập hợp thì phần nào có giá trị là 1 tƣơng xứng với giá trị 1 của phần bù
1
A A÷
B
A
1
A
A B
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 33-
tập hợp A thì đƣợc giữ nguyên, phần nào có giá trị 1 tƣơng xứng với giá trị 0 của phần
bù tập hợp A thì sẽ đƣợc gán là 0. Quá trình này sẽ đƣợc lặp đi lặp lại cho đến khi tất
cả các điểm ảnh tƣơng ứng bên trong biên của đối tƣợng đƣợc gán là 1.
Bƣớc 3: Cuối cùng lấy hợp giữa X
7
và biên A ta sẽ đƣợc đối tƣợng đã đƣợc làm
đầy từ biên vùng trong ảnh (Hình 2.17).

Hình 2.17: Quá trình làm đầy đối tượng trong ảnh.
2.8.3. Tách các thành phần liên thông (Extraction of Connected Components)
Trong thực tế, bài toán tách thành phần liên thông trong ảnh nhị phân đóng vai
trò quan trọng trong các ứng dụng phân tích ảnh tự động.Tƣơng tự nhƣ phép làm đầy
vùng. Quá trình thực hiện thuật toán cũng đƣợc lặp đi lặp lại với phép tách các thành
phần liên thông.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 34-
Cho một ảnh nhị phân trong đó đối tƣợng là tập hợp A bao gồm một số thành
phần liên thông. Những điểm ảnh nào thuộc đối tƣợng thì đƣợc đánh dấu là 1 và điểm
ảnh nào nằm ngoài đối tƣợng thì đƣợc đánh dấu là 0. Ta có thể tách các thành phần
liên thông bằng cách gán một điểm ảnh ở trong đối tƣợng rồi từ điểm ảnh đó, lặp đi lặp
lại phép giãn nhị phân với phần tử cấu trúc dƣới hạn chế đặt ra bởi tập hợp A.
Với X
0
=p và B là phần tử cấu trúc. Khi đó phép tách các thành phần liên thông
đƣợc xác định bởi công thức:
X
k
=
1
( ) ,
k
X B A
÷
© · k= 1,2,3… (1.35)

Hình 2.18: Quá trình tách các thành phần liên thông trong ảnh bằng phép toán hình
thái.
2.8.4. Bao Lồi (Convex Hull)
Ta có thể hình dung bao lồi của một đối tƣợng giống nhƣ một dải băng cao su
bao quanh đối tƣợng. Vì thế dải băng cao su này đƣợc căng qua các phần lõm theo các
viền lồi của đối tƣợng. Kết quả là tạo ra một hình dạng đối tƣợng không có đoạn nào
bị lõm. Bao lồi có thể đƣợc biến đổi bởi phép toán Hit-or-Miss với 4 phần tử cấu trúc
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 35-
luân phiên quay 90
0
. Cho A là một ảnh nhị phân và phần tử cấu trúc B
i
với i=1,2,3,4,
khi đó ta có 4 phần tử cấu trúc tƣơng ứng nhƣ sau:
(1.36)
Trong các phần tử cấu trúc trên những phần tử đƣợc đánh dấu là những phần
tử không cần quan tâm. Đầu tiên cho
0
i
X A = , sau đó lặp đi lặp lại thuật toán theo công
thức sau:
(
i
k
X X = s* B) A , i=1,2,3,4 và k=1,2,3…k-1 (1.37)
Khi
1
i i
k k
X X
÷
= tức là chúng đồng quy (converge) thì quá trình xử lý dừng lại và
đặt
i i
conv
D X = , Khi đó bao lồi của A sẽ là:

4
1
( )
i
i
C A D
=
= , (1.38)
Nói cách khác, thuật toán sẽ thực hiện phép biến đổi Hit-or-Miss giữa tập hợp A
với phần tử cấu trúc B
1
trên toàn bộ đối tƣợng cho đến khi đối tƣợng không có gì thay
đổi nữa thì dừng lại và đặt
i i
conv
D X = , sau đó hợp tập hợp A với kết quả
i
D , quá trình
này sẽ đƣợc thực hiện lần lƣợt với
2 3 4
, , B B B . Cuối cùng hợp của 4 tập
i
D cho ta bao
lồi của A.
Xét thí dụ trong một chu trình xử lý ảnh sử dụng phép bao lồi (Hình 2.19). Với
tập hợp A là tập hợp các phần tử tạo lên một đối tƣợng trong ảnh, A
c
là phần bù của
tập hợp A. B là phần tử cấu trúc gồm có B
1
, và B
2
.

Hình 2.19: Một quá trình trong phép bao lồi.

Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 36-
Thí dụ trên cho thấy một chu trình trong quá trình thực hiện phép bao lồi đối với
đối tƣợng trong ảnh. Quá trình này sẽ đƣợc lặp đi lặp lại lần lƣợt với các phần tử cấu
trúc khác nhau (1.37). Khi thuật toán kết thúc, tất cả các chỗ bị lõm hay thiếu hụt chi
tiết sẽ đƣợc làm đầy. Xét một thí dụ tổng quát từ thí dụ trong hình 2.19, với

, và

:


Hình 2.20: Phép bao lồi đối với đối tượng trong ảnh.

2.8.5. Làm mảnh(Thinning)
Thuật toán làm mảnh thƣờng bao gồm nhiều lần lặp, mỗi lần lặp tất cả các điểm
ảnh của đối tƣợng sẽ đƣợc kiểm tra, Các phần tử cấu trúc đƣợc thiết kế để tìm các
điểm biên mà khi loại bỏ điểm ảnh trên đối tƣợng thì sẽ không làm ảnh hƣởng tới các
liên thông. Nếu điểm ảnh nào mà thỏa mãn điều kiện của phần tử cấu trúc thì sẽ bị
loại bỏ. Quá trình này cứ lặp đi lặp lại cho tới khi không còn điểm biên nào đƣợc xóa
nữa.
Làm mảnh tập hợp A bởi phần tử cấu trúc B, ký kiệu ⊗, xác định bởi công
thức sau:

=

, (1.39)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 37-
Để có thể làm mảnh một đối tƣợng A một cách hiệu quả hơn, ta dựa vào dãy các
phần tử cấu trúc.
{} {

}, (1.40)
Trong đó

Nhận đƣợc từ

, qua phép quay quanh tâm điểm của nó. Với
khái niệm này ta định nghĩa phép làm mảnh bởi một dãy các phần tử cấu trúc theo
công thức.
⊗{} ⊗

, (1.41)
Nói cách khác, quá trình làm mảnh A bởi

, kết quả lại tiếp tục đƣợc đƣợc làm
mảnh bởi

cho đến

. Lúc này đối tƣợng trong ảnh hầu nhƣ không thay đổi nữa.
Xét thí dụ quá trình làm mảnh (Hình 2.21). Quá trình làm mảnh đối tƣợng sẽ
đƣợc lặp đi lặp lại cho đến khi đối tƣợng không có sự thay đổi nào thì dừng lại .

Theo công thức tổng quát ta có:
⊗{} ⊗

,
Nhƣ vậy, Trong thí dụ này quá trình làm mảnh đƣợc lặp đi lặp lại 2 lƣợt. Trong
mỗi lần lặp đối tƣợng phải trải qua quá trình làm mảnh với 8 phần tử cấu trúc:

.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 38-

Hình 2.21: Quá trình làm mảnh đối tượng trong hình ảnh.
2.8.6. Tìm khung xương (Skeletonization)
Tìm khung xƣơng cũng tƣơng tự nhƣ làm mảnh, nhƣng nó đƣợc dùng để tìm ra
các chi tiết cấu trúc của đối tƣợng. Khung xƣơng của đối tƣợng là tập hợp các điểm
ảnh cách đều biên của đối tƣợng. Và có thể biểu diễn bằng phép co nhị phân và phép
mở ảnh.
Xét A là một ảnh nhị phân bao gồm các điểm ảnh thuộc đối tƣợng, đƣợc đặt nhãn
là các số 1. Các điểm ảnh không thuộc đối tƣợng đƣợc đặt nhãn là các số 0. B là phần
tử cấu trúc 3x3. Khi đó, nếu ký hiệu S(A) là khung xƣơng của tập hợp A thì thuật toán
tìm khung xƣơng đƣợc xác định qua công thức:
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 39-

, (1.42)
Trong đó:


{ ⊖ [ ⊖ ]}

, (1.43)
(A ⊖ kB) là phép co k lần liên tiếp trên A. Tức là:
(A ⊖ kB )=((..( A ⊖ B ⊖ B .⊖ B
Và K là Bƣớc lặp cuối cùng trƣớc khi A bị ăn mòn thành tập rỗng. Nói cách
khác:
K = max{ k | (A ⊖ kB ) }
Công thức (1.42) và (1.43) khẳng định rằng khung xƣơng S(A) có thể nhận đƣợc
từ hợp các bộ khung xƣơng con S
k
(A). Có thể chứng minh rằng A có thể xây dựng lại
từ các tập con này bằng cách sử dụng công thức:
A = ⋃

, (1.44)
Trong đó

⊕ ký hiệu k lần giãn nhị phân S
k
(A), tức là:

⊕=((..( Sk(A) ⊕B ⊕ B .⊕ B.
Xét thí dụ:

Hình 2.22: Quá trình thực hiện thuật toán tìm xương.



Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 40-
CHƢƠNG III. ỨNG DỤNG CỦA PHÉP TOÁN HÌNH THÁI

Thuật ngữ hình thái học (Morphology) đƣợc sử dụng trong sinh học để đề cập
đến quá trình nghiên cứu dạng cấu trúc động thực vật. Tƣơng tự trong xử lý ảnh chúng
ta gọi là Phép toán hình thái (Mathematical Morphology). Chúng ta sử dụng phép toán
hình thái nhƣ một công cụ để tách các thành phần của ảnh cho phép biểu diễn và miêu
tả hình dạng đối tƣợng trong ảnh thông qua vùng, biên,... Ngoài ra chúng ta còn sử
dụng phép toán hình thái để tác động lên đối tƣợng nhƣ đóng ảnh(Closing), mở
ảnh(Opening),tìm xƣơng làm mảnh…
3.1. Sử dụng phép toán hình thái trong ƣớc lƣợng độ nghiêng văn
bản
Trong quá trình nhận dạng và xử lý ảnh văn bản cũng nhƣ trong hầu hết các phần
mềm sử dụng kỹ thuật nhận dạng ký tự (Optical Character Recognition) hay các hệ
thống phân tích văn bản (Document Analaysis System), chúng ta phải trải qua nhiều
công đoạn phức tạp và một trong những công đoạn đó là ƣớc lƣợng góc nghiêng của
toàn bộ văn bản. Chính điều này sẽ tạo điều kiện thuận lợi cho việc thực hiện các bƣớc
tiếp theo trong quá trình nhận dạng sau này. Nguyên nhân của việc tạo ra góc nghiêng
văn bản có thể do việc copy, in, fax hoặc scan ….Trong hầu hết các phƣơng pháp giải
quyết bài toán nhận dạng ký tự, việc văn bản bị nghiêng ảnh hƣởng rất nghiêm trọng
đến việc: tách khối, phân tích bố cục, thuật toán nhận dạng ký tự…, ngay cả khi góc
nghiêng của văn bản rất nhỏ vào khoảng 5
o
.
Đã có nhiều cách tiếp cận nhằm giải quyết vấn đề ở nhiều mức độ khác nhau nhƣ
các phƣơng pháp do Baird hoặc của Hinds và các đồng nghiệp đề nghị. Tuy nhiên,
chúng đều gặp những khó khăn nhất định (độ chính xác không tốt, góc nghiêng quá
lớn… ). Có hai tiêu chuẩn cơ bản để đánh giá độ chính xác của việc chỉnh nghiêng ảnh
văn bản. Tiêu chuẩn đầu tiên là giới hạn góc ƣớc lƣợng ví dụ góc ƣớc lƣợng của văn
bản giới hạn trong khoảng [-10
o
, 10
o
]. Thứ hai là số lƣợng góc nghiêng trong toàn văn
bản nghĩa là văn bản có một hay nhiều góc nghiêng. Trong phạm vi của đề tài này, ta
chỉ quan tâm đến văn bản có một góc nghiêng. Đối với một vài phƣơng pháp xác định
góc nghiêng văn bản, phải có một số ràng buộc đối với ảnh văn bản đầu vào nhƣ cỡ
chữ, khoảng cách giữa các dòng, ngôn ngữ sử dụng trong văn bản, thậm chí bố cục
của văn bản cũng bị ràng buộc, ví dụ nhƣ một vài thuật toán đòi hỏi phải có đủ số
lƣợng thành phần liên thông là chữ hay phải có thật ít nhiễu.
Trong đề tài này, ta sử dụng thuật toán các phép biến đổi hình thái để ƣớc lƣợng
góc nghiêng văn bản. Thuật toán này đặc biệt thích hợp cho các văn bản có dấu nhƣ
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 41-
tiếng Việt, tiếng Pháp, …Đối với loại văn bản này, việc xuất hiện của các dấu, phần
phụ trên, phần phụ dƣới của chữ cũng nhƣ nhiễu đã làm cho các dòng lân cận nhau có
xu hƣớng dính lại với nhau (hình 3.1). Chính điều này đã làm cho các phƣơng pháp
xác định góc nghiêng văn bản trƣớc đây bị thất bại. Bằng cách sử dụng các phép biến
đổi hình thái, dấu nhiễu sẽ bị tách khỏi ảnh văn bản. Nó giúp cho việc xác định các
dòng văn bản dễ dàng hơn. Quá trình loại bỏ nhiễu và dấu nhờ vào các phép biến đổi
hình thái có thể làm mất một số thông tin của văn bản. Tuy nhiên, sự mất mát đó
không quan trọng, vì góc nghiêng của văn bản đƣợc đặc trƣng bởi các dòng văn bản
ngay cả sau khi đã loại bỏ phần phụ trên và phụ dƣới.

Hình 3.1: Các dòng văn bản có xu hướng dính lại với nhau do ảnh hưởng của dấu

Các dòng văn bản sẽ đƣợc hình dạng hóa bằng các phép biến đổi nhƣ đóng, mở.
Việc sử dụng các phép biến đổi hình thái sẽ rất thuận lợi vì nhiễu sẽ đƣợc loại bỏ. Điều
này rất thích hợp trong các văn bản có dấu nhƣ tiếng việt, tiếng pháp,…Trong phƣơng
pháp của Chen, các phép đóng, mở với các phần tử cấu trúc khác nhau đƣợc sử dụng.
Sau khi thực hiện các phép biến đổi này, các dòng văn bản sẽ biến thành các vệt thon
dài rồi áp dụng một phƣơng pháp khác để xác định hƣớng của các dòng văn bản.
Trong quá trình áp dụng, có thể xuất hiện một số hƣớng sai lệch chúng đƣợc tạo ra bởi
nhiễu và các thành phần liên thong không phải là text. Một thuật toán khác là “good
lines selection” sẽ đƣợc sử dụng. Trong thuật toán này, các dòng có hƣớng gần giống
với hƣớng cơ bản của toàn văn bản sẽ đƣợc chọn ra. Cuối cùng, góc nghiêng của toàn
văn bản sẽ đƣợc ƣớc lƣợng từ các hƣớng đã chọn ra này. Tuy nhiên, phƣơng pháp này
chỉ áp dụng đƣợc cho các văn bản có độ nghiêng là ±5
o
và độ chính xác là 0.5
o
(đã
đƣợc kiểm tra trên bộ thƣ viện ảnh UW English Document Image Database).
Das và Chanda cũng dùng các phép đóng, mở trên các dòng văn bản với hai
thành phần cấu trúc dạng đƣờng thẳng và dạng hình vuông nhỏ. Ảnh văn bản đã đƣợc
thực hiện phép mở sẽ đƣợc quét theo chiều dọc để ghi nhận các pixel có sự chuyển đổi
từ 1 sang 0, đó cũng chính là base line của dòng văn bản. Các dòng có chiều dài lớn
hơn một ngƣỡng cho trƣớc sẽ đƣợc chọn ra và góc của toàn bộ văn bản là trung vị của
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 42-
góc các dòng văn bản này. Giới hạn của phƣơng pháp này là nó chỉ thực hiện tốt đối
với các ảnh văn bản có góc nghiêng dƣới 15
o
.
Najman lại hiện thực các phép toán hình thái theo một cách khác. Ý tƣởng chính
là tìm ra góc quay tối ƣu nhất của các phần tử cấu trúc bằng cách cực đại hóa diện tích
của các vệt thẳng tạo ra từ các phép toán hình thái. Trong hƣớng tiếp cận này, thuật
toán Run-Length Smoothing closing (RLSA) cũng đƣợc sử dụng để tối ƣu hóa góc
quay của phần tử cấu trúc. Góc quay này cũng chính là góc nghiêng của toàn bộ văn
bản. Nhƣợc điểm lớn nhất của cả ba phƣơng pháp vừa trình bày ở trên là chúng phụ
thuộc vào kích cỡ chữ, khoảng cách giữa các dòng, khoảng cách giữa các kí tự lân cận
trong văn bản, …Do đó các thuật toán này rất phụ thuộc vào các tham số thực nghiệm
và không thể xác định các tham số này một cách tự động.
3.1.1. Mô tả phương pháp
Trƣớc hết là quá trình tiền xử lý, đây là quá trình dùng để lọc nhiễu, tách dấu và
những thành phần liên thông lớn. Trong quá trình này các tham số nhƣ chiều cao và
chiều rộng đặc trƣng của chữ sẽ đƣợc tự động xác định dựa trên văn bản đầu vào. Sau
đó, thuật toán ƣớc lƣợng thô sẽ xác định đƣợc khoảng mà góc nghiêng của văn bản rơi
vào. Cuối cùng, với những tham số tìm thấy ở bƣớc đầu tiên, ta sẽ thực hiện các phép
đóng và mở cho các dòng văn bản để tạo thành các vệt tạo thuận lợi cho bƣớc xác định
góc nghiêng tiếp theo. Sau đó một thuật toán đơn giản sẽ đƣợc dùng để xác định góc
của mỗi dòng văn bản và góc nghiêng của toàn bộ văn bản cũng sẽ đƣợc tìm thấy dựa
trên góc nghiêng của các dòng văn bản. Trong phạm vi đề tài ta chỉ quan tâm đến bƣớc
sử dụng phép toán hình thái.
3.1.2. Áp dụng phép toán hình thái
Trong bƣớc này, chúng ta sẽ thực hiện các phép đóng và mở cho các dòng văn
bản. Phép đóng dùng để nối các kí tự trong một từ, và các từ trong một dòng, phép mở
để loại bỏ các thành phần liên thông rất nhỏ, cũng nhƣ các phần phụ trên hay phần phụ
dƣới của ký tự. Do đó các dòng văn bản sẽ trở thành các vệt thon dài.
Tuy nhiên, để thực hiện các phép đóng, mở một cách hiệu quả nhất ta cần xác
định kích cỡ và hình dạng của các phần tử cấu trúc thật chính xác. Trong thuật toán
này, ta sử dụng một cách tính toán đơn giản đƣợc mô tả nhƣ sau: Trung điểm của
khoảng mà góc nghiêng văn bản thuộc về tìm đƣợc trong bƣớc ƣớc lƣợng thô chính là
góc quay của phần tử cấu trúc. Nếu khoảng mà góc nghiêng văn bản rơi vào [30
o
, 50
o
],
thì góc quay của phần tử cấu trúc sẽ là 40
o
. Ta chia góc quay của văn bản thành 9 phần
và mỗi phần tƣơng ứng với 20
o
là vì mỗi góc quay α của phần tử cấu trúc có thể phù
hợp cho tất cả các văn bản có góc nghiêng trong khoảng [α – 10
o
, α + 10
o
], nghĩa là
khoảng chênh lệch là 20
o
. Qua thực nghiệm bằng cách quan sát và thử nghiệm trên
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 43-
một số lƣợng lớn các ảnh văn bản, cho thấy việc xác định góc quay cho các phần tử
cấu trúc là rất quan trọng. Nó giúp cho kết quả của các phép đóng mở là đúng đắn
nhất. Với một phần tử cấu trúc phù hợp, thì chỉ các từ trong cùng dòng mới kết hợp lại
đƣợc với nhau trong khi đó từ trong các dòng khác nhau sẽ vẫn rời nhau .

Hình 3.2: Những khoảng góc nghiêng khác nhau được sử dụng để ước lượng góc
nghiêng phù hợp cho phần tử cấu trúc.
Gọi I là ảnh thu đƣợc sau khi khử nhiễu, dấu và những thành phần liên thông lớn.
Ảnh I
co
đƣợc tạo ra nhƣ sau:

( ) ( ) ( )
o o o n c m co
E E I I © © - = 
, (1.45)
Trong đó những phần tử cấu trúc 1×3 và 2×2 đƣợc chọn tƣơng ứng với E
c
và E
o
;
m và n đƣợc xác định bởi max{W / 2z, H / z} và max{W / 3z, H / 2z}; với z là độ thu
nhỏ thích hợp của ảnh, z đƣợc tính nhƣ sau:
z = min{W / 4, H / 5}
α đƣợc tính bằng thuật toán ƣớc lƣợng thô; và
( )
o c m
E ©

( )
o o n
E ©
là những
kết quả của phép quay những phần tử cấu trúc
( )
c m
E ©

( )
o n
E ©
bởi góc α (hình
3.3 là một minh họa của ảnh I
co
).
Một lần nữa, có thể thấy rõ ràng rằng kích thƣớc và góc nghiêng của phần tử cấu
trúc đƣợc xác định một cách tự động và chỉ dựa trên ảnh đƣa vào ban đầu. Với việc
tính toán tự động này, thuật toán này có thể áp dụng để giải quyết vấn đề ƣớc lƣợng
góc nghiêng của những văn bản có góc nghiêng tùy ý.

(a) (b) (c)
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 44-

(d) (e) (f)
Hình 3.3: Một vài ví dụ của việc sử dụng phép đóng và mở với những phần tử cấu
trúc nghiêng. Hình 3.3a và 3.3d là những ảnh đưa vào ban đầu. Hình 3.3b và 3.3e là
những kết quả của việc áp dụng bước tiền xử lý, ước lượng thô, và phép đóng tương
ứng với hình 3.3a và 3.3d. Hình 3.3c và 3.3f là những kết quả của việc áp dụng phép
mở tương ứng với hình 3.3b và 3.3e.
3.2. Ứng dụng phép toán hình thái trong tách dòng văn bản
Thuật toán xác định bố cục văn bản thực chất là tìm cách chia ảnh văn bản ra
thành nhiều khối mà mỗi khối sẽ đặc trƣng cho một vùng văn bản. Sau đó mỗi khối
này sẽ đƣợc chia thành nhiều dòng, rồi mỗi dòng có thể đƣợc chia thành một hoặc
nhiều từ, tƣơng tự mỗi từ sẽ đƣợc chia thành nhiều ký tự.
Đã có rất nhiều phƣơng pháp đƣa ra để tách dòng văn bản, phƣơng pháp tách
dòng rất đơn giản dựa trên các phép toán hình thái và phép chiếu lấy lƣợc đồ. Phƣơng
pháp gồm 3 bƣớc căn bản sau:
Bƣớc 1: Dùng các phép toán hình thái để tô lem dòng văn bản.
Bƣớc 2: Lấy lƣợc đồ chiếu đối với mỗi khối văn bản theo trục Oy.
Bƣớc 3: Xác định dòng văn bản trong mỗi khối.
Trong ba bƣớc trên ta chỉ quan tâm tới bƣớc 1, đó là khâu tô lem dòng văn bản.
3.2.1. Sử dụng phép toán hình thái để tô lem dòng văn bản
Việc xác định dòng văn bản trong thuật toán đƣợc đƣa ra ở đây chủ yếu dựa vào
các pixel đen và mật độ phân bố của chúng. Trong bƣớc đầu tiên này, ta sẽ tiến hành tô
các dòng văn bản thành các vệt lem thon dài, mục đích là làm tăng số lƣợng pixel đen
có trong một dòng văn bản. Một điều lƣu ý rằng, việc tô lem các dòng văn bản chỉ
nhằm mục đích xác định các vết cắt của dòng văn bản chứ không làm ảnh hƣởng tới
ảnh văn bản ban đầu. Chính việc làm này sẽ làm tăng độ chính xác của thuật toán xác
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 45-
định dòng văn bản nhất là đối với các dòng văn bản cuối cùng trong khối chỉ có một,
hai hoặc rất ít từ.
Cách thức tô lem dòng văn bản trong giai đoạn này đƣợc thực hiện khá giống
với cách thức tô lem dòng văn bản trong giai đoạn xác định góc nghiêng văn bản. Tuy
nhiên, có một sự khác biệt duy nhất đó là việc tô lem này đƣợc thực hiện trên văn bản
đã đƣợc chỉnh nghiêng.

Hình 3.5: Hai dòng văn bản đã được tô lem.
Sau khi thực hiện bƣớc này, văn bản sẽ đƣợc đặt trƣng bởi các vệt đen thon dài,
nhờ đó việc xác định dòng văn bản sẽ đƣợc thực hiện dễ dàng hơn.
Khi tiến hành tô lem văn bản dựa trên các phép toán hình thái, nhiễu đã bị loại
bỏ. Cũng trong quá trình tô lem, dấu, các acender, descender đã bị loại bỏ nên để đảm
bảo độ chính xác của việc tách dòng và không làm mất dấu trong văn bản tiếng việt, ta
tiến hành mở rộng biên cho dòng một khoảng T.

(a)

(b)
Hình 3.6: (a) Một dòng cắt nhưng không mở rộng biên, (b) Dòng cắt đã được mở
rộng biên.

Trên đây là một đoạn văn bản đã đƣợc tách dòng. Kết quả quá trình tách dòng
là danh sách các dòng, đây chính là đầu vào cho việc tách từ và tách ký tự tiếp theo
trong quá trình xây dựng và phân tích bố cục văn bản.
-Ngoài ra còn rất nhiều các ứng dụng như phát hiện đối tượng chuyển động,
phát hiện hình dạng đối tượng thông qua xương đối tượng trong ảnh…



Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 46-
CHƢƠNG IV. CÀI ĐẶT CHƢƠNG TRÌNH

4.1. Giới thiệu chƣơng trình
Chƣơng trình đƣợc xây dựng trên nền C#, để minh họa các phép toán hình thái
gồm có, phép co nhị phân (Erosion), phép giãn nhị phân (Dilation), phép đóng ảnh
(Closing), phép mở ảnh (Opening), tìm biên (Edge direction), và tìm xƣơng
(Skeleton).
Giao diện chƣơng trình nhƣ sau:

Chƣơng trình gồm có 8 phần và đƣợc đánh số thứ tự tƣơng ứng nhƣ hình minh
họa trên. Trong đó:
- Số 1,2,3,4 chỉ ra các thành phần điều khiển để thực hiện quá trình tác động lên
ảnh gốc.
- Số 6,7 chỉ ra thành phần dùng để hiển thị hình ảnh gốc và hình ảnh kết quả
sau khi xử lý, phần 5 thanh trạng thái xử lý (startus bar).
- Cuối cùng số 8 là nút thoát ứng dụng.



Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 47-
4.2. Hƣớng dẫn sử dụng
Số 1:
Open: Nạp ảnh cần xử lý vào picture box
(Số 6).
Save: Lƣu ảnh đã xử lý ra định dạng
Image file.

Số 2:
Ở nhóm Operation: Lựa chọn các phép
toán để tác động lên ảnh gốc. Phép giãn nhị
phân (Dilation), phép co nhị phân (Erosion),
Phép mở ảnh (Opening), Phép đóng ảnh
(Closing).
Nhóm “Kernel Shape”: Lựa chọn các
dạng của phần tử cấu trúc, tác động lên đối tƣợng trong ảnh. Dạng hình vuông
(Square), dạng hình tròn (Circle), và dạng hình dấu cộng (Cross).
Số 3:
“Kernel Side”: Dùng để lựa chọn kích
thƣớc của phần tử cấu trúc.
Morphology: Thực hiện phép toán hình
thái tác động lên ảnh khi đã chọn phép toán và
dạng cỡ phần tử cấu trúc tƣơng xứng.

Số4:
Edge direction: Phát hiện biên của đối
tƣợng trong ảnh.
Skeleton: Bắt đầu quá trình làm mảnh đối
tƣợng trong ảnh.
Số 5:
Status bar: Thanh trạng thái biểu thị tiến
độ xử lý ảnh của chƣơng trình. Cho một thí dụ,
nếu sử dụng phép co nhị phân hay giãn nhị phân, thì tiến độ này sẽ chạy một lần, bởi
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 48-
vì để thực hiện phép co nhị phân và phép giãn thì ta chỉ thực hiện thuật toán một lần.
Nếu sử dụng với phép đóng ảnh và phép mở ảnh thì sẽ chạy hai lần, vì để thực hiện
một trong hai phép toán này ta phải thực hiện hai lần thuật toán co và giãn nhị phân.
Đối với các phép toán khác thì chức năng biểu thị trạng thái của nó cũng tƣơng tự.
4.3. Thực Nghiệm
Chƣơng trình đƣợc cài đặt thuật toán để xử lý ảnh nhị phân bằng các phép toán
phép giãn nhị phân, phép co nhị phân, phép đóng ảnh, và phép mở ảnh với các phần tử
cấu trúc dạng hình vuông, hình tròn, hình chữ thập, có kích thƣớc khác nhau (3x3,
4x4, 5x5, 6x6, 7x7).
Quan sát hình 4.1 ta thấy: Từ một ảnh nhị phân đã xuống cấp, sau khi sử dụng
phép giãn nhị phân với phần tử cấu trúc dạng tròn, kích thƣớc 4x4, ta đƣợc ảnh mới,
các nét đứt đã đƣợc nối liền lại và rõ ràng hơn. Tƣơng tự nhƣ vậy, đối với các phần tử
cấu trúc dạng vuông, dạng chữ thập. đều sẽ cho ta kết quả mới là các đối tƣợng đã
đƣợc cải thiện rõ rệt , với phần tử cấu trúc có kích thƣớc càng lớn thì đối tƣợng càng
giãn.

Hình 4.1: Thực nghiệm giãn nhị phân hình ảnh với cấu trúc 4x4.


Thí dụ nhƣ vẫn trƣờng hợp trên, ta xét thuật toán giãn nhị phân trên ảnh với phần
tử cấu trúc 7x7 ta sẽ có ảnh với các đối tƣợng trong ảnh có bề dày lớn hơn:
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 49-

Hình 4.2: Thực hiện giãn nhị phân hình ảnh với phần tử cấu trúc 7x7.
Cũng hình ảnh nhị phân nhƣ trên ta sử dụng phép co nhị phân hình ảnh với phần
tử cấu trúc 4x4. Bởi vì với phép toán này đối tƣợng có xu hƣớng co vào nên ta có thể
sử dụng để lọc các điểm ảnh nhỏ thừa trong ảnh nhị phân. Vì vậy tùy theo yêu cầu mà
ta tùy chọn kích thƣớc phần tử cấu trúc tƣơng ứng để lọc các chi tiết quan trọng trên
ảnh.
Quan sát ở hình 4.3 ta có thể thấy, với phần tử cấu trúc 4x4, khi ta cài đặt thuật
toán và tác động lên ảnh thì tập hợp những điểm ảnh có kích thƣớc lớn sẽ không bị
loại bỏ bởi phần tử cấu trúc, trong khi các tập hợp điểm ảnh nhỏ hoặc điểm ảnh riêng
rẽ sẽ bị loại bỏ. Nhƣ trên phần lý thuyết ở chƣơng 2 đã giới thiệu, trong một số trƣờng
hợp ta có thể kết hợp phép co nhị phân và phép giãn nhị phân để lọc các điểm ảnh
không dƣ thừa trong ảnh. Tất nhiên chỉ đạt yêu cầu đối với ảnh nhị phân.


Hình 4.3: Thực nghiệm phép co nhị phân trên hình ảnh với phần tử cấu trúc 4x4.
Xét ảnh nhị phân, đối tƣợng là một hình vuông khoét (Hình 4.4), khi ta sử dụng
thuật toán mở ảnh với phần tử cấu trúc dạng hình tròn, kích thƣớc 7x7 thì ta có ảnh
mới với các góc hƣớng ra ngoài bị làm trơn, còn các góc hƣớng vào trong thì vẫn giữ
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 50-
nguyên. Với đặc trƣng này ta có thể áp dụng để làm trơn các ngạnh hƣớng ra ngoài của
đối tƣợng đầu ra, trong hình 4.2. Cũng tƣơng tự nhƣ phép co nhị phân, phép giãn nhị
phân, kích thƣớc của phần tử cấu trúc càng lớn thì độ trơn góc cạnh hƣớng ra ngoài
càng cao.

Hình 4.4: Thực nghiệm phép mở ảnh trên hình ảnh với phần tử cấu trúc tròn 7x7.

Trong hình vẽ 4.5 ta thấy, các nghạnh hƣớng ra ngoài của đối tƣợng trong ảnh
nhị phân (nét chữ) đã đƣợc làm trơn. Thuật toán rất hiệu quả trong khôi phục văn bản
tài liệu đã xuống cấp.


Hình 4.5: Thực nghiệm mở ảnh làm trơn góc của đối tượng trong ảnh nhị phân.

Tùy thuộc vào phần tử cấu trúc mà ta đƣợc đối tƣợng mới có thuộc tính khác
nhau. Thí dụ, với phần tử cấu trúc dạng hình vuông thì cấu tạo đối tƣợng trong ảnh
không thay, còn đối với phần tử cấu trúc hình chữ thập thì sẽ tạo ra ở góc cạnh của đối
tƣợng mới một góc vuông hƣớng vào (Hình 4.6).
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 51-

Hình 4.6: Thực nghiệm phép mở ảnh với phần tử cấu trúc hình chữ thập, kích
thước 7x7.

Ngƣợc lại với phép mở ảnh, phép đóng ảnh với phần tử cấu trúc tròn lại làm trơn
các góc hƣớng vào trong đối tƣợng (Hình 4.7), và độ trơn của đối tƣợng trong ảnh
cũng phụ thuộc vào kích thƣớc của phần tử cấu trúc.

Hình 4.7: Thực nghiệm phép đóng ảnh trên phần tử cấu trúc tròn 7x7.









Đối với phần tử cấu trúc hình dạng chữ thập, và kích thƣớc 7x7, các góc hƣớng
vào sẽ đƣợc phần tử cấu trúc tạo lên một góc vuông hƣớng ra ngoài (Hình 4.8).
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 52-

Hình 4.8: Thực nghiệm phép đóng ảnh với phần tử cấu trúc hình dạng chữ thập,
kích thước 7x7.

Tiếp theo, ta xét một hình ảnh nhị phân đối tƣợng là chữ A màu trắng (Hình 4.9),
ta áp dụng thuật toán tìm xƣơng trên hình ảnh này. Kết quả thu đƣợc là tập hợp các
điểm màu đỏ phía bên trong A.


Hình 4.9: Thực nghiệm tìm xương đối tượng trên ảnh nhị phân.

Cuối cùng là thuật toán phát hiện biên đối tƣợng. Đầu tiên thuật toán sẽ thực hiện
co nhị phân giữa đối tƣợng và phần tử cấu trúc, sau đó lấy đối tƣợng ban đầu trừ đi kết
quả co nhị phân, ta sẽ đƣợc biên của đối tƣợng, độ dày của biên tùy thuộc vào phần tử
cấu trúc.

Hình 4.10: Thực nghiệm tìm biên của đối tượng.
Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 53-
Kết luận
Phép toán hình thái là một mảng vô cùng quan trọng trong xử lý ảnh số, các đề
tài về phép biến đổi này cũng đang đƣợc nhiều ngƣời quan tâm, bởi vì qua các thuật
toán và phép toán cơ sở đó ta có thể mở rộng và phát triển những bài toán khác có liên
quan đến lĩnh vực quan sát thăm dò, trí tuệ nhân tạo…, chẳng hạn nhƣ ứng dụng với
camera theo dõi qua các thuật toán nhận biết đối tƣợng chuyển động, hoặc ghép đối
tƣợng trong hai hình ảnh thông qua các đặc điểm hoặc điểm tƣơng đồng…
Các kết quả đã đạt đƣợc:
- Trình bày tổng quan về xử lý ảnh, lịch sử phát triển và phƣơng thức hoạt động.
- Trình bày hệ thống các khái niệm cơ bản của phép toán hình thái dƣới góc độ
xử lý ảnh; các khái niệm, các tính chất và ứng dụng cơ bản trong xử lý và biểu diễn
hình dạng đối tƣợng. Đồng thời qua đó giải thích và minh họa cụ thể và đƣa ra mối
liên hệ giữa các phép toán đó với nhau.
- Thực nghiệm các phép toán, thuật toán qua chƣơng trình xử lý.
Qua phân tích trên ta có thể rút ra kết luận:
Các phép toán giãn nhị phân (Dilation), co nhị phân (Erosion), Phép mở ảnh
(Opening), phép đóng ảnh (Closing), là các phép toán cơ sở trong phép toán hình thái,
các thuật toán trích biên (Boundary), làm đầy (Region filling), tách thành phần liên
thông (Extraction of connected compoments), bao lồi (Convex Hull), làm mảnh
(Thinning), tìm xƣơng (Skeleton), đều đƣợc xây dựng từ các phép toán hình thái cơ
bản. Các phép toán đó là điều kiện, cũng nhƣ tiền đề để tìm hiểu nghiên cứu các thuật
toán khác có tính ứng dụng cao trong xử lý ảnh nói riêng và trong thực tế đời sống nói
chung.
Phép toán hình thái là một đề tài rất rộng, cần rất nhiều thời gian mới có thể tìm
hiểu và nghiên cứu về nó. Trong thời gian tới nếu có điều kiện em sẽ tiếp tục tìm hiểu
các thuật toán lọc nhiễu, tăng cƣờng ảnh, và phân đoạn ảnh… thông qua các phép toán
hình thái.






Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 54-
Tài liệu tham khảo:
Tiếng Việt
[1]. TS. Đỗ Năng Toàn, TS. Phạm Việt Bình (2007) - Giáo Trình Môn Học Xử Lý
Ảnh, trƣờng ĐH thái nguyên, khoa CNTT, tr. 26 ~ 27, tr. 44 ~ 49.
[2]. PGS. Nguyễn Quang Hoan (2006)- Giáo Trình Xử Lý Ảnh, học viện công
nghệ bƣu chính viễn thông, tr. 4
[3]. Lương Mạnh Bá, Nguyễn Thanh Thủy (2003)- Nhập Môn Xử Lý Ảnh Số,
Nhà xuất bản Khoa học và Kỹ thuật, tr. 7 ~ 10.
[4]. Phạm Việt Bình (2006) – Phát triển kỹ thuật dò biên, phát hiện biên và ứng
dụng, luận án tiến sĩ khoa học, tr. 5, tr. 13~17


Tiếng Anh
[1]. Chen, S.( 1995): Document Layout Analysis Using Recursive Morphological
Transforms, PhD thesis, Univ. of Washington,.
[2]. Das, A., Chanda, B. (2001): A Fast Algorithm for Skew Detection of
Document Images Using Morphology. Int. J. Document Analysis and Recognition 4,
tr. 109~114.
[3]. Frank Y. Shih(2009) -Image Processing and Mathematical Morphology
Fundamentals and Applications, tr. 11~ 24,tr 37~52.
[4]. Hinds, S.C., Fisher, J.L., D’Amato, D.P. USA (1990): A Document Skew
Detection Method Using Run-Length Encoding and the Hough Transform. In: Proc.
10th Int. Conf. on Pattern Recognition, Atlantic City PA, tr. 464~468.
[5]. Najman, L. USA (2004): Using Mathematical Morphology for Document
Skew Estimation. In: Proc. of SPIE Conf. on Document Recognition and Retrieval XI,
San Jose, California, tr. 182~191.
[6]. J.B.T.M Roerdink- Computer vision And Mathematical Morphology.
[7]. Rafael C. Gonzalez & Richard E. Woods (1992)- Digital Image Processing
Second Edition, tr. 20 ~ 26, tr. 530 ~ 560.


Tìm hiểu các phép toán hình thái và ứng dụng

- Trang 55-
Website
[1]. http://homepages.inf.ed.ac.uk/rbf/HIPR2/skeleton.htm
[2].http://en.wikipedia.org/wiki/Morphological_image_processing#Properties_of
_the_basic _operators
[3]. http://www.funmorph.com/
[4]. http://www.ph.tn.tudelft.nl/Courses/FIP/noframes/fip-Morpholo.html