Professional Documents
Culture Documents
Chapter 6. Image Segmentation
Chapter 6. Image Segmentation
Hà Nội, 2021 1
Machine Translated by Google
3. Ngưỡng
2
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Gọi R là toàn bộ vùng không gian chứa ảnh. Chúng tôi có thể xem
phân đoạn hình ảnh là một quá trình phân vùng R thành n tiểu vùng, R1 , R2 , …, Rn , sao cho:
trong đó Q(Rk ) là vị từ logic được xác định trên các điểm trong tập Rk và là null
bộ.
3
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Hai miền Ri và Rj được gọi là liền kề nếu hợp của chúng tạo thành một liên thông
bộ.
Các miền được gọi là rời nhau nếu tập hợp được hình thành bởi sự hợp của hai miền là
không kết nối.
Vấn đề cơ bản trong phân đoạn là phân chia hình ảnh thành các vùng thỏa mãn các điều
kiện trước đó.
Các thuật toán phân đoạn ảnh đơn sắc nhìn chung dựa trên một trong hai loại cơ bản
liên quan đến tính chất của các giá trị cường độ: tính gián đoạn
và sự tương đồng.
(a) Hình ảnh của vùng cường độ không đổi. (b) Ranh giới dựa trên sự không liên tục về cường độ. (c) Kết
quả của phân đoạn. (d) Hình ảnh của vùng kết cấu. (e) Kết quả tính toán cường độ không liên tục (lưu
ý số lượng lớn các cạnh nhỏ). (f) Kết quả phân đoạn dựa trên đặc tính vùng.
5
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
6
Machine Translated by Google
3. Ngưỡng
7
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Điểm ảnh cạnh: cường độ hình ảnh thay đổi đột ngột
Các cạnh (hoặc các đoạn cạnh): tập hợp các pixel cạnh được kết nối
Bộ dò biên: các công cụ xử lý ảnh cục bộ được thiết kế để phát hiện các điểm ảnh biên
số 8
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Một dòng:
cường độ của nền ở hai bên đường thẳng cao hơn hoặc thấp hơn nhiều so với
cường độ của các pixel đường thẳng.
“mép mái”
Điểm biệt lập: điểm ảnh nền trước (nền) được bao quanh bởi nền
(tiền cảnh) pixel.
9
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
xấp xỉ đạo hàm cấp một tại một điểm x tùy ý của hàm một chiều f(x)
10
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
xấp xỉ đạo hàm cấp một tại một điểm x tùy ý của hàm một chiều f(x)
11
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
12
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
Đạo hàm bậc hai dựa trên sai phân trung tâm
13
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
14
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
15
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
16
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Bối cảnh
Tiếng Laplacian
18
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Ví dụ
(a) Hạt nhân Laplacian được sử dụng để phát hiện điểm. (b) Ảnh X-quang của cánh tuabin có độ xốp được biểu hiện bằng
một điểm ảnh màu đen. (c) Kết quả của việc kết hợp hạt nhân với hình ảnh. ( d ) Kết quả của việc sử dụng phương
trình. (10-15) là một điểm duy nhất (được phóng to ở đầu mũi tên).
19
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
(a) Ảnh gốc. (b) Hình ảnh Laplacian; phần được phóng to cho thấy đặc tính hiệu ứng đường đôi dương/âm của
Laplacian. (c) Giá trị tuyệt đối của Laplacian. (d) Giá trị dương của Laplacian.
20
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Hạt nhân phát hiện dòng. Các góc phát hiện tương ứng với hệ trục trong hình trên, với các
góc dương được đo ngược chiều kim đồng hồ so với trục x (dọc).
21
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
22
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Mô hình cạnh
23
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Mô hình cạnh
nét từ tối đến sáng, trong các khu vực được bao
quanh bởi các vòng tròn nhỏ. Cấu hình đoạn đường
24
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Mô hình biên
25
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
VÍ DỤ: Hành vi của đạo hàm bậc nhất và đạo hàm bậc hai trong vùng nhiễu
bờ rìa.
26
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
VÍ DỤ: Hành vi của đạo hàm bậc nhất và đạo hàm bậc hai trong vùng nhiễu
bờ rìa.
27
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Ba bước được thực hiện điển hình để phát hiện cạnh là:
28
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Kích cỡ:
29
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Sử dụng gradient để xác định cường độ cạnh và hướng tại một điểm. Lưu ý rằng hướng của cạnh
vuông góc với hướng của vectơ độ dốc tại điểm tính độ dốc. Mỗi ô vuông đại diện cho một
pixel.
30
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
31
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
32
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Hạt nhân la bàn Kirsch. Hướng cạnh của phản ứng mạnh nhất của mỗi hạt nhân được dán nhãn bên dưới nó.
33
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Đáp ứng giá trị tuyệt đối Sobel của hai thành phần gradient
34
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Hình ảnh gốc được làm mịn bằng hạt nhân trung bình 5x5 trước khi phát hiện cạnh.
36
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Phát hiện cạnh chéo. (a) Kết quả của việc sử dụng hạt nhân Kirsch trong Hình 10.15(c) . (b)
Kết quả sử dụng kernel ở Hình 10.15(d). Hình ảnh đầu vào trong cả hai trường hợp là
Hình 10.18(a).
37
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
(a) Kết quả của việc đặt ngưỡng Hình 10.16(d), độ dốc của ảnh gốc. (b)
Kết quả của việc đặt ngưỡng Hình 10.18(d), độ dốc của ảnh được làm mịn.
38
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Tỷ lệ lỗi thấp
39
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Hàm Gaussian:
tích chập f và G:
40
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
(a) Hai hướng có thể có của (b) Phạm vi giá trị (được tô (c) Phạm vi góc của các pháp
cạnh ngang (được tô bóng) bóng) của , góc hướng pháp tuyến tuyến cạnh cho bốn loại hướng cạnh
trong vùng lân cận 3x3. của cạnh đối với cạnh nằm ngang. trong vùng lân cận 3x3.
41
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Ngăn chặn không tối đa: tìm pixel có giá trị lớn nhất trong một
bờ rìa
r = αb + (1 α)a
Ngăn chặn không tối đa bằng phép nội suy Không nội suy
42
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Ngưỡng kép
43
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
44
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
Thuật toán phát hiện biên Canny gồm các bước sau:
Áp dụng triệt tiêu không cực đại cho ảnh cường độ gradient.
Sử dụng ngưỡng kép và phân tích kết nối để phát hiện và liên kết các cạnh.
45
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
46
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
47
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
48
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
50
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
51
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Ngưỡng đơn
Nhiều ngưỡng
52
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Biểu đồ cường độ có thể được phân chia (a) theo một ngưỡng duy nhất và (b) theo ngưỡng kép.
53
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Vai trò của nhiễu trong việc xác định ngưỡng ảnh
54
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Vai trò của độ sáng và độ phản xạ trong việc xác định ngưỡng ảnh
55
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Phân đoạn hình ảnh sử dụng T trong biểu thức. (1). Điều này sẽ tạo ra hai nhóm pixel: G1 , bao gồm
các pixel có giá trị cường độ > T và G2 , bao gồm các pixel có giá trị T.
Tính giá trị cường độ trung bình (trung bình) m1 và m2 cho các pixel trong G1 và G2
tương ứng.
Lặp lại các bước từ 2 đến 4 cho đến khi chênh lệch giữa các giá trị của T trong các lần lặp liên tiếp là
nhỏ hơn giá trị được xác định trước, T
56
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
(a) Dấu vân tay ồn ào. ( b ) Biểu đồ. (c) Kết quả được phân đoạn sử dụng ngưỡng
chung (đường viền hình ảnh mỏng được thêm vào để rõ ràng).
57
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
58
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
(a) Ảnh gốc. (b) Biểu đồ (các đỉnh cao được cắt
bớt để làm nổi bật các chi tiết ở giá trị thấp hơn).
(c) Kết quả phân đoạn bằng thuật toán tổng thể cơ bản.
(d)
59
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Sử dụng tính năng Làm mịn Hình ảnh để Cải thiện Ngưỡng Toàn cầu
60
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
Sử dụng tính năng Làm mịn Hình ảnh để Cải thiện Ngưỡng Toàn cầu
61
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
62
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
VÍ DỤ: Sử dụng thông tin biên dựa trên Laplacian để cải thiện toàn cầu
ngưỡng.
63
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
(a) Hình ảnh của một tảng băng trôi. ( b ) Biểu đồ. (c) Hình ảnh được phân chia thành
ba vùng sử dụng ngưỡng Otsu kép.
64
Rafael C. Gonzalez, Richard E. Woods, “Xử lý hình ảnh kỹ thuật số,” Pearson (2018).
Machine Translated by Google
3. Ngưỡng
65
https://viso.ai/deep-learning/image-segmentation-USE-deep-learning/. Truy cập ngày 20 tháng 10 năm 2021.
Machine Translated by Google
Phân đoạn ngữ nghĩa: phân loại các pixel trong ảnh thành các phân đoạn ngữ nghĩa
các lớp học
Phân đoạn trường hợp: phân loại pixel thành các danh mục trên cơ sở “các trường
hợp” hơn là các lớp
Phân đoạn toàn cảnh: sự kết hợp giữa phân đoạn theo ngữ nghĩa và phân đoạn thực thể
trong đó mỗi phiên bản của một đối tượng trong ảnh được tách biệt và dự đoán danh tính
của đối tượng
66
Giới thiệu nhẹ nhàng về Phân đoạn hình ảnh cho Machine Learning (v7labs.com)
Machine Translated by Google
67
Giới thiệu nhẹ nhàng về Phân đoạn hình ảnh cho Machine Learning (v7labs.com)
Machine Translated by Google
Các mô hình phân đoạn theo ngữ nghĩa cung cấp bản đồ phân đoạn dưới dạng đầu ra tương ứng với
đầu vào mà chúng được cung cấp.
68
Giới thiệu nhẹ nhàng về Phân đoạn hình ảnh cho Machine Learning (v7labs.com)
Machine Translated by Google
Giống như hầu hết các ứng dụng khác, việc sử dụng CNN để phân đoạn ngữ nghĩa là
sự lựa chọn hiển nhiên.
Khi sử dụng CNN để phân đoạn theo ngữ nghĩa, đầu ra cũng là một hình ảnh chứ không
phải là một vectơ có độ dài cố định.
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
69
Machine Translated by Google
Kiến trúc của mô hình bao gồm một số lớp tích chập, kích hoạt phi tuyến tính ,
chuẩn hóa hàng loạt và các lớp gộp
Các lớp đầu tiên học các khái niệm cấp thấp như cạnh và màu sắc
Các lớp cấp độ sau học các khái niệm cấp độ cao hơn như các đối tượng khác nhau
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
70
Machine Translated by Google
Tensor không gian được lấy mẫu xuống và chuyển thành vectơ
71
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
Machine Translated by Google
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
72
Machine Translated by Google
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
74
Machine Translated by Google
Mỗi pixel của đầu ra của mạng được so sánh với pixel tương ứng trong ảnh phân
đoạn thực tế mặt đất. Chúng tôi áp dụng tính năng mất entropy chéo tiêu chuẩn
trên từng pixel.
Trong phân loại nhị phân, trong đó số lớp M bằng 2, entropy chéo
có thể được tính như sau:
Nếu M>2 (tức là phân loại nhiều lớp), chúng tôi tính toán tổn
thất riêng cho từng nhãn lớp cho mỗi quan sát và tính tổng kết quả.
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
75
Machine Translated by Google
Thực hiện
Tập dữ liệu: Bước đầu tiên trong quá trình huấn luyện mô hình phân đoạn của chúng ta là chuẩn bị
tập dữ liệu.
Thực hiện
Xây dựng mô hình: xác định mô hình phân đoạn của chúng tôi với các kết nối bỏ qua
Lựa chọn mô hình cơ sở: chọn mạng cơ sở phù hợp ResNet, VGG-
16, MobileNet, CNN tùy chỉnh, …
Lựa chọn kiến trúc phân đoạn: FCN, SegNet, UNet, PSPNet, …
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
77
Machine Translated by Google
Thực hiện
Thực hiện
Thực hiện
Thực hiện
81
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
Machine Translated by Google
Thực hiện
Chọn kích thước đầu vào: Nếu trong ảnh có số lượng lớn đối tượng thì kích thước
đầu vào sẽ lớn hơn. Kích thước đầu vào tiêu chuẩn nằm trong khoảng từ 200x200
đến 600x600.
82
Hướng dẫn dành cho người mới bắt đầu về Phân đoạn ngữ nghĩa dựa trên Deep Learning bằng Keras | Divam Gupta
Machine Translated by Google
Thực hiện
83