You are on page 1of 5

neighborhoods operation

如同買房要先買鄰

線性conv
spectral 頻譜
conv mask

通俗的理解卷積運算 (convolution)

neighborhoods operation
1.鄰居的重要性
提供每個像素的上下文,就像是可以用身邊的人來定義你
相關的操作有
noise reduction : 去除噪音(如salt pepper)
edge enhancement: 銳化圖像
zooming : 拉近圖像
Linear convolution
Non-linear operators : median, max, min, …
一般來說有2種處理影像方式
卷積和spectral(頻譜分析)

2D conv
矩陣的乘法和線代的那個不同,是自己格乘自己格
用途是提取特徵+減少noise
O
至於非線性操作那裏,可能得看一下書
我的理解是
最大/小值濾波,以及中值濾波
可以參考
取9格的中間值93,把中間的格子78改成93就好了
而最大/小值同理,只是取max min

edge detection
參考
參考2
通常用和周遭有大幅度的變化當作邊界
這方面有滿多filter可用
如high pass filter
sobel operator

偵測橫向和垂直的邊緣,你可以看到filter是中間都0,兩側正負相反。此使用的是conv,這樣當兩側piexl相同時就會get 0
角度和長度

edge direction
偵測邊緣的朝向
robinson 算子
拉普拉斯算子
考虑到边缘其实就是图像上像素值变化很大的点的集合,因此可以通过计算二阶微分得到,当二阶微分为0时,像素值的变化最大。此时,对x方向
和y方向分别求取二阶导数
4領域的kernel (上下左右)

8領域的kernel (還有東北 東南這種的八個方位)

===
shape
chain code就是方位,4 or 8
且用代碼描述邊界,比單純用給多個piexl的座標好
Shape Numbers
多個幾個方向

chain code的缺點是這很依賴起始的pixel,和物體朝向

Fourier Descriptors

You might also like