You are on page 1of 63

I HC THI NGUYN

TRNG I HC CNG NGH THNG TIN


V TRUYN THNG

LA NGC TNG

K THUT SIFT TRONG PHT HIN V


NH DU I TNG

LUN VN THC S KHOA HC MY TNH

Thi Nguyn- 2012

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

MC LC

MC LC ......................................................................................................... i
DANH MC K HIU V VIT TT ...................................................... iv
DANH MC CC HNH NH ..................................................................... v
PHN M U .............................................................................................. 1
Chng 1:

KHI QUT V X L NH V PHT HIN, ............ 4

NH DU I TNG ............................................................................. 4
1.1. Khi qut v x l nh ........................................................................... 4
1.1.1. Cc khi nim c bn ...................................................................... 4
1.1.1.1. X l nh .................................................................................. 4
1.1.1.2. im nh .................................................................................. 5
1.1.1.3. nh ........................................................................................... 5
1.1.1.4. Mc xm ca nh ..................................................................... 5
1.1.1.5. phn gii ca nh ................................................................ 6
1.1.2. Cc bc x l nh s ..................................................................... 7
1.1.2.1. Thu nhn nh ............................................................................ 8
1.1.2.2. Tin x l ................................................................................. 8
1.1.2.3. Phn vng nh ........................................................................ 16
1.1.2.4. Trch chn c trng .............................................................. 17
1.1.2.5. Nhn dng v ni suy nh ...................................................... 18
1.1.2.6. Hu x l ................................................................................ 19

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

ii

1.2. Pht hin v nh du i tng .......................................................... 23


1.2.1. Pht hin i tng ....................................................................... 23
1.2.2. nh du i tng ....................................................................... 25
Chng 2: K THUT PHT HIN V NH DU I TNG
DA TRN C TRNG BT BIN T L ......................................... 26
2.1. L thuyt im bt ng v cc c trng bt bin ca i tng ...... 26
2.1.1. im bt ng ............................................................................... 26
2.1.1.1. nh ngha .............................................................................. 26
2.1.1.2. Mt s nh l v im bt ng ........................................... 27
2.1.1.3. Vai tr ca im bt ng trong nhn dng i tng .......... 29
2.1.2. Cc c trng cc b bt bin ca i tng ................................ 30
2.1.3. Trch chn cc c trng bt bin da trn cc im bt ng .... 30
2.1.4. So khp c trng ......................................................................... 31
2.2. Thut ton Php bin i c trng bt bin t l SIFT ............... 32
2.2.1. Pht hin cc tr khng gian t l (Scale-space Extrema Detection)
................................................................................................................. 35
2.2.1.1. Tn s ly mu theo t l ....................................................... 37
2.2.1.2. Tn s ly mu trong mt vng khng gian .......................... 38
2.2.2. nh v chnh xc im kha (Keypoint localization) .................. 39
2.2.3 Gn hng cho cc im kha (Oriented Assignment) ................. 43
2.2.4. B m t nh cc b (Keypoint Description) [5,6,7].................... 44
2.3. Mt s hng ci tin, pht trin thut ton SIFT ............................... 47

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

iii

2.3.1. Gim s lng keypoint trch xut mi nh .............................. 47


2.3.2. Dng lc mu loi tr trc cc nh t kh nng tng ng48
2.3.3. Trch xut i tng ra khi nh theo i tng mu .................. 48
Chng 3: CHNG TRNH TH NGHIM ......................................... 49
3.1. Bi ton nhn dng i tng .............................................................. 49
3.1.1. Pht biu bi ton .......................................................................... 49
3.1.2. Cch gii quyt bi ton ................................................................ 49
3.2. Chng trnh ci t th nghim ......................................................... 51
3.2.1. Ci t chng trnh...................................................................... 51
3.2.2. Kt qu thc nghim ..................................................................... 51
PHN KT LUN ........................................................................................ 55
TI LIU THAM KHO ............................................................................ 57

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

iv

DANH MC K HIU V VIT TT

STT

K hiu
vit tt

Vit y

ngha

Pixel

Picture Element

im nh

CGA

Color Graphic Adapter

Ch ha mu

RLC

Run Length Coding

Phng php m ha lot


di

MPEG

2D

Two-dimensional space Khng gian hai chiu

3D

Three-dimensional
space

Khng gian ba chiu

SIFT

Scale Invariant Feature


Transform

Php bin i c trng bt


bin t l

10

DoG

Deffirence of
Gaussisan

Hm sai khc Gaussian

11

RANDSAC

RANDom Sample
Consensus

ng thun mu ngu nhin

Moving Picture Experts Chun nn video v audio


Group
theo ISO/IEC

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

DANH MC CC HNH NH
Hnh 1.1. Qu trnh x l nh ........................................................................... 4
Hnh 1.2. Cc bc c bn trong mt h thng x l nh ................................ 7
Hnh 1.3. S phn tch, x l nh v lu thng tin gia cc khi .......... 7
Hnh 1.4. nh thu nhn v nh mong mun ..................................................... 9
Hnh 1.5. Dn tng phn .......................................................................... 15
Hnh 1.6. Qu trnh hin th v chnh sa, lu tr nh thng qua DIB .......... 22
Hnh 1.7. S chuyn i gia cc m hnh biu din nh .............................. 23
Hnh 2.1. Xy dng mt th hin khng gian t l ......................................... 36
Hnh 2.2. Cc gi tr cc i v cc tiu ca cc nh DoG ............................ 37
Hnh 2.3. Cc giai on la chn cc im kha............................................ 40
Hnh 2.4. B m t im kha ........................................................................ 44
Hnh 3.1. V d v bi ton nhn dng i tng: xc nh xem i tng ... 49
trong nh (b) c trong nh (a) khng?............................................................. 49
Hnh 3.2. M hnh chc nng nhn dng i tng ....................................... 50
Hnh 3.3. .......................................................................................................... 52
Kt qu nhn dng ca nh cha nhiu i tng c hun luyn. ............. 52
Hnh 3.4. Kt qu nhn dng i tng b che khut mt phn. .................... 53
Hnh 3.5. Khng nhn dng c i tng................................................... 54

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

PHN M U

Con ngi thu nhn thng tin t mi trng ngoi thng qua cc gic quan,
trong th gic ng vai tr quan trng nht trong qu trnh nhn thc. S pht
trin ca phn cng my tnh v phng din thu nhn, lu tr, x l v hin th v
vch ra nhiu nh hng mi cho s pht trin phn mm ni chung v lnh vc
x l nh ni ring. Cng vi k thut ha, x l nh ng vai tr quan trng
trong cc h thng tng tc ngi my.
Nhn dng i tng l mt bi ton in hnh ca lnh vc x l nh, vi
mc tiu gip cho my tnh c th nhn thc c mi trng ngoi ging nh con
ngi thng qua th gic. Bi ton ny c th c p dng trong vic pht hin,
nhn dng, theo di hay tm kim t ng cc i tng trong thc t, in hnh
nh vic gim st an ninh cho cc khu vc quan trng: ngn hng, khu vc chnh
tr, qun s...
Qu trnh nhn dng i tng t ng bao gm vic thu nhn d liu t cc
gic quan v tin x l, biu din d liu, nhn dng v a ra quyt nh. i vi
con ngi qu trnh ny din ra gn nh tc thi, nhng i vi my tnh th hot
ng ny tng i phc tp. Vi s h tr ca cc thit b thu nhn hnh nh hin
i cho ta cht lng hnh nh r nt, chn thc v i tng, nhng vn l lm
th no my tnh nhn bit c i tng trng nh th no, cc hnh dng khc
nhau, cc gc nhn khc nhau v kch thc ca i tng ra sao...
Mt s vn cn gii quyt ca bi ton nhn dng i tng khi p dng
vo thc t to ra nhng thch thc v gii thut cng nh yu cu v tc tnh
ton. c im chung ca tt c nhng ng dng l nhng c im c trng
cn thit thng l nhiu, khng th do chuyn gia xut, m phi c trch chn
da trn cc th tc phn tch d liu. Vi bi ton nhn dng i tng c rt
nhiu cch tip cn gii quyt, vi mi loi i tng li c mt phng php c
th p dng, nhng chng vn c nhng im chung. Mt trong s nhng

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

phng php c s dng l trch chn cc c trng ca nh. Cc c trng


c trch chn thng da vo cc c trng bt bin ca nh.
L thuyt v im bt ng c nghin cu nhiu trong ton hc v vt
l. Vic nghin cu p dng l thuyt ny trch chn c im phc v cho nhn
dng trong x l nh l hng tip cn mi v c nhiu ha hn nht l i vi cc
i tng c s bin i v kch thc, hnh dng, cc i tng b che khut mt
s b phn hoc i tng chuyn ng v.v.. Nh vy bi ton nhn dng i tng
da vo cc c trng bt bin m nn tng l da vo cc im bt ng l mt
cch tip cn mi trong khoa hc nhn dng l c s xy dng nhiu ng dng
quan trng v cn thit. C th lit k ra mt s k thut tm kim im bt bin
trong nh nh: Phng php Harris; Phng php Harris Laplacian; Phng
php xc nh im bt bin Harris Affine; Phng php SIFT (Scale Invarian
Feature Tranforms); Phng php SURF (Speed Up Robust Feature).
Trong vn c th nhn dng i tng th ngy nay hng nghin cu ph
bin trn th gii l vic s dng cc im bt bin (Invarian Feature) trong nh lm
c trng (Keypoint) nhn dng. Tiu biu nht trong cc thut ton i snh s
dng keypoint dng ny l thut ton SIFT (Scale-Invarian Feature Transform,
David Lowe 1999 v 2004), SIFT c th coi l thut ton tin cho cc ng dng
cng nh gii thut khc v bin i c trng bt bin trong nh. Cc gii thut
ang ng dng trong thc t khc u da trn hay pht trin theo cc nhnh ring
ca k thut SIFT.
Cc c trng trong SIFT khng ph thuc vo cc php bin i nh c bn
nh xoay, thu phng, thay i sng... nn c th xem tp cc c trng ca mt
nh l th hin cho ni dung ca nh . V vy kt qu ca vic nhn dng s c
chnh xc rt cao v thm ch c th khi phc c i tng b che khut trong
nh. Tuy nhin gii thut SIFT rt phc tp trong ci t, i hi thi gian nghin
cu v am hiu nhiu thut ton thnh phn.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

Vi tm quan trng ca bi ton nhn dng i tng nh trn, c bit l


cc i tng b bin i cho ta thy r tnh cn thit cng nh tnh thi s, ng
thi l ngha khoa hc v thc tin ca vn . Nhn thc c iu ny, ti
chn ti lun vn: K thut SIFT trong pht hin v nh du i tng.
Ni dung lun vn bao gm phn m u, phn kt lun v ba chng vi b
cc ni dung nh sau:
Chng 1: Khi qut v x l nh v pht hin, nh du i tng
Chng ny trnh by khi qut v x l nh, cc giai on ca x l
nh s v cc vn trong pht hin v nh du i tng.
Chng 2: K thut pht hin v nh du i tng da trn c trng bt
bin t l - SIFT
Trong chng ny s trnh by l thuyt v im bt ng v cc c
trng bt bin ca i tng; l thuyt c bn ca thut ton SIFT cng nh
cc bc tin hnh; mt s hng ci tin, pht trin thut ton SIFT.
Chng 3: Chng trnh th nghim
Trong chng ny s trnh by ng dng nhn dng i tng nh
da vo cc c trng bt bin c xy dng t cc im bt ng, ci t
th nghim thnh cng k thut SIFT trnh by chng 2.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

Chng 1: KHI QUT V X L NH V PHT HIN,


NH DU I TNG

1.1. Khi qut v x l nh


1.1.1. Cc khi nim c bn
1.1.1.1. X l nh
X l nh [1,2,3] l mt lnh vc mang tnh khoa hc v cng ngh.
Tuy l mt ngnh khoa hc mi m so vi nhiu ngnh khoa hc khc, nhng
tc pht trin rt nhanh, c rt nhiu cc vin nghin cu, ng dng.
Nhng nm tr li y vi s pht trin ca phn cng my tnh, x l
nh v ho pht trin mt cch mnh m v c nhiu ng dng c p
dng trong cuc sng. X l nh v ho ng mt vai tr quan trng trong
tng tc ngi - my.
Mc ch ca x l nh l nng cao cht lng nh phc v con ngi
v x l nh d liu dng hnh nh my tnh c th hiu c t a ra
nhng quyt nh cn thit.

Hnh 1.1. Qu trnh x l nh


X l nh c nhiu ng dng trong i sng nh : nhn dng nh, v
tinh d bo thi tit, vin thm, nh y t, khoa hc hnh s, in nh

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

1.1.1.2. im nh
im nh (Pixel) l mt phn t ca nh s ti to (x, y) vi xm
hoc mu nht nh. Kch thc v khong cch gia cc im nh c
chn thch hp sao cho mt ngi cm nhn s lin tc v khng gian v mc
xm (hoc mu) ca nh s gn nh nh tht. Mi phn t trong ma trn c
gi l mt phn t nh.
1.1.1.3. nh
nh s l tp hp cc im nh vi mc xm ph hp dng m t
nh gn ging vi nh tht.
nh c to nn t hng trm ngn cho n hng triu vung rt
nh - c coi l nhng nhn t ca bc nh v thng c bit di tn gi
l im nh. My tnh hay my in s dng nhng vung nh ny hin th
hay in ra bc nh. lm c iu my tnh hay my in chia mn hnh,
trang giy thnh mt mng li cha cc vung, sau s dng cc gi tr
cha trong file nh nh ra mu sc, sng ti ca tng pixel trong mng
li , l c s nh s c hnh thnh. Vic kim sot, nh ra a ch
theo mng li nh trn c gi l bit mapping v nh s cn c gi l
nh bitmap.
1.1.1.4. Mc xm ca nh
* nh ngha: Mc xm (grey level) ca im nh l cng sng ca n
c gn bng gi tr s ti im .
* Cc thang gi tr mc xm thng thng: 16, 32, 64, 128, 256 (Mc 256
l mc ph dng bi v trong k thut my tnh dng 1 byte (8 bit) biu
din mc xm: Mc xm dng mt byte biu din: 28=256 mc, tc l t gi
tr 0 n 255).

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

* nh en trng: l nh c hai mu en, trng (khng cha mu khc) vi


mc xm cc im nh c th khc nhau.
* nh nh phn: nh ch c hai mc en trng phn bit tc dng mt bit m
t 21 mc khc nhau. Ni cch khc: mi im nh ca nh nh phn ch c
th l 0 hoc 1.
* nh mu: trong khun kh l thuyt ba mu (Red, Blue, Green) to nn
th gii mu, ngi ta thng dng ba byte m t mc mu, khi cc gi
tr mu: 28*3 = 224 16,7 triu mu.
1.1.1.5. phn gii ca nh
nh ngha: phn gii (Resolution) ca nh l mt im nh c n
nh trn mt nh s c hin th.
Theo nh ngha, khong cch gia cc im nh phi c chn sao
cho mt ngi vn thy c s lin tc ca nh. Vic la chn khong cch
thch hp to nn mt mt phn b, chnh l phn gii v c phn
b theo trc x v y trong khng gian hai chiu.
V d: phn gii ca nh trn mn hnh CGA (Color Graphic
Adapter) l mt li im theo chiu ngang mn hnh: 320 im chiu dc
200 im nh (320200). R rng, cng mn hnh CGA 12 ta nhn thy mn
hn mn hnh CGA 17 phn gii 320200. L do: cng mt mt (
phn gii) nhng din tch mn hnh rng hn th mn (lin tc ca cc
im) km hn.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

1.1.2. Cc bc x l nh s
Mt h thng x l nh c s tng qut nh sau:

Hnh 1.2. Cc bc c bn trong mt h thng x l nh

Hnh 1.3. S phn tch, x l nh v lu thng tin gia cc khi


Sau y s trnh by mt s k thut x l nh cn thit phc v cho
vic ci t chng trnh th nghim (theo cc bc trong hnh 1.2), cn cc
thnh phn khc s c gii thiu mc c bn.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

1.1.2.1. Thu nhn nh


Cc thit b thu nhn nh bao gm camera, scanner cc thit b thu nhn
ny c th cho nh en trng.
Cc thit b thu nhn nh c hai loi chnh ng vi hai loi nh thng
dng Raster, Vector.
Cc thit b thu nhn nh Raster thng thng l camera, cc thit b thu nhn
nh thng thng Vector l sensor hoc bn s ho Digitalizer hoc c
chuyn i t nh Raster.
Nhn chung cc h thng thu nhn nh thc hin 1 qu trnh:
- Cm bin: bin i nng lng quang hc thnh nng lng in
- Tng hp nng lng in thnh nh
1.1.2.2. Tin x l
Sau b thu nhn, nh c th nhiu v tng phn thp nn cn a
vo b tin x l (Image Processing) nng cao cht lng. Chc nng
chnh ca b tin x l l nn chnh bin dng, lc nhiu, chnh mc xm,
nng tng phn lm nh r hn, nt hn.
Cc thut ton trin khai vic nng cao cht lng nh hu ht da trn
cc k thut trong min im, khng gian v tn s. Ton t im l php
bin i i vi tng im nh ang xt, khng lin quan n cc im ln
cn khc, trong khi , ton t khng gian s dng cc im ln cn quy
chiu ti im nh ang xt. Mt s php bin i c tnh ton phc tp c
chuyn sang min tn s thc hin, kt qu cui cng c chuyn tr li
min khng gian nh cc bin i ngc.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

a. Nn chnh bin dng


nh thu nhn thng b bin dng do cc thit b quang hc v in t.

nh thu nhn

nh mong mun

Hnh 1.4. nh thu nhn v nh mong mun


Cc nguyn nhn bin dng do:
- Do camera, u thu nh cht lng km.
- Do mi trng, nh sng, hin trng (scene), kh quyn, nhiu xung.
- Do cht lng.
khc phc ngi ta s dng cc php chiu, cc php chiu thng
c xy dng trn tp cc im iu khin.
Gi s (Pi, Pi) vi i = 1, n c n cc tp iu khin
Tm hm f: Pi a f (Pi) sao cho:
(1.1)
Gi s nh b bin i ch bao gm: Tnh tin, quay, t l, bin dng
bc nht tuyn tnh. Khi hm f c dng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

(1.2)

10

Ta c:
(1.3)
cho min

(1.4)

Gii h phng trnh tuyn tnh tm c a1, b1, c1, tng t tm c


a2, b2, c; t ta xc nh c hm f.
b. Lc nhiu
Thng nh thu nhn c c nhiu nn cn phi loi b nhiu.
tch nhiu (hay lm trn nhiu), ngi ta s dng cc b lc tuyn tnh (lc
trung bnh, thng thp) hay lc phi tuyn (trung v, gi trung v, lc ng
hnh). T bn cht ca nhiu (thng tng ng vi tn s cao) v t c s l
thuyt lc l: b lc ch cho tn hiu c tn s no thng qua do , lc
nhiu ngi ta thng dng lc thng thp (theo quan im tn s khng
gian) hay ly t hp tuyn tnh san bng (lc trung bnh).
Trc khi xem xt chi tit cc k thut p dng, cn phn bit cc loi
nhiu hay can thip trong qu trnh x l nh. Trn thc t tn ti nhiu loi
nhiu; tuy nhin ngi ta thng xem xt ba loi nhiu chnh: nhiu cng,
nhiu nhn v nhiu xung:

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

11

- Nhiu cng: Nhiu cng thng phn b khp nh. Nu gi nh quan


st (nh thu c) l Xqs, nh gc l Xgc, nhiu l , nh thu c c
th biu din bi:
- Xqs = Xgc +

(1.5)

- Nhiu nhn: Nhiu nhn thng phn b khp nh v nh thu c s


biu din vi cng thc:
- Xqs = Xgc *

(1.6)

- Nhiu xung: Nhiu xung thng gy t bin ti mt s im nh.


* Lm trn nhiu bng lc tuyn tnh: lc trung bnh v lc di thng thp
Do c nhiu loi nhiu can thip vo qu trnh x l nh nn cn c
nhiu b lc thch hp. Vi nhiu cng v nhiu nhn ta dng cc b lc
thng thp, trung bnh v lc ng hnh (Homomorphie); vi nhiu xung ta
dng lc trung b, gi trung v, lc ngoi (Outlier).
i. Lc trung bnh khng gian
Vi lc trung bnh, mi im nh c thay th bng trung bnh trng
s ca cc im ln cn v c nh ngha nh sau:
(1.7)
Nu trong k thut lc trn, ta dng cc trng s nh nhau, phng
trnh trn s tr thnh:
(1.8)
vi : y(m, n): nh u vo,
v(m, n): nh u ra ;

S ha bi Trung tm Hc liu i hc Thi Nguyn

a(k, l) : l ca s lc.

http://www.lrc-tnu.edu.vn

12

Vi

v Nw l s im nh trong ca s lc W.

Lc trung bnh c trng s chnh l thc hin chp nh u vo vi


nhn chp H. Nhn chp H trong trng hp ny c dng:

(1.9)

Trong lc trung bnh, thng ngi ta u tin cho cc hng bo v


bin ca nh khi b m khi lm trn nh. Cc kiu mt n c s dng ty
theo cc trng hp khc nhau. Cc b lc trn l b lc tuyn tnh theo ngha
l im nh tm ca s s c thay bi t hp cc im ln cn chp vi
mt n.
Gi s u vo biu din bi ma trn I:

(1.10)

nh s thu c bi lc trung bnh Y=H I c dng:

(1.11)

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

13

Mt b lc trung bnh khng gian khc cng hay c s dng.


Phng trnh ca b lc c dng:
(1.12)
y, nhn chp H c kch thuc 2x2 v mi im nh kt qu c gi
tr bng trung bnh cng ca n vi trung bnh cng ca bn ln cn gn nht.
Lc trung bnh trng s l mt trng hp ring ca lc thng thp.
ii. Lc thng thp
Lc thng thp thng c s dng lm trn nhiu.V nguyn l
ca b lc thng thp ging nh trnh by trn. Trong k thut ny ngi
ta hay dng mt s nhn chp c dng sau:
(1.13)

(1.14)

Ta d dng nhn thy khi b =1, Hb chnh l nhn chp Ht1 (lc trung
bnh). hiu r hn bn cht kh nhiu cng ca cc b lc ny, ta vit li
phng trnh thu nhn nh di dng:
(1.15)

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

14

Trong [m, n] l nhiu cng c phng sai 2n. Nh vy, theo cch
tnh ca lc trung bnh ta c:

(1.16)
Nh vy, nhiu cng trong nh gim i Nw ln.
c. Tng tng phn
Trc tin cn lm r khi nim tng phn. nh s l tp hp cc
im nh, m mi im nh c gi tr sng khc nhau. y, sng
mt ngi d cm nhn nh, song khng phi l quyt nh. Thc t ch ra
rng hai i tng c cng sng nhng t trn hai nn khc nhau s cho
cm nhn khc nhau. Nh vy, tng phn biu din s thay i sng
ca i tng so vi nn. Nh v c th hiu rng, tng phn l ni
ca im nh hay vng nh so vi nn. Vi nh ngha ny, nu nh c
tng phn km, ta c th thay i tu theo mun.
nh vi tng phn thp c th do iu kin sng khng hay
khng u, hoc do tnh khng tuyn tnh hay bin ng nh ca b cm nhn
nh. iu chnh li tng phn ca nh, ta iu chnh li bin trn
ton di hay trn di c gii hn bng cch bin i tuyn tnh bin u
vo (dng hm bin i l hm tuyn tnh) hay phi tuyn (hm m hay hm
lgart). Khi dng hm tuyn tnh cc dc , , phi chn ln hn mt
trong min cn dn. Cc tham s a v b (cc cn) c th chn khi xem xt
lc xm ca nh.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

15

Hnh 1.5. Dn tng phn


Ch , nu dn tng phn bng hm tuyn tnh ta c:
1

, , 1
, , 1

nh kt qu trng vi nh
dn
gc tng phn
co tng phn

Hm m hay dng trong dn tng phn c dng:


f = (X[m,n])p

(1.17)

Gi m
Gi s ta c nh I c kch thc m n v s nguyn c. Khi , k thut
tng, gim c sng c th hin
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +)
I [i, j] = I [i, j] + c;

- Nu c > 0: nh sng ln
- Nu c < 0: nh ti i
d. Chnh mc xm
Nhm khc phc tnh khng ng u ca h thng gy ra. Thng
thng c hai hng tip cn:

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

16

- Gim s mc xm: Thc hin bng cch nhm cc mc xm gn nhau


thnh mt b. Trng hp ch c hai mc xm th chnh l chuyn v
nh en trng. ng dng: In nh mu ra my in en trng.
- Tng s mc xm: Thc hin ni suy ra cc mc xm trung gian bng
k thut ni suy. K thut ny nhm tng cng mn cho nh.
1.1.2.3. Phn vng nh
Phn vng nh l bc then cht trong x l nh. Giai on ny nhm
phn tch nh thnh nhng thnh phn c cng tnh cht no da theo bin
hay cc vng lin thng. Tiu chun xc nh cc vng lin thng c th l
cng mc xm, cng mu hay cng nhm... Trc ht cn lm r khi
nim "vng nh" (Segment) v c im vt l ca vng.
Vng nh l mt chi tit, mt thc th trng ton cnh. N l mt tp
hp cc im c cng hoc gn cng mt tnh cht no : mc xm, mc
mu, nhm Vng nh l mt trong hai thuc tnh ca nh. Ni n vng
nh l ni n tnh cht b mt. ng bao quanh mt vng nh (Boundary)
l bin nh. Cc im trong mt vng nh c bin thin gi tr mc xm
tng i ng u hay tnh kt cu tng ng.
Da vo c tnh vt l ca nh, ngi ta c nhiu k thut phn vng:
phn vng da theo min lin thng gi l phn vng da theo min ng
nht hay min k; phn vng da vo bin gi l phn vng bin. Ngoi ra
cn c cc k thut phn vng khc da vo bin , phn vng da theo kt
cu.
y l phn phc tp kh khn nht trong x l nh v cng d gy li,
lm mt chnh xc ca nh. Kt qu nhn dng nh ph thuc rt nhiu vo
cng on ny.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

17

1.1.2.4. Trch chn c trng


u ra nh sau phn on cha cc im nh ca vng nh (nh
phn on) cng vi m lin kt vi cc vng ln cn. Vic bin i cc s
liu ny thnh dng thch hp l cn thit cho x l tip theo bng my tnh.
Vic chn cc tnh cht th hin nh gi l trch chn c trng (hay trch
chn c im - Feature Selection) gn vi vic tch cc c tnh ca nh
di dng cc thng tin nh lng hoc lm c s phn bit lp i tng
ny vi i tng khc trong phm vi nh nhn c. V d: trong nhn dng
k t trn phong b th, chng ta miu t cc c trng ca tng k t gip
phn bit k t ny vi k t khc.
Cc c im ca i tng c trch chn tu theo mc ch nhn
dng trong qu trnh x l nh. C th nu ra vi c im ca nh sau y:
- c im khng gian: Phn b mc xm, phn b xc sut, bin ,
im un ...
- c im bin i: Cc c im loi ny c trch chn bng vic
thc hin lc vng (Zonal Filtering). Cc b vng c gi l mt n
c im (Feature Mask) thng l cc khe hp vi hnh dng khc
nhau (ch nht, tam gic, cung trn ...)
- c im bin v ng bin: c trng cho ng bin ca i
tng v do vy rt hu ch trong vic trch chn cc thuc tnh bt
bin c dng khi nhn dng i tng. Cc c im ny c th
c trch chn nh ton t gradient, ton t la bn, ton t Laplace,
ton t cho khng (Zero Crossing) ...
Vic trch chn hiu qu cc c im gip cho vic nhn dng cc i
tng nh chnh xc, vi tc tnh ton cao v dung lng b nh lu tr
gim xung.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

18

1.1.2.5. Nhn dng v ni suy nh


y l giai on cui ca cc h thng x l nh. Nhn dng nh
(Image Recognition) l qu trnh phn loi cc i tng c biu din theo
mt m hnh no v gn chng mt tn (gn cho i tng mt tn gi, tc
l mt dng) da theo nhng quy lut v mu chun. Qu trnh nhn dng da
vo nhng mu chun c hc (hoc lu) t trc gi l nhn dng c thy
hay hc c thy, trong nhng trng hp ngc li gi l hc khng c thy.
Ni suy (Interpretation) l phn on theo ngha trn c s nhn
dng. V d: mt lot ch s v nt gch ngang trn phong b th c th c
ni suy thnh m in thoi.
C nhiu cch phn loai nh khc nhau. Trong l thuyt v nhn dng
ni chung v nhn dng nh ni ring, cc m hnh ton hc v nh c
phn theo hai loi nhn dng nh c bn:
- Nhn dng theo tham s.
- Nhn dng theo cu trc.
Hay c ba cch tip cn khc nhau:
- Nhn dng da vo phn hoch khng gian.
- Nhn dng da vo cu trc.
- Nhn dng da vo k thut mng nron.
Hai cch tip cn u l nhng cch tip cn kinh in, c nghin
cu v p dng rt nhiu trong thc t. Cc i tng nh quan st v thu
nhn c phi tri qua giai on tin x l nhm tng cng cht lng, lm
ni cc chi tit, tip theo l trch chn v biu din cc c trng, cui cng
mi l giai on nhn dng.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

19

Cch tip cn th ba hon ton khc. N da vo c ch on nhn, lu


tr v phn bit i tng m phng theo hot ng ca h thn kinh con
ngi. Do c ch c bit, cc i tng thu nhn bi th gic ngi khng
cn qua giai on ci thin m chuyn ngay sang giai on tng hp, i snh
vi cc mu lu tr nhn dng. y l cch tip cn y ha hn c
trnh by c th trong cc phn di y.
Mt s i tng nhn dng kh ph bin hin nay ang c p dng
trong khoa hc v cng ngh l: nhn dng k t (ch in, ch vit tay, ch k
in t), nhn dng vn bn (Text), nhn dng vn tay, nhn dng m vch,
nhn dng i tng chuyn ng, nhn dng mt ngi, nhn dng n ci,
nhn dng mng mt,
1.1.2.6. Hu x l
a. Nn nh
nh d dng no vn chim khng gian nh rt ln. Nhm gim
thiu khng gian lu tr, khi m t nh, ngi ta a k thut nn nh vo.
Thng thng c tin hnh theo c hai cch khuynh hng l nn c
bo ton v nn khng bo ton thng tin. Nn khng bo ton th thng c
kh nng nn cao hn nhng kh nng phc hi th km hn. Trn c s hai
khuynh hng, c bn cch tip cn c bn trong nn nh:
- Nn nh thng k: K thut nn ny da vo vic thng k tn xut
xut hin ca gi tr cc im nh, trn c s m c chin lc m
ha thch hp. Mt v d in hnh cho k thut m ha ny l *.TIF
- Nn nh khng gian: K thut ny da vo v tr khng gian ca cc
im nh tin hnh m ha. K thut li dng s ging nhau ca cc

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

20

im nh trong cc vng gn nhau. V d cho k thut ny l m nn


*.PCX
- Nn nh s dng php bin i: y l k thut tip cn theo hng
nn khng bo ton v do vy, k thut thng hiu qu hn. *.JPG
tip cn theo k thut nn ny.
- Nn nh Fractal: S dng tnh cht Fractal ca cc i tng nh, th
hin s lp li ca cc chi tit. K thut nn s tnh ton ch cn lu
tr phn gc nh v quy lut sinh ra nh theo nguyn l Fractal.
Cc phng php nn nh:
* Nn th h th nht:
- Phng php m ha lot di RLC (Run Length Coding)
- Phng php m ha Huffman
- Phng php LZW (Lempel Ziv-Wench)
- Phng php m ha khi (Block Coding)
- Phng php thch nghi
* Nn th h th hai:
- Phng php Kim t thp Laplace (Pyramide Laplace)
- Phng php m ha da vo biu din nh
- Hin nay, cc chun nn nh theo nh dng MPEG c dng v ang
pht huy hiu qu.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

21

b. Biu din nh
nh trn my tnh l kt qu thu nhn theo cc phng php s ho
c nhng trong cc thit b k thut khc nhau. Qu trnh lu tr nh nhm
hai mc ch:
- Tit kim b nh
- Gim thi gian x l
Vic lu tr thng tin trong b nh c nh hng rt ln n vic hin
th, in n v x l nh c xem nh l mt tp hp cc im vi cng kch
thc nu s dng cng nhiu im nh th bc nh cng p, cng mn v
cng th hin r hn chi tit ca nh gi c im ny l phn gii.
Vic la chn phn gii thch hp tu thuc vo nhu cu s dng v
c trng ca mi nh c th, trn c s cc nh thng c biu din
theo hai m hnh c bn.
* M hnh Raster
y l cch biu din nh thng dng nht hin nay, nh c biu
din di dng ma trn cc im (im nh). Thng thu nhn qua cc thit
b nh camera, scanner. Tu theo yu cu thc th m mi im nh c
biu din qua mt hay nhiu bt.
M hnh Raster thun li cho hin th v in n. Ngy nay cng ngh
phn cng cung cp nhng thit b thu nhn nh Raster ph hp vi tc
nhanh v cht lng cao cho c u vo v u ra. Mt thun li cho vic
hin th trong mi trng Windows l Microsoft a ra khun dng nh DIB
(Device Independent Bitmap) lm trung gian. Hnh 1.4 th hnh quy trnh
chung hin th nh Raster thng qua DIB.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

22

Mt trong nhng hng nghin cu c bn trn m hnh biu din ny


l k thut nn nh cc k thut nn nh li chia ra theo hai khuynh hng l
nn bo ton v khng bo ton thng tin nn, bo ton c kh nng phc hi
hon ton d liu ban u cn, nu khng bo ton ch c kh nng phc hi
sai s cho php no . Theo cch tip cn ny ngi ta ra nhiu quy
cch khc nhau nh BMP, TIF, GIF, PCX
Hin nay trn th gii c trn 50 khun dng nh thng dng bao gm
c trong cc k thut nn c kh nng phc hi d liu 100% v nn c
kh nng phc hi vi sai s nhn c.

Hnh 1.6. Qu trnh hin th v chnh sa, lu tr nh thng qua DIB


* M hnh Vector
Biu din nh ngoi mc ch tit kim khng gian lu tr d dng cho
hin th v in n cn m bo d dng trong la chn sao chp di chuyn tm
kimTheo nhng yu cu ny k thut biu din vector t ra u vit hn.
Trong m hnh vector ngi ta s dng hng gia cc vector ca im
nh ln cn m ho v ti to hnh nh ban u nh vector c thu nhn
trc tip t cc thit b s ho nh Digital hoc c chuyn i t nh Raster
thng qua cc chng trnh s ho.
Cng ngh phn cng cung cp nhng thit b x l vi tc nhanh
v cht lng cho c u vo v ra nhng li ch h tr cho nh Raster.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

23

Do vy, nhng nghin cu v biu din vect u tp trung t chuyn


i t nh Raster.

Hnh 1.7. S chuyn i gia cc m hnh biu din nh


1.2. Pht hin v nh du i tng
1.2.1. Pht hin i tng
Pht hin v nhn dng i tng trong nh c rt nhiu ng dng
trong cuc sng. y cng l bi ton c bn cn gii quyt trong cc h
thng tng tc ngi my, theo di i tng. Pht hin i tng l mt
khu khng th thiu cho bt k h thng x l i tng nh mt cch t
ng nh: nhn dng i tng, xc nh cc phn c trng ca i tng,
kim chng xc thc i tng
Nhim v ca mt h thng pht hin i tng l nhm xc nh xem
trong nh u vo c i tng hay khng, nu c th ch ra v tr v kch
thc ca i tng trong nh. Trong hai thp k gn y vn ny c
rt nhiu nh khoa hc quan tm nghin cu, v c kh nhiu gii php
khc nhau c a ra nhm gii quyt bi ton pht hin i tng trong nh
n v trong chui nh video. Tuy nhin do tnh phc tp v a dng ca cc
i tng trong thc t nn mt gii php ton din v trn vn cho vn
ny vn cn ang trong giai on nghin cu. Trong khun kh ti ny, ti
ch tp trung trnh by vo vn nghin cu v ci tin gii php pht hin
i tng trong nh n.
Cho n nay c th phn loi cc phng php pht hin i tng
thnh 4 nhm ch yu:

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

24

- Phng php da tren cc lut tri thc tm kim i tng


- Phng php s dng cc c trng bt bin ca i tng
- Phng php i snh ngu.
- Phng php s dng cc k thut hc cho mng N-ron.
i vi nhm phng php th nht, tp trung nghin cu xy dng
mt tp lut pht hin i tng da trn cc c im to thnh i tng
. V d nh cc c trng ng bin, thc hin phn lp cho nh thnh
2 lp: Lp nh c i tng v lp nh khng c i tng cn pht hin.
Trong nhm phng php th hai, cc gii php c xut hng
ti tm kim cc c trng c cu trc ca i tng ngay c khi thay i tm
quan st, gc quan st, iu kin nh sng, v s dng cc c trng ny
nh v i tng. Mt s c trng thng c s dng l: hnh dng,
kt cu, mu sc, ng bin in hnh nht l c im bt bin t l ca
i tng nh s c trnh by trong Chng 2.
Cc nhm phng php th ba, nghin cu k thut i snh mu da
trn s i snh i tng nhn c vi cc mu c xy dng trc.
Cn nhm phng php th t, da trn k thut my hc, xut ra
cc m hnh qu trnh hc v s dng m hnh ny hun luyn v tm kim
i tng. Cc k thut my hc thng c s dng nh: mng N ron,
SVM, HMM.
Cc phng php thuc ba nhm phng php u cho php xy dng
cc h thng c tc x l nhanh, tuy nhin kt qu x l cha cao. Ngc
li, cc phng php da trn k thut hc thng cho kt qu u ra cao hn
hn cc phng php cn li nhng li kh p dng trong cc h thng thi
gian thc.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

25

1.2.2. nh du i tng
nh du l vn c ngha v kh nn c cc nh nghin cu v
my tnh ton rt quan tm. Mc ch ca nh du l thit lp s ph hp
ca cc i tng v cc phn ca i tng gia cc frame lin tip trong
Video. N l mt cng vic c ngha trong hu ht cc ng dng gim st
t vic n cung cp d liu gn kt theo thi gian v cc i tng chuyn
ng dng cho c vic lm tng kh nng ca cc bc x l thp nh
phn on chuyn ng v kh nng m rng d liu mc cao hn nh
phn tch hot ng v tha nhn cch hnh ng. nh du l mt cng vic
kh khn ng dng trong cc v tr chng cho do cc i tng phn on
khng ng. Cc vn chung ca vic phn on khng ng l cc bng
di, cc phn ring l v tnh trng b chng cho ca cc i tng vi mi
i tng khc v vi phn t ng yn trong cnh . Nh vy, vic i ph
vi bng bc pht hin chuyn ng v vic bt c cc phn b che
khut c bc phn on v bc nh du l rt quan trng cho s nh
du ng n.
nh du trong Video c th c phn bit theo s cn thit ca cc
ng dng s dng n hoc theo cc phng php s dng gii quyt.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

26

Chng 2: K THUT PHT HIN V NH DU I TNG


DA TRN C TRNG BT BIN T L

2.1. L thuyt im bt ng v cc c trng bt bin ca i tng


2.1.1. im bt ng
2.1.1.1. nh ngha
Cc nh l im bt ng [4] cung cp nhiu iu kin tm ra
cc gii php cho cc bi ton v nh x (cc nh x n hoc nh x nhn a
gi tr). Bn thn l thuyt ny l mt s pha trn tt p ca hnh hc tp
gii tch v hnh hc. Nm mi nm gn y l thuyt v cc im bt ng
c khm ph nh mt cng c rt quan trng v c tc ng mnh m
trong vic nghin cu cc hin tng phi tuyn tnh. Trong thc t cc k
thut im bt ng v ang c p dng trong nhiu lnh vc khc nhau
nh sinh vt hc, ha hc, kinh t, l thuyt game v vt l. Gn y, ng
dng ca l thuyt im bt ng trong x l nh cng c phn tch.
* im bt ng trong ton hc
Trong ton hc, im bt ng c nh ngha nh sau:
nh x

f : A B; A, B P

(2.1)

im x* A c gi l im bt ng (im bt bin hnh hc) khi v


ch khi f(x*)=x*. Nu f l nh x co th x* l duy nht.
Vi cch tip cn ton hc, hm f thng l mt hm lin tc trong ln
cn ca im x*.
tm im bt ng, ngi ta thng dng cc phng php xc nh
trc mt khong [a,b] tha mn tnh cht no m cha im x*, sau

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

27

dng cc phng php lp (nh Newton, Leibniz) tnh gn ng im


bt ng. Sau mt s bc, php lp s hi t v im bt ng.
* im bt ng trong x l nh
Trong x l nh, ngi ta cng thng s dng nh x f:AB, vi A
l tp cc im nh, hay ni cch khc f l php bin i nh. Cc php bin
i nh thng thy l php bin i affine (php quay, php t l, php tnh
tin), php thay i cng sng. Ta gi cc php bin i l f: II,
bin nh I thnh nh I.
Bng mt cch no , ta s trch ra t nh I cc im c trng (x,y)
tha mn tnh cht H. Nu sau php bin i A, nh II, im (x,y) ca nh
I tr thnh (x,y) ca nh I, v im vn tha mn tnh cht H i vi nh
I th c th coi im (x,y) l im bt ng i vi php bin i f.
2.1.1.2. Mt s nh l v im bt ng
Mt s nh l im bt ng kinh in c s dng rng ri c pht
biu nh sau:
* nh l im bt ng ca Brouwer[4]:
Trong ton hc, nh l im bt ng Brouwer l mt nh l quan
trng p dng cho cc khng gian hu hn chiu v hnh thnh c s cho cc
nh l im bt ng tng qut hn.
Pht biu nh l: vi mt nh x lin tc f : S S ca mt n hnh nchiu vo chnh n tn ti t nht mt im x S m f (x) = x.
nh l im bt ng ca Brouwer pht biu rng nu 1 tp khng rng,
compact, li ca mt khng gian Euclide hu hn chiu c nh x lin tc
vo chnh n, th c t nht mt trong cc im ca n vn khng thay i.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

28

nh l ny c th c minh ha bng mt v d th v nh sau: ly hai t


giy c cng kch thc v t ln chng trong mt h ta , t t giy th
nht ln bn, v nhu t giy th hai v t t giy ny ln trn t giy th nht.
Khi s c t nht mt im ca t giy v nhu v tr chnh xc vi im
tng ng ca t giy trn bn (tc l im ny vn gia nguyn ta ). y l
mt h qu ca trng hp n = 2 c p dng cho mt nh x lin tc gn
ta ca mi im ca t giy v nhu vi ta ca im thuc t giy
phng di n.
* nh l im bt ng ca Banach[4]:
nh l im bt ng ca Banach (c bit nh nh l nh x co hoc
nguyn l nh x co) l mt cng c quan trng trong l thuyt khng gian
metric; n bo m s tn ti v tnh duy nht ca cc im bt ng ca cc
nh x vo chnh n ca khng gian metric, v cung cp mt phng php
suy din tm ra cc im c nh . nh l ny c t tn Stefan
Banach (1892-1945) v c cng b bi tc gi vo nm 1922.
Ly (X, d) l mt khng gian metric y khng rng. Cho T : X X
l mt nh x co trn X, tc l: c mt s thc khng m q < 1
d (Tx, Ty ) q.d ( x, y ) vi mi x, y thuc X. Khi nh x T nhn c mt v

ch mt im c nh x* trong X (iu ny c ngha l Tx* = x*). Hn na,


im bt ng ny c th c tm thy nh sau: bt u vi mt phn t bt
k x0 trong X v xc nh mt chui lp xn = Txn-1 vi n = 1, 2, 3,... th chui
ny hi t, v gii hn ca n l x*. Bt ng thc sau m t tc hi t:

d ( x*, xn )

qn
d (x , x )
1 q 1 0

S ha bi Trung tm Hc liu i hc Thi Nguyn

(2.2)

http://www.lrc-tnu.edu.vn

29

Tng ng:

d ( x*, xn1)
V

q
d ( xn1, xn )
1 q

(2.3)

d ( x*, xn1) qd ( xn , x* )

(2.4)

Ch rng iu kin d(Tx, Ty) < d(x, y) vi x v y khc nhau th khng


m bo s tn ti ca mt im c nh, nh c th hin bi nh x
T : [1,) [1,) vi T(x) = x + 1/x, n khng c mt im c nh no c.
Tuy nhin, nu khng gian X l compact, th gi nh lng lo ny a n tt
c cc pht biu ca nh l ny. Khi s dng nh l ny trong thc t, nhim
v kh nht l xc nh tp X mt cch ng n T nh x thc s cc phn
t t X vo X, tc l Tx lun l mt phn t ca X.
2.1.1.3. Vai tr ca im bt ng trong nhn dng i tng
L thuyt im bt ng ng mt vai tr c bn trong nhiu lnh lc
ca khoa hc my tnh, cu trc v cc c tnh ca cc im bt ng
c nghin cu trong nhiu Framework khc nhau v c ng dng
trong nhiu lnh vc ca x l nh. Chng ta thy rng cc thut ton lp hi
t cho vic phc hi nh c th c xem xt trong phm vi lp thut ton
im bt ng. Tip n l ng dng ca l thuyt ny trong vic x l nh
mu nh nhn dng i tng.
Nhiu thut ton v khi phc nh s dng tnh lp i lp li ca cc
im bt ng lm tng chnh xc cho s phc hi nh.
Cn trong nhn dng i tng, cn c vo cc im bt ng ta c th
trch chn c cc c trng bt bin nhn dng i tng tt hn, y l
mt hng nghin cu mi. Khi i tng c thu nhn cc t l khc
nhau, gc quay camera c th thay i hoc c s bin i i cht v hnh

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

30

dng ca i tng th da vo cc im bt bin ca i tng ta vn c th


nhn dng c i tng.
2.1.2. Cc c trng cc b bt bin ca i tng
c trng bt bin nh [6,7,8] c xy dng da trn c s ca im
bt ng. Mt tp cc im bt ng cng vi cc c trng bt bin c to
ra t n c th c xem nh l cc c tnh biu din cht liu nh hay i
tng nh. Nh vy, tm cc c trng bt bin nh: u tin ta xc nh
cc im bt ng trong nh i vi php bin i hnh hc no , sau
tnh ton cc m t da vo cc im bt ng tm c, cc m t ny
chnh l cc c trng bt bin biu din nh.
2.1.3. Trch chn cc c trng bt bin da trn cc im bt ng
Mt trong nhng ng dng quan trng ca im bt ng trong nhn dng
l trch chn c trng, v im bt ng l mt dng ca bt bin nn cc
c trng c trch chn da vo cc im bt ng cng bt bin nn n
thun tin trong vic so khp v nhn dng. Sau khi pht hin cc im quan
tm bt bin trong nh, bc tip theo l tnh ton cc c trng da vo v tr
ca cc im bt ng, bng cch to ra cc b m t cho cc im ny. B m
t im kha c xy dng nh sau:
Sau khi xc nh c v tr, t l cho mi im kha. Cc tham s
ny p t cho h ta 2D cc b m t vng nh cc b. Bc tip theo
l tnh ton mt b m t cho mt vng nh cc b xung quanh im kha
c th bt bin i vi cc thay i cn li nh thay i sng hoc im
nhn 3D.
Cc b m t im kha l cc o hm Gaussian c tnh trong mt
vng ln cn cc b xung quanh cc im kha. tnh ton b m t im
kha, u tin cc ln v hng gradient nh c ly mu quanh v tr

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

31

im kha, s dng t l ca im kha la chn mc m Gaussian cho


nh. t c s c lng n nh v hng gradient, ta s dng hng
gradient trung bnh trong mt vng ln cn ca im kha. S bt bin i
vi cc bin i v cng affine c t n bng vic chia cc o hm
bc cao hn thnh cc o hm bc nht. Nh vy, chng ta thu c cc b
m t vi s chiu hu hn biu din cc c trng c trch chn t cc
im bt ng.
2.1.4. So khp c trng
Nhn dng i tng c thc hin bng vic so khp mi c trng mt
cch c lp ti mt c s d liu cc c trng trch chn t cc nh hun luyn.
Mt so khp ng c tt nht cho mi c trng c tm thy bng vic
xc nh lng ging gn nht ca n trong mt c s d liu cc c trng.
Lng ging gn nht c xc nh bi c trng c khong cch Euclidean
nh nht.
Gi s cc c trng c m t thnh cc vect trong khng gian
Euclide Rn th khong cch Euclide gia hai c trng P = (p 1, p2,..., pn) v Q
= (q1, q2,..., qn) c nh ngha nh sau:

( p1 q1 )2 ( p2 q2 )2 ... ( pn qn )2

( pi qi )2

i 1

(2.5)

Ngoi ra, ngi ta cng thng s dng khong cch Mahalanobis


la chn cho mi c trng trong nh th nht mt c trng tng t nht
trong nh th hai. Nu khong cch ny nh hn mt ngng cho trc th so
khp chnh xc mt cch tim tng.
Khong cch Mahalanobis l mt cch hu ch cho vic xc nh
tng t ca mt tp cc mu cha bit ti mt tp cc mu bit. Khc vi

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

32

khong cch Euclide, khong cch Mahalanobis tnh n cc tng quan


ca tp d liu v n bt bin t l, tc l khng ph thuc vo t l ca cc
php o.
Chnh thc, khong cch Mahalanobis t mt nhm gi tr vi gi tr
trung bnh (1, 2 , 3 ,..., p )T v ma trn ng bin cho mt vect a
bin x ( x1, x2 , x3 ,..., x p )T c nh ngha nh sau:

DM ( x) ( x )T 1 ( x )

(2.6)

Khong cch Mahalanobis cng c th c nh ngha nh o tnh

khng ng dng gia hai vect ngu nhin x v y ca cng phn phi vi
ma trn ng bin :




d ( x , y ) ( x y )T 1 ( x y )

(2.7)

Nu ma trn ng bin l ma trn n v th khong cch Mahalanobis s


dn ti khong cch Euclide. Nu ma trn ng bin l cho th o khong
cch kt qu c gi l khong cch Euclide chun ha:


d ( x, y)

i 1

( xi yi )2

i2

(2.8)

Khong cch Mahalanobis c dng rng ri trong phn tch cm v


cc k thut phn lp khc. N lin quan mt thit vi phn phi c dng
cho vic kim th thng k a bin (Multivariate Statistical Testing).
2.2. Thut ton Php bin i c trng bt bin t l SIFT
SIFT (Scale Invariant Feature Transform) [5,6,7] l mt thut ton
trong lnh vc th gic my tnh (Computer Vision) do David Lowe a ra t
nm 1999. y l mt thut ton tiu biu v c hiu qu kh cao v da trn

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

33

cc c trng cc b bt bin trong nh v n nay c nhiu ci tin trong


thut ton. y l mt trong nhng phng php hiu qu trch chn cc
im bt bin t cc nh c dng thc hin so khp tin cy gia cc tm
nhn khc nhau ca cng mt i tng hoc quang cnh. Phng php ny
c gi l Php bin i c trng bt bin t l (Scale Invariant Feature
Transform SIFT) v n bin i d liu nh thnh cc ta bt bin t l
c lin quan ti cc c trng cc b.
K thut SIFT c ng dng vo cc bi ton tiu biu nh: Nhn
dng i tng (Object Recognition), lp bn v dn ng my mc
(Robotic Mapping and Navigation), ghp nh (Image Stitching), m hnh 3D
(3D Modeling), nhn dng c ch, theo di video (Video Tracking) v ph
hp vi chuyn ng (match moving). Thut ton SIFT c cp bng
sng ch ti M, bn quyn thuc v trng i hc British Columbia.
c trng c trch chn trong SIFT l cc im c bit gi l
keypoint, cc im ny km theo cc m t v n v mt vc t c ly
keypoint lm im gc.
C bn giai on chnh c thc hin trong thut ton trch xut
cc im c bit v cc c trng ca n bao gm:
* Pht hin cc tr khng gian t l (Scale-space Extrema Detection): Bc
u tin ny s p dng hm sai khc Gaussian (DoG - Deffirence of
Gaussisan) tm ra cc im c kh nng lm im c trng tim nng
(candidate keypoints), l nhng m rt t ph thuc (bt bin) vo s thu
phng nh v xoay nh.
* nh v chnh xc im kha (Keypoint localization): T nhng im tim
nng trn s lc v ly ra tp cc im c trng tt nht (keypoints).

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

34

* Gn hng cho cc im kha (Oriented Assignment): Mi im kha s


c gn cho mt hoc nhiu hng da trn hng gradient ca nh. Mi
php ton x l cc bc sau ny s c thc hin trn nhng d liu nh
m c bin i tng i so vi hng gn, kch c v v tr ca mi
im kha. Nh , to ra mt s bt bin trong cc php x l ny.
* B m t nh cc b (Keypoint Description): Cc hng gradient cc b
c o trong nh c kch c c th no trong vng ln cn vi mi im
c trng. Sau , chng s c biu din thnh mt dng m cho php m
t cc tng quan trng ca qu trnh bp mo hnh dng cc b v s thay i
v sng.
Tp cc im c bit thu c thng ph thuc rt t vo cc php
bin i c bn nh xoay, phng to, thu nh, tng gim cng sng v
vy c th xem y l cc c trng mang tnh cc b ca nh. i snh v
nhn dng hai nh th ta tm tp keypoint ging nhau trong hai nh, da vo
hng v t l c th bit i tng trong nh gc xoay, thu phng bao
nhiu so vi nh em i snh. Cch tip cn ca thut ton ny da vo im
bt bin cc b ca nh, chng c trch xut ra, c nh hng v m t
sao cho hai keypoint hai vng khc nhau th khc nhau. Tuy nhin mt yu
t nh hng khng nh n tc thut ton l s lng cc keypoint c
ly ra l khng nh. Trung bnh mt nh kch thc 500 x 500 pixels th s
trch xut c khong 2000 im (s lng im ny ph thuc vo ty tng
nh v tham s lc khc nhau). S lng cc im c trng c mt tm quan
trng trong vn nhn dng i tng, nhn dng mt i tng nh
trong mt nh cha tp hp cc i tng hn n th cn t nht 3 im c
trng ging nhau pht hin v v bc tch i tng.
i vi vn xy dng mt c s d liu nh v thc hin nhn dng
i tng bt k th ban u thng s dng SIFT to mt h d liu cc

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

35

c trng (keypoints) c trch xut t d liu nh gc. Sau vi mi nh


i tng em nhn dng ta dng gii thut SIFT trch xut tp c trng t
nh v em i snh vi h d liu c trng tm ra tp keypoint ging
nhau, t nhn dng i tng trong c s d liu nh ban u. Tuy nhin
vic i snh ny cn chi ph i snh rt ln i vi c s d liu nh c s
lng ln do s lng cc c trng mi nh l ln.
2.2.1. Pht hin cc tr khng gian t l (Scale-space Extrema Detection)
Giai on u tin ca pht hin im kha l tm ra cc v tr v cc t
l c th c gn lp i lp li di cc tm nhn khc nhau ca cng mt
i tng. Vic pht hin cc v tr bt bin khi c s thay i t l ca nh c
th c thc hin bng vic tm kim cc c trng n nh qua tt c cc t
l c th, s dng mt hm lin tc t l c hiu nh khng gian t l.
Dng hm Gaussian [5,6,7] lm hm nhn ca khng gian t l. V vy,
khng gian t l ca mt nh c xc nh bi hm L(x,y,), hm ny c
to ra t php cun Gaussian bin thin t l, G(x,y,), vi nh u vo I(x,y):
L( x, y, ) G( x, y, ) I ( x, y)

(2.9)

trong * l php ton cun theo x v y, v

G( x, y, )

1
2

e ( x
2

y 2 ) / 2 2

(2.10)

pht hin hiu qu cc v tr im kha n nh trong khng gian t


l, ta s dng cc cc tr khng gian t l trong hm Difference-of-Gaussian
c cun vi nh , D(x,y,), hm ny c th c tnh t s chnh lch
gia hai t l ln cn c phn bit bi tha s k:

D( x, y, ) (G( x, y, k ) G( x, y, )) I ( x, y)
L( x, y, k ) L( x, y, )

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

(2.11)

36

Hnh 2.1. Xy dng mt th hin khng gian t l

Hnh 2.1 th hin mt phng php hiu qu cho vic xy dng hm


D(x,y,). nh ban u c cun theo kiu gia tng vi cc hm Gaussian
to ra cc nh c phn bit bi tha s k trong khng gian t l, c xp
thnh chng ct bn tri. Ta chia mi qung ca khng gian t l (ngha l
gp i ) thnh s khong (s l s nguyn), v vy k = 21/s. Chng ta phi to ra
s+3 nh trong chng cc nh b lm m cho mi qung, vic pht hin cc
tr cui cng bao ph trn vn mt qung. Cc t l nh gn k c tr vi
nhau to ra cc nh Difference-of-Gaussian c th hin hnh bn phi.
Mt khi mt qung trn vn c x l, chng ta ti ly mu nh Gaussian gp
i gi tr ban u v vic x l c lp li.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

37

Hnh 2.2. Cc gi tr cc i v cc tiu ca cc nh DoG


Cc gi tr cc i v cc tiu ca cc nh DoG c tm thy bng vic
so snh mt im nh (nh du X) vi 26 lng ging trong cc vng 33
cc mc hin thi v cc mc gn k (c nh du O).
tm gi tr cc i v cc tiu a phng ca hm D(x,y,), mi
im mu c so snh vi 8 lng ging trong nh hin thi v 9 lng ging
trong t l trn v di (Hnh 2.2). N c chn ch khi ln hn tt c
cc lng ging ny hoc nh hn tt c chng. Chi ph ca s kim tra ny l
kh nh v trn thc t hu ht cc im mu s b loi b sau vi ln kim tra
u tin.
2.2.1.1. Tn s ly mu theo t l
S xc nh thc nghim ca tn s ly mu lm tng ti a tnh n nh
ca cc cc tr. xc nh tn s ly mu ngi ta s dng mt b s tp
gm 32 nh thc gm nhiu loi khc nhau, bao gm cc cnh ngoi tri, cc
mt ngi, cc bc nh trn khng v cc nh k ngh. Sau mi nh phi
chu mt dy cc php bin i, bao gm php quay, thay i t l, thay i
sng v tng phn, v thm tp nhiu nh. Bi v cc thay i ny l
khng t nhin, nn c th d on chnh xc ni m mi c trng trong nh
gc s xut hin trong nh bin i, ch n php o tnh lp li v

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

38

chnh xc v tr i vi mi c trng. Kt qu l, kh nng lp li cao nht


c t n khi ly mu 3 t l cho mi qung. [5,6,7]
Thc nghim cho thy kh nng lp li ca cc im kha khng tng
khi nhiu t l hn c ly mu. L do l v c nhiu cc tr a phng hn
c pht hin, nhng tnh trung bnh cc cc tr ny t n nh v v vy t c
kh nng c pht hin trong nh b bin i. S lng cc im kha
tng ln cng vi vic ly mu tng ca cc t l v tng s lng cc so
khp chnh xc cng tng. V s thnh cng ca vic nhn dng i tng
thng ph thuc nhiu vo s lng cc im kha c so khp chnh xc,
ch khng phi t l phn trm so khp chnh xc ca chng, nn i vi
nhiu ng dng, s ti u hn khi s dng mt lng ln cc mu t l. Tuy
nhin, chi ph tnh ton cng tng cng vi s lng ny, v vy qua thc
nghim chng ta ch cn chn 3 mu t l trn mi qung.
Tm li, cc th nghim cho thy rng hm Difference-of-Gaussian ca
khng gian t l c mt lng ln cc cc tr v s tn nhiu chi ph pht
hin tt c chng. May thay, chng ta c th pht hin c mt tp con n
nh v hu ch nht thm ch khi vic ly mu t l tr nn ti.
2.2.1.2. Tn s ly mu trong mt vng khng gian
V chng ta xc nh tn s ly mu trn mi qung ca khng gian t
l, cho nn phi xc nh tn s ly mu trong mt vng nh lin quan ti t
l ca vic lm trn. Bit rng cc tr c th gn nhau mt cch ty , nn s
c mt s cn bng tng i gia tn s ly mu v t l pht hin. [5,6,7]
D nhin, nu ta lm trn nh trc khi pht hin cc tr th s loi b
mt cch hiu qu cc tn s khng gian cao nht. Bi vy, lm tng tnh
hu ch ca d liu vo th nh c th c m rng to ra nhiu im mu
hn chng c mt trong nh gc. Ta tng gp i kch thc ca nh u vo

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

39

s dng php ni suy tuyn tnh trc khi xy dng mc u tin ca hnh
chp. Khi php ton tng ng c th c thc thi mt cch hiu qu
bng vic s dng cc b lc khong trng subpixel trn nh gc, th vic gp
i nh dn n s thc thi c hiu qu hn. Gi s rng nh gc c mt vt
m ti thiu 0.5 v v vy, nh c gp i c 1.0 lin quan ti
khong cch im nh mi ca n. iu ny c ngha l cn lm trn mt
cht trc khi to ra qung u tin ca khng gian t l. Vic nhn i nh
lm tng s lng cc im kha n nh bi mt tha s l 4, nhng cha
tm thy cc ci tin ng k hn na i vi tha s m rng ln hn.
2.2.2. nh v chnh xc im kha (Keypoint localization)
Mt khi mt im kha ng c c tm thy bng vic so snh mt im
nh vi cc lng ging ca n, th bc tip theo l thc hin iu chnh chi tit
vi d liu ln cn cho v tr, t l, v t l ca cc cong ch yu. Thng tin ny
cho php loi b cc im c tng phn thp hoc c nh v km dc bin.
Thc thi ban u ca hng tip cn ny nh v mt cch n gin
cc im kha v tr v t l ca im mu trung tm. Tuy nhin, gn y
ngi ta s dng mt phng php khc l lm ph hp mt hm bc hai
3D cho cc im mu a phng xc nh v tr ni suy ca im cc i,
v cc th nghim cho thy rng phng php ny mang li s ci tin
ng k cho vic so khp v n nh. Phng php ny s dng php khai
trin Taylor (ti a l dng bc hai) ca hm khng gian t l, D(x,y,), c
thay i nh gc v tr im mu: [5,6,7]

D(x) D

DT
1 2 D
x xT 2 x
x
2
x

S ha bi Trung tm Hc liu i hc Thi Nguyn

(2.12)

http://www.lrc-tnu.edu.vn

40

Trong D v cc o hm ca n c nh gi im mu v

x (x,y, )T l offset t im ny. V tr ca cc tr, x , c xc nh bng


vic ly o hm theo x v thit lp n bng 0, ta thu c:

2 D 1 D
x
x 2 x

(2.13)

Hnh 2.3. Cc giai on la chn cc im kha.


Nhn xt:
(a)

nh gc vi 233189 im nh.

(b)

832 v tr im kha ban u cc im cc i v cc tiu ca

hm Difference-of-Gaussian. Cc im kha c th hin nh cc vect


cho bit t l, hng v v tr.
(c)

Sau khi p dng mt ngng ln tng phn ti thiu, cn li

729 im kha.
(d)

536 im kha cui cng c gi li sau khi p dng mt ngng

cho t l ca cc cong ch yu.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

41

Theo xut ca Brown th ma trn Hessian v o hm ca D c


xp x bng vic s dng cc chnh lch gia cc im mu ln cn. Nu

offset x ln hn 0.5 bt k chiu no, th c ngha l cc tr nm gn vi


mt im mu khc hn. Trong trng hp ny, im mu c thay i v

thc hin php ni suy thay cho im . Offset cui cng x c cng thm
v hng v tr im mu ca n c c s c lng ni suy cho v tr
ca cc tr .

Gi tr hm cc tr, D( x ), c ch cho vic loi b cc cc tr khng n

nh c tng phn thp. C th t c iu ny bng vic th phng


trnh (2.13) vo (2.12), ta c:

1 DT

D(x) D
x
2 x

(2.14)

Thng qua cc th nghim ngi ta nhn thy rng, tt c cc cc tr c

gi tr |D( x )| nh hn 0.03 u c loi b.


Hnh 2.3 cho thy hiu qu ca vic la chn im kha trn mt nh
t nhin. trnh qu nhiu s ln xn, s dng mt nh c phn gii
thp vi 233189 im nh v cc im kha c th hin nh cc vect
cho bit v tr, t l, v hng ca mi im kha (vic gn hng c miu
t sau). Hnh 2.3 (a) th hin nh gc, nh ny c th hin vi tng
phn thp dn cc hnh tip theo. Hnh 2.3 (b) ch ra 832 im kha tt c
cc im cc i v cc tiu c pht hin bi hm Difference-of-Gaussian,
trong khi hnh 2.3(c) ch ra 729 im kha cn li sau khi loi b cc im

c |D( x )| nh hn 0.03. Phn (d) s c gii thch trong mc tip theo.


* Loi b cc p ng bin
i vi tnh n nh, khng loi b cc im kha c tng
phn thp. D v tr dc theo bin c xc nh ti nhng hm Difference-of-

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

42

Gaussian [5,6,7] vn c mt p ng mnh dc theo cc bin v v vy khng


n nh khi c cc lng nh tp nhiu.
nh c xc nh ti trong hm Difference-of-Gaussian s c mt
cong ln ch yu ngang qua bin ngoi tr cong nh hng trc giao.
Cc cong ch yu c th c tnh t ma trn Hessian 22, H, c tnh
v tr v t l ca im kha:
Dxx Dxy

Dxy Dyy

(2.15)

Cc o hm c c lng bng vic ly cc chnh lch gia cc


im mu lng ging.
Cc gi tr ring ca ma trn H tng ng vi cc cong ch yu ca
D. Ly l gi tr ring vi cng ln nht v l gi tr ring vi cng
nh hn. Khi , ta c th tnh tng cc gi tr ring t du vt ca H v
tch ca chng c tnh t gi tr ca nh thc:
Tr(H) = Dxx + Dyy = + ,
Det(H) = DxxDyy (Dxy) = .

(2.16)

Trong trng hp khng chc xy ra l nh thc c gi tr m, cc


cong c cc du hiu khc nhau v vy im b loi b khng phi l mt
cc tr. Ly r l t l gia gi tr ring c cng ln nht v gi tr ring c
cng nh hn, = r. Khi ,

Tr(H)2 ( )2 (r )2 (r 1)2

Det(H)

r 2
r

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

(2.17)

43

Biu thc (r+1)2/r nhn gi tr cc tiu khi hai gi tr ring bng nhau
v n tng cng vi r. V vy, kim tra xem t l ca cc cong ch yu
c di mt ngng r no khng, ta ch cn kim tra:

Tr(H)2 (r 1)2

Det(H)
r

(2.18)

Cc th nghim cho thy s dng gi tr r = 10, s loi b c cc


im kha c t l gia cc cong ch yu ln hn 10. S chuyn tip t
Hnh 2.3(c) sang Hnh 2.3(d) th hin cc tc ng ca thao tc ny.
2.2.3 Gn hng cho cc im kha (Oriented Assignment)
Bng vic gn mt hng thch hp cho mi im kha da trn cc
c tnh nh cc b, b m t im kha c trnh by phn sau c lin
quan ti hng ny v v vy t c s bt bin i vi php quay nh.
gn mt hng cc b cho mi im kha ta s dng hng
gradient ca nh. T l ca im kha c dng la chn nh c lm
trn Gaussian, L, vi t l gn nht, thc hin tt c cc tnh ton theo kiu
bt bin t l. i vi mi mu nh, L(x,y), t l ny, cng gradient,
m(x,y), v hng, (x,y), c tnh ton trc s dng chnh lch gia cc
im nh:
m( x, y ) ( L( x 1, y ) L( x 1, y )) 2 ( L( x, y 1) L( x, y 1)) 2

(2.19)

( x, y ) tan 1 (( L( x, y 1) L( x, y 1)) /( L( x 1, y ) L( x 1, y ))) (2.20)


Mt biu hng c thit lp t cc hng gradient ca cc im
mu trong phm vi mt vng ln cn xung quanh im kha. Biu hng
c 36 bin bao ph 360 ca tt c cc hng. Mi mu c thm vo biu

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

44

c gn trng s bi ln gradient ca n v bi mt ca s hnh trn


Gaussian vi gp 1.5 ln t l ca im kha .
Cc nh trong biu hng tng ng vi cc hng bao qut cc
gradient cc b. Da vo biu hng ta c th xc nh c nh cao nht
trong biu v khi bt k nh cc b no khc nm trong phm vi 80%
so vi nh cao nht u c dng to ra mt im kha vi cng hng
. V vy, i vi cc v tr c nhiu nh c cng tng t nhau, th s
c nhiu im kha c to ra cng v tr v t l nhng cc hng th
khc nhau. Ch c khong 15% im c gn nhiu hng, nhng nhng
im ny gp phn ng k cho tnh n nh ca vic so khp. Cui cng,
mt ng parabol c lm ph hp vi 3 gi tr ca biu gn vi mi
nh nht ni suy v tr ca nh mang li chnh xc tt hn.
2.2.4. B m t nh cc b (Keypoint Description)
Cc thao tc trn gn v tr, t l v hng cho mi im kha.
Cc tham s ny p t cho h ta 2D cc b m t mt vng nh cc
b. Bc tip theo l tnh ton mt b m t cho vng nh cc b c th
bt bin i vi cc thay i cn li nh thay i sng hoc im nhn 3D.

Image gradients

Keypoint descriptor

Hnh 2.4. B m t im kha

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

45

B m t im kha [5,6,7] c to ra bng cch: u tin tnh ton


ln v hng gradient mi im mu trong mt vng xung quanh v tr
im kha, nh hnh bn tri. Cc hng ny c gn trng s bi mt ca
s Gaussian, c biu th bi ng trn ph ngoi. Sau cc mu ny
c gom li thnh cc biu hng tm tt ni dung trn 44 vng con,
c th hin hnh phi, vi chiu di mi mi tn tng ng vi tng
cc cng gradient gn vi hng trong phm vi ca vng .
Hnh 2.4 minh ha cho vic tnh ton b m t im kha. u tin cc
ln v hng gradient nh c ly mu quanh v tr im kha, s dng t
l ca im kha la chn mc m Gaussian cho nh. t n s bt
bin v hng, th cc ta ca b m t v cc hng gradient b quay c
lin quan ti hng ca im kha. thun tin trong vic tnh ton b m t,
cc gradient phi c tnh trc cho tt c cc mc ca hnh chp. Cc
gradient ny c minh ha bi cc mi tn nh mi v tr mu hnh bn
tri ca hnh 2.4.
Hm gn trng s Gaussian vi bng mt na chiu rng ca ca s
b m t c dng gn mt trng s cho cng ca mi im mu.
iu ny c minh ha bng mt ca s hnh trn th hin hnh bn tri
ca hnh 2.4. Mc ch ca ca s Gaussian ny l trnh cc thay i t ngt
trong b m t khi c cc thay i nh v tr ca ca s, v t quan tm n
cc gradient xa v tr trung tm ca b m t.
Hnh bn phi ca hnh 2.4 th hin b m t im kha. N ch n
s thay i ng k cc v tr gradient bng vic to ra cc biu hng
trn 44 vng mu. Hnh ny th hin 8 hng cho mi biu , vi chiu di
ca mi mi tn tng ng vi ln ca mi mc (entry) ca biu .

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

46

trnh tt c cc nh hng bin l iu tht s quan trng, b


m t thay i t ngt v mt mu thay i lin tc t mt biu ny sang
mt biu khc hoc t mt hng ny sang hng khc. V vy, s dng
php ni suy tuyn tnh bc 3 phn b gi tr ca mi mu gradient vo cc
bin biu gn k. Mt khc, mi entry trong mt bin c tng ln nhiu ln
bi trng s l 1 d cho mi chiu, trong d l khong cch ca mu t gi
tr trung tm ca bin c o di dng cc n v ca khong cch bin
biu .
B m t c to nn t mt vect cha cc gi tr ca tt c cc entry
ca biu hng, tng ng vi cc chiu di ca cc mi tn hnh bn
phi ca hnh 2.4. Hnh ny th hin mt mng 44 cc biu vi 8 bin
hng. V vy, mt vect c trng c 448 =128 phn t m t cho mi
im kha.
Cui cng, vect c trng c sa i gim cc tc ng ca s
thay i v sng. u tin, vect c chun ha theo chiu di n v. S
thay i v tng phn ca nh tc l mi gi tr im nh c nhn vi
mt hng s s lm tng cc gradient bi cng hng s , cho nn php
chun ha vect s xa b c s thay i v tng phn. Thay i
sng tc l mt hng s c thm vo mi im nh, iu ny s khng nh
hng n cc gi tr gradient, v gi tr gradient c tnh t cc chnh
lch ca im nh. Bi vy, b m t bt bin i vi cc thay i affine v
sng. Tuy nhin, cc thay i sng phi tuyn tnh cng c th xy ra da
trn s bo ha ca camera hoc da trn cc thay i v s chiu sng m
chng nh hng n cc b mt 3D vi cc hng khc nhau bi cc lng
khc nhau. Cc nh hng ny c th gy nn s thay i ln cc cng
lin quan i vi mt s gradient, nhng t c kh nng nh hng n cc

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

47

hng gradient. V vy, gim c tc ng ca cc cng gradient ln


bng vic ly ngng i vi cc gi tr trong vect n v c trng cho mi
cng l khng vt qu 0.2, sau chun ha li chiu di n v. iu
ny c ngha l vic so khp cc cng i vi cc gradient ln khng cn
quan trng na, v s phn b ca cc hng c tm quan trng rt ln. Gi tr
0.2 c xc nh bng thc nghim s dng cc nh c cc chiu sng
khc nhau cho cng cc i tng 3D.
2.3. Mt s hng ci tin, pht trin thut ton SIFT
2.3.1. Gim s lng keypoint trch xut mi nh
Mt trong nhng hn ch ln ca SIFT l chi ph i snh tp keypoint
kh ln do s lng keypoint trch xut c kh ln. khc phc nhc
im ny ngoi ci thin thut ton i snh th nn gim s lng cc im
keypoint trch xut c.
C th s ti gin tp keypoint theo cc bc:
- Hn ch cc im keypoint m ti bin Gradient bin i khng r
rt, tc l ti bin thin mu sc l nh, cc im ln cn c mc xm
gn tng t nhau. Hn ch nhng im ny khng lm gim tnh c trng
ca tp keypoint do mt trong s cc im ln cn ca n c bin Gradient
bin i r rt hn v c chn lm keypoint s i din tnh c trng cc
b cho im b loi b v im c chn s ng thi tng tnh c trng
cc b.
- Kt hp vi vic d bin nh hn ch cc im keypoint nm gn
bin do cng gn bin s cng d b nh hng bi nhiu v cc php bin i
thng thng. Vic d bin s p dng k thut d bin Candy cho ng
bin mnh v hiu qu.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

48

2.3.2. Dng lc mu loi tr trc cc nh t kh nng tng ng


Trc khi thc hin tm kim trong c s d liu nh ta s dng lc
mu loi cc nh c mu sc qu khc nhau, tc l tnh tng t nhau l
rt t. Cc nh ny s b b qua trong qu trnh tm kim gim chi ph i
snh, tm kim nh tng ng
2.3.3. Trch xut i tng ra khi nh theo i tng mu
Sau khi nhn dng i tng trong nh theo mt i tng mu ta c
th trch xut i tng ra khi nh nh vic iu chnh hng cho tng
cp keypoint so khp cho chng ng b nhau v thc hin d vt theo cc
cht l cc keypoint so khp ln theo bin i tng v thc hin trch
xut c i tng ra khi nh.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

49

Chng 3: CHNG TRNH TH NGHIM


3.1. Bi ton nhn dng i tng
3.1.1. Pht biu bi ton
Cho trc hai bc nh, bc nh th nht cha nhiu i tng, bc nh
th hai ch cha mt i tng duy nht,yu cu xc nh xem trong bc nh
th nht c cha i tng nh trong bc nh th hai khng, xc nh v tr
ca i tng trong bc nh th nht.

(a)

(b)

Hnh 3.1. V d v bi ton nhn dng i tng: xc nh xem i tng


trong nh (b) c trong nh (a) khng?

3.1.2. Cch gii quyt bi ton


T tng ca bi ton nh sau: Cho trc mt nh hun luyn v i
tng cn nhn dng, ta tm trong nh cn xt (gi l nh truy vn) c i
tng hay khng. Bng cch nh gi mc ging nhau ca i tng

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

50

trong nh cho trc vi cc i tng trong nh truy vn. Do cn phi gii


quyt bi ton ny theo cch i snh cc c trng ca nh cho trc vi cc
c trng ca nh truy vn. Thc cht y chnh l mt trng hp c bit
ca bi ton tra cu nh da trn cc c trng c bit no . V cng lu
rng yu t thi gian thc lun c quan tm cho mi bi ton, mc cn
thit ca n ty thuc vo bi ton m ta gii quyt, yu t ny quyt nh s
thnh cng hay tht bi ca nhiu bi ton.
M hnh chung ca bi ton nhn dng i tng nh sau:

nh u vo

nh hun luyn

Trch chn c trng:


Bt bin

Trch chn c trng:


Bt bin

So snh tng t

nh kt qu (nh c khoanh
vng i tng cn nhn dng)

Hnh 3.2. M hnh chc nng nhn dng i tng

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

51

Nh vy, bi ton nhn dng i tng bng k thut X l nh gm


ba bc chnh:
- Xc nh v trch chn cc c trng ca hai nh mt cch c lp.
- nh gi tng t ( ging nhau) ca i tng trong hai nh da
vo vic so khp cc c trng c trch chn.
- Phn tch xc sut thc hin xc minh cui cng.
y chnh l mt bi ton ln trong lnh vc nhn dng v th gic my.
3.2. Chng trnh ci t th nghim
3.2.1. Ci t chng trnh
Chng trnh c vit bng ngn ng Visual C# 2008, chy trn h
iu hnh Windows 7 32bit, my tnh tc Core i5 2.53 GHz, b nh 4GB
RAM. Chng trnh c cc chc nng sau:
- Cho php ngi s dng la chn nh truy vn v nh cha i tng
cn nhn dng Khoanh vng i tng cn tm trn nh cha i
tng nhn dng.
- Hin th kt qu nhn dng.
- ng dng vic trch chn c trng vo vic tm nh
3.2.2. Kt qu thc nghim
Thc hin ci t th nghim phng php SIFT trch chn c trng
bt bin, sau s dng RANDSAC so khp nhn dng. Bc u vi
mt s kt qu sau:

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

52

(a)

(b)

(c)
Hnh 3.3.
Kt qu nhn dng ca nh cha nhiu i tng c hun luyn.
(a) nh truy vn cha nhiu i tng;
(b) nh hun luyn;
(c) Kt qu nhn dng.
Hnh 3.3 th hin kt qu nhn dng i tng, nh (a) cc i tng
c thu nhn trn mt nn tng i r rng nn vic trch chn v so khp
c trng c tin hnh khng my kh khn v chnh xc tng i cao,
hn na gc nhn ca i tng cn nhn dng trong c hai ging nhau ch
khc nhau v t l.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

53

(a)

(b)

(c)

Hnh 3.4. Kt qu nhn dng i tng b che khut mt phn.


(a) nh truy vn cha nhiu i tng;
(b) nh cha i tng cn nhn dng;
(c) Kt qu nhn dng.
Hnh 3.4 th hin mt v d khc v nhn dng i tng, i tng
cn nhn dng trong c hai nh c s khc nhau i cht v gc nhn, hn na
nh truy vn li cha qu nhiu i tng, c thu nhn trn mt nn khng
r rng nn s c rt nhiu c trng c tm thy nh (a) v vy vic so
khp c trng s mt nhiu thi gian hn v s lng cc so khp khng
chnh xc cng tng ln.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

54

* Nhn xt:
Thut ton ny c nh gi l kh hiu qu trong vic trch chn c
trng phc v cho vic nhn dng i tng, c bit khi cc nh c thu
nhn c t l khc nhau hoc cc i tng trong nh c t cc gc nhn
khc nhau. Tuy nhin trong qu trnh ci t thut ton vn cha x l c
trng hp i tng cn nhn dng b che khut mt s b phn hoc b thay
i gc nhn, t l qu ln.

Hnh 3.5. Khng nhn dng c i tng

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

55

PHN KT LUN

Mt trong nhng hng tip cn nhn dng i tng hiu qu v


ang c nhiu nhm nghin cu ch gn y l da vo cc c trng
bt bin ca i tng. Lm sao c th nhn dng chnh xc c i tng
trong nh cho d i tng c s bin i i cht v hnh thc, s thay
i v t l thu nhn nh, i tng cn nhn dng b che khut mt phn bi
cc i tng khc hay cc bin i khc l mt vn rt c ngha. Xut
pht t thc t lun vn tm hiu v cc phng php pht hin c
trng bt bin m nn tng l da vo cc im bt ng, k thut SIFT p
dng cho bi ton pht hin v nh du i tng,v ng dng ca chng
trong nhn dng.
Kt qu t c:
Trong qu trnh nghin cu ti liu v thc hin lun vn di s nh
hng ca thy gio hng dn, lun vn t c mt s kt qu nh sau:
- Trnh by khi qut v x l nh, cc giai on ca x l nh s v cc
vn trong pht hin v nh du i tng.
- Trnh by l thuyt v im bt ng v cc c trng bt bin ca i
tng, vai tr, c im; l thuyt c bn ca thut ton SIFT cng nh cc
bc tin hnh; mt s hng ci tin, pht trin thut ton SIFT.
- Trnh by ng dng nhn dng i tng nh da vo cc c trng bt
bin c xy dng t cc im bt ng, ci t th nghim thnh cng k
thut SIFT trnh by chng 2 trong trng hp cc nh c s khc nhau
v t l, gc nhn v cc i tng trong nh b che khut mt s b phn
khng ng k.

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

56

- Ngoi ra, trong qu trnh nghin cu ti cng t tch ly thm cho mnh
cc kin thc v ton hc, v k thut lp trnh,V quan trng l rn luyn
k nng thc hin mt nghin cu khoa hc. Tuy mi ch l bc u,
nhng nhng kt qu ny s gip ch cho ti trong nhng nghin cu sau ny
thu c nhng kt qu tt hn.
Mt s vn cn tip tc gii quyt:
- Cc nh c thu nhn c s khc nhau ng k v t l, gc nhn, i
tng cn nhn dng b che khut kh nhiu.
- nh cha cc i tng cn nhn dng b thay i sng, tng
phn.Cc nh chu php bin i affine ln.
Trong qu trnh thc hin lun vn tt nghip, bn thn ti cng rt
n lc, c gng, u t nhiu thi gian, cng sc cho vic tm hiu nghin cu
ti di s nh hng tn tnh ca thy gio PGS.TS. Nng Ton. Tuy
nhin, do hn ch v mt kin thc ca bn thn, thi gian cng nh cc
ngun ti liu, nn lun vn cha c hon ho, cn nhiu thiu st. Knh
mong cc thy c gio cng nh cc bn ng nghip ch bo v gip .

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

57

TI LIU THAM KHO


[1]

Nng Ton, Phm Vit Bnh, X l nh, i hc cng ngh thng


tin & Truyn Thng.

[2]

Lng Mnh B, Nguyn Thanh Thy, 1999, Nhp mn X l nh s, Nh


xut bn Khoa hc v K thut, H Ni.

[3]

Nguyn Quang Hoan, 2006, X l nh, Hc vin bu chnh vin thng.

[4]

Hng Tn, Nguyn Th Thanh H 2003, Cc nh l im bt ng,


i hc s phm H Ni.

[5]

Brown M. and Lowe D.G 2002, Invariant features from interest point
groups, In The 13th British Machine Vision Conference, Cardiff
University, UK.

[6]

David Lowe, 1999, The SIFT (Scale Invariant Feature Transform) Detector
and Descriptor, University of British Columbia.

[7]

http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

[8]

http://opencv.willowgarage.com/wiki/

[9]

http://en.wikipedia.org/wiki/Computer_vision

S ha bi Trung tm Hc liu i hc Thi Nguyn

http://www.lrc-tnu.edu.vn

You might also like