Professional Documents
Culture Documents
07 SVMs
07 SVMs
Hỗ TrợVectorMáy
&Hạt nhân
Thực hiện rất tốt với các bề mặt quyết định tuyến tính
Đề cương
n Dự đoán@on
n Whymightpredic@onsbewrong?
n hạt nhân
Tại saoMightPredic@onsbeWrong?
• Thuyết quyết định Truenon
– Flipabiasedcoin–
p(ngửa)= θ
– Es@mate θ
– Dothebestyoucaninexpecta@on
Machine Translated by Google
Tại saoMightPredic@onsbeWrong?
• Khả năng quan sát được
– N-bitparityproblem
• x chứaN-1bits(hardPO)
• x containsNbitsbutlearnerignoressomeofthem(soWPO)
• Noiseintheobserva@on x
– Lỗi đo lường
Tại saoMightPredic@onsbeWrong?
• Thuyết quyết định Truenon
Re Presenta@onalBias
0
x x2
Machine Translated by Google
Hỗ TrợVectorMáy
thuyết–
inprac@ce
MinorNota@onChange
Tobe`ermatchnota@onusedinSVMs
Không đậm
tôi là instancelabel
y(tôi) ừ biểu thị vô hướng
9
Machine Translated by Google
luyện x 2 Rd+1, x0 = 1
y 2 {1, 1}
Nhớ lại:
Intui@ons
Machine Translated by Google
Intui@ons
Machine Translated by Google
Intui@ons
Machine Translated by Google
Intui@ons
Machine Translated by Google
Tiếng ồn trongObserva@ons
Machine Translated by Google
lề
Machine Translated by Google
là có ít mô hình hơn
lớn, sau đó lỗi đào tạo thấp có khả năng xảy ra bằng
chứngoflowgeneraliza@onerror
23
Machine Translated by Google
Alterna@veViewofLogis@cRegression
1
h (x) = h (x) = g(z)
1 + e Tx
z = Tx h (x) = g(z)
z = Tx
y = 0 , chúng
Nếu y = 0 tôi muốn h
h (x)
(x) 0
0, Tx 0
24
Dựa trênslidebyAndrewNg
Machine Translated by Google
AlternateViewofLogis@cRegression
Ví dụ chi phí: yi log h (xi) (1 yi) log (1 h (xi)) h
(x) = g(z)
1
h (x) z = Tx
= 1 + e Tx
y = 1 Tx 0
y = 0 Tx 0
25
Dựa trênslidebyAndrewNg
Machine Translated by Google
Logis@cRegressiontoSVM
Logis@cHồi quy:
N d
phút
X [yi log h (xi) + (1 yi) log (1 h (xi))] +
2 X 2
j
tôi=1 j=1
Hỗ trợVectorMachines:
N d
1
phút
CX [yicost1( |xi) + (1 yi) cost0( |xi)] +
2X
2
j
tôi=1 j=1
1
Bạn có thể nghĩ C tương tự như vậy
26
Machine Translated by Google
Hỗ trợVectorMáy
N d
1
phút
CX [yicost1( |xi) + (1 yi) cost0( |xi)] +
2 X j
2
tôi=1 j=1
y = 1
-1 1 -1 1
27
Dựa trênslidebyAndrewNg
Machine Translated by Google
Hỗ trợVectorMáy
N
1 d
phút
CX [yicost1( |xi) + (1 yi) cost0( |xi)] +
2 X 2
j
tôi=1
y=1/0 j=1
y=+1/-1
với C = 1
d d
1 1
phút 2
2X
2
j=1
j phút
2 X j
j=1
1 st |xi 1 nếu yi = 1 nếu yi = 1
st yi( |xi) 1
1 |xi 1 nếu yi = 1 nếu yi = 1
28
Machine Translated by Google
|x = 1 |x = 1
Machine Translated by Google
Hỗ trợVector
|x = 1 |x = 1
Machine Translated by Google
C rất lớn
x2
x1
31
Dựa trênslidebyAndrewNg
Machine Translated by Google
v v
2
bạn
bạn 2
kuk2 = chiều dài(u) 2 R
θ + u2
= qu2 1 2
P
v bạn
1 1
u|v = v|u
= u1v1
= u1v1 +
+ u2v2
u2v2
= kuk2
= kuk2 kvk2
kvk2 cos
cos
= pkuk2
= pkuk2 trong
trong đó
đó p
p =
= kvk2
kvk2 cos
cos
32
Dựa trên ví dụ của Andrew Ng
Machine Translated by Google
x
|x = k k2 kxk2 cos
| }
θ
{z
= pk k2
θ
P
33
Dựa trên ví dụ của Andrew Ng
Machine Translated by Google
Dựa trên ví dụ của Andrew Ng
θ
-θ
θ
-θ
k k2 phải k k2
Vì p nhỏ nên pk k2 Vì p lớn hơn
1
(hoặc<-1)belargetohave để có nên pk canbesmaller(hoặ
k2 1
Machine Translated by Google
P
Vì thế,
1
p =
k k2
-θ
θ 2
lề = 2p =
k k2
lề
35
Machine Translated by Google
Vấn đềSVMDual
Vấn đề SVM nguyên thủy đã được đưa ra
d
1
2
phút
2 X j
j=1
st yi( |xi) 1 8i
36
Machine Translated by Google
Vấn đềSVMDual
• TheLagrangianisđược tặng bởi
d N
1
2 i(yi |x 1)
L( , ) =
2 X j X
j=1 tôi=1
st i 0 8i
• Atop@malsolu@on,par@alsw.rt θ'sare0
và chúng ta có được...
37
Machine Translated by Google
SVMDualRe Presenta@on
N N N
1
Tối đa hóa
J( ) =X tôi
2 X X i jyiyj hxi, xj tôi
tôi=1 tôi=1 j=1
st i 0 8i
X iyi = 0
Tôi
Thedecisionfunc@onisgivenbởi
h(x) = ký hiệu X
i2SV iyihx, xii + b !
1
1
trong đó b =
|SV| i2SV
X X jyj hxi, xj tôi
j2SV
0 @yi MỘT
38
Machine Translated by Google
st i 0 8i
X iyi = 0
Tôi
39
Machine Translated by Google
st i 0 8i
X iyi = 0
Tôi
Intui@vely,chúng ta nên cẩn thận hơn xung quanh các điểm gần lề
40
Machine Translated by Google
st i 0 8i
X iyi = 0
Tôi
Inthesolu@on,hoặc: yi( |
xi)=1 Øpointisasupportvector
• αi >0andtheconstraintis@ght()
• αi =0
41
Machine Translated by Google
Tuyển dụngSolu@on
• Giventheop@malalsolu@on α*,op@malweightsare
? = X ? yixi
tôi
i2SV
• Vì vậy, chúng ta có thể giải quyết một trong những ràng buộc SV
yi( ? · xi + 0)=1
42
Machine Translated by Google
WhatifDataKhông thể
st
• Không thể tìm thấy θ thatsa@sfies yi( |xi) 1 8i
d
• Vấn đề mới:
1
2
phút X 2
j + CX tôi
j=1 Tôi
st yi( |xi) 1 i 8i
Machine Translated by Google
quả với ít phiên bản đào tạo· Tìm mô hình tốt nhất
ồ ôi
ồ ồ ồ
ồ ồ ồ
X X X
ồ ồ
ồ X ồ
ồ
X X ồ
ồ
ôi ồ
Hình ảnh từh`p://www.atrandomresearch.com/iclass/
Machine Translated by Google
0 x x2
Machine Translated by Google
: X7! Xˆ = (x)
hạt nhân
• Hữu íchinvisualpa`ernrecogni@on
– Ví dụ: •
TheKernelTrick
”
“Givenanalgorithmwhichiscomulatedintermsofa
ØSVMscanusethekerneltrick
Machine Translated by Google
Incorpora@ngKernelsintoSVM
N
1 N N
J( ) =X tôi
2 X X i jyiyj hxi, xj tôi
tôi=1 tôi=1 j=1
st ai 0 8i
XN iyi =1 0 N N
J( ) =XTôi tôi
2 X X i jyiyjK(xi, xj )
tôi=1 tôi=1 j=1
st ai 0 8i
X iyi = 0
Tôi
53
Machine Translated by Google
K(xi, xj ) = exp 22 •
kxi xjk2 2
– Giá trị giảm xuống 0 trong khoảng cách ngày càng tăng
– Lưu ý: Cần thực hiện tính năng chia tỷ lệ trước khi sử dụng GaussianKernel
-3 -3 -3
-1 5 -1 5 -1 5
1 0 1 0 1 0
3-5 3-5 3-5
GaussianKernelVí dụ
`1
`2
K(xi, xj ) = exp kxi 2xjk2
22 •
= [0,5, 1, 1, 0]
`3
GaussianKernelVí dụ
`1
`2
K(xi, xj ) = exp kxi 22 •2
xjk2
x1
= [0,5, 1, 1, 0]
`3
GaussianKernelVí dụ
`1
`2
K(xi, xj ) = exp kxi 22 •2
xjk2
= [0,5, 1, 1, 0]
`3 x2
GaussianKernelVí dụ
`1
`2
K(xi, xj ) = exp kxi 22
xjk2• 2
= [0,5, 1, 1, 0]
`3
– SVM với hạt nhân asigmoid tương đương với nhận thức 2 lớp
– Lựa chọn phổ biến để đo lường độ tương tự của tài liệu văn bản
– Định mức L2dự ánvectơtrên các đơn vịhình cầu;sản phẩm chấm
của chúng là cosin của góc giữa các vectơ
59
Machine Translated by Google
– Dataisassumedtobenon-nega@ve,oWenwithL1 Normof1
• Hạt chuỗi
• Hạt cây
• Hạt đồ thị
60
Machine Translated by Google
Ngoài ra:TheMathBehindKernels
– Posi@vesemi-definitematrix:
zTGz ≥0foreverynon-zerovector z 2 Rn
Xây dựng “kernel-hood” từ nguyên tắc đầu tiên không hề tầm thường
Machine Translated by Google
AFewGoodKernels...
• Hạt nhân tuyến tính K(xi, xj ) = hxi, xj i
d
• Hạt nhân đa thức K(xi, xj )=(hxi, xj i + c)
– c ≥0tradesoffinfluenceoflowerorderterms
Nhiều hơn
Applica@on:Automa@cPhotoRetouching
(Leyvandetal., 2008)
Machine Translated by Google
d
ví dụ,
K(xi, xj )=(hxi, xj i + c)
K(xi, xj ) = exp
22 •
kxi xjk2 2
64
Machine Translated by Google
Mul@-ClassClassifica@onwithSVMs
y 2 {1,...,K}
• ManySVMpackagesalreadyhavemul@-classclassifica@onbuildin
– Đào tạo K SVM, từng lớp chọn từ phần còn lại, (1)
Dựa trênslidebyAndrewNg 65
SVMsvsLogis@cRegression
Machine Translated by Google
n =#trainingexamples d =#features
Mạng lưới thần kinh có khả năng hoạt động tốt trong hầu hết
OtherSVMVaria@ons
• nuSVM
Frac@onofsupportvectors(lowbound)andmisclassifica@onrate(upperbo
SVsandtrainingerrorrateis≤5% –
Hardertoop@mizethanC-SVMandnotasscalable
• SVMsforregression
• SVM một lớp
67
Machine Translated by Google
– Needtochoosethekernel(andtuneitsparameters)