Professional Documents
Culture Documents
Project Status5
Project Status5
• 분류 문제의 경우, 마지막에 softmax를 취해서 각 클래스에 해당할 확률의 합이 1이 되게끔 처리를 해준다
얼굴 인식에서 DCNNs를 훈련시키기 위한 두가지 방법이 있지만, 각각의 단점을 가지고 있다.
1. 두 데이터 간의 각도(angular) 정보 넣기
: 두 feature를 dot product를 한 뒤(cosine similar), 이를 arc cosine 함수를 통해서 데이터 간의 각도 정보를 유도
2. Angular margin 추가
: 얻은 각도에 angular margin을 추가하고, cosine 함수를 통해서 목표 logit을 추출
3. Resclae 및 softmax 적용
: 모든 로짓을 고정된 feature norm 에 따라 re-scale 하고, 그 로짓을 기반으로 softmax loss 를 수행
ArcFace의 장점
1. Engaging : 정규화된 하이퍼파라미터에서 각도와 호 사이의 정확한 일치성을 통해 geodesic distance margin을 직접 최적화한다.
2. Effective : 대규모 이미지와 비디오 dataset을 포함한 10개의 얼굴인식 benchmark 에서 SOTA 성능을 나타낸다.
3. Easy : 구현하기 쉬우며, Sphereface 연구들과 다르게, 안정적인 성능을 가지기 위해 다른 손실함수와 결합하여 사용할 필요가 없다.
4. Efficient : 계산 복잡도가 무시할 정도이다.
II. Proposed Approach
Proposed Approach
Softmax Loss
: 가장 널리 사용되는 분류 손실 함수
𝑁 𝑊𝑦𝑇𝑖 𝑥𝑖 +𝑏𝑦𝑖
1 𝑒
𝐿1 = − log
𝑁 𝑛 𝑊𝑗𝑇 𝑥𝑖 +𝑏𝑗
𝑖=1 σ𝑗=1 𝑒
- Feature embedding이 클래스 내에 sample들이 높은 유사성을 가지도록, 다양성을 가지도록 최적화 되어있지 않다.
- 따라서, 이미지의 차이가 큰 상황(연령, 포즈의 다양성)이나, 대규모 테스트 시나리오가 존재하는 상황에서 성능의 차이를 보인다.
수식 변형
1) bias = 0
단점을 보완하기 위한 수식 변형 2) 𝑊𝑗𝑇 𝑥𝑖 = 𝑊𝑗 𝑥𝑖 𝑐𝑜𝑠 𝜃𝑗
3) 𝑊𝑗 = 1
4) 𝑥𝑖 → 𝑠 (re-scale)
Proposed Approach
변형된 수식
𝑁
1 𝑒 𝑠 cos 𝜃𝑦𝑖
𝐿2 = − log 𝑠 cos 𝜃
𝑁 𝑒 𝑦𝑖
+ σ 𝑛
𝑗=1,𝑗≠𝑦 𝑒 𝑠 cos 𝜃𝑗
𝑖=1 𝑖
수식 의미
1) 𝜃 ∶ angle between the feature and the weight
2) 𝑠 : with a radius of s, embedding features are distributed on a hypersphere.
4) 𝜃에 margin 추가
cos 취함
1) x, W 정규화 5) s를 곱함
2) 두 feature의 dot product를 한 뒤,
cosine 유사도 cos 𝜃𝑗 (Logit)을 구함
Proposed Approach
Comparison with SphereFace and CosFace