Professional Documents
Culture Documents
동영상의 객체 기반 이종정보를 활용한 관광 이벤트 분류
동영상의 객체 기반 이종정보를 활용한 관광 이벤트 분류
Event classification using object-based multi-modal data from Youtube tourism videos
요 약
807
2021년 한국소프트웨어종합학술대회 논문집
2.3 LightGBM
기존 트리 알고리즘은 수평적(level-wise)으로 확장을 하는
반면, LightGBM은 수직적(leaf-wise)으로 확장하는 차이점이
있다. 결정 트리가 수직적으로 확장함으로써 연산량과 정보 그림 1 동영상 객체 검출 및 카테고리 분류 모델
808
2021년 한국소프트웨어종합학술대회 논문집
카테고리의 결과에 대한 평균값을 계산했을 때 75.7%의 성능을 신경망을 이용하였다. 실험 결과 가공되지 않은 동영상
보였다. 표2에서 굵게 표시된 것은 단일 카테고리에서 더 우수한 데이터를 사용한 분류 모델보다 객체 기반의 모델이 더 우수한
성능을 보인 모델을 나타낸다. 성능을 보였다. 인간이 판별할 수 있는 객체를 추출해서 분류에
사용하는 방식이 더 좋다고 할 수 있다. 또한 단일 모델의 분류
표 2 테스트 셋에 대한 객체 기반의 앙상블과 단일 모델의 성능보다 서로 다른 모델을 결합한 앙상블 모델의 성능이
분류 성능 비교 우수했다. 하지만 데이터 셋에 불균형 문제가 있어 좋은 성능을
단일 모델 앙상블 모델 내는데 한계점이 있었다. 향후 연구에서는 추가적으로 학습
지역 45.36% 48.36% 데이터를 수집하여 데이터 불균형 문제를 완화시키고, 딥러닝
인종 93.35% 93.85% 네트워크를 적용하여 성능을 향상시킬 계획이다.
연령대 86.58% 87.47% 결론적으로 본 논문에서 제시한 관광 이벤트 분류 모델을
객체 기반의 모델과 가공되지 않은(raw) 동영상 데이터를 feature representations from imbalanced data." IEEE
사용한 분류 모델의 성능은 표 3과 같다. 가공되지 않은 동영상 transactions on neural networks and learning systems
Convolution Network)[6]를 사용했으며 2차원 합성곱 필터를 [6] Carreira, Joao, and Andrew Zisserman. "Quo vadis, action
3차원으로 확장하여 만든 망으로 2차원 필터의 사전 학습된 recognition? a new model and the kinetics dataset."
가중치를 가져올 수 있다는 장점이 있다. 객체 기반의 모델의 proceedings of the IEEE Conference on Computer Vision
4. 결 론
본 논문은 동영상으로부터 추출된 이종 정보 객체 기반의
모델과 가공되지 않은 동영상 데이터를 사용한 분류 모델의
분류 성능을 비교하였다. 객체 기반의 모델은 3가지의 부스팅
알고리즘을 적용했으며 단일 모델과 앙상블 모델 간의 성능을
비교하였다. 가공되지 않은 동영상 기반 모델은 3차원 합성곱
809