Professional Documents
Culture Documents
동해안 너울성 파도 예측을 위한 머신러닝 모델 연구
동해안 너울성 파도 예측을 위한 머신러닝 모델 연구
요 약
최근 들어 동해안에서 너울성 파도에 의한 손실이 빈번히 발생하고 있다. 너울성 파도는 다양한 요인들이
결합되어 발생하기 때문에 예측이 어렵다. 본 연구에서는 머신러닝 기술에 기초하여 동해안에서 너울성 파도
의 발생을 예측하는 모델을 제안하였다. 모델 개발을 위해 포항 신항의 하역중단 데이터 및 신항 부근의 기압,
풍속, 풍향, 수온 등의 기상자료를 수집하였다. 수집한 데이터로부터 너울발생에 중요한 영향을 미치는 변수들
을 선별하였으며, 모델 개발을 위해 다양한 머신러닝 예측 알고리즘들을 테스트 하였다. 그 결과 조위, 수온,
기압이 너울 발생 예측을 위한 주요 변수로 확인이 되었고, Random Forest 모델이 가장 우수한 성능을 보였
으며. 모델의 예측 정확도는 88.6%이다.
Abstract
In recent years, damage and loss of life and property have been occurred frequently due to swelling waves in the
East Sea. Swelling waves are not easy to predict because they are caused by various factors. In this research, we
build a model for predicting the swelling waves occurrence in the East Coast of Korea using machine learning
technique. We collect historical data of unloading interruption in the Pohang Port, and collect air pressure, wind
speed, direction, water temperature data of the offshore Pohang Port. We select important variables for prediction, and
test various machine learning prediction algorithms. As a result, tide level, water temperature, and air pressure were
selected, and Random Forest model produced best performance. We confirm that Random Forest model shows best
performance and it produces 88.86% of accuracy
Keywords
swell, machine learning, classification algorithm, prediction model, accuracy
* 단국대학교 데이터사이언스학과 ž Received: Jul. 11, 2019, Revised: Aug. 12, 2019, Accepted: Aug. 15, 2019
- ORCID: http://orcid.org/0000-0002-7401-2042 ž Corresponding Author: Sejong Oh
** 단국대학교 소프트웨어학과 교수(교신저자) Dept. of Software Science, Dankook University, Korea
- ORCID: http://orcid.org/0000-0002-9365-274X Tel.: +82-31-8005-3222, Email: sejongoh@dankook.ac.kr
12 동해안 너울성 파도 예측을 위한 머신러닝 모델 연구
Ⅰ서. 론 Ⅱ 관련 연구
.
Ⅲ 예측 모델의 개발
. 예측모델 개발을 위한 자료의 수집은 국립 해양
조사원 바다누리 해양정보 서비스(htt://www.khoa.go.
3.1 예측변수와 설명 변수 kr/oceangrid/khoa/intro.do)에서 제공하는 포항신항의
파랑 관측 데이터를 이용하였다. 수집한 포항 신항
본 연구에서는 예측 모델의 개발에 있어서 그림 항외 데이터는 조위( 潮位
; 조수의 흐름에 따라 변화
1 과 같이 일반적인 머신러닝 모델 개발 절차를 따 하는 해수면의 높이), 기압, 풍속, 풍향, 수온 데이
랐다. 먼저 모델 개발의 기본 자료가 되는 데이터를 터이며 각 데이터는 자정을 기준으로 1분 간격으로
수집하고 모델 개발에 적합하도록 데이터를 전처리 측정된다. 포항 조위관측센터의 위치는 위도 129.3838,
한다. Down sampling과 데이터 표준화를 전처리 과 경도 36.04713 에 위치해 있으며 포항 신항 서북쪽
정에서 시행한다. 그 다음으로 Fisher Score와 mRMR 에 위치해 있다. 포항 조위 관측센터에서는 영일만
을 이용하여 예측에 도움이 되는 변수들을 선별 부근 항외 해양 수면의 환경을 관측하기 위해 HF
한 뒤, 다양한 머신러닝 알고리즘을 이용하여 예측 (High Frequency)-Radar 시스템을 이용해 영일만의
모델을 수립한다. 각 예측모델의 성능을 비교하여 광역해수유동 정보를 측정하고 있다.
가장 좋은 모델을 확정한다.
표 1. 설명변수 리스트
본 연구에서 개발한 예측 모델의 예측 변수는 너
울의 발생 여부이다. 너울의 발생 여부는 선박의 하
Table 1. Variable lsit of wave observation
Group Variable Description
역중단 기록을 근거로 판단하였다. 담당자의 설명에
TL_Mean mean of TL
의하면 하역중단이 발생하는 대부분의 원인은 너울 TL_SD s.d. of TL
의 발생에 의한 것이고, 하역이 정상적으로 진행된 TL TL_CV variance of TL
(Tide Level) TL_Min min of TL
것은 너울이 발생하지 않은 것이다. 하역중단 자료
社 TL_Max max of TL
는 포스코 에서 수집한 자료를 승낙을 받고 사용 TL_Range difference of TL
하였는데, 2014년 1월 4일부터 2017년 12월 27일까 AP_Mean mean of AP
지 4년 동안의 기록을 포함한다. 하역이 중단된 시 AP_SD s.d. of AP
AP AP_CV variance of AP
간대를 기록한 자료를 바탕으로 1시간 단위로 너울
(Air Pressure) AP_Min min of AP
의 발생 여부를 예측변수로 사용하였다. AP_Max max of AP
AP_Range difference of AP
WS_Mean mean of WS
WS_SD s.d. of WS
WS WS_CV variance of WS
(Wind Speed) WS_Min min of WS
WS_Max max of WS
WS_Range difference of WS
WD_Mean mean of WD
WD_SD s.d. of WD
WD WD_CV variance of WD
(Wind Direction) WD_Min min of WD
WD_Max max of WD
WD_Range difference of WD
WT_Mean mean of WT
WT WT_SD s.d. of WT
(Water WT_CV variance of WT
그림 1. 예측모델 개발 절차 Temperture) WT_Mi n min of WT
WT_Max max of WT
Fig. 1. Development process of prediction model WT_Range difference of WT
14 동해안 너울성 파도 예측을 위한 머신러닝 모델 연구
3.3 변수 선택 WT_Max ●
WT_Range ●
저자소개
강 동 훈 (Donghoon Kang)
2016년 2월 : 아주대학교 미디어
학과(공학사)
2017년 2월 ~ 현재 : 단국대학교
데이터사이언스 학과 석사과정
관심분야 : 데이터 마이닝,
머신러닝
오 세 종 (Sejong Oh)
1989년 2월 : 서강대학교
컴퓨터학과(공학사)
1991년 2월 : 서강대학교
컴퓨터학과(공학석사)
20011년 8월 : 서강대학교
컴퓨터학과(공학박사)
2003년 9월 ~ 현재 : 단국대학교
소프트웨어학과 교수
관심분야 : 데이터베이스, 데이터 마이닝, 머신러닝