You are on page 1of 122

기본연구보고서 19-07 www.keei.re.

kr

국제유가 변동성 예측과


유가 확률분포 추정

| 서유정ㆍ조철근 |
참여연구진

연구책임자 : 부연구위원 서유정

연 구 위 원 조철근

연구참여자 : 전 문 원 오은주

위촉연구원 정진영
<요 약>

1. 연구의 필요성 및 목적

금융자산이나 상품(commodity) 가격 변동성의 측정 및 예측은 경제


학에서 중요한 연구 분야로 자리매김하였다. 거시경제학에서도 2008년
글로벌 금융 위기(Global Financial Crisis) 이후 불확실성이 거시경제
에 미치는 영향에 대한 연구가 늘어나고 있는 추세이며 특히 변동성의
변화(time-varying variance)가 경제에 영향을 미치는 다양한 채널들이
학계의 주목을 받고 있다.
본 연구의 주제인 WTI(West Texas Intermediate) 원유의 가격 변동
성은 세계경제의 불확실성을 나타내는 다양한 지표들 중 하나이자 수
많은 경제주체들의 의사결정에 직접 영향을 주는 요인이다. 이에 대한
예로 유가하락 위험회피를 위해 옵션 등을 이용한 헷징을 시도하려는
미국 셰일원유 생산업자들을 생각해 볼 수 있다. 셰일원유 생산업자의
헷징 수요는 가격이 심하게 하락할 가능성이 클수록 높아질 것인데 이
들이 만약 미래 유가의 분포를 보다 잘 예측할 수 있다면 현 시점에서
보다 나은 의사결정을 내릴 수 있을 것임을 쉽게 알 수 있다. 보다 정
확한 유가변화 확률분포가 주어지면 미래 특정기간 동안 유가가 임의
의 범위 내에 있을 확률을 계산할 수 있게 되고 이를 기반으로 지금
결정하는 의사결정의 경제적 가치를 보다 정확하게 평가할 수 있기 때
문이다.
본 연구에서 주목하는 변동성 예측의 필요성과 가치는 바로 정확한

요약 i
변동성 예측을 통한 유가변화 확률분포 예측 정확도 제고에 있다. 추
정된 예측확률분포는 위에서 예로 든 원유 생산업자의 헷징 의사결정
에서 뿐만 아니라 구매시기가 유동적인 원유 실수요자의 구매계획 수
립, 원유관련 파생상품 금융투자자의 투자결정 등에 유용한 정보를 제
공할 수 있을 것으로 기대된다.
보다 정확한 변동성 전망은 이론적으로 엄밀한 변동성의 정의 및 이
에 대한 적절한 측도에 기초해야 함은 두 말할 필요가 없을 것이다.
2000년대 이후로 학계에서는 고빈도 데이터를 기반으로 한 변동성 측
정과 예측이 주목을 받고 있는데 본 보고서에서도 이러한 대용량 고빈
도 데이터를 이용하는 방법론을 채택하여 WTI 선물가격의 변동성을
예측하는 모형을 제시하고 이를 기반으로 미래기간 중의 유가변화 확
률분포를 추정하는 것을 연구의 목표로 한다.

2. 연구 내용

본 연구는 미국 WTI 선물가격 변동성 및 그 가격 변화의 확률분포


예측에 관한 것이다. WTI 최근월물 선물가격의 고빈도(high
frequency) 거래데이터를 이용하여 각 거래일마다 5분 간격 가격변화
율을 계산하였고 이를 기반으로 Realized Variance(RV), Realized
Semivariance(RS) 등 주요 변동성 측도들을 계산하였다.
미래기간 동안의 변동성을 설명하는 변수들을 찾아내기 위해 과거
변동성 측도들 및 추가적인 외생변수들을 설명변수로 이용한 변동성
설명 회귀분석(In-sample 분석)을 수행하였다. 다수의 과거 변동성 설
명변수들은 예측시계(1일, 1주 및 1개월)에 관계없이 모두 미래 변동

ii
성에 대한 유의한 설명력을 보였다.
이에 반해, 각 외생변수의 변동성 설명력은 예측시계에 따라 차별화
되어 나타났다. OPEC 여유 생산능력은 모든 시계에서 유의하게 변동
성을 설명하였으나 특히 향후 1개월 변동성 예측에서 유의성이 크게
나타났다. 선물유가 선도곡선(이하 forward curve)의 Backwardation1)
및 Contango를 측정하는 변수들도 미래의 변동성에 대한 설명력을 보
였는데 Contango 정도는 모든 시계에서 유의한 반면 Backwardation
정도는 1일 및 1주 후 변동성 예측에서 유의성이 관찰되었다. 주식시
장의 변동성 기대지수인 VIX도 미래 유가 변동성을 유의하게 설명하
는 것으로 나타났는데 이는 석유시장 변동성과 주식시장 변동성 간의
연관성을 시사한다. 투기적 투자자들의 포지션 관련 변수들과 중동지
역 지정학 리스크 등은 변동성 예측에 유의한 추가적 설명력을 보이지
않았다. 불확실성 전망 지수들 중에서는 실물부문 불확실성 지수가 모
든 시계에서 유가 변동성에 영향을 미치는 것으로 나타났다.
본 연구는 상기의 분석 결과를 기초로 Good/Bad 변동성 변수가 포
함된 HAR-RS 모형에 설명력이 높은 일부 외생변수를 추가한
HAR-RS-X2 모형을 변동성 예측모형으로 선택하였다. 다음으로, 동
모형을 Maheu and McCurdy(2011)의 방법론에 접목시킴으로써 유가
변화 확률분포를 예측하였다. 확률분포는 향후 1일, 1주 및 1개월에
대해 각각 구축되었으며 분석 결과에 따르면 예측된 확률분포가 실제
유가변화 분포에 근접하는 것으로 나타났다.

1) 근월물 선물가격이 원월물 가격보다 높은 상황을 가리킴. Contango는 그 반대의


경우를 지칭함.

요약 iii
3. 연구의 공헌도 및 활용도

본 연구의 기여를 요악하면 다음과 같다.


첫째, 본 연구를 통해 국제 원유선물가격 고빈도 데이터를 이용한
국제유가 변동성과 확률분포 예측치 계산을 상시 작업화 할 수 있는
시발점이 마련되었다고 판단된다. 변동성 및 유가변화 확률분포 전망
은 에너지경제연구원에서 현재 수행하는 국제유가 전망과 결합되어 향
후 국제유가 움직임에 대한 추가적인 정보를 제공할 수 있을 것으로
기대된다.
둘째, 본 연구는 HAR-RS-X 모형을 Maheu and McCurdy(2011) 방
법론에 접목하여 유가변화 확률분포를 도출하고 그 정확성을 관찰하였
다. 기존의 석유시장 변동성 연구가 변동성 모형의 Out-of-sample 예
측력을 측정·비교하는 데에 초점을 두었다면 본 연구는 한 걸음 더 나
아가 이를 이용하여 유가변화 확률분포를 추정을 시도하였다. 특히 1
주 및 1개월 후 유가변화 확률분포 추정 작업 시 Maheu and
McCurdy(2011)가 제안한 방법론에서 사용된 우도함수를 데이터의 자
기상관성을 반영하여 수정하였고 이를 이용하여 모수들을 추정하였다.
자기상관성을 반영한 우도함수를 사용할 필요성에 대해 상술하면 다음
과 같다. Maheu and McCurdy(2011)는 일별 예측에 초점을 둔 모형을
고려하였는데 이 모형을 주간 및 월간 예측에 적용하려면 순차적
(recursive)인 방식을 따라야 한다. 즉, 주간 예측을 예로 들면, 오늘까
지의 데이터를 이용하여 내일의 변동성을 예측하고 그 예측 값을 기초
로 그 다음 거래일의 일중 변동성을 예측하는 방식으로 매 시점 향후
5일간의 일중 변동성을 예측하는 방식이다. 본 보고서는 이와 같은 순
차적인 방식이 아닌 주간 및 월간 변동성을 모형에 직접 도입하여 주

iv
간 및 월간 확률분포를 도출하였다. 이러한 접근 방식을 선택한 주된
이유는 In-sample 분석이나 Out-of-sample 변동성 예측력 평가 결과에
따르면 일중 변동성 예측보다 주간 혹은 월간 변동성 예측의 정확도가
높게 나타났기 때문이다. 하지만 직접 주간 및 월간 확률분포 예측을
시도할 경우 기존 Maheu and McCurdy(2011) 모형 상의 우도함수를
원형 그대로 이용할 수 없게 된다. 그 이유는 주간(또는 월간) 변동성
방정식을 도입할 시에는 자연스레 가격변화(수익률) 방정식도 주간(또
는 월간) 수익률에 대해 설정되어야 하기 때문이다. 이럴 경우, 가령
오늘 기준 향후 5일간 수익률과 내일기준 향후 5일간 수익률은 거래일
(4 거래일)이 중첩됨에 따라 자기상관성이 필연적으로 존재하게 된다.
하지만, Maheu and McCurdy(2011)가 고려한 우도함수는 자기상관성
이 없음을 전제하므로 이를 주간 및 월간 예측에 사용하는 것은 이론
적으로 맞지 않다.
다음으로 본 연구에서는 다양한 석유시장 관련 외생변수의 유가 변동
성 예측력을 평가하였다. 선물시장 관련 변수 중에서는 Backwardation/
Contango의 정도가 변동성 예측에 도움이 되었다. OPEC의 여유생산능
력(석유수요 대비)과 석유 수요/공급 비율 등과 같은 석유 physical 시
장변수들은 주간 및 월간 변동성에 대해 예측력을 보였지만, 상업용 석
유재고량(석유수요 대비)은 변동성 예측력이 없는 것으로 나타났다. 또
한 학계에서 인정받는 거시·금융·실물부문 불학실성 전망지수, 미국 정
책 불확실성 지수 및 중동지역 리스크 지수 등의 국제유가 변동성 설명
력을 검증하였는데 특히 실물부문의 불확실성 지수가 고려된 모든 예측
시계에서 미래 유가변동성에 대한 예측력을 지니는 것으로 나타났다.
이 외에도 미국 주식시장향후 1개월 동안의 변동성 기대치를 나타내는

요약 v
VIX는 모든 예측시계에서 유의한 예측력을 보인 반면 원유시장의 변동
성 기대치인 OVX는 변동성 설명력이 약하게 나타났다. 특히 향후 1개
월 변동성 예측에 있어서 OVX는 통계적 유의성이 나타나지 않았는데
OVX 변수 자체가 향후 1개월 동안의 변동성 기대치를 측정하는 개념
임을 고려할 때 매우 놀라운 결과라고 생각된다. 본 연구의 결과에 따
르면 향후 1개월 유가변동성을 예측함에 있어서 본 연구에서 고려된 타
설명변수들을 이용한다면 OVX 변수는 추가적인 예측력을 보이지 않게
된다.
본 연구의 연구결과는 정책담당자, 민간 투자자 및 원유구매 주체들
의 의사결정에 유용하게 활용될 수 있을 것으로 기대된다. 변동성 및
유가변화 확률분포 전망은 원유선물 등 파생상품 투자자, 원유구매 리
스크 관리자(헷징 담당자), 원유 구매시기가 비교적 유동적인 원유구매
자, 원유가격의 급등이나 급락 등 변동폭에 관심이 있는 정책 당국자
등 리스크 관리자들에게 의사결정에 필요한 유의미한 정보를 제공할
수 있을 것으로 판단된다.

vi
ABSTRACT

This research addresses the prediction of the volatility of WTI futures


prices and the probability distribution of oil price changes. Using the
high-frequency trading data of WTI futures price, the return of oil price
per five minutes is calculated for each transaction day, and the key
variability measures such as Realized Variance and Realized Semivariance
are computed.
In-sample regression analyses are carried out using calculated variability
measures and additional exogenous variables as regressors. The various
historical variability measures all significantly explain future oil price
volatility regardless of the forecast horizon. The extent that exogenous
variables explain oil price volatility depends on the volatility forecast
horizon. OPEC's spare production capacity has significant explanatory
power in all horizons, particularly in one-month ahead forecasting. The
regressors that measure the strength of backwardation and contango of
forward curves are also relevant variables in explaining the future volatility.
But the degree of contango is statistically significant in all horizons, while
the degree of backwardation is only significant in 1-day or 1-week volatility
forecasting. The VIX, the volatility expectation index for the U.S. stock
market, is also able to predict the future oil price volatility, providing
evidence of volatility co-movement among different markets. Of the
uncertainty outlook indexes, the real-sector uncertainty index is found to

Abstract i
predict the volatility of oil prices in all horizons. The position variables
of speculative investors and the geopolitics risk of the Middle East region
show no significant additional explanatory power.
Based on the results of the regression analysis, the HAR-RS-X model
is used as a model for estimating a predictive probability distribution of
oil price changes. The predictive probability distribution is estimated by
incorporating the HAR-RS-X model into the framework of Maheu and
McCurdy (2011). The probability distributions are established for the next
day, week, and month respectively, and we find this predictive distribution
provides a good approximation to the true distribution of oil price changes.
The contributions of this research are as follows. First, this research
provides a stepping stone for predicting oil price volatility and probability
distribution forecasts on a regular basis using the high-frequency data. The
outlook for volatility and the probability distribution of oil price changes
is expected to provide useful additional information on future oil prices
movement for policy-makers and economic agents in private sectors, upon
combined with forecasts of oil prices currently being performed by the
Korea Energy Economics Institute. Second, this study incorporates the
HAR-RS-X model into the Maheu and McCurdy (2011) framework to derive
the predictive probability distribution of oil price change and finds evidence
of the accuracy of the estimated distribution. Existing oil market volatility
studies focused on measuring and comparing the out-of-sample forecast
performance of the variability model. But this study takes a step further
to estimate the probability distribution of oil price changes. In addition,

ii
the study's efforts to predict the volatility of oil prices by various external
variables related to the oil market can be seen as another contribution.
The findings in this research or further extended studies may serve as
a useful tool for policy-makers, private investors, and crude oil buyers such
as refinery companies. The outlook for variability and the probability
distribution of oil price changes is expected to provide useful information
also for risk managers, including oil-related derivatives traders, oil
purchasing managers, oil purchasing task appraisers, and policy officials
concerned with extremely high or low crude oil prices.

Abstract iii
제목 차례

제1장 서 론 ·
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··1

제2장 변동성 예측의 중요성 ·


··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
·5
1. 유가 확률분포 추정과 활용 ··························································· 5
2. 원유 관련 파생상픔 거래 ······························································· 6
3. 자산 포트폴리오 및 리스크 관리 ·················································· 8
4. 변동성에 대한 거시경제학적 접근 ················································ 8

제3장 변동성 추정 및 예측의 기본 이론 ·


··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
·11
1. Realized Variance ········································································· 11
1.1. 기본 모형 ················································································ 12
1.2. RV의 정의 및 통계적 속성 ·················································· 15
2. 변동성 예측 모형(HAR) ······························································· 17
3. 점프가 추가된 SV 모형 ······························································· 20
4. 점프 테스트 ··················································································· 22
5. Realized Semivariance ·································································· 24
6. 기존 연구결과 ··············································································· 25
6.1. 석유 시장 ················································································ 26
6.2. 환율, 주식, 주가 지수, 채권 시장 및 뉴스효과 연구 ········ 27

제4장 데이터 구축 및 변동성 추정 ·


··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··31
1. WTI 선물 데이터 ·········································································· 31

차례 i
2. 변동성 측도 계산 ·········································································· 32
2.1. RV ··························································································· 32
2.2. RS ···························································································· 34
2.3. BPV ························································································· 36
2.4. 점프 테스트를 위한 통계량 ·················································· 36
3. 외생변수 구축 ··············································································· 37
3.1. WTI 선물시장 관련 변수 ······················································ 38
3.1.1. Forward curve 기울기 ······················································ 40
3.1.2. 비상업 투자자 포지션 ······················································· 41
3.2. 석유 physical market 관련 변수 ·········································· 42
3.3. 불확실성 지수 ········································································· 44
3.3.1. Ludvigson 불확실성 지수 ················································· 44
3.3.2. 정책 불확실성 지수 ·························································· 48
3.4. 지정학 리스크, 주식 및 원유선물 시장 변동성 인덱스 ····· 49
3.4.1. 지정학적 리스크 지수(GPR Index) ································· 49
3.4.2. OVX 및 VIX ···································································· 49

제5장 변동성 설명 및 예측 ·
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··51
1. In-sample 변동성 설명 ································································· 51
1.1. 변동성 예측 모형 ··································································· 51
1.2. 모형별 변동성 In-sample 회귀분석 결과 ····························· 54
1.2.1. HAR 모형 결과 ································································· 54
1.2.2. HAR-CJ 모형 결과 ··························································· 54
1.2.3. HAR-RS 모형 결과 ·························································· 55

ii
1.2.4. HAR-CJ-X 모형 결과 ······················································· 57
1.2.5. HAR-RS-X 모형 결과 ······················································ 61
2. Out-of-sample 변동성 예측 ·························································· 65
2.1. 모형 비교 기준 ······································································· 65
2.2. 모형 비교 결과 ······································································· 66
3. 유가변화 확률분포 추정 ······························································· 72
3.1. 모형 및 추정방법 ··································································· 72
3.2. 추정 결과 ················································································ 76

제6장 요약 및 결론 ·
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··81

참고문헌 ·
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··87

부록: Refinitiv WTI CLc1 데이터 및 코드 ·


··
··
··
··
··
··
··
··
··
··
··
··
··
··
··
··93
1. 연도별 데이터 개수 ······································································ 93
2. Python code ················································································ 93

차례 iii
표 차례

<표 4-1> 주요 일중 변동성 측도 기술통계량 ·································· 33


<표 4-2> 외생적 설명변수 목록 ························································ 38
<표 5-1> 회귀분석 결과(HAR) ···························································· 54
<표 5-2> 회귀분석 결과(HAR-CJ) ······················································ 54
<표 5-3> 회귀분석 결과(HAR-RS) ····················································· 55
<표 5-4> 회귀분석 결과(HAR-CJ-X) ·················································· 59
<표 5-5> 회귀분석 결과(HAR-RS-X) ················································· 64
<표 5-6> 모형 간 예측능력 비교(HAR-CJ vs. HAR-RS) ················ 67
<표 5-7> 모형 간 예측능력 비교(HAR-CJ-X vs. HAR-RS-X) ········ 67
<표 5-8> HAR-RS-X2 모형에 사용된 설명변수 ······························· 69
<표 5-9> 모형 간 예측능력 비교(HAR-RS vs. HAR-RS-X2) ········· 69
<표 5-10> 예측분포의 정확도(HAR-RS-X2) ······································ 79
<표 부록-1> 연도별 데이터 수 ···························································· 93

iv
그림 차례

[그림 4-1] Historical RV ······································································ 34


[그림 4-2] Signed Jump Components ················································· 35
[그림 4-3] 점프의 변동성 기여분과 Skipped BPV ··························· 37
[그림 4-4] 선물시장 관련 설명변수 ···················································· 42
[그림 4-5] 석유 Physical market 관련 변수 ······································ 43
[그림 4-6] Ludvigson 금융 불확실성 ·················································· 45
[그림 4-7] Ludvigson 거시 불활실성 ·················································· 46
[그림 4-8] Ludvigson 실물부문 불확실성 ·········································· 47
[그림 4-9] Ludvigson Smoothed Uncertainty ····································· 47
[그림 4-10] 미국의 정책 불확실성 지수 ············································· 48
[그림 4-11] GRP Index, VIX 및 OVX ·············································· 50
[그림 5-1] 실제 RV vs. RV 예측치(HAR-RS-X2), 일간예측 ·········· 70
[그림 5-2] 실제 RV vs. RV 예측치(HAR-RS-X2), 주간예측 ·········· 71
[그림 5-3] 실제 RV vs. RV 예측치(HAR-RS-X2), 월간예측 ·········· 71
[그림 5-4] 실제 일간 유가변화율과 예측된 1-표준편차 구간 ·········· 76
[그림 5-5] 실제 주간 유가변화율과 예측된 1-표준편차 구간 ·········· 77
[그림 5-6] 실제 월간 유가변화율과 예측된 1-표준편차 구간 ·········· 78

차례 v
제1장 서 론

경제학 연구에서 금융자산 및 상품(commodity) 가격 변동성 측정과


예측은 전통적인 주요 관심 주제이다. 특히 2008년 글로벌 금융위기
이후, 거시경제학연구에서는 시장불확실성과 거시경제 간 연관성을 규
명하려는 연구가 많아졌다. 대부분의 연구들은 -불확실성에 대한 개념
정립과 측정이 여전히 논의 중이기에- 주로 거시경제모형 내 주요 변
수들의 ‘예상치 못한 변화 (unexpected shocks)’에 초점을 맞추어 설명
변수 불확실성의 모형 내 파급 효과 추정에 주목하고 있다. 거시경제
변수의 모형 내 변동성은 시간이 흐름에 따라서 변화하는 특징을 보이
는데 소위 ‘시간변화 변동성(time-varying variance)’은 다양한 경제적
채널을 통해 거시경제에 영향을 미치는 요인으로 인식되고 있다.
WTI(West Texas Intermediate)와 같은 글로벌 벤치마크 원유의 선
물가격 변동성 또한 다양한 측면에서 연구의 중요성이 존재한다. 첫째,
미래 기간 동안의 원유가격 변동성은 원유관련 옵션(options) 등 파생
상품의 가치와 밀접한 관계를 갖는다. 시장에서 높은 변동성을 예상할
경우 위험회피(리스크 헷징) 수단인 옵션의 가치는 상승하게 되며 이
러한 관계는 Black-Scholes 모형 등 다양한 옵션가격 공식에서도 확인
된다. 따라서 미래 기간 동안의 변동성을 보다 정확하게 예측할 수 있
다면 시장에서 형성된 파생상품 가격 적정성 평가에 도움이 되며 결과
적으로 원유 파생상품을 이용한 리스크 헷징 의사결정에 유용한 정보
가 될 수 있다.
둘째, 시간에 따라 변하는 원유가격 변동성에 대한 예측치가 주어지

제1장 서론 1
면 유가변화 확률분포 추정 상의 예측 정확도를 제고할 수 있다. 미래
기간 동안의 유가변화 예측확률분포가 주어진다면 유가가 동 기간 중
특정 범위 내에 있을 확률을 계산할 수 있다는 점이 확률분포 예측 연
구의 의의이다. 추정된 예측확률분포는 원유 구입자의 헷징 의사결정,
원유 등을 투자대상 자산으로 포함하는 포트폴리오 관리자의 투자자산
배분 결정 및 WTI 선물시장 투자자의 매매전략 수립 등에 핵심적인
정보를 제공할 수 있을 것으로 판단된다.
유가 변동성의 예측은 기본적으로 두 단계의 작업을 필요로 한다.
시간에 따라 변화하는 변동성은 직접 관찰되는 변수가 아니므로 1차적
으로 과거기간 동안의 변동성을 보다 정확하게 추정하는 작업이 선행
되어야 한다. 변동성에 대한 정확한 측도가 계산되면 이를 이용하여
과거 변동성과 미래 변동성 간의 관계에 대한 모형을 설정하고 각 모
형의 변동성 예측력을 평가해 볼 수 있다. 이러한 과정을 통해 도출된
예측모형을 기반으로 각 시점별(매일) 미래 기간(익일, 차주 및 차월
등)의 변동성을 예측할 수 있게 된다.
전통적으로 변동성 측정과 예측은 ARCH2), GARCH3) 등의 조건부
이분산 모형을 이용하여 수행되었다. 하지만 고빈도(high frequency)
데이터인 일중 거래가격 등 대용량의 정보가 접근 가능한 상황에서도
전통적 방법은 여전히 상대적으로 저빈도(low frequency)인 일간 혹은
주간 가격변화 자료를 이용하여 모형을 추정하는 것이 보편적이다. 이
는 전통적 방법론이 고빈도 데이터를 이용하기에 다소 부적합한 측면
이 존재하기 때문이다. 하지만 2000년대 이후 고빈도 데이터에 적합한
계량경제학 방법론에 대한 논의가 시작되면서 특히 변동성 연구에서는

2) Autoregressive Conditional Heteroskedasticity, Engle(1982)


3) Generalized Autoregressive Conditional Heteroskedasticity, Bollerslev(1986)

2
Andersen, Bollerslev, Diebold and Laby(2001) 등이 소위 “Realized
Variance(RV)”라는 변동성 측도의 사용을 제안하였다. 이후 다수의 연
구에서 고빈도 거래가격 데이터를 이용하는 RV 측도가 전통적 방법론
에서 도출된 변동성 측도보다 실제 변동성 변화를 잘 나타내며 변동성
예측 측면에서도 RV에 기반을 둔 비교적 단순한 모형들이 기존 방법
론보다 정확도가 더 높음을 주장하였다. 한편, RV 측도를 이용하는 이
후의 연구에서는 RV를 점프(급작스럽고 흔치 않은 가격 상승/하락)과
非점프 기여부분으로 분해하여 사용하거나, 변동성을 가격상승(Good
Volatility) 또는 가격하락(Bad Volatility)과 관련한 부분으로 분해하기
도 하였으며, 더 나아가 추가 외생변수를 변동성을 설명변수로 포함시
킴으로써 변동성 예측의 정확도 제고를 시도하였다.
본 연구에서는 기존연구에서 주목을 받은 HAR 모형 등 기본 예측모
형들과 더불어 비교적 최근에 제안된 HAR-RS 모형 그리고 각 모형에
석유시장 변수 등 외생변수를 추가한 모형들을 고려하였다. 기존 주식
시장이나 외환시장 변동성 연구에서는 Good/Bad 변동성을 활용하는
모형이 변동성 설명력(In-sample)과 예측력(Out-of-sample forecasting)
에서 기존의 모형보다 성과가 좋은 것으로 보고되었다. 본보고서는
WTI 선물가격에 있어서도 해당 모형이 타 모형보다 우월하다는 분석
결과를 제시하였고 이러한 모형 간 비교 평가를 통해 유가변화 확률분
포 예측을 시도하였다. 각 거래일마다 미래시점(1일 후, 1주 후 및 1개
월 후)의 확률분포를 추정하였으며 추정된 예측 확률분포가 실제 유가
변화 분포에 근접하는 지 확인한 결과 본 연구에서 도출한 예측분포가
실제 분포를 근사하는 것으로 나타났다.
본 연구 보고서의 구성은 다음과 같다. 2장에서는 변동성 예측 중요
성에 대해 다양한 측면에서 서술한다. 3장에서는 변동성 추정의 핵심

제1장 서론 3
개념인 Realized Variance에 대한 이론적 속성을 제시하고 예측모형의
근간이 되는 Corsi(2009)의 HAR(Heterogenous Autoregressive) 모형을
소개한다. 또한 변동성을 점프에 의한 부분과 그렇지 않은 부분으로
분해하기 위한 점프테스트에 대해 상술하고 Good/Bad 변동성을 나타
내는 Realized Semivariance(RS) 측도를 소개한다. 석유시장 및 주식,
채권, 환율 시장의 변동성에 대한 기존 연구결과와 중심적인 이론연구
결과들에 대한 요약도 3장에 제시된다. 4장은 본 연구에서 사용한
WTI 선물유가 가격 데이터를 소개하고 이를 기초로 계산한 다양한 변
동성 관련 변수들을 상술하였다. 5분 단위 가격 추출 및 변동성 변수
들의 계산을 위해 사용된 code는 부록에 수록하였다. 추가 외생변수들
에 대한 소개와 요약도 본 장에 제시된다. 5장은 변동성 모형 선택을
위한 In-sample 분석 결과를 제시하고 각 모형의 Out-of-sample 예측
력을 평가하였다. 끝으로 이상의 분석결과를 통해 채택된 변동성(RV)
예측모형인 HAR-RS-X2를 적용하여 유가변화 예측 확률분포를 구축
하였다. 마지막 6장에서는 연구결과와 연구의 기여도를 요약하였다.
본 보고서 내용의 핵심 내용만을 파악하기 원하는 독자는 아래와 같
은 순서의 부분읽기 방법을 선택할 수 있다. 변동성 추정 및 예측의 중
요성은 서론 및 2장에 서술되었다. 핵심 변동성 측도인 Realized
Variance와 Realized Semivariance는 각각 3장 1절 및 5절에 제시되어
있고 초기 예측 모형인 HAR 모형은 3장 2절에서 설명한다. 본 연구진
이 사용한 실제 데이터와 변수 소개 및 구축과정은 4장에 제시된다.
본 보고서가 채택한 변동성 예측모형의 근간이 되는 HAR-RS-X 모형
에 대한 In-sample 분석결과는 5장 1절, 마지막으로 유가확률분포 추
정방법 및 그 결과는 5장 3절에 제시되어 있다.

4
제2장 변동성 예측의 중요성

변동성의 예측은 경제학 특히 재무경제학과 계량경제학에서 중요한


연구주제이다. 주식이나 환율 그리고 원유 등에 있어서 시장이 효율적
이라면 가격(혹은 수익률)의 예측은 불가능하여야 한다. 이러한 효율적
시장가설에 부합하여 가격(혹은 수익률) 예측은 실증연구에서 큰 성공
을 거두지 못한 것으로 평가되는 반면4), 자산 가격 변동성5)의 예측은
실증연구들에서 그 가능성이 입증되어 학계의 주요한 관심주제로 자리
잡았다. 본 장에서는 원유가격을 포함한 주요 자산가격의 변동성 예측
의 중요성에 대해 다양한 측면에서 조명해 보기로 한다.

1. 유가 확률분포 추정과 활용

유가 및 변동성 모형 내 에러 항에 적절한 분포가정을 한다면 원유


가격 변화율의 예측 확률분포를 구축할 수 있다. 자산가격 변화율의
조건부 평균은 시장효율성 하에서는 거의 0에 가까우므로 가격변화율
의 변동성이 확률분포의 핵심 요소가 된다. 따라서 변동성의 정확한
예측은 보다 정확한 확률분포 예측을 의미함을 쉽게 짐작할 수 있다.
미래 특정기간 동안의 유가변화의 확률분포가 주어지면 원유를 상시
적으로 수입하는 민간 정유회사나 석유공사 등 원유 실수요자에게도

4) 주식을 포함한 자산가격 수익률에 대한 예측변수를 제안한 연구에는 Campbell and


Shiller(1987), Lettau and Ludvigson(2001) 등이 있다.
5) 변동성 예측에 대한 대표적 서베이 연구로는 Andersen, Bollerslev, Christoffersen and
Diebold(2006)가 있다.

제2장 변동성 예측의 중요성 5


유용한 정보가 된다. 가령 향후 1달 내지는 1분기 동안 유가변화의 변
동성이 높게 예측되는 경우와 상대적으로 변동성이 낮게 예측되는 경
우에 있어서 원유구입 및 헷징 전략이 달라 질 수 있다. 원유 실수요자
를 예로 들면 변동성이 높을 때는 가격상승 리스크에 대한 헤징 필요
성이 높아질 수 있는 반면, 변동성이 낮을 것으로 예상되는 상황에서
는 그러한 필요성이 상대적으로 낮아진다. 또한 원유 구매 시기가 비
교적 유동적인 원유구입자의 경우 기간별 변동성 예측 결과와 구매하
려는 원유의 현재 가격조건에 따라 원유구입 시기를 조정할 여력이 생
길 수 있다. 원유 판매자가 제시한 가격이 유가변화율 확률분포를 기
준으로 그렇게 높은 가격이 아니라면 원유구매를 진행하고, 반대로 제
시 가격이 확률분포 상 높은 가격이라고 판단되면 해당 원유구매의 시
기를 조정하거나 물량을 축소하는 결정을 내릴 수도 있을 것이다.
유가변화 확률분포의 정보는 현재 혹은 가까운 미래 시점의 원유구
입 의사결정에 도움이 될 수 있을 뿐 아니라 과거 특정 기간에 수행한
원유구입에 대한 성과 평가에도 활용될 수 있는 소지도 존재한다. 변
동성이 낮았던 기간 중 구입한 원유가 상대적으로 높은 가격에 수입되
었다면 이는 원유구입이 비효율적으로 이루어졌을 가능성을 의미할 수
있다. 반면 동일한 높은 가격에 수입되었지만 해당 기간의 변동성이
높았다면 원유구입 상의 기회손실은 -기간 중 변동성을 감안하여- 작
게 평가되어야 할 것이다.

2. 원유관련 파생상품 거래

옵션 등 파생상품 가격의 이론모형에서는 옵션 만기까지의 기초자산

6
가격 변동성이 옵션가격을 결정하는 요인 중 하나인데 변동성이 클수
록 옵션 가치는 높아진다. 각 시점에서의 기초자산에 대한 옵션 시장
가격과 이론적 옵션가격 모형을 이용함으로써 옵션가격에 내재된 기초
자산의 변동성(implied volatility)을 계산하는 것이 가능한데 석유시장
의 경우 CBOE(Chicago Board of Options Exchange, 시카고 옵션거래
소)에서 이를 Oil Volatility Index(OVX)로 매일 발표(자료 기간은
2007년 5월 이후)하고 있다. OVX는 거래소를 통해 거래(exchange
traded fund, ETF) 되는 미국 오일 펀드(USO)에 대한 옵션의 시장가
격으로부터 역 계산된 implied volatility의 일종이며 사실은 미 주식시
장(S&P 500 인덱스) 변동성 예측의 측도로 널리 인정되는
VIX(Volatility Index)를 USO에 적용한 것이라 할 수 있다. VIX와
OVX 모두 향후 한 달 동안의 기초자산 변동성에 대한 기대치로 인식
되고 있으며 미래 변동성 측도로서 널리 사용되고 있다.
원유가격 변동성 예측 연구의 가치는 본 연구에서 고려되는 모형들
로부터 도출된 변동성 예측치가 OVX 만을 이용한 방법보다 예측력이
우월할 때 존재하게 될 것이다. 만약 옵션 시장가격에 반영되지 않은
변동성을 특정 모형을 통해 예측할 수 있다면 이는 원유 관련 옵션 거
래자들에게 헷징 의사결정에 있어서 유용한 정보가 될 수 있다.
이 외에도 미래 변동성에 대한 정보는 변동성 크기에 따라 수익의
크기가 결정되는 유형의 옵션 투자 의사결정 및 선물 투자에서의 매
수·매도 시점 결정 등 각종 파생상품 투자전략 수립 및 운영에도 중요
한 정보를 제공할 것으로 판단된다.

제2장 변동성 예측의 중요성 7


3. 자산 포트폴리오 및 리스크 관리

보다 일반적인 관점에서도 미래의 자산 가격 변동성은 포트폴리오


관리와 리스크 관리 측면에서 핵심적인 정보가 될 수 있다. 투자 자산
배분 의사결정 시 많이 사용하는 Mean-Variance(MV) 모형은 각 시
점별 개별 자산들의 분산과 공분산을 이용하여 포트폴리오 내의 개별
자산의 투자비율을 결정할 수 있는 기초를 제공해 준다. Fleming,
Kirby and Ostdiek(2003)은 본 보고서에서 이용할 Realized Variance
등을 이용하여 MV 모형 기반 투자결정(포트폴리오 구성)을 할 경우
실질적인 경제적 효익이 있음을 보인 바 있다.
변동성 예측은 원유와 금융자산 가격 등이 극단적으로 높아지거나
낮아지는 경우를 회피하고 싶은 투자자와 정책 담당자 등에게도 중요
한 주제이다. 정확한 변동성 예측을 통해 가격 변화율 분포 상의 꼬리
부분(tail)의 확률을 더 정확하게 계산할 수 있다면 VaR(Value at Risk)
평가 등 리스크 관리업무의 정확도 제고에 기여할 것으로 예상된다.

4. 변동성에 대한 거시경제학적 접근

경제의 불확실성(uncertainty)은 경제모형에서 주로 변동성6)으로 정


의되어서 모형에 도입되고 있다. 부분균형 모형에서 변동성이 경제에
미치는 영향으로 실질 옵션 효과(real options effect), 예비적 저축 효
과(precautionary savings effect), 금융 마찰 효과(financial frictions

6) 경제 주체의 관점에서는 예측이 불가능한 조건부 분산(conditional volatility)으로 주


로 정의되고 있다.

8
effect) 등의 채널이 연구7)되었다. 변동성은 고용, 투자, 소비 등을 감
소시킬 수 있는데 경제주체가 고정 비용(fixed costs)이나 부분적인 비
가역성(partial irreversibilities) 하에서 변동성에 직면하여서 의사결정
을 변화시키는 경우를 실질 옵션 효과라 한다. 경제주체가 위험 회피
적(risk averse)이어서 변동성이 있는 경우 고용, 투자, 소비 등을 감소
시키는 경우는 예비적 저축 효과라고 하며 경제 주체가 직면하는 금융
적 제약(financial constraints)의 강도가 변동성의 상승에 따라 높아져
서 의사결정에 영향을 미치는 효과를 금융 마찰 효과라 부르고 있다.
일반균형 모형에서는 변동성의 여러 가지 효과가 복합적으로 작용하
여서 모형의 해에 영향을 주며 변동성의 변화는 경제에 많은 영향을 미
칠 수 있다. 모형 기반의 연구에서는 동태확률일반균형모형(Dynamic
Stochastic General Equilibrium Model, DSGE)의 주요 구조 충격
(structural shocks)의 변동성에 초점을 맞추며 변동성의 변화
(time-varying uncertainty)를 모형에 도입하여 거시경제 일반에 미치는
영향에 대하여 분석을 하고 있다.
경제의 시계열 데이터를 사용하여 거시경제에 대해서 연구하는 실증
연구에서는 주로 VAR(Vector Autoregression) 모형을 이용하여서 분
석을 하고 있다. 변동성의 변화에 초점을 맞추는 경우에는 오차항의
분산이 시간에 따라서 변화할 수 있음을 가정한 TV-VAR(time-varying
VAR) 모형을 베이지안 방법으로 추정하는 연구들도 존재한다.

7) Jurado, Ludvigson and Ng (2015)을 참고하여 정리하였다.

제2장 변동성 예측의 중요성 9


제3장 변동성 추정 및 예측의 기본 이론

1. Realized Variance

전통적인 주식, 환율, 채권 및 원유선물 가격 등의 변동성 추정과 예


측은 ARCH(Autoregressive conditional heteroskedasticity), GARCH
(Generalized ARCH) 등의 조건부 이분산성 모형이나 모수화된
Stochastic Volatility(SV) 모형을 이용하였다. 이러한 전통적인 접근방
법 하에서는 고빈도(high frequency) 거래 데이터 사용이 가능한 환경
에서도 고빈도 데이터를 직접 이용하지 않고 상대적으로 저빈도(low
frequency)인 일간 혹은 주간 데이터를 이용하는 것이 일반적이다. 이
는 일간·주간 데이터에 비해 데이터의 양이 많은 고빈도 데이터를 조
건부 이분산성 모형이나 모수화된 SV 모형에 적용할 경우 계산의 양
이 방대해질 뿐만 아니라 고빈도 데이터를 이용한 추정결과로 일별 혹
은 주별 변동성을 구축할 경우 일간 변동성 흐름을 잘 반영하지 못 하
는 단점이 있기 때문이라고 알려져 있다(Andersen, Bollerslev, Diebold
and Labys, 2003).
반면, 최근 학술연구에서 주목을 받고 있는 Realized Variance(RV)
는 고빈도 데이터를 직접 이용한 변동성 측도로서 실제 일간 변동성을
잘 나타내며 손쉽게 특정기간(예: 일별, 주별, 월별 등) 동안의 가격 변
동성을 추정할 수 있다는 장점이 있다. 또한 변동성 예측에 있어서도
RV를 이용한 비교적 단순한 변동성 전망모형이 전통적인 방법보다 더
정확한 예측치를 제공한다고 알려져 있다. 즉 변동성의 추정과 전망

제3장 변동성 추정 및 예측의 기본 이론 11


두 측면에서 RV를 기반으로 한 접근방법이 기존의 방법보다 선호될
수 있는 이유가 존재하는 셈이다.
이번 절에서는 RV의 정의 및 핵심적인 통계적 성질 그리고 초기
RV 연구들의 이론 및 실증 결과에 대해 살펴보기로 한다.

1.1. 기본 SV 모형

Realized Variance의 유용성을 발견하고 전파한 초기 연구는


Andersen, Bollerslev, Diebold and Labys (2001, 2003 이하 ABDL),
Andersen, Bollerslev, Diebold, Ebens(2001, 이하 ABDE)가 있으며
RV 변동성 측도의 핵심적인 통계적 속성은 Barndorff-Nielsen and
Shephard(이하 BNS, 2002a, 2002b)에 의해 정립되었다.
고빈도 데이터를 이용한 RV 관련 연구들은 공통적으로 자산가격이
아래와 같은 확률과정을 따른다고 전제한다.

           (3-1)

여기서  는 분석대상(예: 원유가격, 주가 index 등)의 log 가격, 

는 drift항,   는 표준 브라운 과정(standard Brownian motion)을 나


타내며   는 시점 순간 변동성으로서 고정상수가 아닌 일련의 확률
과정을 따른다. 식 (3-1)의 좌변은 log 자산가격의 순간 변화율
(instantaneous rate of change)을 뜻하는데 동 변화율(혹은 수익률)은
drift항 및 각 시점 자산가격에 영향을 미치는 innovation인   와
innovation 영향의 크기를 결정하는 의 곱에 따라 주어지게 된다.
동 모형에서는 변동성 가 확률과정을 따른다고 가정함에 따라

12
변동성 자체의 시변성(time-varying) 및 시점 간 선형 상관관계(serial
correlation) 등을 허용하게 된다. 단, 변동성 확률과정에 대한 구체적
모형은 명시하지 않는데 이 점이 구체적 변동성 과정 모형을 가정하여
관련 모수를 추정하는 전통적인 SV모형 접근방식과 구별되는 점이다.
식 (3-1)과 같은 확률미분방정식(Stochastic differential equation)이
주어지면 시점의 자산 가격은 식 (3-2)로 주어진다.


      

(3-2)

식 (3-2)는 미래시점 자산가격의 분포속성에 대한 정보를 제공한다.


논의의 단순성을 위해 drift항은 ∙라고 가정하자. 이제 현재 시점
을   로 표기하고 미래시점인 시점에서의 가격의 분포를 살펴보
면, 우선 가격의 무조건부 분포는 정규분포가 아님을 알 수 있다. 이는
표준 브라운운동은 정규분포를 따르지만   가 모종의 확률과정을 따
르기 때문이다. 단, 조건부 분포는 정규분포를 따르는데 이를 위해
integrated variance8)(  )를 아래와 같이 정의하자.


       


(3-3)


8) integrated variance는 순간 변동성    를 0시점에서 t시점까지 적분한 개념이지
만 이하에서는 편의상 임의의 구간위에서의 적분 값도 integrated variance라고 지
칭하기로 한다.

제3장 변동성 추정 및 예측의 기본 이론 13


이제    시점과  시점 간의 integrated variance의 변화를   
로 표기한다.


           

   (3-4)

  는 현재 시점에서는 미실현되어 실제로는 그 값을 알 수 없으

나   -조건부 분포를 상정한다면 미래시점 자산가격변화


( ≡     )의 분포는 Ito-isometry에 의해

 ∼    (3-5)

로 주어지게 된다. 즉 미래의    값을 만약 알 수 있다면 자산가격


변화율의 분포는 분산이   를 따르는 정규분포라고 말할 수 있을
것이다. 하지만 앞서 언급하였듯 미래의   값은 현재시점에서는 알
수 없을 뿐 아니라 사실은 과거 특정기간의 integrated variance 또한
직접 관측이 되지 않는다. 이하에서는 Realized Variance가 (1) 과거
특정 기간의 실현된 그러나 직접관측이 안 되는 integrated variance에
대한 일치(consistent) 추정량이 되며 (2) 과거 기간의 Realized
Variance 값을 이용하여 미래 기간 동안의 Realized Variance를 예측
할 수 있다는 연구결과(HAR 모형)을 소개하고자 한다.

14
1.2. RV의 정의 및 통계적 속성

RV(Realized Variance) 정의는 다음과 같다. 1 거래일을 (예: 1분,


5분 등) 간격으로 잘게 자르고 각 -subinterval 동안의 변화율을 제곱
한 후 더한다.


  


     (3-6)

여기서,     은 시점을 종료시점으로 하는 거래일(이하  거래

일)의 번째 -subinterval에서의 차분된 log 가격 값인

                   ≡ (3-7)

이며 은 1 거래일 내의 -subinterval 개수,  는  거래일의 일중

(daily) 변동성을 나타낸다. 통상    로는  거래일의 첫 번째 거래가

격이 사용되며       이다.

ABDL(2001)은 위와 같이 정의된 Realized Variance(RV)가 이 커


질수록(가 0으로 근접할수록) 식 (3-1)을 따르는 확률과정의
Quadratic Variance(QV)로 수렴(convergence in probability)함을 언급
하고 식 (3-1)과 같은 Stochastic Volatility 모형에서는 QV가
integrated variance와 일치하기 때문에 결국 RV가 우리가 알고 싶은
integrated variance에 대한 일치 추정량이 된다는 사실을 주지시켰다.

제3장 변동성 추정 및 예측의 기본 이론 15


 
 
     ↑∞. (3-8)

한편, Andersen 등의 연구는 RV의 일치성만을 언급한 반면


BNS(2002a, 2002b, 2003)는 RV의 극한분포를 도출함으로써 RV 등의
변동성 측도를 이용한 통계적 추론을 가능케 하는 시발점을 마련하였
다. BNS가 도출한 RV의 점근분포는 아래와 같다.

  


     

 ⇒   ↑∞. (3-9)




   



위의 식에서 분모에 나타나는 

  는 integrated quarticity



로서 이에 대한 추정량으로는   
    
(realized quarticity),



 
   
             
 (realized quad-power quarticity) 및

 
 
  

  
     (realized tri-power quarticity)
 
  
 

등이 사용된다.
식 (3-6)으로 계산한 일별 변동성을 이용하여 주별(weekly) 및 월별
(monthly) 등 특정 기간 동안의 변동성을 계산할 수 있다.    거래

16
일부터    거래일 기간 동안의 평균 변동성은 아래 식 (3-10)과 같
이 정의된다.


          ⋯    (3-10)

예를 들어 현재 시점 기준 향후 1주(5 거래일) 동안의 주간 (평균)


변동성은   ≡    로 표기하고 과거 1주 동안의 주간 변동성

은      로 표기한다. 유사하게 향후 1개월(통상적으로 22 거래

일) 동안의 변동성은   ≡    , 과거 1개월 동안의 변동성은

     로 표기한다.


이상에서 고빈도 거래가격을 이용한 변동성 측정에 대해 살펴보았는
데 본 보고서의 중요한 목표는 변동성 예측이므로 다음 절에서는
HAR 모형을 사용한 예측모형에 대해 알아보기로 한다.

2. 변동성 예측 모형(HAR)

Corsi(2009)는 변동성 예측을 위한 모형으로 식 (3-11)에 제시된


Heterogenous Autoregressive(HAR) 모형을 제안하였다.

                  (3-11)

여기서 ∈  이다. 는 일간 변동성을 의미하는 상첨자이며


는 주간, 은 월간을 의미한다. 따라서 좌측변의 피설명변수로는 일

제3장 변동성 추정 및 예측의 기본 이론 17


간, 주간, 월간 등 중에서 선택할 수 있으며 설명변수는 전일, 전주, 전
월의 평균변동성이 사용된다. 피설명변수에 관계없이 동일한 설명변수
들이 사용되지만 각 설명변수의 계수 값은 피설명변수가 무엇인지에
따라 다르게 된다.
HAR 모형은 기본적으로 가격의 변동성은 다양한 시계(time horizon)
에 대응하는 변동성 요소들이 결합하여 실현된다는 이른바 cascade 모
형에 기반한다. 식 (3-11)에서 보이는 것처럼 비교적 단순한 과거의 변
동성들을 이용하여 미래의 변동성을 예측한다. 그러나 HAR 모형은 단
순한 모형임에도 불구하고 변동성이 갖는 속성인 long memory(장기 기
억)을 잘 반영한다고 알려져 있다. 실증적으로 가격변화(자산 수익률)의
변동성은 과거의 변동성과 자기 상관(autocorrelation), 즉 시점 간 의존
성(temporal dependence)을 보이는데 특히 자기 상관의 정도가 시계열
분석에서 일반적으로 사용되는 ARMA 모형과 같은 short memory 정
상시계열의 경우보다 자기상관성이 강하게 나타난다. 보다 구체적으로
시점과   시점 간의 자기상관은 정상시계열인 경우에는 가 커짐에
따라 기하급수적으로 줄어드는 반면, long memory 시계열은 그 보다
낮은 속도(hyperbolic rate)로 줄어든다.9) 따라서 변동성을 설명하기 위
해서는 비교적 많은 lag의 과거 변동성을 설명변수로 사용해야 하나 HAR
모형은 단 세 가지 설명변수를 사용하여 long memory 속성을 반영할 수
있다는 장점이 있다.10)

9) Long memory 시계열에 대해 궁금한 독자는 Granger and Joyeux(1980), Baillie(1996),


Cho et al(2015) 등을 참조
10) Baillie et al(2019)는 HAR 모형을 사용해도 회귀식의 잔차에 long memory가 여전
히 남아 있을 수 있어 HAR 모형과 일반적인 장기기억 시계열 모형인 ARFIMA
를 결합한 방법론을 제시한 바 있다.

18
위에서 언급된 HAR 모형의 장점으로 인해 HAR 모형 기반의 변동
성 예측은 주식, 채권, 환율, 원유시장 등에 대한 다양한 실증연구에서
적용되었다. HAR 모형을 통해 추정된 미래 변동성은 전통적인
GARCH 모형이나 모수적인 Stochastic Volatility 모형의 추정을 통한
변동성 예측치보다 Out-of-sample 예측 정확도가 높다는 것이 학계의
중론이다.
Corsi(2009)가 제안한 HAR 모형은 이후 추가적인 외생변수를 고려
하거나 자산가격의 jump를 허용하는 모형 등으로 확장되었다.
Haugom, Langeland, Molnar and Westgaard(2014)는 WTI 선물유가 변
동성을 설명하기 위해 기존 변동성 변수에 선물시장 관련 외생변수를
추가한 소위 HARX(HAR+exogenous variables) 모형을 채택한 바 있
다. Andersen, Bollerslev and Diebold(2007) 및 Corsi, Pirino and
Reno(2010) 등은 RV 측도를 jump 요소와 非jump 요소로 분해하여 변
동성 예측에 적용하였고(HAR-CJ 모형), Patton and Sheppard(2015)는
Realized Semivariance(RS)라고 불리는 가격상승과 하락에 동반된 변동
성을 설명변수로 사용하였다. 특히, Patton and Sheppard가 고려한 변동
성 예측모형 중 HAR-RS 모형은 기존의 HAR 모형이나 HAR-CJ 모형
보다 예측 정확도 면에서 우월하다고 보고되었다. HAR-RS 및 HAR-CJ
예측모형 등은 공통적으로 자산가격의 점프가 발생하는 것을 허용하는
모형에 기초하고 있다. 식 (3-1)에 점프를 추가하는 확장모형과 점프의
통계적 식별 그리고 Realized Semivariance(RS) 측도와 이를 활용한 예
측 모형 등은 다음 절에서 소개하기로 한다.

제3장 변동성 추정 및 예측의 기본 이론 19


3. 점프가 추가된 SV 모형

식 (3-1)은 기본적인 Stochastic Volatility 모형으로서 자산가격의 jump가


모형이 반영되어 있지 않다. jump의 발생 가능성을 허용하는 모형은 아래
식 (3-12)으로 주어진다.

                (3-12)

우측 변 마지막 항인     가 점프에 의한 순간적인 가격 변화를


의미한다.  시점에 jump가 발생할 경우     가 되며 그렇지 않을 경
우에는    이다.   는 jump 발생 시의 그 크기를 나타낸다.
위 모형에서처럼 jump 발생이 허용되는 경우에는 앞 장에서 소개한
Realized Variance(RV)는 integrated variance로 수렴하지 않게 된다. 대신 이
경우 RV의 극한은 아래 식에서와 같이 integrated variance와 더불어 실제
발생한 jump들의 제곱 합으로 주어진다.

 
 
    
 ≤
   (3-13)

변동성 예측에 있어서 jump가 기여하는 부분(위 식 우측 두 번째


항)과 연속적(continuously)으로 시변하는 변동성(위 식 우측 첫 번째
항, integrated variance)는 상이한 통계적 속성 및 예측력을 갖고 있기
때문에 본 보고서에서는 기존 연구들에서처럼 Realized Variance를
jump가 기여한 부분( 로 표기)과 그렇지 않은 부분(integrated
variance, 로 표기)으로 분해하여 사용하는 것을 고려한다. 이를 위해

20
서는 각 거래일에 대하여 jump가 발생하였는가를 테스트해야 하는데
이를 위해 BNS(2004)가 처음 제안했던 Bipower variation(BPV)을 이
용할 수 있다.
Bipower variation의 정의는 아래와 같다.

 
 ≡  

     



(3-14)

Realized Variance가  를 제곱하여 더한 것인데 반해, Bipower

variation은  과 직전 subinterval의 변화율인    을 곱하여 더한

측도이다. 중요한 점은 jump 존재 여부에 관계없이 BPV는 integrated


variance로 수렴한다는 점이다.

 
   
    ↑∞ (3-15)

BPV의 극한에 jump의 기여분이 반영되지 않는 직관적인 이유는 다


음과 같다. 가령, jump가 번째 subinterval에서 발생하여  가 비교적

큰 숫자로 관찰되는 경우를 상정하자. jump는 희귀사건(rare event)이


므로 인접한 subinterval에서는 jump가 없었을 가능성이 크다. 이제
       로 표현하게 되면  가 번째 구간에서의 jump를 의

미하게 된다. 따라서 BPV 정의상의 각 교차곱들은


           로 쓸 수 있다. jump가 없는 경우 변화율

   는 0에 가까운 작은 숫자일 공산이 크므로  와    를 곱한

제3장 변동성 추정 및 예측의 기본 이론 21


값 역시 원래의  보다 작아지게 된다. 다시 말하면 BPV 계산과정에

서 jump의 영향이 축소된다.


기존 연구들에서는 4절에서 소개될 점프 테스트의 power를 향상시
키기 위해 앞서 정의한 BPV대신 교차곱을 한 번 이상 skip한 skipped
BPV를 사용하고 있다.


 ≡      

   (3-16)

본 연구에서 적용할 jump 테스트에서는 기존 연구들을 따라 위 식


과 동일한 skipped Bipower variation을 사용하기로 한다.

4. 점프 테스트

앞 절에서 상술된 바와 같이 jump가 존재할 경우에는 RV와 BPV의


극한이 일치하지 않게 된다. BPV의 극한은 jump 유무와 무관하게
integrated variance이지만 RV의 극한은 integrated variance와 제곱된
jump의 합으로 표현되어 BPV의 극한보다 항상 크게 주어진다. 따라
서 유한표본에서도 jump가 있을 시에는 RV가 BPV보다 크게 되고
jump가 없을 시에는 그 값의 차이가 크지 않을 가능성이 높다.
jump 테스트는 위와 같은 직관에 기초하여 적절한 통계량을 사용한
다. 귀무가설은 “jump가 발생하지 않았다”이고 대립가설은 “jump가
발생하였다”이다. RV와 BPV의 차이가 양의 숫자로서 통계적으로 유
의미할 시 점프가 존재한다는 통계적 결론을 내리게 된다. BNS(2006)

22
와 Huang and Tauchen(2005)는 jump 테스트를 위한 통계량을 제안했
는데 이후 연구들에서 이를 수정·보완한 아래 식과 같은 통계량이 사
용되고 있다.

    
 ≡ 
(3-17)
      max 

통계량  의 핵심요소는 분자에 나타난 RV와 skipped BPV의 차

이(혹은 둘 간의 비율과 숫자 1 간의 차이)이며 나머지 항들은 통계


량의 귀무가설 하 극한분포가 표준정규분포가 되게 하는 기능을 한
다. 특히  은 tripower quarticity(skipped 버전)로서 아래와 같이

정의된다.


 ≡       



     (3-18)


 
여기서             
     이고 ∙는 감마함

수를 나타낸다.
jump 테스트는 단측검정(우측)으로 진행되며 통계량  가 임계치

(critical value)보다 클 경우 귀무가설을 기각하고  거래일에 점프가


발생했다고 결론 내린다. 귀무가설 하 극한분포가 표준정규분포이므로
nominal size 5% 임계치는 1.645, nominal size 1% 임계치는 2.325 등
을 사용하게 된다.

제3장 변동성 추정 및 예측의 기본 이론 23


점프 테스트의 결과에 따라 RV를 integrated variance 부분( )과
jump 기여분( )으로 분해할 수 있다. 분해 방법은 아래 식과 같다.

   ∙ ≤   ∙   (3-19)


    ∙  

위 정의에 따르면      관계식이 항상 성립하게 된다.

5. Realized Semivariance

앞 절들에서 다룬 Realized Variance는 가격이 상승할 때와 하락할


때를 구분하지 않고 변동성을 계측하는 측도이다. 반면 BNS(2008)이
제안한 Realized Semivariance는 가격상승과 하락을 구분하여 변동성
을 측정하게 된다.


 ≡ 


  
 (3-20)

 ≡ 


  


 는 가격이 상승하는 subinterval에 대해서만 변화율을 제곱하여

합한 변동성 측도이고  는 가격이 하락하는 subinterval에 대해서만

변화율을 제곱하여 합한 변동성이다. 가격상승이 대세였던 거래일은


당연히  이  보다 크고 가격이 하락세를 보인 거래일은 그 반

24
대로 나타난다.  은 가격상승에 동반된 변동성이어서 Good

Volatility라고 불리우며  는 가격하락에 동반된 변동성이므로 Bad

Volatility라고 불리기도 한다.


위 두 변동성 측도는 이 증가할수록 아래와 같이 수렴한다.

  

 

   
≤
    (3-21)

  
 
 

    
≤
       (3-22)

Patton and Sheppard(2015)는 직전 거래일에 Good Volatility가 Bad


Volatility 보다 더 컸는지 여부에 따라 향후 변동성이 영향을 받음을
실증적으로 보였는데 이들이 사용한 변수는 ∆  ≡    

×     와 ∆  ≡        이다.

정의상 ∆  는 항상 양수이거나 0이고 ∆  는 항상 음수이거나 0

이 된다.

6. 기존 연구결과

본 보고서에서는 Realized Variance를 활용한 주요 기존연구들의 결


과들을 요약하기로 한다. 석유시장을 분석한 주요 기존연구들은 6.1절
에 제시되어 있다. 6.2절은 RV 기반 연구가 진행된 이래 주요 이론 및
非석유시장 실증 연구결과들을 요약한다. 이 중 2000년대 초기 연구들

제3장 변동성 추정 및 예측의 기본 이론 25


은 모형에 가격의 점프발생 가능성을 고려하지 않았으나, BNS(2004,
2006)가 BPV(Bipower Variation) 측도를 제안한 이후로는 점프 발생
여부 테스트가 가능해 짐에 따라 점프를 명시적으로 모형에 반영한
Andersen et al(2007) 등과 같은 연구들이 나오기 시작하였다. 한편,
BNS(2008)는 변동성을 상승관련 변동성과 하락관련 변동성으로 구분
할 것을 제안하였는데 Patton and Sheppard(2015)에 의해 동 접근방법
을 실증분석에 적용하는 것이 본격화되었다.

6.1. 석유 시장

Haugom, Langeland, Molnar and Westgaard(2014)는 WTI 선물가격


의 변동성 예측을 위해 기존 HAR 모형에 CBOE Crude Oil Volatility
Index(OVX) 변수를 추가한 확장모형을 고려하였다. 모형에 추가된
OVX는 기초자산을 USO(미국 오일펀드)로 하는 옵션들의 가격에 내
재된 변동성(implied volatility)으로서 향후 1개월 간 변동성에 대한 시
장의 기대치를 나타낸다. 동 지수는 미국 주가지수 변동성 지수인
VIX를 계산하는 방법론(VIX methodology)을 동일하게 적용하여 계산
되고 있으며 2008년부터 CBOE에서 일단위로 작성·발표하고 있다.
이들은 이 외에도 거래량, 미결제약정(open interest), 일간 유가 변화
율, 매수호가와 매도호가 차이인 Bid-ask 스프레드(spread), 선도곡선
기울기 등 다양한 설명변수를 추가하여 변동성 예측을 시도하였다.
Out-of-sample 변동성 예측 결과에 따르면 OVX와 추가된 외생변수들
이 예측의 정확도를 높이는데 도움이 되는데 특히 OVX는 일간 및 주
간 변동성 예측에서, 기타 추가 외생변수들은 일간, 주간 및 월간 예측
에서 정확도를 향상시키는 것으로 나타났다.

26
Ma, Liu, Huang and Chen(2017)은 유가 움직임의 범위(range)에 기
초한 변동성 측도인 RRV(Realized Range-based Volatility)를 피설명
변수로 설정하여 원유 선물가격 변동성을 분석하였다. 또한 RRV 자체
의 변동성(즉 변동성의 변동성)을 설명변수로 포함시켰는데 이들의 분
석결과에 따르면 원유 선물시장에서도 변동성의 변화폭 자체가 시간에
따라 변화하는 현상이 나타나고 있으며 이를 측정하는 RRV 변동성을
설명변수로 추가할 경우 예측의 정확성을 높일 수 있음을 보이고 있다.
Prokopczuk, Symeonidis and Simen(2016)은 다양한 에너지 제품(원
유, 난방유, 천연가스, 휘발유) 가격에 대한 변동성을 연구하였다. 이들
의 연구는 HAR, HAR-CJ 등과 같은 다수의 모형을 고려하였는데 대
부분의 모형에서 과거 점프변동성 설명변수가 미래 변동성에 대한 설
명력이 없다고 결론지었다.
본 연구는 Haugom et al(2014)가 채택한 기본 HAR 모형 외에도
HAR-CJ, HAR-RS 등의 모형을 고려하였고 외생적 설명변수의 구성
도 상이한 점에서 차별화 된다. 또한 본 절에 언급된 기존 연구들과 달
리 변동성 예측을 기초로 유가변화의 확률분포까지 예측한 점이 또 다
른 중요한 차이점이다.

6.2. 환율, 주식, 주가 지수, 채권 시장 및 뉴스효과 연구

Andersen et al(2001)은 독일 마르크화와 일본 엔화의 미 달러화 대비


환율에 관한 고빈도(high-frequency) 데이터를 이용하여 일일 환율 변동성
과 두 환율 간 상관관계(correlations)를 계산하고 변동성과 상관관계 간의
분포(joint distribution)에 관하여 분석하였다. 이들은 환율의 개별 변동성
간의 높은 당기 상관관계를 발견하였고 두 환율 간 상관관계와 개별 환율

제3장 변동성 추정 및 예측의 기본 이론 27


변동성 간에도 밀접한 관계가 있음을 보였다.
Andersen et al(2003)은 가격 및 변동성에 관한 이론적 모형에 기반
하여 RV와 조건부 공분산(conditional covariance matrix)에 관한 이론
적 기반을 제시하였고 이를 마르크, 엔 및 달러화에 관한 고빈도 데이
터 분석에 적용하였다. 이들은 일중 RV에 관한 단순 장기메모리
Gaussian(simple long-memory Gaussian) VAR 모형의 예측결과가 매
우 우수함을 보여주었다.
Andersen et al(2001)은 주식11) 거래에 관한 고빈도(high-frequency)
데이터를 이용해서 변동성 및 상관관계에 관하여 분석을 실시하였다.
RV 및 상관관계의 비조건부 분포(unconditional distributions)가 우측
으로 치우쳤으며(right-skewed), 둘 모두 장기메모리 과정(long-memory
process)의 특징을 지님을 보였다.
Andersen et al(2007)은 Bipower 변동성 측도(bipower variation
measures)를 새롭게 도입하여 다양한 자산 수익률 변동성 예측에 활용
하였으며 점프발생 여부에 관하여 비모수적인 검증을 실시하였다. 동
방법론을 환율, 주가 지수 수익률(equity index returns) 및 채권 수익률
에 적용하였으며 특히 설명변수로 사용되는 과거 변동성 측도를 점프
발생에 의한 부분과 그렇지 않은 부분으로 분해하여 사용하는 접근방
식을 제안하였다. 이들은 HAR 모형에 직전 거래일의 점프 변수(  )를

추가한 모형과 더불어 본 보고서에서 고려한 모형 중 하나인 HAR-CJ


모형의 유용성을 분석하였다. 해당 모형들을 DM/USD 현물 환율 , 미
국 S&P 500 인덱스 선물, 30년 만기 미 국채(Treasury bond) 선물 데
이터에 적용하였다. HAR-CJ 모형의 추정에서 과거 점프 관련 변수들의

11) Dow Jones의 산업 평균(Industrial Average)을 구성하는 각각의 주식의 거래 가격


에 관한 데이터를 이용하여서 분석을 하였다.

28
미래 변동성 설명력은 유의하지 않게 나타난 반면, 과거 integrated
variance 관련 변수들은 통계적 유의성을 보였다. 이들은 점프로 인한 변
동성과 연속적으로 변하는 integrated variance는 미래 변동성 설명력이
다르므로 RV를 두 가지 요소로 분해하여 사용해야 된다고 주장하였다.
Corsi, Pirino and Reno(2010)는 Andersen et al(2007)의 모형을 채
택하여 S&P 500 인덱스 선물과 미국 주요 개별 주식의 변동성을 분석
하였다. 이들은 기존의 Bipower 변동성을 포괄하는 멀티파워 변동성
(multipower variation)에 기초한 기존의 점프 검정(test)방법에 비해 검
정력이 높은 새로운 점프 식별 검정을 제시하였다. 점프 테스트의
power가 높을 때는 샘플기간 내에서 좀 더 많은 점프가 발견될 수 있
으며 결과적으로 동일한 회귀모형이라 하더라도 각 설명변수의 값이
변하게 된다. 이들의 실증분석 결과에서는 새로운 점프 테스트 방법에
기초하여 구축된 직전 거래일 점프 변동성 설명변수가 미래 변동성에 대
한 강한 설명력을 보이고 있다.
BNS(2008)은 RS(Realized Semivariance) 측도의 극한 및 Quadratic
Variation(QV)과의 관계 등에 관한 이론적인 기반을 제시한 후에 이를
토대로 GE社 주식 거래 데이터에 대한 실증분석을 수행하였다. 이들
의 결과에 따르면 일반적인 RV 통계량에 비해서 음의 RS가 미래 변
동성 예측에서 높은 설명력을 갖는 것으로 보고되었다.
Patton and Sheppard(2015)는 BNS(2008)의 방법론을 준용하여 자산
가격(S&P 500 지수와 105개의 개별 주식가격)의 수익률이 양인 경우
와 음인 경우를 구분한 후 각각의 변동성(Realized Semivariance)을 계
산하였다. 특히 이들은 양의 RS와 음의 RS의 차이에 기반한 소위
‘signed jump 요소’를 설명변수에 포함하는 HAR-RS 모형을 제안하였
다. 이들의 실증 결과에 다르면 미래 변동성은 과거 음의 수익률과 연

제3장 변동성 추정 및 예측의 기본 이론 29


관된 변동성에 더 큰 영향을 받는데 가격하락 변동성이 클 경우 미래
의 변동성은 더 커지는 반면, 가격상승 변동성이 클 경우 미래의 변동
성은 낮아지는 경향이 있다.
Liu et al(2018)은 Corsi et al(2010)의 새로운 점프테스트를 적용하
여 HAR-CJ 모형을 추정하였는데 특히 점프의 크기를 기준으로 큰 점
프와 작은 점프로 구분하여 설명변수로 사용하였다. WTI 선물유가에
대한 이들의 실증결과에 따르면 1일 예측의 경우 기존 HAR 모형의
설명변수에 ‘작은 점프’ 설명변수를 추가한 모형이 예측성과가 가장
좋았고 주간 및 월간 변동성 예측의 경우 HAR 모형에 ‘작은 점프’ 및
‘큰 점프’ 두 개의 변수를 추가한 모형이 예측력이 가장 좋았다.
앞서 열거된 연구들과 차별화하여 Andersen et al(2003), Andersen,
Bollerslev, Diebold and Vega(2007) 및 Elder et al(2013)은 거시경제
지표 뉴스발표의 실시간 영향을 분석하였다. Andersen et al(2003,
2007)가 분석한 자료는 세계 주요 선진국의 주식시장 인덱스, 환율 그
리고 채권가격 그리고 WTI 선물유가 등의 고빈도 자료이며 미국 분
기, 월간 경제지표 발표와 주간 실업수당 청구건수, FOMC 목표 정책
금리 뉴스 등의 가격영향을 추정하였다. Elder et al(2013)은 일부 거
시경제 지표 뉴스와 EIA가 발표하는 미 원유재고 발표의 선물유가 가
격변화 효과를 추정하였다. 이상의 연구들의 초점은 뉴스의 가격영향
분석이므로 일반적인 변동성 분석의 연구들과는 다소 거리가 있으나
경제 뉴스의 가격 점프 유발이라는 주제는 원유가격 등 석유시장에 적
용할 여지가 충분하므로 향후 해당 연구를 수행 할 경우 이들의 연구
방법론 등은 좋은 참고가 될 것으로 기대된다.

30
제4장 데이터 구축 및 변동성 추정

1. WTI 선물 데이터

RV 및 RS 계산에 사용된 데이터는 톰슨 로이터 Refinitiv의 WTI


최근월물 선물 계약12) 가격 자료이다. 2007년 1월 1일부터 2019년 9
월 31일까지의 자료를 이용하였다. 원래의 데이터는 나노초 단위로 기
록되며 약 4.33억 개로 규모가 매우 크며 5분 단위 종가로 정리된 데
이터는 약 1백 33만 개에 달한다13).
WTI 선물 계약 1단위는 1,000 배럴로서 만기까지 보유 시 원유가
오클라호마 쿠싱(Cushing)에서 인도(delivery)된다. 다음 달(front
month) 거래는 인도 전월 25일로부터 3 영업일(business day) 전에 종
료된다.
거래는 시카고 상품거래소(Chicago Merchantile Exchange, 이하
CME)의 지역시간(local time)인 미국 중부시간(CT)으로 17시에 시작
되어서 다음 날 16시14)에 종료되는 것이 일반적이며 다음 거래일까지
의 1시간은 휴식 기간(break)에 해당한다. 미국의 휴일이 포함되는 경
우에는 거래시간이 다소 다를 수도 있다. 주(week) 단위로 보면 거래
는 일요일 저녁에 시작되어서 금요일 오후에 마감된다.

12) Refinitiv에서는 개별 자료를 식별하기 위해서 RIC(Reuters Identification Code)를


이용하며 WTI 최근월물 선물에 해당하는 RIC은 CLc1이다.
13) 데이터 다운로드에는 Refinitiv에서 제공하는 API(Application Programming Interface)
를 이용하였으며 코드는 Python을 이용하여 작성되었다. 자세한 내용은 부록에
첨부되어 있다.
14) 2015년 9월 21일에 휴식 기간이 15분 증가하였다. 이전에는 거래가 16시 15분에
종료되어서 휴식 기간이 45분이었다.

제4장 데이터 구축 및 변동성 추정 31


2. 변동성 측도 계산

본 절에서는 변동성 예측과 점프 테스트에서 사용된 변동성 측도,


통계량 등의 계산에 대하여 기술하기로 한다.  거래일 번째 
-subinterval 내의 마지막 log-거래가격을    라고 표기하면 동

subinterval에서의 수익률 는 다음과 같이 정의된다.

 ≡            . (4-1)

2.1. RV

식 (3-6)에서 이론적으로 정의된 RV는 실증분석에서는 일간, 주간 및


월간의 시간단위로 구별되어서 계산되었다. 1일의 기간을 1이라고 하고
 시간(5분) 간격에서의 수익률을 구하여서 RV의 계산에 이용한다.
   시점(거래일    의 종료시점)과  시점(거래일 의 종료시점)

사이의 일중 Realized Variance인  는  거래일 하루 동안의 수익

률의 제곱합으로서 아래와 같이 계산하였다.


  


 . (4-2)

일간 RV에서는 수익률을 5분 단위로 구하였으며 해당 일의 최초의


가격은 17시에 가장 가까운 값인 개장 가격을 이용하였으며 이후 5분
단위로 종가를 구하여서 수익률을 계산한 후에 위의 식에 대입하여서

32
계산하였다.15)
[그림 4-1]은 분석기간 동안의 RV를 나타내며 일별 RV 등의 기술통계
량은 아래 <표 4-1>에 제시되어 있다.

<표 4-1> 주요 변동성 측도 기술 통계량

     
평균 0.000505 0.000250 0.000255

표준편차 0.000751 0.000409 0.000368

왜도 7.914119 9.607975 6.294147

첨도 127.607843 169.736144 80.874429

최소값 0.000006 0.000002 0.000004

최대값 0.018713 0.010593 0.008120

데이터 수 3,292 3,292 3,292

주간 및 월간 RV는 위에서 구한 일간 RV를 각각 5 거래일과 22 거래일


의 기간에 해당하는 일간 RV의 평균으로 계산하였다.

15) 개장 가격 1개와 23시간(1,380분) 동안 5분 단위의 종가 276개의 합인 277개의


가격으로 276개의 수익률을 구하여서 일간 RV 계산에 이용하였다. 거래가 없는
구간도 존재하여서 하루 가격의 개수가 277개보다 적은 날도 존재한다.

제4장 데이터 구축 및 변동성 추정 33


[그림 4-1] Historical RV

자료: Refinitiv 데이터를 가공하여 저자들이 작성

2.2. RS

RS는 RV 계산에 사용된 5분 단위 수익률이 양일 경우와 음일 경우


로 구분하여 변동성을 계산하는 측도로서 양의 RS와 음의 RS가 존재
하며 아래의 식과 같이 정의된다.


  


    . (4-3)

34

  


    . (4-4)

 ∙는 인디케이터 함수로 괄호 안의 조건이 만족하면 1을 그렇지


않으면 0의 값을 갖는다. RS가 구축되면 이를 이용하여 Patton and
Sheppard(2015)가 사용한 signed jump component16)를 계산할 수 있다.

[그림 4-2] Signed Jump Components

자료: Refinitiv 데이터를 가공하여 저자들이 작성

16) ∆ ≡          ,


∆  ≡        

제4장 데이터 구축 및 변동성 추정 35


2.3. BPV

BPV는 수익률의 교차곱을 합하여서 계산하며 식 (3-14)에 나오는


것처럼 인접한 수익률을 곱하여서 계산되며 skipped BPV는 식 (3-16)
에서와 같이 하나의 값을 건너뛰어서 구한 교차 곱으로 계산된다.

2.4. 점프 테스트를 위한 통계량

점프 테스트에서 사용된 통계량인  ,  ,  및  는 각각 식

(3-17), (3-18) 및 (3-19)에서와 같이 계산되었다. 해당 식을 다시 쓰면


아래와 같으며 분석대상인 선물유가에 적용한 결과는 아래 표에 제시
되어 있다.

    
 ≡ 
,
      max 

 ≡       



     ,

   ∙ ≤   ∙  


    ∙  

36
[그림 4-3] 점프의 변동성 기여분과 Skipped BPV

자료: Refinitiv 데이터를 가공하여 저자들이 작성

3. 외생변수 구축

본 연구에서는 유가 변동성을 설명하는 변수로서 과거 변동성 관련


변수 이외에도 WTI 선물시장 관련 변수, 석유수급 등 physical 시장
관련 변수 그리고 금융시장 등의 불확실성 인덱스 및 지정학 리스크
인덱스 등이 외생변수로서 고려된다.

제4장 데이터 구축 및 변동성 추정 37


<표 4-2> 외생적 설명변수 목록

구 분 세부 설명변수

Forward curve 기울기


선물 시장
비상업 투자자 매수/매도 포지션 비율
관련 변수
비상업 투자자 매수 및 매도 포지션 변화

석유 수요/공급 비율
석유 Physical market
OPEC 원유 여유생산능력/석유수요 비율
관련 변수
상업용 원유재고/석유 수요 비율

Ludvigson 거시/실물/금융 불확실성 전망치


불확실성 및
미국 정책 불확실성 지수
리스크 지수
중동지역 지정학 리스크 지수

VIX(S&P500 지수 월간 변동성 기대치)


외부 변동성 지수
OVX(WTI 월간 변동성 기대치)

3.1. WTI 선물시장 관련 변수

Haugom, Langeland, Molnar and Westgaard(2014)는 HARX 모형을


채택하여 유가변동성을 설명 및 예측하는데 외생변수로서 WTI 선물시
장의 관련 변수들을 사용하였다. Haugom et al(2014)가 사용한 외생변
수로는 1개월 이후의 유가 변동성에 대한 기대치에 해당되는
OVX(CBOE Oil Volatility Index), WTI 선물 거래량 및 거래회수, 청
산되지 않은 주문량을 의미하는 Open interest, 일별 유가 변화율,
Bid-ask 스프레드의 대용변수, WTI 선물가격 선도곡선(forward curve)
의 기울기 등이다. 이들의 연구는 기본적인 HAR 모형상의 과거 변동
성 변수들을 붙박이 변수로 고정해 놓고 여기에 OVX 및 기타 외생변
수를 조합하여 다양한 HARX 모형의 설명력과 예측력을 평가하였다.
일중 변동성의 경우 OVX, 유가 선물 거래량, 유가 수익률, forward

38
curve의 Contango의 정도 등의 계수가 과거 변동성 변수들과 더불어
강하게 통계적으로 유의한 것으로 보고되었다. 주중 및 월중 변동성의
경우에는 일중 변동성 분석에서 유의하게 나타난 변수들에 추가하여
Bid-ask 스프레드 대용변수가 유의성을 보였다.
본 연구에서는 WTI 선물시장 관련 외생변수로서 forward curve의
기울기 변수, 비상업 투자자들의 매수/매도 포지션 간 비율, 매수 포지
션의 변화율, 매도 포지션의 변화율을 고려하였다.
본 연구에서 Bid-ask 스프레드(BAS)를 고려하지 않은 이유는 다음
과 같다. RV를 이용한 일중 변동성 측도는 샘플링 빈도가 너무 크면
(예: tick-by-tick 혹은 1분 간격), BAS 및 거래비용 등으로 인해 noise
가 생기고 결과적으로 RV 변동성 측도가 편의성(bias)을 띄게 된다.
따라서, BAS를 설명변수로 넣으면 이로 인한 변동성 변화 영향을 통
제할 수 있게 된다. 그러나 만약 RV 측도에 편의(bias)가 크지 않다면
BAS를 설명변수로 포함할 필요성은 줄어들게 된다. 본 연구에서는 기
존연구에서처럼 5분 단위 수익률에 기초하여 RV를 계산하였는데 5분
단위 거래가격을 이용할 경우 noise가 현격히 감소한다고 알려져 있다
(예: Corsi, Mittnik, Pigorsch and Pigorsch, 2008). 이와 같은 기존 연
구결과를 토대로 본 연구에서는 BAS를 변수로 포함하지 않았다.
한편, 본 연구에서는 투기적 투자자들의 포지션이 변동성에 어떻게
영향을 미칠 수 있는가를 보기 위해 거래일 직전 발표된 포지션 데
이터를 설명변수 구축에 사용하였다. 구축된 설명변수는 투기적 투자
자들의 매수/매도 포지션 비율과 매수 포지션 및 매도 포지션 변화율
이다.

제4장 데이터 구축 및 변동성 추정 39


3.1.1. Forward curve 기울기

Forward curve 기울기 변수는 Haugom et al(2014)에서와 동일한 변


수를 사용하였다.  과  은 각각 시점에서의 3개월물 및 6개월
물 WTI 선물가격을 나타낸다. 근월물(3개월물)이 원월물(6개월물)보다
가격이 낮은 경우는 Contango 시장이라고 칭하고 반대의 경우는
Backwardation 시장이라고 말하므로, 변수  는 Contango의 정도를

측정하게 되고 정의상 음의 값을 갖는  변수는 그 절대값이

Backwardation의 정도를 나타내게 된다.

  
  max log    

(4-5)

  
  min log  


Forward curve의 기울기와 가격 변동성 간의 관계에 관한 대표적 이


론 연구는 Litzenberger and Rabinowitz(1995)와 Kogan, Livdan and
Yaron(2009)이다. 전자는 원유생산자가 call option17) 보유자에 해당하
며 근월물 가격이 원월물 가격보다 낮은 Contango 시장의 경우에는 현
재 시점에 call option이 행사(원유생산)되지 않을 것이므로 원유선물시
장은 항상 Backwardation 시장이어야 한다고 주장하였다. 또한 기초자
산(원유)의 변동성 증가는 call option 가치를 상승시키므로 call option
행사(원유생산)을 위해서는 더 큰 인센티브(더 강한 Backwardation)가
요구된다는 논리로 Backwardation과 유가 변동성 간의 정의 관계를 논

17) 행사가격은 유전생산비용, 매수자산 가치는 원유가격

40
증하였다.
반면 Kogan et al(2009)는 Backwardation과 Contango 모두 실제 투
자가 최적의 투자에서 이탈된 결과이므로 Backwardation과 Contango
의 정도가 증가하면 변동성이 상승할 것이라고 주장하였다.
이상의 이론적 관점과 별개로 시장 전문가들 사이에서는 현재(혹은
가까운 미래)의 수급상태가 Backwardation 혹은 Contango를 결정하는
주요 요인이라고 알려져 있다. 현재 실제 원유수급이 초과공급을 나타
낼 경우 일 경우 현재의 가격이 낮아지므로 Contango 시장이 실현되
며 반대의 경우인 공급부족 상황에서 Backwardation 시장이 관찰된다
는 것이다.

3.1.2. 비상업 투자자 포지션

비상업(non-commercial) 투자자들은 정유업자 등 producer가 아닌


선물시장의 가격등락을 이용하여 금전적 이익을 추구하는 부류로서
money manager, hedge fund 등을 포괄한다. 통상 비상업 투자자는 투
기성 투자자(speculative investor)로 인식되고 있으며 미국 상품선물거
래위원회(CFTC)는 매주 화요일 기준 비상업 투자자들의 매수포지션
및 매도포지션을 발표하고 있다.
앞서 설명한 대로  거래일 직전 선행 주간에 발표된 포지션 자료를
바탕으로 매수/매도 포지션 비율(  ), 이전 주 대비 매수 포지션 변화
율( ∆ ), 매도 포지션 변화율( ∆ )을 계산하여 설명변수로 사용하였다.

제4장 데이터 구축 및 변동성 추정 41


[그림 4-4] 선물시장 관련 설명변수

자료: Reuters Eikon의 원자료를 저자가 가공

3.2. 석유 physical market 관련 변수

저자들의 문헌조사 결과 기존연구에서는 석유 physical market과 관


련한 변수를 설명변수로 채택한 경우가 전무하였다. 이는 첫째, 석유수
급 및 재고 등 physical market 관련한 변수들은 월 주기로 발표되기 때
문에 빈도가 높은 변동성 시계열과의 연관성이 낮을 가능성이 존재하
고, 둘째, IEA(International Energy Agency) 혹은 EI(Energy Intelligence)
등의 수급 및 재고 자료들은 무료로 제공되지 않으며 이미 발표된 특정
월의 자료수치가 이후에 수정되는 등 연구를 위한 자료구축 과정이 쉽
지 않기 때문일 수 있다고 생각된다.

42
[그림 4-5] 석유 Physical market 관련 변수

자료: IEA, Oil Market Report(2007년 6월호 2019년 5월호); EI, Oil Market
Intelligence(2007년 6월호 2019년 5월호)의 원자료를 저자가 가공

본 연구에서는 석유시장 physical market 데이터가 특히 월중 변동


성을 설명하는 설명력이 있을 수 있다는 판단 하에 해당 자료들을 구
축하여 설명변수로 사용하였다.
우선, EI에서 Oil Market Intelligence 월간보고서를 통해 발표하는
세계 석유(petroleum) 수요 및 공급량을 이용하여 수요/공급 비율(  )
을 계산하였다. 다음으로 역시 EI에서 발표하는 원유(commercial
crude oil)의 재고량을 해당 월의 석유수요량으로 나누어 계산한 변수
( ) 그리고 IEA Oil Market Report 월간보고서를 통해 발표하는
월별 OPEC spare capacity를 월간 세계석유수요로 나누어 계산한 변
수( )를 고려하였다.
이상의 변수들은 실제 석유 수급상황, 원유재고 변화 및 비상시 원

제4장 데이터 구축 및 변동성 추정 43


유공급 가능정도 등이 유가 변동성에 어떤 영향을 갖는지 평가하기 위
해 설명변수로서 고려되었다.

3.3. 불확실성 지수

3.3.1. Ludvigson 불확싱성 지수

Jurado, Ludvigson and Ng(2015, AER)는 경제의 불확실성(이하


‘Ludvigson 불확실성’으로 표기)을 측정하는 방법에 관하여 새로운 방
법을 제시하였다. 기존의 실증분석에서는 불확실성을 측정하는 지표로
주로 네 가지의 지표를 사용하였다. 이에 해당하는 것으로는 주식 수
익률의 변동성(implied or realized volatility), 기업의 이윤, 주식 수익
률, 생산성 등의 횡단면 편차(corss-sectional dispersion), 서베이
(survey) 자료와 같은 주관적 예측치의 횡단면 편차, 언론매체에 등장
하는 불확실성과 관련된 키워드 등이 있다.
Jurado et al(2015)은 특정 모형의 구조 및 소수의 관찰 가능한 변수
에 크게 영향을 받지 않으면서 경제의 불확실성을 측정하는 계량경제
학적 추정치(econometric estimates)를 FAVAR(Factor Augmented
Vector Autoregression) 모형을 이용하여 추정하였다. 이들의 핵심적
인 아이디어는 다수의 경제 시계열 자료로부터 소수의 요인(factors)을
추정하여서 예측 모형(forecasting model)에 포함시키는 것이다.18)

18) 이러한 방법은 diffusion index forecasting이라 불리며 데이터가 많은 상황(data rich
environments)에서 널리 사용되는 방법이다.

44
[그림 4-6] Ludvigson 금융 불확실성

자료: Sydney Ludvigson 홈페이지(웹주소는 참고문헌에 제시)


주: h=1은 1개월 후, h=3은 3개월 후, h=12는 12개월 후 불확실성 전망치임

Jurado et al(2015)은 거시경제관련 132개의 자료로 구성된 데이터셋


및 금융관련 변수 147개로 구성된 데이터셋19)을 이용하여 거시 불확
실성(macro uncertainty) 및 금융 불확실성(financial uncertainty)를 구
하였다. 또한 이후에 거시 데이터셋에서 실물부문 변수와 관련된 73개
의 데이터를 구분하여 불확실성 지수를 구한 후 이를 실물부문 불확실
성(real uncertainty)라 명명하였다.

19) 거시경제관련 데이터셋은 생산, 소비, 노동시장, 주택, 재고, 신규주문 등의 실물


지표와 통화, 신용, 채권, 환율, 물가 및 주식시장 등의 금융 관련 지표들로 구성
되어 있는데 거시 불확실성은 동 데이터셋을 모두 활용하여 계산하고 실물 불확
실성은 실물지표들만을 이용하여 계산함. 금융 불확실성 전망을 위해 사용되는
데이터셋은 CRSP 배당수익률, Kenneth French가 제공하는 산업별, Size 및 Book-
to-Market 기준으로 구성한 포트폴리오들의 수익률 등으로 구성됨.

제4장 데이터 구축 및 변동성 추정 45


[그림 4-7] Ludvigson 거시 불활실성

자료: Sydney Ludvigson 홈페이지(웹주소는 참고문헌에 제시)


주: h=1은 1개월 후, h=3은 3개월 후, h=12는 12개월 후 불확실성 전망치임

불확실성 지수는 매년 2회 업데이트되며 저자들이 관리하는 홈페이


지에 공개되고 있다. 금융, 거시 및 실물부문 불확실성은 각각 [그림
4-6], [그림 4-7] 및 [그림 4-8]에 제시되어 있다.
분석의 예측모형에서는 위의 불확실성 지수를 스무딩(smoothing)하
여서 사용하였으며 이는 [그림 4-9]에 제시되어 있다. [그림 4-9]에 제
시된 값은 1개월 선행 불활실성 전망 지수를 각 거래일에 맞게 스무
딩한 결과이다. 예를 들어 1월 15일 기준 향후 1개월불확실성 지수는
향후 1개월이 1월 16일에서 2월 15일까지이므로 1월과 2월 불확실성
지수를 0.5씩 가중평균 하여 계산하였다.

46
[그림 4-8] Ludvigson 실물부문 불확실성

자료: Sydney Ludvigson 홈페이지(웹주소는 참고문헌에 제시)


주: h=1은 1개월 후, h=3은 3개월 후, h=12는 12개월 후 불확실성 전망치임

[그림 4-9] Ludvigson Smoothed Uncertainty

자료: Sydney Ludvigson 홈페이지(참고문헌 웹주소 참조) 자료 토대로


저자가 작성

제4장 데이터 구축 및 변동성 추정 47


3.3.2. 정책 불확실성 지수

Baker, Bloom and Davis(2016, QJE)는 특정 단어20)를 포함한 신문


기사 수를 이용하여 경제 정책 불확실성(economic policy uncertainty)
지수를 제시하였다. 미국의 정책불확실성 지수는 대선, 1·2차 걸프전,
9/11 테러 공격, Lehman Brothers 파산, 2011년 부채 논의(debt ceiling
dispute) 및 재정정책에 관한 첨예한 의견 대립이 존재한 시기에 높아
진 것으로 나타났다. 이후 매년 업데이트된 자료를 홈페이지에 올리고
있으며 글로벌 지수와 영국, 독일 및 유럽 지수 등을 제시하여서 그 범
위를 넓히고 있다. 홈페이지에 공개된 미국의 정책 불확실성 지수를
살펴보면 [그림 4-10]과 같다.

[그림 4-10] 미국의 정책 불확실성 지수

자료: https://www.policyuncertainty.com/ (접속일자: 2019.6.27.)

20) 세 가지 항목(“economic” or “economy”; “uncertain” or “uncertainty”; and one or more


of “Congress,” “deficit,” “Federal Reserve,” “legistration,” “regulation,” or “White
House.”)을 포함한 신문 기사를 검색하였으며 미국의 주요 신문 10개를 조사대상
으로 하였다.

48
3.4. 지정학적 리스크, 주식 및 원유 선물시장 변동성 인덱스

3.4.1. 지정학적 리스크 지수(GPR Index)

Caldara and Iacoviello(2018)는 지정학적인 긴장관계를 다룬 신문


기사에 기반을 둔 월별 지정학적 위험 지수를 제시하였다. GPR 지수
([그림 4-11] 에 제시)는 걸프전, 9/11 테러 공격 이후, 2003년 이라크
침공, 2014 러시아-우크라이나 위기 및 파리 테러공격 시기에 상승한
것으로 나타났다. 이들은 계량적 분석을 통해 GRP 지수가 실질경제
활동의 하락, 주식 수익률의 하락 그리고 개도국에서 선진국으로의 자
금 이동과 관련이 있음을 보였다.

3.4.2. OVX 및 VIX21)

OVX는 CBOE에서 작성하는 원유 변동성 지수(CBOE Crude Oil


Volatility Index, OVX)이며 원유 가격의 향후 30일 변동성에 대한 시
장의 기대치를 나타낸다다. VIX는 CBOE에서 제공하는 변동성 지수
(CBOE Volatility Index, VIX)로서 S&P 500 지수 옵션에 반영되는 주
가들로부터 계산되며 시장과 투자자의 위험에 대한 인식(sentiments)을
나타내는 것으로 여겨진다. 이들 지수들은 두려움 측도(Fear Gauge),
두려움 지수(Fear Index) 등으로 불린다. OVX 및 VIX는 [그림 4-11]
에 제시되어 있다.

21) CBOE 홈페이지 및 Investopedia 웹사이트를 참고하여 작성되었으며 URL은 부록


에 제시되어 있다.

제4장 데이터 구축 및 변동성 추정 49


[그림 4-11] GRP Index, VIX 및 OVX

자료: Matteo Iacoviello 홈페이지(GPR, 주소는 참고문헌에 제시),


CBOE(VIX, OVX)

50
제5장 변동성 설명 및 예측

1. In-sample 변동성 설명

1.1. 변동성 예측 모형

본 절에서 다룰 In-sample 분석은 유가변동성 전망모형의 결정을 위


한 사전 단계로서 각 모형 및 설명변수의 변동성 설명력을 평가하여
변동성 전망모형을 선택하는데 있어서 지침을 제공한다.
분석의 대상이 되는 모형은 Corsi(2009)의 HAR모형, Andersen,
Bollerslev and Diebold(2007)의 모형(HAR-CJ로 표기), Patton and
Sheppard(2015)의 모형(HAR-RS로 표기) 등이다. 외생변수를 포함시
키지 않은 채로 위 세 가지 모형 등의 설명력을 비교한 후 HAR-CJ 모
형과 HAR-RS 모형 두 가지 모형에는 외생변수를 추가하여 변동성 설
명력을 살펴보기로 한다.

HAR:                  

HAR 모형은 앞서 설명한 바와 같이 미래의 변동성을 과거 일일, 주


간, 월간 변동성으로 설명하는 모형이다. 이 모형은 변동성의 시점 간
의존성(temporal dependence)을 이용하되 비교적 적은 수의 설명변수
들을 사용한 효율적 모형으로 평가 받고 있다.

제5장 변동성 설명 및 예측 51
HAR-CJ:              
             

자산가격의 점프 발생을 허용하는 보다 일반화된 모형을 고려한다면


변동성을 integrated variance와 점프의 기여부분으로 분해하여 각 구성
요소가 미래 변동성을 얼마나 설명하는지 구분하여 평가할 필요가 있
다. 이것은 각 요소와 미래 변동성과의 관계가 상이하기 때문인데 가
령 어제 가격이 급등하는 점프가 발생한 경우와 점프 없이 변동성이
실현된 두 경우에 있어서 양자가 Realized Variance의 크기는 같은 경
우라 할지라도 오늘의 변동성에 미치는 영향의 정도는 다를 수 있기
때문이다. 이러한 특성들을 반영하기 위해 HAR-CJ 모형은 과거
daily/weekly/monthly RV를 점프테스트를 통해 점프와 비점프 요인으
로 구분하여 별도의 설명변수로 사용한다.

HAR-RS:              


 ∆    ∆     

HAR-RS 모형은 직전 거래일의 가격상승으로 인한 변동성과 하락으


로 인한 변동성을 구분하는 것을 주요한 특징으로 한다. 변수 ∆   는

상승으로 인해 실현된 변동성이 하락으로 인한 변동성보다 클 때 그 초


과분(양의 값)을 의미하고 ∆   는 상승으로 인한 변동성이 하락으로 인
한 변동성보다 작을 때 그 차이(음의 값)를 의미한다. 이 변수들은
Good Volatility(상승으로 인한 변동성)와 Bad Volatility(하락으로 인한
변동성)의 상대적 크기가 미래의 변동성에 차별화된 영향을 가질 수 있
다는 직관을 실증하기 위해 도입되었다. Patton and Sheppard(2015)은

52
미국 S&P 500 인덱스 ETF(Exchange traded fund) 등에 적용하여
Good Volatility가 Bad Volatility보다 큰 경우 미래의 변동성이 감소하
는 경향이 있고 반대의 경우는 다음 날의 변동성이 커지는 효과가 있음
을 보였다.
본 연구에서는 이와 같은 기존 문헌상의 모형에 석유 선물 및
physical 시장 관련 변수(4장 3절 참조) 등을 추가한 아래의 모형을
WTI 선물유가 변동성 분석에 적용하였다.

HAR-CJ-X:              


           ′    

HAR-RS-X:              


 ∆    ∆   ′    

위 모형에서 변수  는 4장 3절에 열거한 외생변수들을 포함된다.

피설명변수는 daily 변동성 분석(  )의 경우 +1 시점 일중 RV,


weekly 변동성 분석(  )은    시점에서    시점 사이의 주중
(5 거래일) RV, monthly 변동성 분석(  )은 t+1 시점에서 t+22 시
점 사이의 월중(22 거래일) RV가 사용된다.
이하의 회귀분석 결과 상의 t-value는 Newey-West 표준오차를 이용
한 값이며 Newey-West 표준오차 계산 시 적용한 lag의 개수는 예측시
계에 따라 각각 5(daily 분석), 10(weekly 분석) 및 44(monthly 분석)이
다. 유의수준 10%에서 통계적으로 유의할 경우 *, 5% 유의성은 **,
1% 유의성은 ***로 표시한다.

제5장 변동성 설명 및 예측 53
1.2. 모형별 변동성 In-sample 회귀분석 결과

1.2.1. HAR 모형 결과

<표 5-1> 회귀분석 결과(HAR)

HAR        상수항


daily coeff. .096 .508 .345 .00003
Adj.   =60.59% t-value 1.25 3.39*** 2.87*** 1.41

weekly coeff. .116 .380 .433 .00003


Adj.   =77.69% t-value 2.04** 3.72*** 4.03*** 1.70

monthly coeff. .070 .394 .389 .00007


Adj.   =75.87% t-value 3.00*** 5.71*** 3.63*** 2.34

HAR 모형을 WTI 선물유가 변동성에 적용한 결과 거의 모든 경우에 세


가지 과거 변동성 설명변수들의 계수가 양수로 나타났다. 예외적으로 일일
변동성 설명에 있어서 전일 변동성의 영향이 통계적으로 유의미하지 않았다.

1.2.2. HAR-CJ 모형 결과

<표 5-2> 회귀분석 결과(HAR-CJ)

HAR-CJ               상수항


daily coeff. .104 .539 .311 -.025 -.133 .191 .00003
Adj.   =61.0% t-value 1.20 3.38*** 2.40** -.91 -1.31 1.10 1.63

weekly coeff. .126 .400 .407 -.018 -.074 .111 .00004


Adj.   =78.10% t-value 2.39** 4.38*** 4.19*** -1.11 -.86 .57 1.91

monthly coeff. .076 .419 .362 -.012 -.113 .536 .00008


Adj.  =76.17% t-value 2.78*** 5.87*** 3.43***

-1.33 -.64 .64 2.33

54
변동성을 integrated variance와 점프로 구분하여 변동성을 설명하는
HAR-CJ 모형의 결과는 <표 5-2>에 제시되어 있다. 점프에 의한 변동
성 설명변수는 통계적으로 유의지 않으며 integrated variance( ) 설명
변수들의 계수들은 양의 부호로서 통계적 유의성을 지닌다. HAR 모형
에서와 동일하게 익일 변동성이 피설명변수인 경우 전날 일중 변동성
은 통계적 유의성이 없다. 점프 변수들이 유의하지 않게 나온 결과도
DM/USD 환율과 미국 S&P 500를 분석한 Andersen, Bollerslev and
Diebold(2007)의 결과와 유사하다. 전주 및 전월 변동성 변수의 계수
가 상대적으로 크게 추정되고 통계적 유의성이 더 큰 점도 WTI 시장
과 기존 환율/주식 시장 연구결과와의 공통점이다. 기존 연구와의 차이
점은 WTI 선물시장의 경우 전날 변동성 변수의 계수가 상대적으로 작
고 통계적으로 유의하지 않게 나온 점이다. 일별 변동성의 자기상관성
이 높음을 감안할 때 이러한 결과는 다소 의아한 측면이 있다. 다음 절
에서는 전날의 변동성을 integrated variance 요소와 Good/Bad 변동성
요소로 구분한 HAR-RS 모형의 추정결과를 제시하는데 전일 변동성의
통계적 유의성 측면에서 HAR-CJ 모형결과와 큰 차이를 보인다.

1.2.3. HAR-RS 모형 결과

<표 5-3> 회귀분석 결과(HAR-RS)

HAR-RS        ∆  ∆  상수항


daily coeff. .236 .350 .291 -.155 -1.51 .00001
Adj.   =65.6% t-value 3.46*** 2.81*** 2.73*** -1.14 -2.26** .80
weekly coeff. .341 .278 .365 -.484 -.408 
Adj.   =80.4% t-value 4.62*** 3.87*** 4.17*** -2.59*** -3.22*** 1.68
monthly coeff. .220 .324 .341 -.386 -.400 
Adj.   =77.8% t-value 5.70*** 4.78*** 3.35*** -3.02*** -4.81*** 2.39

제5장 변동성 설명 및 예측 55
HAR-RS 모형의 추정결과는 위의 표에 제시되어 있다. 거의 모든
설명변수들이 미국 주식시장을 분석한 Patton and Sheppard(2015)에서
처럼 통계적으로 유의하다. 전날 변동성 중 점프의 기여분이 제거된
BPV 변수와 전주 및 전월 변동성은 미래 변동성에 양의 영향을 주고
있다. ∆  변수의 계수는 음수로 추정되었는데 이는 전날 Good
Volatility가 크면 클수록 미래의 변동성이 작아지는 효과가 있음을 보
여준다. 반면, 정의상 음의 값을 갖는 ∆  변수의 계수의 부호도 음인
데 이는 Bad Volatility가 클수록 미래의 변동성이 커짐을 뜻한다. 이
추정 결과는 가격상승을 동반한 변동성이 컸던 거래일의 다음날에는
변동성이 작아지는 경향이 있고 가격하락으로 인한 변동성이 상대적으
로 컸던 거래일 다음날에는 변동성이 상승하는 경향이 있다는 점을 의
미한다. 다만, Patton and Sheppard(2015)가 분석한 주식시장 변동성의
경우 ∆  계수의 절대값이 ∆  의 계수 절대값보다 현저히 크게 나타
나는 비대칭성을 보였지만 본 연구에서 분석한 WTI 선물시장은 두 변
수의 계수 크기가 유사하게 추정되었다. 즉 주식과 WTI 선물시장 모
두 전날 가격하락을 동반한 변동성이 가격상승 변동성 보다 크면 다음
날 변동성이 커지고 반대의 경우에는 다음 날 변동성이 작아지는 경향
이 존재하지만 주식시장은 전자의 효과가 후자보다 상대적으로 큰 반
면 원유선물 시장에서는 양자가 비슷한 크기로 나타났다. 이는 원유선
물시장 변동성이 주식시장의 그것에 비해 가격하락에 대해 상대적으로
덜 민감하다는 점을 시사한다.
한편 위 표의 실증결과를 보면 전날 변동성(BPV 변수)이 미래 변동
성에 대한 통계적으로 유의한 설명력을 보이고 있다. 이는 앞서 봤던
HAR-CJ 모형의 실증결과와 차별되는 점인데 Good-Bad 변동성( ∆  ,
∆  )을 설명변수로 포함하지 않는 HAR-CJ 모형의 추정결과는 -기존

56
타 시장에 대한 실증결과와는 달리- 전일의 변동성(  )의 설명력이 높
게 나오지 않거나 통계적으로 유의하지 않게 나온 반면 전일의 변동을
BPV와 Good/Bad 변동성 등으로 분해하여 사용한 HAR-RS 모형에서
는 전일 변동성 (BPV)의 설명력이 존재함이 드러났다. 이는 WTI 선물
가격 변동성의 경우 전일 변동성의 가격하락/상승 속성 구분의 중요성
을 의미하는데 세분화된 설명변수를 사용한 HAR-RS 모형이 각 변수
들의 설명력을 올바르게 추정한 것으로 판단된다.

1.2.4. HAR-CJ-X 모형 결과

HAR-CJ 모형에 외생변수를 추가한 HAR-CJ-X 모형의 추정결과는


아래 표에 제시되어 있다. 4장 6절에서 언급한 변수 중 석유재고 관련
변수와 정책 불확실성 지수 등은 예비분석 단계에서 설명력이 현저히
낮은 것으로 나타나 본 분석에서는 제외하였다.
우선, HAR-CJ 모형과 HAR-CJ-X 모형의 추정 결과를 비교하면 다
음과 같다. 외생변수 추가에 따라 HAR-CJ 모형 추정 결과에서 통계적
으로 유의했던 과거 월간 변동성 변수(    )는 더 이상 유의하지 않
다. 직전 거래일 변동성 변수(  )의 계수도 HAR-CJ 모형 결과에 비해
크기가 줄어들었을 뿐 아니라 (monthly 분석의 경우에서는) 통계적 유
의성도 사라졌다. 과거 점프의 영향은 종전과 마찬가지로 대부분의 경
우 통계적 유의성이 없는 것으로 나타났다.
새로 추가한 외생변수들의 경우 유가 선물의 forward curve 기울기,
OPEC여유생산능력 관련 변수( ), 미 주식시장의 1개월 후 변동성
기대치를 나타내는  변수, Ludvigson의 금융시장, 실물부문, 거시경
제 1개월 후 불확실성 지수 등이 미래 유가 변동성에 대한 설명력이

제5장 변동성 설명 및 예측 57
있었다.
Contango 의 정도를 측정하는  변수는 일간/주간/월간 모든 분석
에서 미래의 변동성에 통계적으로 유의한 (+)의 영향을 미치는 것으로
추정되었다. Backwardation의 정도를 측정하는  변수 일간 분석에
서 통계적으로 유의하고 그 계수의 부호를 음수로 추정되었다. 이 변
수 자체가 음수이므로 Backwardation의 정도가 커질수록(  의 절대
값이 커질수록) 미래 변동성이 커진 것으로 추정되었다. 요약하면
Contango이든 Backwardation이든 그 정도가 클수록 미래의 변동성이
증가하는 경향성을 의미하는데 이 결과는 Kogan et al(2009)과
Lizenberger and Rabinowitz(1995)의 이론과 부합한다.
비상업 선물 투자자(투기적 투자자)의 포지션 관련 변수는 대부분의
경우 미래 변동성을 설명하지 못 하는 것으로 나타났다. 해당 변수들
이 갖는 정보의 내용은 대부분 타 변수들과 중첩되어 통계적 유의성은
발견되지 않는 것으로 판단된다.
세계 석유수급 변수(  )도 월간 변동성 분석의 경우를 제외하면 설
명력이 없는 것으로 나타났다. 수급관련 변수는 유가 수준에는 직접적
으로 영향을 미치겠으나 변동성 자체에 대한 설명력은 낮은 것으로 해
석할 수 있다. 단 월간 변동성 분석의 경우 석유수요의 공급 대비 비율
이 상승하면 변동성이 통계적으로 유의하게 낮아지는 것으로 추정되었
다. 이는 공급량 대비 수요량이 커지는 타이트한 시장상황에서 오히려
변동성이 낮아지는 경향성이 있다는 점을 의미한다. 즉, 해당 변수의
값이 커지면 당연히 유가는 상승하겠지만 유가변화의 변동성은 하락한
다는 것이다. 이 결과는 앞서 보았던 HAR-RS 모형의 실증결과와 연
결 지어 설명될 수 있다. 석유수급 비율변수가 커지면 유가는 상승세
를 보이고 그에 따라 Good 변동성이 Bad 변동성보다 크게 나타날 공

58
산이 큰데 HAR-RS 실증결과에 따르면 이는 미래 변동성의 하락으로
이어진다. 그런데, HAR-CJ-X 모형에서는 Good/Bad 변동성 설명변수
가 포함되어 있지 않으므로 수급비율 변수의 움직임에는 Good/Bad 변
동성 정보가 내포될 가능성이 있으며 이로 인해 추정된 계수의 부호가
음으로 나타날 수 있을 것으로 판단된다.
석유시장의 1개월 후 변동성 기대치를 나타내는 OVX 변수는 월간
변동성 예측에 있어서 예상과 다르게 통계적 유의성이 낮게 나타났다.
이는 해당 변수가 과거 RV 설명변수, Ludvigson 불확실성 변수들과
정보의 내용이 중복되어 나타난 결과로 추정된다.

<표 5-4> 회귀분석 결과(HAR-CJ-X)


Daily Weekly Monthly
HAR
Adj.   =63.26% Adj.   =81.74% Adj.   =83.56%
-CJ-X
coeff. t-val coeff. t-val coeff. t-val
 .061 .85 .083 2.09** .029 1.49
   .430 2.84*** .291 3.67*** .298 5.46***
   .054 .41 .148 1.12 .052 .54
 -.027 -.93 -.022 -1.39 -.021 -2.27**
   -.145 -1.89* -.085 -1.05 -.114 -.89
   -.104 -.39 -.174 -.50 .272 .57
 .004 2.84** .005 3.77*** .005 2.04**
 -.002 -2.41** -.001 -1.76*  .40
∆  .51 .003 .93 .001 .70
  1.37  1.03  .84
∆  1.14  1.44  1.86*
∆  .87  1.06  1.47
  1.15  1.39  1.61
  .02   -.83 -.002 -2.19**
   -2.63***   -3.19***   -3.25***
  3.20***  1.94*  1.05
  4.51***  4.99***  2.40**
   -4.10***   -2.70***   -1.32
   -2.36**   -1.70*   -.15
  .003 3.91*** .003 3.92*** .004 2.97***
상수항 -.001 -1.77 -.001 -1.09  .15

제5장 변동성 설명 및 예측 59
OVX 변수만을 이용한 변동성 모형의 경우 본 보고서에서 고려한
모형들보다   값이 현저히 낮게 나타났다. 또한 본 보고서에서 고려
한 회귀모형에서 OVX 변수의 설명력이 낮게 나타난 점은 본 연구에
서 택한 변동성 설명변수들이 OVX 가 갖는 설명력을 대부분 포함하
고 있다는 점을 보여준다.
미국 주식시장 1개월 후 변동성 기대치를 나타내는 VIX 지수는 유
가 변동성에 (+) 영향을 미치는 것으로 추정되었다. 이는 주식시장과
원유선물시장 변동성 간의 변동성 spill-over 가능성을 시사하는 결과
이다.
Ludvigson의 불확실성 변수들 중 특히 실물부문의 불확실성을 나타
내는   변수는 유가 변동성과 밀접한 관계가 있는 것으로 나타났
다.22) 실물부문 불확실성 지수는 유가 변동성을 상승시키는 것으로 추
정된 반면 거시경제 및 금융시장 불확실성 변수는 예상과 달리 유가
변동성의 하락으로 이어진다. 거시경제 중 금융시장 및 거시경제 불
확실성이 유가 변동성을 낮추는 것은 다소 의아한 결과이다. 단, 금융
시장 불확실성 변수에 포함되는 정보의 내용이 미국 주식시장 변동성
기대 변수인 VIX가 담고 있는 정보와 중복되는 것을 감안한다면, 금
융시장 불확실성 변수에 포함된 주식시장 외의 금융시장의 불확실성은
유가의 변동성과 반대로 움직인다는 가설을 상정해 볼 수 있지만 보다
면밀한 결론을 도출하기 위해서는 별도의 연구가 필요할 것으로 판단
된다.
중동지역 지정학적 리스크를 측정하는  변수는 그 계수가 양수로

22) 이는 경제지표 발표와 순간적인 유가 변화의 관계에 대해 연구한 Elder et al(2013)


의 결과를 연상케 한다. 해당 연구에서는 비농업부문 임금소득 변화(Changes in
nonfarm payrolls) 등의 뉴스에 유가가 크게 반응함을 발견하였다.

60
추정되어 유가 변동성과 정의 관계에 있었지만 통계적 유의성은 낮게
나타났다. 이 또한 지정학적 리스크 변수가 담고 있는 정보가 상당 부
분 타 설명변수의 정보와 중복되어 나타난 결과로 추정된다.
마지막으로 유로화 대비 미 달러 환율의 일간 변화는 유가 변동성과
큰 관련이 없는 것으로 나타났다. 미국 달러화 가치가 유가 수준과는
관련성이 있다는 것은 알려져 있으나 변동성을 설명하기에는 부적합한
변수인 것으로 판단된다. 환율 변화 변수가 일간 단위로 구축된 변수
인 것을 감안하면 차주 혹은 차월의 유가 변동성과 큰 관련이 없다는
결과는 예상할 수 있는 결과이다. 단 환율시장의 과거 변동성(주간 내
지는 월간)을 RV 측도를 이용하여 계산하여 설명변수로 사용한다면
설명력이 존재할 것으로 추정된다.

1.2.5. HAR-RS-X 모형 결과

비교적 설명력이 높고 각 변수의 통계적 유의성도 확인되었던


HAR-RS 모형에 외생변수를 추가한 HAR-RS-X 모형의 추정결과는
<표 5-5>에 제시되어 있다. 과거 월중 변동성(    ) 변수를 제외하면
모든 RV 관련 변수가 대부분의 경우 통계적 유의성을 보이고 있다. 전
날의 변동성, 전주의 변동성 그리고 Good/Bad 변동성과 관련한 ∆  와

∆  변수 모두 미래의 변동성 설명력을 지니고 있다. 이외에도


forward curve 변수들도 대부분 설명력을 보였는데 전날의 Contango
정도는 일간/주간/월간 변동성에 (+)영향을 미치며 Backwardation 정도
는 일간/주간에 (+) 영향을 갖는다. 환율변화(유로화 대비 달러가치 하
락)는 익일 변동성을 높이는 영향이 있지만 차주 및 차월 유가 변동성
과는 큰 관련성이 없다.

제5장 변동성 설명 및 예측 61
앞선 모형에서처럼 미 주식시장의 1개월 후 변동성 기대치인  변수는
미래 유가 변동성과 강한 정(+)의 관계를 보인 반면 원유시장  에 해당하는
 변수는 익월 유가 변동성에 추가적인 설명력을 갖지 못 한다.
불확실성의 정도에 대한 전망치인 Ludvigson 불확실성 지수도 유가
변동성을 설명하는 것으로 나타났다. 실물부분의 불확실성(   )의 확
대는 미래 유가 변동성을 높이는 반면 거시경제 전반적 불확실성
(  )은 유가 변동성에 대한 유의한 설명력을 보이지 않았다. 금융시
장의 불확실성 상승(  )은 HAR-CJ-X 모형 결과에서와 동일하게 유
가 변동성을 낮추는 것으로 나타나 이에 대한 이유에 대해서 앞에서
언급한 것처럼 추가적인 연구가 필요해 보인다.
비상업 투자자의 포지션은 전주에 매도포지션 대비 매수포지션이 높
을수록 익일 변동성을 상승시키는 영향을 보였다. 매도 포지션 변화는
변동성 설명력이 낮으나 매수포지션의 변화는 차주 혹은 차월의 변동
성과 정(+)의 관계가 있다.
석유 physical market 관련 두 변수들 중 수급비율 변수(  )는 향후
1개월 변동성에 대해서만 설명력을 갖고 OPEC 여유생산능력 관련 변
수( )는 향후 1주 및 1개월 변동성에 대해서 설명력을 보이는 것
으로 추정되었다. 첫째, 수급비율의 증가는 변동성을 하락시키는 것으
로 추정되었는데 이에 대한 설명을 위해 앞 절(HAR-CJ-X 추정결과)
에서 제시된 해석을 준용할 수 있다. 한 가지 추가적으로 고려해야할
점은 HAR-RS-X 모형의 경우 HAR-CJ-X 모형과 달리 Good/Bad 변동
성 변수를 명시적으로 설명변수로 사용함에도 불구하고 수급비율 변수
의 계수가 여전히 음수로 추정되었다는 점이다. 하지만 HAR-RS-X 모
형에 포함된 Good/Bad 설명변수들( ∆  , ∆  )은 예측시점 당일의 변

62
동성 속성임을 상기할 필요가 있다. 향후 1달 간의 변동성은 -HAR-RS
모형 추정결과에 따르면- 예측기간에 속하는 각 거래일의 Good/Bad
변동성에 의해 영향을 받게 되는데 만약 예측시점의 수급비율 변수가
향후 1개월 기간 동안의 Good/Bad 변동성에 대한 정보를 일부 포함한
다면 수급비율 변수의 계수가 음수로 나타날 가능성이 존재하게 된다.
예를 들어 타이트한 수급상황이 당분간 지속되는 경우(즉,  값이 상
대적으로 큰 경우)를 상정하자. 수급이 타이트한 상황에서는 향후 일
정기간 동안 유가는 상승할 가능성이 높고 따라서 향후 각 거래일 마
다 Bad 변동성보다 Good 변동성이 클 가능성이 높아지게 되며,
-HAR-RS 추정결과에 따르면 Good 변동성이 크면 다음 거래일의 변
동성이 작아지는 효과가 있으므로- 종국적으로 해당 기간 동안의 변동
성이 작아지는 결과를 낳게 된다. 둘째, 석유수요량 대비 OPEC의 여
유생산능력(spare capacity)의 비율이 클수록 유가 변동성은 낮아지는
것으로 추정되었다. 특정 기간에 가격의 변동성이 다른 기간보다 크게
나타나는 이유 중 하나는 석유시장 관련 뉴스에 대해 시장참가자들이
더 민감하게 반응하기 때문일 것이다. OPEC 여유생산능력 비율 변수
와 관련이 있는 석유시장 사건으로는 비OPEC 산유국에서의 생산차질
을 상정해 볼 수 있다. OPEC의 여유생산능력이 충분한 상황에서는 특
정 산유국에서 생산차질이 발생한다 하더라도 세계 석유수요를 충당할
만큼의 원유공급이 빠른 시일 내에 가능해 지므로 시장참가자들의 반
응정도 및 가격변화 정도는 낮을 가능성이 큰 반면 여유생산능력이 수
요 대비 충분치 못할 경우에는 동일한 수준의 생산차질 소식에도 가격
이 크게 반응할 수 있음을 짐작해 볼 수 있다.

제5장 변동성 설명 및 예측 63
<표 5-5> 회귀분석 결과(HAR-RS-X)

Daily Weekly Monthly


HAR Adj.   =66.7% Adj.   =82.8% Adj.   =84.0%
-RS-X
coeff. t-val coeff. t-val coeff. t-val
 .160 2.52** .254 3.67*** .113 4.33***

   .302 2.68*** .221 3.56*** .255 5.18***

   .109 1.05 .153 1.29 .070 .76

∆  -.063 -.47 -.377 -2.05** -.252 -3.29***

∆  -1.414 -2.04** -.278 -2.16** -.201 -3.20***

 .004 3.42*** .004 3.73*** .004 2.04**

 -.002 -2.79*** -.002 -1.92*  .45

∆ .003 1.89* .004 1.20 .002 1.23

  1.90*  1.30  .91

∆ .004 1.52  1.64*  2.00**

∆   -.01  .78  1.13

  .26  .97  1.48

   -.06   -.94 -.002 -2.24**

   -1.70*   -2.94***   -3.23***

  2.25**  1.66*  .80

  2.82***  4.42***  2.22**

 -.003 -2.70***   -2.38**   -1.14

 -.003 -1.22   -1.18   -.00

  .002 2.32** .003 3.64*** .004 2.84***

상수항 -.001 -1.53   -.94  .23

64
2. Out-of-sample 변동성 예측

Out-of-sample 변동성 예측은 다음과 같이 수행되었다. 우선, 샘플기


간 초기부터 1,000개의 데이터는 초기 추정 샘플로 사용하고 1,001번
째 시점부터는 이전 기간의 데이터를 누적 사용하는 방식으로 익일 및
차주, 차월의 변동성을 예측하였다. 각 모형에 대하여 동일한 예측치를
생성하였는데 모형 간 예측 능력 비교를 위해 이하에서 소개하는 기준
을 이용하였다.

2.1. 모형 비교 기준

기존 연구에서 모형 간 예측능력 비교를 위해 사용되는 계량적 기준


들은 다음과 같다. 첫 번째로는 Mincer-Zarnowitz   인데 이는 아래
식에서의  값을 의미한다.

    
    (5-1)

여기서  는 예측을 하려는 변수(Realized Variance)의 실제 값, 




는    시점에서의  값에 대한 예측치이다.  가 높을수록 예측 정

확도가 높은 것으로 이해할 수 있다.


두 번째 기준인 HRMSE와 세 번째 기준인 QLIKE는 loss(손실) 함
수에 기반한다.


  

    
HRMSE:  (5-2)
  

제5장 변동성 설명 및 예측 65



 

QLIKE: 
 

log 

(5-3)

모형 의  번째 예측 loss 함수( )는   


HRMSE의 경우  이며






QLIKE의 경우에는 log  이다.


두 모형(모형 1과 모형 2)의 예측 정확도 비교는 모형 1의 loss와 모

형 2의 loss 차이  를 이용하는데 널리 사용되는 통계량을 DM

통계량(Diebold and Mariano, 1995)이다. DM 통계량의 귀무가설(두 모


형의 예측력이 동일)하 극한분포는 표준정규분포이므로 임계치 적용은
동 분포를 이용한다. 표준정규분포 DM 통계량이 양의 값으로 유의(우
측 검정)할 경우 모형 2의 예측력이 더 높으며 음의 값으로 유의(좌측
검정)할 경우 모형 1의 예측력이 더 높게 된다. 본 보고서에서는 DM
통계량 계산 시 Bartlett 커널을, bandwidth는     을 적용하였다.

2.2. 모형 비교 결과

우선, 외생변수가 포함되지 않은 HAR-CJ 모형과 HAR-RS 모형의


예측 정확도를 비교한 결과는 <표 5-6>에 제시되어 있다. Mincer-
Zarnowitz   의 경우 일간, 주간 및 월간 예측 모두 HAR-RS 모형이
더 큰 것으로 나타나 HAR-RS 모형이 더 선호된다. HRMSE 기준 DM
테스트의 결과 또한 HAR-RS 모형의 우월성을 시사한다. 일간 변동성
예측에서는 DM 통계량이 0.496으로서 통계적으로 유의하지 않지만
주간 예측에서는 유의수준 1%에서 HAR-RS가 예측 정확도가 높으며

66
월간 예측에서는 유의수준 10%에서 HAR-RS의 예측 정확도가 더 높
다. QLIKE 기준으로는 두 모형 간 예측력은 통계적으로 동일한 것으
로 나왔다.

<표 5-6> 모형 간 예측 능력 비교(HAR-CJ vs. HAR-RS)

Daily 예측 Weekly 예측 Monthly 예측


HAR-CJ MZ  
55.97% 65.61% 53.07%
HAR-RS MZ  
56.03% 67.71% 59.38%
DM HRMSE .496 3.10*** 1.79*
test QLIKE .123 .136 .051

<표 5-7> 모형 간 예측 능력 비교(HAR-CJ-X vs. HAR-RS-X)

Daily 예측 Weekly 예측 Monthly 예측


HAR-CJ-X MZ  
58.05% 69.42% 62.13%
HAR-RS-X MZ   57.31% 70.20% 63.57%
DM HRMSE .4527 2.79*** 1.28
test QLIKE -.024 -.034 .034

다음으로 외생변수를 포함한 HAR-CJ-X 모형과 HAR-RS-X 모형의


예측 정확도 비교결과는 <표 5-7>에 제시되어 있다. Mincer-Zarnowitz
  기준으로는 주간과 월간에서는 HAR-RS-X가 예측력이 높으나 일간
에서는 반대로 나타났다. HRMSE를 이용한 DM 테스트에서는 주간
변동성 예측에서는 HAR-RS-X가 통계적으로 유의하게 예측력이 높았
으나 일간과 월간 변동성 예측에서는 HAR-RS-X가 손실은 더 적으나
통계적으로는 유의하지 않았다. QLIKE를 이용한 DM 통계량의 수치
는 0에 가깝게 계산되어 두 모형 간 우열을 결론지을 수 없었다.

제5장 변동성 설명 및 예측 67
다음으로 외생변수의 추가가 예측력 향상에 기여하는지 확인하기 위
해 HAR-RS 모형과 외생변수를 추가한 모형을 비교하였다.
앞서 고려한 모든 외생변수를 설명변수로 포함시킬 시에는
HAR-RS-X모형이 HAR-RS 모형보다 Mincer-Zarnowitz  는 높지만
DM 테스트 결과상으로는 HAR-RS 모형이 우월한 것으로 나타났다.
이에 외생변수 중 In-sample 분석결과 상 통계적 유의성이 없거나 낮
은 변수들을 제외한 모형(이하 HAR-RS-X2로 표기)을 고려하여
HAR-RS 모형과 비교하였다.
HAR-RS-X2 모형을 이용한 일간 예측에서 외생변수로 포함된 변수
들은 forward curve 기울기 변수들, OVX, VIX 그리고 Ludvigson의
지수 중 금융부문과 실물부문의 불확실성 전망치이다. 주간 예측에서
는 forward curve 기울기 변수들, 투기적 투자자의 long position 변화,
VIX 그리고 Ludvigson의 지수 중 금융부문과 실물부문의 불확실성 전
망치를 포함하였다.
월간 변동성 예측에서는 forward curve 중 Contango 정도를 나타내
는 변수, 투기적 투자자의 long position 변화, physical market 변수들
(수요/공급 비율과, OPEC 여유생산능력/수요 비율), VIX, Ludvigson
의 실물부문의 불확실성 전망치를 포함하였다.
이러한 예측시계별로 차별화된 외생변수를 이용하여 도출한
Out-of-sample 예측력 비교 결과는 <표 5-9>에 제시되어 있다. DM 테
스트로서는 HAR-RS 모형과 일부의 외생변수만을 사용한 HAR-RS-X2
모형 간에 우열을 가릴 수 없지만 Mincer-Zarnowitz   는 외생변수를
추가한 모형이 높게 나타났다. 특히 월 변동성 예측에서는 그 차이가
크게 나타났다.

68
<표 5-8> HAR-RS-X2 모형에 사용된 설명변수

Daily 예측 Weekly 예측 Monthly 예측

Backwardation 정도
Contango 정도
선물시장 Backwardation 정도 Contango 정도
투기적 투자자 long
변수 Contango 정도 투기적 투자자 long
position 변화
position 변화

석유
석유 수요/공급 비율
physical 시장 - OPEC 여유생산능력
OPEC 여유생산능력
변수

외부 변동성 OVX, VIX VIX VIX


지수 및 Ludvigson 금융/실물 Ludvigson 금융/실물 Ludvigson 실물
불확실성 지수 불확실성 지수 불확실성 지수 불확실성 지수

공통변수 HAR-RS 모형의 설명변수들

<표 5-9> 모형 간 예측 능력 비교 (HAR-RS vs. HAR-RS-X2)

Daily 예측 Weekly 예측 Monthly 예측


HAR-RS MZ  
56.03% 67.71% 59.38%
HAR-RS-X2 MZ  
58.46% 70.67% 67.40%
DM HRMSE -.422 -1.373 .070
test QLIKE .115 .070 .162

이상의 In-sample 분석 및 Out-of-sample 예측 정확도 비교 결과를


요약하면 다음과 같다. 우선 HAR-RS 모형은 HAR-CJ 모형 보다 예측
정확도 면에서 우월하다. 외생변수를 포함하여 두 모형을 비교할 때도
유사한 결과를 얻었다. 또한 In-sample 분석결과에서 본 바와 같이
HAR-CJ-X 모형의 경우 다수의 과거 변동성 설명변수가 유의성이 없
었던 반면 HAR-RS-X 모형에서는 대부분의 과거 변동성이 유의성을
보이고 있다. 다음으로 일부 외생변수를 사용한 HAR-RS-X2 모형과

제5장 변동성 설명 및 예측 69
외생변수를 사용하지 않는 HAR-RS 모형 간 비교는 전자가 후자보다
Mincer-Zarnowitz   가 높게 나타났고 DM 테스트로는 두 모형 간 우
열을 가릴 수 없었다. 이상의 결과에 따라 다음 절에서 다룰 예측 확률
분포 추정을 위한 모형으로는 일부 외생변수를 사용한 HAR-RS-X2를
선택하기로 한다.
Out-of-sample 예측기간 중 실현된 RV와 HAR-RS-X2 모형 변동성
예측치를 계산한 결과는 아래 그림에 예측 시계별로 제시되어 있다.

[그림 5-1] 실제 RV vs. RV 예측치(HAR-RS-X2), 일간예측

70
[그림 5-2] 실제 RV vs. RV 예측치(HAR-RS-X2), 주간예측

[그림 5-3] 실제 RV vs. RV 예측치(HAR-RS-X2), 월간예측

제5장 변동성 설명 및 예측 71
3. 유가변화 확률분포 추정

3.1. 모형 및 추정방법

본 절에서는 Maheu and McCurdy(2011)의 이변수 MLE 방법을 적


용하여 유가변화율 확률분포를 전망한다. Maheu and McCurdy는 주가
수익률과 주가변화 변동성인 RV에 대한 방정식을 설정하되 다양한 형
태의 RV 방정식을 고려하였다. 이들은 각 모형을 모두 MLE로 추정한
후 확률분포 예측 정확도를 비교하였다. 본 보고서에서도 선물유가 변
화율과 그 RV를 이변수 시스템으로 표현하고 MLE로 추정한 후 각
시점별 익일, 차주 및 차월 조건부 분산을 계산하여 유가변화 확률분
포 전망치를 도출하였다. 본 보고서의 차별성은 RV-기반 변동성 예측
모형 HAR-RS-X를 이변수 시스템에 삽입하여 선물유가에 적용하고
매 시점 확률분포 전망치를 도출하였다는 점이다. 또한 주간 및 월간
변동성 예측에서는 주간·월간 수익률 방정식의 에러항이 자기 상관을
가짐을 반영하여 Maheu and McCurdy(2011)의 분포가정을 수정하여
작업을 수행하였다.
Maheu and McCurdy의 모형에 외생변수를 추가한 이변수 시스템
모형은 아래와 같다.

                  23) (5-4)


log      ′    

23) Realized Variance에 로그를 취한 변수를 사용하는 이유는 log(RV)의 분포가 정규분
포에 가깝다고 알려져 있기 때문이다(Corsi et al, 2008 등).

72
위 식에서 ∈  이며    는    일의 유가 변화율,   는

   거래일부터    거래일 동안(시점 기준 향후 1주 동안)의 유가

변화율, 그리고 
   는    거래일부터    거래일 동안(시점 기

준 향후 1개월 동안)의 유가 변화율이다. 는 유가변화율의 평균을 의



미하며    는 전망시점인  시점에서 예측한 다음날(  ), 향후 1

주(  ) 및 향후 1개월(  )의 유가변화의 조건부 분산(각 기간 중


일평균)이다.    과    은 각 식의 innovation 항인데 이들의 분포는

정규분포이며   간은 독립성을 가정한다. 의 분산과 공분산은 예


측시계에 따라 상이하다. 일간 예측모형에서의   는 분산이 1인 반

면    24)의 분산은 5, 



25)의 분산은 22이다. 이는 첫 번째 식의

좌측 변 변화율 변수가 각각 일간, 주간(5 거래일) 및 월간(22 거래일)


수익률이기 때문이다. 또한 주간 및 월간 분석의 경우(   )  와

 간의 공분산이 존재하므로 이를 반영하여 우도함수를 설정하였다.

 는 HAR-RS-X2 모형에서 사용된 모든 설명변수를 포함26)하며 모수


의 제곱은 log(RV) 변수의 조건부 분산을 의미한다.
앞 절에서와 마찬가지로 처음 1,000개의 샘플은 초기 추정용 샘플로
만 사용하고 1,001번째부터 마지막 3,05027)번째 시점에 대해 매번 모

24)      ⋯  


25)   
     ⋯  
26) 변수의 리스트는 in-sample 분석과 동일하지만 physical market 변수와 투기적 투
자자 포지션 관련 변수를 제외한 나머지 변수들은 log를 취한 형태로 이용되었
다. log의 진수는 비음이어야 하므로 forward 기울기 변수는 log    ,
log    로 변환되었고 RS 관련 변수는 log   ∆   및 log   ∆  
로 변환되어 사용하였다.

제5장 변동성 설명 및 예측 73
 
형을 추정하고 조건부 분산인    를 추정한다.    의 추정은

두 번째 방정식의 추정결과를 사용하는데 구체적으로 아래 식과 같다.

       (5-5)


  
 explog    log  
  

여기서 log  은   ′이고 log    이며

실제 적용 시에는 , , 의 추정치가 사용된다. 예측 작업을 시간에


따라 진행하면서 모수추정에 사용되는 데이터가 증가하므로 모든 모수
의 추정치는 예측 시점마다 변한다. 식 (5-5)는 모형 (5-4)의 두 방정식
간의 연결고리가 된다.
식 (5-5) 의 첫 번째 등식은 Maheu and McCurdy(2011)에서도 사용
한 관계식인데 이론적 근거는 Andersen et al(2001, ABDL)과
BNS(2002b)에 제시되어 있다. 두 번째 등식은 log(RV)의 조건부 분포
가 정규분포(RV는 조건부 log-normal 분포)라는 가정 하에서 도출된다.
시점 정보까지 이용한 ML 추정에서 사용한 로그-우도함수(모수와
관련없는 항은 제외)는 아래와 같다. 우선, 수익률 방정식의 innovation
항을 아래 식과 같이 쓸 수 있다.

     
   . (5-6)
 
    
exp     ′   

27) RV 등 변동성 지수는 2007년 1월 2일부터 2019년 5월 31일까지 계산(3,292개의


샘플)하였지만 보고서 작성시점 기준 외생변수 구축이 2019년 4월 1일까지 가능
하여 변동성예측에 사용된 전체 샘플개수는 3,050개임.

74
앞서 기술한 모형의 분포가정하에서는  는 평균이 0이고 공

분산 행렬이 인 다변량 정규분포를 따르게 된다. 이미 언급했듯이


공분산 행렬    은 예측시계()에 따라 달라진다. 구체적으로,

일간예측 시에는    ×  이며 주간 및 월간 예측 시 적용할  ×

공분산 행렬은 각각 아래 식에서와 같이 주어진다.

  for   




  for     
  for     
   for      ,


  for     
  for    ≥ 
  for   

 
  for    
  for     
  ⋮  ⋮ . (5-7)

  for     
  for    ≥ 

다음으로, 두 번째 방정식의 innovation 항은 상호 독립인 표준정규


분포를 따른다. 따라서  벡터는 평균이 0이고 공분산 행렬이

 ×  인 다변량 표준정규분포를 따른다.

최종적으로 우도함수는  의 결합 확률밀도함수와  

의 결합 확률밀도함수의 곱으로 표현되며 여기에 로그를 취하여 얻게


되는 목적함수를 모형 내 모수들에 대해 최대화한다.

제5장 변동성 설명 및 예측 75
3.2. 추정 결과

향후 일일, 주간 및 월간 유가변동성을 예측하여 1-표준편차 구간을


그리면 아래와 같다.
파란색 선은 실제 일간, 주간 및 월간 수익률을 나타내며 1-표준편차

구간인 


  

   

  

   28)도 함께 표시되어 있다. 일일 실제

수익률은 시점 간 선형연관성이 없는 white noise 과정으로 보이며 주


간 및 월간 수익률은 거래일 중첩에 기인한 자기 상관성의 존재가 관
찰된다.

[그림 5-4] 실제 일간 유가변화율과 예측된 1-표준편차 구간

28)   1(일간예측), 
 (주간예측), 
 (월간예측)

76
실제 수익률의 실현된 변동성은 시변성을 보이며 변동성 cluster를
형성하고 있다. 변동성 전망 1-표준편차 구간은 이러한 실제 실현된
변동성의 등락을 잘 따라가고 있는데 이와 같은 육안관찰에 더하여 아
래에서는 추정결과를 바탕으로 한 유가변화율의 예측분포가 얼마나 실
제 분포에 근접하는지 확인하기로 한다.
예측분포의 실제분포 근접성은 다음과 같이 간단한 방법으로 확인하
였다. 우선 모형의 가정 상 현재시점인  시점에서의 미래 유가변화율

의 분포는 평균이 

 이고 분산이  

 
   인 정규분포이다.29) 따라서

실제 수익률이 추정된 예측분포를 정확히 따른다면 각 구간별 확률은


식 (5-8)과 같이 주어질 것이다.

[그림 5-5] 실제 주간 유가변화율과 예측된 1-표준편차 구간

29) 
 는 0에 매우 가까운 수치로서 각 시점 별로 큰 차이를 보이지 않았다.

제5장 변동성 설명 및 예측 77
[그림 5-6] 실제 월간 유가변화율과 예측된 1-표준편차 구간

  ∈   


   
   ∙
   
  ∙ (5-8)

  for   

  for   


  for   
   for   

  for   


  for   

즉, 우리가 추정한 예측분포가 실제분포와 가깝다면 위 식에 나열된


확률수치와 큰 차이가 없을 것이고 그렇지 않다면 적지 않은 차이를
관찰할 것이다.

78
<표 5-10> 예측분포의 정확도(HAR-RS-X2)

k 값 0.5 1.0 1.5 2.0 2.5 3.0

벤치마크 확률 .3830 .6826 .8664 .9544 .9876 .9973

예측분포를
이용한 빈도 .3985 .7215 .8834 .9498 .9800 .9922
(daily)
예측분포를
이용한 빈도 .4146 .7171 .8888 .9541 .9844 .9941
(weekly)
예측분포를
이용한 빈도 .3600 .7000 .8985 .9659 .9810 .9922
(monthly)

<표 5-10>에서 제시된 것처럼 예측분포 기준으로 실제 수익률이 각


 표준편차 구간에 나타난 빈도는 벤치마크 확률과 큰 차이가 나지 않
는다. 특히 월간 예측의 경우에는 그 차이가 더욱 작게 나타났다. 이
사실은 추정된 예측분포가 실제 분포에 가깝게 근사하고 있다는 점을
방증한다. 특히 값이 2이상 큰 경우에도 빈도가 벤치마크 확률과 거
의 유사하게 나타나고 있다. 따라서 추정한 예측분포가 실제 유가 변
화율의 두꺼운 꼬리(fat-tail) 속성까지도 잘 반영하고 있는 것으로 이
해할 수 있다.

제5장 변동성 설명 및 예측 79
제6장 요약 및 결론

본 연구는 WTI 선물유가 변동성 및 유가변화 확률분포 예측을 다루


었다. WTI 최근월물 선물유가의 고빈도 거래데이터를 이용하여 각 거
래일 마다 5분 간격 유가변화율을 계산하였고 이를 이용하여 Realized
Variance(RV), Realized Semivariance(RS) 등의 주요 변동성 측도를
계산하였다.
In-sample 분석(변동성 설명)에서는 HAR, HAR-CJ, HAR-RS 등 과
거 변동성 변수만을 고려한 기본 모형들과 더불어 WTI 선물시장 변
수, 석유 physical market 변수, 지정학 위험지수, 향후 1개월 변동성
기대치인 OVX와 VIX, 금융, 거시 및 실물 부문 불확실성 전망지수
등의 외생변수를 추가한 HAR-CJ-X와 HAR-RS-X 모형을 고려하였다.
WTI 유가변동성 분석을 위해 Realized Semivariance 변수를 고려한
기존 연구에는 Sevi(2014), Ma et al(2018) 등이 있지만 세부 설명변수
가 본 연구에서 채택한 HAR-RS 모형 상의 변수와 상이하고 이들 연
구에서는 추가 외생변수가 고려되지 않았다.
HAR-RS-X 모형에서 각 설명변수의 설명력은 예측 주기에 따라 차
별화되어 나타났다. 우선 일간 변동성에서는 직전거래일의 非점프 변
동성(BPV), 직전 주(직전 5거래일)의 Realized Variance 변수가 유의
한 것으로 나타났다. 또한 직전거래일의 가격하락으로 인해 생긴 변동
성이 가격상승으로 인해 생긴 변동성보다 큰 경우 익일 변동성을 상승
시키는 것으로 나타났다. 반면 가격상승 변동성이 큰 경우에는 익일
변동성이 작아지는 경향이 나타났지만 통계적 유의성은 발견되지 못하

제6장 요약 및 결론 81
였다. 외생변수 중에서는 선물유가 forward curve 관련변수, OPEC 여
유생산능력 관련 변수, 금융부문과 실물부문의 불확실성 지수 예측치
그리고 주식시장과 원유시장 옵션가격에 내재된 변동성인 VIX와
OVX 변수가 통계적으로 유의하게 익일 유가 변동성을 설명하였다.
선물유가 forward curve의 Backwardation이나 Contango의 강도는 모
두 그 강도가 클수록 익일 변동성을 상승시키는 것으로 나타났고 석유
수요량 대비 OPEC 여유생산능력이 클수록 변동성이 감소하고 OVX,
VIX, 그리고 실물경제 불확실성이 높을수록 익일 유가변동성은 증가
하였다.
주간 변동성 분석에서는 RV 혹은 RS 관련변수들은 일간 변동성에
서와 유사한 결과를 얻었다. 한 가지 다른 점은 직전거래일의 가격상
승으로 인해 생긴 변동성이 가격하락으로 인해 생긴 변동성보다 큰 경
우 그 차이가 클수록 차주의 변동성은 감소하는데 일간 예측에서와 달
리 통계적 유의성도 발견되었다. 외생변수의 변동성 설명 유의성은 일
간 분석에서와 전반적으로 유사하지만 Backwardation 강도가 차주 변
동성에 미치는 영향은 일간 변동성 분석의 경우보다 통계적 유의성이
다소 낮고, 원유옵션에 내재된 변동성인 OVX 변수의 유의성도 일간
분석에서보다 낮아졌다. 이에 반하여 미국 주식시장 변동성 지수인
VIX 변수와 실물부문 불확실성 전망변수 그리고 OPEC 여유생산능력
관련 변수의 영향정도와 통계적 유의성은 상승하였다.
월간 변동성 분석 결과에서는 RV 혹은 RS 관련 변수의 유의성과
계수는 주간 분석에서와 유사하게 나타났다. 반면, Forward curve 변
수들의 경우 Backwardation 정도는 통계적 유의성이 사라졌고
Contango 정도를 측정하는 설명변수만이 그 영향이 유의하게 나타났

82
다. OPEC 여유생산능력 관련 변수의 계수크기와 통계적은 유의성은
주간 분석결과보다도 더 높게 나타났으며 일간 및 주간 분석에서 유의
성이 없었던 석유 수요/공급 비율 변수가 통계적 유의성을 보였다.
OVX 변수는 유의성이 발견되지 않았으나 VIX 변수의 유의성은 유지
되었다. 불확실성 변수 중에서는 오직 실물부문 불확실성 전망치만이
유의한 설명력을 보였다.
각 변수별 전망 시계에 따른 설명력 변화를 요약하면 다음과 같다.
직전 거래일, 직전 주의 변동성은 미래 변동성에 시차에 관계없이 정
(+)의 설명력을 보였다. 이는 변동성 과정이 보이는 시점 간 양의 상관
관계 및 변동성 클러스터 현상과 부합하는 결과이다. 또한 HAR-RS
모형을 주식, 환율 시장 등에 적용한 기존연구에서의 결과와 동일하게
WTI 선물시장에서도 직전 거래일에 가격하락 변동성이 상승 변동성을
압도하는 경우 그 정도가 커짐에 따라 미래 변동성은 증가하였고 반대
로 가격상승 변동성이 압도적인 경우 그 정도가 커짐에 따라 차주 및
차월 변동성은 하락하였다. 이러한 결과는 가격 움직임의 방향과 변동
성 간의 관계를 시사하는데 통상 가격상승기에 비해 가격이 하락하는
기간에 변동성이 더 크다는 시장참가자들의 경험적 상식에 부합하는
분석 결과라고 할 수 있겠다.
Forward curve 변수들을 보면 Backwardation 강도가 커질수록 익일
변동성이 커지나 주간과 월간에서는 유의성이 낮게 나타난 반면
Contango 정도는 고려된 모든 전망시계에서 미래 변동성 상승과 관련
이 있었다. 이 결과는 단순히 현재 석유시장에서 수요가 공급보다 많
거나 적음에 따라 변동성이 영향을 받는다는 가설과는 부합하지 않으
며 Kogan et al(2009) 등이 주장한 대로 Backwardation 이든 Contango

제6장 요약 및 결론 83
이든 그 정도가 크면 최적 투자에서 이탈한 정도가 커지게 되어 원유
가격 변동성이 상승하게 된다는 이론과 부합한다.
투기적 투자자들의 포지션 변화나 이들의 매수/매도 포지션 비율 등
은 많은 경우에 미래 변동성 설명력이 나타나지 않았다.
OPEC 여유생산능력 관련 변수는 모든 시계에서 통계적 유의성을
보였으나 시계가 길어질수록 계수크기와 통계적 유의성이 증가하였다.
OPEC 여유생산능력은 일부 산유국에서 생산차질이 발생했을 때의 공
급부족분을 벌충할 수 있는 여력을 의미하는데 이것이 충분할수록 유
가의 변동성은 낮아졌으며 특히 일간 변동성보다는 주간 및 월간에서
그 효과가 강하게 나타났다. 또한 석유수요를 공급으로 나눈 비율 변
수는 그 계수의 부호가 음으로 추정되었는데 이는 해당 변수의 값이
상승할 시 유가가 함께 상승하고 이는 Good 변동성의 증가로 이어져
전반적 변동성이 하락하는 영향을 갖는 것으로 해석된다. 한편, 석유재
고량 변수는 In-sample 분석에서 설명력이 미미하게 나타나 본 분석에
서는 설명변수에서 제외되었다.
미국 S&P 500 펀드 옵션가격으로 도출하는 향후 1개월 동안의 주식
시장 내재 변동성(implied volatility) 지수인 VIX는 모든 시계에서 설명
력을 보였으나 특히 주간 및 월간 시계에서 설명력이 강하게 나타났다.
이 결과는 서로 다른 시장 간의 변동성 동행성을 시사하는데 향후 연구
에서 각 시장의 RV 변동성 간의 spill-over 구조를 분석한다면 각 개별
시장의 변동성 예측 정확도 제고에 도움이 될 것으로 보인다.
다음으로, VIX의 석유시장 버전인 OVX는 예상과는 달리 주간 및
월간 변동성 설명에서는 유의성이 나타나지 않았다. 이는 OVX가 포
함하는 정보의 내용이 이미 다른 변수(RV, RS 변수들 및 외생변수

84
들)에 포함되었을 가능성을 시사한다. 또한 시장에서 변동성 전망 지
수로 흔히 사용되고 있는 OVX 변수가 미래 변동성에 대한 완벽한 측
도가 아니며 본 연구 등에서처럼 과거 RV, RS 변수 및 추가 외생변수
를 사용한 변동성 예측 모형을 이용하면 OVX만을 활용하여 변동성을
예측할 때의 한계점을 상당부분 극복할 수 있음을 의미한다.
Ludvigson 등이 제안한 금융, 거시, 실물 부문 불확실성 전망치 변
수의 경우 실물 불확실성 정도가 유가변동성 그 중에서도 익월 및 차
주 변동성에 대한 설명력을 보였다. 거시 불확실성 전망치는 추가 설
명력이 발견되지 않았고 금융부문 불확실성 전망치는 일간 및 주간 유
가 변동성을 설명하였으나 그 계수가 음수로 나타나 다소 직관과 부합
하지 않았다. 이는 금융부문 불확실성 변수와 VIX 변수가 함께 설명
변수로 사용된 결과로 이해되는데 금융부문 불확실성 전망치를 구축할
때 사용된 정보들 중 미국 주식시장의 정보를 제외한 부분이 유가 변
동성과 역의 관계가 있을 수 있다고 추측해 볼 수 있으나 이러한 가설
의 입증을 위해서는 추가적인 연구가 필요해 보인다.
끝으로 중동지역 지정학적 리스크는 추정된 계수의 부호는 (+)로서 유
가 변동성에 양의 영향을 미치지만 통계적 유의성은 발견할 수 없었다.
본 연구에서는 이상의 In-sample 분석 결과 및 Out-of-sample 예측
력 비교결과에 기초하여 HAR-RS-X 모형의 외생변수 중 설명력이 존
재하는 일부 변수만을 포함한 HAR-RS-X2 모형을 이변수 시스템에
삽입하여 유가변화 확률분포를 구축하였다. 각 거래일마다 익일, 차주
및 차월의 유가변화 예측 확률분포를 계산하였고 본 연구에서 추정된
확률분포가 실제 유가변화율 분포에 대한 좋은 근사치가 된다는 점을
보였다.

제6장 요약 및 결론 85
본 연구의 기여는 다음과 같다. 우선 국제 원유선물가격 고빈도 데
이터에 기반하여 HAR-RS-X 모형 등을 이용하여 변동성 설명 및 예측
을 시도하였다. 대용량 거래데이터를 처리하여 변동성 변수들을 계산
하였으며 추가 외생변수 데이터를 구축하여 기존 변동성 모형을 보완
하고 실증하였고 전망 주기별로 변동성 설명력이 존재하는 외생변수
등을 파악하였다. 둘째, HAR-RS-X 모형을 Maheu and
McCurdy(2011) 방법론에 접목하여 유가변화 확률분포를 도출하고 그
정확성을 관찰하였다. 기존의 석유시장 변동성 연구가 변동성 모형의
Out-of-sample 예측 성과를 측정·비교하는 데에 초점을 두었다면 본
연구는 한 걸음 더 나아가 이를 이용하여 유가변화 확률분포를 추정한
점이 기존연구들과의 차별점이라 할 수 있겠다. 또한 유가변화율 예측
확률분포 추정작업에서 주간 및 월간 수익률 간의 자기상관성을 모형
에 직접 반영한 점도 본 연구의 방법론 상 기여점이라 할 수 있을 것
이다. 실무적인 관점에서 본 연구는 국제유가 변동성과 확률분포 예측
치 계산을 상시화 할 수 있는 단초를 마련하였다고 판단된다. 이는 에
너지경제연구원에서 수행하는 국제유가 전망과 결합되어 정책당국 및
민간 이해관계자들에게 향후 국제유가 움직임에 대한 추가적인 정보를
제공할 수 있으리라 생각한다. 서론과 2장에서 언급한 바와 같이 변동
성 및 유가변화 확률분포 예측치는 파생상품 투자자, 원유구매 리스크
관리자(헷징 담당자), 원유 구매시기가 비교적 유동적인 원유구매자,
원유가격의 급등이나 급락 등 변동폭에 관심이 있는 정책 당국자 등
리스크 관리자들에게 의사결정에 필요한 유의미한 정보가 될 수 있을
것으로 판단된다.

86
참고문헌

<국내 문헌>

에너지경제연구원, 주간 국제유가 및 시장동향, 2007년 1월 1주- 2019년


4월 4주.

<외국 문헌>

Andersen, T.G., Bollerslev, T., Christoffersen, P.F., Diebold, F.


“Volatility and Correlation Forecasting.” Handbook of Economic
Forecasting, volume 1, 777-878, 2006.

Andersen, T.G., Bollerslev, T., Diebold, F.X. “Roughing It Up: Including


Jump Components in the Measurement, Modeling, and Forecasting
of Return Volatility.” The Review of Economics and Statistics,
89(4), 701-720, 2007.

Andersen, T.G., Bollerslev, T., Diebold, F.X., Ebens, H. “The


Distribution of Realized Stock Return Volatility.” Journal of
Financial Economics, 61, 43-76, 2001.

Andersen, T.G., Bollerslev, T., Diebold, F.X., Labys, P. “The


Distribution of Realized Exchange Rate Volatility.” Journal of the
American Statistical Association, 96(453), 42-55, 2001.

Andersen, T.G., Bollerslev, T., Diebold, F.X., Labys, P. “Modeling and


Forecasting Realized Volatility.” Econometrica, 71(2), 579-625,
2003.

참고문헌 87
Andersen, T.G., Bollerslev, T., Diebold, F.X., Vega, C. “Real-Time Price
Discovery in Global Stock, Bond and Foreign Exchange Markets.”
Journal of International economics, 73, 251-277, 2007.

Andersen, T.G., Bollerslev, T., Diebold, F.X., Vega, C. “Micro Effects


of Macro Announcements: Real-Time Price Discovery in Foreign
Exchange.” The American Economic Review, 93(1), 38-62, 2003.

Baillie, R.T. “Long Memory Processes and Fractional Integration in


Econometrics.” Journal of Econometrics, 73, 5-59, 1996.

Baillie, R.T., Calonaci, F., Cho, D., Rho, S. “Long Memory, Realized
Volatility and Heterogeneous Autoregressive Models.” Journal of
Time Series Analysis, 40, 609-628, 2019.

Baker, S., Bloom, N., Davis, S. “Measuring Economic Policy


Uncertainty.” The Quarterly Journal of Economics 131(4):
1593-1636, 2016.

Baker, S., Bloom, N., Davis, S., Kost, K. “Policy News and Stock Market
Volatility.” Working Paper : 1-52, 2019.

Barndorff-Nielsen, O.E., Kinnebrock, S., Shephard, N. “Measuring


Downside Risk.” CREATES Research Paper 2008-42, 2008.

Barndorff-Nielsen, O.E., Shephard, N. “Econometric Analysis of


Realized Volatility and Its Use in Estimating Stochastic Volatility
Models.” Journal of the Royal Statistical Society: Series B, 64(2),
253-280, 2002a.

Barndorff-Nielsen, O.E., Shephard, N. “Estimating Quadratic Variation


Using Realized Variance.” Journal of Applied Econometrics, 17,
457-477, 2002b.

88
Barndorff-Nielsen, O.E., Shephard, N. “Realized Power Variation and
Stochastic Volatility Models.” Bernoulli, 9(2), 243-265, 2003.

Barndorff-Nielsen, O.E., Shephard, N. “Power and Bipower Variation


with Stochastic Volatility and Jumps.” Journal of Financial
Econometrics, 2(1), 1-37, 2004.

Barndorff-Nielsen, O.E., Shephard, N. “Econometrics of Testing for


Jumps in Financial Economics Using Bipower Variation.” Journal
of Financial Econometrics, 4(1), 1-30, 2006.

Bollerslev, T. “Generalized Autoregressive Conditional Heteroskedasticity.”


Journal of Econometrics 31, 3077-327, 1986.

Caldara, D., Iacoviello, M. “Measuring Geopolitical Risk.” Working


Paper : 1-47, 2018.

Campbell, J., Shiller, R. “Cointegration and Tests of Present Value


Models.” Journal of Political Economy 95, 1062-1087, 1987.

Cho, C-K., Amsler, C., Schmidt, P. “A Test of the Null of Integer


Integration Against the Alternative of Fractional Integration.”
Journal of Econometrics 187, 217-237, 2015.

Corsi, F.. “A Simple Approximate Long-Memory Model of Realized


Volatility.” Journal of Financial Econometrics 7(2), 174-196, 2009.

Corsi, F., Mittnik, S., Pigorsch, C., Pigorsch, U. “The Volatility of


Realized Volatility.” Econometric Reviews 27, 46-78, 2008.

Corsi, F., Pirino, D., Reno, R. “Threshold Bipower Variation and the
Impact of Jumps on Volatility Forecasting.” Journal of
Econometrics 159, 276-288, 2010.

Elder, J., Miao, H., Ramchander, S. “Jumps in Oil Prices: The Role of

참고문헌 89
Economic News.” The Energy Journal 34(3), 217-237, 2013.

Energy Intelligence(EI), Oil Market Intelligence, 2007 January - 2019


June.

Engle, R. “Autoregressive Conditional Heteroskedasticity with Estimates


of the Variance of UK Inflation.” Econometrica 50, 987-1008, 1982.

Fleming, J., Kirby, C., Ostdiek, B. “The Economic Value of Volatility


Timing Using “Realized” Volatility.” Journal of Financial
Economics, 67, 473-509, 2003.

Granger, C.W., Joyeux, R. “An Introduction to Long-Memory Time


Series Models and Fractional Differencing.” Journal of Time Series
Analysis, 1, 15-29, 1980.

Haugom, E., Langeland, H., Molnar, P., Westgaard, S. “Forecasting vola-


tility of the U.S. oil market .” Journal of Banking and Finance
47: 1-14, 2014.

Huang, X.. Tauchen, G. “The Relative Contribution of Jumps to Total


Price Variance.” Journal of Financial Econometrics 3(4), 456-499,
2005.

International Energy Agency(IEA), Oil Market Report, 2007 January -


2019 June.

Jo, S. “The Effects of Oil Price Uncertainty on Global Real Economic


Activity.” Journal of Money, Credit and Banking 46(6): 1113-1135,
2014.

Jurado, K., Ludvigson, S., Ng, S. “Measuring Uncertainty.” American


Economic Review 105(3): 1177-1216, 2015.

Kogan, L., Livdan, D., Yaron, A. “Oil Futures Prices in a Production

90
Economy with Investment Constraints.” The Journal of Finance
64(3), 1345-1375, 2009.

Lettau, M., Ludvigson, S. “Consumption, Aggregate Wealth, and


Expected Stock Returns” The Journal of Finance 56(3), 815-849,
2001.

Litzenberger, R. H., Rabinowitz, N. “Backwardation in Oil Futures


Markets: Theory and Empirical Evidence.” The Journal of Finance
50(5), 1517-1545, 1995.

Liu, J., Ma, F., Yang, K., Zhang, Y. “Forecasting the Oil Futures Price
Volatility: Large Jumps and Small Jumps” Energy Economics 72,
321-330, 2018.

Ma, F.,Wei, W., Liu, L., Huang, D. “Forecasting Realized Volatility of


Oil Futures Market: A New Insight” Journal of Forecasting 37(4),
419-436, 2018.

Ma, F., Liu, J., Huang, D., Chen, W. “Forecasting the oil futures price
volatility: A new approach.” Economic Modelling 64: 560-566,
2017.

Maheu, J. M., McCurdy, T. H. “Do High-Frequency Measures of


Volatility Improve Forecasts of Return Distributions?” Journal of
Econometrics 160, 69-76, 2011.

Patton, A., Sheppard, K. “Good Volatility, Bad Volatility: Signed Jumps


and the Persistence of Volatility.” The Review of Economics and
Statistics, 97(3), 683-697, 2015.

Prokopczuk, M., Symeonidis, L., Simen, C. W. “Do Jumps Matter for


Volatility Forecasting? Evidence from Energy Markets.” The

참고문헌 91
Journal of Futures Markets, 36(8), 758-792, 2016.

Sevi, B. “Forecasting the Volatility of Crude Oil Futures Using Intraday


Data” European Journal of Operational Research 235(3), 643-659,
2014.

Van Robays, I. “Macroeconomic Uncertainty and Oil Price Volatility.”


Oxford Bulletin of Economics and Statistics 78(5): 671-693, 2016.

<웹사이트>

Chicago Board of Options Exchange(CBOE) VIX 데이터, http://www.cboe.co


m/vix, 접속일자: 2019.6.27.

Chicago Board of Options Exchange(CBOE) OVX 데이터, http://www.cboe.c


om/products/vix-index-volatility/volatility-on-etfs/cboe-crude-oil-e
tf-volatility-index-ovx, 접속일자: 2019.6.27.

Chicago Board of Options Exchange(CBOE) OVX 설명, http://www.cboe.co


m/products/vix-index-volatility/volatility-on-etfs/cboe-crude-oil-et
f-volatility-index-ovx, 접속일자: 2019.10.30.

Investopedia, VIX 설명, https://www.investopedia.com/terms/v/vix.asp,


접속일자: 2019.10.30.
Matteo Iacoviello 홈페이지, GPR, https://www2.bc.edu/matteo-iacoviello/g
pr.htm, 접속일자: 2019.6.27.

Sydney Ludvigson 홈페이지, 불확실성 지수, https://www.sydneyludvigson.


com/macro-and-financial-uncertainty-indexes, 접속일자: 2019.9.3.

https://www.policyuncertainty.com/, 정책 불확실성 지수, 접속일자: 2019.6.27.

92
부록: Refinitiv WTI CLc1 데이터 및 code

1. 연도별 데이터 개수

<표 부록-1> 연도별 데이터 수

연도 raw data 5-min returns 비고


2007 11,995,688 104,824
2008 21,521,495 105,073
2009 21,187,268 104,824
2010 31,704,675 104,236
2011 42,048,615 104,248
2012 35,218,584 104,824
2013 33,156,343 104,824
2014 37,204,600 104,824
2015 42,916,897 104,821
2016 35,968,312 104,245
2017 34,622,104 103,957
2018 47,080,844 104,821
2019 38,678,750 78,361 1월 ~ 9월
합계 433,304,175 1,333,882

2. Python code

2.1. raw data로부터 5분 간격 마감 가격 추출

import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

부 록 93
from datetime import datetime
import time
import gzip
%matplotlib inline

dataFile_prefix = "TRTH_WTI_CLc1_Trade"
FilePath = "D:/Work/KEEI/Oil/RV/RawData/"

FileList = []
for year in range(2007,2019+1):
if year == 2019:
last_month = "09"
else:
last_month = "12"
FileList.append(dataFile_prefix+str(year)+"01_"+str(year)+last_month+".csv.gz")

OnlyYear2019 = 1

if OnlyYear2019 == 0:
cnt = 1
year = 2007

for i in range(len(FileList)):
df = pd.read_csv(FilePath + FileList[i],encoding='utf8',engine='python',index_col=False,compression='gzip')
df.dropna(subset=['Price','Volume'],inplace=True)
#df.drop(['Alias Underlying RIC','Domain','GMT Offset','Type'],axis=1,inplace=True)

df.drop(['Alias Underlying RIC','Domain','Type'],axis=1,inplace=True)


df['Date'],df['Time'] = df['Date-Time'].str.split('T').str
df['Time'] = df['Time'].str[:-3]
df.drop(['Date-Time'],axis=1,inplace=True)
df.rename(index=str,columns={"#RIC":"RIC"},inplace=True)
df['Date_Time'] = pd.to_datetime(df['Date'] + " " + df['Time'], format = '%Y-%m-%d %H:%M:%S.%f')
df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d')

94
df.set_index('Date_Time',inplace=True,drop=False)
df_1st_bd = df[['Price','Date_Time']].resample('24h',base=18).first()
df_1st_bd['day_start'] = 1
df_1st_bd.loc[df_1st_bd['Date_Time'].isnull(),'Date_Time'] =
pd.to_datetime(df_1st_bd.loc[df_1st_bd['Date_Time'].isnull()].index.map(str) + '.000000',format
= '%Y-%m-%d %H:%M:%S.%f')
df_1st_bd.rename(index=str,columns={'Date_Time':'first_obs'},inplace=True)
#outfile = str(FilePath + 'CLc1_1st_Obs_' + FileList[i][-13:-9] + '.csv')
#df_1st_obs_bd.to_csv(outfile)

df_5min = df['Price'].resample('5min',label='right',closed='right').ohlc()
df_5min.drop(['open','high','low'],axis=1,inplace=True)
df_5min.rename(index=str,columns={"close":"Price"},inplace=True)
# Merge the data set w/ 1st obs and data set w/ 5-min freq. observations

df_ = pd.merge(df_1st_bd,df_5min,left_index=True,right_index=True,how='outer',on='Price')
df_.index = pd.to_datetime(df_.index.map(str),format = '%Y-%m-%d %H:%M:%S')
df_['bw_day'] = 0

if cnt < 9:

df_.iloc[df_.index.indexer_between_time('17:16','17:59'),df_.columns.get_loc('bw_day')] = 1
elif cnt ==9:
df_A = df_.loc[:'2015-09-21 17:59:00']
df_B = df_.loc['2015-09-21 18:00:00':]
del df_

df_A.iloc[df_A.index.indexer_between_time('17:16','17:59'),df_A.columns.get_loc('bw_day')] = 1

df_B.iloc[df_B.index.indexer_between_time('17:01','17:59'),df_B.columns.get_loc('bw_day')] = 1

df_ = pd.concat([df_A,df_B],axis=0)
else:

부 록 95
df_.iloc[df_.index.indexer_between_time('17:01','17:59'),df_.columns.get_loc('bw_day')] = 1

outfile = str(FilePath + 'CLc1_Trade_Price_5min_' + FileList[i][-13:-9] + '.csv')


df_.to_csv(outfile)
#if cnt == 1:
# df_RV = pd.DataFrame(columns = df_combined.columns)
#df_RV.append(df_combined)

print('year:{0}, i:{1}, len_raw:{2}, len_5min:{3}'.format(year, cnt,len(df),len(df_)))


del df_, df, df_5min

cnt += 1
year += 1
else:
## some work for the year of 2019
df = pd.read_csv(FilePath + FileList[-1],encoding='utf8',engine='python',index_col=False,compression='gzip')
df.dropna(subset=['Price','Volume'],inplace=True)
df.drop(['Alias Underlying RIC','Domain','Type'],axis=1,inplace=True)
df['Date'],df['Time'] = df['Date-Time'].str.split('T').str
df['Time'] = df['Time'].str[:-3]
df.drop(['Date-Time'],axis=1,inplace=True)
df.rename(index=str,columns={"#RIC":"RIC"},inplace=True)
df['Date_Time'] = pd.to_datetime(df['Date'] + " " + df['Time'], format = '%Y-%m-%d %H:%M:%S.%f')
df['Date'] = pd.to_datetime(df['Date'], format='%Y-%m-%d')
df.set_index('Date_Time',inplace=True,drop=False)

df_1st_bd = df[['Price','Date_Time']].resample('24h',base=18).first()
df_1st_bd['day_start'] = 1
df_1st_bd.loc[df_1st_bd['Date_Time'].isnull(),'Date_Time'] =
pd.to_datetime(df_1st_bd.loc[df_1st_bd['Date_Time'].isnull()].index.map(str) + '.000000',format
= '%Y-%m-%d %H:%M:%S.%f')
df_1st_bd.rename(index=str,columns={'Date_Time':'first_obs'},inplace=True)

96
df_5min = df['Price'].resample('5min',label='right',closed='right').ohlc()
df_5min.drop(['open','high','low'],axis=1,inplace=True)
df_5min.rename(index=str,columns={"close":"Price"},inplace=True)
# Merge the data set w/ 1st obs and data set w/ 5-min freq. observations

df_ = pd.merge(df_1st_bd,df_5min,left_index=True,right_index=True,how='outer',on='Price')
df_.index = pd.to_datetime(df_.index.map(str),format = '%Y-%m-%d %H:%M:%S')
df_['bw_day'] = 0

df_.iloc[df_.index.indexer_between_time('17:01','17:59'),df_.columns.get_loc('bw_day')] = 1

outfile = str(FilePath + 'CLc1_Trade_Price_5min_' + FileList[-1][-13:-9] + '.csv')


df_.to_csv(outfile)

print('len_raw:{0}, len_5min:{1}'.format(len(df),len(df_)))
del df_, df, df_5min

FileList_5min = []
for i in range(len(FileList)):
FileList_5min.append(str(FilePath + 'CLc1_Trade_Price_5min_' + FileList[i][-13:-9] + '.csv'))
FileList_5min

for i in range(len(FileList_5min)):
df = pd.read_csv(FileList_5min[i],encoding='utf8',index_col=False)
if i == 0:
df_5min = df
else:
df_5min = pd.concat([df_5min,df],axis=0,ignore_index=True)
print('len_df_5min:{0}'.format(len(df_5min)))
df_5min.set_index('Date_Time',inplace=True)
df_5min.head()

outfile = str(FilePath + 'CLc1_Trade_Price_5min' + '.csv')


df_5min.to_csv(outfile)

부 록 97
2.2. RV 등 통계량 계산

import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
from datetime import datetime
import time
import math

%matplotlib inline

FilePath = "D:/Work/KEEI/Oil/RV/RawData/"
FileName = "CLc1_Trade_Price_5min.csv"
df_CLc1_TP_5min = pd.read_csv(FilePath + FileName,encoding='utf8',index_col = 0)

df_CLc1_TP_5min.dropna(subset=['Price'],inplace=True)
df_CLc1_TP_5min.drop(df_CLc1_TP_5min.loc[df_CLc1_TP_5min['bw_day']>0].index,inplace=True)
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['day_start'].isnull(),'day_start'] = 0
df_CLc1_TP_5min['business_day'] = df_CLc1_TP_5min['day_start'].cumsum(skipna=True)

# log(price), log(return), log(return)**2


df_CLc1_TP_5min['logP'] = np.log(df_CLc1_TP_5min['Price'])
df_CLc1_TP_5min['logR'] = df_CLc1_TP_5min.groupby('business_day')['logP'].diff()
df_CLc1_TP_5min['logR2'] = df_CLc1_TP_5min['logR']**2
# lagged log(return)
df_CLc1_TP_5min['logR_1'] = df_CLc1_TP_5min.groupby('business_day')['logR'].shift(1)
df_CLc1_TP_5min['logR_2'] = df_CLc1_TP_5min.groupby('business_day')['logR'].shift(2)
df_CLc1_TP_5min['logR_3'] = df_CLc1_TP_5min.groupby('business_day')['logR'].shift(3)
df_CLc1_TP_5min['logR_4'] = df_CLc1_TP_5min.groupby('business_day')['logR'].shift(4)

# count data
df_CLc1_TP_5min['count_logR'] = np.NaN

98
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['day_start']>0,'count_logR'] =
df_CLc1_TP_5min.groupby('business_day')['logR'].transform('count')
df_CLc1_TP_5min['count_logR'].fillna(method='ffill',inplace=True)

# Statistics for the jump test


Delta = 1/277
mu_1 = np.sqrt(2/np.pi)
mu_4_3 = 2**(2/3)*math.gamma(7/6)/math.gamma(1/2)

df_CLc1_TP_5min['RV'] = df_CLc1_TP_5min.groupby('business_day')['logR2'].transform('sum')

df_CLc1_TP_5min['RV_sign'] = np.NaN
df_CLc1_TP_5min['RV_Pos'] = np.NaN
df_CLc1_TP_5min['RV_Neg'] = np.NaN

df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']>0,'RV_sign'] =
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']>0].groupby('business_day')['logR2'].transform('sum')
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']<=0,'RV_sign'] =
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']<=0].groupby('business_day')['logR2'].transform('sum')

df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']>0,'RV_Pos'] =
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']>0,'RV_sign']
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']<=0,'RV_Neg'] =
df_CLc1_TP_5min.loc[df_CLc1_TP_5min['logR']<=0,'RV_sign']

df_CLc1_TP_5min['RV_Neg'] = df_CLc1_TP_5min.groupby('business_day')['RV_Neg'].fillna(method='ffill')
df_CLc1_TP_5min['RV_Pos'] = df_CLc1_TP_5min.groupby('business_day')['RV_Pos'].fillna(method='ffill')

df_CLc1_TP_5min['BV_i'] = np.abs(df_CLc1_TP_5min['logR'])*np.abs(df_CLc1_TP_5min['logR_1'])
df_CLc1_TP_5min['BV'] = df_CLc1_TP_5min.groupby('business_day')['BV_i'].transform('sum')*mu_1**(-2)

df_CLc1_TP_5min['TQ_i'] =
np.abs(df_CLc1_TP_5min['logR'])**(4/3)*np.abs(df_CLc1_TP_5min['logR_1'])**(4/3)*np.abs(df_CLc1_T

부 록 99
P_5min['logR_2'])**(4/3)
df_CLc1_TP_5min['TQ'] = df_CLc1_TP_5min.groupby('business_day')['TQ_i'].transform('sum')*Delta**(-1)*mu_4_3**(-3)

df_CLc1_TP_5min['BV1_i'] = np.abs(df_CLc1_TP_5min['logR'])*np.abs(df_CLc1_TP_5min['logR_2'])
df_CLc1_TP_5min['BV1'] =
df_CLc1_TP_5min.groupby('business_day')['BV1_i'].transform('sum')*mu_1**(-2)*(1-2*Delta)**(-1)

df_CLc1_TP_5min['TQ1_i'] =
np.abs(df_CLc1_TP_5min['logR'])**(4/3)*np.abs(df_CLc1_TP_5min['logR_2'])**(4/3)*np.abs
(df_CLc1_TP_5min['logR_4'])**(4/3)
df_CLc1_TP_5min['TQ1'] =
df_CLc1_TP_5min.groupby('business_day')['TQ1_i'].transform('sum')*Delta**(-1)*mu_4_3**(-3)*
(1-4*Delta)**(-1)

df_CLc1_TP_5min['Date_Time'] = df_CLc1_TP_5min.index
df_CLc1_TP_5min.drop(['RV_sign'],axis=1,inplace=True)
df_CLc1_TP_5min_volatility_measures = df_CLc1_TP_5min.groupby('business_day',as_index=False).last()

# save the file


outfile = str(FilePath + 'CLc1_TP_5min_volatility_measures_Delta277' + '.csv')
df_CLc1_TP_5min_volatility_measures.to_csv(outfile)

100
서 유 정
現 에너지경제연구원 부연구위원
<주요저서 및 논문>
󰡔유가변동의 국내 거시경제 파급효과 분석󰡕,
에너지경제연구원 에너지정보통계센터 출연과제 18-01, 2018(공동연구)

조 철 근
現 에너지경제연구원 연구위원
<주요저서 및 논문>
󰡔국내 수송용 연료 수요의 가격 및 교차 탄력성 추정에 관한 연구󰡕,
에너지경제연구원 기본연구보고서 17-09, 2017(공동연구)
“Fixed-b Inference for Testing Structural Change in a Time Series
Regression”, with T.J. Vogelsang, 󰡔Econometrics󰡕, 5(2), 2017.
“A Test of the Null of Integer Integration Against the Alternative of
Fractional Integration”, with C. Amsler and P. Schmidt, 󰡔Journal of
Econometrics󰡕, 187, 2015.

기본연구보고서 2019-07
국제유가 변동성 예측과 유가 확률분포 추정

2019년 12월 30일 인쇄


2019년 12월 31일 발행

저 자 서 유 정 조 철 근
발행인 조 용 성
발행처 에너지경제연구원
󰊴󰊴󰊵󰊴󰊳 울산광역시 중구 종가로 405-11
전화: (052)714-2114( ) 팩시밀리: (052)714-2028
등 록 제 369-2016-000001호(2016년 1월 22일)
인 쇄 (사) 장애인동반성장협회 동반사업장
에너지경제연구원 2019 ISBN 978-89-5504-734-9 93320

* 파본은 교환해 드립니다. 값 7,000원

본 연구에 포함된 정책 대안 등 주요 내용은 에너지경제연구원의 공식적인


의견이 아닌 연구진의 개인 견해임을 밝혀 둡니다.

You might also like