Professional Documents
Culture Documents
금융통계학
금융통계학
① 기술통계학(descriptive statistics)
자료의 기술과 요약을 다루는 통계학의 한 분야이다.
② 추론통계학(inferential statistics)
자료로부터 결론을 도출하는 것과 관련된 통계학의 한 분야이다.
1 확률, 확률변수, 분포
제 1 장 금융통계학 19
tail }이 되며, 주사위를 던지는 실험에서 표본공간 S = {1, 2, 3, 4, 5, 6}이
될 것이다. 표본공간 S, 사상 A 및 B를 이용하여 여집합, 교집합, 합집합 등
을 기호로 나타내면 다음과 같다.
① 여집합(complement, A 또는 A c ) : A = S - A
② 교집합(intersection) : A B
③ 합집합(union) : A B
1 확률의 정의
(1) 고전적 정의
n개의 사상이 상호 배타적이고 발생 가능성이 균등하다고 하자. 이들 사상
중 n A 개 만큼이 속성 A를 갖는다고 할 때 A의 확률은 n A / n 으로 정의되
고 기호로 P ( A ) = n A / n 로 표시한다. 참고로 상대적 빈도수에 따른 확률의
정의(frequency definition), P (A ) = lim n A / n 이다.
n
(2 ) 공리적 정의
사상 A의 확률은 표본공간의 모든 사상 A에 대하여 P ( A ) 0 을 만족하는
실수로 정의한다. n개의 사상 A 1 , A 2 , , A n 이 상호 배타적이라면,
n
P (A 1) + P (A 2 ) + + P (A n ) = P ( A i) = 1
i= 1
① 0 P (A ) 1 (1.1)
② P ( A ) = 1 - P (A ) (1.2)
20 제 1 부 금융통계학
③ 확률의 덧셈법칙
P (A B ) = P ( A ) + P ( B ) - P (A B) (1.3)
= P (A ) + P ( B ) (A , B가 disjoint 인 경우)
2 조건부확률
P (A B )
P ( B |A ) = (1.4)
P (A )
P (A ) = P (A B ) + P (A B c) (1.5)
3 확률의 곱셈법칙
P (A B ) = P ( A )P (B |A ) (1.6)
또는 P (A B ) = P ( B )P (A |B ) (1.7)
제 1 장 금융통계학 21
P(A 1 A 2 A n)
= P (A 1) P ( A 2 |A 1) P (A 3 |A 1 A 2) P (A n |A 1 A 2 A n)
(1.8)
P (A B ) = P ( A )P (B ) (1.9)
또는 P (A |B ) = P (A ) 그리고 P ( B |A ) = P ( B ) (1.10)
4 베이즈 정리
P ( B |A )P (A ) P ( B |A )P (A )
P (A |B ) = =
P(B) P ( B |A )P (A ) + P ( B |A c )P (A c )
(1.11)
22 제 1 부 금융통계학
다음과 같다.
P ( B |A )P (A ) 0 .999(0 . 006)
P (A |B ) = = = 0 . 38
P(B) 0 . 999(0 . 006) + 0 . 01(0 . 994)
5 확률변수
6 이항분포
제 1 장 금융통계학 23
이항확률변수의 확률분포를 이항확률분포 또는 이항분포(binomial distribu-
tion)라고 칭한다. 이항분포 확률변수의 밀도함수, 기대값 및 분산은 다음과
같다.
n!
밀도함수 : P ( X = x ) = p x ( 1 - p) n- x
, x = 0, ,n
x !( n - x ) !
기대값 : E (X ) = np
분산 : Var ( X ) = np( 1 - p) (1.12)
7 정규분포
24 제 1 부 금융통계학
1 1
f (X ) =
2 {
ex p -
2 2 (X - ) 2
} (1.13)
1 1
f (x) =
2
ex p - { 2
x
2
}, - < x < (1.14)
2 2
X 1 N ( 10 , 4 ) , X 2 N ( 14 , 6 )
제 1 장 금융통계학 25
이 때 수익률이 0%보다 작게 될 확률이 작은 증권은 X 1과 X 2 중에서
어떤 것이 될까? 이에 대한 물음에 답하기 위하여 먼저 표준화변량을 다음
과 같이 정의하자.
X -
Z= 다음으로,
X - 0-
P (X 1 <0) = P ( 1
< )
0 - 10
= P Z ( 1 <
4 )= P (Z 1 < - 2 .5) = 1 - (2 .5)
= 0 . 0062
유사하게
26 제 1 부 금융통계학
준화된 정규분포는 재무분야, 특히 위험관리 분야의 여러 곳에서 유용하게
사용될 수 있다.
< 그림 1-2> 는 표준정규분포와 자유도(degree of freedom ; dof)가 0.5인
t-분포를 그림으로 서로 비교하여 나타낸 것이다. < 그림 1-2> 를 보면 정
규분포는 평균 를 중심으로 좌우대칭이며 종모양(bell shaped)을 이루는 것
을 쉽게 알 수 있으며, t-분포의 경우에는 정규분포보다 꼬리가 더 두터운
모양을 보이고 있음을 알 수 있다. 후술하겠지만 꼬리가 두터운 leptokurtic
한 분포는 일반적으로 주식수익률이나 환율변화율 등과 같은 금융시계열에서
흔히 볼 수 있는 현상이다.
2 기대값, 평균, 분산
n n
E (X ) = x i P ( X = x i) = x i f (x i) (1.16)
i= 1 i= 1
n
또는 E (g (X )) = [g (x i) f (x i) ] (1.17)
i= 1
E (X - ) = E (X ) - = 0 (1.18)
E ( c) = c (단, c 는 상수를 나타냄) (1.19)
E [ cg (X ) ] = c E [ g (X ) ] (1.20)
E [ u( X ) + v(X ) ] = E [ u (X ) ] + E [ v(X ) ] (1.2 1)
즉, E 는 선형 연산자임을 알 수 있다.
모집단의 분산은 평균적인 편차제곱이다. 일반적으로 확률분포에서 분산은
편차제곱의 기대되는 값이다. 분산(variance) 또는 second moment around
the mean 은 다음과 같이 표기한다.
제 1 장 금융통계학 27
2
Var (X ) = = E [ (X - E ( X )) 2 ]
= E (X 2 ) - [ E (X ) ] 2 (1.22)
Var ( c) = 0 (1.23)
Var ( a + bX ) = b 2 Var (X ) (단, a , b는 상수) (1.24)
그림 1-3 N (0 , 1) , N (0 . 5 , 2 .0 2 ) , N ( - 0 . 5 , 0 .5 2 ) 의 예시
28 제 1 부 금융통계학
이번에는 함수의 평균과 분산에 대하여 다음과 같은 경우를 생각해 보기
로 하자.
E (X ) = , Var (X ) = 2
이고 g (X ) 가 X 에 대하여 미분 가능한 함수라고
하자. 구태여 예를 들어본다면 g (X ) = X 와 같은 형태의 함수가 될 것이
다. 이 때 함수 g (X )의 기대값 E (g ( X )) 와 분산 Var (g (X )) 는 어떻게 될
까? 대부분 이러한 경우에는 를 중심으로 테일러 1차 시리즈 확장을 하게
된다.
g (X ) g ( ) + g ' ( )(X - )
그러므로
E (g (X )) g( )
(1.25)
2
Var (g (X )) [g ' ( )] 2
(1) 최빈수(mode )
관측치 집합 중에서 빈도가 가장 높은 자료의 값을 말한다.
(2 ) 중위수(medi an )
관측치를 내림차순 혹은 올림차순으로 순서대로 늘어놓았을 때 가운데에 위
치한 값을 말한다.
제 1 장 금융통계학 29
(4 ) 비대칭도(skewness )
분포가 왼쪽 또는 오른쪽으로 치우친 정도를 말하며, 편차의 세제곱의 기대
치를 표준편차의 세제곱으로 나눈 값으로 나타낸다. 즉,
[E (X - ) 3]
3 (1.26)
(5) 첨도(kur t os i s )
분포가 어느 정도나 뾰족한지, 꼬리가 얼마나 두꺼운지를 측정하는 척도로서,
편차의 네제곱의 기대치를 표준편차의 네제곱으로 나눈 값으로 나타낸다. 즉,
[ E (X - ) 4]
4 (1.27)
4
초과첨도(excess kurtosis) = [ E (X - 4 ) ] - 3 (1.28)
30 제 1 부 금융통계학
Var ( R p ) ar (0 . 6X + 0 .4 Y)
3 결합확률분포
f X Y (x , y ) = P (X = x , Y = y ) (1.29)
1 한계밀도함수
X 와 Y 가 각각 x 1 , x 2 , , x m , y 1, y 2 , , y n 의 값을 띠는 이산확
n
f X (x ) = f X Y (x , y j )
j= 1
(1.30)
m
f Y (y ) = f X Y ( x i, y )
i= 1
제 1 장 금융통계학 31
즉, 한계밀도함수는 결합밀도함수에서 특정 변수를 concentrate out 한 결
과임을 알 수 있다.
2 조건부밀도함수
f X Y (x , y )
f Y |X (x , y ) = (1.31)
f X (x )
f X Y (x , y )
f X |Y (x , y ) = (단, f X (x ) 0, f Y (y) 0) (1.32)
f Y (y )
P ( Y = y , X = x)
P ( Y = y |X = x ) = (1.33)
P (X = x )
3 기대값과 공분산
E [ g (X , Y) ] = g (x , y )f (x , y ) (1.34)
X = x Y= y
32 제 1 부 금융통계학
Cov(X , Y) = xy = E [ (X - x )( Y - y )]
(1.35)
= E (X Y) - x y
(1) 공분산의 특성
① X 와 Y 가 독립적이지 않은 경우
4 상관계수, 조건부평균
xy Cov(X , Y)
xy = = 1/ 2 (1.38)
x y [ Var (X ) Va r ( Y) ]
제 1 장 금융통계학 33
이 때 유의해야 할 사항은 X 와 Y 가 통계적으로 독립이면 항상 xy = 0
(uncorrelated)이 성립하지만 그 역은 항상 성립하지 않는다는 것이다. 즉,
Cov(X , Y) = 0이더라도 X 와 Y 는 독립이 아닐 수 있다.
일반적으로 두 개의 변수가 있는 경우 조건부평균(conditional mean)은 다
음과 같이 정의된다.
E ( Y |X ) = yf Y |X (x , y ) (1.39)
y
5 이변량 정규분포
1
f X Y (x , y ) =
2 x y (1- 2
)
exp
{2( 1- - 2
) } (1.40)
2 2
x- (x - )(y - ) y-
단, =
( x
x
) - 2
x
x y
y
+
( y
y
) (1.41)
E (X ) = x , E ( Y) = y
2 2
Var (X ) = x , Var ( Y ) = y (1.42)
Cov(X , Y) = x y
34 제 1 부 금융통계학
< 그림 1-4> 에서는 x = y = 0, x = y = 1 그리고 두 확률변수의 상
한계분포는 N ( y ,
2
y ) 이다. 그러나 그 역은 항상 성립하지 않는다.
f X |Y ( x |y ) N
( x + (
x
y
)(y - y ),
2
x (1-
2
)
) (1.43)
제 1 장 금융통계학 35
예제 1- 1 X 와 Y 의 결합밀도함수(joint probability distribution)가 다음과 같이 주어져 있다고 가정
하자.
Y의
X
0 1 2 한계밀도함수
Y
( f Y (y ) )
0 16/36 8/36 1/36 25/36
1 8/36 2/36 0 10/36
2 1/36 0 0 1/36
X의 한계밀도함수
25/36 10/36 1/36
(f X (x ) )
(1) X 와 Y 의 한계밀도함수는? 즉, P (X = x ) 와 P ( Y = y) ?
예를 들어, P (X = 0) = P ( X = 0 Y = 0) + P (X = 0 Y = 1) + P (X = 0 Y = 2)
= 16/ 36 + 8/ 36 + 1/ 36 = 25/ 36
(2) X 의 기대값은?
E (X ) = 0 (25/ 36) + 1 ( 10/ 36) + 2 ( 1/ 36) = 20 / 36
(3) Y 의 기대값은?
(2)와 유사하게 계산한다.
(4) E ( X Y ) = ?
E (X Y ) = 0 0 ( 16/ 36) + 0 1 (8/ 36) + 0 2 ( 1/ 36) + 1 0 (8/ 36) + 1 1
( 2/ 36) + 2 0 ( 1/ 36) = 2/ 36
(5) Cov(X , Y ) = ?
Cov(X , Y ) = E (X Y ) - E (X )E ( Y ) 로 계산한다.
(6) X 와 Y 는 독립인가?
예를 들어, P (X = 1 , Y = 1) = ( 2/ 36) / ( 10/ 36) = 0 . 2
반면, P ( X = 1) P ( Y = 1) = ( 10/ 36) ( 10/ 36) = 0 . 077
서로 다르므로 독립이 아니다.
(7) P ( Y = 0 X = 1) , 즉 조건부밀도함수값은?
P (X = 1 , Y = 0) 8 10
= / = 0.8
P ( X = 1) 36 36
36 제 1 부 금융통계학
x -분포, t -분포, F -분포
2
4
1 2
분포
n
Z 1, , Z n 이 독립적인 표준정규분포 확률변수라 할 때 확률변수 Z 2i 는
i= 1
n
자유도가 n인
2
-분포한다(기호로는 Z 2
i
2
n 으로 표시함). 일반
i= 1
적으로 2
-분포 확률변수의 기대값은 자유도와 같다. <그림 1-5> 에서는
자유도가 각각 1, 3, 5인 경우의 2
-분포 밀도함수를 나타낸 것이다. 2
-
분포는 자유도가 커짐에 따라 점차적으로 정규분포의 모양과 유사해짐을 알
수 있다.
2
그림 1-5 자유도가 각각 1, 3, 5인 경우의 -분포 밀도함수
2
-분포의 특성은 다음과 같다.
제 1 장 금융통계학 37
① 두 개의 확률변수 X 와 Y 가 X 2
m , Y 2
n 이고, X 와 Y 가 서로 독립
이면,
2
X + Y m+ n (1.44)
n
2
(x i - i )
i= 1 2
2 n (1.45)
i
n
2
2 (x i - x )
( n - 1)s i= 1 2
2 = 2 n- 1 (1.46)
2 t -분포
Z 가 표준정규분포 변량이고 U 2
n 라고 하고, Z 와 U는 서로 독립이라고
하자. 이 때 t-분포 변량은 다음과 같이 정의한다.
Z
t= (1.47)
U/ n
( n +2 1 ) 1 1+ x 2 - ( n + 1) / 2
f (x) = ( ) (1.48)
( 21 ) ( 2n ) n n
n > 0
= 0 for n > 1
2 n
= for n >2
n- 2
38 제 1 부 금융통계학
한편, t-분포의 특성은 다음과 같다.
n
2
(x i - x )
x- 2 i= 1
t= t n- 1 (단 , s = ) (1.49)
s/ n n- 1
3 F-분포
두 개의 확률변수 U와 V가 U 2
m , V 2
n 그리고 U와 V는 서로 독립이
라고 하자. 이 때 F-분포 변량은 다음과 같이 정의된다.
U/ m
F= F m,n (1.50)
V/ n
[ ( m 2+ n) ] m
m
2 ( m - 2) / 2
x
n [ n ]
f (x) = ( m + n)/ 2 (1.51)
m
( 2 ) (2 ) (1 + mxn )
단, x > 0, m , n = 1, 2, ...
n
= , n >2
n- 2
2
2 2n ( m + n - 2)
= 2 , n >4
m ( n - 2) ( n - 4)
① F -분포는 2
-분포와 유사한 형태를 가진다.
② x 1, x 2 , , x n이 N( ,
2
) 분포한다고 하자. 이 때 다음이 성립한다.
제 1 장 금융통계학 39
2
( x- )
F= F 1, n - 1 (1.52)
s 2/ n
그리고
F t n- 1 (1.53)
③ x 1, x 2 , , x m 이 N( x,
2
x ) 분포하고 y 1 , y 2 , , y n이 N( y,
2
y )
s 2x / 2
x
F= F m - 1, n - 1 (1.54)
s 2y / 2
y
5 확률표본추출
40 제 1 부 금융통계학
n
f (x 1, x 2 , , x n ) = f (x 1)f (x 2 ) f (x n ) = + (x i) (1.55)
i= 1
6 표본통계량의 분포
1 표본통계량
(1) 표본평균
n
x= ( n1 ) i= 1
x i (1.56)
n
1
s2= ( n- 1 ) i= 1
(x i - x ) 2
(1.57)
n n
2 2 2
(x i - x ) = xi- n x (1.58)
i= 1 i= 1
제 1 장 금융통계학 41
n
(x i - x )(y i - y )
i= 1
r=
( n - 1)s x s y
2 표본통계량의 분포
x 1, x 2 , , x n 이 E ( x i) = , Var (x i) = 2
인 모집단으로부터의 표본이라
E ( x) =
(1.60)
2
Var ( x ) = /n
① x 1, x 2 , , x n 이 E (x i ) = , Var (x i) = 2
인 정규분포 모집단으로부
터의 표본이라 할 때
2
x N ( ,
n ) (1.61)
( x- ) ( x- )
② Z= = n N (0 , 1) (1.62)
/ n
③ x 1, x 2 , , x n 이 E (x i ) = , Var (x i) = 2
인 정규분포 모집단으로부
터의 표본이라 할 때 표본분산
n
s2= ( n -1 1 ) i= 1
(x i - x ) 2
42 제 1 부 금융통계학
n
2
2 (x i - x)
( n - 1)s i= 1 2
U= 2 = 2 n- 1 (1.63)
( n - 1)s 2
④이 때 E [ 2 ]= n - 1 (E(
2
m ) = m 이므로), E ( s 2 ) =
2
이 성립함
( x- )
t= n t n- 1 (1.64)
s
7 추정량의 특성
(1) 불편성
E ( ) = 이 성립하는 경우 추정량 를 모수 의 불편추정량이라고 한다.
(2) 효율성
과
1 2 를 각각 모수 의 불편추정량이라고 하자. Var ( ) < Var (
1 2 )인 경
우 을
1 2 보다 효율적이라고 한다. 이 때 Var ( ) / Var (
1 2 ) 를 상대적 효
(3) 평균제곱오차
추정량 의 평균제곱오차(mean squared error; MSE)는 다음과 같이 정의한다.
제 1 장 금융통계학 43
MSE ( ) = E [ ( - ) 2] (1.65)
이 때 MSE 는 추정량의 분산과 편의(bias)의 두 항으로 분해할 수 있다.
MSE ( ) = E [ ( - ) 2] = E [ - E ( ) + E ( ) - ]2
2
= E [ - E ( ) + b( ) ] = E [ - E ( ) 2 ] + b( ) 2
+ 2b( )E [ - E ( ) ]
2
= Var ( ) + b( ) (1.66)
= a 1x 1 + a 2x 2 + + a nx n = a ix i (1.67)
① 점근적 불편성
추정량 는 다음의 조건이 만족하는 경우 점근적 불편성(asymptotic unbi-
asedness)을 띤다고 말한다.
② 일치성
추정량 는 다음의 조건이 만족하는 경우 일치추정량이라고 말한다.
44 제 1 부 금융통계학
lim P ( - n + ) = 1, for all >0 (1.69)
n
③ 점근적 정규성
추정량의 표본분포가 표본의 크기가 무한히 커짐에 따라 정규분포에 접근할
때 그 추정량은 점근적으로 정규분포한다고 말한다.
다음은 점근적 정규성(asymptotic normality)과 관련된 두 가지 주요 결과
이다.
ㄱ. 대수의 법칙 : Z n 가 iid분포하는 확률변수 Z 1 , Z 2 , , Z n 의 평균이라고
하자. 이 때 다음이 성립한다.
p lim ( Z n ) = E ( Z n ) (1.70)
p lim ( x n ) = (1.71)
유사하게
2
(x i - x )
2 2
p lim ( s ) = = (1.72)
n- 1
제 1 장 금융통계학 45
참고
체비셰프의 부등호(Chebyshev's inequality)
임의 확률변수에 대하여 확률변수가 이의 기대값의 k , 표준편차 범위 내의 값을 취할 확률은 적어도
1
1- 이다. 즉,
k2
1
P( X - k ) (1.73)
k2
이의 기대값과 분산이 각각 와 2
라고 하자. 표본의 크기 n 이 클 때
n
X i 는 대략적으로 다음과 같은 평균과 분산을 갖는 정규분포를 한다.
i= 1
n
2
x i N( n , n )
i= 1
(1.74)
n
2
x = ( 1/ n) x i N( , / n)
i= 1
또는 Z = n( x - )/ N (0 , 1) (1.75)
8 모수추정절차
46 제 1 부 금융통계학
1 최소자승법
예시 최소자승법에 의한 평균의 계산
i 번째 관찰치가 다음과 같이 평균과 i 번째 잔차로 이루어지는 경우를 생각해 보자.
2
x i= + ei, e i (0 , ) (1.76)
2
= (x i - ) (1.77)
SSE
= ( - 2)( x i - )
= ( - 2) [ x i- n ] = 0 (1.78)
즉, = ( n1 ) x i
2 최우추정법
e i N (0 , 2
) 을 가정하면 e i 의 밀도함수(또는 우도함수)를 설정할 수 있다.
우도함수가 f ( ; x ) , = ( , 2
) ' 이라면 최우추정법(maximum likelihood esti-
mation; MLE)은
max f ( ; x) (1.79)
가 되는 를 찾는 것과 같다.
제 1 장 금융통계학 47
9 구간추정
x-
[
P - t* t=
s/ n
t* ]= 0 . 95
P [ x - ( s/ n) t * x + ( s/ n) t * ] = 0 .95 (1.81)
48 제 1 부 금융통계학
10 통계적 가설검정
1 귀무가설과 대립가설
a b c d
H0 = 0 = 0 0 0
HA = 1 0 > 0 < 0
제 1 장 금융통계학 49
2 제1종 오류와 제2종 오류
③ 유의수준(level of significance)
유의수준이란 귀무가설이 옳은 경우 제1종 오류를 범할 최대확률을 말한다
(예 : 무죄인 사람을 기소할 최대확률).
④ 검정력(power of a test)
검정력이란 귀무가설이 사실이 아닐 때 이를 (옳게) 기각하는 확률을 말한다
(예 : 유죄인 사람을 기소하는 확률).
① 가설설정
귀무가설( H 0 )과 대립가설( H A )의 두 가지를 각각 설정한다.
H0: = 0 , H A : 0
50 제 1 부 금융통계학
② 아래의 식을 이용하여 검정통계량을 계산한다.
t= n ( x -s )
0
t n- 1
11 단순회귀분석
1 단순회귀분석의 가정
제 1 장 금융통계학 51
(1) 선형모형
Y t= + X t+ u t (1.82)
① 누락변수 효과
② 비선형성 효과 : Y t = + X t+ X 2
+ u t (1.83)
③ X 와 Y 변수의 측정오차
④ 예측 불가능한 확률적 효과
그림 1-6 회귀분석의 가정
(4) X t 는 비확률적(given or nonrandom)이다. 이는 X t 가 u t 와 무상관임을
의미한다. 즉,
Cov(X t , u t) = E ( X t u t ) - E ( X t )E ( u t ) = 0 (1.85)
따라서,
E ( Y t |X t) = E ( + X t + u t |X t) = + X t + E ( u t |X t) = + X t
52 제 1 부 금융통계학
(1.86)
Var ( u t) = E ( u 2t ) =
2
for all t (1.87)
2
u t N (0 , ) (1.89)
제 1 장 금융통계학 53
2 회귀모수의 추정
(1) 단순법
단순법(simple method)이란 오차항의 평균이 0이라는 가정을 이용하여 두
개의 방정식을 만들고 이를 두 개의 미지수에 관하여 푸는 방식을 말한다.
식 (1.84)의 오차항의 평균을 0이라고 하는 가정, 다시 말하면 E ( u t) = 0
을 이용하면,
E ( u t ) = 0 = E ( u t X t) (1.91)
u t = Y t- - X t (1.92)
1 1
ut= 0 = ( Yt- - X t)
T T
1 1 1
= Yt- (T )- X t
T T T
1 1
(X t u t) = [X t ( Y t - - X t)] = 0 (1.93)
T T
X tYt- X t- X 2t = 0 or X tYt= X t+ X 2
t
(1.94)
54 제 1 부 금융통계학
(2) 최소자승법
최소자승법(method of least squares)이란 잔차의 제곱의 합을 최소화하는 회
귀선을 구하는 방법이다. 즉,
(3) 최우추정법
최우추정법(MLE)이란 본래 각 표본관측치의 밀도함수를 극대화하는 방법으
로 모수를 추정하는 방법이다. 조금 더 구체적으로 u i N (0 ,
2
) 을 가정하
제 1 장 금융통계학 55
우도함수에서 t-번째 관측치의 우도함수가 l t ( ; Y , X ) , = ( , ,
2
)'
이라면 최우추정법에서는,
T
max ln [ l t ( ; Y , X ) ] (1.96)
t= 1
가 되는 를 구하는 것이다.
단순회귀분석에서는 최우법에 의해 구한 , 는 최소자승법에 의해 구한
그것과 동일하게 된다(즉, 닫힌 해가 존재한다). 그러나 좀더 복잡한 모형에
서는 MLE의 경우 닫힌 해가 존재하지 않는 경우가 많은데, 이러한 경우 대
수우도함수의 극대화는 수치최적화(numerical optimization) 방법을 사용하
게 된다.
한편, 식 (1.93)과 식 (1.94) 두 개의 정규방정식의 해를 구하면 두 개의
회귀계수 , 를 얻을 수 있다.
X Y
X Y- S S / ( T - 1)
T xy xy Cov(X , Y)
= = = =
2 S xx S xx / ( T - 1) Var ( X )
( X)
2
X -
T
(1.97)
= Y- X (1.98)
3 최소자승추정량의 특성
이제 u i N (0, 2
) 라는 전제하에서 위에서 구한 최소자승추정량이 어떤 특
E( ) = , E( ) =
56 제 1 부 금융통계학
Y 2- Y 1
예 : 또한 = 도 불편추정량이다.
X 2- X 1
u2- u 1
= + E( ) =
X 2- X 1
S xu/ T
즉, = + (단, S pq = ( P - P)( Q - Q))
S xx / T
LLN에 의하여
S xu
Cov(X , u)
T
S xx
Var ( X )
T
(3) 효율성
가정 (2)~(6)하에서 최소자승추정량은 불편선형추정량 중에서 가장 효율적
인 추정량이다(즉, BLUE 특성을 갖는다). 이러한 결과는 가우스-마코프
정리 라고 알려져 있다.
4 최소자승추정량의 정확도
제 1 장 금융통계학 57
T X t- X
=
t+ 1 [ S xx ] Y t (1.99)
따라서,
, = f ( Y 1, Y 2 , , Y T ) = g ( u 1, u 2 , , u T) (1.100)
2
X
② Var ( ) = E [ ( - 2
) ]=
2
(1.102)
TS xx
X
③ Cov( , ) = E[ ( - )( - )] = - 2
(1.103)
S xx
u 2t
s =
2 2
= ( s 2는 2
의 불편추정량임) (1.104)
T- 2
5 회귀계수에 대한 가설검정
H0: = 0 , H A : 0 (1.105)
58 제 1 부 금융통계학
위의 가설을 검정하기 위한 통계량은 다음과 같다.
- 0
tc= t T- 2 (1.106)
Var ( )
검정통계량은
- 0
t c( ) = = -2.592095
Va r ( )
제 1 장 금융통계학 59
이다. 따라서 p -값은 다음과 같이 계산할 수 있다.
이번에는 다음과 같은 분산 2
의 가설검정을 생각해 보자.
2 2 2 2
H0: = 0 , H A : > 0 (1.107)
6 적합도의 측정
2
( Y t- Y)
2
Y Y, y = (1.109)
T- 1
60 제 1 부 금융통계학
이 경우 Y 를 예측하는 데 수반되는 오차는 다음과 같다.
2
T SS = ( Y t- Y) (1.110)
그림 1-10 표본회귀선의 평가
하는 경우 T S S 가 아니라 S SE = u 2
t = ( Y t- Y t ) 2 가 된다. 만일 모
T SS = R S S + SSE (1.111)
2
u
2 SSE R SS 2
R = 1- = 1- = 0 R 1
2 T SS TSS ,
(Y- Y)
(1.112)
제 1 장 금융통계학 61
이 때 Y t 관측치들에 동일한 상수를 더한 뒤 R 2 를 다시 계산해 보자. X
와 Y 의 관계에는 변함이 없음에도 불구하고 이 경우 R 2 는 다르게 계산됨
을 볼 수 있는데, 이는 단순히 통계적 허상임을 유의하자. 반면 X 와 Y 의
단위를 변경하는 경우( Y * = 1000 Y , X = 100X ' 등) 계수값들은 달라질 수 있
으나, 추정계수의 단위변경을 고려하여 해석하면 계산된 통계량들은 불변임
을 유의하자.
결정계수는 다음과 같이 관측치와 예측치 사이의 상관계수의 제곱으로 표
현할 수도 있다.
R SS Cov 2 ( Y t , Y t )
R 2= =
TSS
Var ( Y t) Var ( Y t )
= r2 (1.113)
Y, Y
7 예측
E ( Y |X = X 0 ) = E ( ) + X 0 E ( )
(1.114)
= + X 0 = E ( Y |X = X 0 )
수 있다.
한편, 평균예측치의 분산추정량은 다음과 같이 주어진다.
62 제 1 부 금융통계학
Var ( Y 0 ) = s 2 = E [ Y 0 - E ( Y |X 0 ) ] 2
Y0
(1.115)
2
1 (X - X)
= 2
[ T
+
0
S xx ]
회귀모형을 이용하는 목적은 크게 두 가지로 나누어 생각해 볼 수 있다.
하나는 X 0가 주어진 경우 Y 0의 기대치에 대한 추정이고, 또 다른 하나는
Y 의 특정값 또는 개별값에 대한 예측이다. 식 (1.115)로부터 평균예측치의
신뢰구간은 다음과 같이 계산한다.
{Y 0 t* s Y0 } (1.116)
*
{Y 0 t s u0 } (1.117)
제 1 장 금융통계학 63
2
1 (X - X)
Var ( u 0 ) = s 2 =
u0
2
[ 1+
T
+
0
S xx ]>s2
Y0
(1.118)
T
( Y ft , i - Y t )
t= 1
MSE i = ( i = 1, 2) (1.119)
T- 2
12 다중회귀분석
1 다중회귀모형
Y t= 1 X t1 + 2 X t2 + + k X tk + u t ( t = 1, 2 , , T)
(1.120)
X t1 = 1 (1.121)
또는
k
Y t= j X tj + u t ( t = 1, 2 , , T) (1.122)
j= 1
64 제 1 부 금융통계학
식 (1.120)과 식 (1.122)에서 X tk는 독립변수 X k의 t-번째 관측치를 나
타낸다. 위의 모형은 종속변수 Y 에 있어서의 총변동은 1X t1 + X
2 t2 +
Y= X + u (1.123)
단,
Y 1 X 12 X 1k u
1 1 1
, X = 1 X X 그리고 u =
Y= 22 2k , =
Y T k u T
1 X T2 X Tk
(1.124)
Cov(X ti , u t ) = E (X ti , u t) = 0 ( i = 1, , k ; t = 1, , T)
(1.125)
S y2 S 33 - S y3 S 23
2 =
S 32 S 22 - S y2 S 23
3 = (1.126)
1 = Y- 2 X 2- 3 X 3
단, = S 22 S 33 - S 23 , S ij = (X ti - X i )( X tj - X j) (1.127)
제 1 장 금융통계학 65
이 때 다중회귀모형의 추정계수를 행렬로 표현하면 다음과 같다.
- 1
= ( X 'X ) X 'y (1.128)
2
S 33
Var ( 2 )= (1.129)
2
S 22
Var ( 3 )= (1.130)
2
- S 23
Cov( 2 , 3 )= (1.131)
2 - 1
Var ( ) = (X 'X ) (1.132)
또한
u2
2 2
s = = (1.133)
T- k
2 다중회귀모형의 적합도 검정
66 제 1 부 금융통계학
의 총변동에 대한 회귀방정식에 의해 설명된 변동의 비율로서 실제 관측치들
과 회귀선의 근사성에 대한 추정치로 생각할 수 있다.
u2
2 SSE R SS 2
R = 1- = 1- = 0 R 1
2 T SS TSS ,
(Y- Y)
(1.134)
2 Var ( u)
R = 1-
Var ( Y)
S SE / ( T - k)
= 1- (1.135)
T S S / ( T - 1)
T- 1
= 1- ( 1 - R 2)
T- k
① R 2
(조정다중결정계수)가 큰 모형을 선택한다.
2
u
② s= (root M SE)가 작은 모형을 선택한다.
T- k
제 1 장 금융통계학 67
3 다중회귀모형의 유의성 검정
비제약식(U) :
Y t= X
1 t1 + 2 X t2 + + m X tm + m+ 1X tm + 1 + + X
k tk + u t
(1.136)
제약식(R) :
Y t= X
1 t1 + 2 X t2 + + m X tm + u t (1.137)
H 0 : m+ 1 = = k = 0 : ( k - m ) 개의 제약조건
S SE u 2
2 T- k (1.138)
S SE R 2
2 T- m (1.139)
이면 다음을 보일 수 있다.
68 제 1 부 금융통계학
( SSE R - S SE u) 2
2 T - m - ( T - k) (1.140)
( SSE R - S SE u ) / ( k - m )
F= F k- m, T - k ( ) (1.141)
SSE u / ( T - k)
예를 들어 제약식(R)이 Y t = 1 + u t, H 0 : 2 = = k = 0 인 경우 F -
통계량은 다음과 같이 계산된다.
R S S u / ( k - 1) R 2 / ( k - 1)
F= = F k - 1, T - k ( ) (1.142)
S SE u / ( T - k) ( 1 - R 2 ) / ( T - k)
소비함수 : C t = 1 + 2 Wt + 3 P t+ u t (1.143)
또는 H
H 0 : 2 = 3 0 : [ 1 - 1]
[ ]= 0
2
3
(1.144)
① Wald 검정
R : Y t= 1 + 2 (X t2 + X t3 )+ u t (1.145)
( SSE R - S SE u ) / (3 - 2)
F= F 1, T - 3 ( ) (1.146)
S SE u / ( T - 3)
② 간접 t-검정
C t = 1 + 2 Wt + ( 2 - )P t + u t
= 1 + 2 ( W t + P t) - P t+ u t (1.147)
H 0 : = 2 - 3 = 0
제 1 장 금융통계학 69
③ 직접 t-검정
2 - 3 N [ 2 - 3 , Var ( 2 - 3 )] (1.148)
2 - 3 - ( 2 - 3 )
T = 1 (1.149)
2
[ Var ( 2 ) + Var ( 3 ) - 2Cov( 2, 3) ]
Y t= 1 + 2X t2 + 3 X t3 + u t (1.150)
H 0 : 2 3 = 1 (1.151)
먼저 귀무가설을 식 (1.150)에 대입하면
1
Y t= 1 + 2X t2 + X t3 + u t (1.152)
2
LR = - 2 (L R - L U ) 2
k (단, k 는 제약조건의 수) (1.153)
70 제 1 부 금융통계학
수추정량들에 편의를 초래하게 된다. 그러나 그러한 추정량들의 분산은 그렇
지 않았을 경우에 비해서 편의를 상쇄시킬 수 있을 만큼 작게 된다. 하지만
모형에서 제외된 변수가 포함된 설명변수들과 상관관계가 없는 경우에는 계
수추정치들이 변수가 포함되어 있는 경우와 동일하게 되어 편의는 없게 될
것이다.
다음에서는 중요변수를 누락한 경우(omission of a relevant variable)의 올
바른 식과 그릇되게 추정된 식을 예시하고 그 효과를 정리한 것이다.
바른 식 : Y t = 1 + 2 X t2 + 3 X t3 + u t (1.154)
중요변수 누락식 : Y t = 1 + X
2 t2 + v t (1.155)
(1) 직관적으로 보면
① v t= 3 X t3 + u t E ( v t) = 3X t 0 (1.156)
② Cov(X t2 , v t) = Cov(X t2 , 3 X t3 + u t)
(2) 효과
제 1 장 금융통계학 71
5 부적합한 변수의 추가
바른 식 : Y t = 1 + 2 X t2 + u t (1.158)
(1) 효과
6 모형 설정오류에 대한 검정
72 제 1 부 금융통계학
하고자 한다. RESET 검정과 Hausman 검정절차는 다음과 같이 간단하게 요
약할 수 있다.
estimated : Y t = 1 + 2 X t2 + v t (1.160)
suspect : Y t = 1 + 2 X t2 + 3 X t3 + u t (1.161)
① Y = 1 + 2 X 2 를 추정한다.
Y t= 1 + X
2 t2 + 1 Y 2t + 2 Y 3t + t (1.162)
Y t= + X t+ u t (1.163)
H 0 : X 와 u 간에 현시점 상관관계 없음
제 1 장 금융통계학 73
① X 를 Z 에 회귀분석한다.
X t= + Z t (1.164)
* *
Yt= + X t (1.165)
* *
= Y- X
(1.166)
Z tY t
*
=
Z tX t
(3) 검정절차
① Yt= + X t+ Z t (1.167)
만일 가 유의적이면 식 (1.163)의 설명변수와 잔차항 사이에 현시점 상관
관계가 있는 것으로 결론내린다.
② 다중회귀식의 경우
Y t= 1 + 2 X t2 + 3 X t3 + u t (1.168)
74 제 1 부 금융통계학
ㄱ. 1단계 : u t 와 무상관인 도구변수가 m 개 있다고 하자( Z 1 , Z 2 , , Z m
에 회귀분석하여 X t2 와 X t3 을 구한다.
ㄴ. 2단계 : Y t = 1 + 2 X t2 + 3 X t3 + 2 X t2 + 3 X t3 + t (1.169)
ㄷ. 3단계 : 2 , 3 가 동시에 영인지 F -검정을 실행한다. 만일 영이 아니면
설정오류가 있는 것으로 결론내린다.
1 이분산의 정의
Y t= + X t+ u t (1.170)
제 1 장 금융통계학 75
본래 회귀분석에서는 식 (1.170)의 확률변수 u t 의 분산이 다른 변수의 값
이나 시간에 상관 없이 항상 일정하다는 다음과 같은 가정이 필요하다. 즉,
Var ( u t) = E ( u 2t ) =
2
for all t (1.171)
Var ( u t) = E ( u 2t ) = 2
t ( t = 1, 2 , , T) (1.172)
76 제 1 부 금융통계학
2 이분산의 검정
① 1단계
t = f (Z t) 의 관계를 만족하는 변수 Z t 를 식별한 뒤 자료를 Z t 의 값이 작
② 2단계
전체표본 T 를 처음의 T 1 개와 나중의 T 2 개로 구분하고 중간의 T 1 + 1부
터 T - T 1 까지 관측치를 버린다. 생략하는 관측치의 수는 임의로 정하나
1 1
대략 전체표본의 또는 정도로 한다.
6 3
③ 3단계
처음과 나중의 두 개의 표본을 사용하여 각각 LS를 실행한다.
④ 4단계
각각의 회귀식으로 잔차항 제곱합을 구한다.
T 1
2
S SE 1 = ut
t= 1
T
2
S SE 2 = ut (1.173)
t= T - T 2+ 1
⑤ 5단계
귀무가설( H 0 :
2
1 =
2
2 )하에서의 검정통계량을 구한다.
제 1 장 금융통계학 77
2
2 S SE 2 / ( T 2 - k)
F c= = F T 2 - k , T 1- k (1.174)
2 S SE 1 / ( T 1 - k)
1
대립가설은 일반적으로 H A : 2
1 <
2
2 이다.
Y t= 1 + 2 X t2 + + k X tk + u t (1.175)
2
t = 0 + 1Z t1 + 2 Z t2 + + p Z tp (1.176)
H 0 : 1 = = p = 0 (1.177)
① 1단계
u 2t
2
LS u t, = (1.178)
T
② 2단계
u 2t
2
= 0 + 1 Z t1 + + p Z tp + v t (1.179)
③ 3단계
귀무가설하에서 다음과 같은 검정통계량을 구한다.
1 2
R SS p (1.180)
2
1
R SS >
2
p , 0 . 05 이면 귀무가설을 기각한다.
2
이 때 BP 검정은 정규성(normality) 가정의 위배 여부에 따라 결과가 민
감한 것으로 알려져 있다. 또한 이분산성의 형태에 대한 선험적 지식이 필요
하다.
78 제 1 부 금융통계학
hi t e 검정(대표본 LM검정)
(3) W
Breusch-Pagan 검정은 오차항이 정규분포한다는 가정에 의존하고 있는 데 반
하여, White 검정에서는 정규성에 크게 의존하지 않으면서도 Breusch-Pagan
검정과 밀접하게 연관된 검정방법을 제시하였다. 즉, White 검정에서는 이분
산성의 형태에 대한 선험적 가정이 불필요하다.
다음과 같이 회귀식과 분산식이 주어질 때 White 검정의 단계별 절차는
다음과 같다.
Y t= 1 + 2 X t2 + 3 X t3 + u t (1.181)
2 2 2
t = 0 + 1 X t2 + 2 X t3 + 3 X t2 + 4 X t3 + 5 X t2 X t3 + v t
(1.182)
① 1단계 : LS u t , u 2t
2 2
T R 5 (1.183)
2
Y= X + u, u (0, ) (1.184)
- 1 2 - 1
H C Var ( ) = (X 'X ) [X ' ( )X ](X 'X ) (1.185)
제 1 장 금융통계학 79
2 T
X ' X 1
X tX t ' 를 다음과 같이 추정한다.
2
= = t
T T t= 1
T
1
S 0= u 2t X tX t '
T t= 1
이 때 S 0는 의 일치추정량이다. 따라서,
- 1 - 1
E st. H C Var ( ) = T (X 'X ) S 0 (X 'X ) (1.186)
3 이분산의 처치
Y t 1 X t2 X t3 u t
= 1 + 2 + 3 + (1.187)
t t t t t
1
Y *t =
* * *
+ 2 X t2 + 3 X t3 + u t (1.188)
t
u Var ( u t)
*
Var ( u t ) = Var
( )= t
t
2
t
= 1 (상수) (1.189)
1
그러므로 Y *t 를 , X
*
t2 , X
*
t3 (추가적 상수는 불필요)에 회귀분석하면
t
80 제 1 부 금융통계학
예시 Var ( u t) =
2
=
2
Z 2
또는 = Z (1.190)
t t t t
Yt 1 X t2 X t3 u t
= 1 + 2 + 3 + (1.191)
Zt Zt Z t Z t Z t
1
Y *t = + 2 X *
t2 + 3 X *
t3 + u *
t (1.192)
Z t
2
Var ( u t) Z 2t
Var ( u *t ) = = = 2
(상수) (1.193)
Z 2t Z 2t
4 자기상관의 정의
제 1 장 금융통계학 81
ln K OSPI t = + tim e + u t , t = 80 . 1 - 98 . 1 (1.196)
y = + X + u,
(1.197)
A R ( 1) : u t = u t- 1 + t , - 1< < 1
2
t i i d (0 , )
82 제 1 부 금융통계학
둘째, 어느 경제관계에 실제형태와는 다른 수학적 형태로 설정된 경우, 예
를 들어 주기적 관계를 갖는 두 변수의 관계를 선형함수로 설정하는 것과
같은 모형의 수학적 형태 설정오류에 의해서 자기상관이 발생할 수 있다.
셋째, 일련의 지속적인 기간을 통해 실제변동을 평균화하여 완만하게 자료
를 생성시켜 낼 때 자기상관이 생기게 된다.
넷째, 자기회귀모형으로 진정한 회귀모형이 설정되어 있는 상황에서 시차
변수를 포함시키지 않는 모형을 설정하게 되면 잔차항에는 당연히 뜻하지 않
는 자기상관이 생기게 된다.
다섯째, 태풍이나 홍수와 같은 순수한 확률적 요소가 어느 한 기간 이상으
로 그 영향이 확산되는 양상을 보이게 될 때 여러 경제변수들은 여러 기간
동안 영향을 받을 것이며, 이에 따라 확률오차항에 자기상관이 생기는 실제
자기상관의 경우를 생각해 볼 수 있을 것이다.
일반적으로 자기상관 특성을 갖는 자료를 이용하여 회귀분석을 하게 되면
다음과 같은 결과를 초래하게 된다.
① 추정량과 예측치는 여전히 불편추정량이고 일치추정량이다(왜냐하면 E ( u t)
= 0 , E ( u tX t) = 0 이므로).
② LS 추정량은 더 이상 BLUE가 아니고 비효율적이 된다. 예측치 또한 비
효율적이 된다.
③ 회귀계수의 분산추정치는 편의를 가지며 따라서 가설검정은 유효하지 못
하다. 만일 <그림 1- 14>처럼 자기상관이 정(+) 이고 독립변수 X t 가 시
간의 흐름에 따라 증가하는 경우 표준오차는 참값을 과소추정할 것이다.
그림 1-14 자기상관의 예
제 1 장 금융통계학 83
5 자기상관의 검정
Y t= 1 + X
2 t2 + 3 X t3 + + X
k tk + u t (1.198)
u t= u t- 1 + t (1.199)
① 1단계 : LS를 실행하고 u t를 구한다.
② 2단계 : 다음과 같이 Durbin-Watson 통계량을 구한다.
T
2
( u t - u t - 1)
t= 2
d= T
(1.200)
2
u t
t= 1
T
u t u t- 1
t= 2
= T
(1.201)
2
u t
t= 1
d 2( 1 - ) (1.202)
= 0 d= 2 (1.203)
84 제 1 부 금융통계학
즉, H 0 : = 0의 검정은 H 0 : d = 0의 검정과 동일하게 됨을 알 수 있
③ 3단계
H 0 : = 0, H A : >0 에서 하한치와 상한치를 구한다. 즉,
④ 4단계
d d L 이면 귀무가설을 기각하고 정의 일차 자기상관이 있다는 가설을 채택
참고
① 만일 대립가설이 H A : <0 이면 검정통계량을 d 대신 (4 - d )로 계산하여 3단계와 동일하게 가설검정
한다.
② 만일 대립가설이 H A : 0 이면 d d L 또는 d 4 - d L 인 경우 귀무가설을 기각하고, d U d 4- d U
이면 귀무가설을 채택한다.
(3) LM검정
자기상관 검정을 위한 Durbin-Watson 검정법은 검정통계량 d 가 검정결과가
불완전한 영역에 속하는 경우에는 자기상관의 존재 여부에 대하여 아무런 결
론을 내릴 수 없으며, 또한 Durbin-Watson 검정법에 고유한 가정들이 있어
분석해야 할 자료들이 이러한 가정에 위배되는 경우 이를 사용할 수 없는
단점이 있다. 이 때에는 LM(lagrangian multiplier) 검정법을 사용할 수 있다.
LM 검정법의 단계별 절차를 소개하면 다음과 같다.
① 1단계
식 (1.198)과 같은 회귀식에서 LS를 실행하고 u t를 구한다.
제 1 장 금융통계학 85
② 2단계
u t를 상수 X t2 , , X tk , u t - 1에 대하여 T - 1 개의 관측치를 사용하여
③ 3단계
( T - 1)R 2
>
2
1, 0 . 05 이면 귀무가설을 기각한다. 이 때 대립가설은 H A : 0
6 자기상관의 처치
Y t= 1 + X
2 t2 + 3 X t3 + + k X tk + u t (1.204)
u t= u t- 1 + t (1.205)
이제 를 이용하여 다음과 같이 모형을 변환시킨 다음 단계별 추정을 실
시한다.
Y t- Y t- 1 = 1 (1- )+ 2 [X t2 - X t - 1, 2 ]+
+ k [X tk - X t - 1, k ]+ t
* * *
Y t = 1 (1- )+ 2 X t2 + + X
k tk + t (1.206)
86 제 1 부 금융통계학
① 1단계 : LS를 실행하고 u t를 구한다.
② 2단계 : 를 추정한다.
③ 3단계 : Y *t = Y t - Y t- 1 , X *
tj = X tj - X t - 1, j 를 계산한다.
④ 4단계 : 1단계부터 다시 반복한다(단, Y * 를 X * 에 대하여 회귀분석한다).
7 다중공선성의 정의
Y t = 1 + 2X t2 + 3 X t3 + u t (1.207)
X t3 = a + bX t2 (1.208)
제 1 장 금융통계학 87
우에는 확률오차항이 있는 것을 알 수 있다. 즉, 준다중공선성의 경우에는
관련되어 있는 두 변수 간의 관계가 일정하지 않고 확률적으로 결정된다는
것이다. 이처럼 모형에 포함된 어떤 설명변수가 다른 설명변수와 상관관계를
갖는 다중공선성이 발생하는 이유는 첫째, 경제의 규모는 동일한 요인들에
의하여 영향을 받고 그 결과 경제변수들은 시간을 두고 동일한 형태를 보이
는 추세를 가지기 때문이며, 둘째, 시차모형의 사용이 점점 확대되면서 어느
한 변수의 연속적인 값이 상호 연관되어 나타나기 때문이다. 일반적으로 다
중공선성 특성을 갖는 자료를 이용하여 회귀분석을 하게 되면 다음과 같은
결과를 초래하게 된다.
8 다중공선성의 탐색과 처치
88 제 1 부 금융통계학
다중공선성이 함수관계에 존재하는 경우 취해야 할 해결방법은 다중공선성
의 심각성에 따라, 대표본이나 횡단면 표본자료 등과 같은 다른 자료를 이용
할 수 있는 자료이용 가능성에 따라, 다중공선성에 연관된 변수의 중요도 등
에 따라 매우 다양하다.
다음은 일반적인 다중공선성의 해결책을 간단히 정리한 것이다.
14 단일시계열 변동성 모형
1 ARCH 모형
제 1 장 금융통계학 89
y t = X t + t t , t N ( 0 , 1) (1.210)
2
t = t t , t t- 1 N (0 , t ) (1.211)
2 2 2
t = 0 + 1 t- 1 + + p t- p (단, 0 >0 ; 1 , , p 0)
(1.212)
2 2 2 2
t = t + ( t - t )
2 2 2 2
= 0 + 1 t- 1 + + p t- p + v t (단, v t = t ( t - 1))
(1.213)
2 2 2
t = 0 + 1 t- 1 + + p t- p
90 제 1 부 금융통계학
2 ARCH 효과의 검정과 추정
ln f ( 1 , , T 0 , X ; )
T
= ln f ( t t- 1 ; )
t= 1
T T
= - ( 2T )ln (2 )- ( 21 ) t= 1
ln
2
t - ( 21 ) t= 1
ln
2
t /
2
t (1.214)
3 GARCH(p, q) 모형
제 1 장 금융통계학 91
y t = X t + t t , t N ( 0 , 1) (1.215)
2
t = t t , t t- 1 N (0 , t ) (1.216)
2 2 2 2 2
t = 0 + 1 t- 1 + + p t- p + 1 t- 1 + + q t- q
2 2
= 0 + A (L ) t + B (L ) t (1.217)
단, 0 >0 , 1 , , p , 1 , , q 0, A (L ) = L+
1 + p L p, B ( L )
2 2 2
t = 0 + 1 t- 1 + 1 t- 1 (1.218)
2 2 2
t = 0 + 1 t- 1 + 1 t- 1
가 되므로 이를
2
(1- 1 L- 1 L) t = 0
0
) < 1인 경우
2
= , ( 1 + 1 (1.219)
(1- 1 - 1 )
2 0 j- 1 2
t = + 1 1 t- j (1.220)
(1- 1 ) j= 1
92 제 1 부 금융통계학
단순한 GARCH(1,1) 모형으로도 대부분 잘 모형화할 수 있는 것으로 알려져
있다.
GARCH(p,q) 모형에 관해서는 다음의 두 정리를 기억할 필요가 있다.
A ( 1) + B ( 1) < 1 (1.221)
4 2 2 2 - 1
E( t )= 3 0 (1+ 1 + 1 )[ ( 1 - 1 - 1 ) (1- 1 - 2 1 1 - 3 1 )]
4 2 2 2 - 2
= [E ( t ) - 3E ( t ) ]E ( t )
2 2 2 - 1
= 6 1 (1- 1 - 2 1 1 - 3 1 ) >0
4 GARCH(1, 1) 모형의 특성
제 1 장 금융통계학 93
2 2 2
t = 0 + 1 t- 1 + 1 t- 1
2 2 2
= 0 + ( 1 + 1 ) t- 1 + 1 ( t- 1 - t- 1 ) (1.222)
2 2 2
= 0 + ( 1 + 1 ) t- 1 + 1 t- 1 ( t- 1 - 1)
두 번째 등호에서 ( 2
t- 1 -
2
t- 1 )항의 평균은 영 이므로 변동성에 대한 충
격으로 생각할 수 있다. 계수 은 현재의 변동성 충격이 다음 기의 변동성
1
분포 확률변수의 제곱( 2
( 1) 변량)에서 그의 평균(즉, 1)을 뺀 뒤 과거의 변
동성값으로 곱한 것으로 다시 표현한 것이다.
GARCH(1,1) 모형은 다음과 같이 제곱한 오차항 과정으로도 고쳐 쓸 수
있다.
2 2 2 2 2 2
t = 0 + t- 1 + ( t - t )- 1 ( t- 1 - t- 1 ) (1.223)
94 제 1 부 금융통계학