You are on page 1of 24

CHƢƠNG 5

HIỆN TƯỢNG ĐA CỘNG TUYẾN


(MULTICOLLINEARITY)

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 1


ĐA CỘNG TUYẾN

1. Hiểu bản chất và hậu quả của


đa cộng tuyến
MỤC
TIÊU
2. Biết cách phát hiện đa cộng
tuyến và biện pháp khắc phục

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 2


NỘI DUNG

1 Bản chất, nguyên nhân của đa cộng tuyến

2 Ước lượng các tham số

3 Hậu quả

4 Phát hiện đa cộng tuyến

5 Khắc phục đa cộng tuyến

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 3


5.1 Bản chất của đa cộng tuyến
Đa cộng tuyến

Trong mô hình hồi quy bội


Yˆi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki
Có sự phụ thuộc tuyến tính cao giữa các
biến giải thích (biến độc lập)

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 4


5.1 Bản chất của đa cộng tuyến

a. Đa cộng tuyến hoàn hảo


Tồn tại 2, 3,… k không đồng thời bằng 0
sao cho
2X2 + 3X3 + …+ kXk = 0
b. Đa cộng tuyến không hoàn hảo
2X2 + 3X3 + …+ kXk + vi= 0
với vi là sai số ngẫu nhiên.

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 5


5.1 Bản chất của đa cộng tuyến
VD
X2 10 15 18 24 30

X3 50 75 90 120 150

X4 52 75 97 129 152
V 2 0 7 9 2
X3i = 5X2i, có cộng tuyến hoàn hảo giữa X2 và
X3 ; r23 = 1
X2 và X4 có cộng tuyến không hoàn hảo

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 6


5.1 Bản chất của đa cộng tuyến
Không có đa cộng tuyến Đa cộng tuyến thấp

Y Y

X2 X3 X3
X2

Hình 5.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến


21/02/20 ECO1104-Chương 5: Đa cộng tuyến 7
5.1 Bản chất của đa cộng tuyến
Đa cộng tuyến cao Đa cộng tuyến hoàn hảo

Y Y
X3
X2 X2
X3

Hình 5.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến


21/02/20 ECO1104-Chương 5: Đa cộng tuyến 8
5.1 Nguyên nhân của đa cộng tuyến

- Chọn các biến độc lập có mối quan có


quan hệ nhân quả hay có tương quan cao
vì đồng phụ thuộc vào một điều kiện khác.
- Số quan sát nhỏ hơn số biến độc lập.
- Cách thu thập mẫu: mẫu không đặc trưng
cho tổng thể
- Chọn biến Xi có độ biến thiên nhỏ.

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 9


5.2 Ước lượng khi có đa cộng tuyến

1. Trường hợp có đa cộng tuyến hoàn hảo


Xét mô hình hồi qui 3 biến dưới dạng sau:
Yi = 2 X2i + 3 X3i + ei
giả sử X3i = X2i, mô hình được biến đổi thành:
Yi = (2+ 3)X2i + ei = 0 X2i + ei
Phương pháp OLS
ˆo  ( ˆ2  ˆ3 )  x y 2i i

x 2
2i

 Không thể tìm được lời giải duy nhất cho ˆ2 , ˆ3
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 10
5.2 Ước lượng khi có đa cộng tuyến

ˆ2   i 2i  3i   yi x3i  x2i x3i


y x x 2

x x 2
2i
2
3i  ( x2i x3i ) 2

ˆ
2 
  yi x3 i  x  2

3i yi x3 i  x3 i x3i

0
  x3i  x3i    x3i  x3i
2 2 2 2 2 2
0
 Các hệ số ước lượng không xác định
 Phương sai và sai số chuẩn của 2 và 3
là vô hạn
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 11
5.2 Ước lượng khi có đa cộng tuyến

2. Trường hợp có đa cộng tuyến không hoàn


hảo
• Đa cộng tuyến hoàn hảo thường không xảy ra
trong thực tế.
• Xét mô hình hồi qui 3 biến dưới dạng sau:
yi = 2 x2i + 3 x3i + ei
Giả sử x3i =  x2i + vi
Với   0 và vi là sai số ngẫu nhiên

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 12


5.2 Ước lượng khi có đa cộng tuyến

 y x   x   v     y x   y v   x 
2 2 2 2 2

ˆ  i 2i 2i i i 2i i i 2i
2
 x   x   v    x 
2
2i
2 2
2i
2
i
2 2 2
2i

 Có thể ước lượng được các hệ số hồi


quy nhưng sai số chuẩn rất lớn.

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 13


5.3 Hậu quả của đa cộng tuyến

Nếu có cộng tuyến gần hoàn hảo


1. Phương sai và hiệp phương sai của các
ước lượng OLS lớn.
2. Khoảng tin cậy rộng hơn.
3. Tỉ số t "không có ý nghĩa"
4. R2 cao nhưng tỉ số t ít có ý nghĩa

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 14


5.3 Hậu quả của đa cộng tuyến

5. Các ước lượng OLS và sai số chuẩn của


chúng trở nên rất nhạy với những thay
đổi nhỏ trong dữ liệu.
5. Dấu của các ước lượng của các hệ số hồi
qui có thể sai
7. Thêm vào hay bớt đi các biến cộng tuyến
với các biến khác, mô hình sẽ thay đổi về
dấu hoặc thay đổi về độ lớn của các ước
lượng.

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 15


5.3 Hậu quả của đa cộng tuyến

Đa cộng tuyến là một hiện tượng theo


mẫu, nghĩa là cho dù các biến độc lập
Xi không tương quan tuyến tính trong
tổng thể nhưng chúng có thể tương
quan tuyến tính trong một mẫu cụ thể
nào đó. Do đó cỡ mẫu lớn thì hiện
tượng đa cộng tuyến ít nghiêm trọng
hơn cỡ mẫu nhỏ

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 16


5.4 Cách phát hiện đa cộng tuyến

1. Hệ số R2 lớn nhưng tỷ số t nhỏ


2. Tương quan cặp giữa các biến giải
thích cao
3. Sử dụng mô hình hồi qui phụ
4. Sử dụng yếu tố phóng đại phương sai
(VIF)

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 17


5.4 Cách phát hiện đa cộng tuyến
1. R2 lớn nhƣng tỷ số t nhỏ
2. Tƣơng quan cặp giữa các biến giải thích
cao

rXZ 
 ( X i  X )(Z i  Z )
 ( X i  X ) (Zi  Z )
2 2

Trong đó X, Z là 2 biến giải thích trong mô


hình

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 18


5.4 Cách phát hiện đa cộng tuyến
3. Sử dụng mô hình hồi quy phụ
Hồi qui một biến độc lập X theo các biến độc lập còn
lại ˆ ˆ ˆ
Xˆ 2i  1  3 X 3i  ...   k X mi

Tính R2 và F cho mỗi mô hình


R 2 ( n  m)
F 
(1  R )(m  1)
2

Lập giả thiết H0: R2 = 0 ~ H0: không có đa cộng tuyến


Nếu F > F(m-1,n-k): bác bỏ H0 hay có đa cộng tuyến
Nếu F < F(m-1,n-k): chấp nhận H0 hay không có đa
cộng tuyến
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 19
5.4 Cách phát hiện đa cộng tuyến
4. Sử dụng nhân tử phóng đại phƣơng sai (VIF)
Đối với hàm hồi quy 2 biến giải thích
1
VIF 
(1  r232 )
Đối với trường hợp tổng quát, có (k-1) biến giải thích
1
VIF 
(1  R 2j )
R2j: là giá trị R2 trong hàm hồi quy của Xj theo (k-2)
biến giải thích còn lại.
Thông thường khi VIF > 10, thì biến này được coi là
có cộng tuyến cao
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 20
5.5 Cách khắc phục
1. Dùng thông tin tiên nghiệm
Ví dụ mô hình sản xuất Cobb-Douglas
Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui
Có thể xảy ra đa cộng tuyến do K và L cùng
tăng theo quy mô sản xuất. Nếu biết hiệu suất
không đổi theo quy mô tức là 2+3=1 thì
Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui
Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui
Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui
=> mất đa cộng tuyến (vì đây là mô hình hồi
quy đơn)
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 21
5.5 Cách khắc phục
2. Loại trừ một biến giải thích ra khỏi mô
hình
B1: Xem cặp biến giải thích nào có quan hệ
chặt chẽ. Giả sử X2, X3…Xk là các biến độc
lập, Y là biến phụ thuộc và X2, X3 có tương
quan chặt chẽ với nhau.
B2: Tính R2 đối với các hàm hồi quy: có mặt
cả 2 biến; không có mặt một trong 2 biến
B3: Loại biến mà giá trị R2 tính được khi
không có mặt biến đó là lớn hơn.
21/02/20 ECO1104-Chương 5: Đa cộng tuyến 22
5.5 Cách khắc phục
3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới

ˆ  2
var(  2 ) 
x 2
2i (1  r ) 2
23

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 23


5.5 Cách khắc phục
4. Dùng sai phân cấp 1
Có hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut
suy ra
yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1
Trừ hai vế cho nhau, được:
yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut –
ut – 1)
Hay:
yt = 1  x1,t + 2  x2,t + et,

21/02/20 ECO1104-Chương 5: Đa cộng tuyến 24

You might also like