You are on page 1of 24

1

KINH TẾ LƯỢNG
(ECONOMETRICS)
Chương 4: Đa cộng tuyến
(Multicollinerity)

4/29/2022 HUỲNH HIỀN HẢI


Nội dung
2

 Bản chất của đa cộng tuyến


 Ước lượng OLS khi có đa cộng tuyến
 Hậu quả của đa cộng tuyến
 Phát hiện sự tồn tại của đa cộng tuyến
 Biện pháp khắc phục hiện tượng đa cộng tuyến

4/29/2022
Bản chất của đa cộng tuyến
3

Trong mô hình hồi quy bội, giả thuyết các biến giải
thích của mô hình không có tương quan với nhau. Nếu
giả thuyết này bị vi phạm thì sẽ có hiện tượng đa cộng
tuyến.
→ Đa cộng tuyến giữa các biến độc lập: xuất hiện mối
quan hệ tương quan tuyến tính hoặc gần tuyến tính giữa
các biến độc lập trong mô hình.

4/29/2022
Bản chất của đa cộng tuyến
4

4/29/2022
Bản chất của đa cộng tuyến
5

Xét hàm hồi qui gồm k biến:


Y = 0 + 1 X 1 + ... +  k −1 X k −1 + U
❑ Đa cộng tuyến hoàn hảo: Tồn tại các hằng số 1,
2,…, k-1 không đồng thời bằng 0 sao cho:
1X1 + 2X2 + …+ k-1Xk-1 = 0
❑Đa cộng tuyến không hoàn hảo: Tồn tại 1, 2,… k-1
không đồng thời bằng 0 sao cho
2X2 + 3X3 + …+ kXk + V= 0 (V là sai số ngẫu nhiên)

4/29/2022
Bản chất của đa cộng tuyến
6

X2 10 15 18 24 30

X3 50 75 90 120 150

X4 52 75 97 129 152
V 2 0 7 9 2

❑ có cộng tuyến hoàn hảo giữa X2 và X3 ; r23 = 1


❑ có cộng tuyến không hoàn hảo giữa X2 và X4 ; r24 =0.99

4/29/2022
Ví dụ
7

1. Khảo sát về lượng tiêu dùng thịt gà tính theo đầu
người (Y), với thu nhập khả dụng theo đầu người
(X1), giá bán lẻ thịt gà (X2), giá bán lẻ thịt heo
(X3), giá bán lẻ thịt bò (X4).
2. Khảo sát chi tiêu cho tiêu dùng theo thu nhập
(X1) và sự giàu có (X2).

4/29/2022
Nguyên nhân của đa cộng tuyến
8

 PP thu thập số liệu: mẫu không đặc trưng cho tổng


thể
 Do bản chất của mối quan hệ giữa các biến ngầm
chứa hiện tượng đa cộng tuyến
 Đặc trưng của mô hình: khi bổ sung những biến có
lũy thừa bậc cao vào mô hình, đặc biệt khi phạm vi
dữ liệu của biến độc lập là nhỏ
 Một mô hình xác định quá mức: Số biến giải thích
nhiều hơn cỡ mẫu→ không thể xác định hệ số hồi
quy
4/29/2022
Ước lượng khi có đa cộng tuyến
9

❑ Trường hợp có đa cộng tuyến hoàn hảo


Xét mô hình hồi qui 3 biến PRF:
Y =  0 + 1 X 1i +  2 X 2i + U i
Mô hình hồi qui mẫu SRF:
Y = ˆ0 + ˆ1 X 1i + ˆ2 X 2i + Uˆ i
Ta biết hàm hồi quy mẫu đi qua giá trị trung bình nên:
Y = ˆ + ˆ X + ˆ X
0 1 1 2 2

4/29/2022
Ước lượng khi có đa cộng tuyến
10

 Hàm hồi quy mẫu có thể viết lại dưới dạng:
yi = ˆ1 x1i + ˆ2 x2i + Uˆ i
Trong đó: yi = Y − Yi , x1i = X1i − X1 , x2i = X 2i − X 2
Áp dụng PP OLS, tìm các hệ số sao cho: U i → min ˆ 2

Các hệ số là nghiệm của của hệ pt:


 i 1i 1 1i 2 1i 2i
y x = ˆ x 2 + ˆ x x

 i 2i 1 1i 2i 2 2i
y x = ˆ x x + ˆ x 2

Với giả định là đa cộng tuyến hoàn hảo: x2i =  x1i
→  yi x1i = ˆ1 x1i + ˆ2 x1i
2 2

→ Pt có hai ẩn số sẽ không có nghiệm duy nhất
4/29/2022
Ước lượng khi có đa cộng tuyến
11

❑ Trường hợp đa cộng tuyến không hoàn hảo


x2i =  x1i + vi
Trong trường hợp này, hệ pt có nghiệm duy nhất.
→ Có thể xác định được duy nhất các hệ số của pt hồi
quy

4/29/2022
Hậu quả của đa cộng tuyến
12

❑ Ảnh hưởng đến tính chất BLUE (ước lượng tuyến tính, không
chệch tốt nhất –Best Linear Unbiased Estimator): Tính chất
BLUE của các hệ số ước lượng vẫn được đảm bảo.
❑ Ảnh hưởng đến độ chính xác của các ước lượng: VD với mô
hình hồi quy ba biến:
2 1 Mức độ đa cộng tuyến tăng dần giữa
var( ˆ1 ) = .
 x1i 1 − r122
2
các biến độc lập, tức là r12 tiến đến
2 1 1→Phương sai và hiệp phương sai
var( ˆ2 ) = .
x 2
2i 1 − r122 giữa các biến tiến tới vô cực→
khoảng tin cậy của các ước lượng
−r12 2
cov( ˆ1 , ˆ2 ) = rộng hơn→ các giá trị thay đổi nhiều
(1 − r122 ) x x
2
1i
2
2i từ mẫu này sang mẫu khác→mức độ
chính xác của các ước lượng giảm.
4/29/2022
Hậu quả của đa cộng tuyến
13

 Ảnh hưởng đến việc kiểm định các giả thuyết về các hệ số:
ˆ j − ˆ *j
Khi kiểm định, sử dụng trị thống kê t =
se( ˆ j )
Trong trường hợp đa cộng tuyến ở mức độ cao, phương sai
của các hệ số ước lượng lớn, sai số chuẩn lớn→ trị thống kê
nhỏ→xu hướng chấp nhận giả thuyết không̣, đặc biệt khi kiểm
định các hệ số hồi quy khác 0 có ý nghĩa thống kê không.

4/29/2022
Hậu quả của đa cộng tuyến
14

 Hệ số xác định cao nhưng các hệ số ít có ý nghĩa


 Các ước lượng bình phương bé nhất và các sai số chuẩn của
chúng trở nên rất nhạy đối với sự thay đổi nhỏ trong dữ
liệu.
 Dấu của các ước lượng hồi quy có thể sai
 Thêm vào hay bớt đi các biến cộng tuyến với các biến khác,
mô hình sẽ thay đổi độ lớn các ước lượng hoặc dấu của
chúng.

4/29/2022
Phát hiện sự tồn tại của đa cộng tuyến
15

 Hệ số xác định cao (>0.8) mà trị số t thấp là dấu


hiệu của đa cộng tuyến
 Tương quan cặp giữa các biến giải thích cao: Nếu
hệ số tương quan cặp giữa các biến độc lập cao
(>0.8) thì có khả năng tồn tại hiện tượng đa cộng
tuyến, đặc biệt là ở mô hình hồi quy ba biến.

4/29/2022
Phát hiện sự tồn tại của đa cộng tuyến
16

 Phương pháp hồi quy phụ: tiến hành hồi quy một biến
độc lập theo các biến độc lập còn lại.
Y =  0 + 1 X 1 +  2 X 2 + ... +  k −1 X k −1 + U
➢ Ước lượng mô hình hồi quy phụ của biến độc lập j vơi k-2
biến độc lập còn lại.
X j = 0 + 1 X1 +  2 X 2 + ... +  j −1 X j −1 +  j +1 X j +1 + ...k −1 X k −1 + V
➢ Lập giả thuyết: H 0 : R 2j = 0 (không có đa cộng tuyến)
➢ Với R 2j là hệ số xác định của mô hình hồi quy phụ
R 2j / (k − 2)
➢ Tính: Fj =
(1 − R 2j ) / (n − k + 1)
➢ Nếu: Fj  F (n − 2, n − k + 1) bác bỏ giả thuyết Ho
4/29/2022
Phát hiện sự tồn tại của đa cộng tuyến
17

 Nhân tử phóng đại phương sai VIF


1
VIF =
(1 − R 2j )
Thông thường khi VIF > 10, khi đó R2j >0.9 →có cộng
tuyến cao

4/29/2022
Phát hiện sự tồn tại của đa cộng tuyến
18

 Xem xét tương quan riêng:


Farrar và Glauber đã đề nghị sử dụng hệ số tương
quan riêng. Trong hồi quy Y với các biến X2, X3,
X4, nếu nhận thấy hệ số xác định cao trong khi đó
2 2 2
r12,34 , r13,24 , r14,23 tương đối thấp thì có thể gợi ý rằng
các biến X2, X3, X4 có tương quan cao và có ít nhất
1 biến là thừa.

4/29/2022
Biện pháp khắc phục
19

 Sử dụng thông tin tiên nhiệm hoặc thông tin từ các
nguồn khác để ước lượng các hệ số riêng
  U
 Ví dụ: Khảo sát hàm sản xuất Cough-Douglas Q t = AL t X t e
i

Hàm trên biến đổi thành dạng hàm log như sau:
ln Qt = lnA+  lnLt +  ln Kt + U t
Đặt Q* = ln Qt , A* = lnA, L* = lnLt , Kt* = ln Kt
t t

Giả sử K và L có tương quan rất cao, điều này sẽ dẫn tới
phương sai rất lớn của các ước lượng.
Giả sử kết quả nghiên cứu thực nghiệm nào đó đã rút ra rằng
nền sản xuất của quốc gia ta đang nghiên cứu có sản lượng
không đổi theo quy mô, tức là  +  = 1
4/29/2022
Biện pháp khắc phục
20

Cách xử lý là ta thay  = 1 −  , thu được:


Q* = A* +  L* + (1 −  ) K * + U t
t t t

Hay: Q* − K * = A* +  (L* − K * ) + U t
t t t t

Đặt: Yt * = Q* − K * , Z t* = L* − K *
t t t t

Ta được mô hình:
Yt * = A* +  Z t* + U t
Có nghĩa là kết quả trên đã giúp ta giảm bớt số biến độc lập
trong mô hình. Sau khi ước lượng được ̂ , chúng ta tính ˆ = 1 − ˆ

4/29/2022
Biện pháp khắc phục
21

 Thu thập thêm số liệu hoặc lấy thêm mẫu mới


 Bỏ biến: Khi có hiện tượng đa cộng tuyến nghiêm
trọng thì cách đơn giản nhất là bỏ biến cộng tuyến
ra khỏi mô hình.

4/29/2022
Biện pháp khắc phục
22

 Sử dụng sai phân cấp một


Giả sử ta xét hàm hồi quy sau:
Yt = 0 + 1 X 1t +  2 X 2t + U t
Hàm đúng với thời điểm t thì cũng đúng với thời điểm (t-1),
tức là:
Yt −1 = 0 + 1 X1,t −1 + 2 X 2,t −1 + Ut −1
Từ đó, ta rút ra pt sai phân cấp 1 dùng để ước lượng các tham
số hồi quy.
Yt − Yt −1 = 1 ( X1t − X1,t −1 ) + 2 ( X 2t − X 2,t −1 ) + Ut − Ut −1

4/29/2022
Biện pháp khắc phục
23

 Một số lưu ý khi sử dụng sai phân cấp 1:


✓ Trong một số trường hợp Ut không có tự tương quan,
nhưng U t − U t −1có thể tự tương quan →vi phạm một trong
những giả thiết khác của mô hình hồi quy tuyến tính cổ
điển.
✓ Bậc tự do giảm đi 1 do mất 1 quan sát trong quá trình biến
đổi số liệu →có thể ảnh hưởng đến ước lượng khi cỡ mẫu
nhỏ
✓ Sử dụng sai phân cấp 1 có thể không phù hợp với số liệu
chéo
✓ Sử dụng sai phân cấp 1 tức là sử dụng hồi quy qua gốc tọa
độ→ cân nhắc 4/29/2022
Biện pháp khắc phục
24

Giảm đa cộng tuyến trong hồi quy đa thức


Đối với hàm hồi quy đa thức bậc cao:
Y = 0 + 1 X + 2 X 2 + 3 X 3 + U = 0 + 1Z1 + 2 Z2 + 3Z3 + U
Với hàm đa thức trên, có khả năng xảy ra hiện tượng đa
cộng tuyến giữa các biến độc lập tương ứng với bậc lũy
thừa→ có thể sử dụng hàm hồi quy độ lệch theo giá trị
trung bình:
Y = 0 + 1 (Z1 − Z1 ) + 2 (Z2 − Z2 ) + 3 (Z3 − Z3 ) + U

4/29/2022

You might also like