You are on page 1of 26

ĐA CỘNG TUYẾN

1. BẢN CHẤT CỦA ĐA CỘNG TUYẾN

2. NGUỒN GỐC ĐA CỘNG TUYẾN

3. ƯỚC LƯỢNG KHI CÓ ĐA CỘNG TUYẾN HOÀN HẢO

4. ƯỚC LƯỢNG KHI CÓ ĐA CỘNG TUYẾN KHÔNG HOÀN HẢO


5. HẬU QUẢ CỦA ĐA CỘNG TUYẾN
6. PHÁT HIỆN ĐA CỘNG TUYẾN
7. CÁC GIẢI PHÁP KHẮC PHỤC
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Trong chương trước, chúng ta phát biểu hệ số hồi qui đối với
một biến cụ thể là số đo tác động riêng của biến này, nghĩa là
tác động của nó khi tất cả các biến khác trong mô hình được
giữ ở những mức cố định và chỉ có giá trị của biến này thay
đổi. Tuy nhiên, khi hai biến giải thích cùng tương quan chặt;
chúng ta không thể chỉ đơn giản giữ một biến không đổi và
thay đổi biến còn lại vì khi biến sau thay đổi thì biến đầu thay
đổi. Cũng vậy, thay đổi mô hình bằng cách loại bỏ hoặc thêm
vào một biến có thể làm thay đổi kết quả một cách nghiêm
trọng. Đây chính là vấn đề đa cộng tuyến, vấn đề xuất hiện
khi các biến giải thích có các quan hệ gần như tuyến tính.
BẢN CHẤT CỦA ĐA CỘNG TUYẾN

Trường hợp lý tưởng là các biến độc lập không có tương


quan với nhau; mỗi biến Xj chứa một thông tin riêng về Y.
Trong thực tế, khi điều này xảy ra ta không gặp hiện
tượng đa cộng tuyến. Ở trường hợp ngược lại, ta gặp
hiện tượng đa cộng tuyến
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
+ Đa cộng tuyến hoàn hảo là sự tồn tại mối quan hệ tuyến
tính “hoàn hảo” hay “chính xác” hoặc “chặt chẽ” giữa các
biến giải thích. Đa cộng tuyến hoàn hảo xảy ra khi một
biến giải thích được biểu diễn dưới dạng tổ hợp tuyến
tính của các biến giải thích còn lại. Hoặc có thể phát biểu
đa cộng tuyến hoàn hảo giữa các biến giải thích X 2, X3, …,
Xk xảy ra nếu điều kiện sau thoả mãn
λ2X2 + λ3X3 +…+ λkXk =0

Trong đó λ2, λ3 , …, λk là các hằng số không đồng thời bằng 0


BẢN CHẤT CỦA ĐA CỘNG TUYẾN
+ Đa cộng tuyến không hoàn hảo là sự tồn tại mối quan hệ
tuyến tính khá “chặt chẽ” giữa các biến giải thích. Đa cộng
tuyến không hoàn hảo giữa các biến giải thích X2, X3, …, Xk
xảy ra nếu điều kiện sau thoả mãn
λ2X2 + λ3X3 +…+ λkXk + Vi = 0
Trong đó
+ Vi là sai số ngẫu nhiên
+ λ2, λ3 , …, λk là các hằng số không đồng thời bằng 0
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Ví dụ. Xét mô hình có các biến độc lập như sau

X2 10 15 18 24 30
X3 50 75 90 120 150
X4 52 75 97 129 152
e 2 0 7 9 2

rX 2 X3  1 rX 2X 4  0,996
NGUỒN GỐC ĐA CỘNG TUYẾN
1. Bản chất trong quan hệ giữa các biến giải thích
Ví dụ. Xét hồi quy mức tiêu thụ điện (Y) theo thu nhập (X 2) và
kích thước nhà ở (X3) thì bản chất X2 và X3 có quan hệ chặt
2. Do phương pháp thu thập dữ liệu: Các giá trị của biến
độc lập phụ thuộc lẫn nhau trong mẫu, nhưng không phụ
thuộc lẫn nhau trong tổng thể
Ví dụ. Người có thu nhập cao hơn khuynh hướng sẽ có
nhiều của cải hơn. Điều này có thể đúng với mẫu nhưng
không đúng với tổng thể. Tổng thể sẽ có các quan sát về các
cá nhân có thu nhập cao nhưng không có nhiều của cải và
ngược lại
NGUỒN GỐC ĐA CỘNG TUYẾN
3. Các biến độc lập vĩ mô được quan sát theo dữ liệu thời
gian

Ví dụ. Nhập khẩu quốc gia phụ thuộc vào GDP và CPI (các
chỉ số này được thu thập từ dữ liệu thời gian)

Ví dụ. Dân số và tổng sản phẩm quốc dân là hai chuỗi dữ


liệu tương quan chặt chẽ lẫn nhau
ƯỚC LƯỢNG KHI CÓ ĐA CỘNG TUYẾN HOÀN HẢO
Các hệ số hồi quy là không xác định, các sai số tiêu chuẩn là
vô hạn, chẳng hạn với mô hình ba biến, ta có
n n n n

y x x y x x
i 2i
2
3i i 3i 2i x 3i
0
β̂ 2  i=1 i=1 i=1 i=1
2

n
 n
 n 0

i=1
x  x    x 2i x 3i 
i=1
2
2i
 i=1 
2
3i

Nếu x3i = λx2i thì không xác định

 
2
ˆ σ r23 1
var β 2  n   
 x 2i 1  r23 
2 2

i=1
ƯỚC LƯỢNG KHI CÓ ĐA CỘNG TUYẾN KHÔNG
Giả sử X2 và X3 có cộngHOÀN HẢOhoàn hảo theo nghĩa
tuyến không
x3i = λx2i + Vi, trong đó λ ≠ 0, Vi là nhiễu ngẫu nhiên sao
cho = 0
n
 2 n n
2 
n n
n
2 
  yi x 2i    x 2i   Vi      yi x 2i   yi Vi    x 2i 
2

β̂ 2   i=1  i=1 i=1   i=1 i=1  i=1 


2
2  2 2  2 
n n n n

i=1
x 2i    x 2i   Vi      x 2i 
 i=1
2

i=1   i=1 
HẬU QUẢ ĐA CỘNG TUYẾN
1. Phương sai và hiệp phương sai của các ước lượng hồi
quy lớn
Xét mô hình hồi quy ba biến ta có
2
ˆ σ r23 1
var(β 2 )= n   
 x 2i 1  r23
2 2
 
i=1 2
σ
var(βˆ 3 )  n
 r23 1
 
 x 1  r 
i=1
2
3i
2
23

r23 là hệ số tương quan mẫu giữa X2 và X3


HẬU QUẢ ĐA CỘNG TUYẾN
2. Khoảng tin cậy rộng hơn
Ta biết trong chương trước khoảng tin cậy 95% cho β2, β3
khi σ2 đã biết

 
ˆ 2  1,96.se ˆ 2 vaø ˆ 3  1,96.se ˆ 3  
Trong đó

2 2
1 σ 1 σ
se(βˆ 2 )  n
se(βˆ 3 )  n
1 r 2
1 r 2
23
x
i=1
2
2i
23
x 2
3i
i=1
HẬU QUẢ ĐA CỘNG TUYẾN
3. Tỷ số t mất ý nghĩa
Giá trị thống kê t nhỏ (không có ý nghĩa mặc dù R 2 lớn)
dẫn đến luôn bác bỏ giả thuyết kiểm định ý nghĩa của
biến độc lập trong mô hình (làm cho biến độc lập không
có ý nghĩa)
ˆ i
t
se(βˆ i )  var(βˆ i )
HẬU QUẢ ĐA CỘNG TUYẾN
4. R2 lớn nhưng tỷ số t ít có nghĩa
5. Các ước lượng bình phương bé nhất và các sai số tiêu
chuẩn của chúng trở nên rất nhạy cảm đối với những
thay đổi nhỏ trong số liệu
6. Dấu hệ số hồi quy có thể sai
7. Thêm vào hay bớt đi các biến cộng tuyến với các biến
khác, mô hình sẽ thay đổi về độ lớn của các ước lượng
hoặc dấu của chúng
PHÁT HIỆN RA SỰ TỒN TẠI ĐA CỘNG TUYẾN
Một vài dấu hiệu nhận biết hiện tượng đa cộng tuyến của
mô hình
1. R2 lớn nhưng tỷ số t nhỏ
Nếu R2 ≥ 0,7 và ∃ |t| < 1
2. Dấu hệ số hồi quy thay đổi so với thực tế
3. Dùng hồi quy phụ
Nếu mô hình Xi = f(X1, X2, …), i ≠ 1, 2, … phù hợp
PHÁT HIỆN RA SỰ TỒN TẠI ĐA CỘNG TUYẾN
4. Hệ số nhân tử phóng đại phương sai VIF
1
VIF   10; rXiX j  max  R
1  rXiX j
2
PHÁT HIỆN RA SỰ TỒN TẠI ĐA CỘNG TUYẾN
Ví dụ. Khảo sát chi tiêu cho tiêu dùng, thu nhập và sự giàu
có ta có bảng số liệu sau
Y 70 65 90 95 110 115 120 140 155 150
X2 80 100 120 140 160 180 200 220 240 260

X3 810 1009 1273 1425 1633 1876 2052 2201 2435 2686

Trong đó
Y : Chi tiêu cho tiêu dùng (USD)
X2: thu nhập (USD)
X3 : sự giàu có (USD)
PHÁT HIỆN RA SỰ TỒN TẠI ĐA CỘNG TUYẾN
Dependent Variable: Y
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 24.77473 6.752500 3.668972 0.0080
X2 0.941537 0.822898 1.144172 0.2902
X3 -0.042435 0.080664 -0.526062 0.6151
R-squared 0.963504 Mean dependent var 111.0000
Adjusted R-squared 0.953077 S.D. dependent var 31.42893
S.E. of regression 6.808041 Akaike info criterion 6.917411
Sum squared resid 324.4459 Schwarz criterion 7.008186
Log likelihood -31.58705 Hannan-Quinn criter. 6.817830
F-statistic 92.40196 Durbin-Watson stat 2.890614
Prob(F-statistic) 0.000009
PHÁT HIỆN RA SỰ TỒN TẠI ĐA CỘNG TUYẾN
Mô hình hồi quy phụ X2 theo X3
1
VIF   482,169  10
Dependent Variable: X2 1  0,997926
Method: Least Squares
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C -0.386271 2.897956 -0.133291 0.8973
X3 0.097923 0.001578 62.04047 0.0000
R-squared 0.997926 Mean dependent var 170.0000
Adjusted R-squared 0.997667 S.D. dependent var 60.55301
S.E. of regression 2.925035 Akaike info criterion 5.161346
Sum squared resid 68.44662 Schwarz criterion 5.221863
Log likelihood -23.80673 Hannan-Quinn criter. 5.094959
F-statistic 3849.020 Durbin-Watson stat 2.068509
Prob(F-statistic) 0.000000
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
1. Sử dụng thông tin tiên nghiệm
Các thông tin tiên nghiệm thường xuất hiện từ phân
tích lý thuyết kinh tế hoặc từ các nghiên cứu trước đây.
Chẳng hạn nghiên cứu về sản lượng (Y) phụ thuộc theo
vốn (K) và lao động (L) ta có hàm Cobb-Douglas
+
Giả sử có cộng tuyến giữa và.
Nếu ta có thông tin tiên nghiệm là β2 + β3 = 1 (tức là sinh
lợi không đổi theo quy mô)
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
⇒ β3 1 β2 ⇒ lnYi β1 + β2lnKi + (1 β2 )lnLi + Ui
⇔ ln(Yi/Li) β1 + β2ln(Ki/Li)
Như vậy mô hình cuối cùng ta thu được chỉ có một biến
giải thích là Ki/Li nên không còn hiện tượng đa cộng tuyến
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
2. Thu thập thêm số liệu mới
Vì đa cộng tuyến là đặc trưng của mẫu nên ta có thể có
mẫu khác liên quan đến cùng các biến trong mẫu ban đầu
mà đa cộng tuyến có thể không nghiêm trọng nữa. Điều
này có thể làm được khi chi phí cho việc lấy mẫu có thể
chấp nhận được trong thực tế
Đôi khi chỉ cần thu thập thêm số liệu, tăng cỡ mẫu có thể
làm giảm tính nghiêm trọng của đa cộng tuyến
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
3. Bỏ bớt biến gây ra đa cộng tuyến nghiêm trọng
Khi có hiện tượng đa cộng tuyến nghiêm trọng thì cách
“đơn giản nhất” là bỏ biến cộng tuyến ra khỏi phương
trình. Khi phải sử dụng biện pháp này thì cách thức tiến
hành như sau:
+ Sử dụng R2 và
+ Loại bỏ biến độc lập (biến có p-value lớn hơn mức ý
nghĩa và lớn nhất) ra khỏi mô hình (Lưu ý mỗi lần chỉ
thực hiện bỏ một biến)
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
4. Dùng sai phân cấp 1
Theo thời gian một số biến kinh tế thường có tính xu thế
và chúng dễ tương quan với nhau. Một trong những cách
có thể làm giảm đi sự tương quan giữa các biến này, tức
là làm giảm đi sự nghiêm trọng của đa cộng tuyến, là sử
dụng sai phân cấp 1
Giả sử ta có mô hình
Yt = β1 + β2X2t + β3X3t + … + βkXkt + Ut
Trong đó t là thời gian và giữa các biến và giữa các biến
độc lập X2t, …, Xkt tồn tại đa cộng tuyến nghiêm trọng
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
Thay t bằng t-1 ta có hàm hồi quy
Yt-1 = β1 + β2X2,t-1 + β3X3,t-1 + … + βkXk,t-1 + Ut-1
Suy ra

Yt-Yt-1=β2(X2t-X2,t-1)+β3(X3t-X3,t-1)+ … +βk(Xkt-Xk,t-1)+Ut-Ut-1
Hay ta có mô hình sai phân cấp 1:
yt = β2x2t+ …+ βkxkt + Vt (*)

Trong đó yt = Yt - Yt-1, x2t = X2t - X2,t-1, …, xkt = Xkt - Xk,t-1,


Vt = Ut - Ut-1 là số hạng nhiễu
KHẮC PHỤC HIỆN TƯỢNG ĐA CỘNG TUYẾN
Mô hình hồi quy dạng sai phân (*) thường làm giảm tính
nghiêm trọng đa cộng tuyến cho dù có đa cộng tuyến giữa
các biến độc lập Xti nhưng không có lý do tiên nghiệm nào
chắc chắn rằng sai phân của chúng cũng tương quan cao.
Tuy nhiên biến đổi sai phân bậc nhất sinh ra một số vấn đề
chẳng hạn như số hạng sai số Vt trong mô hình (*) có thể
không thoả mãn giả thiết của mô hình hồi quy cổ điển là
các nhiễu không tương quan. Điều này có thể gây ra sai lầm
nghiêm trọng khác

You might also like