You are on page 1of 24

TBP

Chương 4

ĐA CỘNG TUYẾN

TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến

Thông thường các biến độc lập không có mối


quan hệ tuyến tính.

Nếu quy tắc này bị vi phạm thì sẽ có hiện tượng


đa cộng tuyến.

TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
Xét mô hình hồi quy tuyến tính k biến với hàm PRF :
Yi  1  2 X 2i  3 X 3i  ...  k X ki  Ui
Đa cộng tuyến hoàn hảo xảy ra khi giữa các
biến độc lập có mối quan hệ chính xác theo
dạng
a2X 2 + a3X 3 + ... + ak X k = 0
Đa cộng tuyến không hoàn hảo xảy ra khi giữa
các biến độc lập có mối quan hệ theo dạng
a2X 2 + a 3X 3 + ... + ak X k + V = 0
TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
X2 X3 X4
627 3135 3165
843 4215 4260
650 3250 3275
786 3930 3987
704 3520 3582

TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
Ví dụ  Đa cộng tuyến hoàn hảo:

X2 X3 X4
10 50 52
15 75 78
18 90 97
24 120 129
11 55 63

TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
 Điều gì xảy ra khi có đa cộng tuyến hoàn hảo ?
Xét ví dụ hàm hồi quy tuyến tính 3 biến
Yi  1   2 X 2i  3 X 3i  U i
Và giả sử có đa cộng tuyến hoàn hảo : X3i=aX2i
 y x  x    x x  y x 
2

Ta có : ˆ2  i 2i 3i 2 i 3i i 3i

 x  x   x x 
2
2i
2
3i 2 i 3i
2

Vì : X3i=aX2i

 y x a  x   a  x x a  y x  0
2 2

ˆ  i 2i 2i

2i 2i i 2i
2
 x a  x   a x x 
2
2i
2 2
2i
02i 2i
2

TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
0
Tương tự: ˆ3 
0
Nếu thay X3i=aX2i vào hàm hồi quy ta được:
Yi  1   2 X 2 i   3 aX 2 i  U i
Yi  1  (  2   3 a ) X 2 i  U i
Như vậy trong trường hợp đa cộng tuyến hoàn
hảo thì không thể ước lượng được các hệ số
trong mô hình mà chỉ có thể ước lượng được
một tổ hợp tuyến tính của các hệ số đó.
TBP 3/18/2020
TBP
1. Giới thiệu đa cộng tuyến
 Điều gì xảy ra khi có đa cộng tuyến không
hoàn hảo ?

TBP 3/18/2020
TBP
2. Nguyên nhân của đa cộng tuyến
Do phương pháp thu thập dữ liệu:
+ Các giá trị của các biến độc lập phụ
thuộc lẫn nhau trong mẫu, nhưng không
phụ thuộc lẫn nhau trong tổng thể.

Ví dụ:

TBP 3/18/2020
TBP
2. Nguyên nhân của đa cộng tuyến

+ Các biến độc lập được chọn có quan hệ


nhân quả hay có mối quan hệ tương quan
cao vì cùng phụ thuộc vào một điều kiện
khác.
Vd:

TBP 3/18/2020
2. Nguyên nhân của đa cộng tuyến
TBP

 Kích cỡ mẫu quá nhỏ


 Dạng hàm mô hình:

 Các biến độc lập vĩ mô được quan sát theo


dữ liệu chuỗi thời gian

TBP 3/18/2020
3. Hậu quả của đa cộng tuyến
TBP

Hệ quả khi có đa cộng tuyến không hoàn hảo

1. Phương sai của các ước lượng theo OLS lớn

2. Sai số chuẩn của các hệ số hồi qui sẽ lớn


Do đó:

TBP 3/18/2020
TBP
3. Hậu quả của đa cộng tuyến
3. Tỷ số t nhỏ

4.Các ước lượng và sai số chuẩn của ước


lượng rất nhạy cảm với sự thay đổi của dữ
liệu
Chỉ cần một sự thay đổi nhỏ trong mẫu dữ
liệu sẽ kéo theo sự thay đổi lớn các hệ số
ước lượng.
TBP 3/18/2020
3. Hậu quả của đa cộng tuyến
TBP

5. Dấu của các ước lượng của các hệ số hồi


quy có thể sai

6. Thêm vào hay bớt đi các biến cộng tuyến


với các biến khác, mô hình sẽ thay đổi về
dấu hoặc thay đổi về độ lớn của các ước
lượng

TBP 3/18/2020
TBP
4. Nhận biết đa cộng tuyến

 R2 cao và thống kê t thấp.

Ví dụ:
Khảo sát 10 cửa hàng máy tính, tìm hiểu ảnh
hưởng của doanh số bán hàng và tiền thưởng
cho bộ phận kinh doanh lên lợi nhuận sau
thuế, đơn vị triệu đồng
TBP 3/18/2020
TBP
Tiền thưởng Doanh số bán Lợi nhuận
X2 X3 Y
1.58 200 22
2.686 340 35.7
1.862 245 27.685
1.44 180 19.62
2.145 275 30.8
3.672 459 48.654
1.1242 146 16.06
2.496 320 36.16
4.345 550 63.25
TBP 3/18/2020
TBP

TBP 3/18/2020
TBP
4. Nhận biết đa cộng tuyến

TBP 3/18/2020
TBP
4. Nhận biết đa cộng tuyến

 Tương quan tuyến tính mạnh giữa các


biến độc lập

TBP 3/18/2020
TBP

Hệ số tương quan (r)

∑(𝑿𝟐𝒊 − 𝑿𝟐)(𝑿𝟑𝒊 − 𝑿𝟑)


𝒓𝟐𝟑 =
∑(𝑿𝟐𝒊− 𝑿𝟐)𝟐 ∑(𝑿𝟑𝒊 − 𝑿𝟑)𝟐

TBP 3/18/2020
TBP
4. Nhận biết đa cộng tuyến
 Thực hiện hồi qui phụ

TBP 3/18/2020
Dependent Variable: X2 TBP

Method: Least Squares


Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 0.159584 0.238054 0.670369 0.5215
X3 0.007081 0.000687 10.30674 0.0000
R-squared 0.929965 Mean dependent var 2.429020
Adjusted R-squared 0.921211 S.D. dependent var 1.019332
S.E. of regression 0.286120 Akaike info criterion 0.512049
Sum squared resid 0.654919 Schwarz criterion 0.572566
Log likelihood -0.560244 Hannan-Quinn criter. 0.445662
F-statistic 106.2288 Durbin-Watson stat 1.874165
Prob(F-statistic) 0.000007 TBP 3/18/2020
TBP
4. Nhận biết đa cộng tuyến

 Thừa số phóng đại phương sai- VIF

o R2j là hệ số xác định của hàm hồi quy phụ


o VIFj càng lớn, cộng tuyến càng cao.
o Kinh nghiệm: ………………………….,
cộng tuyến được xem là cao
TBP 3/18/2020
5. Khắc phục đa cộng tuyến TBP

TBP 3/18/2020

You might also like