You are on page 1of 21

VẤN ĐỀ

ĐA CỘNG TUYẾN
TRONG MÔ HÌNH
HỒI QUY
NỘI DUNG CHÍNH
Bản chất của đa cộng tuyến

Ước lượng trong trường hợp có đa cộng tuyến

Nguyên nhân của đa cộng tuyến

Hậu quả của đa cộng tuyến

Cách phát hiện đa cộng tuyến

Khắc phục đa cộng tuyến


BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Đa cộng tuyến là tồn tại mối quan hệ tuyến tính giữa một số hoặc tất cả các
biến độc lập trong mô hình.
Xét hàm hồi quy:
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋𝑖2 + ⋯ . +𝛽𝑘 𝑋𝑖𝑘 + 𝑈𝑖

Nếu tồn tại các số 𝝀𝟐 , 𝝀𝟑 , … , 𝝀𝒌 không đồng thời bằng 0 sao cho:

𝜆2 𝑋2 + 𝜆3 𝑋3 + ⋯ + 𝜆𝑘 𝑋𝑘 + 𝑎 = 0
(a: hằng số)
Có đa cộng tuyến hoàn hảo.
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Nếu tồn tại các số 𝝀𝟐 , 𝝀𝟑 , … , 𝝀𝒌 không đồng thời bằng 0 sao cho:

𝜆2 𝑋2 + 𝜆3 𝑋3 + ⋯ + 𝜆𝑘 𝑋𝑘 + 𝑉𝑖 = 0 (𝑉𝑖 : ngẫu nhiên)

 Có đa cộng tuyến.
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Không có đa cộng tuyến Đa cộng tuyến thấp

Y
Y

𝑋3
𝑋2
𝑋3
𝑋2
BẢN CHẤT CỦA ĐA CỘNG TUYẾN
Đa cộng tuyến cao Đa cộng tuyến hoàn hảo

Y
Y

𝑋3
𝑋2
𝑋2

𝑋3
VÍ DỤ
Xét hàm hồi quy: 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝑈
Với số liệu của các biến độc lập :
X2 10 15 18 24 30
X3 50 75 90 120 150
X4 52 75 97 129 152
Ta có : X3 = 5X2 hay 5X2 – X3 + 0 =0
 có hiện tượng đa cộng tuyến hoàn hảo giữa X2 và X3.
X4 = 5X2 + Vi hay 5X2 – X4 + Vi = 0
 có hiện tượng đa cộng tuyến không hoàn hảo giữa X2 và X4 .
ƯỚC LƯỢNG
TRONG TRƯỜNG HỢP CÓ ĐA CỘNG TUYẾN
 Trường hợp có đa cộng tuyến hoàn hảo
Xét hàm hồi quy: 𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑈
Theo phương pháp OLS, các hệ số ước lượng được tính theo công thức:
𝛽 = 𝑋′𝑋 −1
(𝑋 ′ 𝑌)
 Ma trận 𝑋 ′ 𝑋 không khả nghịch
 Không thể ước lượng được các hệ số trong mô hình, chỉ có thể ước lượng
được một tổ hợp tuyến tính của các hệ số đó.
ƯỚC LƯỢNG
TRONG TRƯỜNG HỢP CÓ ĐA CỘNG TUYẾN
 Trường hợp có đa cộng tuyến
Xét hàm hồi quy: 𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑈
Theo phương pháp OLS, các hệ số ước lượng được tính theo công thức:
𝛽 = 𝑋′𝑋 −1 (𝑋 ′ 𝑌)

 Ma trận 𝑋 ′ 𝑋 khả nghịch


 Vẫn có thể ước lượng được các hệ số trong mô hình.
NGUYÊN NHÂN CỦA ĐA CỘNG TUYẾN
 Mẫu không có tính đại diện cao cho tổng thể, do chỉ thu thập một bộ phân
tập trung.
 Dạng hàm mô hình
 Ví dụ: hồi quy dạng các biến độc lập được bình phương sẽ xảy ra đa cộng
tuyến, đặc biệt khi phạm vi các giá trị ban đầu của biến độc lập là nhỏ.
 Các biến giải thích cùng xu thế biến động: dữ liệu ch thời gian, khi các biến
giải thích cùng có xu thế tăng hay giảm.
HẬU QUẢ CỦA ĐA CỘNG TUYẾN
Trường hợp đa cộng tuyến hoàn hảo:
Ma trận 𝑋′𝑋 là ma trận suy biến→ ma trận nghịch đảo của nó không tồn tại.
 Vì vậy không thể tìm được ma trận các hệ số hồi quy ước lượng.
HẬU QUẢ CỦA ĐA CỘNG TUYẾN
Trường hợp đa cộng tuyến
1. Phương sai và hiệp phương sai của các ước lượng OLS lớn.
2. Khoảng tin cậy rộng hơn, thống kê t nhỏ nên tăng khả năng các hệ số ước
lượng không có ý nghĩa, dấu của các ước lượng có thể sai.
3. R2 cao nhưng thống kê t nhỏ.
4. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những
thay đổi nhỏ trong dữ liệu.
5. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay
đổi về dấu hoặc độ lớn của các ước lượng.
CÁCH PHÁT HIỆN ĐA CỘNG TUYẾN
1. Hệ số R2 lớn nhưng thống kê t nhỏ.
2. Tương quan cặp giữa các biến giải thích (độc lập) cao.
Ví dụ : Yn = 1+2Xn2+3Xn3+ 4Xn4 +
Nếu r23 hoặc r24 hoặc r34 cao  có đa cộng tuyến.
Tuy nhiên điều ngược lại không đúng, nếu các r nhỏ thì chưa biết có đa cộng tuyến
hay không.
CÁCH PHÁT HIỆN ĐA CỘNG TUYẾN
3. Sử dụng mô hình hồi qui phụ.
Xét : Y = 1+2X2+3X3+ 4X4 +ε
Cách sử dụng mô hình hồi qui phụ như sau :
Hồi qui mỗi biến độc lập theo các biến độc lập còn lại. Tính R2 cho mỗi hồi qui
phụ :
X2 = 1+2X3+3X4+u2 𝑅22
X3 = 1+ 2X2+ 3X4+u3  𝑅32
X4 = 1+ 2X2+ 3X3+u4  𝑅42
CÁCH PHÁT HIỆN ĐA CỘNG TUYẾN
3. Sử dụng mô hình hồi qui phụ.
- Kiểm định các giả thiết
𝐻0 : 𝑅𝑗2 = 0 (hồi quy phụ không phù hợp)
Giá trị kiểm định:
R 2j /  k  1
Fj 
 j  / n  k 
1  R 2

Nếu Fj > Fα;(k-2;n-k+1) thì bác bỏ giả thiết H0


- Nếu chấp nhận tất cả các giả thiết H0 trên thì không có đa cộng tuyến giữa
các biến độc lập.
CÁCH PHÁT HIỆN ĐA CỘNG TUYẾN
4. Sử dụng hệ số phóng đại phương sai (VIF)
1
VIFj  2
1  Rj

Trong đó, 𝑅𝑗2 là hệ số xác định của mô hình hồi quy phụ 𝑋𝑗 theo các biến độc lập
khác.
 Nếu VIF lớn thì có đa cộng tuyến trong mô hình
 Thông thường nếu VIF > 10 thì 𝑋𝑗 có đa cộng tuyến cao với các biến độc lập
khác trong mô hình.
KHẮC PHỤC ĐA CỘNG TUYẾN
Rules of Thumb khi bỏ qua đa cộng tuyến:
1. Bỏ qua đa cộng tuyến nếu các trị thống kê t > 2.
2. Bỏ qua đa cộng tuyến nếu R2 của mô hình cao hơn R2 của các mô hình hồi quy
phụ.
3. Bỏ qua đa cộng tuyến nếu mục tiêu xây dựng mô hình sử dụng để dự báo chứ
không phải kiểm định
KHẮC PHỤC ĐA CỘNG TUYẾN
1. Bỏ đi biến độc lập có đa cộng tuyến: Điều này xảy ra với giả định rằng
không có mối quan hệ giữa biến phụ thuộc và biến độc lập được loại ra
khỏi mô hình (nếu lý thuyết khẳng định có mối quan hệ giữa biến phụ thuộc
với biến độc lập dự định loại bỏ, thì việc loại bỏ biến này dẫn đến loại bỏ biến
quan trọng và chúng ta sẽ mắc sai lầm về nhận dạng hàm).
2. Bổ sung dữ liệu hoặc tìm dữ liệu mới: Tìm mẫu dữ liệu khác hoặc gia tăng cỡ
mẫu.
3. Thay đổi dạng mô hình: Mô hình kinh tế lượng có nhiều dạng hàm khác nhau.
4. Sử dụng thông tin tiên nghiệm: Sử dụng kết quả của các mô hình kinh tế lượng
trước đó ít có đa cộng tuyến.
VÍ DỤ
VÍ DỤ

You might also like