You are on page 1of 64

CHƯƠNG 5.

CÁC KHUYẾT TẬT CỦA MÔ HÌNH

Bài1 Đa cộng tuyến

Bài 2 Phương sai sai số thay đổi

Bài 3 Tự tương quan

2
Bài 1. ĐA CỘNG TUYẾN

1. Bản chất

2. Nguyên nhân của đa cộng tuyến

3. Hậu quả của đa cộng tuyến

4. Phát hiện đa cộng tuyến

5. Các biện pháp khắc phục đa cộng tuyến


1. Bản chất của đa cộng tuyến
Đa cộng tuyến là gì ?

Đa cộng tuyến có nghĩa là sự tồn tại mối quan hệ tuyến

tính “hoàn hảo” hoặc “gần hoàn hảo” giữa một số hoặc

tất cả các biến độc lập trong một mô hình hồi quy.
1. Bản chất của đa cộng tuyến
Xét mô hình hồi quy tuyến tính k-1 biến độc lập:
Y = 1 + 2X2 + 3X3 + … + kXk + U (1)
● Nếu tồn tại các số thực 2, 3, …, k sao cho:
2X2 + 3X3 + …… + kXk = 0
với i (i = 2, 3,…,k) không đồng thời bằng không thì mô hình (1)
xảy ra hiện tượng đa cộng tuyến hoàn hảo.
VD: Y = 1 + 2X2 + 3X3 + 4X4 +U (*)
Mà có: 5X2 -X3 -2X4 = 0
=>Mô hình (*) bị đa cộng tuyến hoàn hảo.
1. Bản chất của đa cộng tuyến
● Nếu tồn tại các số thực 2, 3, …, k sao cho:
2X2 + 3X3 + …… + kXk + V = 0
với V là sai số ngẫu nhiên thì mô hình (1) bị hiện tượng đa

cộng tuyến gần hoàn hảo (đa cộng tuyến cao).

Nói cách khác là một biến độc lập nào đó có tương quan

với một hoặc một số biến độc lập khác thì mô hình bị đa

cộng tuyến cao.


Ví dụ
X2 10 15 18 24 30

X3 50 75 90 120 150

X4 52 75 97 129 152

 X3 = 5X2, vì vậy mô hình: Y = β1 + β2X2 + β3X3 + U bị hiện tượng


đa cộng tuyến hoàn hảo.
 X2 và X4 có tương quan với nhau nên mô hình:
Y = β1 + β2X2 +β3X4 + U bị đa cộng tuyến gần hoàn hảo (đa cộng
tuyến cao).
1. Bản chất của đa cộng tuyến

Không có đa cộng tuyến Đa cộng tuyến thấp

Y Y

X2 X3 X3
X2

Hình 1: Biểu đồ Venn mô tả hiện tượng đa cộng tuyến


1. Bản chất của đa cộng tuyến
Đa cộng tuyến cao Đa cộng tuyến hoàn hảo

Y Y
X3
X2 X2
X3

Hình 2: Biểu đồ Venn mô tả hiện tượng đa cộng tuyến


2. Nguyên nhân của hiện tượng đa cộng tuyến

1 2 3 4

Các hiện tượng


kinh tế luôn chứa Do quá trình Do chọn sai Những nguyên
những quan hệ lấy mẫu dạng hàm. nhân khác.
bao hàm, các biên không khách
có quan hệ với quan hoặc
nhau theo một xu kích thước
hướng nào đó. mẫu nhỏ.
3. Hậu quả của đa cộng tuyến
3.1. Trường hợp đa cộng tuyến hoàn hảo
 

SRM : Yi = ˆ1 +  2 X 2 i +  3 X 3i + ei
 ( y x )( x ) − ( y x )( x x )
2

2 =
i 2i 3i i 3i 2i 3i

( x )( x ) − ( x x )
2
2i
2
3i 2i 3i
2

 ( y x )( x ) − ( y x )( x x )
2

3 =
i 3i 2i i 2i 2i 3i

( x )( x ) − ( x x )
2
2i
2
3i 2i 3i
2

• Giả sử X3i=.X2i trong đó   0, thay vào ta có:


 ( y x )(  x ) − (  y x )(  x ) 0
2 2 2
2i
2 = =
i 2i 2i i 2i

( x )(  x ) −  ( x )
2
2i
2 0 2
2i
2 2
2i
2
3. Hậu quả của đa cộng tuyến
3.2. Trường hợp đa cộng tuyến không hoàn hảo
• Xét mô hình hồi quy 3 biến dưới dạng sau:

Yi = 1 +2 X2i + 3 X3i + ui (1)

Giả định x3i =  x2i + vi

với   0 và vi là sai số ngẫu nhiên.

Trong trường hợp này, các hệ số hồi quy 2 và 3 vẫn có thể ước
lượng được bằng OLS, chẳng hạn:
 (  y x )(  x +  v ) − ( y x +  y v )( x )
2 2 2 2

2 =
i 2i 2i i i 2i i i 2i

(  x )(   x +  v ) −  (  x )
2 2 2 2 2 2 2
2i 2i i 2i
3. Hậu quả của đa cộng tuyến
3.2. Trường hợp đa cộng tuyến không hoàn hảo

● Phương sai của các ước lượng OLS lớn:

 2 2
Var ( ˆ 2 ) = Var ( ˆ3 ) =
 x (1 − r )
2
2i
2
23
x (
 3i 23
2
1 − r 2
)
● Khoảng tin cậy của các hệ số hồi quy riêng rộng:
 
ˆ

ˆ ( n −3) 
  j − Se(  j ).t /2   j   j + Se(  j )t /2 
( n −3)

 
3. Hậu quả của đa cộng tuyến
3.2. Trường hợp đa cộng tuyến không hoàn hảo
ˆ j
● Thống kê T = ˆ “ mất ý nghĩa” khi kiểm định cặp
se(  j )
giả thuyết: H0: j = 0, H1: j ≠ 0
● Hệ số R2 cao nhưng tỉ số Tqs thấp, do đó kiểm định F và kiểm
định T mâu thuẫn nhau, cụ thể:

+ kiểm định F thì cho kết quả bác bỏ giả thuyết H0 : R2 = 0

+ kiểm định T thì lại chấp nhận H0 : j =0


4. Phát hiện đa cộng tuyến

5.4.1. Hệ số R2 lớn nhưng tỷ số Tqs nhỏ

5.4.2. Tương quan cặp giữa các biến giải thích cao

5.4.3. Sử dụng nhân tố phóng đại phương sai (VIF)

5.4.4. Sử dụng mô hình hồi quy phụ

5.4.5. Sử dụng độ đo Theil


4. Phát hiện đa cộng tuyến
4.1. Hệ số R2 lớn nhưng tỷ số Tqs nhỏ
• Đây là triệu chứng “kinh điển” của đa cộng tuyến:

Nếu R2 cao (R2 >0,8) và thống kê F cho phép bác


bỏ giả thuyết H0 :R2 = 0, nhưng thống kê T cho
từng j lại chấp nhận giả thuyết H0: j = 0 thì đó
là dấu hiệu có thể cho rằng mô hình gốc bị đa
cộng tuyến cao.
4. Phát hiện đa cộng tuyến
4.2. Tương quan giữa các cặp biến giải thích cao

Nếu hệ số tương quan cặp giữa các biến giải thích

cao (rij > 0,8) thì đó là dấu hiệu để nhận định rằng

mô hình có thể xảy ra hiện tượng đa cộng tuyến.

Tuy nhiên phương pháp này mang tính phán đoán.


4. Phát hiện đa cộng tuyến
4.3. Sử dụng nhân tố phóng đại phương sai (VIF)
Đối với hàm hồi quy có k-1 biến giải thích , VIF (Variance Inflation

1
Factor) được định nghĩa như sau: 𝑉𝐼𝐹 =
1−𝑅𝑗2

trong đó Rj2 là hệ số xác định khi hồi qui biến Xj theo các biến giải

thích còn lại.

Kinh nghiệm: nếu VIF vượt quá 10 (điều này xảy ra nếu Rj2 > 0,9)

thì mô hình được coi là có cộng tuyến cao.


4. Phát hiện đa cộng tuyến
4.4. Sử dụng hồi quy phụ
• K/N: Hồi quy phụ là phương pháp hồi quy biến Xj theo các biến
độc lập còn lại, cụ thể:
Xét mô hình gốc k biến:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑈 1
Thủ tục kiểm định:
Bước 1. Hồi quy mô hình hồi quy phụ:
𝑋𝑗 = 𝛼1 + 𝛼2 𝑋2 + ⋯ + 𝛼𝑗−1 𝑋𝑗−1 + 𝛼𝑗+1 𝑋𝑗+1 + ⋯ + 𝛼𝑘 𝑋𝑘 + 𝑈
thu được: 𝑅𝑗2 𝑉ớ𝑖 𝑗 = 2,3, … , 𝑘
4. Phát hiện đa cộng tuyến
4.4. Sử dụng hồi quy phụ
Bước 2. Kiểm định cặp giả thuyết:
H 0 : R 2j = 0
H1 : R 2j  0
• Tiêu chuẩn kiểm định:
R 2j n − k +1
Fj = .  F ( k − 2; n − k + 1)
1− Rj k − 2
2

• Miền bác bỏ: Wα =(f α (k-2; n-k-1) ; + ∞)

• Nếu giả thuyết H0 được chấp nhận, thì mô hình gốc không
có đa cộng tuyến.
4. Phát hiện đa cộng tuyến
4.4. Sử dụng hồi quy phụ
Ví dụ:
Nghiên cứu mối quan hệ lượng cung tiền của một quốc gia MS
(Đv: tỷ USD) với thu nhập quốc dân GDP (đv: tỷ USD) và lãi
suất R (đv: %), xét mô hình sau:
PRM: MS = β1 + β2GDP + β3 R + u (1)
Hồi quy mô hình sau:
GDP = α 1+ α2R + v ; n = 62 (2)
thu được hệ số xác định R2 =0,325. Mô hình (2) dùng để làm gì?
Cho kết luận?
4. Phát hiện đa cộng tuyến
4.5. Sử dụng độ đo Theil
• Xét mô hình hồi quy k biến:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑈 1
Bước 1. Hồi quy mô hình đã cho tìm được hệ số R2
Bước 2. Lần lượt hồi quy k-1 mô hình sau:

Y= 𝛼1 + 𝛼2 𝑋2 + ⋯ + 𝛼𝑗−1 𝑋𝑗−1 + 𝛼𝑗+1 𝑋𝑗+1 + ⋯ + 𝛼𝑘 𝑋𝑘 + 𝑈


2
thu được hệ số xác định bội 𝑅−𝑗 𝑉ớ𝑖 𝑗 = 2,3, … , 𝑘
( )
k
Bước 3. Tìm độ đo Theil theo công thức sau: m = R − 2
R 2
− R 2
−j
j =2
Bước 4. Kết luận:
• Nếu m  0 thì mô hình không có đa cộng tuyến;
• Nếu m  1 thì mô hình có đa cộng tuyến hoàn hảo;
• Khi m càng lớn thì mô hình càng có đa cộng tuyến cao.
5. Các biện pháp khắc phục
5.1. Loại trừ biến độc lập ra khỏi mô hình
Bước 1: Xem cặp biến giải thích nào có quan hệ chặt chẽ.
Giả sử X2, X3,…,Xk là các biến độc lập, Y là biến phụ
thuộc và chẳng hạn X2, X3 có tương quan chặt chẽ với
nhau.

Bước 2: Tính R2 đối với các hàm hồi quy: không có mặt
một trong hai biến.

Bước 3: Ta loại biến mà giá trị R2 tính được khi không có


mặt biến đó là lớn hơn.
5. Các biện pháp khắc phục
5.2. Sử dụng sai phân cấp 1
Từ hàm hồi quy: Yt = 1 + 1 X1t + 2 X2t + ut

ta suy ra : Yt-1 = 1 + 1X1,t-1 + 2X2,t-1 + ut-1

Trừ hai vế cho nhau, ta được:

Yt – Yt – 1 = 1(X1,t – X1,t – 1) + 2(X2,t – X2,t – 1) + (ut – ut – 1)

Hay: Yt = 1X1,t + 2X2,t + et,

Mặc dù, X1 và X2 có quan hệ tuyến tính, nhưng không có nghĩa sai


phân của chúng cũng như vậy.

Ngoài ra ta có thể lấy thêm mẫu hoặc lấy mẫu mới.


Bài 2. PHƯƠNG SAI SAI SỐ THAY ĐỔI

1 Khái niệm PSSS thay đổi

2 Nguyên nhân của PSSS thay đổi

3 Hậu quả của PSSS thay đổi

4 Cách phát hiện PSSS thay đổi

5 Cách khắc phục PSSS thay đổi


2
1. Bản chất của phương sai sai số thay đổi

• Giả thiết của phương pháp OLS:


Mô hình có phương sai sai số ngẫu nhiên thuần nhất
(Homoscedasticity), tức là:
Var(Ui) = σ2 với mọi i.
• Tuy nhiên trong thực tế giả thiết này có thể bị vi phạm
nghĩa là: Var(Ui) = σi2, phương sai sai số ngẫu nhiên có
giá trị khác nhau ở các giá trị khác nhau của biến độc
lập.
• Hiện tượng này được gọi là hiện tượng phương sai sai
số thay đổi (Heteroskedasticity).
1. Bản chất của phương sai sai số thay đổi

Y Y

(a) (b)

0 X 0 X
X1 X2 Xn X1 X2 Xn
Hình 1.1: (a) Phương sai của sai số không đổi và (b) Phương sai của sai số thay đổi
2. Nguyên nhân của phương sai sai số thay đổi

• Do bản chất của các hiện tượng kinh tế:


– Hiện tượng kinh tế diễn ra thao những đối tượng có quy mô khác nhau
hoặc theo những thời kỳ có nhiều biến động nên phương sai của sai số
ngẫu nhiên sẽ khác nhau.

– Hiện tượng phương sai sai số thay đổi thường xảy ra với dữ liệu chuỗi
thời gian.

• Do phương tiện thu thập và xử lý thông tin dữ liệu ngày càng


hoàn thiện nên sai số ngày càng giảm.
3. Hậu quả của phương sai sai số thay đổi

• Các hệ số hồi quy ước lượng bằng OLS vẫn là ước lượng
tuyến tính, không chệch nhưng không phải là ước lượng
hiệu quả nhất.
• Ước lượng của phương sai sai số ngẫu nhiên là ước lượng
chệch.
• Khoảng tin cậy của hệ số hồi quy mất tính chính xác.
• Kiểm định T và kiểm đinh F bị mất chính xác và mâu thuẫn
nhau.
4. Phát hiện phương sai sai số thay đổi

4.1. Dựa vào đồ thị phần dư

4.2. Kiểm định Park

4.3. Kiểm định Glejser

4.4. Kiểm định White

4.5. Kiểm định dựa vào biến phụ thuộc


4.1. Dựa vào đồ thị phần dư

Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑈𝑖 (1)

• Bước 1: Hồi quy mô hình đã cho, thu được phần dư ei => ei2
• Bước 2: Vẽ đồ thị ei2 theo Xi và dựa vào đồ thị để phán đoán
mô hình có hiện tượng phương sai sai số thay đổi hay không.

ei2 ei2

0 Xi 0 Xi
4.2. Kiểm định Park
• Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑈𝑖 (1)
• Giả thiết: Phương sai thay đổi theo một hàm của
biến giải thích, tức là:
𝛼2 𝑉𝑖
𝜎𝑖2 =𝜎 2
𝑋𝑖 𝑒
hay: ln(σ2i) = ln(σ2) + α2 ln(Xi) + Vi
• α2 = 0: Mô hình (1) không có phương sai sai số thay đổi
α2 ≠ 0: Mô hình (1) có phương sai sai số thay đổi.
• Do σi chưa biết nên ta dùng ước ượng của nó là ei2
Các Bước Kiểm Định Park
• Bước 1: Hồi quy mô hình (1) thu được phần dư ei  e2i
• Bước 2: Hồi quy mô hình: ln(e2i) = α1 + α2 ln(Xi) + Vi
• Bước 3: Kiểm định cặp giả thuyết:

H0: Mô hình (1) không có phương sai sai số thay đổi.

H1: Mô hình (1) có phương sai sai số thay đổi.

ෝ2
𝛼
Tiêu chuẩn kiểm định thứ nhất: T = ~T(n-2)
ෝ2
𝑠𝑒 𝛼

𝑅 2 𝑛−2
Tiêu chuẩn kiểm định thứ hai: F = 2 . ~F(1;n-2)
1−𝑅 1
4.3. Kiểm Định Glejser

Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑈𝑖 (1)


• Giả thiết: Phương sai sai số là một hàm của

biến độc lập.

• Tuy nhiên việc lựa chọn dạng hàm nào tùy

thuộc vào tình huống cụ thể.


Các bước kiểm định bằng Glejer
• Bước 1: Hồi quy mô hình ban đầu thu được ei  |ei|
• Bước 2: Hồi quy một trong các mô hình sau:
ei = 1 +  2 X i + Vi ei = 1 +  2 X i + Vi
1 1
ei = 1 +  2 + Vi ei = 1 +  2 + Vi
Xi Xi
• Bước 3: Kiểm định cặp giả thuyết:
H0: Mô hình (1) không có phương sai sai số thay đổi
H1: Mô hình (1) có phương sai sai số thay đổi.
Tiêu chuẩn kiểm định: T, F
4.4. Kiểm định White
• Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑈𝑖 (1)
• Giả thiết: Phương sai của sai số ngẫu nhiên thay đổi nhưng phụ
thuộc vào: biến độc lập, bình phương và tích chéo của biến độc
lập có trong mô hình.
• Thủ tục kiểm định:
– Bước 1: Hồi quy mô hình (1) thu được: ei  ei2
– Bước 2: Hồi quy mô hình sau thu được R2:
𝑒𝑖2 = 𝛼1 + 𝛼2 𝑋2𝑖 + 𝛼3 𝑋3𝑖 + 𝛼4 𝑋2𝑖
2 2
+ 𝛼5 𝑋3𝑖 + 𝛼6 𝑋2𝑖 𝑋3𝑖 + 𝑉𝑖
4.4. Kiểm định White
- Bước 3: Kiểm định cặp giả thuyết:

H0: Mô hình (1) không có phương sai sai số thay đổi

H1: Mô hình (1) có phương sai sai số thay đổi

Tiêu chuẩn kiểm định thứ nhất: F

Tiêu chuẩn kiểm định thứ hai:  2


= nR 2
  2
(m)

Miền bác bỏ: W = (  (m); +)


2

trong đó m là số biến độc lập ở bước 2.

• Chú ý: Mô hình ở bước 2 có thể có biến tích chéo hoặc không có.
4.4. Kiểm định White
Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑈𝑖 ; 𝑛 = 25 (1)

trong đó: Y là mức lương (triệu đồng/tháng)

X2 là số năm kinh nghiệm;

X3 là số năm được đào tạo.

Hồi quy mô hình sau thu được hệ số xác định R2 =0,592:


𝑒𝑖2 = 𝛼1 + 𝛼2 𝑋2𝑖 + 𝛼3 𝑋3𝑖 + 𝛼4 𝑋2𝑖
2 2
+ 𝛼5 𝑋3𝑖 + 𝛼6 𝑋2𝑖 𝑋3𝑖 + 𝑉𝑖

Mô hình (2) dùng để làm gì? Cho kết luận?


4.5. Kiểm định dựa vào biến phụ thuộc
• Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 + 𝑈𝑖 1

Giả thiết: Phương sai sai số thay đổi nhưng phụ thuộc
tuyến tính vào [E(Y/Xi)]2, tức là:

σi 2= α1+ α2[E(Y/Xi)]2 + vi
• Thủ tục kiểm định:
– Bước 1: Hồi quy mô hình (1) ta thu được ei và 𝑌෠𝑖
– Bước 2: Hồi quy mô hình sau:
 2
ei2 = 1 +  2 Yi + vi
thu được các hệ số hồi quy và hệ số xác định R2.
4.5. Kiểm định dựa vào biến phụ thuộc

- Bước 3: Kiểm định cặp giả thuyết:


H0: Mô hình (1) không có phương sai sai số thay đổi

H1: Mô hình (1) có phương sai sai số thay đổi

Tiêu chuẩn kiểm định thứ nhất: T

Tiêu chuẩn kiểm định thứ hai: F

Tiêu chuẩn kiểm định thứ ba:  2


= nR 2
  2
(1)

Miền bác bỏ: W = (  2 (1) ; + )


4.5. Kiểm định dựa vào biến phụ thuộc

Xét mô hình hồi quy 3 biến:


PRM: Y = 1 +  2 X 2 + 3 X 3 + U ; n = 100 (1)
trong đó:
Y chi tiêu của sinh viên (triệu /tháng)
X2 là số tiền gia đình chu cấp hàng tháng (triệu)
X3 là số năm theo học
Hồi quy mô hình sau được hệ số xác định R2 =0,263:
2
ei2 = 1 +  2 Yi + vi (2)
Mô hình (2) dùng để làm gì? Cho kết luận?
5. Biện pháp khắc phục
5.1. Khi σi 2 đã biết
5.2. Khi σi 2 chưa biết
– Giả thiết 1: Phương sai sai số tỷ lệ với bình phương
của biến giải thích.
– Giả thiết 2: Phương sai sai số tỷ lệ với biến giải thích.
– Giả thiết 3: Phương sai sai số tỷ lệ với bình phương kỳ
vọng có điều kiện của biến phụ thuộc.
– Giả thiết 4: Phương sai sai số thay đổi là do chỉ định
sai dạng hàm.
5.1. Khi σi 2 đã biết

• Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑈𝑖 (1)

• Giả sử mô hình (1) có Var(Ui) = σi 2 thay đổi nhưng đã biết.


Khi đó chia cả hai về của mô hình (1) cho σi ta có:

Yi 1 Xi Ui
= 1 + 2 + (2)
i i i i
• Mô hình (2) có phương sai sai số không đổi vì:
 Ui  1
Var   = 2 Var (U i ) = 1
 i  i
• Khi đó ước lượng mô hình (2) bằng phương pháp OLS.
5.2. Khi σi 2 chưa biết
• Xét mô hình: Y𝑖 = 𝛽1 + 𝛽2 𝑋𝑖 + 𝑈𝑖 (1)
• Giả sử mô hình (1) có Var(Ui)=σi 2 thay đổi nhưng chưa biết. Khi
đó tùy thuộc vào sự thay đổi của σi 2 mà có cách khắc phục khác
nhau, cụ thể:
• Giả thiết 1: Phương sai sai số tỷ lệ với bình phương của biến giải
thích: Var (U i ) =  i 2 =  2 X i 2
– Chia cả hai vế của mô hình (1) cho Xi ta có:
Yi 1 X i Ui
= 1 + 2 + (3)
Xi Xi Xi Xi
– Mô hình (3) có phương sai sai số không đổi vì:
 Ui 
Var   = 2 Var (U i ) =  2
1
 Xi  Xi
– Khi đó ước lượng mô hình (3) bằng phương pháp OLS.
5.2. Khi σi 2 chưa biết
Giả thiết 2: Phương sai của sai số ngẫu nhiên tỷ lệ với biến độc lập
Var (U i ) =  i =  2 X i
2

– Chia cả hai vế của mô hình (1) cho X i ta có:


Yi 1 X U
= 1 + 2 i + i (4)
Xi Xi Xi Xi

– Mô hình (4) có phương sai sai số không đổi vì:

 Ui  1
Var  = Var (U i ) =  2
 X  Xi
 i 

– Khi đó ước lượng mô hình (4) bằng phương pháp OLS.


5.2. Khi σi 2 chưa biết
Giả thiết 3: Phương sai sai số tỷ lệ với bình phương kỳ vọng có
điều kiện của biến phụ thuộc:
Var (U i ) =  i =  E (Y / X i )
2 2 2

– Chia cả hai vế của (1) cho E(Y/Xi ) ta có:


Yi 1 Xi Ui
= 1 + 2 + (5)
E (Y X i ) E (Y X i ) E ( Y X i ) E (Y X i )
– Mô hình (5) có phương sai sai số không đổi vì:
 Ui 
Var   =
1
Var (U ) =  2

 E (Y X )
i  E (Y X i )2 i

– Do E(Y/Xi ) chưa có nên ta thay bằng 𝑌෠𝑖 vào mô hình (5) và


ước lượng mô hình (5) bằng phương pháp OLS:
Yi 1 X i Ui
= 1 +  2 +
Yˆi Yˆi Yˆi Yˆi
5.2. Khi σi 2 chưa biết
Giả thiết 4: Phương sai sai số thay đổi do chỉ định sai dạng hàm

• Thay vì ước lượng mô hình hồi quy tuyến tính ta có thể ước
lượng một trong các mô hình sau:

ln Yi = 1 +  2 ln X i + U i
ln Yi = 1 +  2 X i + U i
Yi = 1 +  2 ln X i + U i
Bài 3. TỰ TƯƠNG QUAN

1 Khái niệm tự tương quan

2 Nguyên nhân của tự tương quan

3 Hậu quả của tự tương quan

4 Cách phát hiện tự tương quan

5 Cách khắc phục tự tương quan


2
1. Khái niệm tự tương quan
• Giả thiết của OLS: không có tự tương quan giữa các sai
số ngẫu nhiên, tức là Cov(Ui,Uj) = 0 (với mọi i  j).

• Trong thực tế thì giả thiết này có thể bị vi phạm, sai số


ngẫu nhiên ở các quan sát khác nhau có tương quan với
nhau, tức là Cov(Ui,Uj)  0 (với i  j). Khi đó mô hình
gốc có tự tương quan.

• Thực tế cho thấy, mô hình với số liệu chuỗi thời gian dễ


xảy ra hiện tượng tự tương quan hơn với số liệu chéo.
1. Khái niệm tự tương quan

• Ta nói mô hình gốc có hiện tượng tự tương quan


bậc 1 (ký hiệu: AR(1)) nếu thỏa mãn hệ thức:
Ut = ρ Ut-1 +Vt

V ~N(0, a2 ) và Cov(V ; V ) = 0
Trong đó: t i j

• Ta nói mô hình gốc có hiện tượng tự tương quan


bậc p (ký hiệu: AR(p)) nếu thỏa mãn hệ thức:
Ut = ρ1Ut-1 + …+ ρpUt-p + Vt
2. Nguyên nhân tự tương quan

• Do các hiện tượng kinh tế xã hội có các tính


chất: quán tính, mạng nhện, trễ.

• Do xử lý số liệu (tách, gép, nội suy, ngoại suy).

• Do chỉ định sai dạng hàm.

• Do nguyên nhân khác


3. Hậu quả tự tương quan
• Ước lượng các hệ số hồi quy bằng pương pháp OLS
vẫn là ước lượng tuyến tính không chệch nhưng
không phải là ước lượng hiệu quả nhất.

• Kết quả ước lượng R2 có thể là không đáng tin cậy.

• Các kiểm định T và F không đáng tin cậy.

• Ước lượng phương sai của sai số ngẫu nhiên và sai số


chuẩn có thể không phải là ước lượng hiệu quả nhất.
4. Phát hiện tự tương quan

4.1. Phương pháp đồ thị

4.2. Kiểm định Durbin- Watson

4.3. Kiểm định Breusch- Godfrey (BG)


4. Phát hiện tự tương quan
4.1. Phương pháp đồ thị
Xét mô hình: Y𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝑈𝑡 (1)
• Các bước thực hiện:
– Bước 1: Hồi quy mô hình (1) thu được phần dư et và et-1
– Bước 2: Vẽ đồ thị của et theo thời gian t hoặc et theo et-1 và quan
sát đồ thị từ đó đưa ra kết luận:
120 120

80 80

40
40

0
0
E

-40
-40
-80
-80
-120
50 55 60 65 70 75 80 85 90 -120
-120 -80 -40 0 40 80 120
CS Residuals
E1
4. Phát hiện tự tương quan
4.2. Kiểm định Durbin- Watson
• Thống kê kiểm định Durbin- Watson:
n

 t t −1
( e − e ) 2

d= t =2
n

 t
e 2

t =1
• Điều kiện áp dụng thống kê Durbin-Watson:
– Mô hình có hệ số chặn.
– Mô hình không chứa biến trễ của biến phụ thuộc với tư cách là
biến độc lập.
– Không có quan sát nào bị mất trong tập số liệu.
– Chỉ dùng để kiểm định tự tương quan bậc một:
AR (1) : U t = U t −1 + Vt
4. Phát hiện tự tương quan
4.2. Kiểm định Durbin- Watson
n n n n n

 (e − e  (e + et −1 − 2et et −1 ) e + e − 2 et et −1
2 2 2 2 2
t t −1 ) t t t −1
d= t =2
n
= t =2
n
= t =2 t =2
n
t =2

e
t =1
2
t e
t =1
2
t t
e 2

t =1
n n

e e t t −1 e e t t −1
̂ là ước lượng của
 2−2 t =2
ˆ = t =2
 d  2(1 − ˆ )
n n  trong AR(1)
e
t =1
2
t e
t =1
2
t

Nhận xét: 
 = 0    0  d  2 => Mô hình không bị tự tương quan
 = 1  ˆ  1  d  0 => Mô hình bị tự tương quan dương
 = −1  ˆ  −1  d  4 => Mô hình bị tự tương quan âm
4. Phát hiện tự tương quan
4.2. Kiểm định Durbin- Watson
Thủ tục kiểm định Durbin-Watson:
Bước 1: Hồi quy mô hình gốc thu được et và et-1
Bước 2: Tính thống kê quan sát của Durbin-Watson: dqs
Bước 3: Với =5%, n , k’=k-1 tra dLvà dU
Bước 4: Lập bảng quyết định:
MH có tự Không có MH không Không có MH có tự
tương quan kết luận có tự tương kết luận tương quan
dương quan âm

0 dL dU 4-dU 4-dL 4
Bước 5: So sánh dqs với bảng trên và kết luận.
4. Phát hiện tự tương quan
4.2. Kiểm định Durbin- Watson

Ví dụ:
Hồi quy mối quan hệ giữa sản lượng đầu ra Q(đv: nghìn sản
phẩm), vốn K(đv: triệu đồng) và lao động L (đv: người),
nghiên cứu thực hiện với một ngành công nghiệp từ 1998
đến 2020, ta có kết quả sau:

lnQ = 0,4571 + lnK + 0,3722lnL + e

Thống kê Durbin-Watson thu được bằng 1,8756. Mô hình


ban đầu có bị hiện tượng tự tương quan bậc 1 hay không?
4. Phát hiện tự tương quan
4.3. Kiểm định Breusch- Godfrey (BG)

• Cho mô hình: Y𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 + ⋯ + 𝛽𝑘 𝑋𝑘𝑡 + 𝑈𝑡 (1)

xem mô hình (1) có AR(p) :

𝑈𝑡 = 𝜌1 𝑈𝑡−1 + ⋯ + 𝜌𝑝 𝑈𝑡−𝑝 + 𝑉𝑡
• Thủ tục kiểm định:
– Bước 1: Hồi quy mô hình gốc thu được: et , et-1 ,…, et-p
– Bước 2: Hồi quy mô hình sau thu được R21 :
et = 1 +  2 X 2t + ... +  k X kt + 1et −1 + ... +  p et − p + V1t
4. Phát hiện tự tương quan
4.3. Kiểm định Breusch- Godfrey (BG)

- Bước 3: Kiểm định cặp giả thuyết:

H0: Mô hình gốc không có tự tương quan bậc p

H1: Mô hình gốc có tự tương quan bậc p

Tiêu chuẩn kiểm định:


 2 = (n − p )R12   2 ( p )
Miền bác bỏ: W = ( 2 ( p ) ; + )
4. Phát hiện tự tương quan
4.3. Kiểm định Breusch- Godfrey (BG)

Ví dụ:
Cho mô hình: Yt = β1 + β2 Xt + Ut ; n = 36 (1)

Hồi quy mô hình:

et = α1 + α2 Xt + α3et-1 + α4et-2 + Vt (2)

thu được hệ số xác định R2 = 0,152. Mô hình (2) dùng để


làm gì? cho kết luận?
5. Khắc phục tự tương quan
5.1. Khi cấu trúc tự tương quan đã biết
• Xét mô hình: Yt = β1 + β2 Xt +Ut

và Ut = ρ Ut-1 +Vt trong đó đã biết ρ

• Lấy trễ một kỳ ta có: Yt-1 = β1 + β2 Xt-1 + Ut-1

=> ρ Yt-1 = ρ β1 + ρ β2 Xt-1 + ρUt-1

=> Yt - ρYt-1 = (1- ρ)β1 + β2(Xt - ρXt-1 ) + Ut - ρUt-1 (*)

Đặt: Yt* = Yt - ρYt-1 ; Xt* = Xt - ρXt-1 ; Vt = Ut - ρUt-1

=>(*) có dạng: Yt* = β1* + β2 Xt* + Vt


5. Khắc phục tự tương quan
5.2. Khi cấu trúc tự tương quan chưa biết
• Xét mô hình: Yt = β1 + β2 Xt + Ut (1)
và Ut = ρUt-1 + Vt trong đó ρ chưa biết.
• Ước lượng ρ theo 2 phương pháp:
*Phương pháp 1: Sử dụng thống kê Durbin – Watson:
 d
  1−
2
Thay vào phương trình sai phân cấp 1 ta có:

Y − ˆY = 1− ˆ  +   X − ˆX  +U − ˆU


t t −1 1 2 t t −1  t t −1
5. Khắc phục tự tương quan
5.2. Khi cấu trúc tự tương quan chưa biết
*Phương pháp 2: Lặp Cochrane Orcutt:
Bước 1: Hồi quy mô hình: Yt = β1 + β2 Xt + Ut
tìm được et và et-1
Bước 2: Hồi quy mô hình: et = ρet-1 + vt
tìm được 𝜌ො
Bước 3: Dùng 𝜌ො hồi quy mô hình sai phân tổng quát:
Yt − ˆYt −1 = (1 − ˆ )1 +  2 ( X t −1 − ˆX t −1 ) + U t − ˆU t −1
tìm được 𝛽መ1 , 𝛽መ2
Bước 4: Thay 𝑒Ƹ𝑡 , 𝑒Ƹ𝑡−1 thay vào mô hình (1) tìm được 𝛽መ1 , 𝛽መ2
5. Khắc phục tự tương quan
5.2. Khi cấu trúc tự tương quan chưa biết

Bước 5: Hồi quy mô hình: 𝑒Ƹ𝒕 = 𝝆ො𝒆𝒕−𝟏 + 𝒗𝒕 tìm được 𝜌෠ො

Bước 6: Dùng 𝜌෠ො thiết lập mô hình sai phân tổng quát (lặp ở bước 3)

Bước 7: Lặp bước 4, tiếp tục cho đến khi thu ước lượng của ρ ở hai

lần lặp kế tiếp xấp xỉ bằng nhau thì dừng và dùng kết quả thu được

để lập và ước lượng mô hình sai phân tổng quát.

You might also like