You are on page 1of 33

CHƯƠNG 7:

CHỌN MÔ HÌNH & KIỂM ĐỊNH


VIỆC CHỌN MÔ HÌNH

1
NỘI DUNG CHƯƠNG 7

1
2 Các thuộc tính của một mô hình tốt

2 Các sai lầm thường gặp khi chọn mô hình

3 Phát hiện những sai lầm và kiểm định

4 Kiểm định giả thiết phân phối chuẩn của U

2
1. CÁC THUỘC TÍNH CỦA MÔ HÌNH TỐT
1. Tiết kiệm: mô hình càng đơn giản càng tốt
2. Tính đồng nhất: với một tập dữ liệu đã cho,
các tham số ước lượng phải duy nhất
3. Tính thích hợp: mô hình có R2, R 2 càng gần 1
được coi là càng thích hợp
4. Tính bền vững về mặt lý thuyết: mô hình phải
phù hợp với cơ sở lý thuyết.
5. Có khả năng dự báo tốt
3
2. CÁC SAI LẦM THƯỜNG GẶP
KHI CHỌN MÔ HÌNH
1. Bỏ sót biến thích hợp
Giả sử mô hình đúng là :
Yt = β1 + β2X2t + β3X3t + Ut (9.17)
Nhưng ta lại chọn mô hình :
Yt = α1 + α2X2t + Vt (9.18)
→ hậu quả

4
2. CÁC SAI LẦM THƯỜNG GẶP
KHI CHỌN MÔ HÌNH
1. Bỏ sót biến thích hợp
Hậu quả:
➢ Các ước lượng thu được là ước lượng chệch
của các tham số trong mô hình đúng.
➢ Các ước lượng thu được không phải là ước
lượng vững.
➢ Phương sai của các ước lượng trong mô hình
sai (9.18) lớn hơn trong mô hình đúng (9.17).
➢ Khoảng tin cậy rộng, các kiểm định không còn
tin cậy nữa. 5
2. CÁC SAI LẦM THƯỜNG GẶP
KHI CHỌN MÔ HÌNH
2. Đưa vào mô hình các biến không thích hợp
Giả sử mô hình đúng là :
Yt = β1 + β2X2t + Ut (9.26)
Nhưng ta lại chọn mô hình:
Yt = α1 + α2X2t + α3X3t + Vt (9.27)
→ hậu quả

6
2. CÁC SAI LẦM THƯỜNG GẶP
KHI CHỌN MÔ HÌNH
2. Đưa vào mô hình các biến không thích hợp
Hậu quả:
➢ Các ước lượng OLS vẫn là các ước lượng
không chệch và vững của các tham số trong mô
hình đúng.
➢ Phương sai của các ước lượng trong mô hình
sai (9.26) lớn hơn trong mô hình đúng (9.27).
➢ Khoảng tin cậy rộng, các kiểm định không còn
tin cậy nữa.
7
2. CÁC SAI LẦM THƯỜNG GẶP
KHI CHỌN MÔ HÌNH
3. Chọn dạng hàm không đúng
Giả sử mô hình đúng là :
Yt = β1 + β2X2t + β3X3t + Ut (9.28)
Nhưng ta lại chọn mô hình:
lnYt = α1 + α2lnX2t + α3X3t + Vt (9.29)
→ hậu quả: kết luận sai lầm

8
3. PHÁT HIỆN NHỮNG SAI LẦM
VÀ KIỂM ĐỊNH

Hậu quả của việc chọn mô hình sai


➔ Phải phát hiện ra những sai lầm
➔ Có biện pháp khắc phục

9
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Giả sử ta có mô hình hồi quy :
Yi = β1+ β2X2i + β3X3i + β4X4i + β5X5i + Ui (9.30)
➢ Trường hợp nghi ngờ X5 là biến không cần thiết
→ kiểm định H0 : β5 = 0
➢ Trường hợp nghi ngờ X4 và X5 là các biến
không cần thiết
→ kiểm định H0 : β4 = β5 = 0

10
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Kiểm định Wald
Xét các mô hình:
(U) Yi = β1 + β2X2i + … + βmXmi +
+ βm+1X(m+1)i + … + βkXki + Ui
(R) Yi = β1 + β2X2i + … + βmXmi + Vi
(U) là mô hình không giới hạn và (R) là mô hình
giới hạn.
(k-m) biến bị loại bỏ (Xm+1,…, Xk): ảnh hưởng Y ?
➔ Kiểm định giả thiết H0: βm+1 = … = βk = 0 11
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Kiểm định Wald
Giả thiết H0: βm+1 = … = βk = 0
Bước 1: Ước lượng mô hình (U) và (R), tính được
RSSU và RSSR , sau đó tính:

F=
(RSS R − RSS U )/ (k − m)
RSS U / (n − k )
Bước 2: Với mức ý nghĩa α, tìm Fα(k-m, n-k)
Bước 3: Nếu F > Fα(k-m, n-k): Bác bỏ H0, tức là
(U) không thừa biến 12
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Ví dụ:
Ta có bảng số liệu về các biến Y, X2, X3 và Z
Trong đó:
Y : lượng hàng bán được của sp A (kg/tháng)
X2 : giá bán của sp A
X3 : giá bán của sp B
Z = 0 : khu vực khảo sát ở nông thôn
Z = 1 : khu vực khảo sát ở thành phố 13
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Y X2 Z X3 Y X2 Z X3
20 2 1 14 14 5 0 14
19 3 0 13 14 6 1 15
18 3 1 15 13 6 0 13
18 4 0 16 12 7 1 14
17 4 1 11 12 7 0 12
17 3 1 16 15 5 1 16
16 4 0 10 16 4 0 15
16 4 1 17 12 7 1 18
15 5 1 13 10 8 0 16
15 5 1 12 11 8 1 20
14
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.


C 22.39719 0.962214 23.27674 0.0000
X2 -1.541265 0.095086 -16.20923 0.0000
X3 0.018480 0.072000 0.256667 0.8007
Z 0.068620 0.329596 0.208193 0.8377

R-squared 0.948921 Mean dependent var 15.00000


Adjusted R-squared 0.939343 S.D. dependent var 2.752989
S.E. of regression 0.678023 Akaike info criterion 2.237585
Sum squared resid 7.355440 Schwarz criterion 2.436731
Log likelihood -18.37585 F-statistic 99.07919
15
Durbin-Watson stat 1.923118 Prob(F-statistic) 0.000000
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Từ kết quả hồi quy
biến X3 và Z có thể không

cần thiết đưa vào mô hình

Ta kiểm định giả thiết:


H0 : β3 = β4 = 0

16
3.1 PHÁT HIỆN SỰ CÓ MẶT
CỦA BIẾN KHÔNG CẦN THIẾT
Wald Test:
Equation: Untitled Chưa bác bỏ H0
Test Statistic Value df Probability
F-statistic 0.082219 (2, 16) 0.9215
Chi-square 0.164439 2 0.9211

Null Hypothesis Summary:


Normalized Restriction (= 0) Value Std. Err.
C(3) 0.018480 0.072000
C(4) 0.068620 0.329596
Restrictions are linear in coefficients.

X3 và Z không cần thiết trong mô hình 17


3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Xét mô hình: Yt = β0 + β1Xt + Ut (9.32)
Kiểm tra mô hình có bỏ sót biến Z hay không :
+ Ước lượng mô hình Yt = β0 + β1Xt + β2Zt + Vt
+ Kiểm định H0: β2 = 0. Nếu bác bỏ H0 thì mô hình
ban đầu đã bỏ sót biến Z.
❖ Nếu có số liệu của Z : thực hiện dễ dàng
❖ Nếu không có số liệu của Z : dùng kiểm định
RESET của Ramsey.
18
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Kiểm định RESET của Ramsey
Ramsey đã đề xuất sử dụng Ŷt2 , Ŷt3 làm các xấp xỉ
cho Zt.
Bước 1 : Ước lượng mô hình (9.32) ➔ Ŷt , R old
2

Yt = β0 + β1Xt + Ut
Bước 2 : Ước lượng mô hình (new) ➔ new
R 2

ˆ t2 + α3 Y
Yt = α0 + α1X t + α2 Y ˆ t3 + Vt (new)

19
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Kiểm định RESET của Ramsey
Bước 3 : Kiểm định giả thiết H0 : α2 = α3 = 0

(R − R ) /m
Tính 2 2
F=
(1 − R ) / (n − k )
new old
2
new

m: số biến độc lập mới đưa thêm vào mô hình


k: số hệ số của mô hình (new)
Bước 4: Nếu F > Fα(m, n-k): bác bỏ H0
➔ Mô hình (9.32) đã bỏ sót biến 20
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Ví dụ: Số liệu về tổng chi phí (Y) và tổng sản
lượng (X) như sau:

Sản lượng Tổng chi phí Sản lượng Tổng chi phí
(X) (Y) (X) (Y)
1 193 6 260
2 226 7 274
3 240 8 297
4 244 9 350
5 257 10 420

21
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Bước 1:
Hồi quy mô hình: Yi = β1 + β2Xi + Ui (1)
Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.


C 166.4667 19.02142 8.751537 0.0000
X 19.93333 3.065580 6.502305 0.0002

R-squared 0.840891 F-statistic 42.27997


Adjusted R-squared 0.821002 Prob(F-statistic) 0.000188

2
R old
22
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Bước 2: 2
R new
Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.


C 2140.215 131.9893 16.21507 0.0000
X 476.5521 33.39086 14.27193 0.0000
YF^2 -0.091865 0.006192 -14.83680 0.0000
YF^3 0.000119 7.46E-06 15.89677 0.0000

R-squared 0.998339 F-statistic 1202.220


Adjusted R-squared 0.997509 Prob(F-statistic) 0.000000
23
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Bước 3 :

F=
(R − R ) /m
2 2

(1 − R ) / (n − k )
new old
2
new

F=
(0,998339− 0,840891)/2
= 284,3732
(1 − 0,998339)/ (10 − 4)
Bước 4: Fα(m, n-k) = F0,05(2,6) = 5,14
Vậy F > F0,05(2,6): bác bỏ H0
➔ Mô hình (1) đã bỏ sót biến 24
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT

Ramsey RESET Test:


F-statistic 284.4035 Probability 0.000001
Log likelihood ratio 45.62275 Probability 0.000000

Test Equation:
Dependent Variable: Y
Variable Coefficient Std. Error t-Statistic Prob.
C 2140.215 131.9893 16.21507 0.0000
X 476.5521 33.39086 14.27193 0.0000
FITTED^2 -0.091865 0.006192 -14.83680 0.0000
FITTED^3 0.000119 7.46E-06 15.89677 0.0000
25
3.2 KIỂM ĐỊNH CÁC BIẾN BỊ BỎ SÓT
Ramsey RESET Test:
F-statistic 0.132831 Probability 0.879321
Log likelihood ratio 0.643028 Probability 0.725050

Test Equation:
Dependent Variable: Y
Variable Coefficient Std. Error t-Statistic Prob.
C 85.70189 151.8422 0.564414 0.6026
X -15.03495 194.4740 -0.077311 0.9421
X^2 3.456369 40.33312 0.085696 0.9358
X^3 -0.274376 2.974505 -0.092243 0.9309
FITTED^2 0.003961 0.010345 0.382919 0.7213
26
FITTED^3 -3.85E-06 1.07E-05 -0.360327 0.7368
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U
Để sử dụng các kiểm định t, F,  2
: giả thiết Ui có
phân phối chuẩn.

Do Ui chưa biết ➔ thông qua ei để đoán nhận.

Để kiểm định phân phối chuẩn của ei : dùng kiểm


định  hoặc kiểm định Jarque – Bera (JB)
2

27
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U
Kiểm định Jarque – Bera (JB)
Giả thiết : H0: U có phân phối chuẩn
H1: U không có phân phối chuẩn
Bước 1: Tính  S (K − 3) 
2 2
JB = n. + 
6 24 
S: hệ số bất đối xứng ; K: độ nhọn
Bước 2: Nếu JB >  (2)
2
➔ Bác bỏ H0
➔ U không có phân phối chuẩn 28
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U

Ví dụ (ví dụ 2 – chương 2): Cho số liệu về thu


nhập (X – USD/tuần) và chi tiêu (Y – USD/tuần)
của một mẫu gồm 10 hộ gia đình. Kiểm định giả
thiết phân phối chuẩn của U

Xi 80 100 120 140 160 180 200 220 240 260


Yi 70 65 90 95 110 115 120 140 155 150

29
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U
Kết quả từ Eviews:
5
Series: Residuals
Sample 1 10
4 Observations 10

Mean 2.13e-14
3 S Median 1.409091
Maximum 8.363636
Minimum -10.36364
2 Std. Dev. 6.121662
Skewness -0.398346
K Kurtosis 1.890997
1
Jarque-Bera 0.776920
Probability 0.678100
0
-15 -10 -5 0 5 10 30
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U
Với: S = - 0,398346 ; K = 1,890997
 S2 (K − 3)2 
JB = n. + 
6 24 
 (− 0,398346)2 (1,890997− 3)2 
JB = 10. +  = 0,7769
 6 24 
Nhận thấy JB <  2
0 , 05 (2) = 6 ➔ Chưa bác bỏ H0

➔ U có phân phối chuẩn


31
4. KIỂM ĐỊNH GIẢ THIẾT
PHÂN PHỐI CHUẨN CỦA U
Kết quả từ Eviews:
5
Series: Residuals
U có phân phối chuẩn Sample 1 10
4 Observations 10

Mean 2.13e-14
3 Median 1.409091
Maximum 8.363636
Minimum -10.36364
2 Std. Dev. 6.121662
Skewness -0.398346
Kurtosis 1.890997
1
Jarque-Bera 0.776920
Probability 0.678100
0
-15 -10 -5 0 5 10 32
33

You might also like