You are on page 1of 40

CHƯƠNG 9

CHỌN MÔ HÌNH VÀ KIỂM ĐỊNH CHỌN


MÔ HÌNH
CHỌN MÔ HÌNH

1. Biết cách tiếp cận để lựa chọn


mô hình
MỤC
TIÊU
2. Biết cách kiểm định việc chọn
mô hình

2
NỘI DUNG

1 Chọn mô hình- Các sai lầm khi chọn mô hình

2 Cách tiếp cận để lựa chọn mô hình

3 Kiểm định việc chọn mô hình

3
Chọn mô hình và kiểm định chọn mô hình

1. Chọn mô hình
- Tiết kiệm: Mô hình đơn giản nhưng phải chứa
các biến chủ yếu ảnh hưởng đến biến phụ thuộc
nhằm giải thích bản chất của vấn đề nghiên cứu.
- Tính đồng nhất: Với một tập dữ liệu đã cho, các
tham số ước lượng phải duy nhất. 2
-Tính thích hợp (R2): Mô hình có R2 ( hoặc R
càng gần 1 được coi càng thích hợp.
- Tính bền vững về mặt lý thuyết: mô hình phải
phù hợp với lý thuyết nền tảng.
- Khả năng dự báo cao
4
2. Các sai lầm khi chọn mô hình- Hậu quả

•Bỏ sót biến thích hợp: dẫn đến một số hậu


quả như
i.Các tham số ước lượng sẽ bị chệch và
không vững.
ii.Khoảng tin cậy và các kiểm định không chính
xác.
iii.Dự báo dựa trên mô hình sai sẽ không đáng
tin cậy.

5
2. Các sai lầm khi chọn mô hình- Hậu quả

•Đưa vào mô hình những biến không phù


hợp:
các ước lượng thu được từ mô hình thừa
biến không hiệu quả, khoảng tin cậy rộng.

6
2. Các sai lầm khi chọn mô hình- Hậu quả

•Lựa chọn mô hình không chính xác:


i.Ước lượng chệch các hệ số hồi quy,
thậm chí dấu của hệ số hồi quy có thể
sai.
ii.Có ít hệ số hồi quy ước lượng được có
ý nghĩa thống kê
iii.R2 không cao
iv.Phần dư các quan sát lớn và biểu thị
sự biến thiên có tính hệ thống.

7
Ví dụ
• Về hàm chi phí của doanh nghiệp, dạng hàm đúng
Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i
• Bỏ sót biến quan trọng (Xi3):
  Yi = a1 + a2Xi + a3Xi2 + u2i
• Đưa biến không liên quan vào mô hình (Xi4):
Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 +  u3i
• Dạng hàm sai.
  lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i

8
Cách tiếp cận để lưa chọn mô hình
1. Xác định số biến độc lập: có hai hướng tiếp cận:
Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ
vào mô hình
Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy
đủ các biến độc lập đã được xác định, sau đó loại trừ
những biến không quan trọng ra khỏi mô hình
2. Kiểm định mô hình có vi phạm giả thiết như đa cộng
tuyến, phương sai thay đổi, tự tương quan. Nếu mô
hình vi phạm thì cần có biện pháp khắc phục.
3. Chọn dạng hàm; dựa vào
Các lý thuyết kinh tế
Các kết quả nghiên cứu thực nghiệm
4. Sử dụng các tiêu chuẩn thông dụng để chọn mô
hình
9
Kiểm định việc chọn mô hình
a. Kiểm định thừa biến (kiểm định Wald)
Xét hai mô hình:
(U ) : Y  1   2 X 2  ...   m 1 X m 1   m X m   k X k  U

( R) : Y  1   2 X 2  ...   m 1 X m 1  V
(U): mô hình không bị ràng buộc (Unrestricted
model)
(R): mô hình bị ràng buộc (Restricted model).
Điều kiện ràng buộc là các hệ số hồi quy của các
biến Xm , Xm+1 , Xk đồng thời bằng 0
10
a. Kiểm định Wald
Xây dựng giả thiết để kiểm định đk ràng buộc
Ho :  m  ...   k  0
H1: có ít nhất một  j khác 0
B1: Hồi quy mô hình (U) có k tham số, tính RSSU
có n-k bậc tự do
B2: Hồi quy mô hình (R) có m tham số, tính
RSSR có n-m bậc tự do
B3: Tính F
( RSSR  RSSU ) /( k  m) ( R 2U  R 2 R ) /( k  m)
F 
RSSU /( n  k ) (1  R U ) /( n  k )
2

11
a. Kiểm định Wald
B4: Tra bảng F với mức ý nghĩa α có giá
trị Fα (k-m, n-k)
Quy tắc quyết định:
Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô
hình (U) không thừa biến.
Nếu dùng kết quả p-value thì quy tắc
quyết định như sau:
•Nếu p ≤  : Bác bỏ H0
•Nếu p > : Chấp nhận H0

12
b. Kiểm định bỏ sót biến giải thích

Để kiểm định các biến giải thích bỏ sót, ta dùng


kiểm định Reset của Ramsey, gồm các bước:
Bước 1: Dùng OLS để ước lượng mô hình
Yi = 1 + 2X2i + ui
Từ đó ta tính Yˆi và R2old
Bước 2: dùng OLS để ước lượng mô hình
ˆ ˆ
Yi  1   2 X 2i   3Y   4Y  ...  vi
2 3

Tính R2new
Kiểm định giả thiết H0: 3 = 4 =… = k = 0

13
b. Kiểm định bỏ sót biến giải thích
Bước 3: Tính
(R  R ) m
2 2
F new old
(1  Rnew ) (n  k )
2

n: số quan sát, k: số tham số trong mô hình mới; m: số


biến đưa thêm vào.
Bước 4: Nếu F > F(m,n-k): Bác bỏ H0, tức các hệ số
3,4,…k không đồng thời bằng 0, mô hình cũ đã bỏ
sót biến.
Nếu dùng kết quả p-value thì quy tắc quyết định như
sau: Nếu p ≤  : Bác bỏ H0
Nếu p > : Chấp nhận H0
14
c. Kiểm định giả thiết phân phối chuẩn của ui

Để kiểm định phân phối chuẩn của Ui, ta dùng kiểm


định χ2, hay kiểm định Jarque-Bera:
Kiểm định giả thiết H0: ui có phân phối chuẩn

 S 2 ( K  3) 2 
JB  n   
 6 24 

S
 (u i u) 3

K
 (u i u) 4

3 4
n.SE u n.SE u
Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0
15
Tiêu chuẩn lựa chọn mô hình

• R2,
• R2 điều chỉnh,
• Giá trị của hàm hợp lý log-likelihood (L),
• Tiêu chuẩn thông tin Akaike (AIC),
• Tiêu chuẩn thông tin Schwarz (SIC)

16
Tiêu chuẩn R 2

• R2 đo lường % biến động của Y được giải thích bởi


các Xi trong mô hình.
• R2 càng gần 1, mô hình càng phù hợp.
• Lưu ý:
– Nó chỉ đo lường sự phù hợp “trong mẫu”
– Khi so sánh R2 giữa các mô hình khác nhau, các biến phụ
thuộc phải giống nhau.
– R2 không giảm khi tăng thêm biến độc lập.

17
Tiêu chuẩn R2 điều chỉnh
(R2)
RSS /(n  k ) 2 n 1
R  1
2
 1  (1  R )
TSS /(n  1) nk
• Ta thấyR2  R2.R2 chỉ tăng khi giá trị tuyệt đối
của giá trị t của biến được thêm vào mô hình
lớn hơn 1.
• Do vậy,R2 là tiêu chuẩn tốt hơn R2.
• Lưu ý, các biến phụ thuộc cũng phải giống
nhau.
18
Giá trị của hàm hợp lý log-likelihood (L)

n n 1
L   ln   ln(2 )   U i2
2

2 2 2

• Giá trị L càng lớn chứng tỏ mô hình càng phù


hợp

19
Tiêu chuẩn thông tin Akaike (AIC)

 RSS  2 k / n
AIC   .e
 n 
hay
 2k   RSS 
ln AIC     ln 
 n   n 

• Trong đó k là số biến được ước lượng (gồm cả


hệ số tự do) và n là cỡ mẫu.
• Giá trị AIC càng nhỏ chứng tỏ mô hình càng phù
hợp.
20
Tiêu chuẩn thông tin Schwarz (SC)
 RSS  k / n
SC   .n
 n 
hay
k  RSS 
ln SC  ln n   
n  n 
• SC còn khắt khe hơn AIC.
• SC càng nhỏ, mô hình càng tốt.

21
6. Các chỉ tiêu đánh giá mô hình dự báo

• Sai số dự báo

et  Yt  Yˆt
• Mẫu chia thành hai phần
Mẫu khởi động: gồm các quan sát t=1,2,3...S-1
Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h

22
6.1 Trung bình sai số bình phương

Mean Squared Error


S h
1
MSE  
h  1 t S
2
et

23
6.2 Căn bậc hai của trung bình sai số bình
phương

• Root Mean Squared Error

RMSE  MSE

24
6.3 Trung bình sai số tuyệt đối

• Mean Absolute Error


1 S h
MAE  
h  1 t S
et

• Các chỉ tiêu MSE, RMSE, MAE phụ thuộc đơn


vị đo của biến dự báo.

25
6.4 Trung bình của phần trăm sai số tuyệt đối

• Mean Absolute Percentage Error


1 S  h et
MAPE  
h  1 t  S Yt

26
6.5 Hệ số bất đẳng thức Theil

• Mean Absolute Error


RMSE
TIC 
S h S h
1 1

h  1 t S
ˆ
Yt 
2

h  1 t S
Yt 2

• TIC thuộc [0;1]


• TIC =0: hàm hồi quy dự báo chính xác

27
6.6 Tỷ lệ độ chệch

• Bias Proportion: trung bình của giá trị dự báo


khác so với trung bình giá trị thực tế

BP 
Yˆ  Y  2

1 S h ˆ

h  1 t S
(Yt  Yt ) 2

28
6.7 Tỷ lệ phương sai

• Variance Proportion: cho biết mức độ biến


thiên của giá trị dự báo khác mức độ biến
thiên của giá trị thiực tế

( SYˆ  SY ) 2
VP  S h
1

h t S
ˆ
(Yt  Yt ) 2

1 S h ˆ ˆ 2 1 S h
SYˆ  
h t S
(Yt  Yt ) SY  
h t S
(Yt  Yt ) 2

29
6.8 Tỷ lệ hiệp phương sai

• Covariance Proportion: cho biết tỷ lệ phần sai


số của dự báo không mang tính hệ thống
2(1  rYˆY ) SYˆ SY
CP  S  h
1

h t S
ˆ
(Yt  Yt ) 2

• BP+VP+CP=1
• Mô hình dự báo tốt: BP và VP nhỏ

30
Ví dụ 1
• Cho Y: lượng hàng bán được của mặt hàng A
(kg/tháng)
• X2: giá bán mặt hàng A (ngàn đồng/kg)
• X3: giá bán của mặt hàng B (ngàn đồng/kg)
• Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1
nếu kv khảo sát ở thành phố
Sử dụng Eviews, hãy kiểm định Wald để phát
hiện thừa biến
31
X2 X3 Z Y
2 14 1 20
3 13 0 19
3 15 1 18
4 16 0 18
4 11 1 17
3 16 1 17
4 10 0 16
4 17 1 16
5 13 1 15
5 12 1 15
5 14 0 14
6 15 1 14
6 13 0 13
7 14 1 12
7 12 0 12
5 16 1 15
4 15 0 16
7 18 1 12
8 16 0 10
8 20 1 11 32
B1. Chạy mô hình U

33
B2 Chạy mô hình R

34
B3 Tính F

( RSSR  RSSU ) /( k  m) ( R 2U  R 2 R ) /( k  m)
F 
RSSU /( n  k ) (1  R U ) /( n  k )
2

• B4 Tra bảng F (α, k-m, n-k) và quyết định bác bỏ


hoặc chấp nhận Ho.
Ho: Thừa biến
H1: Không thừa biến
35
Ví dụ 1
Giả sử mô hình hồi quy
Yi  1   2 X 2i   3 X 3i   4 Z i  ui

B1: Chạy mô hình hồi quy mẫu


B2: Xác định hệ số hồi quy không có ý nghĩa
thống kê (có p>α). Lập giả thuyết Ho
B3: Chạy kiểm định Wald, xem giá trị F và p của F
để quyết định bác bỏ hay chấp nhận Ho
36
B1: Chạy hồi quy

37
• Giả sử α=5%, ta thấy hệ số hồi quy của biến X3
và Z có p > α nên biến X3 và Z khác 0 không có
ý nghĩa.
• B2: Chạy kiểm định Wald cho giả thiết
H0: β3=β4 =0 , ta có kết quả

38
39
• Ta có F= 0.082219, p=0.9215> α nên ta chấp
nhận giả thuyết H0: β3=β4 =0. Tức biến X3, Z
không cần thiết đưa vào mô hình.
• Kết luận: Lượng hàng trung bình bán được của
mặt hàng A chỉ phụ thuộc vào giá bán của mặt
hàng A, không phụ thuộc vào giá bán mặt
hàng B và khu vực bán.

40

You might also like