Professional Documents
Culture Documents
2
NỘI DUNG
3
Chọn mô hình và kiểm định chọn mô hình
1. Chọn mô hình
- Tiết kiệm: Mô hình đơn giản nhưng phải chứa
các biến chủ yếu ảnh hưởng đến biến phụ thuộc
nhằm giải thích bản chất của vấn đề nghiên cứu.
- Tính đồng nhất: Với một tập dữ liệu đã cho, các
tham số ước lượng phải duy nhất. 2
-Tính thích hợp (R2): Mô hình có R2 ( hoặc R
càng gần 1 được coi càng thích hợp.
- Tính bền vững về mặt lý thuyết: mô hình phải
phù hợp với lý thuyết nền tảng.
- Khả năng dự báo cao
4
2. Các sai lầm khi chọn mô hình- Hậu quả
5
2. Các sai lầm khi chọn mô hình- Hậu quả
6
2. Các sai lầm khi chọn mô hình- Hậu quả
7
Ví dụ
• Về hàm chi phí của doanh nghiệp, dạng hàm đúng
Yi = b1 + b2Xi + b3Xi2 + b4Xi3 + u1i
• Bỏ sót biến quan trọng (Xi3):
Yi = a1 + a2Xi + a3Xi2 + u2i
• Đưa biến không liên quan vào mô hình (Xi4):
Yi = l1 + l2Xi + l3Xi2 + l4Xi3 + l5Xi4 + u3i
• Dạng hàm sai.
lnY = g1 + g2Xi + g3Xi2 + g4Xi3 + u4i
8
Cách tiếp cận để lưa chọn mô hình
1. Xác định số biến độc lập: có hai hướng tiếp cận:
Từ đơn giản đến tổng quát: bổ sung biến độc lập từ từ
vào mô hình
Từ tổng quát đến đơn giản: Xét mô hình hồi quy có đầy
đủ các biến độc lập đã được xác định, sau đó loại trừ
những biến không quan trọng ra khỏi mô hình
2. Kiểm định mô hình có vi phạm giả thiết như đa cộng
tuyến, phương sai thay đổi, tự tương quan. Nếu mô
hình vi phạm thì cần có biện pháp khắc phục.
3. Chọn dạng hàm; dựa vào
Các lý thuyết kinh tế
Các kết quả nghiên cứu thực nghiệm
4. Sử dụng các tiêu chuẩn thông dụng để chọn mô
hình
9
Kiểm định việc chọn mô hình
a. Kiểm định thừa biến (kiểm định Wald)
Xét hai mô hình:
(U ) : Y 1 2 X 2 ... m 1 X m 1 m X m k X k U
( R) : Y 1 2 X 2 ... m 1 X m 1 V
(U): mô hình không bị ràng buộc (Unrestricted
model)
(R): mô hình bị ràng buộc (Restricted model).
Điều kiện ràng buộc là các hệ số hồi quy của các
biến Xm , Xm+1 , Xk đồng thời bằng 0
10
a. Kiểm định Wald
Xây dựng giả thiết để kiểm định đk ràng buộc
Ho : m ... k 0
H1: có ít nhất một j khác 0
B1: Hồi quy mô hình (U) có k tham số, tính RSSU
có n-k bậc tự do
B2: Hồi quy mô hình (R) có m tham số, tính
RSSR có n-m bậc tự do
B3: Tính F
( RSSR RSSU ) /( k m) ( R 2U R 2 R ) /( k m)
F
RSSU /( n k ) (1 R U ) /( n k )
2
11
a. Kiểm định Wald
B4: Tra bảng F với mức ý nghĩa α có giá
trị Fα (k-m, n-k)
Quy tắc quyết định:
Nếu F> Fα (k-m, n-k): bác bỏ Ho, tức mô
hình (U) không thừa biến.
Nếu dùng kết quả p-value thì quy tắc
quyết định như sau:
•Nếu p ≤ : Bác bỏ H0
•Nếu p > : Chấp nhận H0
12
b. Kiểm định bỏ sót biến giải thích
Tính R2new
Kiểm định giả thiết H0: 3 = 4 =… = k = 0
13
b. Kiểm định bỏ sót biến giải thích
Bước 3: Tính
(R R ) m
2 2
F new old
(1 Rnew ) (n k )
2
S 2 ( K 3) 2
JB n
6 24
S
(u i u) 3
K
(u i u) 4
3 4
n.SE u n.SE u
Nếu JB > χ2, Bác bỏ H0, ngược lại, chấp nhận H0
15
Tiêu chuẩn lựa chọn mô hình
• R2,
• R2 điều chỉnh,
• Giá trị của hàm hợp lý log-likelihood (L),
• Tiêu chuẩn thông tin Akaike (AIC),
• Tiêu chuẩn thông tin Schwarz (SIC)
16
Tiêu chuẩn R 2
17
Tiêu chuẩn R2 điều chỉnh
(R2)
RSS /(n k ) 2 n 1
R 1
2
1 (1 R )
TSS /(n 1) nk
• Ta thấyR2 R2.R2 chỉ tăng khi giá trị tuyệt đối
của giá trị t của biến được thêm vào mô hình
lớn hơn 1.
• Do vậy,R2 là tiêu chuẩn tốt hơn R2.
• Lưu ý, các biến phụ thuộc cũng phải giống
nhau.
18
Giá trị của hàm hợp lý log-likelihood (L)
n n 1
L ln ln(2 ) U i2
2
2 2 2
19
Tiêu chuẩn thông tin Akaike (AIC)
RSS 2 k / n
AIC .e
n
hay
2k RSS
ln AIC ln
n n
21
6. Các chỉ tiêu đánh giá mô hình dự báo
• Sai số dự báo
et Yt Yˆt
• Mẫu chia thành hai phần
Mẫu khởi động: gồm các quan sát t=1,2,3...S-1
Mẫu kiểm tra: gồm các quan sát t=S, S+1,…S+h
22
6.1 Trung bình sai số bình phương
23
6.2 Căn bậc hai của trung bình sai số bình
phương
RMSE MSE
24
6.3 Trung bình sai số tuyệt đối
25
6.4 Trung bình của phần trăm sai số tuyệt đối
26
6.5 Hệ số bất đẳng thức Theil
27
6.6 Tỷ lệ độ chệch
BP
Yˆ Y 2
1 S h ˆ
h 1 t S
(Yt Yt ) 2
28
6.7 Tỷ lệ phương sai
( SYˆ SY ) 2
VP S h
1
h t S
ˆ
(Yt Yt ) 2
1 S h ˆ ˆ 2 1 S h
SYˆ
h t S
(Yt Yt ) SY
h t S
(Yt Yt ) 2
29
6.8 Tỷ lệ hiệp phương sai
• BP+VP+CP=1
• Mô hình dự báo tốt: BP và VP nhỏ
30
Ví dụ 1
• Cho Y: lượng hàng bán được của mặt hàng A
(kg/tháng)
• X2: giá bán mặt hàng A (ngàn đồng/kg)
• X3: giá bán của mặt hàng B (ngàn đồng/kg)
• Z= 0 nếu khu vực khảo sát ở nông thôn, Z=1
nếu kv khảo sát ở thành phố
Sử dụng Eviews, hãy kiểm định Wald để phát
hiện thừa biến
31
X2 X3 Z Y
2 14 1 20
3 13 0 19
3 15 1 18
4 16 0 18
4 11 1 17
3 16 1 17
4 10 0 16
4 17 1 16
5 13 1 15
5 12 1 15
5 14 0 14
6 15 1 14
6 13 0 13
7 14 1 12
7 12 0 12
5 16 1 15
4 15 0 16
7 18 1 12
8 16 0 10
8 20 1 11 32
B1. Chạy mô hình U
33
B2 Chạy mô hình R
34
B3 Tính F
( RSSR RSSU ) /( k m) ( R 2U R 2 R ) /( k m)
F
RSSU /( n k ) (1 R U ) /( n k )
2
37
• Giả sử α=5%, ta thấy hệ số hồi quy của biến X3
và Z có p > α nên biến X3 và Z khác 0 không có
ý nghĩa.
• B2: Chạy kiểm định Wald cho giả thiết
H0: β3=β4 =0 , ta có kết quả
38
39
• Ta có F= 0.082219, p=0.9215> α nên ta chấp
nhận giả thuyết H0: β3=β4 =0. Tức biến X3, Z
không cần thiết đưa vào mô hình.
• Kết luận: Lượng hàng trung bình bán được của
mặt hàng A chỉ phụ thuộc vào giá bán của mặt
hàng A, không phụ thuộc vào giá bán mặt
hàng B và khu vực bán.
40