Professional Documents
Culture Documents
Trước tiên, khi nhận được 1 đề bài (1 vấn đề) các bạn cần xác định tổng thể là tập hợp nào, với kinh
tế lượng cơ bản thì cần xem xét số liệu theo không gian (số liệu chéo) hay theo thời gian (số liệu
chuỗi thời gian). Với giả định không có số liệu tổng thể và thường chỉ có đúng 1 mẫu thì các con số
(các kết quả ước lượng) đều gắn với mẫu. Với tổng thể chỉ có các kí hiệu.
• Với KTL1, biến phụ thuộc phải là biến định lượng. Xác định các biến độc lập, loại biến (định tính
hay định lượng).
• Lựa chọn dạng hàm phù hợp: nên theo lý thuyết hoặc các kết quả nghiên cứu khác gợi ý.
• (Thu thập dữ liệu), Kiểm tra số liệu và thực hiện hồi quy (sử dụng Excel, Eviews, Stata, R, …)
• Kiểm định sự phù hợp của mô hình. Kiểm tra các giả thiết OLS và khắc phục nếu cần.
• Tiến hành phân tích (ước lượng khoảng, kiểm định T, kiểm định F, …) và dự báo.
1
3. Phương pháp OLS (Ordinary Least Squares)
a. Các giả thiết của pp OLS với số liệu chéo (Cross Sectional Data – CS)
CS1: …mẫu là ngẫu nhiên
Đây là giả thiết quan trọng, ảnh hưởng đến tính không chệch, độ chính xác, tính vững của
ước lượng β̂j .
Với KTL1 coi như CS1 được thỏa mãn.
CS2: E(ui|X2i,…,Xki) = 0 (từ đó chứng minh được E(u) = 0 và Cov(Xj,u) = 0, mọi j)
Giả thiết CS2 ảnh hưởng đến tính không chệch của các ước lượng β̂j nên nó ảnh hưởng đến
cả mục đích phân tích và mục đích dự báo.
CS3: Var(ui|X2i,…,Xki) = σ2
Giả thiết CS3 ảnh hưởng đến độ chính xác của các ước lượng nên nó ảnh hưởng đến mục
đích phân tích.
CS4: MH không có đa cộng tuyến hoàn hảo
Mô hình được gọi là có đa cộng tuyến hoàn hảo nếu tồn tại các giá trị 𝛼𝑗 không đồng thời
bằng 0 thỏa mãn phương trình 𝛼1 + 𝛼2 𝑋2 + ⋯ + 𝛼𝑘 𝑋𝑘 = 0.
Trường hợp có ĐCT hoàn hảo thì sẽ tồn tại j (=2, …, k) mà khi hồi quy mô hình 𝑋𝑗 = 𝛼1 +
𝛼2 𝑋2 + ⋯ + 𝛼𝑗−1 𝑋𝑗−1 + 𝛼𝑗+1 𝑋𝑗+1 + ⋯ + 𝛼𝑘 𝑋𝑘 + 𝑣 sẽ thu được hệ số xác định 𝑅𝑗2 = 1.
Giả thiết CS4 được thỏa mãn thì mới tồn tại các công thức ước lượng β̂j . Tuy nhiên thực tế
thường giả thiết này không bị vi phạm và thưởng hay xem xét ĐCT cao (gần vi phạm CS4)
CS5: sai số ngẫu nhiên pp chuẩn
Đến chương 3 mới cần CS5, nghĩa là giả thiết này ảnh hưởng đến bài toán ước lượng
khoảng, kiểm định T, kiểm định F.
b. Ý tưởng: Tìm các 𝛽̂𝑗 sao cho tổng 𝑅𝑆𝑆 = ∑𝑛𝑖=1 𝑒𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽
̂1 − 𝛽
̂2 𝑋2𝑖 − ⋯ − 𝛽
̂𝑘 𝑋𝑘𝑖 )2 đạt
nhỏ nhất. Có thể sử dụng ma trận để giải.
c. Các định lý quan trọng
ĐL Gauss – Markov: Khi các giả thiết CS1 – CS4 thỏa mãn thì các ước lượng thu được từ pp
OLS là BLUE (ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các
ước lượng tuyến tính không chệch)
𝜎2
̂ ̂
𝐸(𝛽𝑗 ) = 𝛽𝑗 ; 𝑉𝑎𝑟(𝛽𝑗 ) =
(1 − 𝑅𝑗2 ) ∑𝑛𝑖=1(𝑋𝑗𝑖 − 𝑋̅𝑗 )2
Do 𝜎 2 = 𝑉𝑎𝑟(𝑢𝑖 |𝑋2 , … , 𝑋𝑘 ) không tính trực tiếp được nên có thể thay bởi ước lượng của
𝑛 2
̂2 = ∑𝑖=1 𝑒𝑖 .
nó là 𝜎
𝑛−𝑘
̂̂ ) = ∑𝑛𝑖=1 𝑒𝑖2 ×
Khi đó ước lượng của 𝑉𝑎𝑟(𝛽̂𝑗 ) là 𝑉𝑎𝑟(𝛽
1
× ∑𝑛
1
𝑗 𝑛−𝑘 1−𝑅𝑗2 ̅̅̅ 2
𝑖=1(𝑋𝑗𝑖 −𝑋𝑗 )
̂̂ ) là giá trị được cung cấp tại cột (Std. Error) trong kết quả hồi quy
và 𝑆𝑒(𝛽̂𝑗 ) = √𝑉𝑎𝑟(𝛽𝑗
sử dụng Eviews4, nó cho biết độ chính xác của ước lượng 𝛽̂𝑗 .
̂̂ ) có thể xác định các yếu tố ảnh hưởng đến độ chính xác của ước
Từ công thức của 𝑉𝑎𝑟(𝛽 𝑗
lượng.
2
ĐL 2.4. Khi các giả thiết CS1 – CS4 thỏa mãn thì các ước lượng OLS là ước lượng vững.
ĐL 2.5. Nếu trong định lý 2.4, giả thiết CS2 được thay bởi giả thiết sau:
(i) Cov(Xj, u) = 0 với j = 2, 3, …, k.
(ii) E(u) = 0
Thì ước lượng OLS vẫn là ước lượng vững.
ĐL 3.1. Khi các giả thiết CS1 – CS5 thỏa mãn thì ta có 𝛽̂𝑗 ~ 𝑁 (𝛽𝑗 , 𝑉𝑎𝑟(𝛽̂𝑗 )) , 𝑗 = 1, 2, … , 𝑘.
Từ đó suy ra 𝑎𝛽̂𝑗 + 𝑏𝛽̂𝑠 ~ 𝑁(𝑎𝛽𝑗 + 𝑏𝛽𝑠 , 𝑎2 𝑉𝑎𝑟(𝛽̂𝑗 ) + 𝑏2 𝑉𝑎𝑟(𝛽̂𝑠 ) + 2𝑎𝑏. 𝐶𝑜𝑣(𝛽̂𝑗 , 𝛽̂𝑠 ))
̂𝑗 −𝛽𝑗
𝛽
ĐL 3.2. Khi các giả thiết CS1 – CS5 thỏa mãn thì ta có 𝑡 = ̂𝑗 ) ~ 𝑇(𝑛 − 𝑘)
𝑆𝑒(𝛽
̂𝑗 +𝑏𝛽
(𝑎𝛽 ̂𝑠 )−(𝑎𝛽𝑗 +𝑏𝛽𝑠 )
Tương tự ĐL3.1: 𝑡 = ̂𝑗 +𝑏𝛽
̂𝑠 ) ~ 𝑇(𝑛 − 𝑘)
𝑆𝑒(𝑎𝛽
6. Bài toán ước lượng khoảng tin cậy của các tham số
VD: khi X tăng 1 đơn vị thì Y thay đổi (tăng/giảm) một lượng thuộc khoảng nào? → cần ước
lượng hệ số góc của biến X, dùng khoảng đối xứng
VD: khi X tăng 2 đơn vị đồng thời Z giảm 3 đơn vị thì Y thay đổi như thế nào/trong khoảng nào?
→ cần ước lượng một biểu thức của các hệ số (2βX – 3βZ), dùng khoảng đối xứng
- Tương tự như XSTK, khi câu hỏi là … thay đổi trong khoảng nào? … thay đổi như thế nào?
thì cần ước lượng.
- Dựa vào câu hỏi thì xem xét ước lượng tham số nào.
- Thông thường chỉ dùng khoảng đối xứng, một số trường hợp có thể ước lượng tối đa, tối thiểu.
Chú ý: khi hệ số hồi quy ước lượng (𝛽̂ ) âm và cần ước lượng 1 phía thì dùng khoảng tin cậy bên
trái hay bên phải cần phải thận trọng.
4
Công thức chung: giả sử cần ước lượng aβX + bβZ (viết βX nghĩa là hệ số góc của biến X)
Đặt: β = aβX + bβZ; tương ứng 𝛽̂ = 𝑎𝛽̂𝑋 + 𝑏𝛽̂𝑍
(𝑛−𝑘) (𝑛−𝑘)
Khoảng tin cậy đối xứng: 𝛽̂ − 𝑆𝑒(𝛽̂)𝑡𝛼 < 𝛽 < 𝛽̂ + 𝑆𝑒(𝛽̂)𝑡𝛼
2 2
(𝑛−𝑘)
Khoảng tin cậy bên trái: 𝛽̂ − 𝑆𝑒(𝛽̂ )𝑡𝛼 <𝛽
(𝑛−𝑘)
Khoảng tin cậy bên phải: 𝛽 < 𝛽̂ + 𝑠𝑒(𝛽̂)𝑡𝛼
5
𝑆𝑒(𝛽̂) = 𝑆𝑒(𝑎𝛽
̂𝑋 + 𝑏𝛽
̂𝑍 ) = √𝑎2 𝑆𝑒 2 (𝛽
̂𝑋 ) + 𝑏2 𝑆𝑒 2 (𝛽
̂𝑍 ) + 2𝑎𝑏. 𝐶𝑜𝑣(𝛽
̂𝑋 , 𝛽
̂𝑍 )
6
Một số dạng ràng buộc: (đọc để biết)
Xét mô hình (U): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝑢
• Dạng 1: 𝐻0 : 𝛽3 = 𝛽4 = 0 (𝑚 = 2)
Nếu 𝐻0 đúng thì thay 𝛽3 = 𝛽4 = 0 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 0𝑋3 + 0𝑋4 + 𝑢
→ Mô hình (𝑅): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝑢
• Dạng 2: 𝐻0 : 𝛽3 + 𝛽4 = 0 (𝑚 = 1)
Nếu 𝐻0 đúng thì thay 𝛽4 = −𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 − 𝛽3 𝑋4 + 𝑢
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑋 = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋 ∗ + 𝑢
∗
• Dạng 3: 𝐻0 : 𝛽3 + 𝛽4 = 1 (𝑚 = 1)
Nếu 𝐻0 đúng thì thay 𝛽4 = 1 − 𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + (1 − 𝛽3 )𝑋4 + 𝑢
𝑌 − 𝑋4 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑌 ∗ = 𝑌 − 𝑋4 ; 𝑋 ∗ = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 ∗ = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋 ∗ + 𝑢
Lưu ý: biến phụ thuộc thay đổi.
• Dạng 4: 𝐻0 : 𝛽2 = 2 và 𝛽3 + 𝛽4 = 1 (𝑚 = 2) (kiểm định Wald)
Nếu 𝐻0 đúng thì thay 𝛽2 = 2 và 𝛽4 = 1 − 𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 2𝑋2 + 𝛽3 𝑋3 + (1 − 𝛽3 )𝑋4 + 𝑢
𝑌 − 2𝑋2 − 𝑋4 = 𝛽1 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑌 = 𝑌 − 2𝑋2 − 𝑋4 ; 𝑋 = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 ∗ = 𝛽1 + 𝛽3 𝑋 ∗ + 𝑢
∗ ∗
8. Dự báo
a. Dự báo giá trị trung bình
̂1 + 𝛽
Khi X nhận X0 thì dự báo giá trị trung bình của Y là 𝑌̂0 = 𝛽 ̂2 𝑋0 (với KTL cơ bản chỉ xem
xét dự báo kiểu ước lượng điểm này).
VD: Khi TN = 100 (triệu) thì 𝐶𝑇 ̂0 = 𝛽̂1 + 𝛽̂2 𝑇𝑁0 = 30 + 0,6 ∗ 100 = 90, hiểu là ước lượng
chi tiêu trung bình của những người có mức thu nhập 100 triệu là 90 triệu.
Nếu thực tế quan sát được 1 người có thu nhập 100 triệu và chi tiêu hết 95 triệu. Khi đó phần
dư kí hiệu là 𝑒0 = 𝑌0 − 𝑌̂0 = 95 − 90 = 5 > 0, nghĩa là người này chi tiêu nhiều hơn (vì e0>
0) mức trung bình của những người cùng loại (tức là có cùng mức thu nhập 100 triệu) một
lượng là 5 triệu.
b. Sai số dự báo (xem slide)
Chúng ta xem xét sai số dự báo khi mục đích là dự báo. Có RMSE, MAE, MAPE để đánh giá,
tuy nhiên RMSE và MAE có đơn vị đo (trùng với đơn vị đo của Y) nên thường dùng MAPE
để đánh giá, mô hình có MAPE càng bé thì dùng cho mục đích dự báo càng tốt.
8
β2: cho biết sự khác nhau về hệ số chặn của 2 mô hình ứng với 2 nhóm, nếu các biến X3,…,Xk
nhận giá trị giống nhau thì trung bình của biến phụ thuộc của nhóm 1 cao hơn (hoặc thấp
hơn) nhóm còn lại β2 đơn vị.
c. MH có biến tương tác
Yi = β1 + β2D*X3 + β3X3i +….+ βkXki + ui
E(Y| X2i,…,Xki) = β1 + β2D*X3 + β3X3i +….+ βkXki
Với nhóm 1 (D=1): E(Y | X2i,…,Xki) = β1 + (β2 + β3)X3i +….+ βkXki
Với nhóm còn lại: (D=0): E(Y | X2i,…,Xki) = β1 + β3X3i +….+ βkXki
β2: khác nhau về hệ số góc của biến X3 trong 2 mô hình ứng với 2 nhóm, khi X3 tăng 1 đơn vị
thì trung bình của nhóm 1 tăng nhiều hơn (hoặc ít hơn) nhóm còn lại β3 đơn vị, điều kiện các
biến X4,..,Xk nhận giá trị giống nhau ở 2 nhóm.
Có thể đưa cả D và D*X vào mô hình khi nhận thấy có sự khác nhau cả hệ số chặn và hệ số
góc.
d. Với biến định tính có m phạm trù thì dùng (m-1) biến giả
Dj = 1 nếu quan sát thuộc nhóm thứ j và Dj = 0 nếu không thuộc nhóm j; j = 1, 2, …, m-1
Chú ý: Dựa vào ý nghĩa của hệ số góc ở phần b và phần c để xem xét khi nào thì thêm D, khi
nào thêm D*X. Các ước lượng, kiểm định T, kiểm định F liên quan đến biến giả hoàn toàn
tương tự như các biến khác.
10
CS5: sai số ngẫu nhiên pp chuẩn
Kết hợp các gt CS2, CS3, CS5 thì
(𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )~𝑁(0; 𝜎 2 ) ⇔ (𝑌𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )~𝑁(𝛽1 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 ; 𝜎 2 )
Nếu CS5 không được thỏa mãn thì các suy diễn dùng thống kê T, F có thể sai
Nếu n đủ lớn thì có thể bỏ qua giả thiết CS5 này
Phát hiện: Dùng kiểm định Jacque- Bera đối với phần dư e
H0: sai số ngẫu nhiên phân phối Chuẩn
H1: sai số ngẫu nhiên không phân phối Chuẩn
d. Vấn đề đa cộng tuyến cao: xảy ra với mô hình có từ 2 biến độc lập trở lên
• Nguyên nhân: Bản chất mối quan hệ giữa các hệ số
Mô hình dạng đa thức
Mẫu không mang tính đại diện
• Hậu quả: Sai số chuẩn SE lớn, kiểm định T kết luận hệ số không có ý nghĩa thống kê,
khoảng tin cậy cho hệ số góc trở nên rộng (có thể không hữu ích)
Kết luận của kiểm định T và F có thể mâu thuẫn
Dấu các ước lượng thay đổi, và sai (hậu quả này thường đi kèm P-value lớn)
Ước lượng hệ số không vững khi mẫu thay đổi
1
• Phát hiện: Sử dụng nhân tử phóng đại phương sai: 𝑉𝐼𝐹𝑗 = ≥ 10 ⇔ 𝑅𝑗2 ≥ 0,9
1−𝑅𝑗2
Sử dụng ma trận hệ số tương quan giữa các biến: 𝑐𝑜𝑟𝑟(𝑋𝑗 , 𝑋𝑠 ) ≥ 0,8 → ĐCT
cao
Khi nào cần kiểm tra ĐCT cao?
Khi P-value của các hệ số ước lượng đều nhỏ thì không cần kiểm tra
Khi P-value của một hệ số nào đó lớn, có thể do 2 nguyên nhân
+ Biến tương ứng thực sự không ảnh hưởng đến biến phụ thuộc
+ Do ĐCT cao → cần kiểm tra
• Khắc phục: Tăng kích thước mẫu
Đổi dạng hàm, đổi dạng biến (ví dụ dùng Y/L; K/L; …)
Nếu có khá nhiều biến có thể dùng phương pháp phân tích nhân tố
Bỏ bớt biến, trong nghiên cứu hạn chế bỏ biến.
e. Mô hình chứa biến không thích hợp (đọc slide, giáo trình)
11
Mô hình với số liệu chéo
1. Nhận biết + số liệu theo thời gian (điều tra nhiều thời điểm cách đều nhau)
+ một đối tượng tại nhiều thời điểm
VD cho số liệu 12 quan sát về chi tiêu và thu nhập của một hộ gia đình trong 12 tháng
Cho số liệu về xuất khẩu của VN theo quý từ năm 2000 đến 2019
Một số khái niệm/nội dung lý thuyết cần nhớ:
a. Biến trễ (lag) của biến Yt là Yt-1, Yt-2, … là các biến thời kì trước của Yt và trong kết quả hồi
quy viết là Y(-1), Y(-2), ….
b. Tự tương quan (TTQ): Chuỗi {Xt} gọi là có TTQ bậc p nếu Corr(Xt, Xt-p) ≠ 0 với p ≠ 0.
c. Yếu tố mùa vụ (season): chẳng hạn lượng bán chăn bông vào quý 4 (mùa đông) cao hơn các
quý khác. Mùa vụ là một yếu tố định tính chia 1 năm thành 4 mùa (4 quý). Để đưa yếu tố này
vào mô hình cần dùng 3 biến giả. Thường quy ước Si = 1 vào quý thứ i; Si = 0 vào quý khác
(i=1,2,3,4 nhưng chỉ dùng 3 biến giả). Với số liệu quý thì dễ dàng tạo biến mùa vụ trên phần
mềm.
d. Yếu tố xu thế (trend): nếu chuỗi số liệu có xu hướng tăng/giảm theo thời gian (VD GDP tăng
qua các năm, quý) thì gọi là có yếu tố xu thế. Biến xu thế trong phương trình có thể là t, t2,
log(t), nhưng phố biến nhất là dùng t. Nếu số liệu theo năm thì t = 1, 2, … ứng với năm thứ
nhất, năm thứ hai, …. Nếu số liệu theo quý thì t = 1, 2, …, 5, … ứng với quý thứ nhất, quý
thứ hai, …, quý thứ 5, …. Khi đọc/làm bài phải chú ý biến xu thế nhận từ 0 hay từ 1. Biến
@trend thường là nhận từ 0.
e. Dữ liệu có sự thay đổi cấu trúc: ví dụ cho dữ liệu
8
biến Xt theo tháng. Nhận thấy từ quan sát thứ 1 đến
quan sát thứ 11 giá trị Xt tăng, từ quan sát 12 đến 6
13
⇒ ⇒
𝐸 (𝑢 ) = 0 𝐸 ( 𝑢𝑡 ) = 0
{ {
𝐶𝑜𝑣(𝑋𝑗 , 𝑢) = 0; 𝑗 = 2,3 𝐶𝑜𝑣(𝑋𝑗𝑠 , 𝑢𝑡 ) = 0; 𝑗 = 2,3
CS3: Var(ui|X2i,X3i) = σ2 TS3: Var(ut|X2,X3) = σ2 TS3’: Var(ut|X2,X3) = σ2 CS3 < TS3’ = TS3
(mọi i) (mọi t) (mọi t)
CS4: Giữa các biến độc TS4: Giữa các biến độc lập TS4’: Giữa các biến độc Giống nhau
lập không có ĐCT hoàn không có ĐCT hoàn hảo lập không có ĐCT hoàn
hảo hảo
CS5: ui|X2i,X3i ~ N(‧ , ‧) TS5: ut|X2,X3 ~ N(‧ , ‧) CS5 < TS5
̂̂ ) là giá trị được cung cấp tại cột (Std. Error) trong kết quả hồi quy
và 𝑠𝑒(𝛽̂𝑗 ) = √𝑣𝑎𝑟(𝛽𝑗
sử dụng Eviews4, cho biết độ chính xác của ước lượng 𝛽̂𝑗 .
̂̂ ) xác định được các yếu tố ảnh hưởng đến độ chính xác của ước
Từ công thức của 𝑣𝑎𝑟(𝛽 𝑗
lượng.
ĐL 6.3: Khi các giả thiết TS1 – TS5 thỏa mãn thì ta có 𝛽̂𝑗 ~ 𝑁 (𝛽𝑗 , 𝑣𝑎𝑟(𝛽̂𝑗 )) , 𝑗 = 2, … , 𝑘.
Các bài toán ước lượng khoảng, kiểm định T, F làm như chương 3.
ĐL 6.4: Khi các giả thiết TS0’ – TS2’ thỏa mãn thì các ước lượng OLS là ước lượng vững.
ĐL 6.5: Khi các giả thiết TS0’ – TS4’ thỏa mãn thì các ước lượng OLS là tiệm cận hiệu quả
trong lớp các ước lượng tuyến tính và vững.
ĐL 6.6: Khi các giả thiết TS0’ – TS4’ thỏa mãn và kích thước mẫu đủ lớn thì các ước lượng
OLS có phân phối xấp xỉ Chuẩn, và khi đó các thống kê t, F có phân phối xấp xỉ Student và
Fisher tương ứng.
Giả thiết TS2 rất mạnh, khó thỏa mãn và thực tế thường dùng trường hợp mẫu lớn. Khi đó các
giả thiết TS2’, TS3’, TS4’ giống số liệu chéo nên cần kiểm tra thêm giả thiết TS0’ và TS1’.
15
Thông thường sẽ có thêm các biến Xt khác
Trường hợp có cả xu thế và mùa vụ: Yt = 1 + 2t + 2S2 + 3S3 + 4S4 + ut, khi t thay đổi thì
Sj nào đó cũng thay đổi nên không thể đọc riêng ý nghĩa của 2 và các j.
• Mô hình có biến thay đổi cấu trúc
VD: Yt = β1 + β2X2t + β3X3t + β4Dt + ut
D = 1 với thời kì đầu; D = 0 với thời kì sau
β4 cho biết lượng chênh lệch trung bình biến phụ thuộc ở 2 thời kì với điều kiện các biến khác
không đổi.
Có thể gặp mô hình có cả biến trễ của X, trễ của Y, xu thế, mùa vụ, thay đổi cấu trúc.
10. Kiểm định và lựa chọn mô hình
Tương tự số liệu chéo, trước tiên phải kiểm định sự phù hợp của mô hình. Sau đó sẽ lần lượt làm:
a. Kiểm tra tính dừng (gt TS0’): chỉ làm cho MH với biến thời gian, không phải phát hiện chuỗi
không dừng khi thi/KT, làm thực tế khi tiến hành nghiên cứu.
TS0’: các chuỗi Yt, Xjt đều là chuỗi dừng và phụ thuộc yếu.
Các chuỗi dừng thường phụ thuộc yếu nên chỉ cần kiểm tra tính dừng.
• Nguyên nhân: Bản chất các biến kinh tế.
• Hậu quả: Ảnh hưởng tính vững, tiệm cận hiệu quả của các ước lượng OLS (ĐL 6.4, 6.5)
• Phát hiện: có nhiều cách
Dùng đồ thị Xt theo t
Dùng kiểm định Augment Dickey – Fuller (ADF) (tự đọc chương 12 hoặc tài liệu thực
hành)
Một số kiểm định khác
• Khắc phục: dùng sai phân
b. Kì vọng của sai số ngẫu nhiên (SSNN) khác 0 (vi phạm gt TS2’): giống số liệu chéo
c. Phương sai sai số (PSSS) thay đổi (vi phạm gt TS3’): giống số liệu chéo
d. Sai số ngẫu nhiên có tự tương quan (vi phạm TS1=TS1’): chỉ làm cho MH với biến thời gian
TS1: SSNN không có tự tương quan, Cov(ut,us|X2,X3) = 0, t ≠ s
Nếu TS1 bị vi phạm thì nói mô hình có tự tương quan (TTQ) hoặc tương quan chuỗi
Trường hợp bậc 1, có thể viết: ut = 1ut – 1 + t; 1 0, t là nhiễu trắng
• Khi 1 > 0: tự tương quan bậc 1 dương
• Khi 1 < 0: tự tương quan bậc 1 âm
• Khi 1 = 0: không có tự tương quan bậc 1
Tổng quát đến bậc p:
ut = 1ut – 1 +…+ put – p +t
Hậu quả: Ước lượng hệ số OLS là không chệch và vững
Ước lượng phương sai, SE là chệch
Suy diễn thống kê có thể không đáng tin cậy
Phát hiện: Sử dụng đồ thị phần dự hoặc các kiểm định
• Kiểm định tự tương quan bậc 1:
o Các biến độc lập đều là ngoại sinh chặt:
16
✓ Hồi quy phụ trực tiếp: et = (α +) ρ1et-1 + εt, kiểm định ρ theo kiểm định T (hoặc F)
✓ kiểm định Durbin-Watson (DW): phải có hệ số chặn, chuối số là liên tục (không có
quan sát bị mất) và tất cả các biến độc lập là ngoại sinh chặt (không có biến trễ của
biến phụ thuộc). Kiểm định DW đáng tin khi các giả thiết khác đã được thỏa mãn.
n
(e − et −1 )2
DW = d = t =2 t
2(1 − ˆ 1 )
t =1 et2
n
(thường cho sẵn trong kết quả Eviews)
Với n, k ’ = k – 1, cho trước → dL , dU
Nếu 0 < DW < dL: có TTQ bậc 1 dương
Nếu dL < DW < dU: không có kết luận
Nếu dU < DW < 4-dU: không có TTQ
Nếu 4-dU < DW < 4-dL: không có kết luận
Nếu 4-dL < DW < 4: có TTQ bậc 1 âm
o Có biến độc lập không ngoại sinh chặt:
✓ Kiểm định BG: et = (1+ 2X2t + … +kXkt ) + 1et – 1 + vt
Nếu 1 0 thì MH gốc có TTQ bậc 1
✓ Có trễ của biến phụ thuộc: Durbin-h
Khi mô hình có trễ của biến phụ thuộc ở vế phải
Yt = 1 + 2X2t +… + k Xkt + Yt – 1 + ut
Dùng Durbin’s h khi 𝑉𝑎𝑟(𝜆̂) < 1/𝑛:
H0: Mô hình không có tự tương quan bậc 1
H1: Mô hình có tự tương quan bậc 1
𝑛 𝑑 𝑛
ℎ = 𝜌̂√ = (1 − ) √
1 − 𝑛𝑉𝑎𝑟(𝜆̂) 2 1 − 𝑛𝑉𝑎𝑟(𝜆̂)
18