You are on page 1of 18

KINH TẾ LƯỢNG 1

Trước tiên, khi nhận được 1 đề bài (1 vấn đề) các bạn cần xác định tổng thể là tập hợp nào, với kinh
tế lượng cơ bản thì cần xem xét số liệu theo không gian (số liệu chéo) hay theo thời gian (số liệu
chuỗi thời gian). Với giả định không có số liệu tổng thể và thường chỉ có đúng 1 mẫu thì các con số
(các kết quả ước lượng) đều gắn với mẫu. Với tổng thể chỉ có các kí hiệu.
• Với KTL1, biến phụ thuộc phải là biến định lượng. Xác định các biến độc lập, loại biến (định tính
hay định lượng).
• Lựa chọn dạng hàm phù hợp: nên theo lý thuyết hoặc các kết quả nghiên cứu khác gợi ý.
• (Thu thập dữ liệu), Kiểm tra số liệu và thực hiện hồi quy (sử dụng Excel, Eviews, Stata, R, …)
• Kiểm định sự phù hợp của mô hình. Kiểm tra các giả thiết OLS và khắc phục nếu cần.
• Tiến hành phân tích (ước lượng khoảng, kiểm định T, kiểm định F, …) và dự báo.

Mô hình với số liệu chéo


1. Nhận biết + số liệu theo không gian (điều tra ở nhiều nơi, hoặc nhiều người, …)
+ nhiều đối tượng tại cùng một thời điểm
VD cho số liệu về chi tiêu và thu nhập của 40 hộ gia đình vào năm 2018
Cho số liệu về xuất khẩu của 60 tỉnh quý I năm 2019

2. Các phương trình hồi quy


a. Tổng thể: Với i = 1, 2, …, N
MH HQ tổng thể (PRM): Y = β1 + β2X2 +….+ βkXk + u
Hàm HQ tổng thể (PRF): E(Y | X2,…,Xk) = β1 + β2X2 +….+ βkXk
Y là biến phụ thuộc; X2, X3, … là các biến độc lập
u là sai số ngẫu nhiên, bao gồm tất cả các yếu tố tác động đến Y ngoại trừ các Xj
β1 là hệ số chặn, cho biết giá trị trung bình của Y khi X2 = … = Xk = 0
β2, β3, … là các hệ số hồi quy riêng (hay các hệ số góc), cho biết khi biến Xj tăng 1 đơn vị thì
trung bình của Y thay đổi βj đơn vị trong điều kiện các yếu tố khác không đổi.
b. Mẫu : Với i = 1, 2, …, n
MH HQ mẫu (SRM): 𝑌𝑖 = 𝛽 ̂1 + 𝛽̂2 𝑋2𝑖 + ⋯ + 𝛽̂𝑘 𝑋𝑘𝑖 + 𝑒𝑖
Hàm HQ mẫu (SRF): 𝑌 ̂1 + 𝛽
̂𝑖 = 𝛽 ̂2 𝑋2𝑖 + ⋯ + 𝛽̂𝑘 𝑋𝑘𝑖
Trong đó 𝑌 ̂𝑖 là (hàm) ước lượng được của E(Y | X2i,…,Xki)
𝛽̂𝑗 gọi là hệ số hồi quy mẫu (hệ số hồi quy ước lượng, ước lượng OLS), là hàm ước lượng của
βj tương ứng
̂1 là hệ số chặn ước lượng, cho biết khi tất cả các biến độc lập đều bằng 0 thì ước lượng giá
𝛽
̂1 đơn vị
trị trung bình của biến phụ thuộc là 𝛽
𝛽̂𝑗 là hệ số góc ước lượng của biến Xj, cho biết khi Xj tăng 1 đơn vị và các yếu tố khác không
đổi thì ước lượng trung bình của biến phụ thuộc thay đổi (tăng/giảm) 𝛽̂𝑗 đơn vị.
̂𝑖 là phần dư, có thể hiểu là 𝑢̂𝑖 (ước lượng của ui)
𝑒𝑖 = 𝑌𝑖 − 𝑌

1
3. Phương pháp OLS (Ordinary Least Squares)
a. Các giả thiết của pp OLS với số liệu chéo (Cross Sectional Data – CS)
CS1: …mẫu là ngẫu nhiên
Đây là giả thiết quan trọng, ảnh hưởng đến tính không chệch, độ chính xác, tính vững của
ước lượng β̂j .
Với KTL1 coi như CS1 được thỏa mãn.
CS2: E(ui|X2i,…,Xki) = 0 (từ đó chứng minh được E(u) = 0 và Cov(Xj,u) = 0, mọi j)
Giả thiết CS2 ảnh hưởng đến tính không chệch của các ước lượng β̂j nên nó ảnh hưởng đến
cả mục đích phân tích và mục đích dự báo.
CS3: Var(ui|X2i,…,Xki) = σ2
Giả thiết CS3 ảnh hưởng đến độ chính xác của các ước lượng nên nó ảnh hưởng đến mục
đích phân tích.
CS4: MH không có đa cộng tuyến hoàn hảo
Mô hình được gọi là có đa cộng tuyến hoàn hảo nếu tồn tại các giá trị 𝛼𝑗 không đồng thời
bằng 0 thỏa mãn phương trình 𝛼1 + 𝛼2 𝑋2 + ⋯ + 𝛼𝑘 𝑋𝑘 = 0.
Trường hợp có ĐCT hoàn hảo thì sẽ tồn tại j (=2, …, k) mà khi hồi quy mô hình 𝑋𝑗 = 𝛼1 +
𝛼2 𝑋2 + ⋯ + 𝛼𝑗−1 𝑋𝑗−1 + 𝛼𝑗+1 𝑋𝑗+1 + ⋯ + 𝛼𝑘 𝑋𝑘 + 𝑣 sẽ thu được hệ số xác định 𝑅𝑗2 = 1.
Giả thiết CS4 được thỏa mãn thì mới tồn tại các công thức ước lượng β̂j . Tuy nhiên thực tế
thường giả thiết này không bị vi phạm và thưởng hay xem xét ĐCT cao (gần vi phạm CS4)
CS5: sai số ngẫu nhiên pp chuẩn
Đến chương 3 mới cần CS5, nghĩa là giả thiết này ảnh hưởng đến bài toán ước lượng
khoảng, kiểm định T, kiểm định F.
b. Ý tưởng: Tìm các 𝛽̂𝑗 sao cho tổng 𝑅𝑆𝑆 = ∑𝑛𝑖=1 𝑒𝑖2 = ∑𝑛𝑖=1(𝑌𝑖 − 𝛽
̂1 − 𝛽
̂2 𝑋2𝑖 − ⋯ − 𝛽
̂𝑘 𝑋𝑘𝑖 )2 đạt
nhỏ nhất. Có thể sử dụng ma trận để giải.
c. Các định lý quan trọng
ĐL Gauss – Markov: Khi các giả thiết CS1 – CS4 thỏa mãn thì các ước lượng thu được từ pp
OLS là BLUE (ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các
ước lượng tuyến tính không chệch)
𝜎2
̂ ̂
𝐸(𝛽𝑗 ) = 𝛽𝑗 ; 𝑉𝑎𝑟(𝛽𝑗 ) =
(1 − 𝑅𝑗2 ) ∑𝑛𝑖=1(𝑋𝑗𝑖 − 𝑋̅𝑗 )2
Do 𝜎 2 = 𝑉𝑎𝑟(𝑢𝑖 |𝑋2 , … , 𝑋𝑘 ) không tính trực tiếp được nên có thể thay bởi ước lượng của
𝑛 2
̂2 = ∑𝑖=1 𝑒𝑖 .
nó là 𝜎
𝑛−𝑘
̂̂ ) = ∑𝑛𝑖=1 𝑒𝑖2 ×
Khi đó ước lượng của 𝑉𝑎𝑟(𝛽̂𝑗 ) là 𝑉𝑎𝑟(𝛽
1
× ∑𝑛
1
𝑗 𝑛−𝑘 1−𝑅𝑗2 ̅̅̅ 2
𝑖=1(𝑋𝑗𝑖 −𝑋𝑗 )

̂̂ ) là giá trị được cung cấp tại cột (Std. Error) trong kết quả hồi quy
và 𝑆𝑒(𝛽̂𝑗 ) = √𝑉𝑎𝑟(𝛽𝑗

sử dụng Eviews4, nó cho biết độ chính xác của ước lượng 𝛽̂𝑗 .
̂̂ ) có thể xác định các yếu tố ảnh hưởng đến độ chính xác của ước
Từ công thức của 𝑉𝑎𝑟(𝛽 𝑗
lượng.
2
ĐL 2.4. Khi các giả thiết CS1 – CS4 thỏa mãn thì các ước lượng OLS là ước lượng vững.
ĐL 2.5. Nếu trong định lý 2.4, giả thiết CS2 được thay bởi giả thiết sau:
(i) Cov(Xj, u) = 0 với j = 2, 3, …, k.
(ii) E(u) = 0
Thì ước lượng OLS vẫn là ước lượng vững.
ĐL 3.1. Khi các giả thiết CS1 – CS5 thỏa mãn thì ta có 𝛽̂𝑗 ~ 𝑁 (𝛽𝑗 , 𝑉𝑎𝑟(𝛽̂𝑗 )) , 𝑗 = 1, 2, … , 𝑘.
Từ đó suy ra 𝑎𝛽̂𝑗 + 𝑏𝛽̂𝑠 ~ 𝑁(𝑎𝛽𝑗 + 𝑏𝛽𝑠 , 𝑎2 𝑉𝑎𝑟(𝛽̂𝑗 ) + 𝑏2 𝑉𝑎𝑟(𝛽̂𝑠 ) + 2𝑎𝑏. 𝐶𝑜𝑣(𝛽̂𝑗 , 𝛽̂𝑠 ))
̂𝑗 −𝛽𝑗
𝛽
ĐL 3.2. Khi các giả thiết CS1 – CS5 thỏa mãn thì ta có 𝑡 = ̂𝑗 ) ~ 𝑇(𝑛 − 𝑘)
𝑆𝑒(𝛽
̂𝑗 +𝑏𝛽
(𝑎𝛽 ̂𝑠 )−(𝑎𝛽𝑗 +𝑏𝛽𝑠 )
Tương tự ĐL3.1: 𝑡 = ̂𝑗 +𝑏𝛽
̂𝑠 ) ~ 𝑇(𝑛 − 𝑘)
𝑆𝑒(𝑎𝛽

4. Hệ số xác định và hệ số xác định hiệu chỉnh


a. Hệ số xác định (R-squared; R2)
Xét mô hình có hệ số chặn
𝐸𝑆𝑆 ∑(𝑌̂ −𝑌̅)2 𝑅𝑆𝑆
Công thức: 𝑅2 = = ∑(𝑌𝑖 ̅ )2
=1−
𝑇𝑆𝑆 𝑖 −𝑌 𝑇𝑆𝑆
Ý nghĩa: Sự thay đổi của các biến độc lập trong mô hình giải thích được R2*100% sự thay đổi
của biến phụ thuộc.
Chú ý:
+ 0 ≤ R2 ≤ 1 (MH có hệ số chặn)
+ Khi thêm biến vào mô hình thì R2 sẽ tăng lên (bất kể biến đó có thực sự ảnh hưởng đến biến
phụ thuộc hay không) nên khi so sánh 2 mô hình bao nhau (cùng biến phụ thuộc, các biến độc
lập của mô hình bé cũng là biến độc lập của mô hình lớn) thì R2 của mô hình lớn hơn sẽ lớn
hơn.
+ Có thể dùng R2 để so sánh các mô hình, điều kiện để sử dụng là: cùng biến phụ thuộc (cùng
là Y hoặc cùng là log(Y)); cùng số lượng biến độc lập; phải có hệ số chặn; phải ước lượng
trên cùng mẫu.
+ Nếu không có hệ số chặn thì công thức trên không đúng nữa.
b. Hệ số xác định hiệu chỉnh (Adjusted R-squared; ̅̅̅̅
𝑹𝟐 )
Công thức: 𝑅̅̅̅2̅ = 1 − (1 − 𝑅2 ) 𝑛−1
𝑛−𝑘
Hệ số xác định hiệu chỉnh là 1 trong các tiêu chí để xem xét xem có nên thêm biến độc lập vào
mô hình hay không. Điều kiện dùng là cùng biến phụ thuộc; trên cùng một mẫu; mô hình ít
biến nằm trong mô hình nhiều biến. Nếu thêm biến mà 𝑅 ̅̅̅2̅ tăng lên thì nên thêm biến.

5. Một số dạng hàm hồi quy


Chỉ xét mô hình 2 biến, khi xét tác động của X lên Y thì coi như các yếu tố khác không đổi
a. Dạng lin-lin
𝑑𝑌
Hàm HQ tổng thể: Y = β1 + β2X + u; 𝛽2 = ⇒ 𝑑𝑌 = 𝛽2 . 𝑑𝑋
𝑑𝑋
β2 cho biết khi X tăng 1 đơn vị (nghĩa là dX = +1) thì trung bình của Y thay đổi β2 đơn vị.
3
b. Dạng lin-log
𝑑𝑌 𝑑𝑌 𝑑𝑋
Hàm HQ tổng thể: Y = β1 + β2.log(X) + u; 𝛽2 = = → 𝑑𝑌 = 𝛽2
𝑑𝑙𝑜𝑔(𝑋) 𝑑𝑋/𝑋 𝑋
(Khi (dX / X) = 0,01 nghĩa là X thay đổi 1% )
β2 cho biết khi X tăng 1% thì trung bình của Y thay đổi β2.0,01 (= β2 /100) đơn vị.
c. Dạng log-lin
𝑑log (𝑌) 𝑑𝑌
Hàm HQ tổng thể: log(Y) = β1 + β2X + u; 𝛽2 = → 𝑑𝑙𝑜𝑔(𝑌) = = 𝛽2 . 𝑑𝑋
𝑑𝑋 𝑌
𝑑𝑌
β2 cho biết khi X tăng 1 đơn vị thì trung bình của Y thay đổi β2*100 % (nghĩa là = 𝛽2 . 1)
𝑌
d. Dạng log-log
𝑑𝑌 𝑑𝑋
Hàm HQ tổng thể: log(Y) = β1 + β2.log(X) + u; = 𝛽2
𝑌 𝑋
β2 cho biết khi X tăng 1% thì trung bình của Y thay đổi β2%
Trong trường hợp này β2 còn gọi là hệ số co giãn của Y theo X
e. Dạng đa thức
𝑑𝑌 𝑑2 𝑌
Dạng bậc 2: Y = β1 + β2X + β3X2 + u; = 𝛽2 + 2𝛽3 𝑋; = 2𝛽3
𝑑𝑋 𝑑𝑋 2
Khi β2 > 0 và β3 < 0 thì có thể nói ban đầu khi X tăng thì trung bình của Y tăng lên, đến khi X
𝛽2
đạt giá trị (− ) thì X tiếp tục tăng sẽ làm cho trung bình của Y giảm. Cũng có thể nói khi X
2𝛽3
tăng thì Y tăng nhưng tốc độ tăng giảm dần, thỏa mãn cận biên giảm dần.
Các trường hợp khác tương tự.
𝑑𝑌 1
Dạng nghịch đảo: Y = β1 + β2 /X + u; = −𝛽2
𝑑𝑋 𝑋2
(có lý thuyết hỗ trợ mới dùng dạng này)
𝜕𝑌
Dạng có tích chéo: Y = β1 + β2X + β3Z + β4X*Z + u; = 𝛽2 + 𝛽4 𝑍
𝜕𝑋
Khi xét tác động của X lên Y cần xác định Z đang nhận giá trị nào.
3 dạng trên đều có đạo hàm là 1 hàm số nên việc chỉ nói X tăng 1 đơn vị thì trung bình biến
phụ thuộc thay đổi bao nhiêu đơn vị không có ý nghĩa và thường không xem xét.
Dạng thường dùng nhất (trong 3 dạng) là dạng đa thức bậc 2.

6. Bài toán ước lượng khoảng tin cậy của các tham số
VD: khi X tăng 1 đơn vị thì Y thay đổi (tăng/giảm) một lượng thuộc khoảng nào? → cần ước
lượng hệ số góc của biến X, dùng khoảng đối xứng
VD: khi X tăng 2 đơn vị đồng thời Z giảm 3 đơn vị thì Y thay đổi như thế nào/trong khoảng nào?
→ cần ước lượng một biểu thức của các hệ số (2βX – 3βZ), dùng khoảng đối xứng
- Tương tự như XSTK, khi câu hỏi là … thay đổi trong khoảng nào? … thay đổi như thế nào?
thì cần ước lượng.
- Dựa vào câu hỏi thì xem xét ước lượng tham số nào.
- Thông thường chỉ dùng khoảng đối xứng, một số trường hợp có thể ước lượng tối đa, tối thiểu.
Chú ý: khi hệ số hồi quy ước lượng (𝛽̂ ) âm và cần ước lượng 1 phía thì dùng khoảng tin cậy bên
trái hay bên phải cần phải thận trọng.

4
Công thức chung: giả sử cần ước lượng aβX + bβZ (viết βX nghĩa là hệ số góc của biến X)
Đặt: β = aβX + bβZ; tương ứng 𝛽̂ = 𝑎𝛽̂𝑋 + 𝑏𝛽̂𝑍
(𝑛−𝑘) (𝑛−𝑘)
Khoảng tin cậy đối xứng: 𝛽̂ − 𝑆𝑒(𝛽̂)𝑡𝛼 < 𝛽 < 𝛽̂ + 𝑆𝑒(𝛽̂)𝑡𝛼
2 2
(𝑛−𝑘)
Khoảng tin cậy bên trái: 𝛽̂ − 𝑆𝑒(𝛽̂ )𝑡𝛼 <𝛽
(𝑛−𝑘)
Khoảng tin cậy bên phải: 𝛽 < 𝛽̂ + 𝑠𝑒(𝛽̂)𝑡𝛼

Trong đó : 𝑆𝑒(𝛽̂ ) = 𝑆𝑒(𝑎𝛽


̂𝑋 + 𝑏𝛽
̂𝑍 ) = √𝑎2 𝑆𝑒 2 (𝛽
̂𝑋 ) + 𝑏2 𝑆𝑒 2 (𝛽
̂𝑍 ) + 2𝑎𝑏. 𝐶𝑜𝑣(𝛽
̂𝑋 , 𝛽
̂𝑍 )

Nếu chỉ ước lượng 1 tham số thì a = 1; b = 0


Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy
Theo công thức ước lượng 𝛽𝑗 độ dài khoảng tin cậy của tham số 𝛽𝑗 là

(𝑛−𝑘) (𝑛−𝑘) 𝑅𝑆𝑆


𝐼 = 2𝑡𝛼 𝑆𝑒(𝛽̂𝑗 ) = 2𝑡𝛼 √ (𝑗 = 2, 3, … , 𝑘)
2 2 (𝑛 − 𝑘)(1 − 𝑅𝑗2 ) ∑𝑛𝑖=1 𝑥𝑗𝑖2
Độ dài khoảng tin cậy phụ thuộc vào các yếu tố sau:
• Kích thước mẫu (n): n tăng làm cho độ dài khoảng tin cậy giảm, độ chính xác của ước lượng
tăng.
• Số tham số cần ước lượng (k): k tăng làm độ dài khoảng tin cậy tăng hay độ chính xác sủa ước
lượng giảm xuống.
• Độ tin cậy (1 − 𝛼): độ tin cậy tăng làm độ dài khoảng tin cậy tăng lên, nghĩa là độ chính xác
của ước lượng giảm xuống.
• Mối tương quan tuyến tính giữa 𝑋𝑗 và các biến độc lập còn lại của mô hình: khi mối tương
quan này càng chặt thì 𝑅𝑗2 càng lớn, 𝑆𝑒(𝛽̂𝑗 ) càng lớn làm cho độ dài khoảng tin cậy càng lớn,
nghĩa là độ chính xác của ước lượng giảm.
2
• ∑𝑛𝑖=1 𝑥𝑗𝑖2 = ∑𝑛𝑖=1(𝑋𝑗𝑖 − 𝑋̅𝑗 ) càng lớn thì độ dài khoảng tin cậy càng nhỏ. ∑𝑛𝑖=1 𝑥𝑗𝑖2 tăng khi các
giá trị quan sát được 𝑋𝑗𝑖 càng khác biệt.

7. Bài toán kiểm định giả thuyết về các hệ số hồi quy


a. Kiểm định T – một ràng buộc
VD: Khi X tăng thì Y có thực sự tăng không? → cần kiểm định hệ số góc của biến X dương (βX >
0)
VD: Phải chăng khi X tăng 2 đơn vị đồng thời Z giảm 3 đơn vị thì Y giảm đúng 1 đơn vị hay
không? → cần kiểm định một biểu thức các hệ số (2βX – 3βZ = - 1)
- Tương tự như XSTK, khi câu hỏi yêu cầu phải trả lời đúng hay sai, có hay không, … thì cần
kiểm định
- Dựa vào câu hỏi thì xem xét kiểm định tham số nào, so sánh với hằng số nào.
- Phát biểu có dấu bằng (=, ≥, ≤) là giả thuyết H0; phát biểu không có dấu bằng (≠,>,<) là H1
Công thức chung: giả sử cần kiểm định aβX + bβZ so với c
Đặt: β = aβX + bβZ; tương ứng 𝛽̂ = 𝑎𝛽 ̂𝑋 + 𝑏𝛽̂𝑍

5
𝑆𝑒(𝛽̂) = 𝑆𝑒(𝑎𝛽
̂𝑋 + 𝑏𝛽
̂𝑍 ) = √𝑎2 𝑆𝑒 2 (𝛽
̂𝑋 ) + 𝑏2 𝑆𝑒 2 (𝛽
̂𝑍 ) + 2𝑎𝑏. 𝐶𝑜𝑣(𝛽
̂𝑋 , 𝛽
̂𝑍 )

Cặp giả thuyết H0 H1 Tiêu chuẩn KĐ Bác bỏ H0 nếu


Hai phía aβX + bβZ = c aβX + bβZ ≠ c 𝛽̂ − 𝑐 |tqs| > tα/2(n-k)
𝑡=
Một phía aβX + bβZ ≥ c aβX + bβZ < c 𝑆𝑒(𝛽̂) tqs < - tα(n-k)
aβX + bβZ ≤ c aβX + bβZ > c tqs > tα(n-k)
Nếu chỉ kiểm định một tham số thì a = 1 ; b = 0
Đặc biệt: Cột 5 trên bảng kết quả Eviews4 cung cấp giá trị P-value của cặp giả thuyết
H0 : βj = 0; H1: βj ≠ 0
(Giả sử có P-value = pj là một số thuộc khoảng 0 đến 1)
+ Nếu pj < α thì bác bỏ H0, nghĩa là trên tổng thể có thể nói βj ≠ 0 ; cũng có thể kết luận (trên
mẫu) 𝛽̂𝑗 có ý nghĩa thống kê.
+ Nếu đã kết luận βj ≠ 0 mà thấy 𝛽̂𝑗 > 0 thì có thể cho rằng βj > 0
+ Tương tự như XSTK khi 𝛽̂𝑗 > 0, P-value của cặp H0 : βj ≤ 0; H1: βj > 0 là pj/2 (hạn chế
dùng cách này)
+ Khi kiểm định một phía thì nên dùng Tqs
b. KĐ F - nhiều ràng buộc
Các bước của kiểm định F: (tổng quát, đọc để biết)
Xét mô hình hồi quy gốc:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑢
gọi là mô hình không có ràng buộc (U: unrestricted)
• Bước 1: Thiết lập cặp giả thuyết thống kê gồm 𝑚 (𝑚 ≥ 1) ràng buộc cùng lúc.
𝐻 : 𝑚 ràng buộc đều đúng
{ 0
𝐻1 : có ít nhất 1 ràng buộc sai
• Bước 2: Xác định mô hình có ràng buộc (R: restricted) bằng cách giả định cả 𝑚 ràng buộc cùng
xảy ra, thay vào (U) sẽ làm cho số các hệ số của (U) giảm xuống (xem một số dạng ràng buộc).
Ước lượng mô hình (U) thu được tổng bình phương phần dư là 𝑅𝑆𝑆(𝑈), làm tương tự với mô hình
(R) thu được 𝑅𝑆𝑆(𝑅).
• Bước 3: Tính giá trị quan sát của thống kê kiểm định F theo công thức:
[𝑅𝑆𝑆(𝑅) − 𝑅𝑆𝑆(𝑈)]/𝑚
𝐹=
𝑅𝑆𝑆(𝑈)/(𝑛 − 𝑘𝑈 )
trong đó 𝑚 là số ràng buộc, 𝑛 là kích thước mẫu và 𝑘𝑈 là số tham số cần ước lượng của mô hình
(U).
Khi các giả thiết 1 – 5 đúng thì 𝐹 ~ 𝐹(𝑚, 𝑛 − 𝑘𝑈 ).
• Bước 4: Nếu 𝐹𝑞𝑠 > 𝑓𝛼 (𝑚, 𝑛 − 𝑘𝑈 ) thì bác bỏ giả thuyết 𝐻0 . Nếu ngược lại thì chưa bác bỏ 𝐻0 .
Có thể kết luận dựa vào 𝑃 − value = 𝑃[𝐹(𝑚, 𝑛 − 𝑘𝑈 ) > 𝐹𝑞𝑠 ] nếu trong kết quả ước lượng cho sẵn
giá trị này.
Có thể dùng kiểm định F để:
• Kiểm định bớt biến: (U) là mô hình trước khi bớt, (R) là mô hình sau khi bớt.
• Kiểm định thêm biến: (R) là mô hình trước khi thêm, (U) là mô hình sau khi thêm.
• Kiểm định các đẳng thức bậc nhất của các hệ số hồi quy.

6
Một số dạng ràng buộc: (đọc để biết)
Xét mô hình (U): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + 𝛽4 𝑋4 + 𝑢
• Dạng 1: 𝐻0 : 𝛽3 = 𝛽4 = 0 (𝑚 = 2)
Nếu 𝐻0 đúng thì thay 𝛽3 = 𝛽4 = 0 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 0𝑋3 + 0𝑋4 + 𝑢
→ Mô hình (𝑅): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝑢
• Dạng 2: 𝐻0 : 𝛽3 + 𝛽4 = 0 (𝑚 = 1)
Nếu 𝐻0 đúng thì thay 𝛽4 = −𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 − 𝛽3 𝑋4 + 𝑢
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑋 = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋 ∗ + 𝑢

• Dạng 3: 𝐻0 : 𝛽3 + 𝛽4 = 1 (𝑚 = 1)
Nếu 𝐻0 đúng thì thay 𝛽4 = 1 − 𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋3 + (1 − 𝛽3 )𝑋4 + 𝑢
𝑌 − 𝑋4 = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑌 ∗ = 𝑌 − 𝑋4 ; 𝑋 ∗ = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 ∗ = 𝛽1 + 𝛽2 𝑋2 + 𝛽3 𝑋 ∗ + 𝑢
Lưu ý: biến phụ thuộc thay đổi.
• Dạng 4: 𝐻0 : 𝛽2 = 2 và 𝛽3 + 𝛽4 = 1 (𝑚 = 2) (kiểm định Wald)
Nếu 𝐻0 đúng thì thay 𝛽2 = 2 và 𝛽4 = 1 − 𝛽3 vào mô hình (U) ta có:
𝑌 = 𝛽1 + 2𝑋2 + 𝛽3 𝑋3 + (1 − 𝛽3 )𝑋4 + 𝑢
𝑌 − 2𝑋2 − 𝑋4 = 𝛽1 + 𝛽3 (𝑋3 − 𝑋4 ) + 𝑢
Đặt 𝑌 = 𝑌 − 2𝑋2 − 𝑋4 ; 𝑋 = 𝑋3 − 𝑋4 → Mô hình (𝑅): 𝑌 ∗ = 𝛽1 + 𝛽3 𝑋 ∗ + 𝑢
∗ ∗

Kiểm định F – thêm/bớt biến: (cần thuộc)


• MH (U): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘−𝑚 𝑋𝑘−𝑚 + 𝛽𝑘−𝑚+1 𝑋𝑘−𝑚+1 + ⋯ + 𝛽𝑘 𝑋𝑘 + 𝑢
• Ràng buộc: 𝛽𝑘−𝑚+𝟏 = ⋯ = 𝛽𝑘 = 0
• MH (R): 𝑌 = 𝛽1 + 𝛽2 𝑋2 + ⋯ + 𝛽𝑘−𝑚−1 𝑋𝑘−𝑚−1 + 𝑣
• 𝐻0 : 𝛽𝑘−𝑚+1 = ⋯ = 𝛽𝑘 = 0
2
𝐻1 : 𝛽𝑘−𝑚+1 + ⋯ + 𝛽𝑘2 > 0
2
Chú ý do 𝛽𝑘−𝑚+1 + ⋯ + 𝛽𝑘2 ≥ 0 nên viết 𝛽𝑘−𝑚+1
2
+ ⋯ + 𝛽𝑘2 > 0 và 𝛽𝑘−𝑚+1
2
+ ⋯ + 𝛽𝑘2 ≠ 0 là
giống nhau.
(𝑅𝑆𝑆𝑅 −𝑅𝑆𝑆𝑈 )/𝑚
• Thống kê F: 𝐹= 𝑅𝑆𝑆𝑈 /(𝑛−𝑘𝑈 )
Do mô hình (U) và mô hình (R) có cùng biến phụ thuộc nên có thể chứng minh
(𝑅𝑈2 − 𝑅𝑅2 )/𝑚
F=
(1 − 𝑅𝑈2 )/(𝑛 − 𝑘𝑈 )
• Nếu 𝐹𝑞𝑠 > 𝑓𝛼 (𝑚, 𝑛 − 𝑘𝑈 ) thì bác bỏ 𝐻0 .
So sánh:
• Kiểm định T chỉ kiểm định được 1 ràng buộc (H0 chỉ có 1 biểu thức), nhưng có thể kiểm
định 𝐻1 có dấu khác, lớn hơn, nhỏ hơn đều có thể thực hiện.
• Kiểm định F kiểm định đồng thời nhiều ràng buộc (H0 có nhiều biểu thức), tuy nhiên chỉ
có thể kiểm định cho 𝐻1 ứng với dấu khác.
Đặc biệt: KĐ sự phù hợp của hàm hồi quy (chính là kiểm định F với (k-1) ràng buộc)
H0 : β2 = β3 = ... = βk = 0 (hay R2 = 0 hay mô hình không phù hợp)
7
H1 : 𝛽22 + 𝛽32 + ⋯ + 𝛽𝑘2 > 0 (hay R2 > 0 hay mô hình phù hợp)
MH không ràng buộc: Y = β1 + β2X2 + ... + βkXk + u (U – unrestricted)
MH có ràng buộc (H0 đúng): Y = β1 + u (R – restricted)
𝑅2 /(𝑘−1)
Tiêu chuẩn kiểm định: 𝐹 =
(1−𝑅2 )/(𝑛−𝑘)
Nếu Fqs > fα(k-1, n-k) thì bác bỏ H0, nghĩa là MH phù hợp
Đây là kiểm định quan trọng nhất khi xem xét mô hình có phù hợp để phân tích hay không.

8. Dự báo
a. Dự báo giá trị trung bình
̂1 + 𝛽
Khi X nhận X0 thì dự báo giá trị trung bình của Y là 𝑌̂0 = 𝛽 ̂2 𝑋0 (với KTL cơ bản chỉ xem
xét dự báo kiểu ước lượng điểm này).
VD: Khi TN = 100 (triệu) thì 𝐶𝑇 ̂0 = 𝛽̂1 + 𝛽̂2 𝑇𝑁0 = 30 + 0,6 ∗ 100 = 90, hiểu là ước lượng
chi tiêu trung bình của những người có mức thu nhập 100 triệu là 90 triệu.
Nếu thực tế quan sát được 1 người có thu nhập 100 triệu và chi tiêu hết 95 triệu. Khi đó phần
dư kí hiệu là 𝑒0 = 𝑌0 − 𝑌̂0 = 95 − 90 = 5 > 0, nghĩa là người này chi tiêu nhiều hơn (vì e0>
0) mức trung bình của những người cùng loại (tức là có cùng mức thu nhập 100 triệu) một
lượng là 5 triệu.
b. Sai số dự báo (xem slide)
Chúng ta xem xét sai số dự báo khi mục đích là dự báo. Có RMSE, MAE, MAPE để đánh giá,
tuy nhiên RMSE và MAE có đơn vị đo (trùng với đơn vị đo của Y) nên thường dùng MAPE
để đánh giá, mô hình có MAPE càng bé thì dùng cho mục đích dự báo càng tốt.

9. Mô hình hồi quy với biến định tính


a. Biến định tính và biến giả
Biến định tính: là biến chia tập hợp (tổng thể, mẫu) thành các nhóm, không có đơn vị đo
lường.
Ví dụ: Giới tính của một người VN có thể là nam hoặc nữ
Quê quán có thể ở miền Bắc, miền Trung, miền Nam.
Size quần áo có thể là XS, S, M, L, XL, …
Để đưa biến định tính vào mô hình hồi quy thì phải sử dụng biến giả.
Biến giả (dummy): là biến số chỉ nhận 2 giá trị là 0 và 1. Hai số 0 và 1 chỉ dùng để chia
nhóm, không dùng để so sánh hay tính toán. Kí hiệu,
1 ứng với nhóm 1
𝐷={
0 ứng với nhóm còn lại
b. MH có biến giả
Yi = β1 + β2D + β3X3i +….+ βkXki + ui
E(Y | X2i,…,Xki) = β1 + β2D + β3X3i +….+ βkXki
Với nhóm 1 (D = 1): E(Y | X2i,…,Xki) = β1 + β2 + β3X3i +….+ βkXki
Với nhóm còn lại: (D = 0): E(Y | X2i,…,Xki) = β1 + β3X3i +….+ βkXki

8
β2: cho biết sự khác nhau về hệ số chặn của 2 mô hình ứng với 2 nhóm, nếu các biến X3,…,Xk
nhận giá trị giống nhau thì trung bình của biến phụ thuộc của nhóm 1 cao hơn (hoặc thấp
hơn) nhóm còn lại β2 đơn vị.
c. MH có biến tương tác
Yi = β1 + β2D*X3 + β3X3i +….+ βkXki + ui
E(Y| X2i,…,Xki) = β1 + β2D*X3 + β3X3i +….+ βkXki
Với nhóm 1 (D=1): E(Y | X2i,…,Xki) = β1 + (β2 + β3)X3i +….+ βkXki
Với nhóm còn lại: (D=0): E(Y | X2i,…,Xki) = β1 + β3X3i +….+ βkXki
β2: khác nhau về hệ số góc của biến X3 trong 2 mô hình ứng với 2 nhóm, khi X3 tăng 1 đơn vị
thì trung bình của nhóm 1 tăng nhiều hơn (hoặc ít hơn) nhóm còn lại β3 đơn vị, điều kiện các
biến X4,..,Xk nhận giá trị giống nhau ở 2 nhóm.
Có thể đưa cả D và D*X vào mô hình khi nhận thấy có sự khác nhau cả hệ số chặn và hệ số
góc.
d. Với biến định tính có m phạm trù thì dùng (m-1) biến giả
Dj = 1 nếu quan sát thuộc nhóm thứ j và Dj = 0 nếu không thuộc nhóm j; j = 1, 2, …, m-1
Chú ý: Dựa vào ý nghĩa của hệ số góc ở phần b và phần c để xem xét khi nào thì thêm D, khi
nào thêm D*X. Các ước lượng, kiểm định T, kiểm định F liên quan đến biến giả hoàn toàn
tương tự như các biến khác.

10. Kiểm định và lựa chọn mô hình


Trong mục 4a đã đề cập đến các giả thiết của phương pháp OLS. Với số liệu chéo thì CS1 coi
như luôn thỏa mãn. Nếu vi phạm CS4 thì không có các công thức ước lượng nên coi như CS4
cũng được thỏa mãn. Chúng ta sẽ xem xét lần lượt vi phạm CS2, CS3, CS5, gần vi phạm CS4
(gọi là đa cộng tuyến cao) và mô hình chứa biến không cần thiết. Trước khi xem xét vi phạm giả
thiết thì thực hiện kiểm định F về sự phù hợp của mô hình (mục 7b).
a. Kì vọng của sai số ngẫu nhiên (SSNN) khác 0 (vi phạm gt2-OLS)
CS2: E(ui|X2i,…,Xki) = 0 (từ đó chứng minh được E(u) = 0 và Cov(Xj,u) = 0, mọi j = 2, 3, …,
k)
• Nguyên nhân: Mô hình thiếu biến quan trọng
Dạng hàm sai
Tính tác động đồng thời của số liệu
Sai số đo lường của các biến độc lập
• Hậu quả: Ước lượng OLS là ước lượng chệch
Các suy diễn không đáng tin cậy
• Phát hiện:
Thiếu 1 biến: dùng kđ T hoặc kđ F (điều kiện: có sẵn số liệu)
Thiếu nhiều biến đồng thời: dùng kđ F (điều kiện: có sẵn số liệu)
KĐ Ramsey
B1: ƯL MH gốc Yi = β1 + β2X2i +….+ βkXki + ui và lưu chuỗi giá trị tương hợp là 𝑌̂
B2: ƯL MH phụ Yi = β1 + β2X2i +….+ βkXki + 𝛼1 𝑌̂ 2 + 𝛼2 𝑌̂ 3 + ⋯ + 𝛼𝑚 𝑌̂ 𝑚+1 + vi
(thường chỉ dùng α1, α2)
9
B3: Kiểm định cặp giả thuyết sau theo kiểm định F
H0 : α 1 = … = α m = 0 (MH gốc không bị thiếu biến hoặc dạng hàm sai)
2 2
H1: 𝛼1 + ⋯ + 𝛼𝑚 ≠ 0 (MH gốc bị thiếu biến hoặc dạng hàm sai)
Có thể dùng P-value để kết luận.
• Khắc phục: Thay đổi dạng hàm sang log-log, lin-log, log-lin, …
Thêm biến X2, X3, … hoặc thêm biến Z nếu có sẵn số liệu.
b. Phương sai sai số (PSSS) thay đổi (vi phạm gt3-OLS)
CS3: Var(ui|X2i,…,Xki) = σ2
• Nguyên nhân: Mô hình thiếu biến quan trọng hoặc dạng hàm sai
Do bản chất số liệu
• Hậu quả: Phương sai của ước lượng hệ số là chệch
Các ước lượng OLS không còn là ước lượng hiệu quả, không phải tốt nhất
Sai số chuẩn SE là chệch , khoảng tin cậy, kiểm định T có thể sai
• Phát hiện:
Giả sử không vi phạm giả thiết CS2, khi đó
𝑉𝑎𝑟(𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 ) = 𝐸 (𝑢𝑖2 |𝑋2𝑖 , … , 𝑋𝑘𝑖 ) − [𝐸 (𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )]2 = 𝐸 (𝑢𝑖2 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )
Do không có được số liệu về ui nên sẽ dùng ei. Theo công thức trên thì việc phát hiện vi
phạm CS3 (với điều kiện không vi phạm CS2) sẽ dùng 𝑒𝑖2 hoặc |ei|. Có các cách sau:
o Dùng đồ thị phần dư: vẽ đồ thị của 𝑒𝑖2 theo các biến Xj
o Thực hiện hồi quy phụ 𝑒𝑖2 theo các biến độc lập, nếu mô hình hồi quy phụ phù hợp thì
mô hình gốc có PSSS thay đổi. Giả sử có 2 biến độc lập là X2, X3.
KĐ BP
B1: ƯL MH gốc Yi = β1 + β2X2i + β3X3i + ui và lưu chuỗi phần dư là e
B2: ƯL MH phụ ei2 = α1 + α2X2i + α3X3i + vi
B3: Kiểm định cặp giả thuyết sau theo kiểm định F
H0 : α 2 = α 3 = 0 (MH gốc có PSSS đồng đều)
H1: 𝛼22 + 𝛼32 ≠ 0 (MH gốc bị PSSS thay đổi)
Có thể dùng phương pháp P-value
KĐ White
B1: ƯL MH gốc Yi = β1 + β2X2i + β3X3i + ui và lưu chuỗi phần dư là e
2 2
B2: ƯL MH phụ ei2 = α1 + α2X2i + α3X3i + 𝛼4 𝑋2𝑖 + 𝛼5 𝑋3𝑖 + 𝛼6 𝑋2𝑖 𝑋3𝑖 + vi
(Nếu không dùng α6 thì là White không tích chéo, nếu có dùng α6 thì là White có tích
chéo)
B3: Kiểm định cặp giả thuyết sau theo kiểm định F
H0 : α 2 = … = α 6 = 0 (MH gốc có PSSS đồng đều)
2 2
H1: 𝛼2 + ⋯ + 𝛼6 ≠ 0 (MH gốc bị PSSS thay đổi)
Có thể dùng phương pháp P-value
• Khắc phục: Phương pháp bình phương nhỏ nhất tổng quát GLS (slide)
Ước lượng sai số chuẩn (thực hành)
c. Sai số ngẫu nhiên không pp chuẩn (vi phạm gt5-OLS)

10
CS5: sai số ngẫu nhiên pp chuẩn
Kết hợp các gt CS2, CS3, CS5 thì
(𝑢𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )~𝑁(0; 𝜎 2 ) ⇔ (𝑌𝑖 |𝑋2𝑖 , … , 𝑋𝑘𝑖 )~𝑁(𝛽1 + 𝛽2 𝑋2𝑖 + ⋯ + 𝛽𝑘 𝑋𝑘𝑖 ; 𝜎 2 )
Nếu CS5 không được thỏa mãn thì các suy diễn dùng thống kê T, F có thể sai
Nếu n đủ lớn thì có thể bỏ qua giả thiết CS5 này
Phát hiện: Dùng kiểm định Jacque- Bera đối với phần dư e
H0: sai số ngẫu nhiên phân phối Chuẩn
H1: sai số ngẫu nhiên không phân phối Chuẩn
d. Vấn đề đa cộng tuyến cao: xảy ra với mô hình có từ 2 biến độc lập trở lên
• Nguyên nhân: Bản chất mối quan hệ giữa các hệ số
Mô hình dạng đa thức
Mẫu không mang tính đại diện
• Hậu quả: Sai số chuẩn SE lớn, kiểm định T kết luận hệ số không có ý nghĩa thống kê,
khoảng tin cậy cho hệ số góc trở nên rộng (có thể không hữu ích)
Kết luận của kiểm định T và F có thể mâu thuẫn
Dấu các ước lượng thay đổi, và sai (hậu quả này thường đi kèm P-value lớn)
Ước lượng hệ số không vững khi mẫu thay đổi
1
• Phát hiện: Sử dụng nhân tử phóng đại phương sai: 𝑉𝐼𝐹𝑗 = ≥ 10 ⇔ 𝑅𝑗2 ≥ 0,9
1−𝑅𝑗2

Sử dụng ma trận hệ số tương quan giữa các biến: 𝑐𝑜𝑟𝑟(𝑋𝑗 , 𝑋𝑠 ) ≥ 0,8 → ĐCT
cao
Khi nào cần kiểm tra ĐCT cao?
Khi P-value của các hệ số ước lượng đều nhỏ thì không cần kiểm tra
Khi P-value của một hệ số nào đó lớn, có thể do 2 nguyên nhân
+ Biến tương ứng thực sự không ảnh hưởng đến biến phụ thuộc
+ Do ĐCT cao → cần kiểm tra
• Khắc phục: Tăng kích thước mẫu
Đổi dạng hàm, đổi dạng biến (ví dụ dùng Y/L; K/L; …)
Nếu có khá nhiều biến có thể dùng phương pháp phân tích nhân tố
Bỏ bớt biến, trong nghiên cứu hạn chế bỏ biến.
e. Mô hình chứa biến không thích hợp (đọc slide, giáo trình)

11
Mô hình với số liệu chéo
1. Nhận biết + số liệu theo thời gian (điều tra nhiều thời điểm cách đều nhau)
+ một đối tượng tại nhiều thời điểm
VD cho số liệu 12 quan sát về chi tiêu và thu nhập của một hộ gia đình trong 12 tháng
Cho số liệu về xuất khẩu của VN theo quý từ năm 2000 đến 2019
Một số khái niệm/nội dung lý thuyết cần nhớ:
a. Biến trễ (lag) của biến Yt là Yt-1, Yt-2, … là các biến thời kì trước của Yt và trong kết quả hồi
quy viết là Y(-1), Y(-2), ….
b. Tự tương quan (TTQ): Chuỗi {Xt} gọi là có TTQ bậc p nếu Corr(Xt, Xt-p) ≠ 0 với p ≠ 0.
c. Yếu tố mùa vụ (season): chẳng hạn lượng bán chăn bông vào quý 4 (mùa đông) cao hơn các
quý khác. Mùa vụ là một yếu tố định tính chia 1 năm thành 4 mùa (4 quý). Để đưa yếu tố này
vào mô hình cần dùng 3 biến giả. Thường quy ước Si = 1 vào quý thứ i; Si = 0 vào quý khác
(i=1,2,3,4 nhưng chỉ dùng 3 biến giả). Với số liệu quý thì dễ dàng tạo biến mùa vụ trên phần
mềm.
d. Yếu tố xu thế (trend): nếu chuỗi số liệu có xu hướng tăng/giảm theo thời gian (VD GDP tăng
qua các năm, quý) thì gọi là có yếu tố xu thế. Biến xu thế trong phương trình có thể là t, t2,
log(t), nhưng phố biến nhất là dùng t. Nếu số liệu theo năm thì t = 1, 2, … ứng với năm thứ
nhất, năm thứ hai, …. Nếu số liệu theo quý thì t = 1, 2, …, 5, … ứng với quý thứ nhất, quý
thứ hai, …, quý thứ 5, …. Khi đọc/làm bài phải chú ý biến xu thế nhận từ 0 hay từ 1. Biến
@trend thường là nhận từ 0.
e. Dữ liệu có sự thay đổi cấu trúc: ví dụ cho dữ liệu
8
biến Xt theo tháng. Nhận thấy từ quan sát thứ 1 đến
quan sát thứ 11 giá trị Xt tăng, từ quan sát 12 đến 6

19 xu hướng chung là giảm (dù ở giữa có nhấp nhô 4

nhưng vẫn là giảm), từ quan sát 19 về sau tăng. Có 2


thể dùng 2 biến giả: 0
1 𝑞𝑢𝑎𝑛 𝑠á𝑡 1 đế𝑛 11 1 4 7 10 13 16 19 22 25 28 31 34
𝐷1 = {
0 𝑐á𝑐 𝑞𝑢𝑎𝑛 𝑠á𝑡 𝑘ℎá𝑐
1 𝑞𝑢𝑎𝑛 𝑠á𝑡 12 đế𝑛 19
𝐷2 = {
0 𝑐á𝑐 𝑞𝑢𝑎𝑛 𝑠á𝑡 𝑘ℎá𝑐
12
f. Sai phân: thường chỉ dùng sai phân bậc 1 là Δ𝑌𝑡 = 𝑌𝑡 − 𝑌𝑡−1 . Các sai phân khác xem trang
thứ 3, slide chương 6.
g. Chuỗi dừng: chuỗi Yt gọi là chuỗi dừng nếu thỏa mãn đồng thời cả 3 điều kiện
• E(Yt) = µ, mọi t
• Var(Yt) = σ2, mọi t
• Cov(Yt, Yt-p) = ρp chỉ thay đổi theo p.
Ví dụ: Yt = βYt-1 + εt với εt là nhiễu trắng, nếu |β| < 1 thì chuỗi Yt là chuỗi dừng.
h. Chuỗi phụ thuộc yếu: Cov(Yt, Yt-p) → 0 rất nhanh khi p tăng nhanh. Chuỗi dừng thường cũng
là chuỗi phụ thuộc yếu.
i. Nhiều trắng: chuỗi Yt gọi là nhiễu trắng nếu thỏa mãn đồng thời 3 điều kiện sau:
• E(Yt) = 0, mọi t
• Var(Yt) = σ2, mọi t
• Cov(Yt, Yt-p) = 0, mọi t, p.
Nhiễu trắng là chuỗi dừng, điều ngược lại không đúng. Khái niệm nhiễu trằng thường dùng
cho sai số ngẫu nhiên u.
j. Biến ngoại sinh chặt là biến độc lập Xj nào đó thỏa mãn Cov(Xjt, us) = 0, t ≠ s.
2. Các phương trình hồi quy
Như số liệu chéo, có 4 loại phương trình, thay chỉ số i bởi chỉ số t.
X có thể là biến nào đó có ảnh hưởng đến Y, biến trễ của Y, biến trễ của biến độc lập khác, biến
thời gian T, biến giả đại diện mùa vụ, biến giả thể hiện sự thay đổi cấu trúc dữ liệu

3. Một số dạng hàm


Như số liệu chéo.
Chú ý: không được dùng log(biến giả).

4. Phương pháp OLS


a. Các giả thiết
Mô hình với số liệu chéo Mô hình với số liệu chuỗi thời gian (Time Series) So sánh
(Cross Sectional) 𝑌𝑡 = 𝛽1 + 𝛽2 𝑋2𝑡 + 𝛽3 𝑋3𝑡 + 𝑢𝑡 >: mạnh hơn
𝑌𝑖 = 𝛽1 + 𝛽2 𝑋2𝑖 + 𝛽3 𝑋3𝑖 Tổng quát Mẫu lớn =: trùng nhau
+ 𝑢𝑖
TS0’: chuỗi dừng, phụ TS0’ chỉ có ở
thuộc yếu Time Series với
Thường dừng cũng phụ mẫu lớn
thuộc yếu
CS1: Mẫu là ngẫu nhiên TS1: Cov(ut,us|X2,X3) = 0, TS1’: Cov(ut,us|X2,X3) = CS1 > TS1’ = TS1
t≠s 0, t ≠ s
CS2: E(ui|X2i,X3i) = 0 TS2: E(ut|X2,X3) = 0 (mọi t) TS2’: E(ut|X2t,X3t) = 0 CS2 = TS2’ < TS2
(mọi i) (mọi t)

13
⇒ ⇒
𝐸 (𝑢 ) = 0 𝐸 ( 𝑢𝑡 ) = 0
{ {
𝐶𝑜𝑣(𝑋𝑗 , 𝑢) = 0; 𝑗 = 2,3 𝐶𝑜𝑣(𝑋𝑗𝑠 , 𝑢𝑡 ) = 0; 𝑗 = 2,3
CS3: Var(ui|X2i,X3i) = σ2 TS3: Var(ut|X2,X3) = σ2 TS3’: Var(ut|X2,X3) = σ2 CS3 < TS3’ = TS3
(mọi i) (mọi t) (mọi t)
CS4: Giữa các biến độc TS4: Giữa các biến độc lập TS4’: Giữa các biến độc Giống nhau
lập không có ĐCT hoàn không có ĐCT hoàn hảo lập không có ĐCT hoàn
hảo hảo
CS5: ui|X2i,X3i ~ N(‧ , ‧) TS5: ut|X2,X3 ~ N(‧ , ‧) CS5 < TS5

b. Các định lý quan trọng


ĐL 6.1 (Gauss – Markov cho mô hình hồi quy chuỗi thời gian): Khi các giả thiết TS1 – TS4
thỏa mãn thì các ước lượng thu được từ pp OLS là BLUE (ước lượng tuyến tính, không chệch
và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch)
ĐL 6.2: Khi các giả thiết TS1 – TS4 thỏa mãn thì phương sai của các hệ số góc ước lượng là:
𝜎2
̂
𝑣𝑎𝑟(𝛽𝑗 ) = 2 ; 𝑗 = 2, 3, . . , 𝑘
(1 − 𝑅𝑗2 ) ∑𝑛𝑡=1(𝑋𝑗𝑡 − 𝑋̅𝑗 )
∑𝑛 2
𝑡=1 𝑒𝑡
Thay 𝜎 2 = 𝑉𝑎𝑟(𝑢𝑡 |𝑋2 , … , 𝑋𝑘 ) bởi ước lượng của nó là 𝜎̂ 2 = .
𝑛−𝑘
̂̂ ) = ∑𝑛𝑡=1 𝑒𝑡2 ×
Khi đó ước lượng của 𝑉𝑎𝑟(𝛽̂𝑗 ) là 𝑣𝑎𝑟(𝛽
1
× ∑𝑛
1
𝑗 𝑛−𝑘 1−𝑅𝑗2 ̅̅̅ 2
𝑡=1(𝑋𝑗𝑡 −𝑋𝑗 )

̂̂ ) là giá trị được cung cấp tại cột (Std. Error) trong kết quả hồi quy
và 𝑠𝑒(𝛽̂𝑗 ) = √𝑣𝑎𝑟(𝛽𝑗

sử dụng Eviews4, cho biết độ chính xác của ước lượng 𝛽̂𝑗 .
̂̂ ) xác định được các yếu tố ảnh hưởng đến độ chính xác của ước
Từ công thức của 𝑣𝑎𝑟(𝛽 𝑗
lượng.
ĐL 6.3: Khi các giả thiết TS1 – TS5 thỏa mãn thì ta có 𝛽̂𝑗 ~ 𝑁 (𝛽𝑗 , 𝑣𝑎𝑟(𝛽̂𝑗 )) , 𝑗 = 2, … , 𝑘.
Các bài toán ước lượng khoảng, kiểm định T, F làm như chương 3.
ĐL 6.4: Khi các giả thiết TS0’ – TS2’ thỏa mãn thì các ước lượng OLS là ước lượng vững.
ĐL 6.5: Khi các giả thiết TS0’ – TS4’ thỏa mãn thì các ước lượng OLS là tiệm cận hiệu quả
trong lớp các ước lượng tuyến tính và vững.
ĐL 6.6: Khi các giả thiết TS0’ – TS4’ thỏa mãn và kích thước mẫu đủ lớn thì các ước lượng
OLS có phân phối xấp xỉ Chuẩn, và khi đó các thống kê t, F có phân phối xấp xỉ Student và
Fisher tương ứng.
Giả thiết TS2 rất mạnh, khó thỏa mãn và thực tế thường dùng trường hợp mẫu lớn. Khi đó các
giả thiết TS2’, TS3’, TS4’ giống số liệu chéo nên cần kiểm tra thêm giả thiết TS0’ và TS1’.

5. Hệ số xác định và hệ số xác định hiệu chỉnh


Như số liệu chéo.
6. Bài toán ước lượng khoảng tin cậy của các tham số
14
Như số liệu chéo
7. Bài toán kiểm định giả thuyết về các hệ số hồi quy
Như số liệu chéo
8. Dự báo
Tương tự số liệu chéo, thường chỉ tính ước lượng điểm.
Có thể dự báo cho thời kì tiếp theo.

9. Một số mô hình hồi quy chuỗi thời gian cơ bản


a. Mô hình tĩnh (tương tự số liệu chéo)
• Không có biến trễ, không có biến xu thế, mùa vụ, thay đổi cấu trúc
• Chỉ xét mối quan hệ giữa các biến số tính tại một thời điểm, nó cho phép xem xét mối quan
hệ tức thời hoặc mối quan hệ cân bằng dài hạn giữa các biến số kinh tế.
b. Mô hình động
• Mô hình có trễ phân phối bậc q (kí hiệu: DL(q))
Yt =  + 0Xt + 1Xt – 1 + … + q Xt – q + ut
Tác động cùng kỳ, ngắn hạn: 0
Tác động tổng hợp, dài hạn: 0 + 1 + … + q
• Mô hình tự hồi quy bậc p (kí hiệu: AR(p))
Yt =  + 1Yt – 1 + 2Yt – 2 +…+ pYt – p + ut
• Mô hình ARDL(p, q)
Yt =  + 1Yt – 1 +…+ pYt – p + 0Xt + 1Xt – 1 +…+ q Xt – q + ut
• Mô hình có biến xu thế thời gian
Biến xu thế thời gian (Trend ) t = 1, 2,… hoặc 0, 1,…
Tổng quát: Yt = g(t ) + ut
Dự báo cho thời kỳ/điểm 𝑇 + ℎ: 𝑌̂𝑇+ℎ = 𝑔̂(𝑡)
o Tuyến tính: Yt = 1 + 2t + ut
o Parabol: Yt = 1 + 2t + 3t 2
+ ut
o Logarit: Yt = 1 + 2ln(t ) + ut
o Tăng trưởng: ln(Yt ) = 1 + 2t + ut
o Hàm mũ: ln(Yt ) = 1 + 2ln(t ) + ut
• Mô hình với biến mùa vụ
Số liệu quý, đặt các biến giả theo Quý (mùa)
Sj = 1 tại Quý j, = 0 nếu ngược lại, j = 1, 2, 3, 4
Chọn 1 quý làm gốc, chẳng hạn Quý 1
Yt = α1 + 2S2 + 3S3 + 4S4 + ut
So sánh trong cùng năm:
Quý 2 chênh lệch Quý 1 là: 2
Quý 3 chênh lệch Quý 1 là: 3
Quý 4 chênh lệch Quý 1 là: 4

15
Thông thường sẽ có thêm các biến Xt khác
Trường hợp có cả xu thế và mùa vụ: Yt = 1 + 2t + 2S2 + 3S3 + 4S4 + ut, khi t thay đổi thì
Sj nào đó cũng thay đổi nên không thể đọc riêng ý nghĩa của 2 và các j.
• Mô hình có biến thay đổi cấu trúc
VD: Yt = β1 + β2X2t + β3X3t + β4Dt + ut
D = 1 với thời kì đầu; D = 0 với thời kì sau
β4 cho biết lượng chênh lệch trung bình biến phụ thuộc ở 2 thời kì với điều kiện các biến khác
không đổi.
Có thể gặp mô hình có cả biến trễ của X, trễ của Y, xu thế, mùa vụ, thay đổi cấu trúc.
10. Kiểm định và lựa chọn mô hình
Tương tự số liệu chéo, trước tiên phải kiểm định sự phù hợp của mô hình. Sau đó sẽ lần lượt làm:
a. Kiểm tra tính dừng (gt TS0’): chỉ làm cho MH với biến thời gian, không phải phát hiện chuỗi
không dừng khi thi/KT, làm thực tế khi tiến hành nghiên cứu.
TS0’: các chuỗi Yt, Xjt đều là chuỗi dừng và phụ thuộc yếu.
Các chuỗi dừng thường phụ thuộc yếu nên chỉ cần kiểm tra tính dừng.
• Nguyên nhân: Bản chất các biến kinh tế.
• Hậu quả: Ảnh hưởng tính vững, tiệm cận hiệu quả của các ước lượng OLS (ĐL 6.4, 6.5)
• Phát hiện: có nhiều cách
Dùng đồ thị Xt theo t
Dùng kiểm định Augment Dickey – Fuller (ADF) (tự đọc chương 12 hoặc tài liệu thực
hành)
Một số kiểm định khác
• Khắc phục: dùng sai phân
b. Kì vọng của sai số ngẫu nhiên (SSNN) khác 0 (vi phạm gt TS2’): giống số liệu chéo
c. Phương sai sai số (PSSS) thay đổi (vi phạm gt TS3’): giống số liệu chéo
d. Sai số ngẫu nhiên có tự tương quan (vi phạm TS1=TS1’): chỉ làm cho MH với biến thời gian
TS1: SSNN không có tự tương quan, Cov(ut,us|X2,X3) = 0, t ≠ s
Nếu TS1 bị vi phạm thì nói mô hình có tự tương quan (TTQ) hoặc tương quan chuỗi
Trường hợp bậc 1, có thể viết: ut = 1ut – 1 + t; 1  0, t là nhiễu trắng
• Khi 1 > 0: tự tương quan bậc 1 dương
• Khi 1 < 0: tự tương quan bậc 1 âm
• Khi 1 = 0: không có tự tương quan bậc 1
Tổng quát đến bậc p:
ut = 1ut – 1 +…+ put – p +t
Hậu quả: Ước lượng hệ số OLS là không chệch và vững
Ước lượng phương sai, SE là chệch
Suy diễn thống kê có thể không đáng tin cậy
Phát hiện: Sử dụng đồ thị phần dự hoặc các kiểm định
• Kiểm định tự tương quan bậc 1:
o Các biến độc lập đều là ngoại sinh chặt:

16
✓ Hồi quy phụ trực tiếp: et = (α +) ρ1et-1 + εt, kiểm định ρ theo kiểm định T (hoặc F)
✓ kiểm định Durbin-Watson (DW): phải có hệ số chặn, chuối số là liên tục (không có
quan sát bị mất) và tất cả các biến độc lập là ngoại sinh chặt (không có biến trễ của
biến phụ thuộc). Kiểm định DW đáng tin khi các giả thiết khác đã được thỏa mãn.

n
(e − et −1 )2
DW = d = t =2 t
 2(1 − ˆ 1 )
t =1 et2
n
(thường cho sẵn trong kết quả Eviews)
Với n, k ’ = k – 1,  cho trước → dL , dU
Nếu 0 < DW < dL: có TTQ bậc 1 dương
Nếu dL < DW < dU: không có kết luận
Nếu dU < DW < 4-dU: không có TTQ
Nếu 4-dU < DW < 4-dL: không có kết luận
Nếu 4-dL < DW < 4: có TTQ bậc 1 âm
o Có biến độc lập không ngoại sinh chặt:
✓ Kiểm định BG: et = (1+ 2X2t + … +kXkt ) + 1et – 1 + vt
Nếu 1  0 thì MH gốc có TTQ bậc 1
✓ Có trễ của biến phụ thuộc: Durbin-h
Khi mô hình có trễ của biến phụ thuộc ở vế phải
Yt = 1 + 2X2t +… + k Xkt + Yt – 1 + ut
Dùng Durbin’s h khi 𝑉𝑎𝑟(𝜆̂) < 1/𝑛:
H0: Mô hình không có tự tương quan bậc 1
H1: Mô hình có tự tương quan bậc 1
𝑛 𝑑 𝑛
ℎ = 𝜌̂√ = (1 − ) √
1 − 𝑛𝑉𝑎𝑟(𝜆̂) 2 1 − 𝑛𝑉𝑎𝑟(𝜆̂)

Nếu | h | > u/2 thì bác bỏ H0


Hạn chế: không phải lúc nào cũng tính được h do biểu thức dưới dấu căn có thể âm.
Kiểm định tự tương quan bậc p: kiểm định BG (Breusch-Godfrey):
Hồi quy phụ:
et =(1 + 2X2t +…+ kXkt ) + 1et – 1 +…+ pet – p + vt
H0: 𝜌1 = ⋯ = 𝜌𝑝 : không có TTQ đến bậc p
H1: Có tự tương quan ở ít nhất 1 bậc
Kiểm định F (thu hẹp hồi quy)
2
Kiểm định 𝜒 2 : 𝜒 2 = (𝑛 − 𝑝)𝑅(hồi 2 2
quy phụ) ; nếu 𝜒𝑞𝑠 > 𝜒𝛼 (𝑛 − 𝑝) thì bác bỏ H0
Khắc phục:
• Phương pháp Bình phương nhỏ nhất tổng quát GLS (General Least Squares)
Mô hình: 𝑌𝑡 = 𝛽1 + 𝛽2 𝑋𝑡 + 𝑢𝑡 (1)
Xét TTQ bậc 1: 𝑢𝑡 = 𝜌𝑢𝑡−1 + 𝜀𝑡 (  0)
Không ước lượng (1) trực tiếp, mà ước lượng mô hình có dạng sai phân tổng quát:
𝑌𝑡 − 𝜌𝑌𝑡−1 = 𝛽1 (1 − 𝜌) + 𝛽2 (𝑋𝑡 − 𝜌𝑋𝑡−1 ) + (𝑢𝑡 − 𝜌𝑢𝑡−1 )
Hay: 𝑌𝑡∗ = 𝛽1∗ + 𝛽2 𝑋𝑡∗ + 𝜀𝑡 (2)
17
Mô hình (2) không có tự tương quan, biến độc lập là ngoại sinh chặt
• Phương pháp Bình phương nhỏ nhất tổng quát thực hành: FGLS
Phương trình sai phân tổng quát cần giá trị , nhưng lại chưa biết
Sử dụng ước lượng của  : FGLS (Feasible GLS), từ nhiều cách:
o Từ DW: 𝜌̂ = 1 − 𝑑/2
o Từ hồi quy phụ: 𝑒𝑡 = (𝛼) + 𝜌𝑒𝑡−1 + 𝑣𝑡
o Từ ước lượng nhiều bước
• Phương pháp lấy sai phân
• Dùng phương sai hiệu chỉnh: phương pháp sai số chuẩn vững, phương pháp Newey – West
o Ước lượng các hệ số không đổi
o Tính lại các sai số chuẩn
e. Vấn đề đa cộng tuyến cao: giống số liệu chéo
f. Sai số ngẫu nhiên không phân phối chuẩn: bỏ qua vì mẫu lớn
g. Mô hình chứa biến không thích hợp: giống số liệu chéo

18

You might also like