You are on page 1of 12

BÀI 5: HỒI QUY CHUỖI THỜI GIAN THEO XU THẾ VÀ MÙA VỤ

5.1. Khái quát về hồi quy


- Hồi quy: tìm ra quy luật về mối quan hệ giữa các biến số.
Mối quan hệ:
+ Nhân quả đã được các lý thuyết chứng minh: cung tiền – lãi suất; đầu tư –
tăng trưởng; số năm đi học – năng suất lao động;…
+ Các biến số có liên quan đến nhau chưa được chứng minh bằng lý thuyết:
người đã tiêm vaccine phòng lao thì khả năng trở nặng khi bị covid sẽ giảm đi;
kỳ vọng của người dân về lạm phát tăng thì sẽ làm cho lạm phát thực tăng lên.
- Các dạng phương trình hồi quy:
+ Hồi quy tuyến tính và hồi quy phi tuyến
VD: Hồi quy tuyến tính: Y = β0 + β1X
VD: Hồi quy phi tuyến tính: Y = β0 + β1/X
+ Các dạng phương trình hồi quy tuyến tính:
@ Linear – Linear: Y = β0 + β1X
@ Log – Linear: LogY = β0 + β1X
@ Linear – Log: Y = β0 + β1*LogX
@ Log – Log: LogY = β0 + β1*LogX
Ở mỗi dạng phương trình trên, mối quan hệ biến đổi của Y theo X được thể
hiện như thế nào?
1@ Linear – Linear: Y = β0 + β1X
Khi X thay đổi 1 đơn vị thì Y thay đổi β1 đơn vị.
VD: X = 1  Y = β0 + β1*1 = β0 + β1
X = 2  Y = β0 + β1*2
 Khi X tăng từ 1 lên 2 thì Y thay đổi β1 đơn vị.
2@ Log – Linear: LogY = β0 + β1X
X = 1  LogY1 = β0 + β1
X = 2  LogY2 = β0 + 2*β1
LogY2 – LogY1 = β1
Log(Y2/Y1) = β1
Y2/Y1 = e β1
100*(Y2/Y1 – 1) = (e β1 – 1)*100
Khi X tăng 1 đơn vị thì Y tăng xấp xỉ β1*100 ( %)
Khi X thay đổi 1 đơn vị thì Y thay đổi β1*100 ( %)
Chứng minh bằng co giãn
3@ Linear – Log: Y = β0 + β1*LogX
Khi X thay đổi 1% thì Y thay đổi β1 đơn vị
X1  Y1 = β0 + β1*LogX1
X2  Y2 = β0 + β1*LogX2
Y2 – Y1 = β1*( LogX2 - LogX1)
4@ Log – Log: LogY = β0 + β1*LogX
Khi X thay đổi 1% thì Y thay đổi β1 %
Khi nào thì sử dụng mỗi dạng phương trình trên?
Tùy thuộc vào mục đích phân tích mối quan hệ giữa X và Y để chọn dạng
phương trình. Người phân tích thường phải xác định rõ biến động của Y và X
nên được tính theo % hay theo đơn vị để chọn dạng phương trình hồi quy phù
hợp.
VD1: Hồi quy GDP theo cung tiền MS
 MS tăng 1 đơn vị thì GDP tăng bao nhiêu đơn vị: GDP = β0 + β1MS
 MS tăng 1 đơn vị thì GDP tăng bao nhiêu %: LogGDP = β0 + β1MS
 MS tăng 1% thì GDP tăng bao nhiêu %: LogGDP = β0 + β1 LogMS
VD2: Hồi quy thu nhập theo số năm đi học
 Số năm đi học tăng 1 đơn vị (học thêm 1 năm học) thì thu nhập thay đổi bao
nhiêu %: Log(Thu nhập) = β0 + β1*(Số năm đi học)
VD3: Hồi quy GDP theo tỷ lệ lạm phát:
 Tỷ lệ lạm phát tăng 1% thì GDP thay đổi bao nhiêu %:
LogGDP = β0 + β1 *Tỷ lệ lạm phát
- Các dạng biến số của phương trình hồi quy tuyến tính
X: biến độc lập
Y: biến phụ thuộc
+ X và Y đều là biến liên tục
VD: GDP, MS, thu nhập
+ X chỉ nhận giá trị 0 hoặc 1: X biến định danh (biến giả, biến nhị phân)
+ Y chỉ nhận giá trị 0 hoặc 1: Y biến định danh (biến giả, biến nhị phân):
Vd: người dân có di cư việc làm hay không phụ thuộc vào trình độ, số người
trong hộ, tỷ lệ thu nhập phi nông nghiệp của hộ.
(có/không di cư việc làm) = f(trình độ, số người trong hộ, tỷ lệ thu nhập phi
nông nghiệp của hộ)
Dùng phương trình dạng xác suất: Mô hình Logit.
+ Y là biến rời rạc: VD: Y = 0, 1, 2, 3, 4, 5. Mô hình hồi quy với biến phụ thuộc
là biến rời rạc
Một người có khả năng trả lời mức độ hài lòng của mình ở 6 thang 0  5;
Hài lòng = f(thức ăn, độ phong phú, bài trí, thái độ của nhân viên)
+ ……
5.2. Mô hình hồi quy với biến giả
Biến giả: Là biến định danh, dùng để xác định đối tượng có thuộc nhóm quan
sát hay không. Khi đối tượng thuộc nhóm quan sát, biến định danh nhận giá trị
= 1; Khi đối tượng không thuộc nhóm quan sát, biến định danh nhận giá trị =
0.
VD: Điều tra thu nhập của những người làm trong các khu vực kinh tế khác
nhau:

Thu
Nhà Tư nhập
ID FDI
nước nhân (triệu
đồng)
1 0 0 1 25
2 1 0 0 18
3 1 0 0 10
4 0 1 0 28
5 1 0 0 8
6 0 1 0 35
7 0 0 1 36
8 1 0 1 25
9 0 0 1 36
10 1 0 0 31
11 0 0 1 31
12 1 0 0 34
13 0 1 1 38
14 0 0 1 26
15 0 0 1 14
16 1 0 0 26
17 0 0 1 13
18 0 0 1 26
19 0 0 1 29
20 0 1 0 8
21 0 1 0 31
22 1 0 0 22
23 0 0 1 39
24 1 0 0 9
25 0 0 1 37
26 0 0 1 31
27 0 1 0 24
28 1 0 0 22
29 1 0 0 30
30 0 1 0 24

Với các yếu tố khác (tuổi, trình độ, sức khỏe,….) như nhau, trung bình một
người làm trong khu vực nhà nước có thu nhập khác biệt thế nào với những
người làm trong hai khu vực còn lại?
 Sử dụng phương trình hồi quy với biến giả (dummy variable):
Hồi quy với biến giả
VD: Sự khác biệt về thu nhập giữa Nam và Nữ:
Y = β0 + β1*X
Y là thu nhập; X là biến giả định danh cho giới tính.
Quan sát là Nam: X = 1;
Quan sát là Nữ: X = 0
 Thu nhập của nam giới:
YNam = β0 + β1*1 = β0 + β1
YNữ = β0 + β1*0 = β0
YNam - YNữ = β1
 Hệ số của biến giả X là β1 chính là chênh lệch thu nhập giữa Nam và Nữ
VD: Sự khác biệt thu nhập giữa những nhóm người làm việc ở các khu vực kinh
tế khác nhau (Nhà nước, Tư nhân, FDI):
Y = β0 + β1*Nhà nước + β2*Tư nhân (1)
(Lấy nhóm người làm việc trong khu vực FDI làm nhóm cơ sở)
Nhà nước = 1 nếu quan sát làm việc trong khu vực nhà nước; = 0 otherwise;
Tư nhân = 1 nếu quan sát làm việc trong khu vực nhà nước; = 0 otherwise;
FDI = 1 nếu quan sát làm việc trong khu vực nhà nước; = 0 otherwise;
YNhà nước = β0 + β1
YTư nhân = β0 + β2
YFDI = β0
Hệ số β1 của phương trình (1) là chênh lệch thu nhập trung bình của một người
làm việc trong khu vực nhà nước so với thu nhập trung bình của một người làm
việc trong khu vực FDI (với điều kiện các yếu tố khác như nhau).
Hệ số β2 của phương trình (1) là chênh lệch thu nhập trung bình của một người
làm việc trong khu vực tư nhân so với thu nhập trung bình của một người làm
việc trong khu vực FDI (với điều kiện các yếu tố khác như nhau).
- Nếu lấy nhóm người làm việc trong khu vực Nhà nước làm nhóm cơ sở, thì pt
hồi quy trở thành:
Y = β0 + β1*Tư nhân + β2*FDI (1)
5.3. Hồi quy chuỗi thời gian với biến xu thế và biến giả mùa vụ
5.3.1. Hồi quy chuỗi thời gian với biến xu thế
- Biến xu thế: là biến đếm số thời kỳ quan sát đối tượng nghiên cứu
Ký hiệu: t (time-trend variable);
Giá trị của t: 0, 1, 2,3,…
Ý nghĩa: Giúp tính được trung bình sau một thời kỳ thì giá trị của đối tượng
nghiên cứu thay đổi thế nào.
Lệnh tạo biến xu thế: genr t = @trend
VD về phương trình hồi quy với biến xu thế:
LogGDP = β0 + β1*t
với t là số quý quan sát.
 Pt cho biết cứ sau 1 quý (t tăng 1 đơn vị) thì GDP sẽ tăng lên β1%.
5.3.2. Hồi quy chuỗi thời gian với biến giả mùa vụ
Giả sử chuỗi quan sát theo quý  sẽ có 4 quý trong năm.
Cần đặt biến giả như thế nào để có thể so sánh sự khác biệt của GDP giữa các
quý với nhau?
LogGDP = β0 + β1*Q1 + β2*Q2 + β3*Q3 (2)
Q1 = 1 nếu quan sát thuộc quý 1 (nếu quan sát là GDP của Quý 1); Q1 = 0,
otherwise
Q2 = 1 nếu quan sát thuộc quý 2 (nếu quan sát là GDP của Quý 2); Q2 = 0,
otherwise
Q3 = 1 nếu quan sát thuộc quý 3 (nếu quan sát là GDP của Quý 3); Q3 = 0,
otherwise
Q4 = 1 nếu quan sát thuộc quý 4 (nếu quan sát là GDP của Quý 4); Q4 = 0,
otherwise
LogGDPQ1 = β0 + β1
LogGDPQ2 = β0 + β2
LogGDPQ3 = β0 + β3
LogGDPQ4 = β0
LogGDPQ1 - LogGDPQ4 = β1
Log(GDPQ1/ GDPQ4) = β1
GDPQ1/GDPQ4 = e β1
100*(GDPQ1/GDPQ4 – 1) = 100*( e β1 – 1)
Tính trung bình trong cả thời kỳ, chênh lệch theo % giữa GDP của quý 1 so với
GDP của quý 4 bằng 100*(e β1 – 1).
Tính trung bình trong cả thời kỳ, chênh lệch theo % giữa GDP của quý 2 so với
GDP của quý 4 bằng 100*(e β2 – 1).
Tính trung bình trong cả thời kỳ, chênh lệch theo % giữa GDP của quý 3 so với
GDP của quý 4 bằng 100*(e β3 – 1).
Lệnh tạo biến giả mùa vụ:
genr Q1 = @seas(1)
genr Q2 = @seas(2)
genr Q3 = @seas(3)
genr Q4 = @seas(4)
5.3.2. Hồi quy chuỗi thời gian với biến giả mùa vụ
Phương trình hồi quy có dạng:
Y = β0 + β1*Q1 + β2*Q2 + β3*Q3 + β4*t
 Hệ số của t cho biết bình mỗi quý Y sẽ thay đổi bao nhiêu đơn vị;
 Hệ số của các biến giả mùa vụ cho phép tính được chênh lệch giá trị của Y
giữa các quý.
Yêu cầu: Hồi quy GDP theo quý của VN theo biến xu thế và biến giả mùa vụ
(LẤY QUÝ 4 LÀM QUÝ CƠ SỞ)
B1: Tạo các biến t, Q1, Q2, Q3, Q4.
genr t = @trend
genr Q1 = @seas(1)
genr Q2 = @seas(2)
genr Q3 = @seas(3)
genr Q4 = @seas(4)
B2: Chạy hồi quy: Nếu lấy quý 4 làm quý cơ sở:
LS log(GDP) c t Q1 Q2 Q3
5.4. Dự báo chuỗi thời gian theo mô hình hồi quy xu thế và mùa vụ
Giả sử hàm hồi quy sử dụng đối với chuỗi thời gian là:
Y(2015q4) = β0 + β1*Q1(2015q4) + β2*Q2(2015q4) + β3*Q3(2015q4) + β4*t(2015q4)
Để dự báo cho các thời kỳ tiếp theo, thì các giá trị Q1, Q2, Q3, t đều phải được
mở rộng đến kỳ cần dự báo.
1,000,000
Forecast: GDPF
Actual: GDP
800,000 Forecast sample: 2000Q1 2017Q4
Included observations: 72
Root Mean Squared Error 33387.50
600,000 Mean Absolute Error 24574.53
Mean Abs. Percent Error 5.770711
Theil Inequality Coefficient 0.033277
400,000
Bias Proportion 0.000000
Variance Proportion 0.011491
Covariance Proportion 0.988509
200,000
Theil U2 Coefficient 0.297891
Symmetric MAPE 5.939487
0
2000 2002 2004 2006 2008 2010 2012 2014 2016

GDPF ± 2 S.E.

Tính sai số dự báo:


genr saiso_GDPF = 100*(GDP - GDPF)/GDP
Kiểm tra phương sai sai số thay đổi: sai số có mối liên hệ với các biến của mô
hình không?
Kiểm tra phần dư có tự tương quan: các thành phần trong chuỗi sai số có mối
liên hệ với nhau hay không?
 các thành phần của chuỗi sai số là độc lập, ngẫu nhiên, không có mối quan
hệ gì với nhau và không có mối quan hệ với các biến của mô hình.
Nếu mô hình có bệnh phần dư có tự tương quan và bệnh phương sai sai số thay
đổi  có thể chữa bằng cách đưa thành phần trung bình trượt tự hồi quy vào mô
hình để rút quy luật liên quan đến chuỗi phần dư (Tham khảo mô hình
ARIMA).
5.5. So sánh giữa các mô hình dự báo
Một chuỗi thời gian có thể được dự báo bằng nhiều mô hình khác nhau:
- Đối với chuỗi không xu thế, không mùa vụ: Dự báo thô, dự báo bằng trung
bình giản đơn, dự báo bằng trung bình trượt, dự báo bằng san mũ đơn, dự báo
bằng hồi quy.
- Đối với chuỗi có xu thế, không mùa vụ: San mũ Holt, hồi quy
- Đối với chuỗi có xu thế, có mùa vụ: San mũ Holt-Winter, hồi quy (đã học: hồi
quy theo xu thế và mùa vụ).
 Người dự báo cần so sánh sai số giữa các mô hình dự báo để chọn được một
mô hình phù hợp nhất.
VD: So sánh kết quả dự báo chuỗi GC theo quý từ hai mô hình Holt-Winter &
hồi quy xu thế mùa vụ.
5.6. Trình bày báo cáo dự báo
- Mô tả nguồn dữ liệu, số lượng quan sát trong mẫu:
VD: Báo cáo này sử dụng số liệu trong giai đoạn từ 2000Q1 – 2015Q4 về chi
tiêu chính phủ (GC) theo giá cố định năm 2010 do Tổng cục Thống kê Việt
Nam công bố. Số lượng quan sát trong mẫu là 64 quan sát, bao gồm các giá trị
GC theo quý.
- Mô tả đặc tính của dữ liệu (thường dùng biểu đồ):
VD: Đồ thị dữ liệu từ 2000Q1 – 2015Q4 cho thấy chuỗi GC có xu thế đi lên và
có dao động theo mùa. (Mô tả cụ thể đặc điểm dao động mùa, lý giải nếu cần)
- Xác định mô hình dự báo phù hợp:
VD: Đồ thị dữ liệu của chuỗi cho thấy các mô hình thích hợp có thể sử dụng để
dự báo chuỗi là: HW, hồi quy,…
- Trình bày từng mô hình dự báo sử dụng: công thức dự báo/phương trình hồi
quy tổng quát.
- Trình bày kết quả dự báo từ từng mô hình:
+ Đưa ra các bảng kết quả của mỗi mô hình:
Holt Winters Hồi quy xu ARIMA MAPE RMSE
(alpha =…; beta = …; thế mùa vụ
gama =…)
2016q
1
2016q
2

- So sánh sai số:


Thường thể hiện qua biểu đồ sai số
- Chọn kết quả phù hợp nhất để báo cáo kết quả dự báo.

Dependent Variable: LOG(GDP)


Method: Least Squares
Date: 10/13/21 Time: 11:35
Sample (adjusted): 2000Q1 2015Q4
Included observations: 64 after adjustments

Variable Coefficient Std. Error t-Statistic Prob.  

C 12.73531 0.009189 1385.876 0.0000


T 0.015314 0.000186 82.46994 0.0000
Q1 -0.408520 0.009700 -42.11341 0.0000
Q2 -0.184007 0.009692 -18.98628 0.0000
Q3 -0.190805 0.009686 -19.69856 0.0000

R-squared 0.993495    Mean dependent var 13.02187


Adjusted R-squared 0.993053    S.D. dependent var 0.328652
S.E. of regression 0.027392    Akaike info criterion -4.282243
Sum squared resid 0.044268    Schwarz criterion -4.113580
Log likelihood 142.0318    Hannan-Quinn criter. -4.215798
F-statistic 2252.564    Durbin-Watson stat 1.504981
Prob(F-statistic) 0.000000

Hệ số của t = 0.015314  Trung bình trong cả thời kỳ, cứ sau mỗi quý thì GDP
tăng được 1.5%.
Hệ số của Q1 là -0.408520  Trung bình trong cả thời kỳ, GDP của Quý 1 thấp hơn
GDP của Quý 4 là 100*(e-0.408520 – 1)% = -33.54%.
Hệ số của Q2 là …….  Trung bình trong cả thời kỳ, GDP của Quý 2 thấp hơn
GDP của Quý 4 là 100*(….. – 1)% = ……..%.
Hệ số của Q3 là ………  Trung bình trong cả thời kỳ, GDP của Quý 3 thấp hơn
GDP của Quý 4 là 100*(…….. – 1)% = …….%.

Nếu lấy quý 2 làm quý cơ sở: LS log(GDP) c t Q1 Q4 Q3

You might also like