You are on page 1of 62

CHƯƠNG 8.

DỰ
BÁO BẰNG
PHƯƠNG PHÁP
ARIMA (BOX-
JENKINS)
8.1 TÍNH DỪNG CỦA CHUỖI THỜI GIAN
ĐỊNH NGHĨA
Một chuỗi thời gian được cho là có tính dừng khi giá trị của chuỗi dao động quanh giá trị trung bình và độ lớn ph
thời gian.
TẦM QUAN TRỌNG
-Trong dự báo chuỗi thời gian, không thể dự báo cho tương lai nếu bản chất dữ liệu luôn thay đổi.
•Trong phân tích hồi quy, nếu chuỗi thời gian không dừng thì kết quả của phân tích hồi quy tuyến tính sẽ không c
Chuoi thoi gian dung

Hình 8.1: Chuỗi thời gian dừng 107,5

105,0

102,5

Yt
100,0

97,5

95,0

2 4 6 8 10 12 14 16
Thoi gian
KIỂM ĐỊNH TÍNH DỪNG CỦA CHUỖI THỜI GIAN
Hình 8.2: Chuỗi thời gian chỉ dừng trị trung bình( phương sai
thay đổi)
Hình 8.3: Chuỗi thời gian không dừng cả trị trung bình
120 và phương sai
110

108
100
Yt

106
90
104

80 102

100

Yt
70
2 4 6 8 10 12 14 16
Th?i gian 98

96

94

92
2 4 6 8 10 12 14 16
Thoi gian
Thống kê t (Student)
Giả sử
Dữ liệu phân bố chuẩn.
Mức ý nghĩa = 5%, tương ứng với trị thống kê Student bằng 2
Giả thuyết:
Hệ số tương quan:
(8.1)
Trong đó:
: giá trị trung bình của chuỗi thời số thời gian Yt.
k: độ trễ (trượt)
n: số lượng quan sát (mẫu) của chuỗi Yt.
Yt-k: chuỗi được tạo thành bằng cách trượt đi k thời đoạn.
Giá trị rk (-1, 1)
Nếu rk ( => chuỗi dừng, chấp nhận H0, bác bỏ H1
Nếu rk­ không thuộc khoảng trên, thì chuỗi không dừng ở độ trễ (trượt) k.
Biểu Đồ Tự Tương Quan ACF
Là biểu đồ sử dụng trục hoành để biểu diễn mức độ trễ
( trượt) k, còn trục tung là giá trị của hệ số tự tương
quan rk. Khoảng được biểu diễn như hai đường biên.
Giá trị rk nằm bên trong hai đường biên trên thì chuỗi
thời gian được gọi là dừng ở độ trễ (trượt) k.
Là một công cụ hình ảnh tốt để biểu diễn tính dừng của
chuỗi thời gian. (hình 8.4a, 8.4b)
Ngoài ra, ACF còn thể hiện được tính chất dừng của
chuỗi thời gian. (hình 8.4c, 8.4d
Hình 8.4: Biểu đồ tự tương quan ACF(SGK/326)
Ví dụ 8.1: Hãy kiểm định tính dừng của chuỗi Doanh thu
thời gan biểu diễn doanh thu trong một năm của Doanh thu Doanh thu trượt trượt 1
Tháng thời đoạn
một cửa hàng bán điện thoại thông minh trình Yt 1 thời đoạn Yt-1
Yt-2
bày ở bảng 8.1 sau
1 123 - -
2 130 123 -
Lời giải: 3 125 130 123
Áp dụng công thức 8.1 với độ trễ k=1: 4 138 125 130
= = 0.572 5 145 138 125
6 142 145 138
7 141 142 145
8 146 141 142
9 147 146 141
10 157 147 146
11 150 157 147
12 160 150 157
= = 142
Sử dụng dữ liệu doanh thu Yt và doanh thu trượt Tháng Yt Yt-1
một thời đoạn Yt-1 (bảng 8.2) để vẽ biểu đồ phân
1 123 - -19 - 361 -
tán (hình 8.5)
2 130 123 -12 -19 144 228
Nhận xét: Yt và Yt-1 có mối quan hệ đồng biến 3 125 130 -17 -12 289 204
với mức độ vừa phải đúng giá trị của hệ số tự 4 138 125 -4 -17 16 68
tương quan r1= 0.572 5 145 138 3 -4 9 -12
6 142 145 0 3 0 0
7 141 142 -1 0 1 0
8 146 141 4 -1 16 -4
9 147 146 5 4 25 20
10 157 147 15 5 225 75
11 150 157 8 15 64 120
12 160 150 18 8 324 144

Tổng 1704 1474 843


Hình 8.5: Biểu đồ phân tán biểu diễn tương quan
giữa Yt và Yt-1

Hình 8.5: Biểu đồ phân tán biểu diễn tương quan giữa Y t và Yt-1

160

150
Yt

140

130

120
120 130 140 150 160
Yt-1
*Kiểm định bằng thống kê t (Student)
Giá trị biên (mức ý nghĩa = 5%) Hình 8.6: Biểu đồ tự tương quan ACF.
rk= 0.572 (k=1) (-0.577; 0.577)
K rk
Do đó: chuồi thời gian có tính dừng ở độ trễ k=1
0 1
1 0.571913
2 0.462687
3 0.110583
4 0.015604
5 -0.033243
6 -0.101764
7 -0.250339
8 -0.327680
9 -0.466079
10 -0.249661
11 -0.232022
Bảng 8.3: Trị thống kê Q của
Kiểm định bằng thống kê Q
doanh thu
Giả thiết giá trị tới hạn
H0: (chuỗi dừng)
H1: Hệ số tương quan
Trượt k n-k Thống kê Q
Mức ý nghĩa =0.05, Q có phân phối với rk
bậc tự do n-1=11, tra bảng phân phối Chi 1 0.571913 11 0.02973 5
bình phương ta được trị tới hạn: 2 0.462687 10 0.02141 8.59
3 0.110583 9 0.00136 8.82
4 0.015604 8 0.00003 8.83
Áp dụng công thức 8.3 để tính thống kê 5 -0.033243 7 0.00016 8.85
6 -0.101764 6 0.00173 9.14
Q với rk như bảng 8.2 ta được bảng sau:
7 -0.250339 5 0.01253 11.25
8 -0.327680 4 0.02684 15.76
Với k=1, trị thống kê Q= 5 (3.815; 9 -0.466079 3 0.07241 27.92
21.92) 10 -0.249661 2 0.03117 33.16
Kết luận: chuỗi dừng ở hệ số trượt k=1 11 -0.232022 1 0.05383 42.20
0.25120
8.2. Mô hình tự hồi qui (AR)
Thông thường, giá trị dữ liệu dãy số thời gian tại một thời điểm có liên quan với giá trị ở thời điểm
trước đó. Mô hình hồi qui sinh ra giá trị dự báo bằng cách sử dụng một hay nhiều giá trị dữ liệu của
các thời điểm trước đó.
Yt=f(Yt-1,Yt-2,..., Yt-p, εt)
1Yt-1,...,Yt-p), ô hình tự hồi qui tổng quát bậc p
t =0+1Yt-1+2Yt-2 +...+pYt-p+ εt (8.4)
Trong đó:
t : Giá trị dự báo của giá trị thời gian tại thời điểm t.
Yt-1,Yt-2....Yt-p: Chuỗi thời gian trễ(trượt) t-1, t-2,... t-p thời đoạn
0, 1,2...,p: Các hệ số hồi qui, giá trị của các hệ số này giảm dần về 0 khi tăng giá trị trễ(trượt)k nếu
chuỗi dừng.
p: Mức tựu hồi qui
εt: Sai số dự bó của mô hình
Tự hồi qui bậc 1- AR(1): mô hình hồi qui với biến phụ thuộc Y t, còn biến đọc lập là Yt-1
t =0+1Yt-1+ εt (8.5)
Trong đó:
0: hằng số ban đầu

1: Hệ số hồi qui(độ dốc); với ràng buộc-1< 1<1


Ràng buộc -1<1<1 để đảm bảo tính dừng của chuỗi kết quả dự báo. thật vậy, mô hình tự
hồi qui bậc 1.
t =Yt-1+ εt
Nhưng : Yt-1=Yt-2+ εt-1
Thế vào t= εt+ εt-1+ Yt-2)
Yt-2= Yt-3+ εt-2
t = εt+ εt-1+ Yt-3+ εt-2))
Một cách tổng quát:
t = εt+ εt-1+ εt-2+...+p εt-p
2

Nếu trị số tuyệt đối của hệ số thì giá trị dự báo của t có xu hướng ttawng theo hời gian,
chuỗi như vậy không dừng
Tự hồi qui bậc 2- AR(2)
t =0+1Yt-1+2Yt-2+ εt (8.6)
Trong đó:
0: hằng số ban đầu

1: Hệ số hồi qui cho biến Yt-1; với ràng buộc-1<1<1

2: Hệ số hồi qui cho biến Yt-2; với ràng buộc -1<2<1 và 1+2<1 và 2-1<1
Yt-1,Yt-2: Chuỗi thời gian trể(trượt) 1 và 2 thời đoạn.
Thời đoạn Yt Thời đoạn Yt
Ví dụ 8.2: Cho bảng dữ liệu là doanh thu (tỷ đồng) 1 0.38 26 1.63
2 1.02 27 0.98
hàng tháng trong 50 thời đoạn của một cửa hàng bán
3 0.7 28 0.98
lẻ( Bảng 8.5). Hãy dự báo doanh thu cho thời đoạn thứ
4 1.16 29 1.13
51 của cửa hàng nêu trên sử dụng mô hình tự hồi qui. 5 1.11 30 1.3
6 0.93 31 1.61
7 1.32 32 1.31
Lời giải: 8 0.78 33 1.2
Tự hồi qui cấp 3 9 0.5 34 1.26
trượt doanh thu Yt trình bày ở bảng 8.5 đi 1,2, và 3 thời 10 0.72 35 1.32
11 0.69 36 0.85
đoạn dữ liệu cho mô hình tự hồi qui cấp 3 trình bày ở 12 0.41 37 1.13
bảng 8.6. Sử dụng vùng dữ liệu thời đoạn thứ 4 trở đi cho 13 1.16 38 1.24
mô hình tự hồi qui cấp 3 với biến phụ thộc là Yt, ba biến 14 1.35 39 1.08
15 0.68 40 0.85
độc lập là Yt-1, Yt-2 và Yt-3 được kết quả là các hệ số hồi 16 1.21 41 1.32
qui và trị thống kê của từng hệ số trình bày ở bảng 8.7. 17 0.69 42 1.53
Chọn mức ý nghĩa khi kiểm định α=0.05, giá trị p-value 18 0.35 43 1.75
19 0.7 44 1.11
của hệ số 2,3 đều lớn hơn 0.05 nên không bác bỏ giả 20 0.74 45 0.8
thuyết H0 21 0.52 46 0.41
Kết luận: không thể sử dụng mô hình hồi qui cấp 3 22 0.26 47 0.93
23 0.21 48 0.66
24 1.06 49 1.29
25 1.27 50 1.11
Thời đoạn Yt Yt-1 Yt-2 Yt-3
1 0.38 - - -
2 1.02 0.38 - -
3 0.7 1.02 0.38 -
4 1.16 0.7 1.02 0.38
5 1.11 1.16 0.7 1.02
6 0.93 1.11 1.16 0.7
7 1.32 0.93 1.11 1.16
8 0.78 1.32 0.93 1.11
9 0.5 0.78 1.32 0.93
10 0.72 0.5 0.78 1.32
11 0.69 0.72 0.5 0.78
12 0.41 0.69 0.72 0.5
13 1.16 0.41 0.69 0.72
14 1.35 1.16 0.41 0.69
15 0.98 1.35 1.16 0.41
16 1.21 0.98 1.35 1.16
17 0.69 1.21 0.98 1.35
18 0.35 0.69 1.21 0.98
19 0.7 0.35 0.69 1.21
20 0.74 0.7 0.35 0.69
21 0.52 0.74 0.7 0.35
22 0.26 0.52 0.74 0.7
23 0.21 0.26 0.52 0.74
24 1.06 0.21 0.26 0.52
25 1.27 1.06 0.21 0.26
26 1.63 1.27 1.06 0.21
27 0.98 1.63 1.27 1.06
28 0.98 0.98 1.63 1.27
29 1.13 0.98 0.98 1.63
30 1.3 1.13 0.98 0.98
31 1.61 1.3 1.13 0.98
32 1.31 1.61 1.3 1.13
Bảng 8.7: Kết quả của mô hình tự hồi qui cấp 3
Tự hồi qui cấp 2
Tương tự mô hình tự hồi qui cấp 3, mô hình
Giá trị Giá trị thống p-value hồi qui cấp 2 cũng không được lựa chọn vì hệ
Hệ số kê số 2 không có ý nghĩa thống kê như được trình
bày ở bảng 8.8
0.593676 3.503871 0.001084
0.552741 3.702094 0.000604
-0.02275 -0.13302 0.894802
-0.12295 -0.83114 0.410484
R2 0.284076 - -
F 5.687422 - 0.002265
Bảng 8.8: Kết quả của mô hình tự hồi qui cấp 2

Tự hôì qui cấp 1


Hệ số Giá trị Giá trị thống p-value Mô hình tự hồi qui cấp 1 gán biến phụ thuộc Yt, biến
kê độc lập Yt-1 sử dụng dữ liệu từ thời đoạn thứ 2 trở đi
0.50660 3.34965 0.001645 của bảng 8.6 để phân tích hồi qui thu được kết quả
0.53452 3.63048 0.000721 trình bày ở bảng 8.9
-0.04532 -0.31423 0.754798 Bảng 8.9: Kết quả của mô hình tự hồi qui cấp 1
R2 0.26292 - -
F 8.02587 - 0.001045
Hệ số Giá trị Giá trị thống p-value

0.522121 4.051856 0.001246
0.481021 3.897909 0.033203
R2 0.244296 - -
F 15.19369 - 0.000307
Biểu đồ tự tương quan riêng phần PACF(Partial
Correlation)

Phương trình hồi qui bậc 1,2, và p AR(1), AR(2), và AR(p)


viết lại ở dạng hệ số tự tương quan riêng phần như sau:
1 = Yt-1 + εt

2= 1Yt-1 + 2 Yt-2 + εt
... (8.8)
p= 1Yt-1 + 2 Yt-2 + ...+ p Yt-p+ εt
Giải hệ phương trình (8.8), ta có thể tìm ra giá trị của các hệ
số 1,2,...p
Hình 8.7 trình bày biểu đồ tự tương quan ACF và tự
tương quan riêng phần PACF cho dãy thời gian của ví dụ
8.2.Biểu đồ ACF thể hiện rằng, chuỗi thời gian sẽ dừng ở
hệ số trượt k=1. Ngoài ra, giá trị tham số k của biểu đồ
PACF được tính như sau:
1= r1 =0.4795

2= =-0.0283
Biểu đồ PACF cho doanh thu
8.3 Mô hình trung bình động ma (Moving average)

Mô hình trung bình động trượt q ký hiệu MA(q) dự báo giá trị Ŷt dựa trên
phối hợp tuyến tính các sai số của hiện tại và quá khứ.
Ŷt = µ + ɛt – ω1ɛt-1 – ω2ɛt-2 - … - ωqɛt-q (8.10)
Trong đó:
Ŷt : Giá trị dự báo tại thời điểm t.
µ: Giá trị trung bình của chuỗi thời gian.
ɛt: Sai số dự báo thời điểm t
ɛt-1, ɛt-2: Sai số dự báo quá khứ.
ω1, ω2,…, ωq: Hệ số ước lượng.
Lưu ý quy ước đặt dấu trừ trước các hệ số ước lượng. Do mô hình trung bình
động ban đầu dự báo dựa trên sai lệch quá khứ theo công thức.

Ŷt = ɛt + ω1ɛt-1 + ω2ɛt-2 + … + ωqɛt-q


Hình 8.11 Biểu đồ thể hiện mối liên hệ giữa giá trị
dự báo với sai số
Trung bình động trượt một thời đoạn MA(1):
Ŷt = µ + ɛt – ω1ɛt-1 (8.11)
Giá trị dự báo Ŷt của trung bình động là tổng có trọng số
của hai giá trị ɛ gần nhất.
Ŷt - µ = ɛt – ω1ɛt-1
Y Xt = ɛt – ω1ɛt-1
γ0 = Var(Ŷt - µ)2 = E(Xt2) = E[(ɛt – ω1ɛt-1)2)]
Y1 Y1 = E(ɛt2) - 2ω1E(ɛtɛt-1) + ω12E(ɛ2t-1)
Ŷt
= σ2 + ω12σ2 = σ2(1+ ω12)
γ1 = Cov(Xt, Xt-1) = E(Ŷt - µ)( Ŷt-1 - µ)
=E(Xt Xt-1) = E[(ɛt – ω1ɛt-1)( ɛt-1 – ω1ɛt-2)]
ɛt = Ŷt - µ =E(ɛtɛt-1) - ω1E(ɛtɛt-1) - ω1E(ɛ2t-1) + ω12E(ɛt-1ɛt-2)
= - ω1E(ɛ2t-1) = - ω1σ2

x1 t
Trung bình động trượt một thời đoạn MA(1):

Ŷt = µ + ɛt – ω1ɛt-1 (8.11)

Giá trị dự báo Ŷt của trung bình động là tổng có trọng số của hai giá trị ɛ gần nhất.

Ŷt - µ = ɛt – ω1ɛt-1

Xt = ɛt – ω1ɛt-1

γ0 = Var(Ŷt - µ)2 = E(Xt2) = E[(ɛt – ω1ɛt-1)2)]

= E(ɛt2) - 2ω1E(ɛtɛt-1) + ω12E(ɛ2t-1)

= σ2 + ω12σ2 = σ2(1+ ω12)

γ1 = Cov(Xt, Xt-1) = E(Ŷt - µ)( Ŷt-1 - µ)

=E(Xt Xt-1) = E[(ɛt – ω1ɛt-1)( ɛt-1 – ω1ɛt-2)]

=E(ɛtɛt-1) - ω1E(ɛtɛt-1) - ω1E(ɛ2t-1) + ω12E(ɛt-1ɛt-2)

= - ω1E(ɛ2t-1) = - ω1σ2
Hình 8.12 Biểu đồ ACF và PACF đặc trưng của trung bình động
trượt 1 thời đoạn MA(1)

ACF PACF

k k
0 0

-1 -1
(a)

1 1

k k

0 0

-1 -1
Biểu đồ PACF của hình 8.12 (a) có trị tự tương quan riêng phần ɸ i hoàn toàn âm và giảm dần
( theo hàm mũ). Giá trị tương quan r1 của biểu đồ ACF khác 0 rõ rệt; các giá trị tương quan r k
tiếp theo tắt về 0. Chuỗi thời gian có biểu đồ ACF và PACF như trên nên được dự báo bởi mô
hình động trượt 1 thời đoạn MA(1).
Tương tự phần trên, biểu đồ PACF của chuỗi thời gian hình 8.12 (b) có trị tự tương quan riêng
phần ɸi của biểu đồ PACF liên tục đổi dấu và giảm dần. Giá trị r1 của biểu đồ ACF cũng khác
0 rõ rệt còn các trị rk kế tiếp tắt về 0; chuỗi thời gian này cũng nên được dự báo bằng mô hình
động trượt 1 thời đoạn MA(1)
Mô hình trung bình động trượt 2 thời đoạn MA(2):

Ŷt = µ + ɛt – ω1ɛt-1 – ω2ɛt-2 (8.12)

Tương tự mô hình trung bình động trượt 1 thời đoạn, biểu đồ PACF cho mô hình động trượt 2
thời đoạn MA(2) có giá trị tự tương quan riêng phần ɸi hoàn toàn âm và giảm dần theo hàm
mũ (Hình 8.13b) hoặc lien tục đổi dấu và cũng giảm dần(Hình 8.13a). Trị r1, r2 của biểu đồ
ACF cũng khác 0 rõ rệt còn các trị rk kế tiếp tắt về 0; chuỗi thời gian này cũng nên được dự
báo bởi mô hình trung bình động trượt 2 thời đoạn MA(2).
Biểu đồ ACF và PACF cho mô hình trung bình động trượt 2 thời đoạn MA(2)

ACF PACF

k k
0 v
0

-1 -1
(a)

1 1

k k
0 0

(b)
-1 -1

Trong thực tế dự báo, do các dấu hiệu ở biểu đồ ACF và PACF


của một chuỗi thời gian không hoàn hảo như trường hợp của
hình 8.12 và 8.13 trên mà luôn có sự hiện diện của nhiễu nên
việc lựa chọn mô hình trung bình động trượt q thời đoạn MA(q)
thường không dễ dàng và rõ ràng.
Ví dụ 8.4: Xây dựng mô hình dự báo trung bình động trượt q thời đoạn
MA(q) cho chuỗi thời gian trình bày ở Bảng 8.12.
Bảng 8.12: Dữ liệu theo thời gian của một doanh nghiệp

STT Yt STT Yt STT Yt


1 0.37 11 0.68 21 0.67
2 0.32 12 0.85 22 0.99
3 0.95 13 0.63 23 0.82
4 1.40 14 1.29 24 0.57
5 1.04 15 1.14 25 0.99
6 1.44 16 0.68 26 1.35
7 1.33 17 0.48 27 1.16
8 1.10 18 0.50 28 1.42
9 0.73 19 1.13 29 1.12
10 0.63 20 1.12 30 1.14
TT Yt Ŷt ɛt
1 0.37 0.83953 -0.469529
Sử dụng phần mềm SPSS với dữ liệu ở Bảng 8.12 tính được kết 2 0.32 0.67363 -0.353630
3 0.95 0.73777 0.212226
quả dự báo trình bày ở Bảng 8.13 và 8.14. Do các tham số µ và 4 1.40 1.05095 0.349052
ω1 đều có ý nghĩa thống kê; bỏ qua sai lệch của thời điểm hiện 5 1.04 1.12667 -0.086675
6 1.44 0.88552 0.554479
tại ɛt, giá trị dự báo được tính bởi công thức 8.11 như sau: 7 1.33 1.24037 0.089632
8 1.10 0.98310 0.116902
Ŷt = 0.93349 + 0.5535* ɛt-1 9 0.73 0.99819 -0.268191
10 0.63 0.78506 -0.155061
11 0.68 0.84767 -0.167673
Giá trị dự báo cho thời điểm t = 31. 12 0.85 0.84069 0.009307
13 0.63 0.93864 -0.308643
Ŷ31 = 0.93349 + 0.5535* 0.243199 = 1.06809 14 1.29 0.76267 0.527327
15 1.14 1.22534 -0.085341
16 0.68 0.88626 -0.206259
Sai lệch ɛ31 = 0, thực hiện dự báo cho thời điểm t = 32 17 0.48 0.81934 -0.339337
18 0.50 0.74568 -0.245685
Ŷ32 = 0.93349 + 0.5535* 0 = 0.93349 19 1.13 0.79752 0.332483
TT Yt Ŷt ɛt
20 1.12 1.11750 0.002495
Từ thời điểm t = 32 trở đi, giá trị dự báo chính là giá trị trung 21 0.67 0.93487 -0.264872
bình µ. Như vậy, giả sử thời điểm hiện tại là t thì mô hình trung 22 0.99 0.78690 0.203103
23 0.82 1.04590 -0.225899
bình động trượt 1 thời đoạn MA(1) chỉ dự báo chính xác cho 24 0.57 0.80847 -0.238467
25 0.99 0.80151 0.188489
thời đoạn t + 1. Từ thời đoạn t + 2 trở đi, mô hình này giảm 26 1.35 1.03781 0.312189
dần độ chính xác. Bảng 8.15 hệ thống hóa kết quả dự báo Ŷt và 27 1.16 1.10627 0.053727
28 1.42 0.96323 0.456773
sai lệch ɛt từ mô hình MA(1). 29 1.12 1.18629 -0.066293
30 1.14 0.89680 0.243199
Kết quả dự báo: Thời đoạn Thời gian Doanh Dự báo Ŷt Sai lệch ɛt
thu Yt
µ = 0.93266
ω1 = -0.6007
… … … … …
ω2 = -0.0729
t–2 29 1.12 1.20371 -0.08371
Giả sử bỏ qua sai lệch hiện tại ɛt, giá trị dự báo cho thời điểm t
được tính bởi công thức. t–1 30 1.14 0.91502 0.22498

Ŷt = 0.93266 + 0.6007ɛt-1+ 0.0729 ɛt-2 T 31 - 1.06170 0


Giá trị dự báo cho thời điểm t = 31:
t+1 32 - 0.94906 0
Ŷt = 0.93266 + 0.6007 * 0.224982 + 0.0729 * -0.083706
= 1.06177 t+2 33 - 0.93266 0

Từ thời điểm t + 2 = 33 trở đi, giá trị dự báo chính là giá trị của
hằng số µ. Chi tiết kết quả tính toán được trình bày ở Bảng 8.17
Bảng 8.17: Dự báo theo mô hình trung bình trượt 2 thời đoạn
MA(2)
Sai số dự báo của mô hình MA(2)

MAE RMSE MAPE


0.241 0.299 33.447

Dựa trên tiêu chí sai số tuyệt đối trung bình MAE, mô hình trung
bình động trượt 2 thời đoạn MA(2) có sai số bé hơn mô hình
MA(1). Tuy nhiên không thể chọn MA(2) để dự báo cho dữ liệu
của ví dụ này bởi vì mức ý nghĩa α = 5%, tham số ω2 của mô hình
không có ý nghĩa thống kê. Lựa chọn mô hình dựa trên việc so
sánh sai số dự báo chỉ có thể áp dụng được trong trường hợp các
mô hình đều có ý nghĩa thống kê.
8.4 MÔ HÌNH ARMA(p,q)
Mô hình kết hợp tự hồi qui AR(p) và trung bình động MA(q)
với nhau để được mô hình hỗn hợp tự hồi qui – trung bình động.
Ký hiệu: ARMA(p,q).
Trong mô hình này:
p: bậc của phần tự hồi qui
q: mức trượt của trung bình động.
Mô hình ARMA(p,q) có dạng như sau:

(8.13)
Hình 8.15: Biểu đồ ACF và PACF cho chuỗi thời gian nên áp
dụng mô hình ARMA(1,1)
Hay ở dạng rút gọn: Mô hình ARMA(1,1):
(8.14) (8.15)
Trong đó: Chuỗi thời gian có giá trị và ở biểu đồ ACF và PACF giảm dần
: giá trị dự báo tại thời điểm t (dao động quanh trị trung bình, hoặc dương, hoặc âm), hệ số tự
tương quan và tự tương quan riêng phần có giá trị lớn nhất như
: hằng số ban đầu
được trình bày ở Hình 8.15 thì nên áp dụng mô hình
: hệ số tự hồi qui ARMA(1,1).
: hệ số ước lượng; lưu ý qui ước đặt dấu trừ Bảng 8.18 và Hình 8.16 tổng kết một số dấu hiệu từ biểu đồ
ACF và PACF mà người sử dụng có thể dựa vào đó để lựa chọn
: sai số dự báo thời điểm t
giữa 1 trong 3 mô hình tự hồi qui AR(p), trung bình động
: sai số dự báo quá khứ MA(q) và ARMA(p,q) để dự báo. Chuỗi thời gian có giá trị của
biểu đồ ACF giảm dần và dừng đột ngột tại q; giá trị của biểu
đồ tự tương quan riêng phần PACF cũng giảm dần và dừng đột
ngột tại p thì nên áp dụng mô hình kết hợp ARMA(p, q). Theo
Hanke [2] thì thông thường, giá trị của p và q ít vượt quá 2.
TT Yt
TT Yt
1 57 TT Yt
1 60
2 63 1 53
2 54
Bảng 8.18: Lựa chọn mô hình dự 3 75 2 50
3 41
4 85 3 53
4 35
báo dựa trên biểu đồ ACF và PACF 5 80
5 43 4 58
6 77 5 73
6 44
7 68 6 72
7 44
8 72 7 68
8 36
9 68 8 63
9 44
10 70 9 64
10 50
10 68

Mô hình Tự tương quan ACF Tự tương quan riêng phần


PACF
MA(q) Dừng đột ngột ở độ trượt q Tắt dần
AR(p) Tắt dần Dừng đột ngột ở độ trượt p
ARMA(p,q) Tắt dần và dừng đột ngột ở Tắt dần và dừng đột ngột ở
đột trượt q. đột trượt p.
Bảng 8.19 với khai báo mô hình kết hợp ARIMA(1,0,2), phần
Xây dựng biểu đồ ACF và PACF mềm SPSS tính ra các hệ số của mô hình như sau:
= 24.420 (t = 9.47)
= 0.5878 (t = 3.02)
= -0.5905 (t = -3.03)
= -0.5764 (t = -3.09).
Áp dụng công thức (8.14), bỏ qua sai lệch hiện tại được mô
hình kết hợp như sau.

Ví dụ giá trị dự báo cho thời điểm t = 31

Kết quả trị dự báo và sai lệch thực hiện bởi phần mềm SPSS
được trích ra ở Bảng 8.20 (giả sử sai lệch cho thời điểm t, = 0).

Thời đoạn t Thời gian

.. .. .. .. ..
t-2 29 44 37.6461 6.35391
t-1 30 50 50.1725 -0.1725
t 31 - 55.3684 0
t+1 32 - 54.8671 0
t+2 33 - 54.9665 0
Dự báo trị cho thời đọan t = 32

Dự báo thời điểm càng xa t, sai số dự báo càng lớn.


Sai số dự báo của mô hình ARMA(1,2)

MAE RMSE MAPE

5.1570 6.6480 9.4080

Dự báo bằng mô hình ARMA(1,3) được kết quả dự báo trình


bày ở Bảng 8.21. Cần phải thử mô hình ARMA(1,3) vì người dự
báo cần hướng đến các mô hình có bậc cao hơn nhằm tăng độ
chính xác. Mô hình ARMA(1,3) có sai số dự báo thấp hơn mô
hình ARMA(1,2). Tuy nhiên ở mô hình ARMA(1,3), các hệ , ,
đều không có ý nghĩa thống kê tức là không thể sử dụng mô
hình này để dự báo. Kết luận, sử dụng mô hình ARMA(1,2) để
dự báo cho dãy số thời gian của ví dụ này.
Thực tế dự báo, người sử dụng thường phải kiểm tra mô hình đang dự báo bằng một
mô hình khác hay cũng với mô hình kết hợp ARMA(p,q) nhưng với giá trị p, q khác
theo thiên hướng tăng giá trị p, q rồi dựa trên tiêu chí sai số để chọn lựa giá trị p, q
và mô hình phù hợp. Ở mô hình phù hợp, từng hệ số của mô hình và toàn bộ mô
hình phải có ý thống kê. Ở Ví dụ 8.4 này mô hình ARMA(1,3) không được chọn do
các hệ số , , không có ý nghĩa thống kê. Hình 8.18 trình bày biểu đồ thể hiện doanh
thu và giá trị dự báo khi thực hiện bằng mô hình ARMA(1,2). Xét thấy đường dự
báo bám rất sát đường dữ liệu , ngoài ra thì sai số dự báo MAE tương đối thấp nên
kết quả dự báo là đáng tin.

MAE RMSE MAPE


5.0010 6.5870 9.0150
8.5. Tịnh hóa dữ liệu
Để dự báo một chuỗi thời gian theo các mô hình AR(p), MA(q) hay ARAMA(p,q), điều kiện tiên quyết là
chuỗi dữ đó phải dừng. Nếu chuỗi không dừng thì ta xử lý bằng cách lấy sai phân để có được chuỗi dừng. Qui
trình lấy sai phân để được chuỗi dừng được gọi là tịnh hóa dữ liệu. Giả sử chuỗi ban đầu không dừng nhưng
sai phân bậc I của nó có thể là 1 chuỗi dừng. VD mô hình sai phân kết hợp hồi qui trung bình động cho sai
phân lần 1.

Hoặc (8.16)
Trong đó Trị dự báo tại thời điểm t Hằng số ban đầu
Hệ số tự hồi qui Hệ số ước lượng, lưu ý qui ước đặt dấu trừ
Sai số dự báo thời điểm t : Sai số dự báo thời điểm t-1
Mô hình kết hợp sai phân với AR(p), MA(q) đươc gọi là mô hình ARIMA(p,d,q). Nếu chuỗi ban đầu là chuỗi
dừng thì d=0 và mô hình ARIMA trở thành ARMA
Ví dụ sau đây là 1 ví dụ cần phải tịnh hóa dữ liệu
T
Ví dụ 8.6: Sản lượng theo thời gian của 1 doanh nghiệp sản xuất được trình bày ở Bảng 8.23. 66 46.97
Hãy xây dựng mô hình dự báo sản lượng cho thời điểm 201? 2
T T 67 47.43
T T T
5
1 0.160 14 8.384 27 17.399 40 27.273 53 37.212
68 47.58
2 0.570 15 9.816 28 18.369 41 28.536 54 38.247 7

16 10.614 29 19.268 42 29.423 55 38.745 69 48.02


3 1.406
0
4 1.926 17 10.988 30 20.208 43 29.704 56 39.129
70 48.86
5 2.676 18 11.398 31 21.030 44 30.763 57 39.406 7
6 4.033 19 12.340 32 22.011 45 32.399 58 39.129 71 49.46
4
7 5.189 20 13.162 33 22.564 46 33.842 59 41.160
72 50.15
8 5.619 21 13.543 34 22.923 47 34.788 60 42.384 3
9 5.831 22 13.837 35 24.076 48 35.156 61 43.457 73 50.96
49 35.375 62 44.134 8
10 5.977 23 14.541 36 25.307
74 52.23
11 6.584 24 15.495 37 26.013 50 35.816 63 45.133 0
12 7.237 25 16.072 38 26.282 51 36.547 64 45.803 75 53.67
39 26.637 52 37.212 65 46.142 1
13 7.475 26 16.612
76 55.16
6
T T T T T T T
83 60.931 101 76.831 118 89.235 135 103.326 152 121.418 170 133.770 187 147.529
102 77.811 119 90.161 136 104.573 153 122.311 171 134.652 188 148.699
84 61.901 137 105.776 154 123.499 172 136.127
103 78.687 120 91.432 189 149.201
85 62.835
104 79.392 121 92.592 138 106.497 155 124.123 173 137.121 190 149.937
86 64.219
105 79.798 122 93.696 139 107.681 156 125.136 174 138.285 191 150.720
87 65.439
106 80.850 123 94.480 140 109.156 157 125.864 175 139.541
88 66.163
192 151.109
107 81.770 124 95.246 141 110.411 158 126.220 176 140.398
89 66.609 193 151.924
108 82.037 125 96.321 142 111.723 159 127.121 177 140.883
90 67.508 194 153.270
109 82.963 126 97.167 143 113.105 160 127.710 178 141.275
91 68.352 195 154.349
110 83.757 127 97.444 144 114.293 161 128.056 179 141.823
92 69.137 196 155.530
111 84.156 128 97.854 145 115.676 162 128.968 180 142.586
93 69.592 197 156.529
112 84.392 129 98.729 146 116.802 163 129.517 181 143.149
94 70.592 198 157.396
95 71.869 113 85.033 130 99.283 147 117.279 164 129.657 182 144.266
199 158.779
96 72.419 114 86.141 131 100.288 148 117.984 165 130.53 183 145.443
200 160.147
97 72.569 115 86.683 132 101.584 149 119.082 166 131.125 184 145.897
98 73.233 116 87.680 133 102.224 150 120.202 167 131.619 185 146.110
99 74.656 117 88.610 134 102.702 151 121.005 168 132.691 186 146.465
Biểu đồ ACF chi Sản lượng
1.0

0.8

0.6

0.4

0.2

0.0

rk
-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
Biểu đồ PACF cho Sản lượng k

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
k
Biểu đồ ACF cho sản lượng
(with 5% significance limits for the autocorrelations)

1.0

0.8

0.6

0.4

0.2

0.0

rk
-0.2

-0.4
Biểu đồ PACF cho Sản lượng
-0.6
1.0 -0.8

0.8 -1.0

0.6 1 5 10 15 20 25 30 35 40 45 50
Partial Autocorrelation

0.4
k

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50
k
Dựa trên biểu đồ tự tương quan ACF Hình 8.19(a) chuỗi thời gian này chỉ dừng ở
độ trượt k=18 nên áp dụng mô hình trung bình động với hệ số trượt k>= 18. Mô
hình này quá phức tạp để dự báo. Nếu áp dụng mô hình AR(1) thì hằng số có p-
value=0.898 nên mô hình không có ý nghĩa thống kê. Giải pháp sử dụng sai phân
của dữ liệu (tịnh hóa dữ liệu) để giảm mức phức tạp của mô hình được sử dụng
trong TH này.
Gias trij p,d,q cuar mô hình ARIMA được xác định như sau. Chọn d=1, dữ liệu
được tịnh hóa có trị tự tương quan riêng (PACF) giảm dần, trị tự tương quan rk
dừng đột ngột ở độ trễ k=1 nên áp dụng mô hình trung bình động trượt 1 thời đoạn
MA(1) tức chọn q=1, p=0 tham số mô hình ARIMA(0,1,1). Nhập số liệu cho phần
mềm, tính được
Áp dụng CT 8.11, bỏ qua sai số thời đoạn t

Giá trị dự báo tại t=201


Kết quả giá trị dự báo và sai lệch được tính bằng SPSS trong bảng sau

Thời đoạn Thời gian Sản lượng Y_t


… … … … …
t-3 198 157.396 157.245 0.151219
t-2 199 158.779 158.318 0.460728
t-1 200 160.147 159.946 0.201085
t 201 161.109 0

Sai số dự báo của mô hình ARIMA(0,1,1)


MAE RMSE MAPE
0.2530 0.2920 1.2600

Hình sau thể hiện biểu đồ sản lượng Yt và dự báo khi thực hiện bằng mô hình ARIMA(0,1,1).
Đường dự báo rất giống với đường dữ liệu và sai lệch nhỏ nên kết quả dự báo thời điểm cuối 201 là
đáng tin
Biểu đồ giá trị dự báo

160

150
Sản lượng

140

130

120

150 160 170 180 190 200


Thời gian
8.6. Mô hình
ARIMA cho dữ
liệu có tính mùa
vụ

Nhóm 7
Tính mùa vụ của chuỗi thời gian có thể đươc nhận dạng bằng biện pháp phân tích chỉ số mùa vụ đã được
trình bày ở các phần trước. Ngoài ra tính mùa vụ của dữ liệu thời gian dự báo bằng mô hình ARIMA có
thể được nhân dạng thông qua quan sát biểu đồ tự tương quan ACF. Nếu các hệ số tương quan r_k của
biểu đồ ACF tương quan với nhau với chu kỳ là các tuàn trong tháng hay quý trong năm thì đó có tính
thời vụ
Ví dụ 8.7: Sản lượng theo tháng của 1 DN sản xuất hàng tiêu dùng ở bảng 8.25, xây dựng mô hình
ARIMA để dự báo sản lượng cho thời điểm 116?
Thời gian Sản lượng Y_t Thời điểm Sản lượng Yt Thời gian Sản lượng Y_t Thời gian Sản lượng Y_t

1 1736.8 30 1911 59 2072.2 88 2028


2 1297.4 31 1695 60 1952.6 89 2236
3 1757.6 32 1757.6 61 2134.6 90 2028
4 1455.6 33 1944.8 62 1799.2 91 2100.8
5 1526.3 34 2108.6 63 756.6 92 2327
6 1419.6 35 1895.4 64 1890.2 93 2225.6
7 1484.6 36 1822.6 65 2256.8 94 2321.8
8 1651 37 2054 66 2111.2 95 2275
9 1661.4 38 1544.4 67 2080 96 2171
10 1851.2 39 600.6 68 2191.8 97 2431
11 1617.2 40 1604.2 69 2202.2 98 2165.8
12 1614.6 41 1796.6 70 2449.2 99 780
13 1757.6 42 1822.6 71 2090.4 100 2056.6
14 1302.6 43 1835.6 72 2184 101 2340
15 572 44 1944.8 73 2267.2 102 2033.2
16 1458.6 45 2009.8 74 1705.6 103 2288

17 1567.8 46 2116.4 75 962 104 2275

18 1627 47 1994.2 76 1929.2 105 2581.8

19 1575.6 48 1895.4 77 2202.2 106 2615.6

20 1682.2 49 1947.4 78 1903.2 107 2519.4

21 1710.8 50 1770.6 79 2337.4 108 2267.2

22 1853.8 51 626.6 80 2022.8 109 2615.6

23 1788.8 52 1768 81 2225.6 110 2163.2

24 1822.4 53 1840.8 82 2441.4 111 899.6

25 1838.2 54 1804.4 83 2113.8 112 2210

26 1635.4 55 2007.2 84 2035.8 113 2376.4

27 618.8 56 2067 85 2152.8 114 2259.4

28 1593.8 57 2048.8 86 1708.2 115 2584.4

29 1898 58 2314 87 806


Hình 8.22. Biểu đồ biểu diễn sản lượng

2500

2000
Yt

1500

1000

500
0 20 40 60 80 100 120
t
Dựa trên biểu đồ biểu diễn sản lượng theo thời gian (8.22) ta có nhận xét sản lượng vừa có tính mùa vụ, vừa
có tính xu hướng. Để chính xác hơn ta xét bằng độ tương quan theo chu kỳ năm của các hệ số tự tương quan
đó là hệ số Từ biểu đồ tương quan hình 8.23 ta KL các hệ số này có tự tương quan với nhau với chu kỳ 1
năm. Dữ liệu có tính mùa vụ

Biểu đồ tự tương quan ACF

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50 55 60
Do dữ liệu không dừng tại nên áp dụng biện pháp tịnh hóa dữ liệu nhằm thu được chuỗi dừng. Biện pháp tịnh
hóa cho dữ liệu mùa vụ được thực hiện theo mô hình ARIMA(p,d,q)(P,D,Q)_12. Lấy sai phân cấp 1 của chuỗi
thời gian được biểu đồ tự tương quan ACF và tự tương quan riêng phần PACF trình bày ở hình 8.24. Do trị tự
tương quan của biểu đồ ACF dừng đột ngột ở độ trễ(trượt) k=12 và tương quan riêng phần PACF có xu hướng
giảm dần theo thời gian nên áp dụng mô hình ARIMA(0,0,0)(0,1,1)_12 tức tịnh hóa dữ liệu mùa vụ dung sai
phân cấp 1, trung bình động mùa trượt 1 thời đoạn MA(1).
Hình 8.25 trình bày lại biểu đồ ACF và PACF với sai phân cấp 1, kiêu mùa vụ sử dụng phần mềm Minitab. Biểu
đồ ACF ở hình 8.24 chỉ thể hiện giá trị các r_k chu kỳ tức còn ACF ở hình 8.25 thể hiện tất cả các giá trị r_k.
Khi sử dụng mô hình ARIMA mùa vụ, chỉ cần quan tâm đến các r_k chu kỳ tức là r_k không dừng có tính chu
kỳ.
Công thức tính sai phân cấp 1 chu kỳ 1 năm 12 tháng

Mô hình hồi qui sai phân cấp 1 trung bình động trượt 1 thời đoạn cho mùa vụ.

Trong đó:
Trị dự báo tại thời điểm t Hằng số ban đầu, Hệ số ước lượng, lưu ý qui ước đặt dấu trừ.
Sai số dự báo thời điểm t, Sai số dự báo thời điểm t-12
Nhập số liệu là chuỗi thời gian trình bày ở Bảng 8.25 với khai báo mô hình
ARIMA(0,0,0)(0,1,1)_12 vào phần mềm SPSS được các tham số của mô hình như
sau:

Hình 8.24. Biểu đồ ACF và PACF của sai phân cấp 1 (phần mềm SPSS)
Biểu đồ tự tương quan ACF sai phân cấp 12
1.0

0.8

0.6

0.4

0.2

0.0

rk
-0.2

-0.4
Biểu đồ PACF cho Sản lượng của sai phân cấp 12
-0.6
1.0
-0.8
0.8
-1.0
0.6
1 5 10 15 20 25 30 35 40 45 50 55 60
0.4
k
0.2

0.0

-0.2

-0.4

-0.6

-0.8

-1.0

1 5 10 15 20 25 30 35 40 45 50 55 60
k
Bảng 8.26. Giá trị dự báo và sai lệch theo mô hình ARIMA(0,0,0)(0,1,1)_12

Thời đoạn t Thời gian Sản lượng Y_t

… … … … …
t-24 92 2327.00 2247.49 79.5138
t-12 104 2275.00 2347.42 -72.4178
t 116 2419.69 0

Áp dụng công thức 8.18, bỏ qua sai lệch tại thời điểm t tức ,giá trị dự báo:

Kết quả trị dự báo và sai lệch thực hiên bởi phần mềm SPSS được trích ra ở Bảng 8.26 (giả sử sai lệch cho thời
điểm t, =0)

Sai số dự báo của mô hình

MAE RMSE MAPE


92.0290 114.7220 5.55
Hình 8.27 thể hiện biểu đồ sản lượng và dự báo khi thực hiện bằng mô hình . Đường dự báo bám rất sát đường dữ
liệu sản lượng chứng minh sự phù hợp của mô hình dự báo.

Biểu đồ sản lượng Yt và dự báo của ví dụ 8.7

2500

2000

1500

1000

500
0 20 40 60 80 100 120
t
8.7. Các bước cơ bản của phương pháp
ARIMA (BOX-JENKINS)

Phần này hệ thống hóa qui trình dự báo bằng mô hình


ARRIMA nhằm giúp người đọc khaiis quát hóa cũng như áp
dụng được qui trình thực tế dự báo.
Bước 1: Xác định mô hình
1. Trong giai đoạn nhận diện mô hình cần làm rõ dữ liệu có
tính dừng hay không. Thường thì chuỗi dữ liệu không dừng
có thể biến đổi thành chuỗi dừng sau khi lấy sai phân cấp 1
hoặc cấp 2. giả sử một chuỗi ban đầu Yt không dừng nhưng
sai phân bậc 1 của nó Yt =Yt – Yt-1 thường dừng. Giả sử áp
dụng mô hình ARIMA(1,1,1) được mô hình dự báo như sau:

t = 0 + 1 Yt-1 +t – 1t-1

Hoặc: ( t - Yt-1 ) = 0 + 1(Yt-1 - Yt-2 )+t - 1t-1


Hình 8.27: Biểu đồ sản lượng Yt và dự báo t của ví dụ 8.7

Trong một số trường hợp, nếu chuỗi không dừng nhưng sẽ


dừng ở hệ số trượt k≤2 ta có thể không cần tịnh hóa( làm cho
dừng) dữ liệu mà áp dụng trực tiếp mô hình trung bình động
hoặc tự hồi cấp k. Ví dụ tự hồi qui cấp 1 AR(1) có mô hình như
sau:

t =0 + 1 Yt-1

Mô hình trên sử dụng dữ liệu đã được trược đi 1 thời đoạn tức


Yt-1 nên không cần tịnh hóa vqanx không dẫn đến sai lệch ở giá
trị dự báo.
Nếu dữ liệu có tính mùa vụ tức giá trị tự tương quan r k không
dừng với chu kỳ ≤1 năm thì sai phân cấp k của dữ liệu với chu
kỳ ≤1( 12 tháng hoặc 4 quý) sẽ dừng.
Bước 2: Ước lượng các tham số của mô hình.
1. ước lượng các tham số mô hình.
Người ta thường sử dụng phần mềm (như SPSS, Minitab, Eviews) để ước tính các tham số của mô
hình. Chẳng hạn sử dụng SPSS để xây dựng mô hình dự báo ARIMA cho vd 8.2. Do trị tự tương
quan rk của biểu đồ ACF giảm dần, còn trị tự tương quan riêng phần k của PACF dừng đột ngột ở
mức trượt k=1, (hình 8.7) nên chọn mô hình tự hồi quy trượt 1 thời đoạn AR(1) tức là chọn mô hình
dự báo là ARIMA(1,0,0,0). Xử lý bằng phần mềm SPSS được giá trị tham số được trình bày ở bảng
8.10.
Mô hình dự báo: t = 0.4768 + 0.5087Yt-1
p-value (.00) (.000)
Giả thiết H0 : 1=0 tức hệ số chính của mô hình tự hồi qui không có ý nghĩa thống kê ở mức ý nghĩa
α=0.05. Giá trị thống kê p-value của 1 = 0.00 < α=0.05, nên bác bỏ giả thuyết H0 tức hệ số 1 có ý nghĩa thống
kê.
Áp dụng mô hình ARMIMA(0,0,1) tức trung bình động cấp 1 MA(1) cho cùng dữ liệu của VD 8.2 này
được kết quả trình bày ở bảng 8.27
Gỉa thiết H0 : 1 =0 tức hệ số chính của mô hihf MA(1) không có ý nghĩa thống kê ở mức ý nghĩa α=0.05.
Giá trị thống kê p-value của 1=0.02< α=0.05, nên bác bỏ giả thiết H0 tức 1 có ý nghĩa thống kê.
Áp dụng mô hình ARMIMA(0,0,1) tức trung bình động cấp 1 MA(1) cho cùng dữ
liệu của VD 8.2 này được kết quả trình bày ở bảng 8.27
Gỉa thiết H0 : 1 =0 tức hệ số chính của mô hình MA(1) không có ý nghĩa thống kê ở
mức ý nghĩa α=0.05. Giá trị thống kê p-value của 1=0.02< α=0.05, nên bác bỏ giả thiết H0
tức 1 có ý nghĩa thống kê.
Bảng 8.27: Tham số ước lượng theo mô hình ARIMA(0,0.1)

Esstimate(ước T( thống kê Sig.(p-value)


lượng) Student)
Hằng số μ 0.9736 14.61 .000
MA1 -0.4313 -3.29 0.002
Xem lại biểu đồ ACF và PACF Hình 8.7 thấy rằng giá trị của cả r 1 lẫn 1 đều
khác 0 một cách có ý nghĩa nên cả hai mô hình đó là MA(1) hoặc AR(1) đều có
thể lựa chọn( có ý nghĩa thống kê)
1. Tính sai số phần dư bình phương trung bình MSE.

S2 =
Trong đó :

1 = Yt-t : Phần dư tại thời điểm t

n: Số lượng phần dư
r: Tổng số tham số ướclượng( kể cả hằng số 0)

Sai số phần dư bình phương càng nhỏ càng tốt, người ta còn dùng chỉ tiêu này
để so sánh lựa chọn mô hình.
Tiêu chuẩn thông tin Akaike(AIC)
AIC= ln2 + (8.20)
Trong đó:
ln: Lô-ga-rít tự nhiên
2
: Tổng bình phương sai lệch phần dư, chia cho tổng số quan sát
n: Số lượng quan sát(phần dư)
r: : Tổng tham số của mô hình dự báo
Tiêu chuẩn thông tin Bayes
BIC= ln2 + (8.21)
Thường thì cả hai tiêu chuẩn AIC và BIC đều cho cùng 1 kết quả
Bước 3: Kiểm định phần dư
1.Biểu đồ phần dư và phân phối của chúng được dùng để kiểm định tính ngẫu nhiên(của phần dư) của mô hình
ARIMA.
2. Các hệ số tự tương quan của phần dư rk(ε) ở biểu đồ ACF và PACF phần dư phải lân cận 0 và nằm bên trong
khoảng
3.Hảnh vi của hàm tự tương quan phần dư, nói chung phải tương ứng với hồi qui nhận được đối với tập hợp sai số
ngẫu nhiên.
Bước 4: Dự báo dựa vào mô hình lựa chọn
1. Khi tìm được mô hình phù hợp có thể tiến hành dự báo cho một hoặc vài thời đoạn tiếp theo.Lưu ý, mô hình
ARIMA chỉ phù hợp để dự báo trong ngắn hạn, thời đoạn dự báo càng xa, sai số dự báo càng lớn
2. Khi có dữ liệu quan sát mới, nên đưa điiểm quan sát này vào mô hình để làm ngắn thời đoạn dự báo
3. Nếu đặc điểm hành vi của chuỗi có thể bị thay đổi bởi dữ liệu mới, có thể phải ước lượng lại các tham số mô
hình, hoặc thậm chí xây dựng mô hình mới

You might also like