Professional Documents
Culture Documents
Chương 8 Phương Pháp Arima
Chương 8 Phương Pháp Arima
DỰ
BÁO BẰNG
PHƯƠNG PHÁP
ARIMA (BOX-
JENKINS)
8.1 TÍNH DỪNG CỦA CHUỖI THỜI GIAN
ĐỊNH NGHĨA
Một chuỗi thời gian được cho là có tính dừng khi giá trị của chuỗi dao động quanh giá trị trung bình và độ lớn ph
thời gian.
TẦM QUAN TRỌNG
-Trong dự báo chuỗi thời gian, không thể dự báo cho tương lai nếu bản chất dữ liệu luôn thay đổi.
•Trong phân tích hồi quy, nếu chuỗi thời gian không dừng thì kết quả của phân tích hồi quy tuyến tính sẽ không c
Chuoi thoi gian dung
105,0
102,5
Yt
100,0
97,5
95,0
2 4 6 8 10 12 14 16
Thoi gian
KIỂM ĐỊNH TÍNH DỪNG CỦA CHUỖI THỜI GIAN
Hình 8.2: Chuỗi thời gian chỉ dừng trị trung bình( phương sai
thay đổi)
Hình 8.3: Chuỗi thời gian không dừng cả trị trung bình
120 và phương sai
110
108
100
Yt
106
90
104
80 102
100
Yt
70
2 4 6 8 10 12 14 16
Th?i gian 98
96
94
92
2 4 6 8 10 12 14 16
Thoi gian
Thống kê t (Student)
Giả sử
Dữ liệu phân bố chuẩn.
Mức ý nghĩa = 5%, tương ứng với trị thống kê Student bằng 2
Giả thuyết:
Hệ số tương quan:
(8.1)
Trong đó:
: giá trị trung bình của chuỗi thời số thời gian Yt.
k: độ trễ (trượt)
n: số lượng quan sát (mẫu) của chuỗi Yt.
Yt-k: chuỗi được tạo thành bằng cách trượt đi k thời đoạn.
Giá trị rk (-1, 1)
Nếu rk ( => chuỗi dừng, chấp nhận H0, bác bỏ H1
Nếu rk không thuộc khoảng trên, thì chuỗi không dừng ở độ trễ (trượt) k.
Biểu Đồ Tự Tương Quan ACF
Là biểu đồ sử dụng trục hoành để biểu diễn mức độ trễ
( trượt) k, còn trục tung là giá trị của hệ số tự tương
quan rk. Khoảng được biểu diễn như hai đường biên.
Giá trị rk nằm bên trong hai đường biên trên thì chuỗi
thời gian được gọi là dừng ở độ trễ (trượt) k.
Là một công cụ hình ảnh tốt để biểu diễn tính dừng của
chuỗi thời gian. (hình 8.4a, 8.4b)
Ngoài ra, ACF còn thể hiện được tính chất dừng của
chuỗi thời gian. (hình 8.4c, 8.4d
Hình 8.4: Biểu đồ tự tương quan ACF(SGK/326)
Ví dụ 8.1: Hãy kiểm định tính dừng của chuỗi Doanh thu
thời gan biểu diễn doanh thu trong một năm của Doanh thu Doanh thu trượt trượt 1
Tháng thời đoạn
một cửa hàng bán điện thoại thông minh trình Yt 1 thời đoạn Yt-1
Yt-2
bày ở bảng 8.1 sau
1 123 - -
2 130 123 -
Lời giải: 3 125 130 123
Áp dụng công thức 8.1 với độ trễ k=1: 4 138 125 130
= = 0.572 5 145 138 125
6 142 145 138
7 141 142 145
8 146 141 142
9 147 146 141
10 157 147 146
11 150 157 147
12 160 150 157
= = 142
Sử dụng dữ liệu doanh thu Yt và doanh thu trượt Tháng Yt Yt-1
một thời đoạn Yt-1 (bảng 8.2) để vẽ biểu đồ phân
1 123 - -19 - 361 -
tán (hình 8.5)
2 130 123 -12 -19 144 228
Nhận xét: Yt và Yt-1 có mối quan hệ đồng biến 3 125 130 -17 -12 289 204
với mức độ vừa phải đúng giá trị của hệ số tự 4 138 125 -4 -17 16 68
tương quan r1= 0.572 5 145 138 3 -4 9 -12
6 142 145 0 3 0 0
7 141 142 -1 0 1 0
8 146 141 4 -1 16 -4
9 147 146 5 4 25 20
10 157 147 15 5 225 75
11 150 157 8 15 64 120
12 160 150 18 8 324 144
Hình 8.5: Biểu đồ phân tán biểu diễn tương quan giữa Y t và Yt-1
160
150
Yt
140
130
120
120 130 140 150 160
Yt-1
*Kiểm định bằng thống kê t (Student)
Giá trị biên (mức ý nghĩa = 5%) Hình 8.6: Biểu đồ tự tương quan ACF.
rk= 0.572 (k=1) (-0.577; 0.577)
K rk
Do đó: chuồi thời gian có tính dừng ở độ trễ k=1
0 1
1 0.571913
2 0.462687
3 0.110583
4 0.015604
5 -0.033243
6 -0.101764
7 -0.250339
8 -0.327680
9 -0.466079
10 -0.249661
11 -0.232022
Bảng 8.3: Trị thống kê Q của
Kiểm định bằng thống kê Q
doanh thu
Giả thiết giá trị tới hạn
H0: (chuỗi dừng)
H1: Hệ số tương quan
Trượt k n-k Thống kê Q
Mức ý nghĩa =0.05, Q có phân phối với rk
bậc tự do n-1=11, tra bảng phân phối Chi 1 0.571913 11 0.02973 5
bình phương ta được trị tới hạn: 2 0.462687 10 0.02141 8.59
3 0.110583 9 0.00136 8.82
4 0.015604 8 0.00003 8.83
Áp dụng công thức 8.3 để tính thống kê 5 -0.033243 7 0.00016 8.85
6 -0.101764 6 0.00173 9.14
Q với rk như bảng 8.2 ta được bảng sau:
7 -0.250339 5 0.01253 11.25
8 -0.327680 4 0.02684 15.76
Với k=1, trị thống kê Q= 5 (3.815; 9 -0.466079 3 0.07241 27.92
21.92) 10 -0.249661 2 0.03117 33.16
Kết luận: chuỗi dừng ở hệ số trượt k=1 11 -0.232022 1 0.05383 42.20
0.25120
8.2. Mô hình tự hồi qui (AR)
Thông thường, giá trị dữ liệu dãy số thời gian tại một thời điểm có liên quan với giá trị ở thời điểm
trước đó. Mô hình hồi qui sinh ra giá trị dự báo bằng cách sử dụng một hay nhiều giá trị dữ liệu của
các thời điểm trước đó.
Yt=f(Yt-1,Yt-2,..., Yt-p, εt)
1Yt-1,...,Yt-p), ô hình tự hồi qui tổng quát bậc p
t =0+1Yt-1+2Yt-2 +...+pYt-p+ εt (8.4)
Trong đó:
t : Giá trị dự báo của giá trị thời gian tại thời điểm t.
Yt-1,Yt-2....Yt-p: Chuỗi thời gian trễ(trượt) t-1, t-2,... t-p thời đoạn
0, 1,2...,p: Các hệ số hồi qui, giá trị của các hệ số này giảm dần về 0 khi tăng giá trị trễ(trượt)k nếu
chuỗi dừng.
p: Mức tựu hồi qui
εt: Sai số dự bó của mô hình
Tự hồi qui bậc 1- AR(1): mô hình hồi qui với biến phụ thuộc Y t, còn biến đọc lập là Yt-1
t =0+1Yt-1+ εt (8.5)
Trong đó:
0: hằng số ban đầu
Nếu trị số tuyệt đối của hệ số thì giá trị dự báo của t có xu hướng ttawng theo hời gian,
chuỗi như vậy không dừng
Tự hồi qui bậc 2- AR(2)
t =0+1Yt-1+2Yt-2+ εt (8.6)
Trong đó:
0: hằng số ban đầu
2: Hệ số hồi qui cho biến Yt-2; với ràng buộc -1<2<1 và 1+2<1 và 2-1<1
Yt-1,Yt-2: Chuỗi thời gian trể(trượt) 1 và 2 thời đoạn.
Thời đoạn Yt Thời đoạn Yt
Ví dụ 8.2: Cho bảng dữ liệu là doanh thu (tỷ đồng) 1 0.38 26 1.63
2 1.02 27 0.98
hàng tháng trong 50 thời đoạn của một cửa hàng bán
3 0.7 28 0.98
lẻ( Bảng 8.5). Hãy dự báo doanh thu cho thời đoạn thứ
4 1.16 29 1.13
51 của cửa hàng nêu trên sử dụng mô hình tự hồi qui. 5 1.11 30 1.3
6 0.93 31 1.61
7 1.32 32 1.31
Lời giải: 8 0.78 33 1.2
Tự hồi qui cấp 3 9 0.5 34 1.26
trượt doanh thu Yt trình bày ở bảng 8.5 đi 1,2, và 3 thời 10 0.72 35 1.32
11 0.69 36 0.85
đoạn dữ liệu cho mô hình tự hồi qui cấp 3 trình bày ở 12 0.41 37 1.13
bảng 8.6. Sử dụng vùng dữ liệu thời đoạn thứ 4 trở đi cho 13 1.16 38 1.24
mô hình tự hồi qui cấp 3 với biến phụ thộc là Yt, ba biến 14 1.35 39 1.08
15 0.68 40 0.85
độc lập là Yt-1, Yt-2 và Yt-3 được kết quả là các hệ số hồi 16 1.21 41 1.32
qui và trị thống kê của từng hệ số trình bày ở bảng 8.7. 17 0.69 42 1.53
Chọn mức ý nghĩa khi kiểm định α=0.05, giá trị p-value 18 0.35 43 1.75
19 0.7 44 1.11
của hệ số 2,3 đều lớn hơn 0.05 nên không bác bỏ giả 20 0.74 45 0.8
thuyết H0 21 0.52 46 0.41
Kết luận: không thể sử dụng mô hình hồi qui cấp 3 22 0.26 47 0.93
23 0.21 48 0.66
24 1.06 49 1.29
25 1.27 50 1.11
Thời đoạn Yt Yt-1 Yt-2 Yt-3
1 0.38 - - -
2 1.02 0.38 - -
3 0.7 1.02 0.38 -
4 1.16 0.7 1.02 0.38
5 1.11 1.16 0.7 1.02
6 0.93 1.11 1.16 0.7
7 1.32 0.93 1.11 1.16
8 0.78 1.32 0.93 1.11
9 0.5 0.78 1.32 0.93
10 0.72 0.5 0.78 1.32
11 0.69 0.72 0.5 0.78
12 0.41 0.69 0.72 0.5
13 1.16 0.41 0.69 0.72
14 1.35 1.16 0.41 0.69
15 0.98 1.35 1.16 0.41
16 1.21 0.98 1.35 1.16
17 0.69 1.21 0.98 1.35
18 0.35 0.69 1.21 0.98
19 0.7 0.35 0.69 1.21
20 0.74 0.7 0.35 0.69
21 0.52 0.74 0.7 0.35
22 0.26 0.52 0.74 0.7
23 0.21 0.26 0.52 0.74
24 1.06 0.21 0.26 0.52
25 1.27 1.06 0.21 0.26
26 1.63 1.27 1.06 0.21
27 0.98 1.63 1.27 1.06
28 0.98 0.98 1.63 1.27
29 1.13 0.98 0.98 1.63
30 1.3 1.13 0.98 0.98
31 1.61 1.3 1.13 0.98
32 1.31 1.61 1.3 1.13
Bảng 8.7: Kết quả của mô hình tự hồi qui cấp 3
Tự hồi qui cấp 2
Tương tự mô hình tự hồi qui cấp 3, mô hình
Giá trị Giá trị thống p-value hồi qui cấp 2 cũng không được lựa chọn vì hệ
Hệ số kê số 2 không có ý nghĩa thống kê như được trình
bày ở bảng 8.8
0.593676 3.503871 0.001084
0.552741 3.702094 0.000604
-0.02275 -0.13302 0.894802
-0.12295 -0.83114 0.410484
R2 0.284076 - -
F 5.687422 - 0.002265
Bảng 8.8: Kết quả của mô hình tự hồi qui cấp 2
2= 1Yt-1 + 2 Yt-2 + εt
... (8.8)
p= 1Yt-1 + 2 Yt-2 + ...+ p Yt-p+ εt
Giải hệ phương trình (8.8), ta có thể tìm ra giá trị của các hệ
số 1,2,...p
Hình 8.7 trình bày biểu đồ tự tương quan ACF và tự
tương quan riêng phần PACF cho dãy thời gian của ví dụ
8.2.Biểu đồ ACF thể hiện rằng, chuỗi thời gian sẽ dừng ở
hệ số trượt k=1. Ngoài ra, giá trị tham số k của biểu đồ
PACF được tính như sau:
1= r1 =0.4795
2= =-0.0283
Biểu đồ PACF cho doanh thu
8.3 Mô hình trung bình động ma (Moving average)
Mô hình trung bình động trượt q ký hiệu MA(q) dự báo giá trị Ŷt dựa trên
phối hợp tuyến tính các sai số của hiện tại và quá khứ.
Ŷt = µ + ɛt – ω1ɛt-1 – ω2ɛt-2 - … - ωqɛt-q (8.10)
Trong đó:
Ŷt : Giá trị dự báo tại thời điểm t.
µ: Giá trị trung bình của chuỗi thời gian.
ɛt: Sai số dự báo thời điểm t
ɛt-1, ɛt-2: Sai số dự báo quá khứ.
ω1, ω2,…, ωq: Hệ số ước lượng.
Lưu ý quy ước đặt dấu trừ trước các hệ số ước lượng. Do mô hình trung bình
động ban đầu dự báo dựa trên sai lệch quá khứ theo công thức.
x1 t
Trung bình động trượt một thời đoạn MA(1):
Ŷt = µ + ɛt – ω1ɛt-1 (8.11)
Giá trị dự báo Ŷt của trung bình động là tổng có trọng số của hai giá trị ɛ gần nhất.
Ŷt - µ = ɛt – ω1ɛt-1
Xt = ɛt – ω1ɛt-1
= - ω1E(ɛ2t-1) = - ω1σ2
Hình 8.12 Biểu đồ ACF và PACF đặc trưng của trung bình động
trượt 1 thời đoạn MA(1)
ACF PACF
k k
0 0
-1 -1
(a)
1 1
k k
0 0
-1 -1
Biểu đồ PACF của hình 8.12 (a) có trị tự tương quan riêng phần ɸ i hoàn toàn âm và giảm dần
( theo hàm mũ). Giá trị tương quan r1 của biểu đồ ACF khác 0 rõ rệt; các giá trị tương quan r k
tiếp theo tắt về 0. Chuỗi thời gian có biểu đồ ACF và PACF như trên nên được dự báo bởi mô
hình động trượt 1 thời đoạn MA(1).
Tương tự phần trên, biểu đồ PACF của chuỗi thời gian hình 8.12 (b) có trị tự tương quan riêng
phần ɸi của biểu đồ PACF liên tục đổi dấu và giảm dần. Giá trị r1 của biểu đồ ACF cũng khác
0 rõ rệt còn các trị rk kế tiếp tắt về 0; chuỗi thời gian này cũng nên được dự báo bằng mô hình
động trượt 1 thời đoạn MA(1)
Mô hình trung bình động trượt 2 thời đoạn MA(2):
Tương tự mô hình trung bình động trượt 1 thời đoạn, biểu đồ PACF cho mô hình động trượt 2
thời đoạn MA(2) có giá trị tự tương quan riêng phần ɸi hoàn toàn âm và giảm dần theo hàm
mũ (Hình 8.13b) hoặc lien tục đổi dấu và cũng giảm dần(Hình 8.13a). Trị r1, r2 của biểu đồ
ACF cũng khác 0 rõ rệt còn các trị rk kế tiếp tắt về 0; chuỗi thời gian này cũng nên được dự
báo bởi mô hình trung bình động trượt 2 thời đoạn MA(2).
Biểu đồ ACF và PACF cho mô hình trung bình động trượt 2 thời đoạn MA(2)
ACF PACF
k k
0 v
0
-1 -1
(a)
1 1
k k
0 0
(b)
-1 -1
Từ thời điểm t + 2 = 33 trở đi, giá trị dự báo chính là giá trị của
hằng số µ. Chi tiết kết quả tính toán được trình bày ở Bảng 8.17
Bảng 8.17: Dự báo theo mô hình trung bình trượt 2 thời đoạn
MA(2)
Sai số dự báo của mô hình MA(2)
Dựa trên tiêu chí sai số tuyệt đối trung bình MAE, mô hình trung
bình động trượt 2 thời đoạn MA(2) có sai số bé hơn mô hình
MA(1). Tuy nhiên không thể chọn MA(2) để dự báo cho dữ liệu
của ví dụ này bởi vì mức ý nghĩa α = 5%, tham số ω2 của mô hình
không có ý nghĩa thống kê. Lựa chọn mô hình dựa trên việc so
sánh sai số dự báo chỉ có thể áp dụng được trong trường hợp các
mô hình đều có ý nghĩa thống kê.
8.4 MÔ HÌNH ARMA(p,q)
Mô hình kết hợp tự hồi qui AR(p) và trung bình động MA(q)
với nhau để được mô hình hỗn hợp tự hồi qui – trung bình động.
Ký hiệu: ARMA(p,q).
Trong mô hình này:
p: bậc của phần tự hồi qui
q: mức trượt của trung bình động.
Mô hình ARMA(p,q) có dạng như sau:
(8.13)
Hình 8.15: Biểu đồ ACF và PACF cho chuỗi thời gian nên áp
dụng mô hình ARMA(1,1)
Hay ở dạng rút gọn: Mô hình ARMA(1,1):
(8.14) (8.15)
Trong đó: Chuỗi thời gian có giá trị và ở biểu đồ ACF và PACF giảm dần
: giá trị dự báo tại thời điểm t (dao động quanh trị trung bình, hoặc dương, hoặc âm), hệ số tự
tương quan và tự tương quan riêng phần có giá trị lớn nhất như
: hằng số ban đầu
được trình bày ở Hình 8.15 thì nên áp dụng mô hình
: hệ số tự hồi qui ARMA(1,1).
: hệ số ước lượng; lưu ý qui ước đặt dấu trừ Bảng 8.18 và Hình 8.16 tổng kết một số dấu hiệu từ biểu đồ
ACF và PACF mà người sử dụng có thể dựa vào đó để lựa chọn
: sai số dự báo thời điểm t
giữa 1 trong 3 mô hình tự hồi qui AR(p), trung bình động
: sai số dự báo quá khứ MA(q) và ARMA(p,q) để dự báo. Chuỗi thời gian có giá trị của
biểu đồ ACF giảm dần và dừng đột ngột tại q; giá trị của biểu
đồ tự tương quan riêng phần PACF cũng giảm dần và dừng đột
ngột tại p thì nên áp dụng mô hình kết hợp ARMA(p, q). Theo
Hanke [2] thì thông thường, giá trị của p và q ít vượt quá 2.
TT Yt
TT Yt
1 57 TT Yt
1 60
2 63 1 53
2 54
Bảng 8.18: Lựa chọn mô hình dự 3 75 2 50
3 41
4 85 3 53
4 35
báo dựa trên biểu đồ ACF và PACF 5 80
5 43 4 58
6 77 5 73
6 44
7 68 6 72
7 44
8 72 7 68
8 36
9 68 8 63
9 44
10 70 9 64
10 50
10 68
Kết quả trị dự báo và sai lệch thực hiện bởi phần mềm SPSS
được trích ra ở Bảng 8.20 (giả sử sai lệch cho thời điểm t, = 0).
.. .. .. .. ..
t-2 29 44 37.6461 6.35391
t-1 30 50 50.1725 -0.1725
t 31 - 55.3684 0
t+1 32 - 54.8671 0
t+2 33 - 54.9665 0
Dự báo trị cho thời đọan t = 32
Hoặc (8.16)
Trong đó Trị dự báo tại thời điểm t Hằng số ban đầu
Hệ số tự hồi qui Hệ số ước lượng, lưu ý qui ước đặt dấu trừ
Sai số dự báo thời điểm t : Sai số dự báo thời điểm t-1
Mô hình kết hợp sai phân với AR(p), MA(q) đươc gọi là mô hình ARIMA(p,d,q). Nếu chuỗi ban đầu là chuỗi
dừng thì d=0 và mô hình ARIMA trở thành ARMA
Ví dụ sau đây là 1 ví dụ cần phải tịnh hóa dữ liệu
T
Ví dụ 8.6: Sản lượng theo thời gian của 1 doanh nghiệp sản xuất được trình bày ở Bảng 8.23. 66 46.97
Hãy xây dựng mô hình dự báo sản lượng cho thời điểm 201? 2
T T 67 47.43
T T T
5
1 0.160 14 8.384 27 17.399 40 27.273 53 37.212
68 47.58
2 0.570 15 9.816 28 18.369 41 28.536 54 38.247 7
0.8
0.6
0.4
0.2
0.0
rk
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
Biểu đồ PACF cho Sản lượng k
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
k
Biểu đồ ACF cho sản lượng
(with 5% significance limits for the autocorrelations)
1.0
0.8
0.6
0.4
0.2
0.0
rk
-0.2
-0.4
Biểu đồ PACF cho Sản lượng
-0.6
1.0 -0.8
0.8 -1.0
0.6 1 5 10 15 20 25 30 35 40 45 50
Partial Autocorrelation
0.4
k
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50
k
Dựa trên biểu đồ tự tương quan ACF Hình 8.19(a) chuỗi thời gian này chỉ dừng ở
độ trượt k=18 nên áp dụng mô hình trung bình động với hệ số trượt k>= 18. Mô
hình này quá phức tạp để dự báo. Nếu áp dụng mô hình AR(1) thì hằng số có p-
value=0.898 nên mô hình không có ý nghĩa thống kê. Giải pháp sử dụng sai phân
của dữ liệu (tịnh hóa dữ liệu) để giảm mức phức tạp của mô hình được sử dụng
trong TH này.
Gias trij p,d,q cuar mô hình ARIMA được xác định như sau. Chọn d=1, dữ liệu
được tịnh hóa có trị tự tương quan riêng (PACF) giảm dần, trị tự tương quan rk
dừng đột ngột ở độ trễ k=1 nên áp dụng mô hình trung bình động trượt 1 thời đoạn
MA(1) tức chọn q=1, p=0 tham số mô hình ARIMA(0,1,1). Nhập số liệu cho phần
mềm, tính được
Áp dụng CT 8.11, bỏ qua sai số thời đoạn t
Hình sau thể hiện biểu đồ sản lượng Yt và dự báo khi thực hiện bằng mô hình ARIMA(0,1,1).
Đường dự báo rất giống với đường dữ liệu và sai lệch nhỏ nên kết quả dự báo thời điểm cuối 201 là
đáng tin
Biểu đồ giá trị dự báo
160
150
Sản lượng
140
130
120
Nhóm 7
Tính mùa vụ của chuỗi thời gian có thể đươc nhận dạng bằng biện pháp phân tích chỉ số mùa vụ đã được
trình bày ở các phần trước. Ngoài ra tính mùa vụ của dữ liệu thời gian dự báo bằng mô hình ARIMA có
thể được nhân dạng thông qua quan sát biểu đồ tự tương quan ACF. Nếu các hệ số tương quan r_k của
biểu đồ ACF tương quan với nhau với chu kỳ là các tuàn trong tháng hay quý trong năm thì đó có tính
thời vụ
Ví dụ 8.7: Sản lượng theo tháng của 1 DN sản xuất hàng tiêu dùng ở bảng 8.25, xây dựng mô hình
ARIMA để dự báo sản lượng cho thời điểm 116?
Thời gian Sản lượng Y_t Thời điểm Sản lượng Yt Thời gian Sản lượng Y_t Thời gian Sản lượng Y_t
2500
2000
Yt
1500
1000
500
0 20 40 60 80 100 120
t
Dựa trên biểu đồ biểu diễn sản lượng theo thời gian (8.22) ta có nhận xét sản lượng vừa có tính mùa vụ, vừa
có tính xu hướng. Để chính xác hơn ta xét bằng độ tương quan theo chu kỳ năm của các hệ số tự tương quan
đó là hệ số Từ biểu đồ tương quan hình 8.23 ta KL các hệ số này có tự tương quan với nhau với chu kỳ 1
năm. Dữ liệu có tính mùa vụ
1.0
0.8
0.6
0.4
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50 55 60
Do dữ liệu không dừng tại nên áp dụng biện pháp tịnh hóa dữ liệu nhằm thu được chuỗi dừng. Biện pháp tịnh
hóa cho dữ liệu mùa vụ được thực hiện theo mô hình ARIMA(p,d,q)(P,D,Q)_12. Lấy sai phân cấp 1 của chuỗi
thời gian được biểu đồ tự tương quan ACF và tự tương quan riêng phần PACF trình bày ở hình 8.24. Do trị tự
tương quan của biểu đồ ACF dừng đột ngột ở độ trễ(trượt) k=12 và tương quan riêng phần PACF có xu hướng
giảm dần theo thời gian nên áp dụng mô hình ARIMA(0,0,0)(0,1,1)_12 tức tịnh hóa dữ liệu mùa vụ dung sai
phân cấp 1, trung bình động mùa trượt 1 thời đoạn MA(1).
Hình 8.25 trình bày lại biểu đồ ACF và PACF với sai phân cấp 1, kiêu mùa vụ sử dụng phần mềm Minitab. Biểu
đồ ACF ở hình 8.24 chỉ thể hiện giá trị các r_k chu kỳ tức còn ACF ở hình 8.25 thể hiện tất cả các giá trị r_k.
Khi sử dụng mô hình ARIMA mùa vụ, chỉ cần quan tâm đến các r_k chu kỳ tức là r_k không dừng có tính chu
kỳ.
Công thức tính sai phân cấp 1 chu kỳ 1 năm 12 tháng
Mô hình hồi qui sai phân cấp 1 trung bình động trượt 1 thời đoạn cho mùa vụ.
Trong đó:
Trị dự báo tại thời điểm t Hằng số ban đầu, Hệ số ước lượng, lưu ý qui ước đặt dấu trừ.
Sai số dự báo thời điểm t, Sai số dự báo thời điểm t-12
Nhập số liệu là chuỗi thời gian trình bày ở Bảng 8.25 với khai báo mô hình
ARIMA(0,0,0)(0,1,1)_12 vào phần mềm SPSS được các tham số của mô hình như
sau:
Hình 8.24. Biểu đồ ACF và PACF của sai phân cấp 1 (phần mềm SPSS)
Biểu đồ tự tương quan ACF sai phân cấp 12
1.0
0.8
0.6
0.4
0.2
0.0
rk
-0.2
-0.4
Biểu đồ PACF cho Sản lượng của sai phân cấp 12
-0.6
1.0
-0.8
0.8
-1.0
0.6
1 5 10 15 20 25 30 35 40 45 50 55 60
0.4
k
0.2
0.0
-0.2
-0.4
-0.6
-0.8
-1.0
1 5 10 15 20 25 30 35 40 45 50 55 60
k
Bảng 8.26. Giá trị dự báo và sai lệch theo mô hình ARIMA(0,0,0)(0,1,1)_12
… … … … …
t-24 92 2327.00 2247.49 79.5138
t-12 104 2275.00 2347.42 -72.4178
t 116 2419.69 0
Áp dụng công thức 8.18, bỏ qua sai lệch tại thời điểm t tức ,giá trị dự báo:
Kết quả trị dự báo và sai lệch thực hiên bởi phần mềm SPSS được trích ra ở Bảng 8.26 (giả sử sai lệch cho thời
điểm t, =0)
2500
2000
1500
1000
500
0 20 40 60 80 100 120
t
8.7. Các bước cơ bản của phương pháp
ARIMA (BOX-JENKINS)
t = 0 + 1 Yt-1 +t – 1t-1
t =0 + 1 Yt-1
S2 =
Trong đó :
n: Số lượng phần dư
r: Tổng số tham số ướclượng( kể cả hằng số 0)
Sai số phần dư bình phương càng nhỏ càng tốt, người ta còn dùng chỉ tiêu này
để so sánh lựa chọn mô hình.
Tiêu chuẩn thông tin Akaike(AIC)
AIC= ln2 + (8.20)
Trong đó:
ln: Lô-ga-rít tự nhiên
2
: Tổng bình phương sai lệch phần dư, chia cho tổng số quan sát
n: Số lượng quan sát(phần dư)
r: : Tổng tham số của mô hình dự báo
Tiêu chuẩn thông tin Bayes
BIC= ln2 + (8.21)
Thường thì cả hai tiêu chuẩn AIC và BIC đều cho cùng 1 kết quả
Bước 3: Kiểm định phần dư
1.Biểu đồ phần dư và phân phối của chúng được dùng để kiểm định tính ngẫu nhiên(của phần dư) của mô hình
ARIMA.
2. Các hệ số tự tương quan của phần dư rk(ε) ở biểu đồ ACF và PACF phần dư phải lân cận 0 và nằm bên trong
khoảng
3.Hảnh vi của hàm tự tương quan phần dư, nói chung phải tương ứng với hồi qui nhận được đối với tập hợp sai số
ngẫu nhiên.
Bước 4: Dự báo dựa vào mô hình lựa chọn
1. Khi tìm được mô hình phù hợp có thể tiến hành dự báo cho một hoặc vài thời đoạn tiếp theo.Lưu ý, mô hình
ARIMA chỉ phù hợp để dự báo trong ngắn hạn, thời đoạn dự báo càng xa, sai số dự báo càng lớn
2. Khi có dữ liệu quan sát mới, nên đưa điiểm quan sát này vào mô hình để làm ngắn thời đoạn dự báo
3. Nếu đặc điểm hành vi của chuỗi có thể bị thay đổi bởi dữ liệu mới, có thể phải ước lượng lại các tham số mô
hình, hoặc thậm chí xây dựng mô hình mới