You are on page 1of 15

PHẦN 2: DỰ BÁO CHỈ SỐ VNINDEX BẰNG MÔ HÌNH ARIMA

1. Thu thập và xử lý dữ liệu

Để thực hiện nghiên cứu tác giả đã thu thập chỉ số VNIndex trong 52 tuần. Tính từ ngày
21/02/2022 đến 13/02/2023 được cập nhật tại trang investing.com.

Hình 1: Biểu đồ giá VNIndex trong 52 tuần

2. Phương pháp nghiên cứu

Mô hình ARMA (p,q) áp dụng cho I(d) được gọi là mô hình ARIMA (p,d,q). Phương
pháp Box - Jenkins bao gồm các bước sau:

Bước 1: Nhận dạng mô hình

Nhận dạng mô hình ARIMA (p,d,q) là tìm các giá trị thích hợp của p, d và q với p là bậc
tự hồi quy, d là bậc sai phân của chuỗi thời gian được khảo sát, q là bậc trung bình trượt.
Việc xác định p và q sẽ phụ thuộc vào các đồ thị ACF (Autocorrelation Function) và
PACF (Partial Autocorrelation Function).. Chọn giá trị của p,q nếu đồ thị PACF và ACF
có giá trị cao tại các độ trễ 1, 2,..., .
Bước 2: Ước lượng các tham số của mô hình ARIMA (p, d, q)

Các tham số của mô hình ARIMA sẽ được ước lượng theo phương pháp bình phương
nhỏ nhất.

Bước 3: Kiểm tra chẩn đoán mô hình

Sau khi đã lựa chọn mô hình ARIMA cụ thể và ước lượng các tham số, tìm hiểu xem mô
hình lựa chọn có phù hợp với dữ liệu ở mức chấp nhận hay không.

Bước 4: Dự báo bằng mô hình ARIMA

Dựa vào mô hình ARIMA phù hợp nhất, thực hiện dự báo theo phương pháp dynamic.

3. Kết quả nghiên cứu

3.1. Kiểm định tính dừng của chuỗi dữ liệu

Để có thể xác minh tính chính xác của nhận định trên, tác giả sẽ kiểm định tính dừng
bằng phương pháp Dickey – Fuller. Xác định xem có thực sự đây là một chuỗi không
dừng hay không.

Đặt giả thuyết:

H0: Chuỗi dữ liệu là chuỗi không dừng

H1: Chuỗi dữ liệu là chuỗi dừng


Test statistic (Dickey-Fuller) P-value
Bậc 0 -1.9283 0.6033
Bậc 1 -3.338 0.0753
Bậc 2 -5.722 0.01
Nguồn: Tác giả tổng hợp kết quả từ R

Bảng 1: Kết quả kiểm định tính dừng của chuỗi dữ liệu

2
Từ bảng kết quả, tác giả có những nhận định sau:

Với kiểm định tính dừng bậc 0, giá trị P-value > 0.05 (mức ý nghĩa 5%). Ta sẽ chấp nhận
giả thuyết H0 rằng chuỗi dữ liệu là không dừng. Tác giả sẽ tiếp tục tiến hành lấy sai phân
và tìm mô hình tối ưu.

Với kiểm định tính dừng tại sai phân bậc 1, giá trị P-value là 0.0753 > 0.05 (mức ý nghĩa
5%). Tác giả chấp nhận H0 chuỗi dữ liệu không dừng.

Với kiểm định tính dừng bậc 2, giá trị P-value là 0.01 < 0.05 (mức ý nghĩa 5%). Tác giả
bác bỏ giả thuyết H0 chứng minh chuỗi dữ liệu đã dừng. Kết luận, chuỗi dữ liệu dừng ở
sai phân bậc 2. Tác giả xác định giá trị hệ số d = 1 trong việc vận hành mô hình ARIMA.

3.2. Xác định p,q tối ưu

Hình 2: Đồ thị ACF sai phân bậc 2 của chuỗi dữ liệu

3
Hình 3: Đồ thị PACF sai phân bậc 2 của chuỗi dữ liệu

Để xác định các tham số tối ưu p và q cho mô hình ARIMA, tác giả đã tiến hành phân
tích dựa trên đồ thị tự tương quan (ACF) và đồ thị tự tương quan riêng (PACF) của chuỗi
sai phân bậc 2. Đây là một quy trình phổ biến để lựa chọn các tham số phù hợp cho mô
hình ARIMA.

Dựa trên đồ thị ACF của chuỗi sai phân bậc 2, tác giả đã nhận thấy rằng các độ trễ bậc 0
và bậc 1 có tương quan đáng kể, trong khi các độ trễ khác không có sự tương quan đáng
kể. Do đó, tác giả quyết định lựa chọn hệ số q = 0 và q = 1 cho mô hình ARIMA với sai
phân bậc 2.

Tiếp theo, đồ thị PACF cho phép xem xét tương quan giữa các giá trị trong chuỗi dữ liệu
sau khi đã loại bỏ tương quan của các độ trễ khác. Dựa vào đồ thị PACF của chuỗi sai
phân bậc 2, tác giả nhận thấy rằng chỉ có độ trễ bậc 1 và bậc 3 có tương quan đáng kể,
trong khi các độ trễ khác không có sự tương quan. Điều này cho thấy rằng mô hình
ARIMA có thể cần các thành phần tự hồi quy tự động (AR) ở sai phân bậc 2. Dựa vào đồ

4
thị PACF, tác giả quyết định lựa chọn p = 1 và p = 3 cho mô hình ARIMA với sai phân
bậc 2.

Tóm lại, dựa trên phân tích của đồ thị ACF và đồ thị PACF, tác giả đã chọn các tham số
p và q tối ưu là p = 1, p = 3 và d = 2 và q = 0, q = 1 để xây dựng mô hình ARIMA cho
chuỗi dữ liệu VNIndex. Các tham số này được chọn để đảm bảo rằng mô hình có khả
năng mô phỏng và dự báo.

3.3. Lựa chọn mô hình ARIMA(p,d,q) tối ưu

Theo các nghiên cứu trước đây, để lựa chọn được mô hình ARIMA tối ưu thì phải thỏa
mãn các chỉ tiêu sau: chỉ tiêu Akaike (AIC), chỉ tiêu Bayesian (BIC),… càng thấp càng
tốt. Các chỉ tiêu trên của các mô hình ARIMA được trình bày ở dưới đây:
Mô hình AIC BIC AICC
ARIMA(1,2,0) 548.5632 552.3872 548.8185
ARIMA(1,2,1) 536.3376 542.0736 536.8593
ARIMA(3,2,0) 544.0002 551.6483 544.8891
ARIMA(3,2,1) 539.0122 548.5723 540.3758
Nguồn: Tác giả tổng hợp kết quả từ R

Bảng 2: Kết quả lựa chọn mô hình ARIMA(p,d,q) tối ưu

Dựa vào kết quả trong bảng, tác giả đã nhận thấy rằng mô hình ARIMA (1,2,1) có các chỉ
số thấp nhất trong 4 mô hình. Điều này cho thấy mô hình ARIMA (1,2,1) có khả năng
phù hợp tốt hơn với dữ liệu chỉ số VNIndex và có khả năng dự báo tốt hơn so với các mô
hình khác.

3.4. Kiểm định hiện tượng tự tương quan

Tác giả sử dụng hai kiểm định Ljung-Box và Box-Pierce đến độ trễ thứ 10. Giả thuyết
của cả hai kiểm định này được phát biểu như sau:

H0: Chuỗi thời gian không có tự tương quan đến bậc 10


5
H1: Chuỗi thời gian có hiện tượng tự tương quan
Độ trễ Ljung-Box (p-value) Box-Pierce (p-value)
10 0.8578 0.9130
Nguồn: Tác giả tổng hợp kết quả từ R

Bảng 3: Kết quả kiểm định hiện tượng tự tương quan

Như vậy, với mức ý nghĩa 5%, tác giả không bác bỏ giả thuyết H 0 ở cả hai kiểm định.
Chứng minh rằng, dữ liệu chuỗi thời gian không gặp hiện tượng tự tương quan.

3.5. Kiểm định hiện tượng phương sai thay đổi của phần dư

Tác giả sẽ sử dụng kiểm định White nhằm mục đích phục vụ kiểm định hiện tượng
phương sai thay đổi của phần dư, giả thuyết kiểm định như sau:

H0: Phần dư không gặp hiện tượng phương sai thay đổi

H1: Phần dư gặp hiện tượng phương sai thay đổi

Kết quả của kiểm định như sau:

White Neural Network Test

data: r2$residuals

X-squared = 1.939, df = 2, p-value = 0.3793


Nguồn: Tác giả tổng hợp kết quả từ R

Bảng 4: Kết quả kiểm định hiện tượng phương sai thay đổi

6
Từ kết quả ở hình trên, tác giả thấy rằng p-value = 0.3793 > 0.05 (mức ý nghĩa 5%). Vì
vậy, tác giả chấp nhận giả thuyết H0, phần dư không gặp hiện tượng phương sai thay đổi.

4. Thực hiện dự báo chỉ số và đánh giá hiệu quả mô hình

Tác giả thực hiện dự báo chỉ số VNIndex trong 8 tuần tiếp theo bằng phương pháp
Dynamic. Kết quả dự báo, đồ thị và thông tin so sánh với chỉ số thực tế được tác giả trình
bày như sau:
Tuần Dự báo Low 95 High 95 Thực tế
53 (20/02/23) 1034.86 940.42 1129.31 1086.69
54 (27/02/23) 1025.71 891.45 1159.97 1021.25
55 (06/03/23) 1016.56 850.82 1182.30 1027.18
56 (13/03/23) 1007.41 814.40 1200.41 1052.80
57 (20/03/23) 998.26 780.61 1215.90 1023.10
58 (27/03/23) 989.11 748.64 1229.58 1052.25
59 (03/04/23) 979.95 718.01 1241.90 1079.28
60 (10/04/23) 970.80 688.40 1253.20 1065.35
Nguồn: Tác giả tổng hợp kết quả từ R

Bảng 5: Bảng kết quả dự báo chỉ số VNIndex trong 8 tuần

Dựa vào kết quả trong bảng, tác giả dự báo rằng chỉ số VNIndex có xu hướng giảm trong
8 tuần tới. Tuy nhiên, để xác nhận tính chính xác của dự báo này, tác giả đã so sánh với
dữ liệu thực tế. Kết quả cho thấy, nói chung các số liệu thực tế của chỉ số VNIndex trong
8 tuần tiếp theo nằm trong khoảng tin cậy 95%. Điều này có nghĩa là dự báo đạt được
mức độ chính xác tương đối cao và tương thích với dữ liệu thực tế.

Tuy nhiên, với phương pháp dự báo Dynamic, có một đặc trưng quan trọng là khoảng tin
cậy có xu hướng rộng ra khi dự báo xa hơn trong tương lai. Điều này có nghĩa là mức độ
chính xác của dự báo giảm dần khi xa khỏi thời điểm hiện tại. Do đó, tác giả đưa ra quan

7
điểm rằng phương pháp dự báo Dynamic chỉ nên được áp dụng để dự báo chỉ số thị
trường trong một khoảng thời gian ngắn.

Việc giới hạn phạm vi dự báo trong một khoảng thời gian ngắn có thể giúp giảm thiểu sai
số và đảm bảo tính tin cậy của dự báo. Khi dự báo xa hơn, các yếu tố và biến động khác
có thể ảnh hưởng đến thị trường một cách không thể dự báo trước, làm cho dự báo trở
nên khó khăn và không chính xác hơn.

Để có được dự báo chính xác hơn và đáng tin cậy, tác giả có thể kết hợp nhiều phương
pháp dự báo khác nhau, sử dụng thông tin từ các chỉ số khác và các yếu tố thị trường liên
quan. Điều này có thể giúp tăng cường tính linh hoạt và khả năng ứng dụng của dự báo
trong các tình huống thị trường khác nhau.

Kết luận, mặc dù dự báo Dynamic cho thấy mức độ chính xác tương đối cao trong
khoảng thời gian ngắn, tuy nhiên, khi dự báo xa hơn, cần đặc biệt chú trọng đến mức độ
tin cậy của dự báo và sự ảnh hưởng của các yếu tố bên ngoài.

Hình 4: Biểu đồ giá VNIndex mà tác giả dự báo trong 8 tuần tới

8
PHỤ LỤC PHẦN 2
 Biểu đồ giá VNIndex

 Kiểm định tính dừng bậc 0

 Kiểm định tính dừng bậc 1

9
 Kiểm định tính dừng bậc 2

 Giản đồ ACF sai phân bậc 2

10
 Giản đồ PACF sai phân bậc 2

11
 Chọn mô hình ARIMA tối ưu

 Kiểm định hiện tượng tự tương quan

12
 Hồi quy mô hình ARIMA(1,2,1)

 Dự báo chỉ số VNIndex trong 8 tuần tới

13
 Biểu đồ dự báo chỉ số VNIndex trong 8 tuần tới

14
15

You might also like