You are on page 1of 26

CHƯƠNG 6.

MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Ta sẽ nghiên cứu vấn đề tìm mô hình thích hợp cho tập số liệu đã

biết {𝑥" , … , 𝑥% } không nhất thiết được cảm sinh bởi một chuỗi thời gian

dừng. Nếu số liệu (a) có biểu hiện sai lệch không rõ ràng từ tính dừng

và (b) có hàm tự hiệp phương sai giảm nhanh, ta cố thử xây dựng mô

hình ARMA cho bộ số liệu quy tâm bằng các kỹ thuật ở chương 5. Nói

cách khác, ta tìm kiếm các phép biến đổi số liệu đưa về chuỗi mới với

các tính chất (a) và (b). Điều đó có thể đạt được bằng sai phân, dẫn đến

xem xét một lớp các mô hình ARIMA.

§𝟏. MÔ HÌNH ARIMA CHO CHUỖI THỜI GIAN KHÔNG DỪNG

Tổng quát hoá lớp mô hình ARMA kết hợp nhiều loại chuỗi

không dừng được cung cấp bởi các quá trình ARIMA, tức là quá trình

sau khi sai phân một số hữu hạn lần sẽ đưa đến quá trình ARMA.

* Định nghĩa 6.1 Nếu 𝑑 là số nguyên không âm, thì {𝑋, } là quá trình

ARIMA(𝑝, 𝑑, 𝑞) nếu 𝑌, = (1 − 𝐵)5 𝑋, là quá trình ARMA(𝑝, 𝑞) nhân

quả.

Định nghĩa này cho thấy {𝑋, } thoả phương trình sai phân dạng

𝑎 ∗ (𝐵)𝑋, ≡ 𝑎(𝐵)(1 − 𝐵)5 𝑋, = 𝑏(𝐵)𝜀, , {𝜀, } ~ WN(0,𝜎 = ), (6.1)


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

trong đó 𝑎(𝑧) và 𝑏(𝑧) là các đa thức bậc 𝑝 và 𝑞 tương ứng và 𝑎(𝑧) ≠ 0

với 𝑧 ≤ 1. Đa thức 𝑎 ∗ (𝑧) có nghiệm 1 bội 𝑑. Quá trình {𝑋, } là dừng

khi và chỉ khi 𝑑 = 0, trường hợp này dẫn đến quá trình ARMA(𝑝, 𝑞).

Để ý rằng nếu 𝑑 ≥ 1 ta có thể thêm vào một khuynh đa thức bậc

𝑑 − 1 bất kỳ mà không vi phạm phương trình sai phân (6.1). Mô hình

ARIMA vì thế tiện lợi cho việc biểu diễn số liệu có khuynh. Nhưng

mặc dù vậy quá trình ARIMA cũng thích hợp để mô hình hoá các chuỗi

không khuynh. Cũng để ý với 𝑑 ≥ 1, phương trình (6.1) xác định các

tính chất của {(1 − 𝐵)5 𝑋, } chứ không phải của {𝑋, }, ước lượng của

𝒂, 𝒃 và 𝜎 = sẽ dựa trên các quan sát của sai phân (1 − 𝐵)5 𝑋, .

* Thí dụ 6.1 {𝑋, } là một quá trình ARIMA(1,1,0) nếu với một 𝑎 nào

đó ∈ (−1,1)

(1 − 𝑎𝐵)(1 − 𝐵)𝑋, = 𝜀, , {𝜀, } ~ WN(0,𝜎 = ).

Khi đó ta có thể viết


,
𝑋, = 𝑋F + HI" 𝑌H , 𝑡 ≥ 1,

trong đó
L H
𝑌, = (1 − 𝐵)𝑋, = HIF 𝑎 𝜀,KH .
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Thể hiện của {𝑋" , … , 𝑋=FF } với 𝑋F = 0, 𝑎 = 0,8 và 𝜎 = = 1 được trình

diễn trong hình dưới đây, với các tự tương quan và tự tương quan riêng

mẫu trong hai hình tiếp theo. ∎

Điểm đặc trưng nổi bật của bộ số liệu thích hợp với mô hình

ARIMA là việc giảm chậm của hàm tự tương quan mẫu. Và vì thế nếu

ta có số liệu và muốn tìm một mô hình thích hợp, thì điều tự nhiên là

áp dụng toán tử 𝛻 = 1 − 𝐵 nhiều lần trong hy vọng rằng với 𝑗 nào đó

{𝛻H 𝑋, } sẽ có hàm tự tương quan mẫu giảm nhanh tương thích với việc
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

một quá trình ARMA với đa thức AR không triệt tiêu gần vòng tròn

đơn vị. Với chuỗi thời gian đặc biệt đó, một áp dụng toán tử 𝛻 làm sản

sinh một thể hiện được vẽ trong hình dưới đây; hàm tự tương quan và

hàm tự tương quan riêng (hai hình tiếp theo) gợi ý mô hình AR(1) (hoặc

có thể AR(2) cho {𝛻𝑋, }. Các ước lượng ML thu được của a và 𝜎 = nhờ

phần mềm PEST dưới giả thiết 𝐸(𝛻𝑋, ) = 0 là 0,808 và 0,978 tương

ứng, cho ta mô hình

(1 − 0,808 𝐵)(1 − 𝐵)𝑋, = 𝜀, , {𝜀, } ~ WN(0; 0,978), (6.2)

tương đồng gần với mô hình thật đang xét

(1 − 0,8𝐵)(1 − 𝐵)𝑋, = 𝜀, , {𝜀, } ~ WN(0,1). (6.3)


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Thay vì sai phân chuỗi gốc ta có thể bắt đầu trực tiếp hơn khi cố

gắng dựng một mô hình AR(2) như tự tương quan riêng của chuỗi ban

đầu đề xuất. Ước lượng ML theo PEST sau khi dựng mô hình thô với

thuật toán Burg và giả sử rằng 𝐸(𝑋, ) = 0, cho ta mô hình

(1 − 1,808𝐵 + 0,811𝐵 = ) 𝑋,

= (1 − 0,825 𝐵)(1 − 0,983𝐵)𝑋, = 𝜀, , {𝜀, } ~ WN(0; 0,970), (6.4)

và mặc dù là dừng, các hệ số của nó gần giống với của quá trình thật

không dừng (6.3).

Từ một mẫu cỡ hữu hạn sẽ cực kỳ khó để phân biệt giữa một quá

trình không dừng (6.3) với 𝑎 ∗ (1) = 0, và một quá trình như (6.4) với

các hệ số rất giống nhưng 𝑎 ∗ (. ) có mọi không điểm nằm ngoài vòng

tròn đơn vị. Tuy vậy trong cả hai trường hợp, nếu có thể lấy sai phân

để sinh ra chuỗi với tự tương quan mẫu giảm nhanh, thì tập số liệu đã

sai phân có thể dùng dựng một quá trình ARMA cấp thấp mà đa thức

AR 𝑎 ∗ (. ) có không điểm thoải mái nằm ngoài vòng tròn đơn vị. Điều

đó có nghĩa là các tham số tìm được sẽ khá xa biên của tập tham số

được phép. Đó là điều mong muốn cho tính toán số các tham số và có

thể hoàn toàn nguy hiểm cho một số phương pháp ước lượng. Chẳng
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

hạn, nếu ta áp dụng phương trình Yule – Walker để xây dựng mô hình

AR(2) cho số liệu ở thí dụ 6.1, ta thu được mô hình

(1 − 1,282𝐵 + 0,290𝐵 = )𝑋, = 𝜀, , {𝜀, } ~ WN(0; 6,435), (6.5)

xác nhận sự tương đồng ít với mô hình ML khác (6.4) hoặc mô hình

thật (6.3). Trong trường hợp này ma trận Toeplitz gần suy biến.

Một giới hạn rõ ràng khi xây dựng một quá trình ARIMA(𝑝, 𝑑, 𝑞)

{𝑋, } cho bộ số liệu là {𝑋, } được phép trở thành không dừng chỉ trong

trường hợp rất đặc biệt, tức là khi cho phép đa thức 𝑎 ∗ (𝐵) trong biểu

diễn 𝑎 ∗ (𝐵)𝑋, = 𝜀, có nghiệm 1 bội 𝑑. Các mô hình như vậy là thích

hợp khi tự tương quan mẫu là hàm dương giảm chậm như trong thí dụ

6.1, vì các hàm tự tương quan mẫu dạng đó liên quan đến mô hình

𝑎 ∗ (𝐵)𝑋, = 𝑏(𝐵)𝜀, , trong đó 𝑎 ∗ (. ) có không điểm là 1 hoặc gần 1.

Tự tương quan mẫu dạng sin tắt chậm liên quan đến mô hình

𝑎 ∗ (𝐵)𝑋, = 𝑏(𝐵)𝜀, mà trong đó 𝑎 ∗ (. ) có không điểm gần 𝑒 [\ với 𝜔 ∈

(−𝜋, 𝜋] khác 0. Hình vẽ sau cho tự tương quan mẫu của 200 quan sát

của quá trình AR(2) mô phỏng bằng PEST (hình phải)

𝑋, − 2𝑟 K" 𝑐𝑜𝑠𝜔 𝑋,K" + 𝑟 K= 𝑋,K= = 𝜀, , {𝜀, } ~ WN(0;1), (6.6)

với 𝑟 = 1,005 và 𝜔 = 𝜋/3, tức là

𝑋, − 0,9950𝑋,K" + 0,9901𝑋,K= = 𝜀, , {𝜀, } ~ WN(0;1).


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Hàm tự tương quan của mô hình (6.6) có thể thu được khi để ý

1 − 2𝑟 K" 𝑐𝑜𝑠𝜔 𝐵 + 𝑟 K= 𝐵 = = (1 − 𝑟 K" 𝑒 [\ 𝐵)(1 − 𝑟 K" 𝑒 K[\ 𝐵) (6.7)

và sau khi tính toán ta được

sin (ℎ𝜔+𝜓)
𝜌(ℎ) = 𝑟 K" , ℎ ≥ 0, (6.8)
𝑠𝑖𝑛𝜓

trong đó

m n o"
tan𝜓 = tan𝜔. (6.9)
m n K"

Rõ ràng từ các phương trình trên

𝜌 ℎ → cos (ℎ𝜔) khi 𝑟 ↓ 1. (6.10)

Với 𝑟 = 1,005 và 𝜔 = 𝜋/3 như trong mô hình được vẽ trên đồ thị trên

đây, hàm tự tương quan trong (6.8) là sóng hình sin tắt dần với tỷ lệ tắt

dần là 1/1,005 và chu kỳ 6. Các tính chất đó được phản ánh trong hàm

tự tương quan được vẽ trong hình bên cạnh. Với các giá trị 𝑟 gần 1 hơn,
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

sự tắt dần sẽ có thể chậm hơn, như hàm tự tương quan của mô hình

tiệm cận đến dạng giới hạn (6.10).

Nếu số liệu được cho vẽ trên hình trái ở trên mà không có chỉ dẫn

về mô hình cảm sinh ra nó, hàm tự tương quan mẫu dạng sin tắt dần

chậm với chu kỳ 6 sẽ đề xuất thử trở thành hàm tự tương quan mẫu

giảm nhanh hơn bằng việc áp dụng toán tử (6.7) với 𝑟 = 1 và 𝜔 = 𝜋/3,

tức là 1 − 𝐵 + 𝐵 = . Nếu việc này xảy ra, chu kỳ 2𝜋/3 sẽ gần một số

nguyên 𝑠 nào đó (trong trường hợp này là 6), thì toán tử 1 − 𝐵 t cũng

có thể được áp dụng để tạo ra chuỗi với hàm tự tương quan giảm nhanh

hơn. Hai hình vẽ sau cho thấy các hàm tự tương quan mẫu thu được sau

khi áp dụng các toán tử 1 − 𝐵 + 𝐵 = và 1 − 𝐵 t , tương ứng, cho 200 số

liệu mô phỏng ở trên. Cho mỗi chuỗi sai phân, không khó để dựng một

mô hình ARMA 𝑎(𝐵)𝑋, = 𝑏(𝐵)𝜀, , sao cho các không điểm của 𝑎(. )
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

nằm ngoài vòng tròn đơn vị. Để thuận tiện ta nhắc lại kỹ thuật nhận

dạng và xác định các mô hình ARMA như vậy (đã xét ở chương 5).

§𝟐. CÁC KỸ THUẬT NHẬN DẠNG

(a) Các phép biến đổi thô. Nếu số liệu có các đặc trưng biểu hiện tính

không dừng (chẳng hạn như khuynh và mùa), thì cần thiết phải thực

hiện phép biến đổi tạo ra các chuỗi mới tương thích với giả thiết dừng.

Sự lệch lạc khỏi tính dừng có thể thấy trên đồ thị của chuỗi hoặc qua

hàm tự tương quan mẫu hoặc cả hai.

Việc xem xét kỹ đồ thị chuỗi đôi lúc phát hiện sự phụ thuộc mạnh

vào biến động mức của chuỗi, trong trường hợp này đầu tiên nên biến

đổi số liệu để giảm hoặc khử sự phụ thuộc đó. Trong hình bên trái dưới

đây cho thấy mức bán rượu vang đỏ Úc hàng tháng từ tháng 1/1980 đến

10/1991, và hình bên trái cho thấy làm thế nào để giảm sự biến động
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

tăng của mức bán bằng việc lấy lô ga tự nhiên chuỗi gốc. Phép biến đổi

lô ga 𝑉, = ln𝑈, được dùng ở đây là phù hợp mỗi khi {𝑈, } là chuỗi có

độ lệch chuẩn tăng tuyến tính với trung bình. Với các ghi chép mang

tính hệ thống về lớp tổng quát các phép biến đổi ổn định phương sai,

nên để ý đến phép biến đổi Box – Cox

𝜆K" 𝑈,y − 1 , 𝑈, ≥ 0, 𝜆 > 0,


𝑓y (𝑈, ) =
ln 𝑈, , 𝑈, > 0, 𝜆 = 0.

Trên thực tế, nếu phép biến đổi Box – Cox là cần thiết, thường đó là

trường hợp hoặc 𝑓F hay 𝑓F,} là đáp ứng được.

Khuynh và mùa thường được phát hiện khi xem xét kỹ đồ thị

chuỗi (có thể cả chuỗi đã biến đổi). Tuy nhiên chúng cũng được đặc

trưng bởi việc hàm tự tương quan giảm chậm và gần tuần hoàn tương

ứng. Việc khử khuynh và mùa được thực hiện bằng hai phương pháp:

1. ‘khai triển cổ điển” chuỗi thành các thành phần khuynh, mùa và

phần dư ngẫu nhiên, và

2. lấy sai phân.

Phần mềm PEST đề xuất lựa chọn giữa hai kỹ thuật trên, kết quả áp

dụng hai phương pháp đó cho số liệu vang đỏ đã biến đổi 𝑉, = ln𝑈,

được trình bày trong hai hình sau đây. Hình trái nhận được từ PEST
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

bằng ước lượng và loại khuynh tuyến tính và thành phần mùa với chu

kỳ 12 từ {𝑉, }. Hình phải thu được bằng áp dụng toán tử 1 − 𝐵"= .

Không có kết quả nào để lộ ra độ lệch rõ ràng khỏi tính dừng, kể cả các

hàm tự tương quan mẫu. Tự tương quan mẫu và tự tương quan riêng

mẫu của {(1 − 𝐵"= )𝑉, } được trình bày trong hai hình sau.

Sau khi loại khuynh và mùa, vẫn còn có thể xảy ra việc hàm tự tương

quan là của quá trình không dừng (hoặc gần không dừng), trong trường

hợp này việc lấy sai phân có thể tiến hành tiếp.

(b) Nhận dạng và ước lượng. Cho {𝑋, } là chuỗi đã biến đổi, quy tâm.

Vấn đề hiện nay là tìm một chuỗi ARMA(𝑝, 𝑞) phù hợp nhất để biểu
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

diễn {𝑋, }. Thông thường 𝑝 và 𝑞 không biết trước và cần thiết phải nhận

dạng các giá trị thích hợp cho chúng.

Đầu tiên hình như giá trị 𝑝 và 𝑞 được chọn càng lớn thì mô hình

dựng được càng tốt. Tuy nhiên ước lượng một số lượng lớn tham số

đưa tới các sai số ước lượng ảnh hưởng ngược lại đến việc dùng mô

hình đã dựng để dự báo. Vì vậy ta tối thiểu một trong những tiêu chuẩn

lựa chọn mô hình đã bàn ở chương 5 nhằm chọn các giá trị của 𝑝 và 𝑞.

Mỗi tiêu chuẩn bao gồm số hạng phạt để không khuyến khích dùng quá

nhiều tham số. Ta chọn 𝑝 và 𝑞 thô dựa trên làm cực tiểu thống kê AICC

được xác định bởi

AICC(𝒂, 𝒃) = −2ln𝐿(𝒂, 𝒃, 𝑆(𝒂, 𝒃)/𝑛)

+ 2 𝑝 + 𝑞 + 1 𝑛/(𝑛 − 𝑝 − 𝑞 − 2), (6.11)

trong đó 𝐿(𝒂, 𝒃, 𝜎 = ) là hàm hợp lý của số liệu của mô hình ARMA

Gauss với các tham số 𝒂, 𝒃, 𝜎 = và 𝑆(𝒂, 𝒃) là tổng các bình phương phần

dư. Một khi mô hình tìm được làm tối thiểu giá trị AICC, thì cần phải

kiểm tra tính hợp lý của mô hình đã dựng (cần phải kiểm tra xem các

phần dư có giống ồn trắng) như đã nói tới ở chương 5.

Đối với các giá trị cố định nào đó của 𝑝 và 𝑞, ước lượng ML của

𝒂 và 𝒃 là các giá trị làm tối thiểu AICC. Hơn nữa, mô hình AICC tối
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

thiểu có thể được tìm bằng việc tính bộ ước lượng ML cho mỗi 𝑝 và 𝑞

và chọn từ đó mô hình ML với giá trị AICC bé nhất. Tuy nhiên việc

ước lượng ML chính xác là tương đối lâu, nên tiện hơn là dùng ý tưởng

thô của bậc tối ưu bằng việc tìm các ước lượng thô của 𝒂 và 𝒃 và tính

các gía trị AICC tương ứng từ (6.11). Ước lượng thô của 𝑝 và 𝑞 là các

giá trị sao cho AICC của các ước lượng hệ số thô là cực tiểu.

Các bước nhận dạng và ước lượng mô hình như sau:

• Sau khi biến đổi số liệu (nếu cần thiết) ta lập một mô hình dừng

hợp lý, kiểm tra các hàm tự tương quan và tự tương quan riêng mẫu để

lấy ý tưởng về các giá trị 𝑝 và 𝑞 tiềm năng.

• Dùng phần mềm (PEST) ước lượng thô các hệ số để lựa chọn 𝑝

và 𝑞.

• Xuất phát từ mô hình ở trên tìm mô hình ML có cùng bậc với mô

hình thô.

• Từ các mô hình ML đã dựng chọn lấy một với giá trị AICC bé

nhất, lập danh sách các mô hình dự bị có giá trị AICC gần với cực tiểu.

• Việc kiểm tra các hệ số tìm được và sai số chuẩn có thể gợi ý một

số hệ số có thể đặt bằng không. Việc tối ưu cho ta mô hình ML với các
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

hệ số được chọn đặt bằng 0 và mô hình được đánh giá bằng cách so

sánh giá trị AICC của nó với của các mô hình dự bị khác.

• Kiểm tra tính phù hợp của các mô hình dự bị.

* Thí dụ 6.2 Số liệu rượu vang đỏ Úc

Cho {𝑋" , … , 𝑋"€F } là ký hiệu chuỗi thu được từ số liệu rượu vang đỏ

trong thí dụ chương 5 sau khi lấy lô ga tự nhiên, sai phân bậc 12 và quy

tâm (trừ đi trung bình 0,0681). Đồ thị của số liệu đã quy tâm đã cho

trong mục này. Hàm tự tương quan riêng mẫu của {𝑋, } cho gợi ý là mô

hình AR(12) có thể thích hợp cho chuỗi đó. Dùng phần mềm PEST và

thuật toán Burg ta dựng được mô hình Burg với AICC cực tiểu khi 𝑝 =

12

(1 − 0,245𝐵 − 0,069𝐵 = − 0,012𝐵 € − 0,021𝐵 • − 0,200𝐵 }

+ 0,025𝐵 ‚ + 0,004𝐵 ƒ − 0,133𝐵 „ + 0,010𝐵 … − 0,095𝐵"F

+ 0,118𝐵"" + 0,384𝐵"= )𝑋, = 𝜀, , {𝜀, }~ WN(0; 0,0135)

và giá trị AICC −158,77. Mặt khác PEST cho ta mô hình ML AR(12)

rất giống với mô hình Burg và có giá trị AICC −158,87. Việc xem xét

các sai số chuẩn cho thấy khả năng đặt hệ số có thứ tự 2, 3, 4, 6, 7, 10

và 11 bằng 0. Từ đó khi tối ưu dùng PEST, ta thu được mô hình

(1 − 0,270𝐵 − 0,224𝐵 } − 0,149𝐵 „ + 0,099𝐵"" + 0,353𝐵"= )𝑋, = 𝜀, ,


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

với {𝜀, }~ WN(0; 0,0138) và giá trị AICC −172,49. Hàm tự tương

quan mẫu gợi ý mô hình MA cũng có thể thích hợp đối với tập số liệu

đã cho. Nếu ta kiểm tra các mô hình thô MA(𝑞) có bậc từ 1 đến 13 dùng

hoặc các đổi mới hoặc thuật toán Hannan – Rissanen, ta tìm được mô

hình AICC cực tiểu là mô hình thu được từ thuật toán đổi mới với 𝑞 =

13. Dùng PEST tìm mô hình thô MA(13) với hợp lý cực đại, ta thu

được mô hình MA(13) với giá trị AICC bằng −172,53. Việc xem xét

các sai số chuẩn của ước lượng hệ số cho thấy khả năng đặt các hệ số

với các chỉ số 3, 4, 6, 7, 9 và 11 bằng không. Cuối cùng ta đi đến mô

hình con MA (13) sau

𝑋, = (1 + 0,248𝐵 + 0,205𝐵 = + 0,230𝐵 } + 0,275𝐵 „

+0,266𝐵"F − 0,608𝐵"= − 0,263𝐵"€ )𝜀, ,

với {𝜀, }~ WN(0; 0,0110) và giá trị AICC −181,52. Để kiểm tra các

mô hình ARMA (𝑝, 𝑞) với cả hai 𝑝 và 𝑞 lớn hơn không ta lại dùng

PEST. Một quy trình tìm tiện lợi ban đầu là cho 𝑝 = 𝑞 và tăng dần từ 𝑝

= 0 dùng thuật toán Hannan – Rissanen (thuật toán đổi mới cho mô

hình hỗn hợp có khuynh hướng dẫn đến mô hình không nhân quả và

không thể dùng để bắt đầu ước lượng ML). Có thể thấy rõ là AICC của

mô hình hỗn hợp thô chắc chắn kém hơn các mô hình thuần AR và MA.
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Ở đây mô hình hứa hẹn nhất là MA(13). Ta thấy mọi kiểm định phù

hợp đều qua được và các tự tương quan và tự tương quan riêng mẫu

của phần dư của mô hình con MA(13) thích ứng hơn với ồn trắng so

với AR(12), đồng thời chắc chắn có giá trị AICC bé hơn. Mặc dù mô

hình này không khả nghịch, PEST không yêu cầu điều đó và thuật toán

được dùng ở đây có thể tính chính xác các ước lượng và sai số MS cho

cả mô hình khả nghịch và không khả nghịch. Tuy nhiên, để ý với mô

hình không khả nghịch phương sai ồn trắng và sai số dự đoán MS một

bước là không như nhau. ∎

* Thí dụ 6.3 Số liệu hồ Huron

Cho {𝑋, , 𝑡 = 1, … ,98} ký hiệu cho số liệu hồ đã quy tâm. Tiến hành

các tìm kiếm có tính hệ thống mô hình AICC cực tiểu, ta bắt đầu với

ước lượng AR thô, chọn bậc −1 và dùng thuật toán Burg. Điều đó cho

ta bậc 𝑝 = 2 của mô hình Burg thô với giá trị AICC bé nhất. Tương tự

mô hình Yule – Walker thô với AICC bé nhất có 𝑝 = 2 (nhưng AICC

lớn hơn một chút so với mô hình Burg). Kiểm tra các mô hình MA thô

được dựng dùng thuật toán đổi mới, ta tìm được mô hình AICC cực

tiểu có 𝑞 = 7. Tương tự mô hình MA Hannan – Rissanen thô với AICC

bé nhất có 𝑞 = 7 (nhưng AICC lớn hơn một chút so với mô hình đổi
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

mới). Kiểm tra các mô hình hỗn hợp thô (tức là các mô hình có 𝑝 và 𝑞

lớn hơn 0), ta thấy cả hai thuật toán Hannan – Rissanen và đổi mới dho

AICC cực tiểu tại 𝑝 = 𝑞 = 1, với thuật toán sau cho mô hình với AICC

bé hơn một chút. Cũng để ý đối với mô hình bậc cao hơn phương pháp

đổi mới có khuynh hướng để cho mô hình không nhân quả so với

Hannan – Rissanen. Ước lượng thô đề xuất ba mô hình ứng viên AR(2),

MA(7) và ARMA(1,1). Để kết thúc việc lựa chọn ta cần thực hiện ước

lượng ML và tìm mô hình AICC cực tiểu như là mô hình ban đầu cho

cực đại hàm hợp lý. Ta tìm được mô hình ML ARMA(1,1) cho giá trị

AICC bé nhất, và mô hình ML AR(2) thứ hai. ∎

§𝟑. NGHIỆM ĐƠN VỊ TRONG MÔ HÌNH CHUỖI THỜI GIAN

Vấn đề nghiệm đơn vị trong chuỗi thời gian xuất hiện khi đa thức

AR hoặc MA của một mô hình ARMA có nghiệm nằm trên hoặc gần

vòng tròn đơn vị. Nghiệm đơn vị trong các đa thức đó có liên quan quan

trọng cho mô hình hoá.. Chẳng hạn, nghiệm gần 1 của đa thức AR gợi

ý rằng số liệu có thể được sai phân trước khi dựng mô hình ARMA,

trong khi nghiệm gần 1 của đa thức MA cho thấy số liệu bị quá khả sai
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

phân (overdifferenced). Trong tiết này ta xem xét quy trình suy luận để

phát hiện nghiệm đơn vị trong các đa thức AR và MA.

3.1 Nghiệm đơn vị trong tự hồi quy

Trong tiết 1 ta đã bàn về việc dùng sai phân để biến đổi một chuỗi

thời gian không dừng với hàm tự tương quan mẫu giảm chậm và các

giá trị gần 1 tại các trễ bé thành chuỗi với tự tương quan mẫu giảm

nhanh. Bậc sai phân của chuỗi {𝑋, } được xác định bằng áp dụng toán

tử sai phân liên tiếp cho đến khi tự tương quan mẫu của {𝛻 5 𝑋, } giảm

nhanh. Chuỗi thời gian đã sai phân có thể là mô hình của một quá trình

ARMA(𝑝, 𝑞) bậc thấp, và từ đó mô hình kết quả ARIMA(𝑝, 𝑑, 𝑞) cho

số liệu gốc có đa thức AR (1 − 𝑎" 𝑧 − ⋯ − 𝑎ˆ 𝑧 ˆ )(1 − 𝑧)5 , với 𝑑

nghiệm trên vòng tròn đơn vị. Ta sẽ bàn cách tiếp cận hệ thống nhằm

kiểm định sự có mặt nghiệm đơn vị của đa thức AR để quyết định xem

có nên sai phân chuỗi thời gian hay không.

Cho 𝑋" , … , 𝑋% là các quan sát từ mô hình AR(1)

𝑋, − 𝜇 = 𝑎" 𝑋,K" − 𝜇 + 𝜀, , {𝜀, } ~ WN(0; 𝜎 = ), (6.11)

trong đó 𝑎" < 1 và 𝜇 = 𝐸𝑋, . Với 𝑛 lớn, ước lượng ML 𝑎" của 𝑎" sẽ

xấp xỉ chuẩn 𝒩(𝑎" , (1 − 𝑎"= )/𝑛). Đối với trường hợp nghiệm đơn vị,

xấp xỉ chuẩn này không còn dùng được, ngay cả theo kiểu tiệm cận, và
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

không thể được sử dụng để kiểm định giả thuyết nghiệm đơn vị 𝐻F : 𝑎"

= 1 với 𝐻" : 𝑎" < 1. Để xây dựng kiểm định 𝐻F , ta viết lại (6.11)

𝛻𝑋, = 𝑋, − 𝑋,K" = 𝑎F∗ + 𝑎"∗ 𝑋,K" + 𝜀, , {𝜀, } ~ WN(0; 𝜎 = ), (6.12)

trong đó 𝑎F∗ = 𝜇(1 − 𝑎" ) và 𝑎"∗ = 𝑎" − 1. Bây giờ cho 𝑎"∗ là ước lượng

bình phương bé nhất thông thường (OLS – ordinary least squares) của

𝑎"∗ tìm được bằng tính hồi quy của 𝛻𝑋, theo 1 và 𝑋,K" . Ước lượng của

độ lệch chuẩn của 𝑎"∗ là

%
𝑆𝐸(𝑎"∗ ) = 𝑆/ ,I=(𝑋,K" − 𝑋)= "/=
,

%
trong đó 𝑆 = = ,I= 𝛻𝑋, − 𝑎F∗ − 𝑎"∗ 𝑋,K" =
/(𝑛 − 3) và 𝑋 là trung bình

mẫu của 𝑋" , … , 𝑋%K" . Dickey và Fuller đã tìm ra phân phối giới hạn khi

𝑛 → ∞ của 𝑡-tỷ số

𝜏• = 𝑎"∗ /𝑆𝐸(𝑎"∗ ) (6.13)

dưới giả thiết nghiệm đơn vị 𝑎"∗ = 0, từ đó có thể xây dựng kiểm định

giả thuyết gốc 𝐻F : 𝑎" = 1. Các phân vị 0,01; 0,05 và 0,10 của phân phối

giới hạn của 𝜏• (xem bảng Fuller, 1976) lần lượt là −3,43; −2,86 và

−2,57. Theo Dickey-Fuller ta bác bỏ giả thuyết gốc về nghiệm đơn vị,

với mức 0,05 nếu 𝜏• < −2,86. Để ý giá trị ngưỡng của thống kê kiểm

định bé hơn nhiều giá trị ngưỡng tiêu chuẩn −1,645 thu được từ xấp xỉ
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

chuẩn cho phân phối 𝑡, nên giả thuyết nghiệm đơn vị khó có khả năng

bị bác bỏ hơn khi dùng phân phối giới hạn chính xác.

Quy trình trên có thể mở rộng cho trường hợp {𝑋, } tuân theo mô

hình AR(𝑝) với trung bình 𝜇

𝑋, − 𝜇 = 𝑎" 𝑋,K" − 𝜇 + ⋯ + 𝑎ˆ 𝑋,Kˆ − 𝜇 + 𝜀, , {𝜀, } ~ WN(0; 𝜎 = ).

Mô hình này có thể viết lại

𝛻𝑋, = 𝑎F∗ + 𝑎"∗ 𝑋,K" + 𝑎=∗ 𝛻𝑋,K" + ⋯ + 𝑎ˆ∗ 𝛻𝑋,Kˆo" + 𝜀, , (6.14)

ˆ ˆ
trong đó 𝑎F∗ = 𝜇(1 − 𝑎" − ⋯ − 𝑎ˆ ), 𝑎"∗ = [I" 𝑎[ − 1 và 𝑎H∗ = [IH 𝑎[ ,

𝑗 = 2, … , 𝑝. Nếu đa thức AR có nghiệm đơn vị tại 1, thì 0 = 𝑎(1) = −𝑎"∗ ,

và chuỗi đã lấy sai phân {𝛻𝑋, } là quá trình AR(𝑝 − 1). Hệ quả là kiểm

định giả thuyết về nghiệm đơn vị tại 1 của đa thức AR tương đương với

kiểm định 𝑎"∗ = 0. Như trong thí dụ AR(1), 𝑎"∗ có thể ước lượng như là

hệ số của 𝑋,K" trong hồi quy OLS của 𝛻𝑋, với 1, 𝑋,K" , 𝛻𝑋,K" ,…,

𝛻𝑋,Kˆo" . Với 𝑛 lớn 𝑡-tỷ số

𝜏• = 𝑎"∗ /𝑆𝐸(𝑎"∗ ), (6.15)

trong đó 𝑆𝐸(𝑎"∗ ) là ước lượng của sai số chuẩn của 𝑎"∗ , có cùng phân

phối giới hạn như thống kê trong (6.13). Kiểm định mở rộng Dickey-
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Fuller trong trường hợp này được áp dụng cùng kiểu như cho trường

hợp AR(1) dùng thống kê (6.15) và giá trị ngưỡng như đã cho ở trên.

* Thí dụ 6.4 Xét kiểm định chuỗi thời gian trong thí dụ 6.1 về sự có

mặt của nghiệm đơn vị trong toán tử AR. Hàm tự tương quan riêng mẫu

gợi ý dựng mô hình AR(2) hoặc có thể AR(3). Lấy hồi quy của 𝛻𝑋,

theo 1, 𝑋,K" , 𝛻𝑋,K" , 𝛻𝑋,K= với 𝑡 = 4, … , 200 dùng OLS cho ta

𝛻𝑋, = 0,1353 − 0,0041𝑋,K" + 0,9335𝛻𝑋,K" − 0,1548𝛻𝑋,K= + 𝜀, ,

(0,1135) (0,0028) (0,0707) (0,0708)

trong đó {𝜀, } ~ WN(0; 0,9639). Thống kê kiểm định sự có mặt của

nghiệm đơn vị là

KF,FF•"
𝜏• = = −1,464.
F,FF=„

Vì −1,464 > −2,57, giả thuyết nghiệm đơn vị không thể bác bỏ với

mức 0,10. Ngược lại, nếu ta nhầm lẫn dùng phân phối 𝑡 với 193 bậc tự

do như là xấp xỉ cho 𝜏• , thì ta có thể bác bỏ giả thuyết nghiệm đơn vị

với mức 0,10 (𝑝-giá trị là 0,074). Tỷ số 𝑡 cho các hệ số khác 𝑎F∗ , 𝑎=∗ và

𝑎€∗ có phân phối 𝑡 xấp xỉ với 193 bậc tự do. Dựa trên các tỷ số 𝑡 đó, cận

chặn có thể bằng 0 khi hệ số của 𝛻𝑋,K= vừa đủ có nghĩa. Sự hiển nhiên
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

đó càng rõ hơn nhiều nghiêng về nghiệm đơn vị nếu phân tích lặp lại

mà không có số hạng trung bình. Mô hình dựng trong trường hợp này

𝛻𝑋, = 0,0012𝑋,K" + 0,9395𝛻𝑋,K" − 0,1585𝛻𝑋,K= + 𝜀, ,

(0,0018) (0,0707) (0,0709)

với {𝜀, } ~ WN(0; 0,9677). Giá trị ngưỡng 0,01, 0,05 và 0,10 cho thống

kê kiểm định tương ứng, khi thành phần trung bình bị loại khỏi mô

hình, là −2,58, −1,95 và −1,62. Trong thí dụ này, thống kê là

KF,FF"=
𝜏= = −0,667
F,FF"„

chắc chắn lớn hơn giá trị ngưỡng 0,10 là −1,62. ∎

3.2 Nghiệm đơn vị trong trung bình trượt

Nghiệm đơn vị trong đa thức MA có nhiều cách giải thích phụ

thuộc vào ứng dụng mô hình hoá. Chẳng hạn, cho {𝑋, } là một quá trình

ARMA(𝑝, 𝑞) thoả mãn

𝑎(𝐵)𝑋, = 𝑏(𝐵)𝜀, , {𝜀, } ~ WN(0; 𝜎 = ).

Khi đó chuỗi sai phân 𝑌, = 𝛻𝑋, là quá trình ARMA(𝑝, 𝑞 + 1) không

khả nghịch với đa thức MA 𝑏(𝑧)(1 − 𝑧). Hệ quả là việc kiểm định

nghiệm đơn vị trong đa thức MA tương đương với kiểm định rằng chuỗi

quá khả sai phân.


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

Như là ứng dụng thứ hai, có thể phân biệt giữa các mô hình

cạnh tranh

𝛻‘ 𝑋, = 𝑎 + 𝑉,

và 𝑋, = 𝑐F + 𝑐F 𝑡 + ⋯ + 𝑐F 𝑡 ‘ + 𝑊, ,

trong đó {𝑉, } và {𝑊, } là các quá trình ARMA khả nghịch. Với mô

hình đầu chuỗi sai phân {𝛻‘ 𝑋, } không có nghiệm đơn vị MA, trong

khi ở mô hình sau {𝛻‘ 𝑋, } có nghiệm đơn vị MA bội cấp 𝑘. Từ đó ta

có thể phân biệt giữa hai mô hình bằng việc dùng các giá trị quan sát

của {𝛻‘ 𝑋, } để kiểm định sự có mặt của nghiệm đơn vị MA.

Ta giới hạn bàn luận về nghiệm đơn vị cho mô hình MA(1),

trường hợp tổng quát khá phức tạp và chưa được giải quyết đầy đủ. Cho

𝑋" , … , 𝑋% là các quan sát từ mô hình MA(1)

𝑋, = 𝜀, + 𝑏𝜀,K" , {𝜀, } ~ IID(0,𝜎 = ).

Davis và Dunsmuir (1996) đã chứng tỏ dưới giả thiết 𝑏 = −1, 𝑛(𝑏 + 1)

(𝑏 là ước lượng ML) hội tụ theo luật phân phối. Kiểm định 𝐻F : 𝑏 = −1

với 𝐻" : 𝑏 > −1 có thể được tạo ra trên kết quả giới hạn này bằng việc

bác bỏ 𝐻F khi

𝑏 > −1 + 𝑐” /𝑛,
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

trong đó 𝑐” là phân vị (1 − 𝛼) của phân phối giới hạn của 𝑛(𝑏 + 1) (từ

bảng số của Davis, Chen và Dunsmuir (1995), 𝑐F,F" = 11,93, 𝑐F,F} =

6,80 và 𝑐F,"F = 4,90). Đặc biệt, nếu 𝑛 = 50, thì giả thuyết gốc bị bác

bỏ ở mức 0,05 nếu 𝑏 > −1 + 6,80/50 = −0,864.

Kiểm định tỷ số hợp lý cũng có thể được sử dụng để kiểm tra

giả thuyết nghiệm đơn vị. Trong trường hợp này tỷ số hợp lý là

𝐿(−1, 𝑆(−1)/𝑛) / 𝐿(𝑏, 𝜎 = ),

trong đó 𝐿(𝑏, 𝜎 = ) là hàm hợp lý Gauss của tập số liệu dựa trên mô hình

MA(1), 𝑆(−1) là tổng bình phương phần dư ở chương 5 khi 𝑏 = −1,

𝑏 và 𝜎 = là ước lượng ML của 𝑏 và 𝜎 = . Giả thuyết gốc bị bác bỏ ở mức

𝛼 nếu

–(K",—(K")/%)
𝜆% = −2ln > 𝑐–š,”
–(˜,™ n )

với giá trị ngưỡng được chọn sao cho 𝑃˜IK" (𝜆% > 𝑐–š,” ) = 𝛼. Phân

phối giới hạn của 𝜆% được Davis và cộng sự cung cấp (1995); họ cũng

cho phân vị lựa chọn của giới hạn. Người ta tìm được rằng các phân vị

này cung cấp một xấp xỉ tốt các đối trọng mẫu hữu hạn cho chuỗi thời

gian cỡ 𝑛 ≥ 50. Phân vị giới hạn cho 𝜆% dưới 𝐻F là 𝑐–š;F,F" = 4,41;

𝑐–š;F,F} = 1,94 và 𝑐–š;F,"F = 1,00.


CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

* Thí dụ 6.5 Từ một thí dụ ở chương 5, một mô hình MA(1) ML cho

tập số liệu quy tâm (𝑌, = 𝑋, + 4,035) đã được tìm

𝑌, = 𝜀, − 0,818𝜀,K" , {𝜀, } ~ WN(0;2040,75).

Về mặt cấu trúc, tham số MA có quan hệ với các phương sai sai số đo

𝜎•= và 𝜎ž= thông qua phương trình

n
˜ K™Ÿ
= n o™ n .
" o ˜n =™Ÿ

Các phương sai này tương ứng với khối lượng nhiên liệu ngày trong bể

chứa và lượng bổ sung ngày liên quan đến bán và cung cấp nhiên liệu.

Giá trị 𝑏 = −1 chỉ ra không có sai số đo đáng kể liên quan đến bán và

cung cấp nhiên liệu (tức 𝜎ž= = 0) và từ đó kiểm định cho nghiệm đơn vị

ở đây tương đương với kiểm định 𝜎•= = 0. Giả sử đã biết trung bình, giả

thuyết nghiệm đơn vị bị bác bỏ với 𝛼 = 0,01 vì −0,818 > −1 +

6,80/57 = −0,881. Sự hiển nhiên bác bỏ 𝐻F càng mạnh hơn nếu dùng

thống kê tỷ số hợp lý. Sử dụng PEST với mô hình MA(1) ở trên có 𝑏 =

−1 và 𝜎 = = 2203,12; ta tìm được −2ln𝐿(−1; 2203,12) = 604,584 và

−2ln𝐿(𝑏, 𝜎 = ) = 597,267. So sánh thống kê tỷ số hợp lý 𝜆% = 604,584

−597,267 = 7,317 với giá trị ngưỡng 𝑐–š;F,F" , ta bác bỏ 𝐻F với mức 𝛼
CHƯƠNG 6. MÔ HÌNH CHUỖI THỜI GIAN KHÔNG DỪNG VÀ CÓ MÙA

= 0,01 và kết luận rằng sai số đo liên quan đến bán và cung cấp nhiên

liệu không bằng 0. ∎

Trong thí dụ trên ta giả thiết là trung bình đã biết. Trong thực

tế, các kiểm định như thế này có thể tiến hành cho trường hợp trung

bình phải được ước lượng.

You might also like