You are on page 1of 300

Machine Translated by Google

Machine Translated by Google

Nội dung thống kê trong loạt bài thống


kê Người biên tập: G. Casella S. Fienberg
I. Olkin
Machine Translated by Google

Springer Texts in Statistics


Athreya / Lahiri: Lý thuyết đo lường và lý thuyết xác suất Bilodeau /

Brenner: Lý thuyết thống kê đa biến Brockwell / Davis: Giới thiệu về chuỗi

thời gian và dự báo Carmona: Phân tích thống kê dữ liệu tài chính trong S-PLUS Chow /

Teicher: Lý thuyết xác suất: Độc lập, khả năng thay thế cho nhau, Martingales, xuất

bản lần thứ 3 .

Christensen: Mô hình tuyến tính nâng cao: Đa biến, Chuỗi thời gian và Dữ liệu không gian; Hồi quy không đối xứng

và Tối đa hóa bề mặt đáp ứng, xuất bản lần thứ 2 .

Christensen: Mô hình Log-Linear và Hồi quy Logistic, xuất bản lần thứ 2 .

Christensen: Các câu trả lời mặt phẳng cho các câu hỏi phức tạp: Lý thuyết về mô hình tuyến tính, xuất bản lần thứ 2 .

Cryer / Chan: Phân tích chuỗi thời gian, Ấn bản thứ


hai Davis: Phương pháp thống kê để phân tích các phép đo lặp lại Dean /
Voss: Thiết kế và phân tích thử nghiệm Dekking / Kraaikamp / Lopuhaä /
Meester: Giới thiệu hiện đại về xác suất và thống kê Durrett: Bản chất của quá trình ngẫu nhiên

Edwards: Giới thiệu về tạo mô hình đồ họa, xuất bản lần thứ 2 .

Everitt: Một người bạn đồng hành R và S-PLUS cho Phân tích Đa biến Nhẹ nhàng: Đại

số Ma trận: Lý thuyết, Tính toán và Ứng dụng trong Thống kê Ghosh / Delampady / Samanta: Giới thiệu

về Phân tích Bayesian Gut: Xác suất: Một Khóa học Sau đại học Heiberger / Holland: Phân tích Thống kê

và Hiển thị dữ liệu; Một khóa học trung cấp với các ví dụ trong S-PLUS, R và SAS Công việc: Phân tích

dữ liệu đa biến ứng dụng, Tập I: Công việc thiết kế hồi quy và thử nghiệmBài: Phân tích dữ liệu đa biến ứng dụng, Tập II:

Phương pháp phân loại và đa biến Karr: Xác suất Kulkarni: Mô hình hóa, Phân tích , Thiết kế và Kiểm soát các Hệ thống ngẫu

nhiên Lange: Xác suất Ứng dụng Lange: Tối ưu hóa Lehmann: Các yếu tố của Lý thuyết Mẫu Lớn Lehmann / Romano: Kiểm tra các Giả

thuyết Thống kê, xuất bản lần thứ 3 .

Lehmann / Casella: Lý thuyết về ước lượng điểm, xuất bản lần thứ 2 .

Longford: Nghiên cứu tình trạng phổ biến của con người: Một khóa học nâng cao về thống kê Marin /

Robert: Bayesian Core: Phương pháp tiếp cận thực tế đối với thống kê Bayes tính toán Nolan / Tốc độ: Stat Labs: Thống

kê toán học thông qua ứng dụng Pitman: Xác suất Rawlings / Pantula / Dickey: Phân tích hồi quy ứng dụng Robert: Sự lựa

chọn của Bayes: Từ Cơ sở Lý thuyết-Quyết định đến Thực hiện Tính toán, xuất bản lần thứ 2 .

Robert / Casella: Phương pháp thống kê Monte Carlo, xuất bản lần thứ 2 .
Rose / Smith: Thống kê toán học với Mathematica

Ruppert: Thống kê và Tài chính: Giới thiệu Sen / Srivastava:

Phân tích hồi quy: Lý thuyết, Phương pháp và Ứng dụng.

Shao: Thống kê toán học, xuất bản lần thứ 2 .

Shorack: Xác suất cho các nhà thống kê Shumway /

Stoffer: Phân tích chuỗi thời gian và các ứng dụng của nó, xuất bản lần thứ 2 .

Simonoff: Phân tích dữ liệu phân loại Terrell:


Thống kê toán học: Giới thiệu thống nhất Thời gian : Phân tích đa biến

ứng dụng Toutenberg: Phân tích thống kê các thử nghiệm được thiết kế,

xuất bản lần thứ 2 .

Wasserman: Tất cả các thống kê phi tham số Wasserman: Tất


cả các số liệu thống kê: Một khóa học ngắn gọn về suy luận thống kê

Weiss: Mô hình hóa dữ liệu theo chiều dọc

Whittle: Xác suất thông qua kỳ vọng, xuất bản lần thứ 4 .
Machine Translated by Google

Jonathan D. Cryer • Kung-Sik Chan

Phân tích chuỗi thời gian

Với các ứng dụng trong R

Phiên bản thứ hai


Machine Translated by Google

Jonathan D. Cryer Kung-Sik Chan


Khoa Thống kê & Khoa học Tính toán Đại Khoa Thống kê & Khoa học Tính toán Đại
học Iowa Thành phố Iowa, Iowa 52242 Hoa học Iowa Thành phố Iowa, Iowa 52242 Hoa
Kỳ jon-cryer@uiowa.edu Kỳ kung-sik-chan@uiowa.edu

Người biên tập loạt bài:

George Casella Stephen Fienberg Ingram Okin


Cục thống kê Cục thống kê Cục thống kê
Đại học Florida Đại học Carnegie Mellon Đại học Stanford
Gainesville, FL 32611-8545 Pittsburgh, PA 15213-3890 Stanford, CA 94305
Hoa Kỳ Hoa Kỳ Hoa Kỳ

ISBN: 978-0-387-75958-6 e-ISBN: 978-0-387-75959-3

Số kiểm soát của Thư viện Quốc hội: 2008923058

© 2008 Springer Science + Business Media, LLC


Đã đăng ký Bản quyền. Tác phẩm này không được dịch hoặc sao chép toàn bộ hoặc một phần mà không có sự cho phép bằng
văn bản của nhà xuất bản (Springer Science + Business Media, LLC, 233 Spring Street, New York, NY 10013, USA), ngoại
trừ các đoạn trích ngắn có liên quan đến đánh giá hoặc phân tích học thuật. Nghiêm cấm sử dụng liên quan đến bất kỳ
hình thức lưu trữ và truy xuất thông tin nào, điều chỉnh điện tử, phần mềm máy tính, hoặc theo phương pháp tương tự
hoặc khác biệt hiện đã được biết đến hoặc sau này được phát triển.
Việc sử dụng tên thương mại, nhãn hiệu, nhãn hiệu dịch vụ và các thuật ngữ tương tự trong ấn phẩm này, ngay cả khi
chúng không được xác định là như vậy, sẽ không được coi là sự thể hiện ý kiến về việc chúng có thuộc quyền sở hữu
hay không.

In trên giấy không chứa axit.

9 8 7 6 5 4 3 2 1

springer.com
Machine Translated by Google

Đến gia đình của chúng tôi


Machine Translated by Google

LỜI NÓI ĐẦU

Lý thuyết và thực hành của phân tích chuỗi thời gian đã phát triển nhanh chóng kể từ khi
xuất hiện vào năm 1970 công trình nổi tiếng của George EP Box và Gwilym M. Jenkins, Phân
tích chuỗi thời gian: Dự báo và kiểm soát, hiện đã có trong ấn bản thứ ba (1994) với đồng -
tác giả Gregory C. Reinsel. Nhiều cuốn sách về chuỗi thời gian đã xuất hiện kể từ đó, nhưng
một số trong số đó đưa ra quá ít ứng dụng thực tế, trong khi những cuốn khác lại đưa ra quá
ít nền tảng lý thuyết. Cuốn sách này cố gắng trình bày cả ứng dụng và lý thuyết ở mức độ
phù hợp với nhiều sinh viên và học viên. Cách tiếp cận của chúng tôi là kết hợp ứng dụng và
lý thuyết xuyên suốt cuốn sách vì chúng cần thiết một cách tự nhiên.
Cuốn sách được phát triển cho một khóa học kéo dài một học kỳ thường dành cho các sinh
viên thống kê, kinh tế, kinh doanh, kỹ thuật và khoa học xã hội định lượng. Thống kê áp
dụng cơ bản thông qua nhiều hồi quy tuyến tính được giả định. Giải tích chỉ được giả định
trong phạm vi tối thiểu hóa tổng bình phương, nhưng giới thiệu dựa trên giải tích về thống
kê là cần thiết để hiểu thấu đáo về một số lý thuyết. Tuy nhiên, các dữ kiện bắt buộc liên
quan đến kỳ vọng, phương sai, hiệp phương sai và mối tương quan được xem xét trong phụ lục.
Ngoài ra, các thuộc tính kỳ vọng có điều kiện và dự đoán sai số bình phương trung bình tối
thiểu được phát triển trong phụ lục. Dữ liệu chuỗi thời gian thực tế được rút ra từ các
lĩnh vực khác nhau được sử dụng xuyên suốt cuốn sách để minh họa phương pháp luận. Cuốn
sách bao gồm các chủ đề bổ sung có tính chất nâng cao hơn có thể được chọn để đưa vào khóa
học nếu người hướng dẫn chọn.

Tất cả các đồ thị và kết quả số hiển thị trong sách đều được tạo ra bằng phần mềm R,
có sẵn từ Dự án R cho Máy tính Thống kê tại www.r-project.org. Một số đầu ra số đã được
chỉnh sửa để rõ ràng hơn hoặc để đơn giản hơn. R có sẵn dưới dạng phần mềm miễn phí theo
các điều khoản của Giấy phép Công cộng GNU của Tổ chức Phần mềm Tự do ở dạng mã nguồn. Nó
chạy trên nhiều nền tảng UNIX và các hệ thống tương tự, Windows và MacOS.

R là một ngôn ngữ và môi trường cho tính toán thống kê và đồ họa, cung cấp nhiều loại
thống kê (ví dụ: phân tích chuỗi thời gian, mô hình tuyến tính và phi tuyến, các bài kiểm
tra thống kê điển hình) và các kỹ thuật đồ họa, và có khả năng mở rộng cao. Phần phụ lục mở
rộng Giới thiệu về R, cung cấp phần giới thiệu về phần mềm R được thiết kế đặc biệt để đi
kèm với cuốn sách này. Một trong những tác giả (KSC) đã tạo ra một số lượng lớn các hàm R
mới hoặc nâng cao phù hợp với các phương pháp được mô tả trong cuốn sách này.
Chúng được liệt kê trên trang 468 và có sẵn trong gói có tên TSA trên Trang web của Dự án R
tại www.r-project.org. Chúng tôi cũng đã xây dựng các tệp kịch bản lệnh R cho mỗi chương.
Chúng có thể tải xuống tại www.stat.uiowa.edu/ ~ kchan / TSA.htm. Chúng tôi cũng hiển thị
mã R bắt buộc bên dưới gần như mọi bảng và hiển thị đồ họa trong sách. Các tập dữ liệu cần
thiết cho các bài tập được đặt tên trong mỗi bài tập bằng một tên tệp thích hợp; ví dụ:
larain cho dữ liệu lượng mưa ở Los Angeles. Tuy nhiên, nếu bạn đang sử dụng gói TSA, tập dữ
liệu là một phần của gói và có thể được truy cập thông qua dữ liệu lệnh R (larain), chẳng
hạn.
Tất cả các bộ dữ liệu cũng có sẵn trên trang web sách giáo khoa dưới dạng tệp ACSCII

với các tên biến ở hàng đầu tiên. Chúng tôi tin rằng nhiều âm mưu và tính toán

vii
Machine Translated by Google

viii

được mô tả trong sách cũng có thể được lấy bằng phần mềm khác, chẳng hạn như SAS ©, Splus ©,

Statgraphics ©, SCA ©, EViews ©, RATS ©, Ox ©, và những thứ khác.

Cuốn sách này là ấn bản thứ hai của cuốn sách Phân tích chuỗi thời gian của Jonathan Cryer,

xuất bản năm 1986 bởi Nhà xuất bản PWS-Kent (Duxbury Press). Ấn bản mới này chứa

gần như tất cả bản gốc được đón nhận nồng nhiệt cùng với tài liệu mới đáng kể, số lượng bộ dữ liệu mới và

các bài tập mới. Một số chủ đề mới được tích hợp với

bản gốc bao gồm các bài kiểm tra gốc đơn vị, các chức năng tự tương quan mở rộng, tập hợp con ARIMA mod els,

và bootstrapping. Các chương hoàn toàn mới bao gồm các chủ đề về mô hình sion hồi quy chuỗi thời gian, mô

hình chuỗi thời gian của phương sai thay đổi, phân tích quang phổ và ngưỡng

các mô hình. Mặc dù mức độ khó trong các chương mới này có phần cao hơn

trong tài liệu cơ bản hơn, chúng tôi tin rằng cuộc thảo luận được trình bày theo cách sẽ

làm cho tài liệu dễ tiếp cận và khá hữu ích cho nhiều đối tượng người dùng. Chương 15,

Mô hình ngưỡng, được đặt sau cùng vì đây là chương duy nhất đề cập đến mô hình phi tuyến tính

các mô hình chuỗi thời gian. Nó có thể được đề cập trước đó, nói sau Chương 12. Ngoài ra, các Chương 13

và 14 về phân tích quang phổ có thể được đề cập sau Chương 10.

Chúng tôi muốn cảm ơn John Kimmel, Biên tập viên Điều hành, Thống kê, tại Springer, vì

sự quan tâm và hướng dẫn liên tục của anh ấy trong suốt thời gian dài chuẩn bị bản thảo. Chuyên gia Howell

Tong của Trường Kinh tế London, Giáo sư Henghsiu Tsai của

Academica Sinica, Đài Bắc, Giáo sư Noelle Samia của Đại học Northwestern, Giáo sư WK Li và Giáo sư Kai W.

Ng, cả hai Đại học Hồng Kông, và Giáo sư Nils Christian Stenseth của Đại học Oslo vui lòng đọc các phần của

bản thảo,

và Giáo sư Jun Yan đã sử dụng phiên bản sơ bộ của văn bản cho một lớp học tại Đại học

của Iowa. Những ý kiến đóng góp mang tính xây dựng của họ được đánh giá rất cao. Chúng tôi xin cảm ơn

Samuel Hao, người đã giúp giải bài tập và đọc phần phụ lục: Lời giới thiệu với R. Chúng tôi cũng muốn cảm ơn

một số người đánh giá ẩn danh đã đọc tập lệnh manu ở nhiều giai đoạn khác nhau. Đánh giá của họ đã dẫn đến

một cuốn sách được cải thiện nhiều. Cuối cùng, một trong những

các tác giả (JDC) muốn cảm ơn Dan, Marian và Gene đã cung cấp một

địa điểm, Casa de Artes, Câu lạc bộ Santiago, Mexico, vì đã làm việc trên bản thảo đầu tiên của phần lớn
phiên bản mới này.

Thành phố Iowa, Iowa Jonathan D. Cryer

Tháng 1 năm 2008 Kung-Sik Chan


Machine Translated by Google

NỘI DUNG

CHƯƠNG 1 GIỚI THIỆU . .... . . . ....... . . ....... . . .... 1

1.1 Ví dụ về Chuỗi thời gian. .. . . ....... . . . ...... . . ..... 1

1.2 Chiến lược xây dựng mô hình. . . . . ....... . . ....... . . .... số 8

1.3 Các lô thời gian trong lịch sử. . . ....... . . ....... . . ..... số 8

1.4 Tổng quan về cuốn sách. ... . . ....... . . ....... . . . ... 9


Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . . 10

CHƯƠNG 2 CÁC KHÁI NIỆM CƠ BẢN . ... . . ....... . . . . . 11

2.1 Chuỗi thời gian và quy trình ngẫu nhiên. . . . ....... . . . . . 11


2.2 Phương sai, Phương sai và Phương sai. ... . . ....... . . . . . 11

2.3 Tính cơ sở. .... . . ........ . . ....... . . ....... . . . . . 16

2.4 Tóm tắt. ..... . . ........ . . ....... . . ....... . . . . . 19


Bài tập. . . ........ . . ....... . . ...... . . . ....... . . . . . . 19

Phụ lục A: Kỳ vọng, Phương sai, Phương sai và Tương quan. 24

CHƯƠNG 3 XU HƯỚNG . . . . ....... . . . ....... . . ....... . . . . . 27

3.1 Xu hướng xác định so với ngẫu nhiên. . . . ...... . . . . . . 27


3.2 Ước tính giá trị trung bình không đổi. ....... . . ....... . . . . . 28

3.3 Phương pháp hồi quy. . ..... . . ........ . . ...... . . . . . . 30

3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy. . . . . . . . 36

3.5 Thông dịch đầu ra hồi quy. ...... . . ....... . . . . . . 40

3.6 Phân tích dư lượng. . ....... . . ...... . . . ....... . . . . . . 42

3.7 Tóm tắt. ..... . . ........ . . ....... . . ....... . . . . . 50


Bài tập. . . ........ . . ....... . . ...... . . . ....... . . . . . . 50

CHƯƠNG 4 CÁC MÔ HÌNH CHO CÁC GIAI ĐOẠN THỜI GIAN TRẠM TRẠM . . . . . 55

4.1 Các quy trình tuyến tính chung. . . . ........ . . ....... . . . . . 55

4.2 Các quá trình trung bình động. . ....... . . . ...... . . . . . . . 57

4.3 Các quy trình tự động phục hồi. . . . ....... . . ....... . . . . . . 66

4.4 Mô hình Trung bình Động Tự động Phục hồi Hỗn hợp. . . . . . . . 77

4.5 Tính nghịch đảo. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

4.6 Tóm tắt. ..... . . ........ . . ....... . . ....... . . . . . 80


Bài tập. . . ........ . . ....... . . ...... . . . ....... . . . . . . 81

Phụ lục B: Khu vực ổn định cho một quá trình AR (2). . . . . 84

Phụ lục C: Hàm Tự tương quan cho ARMA (p, q). . . . . . . 85

ix
Machine Translated by Google

x Nội dung

CHƯƠNG 5 CÁC MÔ HÌNH DÀNH CHO CÁC DÒNG THỜI KỲ KHÔNG TƯƠNG TỰ .87

5.1 Tính ổn định thông qua sự khác biệt. ....... . . . ...... . . . .88
5.2 Mô hình ARIMA. . .. . . ........ . . ...... . . . ....... . . . .92
5.3 Điều khoản không đổi trong Mô hình ARIMA. . ...... . . . . . . . . . . . . .97
5.4 Các biến đổi khác. ....... . . ....... . . . . . . . . . . . . 0,98

5.5 Tóm tắt. . ....... . . ....... . . . ....... . . . . . . . . . . .102


Bài tập. . .. . . ....... . . ........ . . ...... . . . . . . . . . . . . .103

Phụ lục D: Người điều hành dịch chuyển lùi. . . . . . . . . . . . . . . . . . . . . . .106

CHƯƠNG 6 ĐẶC ĐIỂM KỸ THUẬT MÔ HÌNH . . ....... . . . . . . . . . . . .109

6.1 Các thuộc tính của chức năng tự tương quan mẫu. .. . . . .109
6.2 Các chức năng tự tương quan một phần và mở rộng. . . . .112

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian được mô phỏng. . . . . . . . . . .117
6.4 Sự phi lý. . .. . . ....... . . . ...... . . . . . . . . . . . . .125

6.5 Các phương pháp đặc điểm kỹ thuật khác. . . . ....... . . . . . . . . . . . . .130

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế. . . . . . . . . . . . . .133
6.7 Tóm tắt. ........ . . ....... . . ....... . . . . . . . . . . . .141
Bài tập. . .. . . ....... . . ....... . . ....... . . ....... . . . .141

CHƯƠNG 7 ƯỚC LƯỢNG THAM SỐ . ...... . . . . . . . . . . . .149

7.1 Phương pháp Khoảnh khắc. ..... . . ....... . . . . . . . . . . . .149

7.2 Ước tính bình phương nhỏ nhất. ... . . ....... . . ....... . . . .154

7.3 Khả năng xảy ra tối đa và bình phương ít nhất vô điều kiện. . .158
7.4 Các thuộc tính của Ước tính. . .160 . . . . ....... . . ....... . .

7.5 Minh họa về ước lượng tham số. .... . . . . . . . . . . . . .163

7.6 Mô hình ARIMA khởi động. . . ....... . . . . . . . . . . . . .167

7.7 Tóm tắt. ........ . . ....... . . . ...... . . . . . . . . . . . .170


Bài tập. . .. . . ....... . . ........ . . ...... . . . . . . . . . . . . .170

CHƯƠNG 8 CHẨN ĐOÁN MÔ HÌNH . . . ....... . . . . . . . . . . . .175

8.1 Phân tích dư lượng. . ....... . . . ...... . . ........ . . . .175

8.2 Trang bị thừa và Dự phòng tham số. . .. . . . . . . . . . . . .185

8.3 Tóm tắt. ........ . . ....... . . ....... . . . . . . . . . . . .188


Bài tập. . .. . . ....... . . ....... . . ....... . . ....... . . . .188
Machine Translated by Google

Nội dung xi

CHƯƠNG 9 DỰ BÁO. . .... . . . ....... . . ....... . . . . 191

9.1 Dự báo lỗi bình phương trung bình tối thiểu. . . . . . . . . . . . . 191
9.2 Xu hướng xác định. . ...... . . ....... . . . ...... . . . . 191
9.3 Dự báo ARIMA. ....... . . ........ . . . . . . . . . . . . 193
9.4 Giới hạn dự đoán. . . ....... . . ....... . . . ...... . . . . . 203
9.5 Minh họa dự báo. ... . . ....... . . . ...... . . . . . 204
9.6 Cập nhật Dự báo ARIMA. . ....... . . . ....... . . . . . 207
9.7 Trọng số dự báo và Trọng số theo cấp số nhân
Đường trung bình động. . . . . . . . . . . . . . . . . . . . . ....... . . . . 207
9.8 Chuỗi dự báo đã biến đổi. . ...... . . ....... . . . . 209
9.9 Tóm tắt dự báo với một số mô hình ARIMA nhất định. . . . 211
9.10 Tóm tắt. ..... . . ....... . . . ....... . . ....... . . . . 213
Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . 213
Phụ lục E: Kỳ vọng có Điều kiện. . ....... . . ....... . . . . 218
Phụ lục F: Dự đoán lỗi bình phương trung bình tối thiểu. . . . . . . . . 218
Phụ lục G: Quy trình tuyến tính rút gọn. .. . . ....... . . . . 221
Phụ lục H: Mô hình không gian trạng thái. . . . . . . . . . . . ...... . . . . . . 222

CHƯƠNG 10 CÁC MÔ HÌNH MÙA . . ....... . . ....... . . . . 227

10.1 Mô hình ARIMA theo mùa. .. . . . ....... . . ....... . . . . 228


10.2 Mô hình ARMA theo mùa đa số. . . . ....... . . . . . 230
10.3 Mô hình ARIMA theo mùa không cố định. . . ....... . . . . 233
10.4 Đặc điểm kỹ thuật mô hình, lắp và kiểm tra. . ...... . . . . . 234
10.5 Các mô hình dự báo theo mùa. . ....... . . ....... . . . . 241
10.6 Tóm tắt. ..... . . ....... . . ........ . . ...... . . . . . 246
Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . 246

CHƯƠNG 11 CÁC MÔ HÌNH ĐỊA LÍ CÁC LOẠI THỜI GIAN . . . . . . 249

11.1 Phân tích can thiệp. ..... . . ........ . . ...... . . . . . 249


11.2 Các yếu tố ngoại lai. . . . . . . . . . ....... . . ........ . . ....... . . . . 257
11.3 Tương quan giả. . ..... . . ....... . . . ...... . . . . . 260
11.4 Làm trắng da và hồi quy ngẫu nhiên. . . ...... . . . . . 265
11.5 Tóm tắt. ..... . . ....... . . ........ . . ...... . . . . . 273
Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . 274
Machine Translated by Google

xii Nội dung

CHƯƠNG 12 CÁC MÔ HÌNH DÒNG THỜI GIAN CỦA

KHẢ NĂNG LÀM VIỆC. . ....... . . . . . . . . . . . .277

12.1 Một số đặc điểm chung của chuỗi thời gian tài chính. . . . . . .278

12.2 Mô hình ARCH (1). . ....... . . ....... . . . . . . . . . . . .285


12.3 Mô hình GARCH. .. . . ....... . . ....... . . ....... . . . .289
12.4 Ước tính khả năng xảy ra tối đa. ....... . . . . . . . . . . . . .298

12.5 Chẩn đoán Mô hình. . . . ....... . . ....... . . . . . . . . . . . .301

12.6 Điều kiện cho tính không âm của


Phương sai có điều kiện. ...... . . . ...... . . . . . . . . . . . . .307
12.7 Một số phần mở rộng của mô hình GARCH. .. . . . . . . . . . . . .310

12.8 Một ví dụ khác: Tỷ giá hối đoái USD / HKD hàng ngày. .311
12.9 Tóm tắt. . . . ..315
...... . . ........ . . ...... . . . ......
.. .
Bài tập. . . .316 . ....... . . ....... . . ....... . . ....... . .

Phụ lục I: Công thức cho Kiểm tra Portmanteau Tổng quát. . .318

CHƯƠNG 13 GIỚI THIỆU VỀ PHÂN TÍCH PHÂN TÍCH. . . .319

13.1 Giới thiệu. ...... . . ....... . . ....... . . . . . . . . . . . .319

13.2 Biểu đồ tuần hoàn. .. . . ....... . . ....... . . . . . . . . . . . .322

13.3 Biểu diễn phổ và phân bố phổ. . . .327


13.4 Mật độ phổ. . . . .330 ....... . . . ...... . . .......

13.5 Mật độ phổ cho các quá trình ARMA. . . . .332 . . . .......

13.6 Tính chất lấy mẫu của mật độ phổ mẫu. . . . .340
....... . . . ....... . . .......
13.7 Tóm tắt. . . .346 . . . ......
Bài tập. . .. . . ....... . . ........ . . ...... . . . . . . . . . . . . .346

Phụ lục J: Tính trực giao của chuỗi Cosine và sin. . . . .349

CHƯƠNG 14 ƯỚC LƯỢNG THỂ TÍCH . . . . . . . . . . . . . .351

14.1 Làm mịn mật độ quang phổ. ....... . . . . . . . . . . . . .351


14.2 Độ chệch và phương sai. . . . . . . . . . . . ...... . . . ....... . . . .354
14.3 Băng thông. ...... . . ....... . . ....... . . . . . . . . . . . . .355

14.4 Khoảng tin cậy cho phổ. .. . . ....... . . . .356

14.5 Rò rỉ và tắc nghẽn. ....... . . ....... . . . . . . . . . . . .358

14.6 Ước tính phổ tự động hồi phục. . ... . . . . . . . . . . . . .363

14.7 Ví dụ với dữ liệu được mô phỏng. . ....... . . . . . . . . . . . . .364

14.8 Ví dụ với dữ liệu thực tế. .. . . ....... . . . . . . . . . . . . .370

14.9 Các phương pháp ước lượng phổ khác. .... . . . . . . . . . . . .376

14,10 Bản tóm tắt. . . . . . . . . . . . . . . . . . . . ....... . . . . . . . . . . . .378


Bài tập. . .. . . ....... . . ....... . . ....... . . ....... . . . .378

Phụ lục K: Tanking và Dirichlet Kernel. .. . . . . . . . . . . . .381


Machine Translated by Google

Nội dung xiii

CHƯƠNG 15 CÁC MÔ HÌNH HỮU HẠN . ...... . . ....... . . . . 383

15.1 Khám phá tính phi tuyến tính bằng đồ họa. . . . . . . . ....... . . . . 384

15.2 Kiểm tra tính phi tuyến. ..... . . ....... . . ....... . . . . . 390

15.3 Các mô hình đa thức thường dễ bùng nổ. ..... . . . . . 393

15.4 Mô hình tự động khôi phục ngưỡng bậc nhất. .... . . . . . 395
15.5 Mô hình ngưỡng. . ........ . . ....... . . ....... . . . . 399

15.6 Kiểm tra tính phi tuyến của ngưỡng. .... . . . ...... . . . . . 400
15.7 Ước tính Mô hình TAR. . . . ........ . . ....... . . . . 402

15.8 Chẩn đoán mô hình. ........ . . ....... . . ....... . . . . 411


15,9 Dự đoán. .... . . . ....... . . ....... . . ....... . . . . . 415

15.10 Tóm tắt. ..... . . ....... . . ........ . . ....... . . . . 420


Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . 420

Phụ lục L: Thử nghiệm Portmanteau Tổng quát cho TAR. . . . . . 421

PHỤ LỤC: GIỚI THIỆU VỀ R. .... . . . ...... . . . . . 423

Giới thiệu . . . ...... . . . ....... . . ....... . . ....... . . . . 423

Chương 1 R Các lệnh. ....... . . ....... . . . ...... . . . . . 429

Chương 2 R Các lệnh. ....... . . ....... . . . ...... . . . . . 433

Chương 3 R Các lệnh. ....... . . ....... . . . ...... . . . . . 433

Chương 4 R Các lệnh. ....... . . ....... . . . ...... . . . . . 438

Chương 5 Các lệnh R. ....... . . ....... . . . ...... . . . . . 439

Chương 6 Lệnh R. ....... . . ....... . . . ...... . . . . . 441

Chương 7 R Các lệnh. ....... . . ....... . . . ...... . . . . . 442

Chương 8 R Các lệnh. ....... . . ....... . . . ...... . . . . . 446

Chương 9 Lệnh R. ....... . . ....... . . . ...... . . . . . 447

Chương 10 Các lệnh R. ...... . . ....... . . . ...... . . . . . 450

Chương 11 Lệnh R. ...... . . ....... . . . ...... . . . . . 451

Chương 12 Lệnh R. ...... . . ....... . . . ...... . . . . . 457

Chương 13 Lệnh R. ...... . . ....... . . . ...... . . . . . 460

Chương 14 Lệnh R. ...... . . ....... . . . ...... . . . . . 461

Chương 15 R Các lệnh. ...... . . ....... . . . ...... . . . . . 462

Chức năng mới hoặc chức năng nâng cao trong Thư viện TSA. . . . . . . . . . . . . 468

THÔNG TIN DATASET . . . . . . . . . . . . . . . . . . . . . . . . . 471

BIBLIOGRAPHY . ....... . . ........ . . ....... . . ....... . . . . 477

CHỈ SỐ . . . . . . . . . . ...... . . ........ . . ....... . . ....... . . . . 487


Machine Translated by Google

CHƯƠNG 1
GIỚI THIỆU

Dữ liệu thu được từ các quan sát được thu thập tuần tự theo thời gian là cực kỳ hài hòa. Trong
kinh doanh, chúng tôi quan sát lãi suất hàng tuần, giá cổ phiếu đóng cửa hàng ngày, chỉ số giá
hàng tháng, số liệu bán hàng hàng năm, v.v. Trong khí tượng học, chúng tôi quan sát nhiệt độ cao
và thấp hàng ngày, lượng mưa hàng năm và các chỉ số hạn hán, và tốc độ gió hàng giờ. Trong nông
nghiệp, chúng tôi ghi lại số liệu hàng năm về sản xuất cây trồng và vật nuôi, xói mòn đất và
doanh số xuất khẩu. Trong khoa học sinh học, chúng ta quan sát hoạt động điện của tim ở những
khoảng thời gian mili giây. Trong sinh thái học, chúng tôi ghi lại sự phong phú của các loài
động vật. Danh sách các lĩnh vực mà chuỗi thời gian được nghiên cứu hầu như vô tận. Mục đích của
phân tích chuỗi thời gian thường gồm hai mặt: để hiểu hoặc mô hình hóa chủ nghĩa ngẫu nhiên làm
phát sinh chuỗi được quan sát và dự đoán hoặc dự báo các giá trị tương lai của chuỗi dựa trên
lịch sử của chuỗi đó và có thể là các chuỗi liên quan khác hoặc các yếu tố.
Chương này sẽ giới thiệu nhiều ví dụ về chuỗi thời gian từ các lĩnh vực ứng dụng đa dạng.
Một đặc điểm hơi độc đáo của chuỗi thời gian và các mô hình của chúng là chúng ta thường không
thể giả định rằng các quan sát phát sinh độc lập từ một quần thể chung (hoặc từ các quần thể với
các phương tiện khác nhau, chẳng hạn). Nghiên cứu các mô hình kết hợp sự phụ thuộc là khái niệm
chính trong phân tích chuỗi thời gian.

1.1 Ví dụ về Chuỗi thời gian

Trong phần này, chúng tôi giới thiệu một số ví dụ sẽ được xem xét trong các chương sau.

Lượng mưa hàng năm ở Los Angeles

Hình 1.1 hiển thị biểu đồ chuỗi thời gian về lượng mưa hàng năm được ghi nhận ở Los Angeles,
California, trong hơn 100 năm. Biểu đồ cho thấy sự thay đổi đáng kể về lượng mưa qua các năm -
một số năm thấp, một số cao và nhiều năm có giá trị tương đương nhau. Năm 1883 là một năm đặc
biệt ẩm ướt đối với Los Angeles, trong khi năm 1983 khá khô hạn. Đối với mục đích phân tích và
mô hình hóa, chúng tôi quan tâm đến việc các năm liên tiếp có liên quan với nhau theo một cách
nào đó hay không. Nếu vậy, chúng tôi có thể sử dụng giá trị lượng mưa của một năm để giúp dự báo
lượng mưa của năm tới. Một cách đồ họa để điều tra câu hỏi đó là ghép các giá trị lượng mưa liên
tiếp và vẽ biểu đồ phân tán kết quả của các cặp.

Hình 1.2 cho thấy một biểu đồ phân tán đối với lượng mưa. Ví dụ: điểm được vẽ gần góc dưới
bên phải cho thấy rằng năm có lượng mưa cực lớn, 40 inch vào năm 1883, được theo sau bởi lượng
mưa giữa đường (khoảng 12 inch) vào năm 1884. Điểm

1
Machine Translated by Google

2 Giới thiệu

gần đầu màn hình hiển thị rằng năm 40 inch trước một năm điển hình hơn nhiều là
khoảng 15 inch.

Phụ lục 1.1 Biểu đồ chuỗi thời gian về lượng mưa hàng năm ở Los Angeles


• • •
• •
• •• •
• •• • • •• • •
• • • • •
Inch

• •
• • • • • • • ••
• •
•• • •• • •
•• • •• ••••
• • • •
••
• •
• • •

• ••
40
30
20
10
• •• •
• •• •
• ••

• •• • •• •


• • • • • • • ••
••


• • •
• • • •
•• • • •
• •

1880 1900 1920 1940 1960 1980

Năm
> library (TSA)>
win.graph (width = 4.875, height = 2.5, pointsize = 8)>
data (larain); plot (larain, ylab = 'Inches', xlab = 'Year', type = 'o')

Hình 1.2 Biểu đồ phân tán của Lượng mưa LA so với Lượng mưa LA của Năm ngoái


40

• •
30
• •
• • • •

• •• •• •
• •


Inch
20


• •

••


• • • •• • • •


• •
• • •

•• •
• • • •


•• • •
• •
• • ••
• ••
• ••
• ••
• ••

• • •



10
••• •


• • • • •


• •
•• •
• • •

•• • •
• • •

• •

• • •• •
• •
• •

10 20 30 40

Inch năm trước

> win.graph (width = 3, height = 3, pointsize =


8)> plot (y = larain, x = zlag (larain), ylab = 'Inches',
xlab = 'Inch năm trước')
Machine Translated by Google

1.1 Ví dụ về Chuỗi thời gian 3

Ấn tượng chính mà chúng tôi nhận được từ biểu đồ này là có rất ít thông tin về lượng mưa năm nay so

với lượng mưa năm ngoái. Cốt truyện cho thấy không

"Xu hướng" và không có xu hướng chung. Có rất ít mối tương quan giữa lượng mưa năm ngoái

số tiền và số tiền của năm nay. Từ quan điểm mô hình hóa hoặc dự báo, đây không phải là

một chuỗi thời gian rất thú vị!

Một quy trình hóa chất công nghiệp

Ví dụ thứ hai, chúng tôi xem xét một chuỗi thời gian từ một quy trình hóa chất công nghiệp.

Biến được đo ở đây là thuộc tính màu từ các lô liên tiếp trong quá trình.

Hình 1.3 cho thấy một biểu đồ chuỗi thời gian của các giá trị màu này. Đây là những giá trị hàng xóm

trong thời gian có xu hướng tương tự về kích thước. Có vẻ như những người hàng xóm có liên quan đến nhau.

Biểu đồ 1.3 Chuỗi thời gian Biểu đồ thuộc tính màu từ một quá trình hóa học

85 • • •

• • •• ••• • •
75
• • • •• • • •
• •••• •
Thuộc
tính
màu
65 • • • • •• •

0 5 10 15 20 25 30 35

Lô hàng

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> dữ liệu (màu)

> plot (color, ylab = 'Color Property', xlab = 'Batch', type = 'o')

Điều này có thể được thấy rõ hơn bằng cách xây dựng biểu đồ phân tán của các cặp lân cận khi chúng ta

đã làm với ví dụ đầu tiên.

Hình 1.4 hiển thị biểu đồ phân tán của các cặp giá trị màu lân cận. Chúng tôi thấy

xu hướng tăng nhẹ trong biểu đồ này — các giá trị thấp có xu hướng được theo sau trong đợt tiếp theo bởi

giá trị thấp, giá trị cỡ trung bình có xu hướng được theo sau bởi giá trị cỡ trung bình và giá trị cao

các giá trị có xu hướng được theo sau bởi các giá trị cao. Xu hướng rõ ràng nhưng không khủng khiếp

mạnh. Ví dụ, mối tương quan trong biểu đồ phân tán này là khoảng 0,6.
Machine Translated by Google

4 Giới thiệu

Biểu đồ 1.4 Biểu đồ tán xạ của Giá trị màu so với Giá trị màu trước đó

85
• • •

80
•• • •
• • •
• ••• •• •
••
75


• •
Thuộc
tính
màu

70

• •

• •
• • ••
65


65 70 75 80 85

Thuộc tính màu lô trước


> win.graph (chiều rộng = 3, chiều cao = 3, kích thước điểm = 8)
> plot (y = color, x = zlag (color), ylab = 'Color Thuộc tính', xlab = 'Thuộc
tính Màu Hàng loạt Trước đó')

Sự phong phú hàng năm của Canada Hare

Ví dụ thứ ba của chúng tôi liên quan đến sự phong phú hàng năm của thỏ Canada. Hình 1.5 cho

cốt truyện chuỗi thời gian của sự phong phú này trong khoảng 30 năm. Các giá trị lân cận ở đây là

liên quan rất chặt chẽ. Những thay đổi lớn về mức độ phong phú không xảy ra từ năm này sang năm khác.

Mối tương quan lân cận này được nhìn thấy rõ ràng trong Hình 1.6, nơi chúng tôi đã lập biểu đồ về

sự nhảy vọt so với sự phong phú của năm trước. Như trong ví dụ trước, chúng ta thấy một

xu hướng tăng trong biểu đồ — các giá trị thấp có xu hướng được theo sau bởi các giá trị thấp trong năm tới,

giá trị cỡ trung bình bằng giá trị cỡ trung bình và giá trị cao bằng giá trị cao.
Machine Translated by Google

1.1 Ví dụ về Chuỗi thời gian 5

Hình 1.5 Sự phong phú của Canada Hare


•• •• • •
80

• • •
• ••
••
40
dào
Dồi
• •• • • •
0 • • • • • ••
• • •
1905 1910 1915 1920 1925 Năm 1930 1935

Năm

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> dữ liệu (thỏ rừng); plot (hare, ylab = 'Abundance', xlab = 'Year', type = 'o')

Hình minh họa 1.6 Mức độ dồi dào so với Mức độ dồi dào của Năm trước


• • • •
80



• •

60


40


dào
Dồi

••• ••
20
• • • • •
•• •

•• •
0

0 20 40 60 80

Năm trước dồi dào

> win.graph (chiều rộng = 3, chiều cao = 3, kích thước điểm = 8)


> plot (y = hare, x = zlag (hare), ylab = 'Abundance',
xlab = 'Sự dồi dào của năm trước')
Machine Translated by Google

6 Giới thiệu

Nhiệt độ trung bình hàng tháng ở Dubuque, Iowa

Nhiệt độ trung bình hàng tháng (tính bằng độ F) trong một số năm được ghi lại ở Dubuque,
Iowa, được thể hiện trong Hình 1.7.

Hình 1.7 Nhiệt độ Trung bình Hàng tháng, Dubuque, Iowa

• • • • ••
••• •
70
• •• • •

•• •• •
•• •

•• • •
• • • • •

• •• •


• • • •
•• • • •
• • • ••
• •

• • • • •• • • •

• • • • ••
50

• • • •• • ••
• •

• •• • • • •
• • • • • •• •
• •

• •
• • • • •
Nhiệt
độ 30

•• • • • • • •
• •


• • • •
• •

• •
• • ••


•• • • • • ••

• •
10 •
• •

Năm 1964 Năm 1966 Năm 1968 1970 Năm 1972 1974 Năm 1976

Thời gian

> win.graph (width = 4.875, height = 2.5, pointsize =


8)> data (tempdub); âm mưu (tempdub, ylab = 'Nhiệt độ', type = 'o')

Chuỗi thời gian này hiển thị một mô hình rất đều đặn được gọi là tính thời vụ. Tính
thời vụ cho các giá trị hàng tháng xảy ra khi các quan sát cách nhau mười hai tháng có
liên quan đến một số người khác. Tất cả các tháng 1 và tháng 2 đều khá lạnh nhưng chúng
có giá trị tương tự và khác với nhiệt độ của các tháng ấm hơn như tháng 6, tháng 7 và
tháng 8, chẳng hạn. Vẫn có sự khác biệt giữa các giá trị tháng 1 và sự thay đổi giữa các
giá trị tháng 6. Các mô hình cho loạt phim như vậy phải phù hợp với biến thể này trong khi
vẫn giữ được các điểm tương đồng. Ở đây người ta đã hiểu rõ lý do của tính thời vụ — độ
nghiêng thay đổi của Bắc bán cầu đối với mặt trời.

Bán bộ lọc dầu hàng tháng

Ví dụ cuối cùng của chúng tôi cho chương này liên quan đến doanh số hàng tháng cho các
đại lý của bộ lọc dầu chuyên dụng cho thiết bị xây dựng do John Deere sản xuất. Khi những
dữ liệu này lần đầu tiên được trình bày cho một trong các tác giả, người quản lý nói,
"Không có lý do gì để tin rằng những doanh số bán hàng này là theo mùa." Tính thời vụ sẽ
xuất hiện nếu các giá trị của tháng 1 có xu hướng liên quan đến các giá trị khác của tháng
1, các giá trị của tháng 2 có xu hướng liên quan đến các giá trị khác của tháng 2, v.v.
Cốt truyện của chuỗi thời gian được hiển thị trong Phụ lục 1.8 không được thiết kế để đặc
biệt tốt cho việc chơi theo mùa. Hình 1.9 đưa ra cùng một cốt truyện nhưng được sửa đổi
để sử dụng các biểu tượng cốt truyện có ý nghĩa. Trong biểu đồ này, tất cả các giá trị
của tháng 1 được vẽ bằng charac ter J, tất cả các tháng 2 với F, tất cả các cuộc tuần hành
với M, v.v. và tháng 2 đều có xu hướng cao, trong khi doanh số bán hàng vào tháng 9, 10, 11 và 12 là
Machine Translated by Google

1.1 Ví dụ về Chuỗi thời gian 7

đồng minh khá thấp. Tính thời vụ trong dữ liệu dễ thấy hơn nhiều từ biểu đồ chuỗi thời gian đã
sửa đổi này.

Hình 1.8 Doanh số bán bộ lọc dầu hàng tháng

• • •
• • • • •
• •• • •
hàng
Việc
bán

• •
•••
• •
• ••

• •

• •
•• •••

• • • •
• •
6000
4000
2000

• • •

• •
• •

1984 1985 1986 1987

Thời gian

> dữ liệu (bộ lọc dầu); âm mưu (bộ lọc dầu, type = 'o', ylab = 'Bán hàng')

Biểu thị 1.9 Doanh số bán bộ lọc dầu hàng tháng với các ký hiệu vẽ đồ thị đặc biệt

6000

J F F
JF J J Một

FMAM Một

J
4000

S M
J AMJ
hàng
Việc
bán

O D J J
D
Một

M J M
J N Một Một
M J
O TRÊN
Một
TRÊN
M
2000

S
N D
S S D

1984 1985 1986 1987

Thời gian
J = tháng 1 (và tháng 6 và tháng 7),
F = tháng 2, M = tháng 3 (và tháng 5), v.v.

> lô (bộ lọc dầu, type = 'l', ylab = 'Bán hàng')> điểm (y =
bộ lọc dầu, x = thời gian (bộ lọc dầu), pch = as.vector (mùa
(bộ lọc dầu)))

† Khi đọc cốt truyện, bạn vẫn sẽ phải phân biệt giữa tháng Giêng, tháng Sáu và tháng Bảy, giữa tháng

Giêng và tháng Năm, và tháng Tư và tháng Tám, nhưng điều này có thể dễ dàng thực hiện bằng cách nhìn

vào các nhân vật trong cốt truyện lân cận.


Machine Translated by Google

số 8 Giới thiệu

Nói chung, mục tiêu của chúng tôi là nhấn mạnh các phương pháp vẽ biểu đồ phù hợp và sử dụng

tối đa để tìm ra các mẫu dẫn đến các mô hình phù hợp cho dữ liệu chuỗi thời gian của chúng tôi.

Trong các chương sau, chúng ta sẽ xem xét một số cách khác nhau để kết hợp tính thời vụ vào các mô
hình chuỗi thời gian.

1.2 Chiến lược xây dựng mô hình

Tìm kiếm các mô hình thích hợp cho chuỗi thời gian là một nhiệm vụ không hề nhỏ. Chúng tôi sẽ phát

triển một chiến lược xây dựng mô hình nhiều bước đã được Box và Jenkins (1976) tán thành rất tốt.

Có ba bước chính trong quy trình, mỗi bước có thể được sử dụng nhiều lần:

1. đặc tả mô hình (hoặc nhận dạng) 2. phù hợp

mô hình, và 3. chẩn đoán mô hình Trong đặc tả

mô hình (hoặc nhận dạng), các lớp của mô hình

chuỗi thời gian được chọn có thể phù hợp với một chuỗi quan sát nhất định. Trong bước này,

chúng tôi xem xét biểu đồ thời gian của chuỗi, tính toán nhiều thống kê khác nhau từ dữ liệu và

cũng áp dụng bất kỳ kiến thức nào về chủ đề mà dữ liệu phát sinh, chẳng hạn như sinh học, kinh

doanh hoặc sinh thái. Cần nhấn mạnh rằng mô hình được chọn vào thời điểm này là dự kiến và có thể

được sửa đổi sau này trong quá trình phân tích.

Trong việc lựa chọn một mô hình, chúng tôi sẽ cố gắng tuân thủ các nguyên tắc của parsimony;

nghĩa là, mô hình được sử dụng phải yêu cầu số lượng tham số nhỏ nhất sẽ đại diện đầy đủ cho chuỗi

thời gian. Albert Einstein được trích dẫn trong Parzen (1982, trang 68) khi nhận xét rằng “mọi thứ

nên được làm càng đơn giản càng tốt nhưng không đơn giản hơn”.

Mô hình chắc chắn sẽ liên quan đến một hoặc nhiều tham số mà giá trị của chúng phải được ước

tính từ chuỗi quan sát. Việc điều chỉnh mô hình bao gồm việc tìm ra các ước lượng tốt nhất có thể

về các thông số chưa biết đó trong một mô hình nhất định. Chúng tôi sẽ xem xét các tiêu chí như

bình phương nhỏ nhất và khả năng lớn nhất để ước tính.

Chẩn đoán mô hình liên quan đến việc đánh giá chất lượng của mô hình mà chúng tôi đã chỉ định

và ước tính. Mô hình phù hợp với dữ liệu đến mức nào? Các giá trị giả định của mô hình có được thỏa

mãn một cách hợp lý không? Nếu không tìm thấy điểm bất cập nào, mô hình có thể được coi là hoàn

chỉnh và mô hình có thể được sử dụng, ví dụ, để dự báo các giá trị trong tương lai. Nếu không,

chúng tôi chọn một mô hình khác dựa trên những bất cập được tìm thấy; nghĩa là chúng ta quay lại

bước đặc tả mô hình. Bằng cách này, chúng tôi thực hiện theo ba bước cho đến khi, lý tưởng nhất là

tìm thấy một mô hình có thể chấp nhận được.

Bởi vì các tính toán cần thiết cho mỗi bước trong xây dựng mô hình là chuyên sâu, chúng tôi sẽ

dựa vào phần mềm thống kê sẵn có để thực hiện các tính toán và vẽ biểu đồ.

1.3 Các âm mưu của chuỗi thời gian trong lịch sử

TheoTufte (1983, trang 28), “Cốt truyện theo chuỗi thời gian là hình thức thiết kế đồ họa thường

xuyên được sử dụng nhất. Với một chiều di chuyển theo nhịp điệu đều đặn của giây
Machine Translated by Google

1.4 Tổng quan về cuốn sách 9

onds, phút, giờ, ngày, tuần, tháng, năm hoặc thiên niên kỷ, thứ tự tự nhiên của thang thời gian

mang lại cho thiết kế này một sức mạnh và hiệu quả giải thích không có trong cách sắp xếp đồ họa

nào khác. ”

Hình 1.10 mô phỏng lại những gì dường như là ví dụ lâu đời nhất được biết đến về một cốt

truyện chuỗi thời gian, có niên đại từ thế kỷ thứ mười (hoặc có thể là thứ mười một) và cho thấy

các góc nghiêng của quỹ đạo hành tinh. † Nhận xét về hiện vật này, Tufte nói “Nó xuất hiện như một

kỳ quan bí ẩn và biệt lập trong lịch sử đồ họa dữ liệu, kể từ khi đồ họa tồn tại tiếp theo của một

chuỗi thời gian có âm mưu xuất hiện vào khoảng 800 năm sau ”.

Hình 1.10 Một lô thời gian ở thế kỷ thứ mười

1.4 Tổng quan về cuốn sách

Chương 2 phát triển các ý tưởng cơ bản về hàm trung bình, hiệp phương sai và tương quan và kết thúc

với khái niệm quan trọng về tính đứng yên. Chương 3 thảo luận về phân tích xu hướng và nghiên cứu

cách ước tính và kiểm tra các mô hình xu hướng xác định phổ biến, chẳng hạn như các mô hình cho xu
hướng thời gian tuyến tính và các phương tiện theo mùa.

Chương 4 bắt đầu sự phát triển của các mô hình tham số cho chuỗi thời gian tĩnh, cụ thể là

cái gọi là mô hình đường trung bình động tự động hồi quy (ARMA) (còn được gọi là mô hình Box-

Jenkins). Sau đó, các mô hình này được khái quát trong Chương 5 để bao gồm một số loại trường hợp

ngẫu nhiên ngẫu nhiên — các mô hình ARIMA.

Các chương 6, 7 và 8 là trung tâm của chiến lược xây dựng mô hình cho ARIMA mod eling. Các

kỹ thuật được trình bày để xác định một cách tạm thời các mô hình (Chương 6), ước tính hiệu quả

các tham số của mô hình bằng cách sử dụng bình phương nhỏ nhất và khả năng xảy ra lớn nhất (Chương

7), và xác định mức độ phù hợp của các mô hình với dữ liệu (Chương 8).

Chương 9 phát triển kỹ lưỡng lý thuyết và phương pháp dự báo sai số bình phương trung bình

tối thiểu cho các mô hình ARIMA. Chương 10 mở rộng các ý tưởng của Chương 4

† Từ Tufte (1983, trang 28).


Machine Translated by Google

10 Giới thiệu

đến 9 đến các mô hình theo mùa ngẫu nhiên. Các chương còn lại bao gồm các chủ đề được chọn và có
tính chất nâng cao hơn một chút.

BÀI TẬP

1.1 Sử dụng phần mềm để tạo biểu đồ chuỗi thời gian được trình bày trong Hình 1.2, trên trang 2.
Dữ liệu nằm trong tệp có tên larain. † 1.2 Tạo biểu đồ chuỗi thời gian được hiển thị

trong Phụ lục 1.3, trên trang 3. Tệp dữ liệu là


màu được đặt tên .

1.3 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị bình thường, độc
lập. Vẽ sơ đồ chuỗi thời gian. Nó có trông "ngẫu nhiên" không? Lặp lại bài tập này nhiều
lần với một mô phỏng mới mỗi lần.

1.4 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị phân bố chi bình
phương, độc lập, mỗi giá trị có 2 bậc tự do. Hiển thị âm mưu của chuỗi thời gian.
Nó trông có vẻ “ngẫu nhiên” và không bình thường? Lặp lại bài tập này nhiều lần với một
mô phỏng mới mỗi lần.

1.5 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị được phân phối t
độc lập, mỗi giá trị có 5 bậc tự do. Xây dựng cốt truyện của chuỗi thời gian. Nó trông có
vẻ “ngẫu nhiên” và không bình thường? Lặp lại bài tập này nhiều lần với một mô phỏng mới
mỗi lần.

1.6 Xây dựng biểu đồ chuỗi thời gian với các ký hiệu biểu đồ hàng tháng cho chuỗi nhiệt độ
Dubuque như trong Phụ lục 1.9, trên trang 7. Dữ liệu nằm trong tệp có tên là lồng tiếng
tạm thời.

† Nếu bạn đã cài đặt gói R TSA, có sẵn để tải xuống tại www.r-project.org, dữ
liệu larain được truy cập bằng lệnh R: data (larain). Tệp ASCII của dữ liệu
cũng có sẵn trên Trang web sách tại www.stat.uiowa.edu/~kchan/TSA.htm.
Machine Translated by Google

CHƯƠNG 2
CÁC KHÁI NIỆM CƠ BẢN

Chương này mô tả các khái niệm cơ bản trong lý thuyết về mô hình chuỗi thời gian. Trong
đặc biệt, chúng tôi giới thiệu các khái niệm về quá trình ngẫu nhiên, hàm hàm trung bình và
hiệp phương sai, các quá trình tĩnh và các hàm tự tương quan.

2.1 Chuỗi thời gian và quy trình ngẫu nhiên

Chuỗi các biến ngẫu nhiên {Yt: t = 0, ± 1, ± 2, ± 3,…} được gọi là ngẫu nhiên
xử lý và phục vụ như một mô hình cho một chuỗi thời gian được quan sát. Được biết, sự hoàn
cấu trúc xác suất của một quá trình như vậy được xác định bởi tập hợp các phân phối của tất cả
tập hợp hữu hạn của Y. May mắn thay, chúng tôi sẽ không phải giải quyết rõ ràng với những
các phân phối đa biến. Phần lớn thông tin trong các bản phân phối chung này có thể
được mô tả dưới dạng phương tiện, phương sai và hiệp phương sai. Do đó, chúng tôi tập trung
nỗ lực của chúng tôi vào những khoảnh khắc đầu tiên và thứ hai này. (Nếu phân phối chung của Y là
phân phối chuẩn đa biến , sau đó thời điểm thứ nhất và thứ hai ngăn chặn hoàn toàn
tất cả các phân phối chung.)

2.2 Phương sai, Phương sai và Phương sai

Đối với quy trình ngẫu nhiên {Yt: t = 0, ± 1, ± 2, ± 3,…}, hàm trung bình được xác định bởi

μt E Yt = () f hoặc t = 0, 12 ±..., ±, (2.2.1)

Tức là, μt chỉ là giá trị kỳ vọng của quá trình tại thời điểm t. Nói chung, μt có thể khác ent
tại mỗi thời điểm t.

Hàm tự thay đổi , γt, s, được định nghĩa là

= f hoặc ts = ±
0,,,
1 ±
γtS, ( Cov Yt ,
Ys ) 2 ..., (2.2.2)

trong đó Cov (Yt, Ys) = E [(Yt - μt ) (Ys - μs)] = E (YtYs) - μt μs.

Hàm tự tương quan, ρt, s, được cho bởi

= cho ts = 0, ±
1 ,,
±
ρt S, ( Ys ,)
Corr Yt 2 ..., (2.2.3)

ở đâu

() Ys,
Cov Yt γtS,
= -------------------------------------------- = --------------------
() Ys,
Corr Yt (2.2.4)
Var Yt ( ) Var Ys () , có
không S,

11
Machine Translated by Google

12 Các khái niệm cơ bản

Chúng tôi xem xét các thuộc tính cơ bản của kỳ vọng, phương sai, hiệp phương sai và tương quan

trong Phụ lục A trên trang 24.


Nhớ lại rằng cả hiệp phương sai và tương quan đều là các thước đo của sự phụ thuộc (tuyến tính)
giữa các biến ngẫu nhiên nhưng mối tương quan không đơn vị có phần dễ dàng hơn giữa các biến ngẫu

nhiên. Các thuộc tính quan trọng sau đây dựa trên các kết quả đã biết và định nghĩa của chúng tôi:

= 1 =
không
,
Var Yt () ρt ,t
= =
γt S, γs ,t ρt S, ρs t (2.2.5)
,

≤ ρt S,
≤ 1
γt S, không
, có S,

Các giá trị của ρt, s gần ± 1 biểu thị sự phụ thuộc mạnh (tuyến tính), trong khi các giá trị gần 0

chỉ ra sự phụ thuộc yếu (tuyến tính). Nếu ρt, s = 0, chúng ta nói rằng Yt và Ys là không tương quan.
Để khảo sát thuộc tính hiệp phương sai của các mô hình chuỗi thời gian khác nhau,
kết quả sau sẽ được sử dụng lặp lại: Nếu c1, c2,…, cm và d1, d2,…, dn là hằng số và t1,
t2,…, tm và s1, s2,…, sn là các mốc thời gian, thì

m N m N
Cov , , ) (2.2.6)
ci Yt
dj Ysj
= ( ci dj Cov Yt
tôi Ysj
tôi

tôi 1 = j 1 = tôi 1 = j 1 =

Chứng minh Công thức (2.2.6), mặc dù tẻ nhạt, là một ứng dụng đơn giản của
các tính chất tuyến tính của kỳ vọng. Như một trường hợp đặc biệt, chúng tôi thu được kết quả nổi tiếng

N N N tôi 1–
Var = )+ 2
ci Yt tôi
ci 2Var Yt
( Cov (Yt ,Yt )
ci cj
(2.2.7)
j
tôi tôi

tôi 1 = tôi 1 = tôi 2 = j 1 =

Đi bộ ngẫu nhiên

Cho e1, e2,… là một chuỗi các biến ngẫu nhiên độc lập, phân bố giống hệt nhau
2 .
từng có phương sai và trung bình bằng 0 Chuỗi
σe thời gian quan sát được, {Yt: t = 1, 2,…}, là
được xây dựng như sau:

Y1 e1 =

Y2 e1 .e2 + =
.
. (2.2.8)

= +++
Yt e1 e2 … et

Ngoài ra, chúng ta có thể viết

(2.2.9)
Yt Yt 1– et + =

với “điều kiện ban đầu” Y1 = e1. Nếu chữ e được hiểu là kích thước của "các bước" được thực hiện
(tiến hoặc lùi) dọc theo một đường số, khi đó Yt là vị trí của "ngẫu nhiên
người đi bộ ”tại thời điểm t. Từ phương trình (2.2.8), chúng ta thu được hàm trung bình
Machine Translated by Google

2.2 Phương sai, Phương sai và Phương sai 13

= = =
( μt E Yt () E e1 e2) …+++
et E e1 () E e2 ()… E et + ++ ()

= 0 0 ++ +… 0

để có thể

μt = 0 với mọi t (2.2.10)


Chúng tôi cũng có

= =
( Var Yt () Var e1 +e2Var
… et
e1 )()++Var e2 ()… Var et + ++ ()
2 2
2 =σe+++ σe … E

để có thể

= (2.2.11)
Var Yt () 2 te

Lưu ý rằng phương sai quá trình tăng tuyến tính theo thời gian.
Để khảo sát hàm hiệp phương sai, giả sử rằng 1 ≤ t ≤ s. Sau đó chúng tôi có
= , = , et 1+ + + ++ + +
γt S, Cov Yt()Ys Cov e1( e2 … et +++ e1 e2 … et )… Es

Từ phương trình (2.2.6), chúng ta có


S t

γt S, = Cov ei (),
ej
tôi 1 = j 1 =

2
Tuy nhiên, các hiệp phương sai này bằng 0 trừ khi i = j, trong trường hợp đó chúng bằng Var (ei ) = σe .
2
Có đúng t trong số này để γt, s = t σe .

Vì γt, s = γs, t, điều này chỉ định hàm tự phương sai cho tất cả các thời điểm t và s
và chúng ta có thể viết

= 2
γt S, tσe cho 1 ≤ ≤ts (2.2.12)

Hàm tự tương quan cho bước đi ngẫu nhiên hiện có thể dễ dàng thu được như

γt S, t
= = - cho 1 ≤ ≤ts (2.2.13)
--------------------
ρt S,
S
, có
không S,

Các giá trị số sau đây giúp chúng ta hiểu hành vi của ngẫu nhiên
đi bộ.

1
= = - 0,707 = = - 0,943
số 8

ρ1 2, ρ8 9,
2 9

24 1
= = ----- 0,980 = = ----- 0,200
ρ24 25
, ρ1 ,
25
25 25

Các giá trị của Y tại các điểm thời gian lân cận ngày càng có tương quan chặt
chẽ và tỷ lệ thuận theo thời gian. Mặt khác, các giá trị của Y ở thời điểm xa
điểm ngày càng ít tương quan.
Một cuộc đi bộ ngẫu nhiên được mô phỏng được thể hiện trong Phụ lục 2.1 nơi các e được chọn từ

một phân phối chuẩn chuẩn. Lưu ý rằng mặc dù hàm trung bình theo lý thuyết là
Machine Translated by Google

14 Các khái niệm cơ bản

0 cho tất cả các mốc thời gian, thực tế là phương sai tăng theo thời gian và mối tương quan
giữa các giá trị quá trình gần đó trong thời gian gần bằng 1 cho thấy rằng chúng ta nên mong đợi
các chuyến du ngoạn dài của quá trình ra khỏi mức trung bình bằng 0.
Quá trình đi bộ ngẫu nhiên đơn giản cung cấp một mô hình tốt (ít nhất là cho một lần
tương ứng đầu tiên) cho các hiện tượng đa dạng như sự chuyển động của giá cổ phiếu phổ thông, và
vị trí của các hạt nhỏ lơ lửng trong chất lỏng - cái gọi là chuyển động Brown.

Hình 2.1 Biểu đồ chuỗi thời gian của một bước đi ngẫu nhiên


số
8


• •
6 • •
• • •
• •
• • •

• •

•• • •
4

•• •
• •


2 • • •

• ••
• • •


•• • •• •• ••
nhiên
ngẫu
bộ
Đi

• •• • • •
• • •
• •
0 2


0 10 20 30 40 50 60

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> data (rwalk) # rwalk chứa một cuộc đi bộ ngẫu nhiên được mô phỏng

> plot (rwalk, type = 'o', ylab = 'Random Walk')

Đường trung bình động

Ví dụ thứ hai, giả sử rằng {Yt } được xây dựng như

+
et et 1–
--------------------- =
Yt (2.2.14)
2

trong đó (như mọi khi trong cuốn sách này) các e được giả định là độc lập và được phân phối
2 Nơi đây
chuẩn xác với phương sai và giá trị trung bình bằngσe0.

+
et et E et () E et 1– + ()
== = ---------------------------------------
---------------------

1– μt E Yt () E 2 2

0 =


Machine Translated by Google

2.2 Phương sai, Phương sai và Phương sai 15

et+ et 1– Var và () +Var và( 1– )


= --------------------- = ------------------------------------------------- -
Var Yt () Var 2 4

= 2
0,5σe

Cũng thế

et+ et 1– +
et 1– et 2–
( Yt,1– ) = Cov
---------------------
,
----------------------------
Cov Yt
2 2

() et, 1–
Cov và + ()et, 2–
Cov và + ( 1– và,1–
Cov và )
= ------------------------------------------------- -------------------------------------------------- -----------------------

(
Cov et 1– et 2– ) +,
-----------------------------------------

( 1– và,1– )
Cov và
= -----------------------------------------
(vì tất cả các hiệp phương sai khác bằng 0)
4

= 2
0,25σe

hoặc

= 2
, 1–
không 0,25σe cho tất cả t (2.2.15)

Hơn nữa,

et +
et 1– + 3–
et 2– et
( Yt,2– ) = Cov ---------------------
,
----------------------------
Cov Yt
2 2

= 0 vì các e là độc lập.

Tương tự, Cov (Yt, Yt k) = 0 với k > 1, vì vậy chúng ta có thể viết

0,5σe2 cho ts - 0 =
=
γt S,
0,25σe2 cho ts - 1 =

0 cho ts - 1>

Đối với hàm tự tương quan, chúng ta có

1 cho ts - 0 =
= (2.2.16)
ρt S, 0,5 cho ts - 1 =

0 cho ts - 1>

2 2
kể từ 0,25 /0,5
σe = 0,5.
σe

Chú ý rằng ρ2,1 = ρ3,2 = ρ4,3 = ρ9,8 = 0,5. Các giá trị của Y cách nhau chính xác một đơn vị thời gian

có mối tương quan chính xác như nhau cho dù chúng xảy ra ở đâu trong thời gian. Hơn nữa, ρ3,1
là như nhau đối với tất cả các giá trị của t. Điều này dẫn chúng ta đến
= ρ4,2 = ρt, t - 2 và tổng quát hơn, ρt, t -
k khái niệm quan trọng của tính đứng yên.
Machine Translated by Google

16 Các khái niệm cơ bản

2.3 Tính ổn định

Để đưa ra các suy luận thống kê về cấu trúc của một quá trình ngẫu nhiên trên cơ sở
một hồ sơ quan sát được về quá trình đó, chúng ta thường phải đưa ra một số giả định
đơn giản hóa (và tổng thể là hợp lý) về cấu trúc đó. Điều quan trọng nhất như vậy
giả định là của sự cố định. Ý tưởng cơ bản của tính ổn định là xác suất
luật điều chỉnh hành vi của quá trình không thay đổi theo thời gian. Theo một nghĩa nào đó,

thuế chuyên nghiệp đang ở trạng thái cân bằng thống kê. Cụ thể, một quy trình {Yt } được cho là
, Yt ,… Yt
hoàn toàn tĩnh nếu việc phân phối chung Yt , giống như sự phân phối chung của
1 2 N

Yt - k Yt ,
- k,… Yt - k cho tất cả các lựa chọn về thời điểm t1, t2,…, tn và tất cả các lựa chọn về thời gian
1 2 N

độ trễ k.

Do đó, khi n = 1, phân phối (đơn biến) của Yt giống như của Yt - k đối với
tất cả t và k; nói cách khác, Y được phân phối (biên) giống hệt nhau. Sau đó nó theo sau
rằng E (Yt ) = E (Yt - k) với mọi t và k để hàm trung bình là không đổi trong mọi thời gian.
Ngoài ra, Var (Yt ) = Var (Yt - k) với mọi t và k để phương sai cũng không đổi theo
thời gian.

Đặt n = 2 trong định nghĩa điểm dừng, chúng ta thấy rằng phân phối hai biến của Yt
và Ys phải giống với Yt - k và Ys - k mà từ đó nó theo sau Cov (Yt , Ys)

= Cov (Yt - k, Ys - k) với mọi t, s và k. Đặt k = s và sau đó k = t, chúng ta thu được

= , ) (
( s - Y0
γtS, Cov Yt

=
Cov Y0 Ys,t - ) (

=
Cov Y0 Y, ts - )

=
γ0, ts -

Nghĩa là, hiệp phương sai giữa Yt và Ys chỉ phụ thuộc vào thời gian thông qua thời gian khác
nhau ence | t - s | và không phải về thời gian thực tế t và s. Do đó, đối với một quá trình tĩnh,
chúng ta có thể đơn giản hóa ký hiệu và viết

= , Cov
() γk nd = , Corr
() ρk (2.3.1)
Yt Yt k - một
Yt Yt k -

Cũng lưu ý rằng

γk
---- =
ρk
γ0

Các thuộc tính tổng quát được đưa ra trong Công thức (2.2.5) bây giờ trở thành

=
γ0 Var Yt () ρ0 1 =

γk γ – k = ρk ρ – k = (2.3.2)

γk γ0 ≤ ρk ≤ 1

Nếu một quá trình là đứng yên và có phương sai hữu hạn, thì hiệp phương sai func
tion chỉ phải phụ thuộc vào độ trễ thời gian.

Một định nghĩa tương tự như định nghĩa của sự cố định nghiêm ngặt nhưng yếu hơn về mặt toán học
Machine Translated by Google

2.3 Tính ổn định 17

như sau: Quá trình ngẫu nhiên {Yt} được cho là yếu (hoặc bậc hai)
cố định nếu
1. Hàm trung bình không đổi theo thời gian và

2. =
γtt
, -k γ0, k cho tất cả thời gian t và độ trễ k

Trong cuốn sách này, thuật ngữ văn phòng phẩm khi được sử dụng một mình sẽ luôn đề cập đến dạng yếu hơn này của

sự cố định. Tuy nhiên, nếu các phân phối chung cho quá trình đều là đa biến bình thường
phân phối, nó có thể được chỉ ra rằng hai định nghĩa trùng khớp. Đối với các quy trình tĩnh,
chúng ta thường chỉ xét k ≥ 0.

Tiếng ồn trắng

Một ví dụ rất quan trọng về quá trình tĩnh là cái gọi là quá trình tiếng ồn trắng ,
được định nghĩa là một chuỗi các biến ngẫu nhiên độc lập, phân bố giống hệt nhau
{et }. Tầm quan trọng của nó không bắt nguồn từ thực tế rằng bản thân nó là một mô hình thú vị mà là từ

thực tế là nhiều quy trình hữu ích có thể được xây dựng từ nhiễu trắng. Thực tế là
{et } là hoàn toàn cố định nên dễ dàng nhận thấy vì

( Pr et x1 ≤ ,,
et x2 ≤ … Et ) ≤xn
1 2 N

=
Pr (et1 ()x1≤ Pr et2 ()x2≤ … Pr etN ) xn
≤ (độc lập)

=
Pr (et1 - k () x2 ≤ … Pr et - k )xn≤
x1 ≤ Pr et - k ()
2 N

(các bản phân phối giống hệt nhau)

= (Pr et - k x1 ≤,et - k x2 ≤,,


… Et - k )xn≤ (độc lập)
1 2 N

theo yêu cầu. Ngoài ra, μt = E (et ) là hằng số và

cho k 0 =
= Var et ()
γk
cho k 0
0

Ngoài ra, chúng ta có thể viết

1 cho k 0 =
= (2.3.3)
ρk
cho k 0
0

Thuật ngữ tiếng ồn trắng phát sinh từ thực tế là một phân tích tần số của mô hình cho thấy
tương tự với ánh sáng trắng, tất cả các tần số đều nhập như nhau. Chúng tôi thường cho rằng
2
σe
quá trình nhiễu trắng có giá trị trung bình bằng 0 và biểu thị Var (et ) bằng.

Ví dụ về đường trung bình động, ở trang 14, trong đó Yt = (et + et - 1) / 2, là một ví dụ khác
ví dụ về một quá trình tĩnh được xây dựng từ tiếng ồn trắng. Trong ký hiệu mới của chúng tôi, chúng tôi

có cho quá trình trung bình động mà


1 cho k 0 =
= 0,5 cho k 1 =
ρk
cho k ≥ 2
0
Machine Translated by Google

18 Các khái niệm cơ bản

Sóng Cosine ngẫu nhiên

Như một ví dụ hơi khác, † hãy xem xét quá trình được định nghĩa như sau:

Yt = cos 2π t
----- + Φ cho t = 012…, ±, ±,
12

trong đó Φ được chọn (một lần) từ phân phối đều trên khoảng từ 0 đến 1. A
mẫu từ quy trình như vậy sẽ có tính xác định cao vì Yt sẽ tự lặp lại
giống hệt nhau mỗi 12 đơn vị thời gian và trông giống như một đường cong cosine (thời gian rời rạc)

hoàn hảo. Dù sao đi nữa, cực đại của nó sẽ không xảy ra tại t = 0 mà sẽ được xác định bởi pha ngẫu nhiên Φ.

Giai đoạn Φ có thể được hiểu là một phần của một chu kỳ hoàn chỉnh được hoàn thành vào thời gian t =

0. Tuy nhiên, các thuộc tính thống kê của quá trình này có thể được tính như sau:

=
E Yt () E
cos 2π
t
----- + Φ
12

t 2π
cos ----- + φ dφ
= 12
0

1
1 t
= ------
tội 2π
----- +
2π φ 12
φ 0 =

1 t
= ------
tội 2πt ----- + - tội 2π

2π 2π 12 -----12

Nhưng đây là số không vì các sines phải đồng ý. Vậy μt = 0 với mọi t.
Cũng thế

γt S,
= E cos 2π t
----- + cos 2π ----- +
s

Φ 12 Φ 12

1
t S
cos 2π
----- + φ
cos 2π
----- + φ dφ
= 12 12
0

1
1
- ts -2π ts +
cos + cos 2π --------- 2 + φ 12 dφ
=2 0 12
---------

1
1
- ts2π- 1 ts +
= cos + ------ 2π Tôi tội lỗi
--------- 2 +
2 ---------
12 4π 12 φ

φ 0 =

- 1 ts2π -
= cos
2 ------------
12

† Ví dụ này chứa tài liệu tùy chọn không cần thiết để hiểu hầu hết
phần còn lại của cuốn sách này. Nó sẽ được sử dụng trong Chương 13, Giới thiệu về Phân tích Quang phổ.
Machine Translated by Google

2.4 Tóm tắt 19

Vì vậy, quá trình là tĩnh với chức năng tự tương quan

k
= cos 2π cho k = 012…, ±, ±, (2.3.4)
ρk ----- 12

Ví dụ này cho thấy rằng sẽ rất khó để đánh giá xem liệu có phải là

một giả định hợp lý cho một chuỗi thời gian nhất định trên cơ sở biểu đồ trình tự thời gian của
dữ liệu quan sát.
= +++ cũng được xây dựng
Bước đi ngẫu nhiên của trang 12, nơi Yt e1 e2 … et từ nhiễu trắng nhưng ,
không đứng yên. Ví dụ, hàm phương sai, Var (Yt ) =
2 2 cho 0 ≤ t ≤ s không =
σe_ , không
tσe phải là hằng số; hơn nữa, hàm hiệp phương sai γt
S,
không chỉ phụ thuộc vào độ trễ thời gian. Tuy nhiên, giả sử rằng thay vì phân tích {Yt } trực tiếp,

chúng tôi xem xét sự khác biệt của các giá trị Y liên tiếp, được ký hiệu là Yt . Khi đó Yt = Yt - Yt 1 =

vì vậy chuỗi sai phân, { Yt }, là cố định. Điều này đại diện cho một ví dụ đơn giản về
et , kỹ thuật được tìm thấy là cực kỳ hữu ích trong nhiều ứng dụng. Rõ ràng, nhiều thời gian thực

chuỗi không thể được mô hình hóa một cách hợp lý bởi các quá trình tĩnh vì chúng không ở trạng thái

cân bằng thống kê mà đang phát triển theo thời gian. Tuy nhiên, chúng ta có thể thường xuyên chuyển

đổi chuỗi không cố định thành chuỗi tĩnh bằng các kỹ thuật đơn giản như phân biệt. Như là

các kỹ thuật sẽ được theo đuổi mạnh mẽ trong các chương còn lại.

2.4 Tóm tắt

Trong chương này, chúng tôi đã giới thiệu các khái niệm cơ bản về các quá trình ngẫu nhiên phục vụ

làm mô hình cho chuỗi thời gian. Đặc biệt, bây giờ bạn nên làm quen với các

các khái niệm về hàm trung bình, hàm tự thay đổi và hàm tự tương quan.

Chúng tôi đã minh họa các khái niệm này bằng các quy trình cơ bản: bước đi ngẫu nhiên, tiếng ồn trắng,

đường trung bình động đơn giản và một sóng cosine ngẫu nhiên. Cuối cùng, khái niệm cơ bản về

văn phòng phẩm được giới thiệu ở đây sẽ được sử dụng xuyên suốt cuốn sách.

BÀI TẬP

2.1 Giả sử E (X) = 2, Var (X) = 9, E (Y) = 0, Var (Y) = 4 và Corr (X, Y) = 0,25. Tìm thấy:
(a) Var (X + Y).

(b) Cov (X, X + Y).

(c) Corr (X + Y, X - Y).

2.2 Nếu X và Y phụ thuộc nhưng Var (X) = Var (Y), hãy tìm Cov (X + Y, X - Y).

2.3 Cho X có phân phối với trung bình μ và phương sai σ2 , và đặt Yt = X với mọi t.

(a) Chứng tỏ rằng {Yt } là đứng yên và yếu.

(b) Tìm hàm tự phương sai cho {Yt }.

(c) Vẽ sơ đồ thời gian “điển hình” của Yt .


Machine Translated by Google

20 Các khái niệm cơ bản

2.4 Cho {et } là một quá trình nhiễu trắng có nghĩa là 0. Giả sử rằng quá trình được quan
sát là Yt = et + {Yt
θet }- cả
1, khi
trong
θ =đó3 θvàlàkhi
3 hoặc
θ = 1/3.
1/3. (b)
(a) Bạn
Tìm nên
hàm phát
tự tương
hiện quan
ra rằng
cho
chuỗi thời gian là đứng yên bất kể giá trị của θ và các hàm tự tương quan là như
nhau đối với θ = 3 và θ = 1/3. Để đơn giản hơn, giả sử rằng trung bình của quá
trình được biết là 0 và phương sai của Yt được biết là 1. Bạn quan sát chuỗi

{Yt } cho t = 1, 2, ..., n và giả sử rằng bạn có thể tạo ra ước lượng của tự
tương quan ρk.

Bạn có nghĩ rằng bạn có thể xác định giá trị nào của θ là đúng (3 hoặc 1/3) dựa trên

ước tính của ρk không? Tại sao hoặc tại sao không?
2.5 Giả sử Yt = 5 + 2t + Xt , trong đó {Xt } là chuỗi đứng yên bằng 0 với hàm phương sai
autoco γk. (a) Tìm hàm trung bình cho {Yt }. (b) Tìm hàm tự phương sai cho {Yt }.
(c) {Yt } có đứng yên không ? Tại sao hoặc tại sao không?

cho t lẻ
=
2.6 Gọi {Xt } là một chuỗi thời gian tĩnh và xác định Yt Xt
cho t thậm chí.
Xt

3+ (a) Chứng tỏ rằng Cov


() không ,k -t với mọi độ trễ k.
chứa
Yt Yt

(b) {Yt } có đứng yên không ?

2.7 Giả sử rằng {Yt } đứng yên với hàm tự phương sai γk. (a) Chứng tỏ
rằng Wt = Yt = Yt - Yt - 1 là đứng yên
sai bằng
trungcách
bìnhtìm
và hàm
phương
phương
sai autoco cho {Wt }.

(b) Chứng tỏ rằng Ut = 2Yt = [Yt - Yt 1] = Yt - 2Yt 1 + Yt 2 là đứng yên.


(Bạn không cần tìm hàm trung bình và phương sai tự động cho {Ut }.)
2.8 Giả sử rằng {Yt } đứng yên với hàm tự phương sai γk. Chứng tỏ rằng với bất kỳ số nguyên
dương n cố định và bất kỳ hằng số c1, c2, ..., cn nào, quá trình {Wt } được xác định
=
bởi là tĩnh. (Lưu+ý ++
rằng Bài tập Wt c1Yt
… CnYt n - c2Yt
1 +1– kết
2,7 quả
là một
này.)
trường hợp đặc biệt của

2.9 Giả sử Yt = β0 + β1t + Xt , trong đó {Xt } là chuỗi đứng yên bằng 0 với hàm hiệp
phương sai tự động γk và β0 và β1 là các hằng số. (a) Chứng tỏ rằng {Yt } không
đứng yên nhưng Wt = Yt = Yt - Yt - 1 là đứng yên. (b) Nói chung, chứng
nếu Yttỏ
= rằng
μt +
Xt , trong đó {Xt } là chuỗi đứng yên bằng 0= và μt
( là
m đa1Yt
thức
) là
ở tsta
bậctĩnh
d, thì
đối với
mYt
m ≥ d và tĩnh đối với 0 ≤ m < d.

2.10 Gọi {Xt } là một quá trình tĩnh đơn vị-trung bình bằng 0 với hàm tự tương quan ρk.
Giả sử rằng μt là một hàm không thuận và σt là một hàm không thuận nghịch có giá
trị dương. Chuỗi quan sát được hình thành là Yt = μt + σt Xt . (a) Tìm hàm trung
bình và hiệp phương sai cho quá trình {Yt }. (b) Chứng tỏ rằng hàm tự tương quan
cho quá trình {Yt } chỉ phụ thuộc vào
thời gian trễ. Quá trình {Yt } có đứng yên không?
(c) Có thể có một chuỗi thời gian với giá trị trung bình không đổi và với
Corr (Yt, Yt - k) không có t nhưng với {Yt } không đứng yên?
Machine Translated by Google

Bài tập 21

2.11 Giả sử Cov (Xt, Xt - k) = γk không chứa t nhưng E (Xt ) = 3t.


(a) {Xt } có đứng yên không ?

(b) Cho Yt = 7 - 3t + Xt . {Yt } có đứng yên không ?


2.12 Giả sử rằng Yt = et - et-12. Chứng tỏ rằng {Yt } là đứng yên và với k > 0,
hàm tự tương quan là khác không chỉ đối với độ trễ k = 12.
2
2.13 Cho Yt = et - θ (et - 1) . Đối với bài tập này, giả sử rằng chuỗi tiếng ồn trắng cũng không
phân phối mally.
(a) Tìm hàm tự tương quan cho {Yt }.
(b) {Yt } có đứng yên không ?

2.14 Đánh giá hàm trung bình và hiệp phương sai cho mỗi quá trình sau đây. Trong
mỗi trường hợp, xác định xem quá trình có đứng yên hay không.
(a) Yt = θ0 + tet .

(b) Wt = Yt , trong đó Yt như đã cho trong phần

(a). (c) Yt = et et - 1. (Bạn có thể cho rằng {et } là nhiễu trắng bình thường.)

2.15 Giả sử rằng X là một biến ngẫu nhiên có giá trị trung bình bằng không. Xác định một chuỗi thời gian bằng

Yt = ( 1) t X.

(a) Tìm hàm trung bình cho {Yt }.


(b) Tìm hàm hiệp phương sai của {Yt }.
(c) {Yt } có đứng yên không ?

2.16 Giả sử Yt = A + Xt , trong đó {Xt } là đứng yên và A là ngẫu nhiên nhưng độc lập với
{Xt }. Tìm hàm trung bình và hiệp phương sai cho {Yt } theo giá trị trung bình và
hàm tự phương sai cho {Xt } và giá trị trung bình và phương sai của A.
_ 1 - N
2.17 Cho {Yt } đứng yên với hàm tự phương sai γk. Hãy cho thấy Y .
= N t 1 = Yt
điều đó

n 1–
γ0 2
- k
----
Var Y_ () + =
N N 1 --–N γk
k 1 =

n 1–
-1 1 - -----
k
= N N γk
kn - 1 + =

2.18 Cho {Yt } đứng yên với hàm tự phương sai γk. Xác định biến mẫu =
1 N _
2
ance as S2 -----------
()
Yt-Y .
n 1– t 1 =
N N _
2 = 2
(a) Đầu tiên cho thấy rằng Yt () - μ (Yt )Y - + N Y_ ( 2 ) - μ .
t 1 = t 1 =

(b) Sử dụng phần (a) để chỉ ra rằng


n 1–
N N 2
(c) E S2 () =
- ----------- ----------- k
.
Var Y_= ()
- γ0
n 1–
----------- γ0
n 1– n 1– 1 --– N γk
k 1 =
(Sử dụng kết quả của Bài tập 2.17 cho biểu thức cuối cùng.)

(d) Nếu {Yt } là một quá trình nhiễu trắng với phương sai γ0, chứng tỏ rằng E (S2 ) = γ0.
Machine Translated by Google

22 Các khái niệm cơ bản

2.19 Cho Y1 = θ0 + e1, sau đó với t > 1 xác định đệ quy Yt theo Yt = θ0 + Yt 1 + et .
Ở đây θ0 là một hằng số. Quá trình {Yt } được gọi là một bước đi ngẫu nhiên với
sự trôi dạt. (a) Chứng tỏ rằng Yt có thểTìm =hàm
được ++
viết+ lại
trung
+ bình
thành …. E1
củaYtYttθ0 et et
(c)
. (b)
Tìm1–hàm
tự phương sai của Yt .

2.20 Xem xét mô hình đi bộ ngẫu nhiên tiêu chuẩn trong đó Yt = Yt - 1 + et với Y1 = e1. (a)
Sử dụng biểu diễn của Yt ở trên để chứng tỏ rằng μt = μt - 1 với t >ban
1 với
đầu điều
μ1 = kiện
E (e1) =
0. Do đó cho thấy μt = 0 với mọi t. (b) Tương tự, chứng tỏ rằng Var (Yt ) = Var (Yt
2 2
- 1) + σe và do đó Var (Yt ) = t σe (c) Với 0 ≤ t ≤ s,+ sử cho
+ es đểtYs
dụng > =1thấy
cho với+ rằng
Yt Var (Y1)
et + Cov
1 + (Yt
et +, 2
= σe
2
Ys) = .

2
Var (Yt ) và do đó, Cov (Yt , Ys) = min (t, s) σe 2,21 Đối .
với một lần đi bộ ngẫu nhiên với giá trị bắt đầu ngẫu nhiên, hãy đặt Yt = ++ + +
Y0 et et 1– … e1 cho t >
2
σ0 e1,
0, trong đó Y0 có phân phối với μ0 trung bình và phương sai. Giả sử nhiệt lông...,
mà Y0,
et
là độc lập. (a) Chứng tỏ rằng E (Yt ) = μ0 với mọi t. (b) Chứng tỏ rằng Var (Yt ) = t +
σe σ0 (c) Chứng tỏ rằng Cov (Yt , Ys) = min (t, s) + σ0
2 2
.
2 2
σe .
2 2
tσa + σ0
(d) Cho thấy rằng , ()
Corr Yt Ys
= --------------------- cho 0 ≤ ≤ts.
2
2 σ0
+ sσa
2.22 Gọi {et } là quá trình nhiễu trắng có giá trị 0, và đặt c là hằng số với | c | <1.
Định nghĩa đệ quy Yt theo Yt = cYt - 1 + et với Y1 = e1. (a)

Chứng tỏ rằng E (Yt ) = 0. (b) Chứng tỏ rằng Var (Yt ) = (1 +


2 …
c2 + c4 + + c2t - 2). {Yt } có đứng yên không ? σe (c) Chứng tỏ rằng

() 1–
Var Yt
Corr Yt , 1– )
( Yt = --------------------------
c
và nói chung,
Var Yt ()

Var Yt k - ()
, k - )
( Yt
Corr Yt
= ck --------------------------
cho k > 0
Var Yt ()

Gợi ý: Lập luận rằng Yt - 1 độc lập với et . Sau đó sử

dụng Cov (Yt , Yt - 1) = Cov (cYt - 1 + et , Yt

1 ) (d) Đối với t lớn, lập luận rằng


2
σe
Var Yt ()
≈ ------------- và Corr Yt , k - ) ck ≈
( Yt cho k > 0
1 c2
- để {Yt } có thể được gọi là tiệm cận đứng. (e) Giả
e1
sử bây giờ chúng ta thay đổi điều kiện ban đầu và đặt Y1 mà = ------------------ . Trình diễn

bây giờ {Yt } đang đứng yên. 1 c2 -


Machine Translated by Google

Bài tập 23

2.23 Hai quá trình {Zt } và {Yt } được cho là độc lập nếu đối với bất kỳ thời điểm nào t1,

t2, ..., tm và s1, s2, ..., sn các biến ngẫu nhiên { Zt ,,


Zt } độc lập
1 2 … Ztm
,, tỏ rằng nếu
của các biến ngẫu nhiên {}. Chứng {Zt
các } trình
quá và {Ytđứng
} làyên Ys1 Ys2 … Ysn ,
thì Wt = Zt + Yt là các quá trình đứng yên.

2.24 Gọi {Xt } là một chuỗi thời gian mà chúng ta quan tâm. Tuy nhiên, vì bản thân quá trình
chắc chắn không hoàn hảo, chúng tôi thực sự quan sát thấy Yt = Xt + et . Chúng tôi giả định
rằng {Xt } và {et } là các quá trình độc lập. Chúng tôi gọi Xt là tín hiệu và et
nhiễu đo lường hoặc quá trình lỗi.
Nếu {Xt } đứng yên với hàm tự tương quan ρk, chứng tỏ rằng {Yt } cũng
đứng yên với
ρk
, k - )
( Yt = -------------------------- cho k ≥ 1
Corr Yt 2 2
1 +σe⁄ σX

2 2là⁄ tỷ lệ tín hiệu trên nhiễu, hoặc SNR. Lưu ý rằng SNR càng lớn,
Chúng tôi gọi
σX σe
Hàm tự tương quan của quá trình quan sát {Yt } càng gần với hàm tự tương
quan của tín hiệu mong muốn {Xt }.
k
2.25 Giả sử Yt β0 + = [Ai cos
2πf( tôi
+ t
( ) sin
Bi 2πf tôi
) t ], trong đó β0, f1, f2, ..., fk là
tôi 1 =

hằng số và A1, A2, ..., Ak, B1, B2, ..., Bk là các biến ngẫu nhiên độc lập với
2
không có nghĩa và phương sai Var (Ai ) = Var (Bi ) = . σi
Chứng tỏ rằng {Yt } đang đứng yên
và tìm hàm hiệp phương sai của nó.
1 2
2.26 Định nghĩa hàm Γt = [( bán biểu
S, --E Yt Ys
2 - ) ] . Trong thống kê địa lý, Γt, s được gọi là
đồ.
(a) Chứng tỏ rằng đối với một quá trình
- =
γ0 γ .
Γt S, ts -
đứng yên (b) Một quá trình được cho là đứng yên về bản chất nếu Γt, s chỉ phụ thuộc vào thời gian
sự khác biệt | t - s |. Chứng tỏ rằng quá trình đi bộ ngẫu nhiên về bản chất là quá trình

đi bộ.

2.27 Đối với một số nguyên dương r cố định và không đổi φ, hãy xem xét chuỗi thời gian được xác định bởi
= + + ++
Yt et φet 1– φ2et 2– (a) … Ret r - .
Chứng tỏ rằng quá trình này là đứng yên với bất kỳ giá trị nào của φ.
(b) Tìm hàm tự tương quan.
2.28 (Mở rộng sóng cosin ngẫu nhiên) Giả sử rằng

Yt = Rcos (2π () ft + Φ) cho t = 012…, ±, ±,

trong đó 0 < f <½ là tần số cố định và R và Φ là các ables biến ngẫu nhiên
không tương quan và với Φ phân bố đồng đều trên khoảng (0,1).
(a) Chứng tỏ rằng E (Yt ) = 0 với mọi t.
1
(b) Chứng tỏ rằng quá trình là đứng yên với γk --E cos
= () R2 () 2πf k .
2

Gợi ý: Sử dụng các phép tính dẫn đến Công thức (2.3.4), ở trang 19.
Machine Translated by Google

24 Các khái niệm cơ bản

2.29 (Sóng cosin ngẫu nhiên mở rộng thêm) Giả sử rằng


m
= f hoặc t = 012…, ±, ±,
Yt Rj cos
2π f[ ( j t +Φj ) ]
j 1 =

trong đó 0 < f1 < f2 <… < fm <½ là m tần số cố định và R1, Φ1, R2, Φ2,…,

Rm, Φm là các biến ngẫu nhiên không tương quan với mỗi Φj được phân phối đồng đều trên
khoảng (0,1).

(a) Chứng tỏ rằng E (Yt ) = 0 với mọi t.


1 m
(b) Chứng tỏ rằng quá trình là đứng yên với γk (
2 ()cos
2πf ) k .
= - E Rj
2 j
Gợi ý: Làm bài tập 2.28 trước. j 1 =
2.30 (Yêu cầu thống kê toán học) Giả sử rằng

Yt = Rcos [2π ( ft + Φ)] cho t = 012…, ±, ±,

trong đó R và Φ là các biến ngẫu nhiên độc lập và f là tần số cố định. Các
pha Φ được giả thiết là phân bố đều trên (0,1) và biên độ R có
=
> r2
một phân phối Rayleigh với pdf f r () cho r lại 0. -Chỉ
⁄ 2
ra rằng cho mỗi
thời điểm t, Yt có phân phối chuẩn. (Gợi ý: Cho YR = cos [2π ( ft + Φ ) ] và
X = Rsin [2π ( ft + Φ )] . Bây giờ hãy tìm phân phối chung của X và Y. Nó cũng có thể là
cho thấy rằng tất cả các phân phối chiều hữu hạn là chuẩn đa biến và

do đó quá trình này hoàn toàn tĩnh.)

Phụ lục A: Kỳ vọng, Phương sai, Phương sai,


và Tương quan

Trong phụ lục này, chúng tôi xác định kỳ vọng cho các biến ngẫu nhiên liên tục. Tuy nhiên, tất cả
của các thuộc tính được mô tả giữ cho tất cả các loại biến ngẫu nhiên, rời rạc, liên tục,
hay nói cách khác. Cho X có hàm mật độ xác suất f (x) và cho cặp (X, Y) có
hàm mật độ xác suất khớp f (x, y). ∞
Giá trị kỳ vọng của X được xác định là E X () xf x () xd .
=
–∞

(Nếu xf x () xd∞;<nếu không thì E (X) là không xác định.) E (X) còn được gọi là kỳ vọng
–∞
của X hoặc giá trị trung bình của X và thường được ký hiệu là μ hoặc μX.

Thuộc tính của kỳ vọng



Nếu h (x) là một hàm sao cho h x () f x () xd ∞ < , nó có thể được hiển thị rằng
–∞


EhX [()] = h x ( ) f x () xd
–∞
∞ ∞
Tương tự, nếu h xy (,) fxy, () dy xd ∞ < , nó có thể được hiển thị rằng
–∞ –∞
Machine Translated by Google

Phụ lục A: Kỳ vọng, Phương sai, Phương sai và Tương quan 25

∞ ∞
EhXY ([),] = hxy (), fxy(), dy xd (2.A.1)
–∞ –∞
Theo hệ quả của Công thức (2.A.1), chúng ta dễ dàng thu được kết quả quan trọng

E (aX bY+ c= )aE+ X () + + bE Y () c (2.A.2)

Chúng tôi cũng có

∞ ∞
E XY () = xyf xy(), dy xd (2.A.3)
–∞ –∞
Phương sai của một biến ngẫu nhiên X được định nghĩa là

EX [- ()] 2(với
= { điều
Vartồn
Xkiện
()
tạiEXE } (2.A.4)

(X2) ). Phương sai của X thường được ký hiệu là σ2 hoặc σX2 .

Thuộc tính của phương sai

Var X () ≥ 0 (2.A.5)

Var a bX
+ () b2 = Var X () (2.A.6)

Nếu X và Y độc lập thì

Var XY () + Var X () + = Var Y () (2.A.7)

Nói chung, có thể cho thấy rằng

Var X () -E =X2 () [] E X ()2 (2.A.8)

Căn bậc hai dương của phương sai của X được gọi là độ lệch chuẩn của X và
thường được ký hiệu là σ hoặc σX. Biến ngẫu nhiên (X - μX) / σX được gọi là phiên
bản chuẩn hóa của X. Giá trị trung bình và độ lệch chuẩn của một biến chuẩn là
luôn luôn bằng không và một, tương ứng.
Hiệp phương sai của X và Y được xác định là Cov ,XY () =[ EX μX
- ()
() - Y μY ].

Thuộc tính của hiệp phương sai

+ (
Cov a bX , ) c dY + = bdCov XY (), (2.A.9)

Var XY (
) + = Var X () + + Var Y () 2Cov XY (), (2.A.10)

Cov XY (+ , Z )= Cov XZ (), + Cov YZ (), (2.A.11)

Cov XX (), = Var X () (2.A.12)

Cov XY (), = Cov YX (), (2.A.13)

Nếu X và Y độc lập,

Cov XY (), 0 = (2.A.14)


Machine Translated by Google

26 Các khái niệm cơ bản

Hệ số tương quan của X và Y, ký hiệu là Corr (X, Y) hoặc ρ, được định nghĩa là

= Cov XY (),
ρ Corr XY (), = ----------------------------------------

Var X ( ) Var Y ()

Ngoài ra, nếu X * là X chuẩn hóa và Y * là Y chuẩn hóa, thì ρ = E (X * Y *).

Thuộc tính của tương quan

1– ≤ Corr XY (), ≤ 1 (2.A.15)

+ ( , c dY +) = dấu bd ( ) Corr XY ,()


Corr a bX

1 nếu bd > 0
(2.A.16)
nơi ký bd () = 0 nếu bd 0 =

- nếu 1 bd
<0

Corr (X, Y) =± nếu


1 và chỉ khi có các hằng số a và b sao cho Pr (Y = a + bX) = 1.
Machine Translated by Google

CHƯƠNG 3
XU HƯỚNG

Trong một chuỗi thời gian chung, hàm trung bình là một hàm hoàn toàn tùy ý của thời gian. Trong

chuỗi thời gian tĩnh, hàm trung bình phải không đổi theo thời gian. Thông thường, chúng ta cần lấy

điểm trung bình và xem xét các hàm trung bình là các hàm tương đối đơn giản (nhưng không phải là

hằng số) của thời gian. Những xu hướng này được xem xét trong chương này.

3.1 Xu hướng xác định so với ngẫu nhiên

"Xu hướng" có thể khá khó nắm bắt. Các nhà phân tích khác nhau có thể nhìn nhận cùng một chuỗi thời

gian hoàn toàn khác nhau. Bước đi ngẫu nhiên được mô phỏng trong Hình 2.1 có thể được coi là hiển

thị một xu hướng tăng chung. Tuy nhiên, chúng ta biết rằng thuế đi bộ ngẫu nhiên không có giá trị

trung bình cho mọi thời đại. Xu hướng được nhận thức chỉ là sự tạo tác của mối tương quan thuận

chặt chẽ giữa các giá trị chuỗi tại các thời điểm gần nhau và phương sai ngày càng tăng trong quá

trình khi thời gian trôi qua. Mô phỏng thứ hai và thứ ba của chính xác cùng một quy trình có thể

cho thấy những “xu hướng” hoàn toàn khác nhau. Chúng tôi yêu cầu bạn tạo một số mô phỏng bổ sung
trong các bài tập. Một số tác giả đã mô tả các xu hướng như vậy là xu hướng ngẫu nhiên (xem Box,

Jenkins và Reinsel, 1994), mặc dù không có định nghĩa được đồng minh địa lý chấp nhận về xu hướng

ngẫu nhiên.

Chuỗi nhiệt độ trung bình hàng tháng được vẽ trong Hình 1.7 trên trang 6, cho thấy xu hướng

theo chu kỳ hoặc theo mùa, nhưng ở đây lý do cho xu hướng này là rõ ràng - độ nghiêng thay đổi của

Bắc bán cầu đối với mặt trời. Trong trường hợp này, một mô hình khả thi có thể là Yt = μt + Xt ,

trong đó μt là một hàm xác định tuần hoàn với chu kỳ 12; đó là μt , nên thỏa mãn

=
μt μt - 12 cho tất cả t

Chúng ta có thể giả định rằng Xt , biến thiên không quan sát được xung quanh μt , không có giá trị

trung bình với mọi t để thực sự μt là hàm trung bình của chuỗi quan sát Yt . Chúng ta có thể mô tả
mô hình này là có một xu hướng xác định trái ngược với xu hướng ngẫu nhiên đã được xem xét trước

đó. Trong các tình huống khác, chúng ta có thể đưa ra giả thuyết về một xu hướng xác định là tuyến

tính theo thời gian (nghĩa là, μt = β0 + β1t) hoặc có thể là xu hướng thời gian bậc hai, μt = β0 +

β1t + β2t 2. Lưu ý rằng hàm ý của mô hình Yt = μt + Xt với E (Xt ) = 0 với mọi t là xu hướng đẳng

tích xác định μt áp dụng cho mọi thời điểm. Do đó, nếu μt = β0 + β1t, chúng ta đang giả định rằng
cùng một xu hướng thời gian tuyến tính áp dụng mãi mãi. Do đó, chúng ta nên có những lý do chính

đáng để giả định một mô hình như vậy — không chỉ vì chuỗi có vẻ hơi tuyến tính trong khoảng thời
gian được quan sát.

27
Machine Translated by Google

28 Xu hướng

Trong chương này, chúng tôi xem xét các phương pháp để mô hình hóa các xu hướng xác định. Stochastic

các xu hướng sẽ được thảo luận trong Chương 5 và các mô hình theo mùa ngẫu nhiên sẽ được thảo luận

trong Chương 10. Nhiều tác giả sử dụng từ xu hướng chỉ cho một hàm trung bình thay đổi chậm,
chẳng hạn như xu hướng thời gian tuyến tính và sử dụng thuật ngữ thành phần theo mùa cho một
hàm trung bình thay đổi theo chu kỳ. Chúng tôi không thấy hữu ích khi phân biệt như vậy ở đây.

3.2 Ước tính giá trị trung bình không đổi

Đầu tiên chúng ta xem xét tình huống đơn giản trong đó một hàm trung bình không đổi được giả định. Của chúng tôi

mô hình sau đó có thể được viết là

Yt μ Xt + = (3.2.1)

trong đó E (Xt ) = 0 với mọi t. Chúng tôi muốn ước tính μ với chuỗi thời gian quan sát của chúng tôi Y1, Y2,…,

Yn. Ước tính phổ biến nhất của μ là giá trị trung bình hoặc giá trị trung bình của mẫu được xác định là

_ 1 - N
Y (3.2.2)
= N Yt
t 1 =

Theo
_
Y E () = μ;
giả thiết tối giản của phương trình (3.2.1), chúng ta thấy rằng
trướcYđó có một ước lượng không chệch của μ. Để điều tra độ chính xác
Y của ước tính
μ, chúng ta cần đưa ra các giả thiết khác liên quan đến Xt .
Giả sử rằng {Yt }, (hoặc tương đương, {Xt } của phương trình (3.2.1)) là thời gian đứng yên
chuỗi với hàm tự tương quan ρk. Sau đó, theo Bài tập 2.17, chúng ta có

n 1– k
γ0 1 - -----
=
----
Var Y_ () ρk N
N kn - 1 + =

(3.2.3)
n 1–
k
= γ0
---- 12 1 --–
N + N Ρ ρk
k 1 =

Lưu ý rằng yếu tố đầu tiên, γ0 / n, là phương sai của quá trình (tổng thể) chia cho kích thước
sam sung — một khái niệm mà chúng ta đã quen thuộc trong bối cảnh lấy mẫu ngẫu nhiên đơn giản hơn. Nếu

chuỗi {Xt } của phương trình (3.2.1) chỉ là nhiễu trắng, sau đó ρk = 0 với k > 0 và giảm Var Y ()

xuống đơn giản là γ0 / n.

Trong mô hình trung bình động (đứng yên) Yt = et - ½et - 1, chúng ta thấy rằng ρ1 = 0,4
và ρk = 0 với k > 1. Trong trường hợp này, chúng ta có

γ0
----
1
Var Y_ ()
() 1–0,4
21 + = --–
N N

γ0 n 1–
- = ---- 1 0,8 -----------

N N

Đối với các giá trị của n thường xảy ra trong chuỗi thời gian (chẳng hạn như n > 50), hệ số (n - 1) / n

sẽ gần bằng 1, do đó chúng tôi có


Machine Translated by Google

3.2 Ước tính giá trị trung bình không đổi 29

Var Y_ ()≈ 0,2γ0


----
N

Chúng tôi thấy rằng mối tương quan âm ở độ trễ 1 đã cải thiện ước lượng giá trị
trung bình so với ước lượng thu được trong tình huống nhiễu trắng (mẫu ngẫu nhiên).
Bởi vì chuỗi có xu hướng dao động qua lại trên giá trị trung bình, giá trị trung bình
mẫu thu được chính xác hơn.
Mặt khác, nếu ρk ≥ 0 với mọi k ≥ 1, ta thấy từ Công thức (3.2.3) rằng Var Y () sẽ
lớn hơn γ0 / n. Ở đây, các tương quan thuận làm cho việc ước lượng giá trị trung bình
khó hơn so với trường hợp nhiễu trắng. Nói chung, một số tương quan sẽ là tích cực và
một số tiêu cực, và Công thức (3.2.3) phải được sử dụng để đánh giá tác động tổng thể.
Đối với nhiều quá trình tĩnh, chức năng tự tương quan suy giảm đủ nhanh với
độ trễ ngày càng tăng

∞ ρk
< (3.2.4)
k 0 =

(Sóng cosine ngẫu nhiên của Chương 2 là một ngoại lệ.)


Theo giả định (3.2.4) và với kích thước mẫu lớn n, giá trị xấp xỉ hữu ích sau
đây được lấy từ Công thức (3.2.3) (Ví dụ, xem Anderson, 1971, trang 459)


γ0
----
Var Y_ () ≈ ρk cho n lớn (3.2.5)
N k - = ∞

Lưu ý rằng với giá trị gần đúng này, phương sai tỷ lệ nghịch với cỡ mẫu n.

Ví dụ, giả sử rằng ρk = φ | k | với mọi k, trong đó φ là một số chính xác từ 1


đến +1. Tính tổng một chuỗi hình học cho kết quả

( 1 + φ) γ0
≈ ---------------- ----
Var Y_ () (3.2.6)
(1 - φ) N

Đối với quá trình không tĩnh (nhưng với giá trị trung bình không đổi), độ chụm của giá trị trung

bình của mẫu như một ước lượng của μ có thể khác nhau một cách rõ rệt. Như một ví dụ hữu ích, giả sử

rằng trong Phương trình (3.2.1) {Xt } là một quá trình đi bộ ngẫu nhiên như được mô tả trong Chương 2.

Sau đó, trực tiếp từ Phương trình (2.2.8) chúng ta có

N
1
= ----- Yi
Var Y_ ()
Var n2 tôi 1 =

N
1
tôi

= -----
ej
Var n2 i 1 = j 1 =
Machine Translated by Google

30 Xu hướng

1
= + + ++
(----- Var e1 2e2 3e3 … nen ) n2

2 N
σe k2
------
=
n2 k 1 =

để có thể

= () n 1+
----------------

Var Y_ () σe 2 () 2n 1+ (3.2.7)
6n

Lưu ý rằng trong trường hợp đặc biệt này, phương sai của ước tính của chúng tôi về giá trị trung bình thực sự

tăng khi kích thước mẫu n tăng. Rõ ràng đây là điều không thể chấp nhận được và chúng ta cần
xem xét các kỹ thuật ước lượng khác cho chuỗi không tĩnh.

3.3 Phương pháp hồi quy

Phương pháp thống kê cổ điển của phân tích hồi quy có thể dễ dàng được sử dụng để ước tính
các tham số của các mô hình xu hướng trung bình không tương đối phổ biến. Chúng tôi sẽ xem xét nhiều nhất

những thứ hữu ích: tuyến tính, bậc hai, phương tiện theo mùa và xu hướng cosin.

Xu hướng tuyến tính và bậc hai theo thời gian

Xem xét xu hướng thời gian xác định được biểu thị bằng

μt β0 β1 + = t (3.3.1)

trong đó độ dốc và điểm chặn, tương ứng là β1 và β0 , là các tham số chưa biết. Các
Phương pháp bình phương nhỏ nhất cổ điển (hoặc hồi quy) là chọn làm ước lượng của β1 và β0
val ues tối thiểu hóa
N
2
Q ( , )
β0 β1 Yt -β0( β1 t) []
+
=
t 1 =

Giải pháp có thể đạt được theo một số cách, ví dụ, bằng cách tính toán một phần
dẫn xuất đối với cả hai β, đặt kết quả bằng 0 và giải ^ ^
β 0 và β 1 , chúng
kết quả là phương trình tuyến tính của β. Biểu thị các giải pháp bằng tôi thấy rằng

N
_
( Yt )Y - t()t_-
^ t 1 =
β1 = ---------------------------------------------
N
2
t t_ (3.3.2)
() -
t 1 =

^ _ ^ _
β0 - =Y β 1t

_
trong đó t
= (n + 1) / 2 là giá trị trung bình của 1, 2,…, n. Những công thức này có thể được đơn giản hóa một số

điều, và các phiên bản khác nhau của công thức đều được nhiều người biết đến. Tuy nhiên, chúng tôi giả định rằng
Machine Translated by Google

3.3 Phương pháp hồi quy 31

các tính toán sẽ ^được thực^ hiện bằng phần mềm thống kê và chúng tôi sẽ không theo đuổi các
biểu thức cho và βở0 1đây. β

Thí dụ

Hãy xem xét quá trình đi bộ ngẫu nhiên được trình bày trong Phụ lục 2.1. Giả sử chúng ta
(nhầm lẫn) coi đây là xu hướng thời gian tuyến tính và ước tính độ dốc và mức chặn bằng
hồi quy bình phương tối thiểu. Sử dụng phần mềm thống kê, chúng tôi thu được Phụ lục 3.1.

Hình 3.1 Ước tính hồi quy bình phương nhỏ nhất cho xu hướng thời gian tuyến tính

Ước tính Std. Lỗi giá trị t Pr (> | t |)

Đánh chặn 1,008 0,2972 3,39 0,00126

Thời gian 0,1341 0,00848 15,82 <0,0001

> dữ liệu (rwalk)


> model1 = lm (rwalk ~ thời gian (rwalk))

> tóm tắt (model1)

^ ^
Vì vậy, ở đây độ dốc và hệ số chặn ước tính là β=1 0,1341 và = β
1,008, tương ứng 0
cẩn thận. Hình 3.2 hiển thị bước đi ngẫu nhiên với đường xu hướng hồi quy bình phương nhỏ nhất
chồng lên nhau. Chúng tôi sẽ giải thích thêm về kết quả hồi quy sau trong Phần 3.5 về
trang 40 và thấy rằng việc điều chỉnh một dòng cho những dữ liệu này là không phù hợp.

Hình 3.2 Bước đi ngẫu nhiên với xu hướng thời gian tuyến tính



số
8

• •

• •
6 • • •
• •
• • •

• •

•• • •

4
•• •
• •


y • • •

• ••
• • •


•• •
• ••
2
• •

0 • •• • • ••
• •
• •


2 •
0 10 20 30 40 50 60

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> plot (rwalk, type = 'o', ylab = 'y')
> abline (model1) # thêm dòng hình vuông nhỏ nhất vừa vặn từ model1
Machine Translated by Google

32 Xu hướng

Xu hướng theo chu kỳ hoặc theo mùa

Bây giờ hãy xem xét lập mô hình và ước tính các xu hướng theo mùa, chẳng hạn như trung bình hàng tháng

dữ liệu nhiệt độ trong Hình 1.7. Ở đây, chúng tôi giả định rằng chuỗi được quan sát có thể được gửi
lại dưới dạng

Yt μt Xt + =

trong đó E (Xt ) = 0 với mọi t.

Giả định chung nhất cho μt với dữ liệu theo mùa hàng tháng là có 12
hằng số (tham số), β1, β2,… và β12, đưa ra nhiệt độ trung bình dự kiến cho
mỗi 12 tháng. Chúng tôi có thể viết

β1 cho t = 1, 13, 25, ...

β2 cho t = 2, 14, 26, ...


= (3.3.3)
μt .
.
.

β12 cho t = 12, 24, 36, ...

Đây đôi khi được gọi là mô hình phương tiện theo mùa .

Ví dụ về mô hình này, hãy xem xét dữ liệu nhiệt độ trung bình hàng tháng được hiển thị
trong Hình 1.7 trên trang 6. Để phù hợp với mô hình như vậy, chúng ta cần thiết lập các biến chỉ báo

(đôi khi được gọi là biến giả) cho biết tháng mà mỗi dữ liệu
điểm liên quan. Thủ tục để thực hiện điều này sẽ phụ thuộc vào thống kê cụ thể
phần mềm mà bạn sử dụng. Chúng tôi cũng cần lưu ý rằng mô hình như đã nêu không chứa
thuật ngữ chặn, và phần mềm cũng sẽ cần biết điều này. Ngoài ra, chúng ta có thể sử dụng
một điểm chặn và loại bỏ bất kỳ một trong số các dấu β trong Công thức (3.3.3).

Hình 3.3 hiển thị kết quả của việc điều chỉnh mô hình phương tiện theo mùa với dữ liệu
thời tiết. Ở đây, các giá trị t và giá trị Pr (> | t |) được báo cáo ít được quan tâm vì chúng
liên quan đến việc kiểm tra các giả thuyết rỗng mà các β bằng 0 — không phải là một giả thuyết thú vị
trong trường hợp này.

Phụ lục 3.3 Kết quả hồi quy cho mô hình phương tiện theo mùa

Ước tính Std. Lỗi giá trị t Pr (> | t |)

tháng Giêng 16,608 0,987 16,8 <0,0001

tháng 2 20.650 0,987 20,9 <0,0001

Bước đều 32.475 0,987 32,9 <0,0001

Tháng tư 46.525 0,987 47.1 <0,0001

Có thể 58.092 0,987 58,9 <0,0001

Tháng sáu 67.500 0,987 68.4 <0,0001

Tháng bảy
71.717 0,987 72,7 <0,0001
Machine Translated by Google

3.3 Phương pháp hồi quy 33

Ước tính Std. Lỗi giá trị t Pr (> | t |)

Tháng tám 69.333 0,987 70,2 <0,0001

Tháng 9 61.025 0,987 61.8 <0,0001

Tháng Mười 50,975 0,987 51,6 <0,0001

Tháng mười một 36.650 0,987 37.1 <0,0001

Tháng 12 23,642 0,987 24.0 <0,0001

> dữ liệu (tempdub)


> month. = season (tempdub) # dấu chấm được thêm vào để cải thiện hiển thị bảng
> model2 = lm (tempdub ~ month.-1) # -1 xóa cụm từ chặn> tóm tắt (model2)

Hình 3.4 cho thấy các kết quả thay đổi như thế nào khi chúng ta điều chỉnh một mô hình với một điểm chặn

kỳ hạn. Phần mềm bỏ qua hệ số tháng 1 trong trường hợp này. Bây giờ hệ số tháng 2
được hiểu là sự khác biệt giữa nhiệt độ trung bình của tháng 2 và tháng 1, hệ số
tháng 3 là sự khác biệt giữa mức trung bình của tháng 3 và tháng 1
nhiệt độ, v.v. Một lần nữa, các giá trị t và Pr (> | t |) (giá trị p) đang kiểm tra
giả thuyết ít được quan tâm trong trường hợp này. Lưu ý rằng hệ số đánh chặn cộng với
Hệ số tháng Hai ở đây bằng hệ số tháng Hai được hiển thị trong Phụ lục 3.3.

Phụ lục 3.4 Kết quả cho Mô hình Phương tiện Theo mùa có Chặn

Ước tính Std. Lỗi giá trị t Pr (> | t |)

Đánh chặn 16,608 0,987 16,83 <0,0001

tháng 2 4.042 1.396 2,90 0,00443

Bước đều 15.867 1.396 11,37 <0,0001

Tháng tư 29,917 1.396 21.43 <0,0001

Có thể 41.483 1.396 29,72 <0,0001

Tháng sáu 50.892 1.396 36,46 <0,0001

Tháng bảy
55.108 1.396 39.48 <0,0001

Tháng tám 52,725 1.396 37,78 <0,0001

Tháng 9 44.417 1.396 31,82 <0,0001

Tháng Mười 34.367 1.396 24,62 <0,0001

Tháng mười một 20.042 1.396 14,36 <0,0001

Tháng 12 7.033 1.396 5,04 <0,0001

> model3 = lm (tempdub ~ tháng.) # Tháng 1 tự động bị loại bỏ


> tóm tắt (model3)
Machine Translated by Google

34 Xu hướng

Xu hướng Cosine

Mô hình trung bình theo mùa cho dữ liệu hàng tháng bao gồm 12 thông số độc lập và
hoàn toàn không tính đến xu hướng theo mùa. Ví dụ, thực tế
rằng tháng Ba và tháng Tư có nghĩa là khá giống nhau (và khác với tháng Sáu và tháng Bảy
nghĩa là) không được phản ánh trong mô hình. Trong một số trường hợp, các xu hướng theo mùa có thể

được mô hình hóa sinh thái với các đường cong cosine kết hợp sự thay đổi suôn sẻ được mong đợi từ một

khoảng thời gian này sang khoảng thời gian tiếp theo mà vẫn bảo toàn tính thời vụ.

Xét đường cong côsin với phương trình

μt = βcos ( 2πft + Φ ) (3.3.4)

Chúng ta gọi β (> 0) là biên độ, f là tần số và Φ là pha của đường cong. Khi t thay đổi,
đường cong dao động giữa cực đại của β và cực tiểu của β. Kể từ khi đường cong
lặp lại chính xác mỗi đơn vị thời gian 1 / f, 1 / f được gọi là chu kỳ của sóng cosin. Như
được lưu ý trong Chương 2, Φ dùng để thiết lập điểm gốc tùy ý trên trục thời gian. Cho hàng tháng
dữ liệu có thời gian được lập chỉ mục là 1, 2,…, tần số quan trọng nhất là f = 1/12, vì như vậy
một sóng cosine sẽ tự lặp lại sau mỗi 12 tháng. Chúng tôi nói rằng khoảng thời gian là 12.

Phương trình (3.3.4) không thuận tiện cho việc ước lượng vì các tham số β và Φ do
không nhập biểu thức một cách tuyến tính. May mắn thay, một nhận dạng lượng giác có sẵn
reparameterizes (3.3.4) thuận tiện hơn, cụ thể là

= (3.3.5)
βcos ()β12πft
cos +()Φ 2πft β2 + sin () 2πft

ở đâu

=
2
β β12 + β2 , Φ = atan ( β2 - β1 ) ⁄ (3.3.6)

và ngược lại,

β1 = β Φ cos (), β2 = β Φ sin () (3.3.7)

Để ước tính các tham số β1 và β2 bằng kỹ thuật hồi quy, chúng ta chỉ cần sử dụng
cos (2πft) và sin (2πft) làm biến hồi quy hoặc biến dự báo.
Mô hình đơn giản nhất như vậy cho xu hướng sẽ được thể hiện dưới dạng

= + (3.3.8)
μt β0 β1 cos () 2πft β2 + sin
2πft
()

Ở đây, số hạng hằng số, β0, có thể được hiểu một cách có ý nghĩa là một cosin với tần số
số không.

Trong bất kỳ ví dụ thực tế nào, chúng ta phải cẩn thận cách chúng ta đo lường thời gian, như sự lựa chọn của chúng ta

của phép đo thời gian sẽ ảnh hưởng đến giá trị của các tần số quan tâm. Ví dụ, nếu
chúng tôi có dữ liệu hàng tháng nhưng sử dụng 1, 2, 3, ... làm thang thời gian của chúng tôi, thì 1/12 sẽ là

tần suất thú vị, với khoảng thời gian tương ứng là 12 tháng. Tuy nhiên, nếu chúng ta xác định

thời gian chắc chắn theo năm và năm phân số, giả sử 1980 cho tháng Giêng, 1980,08333 cho tháng Hai của

1980, v.v., thì tần số 1 tương ứng với ity định kỳ hàng năm hoặc 12 tháng.

Hình 3.5 là một ví dụ về việc điều chỉnh một đường cong côsin ở tần số cơ bản để
chuỗi nhiệt độ trung bình hàng tháng.
Machine Translated by Google

3.3 Phương pháp hồi quy 35

Hình 3.5 Mô hình xu hướng Cosine cho Dòng nhiệt độ

Hệ số Ước tính Std. Lỗi giá trị t Pr (> | t |)

Đánh chặn 46.2660 0,3088 149,82 <0,0001

cos (2πt) 26,7079 0,4367 61,15 <0,0001

sin (2πt) 2.1697 0,4367 4,97 <0,0001

> har. = harmonic (tempdub, 1)> model4


= lm (tempdub ~ har.)> tóm tắt (model4)

Trong kết quả đầu ra này, thời gian được đo bằng năm, với năm 1964 là giá trị bắt đầu
và khoảng thời gian tự do là 1 mỗi năm. Biểu đồ của các giá trị chuỗi thời gian cùng với
đường cong côsin vừa vặn được thể hiện trong Hình 3.6. Xu hướng phù hợp với dữ liệu khá tốt,
ngoại trừ hầu hết các giá trị của tháng 1, nơi các quan sát thấp hơn so với mô hình trước
khi ra lệnh.

Hình 3.6 Xu hướng Cosine cho Dòng nhiệt độ

• • ••
• •

• •
••
• • •
•• •
• • •

•• • • •
• • • • • • •

•• •• • • •
•• •

••
• • •• •

• • • • •• ••
• •

• • • ••
Nhiệt
độ


••• ••••• ••• •• ••
• •
• •• • • • •• •
• •

• • • • • • •
• • • • • • •
• •
• • •• • • •
70
60
50
40
30
20
10

••
• • • • •
•• • • • •• ••


• • • •
• •

• •


Năm 1964 Năm 1966 Năm 1968 1970 Năm 1972 1974 Năm 1976

Thời gian

> win.graph (width = 4.875, height = 2.5, pointsize = 8)> plot (ts (fit
(model4), freq = 12, start = c (1964,1)),
ylab = 'Nhiệt độ', type = 'l',
> ylim = range (c (fit (model4), tempdub))); điểm (tempdub)> # ylim đảm bảo rằng phạm
vi trục y phù hợp với dữ liệu thô và các giá trị phù hợp

Các hàm cosin bổ sung ở các tần số khác sẽ thường xuyên được sử dụng để lập mô hình
các xu hướng theo chu kỳ. Đối với chuỗi hàng tháng, tần số sóng hài cao hơn, chẳng hạn
như 2/12 và 3/12, đặc biệt thích hợp và đôi khi sẽ cải thiện sự phù hợp với chi phí bổ sung
Machine Translated by Google

36 Xu hướng

nhập thêm thông số vào mô hình. Trên thực tế, có thể chỉ ra rằng bất kỳ xu hướng định kỳ nào với
chu kỳ 12 có thể được biểu thị chính xác bằng tổng của sáu cặp hàm cosin-sin.
Những ý tưởng này được thảo luận chi tiết trong phân tích Fourier hoặc phân tích quang phổ. Chúng tôi theo đuổi

những ý tưởng này sẽ được bổ sung thêm trong Chương 13 và 14.

3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy

Chúng tôi giả định rằng chuỗi được biểu diễn dưới dạng Yt = μt + Xt , trong đó μt là xu hướng xác định

thuộc loại được xem xét ở trên và {Xt } là một quá trình dừng có giá trị trung bình bằng 0
với các hàm tự tương quan và tự tương quan γk và ρk, tương ứng. Các ước tính hồi quy thông
thường kết hợp các tham số trong một mô hình tuyến tính theo tiêu chí bình phương nhỏ nhất bất kể
về việc liệu chúng ta có đang phù hợp với xu hướng thời gian tuyến tính, phương tiện theo mùa, đường cong cosin hay bất cứ thứ gì.

Trước tiên, chúng tôi xem xét trường hợp dễ dàng nhất — phương tiện theo mùa. Như đã đề cập trước đó,

ước tính bình phương nhỏ nhất của các phương tiện theo mùa chỉ là giá trị trung bình theo mùa; do đó, nếu chúng ta có

N (đầy đủ) năm dữ liệu hàng tháng, chúng tôi có thể viết ước tính cho giá trị trung bình của ngày thứ j
mùa như

^ 1
N 1–

βj =
---
Yj + 12i
N tôi 0 =
^
Từ β là một lượt thích trungYbình nhưng chỉ
^ sử dụng mỗi lần quan sát thứ 12, Phương trình
(3.2.3) có thểj dễ
Vardàng
β sửa đổi để cung cấp. Chúng ta thay n bằng N (năm) và ρk bằng
j ()
ρ12k để có được

^ γ0
N 1–
k
Var jβ () = ---- +12 1
---–
cho j = 1, 2, ..., 12 (3.4.1)
N k 1 = N
ρ12k

^
Chúng tôi nhận thấy rằng nếu {Xt } là nhiễu trắng, thìVar jβ ()xuống γ0 / N, như mong đợi.
sẽ giảm ^ Lông Var β
thermore, nếu một số ρk khác không nhưng ρ12k = 0, thì chúng ta vẫn có bất kỳ .
j () γ0 = ⁄ N
Trong

trường hợp nào, chỉ có tự tương quan theo mùa, ρ12, ρ24, ρ36 , ..., nhập vào Công thức

(3.4.1). Vì N hiếm khi rất lớn (có lẽ ngoại trừ dữ liệu hàng quý), các giá trị gần
đúng như thể hiện trong Công thức (3.2.5) thường sẽ không hữu ích.
Bây giờ chúng ta chuyển sang các xu hướng cosine được biểu diễn trong Công thức (3.3.8).

Đối với bất kỳ chu kỳ tự do nào có dạng f^ = m / n,


^ trong đó m là số nguyên thỏa mãn 1 ≤ m < n /
2, các sions tường minh có sẵn cho các ước β 2 ,biên
β 1lượng và độ của cosin và sin:

^ 2
N ^ 2
N
- cos 2πmt - tội 2πmt
β1 = Yt
, β2 = Yt
(3.4.2)
Nt 1 = N
------------ Nt 1 =
N
------------

(Đây thực sự là các mối tương quan giữa chuỗi thời gian {Yt } và cosin và
sóng sin với tần số m / n.)
Bởi vì đây là các hàm tuyến tính của {Yt }, chúng tôi có thể đánh giá phương sai của chúng bằng cách sử dụng

Phương trình (2.2.6). Chúng ta tìm thấy


Machine Translated by Google

3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy 37

^ N s 1–
2πmt
2γ0 4
Var β
1 ()
= -------- 1 - + cos cos 2πms Ρ
(3.4.3)
ρs t -
N N N
------------ N
-------------
s 2 = t 1 =

N
nơi chúng tôi đã sử dụng thực tế rằng [cos (]) =2πmt
n ⁄ 2n⁄ 2 . Tuy nhiên, đôi
t 1 =

Nói chung, tổng trong Công thức (3.4.3) không giảm thêm. Một biểu thức tương tự giữ
^
2 () nếu chúng ta thay thế các cosin bằng các sin.
cho Var β

Nếu {Xt } là nhiễu trắng, chúng ta chỉ nhận được 2γ0 / n. Nếu ρ1 0, ρk = 0 với k > 1 và m / n = 1/12,
sau đó phương sai giảm xuống

^ 2γ0
n 1–
πt
= 4ρ1 πt 1+
Var β
1 () -------- 1 -------- + coscos (3.4.4)
N N ---- 6 --------------
6
t 1 =

Để minh họa ảnh hưởng của các số hạng cosin, chúng tôi đã tính toán một số giá trị đại diện
ues:
^
N Var (β 1)

2γ0
25 +
(1 1.71ρ1 )
N
--------

2γ0
50 +
(1 1,75ρ1 )
N
--------

2γ0
500 +
() 1--------
1.73ρ1
N

2γ0 π 2γ0
= +

N
--------
1+2ρ1
cos
- 6 N
(1 1.732ρ1
-------- ) (3.4.5)

Nếu ρ1 = 0,4, thì hệ số nhân mẫu lớn trong Công thức (3.4.5) là 1 + 1.732 ( 0.4) =
0,307 và phương sai giảm khoảng 70% khi so sánh với tiếng ồn trắng
trường hợp.

Trong một số trường hợp, các phương tiện theo mùa và xu hướng cosin có thể được coi là

các mô hình cạnh tranh cho một xu hướng theo chu kỳ. Nếu mô hình cosine đơn giản là một mô hình đầy đủ,

chúng ta mất bao nhiêu nếu chúng ta sử dụng mô hình phương tiện theo mùa ít phức tạp hơn? Đến
tiếp cận vấn đề này, trước tiên chúng ta phải xem xét cách so sánh các mô hình. Bản
thân các tham số không thể so sánh trực tiếp, nhưng chúng ta có thể so sánh các ước tính của
xu hướng tại các thời điểm có thể so sánh được.

Hãy xem xét hai ước tính cho xu hướng trong tháng Giêng; nghĩa là, μ1. Với theo mùa
có nghĩa là, ước tính này chỉ là giá trị trung bình của tháng 1, có phương sai được đưa ra bởi Phương trình

(3.4.1). Với mô hình xu hướng cosine, ước tính tương ứng là


Machine Translated by Google

38 Xu hướng

^ ^ ^
= +β 0 2π + tội 2π
μ ^ β 1 cos β lỗi 2
1 ------12 ------12

Để tính toán
^ phương
^ sai ^của ước tính này, chúng ta cần một dữ kiện nữa: Với mô hình này,
ước tính
0 , β 1 , và không
β 2 tương quan. † Điều này xuất phát từ quan hệ trực giao β

các hạt của cosin và sin liên quan. Xem Bloomfield (1976) hoặc Fuller (1996) cho
chi tiết hơn. Đối với mô hình cosine, sau đó, chúng ta có

^ ^ 2 ^ 2
= + cos 2π + Var β2 () tội 2π
Var μ()^ 1Var β 0 () Var β 1 () (3.4.6)
------12 ------12

Đối với so sánh đầu tiên của chúng tôi, giả sử rằng thành phần ngẫu nhiên là nhiễu trắng. sau đó

phương sai của ước tính của chúng tôi trong mô hình trung bình theo mùa chỉ là γ0 / N. Đối với cosine
, chúng tôi sử dụng Phương trình (3.4.6) và Phương trình (3.4.4) và tương đương sin của nó, để thu được

γ0 π 2 π 2
= ----
cos 2 +
Var μ()^ 1 1 +2 tội lỗi
N - 6 - 6

γ0
= ----
3
N

2 )(kể
cosθ
từ + ( ) sinθ 2 1 = . Do đó, tỷ lệ của độ lệch chuẩn trong cosin
mô hình đó trong mô hình phương tiện theo mùa là

3γ0 ⁄ n 3N
--------------- ------ =
N
γ0 ⁄ N

Đặc biệt, đối với chuỗi nhiệt độ tháng, ta có n = 144 và N = 12; do đó,
tỷ lệ là

3 12 ()
-------------
0,5 =
144

Do đó, trong mô hình cosine, chúng tôi ước tính hiệu ứng tháng Giêng với độ lệch chuẩn
chỉ lớn bằng một nửa so với nếu chúng tôi ước tính với mô hình phương tiện theo mùa — một mức lợi

nhuận nhỏ đáng kể. (Tất nhiên, điều này giả định rằng xu hướng cosine cộng với mô hình nhiễu trắng là
đúng mô hình.)

Giả sử bây giờ thành phần ngẫu nhiên sao cho ρ1 0 nhưng ρk = 0 với k > 1.
Với mô hình phương tiện theo mùa, phương sai của hiệu ứng ước tính trong tháng 1 sẽ là
không thay đổi (xem Công thức (3.4.1) trên trang 36). Đối với mô hình xu hướng cosine, nếu chúng ta có

cỡ mẫu ^lớn hợp lý, chúng tôi có thể sử dụng Công thức (3.4.5),
^ một biểu thức giống hệt nhau cho
( Var β) 2, và Công thức (3.2.3) trên trang 28 cho Var β() để có được
0

† Điều này giả định rằng 1/12 là “tần số Fourier”; nghĩa là, nó có dạng m / n. Nếu không thì,
những ước tính này chỉ gần như không tương quan.
Machine Translated by Google

3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy 39

γ0 2π
= + + + cos
Var μ()^ 1 ---- 1 2ρ1 21 2ρ1 ------
N 12

γ0 π
= ++ cos -
---- 3 2ρ1 1 2
N 6

Nếu ρ1 = 0,4, thì chúng ta có 0,814γ0 / n, và tỷ lệ của độ lệch chuẩn trong cosin
trường hợp độ lệch chuẩn trong trường hợp phương tiện theo mùa là

0,814γ0 () ⁄ n
------------------------------
0,814N
= -----------------

γ0 ⁄ N N

Nếu ta lấy n = 144 và N = 12 thì tỉ số là

0,814 12 () 0,26 =
------------------------

144

thực sự là một mức giảm rất đáng kể!

^ thời gian tuyến tính. Đối với những xu hướng này, một công thức thay thế cho Equa
Bây giờ chúng ta chuyển sang xu hướng

β 1
tion (3.3.2) trên trang 30 để thuận tiện hơn. Nó có thể được chỉ ra rằng các hình vuông nhỏ nhất
ước tính độ dốc có thể được viết
N

(t ) -
t_
Yt
^ t 1 =
β1 = ------------------------------
N (3.4.7)
2
t -
() t_
t 1 =

Vì ước tính là sự kết hợp tuyến tính của các giá trị Y, một số tiến bộ có thể đạt được trong
đánh giá phương sai của nó. Chúng ta có

^ N s 1–
12γ0 24
Var β1 () = ----------------------
t t_ (3.4.8)
----------------------
1
t_ (()) ρ- -s st -
+ n n2 () 1– n n2 () 1– s 2 = t 1 =

N
2
nơi chúng tôi đã sử - t 1(t=t_ ) = n (n2 - 1) / 12. Một lần nữa tổng kép không có trong gen
dụng giảm eral.

Để minh họa ảnh hưởng của Công thức (3.4.8), hãy xem xét lại trường hợp ρ1 0 nhưng
ρk = 0 với k > 1. Sau đó, sau một số thao tác đại số, lại liên quan đến tổng của
các số nguyên liên tiếp và bình phương của chúng, Phương trình (3.4.8) có thể được rút gọn thành

^
12γ0
Var β1 () = + 3
---------------------- 1 2ρ1 1
--– n n2 () 1–
N

Đối với n lớn, chúng ta có thể bỏ qua thuật ngữ 3 / n và sử dụng

^
12γ0 1 2ρ1
+ ()
Var β1 () = ----------------------------------
(3.4.9)
n n2 () 1–
Machine Translated by Google

40 Xu hướng

^
Nếu ρ1 = 0,4, thì 1 + 2ρ1 = 0,2, và khi đó phương sai của chỉ bằng 20%
β 1 nếu {Xt } là nhiễu trắng.

Tất nhiên, nếu ρ1 > 0, thì phương sai sẽ lớn hơn so với trường hợp nhiễu trắng.

Bây giờ chúng ta chuyển sang so sánh các ước lượng bình phương nhỏ nhất với cái gọi là ước

lượng không chệch tuyến tính tốt nhất (BLUE) hoặc ước lượng bình phương nhỏ nhất tổng quát (GLS).

Nếu thành phần ngẫu nhiên {Xt } không phải là nhiễu trắng, thì có thể thực hiện ước tính các tham
số chưa biết trong hàm xu hướng; chúng là các hàm tuyến tính của dữ liệu, không thiên vị và có

phương sai nhỏ nhất trong số tất cả các ước tính như vậy — cái gọi là ước tính BLUE hoặc GLS. Các

ước lượng này và phương sai của chúng có thể được biểu thị khá rõ ràng bằng cách sử dụng các ma

trận nhất định và các phép nghịch đảo của chúng. (Chi tiết có thể được tìm thấy trong Draper và

Smith (1981).) Tuy nhiên, việc xây dựng các ước lượng này đòi hỏi kiến thức đầy đủ về hàm hiệp

phương sai của thành phần ngẫu nhiên, một hàm chưa được biết đến trong hầu hết các ứng dụng thực

tế. Có thể ước lượng lặp đi lặp lại hàm hiệp phương sai cho {Xt } dựa trên ước tính sơ bộ về xu
hướng. Sau đó, xu hướng được ước tính lại bằng cách sử dụng hàm hiệp phương sai ước tính cho {Xt }

và do đó được lặp lại thành MÀU XANH gần đúng cho xu hướng. Tuy nhiên, phương pháp này sẽ không
được theo đuổi ở đây.

May mắn thay, có một số kết quả dựa trên kích thước mẫu lớn hỗ trợ việc sử dụng các ước tính

bình phương nhỏ nhất đơn giản hơn cho các loại xu hướng mà chúng tôi đã xem xét. Cụ thể, chúng tôi

có kết quả sau (xem Fuller (1996), trang 476–480, để biết thêm chi tiết): Chúng tôi giả định rằng

xu hướng là một đa thức theo thời gian, một đa thức lượng giác, trung bình theo mùa hoặc một kết

hợp tuyến tính trong số này. Sau đó, đối với thành phần ngẫu nhiên tĩnh tổng quát {Xt }, các ước

tính bình phương nhỏ nhất cho xu hướng có cùng phương sai với các ước tính không chệch tuyến tính
tốt nhất cho các cỡ mẫu lớn.

Mặc dù các ước tính bình phương nhỏ nhất đơn giản có thể hiệu quả về mặt tiệm cận, nó không

tuân theo rằng độ lệch chuẩn ước tính của các hệ số được in ra bởi tất cả các quy trình hồi quy là

đúng. Chúng tôi sẽ trình bày rõ hơn về điểm này trong phần tiếp theo. Chúng tôi cũng cảnh báo người
đọc rằng kết quả ở trên bị hạn chế đối với một số loại xu hướng nhất định và nói chung không thể

mở rộng thành hồi quy trên các biến dự đoán tùy ý, chẳng hạn như các chuỗi thời gian khác. Ví dụ,

Fuller (1996, trang 518–522) chỉ ra rằng nếu Yt = βZt + Xt , trong đó {Xt } có cấu trúc ngẫu nhiên

đơn giản nhưng {Zt } cũng là một chuỗi tĩnh, thì ước lượng bình phương nhỏ nhất của β có thể là
rất kém hiệu quả và sai lệch ngay cả đối với các mẫu lớn.

3.5 Thông dịch đầu ra hồi quy

Chúng tôi đã lưu ý rằng các quy trình hồi quy tiêu chuẩn tính toán các ước tính bình phương nhỏ

nhất của các hệ số hồi quy chưa biết — betas. Do đó, các ước tính có thể được lập lại theo các

giả định tối thiểu về thành phần ngẫu nhiên {Xt }. Tuy nhiên, một số thuộc tính của đầu ra hồi quy
phụ thuộc nhiều vào giả định hồi quy thông thường rằng {Xt } là nhiễu trắng và một số phụ thuộc

vào giả định khác rằng {Xt } được phân phối gần đúng. Chúng tôi bắt đầu với các mục phụ thuộc ít

nhất vào các giả định.

Xem xét đầu ra hồi quy được hiển thị trong Hình 3.7. Chúng tôi sẽ viết cho xu hướng
μ ^
t
giao

phối esti bất kể dạng tham số giả định cho μt . Ví dụ, đối với xu hướng

thời gian tai lin, chúng ta có μt = β0 + β1t. Đối với mỗi t, thành phần ngẫu nhiên không được quan sát
Machine Translated by Google

3.5 Thông dịch đầu ra hồi quy 41

Xt có thể được ước tính (dự đoán) bởi Yt - μ ^


. Nếu quá trình {Xt } có phương sai không đổi,
t

thì chúng ta có thể ước tính độ lệch chuẩn của Xt , cụ thể là theo stan dư γ0
sai lệch dard

1 N
S =
----------- 2
( Yt )μ -^ (3.5.1)
t
np -
t 1 =

trong đó p là số tham số được ước tính bằng μt và n - p là cái gọi là độ của


tự do cho s. Giá trị của s cung cấp một thước đo tuyệt đối về mức độ phù hợp của xu hướng giao
phối esti — giá trị của s càng nhỏ thì sự phù hợp càng tốt. Tuy nhiên, một giá trị của , giả sử,
60,74 hơi khó giải thích.
Một thước đo không đơn vị để đánh giá mức độ phù hợp của xu hướng là giá trị của R2, còn được gọi là

hệ số xác định hoặc nhiều R bình phương. Một cách giải thích của R2 là
nó là bình phương của hệ số tương quan mẫu giữa chuỗi quan sát và
xu hướng ước tính. Nó cũng là một phần của sự biến đổi trong chuỗi được giải thích bởi
xu hướng ước tính. Hình 3.7 là đầu ra hồi quy hoàn chỉnh hơn khi phù hợp với
đường thẳng đến dữ liệu đi bộ ngẫu nhiên. Điều này mở rộng những gì chúng ta đã thấy trong Phụ lục 3.1 trên trang
31.

Hình 3.7 Kết quả hồi quy cho sự phù hợp với xu hướng tuyến tính của bước đi ngẫu nhiên

Ước tính Std. Lỗi giá trị t Pr (> | t |)

Đánh chặn 1,007888 0,297245 3,39 0,00126

Thời gian 0,134087 0,008475 15,82 <0,0001

Lỗi tiêu chuẩn còn lại 1.137 với 58 bậc tự do

Nhiều bình phương R 0,812

R bình phương được điều chỉnh 0,809

Thống kê F 250.3 với 1 và 58 df; p-value <0,0001

> model1 = lm (rwalk ~ thời gian (rwalk))


> tóm tắt (model1)

Theo Hình 3.7, khoảng 81% sự thay đổi trong chuỗi đi bộ ngẫu nhiên là
được giải thích bởi xu hướng thời gian tuyến tính. Giá trị bình phương R đã điều chỉnh là một điều chỉnh nhỏ

đến R2 mang lại ước tính gần đúng không chệch dựa trên số lượng tham số
ước tính trong xu hướng. Nó rất hữu ích để so sánh các mô hình với các số lượng khác nhau
thông số. Các công thức tính R2 khác nhau có thể được tìm thấy trong bất kỳ cuốn sách nào về
regres sion, chẳng hạn như Draper và Smith (1981). Độ lệch chuẩn của các hệ số
có nhãn Std. Lỗi trên đầu ra cần được giải thích cẩn thận. Chúng thích hợp
chỉ khi thành phần ngẫu nhiên là nhiễu trắng - giả định hồi quy thông thường.
Machine Translated by Google

42 Xu hướng

Ví dụ, trong Hình 3.7, giá trị 1.137 nhận được từ căn bậc hai của giá trị được cho bởi Công thức

(3.4.8) khi ρk = 0 với k > 0 và với γ0 được ước lượng bởi s 2, nghĩa là trong phạm vi làm tròn,

2 12 1,137 ()
0,008475 = ----------------------------

60 602 () 1–

Điểm quan trọng là những độ lệch chuẩn này giả định một thành phần ngẫu nhiên nhiễu trắng hiếm
khi đúng với chuỗi thời gian.
Các giá trị t hoặc tỷ lệ t được trình bày trong Phụ lục 3.7 chỉ là hệ số hệ số hồi quy ước
tính, mỗi giá trị chia cho sai số tiêu chuẩn tương ứng của chúng. Nếu thành phần ngẫu nhiên là
nhiễu trắng được phân phối bình thường, thì các tỷ lệ này cung cấp thống kê thử nghiệm thích
hợp để kiểm tra ý nghĩa của các hệ số hồi quy. Trong mỗi trường hợp, giả thuyết rỗng là hệ số
hồi quy chưa biết tương ứng bằng không. Các mức ý nghĩa và giá trị p được xác định từ phân phối
t với n - p bậc tự do.

3.6 Phân tích dư


Như chúng ta đã lưu ý, thành phần ngẫu nhiên không được quan sát {Xt } có thể được ước tính hoặc
dự đoán bằng phần dư
^
X - =
t Yt μ ^ t (3.6.1)

Dự đoán thực sự là một thuật ngữ tốt hơn. Chúng tôi bảo lưu ước tính kỳ hạn để phỏng đoán một
tham số không xác định
^ và dự đoán kỳ hạn cho ước tính một biến ngẫu nhiên không được quan sát.
Ta gọi phần dư tương
vàứnglý,với
các thìlần
giả quan
định
phần dư sát
khác thứvề
sẽnhau
hoạt t. Nếugần
động
thànhmô hình
phần
giống xu
ngẫunhưhướng
thànhX
nhiên là đúng
cóphần
thể một
ngẫu
được cách
nhiên
đánh hợp
giá
thực
bằng
sự
t
cách xem xét phần dư. Nếu thành phần ngẫu nhiên là nhiễu trắng, thì phần dư sẽ hoạt động gần
giống như các biến ngẫu nhiên độc lập (bình thường) với giá trị trung bình bằng 0 và độ lệch
chuẩn s. Vì một bình phương nhỏ nhất phù hợp với bất kỳ xu hướng nào có chứa số hạng không đổi
sẽ tự động tạo ra phần dư với giá trị trung bình bằng 0, chúng tôi có thể xem xét việc chuẩn
hóa phần dư dưới dạng. Tuy nhiên, hầu hết các phần mềm thống kê sẽ tạo ra các phần dư được tiêu
chuẩn hóa bằng^cách sử dụng một sai số tiêu chuẩn phức tạp hơn trong mẫu số có tính đến mô hình
hồi quy cụ thểX đang phù hợp.
t

Với các phần dư hoặc phần dư tiêu chuẩn trong tay, bước tiếp theo là kiểm tra các ô phần dư

var ious. Đầu tiên chúng ta xem xét âm mưu của những phần dư theo thời gian. Nếu dữ liệu có thể

là theo mùa, chúng ta nên sử dụng các ký hiệu biểu đồ như chúng ta đã làm trong Phụ lục 1.9 trên

trang 7, để có thể dễ dàng xác định các phần còn lại liên quan đến cùng một mùa.

Chúng tôi sẽ sử dụng chuỗi nhiệt độ trung bình hàng tháng mà chúng tôi đã trang bị với các
phương tiện theo mùa làm ví dụ đầu tiên của chúng tôi để minh họa một số ý tưởng về phân tích
dư lượng. Hình 1.7 trên trang 6 trình bày sơ đồ chuỗi thời gian của chuỗi đó. Hình 3.8 cho thấy
một biểu đồ chuỗi thời gian cho các phần dư được tiêu chuẩn hóa của dữ liệu nhiệt độ hàng tháng
được trang bị theo mùa. Nếu thành phần ngẫu nhiên là nhiễu trắng và xu hướng được mô hình hóa
đầy đủ, chúng tôi mong đợi một âm mưu như vậy sẽ đề xuất một phân tán hình chữ nhật không có xu
hướng rõ ràng nào. Không có sự khởi hành đáng chú ý nào từ sự ngẫu nhiên rõ ràng trong màn hình này.
Machine Translated by Google

3.6 Phân tích dư 43

Biểu đồ 3.9 lặp lại âm mưu của chuỗi thời gian nhưng bây giờ với các ký hiệu biểu đồ theo mùa. Một

lần nữa, không có mô hình rõ ràng nào liên quan đến các tháng khác nhau trong năm.

Hình 3.8 Phần dư so với thời gian đối với nhiệt độ Phương tiện theo mùa
3

2 • • •
•• • •
•• ••
1
• • •• •
•• • • • •
• •

• • •• • • • • •
••• • •
• •
0
• • • • •
• • • • • ••
• •


• •

• • •
•• • ••
• • •• • • • • •
• • •



• •

• •
• ••

• • •
• •• •

• • ••

• • •


• • • •
• • • •

• • •
• •

• •
chuẩn
tiêu
được
Phần
hóa
dư • • •
••
•• • • • ••

• • •
• •
• •

1
2

• • •
0 20 40 60 80 100 120 140

Thời gian

> plot (y = rstudent (model3), x = as.vector (time (tempdub)),


xlab = 'Thời gian', ylab = 'Phần dư Tiêu chuẩn hóa', type = 'o')

Hình 3.9 Phần còn lại so với thời gian với các ký hiệu vẽ đồ thị theo mùa
3
M
J M
2 D
JO J
1 FM M J F O
F M JM NSD M
N M
Một

M DJ J D Một
Một
J J D
J SNJM
Một Một Một
Một
S J O
Một
MộtJ F D S N
0
J ON J N J
NHƯ Ô
J
Một
Một
MJ J
S F J
JJ
S SO ND F TRÊN
J J
Một

J M F F
FMột F M
BẰNG CON TRAI
Một
M JJ
JO
Một Một

O
Một

M DJM N M Một M
M
Một

D Một N
OD J
Một
JF D MJ S S
M N
chuẩn
tiêu
được
Phần
hóa

M J O
J Một
1
2
J F D
M J M

0 20 40 60 80 100 120 140

Thời gian

> plot (y = rstudent (model3), x = as.vector (time (tempdub)), xlab = 'Time',> ylab = 'Standardized
Residuals', type = 'l')> points (y = rstudent (model3 ), x = as.vector (thời gian (tempdub)),

pch = as.vector (season (tempdub)))


Machine Translated by Google

44 Xu hướng

Tiếp theo, chúng tôi xem xét các phần dư được tiêu chuẩn hóa so với ước tính xu hướng tương ứng,

hoặc giá trị phù hợp, như trong Phụ lục 3.10. Một lần nữa, chúng tôi đang tìm kiếm các mẫu. Nhỏ

phần dư liên quan đến giá trị xu hướng phù hợp nhỏ và phần dư lớn với giá trị phù hợp lớn
giá trị xu hướng? Có ít sự thay đổi hơn đối với phần dư được liên kết với một số kích thước nhất định được trang bị

giá trị xu hướng hoặc nhiều biến thể hơn với các giá trị xu hướng phù hợp khác? Có phần nào nữa

sự thay đổi đối với phần còn lại của tháng 3 và ít hơn đối với tháng 11, nhưng Hình 3.10 chắc chắn có

không chỉ ra bất kỳ mô hình ấn tượng nào có thể khiến chúng tôi nghi ngờ các phương tiện theo mùa
người mẫu.

Phụ lục 3.10 Phần dư được tiêu chuẩn hóa so với các giá trị được trang bị cho Mô hình

phương tiện theo mùa nhiệt độ

10
M
J M
D
5 J O J
J F M O M
J D N M
M S
F N Một
M
J D M Một
Một
J
D M Một
O S
Một
Một
J
J F D N
N
Một
J
J
Một

S
0
J
Một
N M
Một

F D N
Một

S J
Một
J
J
Một O S
F
F M N O S J J
J
Một
F M
Một
Một
O
Một
Một
J
J N
Một
O M
M Một

J F D
D M N
Một
O M S
chuẩn
tiêu
được
Phần
hóa

5 D N M S J Một J
J Một
O M J
J F D
J M
M

20 30 40 50 60 70

Giá trị xu hướng được trang bị

> plot (y = rstudent (model3), x = as.vector (fit (model3)),


xlab = 'Giá trị xu hướng được trang bị',
> ylab = 'Phần dư Tiêu chuẩn hóa', type = 'n')
> điểm (y = rstudent (model3), x = as.vector (fit (model3)),
pch = as.vector (season (tempdub)))

Tổng bất thường có thể được đánh giá bằng cách vẽ biểu đồ biểu đồ của các phần dư hoặc phần dư

theo tiêu chuẩn stan. Hình 3.11 hiển thị biểu đồ tần số của tiêu chuẩn hóa

phần dư từ mô hình trung bình theo mùa cho chuỗi nhiệt độ. Cốt truyện là một số đối xứng và kết

thúc ở cả đầu cao và thấp như một phân phối chuẩn.


Machine Translated by Google

3.6 Phân tích dư 45

Biểu đồ 3.11 Biểu đồ lượng dư được tiêu chuẩn hóa từ Mô hình phương tiện theo
mùa

thường
xuyên
Tính

35
30
25
20
15
10
5
0

3 2 1 0 1 2 3

Phần dư được tiêu chuẩn hóa

> hist (rstudent (model3), xlab = 'Phần dư chuẩn hóa')

Độ chuẩn có thể được kiểm tra cẩn thận hơn bằng cách vẽ biểu đồ được gọi là điểm bình
thường hoặc biểu đồ lượng tử-lượng tử (QQ). Biểu đồ như vậy hiển thị các lượng tử của dữ
liệu so với các lượng tử quặng của một phân phối chuẩn. Với dữ liệu được phân phối bình
thường, âm mưu QQ trông giống như một đường thẳng. Hình 3.12 cho thấy biểu đồ điểm bình
thường QQ cho phần dư được tiêu chuẩn hóa từ mô hình trung bình theo mùa cho chuỗi nhiệt độ.
Mô hình đường thẳng ở đây hỗ trợ giả định về thành phần tic ngẫu nhiên được phân phối
chuẩn trong mô hình này.

Hình 3.12 Ô QQ: Phần dư được tiêu chuẩn hóa của mô hình phương tiện theo mùa


• •

Lượng
mẫu
tử
• • • • •
• • • • • • •
• • • • • • • • • •

• • •• •• •• •• •• •• •• •• •• •• •• ••
• • •• •• •• •• •• •• •• •• •• •• •• •• •• •• ••
• • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • •
32
2
1
0 1
• • • • • • • • • • • • • • • • • • • • •

• • • • • • • • • • • • • • • • • • • • • • • (


•••
•••••
••
•••••• ••••
•••••
••
•L

••

••

••
•••
•••
••
••

• • •

2 1 0 1 2

Lượng tử lý thuyết

> win.graph (width = 2,5, height = 2,5, pointsize = 8)> qqnorm


(rstudent (model3))
Machine Translated by Google

46 Xu hướng

Một phép thử tuyệt vời về tính chuẩn được gọi là phép thử Shapiro-Wilk .

Mối tương quan này càng thấp, chúng ta càng có nhiều bằng chứng chống lại tính chuẩn mực. Áp dụng điều đó

kiểm tra các phần dư này cho một thống kê kiểm định là W = 0,9929 với giá trị p là 0,6954. chúng tôi

không thể bác bỏ giả thuyết rỗng rằng thành phần ngẫu nhiên của mô hình này bình thường
được phân phối.

Tính độc lập trong thành phần ngẫu nhiên có thể được kiểm tra theo một số cách. Các cuộc chạy

kiểm tra kiểm tra các phần còn lại theo trình tự để tìm kiếm các mẫu — các mẫu sẽ cung cấp
bằng chứng chống lại độc lập. Số lần chạy trên hoặc dưới mức trung bình của chúng đều được tính. Nhỏ

số lần chạy sẽ chỉ ra rằng phần dư lân cận phụ thuộc cùng chiều và
có xu hướng "gắn bó với nhau" theo thời gian. Mặt khác, quá nhiều lần chạy sẽ chỉ ra rằng
các phần dư dao động qua lại trên đường trung bình của chúng. Sau đó, phần dư lân cận
phụ thuộc tiêu cực. Vì vậy, quá ít hoặc quá nhiều lần chạy đều dẫn đến việc chúng ta từ chối
sự thiếu hiểu biết. Thực hiện kiểm tra chạy ‡ trên các phần dư này tạo ra các giá trị sau:
số lần chạy quan sát = 65, số lần chạy dự kiến = 72,875, dẫn đến giá trị p là 0,216 và chúng tôi
không thể bác bỏ tính độc lập của thành phần ngẫu nhiên trong mô hình phương tiện theo mùa này.

Chức năng tự tương quan mẫu

Một công cụ chẩn đoán rất quan trọng khác để kiểm tra sự phụ thuộc là chức năng tương quan
tự động mẫu. Xem xét bất kỳ chuỗi dữ liệu nào Y1, Y2,…, Yn — cho dù phần dư,
phần dư được chuẩn hóa, dữ liệu gốc hoặc một số biến đổi dữ liệu. Giả sử cố ý về tính cố
định, chúng tôi muốn ước tính hàm tự tương quan ρk cho nhiều loại
trễ k = 1, 2,…. Cách rõ ràng để làm điều này là tính toán mối tương quan mẫu
giữa các cặp cách nhau k đơn vị về thời gian. Nghĩa là, trong số (Y1, Y1 + k), (Y2, Y2 + k),
(Y3, Y3 + k), ..., và (Yn - k, Yn). Tuy nhiên, chúng tôi sửa đổi điều này một chút, có tính đến
rằng chúng tôi đang giả định tính ổn định, điều này ngụ ý một giá trị trung bình và phương sai chung cho

loạt. Với ý nghĩ này, chúng tôi xác định hàm tự tương quan mẫu, rk, tại độ trễ k là

N _ _
( Yt )Y - Yt( k - ) -Y
tk 1 + =
rk
= ------------------------------------------------- --------------
N _ cho k = 1, 2, ... (3.6.2)
2
()Yt- Y
t 1 =
_
Lưu ý rằng chúng tôi đã sử dụng "đại nghĩa", Yở tất cả các nơi và cũng đã chia cho
"Tổng bình phương" chứ không phải là tích của hai độ lệch chuẩn riêng biệt
được sử dụng trong hệ số tương quan thông thường. Chúng tôi cũng lưu ý rằng mẫu số là một tổng
của n số hạng bình phương trong khi tử số chỉ chứa n - k tích chéo. Đối với nhiều loại
lý do, điều này đã trở thành định nghĩa tiêu chuẩn cho chức năng tự tương quan mẫu. Biểu đồ
của rk so với độ trễ k thường được gọi là một biểu đồ tương quan.

† Royston, P. (1982) “Mở rộng Thử nghiệm W của Shapiro và Wilk về mức độ bình thường đến quy mô lớn
Mẫu." Thống kê Áp dụng, 31, 115–124.
‡ Mã R: chạy (rstudent (model3))
Machine Translated by Google

3.6 Phân tích dư 47

Trong bối cảnh hiện tại của chúng tôi, chúng tôi quan tâm đến việc phát hiện ra sự phụ thuộc có thể có trong

thành phần ngẫu nhiên; do đó, hàm tự tương quan mẫu cho phần dư ized tiêu chuẩn được quan tâm.
Hình 3.13 hiển thị tự tương quan mẫu cho
lượng dư được chuẩn hóa từ mô hình trung bình theo mùa của chuỗi nhiệt độ. Tất cả các giá trị
đều nằm trong các đường đứt nét ngang, được đặt ở số không cộng và trừ hai
sai số chuẩn gần đúng của các phép tự tương quan mẫu, cụ thể là 2 ⁄ ± n . Giá trị

của rk tất nhiên là ước tính của ρk. Do đó, họ có các bản phân phối lấy mẫu của riêng mình,
lỗi tiêu chuẩn và các thuộc tính khác. Hiện tại, chúng tôi sẽ sử dụng rk như một công cụ mô tả và
hoãn thảo luận về những chủ đề đó cho đến Chương 6 và 8. Theo Phụ lục 3.13, vì k

= 1, 2, ..., 21, không có giả thuyết nào trong số các giả thuyết ρk = 0 có thể bị bác bỏ với
mức ý nghĩa thông thường, và điều hợp lý là suy ra rằng thành phần ngẫu nhiên của chuỗi là màu trắng
tiếng ồn.

Phụ lục 3.13 Mẫu tự tương quan về phần dư của mô hình phương tiện theo mùa

0,15

0,05

ACF

0,05

0,15

2 4 6 số 8 10 12 14 16 18 20

Lỗi

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (rstudent (model3))

Như ví dụ thứ hai, hãy xem xét các phần dư được tiêu chuẩn hóa từ việc lắp một đường thẳng
đến chuỗi thời gian đi bộ ngẫu nhiên. Nhớ lại Phụ lục 3.2 trên trang 31, hiển thị dữ liệu và
dòng được trang bị. Biểu đồ chuỗi thời gian của các phần dư được tiêu chuẩn hóa được thể hiện trong Hình 3.14.
Machine Translated by Google

48 Xu hướng

Hình 3.14 Phần dư từ việc điều chỉnh đường thẳng của bước đi ngẫu nhiên

• • •
•• •
• • • • • •• •

• •• • • • ••
2
1
0

• • • •
••




• • ••
• • •
• •
• •
• • •
• •
• ••
• •
2
• •


• •


chuẩn
tiêu
được
Phần
hóa

0 10 20 30 40 50 60

Thời gian

> plot (y = rstudent (model1), x = as.vector (time (rwalk)),


ylab = 'Phần dư chuẩn hóa', xlab = 'Thời gian', type = 'o')

Trong cốt truyện này, các phần dư "dính vào nhau" quá nhiều cho tiếng ồn trắng - cốt truyện cũng
trơn tru. Hơn nữa, dường như có nhiều biến thể hơn trong một phần ba cuối của loạt phim hơn là

trong hai phần ba đầu tiên. Hình 3.15 cho thấy tác động tương tự với lượng dư lớn hơn kết hợp với

các giá trị được lắp lớn hơn.

Hình 3.15 Phần dư so với giá trị được trang bị từ Điều chỉnh đường thẳng
2
• •
•• • • • •

1
• •
• • •
0 • • ••• • •
••
• •

•• • • •
• •
• •
• •

• • • •
• • •
• •
• • • •
1

• •
• • •
chuẩn
tiêu
được
Phần
hóa

• • •

2



0246

Giá trị đường xu hướng được trang bị

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> plot (y = rstudent (model1), x = fit (model1),
ylab = 'Phần dư chuẩn hóa', xlab = 'Giá trị Đường xu hướng được trang bị', type = 'p')
Machine Translated by Google

3.6 Phân tích dư 49

Hàm tự tương quan mẫu của các phần dư chuẩn hóa, được trình bày trong Phụ lục

3.16, xác nhận sự mượt mà của biểu đồ chuỗi thời gian mà chúng tôi đã quan sát được trong Hình 3.14.

Độ trễ 1 và độ trễ 2 tự tương quan vượt quá hai lỗi tiêu chuẩn trên 0 và độ trễ 5

và độ trễ 6 tự tương quan hơn hai lỗi tiêu chuẩn dưới 0. Đây không phải là những gì

chúng tôi mong đợi từ một quá trình tiếng ồn trắng.

Hình 3.16 Tự tương quan mẫu của phần dư từ mô hình đường thẳng

0,6

0,4

0,2

ACF

0,2
0,4
0,0

2 4 6 số 8 10 12 14 16

Lỗi

> acf (rstudent (model1))

Cuối cùng, chúng tôi quay trở lại lượng mưa hàng năm ở Los Angeles được thể hiện trong Hình 1.1 trên

trang 2. Chúng tôi không tìm thấy bằng chứng nào về sự phụ thuộc trong loạt bài đó, nhưng chúng tôi hiện đang

tìm kiếm sự khác biệt chống lại sự bình thường. Hình 3.17 hiển thị biểu đồ lượng tử-lượng tử bình thường cho điều đó

loạt. Chúng tôi thấy độ cong đáng kể trong cốt truyện. Một dòng đi qua đầu tiên và

phần tư bình thường thứ ba giúp chỉ ra điểm xuất phát từ một đường thẳng trong biểu đồ.
Machine Translated by Google

50 Xu hướng

Hình 3.17 Lô đất định lượng-định lượng của loạt mưa hàng năm ở Los Angeles


40

30
••
• •

•••
• •
•••••••••
20 •• •• ••
ot

••••

Lượng
mẫu
tử
• •

••
••••••
•••


•• ••••
• •

•••••
10
••
••
••
ot•

•••••


2 1 0 1 2

Lượng tử lý thuyết

> win.graph (width = 2.5, height = 2.5, pointsize =


8)> qqnorm (larain); qqline (larain)

3.7 Tóm tắt

Chương này liên quan đến việc mô tả, mô hình hóa và ước tính các xu hướng xác định trong
chuỗi thời gian. “Xu hướng” xác định đơn giản nhất là một hàm trung bình không đổi.
Các phương pháp ước tính giá trị trung bình không đổi đã được đưa ra nhưng quan trọng hơn là
việc đánh giá độ chính xác của các ước tính trong các điều kiện khác nhau đã được xem xét. Các
phương pháp hồi quy sau đó đã được theo đuổi để ước tính các xu hướng tuyến tính hoặc bậc hai
theo thời gian. Tiếp theo là các meth để lập mô hình các xu hướng theo chu kỳ hoặc theo mùa, và
độ tin cậy và hiệu quả của tất cả các phương pháp hồi quy này đã được nghiên cứu. Phần cuối cùng
bắt đầu nghiên cứu của chúng tôi về phân tích lượng dư để điều tra chất lượng của mô hình được
trang bị. Phần này cũng giới thiệu về hàm tự tương quan mẫu quan trọng, mà chúng ta sẽ xem lại
trong phần còn lại của cuốn sách.

BÀI TẬP

3.1 Kiểm tra Công thức (3.3.2) trên trang 30, để biết các ước lượng bình phương nhỏ nhất của β0
và của β1 khi mô hình Yt = β0 + β1t + Xt được xem xét.
3.2 Giả sử Yt = μ + et - et 1. Tìm thấy . Var
Ghi Y_ () bất kỳ kết quả bất thường nào. Đặc biệt, hãy
nhận

so sánh câu trả lời của bạn với những gì sẽ thu được nếu Yt = μ + et . (Gợi ý: Bạn có thể
tránh Phương trình (3.2.3) ở trang 28 bằng cách thực hiện một số đơn giản hóa đại số trên
N -
().) et et 1–
t 1 =
Machine Translated by Google

Bài tập 51

3.3 Giả sử Yt = μ + et + et Varcâu


1. Tìm thấy . So sánh Y_ trả
() lời của bạn với những gì sẽ nhận được nếu Yt =

μ + et . Mô tả ảnh hưởng của tự tương quan trong Var Y_ ()

{Yt } có trên .

3.4 Số giờ trong tệp dữ liệu chứa các giá trị hàng tháng của số giờ làm việc trung bình mỗi tuần trong lĩnh

vực sản xuất của Hoa Kỳ từ tháng 7 năm 1982 đến tháng 6 năm 1987. (a) Hiển thị và diễn giải biểu đồ

chuỗi thời gian cho những dữ liệu này. (b) Bây giờ xây dựng một biểu đồ chuỗi thời gian sử dụng các

ký hiệu biểu đồ riêng biệt cho các tháng khác nhau. Cách giải thích của bạn có thay đổi so với phần

(a) không?

3.5 Tiền lương trong tệp dữ liệu chứa các giá trị hàng tháng của mức lương trung bình theo giờ (tính bằng

đô lars) cho công nhân trong ngành sản phẩm dệt may của Hoa Kỳ từ tháng 7 năm 1981 đến tháng 6 năm

1987. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này. (b) Sử dụng bình

phương nhỏ nhất để phù hợp với xu hướng thời gian tuyến tính với chuỗi thời gian này. Diễn giải đầu

ra hồi quy. Lưu các phần còn lại đã được chuẩn hóa từ chỗ vừa vặn để tiếp tục khám bệnh qua đường

hậu môn.

(c) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ

phần (b).

(d) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng thời gian bậc hai với chuỗi thời gian tiền

lương. Inter trước đầu ra hồi quy. Lưu lượng dư đã tiêu chuẩn hóa từ phù hợp để phân tích nhiệt

lông thú.

(e) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ

phần (d).

3.6 Tệp dữ liệu bán bia chứa doanh số bán bia hàng tháng của Mỹ (tính bằng hàng triệu thùng)

trong khoảng thời gian từ tháng 1 năm 1975 đến tháng 12 năm 1990.

(a) Hiển thị và diễn giải biểu đồ của biểu đồ chuỗi thời gian cho những dữ liệu

này. (b) Bây giờ xây dựng một biểu đồ chuỗi thời gian sử dụng các ký hiệu biểu đồ riêng biệt cho

các tháng khác nhau. Cách giải thích của bạn có thay đổi so với phần (a) không? (c) Sử dụng

bình phương nhỏ nhất để phù hợp với xu hướng theo mùa với chuỗi thời gian này. Diễn giải đầu ra hồi

quy. Lưu các phần còn lại đã được chuẩn hóa từ chỗ vừa vặn để tiếp tục khám bệnh qua đường hậu

môn.

(d) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ phần (c). Đảm bảo sử

dụng các ký hiệu biểu đồ thích hợp để kiểm tra tính thời vụ trong phần dư được tiêu chuẩn hóa.
(e) Sử dụng bình phương nhỏ nhất để phù hợp với phương tiện theo mùa cộng với xu hướng thời

gian bậc hai với chuỗi thời gian bán bia. Diễn giải đầu ra hồi quy. Lưu alu dư tiêu chuẩn từ phù hợp

để phân tích thêm. (f) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa

từ phần (e). Một lần nữa sử dụng các ký hiệu biểu đồ thích hợp để kiểm tra xem có bất kỳ độ âm

nào còn lại của biển trong phần dư hay không.

3.7 Tệp dữ liệu winnebago chứa doanh số bán xe giải trí theo đơn vị hàng tháng của Winnebago, Inc., từ tháng

11 năm 1966 đến tháng 2 năm 1972. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ

liệu này. (b) Sử dụng bình phương nhỏ nhất để vừa một dòng với dữ liệu này. Diễn giải đầu ra hồi

quy. Vẽ đồ thị phần dư được tiêu chuẩn hóa từ sự phù hợp dưới dạng một chuỗi thời gian. Diễn giải

cốt truyện. (c) Bây giờ lấy logarit tự nhiên của số liệu bán hàng hàng tháng và hiển thị và
Machine Translated by Google

52 Xu hướng

diễn giải biểu đồ chuỗi thời gian của các giá trị đã biến đổi.

(d) Sử dụng các ô vuông nhỏ nhất để vừa một dòng với dữ liệu đã ghi. Hiển thị và diễn giải thời gian

đồ thị chuỗi của các phần dư được tiêu chuẩn hóa từ sự phù hợp này.

(e) Bây giờ, hãy sử dụng bình phương nhỏ nhất để phù hợp với xu hướng thời gian tuyến tính cộng với giá

trị theo mùa với chuỗi thời gian bán hàng đã ghi và lưu phần dư được chuẩn hóa để phân tích thêm.

Kiểm tra ý nghĩa thống kê của từng hệ số hồi quy trong mô hình.

(f) Hiển thị biểu đồ chuỗi thời gian của các phần dư chuẩn hóa thu được trong phần (e).

Diễn giải cốt truyện.

3.8 Tệp dữ liệu bán lẻ liệt kê tổng doanh số bán lẻ của Vương quốc Anh (Vương quốc Anh) (tính bằng tỷ bảng Anh)

từ tháng 1 năm 1986 đến tháng 3 năm 2007. Dữ liệu không được “điều chỉnh theo mùa” và năm 2000 = 100 là

năm gốc. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này. Hãy chắc chắn sử dụng

âm mưu

biểu tượng cho phép bạn tìm kiếm tính thời vụ.

(b) Sử dụng bình phương nhỏ nhất để phù hợp với giá trị trung bình theo mùa cộng với xu hướng thời gian

tuyến tính với chuỗi thời gian này. Giải thích đầu ra hồi quy và lưu các phần dư chuẩn hóa từ phần

phù hợp để phân tích thêm.

(c) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ phần (b). Đảm bảo sử

dụng các ký hiệu biểu đồ thích hợp để kiểm tra tính thời vụ.

3.9 Kê đơn trong tệp dữ liệu cung cấp chi phí kê đơn hàng tháng của Hoa Kỳ trong các tháng từ tháng 8 năm 1986

đến tháng 3 năm 1992. Những dữ liệu này là từ Chương trình Thuốc Pre scription của Tiểu bang New Jersey

và là chi phí cho mỗi yêu cầu kê đơn. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ

liệu này. Sử dụng các biểu tượng biểu đồ cho phép bạn tìm kiếm tính thời vụ. (b) Tính toán và vẽ biểu

đồ trình tự thay đổi tỷ lệ phần trăm hàng tháng trong chi phí kê đơn. Một lần nữa, hãy sử dụng các

biểu tượng âm mưu cho phép bạn tìm kiếm âm sắc của biển.

(c) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng cosin có tần số cơ bản 1/12 với chuỗi thay đổi

phần trăm. Diễn giải đầu ra hồi quy. Lưu phần dư ized tiêu chuẩn.

(d) Vẽ đồ thị chuỗi các phần dư chuẩn hóa để khảo sát tính đầy đủ của mô hình xu hướng cosin. Diễn giải

cốt truyện.

3.10 (Làm tiếp bài tập 3,4) Xem xét lại chuỗi thời gian giờ .

(a) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng bậc hai cho những dữ liệu này. Diễn giải đầu

ra hồi quy và lưu các phần dư chuẩn hóa để phân tích thêm. (b) Hiển thị một biểu đồ trình tự của

các phần dư được tiêu chuẩn hóa và giải thích. Sử dụng các ký hiệu biểu đồ hàng tháng để có thể dễ dàng

xác định được tính thời vụ.

(c) Thực hiện phép thử Chạy đối với các phần dư được tiêu chuẩn hóa và giải thích kết quả. (d) Tính

toán và giải thích tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.

(e) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (các điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
Machine Translated by Google

Bài tập 53

3.11 (Tiếp theo bài tập 3.5) Trở lại chuỗi tiền lương .

(a) Xem xét phần dư từ một hình vuông nhỏ nhất phù hợp với xu hướng thời gian bậc hai. (b) Thực

hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính toán và giải

thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.

(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.

3.12 (Tiếp theo bài tập 3.6) Hãy xem xét chuỗi thời gian trong tệp dữ liệu bán hàng. (a) Lấy phần dư từ các bình

phương nhỏ nhất phù hợp với phương tiện theo mùa cộng qua
mô hình xu hướng thời gian dratic.

(b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính

toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.

(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.

3.13 (Tiếp theo bài tập 3.7) Quay lại chuỗi thời gian winnebago .

(a) Tính số dư bình phương nhỏ nhất từ phương tiện theo mùa cộng với thời gian tuyến tính

mô hình xu hướng trên logarit của chuỗi thời gian bán hàng. (b) Thực

hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính toán và giải

thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.

(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.

3.14 (Tiếp theo của bài tập 3.8) Tệp dữ liệu bán lẻ chứa bán lẻ hàng tháng của Vương quốc Anh

số liệu bán hàng.

(a) Lấy phần dư bình phương nhỏ nhất từ phương tiện theo mùa cộng với thời gian tuyến tính
mô hình xu hướng.

(b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính

toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.

(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.

3.15 (Tiếp theo Bài tập 3.9) Xem xét lại chuỗi thời gian quy định .

(a) Lưu phần dư chuẩn hóa từ một bình phương nhỏ nhất phù hợp với xu hướng cosin với tần suất cơ bản 1/12

vào chuỗi thời gian thay đổi phần trăm. (b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn

hóa và giải thích kết quả. (c) Tính toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa

anh em.

(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét

biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
Machine Translated by Google

54 Xu hướng

3.16 Giả sử rằng một chuỗi thời gian tĩnh, {Yt }, có một hàm tự tương quan của
dạng ρk = φk với k > 0, trong đó φ là hằng số trong khoảng ( 1, + 1).

= γ0 1 + φ - 2φ 1 φn - ()
(a) Cho thấy rằng Var Y_ ()
---- ------ -------------------
------------
.
N N 2
1 - (1 - φ)
φ (Gợi ý: Sử dụng Công thức (3.2.3) ở trang 28, tổng hình học hữu hạn

N - 1+ N d N
1 φn
φk
--------------------- =
, và tổng liên quan kφk 1– φk .)
=
k 0 = 1 - φ k 0 = dφ k 0 =

γ0 1 + φ
() (b) Nếu n lớn, lập luận rằngVar Y_
----
≈ ------------ .
N 1 - φ
(c) Ô () 1 (1
+ φ- ⁄ φ ) cho φ trong khoảng 1 đến +1. Giải thích cốt truyện theo thuật ngữ

về độ chính xác trong việc ước tính giá trị trung bình của quá trình.

3.17 Xác minh phương trình (3.2.6) trên trang 29. (Gợi ý: Bạn sẽ cần thực tế rằng
∞ 1
----------- =
φk cho 1 <φ <+1.)
k 0 = 1 - φ

3.18 Xác minh phương trình (3.2.7) trên trang 30. (Gợi ý: Bạn sẽ cần hai tổng

N N
t
n n ( ) 1+ và n n () 1+ ) 2n 1+
= --------------------
t2 = -----------------------------------------
.)
2 (6
t 1 = t 1 =
Machine Translated by Google

CHƯƠNG 4
CÁC MÔ HÌNH CHO CÁC GIAI ĐOẠN THỜI GIAN CỦA VĂN PHÒNG

Chương này thảo luận về các khái niệm cơ bản của một loại rộng các mô hình chuỗi thời gian
tham số — các mô hình đường trung bình động tự hồi phục (ARMA). Các mô hình này đã có tầm quan
trọng lớn trong việc mô hình hóa các quy trình trong thế giới thực.

4.1 Các quy trình tuyến tính chung

Chúng tôi sẽ luôn đặt {Yt } biểu thị chuỗi thời gian được quan sát. Từ đây, chúng ta cũng sẽ để {et }

đại diện cho một chuỗi nhiễu trắng không được quan sát, nghĩa là, một chuỗi các biến ngẫu nhiên độc

lập, có giá trị trung bình bằng không, có phân phối giống hệt nhau. Đối với phần lớn công việc của

chúng tôi, giả định về tính độc lập có thể được thay thế bằng giả định yếu hơn rằng {et } là các biến

ngẫu nhiên chưa được phân loại, nhưng chúng tôi sẽ không theo đuổi tính tổng quát nhỏ đó.

Quá trình tuyến tính tổng quát, { Yt }, là một quá trình có thể được biểu diễn dưới dạng kết hợp tuyến

tính có trọng số của các thuật ngữ nhiễu trắng hiện tại và quá khứ như

Yt =et+++…
ψ1et 1– ψ2et 2– (4.1.1)

Nếu vế phải của biểu thức này thực sự là một chuỗi vô hạn, thì một số điều kiện nhất
định phải được đặt vào trọng số để vế phải có nghĩa là toán học có ý nghĩa. Đối với
mục đích của chúng tôi, đủ để giả định rằng


i
2 ∞ < (4.1.2)
tôi 1 =

Chúng ta cũng cần lưu ý rằng vì {et } là không thể quan sát được, nên không có gì mất đi tính tổng

quát của Công thức (4.1.2) nếu chúng ta giả định rằng hệ số trên et là 1; hiệu quả, ψ0 = 1.
Một ví dụ quan trọng không đáng có mà chúng tôi sẽ thường xuyên quay lại là trường hợp
của hình thành một chuỗi phân rã theo cấp số nhân

=
ψj φ j

trong đó φ là một số đúng giữa 1 và +1. sau đó

Yt =et++φet
+… 1– φ2et 2–

Đối với ví dụ
= =
này, E Yt (()φ2et
E et2–φet
) ++
1– +… 0

55
Machine Translated by Google

56 Mô hình cho chuỗi thời gian tĩnh

sao cho {Yt } có giá trị trung bình không đổi. Cũng thế,

=
Var Yt () Var ()
et ++
φet+…1– φ2et 2–

2– Var
= +++
et ()…
() φ2Var1–et( ) φ4Var et

= ( 2e 1 +++
φ2 φ)
4 …
2
σe
= -------------- (bằng cách cộng một chuỗi hình học)
1 φ2 -

Hơn nữa,

, 1– = ++ +…
, ( Cov )
() Yt
Cov Yt Cov φet
et +et
2–
+…1–
(et)φ2et
1– φet
2– +2– φ2et 2et 2– 3–
= , 1– )
( 1– et
Cov φet
+ , + …

2
= +++
φσe22 φ3σe
… φ5σe
=
φσe2(1 +++
φ2 φ)
4 …
2
φσe
= -------------- (một lần nữa tổng hợp một chuỗi hình học)
1 φ2 -

Như vậy

2 2
φσe σe
, 1– ) =
( Yt ⁄ = φ
-------------- --------------

Corr Yt
1 φ2 - 1 φ2 -

2
φkσe
Theo cách tương tự, chúng ta có thể tìm thấy () , k -
Cov Yt Yt
= --------------

1 φ2 -
và như vậy

= k
(4.1.3)
Corr Yt
- ()
Yt φ,
k

Điều quan trọng cần lưu ý là quá trình được xác định theo cách này là tĩnh - cấu trúc phương sai

autoco chỉ phụ thuộc vào độ trễ thời gian chứ không phụ thuộc vào thời gian tuyệt đối. Đối với một lin

quy trình = +++…


Yt et ψ1et 1– ψ2et 2– các phép tính tương,tự như các phép tính đã thực hiện ở trên
tai, thu được các kết quả sau:


= 2 k ≥ 0
E Yt () 0 = γk Cov Yt Yt k =- () σ, e ψi ψi k +
(4.1.4)
i 0 =

với ψ0 = 1. Có thể thu được quá trình có giá trị trung bình khác không bằng cách thêm μ vào
vế phải của phương trình (4.1.1). Vì giá trị trung bình không ảnh hưởng đến sai lệch phương sai của một quá trình,

chúng tôi giả định giá trị trung bình bằng 0 cho đến khi chúng tôi bắt đầu điều chỉnh các mô hình với dữ liệu.
Machine Translated by Google

4.2 Các quá trình trung bình động 57

4.2 Các quá trình trung bình động

Trong trường hợp chỉ có một số hữu hạn trọng số là khác không, chúng ta có
được gọi là một quá trình trung bình động. Trong trường hợp này, chúng tôi thay đổi phần nào ký hiệu † và viết

= -
Yt et θ1et 1–
- -
(4.2.1)
θ2et 2– … Θq - etq -

Chúng ta gọi một chuỗi như vậy là đường trung bình của bậc q và viết tắt tên là MA (q).
Thuật ngữ trung bình động phát sinh từ thực tế là Yt thu được bằng cách áp dụng
- - -
trọng số 1, θ1, θ2, ..., vàetsau2,…,
θq thành các biến et , et 1, đó diet q
chuyển
trọng lượng và áp dụng chúng với et + 1, et ,- et -
q + et1 để thu được Yt + 1 , v.v. Mô hình
1, ...,

trung bình Mov lần đầu tiên được xem xét bởi Slutsky (1927) và Wold (1938).

Quy trình trung bình trượt đơn hàng đầu tiên

Chúng tôi xem xét chi tiết quá trình đơn giản nhưng quan trọng của đường trung bình động của
bậc 1, tức là, chuỗi MA (1). Thay vì chuyên biệt hóa các công thức trong Phương trình
(4.1.4), nên xác định lại kết quả. Mô hình là Yt et θet
- =
1– . Từ
chỉ một θ được tham gia, chúng tôi loại bỏ chỉ số phụ dư thừa 1. Rõ ràng E Yt () = 0
và Var Yt ()
= σe
()2 +1 θ2 . Hiện nay

= - -
( Cov Yt,Yt 1– ) Cov (et θet 1–,et 1– θet 2– )
= - - =
2
( 1– ) θ, et 1– σe
Cov θet


, 2– ) = - -
( Yt
Cov Yt Cov (et θet 1–,et 2– θet 3– )
0 =

-
vì không có e nào có điểm chung giữa Yt và Yt 2. Tương tự,
( Cov Yt ,
Yt k - ) 0 = bất cứ khi nào k ≥ 2 ; nghĩa là, quá trình không có mối tương quan nào ngoài độ trễ

1. Thực tế này sẽ rất quan trọng sau này khi chúng ta cần chọn những mô hình phù hợp để thực
dữ liệu.

- =
Tóm lại, đối với mô hình MA (1), Yt et θet 1– ,

E Yt () 0 =

=
γ0 Var Yt () σe = ()2 +
1 θ2

- =
2
γ1 θσe (4.2.2)

= ) –Θ 1 θ2
ρ1 (⁄ () +

γk ρk = = 0 với k ≥ 2

† Lý do cho sự thay đổi này sẽ rõ ràng ở phần sau. Một số phần mềm thống kê, chẳng hạn
R, sử dụng dấu cộng trước các nhiệm vụ. Kiểm tra với của bạn để xem nó sử dụng quy ước nào.
Machine Translated by Google

58 Mô hình cho chuỗi thời gian tĩnh

Một số giá trị số cho ρ1 so với θ trong Công thức (4.2.2) giúp minh họa các khả năng có thể.

Lưu ý rằng các giá trị ρ1 đối với θ âm có thể nhận được bằng cách phủ định
giá trị cho giá trị θ dương tương ứng.

θ () + θρ11 θ2 - = ⁄
0.099 θ () + θ 1 θ2 - = ⁄
ρ1
0,1 0,6 0,441

0,2 0,192 0,7 0.470

0,3 0,275 0,8 0.488

0,4 0.345 0,9 0.497

0,5 0.400 1,0 0.500

Một đối số giải tích cho thấy rằng giá trị lớn nhất mà ρ1 có thể đạt được là ρ1 = ½ khi

θ = 1 và giá trị nhỏ nhất là ρ1 = ½, giá trị này xảy ra khi θ = +1 (xem Bài tập 4.3).
Hình 4.1 hiển thị một biểu đồ của các giá trị tự tương quan trễ 1 cho θ nằm trong khoảng từ 1 đến
+1.

Hình 4.1 Độ trễ 1 Tự tương quan của một quá trình MA (1) cho các quá trình khác nhau θ

ρ1

0,2
0,4
0,4
0,2
0,0

0,8 0,4 0,0 0,4 0,8

Bài tập 4.4 yêu cầu bạn chỉ ra rằng khi bất kỳ giá trị khác nào của θ được thay thế bằng 1 / θ,

cùng một giá trị cho ρ1 thu được. Ví dụ: ρ1 giống với θ = ½ như đối với θ = 1 / (½)

= 2. Nếu chúng ta biết rằng một quá trình MA (1) có ρ1 = 0,4, chúng ta vẫn không thể nói chính xác
giá trị của θ. Chúng ta sẽ quay lại điểm rắc rối này khi chúng ta thảo luận về khả năng nghịch đảo trong

Mục 4.5 trên trang 79.

Hình 4.2 cho thấy đồ thị thời gian của một chuỗi MA (1) được mô phỏng với θ = 0,9 và không

có nhiễu trắng phân phối theo m. Nhớ lại từ Hình 4.1 rằng ρ1 = 0,4972 cho mô hình này;
do đó có mối tương quan thuận vừa phải mạnh ở độ trễ 1. Mối tương quan này là rõ ràng

trong cốt truyện của loạt bài vì các quan sát liên tiếp có xu hướng liên quan chặt chẽ với nhau. Nếu một
quan sát trên mức trung bình của chuỗi, thì quan sát tiếp theo cũng có xu hướng

ở trên mức trung bình. Cốt truyện tương đối suôn sẻ theo thời gian, chỉ đôi khi
biến động.
Machine Translated by Google

4.2 Các quá trình trung bình động 59

Hình 4.2 Đồ thị thời gian của một quá trình MA (1) với θ = 0,9

• • •

• ••• • ••

• •
• ••
• • • • •

• • • • •• • •
• •

• ••• • •••• •• • •
• • •
Yt •


• • • • ••• • •
• • • ••

• • • • • •••• • • •
• •• ••
31
2
1
0

• •
• • • • •• •
• • •
• • • •
••
• • •

• ••
• •

• •
• • •


3

••

0 20 40 60 80 100 120

Thời gian

> win.graph (width = 4.875, height = 3, pointsize = 8)> data


(ma1.2.s); plot (ma1.2.s, ylab = expression (Y [t]), type = 'o')

Tự tương quan trễ 1 thậm chí còn rõ ràng hơn trong Phụ lục 4.3, biểu đồ Yt ver
sus Yt- 1. Lưu ý xu hướng tăng mạnh vừa phải trong biểu đồ này.

Biểu đồ 4.3 Biểu đồ Yt so với Yt – 1 cho chuỗi MA (1) trong Phụ lục 4.2

3
2
• •
• •
• • •
•• • • • •
• • • •• •• •
• • • • •

••

••
• • •

• ••
• •
• •• •• ••


Yt
• • • • • • • •
•• •
• • • • ••

• •

•• • •

•• • •


• •
• •


• ••• •••


••
• •• • •

• •
• • •


••


• • •
• •
13
0 1
2



3 2 1 0 1 2 3

Yt-1

> win.graph (width = 3, height = 3, pointsize = 8)> plot (y =


ma1.2.s, x = zlag (ma1.2.s), ylab = expression (Y [t]), xlab = biểu thức (Y [t-1]),
type = 'p')
Machine Translated by Google

60 Mô hình cho chuỗi thời gian tĩnh

Biểu đồ của tự tương quan - 2 trong Hình 4.4 đưa ra một hình dung rõ ràng về số không
Yt so với Yt ở độ trễ 2 cho mô hình này.

Biểu đồ 4.4 Biểu đồ Yt so với Yt – 2 cho chuỗi MA (1) trong Phụ lục 4.2

• • •

••
• •• ••

• • • •
• • • •• •
• • • • • •


Yt •
• • •

• •
•• ••
• •

• •• • • •
• •
• •• • • • •

• • • •
• • ••
• ••


• •
• •

••
• • • •

••• •
• •• •• • •
• ••


• •
• •
• •

• •• •
33
2
1
0 1
2
• • • •

• ••

• •

3 2 1 0 1 2 3

Yt 2

> plot (y = ma1.2.s, x = zlag (ma1.2.s, 2), ylab = expression (Y [t]),


xlab = expression (Y [t-2]), type = 'p ')

Một loạt hơi khác được trình bày trong Phụ lục 4.5. Đây là chuỗi MA (1) được mô phỏng

với θ = +0,9. Nhớ lại từ Hình 4.1 rằng ρ1 = 0,497 cho mô hình này; do đó có mối tương quan
âm mạnh vừa phải ở độ trễ 1. Mối tương quan này có thể được nhìn thấy trong biểu đồ của
chuỗi vì các quan sát liên tiếp có xu hướng nằm ở phía đối diện của giá trị trung bình bằng
0. Nếu một quan sát nằm trên mức trung bình của chuỗi, thì quan sát tiếp theo có xu hướng ở

dưới mức trung bình. Cốt truyện khá lộn xộn theo thời gian — đặc biệt là khi được so sánh
với cốt truyện trong Phụ lục 4.2.
Machine Translated by Google

4.2 Các quá trình trung bình động 61

Hình 4.5 Biểu đồ thời gian của một quy trình MA (1) với θ = +0,9

• • •
2
•• • • • • •• •
•• • • • • • •
• • •• • • • • • • •• • ••
• •
• • •

• • • •• •• • • •• • • •

• • • ••
0 • • • • •
Yt
•• • • • •


• •••• •
• • •


• • • •
• •

••
• •
•• • •
• • • •
••


• •
• •• • • • •


2
4 •

0 20 40 60 80 100 120

Thời gian

> win.graph (width = 4.875, height = 3, pointsize = 8)> data


(ma1.1.s)> plot (ma1.1.s, ylab = expression (Y [t]), type = 'o' )

Độ trễ âm 1 tự tương quan thậm chí còn rõ ràng hơn trong biểu đồ độ trễ của Hình
4.6.

Biểu đồ 4.6 Biểu đồ Yt so với Yt – 1 cho chuỗi MA (1) trong Phụ lục 4.5

• • •

2 • •

•• • • •

• • •
• • • •

• • •


•• • • •
• • • •
• • • • • • • •
• •
• •
• • •••
• • •••

• •

• ••• •• • •
• • • • • • • • • • • • •
• • • • • • • • • • • •


• • • • • •
0 • • •

Yt • • •


• • ••
• •• • ••


• • •



• • • ••
• ••
••


• •

• •
••
2
• •


• •

4 •

4 2 0 2

Yt-1

> win.graph (width = 3, height = 3, pointsize = 8)> plot (y =


ma1.1.s, x = zlag (ma1.1.s), ylab = expression (Y [t]), xlab = biểu thức (Y [t-1]),
type = 'p')
Machine Translated by Google

62 Mô hình cho chuỗi thời gian tĩnh

Biểu đồ của Yt so với Yt


- 2 trong Hình 4.7 hiển thị tự tương quan 0 ở độ trễ 2
cho mô hình này.

Hình 4.7 Đồ thị của Yt so với Yt-2 cho chuỗi MA (1) trong Hình 4.5

•••
•••• • •
• • • ••••• •
2
• • ••••••
• •••••• •• •• ••
•••• •
0 •
• •• • • •••••• ••• • • • • •

• •• • ••••
• •

• •
Yt

•• ••••• •• ••
• • ••
• • •••• •• • •

•• •
2

• ••


4

4 2 0 2

Yt 2

> plot (y = ma1.1.s, x = zlag (ma1.1.s, 2), ylab = expression (Y [t]),


xlab = expression (Y [t-2]), type = 'p ')

Các quy trình MA (1) không có tự tương quan ngoài độ trễ 1, nhưng bằng cách tăng thứ tự
của quá trình, chúng ta có thể thu được các mối tương quan bậc cao hơn.

Quy trình trung bình trượt bậc hai

Hãy xem xét quá trình trung bình động của bậc 2:

= θ1et
Yt et
-
1–
-
θ2et 2–

Nơi đây

2 2
= = - - =
(
γ0 Var Yt () Var et θ1et 1– θ2et 2– ) (1 2θ1+ + θ2 ) σe

( γ1= Cov Yt Yt = - - - -
, 1– ) Cov (
et θ1et 1– θ2et 2–, et 1– θ1et 2– θ2et 3– )

= Cov –θ1et
( , 1– ) + Cov (
1– et
- -
, θ2et 2– )
θ1et 2–
2
= + ( θ1 ()-])
[ θ1 - θ2 - σe
2
= + θ1θ2 ) σ e
( θ1 -


Machine Translated by Google

4.2 Các quá trình trung bình động 63

= 2– ( () ,
γ2 Cov = - - - -
Yt Yt ( θ1et 1–
Cov et θ2et 2–, et 2– θ1et 3– θ2et 4– )

= -
,)
Cov θ2et 2– và 2–

- =
2
θ2σe

Do đó, đối với quy trình MA (2),

θ1 - θ1θ2 +
ρ1 = ----------------------------
2
1 2θ1+ + θ2

θ2 - (4.2.3)
ρ2 = ---------------------------
2
1 2θ1+ + θ2

ρk = 0 đối với k = 3, 4, ...

Yt = et et 1– + 0,6et 2– , chúng
- ta có
Đối với trường hợp cụ thể

- 1 () –0,6 –1,6
1 + ()
ρ1 = = ---------- 0,678 = -
--------------------------------------------

2,36
1 +
1 ( ) 2 +() –0,6 2


0,6
ρ2 = = ---------- 0,254
2,36

Biểu đồ thời gian mô phỏng quá trình MA (2) này được thể hiện trong Hình 4.8. Các
chuỗi có xu hướng di chuyển qua lại trên giá trị trung bình trong một đơn vị thời gian. Điều này phản ánh

tự tương quan âm khá mạnh ở độ trễ 1.

Hình 4.8 Đồ thị thời gian của một quá trình MA (2) với θ1 = 1 và θ2 = 0,6

4

• ••
• •
• • •• • •
• •• • •
• • • • • • •••••• •
2
• ••• •••• •••• •• ••• •
0
• • • •• •• • ••• •• •••• • • • ••• •
• • • • •• • • • • ••••
Yt

••

• •
••• ••• ••
•• •
• • • • • • •
• • • • •••
2
• •
4 • •
0 20 40 60 80 100 120

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> data (ma2.s); plot (ma2.s, ylab = expression (Y [t]), type = 'o')
Machine Translated by Google

64 Mô hình cho chuỗi thời gian tĩnh

Cốt truyện trong Hình 4.9 phản ánh sự tự tương quan âm khá đáng kể.

Biểu đồ 4.9 Đồ thị của Yt so với Yt – 1 cho chuỗi MA (2) trong Phụ lục 4.8
4

•• • •
• •

2 • • •

• • • •

• • •• • •



• ••

• • • • • • • •
• • • • •
• •


• • •• ••
• • • •
• •
0 • • • •
• • • ••
• •
• •


Yt • •


••


• ••
• • • •

• •• •• • • •

• •
• •
• • ••

2 • •• • • ••
• • •

• • • •
••
• •

4 •
4 2 0 2 4

Yt-1

> win.graph (width = 3, height = 3, pointsize = 8)> plot (y =


ma2.s, x = zlag (ma2.s), ylab = expression (Y [t]),
xlab = biểu thức (Y [t-1]), type = 'p')

Tự tương quan dương yếu ở độ trễ 2 được hiển thị trong Hình 4.10.

Hình 4.10 Đồ thị của Yt so với Yt – 2 cho chuỗi MA (2) trong Hình 4.8
4

• •
• •


• ••

••

2 • •




• •• ••
• •

• ••
• •


• •
• •• •
• • • • • ••• •

•• •
• •
• •


0 •• • • • • • •
• •

Yt • • • • •

• • •
• • • •


• • • •

• • • • •


•• •

•• • • •
• •
• •

• •
• •• •

• •
2

• • • • •

4 •
4 2 0 2 4

Yt 2

> plot (y = ma2.s, x = zlag (ma2.s, 2), ylab = expression (Y [t]),


xlab = biểu thức (Y [t-2]), type = 'p')
Machine Translated by Google

4.2 Các quá trình trung bình động 65

Cuối cùng, việc thiếu tự tương quan ở độ trễ 3 là rõ ràng từ biểu đồ phân tán trong
Hình 4.11.

Biểu đồ 4.11 Biểu đồ của Yt so với Yt – 3 cho chuỗi MA (2) trong Phụ lục 4.8
4
••• •
• • •
• •• • •
••
• • •• • • • •• •
2
•• • • •••• •••• •
•• ••
••••• •• •• • •• •• •
• •

••
0
••• •
•• •

••
Yt

•• •
• •

• •• ••• •• •• •

•••• •• ••• • • •

••
• •
2

• •• ••
• •
4

4 2 0 2 4

Yt-3

> plot (y = ma2.s, x = zlag (ma2.s, 3), ylab = expression (Y [t]),


xlab = biểu thức (Y [t-3]), type = 'p')

Quy trình MA (q) Chung


= θ1et 1– - - ––
… Qet q - ,
Đối với quy trình MA (q) chung Yt et calcu tương tự
θ2et 2–
lation cho thấy rằng

= 2 2 2 2
γ0 (1 )θ1++++ θ2σe … Θq (4.2.4)

θk -
+ θ1θk 1++ θ2θk
++ 2+ … Θq k - θq
-------------------------------------------------- ------------------------------------------------

2 2 2 cho k = 1, 2, ..., q
=
ρk 1 ++++
θ1 θ2 … Θq (4.2.5)

0 cho kq >

trong đó tử số của ρq chỉ là θq. Chức năng tự tương quan "ngắt" sau độ trễ
q; nghĩa là, nó bằng không. Hình dạng của nó có thể là gần như bất cứ thứ gì đối với các độ trễ trước đó. Một loại khác của

process, quá trình tự hồi quy, cung cấp các mô hình cho các con nhạn biển tự tương quan
thay thế.
Machine Translated by Google

66 Mô hình cho chuỗi thời gian tĩnh

4.3 Quy trình tự động phục hồi

Các quy trình tự phục hồi giống như tên gọi của chúng - tự hồi quy. Cụ thể, một quy
trình tự động hồi quy bậc p {Yt } thỏa mãn phương trình

= + ++ + (4.3.1)
Yt φ1Yt 1– φ2Yt 2– … PYt p - et

Giá trị hiện tại của chuỗi Yt là sự kết hợp tuyến tính của p giá trị trong quá khứ gần đây nhất
của chính nó cộng với thuật ngữ “đổi mới” và kết hợp mọi thứ mới trong loạt phim tại
thời gian t mà không được giải thích bởi các giá trị trong quá khứ. Do đó, với mọi t, chúng ta giả sử rằng et là

không phụ thuộc vào Yt - 1, Yt - 2, Yt - 3, .... Yule (1926) thực hiện công việc gốc trên
các quy trình tự phục hồi. †

Quy trình tự động khôi phục đơn hàng đầu tiên

Một lần nữa, cần phải xem xét chi tiết mô hình bậc nhất, viết tắt là AR (1).
Giả sử chuỗi là đứng yên và thỏa mãn

Yt φYt 1– et + = (4.3.2)

trong đó chúng tôi đã loại bỏ chỉ số phụ 1 từ hệ số φ để đơn giản hóa. Như thường lệ, trong
những chương đầu tiên này, chúng tôi giả định rằng trung bình của quá trình đã được trừ đi để
giá trị trung bình của chuỗi là 0. Các điều kiện về tính ổn định sẽ được xem xét ở phần sau.

Đầu tiên chúng ta lấy phương sai của cả hai vế của Phương trình (4.3.2) và thu được

+ =
2
γ0 φ2γ0 σe

Giải quyết cho lợi suất γ0


2
σe
γ0
= --------------
(4.3.3)
1 φ2

Lưu ý hàm ý ngay lập tức rằng - φ2 <1 hoặc φ <1 . Bây giờ lấy phương trình
cái đó (4.3.2), nhân cả hai vế với Yt - k (k = 1, 2, ...) và nhận các giá trị mong đợi

=
k -φE Yt k - Yt(1– + (
E Yt () ) E et Yt k - )

hoặc

γk φγk
= ()1– + E et Yt k -

Vì chuỗi được giả định là đứng yên với giá trị trung bình bằng 0, và vì et là vết lõm sâu của

Yt - k, chúng tôi thu được


= = 0
E ((
et Yt k -) E et ( ) E Yt k - )

và vì thế

† Nhớ lại rằng chúng ta đang giả định rằng Yt không có giá trị trung bình. Chúng tôi luôn có thể giới thiệu một nonzero

nghĩa là bằng cách thay thế Yt bởi Yt - μ trong các phương trình của chúng ta.
Machine Translated by Google

4.3 Quy trình tự động phục hồi 67

= cho k = 1, 2, 3, ... (4.3.4)


γk φγk 1–

2
Đặt k = 1, ta được γ1 φγ0 φσe= = () 1-.Với
φ2 ⁄ k = 2, chúng ta thu được γ2 =
φ2σe 2()1 -φ2 ⁄ . Bây giờ có thể dễ dàng nhận thấy rằng nhìn chung

2
σe
= --------------
γk φk 1 (4.3.5)
φ2 -

và như vậy

= γk (4.3.6)
ρk ---- φk cho k = 1, 2, 3, ...
γ0

Vì độ lớn
φ <1của, hàm tự tương quan giảm theo cấp số nhân
khi số độ trễ, k, tăng lên. Nếu tất cả các0 mối 1 , quan là tích cực; nếu
<<φ tương
–1 <<φ 0 , tự tương quan trễ 1 là âm (ρ1 = φ) và các dấu hiệu liên tiếp
tự tương quan thay thế từ tích cực sang tiêu cực, với độ lớn của chúng giảm dần
nhanh chóng. Các phần của đồ thị của một số hàm tự tương quan được hiển thị
trong Hình 4.12.

Hình 4.12 Các chức năng tự tương quan cho một số mô hình AR (1)


• φ = 0,9
• • φ = 0,4
ρk
• • ρk
• •
• • •
• •

0,8
0,4
0,0 0,8
0,4
0,0
• • • • • • • • • • •

2 4 6 8 10 12 2 4 6 8 10 12

Lỗi Lỗi

1,0 1,0

• φ = 0,8 φ = 0,5

• • •
• • • • •
ρk 0,0
ρk 0,0

• • • • • • • • • •

• •
1,0
• 1,0

2 4 6 8 10 12 2 4 6 8 10 12

Lỗi Lỗi

Lưu ý rằng đối với φ gần ± 1 , sự phân rã theo cấp số nhân khá chậm (ví dụ: (0,9) 6 =
0,53), nhưng đối với φ nhỏ hơn, sự phân rã khá nhanh (ví dụ, (0,4) 6 = 0,00410). Với φ
ở gần ± 1 , mối tương quan mạnh mẽ sẽ kéo dài qua nhiều độ trễ và tạo ra một
Machine Translated by Google

68 Mô hình cho chuỗi thời gian tĩnh

chuỗi trơn nếu φ là dương và một chuỗi rất răng cưa nếu φ là âm.

Hình 4.13 hiển thị biểu đồ thời gian của một quy trình AR (1) được mô phỏng với φ = 0,9.

Lưu ý rằng chuỗi số này không thường xuyên vượt qua trung bình lý thuyết của nó như thế nào. Có rất nhiều

quán tính trong chuỗi — nó gắn liền với nhau, vẫn ở cùng phía của giá trị trung bình cho

thời gian kéo dài. Một người quan sát có thể khẳng định rằng loạt bài này có một số xu hướng. Chúng tôi biết

rằng trên thực tế, giá trị trung bình lý thuyết là 0 cho mọi thời điểm. Ảo tưởng về xu hướng là do

đến tự tương quan mạnh của các giá trị lân cận của chuỗi.

Hình 4.13 Biểu đồ thời gian của một chuỗi AR (1) với φ = 0,9

• •• •
• • •

4
• •• • •
• • •

• • • • •• •

2
• • •
• • •• • ••
• •
Yt • •

• • •
•• •
• •

0

• • •
• • •• • •
2 •
• • •
0 10 20 30 40 50 60

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> data (ar1.s); plot (ar1.s, ylab = expression (Y [t]), type = 'o')

Sự mượt mà của chuỗi và tự tương quan mạnh ở độ trễ 1 được mô tả trong

biểu đồ độ trễ được hiển thị trong Hình 4.14.


Machine Translated by Google

4.3 Quy trình tự động phục hồi 69

Hình 4.14 Biểu đồ của Yt so với Yt - 1 cho AR (1) Chuỗi của Phụ lục 4.13

•• • •
••
• •
4
•• • ••• ••
•• •

• •

•• •
2 •• •• •• ••
• ••
Yt

•• ••• • • •


0
• •••

• •
• ••
2 •• •
2 0 2 4

Yt-1

> win.graph (chiều rộng = 3, chiều cao = 3, kích thước điểm = 8)


> plot (y = ar1.s, x = zlag (ar1.s), ylab = expression (Y [t]),
xlab = biểu thức (Y [t-1]), type = 'p')

Mô hình AR (1) này cũng có tự tương quan dương mạnh mẽ ở độ trễ 2, cụ thể là ρ2 =
(0,9) 2 = 0,81. Hình 4.15 cho thấy điều này khá tốt.

Hình 4.15 Biểu đồ của Yt so với Yt - 2 cho chuỗi AR (1) của Phụ lục 4.13

• •• •
•• •
• • •
4
• ••

• • • • • •
• •
• ••
2 •• • •

• •

Yt

• • •
• • •• ••

0
•••


• •

• •
2
• •
2 0 2 4

Yt 2

> plot (y = ar1.s, x = zlag (ar1.s, 2), ylab = expression (Y [t]),


xlab = biểu thức (Y [t-2]), type = 'p')
Machine Translated by Google

70 Mô hình cho chuỗi thời gian tĩnh

Cuối cùng, ở độ trễ 3, tự tương quan vẫn còn khá cao: ρ3 = (0,9) 3 = 0,729. Triển lãm
4.16 xác nhận điều này cho loạt bài cụ thể này.

Biểu đồ 4.16 Biểu đồ của Yt so với Yt - 3 cho chuỗi AR (1) của Phụ lục 4.13

• •• •
• • •
• • • •••• • • • •
4
•••

• •
• • • ••
2
• • • •
• •

• •
Yt


•• • •
••

0
• • •
• •••
• • •
2 •
2 0 2 4

Yt-3

> plot (y = ar1.s, x = zlag (ar1.s, 3), ylab = expression (Y [t]),


xlab = biểu thức (Y [t-3]), type = 'p')

Phiên bản quy trình tuyến tính chung của mô hình AR (1)

Định nghĩa đệ quy của quá trình AR (1) được đưa ra trong Công thức (4.3.2) là cực kỳ
hữu ích cho việc giải thích mô hình. Đối với các mục đích khác, thật thuận tiện để thể hiện
Mô hình AR (1) như một quá trình tuyến tính tổng quát như trong Công thức (4.1.1). Định nghĩa đệ quy

có giá trị cho mọi t. Nếu chúng ta sử dụng phương trình này với t được thay thế bởi t 1, chúng
=

ta nhận
+
được Yt 1– φYt 2– et 1– . Thay thế điều này vào biểu thức ban đầu cho

= + + et
Yt (φ φYt 2– et 1– )

= +et φet 1– φ2Yt


+ 2–

Nếu chúng ta lặp lại sự thay thế này trong quá khứ, nói k - 1 lần, chúng ta nhận được

= +
Yt et φet 1– φ2et 2–
+ ++ +
… Φk 1– et k - 1 + φkYt k - (4.3.7)

Giả sử φ <1 và để k tăng mà không bị ràng buộc, điều đó có vẻ hợp lý (đây là


gần như là một bằng chứng chặt chẽ) rằng chúng ta sẽ có được biểu diễn chuỗi vô hạn

= ++ + φ3e t 3– +
… (4.3.8)
Yt et φet 1– φ2et 2–
Machine Translated by Google

4.3 Quy trình tự động phục hồi 71

= ,
Đây là dạng của quá trình tuyến tính tổng quát của Phương trình (4.1.1) mà ψj φ j
chúng ta đã nghiên cứu trong Phần 4.1 trên trang 55. Lưu ý rằng biểu diễn này
nhấn mạnh lại sự cần thiết của hạn chế φ <1 .

Tính ổn định của một quy trình AR (1)

Có thể chỉ ra rằng, tùy thuộc vào hạn chế mà không phụ thuộc vào Yt - 1 , Yt - 2,
và rằng 2 > 0
Yt - 3,… σe Yt ,φYt
nghiệm của+ AR
1– et = (1) xác định đệ quy φ <1
sẽ đứng yên nếu và chỉ khi φ <1 . Yêu cầu thường được gọi là
điều kiện ổn định cho quá trình AR (1) (Xem Box, Jenkins và Reinsel, 1994,
P. 54; Nelson, 1973, tr. 39; và Wei, 2005, tr. 32) mặc dù nhiều hơn sự cố định là
có liên quan. Đặc biệt xem các Bài tập 4.16, 4.18 và 4.25.
Tại thời điểm này, chúng ta cần lưu ý rằng hàm tự tương quan cho quá trình AR (1)
đã được bắt nguồn theo hai cách khác nhau. Phương pháp đầu tiên sử dụng quy trình tuyến tính chung

biểu diễn dẫn đến phương trình (4.1.3). Phương pháp thứ hai sử dụng định nghĩa
đệ quy và khai triển
Yt φYt 1– các
et +phương
= trình (4.3.4), (4.3.5), và
(4.3.6). Đạo hàm thứ ba thu được bằng cách nhân cả hai vế của Phương trình (4.3.7) với
- k, lấy các giá trị mong đợi của cả hai bên và sử dụng thực tế là et , et - 1, et - 2, ...,
Yt -độc
et (k -lập với Yt - k. Phương pháp thứ hai cần được đặc biệt lưu ý vì
1) nó sẽ tổng quát hóa độc đáo cho các quy trình bậc cao hơn.

Quy trình tự động phục hồi bậc hai

Bây giờ hãy coi bộ truyện thỏa mãn

= + 2– et + (4.3.9)
Yt φ1Yt 1– φ2Yt

trong đó, như thường lệ, chúng tôi giả định rằng et độc lập với Yt - 1, Yt - 2, Yt - 3, ... Để thảo luận

sự cố định, chúng tôi giới thiệu đa thức đặc trưng AR

φ () x 1 φ1 - x φ2x2 - =

và phương trình đặc tính AR tương ứng

0 =
1 φ1 - x φ2x2 -

Chúng ta nhớ lại rằng một phương trình bậc hai luôn có hai nghiệm (có thể phức).

Tính ổn định của Quy trình AR (2)

Có thể chỉ ra rằng, với điều kiện et độc lập với Yt - 1, Yt - 2,


Yt - 3, ..., một nghiệm tĩnh cho Phương trình (4.3.9) tồn tại nếu và chỉ khi gốc của AR
phương trình đặc trưng vượt quá 1 về giá trị tuyệt đối (môđun). Đôi khi chúng tôi nói rằng
gốc nên nằm ngoài đường tròn đơn vị trong mặt phẳng phức. Câu lệnh này sẽ tổng quát hóa
trường hợp bậc p mà không thay đổi. †

† Nó cũng áp dụng trong trường hợp bậc nhất, trong đó phương trình đặc tính AR chỉ là 1 - φx = 0
với căn 1 / φ, vượt quá 1 về giá trị tuyệt đối nếu và chỉ khi φ <1 .
Machine Translated by Google

72 Mô hình cho chuỗi thời gian tĩnh

Trong trường hợp bậc hai, nghiệm nguyên của phương trình đặc tính bậc hai dễ dàng
được tìm thấy là

±
φ1 φ12 + 4φ2
-------------------------------------
(4,3.10)
2φ2 -

Đối với tính cố định, chúng tôi yêu cầu các gốc này vượt quá 1 về giá trị tuyệt đối. Trong phụ lục

B, trang 84, chúng tôi chứng minh rằng điều này sẽ đúng nếu và chỉ khi ba điều kiện được thỏa mãn:

nd (4.3.11)
φ1 φ2 + <1, φ2 φ1 - <1, φ2 <1 một

Như với mô hình AR (1), chúng tôi gọi đây là các điều kiện cố định cho AR (2)

người mẫu. Vùng cố định này được hiển thị trong Phụ lục 4.17.

Hình 4.17 Vùng tham số trạng thái cho quy trình AR (2)
1,0

0,5 2 0 =
φ1 4φ2 +
rễ thật

φ2 0,0

rễ phức tạp

0,5
1,0

2 1 0 1 2

φ1

Chức năng tự tương quan cho quy trình AR (2)

Để lấy được hàm tự tương quan cho trường hợp AR (2), chúng ta sử dụng phép đệ quy xác định
mối quan hệ của phương trình (4.3.9), nhân cả hai vế với Yt - k và lấy kỳ vọng.

Giả sử tính đứng yên, không có nghĩa là và et đó độc lập với Yt - k, chúng ta nhận được

= + f hoặc k = 1, 2, 3, ... (4.3.12)


γk φ1γk 1– φ2γk 2–

hoặc, chia cho γ0,

=
ρk φ1ρk 1– φ2ρk+ 2– cho k = 1, 2, 3, ... (4.3.13)

Phương trình (4.3.12) và / hoặc (4.3.13) thường được gọi là phương trình Yule-Walker, đặc biệt là

tập hai phương trình thu được đối với k = 1 và 2. Đặt k = 1 và sử dụng ρ0 = 1
và ρ 1 = ρ1, ta nhận được ρ1 φ1 φ2ρ1 + = và vì thế
Machine Translated by Google

4.3 Quy trình tự động phục hồi 73

φ1
= --------------
ρ1 (4.3.14)
1 φ2 -

Sử dụng các giá trị hiện đã biết cho ρ1 (và ρ0), Công thức (4.3.13) có thể được sử dụng với k = 2 để
được

ρ2 φ1ρ1 φ2ρ0 + =

+ 2 (4.3.15)
φ2 1 φ2 () φ - 1
= -------------------------------------

1 φ2 -

Các giá trị kế tiếp của ρk có thể dễ dàng được tính bằng số từ quan hệ tương đối
đệ quy của Công thức (4.3.13).
Mặc dù Công thức (4.3.13) rất hiệu quả để tính toán các giá trị tự tương quan
về mặt số từ các giá trị đã cho của φ1 và φ2, cho các mục đích khác, điều mong muốn là có
công thức rõ ràng hơn cho ρk. Hình thức của giải pháp rõ ràng phụ thuộc rất nhiều vào

nghiệm của phương trình đặc trưng 0 = 1 φ1 - x φ2x2 - . Biểu thị những người có đi có lại

những gốc này bởi G1 và G2, nó được trình bày trong Phụ lục B, trang 84,

2 2
=
φ1 4φ2
φ1 + - φ1 φ1
4φ2 ++
-------------------------------------
a nd
G1 G2
= -------------------------------------

2 2

Đối với trường hợp G1 G2, có thể cho thấy rằng chúng ta có

2 - 2 k 1+
( 1 )G2- G1 k 1+ 1( G1
) - G2
cho k ≥ 0
ρk (4.3.16)
= ------------------------------------------------- ----------------------------

( G1 +
G2 ) -
1 G1G2 ()

2
Nếu các gốc phức tạp (nghĩa là, nếu φ1 4φ2 + 0 < ), thì ρk có thể được viết lại thành

) Θk + Φ
= ------------------------------ cho k ≥ 0
ρk Rk sin ( (4.3.17)
sin () Φ

trong R = () Φ
đó φ2 - = và Θ và Φ được xác định bởi = ⁄ (cos ()
và Θ φ1 2 φ2 ) -
rám nắng

[1
- ⁄φ2
φ2()
(1 ) + ].
2
Để hoàn chỉnh, chúng ta lưu ý rằng nếu các gốc bằng nhau ( φ1 4φ2 + 0 = ), sau đó chúng tôi có

k
1 + φ2 φ1
=
ρk k
1 + --------------
----- 2
cho k = 0, 1, 2, ... (4.3.18)
1 φ2 -

Một cuộc thảo luận tốt về nguồn gốc của các công thức này có thể được tìm thấy trong Fuller (1996,
Mục 2.5).

Các chi tiết cụ thể của các công thức này ít quan trọng đối với chúng tôi. Chúng tôi chỉ cần
lưu ý rằng hàm tự tương quan có thể giả định rất nhiều hình dạng. Trong tất cả trường hợp,
độ lớn của ρk chết nhanh theo cấp số nhân khi độ trễ k tăng lên. Trong trường hợp gốc
com plex, ρk hiển thị hành vi sóng hình sin giảm xóc với hệ số giảm chấn R, 0 R <≤ 1 ,

tần số Θ và pha Φ. Minh họa về các hình dạng có thể được đưa ra trong Phần trình bày
4.18. (Hàm R ARMAacf được thảo luận trên trang 450 rất hữu ích cho việc vẽ biểu đồ.)
Machine Translated by Google

74 Mô hình cho chuỗi thời gian tĩnh

Hình 4.18 Các chức năng tự tương quan cho một số mô hình AR (2)

φ1 = 0,5, φ2 = 0,25 φ1 = 1,0, φ2 = 0,25


ρk ρk •

• •

• •
• •
0,8
0,4
0,0
• •
0,8
0,4
0,0

• • • • • •
• • • • • •

2 4 6 8 10 12 2 4 6 8 10 12

Lỗi Lỗi

• φ1 = 1,5, φ2 = 0,75 φ1 = 1,0, φ2 = 0,6




ρk ρk

• • •
• • • • • • • • •
• •
0,5
1,0
0,5
0,0 • • 0,5
1,0
0,5
0,0

• • • • •

2 4 6 8 10 12 2 4 6 8 10 12

Lỗi Lỗi

Hình 4.19 hiển thị biểu đồ thời gian của một chuỗi AR (2) được mô phỏng với φ1 =
1,5 và φ2 = 0,75. Hành vi tuần hoàn của ρk được thể hiện trong Hình 4.18 được phản
ánh rõ ràng trong hành vi gần như tuần hoàn của chuỗi với cùng chu kỳ 360/30 = 12 đơn
vị thời gian. Nếu Θ được đo bằng radian, 2π / Θ đôi khi được gọi là bán kỳ của AR (2) pro
thuế.

Hình 4.19 Đồ thị thời gian của một chuỗi AR (2) với φ1 = 1,5 và φ2 = 0,75

••
••

• •


•••
••• ••

• •• • • •• •••

• • • •• • • ••• •
Yt ••

• • • ••

• • • • • •• • •
••

• • •
• •
• • • • • •
••

• • • •

••
• • •
•• • •
•• • •
••
• •
• • •
64
4
2
0 2
• •••
• •

• •
• •
• •
•• • • ••
•• • •

0 20 40 60 80 100 120

Thời gian

> win.graph (width = 4.875, height = 3, pointsize = 8)> data


(ar2.s); plot (ar2.s, ylab = expression (Y [t]), type = 'o')
Machine Translated by Google

4.3 Quy trình tự động phục hồi 75

Phương sai cho Mô hình AR (2)

Phương sai quá trình γ0 có thể được biểu thị theo các tham số mô hình φ1, φ2, và
2
σe như sau: Lấy phương sai của cả hai vế của Phương trình (4.3.9) cho kết quả

2 2 2
γ0 = ( φ1 γ + 0 +2φ1φ2γ1 σe +
) φ2 (4.3.19)

Đặt k = 1 trong Công thức (4.3.12) đưa ra phương trình tuyến tính thứ hai cho γ0 và γ1 ,

γ1 φ1γ0 φ2γ1 + = , có thể được giải quyết đồng thời với Công thức (4.3.19) để
được
2
) σ( - e
1 φ2
γ0 = ------------------------------------------------- ------------------------
2 2 2
- -
1 φ2
() - (1 φ1 ) φ2
- 2φ2φ1

2 (4,3,20)
1 φ2 - σe
= ---------------------------------
2 2
-------------- -
1 φ2 + 1 φ2 () - φ1

Hệ số ψ cho Mô hình AR (2)

Hệ số ψ trong biểu diễn quy trình tuyến tính tổng quát cho chuỗi AR (2) là
phức tạp hơn so với trường hợp AR (1). Tuy nhiên, chúng ta có thể thay thế tuyến tính chung
biểu diễn quy trình sử dụng Công thức (4.1.1) cho Yt, cho Yt - 1 và cho Yt - 2 thành
Mối =quan hệ Yt + +
φ1Yt 1– φ2Yt .
Nếu sau đó chúng ta cân bằng các hệ số của ej, chúng ta nhận được đệ quy
2– et

ψ0 1 =

ψ1 φ1ψ0 - 0 = (4.3.21)
- - = 0 cho
ψj φ1ψj 1– φ2ψj 2– j = 2, 3, ...
2
Chúng có thể được giải một cách đệ quy để thu được ψ0 = 1, ψ1 = φ1, ψ2
φ2φ1+ = , và như thế.
Các mối quan hệ này cung cấp các giải pháp số tuyệt vời cho các hệ số ψ cho
các giá trị số đã cho của φ1 và φ2.
Người ta cũng có thể chỉ ra rằng, đối với G1 G2, một giải pháp rõ ràng là

j 1+ - j 1+
G1 G2
ψj
= ---------------------------------
(4.3.22)
G1 G2 -

trong đó, như trước đây, G1 và G2 là nghịch đảo của các gốc của đặc tính AR
phương trình. Nếu các gốc phức tạp, Phương trình (4.3.22) có thể được viết lại thành

j sin [() Θ j 1+
= ]
---------------------------------
(4.3.23)
ψj R

sin () Θ

một sóng sin giảm chấn với cùng hệ số tắt dần R và tần số Θ như trong phương trình
(4.3.17) cho hàm tự tương quan.
Để hoàn chỉnh, chúng ta lưu ý rằng nếu các rễ bằng nhau thì

= 1 (4.3.24)
j ψj () φ 1 + j
Machine Translated by Google

76 Mô hình cho chuỗi thời gian tĩnh

Quy trình Tự động Phục hồi Chung

Bây giờ hãy xem xét mô hình hồi quy tự động bậc p

=
Yt φ1Yt 1– φ2Yt+ 2–
++ + et (4.3.25)
… PYt p -

với đa thức đặc trưng AR

x =- φ φ1
φ2x2 () -1 x-… φpxp
-
(4.3.26)

và phương trình đặc tính AR tương ứng

1 φ1 - x φ2x2 - -… φpxp - 0 = (4.3.27)

Như đã lưu ý trước đó, giả sử rằng et độc lập với Yt - 1, Yt - 2, Yt - 3, ... một
giải pháp trạm cho Phương trình (4.3.27) tồn tại nếu và chỉ khi gốc p của đặc trưng AR
mỗi phương trình vượt quá 1 giá trị tuyệt đối (môđun). Các mối quan hệ khác giữa các
căn và hệ số đa danh có thể được sử dụng để chỉ ra rằng hai bất đẳng thức sau
là cần thiết cho sự cố định. Nghĩa là, đối với các gốc lớn hơn 1 trong môđun, nó là
cần thiết, nhưng không đủ, cả hai

φ1 φ2 … φp +++ 1 <
(4.3.28)

φp <1

Giả sử tính đứng yên và bằng không, chúng ta có thể nhân Phương trình (4.3.25) với Yt - k,
lấy kỳ vọng, chia cho γ0 và nhận được mối quan hệ đệ quy quan trọng

=
ρk φ1ρk 1– φ2ρk +2– φ3ρk 3–+ ++ cho k ≥ 1 (4.3.29)
… Φpρk p -

Đưa k = 1, 2, ... và p vào Công thức (4.3.29) và sử dụng ρ0 = 1 và ρ k = ρk, chúng ta nhận được
các phương trình Yule-Walker tổng quát

ρ1 = + + ++
φ1 φ2ρ1 φ3ρ2 … φpρp 1– ρ2
= ++ ++
φ1ρ1 φ2 φ3ρ1 … φpρp 2–
. (4,3,30)
.
.
= +
ρp φ1ρp 1– φ2ρp 2– φ3ρp 3– … φp + ++

Đã cho các giá trị số cho φ1, φ2, ..., φp, các phương trình tuyến tính này có thể được giải thành

lấy các giá trị số cho ρ1, ρ2, ..., ρp. Sau đó, Công thức (4.3.29) có thể được sử dụng để lấy
các giá trị số cho ρk tại bất kỳ số độ trễ cao hơn nào.
Cần lưu ý rằng

= = 2 = 2
E et Yt ([ (
) E et φ1Yt 1– +φ2Yt
++ + 2–
… PYt p - et )] E ()
et σe

chúng ta có thể nhân Phương trình (4.3.25) với Yt , lấy các kỳ vọng và tìm

= 2
+ ++ +
γ0 φ1γ1 φ2γ2 … pγp σe
Machine Translated by Google

4.4 Mô hình trung bình trượt tự động hồi phục hỗn hợp 77

mà, sử dụng ρk = γk / γ0, có thể được viết là

2
σe
γ0
= ------------------------------------------------- -------------------
(4.3.31)
-
1 φ1ρ1 - φ2ρ2 - … Φpρp -
2
và thể hiện phương sai quá trình γ0 theo các tham số, φ1,
σe φ2, ..., φp, và
các giá trị hiện đã biết của ρ1, ρ2, ..., ρp. Tất nhiên, các giải pháp rõ ràng cho ρk về cơ bản là
không thể trong tính tổng quát này, nhưng chúng ta có thể nói rằng ρk sẽ là một tổ hợp tuyến tính của
Các số hạng phân rã theo cấp số nhân (tương ứng với các căn thực của phương trình đẳng tích
đặc trưng) và các số hạng sóng sin giảm dần (tương ứng với các căn phức của phương trình đẳng
thức đặc trưng).
Giả sử tính ổn định, quá trình cũng có thể được biểu diễn ở dạng kết quả tuyến
tính tổng quát của Phương trình (4.1.1), nhưng hệ số ψ là các hàm phức tạp của

tham số φ1, φ2, ..., φp. Các hệ số có thể được tìm thấy bằng số; xem Phụ lục C trên
trang 85.

4.4 Mô hình trung bình trượt tự động hồi phục hỗn hợp

Nếu chúng tôi giả định rằng chuỗi một phần là tự động hồi quy và một phần là đường trung bình động, chúng tôi

có được một mô hình chuỗi thời gian khá tổng quát. Nói chung, nếu

= + ++ + - -
Yt φ1Yt 1– φ2Yt 2– … PYt p - et 1et 1– θ2et
- -
(4.4.1)
2– … qet q -

chúng ta nói rằng {Yt } là một quá trình trung bình động tự hồi quy hỗn hợp của các lệnh p và q,
tương ứng; chúng tôi viết tắt tên thành ARMA (p, q). Như thường lệ, chúng tôi thảo luận về một
trường hợp đặc biệt đầu tiên. †

Mô hình ARMA (1,1)

Phương trình xác định có thể được viết

- + = (4.4.2)
Yt φYt 1– et θet 1–

Để suy ra các phương trình loại Yule-Walker, trước tiên chúng ta lưu ý rằng

E et Yt)(=E [et ( 1– et
φYt 1– θet
) - + ]

= 2
σe

† Trong các mô hình hỗn hợp, chúng tôi giả định rằng không có yếu tố chung nào trong quá trình tự phục hồi và

đa thức trung bình động. Nếu có, chúng tôi có thể hủy chúng và mô hình sẽ

giảm xuống mô hình ARMA có bậc thấp hơn. Đối với ARMA (1,1), điều này có nghĩa là θ φ.
Machine Translated by Google

78 Mô hình cho chuỗi thời gian tĩnh

E ( ( 1– et
và 1– Yt) =E[ và 1– φYt - +
θet 1– ) ]

- = 2 2
φσe θσe
= 2 () σ φ θ -e

Nếu chúng ta nhân Phương trình (4.4.2) với Yt-k và lấy các kỳ vọng, chúng ta có

+ = [1 - θφ θ (]) 2
γ0 φγ1 σe -
- = 2
γ1 φγ0 θσe (4.4.3)

= cho k ≥ 2
γk φγk 1–

Giải hai phương trình đầu tiên thu được

= θ2
1 ()
2 -+φθ 2
(4.4.4)
γ0 ----------------------------------- σe

1 φ2 -

và giải quyết đệ quy đơn giản cho

(1 - θφ() φθ) -
= ------------------------------------- cho k ≥ 1
ρk (4.4.5)
φk 1– 1 2 - θφ θ2 +

Lưu ý rằng hàm tự tương quan này giảm dần theo cấp số nhân khi độ trễ k tăng lên.
Hệ số tắt dần là φ, nhưng sự phân rã bắt đầu từ giá trị ban đầu ρ1, giá trị này cũng phụ thuộc
trên θ. Điều này trái ngược với tự tương quan AR (1), tự tương quan cũng phân rã với giảm xóc
hệ số φ nhưng luôn từ giá trị ban đầu ρ0 = 1. Ví dụ, nếu φ = 0,8 và θ = 0,4, thì
ρ1 = 0,523, ρ2 = 0,418, ρ3 = 0,335, v.v. Có thể có một số hình dạng cho ρk ,
phụ thuộc vào dấu của ρ1 và dấu của φ.
Dạng quy trình tuyến tính chung của mô hình có thể thu được theo cách tương tự
dẫn đến Công thức (4.3.8). Chúng ta tìm thấy


j 1–
Yt + =et () φ φ θ - et j -
, (4.4.6)
j 1 =

đó là,
= j
1– ψj () φ φ θ - cho j ≥ 1

Bây giờ chúng ta nên đề cập đến điều kiện ổn định rõ ràng φ <1 , hoặc tương đương
gốc của phương trình đặc tính AR 1 - φx = 0 phải vượt quá sự thống nhất tuyệt đối
giá trị.

Đối với mô hình ARMA (p, q) tổng quát , chúng tôi nêu các dữ kiện sau mà không cần chứng minh:

Theo điều kiện et độc lập với Yt - 1, Yt - 2, Yt - 3,…, một chất tan đứng yên cho Phương
trình (4.4.1) tồn tại nếu và chỉ khi tất cả các gốc của đặc trưng AR đều bằng φ ( x) =
0 vượt quá sự thống nhất trong mô-đun.
Nếu các điều kiện cố định được thỏa mãn, thì mô hình cũng có thể được viết dưới dạng
quá trình tuyến tính tổng quát với hệ số ψ được xác định từ
Machine Translated by Google

4.5 Tính nghịch đảo 79

ψ0 1 =

ψ1 - φ1
θ1 + =
= + φ2
+ φ1ψ1 (4.4.7)
ψ2 θ2 -
.
.
.
= + +
ψj θj - φpψj p - φp 1– ψj p - 1 + ++… Φ1ψj 1–

trong đó chúng ta lấy ψj = 0 cho j <0 và θj = 0 cho j > q.


Một lần nữa, giả sử tính ổn định, hàm tự tương quan có thể dễ dàng được hiển thị cho
thỏa mãn
= + ++ cho kq > (4.4.8)
ρk φ1ρk 1– φ2ρk 2– … Φpρk p -

Các phương trình tương tự có thể được phát triển cho k = 1, 2, 3, ..., q liên quan đến θ1, θ2, ..., θq. Một
thuật toán phù hợp để tính toán số của hàm tự tương quan hoàn chỉnh
được đưa ra trong Phụ lục C trên trang 85. (Thuật toán này được thực hiện trong hàm R
có tên là ARMAacf.)

4.5 Tính nghịch đảo

Chúng ta đã thấy rằng đối với quá trình MA (1), chúng ta nhận được chính xác cùng một hàm
tự tương quan nếu θ được thay thế bằng 1 / θ. Trong các bài tập, chúng tôi tìm thấy một vấn
đề tương tự với ness nonunique cho mô hình MA (2). Sự thiếu độc đáo này của các mô hình MA, do
các hàm tự tương quan, phải được giải quyết trước khi chúng tôi cố gắng suy ra giá trị của các
tham số từ chuỗi thời gian quan sát được. Nó chỉ ra rằng sự không đồng nhất này có liên quan đến
câu hỏi dường như không liên quan được nêu tiếp theo.

Quá trình tự động phục hồi luôn có thể được biểu hiện lại dưới dạng một quá trình tuyến tính chung

thông qua các hệ số ψ để một quá trình AR cũng có thể được coi là một quá trình
trung bình động bậc nhất. Tuy nhiên, đối với một số mục đích, việc phản hồi tự động
tái phạm cũng rất thuận tiện. Mô hình trung bình động có thể được biểu thị lại như một
sự phạm tội?
Để khắc phục các ý tưởng, hãy xem xét mô hình MA (1):

- =
Yt et θet 1– (4.5.1)

Đầu tiên viết lại nó dưới dạng et = Yt + θet 1 và sau đó thay t bằng t - 1 và thay thế cho

et - 1 ở trên, chúng tôi nhận được

+ Yt
Yt θ etθet 2– )+
= (1–

= + +
Yt θYt 1– θ2et 2–

θ <1 , chúng tôi có thể tiếp tục thay thế này "vô hạn" trong quá khứ và có được
Nếu biểu thức [so sánh với phương trình (4.3.7) và (4.3.8)]

= ++ +…
et Yt θYt 1– θ2Yt 2–
Machine Translated by Google

80 Mô hình cho chuỗi thời gian tĩnh

hoặc

= (- - + (4.5.2)
Yt θYt 1– θ2Yt 2– )θ3Yt
––…3–
et

Nếuθ <1 ,chúng ta thấy rằng mô hình MA (1) có thể được đảo ngược thành mô hình lặn tự động
có bậc vô hạn. Chúng tôi nói rằng mô hình MA (1) là khả nghịch nếu và chỉ θkhi . với mô
<1Đối
hình MA (q) hoặc ARMA (p, q) tổng quát , chúng tôi xác định đặc tính MA
đa thức như

= - -
- x
θ () 1 θ1 - x θ2x2 - θ3x3 … Θqxq (4.5.3)

và phương trình đặc tính MA tương ứng


- 0 =
1 θ1 - x θ2x2 - θ3x3 - … Θqxq (4.5.4)

- Có thể chỉ ra rằng mô hình MA (q) là khả nghịch; nghĩa là có hệ số πj


như vậy mà

= + + ++ (4.5.5)
Yt π1Yt 1– π2Yt 2– π3Yt 3– … Et

nếu và chỉ khi nghiệm của phương trình đặc trưng MA vượt quá 1 trong môđun. (Kết hợp
điều này với tính ổn định của mô hình AR.)
Nó cũng có thể được hiển thị rằng chỉ có một tập hợp các giá trị tham số mang lại
quá trình MA nghịch đảo với một hàm tự tương quan cho trước. Ví dụ: Yt =
et + 2et - 1 và Yt = et + ½et - 1 đều có cùng một hàm tự tương quan, nhưng chỉ có
cái thứ hai với căn 2 là khả nghịch. Kể từ đây, chúng tôi sẽ hạn chế sự chú ý của mình vào

hợp lý về mặt vật lý của các mô hình không thể đảo ngược.

Đối với mô hình ARMA (p, q) tổng quát , chúng tôi yêu cầu cả tính ổn định và tính nghịch đảo.

4.6 Tóm tắt

Chương này giới thiệu đường trung bình động tự hồi quy đơn giản nhưng rất hữu ích
(ARMA) mô hình chuỗi thời gian. Các thuộc tính thống kê cơ bản của các mô hình này là
được suy ra đặc biệt cho các trường hợp đặc biệt quan trọng của đường trung bình động của đơn đặt hàng 1 và

2 và các quy trình tự phục hồi của đơn đặt hàng 1 và 2. Các vấn đề về tính ổn định và tính nghịch đảo

đã được theo đuổi cho những trường hợp này. Các thuộc tính của mô hình ARMA hỗn hợp cũng đã
đã điều tra. Bạn nên thông thạo các thuộc tính tự tương quan của các mod els này
và các đại diện khác nhau của các mô hình.
Machine Translated by Google

Bài tập 81

BÀI TẬP

4.1 Sử dụng các nguyên tắc đầu tiên để tìm hàm tự tương quan cho quá trình tĩnh
Được định nghĩa bởi

1 1
-
Yt =5 +et 2 - đặt 1–
+
4 --et 2–

4.2 Vẽ phác các hàm tự tương quan cho các mô hình MA (2) sau đây với tham số
eters như quy
định: (a) θ1 = 0,5 và θ2
= 0,4. (b) θ1 = 1,2 và θ2 =
0,7. (c) θ1 = 1 và θ2 = 0,6.
4.3 Xác minh điều đó đối với quy trình MA (1)
= 0,5 và - = 0,5
tối đa tối thiểu ρ1
ρ1 –∞θ∞ << –∞θ∞ <<
4.4 Chứng tỏ rằng khi θ được thay thế bằng 1 / θ, hàm tự tương quan cho MA (1)
quy trình không thay đổi.
4.5 Tính toán và phác thảo các hàm tự tương quan cho mỗi mô hình AR (1) sau đây. Vẽ đồ thị
cho độ trễ đủ để chức năng tự tương quan gần như không còn hoạt động. (a) φ1 = 0,6.
(b) φ1 = 0,6. (c) φ1 = 0,95. (Thực hiện đến 20 độ trễ.) (D) φ1 = 0,3.

4.6 Giả sử rằng {Yt } là một quá trình AR (1) với 1 <φ <+1. (a)
Tìm hàm tự phương sai cho Wt = Yt = Yt - Yt 1 theo φ và
2 σe.

(b) Đặc biệt, chứng tỏ rằng Var (Wt ) = 22 /σe(1 + φ).


4.7 Mô tả các đặc điểm quan trọng của hàm tự tương quan đối với các mô hình hạ thấp nhóm:
(a) MA (1), (b) MA (2), (c) AR (1), (d) AR (2), và (e ) ARMA (1,1).
4.8 Gọi {Yt } là một quá trình AR (2) có dạng đặc biệt Yt = φ2Yt - 2 + et . Sử dụng mật mã
hoàng tử đầu tiên để tìm phạm vi giá trị của φ2 mà quá trình đứng yên.
4.9 Sử dụng công thức đệ quy của Công thức (4.3.13) để tính toán và sau đó phác thảo các
hàm tự tương quan cho các mô hình AR (2) sau đây với các tham số như được chỉ định.
Trong mỗi trường hợp, chỉ rõ nghiệm của phương trình đặc trưng là thực hay phức. Nếu
các gốc phức tạp, hãy tìm hệ số tắt dần, R, và tần số tự do, Θ, cho hàm tự tương
quan tương ứng khi được biểu thị như trong Công thức (4.3.17), trên trang 73. (a) φ1
= 0,6 và φ2 = 0,3. (b) φ1 = 0,4 và φ2 = 0,5. (c) φ1 = 1,2 và φ2 = 0,7. (d) φ1 =
1 và φ2 = 0,6. (e) φ1 = 0,5 và φ2 = 0,9. (f) φ1 = 0,5 và φ2 = 0,6.
Machine Translated by Google

82 Mô hình cho chuỗi thời gian tĩnh

4.10 Phác thảo các hàm tự tương quan cho từng mô hình ARMA sau:
(a) ARMA (1,1) với φ = 0,7 và θ = 0,4.
(b) ARMA (1,1) với φ = 0,7 và θ = 0,4.
4.11 Đối với mô hình ARMA (1,2) Yt = 0,8Yt - 1 + et + 0,7et - 1 + 0,6et - 2, chứng tỏ rằng
(a) ρk = 0,8ρk 1 với k > 2. (B) ρ2 = 0,8ρ1 + 0,6 / γ0. σe
2
4.12 Xét hai quá trình MA (2), một với θ1 = θ2 = 1/6 và một quá trình khác với θ1 = 1
và θ2 =
6. (a) Chứng tỏ rằng các quá trình này có cùng một hàm tự tương
quan. (b) Làm thế nào để so sánh các căn của các đa thức đặc trưng tương ứng?
4.13 Gọi {Yt } là một quá trình đứng yên với ρk = 0 với k > 1. Chứng tỏ rằng ta phải có |

ρ1 | ≤ ½. (Gợi ý: Hãy xem xét Var (Yn + 1 + Yn + + Y1) và sau đó là Var (Yn + 1 -

Yn + Yn - 1 - ± Y1). Sử dụng thực tế là cả hai điều này phải không âm với mọi n.)
4.14 Giả sử rằng {Yt } là một quá trình tĩnh, trung bình bằng 0 với | ρ1 | <0,5 và ρk = 0 với k

> 1. Chứng tỏ rằng {Yt } phải có thể biểu diễn như một quá trình MA (1). Tức là, chứng

tỏ rằng có một chuỗi nhiễu trắng {et } sao cho Yt = et - θet - 1, trong trực
đó ρ1tràng
là cor
và et

không tương quan với Yt - k với k > 0. (Gợi


+ θ2);
ý: Chọn
sau θđósao
chocho
et | θ | <1 và ρ1 = θ / (1
∞ θj Y .
= Nếu chúng
không ta jgiả
phải 0 =sửtjrằng {Yt et
- mal, } là mộtsẽquy
cũng trình
bình cũng và
thường,
tương quan bằng không tương đương với quy trình indepen.)

4.15 Xem xét mô hình AR (1) Yt = φYt - 1 + et . Chứng tỏ rằng nếu | φ | = 1 quá trình không
thể đứng yên. (Gợi ý: Tính phương sai của cả hai bên.)
4.16 Xem xét mô hình AR (1) “không cố định” Yt = 3Yt 1 + et .
∞ 1
etrình AR (1).
(a) Chứng tỏ rằng
( ) thỏa
- mãn
- j=Yt (b)phương
Chứng
3
j 1 = tj +
tỏ rằng quá trình được xác định trong phần (a) là đứng yên. (c)

Giải pháp này không thỏa mãn theo cách nào?

4.17 Xét một quá trình thỏa mãn phương trình AR (1) Yt = ½Yt - 1 + et .

(a) Chứng tỏ rằng Yt = 10 (½) t + et + ½et - 1 + (½) 2et - 2 + là một nghiệm của AR (1)
phương

trình. (b) Dung dịch đã cho trong phần (a) có đứng yên không?

4.18 Hãy xem xét một quá trình thỏa mãn phương trình AR (1) trung bình bằng 0, Yt = φYt - 1 +
et với 1 <φ <+1. Gọi c là hằng số khác không bất kỳ và xác định Wt = Yt + cφt . (a)
Chứng tỏ rằng E (Wt ) = cφt . (b) Chứng tỏ rằng {Wt } thỏa mãn phương trình AR (1) “đứng

yên” Wt = φWt - 1 + et . (c) {Wt } có đứng yên không ?

4.19 Xét mô hình MA (6) với θ1 = 0,5, θ2 = 0,25, θ3 = 0,125, θ4 = 0,0625, θ5


= 0,03125 và θ6 = 0,015625. Tìm một mô hình đơn giản hơn nhiều có trọng
lượng gần như nhau.
4.20 Xét mô hình MA (7) với θ1 = 1, θ2 = 0,5, θ3 = 0,25, θ4 = 0.125, θ5 =
0,0625, θ6 = 0,03125 và θ7 = 0,015625. Tìm một mô hình đơn giản hơn
nhiều có trọng lượng gần như nhau.
Machine Translated by Google

Bài tập 83

4.21 Xét mô hình Yt = et - 1 - et - 2 + 0.5et - 3.


(a) Tìm hàm tự phương sai cho quá trình này. (b)
Chứng tỏ rằng đây là một quá trình ARMA (p, q) nào đó được ngụy trang. Nghĩa
là, xác định các giá trị của p và q và của θ và φ sao cho quá trình ARMA
(p, q) có các thuộc tính thống kê giống như {Yt }. 1 φ1 - x φ2x2 -… φpxp

4.22 Chứng tỏ rằng tuyên bố “Nguồn gốc của - - = 0 là

lớn hơn 1 ở giá trị tuyệt đối ”tương đương với tuyên bố“ Các gốc của xp φ1xp … φp 0 nhỏ
- 1– - 2– - - =
φ2xp đối. ”là(Gợi
hơn 1 ở giá trị tuyệt căn ý:
củaNếu G là trình
phương căn của
kiamột phương trình thì 1 / G có phải
không?)

4.23 Giả sử rằng {Yt } là một quá trình AR (1) với ρ1 = φ. Xác định dãy {bt } là bt = Yt - φYt
+ 1. (a) Chứng tỏ rằng Cov (bt , bt - k) = 0 với mọi t và k. (b) Chứng tỏ rằng Cov (bt ,
Yt + k) = 0 với mọi t và k > 0.

4.24 Gọi {et } là một quá trình nhiễu trắng có phương sai đơn vị. Hãy xem xét một quá trình
bắt đầu tại thời điểm t = 0 và được định nghĩa một cách đệ quy như sau. Cho Y0 = c1e0
và Y1 = c2Y0 + e1. Sau đó cho Yt = φ1Yt - 1 + φ2Yt - 2 + et với t > 1 như trong AR (2) pro
thuế.

(a) Chứng tỏ rằng giá trị trung bình của


quá trình bằng 0. (b) Đối với các giá trị cụ thể của φ1 và φ2 trong vùng đứng yên
cho mô hình AR (2), hãy chỉ ra cách chọn c1 và c2 để cả Var (Y0) = Var (Y1) và độ
trễ 1 tự tương quan giữa Y1 và Y0 khớp với giá trị pro cess AR (2) cố định với
các tham số φ1 và φ2. (c) Sau khi quá trình {Yt } được tạo, hãy chỉ ra cách
chuyển đổi nó thành một quá trình mới có bất kỳ giá trị trung bình và phương sai mong
muốn nào. (Bài tập này gợi ý một phương pháp thuận tiện để mô phỏng quá trình AR
(2) tĩnh tại.)
4.25 Xem xét quá trình “AR (1)” thỏa mãn Yt = φYt - 1 + et , trong đó φ có thể là num ber bất
kỳ và {et } là một quá trình nhiễu trắng sao cho et độc lập với quá khứ {Yt - 1, Yt -
.t > tỏ 2
2,…}. Gọi Y0 là một biến ngẫu nhiên với trung bình μ0 và phương sai σ0 (a)với
Chứng 0, rằng
chúng
ta có thể viết

Yt = et + φet - 1 + φ2 et - 2 + φ3 et - 3 + + φt 1 e1 + φt

Y0. (b) Chứng tỏ rằng với t > 0, ta có E (Yt ) = φt μ0. (c) Chứng tỏ rằng
t > 0

2
2 +φ2t σ0 cho φ
1 φ2t -

----------------
σe 1 φ2 -
1
=
Var Yt ()
2
tσe2 +
σ0 cho φ 1 =

(d) Giả sử bây giờ μ0 = 0. Lập luận rằng, nếu {Yt } đứng yên, ta phải có .

φ 1 (e) Tiếp tục giả sử μ0 = 0, chứng tỏ rằng, nếu {Yt } đứng yên thì 2
<1. 1 φ2 Var Yt () σe = ⁄ () - và do đó chúng ta phải có | φ |
Machine Translated by Google

84 Mô hình cho chuỗi thời gian tĩnh

Phụ lục B: Khu vực ổn định cho một quá trình AR (2)

Trong trường hợp bậc hai, các nghiệm nguyên của đa thức đặc trưng bậc hai dễ dàng
được tìm thấy là

φ1 ± φ1 2 +
4φ2
-------------------------------------
(4.B.1)
2φ2 -

Đối với tính cố định, chúng tôi yêu cầu các gốc này vượt quá 1 giá trị tuyệt đối. Chúng tôi bây giờ

cho thấy rằng điều này sẽ đúng nếu và chỉ khi ba điều kiện được thỏa mãn:

φ1 φ2 + <1, φ2 φ1 - <1, a nd (4.B.2)


φ2 <1

Chứng minh: Cho số nghịch đảo của các gốc được ký hiệu là G1 và G2. sau đó

2
2φ2 2φ2 φ1 - 4φ2 φ1 ++
G1 = ----------------------------------------- = ----------------------------------------- ------------------------------------------

2 2 2
φ1 - 4φ2 φ1
+ - φ1 - 4φ2 φ1
+ - φ1
φ1 - 4φ2 ++

2 2
(2φ2 φ1 - 4φ2 φ1
) ++ φ1 4φ2
φ1 + -
2 2
= ------------------------------------------------- ------- = -------------------------------------

φ1 - ( φ1 4φ2 ) + 2

Tương tự,
2
φ1 4φ2 φ1
++
G2 = -------------------------------------

Bây giờ chúng ta chia chứng minh thành hai trường hợp tương ứng với căn nguyên thực và phức.
2
Rễ sẽ là thực nếu và chỉ khi 4φ2 + ≥ 0φ1 .
I. Rễ Thực: Gi cho i = 1 và 2 nếu và chỉ khi
<1
2 2
φ1 4φ2 φ1 + - φ1 4φ2
φ1 ++
------------------------------------- 1
- 1<<< -------------------------------------
2 2

hoặc

2
- 2<-φ1 φ1 < φ1 + φ12 + 2 < .
4φ2 + 4φ2
2
Chỉ xem xét bất đẳng thức đầu tiên. Bây giờ - <+ - φ1
2 2 2 φ1 4φ2 nếu và chỉ khi
φ1 4φ2 + φ1 <2+ nếu và chỉ khi φ1 < 2 + + 4 nếu và chỉ khi ,
4φ2 + φ1 4φ1 φ 2 φ1 <1+
hoặc 1 <.
φ2 φ1 -

+
Bất đẳng thức φ1 4φ2 Các φ12 + trình 2 <
được xử lý tương tự và dẫn đến φ2 φ1 + 1 <.
phương
2
≥ 0
này cùng với trường hợp căn thức thực φ1 4φ2 + xác định vùng đứng yên cho
được trình bày trong Hình 4.17.
2
II. Rễ phức tạp: Bây giờ φ1 <0 .
4φ2 + Ở đây2 G1 và G2 sẽ là2 cổng conju
2 phức2 tạp và <1
G1 G2 . Nhưng mà G1 -
nếu và chỉ khi <1 =
= G1
[ φ1 + ( φ1 4φ2 ) -] ⁄ 4
. 1 <0
2 φ2 - =+ sao
xác cho
định
φ2phần
> 1– Điều này cùng với bất đẳng thức φ 4φ2
của vùng đứng yên đối với các gốc phức được thể hiện trong Hình 4.17 và thiết lập phương
trình (4.3.11). Điều này hoàn thành bằng chứng.
Machine Translated by Google

Phụ lục C: Hàm tự tương quan cho ARMA (p, q) 85

Phụ lục C: Hàm tự tương quan cho ARMA (p, q)

Gọi {Yt } là một quá trình ARMA (p, q) cố định, khả nghịch . Nhớ lại rằng chúng ta luôn có thể viết
một quá trình như vậy ở dạng quy trình tuyến tính chung như

Yt = (4.C.1)
ψj et j
- j 0 =

trong đó trọng số ψ có thể thu được một cách đệ quy từ Công thức (4.4.7), trên trang 79.
Sau đó chúng tôi có


( = = 2 cho k ≥ 0 (4.C.2)
E Yt k + et ) E ψj etkj - + et ψkσe
j 0 =

Do đó, phương sai phải thỏa mãn

P q
= =
( γk E)YtE k φj
Yt + Ytkj - + - θj etkj - + Yt

j 1 =
j 0 =
(4.C.3)
P q
=
2 φj γk -j σe
- θj ψj k -
j 1 = jk =

trong đó θ0 = 1 và tổng cuối cùng không có nếu k > q. Đặt k = 0, 1,…, p và sử dụng γ k =

γk dẫn đến p + 1 phương trình tuyến tính trong γ0, γ1 , …, γp.

= + ++ …
- pγp
( θ0σe 2
θ1ψ1 … + ++
γ0 φ1γ1 φ2γ2 θqψq )
= + ++ …
- pγp
( θ11–
θ2ψ1 2 + ++
γ1 φ1γ0 φ2γ1 σe … θqψq 1– ) (4.C.4)
.
.
.
= … θqψq p - +)
2 ++
γp φ1γp 1– φ2γp+ 2–
++ trong … 1+
- ( θp θp Pγ0ψ1 σe

đó θj = 0 nếu j > q.
2
Đối với một bộ giá trị tham số nhất định, σe , của φ, và của θ (và do đó là của ψ), chúng ta có thể giải quyết

phương trình tuyến tính để thu được γ0, γ1 ,…, γp. Các giá trị của γk đối với k > p sau đó có
thể được đánh giá từ đệ quy trong Công thức (4.4.8), trên trang 79. Cuối cùng, ρk thu được từ ρk
= γk / γ0.
Machine Translated by Google

CHƯƠNG 5

CÁC MÔ HÌNH CHO THỜI GIAN KHÔNG PHÙ HỢP


LOẠT

Bất kỳ chuỗi thời gian nào không có giá trị trung bình không đổi theo thời gian đều là không cố định. Các mô hình của biểu mẫu

Yt = μt + Xt

trong đó μt là một hàm trung bình không thay đổi và Xt là một chuỗi cố định bằng 0, đã được
xem xét trong Chương 3. Như đã nêu ở đó, các mô hình như vậy chỉ hợp lý nếu có lý do chính
đáng để tin rằng xu hướng xác định là phù hợp “mãi mãi”. Có nghĩa là, chỉ vì một phân đoạn
của chuỗi có vẻ như nó đang tăng (hoặc giảm) gần đúng một cách tuyến tính, chúng ta có tin
rằng mức độ tuyến tính là nội tại của quá trình và sẽ tồn tại trong tương lai không? Thông
thường trong các ứng dụng, đặc biệt là trong kinh doanh và kinh tế, chúng ta không thể giả
định một cách hợp pháp một xu hướng xác định. Nhớ lại bước đi ngẫu nhiên được hiển thị trong
Hình 2.1, trên trang 14. Chuỗi thời gian dường như có một xu hướng tăng mạnh có thể là tuyến
tính theo thời gian. Tuy nhiên, cũng cần nhớ lại rằng quá trình đi bộ ngẫu nhiên có một ý
nghĩa, giá trị trung bình bằng 0 và không có xu hướng xác định nào cả.

Ví dụ, hãy xem xét giá hàng tháng của một thùng dầu thô từ tháng 1 năm 1986 đến tháng 1
năm 2006. Hình 5.1 hiển thị biểu đồ chuỗi thời gian. Loạt này hiển thị sự thay đổi đáng kể,
đặc biệt là kể từ năm 2001, và một mô hình tĩnh dường như không hợp lý. Chúng ta sẽ khám phá
ra trong các Chương 6, 7 và 8 rằng không có mô hình xu hướng xác định nào hoạt động tốt cho
loạt bài này nhưng một trong những mô hình phi tĩnh đã được mô tả là chứa các xu hướng ngẫu
nhiên có vẻ hợp lý. Chương này thảo luận về các mô hình như vậy. May mắn thay, như chúng ta
sẽ thấy, nhiều xu hướng ngẫu nhiên có thể được mô hình hóa với tương đối ít tham số.

87
Machine Translated by Google

88 Mô hình cho chuỗi thời gian không tĩnh

Hình 5.1 Giá dầu hàng tháng: Tháng 1 năm 1986 – Tháng 1 năm 2006

thùng
mỗi
Giá

60
50
40
30
20
10

1990 1995 2000 2005

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> dữ liệu (oil.price)
> plot (oil.price, ylab = 'Price per Barrel', type = 'l')

5.1 Tính ổn định thông qua sự khác biệt

Hãy xem xét lại mô hình AR (1)


Yt φYt 1– et + = (5.1.1)

Chúng tôi đã thấy rằng giả định et là một “sự đổi mới” thực sự (nghĩa là et không liên quan đến
Yt - 1, Yt - 2,…), chúng ta phải có | φ | <1. Chúng ta có thể nói gì về các giải pháp cho Phương trình

(5.1.1) nếu | φ | ≥ 1? Đặc biệt xem xét phương trình

Yt 3Yt 1– et + = (5.1.2)

Lặp lại quá khứ như chúng ta đã làm trước khi mang lại kết quả

Yt =et
+ 3et 1– +32et
++ + 2– … 3t 1– e1 3t Y0 (5.1.3)

Chúng tôi thấy rằng ảnh hưởng của các giá trị trong quá khứ xa xôi của Yt và et không hề mất đi — thực sự,

trọng số áp dụng cho Y0 và e1 lớn lên theo cấp số nhân. Trong Hình 5.2, chúng tôi cho thấy
giá trị cho một mô phỏng rất ngắn của một chuỗi như vậy. Ở đây, chuỗi tiếng ồn trắng là
được tạo ra dưới dạng các biến bình thường tiêu chuẩn và chúng tôi sử dụng Y0 = 0 làm điều kiện ban đầu.

Hình 5.2 Mô phỏng "Mô hình AR (1)" Chất nổ Yt 3Yt 1– et + =

t 12345678

et 0,63 1,25 1,80 1.51 1.56 0,62 0,64 0,98

Yt 0,63 0,64 3,72 12,67 39,57 119,33 358,63 1074,91


Machine Translated by Google

5.1 Tính ổn định thông qua sự khác biệt 89

Hình 5.3 cho thấy sơ đồ chuỗi thời gian của mô phỏng AR (1) bùng nổ này.

Hình 5.3 Một loạt “AR (1)” gây nổ


Yt

1000
800
600
400
200
0


• • • • •
12345678

Thời gian

> dữ liệu (bùng nổ.s)


> plot (boom.s, ylab = expression (Y [t]), type = 'o')

Hành vi bùng nổ của một mô hình như vậy cũng được phản ánh trong phương sai của mô hình
và các hàm hiệp phương sai. Chúng có thể dễ dàng tìm thấy là

1 2
= - ()
9 tσ 1– 8 (5.1.4)
Var Yt () e

3k 2
, k - = (5.1.5)
() Yt
Cov Yt ----- 9 tk - () σ 1– e
số 8

tương ứng. Lưu ý rằng chúng tôi có

9t k - 1–
, k - = 3k
≈ 1 fhoặc t lớn và k vừa phải
() Yt
Corr Yt
--------------------
9t 1–

Tăng trưởng theo cấp số nhân chung hoặc hành vi bùng nổ sẽ xảy ra cho bất kỳ φ
sao cho | φ | > 1. Một loại bất ổn hợp lý hơn thu được khi φ = 1. Nếu φ = 1,
phương trình mô hình AR (1) là

Yt Yt et + = (5.1.6)

Đây là mối quan hệ được thỏa mãn bởi quá trình đi bộ ngẫu nhiên của Chương 2 (Phương trình
(2.2.9) nơi trang 12). Ngoài ra, chúng ta có thể viết lại điều này dưới dạng

Yt et = (5.1.7)
Machine Translated by Google

90 Mô hình cho chuỗi thời gian không tĩnh

đâu là điểm - =
Ytkhác
Yt Yt 1–đầu tiên của Yt .
biệt Đi bộ ngẫu nhiên sau đó dễ dàng
được mở rộng sang một mô hình tổng quát hơn mà điểm khác biệt đầu tiên là một số điểm chuyên nghiệp cố

định — không chỉ là tiếng ồn trắng.

Một số tập hợp giả định hơi khác nhau có thể dẫn đến các mô hình có dif đầu tiên
ference là một quá trình tĩnh. Giả sử

Yt Mt Xt + = (5.1.8)

trong đó Mt là một chuỗi chỉ thay đổi chậm theo thời gian. Ở đây Mt có thể là
xác định hoặc ngẫu nhiên. Nếu chúng ta giả định rằng Mt xấp xỉ không đổi trên mọi
hai mốc thời gian liên tiếp, chúng tôi có thể ước tính (dự đoán) Mt tại t bằng cách chọn β0 sao cho

1
- 2
(Yt j - β0, t )
j 0 =

được giảm thiểu. Điều này rõ ràng dẫn đến


^ 1
M t = (- Yt Yt
+ 1– )
2

và chuỗi "bị phát hiện" tại thời điểm t là

^ 1 1 1
- = == + 1-2 -
Yt M Yt - _
()Yt Yt
- - (Yt Yt 1-2 )
2 Yt
--
t
_


Đây là bội số không đổi của hiệu số đầu tiên, Yt .
Nhóm giả định thứ hai có thể là Mt trong phương trình (5.1.8) là ngẫu nhiên và
thay đổi chậm theo thời gian được điều chỉnh bởi mô hình đi bộ ngẫu nhiên. Ví dụ, giả sử,
cái đó

=
Yt Mt et + ith w Mt Mt 1– εt + = (5.1.9)

trong đó {et } và {εt } là chuỗi nhiễu trắng độc lập. sau đó

Y + =
t Mt e t

- +εt= et et 1–

sẽ có hàm tự tương quan của chuỗi MA (1) với


2
ρ1 - = {⁄ 2[+σε(1 2 ]}
) ⁄e (5.1.10)

Trong một trong hai tình huống này, chúng tôi được dẫn đến việc nghiên cứu Yt như một quá trình tĩnh.

Quay trở lại chuỗi thời gian giá dầu, Hình 5.4 hiển thị biểu đồ chuỗi thời gian của
sự khác biệt của logarit của chuỗi đó. ‡ Chuỗi sai khác trông tĩnh hơn nhiều khi
so sánh với chuỗi thời gian ban đầu được trình bày trong Hình 5.1, trên trang 88.

† Ghi nhãn đầy đủ hơn về sự khác biệt này sẽ là sự khác biệt đầu tiên ở độ trễ 1. ‡ Trong Phần
5.4 trên trang 98, chúng ta sẽ thấy lý do tại sao logarit thường là một phép biến đổi thuận tiện
sự.
Machine Translated by Google

5.1 Tính ổn định thông qua sự khác biệt 91

(Chúng ta cũng sẽ thấy ở phần sau rằng có những điểm ngoại lệ trong loạt bài này cần được xem xét để

tạo ra một mô hình thích hợp.)

Hình 5.4 Chuỗi Chênh lệch của Nhật ký Thời gian Giá Dầu

(Giá)
trong
nhật
Thay
đổi

0,2
0,4
0,4
0,2
0,0

1990 1995 2000 2005

Thời gian

> plot (diff (log (oil.price)), ylab = 'Change in Log (Price)', type = 'l')

Chúng tôi cũng có thể đưa ra các giả định dẫn đến các mô hình khác biệt thứ hai đứng yên.
Một lần nữa, chúng tôi giả định rằng Phương trình (5.1.8) ở trang 90 được giữ nguyên, nhưng bây giờ giả sử rằng

Mt là liên quan đến thời gian trong ba mốc thời gian liên tiếp. Bây giờ chúng tôi có thể ước tính (dự đoán) Mt tại
thời điểm giữa t bằng cách chọn β0, t β1, t và để giảm thiểu
1
2
(Yt +
j - - ( β0, t jβ1, t ))
j 1– =

Giải pháp mang lại


^ 1
M t = (- Yt 1+ Yt + + )
Yt 1–
3

và do đó, loạt phim bị chia sẻ là

^ + +
Yt 1+ Yt Yt 1–
- - = Yt
Yt M t
-------------------------------------------------- 3

1
= ( Yt 1+ 2Yt - + Yt 1– )
–--3

1
= ( Y )
–-- 3 t 1+

1
= 2 Yt(1+ )
–-- 3

bội số không đổi của hiệu số thứ hai ở giữa của Yt . Lưu ý rằng chúng tôi đã khác nhau
hai lần, nhưng cả hai sự khác biệt đều ở độ trễ 1.
Ngoài ra, chúng tôi có thể giả định rằng
Machine Translated by Google

92 Mô hình cho chuỗi thời gian không tĩnh

= et where, +
Yt Mt Mt Mt= 1– Wt + nd Wt Wt 1– εt + =
một
(5.1.11)

với chuỗi thời gian tiếng ồn trắng độc lập {et } và {εt }. Đây là xu hướng ngẫu nhiên Mt là
sao cho “tốc độ thay đổi”, Mt , đang thay đổi chậm theo thời gian. sau đó

Y =
t Mt+ e = +Wt e
t t

2Yt Wt 2et + =
() εt et()et+- 1–
= -et 1– et 2– -

= +
εt -
et 2et 1– + et 2–

có chức năng tự tương quan của một quá trình MA (2). Điểm quan trọng là
điểm khác biệt thứ hai của quá trình không tĩnh {Yt } là tĩnh. Điều này dẫn chúng ta đến
định nghĩa chung về chuỗi thời gian trung bình động tích hợp tự động hồi phục quan trọng
các mô hình.

5.2 Mô hình ARIMA

Chuỗi thời gian {Yt } được cho là tuân theo đường trung bình động tích hợp tự động hồi phục
mô hình nếu sự khác biệt thứ d Wt = dYt là một quá trình ARMA tĩnh. Nếu {Wt } theo sau một
Mô hình ARMA (p, q) , chúng ta nói rằng {Yt } là một quá trình ARIMA (p, d, q) . May mắn thay, cho
mục đích thực tế, chúng ta thường có thể lấy d = 1 hoặc nhiều nhất là 2.

Sau đó, hãy xem xét một quy trình ARIMA (p, 1, q) . Với Wt = Yt - Yt - 1, chúng ta có

= 1– φ2Wt+2–++
Wt φ1Wt + et - -
(5.2.1)
… ΦpWt p - 1et 1– θ2et
- -
2– … qet q -
hoặc, xét về chuỗi quan sát,

Yt -Yt 1– = ( φ1 Yt 1–2–Yt) φ - +
( 2 Yt 2– Yt- 3– ) + + (…
… φp Ytq - p - -
θqet Yt ) p - 1 -

- - - -
et + θ1et 1– θ2et 2–

mà chúng tôi có thể viết lại thành

Yt = +++…
) + Yt
1 φ1 ((
1– φ2 φ1 ) - Yt 2– φ3 φ2
( ) - Yt 3–

(5.2.2)
+ ( p φp
- 1– ) Yt p -- φpYt p - 1 - - et
+ -
θ1et 1– θ2et 2– - -
… Qet q -
Chúng tôi gọi đây là dạng phương trình sai khác của mô hình. Lưu ý rằng nó dường như là một
Quá trình ARMA (p + 1, q) . Tuy nhiên, đa thức đặc trưng thỏa mãn
1+
- - (φp
φ3φp
)φ2-1–
(-…
x3) xp + - -
x2φ11 - (1 φ1 () +
) x
- φ2 φpxp
-
- = 1(-…
φ1 φpxp
- x φ2x2
) (1 - x )
Machine Translated by Google

5.2 Mô hình ARIMA 93

mà có thể dễ dàng kiểm tra. Việc phân tích nhân tử này rõ ràng cho thấy căn tại x = 1,
ngụ ý sự phi thường. Tuy nhiên, các rễ còn lại là rễ của đặc tính
đa thức của quá trình tĩnh Yt .
Các đại diện rõ ràng của chuỗi được quan sát dưới dạng Wt hoặc màu trắng
chuỗi nhiễu bên dưới Wt khó hơn trong trường hợp tĩnh. Vì các quá trình tĩnh không nonsta không
ở trạng thái cân bằng thống kê, chúng ta không thể giả định rằng chúng hoàn toàn đi vào quá khứ
t thời
hoặc chúng bắt đầu khi chúng bắt đầu vào một - = điểm
∞ . Tuy
nàonhiên, chúng hạn,
đó, chẳng tôi có thểthời
tại và sẽ giả chúng
điểm định rằng
t m– tiện,
ta quan sát chuỗi đầu tiên. Để thuận = khác
chúng
nhau lấy-–MYt
ta Yt Yt =-sớm =hơn
01 với thời
Wtt có m.điểm
< thể được tgiải
Phương =trình
1, lúc
bằng
enceđó
cách

tính tổng cả hai vế từ t để có được biểu diễn


t m– = đến t =

Yt = Wj
(5.2.3)
j m– =

cho quy trình ARIMA (p, 1, q) .


Quy trình ARIMA (p, 2, q) có thể được xử lý tương tự bằng cách cộng hai lần để có được
đại diện
t j
Yt = Wi
j m– = tôi m– =

t m + (5.2.4)
= ()
Wt jj 1+
- j 0 =

Các biểu diễn này được sử dụng hạn chế nhưng có thể được sử dụng để điều tra hiệp phương sai
thuộc tính của các mô hình ARIMA và cũng để thể hiện Yt theo chuỗi tiếng ồn trắng
{et }. Chúng tôi trì hoãn các tính toán cho đến khi chúng tôi đánh giá các trường hợp cụ thể.

Nếu quy trình không chứa các điều khoản tự động hồi tố, chúng tôi gọi đó là quy trình di chuyển tích hợp

trung bình và viết tắt tên thành IMA (d, q). Nếu không có điều khoản trung bình động nào,
chúng tôi ký hiệu mô hình là ARI (p, d). Trước tiên, chúng tôi xem xét chi tiết IMA quan trọng (1,1)
người mẫu.

Mô hình IMA (1,1)

Mô hình IMA (1,1) đơn giản thể hiện thỏa đáng nhiều chuỗi thời gian, đặc biệt
những phát sinh trong kinh tế và kinh doanh. Ở dạng phương trình sai khác, mô hình là

- + =
Yt Yt 1– et θet 1– (5.2.5)

Để viết Yt một cách rõ ràng dưới dạng một hàm của các giá trị nhiễu hiện tại và quá khứ, chúng ta sử dụng Phương trình

(5.2.3) và thực tế là Wt = et - θet - 1 trong trường hợp này. Sau khi sắp xếp lại một chút, chúng tôi có thể
viết

Yt
= +et () 1et- 1–
θ
+ ()θ 1và- 2– ++ … () 1e -– θm θe– - 1 m - (5.2.6)

Lưu ý rằng trái ngược với các mô hình ARMA tĩnh của chúng tôi, trọng số của tiếng ồn trắng
các điều khoản không biến mất khi chúng ta đi vào quá khứ. Vì chúng ta giả sử rằng m <1 và 0 < t,

chúng ta có thể nghĩ một cách hữu ích về Yt chủ yếu là sự tích lũy có trọng số như nhau của một số
lượng lớn các giá trị nhiễu trắng.
Machine Translated by Google

94 Mô hình cho chuỗi thời gian không tĩnh

Từ công thức (5.2.6), chúng ta có thể dễ dàng suy ra các phương sai và tương quan. Chúng ta có
2
= 1 +θ2
()] t+ m
(1+ -σe
θ 2 [) (5.2.7)
Var Yt ()

Corr Yt
1 - θ +θ2+ (1 - θ 2 )() tmk - +
() Yt
, k - = ------------------------------------------------- ---------------------------
1 2 /

[(
Var Yt ( ) Var Yt k - )]

tmk - + (5.2.8)
≈ --------------------

t m +

≈ 1 cho m lớn và k vừa phải

Chúng ta thấy rằng khi t tăng, Var Yt () tăng và có thể khá lớn. Ngoài ra, mối tương quan
giữa Yt và Yt - k sẽ rất dương đối với nhiều độ trễ k = 1, 2,….

Mô hình IMA (2,2)

Các giả định của phương trình (5.1.11) dẫn đến mô hình IMA (2,2). Trong phương trình khác biệt
hình thức, chúng tôi có

= - -
2Yt et θ1et 1– θ2et 2–

hoặc

=
Yt 2Yt 1– Yt -2– + et -θ1et 1– -
(5.2.9)
θ2et 2–

Biểu diễn của Công thức (5.2.4) có thể được sử dụng để biểu thị Yt dưới dạng et, et - 1,….

Sau một số đại số tẻ nhạt, chúng tôi thấy rằng

t m +

+ = -
Yt et ψj et j () θ [ t m + + 1 1 + (t m + ) ] e–
θ2 1 m -
- j 1 = (5.2.10)
-
()
1 θ t m
2e– 2 +
m +
-

trong đó ψj = 1 + θ2 + (1 - θ1 - θ2) j với j = 1, 2, 3,…, t + m. Một lần nữa, chúng tôi thấy rằng
Trọng số ψ không chết đi mà tạo thành một hàm tuyến tính của j.

Một lần nữa, các phương sai và tương quan đối với Yt có thể nhận được từ biểu diễn
được đưa ra trong Công thức (5.2.10), nhưng các phép tính rất tẻ nhạt. Chúng tôi chỉ cần lưu ý rằng

phương sai của Yt tăng nhanh theo t và một lần nữa () gầnCorr , ktất cả
bằngYt1 Yt
với
- vừa phải k.

Kết quả mô phỏng quá trình IMA (2,2) được hiển thị trong Phụ lục 5.5.
Lưu ý sự thay đổi trơn tru trong các giá trị quy trình (và sự không quan trọng của giá trị trung bình bằng 0

hàm số). Phương sai ngày càng tăng và các mối tương quan láng giềng mạnh mẽ, tích cực
chi phối sự xuất hiện của cốt truyện chuỗi thời gian.
Machine Translated by Google

5.2 Mô hình ARIMA 95

Hình 5.5 Mô phỏng chuỗi IMA (2,2) với θ1 = 1 và θ2 = 0,6


30

••• ••••••••
••••••••••••• •••••••
•• ••
•• ••
20


••• ••
••
••••
••
•••
(2,2)
phỏng
IMA

• •
••
10
5
0

•••
0 10 20 30 40 50 60

Thời gian

> data (ima22.s)>


plot (ima22.s, ylab = 'IMA (2,2) Simulation', type = 'o')

Hình 5.6 cho thấy biểu đồ chuỗi thời gian của sự khác biệt đầu tiên của chuỗi mô phỏng.
Chuỗi này cũng không cố định, vì nó được điều chỉnh bởi mô hình IMA (1,2).

Hình 5.6 Sự khác biệt đầu tiên của Dòng IMA được mô phỏng (2,2)

4

• •
• • •
2
• •••
• • •• •
• •• • • • •
• ••
0 •• ••
•• • •
•••••

• ••
• ••
••

• •
tiên
biệt
khác
đầu
Sự • • • •

• ••
• •• •


2
4

0 10 20 30 40 50 60

Thời gian

> plot (diff (ima22.s), ylab = 'First Difference', type = 'o')

Cuối cùng, sự khác biệt thứ hai của các giá trị chuỗi IMA (2,2) được mô phỏng được vẽ
trong Hình 5.7. Các giá trị này phát sinh từ mô hình MA (2) đứng yên với θ1 = 1 và θ2 =
0,6. Từ Công thức (4.2.3) ở trang 63, các phép tự tương quan lý thuyết cho mô hình này là
ρ1 = 0,678 và ρ2 = 0,254. Những giá trị tương quan này dường như được phản ánh trong sự
xuất hiện của cốt truyện chuỗi thời gian.
Machine Translated by Google

96 Mô hình cho chuỗi thời gian không tĩnh

Hình 5.7 Sự khác biệt thứ hai của Dòng IMA được mô phỏng (2,2)
4
2 • • •
• • • •• •
•• • • • •• • • • • •
• • •
• • •
• •
• • • •• • ••• • • • •• • •


biệt
khác
lần
Hai

• • • • • • •
• •
0 4
2

• • •
• •
10 20 30 40 50 60

Thời gian

> plot (diff (ima22.s, difference = 2), ylab = 'Differenced


Hai lần ', gõ =' o ')

Mô hình ARI (1,1)

Quy trình ARI (1,1) sẽ đáp ứng


- = - + (5.2.11)
Yt Yt 1– (φ Yt 1– Yt 2– ) et

hoặc

= -
()φ 1Yt+ 1– φYt 2– + (5.2.12)
Yt et

ở đâu | φ | <1. †

Để tìm trọng số trong trường hợp này, chúng ta sẽ sử dụng một kỹ thuật sẽ tổng quát hóa thành

mô hình ARIMA tùy ý. Có thể chỉ ra rằng các trọng số ψ có thể nhận được bằng cách cân
bằng các lũy thừa của x trong danh tính:

- -
( 1 φ1 - x φ2x2 - … Φpxp ) () () 1 -)dx 1
θqxq 1 +θ1
ψ1x
+- 3xψ2x2

θ2x2 ψ3x ++- = (-…
- θ3x3
(5.2.13)
-

Trong trường hợp của chúng tôi, mối quan hệ này giảm xuống

()()1 (- φx 1 - x 1+ψ1x
+ 3ψ2x2
… 1 =
ψ3x ++ )

hoặc

) ++ (φ
[1 1 - (] x φx2 1+ ψ1x
+ + ψ2x2
3 … 1ψ3x
= + )

Tương tự như lũy thừa của x trên cả hai vế, chúng ta thu được

† Lưu ý rằng đây giống như một mô hình AR (2) đặc biệt. Tuy nhiên, một trong những gốc của
đa thức đặc trưng AR (2) tương ứng là 1 và điều này không được phép trong AR cố định (2)
các mô hình.
Machine Translated by Google

5.3 Các điều khoản không đổi trong các mô hình ARIMA 97

- ()φ 1ψ1+ + 0 =

φ -() ψ 1 + φ 1+ ψ2
= 0

và nói chung,
=
ψk () ψ 1 + φ k 1– φψk 2–
- cho k ≥ 2 (5.2.14)

với ψo = 1 và ψ1 = 1 + φ. Đệ quy này với các giá trị bắt đầu cho phép chúng tôi tính toán như
nhiều trọng lượng ψ khi cần thiết. Nó cũng có thể được chỉ ra rằng trong trường hợp này, một giải pháp rõ ràng

đệ quy được đưa ra dưới dạng


-
1 φk 1+ =
ψk --------------------- với k ≥ 1 (5.2.15)
1 - φ

(Ví dụ, có thể dễ dàng chứng minh rằng biểu thức này thỏa mãn Công thức (5.2.14).

5.3 Các điều khoản không đổi trong các mô hình ARIMA

Đối với mô hình ARIMA (p, d, q) , dYt = Wt là quá trình ARMA (p, q) tĩnh . Giả định stan
dard của chúng tôi là các mô hình tĩnh có giá trị trung bình bằng 0; đó là, chúng tôi thực sự
làm việc với độ lệch so với giá trị trung bình không đổi. Giá trị trung bình của hằng số khác

không, μ, trong mô hình ARMA tĩnh {Wt } có thể được điều chỉnh theo một trong hai cách. Chúng ta có thể
giả sử

=
( Wt - μ φ1 Wt 1– ) φ - +μ (++ () - Wt
μ… 2–
φp Wt 2 p -) - μ

- - -
et + 1et 1– θ2et 2– -… qet q -

Ngoài ra, chúng ta có thể đưa một số hạng không đổi θ0 vào mô hình như sau:

+ =φ1Wt
Wt θ0 + ++
1– φ2Wt 2– … PWt p -
+ et
- θ1et 1– θ2et 2– - - -
… qet q -

Lấy các giá trị mong đợi trên cả hai mặt của biểu thức sau, chúng tôi thấy rằng

θ0 +φ1= φ2
(μ … φp ) +++ μ

để có thể

θ0
μ = -------------------------------------------------

- -
(5.3.16)
1 φ1 φ2 - -… φp

hoặc ngược lại, điều đó

- -
= μ 1 φ1 φ2 - -… φp )
( θ0 (5.3.17)

Vì các đại diện thay thế là tương đương, chúng tôi sẽ sử dụng bất kỳ thông số nào
thuận tiện.
Machine Translated by Google

98 Mô hình cho chuỗi thời gian không tĩnh

Ảnh hưởng của ý nghĩa khác không đối với Wt trên chuỗi Yt không khác biệt sẽ như thế nào?
Hãy xem xét trường hợp IMA (1,1) với một số hạng không đổi. Chúng ta có

= + θet
Yt Yt 1– θ0 et + -1–

hoặc

Wt θ0- et
+ et
= 1–

Bằng cách thay thế vào Công thức (5.2.3) trên trang 93 hoặc bằng cách lặp lại quá khứ, chúng tôi
tìm thấy điều đó

= +
Yt et () 1 - 1–
θ et + ()θ 1và- 2– ++ …-(1 - θ e –) m θe– ( t 1 m -
(5.3.18)
+ mθ+0+ 1)

So sánh điều này với Công thức (5.2.6), chúng ta thấy rằng chúng ta có thêm một định thức tuyến tính

xu hướng thời gian (t + m + 1) θ0 với hệ số góc θ0.

Sau đó, một đại diện tương đương của quá trình sẽ là

Yt = +Yt+' t
β0 β1

' '
đâu là chuỗi
Yt IMA (1,1) với E Yt () = 0 Evà( Y = β1. t )(Đối
dYtvới mô
q) tổng quát trong đó E ) hình ARIMA 0,
(p,có
d,thể lập luận rằng Yt =
' '
Yt μt + , trong đó μt là đa thức xác định bậc d và là ARIMA (p,Ytd, q)
'
với E =Yt0. Với d = 2 và θ0 0, một xu hướng bậc hai sẽ được ngụ ý.

5.4 Các biến đổi khác

Chúng tôi đã thấy sự khác biệt có thể là một chuyển đổi hữu ích để đạt được sự ổn định như thế nào.

Tuy nhiên, phép biến đổi logarit cũng là một phương pháp hữu ích trong một số trường hợp nhất định.

Chúng tôi thường xuyên gặp phải các chuỗi trong đó sự phân tán gia tăng dường như được liên kết với

cấp độ cao hơn của chuỗi — cấp độ của chuỗi càng cao, thì càng có nhiều biến thể
xung quanh mức đó và ngược lại.
Cụ thể, giả sử rằng Yt > 0 với mọi t và

E Yt () μt =
và Var Yt () μt = σ (5.4.1)

sau đó
2
và Var () σ log ≈
E []
Yt μ log ()
log≈ () t Yt () (5.4.2)

Những kết quả này sau khi lấy các giá trị và phương sai mong đợi của cả hai bên của
(Taylor) mở rộng
Yt μt -
≈ + ---------------
Nhật ký Yt () μt log ()
μt

Nói cách khác, nếu độ lệch chuẩn của chuỗi tỷ lệ với mức của chuỗi,
sau đó biến đổi sang logarit sẽ tạo ra một chuỗi có độ biến thiên xấp xỉ không đổi
theo thời gian. Ngoài ra, nếu mức độ của chuỗi thay đổi gần như theo cấp số nhân, thì
Machine Translated by Google

5.4 Các biến đổi khác 99

chuỗi được biến đổi log sẽ thể hiện xu hướng thời gian tuyến tính. Do đó, chúng ta có thể muốn lấy

những điểm khác biệt đầu tiên. Một tập hợp các giả định thay thế dẫn đến sự khác biệt của dữ liệu đã ghi
theo sau.

Phần trăm Thay đổi và Logarit

Giả sử Yt có xu hướng thay đổi tỷ lệ phần trăm tương đối ổn định từ một khoảng thời gian đến
tiếp theo. Cụ thể, giả sử rằng
=
Yt 1 Xt
) (+ Yt 1–

trong đó 100Xt là phần trăm thay đổi (có thể âm) từ Yt-1 đến Yt . sau đó

Yt
Yt log () - log () Yt 1– = log -----------
Yt 1–

= log ( 1 +Xt )

Nếu Xt bị hạn chế, giả sử, | Xt | <0,2 (nghĩa là phần trăm thay đổi tối đa là ± 20%),
sau đó, để gần đúng, log (1 + Xt ) ≈ Xt . Do đó,

[Yt ] log () Xt ≈ (5.4.3)

sẽ tương đối ổn định và có lẽ được mô hình hóa tốt bởi một quá trình tĩnh. Thông báo rằng
chúng tôi ghi nhật ký trước và sau đó tính toán sự khác biệt đầu tiên — thứ tự quan trọng. Trong tài chính

văn học, sự khác biệt của logarit (tự nhiên) thường được gọi là lợi nhuận.
Ví dụ, hãy xem xét chuỗi thời gian được hiển thị trong Phụ lục 5.8. Loạt bài này mang lại cho

tổng lượng điện hàng tháng được tạo ra ở Hoa Kỳ tính bằng hàng triệu kilowatt giờ.
Các giá trị cao hơn hiển thị nhiều biến thể hơn đáng kể so với các giá trị thấp hơn.

Biểu đồ 5.8 Điện lực Hoa Kỳ được tạo ra theo tháng

Điện
lực

350000
250000
150000

1975 1980 1985 1990 1995 2000 2005

Thời gian

> dữ liệu (điện); âm mưu (điện)


Machine Translated by Google

100 Mô hình cho chuỗi thời gian không tĩnh

Hình 5.9 hiển thị biểu đồ chuỗi thời gian của logarit của các giá trị điện.
Lưu ý rằng số lượng biến động xung quanh xu hướng tăng hiện đồng đều hơn nhiều
trên các giá trị cao và thấp của chuỗi.

Biểu đồ 5.9 Chuỗi thời gian Đồ thị lôgarit của các giá trị điện

12,8

12.4

(điện)
Nhật

12.0

1975 1980 1985 1990 1995 2000 2005

Thời gian

> plot (log (điện), ylab = 'Log (điện)')

Sự khác biệt của logarit của các giá trị điện được hiển thị trong Hình ảnh minh họa
5.10. Trên cơ sở của biểu đồ này, chúng ta có thể xem xét một mô hình cố định là thích hợp.

Hình 5.10 Sự khác biệt của Logarit đối với chuỗi thời gian điện

0,1

(điện)
Nhật
biệt
khác
của

Sự
0,1
0,2
0,0

1975 1980 1985 1990 1995 2000 2005

Thời gian

> plot (diff (log (điện)), ylab = 'Sự


khác biệt của Log (điện)')
Machine Translated by Google

5.4 Các biến đổi khác 101

Biến đổi nguồn điện

Một họ các phép biến đổi linh hoạt, các phép biến đổi sức mạnh, đã được giới thiệu bởi
Box và Cox (1964). Đối với một giá trị nhất định của tham số λ, phép biến đổi được xác định
qua

xλ 1–
--------------
cho λ 0
= λ (5.4.4)
g x ()

nhật
x cho λ 0 =

Thuật ngữ xλ là phần quan trọng của biểu thức đầu tiên, trừ 1 và chia
bởi λ làm cho g (x) thay đổi thuận lợi khi λ tiến gần đến 0. Trên thực tế, một đối số giải tích †
cho thấy rằng dưới dạng λ 0 , (xλ - 1) / λ log (x). Chú ý rằng λ = ½ tạo ra căn bậc hai

phép biến đổi hữu ích với dữ liệu giống Poisson và λ = 1 tương ứng với một nghịch đảo
sự biến đổi.

Việc chuyển đổi công suất chỉ áp dụng cho các giá trị dữ liệu dương. Nếu một số giá trị
là âm hoặc 0, một hằng số dương có thể được thêm vào tất cả các giá trị để làm cho chúng
tất cả đều tích cực trước khi thực hiện chuyển đổi điện năng. Sự thay đổi thường được xác định một

cách cẩn thận. Ví dụ: đối với dữ liệu đánh bắt không âm trong sinh học, sự xuất hiện của các số không là

thường được xử lý bằng cách thêm một hằng số bằng giá trị dữ liệu dương nhỏ nhất vào tất cả
các giá trị dữ liệu. Một cách tiếp cận thay thế bao gồm sử dụng các phép biến đổi áp dụng cho
bất kỳ dữ liệu nào — tích cực hay không. Một hạn chế của cách tiếp cận thay thế này là các diễn giải

của các phép biến đổi như vậy thường ít đơn giản hơn so với cách diễn giải của
các phép biến đổi công suất. Xem Yeo và Johnson (2000) và các tài liệu tham khảo có
trong đó.

Chúng ta có thể coi λ là một tham số bổ sung trong mô hình được ước tính từ
dữ liệu quan sát. Tuy nhiên, ước tính chính xác của λ thường không được bảo đảm. Đánh giá của
một loạt các phép biến đổi dựa trên lưới các giá trị λ, chẳng hạn như ± 1, ± 1/2, ± 1/3, ± 1/4 và 0,

thường sẽ đủ và có thể có một số ý nghĩa trực quan.


Phần mềm cho phép chúng tôi xem xét một loạt các giá trị lambda và tính toán giá trị mui
xe log-likeli cho mỗi giá trị lambda dựa trên một hàm khả năng bình thường. Một âm mưu trong số này
các giá trị được thể hiện trong Hình 5.11 cho dữ liệu điện. Khoảng tin cậy 95% cho
λ chứa giá trị của λ = 0 khá gần tâm của nó và gợi ý mạnh mẽ về một lôgarit
biến đổi (λ = 0) cho những dữ liệu này.

† Bài tập (5.17) yêu cầu bạn xác minh điều này.
Machine Translated by Google

102 Mô hình cho chuỗi thời gian không tĩnh

Hình 5.11 Khả năng ghi nhật ký so với Lambda

95%
1500

1480

1460

nhật
năng
ghi
Khả

1440

1420

2 1 0 1 2

> BoxCox.ar (điện)

5.5 Tóm tắt

Chương này đã giới thiệu khái niệm về sự khác biệt để tạo ra sự ổn định trên một số
các quy trình phi tĩnh. Điều này dẫn đến việc di chuyển tự động hồi phục tích hợp quan trọng
mô hình trung bình (ARIMA). Các thuộc tính của các mô hình này sau đó được triệt để
đã khám phá. Các phép biến đổi khác, cụ thể là thay đổi tỷ lệ phần trăm và logarit, sau đó
được xem xét. Nói chung hơn, các phép biến đổi công suất hoặc phép biến đổi Box-Cox là
được giới thiệu là các phép biến đổi hữu ích thành tính đứng yên và thường là tính chuẩn.
Machine Translated by Google

Bài tập 103

BÀI TẬP

5.1 Xác định những điều sau đây là các mô hình ARIMA cụ thể. Tức là p, d và q là gì và
giá trị của các tham số (của φ và θ) là gì? (a) Yt = Yt - 1 - 0,25Yt - 2 + et -
0,1et - 1. (b) Yt = 2Yt - 1 - Yt 2 + et . (c) Yt = 0,5Yt - 1 - 0,5Yt - 2 + et -
0,5et - 1+ 0,25et - 2.

5.2 Đối với mỗi mô hình ARIMA dưới đây, hãy cung cấp các giá trị cho E ( Yt ) và Var ( Yt ).
(a) Yt = 3 + Yt - 1 + et - 0,75et -

1. (b) Yt = 10 + 1,25Yt - 1 - 0,25Yt - 2 + et - 0,1et -

1. (c) Yt = 5 + 2Yt - 1 - 1,7Yt - 2 + 0,7Yt - 3 + et - 0,5et - 1+ 0,25et - 2.



5.3 Giả sử rằng {Yt } được tạo theo Yt = et + cet - 1+ cet - 2+ cet - 3+ +
ce0 với t >
0. (a) Tìm hàm trung bình và hiệp phương sai của {Yt }. {Yt } có đứng yên
không ? (b) Tìm hàm trung bình và hiệp phương sai của { Yt }. { Yt } có đứng yên
không? (c) Xác định {Yt } là một quy trình ARIMA cụ thể.
5.4 Giả sử rằng Yt = A + Bt + Xt , trong đó {Xt } là một bước đi ngẫu nhiên. Trước tiên, giả sử rằng A
và B là hằng số. (a)

{Yt } có đứng yên không ?

(b) { Yt } có đứng yên không?

Bây giờ, giả sử rằng A và B là các biến ngẫu nhiên độc lập với bước đi ngẫu nhiên {Xt }.

(c) {Yt } có đứng yên không ? (d) { Yt } có đứng yên không?

5.5 Sử dụng các giá trị nhiễu trắng được mô phỏng trong Phụ lục 5.2, trên trang 88, xác minh giá trị

ues được hiển thị cho quá trình bùng nổ Yt .

5.6 Xem xét một quá trình tĩnh {Yt }. Chứng tỏ rằng nếu ρ1 <½, Yt có phương sai lớn hơn
hơn Yt .
5.7 Xét hai mô hình: A: Yt

= 0,9Yt - 1 + 0,09Yt - 2 + et .
B: Yt = Yt - 1 + et -
0.1et - 1. (a) Xác định mỗi mô hình là một mô hình ARIMA cụ thể. Tức là p,
d và q là gì và giá trị của các tham số, của φ và θ là gì? (b) Hai mô hình
khác nhau ở những điểm nào? (c) Hai mô hình giống nhau ở những điểm nào? (So
sánh trọng lượng ψ và
π-trọng lượng.)
Machine Translated by Google

104 Mô hình cho chuỗi thời gian không tĩnh

5.8 Hãy xem xét một quy trình “AR (1)” không cố định được định nghĩa là một giải pháp cho Phương trình

(5.1.2) trên trang 88, với | φ | > 1.

(a) Suy ra một phương trình tương tự như Phương trình (5.1.3) trên trang 88, cho trường hợp khác

thường hơn. Sử dụng Y0 = 0 làm điều kiện ban đầu.

(b) Tìm ra một phương trình tương tự như Phương trình (5.1.4) ở trang 89, cho chi tiết này
trường hợp eral.

(c) Tìm ra một phương trình tương tự như Phương trình (5.1.5) ở trang 89, cho chi tiết này
trường hợp eral.

(d) Có đúng với bất kỳ | φ | > 1, () ≈ 1Corr Yt Yt ,k - cho t lớn và k vừa phải ?

5.9 Xác minh phương trình (5.1.10) trên trang 90.

5.10 Chuỗi ARIMA không cố định có thể được mô phỏng bằng cách đầu tiên mô phỏng chuỗi ARMA tĩnh tương ứng

và sau đó "tích hợp" nó (thực sự là tổng một phần

nó). Sử dụng phần mềm thống kê để mô phỏng nhiều chuỗi IMA (1,1) và IMA (2,2)

với nhiều giá trị tham số. Lưu ý bất kỳ "xu hướng" ngẫu nhiên nào trong mô phỏng
loạt.

5.11 Tệp dữ liệu winnebago chứa doanh số bán xe giải trí theo đơn vị hàng tháng

(RV) từ Winnebago, Inc., từ tháng 11 năm 1966 đến tháng 2 năm 1972.

(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.

(b) Bây giờ lấy logarit tự nhiên của số liệu bán hàng hàng tháng và hiển thị thời gian

biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.

(c) Tính các thay đổi tương đối của phân số, (Yt - Yt - 1) / Yt - 1, và so sánh chúng

với sự khác biệt của logarit (tự nhiên), log (Yt ) = log (Yt ) - log (Yt - 1).

Làm thế nào để họ so sánh cho các giá trị nhỏ hơn và cho các giá trị lớn hơn?

5.12 Tệp dữ liệu SP chứa chứng khoán Chỉ số Tổng hợp Standard & Poor hàng quý

giá trị từ quý đầu tiên của năm 1936 đến quý thứ tư của năm 1977.

(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.

(b) Bây giờ lấy logarit tự nhiên của các giá trị hàng quý và hiển thị và thời gian

biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.

(c) Tính các thay đổi tương đối (phân số), (Yt - Yt - 1) / Yt - 1, và so sánh

chúng với sự khác biệt của logarit (tự nhiên), log (Yt ). Làm thế nào để họ chia sẻ cho các

giá trị nhỏ hơn và cho các giá trị lớn hơn?

5.13 Đường bay tệp dữ liệu chứa số dặm hành khách hàng không hàng tháng của Hoa Kỳ bay từ tháng 1 năm 1949

đến tháng 12 năm 1960. Đây là chuỗi thời gian cổ điển được phân tích trong Box

và Jenkins (1976).

(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.

(b) Bây giờ lấy logarit tự nhiên của các giá trị hàng tháng và hiển thị và thời gian

biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.

(c) Tính các thay đổi tương đối (phân số), (Yt - Yt - 1) / Yt - 1, và so sánh

chúng với sự khác biệt của logarit (tự nhiên), log (Yt ). Làm thế nào để họ chia sẻ cho các

giá trị nhỏ hơn và cho các giá trị lớn hơn?
Machine Translated by Google

Phụ lục D: Người điều hành dịch chuyển lùi 105

5.14 Xem xét dữ liệu về lượng mưa hàng năm của Los Angeles được trình bày trong Phụ lục 1.1, trên trang

2. Biểu đồ bình thường lượng tử-lượng tử của những dữ liệu này, được hiển thị trong Phụ lục 3.17, trên trang

50, thuyết phục chúng tôi rằng dữ liệu không bình thường. Dữ liệu nằm trong tệp tin .

(a) Sử dụng phần mềm để tạo ra một biểu đồ tương tự như Phụ lục 5.11, trên trang 102, và xác định giá trị

“tốt nhất” của λ cho phép biến đổi dữ liệu.

(b) Hiển thị một biểu đồ lượng tử-lượng tử của dữ liệu được biến đổi. Họ có nhiều hơn cũng không
con đực?

(c) Tạo một biểu đồ chuỗi thời gian của các giá trị đã biến đổi.

(d) Sử dụng các giá trị đã chuyển đổi để hiển thị biểu đồ Yt so với Yt - 1 như trong Hình minh họa

1.2, ở trang 2. Chúng ta có nên mong đợi sự biến đổi để thay đổi sự phụ thuộc

hoặc thiếu sự phụ thuộc trong bộ truyện?

5.15 Thu nhập hàng quý trên mỗi cổ phiếu của Công ty Johnson & Johnson được đưa ra trong

tệp dữ liệu có tên JJ. Dữ liệu bao gồm các năm từ 1960 đến 1980.

(a) Hiển thị biểu đồ chuỗi thời gian của dữ liệu. Giải thích các tính năng thú vị trong

kịch bản.

(b) Sử dụng phần mềm để tạo ra một biểu đồ tương tự như Phụ lục 5.11, trên trang 102, và xác định giá trị

"tốt nhất" của λ cho phép biến đổi lũy thừa của những dữ liệu này.

(c) Hiển thị biểu đồ chuỗi thời gian của các giá trị đã biến đổi. Cốt truyện này có gợi ý không

rằng một mô hình tĩnh có thể thích hợp?

(d) Hiển thị biểu đồ chuỗi thời gian về sự khác biệt của các giá trị đã biến đổi. Làm

âm mưu này gợi ý rằng một mô hình tĩnh có thể thích hợp cho các chủng tộc khác nhau?

5.16 Tệp có tên vàng chứa giá vàng hàng ngày (tính bằng đô la trên một ounce troy) cho

252 ngày giao dịch của năm 2005.

(a) Hiển thị biểu đồ chuỗi thời gian của những dữ liệu này. Diễn giải cốt truyện.

(b) Hiển thị biểu đồ chuỗi thời gian về sự khác biệt của logarit của những dữ liệu này.

Diễn giải âm mưu này.

(c) Tính toán và hiển thị ACF mẫu cho sự khác biệt của logarit của

những dữ liệu này và lập luận rằng logarit dường như tuân theo một bước đi ngẫu nhiên
người mẫu.

(d) Hiển thị sự khác biệt của các bản ghi trong biểu đồ và diễn giải.

(e) Hiển thị sự khác biệt của các bản ghi trong một biểu đồ bình thường lượng tử-lượng tử và liên

xinh đẹp.

5.17 Sử dụng phép tính để chỉ ra rằng, với bất kỳ x > 0 cố định nào, khi λ 0 λx 1–
, ⁄
λ
()logx .
Machine Translated by Google

106 Mô hình cho chuỗi thời gian không tĩnh

Phụ lục D: Người điều hành dịch chuyển lùi

Nhiều cuốn sách khác và phần lớn văn học loạt thời gian sử dụng cái được gọi là sự dịch chuyển ngược

để thể hiện và thao tác các mô hình ARIMA . Toán tử dịch chuyển ngược, ký hiệu là B,
hoạt động dựa trên chỉ mục thời gian của một chuỗi và dịch chuyển thời gian trở lại một đơn vị thời gian để tạo thành một

† Đặc biệt,
=
BYt Yt 1–

Toán tử dịch chuyển ngược là tuyến tính vì đối với bất kỳ hằng số a, b, c và chuỗi Yt và Xt , nó
dễ dàng nhận thấy điều đó

B (aYt +bXt
+ c ) = aBYt +bBXt + c

Bây giờ hãy xem xét mô hình MA (1). Về mặt B, chúng ta có thể viết

= == -
Yt et θet 1– et θBet - 1 () - θB et

=
θ () B et

trong đó θ (B) là đa thức đặc trưng MA được “đánh giá” tại B.


Vì bản thân BYt là một chuỗi thời gian, nên việc coi BBYt là có ý nghĩa . Nhưng rõ ràng BBYt
= BYt - 1 = Yt - 2, và chúng ta có thể viết

=
B2Yt Yt 2–

Nói chung, chúng tôi có


=
BmYt Yt m–

với mọi số nguyên dương m. Đối với mô hình MA (q) tổng quát , chúng ta có thể viết

= - - ––
Yt et θ1et 1– θ2et 2– … Qet q
= ––
- et θ1Betθ2B2et
- 1 θ1 - … θqBqe
t

=
θqBq
- B )
θ2B2
–– et
- (…
hoặc

=
Yt θ () B et

trong đó, một lần nữa, θ (B) là đa thức đặc trưng MA được đánh giá tại B.
Đối với mô hình tự động hồi quy AR (p), trước tiên, chúng tôi chuyển tất cả các thuật ngữ liên quan đến Y sang
phía tay trái
- - -
Yt φ1Yt 1– φ2Yt 2– -… φpYt p - et =

và sau đó viết

Yt φ1BYt -φ2B2Yt -
-… φpBpYt - et =

hoặc

† Đôi khi B được gọi là toán tử Lag.


Machine Translated by Google

Phụ lục D: Người điều hành dịch chuyển lùi 107

-
- 1(-…
φ1 φpBp
- B φ2B2
) Yt et =

có thể được diễn đạt dưới dạng

φ () B Yt et =

trong đó φ (B) là đa thức đặc trưng AR được đánh giá tại B.


Kết hợp cả hai, mô hình ARMA (p, q) chung có thể được viết gọn gàng như

=
φ () B Yt θ () B et

Sự khác biệt cũng có thể được thể hiện một cách thuận tiện trong điều khoản B. Chúng tôi có

Y = - = -
t Yt Yt 1– Yt BYt
= ()
1 - B Yt

với sự khác biệt thứ hai được đưa ra bởi

=
2Yt ( 1 - B 2Yt )
2
Thực tế , = 1 - B và 2 = (1 - B) .
Mô hình ARIMA (p, d, q) chung được diễn đạt một cách ngắn gọn như

=
() B ()1 - B dYt θ () B et φ

Trong tài liệu, người ta phải cẩn thận phân biệt với ngữ cảnh, việc sử dụng B như một
toán tử dịch chuyển ngược và việc sử dụng nó như một biến thực (hoặc phức) bình thường. Ví dụ,
điều kiện đứng yên thường được đưa ra bằng cách nói rằng các gốc của φ (B) = 0 phải là
lớn hơn 1 về giá trị tuyệt đối hoặc tương đương, phải nằm ngoài vòng tròn đơn vị trong
mặt phẳng phức tạp. Ở đây, B được coi là một biến giả trong một phương trình chứ không phải là
toán tử lùi xe.
Machine Translated by Google

CHƯƠNG 6

THÔNG SỐ KỸ THUẬT MÔ HÌNH

Chúng tôi đã phát triển một nhóm lớn các mô hình tham số cho cả chuỗi thời gian tĩnh và không
tĩnh — các mô hình ARIMA. Bây giờ chúng tôi bắt đầu nghiên cứu và triển khai
suy luận thống kê cho các mô hình như vậy. Các chủ đề của ba chương tiếp theo, tương ứng, là:

1. làm thế nào để chọn các giá trị thích hợp cho p, d, và q cho một loạt các;

2. cách ước lượng các tham số của một mô hình ARIMA (p, d, q) cụ thể ;

3. làm thế nào để kiểm tra sự phù hợp của mô hình được trang bị và cải thiện nó nếu cần.

Chiến lược tổng thể của chúng tôi trước tiên sẽ là quyết định các giá trị hợp lý - nhưng mang tính dự kiến -

cho p, d và q. Sau khi làm như vậy, chúng tôi sẽ ước tính φ's, θ's và σe cho mô hình đó trong
cách hiệu quả nhất. Cuối cùng, chúng ta sẽ xem xét kỹ lưỡng mô hình được trang bị do đó thu được
để kiểm tra tính đầy đủ của nó, giống như cách chúng ta đã làm trong Phần 3.6 trên trang 42. Nếu
theo một cách nào đó, mô hình có vẻ bất cập, chúng tôi coi bản chất của sự không phù hợp là
giúp chúng tôi chọn một mô hình khác. Chúng tôi tiến hành ước tính mô hình mới đó và kiểm tra
sự đầy đủ.
Với một vài lần lặp lại của chiến lược xây dựng mô hình này, chúng tôi hy vọng sẽ đạt được kết quả tốt nhất

mô hình khả thi cho một loạt nhất định. Cuốn sách của George EP Box và GM Jenkins
(1976) đã phổ biến kỹ thuật này đến nỗi nhiều tác giả gọi quy trình là “phương pháp Box
Jenkins”. Chúng ta bắt đầu bằng cách tiếp tục điều tra các thuộc tính của hàm tự tương quan sam
ple.

6.1 Các thuộc tính của chức năng tự tương quan mẫu

Nhớ lại từ trang 46 định nghĩa của mẫu hoặc hàm tự tương quan ước lượng.

Đối với chuỗi quan sát Y1, Y2,…, Yn, chúng ta có

N
_ _
( k - ) -Y
( Yt )Y - Yt
tk 1 + =
rk
= ------------------------------------------------- --------------
cho k = 1, 2, ... (6.1.1)
N _
2
( Yt )Y -
t 1 =

Mục tiêu của chúng tôi là nhận ra, trong phạm vi có thể, các mẫu trong rk là đặc trưng
của các mẫu đã biết trong ρk cho các mô hình ARMA phổ biến. Ví dụ, chúng tôi biết rằng
ρk = 0 với k> q trong mô hình MA (q) . Tuy nhiên, vì rk chỉ là ước tính của ρk, chúng tôi

109
Machine Translated by Google

110 Đặc điểm kỹ thuật mô hình

cần phải điều tra các đặc tính lấy mẫu của chúng để tạo điều kiện thuận lợi cho việc so sánh các
tương quan với tương quan lý thuyết.

Từ định nghĩa của rk, một tỷ lệ của các hàm bậc hai có thể phụ thuộc ables,
cần rõ ràng rằng các đặc tính lấy mẫu của rk sẽ không dễ dàng thu được.
Ngay cả giá trị kỳ vọng của rk cũng khó xác định — hãy nhớ rằng giá trị kỳ vọng của
một tỷ lệ không phải là tỷ lệ của các giá trị kỳ vọng tương ứng. Chúng tôi sẽ hài lòng khi chấp nhận một

kết quả mẫu lớn tổng quát và xem xét ý nghĩa của nó trong các trường hợp đặc biệt. Bartlett (1946)

thực hiện các công việc ban đầu. Chúng ta sẽ lấy một kết quả tổng quát hơn từ Anderson (1971).
Một cuộc thảo luận gần đây về những kết quả này có thể được tìm thấy trong Shumway và Stoffer (2006, tr.

519).
Chúng tôi cho rằng

Yt +
μ = ψj et j -
j 0 =

trong đó et là độc lập và được phân phối giống nhau với phương tiện bằng không và phương sai hữu
hạn, khác không, phổ biến. Chúng tôi giả định thêm rằng

∞ ∞
2
∞ <và ψj ∞jψj
<
j 0 = j 0 =

(Những điều này sẽ được đáp ứng bởi bất kỳ mô hình ARMA cố định nào.)

Sau đó, đối với bất kỳ m cố định nào , phân phối chung của

r1()ρ1- n , n ()…
r2 ρ2- n,,
rm-()
ρm

phương pháp tiếp cận, n ∞ , một phân phối chuẩn chung với giá trị trung bình bằng 0, phương sai cjj và

như hiệp phương sai cij, trong đó


- - 2
+ + (6.1.2)
cij = ( ρk i + ρk j + ρk i - ρk j + 2ρi ρkρk j + 2ρj ρkρk i + 2ρi ρj ρk )
k - = ∞

Đối với n lớn, chúng ta sẽ nói rằng rk được phân phối xấp xỉ chuẩn với giá trị trung bình ρk
và phương sai ckk / n. Hơn nữa, () giao , xấp
ckj ckkcjj
phối . Lưu
⁄≈ xỉ Corr rk rj của ýrkrằng phương
tỷ lệ sai
nghịch
với kích thước mẫu, nhưng (), Là
Corr rk rj
xấp xỉ không đổi đối với n lớn .
Vì Công thức (6.1.2) rõ ràng là khó giải thích theo tính tổng quát hiện tại của nó, chúng tôi

sẽ xem xét một số trường hợp đặc biệt quan trọng và đơn giản hóa. Trước tiên, giả sử rằng {Yt }
là tiếng ồn trắng. Sau đó, Công thức (6.1.2) giảm đáng kể, và chúng tôi thu được

1
≈ (6.1.3)
Var rk () (- và Corr rk rj ), 0 cho kj ≈
N

Tiếp theo, giả sử rằng {Yt } được tạo ra bởi một quá trình AR (1) với ρk = φk với k > 0.
Sau đó, sau đại số đáng kể và tính tổng một số chuỗi hình học, Phương trình
(6.1.2) với i = j sản lượng

1 1 φ2 +) (1- φ2k ()
≈ - ------------------------------------------
-
(6.1.4)
Var rk ()
N
2kφ2k 1 φ2 -
Machine Translated by Google

6.1 Các thuộc tính của chức năng tự tương quan mẫu 111

Đặc biệt,

1 φ2 -
Var r1 ()
≈ --------------
(6.1.5)
N

Lưu ý rằng φ càng gần ± 1, ước tính của chúng ta về ρ1 (= φ) càng trở nên chính xác hơn.
Đối với độ trễ lớn, các thuật ngữ trong Công thức (6.1.4) liên quan đến φk có thể bị bỏ qua, và chúng tôi

-1 1 φ2 +
Var rk () ≈ -------------- cho k lớn (6.1.6)
N
1 φ2 -

Lưu ý rằng ở đây, trái ngược với Công thức (6.1.5), các giá trị của φ gần với ± 1 ngụ ý rằng biến thể

lớn φk ≈ 0
dấu ngoặc cho rk. Vì vậy, chúng ta không nên mong đợi ước tính gần như chính xác của ρk = cho

k lớn khi ta làm ρk = φk với k nhỏ .


Đối với mô hình AR (1), Phương trình (6.1.2) cũng có thể được đơn giản hóa (sau nhiều đại số)

cho chung 0 < i < j as

-
= ()φ ji - φ ji + 1 φ2
+ () + () φ ji - ji -- () φ ji + ji + (6.1.7)
-------------------------------------------------- ---

cij
1 φ2 -

Đặc biệt, chúng tôi nhận thấy

1 φ2 -
, () ≈ 2φ (6.1.8)
---------------------------------
Corr r1 r2
1 2φ2 3φ4 - +

Dựa trên các phương trình (6.1.4) đến (6.1.8), Phụ lục 6.1 đưa ra tiêu chuẩn gần đúng
sai lệch và tương quan đối với một số độ trễ và một vài giá trị của φ trong các mô hình AR (1).

Phụ lục 6.1 Kết quả mẫu lớn cho rk được chọn từ Mô hình AR (1)

φ Var r1 () Var r2 () Corr r1 r2


(), Var r10 ()
± 0,9 0,44 ⁄ n 0,807 ⁄ n ± 0,97 2,44 ⁄ n

± 0,7 0,71 ⁄ n 1,12 ⁄ n ± 0,89 1,70 ⁄ n

± 0,4 0,92 ⁄ n 1,11 ⁄ n ± 0,66 1,18 ⁄ n

± 0,2 0,98 ⁄ n 1,04 ⁄ n ± 0,38 1,04 ⁄ n

Đối với trường hợp MA (1), Công thức (6.1.2) đơn giản hóa như sau:

= - 2
2 + = + cho k > 1 (6.1.9)
c11 1 3ρ1 4 và ckk 4ρ1 1 2ρ1

Hơn nữa,
= 2
( c12 2ρ1 1 ρ1) - (6.1.10)

Dựa trên các biểu thức này, Phụ lục 6.2 liệt kê các độ lệch chuẩn mẫu lớn và quan
hệ cor cho tự tương quan mẫu đối với một số độ trễ và một số giá trị θ. Để ý
một lần nữa rằng các tự tương quan mẫu có thể tương quan cao và tiêu chuẩn
độ lệch của rk lớn hơn đối với k > 1 so với k = 1.
Machine Translated by Google

112 Đặc điểm kỹ thuật mô hình

Phụ lục 6.2 Kết quả mẫu lớn cho rk được chọn từ Mô hình MA (1)

θ
Var r1 () Var rk () cho k > 1 Corr r1 (),
r2
± 0,9 0,71 ⁄ n 1,22 ⁄ n + 0,86

± 0,7 0,73 ⁄ n 1,20 ⁄ n + 0,84

± 0,5 0,79 ⁄ n 1,15 ⁄ n + 0,74

± 0,4 0,89 ⁄ n 1,11 ⁄ n + 0,53

Đối với quy trình MA (q) tổng quát và i = j = k, Công thức (6.1.2) giảm xuống

q
ckk 1 2 ρj2 cho kq >
+ =
j 1 =

để có thể

q
1 2
= - 1 2 + (6.1.11)
Var rk ()
N cho ρj kq >
j 1 =

Đối với một chuỗi thời gian được quan sát, chúng ta có thể thay thế ρ bằng r, lấy căn bậc hai, và

thu được độ lệch chuẩn ước tính của rk, nghĩa là, sai số chuẩn của rk đối với
trễ. Kiểm tra giả thuyết rằng chuỗi là MA (q) có thể được thực hiện bằng cách so sánh
rk để cộng và trừ hai lỗi tiêu chuẩn. Chúng tôi sẽ bác bỏ giả thuyết vô hiệu nếu và chỉ
nếu rk nằm ngoài các giới hạn này. Nói chung, chúng ta không nên mong đợi mẫu autocorrela tion
mô phỏng quá trình tự tương quan thực một cách chi tiết. Vì vậy, chúng ta không nên ngạc nhiên khi

xem các gợn sóng hoặc "xu hướng" trong rk mà không có đối tác nào trong ρk.

6.2 Các chức năng tự tương quan một phần và mở rộng

Vì đối với các mô hình MA (q) , hàm tự tương quan bằng 0 đối với độ trễ vượt quá q,
nên tự tương quan sam sung là một chỉ báo tốt về thứ tự của quá trình. Tuy nhiên, các
quan hệ autocor của một mô hình AR (p) không trở thành 0 sau một số độ trễ nhất định — chúng
chết đi chứ không phải cắt bỏ. Vì vậy, một chức năng khác là cần thiết để giúp xác định thứ tự
của các mô hình tự phục hồi. Một chức năng như vậy có thể được định nghĩa là mối tương quan giữa Yt
và Yt - k sau khi loại bỏ ảnh hưởng của các biến can thiệp Yt - 1, Yt - 2, Yt - 3,…,

Yt - k + 1. Hệ số này được gọi là tự tương quan từng phần ở độ trễ k và sẽ được ký hiệu là
bởi φkk. (Lý do cho chỉ số phụ kép dường như dư thừa trên φkk sẽ trở thành
rõ ràng sau này trong phần này.)
Có một số cách để làm cho định nghĩa này chính xác. Nếu {Yt } là một phân phối bình thường
chuỗi thời gian đã định, chúng ta có thể để

= Yt Yt k - ,| Yt 1– Yt 2– ,,
φkk Corr … Yt k - 1 + () (6.2.1)

Nghĩa là, φkk là mối tương quan trong phân phối lưỡng biến của Yt và Yt - k với điều kiện

Yt - 1, Yt - 2,…, Yt - k + 1.
Machine Translated by Google

6.2 Các chức năng tự tương quan một phần và mở rộng 113

Một cách tiếp cận thay thế, không dựa trên tính chuẩn mực, có thể được phát triển như sau
đường. Xem xét dự đoán Yt dựa trên một hàm tuyến tính của các biến can thiệp Yt - 1,

Yt - 2,…, Yt - k + 1, giả sử, β1Yt - 1+ β2Yt - 2 + + βk - 1Yt - k + 1, với β được chọn để
giảm thiểu sai số bình phương trung bình của dự đoán. Nếu chúng ta giả định rằng các β đã như vậy
được lựa chọn và sau đó suy nghĩ ngược lại theo thời gian, điều đó xảy ra theo lý do rằng

“điểm trước” tốt nhất


+1+của Yt - k dựa trên cùng một Yt - 1, Yt - 2,…, Yt - k +1 sẽ là β1Yt - k
… Khi đó, hàm tự tương quan một phần ở độ trễ k là
β2Yt - k + 2+ + βk - 1Yt - 1.
được định nghĩa là mối tương quan giữa các sai số dự đoán; đó là,

= - -
,
φkk Corr Y ( t β1Yt 1– β2Yt 2–
1– ––… βk β2Yt k - 2 +
Yt 2–
(6.2.2)
- - -
Yt k - β1Yt k - 1 + … - βk 1– Yt 1– )

(Đối với chuỗi phân phối chuẩn, có thể chứng minh rằng hai định nghĩa trùng khớp.)
quy ước, ta lấy φ11 = 1.
Ví dụ, hãy xem xét φ22. Nó được hiển thị trong Phụ lục F trên trang 218 rằng tốt nhất
dự đoán tuyến tính của Yt dựa trên riêng Yt - 1 chỉ là ρ1Yt - 1. Do đó, theo Công thức
(6.2.2), chúng tôi sẽ thu được φ22 bằng máy tính

- - = - - 2 2 ) + = ()
Cov (Yt ρ1Yt 1–,Yt 2– ρ1Yt 1– ) ρ2 2ρ1( γ0 2 ρ1 - ρ1 γ0 ρ2 ρ1

Từ
- = -
Var (Yt ρ1Yt 1– ) Var (Yt 2– ρ1Yt 1– )
2 2
= ()
γ0 1-ρ1+ 2ρ1
2
= ( γ0) 1- ρ1

chúng ta có rằng, đối với bất kỳ quá trình tĩnh nào, tự tương quan một phần độ trễ 2 có thể là
thể hiện như
- 2
ρ2 ρ1
φ22
----------------- =
(6.2.3)
- 2
1 ρ1

Bây giờ hãy xem xét một mô hình AR (1). Nhớ lại rằng ρk = φk để

= φ2 φ2 -
= ----------------- 0
φ22
1 φ2 -

Chúng ta sẽ sớm thấy rằng đối với trường hợp AR (1), φkk = 0 với mọi k > 1. Do đó, quan hệ lấy nét tự

động một phần là khác 0 đối với độ trễ 1, thứ tự của quá trình AR (1), nhưng bằng 0 đối với tất cả độ trễ

lớn hơn 1. Chúng tôi sẽ chỉ ra rằng điều này nói chung là trường hợp của các mô hình AR (p). Đôi khi

chúng ta nói rằng hàm tự tương quan một phần cho một quá trình AR (p) bị cắt sau khi
độ trễ vượt quá thứ tự của quá trình.
Hãy xem xét một trường hợp AR (p) tổng quát . Nó sẽ được chỉ ra trong Chương 9 rằng tuyến tính tốt nhất

dự đoán Yt dựa trên hàm tuyến tính của các biến Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1

với k > p là φ1Yt - 1 + φ2Yt - 2 + + φpYt - p. một Ngoài ra, dự đoán tuyến tính tốt nhất của Yt - k là
số hàm của Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1, gọi nó là h (Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1).
Vì vậy, hiệp phương sai giữa hai sai số dự đoán là
Machine Translated by Google

114 Đặc điểm kỹ thuật mô hình

-
Cov Y ( t φ1Yt 1– ––… φpYt p, --
2– φ2Yt

Yt k - -( h Yt k - ,
1 + Yt k -1–2 )+ ,,)
… Yt

= k - h(-Yt(,kCov Yt k - 2 + ,
- 1et+ Yt 0 vì et ,,… Đúng 1–))
= độc lập với Yt k - Yt k - 1 + Yt k ,- 2 + , ,,… Đúng 1–

Do đó, chúng tôi đã thiết lập một thực tế quan trọng rằng, đối với mô hình AR (p) ,

φkk = 0 cho kp > (6.2.4)

Đối với mô hình MA (1), Phương trình (6.2.3) nhanh chóng tạo ra

θ2 -
φ22
= ---------------------------
(6.2.5)
1 +
θ2 +θ4

Hơn nữa, đối với trường hợp MA (1), có thể chỉ ra rằng

θk 1 ()
θ2 -
φkk - = ---------------------------- cho k ≥ 1 (6.2.6)
1 -θ2 () k 1+

Lưu ý rằng tự tương quan từng phần của một mô hình MA (1) không bao giờ bằng 0 mà tự
nhiên giảm dần về 0 nhanh theo cấp số nhân khi độ trễ tăng lên — giống như hàm
autocorrela tion của quy trình AR (1). Nhìn chung hơn, có thể chỉ ra rằng một phần
tự tương quan của một mô hình MA (q) hoạt động rất giống như tự tương quan của một
Mô hình AR (q) .

Một phương pháp chung để tìm hàm tự tương quan từng phần cho bất kỳ
quá trình với hàm tự tương quan ρk như sau (xem Anderson 1971, trang 187–188,
Ví dụ). Với độ trễ k cho trước, có thể chứng minh rằng φkk thỏa mãn Yule-Walker
phương trình (xuất hiện lần đầu trong Chương 4 trên trang 79):

= + (6.2.7)
ρj φk1ρj 1– φk2ρj 2– φk3ρj 3–
1 2… ,,,…
φkkρj
k k - + ++ cho j =

Rõ ràng hơn, chúng ta có thể viết k phương trình tuyến tính này dưới dạng

φk1 + ρ1φk2 + ρ2φk3 + +… ρk 1– φkk ρ1 =

ρ1φk1 + φk2 + ρ1φk3 + +… ρk 2– φkk ρ2 =


. (6.2.8)
.
.

ρk 1– φk1 + ρk 2– φk2 + ρk 3– φk3 + +… φkk ρk =

Ở đây chúng ta đang xử lý ρ1, ρ2,…, ρk như đã cho và muốn giải cho φk1, φk2,…, φkk
(bỏ tất cả trừ φkk).
Các phương trình này mang lại φkk cho bất kỳ quá trình tĩnh nào. Tuy nhiên, nếu quy trình trong
thực tế AR (p), do đó đối với k = p Phương trình (6.2.8) chỉ là phương trình Yule-Walker

(trang 79), mà mô hình AR (p) đã biết để thỏa mãn, chúng ta phải có φpp = φp. Nói
cách khác, như chúng ta đã thấy bằng một đạo hàm thay thế, φkk = 0 với k > p. Do đó,
tự tương quan mệnh giá hiển thị hiệu quả thứ tự p chính xác của một quá trình tự hồi quy
là độ trễ cao nhất k trước khi φkk trở thành 0.
Machine Translated by Google

6.2 Các chức năng tự tương quan một phần và mở rộng 115

Chức năng tự tương quan một phần mẫu

Đối với một chuỗi thời gian được quan sát, chúng ta cần có khả năng ước tính tự tương quan một phần

hoạt động ở nhiều độ trễ. Với các mối quan hệ trong phương trình (6.2.8), một điều hiển nhiên
phương pháp là ước lượng ρ's với tự tương quan mẫu, r tương ứng , và
sau đó giải các phương trình tuyến tính thu được cho k = 1, 2, 3,… để có được các ước lượng của φkk. Chúng tôi gọi

hàm ước lượng hàm


^ tự tương quan từng phần mẫu (PACF mẫu)
φ kk
và biểu thị nó bằng.
Levinson (1947) và Durbin (1960) đã đưa ra một phương pháp hiệu quả để thu được các
giá trị solu cho phương trình (6.2.8) cho tự tương quan từng phần lý thuyết hoặc mẫu. Họ
cho thấy một cách độc lập rằng Phương trình (6.2.8) có thể được giải một cách đệ quy như sau:

k 1–

ρk - φk 1–, j ρk j -
j 1 =
φkk
= ------------------------------------------------- -
(6.2.9)
k 1–
1
- φk 1–, j ρj
j 1 =

ở đâu
= -
cho j =,,,
1 2 …
k 1–
φk j , φk 1–, j φkkφk 1– , kj -

Ví dụ: sử dụng φ11 = ρ1 để bắt đầu, chúng ta có

-
= ρ2 φ11ρ1 -
------------------------- 2 ρ2 ρ1
= -----------------
φ22 - 2
1 φ11ρ1 - 1 ρ1

(như trước) với φ21 φ11 φ22φ11 - = , cần thiết cho bước tiếp theo.
sau đó

ρ3 φ21ρ2 - φ22ρ1 -
= ----------------------------------------------
φ33
1 φ21ρ1 - φ22ρ2 -

Do đó, chúng tôi có thể tính toán số lượng nhiều giá trị cho φkk như mong muốn. Như đã nói,
các phương trình đệ quy này cung cấp cho chúng ta các tự tương quan từng phần theo lý thuyết, nhưng bằng cách

thay thế ρ's bằng r, chúng ta thu được các tự tương quan từng phần được ước lượng hoặc lấy mẫu.

Để đánh giá mức độ có thể có của tự tương quan từng phần mẫu, Quenoulle
(1949) đã chỉ ra rằng, theo giả thuyết rằng một mô hình AR (p) là đúng, mẫu
tự tương quan từng phần ở độ trễ lớn hơn p được phân phối gần đúng bình thường
với không có nghĩa và phương sai 1 / n. Do đó, với k > p, 2 ⁄ ± n có thể được sử dụng làm giới hạn tới hạn
^
trên φ kk để kiểm tra giả thuyết rỗng rằng mô hình AR (p) là đúng.

Mô hình hỗn hợp và chức năng tự động tương quan mở rộng

Hình 6.3 tóm tắt hành vi của tự tương quan và tự tương quan một phần
các chức năng hữu ích trong việc chỉ định mô hình.
Machine Translated by Google

116 Đặc điểm kỹ thuật mô hình

Phụ lục 6.3 Hành vi Chung của ACF và PACF đối với Mô hình ARMA

AR (p) MA (q) ARMA (p, q), p> 0 và q> 0

ACF Tails off Tắt sau độ trễ q Tails off

PACF Tắt sau độ trễ p Tails off Tails off

Chức năng tự tương quan mở rộng

ACF và PACF mẫu cung cấp các công cụ hiệu quả để xác định AR (p) hoặc MA (q) thuần túy
các mô hình. Tuy nhiên, đối với mô hình ARMA hỗn hợp, ACF và PACF lý thuyết của nó
có rất nhiều giá trị khác không, gây khó khăn cho việc xác định các mô hình hỗn hợp
từ ACF sam sung và PACF. Nhiều công cụ đồ họa đã được đề xuất để giúp bạn dễ dàng hơn
xác định các thứ tự ARMA, ví dụ, phương pháp góc (Becuin và cộng sự, 1980),
phương pháp tự tương quan mở rộng (EACF) (Tsay và Tiao, 1984), và phương pháp nhỏ nhất
phương pháp tương quan kinh điển (SCAN) (Tsay và Tiao, 1985), trong số những phương pháp khác. Chúng ta sẽ

phác thảo phương pháp EACF, phương pháp này dường như có các đặc tính lấy mẫu tốt cho
các cỡ mẫu cực lớn hiện đại theo một nghiên cứu mô phỏng so sánh được thực hiện bởi WS
Chan (1999).
Phương pháp EACF sử dụng thực tế là nếu phần AR của mô hình ARMA hỗn hợp là
được biết, "lọc ra" sự tự động hồi phục khỏi chuỗi thời gian đã quan sát dẫn đến kết quả thuần túy

Quy trình MA hưởng đặc tính cắt trong ACF của nó. Các hệ số AR có thể được ước tính
bởi một chuỗi hồi quy hữu hạn. Chúng tôi minh họa quy trình cho trường hợp
mô hình thực là mô hình ARMA (1,1):

= + -
Yt φYt 1– et θet 1–

Trong trường hợp này, một hồi quy tuyến tính đơn giản của Yt trên Yt - 1 dẫn đến ma
trận ước tính không nhất quán là φ, ngay cả với vô số dữ liệu. Thật vậy, hệ số hồi quy lý thuyết
bằng ρ1 = (φ - θ) (1 - φθ) / (1 - 2φθ + θ2), không phải φ. Nhưng phần còn lại từ hồi quy này
chứa thông tin về quá trình lỗi {et }. Một hồi quy bội thứ hai được hình thành bao
gồm hồi quy Yt trên Yt - 1 và trên độ trễ 1 của các phần dư từ ~
hồi quy đầu tiên. Hệ số của Yt - 1 φ trong hồi quy thứ hai, ký hiệu là, lần lượt
- =
trở thành một công cụ ước tính nhất quán của Wt
φ. Yt
Xác định
φ ~ sau đó, gần đúng là một quá
Yt 1–
trình MA (1). Đối với mô hình ARMA (1,2), hồi quy thứ ba hồi quy Yt
về độ trễ 1 của nó, độ trễ 1 của phần còn lại từ hồi quy thứ hai và độ trễ 2 của
phần dư từ hồi quy đầu tiên dẫn đến hệ số Yt - 1 là hệ số ước lượng nhất quán của φ.
Tương tự, các hệ số AR của mô hình ARMA (p, q) có thể nhất quán
ước tính thông qua một chuỗi q hồi quy.
Vì lệnh AR và MA không xác định, nên cần phải có một quy trình lặp lại. Để cho
~ ~
––– =
Wtkj , Yt φ 1Yt 1– … Φ kYt k - (6.2.10)

là phần dư hồi quy tự động được xác định với hệ số AR được ước tính lặp đi lặp lại
giả sử thứ tự AR là k và thứ tự MA là j. Các tự tương quan mẫu của Wt, k, j
được gọi là tự tương quan mẫu mở rộng. Với k = p và j ≥ q, {Wt, k, j } là
xấp xỉ một mô hình MA (q) , để tự tương quan lý thuyết của nó về độ trễ q + 1 hoặc
Machine Translated by Google

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 117

cao hơn bằng không. Đối với k > p, xảy ra vấn đề trang bị quá mức và điều này làm tăng
Thứ tự MA cho quá trình W nhỏ nhất của k - p và j - q. Tsay và Tiao (1984)
đề xuất tóm tắt thông tin trong EACF mẫu bằng một bảng có phần tử
trong hàng thứ k và cột thứ j bằng ký hiệu X nếu độ trễ j + 1 tương quan mẫu của

Wt, k, khác đáng kể so với 0 (nghĩa là, nếu độ lớn của nó lớn hơn
j 1,96 ⁄ njk –– vì tự tương quan mẫu là tiệm cận N (0,1 / (n - k - j)) nếu
W là một quá trình MA (j) ) và 0 thì ngược lại. Trong một bảng như vậy, một
Quá trình MA (p, q) sẽ có một mô hình lý thuyết là một tam giác các số 0, với
đỉnh bên trái tương ứng với các lệnh ARMA. Hình 6.4 hiển thị sơ đồ
mẫu cho mô hình ARMA (1,1). Đỉnh phía trên bên trái của tam giác số không là
được đánh dấu bằng ký hiệu 0 * và nằm ở hàng p = 1 và cột q = 1 — một dấu hiệu của mô hình
ARMA (1,1).

Hình 6.4 ACF mở rộng lý thuyết (EACF) cho Mô hình ARMA (1,1)

AR / MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 xxxxxxxxxxxxxx
1 x 0 * 0 0 0 0 0 0 0 0 0 0 0 0
2 xx000000000000
3 xxx00000000000
4 xxxx0000000000
5 xxxxx000000000
6 xxxxxx00000000
7 xxxxxxx0000000

Tất nhiên, EACF mẫu sẽ không bao giờ rõ ràng như thế này. Hiển thị như Hình 6.4
sẽ chứa 8 × 14 = 112 tương quan ước tính khác nhau và một số sẽ được thống kê
khác biệt đáng kể so với tình cờ (xem Phụ lục 6.17 trên trang 124, để biết đề thi). Chúng tôi
sẽ minh họa việc sử dụng EACF trong hai phần tiếp theo và trong suốt
phần còn lại của cuốn sách.

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng

Để minh họa lý thuyết của Phần 6.1 và 6.2, chúng ta sẽ xem xét mối tương quan tự động lấy mẫu
và mối tương quan từng phần của mẫu của một số chuỗi thời gian mô phỏng.
Phụ lục 6.5 hiển thị một biểu đồ của tự tương quan mẫu đến độ trễ 20 cho chuỗi thời gian bị

lỗi mô phỏng mà chúng ta đã thấy lần đầu tiên trong Phụ lục 4.5 trên trang 61. Chuỗi này, có độ dài 120,

được tạo ra từ mô hình MA (1) với θ = 0,9. Từ Hình 4.1 trên trang 58, tự tương quan quặng ở
độ trễ 1 là 0,4972. Giá trị ước tính hoặc giá trị mẫu được hiển thị ở độ trễ
1 trên đồ thị là 0,474. Sử dụng Hình 6.2 trên trang 112, sai số chuẩn gần đúng
Machine Translated by Google

118 Đặc điểm kỹ thuật mô hình

N
của ước tính này là 0,71 / = 0,71 / sai 120 = 0,065, vì vậy ước tính tốt trong vòng hai khổ
số dard của giá trị thực.

Hình 6.5 Tự tương quan mẫu của một quá trình MA (1) với θ = 0,9

0,1

ACF

0,1
0,3
0,5

2 4 6 số 8 10 12 14 16 18 20

Lỗi
> dữ liệu (ma1.1.s)

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (ma1.1.s, xaxp = c (0,20,10))

Các đường ngang đứt nét trong Hình 6.5, được vẽ ở 2 ⁄ ± n = ± 0,1826, là

nhằm cung cấp các giá trị tới hạn để kiểm tra xem hệ số tự tương quan có hay không

khác đáng kể so với số không. Các giới hạn này dựa trên giá trị lớn gần đúng

lỗi tiêu chuẩn mẫu áp dụng cho quá trình nhiễu trắng, cụ thể là 1 ⁄ n . Thông báo rằng

các giá trị ACF mẫu vượt quá các giá trị tới hạn thô này ở độ trễ 1, 5 và 14. Tất nhiên,

tự tương quan thực sự ở độ trễ 5 và 14 đều bằng không.

Hình 6.6 hiển thị cùng một ACF mẫu nhưng với các giới hạn quan trọng dựa trên cộng

và trừ đi hai trong số các lỗi tiêu chuẩn phức tạp hơn được ngụ ý bởi Công thức (6.1.11) trên

trang 112. Khi sử dụng Công thức (6.1.11), chúng ta thay thế ρ's bằng r's, đặt q bằng 1, 2, 3, ...

thành công, và lấy căn bậc hai để có được những sai số tiêu chuẩn này.
Machine Translated by Google

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 119

Phụ lục 6.6 Các giới hạn thay thế cho ACF mẫu cho MA (1)
Quá trình

0,1

ACF

0,1
0,3
0,5

2 4 6 số 8 10 12 14 16 18 20

Lỗi

> acf (ma1.1.s, ci.type = 'ma', xaxp = c (0,20,10))

Bây giờ giá trị ACF mẫu ở độ trễ 14 là không đáng kể và giá trị ở độ trễ 5 chỉ là
hầu như không đáng kể. Độ trễ tự tương quan 1 vẫn có ý nghĩa rất lớn và thông tin được đưa ra
trong hai biểu đồ này được thực hiện cùng nhau khiến chúng tôi xem xét mô hình MA (1) cho điều này
loạt. Hãy nhớ rằng mô hình là dự kiến tại thời điểm này và chúng tôi chắc chắn muốn
xem xét các mô hình thay thế “lân cận” khác khi chúng tôi thực hiện chẩn đoán mô hình.
Ví dụ thứ hai, Phụ lục 6.7 cho thấy ACF mẫu cho chuỗi được hiển thị trong
Hình 4.2 trên trang 59, được tạo bởi mô hình MA (1) với θ = 0,9. Các giá trị quan trọng
dựa trên sai số tiêu chuẩn rất gần đúng trỏ đến mô hình MA (1) cho loạt bài này
cũng.

Hình 6.7 Tự tương quan mẫu cho một quá trình MA (1) với θ = 0,9

0,4

0,2

ACF

0,0

0,2

2 4 6 số 8 10 12 14 16 18 20

Lỗi

> data (ma1.2.s); acf (ma1.2.s, xaxp = c (0,20,10))


Machine Translated by Google

120 Đặc điểm kỹ thuật mô hình

Đối với ví dụ thứ ba của chúng tôi, chúng tôi sử dụng dữ liệu được hiển thị trong Phụ lục 4.8 trên trang 63,

được mô phỏng từ mô hình MA (2) với θ1 = 1 và θ2 = 0,6. Đĩa ACF mẫu đóng vai trò quan trọng ở độ

trễ 1, 2, 5, 6, 7 và 14 khi chúng tôi sử dụng lỗi tiêu chuẩn đơn giản
giới hạn.

Hình 6.8 ACF mẫu cho một quá trình MA (2) với θ1 = 1 và θ2 = 0,6

0,2
0,2
0,0
ACF

0,6

2 4 6 số 8 10 12 14 16 18 20

Lỗi

> data (ma2.s); acf (ma2.s, xaxp = c (0,20,10))

Hình 6.9 hiển thị ACF mẫu với lỗi tiêu chuẩn phức tạp hơn

giới hạn. Bây giờ, độ trễ 2 ACF không còn đáng kể nữa và dường như MA (1) có thể

Được áp dụng. Chúng ta sẽ phải đợi cho đến khi chúng ta tiến xa hơn trong lĩnh vực xây dựng mô hình

chuyên nghiệp để thấy rằng mô hình MA (2) — mô hình chính xác — là mô hình thích hợp nhất cho
những dữ liệu này.

Phụ lục 6.9 Các giới hạn thay thế cho ACF mẫu cho MA (2)
Quá trình

0,2
0,2
0,0
ACF

0,6

2 4 6 số 8 10 12 14 16 18 20

Lỗi
> acf (ma2.s, ci.type = 'ma', xaxp = c (0,20,10))
Machine Translated by Google

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 121

Các kỹ thuật này hoạt động như thế nào đối với các mô hình tự phục hồi? Hình 6.10 cho

ACF mẫu cho quy trình AR (1) được mô phỏng mà chúng tôi đã thấy trong Phụ lục 4.13 trên trang 68.

giá trị ACF mẫu dương ở độ trễ 1, 2 và 3 phản ánh sức mạnh của các tàu quan hệ bị trễ mà chúng ta

đã thấy trước đó trong các Phần trình bày 4.14, 4.15 và 4.16. Tuy nhiên, lưu ý rằng ACF sam ple

giảm tuyến tính hơn theo cấp số nhân như lý thuyết cho thấy. Cũng trái ngược với

lý thuyết, ACF mẫu sẽ âm ở độ trễ 10 và vẫn như vậy trong nhiều độ trễ.

Hình 6.10 ACF mẫu cho một quy trình AR (1) với φ = 0,9

0,6

ACF
0,2

0,2

2 4 6 số 8 10 12 14 16

Lỗi
> data (ar1.s); acf (ar1.s, xaxp = c (0,20,10))

Tự tương quan từng phần mẫu (PACF) được trình bày trong Phụ lục 6.11, cho

hình ảnh rõ ràng hơn về bản chất của mô hình tạo. Dựa trên biểu đồ này, chúng tôi sẽ

chắc chắn giải trí với mô hình AR (1) cho chuỗi thời gian này.

Phụ lục 6.11 ACF từng phần mẫu cho quy trình AR (1) với φ = 0,9

0,6

0,2
phần
một
ACF

0,2

2 4 6 số 8 10 12 14 16

Lỗi
Machine Translated by Google

122 Đặc điểm kỹ thuật mô hình

> pacf (ar1.s, xaxp = c (0,20,10))

Hình 6.12 hiển thị ACF mẫu cho chuỗi thời gian AR (2) của chúng tôi. Chuỗi thời gian
biểu đồ cho loạt bài này được trình bày trong Phụ lục 4.19 trên trang 74. Mẫu ACF trông
phần nào giống như sóng bị hãm mà Công thức (4.3.17) trên trang 73 và Hình 4.18
gợi ý. Tuy nhiên, ACF mẫu không giảm nhanh như lý thuyết
dự đoán.

Hình 6.12 ACF mẫu cho một quá trình AR (2) với φ1 = 1,5 và φ2 = 0,75

0,6

ACF

0,2
0,6
0,2

2 4 6 số 8 10 12 14 16 18 20

Lỗi
> acf (ar2.s, xaxp = c (0,20,10))

PACF mẫu trong Phụ lục 6.13 đưa ra một dấu hiệu mạnh mẽ mà chúng ta nên xem xét
mô hình AR (2) cho những dữ liệu này. PACF mẫu có vẻ quan trọng ở độ trễ 9 sẽ
cần được nghiên cứu thêm trong quá trình chẩn đoán mô hình.

Hình 6.13 PACF mẫu cho một quá trình AR (2) với φ1 = 1,5 và φ2 = 0,75

0,5

0,0

phần
một
ACF

0,5

2 4 6 số 8 10 12 14 16 18 20

Lỗi
Machine Translated by Google

6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 123

> pacf (ar2.s, xaxp = c (0,20,10))

Ví dụ cuối cùng, chúng tôi đã mô phỏng 100 giá trị của mô hình ARMA (1,1) hỗn hợp với
φ = 0,6 và θ = 0,3. Biểu đồ chuỗi thời gian được trình bày trong Phụ lục 6.14 và ACF và
PACF mẫu được trình bày trong Phụ lục 6.15 và Phụ lục 6.16, tương ứng. Những điều này dường
như chỉ ra rằng mô hình AR (1) nên được chỉ định.

Hình 6.14 Chuỗi ARMA được mô phỏng (1,1) với φ = 0,6 và θ = 0,3.


4

• •
• •
2 •• • • •


• •
• • • •

• •

• •• • •

• • •

• •


• •
•• • ••
Yt 0 •

• • •
• •• •

• •• •

••
• • • •
•• •
• •

• ••••• •
• •



• •••

• • • •
2
• •
• • •

• ••

• •
0 20 40 60 80 100

Thời gian

> data (arma11.s)>


plot (arma11.s, type = 'o', ylab = expression (Y [t]))

Hình 6.15 ACF mẫu cho dòng ARMA (1,1) được mô phỏng

ACF 0,6
0,4
0,2

0,2

2 4 6 số 8 10 12 14 16 18 20

Lỗi
> acf (arma11.s, xaxp = c (0,20,10))
Machine Translated by Google

124 Đặc điểm kỹ thuật mô hình

Hình 6.16 PACF mẫu cho dòng ARMA (1,1) được mô phỏng

phần
một
ACF

0,2
0,6
0,4
0,2
0,0

2 4 6 số 8 10 12 14 16 18 20

Lỗi

> pacf (arma11.s, xaxp = c (0,20,10))

Tuy nhiên, vùng tam giác của các số không được thể hiện trong EACF mẫu trong Phụ lục 6.17
chỉ ra khá rõ ràng rằng một mô hình hỗn hợp với q = 1 và với p = 1 hoặc 2 sẽ nhiều hơn
phù hợp. Chúng tôi sẽ minh họa các cách sử dụng khác của EACF khi chúng tôi chỉ định một số
loạt bài trong Phần 6.6.

Hình 6.17 EACF mẫu cho dòng ARMA (1,1) được mô phỏng

AR / MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 xxxx oooooooooo
1 xooooooooooooo
2 xooooooooooooo
3 xxoooooooooooo
4 xoxooooooooooo
5 xooooooooooooo
6 xoooxooooooooo
7 xoooxooooooooo

> eacf (arma11.s)


Machine Translated by Google

6.4 Sự phi lý 125

6.4 Sự phi lý

Như đã chỉ ra trong Chương 5, nhiều loạt bài thể hiện sự bất thường có thể được giải thích bằng cách

các mô hình ARMA tích hợp. Sự bất thường sẽ thường xuyên rõ ràng theo thời gian
cốt truyện hàng loạt của bộ truyện. Nên xem lại các Phần trình bày 5.1, 5.5 và 5.8 tại đây.
ACF mẫu được tính cho chuỗi không tĩnh cũng sẽ thường chỉ ra
phi lý tính. Định nghĩa ngầm định của hàm tự tương quan mẫu
giả định sự cố định; ví dụ: chúng tôi sử dụng các sản phẩm bị tụt hậu có độ lệch so với tổng thể
trung bình, và mẫu số giả định một phương sai không đổi theo thời gian. Vì vậy, nó không phải là ở tất cả

rõ ràng ACF mẫu đang ước tính những gì cho một quá trình không cố định. Tuy nhiên, đối với
loạt không ổn định, ACF mẫu thường không chết nhanh chóng vì độ trễ
tăng. Điều này là do xu hướng chuỗi không tĩnh trôi chậm, hoặc lên hoặc

giảm, với “xu hướng” rõ ràng. Các giá trị của rk không cần lớn ngay cả đối với độ trễ thấp, nhưng
thường là họ.
Hãy xem xét chuỗi thời gian giá dầu được trình bày trong Phụ lục 5.1 trên trang 88. Mẫu
ACF cho logarit của những dữ liệu này được hiển thị trong Phụ lục 6.18. Tất cả các giá trị được hiển thị là

"Xa đáng kể so với 0" và mô hình duy nhất có lẽ là giảm tuyến tính với
tăng độ trễ. PACF mẫu (không được hiển thị) cũng không xác định.

Hình 6.18 ACF mẫu cho Chuỗi thời gian giá dầu

0,8

ACF 0,4

0,0

2 4 6 số 8 10 12 14 16 18 20 22

Lỗi
> dữ liệu (oil.price)
> acf (as.vector (dầu. giá), xaxp = c (0,24,12))

ACF mẫu được tính toán dựa trên sự khác biệt đầu tiên của các nhật ký của chuỗi giá dầu
được thể hiện trong Phụ lục 6.19. Bây giờ mô hình xuất hiện rõ ràng hơn nhiều - sau khi phân
biệt, mô hình trung bình động bậc 1 có vẻ phù hợp. Mô hình cho bản gốc
Khi đó chuỗi giá dầu sẽ là mô hình IMA (1,1) không cố định. (ACF “quan trọng”
ở độ trễ 15, 16 và 20 hiện bị bỏ qua.)
Machine Translated by Google

126 Đặc điểm kỹ thuật mô hình

Phụ lục 6.19 ACF mẫu cho sự khác biệt của chuỗi giá dầu gỗ

0,2

0,1

ACF

0,1
0,0

2 4 6 số 8 10 12 14 16 18 20 22

Lỗi
> acf (diff (as.vector (log (oil.price))), xaxp = c (0,24,12))

Nếu sự khác biệt đầu tiên của một chuỗi và ACF mẫu của nó dường như không hỗ trợ
mô hình ARMA tĩnh, thì chúng tôi lấy một sự khác biệt khác và tính toán lại mẫu
ACF và PACF để tìm kiếm các đặc điểm của quy trình ARMA tĩnh. Thường là một
hoặc nhiều nhất là hai sự khác biệt, có thể được kết hợp với một lôgarit hoặc phép biến đổi khác,
sẽ thực hiện việc giảm này đến trạng thái đứng yên. Các thuộc tính bổ sung của ACF mẫu
được tính toán trên dữ liệu phi tĩnh được đưa ra trong Wichern (1973), Roy (1977) và Hasza
(1980). Xem thêm Box, Jenkins, và Reinsel (1994, trang 218).

Chênh lệch quá mức

Từ bài tập 2.6 trang 20, chúng ta biết rằng sự khác biệt của bất kỳ chuỗi thời gian đứng yên nào
cũng đứng yên. Tuy nhiên, chênh lệch quá mức đưa các mối tương quan không cần thiết vào một
hàng loạt và sẽ làm phức tạp quá trình mô hình hóa.
Ví dụ: giả sử chuỗi quan sát của chúng tôi, {Yt }, trên thực tế là một cuộc dạo chơi ngẫu nhiên để một

sự khác biệt sẽ dẫn đến một mô hình nhiễu trắng rất đơn giản

Y t
= -
Yt Yt 1– = et

Tuy nhiên, nếu chúng ta khác biệt một lần nữa (nghĩa là chênh lệch quá mức), chúng ta có

- =
2Yt et 1– _

là một mô hình MA (1) nhưng với θ = 1. Nếu chúng ta lấy hai điểm khác biệt trong tình huống này, chúng ta

không cần thiết phải ước lượng giá trị chưa biết của θ. Chỉ định mô hình IMA (2,1)
sẽ không thích hợp ở đây. Mô hình đi bộ ngẫu nhiên, có thể được coi là
IMA (1,1) với θ = 0, là mô hình chính xác .

† Mô hình đi bộ ngẫu nhiên cũng có thể được coi là ARI (1,1) với φ = 0 hoặc như AR
không tĩnh (1) với φ = 1.
Machine Translated by Google

6.4 Sự phi lý 127

ible model — xem Phần 4.5 về các vấn đề 79. † Mô hình không thể thay đổi cũng tạo ra sự nghiêm túc

trên trang khi chúng tôi cố gắng ước tính các tham số của chúng — xem Chương 7.
Để minh họa chênh lệch quá mức, hãy xem xét bước đi ngẫu nhiên được hiển thị trong Phụ lục 2.1 trên

trang 14. Lấy một điểm khác biệt sẽ dẫn đến nhiễu trắng - một mô hình rất đơn giản. Nếu chúng ta
lấy nhầm hai điểm khác biệt (nghĩa là chênh lệch quá mức) và tính ACF mẫu,
chúng ta thu được đồ thị trong Hình 6.20. Dựa trên cốt truyện này, chúng tôi có thể sẽ chỉ định
ít nhất một mô hình IMA (2,1) cho chuỗi ban đầu và sau đó ước tính MA không cần thiết
tham số. Chúng tôi cũng có một giá trị ACF mẫu đáng kể ở độ trễ 7 để suy nghĩ và xử lý
với.

Hình 6.20 ACF mẫu của Đi bộ ngẫu nhiên sai biệt quá mức

0,4
0,2

ACF

0,2

0,6

2 4 6 số 8 10 12 14 16

Lỗi
> dữ liệu (rwalk)

> acf (diff (rwalk, chênh lệch = 2), ci.type = 'ma', xaxp = c (0,18,9))

Ngược lại, Phụ lục 6.21 hiển thị ACF mẫu của sự khác biệt đầu tiên của chuỗi đi bộ dom đã
chạy. Khi xem biểu đồ này, chúng tôi có thể muốn xem xét sự chính xác
mô hình — sự khác biệt đầu tiên trông rất giống tiếng ồn trắng.

=
† Trong ký hiệu dịch chuyển ngược, nếu mô hình chính xác là φ () B ()
1 - B Yt θ () B e t
, quá chênh lệch
= 1 - B )e =
(dẫn đến φ () B 1()- B 2Yt θ () B θ '() B e , giả sử, trong đó θ '() B = () 1
θ - B () B
tt θ '() B
và gốc "bị cấm" trong tại B = 1 là hiển nhiên.
Machine Translated by Google

128 Đặc điểm kỹ thuật mô hình

Phụ lục 6.21 ACF mẫu của Đi bộ ngẫu nhiên có sai biệt chính xác

0,2

ACF

0,2
0,0

2 4 6 số 8 10 12 14 16

Lỗi
> acf (diff (rwalk), ci.type = 'ma', xaxp = c (0,18,9))

Để tránh chênh lệch quá mức, chúng tôi khuyên bạn nên xem xét cẩn thận từng điểm khác biệt trong

kế thừa và giữ nguyên tắc phân tích luôn được ghi nhớ — các mô hình nên
đơn giản, nhưng không quá đơn giản.

Bài kiểm tra đơn vị gốc của Dickey-Fuller

Trong khi sự phân rã tuyến tính gần đúng của ACF mẫu thường được coi là một triệu chứng
chuỗi thời gian cơ bản là không ổn định và yêu cầu sự khác biệt, nó cũng hữu ích để
định lượng bằng chứng về sự không bất thường trong cơ chế tạo dữ liệu. Điều này có thể là
được thực hiện thông qua kiểm tra giả thuyết. Xem xét mô hình

Yt αYt 1– Xt + = cho t = 1, 2,…

trong đó {Xt } là một quá trình tĩnh. Quá trình {Yt } là không tĩnh nếu hệ số α
= 1, nhưng nó đứng yên nếu | α | <1. Giả sử rằng {Xt } là một quá trình AR (k) : Xt = φ1Xt - 1 +

+ φkXt - k + et . Theo giả thiết rỗng rằng α = 1, Xt = Yt - Yt - 1. Đặt a = α -
1, chúng tôi có

- = - + Xt
Yt Yt 1– (α 1) Yt 1–
= + ++ +
aYt 1– φ1Xt 1– … ΦkXt k - et (6.4.1)

= + - + + - +
( aYt
1– φ1 Yt 1– Yt 2– ) (… Φk Yt k - Yt k 1–– ) et

trong đó a = 0 theo giả thuyết rằng Yt là sự khác biệt không cố định. Mặt khác,
nếu {Yt } đứng yên sao cho 1 <α <1, thì có thể xác minh rằng Yt vẫn thỏa mãn một
phương trình tương tự như phương trình trên nhưng với các hệ số khác nhau; ví dụ, a =

(1 - φ1 - φk) (1 - α) <0. Thật vậy, {Yt } khi đó là một quá trình AR (k + 1) có phương trình
biểu diễn đặc tính AR được cho bởi Φ (x) (1 - αx) = 0 , trong đó Φ (x) = 1 - φ1x -… - φkxk . Nên
giả thuyết rỗng tương ứng với trường hợp đa thức đặc trưng AR có
căn bậc hai và giả thuyết thay thế nói rằng nó không có căn bậc hai. Do đó,
Machine Translated by Google

6.4 Sự phi lý 129

kiểm tra số lượng chênh lệch với kiểm tra một đơn vị gốc trong khối đa giác đặc trưng AR
của {Yt }.
Bằng cách phân tích ở trên, giả thuyết rỗng rằng α = 1 (tương đương a = 0) có thể được
kiểm tra bằng cách hồi quy sự khác biệt đầu tiên của chuỗi thời gian quan sát trên độ trễ 1
của chuỗi quan sát và k độ trễ trong quá khứ của sự khác biệt đầu tiên của loạt quan sát.
Sau đó, chúng tôi kiểm tra xem hệ số a = 0 — giả thuyết rỗng cho rằng quá trình là khác
biệt không cố định. Đó là, quá trình này là không ổn định nhưng trở thành tĩnh sau lần đầu
tiên khác biệt. Giả thuyết thay thế là a <0 và do đó {Yt } là đứng yên.
Thống kê kiểm định Dickey-Fuller (ADF) tăng cường là thống kê t của hệ số ước tính đủ a từ
phương pháp hồi quy bình phương nhỏ nhất. Tuy nhiên, thống kê kiểm định ADF không được phân
phối xấp xỉ t theo giả thuyết rỗng; thay vào đó, nó có một phân phối mẫu lớn không chuẩn
nhất định theo giả thuyết rỗng của một đơn vị gốc. May mắn thay, điểm phần trăm của phân
phối giới hạn (null) này đã được lập bảng; xem Fuller (1996).
Trong thực tế, ngay cả sau khi phân biệt lần đầu, quá trình này có thể không phải là
một quá trình AR có thứ tự hữu hạn, nhưng nó có thể gần đúng với một số quá trình AR với
thứ tự AR tăng theo kích thước mẫu. Said và Dickey (1984) (xem thêm Chang và Park, 2002) đã
chỉ ra rằng với thứ tự AR tăng theo kích thước mẫu, thử nghiệm ADF có cùng phân phối rỗng
mẫu lớn như trường hợp chênh lệch đầu tiên của chuỗi thời gian là một quy trình AR có thứ
tự hữu hạn. Thông thường, thứ tự AR gần đúng có thể được ước tính trước dựa trên một số
tiêu chí thông tin (ví dụ: AIC hoặc BIC) trước khi thực hiện kiểm tra ADF. Xem Phần 6.5
trên trang 130 để biết thêm thông tin về các tiêu chí AIC và BIC.

Trong một số trường hợp, quá trình có thể có xu hướng không ổn định theo nghĩa là nó
có xu hướng xác định (ví dụ, một số xu hướng tuyến tính) nhưng ngược lại là đứng yên. Một
thử nghiệm gốc đơn vị có thể được thực hiện với mục đích phân biệt điểm ổn định của sự khác
biệt với điểm ổn định của xu hướng. Điều này có thể được thực hiện bằng cách thực hiện kiểm
tra ADF với dữ liệu được chia nhỏ. Tương tự, điều này có thể được thực hiện bằng cách hồi
quy sự khác biệt đầu tiên trên các hiệp biến xác định xu hướng, độ trễ 1 của dữ liệu gốc và
độ trễ trong quá khứ của sự khác biệt đầu tiên của dữ liệu gốc. Thống kê t dựa trên ước
lượng hệ số của độ trễ 1 của dữ liệu gốc cung cấp thống kê thử nghiệm ADF, thống kê này có
phân phối rỗng mẫu lớn không chuẩn khác. Xem Phillips và Xiao (1998) để biết khảo sát về
kiểm thử đơn vị gốc.
Bây giờ chúng tôi minh họa kiểm định ADF với bước đi ngẫu nhiên được mô phỏng trong

Hình 2.1 trên trang 14. Đầu tiên, chúng tôi xem xét việc kiểm tra giả thuyết rỗng của đơn
vị gốc so với giả thuyết thay thế rằng chuỗi thời gian đứng yên với giá trị trung bình chưa
biết. Do đó, hồi quy được xác định bởi Công thức (6.4.1) được tăng thêm một số chặn để cho
phép giá trị trung bình có thể khác không theo giả thuyết thay thế. (Đối với giả thuyết
thay thế rằng quá trình là một quá trình tĩnh có giá trị trung bình bằng 0, thống kê kiểm
định ADF có thể thu được bằng cách chạy hồi quy không liên hợp được xác định bởi Công thức
(6.4.1).) Để thực hiện kiểm tra, nó vẫn phải
tiênxác
củađịnh k. † Theo
dữ liệu, AIC
k được với
tìm sự khác
thấy là 8,biệt đầu
trong
trường hợp đó thống kê thử nghiệm ADF trở thành 0,601, với giá trị p lớn hơn 0,1. ‡ Mặt

khác, đặt k = 0 (thứ tự đúng) dẫn đầu

† Mã R: ar (diff (rwalk))
Machine Translated by Google

130 Đặc điểm kỹ thuật mô hình

đến thống kê ADF -1,738, với giá trị p vẫn lớn hơn 0,1 . Thứ hai, hãy nhớ lại rằng
ngẫu nhiên được mô phỏng
đi bộ dường như có một xu hướng tuyến tính. Do đó, xu hướng tuyến tính cộng với các dạng lỗi cố định

một giải pháp thay thế hợp lý khác cho giả thuyết vô hiệu của đơn vị gốc (sự khác biệt số
arity). Đối với thử nghiệm này, chúng tôi bao gồm cả thuật ngữ chặn và thời gian hiệp biến trong
hồi quy được xác định bởi Công thức (6.4.1). Với k = 8, thống kê kiểm định ADF bằng 2.289
với giá trị p lớn hơn 0,1; nghĩa là, chúng ta không bác bỏ giả thuyết vô hiệu của căn bậc hai.
Mặt khác, đặt k = 0, thứ tự thực sự chưa biết trong thực tế, kiểm tra ADF
thống kê trở thành 3,49 với giá trị p bằng 0,0501. ‡ Do đó, có bằng chứng yếu
rằng quá trình là tuyến tính-xu hướng không cố định; nghĩa là, quá trình tương đương với xu hướng thời gian tuyến tính

cộng với sai số cố định, trái với sự thật rằng quá trình là một bước đi ngẫu nhiên,
là khác biệt không cố định! Ví dụ này cho thấy rằng với kích thước mẫu nhỏ, có thể khó
để phân biệt giữa tính bất thường của xu hướng và tính không bất thường của sự khác biệt.

6.5 Các phương pháp đặc điểm kỹ thuật khác

Một số cách tiếp cận khác đối với đặc tả mô hình đã được đề xuất kể từ Box và
Công việc quan trọng của Jenkins. Một trong những nghiên cứu được nghiên cứu nhiều nhất là rion Ghi chép

thông tin (AIC) của Akaike (1973 ). Tiêu chí này cho biết để chọn mô hình giảm thiểu

AIC = - 2 log
khả năng
() +tối
k đa 2 (6.5.1)

trong đó k = p + q + 1 nếu mô hình chứa số hạng chặn hoặc hằng số và k = p + q oth


đúng. Ước tính khả năng xảy ra tối đa được thảo luận trong Chương 7. Việc bổ sung
thuật ngữ 2 (p + q +1) hoặc 2 (p + q) đóng vai trò là "hàm hình phạt" để giúp đảm bảo lựa chọn
mô hình phức tạp và tránh chọn mô hình có quá nhiều tham số.

AIC là công cụ ước lượng phân kỳ Kullback-Leibler trung bình của mô hình kết hợp
esti với mô hình thực. Gọi p (y1, y2,…, yn) là pdf thực sự của Y1, Y2, …, Yn,
và qθ (y1, y2,…, yn) là pdf tương ứng trong mô hình với tham số θ. Các
Phân kỳ Kullback-Leibler của qθ từ p được xác định bởi công thức

∞ ∞ ∞ () ,,,
… p y1 y2 … yn
D (p qθ ,) = () ,,, log ddd yn
p y1
() y2
,,,… qθ
yn y1 y2 … yn
--------------------------------------------------
-------- y1 y2…
–∞ –∞ –∞
^
AIC ước tính , , đâu là công cụ ước tính khả năng xảy ra tối đa của
E Dpqθ ˆ [ )] θ (tham
số vectơ θ. Tuy nhiên, AIC là một công cụ ước lượng chệch và độ chệch có thể áp dụng
cho tham số lớn trên mỗi tỷ lệ dữ liệu. Hurvich và Tsai (1989) đã chỉ ra rằng độ chệch
có thể được loại bỏ gần như bằng cách thêm một thuật ngữ hình phạt nonstochastic khác vào
AIC, dẫn đến AIC đã hiệu chỉnh, được ký hiệu là AICc và được xác định bằng công thức

‡ Mã R: thư viện (uroot); ADF.test (rwalk, selectlags = list


(mode = c (1,2,3,4,5,6,7,8), Pmax = 8), itsd = c (1,0,0))

ADF.test (rwalk, selectlags = list (mode = c (1,2,3,4,5,6,7,8), Pmax = 8),
itsd = c (1,1,0))

ADF.test (rwalk, selectlags = list (Pmax = 0), itsd = c (1,1,0))
Machine Translated by Google

6.5 Các phương pháp đặc điểm kỹ thuật khác 131

2 ()
( k 1+ ) k 2+
AICc AIC+ = ------------------------------------- (6.5.2)
nk 2––

Ở đây n là cỡ mẫu (hiệu quả) và k là tổng số các tham số như

ở trên loại trừ phương sai tiếng ồn. Kết quả mô phỏng của Hurvich và Tsai (1989) cho thấy rằng

đối với các trường hợp có k / n lớn hơn 10%, AICc hoạt động tốt hơn nhiều mô hình khác

tiêu chí lựa chọn, bao gồm cả AIC và BIC.

Một cách tiếp cận khác để xác định đơn đặt hàng ARMA là chọn một mô hình nhỏ

bắt chước Tiêu chí Thông tin Schwarz Bayesian (BIC) được định nghĩa là

BIC = - log
khả(2
năng lớn nhất) + kn log () (6.5.3)

Nếu quy trình thực tuân theo mô hình ARMA (p, q), thì người ta biết rằng các đơn đặt hàng được

xác định bằng cách tối thiểu hóa BIC là nhất quán; nghĩa là, họ tiếp cận các đơn đặt hàng thực như

kích thước mẫu tăng lên. Tuy nhiên, nếu quy trình thực sự không phải là quy trình ARMA bậc hữu hạn,

sau đó giảm thiểu AIC giữa một lớp ngày càng lớn các mô hình ARMA thích

thuộc tính hấp dẫn mà nó sẽ dẫn đến một mô hình ARMA tối ưu gần với sự thật

quy trình giữa các lớp mô hình đang nghiên cứu. †

Bất kể chúng tôi sử dụng AIC hay BIC, các phương pháp này đều yêu cầu thực hiện
Ước lượng khả năng tối đa. Tuy nhiên, ước tính khả năng xảy ra tối đa cho một

Mô hình ARMA dễ gặp các vấn đề về số do khả năng xảy ra đa phương thức

chức năng và vấn đề trang bị quá mức khi lệnh AR và MA vượt quá giá trị true

đơn đặt hàng. Hannan và Rissanen (1982) đã đề xuất một giải pháp thú vị và thiết thực để

vấn đề này. Quy trình của họ bao gồm việc đầu tiên lắp một quy trình AR bậc cao với

thứ tự được xác định bằng cách giảm thiểu AIC. Bước thứ hai sử dụng phần còn lại từ

bước đầu tiên làm proxy cho các điều khoản lỗi không thể quan sát được. Do đó, mô hình ARMA (k, j) có thể là

ước tính gần đúng bằng cách hồi quy chuỗi thời gian của chính nó trễ 1 đến k với nhau

với độ trễ từ 1 đến j của phần dư từ quá trình tự động hóa bậc cao; BIC của cái này

mô hình tự hồi quy là một ước tính của BIC thu được với khả năng xảy ra tối đa. Hannan và Rissanen

(1982) đã chứng minh rằng giảm thiểu giá trị gần đúng
BIC vẫn dẫn đến ước tính nhất quán về các lệnh ARMA.

Xác định thứ tự liên quan đến vấn đề tìm tập con của các hệ số khác không của mô hình ARMA

với các đơn hàng ARMA đủ cao. Một tập hợp con ARMA (p, q)

mô hình là một mô hình ARMA (p, q) với một tập con các hệ số của nó được biết là không. Vì

ví dụ, mô hình
Yt = 0,8Yt 12 + et + 0,7et 12 (6.5.4)

là một mô hình ARMA tập hợp con (12,12) hữu ích để lập mô hình một số thời gian theo mùa hàng tháng

loạt. Đối với các mô hình ARMA có đơn đặt hàng rất cao, chẳng hạn như ARMA trước đó (12,12)

mô hình, việc tìm kiếm một mô hình ARMA tập hợp con xấp xỉ đầy đủ điểm chuyên nghiệp cơ bản là

quan trọng hơn từ quan điểm thực tế hơn là chỉ đơn giản xác định ARMA

đơn đặt hàng. Phương pháp của Hannan và Rissanen (1982) để ước tính các đơn hàng ARMA

có thể được mở rộng để giải quyết vấn đề tìm kiếm một mô hình ARMA tập con tối ưu.

† Độ gần được đo bằng phân kỳ Kullback-Leibler — một phép đo độ lệch giữa các
mô hình. Xem Shibata (1976) và thảo luận trong Stenseth et al. (2004).
Machine Translated by Google

132 Đặc điểm kỹ thuật mô hình

Thật vậy, một số tiêu chí lựa chọn mô hình (bao gồm AIC và BIC) của tập hợp con

Mô hình ARMA (p, q) (2p được + q trong số chúng!) có thể xấp xỉ, toàn bộ và nhanh chóng
tính bằng phương pháp hồi quy theo bước nhảy vọt (Furnival và Wilson, 1974)

được áp dụng cho hồi quy tập hợp con của Yt với độ trễ của chính nó và độ trễ của phần dư từ một

quá trình tự động hóa bậc cao của {Yt }.

Cần thận trọng khi kiểm tra một vài mô hình ARMA tập hợp con tốt nhất (ví dụ:

BIC) để đưa ra một số mô hình dự kiến hữu ích để nghiên cứu thêm. Mô hình của

độ trễ nào của chuỗi thời gian được quan sát và quá trình lỗi nào đi vào mô hình tập hợp con var ious

best có thể được tóm tắt ngắn gọn trong một màn hình như được hiển thị trong

Hình 6.22. Bảng này dựa trên mô phỏng của mô hình ARMA (12,12) được hiển thị trong

Phương trình (6.5.4). Mỗi hàng trong triển lãm tương ứng với một mô hình ARMA tập hợp con trong đó
các ô của các biến được chọn cho mô hình được tô bóng. Các mô hình được sắp xếp

theo BIC của họ, với các mô hình tốt hơn (BIC thấp hơn) được đặt ở các hàng cao hơn và với

sắc thái đậm hơn. Hàng trên cùng cho chúng ta biết rằng mô hình ARMA tập hợp con (14,14) với BIC ước

tính nhỏ chỉ chứa độ trễ 8 và 12 của chuỗi thời gian được quan sát và độ trễ 12 của lỗi

quá trình. Mô hình tốt nhất tiếp theo có độ trễ 12 của chuỗi thời gian và độ trễ 8 trong số các lỗi,

trong khi mô hình tốt thứ ba chứa độ trễ 4, 8 và 12 của chuỗi thời gian và độ trễ 12 của
các lỗi. Trong chuỗi thời gian mô phỏng của chúng tôi, mô hình tốt thứ hai là mô hình tập hợp con thực sự.

Tuy nhiên, các giá trị BIC cho ba mô hình này đều rất giống nhau và cả ba (cộng

mô hình tốt thứ tư) đáng được nghiên cứu thêm. Tuy nhiên, độ trễ 12 của chuỗi thời gian

và lỗi đó là hai biến thường gặp nhất trong các tập hợp con khác nhau

các mô hình được tóm tắt trong triển lãm, cho thấy rằng có lẽ chúng quan trọng hơn

như chúng ta biết!

Phụ lục 6.22 Lựa chọn ARMA cho tập con tốt nhất dựa trên BIC

(Intercept)
error
error
lag3
lag12
test
lag7
test
lag6
test
lag5
test
lag4
test
lag3
test
lag2
test
lag1
test -lỗi
lag11
lag1
lag10
-lỗi
test
test
lỗi
test
test
test
lag9
test
lag8 lag7
lag6
-lỗi
lag5
-lỗi
lag4
-lỗi
-lỗi
lag14
lag13
lag2 8 lag14
lag13
lag11
-lỗi
lag10
-lỗi
lỗi
-lỗi
-lỗi
-lỗi9
12
-lỗi
lỗi

140

140

140

BIC 140

140

140

130

130
Machine Translated by Google

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 133

> set.seed (92397)>


test = arima.sim (model = list (ar = c (rep (0,11), 8), ma
= c (rep (0,11), 0,7)), n = 120)
> res = armasubsets (y = test, nar = 14, nma = 14, y.name = 'test',
ar.method = 'ols')>
plot (res)

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế

Bây giờ hãy xem xét đặc điểm kỹ thuật của các mô hình cho một số chuỗi thời gian thực tế mà chúng ta đã thấy

trong các chương trước.

Loạt mưa hàng năm ở Los Angeles

Tổng lượng mưa hàng năm của Los Angeles được trình bày trong Phụ lục 1.1 trên trang 2. Trong Chương

3, chúng tôi đã lưu ý trong Phụ lục 3.17 trên trang 50, rằng lượng mưa không được phân phối bình

thường. Như được thể hiện trong Hình 6.23, việc sử dụng logarit cải thiện tính chuẩn mực theo

phương pháp tĩnh.

Biểu đồ 6.23 QQ Bình thường Đồ thị Logarit của Lượng mưa hàng năm LA


• •
• • • • •

• • • • • • • •
• • • • • • • • • •

• •• •• •• •• •• •• •• •• •• •• ••
• • • • • • • • • • • • • • •
• • • • • • • • • • • • • • •
• •• •• •• •• •• •• •• •• •• •• •• •• •• •• •• (• •
• • • •

Lượng
mẫu
tử
•••
•••
•• ••••
• • • •
••••••••••••••••
• • • • • •

•••••••••••••••••••••••••••••••
•• •• •• •• •• •• •• •• ••

• • • • • • • • •

••
3,5
3,0
2,5
2,0
1,5
(•)

2 1 0 1 2

Lượng tử lý thuyết

> dữ liệu (larain); win.graph (width = 2.5, height = 2.5, pointsize = 8)>
qqnorm (log (larain)); qqline (log (larain))
Machine Translated by Google

134 Đặc điểm kỹ thuật mô hình

Phụ lục 6.24 hiển thị các tự tương quan mẫu cho logarit của năm
loạt mưa.

Hình 6.24 ACF mẫu về Logarit của lượng mưa hàng năm LA

0,1

ACF

0,1
0,2
0,0

2 4 6 số 8 10 12 14 16 18 20

Lỗi
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (log (larain), xaxp = c (0,20,10))

Việc chuyển đổi nhật ký đã cải thiện tính bình thường, nhưng không có gì có thể nhận biết được

sự phụ thuộc trong chuỗi thời gian này. Chúng tôi có thể lập mô hình logarit của lượng mưa hàng năm

là các biến ngẫu nhiên độc lập, bình thường với trung bình 2,58 và độ lệch chuẩn 0,478.
Cả hai giá trị này đều được tính bằng đơn vị log (inch).

Dòng thuộc tính màu quy trình hóa học

Thuộc tính màu của quá trình hóa chất công nghiệp được hiển thị trong Phụ lục 1.3 trên trang 3,
cho thấy nhiều hứa hẹn hơn về mô hình chuỗi thời gian thú vị — đặc biệt là dựa trên
sự phụ thuộc của các lô kế tiếp được thể hiện trong Phụ lục 1.4 trên trang 4. ACF mẫu
được vẽ trong Hình 6.25 thoạt nhìn có thể gợi ý mô hình MA (1), vì chỉ có độ trễ 1
tự tương quan khác 0 có ý nghĩa.
Machine Translated by Google

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 135

Phụ lục 6.25 ACF mẫu cho dòng thuộc tính màu

0,4
0,2
0,0
ACF

0,4

2 4 6 số 8 10 12 14

Lỗi
> dữ liệu (màu); acf (color, ci.type = 'ma')

Tuy nhiên, sự xuất hiện sóng hình sin được làm ẩm của biểu đồ khuyến khích chúng ta xem
xét quá trình tự tương quan từng phần của mẫu. Hình 6.26 hiển thị âm mưu đó, và bây giờ chúng tôi
thấy rõ rằng mô hình AR (1) đáng được xem xét đầu tiên. Như mọi khi, các mô hình dự kiến cụ thể
của chúng tôi là dự kiến và có thể sửa đổi trong giai đoạn chẩn đoán mô hình
của việc xây dựng mô hình.

Phụ lục 6.26 ACF một phần mẫu cho dòng thuộc tính màu

phần
một
ACF

0,2
0,4
0,2
0,0

2 4 6 số 8 10 12 14

Lỗi
> pacf (màu)
Machine Translated by Google

136 Đặc điểm kỹ thuật mô hình

Sự phong phú hàng năm của loạt Canada Hare

Chuỗi thời gian về số lượng thỏ rừng phong phú hàng năm của Vịnh Hudson ở Canada được trình bày trong

Hình 1.5 trên trang 5, và sự phụ thuộc hàng năm được chứng minh trong

Hình 1.6. Trong tài liệu, người ta đã gợi ý rằng một phép biến đổi có thể được sử dụng để

tạo ra một mô hình tốt cho những dữ liệu này. Hình 6.27 hiển thị khả năng ghi nhật ký như một chức

năng của tham số công suất, λ. Cực đại xảy ra ở λ = 0,4, nhưng hệ thức trans căn bậc hai với λ = 0,5
nằm trong khoảng tin cậy đối với λ. Chúng tôi sẽ lấy

căn bậc hai của các giá trị phong phú cho tất cả các phân tích sâu hơn.

Hình 6.27 Kết quả chuyển đổi điện năng Box-Cox cho sự dồi dào

95% 95%

50

nhật
năng
ghi
Khả

50

2 1 0 1 2

> win.graph (chiều rộng = 3, chiều cao = 3, kích thước điểm = 8)


> dữ liệu (thỏ rừng); BoxCox.ar (thỏ rừng)

Hình 6.28 cho thấy ACF mẫu cho loạt chuyển đổi này. Khá mạnh

tự tương quan lag 1 chiếm ưu thế, nhưng một lần nữa, có một dấu hiệu mạnh mẽ về hành vi tiềm ẩn của

oscil bị hãm.
Machine Translated by Google

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 137

Phụ lục 6.28 ACF mẫu cho Căn bậc hai của Hare dồi dào

0,6

0,2

ACF

0,2
0,6

2 4 6 số 8 10 12 14

Lỗi
> acf (hare ^ .5)

Tự tương quan từng phần mẫu cho chuỗi đã biến đổi được hiển thị trong Phần trình bày
6.29. Nó cung cấp bằng chứng mạnh mẽ để hỗ trợ mô hình AR (2) hoặc có thể là AR (3) cho những
dữ liệu.

Phụ lục 6.29 ACF một phần mẫu cho Căn bậc hai của Hare dồi dào

0,4

0,0
phần
một
ACF

0,4

2 4 6 số 8 10 12 14

Lỗi
> pacf (thỏ rừng ^ .5)
Machine Translated by Google

138 Đặc điểm kỹ thuật mô hình

Chuỗi giá dầu

Trong Chương 5, chúng tôi bắt đầu xem xét chuỗi thời gian giá dầu hàng tháng và lập
luận một cách chặt chẽ rằng sự khác biệt của logarit có thể được coi là đứng yên — xem Hình
5.1 trên trang 88. Triển khai phần mềm của thử nghiệm đơn vị gốc Augmented Dickey-Fuller
được áp dụng cho nhật ký của giá gốc dẫn đến thống kê thử nghiệm là 1,119 và giá trị p
của 0,9189. Với sự cố định là giả thuyết thay thế, điều này cung cấp bằng chứng mạnh mẽ
về tính không ổn định và sự phù hợp của việc lấy sự khác biệt của các bản ghi. Đối với điều này
kiểm tra, phần mềm đã chọn giá trị k = 6 trong Công thức (6.4.1) trên trang 128 dựa trên
lý thuyết mẫu lớn.
Hình 6.30 cho thấy bảng EACF tóm tắt về sự khác biệt của các logarit
của dữ liệu giá dầu. Bảng này gợi ý mô hình ARMA với p = 0 và q = 1.

Phụ lục 6.30 ACF mở rộng cho sự khác biệt của lôgarit của chuỗi giá dầu

AR / MA 0 1 2 3 4 5 6 7 số 8 9 10 11 12 13
0 xoooooo ooooooo

1 xxooooooooxooo

2 oxooooo ooooooo

3 oxooooo ooooooo

4 oxxoooo ooooooo

5 oxoxoooooooooo

6 oxoxoooooooooo

7 xxoxoooooooooo

> eacf (diff (log (oil.price)))


Machine Translated by Google

6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 139

Kết quả của cách tiếp cận ARMA tập con tốt nhất được hiển thị trong Hình 6.31.

Hình 6.31 Mô hình ARMA bộ phụ tốt nhất cho sự khác biệt của bản ghi (dầu)

chặn)
(Đánh DiffLog
lag1 DiffLog
lag2 DiffLog
lag3 DiffLog
lag4 DiffLog-
lag5 DiffLog
lag6 DiffLog-
lag7 error-
lag1 error
lag2 error-
lag3 error-
lag4 error-
lag5 error-
lag6 error-
lag7

3,4

0,91

BIC
2,5

5.2

8.8

13

18

> res = armasubsets (y = diff (log (oil.price)), nar = 7, nma =


7, y.name = 'test', ar.method = 'ols')> plot (res)

Ở đây gợi ý là Yt = log (Oilt ) nên được mô hình hóa theo Yt - 1 và Yt - 4 và không cần
độ trễ (1,1,0)
trong các
trên
điều
logarit
khoản cũng
lỗi. cần
Mô hình
được tốt
nghiên
nhất
cứu
thứ
thêm.
hai bỏ qua số hạng trễ 4 để mô hình ARIMA
Machine Translated by Google

140 Đặc điểm kỹ thuật mô hình

Hình 6.32 gợi ý rằng chúng tôi chỉ định một mô hình MA (1) cho sự khác biệt của nhật ký

giá dầu và Phụ lục 6.33 cho biết hãy xem xét mô hình AR (2) (bỏ qua một số

tăng đột biến ở độ trễ 15, 16 và 20). Chúng tôi sẽ muốn xem xét thêm tất cả các mô hình này khi

chúng tôi ước tính các thông số và thực hiện kiểm tra chẩn đoán trong Chương 7 và 8. (Chúng tôi sẽ thấy

sau đó để có được một mô hình phù hợp cho chuỗi giá dầu, các giá trị ngoại lệ trong chuỗi sẽ

cần phải được xử lý. (Bạn có thể phát hiện ra những điểm khác thường trong Phụ lục 5.4 trên trang 91 không?)

Hình 6.32 ACF mẫu về sự khác biệt của giá dầu đã khai thác

0,2

0,1

ACF

0,1
0,0

2 4 6 số 8 10 12 14 16 18 20 22

Lỗi
> acf (as.vector (diff (log (oil.price))), xaxp = c (0,22,11))

Hình 6.33 PACF mẫu về sự khác biệt của giá dầu đã khai thác

0,2

phần
một
ACF

0,1
0,1
0,0

2 4 6 số 8 10 12 14 16 18 20 22

Lỗi
> pacf (as.vector (diff (log (oil.price))), xaxp = c (0,22,11))
Machine Translated by Google

Bài tập 141

6.7 Tóm tắt

Trong chương này, chúng tôi đã xem xét vấn đề xác định các mô hình hợp lý nhưng đơn giản cho chuỗi

thời gian quan sát. Đặc biệt, chúng tôi đã nghiên cứu các công cụ để chọn thứ tự (p, d và q) cho

các mô hình ARIMA (p, d, q) . Ba công cụ, hàm tự tương quan mẫu, hàm tự tương quan từng phần mẫu

và hàm tự tương quan mở rộng mẫu, đã được giới thiệu và nghiên cứu để giúp thực hiện nhiệm vụ khó

khăn này. Phép thử đơn vị gốc Dickey-Fuller cũng được giới thiệu để giúp phân biệt giữa chuỗi ary

tĩnh và không có điểm. Những ý tưởng này đều được minh họa bằng cả chuỗi thời gian mô phỏng và

thực tế.

BÀI TẬP

6.1 Xác minh Công thức (6.1.3) trên trang 110 cho quá trình nhiễu trắng.

6.2 Xác minh Công thức (6.1.4) trên trang 110 cho quy trình AR (1).

6.3 Kiểm tra dòng trong Hình 6.1 trên trang 111, cho các giá trị φ = ± 0,9.

6.4 Thêm các mục mới vào Phụ lục 6.1 trên trang 111, cho các giá trị sau: (a) φ = ±

0,99. (b) φ = ± 0,5. (c) φ = ± 0,1.

6.5 Xác minh Phương trình (6.1.9) trên trang 111 và Phương trình (6.1.10) cho MA (1) chuyên nghiệp
thuế.

6.6 Xác minh dòng trong Hình 6.2 trang 112, cho các giá trị θ = ± 0,9.

6.7 Thêm các mục mới vào Phụ lục 6.2 trên trang 112, cho các giá trị sau: (a) θ = ±
0,99. (b) θ = ± 0,8. (c) θ = ± 0,2.

6.8 Xác minh Công thức (6.1.11) trên trang 112, cho quy trình MA (q) chung .

6.9 Sử dụng Công thức (6.2.3) trên trang 113, để xác minh giá trị cho hàm quan hệ tự động lấy nét

từng phần độ trễ 2 cho quá trình MA (1) được cho trong Công thức (6.2.5) trên trang 114.

6.10 Chứng tỏ rằng biểu thức tổng quát cho hàm tự tương quan từng phần của quá trình MA (1) được

đưa ra trong Phương trình (6.2.6) trên trang 114, thỏa mãn đệ quy Yule-Walker cho trong

Phương trình (6.2.7).

6.11 Sử dụng Công thức (6.2.8) trên trang 114, để tìm hàm tự tương quan từng phần (lý thuyết) cho

mô hình AR (2) theo φ1 và φ2 và độ trễ k = 1, 2, 3,….

6.12 Từ chuỗi thời gian gồm 100 quan sát, chúng ta tính được r1 = 0,49, r2 = 0,31, r3 = 0,21,

r4 = 0,11, và | rk | <0,09 cho k > 4. Chỉ dựa trên cơ sở này, chúng ta dự kiến sẽ chỉ định
mô hình ARIMA nào cho chuỗi?

6.13 Chuỗi thời gian tĩnh có độ dài 121 tạo ra tự tương quan từng phần của mẫu là φ = 0,8, φ φ =
^ ^ ^ ^
0,6,
định
= 0,08
mô hình
và φnào
= 0,00.
cho loạt
Chỉ phim?
dựa trên thông tin 11 22 33 44 này, chúng ta dự kiến sẽ chỉ

6.14 Với một dãy số có độ dài 169, chúng ta thấy rằng r1 = 0,41, r2 = 0,32, r3 = 0,26, r4 = 0,21

và r5 = 0,16. Mô hình ARIMA nào phù hợp với mô hình tự tương quan này?
Machine Translated by Google

142 Đặc điểm kỹ thuật mô hình

6.15 ACF mẫu cho một chuỗi và sự khác biệt đầu tiên của nó được đưa ra như sau
bàn. Ở đây n = 100.

tụt hậu 123456


ACF cho Yt 0,97 0,97 0,93 0,85 0,80 0,71

ACF cho Yt 0,42 0,18 0.02 0,07 0,10 0,09

Chỉ dựa trên thông tin này, chúng tôi sẽ xem xét (các) mô hình ARIMA nào cho
bộ truyện?

6.16 Đối với một chuỗi có độ dài 64, tự tương quan từng phần mẫu được đưa ra như sau:

Trễ 12345
PACF 0,47 0,34 0,20 0,02 0,06

Chúng ta nên xem xét những mô hình nào trong trường hợp này?

6.17 Xét chuỗi AR (1) có độ dài 100 với φ = 0,7.

(a) Bạn có ngạc nhiên nếu r1 = 0,6 không?


(b) R10 = 0,15 có bất thường không ?
6.18 Giả sử {Xt } là một quá trình AR (1) cố định với tham số φ nhưng chúng ta có thể
chỉ quan sát Yt = Xt + Nt trong đó {Nt } là sai số đo nhiễu trắng phụ thuộc vào {Xt }.

(a) Tìm hàm tự tương quan cho quá trình quan sát theo φ, σX
2,
và 2 .
σN
(b) Chúng tôi có thể chỉ định mô hình ARIMA nào cho {Yt }?
6.19 Biểu đồ thời gian của hai chuỗi được hiển thị bên dưới.

(a) Đối với mỗi chuỗi, mô tả r1 bằng cách sử dụng các thuật ngữ tích cực mạnh, hiện đại
hoàn toàn tích cực, gần bằng không, âm vừa phải hoặc tiêu cực mạnh. Bạn có
cần biết thang đo của dãy số để trả lời điều này?

(b) Lặp lại phần (a) cho r2.

• • • • •
• • •
• •


Dòng
A Dòng
B


• •

•• • •
• •
1 3 5 7 9 11 1 3 5 7 9 11

Thời gian Thời gian


Machine Translated by Google

Bài tập 143

6.20 Mô phỏng chuỗi thời gian AR (1) với n = 48 và với φ = 0,7.


(a) Tính toán tự tương quan lý thuyết ở độ trễ 1 và độ trễ 5 cho mô hình này.
(b) Tính toán tự tương quan mẫu ở độ trễ 1 và độ trễ 5 và so sánh các giá trị với giá
trị lý thuyết của chúng. Sử dụng các phương trình (6.1.5) và (6.1.6) trang 111,
để định lượng các so sánh.
(c) Lặp lại phần (b) với một mô phỏng mới. Mô tả độ chụm của vật liệu thử thay đổi như
thế nào với các mẫu khác nhau được chọn trong các điều kiện giống hệt nhau.

(d) Nếu phần mềm cho phép, hãy lặp lại mô phỏng chuỗi và tính toán r1
và r5 nhiều lần và tạo thành phân bố lấy mẫu của r1 và r5. Mô tả
độ chính xác của ước tính thay đổi như thế nào với các mẫu khác nhau được chọn trong
điều kiện giống hệt nhau. Phương sai mẫu lớn được đưa ra trong Phương trình (6.1.5)
trên trang 111, gần đúng như thế nào với phương sai trong phân phối lấy mẫu của bạn?

6.21 Mô phỏng chuỗi thời gian MA (1) với n = 60 và với θ = 0,5.

(a) Tính toán tự tương quan lý thuyết ở độ trễ 1 cho mô hình này.
(b) Tính toán tự tương quan mẫu ở độ trễ 1 và so sánh giá trị với
Giá trị lý thuyết. Sử dụng Hình 6.2 trên trang 112, để định lượng các phép so
sánh. (c) Lặp lại phần (b) với một mô phỏng mới. Mô tả độ chụm của vật liệu thử thay
đổi như thế nào với các mẫu khác nhau được chọn trong các điều kiện giống hệt nhau.

(d) Nếu phần mềm cho phép, hãy lặp lại mô phỏng chuỗi và tính toán r1
nhiều lần và tạo thành phân bố lấy mẫu của r1. Mô tả mức độ trước của ước tính thay
đổi như thế nào với các mẫu khác nhau được chọn theo các quan điểm giống hệt nhau.
Phương sai mẫu lớn đưa ra trong Hình 6.2 trên trang tốt như thế nào
112, gần đúng phương sai trong phân phối lấy mẫu của bạn?
6.22 Mô phỏng chuỗi thời gian AR (1) với n = 48, với

(a) φ = 0,9, và tính toán tự tương quan lý thuyết ở độ trễ 1 và độ trễ 5;


(b) φ = 0,6, và tính toán tự tương quan lý thuyết ở độ trễ 1 và độ trễ 5;
(c) φ = 0,3, và tính toán tự tương quan lý thuyết ở độ trễ 1 và độ trễ 5.
(d) Đối với mỗi chuỗi trong phần (a), (b) và (c), tính toán độ trễ tự động lấy mẫu ở độ
trễ 1 và độ trễ 5 và so sánh các giá trị với giá trị lý thuyết của chúng.
Sử dụng Công thức (6.1.5) và 6.1.6, trang 111, để định lượng các phép so sánh. Trong
nói chung, mô tả độ chính xác của ước tính thay đổi như thế nào với giá trị của φ.
6.23 Mô phỏng chuỗi thời gian AR (1) với φ = 0,6, với

(a) n = 24, và ước lượng ρ1 = φ = 0,6 với r1;


(b) n = 60, và ước lượng ρ1 = φ = 0,6 với r1;
(c) n = 120, và ước lượng ρ1 = φ = 0,6 với r1.
(d) Đối với mỗi chuỗi trong phần (a), (b) và (c), hãy so sánh các giá trị ước tính
với giá trị lý thuyết. Sử dụng Công thức (6.1.5) trên trang 111, để định lượng
so sánh. Nói chung, hãy mô tả độ chính xác của ước tính thay đổi như thế nào
với kích thước mẫu.
Machine Translated by Google

144 Đặc điểm kỹ thuật mô hình

6.24 Mô phỏng chuỗi thời gian MA (1) với θ = 0,7, với (a) n =

24, và ước lượng ρ1 với r1; (b) n = 60, và ước lượng ρ1

với r1; (c) n = 120, và ước lượng ρ1 với r1. (d) Đối với

mỗi chuỗi trong phần (a), (b) và (c), hãy so sánh các giá

trị ước tính của ρ1 với giá trị lý thuyết. Sử dụng Hình 6.2 trên trang 112, để định lượng các

phép so sánh. Nói chung, hãy mô tả độ chính xác của ước tính thay đổi như thế nào theo cỡ

mẫu.

6.25 Mô phỏng chuỗi thời gian AR (1) có độ dài n = 36 với φ = 0,7. (a) Tính

toán và vẽ đồ thị hàm tự tương quan lý thuyết cho mô hình này. Vẽ các độ trễ vừa đủ cho đến

khi các mối tương quan là không đáng kể. (b) Tính toán và vẽ biểu đồ ACF mẫu cho chuỗi mô

phỏng của bạn. Làm tốt như thế nào

giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)? (c) Tự tương

quan từng phần trên lý thuyết cho mô hình này là gì? (d) Tính toán và vẽ biểu

đồ ACF mẫu cho chuỗi mô phỏng của bạn. Làm thế nào để các giá trị và mẫu khớp với ACF lý thuyết

từ phần (a)? Sử dụng sai số tiêu chuẩn mẫu lớn được báo cáo trong Phụ lục 6.1 trên trang

111, để định lượng

câu trả lời của bạn.

(e) Tính toán và vẽ biểu đồ PACF mẫu cho chuỗi mô phỏng của bạn. Làm thế nào để các giá trị và

mẫu khớp với ACF lý thuyết từ phần (c)? Sử dụng các lỗi tiêu chuẩn mẫu lớn được báo cáo

trên trang 115 để định lượng câu trả lời của bạn.

6.26 Mô phỏng chuỗi thời gian MA (1) có độ dài n = 48 với θ = 0,5. (a) Các lý

thuyết tự tương quan cho mô hình này là gì? (b) Tính toán và vẽ biểu

đồ ACF mẫu cho chuỗi mô phỏng của bạn. Làm tốt như thế nào

giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)?

(c) Tính toán và vẽ đồ thị hàm tự tương quan từng phần lý thuyết cho mô hình này. Vẽ các độ

trễ vừa đủ cho đến khi các mối tương quan là không đáng kể. (Gợi ý: Xem Công thức (6.2.6)

trên trang 114.) (d) Tính toán và vẽ biểu đồ PACF mẫu cho chuỗi mô phỏng của bạn. Làm thế

nào để các giá trị và mẫu khớp với ACF lý thuyết từ phần (c)?

6.27 Mô phỏng chuỗi thời gian AR (2) có độ dài n = 72 với φ1 = 0,7 và φ2 = 0,4.

(a) Tính toán và vẽ đồ thị hàm tự tương quan lý thuyết cho mô hình này. Vẽ các độ trễ vừa đủ

cho đến khi các mối tương quan là không đáng kể. (b) Tính toán và vẽ biểu đồ ACF mẫu cho

chuỗi mô phỏng của bạn. Làm tốt như thế nào

giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)? (c) Tự tương

quan từng phần trên lý thuyết cho mô hình này là gì? (d) Tính toán và vẽ biểu

đồ ACF mẫu cho chuỗi mô phỏng của bạn. Làm tốt như thế nào

giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)?

(e) Tính toán và vẽ biểu đồ PACF mẫu cho chuỗi mô phỏng của bạn. Làm thế nào để các giá trị và

mẫu khớp với ACF lý thuyết từ phần (c)?


Machine Translated by Google

Bài tập 145

6.28 Mô phỏng chuỗi thời gian MA (2) có độ dài n = 36 với θ1 = 0,7 và θ2 = 0,4. (a)
Các lý thuyết tự tương quan cho mô hình này là gì? (b) Tính toán và vẽ biểu đồ
ACF mẫu cho chuỗi mô phỏng của bạn. Làm tốt như thế nào
giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)?
(c) Tính toán và vẽ đồ thị hàm tự tương quan từng phần lý thuyết cho mô hình này. Vẽ
các độ trễ vừa đủ cho đến khi các mối tương quan là không đáng kể. (Gợi ý: Xem
Công thức (6.2.6) trên trang 114.) (d) Tính toán và vẽ biểu đồ PACF mẫu cho chuỗi
mô phỏng của bạn. Làm thế nào để các giá trị và mẫu khớp với ACF lý thuyết từ phần (c)?

6.29 Mô phỏng mô hình ARMA (1,1) hỗn hợp có độ dài n = 60 với φ = 0,4 và θ = 0,6.
(a) Tính toán và vẽ đồ thị hàm tự tương quan lý thuyết cho mô hình này. Vẽ các độ trễ
vừa đủ cho đến khi các mối tương quan là không đáng kể. (b) Tính toán và vẽ biểu
đồ ACF mẫu cho chuỗi mô phỏng của bạn. Làm tốt như thế nào
giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)?
(c) Tính toán và giải thích EACF mẫu cho chuỗi này. EACF có trợ giúp không
bạn chỉ định các đơn đặt hàng chính xác cho mô hình?

(d) Lặp lại các phần (b) và (c) với một mô phỏng mới sử dụng cùng một tham số val
ues và kích thước mẫu. (e) Lặp lại các phần (b) và (c) với một mô phỏng mới sử
dụng cùng một tham số val
ues nhưng cỡ mẫu n = 36.
(f) Lặp lại các phần (b) và (c) với một mô phỏng mới sử dụng cùng một tham số val
ues nhưng cỡ mẫu n = 120.
6.30 Mô phỏng mô hình ARMA (1,1) hỗn hợp có độ dài n = 100 với φ = 0,8 và θ = 0,4. (a) Tính
toán và vẽ đồ thị hàm tự tương quan lý thuyết cho mô hình này. Vẽ các độ trễ vừa đủ
cho đến khi các mối tương quan là không đáng kể. (b) Tính toán và vẽ biểu đồ ACF
mẫu cho chuỗi mô phỏng của bạn. Làm tốt như thế nào
giá trị và mẫu phù hợp với ACF lý thuyết từ phần (a)?
(c) Tính toán và giải thích EACF mẫu cho chuỗi này. EACF có trợ giúp không
bạn chỉ định các đơn đặt hàng chính xác cho mô hình?

(d) Lặp lại các phần (b) và (c) với một mô phỏng mới sử dụng cùng một tham số val
ues và kích thước mẫu. (e) Lặp lại các phần (b) và (c) với một mô phỏng mới sử
dụng cùng một tham số val
ues nhưng cỡ mẫu n = 48.
(f) Lặp lại các phần (b) và (c) với một mô phỏng mới sử dụng cùng một tham số val
ues nhưng cỡ mẫu n = 200.
Machine Translated by Google

146 Đặc điểm kỹ thuật mô hình

6.31 Mô phỏng chuỗi thời gian không tĩnh với n = 60 theo mô hình ARIMA (0,1,1) với θ = 0,8. (a) Thực

hiện kiểm tra Dickey-Fuller (tăng cường) trên chuỗi với k = 0 trong Phương trình (6.4.1) trên

trang 128. (Với k = 0, đây là kiểm tra Dickey-Fuller và không tăng thêm.) Nhận xét về kết quả.

(b) Thực hiện kiểm tra Dickey-Fuller tăng cường trên chuỗi với k được chọn bởi phần mềm —

nghĩa là, giá trị “tốt nhất” của k. Nhận xét về kết quả. (c) Lặp lại các phần (a) và (b)

nhưng sử dụng sự khác biệt của loạt mô phỏng. Com đề cập đến kết quả. (Tất nhiên, ở đây, bạn
nên bác bỏ giả thuyết gốc đơn vị sis.)

6.32 Mô phỏng chuỗi thời gian đứng yên có độ dài n = 36 theo mô hình AR (1) với φ = 0,95. Mô hình này

là cố định, nhưng chỉ gần như vậy. Với một chuỗi và một lịch sử ngắn như vậy, sẽ rất khó nếu

không muốn nói là không thể phân biệt giữa tĩnh và không cố định bằng một đơn vị gốc. (a) Vẽ

đồ thị của chuỗi và tính toán ACF và PACF mẫu và mô tả những gì bạn

hiểu.

(b) Thực hiện phép thử Dickey-Fuller (tăng cường) trên chuỗi với k = 0 trong Phương trình

(6.4.1) trên trang 128. (Với k = 0, đây là phép thử Dickey-Fuller và không được tăng thêm.)

về kết quả. (c) Thực hiện kiểm tra Dickey-Fuller tăng cường trên chuỗi với k được chọn bởi

phần mềm — nghĩa là, giá trị “tốt nhất” của k. Nhận xét về kết quả. (d) Lặp lại các phần (a),
(b) và (c) nhưng với một mô phỏng mới với n = 100.

6.33 Tệp dữ liệu có tên deere1 chứa 82 giá trị liên tiếp cho lượng sai lệch (tính bằng đơn vị 0,000025

inch) từ một giá trị mục tiêu xác định mà quy trình gia công công nghiệp tại Deere & Co. tạo

ra trong một số điều kiện hoạt động cụ thể. (a) Hiển thị cốt truyện chuỗi thời gian của loạt
phim này và nhận xét bất kỳ điểm bất thường nào. (b) Tính ACF mẫu cho chuỗi này và nhận xét kết

quả. (c) Bây giờ thay giá trị bất thường bằng một giá trị điển hình hơn nhiều và tính toán lại

ACF mẫu. Nhận xét về sự thay đổi so với những gì bạn đã thấy trong phần (b). (d) Tính PACF mẫu

dựa trên loạt sửa đổi mà bạn đã sử dụng trong phần (c). Bạn sẽ chỉ định mô hình nào cho loạt

bài đã sửa đổi? (Sau đó, chúng tôi sẽ điều tra các cách khác để xử lý các trường hợp ngoại

lệ trong mô hình chuỗi thời gian.)

6.34 Tệp dữ liệu có tên deere2 chứa 102 giá trị liên tiếp cho lượng độ lệch (tính bằng đơn vị 0,0000025

inch) từ một giá trị mục tiêu được chỉ định mà một quy trình gia công công nghiệp khác tạo ra

tại Deere & Co. (a) Hiển thị biểu đồ chuỗi thời gian của chuỗi này và nhận xét về sự xuất hiện

của nó.

Một mô hình tĩnh có thích hợp không? (b) Hiển thị ACF và

PACF mẫu cho loạt phim này và chọn các đơn đặt hàng dự kiến cho một mô hình ARMA cho loạt phim.
Machine Translated by Google

Bài tập 147

6.35 Tệp dữ liệu có tên deere3 chứa 57 phép đo liên tiếp được ghi lại từ một máy công cụ

phức tạp của Deere & Co. Quá trình sử dụng một cơ chế điều khiển đặt lại một số
thông số của máy công cụ tùy thuộc vào mức độ sai lệch so với mục tiêu của mặt hàng
cuối cùng được sản xuất. (a) Hiển thị cốt truyện theo chuỗi thời gian của chuỗi này
và nhận xét về sự xuất hiện của nó.

Một mô hình cố định có thích hợp ở đây không?


(b) Hiển thị ACF và PACF mẫu cho loạt phim này và chọn các đơn đặt hàng dự kiến
cho một mô hình ARMA cho loạt phim.
6.36 Tệp dữ liệu có tên rô bốt chứa chuỗi thời gian thu được từ rô bốt công nghiệp.

Robot được thực hiện một chuỗi các thao tác và khoảng cách từ điểm kết thúc mong
muốn được ghi lại bằng inch. Điều này được lặp lại 324 lần để tạo thành chuỗi thời
gian. (a) Hiển thị biểu đồ chuỗi thời gian của dữ liệu. Dựa trên thông tin này,

những dữ liệu này dường như đến từ một quá trình tĩnh hay không cố định? (b) Tính
toán và vẽ đồ thị ACF và PACF mẫu cho các dữ liệu này. Dựa trên thông tin bổ
sung này, những dữ liệu này dường như đến từ một quá trình tĩnh hay không tĩnh? (c)
Tính toán và giải thích EACF mẫu. (d) Sử dụng cách tiếp cận ARMA tập hợp con
tốt nhất để chỉ định mô hình cho những dữ liệu này. Hãy ghép những kết quả này
với những gì bạn đã khám phá được trong các phần (a), (b) và (c).

6.37 Tính toán và giải thích EACF mẫu cho logarit của chuỗi lượng mưa Los Angeles. Dữ
liệu nằm trong tệp có tên larain. Kết quả có xác nhận rằng các bản ghi là nhiễu

trắng không?
6.38 Tính toán và giải thích EACF mẫu cho chuỗi thời gian thuộc tính màu. Dữ liệu nằm
trong tệp màu . EACF mẫu có đề xuất cùng một mô hình đã được chỉ định bằng cách
xem PACF mẫu không?
6.39 Tệp dữ liệu có tên ngày chứa dữ liệu kế toán từ Công ty Winegard của Bur lington,
Iowa. Dữ liệu là số ngày cho đến khi Winegard nhận được thanh toán cho 130 đơn đặt
hàng liên tiếp từ một nhà phân phối sản phẩm Winegard cụ thể.
(Tên của nhà phân phối phải được giấu tên vì lý do bảo mật.) (A) Vẽ biểu đồ chuỗi
thời gian và nhận xét về màn hình. Có bất kỳ val bất thường nào không
ues?

(b) Tính ACF và PACF mẫu cho chuỗi này. (c) Bây giờ thay
thế mỗi giá trị bất thường bằng giá trị 35 ngày — các giá trị điển hình hơn nhiều
— và lặp lại phép tính ACF và PACF mẫu.
Bạn sẽ chỉ định mô hình ARMA nào cho loạt bài này sau khi loại bỏ các lớp lót bên ngoài?

(Sau đó, chúng tôi sẽ điều tra các cách khác để xử lý các trường hợp ngoại lệ trong mô hình

chuỗi thời gian.)


Machine Translated by Google

CHƯƠNG 7

DỰ TOÁN THÔNG SỐ

Chương này đề cập đến vấn đề ước lượng các tham số của mô hình ARIMA
dựa trên chuỗi thời gian quan sát Y1, Y2,…, Yn. Chúng tôi giả định rằng một mô hình đã
đã được chỉ định; nghĩa là, chúng tôi đã chỉ định các giá trị cho p, d và q bằng cách sử dụng các phương pháp của

Chương 6. Liên quan đến tính không ổn định, vì sự khác biệt thứ d của chuỗi quan sát
được giả định là một quá trình ARMA (p, q) cố định , chúng ta chỉ cần quan tâm đến
vấn đề ước lượng các tham số trong các mô hình tĩnh như vậy. Trong thực tế, sau đó chúng tôi
coi sự khác biệt thứ d của chuỗi thời gian gốc là chuỗi thời gian mà từ đó chúng tôi ước
tính các tham số của mô hình hoàn chỉnh. Để đơn giản, chúng ta sẽ để Y1, Y2,…, Yn
biểu thị quá trình tĩnh được quan sát của chúng tôi mặc dù nó có thể là một sự khác biệt thích hợp

của loạt phim gốc. Đầu tiên chúng ta thảo luận về phương pháp ước tính khoảnh khắc, sau đó là
công cụ ước lượng bình phương và cuối cùng là công cụ ước tính khả năng xảy ra tối đa đầy đủ.

7.1 Phương pháp Khoảnh khắc

Phương pháp thời điểm thường là một trong những phương pháp dễ dàng nhất, nếu không phải
là hiệu quả nhất, để có được các ước tính tham số. Phương pháp bao gồm cân bằng mẫu
mô men đến mô men lý thuyết tương ứng và giải các phương trình kết quả để
có được ước tính của bất kỳ thông số nào chưa biết. Ví dụ đơn giản nhất của phương pháp là
ước tính giá trị trung bình của quá trình tĩnh bằng giá trị trung bình của mẫu. Các thuộc tính của công cụ ước tính này

đã được nghiên cứu nhiều trong Chương 3.

Mô hình tự động phục hồi

Đầu tiên hãy xem xét trường hợp AR (1). Đối với quá trình này, chúng ta có mối quan hệ đơn giản ρ1 = φ.

Trong phương pháp mô men, ρ1 tương đương với r1, độ trễ 1 tự tương quan mẫu. Như vậy
chúng ta có thể ước tính φ bằng
^
φ r1 = (7.1.1)

Bây giờ hãy xem xét trường hợp AR (2). Mối quan hệ giữa các tham số φ1 và φ2
và các khoảnh khắc khác nhau được đưa ra bởi các phương trình Yule-Walker (4.3.13) trên trang 72:

ρ1 =φ1 ρ1φ2
+ và ρ2 = +
ρ1φ1 φ2

Phương pháp mômen thay thế ρ1 bằng r1 và ρ2 bằng r2 để thu được

= + = +
r1 φ1 r1φ2 và r2 r1φ1 φ2

149
Machine Translated by Google

150 Ước tính tham số

sau đó được giải quyết để có được

2
^ ^ r2 -r1
( r1 r2 1 ) -
φ 1 = -----------------------
2 và φ
2 2
--------------- =
(7.1.2)
- -
1 r1 1 r1

Trường hợp AR (p) chung cũng tiến hành tương tự. Thay thế ρk bằng rk trong suốt
Phương trình Yule-Walker trên trang 79 (hoặc trang 114) để lấy

φ1 + r1φ2 + + +… + rp 1– φp r1 =
r2φ3

r1φ1 + φ2 + r1φ3 + +… + rp 2– φp r2 =
. (7.1.3)
.
.

rp 1– φ1 + rp 2– φ2 + rp 3– φ3 + +… φp
rp =
^ ^
Các phương trình tuyến tính này sau đó được giải cho φ φ 2 … φ ^P . Durbin-Levinson tái diễn
1 ,,,

sion của Phương trình (6.2.9) trên trang 115 cung cấp một phương pháp giải thuận tiện nhưng là
phải chịu các sai số đáng kể nếu giải pháp gần với ranh giới của vùng điểm trung
bình. Các ước tính thu được theo cách này còn được gọi là các bạn tình Yule-Walker
esti.

Mô hình trung bình động

Đáng ngạc nhiên là phương pháp thời điểm gần như không thuận tiện khi áp dụng cho mô hình
trung bình mov ing. Hãy xem xét trường hợp MA (1) đơn giản. Từ phương trình (4.2.2) trở đi
trang 57, chúng tôi biết rằng

θ
ρ1 --------------– =

1 θ2 +

Cân bằng ρ1 với r1, chúng ta được dẫn đến giải một phương trình bậc hai trong θ. Nếu | r1 | <0,5, sau đó hai

rễ thực sự được đưa ra bởi

1 1
-------– ± -------- 1 -
2
2r1 4r1

Có thể dễ dàng kiểm tra, tích của hai dung dịch luôn bằng 1; trước đó, chỉ một
trong các nghiệm thỏa mãn điều kiện khả nghịch | θ | <1.
Sau khi thao tác thêm đại số, chúng ta thấy rằng nghiệm nghịch đảo có thể được ghi
mười là

2 ^ - 14 1 r1
- +
θ = -----------------------------------
(7.1.4)
2r1

Nếu r1 = ± 0,5, nghĩa là tồn tại các nghiệm thực, duy nhất,
+ 1 nhưng không khả nghịch. Nếu | r1 | > 0,5

(điều này chắc chắn có thể xảy ra ngay cả khi | ρ1 | <0,5), không có nghiệm thực sự tồn tại, và do đó

phương pháp mô men không mang lại ước lượng là θ. Tất nhiên, nếu | r1 | > 0,5,
mức độ cụ thể của mô hình MA (1) sẽ bị nghi ngờ đáng kể.
Machine Translated by Google

7.1 Phương pháp Khoảnh khắc 151

Đối với các mô hình MA bậc cao, phương pháp thời điểm nhanh chóng trở nên phức tạp.
Chúng ta có thể sử dụng Công thức (4.2.5) ở trang 65 và thay thế ρk bằng rk cho k = 1, 2,…, q, để

thu được q phương trình với q ẩn số θ1, θ2, ..., θq. Tuy nhiên, các phương trình kết quả
là rất phi tuyến tính trong θ's, và nghiệm của chúng cần thiết là số. Ngoài ra, sẽ có nhiều
giải pháp, trong đó chỉ có một giải pháp là không thể đảo ngược. Chúng tôi sẽ không
theo đuổi điều này hơn nữa vì chúng ta sẽ thấy trong Phần 7.4 rằng, đối với các mô hình MA, phương pháp

các khoảnh khắc thường tạo ra các ước tính kém.

Mô hình hỗn hợp

Chúng tôi chỉ xem xét trường hợp ARMA (1,1). Gọi lại Công thức (4.4.5) trên trang 78,

= (1 - θφ () φ θ) -
-------------------------------------
cho k ≥ 1
ρk
φk 1– 1 2 - θφ θ2 +

Lưu ý rằng ρ2 / ρ1 = φ, trước tiên chúng ta có thể ước tính φ là

r2
^ ˆ
= ----
φ (7.1.5)
r1
Sau khi làm như vậy, chúng ta có thể sử dụng

1 ^)
θφ φ - ^ () - θ
= -------------------------------------
(7.1.6)
r1
(1 2θφ ^ - θ2 +
^
θ
để giải quyết cho. Một lần nữa lưu ý rằng phương trình bậc hai phải được giải và chỉ có nghiệm

nghịch đảo, nếu có, được giữ lại.

Ước tính phương sai tiếng ồn

2 . Trong
Tham số cuối cùng được ước tính là phương sai tiếng ồn, σe mọi trường hợp, trước hết chúng ta có thể

ước tính phương sai quá trình, γ0 = Var (Yt ), bằng phương sai mẫu

1 N _
----------- 2 (7.1.7)
s2 = ( Yt )Y -
n 1–
t 1 =

2,
và sử dụng các mối quan hệ đã biết từ Chương 4 giữa γ0, σe và θ's và φ's để esti
2.
giao phối
σe
Đối với mô hình AR (p) , Công thức (4.3.31) trên trang 77 cho kết quả
^ ^ ^
2 = -
σ ^
s2 )
(11r1
φ - 2r2
φ - prp
-… φ (7.1.8)
e

Đặc biệt, đối với quy trình AR (1),


2 = 2
(1 )
r1- s2
σ ^
e
^
kể từ .
khiφr1 =

Đối với trường hợp MA (q) , chúng ta có, sử dụng Công thức (4.2.4) ở trang 65,

2 s2
σ ^
^ ^ ^
= ------------------------------------------------- -
(7.1.9)
e
1 θ 21θ 2
2 ++++ … Θ
2 q
Machine Translated by Google

152 Ước tính tham số

Đối với quy trình ARMA (1,1), Công thức (4.4.4) trên trang 78 cho kết quả

2 - ^
2 1 φ
e
σ ^ ^
------------------------------ s2 = (7.1.10)
-
^ 2 1 2φ ^ θ+ θ

Ví dụ số

Bảng trong Hình 7.1 hiển thị các ước tính theo phương pháp khoảnh khắc cho các tham số từ
một số chuỗi thời gian mô phỏng. Nói chung, các ước tính cho tất cả các mô hình tự
động trả lời là khá tốt nhưng ước tính cho các mô hình trung bình động thì không
có thể chấp nhận được. Có thể chứng minh rằng lý thuyết xác nhận quan sát này — phương pháp của khoảnh khắc

các công cụ ước tính rất kém hiệu quả đối với các mô hình có chứa các số hạng trung bình động.

Hình 7.1 Ước tính tham số phương pháp của khoảnh khắc cho mô phỏng

Loạt

Phương pháp của Khoảnh khắc


Các thông số đích thực Ước tính

Người mẫu
θ φ1 φ2 θ φ1 φ2 N

MA (1) 0,9 0,554 120

MA (1) 0,9 0,719 120

MA (1) 0,9 NA † 60

MA (1) 0,5 0.314 60

AR (1) 0,9 0,831 60

AR (1) 0,4 0,470 60

AR (2) 1,5 0,75 1,472 0,767 120

† Không có phương pháp ước lượng mô-men nào tồn tại vì r1 = 0,544 cho mô phỏng này.

> data (ma1.2.s); dữ liệu (ma1.1.s); dữ liệu (ma1.3.s); dữ liệu (ma1.4.s)


> ước tính.ma1.mom (ma1.2.s); ước tính.ma1.mom (ma1.1.s)
> ước tính.ma1.mom (ma1.3.s); ước tính.ma1.mom (ma1.4.s)
> arima (ma1.4.s, order = c (0,0,1), method = 'CSS', include.mean = F)
> data (ar1.s); dữ liệu (ar1.2.s)
> ar (ar1.s, order.max = 1, AIC = F, method = 'yw')
> ar (ar1.2.s, order.max = 1, AIC = F, method = 'yw')
> dữ liệu (ar2.s)
> ar (ar2.s, order.max = 2, AIC = F, method = 'yw')

Bây giờ hãy xem xét một số chuỗi thời gian thực tế. Chúng tôi bắt đầu với sự phong phú của thỏ Canada

loạt. Vì chúng tôi đã tìm thấy trong Hình 6.27 ở trang 136 rằng một phép biến đổi căn bậc hai là
thích hợp ở đây, chúng tôi dựa trên tất cả các mô hình dựa trên căn bậc hai của mức độ phong phú ban đầu

những con số. Chúng tôi minh họa ước tính của mô hình AR (2) với dữ liệu thỏ rừng, thậm chí
Machine Translated by Google

7.1 Phương pháp Khoảnh khắc 153

mặc dù sau này chúng tôi sẽ chỉ ra rằng mô hình AR (3) cung cấp sự phù hợp hơn với dữ liệu. Người đầu tiên

hai phép tự tương quan mẫu được hiển thị trong Hình 6.28 trên trang 137 là r1 = 0,736 và r2
= 0,304. Sử dụng Công thức (7.1.2), các ước lượng theo phương pháp khoảnh khắc của φ1 và φ2 là

^ ( r1 r2
1 ) - -
== =----------------------- 0,736 1 0,304 ()
---------------------------------------- 1.1178
φ1 2 (7.1.11)
- -
1 r1 2 1 0,736 ()


2
^ r2 -r1 -
2 0,304 0,736 ()
φ2 == =---------------
----------------------------------------
2 0,519 - (7.1.12)
- -
1 r1 2 1 0,736 ()

Giá trị trung bình mẫu và phương sai của chuỗi này (sau khi lấy căn bậc hai) được tìm thấy là
lần lượt là 5,82 và 5,88. Sau đó, sử dụng Công thức (7.1.8), chúng tôi ước tính sự thay đổi của tiếng ồn
ance as
^ ^
= (1 φ -
φ ) 2r2 s2
σ ^ e 2
1r1 -

= [1 1,1178 - () () 0,736 - () –0,519 (]) ()


0,304
5,88
(7.1.13)

= 1,97

Mô hình ước tính (trong điều kiện ban đầu) sau đó là

= Yt 1– Yt
) (- - 5,82
2– 5,82
) - 0,519et + (7.1.14)
Yt - 1,1178 5,82 (

hoặc

=
Yt 2,335 + Yt 1–
1,1178 - 0,519 Yt 2– + et (7.1.15)

với phương sai tiếng ồn ước tính là 1,97.

Bây giờ hãy xem xét chuỗi giá dầu. Hình 6.32 trên trang 140 gợi ý rằng chúng tôi
chỉ định ify một mô hình MA (1) cho sự khác biệt đầu tiên của logarit của chuỗi. Độ trễ 1
tự tương quan mẫu trong phần trình bày đó là 0,212, vì vậy ước tính theo phương pháp mô men của θ

^ - 1 ) 2 1
θ = - 4
+ 0,212
( 0,222 -
= ------------------------------------------------- -
(7.1.16)
2 0,212 ()

Trung bình của sự khác biệt của các bản ghi là 0,004 và phương sai là 0,0072. Mô hình
giao phối esti là
= 0,004 + et
+ 0,222et 1– (7.1.17)
Yt ()
log

hoặc

= Yt 1–
() nhật ký
+ 0,004
++ et 0,222et 1– (7.1.18)
Nhật ký Yt ()

với phương sai tiếng ồn ước tính là

s2
0,0072
(7.1.19)
--------------
σ ^ e 2 == = --------------------------------- 0,00686
-
1 +
θ ^ 2 1 + 2 0,222 ()
Machine Translated by Google

154 Ước tính tham số

Sử dụng Công thức (3.2.3) trên trang 28 với các tham số ước tính sẽ dẫn đến sai số chuẩn là
giá trị trung bình của mẫu là 0,0060. Do đó, giá trị trung bình mẫu quan sát được là 0,004
không hẳn là khác 0 đáng kể và chúng tôi sẽ loại bỏ số hạng không đổi khỏi mô hình, đưa ra
mô hình cuối cùng là
= + + (7.1.20)
Nhật ký Yt () log () và 0,222et 1– Yt 1–

7.2 Ước tính bình phương nhỏ nhất

Bởi vì phương pháp thời điểm không đạt yêu cầu đối với nhiều mô hình, chúng ta phải xem xét
các phương pháp ước lượng khác. Chúng tôi bắt đầu với hình vuông nhỏ nhất. Đối với các mô hình tự động phục hồi,

những ý tưởng khá đơn giản. Tại thời điểm này, chúng tôi giới thiệu một nghĩa có thể khác,
μ, vào các mô hình tĩnh của chúng tôi và coi nó như một tham số khác để ước tính ít nhất
hình vuông.

Mô hình tự động phục hồi

Hãy xem xét trường hợp đơn đặt hàng đầu tiên, nơi

= + (7.2.1)
Yt - μ φ Yt 1–() - μ et

Chúng ta có thể xem đây là một mô hình hồi quy với biến dự báo Yt - 1 và biến phản hồi có thể
Yt . Ước tính bình phương nhỏ nhất sau đó tiến hành bằng cách giảm thiểu tổng bình phương của
sự khác biệt

Yt () φ - -μ () Yt
- μ1–

Vì chỉ quan sát được Y1, Y2,…, Yn nên chúng ta chỉ có thể tính tổng từ t = 2 đến t = n. Để cho

N
2
Sc ( ) φ μ, = [Yt () φ - -μ ( Yt 1– ) - μ] (7.2.2)
t 2 =

Đây thường được gọi là hàm tổng bình phương có điều kiện. (Lý do cho
thuật ngữ có điều kiện sẽ trở nên rõ ràng sau này.) Theo nguyên tắc ít nhất

bình phương, chúng tôi ước tính φ và μ bằng các giá trị tương ứng mà tối thiểu hóa Sc (φ, μ) cho
giá trị quan sát của Y1, Y2,…, Yn.
Xét phương trình Sc . Chúng ta có
μ ⁄ 0 =

N
= = 0
2 [Yt () φ - -μ ( Yt 1– ])
() -1–μ + φ
Sc μ t 2 =

hoặc, đơn giản hóa và giải cho μ,

N N
1
μ
= ---------------------------------

() n 1– (1 - φ)
Yt φ Yt- 1– (7.2.3)
t 2 = t 2 =
Machine Translated by Google

7.2 Ước tính bình phương nhỏ nhất 155

Bây giờ, đối với n lớn,

1
N
1
N _
-----------
≈ -----------

n 1–
Yt n 1– 1– YtY
t 2 = t 2 =

Do đó, bất kể giá trị của φ là bao nhiêu, Công thức (7.2.3) giảm xuống

1 _ _ _
μ ^ (
----------- Y
) φY
- = Y (7.2.4)
≈ 1 - φ
_
Đôi khi chúng tôi nói, ngoại trừ hiệu ứng μ ^=_ Y .
Bây giờ hãy xem xét việc giảm thiểu
cuối,( Sc
),φ Yđối với φ. Chúng ta có
_
N _ _ _
Sc( φ ,Y
2 [Yt
() Yφ - - ( Y Y
Yt 1– ) -] ( Yt 1– ) -
----------------------

) =
φ t 2 =

Đặt giá trị này bằng 0 và giải φ cho kết quả

N _ _
( 1– ) -Y
(Yt )Y - Yt
^ t 2 =
φ = ------------------------------------------------- -------
N _
2
(Yt 1– ) Y
-
t 2 =
_
2
Ngoại trừ một số hạng bị thiếu ở mẫu số, đó là Yn Y () - , cái này giống với

r1. Số hạng còn thiếu duy nhất là không đáng kể đối với các quá trình tĩnh, và do đó ít nhất
bình phương và phương pháp ước tính mô-men gần giống hệt nhau, đặc biệt là đối với
mẫu.
Đối với quy trình AR (p) chung , các phương pháp được sử dụng để có được Công thức (7.2.3) và

(7.2.4) có thể dễ dàng được mở rộng để mang lại cùng một kết quả, cụ thể là
_
μ ^= Y (7.2.5)

Để tổng quát ước lượng của φ, chúng ta xem xét _


mô hình bậc hai. Trong bước nhảy phụ với
Y
Công thức (7.2.5), chúng tôi thay thế μ bằng trong hàm func tổng bình phương có điều
kiện, vì vậy

_ N _ _ _
2
, Y,
Sc (φ1 φ2 ) = [() φ21–Yt 2–Y ) -]
Ytφ Y- - -()- 1( Yt Y (7.2.6)
t 3 =

⁄ 0 = ,
Cài đặt Sc chúng ta có
φ1

N _ _ _ _
- 2 = 0
YtφY- - ( 1 Yt 1– ) -Y - ( Yt
[() φ2 2– Y (
) -] Y
Yt 1– ) - (7.2.7)
t 3 =

mà chúng ta có thể viết lại thành


Machine Translated by Google

156 Ước tính tham số

N _ _ N _
= 2
(Yt ) Y- Yt( 1– ) Y- (Yt Y
1– ) - φ1
t 3 = t 3 =

(7.2.8)
N _ _
+ (Yt Y( 2–
1– ) - Yt ) Y- φ2
t 3 =

N _ _
Tổng các sản phẩm bị tụt hậu (Yt) Y- Yt( 1– ) Y
- gần như là tử số của
t 3 = _ _
r1 — chúng tôi đang thiếu một sản phẩm, ) - . Một
(Y2 )Y - (Y1 Y tình huống tương tự cũng tồn tại đối với

N
_ _ _ _
(Yt Y
1– ) - ( Yt 2– ) Y- ,nhưng ở đây chúng ta đang thiếu ( Yn )Y - ( Yn 1– ) Y- .Nếu chúng ta chia

t 3 = N _
2
cả hai vế của Phương trình (7.2.8) bằng ()
Yt -Y , sau đó, ngoại trừ các hiệu ứng cuối,
t 3 =

không đáng kể theo giả định ổn định, chúng tôi thu được

r1 φ1 r1φ2 + = (7.2.9)

Xấp xỉ một cách tương tự với phương trình Sc φ2 ⁄ 0 =


dẫn đến

r2 r1φ1 φ2 + = (7.2.10)

Nhưng các phương trình (7.2.9) và (7.2.10) chỉ là các phương trình Yule-Walker mẫu cho một
Mô hình AR (2).
Các kết quả hoàn toàn tương tự tuân theo đối với trường hợp AR (p) tĩnh nói chung :
xấp xỉ tuyệt vời, ước lượng bình phương nhỏ nhất có điều kiện của φ thu được
bằng cách giải các phương trình Yule-Walker mẫu (7.1.3). †

Mô hình trung bình động

Bây giờ hãy xem xét ước lượng bình phương nhỏ nhất của θ trong mô hình MA (1):

- =
Yt et θet 1– (7.2.11)

Thoạt nhìn, không rõ là phương pháp hồi quy hoặc bình phương nhỏ nhất có thể như thế nào
áp dụng cho các mô hình như vậy. Tuy nhiên, hãy nhớ lại từ Công thức (4.4.2) trên trang 77 rằng các mô

hình MA (1) đảo ngược có thể được biểu diễn như

= - - –– +
Yt θYt 1– θ2Yt 2– θ3Yt 3– … Et

một mô hình tự phục hồi nhưng có thứ tự vô hạn. Vì vậy, bình phương nhỏ nhất có thể có ý nghĩa
được thực hiện bằng cách chọn một giá trị θ giảm thiểu

† Chúng tôi lưu ý rằng Lai và Wei (1983) đã thiết lập rằng các ước lượng bình phương nhỏ nhất có điều kiện

nhất quán ngay cả đối với các mô hình tự động hồi quy không cố định trong đó các mã số Yule-Walker

không áp dụng.
Machine Translated by Google

7.2 Ước tính bình phương nhỏ nhất 157

= = …
Sc ( ) θ et () 2 [ Yt ++ +
θYt 1– θ2Yt 2–
θ3Y + t 3– 2 ] (7.2.12)

trong đó, rõ ràng, et = et (θ) là một hàm của chuỗi quan sát và tham số eter θ
chưa biết.

Rõ ràng từ Công thức (7.2.12) rằng bài toán bình phương nhỏ nhất là phi tuyến tính trong
thông số. Chúng ta sẽ không thể giảm thiểu Sc (θ) bằng cách lấy đạo hàm đối với
θ, đặt nó thành 0 và giải quyết. Do đó, ngay cả đối với mô hình MA (1) đơn giản, chúng ta phải sử dụng

đến các kỹ thuật tối ưu hóa số. Các vấn đề khác tồn tại trong trường hợp này: Chúng tôi không
chỉ ra các giới hạn rõ ràng về tổng kết trong Công thức (7.2.12) cũng như chúng tôi chưa cho biết cách

đối phó với chuỗi vô hạn dưới dấu tổng.


Để giải quyết những vấn đề này, hãy xem xét đánh giá Sc (θ) cho một giá trị cho trước duy nhất của θ. Các

chỉ Y mà chúng tôi có sẵn là chuỗi quan sát của chúng tôi, Y1, Y2,…, Yn. Viết lại phương trình
(7.2.11) như

et
+ =Yt θet 1– (7.2.13)

Sử dụng phương trình này, e1, e2,…, en có thể được tính toán đệ quy nếu chúng ta có
giá trị e0. Một phép gần đúng phổ biến là đặt e0 = 0 — giá trị kỳ vọng của nó. Sau đó, điều chỉnh

trên e0 = 0, chúng ta có thể thu được

e1 Y1 =

e2 Y2 θe1 + =

e3 Y3 θe2 + = (7.2.14)
.
.
.

en + =Yn θen 1–

=
2 ,có điều kiện về e0 = 0, với giá trị nhất định duy nhất đó là
và do đó tính toán
Sc ( ) θ et ()
θ.
Đối với trường hợp đơn giản của một tham số, chúng tôi có thể thực hiện tìm kiếm lưới trên
khoảng nghịch đảo ( 1, + 1) để θ tìm tổng bình phương nhỏ nhất. Để biết thêm tổng quát
Mô hình MA (q) , một thuật toán tối ưu hóa số, chẳng hạn như Gauss-Newton hoặc Nelder
Mead, sẽ là cần thiết.
Đối với các mô hình đường trung bình động bậc cao hơn, các ý tưởng là tương tự và không có điểm khác biệt mới

đỉnh điểm phát sinh. Chúng tôi tính toán et = et (θ1, θ2,…, θq) một cách đệ quy từ

= + + ++ (7.2.15)
et Yt θ1et 1– θ2et 2– … Qet q -

với e0 = e 1 = = q = 0. Tổng các bình phương được tối thiểu hóa cùng nhau trong θ1, θ2,…, θq
e sử dụng phương pháp số đa biến.

Mô hình hỗn hợp

Hãy xem xét trường hợp ARMA (1,1)

- + =
Yt φYt 1– et θet 1– (7.2.16)
Machine Translated by Google

158 Ước tính tham số

2.
Như trong trường hợp MA thuần túy, chúng ta coi et = et (φ, θ) và muốn tối thiểu hóa Sc ( ) φ θ, = et

Chúng ta có thể viết lại Phương trình (7.2.16) dưới dạng

= - + θet 1– (7.2.17)
et Yt φYt 1–

Để có được e1, bây giờ


_ chúng ta có một vấn đề "khởi động" bổ sung, đó là Y0. Một cách tiếp cận là
Y
để đặt Y0 = 0 hoặc nếu mô hình của chúng tôi có chứa giá trị trung bình khác không. Tuy nhiên, một cách tiếp cận tốt hơn

là bắt đầu đệ quy tại t = 2, do đó hoàn toàn tránh được Y0 và đơn giản là giảm thiểu

N
2
Sc ( ) φ θ, = et
t 2 =

Đối với mô hình ARMA (p, q) chung , chúng tôi tính toán

= - - -
et Yt φ1Yt 1– φ2Yt 2– -… φpYt p -
(7.2.18)
+ + ++
θ1et 1– θ2et 2– … θqet q -

với ep = ep - 1 = 0= và
= ep
sau+ đó
1 - q nhỏ Sc (φ1, φ2,…, φp, θ1, θ2,…, θq)
thu
bằng số để có được ước lượng bình phương nhỏ nhất có điều kiện của tất cả các tham số.

Đối với các bộ tham số θ1, θ2,…, θq tương ứng với các mô hình khả nghịch, giá trị
ues ep, ep - 1,…, ep + 1 khởi động sẽ có rất ít ảnh hưởng đến các ước tính cuối cùng của
- q tham số cho các mẫu lớn.

7.3 Khả năng xảy ra tối đa và bình phương ít nhất vô điều kiện

Đối với chuỗi có độ dài vừa phải và các mô hình theo mùa ngẫu nhiên sẽ được thảo luận trong

Chương 10, các giá trị khởi động ep = ep - 1 = 0hơn
sẽ đối
có ảnh
vớihưởng danh
các ước từ pro
lượng = cùng
cuối = ep cho
+ 1 các
- q
tham số. Vì vậy, chúng tôi được dẫn đến việc xem xét
vấn đề khó hơn về ước tính khả năng xảy ra tối đa.
Ưu điểm của phương pháp có khả năng xảy ra tối đa là tất cả các thông tin
trong dữ liệu được sử dụng thay vì chỉ những khoảnh khắc đầu tiên và thứ hai, như trường hợp ít nhất

hình vuông. Một ưu điểm khác là nhiều kết quả mẫu lớn được biết đến dưới
điều kiện chung. Một điều bất lợi là lần đầu tiên chúng ta phải làm việc cụ thể
với hàm mật độ xác suất chung của quá trình.

Ước lượng khả năng tối đa

Đối với bất kỳ tập hợp quan sát nào, Y1, Y2,…, Yn, chuỗi thời gian hay không, hàm khả năng L là
được định nghĩa là mật độ xác suất chung của việc thu được dữ liệu thực sự được
quan sát. Đã bao giờ, nó được coi là một hàm của các tham số chưa biết trong mô hình với
dữ liệu quan sát được giữ cố định. Đối với các mô hình ARIMA, L sẽ là một hàm của φ's, θ's, μ, và
2
σe đưa ra các quan sát Y1, Y2,…, Yn. Các công cụ ước tính khả năng xảy ra tối đa sau đó là
được định nghĩa là các giá trị của các tham số mà dữ liệu thực sự quan sát được nhiều nhất
có thể, nghĩa là, các giá trị tối đa hóa hàm khả năng.
Chúng ta bắt đầu bằng cách xem xét chi tiết mô hình AR (1). Giả định phổ biến nhất là
rằng các thuật ngữ nhiễu trắng là các biến ngẫu nhiên độc lập, được phân phối bình thường với
Machine Translated by Google

7.3 Khả năng xảy ra tối đa và bình phương ít nhất vô điều kiện 159

không có nghĩa và độ lệch chuẩn chung σe .Hàm mật độ xác suất (pdf)
của mỗi et sau đó là
2
2 et

(2πσe
1 2 / - )

điểm kinh nghiệm


–---------
2 cho <<t
∞ e ∞
-
2σe

và, độc lập, pdf chung cho e2, e3,…, en là

N
2 ) n 1– ⁄ 1 2
) - ( 2 exp ---------
et
(2πσe 2
- (7.3.1)
2σe t 2 =

Bây giờ hãy xem xét

= () - μ e2
Y2 - μ φ Y1 +

= () - μ e3
Y3 - μ φ Y2 +
. (7.3.2)
.
.
= 1–() - μ en +
Yn - μ φ Yn

Nếu chúng ta điều kiện Y1 = y1, Công thức (7.3.2) xác định một phép biến đổi tuyến tính giữa e2,
e3,…, en và Y2, Y3,…, Yn (với Jacobian bằng 1). Do đó, pdf chung của Y2, Y3,…, Yn
cho trước Y1 = y1 có thể nhận được bằng cách sử dụng Công thức (7.3.2) để thay thế cho e theo
của Y trong Công thức (7.3.1). Vì vậy, chúng tôi nhận được

2 ) n 1– ⁄ 2
= ) - (
( f y2
y1 y3
) ,,,
… yn | (2πσe

N
1 2 (7.3.3)
× exp [ yt () φ --μ() -
2 μ]
= yt 1– t
---------
2
-
2σe

Bây giờ hãy xem xét phân phối (cận biên) của Y1. Sau khi gửi trả lời quá trình tuyến tính
của quá trình AR (1) (Phương trình (4.3.8) trên trang 70) rằng Y1 sẽ có giá trị bình thường
2 σe
phối 1 φ2 với trung bình μ và phương sai ⁄ ()Phân
- . Nhân pdf có điều kiện trong
Phương trình (7.3.3) theo pdf biên của Y1 cho chúng ta pdf chung của
2
Y1, Y2,…, Yn mà chúng ta
yêu cầu. Được diễn giải dưới dạng hàm của các tham số φ,σeμ ,và hàm khả năng
cho một mô hình AR (1) được đưa ra bởi

2 2 1
, ,
L (φμσe ) = (2πσe 2 / ⁄ )2 –n
1 φ2
) -( 1
exp –---------2 S ( ) φ μ, (7.3.4)
2σe
ở đâu
N
2
= [Yt () φ μ 1 φ2
() - ( Y1 (7.3.5)
S () φ μ, - - (Yt 1– ) - μ] + t 2
) - μ
=

Hàm S (φ, μ) được gọi là hàm tổng bình phương không điều kiện.
Theo quy tắc chung, logarit của hàm khả năng sẽ thuận tiện hơn để
Machine Translated by Google

160 Ước tính tham số

làm việc với khả năng của chính nó. Đối với trường hợp AR (1), hàm khả năng ghi nhật ký,
biểu thị , , 2 ) , được đưa ra bởi
(l φμσe

2 =
N N
- -1 1
, ,
(l φμσe ) 2 - 1 φ2 log
- () (7.3.6)
2 --log () 2π
σe 2- log () - --------- S ( ) φ μ,
+ 2 2
2σe

, φμσe
, 2
Đối với các giá trị đã cho của φ vàμ, (l ) có thể được phân tích tối đa về mặt phân tích
2
để σe xét về các công cụ ước lượng chưa được xác định của φ và μ. Chúng tôi đạt được

^
2 S μφ ^),(
---------------- =
σ ^
(7.3.7)
e N

Như trong nhiều ngữ cảnh tương tự khác, chúng ta thường chia cho n - 2 hơn là n (vì chúng ta
ước lượng hai tham số, φ và μ) để có được công cụ ước lượng có độ chệch ít hơn. Đối với điển hình
kích thước mẫu chuỗi thời gian, sẽ có rất ít sự khác biệt.
Bây giờ hãy xem xét ước lượng của φ và μ. Một so sánh của vô điều kiện
hàm tổng bình phương S (φ, μ) với hàm tổng bình phương có điều kiện trước đó
Sc (φ, μ) của Công thức (7.2.2) trên trang 154, cho thấy một điểm khác biệt đơn giản:

= + 1 φ2 2 (7.3.8)
S () φ μ, Sc ( ) φ μ, - () Y1 () - μ

2
(Vì Sc (φ, μ) liên quan đến tổng của n - 1 thành phần, trong khi đó) 1 φ2
Y1
- () - μ thì không
liên quan đến n, chúng ta sẽ có S () φ μ, Sc ≈ () φ μ, . Do đó giá trị của φ và μ nhỏ nhất
S (φ, μ) hoặc Sc (φ, μ) phải rất giống nhau, ít nhất là đối với các cỡ mẫu lớn hơn. Ảnh hưởng của
số hạng ngoài cùng bên phải trong Công thức (7.3.8) sẽ quan trọng hơn khi giá trị nhỏ nhất của φ
xảy ra gần ranh giới đứng yên của ± 1.

Hình vuông ít nhất vô điều kiện

Như một sự thỏa hiệp giữa ước lượng bình phương nhỏ nhất có điều kiện và ước tính hood likeli tối

đa đầy đủ, chúng ta có thể cân nhắc việc thu được ước tính bình phương nhỏ nhất không điều kiện; cái đó
2
1 φ2
(là, ước tính tối thiểu hóa S (φ, μ). Thật không may, thuật ngữ) -()Y1- μ gây ra
phương trình và
μ S φ⁄ 0
S = ⁄ 0 = trở thành phi tuyến tính trong φ và μ, và đại
diện cho một số hạng không đổi θ0 = μ (1 - φ) không cải thiện được tình hình về cơ bản. Như vậy
tối thiểu hóa phải được thực hiện bằng số. Các ước lượng kết quả được gọi là ước lượng bình
phương nhỏ nhất không phân số.
Việc suy ra hàm khả năng cho các mô hình ARMA tổng quát hơn có liên quan nhiều hơn. Một
dẫn xuất có thể được tìm thấy trong Phụ lục H: Không gian trạng thái
Các mô hình ở trang 222. Chúng tôi giới thiệu người đọc đến Brockwell và Davis (1991) hoặc Shumway
và Stoffer (2006) để biết thêm chi tiết.

7.4 Các thuộc tính của ước tính

Các thuộc tính mẫu lớn của khả năng xảy ra tối đa và bình phương nhỏ nhất (có điều kiện
hoặc vô điều kiện) các công cụ ước lượng giống hệt nhau và có thể thu được bằng cách sửa đổi tiêu chuẩn

lý thuyết khả năng xảy ra tối đa. Thông tin chi tiết có thể được tìm thấy trong Shumway và Stoffer (2006, pp.

125–129). Chúng ta sẽ xem xét các kết quả và ý nghĩa của chúng đối với các mô hình ARMA đơn giản.
Machine Translated by Google

7.4 Các thuộc tính của ước tính 161

Đối với n lớn, các ước lượng xấp xỉ không chệch và phân phối chuẩn.
Các phương sai và tương quan như sau:

1 φ2 -
AR (1): Var φ ^ ()
≈ --------------
(7.4,9)
N

-
2
^ ^ 1 φ2
φ ) ≈Var φ () 2
Var ( ≈ --------------

N
AR (2): 1 (7.4.10)
^ ^ φ1
( 1, φ 2) ≈ - =
–--------------
Corr φ ρ 1

1 φ2 -

1 θ2 -
MA (1): Var θ ^ ()
≈ --------------
(7.4.11)
N

-
2
^ ^ 1 θ2
Var () ≈ θ
θ Var ( 2 ) ≈ --------------
N
MA (2): 1 (7.4.12)
^ ^ θ1
( 1, θ 2) ≈
Corr θ –--------------

1 θ2 -

2
≈ 1 φ2 -
-------------- 1 - φθ
---------------
Var φ ^ ()
N φ θ -
2
1 θ2 - 1 - φθ
ARMA (1,1): () Var θ ^
≈ -------------- ---------------
(7.4.13)
N φ θ -

^ ^ 1 φ2
-) (1
- θ2 ()
Corr φ
( ),θ ≈ -------------------------------------------

1 - φθ

Lưu ý rằng, trong trường hợp AR (1), phương sai của công cụ ước lượng của φ giảm khi φ
phương pháp tiếp cận ± 1. Cũng lưu ý rằng mặc dù mô hình AR (1) là một trường hợp đặc biệt của
^
Mô hình AR (2), phương sai được hiểnφ thị
1 trong Công thức (7.4.10) cho thấy rằng ước tính của chúng tôi

của φ1 thường sẽ bị ảnh hưởng nếu chúng ta điều chỉnh sai mô hình AR (2) khi trên thực tế, φ2 = 0.
Các nhận xét tương tự có thể được đưa ra về việc điều chỉnh mô hình MA (2) khi MA (1) sẽ
đủ hoặc phù hợp với ARMA (1,1) khi AR (1) hoặc MA (1) là đủ.
Đối với trường hợp ARMA (1,1), hãy lưu ý mẫu số của φ - θ trong các phương sai tính bằng
đẳng thức (7.4.13). Nếu φ và θ gần bằng nhau, độ biến thiên trong các ước lượng của φ và θ có thể
cực kỳ lớn.
Lưu ý rằng trong tất cả các mô hình hai tham số, các ước tính có thể tương quan cao,
ngay cả đối với kích thước mẫu rất lớn.

Bảng thể hiện trong Phụ lục 7.2 cung cấp các giá trị số cho độ lệch chuẩn gần
đúng của mẫu lớn của các ước lượng φ trong mô hình AR (1) đối với một số giá trị của
φ và một số kích thước mẫu. Vì các giá trị trong bảng bằng 1 φ2 (, chúng
) - ⁄ n
áp dụng tốt như nhau đối với độ lệch chuẩn được tính theo Công thức (7.4.10),
Machine Translated by Google

162 Ước tính tham số

(7.4.11) và (7.4.12).

Do đó, khi ước tính mô hình AR (1) với, ví dụ, n = 100 và φ = 0,7, chúng ta có thể

tin tưởng khoảng 95% rằng ước tính của chúng tôi về φ là sai số không quá ± 2 (0,07) =
± 0,14.

^
Phụ lục 7.2 AR (1) Mô hình Độ lệch tiêu chuẩn mẫu lớn của φ

φ 50 100 200

0,4 0,13 0,09 0,06

0,7 0,10 0,07 0,05

0,9 0,06 0,04 0,03

Đối với các mô hình tự động hồi quy tĩnh, phương pháp mô-men xoắn mang lại các công cụ ước lượng

tương đương với bình phương nhỏ nhất và khả năng xảy ra lớn nhất, ít nhất là đối với các mẫu lớn. Đối

với các mod els có chứa các số hạng trung bình động, không phải như vậy. Đối với mô hình MA (1), nó có thể

được chỉ ra rằng phương sai mẫu lớn của phương pháp ước lượng thời điểm của θ là

tương đương với

1 θ2 4θ4 θ6 θ8 ++ ++
Var θ ^ ()
≈ -------------------------------------------------- -----
(7.4.14)
2
n 1 θ2
- ()

So sánh phương trình (7.4.14) với phương trình (7.4.11), chúng ta thấy rằng phương sai của

công cụ ước tính phương pháp của khoảnh khắc luôn lớn hơn phương sai của giá trị lớn nhất

công cụ ước tính khả năng xảy ra. Bảng trong Hình 7.3 hiển thị tỷ lệ của độ lệch tiêu chuẩn mẫu lớn

cho hai phương pháp đối với một số giá trị của θ. Ví dụ, nếu θ là 0,5,

công cụ ước tính phương pháp khoảnh khắc có độ lệch chuẩn mẫu lớn lớn hơn 42%

so với độ lệch chuẩn của công cụ ước tính thu được khi sử dụng khả năng tối đa. Nó là
rõ ràng từ những tỷ lệ này rằng công cụ ước tính thời điểm không nên được sử dụng cho

Mô hình MA (1). Lời khuyên tương tự này áp dụng cho tất cả các mô hình có chứa đường trung bình động
điều kiện.

Hình 7.3 Phương pháp Khoảnh khắc (MM) so với Khả năng tối đa (MLE) trong Mô hình MA (1)

θ SDMM / SDMLE

0,25 1,07

0,50 1,42

0,75 2,66

0,90 5.33
Machine Translated by Google

7.5 Minh họa về ước lượng tham số 163

7.5 Minh họa về ước lượng tham số

Xét chuỗi MA (1) mô phỏng với θ = 0,9. Bộ truyện được trưng bày trong Triển lãm
4.2 trên trang 59 và chúng tôi nhận thấy ước tính theo phương pháp khoảnh khắc của θ là một
0,554; xem Hình 7.1 trên trang 152. Ngược lại, ước tính khả năng xảy ra tối đa là
0,915, ước tính tổng bình phương không điều kiện là 0,923, và ước lượng nhỏ nhất có điều kiện
ước lượng bình phương là 0,879. Đối với chuỗi này, ước tính khả năng xảy ra tối đa là -0,915
gần nhất với giá trị thực được sử dụng trong mô phỏng. Sử dụng Công thức (7.4.11) trên trang 161
và thay thế θ theo ước tính của nó, chúng tôi có một sai số tiêu chuẩn là khoảng

1 -
θ ^ 2 -
2 1 0,91 (= )
≈ -------------- -------------------------- 0,04 ≈
Var ^ θ ^ ()
n 120

vì vậy không có khả năng tối đa, tổng bình phương có điều kiện hoặc không điều kiện
ước tính tổng bình phương khác xa đáng kể so với giá trị thực của 0,9.
Mô phỏng MA (1) thứ hai với θ = 0,9 tạo ra phương pháp mô-men xoắn là 0,719 được trình bày
trong Hình 7.1. Ước tính tổng bình phương có điều kiện là 0,958,
ước tính tổng bình phương vô điều kiện là 0,983 và người bạn đời có khả năng xảy ra tối đa là
1.000. Tất cả đều có sai số tiêu chuẩn khoảng 0,04 như trên. Đây là ước tính khả năng xảy ra
^
tối đa của mẹ là θ 1 = là một chút bối rối vì nó tương ứng với một

mô hình không thể đảo ngược.

Mô phỏng MA (1) thứ ba với θ = 0,9 tạo ra ước tính theo phương pháp mô-men xoắn
của -0,719 (xem Hình 7.1). Ước tính khả năng xảy ra tối đa ở đây là 0,894 với
lỗi tiêu chuẩn của khoảng

-
≈ 2 1 0,894 (≈ )
Var ^ θ ^ () ----------------------------- 0,06
60

Đối với những dữ liệu này, ước tính tổng bình phương có điều kiện là 0,979 và không điều kiện
ước tính tổng bình phương là 0,961. Tất nhiên, với một sai số tiêu chuẩn có độ lớn này, nó
không khôn ngoan khi báo cáo các chữ số trong ước tính của θ vượt quá vị trí phần mười.

Đối với các mô hình tự động phục hồi được mô phỏng của chúng tôi, kết quả được báo cáo trong Phần trưng bày 7.4
và 7,5.

Hình 7.4 Ước tính tham số cho các mô hình AR (1) được mô phỏng
Phương pháp của Có điều kiện Vô điều kiện Tối đa
Khoảnh khắc SS SS Khả năng xảy ra

Thông số φ Ước tính Ước tính Ước tính Ước tính N

0,9 0,831 0,857 0,911 0,892 60

0,4 0,470 0,473 0,473 0,465 60

> data (ar1.s); dữ liệu (ar1.2.s)


> ar (ar1.s, order.max = 1, AIC = F, method = 'yw')
> ar (ar1.s, order.max = 1, AIC = F, method = 'ols')
> ar (ar1.s, order.max = 1, AIC = F, method = 'mle')
Machine Translated by Google

164 Ước tính tham số

> ar (ar1.2.s, order.max = 1, AIC = F, method = 'yw')


> ar (ar1.2.s, order.max = 1, AIC = F, method = 'ols')
> ar (ar1.2.s, order.max = 1, AIC = F, method = 'mle')

Từ Công thức (7.4.9) trên trang 161, các sai số tiêu chuẩn cho các ước tính là

- ^ -
2 1 φ
≈ -------------- 2 1 0,831 (= )
----------------------------- 0,07 ≈
Var ^ φ ^ ()
n 60

-
2 1 0,470 (= )
Var ^ φ ^ () ----------------------------- 0,11 ≈
60

tương ứng. Xem xét mức độ của các sai số tiêu chuẩn này, tất cả bốn phương pháp đều phù hợp với
nhau một cách hợp lý cho các mô hình AR (1).

Hình 7.5 Ước tính tham số cho mô hình AR (2) được mô phỏng
Phương pháp của Có điều kiện Vô điều kiện Tối đa
Khoảnh khắc SS SS Khả năng xảy ra

Thông số Ước tính Ước tính Ước tính Ước tính N

1.472 1.5137 1.5183 1.5061 120


φ1 = 1,5
0,767 0,8050 0,8093 0,7965 120
φ2 = 0,75

> dữ liệu (ar2.s)


> ar (ar2.s, order.max = 2, AIC = F, method = 'yw')
> ar (ar2.s, order.max = 2, AIC = F, method = 'ols')
> ar (ar2.s, order.max = 2, AIC = F, method = 'mle')

Từ Công thức (7.4.10) trên trang 161, các sai số tiêu chuẩn cho các ước tính là

- 2
^ ^ 1 φ2 -
φ1 ≈
2 1 0,75 (= )
Var ^() Var ^()
φ2 ≈ -------------- -------------------------- 0,06 ≈
n 120

Một lần nữa, xem xét quy mô của các sai số tiêu chuẩn, cả bốn phương pháp đều ước tính một cách hợp lý

tốt cho các mô hình AR (2).

Như một ví dụ cuối cùng sử dụng dữ liệu mô phỏng, hãy xem xét ARMA (1,1) được hiển thị trong Phần trình bày

6.14 trên trang 123. Ở đây φ = 0.6, θ = 0.3, và n = 100. Các ước lượng bằng cách sử dụng các
phương pháp được trình bày trong Phụ lục 7.6.
Machine Translated by Google

7.5 Minh họa về ước lượng tham số 165

Hình 7.6 Ước tính tham số cho mô hình ARMA được mô phỏng (1,1)

Phương pháp của Có điều kiện Vô điều kiện Tối đa


Khoảnh khắc SS SS Khả năng xảy ra

Thông số Ước tính Ước tính Ước tính Ước tính N

φ = 0,6 0,637 0,5586 0,5691 0,5647 100

θ = 0,3 0,2066 0.3669 0,3618 0.3557 100

> dữ liệu (arma11.s)


> arima (arma11.s, order = c (1,0,1), method = 'CSS')
> arima (arma11.s, order = c (1,0,1), method = 'ML')

Bây giờ chúng ta hãy xem xét một số chuỗi thời gian thực. Chuỗi thời gian sở hữu hóa chất công nghiệp

lần đầu tiên được hiển thị trong Phụ lục 1.3 trên trang 3. PACF mẫu được hiển thị trong Phụ lục 6.26

trên trang 135, đã đề xuất mạnh mẽ mô hình AR (1) cho loạt bài này. Hình 7.7 cho thấy
các ước lượng khác nhau của tham số φ bằng cách sử dụng bốn phương pháp ước lượng khác nhau.

Hình 7.7 Ước tính tham số cho chuỗi thuộc tính màu

Phương pháp của Có điều kiện Vô điều kiện Tối đa


Khoảnh khắc SS SS Khả năng xảy ra

Tham số Ước tính Ước tính Ước tính Ước tính N

φ 0,5282 0,5549 0,5890 0,5703 35

> dữ liệu (màu)

> ar (color, order.max = 1, AIC = F, method = 'yw')


> ar (color, order.max = 1, AIC = F, method = 'ols')
> ar (color, order.max = 1, AIC = F, method = 'mle')

Ở đây, sai số chuẩn của các ước tính là khoảng

-
≈ 1 0,57 (≈ ) 2
Var ^ φ ^ () -------------------------- 0,14
35

vì vậy tất cả các ước tính đều có thể so sánh được.

Ví dụ thứ hai, hãy xem xét lại chuỗi số lượng phong phú của thỏ Canada. Như
trước đây, chúng tôi dựa trên tất cả các mô hình dựa trên căn bậc hai của các số dư ban đầu.
Dựa trên hàm tự tương quan từng phần được trình bày trong Phụ lục 6.29 trên trang 137, chúng tôi
sẽ ước tính một mô hình AR (3). Đối với minh họa này, chúng tôi sử dụng ước lượng khả năng xảy
ra tối đa và hiển thị kết quả thu được từ phần mềm R trong Phụ lục 7.8.
Machine Translated by Google

166 Ước tính tham số

Hình 7.8 Ước tính khả năng xảy ra tối đa từ Phần mềm R: Dòng Hare

Hệ số: ar1 ar2 ar3 Đánh chặn †

1,0519 0.2292 0,3931 5.6923

se 0,1877 0,2942 0,1915 0,3371

sigma ^ 2 được ước tính là 1,066: log-likelkel = -46,54, AIC = 101,08

† Mức đánh chặn ở đây là ước lượng của trung bình quá trình μ — không phải của θ0.

> dữ liệu (thỏ rừng)

> arima (sqrt (hare), order = c (3,0,0))

^ ^ ^
Ở đây chúng ta thấy
φ rằng = 1.0519,
φ2 = 0.2292, và =φ 3 0.3930. Chúng tôi cũng thấy rằng
1 phương sai tiếng ồn ước tính là = 1,066. Ghi nhận các lỗi tiêu chuẩn, các ước tính của
σ ^ e 2

Hệ số tự động hồi phục lag 1 và lag 3 khác nhau đáng kể so với 0, cũng như
thời hạn chặn, nhưng ước tính tham số tự động hồi quy độ trễ 2 không đáng kể.
Mô hình ước tính sẽ được viết

= (1,0519
-
Yt - 5,6923 Yt 1– - 5,6923 ) () - 5,6923
0,2292 Yt 2–

-
(0,3930 Yt 3– ) 5,6923– et +

hoặc

= + - - +
Yt 3,25 1,0519 Yt 1– 0,2292 Yt 2– 0,3930 Yt 3– et

trong đó Yt là lượng thỏ rừng dồi dào ở năm thứ t tính theo giá trị ban đầu. Vì độ trễ 2 tự động hồi phục

số hạng không đáng kể, chúng ta có thể bỏ số hạng đó (nghĩa là đặt φ2 = 0) và thu được các ước
tính mới của φ1 và φ3 với mô hình tập con này.
Ví dụ cuối cùng, chúng ta quay trở lại chuỗi giá dầu. ACF mẫu được hiển thị trong
Hình 6.32 trên trang 140, đề xuất một mô hình MA (1) về sự khác biệt của các bản ghi của
giá cả. Hình 7.9 đưa ra các ước lượng của θ bằng các phương pháp khác nhau và như chúng ta có
đã thấy trước đó, phương pháp ước tính khoảnh khắc khác khá nhiều so với các phương pháp khác. Các

những người khác gần bằng nhau với sai số tiêu chuẩn của họ là khoảng 0,07.

Phụ lục 7.9 Ước tính về sự khác biệt của nhật ký của chuỗi giá dầu

Phương pháp của Có điều kiện Vô điều kiện Tối đa


Khoảnh khắc SS SS Khả năng xảy ra

Tham số Ước tính Ước tính Ước tính Ước tính N

θ 0,2225 0.2731 0.2954 0.2956 241

> dữ liệu (oil.price)


> arima (log (oil.price), order = c (0,1,1), method = 'CSS')
> arima (log (oil.price), order = c (0,1,1), method = 'ML')
Machine Translated by Google

7.6 Mô hình ARIMA khởi động 167

7.6 Mô hình ARIMA khởi động

Trong Phần 7.4, chúng tôi đã tóm tắt một số kết quả phân phối chuẩn gần đúng cho
^
ước lượng trong
γ, đó γ là vectơ bao gồm tất cả các tham số ARMA. Những điều bình thường
ước lượng chính xác đối với các mẫu lớn và phần mềm thống kê thường sử dụng
những kết quả đó trong việc tính toán và báo cáo sai số tiêu chuẩn. Các lỗi tiêu chuẩn của một số
chức năng phức tạp của các tham số mô hình, ví dụ như bán thời gian của mô hình, nếu
nó tồn tại, sau đó thường thu được bằng phương pháp delta. Tuy nhiên, lý thuyết chung
chuyên nghiệp không có hướng dẫn thực tế về kích thước mẫu phải lớn như thế nào cho bình thường
ước lượng đáng tin cậy. Phương pháp Bootstrap (Efron và Tibshirani, 1993; Davison
và Hinkley, 2003) cung cấp một cách tiếp cận thay thế để đánh giá sự không chắc chắn của một
và có thể chính xác hơn đối với các mẫu nhỏ. Có một số biến thể của
phương pháp bootstrap cho dữ liệu phụ thuộc — xem Politis (2003). Chúng tôi sẽ giới hạn
* * *
sion đĩa của chúng tôi với bootstrap tham số tạo ra chuỗi thời gian bootstrap Y1, , … Yn
,
Y2
bằng cách mô phỏng từ mô hình ARIMA (p, d, q) được trang bị . (Bootstrap có thể được thực hiện bằng

cách cố định các giá trị ban đầu p + d đầu tiên của Y * vào các giá trị của dữ liệu quan sát được.

Đối với els mod tĩnh, một quy trình thay thế là mô phỏng các thực nghiệm tĩnh từ mô hình được trang bị,

có thể được thực hiện gần đúng bằng cách mô phỏng một chuỗi thời gian dài từ mô hình được trang bị

và sau đó xóa phân đoạn ban đầu tạm thời của dữ liệu được mô phỏng — cái gọi là
ghi vào.) Nếu các lỗi được giả định là phân phối bình thường, các lỗi có thể được rút ra
e 2 ngẫu nhiên và với sự thay thế từ () Nbution,
0 lỗi . Đối với trường hợp distri lỗi không xác định
σ, ^
các
có thể được rút ra một cách ngẫu nhiên và với sự thay thế từ phần dư của
^ *
γ hãy là công cụ ước tính được tính toán dựa trên
mô hình được trang bị. Đối với mỗi chuỗi bootstrap,

dữ liệu chuỗi thời gian bootstrap sử dụng phương pháp ước tính khả năng xảy ra tối đa đầy đủ
giả định sự cố định. (Có thể sử dụng các phương pháp ước lượng khác.) Bootstrap được trích
dẫn lần nữa, chẳng hạn như B lần. (Ví dụ: B = 1000.) Từ các ước tính tham số B bootstrap,
^
chúng ta có thể hình thành một phân bố thực nghiệm và sử dụng nó để hiệu chỉnh độ không đảm bảo đo trong γ . Sup

đặt ra, chúng tôi quan tâm đến việc ước lượng một số chức năng của γ, chẳng hạn như h (γ) —ví dụ,
Hệ số AR (1). Sử dụng phương pháp phân vị, khoảng tin cậy 95% khởi động cho
h (γ) có thể nhận được là khoảng từ phân vị 2,5 đến phân vị 97,5 của
phân phối bootstrap của h γ ()
^ * .

Chúng tôi minh họa phương pháp bootstrap với dữ liệu thỏ rừng. Khoảng thời gian liên
tục 95% bootstrap được báo cáo trong hàng đầu tiên của bảng trong Hình 7.10 dựa trên
bootstrap thu được bằng cách điều chỉnh ba quan sát ban đầu và giả định cũng không sai sót.
Những người trong hàng thứ hai được lấy bằng cách sử dụng cùng một phương pháp ngoại trừ
lỗi được rút ra từ phần dư. Hàng thứ ba và thứ tư báo cáo độ tin cậy
khoảng thời gian dựa trên bootstrap tĩnh với phân phối lỗi chuẩn cho phần ba
hàng và phân phối phần dư thực nghiệm cho hàng thứ tư. Hàng thứ năm trong bảng
hiển thị khoảng tin cậy lý thuyết 95% dựa trên phân phối mẫu lớn
kết quả cho người ước lượng. Đặc biệt, chuỗi thời gian bootstrap cho lần khởi động đầu tiên
phương pháp được tạo một cách đệ quy bằng cách sử dụng phương trình
^ ^ ^ ^
* *
φ 1Yt
3Yt 3– *1––––
* φθ2Yt 2– * φ (7.6.1)
Yt 0 et + =
Machine Translated by Google

168 Ước tính tham số

* *
e *2 cho t = 4,
* 5,…, 31, trong đó
et chúng được chọn độc lập với () N 0 σ, ^ , Y1 Y1 = ,
, Y3 ; và các tham số được đặt thành ước tính từ
Y2 Y2 = Y3 = ^ AR (3) ^ ^ ^
mô hình phù hợp với dữ liệu hare (căn bậc hai được biến đổi) vớiθ=0 (φ μ ^ 1) φ––– .
1 2 3 φ
Tất cả các kết quả đều dựa trên khoảng 1000 bản sao bootstrap, nhưng khả năng tối đa đầy đủ
ước tính không thành công đối với 6,3%, 6,3%, 3,8% và 4,8% trong số 1000 trường hợp cho bốn bootstrap

phương pháp I, II, III và IV tương ứng.

Hình 7.10 Bootstrap và Khoảng tin cậy lý thuyết cho AR (3)


Mô hình được trang bị cho dữ liệu Hare

Phương pháp ar1 ar2 ar3 chặn lại tiếng ồn var.

Tôi (0,593, 1,269) ( 0,655, 0,237) ( 0,666, 0,018) (5.115, 6.394) (0,551, 1,546)

II (0,612, 1,296) ( 0,702, 0,243) ( 0,669, 0,026) (5.004, 6.324) (0,510, 1,510)

III (0,699, 1,369) ( 0,746, 0,195) ( 0,666, 0,021) (5.056, 6.379) (0,499, 1,515)

IV (0,674, 1,389) ( 0,769, 0,194) ( 0,665, 0,002) (4.995, 6.312) (0,477, 1,530)

Lý thuyết (0,684, 1,42) ( 0,8058, 0,3474) ( 0,7684, 0,01776) (5,032, 6,353) (0,536, 1,597)

> Xem tệp tập lệnh R Chương 7 để biết mã mở rộng cần thiết để tạo ra các kết quả này.

Tất cả bốn phương pháp đều mang lại khoảng tin cậy bootstrap giống nhau, mặc dù phương
pháp tiếp cận bootstrap condi tional thường mang lại khoảng tin cậy hẹp hơn một chút. Đây là
dự kiến, vì chuỗi thời gian khởi động có điều kiện có nhiều điểm giống nhau hơn
bởi vì tất cả đều phải tuân theo các điều kiện ban đầu giống hệt nhau. Khoảng tin cậy bootstrap
nhìn chung rộng hơn một chút so với các đối tác lý thuyết của chúng, vốn bắt nguồn từ
kết quả mẫu lớn. Nhìn chung, chúng ta có thể rút ra suy luận rằng ước lượng hệ số φ2
là không đáng kể, trong khi cả hai ước lượng hệ số φ1 và φ3 đều có ý nghĩa ở
Mức ý nghĩa 5%.
Phương pháp bootstrap có ưu điểm là cho phép dễ dàng xây dựng các khoảng confi
dence cho một đặc tính của mô hình là một hàm phi tuyến của mô hình

thông số. Ví dụ, đa thức AR đặc trưng của mô hình AR (3) được trang bị
đối với dữ liệu thỏ thừa nhận một cặp gốc phức tạp. Thật vậy, các gốc là 0,84 ± 0,647i và
tôiHai
2,26, trong đó = .phức có thể được viết ở dạng cực: 1,06exp (±
1– gốc

0,657i). Như trong phần thảo luận về bán thời gian cho mô hình AR (2) ở trang 74,
bán kỳ của mô hình AR (3) được điều chỉnh có thể được định nghĩa là 2π / 0,657 = 9,57. Do đó, mô hình

ted phù hợp cho thấy rằng lượng thỏ rừng dồi dào trải qua sự biến động theo chu kỳ với một khoảng thời gian

trong khoảng 9,57 năm. Câu hỏi thú vị về việc xây dựng khoảng tin cậy 95%
cho thời kỳ bán nguyệt có thể được nghiên cứu bằng cách sử dụng phương pháp delta. Tuy nhiên, điều này sẽ khá

phức tạp, vì gần chu kỳ là một hàm phức tạp của các tham số. Nhưng dây đeo khởi động cung
cấp một giải pháp đơn giản: Đối với mỗi tập hợp các ước tính tham số bootstrap, chúng ta có thể
tính toán bán kỳ và do đó có được phân phối bootstrap của
bán kỳ. Sau đó, khoảng tin cậy cho khoảng thời gian gần như có thể được xây dựng bằng cách sử dụng

phương pháp phân vị và hình dạng của sự phân bố có thể được khám phá thông qua gam lịch
sử của ước tính bán thời gian khởi động. (Lưu ý rằng bán thời gian sẽ là unde
Machine Translated by Google

7.6 Mô hình ARIMA khởi động 169

bị phạt bất cứ khi nào gốc của phương trình đặc trưng AR là tất cả các số thực.)
chuỗi thời gian khởi động tĩnh 1000 lần thu được bằng cách mô phỏng từ mô hình được trang bị
với các lỗi được rút ra ngẫu nhiên từ các phần dư có thay thế, chuỗi 952 dẫn đến
ước tính khả năng xảy ra tối đa thành công. Tất cả trừ một trong số 952 series đều có

các bán thời gian được xác định rõ ràng, và biểu đồ của chúng được thể hiện trong Phụ lục 7.11. Các

biểu đồ cho thấy rằng phân phối lấy mẫu của ước tính bán kỳ là một chút
lệch sang phải. † Biểu đồ bình thường QQ (Hình 7.12) gợi ý rằng bán kỳ
hơn nữa, công cụ ước lượng có một phân phối theo đuôi dày. Do đó, phương pháp delta và

xấp xỉ phân phối chuẩn tương ứng có thể không phù hợp để lấy gần đúng phân phối lấy mẫu
của công cụ ước lượng bán kỳ. Cuối cùng, sử dụng phân vị
phương pháp, khoảng tin cậy 95% của chu kỳ gần được tìm thấy là (7.84,11.34).

Hình 7.11 Biểu đồ Ước tính Quasi-Giai đoạn Bootstrap

0,5

0,4

0,3

trọng
Tỉ

0,2

0,1

0,0

6 số 8 10 12 14

Quasi-kỳ

> win.graph (chiều rộng = 3,9, chiều cao = 3,8, kích thước điểm = 8)
> hist (period.replace, prob = T, xlab = 'Quasi-period', axis = F,
xlim = c (5,16))
> trục (2); trục (1, c (4,6,8,10,12,14,16), c (4,6,8,10,12,14, NA))

† Tuy nhiên, hãy xem phần thảo luận bên dưới Công thức (13.5.9) trên trang 338, nơi người ta lập luận rằng,

từ quan điểm của miền tần số, có một vùng tham số nhỏ tương ứng với các gốc phức và tuy
nhiên bán kỳ liên quan có thể không có ý nghĩa vật lý đầy đủ. Điều này minh họa sự tinh tế
của khái niệm bán thời kỳ.
Machine Translated by Google

170 Ước tính tham số

Hình 7.12 Biểu đồ thông thường QQ của Ước tính Quasi-period của Bootstrap


14

12 • •
• •• •

• • •
••••••••••••••
•• •• •• •• •• ••
•••••
••••••
••••••
••••••
••••••
••••••
••••••

•• •• •• •• •• •• •• ••
• • • " • • • •

••
10
••
••
••• ••
••••••••••

•• •••

••••••••
••••••
•••• ••••••••
••••••••

••
••• ••••••••• •••••••
•" •• •• •• ••

••
••••••••
••
oog
••••••••••
••••••••••••••••••
••• •••••••••••••••••••
• •••••••• •
••

ot
••
• •
•• ••••
•• •••
•• •••
•• •••
•• ••

••
••
••••
(•
••
•••
••
•••
••

••
••••••
•••
•••••
•• ••

• •(
••••
••••• ••
••
••
••••


••
•• •••


••
••

••

• •

••
••
••
•••
•• ••
••
••

••
••
•••
••

•••• •
••
•••
••
••
••
• •
••••"



••
••
••••
••
••••
• •••••••••• ••
••• •••••
•• ••••• ••
••
•• •• •••••• •••
• •••••••
••

••
••
••••••••••
•••
••

••
•••••
•••••••••••) •
••
••••••••••••••
••••••(•
•••
•••••••••-•••

•••
••
•• •• •• •
••
••
••••
•••
Lượng
mẫu
tử
•••
số
8 • •
••••••
••••••
••••
••
•••••
••••••••
••••
••••
••
•••••
••••
•••• ••
•••••
•••(•)
•••••••••••••••• ••••••••••••••••••

••
•••••••••••••••••••••••••)••••••• (•
••••••••••••••••••
•••••••• •••• •••••• ••ot •• •••• •••• •••
••• •
••••••••
•••••••"•
••••••• ••••••• ••••••• ••••••• ••••••• •


3 2 1 0 1 2 3

Lượng tử lý thuyết

> win.graph (width = 2.5, height = 2.5, pointsize =


8)> qqnorm (period.replace); qqline (period.replace)

7.7 Tóm tắt

Chương này đi sâu vào ước lượng các tham số của mô hình ARIMA. Chúng tôi đã bỏ qua các tiêu
chí ước tính dựa trên phương pháp thời điểm, các loại bình phương nhỏ nhất khác nhau và tối
đa hóa hàm khả năng. Các thuộc tính của các vòng xoắn estima khác nhau đã được đưa ra và các
công cụ ước lượng được minh họa bằng cả dữ liệu chuỗi thời gian mô phỏng và thực tế.
Bootstrapping với các mô hình ARIMA cũng đã được thảo luận và minh họa.

BÀI TẬP

7.1 Từ một chuỗi độ dài 100, chúng ta đã tính được r1 = 0,8, r2 = 0,5, r3 = 0,4, = 2 và Yphương
sai mẫu là 5. Nếu chúng ta giả sử rằng mô hình AR (2) với số hạng không đổi là phù hợp,
làm thế nào chúng ta có thể nhận được các ước lượng (đơn giản) của φ1, φ2, θ0 và?
2 σe

7.2 Giả sử rằng các dữ liệu sau đây phát sinh từ một quá trình tĩnh, hãy tính các ước lượng
theo phương pháp mô men của μ, γ0 và ρ1: 6, 5, 4, 6, 4.
7.3 Nếu {Yt } thỏa mãn mô hình AR (1) với φ khoảng 0,7, thì chúng ta cần ước lượng chuỗi dài
bao nhiêu φ = ρ1 với độ tin cậy 95% rằng sai số ước lượng của chúng ta không quá ± 0,1?

7.4 Xem xét một quy trình MA (1) mà người ta biết rằng trung bình của quy trình bằng 0.
Dựa trên một dãy số có độ dài n = 3, chúng ta quan sát thấy Y1 = 0, Y2 = 1, và Y3 =

½. (a) Chứng tỏ rằng ước lượng bình phương nhỏ nhất có điều kiện của θ là ½. (b) Tìm

ước lượng của phương sai tiếng ồn. (Gợi ý: Các phương pháp lặp lại không cần thiết

trong trường hợp đơn giản này.)


Machine Translated by Google

Bài tập 171

7.5 Với dữ liệu Y1 = 10, Y2 = 9 và Y3 = 9.5, chúng tôi muốn phù hợp với mô hình IMA (1,1)
không có kỳ hạn cố định. (a)

Tìm ước lượng bình phương nhỏ nhất có điều kiện của θ. (Gợi ý: Làm bài tập 7.4 trước.) (B) Ước

lượng 2 σe.

7.6 Xem xét hai tham số khác nhau của quy trình AR (1) với nonzero
bần tiện:

Mô hình I. Yt - μ = φ (Yt 1 - μ) + et .

Mô hình II. Yt = φYt 1 + θ0 + et .

Chúng ta muốn ước lượng φ và μ hoặc φ và θ0 bằng cách sử dụng bình phương nhỏ nhất có điều kiện với

Y1. Chứng tỏ rằng với Mô hình I, chúng ta được dẫn đến giải các phương trình phi tuyến để thu được các

ước lượng, trong khi với Mô hình II, chúng ta chỉ cần giải các phương trình tuyến tính.

7.7 Xác minh phương trình (7.1.4) trên trang 150.

7.8 Xem xét mô hình ARMA (1,1) với φ = 0,5 và θ = 0,45. (a) Với n = 48, hãy

đánh giá phương sai và mối tương quan của các ước lượng khả năng xảy ra tối đa của φ và θ bằng

cách sử dụng Công thức (7.4.13) ở trang 161. Nhận xét về kết quả.

(b) Lặp lại phần (a) nhưng bây giờ với n = 120. Nhận xét kết quả mới.

7.9 Mô phỏng chuỗi MA (1) với θ = 0,8 và n = 48. (a) Tìm ước lượng

thời điểm theo phương pháp của θ. (b) Tìm ước lượng bình

phương nhỏ nhất có điều kiện của θ và so sánh với phần (a). (c) Tìm ước lượng khả năng xảy ra

lớn nhất của θ và so sánh nó với các phần (a) và

(b).

(d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng cùng các thông số và cùng

cỡ mẫu. So sánh kết quả của bạn với kết quả của bạn từ mô phỏng đầu tiên.

7.10 Mô phỏng chuỗi MA (1) với θ = 0,6 và n = 36. (a) Tìm ước lượng

mômen của. (b) Tìm ước lượng bình phương nhỏ nhất có điều

kiện của θ và so sánh với phần (a). (c) Tìm ước lượng khả năng xảy ra lớn nhất của θ và so sánh

nó với các phần (a) và

(b).

(d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng cùng các thông số và cùng

cỡ mẫu. So sánh kết quả của bạn với kết quả của bạn từ mô phỏng đầu tiên.

7.11 Mô phỏng chuỗi MA (1) với θ = 0,6 và n = 48. (a) Tìm ước lượng

khả năng lớn nhất của θ. (b) Nếu phần mềm của bạn cho phép,

hãy lặp lại phần (a) nhiều lần với một phần mềm mới được mô phỏng

loạt sử dụng các thông số giống nhau và cùng cỡ mẫu. (c) Hình

thành phân phối lấy mẫu của các ước tính khả năng xảy ra tối đa của θ. (d) Các ước tính (gần

đúng) có sai lệch không? (e) Tính toán phương sai của phân phối lấy mẫu của bạn và so sánh

nó với

kết quả mẫu lớn trong Công thức (7.4.11) trên trang 161.

7.12 Lặp lại bài tập 7.11 sử dụng cỡ mẫu n = 120.


Machine Translated by Google

172 Ước tính tham số

7.13 Mô phỏng chuỗi AR (1) với φ = 0,8 và n = 48. (a) Tìm ước
lượng mômen theo phương pháp của φ. (b) Tìm ước lượng
bình phương nhỏ nhất có điều kiện của φ và so sánh với phần (a). (c) Tìm ước lượng khả
năng xảy ra lớn nhất của φ và so sánh nó với các phần (a) và
(b).

(d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng cùng các thông số
và cùng cỡ mẫu. So sánh kết quả của bạn với kết quả của bạn từ mô phỏng đầu tiên.

7.14 Mô phỏng chuỗi AR (1) với φ = 0,5 và n = 60. (a) Tìm ước
lượng theo phương pháp mô men của φ. (b) Tìm ước lượng
bình phương nhỏ nhất có điều kiện của φ và so sánh với phần (a). (c) Tìm ước lượng khả
năng xảy ra lớn nhất của φ và so sánh nó với các phần (a) và
(b).

(d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng cùng các thông số
và cùng cỡ mẫu. So sánh kết quả của bạn với kết quả của bạn từ mô phỏng đầu tiên.

7.15 Mô phỏng chuỗi AR (1) với φ = 0,7 và n = 100. (a) Tìm ước
lượng khả năng xảy ra lớn nhất của φ. (b) Nếu phần mềm
của bạn cho phép, hãy lặp lại phần (a) nhiều lần với một phần mềm mới được mô phỏng
loạt sử dụng các thông số giống nhau và cùng cỡ mẫu. (c)
Hình thành phân phối lấy mẫu của các ước tính khả năng xảy ra tối đa của φ. (d) Các
ước tính (gần đúng) có sai lệch không? (e) Tính toán phương sai của phân phối lấy
mẫu của bạn và so sánh nó với
kết quả mẫu lớn trong Công thức (7.4.9) trên trang 161.

7.16 Mô phỏng chuỗi AR (2) với φ1 = 0,6, φ2 = 0,3 và n = 60. (a) Tìm các
ước lượng theo phương pháp mô men của φ1 và φ2. (b) Tìm ước lượng
bình phương nhỏ nhất có điều kiện của φ1 và φ2 và so sánh chúng
với phần (a).

(c) Tìm các ước lượng khả năng xảy ra lớn nhất của φ1 và φ2 và so sánh chúng với các phần
(a) và (b). (d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng
cùng các thông số và cùng cỡ mẫu. So sánh những kết quả này với kết quả của bạn từ mô
phỏng đầu tiên.

7.17 Mô phỏng chuỗi ARMA (1,1) với φ = 0,7, θ = 0,4 và n = 72.


(a) Tìm các ước lượng theo phương pháp khoảnh khắc của φ
và θ. (b) Tìm ước lượng bình phương nhỏ nhất có điều kiện của φ và θ và so sánh chúng với
phần (a).
(c) Tìm các ước lượng khả năng xảy ra lớn nhất của φ và θ và so sánh chúng với các phần
(a) và (b). (d) Lặp lại các phần (a), (b) và (c) với một loạt mô phỏng mới sử dụng
cùng các thông số và cùng cỡ mẫu. So sánh kết quả mới của bạn với kết quả của bạn từ mô
phỏng đầu tiên.

7.18 Mô phỏng chuỗi AR (1) với φ = 0,6, n = 36 nhưng với số hạng sai số từ bution t-distri với
3 bậc tự do.
Machine Translated by Google

Bài tập 173

(a) Hiển thị PACF mẫu của chuỗi. Mô hình AR (1) có được đề xuất không? (b)
Ước lượng φ từ chuỗi và nhận xét kết quả. (c) Lặp lại các phần (a) và (b)
với một loạt mô phỏng mới trong cùng một điều kiện
hàng tấn.

7.19 Mô phỏng một chuỗi MA (1) với θ = 0,8, n = 60 nhưng với các điều kiện sai số từ một
dấu tích t-dis với 4 bậc tự do. (a) Hiển thị ACF mẫu của chuỗi. Mô hình MA (1) có
được đề xuất không? (b) Ước lượng θ từ chuỗi và nhận xét kết quả. (c) Lặp lại các
phần (a) và (b) với một loạt mô phỏng mới trong cùng một điều kiện

hàng tấn.

7.20 Mô phỏng chuỗi AR (2) với φ1 = 1,0, φ2 = 0,6, n = 48 nhưng với các điều khoản lỗi
từ phân phối t với 5 bậc tự do. (a) Hiển thị PACF
mẫu của chuỗi. Mô hình AR (2) có được đề xuất không? (b) Ước lượng φ1 và φ2
từ dãy số và nhận xét kết quả. (c) Lặp lại các phần (a) và (b) với một loạt
mô phỏng mới trong cùng một điều kiện
hàng tấn.

7.21 Mô phỏng chuỗi ARMA (1,1) với φ = 0,7, θ = 0,6, n = 48 nhưng với các điều khoản lỗi
từ phân phối t với 6 bậc tự do. (a) Hiển thị EACF
mẫu của chuỗi. Mô hình ARMA (1,1) có được đề xuất không? (b) Ước lượng φ và θ từ
chuỗi và nhận xét về kết quả. (c) Lặp lại các phần (a) và (b) với một loạt mô phỏng
mới trong cùng một điều kiện
hàng tấn.

7.22 Mô phỏng chuỗi AR (1) với φ = 0,6, n = 36 nhưng với sai số từ phân phối chi bình phương
với 6 bậc tự do. (a) Hiển thị PACF mẫu của chuỗi. Mô hình AR (1) có được đề xuất
không? (b) Ước lượng φ từ chuỗi và nhận xét kết quả. (c) Lặp lại các phần (a) và (b)
với một loạt mô phỏng mới trong cùng một điều kiện

hàng tấn.

7.23 Mô phỏng chuỗi MA (1) với θ = 0,8, n = 60 nhưng với sai số từ phân phối chi bình
phương với 7 bậc tự do. (a) Hiển thị ACF mẫu của chuỗi. Mô hình MA (1) có được đề
xuất không? (b) Ước lượng θ từ chuỗi và nhận xét kết quả. (c) Lặp lại các phần (a) và
(b) với một loạt mô phỏng mới trong cùng một điều kiện

hàng tấn.

7.24 Mô phỏng chuỗi AR (2) với φ1 = 1,0, φ2 = 0,6, n = 48 nhưng với số hạng sai số từ phân
phối chi bình phương với 8 bậc tự do. (a) Hiển thị PACF mẫu của chuỗi. Mô hình AR (2)
có được đề xuất không? (b) Ước lượng φ1 và φ2 từ dãy số và nhận xét kết quả. (c) Lặp
lại các phần (a) và (b) với một loạt mô phỏng mới trong cùng một điều kiện

hàng tấn.

7.25 Mô phỏng chuỗi ARMA (1,1) với φ = 0,7, θ = 0,6, n = 48 nhưng với số hạng sai số từ
phân phối chi bình phương với 9 bậc tự do. (a) Hiển thị EACF mẫu của chuỗi. Mô hình
ARMA (1,1) có được đề xuất không? (b) Ước lượng φ và θ từ chuỗi và nhận xét về kết
quả. (c) Lặp lại các phần (a) và (b) với một loạt mới với cùng điều kiện.
Machine Translated by Google

174 Ước tính tham số

7.26 Hãy xem xét mô hình AR (1) được chỉ định cho chuỗi thời gian thuộc tính màu được hiển
thị trong Phụ lục 1.3 trên trang 3. Dữ liệu nằm trong tệp có tên màu. (a) Tìm ước
lượng theo phương pháp khoảnh khắc của φ. (b) Tìm ước lượng khả năng xảy ra lớn nhất
của φ và so sánh với phần (a).
7.27 Hình 6.31 trên trang 139 đề xuất chỉ định mô hình AR (1) hoặc có thể là mô hình AR (4)
cho sự khác biệt của logarit của chuỗi giá dầu. Dữ liệu nằm trong tệp có tên oil.price.
(a) Ước tính cả hai mô hình này bằng cách sử dụng khả năng xảy ra tối đa và so sánh
nó với kết quả sử dụng các tiêu chí AIC. (b) Hình 6.32 trên trang 140 đề xuất chỉ định
mô hình MA (1) cho sự khác nhau của các bản ghi. Ước tính mô hình này theo khả
năng xảy ra tối đa và so sánh với kết quả của bạn trong phần (a).

7.28 Tệp dữ liệu có tên deere3 chứa 57 giá trị liên tiếp từ một máy công cụ phức tạp của
Deere & Co. Các giá trị được đưa ra là độ lệch so với giá trị mục tiêu tính bằng đơn
vị mười phần triệu inch. Quá trình sử dụng một cơ chế điều khiển để đặt lại một số
thông số của máy công cụ tùy thuộc vào độ phóng đại của độ lệch so với mục tiêu của
mặt hàng cuối cùng được sản xuất. (a) Ước tính các thông số của mô hình AR (1) cho
loạt bài này. (b) Ước tính các tham số của mô hình AR (2) cho chuỗi này và so sánh

kết quả với những kết quả trong phần (a).

7.29 Tệp dữ liệu có tên rô bốt chứa chuỗi thời gian thu được từ rô bốt công nghiệp.

Robot được thực hiện một chuỗi các thao tác và khoảng cách từ điểm kết thúc mong muốn
được ghi lại bằng inch. Điều này được lặp lại 324 lần để tạo thành chuỗi thời gian.
(a) Ước tính các tham số của mô hình AR (1) cho những dữ liệu này. (b) Ước tính các

tham số của mô hình IMA (1,1) cho những dữ liệu này. (c) So sánh kết quả từ phần (a)
và (b) về AIC.

7.30 Tệp dữ liệu có tên ngày chứa dữ liệu kế toán từ Công ty Winegard của Bur lington, Iowa.
Dữ liệu là số ngày cho đến khi Winegard nhận được thanh toán cho 130 đơn đặt hàng liên
tiếp từ một nhà phân phối sản phẩm Winegard cụ thể.
(Tên của nhà phân phối phải được giấu tên vì lý do bảo mật.)
Chuỗi thời gian chứa đựng những ngoại lệ khá rõ ràng trong cốt truyện của chuỗi
thời gian. (a) Thay thế từng giá trị bất thường bằng giá trị 35 ngày, giá trị ical
điển hình hơn nhiều, rồi ước tính các tham số của mô hình MA (2). (b) Bây giờ giả
sử một mô hình MA (5) và ước lượng các tham số. So sánh những kết quả này với những
kết quả thu được trong phần (a).
7.31 Mô phỏng chuỗi thời gian có độ dài n = 48 từ mô hình AR (1) với φ = 0,7. Sử dụng chuỗi
đó như thể nó là dữ liệu thực. Bây giờ, hãy so sánh sự phân bố tiệm cận lý thuyết của
công cụ ước lượng của φ với phân phối của công cụ ước lượng bootstrap của φ.
7.32 Chuỗi thời gian thuộc tính màu công nghiệp được mô hình AR (1) phù hợp khá tốt.
Tuy nhiên, chuỗi này khá ngắn, với n = 35. Hãy so sánh phân phối tiệm cận lý thuyết
của công cụ ước lượng φ với phân phối của ma trận bootstrap esti của φ. Dữ liệu nằm
trong tệp có tên màu.
Machine Translated by Google

CHƯƠNG 8

CHẨN ĐOÁN MÔ HÌNH

Bây giờ chúng ta đã thảo luận về các phương pháp xác định mô hình và ước tính hiệu quả
các thông số trong các mô hình đó. Chẩn đoán mô hình hoặc phê bình mô hình liên quan đến
kiểm tra độ phù hợp của một mô hình và, nếu độ phù hợp kém, hãy đề xuất các sửa đổi
phù hợp. Chúng tôi sẽ trình bày hai cách tiếp cận bổ sung: phân tích phần dư từ
mô hình được trang bị và phân tích các mô hình được trang bị quá mức; nghĩa là, các mô hình hơn
chung hơn mô hình được đề xuất nhưng có chứa mô hình được đề xuất như một trường hợp đặc biệt.

8.1 Phân tích dư

Chúng tôi đã sử dụng các ý tưởng cơ bản của phân tích phần dư trong Phần 3.6 trên trang 42 khi chúng tôi

đã kiểm tra tính đầy đủ của các mô hình xu hướng xác định được trang bị. Với các mô hình tự phục hồi,

phần còn lại được xác định tương tự trực tiếp với công việc trước đó. Đặc biệt xem xét một
Mô hình AR (2) với số hạng không đổi:

= 1– φ2Yt +2– ++
Yt φ1Yt θ0 et (8.1.1)

Với ước tính φ1, φ2 và θ0, phần dư được xác định là


^ = ^ ^ ^
e t Yt φ –– 1Yt
θ 1– φ2Yt 2– - 0 (8.1.2)

Đối với các mô hình ARMA chung có chứa các thuật ngữ trung bình động, chúng tôi sử dụng đảo ngược,

dạng tự động hồi quy vô hạn của mô hình để xác định phần dư. Để đơn giản, chúng tôi giả định
rằng θ0 bằng không. Từ dạng đảo ngược của mô hình, Công thức (4.5.5) ở trang 80, chúng tôi

= 1– π2Yt +2– π3Yt 3–


Yt π1Yt + ++ … Et

để phần dư được xác định là

^
e t = Yt^ π2Yt
^ 1Yt
-
1– π ^ 3Yt 3–
2– ––
-…
(8.1.3)

Ở đây, số π không được ước lượng trực tiếp mà là hàm ẩn dưới dạng hàm của φ và
của θ. Trên thực tế, phần dư không được tính bằng phương trình này mà là sản phẩm phụ của
ước lượng của φ và θ. Trong Chương 9, chúng ta sẽ tranh luận rằng
^
Y t = +++ t 3– …
π ^ 1Yt 1– π ^ 2Yt 2– π ^ 3Y

175
Machine Translated by Google

176 Chẩn đoán mô hình

là dự báo tốt nhất của Yt dựa trên Yt - 1, Yt - 2, Yt - 3,…. Do đó, Công thức (8.1.3) có thể là
được viết lại thành

còn lại = thực tế - dự đoán

tương tự trực tiếp với các mô hình hồi quy. So sánh điều này với Phần 3.6 trên trang 42.

Nếu mô hình được chỉ định chính xác và các ước tính tham số gần hợp lý

đến các giá trị true, thì phần dư phải có các đặc tính gần như của nhiễu trắng.

Chúng phải hoạt động gần giống như các biến bình thường độc lập, được phân phối giống hệt nhau

với phương tiện bằng 0 và độ lệch chuẩn phổ biến. Sai lệch từ các thuộc tính này có thể

giúp chúng tôi khám phá một mô hình thích hợp hơn.

Các lô của phần còn lại

Kiểm tra chẩn đoán đầu tiên của chúng tôi là kiểm tra một lô của các phần còn lại theo thời gian. Nếu mô hình là

đầy đủ, chúng tôi hy vọng âm mưu đề xuất một hình chữ nhật phân tán xung quanh một chiều ngang bằng 0
không có bất kỳ xu hướng nào.

Biểu đồ 8.1 cho thấy một biểu đồ như vậy cho các phần dư chuẩn hóa từ mô hình AR (1)

được trang bị cho loạt thuộc tính màu công nghiệp. Tiêu chuẩn hóa cho phép chúng tôi xem phần còn lại của

kích thước bất thường dễ dàng hơn nhiều. Các thông số được ước tính bằng cách sử dụng mui xe likeli tối

đa. Biểu đồ này hỗ trợ mô hình, vì không có xu hướng nào.

Hình 8.1 Phần dư được tiêu chuẩn hóa từ Mô hình màu AR (1)

2

1 • • • •

• • • • • •
0 • •••

• • • • • •

• • •


1

chuẩn
tiêu
được
Phần
hóa

•• •
• •
2

0 5 10 15 20 25 30 35

Thời gian

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> dữ liệu (màu)
> m1.color = arima (color, order = c (1,0,0)); m1.color
> plot (rstandard (m1.color), ylab = 'Phần dư chuẩn hóa', type = 'o'); abline (h = 0)

Ví dụ thứ hai, chúng tôi xem xét chuỗi số lượng phong phú của thỏ Canada. Chúng tôi lập mô hình

AR (3) tập con với φ2 được đặt thành 0, như được đề xuất trong cuộc thảo luận sau

Hình 7.8 trên trang 166. Mô hình ước tính là


Machine Translated by Google

8.1 Phân tích dư 177

Yt 3,483
+ = 0,919 Yt 1– - 0,5313 Yt 3– + et (8.1.4)

và biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ mô hình này được thể hiện trong
Hình 8.2. Ở đây, chúng tôi thấy sự thay đổi có thể giảm ở giữa chuỗi và
sự thay đổi tăng lên ở gần cuối của bộ truyện — không hẳn là một phần dư âm lý tưởng. †

Hình 8.2 Phần dư được tiêu chuẩn hóa từ Mô hình AR (3) cho Sqrt (Hare)

1
• • • • •
• •• •
••
0
• •
• • • • •
• • • •
• •
• • • •

1
2
chuẩn
tiêu
được
Phần
hóa

• •
1905 1910 1915 1920 1925 Năm 1930 1935

Thời gian

> dữ liệu (thỏ rừng)

> m1.hare = arima (sqrt (hare), order = c (3,0,0)); m1.hare


> m2.hare = arima (sqrt (hare), order = c (3,0,0), fixed = c (NA, 0, NA, NA))> m2.hare

> # Lưu ý rằng thuật ngữ đánh chặn được đưa ra trong R thực sự là giá trị trung bình ở dạng tập trung
của mô hình ARMA; nghĩa là, nếu y (t) = sqrt (hare) -intercept, thì mô hình là y (t) = 0.919 *

y (t-1) -0.5313 * y (t-3) + e (t)

> # Vì vậy, số chặn 'đúng' bằng 5.6889 * (1-0.919 + 0.5313) = 3.483


> plot (rstandard (m2.hare), ylab = 'Phần dư chuẩn hóa', type = 'o')
> abline (h = 0)

Hình 8.3 hiển thị biểu đồ chuỗi thời gian của các phần dư được tiêu chuẩn hóa từ
Mô hình IMA (1,1) ước tính cho logarit của chuỗi thời gian giá dầu. Mô hình là
phù hợp bằng cách sử dụng ước tính khả năng xảy ra tối đa. Có ít nhất hai hoặc ba phần dư
đầu sê-ri có cường độ lớn hơn 3 — rất bất thường trong mức bình thường tiêu chuẩn
‡ Tốt nhất, chúng ta nên quay trở lại những tháng đó và cố gắng tìm hiểu những gì bên ngoài
các yếu tố có thể đã ảnh hưởng đến sự sụt giảm lớn bất thường hoặc sự gia tăng lớn bất thường trong

giá dầu.

† Các phần dư tiêu chuẩn âm có vẻ lớn không phải là ngoại lệ theo Bon
tiêu chí ngoại lệ ferroni với giá trị tới hạn ± 3,15.

‡ Các giá trị tới hạn của Bonferroni với n = 241 và α = 0,05 là ± 3,71, vì vậy các giá trị ngoại lệ là

có vẻ là thật. Chúng tôi sẽ mô hình hóa chúng trong Chương 11.


Machine Translated by Google

178 Chẩn đoán mô hình

Hình 8.3 Lượng dư được tiêu chuẩn hóa từ Mô hình IMA (1,1) Giá dầu gỗ

4
2

chuẩn
tiêu
được
Phần
hóa

04
2

1990 1995 2000 2005

Thời gian

> dữ liệu (oil.price)


> m1.oil = arima (log (oil.price), order = c (0,1,1))
> plot (rstandard (m1.oil), ylab = 'Phần dư chuẩn hóa', type = 'l')
> abline (h = 0)

Mức độ thường xuyên của phần còn lại

Như chúng ta đã thấy trong Chương 3, đồ thị lượng tử-lượng tử là một công cụ hiệu quả để đánh giá cũng như

tính chất. Ở đây chúng tôi áp dụng chúng cho phần dư.

Một biểu đồ lượng tử-lượng tử của phần còn lại từ mô hình AR (1) được ước tính cho

Chuỗi thuộc tính màu công nghiệp được thể hiện trong Phụ lục 8.4. Các điểm dường như tuân theo

đường thẳng khá chặt chẽ — đặc biệt là các giá trị cực trị. Biểu đồ này sẽ không dẫn chúng ta

để bác bỏ tính bình thường của các điều khoản lỗi trong mô hình này. Ngoài ra, kiểm tra Shapiro-Wilk

cũng như kiểm tra tính xác thực được áp dụng cho các phần còn lại tạo ra thống kê kiểm tra W = 0.9754,

tương ứng với giây với giá trị p là 0.6057 và chúng tôi sẽ không bác bỏ tính chuẩn dựa trên kiểm tra này.
Machine Translated by Google

8.1 Phân tích dư 179

Hình 8.4 Lô đất định lượng-định lượng: Phần còn lại từ Mô hình màu AR (1)
10


5
• • •
••
• •
• • •


•••
•••
• • •
• • • • •
Lượng
mẫu
tử


• •• •

• •
0 10
5

2 1 0 1 2

Lượng tử lý thuyết

> win.graph (width = 2.5, height = 2.5, pointsize = 8)> qqnorm


(dư (m1.color)); qqline (phần dư (m1.color))

Biểu đồ lượng tử-lượng tử cho phần dư từ mô hình AR (3) cho căn bậc hai của chuỗi
thời gian dồi dào thỏ được hiển thị trong Hình 8.5. Đây là val ues cực kỳ đáng ngờ.
Tuy nhiên, mẫu nhỏ (n = 31) và, như đã nêu trước đó, tiêu chí Bon ferroni cho các giá
trị ngoại lai không chỉ ra nguyên nhân gây ra cảnh báo.

Hình 8.5 Lô định lượng-Định lượng: Phần còn lại từ AR (3) cho Hare
1

• •
• •
0 • •• •
••
• •••••••

• •••

••
•• •
Lượng
mẫu
tử
1
2
• •



2 1 0 1 2

Lượng tử lý thuyết

> qqnorm (phần dư (m1.hare)); qqline (phần dư (m1.hare))

Hình 8.6 đưa ra biểu đồ lượng tử-lượng tử cho phần dư từ mô hình IMA (1,1) đã
được sử dụng để mô hình hóa logarit của chuỗi giá dầu. Ở đây những điểm khác thường
khá nổi bật, và chúng ta sẽ giải quyết chúng trong Chương 11.
Machine Translated by Google

180 Chẩn đoán mô hình

Hình 8.6 Lô định lượng-định lượng: Phần còn lại từ Mô hình IMA (1,1) cho
Dầu



0,2



••
••

••

••

•• •
•••••••••
••

• •
• •• ••
••
••
••••
•••••
• ••

••


••
•• ••
• ••

••

••••
•••••
••
•• ••
••••



•• • •
•• ••



•• •


•• • ••
••••
• •• •••••
•••
•••••
Lượng
mẫu
tử

•••
0,2
0,4
0,0


3 2 1 0 1 2 3

Lượng tử lý thuyết

> qqnorm (phần dư (m1.oil)); qqline (phần dư (m1.oil))

Tự tương quan của các phần dư

Để kiểm tra tính độc lập của các thuật ngữ nhiễu trong mô hình, chúng tôi xem xét mẫu
^ k
.
hàm tự tương quan của các phần dư, được ký hiệu từ Công thức r (6.1.3) trở đi
trang 110, chúng ta biết rằng đối với nhiễu trắng thực và n lớn, tự tương quan mẫu là
xấp xỉ không tương quan và được phân phối chuẩn với giá trị trung bình bằng 0 và phương sai 1 / n.

Thật không may, ngay cả các phần dư từ một mô hình được chỉ định chính xác với các tham số được

phối trộn được ước tính hiệu quả cũng có các thuộc tính hơi khác nhau. Điều này lần đầu tiên được

khám phá đối với các mô hình hồi quy đa cấp trong một loạt bài báo của Durbin và Watson (1950, 1951, 1971)

và cho các mô hình tự động hồi phục ở Durbin (1970). Tài liệu tham khảo chính về việc phân phối
tự tương quan dư trong các mô hình ARIMA là Box và Pierce (1970), kết quả của
đã được khái quát trong McLeod (1978).
Nói chung, phần dư được phân phối gần như bình thường với không
có nghĩa; tuy nhiên, đối với độ trễ nhỏ k và j, phương sai
r ^ k của về cơ bản có thể nhỏ hơn
r và có rthể
^ k 1 / n và các ước lượng ^ j tương quan cao. Đối với độ trễ lớn hơn, phương sai giao
nữa và gần như không tương quan. phối r ^r ^kj xấp xỉ 1 / n sẽ áp dụng, và xa hơn
Để làm ví dụ về những kết quả này, hãy xem xét một phương thức được chỉ định chính xác và hiệu quả

mô hình AR (1) được giao phối. Có thể chỉ ra rằng, đối với n lớn,

φ2
Var r()^ 1 ≈ -----
(8.1.5)
N

1 - 1 φ2 ( 2k 2– ) φ - ≈
Var r ^ k () -------------------------------------------------- ---- cho k > 1 (8.1.6)
N

1 φ2) φ( -kdấu
2–
Corr rr ^^ k, () 1 ≈ - ( ) φ ------------------------------------------- - cho k > 1 (8.1.7)
2k 2–
1 -
1 φ2
) (
φ -
Machine Translated by Google

8.1 Phân tích dư 181

ở đâu

1 nếu φ> 0
=
dấu ( ) φ 0 nếu φ 0 =

–1 nếu φ <0

Bảng trong Hình 8.7 minh họa các công thức này cho nhiều giá trị khác nhau của φ và k.
Chú ý rằng Var
() 1r ^⁄≈1 n là một giá trị gần đúng hợp lý cho k ≥ 2 trong một phạm vi rộng
φ-giá trị.

Hình 8.7 Các phép gần đúng đối với tự tương quan dư trong AR (1)
Mô hình

0,3 0,5 0,7 0,9 0,3 0,5 0,7 0,9


φ φ
k Độ lệch chuẩn của thời gian
r ^ k
Tương quan với
r ^ 1 r ^ k

N
1 0,30 0,50 0,70 0,90 1,00 1,00 1,00 1,00

2 0,96 0,90 0,87 0,92 0,95 0,83 0,59 0,21

3 1,00 0,98 0,94 0,94 0,27 0,38 0,38 0,18

4 1,00 0,99 0,97 0,95 0,08 0,19 0,26 0,16

5 1,00 1,00 0,99 0,96 0.02 0,09 0,18 0,14

6 1,00 1,00 0,99 0,97 0.01 0,05 0,12 0,13

7 1,00 1,00 1,00 0,97 0,00 0.02 0,09 0,12

số 8 1,00 1,00 1,00 0,98 0,00 0.01 0,06 0,10

9 1,00 1,00 1,00 0,99 0,00 0,00 0,03 0,08

Nếu chúng ta áp dụng những kết quả này cho mô hình AR (1) được ước tính cho ngành công nghiệp
^
chuỗi thời gian thuộc tính màu với =φ0,57 và n = 35, chúng tôi thu được kết quả hiển thị trong
Hình 8.8.

Hình 8.8 Độ lệch chuẩn gần đúng của giá trị ACF dư

Trễ k 1 2 3 4 5> 5
^ 0,096 0,149 0,163 0,167 0,168 0,169
Var ^ r )
( k

Biểu đồ của ACF mẫu của những phần dư này được thể hiện trong Hình 8.9. Dấu gạch ngang
các đường ngang được vẽ dựa trên sai số tiêu chuẩn độ trễ lớn là ± 2 ⁄ n . Không có
bằng chứng về tự tương quan trong phần dư của mô hình này.
Machine Translated by Google

182 Chẩn đoán mô hình

Hình 8.9 ACF mẫu của phần còn lại từ AR (1) Mô hình cho màu

0,3

0,1

ACF

0,1
0,3

2 4 6 số 8 10 12 14

Lỗi

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (phần dư (m1.color))

Đối với mô hình AR (2), có thể chỉ ra rằng

2
φ2
≈ -----
Var r ^ () 1 (8.1.8)
N

2 + ) +( 2
φ2 φ12 1 φ2
Var r()^ 2 ≈ -----------------------------------------
(8.1.9)
N

Nếu các thông số AR (2) không quá gần với ranh giới cố định được hiển thị trong Biểu đồ
4.17 trên trang 72, sau đó

1
Var r ^ k () - với k ≥≈ 3 (8.1.10)
N

Nếu chúng ta phù hợp với mô hình AR (2) † bằng khả năng tối đa là căn bậc hai của thỏ
^ ^ ˆ

dãy số dư, chúng ta thấy rằng = φ1,351


1
và = 0,776.
φ 2 Vì vậy, chúng tôi có

–0,776
Var ^ r ^ () 1 ≈ ------------------- = 0,131
35

^ - 2
( ) –0,776 2 + 0,776
) 1,351
+ ())
2 ()
((1≈
Var ^------------------------------------
r
2 ---- = 0,141 --------------------------------------------------
35

Var ^ r ^ k () 1 35 ⁄≈ = 0,169 cho k ≥ 3

† Mô hình AR (2) không hoàn toàn tốt bằng mô hình AR (3) mà chúng tôi đã ước tính trước đó, nhưng nó
vẫn khá phù hợp và là một ví dụ hợp lý ở đây.
Machine Translated by Google

8.1 Phân tích dư 183

Hình 8.10 hiển thị ACF mẫu của các phần dư từ mô hình AR (2) của
căn bậc hai của sự phong phú của thỏ rừng. Độ trễ 1 tự tương quan ở đây bằng 0,261,
là gần 2 sai số tiêu chuẩn dưới 0 nhưng không khá. Độ trễ 4 tự tương quan bằng
0,318, nhưng sai số tiêu chuẩn của nó là 0,169. Chúng tôi kết luận rằng biểu đồ không hiển thị

bằng chứng có ý nghĩa thống kê về tự tương quan khác không trong các phần dư. †

Hình 8.10 Mẫu ACF của Phần dư từ Mô hình AR (2) cho Hare

0,3

0,1

ACF

0,1
0,3

2 4 6 số 8 10 12 14

Lỗi

> acf (phần dư (arima (sqrt (hare), order = c (2,0,0))))

Với dữ liệu hàng tháng, chúng tôi sẽ đặc biệt chú ý đến khả năng hấp thụ autocorre
quá mức trong phần còn lại ở độ trễ 12, 24, v.v. Với sê-ri hàng quý, trễ 4, 8, v.v.
thứ tư sẽ đáng chú ý đặc biệt. Chương 10 bao gồm các ví dụ về những ý tưởng này.
Có thể cho thấy rằng kết quả tương tự như kết quả đối với mô hình AR đối với mô hình MA.
Đặc biệt, việc thay thế φ bằng θ trong các phương trình (8.1.5), (8.1.6) và (8.1.7) sẽ cho kết quả

đối với trường hợp MA (1). Tương tự, kết quả cho trường hợp MA (2) có thể được phát biểu bằng cách thay thế φ1

và φ2 tương ứng với θ1 và θ2, trong các Công thức (8.1.8), (8.1.9) và (8.1.10). Kết quả cho
các mô hình ARMA chung có thể được tìm thấy trong Box and Pierce (1970) và McLeod (1978).

Thử nghiệm hộp Ljung

Ngoài việc xem xét các mối tương quan còn lại ở các độ trễ riêng lẻ, việc kiểm tra sẽ rất hữu ích
có tính đến độ lớn của chúng như một nhóm. Ví dụ, nó có thể là hầu hết
các tự tương quan còn lại là vừa phải, một số thậm chí gần với giá trị tới hạn của chúng, nhưng,

chụp cùng nhau, chúng có vẻ quá mức. Box và Pierce (1970) đề xuất thống kê

2 ^ ^
Q nr ^
= ( r
) +++ 2 … r (8.1.11)
1 2 2 K

để giải quyết khả năng này. Họ chỉ ra rằng nếu mô hình ARMA (p, q) đúng được giao
phối, thì đối với n lớn, Q có phân phối chi bình phương gần đúng với K - p - q

† Hãy nhớ lại rằng mô hình AR (3) phù hợp với những dữ liệu này thậm chí còn tốt hơn và có ít tự tương quan hơn trong

phần dư của nó, xem Bài tập 8.7.


Machine Translated by Google

184 Chẩn đoán mô hình

bậc tự do. Việc phù hợp với một mô hình sai lầm sẽ có xu hướng làm tăng giá trị Q. Do đó, một
Kiểm định "portmanteau" sẽ bác bỏ mô hình ARMA (p, q) nếu giá trị quan sát của Q
vượt quá một giá trị tới hạn thích hợp trong phân phối chi bình phương với K - p - q độ
tự do. (Ở đây độ trễ tối đa K được chọn hơi tùy ý nhưng đủ lớn
rằng trọng lượng ψ là không đáng kể đối với j > K.)

Phân phối chi bình phương cho Q dựa trên một định lý giới hạn như n ∞ , nhưng Ljung

và Box (1978) sau đó đã phát hiện ra rằng ngay cả với n = 100, giá trị gần đúng không
đạt yêu cầu. Bằng cách sửa đổi một chút thống kê Q , họ đã xác định một thống kê thử nghiệm có giá trị rỗng

phân phối gần với chi-square hơn nhiều đối với các cỡ mẫu điển hình. Các sửa đổi
Box-Pierce, hoặc Ljung-Box, thống kê được đưa ra bởi
^2 ^2 ^2
r1 r2 rK
= -----------
+ ++ ------------ n
-----------…
(8.1.12)
Q * n n () 2+
n 1– 2– n K–

Chú ý rằng vì (n + 2) / (n - k)> 1 với mọi k ≥ 1, chúng ta có Q * > Q, điều này một phần
giải thích tại sao thống kê ban đầu Q có xu hướng bỏ qua các mô hình không phù hợp. Thêm chi tiết
về các phân phối chính xác của Q * và Q cho các mẫu hữu hạn có thể được tìm thấy trong Ljung và Box

(1978), xem thêm Davies, Triggs, và Newbold (1977).


Phụ lục 8.11 liệt kê sáu điểm tự tương quan đầu tiên của các phần dư từ AR (1) được trang bị

mô hình cho chuỗi thuộc tính màu. Ở đây n = 35.

Hình 8.11 Giá trị tự tương quan dư từ Mô hình AR (1) cho Màu

Trễ k 123456
ACF dư 0.051 0,032 0,047 0,021 0.017 0.019

> acf (phần dư (m1.color), plot = F) $ acf


> signif (acf (phần dư (m1.color), plot = F) $ acf [1: 6], 2)
> # hiển thị 6 giá trị acf đầu tiên thành 2 chữ số có nghĩa

Thống kê kiểm định Ljung-Box với K = 6 bằng

= ) –0.051 2
----------------------- () 0,032 2
+ -------------------- () 0,047 2
( Q * 35 35 2+ () +
35 1– 35 2– -------------------- 35 3 -

() 0,021 2 + -----------------------
+ -------------------- () –0.017 2 + ) –0.019 2
(-----------------------
≈ 0,28
35 4– 35 5– 35 6–

Điều này được gọi là phân phối chi bình phương với 6 - 1 = 5 bậc tự do. Điều này dẫn
đến giá trị p là 0,998, vì vậy chúng tôi không có bằng chứng nào để bác bỏ giả thuyết vô hiệu rằng lỗi
các điều khoản không liên quan.

Hình 8.12 cho thấy ba công cụ chẩn đoán của chúng tôi trong một màn hình — một biểu đồ trình tự của

phần dư chuẩn hóa, ACF mẫu của phần dư và giá trị p cho
Thống kê kiểm định Ljung-Box cho toàn bộ phạm vi giá trị của K từ 5 đến 15. Chiều ngang
đường đứt nét ở mức 5% giúp đánh giá kích thước của các giá trị p. Trong trường hợp này, mọi thứ trông

rất tốt. Mô hình AR (1) ước tính dường như đang nắm bắt cấu trúc phụ thuộc
của chuỗi thời gian thuộc tính màu khá tốt.
Machine Translated by Google

8.2 Trang bị thừa và Dự phòng tham số 185

Hình 8.12 Hiển thị chẩn đoán cho Mô hình AR (1) của Thuộc tính Màu

2
• •• •
• • • • ••• • • •
•• • • • • • •

• •
• • • •
•• • •
0 2

chuẩn
tiêu
được
Phần
hóa
dư • •
0 5 10 15 20 25 30 35

0,3
0,1
phần
lại
còn
của
ACF

2 4 6 số 8 10 12 14

• • •
• • • •
• • • •
trị
Giá
P

0,6
0,0

2 4 6 số 8 10 12 14

> win.graph (chiều rộng = 4,875, chiều cao = 4,5)


> tsdiag (m1.color, gof = 15, omit.initial = F)

Như trong Chương 3, thử nghiệm chạy cũng có thể được sử dụng để đánh giá sự phụ thuộc vào các điều khoản lỗi

qua phần dư. Áp dụng thử nghiệm đối với phần dư từ mô hình AR (3) cho chuỗi số lượng dồi dào của

thỏ Cana dian, chúng tôi thu được số lần chạy dự kiến là 16,09677 so với số lần chạy được quan sát

của 18. Giá trị p tương ứng là 0,602, vì vậy chúng tôi không có ý nghĩa thống kê

bằng chứng chống lại sự độc lập của các điều khoản lỗi trong mô hình này.

8.2 Trang bị thừa và Dự phòng tham số

Công cụ chẩn đoán cơ bản thứ hai của chúng tôi là trang bị quá mức. Sau khi xác định và lắp những gì

chúng tôi tin rằng đó là một mô hình phù hợp, chúng tôi phù hợp với một mô hình tổng quát hơn một chút; đó là một

mô hình "gần" có chứa mô hình ban đầu như một trường hợp đặc biệt. Ví dụ, nếu một

Mô hình AR (2) có vẻ phù hợp, chúng tôi có thể trang bị quá mức với mô hình AR (3). Bản gốc

Mô hình AR (2) sẽ được xác nhận nếu:

1. ước lượng của tham số bổ sung, φ3, không khác biệt đáng kể với
không, và

2. ước lượng cho các tham số chung, φ1 và φ2, không thay đổi đáng kể so với ước tính ban đầu của

chúng.
Machine Translated by Google

186 Chẩn đoán mô hình

Ví dụ, chúng tôi đã chỉ định, trang bị và kiểm tra phần còn lại của AR (1)

mô hình cho chuỗi thời gian thuộc tính màu công nghiệp. Phụ lục 8.13 hiển thị kết quả đầu ra từ

phần mềm R phù hợp với mô hình AR (1) và Phụ lục 8.14 cho thấy kết quả từ

lắp mô hình AR (2) với cùng một loạt. Trước tiên, hãy lưu ý rằng, trong Phụ lục 8.14, ước tính của

φ2 không khác 0 về mặt thống kê. Thực tế này hỗ trợ sự lựa chọn của AR (1)

người mẫu. Thứ hai, chúng tôi lưu ý rằng hai ước tính của φ1 khá gần nhau — đặc biệt là khi
chúng tôi tính đến mức độ sai số tiêu chuẩn của chúng. Cuối cùng, lưu ý rằng trong khi

Mô hình AR (2) có giá trị khả năng ghi nhật ký lớn hơn một chút, phù hợp AR (1) có AIC nhỏ hơn

giá trị. Hình phạt cho việc điều chỉnh mô hình AR (2) phức tạp hơn là đủ để chọn

mô hình AR (1) đơn giản hơn.

Phụ lục 8.13 AR (1) Kết quả Mô hình cho Dòng Thuộc tính Màu

Hệ số: † ar1 Đánh chặn ‡

0,5705 74.3293

se 0,1435 1.9151

sigma ^ 2 được ước tính là 24,83: log-likel Khả năng = -106,07, AIC = 216,15

† m1.color # R mã để lấy bảng

‡ Nhớ lại rằng điểm đánh chặn ở đây là ước lượng của trung bình quá trình μ — không phải θ0.

Phụ lục 8.14 AR (2) Kết quả mô hình cho chuỗi thuộc tính màu

Hệ số: ar1 ar2 Đánh chặn

0,5173 0,1005 74.1551

se 0,1717 0,1815 2.1463

sigma ^ 2 được ước tính là 24,6: log-khả năng = -105,92, AIC = 217,84

> arima (color, order = c (2,0,0))

Một trang bị khác cho loạt bài này là thử mô hình ARMA (1,1). Triển lãm

8.15 hiển thị kết quả của sự phù hợp này. Lưu ý rằng sai số tiêu chuẩn của hệ số coef ước tính

cho sự phù hợp này lớn hơn những gì chúng ta thấy trong Hình 8.13 và 8.14. Ít hơn, ước tính của

φ1 từ sự phù hợp này không khác biệt đáng kể so với ước tính trong
Hình 8.13. Hơn nữa, như trước đây, ước lượng của tham số mới, θ, không khác 0 một cách đáng kể.

Điều này bổ sung hỗ trợ thêm cho mô hình AR (1).


Machine Translated by Google

8.2 Trang bị thừa và Dự phòng tham số 187

Hình 8.15 Trang bị quá mức của Mô hình ARMA (1,1) cho Dòng màu
Hệ số: ar1 ma1 Đánh chặn

0,6721 0,1467 74.1730


se 0,2147 0,2742 2.1357

sigma ^ 2 được ước tính là 24,63: log-likel Khả năng = -105,94, AIC = 219,88

> arima (color, order = c (1,0,1))

Như chúng tôi đã lưu ý, bất kỳ mô hình ARMA (p, q) nào đều có thể được coi là trường hợp đặc biệt của

mô hình ARMA tổng quát hơn với các tham số bổ sung bằng 0. Tuy nhiên,
khi tổng quát hóa các mô hình ARMA, chúng ta phải nhận thức được vấn đề về tham số
dư thừa hoặc thiếu khả năng nhận dạng.
Để làm rõ những điểm này, hãy xem xét mô hình ARMA (1,2):

Yt φYt
+ = 1– -
- et θ1et 1–
θ2et 2– (8.2.1)

Bây giờ thay t bằng t - 1 để có được

+ =2–- et 1– θ1et 2–-


Yt 1– φYt (8.2.2)
θ2et 3–

Nếu chúng ta nhân cả hai vế của Phương trình (8.2.2) với bất kỳ hằng số c nào rồi trừ đi
Phương trình (8.2.1), chúng ta thu được (sau khi sắp xếp lại)

Yt -() φ + c Yt 1– + = et -θ1 () + c et 1– - ( θ2 θ1 ) - c và 2–+ cθ2et 3–


φcYt 2–

Điều này rõ ràng xác định một quy trình ARMA (2,3). Nhưng hãy lưu ý rằng chúng ta có các
yếu tố

1 - (1
) =
φ ()
+ cx
- φx
φcx2
(1 +- cx )


- -
- (() + cx θ2 cθ1 ) - = ()x2(1cθ2x3
- cx + 1 θ1 - x θ2x2 1 θ1 )

Do đó, các đa thức đặc trưng AR và MA trong quy trình ARMA (2,3) có
nhân tử chung của (1 - cx). Mặc dù Yt không đáp ứng mô hình ARMA (2,3), rõ ràng
các tham số trong mô hình đó không phải là duy nhất — hằng số c là hoàn toàn tùy ý. chúng tôi
nói rằng chúng ta có dư thừa tham số trong mô hình ARMA (2,3). †
Ý nghĩa đối với các mô hình phù hợp và trang bị quá mức như sau:

1. Chỉ định mô hình ban đầu một cách cẩn thận. Nếu một mô hình đơn giản có vẻ đầy hứa hẹn,
kiểm tra nó trước khi thử một mô hình phức tạp hơn.

2. Khi trang bị quá mức, không tăng đơn đặt hàng của cả phần AR và MA của
mô hình đồng thời.

† Trong ký hiệu dịch chuyển ngược,


= θ () B e là một mô hình chính xác, sau đó cũng vậy 1
=
nếu φ () t () φ - cB () B Yt
B Yt () θ 1 - cB () B echo bất kỳ hằng số c. Để có tham số duy nhất trong mô hình ARMA,
t
chúng ta phải hủy bỏ bất kỳ thừa số chung nào trong các đa thức đặc trưng AR và MA.
Machine Translated by Google

188 Chẩn đoán mô hình

3. Mở rộng mô hình theo các hướng được gợi ý bởi việc phân tích các phần dư. Vì

ví dụ, nếu sau khi điều chỉnh mô hình MA (1), mối tương quan đáng kể vẫn ở độ trễ 2

trong phần dư, hãy thử MA (2), không phải ARMA (1,1).

Ví dụ, hãy xem xét chuỗi thuộc tính màu một lần nữa. Chúng tôi đã thấy rằng một

Mô hình AR (1) khá phù hợp. Giả sử chúng ta thử một mô hình ARMA (2,1). Kết quả của việc này
2
phù hợp được thể hiện trong Phụ lục 8.16. Lưu ý rằng mặc dù ước tính của và σe
giá trị log-khả năng xảy ra và AIC không quá xa giá trị tốt nhất của chúng, ước tính của φ1,

φ2 và θ khác nhau và không có giá trị nào được coi là khác 0 về mặt thống kê.

Hình 8.16 Mô hình ARMA (2,1) được trang bị quá mức cho dòng thuộc tính màu

Hệ số: ar1 ar2 ma1 Đánh chặn

0,2189 0,2735 0,3036 74.1653

se 2.0056 1.1376 2.0650 2.1121

sigma ^ 2 được ước tính là 24,58: log-likelkel = 105,91, AIC = 219,82

> arima (color, order = c (2,0,1))

8.3 Tóm tắt

Các ý tưởng về phân tích phần dư bắt đầu trong Chương 3 đã được mở rộng đáng kể trong phần này

chương. Chúng tôi đã xem xét các lô khác nhau của các phần còn lại, kiểm tra các thuật ngữ sai

số cho phương sai tương đối, tính bình thường và tính độc lập. Các đặc tính của lượng cặn hấp

thụ mẫu đóng một vai trò quan trọng trong các chẩn đoán này. Thống kê Ljung-Box

Kiểm định portmanteau được thảo luận như một bản tóm tắt của tự tương quan trong các phần dư.

Cuối cùng, các ý tưởng về trang bị quá mức và dư thừa tham số đã được trình bày.

BÀI TẬP

8.1 Đối với mô hình AR (1) với φ ≈ 0,5 và n = 100, độ trễ 1 tự tương quan mẫu của

các phần dư là 0,5. Chúng ta có nên coi điều này là bất thường không? Tại sao hoặc tại sao không?

8.2 Lặp lại bài tập 8.1 cho mô hình MA (1) với θ ≈ 0,5 và n = 100.

8.3 Dựa trên một chuỗi có độ dài n = 200, chúng tôi phù hợp với mô hình AR (2) và thu được phần dư
^ ^ ^ ^ ^
r
tự tương quan của = 0,13, = 0,13, r
và = 0,12. Nếu = r1,1 và = 0,8,φ φ2
1 2 3 1
những tự tương quan còn lại này có hỗ trợ đặc tả AR (2) không? Cá nhân?

Chung?
Machine Translated by Google

Bài tập 189

8.4 Mô phỏng mô hình AR (1) với n = 30 và φ = 0,5. (a) Điều


chỉnh mô hình AR (1) được chỉ định chính xác và xem biểu đồ chuỗi thời gian của các phần
còn lại. Cốt truyện có hỗ trợ đặc tả AR (1) không? (b) Hiển thị một đồ thị lượng tử-
lượng tử bình thường của các phần dư đã được tiêu chuẩn hóa. Làm
cốt truyện hỗ trợ đặc tả AR (1)?
(c) Hiển thị ACF mẫu của các phần dư. Cốt truyện có hỗ trợ AR không (1)
sự chỉ rõ?
(d) Tính tổng thống kê Ljung-Box cho K = 8. Thống kê này có sup
chuyển thông số kỹ thuật AR (1)?
8.5 Mô phỏng mô hình MA (1) với n = 36 và θ = 0,5.

(a) Điều chỉnh mô hình MA (1) được chỉ định chính xác và xem biểu đồ chuỗi thời gian của các

phần dư. Cốt truyện có hỗ trợ đặc điểm kỹ thuật MA (1) không? (b) Hiển thị một đồ thị

lượng tử-lượng tử bình thường của các phần dư đã được tiêu chuẩn hóa. Làm

cốt truyện hỗ trợ đặc điểm kỹ thuật MA (1)?


(c) Hiển thị ACF mẫu của các phần dư. Cốt truyện có hỗ trợ MA (1) không
sự chỉ rõ?
(d) Tính toán thống kê Ljung-Box tổng cho K = 6. Thống kê này có sup
chuyển thông số kỹ thuật MA (1)?

8.6 Mô phỏng mô hình AR (2) với n = 48, φ1 = 1,5 và φ2 = 0,75.


(a) Điều chỉnh mô hình AR (2) được chỉ định chính xác và xem biểu đồ chuỗi thời gian của

các phần còn lại. Cốt truyện có hỗ trợ đặc tả AR (2) không? (b) Hiển thị một đồ thị

lượng tử-lượng tử bình thường của các phần dư đã được tiêu chuẩn hóa. Làm

cốt truyện hỗ trợ đặc tả AR (2)?


(c) Hiển thị ACF mẫu của các phần dư. Cốt truyện có hỗ trợ AR không (2)
sự chỉ rõ?
(d) Tính thống kê Ljung-Box tổng cho K = 12. Thống kê này có sup
chuyển thông số kỹ thuật AR (2)?
8.7 Điều chỉnh mô hình AR (3) có khả năng tối đa với căn bậc hai của chuỗi hare abun dance
(tên tệp hare). (a) Vẽ đồ thị ACF mẫu của các phần dư. Nhận xét về kích thước của các

mối tương quan. (b) Tính toán thống kê Ljung-Box tổng cho K = 9. Thống kê này có sup

chuyển thông số kỹ thuật AR


(3)? (c) Thực hiện chạy thử nghiệm trên các phần còn lại và nhận xét kết

quả. (d) Hiển thị đồ thị bình thường lượng tử-lượng tử của các phần dư. Nhận xét về
kịch bản.

(e) Thực hiện phép thử Shapiro-Wilk về độ chuẩn trên các phần dư.
8.8 Xem xét dữ liệu bán bộ lọc dầu được trình bày trong Phụ lục 1.8 trên trang 7. Dữ liệu trong
tệp có tên bộ lọc dầu.

(a) Phù hợp với mô hình AR (1) với loạt sản phẩm này. Là ước lượng của tham số φ signifi
không thể khác 0 về mặt thống kê?
(b) Hiển thị ACF mẫu của các phần dư từ mô hình được trang bị AR (1). Com
trên màn hình.
Machine Translated by Google

190 Chẩn đoán mô hình

8.9 Tệp dữ liệu có tên rô bốt chứa chuỗi thời gian thu được từ rô bốt công nghiệp.

Robot được thực hiện một chuỗi các thao tác và khoảng cách từ điểm kết thúc mong muốn
được ghi lại bằng inch. Điều này được lặp lại 324 lần để tạo thành chuỗi thời gian.
So sánh sự phù hợp của mô hình AR (1) và mô hình IMA (1,1) cho những dữ liệu này về
các xét nghiệm chẩn đoán được thảo luận trong chương này.
8.10 Tệp dữ liệu có tên deere3 chứa 57 giá trị liên tiếp từ một máy công cụ phức tạp của
Deere & Co. Các giá trị đưa ra là độ lệch so với giá trị mục tiêu tính bằng đơn vị
mười phần triệu inch. Quá trình sử dụng một cơ chế điều khiển để đặt lại một số thông
số của máy công cụ tùy thuộc vào độ phóng đại của độ lệch so với mục tiêu của mặt
hàng cuối cùng được sản xuất. Chẩn đoán sự phù hợp của mô hình AR (1) đối với những
dữ liệu này theo các thử nghiệm được thảo luận trong chương này.
8.11 Hình 6.31 trên trang 139, đề xuất chỉ định mô hình AR (1) hoặc có thể là mô hình AR
(4) cho sự khác biệt của logarit của chuỗi giá dầu. (Tên tệp là oil.price). (a) Ước
tính cả hai mô hình này bằng cách sử dụng khả năng xảy ra tối đa và so sánh kết quả
bằng cách sử dụng các thử nghiệm chẩn đoán được xem xét trong chương này.

(b) Hình 6.32 trên trang 140, đề xuất chỉ định mô hình MA (1) cho sự khác biệt của
các bản ghi. Ước lượng mô hình này theo khả năng xảy ra tối đa và thực hiện các
thử nghiệm chẩn đoán được xem xét trong chương này.
(c) Bạn thích mô hình nào trong số ba mô hình AR (1), AR (4) hoặc MA (1) khi đưa ra
kết quả của phần (a) và (b)?
Machine Translated by Google

CHƯƠNG 9

DỰ BÁO

Một trong những mục tiêu chính của việc xây dựng mô hình cho một chuỗi thời gian là có thể tính toán

trước các giá trị cho chuỗi đó vào các thời điểm trong tương lai. Điều quan trọng không kém là việc đánh giá

độ chính xác của những dự báo đó. Trong chương này, chúng ta sẽ xem xét việc tính toán các phôi

trước và các thuộc tính của chúng cho cả mô hình xu hướng xác định và mô hình ARIMA. Phân tích trước

cho các mô hình kết hợp xu hướng xác định với các thành phần ngẫu nhiên ARIMA
cũng được coi là.

Đối với hầu hết các phần, chúng tôi sẽ giả định rằng mô hình được biết chính xác, bao gồm các

giá trị cụ thể cho tất cả các tham số. Mặc dù điều này không bao giờ đúng trong thực tế, việc sử

dụng các tham số kết hợp esti cho các cỡ mẫu lớn không ảnh hưởng nghiêm trọng đến kết quả.

9.1 Dự báo lỗi bình phương trung bình tối thiểu

Dựa trên lịch sử có sẵn của chuỗi cho đến thời điểm t, cụ thể là Y1, Y2,…, Yt - 1, Yt , muốn dự chúng tôi

báo giá trị của Yt + l sẽ xảy ra với đơn vị thời gian trong tương lai. chúng tôi
gọi thời gian t ^là điểm gốc dự báo và l là thời gian dẫn đầu cho dự báo, và biểu thị thời gian diễn
ra chính nó là Y () l .
t

Như được trình bày trong Phụ lục F, dự báo sai số bình phương trung bình tối thiểu được đưa ra bởi

^
Y (9.1.1)
t (() l E Yt + |l Y1) Y2
,,,… Yt =

(Phụ lục E và F trên trang 218 xem xét các đặc tính của kỳ vọng có điều kiện và

dự đoán lỗi bình phương trung bình tối thiểu.)

Việc tính toán và các thuộc tính của kỳ vọng có điều kiện này liên quan đến việc đúc trước sẽ

là mối quan tâm của chúng tôi trong phần còn lại của chương này.

9.2 Xu hướng xác định

Hãy xem xét một lần nữa mô hình xu hướng xác định của Chương 3,

(9.2.1)
Yt μt Xt + =

trong đó thành phần ngẫu nhiên, Xt, có giá trị trung bình bằng 0. Đối với phần này, chúng tôi sẽ

giả sử rằng {Xt } trên thực tế là nhiễu trắng với phương sai γ0. Đối với mô hình trong Phương trình
(9.2.1), chúng tôi có

191
Machine Translated by Google

192 Dự báo

^
Y t () l= E + Y1 ) Y2,,,
( μt + l Xt + l| … Yt

= E
(μt|+ Y1
l Y2Yt… ) ,,, + ( | Y + l
E Xt 1 ) Y2,,,
… Yt

+ =μt ()
+ l E Xt + l

hoặc

^
l μ=
Y t () (9.2.2)
t + l

vì đối với l ≥ 1, Xt + l độc lập với Y1, Y2,…, Yt - 1, Yt và có giá trị kỳ vọng bằng không.
Do đó, trong trường hợp đơn giản này, dự báo tương đương với việc ngoại suy thời gian xác định
xu hướng trong tương lai.

Đối với trường hợp xu hướng tuyến tính, μt = β0 + β1t, dự báo là

^
Y t ()
l β 0
β1 + = ( t + l) (9.2.3)

Như chúng tôi đã nhấn mạnh trong Chương 3, mô hình này giả định rằng cùng một xu hướng thời gian

tuyến tính cho mỗi người sẽ xuất hiện trong tương lai và dự báo phản ánh giả định đó. Lưu ý rằng nó thiếu
sự phụ thuộc thống kê giữa Yt + l và Y1, Y2,…, Yt - 1, Yt ngăn cản chúng ta
cải thiện trên μt + l như một dự báo.
^
= dự báo
Đối với các mô hình theo mùa, ví dụ, μt μt + 12 Do đó, , dự báo của chúng tôi là Y t ()
t +
=l
μ +
=
^ 12 l
Y t (l 12+ ).cũng sẽ theo chu kỳ, như mong muốn.

Sai số dự báo, et (l), được đưa ra bởi


^
- +=l () Ylt
et () l Yt

- + =
μt + l Xt + l μt + l

=
Xt + l

để có thể

= = 0
E et (()
Xt +()
l)l E

Đó là, các dự báo là không thiên vị. Cũng thế

= = (9.2.4)
Var et () () l () +γ0l
Var Xt

là phương sai sai số dự báo cho tất cả các lần dẫn l.

Mô hình xu hướng cosine cho chuỗi nhiệt độ trung bình hàng tháng đã được ước tính
trong Chương 3 trên trang 35 như

= 46,2660 26,7079– +) cos () 2πt +( - 2.1697)


μ ^t ( sin () 2πt

Ở đây, thời gian được đo bằng năm với giá trị bắt đầu là tháng 1 năm 1964, tần số f = 1 mỗi
năm, và giá trị quan sát cuối cùng là cho tháng 12 năm 1975. Để dự báo giá trị nhiệt độ tháng 6

năm 1976, chúng tôi sử dụng t = 1976,41667 làm giá trị thời gian † và thu được

† Tháng 6 là tháng thứ năm trong năm, và 5/12 ≈ 0,416666666… .


Machine Translated by Google

9.3 Dự báo ARIMA 193

-
= 46,2660 (26,7079 + () –2.1697 sin (2π () 1976.41667 )
μ ^
t
+) cos (2π () 1976,41667)

68,3 ° F =

Dự báo cho các tháng khác cũng được thu thập tương tự.

9.3 Dự báo ARIMA

Đối với mô hình ARIMA, các dự báo có thể được thể hiện theo nhiều cách khác nhau. Mỗi
biểu hiện góp phần vào sự hiểu biết của chúng tôi về quy trình dự báo tổng thể với
liên quan đến tính toán, cập nhật, đánh giá độ chính xác hoặc hành vi dự báo dài hạn.

AR (1)

Trước tiên, chúng tôi sẽ minh họa nhiều ý tưởng bằng quy trình AR (1) đơn giản với dấu khác
có nghĩa là thỏa mãn

= + (9.3.1)
Yt - μ φ Yt 1–( ) - μ et

Hãy xem xét vấn đề dự báo một đơn vị thời gian vào tương lai. Thay t bằng t + 1 trong
Phương trình (9.3.1), chúng ta có

= + (9.3.2)
Yt 1+ - μ φ Yt () - μ et 1+

Với Y1, Y2,…, Yt - 1, Yt , chúng ta lấy các kỳ vọng có điều kiện của cả hai vế của Equa
tion (9.3.2) và thu được
^
Y () μ 1 - = (9.3.3)
t (φ[]E Yt | Y1
Yt Y2
) ,,,
… + (-
1+μ |E Y1
et Y2 … Yt ) ,,,

Bây giờ, từ các thuộc tính của kỳ vọng có điều kiện, chúng ta có

( E Yt |Yt
Y1)Y2
,,,
… Yt = (9.3.4)

Ngoài ra, vì et + 1 độc lập với Y1, Y2, …, Yt - 1, Yt , chúng tôi thu được

= () 1+ = 0 (9.3.5)
( E et 1+ |YtY1) Y2
,,,… E et

Do đó, phương trình (9.3.3) có thể được viết dưới dạng

^
Y 1 () μ φ (9.3.6)
t Yt + = () - μ

Nói cách khác, một tỷ lệ φ của độ lệch hiện tại so với giá trị trung bình của quá trình được thêm vào

quá trình có nghĩa là để dự báo giá trị quá trình tiếp theo.

Bây giờ hãy xem xét một thời gian dẫn chung l. Thay t bằng t + l trong Công thức (9.3.1) và tak

kỳ vọng có điều kiện của cả hai bên tạo ra


^ ^
Y () μ= φ + [l Y () μ l 1– -] f hoặc l ≥ 1 (9.3.7)
t t

^
từ ( E Yt l |1–Y1+ Y2
) ,,,
… YtY = (l t 1– độc lập với Y1,
) và, với l ≥ 1, et + l

Y2, …, Yt - 1, Yt .
Machine Translated by Google

194 Dự báo

Phương trình (9.3.7), được đệ quy trong thời gian dẫn đầu l, cho biết cách dự báo cho
bất kỳ thời gian dẫn đầu nào tôi cũng có thể được xây dựng từ các dự báo để có thời gian dẫn đầu ngắn hơn bằng cách bắt đầu với
^ ^
dự báo ban đầu () 2 Y t () 1 được tính bằng Công thức (9.3.6). Dự báo, v.v. Yt sau đó là
^ ^ ^ ^
thu được từ Y t 2 () [μ φ + = Y t ] () μ 1 - , sau đó Y t () 3 từ Y t () 2, cho đến khi
^
mong muốn Y () l được tìm thấy. Phương trình (9.3.7) và các khái quát của nó cho các mô hình ARIMA khác
t

thuận tiện nhất cho việc thực sự tính toán các dự báo. Phương trình (9.3.7) đôi khi là
được gọi là dạng phương trình chênh lệch của các dự báo.
Tuy nhiên, Công thức (9.3.7) cũng có thể được giải để mang lại một biểu thức rõ ràng cho
dự báo về lịch sử quan sát của chuỗi. Lặp đi lặp lại trên l trong Equa tion (9.3.7), chúng
ta có
^ ^
Y t () φ= l[ Y t ] μ () μ l 1– - +
^
= {[φ
Y φ t () μ l 2– -]} + μ
.
.
.
^
=
φl 1– [ Y t ] μ () μ 1 - +

hoặc

^
Y t ll () μ φ (9.3.8)
Yt + = () - μ

Độ lệch hiện tại so với giá trị trung bình được chiết khấu bởi một hệ số φl , có độ lớn
giảm khi tăng thời gian dẫn. Sau đó, độ lệch chiết khấu được thêm vào giá trị trung bình
chuyên nghiệp để tạo ra dự báo l.
Như một ví dụ số, hãy xem xét mô hình AR (1) mà chúng tôi đã trang bị cho chuỗi thời gian
thuộc tính màu dùng thử indus. Các kết quả ước tính khả năng xảy ra tối đa được trình bày tương
đương trong Phụ lục 7.7 trên trang 165, nhưng các kết quả đầy đủ hơn được trình bày trong Phụ lục
9.1.

Phụ lục 9.1 Ước tính khả năng xảy ra tối đa của Mô hình AR (1) cho Màu sắc

Hệ số: ar1 đánh chặn †

0,5705 74.3293

se 0,1435 1.9151

sigma ^ 2 được ước tính là 24,8: log-likelkel = 106,07, AIC = 216,15

† Hãy nhớ rằng điểm chặn ở đây là ước lượng của trung bình quá trình μ — không phải θ0.

> dữ liệu (màu)


> m1.color = arima (color, order = c (1,0,0))
> m1.color

Đối với mục đích minh họa, chúng tôi giả định rằng các ước tính φ = 0,5705 và μ = 74,339 là
các giá trị đích thực. Các dự báo cuối cùng sau đó có thể được làm tròn.
Machine Translated by Google

9.3 Dự báo ARIMA 195

Giá trị quan sát cuối cùng của thuộc tính màu là 67, vì vậy chúng tôi sẽ dự báo một lần
kỳ trước là †
^
Y () 1 = 74.3293 0.5705 + () (67 74.3293 - )
t

= 74.3293 4,181366 -

= 70.14793

Đối với thời gian dẫn 2, chúng ta có từ Công thức (9.3.7)

^
Y () 2 = 74.3293 0.5705
+ -
t 70.14793
( 74.3293)

= 74.3293 2.385472 -

= 71,94383

Ngoài ra, chúng ta có thể sử dụng Công thức (9.3.8):

^
Y () 2 = 2 74.3293+ 0.5705 ((67
) 74.3293 - )
t

= 71,92823

Ở vị trí dẫn đầu số 5, chúng tôi có

^
Y () 5 = 5 74.3293+ 0.5705 ((67
) 74.3293 - )
t

= 73,88636

và dẫn đầu 10, dự báo là


^
Y () 10 = 74,30253
t

gần bằng μ (= 74.3293). Khi báo cáo những dự báo này, chúng tôi có thể sẽ
Vòng tới thứ mười gần nhất.

Nói chung, kể từ khi | φ | <1, chúng tôi chỉ đơn giản là

^
Y () μ l ≈ đối với l lớn (9.3.9)
t

Sau đó, chúng ta sẽ thấy rằng Công thức (9.3.9) phù hợp với tất cả các mô hình ARMA tĩnh .

Bây giờ hãy xem xét lỗi dự báo trước một bước, et () 1 . Từ phương trình (9.3.2)
và (9.3.6), chúng tôi có
^
Y
et () 1 -Yt=1+() 1 t

= + + ] - [φYt () μ - μ +
[φ()Ytμ - μ ] et 1+

hoặc

= (9.3.10)
et () 1 et 1+

† Vì lỗi làm tròn sẽ tích lũy, bạn nên sử dụng nhiều chữ số thập phân khi thực hiện
tính toán đệ quy.
Machine Translated by Google

196 Dự báo

Quá trình tiếng ồn trắng {et } hiện có thể được diễn giải lại như một chuỗi trước một bước
dự báo sai số. Chúng ta sẽ thấy rằng Công thức (9.3.10) vẫn tồn tại đối với hoàn toàn tổng quát
Mô hình ARIMA. Cũng lưu ý rằng Công thức (9.3.10) ngụ ý rằng sai số dự báo et () 1 Là

độc lập với lịch sử của quá trình Y1, Y2, …, Yt - 1, Yt cho đến thời điểm t. Nếu đây là
không phải vậy, sự phụ thuộc có thể được khai thác để cải thiện dự báo của chúng tôi.

Công thức (9.3.10) cũng ngụ ý rằng phương sai dự báo trước một bước của chúng tôi là
được cho bởi

= 2
(9.3.11)
Var et () σ () 1e

Để điều tra các thuộc tính của lỗi dự báo cho các khách hàng tiềm năng dài hơn, thật tiện lợi để
∞ (), ở dạng. Từ phương trình
thể hiện mô hình AR (1) trong quá trình tuyến tính tổng quát, hoặc MA
(4.3.8) trên trang 70, chúng tôi nhớ lại rằng

= ++
et +φet 1– φ2et 2– φ3et +… (9.3.12)
Yt 3–

Khi đó, các phương trình (9.3.8) và (9.3.12) cùng mang lại kết quả

=
et () l
Yt + l
- μ -φl()Yt- μ

= e + φe
++ +
t + l t l 1– +
… Φl 1– et 1+ φl et

( L et et+ 1– +
- … +… )

để có thể

= e + φe
++ (9.3.13)
et () l
t + l t l 1– +
… Φl 1– et 1+

cũng có thể được viết là

= e + + ++ (9.3.14)
et () l
t + l ψ1e ψ2e
t l 1– + l 2– + t … Ψl 1– et 1+

Phương trình (9.3.14) sẽ được hiển thị để giữ cho tất cả các mô hình ARIMA (xem Công thức (9.3.43)

trên trang 202).


Lưu ý rằng
E et () () l 0 = ; do đó các dự báo là không thiên vị. Hơn nữa, từ Equa
tion (9.3.14), chúng ta có

+ + 2++
Var et () σ() le2 =1 (ψ1
2
(9.3.15)
2 ψ2 )… Ψl 1–

Chúng ta thấy rằng phương sai sai dự báo tăng lên khi l dẫn tăng. Ngược lại điều này

với kết quả được đưa ra trong Công thức (9.2.4) trên trang 192, cho các mô hình xu hướng xác định.

Đặc biệt, đối với trường hợp AR (1),

= 2 1 φ2l -
----------------

Var et () σ () l e (9.3.16)
1 φ2 -

mà chúng ta thu được bằng cách tính tổng một chuỗi hình học hữu hạn.

Đối với thời gian dẫn đầu lâu, chúng tôi có


Machine Translated by Google

9.3 Dự báo ARIMA 197

2
σe
Var et () () l ≈ -------------- cho l (9.3.17)
1 φ2 -

hoặc theo Công thức (4.3.3), trang 66,

≈ = (9.3.18)
Var et (())l Var Yt () γ0 cho tôi lớn

Phương trình (9.3.18) sẽ được chứng minh là hợp lệ cho tất cả các quy trình ARMA tĩnh (xem
Phương trình (9.3.39) trang 201).

MA (1)

Để minh họa cách giải quyết các vấn đề nảy sinh trong việc dự báo đường trung bình động hoặc
mô hình hỗn hợp, hãy xem xét trường hợp MA (1) với giá trị trung bình khác:

- + =
Yt μ et θet 1–

Một lần nữa thay t bằng t + 1 và lấy kỳ vọng có điều kiện của cả hai bên, chúng ta có
^
Y (9.3.19)
t 1 () μ θ - =E ()
et ,,,
| Y1 Y2 … Yt

Tuy nhiên, đối với một mô hình khả nghịch, Công thức (4.5.2) trên trang 80 cho thấy et là
một hàm của Y1, Y2, …, Yt , v.v.

E ()
et ,,,
| Y1etY2= … Yt (9.3.20)

Trên thực tế, một phép gần đúng có liên quan đến phương trình này vì chúng ta chỉ điều chỉnh trên

Y1, Y2, …, Yt và không dựa trên lịch sử vô hạn của quá trình. Tuy nhiên, nếu như trong thực tế, t
lớn và mô hình không thể đảo ngược, sai số trong tính gần đúng sẽ rất nhỏ. Nếu
mô hình không thể đảo ngược — ví dụ: nếu chúng tôi đã sai lệch dữ liệu — thì
Phương trình (9.3.20) thậm chí không gần đúng giá trị; xem Harvey (1981c, tr.161).
Sử dụng các Công thức (9.3.19) và (9.3.20), chúng tôi có dự báo trước một bước về
MA nghịch đảo (1) được biểu thị bằng
^
Y 1 () μ θ et (9.3.21)
t - =

Việc tính toán et sẽ là sản phẩm phụ của việc ước lượng các tham số trong mô hình.
Lưu ý một lần nữa rằng lỗi dự báo trước một bước là
^
Y
et () 1 - Yt
= () 1 t

=
1+
(μμet
- 1+
+ θet
θet)--()

=
et 1+

như trong Công thức (9.3.10), và do đó Công thức (9.3.11) cũng thu được.

Đối với thời gian dẫn đầu lâu hơn, chúng tôi có

^
Y =
t l et + l
+ E
() ,,, θE - ()
| Y1 Y2 ,,,
… Yt | Y1 Y2 … Yt () μ
et l 1– +
Machine Translated by Google

198 Dự báo

Nhưng, với l> 1, cả et + l và et + l - 1 đều độc lập với Y1, Y2,…, Yt . Do đó,
các giá trị kỳ vọng có điều kiện này là các giá trị kỳ vọng vô điều kiện, cụ thể là không,
và chúng ta có
^
Y ()l =
μ cho l> 1 (9.3.22)
t

Lưu ý ở đây rằng Công thức (9.3.9) trên trang 195 đúng với trường hợp MA (1) khi l>

1. Vì đối với mô hình này, ta có ψ1 = θ và ψj = 0 với j > 1, Phương trình (9.3.14)


và (9.3.15) cũng được giữ.

Đi bộ ngẫu nhiên với Trôi

Để minh họa dự báo với chuỗi ARIMA không cố định, hãy xem xét bước đi ngẫu nhiên
với sự trôi dạt được xác định bởi

= + + (9.3.23)
Yt Yt 1– θ0 et

Nơi đây

^
Y =
t () 1 E Yt( | Y1 Yt
Y2 )
… ,,, θ0 E
()et
,,,
1+ | Y1 Y2 … Yt + +

để có thể

^
Y () 1 (9.3.24)
t Yt θ0 + =

Tương tự, dạng phương trình chênh lệch cho dự báo l dẫn là
^ ^
Y () l= Y (9.3.25)
t t () θ l 1–
+ đối
0 với l ≥ 1

và lặp lại trên l cho ra biểu thức rõ ràng


^
Y (9.3.26)
t () l Yt θ0 + = l với l ≥ 1

Ngược lại với Công thức (9.3.9) ở trang 195, nếu θ0 0, thì dự báo không hội tụ cho
dây dẫn dài nhưng theo đường thẳng có hệ số góc θ0 với mọi l.
Lưu ý rằng sự có mặt hoặc vắng mặt của số hạng không đổi θ0 làm thay đổi đáng kể
bản chất của dự báo. Vì lý do này, các thuật ngữ không đổi không nên được bao gồm trong các mô

hình ARIMA tĩnh không nonsta trừ khi bằng chứng rõ ràng rằng giá trị trung bình của các sai khác
sê-ri khác với số không đáng kể. Phương trình (3.2.3) trên trang 28 cho phương sai
của giá trị trung bình của mẫu sẽ giúp đánh giá mức ý nghĩa này.

Tuy nhiên, như chúng ta đã thấy trong trường hợp AR (1) và MA (1), trước một bước
lỗi truyền là
^
= Y =
et () 1 Yt 1+ - ()t 1 et 1+

Cũng thế
Machine Translated by Google

9.3 Dự báo ARIMA 199

^
- =Yt () Yt
et () l + l l

= ( … E )
+ +et ++
Yt lθ0 1+ -Yt
( lθ0 ) + t + l

= + ++ … E
et 1+ et 2+ t + l

đồng ý với Công thức (9.3.14) ở trang 196 vì trong mô hình này ψj = 1 với mọi j.
(Xem Công thức (5.2.6) trên trang 93 với θ = 0.)
Vì vậy, như trong Công thức (9.3.15), chúng ta có

l 1–
= 2 2 = 2
(9.3.27)
Var et () σ () l e Tôiψj_
j 0 =

Ngược lại với trường hợp đứng yên, ở đây Var et () () l phát triển không giới hạn như dự báo
thời gian dẫn l tăng lên. Chúng ta sẽ thấy rằng thuộc tính này là đặc trưng của lỗi dự báo
phương sai cho tất cả các quy trình ARIMA không cố định .

ARMA (p, q)

Đối với mô hình ARMA cố định (p, q) tổng quát , dạng phương trình chênh lệch để tính toán
các dự báo được đưa ra bởi
^ ^ ^ ^
Y t() =
l φ
1Y t() φ l +1– 2Yt() ++
2–…l φpY t ()
+
θ l - p 0
- -
| Y1()
Y2,,,
… Yt | et
θ2E Y1 l
Y22–
… +
Yt ( θ1E et l 1– + ) ,,, (9.3.28)
-
θqE et l - + Y1)Y2,,,
| q … Yt (-…

ở đâu

0
cho j > 0
= (9.3.29)
E …etYtj ()
+ |,,,
Y1 Y2
e tj + cho j ≤ 0
^ ^
Chúng tôi chú ý điều đó Y t( ) j là một dự báo đúng cho j > 0, nhưng cho j ≤ 0, Y t( ) j= Như trong
. Phương
Yt j +
trình (9.3.20) ở trang 197, Phương trình (9.3.29) liên quan đến một số xấp xỉ nhỏ. Vì
một mô hình khả nghịch, Công thức (4.5.5) trên trang 80 cho thấy rằng, sử dụng trọng số π, et có thể
được biểu diễn dưới dạng kết hợp tuyến tính của dãy vô hạn Yt , Yt - 1, Yt - 2,…. Đã

bao giờ, trọng số π lại chết nhanh theo cấp số nhân và tính gần đúng giả định rằng πj là
không đáng kể đối với j > t - q.

Ví dụ, hãy xem xét mô hình ARMA (1,1). Chúng ta có


^
Y t()
1 φ
Yt θ0 θet - + = (9.3.30)

với
^ ^
Y t() φ+ 2= Y t() θ 1 0

và nói chung,
Machine Translated by Google

200 Dự báo

^ ^
Y ()l φ= Y () θ l 1–
+ đối với l ≥ 2 (9.3.31)
t t 0

sử dụng phương trình (9.3.30) để bắt đầu đệ quy.


Các phương trình (9.3.30) và (9.3.31) có thể được viết lại theo nghĩa của quá trình và
sau đó được giải quyết bằng cách lặp lại để có được biểu thức rõ ràng thay thế

^
Y l+ ()
= -
μ φ l Yt () φ - μ
l 1–
cho l ≥ 1 (9.3.32)
t et

Như các Công thức (9.3.28) và (9.3.29) chỉ ra, các thuật ngữ nhiễu et - (q - 1),…, et - 1, et
xuất hiện trực tiếp trong việc tính toán các dự báo cho các khách hàng tiềm năng l = 1, 2,…, q. Tuy nhiên, đối với

l> q, phần tự động hồi quy của phương trình chênh lệch tiếp nhận, và chúng ta có
^ ^ ^ ^
Y ()l φ=
t 1Y t () φ l +1– 2Y t()
2–…
++
l φpY t () θ l 0- +p với l> q (9.3.33)

Do đó, bản chất chung của dự báo trong thời gian dài sẽ được xác định bởi
tham số tự động hồi quy φ1, φ2,…, φp (và số hạng không đổi, θ0, có liên quan đến
trung bình của quá trình).
- -
Nhắc lại từ Công thức (5.3.17) ở trang 97 rằng = 1( φ1
θ0 φ2
μ - -… φp ) chúng ta ,
có thể viết lại Công thức (9.3.33) theo độ lệch so với μ là
^ ^ ^
Y () μ l - = [ φ1 Y() μ l 1– -]+ φ [Y () μ l 2– -] + …
t t 2 t
^ (9.3.34)
+ [ φp tY] () μ l - p - với l> q
^
Là một hàm của thời gian dẫn Y () μ l - tuân theo cùng một đệ quy Yule-Walker như
t

l, hàm tự tương quan ρk của quá trình (xem Công thức (4.4.8), trang 79). Vì vậy, như trong
Phần 4.3 trên trang 66 và Phần 4.4 trên trang 77, các gốc của đặc trưng equa ^
tion sẽ xác định hành vi chung của Y () μ l -cho thời gian dẫn lớn. Đặc biệt,
^ t
Y () μ l - có thể được biểu thị dưới dạng kết hợp tuyến tính của các số hạng giảm dần theo cấp số nhân trong l
t

(tương ứng với các gốc thực) và các thuật ngữ sóng sin giảm xóc (tương ứng với
cặp gốc phức).
^
Do đó, đối với bất kỳ mô hình ARMA cố địnhYnào,
t
() μ giảm
l - xuống 0 khi l tăng, và

dự báo dài hạn chỉ đơn giản là trung bình quá trình μ như được cho trong Công thức (9.3.9) trên
trang 195. Điều này đồng ý với quan điểm chung vì đối với các mô hình ARMA tĩnh,
sự phụ thuộc sẽ mất dần khi khoảng thời gian giữa các lần quan sát tăng lên, và sự suy
giảm này là lý do duy nhất chúng ta có thể cải thiện dự báo “ngây thơ” khi chỉ sử dụng μ.
Lập luận về tính hợp lệ của Công thức (9.3.15) đối với et () l trong tổng thể hiện tại, chúng tôi

cần phải xem xét một đại diện mới cho các quy trình ARIMA. Phụ lục G cho thấy rằng
bất kỳ mô hình ARIMA nào cũng có thể được viết ở dạng quy trình tuyến tính được cắt ngắn như

Ct () l It + = () l cho l> 1 (9.3.35)


Yt + l

trong đó, với mục đích hiện tại của chúng ta, chúng ta chỉ cần biết rằng Ct (l) là một hàm nhất định của Yt ,

Yt-1,… và

= e + + ++ cho l ≥ 1 (9.3.36)
Nó () l
t + l ψ1e t l 2– + t ψ2e … Ψl 1– et 1+ l 1– +
Machine Translated by Google

9.3 Dự báo ARIMA 201

Hơn nữa, đối với các mô hình đảo ngược có t lớn hợp lý, Ct (l) là một hàm nhất định của
lịch sử hữu hạn Yt , Yt - 1,…, Y1. Vì vậy, chúng tôi có

^
Y t () l= E Ct
Yt ()
() l,,,
| Y1
+ ()
Y2 ,,,
… Yt E It () l | Y1 Y2 …

Ct = () l

Cuối cùng,

^
et () l - =Yt()
+ ll
Yt

= [
Ct () +l ()
Nó l] Ct
() -l

Nó = () l

= e
t + +l ψ1e + ++
ψ2e
l 1– + t l 2– + t … Ψl 1– et 1+

Do đó, đối với một quy trình ARIMA có thể đảo ngược chung,

E et [] () l = 0 cho l ≥ 1 (9.3.37)


l 1–
2
= e
Var et () σl () ψj2 cho l ≥ 1 (9.3.38)
j 0 =

Từ công thức (4.1.4) và (9.3.38), chúng ta thấy rằng thời gian dẫn dài ở trạng thái tĩnh
Mô hình ARMA, chúng tôi có

2 2
Var et () σ() le ≈ ψj
j 0 =

hoặc

0
≈ lcho
Var et () γ () l (9.3.39)

Mô hình phi tĩnh

Như cuộc dạo chơi ngẫu nhiên cho thấy, dự báo cho các mô hình ARIMA không tĩnh khá
giống với dự báo cho các mô hình ARMA tĩnh, nhưng có một số khác biệt nổi bật.
Nhớ lại Công thức (5.2.2) ở trang 92 rằng mô hình ARIMA (p, 1, q) có thể được viết dưới dạng
một mô hình ARMA (p + 1, q) không cố định, Chúng tôi sẽ viết điều này là

Yt = + 2– ϕ3Yt+ 3–
ϕ1Yt 1– ϕ2Yt ++ + … ΦpYt p - ϕp 1+ Yt p - 1 -
(9.3.40)
+ et -
- θ1et 1– θ2et -
2– -… qet q -

trong đó hệ số tập lệnh ϕ liên quan trực tiếp đến hệ số khối φ. Đặc biệt,
Machine Translated by Google

202 Dự báo

+ = , = - =
ϕ1 1 φ1 ϕj φj φj 1– 1 2 cho j ,,,… p

và (9.3.41)

ϕp 1+ φp - =

Đối với một bậc tổng quát của sai phân d, chúng ta sẽ có p + d của ϕ hệ số.
Từ biểu diễn này, chúng ta có thể mở rộng ngay lập tức các Công thức (9.3.28), (9.3.29),

và (9.3.30) trên trang 199 để đề cập đến các trường hợp không tĩnh bằng cách thay p bằng p + d và φj

bởi ϕj .

Để làm ví dụ về các phép tính cần thiết, hãy xem xét trường hợp ARIMA (1,1,1).
Nơi đây

- = + + -
Yt Yt 1– ( Yt 1– Ytθ 2–
- 0) et θet 1–

để có thể

= - + + -
Yt ()φ 1Yt+ 1– φYt 2– θ0 et et 1–

Như vậy

^
Y () 1
= () 1 + - - θ0
+ θet
t φ Yt φYt 1–
^ ^
Y () 2
= ()φ 1Y + () φYt1 - + θ0
t t
(9.3.42)

^ ^ ^
Y () l
= ()φ 1Y + () φ l -1–()Yt lθ02–+
t t

Đối với mô hình ARIMA có thể đảo ngược chung, biểu diễn quy trình tuyến tính được cắt ngắn
được đưa ra trong các phương trình (9.3.35) và (9.3.36) và các phép tính sau các phương trình này
cho thấy rằng chúng ta có thể viết

= e + + ++ cho l ≥ 1 (9.3.43)
et () l
t + l ψ1e ψ2e
l 1– + l 2– + t … Ψl 1– et 1+ t

và vì thế

E et () () l = 0 cho l ≥ 1 (9.3.44)


l 1–
2 2 cho l ≥ 1
Var et () σ
() le = (9.3.45)
ψj
j 0 =

Tuy nhiên, đối với chuỗi không tĩnh, trọng số ψj không phân rã về 0 khi j tăng.
Ví dụ, đối với mô hình đi bộ ngẫu nhiên, ψj = 1 với mọi j; đối với mô hình IMA (1,1), ψj =
1 θ với j ≥ 1; đối với trường hợp IMA (2,2), ψj = 1 + θ2 + (1 - θ1 - θ2) j với j ≥ 1; và cho
Mô hình ARI (1,1), ψj = (1 - φ j + 1) / (1 - φ) với j ≥ 1 (xem Chương 5).
Do đó, đối với bất kỳ mô hình tĩnh nào, Công thức (9.3.45) cho thấy rằng lỗi dự báo
phương sai sẽ tăng lên mà không bị ràng buộc khi thời gian dẫn l tăng lên. Sự thật này không nên
quá ngạc nhiên vì với loạt phim không tĩnh, tương lai xa là khá bất định.
Machine Translated by Google

9.4 Giới hạn dự đoán 203

9.4 Giới hạn dự đoán

Như trong tất cả các nỗ lực thống kê, ngoài việc dự báo hoặc dự đoán Yt + l chưa biết ,
chúng tôi muốn đánh giá độ chính xác của các dự đoán của chúng tôi.

Xu hướng xác định

Đối với mô hình xu hướng xác định với thành phần ngẫu nhiên nhiễu trắng {Xt }, chúng tôi
nhớ lại điều đó

^
Y t () =
t +
μ l


= =
Var et () () l Var Xt
l ()
+ γ0

Nếu thành phần ngẫu nhiên được phân phối bình thường, thì lỗi dự báo
^
= Y = (9.4.1)
et () l Yt + l - () l Xt + lt

cũng được phân phối bình thường. Do đó, đối với mức độ tin cậy 1 - α đã cho, chúng ta có thể sử dụng

phân vị chuẩn bình thường, z1 - α / 2, để khẳng định rằng


^
Y l
- () t
Yt + l
- <<----------------------------- 1 - = α
P z1 - α ⁄ 2 z1 - α ⁄ 2

Var et () () l

hoặc, tương đương,


^
P Y - < Y + 1 - = α
[ ^t () l z1 - α ⁄ 2 Var et
(() l) Yt + l
<
t () l z1 - α ⁄ 2 Var et
() () l]

Do đó, chúng tôi có thể (1 - α) 100% tin tưởng rằng quan sát trong tương lai Yt + l sẽ
nằm trong giới hạn dự đoán
^
Yt ± (9.4.2)
Var
() l z1 - α ⁄ 2 () () l et

Như một ví dụ số, hãy xem xét chuỗi nhiệt độ trung bình hàng tháng một lần
hơn. Trên trang 192, chúng tôi đã sử dụng mô hình cosine để dự đoán nhiệt độ trung bình
tháng 6 năm 1976 là 68,3 ° F. Ước tính của () = và ()đối
l Var γ với
giới
mô hạn
hình dự đoán
nàylà cho
là 3,7 nhiệt
° F. độ 95%
Như vậy
trung bình 0tháng 6 năm 1976

1,96 ±
3,7 ° F()đến
= 68,3 ° F± hoặc 61,05 68,3
75,557.252

Những độc giả quen thuộc với phân tích hồi quy chuẩn sẽ nhớ lại rằng vì
dự báo liên quan đến các tham số hồi quy ước tính , phương sai sai dự báo đúng là
được cho bởi γ0 [1 + (1 / n) + cn, l], trong đó cn, l là một hàm nhất định của cỡ mẫu n và
thời gian dẫn l. Tuy nhiên, nó có thể được chỉ ra rằng đối với các loại xu hướng mà chúng ta
đang xem xét (cụ thể là cosin và đa thức theo thời gian) và đối với kích thước mẫu lớn n, 1 / n và

cn, l đều không đáng kể so với 1. Ví dụ, với xu hướng cosin của chu kỳ 12 qua
N = n / 12 năm, chúng ta có cn, l = 2 / n; do đó, phương sai sai dự báo chính xác là
Machine Translated by Google

204 Dự báo

γ0 [1 + (3 / n)] chứ không phải γ0 gần đúng của chúng ta. Đối với mô hình xu hướng thời gian tuyến tính, có thể

chỉ ra rằng cn, l = 3 (n + 2l - 1) 2 / [n (n2 - 1)] ≈ 3 / n đối với đạo trình vừa phải l và n lớn. Do đó, một

lần nữa ước tính gần đúng của chúng tôi có vẻ hợp lý.

Mô hình ARIMA

Nếu các thuật ngữ nhiễu trắng {et } trong chuỗi ARIMA chung, mỗi thuật ngữ phát sinh độc lập với
phân phối chuẩn, thì từ Công thức (9.3.43) trên trang 202, lỗi dự báo et () l cũng sẽ có phân

phối chuẩn
hướng và
xáccác
định,
bướchãy
dẫnnhớ
đếnlại
Công
rằng
thức
trong
(9.4.2)
trường
vẫnhợp
hợphiện
lệ. tại
Tuy nhiên, ngược lại với mô hình xu

l 1–
2 2
Var et () σ ()
= l e ψj
j 0 =

Trong thực tế, 2 sẽ là ẩn số và phải được ước tính từ chuỗi thời gian quan sát được.
σe Các trọng số cần thiết, tất nhiên, cũng là ẩn số vì chúng là một số chức năng của các trọng
số φ và θ chưa biết. Đối với cỡ mẫu lớn, những ước lượng này sẽ ít ảnh hưởng đến các giới hạn dự
đoán thực tế được đưa ra ở trên.
Như một ví dụ số, hãy xem xét mô hình AR (1) mà chúng tôi đã ước tính cho chuỗi thuộc tính
màu dùng thử indus. Từ Hình 9.1 trên trang 194, chúng tôi sử dụng φ = 0,5705, μ = 74,339 và =
2
24,8. Đối với môσehình AR (1), chúng tôi nhớ lại Công thức (9.3.16) trên trang 196

= 2 ----------------
1 φ2l -
Var et () σ () l e
1 φ2 -

Đối với dự đoán trước một bước, chúng tôi có

70.14793 1,96 24,8 ± ±


= 70.14793 9.760721 hoặc 60.39 đến 79.91

Hai bước trước, chúng tôi có được

71,86072 11,88343 hoặc 60,71 đến 83,18 ±

Chú ý rằng khoảng thời gian dự đoán này rộng hơn khoảng thời gian trước đó. Dự báo trước mười
bước dẫn đến
74,173934 11,88451 hoặc 62,42 đến 86,19 ±

Đến khách hàng tiềm năng 10, cả giới hạn dự báo và giới hạn dự báo đã giảm xuống giá trị dẫn đầu dài hạn
của chúng.

9.5 Minh họa dự báo

Thay vì hiển thị các tính toán dự báo và giới hạn dự báo, việc hiển thị các ô phù hợp của các dự
báo và giới hạn của chúng thường mang tính hướng dẫn hơn.
Machine Translated by Google

9.5 Minh họa dự báo 205

Xu hướng xác định

Hình 9.2 hiển thị bốn năm qua của chuỗi thời gian nhiệt độ trung bình hàng tháng cùng
với các dự báo và giới hạn dự báo 95% trong hai năm nữa. Vì mô hình khá phù hợp với
phương sai sai số tương đối nhỏ, các giới hạn dự báo khá gần với dự báo xu hướng phù
hợp.

Phụ lục 9.2 Dự báo và Giới hạn cho Xu hướng Cosine Nhiệt độ


••• ••• •••
70
••
•• • •
••

• •

• •• • • • •
• • • ••

• • • •
50

• • •
• •
• • • •
• • • • • •
Nhiệt
độ
30

• • • •• ••• ••

• • • •
10 ••
• •

Năm 1972 Năm 1973 1974 1975 Năm 1976 1977 1978

Năm

> data (tempdub)>


tempdub1 = ts (c (tempdub, rep (NA, 24)), start = start (tempdub),
freq = tần số (tempdub))
> har. = harmonic (tempdub, 1)>
m5.tempdub = arima (tempdub, order = c (0,0,0), xreg = har.)> newhar. =
harmonic (ts (rep (1,24), start = c (1976,1), freq = 12), 1)> win.graph (width = 4.875,
height = 2.5, pointsize = 8)> plot (m5.tempdub, n.ahead = 24, n1 = c ( 1972,1), newxreg
= newhar.,
type = 'b', ylab = 'Nhiệt độ', xlab = 'Năm'))

Mô hình ARIMA

Chúng tôi sử dụng chuỗi thuộc tính màu công nghiệp làm minh họa đầu tiên của chúng tôi về
dự báo ARIMA. Hình 9.3 hiển thị chuỗi này cùng với các dự báo dẫn đến thời gian 12 với giới
hạn dự đoán trên và dưới 95% cho các dự báo đó. Ngoài ra, một đường ngang tại ước tính cho
giá trị trung bình của quá trình được hiển thị. Lưu ý cách các dự báo tiếp cận giá trị
trung bình theo cấp số nhân khi thời gian dẫn đầu tăng lên. Cũng lưu ý cách giới hạn dự
đoán tăng theo chiều rộng.
Machine Translated by Google

206 Dự báo

Phụ lục 9.3 Dự báo và Giới hạn Dự báo cho Mô hình AR (1) về Màu sắc

• • •

• •• • •

• • •• •
• •
• • •


•• • • • • • • • • • •


• • •

• •
• •
Thuộc
tính
màu

• • •
• • •
85
80
75
70
65
60

0 10 20 30 40

Thời gian

> dữ liệu (màu)


> m1.color = arima (color, order = c (1,0,0))
> plot (m1.color, n.ahead = 12, type = 'b', xlab = 'Time',
ylab = 'Thuộc tính màu')
> abline (h = coef (m1.color) [tên (coef (m1.color)) == 'intercept'])

Chuỗi số lượng phong phú của thỏ Canada được điều chỉnh bằng cách làm việc với căn bậc hai của

số lượng nhiều và sau đó phù hợp với mô hình AR (3). Chú ý cách dự báo
bắt chước chu kỳ gần đúng trong chuỗi thực tế ngay cả khi chúng tôi dự báo với thời gian dẫn đầu
đến 25 năm trong Phụ lục 9.4.

Hình 9.4 Dự báo từ Mô hình AR (3) cho Sqrt (Hare)

10

• •••
•• •• ••
• ••

• • •• ••


5 •

rừng)
(thỏ
Sqrt
• • •
• • •• • • • • • •
• •• • •
• • • • •

• •
• • • •
0
• •
• •

1910 1920 Năm 1930 1940 1950 1960

Năm

> dữ liệu (thỏ rừng)

> m1.hare = arima (sqrt (hare), order = c (3,0,0))


> plot (m1.hare, n.ahead = 25, type = 'b',
xlab = 'Year', ylab = 'Sqrt (hare)')
> abline (h = coef (m1.hare) [names (coef (m1.hare)) == 'intercept'])
Machine Translated by Google

9.6 Cập nhật Dự báo ARIMA 207

9.6 Cập nhật Dự báo ARIMA

Giả sử chúng ta đang dự báo một chuỗi thời gian hàng tháng. Quan sát cuối cùng của chúng tôi là đối với

ruary tháng 2 và chúng tôi dự báo cho tháng 3, tháng 4 và tháng 5. Khi thời gian trôi qua, giá trị thực tế cho

Tháng 3 trở nên khả dụng. Với giá trị mới này trong tay, chúng tôi muốn cập nhật hoặc
sửa đổi (và, một người hy vọng, cải thiện) dự báo của chúng tôi cho tháng 4 và tháng 5. Tất nhiên, chúng tôi có thể

tính toán các dự báo mới từ đầu. Tuy nhiên, có một cách đơn giản hơn.

^ Đối với nguồn gốc dự báo chung t và thời gian dẫn đầu l + 1, dự báo ban đầu của chúng tôi được ký hiệu là
Y t(l 1+ ). Khi có quan sát tại thời điểm t + 1, chúng tôi muốn cập nhật
^
dự báo của chúng tôi là Y
() l t 1+ . Hiệu suất các phương trình (9.3.35) và (9.3.36) trên trang 200

= + + t + + l 1
ψ1e + ++
Yt + + l 1 Ct ()
1+ l
e t + l ψ2et l 1– + … Ψl et 1+

Vì Ct (l + 1) và et + 1 là các hàm của Yt + 1, Yt ,…, trong khi et + l + 1, et + l,…, et + 2 là

không phụ thuộc vào Yt + 1, Yt ,…, chúng ta nhanh chóng thu được biểu thức

^
Yt 1+ () l = Ct () ψ l 1+ +
l et 1+

^ ^
Y t lCt1+= ( phương l 1+), và tất nhiên, -et=1+()
Tuy nhiên, () Yt 1
1+ Yt . Vì vậy, chúng tôi có

trình cập nhật tổng quát


^ ^ ^
Yt 1+ () l= Y t () ψ l +1+[ ] l
Yt 1+ - () Y1 t (9.6.1)
^
Lưu ý rằng Y
[ Yt 1+ - () t1] là lỗi dự báo thực tế tại thời điểm t + 1 khi Yt 1+
đã được
Được Quan sát.

Như một ví dụ số, hãy xem xét chuỗi thời gian thuộc tính màu công nghiệp. Thực hiện theo
Phụ
^ lục 9.1 trên trang 194, chúng tôi phù hợp với
^ mô hình AR (1) để dự báo đi trước một bước như
Y 35 ( ) 1 = 70,096 và đi trước hai bước khi Y 35 ( ) 2 = 71,86072 . Nếu bây giờ màu tiếp theo

giá trị có sẵn là Yt + 1 = Y36 = 65, sau tôi


chúng đó cập nhật dự báo cho thời gian t = 37
như

^ ^
Yt 1+ () 1 =Y 36 +
= () 1 71,86072 0,5705 65( 70,096–) = 68,953452

9.7 Trọng số dự báo và Trọng số theo cấp số nhân


Đường trung bình động

Đối với các mô hình ARIMA không có điều khoản trung bình động, rõ ràng là các dự báo như thế nào

được xác định rõ ràng từ chuỗi quan sát Yt , Yt - 1,…, Y1. Tuy nhiên, với bất kỳ dòng máy nào
với q > 0, các thuật ngữ nhiễu sẽ xuất hiện trong dự báo và bản chất của dự báo thể
hiện rõ ràng nó theo Yt , Yt - 1,…, Y1 bị ẩn. Để đưa ra khía cạnh này của dự báo, chúng tôi
trở lại dạng đảo ngược của bất kỳ quy trình ARIMA có thể đảo ngược nào, cụ thể là

= 1– π2Yt 2– +π3Yt 3–
Yt π1Yt + ++ … Et

(Xem Công thức (4.5.5) ở trang 80.) Vì vậy, chúng ta cũng có thể viết
Machine Translated by Google

208 Dự báo

= + + ++
Yt 1+ π1Yt π2Yt 1– π3Yt 2– … Et 1+

Dựa trên kỳ vọng có điều kiện của cả hai bên, với Yt , Yt - 1,…, Y1, chúng tôi thu được
^
Y 1 ()= π+++…
1Yt π2Yt 1– π3Yt 2– (9.7.1)
t

(Chúng tôi giả sử t là đủ lớn và / hoặc trọng lượng π giảm đi đủ


nhanh sao cho πt , πt + 1,… đều không đáng kể.)
Đối với bất kỳ mô hình ARIMA có thể đảo ngược nào, trọng số π có thể được tính toán đệ quy từ

các biểu thức

min jq(),

θi πj i -ϕj + cho 1 ≤ ≤jpd +


tôi 1 =

= (9.7.2)
πj
min jq(),

θi πj i - cho jpd > +


tôi 1 =

với giá trị ban đầu π0 = 1. (So sánh điều này với Công thức (4.4.7) trên trang 79 cho
ψ-trọng lượng.)

Đặc biệt xem xét mô hình IMA không tĩnh (1,1)


- + =
Yt Yt 1– et θet 1–

Ở đây p = 0, d = 1, q = 1, với ϕ1 = 1; do đó

π1 θπ0 = 1 = + 1 - θ

π2 θπ1 = = θ (1 - θ )

và nói chung,
=
πj θπj 1– cho j > 1
Vì vậy, chúng tôi đã rõ ràng

= 1–) (với
θ 1 -j θ≥ j1 (9.7.3)
πj

do đó, từ Công thức (9.7.1), chúng ta có thể viết

^
Y () 1 = ++ +…
() 1 - ()1 θ- θ 2Yt 2– (9.7.4)
t θ Yt () θ 1 - θ Yt 1–

Trong trường hợp này, trọng số π giảm theo cấp số nhân, và hơn nữa,

∞ ∞ 1 - θ
= == ----------- j 1– 1
() θ 1 - θ πj 1 - θ
j 1 = j 1 =
^
Như vậy Y () 1 được gọi là đường trung bình động có trọng số theo cấp số nhân (EWMA).
t

Đại số đơn giản cho thấy rằng chúng ta cũng có thể viết

^ ^
Y = () 1 + (9,7,5)
t
() 1 - θ Yt θY t 1– () 1
Machine Translated by Google

9.8 Chuỗi dự báo đã biến đổi 209


^ ^ ^
Y t () 1 =Y () 1 + ()
-
() 1] (9,7,6)
t 1– θ [1
Yt -Y t 1–

Phương trình (9.7.5) và (9.7.6) cho biết cách cập nhật các dự báo từ điểm gốc t - 1 đến điểm gốc t,

và chúng thể hiện kết quả dưới dạng kết hợp tuyến tính giữa quan sát mới và quan sát cũ
dự báo hoặc trong điều kiện của dự báo cũ và sai số dự báo quan sát được cuối cùng.

Việc sử dụng EWMA để dự báo chuỗi thời gian đã được ủng hộ, chủ yếu là trong trường hợp đột xuất

cơ sở, trong một số năm; xem Brown (1962) và Montgomery và Johnson (1976).
Tham số 1 - θ được gọi là hằng số làm mịn trong tài liệu EWMA và
việc lựa chọn (ước lượng) thường khá tùy tiện. Từ việc xây dựng mô hình ARIMA
, chúng tôi để dữ liệu cho biết liệu mô hình IMA (1,1) có phù hợp với
loạt phim đang được xem xét. Nếu vậy, chúng tôi ước tính θ một cách hiệu quả và tính toán
dự báo EWMA mà chúng tôi tin tưởng là dự báo sai số bình phương trung bình tối thiểu. Một
xử lý toàn diện các phương pháp làm mịn theo cấp số nhân và mối quan hệ của chúng với
Mô hình ARIMA được đưa ra trong Abraham và Ledolter (1983).

9.8 Chuỗi dự báo đã biến đổi

Sự khác biệt

Giả sử chúng ta quan tâm đến việc dự báo một chuỗi có mô hình liên quan đến sự khác biệt đầu tiên
để đạt được sự ổn định. Hai phương pháp dự báo có thể được xem xét:

1. dự báo chuỗi không tĩnh ban đầu, ví dụ bằng cách sử dụng dạng phương trình sai
khác của Công thức (9.3.28) trên trang 199, với φ được thay thế bằng ϕ trong
suốt, hoặc

2. dự báo chuỗi sai phân cố định Wt = Yt - Yt - 1 và sau đó "hoàn tác" sự khác


biệt bằng cách tính tổng để có được dự báo trong điều kiện ban đầu.

Chúng tôi sẽ chỉ ra rằng cả hai phương pháp đều dẫn đến những dự báo giống nhau. Điều này về cơ bản

bởi vì sai phân là một phép toán tuyến tính và bởi vì kỳ vọng có điều kiện của một tổ
hợp tai lin là kết hợp tuyến tính giống nhau của các kỳ vọng có điều kiện.
Đặc biệt xem xét mô hình IMA (1,1). Dựa trên công việc của chúng tôi trên nonsta gốc
loạt tĩnh, chúng tôi dự báo là
^
Y t () 1 (9.8.1)
Yt θet - =


^ ^
Y t () l= Y() t lcho
1– l> 1 (9.8.2)

Chúng tôi dự kiến sẽ


Bây giờ hãy xem xét chuỗi MA (1) cố định sai phân Wt = Yt - Yt - 1.
truyền Wt + l như

^
W t 1 () -θ =et (9.8.3)


^
W t () l = 0 cho l> 1 (9.8.4)
Machine Translated by Google

210 Dự báo

^ ^ ^ ^
Tuy nhiên, W t() 1YtY -t()=1 W ; do đó t 1 ()et
θ -
tương
= đương với Y t() 1 Yt θet - =
^ ^ ^
như trước. Tương tự, W tl()Y -l =Yt (l 1–t
() ,và Phương trình (9.8.4) trở thành Phương trình
) (9.8.2), như chúng tôi đã tuyên bố.

Kết quả tương tự sẽ áp dụng cho bất kỳ mô hình nào liên quan đến sự khác biệt của bất kỳ thứ tự nào và

thực sự đối với bất kỳ loại biến đổi tuyến tính nào với hệ số không đổi. (Tuyến tính nhất định
các phép biến đổi khác với sự khác biệt có thể áp dụng cho chuỗi thời gian theo mùa. Nhìn thấy
Chương 10.)

Chuyển đổi nhật ký

Như chúng ta đã thấy trước đó, thường là thích hợp để lập mô hình logarit của bản gốc
loạt — một phép biến đổi phi tuyến. Gọi Yt là giá trị chuỗi ban đầu và cho Zt =
log (Yt ). Có thể thấy rằng chúng tôi luôn có

,,Yt 1– … Y1 | Zt) Zt
| Yt 1– [(
≥ exp … Z1E ( E Yt + ,,
Zt + l
l )] (9.8.5)
^
với sự bình đẳng chỉ giữ trong những trường hợp tầm thường. Do đó, dự báo ngây thơ exp [ Z t ] () l
không phải là

dự báo sai số bình phương trung bình tối thiểu của Yt + l . Để đánh giá bình phương trung bình tối thiểu

dự báo lỗi trong điều kiện ban đầu, chúng tôi sẽ thấy thực tế sau đây hữu ích: Nếu X có
σ2
phân phối với μ trung bình và phương sai sau đó,

σ2
EX exp
[] μ
()= -----
exp +
2

(Ví dụ: điều này tiếp theo sau từ hàm tạo thời điểm cho X.) Trong ứng dụng của chúng
tôi

,,
Z1 = () μ |E Zt
Zt Zt
+ l
1– …


=
σ2 Var Zt + l( ,,Zt 1– … Z1 )
| Zt

= +
[ () l Ct () l | ,,
Var et Zt Zt 1– … Z1 ]

= [ () l | ,, + [ () l | ,,
Var et Zt Zt 1– … Z1 ] Var Ct Zt Zt 1– … Z1 ]

= [ () l | ,,
Var et Zt Zt 1– … Z1 ]

=
Var []et
() l

Chúng tuân theo các Công thức (9.3.35) và (9.3.36) (áp dụng cho Zt ) và thực tế là một hàm của
Ct ( ) l
Zt , Zt - 1,…, trong khi et (l) độc lập với Zt , Zt - 1, …. Do đó, dự báo

sai số trung bình bình phương nhỏ nhất trong chuỗi ban đầu được đưa ra bởi

^ 1
exp Z t() l --Var et [] () l (9.8.6)
+ 2

Trong suốt cuộc thảo luận của chúng tôi về dự báo, chúng tôi đã giả định rằng bình phương trung bình tối thiểu

sai số dự báo là tiêu chí của sự lựa chọn. Đối với các biến được phân phối chuẩn, đây là một
Machine Translated by Google

9.9 Tóm tắt dự báo với một số mô hình ARIMA nhất định 211

tiêu chí xuất sắc. Tuy nhiên, nếu Zt có phân phối chuẩn, thì Yt = exp (Zt ) có
phân phối chuẩn log mà tiêu chí khác có thể được mong muốn. Đặc biệt, kể từ
phân phối log-chuẩn là không đối xứng và có đuôi dài bên phải, tiêu chí dựa trên
sai số tuyệt đối trung bình có thể thích hợp hơn. Đối với tiêu chí này, dự báo tối ưu
là trung vị của phân phối Zt + l có điều kiện đối với Zt , Zt - 1,…, Z1. Kể từ nhật ký
phép biến đổi bảo toàn giá trị trung bình và vì đối
^ với phân phối chuẩn, giá trị trung bình và
Z ] () l
trung vị là giống nhau, exp dự báo ngây thơ [là dự báo tối ưu Trong
cho
t Yt + l
nghĩa là nó giảm thiểu sai số dự báo tuyệt đối trung bình.

9.9 Tóm tắt dự báo với một số mô hình ARIMA nhất định

Ở đây, chúng tôi tập hợp các kết quả dự báo khác nhau cho các mô hình ARIMA đặc biệt.

AR (1): ( Yt μ =φ +
Yt 1– ) - μ et
+

^ ^
Y ()l μ= φ + [ Y () μ l 1– -] f hoặc l ≥ 1
t t

= + cho l ≥ 1
μ φl Yt() - μ
^
Y () μ l ≈ đối với l lớn
t

= e + φe
++
et () l … Φl 1– et 1+
t + l t l 1– +

= 2 1 φ2l -
----------------

Var et () σ () l e
1 φ2 -

2
σe
≈ -------------- = cho tôi lớn
Var et () () l γ 0
1 φ2 -

= cho j > 0
ψj φ j

MA (1): - + =
Yt μ et θet 1–
^
Y 1 () μ θ et
t - =

^
Y () μ l = cho l > 1
t

=
et () 1 et 1+

et () l
- =e cho l>θe1
t + l t l 1– +

2 cho l 1 =
σe
=
Var et () () l
2 ()
1 θ2
+ σe cho l> 1
Machine Translated by Google

212 Dự báo

-
θ cho j = 1
=
ψj
0 cho j > 1

=
IMA (1,1) với Thời hạn không đổi: Yt Yt + θet
+ -1–
1– θ0 et
^ ^
Y t () l= Y- t+() θ l 1– 0 θet

Yt lθ0 et - + =
^
Y t () = () 1 - ++ θ+ … (EWMA cho θ 0 = 0)
1 θ Yt ( 1 - )θ Yt 1– ()1 θ- θ 2Yt 2–

= e + ++ t cho l ≥ 1
l 2– + … () 1 et
- θ1+
+ ()θ 1e - ()θ 1e -
et () l t + l t l 1– +

Var et () σl () + - θ 2()]
= e2[ 1 (1 ) l 1–

ψj 1 - = θ cho j > 0

Lưu ý rằng nếu θ0 0, các dự báo sẽ đi theo một đường thẳng với độ dốc θ0, nhưng nếu θ0 = 0, thì
là trường hợp thông thường, sau đó dự báo là giống nhau cho tất cả các thời gian dẫn đầu, cụ thể là

^
Y t() l Yt θet - =

=
IMA (2,2): Yt 2Yt
- + θ0
+ - -
1– Yt 2– et θ1et 1– θ2et 2–
^
Y t () 1 = 2Yt Yt-
1– + θ0 θ1et - - θ2et 1–
^ ^
Y t () 2 =2 nămt () 1 Yt - - θ0
+ θ2et (9.9.1)
^ ^ ^
Y t () l= 2Y t ()1– lY - () l θ0 với
t 2– + l> 2

^ θ0
Y t () l= A+ Bl
+ ----- l
2
(9.9.2)
2

ở đâu
^ ^
=
A 2Y () 1- Y() + (9.9.3)
t t 2 θ0

^ 3
B Y= ^ t () 2- Y()t 1
-
--θ0 (9.9.4)
2

Nếu θ0 0, các dự báo tuân theo ^ ^ bậc hai tính bằng l, nhưng nếu θ0 = 0, các dự báo sẽ tạo thành một
một đường cong

đường
^ thẳng^ có độ dốc vàYsẽ
t ()đi
2- qua
Y() 1 dự báo ban đầu
t hai

Y t() 1 và Y t() 2 . Có thể chỉ ra rằng đó làVar


một
et hàm
() () bậc
l ba nào đó của l; hiểu

Box, Jenkins, và Reinsel (1994, trang 156). Chúng tôi cũng có

ψj = +θ2+ 1(1θ1 - θ2 ) j- với j > 0 (9,9,5)


Machine Translated by Google

9.10 Tóm tắt 213

Cũng có thể chỉ ra rằng dự báo trường hợp đặc biệt với θ1 = 2ω và θ2 = ω2 là
tương đương với cái gọi là làm mịn hàm mũ kép với hằng số làm mịn 1 - ω;
xem Abraham và Ledolter (1983).

9.10 Tóm tắt

Dự báo hoặc dự đoán tương lai khi các giá trị chưa được quan sát là một trong những lý do chính cho

phát triển các mô hình chuỗi thời gian. Các phương pháp thảo luận trong chương này đều dựa trên

việc giảm thiểu sai số dự báo bình phương trung bình. Khi mô hình chỉ đơn giản là xu hướng xác định

cộng với lỗi tiếng ồn trắng trung bình bằng 0, dự báo có thể ngoại suy xu hướng. Đã bao giờ,
nếu mô hình chứa tự tương quan, thì các dự báo sẽ khai thác mối tương quan để đưa ra các dự
báo tốt hơn so với cách khác. Chúng tôi đã chỉ ra cách thực hiện điều này với

ARIMA lập mô hình và điều tra tính toán cũng như tính chất của các dự báo. Trong
các trường hợp đặc biệt, việc tính toán và tính chất của các dự báo đặc biệt thú vị
và chúng tôi đã trình bày chúng một cách riêng biệt. Giới hạn dự đoán đặc biệt quan trọng để đánh giá

độ chính xác tiềm năng (hoặc cách khác) của các dự báo. Cuối cùng, chúng tôi đã giải quyết được vấn đề

của chuỗi thời gian dự báo trong đó các mô hình liên quan đến việc chuyển đổi
loạt.

BÀI TẬP

9.1 Đối với mô hình


^ AR (1) với Yt = 12,2, φ = 0,5 và μ = 10,8,
(a) Tìm ()Y 1t .
^
(b) Tính (c) Y () 2 theo hai cách khác nhau.
^t
Tính Y () 10.
t

9.2 Giả sử rằng doanh thu hàng năm (tính bằng triệu đô la) của Acme Corporation theo
-
mô hình AR (2) 5 1,1Yt 1–= 0,5Yt
+
2– với Yt σe
+
et
2 2 = .

(a) Nếu doanh số năm 2005, 2006 và 2007 là 9 triệu đô la, 11 triệu đô la và 10 triệu đô la

Lion, tương ứng, dự báo doanh số bán hàng cho năm 2008 và 2009.

(b) Chứng tỏ rằng ψ1 = 1,1 cho mô hình này.

(c) Tính toán giới hạn dự đoán 95% cho dự báo của bạn trong phần (a) cho năm 2006.

(d) Nếu doanh thu năm 2006 là 12 triệu đô la, hãy cập nhật dự báo của bạn cho năm 2007.

9.3 Sử dụng xu hướng cosine ước tính trên trang 192:


(a) Dự báo nhiệt độ trung bình hàng tháng ở Dubuque, Iowa, cho tháng 4 năm 1976. (b)
Tìm khoảng thời gian dự đoán 95% cho dự báo tháng 4 đó. (Ước tính của γ0
đối với mô hình này là 3,719 ° F.)

(c) Dự báo cho tháng 4 năm 1977 là gì? Cho tháng 4 năm 2009?
9.4 Sử dụng xu hướng cosine ước tính trên trang 192:
(a) Dự báo nhiệt độ trung bình hàng tháng ở Dubuque, Iowa, cho tháng 5 năm 1976. (b)
Tìm khoảng thời gian dự đoán 95% cho dự báo tháng 5 năm 1976 đó. (Ước tính của
đối với mô hình này là 3,719 ° F.)
γ0
Machine Translated by Google

214 Dự báo

9.5 Sử dụng mô hình phương tiện theo mùa không có chốt chặn được trình bày trong Phụ lục 3.3 trên
trang 32:
(a) Dự báo nhiệt độ trung bình hàng tháng ở Dubuque, Iowa, cho tháng 4 năm 1976. (b) Tìm
khoảng thời gian dự đoán 95% cho dự báo tháng 4 đó. (Ước tính của γ0
đối với mô hình này là 3,419 ° F.)

(c) So sánh dự báo của bạn với dự báo thu được trong Bài tập 9.3.
(d) Dự báo cho tháng 4 năm 1977 là gì? Tháng 4 năm 2009?
9.6 Sử dụng mô hình phương tiện theo mùa có chốt chặn được trình bày trong Phụ lục 3.4 trên trang
33:

(a) Dự báo nhiệt độ trung bình hàng tháng ở Dubuque, Iowa, cho tháng 4 năm 1976. (b) Tìm
khoảng thời gian dự đoán 95% cho dự báo tháng 4 đó. (Ước tính của γ0
đối với mô hình này là 3,419 ° F.)

(c) So sánh dự báo của bạn với dự báo thu được trong Bài tập 9.5.
9.7 Sử dụng mô hình phương tiện theo mùa có chốt chặn được trình bày trong Phụ lục 3.4 trên trang
33

(a) Dự báo nhiệt độ trung bình hàng tháng ở Dubuque, Iowa, cho tháng Giêng
Năm 1976.

(b) Tìm khoảng thời gian dự đoán 95% cho dự báo tháng 1 đó. (Ước tính của γ0
đối với mô hình này là 3,419 ° F.)

9.8 Xem xét chuỗi thời gian phát điện hàng tháng được trình bày trong Phụ lục 5.8 trên
trang 99. Dữ liệu có trong tệp có tên là điện.
(a) Điều chỉnh mô hình xu hướng xác định chứa các giá trị theo mùa cùng với xu hướng
thời gian gần nhất với logarit của các giá trị điện.
(b) Lập biểu đồ năm năm qua của chuỗi cùng với hai năm dự báo và
giới hạn dự báo 95%. Diễn giải cốt truyện.
9.9 Mô phỏng quá trình AR (1) với φ = 0,8 và μ = 100. Mô phỏng 48 giá trị nhưng được đặt
dành 8 giá trị cuối cùng để so sánh dự báo với giá trị thực tế.
(a) Sử dụng 40 giá trị đầu tiên của chuỗi, tìm các giá trị cho likeli lớn nhất
ước lượng mui xe của φ và μ.
(b) Sử dụng mô hình ước tính, dự báo tám giá trị tiếp theo của chuỗi. Kịch bản
loạt dự báo cùng với tám dự báo. Đặt một đường ngang tại điểm trung bình của quá
trình.
(c) So sánh tám dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.

9.10 Mô phỏng quá trình AR (2) với φ1 = 1,5, φ2 = 0,75 và μ = 100. Mô phỏng 52
nhưng dành 12 giá trị cuối cùng để so sánh dự báo với giá trị thực tế.
(a) Sử dụng 40 giá trị đầu tiên của chuỗi, tìm các giá trị cho ước tính độ che phủ likeli
lớn nhất của φ và μ.
(b) Sử dụng mô hình ước tính, dự báo 12 giá trị tiếp theo của chuỗi. Vẽ đồ thị
cùng với 12 dự báo. Đặt một đường ngang với ước tính của
Machine Translated by Google

Bài tập 215

quá trình có nghĩa


là. (c) So sánh 12 dự báo với các giá trị thực tế mà bạn đã đặt sang một
bên. (d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.
9.11 Mô phỏng quá trình MA (1) với θ = 0,6 và μ = 100. Mô phỏng 36 giá trị nhưng dành 4 giá
trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 32 giá trị đầu tiên
của chuỗi, tìm các giá trị cho ước tính độ che phủ likeli lớn nhất của θ và μ.

(b) Sử dụng mô hình ước tính, dự báo bốn giá trị tiếp theo của chuỗi. Lập đồ thị chuỗi
cùng với bốn dự báo. Đặt một đường ngang ở ước tính của giá trị trung bình của quá
trình. (c) So sánh bốn dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không

trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.
9.12 Mô phỏng quá trình MA (2) với θ1 = 1, θ2 = 0,6 và μ = 100. Mô phỏng 36 giá trị nhưng
dành 4 giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 32 giá trị
đầu tiên của chuỗi, tìm các giá trị cho ước lượng độ che phủ likeli lớn nhất của θ và
μ. (b) Sử dụng mô hình ước tính, dự báo bốn giá trị tiếp theo của chuỗi. Lập đồ
thị chuỗi cùng với bốn dự báo. Đặt một đường ngang ở ước tính của giá trị trung bình
của quá trình. (c) Điều gì đặc biệt về các dự báo tại thời điểm dẫn 3 và 4? (d) So
sánh bốn dự báo với các giá trị thực tế mà bạn đã đặt sang một bên. (e) Lập đồ thị
các dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không

trong giới hạn dự báo?

(f) Lặp lại các phần (a) đến (e) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.
9.13 Mô phỏng quy trình ARMA (1,1) với φ = 0,7, θ = 0,5 và μ = 100. Mô phỏng 50 giá trị nhưng
dành 10 giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 40 giá trị
đầu tiên của chuỗi, tìm các giá trị cho likeli lớn nhất
ước lượng mui xe của φ, θ và μ.
(b) Sử dụng mô hình ước tính, dự báo mười giá trị tiếp theo của chuỗi. Lập kế hoạch
chuỗi cùng với mười dự báo. Đặt một đường ngang ở ước tính của giá trị trung bình
của quá trình. (c) So sánh mười dự báo với các giá trị thực tế mà bạn đã đặt sang
một bên. (d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có
giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.
Machine Translated by Google

216 Dự báo

9.14 Mô phỏng quá trình IMA (1,1) với θ = 0,8 và θ0 = 0. Mô phỏng 35 giá trị, nhưng dành năm
giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 30 giá trị đầu tiên
của chuỗi, tìm giá trị cho likeli lớn nhất
ước lượng mui xe của θ.

(b) Sử dụng mô hình ước tính, dự báo năm giá trị tiếp theo của chuỗi. Lập đồ thị chuỗi
cùng với năm dự báo. Dự báo có gì đặc biệt?
(c) So sánh năm dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.

9.15 Mô phỏng quá trình IMA (1,1) với θ = 0,8 và θ0 = 10. Mô phỏng 35 giá trị, nhưng dành năm
giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 30 giá trị đầu tiên
của chuỗi, tìm các giá trị cho likeli lớn nhất

ước lượng mui xe của θ và θ0.


(b) Sử dụng mô hình ước tính, dự báo năm giá trị tiếp theo của chuỗi. Lập đồ thị chuỗi
cùng với năm dự báo. Những dự báo này có gì đặc biệt?
(c) So sánh năm dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.

9.16 Mô phỏng quá trình IMA (2,2) với θ1 = 1, θ2 = 0,75 và θ0 = 0. Mô phỏng 45 giá trị, nhưng
dành năm giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 40 giá trị
đầu tiên của chuỗi, tìm giá trị cho likeli lớn nhất

ước lượng mui xe của θ1 và θ2.


(b) Sử dụng mô hình ước tính, dự báo năm giá trị tiếp theo của chuỗi. Lập đồ thị chuỗi
cùng với năm dự báo. Dự báo có gì đặc biệt?
(c) So sánh năm dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.

9.17 Mô phỏng quá trình IMA (2,2) với θ1 = 1, θ2 = 0,75 và θ0 = 10. Mô phỏng 45 giá trị,
nhưng dành năm giá trị cuối cùng để so sánh dự báo với giá trị thực tế. (a) Sử dụng 40
giá trị đầu tiên của chuỗi, tìm các giá trị cho ước tính độ che phủ likeli lớn nhất của

θ1, θ2 và θ0. (b) Sử dụng mô hình ước tính, dự báo năm giá trị tiếp theo của chuỗi.
Lập đồ thị chuỗi cùng với năm dự báo. Những dự báo này có gì đặc biệt?

(c) So sánh năm dự báo với các giá trị thực tế mà bạn đã đặt sang một bên.
(d) Lập đồ thị dự báo cùng với 95% giới hạn dự báo. Các giá trị thực tế có giảm không
trong giới hạn dự báo?

(e) Lặp lại các phần (a) đến (d) với một loạt mô phỏng mới sử dụng cùng các giá trị
của các tham số và cùng cỡ mẫu.
Machine Translated by Google

Bài tập 217

9.18 Hãy xem xét mô hình Yt


β0 β1t= Xt
+ +đã biết β0, , ở đâu Xt φXt 1– et + = . Chúng tôi giả định

β1 và φ. Chứng tỏ rằng dự báo sai^ số bình phương trung bình tối thiểu l
l
Y t dạng = + .
các bước phía trước có thể được viết dưới () βminh
9.19 Xác 0 β1phương t ++ll(
( ) φ trình Yt β0 - β1
- t)
(9.3.16) trên trang 196.

9.20 Xác minh phương trình (9.3.32) trên trang 200.

9.21 Tệp dữ liệu có tên deere3 chứa 57 giá trị liên tiếp từ một phức hợp
quy trình máy công cụ tại Deere & Co. Quá trình sử dụng một điều khiển

cơ chế đặt lại một số thông số của máy công cụ tùy thuộc vào
mức độ sai lệch so với mục tiêu của mặt hàng cuối cùng được sản xuất.
(a) Sử dụng mô hình AR (1) cho chuỗi này, dự báo mười giá trị tiếp theo.
(b) Lập đồ thị chuỗi, dự báo và giới hạn 95% dự báo, và giải thích kết quả.
9.22 Tệp dữ liệu có tên ngày chứa dữ liệu kế toán từ Công ty Winegard của Bur lington, Iowa.
Dữ liệu là số ngày cho đến khi Winegard nhận được thanh toán
cho 130 đơn đặt hàng liên tiếp từ một nhà phân phối sản phẩm Winegard cụ thể.
(Tên của nhà phân phối phải được giấu tên vì lý do bảo mật.)
Chuỗi thời gian chứa đựng những ngoại lệ khá rõ ràng trong cốt truyện của chuỗi thời gian.
Thay thế từng giá trị bất thường tại “thời điểm” 63, 106 và 129 bằng giá trị nhiều
giá trị điển hình hơn là 35 ngày.
(a) Sử dụng mô hình MA (2) để dự báo mười giá trị tiếp theo của chuỗi đã sửa đổi này.

(b) Lập đồ thị chuỗi, dự báo và giới hạn 95% dự báo, và giải thích kết quả.
9.23 Chuỗi thời gian trong rô bốt tệp dữ liệu đưa ra vị trí cuối cùng theo “hướng x”
sau khi một robot công nghiệp đã hoàn thành một tập hợp các bài tập theo kế hoạch. Các
ments đo được biểu thị bằng độ lệch so với vị trí mục tiêu. Robot được đưa qua
tập hợp các bài tập đã được lên kế hoạch này với hy vọng rằng hành vi của nó có thể lặp lại và do đó

có thể đoán trước được.

(a) Sử dụng mô hình IMA (1,1) để dự báo năm giá trị phía trước. Đạt được 95% dự báo
cũng có giới hạn.

(b) Hiển thị các dự báo, giới hạn dự báo và giá trị thực tế trong biểu đồ và xem trước
kết quả.
(c) Bây giờ, hãy sử dụng mô hình ARMA (1,1) để dự báo trước năm giá trị và đạt được 95%

giới hạn dự báo. So sánh những kết quả này với những kết quả thu được trong phần (a).

9.24 Phụ lục 9.4 trên trang 206 hiển thị các dự báo và giới hạn dự báo 95% cho
căn bậc hai của sự phong phú thỏ Canada. Dữ liệu nằm trong tệp có tên hare.
Sản xuất một cốt truyện tương tự trong điều kiện gốc. Đó là, vẽ đồ thị giá trị phong
phú ban đầu cùng với bình phương của các dự báo và bình phương của giới hạn dự báo.
9.25 Xem xét phương tiện theo mùa cộng với mô hình xu hướng thời gian tuyến tính cho logarit của
chuỗi thời gian phát điện hàng tháng trong Bài tập 9.8. (Dữ liệu có trong
tệp có tên là điện.)
(a) Tìm các dự báo trong hai năm và các giới hạn dự báo trong điều kiện ban đầu. Đó là, triển lãm

xác định (antilog) các kết quả thu được trong Bài tập 9.8.
(b) Lập đồ thị năm năm cuối cùng của chuỗi thời gian gốc cùng với hai năm
dự báo và giới hạn dự báo 95%, tất cả đều ở dạng nguyên bản. Diễn giải cốt truyện.
Machine Translated by Google

218 Dự báo

Phụ lục E: Kỳ vọng có Điều kiện

Nếu X và Y có pdf chung f (x, y) và chúng ta biểu thị pdf biên của X bằng f (x), thì
pdf có điều kiện của Y cho trước X = x được đưa ra bởi

fxy ,()
-------------- =
f () yx
f x ()

Đối với một giá trị nhất định của x, pdf có điều kiện có tất cả các thuộc tính thông thường của pdf.

Theo mệnh giá, kỳ vọng có điều kiện của Y cho trước X = x được định nghĩa là

EYX () = x = yf yx () yd
∞ –∞
Là một giá trị hoặc giá trị trung bình mong đợi, kỳ vọng có điều kiện của Y cho trước X = x có tất cả

các thuộc tính thông thường. Ví dụ,

E (aY bZ+ c+ )X = x = aE YX () = x + bE ZX () = xc + (9.E.1)

EhY [() X = x ] = yf yx () xd (9.E.2)


∞ –∞
Ngoài ra, một số thuộc tính mới phát sinh:

EhX []
() X = x = h x () (9.E.3)

Nghĩa là, với X = x, biến ngẫu nhiên h (X) có thể được coi như một hằng số h (x). Hơn
nói chung là,

, ( X = x = EhxY (),
EhXY ([)] X = x) (9.E.4)

Nếu chúng ta đặt EYX () = x = g x () , thì g (X) là một biến ngẫu nhiên và chúng ta có thể coi
E [g (X)]. Có thể cho thấy rằng

EgX [] () = E Y ()

thường được viết là

EEYX ([] ) = E Y () (9.E.5)

Nếu Y và X độc lập, thì

EYX ( ) = E Y () (9.E.6)

Phụ lục F: Dự đoán lỗi bình phương trung bình tối thiểu

2
. chúng ta là đặt trước Y
Giả sử Y là một biến ngẫu nhiên với μY trung bình và phương sai Nếu đối tượng của
σY
chỉ sử dụng một hằng số c, thì lựa chọn tốt nhất cho c là gì? Rõ ràng, trước tiên chúng ta phải xác định

tốt nhất. Một tiêu chí phổ biến (và thuận tiện) là chọn c để thu nhỏ bình phương trung bình
lỗi dự đoán, nghĩa là, để giảm thiểu

2 = [(EYg cc )()- ]
Machine Translated by Google

Phụ lục F: Dự đoán lỗi bình phương trung bình tối thiểu 219

Nếu chúng ta mở rộng g (c), chúng ta có

g c ()= E Y2 () - 2cE Y ()+ c2

Vì g (c) là bậc hai trong c và mở lên trên, giải g '() c 0 = sẽ sản xuất
yêu cầu tối thiểu. Chúng ta có

g '() c = - 22E Y () + c

sao cho c tối ưu là


c EY = ()
= μ (9.F.1)

Cũng lưu ý rằng

2 2
min g c ()= E Y () - μ = σY (9.F.2)
–∞ << c ∞

Bây giờ hãy xem xét tình huống có sẵn biến ngẫu nhiên thứ hai X và chúng ta

muốn sử dụng giá trị quan sát của X để giúp dự đoán Y. Cho ρ = Corr (X, Y). Đầu tiên, chúng
tôi đặt ra, để đơn giản, chỉ các hàm tuyến tính a + bX mới có thể được sử dụng để dự đoán. Các
sai số bình phương trung bình sau đó được đưa ra bởi

gab ,() = EY a -) - bX 2 (

và mở rộng chúng tôi đã cung cấp

gab (), = E Y2 ()+ a2


+ b2E X2 -()2aE Y () + abE X
2 () - 2bE XY ()

Đây cũng là bậc hai trong a và b và mở ra phía trên. Do đó, chúng ta có thể tìm ra điểm của bà
mẹ nhỏ bằng cách giải đồng thời các phương trình tuyến tính gab (), và ⁄ a 0 = ,gab () =⁄ b0.
Chúng ta có

gab (), ⁄ a = + 2a -2E Y () 2 bE X () = 0

gab -(), ⁄ b +
2E ()
XY = 2aEX2X ()
2bE
() = 0

mà chúng tôi viết lại là

a EX + ( ) b = E Y ()

E X ( ) a EX2 + ( ) b = EXY

Nhân phương trình đầu tiên với E (X) và trừ đi hiệu suất

b = ==E XY () - E X ( ) E Y ()
------ Cov XY (), σY
ρ (9.F.3)
---------------------------------------------- -------------------------

- 2
E X2 () [ ] E X () Var X () σX
sau đó

= = -
σY
a EY ( ) - bE X () μY ρ ------ (9.F.4)
μX σX
^
Y cho là dự đoán sai số bình phương trung bình nhỏ nhất của Y dựa trên tuyến tính
Nếu chúng ta
chức năng của X, sau đó chúng ta có thể viết

^ σY σY
Y = μY ρ
------ μX
+ ρ ------ X (9.F.5)
- σX μX σX

hoặc
Machine Translated by Google

220 Dự báo

^
Y
μY - X μX -
--------------- = ---------------
ρ (9.F.6)
σY σX
Xét về các biến tiêu chuẩn hóa và Y^ * X * , chúng tôi chỉ đơn giản là Y^ * ρX * = .

Ngoài ra, bằng cách sử dụng các Công thức (9.F.3) và (9.F.4), chúng tôi thấy

min gab () σ, () - Y
2 1 ρ2 = (9.F.7)

cung cấp bằng chứng rằng 1 ≤ ρ ≤ +1 vì g (a, b) ≥ 0.


Nếu chúng ta so sánh Phương trình (9.F.7) với Phương trình (9.F.2), chúng ta thấy rằng giá trị nhỏ nhất

sai số bình phương trung bình thu được khi chúng ta sử dụng hàm tuyến tính của X để dự đoán Y được giảm đi

hệ số 1 - ρ2 so với hệ số thu được bằng cách bỏ qua X và chỉ đơn giản sử dụng dấu hiệu μY cho

dự đoán của chúng tôi.


Bây giờ chúng ta hãy xem xét vấn đề tổng quát hơn là dự đoán Y với một
chức năng của X. Một lần nữa, tiêu chí của chúng tôi sẽ là giảm thiểu sai số bình phương trung bình

của hành động trước. Chúng ta cần chọn hàm h (X), giả sử, hàm này tối thiểu hóa

EY hX -[]
()
2 (9.F.8)

Sử dụng phương trình (9.E.5), chúng ta có thể viết như sau

EY hX ()]
[- = ({-2 ()]
EE Y hX [
2 } X) (9.F.9)

Sử dụng Công thức (9.E.4), kỳ vọng bên trong có thể được viết dưới dạng

EY 2 hX
{ [- ()] } X = x EY
2 hx
= {[- ()] } X = x (9.F.10)

Với mỗi giá trị của x, h (x) là một hằng số và chúng ta có thể áp dụng kết quả của Công thức (9.F.1) cho

phân phối có điều kiện của Y cho trước X = x. Do đó, với mỗi x, lựa chọn tốt nhất của h (x) là

h x () = EYX () = x (9.F.11)

Vì sự lựa chọn h (x) này giảm thiểu kỳ vọng bên trong trong Công thức (9.F.9), nó phải
cũng cung cấp mức tối thiểu tổng thể của Công thức (9.F.8). Như vậy

h X () = EYX () (9.F.12)

là công cụ dự đoán tốt nhất về Y trong tất cả các chức năng của X.

Nếu X và Y có phân phối chuẩn hai biến, người ta biết rằng

σY
EYX () μY ------
ρ X μX + = () -
σX
sao cho các nghiệm đã cho trong phương trình (9.F.12) và (9.F.5) trùng nhau. Trong trường hợp này,

dự báo tuyến tính là tốt nhất trong tất cả các chức năng.

Nói chung hơn, nếu Y được dự đoán bởi một hàm của X1, X2,…, Xn, thì nó có thể là
dễ dàng lập luận rằng công cụ dự đoán lỗi bình phương tối thiểu được đưa ra bởi

( EYX1 X2 … Xn ) ,,, (9.F.13)


Machine Translated by Google

Phụ lục G: Quy trình tuyến tính rút gọn 221

Phụ lục G: Quy trình tuyến tính rút gọn

Giả sử {Yt } thỏa mãn mô hình ARIMA (p, d, q) tổng quát với đa thức đặc trưng
AR φ (x), đa thức đặc trưng MA θ (x) và số hạng không đổi θ0. Sau đó, cắt ngắn
biểu diễn quy trình tuyến tính cho {Yt } được đưa ra bởi

Yt l + Ct () l It + = () l với l ≥ 1 (9.G.1)

ở đâu
l 1–
cho l ≥ 1 (9.G.2)
Nó () l = ψj et l - + j
j 0 =

d r pi 1–
= tôi
j (9.G.3)
Ct () l Ai l + Bij l Gi () l
tôi 0 = tôi 1 = j 0 =

và Ai, Bi j, i = 1, 2,…, r, j = 1, 2,…, pi , là hằng số trong l và chỉ phụ thuộc vào Yt,
Yt - 1,…. † Như mọi khi, trọng số ψ được xác định bởi danh tính

φ () x (1 - x ) ( d 1 +ψ1x
+ 2ψ2x
… =) θ+ () x (9.G.4)

hoặc

(ϕ () x )1 ++ + 2
ψ1x … = θ () x
ψ2x (9.G.5)

Chúng tôi sẽ chứng minh rằng biểu diễn được đưa ra bởi Công thức (9.G.1) là hợp lệ bằng cách lập luận

rằng, đối với t cố


Ct ()định,
l về cơ bản là hàm bổ sung của phương trình xác định khác
biệt, nghĩa là,

- - - cho l ≥ 0
Ct () ϕ l 1Ct () ϕ l 1– () l-…
2–ϕp d + Ct () l - p -2Ct
d θ0 = (9.G.6)

và điều đó là một giải pháp cụ thể (không có θ0):


Nó () l

- - -
Nó () ϕ l 1 Nó () ϕ l 1– 2 Nó () () l 2– -… ϕp d + Nó l - p - d
(9.G.7)
= e - - - -
t + l θ1et l 1– + θ2et l 2– + … Θqetlq - + cho l> q

Vì Ct () l chứa p + d hằng số tùy ý ( A và B), tính tổng Ct () l và

Nó () l mang lại nghiệm tổng quát của phương trình ARIMA. Các giá trị cụ thể cho điểm A và
B sẽ được xác định bởi các điều kiện ban đầu trong quá trình {Yt }.
Chúng tôi lưu ý rằng Ad không tùy tiện. Chúng ta có

θ0
Quảng cáo
= ------------------------------------------------- -----------

-
(9.G.8)
(1 φ1 φ2 - -… φpd!
) -

Chứng minh rằng Ct () l như được đưa ra bởi Công thức (9.G.2) là hàm bổ sung và
thỏa mãn Công thức (9.G.6) là kết quả tiêu chuẩn từ lý thuyết về phương trình sai phân

† Tính chất duy nhất của Ct (l) mà chúng ta cần là nó chỉ phụ thuộc vào Yt , Yt - 1,….
Machine Translated by Google

222 Dự báo

(xem, ví dụ, Goldberg, 1958). Chúng tôi sẽ chỉ ra rằng giải pháp cụ thể Nó () l
được xác định bởi Phương trình (9.G.2) thỏa mãn Phương trình (9.G.7).

Để thuận tiện cho việc ký hiệu, chúngϕjta đặt = 0 cho j > p + d. Xem xét phía bên trái
của phương trình (9.G.7). Nó có thể được viết là:

+ ++ l 1– +
( ψ0e t + l ψ1e
-
( ϕ1 ψ0e t
+
ψ1e t l 2– +
+…
t )… Ψl 1– et 1+ l 1– +

+ -
(9.G.9)
ψl 2– et 1+ t )
l --…
p -ϕp
+ dd + ψ ( 0e

+ ψ1e + + t )
l - p - 1 d - + … Ψl - p - 1 d - et 1+

Bây giờ nhóm các thuật ngữ et phổ biến lại với nhau và chọn ra các hệ số của chúng, chúng tôi thu được

Hệ số et + l - 1 : ψ0
Hệ số et + l - 2 : ψ1 ϕ1ψ0 -
Hệ số et + l - 3 : ψ2. ϕ1ψ1 - ϕ2ψ0 -
.
.
: - - - -
Hệ số et + 1 ψl 1– ϕ1ψl 2– ϕ2ψl 3– … P d + ψl - p - 1 d -
Nếu l> q, chúng ta có thể ghép các hệ số này với các hệ số tương ứng trên
vế phải của phương trình (9.G.7) để thu được các mối quan hệ

ψ0 1 =

ψ1 ϕ1ψ0 - θ1 - =

ψ2 ϕ1ψ1 - ϕ2ψ0 - θ2 - =
.
. (9.G.10)
.
- - -
ψq ϕ1ψq 1– ϕ2ψq 2– … Φqψ0 - θq - =
- - - -
ψl 1– ϕ1ψl 2– ϕ2ψl 3– … P d + ψl - p - 1 d - = 0 cho l> q

Tuy nhiên, bằng cách so sánh các mối quan hệ này với Phương trình (9.G.5), chúng ta thấy rằng
Phương trình (9.G.10) chính xác là các phương trình xác định các trọng số và do đó Phương trình
(9.G.7) được thiết lập theo yêu cầu.

Phụ lục H: Mô hình không gian trạng thái

Các kỹ sư lý thuyết điều khiển đã phát triển và sử dụng thành công cái gọi là không gian trạng thái

mô hình và lọc Kalman kể từ khi Kalman xuất bản công trình đầu tiên của mình vào năm 1960.
Các tài liệu tham khảo gần đây bao gồm Durbin và Koopman (2001) và Harvey et al. (2004).

Hãy xem xét một quy trình ARMA (p, q) tổng quát cố định và có thể đảo ngược {Zt }. Đặt m =
max (p, q + 1) và xác định trạng thái của quá trình tại thời điểm t là vectơ cột Z ( ) t của
chiều dài m có phần tử thứ j là dự báo cho Z j^ ( =) j 0, 1, 2,…, m - 1, dựa trên Zt ,
Zt - 1,…. Lưu ý rằng phần tử dẫn của Z ( ) t chỉ là = ZtZ ^.() 0

Nhớ lại phương trình cập nhật (9.6.1) trên trang 207, trong ngữ cảnh hiện tại có thể
Machine Translated by Google

Phụ lục H: Mô hình không gian trạng thái 223

được viết
^ ^
Z t 1+ () l= Z t ()
+ l et 1+
ψ l 1+ (9.H.1)

Chúng ta sẽ sử dụng biểu thức này trực tiếp cho l = 0, 1, 2,…, m - 2. Với l = m - 1, chúng ta có

^ ^
Z t 1+ () m 1– Z+ = t () ψ m m 1– et 1+
^ ^ ^ (9.H.2)
=
φ1Z t () φ m +1– 2Zt()… Φ m ++
2– pZ t () ψ mp - +m 1– et 1+

trong đó biểu thức cuối cùng xuất phát từ Công thức (9.3.34) trên trang 200, với μ = 0.
Công thức ma trận của các phương trình (9.H.1) và (9.H.2) liên Z ()
1+ tZ ( đến
) t
quan và
et 1+ ,của
được gọiAkaike),
là phương
là trình trạng thái (hoặc biểu diễn Markovian
đưa ra như

Z () + = ( ) t Nhận 1+
t 1+ FZ (9.H.3)

ở đâu

0100… 0
0010… 0
0001… 0
F = . (9.H.4)
.
.
0000… 1

φm φm 1– ... φ1

ψ1

G = (9.H.5)
ψ2
.
.
.
ψm 1–

với
φj 0 = cho j > p. Lưu ý rằng tính đơn giản của Phương trình (9.H.3) thu được ở
chi phí phải đối phó với các quy trình có giá trị véc tơ. Vì lation formu không gian
trạng thái cũng thường cho phép sai số đo, chúng tôi không quan sát trực tiếp Zt mà chỉ
quan sát Yt thông qua phương trình quan sát

Yt t
HZ+ ()
= ε t (9.H.6)

trong đóH = [1, 0, 0,…, 0] và phần


εt {} là một quá trình tiếng ồn trắng không trung bình khác gây ra
lõm của et {} .
2 Trường
0 = hợp đặc biệt không có sai số đo đạt được bằng cách đặt εt 0 = Trong
Phương trình (9.H.6). Tương tự, trường hợp này thu được bằng cách lấy σε tiếp theo
các phương trình. Các mô hình không gian trạng thái tổng quát hơn,cho ,và để
phép FGHtổng quát hơn, tạo dáng

điệu đà cũng tùy thuộc vào thời gian.


Machine Translated by Google

224 Dự báo

Đánh giá chức năng khả năng xảy ra và lọc Kalman


Đầu tiên một định nghĩa: Ma trận hiệp phương sai cho vectơ biến ngẫu nhiên X của

dimen sion n × 1 được định nghĩa là ma trận n × n có phần tử thứ i là hiệp phương sai giữa
thành phần thứ i và thứ j của X.
Nếu Y = AX + B, thì dễ dàng chỉ ra rằng ma trận hiệp phương sai của Y là AVAT,
trong đó V là ma trận hiệp phương sai của X và chỉ số trên T biểu thị sự chuyển vị của ma trận.

Quay lại bộ lọc Kalman, chúng tôi đặt Z () biểu


t + 1 | thị
t vectơ m × 1 có

Y1 thành phần thứ j là][ cho


E Z ^
t 1+ ,,
j (= )0,j 1,
| Yt
2,…,
Yt m1–- …1. Tương tự, cho

t ( ) j |,,
E Z ^
Z () t | t là vectơ có thành phần thứ j là [2,…, Yt Yt 1– … Y1 ] cho j = 0, 1,
m - 1.
Sau đó, vì et + 1 độc lập với Zt , Zt - 1,… và do đó cũng với Yt , Yt - 1,…, chúng tôi
xem từ Công thức (9.H.3) rằng
Z ()
t + 1 | t = FZ ( ) t | t (9.H.7)

-
| t Cũng đặt P ttrận
ma() +
là1 hiệp phương sai cho “sai số dự báo” t 1+ Z () t + 1

Z ()
| t và
P ()là
t |ma
t Z trận
( ) t -hiệp
Z () tphương
| t sai cho "sai số dự báo" mà chúng ta có ,
từ Công thức (9.H.3)

+ 1t | t =F P []()
P () t | t FT + σe2GGT (9.H.8)

Từ phương trình quan sát (Phương trình (9.H.6)) và sau đó thay t + 1 bởi t,

Y t ()) + 1 | t = HZ ( t + 1 | t (9.H.9)

ở đâu Y t t(=E ()
Yt +1+1 || Yt Yt 1– ,,
… Y1 )
.
Bây giờ có thể chỉ ra rằng các mối quan hệ sau đây giữ nguyên (ví dụ, xem Har
vey, 1981c):

t 1[ |t t
Z ())
=
1+Z -( Ytt +(]1 | t K +() + 1 | t
1+ 1Yt++) (9.H.10)

ở đâu

= 2
K ()
1+ tP ()) t + 1 | t HT[HP ( t + 1 | t HT 1–σε] + (9.H.11)


P ())
t + 1t | 1+
( ())
t=+ 1Pt| 1+
t - KHP
( t( + )1 | t (9.H.12)

Gọi chung, các Phương trình (9.H.10), (9.H.11) và (9.H.12) được gọi là Kalman
lọc các phương trình. Số lượng

- 1+
errt 1+ Yt = Y t () + 1 | t (9.H.13)

trong Công thức (9.H.10) là sai số dự đoán và độc lập với (hoặc ít nhất là không
liên quan đến) các quan sát trong quá khứ Yt , Yt - 1,…. Vì chúng tôi cho phép đo lường
lỗi, lỗi 1+ et
nói
1+chung không giống như .
Từ phương trình (9.H.13) và (9.H.6), chúng ta có

= = 2
vt 1+ Var (errt 1+ ) HP ( )t + 1 | t HT + σε (9.H.14)
Machine Translated by Google

Phụ lục H: Mô hình không gian trạng thái 225

Bây giờ hãy xem xét hàm khả năng cho chuỗi quan sát Y1, Y2,…, Yn. Từ
định nghĩa của hàm mật độ xác suất có điều kiện, chúng ta có thể viết

= , ) (, f y1 , ,
y2 …
) yn
,,,()
f (
ynf |y1,
y1,y2
y2… …yn
yn1–
1–

hoặc, bằng cách ghi nhật ký,

=
log( f y1
yn y2
) ,,,
… log ( f y1, ,y2 …, yn 1– ) + logf () , … ,yn 1–
yn | y1, y2 (9.H.15)

Giả sử bây giờ chúng ta đang xử lý các bản phân phối bình thường, tức là, et {} và

εt {} là các quá trình nhiễu trắng bình thường. Khi đó, biết rằng phân phối Yn con |
phân số trên Y1 = y1, Y2 = y2,…, Yn - 1 cũng= bình
yn - thường
1, với trung bình y n () và n 1–
phương sai vn. Trong phần còn lại của phần này và phần| tiếp
n 1– theo, chúng tôi viết y n () cho
giá trị quan sát của Y n () | n 1– Số hạng thứ hai ở bên phải của phương trình
(9.H.15) sau đó có thể được viết

1 1 1 yn [- y n ()]| n 1– 2
, … ,yn 1– = - --log2π - -
log vn
- - -------------------------------------------
log f()
yn | y1, y2 2 2 2
vn

Hơn nữa, số hạng đầu tiên ở vế phải của phương trình (9.H.15) có thể là
bị phân hủy tương tự lặp đi lặp lại cho đến khi chúng ta có

log( f y1 = , , (9.H.16)
yn y2
) ,,,
… log () ffy1
yt+|log
y1,()
y2 … yt 1–
t 2 =

sau đó trở thành phân tích lỗi dự đoán của khả năng xảy ra, cụ thể là

N N
N 1 1 - y t ()|yt t[] 1– 2
= - --log2π - -
log… ()
yn ,,, f y1 y2 (9.H.17)
---------------------------------------

2 - 2 vt - 2
t 1 = t 1 = vt

với và v1 1=| Var


y () 0 0 =(Y1).

Chiến lược tổng thể để tính toán khả năng xảy ra đối với một tập hợp các giá trị
tham số nhất định là sử dụng các phương trình lọc Kalman để tạo ra đệ quy các lỗi dự đoán và
phương sai của chúng và sau đó sử dụng phép phân tích lỗi dự đoán của khả năng xảy ra func Z ()

sự. Chỉ còn lại một điểm: Chúng ta cần các giá trị ban đầu0 và
| 0đểP bắt
() 0đầu
| 0các sions định kỳ.

Ma trận hiệp phương sai trạng thái ban đầu

Vectơ trạng thái ban đầu sẽ là một


Z ()vectơ
0 | 0gồm các số không cho quá trình có giá trị trung bình bằng 0, và

P () 0 | 0 là ma trận hiệp phương là


^ Z () 0 - Z^() 0 | 0 = Z () 0. Bây giờ, vì Z () 0
sai cho vectơ cột có các phần tử
[ , ,
Z0 0Z , ()… 1 Z, 0 () m 1– ] nó là cần thiết để chúng tôi đánh giá
ăn
^
^ 0 ( ) ,i Z0 (
Cov Z [ ) j ] cho ij , = 0 1 ,,,… m 1–

^ Từ dạng quy trình tuyến tính được rút gọn, Phương trình (9.3.35) trên trang 200 với Ct () l
= Z () l, chúng ta có thể viết, cho j > 0
t
Machine Translated by Google

226 Dự báo

^ –1

Zj Z+ = 0 ()
j ψ
(9.H.18)
jk + e – k
k j - =

Nhân phương trình (9.H.18) với Z0 và lấy các giá trị kỳ vọng sẽ thu được kết quả

^
= = Z
[ ^ 0 () 0( Z ) ( ) j ] (9.H.19)
γj E Z0Zj () E 0
đối với j ≥ 0

Bây giờ nhân Phương trình (9.H.18) với chính nó với j được thay thế bởi i và nhận các giá trị mong đợi.

Nhắc lại rằng các e độc lập với Z trong quá khứ và giả sử 0 < i ≤ j, chúng ta thu được

^ tôi 1–
= 2
Cov Z [
^ 0 ( ) ]i Z
σ,(
0
+
) j
e
(9 giờ 20)
γj tôi - ψkψkji - +
k 0 =

Kết hợp các phương trình (9.H.19) và (9.H.20), chúng tôi có các phần tử bắt buộc của
P () 0 | 0

γi 0 = ijm ≤ ≤ 1–
^
^ 0 ( ) ,i Z0 (
Cov Z [ ) j ] = tôi 1– (9.H.21)
- 2
1 ≤≤≤ ijm 1–
γj tôi - σe ψkψkji - +
k 0 =

trong đó trọng số ψ thu được từ đệ quy của Phương trình (4.4.7) trên trang 79,
và γk , hàm tự thay đổi cho quá trình {Zt }, nhận được như trong Phụ lục C
trên trang 85.
Phương sai σe 2 2
có thể được loại bỏ khỏi vấn đề bằng cách chia cho. 2 Các
σε σe
phương sai sai dự đoán vt sau đó được thay thế bằng khả năng xảy ra trong log của Phương trình
σe 2vt
2 1Công
(9.H.17), và chúng tôi đặt trong = thức (9.H.8). Bỏ các hằng số không cần thiết, chúng tôi nhận được
σe
khả năng nhật ký mới

yt [ - y t ()]| t 1– 2
N
l + ---------------------------------------
(9.H.22)
= log)σe 2vt (

t 1 = vt

có thể được giảm thiểu về mặt phân tích đối với. Chúng tôi2 đạt được
σe

N yt [- y t ()]| t 1– 2
---------------------------------------
(9.H.23)
2 σe =
t 1 = σe 2vt

Thay thế điều này trở lại vào Công thức (9.H.22), bây giờ chúng ta thấy rằng

N N | ()]
yt [- y t t 1– 2
l ---------------------------------------
(9.H.24)
= log vt n
+ log
t 1 = t 1 = vt

phải được tối thiểu hóa bằng số đối với φ1, φ2,…, φp, θ1, θ2,…, θq, và
2 . Chức năng
2 . Sau khi làm như vậy, chúng tôi quay lại Công thức (9.H.23) để ước tính σe σe
được xác định bởi Công thức (9.H.24) đôi khi được gọi là khả năng log tập trung
hàm số.
Machine Translated by Google

CHƯƠNG 10

CÁC MÔ HÌNH MÙA

Trong Chương 3, chúng ta đã thấy các xu hướng xác định theo mùa có thể được mô hình hóa như thế nào. Tuy nhiên, trong

nhiều lĩnh vực trong đó chuỗi thời gian được sử dụng, đặc biệt là kinh doanh và kinh tế,

giả định về bất kỳ xu hướng xác định nào là khá đáng ngờ mặc dù các xu hướng có tính chu kỳ

rất phổ biến trong các loạt phim như vậy.

Đây là một ví dụ: Mức độ carbon dioxide (CO2) được theo dõi tại một số địa điểm

trên khắp thế giới để điều tra những thay đổi của khí quyển. Một trong những địa điểm nằm ở Alert, North

West Territories, Canada, gần Vòng Bắc Cực.

Biểu đồ 10.1 trình bày mức CO2 hàng tháng từ tháng 1 năm 1994 đến tháng 12 năm 2004. Có một xu hướng

tăng mạnh nhưng cũng có tính thời vụ có thể thấy rõ hơn ở

chi tiết hơn trong Phụ lục 10.2, trong đó chỉ vài năm gần đây được lập biểu đồ bằng cách sử dụng hàng tháng

biểu tượng âm mưu.

Biểu đồ 10.1 Mức độ carbon Dioxide hàng tháng tại Alert, NWT, Canada

CO2

380
365
350

1994 1996 1998 2000 2002 2004

Thời gian

> dữ liệu (co2)

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> plot (co2, ylab = 'CO2')

227
Machine Translated by Google

228 Mô hình theo mùa

Như chúng ta thấy trong màn hình, mức carbon dioxide cao hơn trong mùa đông
tháng và thấp hơn nhiều vào mùa hè. Các mô hình theo mùa xác định như theo mùa

có nghĩa là cộng với xu hướng thời gian tuyến tính hoặc tổng của các đường cong cosine ở các tần số khác nhau cộng với tuyến tính

xu hướng thời gian như chúng ta đã điều tra trong Chương 3 chắc chắn có thể được xem xét ở đây. Nhưng chúng tôi

khám phá ra rằng các mô hình như vậy không giải thích hành vi của chuỗi thời gian này. Đối với loạt bài này

và nhiều người khác, có thể chỉ ra rằng phần dư từ phương tiện theo mùa cộng với tuyến tính
Mô hình xu hướng thời gian rất tự động tương quan với nhau ở nhiều độ trễ. † Ngược lại, chúng ta sẽ thấy rằng

các mô hình theo mùa ngẫu nhiên được phát triển trong chương này hoạt động tốt cho loạt bài này.

Biểu thị 10.2 Mức độ carbon Dioxide với các ký hiệu hàng tháng

MA MJ JFM AMJ D
D
DJF N N
JFMAM J
CO2

FMAM JFMAM J
J D N J J
J D N O
O
N J O
O J O BẰNG
BẰNG

J
380
375
370
365
360
S
S Một

Một
BẰNG

2000 2001 2002 2003 2004 2005

Thời gian

> plot (window (co2, start = c (2000,1)), ylab = 'CO2')


> Tháng = c ('J', 'F', 'M', 'A', 'M', 'J', 'J', 'A', 'S', 'O', 'N', ' D ')
> điểm (cửa sổ (co2, bắt đầu = c (2000,1)), pch = Tháng)

10.1 Mô hình ARIMA theo mùa

Chúng tôi bắt đầu bằng cách nghiên cứu các mô hình tĩnh và sau đó xem xét các khái quát hóa không tĩnh

trong Mục 10.3. Chúng ta đặt s biểu thị khoảng thời gian theo mùa đã biết; cho chuỗi hàng tháng s = 12

và đối với chuỗi hàng quý s = 4.


Xem xét chuỗi thời gian được tạo theo

- =
Yt et Θet - 12

Thông báo rằng

, 1– )
( Yt = -
( Θet - 12 , et 1– Θet - 13 )
-
Cov Yt Cov et

0 =

nhưng điều đó

† Chúng tôi yêu cầu bạn xác minh điều này trong Bài tập 10.8.
Machine Translated by Google

10.1 Mô hình ARIMA theo mùa 229

, - 12 ) =
( Yt
Cov Yt
-
Cov (et Θet - 12, et - 12 Θet - 24 )
-

- = 2
Θσe

Dễ dàng nhận thấy rằng một chuỗi như vậy là đứng yên và có tự tương quan khác không chỉ tại
độ trễ 12.

Tổng quát những ý tưởng này, chúng tôi xác định mô hình MA (Q) theo mùa của thứ tự Q với

chu kỳ sóng biển s bằng

= - - - -
(10.1.1)
Yt et Θ1et s - Θ2et - 2 giây … ΘQet Qs -

với đa thức đặc trưng MA theo mùa

= - -
(10.1.2)
Θ () x 1 Θ1xs - Θ2x2s - … ΘQxQs

Rõ ràng là một chuỗi như vậy luôn đứng yên và hàm tự tương quan
sẽ chỉ là nonzero ở độ trễ theo mùa là s, 2s, 3s,…, Qs. Đặc biệt,

Θk - + Θ1Θk 1+ Θ2Θk + ++ 2+
… ΘQ k - ΘQ
= = 1 2 ,,,… Q (10.1.3)
ρks 2 2 2
-------------------------------------------------- -------------------------------------------------- --------- cho k

1 Θ1+ + ++ Θ2 … ΘQ

(So sánh điều này với Công thức (4.2.5) trên trang 65 cho quá trình MA trái mùa.)
mô hình khả nghịch, các gốc của Θ (x) = 0 đều phải vượt quá 1 về giá trị tuyệt đối.
Điều hữu ích cần lưu ý là mô hình MA (Q) theo mùa cũng có thể được xem như một mô hình đặc biệt

trường hợp của một mô hình MA phi mùa có thứ tự q = Qs nhưng với tất cả các giá trị θ bằng không ngoại trừ tại

độ trễ theo mùa s, 2s, 3s,…, Qs.


Các mô hình tự phục hồi theo mùa cũng có thể được xác định. Xem xét

=
Yt ΦYt - 12 et + (10.1.4)

ở đâu | Φ | <1 và et độc lập với Yt - 1, Yt - 2,…. Có thể chỉ ra rằng | Φ | <1
đảm bảo tính ổn định. Do đó có thể dễ dàng lập luận rằng E (Yt) = 0; nhân phương trình
(10.1.4) theo Yt - k , lấy kỳ vọng và chia cho γ0 thu được
= cho k ≥ 1 (10.1.5)
ρk Φρk - 12

Rõ ràng
== = =
ρ12 Φρ0 Φ và ρ24 Φρ12 Φ2

Nói chung,

ρ12k Φk = = đối với k 1 2,,… (10.1.6)

Hơn nữa, đặt k = 1 và sau đó k = 11 trong Công thức (10.1.5) và sử dụng ρk = ρ k cho
chúng ta

= =
ρ1 Φρ11 và ρ11 Φρ1

điều này ngụ ý rằng ρ1 = ρ11 = 0. Tương tự, người ta có thể chỉ ra rằng ρk = 0 ngoại trừ độ
Ở những độ trễ đó, hàm tự tương quan phân rã theo từng thời
trễ sonal ở biển 12, 24, 36,….
điểm giống như mô hình AR (1).
Machine Translated by Google

230 Mô hình theo mùa

Với ví dụ này, chúng tôi xác định mô hình AR (P) theo mùa của thứ tự P và
thời kỳ theo mùa bởi

=
Yt Φ1Yt + -
s - Φ2Yt ++2 +giây et (10.1.7)
… ΦPYt Ps -

với đa thức đặc trưng theo mùa

- = - -
Φ () x 1 Φ1xs Φ2x2s - … ΦPxPs (10.1.8)

Như mọi khi, chúng tôi yêu cầu et phải độc lập với Yt - 1, Yt - 2,… và, đối với tính ổn định, điều đó

các nghiệm nguyên của Φ (x) = 0 lớn hơn 1 về giá trị tuyệt đối. Một lần nữa, Công thức (10.1.7) có thể là

được xem như một mô hình AR (p) đặc biệt của bậc p = Ps với hệ số khác không chỉ ở
độ trễ theo mùa s, 2s, 3s,…, Ps.
Có thể chỉ ra rằng hàm tự tương quan khác không chỉ ở độ trễ s, 2s, 3s,
…, trong đó nó hoạt động giống như sự kết hợp của cấp số nhân đang phân rã và hàm hàm func
sin giảm xóc. Đặc biệt, các Công thức (10.1.4), (10.1.5) và (10.1.6) dễ dàng tổng quát hóa thành
mô hình AR (1) theo mùa chung để cung cấp

ρks Φk = = cho k 1 2,… (10.1.9)

với độ tương quan bằng không ở các độ trễ khác.

10.2 Mô hình ARMA theo mùa đa số

Hiếm khi chúng ta cần các mô hình chỉ kết hợp tự tương quan ở độ trễ theo mùa.
Bằng cách kết hợp các ý tưởng về mô hình ARMA theo mùa và không theo mùa, chúng tôi có thể phát triển

các mô hình phân tích có chứa tự tương quan cho độ trễ theo mùa nhưng cũng cho mức thấp
độ trễ của các giá trị chuỗi lân cận.
Hãy xem xét một mô hình có đa thức đặc trưng MA được cho bởi

-
1 - θx 1 Θx12
(())

Nhân ra, chúng tôi đã 1 - θx Θx12 θΘx13 + - . Như vậy chuỗi thời gian tương ứng
thỏa mãn

Yt = et -θet 1– - + θΘet - 13 (10.2.1)


Θet - 12

Đối với mô hình này, chúng ta có thể kiểm tra xem hàm tự tương quan có khác không chỉ ở độ trễ 1,
11, 12 và 13. Chúng tôi nhận thấy
2
γ0 = 1 θ2
+) (1
σ +Θ2 () e (10.2.2)

θ
ρ1 --------------– =
(10.2.3)
1 θ2 +

θΘ
=
ρ11 ρ13 = -----------------------------------------
(10.2.4)
1 θ2
+) (1
+ Θ2 ()


Machine Translated by Google

10.2 Mô hình ARMA theo mùa đa số 231

Θ
ρ12 - = ----------------
(10.2.5)
1 Θ2 +

Phụ lục 10.3 hiển thị các hàm tự tương quan cho mô hình Phương trình (10.2.1)
với θ = ± 0,5 và Θ = 0,8 theo phương trình (10.2.2) - (10.2.5).

Hình 10.3 Tự tương quan từ phương trình (10.2.2) - (10.2.5)

0,6 θ = 0,5, Θ = 0,8 θ = +0,5, Θ = 0,8


0,4

0,4

ρk ρk
• • • • • • • • • •
0,0

• •
0,2

• •
0,4
0,0
• • • • • • • • • • •

1 3 5 7 9 11 13 1 3 5 7 9 11 13

Trễ k Trễ k
Tất nhiên, chúng tôi cũng có thể giới thiệu cả tự tương quan ngắn hạn và theo mùa

bằng cách xác định mô hình MA bậc 12 chỉ với θ1 và θ12 khác không. Chúng ta sẽ thấy trong
phần tiếp theo mà mô hình "số nhân" phát sinh khá tự nhiên đối với
mô hình kéo theo sự khác biệt.
Nói chung, sau đó, chúng tôi xác định mô hình ARMA theo mùa nhiều lần (p, q) × (P, Q) s
với khoảng thời gian theo mùa s như một mô hình với đa thức đặc trưng AR φ (x) Φ (x) và MA
đa thức đặc trưng θ (x) Θ (x), trong đó

- = -
φ () x 1 φ1x φ2x2 - -… φpxp
(10.2.6)
- = -
Φ () x 1 Φ1xs Φ2x2s - -… ΦPxPs

- = -
θ () x 1 θ1x θ2x2 - -… θqxq
(10.2.7)
- = -
Θ () x 1 Θ1xs Θ2x2s - -… ΘQxQs

Mô hình cũng có thể chứa một số hạng không đổi θ0. Lưu ý thêm một lần nữa rằng chúng
ta chỉ có một mô hình ARMA đặc biệt với AR bậc p + Ps và MA bậc q + Qs, nhưng các hệ số là
không hoàn toàn tổng quát, chỉ được xác định bởi các hệ số p + P + q + Q. Nếu s = 12,
p + P + q + Q sẽ nhỏ hơn đáng kể so với p + Ps + q + Qs và sẽ cho phép nhiều
mô hình phức tạp hơn.
Ví dụ khác, giả sử P = q = 1 và p = Q = 0 với s = 12. Khi đó mô hình là

Yt =ΦYt
- + - 12 et θet 1– (10.2.8)
Machine Translated by Google

232 Mô hình theo mùa

Sử dụng các kỹ thuật tiêu chuẩn của chúng tôi, chúng tôi thấy rằng

- =
2
γ1 Φγ11 θσe (10.2.9)


=
γk Φγk - 12 cho k ≥ 2 (10.2.10)

Sau khi xem xét các phương trình được ngụ ý bởi các lựa chọn khác nhau cho k, chúng tôi đi đến

1 θ2 + 2
γ0 = --------------- σe
1 Φ2 -

ρ12k Φk = cho k ≥ 1 (10.2.11)

θ
== = cho k 012 ρ12k 1– Φkρ12k 1+
--------------
,,,…
-
1 θ2 +

với tự tương quan cho tất cả các độ trễ khác bằng không.
Hình 10.4 hiển thị các hàm tự tương quan cho hai trong số các
ARIMA xử lý với chu kỳ 12: một với Φ = 0,75 và θ = 0,4, cái còn lại với Φ =
0,75 và θ = 0,4. Hình dạng của các phép tự tương quan này hơi điển hình của các hàm tự
tương quan sam sung cho nhiều chuỗi thời gian theo mùa. Chức năng tương quan tự động thậm chí
còn đơn giản hơn được cung cấp bởi Công thức (10.2.3), (10.2.4) và (10.2.5) và được hiển thị trong
Hình 10.3 dường như cũng xảy ra thường xuyên trong thực tế (có lẽ sau khi khác biệt).

Hình 10.4 Các hàm tự tương quan từ phương trình (10.2.11)

Φ = 0,75, θ = 0,4 Φ = 0,75, θ = 0,4


0,8 0,8

• •
• •
• •
0,4 0,4

ρk
• •
ρk

•• • •
•• •• •• ••
•• ••
•• ••
••
0,4
0,0 0,4
0,0 •

1 12 24 36 48 60 1 12 24 36 48 60

Trễ k Trễ k
Machine Translated by Google

10.3 Mô hình ARIMA theo mùa không cố định 233

10.3 Mô hình ARIMA theo mùa không cố định

Một công cụ quan trọng trong việc lập mô hình các quá trình thời vụ không cố định là độ chênh lệch

theo mùa. Sự khác biệt theo mùa của khoảng thời gian s cho chuỗi {Yt} được ký hiệu là sYt và được
định nghĩa là

- =
sYt Yt Yt s - (10.3.1)

Ví dụ: đối với chuỗi hàng tháng, chúng tôi xem xét các thay đổi từ tháng 1 đến tháng 1, từ
tháng 2 đến tháng 2, v.v. trong các năm tiếp theo. Lưu ý rằng đối với một chuỗi có độ dài
n, chuỗi chênh lệch theo mùa sẽ có độ dài n - s; nghĩa là, các giá trị dữ liệu của s bị mất
do sự khác biệt theo mùa.
Ví dụ về sự khác biệt theo mùa là phù hợp, hãy xem xét một thế hệ quy trình
được tạo ra theo
Yt St et + = (10.3.2)

với

St St εts +- = (10.3.3)

trong đó {et } và {εt } là chuỗi nhiễu trắng độc lập. Ở đây {St } là “cuộc dạo chơi ngẫu nhiên
theo mùa” và nếu, {Stchênh
tính } sẽ lập mô
thường
lệch quáhình
của mức một
{St }, thành
{Ytrõ nhưphần
},ràng {Yt theo
} là
đã cho mùa thay
không
trong cố đổi
Công thứcchậm.
định. Tuy σε σe chúng
nhiên,
(10.3.1), «Do
nếutính bấtta
chúng
ta thấy

= s -- et
+ et
-
sYt St _ s -
(10.3.4)
- +εt= et et s -

Một phép tính dễ dàng cho thấy rằng sYt đứng yên và có hàm tự tương quan của mô
hình MA (1) s.
Mô hình được mô tả bởi Công thức (10.2.2) và (10.2.3) cũng có thể được tổng quát hóa
để giải thích cho một xu hướng ngẫu nhiên thay đổi trái mùa, chậm chạp. Xem xét

= +St+ et
Yt Mt (10.3.5)

với

St St εts +- = (10.3.6)

Mt Mt 1– ξt + = (10.3.7)

trong đó {et }, {εt } và {ξt } là chuỗi nhiễu trắng độc lập lẫn nhau. Ở đây, chúng tôi
lấy cả chênh lệch theo mùa và chênh lệch trái mùa thông thường để thu được †

† Cần lưu ý rằng sYt trên thực tế sẽ đứng yên và sYt sẽ không thể thay đổi. Chúng
tôi sử dụng các Công thức (10.2.5), (10.2.6) và (10.2.7) chỉ để giúp thúc đẩy các mô
hình ARIMA sonal biển nhân.
Machine Translated by Google

234 Mô hình theo mùa

- + + -
( sYt= Mt Mt s - εt et et s -)
(10.3.8)
= + +
εξt
+ +)
εt -
et(-ξt
(()
+ t 1– et 1– s - et s -) et s - 1 -

Quá trình được xác định ở đây là tĩnh và có tự tương quan khác không chỉ ở độ trễ 1,
s - 1, s và s + 1, phù hợp với cấu trúc tự tương quan của phép nhân
mô hình theo mùa ARMA (0,1) × (0,1) với khoảng thời gian theo mùa s.

Những ví dụ này dẫn đến định nghĩa về các mô hình thời vụ không cố định. Một tiến trình
{Yt } được cho là một mô hình ARIMA theo mùa nhiều lần với trái mùa (thông thường)
thứ tự p, d và q, thứ tự theo mùa P, D và Q, và khoảng thời gian theo mùa s nếu sự khác biệt
loạt

= (10.3.9)
Wt d s DYt

thỏa mãn mô hình ARMA (p, q) × (P, Q) s với khoảng thời gian theo mùa s.† Chúng tôi nói rằng {Yt } là một

Mô hình ARIMA (p, d, q) × (P, D, Q) với khoảng thời gian theo mùa s.

Rõ ràng, các mô hình như vậy đại diện cho một lớp rộng rãi, linh hoạt để chọn một
mô hình thích hợp cho một chuỗi thời gian cụ thể. Thực nghiệm đã thấy rằng nhiều
sê-ri có thể phù hợp với các mô hình này, thường có một số lượng nhỏ các thông số,
nói ba hoặc bốn.

10.4 Đặc điểm kỹ thuật mô hình, lắp và kiểm tra

Đặc điểm kỹ thuật mô hình, kiểm tra sự phù hợp và chẩn đoán cho các mô hình theo mùa tuân theo
cùng các kỹ thuật chung được phát triển trong các Chương 6, 7 và 8. Ở đây, chúng tôi sẽ chỉ đơn

giản làm sáng tỏ việc áp dụng những ý tưởng này đặc biệt cho các mô hình theo mùa và chú trọng

đặc biệt đến các độ trễ theo mùa.

Đặc điểm kỹ thuật mô hình

Như mọi khi, kiểm tra cẩn thận cốt truyện của chuỗi thời gian là bước đầu tiên. Hình 10.1 trên
trang 227 hiển thị mức carbon dioxide hàng tháng ở miền bắc Canada. Xu hướng tăng
một mình sẽ dẫn chúng ta đến việc xác định một mô hình không cố định. Hình 10.5 cho thấy mẫu
hàm tự tương quan cho chuỗi đó. Các mối quan hệ tự tương quan theo mùa là
hiển thị khá nổi bật trong màn hình này. Lưu ý mối tương quan chặt chẽ ở độ trễ 12, 24, 36,
và như thế. Ngoài ra, có một mối tương quan đáng kể khác cần được mô hình hóa.

† Sử dụng ký hiệu toán tử dịch chuyển ngược của Phụ lục D, trang 106, chúng ta có thể viết chung
Mô hình ARIMA (p, d, q) × (P, D, Q) s φ (B) Φ (B) d s DYt = θ (B) Θ (B) et .
Machine Translated by Google

10.4 Đặc điểm kỹ thuật mô hình, lắp và kiểm tra 235

Hình 10.5 ACF mẫu về mức CO2

ACF

0,8
0,6
0,4
0,2

0,2

0 5 10 15 20 25 30 35

Lỗi
> acf (as.vector (co2), lag.max = 36)

Hình 10.6 cho thấy biểu đồ chuỗi thời gian của các mức CO2 sau khi chúng tôi thực hiện một sự khác biệt đầu tiên
ence.

Biểu đồ chuỗi thời gian 10.6 Biểu đồ về sự khác biệt đầu tiên của mức CO2

6
4
2
0

tiên
biệt
khác
CO2
của
đầu
Sự

1994 1996 1998 2000 2002 2004

Thời gian

> plot (diff (co2), ylab = 'First Difference of CO2', xlab = 'Time')

Xu hướng tăng chung hiện đã biến mất nhưng tính thời vụ mạnh mẽ vẫn còn
hiện tại, được chứng minh bằng hành vi thể hiện trong Phụ lục 10.7. Có lẽ cách mã hóa khác nhau theo

mùa sẽ đưa chúng ta đến một loạt phim có thể được mô phỏng theo cách phân tích.
Machine Translated by Google

236 Mô hình theo mùa

Phụ lục 10.7 ACF mẫu về sự khác biệt đầu tiên của mức CO2

0,8

0,4

ACF

0,0

0,4

0 5 10 15 20 25 30 35

Lỗi

> acf (as.vector (diff (co2)), lag.max = 36)

Hình 10.8 hiển thị biểu đồ chuỗi thời gian của các mức CO2 sau khi thực hiện cả hai lần đầu tiên

sự khác biệt và sự khác biệt theo mùa. Dường như hầu hết, nếu không phải tất cả, tính thời vụ là

Đi ngay bây giờ.

Hình 10.8 Biểu đồ chuỗi thời gian về sự khác biệt đầu tiên và theo mùa của CO2

2
1

0 3
1
2

theo
tiên
biệt
khác
CO2
của
mùa
đầu

Sự

1996 1998 2000 2002 2004

Thời gian

> plot (diff (diff (co2), lag = 12), xlab = 'Time',


ylab = 'Sự khác biệt đầu tiên và theo mùa của CO2')

Hình 10.9 xác nhận rằng rất ít tự tương quan vẫn còn trong chuỗi sau

hai sự khác biệt này đã được thực hiện. Biểu đồ này cũng gợi ý rằng một mô hình đơn giản

kết hợp tự tương quan độ trễ 1 và độ trễ 12 có thể phù hợp.

Chúng tôi sẽ xem xét việc chỉ định ARIMA nhân, theo mùa (0,1,1) × (0,1,1) 12
người mẫu
Machine Translated by Google

10.4 Đặc điểm kỹ thuật mô hình, lắp và kiểm tra 237

= - - + (10.4.10)
12 Yt et θet 1– Θet - 12 θΘet - 13

trong đó kết hợp nhiều yêu cầu này. Như thường lệ, tất cả các mô hình đều là dự kiến và
phải sửa đổi ở giai đoạn chẩn đoán xây dựng mô hình.

Hình 10.9 ACF mẫu về sự khác biệt đầu tiên và theo mùa của CO2

ACF

0,2
0,4
0,2
0,0

0 5 10 15 20 25 30 35

Lỗi

> acf (as.vector (diff (diff (co2), lag = 12)), lag.max = 36, ci.type = 'ma')

Phù hợp mô hình

Sau khi chỉ định mô hình theo mùa dự kiến cho một chuỗi thời gian cụ thể, chúng tôi tiến hành
ước tính các tham số của mô hình đó một cách hiệu quả nhất có thể. Như chúng tôi đã nhận xét
trước đó, các mô hình ARIMA theo mùa nhiều lần chỉ là các trường hợp đặc biệt của
Mô hình ARIMA. Do đó, tất cả công việc của chúng ta về ước lượng tham số trong Chương 7 đều mang
chuyển sang trường hợp theo mùa.

Phụ lục 10.10 đưa ra các ước tính khả năng xảy ra tối đa và các sai số chuẩn của chúng đối với

mô hình ARIMA (0,1,1) × (0,1,1) 12 cho mức CO2 .

Hình 10.10 Ước tính tham số cho Mô hình CO2

Hệ số θ Θ

Ước tính 0,5792 0,8206

Lỗi tiêu chuẩn 0,0791 0,1137

σ ^ e 2 = 0,5446: khả năng log = 139,54, AIC = 283,08

> m1.co2 = arima (co2, order = c (0,1,1), theo mùa = list (order = c (0,1,1),
kỳ = 12))
> m1.co2
Machine Translated by Google

238 Mô hình theo mùa

Các ước lượng hệ số đều có ý nghĩa cao và chúng tôi tiến hành kiểm tra thêm trên mô hình
này.

Kiểm tra chẩn đoán

Để kiểm tra mô hình ARIMA (0,1,1) × (0,1,1) 12 được ước tính , trước tiên chúng ta nhìn vào biểu đồ
chuỗi thời gian của các phần dư. Hình 10.11 đưa ra biểu đồ này cho các phần dư được tiêu chuẩn hóa.

Ngoài một số hành vi kỳ lạ ở giữa bộ truyện, cốt truyện này không gợi ý bất kỳ điểm bất
thường lớn nào với mô hình, mặc dù chúng ta có thể cần phải điều tra thêm mô hình để tìm
ra các ngoại lệ, vì phần dư chuẩn hóa vào tháng 9 năm 1998 có vẻ đáng ngờ. Chúng tôi tìm
hiểu thêm điều này trong Chương 11.

Hình 10.11 Phần dư từ Mô hình ARIMA (0,1,1) × (0,1,1) 12


• •
3
2
1

••• • • • •
• •• • • • • • • •
•• • ••

•• •
• •

•• ••
• •

•• • •
• •
• •
• •


• •


• •

•• • • • • •
• •• • • •

• • • • •••• • • • • • •
• •• •
• • • • • • •• •

• • • • • • • •

• •
chuẩn
tiêu
được
Phần
hóa

• • • ••
02
1

••
• • • • • •
• • •
1996 1998 2000 2002 2004

Thời gian

> plot (window (rstandard (m1.co2), start = c (1995,2)),


ylab = 'Standardized Residuals', type = 'o')> abline
(h = 0)

Để xem xét thêm, chúng tôi vẽ biểu đồ ACF mẫu của các phần dư trong Hình 10.12. Mối
tương quan “có ý nghĩa thống kê” duy nhất là ở độ trễ 22, và mối tương quan này có giá trị
chỉ là 0,17, một mối tương quan rất nhỏ. Hơn nữa, chúng ta có thể nghĩ rằng không có
tiền lệ hợp lý nào cho sự phụ thuộc ở độ trễ 22. Cuối cùng, chúng ta không nên ngạc nhiên
rằng một quan hệ autocor trong số 36 được hiển thị là có ý nghĩa thống kê. Điều này có thể
dễ dàng xảy ra một cách tình cờ. Ngoại trừ ý nghĩa cận biên ở độ trễ 22, mô hình dường như
đã giới hạn bản chất của sự phụ thuộc trong chuỗi.
Machine Translated by Google

10.4 Đặc điểm kỹ thuật mô hình, lắp và kiểm tra 239

Hình 10.12 ACF của Phần dư từ Mô hình ARIMA (0,1,1) × (0,1,1) 12

0,1

ACF

0,1
0,2
0,0

0 5 10 15 20 25 30 35

Lỗi

> acf (as.vector (window (rstandard (m1.co2), start = c (1995,2))),


lag.max = 36)

Phép thử Ljung-Box cho mô hình này cho giá trị chi bình phương là 25,59 với 22
bậc tự do, dẫn đến giá trị p là 0,27 — một dấu hiệu khác cho thấy mô hình
đã nắm bắt được sự phụ thuộc trong chuỗi thời gian.
Tiếp theo, chúng tôi điều tra câu hỏi về tính bình thường của các thuật ngữ lỗi thông qua phần dư.

Hình 10.13 hiển thị biểu đồ của các phần còn lại. Hình dạng có phần
"Hình chuông" nhưng chắc chắn không phải là lý tưởng. Có lẽ một biểu đồ lượng tử-lượng tử sẽ cho chúng ta biết nhiều hơn.

Hình 10.13 Phần dư từ Mô hình ARIMA (0,1,1) × (0,1,1) 12

thường
xuyên
Tính

40
30
20
10
0

3 2 1 0 1 2 3 4

Phần dư được tiêu chuẩn hóa

> win.graph (chiều rộng = 3, chiều cao = 3, kích thước điểm = 8)


> hist (window (rstandard (m1.co2), start = c (1995,2)),
xlab = 'Phần dư được Tiêu chuẩn hóa')
Machine Translated by Google

240 Mô hình theo mùa

Hình 10.14 hiển thị lô QQ-bình thường cho các phần còn lại.

Hình 10.14 Phần dư: ARIMA (0,1,1) × (0,1,1) 12 Mô hình

2 •
1 • •

• • • • • •

• • • • • • • •
• ••••••••••••••••••••
• • • • • • • • • • • •
• • • • • • • • • • • • • •
• •• •• •• •• •• •• •• •• •• (
•• •• •• •• •• •• •

•••
0
••••
••••
•••••
•••ot
••
•••
•• •
Lượng
mẫu
tử

1

••••


• •• ••

2 1 0 1 2

Lượng tử lý thuyết

> win.graph (width = 2,5, height = 2,5, pointsize = 8)> qqnorm


(window (rstandard (m1.co2), start = c (1995,2)))> qqline (window
(rstandard (m1.co2)) , start = c (1995,2)))

Ở đây, chúng ta lại thấy một giá trị ngoại lệ ở phần đuôi trên, nhưng kiểm định Shapiro-Wilk về

tính không phân biệt có thống kê kiểm tra là W = 0,982, dẫn đến giá trị p là 0,11 và tính chuẩn không bị

bác bỏ ở bất kỳ mức ý nghĩa thông thường nào. các cấp độ.

Khi kiểm tra thêm về mô hình, chúng tôi xem xét việc trang bị quá mức với ARIMA (0,1,2)

× (0,1,1) 12 mô hình với kết quả được hiển thị trong Hình 10.15.

Hình 10.15 ARIMA (0,1,2) × (0,1,1) 12 Mô hình trang bị quá mức

Hệ số θ1 θ2 Θ

Ước tính 0,5714 0,0165 0,8274

Lỗi tiêu chuẩn 0,0897 0,0948 0,1224

σ ^ e 2 = 0,5427: khả năng xảy ra log = 139,52, AIC = 285,05

> m2.co2 = arima (co2, order = c (0,1,2), theo mùa = list (order = c (0,1,1),
kỳ = 12))
> m2.co2

Khi chúng tôi so sánh những kết quả này với những kết quả được báo cáo trong Phụ lục 10.10 trên

trang 237, chúng tôi thấy rằng các ước tính của θ1 và Θ đã thay đổi rất ít - đặc biệt là khi xem xét
kích thước của các sai số tiêu chuẩn. Ngoài ra, ước tính của tham số mới, θ2, không khác 0 về mặt thống

kê. Cũng lưu ý rằng ước tính và khả năng ghi nhật ký không thay đổi nhiều trong khi AIC thực sự đã tăng
σ ^ e 2

lên.

Mô hình ARIMA (0,1,1) × (0,1,1) 12 đã được phổ biến trong ấn bản đầu tiên của cuốn sách sem inal

của Box và Jenkins (1976) khi nó được phát hiện là đặc trưng cho các logarit của
Machine Translated by Google

10.5 Các mô hình dự báo theo mùa 241

chuỗi thời gian của hành khách hàng không hàng tháng. Mô hình này đã được gọi là hãng hàng không
người mẫu. Chúng tôi yêu cầu bạn phân tích dữ liệu ban đầu của hãng hàng không trong các bài thực hành.

10.5 Các mô hình dự báo theo mùa

Tính toán dự báo với các mô hình ARIMA theo mùa, như mong đợi, dễ thực hiện nhất
ra đệ quy bằng cách sử dụng dạng phương trình khác biệt cho mô hình, như trong Phương trình
(9.3.28), (9.3.29) trên trang 199 và (9.3.40) trên trang 201. Ví dụ, hãy xem xét
mô hình ARIMA (0,1,1) × (1,0,1) 12.

-
Yt Yt 1– = () Φ Yt - -12 Yt - 13 + -
et θet 1–
- + θΘet - 13 (10.5.1)
Θet - 12

mà chúng tôi viết lại là

Yt = ++ + ΦYt
Yt 1–
-
- 12 ΦYt - 13
-
et θet 1–
-
Θet - 12 θΘet - 13 (10.5.2)

Khi đó, dự báo trước một bước từ điểm gốc t là


^
Y t() 1 = +Yt ΦYt - 11 ΦYt
-
- 12 θet -
-
Θet - 11
+ θΘet - 12 (10.5.3)

và cái tiếp theo là

^ ^
Y t() 2
= Y t() Φ+ 1 -
Yt - 10 ΦYt - 11
- + θΘet - 11 (10.5.4)
Θet - 10

và kể từ đó trở đi. Các thuật ngữ nhiễu et - 13, et - 12, et - 11,…, et (như phần dư) sẽ đi vào

dự báo cho thời gian khách hàng tiềm năng l = 1, 2,…, 13, nhưng đối với l> 13 thì phần tự động hồi phục của mô hình
tiếp quản và chúng tôi có

^ ^ ^ ^
Y t() l= Y t() Φ l+ 1– Y t() Φ l -12– Yt (l - 13
) cho l> 13 (10.5.5)

Để hiểu bản chất chung của các dự báo, chúng tôi xem xét một số trường hợp đặc biệt.

AR theo mùa (1) 12

Mô hình AR (1) 12 theo mùa là


= - 12 et
Yt ΦYt + (10.5.6)

Rõ ràng, chúng tôi có


^ ^
Y t() Φ= l Y t(l - 12 ) (10.5.7)

Tuy nhiên, lặp lại l, chúng ta cũng có thể viết


^ k 1+
Y t() Φ= l Yt r - + 11 (10.5.8)

trong đó k và r được xác định bởi l = 12k + r + 1 với 0 ≤ r <12 và k = 0, 1, 2,…. Trong khác
từ, k là phần nguyên của (l - 1) / 12 và r / 12 là phần thập phân của (l - 1) / 12. Nếu chúng ta
lần quan sát cuối cùng là vào tháng 12, sau đó giá trị tháng 1 tiếp theo được dự báo bằng Φ lần
giá trị quan sát cuối cùng của tháng 1, tháng 2 được dự báo bằng Φ lần giá trị quan sát được cuối cùng của tháng 2
Machine Translated by Google

242 Mô hình theo mùa

giá trị, v.v. Hai tháng 1 sắp tới được dự báo vì Chỉ Φ2 lần so với tháng 1 được quan sát gần đây nhất.

nhìn vào các giá trị của tháng 1, các dự báo về tương lai sẽ giảm dần theo cấp số nhân với
tốc độ xác định bởi độ lớn của Φ. Tất cả các dự báo cho mỗi tháng sẽ hoạt động
tương tự nhưng với các dự báo ban đầu khác nhau tùy thuộc vào tháng cụ thể dưới
Sự xem xét.
Sử dụng Công thức (9.3.38) trên trang 201 và thực tế là các trọng số khác không
chỉ cho bội số của 12, cụ thể là

=
Φ j / 12 cho j = 0,,,…
12 24
ψj (10.5,9)
0 nếu không thì

chúng tôi có rằng phương sai lỗi dự báo có thể được viết là

- 2+
1 Φ2k
2
= ------------------------- σe (10.5.10)
Var et () () l
1 Φ2 -

trong đó, như trước đây, k là phần nguyên của (l - 1) / 12.

MA theo mùa (1) 12

Đối với mô hình MA (1) 12 theo mùa , chúng ta có

Yt = et -Θet - 12 + θ0 (10.5.11)

Trong trường hợp này, chúng tôi thấy rằng

^
Y t 1 () =Θ -et - 11 + θ0
^
Y t 2 () =Θ -et - 10 + θ0
.
. (10.5.12)
.
^
Y t 12 () +Θ =θ0et -


^
Y t() θ= l 0 cho l> 12 (10.5.13)

Tại đây, chúng tôi nhận được các dự báo khác nhau cho các tháng của năm đầu tiên, nhưng từ đó trở đi

dự báo được đưa ra bởi quá trình trung bình.

Đối với mô hình này, ψ0 = 1, ψ12 = Θ, và ψj = 0 ngược lại. Do đó, từ phương trình
(9.3.38) trên trang 201,
2
σe 1 ≤ ≤l 12
=
Var et (() l) (10.5.14)
+ ( 2 e)
1 σΘ2 12 <l

ARIMA (0,0,0) × (0,1,1) 12

Mô hình ARIMA (0,0,0) × (0,1,1) 12 là

Yt -Yt - 12 - = et Θet - 12 (10.5.15)


Machine Translated by Google

10.5 Các mô hình dự báo theo mùa 243

hoặc

= - + e Θe
Yt + l Yt l - + 12 t + l t l - + 12

để có thể

^
Y t() 1
- =
Yt - 11 Θet - 11
^
Y t() 2
- =
Yt - 10 Θet - 10
. (10.5.16)
.
.
^
Y t() 12 Yt Θet - =

và sau đó
^ ^
Y t() l= Y
()t l
12- cho l> 12 (10.5.17)

Theo đó, tất cả các tháng 1 sẽ dự báo giống nhau, tất cả các tháng 2 giống nhau, và như vậy
ra ngoài.

Nếu chúng ta đảo ngược mô hình này, chúng ta thấy rằng

= +
Yt () - Θ Yt - 12 )
1 ( ++- +…
ΘYt 24 et
Θ2Yt - 36

Do đó, chúng ta có thể viết

^ ∞
Y t() 1
= () Θ 1 - Θ
- j Yt 12 11 - j
j 0 =

^ ∞
Y t() 2
= () Θ 1 - Θ j
Yt - 12 10 - j
j 0 = (10.5.18)
.
.
.

^ ∞
Yt
= () ()
Θ 112- Θ j Yt - 12j
j 0 =

Từ biểu diễn này, chúng tôi thấy rằng dự báo cho mỗi tháng 1 là một
trung bình động có trọng số của tất cả các tháng 1 được quan sát và tương tự cho từng tháng khác
tháng.

Trong trường hợp này, chúng ta có ψj = 1 - Θ cho j = 12, 24,…, và bằng không nếu không. Dự báo
phương sai sai sau đó là

= + σe 1 - Θ 2 2 [1
k ()] (10.5.19)
Var et (() l)

với k là phần nguyên của (l - 1) / 12.

ARIMA (0,1,1) × (0,1,1) 12

Đối với mô hình ARIMA (0,1,1) × (0,1,1) 12

= ++ +
Yt Yt 1– Yt - 12 Yt - 13
- -
et θet 1–
-
Θet - 12 θΘet - 13 (10,5,20)
Machine Translated by Google

244 Mô hình theo mùa

dự báo thỏa mãn


^
Y () 1 Yt = + -
θet -
-
+ θΘet - 12
t Yt - 11 Yt - 12 Et - 11
^ ^
Y () 2= Y() 1 + - -
t t Yt - 10 Yt - 11 et - 10 + θΘet - 11
.
.
. (10.5.21)
^ ^
Y () 12=Y() 11 - + et 1–
t Yt + Yt 1– Θet -
^ t ^ ^
Y () 13=Y() 12 + Y1
() Yt - θΘet +
t t t


^ ^ ^ ^
Y () l= Y () +
t t 1– lY t ()
12–l Y - (lt 13– cho
) l> 13 (10.5.22)

Để hiểu mô hình chung của những dự báo này, chúng ta có thể sử dụng biểu diễn

^ 6
2πjl
Y () l A1 A2l cos 2πjl
+ tội lỗi (10.5.23)
t = + + B1j ---------- B2j
---------- 12 12
j 0 =

trong đó điểm A và B
^ phụ thuộc
^ vào Yt^ , Yt - 1,… hoặc, cách khác, được xác định từ
dự báo ban đầu () Y13 ,
t () 1 Yt () 2
,…, Y t .Kết quả này dựa trên tổng thể
ory của các phương trình sai khác và liên quan đến các nghiệm nguyên của (1 - x) (1 - x12) = 0.

Lưu ý rằng Công thức (10.5.23) cho thấy rằng các dự báo bao gồm một tuyến tính
xu hướng trong thời gian dẫn đầu cộng với tổng các thành phần tuần hoàn. Tuy nhiên, hệ số Ai

và Bij phụ thuộc nhiều hơn vào dữ liệu gần đây hơn là dữ liệu trong quá khứ và sẽ thích ứng với những thay đổi trong
quá trình khi nguồn gốc dự báo của chúng tôi thay đổi và các dự báo được cập nhật. Điều này thật tuyệt vời

trái ngược với dự báo với xu hướng thời gian xác định cộng với các thành phần theo mùa, trong đó
các hệ số phụ thuộc khá như nhau vào cả dữ liệu gần đây và quá khứ và giữ nguyên
cho tất cả các dự báo trong tương lai.

Giới hạn dự đoán

Giới hạn dự đoán thu được chính xác như trong trường hợp trái mùa. Chúng tôi minh họa điều này
với chuỗi thời gian carbon dioxide. Hình 10.16 cho thấy các dự báo và 95% dự báo

giới hạn thời gian dẫn đầu là hai năm cho mô hình ARIMA (0,1,1) × (0,1,1) 12 mà chúng tôi phù hợp.
Dữ liệu quan sát của hai năm gần đây cũng được hiển thị. Các dự báo bắt chước ngẫu nhiên
tính chu kỳ của dữ liệu khá tốt và các giới hạn dự báo mang lại cảm giác tốt cho việc
lựa chọn trước các dự báo.
Machine Translated by Google

10.5 Các mô hình dự báo theo mùa 245

Phụ lục 10.16 Dự báo và Giới hạn Dự báo cho Mô hình CO2


• • • •

• •
•• •
• •

• • •

• • •

• •

• •

CO2
Mức
• •
• • • •
• •
• • •
• ••
••
390
385
380
375
370

•• • •

2003 2004 2005 2006 2007

Năm

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> plot (m1.co2, n1 = c (2003,1), n.ahead = 24, xlab = 'Year', type = 'o',
ylab = 'Mức CO2')

Biểu đồ 10.17 hiển thị năm cuối cùng của dữ liệu quan sát và dự báo trong bốn năm.
Tại thời điểm dẫn đầu này, có thể dễ dàng nhận thấy rằng các giới hạn dự báo ngày càng rộng ra, vì có

nhiều sự không chắc chắn trong các dự báo.

Phụ lục 10.17 Dự báo dài hạn cho mô hình CO2

390

• •
• •
• • • •
• • •
• • • • •


• •


• • • •

• •

• •
380
• • • • •

• • •
• • •
• •
CO2
Mức

• • •
• • • •
•• ••
••
370

• •
••
2004 2005 2006 2007 2008 2009

Năm

> plot (m1.co2, n1 = c (2004,1), n.ahead = 48, xlab = 'Year', type = 'b',
ylab = 'Mức CO2')
Machine Translated by Google

246 Mô hình theo mùa

10.6 Tóm tắt

Mô hình ARIMA theo mùa đa số cung cấp một cách tiết kiệm để lập mô hình thời gian
sê-ri có xu hướng theo mùa không đều đặn như chúng ta có với mô hình xu hướng theo
mùa xác định mà chúng ta đã đề cập trong Chương 3. May mắn thay, những mô hình này là
chỉ đơn giản là các mô hình ARIMA đặc biệt để không cần lý thuyết mới để điều tra sai sót của
chúng. Chúng tôi đã minh họa bản chất đặc biệt của các mô hình này bằng cách mô hình hóa kỹ lưỡng
chuỗi thời gian thực tế.

BÀI TẬP

10.1 Dựa trên dữ liệu hàng quý, một mô hình theo mùa của biểu mẫu

Yt + =Yt -4– -
et θ1et 1– θ2et 2–

đã phù hợp với một chuỗi thời gian nhất định.

(a) Tìm bốn trọng số đầu tiên cho mô hình này.


(b) Giả sử rằng θ1 = 0,5, θ2 = 0,25 và σe = 1. Tìm dự báo cho bốn
quý nếu dữ liệu cho bốn quý gần nhất là

Phần tư Tôi II III IV

Loạt 25 20 25 40

Dư2 1 2 3

(c) Tìm khoảng thời gian dự đoán 95% cho các dự báo trong phần (b).
10.2 Một mô hình AR có đa thức đặc trưng AR
-
(()) 1 1,6 - 0,7x2x 1+ 0,8x12

(a) Mô hình có đứng yên không?


(b) Xác định mô hình là một mô hình ARIMA theo mùa nhất định.
10.3 Giả sử rằng {Yt } thỏa mãn
Yt a=bt+++
St Xt

trong đó St là xác định và tuần hoàn với chu kỳ s và {Xt} là theo mùa
Chuỗi ARIMA (p, 0, q) × (P, 1, Q) . Mô hình cho Wt = Yt Yt - s là gì?
10.4 Đối với mô hình theo mùa - +4– =ee θet 1– with | Φ | <1, tìm γ0 và ρk.
Yt ΦYt

10.5 Xác định những điều sau đây là một số mô hình ARIMA theo mùa tích lũy nhiều lần:
(một)
=
Yt 0,5Yt 1– Yt 4– +
0,5Yt 5– (b)
- + et
- 0,3et 1– .
= 1–
Yt Yt +++
Yt -+ 12 Yt - 13 et 0.5et 1– 10.6 Hãy xác
- - et - 12
0,25et - 13
.
minh các phương trình (10.2.11) trên trang 232.
Machine Translated by Google

Bài tập 247

10.7 Giả sử rằng quá trình {Yt } phát triển theo Yt = et Yt Yt 4– et + =


cho t = 1, 2, 3 và 4.

(a) Tìm hàm phương sai của {Yt }. (b) Tìm

hàm tự tương quan cho {Yt }. (c) Xác định mô hình

cho {Yt } là một mô hình ARIMA theo mùa nhất định.


10.8 Xem xét chuỗi thời gian carbon dioxide hàng tháng của Alert, Canada, được hiển thị trong Phần trình bày

10.1 trên trang 227. Dữ liệu nằm trong tệp có tên là co2. (a) Điều

chỉnh trung bình theo mùa xác định cộng với mô hình xu hướng thời gian tuyến tính với những dữ liệu này.

Có bất kỳ hệ số hồi quy nào “có ý nghĩa thống kê” không? (b) Bội số R
bình phương cho mô hình này là bao nhiêu? (c) Bây giờ hãy tính toán tự

tương quan mẫu của các phần dư từ mô hình này.

Giải thích kết quả.

10.9 Chuỗi thời gian của hành khách hàng không hàng tháng, được điều tra lần đầu tiên trong Box
và Jenkins (1976), được coi là một chuỗi thời gian cổ điển. Dữ liệu nằm trong tệp có tên

hãng hàng không. (a) Hiển thị biểu đồ chuỗi thời gian của cả chuỗi ban đầu và logarit của

chuỗi. Lập luận rằng lấy các bản ghi là một chuyển đổi thích hợp. (b) Hiển thị và diễn

giải các biểu đồ chuỗi thời gian của sự khác biệt đầu tiên của lần ghi nhật ký
loạt.

(c) Hiển thị và diễn giải biểu đồ chuỗi thời gian của sự khác biệt theo mùa của sự khác

biệt đầu tiên của chuỗi đã ghi. (d) Tính toán và giải thích ACF mẫu của sự khác biệt
theo mùa của sự khác biệt đầu tiên của chuỗi đã ghi. (e) Điều chỉnh “mô hình hãng hàng

không” (ARIMA (0,1,1) × (0,1,1) 12 ) với chuỗi đã ghi. (f) Điều tra chẩn đoán cho mô

hình này, bao gồm tự tương quan và tính chuẩn của các phần dư.

(g) Đưa ra dự báo cho loạt phim này với thời gian dẫn đầu là hai năm. Đảm bảo bao gồm các
giới hạn dự báo.

10.10 Phụ lục 5.8 trên trang 99 trình bày sản lượng điện hàng tháng được tạo ra ở Hoa Kỳ. Ở đó,

chúng tôi lập luận rằng lấy logarit là thích hợp cho việc lập mô hình.

Hình 5.10 trên trang 100 cho thấy sơ đồ chuỗi thời gian về những điểm khác biệt đầu tiên
của chuỗi này. Tên tệp là điện. (a) Tính ACF mẫu của hiệu số đầu tiên của chuỗi đã ghi.

Tính thời vụ có hiển thị trong màn hình này không? (b) Vẽ biểu đồ chuỗi thời gian của sự

khác biệt theo mùa và sự khác biệt đầu tiên của lần ghi nhật ký

loạt. Bây giờ một mô hình cố định có vẻ thích hợp không?

(c) Hiển thị ACF mẫu của chuỗi sau khi chênh lệch theo mùa và chênh lệch đầu tiên đã được

thực hiện đối với chuỗi đã ghi. Bạn có thể xem xét (các) mô hình nào cho loạt điện?
Machine Translated by Google

248 Mô hình theo mùa

10.11 Thu nhập hàng quý trên mỗi cổ phiếu cho giai đoạn 1960–1980 của công ty Johnson &
Johnson, được lưu trong tệp có tên JJ. (a)

Vẽ đồ thị của chuỗi thời gian và cả lôgarit của chuỗi. Lập luận rằng chúng ta nên biến đổi

bằng các bản ghi để mô hình hóa chuỗi này. (b) Chuỗi rõ ràng không đứng yên. Lấy sự

khác biệt đầu tiên và lập cốt truyện cho chuỗi đó.

Sự cố định bây giờ có vẻ hợp lý?

(c) Tính toán và vẽ đồ thị ACF mẫu của các khác biệt đầu tiên. Giải thích
kết quả.

(d) Hiển thị biểu đồ của sự khác biệt theo mùa và sự khác biệt đầu tiên. Diễn giải cốt

truyện. Nhớ lại rằng đối với dữ liệu hàng quý, mùa có độ dài là 4. (E) Vẽ biểu đồ và

giải thích ACF mẫu về sự khác biệt theo mùa với dif đầu tiên
hội nghị.

(f) Phù hợp với mô hình ARIMA (0,1,1) × (0,1,1) 4 và đánh giá ý nghĩa của ước lượng
hệ số giao phối. (g)

Thực hiện tất cả các phép thử chẩn đoán trên phần còn lại.

(h) Tính toán và vẽ các dự báo cho hai năm tiếp theo của chuỗi. Đảm bảo bao gồm các giới
hạn dự báo.

10.12 Tệp có tên lên tàu chứa dữ liệu hàng tháng về số lượng người đã lên các phương tiện vận

chuyển (chủ yếu là tàu hỏa hạng nhẹ và xe buýt thành phố) ở Denver, Colorado, khu vực từ

tháng 8 năm 2000 đến tháng 12 năm 2005. (a) Lập biểu đồ chuỗi thời gian cho những dữ liệu.

Đảm bảo sử dụng các ký hiệu biểu đồ sẽ giúp bạn đánh giá tính thời vụ. Một mô hình tĩnh

dường như lý do có thể?

(b) Tính và vẽ đồ thị ACF mẫu cho chuỗi này. Bạn có độ trễ nào

tự tương quan đáng kể?

(c) Điều chỉnh mô hình ARMA (0,3) × (1,0) 12 với những dữ liệu này. Đánh giá ý nghĩa của
các hệ số ước lượng.

(d) Trang bị quá nhiều với kiểu ARMA (0,4) × (1,0) 12 . Giải thích kết quả.
Machine Translated by Google

CHƯƠNG 11

CÁC MÔ HÌNH ĐỊA CHỈ CỦA CÁC DÒNG THỜI GIAN

Trong chương này, chúng tôi giới thiệu một số ý tưởng hữu ích kết hợp thông tin bên ngoài vào mô
hình chuỗi thời gian. Chúng tôi bắt đầu với các mô hình bao gồm tác động của các biện pháp can
thiệp đối với hành vi bình thường của chuỗi thời gian. Chúng tôi cũng xem xét các mô hình đồng

hóa các tác động của các ngoại lệ — các quan sát, trong chuỗi quan sát hoặc trong điều kiện sai
số, rất bất thường so với hành vi bình thường. Cuối cùng, chúng tôi phát triển các phương pháp
để tìm kiếm và xử lý tương quan giả — tương quan giữa các chuỗi là giả tạo và sẽ không giúp lập
mô hình hoặc hiểu chuỗi thời gian quan tâm. Chúng ta sẽ thấy rằng việc làm sạch loạt phim sẽ
giúp chúng ta tìm thấy những mối quan hệ có ý nghĩa.

11.1 Phân tích can thiệp

Biểu đồ 11.1 cho thấy biểu đồ thời gian của logarit của số dặm hành khách hàng tháng của hãng
hàng không ở Hoa Kỳ từ tháng 1 năm 1996 đến tháng 5 năm 2005. Chuỗi thời gian có âm độ cao, cho
thấy thực tế là lưu lượng hàng không nói chung cao hơn trong các tháng mùa hè và tháng 12. các
kỳ nghỉ lễ và thấp hơn vào các tháng mùa đông. † Ngoài ra, lưu lượng hàng không nói chung cũng
tăng lên một cách tuyến tính cho đến khi nó giảm đột ngột vào tháng 9 năm 2001. Số lượng hành
khách đi máy bay giảm đột ngột vào tháng 9 năm 2001 và vài tháng sau đó là do các hành động
khủng bố vào ngày 11 tháng 9 năm 2001, khi bốn máy bay bị cướp, ba trong số đó đã đâm vào tòa
tháp đôi của Trung tâm Thương mại Thế giới và Lầu Năm Góc và chiếc thứ tư vào một cánh đồng nông
thôn ở Pennsylvania. Các cuộc tấn công khủng bố vào tháng 9 năm 2001 đã làm suy giảm nghiêm
trọng không lưu trong khoảng thời gian đó, nhưng không lưu đã dần lấy lại được những tổn thất
theo thời gian. Đây là một ví dụ về sự can thiệp dẫn đến thay đổi xu hướng của một chuỗi thời
gian.
Phân tích can thiệp, do Box và Tiao (1975) giới thiệu, cung cấp một khuôn khổ để đánh giá
tác động của can thiệp đối với một chuỗi thời gian đang nghiên cứu. Giả định rằng sự can thiệp
ảnh hưởng đến quá trình bằng cách thay đổi hàm trung bình hoặc xu hướng của một chuỗi thời gian.
Các biện pháp can thiệp có thể là tự nhiên hoặc nhân tạo. Ví dụ, một số mức quần thể động vật đã
giảm xuống mức rất thấp trong một năm cụ thể do khí hậu khắc nghiệt trong năm đó. Sau đó, mức độ
dân số hàng năm sau sự cố có thể sẽ khác với mức độ dân số trong giai đoạn trước sự cố. Một ví
dụ khác là việc tăng giới hạn tốc độ từ 65 dặm một giờ lên 70 dặm một giờ trên đường cao tốc
liên bang. Điều này có thể làm cho việc lái xe trên

† Trong các bài tập, chúng tôi yêu cầu bạn hiển thị biểu đồ chuỗi thời gian bằng cách sử dụng các ký hiệu biểu

đồ theo mùa trên biểu đồ toàn màn hình, nơi mà tính thời vụ khá dễ nhìn thấy.

249
Machine Translated by Google

250 Mô hình hồi quy chuỗi thời gian

đường cao tốc nguy hiểm hơn. Mặt khác, người lái xe có thể ở trên đường cao tốc trong thời gian
ngắn hơn vì tốc độ nhanh hơn, do đó, ảnh hưởng thực của việc thay đổi giới hạn tốc độ tăng lên
là không rõ ràng. Tác động của việc tăng giới hạn tốc độ có thể được nghiên cứu bằng cách phân
tích hàm trung bình của một số dữ liệu chuỗi thời gian tai nạn; ví dụ, số vụ tai nạn xe hơi gây
tử vong đáng kể trên một số đoạn của đường cao tốc liên bang. (Lưu ý rằng hàm tự thay đổi của
chuỗi thời gian cũng có thể bị thay đổi bởi sự can thiệp, nhưng khả năng này sẽ không được theo
đuổi ở đây.)

Hình 11.1 Dặm hàng tháng của Hãng hàng không Hoa Kỳ: Tháng 1 năm 1996 đến tháng 5 năm 2005

(airmiles)
Nhật

17,7
17,5
17,3
17,1

1996 1998 2000 2002 2004

Năm

> win.graph (width = 4.875, height = 2.5, pointsize =


8)> data (airmiles)> plot (log (airmiles), ylab = 'Log
(airmiles)', xlab = 'Year')

Đầu tiên chúng ta xem xét trường hợp đơn giản của một can thiệp duy nhất. Mô hình chung

cho chuỗi thời gian {Yt }, có lẽ sau khi biến đổi phù hợp, được đưa ra bởi

Yt mt Nt + = (11.1.1)

trong đó mt là sự thay đổi trong hàm trung bình và Nt được mô hình hóa dưới dạng một số ARIMA
pro cess, có thể theo mùa. Quá trình {Nt } đại diện cho chuỗi thời gian cơ bản không có sự can
thiệp. Nó được gọi là quá trình tự nhiên hoặc không bị xáo trộn, và nó có thể đứng yên hoặc
không cố định, theo mùa hoặc trái mùa. Giả sử chuỗi thời gian là phụ của một can thiệp diễn ra

tại thời điểm T. Trước T, mt được giả định là số không xác định. Chuỗi thời gian {Yt , t < T}
được gọi là dữ liệu can thiệp trước
không
và có
bịthể
xáođược
trộnsử
Ntdụng
. để chỉ định mô hình cho quá trình

Dựa trên các cân nhắc của đối tượng, ảnh hưởng của sự can thiệp lên hàm trung bình thường
có thể được chỉ định tới một số tham số. Một chức năng hữu ích trong cation cụ thể này là hàm
bước

() T 1 nếu t T
St = (11.1.2)
≥, 0 nếu
,
không
Machine Translated by Google

11.1 Phân tích can thiệp 251

đó là 0 trong giai đoạn trước can thiệp và 1 trong suốt giai đoạn sau can thiệp.
Hàm xung
() T () T ()
- =
Pt St T St 1– (11.1.3)
() T
bằng 1 tại t = T và bằng 0 nếu không. Đó là, Pt là chỉ báo hoặc cờ biến giả ging thời
gian mà can thiệp diễn ra. Nếu sự can thiệp dẫn đến sự thay đổi ngay lập tức và vĩnh
viễn trong hàm trung bình, thì sự thay đổi có thể được mô hình hóa như

()
= (11.1.4)
T mt ωSt

trong đó ω là thay đổi vĩnh viễn chưa biết trong giá trị trung bình do can thiệp. Thử nghiệm
liệu ω = 0 có tương tự như việc kiểm tra xem các trung bình tổng thể có giống nhau hay không
với dữ liệu ở dạng hai mẫu ngẫu nhiên độc lập từ hai quần thể.
Tuy nhiên, sự khác biệt chính ở đây là dữ liệu trước và sau can thiệp không thể được
giả định là độc lập và được phân phối giống nhau. Mối quan hệ cor nối tiếp vốn có
trong dữ liệu làm cho vấn đề trở nên thú vị hơn nhưng đồng thời cũng nhiều hơn
khó khăn. Nếu có sự chậm trễ d đơn vị thời gian trước khi can thiệp có hiệu lực và d là
được biết, sau đó chúng tôi có thể chỉ định

()
= (11.1.5)
T mt ωSt d -

Trong thực tế, sự can thiệp có thể ảnh hưởng đến chức năng trung bình dần dần, với toàn bộ lực
chỉ phản ánh trong thời gian dài. Điều này có thể được mô hình hóa bằng cách chỉ định mt là kiểu AR (1)
() T
mô hình với thuật ngữ lỗi được thay thế bằng bội số của độ trễ 1 của St :

() T
+ =1– ωSt 1–
mt δmt (11.1.6)

với điều kiện ban đầu m0 = 0. Sau một số đại số, có thể chỉ ra rằng

t T
- -1 δ
ω
= -------------------- cho t T >,
1 - δ (11.1.7)
mt

0 nếu không
,

Thường δ được chọn trong khoảng 1> δ> 0. Trong trường hợp đó, mt tiến tới ω / (1 - δ) cho
lớn t, là thay đổi cuối cùng (được hoặc mất) đối với hàm trung bình. Một nửa của
t-T
thay đổi cuối cùng đạt được khi 1 - δ = 0,5; nghĩa là khi t = T + log (0,5) / log (δ).
Nhật ký thời lượng (0,5) / log (δ) được gọi là chu kỳ bán rã của hiệu ứng can thiệp, và
ngắn hơn thì hệ thống cảm nhận được sự thay đổi cuối cùng càng nhanh. Hình 11.2 trưng bày
chu kỳ bán rã là một hàm của δ, cho thấy chu kỳ bán rã tăng theo δ. Thật,
chu kỳ bán rã trở nên lớn vô hạn khi δ tiến gần đến 1.

Hình 11.2 Chu kỳ bán rã dựa trên Quy trình AR (1) với Đầu vào Chức năng Bước

δ 0,2 0,4 0,6 0,8 0,9 1

Chu kỳ bán rã 0,43 0,76 1,46 3,11 6,58 ∞


Machine Translated by Google

252 Mô hình hồi quy chuỗi thời gian

Điều thú vị là cần lưu ý trường hợp giới hạn khi δ = 1. Khi đó mt = ω (T - t) với t ≥ T và
0 nếu không. Biểu đồ trình tự thời gian của mt hiển thị hình dạng của một đoạn đường dốc với độ dốc ω.

Đặc điểm kỹ thuật này ngụ ý rằng sự can thiệp thay đổi tuyến tính hàm trung bình trong
giai đoạn sau can thiệp. Hiệu ứng đoạn đường nối này (với độ trễ một đơn vị thời gian) được hiển thị trong

Hình 11.3 (c).


Các tác động can thiệp trong thời gian ngắn có thể được chỉ định bằng cách sử dụng biến giả xung

() T
1 ,nếu t = T
= (11.1.8)
Pt
0, ngược lại

Ví dụ, nếu sự can thiệp chỉ tác động đến hàm trung bình tại t = T, thì

()
= (11.1.9)
T mt ωPt

Các hiệu ứng can thiệp chết dần có thể được chỉ định thông qua cation đặc trưng loại
AR (1)
() T
+ = (11.1.10)
mt δmt 1– ωPt

Tức là, mt = ωδT t với t ≥ T sao cho giá trị trung bình thay đổi ngay lập tức một lượng ω và
sau đó sự thay đổi trong giá trị trung bình giảm về mặt hình học bởi nhân tố chung của
δ; xem Phụ lục 11.4 (a). Các thay đổi bị trì hoãn có thể được kết hợp bằng cách làm trễ tần
số xung nhịp. Ví dụ: nếu sự thay đổi giá trị trung bình diễn ra sau độ trễ một đơn vị thời gian
và hiệu ứng biến mất dần dần, chúng tôi có thể chỉ định
() T
+ =1– ωPt 1–
mt δmt (11.1.11)

Một lần nữa, chúng ta giả sử điều kiện ban đầu m0 = 0.

Sẽ rất hữu ích khi viết † mô hình trước theo toán tử dịch chuyển ngược B,
() T () T ( )
= =
trong đó Bmt = mt - 1 và BPt Pt 1– . sau đó 1 () - δB mt ωBPt T. Hoặc, chúng ta có thể viết

ωB () T
= (11.1.12)
mt
1 - δB
--------------- Pt

() T () T () 1 () T
Hồi tưởng = , T có thể được viết lại thành St = .
( ) 1 - B St Pt
1 - B
------------ Pt

† Phần còn lại của chương này sử dụng toán tử dịch chuyển ngược được giới thiệu trong Phụ lục

D ở trang 106. Bạn có thể muốn xem lại phụ lục đó trước khi tiếp tục.
Machine Translated by Google

11.1 Phân tích can thiệp 253

Phụ lục 11.3 Một số mô hình phổ biến cho các can thiệp theo bước (Tất cả đều
được hiển thị với độ trễ là 1 đơn vị thời gian)

(một)
•••• ω
() T

ωBSt
0 ••••••
T

(b) •
ω / (1 δ)
ωB () T
• •
1 - δB
--------------- St
• ω

0
••••••
T
(c)
ωB () T

1 - B • độ dốc = ω

------------ St


0 •
••••••
T

Một số thông số kỹ thuật có thể được kết hợp để tạo mô hình can thiệp phức tạp hơn
các hiệu ứng.

Ví dụ,

ω1B () T ω2B () T
mt = + (11.1.13)
1 - δB
--------------- Pt
1 - B
------------ Pt

mô tả tình huống được hiển thị trong Hình 11.4 (b) trong đó ω1 và ω2 đều lớn hơn
không, và

() T ω1B () T ω2B ()
T mt= ω0Pt + + (11.1.14)
1 - δB
--------------- Pt
1 - B
------------ Pt

có thể mô hình hóa các tình huống như Hình 11.4 (c) với ω1 và ω2 đều âm. Trường hợp cuối cùng này
có thể mô hình hóa tình huống thú vị trong đó một đợt giảm giá đặc biệt có thể gây ra tình trạng mua vội vàng,

ban đầu quá nhiều để bán được sau đó là nhu cầu giảm. Nói chung, chúng tôi
có thể mô hình hóa sự thay đổi trong hàm trung bình bằng một đặc tả kiểu ARMA

ω () B () T
mt = ------------ Pt (11.1.15)
δ () B

= Pt() , các
() T
T trong đó ω (B) và δ (B) là một số đa thức trong B. Vì () 1 - B St
mô hình cho mt có thể được chỉ định theo biến giả xung hoặc bước.
Machine Translated by Google

254 Mô hình hồi quy chuỗi thời gian

Phụ lục 11.4 Một số mô hình phổ biến cho các can thiệp đáp ứng xung (Tất cả đều
được hiển thị với độ trễ là 1 đơn vị thời gian)

(một)
ωB () T • ω
--------------- Pt
1 - δB

0
• •
••••••
T
(b)
ω1B ω2B
---------------
+ ------------ Pt
() T
• ω1 + ω2
1 - δB 1 - B
• • • ω2
0 ••••••
T
(c)
+
ω1B
--------------- ω2B () T • ω0
ω0 + ------------ Pt
0
1 - δB 1 - B ••••
ω2
• • •
• ω1 + ω2

Việc ước lượng các tham số của một mô hình can thiệp có thể được thực hiện bởi
phương pháp ước tính khả năng xảy ra tối đa. Thật vậy, Yt - mt là một điểm chuyên
nghiệp ARIMA theo mùa để hàm khả năng bằng pdf chung của Yt - mt, t = 1, 2,…, n, mà
có thể được tính toán bằng các phương pháp đã nghiên cứu trong Chương 7 hoặc bằng cách khác bằng mô hình không gian trạng thái

phương pháp của Phụ lục H trang 222.

Bây giờ chúng tôi truy cập lại dữ liệu hành khách-chuyến bay hàng tháng. Nhớ lại rằng bọn khủng bố hành động trong

Tháng 9 năm 2001 có những ảnh hưởng trầm cảm kéo dài đối với giao thông hàng không. Sự can thiệp có thể là

được chỉ định là quy trình AR (1) với đầu vào là xung vào tháng 9 năm 2001. Nhưng sự
kiện chưa xảy ra vào tháng 9 năm 2001 có tác động làm lạnh tức thời mạnh đối với không khí
giao thông. Do đó, chúng tôi lập mô hình hiệu ứng can thiệp (hiệu ứng 11/9) là

+ = () ω1 () T
T mt ω0Pt ------------------- Pt
1 ω2 - B

trong đó T biểu thị tháng 9 năm 2001. Trong đặc điểm kỹ thuật này, ω0 + ω1 đại diện cho tức thời
hiệu ứng 11/9, và với k ≥ 1, hiệu ứng 11/9
ω1 ω2là( k) tháng
k sau đó. Nó

vẫn để chỉ định cấu trúc ARIMA theo mùa của thuế suất không bị xáo trộn cơ bản.
Dựa trên dữ liệu trước can thiệp, mô hình ARIMA (0,1,1) × (0,1,0) 12 đã được chỉ
định cụ thể cho quá trình không bị xáo trộn; xem Hình 11.5.
Machine Translated by Google

11.1 Phân tích can thiệp 255

Phụ lục 11.5 ACF mẫu cho (1 B) (1 B12) Nhật ký (Dặm hành khách hàng không) Qua
Giai đoạn tiền can thiệp

0,1

ACF

0,1
0,3

0 10 20 30 40

Lỗi

> acf (as.vector (diff (diff (window (log (airmiles), end = c (2001,8)), 12))), lag.max =
48)

Chẩn đoán mô hình của mô hình được trang bị đề xuất rằng hệ số MA (1) theo mùa
là cần thiết và sự tồn tại của một số ngoại lệ phụ gia xảy ra vào tháng 12 năm 1996,
Tháng 1 năm 1997 và tháng 12 năm 2002. (Các ngoại lệ sẽ được thảo luận chi tiết hơn ở phần sau; tại đây

các ngoại lệ cộng thêm có thể được coi là các biện pháp can thiệp không rõ bản chất có xung
chức năng phản hồi.) Do đó, mô hình được chỉ định là ARIMA (0,1,1) × (0,1,1) 12 cộng
sự can thiệp của vụ 11/9 và ba ngoại lệ cộng thêm. Mô hình được trang bị được tóm tắt trong

Hình 11.6.

Phụ lục 11.6 Ước tính Mô hình Can thiệp cho Logarit của Dặm bay (Sai số tiêu chuẩn được
trình bày bên dưới các ước tính)

θ Θ Tháng mười hai96 Tháng 197 Tháng mười hai 02


ω0 ω1 ω2
0,383 0,650 0,099 0.069 0,081 0.095 0,27 0,814

(0,093) (0,119) (0,044)


(0,023)
σ2 được ước
(0,022)
tính là 0,000672:
(0,020) log-khả
(0,046)
năng = 219,99, (0,098)

AIC = 423,98

> air.m1 = arimax (log (airmiles), order = c (0,1,1), season =


list (order = c (0,1,1), period = 12), xtransf = data.frame
(I911 = 1 * (seq (airmiles) == 69), I911 = 1 * (seq (airmiles) ==
69)), transfer = list (c (0,0), c (1,0)), xreg = data .frame (Dec96 = 1 * (seq
(airmiles) == 12), Jan97 = 1 * (seq (airmiles) == 13), Dec02 = 1 * (seq (airmiles)
== 84)), method = 'ML ')

> air.m1
Machine Translated by Google

256 Mô hình hồi quy chuỗi thời gian

Chẩn đoán mô hình gợi ý rằng mô hình được trang bị ở trên cung cấp sự phù hợp tốt với dữ liệu.

Các vòng tròn mở trong biểu đồ chuỗi thời gian được hiển thị trong Phụ lục 11.7 đại diện cho các giá

trị phù hợp từ mô hình ước tính cuối cùng. Chúng chỉ ra sự thống nhất tốt giữa mô hình và dữ liệu.

Phụ lục 11.7 Nhật ký Dặm bay hành khách và các giá trị được trang bị

••

• ••
• • •
• •• • •• • •• •
• •

• • • •• • • •• • • • • •


• • • • ••

(airmiles)
Nhật

• • •
•• • • • • • • •• • •• •
• •
• • • • •• • •

• •

• • • • •
• •
•• • •
• ••


• • •
• •• •• ••
• • • •

• •
17,7
17,5
17,3
17,1

• • • •

1996 1998 2000 2002 2004

Thời gian

> plot (log (airmiles), ylab = 'Log (airmiles)')> điểm (được


trang bị (air.m1))

Mô hình được trang bị ước tính rằng vụ can thiệp ngày 11/9 đã làm giảm lưu lượng hàng không 31%

= {1 - exp ( 0,0949 0,2715)} × 100% vào tháng 9 năm 2001 và lưu lượng hàng không k tháng sau đã

giảm {1 - exp (- 0,2715 × 0,8139k )} × 100%. Biểu đồ 11.8 vẽ biểu đồ ước tính ảnh hưởng của vụ 11/9

đối với giao thông hàng không, cho thấy rằng giao thông hàng không đã khôi phục lại những tổn thất
vào cuối năm 2003.

0,0

Hình 11.8 Ảnh hưởng dự kiến của vụ 11/9 đối với hàng loạt hành khách đường hàng không

11/9
Hiệu
ứng

0,1
0,2
0,3

1996 1998 2000 2002 2004

Thời gian

> Nine11p = 1 * (seq (airmiles) == 69)> plot


(ts (Nine11p * (- 0,0949) +
Machine Translated by Google

11.2 Ngoại lệ 257

filter (Nine11p, filter = .8139, method = 'recursive', side = 1) *


(-0.2715), frequency = 12, start = 1996), ylab = '9/11 Effects',
type = 'h'); abline (h = 0)

11.2 Ngoại lệ

Các quan sát ngoại lai đề cập đến các quan sát không điển hình có thể phát sinh do đo lường và / hoặc

lỗi sao chép hoặc do những thay đổi đột ngột, ngắn hạn trong quy trình cơ bản. Vì
chuỗi thời gian, hai loại ngoại lệ có thể được phân biệt, cụ thể là ngoại lệ cộng thêm và
những ngoại lệ sáng tạo . Hai loại ngoại lệ này thường được viết tắt là AO và IO,
tương ứng. Một ngoại lệ phụ gia xảy ra tại thời điểm T nếu quá trình cơ bản bị xáo trộn
cộng thêm tại thời điểm T để dữ liệu bằng


+ =Yt ωAPt () T (11.2.1)
Yt

trong đó {Yt} là quá trình không bị xáo trộn. Từ đó, trong phần này, Y ′ biểu thị
quá trình quan sát có thể bị ảnh hưởng bởi một số ngoại lệ và Y là quá trình không bị xáo trộn
′ ′
nên không có ngoại lệ. Vì vậy, nhưng ngược lại, vì vậy thời gian
Yt =
YT YT ωA + = Yt
sê-ri chỉ bị ảnh hưởng tại thời điểm T nếu nó có hệ số phụ tại T. Một hệ số phụ gia có thể
cũng được coi như một can thiệp có đáp ứng xung tại T sao cho mt ωAPt = () T .
Mặt khác, một ngoại lệ sáng tạo xảy ra tại thời điểm t nếu lỗi (còn được gọi là
Một sự đổi mới) tại thời điểm t bị xáo trộn (nghĩa là, sai số bằng nhau trong +đó=et
()
′ ,
et et ωI Pt
′ ′
là một quá trình tiếng ồn trắng trung bình bằng 0). Vì vậy, nếu không. Giả sử et =
eT nhưng eT ωI + = et
rằng quá trình không bị xáo trộn là đứng yên và thừa nhận một biểu diễn MA (∞)

= +++…
Yt et ψ1et 1– ψ2et 2–
Do đó, quá trình xáo trộn có thể được viết


= +++
′ ′ …
ψ1et 1– ′ ψ2et 2–
Yt et
= +
[] +++… ψt T - ωI et ψ1et 1– ψ2et 2–
hoặc


(11.2.2)
Yt Yt ψt T - ωI + =

trong đó ψ0 = 1 và ψj = 0 đối với j âm. Do đó, một ngoại lệ sáng tạo ở T làm đảo lộn tất cả
các quan sát vào và sau T, mặc dù với hiệu ứng giảm dần, vì sự quan sát cách xa điểm
gốc của yếu tố ngoại lai.
Để phát hiện một quan sát là AO hay IO, chúng tôi sử dụng biểu diễn AR (∞)
của quá trình không bị xáo trộn để xác định phần dư:


π1Yt 1– ′ π2Yt 2– ′ ––– =… (11.2.3)
tại Yt

Để đơn giản, chúng tôi giả sử quá trình không có giá trị trung bình và các tham số đã biết.
Trong thực tế, các giá trị tham số không xác định được thay thế bằng các ước tính của chúng từ dữ

liệu bị xáo trộn cố định. Theo giả thuyết vô hiệu của không có ngoại lệ và đối với các mẫu lớn, điều này
Machine Translated by Google

258 Mô hình hồi quy chuỗi thời gian

có ảnh hưởng không đáng kể đến các đặc tính của quy trình thử nghiệm được mô tả dưới đây. Nếu
chuỗi có đúng một IO tại thời điểm T thì aT dư = ωI + eT nhưng at = et thì ngược lại.
Vì vậy, ωI có thể được ước lượng bởi ω˜ I aT = với phương sai bằng σ2 . Do đó, một thống kê thử nghiệm cho

kiểm tra IO tại T là

tại
= -----
λ1, T (11.2.4)
σ

có (gần đúng) phân phối chuẩn chuẩn theo giả thuyết rỗng rằng
không có ngoại lệ trong chuỗi thời gian. Khi T được biết trước, quan sát trong

câu hỏi được tuyên bố là ngoại lệ nếu phần dư chuẩn hóa tương ứng vượt quá 1,96
về độ lớn với mức ý nghĩa 5%. Trong thực tế, thường không có kiến thức trước
về T, và thử nghiệm được áp dụng cho tất cả các quan sát. Ngoài ra, σ sẽ cần được giao phối.
Một thủ tục bảo thủ đơn giản là sử dụng quy tắc Bonferroni để kiểm soát
tỷ lệ lỗi tổng thể của nhiều bài kiểm tra. Để cho

λ1 = max1≤t≤n | λ1, t | (11.2.5)

đạt được tại t = T. Sau đó, quan sát thứ T được coi là IO nếu λ1 vượt quá giá trị trên
0,025 / n × 100 phần trăm của phân phối chuẩn chuẩn. Thủ tục này đảm bảo
rằng có tối đa 5% xác suất phát hiện sai IO. Lưu ý rằng một ngoại lệ
sẽ làm tăng ước tính khả năng xảy ra tối đa của σ, vì vậy nếu không có sự điều chỉnh đối với các trường

hợp ngoại lệ, sức mạnh của hầu hết các thử nghiệm thường bị giảm. Một ước tính chắc chắn về tiêu chuẩn tiếng ồn

độ lệch có thể được sử dụng thay cho ước tính khả năng tối đa để tăng sức mạnh
của bài kiểm tra. Ví dụ: σ có thể được ước lượng chính xác hơn bằng giá trị thặng dư tuyệt đối trung bình
lần 2 π⁄ .

Việc phát hiện một AO phức tạp hơn. Giả sử rằng quá trình thừa nhận một AO tại
T và không có ngoại lệ. Sau đó, nó có thể được hiển thị rằng

= - + et
tại ωAπt T - (11.2.6)

trong đó π0 = 1 và πj = 0 đối với j âm. Do đó, at = et đối với t < T, aT = ωA + eT,


aT + 1 = ωAπ1 + eT + 1, aT + 2 = ωAπ2 + eT + 2, v.v. Công cụ ước lượng bình phương nhỏ nhất của ωA

N
2 ω˜
T A, -ρ = πt T - lúc (11.2.7)
t 1 =

2 2 2 1–
ở đâu = ++++ , với phương sai của ước tính là
2 ρ (1 π1 ) π2 … Πn T -
bằng ρ2σ2. Sau đó chúng ta có thể xác định

ω˜
T A,
----------- =
λ2, T (11.2.8)
ρσ

như thống kê kiểm định để kiểm tra giả thuyết rỗng rằng chuỗi thời gian không có giá trị
ngoại lệ do đó, giả thuyết thay thế của AO tại T. Như trước đây, ρ và σ sẽ cần được giao

phối với nhau. Thống kê kiểm định λ2, T được phân phối xấp xỉ là N (0,1) dưới giá trị rỗng
giả thuyết. Một lần nữa, T thường không được biết, và thử nghiệm được áp dụng lặp đi lặp lại cho mỗi lần

điểm. Quy tắc Bonferroni một lần nữa có thể được áp dụng để kiểm soát tỷ lệ lỗi tổng thể.
Furrmore, bản chất của một ngoại vật không được biết trước. Trong trường hợp một người ngoại lệ
Machine Translated by Google

11.2 Ngoại lệ 259

được phát hiện tại T, nó có thể được phân loại là IO nếu | λ1, T | > | λ2, T | và một AO khác.
Xem Chang và cộng sự. (1988) cho một cách tiếp cận khác để phân loại bản chất của một ngoại nhân.
Khi tìm thấy một giá trị ngoại lệ, nó có thể được đưa vào mô hình và quy trình phát hiện ngoại lệ sau

đó có thể được lặp lại với mô hình đã tinh chỉnh cho đến khi không còn tìm thấy giá trị ngoại lệ nào nữa.

Ví dụ đầu tiên, chúng tôi mô phỏng một chuỗi thời gian có độ dài n = 100 từ mô hình ARIMA
(1,0,1) với φ = 0,8 và θ = 0,5. Sau đó, chúng tôi thay đổi quan sát thứ 10 từ 2,13 thành 10

(nghĩa là, ωA = 12,13); xem Hình 11.9. Dựa trên mẫu ACF, PACF và EACF, một mô hình AR (1) đã
được xác định tạm thời. Dựa trên quy tắc Bonferroni, các quan sát thứ 9, 10 và 11 được tìm thấy
là các ngoại lệ cộng tính có thể xảy ra với thống kê thử nghiệm xác thực tương ứng là 3,54,
9,55 và 5,20. Kiểm tra IO cho thấy quan sát thứ 10 và 11 có thể là IO, với thống kê kiểm tra
xác thực tương ứng là 7,11 và 6,64. Vì trong số các phép thử AO và IO có độ lớn lớn nhất xảy
ra cho phép thử AO ở T = 10, nên lần quan sát thứ 10 được đánh dấu tương ứng là một AO. Lưu ý
rằng thống kê thử nghiệm không được chứng nhận đối với AO tại T = 10 bằng 7,49, về cơ bản nhỏ
hơn giá trị thử nghiệm mạnh mẽ hơn là 9,55, cho thấy rằng việc xác minh ước tính của độ lệch
chuẩn tiếng ồn sẽ làm tăng sức mạnh của thử nghiệm. Sau khi kết hợp AO trong mô hình, không tìm
thấy bất kỳ ngoại lệ nào nữa. Đã bao giờ, ACF dư 1 độ trễ là đáng kể, cho thấy sự cần thiết phải
có tổng hợp MA (1). Do đó, mô hình ARIMA (1,0,1) + AO tại T = 10 đã được lắp vào dữ liệu. Mô hình
này được tìm thấy là không có ngoại lệ bổ sung và đã vượt qua tất cả các kiểm tra chẩn đoán mô
hình.

Hình 11.9 Quy trình ARIMA (1,0,1) được mô phỏng với chất phụ gia


y • AO ••
• •

• • • •• •
•• •

• • • • • • •
• •
• • •
• • • •


• •
• • •• ••
• •

•• •

•• •

8
6
4
2
0 2
10 • •• • ••
• • •

• • •
• ••• •• • •

•• •• • ••
• •• • ••
• •• •

• •
• ••••
• •

0 20 40 60 80 100

Thời gian

> Mã R mở rộng để mô phỏng và phân tích điều này


có thể tìm thấy ví dụ trong tệp kịch bản mã R cho Chương 11.

Đối với một ví dụ thực tế, chúng tôi quay trở lại mô hình ARIMA (0,1,1) × (0,1,1) 12 theo
mùa mà chúng tôi đã trang bị cho chuỗi thời gian carbon dioxide trong Chương 10. Biểu đồ chuỗi
thời gian của phần dư chuẩn hóa từ mô hình này, được thể hiện trong Hình 10.11 trên trang 238,
cho thấy một lượng dư tiêu chuẩn hóa lớn một cách đáng ngờ vào tháng 9 năm 1998. Tính toán cho

thấy rằng không có bằng chứng về hệ số phụ, vì λ2, t không lớn đáng kể đối với bất kỳ t nào.

Tuy nhiên, λ1 = max1≤t≤n | λ1, t | = 3,7527, đạt được ở t = 57, cor-


Machine Translated by Google

260 Mô hình hồi quy chuỗi thời gian

phản hồi vào tháng 9 năm 1998. Giá trị tới hạn của Bonferroni với α = 5% và n = 132

là 3,5544. Vì vậy λ1 quan sát được của chúng tôi đủ lớn để khẳng định tầm quan trọng đối với một sự đổi mới

ra ngoài vào tháng 9 năm 1998. Hình 11.10 cho thấy kết quả của việc lắp ARIMA (0,1,1)

× (0,1,1) 12 mô hình với IO tại t = 57 với chuỗi thời gian CO2. Những kết quả này sẽ

so với các kết quả trước đó được hiển thị trong Phụ lục 10.10 trên trang 237, trong đó giá trị ngoại lệ

đã không được tính đến. Chú ý rằng các ước lượng của θ và Θ không thay đổi lắm

nhiều, AIC tốt hơn (nghĩa là nhỏ hơn), và hiệu ứng IO rất đáng kể. Chẩn đoán nostics dựa trên mô hình
này hóa ra là tuyệt vời, không có bất kỳ ngoại lệ nào khác được phát hiện và

chúng tôi có một mô hình rất phù hợp cho chuỗi thời gian theo mùa này.

Hình 11.10 ARIMA (0,1,1) × (0,1,1) 12 Mô hình với IO tại t = 57 cho Dòng CO2

Hệ số IO-57 θ Θ

Ước tính 0,5925 0,8274 2.6770

Lỗi tiêu chuẩn 0,0775 0,1016 0,7246

2
σ ^ e = 0,4869: khả năng log = 133,08, AIC = 272,16

> m1.co2 = arima (co2, order = c (0,1,1), theo mùa = list (order = c (0,1,1),
kỳ = 12)); m1.co2
> phát hiệnAO (m1.co2); phát hiện (m1.co2)
> m4.co2 = arimax (co2, order = c (0,1,1), theo mùa = list (order = c (0,1,1),
kỳ = 12), io = c (57)); m4.co2

11.3 Tương quan giả

Mục đích chính của việc xây dựng mô hình chuỗi thời gian là để dự báo và ARIMA

mô hình thực hiện điều này bằng cách khai thác mẫu tự tương quan trong dữ liệu. Thông thường, thời gian

chuỗi đang nghiên cứu có thể liên quan đến, hoặc dẫn đầu bởi một số chuỗi thời gian đồng biến khác. Vì

ví dụ, Stige et al. (2006) phát hiện ra rằng sản xuất đồng cỏ ở Châu Phi nói chung có liên quan

đến một số chỉ số khí hậu. Trong những trường hợp như vậy, hiểu rõ hơn về quy trình cơ bản

và / hoặc các dự báo chính xác hơn có thể đạt được bằng cách kết hợp các hiệp biến có liên quan
vào mô hình chuỗi thời gian.

Gọi Y = {Yt } là chuỗi thời gian của biến phản ứng và X = {Xt } là hiệp biến

chuỗi thời gian mà chúng tôi hy vọng sẽ giúp giải thích hoặc dự báo Y. Để khám phá mối tương quan

giữa X và Y và mối quan hệ dẫn đầu của chúng, chúng tôi xác định hiệp phương sai chéo

function γt, s (X, Y) = Cov (Xt , Ys) cho mỗi cặp số nguyên t và s. Tính ổn định của chuỗi thời gian
đơn biến có thể dễ dàng mở rộng sang trường hợp chuỗi thời gian đa biến. Đối với đề thi, X và Y cùng

đứng yên (yếu) nếu phương của chúng không đổi và

hiệp phương sai γt, s (X, Y) là một hàm của chênh lệch thời gian t - s. Đối với các điểm chuyên nghiệp
đứng yên, hàm tương quan chéo giữa X và Y ở độ trễ k sau đó có thể được xác định bằng

ρk (X, Y) = Corr (Xt, Yt - k) = Corr (Xt + k, Yt ). Lưu ý rằng nếu Y = X, tương quan chéo

trở thành tự tương quan của Y ở độ trễ k. Hệ số ρ0 (Y, X) đo lường sự liên kết tuyến tính liên tục

giữa X và Y, trong khi ρk (X, Y) đo lường tuyến tính

sự kết hợp giữa Xt và của Yt - k. Nhớ lại rằng hàm tự tương quan là một
Machine Translated by Google

11.3 Tương quan giả 261

hàm chẵn, nghĩa là, ρk (Y, Y) = ρ k (Y, Y). (Điều này là do Corr (Yt , Yt - k) =
Corr (Yt - k, Yt ) = Corr (Yt, Yt + k), theo tính cố định.) Tuy nhiên, hàm tương quan chéo
nói chung không phải là một hàm chẵn vì Corr (Xt , Yt - k) không cần bằng Corr (Xt, Yt + k).
Như một minh họa, hãy xem xét mô hình hồi quy

= + + (11.3.1)
Yt β0 β1Xt d - et

trong đó X là các biến ngẫu nhiên độc lập, được phân phối giống hệt nhau với phương sai
2
2 và chữ e cũng là nhiễu trắng có phương sai và
σX σe độc lập với chữ X. Nó
có thể được kiểm tra rằng hàm tương quan chéo (CCF) ρk (X, Y) giống hệt nhau bằng không
ngoại trừ lag k = d, trong đó

β1σX
ρ – d (
) X Y,
= -----------------------------
(11.3.2)
2 2 2
+
β1 σX σe

Trong trường hợp này, CCF lý thuyết chỉ khác 0 ở độ trễ -d, phản ánh thực tế rằng X là
“Dẫn đầu” Y theo d đơn vị thời gian. CCF có thể được ước tính bằng hàm tương quan
chéo mẫu (CCF mẫu) được xác định bởi
_ _
(Xt )X - Yt k - ) Y-
rk () X Y,
= ------------------------------------------------- ----------------
_ (11.3.3)
_ 2 2
-
(Xt X ) -
(Yt Y )

nơi mà các tóm tắt được thực hiện trên tất cả dữ liệu mà các triệu hồi có sẵn. Các

mẫu CCF trở thành mẫu ACF khi Y = X. Đồng biến X độc lập với Y
nếu và chỉ khi β1 = 0, trong trường hợp đó, tự tương quan mẫu rk (X, Y) là xấp xỉ
được phân phối chuẩn với giá trị trung bình bằng 0 và phương sai 1 / n, trong đó n là cỡ mẫu —
số cặp (Xt , Yt ) có sẵn. Các mẫu tương quan chéo lớn hơn
1,96 ⁄ n về độ lớn sau đó được coi là khác 0 đáng kể.
Chúng tôi đã mô phỏng 100 cặp (Xt , Yt ) từ mô hình của Phương trình (11.3.1) với d
= 2, β0 = 0, và β1 = 1. X và e được tạo ra dưới dạng các biến ngẫu nhiên bình
thường lần lượt là N (0,1) và N (0,0,25). Về mặt lý thuyết, CCF sau đó sẽ
0 ngoại trừ ở độ trễ 2, trong đó nó bằngρ () X Y, = 1 ⁄ + 1 0,25 = 0,8944. Triển lãm

2– 11.11 cho thấy CCF mẫu của dữ liệu mô phỏng, có ý nghĩa ở độ trễ 2 và 3.
Nhưng CCF mẫu ở độ trễ 3 là khá nhỏ và chỉ đáng kể. Thật sai lầm
báo động không nằm ngoài dự đoán vì triển lãm hiển thị tổng cộng 33 giá trị CCF mẫu trong số
mà chúng tôi có thể mong đợi trung bình 33 × 0,05 = 1,65 cảnh báo sai.
Machine Translated by Google

262 Mô hình hồi quy chuỗi thời gian

Hình 11.11 Tương quan chéo mẫu từ Công thức (11.3.1) với d = 2

0,6

CCF

0,2

0,2

15 10 5 0 5 10 15

Lỗi

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> set.seed (12345); X = rnorm (105); Y = zlag (X, 2) +. 5 * rnorm (105)
> X = ts (X [- (1: 5)], start = 1, freq = 1); Y = ts (Y [- (1: 5)], start = 1, freq = 1)
> ccf (X, Y, ylab = 'CCF')

Mặc dù Xt - 2 tương quan với Yt, mô hình hồi quy được xem xét ở trên là
khá hạn chế, vì X và Y là từng chuỗi nhiễu trắng. Đối với chuỗi thời gian tĩnh,
biến phản hồi và hiệp biến thường tự tương quan với nhau và thuật ngữ lỗi
của mô hình hồi quy nói chung cũng là tự tương quan. Do đó, một hồi quy hữu ích hơn
mô hình được đưa ra bởi

= + + (11.3.4)
Yt β0 β1Xt d - Zt

trong đó Zt có thể tuân theo một số mô hình ARIMA (p, d, q) . Ngay cả khi quá trình X và Y là
độc lập với nhau (β1 = 0), tự tương quan trong Y và X có điều đáng tiếc là
hệ quả của việc ngụ ý rằng CCF mẫu không còn xấp xỉ N (0,1 / n).
Theo giả định rằng cả X và Y đều đứng yên và chúng độc lập với
nhau, nó chỉ ra rằng phương sai mẫu có xu hướng khác với 1 / n. Thực sự nó
có thể được chỉ ra rằng phương sai của nrk ( ) X Y, xấp xỉ

1 2 + (11.3.5)
ρk ( ) ρ X k () Y
k 1 =

trong đó ρk (X) là tự tương quan của X ở độ trễ k và ρk (Y) được định nghĩa tương tự cho
Quy trình Y. Để cải thiện kết quả tiệm cận này, hãy xem Box et al. (1994, tr. 413).
Sup pose X và Y đều là quá trình AR (1) với hệ số AR (1) lần lượt là φX và φY .
Khi đó rk (X, Y) được phân phối xấp xỉ chuẩn với giá trị trung bình bằng 0, nhưng phương sai là
bây giờ xấp xỉ bằng

1 φXφY +
-----------------------------

- (11.3.6)
n 1 φXφY ()
Machine Translated by Google

11.3 Tương quan giả 263

Khi cả hai hệ số AR (1) đều gần bằng 1, tỷ lệ phương sai lấy mẫu của

rk (X, Y) đến giá trị danh nghĩa của 1 / n tiến tới vô cùng. Do đó, việc sử dụng không cần nghi ngờ của

quy tắc 1 / n trong việc quyết định tầm quan trọng của CCF mẫu có thể dẫn đến nhiều sai lầm hơn
dương hơn tỷ lệ lỗi danh nghĩa 5%, mặc dù thời gian phản hồi và hiệp biến
các chuỗi là độc lập với nhau. Hình 11.12 cho thấy một số kết quả số cho

trường hợp φX = φY = φ.

Phụ lục 11.12 Tỷ lệ lỗi tiệm cận của một thử nghiệm danh nghĩa 5% về tính độc
lập cho một cặp quy trình AR (1)

φ = φX = φY 0,00 0,15 0,30 0,45 0,60 0,75 0,90

Tỷ lệ lỗi 5% 6% 7% 11% 18% 30% 53%

> phi = seq (0, .95, .15)


> từ chối = 2 * (1-pnorm (1,96 * sqrt ((1-phi ^ 2) / (1 + phi ^ 2))))
> M = signif (rbind (phi, từ chối), 2)
> rownames (M) = c ('phi', 'Tỷ lệ lỗi')
> M

Vấn đề phương sai tăng cao của các hệ số tương quan chéo mẫu
trở nên cấp tính hơn đối với dữ liệu không cố định. Trên thực tế, các hệ số tương quan chéo
của mẫu có thể không còn được phân phối gần đúng bình thường ngay cả với một mẫu lớn
kích thước. Hình 11.13 hiển thị biểu đồ của 1000 tương quan chéo không độ trễ mô phỏng
giữa hai quy trình IMA (1,1) độc lập, mỗi quy trình có kích thước 500. Hệ số MA (1)

của θ = 0,8 được sử dụng cho cả hai quá trình mô phỏng. Lưu ý rằng phân phối của r0 (X, Y) là
xa bình thường và phân tán rộng rãi giữa 1 và 1. Xem Phillips (1998) về một cuộc thảo luận
lý thuyết phù hợp.

Hình 11.13 Biểu đồ của 1000 mẫu có độ trễ bằng không Tương quan chéo của hai quá trình IMA
(1,1) độc lập Mỗi quá trình có kích thước 500

0,6

0,4

trọng
Tỉ

0,2

0,0

1,0 0,5 0,0 0,5 1,0

r0 (X, Y)
Machine Translated by Google

264 Mô hình hồi quy chuỗi thời gian

> set.seed (23457)


> tương quan.v = NULL; B = 1000; n = 500
> for (i in 1: B) {x = cumsum (arima.sim (model = list (ma = .8), n = n))
> y = cumsum (arima.sim (model = list (ma = .8), n = n))
> tương quan.v = c (tương quan.v, ccf (x, y, lag.max = 1,
plot = F) $ acf [2])}
> hist (tương quan.v, prob = T, xlab = biểu thức (r [0] (X, Y)))

Những kết quả này cung cấp cái nhìn sâu sắc về lý do tại sao đôi khi chúng ta thu được những thứ vô nghĩa (giả mạo)

tương quan giữa các biến chuỗi thời gian. Hiện tượng tương quan giả là
lần đầu tiên được nghiên cứu một cách có hệ thống bởi Yule (1926).

Ví dụ, sản lượng sữa hàng tháng và logarit của sản lượng hàng tháng ở Mỹ từ
tháng 1 năm 1994 đến tháng 12 năm 2005 được hiển thị
trong Phụ lục 11.14. Cả hai loạt phim đều có xu hướng tăng và mang tính thời vụ cao.

Hình 11.14 Sản lượng sữa hàng tháng và Logarit hàng tháng
Sản xuất điện ở Mỹ

Sữa

1700
1300

(điện)
Nhật

12,7
12,4

1994 1996 1998 2000 2002 2004 2006

Thời gian

> dữ liệu (sữa); dữ liệu (điện)


> milk. electroity = ts.intersect (sữa, log (điện))
> plot (milk. electroity, yax.flip = T)

Tính toán cho thấy rằng các chuỗi này có hệ số tương quan chéo ở độ trễ 0
là 0,54, "khác biệt có ý nghĩa thống kê so với 0" như được đánh giá dựa trên
tiêu chí lỗi tiêu chuẩn của1,96
Phụ ⁄ lục
n = 11.15 . thị các mối tương quan chéo mạnh mẽ
0,16 hiển

giữa hai biến này ở một số lượng lớn độ trễ.


Không cần phải nói, rất khó để đưa ra một lý do chính đáng cho mối quan hệ
giữa sản lượng điện hàng tháng và sản lượng sữa hàng tháng. Sự không ổn định trong
chuỗi sản xuất sữa và trong chuỗi điện có nhiều khả năng là nguyên nhân của
các mối tương quan giả được tìm thấy giữa hai chuỗi. Phần sau chứa
thảo luận thêm về ví dụ này.
Machine Translated by Google

11.4 Làm trắng da và hồi quy Stochastic 265

Hình 11.15 Mẫu tương quan chéo giữa sản lượng sữa hàng tháng và lôgarit của sản
lượng điện hàng tháng ở Hoa Kỳ

CCF

0,6
0,4
0,2
0,0

15 10 5 0 5 10 15

Lỗi

> ccf (as.vector (sữa. điện [, 1]),


as.vector (milk. electroity [, 2]), ylab = 'CCF')

11.4 Làm trắng da và hồi quy Stochastic

Trong phần trước, chúng tôi nhận thấy rằng với dữ liệu tự động tương quan mạnh, rất khó để
đánh giá sự phụ thuộc giữa hai quá trình. Vì vậy, nó là thích hợp để gỡ rối
kết hợp tuyến tính giữa X và Y, giả sử, từ sự tự tương quan của chúng. Một thiết bị hữu ích cho
làm điều này là làm trắng da. Nhớ lại rằng, đối với trường hợp X và Y đứng yên không
phụ thuộc vào nhau, phương sai của rk ( ) X Y, xấp xỉ


1
- 1 2 (11.4.1)
ρk ( ) ρ X k () Y
+ n k 1 =

Việc kiểm tra công thức này cho thấy rằng phương sai gần đúng là 1 / n nếu một trong hai
(hoặc cả hai) của X hoặc Y là một quá trình nhiễu trắng. Trong thực tế, dữ liệu có thể không cố định,

nhưng chúng có thể được chuyển đổi thành nhiễu trắng xấp xỉ bằng cách thay thế dữ liệu bằng
phần còn lại từ một mô hình ARIMA được trang bị. Ví dụ: nếu X theo sau ARIMA (1,1,0)
mô hình không có thuật ngữ chặn, sau đó
˜
X Xt =1– - - (φ -
Xt 1– Xt 2– ) t Xt = 1 - ()
1 + φB φB2 + ] Xt (11.4.2)

là tiếng ồn trắng. Nói chung hơn, nếu Xt tuân theo một số mô hình ARIMA (p, d, q) có thể đảo ngược , thì

nó thừa nhận một đại diện AR (∞)


˜ 2
X t = (–––… Xt π () B Xt 1 )π1B =π2B
˜ ˜
X
ở đó là tiếng ồn trắng. Quá trình biến đổi X thành 's qua fil ter Xπ (B) = 1 -

π1B - π2B2 - được gọi là làm trắng hoặc làm trắng da . Bây giờ chúng tôi có thể
Machine Translated by Google

266 Mô hình hồi quy chuỗi thời gian

nghiên cứu CCF giữa X và Y bằng cách làm trắng Y và˜ X bằng˜ cách sử dụng cùng một bộ lọc
Y là, chữ
trên quy trình X và sau đó tính toán CCF của và; nghĩa X Y được làm trắng
và X. Vì làm trắng da là một hoạt động tuyến tính , bất kỳ mối quan hệ tuyến tính nào giữa
loạt ban đầu ˜sẽ được bảo quản sau khi làm trắng da. Lưu ý rằng chúng ta đã lạm dụng thuật ngữ,
Y
không nhất thiết phải là nhiễu trắng vì bộ lọc π (B) chỉ được thiết kế riêng để˜ chuyển dạng X
thành quá trình nhiễu trắng — không phải Y. Hơn nữa, chúng ta giả định rằng bộ Ylọc này là tĩnh.
Cách tiếp cận này có hai ưu điểm: (i) ý nghĩa thống kê của CCF mẫu của
1,96
dữ liệu làm rõ có thể được đánh giá bằng cách sử dụng điểm giới hạn⁄ n ,
và (ii) lý thuyết

đối của CCF được ước lượng tỷ lệ với các hệ số hồi quy nhất định.
Để xem (ii), hãy xem xét một mô hình hồi quy tổng quát hơn liên quan đến X với Y và, không có

mất tính tổng quát, giả sử cả hai quy trình đều không có giá trị trung bình:

Yt = βj Xt j - Zt + (11.4.3)
j - = ∞

trong đó X độc lập với Z và các hệ số β sao cho quá trình này là
được xác định rõ. Trong mô hình này, các hệ số βk có thể khác không với bất kỳ số nguyên k
nào. Đã bao giờ, trong các ứng dụng thực tế, tổng vô hạn kép thường là một tổng hữu hạn để mô hình
đơn giản hóa thành

m2
Yt = βj Xt j - Zt , (11.4.4)
+ j m1 =

sẽ được giả định bên dưới mặc dù chúng tôi vẫn giữ nguyên tổng vô hạn kép
ký hiệu để dễ trình bày. Nếu tổng chỉ phạm vi trên một tập hợp hữu hạn số dương
các chỉ số, sau đó X dẫn trước Y và hiệp biến X đóng vai trò là một chỉ báo hàng đầu hữu ích cho
tương lai của Y. Áp dụng bộ lọc π (B) cho cả hai mặt của mô hình này, chúng tôi nhận được

˜ ˜ ˜
Yt = βkX tk - t
+
Z (11.4.5)
k - = ∞
˜
Z đâu ––– =…
˜ làm tắt các độ
t Zt π1Zt 1– π2Zt 2– . Quy trình làm trắng trước do đó trực giao
trễ khác nhau của ˜ ban đầu. Vì là tiếng ồn trắngX
˜ X trong mô hình hồi quy
˜ độc Xlập
trình tự và ˜ với Z , hệ số tương quan chéo lý thuyết
giữa và ở độX trễ k bằng
Y ( β – k σX ˜ σY ˜ ) ⁄ . Nói cách khác, thập giá lý thuyết

tương quan của các quá trình làm trắng ở độ trễ k tỷ lệ với hệ số hồi quy cient β-k.

Để phân tích sơ bộ nhanh chóng, có thể dễ dàng thực hiện việc làm da gần đúng
trước tiên bằng cách phân biệt dữ liệu (nếu cần) và sau đó điều chỉnh mô hình AR gần đúng với
thứ tự được xác định bằng cách giảm thiểu AIC. Ví dụ, đối với sản xuất sữa và
dữ liệu tiêu thụ điện, cả hai đều mang tính thời vụ cao và chứa đựng xu hướng. Do đó,
chúng có thể được phân biệt với cả sự khác biệt thông thường và sự khác biệt theo mùa, và
thì quá trình làm trắng da có thể được thực hiện bằng cách lọc cả hai chuỗi khác nhau bằng AR
mô hình phù hợp với dữ liệu sữa khác nhau. Hình 11.16 cho thấy CCF mẫu giữa
loạt da bò. Không có mối tương quan chéo nào bây giờ là đáng kể ngoại trừ độ trễ
3, chỉ có ý nghĩa nhỏ. Mối tương quan chéo có ý nghĩa duy nhất có thể là
báo động sai vì chúng tôi dự kiến có khoảng 1,75 cảnh báo sai trong số 35 mẫu điều chỉnh chéo
Machine Translated by Google

11.4 Làm trắng da và hồi quy Stochastic 267

hàng tấn được kiểm tra. Như vậy, có vẻ như sản xuất sữa và tiêu thụ điện đang

thực tế phần lớn không tương quan và mô hình tương quan chéo mạnh mẽ được tìm thấy giữa phần thô

chuỗi dữ liệu thực sự là giả.

Phụ lục 11.16 Mẫu CCF của Sữa trắng và Sản xuất điện

0,2

0,1

CCF

0,1
0,2
0,0

15 10 5 0 5 10 15

Lỗi

> me.dif = ts.intersect (diff (diff (milk, 12)),


diff (diff (log (điện), 12)))
> prewhiten (as.vector (me.dif [, 1]), as.vector (me.dif [, 2]),
ylab = 'CCF')

Mô hình được xác định bởi Công thức (11.3.4) trên trang 262 được gọi là

mô hình chức năng truyền, mô hình độ trễ phân tán hoặc mô hình hồi quy động.

Đặc điểm kỹ thuật mà độ trễ của hiệp biến nhập vào mô hình thường được thực hiện bởi

kiểm tra chức năng tương quan chéo của mẫu dựa trên dữ liệu làm rõ. Khi nào

mô hình dường như yêu cầu một số độ trễ hợp lý của hiệp biến, các hệ số hồi quy có thể được chỉ

định phân tích cú pháp thông qua một đặc tả ARMA tương tự như trường hợp

phân tích can thiệp; xem Box et al. (1994, Chương 11) để biết một số chi tiết. Chúng tôi minh họa

phương pháp dưới đây với hai ví dụ trong đó chỉ có một độ trễ của hiệp biến

cần thiết. Đặc điểm kỹ thuật của quá trình nhiễu ngẫu nhiên Zt có thể được thực hiện bằng cách kiểm tra

phần dư từ một bình phương nhỏ nhất thông thường (OLS) phù hợp của Y trên X bằng cách sử dụng các kỹ thuật

đã học trong các chương trước.

Ví dụ đầu tiên của chúng tôi về phần này là tập dữ liệu bán hàng và giá của một loại khoai tây chiên nhất định

từ Bluebird Foods Ltd., New Zealand. Dữ liệu bao gồm nhật ký được chuyển đổi

doanh số bán hàng theo đơn vị hàng tuần của các gói lớn khoai tây chiên tiêu chuẩn được bán và

giá bán theo tuần trong khoảng thời gian 104 tuần từ ngày 20 tháng 9 năm 1998 đến ngày 10 tháng 9,

Năm 2000; xem Phụ lục 11.17. Phép biến đổi logarit là cần thiết vì doanh số

dữ liệu rất lệch sang phải. Những dữ liệu này rõ ràng là không cố định. Hình 11.18

cho thấy rằng, sau khi phân biệt và sử dụng dữ liệu làm rõ, CCF chỉ có ý nghĩa ở

độ trễ 0, cho thấy mối quan hệ tiêu cực mạnh mẽ đồng thời giữa độ trễ 1 của giá cả

và bán hàng. Giá cao hơn có liên quan đến doanh số bán hàng thấp hơn.
Machine Translated by Google

268 Mô hình hồi quy chuỗi thời gian

Hình 11.17 Nhật ký hàng tuần (Bán hàng) và Giá cho Khoai tây chiên Bluebird

hàng
Việc
bán

300
100

bán
Giá

2,0
1,6
1,2

0 20 40 60 80 100

Thời gian

> dữ liệu (bluebird)


> plot (bluebird, yax.flip = T)

Hình 11.18 Mẫu tương quan chéo giữa nhật ký khác biệt được làm trắng (bán hàng) và giá
khoai tây chiên Bluebird

0,2
0,2
0,0

CCF

0,6

15 10 5 0 5 10 15

Lỗi

> prewhiten (y = diff (bluebird) [, 1], x = diff (bluebird) [, 2], ylab = 'CCF')

Hình 11.19 báo cáo các ước tính từ hồi quy OLS của nhật ký (doanh số bán hàng) về giá.
Tuy nhiên, các phần dư là tự tương quan, như có thể thấy từ ACF mẫu của chúng và
PACF lần lượt được hiển thị trong các Triển lãm 11.20 và 11.21. Thật vậy, các quan hệ tự
động lấy mẫu của các phần dư có ý nghĩa đối với bốn độ trễ đầu tiên, trong khi một phần của mẫu
tự tương quan có ý nghĩa ở độ trễ 1, 2, 4 và 14.
Machine Translated by Google

11.4 Làm trắng da và hồi quy Stochastic 269

Phụ lục 11.19 Các ước tính hồi quy OLS về Nhật ký (Bán hàng) về Giá

Ước tính Std. Lỗi giá trị t Pr (>)

Đánh chặn 15,90 0,2170 73,22 <0,0001

Giá bán 2.489 0,1260 19,75 <0,0001

> bán hàng = bluebird [, 1]; price = bluebird [, 2]


> chip.m1 = lm (doanh số ~ giá, dữ liệu = bluebird)
> tóm tắt (chip.m1)

Phụ lục 11.20 ACF mẫu của phần còn lại từ hồi quy OLS của nhật ký
(bán hàng) về giá

0,3

0,1
ACF

0,1
0,3

5 10 15 20

Lỗi

> acf (phần dư (chip.m1), ci.type = 'ma')

Hình 11.21 PACF mẫu của phần còn lại từ hồi quy OLS của nhật ký (bán
hàng) về giá

0,2

0,0
phần
một
ACF

0,2

5 10 15 20

Lỗi

> pacf (phần dư (chip.m1))


Machine Translated by Google

270 Mô hình hồi quy chuỗi thời gian

EACF mẫu của các phần dư, được thể hiện trong Hình 11.22, chứa một tam giác
các số không có đỉnh tại (1,4), do đó đề xuất mô hình ARMA (1,4). Do đó, chúng tôi phù hợp với một

mô hình hồi quy của nhật ký (bán hàng) về giá với lỗi ARMA (1,4).

Phụ lục 11.22 EACF mẫu của phần còn lại từ hồi quy OLS của nhật ký (bán hàng)
về giá

AR / MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 x x x x 0 0 xx 0 0 0 0 0 0
1 x 0 0 x 0 0 0 0 0 0 0 0 0 0
2 x x 0 x 0 0 0 0 0 0 0 0 0 0
3 x x 0 x 0 0 0 0 0 0 0 0 0 0
4 0 x x 0 0 0 0 0 0 0 0 0 0 0
5 x x x 0 x 0 0 0 0 0 0 0 0 0
6 x x 0 x xx 0 0 0 0 0 0 0 0
7 x 0 x 0 0 0 0 0 0 0 0 0 0 0

> eacf (phần dư (chip.m1))

Hóa ra là các ước tính của hệ số AR (1) và hệ số MA θ1


và θ3 không đáng kể, và do đó, một mô hình cố định các hệ số này bằng 0 là
sau đó được trang bị và báo cáo trong Phụ lục 11.23.

Phụ lục 11.23 Các ước tính về khả năng xảy ra tối đa của một mô hình hồi quy về nhật ký
(bán hàng) về giá với tập hợp con MA (4) cho các lỗi

Tham số θ1 θ2 θ3 θ4 Đánh chặn Giá bán

Ước tính 0 0.2884 0 0,5416 15,86 2.468

Lỗi tiêu chuẩn 0 0,0794 0 0 0,1167 0,1909 0,1100

σ2 được ước tính là 0,02623: khả năng log = 41,02, AIC = 70,05

> chip.m2 = arima (doanh số, đơn đặt hàng = c (1,0,4), xreg = data.frame (giá))
> chip.m2
> chip.m3 = arima (doanh số, đơn đặt hàng = c (1,0,4), xreg = data.frame (giá),
cố định = c (NA, 0, NA, 0, NA, NA, NA)); chip.m3
> chip.m4 = arima (doanh số, đơn đặt hàng = c (0,0,4), xreg = data.frame (giá),
cố định = c (0, NA, 0, NA, NA, NA)); chip.m4

Lưu ý rằng ước tính hệ số hồi quy về Giá tương tự như ước tính từ OLS
hồi quy phù hợp sớm hơn, nhưng sai số chuẩn của ước tính thấp hơn khoảng 10% so với
từ hồi quy OLS đơn giản. Điều này minh họa kết quả chung rằng OLS đơn giản
công cụ ước lượng nhất quán nhưng lỗi tiêu chuẩn liên quan thường không đáng tin cậy.
Machine Translated by Google

11.4 Làm trắng da và hồi quy Stochastic 271

Phần còn lại từ mô hình được trang bị này bởi và lớn vượt qua chẩn đoán mô hình khác nhau
kiểm tra ngoại trừ rằng ACF dư là đáng kể ở độ trễ 14. Do đó, một số Box-Ljung
thống kê thử nghiệm có giá trị p giáp với 0,05 khi 14 độ trễ trở lên của các tương quan tự
động còn lại được đưa vào thử nghiệm. Mặc dù ACF đáng kể ở độ trễ 14 có thể gây ảnh hưởng hàng
quý, chúng tôi không báo cáo một mô hình phức tạp hơn bao gồm độ trễ 14 vì
(1) 14 tuần không chính xác tạo ra một quý và (2) thêm thành phần MA theo mùa (1)
của giai đoạn 14 chỉ dẫn đến cải thiện nhỏ về mặt chẩn đoán mô hình.
Ví dụ thứ hai, chúng tôi nghiên cứu tác động của giá xăng dầu cao hơn đối với việc sử dụng
đường vận tải công cộng. Tập dữ liệu bao gồm số lượt đăng ký công khai hàng tháng
giao thông vận tải ở Denver, Colorado, khu vực cùng với giá đường dây gaso trung bình hàng
tháng ở Denver từ tháng 8 năm 2000 đến tháng 3 năm 2006. Cả hai biến đều sai lệch
ở bên phải và do đó được chuyển đổi nhật ký. Như chúng ta sẽ thấy bên dưới, sự hình thành biến
đổi logarit cũng làm cho mô hình phù hợp cuối cùng dễ hiểu hơn. Các âm mưu của chuỗi thời gian,
được hiển thị trong Hình 11.24, hiển thị các xu hướng ngày càng tăng cho cả các biến và theo mùa
sự biến động về số lượng nội trú. Dựa trên ACF và PACF mẫu, một
Mô hình ARIMA (2,1,0) được trang bị cho dữ liệu giá xăng. Mô hình được trang bị này sau đó đã
được sử dụng để lọc dữ liệu nội trú trước khi tính CCF mẫu của chúng được hiển thị trong
Hình 11.25. CCF mẫu có ý nghĩa ở độ trễ 0 và 15, cho thấy mối tương quan đồng thời thuận chiều
giữa giá xăng và việc sử dụng phương tiện giao thông công cộng. Các
CCF đáng kể ở độ trễ 15, tuy nhiên, không chắc là có thật, vì khó có thể hình dung tại sao
số lần lên tàu có thể dẫn đầu giá xăng với độ trễ 15 tháng. Trong trường hợp này,
cách tiếp cận sơ bộ nhanh chóng để làm trắng loạt phim bằng cách lắp một mô hình AR dài,
tuy nhiên, cho thấy rằng không có CCF nào là đáng kể. Nó chỉ ra rằng ngay cả sau khi mã hóa dữ
liệu khác nhau, AIC chọn một mô hình AR (16). Thứ tự cao hơn đã chọn được kết hợp với
với khoảng thời gian tương đối ngắn có thể làm suy yếu đáng kể khả năng phát hiện các mối tương
quan giữa hai biến. Ngẫu nhiên, ví dụ này cảnh báo không nên chỉ dựa vào
trên AIC để chọn mô hình AR bậc cao để làm trắng da, đặc biệt với dữ liệu chuỗi thời gian ngắn
tương đối.

Biểu đồ 11,24 Logarit của Nội trú Phương tiện Công cộng Hàng tháng và
Giá xăng tại Denver, tháng 8 năm 2000 đến tháng 3 năm 2006

trú)
(nội
Nhật

12,60
12,40

(giá)
Nhật

5,4
4,8

2001 2002 2003 2004 2005 2006

Thời gian

> dữ liệu (nội trú)


> plot (boardings, yax.flip = T)
Machine Translated by Google

272 Mô hình hồi quy chuỗi thời gian

Phụ lục 11.25 CCF mẫu của Nhật ký làm trắng (Nội thất) và Nhật ký (Giá)

0,2
0,1
0,0
CCF

0,2

1,0 0,5 0,0 0,5 1,0

Lỗi

> m1 = arima (boardings [, 2], order = c (2,1,0))


> prewhiten (x = boardings [, 2], y = boardings [, 1], x.model = m1)

Dựa trên ACF, PACF và EACF mẫu của các phần dư từ mô hình tuyến tính của
giá xăng lên xuống, dự kiến mô hình ARIMA (2,0,0) × (1,0,0) 12 theo mùa
được chỉ định cho quá trình lỗi trong mô hình hồi quy. Tuy nhiên, hệ số ước lượng φ2
không có ý nghĩa, và do đó thứ tự AR được giảm xuống p = 1. Sử dụng hệ số ngoại lệ
các kỹ thuật phát hiện được thảo luận trong Phần 11.2, chúng tôi đã tìm thấy một ngoại lệ phụ gia cho tháng Ba
2003 và một ngoại lệ sáng tạo vào tháng 3 năm 2004. Bởi vì thống kê thử nghiệm cho phụ gia

ngoại lệ có cường độ lớn hơn cường độ của ngoại lệ sáng tạo ( 4,09 so với 3,65), chúng tôi
đã kết hợp bộ phụ gia bên ngoài trong mô hình.
mô hình tiết lộ rằng ACF còn lại là đáng kể ở độ trễ 3, điều này cho thấy lỗi
quy trình là quy trình ARIMA theo mùa (1,0,3) × (1,0,0) 12+ . Như ước tính của
các hệ số θ1 và θ2 được tìm thấy là không đáng kể, chúng bị loại bỏ khỏi
mô hình được trang bị cuối cùng được báo cáo trong Phụ lục 11.26.

Chẩn đoán mô hình được trang bị cuối cùng cho thấy sự phù hợp tốt với dữ liệu. Ngoài ra, không còn nữa

các ngoại lệ đã được phát hiện. Khoảng tin cậy 95% cho hệ số hồi quy trên
Nhật ký (Giá) là (0,0249, 0,139). Lưu ý cách giải thích của mô hình được trang bị: a 100%
Việc tăng giá xăng sẽ dẫn đến việc sử dụng phương tiện giao thông công cộng tăng khoảng
8,2%.

† Điều tra sau đó cho thấy một trận bão tuyết 30 inch vào tháng 3 năm 2003 đã đóng cửa hoàn toàn
xuống Denver trong một ngày. Nó vẫn đóng cửa một phần trong vài ngày nữa.
Machine Translated by Google

11.5 Tóm tắt 273

Phụ lục 11.26 Ước tính khả năng xảy ra tối đa của Mô hình hồi quy

Ghi nhật ký (Lên máy bay) trên nhật ký (Giá) với lỗi ARMA

Tham số φ1 Nhật ký đánh chặn (Giá) Ngoại lệ


θ3 Φ1
Ước tính 0,8782 0,3836 0,8987 12.12 0,0819 0.0643

Lỗi tiêu chuẩn 0,0645 0,1475 0,0395 0,1638 0,0291 0,0109

σ2 được ước tính là 0,0004094: log-likelbility = 158,02, AIC = 304,05

> log.boardings = boardings [, 1]


> log.price = boardings [, 2]
> boardings.m1 = arima (log.boardings, order = c (1,0,0),
theo mùa = danh sách (order = c (1,0,0), period = 12), xreg
= data.frame (log.price))
> boardings.m1
> exploreAO (boardings.m1); phát hiện (boardings.m1)
> boardings.m2 = arima (log.boardings, order = c (1,0,3),
theo mùa = danh sách (order = c (1,0,0), period = 12), xreg
= data.frame (log.price, outlier = c (rep (0,31), 1, rep (0,36)) ), fixed = c (NA, 0,0,
rep (NA, 5)))
> nội trú.m2
> DiscoverAO (boardings.m2); phát hiện (boardings.m2)
> tsdiag (boardings.m2, tol = .15, gof.lag = 24)

Cũng cần lưu ý rằng việc loại bỏ thuật ngữ ngoại lệ khỏi mô hình dẫn đến

ước tính hồi quy mới trên Nhật ký (Giá) là 0,0619 với sai số chuẩn là 0,0372.

Do đó, khi hệ số ngoại lệ không được mô hình hóa đúng, hệ số hồi quy không còn là

đáng kể ở mức 5%. Như được chứng minh trong ví dụ này, sự hiện diện của một ngoại lệ

có thể ảnh hưởng xấu đến suy luận trong mô hình chuỗi thời gian.

11.5 Tóm tắt

Trong chương này, chúng tôi đã sử dụng thông tin từ các sự kiện khác hoặc chuỗi thời gian khác để giúp lập mô hình

chuỗi thời gian quan tâm chính. Chúng tôi bắt đầu với cái gọi là mô hình can thiệp,

cố gắng kết hợp các sự kiện bên ngoài đã biết mà chúng tôi tin rằng có ảnh hưởng đáng kể đến

chuỗi thời gian quan tâm. Nhiều cách đơn giản nhưng hữu ích khác nhau để mô hình hóa hiệu ứng của
những can thiệp này đã được thảo luận. Các giá trị ngoại lai là những quan sát sai lệch về cơ bản so

với mô hình chung của dữ liệu. Các mô hình được phát triển để phát hiện và loại bỏ tỷ lệ ngoại lệ

trong chuỗi thời gian. Tài liệu trong phần về tương quan giả minh họa

khó khăn như thế nào để đánh giá mối quan hệ giữa hai chuỗi thời gian, nhưng các phương pháp liên quan đến

da bò đã được chứng minh là giúp ích trong vấn đề này. Một số ví dụ quan trọng đã được sử dụng

để minh họa các phương pháp và kỹ thuật đã thảo luận.


Machine Translated by Google

274 Mô hình hồi quy chuỗi thời gian

BÀI TẬP

11.1 Tạo biểu đồ chuỗi thời gian về số dặm hành khách hàng không trong khoảng thời gian từ tháng 1 năm

1996 đến tháng 5 năm 2005 bằng cách sử dụng các ký hiệu biểu đồ theo mùa. Hiển thị biểu đồ toàn

màn hình và thảo luận về tính thời vụ được hiển thị. Dữ liệu nằm trong tệp có tên là airmiles.

11.2 Chứng tỏ rằng biểu thức cho mt trong Phương trình (11.1.7) trên trang 251 thỏa mãn đệ quy “AR

(1)” được cho trong Phương trình (11.1.6) với điều kiện ban đầu m0 = 0.

11.3 Tìm “thời gian bán hủy” của tác động can thiệp được chỉ định trong Công thức (11.1.6) trên trang

251 khi δ = 0,7.

11.4 Chứng tỏ rằng “thời gian bán hủy” của tác động can thiệp được chỉ định trong Công thức (11.1.6)

trên trang 251 tăng lên mà không bị ràng buộc khi δ tăng lên 1.

11.5 Chỉ ra rằng đối với tác động can thiệp được chỉ định bởi Công thức (11.1.6) trên trang 251

ω () T t - với t T
lim =
mt ≥, 0 ngược lại
δ 1 ,

11.6 Xem xét hiệu ứng can thiệp được hiển thị trong Phụ lục 11.3, (b), trang 253. (a) Chứng

tỏ rằng bước nhảy tại thời điểm T + 1 có độ cao ω như được hiển thị. (b) Chứng tỏ

rằng, như được hiển thị, tác động can thiệp có xu hướng ω / (1 - δ) là t
tăng mà không bị ràng buộc.

11.7 Xem xét hiệu ứng can thiệp được hiển thị trong Phụ lục 11.3, (c), trang 253. Chứng tỏ rằng hiệu

ứng tăng tuyến tính bắt đầu từ thời điểm T + 1 với độ dốc ω như được hiển thị.

11.8 Xem xét hiệu ứng can thiệp được hiển thị trong Phụ lục 11.4, (a), trang 254. (a) Chứng

tỏ rằng bước nhảy tại thời điểm T + 1 có độ cao ω như được hiển thị. (b) Cho thấy

rằng, như được hiển thị, tác động can thiệp có xu hướng trở về 0 khi t
tăng mà không bị ràng buộc.

11.9 Xem xét hiệu ứng can thiệp được hiển thị trong Phụ lục 11.4, (b), trang 254. (a) Chứng

tỏ rằng bước nhảy tại thời điểm T + 1 có độ cao ω1 + ω2 như được hiển thị. (b) Chỉ

ra rằng, như được hiển thị, tác động can thiệp có xu hướng ω2 khi t tăng lên với
ra ngoài ràng buộc.

11.10 Xem xét hiệu quả can thiệp được hiển thị trong Phụ lục 11.4, (c), trang 254.

(a) Chứng tỏ rằng bước nhảy tại thời điểm T có độ cao ω0 như được hiển

thị. (a) Chứng tỏ rằng bước nhảy tại thời điểm T + 1 có độ cao ω1 + ω2 như được

hiển thị. (b) Chỉ ra rằng, như được hiển thị, tác động can thiệp có xu hướng ω2 khi t tăng lên với
ra ngoài ràng buộc.

11.11 Mô phỏng 100 cặp (Xt , Yt ) từ mô hình của Phương trình (11.3.1) trên trang 261 với d = 3, β0 =

0 và β1 = 1. Sử dụng σX = 2 và σe = 1. Hiển thị và giải thích CCF mẫu giữa hai loạt này.

11.12 Chứng tỏ rằng khi X và Y là chuỗi thời gian AR (1) độc lập với các tham số φX và φY tương ứng,

thì Phương trình (11.3.5) trên trang 262 rút gọn để đưa ra Phương trình (11.3.6).

11.13 Chứng tỏ rằng đối với quá trình được


˜ xác định
˜ bởi Công thức (11.4.5) trên trang 266, tương quan
chéo X giữa
Y và tại độ trễ k được cho bởi ( β – k σX. ˜ σY ˜ ) ⁄
Machine Translated by Google

Bài tập 275

11.14 Mô phỏng chuỗi thời gian AR với φ = 0,7, μ = 0, = 1 và độ gian


dài nvà= kiểm
48. Vẽ
trađồACF
thịvàσePACF
chuỗi
mẫuthời
của
chuỗi. (a) Bây giờ thêm một phản ứng hàm bước có độ cao ω = 1 đơn vị tại thời điểm t = 36 vào

chuỗi mô phỏng. Chuỗi hiện có trung bình lý thuyết bằng 0 từ t = 1 đến 35 và trung bình 1 từ
t = 36 trở đi. Vẽ chuỗi thời gian mới và tính ACF và PACF mẫu cho chuỗi mới. So sánh những

kết quả này với kết quả của loạt bài gốc. (b) Lặp lại phần (a) nhưng với đáp ứng xung tại

thời điểm t = 36 của độ cao đơn vị, ω = 1. Vẽ đồ thị của chuỗi thời gian mới và tính ACF

và PACF mẫu cho chuỗi mới. So sánh những kết quả này với kết quả của loạt bài gốc. Hãy xem

liệu bạn có thể phát hiện ra giá trị ngoại lai của phụ gia tại thời điểm t = 36 hay không, giả

sử rằng bạn không biết ngoại lệ có thể xảy ra ở đâu.

11.15 Xem xét chuỗi thời gian dặm bay của hành khách được thảo luận trong chương này. Tệp được đặt

tên là airmiles. Chỉ sử dụng dữ liệu trước can thiệp (tức là dữ liệu trước tháng 9 năm 2001)

cho bài tập này. (a) Xác minh rằng ACF mẫu cho chuỗi logarit sai phân hai lần của dữ liệu

trước can thiệp như được trình bày trong Phụ lục 11.5 trên trang 255. (b) Biểu đồ được tạo

trong phần (a) gợi ý một ARIMA (0,1,1 ) × (0,1,0) 12. Phù hợp với mô hình này và đánh giá

mức độ đầy đủ của nó. Đặc biệt, hãy xác minh rằng các giá trị ngoại lệ cộng được phát hiện vào

tháng 12 năm 1996, tháng 1 năm 1997 và tháng 12 năm 2002. (c) Bây giờ phù hợp với mô hình

ARIMA (0,1,1) × (0,1,0) 12 + ba và đánh giá ade

quacy.

(d) Cuối cùng, phù hợp với mô hình ARIMA (0,1,1) × (0,1,1) 12 + ba ngoại lệ và đánh giá

sự đầy đủ.

11.16 Sử dụng logarit của bảng giá giao thông công cộng vùng Denver và chuỗi giá xăng Den ver. Dữ

liệu nằm trong tệp có tên boardings. (a) Hiển thị biểu đồ chuỗi thời gian của các lượt nội

trú hàng tháng bằng cách sử dụng biểu đồ theo mùa

các ký hiệu. Diễn giải cốt truyện.

(b) Hiển thị biểu đồ chuỗi thời gian của giá xăng trung bình hàng tháng bằng cách sử dụng biển

biểu tượng âm mưu. Diễn giải cốt truyện.


11.17 Tệp dữ liệu có tên deere1 chứa 82 giá trị liên tiếp cho lượng sai lệch (tính bằng đơn vị

0,000025 inch) so với giá trị mục tiêu được chỉ định mà quy trình gia công công nghiệp tại

Deere & Co. tạo ra trong một số điều kiện hoạt động cụ thể. Những dữ liệu này lần đầu tiên

được sử dụng trong Bài tập 6.33, trang 146, nơi chúng tôi quan sát thấy một giá trị ngoại lệ
rõ ràng tại thời điểm t = 27. (a) Điều chỉnh mô hình AR (2) bằng cách sử dụng dữ liệu gốc bao

gồm cả giá trị ngoại lệ. (b) Kiểm tra mô hình AR (2) được trang bị của phần (a) cho cả ngoại

lệ AO và IO. (c) Bây giờ phù hợp với mô hình AR (2) kết hợp một thuật ngữ trong mô hình cho

ngoại lệ. (d) Đánh giá sự phù hợp của mô hình trong phần (c) bằng cách sử dụng tất cả các công

cụ chẩn đoán của chúng tôi. Theo mệnh đề, hãy so sánh các đặc tính của mô hình này với mô hình

thu được trong phần (a).


Machine Translated by Google

276 Mô hình hồi quy chuỗi thời gian

11.18 Tệp dữ liệu có tên ngày chứa dữ liệu kế toán từ Công ty Winegard của Bur lington, Iowa. Dữ

liệu là số ngày cho đến khi Winegard nhận được thanh toán cho 130 đơn đặt hàng liên tiếp từ

một nhà phân phối sản phẩm Winegard cụ thể.

(Tên của nhà phân phối phải được giấu tên vì lý do bảo mật.)

Những dữ liệu này lần đầu tiên được điều tra trong Bài tập 6.39, trang 147, nhưng một số

ngoại lệ đã được quan sát thấy. Khi các giá trị ngoại lệ quan sát được thay thế bằng các giá

trị điển hình hơn, mô hình MA (2) được đề xuất. (a) Điều chỉnh mô hình MA (2) với dữ liệu

ban đầu và kiểm tra mô hình đã lắp cho cả AO


và IO ngoại lệ.

(b) Bây giờ phù hợp với mô hình MA (2) kết hợp các ngoại lệ vào mô hình. (c)

Đánh giá sự phù hợp của mô hình thu được trong phần (b). Đặc biệt, có thêm bất kỳ
liers chỉ ra?

(d) Phù hợp với mô hình MA (2) khác kết hợp bất kỳ ngoại lệ bổ sung nào được tìm thấy trong phần

(c) và đánh giá sự phù hợp của mô hình này.

11.19 Tệp dữ liệu có tên bluebirdlite chứa dữ liệu bán hàng và giá hàng tuần cho khoai tây chiên

Bluebird Lite. Thực hiện phân tích tương tự như phân tích đối với khoai tây chiên Bluebird

Standard đã bắt đầu ở trang 267.

11.20 Tệp có tên các đơn vị chứa doanh số bán hàng đơn vị hàng năm của một sản phẩm nhất định từ một

công ty quốc tế được biết đến rộng rãi trong những năm từ 1983 đến 2005. (Tên của công ty

phải được giấu tên vì lý do độc quyền.) (A) Vẽ chuỗi thời gian của đơn vị và mô tả những nét

chung của cốt truyện. (b) Sử dụng hồi quy bình phương nhỏ nhất thông thường để đưa một đường

thẳng vào đúng chuỗi. (c) Hiển thị PACF mẫu của phần dư từ mô hình này và chỉ định mô hình

ARIMA cho phần dư. (d) Bây giờ phù hợp với doanh số bán đơn vị mô hình = AR (2) + thời gian.
Diễn giải đầu ra. Cụ thể, hãy so sánh hệ số hồi quy ước tính trên biến thời gian thu được

ở đây với hệ số bạn thu được trong phần (b). (e) Thực hiện phân tích kỹ lưỡng các phần còn

lại từ mô hình cuối cùng này. (f) Lặp lại các phần (d) và (e) bằng cách sử dụng logarit

của doanh số bán hàng đơn vị khi phương án phản hồi có thể. So sánh những kết quả này với

những kết quả thu được ở phần (d) và (e).

11.21 Trong Chương 5–8, chúng tôi đã nghiên cứu mô hình IMA (1,1) cho logarit của giá dầu hàng tháng.

Hình 8.3 trên trang 178 gợi ý rằng có thể có một số ngoại lệ trong loạt bài này. Điều tra mô

hình IMA (1,1) cho loạt bài này để tìm các giá trị ngoại lệ bằng cách sử dụng các kỹ thuật

được phát triển trong chương này. Đảm bảo so sánh kết quả của bạn với những kết quả thu được

trước đó đã bỏ qua những ngoại lệ. Dữ liệu nằm trong tệp có tên dầu.
Machine Translated by Google

CHƯƠNG 12
CÁC MÔ HÌNH DÒNG THỜI GIAN CỦA

KHẢ NĂNG LÀM VIỆC

Các mô hình được thảo luận cho đến nay liên quan đến cấu trúc trung bình có điều kiện của dữ liệu chuỗi thời gian.

Tuy nhiên, gần đây, đã có nhiều nghiên cứu về việc lập mô hình cấu trúc biến thể có điều kiện
của dữ liệu chuỗi thời gian — chủ yếu được thúc đẩy bởi nhu cầu về mô hình tài chính. Gọi

{Yt } là một chuỗi thời gian quan tâm. Phương sai có điều kiện của Yt cho các giá trị Y trong
quá khứ , Yt - 1, Yt - 2,…, đo độ không chắc chắn về độ lệch của Yt so với giá trị trung bình
điều kiện E (Yt | Yt - 1, Yt - 2,…). Nếu {Yt } tuân theo một số mô hình ARIMA, thì phương sai
có điều kiện (đi trước một bước) luôn bằng phương sai nhiễu đối với bất kỳ giá trị hiện tại và
quá khứ nào của quá trình. Thật vậy, hằng số của phương sai có điều kiện đúng với các dự đoán
về bất kỳ số bước cố định nào phía trước đối với quy trình ARIMA. Trong thực tế, phương sai có
điều kiện (trước một bước) có thể thay đổi theo giá trị hiện tại và quá khứ của quá trình, và
như vậy, phương sai có điều kiện tự nó là một quá trình ngẫu nhiên, thường được gọi là quá
trình phương sai có điều kiện. Ví dụ, lợi nhuận hàng ngày của cổ phiếu thường được quan sát là
có phương sai có điều kiện lớn hơn sau một giai đoạn biến động giá dữ dội so với giai đoạn
tương đối ổn định. Việc phát triển các mô hình cho quá trình phương sai có điều kiện mà chúng
ta có thể dự đoán sự biến thiên của các giá trị trong tương lai dựa trên giá trị thuê và dữ
liệu quá khứ là mối quan tâm chính của chương này. Ngược lại, các mô hình ARIMA được nghiên cứu
trong các chương trước đó tập trung vào cách dự đoán giá trị trung bình có điều kiện của các
giá trị trong tương lai dựa trên dữ liệu hiện tại và quá khứ.
Trong tài chính, phương sai có điều kiện của tỷ suất sinh lợi của một tài sản tài chính
thường được sử dụng như một thước đo rủi ro của tài sản đó. Đây là một thành phần quan trọng
trong lý thuyết toán học về định giá tài sản tài chính và các tính toán VaR (Giá trị rủi ro);
ví dụ, xem Tsay (2005). Trong một thị trường hiệu quả, lợi nhuận kỳ vọng (trung bình có điều
kiện) phải bằng 0 và do đó chuỗi lợi nhuận phải là nhiễu trắng. Các chuỗi như vậy có cấu trúc
tự tương quan đơn giản nhất. Do đó, để dễ trình bày, chúng tôi sẽ giả định trong một vài phần
đầu tiên của chương này rằng dữ liệu là lợi nhuận của một số tài sản tài chính và là nhiễu
trắng; tức là dữ liệu không tương quan với nhau. Bằng cách đó, ban đầu chúng ta có thể tập
trung vào việc nghiên cứu cách lập mô hình cấu trúc phương sai có điều kiện của một chuỗi thời
gian. Đến cuối chương, chúng ta thảo luận về một số sơ đồ đơn giản để lập mô hình đồng thời giá
trị trung bình có điều kiện và cấu trúc phương sai có điều kiện bằng cách kết hợp mô hình ARIMA
với mô hình phương sai thay đổi có điều kiện.

277
Machine Translated by Google

278 Mô hình chuỗi thời gian của phương sai thay đổi

12.1 Một số đặc điểm chung của chuỗi thời gian tài chính

Như một ví dụ về chuỗi thời gian tài chính, chúng tôi xem xét các giá trị hàng ngày của một đơn vị

Quỹ cổ phiếu CREF trong khoảng thời gian từ ngày 26 tháng 8 năm 2004 đến ngày 15 tháng 8 năm 2006. CREF

quỹ chứng khoán là một quỹ bao gồm vài nghìn cổ phiếu và không được giao dịch công khai trên thị trường

chứng khoán. † Vì cổ phiếu không được giao dịch vào cuối tuần hoặc ngày lễ, chỉ vào những ngày được

gọi là giao dịch trong ngày, dữ liệu CREF không thay đổi vào cuối tuần và ngày lễ. Vì đơn giản, chúng tôi

sẽ phân tích dữ liệu như thể chúng được đặt cách đều nhau. Hình 12.1 cho thấy chuỗi thời gian

đồ thị của dữ liệu CREF. Nó cho thấy một xu hướng tăng nói chung với một gợi ý về khả năng thay đổi

cao hơn với mức giá trị cổ phiếu cao hơn. Giả sử {pt } là chuỗi thời gian của hàng ngày

giá của một số tài sản tài chính. Lợi nhuận (gộp liên tục) vào ngày thứ t là
định nghĩa là

rt - = pt
(log
1– pt
) () log (12.1.1)

Đôi khi lợi nhuận được nhân với 100 để chúng có thể được hiểu là phần trăm thay đổi của giá. Phép nhân

cũng có thể làm giảm lỗi số vì

lợi nhuận thô có thể là những con số rất nhỏ và tạo ra lỗi làm tròn lớn trong một số đỉnh cal.

Hình 12.1 Giá trị cổ phiếu CREF hàng ngày: 26 tháng 8 năm 2004 đến 15 tháng 8 năm 2006

210210

CREF
CREF

190

170

0 0 100
100 200
200 300
300 400
400 500
500

Thời
Thời gian
gian

> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)

> dữ liệu (CREF); âm mưu (CREF)

Hình 12.2 vẽ biểu đồ chuỗi trả về CREF (cỡ mẫu = 500). Cốt truyện cho thấy rằng

lợi nhuận biến động nhiều hơn trong một số khoảng thời gian và trở nên rất dễ bay hơi đối với

cuối kỳ nghiên cứu. Có thể thấy rõ hơn quan sát này bằng cách vẽ biểu đồ

biểu đồ trình tự thời gian của lợi nhuận tuyệt đối hoặc bình phương; xem Bài tập 12.1, trang 316.

† CREF là viết tắt của College Retirement Equities Fund — một nhóm quỹ cổ phiếu và trái phiếu quan trọng

đối với nhiều kế hoạch nghỉ hưu của giảng viên đại học.
Machine Translated by Google

12.1 Một số đặc điểm chung của chuỗi thời gian tài chính 279

Những kết quả này có thể được kích hoạt bởi sự bất ổn ở Trung Đông do chiến tranh ở

miền nam Lebanon từ ngày 12 tháng 7 đến ngày 14 tháng 8 năm 2006, giai đoạn được tô màu xám ở

Các vật chứng 12.1 và 12.2. Mô hình xen kẽ các khoảng thời gian yên tĩnh và không ổn định của

khoảng thời gian phụ này được gọi là phân nhóm biến động trong tài liệu. Sự biến động trong một thời gian

chuỗi liên quan đến hiện tượng trong đó phương sai có điều kiện của chuỗi thời gian thay đổi

tăng ca. Nghiên cứu về mô hình động lực trong sự biến động của một chuỗi thời gian (nghĩa là

quá trình phương sai có điều kiện của chuỗi thời gian) tạo thành chủ đề chính của

chương.

Hình 12.2 Hàng ngày Trả về Cổ phiếu CREF: Ngày 26 tháng 8 năm 2004 đến ngày 15 tháng 8 năm 2006

2
0,02

1
r.cref
r.cref
0,00
0

0.02
1
2

100 200 300 400 500


0 0 100 200 300 400 500

Thời gian
Thời gian

> r.cref = diff (log (CREF)) * 100


> plot (r.cref); abline (h = 0)

ACF và PACF mẫu của CREF hàng ngày trả về (nhân với 100), được hiển thị

trong các Hình ảnh minh họa 12.3 và 12.4, gợi ý rằng lợi nhuận có rất ít tương quan tuần tự. Các

mẫu EACF (không được hiển thị) cũng gợi ý rằng một mô hình tiếng ồn trắng thích hợp cho

những dữ liệu này. Lợi nhuận CREF trung bình bằng 0,0493 với sai số chuẩn là 0,02885.

Do đó, giá trị trung bình của quá trình trả về không khác 0 có ý nghĩa thống kê.

Điều này được mong đợi dựa trên giả thuyết thị trường hiệu quả được đề cập trong phần giới thiệu

đến chương này.


Machine Translated by Google

280 Mô hình chuỗi thời gian của phương sai thay đổi

Hình 12.3 ACF mẫu của Kết quả CREF hàng ngày: 26/8/04 đến 15/08/06

ACF

0,05
0,10
0,05
0,00

0 5 10 15 20 25

Lỗi

> acf (r.cref)

Hình 12.4 PACF mẫu của lợi nhuận CREF hàng ngày: 26/8/04 đến 15/08/06

phần
một
ACF

0,05
0,05
0,00

0 5 10 15 20 25

Lỗi

> pacf (r.cref)

Tuy nhiên, phân nhóm biến động được quan sát trong dữ liệu trả về CREF cho chúng ta một gợi ý

rằng chúng có thể không được phân phối độc lập và giống hệt nhau — nếu không thì phương sai

sẽ không đổi theo thời gian. Đây là dịp đầu tiên chúng tôi nghiên cứu về các mô hình chuỗi thời gian

nơi chúng ta cần phân biệt giữa các giá trị chuỗi là không tương quan và các giá trị chuỗi

độc lập. Nếu các giá trị chuỗi thực sự độc lập, thì tức thời phi tuyến

các phép biến đổi chẳng hạn như lấy logarit, giá trị tuyệt đối hoặc bình phương bảo toàn tính không

xác định. Tuy nhiên, điều tương quan không đúng, vì tương quan chỉ là thước đo

của sự phụ thuộc tuyến tính. Có thể khám phá cấu trúc phụ thuộc nối tiếp bậc cao hơn trong dữ liệu

bằng cách nghiên cứu cấu trúc tự tương quan của lợi tức tuyệt đối (của biến thể lấy mẫu ít hơn
Machine Translated by Google

12.1 Một số đặc điểm chung của chuỗi thời gian tài chính 281

khả năng với ít khả năng kiểm soát toán học hơn) hoặc lợi nhuận bình phương (có độ biến
thiên sam pling lớn hơn nhưng có khả năng quản lý cao hơn về mặt lý thuyết thống kê). Nếu
lợi nhuận được phân phối độc lập và giống hệt nhau, sau đó lợi nhuận tuyệt đối cũng vậy (như
là lợi nhuận bình phương), và do đó chúng cũng sẽ là tiếng ồn trắng. Do đó, nếu lợi nhuận
abso lute hoặc bình phương thừa nhận một số tự tương quan đáng kể, thì những tions
autocorrela này cung cấp một số bằng chứng chống lại giả thuyết rằng lợi nhuận là độc lập
và được phân phối giống nhau. Thật vậy, ACF và PACF mẫu của lợi tức tuyệt đối
và những lợi nhuận bình phương trong Phần hiển thị 12.5 đến 12.8 hiển thị một số
tự tương quan và do đó cung cấp một số bằng chứng cho thấy lợi nhuận CREF hàng ngày không
phân phối độc lập và giống hệt nhau.

Biểu đồ 12.5 ACF mẫu về lợi nhuận CREF hàng ngày tuyệt đối

0,15

0,05

ACF

0,05

0 5 10 15 20 25

Lỗi
> acf (abs (r.cref))

Hình 12.6 PACF mẫu của lợi nhuận CREF hàng ngày tuyệt đối

0,05

phần
một
ACF

0,05

0 5 10 15 20 25

Lỗi

> pacf (abs (r.cref))


Machine Translated by Google

282 Mô hình chuỗi thời gian của phương sai thay đổi

Hình 12.7 ACF mẫu của Lợi nhuận CREF Hàng ngày Bình phương

0,15

ACF

0,05
0,05

0 5 10 15 20 25

Lỗi
> acf (r.cref ^ 2)

Hình 12.8 PACF mẫu của Lợi nhuận CREF Hàng ngày Bình phương

0,15

0,05

phần
một
ACF

0,05

0 5 10 15 20 25

Lỗi

> pacf (r.cref ^ 2)

Những công cụ trực quan này thường được bổ sung bằng cách chính thức kiểm tra xem bình phương

dữ liệu được tự động tương quan bằng cách sử dụng thử nghiệm Box-Ljung. Bởi vì không cần lắp mô hình,

bậc tự do của phân phối chi bình phương gần đúng cho Box-Ljung

thống kê bằng số lượng các mối tương quan được sử dụng trong bài kiểm tra. Do đó, nếu chúng ta

sử dụng m autocorre của dữ liệu bình phương trong thử nghiệm, thì thống kê thử nghiệm là xấp xỉ

chi bình phương được phân bổ với m bậc tự do, nếu không có ARCH. Cách tiếp cận này có thể được mở rộng

trong trường hợp khi giá trị trung bình có điều kiện của quá trình là khác 0 và nếu ARMA

mô hình phù hợp trong việc mô tả cấu trúc tự tương quan của dữ liệu. Trong trường hợp,

m tự tương quan đầu tiên của phần dư bình phương từ mô hình này có thể được sử dụng để kiểm tra

vì sự hiện diện của ARCH. Thống kê Box-Ljung tương ứng sẽ có


Machine Translated by Google

12.1 Một số đặc điểm chung của chuỗi thời gian tài chính 283

phân phối chi bình phương với m bậc tự do theo giả định không có ARCH

hiệu lực, xem McLeod và Li (1983) và Li (2004). Dưới đây, chúng tôi sẽ tham khảo thử nghiệm cho

Hiệu ứng ARCH bằng cách sử dụng thống kê Box-Ljung với phần dư hoặc dữ liệu bình phương là
Thử nghiệm McLeod- Li.

Trên thực tế, sẽ rất hữu ích nếu áp dụng thử nghiệm McLeod-Li cho ARCH bằng cách sử dụng một số

trễ và vẽ biểu đồ giá trị p của bài kiểm tra. Hình 12.9 cho thấy các bài kiểm tra McLeod-Li đều là

có ý nghĩa với mức ý nghĩa 5% khi có hơn 3 độ trễ trong phép thử.

Điều này hoàn toàn phù hợp với mô hình trực quan trong Phụ lục 12.7 và chính thức cho thấy

bằng chứng mạnh mẽ cho ARCH trong dữ liệu này.

Hình 12.9 Thống kê Kiểm tra McLeod-Li cho Lợi nhuận CREF Hàng ngày

1,0

0,8

0,6

trị
Giá
P
0,4 •

0,2


0,0
•• • • • • •••••••••••

0 5 10 15 20 25

Lỗi

> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> McLeod.Li.test (y = r.cref)

Hình dạng phân phối của lợi nhuận CREF có thể được khám phá bằng cách xây dựng một QQ

biểu đồ điểm bình thường — xem Phụ lục 12.10. Cốt truyện QQ gợi ý rằng sự phân phối của

lợi nhuận có thể có đuôi dày hơn so với phân phối bình thường và có thể hơi

lệch về bên phải. Thật vậy, thống kê thử nghiệm Shapiro-Wilk để kiểm tra tính bình thường bằng

0,9932 với giá trị p bằng 0,024, và do đó chúng tôi bác bỏ giả thuyết bình thường tại

các mức ý nghĩa thông thường.


Machine Translated by Google

284 Mô hình chuỗi thời gian của phương sai thay đổi

Biểu đồ 12.10 QQ Lô đất bình thường của lợi nhuận CREF hàng ngày

2 • • •

• • • • • • • • •

• • • • • • • • • • • •

• • • • • • • • • • • • • •


• • • • • • • • • • • • • • •

1 • •• •• •• •• •• •• •• •• •• •( • • • • • • •

••
•• ••
••• ••• •••
••• ••• ••• ••
••••••••••••••••••••••••••

••
• • • • •
••• ••• ••• ••• ••• •
•••••••••••••••••"••••••••••••
•••••• •••••••••••••••••••••••••••••••••••••••••••••••

••
••
•••••••••••
•••••••••••••••••••••••••••••••••(•••••••••••••••••••
•• •••••••••
••••
••
••••••••••••••••••••••••••••••••••••••
(•)

0 •••
••
••
••••
••••
•••••••••••••••••••••••

•••
••••
•••••••••••••••••••••••••••••••••••••••••••••••

••
•• •• •• •• •• •• •• •• ••

••
• •••••••••••••••••••••••••••••••••• ••••••••••••( •••••••

•••
••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••••
• •• •• •• •• •• •• •• •• •• •• •• •• •• •(



••

•••
••
••••
•••
••• •• ••••
••••• ••••• ••••• •
•••
•••••
•••
•••••
•••
•••••
•••

••
••
•••• •••• •••• •••• •

••
•• •• •• •• ••

•••
Lượng
mẫu
tử ••••
•••••••••
• • • •
•••••••• •••••
••••
••••
••••• •••
•••••••••••• •••••• •••••• •••••• •
•••• •••• •••• •••• •••• •••• ••
• •••
••••••
••••••••
••••••••
••••••••
••••••••
•(
••••••••••••

1
2

3 2 1 0 1 2 3

Lượng tử lý thuyết

> win.graph (width = 2.5, height = 2.5, pointsize =


8)> qqnorm (r.cref); qqline (r.cref)

Độ lệch của một biến ngẫu nhiên, chẳng hạn Y, được xác định bởi E (Y μ) 3 / σ3, trong
đó μ và σ lần lượt là giá trị trung bình và độ lệch chuẩn của Y. Nó có thể được ước tính bằng
độ lệch mẫu

N _
3 nσ ^ 3 (12.1.2)
g1 = (Yi -Y ⁄ )()
tôi 1 =
_
2
ở đâu
σ ^ 2 = Σ (Yi) Y- ⁄ n là phương sai mẫu. Độ lệch mẫu của trả về CREF bằng 0,116. Độ
dày của phần đuôi của phân bố so với phân bố không phải là 4 / σ4 - 3. mal thường được đo bằng
(dư thừa), được định nghĩa là E (Y - μ) kurtosis

Đối với các phân phối bình thường, kurtosis luôn bằng không. Một phân bố có hệ số
kurtosis posi tive được gọi là phân phối có đuôi nặng , trong khi nó được gọi là có đuôi
nhẹ nếu kurtosis của nó là âm. Kurtosis có thể được ước tính bằng kurtosis mẫu

N _
4 nσ ^ 4 (12.1.3)
g2 = (Yi -Y ⁄ )() 3–
tôi 1 =

Kurtosis mẫu của CREF trả về bằng 0,6274. Một định nghĩa thay thế của kurtosis sửa đổi
công thức và sử dụng E (rt - μ) 4 / σ4; nghĩa là, nó không trừ ba khỏi tỷ lệ. Chúng tôi sẽ
luôn sử dụng định nghĩa cũ cho kurtosis.
Một thử nghiệm khác cho tính chuẩn là kiểm định Jarque-Bera, dựa trên thực tế là phân
phối chuẩn không có độ lệch bằng 0 và độ lệch bằng không. Giả sử dữ liệu được phân phối độc
lập và giống hệt nhau Y1, Y2,…, Yn, thống kê thử nghiệm Jarque-Bera được định nghĩa là

2 2
ng1 ng2
JB + =--------
-------- (12.1.4)
6 24
Machine Translated by Google

12.2 Mô hình ARCH (1) 285

trong đó g1 là độ lệch mẫu và g2 là độ lệch mẫu. Theo giả thuyết rỗng của chuẩn
tắc, thống kê kiểm định Jarque-Bera được phân phối xấp xỉ là χ2 với hai bậc tự do.
Trên thực tế, theo giả định thông thường, mỗi lần triệu hồi và xác định chỉ số
Jarque-Bera là xấp xỉ χ2 với 1 bậc tự do. Thử nghiệm Jarque-Bera bác bỏ giả định về
tính chuẩn nếu thống kê thử nghiệm quá lớn. Đối với lợi nhuận CREF, JB = 500 ×
0,1162 / 6 + 500 × 0,62742 / 24 = 1,12 + 8,20 = 9,32 với giá trị p bằng 0,011. Nhớ
lại rằng 5 phần trăm trên của phân phối χ2 với đơn vị bậc tự do bằng 3,84. Do đó,
dữ liệu có vẻ không bị lệch nhưng có phần đuôi tương đối nặng. Đặc biệt, giả định
về tính chuẩn không phù hợp với dữ liệu trả về CREF - một kết luận cũng phù hợp với
kết quả của thử nghiệm Sha piro-Wilk.

Tóm lại, dữ liệu trả về CREF được phát hiện là không tương quan theo thứ tự nhưng
thừa nhận một cấu trúc phụ thuộc bậc cao hơn, cụ thể là phân nhóm biến động và phân bổ
theo thứ tự nặng. Người ta thường nhận thấy rằng các đặc điểm như vậy khá phổ biến trong
số liệu chuỗi thời gian tài chính. Các mô hình GARCH được giới thiệu trong các phần tiếp
theo cố gắng cung cấp một khuôn khổ để mô hình hóa và phân tích chuỗi thời gian hiển thị
một số đặc điểm này.

12.2 Mô hình ARCH (1)

Engle (1982) lần đầu tiên đề xuất mô hình phương sai thay đổi có điều kiện tự hồi quy (ARCH)
để lập mô hình phương sai thay đổi của một chuỗi thời gian. Như đã thảo luận trong phần
trước, chuỗi lợi nhuận của tài sản tài chính, chẳng hạn {rt }, thường là một chuỗi không
tương quan với nhau với giá trị trung bình bằng 0, ngay cả khi nó thể hiện sự phân nhóm biến
động. Điều này cho thấy rằng phương sai có điều kiện của rt được trả về trong quá khứ không
2
phải là hằng số. Phương sai có điều kiện, còn được gọi là độ biến động có điều
σt | t
,
kiện,
1– sẽcủa
được
rt
biểu thị bằng chỉ số con t - 1 biểu thị rằng điều kiện là khi trả về trong thời gian t - 1.
Khi có 2 2 rt , lợi tức bình phương cung trị
cấp không
một giá
chệch
công cụ ước lượng của chuỗi A rt σt đoạn
| t 1– lợi đối
tương nhuận bình
biến phương
động. lớnlại,
Ngược có thể báo . nhuận
loạttrước
mộtbình lợigiai
một
phương nhỏ
có thể báo trước một thời kỳ tương đối yên tĩnh. Mô hình ARCH là mô hình hồi quy về mặt vật
lý với biến động có điều kiện là biến phản hồi và độ trễ trong quá khứ của lợi nhuận bình
phương là biến số. Ví dụ: mô hình ARCH (1) giả định rằng chuỗi trả về {rt } được tạo như sau:

= (12.2.1)
rt σt | t 1– εt

2 2
+ =ω αrt 1– (12.2.2)
σt | t 1–

trong đó α và ω là các tham số chưa biết, {εt } là một chuỗi các biến ngẫu nhiên phân bố
độc lập và xác định theo chu kỳ, mỗi biến có phương sai đơn vị và giá trị trung bình bằng

0 (còn được gọi là đổi mới), và εt độc lập với rt - j, j = 1, 2,….Sự đổi mới εt 2được tính
trước là có phương sai đơn vị để phương sai có điều kiện của rt bằng Điều này .
σt | xuất
t 1– phát
từ
Machine Translated by Google

286 Mô hình chuỗi thời gian của phương sai thay đổi

2 2 2
E (rt | rt j j = 1 2,…) E σt= |(,t 1–
- εt | rt j -), j = 1 2,…

2 2
= (εt ), j = 1 2,…
σt | t 1– E | rt j -

2 2
= ()
σt | t 1– E εt
(12.2.3)
2
=
σt | t 1–

Đẳng thức thứ hai theo sau bởi vì σt | t - 1 được biết đến khi trả về quá khứ, thứ ba
sự bình đẳng được duy trì bởi vì nó không phụ thuộc vào lợi nhuận trong quá khứ, và kết quả bình đẳng cuối cùng

từ giả thiết rằng phương sai của εt bằng 1.


Hình 12.11 cho thấy biểu đồ chuỗi thời gian của một chuỗi mô phỏng kích thước 500 từ một
Mô hình ARCH (1) với ω = 0,01 và α = 0,9. Phân nhóm biến động thể hiện rõ ràng trong dữ liệu như
các dao động lớn hơn tập hợp lại với nhau, mặc dù chuỗi có thể khôi phục nhanh chóng
từ các điều chỉnh fluc lớn do bộ nhớ rất ngắn trong quá trình phương sai có điều kiện. †

Hình 12.11 Mô hình ARCH được mô phỏng (1) với ω = 0,01 và α1 = 0,9

0,5

rt
0,0

0,5

0 100 200 300 400 500

> set.seed (1235678); thư viện (tseries)


> garch01.sim = garch.sim (alpha = c (.01, .9), n = 500)
> plot (garch01.sim, type = 'l', ylab = expression (r [t]), xlab = 't')

Trong khi mô hình ARCH giống mô hình hồi quy, thực tế là


phương sai không thể quan sát trực tiếp (và do đó được gọi là biến tiềm ẩn) giới thiệu
một số tinh tế trong việc sử dụng mô hình ARCH trong phân tích dữ liệu. Ví dụ, không
phải làm thế nào để khám phá mối quan hệ hồi quy bằng đồ thị. Để làm như vậy, cần phải
thay thế phương sai có điều kiện bằng một số phương sai có thể quan sát được trong Công thức (12.2.2). Để cho

† Gói R có tên là tseries được yêu cầu cho chương này. Chúng tôi giả định rằng người đọc có
đã tải xuống và cài đặt nó.
Machine Translated by Google

12.2 Mô hình ARCH (1) 287

2 2
- =
ηt rt σt | t 1–
(12.2.4)

Có thể xác minh rằng {ηt } là một chuỗi không tương quan với nhau với giá trị trung bình bằng 0. Hơn nữa, ηt
2 2
không liên quan đến lợi nhuận trong quá khứ. Thay thế vào
σt | phương
t 1– ηttrình
- = (12.2.2)
rt
rõ ràng là
2 2
rt = + + ηt (12.2.5)
ω αrt 1–

Do đó, chuỗi trả về bình phương thỏa mãn mô hình AR (1) theo giả định về
Mô hình ARCH (1) cho chuỗi trả về! Dựa trên quan sát hữu ích này, ARCH (1)
mô hình có thể được chỉ định nếu thông số kỹ thuật AR (1) cho lợi nhuận bình phương được đảm bảo bởi

các kỹ thuật đã học từ các chương trước.


Bên cạnh giá trị của nó về mặt phân tích dữ liệu, mô hình AR (1) được suy luận cho
lợi nhuận bình phương có thể được khai thác để có được những hiểu biết lý thuyết về việc tham số hóa

mô hình ARCH. Ví dụ: vì lợi nhuận bình phương phải không âm, nó
có nghĩa là luôn hạn chế các tham số ω và α là không âm. Ngoài ra, nếu
chuỗi trả về là đứng yên với phương sai σ2, sau đó lấy kỳ vọng ở cả hai phía của
Phương trình (12.2.5) cho kết quả
2 2
σ + =ω ασ (12.2.6)

Đó là, 2 σ = ω ⁄ (1 - α ) và do đó 0 ≤ α <1. Thật vậy, nó có thể được hiển thị (Ling và


McAleer, 2002) rằng điều kiện 0 ≤ α <1 là cần và đủ cho (yếu)
tính ổn định của mô hình ARCH (1). Ngay từ cái nhìn đầu tiên, có vẻ như các khái niệm về phương sai ngẫu nhiên

có điều kiện và phương sai thay đổi có điều kiện có thể không tương thích với nhau. Tuy nhiên, hãy nhớ lại rằng yếu

tính ổn định của một quá trình đòi hỏi giá trị trung bình của quá trình phải không đổi và hiệp

phương sai của quá trình tại hai thời điểm bất kỳ là hữu hạn và giống hệt nhau bất cứ khi nào độ trễ của

hai kỷ nguyên giống nhau. Đặc biệt, phương sai là không đổi đối với
quá trình. Điều kiện 0 ≤ α <1 ngụ ý rằng tồn tại một phân phối ban đầu cho r0
sao cho rt được xác định bởi Công thức (12.2.1) và (12.2.2) cho t ≥ 1 là đứng yên yếu trong
ý nghĩa trên. Thật thú vị khi quan sát rằng tính ổn định yếu không loại trừ
khả năng xảy ra quá trình phương sai có điều kiện không thay thế, như trường hợp của ARCH (1)
người mẫu! Có thể kiểm tra rằng quá trình ARCH (1) là nhiễu trắng. Do đó, nó là một thử nghiệm
của nhiễu trắng thừa nhận một quá trình phương sai có điều kiện không thay đổi như đã định nghĩa
bởi Công thức (12.2.2) thay đổi theo độ trễ của một quá trình bình phương.
Một tính năng thỏa mãn của mô hình ARCH (1) là, ngay cả khi sự đổi mới , nó có
phân phối chuẩn, phân phối cố định của mô hình ARCH (1) với 1> α> 0 có
4
đuôi mập; nghĩa là, kurtosis Ecủa
() σ4 ⁄ lớn
rt nó, , 0. (Nhớ lại rằng kurtosis
3– hơn
của phân phối chuẩn luôn bằng 0 và phân phối có kurtosis dương là
được cho là có đuôi béo, trong khi một biến thể có kurtosis âm được gọi là phân phối
đuôi sáng.) Để xem tính hợp lệ của tuyên bố này, hãy xem xét trường hợp {εt } được phân
phối rõ ràng và giống hệt nhau như các biến bình thường tiêu chuẩn. Nâng cao cả hai mặt của
Phương trình (12.2.1) ở trang 285 cho lũy thừa thứ tư và lấy các kỳ vọng đưa ra
Machine Translated by Google

288 Mô hình chuỗi thời gian của phương sai thay đổi

4 4 4
E (rt ) EE σt | t 1–
= [( εt | rt ,,,…
, j = 123
j - )]

4 4
= [E E (εt | rt j - ,,,…
, j = 123 )]
σt | t 1–
(12.2.7)
4 4
= [E E ()
εt ]
σt | t 1–

4
3E
= ()
σt | t 1–

Đẳng thức đầu tiên theo sau từ công thức kỳ vọng lặp lại, trong công thức đơn giản
trường hợp của hai biến ngẫu nhiên X, Y, nói rằng E [E (X | Y)] = E (X). [Xem Công thức (9.E.5)

trên trang 218 để xem lại.] Đẳng thức thứ hai là kết quả của thực tế rằng σt |t - 1
đã được biết đến

trả lại trong quá khứ. Bình đẳng thứ ba là kết quả của sự độc lập giữa εt và quá khứ
trả về, và bình đẳng cuối cùng tuân theo giả định bình thường. Nó vẫn còn để cal
culate E ()4 . Bây giờ, vẫn chưa rõ liệu kỳ vọng trước đó có tồn tại dưới dạng một
σt | t 1–
con số. Hiện tại, giả sử nó có và, giả sử đứng yên, hãy để nó được ký hiệu là
τ. Dưới đây, chúng tôi sẽ đưa ra một điều kiện để giả định này có hiệu lực. Nâng cao cả hai bên
của Công thức (12.2.2) thành lũy thừa thứ hai và lấy sản lượng kỳ vọng
2 2
τ ω= + α 2 2ωασ + 3τ (12.2.8)

ngụ ý
2
2 ω + 2ωασ
τ = ------------------------------
(12.2.9)
2 -1 3α

Sự bình đẳng này cho thấy rằng một điều kiện cần (và trên thực tế, cũng đủ) để
tính hữu hạn của τ là trong
0 α≤ 1trường
3 ⁄ < hợp
, đó quá trình ARCH (1) có
thời điểm thứ tư. Ngẫu nhiên, điều này cho thấy rằng mô hình ARCH (1) cố định không cần phải có
khoảnh khắc thứ tư hữu hạn. Sự tồn tại của các mômen cao hơn hữu hạn sẽ hạn chế hơn nữa
phạm vi thông số — một tính năng cũng được chia sẻ bởi các chất tương tự bậc cao hơn của mô hình ARCH

và các biến thể của nó. Quay trở lại việc tính toán kurtosis của một quy trình ARCH (1), nó
có thể được chỉ ra bằng đại số tẻ nhạt rằng Công thức (12.2.1) ngụ ý rằng τ> σ4 và do đó
4
E ()
rt 3σ4 > . Do đó, kurtosis của quá trình ARCH tĩnh (1) lớn hơn 0.

Điều này xác minh tuyên bố trước đó của chúng tôi rằng một quy trình ARCH (1) có các đuôi béo ngay

cả khi không có đổi mới. Nói cách khác, phần đuôi béo là kết quả của sự phân nhóm biến động như đã

nêu trong Công thức (12.2.2).

Công dụng chính của mô hình ARCH là để dự đoán các phương sai có điều kiện trong tương lai. Vì

ví dụ, một người có thể quan tâm đến việc dự báo phương sai có điều kiện h-step-front

2 2
σt h + | t
= (h + | , ) t ,1– …
rt Er rt (12.2.10)

Đối với h = 1, mô hình ARCH (1) ngụ ý rằng

2 2 2 2
= + = 1 () σ - α + (12.2.11)
σt + 1 | t
ω αrt αrt

là trung bình có trọng số của phương sai dài hạn và lợi tức bình phương hiện tại.
Tương tự, sử dụng công thức kỳ vọng được lặp lại, chúng ta có
Machine Translated by Google

12.3 Mô hình GARCH 289

2 2
σt h + | t
, ) t ,1– …
r =E (rt h + | rt
2
EE σt 2h( +| +rt| hth1–1–
+ = εt
[ h + ,r) thứ 2–, + … | rt
, r] t ,1– …
2 2
( h + ) |
= [h + + | th 1– E εt
rt Er σt , t 1– ,… ]
(12.2.12)
2
r =E (σt h + + | th ,
1– | rt t 1– ,… )
2
r ++ = (ω αE rt| h,
rt 1– t 1– ,… )
2
+ =
ω ασt h - + 1 | t
2 2
nơi chúng tôi áp dụng quy ước rằng σt h +
= cho h <0. Công thức trên pro
| t rt h +

cung cấp một công thức đệ quy để tính toán phương sai có điều kiện h-step-front.

12.3 Mô hình GARCH

Các công thức dự báo có được trong phần trước cho thấy cả điểm mạnh và
điểm yếu của mô hình ARCH (1), vì dự báo các phương sai có điều kiện trong tương lai
chỉ liên quan đến lợi nhuận bình phương gần đây nhất. Trong thực tế, người ta có thể mong đợi rằng độ chính xác

của dự báo có thể cải thiện bằng cách bao gồm tất cả các lợi nhuận bình phương trong quá khứ với trọng số nhỏ hơn

cho các độ bay xa hơn. Một cách tiếp cận là bao gồm lợi nhuận bình phương bị trễ hơn nữa trong
ngươi mâu. Mô hình ARCH (q) , được đề xuất bởi Engle (1982), tổng quát hóa phương trình
(12.2.2) trên trang 285, bằng cách chỉ định rằng

2 2 2 2
= +ω α1rt 1– + α2rt
++ 2– (12.3.1)
σt | t 1– … Αqrt q -

Ở đây, q được gọi là thứ tự ARCH. Một cách tiếp cận khác, do Bollerslev đề xuất
(1986) và Taylor (1986), giới thiệu độ trễ p của phương sai có điều kiện trong mô hình,
trong đó p được gọi là lệnh GARCH. Mô hình kết hợp được gọi là phương sai thay đổi
có điều kiện tự động hồi quy tổng quát, GARCH (p, q), mô hình.

2 2 2 2
= + ++ + α1rt 1–
σt | t 1– ω β1σt 1 | t 2–– … Βpσt p | t p 1 –––
(12.3.2)
2 2
+ α2rt 2– + +
… Αqrt q -

Về mặt ký hiệu B lùi , mô hình có thể được biểu thị bằng

2 2
(1 ––– + = + +
( … αqBq (12.3.3)
β1B σt
… βpBp )
| t 1– ω α1B ) rt

Chúng tôi lưu ý rằng trong một số tài liệu, ký hiệu GARCH (p, q) được viết là
GARCH (q, p); nghĩa là, các lệnh được chuyển đổi. Có thể hơi khó hiểu nhưng đúng là
hai bộ quy ước khác nhau được sử dụng trong các phần mềm khác nhau! Người đọc phải tìm ra

quy ước nào được sử dụng bởi phần mềm có sẵn trước khi điều chỉnh hoặc giải thích một
Mô hình GARCH.
Machine Translated by Google

290 Mô hình chuỗi thời gian của phương sai thay đổi

Bởi vì các phương sai có điều kiện phải không âm, các hệ số trong GARCH
mô hình thường bị hạn chế là không âm. Tuy nhiên, tham số không âm
các ràng buộc không cần thiết đối với mô hình GARCH để có các biến thể có điều kiện không âm
với xác suất 1; xem Nelson và Cao (1992) và Tsai và Chan (2006). Cho phép nhập các giá trị tham
số là âm có thể làm tăng các mẫu động có thể
được chụp bởi mô hình GARCH. Chúng ta sẽ trở lại vấn đề này sau. Từ đó đến nay, trong
phần này, chúng tôi sẽ giả định ràng buộc không âm cho các tham số GARCH.
Hình 12.12 cho thấy biểu đồ chuỗi thời gian của một chuỗi thời gian, có kích thước 500, được mô phỏng

từ mô hình GARCH (1,1) với các cải tiến thông thường tiêu chuẩn và các giá trị tham số
ω = 0,02, α = 0,05 và β = 0,9. Sự phân nhóm biến động thể hiện rõ ràng trong cốt truyện, càng lớn
những biến động (nhỏ) thường được thành công bởi những biến động lớn (nhỏ). Hơn nữa,
bao gồm độ trễ 1 của phương sai có điều kiện trong mô hình đã nâng cao thành công
bộ nhớ trong sự biến động.

Hình 12.12 Quy trình GARCH được mô phỏng (1,1)

2
1
rt
0

1
2

0 100 200 300 400 500

> set.seed (1234567)


> garch11.sim = garch.sim (alpha = c (0,02,0,05), beta = .9, n = 500)
> plot (garch11.sim, type = 'l', ylab = expression (r [t]), xlab = 't')

Ngoại trừ độ trễ 3 và 20, có ý nghĩa nhẹ, mẫu ACF và PACF


của dữ liệu mô phỏng, được thể hiện trong các Hình ảnh minh họa 12.13 và 12.14, không cho thấy các

sai lệch đáng kể. Do đó, quá trình mô phỏng về cơ bản có vẻ không tương quan với nhau như nó vốn có.

You might also like