Professional Documents
Culture Documents
Dịch 1
Dịch 1
thời gian và dự báo Carmona: Phân tích thống kê dữ liệu tài chính trong S-PLUS Chow /
Teicher: Lý thuyết xác suất: Độc lập, khả năng thay thế cho nhau, Martingales, xuất
Christensen: Mô hình tuyến tính nâng cao: Đa biến, Chuỗi thời gian và Dữ liệu không gian; Hồi quy không đối xứng
Christensen: Mô hình Log-Linear và Hồi quy Logistic, xuất bản lần thứ 2 .
Christensen: Các câu trả lời mặt phẳng cho các câu hỏi phức tạp: Lý thuyết về mô hình tuyến tính, xuất bản lần thứ 2 .
Edwards: Giới thiệu về tạo mô hình đồ họa, xuất bản lần thứ 2 .
Everitt: Một người bạn đồng hành R và S-PLUS cho Phân tích Đa biến Nhẹ nhàng: Đại
số Ma trận: Lý thuyết, Tính toán và Ứng dụng trong Thống kê Ghosh / Delampady / Samanta: Giới thiệu
về Phân tích Bayesian Gut: Xác suất: Một Khóa học Sau đại học Heiberger / Holland: Phân tích Thống kê
và Hiển thị dữ liệu; Một khóa học trung cấp với các ví dụ trong S-PLUS, R và SAS Công việc: Phân tích
dữ liệu đa biến ứng dụng, Tập I: Công việc thiết kế hồi quy và thử nghiệmBài: Phân tích dữ liệu đa biến ứng dụng, Tập II:
Phương pháp phân loại và đa biến Karr: Xác suất Kulkarni: Mô hình hóa, Phân tích , Thiết kế và Kiểm soát các Hệ thống ngẫu
nhiên Lange: Xác suất Ứng dụng Lange: Tối ưu hóa Lehmann: Các yếu tố của Lý thuyết Mẫu Lớn Lehmann / Romano: Kiểm tra các Giả
Lehmann / Casella: Lý thuyết về ước lượng điểm, xuất bản lần thứ 2 .
Longford: Nghiên cứu tình trạng phổ biến của con người: Một khóa học nâng cao về thống kê Marin /
Robert: Bayesian Core: Phương pháp tiếp cận thực tế đối với thống kê Bayes tính toán Nolan / Tốc độ: Stat Labs: Thống
kê toán học thông qua ứng dụng Pitman: Xác suất Rawlings / Pantula / Dickey: Phân tích hồi quy ứng dụng Robert: Sự lựa
chọn của Bayes: Từ Cơ sở Lý thuyết-Quyết định đến Thực hiện Tính toán, xuất bản lần thứ 2 .
Robert / Casella: Phương pháp thống kê Monte Carlo, xuất bản lần thứ 2 .
Rose / Smith: Thống kê toán học với Mathematica
Stoffer: Phân tích chuỗi thời gian và các ứng dụng của nó, xuất bản lần thứ 2 .
ứng dụng Toutenberg: Phân tích thống kê các thử nghiệm được thiết kế,
Whittle: Xác suất thông qua kỳ vọng, xuất bản lần thứ 4 .
Machine Translated by Google
9 8 7 6 5 4 3 2 1
springer.com
Machine Translated by Google
Lý thuyết và thực hành của phân tích chuỗi thời gian đã phát triển nhanh chóng kể từ khi
xuất hiện vào năm 1970 công trình nổi tiếng của George EP Box và Gwilym M. Jenkins, Phân
tích chuỗi thời gian: Dự báo và kiểm soát, hiện đã có trong ấn bản thứ ba (1994) với đồng -
tác giả Gregory C. Reinsel. Nhiều cuốn sách về chuỗi thời gian đã xuất hiện kể từ đó, nhưng
một số trong số đó đưa ra quá ít ứng dụng thực tế, trong khi những cuốn khác lại đưa ra quá
ít nền tảng lý thuyết. Cuốn sách này cố gắng trình bày cả ứng dụng và lý thuyết ở mức độ
phù hợp với nhiều sinh viên và học viên. Cách tiếp cận của chúng tôi là kết hợp ứng dụng và
lý thuyết xuyên suốt cuốn sách vì chúng cần thiết một cách tự nhiên.
Cuốn sách được phát triển cho một khóa học kéo dài một học kỳ thường dành cho các sinh
viên thống kê, kinh tế, kinh doanh, kỹ thuật và khoa học xã hội định lượng. Thống kê áp
dụng cơ bản thông qua nhiều hồi quy tuyến tính được giả định. Giải tích chỉ được giả định
trong phạm vi tối thiểu hóa tổng bình phương, nhưng giới thiệu dựa trên giải tích về thống
kê là cần thiết để hiểu thấu đáo về một số lý thuyết. Tuy nhiên, các dữ kiện bắt buộc liên
quan đến kỳ vọng, phương sai, hiệp phương sai và mối tương quan được xem xét trong phụ lục.
Ngoài ra, các thuộc tính kỳ vọng có điều kiện và dự đoán sai số bình phương trung bình tối
thiểu được phát triển trong phụ lục. Dữ liệu chuỗi thời gian thực tế được rút ra từ các
lĩnh vực khác nhau được sử dụng xuyên suốt cuốn sách để minh họa phương pháp luận. Cuốn
sách bao gồm các chủ đề bổ sung có tính chất nâng cao hơn có thể được chọn để đưa vào khóa
học nếu người hướng dẫn chọn.
Tất cả các đồ thị và kết quả số hiển thị trong sách đều được tạo ra bằng phần mềm R,
có sẵn từ Dự án R cho Máy tính Thống kê tại www.r-project.org. Một số đầu ra số đã được
chỉnh sửa để rõ ràng hơn hoặc để đơn giản hơn. R có sẵn dưới dạng phần mềm miễn phí theo
các điều khoản của Giấy phép Công cộng GNU của Tổ chức Phần mềm Tự do ở dạng mã nguồn. Nó
chạy trên nhiều nền tảng UNIX và các hệ thống tương tự, Windows và MacOS.
R là một ngôn ngữ và môi trường cho tính toán thống kê và đồ họa, cung cấp nhiều loại
thống kê (ví dụ: phân tích chuỗi thời gian, mô hình tuyến tính và phi tuyến, các bài kiểm
tra thống kê điển hình) và các kỹ thuật đồ họa, và có khả năng mở rộng cao. Phần phụ lục mở
rộng Giới thiệu về R, cung cấp phần giới thiệu về phần mềm R được thiết kế đặc biệt để đi
kèm với cuốn sách này. Một trong những tác giả (KSC) đã tạo ra một số lượng lớn các hàm R
mới hoặc nâng cao phù hợp với các phương pháp được mô tả trong cuốn sách này.
Chúng được liệt kê trên trang 468 và có sẵn trong gói có tên TSA trên Trang web của Dự án R
tại www.r-project.org. Chúng tôi cũng đã xây dựng các tệp kịch bản lệnh R cho mỗi chương.
Chúng có thể tải xuống tại www.stat.uiowa.edu/ ~ kchan / TSA.htm. Chúng tôi cũng hiển thị
mã R bắt buộc bên dưới gần như mọi bảng và hiển thị đồ họa trong sách. Các tập dữ liệu cần
thiết cho các bài tập được đặt tên trong mỗi bài tập bằng một tên tệp thích hợp; ví dụ:
larain cho dữ liệu lượng mưa ở Los Angeles. Tuy nhiên, nếu bạn đang sử dụng gói TSA, tập dữ
liệu là một phần của gói và có thể được truy cập thông qua dữ liệu lệnh R (larain), chẳng
hạn.
Tất cả các bộ dữ liệu cũng có sẵn trên trang web sách giáo khoa dưới dạng tệp ACSCII
với các tên biến ở hàng đầu tiên. Chúng tôi tin rằng nhiều âm mưu và tính toán
vii
Machine Translated by Google
viii
được mô tả trong sách cũng có thể được lấy bằng phần mềm khác, chẳng hạn như SAS ©, Splus ©,
Cuốn sách này là ấn bản thứ hai của cuốn sách Phân tích chuỗi thời gian của Jonathan Cryer,
xuất bản năm 1986 bởi Nhà xuất bản PWS-Kent (Duxbury Press). Ấn bản mới này chứa
gần như tất cả bản gốc được đón nhận nồng nhiệt cùng với tài liệu mới đáng kể, số lượng bộ dữ liệu mới và
các bài tập mới. Một số chủ đề mới được tích hợp với
bản gốc bao gồm các bài kiểm tra gốc đơn vị, các chức năng tự tương quan mở rộng, tập hợp con ARIMA mod els,
và bootstrapping. Các chương hoàn toàn mới bao gồm các chủ đề về mô hình sion hồi quy chuỗi thời gian, mô
hình chuỗi thời gian của phương sai thay đổi, phân tích quang phổ và ngưỡng
các mô hình. Mặc dù mức độ khó trong các chương mới này có phần cao hơn
trong tài liệu cơ bản hơn, chúng tôi tin rằng cuộc thảo luận được trình bày theo cách sẽ
làm cho tài liệu dễ tiếp cận và khá hữu ích cho nhiều đối tượng người dùng. Chương 15,
Mô hình ngưỡng, được đặt sau cùng vì đây là chương duy nhất đề cập đến mô hình phi tuyến tính
các mô hình chuỗi thời gian. Nó có thể được đề cập trước đó, nói sau Chương 12. Ngoài ra, các Chương 13
và 14 về phân tích quang phổ có thể được đề cập sau Chương 10.
Chúng tôi muốn cảm ơn John Kimmel, Biên tập viên Điều hành, Thống kê, tại Springer, vì
sự quan tâm và hướng dẫn liên tục của anh ấy trong suốt thời gian dài chuẩn bị bản thảo. Chuyên gia Howell
Academica Sinica, Đài Bắc, Giáo sư Noelle Samia của Đại học Northwestern, Giáo sư WK Li và Giáo sư Kai W.
Ng, cả hai Đại học Hồng Kông, và Giáo sư Nils Christian Stenseth của Đại học Oslo vui lòng đọc các phần của
bản thảo,
và Giáo sư Jun Yan đã sử dụng phiên bản sơ bộ của văn bản cho một lớp học tại Đại học
của Iowa. Những ý kiến đóng góp mang tính xây dựng của họ được đánh giá rất cao. Chúng tôi xin cảm ơn
Samuel Hao, người đã giúp giải bài tập và đọc phần phụ lục: Lời giới thiệu với R. Chúng tôi cũng muốn cảm ơn
một số người đánh giá ẩn danh đã đọc tập lệnh manu ở nhiều giai đoạn khác nhau. Đánh giá của họ đã dẫn đến
một cuốn sách được cải thiện nhiều. Cuối cùng, một trong những
các tác giả (JDC) muốn cảm ơn Dan, Marian và Gene đã cung cấp một
địa điểm, Casa de Artes, Câu lạc bộ Santiago, Mexico, vì đã làm việc trên bản thảo đầu tiên của phần lớn
phiên bản mới này.
NỘI DUNG
1.3 Các lô thời gian trong lịch sử. . . ....... . . ....... . . ..... số 8
3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy. . . . . . . . 36
CHƯƠNG 4 CÁC MÔ HÌNH CHO CÁC GIAI ĐOẠN THỜI GIAN TRẠM TRẠM . . . . . 55
4.4 Mô hình Trung bình Động Tự động Phục hồi Hỗn hợp. . . . . . . . 77
Phụ lục B: Khu vực ổn định cho một quá trình AR (2). . . . . 84
ix
Machine Translated by Google
x Nội dung
CHƯƠNG 5 CÁC MÔ HÌNH DÀNH CHO CÁC DÒNG THỜI KỲ KHÔNG TƯƠNG TỰ .87
5.1 Tính ổn định thông qua sự khác biệt. ....... . . . ...... . . . .88
5.2 Mô hình ARIMA. . .. . . ........ . . ...... . . . ....... . . . .92
5.3 Điều khoản không đổi trong Mô hình ARIMA. . ...... . . . . . . . . . . . . .97
5.4 Các biến đổi khác. ....... . . ....... . . . . . . . . . . . . 0,98
6.1 Các thuộc tính của chức năng tự tương quan mẫu. .. . . . .109
6.2 Các chức năng tự tương quan một phần và mở rộng. . . . .112
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian được mô phỏng. . . . . . . . . . .117
6.4 Sự phi lý. . .. . . ....... . . . ...... . . . . . . . . . . . . .125
6.5 Các phương pháp đặc điểm kỹ thuật khác. . . . ....... . . . . . . . . . . . . .130
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế. . . . . . . . . . . . . .133
6.7 Tóm tắt. ........ . . ....... . . ....... . . . . . . . . . . . .141
Bài tập. . .. . . ....... . . ....... . . ....... . . ....... . . . .141
7.2 Ước tính bình phương nhỏ nhất. ... . . ....... . . ....... . . . .154
7.3 Khả năng xảy ra tối đa và bình phương ít nhất vô điều kiện. . .158
7.4 Các thuộc tính của Ước tính. . .160 . . . . ....... . . ....... . .
Nội dung xi
9.1 Dự báo lỗi bình phương trung bình tối thiểu. . . . . . . . . . . . . 191
9.2 Xu hướng xác định. . ...... . . ....... . . . ...... . . . . 191
9.3 Dự báo ARIMA. ....... . . ........ . . . . . . . . . . . . 193
9.4 Giới hạn dự đoán. . . ....... . . ....... . . . ...... . . . . . 203
9.5 Minh họa dự báo. ... . . ....... . . . ...... . . . . . 204
9.6 Cập nhật Dự báo ARIMA. . ....... . . . ....... . . . . . 207
9.7 Trọng số dự báo và Trọng số theo cấp số nhân
Đường trung bình động. . . . . . . . . . . . . . . . . . . . . ....... . . . . 207
9.8 Chuỗi dự báo đã biến đổi. . ...... . . ....... . . . . 209
9.9 Tóm tắt dự báo với một số mô hình ARIMA nhất định. . . . 211
9.10 Tóm tắt. ..... . . ....... . . . ....... . . ....... . . . . 213
Bài tập. . . . ....... . . ....... . . ........ . . ...... . . . . . 213
Phụ lục E: Kỳ vọng có Điều kiện. . ....... . . ....... . . . . 218
Phụ lục F: Dự đoán lỗi bình phương trung bình tối thiểu. . . . . . . . . 218
Phụ lục G: Quy trình tuyến tính rút gọn. .. . . ....... . . . . 221
Phụ lục H: Mô hình không gian trạng thái. . . . . . . . . . . . ...... . . . . . . 222
12.1 Một số đặc điểm chung của chuỗi thời gian tài chính. . . . . . .278
12.8 Một ví dụ khác: Tỷ giá hối đoái USD / HKD hàng ngày. .311
12.9 Tóm tắt. . . . ..315
...... . . ........ . . ...... . . . ......
.. .
Bài tập. . . .316 . ....... . . ....... . . ....... . . ....... . .
Phụ lục I: Công thức cho Kiểm tra Portmanteau Tổng quát. . .318
13.5 Mật độ phổ cho các quá trình ARMA. . . . .332 . . . .......
13.6 Tính chất lấy mẫu của mật độ phổ mẫu. . . . .340
....... . . . ....... . . .......
13.7 Tóm tắt. . . .346 . . . ......
Bài tập. . .. . . ....... . . ........ . . ...... . . . . . . . . . . . . .346
Phụ lục J: Tính trực giao của chuỗi Cosine và sin. . . . .349
14.9 Các phương pháp ước lượng phổ khác. .... . . . . . . . . . . . .376
15.1 Khám phá tính phi tuyến tính bằng đồ họa. . . . . . . . ....... . . . . 384
15.2 Kiểm tra tính phi tuyến. ..... . . ....... . . ....... . . . . . 390
15.4 Mô hình tự động khôi phục ngưỡng bậc nhất. .... . . . . . 395
15.5 Mô hình ngưỡng. . ........ . . ....... . . ....... . . . . 399
15.6 Kiểm tra tính phi tuyến của ngưỡng. .... . . . ...... . . . . . 400
15.7 Ước tính Mô hình TAR. . . . ........ . . ....... . . . . 402
Phụ lục L: Thử nghiệm Portmanteau Tổng quát cho TAR. . . . . . 421
Chức năng mới hoặc chức năng nâng cao trong Thư viện TSA. . . . . . . . . . . . . 468
CHƯƠNG 1
GIỚI THIỆU
Dữ liệu thu được từ các quan sát được thu thập tuần tự theo thời gian là cực kỳ hài hòa. Trong
kinh doanh, chúng tôi quan sát lãi suất hàng tuần, giá cổ phiếu đóng cửa hàng ngày, chỉ số giá
hàng tháng, số liệu bán hàng hàng năm, v.v. Trong khí tượng học, chúng tôi quan sát nhiệt độ cao
và thấp hàng ngày, lượng mưa hàng năm và các chỉ số hạn hán, và tốc độ gió hàng giờ. Trong nông
nghiệp, chúng tôi ghi lại số liệu hàng năm về sản xuất cây trồng và vật nuôi, xói mòn đất và
doanh số xuất khẩu. Trong khoa học sinh học, chúng ta quan sát hoạt động điện của tim ở những
khoảng thời gian mili giây. Trong sinh thái học, chúng tôi ghi lại sự phong phú của các loài
động vật. Danh sách các lĩnh vực mà chuỗi thời gian được nghiên cứu hầu như vô tận. Mục đích của
phân tích chuỗi thời gian thường gồm hai mặt: để hiểu hoặc mô hình hóa chủ nghĩa ngẫu nhiên làm
phát sinh chuỗi được quan sát và dự đoán hoặc dự báo các giá trị tương lai của chuỗi dựa trên
lịch sử của chuỗi đó và có thể là các chuỗi liên quan khác hoặc các yếu tố.
Chương này sẽ giới thiệu nhiều ví dụ về chuỗi thời gian từ các lĩnh vực ứng dụng đa dạng.
Một đặc điểm hơi độc đáo của chuỗi thời gian và các mô hình của chúng là chúng ta thường không
thể giả định rằng các quan sát phát sinh độc lập từ một quần thể chung (hoặc từ các quần thể với
các phương tiện khác nhau, chẳng hạn). Nghiên cứu các mô hình kết hợp sự phụ thuộc là khái niệm
chính trong phân tích chuỗi thời gian.
Trong phần này, chúng tôi giới thiệu một số ví dụ sẽ được xem xét trong các chương sau.
Hình 1.1 hiển thị biểu đồ chuỗi thời gian về lượng mưa hàng năm được ghi nhận ở Los Angeles,
California, trong hơn 100 năm. Biểu đồ cho thấy sự thay đổi đáng kể về lượng mưa qua các năm -
một số năm thấp, một số cao và nhiều năm có giá trị tương đương nhau. Năm 1883 là một năm đặc
biệt ẩm ướt đối với Los Angeles, trong khi năm 1983 khá khô hạn. Đối với mục đích phân tích và
mô hình hóa, chúng tôi quan tâm đến việc các năm liên tiếp có liên quan với nhau theo một cách
nào đó hay không. Nếu vậy, chúng tôi có thể sử dụng giá trị lượng mưa của một năm để giúp dự báo
lượng mưa của năm tới. Một cách đồ họa để điều tra câu hỏi đó là ghép các giá trị lượng mưa liên
tiếp và vẽ biểu đồ phân tán kết quả của các cặp.
Hình 1.2 cho thấy một biểu đồ phân tán đối với lượng mưa. Ví dụ: điểm được vẽ gần góc dưới
bên phải cho thấy rằng năm có lượng mưa cực lớn, 40 inch vào năm 1883, được theo sau bởi lượng
mưa giữa đường (khoảng 12 inch) vào năm 1884. Điểm
1
Machine Translated by Google
2 Giới thiệu
gần đầu màn hình hiển thị rằng năm 40 inch trước một năm điển hình hơn nhiều là
khoảng 15 inch.
Phụ lục 1.1 Biểu đồ chuỗi thời gian về lượng mưa hàng năm ở Los Angeles
•
• • •
• •
• •• •
• •• • • •• • •
• • • • •
Inch
• •
• • • • • • • ••
• •
•• • •• • •
•• • •• ••••
• • • •
••
• •
• • •
• ••
40
30
20
10
• •• •
• •• •
• ••
• •• • •• •
•
•
• • • • • • • ••
••
•
•
• • •
• • • •
•• • • •
• •
Năm
> library (TSA)>
win.graph (width = 4.875, height = 2.5, pointsize = 8)>
data (larain); plot (larain, ylab = 'Inches', xlab = 'Year', type = 'o')
Hình 1.2 Biểu đồ phân tán của Lượng mưa LA so với Lượng mưa LA của Năm ngoái
•
40
• •
30
• •
• • • •
•
• •• •• •
• •
•
Inch
20
•
•
• •
••
•
•
• • • •• • • •
•
• •
• • •
•• •
• • • •
•
•• • •
• •
• • ••
• ••
• ••
• ••
• ••
•
• • •
•
•
10
••• •
•
• • • • •
•
• •
•• •
• • •
•• • •
• • •
•
• •
• • •• •
• •
• •
10 20 30 40
Ấn tượng chính mà chúng tôi nhận được từ biểu đồ này là có rất ít thông tin về lượng mưa năm nay so
với lượng mưa năm ngoái. Cốt truyện cho thấy không
"Xu hướng" và không có xu hướng chung. Có rất ít mối tương quan giữa lượng mưa năm ngoái
số tiền và số tiền của năm nay. Từ quan điểm mô hình hóa hoặc dự báo, đây không phải là
Ví dụ thứ hai, chúng tôi xem xét một chuỗi thời gian từ một quy trình hóa chất công nghiệp.
Biến được đo ở đây là thuộc tính màu từ các lô liên tiếp trong quá trình.
Hình 1.3 cho thấy một biểu đồ chuỗi thời gian của các giá trị màu này. Đây là những giá trị hàng xóm
trong thời gian có xu hướng tương tự về kích thước. Có vẻ như những người hàng xóm có liên quan đến nhau.
Biểu đồ 1.3 Chuỗi thời gian Biểu đồ thuộc tính màu từ một quá trình hóa học
85 • • •
•
• • •• ••• • •
75
• • • •• • • •
• •••• •
Thuộc
tính
màu
65 • • • • •• •
•
0 5 10 15 20 25 30 35
Lô hàng
> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> dữ liệu (màu)
> plot (color, ylab = 'Color Property', xlab = 'Batch', type = 'o')
Điều này có thể được thấy rõ hơn bằng cách xây dựng biểu đồ phân tán của các cặp lân cận khi chúng ta
Hình 1.4 hiển thị biểu đồ phân tán của các cặp giá trị màu lân cận. Chúng tôi thấy
xu hướng tăng nhẹ trong biểu đồ này — các giá trị thấp có xu hướng được theo sau trong đợt tiếp theo bởi
giá trị thấp, giá trị cỡ trung bình có xu hướng được theo sau bởi giá trị cỡ trung bình và giá trị cao
các giá trị có xu hướng được theo sau bởi các giá trị cao. Xu hướng rõ ràng nhưng không khủng khiếp
mạnh. Ví dụ, mối tương quan trong biểu đồ phân tán này là khoảng 0,6.
Machine Translated by Google
4 Giới thiệu
Biểu đồ 1.4 Biểu đồ tán xạ của Giá trị màu so với Giá trị màu trước đó
85
• • •
•
80
•• • •
• • •
• ••• •• •
••
75
•
• •
Thuộc
tính
màu
70
•
• •
• •
• • ••
65
•
•
65 70 75 80 85
Ví dụ thứ ba của chúng tôi liên quan đến sự phong phú hàng năm của thỏ Canada. Hình 1.5 cho
cốt truyện chuỗi thời gian của sự phong phú này trong khoảng 30 năm. Các giá trị lân cận ở đây là
liên quan rất chặt chẽ. Những thay đổi lớn về mức độ phong phú không xảy ra từ năm này sang năm khác.
Mối tương quan lân cận này được nhìn thấy rõ ràng trong Hình 1.6, nơi chúng tôi đã lập biểu đồ về
sự nhảy vọt so với sự phong phú của năm trước. Như trong ví dụ trước, chúng ta thấy một
xu hướng tăng trong biểu đồ — các giá trị thấp có xu hướng được theo sau bởi các giá trị thấp trong năm tới,
giá trị cỡ trung bình bằng giá trị cỡ trung bình và giá trị cao bằng giá trị cao.
Machine Translated by Google
•
•• •• • •
80
• • •
• ••
••
40
dào
Dồi
• •• • • •
0 • • • • • ••
• • •
1905 1910 1915 1920 1925 Năm 1930 1935
Năm
> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> dữ liệu (thỏ rừng); plot (hare, ylab = 'Abundance', xlab = 'Year', type = 'o')
Hình minh họa 1.6 Mức độ dồi dào so với Mức độ dồi dào của Năm trước
•
• • • •
80
•
•
• •
•
60
•
40
•
•
dào
Dồi
••• ••
20
• • • • •
•• •
•
•• •
0
0 20 40 60 80
6 Giới thiệu
Nhiệt độ trung bình hàng tháng (tính bằng độ F) trong một số năm được ghi lại ở Dubuque,
Iowa, được thể hiện trong Hình 1.7.
• • • • ••
••• •
70
• •• • •
•
•• •• •
•• •
•• • •
• • • • •
•
• •• •
•
• • • •
•• • • •
• • • ••
• •
• • • • •• • • •
•
•
• • • • ••
50
• • • •• • ••
• •
• •• • • • •
• • • • • •• •
• •
• •
• • • • •
Nhiệt
độ 30
•• • • • • • •
• •
•
• • • •
• •
• •
• • ••
•
•• • • • • ••
•
• •
10 •
• •
Năm 1964 Năm 1966 Năm 1968 1970 Năm 1972 1974 Năm 1976
Thời gian
Chuỗi thời gian này hiển thị một mô hình rất đều đặn được gọi là tính thời vụ. Tính
thời vụ cho các giá trị hàng tháng xảy ra khi các quan sát cách nhau mười hai tháng có
liên quan đến một số người khác. Tất cả các tháng 1 và tháng 2 đều khá lạnh nhưng chúng
có giá trị tương tự và khác với nhiệt độ của các tháng ấm hơn như tháng 6, tháng 7 và
tháng 8, chẳng hạn. Vẫn có sự khác biệt giữa các giá trị tháng 1 và sự thay đổi giữa các
giá trị tháng 6. Các mô hình cho loạt phim như vậy phải phù hợp với biến thể này trong khi
vẫn giữ được các điểm tương đồng. Ở đây người ta đã hiểu rõ lý do của tính thời vụ — độ
nghiêng thay đổi của Bắc bán cầu đối với mặt trời.
Ví dụ cuối cùng của chúng tôi cho chương này liên quan đến doanh số hàng tháng cho các
đại lý của bộ lọc dầu chuyên dụng cho thiết bị xây dựng do John Deere sản xuất. Khi những
dữ liệu này lần đầu tiên được trình bày cho một trong các tác giả, người quản lý nói,
"Không có lý do gì để tin rằng những doanh số bán hàng này là theo mùa." Tính thời vụ sẽ
xuất hiện nếu các giá trị của tháng 1 có xu hướng liên quan đến các giá trị khác của tháng
1, các giá trị của tháng 2 có xu hướng liên quan đến các giá trị khác của tháng 2, v.v.
Cốt truyện của chuỗi thời gian được hiển thị trong Phụ lục 1.8 không được thiết kế để đặc
biệt tốt cho việc chơi theo mùa. Hình 1.9 đưa ra cùng một cốt truyện nhưng được sửa đổi
để sử dụng các biểu tượng cốt truyện có ý nghĩa. Trong biểu đồ này, tất cả các giá trị
của tháng 1 được vẽ bằng charac ter J, tất cả các tháng 2 với F, tất cả các cuộc tuần hành
với M, v.v. và tháng 2 đều có xu hướng cao, trong khi doanh số bán hàng vào tháng 9, 10, 11 và 12 là
Machine Translated by Google
đồng minh khá thấp. Tính thời vụ trong dữ liệu dễ thấy hơn nhiều từ biểu đồ chuỗi thời gian đã
sửa đổi này.
• • •
• • • • •
• •• • •
hàng
Việc
bán
• •
•••
• •
• ••
•
• •
• •
•• •••
•
• • • •
• •
6000
4000
2000
• • •
•
• •
• •
Thời gian
> dữ liệu (bộ lọc dầu); âm mưu (bộ lọc dầu, type = 'o', ylab = 'Bán hàng')
Biểu thị 1.9 Doanh số bán bộ lọc dầu hàng tháng với các ký hiệu vẽ đồ thị đặc biệt
6000
J F F
JF J J Một
FMAM Một
J
4000
S M
J AMJ
hàng
Việc
bán
O D J J
D
Một
M J M
J N Một Một
M J
O TRÊN
Một
TRÊN
M
2000
S
N D
S S D
Thời gian
J = tháng 1 (và tháng 6 và tháng 7),
F = tháng 2, M = tháng 3 (và tháng 5), v.v.
> lô (bộ lọc dầu, type = 'l', ylab = 'Bán hàng')> điểm (y =
bộ lọc dầu, x = thời gian (bộ lọc dầu), pch = as.vector (mùa
(bộ lọc dầu)))
† Khi đọc cốt truyện, bạn vẫn sẽ phải phân biệt giữa tháng Giêng, tháng Sáu và tháng Bảy, giữa tháng
Giêng và tháng Năm, và tháng Tư và tháng Tám, nhưng điều này có thể dễ dàng thực hiện bằng cách nhìn
số 8 Giới thiệu
Nói chung, mục tiêu của chúng tôi là nhấn mạnh các phương pháp vẽ biểu đồ phù hợp và sử dụng
tối đa để tìm ra các mẫu dẫn đến các mô hình phù hợp cho dữ liệu chuỗi thời gian của chúng tôi.
Trong các chương sau, chúng ta sẽ xem xét một số cách khác nhau để kết hợp tính thời vụ vào các mô
hình chuỗi thời gian.
Tìm kiếm các mô hình thích hợp cho chuỗi thời gian là một nhiệm vụ không hề nhỏ. Chúng tôi sẽ phát
triển một chiến lược xây dựng mô hình nhiều bước đã được Box và Jenkins (1976) tán thành rất tốt.
Có ba bước chính trong quy trình, mỗi bước có thể được sử dụng nhiều lần:
chuỗi thời gian được chọn có thể phù hợp với một chuỗi quan sát nhất định. Trong bước này,
chúng tôi xem xét biểu đồ thời gian của chuỗi, tính toán nhiều thống kê khác nhau từ dữ liệu và
cũng áp dụng bất kỳ kiến thức nào về chủ đề mà dữ liệu phát sinh, chẳng hạn như sinh học, kinh
doanh hoặc sinh thái. Cần nhấn mạnh rằng mô hình được chọn vào thời điểm này là dự kiến và có thể
được sửa đổi sau này trong quá trình phân tích.
Trong việc lựa chọn một mô hình, chúng tôi sẽ cố gắng tuân thủ các nguyên tắc của parsimony;
nghĩa là, mô hình được sử dụng phải yêu cầu số lượng tham số nhỏ nhất sẽ đại diện đầy đủ cho chuỗi
thời gian. Albert Einstein được trích dẫn trong Parzen (1982, trang 68) khi nhận xét rằng “mọi thứ
nên được làm càng đơn giản càng tốt nhưng không đơn giản hơn”.
Mô hình chắc chắn sẽ liên quan đến một hoặc nhiều tham số mà giá trị của chúng phải được ước
tính từ chuỗi quan sát. Việc điều chỉnh mô hình bao gồm việc tìm ra các ước lượng tốt nhất có thể
về các thông số chưa biết đó trong một mô hình nhất định. Chúng tôi sẽ xem xét các tiêu chí như
bình phương nhỏ nhất và khả năng lớn nhất để ước tính.
Chẩn đoán mô hình liên quan đến việc đánh giá chất lượng của mô hình mà chúng tôi đã chỉ định
và ước tính. Mô hình phù hợp với dữ liệu đến mức nào? Các giá trị giả định của mô hình có được thỏa
mãn một cách hợp lý không? Nếu không tìm thấy điểm bất cập nào, mô hình có thể được coi là hoàn
chỉnh và mô hình có thể được sử dụng, ví dụ, để dự báo các giá trị trong tương lai. Nếu không,
chúng tôi chọn một mô hình khác dựa trên những bất cập được tìm thấy; nghĩa là chúng ta quay lại
bước đặc tả mô hình. Bằng cách này, chúng tôi thực hiện theo ba bước cho đến khi, lý tưởng nhất là
Bởi vì các tính toán cần thiết cho mỗi bước trong xây dựng mô hình là chuyên sâu, chúng tôi sẽ
dựa vào phần mềm thống kê sẵn có để thực hiện các tính toán và vẽ biểu đồ.
TheoTufte (1983, trang 28), “Cốt truyện theo chuỗi thời gian là hình thức thiết kế đồ họa thường
xuyên được sử dụng nhất. Với một chiều di chuyển theo nhịp điệu đều đặn của giây
Machine Translated by Google
onds, phút, giờ, ngày, tuần, tháng, năm hoặc thiên niên kỷ, thứ tự tự nhiên của thang thời gian
mang lại cho thiết kế này một sức mạnh và hiệu quả giải thích không có trong cách sắp xếp đồ họa
nào khác. ”
Hình 1.10 mô phỏng lại những gì dường như là ví dụ lâu đời nhất được biết đến về một cốt
truyện chuỗi thời gian, có niên đại từ thế kỷ thứ mười (hoặc có thể là thứ mười một) và cho thấy
các góc nghiêng của quỹ đạo hành tinh. † Nhận xét về hiện vật này, Tufte nói “Nó xuất hiện như một
kỳ quan bí ẩn và biệt lập trong lịch sử đồ họa dữ liệu, kể từ khi đồ họa tồn tại tiếp theo của một
chuỗi thời gian có âm mưu xuất hiện vào khoảng 800 năm sau ”.
Chương 2 phát triển các ý tưởng cơ bản về hàm trung bình, hiệp phương sai và tương quan và kết thúc
với khái niệm quan trọng về tính đứng yên. Chương 3 thảo luận về phân tích xu hướng và nghiên cứu
cách ước tính và kiểm tra các mô hình xu hướng xác định phổ biến, chẳng hạn như các mô hình cho xu
hướng thời gian tuyến tính và các phương tiện theo mùa.
Chương 4 bắt đầu sự phát triển của các mô hình tham số cho chuỗi thời gian tĩnh, cụ thể là
cái gọi là mô hình đường trung bình động tự động hồi quy (ARMA) (còn được gọi là mô hình Box-
Jenkins). Sau đó, các mô hình này được khái quát trong Chương 5 để bao gồm một số loại trường hợp
Các chương 6, 7 và 8 là trung tâm của chiến lược xây dựng mô hình cho ARIMA mod eling. Các
kỹ thuật được trình bày để xác định một cách tạm thời các mô hình (Chương 6), ước tính hiệu quả
các tham số của mô hình bằng cách sử dụng bình phương nhỏ nhất và khả năng xảy ra lớn nhất (Chương
7), và xác định mức độ phù hợp của các mô hình với dữ liệu (Chương 8).
Chương 9 phát triển kỹ lưỡng lý thuyết và phương pháp dự báo sai số bình phương trung bình
tối thiểu cho các mô hình ARIMA. Chương 10 mở rộng các ý tưởng của Chương 4
10 Giới thiệu
đến 9 đến các mô hình theo mùa ngẫu nhiên. Các chương còn lại bao gồm các chủ đề được chọn và có
tính chất nâng cao hơn một chút.
BÀI TẬP
1.1 Sử dụng phần mềm để tạo biểu đồ chuỗi thời gian được trình bày trong Hình 1.2, trên trang 2.
Dữ liệu nằm trong tệp có tên larain. † 1.2 Tạo biểu đồ chuỗi thời gian được hiển thị
1.3 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị bình thường, độc
lập. Vẽ sơ đồ chuỗi thời gian. Nó có trông "ngẫu nhiên" không? Lặp lại bài tập này nhiều
lần với một mô phỏng mới mỗi lần.
1.4 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị phân bố chi bình
phương, độc lập, mỗi giá trị có 2 bậc tự do. Hiển thị âm mưu của chuỗi thời gian.
Nó trông có vẻ “ngẫu nhiên” và không bình thường? Lặp lại bài tập này nhiều lần với một
mô phỏng mới mỗi lần.
1.5 Mô phỏng một quá trình hoàn toàn ngẫu nhiên có độ dài 48 với các giá trị được phân phối t
độc lập, mỗi giá trị có 5 bậc tự do. Xây dựng cốt truyện của chuỗi thời gian. Nó trông có
vẻ “ngẫu nhiên” và không bình thường? Lặp lại bài tập này nhiều lần với một mô phỏng mới
mỗi lần.
1.6 Xây dựng biểu đồ chuỗi thời gian với các ký hiệu biểu đồ hàng tháng cho chuỗi nhiệt độ
Dubuque như trong Phụ lục 1.9, trên trang 7. Dữ liệu nằm trong tệp có tên là lồng tiếng
tạm thời.
† Nếu bạn đã cài đặt gói R TSA, có sẵn để tải xuống tại www.r-project.org, dữ
liệu larain được truy cập bằng lệnh R: data (larain). Tệp ASCII của dữ liệu
cũng có sẵn trên Trang web sách tại www.stat.uiowa.edu/~kchan/TSA.htm.
Machine Translated by Google
CHƯƠNG 2
CÁC KHÁI NIỆM CƠ BẢN
Chương này mô tả các khái niệm cơ bản trong lý thuyết về mô hình chuỗi thời gian. Trong
đặc biệt, chúng tôi giới thiệu các khái niệm về quá trình ngẫu nhiên, hàm hàm trung bình và
hiệp phương sai, các quá trình tĩnh và các hàm tự tương quan.
Chuỗi các biến ngẫu nhiên {Yt: t = 0, ± 1, ± 2, ± 3,…} được gọi là ngẫu nhiên
xử lý và phục vụ như một mô hình cho một chuỗi thời gian được quan sát. Được biết, sự hoàn
cấu trúc xác suất của một quá trình như vậy được xác định bởi tập hợp các phân phối của tất cả
tập hợp hữu hạn của Y. May mắn thay, chúng tôi sẽ không phải giải quyết rõ ràng với những
các phân phối đa biến. Phần lớn thông tin trong các bản phân phối chung này có thể
được mô tả dưới dạng phương tiện, phương sai và hiệp phương sai. Do đó, chúng tôi tập trung
nỗ lực của chúng tôi vào những khoảnh khắc đầu tiên và thứ hai này. (Nếu phân phối chung của Y là
phân phối chuẩn đa biến , sau đó thời điểm thứ nhất và thứ hai ngăn chặn hoàn toàn
tất cả các phân phối chung.)
Đối với quy trình ngẫu nhiên {Yt: t = 0, ± 1, ± 2, ± 3,…}, hàm trung bình được xác định bởi
Tức là, μt chỉ là giá trị kỳ vọng của quá trình tại thời điểm t. Nói chung, μt có thể khác ent
tại mỗi thời điểm t.
= f hoặc ts = ±
0,,,
1 ±
γtS, ( Cov Yt ,
Ys ) 2 ..., (2.2.2)
= cho ts = 0, ±
1 ,,
±
ρt S, ( Ys ,)
Corr Yt 2 ..., (2.2.3)
ở đâu
() Ys,
Cov Yt γtS,
= -------------------------------------------- = --------------------
() Ys,
Corr Yt (2.2.4)
Var Yt ( ) Var Ys () , có
không S,
11
Machine Translated by Google
Chúng tôi xem xét các thuộc tính cơ bản của kỳ vọng, phương sai, hiệp phương sai và tương quan
nhiên. Các thuộc tính quan trọng sau đây dựa trên các kết quả đã biết và định nghĩa của chúng tôi:
= 1 =
không
,
Var Yt () ρt ,t
= =
γt S, γs ,t ρt S, ρs t (2.2.5)
,
≤ ρt S,
≤ 1
γt S, không
, có S,
Các giá trị của ρt, s gần ± 1 biểu thị sự phụ thuộc mạnh (tuyến tính), trong khi các giá trị gần 0
chỉ ra sự phụ thuộc yếu (tuyến tính). Nếu ρt, s = 0, chúng ta nói rằng Yt và Ys là không tương quan.
Để khảo sát thuộc tính hiệp phương sai của các mô hình chuỗi thời gian khác nhau,
kết quả sau sẽ được sử dụng lặp lại: Nếu c1, c2,…, cm và d1, d2,…, dn là hằng số và t1,
t2,…, tm và s1, s2,…, sn là các mốc thời gian, thì
m N m N
Cov , , ) (2.2.6)
ci Yt
dj Ysj
= ( ci dj Cov Yt
tôi Ysj
tôi
tôi 1 = j 1 = tôi 1 = j 1 =
Chứng minh Công thức (2.2.6), mặc dù tẻ nhạt, là một ứng dụng đơn giản của
các tính chất tuyến tính của kỳ vọng. Như một trường hợp đặc biệt, chúng tôi thu được kết quả nổi tiếng
N N N tôi 1–
Var = )+ 2
ci Yt tôi
ci 2Var Yt
( Cov (Yt ,Yt )
ci cj
(2.2.7)
j
tôi tôi
Đi bộ ngẫu nhiên
Cho e1, e2,… là một chuỗi các biến ngẫu nhiên độc lập, phân bố giống hệt nhau
2 .
từng có phương sai và trung bình bằng 0 Chuỗi
σe thời gian quan sát được, {Yt: t = 1, 2,…}, là
được xây dựng như sau:
Y1 e1 =
Y2 e1 .e2 + =
.
. (2.2.8)
= +++
Yt e1 e2 … et
(2.2.9)
Yt Yt 1– et + =
với “điều kiện ban đầu” Y1 = e1. Nếu chữ e được hiểu là kích thước của "các bước" được thực hiện
(tiến hoặc lùi) dọc theo một đường số, khi đó Yt là vị trí của "ngẫu nhiên
người đi bộ ”tại thời điểm t. Từ phương trình (2.2.8), chúng ta thu được hàm trung bình
Machine Translated by Google
= = =
( μt E Yt () E e1 e2) …+++
et E e1 () E e2 ()… E et + ++ ()
= 0 0 ++ +… 0
để có thể
= =
( Var Yt () Var e1 +e2Var
… et
e1 )()++Var e2 ()… Var et + ++ ()
2 2
2 =σe+++ σe … E
để có thể
= (2.2.11)
Var Yt () 2 te
Lưu ý rằng phương sai quá trình tăng tuyến tính theo thời gian.
Để khảo sát hàm hiệp phương sai, giả sử rằng 1 ≤ t ≤ s. Sau đó chúng tôi có
= , = , et 1+ + + ++ + +
γt S, Cov Yt()Ys Cov e1( e2 … et +++ e1 e2 … et )… Es
γt S, = Cov ei (),
ej
tôi 1 = j 1 =
2
Tuy nhiên, các hiệp phương sai này bằng 0 trừ khi i = j, trong trường hợp đó chúng bằng Var (ei ) = σe .
2
Có đúng t trong số này để γt, s = t σe .
Vì γt, s = γs, t, điều này chỉ định hàm tự phương sai cho tất cả các thời điểm t và s
và chúng ta có thể viết
= 2
γt S, tσe cho 1 ≤ ≤ts (2.2.12)
Hàm tự tương quan cho bước đi ngẫu nhiên hiện có thể dễ dàng thu được như
γt S, t
= = - cho 1 ≤ ≤ts (2.2.13)
--------------------
ρt S,
S
, có
không S,
Các giá trị số sau đây giúp chúng ta hiểu hành vi của ngẫu nhiên
đi bộ.
1
= = - 0,707 = = - 0,943
số 8
ρ1 2, ρ8 9,
2 9
24 1
= = ----- 0,980 = = ----- 0,200
ρ24 25
, ρ1 ,
25
25 25
Các giá trị của Y tại các điểm thời gian lân cận ngày càng có tương quan chặt
chẽ và tỷ lệ thuận theo thời gian. Mặt khác, các giá trị của Y ở thời điểm xa
điểm ngày càng ít tương quan.
Một cuộc đi bộ ngẫu nhiên được mô phỏng được thể hiện trong Phụ lục 2.1 nơi các e được chọn từ
một phân phối chuẩn chuẩn. Lưu ý rằng mặc dù hàm trung bình theo lý thuyết là
Machine Translated by Google
0 cho tất cả các mốc thời gian, thực tế là phương sai tăng theo thời gian và mối tương quan
giữa các giá trị quá trình gần đó trong thời gian gần bằng 1 cho thấy rằng chúng ta nên mong đợi
các chuyến du ngoạn dài của quá trình ra khỏi mức trung bình bằng 0.
Quá trình đi bộ ngẫu nhiên đơn giản cung cấp một mô hình tốt (ít nhất là cho một lần
tương ứng đầu tiên) cho các hiện tượng đa dạng như sự chuyển động của giá cổ phiếu phổ thông, và
vị trí của các hạt nhỏ lơ lửng trong chất lỏng - cái gọi là chuyển động Brown.
Hình 2.1 Biểu đồ chuỗi thời gian của một bước đi ngẫu nhiên
•
số
8
•
• •
6 • •
• • •
• •
• • •
•
• •
•• • •
4
•
•• •
• •
•
2 • • •
• ••
• • •
•
•• • •• •• ••
nhiên
ngẫu
bộ
Đi
• •• • • •
• • •
• •
02
•
•
0 10 20 30 40 50 60
Thời gian
> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> data (rwalk) # rwalk chứa một cuộc đi bộ ngẫu nhiên được mô phỏng
+
et et 1–
--------------------- =
Yt (2.2.14)
2
trong đó (như mọi khi trong cuốn sách này) các e được giả định là độc lập và được phân phối
2 Nơi đây
chuẩn xác với phương sai và giá trị trung bình bằngσe0.
+
et et E et () E et 1– + ()
== = ---------------------------------------
---------------------
1– μt E Yt () E 2 2
0 =
và
Machine Translated by Google
= 2
0,5σe
Cũng thế
et+ et 1– +
et 1– et 2–
( Yt,1– ) = Cov
---------------------
,
----------------------------
Cov Yt
2 2
() et, 1–
Cov và + ()et, 2–
Cov và + ( 1– và,1–
Cov và )
= ------------------------------------------------- -------------------------------------------------- -----------------------
(
Cov et 1– et 2– ) +,
-----------------------------------------
( 1– và,1– )
Cov và
= -----------------------------------------
(vì tất cả các hiệp phương sai khác bằng 0)
4
= 2
0,25σe
hoặc
= 2
, 1–
không 0,25σe cho tất cả t (2.2.15)
Hơn nữa,
et +
et 1– + 3–
et 2– et
( Yt,2– ) = Cov ---------------------
,
----------------------------
Cov Yt
2 2
Tương tự, Cov (Yt, Yt k) = 0 với k > 1, vì vậy chúng ta có thể viết
0,5σe2 cho ts - 0 =
=
γt S,
0,25σe2 cho ts - 1 =
0 cho ts - 1>
1 cho ts - 0 =
= (2.2.16)
ρt S, 0,5 cho ts - 1 =
0 cho ts - 1>
2 2
kể từ 0,25 /0,5
σe = 0,5.
σe
Chú ý rằng ρ2,1 = ρ3,2 = ρ4,3 = ρ9,8 = 0,5. Các giá trị của Y cách nhau chính xác một đơn vị thời gian
có mối tương quan chính xác như nhau cho dù chúng xảy ra ở đâu trong thời gian. Hơn nữa, ρ3,1
là như nhau đối với tất cả các giá trị của t. Điều này dẫn chúng ta đến
= ρ4,2 = ρt, t - 2 và tổng quát hơn, ρt, t -
k khái niệm quan trọng của tính đứng yên.
Machine Translated by Google
Để đưa ra các suy luận thống kê về cấu trúc của một quá trình ngẫu nhiên trên cơ sở
một hồ sơ quan sát được về quá trình đó, chúng ta thường phải đưa ra một số giả định
đơn giản hóa (và tổng thể là hợp lý) về cấu trúc đó. Điều quan trọng nhất như vậy
giả định là của sự cố định. Ý tưởng cơ bản của tính ổn định là xác suất
luật điều chỉnh hành vi của quá trình không thay đổi theo thời gian. Theo một nghĩa nào đó,
thuế chuyên nghiệp đang ở trạng thái cân bằng thống kê. Cụ thể, một quy trình {Yt } được cho là
, Yt ,… Yt
hoàn toàn tĩnh nếu việc phân phối chung Yt , giống như sự phân phối chung của
1 2 N
Yt - k Yt ,
- k,… Yt - k cho tất cả các lựa chọn về thời điểm t1, t2,…, tn và tất cả các lựa chọn về thời gian
1 2 N
độ trễ k.
Do đó, khi n = 1, phân phối (đơn biến) của Yt giống như của Yt - k đối với
tất cả t và k; nói cách khác, Y được phân phối (biên) giống hệt nhau. Sau đó nó theo sau
rằng E (Yt ) = E (Yt - k) với mọi t và k để hàm trung bình là không đổi trong mọi thời gian.
Ngoài ra, Var (Yt ) = Var (Yt - k) với mọi t và k để phương sai cũng không đổi theo
thời gian.
Đặt n = 2 trong định nghĩa điểm dừng, chúng ta thấy rằng phân phối hai biến của Yt
và Ys phải giống với Yt - k và Ys - k mà từ đó nó theo sau Cov (Yt , Ys)
= , ) (
( s - Y0
γtS, Cov Yt
=
Cov Y0 Ys,t - ) (
=
Cov Y0 Y, ts - )
=
γ0, ts -
Nghĩa là, hiệp phương sai giữa Yt và Ys chỉ phụ thuộc vào thời gian thông qua thời gian khác
nhau ence | t - s | và không phải về thời gian thực tế t và s. Do đó, đối với một quá trình tĩnh,
chúng ta có thể đơn giản hóa ký hiệu và viết
= , Cov
() γk nd = , Corr
() ρk (2.3.1)
Yt Yt k - một
Yt Yt k -
γk
---- =
ρk
γ0
Các thuộc tính tổng quát được đưa ra trong Công thức (2.2.5) bây giờ trở thành
=
γ0 Var Yt () ρ0 1 =
γk γ – k = ρk ρ – k = (2.3.2)
γk γ0 ≤ ρk ≤ 1
Nếu một quá trình là đứng yên và có phương sai hữu hạn, thì hiệp phương sai func
tion chỉ phải phụ thuộc vào độ trễ thời gian.
Một định nghĩa tương tự như định nghĩa của sự cố định nghiêm ngặt nhưng yếu hơn về mặt toán học
Machine Translated by Google
như sau: Quá trình ngẫu nhiên {Yt} được cho là yếu (hoặc bậc hai)
cố định nếu
1. Hàm trung bình không đổi theo thời gian và
2. =
γtt
, -k γ0, k cho tất cả thời gian t và độ trễ k
Trong cuốn sách này, thuật ngữ văn phòng phẩm khi được sử dụng một mình sẽ luôn đề cập đến dạng yếu hơn này của
sự cố định. Tuy nhiên, nếu các phân phối chung cho quá trình đều là đa biến bình thường
phân phối, nó có thể được chỉ ra rằng hai định nghĩa trùng khớp. Đối với các quy trình tĩnh,
chúng ta thường chỉ xét k ≥ 0.
Tiếng ồn trắng
Một ví dụ rất quan trọng về quá trình tĩnh là cái gọi là quá trình tiếng ồn trắng ,
được định nghĩa là một chuỗi các biến ngẫu nhiên độc lập, phân bố giống hệt nhau
{et }. Tầm quan trọng của nó không bắt nguồn từ thực tế rằng bản thân nó là một mô hình thú vị mà là từ
thực tế là nhiều quy trình hữu ích có thể được xây dựng từ nhiễu trắng. Thực tế là
{et } là hoàn toàn cố định nên dễ dàng nhận thấy vì
( Pr et x1 ≤ ,,
et x2 ≤ … Et ) ≤xn
1 2 N
=
Pr (et1 ()x1≤ Pr et2 ()x2≤ … Pr etN ) xn
≤ (độc lập)
=
Pr (et1 - k () x2 ≤ … Pr et - k )xn≤
x1 ≤ Pr et - k ()
2 N
cho k 0 =
= Var et ()
γk
cho k 0
0
1 cho k 0 =
= (2.3.3)
ρk
cho k 0
0
Thuật ngữ tiếng ồn trắng phát sinh từ thực tế là một phân tích tần số của mô hình cho thấy
tương tự với ánh sáng trắng, tất cả các tần số đều nhập như nhau. Chúng tôi thường cho rằng
2
σe
quá trình nhiễu trắng có giá trị trung bình bằng 0 và biểu thị Var (et ) bằng.
Ví dụ về đường trung bình động, ở trang 14, trong đó Yt = (et + et - 1) / 2, là một ví dụ khác
ví dụ về một quá trình tĩnh được xây dựng từ tiếng ồn trắng. Trong ký hiệu mới của chúng tôi, chúng tôi
Như một ví dụ hơi khác, † hãy xem xét quá trình được định nghĩa như sau:
Yt = cos 2π t
----- + Φ cho t = 012…, ±, ±,
12
trong đó Φ được chọn (một lần) từ phân phối đều trên khoảng từ 0 đến 1. A
mẫu từ quy trình như vậy sẽ có tính xác định cao vì Yt sẽ tự lặp lại
giống hệt nhau mỗi 12 đơn vị thời gian và trông giống như một đường cong cosine (thời gian rời rạc)
hoàn hảo. Dù sao đi nữa, cực đại của nó sẽ không xảy ra tại t = 0 mà sẽ được xác định bởi pha ngẫu nhiên Φ.
Giai đoạn Φ có thể được hiểu là một phần của một chu kỳ hoàn chỉnh được hoàn thành vào thời gian t =
0. Tuy nhiên, các thuộc tính thống kê của quá trình này có thể được tính như sau:
=
E Yt () E
cos 2π
t
----- + Φ
12
t 2π
cos ----- + φ dφ
= 12
0
1
1 t
= ------
tội 2π
----- +
2π φ 12
φ 0 =
1 t
= ------
tội 2πt ----- + - tội 2π
2π 2π 12 -----12
Nhưng đây là số không vì các sines phải đồng ý. Vậy μt = 0 với mọi t.
Cũng thế
γt S,
= E cos 2π t
----- + cos 2π ----- +
s
Φ 12 Φ 12
1
t S
cos 2π
----- + φ
cos 2π
----- + φ dφ
= 12 12
0
1
1
- ts -2π ts +
cos + cos 2π --------- 2 + φ 12 dφ
=2 0 12
---------
1
1
- ts2π- 1 ts +
= cos + ------ 2π Tôi tội lỗi
--------- 2 +
2 ---------
12 4π 12 φ
φ 0 =
- 1 ts2π -
= cos
2 ------------
12
† Ví dụ này chứa tài liệu tùy chọn không cần thiết để hiểu hầu hết
phần còn lại của cuốn sách này. Nó sẽ được sử dụng trong Chương 13, Giới thiệu về Phân tích Quang phổ.
Machine Translated by Google
k
= cos 2π cho k = 012…, ±, ±, (2.3.4)
ρk ----- 12
Ví dụ này cho thấy rằng sẽ rất khó để đánh giá xem liệu có phải là
một giả định hợp lý cho một chuỗi thời gian nhất định trên cơ sở biểu đồ trình tự thời gian của
dữ liệu quan sát.
= +++ cũng được xây dựng
Bước đi ngẫu nhiên của trang 12, nơi Yt e1 e2 … et từ nhiễu trắng nhưng ,
không đứng yên. Ví dụ, hàm phương sai, Var (Yt ) =
2 2 cho 0 ≤ t ≤ s không =
σe_ , không
tσe phải là hằng số; hơn nữa, hàm hiệp phương sai γt
S,
không chỉ phụ thuộc vào độ trễ thời gian. Tuy nhiên, giả sử rằng thay vì phân tích {Yt } trực tiếp,
chúng tôi xem xét sự khác biệt của các giá trị Y liên tiếp, được ký hiệu là Yt . Khi đó Yt = Yt - Yt 1 =
vì vậy chuỗi sai phân, { Yt }, là cố định. Điều này đại diện cho một ví dụ đơn giản về
et , kỹ thuật được tìm thấy là cực kỳ hữu ích trong nhiều ứng dụng. Rõ ràng, nhiều thời gian thực
chuỗi không thể được mô hình hóa một cách hợp lý bởi các quá trình tĩnh vì chúng không ở trạng thái
cân bằng thống kê mà đang phát triển theo thời gian. Tuy nhiên, chúng ta có thể thường xuyên chuyển
đổi chuỗi không cố định thành chuỗi tĩnh bằng các kỹ thuật đơn giản như phân biệt. Như là
các kỹ thuật sẽ được theo đuổi mạnh mẽ trong các chương còn lại.
Trong chương này, chúng tôi đã giới thiệu các khái niệm cơ bản về các quá trình ngẫu nhiên phục vụ
làm mô hình cho chuỗi thời gian. Đặc biệt, bây giờ bạn nên làm quen với các
các khái niệm về hàm trung bình, hàm tự thay đổi và hàm tự tương quan.
Chúng tôi đã minh họa các khái niệm này bằng các quy trình cơ bản: bước đi ngẫu nhiên, tiếng ồn trắng,
đường trung bình động đơn giản và một sóng cosine ngẫu nhiên. Cuối cùng, khái niệm cơ bản về
văn phòng phẩm được giới thiệu ở đây sẽ được sử dụng xuyên suốt cuốn sách.
BÀI TẬP
2.1 Giả sử E (X) = 2, Var (X) = 9, E (Y) = 0, Var (Y) = 4 và Corr (X, Y) = 0,25. Tìm thấy:
(a) Var (X + Y).
2.2 Nếu X và Y phụ thuộc nhưng Var (X) = Var (Y), hãy tìm Cov (X + Y, X - Y).
2.3 Cho X có phân phối với trung bình μ và phương sai σ2 , và đặt Yt = X với mọi t.
2.4 Cho {et } là một quá trình nhiễu trắng có nghĩa là 0. Giả sử rằng quá trình được quan
sát là Yt = et + {Yt
θet }- cả
1, khi
trong
θ =đó3 θvàlàkhi
3 hoặc
θ = 1/3.
1/3. (b)
(a) Bạn
Tìm nên
hàm phát
tự tương
hiện quan
ra rằng
cho
chuỗi thời gian là đứng yên bất kể giá trị của θ và các hàm tự tương quan là như
nhau đối với θ = 3 và θ = 1/3. Để đơn giản hơn, giả sử rằng trung bình của quá
trình được biết là 0 và phương sai của Yt được biết là 1. Bạn quan sát chuỗi
{Yt } cho t = 1, 2, ..., n và giả sử rằng bạn có thể tạo ra ước lượng của tự
tương quan ρk.
Bạn có nghĩ rằng bạn có thể xác định giá trị nào của θ là đúng (3 hoặc 1/3) dựa trên
ước tính của ρk không? Tại sao hoặc tại sao không?
2.5 Giả sử Yt = 5 + 2t + Xt , trong đó {Xt } là chuỗi đứng yên bằng 0 với hàm phương sai
autoco γk. (a) Tìm hàm trung bình cho {Yt }. (b) Tìm hàm tự phương sai cho {Yt }.
(c) {Yt } có đứng yên không ? Tại sao hoặc tại sao không?
cho t lẻ
=
2.6 Gọi {Xt } là một chuỗi thời gian tĩnh và xác định Yt Xt
cho t thậm chí.
Xt
2.7 Giả sử rằng {Yt } đứng yên với hàm tự phương sai γk. (a) Chứng tỏ
rằng Wt = Yt = Yt - Yt - 1 là đứng yên
sai bằng
trungcách
bìnhtìm
và hàm
phương
phương
sai autoco cho {Wt }.
2.9 Giả sử Yt = β0 + β1t + Xt , trong đó {Xt } là chuỗi đứng yên bằng 0 với hàm hiệp
phương sai tự động γk và β0 và β1 là các hằng số. (a) Chứng tỏ rằng {Yt } không
đứng yên nhưng Wt = Yt = Yt - Yt - 1 là đứng yên. (b) Nói chung, chứng
nếu Yttỏ
= rằng
μt +
Xt , trong đó {Xt } là chuỗi đứng yên bằng 0= và μt
( là
m đa1Yt
thức
) là
ở tsta
bậctĩnh
d, thì
đối với
mYt
m ≥ d và tĩnh đối với 0 ≤ m < d.
2.10 Gọi {Xt } là một quá trình tĩnh đơn vị-trung bình bằng 0 với hàm tự tương quan ρk.
Giả sử rằng μt là một hàm không thuận và σt là một hàm không thuận nghịch có giá
trị dương. Chuỗi quan sát được hình thành là Yt = μt + σt Xt . (a) Tìm hàm trung
bình và hiệp phương sai cho quá trình {Yt }. (b) Chứng tỏ rằng hàm tự tương quan
cho quá trình {Yt } chỉ phụ thuộc vào
thời gian trễ. Quá trình {Yt } có đứng yên không?
(c) Có thể có một chuỗi thời gian với giá trị trung bình không đổi và với
Corr (Yt, Yt - k) không có t nhưng với {Yt } không đứng yên?
Machine Translated by Google
Bài tập 21
2.14 Đánh giá hàm trung bình và hiệp phương sai cho mỗi quá trình sau đây. Trong
mỗi trường hợp, xác định xem quá trình có đứng yên hay không.
(a) Yt = θ0 + tet .
(a). (c) Yt = et et - 1. (Bạn có thể cho rằng {et } là nhiễu trắng bình thường.)
2.15 Giả sử rằng X là một biến ngẫu nhiên có giá trị trung bình bằng không. Xác định một chuỗi thời gian bằng
Yt = ( 1) t X.
2.16 Giả sử Yt = A + Xt , trong đó {Xt } là đứng yên và A là ngẫu nhiên nhưng độc lập với
{Xt }. Tìm hàm trung bình và hiệp phương sai cho {Yt } theo giá trị trung bình và
hàm tự phương sai cho {Xt } và giá trị trung bình và phương sai của A.
_ 1 - N
2.17 Cho {Yt } đứng yên với hàm tự phương sai γk. Hãy cho thấy Y .
= N t 1 = Yt
điều đó
n 1–
γ0 2
- k
----
Var Y_ () + =
N N 1 --–N γk
k 1 =
n 1–
-1 1 - -----
k
= N N γk
kn - 1 + =
2.18 Cho {Yt } đứng yên với hàm tự phương sai γk. Xác định biến mẫu =
1 N _
2
ance as S2 -----------
()
Yt-Y .
n 1– t 1 =
N N _
2 = 2
(a) Đầu tiên cho thấy rằng Yt () - μ (Yt )Y - + N Y_ ( 2 ) - μ .
t 1 = t 1 =
(d) Nếu {Yt } là một quá trình nhiễu trắng với phương sai γ0, chứng tỏ rằng E (S2 ) = γ0.
Machine Translated by Google
2.19 Cho Y1 = θ0 + e1, sau đó với t > 1 xác định đệ quy Yt theo Yt = θ0 + Yt 1 + et .
Ở đây θ0 là một hằng số. Quá trình {Yt } được gọi là một bước đi ngẫu nhiên với
sự trôi dạt. (a) Chứng tỏ rằng Yt có thểTìm =hàm
được ++
viết+ lại
trung
+ bình
thành …. E1
củaYtYttθ0 et et
(c)
. (b)
Tìm1–hàm
tự phương sai của Yt .
2.20 Xem xét mô hình đi bộ ngẫu nhiên tiêu chuẩn trong đó Yt = Yt - 1 + et với Y1 = e1. (a)
Sử dụng biểu diễn của Yt ở trên để chứng tỏ rằng μt = μt - 1 với t >ban
1 với
đầu điều
μ1 = kiện
E (e1) =
0. Do đó cho thấy μt = 0 với mọi t. (b) Tương tự, chứng tỏ rằng Var (Yt ) = Var (Yt
2 2
- 1) + σe và do đó Var (Yt ) = t σe (c) Với 0 ≤ t ≤ s,+ sử cho
+ es đểtYs
dụng > =1thấy
cho với+ rằng
Yt Var (Y1)
et + Cov
1 + (Yt
et +, 2
= σe
2
Ys) = .
…
2
Var (Yt ) và do đó, Cov (Yt , Ys) = min (t, s) σe 2,21 Đối .
với một lần đi bộ ngẫu nhiên với giá trị bắt đầu ngẫu nhiên, hãy đặt Yt = ++ + +
Y0 et et 1– … e1 cho t >
2
σ0 e1,
0, trong đó Y0 có phân phối với μ0 trung bình và phương sai. Giả sử nhiệt lông...,
mà Y0,
et
là độc lập. (a) Chứng tỏ rằng E (Yt ) = μ0 với mọi t. (b) Chứng tỏ rằng Var (Yt ) = t +
σe σ0 (c) Chứng tỏ rằng Cov (Yt , Ys) = min (t, s) + σ0
2 2
.
2 2
σe .
2 2
tσa + σ0
(d) Cho thấy rằng , ()
Corr Yt Ys
= --------------------- cho 0 ≤ ≤ts.
2
2 σ0
+ sσa
2.22 Gọi {et } là quá trình nhiễu trắng có giá trị 0, và đặt c là hằng số với | c | <1.
Định nghĩa đệ quy Yt theo Yt = cYt - 1 + et với Y1 = e1. (a)
() 1–
Var Yt
Corr Yt , 1– )
( Yt = --------------------------
c
và nói chung,
Var Yt ()
Var Yt k - ()
, k - )
( Yt
Corr Yt
= ck --------------------------
cho k > 0
Var Yt ()
Bài tập 23
2.23 Hai quá trình {Zt } và {Yt } được cho là độc lập nếu đối với bất kỳ thời điểm nào t1,
2.24 Gọi {Xt } là một chuỗi thời gian mà chúng ta quan tâm. Tuy nhiên, vì bản thân quá trình
chắc chắn không hoàn hảo, chúng tôi thực sự quan sát thấy Yt = Xt + et . Chúng tôi giả định
rằng {Xt } và {et } là các quá trình độc lập. Chúng tôi gọi Xt là tín hiệu và et
nhiễu đo lường hoặc quá trình lỗi.
Nếu {Xt } đứng yên với hàm tự tương quan ρk, chứng tỏ rằng {Yt } cũng
đứng yên với
ρk
, k - )
( Yt = -------------------------- cho k ≥ 1
Corr Yt 2 2
1 +σe⁄ σX
2 2là⁄ tỷ lệ tín hiệu trên nhiễu, hoặc SNR. Lưu ý rằng SNR càng lớn,
Chúng tôi gọi
σX σe
Hàm tự tương quan của quá trình quan sát {Yt } càng gần với hàm tự tương
quan của tín hiệu mong muốn {Xt }.
k
2.25 Giả sử Yt β0 + = [Ai cos
2πf( tôi
+ t
( ) sin
Bi 2πf tôi
) t ], trong đó β0, f1, f2, ..., fk là
tôi 1 =
hằng số và A1, A2, ..., Ak, B1, B2, ..., Bk là các biến ngẫu nhiên độc lập với
2
không có nghĩa và phương sai Var (Ai ) = Var (Bi ) = . σi
Chứng tỏ rằng {Yt } đang đứng yên
và tìm hàm hiệp phương sai của nó.
1 2
2.26 Định nghĩa hàm Γt = [( bán biểu
S, --E Yt Ys
2 - ) ] . Trong thống kê địa lý, Γt, s được gọi là
đồ.
(a) Chứng tỏ rằng đối với một quá trình
- =
γ0 γ .
Γt S, ts -
đứng yên (b) Một quá trình được cho là đứng yên về bản chất nếu Γt, s chỉ phụ thuộc vào thời gian
sự khác biệt | t - s |. Chứng tỏ rằng quá trình đi bộ ngẫu nhiên về bản chất là quá trình
đi bộ.
2.27 Đối với một số nguyên dương r cố định và không đổi φ, hãy xem xét chuỗi thời gian được xác định bởi
= + + ++
Yt et φet 1– φ2et 2– (a) … Ret r - .
Chứng tỏ rằng quá trình này là đứng yên với bất kỳ giá trị nào của φ.
(b) Tìm hàm tự tương quan.
2.28 (Mở rộng sóng cosin ngẫu nhiên) Giả sử rằng
trong đó 0 < f <½ là tần số cố định và R và Φ là các ables biến ngẫu nhiên
không tương quan và với Φ phân bố đồng đều trên khoảng (0,1).
(a) Chứng tỏ rằng E (Yt ) = 0 với mọi t.
1
(b) Chứng tỏ rằng quá trình là đứng yên với γk --E cos
= () R2 () 2πf k .
2
Gợi ý: Sử dụng các phép tính dẫn đến Công thức (2.3.4), ở trang 19.
Machine Translated by Google
trong đó 0 < f1 < f2 <… < fm <½ là m tần số cố định và R1, Φ1, R2, Φ2,…,
Rm, Φm là các biến ngẫu nhiên không tương quan với mỗi Φj được phân phối đồng đều trên
khoảng (0,1).
trong đó R và Φ là các biến ngẫu nhiên độc lập và f là tần số cố định. Các
pha Φ được giả thiết là phân bố đều trên (0,1) và biên độ R có
=
> r2
một phân phối Rayleigh với pdf f r () cho r lại 0. -Chỉ
⁄ 2
ra rằng cho mỗi
thời điểm t, Yt có phân phối chuẩn. (Gợi ý: Cho YR = cos [2π ( ft + Φ ) ] và
X = Rsin [2π ( ft + Φ )] . Bây giờ hãy tìm phân phối chung của X và Y. Nó cũng có thể là
cho thấy rằng tất cả các phân phối chiều hữu hạn là chuẩn đa biến và
Trong phụ lục này, chúng tôi xác định kỳ vọng cho các biến ngẫu nhiên liên tục. Tuy nhiên, tất cả
của các thuộc tính được mô tả giữ cho tất cả các loại biến ngẫu nhiên, rời rạc, liên tục,
hay nói cách khác. Cho X có hàm mật độ xác suất f (x) và cho cặp (X, Y) có
hàm mật độ xác suất khớp f (x, y). ∞
Giá trị kỳ vọng của X được xác định là E X () xf x () xd .
=
–∞
∞
(Nếu xf x () xd∞;<nếu không thì E (X) là không xác định.) E (X) còn được gọi là kỳ vọng
–∞
của X hoặc giá trị trung bình của X và thường được ký hiệu là μ hoặc μX.
∞
EhX [()] = h x ( ) f x () xd
–∞
∞ ∞
Tương tự, nếu h xy (,) fxy, () dy xd ∞ < , nó có thể được hiển thị rằng
–∞ –∞
Machine Translated by Google
∞ ∞
EhXY ([),] = hxy (), fxy(), dy xd (2.A.1)
–∞ –∞
Theo hệ quả của Công thức (2.A.1), chúng ta dễ dàng thu được kết quả quan trọng
∞ ∞
E XY () = xyf xy(), dy xd (2.A.3)
–∞ –∞
Phương sai của một biến ngẫu nhiên X được định nghĩa là
EX [- ()] 2(với
= { điều
Vartồn
Xkiện
()
tạiEXE } (2.A.4)
Var X () ≥ 0 (2.A.5)
Var a bX
+ () b2 = Var X () (2.A.6)
Căn bậc hai dương của phương sai của X được gọi là độ lệch chuẩn của X và
thường được ký hiệu là σ hoặc σX. Biến ngẫu nhiên (X - μX) / σX được gọi là phiên
bản chuẩn hóa của X. Giá trị trung bình và độ lệch chuẩn của một biến chuẩn là
luôn luôn bằng không và một, tương ứng.
Hiệp phương sai của X và Y được xác định là Cov ,XY () =[ EX μX
- ()
() - Y μY ].
+ (
Cov a bX , ) c dY + = bdCov XY (), (2.A.9)
Var XY (
) + = Var X () + + Var Y () 2Cov XY (), (2.A.10)
Hệ số tương quan của X và Y, ký hiệu là Corr (X, Y) hoặc ρ, được định nghĩa là
= Cov XY (),
ρ Corr XY (), = ----------------------------------------
Var X ( ) Var Y ()
1 nếu bd > 0
(2.A.16)
nơi ký bd () = 0 nếu bd 0 =
- nếu 1 bd
<0
CHƯƠNG 3
XU HƯỚNG
Trong một chuỗi thời gian chung, hàm trung bình là một hàm hoàn toàn tùy ý của thời gian. Trong
chuỗi thời gian tĩnh, hàm trung bình phải không đổi theo thời gian. Thông thường, chúng ta cần lấy
điểm trung bình và xem xét các hàm trung bình là các hàm tương đối đơn giản (nhưng không phải là
hằng số) của thời gian. Những xu hướng này được xem xét trong chương này.
"Xu hướng" có thể khá khó nắm bắt. Các nhà phân tích khác nhau có thể nhìn nhận cùng một chuỗi thời
gian hoàn toàn khác nhau. Bước đi ngẫu nhiên được mô phỏng trong Hình 2.1 có thể được coi là hiển
thị một xu hướng tăng chung. Tuy nhiên, chúng ta biết rằng thuế đi bộ ngẫu nhiên không có giá trị
trung bình cho mọi thời đại. Xu hướng được nhận thức chỉ là sự tạo tác của mối tương quan thuận
chặt chẽ giữa các giá trị chuỗi tại các thời điểm gần nhau và phương sai ngày càng tăng trong quá
trình khi thời gian trôi qua. Mô phỏng thứ hai và thứ ba của chính xác cùng một quy trình có thể
cho thấy những “xu hướng” hoàn toàn khác nhau. Chúng tôi yêu cầu bạn tạo một số mô phỏng bổ sung
trong các bài tập. Một số tác giả đã mô tả các xu hướng như vậy là xu hướng ngẫu nhiên (xem Box,
Jenkins và Reinsel, 1994), mặc dù không có định nghĩa được đồng minh địa lý chấp nhận về xu hướng
ngẫu nhiên.
Chuỗi nhiệt độ trung bình hàng tháng được vẽ trong Hình 1.7 trên trang 6, cho thấy xu hướng
theo chu kỳ hoặc theo mùa, nhưng ở đây lý do cho xu hướng này là rõ ràng - độ nghiêng thay đổi của
Bắc bán cầu đối với mặt trời. Trong trường hợp này, một mô hình khả thi có thể là Yt = μt + Xt ,
trong đó μt là một hàm xác định tuần hoàn với chu kỳ 12; đó là μt , nên thỏa mãn
=
μt μt - 12 cho tất cả t
Chúng ta có thể giả định rằng Xt , biến thiên không quan sát được xung quanh μt , không có giá trị
trung bình với mọi t để thực sự μt là hàm trung bình của chuỗi quan sát Yt . Chúng ta có thể mô tả
mô hình này là có một xu hướng xác định trái ngược với xu hướng ngẫu nhiên đã được xem xét trước
đó. Trong các tình huống khác, chúng ta có thể đưa ra giả thuyết về một xu hướng xác định là tuyến
tính theo thời gian (nghĩa là, μt = β0 + β1t) hoặc có thể là xu hướng thời gian bậc hai, μt = β0 +
β1t + β2t 2. Lưu ý rằng hàm ý của mô hình Yt = μt + Xt với E (Xt ) = 0 với mọi t là xu hướng đẳng
tích xác định μt áp dụng cho mọi thời điểm. Do đó, nếu μt = β0 + β1t, chúng ta đang giả định rằng
cùng một xu hướng thời gian tuyến tính áp dụng mãi mãi. Do đó, chúng ta nên có những lý do chính
đáng để giả định một mô hình như vậy — không chỉ vì chuỗi có vẻ hơi tuyến tính trong khoảng thời
gian được quan sát.
27
Machine Translated by Google
28 Xu hướng
Trong chương này, chúng tôi xem xét các phương pháp để mô hình hóa các xu hướng xác định. Stochastic
các xu hướng sẽ được thảo luận trong Chương 5 và các mô hình theo mùa ngẫu nhiên sẽ được thảo luận
trong Chương 10. Nhiều tác giả sử dụng từ xu hướng chỉ cho một hàm trung bình thay đổi chậm,
chẳng hạn như xu hướng thời gian tuyến tính và sử dụng thuật ngữ thành phần theo mùa cho một
hàm trung bình thay đổi theo chu kỳ. Chúng tôi không thấy hữu ích khi phân biệt như vậy ở đây.
Đầu tiên chúng ta xem xét tình huống đơn giản trong đó một hàm trung bình không đổi được giả định. Của chúng tôi
Yt μ Xt + = (3.2.1)
trong đó E (Xt ) = 0 với mọi t. Chúng tôi muốn ước tính μ với chuỗi thời gian quan sát của chúng tôi Y1, Y2,…,
Yn. Ước tính phổ biến nhất của μ là giá trị trung bình hoặc giá trị trung bình của mẫu được xác định là
_ 1 - N
Y (3.2.2)
= N Yt
t 1 =
Theo
_
Y E () = μ;
giả thiết tối giản của phương trình (3.2.1), chúng ta thấy rằng
trướcYđó có một ước lượng không chệch của μ. Để điều tra độ chính xác
Y của ước tính
μ, chúng ta cần đưa ra các giả thiết khác liên quan đến Xt .
Giả sử rằng {Yt }, (hoặc tương đương, {Xt } của phương trình (3.2.1)) là thời gian đứng yên
chuỗi với hàm tự tương quan ρk. Sau đó, theo Bài tập 2.17, chúng ta có
n 1– k
γ0 1 - -----
=
----
Var Y_ () ρk N
N kn - 1 + =
(3.2.3)
n 1–
k
= γ0
---- 12 1 --–
N + N Ρ ρk
k 1 =
Lưu ý rằng yếu tố đầu tiên, γ0 / n, là phương sai của quá trình (tổng thể) chia cho kích thước
sam sung — một khái niệm mà chúng ta đã quen thuộc trong bối cảnh lấy mẫu ngẫu nhiên đơn giản hơn. Nếu
chuỗi {Xt } của phương trình (3.2.1) chỉ là nhiễu trắng, sau đó ρk = 0 với k > 0 và giảm Var Y ()
Trong mô hình trung bình động (đứng yên) Yt = et - ½et - 1, chúng ta thấy rằng ρ1 = 0,4
và ρk = 0 với k > 1. Trong trường hợp này, chúng ta có
γ0
----
1
Var Y_ ()
() 1–0,4
21 + = --–
N N
γ0 n 1–
- = ---- 1 0,8 -----------
N N
Đối với các giá trị của n thường xảy ra trong chuỗi thời gian (chẳng hạn như n > 50), hệ số (n - 1) / n
Chúng tôi thấy rằng mối tương quan âm ở độ trễ 1 đã cải thiện ước lượng giá trị
trung bình so với ước lượng thu được trong tình huống nhiễu trắng (mẫu ngẫu nhiên).
Bởi vì chuỗi có xu hướng dao động qua lại trên giá trị trung bình, giá trị trung bình
mẫu thu được chính xác hơn.
Mặt khác, nếu ρk ≥ 0 với mọi k ≥ 1, ta thấy từ Công thức (3.2.3) rằng Var Y () sẽ
lớn hơn γ0 / n. Ở đây, các tương quan thuận làm cho việc ước lượng giá trị trung bình
khó hơn so với trường hợp nhiễu trắng. Nói chung, một số tương quan sẽ là tích cực và
một số tiêu cực, và Công thức (3.2.3) phải được sử dụng để đánh giá tác động tổng thể.
Đối với nhiều quá trình tĩnh, chức năng tự tương quan suy giảm đủ nhanh với
độ trễ ngày càng tăng
∞
∞ ρk
< (3.2.4)
k 0 =
∞
γ0
----
Var Y_ () ≈ ρk cho n lớn (3.2.5)
N k - = ∞
Lưu ý rằng với giá trị gần đúng này, phương sai tỷ lệ nghịch với cỡ mẫu n.
( 1 + φ) γ0
≈ ---------------- ----
Var Y_ () (3.2.6)
(1 - φ) N
Đối với quá trình không tĩnh (nhưng với giá trị trung bình không đổi), độ chụm của giá trị trung
bình của mẫu như một ước lượng của μ có thể khác nhau một cách rõ rệt. Như một ví dụ hữu ích, giả sử
rằng trong Phương trình (3.2.1) {Xt } là một quá trình đi bộ ngẫu nhiên như được mô tả trong Chương 2.
N
1
= ----- Yi
Var Y_ ()
Var n2 tôi 1 =
N
1
tôi
= -----
ej
Var n2 i 1 = j 1 =
Machine Translated by Google
30 Xu hướng
1
= + + ++
(----- Var e1 2e2 3e3 … nen ) n2
2 N
σe k2
------
=
n2 k 1 =
để có thể
= () n 1+
----------------
Var Y_ () σe 2 () 2n 1+ (3.2.7)
6n
Lưu ý rằng trong trường hợp đặc biệt này, phương sai của ước tính của chúng tôi về giá trị trung bình thực sự
tăng khi kích thước mẫu n tăng. Rõ ràng đây là điều không thể chấp nhận được và chúng ta cần
xem xét các kỹ thuật ước lượng khác cho chuỗi không tĩnh.
Phương pháp thống kê cổ điển của phân tích hồi quy có thể dễ dàng được sử dụng để ước tính
các tham số của các mô hình xu hướng trung bình không tương đối phổ biến. Chúng tôi sẽ xem xét nhiều nhất
những thứ hữu ích: tuyến tính, bậc hai, phương tiện theo mùa và xu hướng cosin.
Xem xét xu hướng thời gian xác định được biểu thị bằng
μt β0 β1 + = t (3.3.1)
trong đó độ dốc và điểm chặn, tương ứng là β1 và β0 , là các tham số chưa biết. Các
Phương pháp bình phương nhỏ nhất cổ điển (hoặc hồi quy) là chọn làm ước lượng của β1 và β0
val ues tối thiểu hóa
N
2
Q ( , )
β0 β1 Yt -β0( β1 t) []
+
=
t 1 =
Giải pháp có thể đạt được theo một số cách, ví dụ, bằng cách tính toán một phần
dẫn xuất đối với cả hai β, đặt kết quả bằng 0 và giải ^ ^
β 0 và β 1 , chúng
kết quả là phương trình tuyến tính của β. Biểu thị các giải pháp bằng tôi thấy rằng
N
_
( Yt )Y - t()t_-
^ t 1 =
β1 = ---------------------------------------------
N
2
t t_ (3.3.2)
() -
t 1 =
^ _ ^ _
β0 - =Y β 1t
_
trong đó t
= (n + 1) / 2 là giá trị trung bình của 1, 2,…, n. Những công thức này có thể được đơn giản hóa một số
điều, và các phiên bản khác nhau của công thức đều được nhiều người biết đến. Tuy nhiên, chúng tôi giả định rằng
Machine Translated by Google
các tính toán sẽ ^được thực^ hiện bằng phần mềm thống kê và chúng tôi sẽ không theo đuổi các
biểu thức cho và βở0 1đây. β
Thí dụ
Hãy xem xét quá trình đi bộ ngẫu nhiên được trình bày trong Phụ lục 2.1. Giả sử chúng ta
(nhầm lẫn) coi đây là xu hướng thời gian tuyến tính và ước tính độ dốc và mức chặn bằng
hồi quy bình phương tối thiểu. Sử dụng phần mềm thống kê, chúng tôi thu được Phụ lục 3.1.
Hình 3.1 Ước tính hồi quy bình phương nhỏ nhất cho xu hướng thời gian tuyến tính
^ ^
Vì vậy, ở đây độ dốc và hệ số chặn ước tính là β=1 0,1341 và = β
1,008, tương ứng 0
cẩn thận. Hình 3.2 hiển thị bước đi ngẫu nhiên với đường xu hướng hồi quy bình phương nhỏ nhất
chồng lên nhau. Chúng tôi sẽ giải thích thêm về kết quả hồi quy sau trong Phần 3.5 về
trang 40 và thấy rằng việc điều chỉnh một dòng cho những dữ liệu này là không phù hợp.
Hình 3.2 Bước đi ngẫu nhiên với xu hướng thời gian tuyến tính
•
•
số
8
• •
• •
6 • • •
• •
• • •
•
• •
•• • •
•
4
•• •
• •
•
y • • •
• ••
• • •
•
•• •
• ••
2
• •
•
0 • •• • • ••
• •
• •
•
2 •
0 10 20 30 40 50 60
Thời gian
> win.graph (chiều rộng = 4,875, chiều cao = 2,5, kích thước điểm = 8)
> plot (rwalk, type = 'o', ylab = 'y')
> abline (model1) # thêm dòng hình vuông nhỏ nhất vừa vặn từ model1
Machine Translated by Google
32 Xu hướng
Bây giờ hãy xem xét lập mô hình và ước tính các xu hướng theo mùa, chẳng hạn như trung bình hàng tháng
dữ liệu nhiệt độ trong Hình 1.7. Ở đây, chúng tôi giả định rằng chuỗi được quan sát có thể được gửi
lại dưới dạng
Yt μt Xt + =
Giả định chung nhất cho μt với dữ liệu theo mùa hàng tháng là có 12
hằng số (tham số), β1, β2,… và β12, đưa ra nhiệt độ trung bình dự kiến cho
mỗi 12 tháng. Chúng tôi có thể viết
Đây đôi khi được gọi là mô hình phương tiện theo mùa .
Ví dụ về mô hình này, hãy xem xét dữ liệu nhiệt độ trung bình hàng tháng được hiển thị
trong Hình 1.7 trên trang 6. Để phù hợp với mô hình như vậy, chúng ta cần thiết lập các biến chỉ báo
(đôi khi được gọi là biến giả) cho biết tháng mà mỗi dữ liệu
điểm liên quan. Thủ tục để thực hiện điều này sẽ phụ thuộc vào thống kê cụ thể
phần mềm mà bạn sử dụng. Chúng tôi cũng cần lưu ý rằng mô hình như đã nêu không chứa
thuật ngữ chặn, và phần mềm cũng sẽ cần biết điều này. Ngoài ra, chúng ta có thể sử dụng
một điểm chặn và loại bỏ bất kỳ một trong số các dấu β trong Công thức (3.3.3).
Hình 3.3 hiển thị kết quả của việc điều chỉnh mô hình phương tiện theo mùa với dữ liệu
thời tiết. Ở đây, các giá trị t và giá trị Pr (> | t |) được báo cáo ít được quan tâm vì chúng
liên quan đến việc kiểm tra các giả thuyết rỗng mà các β bằng 0 — không phải là một giả thuyết thú vị
trong trường hợp này.
Phụ lục 3.3 Kết quả hồi quy cho mô hình phương tiện theo mùa
Tháng bảy
71.717 0,987 72,7 <0,0001
Machine Translated by Google
Hình 3.4 cho thấy các kết quả thay đổi như thế nào khi chúng ta điều chỉnh một mô hình với một điểm chặn
kỳ hạn. Phần mềm bỏ qua hệ số tháng 1 trong trường hợp này. Bây giờ hệ số tháng 2
được hiểu là sự khác biệt giữa nhiệt độ trung bình của tháng 2 và tháng 1, hệ số
tháng 3 là sự khác biệt giữa mức trung bình của tháng 3 và tháng 1
nhiệt độ, v.v. Một lần nữa, các giá trị t và Pr (> | t |) (giá trị p) đang kiểm tra
giả thuyết ít được quan tâm trong trường hợp này. Lưu ý rằng hệ số đánh chặn cộng với
Hệ số tháng Hai ở đây bằng hệ số tháng Hai được hiển thị trong Phụ lục 3.3.
Phụ lục 3.4 Kết quả cho Mô hình Phương tiện Theo mùa có Chặn
Tháng bảy
55.108 1.396 39.48 <0,0001
34 Xu hướng
Xu hướng Cosine
Mô hình trung bình theo mùa cho dữ liệu hàng tháng bao gồm 12 thông số độc lập và
hoàn toàn không tính đến xu hướng theo mùa. Ví dụ, thực tế
rằng tháng Ba và tháng Tư có nghĩa là khá giống nhau (và khác với tháng Sáu và tháng Bảy
nghĩa là) không được phản ánh trong mô hình. Trong một số trường hợp, các xu hướng theo mùa có thể
được mô hình hóa sinh thái với các đường cong cosine kết hợp sự thay đổi suôn sẻ được mong đợi từ một
khoảng thời gian này sang khoảng thời gian tiếp theo mà vẫn bảo toàn tính thời vụ.
Chúng ta gọi β (> 0) là biên độ, f là tần số và Φ là pha của đường cong. Khi t thay đổi,
đường cong dao động giữa cực đại của β và cực tiểu của β. Kể từ khi đường cong
lặp lại chính xác mỗi đơn vị thời gian 1 / f, 1 / f được gọi là chu kỳ của sóng cosin. Như
được lưu ý trong Chương 2, Φ dùng để thiết lập điểm gốc tùy ý trên trục thời gian. Cho hàng tháng
dữ liệu có thời gian được lập chỉ mục là 1, 2,…, tần số quan trọng nhất là f = 1/12, vì như vậy
một sóng cosine sẽ tự lặp lại sau mỗi 12 tháng. Chúng tôi nói rằng khoảng thời gian là 12.
Phương trình (3.3.4) không thuận tiện cho việc ước lượng vì các tham số β và Φ do
không nhập biểu thức một cách tuyến tính. May mắn thay, một nhận dạng lượng giác có sẵn
reparameterizes (3.3.4) thuận tiện hơn, cụ thể là
= (3.3.5)
βcos ()β12πft
cos +()Φ 2πft β2 + sin () 2πft
ở đâu
=
2
β β12 + β2 , Φ = atan ( β2 - β1 ) ⁄ (3.3.6)
và ngược lại,
Để ước tính các tham số β1 và β2 bằng kỹ thuật hồi quy, chúng ta chỉ cần sử dụng
cos (2πft) và sin (2πft) làm biến hồi quy hoặc biến dự báo.
Mô hình đơn giản nhất như vậy cho xu hướng sẽ được thể hiện dưới dạng
= + (3.3.8)
μt β0 β1 cos () 2πft β2 + sin
2πft
()
Ở đây, số hạng hằng số, β0, có thể được hiểu một cách có ý nghĩa là một cosin với tần số
số không.
Trong bất kỳ ví dụ thực tế nào, chúng ta phải cẩn thận cách chúng ta đo lường thời gian, như sự lựa chọn của chúng ta
của phép đo thời gian sẽ ảnh hưởng đến giá trị của các tần số quan tâm. Ví dụ, nếu
chúng tôi có dữ liệu hàng tháng nhưng sử dụng 1, 2, 3, ... làm thang thời gian của chúng tôi, thì 1/12 sẽ là
tần suất thú vị, với khoảng thời gian tương ứng là 12 tháng. Tuy nhiên, nếu chúng ta xác định
thời gian chắc chắn theo năm và năm phân số, giả sử 1980 cho tháng Giêng, 1980,08333 cho tháng Hai của
1980, v.v., thì tần số 1 tương ứng với ity định kỳ hàng năm hoặc 12 tháng.
Hình 3.5 là một ví dụ về việc điều chỉnh một đường cong côsin ở tần số cơ bản để
chuỗi nhiệt độ trung bình hàng tháng.
Machine Translated by Google
Trong kết quả đầu ra này, thời gian được đo bằng năm, với năm 1964 là giá trị bắt đầu
và khoảng thời gian tự do là 1 mỗi năm. Biểu đồ của các giá trị chuỗi thời gian cùng với
đường cong côsin vừa vặn được thể hiện trong Hình 3.6. Xu hướng phù hợp với dữ liệu khá tốt,
ngoại trừ hầu hết các giá trị của tháng 1, nơi các quan sát thấp hơn so với mô hình trước
khi ra lệnh.
• • ••
• •
•
• •
••
• • •
•• •
• • •
•• • • •
• • • • • • •
•• •• • • •
•• •
••
• • •• •
• • • • •• ••
• •
• • • ••
Nhiệt
độ
•
••• ••••• ••• •• ••
• •
• •• • • • •• •
• •
• • • • • • •
• • • • • • •
• •
• • •• • • •
70
60
50
40
30
20
10
••
• • • • •
•• • • • •• ••
•
• • • •
• •
•
• •
•
•
Năm 1964 Năm 1966 Năm 1968 1970 Năm 1972 1974 Năm 1976
Thời gian
> win.graph (width = 4.875, height = 2.5, pointsize = 8)> plot (ts (fit
(model4), freq = 12, start = c (1964,1)),
ylab = 'Nhiệt độ', type = 'l',
> ylim = range (c (fit (model4), tempdub))); điểm (tempdub)> # ylim đảm bảo rằng phạm
vi trục y phù hợp với dữ liệu thô và các giá trị phù hợp
Các hàm cosin bổ sung ở các tần số khác sẽ thường xuyên được sử dụng để lập mô hình
các xu hướng theo chu kỳ. Đối với chuỗi hàng tháng, tần số sóng hài cao hơn, chẳng hạn
như 2/12 và 3/12, đặc biệt thích hợp và đôi khi sẽ cải thiện sự phù hợp với chi phí bổ sung
Machine Translated by Google
36 Xu hướng
nhập thêm thông số vào mô hình. Trên thực tế, có thể chỉ ra rằng bất kỳ xu hướng định kỳ nào với
chu kỳ 12 có thể được biểu thị chính xác bằng tổng của sáu cặp hàm cosin-sin.
Những ý tưởng này được thảo luận chi tiết trong phân tích Fourier hoặc phân tích quang phổ. Chúng tôi theo đuổi
3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy
Chúng tôi giả định rằng chuỗi được biểu diễn dưới dạng Yt = μt + Xt , trong đó μt là xu hướng xác định
thuộc loại được xem xét ở trên và {Xt } là một quá trình dừng có giá trị trung bình bằng 0
với các hàm tự tương quan và tự tương quan γk và ρk, tương ứng. Các ước tính hồi quy thông
thường kết hợp các tham số trong một mô hình tuyến tính theo tiêu chí bình phương nhỏ nhất bất kể
về việc liệu chúng ta có đang phù hợp với xu hướng thời gian tuyến tính, phương tiện theo mùa, đường cong cosin hay bất cứ thứ gì.
Trước tiên, chúng tôi xem xét trường hợp dễ dàng nhất — phương tiện theo mùa. Như đã đề cập trước đó,
ước tính bình phương nhỏ nhất của các phương tiện theo mùa chỉ là giá trị trung bình theo mùa; do đó, nếu chúng ta có
N (đầy đủ) năm dữ liệu hàng tháng, chúng tôi có thể viết ước tính cho giá trị trung bình của ngày thứ j
mùa như
^ 1
N 1–
βj =
---
Yj + 12i
N tôi 0 =
^
Từ β là một lượt thích trungYbình nhưng chỉ
^ sử dụng mỗi lần quan sát thứ 12, Phương trình
(3.2.3) có thểj dễ
Vardàng
β sửa đổi để cung cấp. Chúng ta thay n bằng N (năm) và ρk bằng
j ()
ρ12k để có được
^ γ0
N 1–
k
Var jβ () = ---- +12 1
---–
cho j = 1, 2, ..., 12 (3.4.1)
N k 1 = N
ρ12k
^
Chúng tôi nhận thấy rằng nếu {Xt } là nhiễu trắng, thìVar jβ ()xuống γ0 / N, như mong đợi.
sẽ giảm ^ Lông Var β
thermore, nếu một số ρk khác không nhưng ρ12k = 0, thì chúng ta vẫn có bất kỳ .
j () γ0 = ⁄ N
Trong
trường hợp nào, chỉ có tự tương quan theo mùa, ρ12, ρ24, ρ36 , ..., nhập vào Công thức
(3.4.1). Vì N hiếm khi rất lớn (có lẽ ngoại trừ dữ liệu hàng quý), các giá trị gần
đúng như thể hiện trong Công thức (3.2.5) thường sẽ không hữu ích.
Bây giờ chúng ta chuyển sang các xu hướng cosine được biểu diễn trong Công thức (3.3.8).
^ 2
N ^ 2
N
- cos 2πmt - tội 2πmt
β1 = Yt
, β2 = Yt
(3.4.2)
Nt 1 = N
------------ Nt 1 =
N
------------
(Đây thực sự là các mối tương quan giữa chuỗi thời gian {Yt } và cosin và
sóng sin với tần số m / n.)
Bởi vì đây là các hàm tuyến tính của {Yt }, chúng tôi có thể đánh giá phương sai của chúng bằng cách sử dụng
3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy 37
^ N s 1–
2πmt
2γ0 4
Var β
1 ()
= -------- 1 - + cos cos 2πms Ρ
(3.4.3)
ρs t -
N N N
------------ N
-------------
s 2 = t 1 =
N
nơi chúng tôi đã sử dụng thực tế rằng [cos (]) =2πmt
n ⁄ 2n⁄ 2 . Tuy nhiên, đôi
t 1 =
Nói chung, tổng trong Công thức (3.4.3) không giảm thêm. Một biểu thức tương tự giữ
^
2 () nếu chúng ta thay thế các cosin bằng các sin.
cho Var β
Nếu {Xt } là nhiễu trắng, chúng ta chỉ nhận được 2γ0 / n. Nếu ρ1 0, ρk = 0 với k > 1 và m / n = 1/12,
sau đó phương sai giảm xuống
^ 2γ0
n 1–
πt
= 4ρ1 πt 1+
Var β
1 () -------- 1 -------- + coscos (3.4.4)
N N ---- 6 --------------
6
t 1 =
Để minh họa ảnh hưởng của các số hạng cosin, chúng tôi đã tính toán một số giá trị đại diện
ues:
^
N Var (β 1)
2γ0
25 +
(1 1.71ρ1 )
N
--------
2γ0
50 +
(1 1,75ρ1 )
N
--------
2γ0
500 +
() 1--------
1.73ρ1
N
2γ0 π 2γ0
= +
∞
N
--------
1+2ρ1
cos
- 6 N
(1 1.732ρ1
-------- ) (3.4.5)
Nếu ρ1 = 0,4, thì hệ số nhân mẫu lớn trong Công thức (3.4.5) là 1 + 1.732 ( 0.4) =
0,307 và phương sai giảm khoảng 70% khi so sánh với tiếng ồn trắng
trường hợp.
Trong một số trường hợp, các phương tiện theo mùa và xu hướng cosin có thể được coi là
các mô hình cạnh tranh cho một xu hướng theo chu kỳ. Nếu mô hình cosine đơn giản là một mô hình đầy đủ,
chúng ta mất bao nhiêu nếu chúng ta sử dụng mô hình phương tiện theo mùa ít phức tạp hơn? Đến
tiếp cận vấn đề này, trước tiên chúng ta phải xem xét cách so sánh các mô hình. Bản
thân các tham số không thể so sánh trực tiếp, nhưng chúng ta có thể so sánh các ước tính của
xu hướng tại các thời điểm có thể so sánh được.
Hãy xem xét hai ước tính cho xu hướng trong tháng Giêng; nghĩa là, μ1. Với theo mùa
có nghĩa là, ước tính này chỉ là giá trị trung bình của tháng 1, có phương sai được đưa ra bởi Phương trình
38 Xu hướng
^ ^ ^
= +β 0 2π + tội 2π
μ ^ β 1 cos β lỗi 2
1 ------12 ------12
Để tính toán
^ phương
^ sai ^của ước tính này, chúng ta cần một dữ kiện nữa: Với mô hình này,
ước tính
0 , β 1 , và không
β 2 tương quan. † Điều này xuất phát từ quan hệ trực giao β
các hạt của cosin và sin liên quan. Xem Bloomfield (1976) hoặc Fuller (1996) cho
chi tiết hơn. Đối với mô hình cosine, sau đó, chúng ta có
^ ^ 2 ^ 2
= + cos 2π + Var β2 () tội 2π
Var μ()^ 1Var β 0 () Var β 1 () (3.4.6)
------12 ------12
Đối với so sánh đầu tiên của chúng tôi, giả sử rằng thành phần ngẫu nhiên là nhiễu trắng. sau đó
phương sai của ước tính của chúng tôi trong mô hình trung bình theo mùa chỉ là γ0 / N. Đối với cosine
, chúng tôi sử dụng Phương trình (3.4.6) và Phương trình (3.4.4) và tương đương sin của nó, để thu được
γ0 π 2 π 2
= ----
cos 2 +
Var μ()^ 1 1 +2 tội lỗi
N - 6 - 6
γ0
= ----
3
N
2 )(kể
cosθ
từ + ( ) sinθ 2 1 = . Do đó, tỷ lệ của độ lệch chuẩn trong cosin
mô hình đó trong mô hình phương tiện theo mùa là
3γ0 ⁄ n 3N
--------------- ------ =
N
γ0 ⁄ N
Đặc biệt, đối với chuỗi nhiệt độ tháng, ta có n = 144 và N = 12; do đó,
tỷ lệ là
3 12 ()
-------------
0,5 =
144
Do đó, trong mô hình cosine, chúng tôi ước tính hiệu ứng tháng Giêng với độ lệch chuẩn
chỉ lớn bằng một nửa so với nếu chúng tôi ước tính với mô hình phương tiện theo mùa — một mức lợi
nhuận nhỏ đáng kể. (Tất nhiên, điều này giả định rằng xu hướng cosine cộng với mô hình nhiễu trắng là
đúng mô hình.)
Giả sử bây giờ thành phần ngẫu nhiên sao cho ρ1 0 nhưng ρk = 0 với k > 1.
Với mô hình phương tiện theo mùa, phương sai của hiệu ứng ước tính trong tháng 1 sẽ là
không thay đổi (xem Công thức (3.4.1) trên trang 36). Đối với mô hình xu hướng cosine, nếu chúng ta có
cỡ mẫu ^lớn hợp lý, chúng tôi có thể sử dụng Công thức (3.4.5),
^ một biểu thức giống hệt nhau cho
( Var β) 2, và Công thức (3.2.3) trên trang 28 cho Var β() để có được
0
† Điều này giả định rằng 1/12 là “tần số Fourier”; nghĩa là, nó có dạng m / n. Nếu không thì,
những ước tính này chỉ gần như không tương quan.
Machine Translated by Google
3.4 Độ tin cậy và hiệu quả của các ước tính hồi quy 39
γ0 2π
= + + + cos
Var μ()^ 1 ---- 1 2ρ1 21 2ρ1 ------
N 12
γ0 π
= ++ cos -
---- 3 2ρ1 1 2
N 6
Nếu ρ1 = 0,4, thì chúng ta có 0,814γ0 / n, và tỷ lệ của độ lệch chuẩn trong cosin
trường hợp độ lệch chuẩn trong trường hợp phương tiện theo mùa là
0,814γ0 () ⁄ n
------------------------------
0,814N
= -----------------
γ0 ⁄ N N
0,814 12 () 0,26 =
------------------------
144
^ thời gian tuyến tính. Đối với những xu hướng này, một công thức thay thế cho Equa
Bây giờ chúng ta chuyển sang xu hướng
β 1
tion (3.3.2) trên trang 30 để thuận tiện hơn. Nó có thể được chỉ ra rằng các hình vuông nhỏ nhất
ước tính độ dốc có thể được viết
N
(t ) -
t_
Yt
^ t 1 =
β1 = ------------------------------
N (3.4.7)
2
t -
() t_
t 1 =
Vì ước tính là sự kết hợp tuyến tính của các giá trị Y, một số tiến bộ có thể đạt được trong
đánh giá phương sai của nó. Chúng ta có
^ N s 1–
12γ0 24
Var β1 () = ----------------------
t t_ (3.4.8)
----------------------
1
t_ (()) ρ- -s st -
+ n n2 () 1– n n2 () 1– s 2 = t 1 =
N
2
nơi chúng tôi đã sử - t 1(t=t_ ) = n (n2 - 1) / 12. Một lần nữa tổng kép không có trong gen
dụng giảm eral.
Để minh họa ảnh hưởng của Công thức (3.4.8), hãy xem xét lại trường hợp ρ1 0 nhưng
ρk = 0 với k > 1. Sau đó, sau một số thao tác đại số, lại liên quan đến tổng của
các số nguyên liên tiếp và bình phương của chúng, Phương trình (3.4.8) có thể được rút gọn thành
^
12γ0
Var β1 () = + 3
---------------------- 1 2ρ1 1
--– n n2 () 1–
N
^
12γ0 1 2ρ1
+ ()
Var β1 () = ----------------------------------
(3.4.9)
n n2 () 1–
Machine Translated by Google
40 Xu hướng
^
Nếu ρ1 = 0,4, thì 1 + 2ρ1 = 0,2, và khi đó phương sai của chỉ bằng 20%
β 1 nếu {Xt } là nhiễu trắng.
Tất nhiên, nếu ρ1 > 0, thì phương sai sẽ lớn hơn so với trường hợp nhiễu trắng.
Bây giờ chúng ta chuyển sang so sánh các ước lượng bình phương nhỏ nhất với cái gọi là ước
lượng không chệch tuyến tính tốt nhất (BLUE) hoặc ước lượng bình phương nhỏ nhất tổng quát (GLS).
Nếu thành phần ngẫu nhiên {Xt } không phải là nhiễu trắng, thì có thể thực hiện ước tính các tham
số chưa biết trong hàm xu hướng; chúng là các hàm tuyến tính của dữ liệu, không thiên vị và có
phương sai nhỏ nhất trong số tất cả các ước tính như vậy — cái gọi là ước tính BLUE hoặc GLS. Các
ước lượng này và phương sai của chúng có thể được biểu thị khá rõ ràng bằng cách sử dụng các ma
trận nhất định và các phép nghịch đảo của chúng. (Chi tiết có thể được tìm thấy trong Draper và
Smith (1981).) Tuy nhiên, việc xây dựng các ước lượng này đòi hỏi kiến thức đầy đủ về hàm hiệp
phương sai của thành phần ngẫu nhiên, một hàm chưa được biết đến trong hầu hết các ứng dụng thực
tế. Có thể ước lượng lặp đi lặp lại hàm hiệp phương sai cho {Xt } dựa trên ước tính sơ bộ về xu
hướng. Sau đó, xu hướng được ước tính lại bằng cách sử dụng hàm hiệp phương sai ước tính cho {Xt }
và do đó được lặp lại thành MÀU XANH gần đúng cho xu hướng. Tuy nhiên, phương pháp này sẽ không
được theo đuổi ở đây.
May mắn thay, có một số kết quả dựa trên kích thước mẫu lớn hỗ trợ việc sử dụng các ước tính
bình phương nhỏ nhất đơn giản hơn cho các loại xu hướng mà chúng tôi đã xem xét. Cụ thể, chúng tôi
có kết quả sau (xem Fuller (1996), trang 476–480, để biết thêm chi tiết): Chúng tôi giả định rằng
xu hướng là một đa thức theo thời gian, một đa thức lượng giác, trung bình theo mùa hoặc một kết
hợp tuyến tính trong số này. Sau đó, đối với thành phần ngẫu nhiên tĩnh tổng quát {Xt }, các ước
tính bình phương nhỏ nhất cho xu hướng có cùng phương sai với các ước tính không chệch tuyến tính
tốt nhất cho các cỡ mẫu lớn.
Mặc dù các ước tính bình phương nhỏ nhất đơn giản có thể hiệu quả về mặt tiệm cận, nó không
tuân theo rằng độ lệch chuẩn ước tính của các hệ số được in ra bởi tất cả các quy trình hồi quy là
đúng. Chúng tôi sẽ trình bày rõ hơn về điểm này trong phần tiếp theo. Chúng tôi cũng cảnh báo người
đọc rằng kết quả ở trên bị hạn chế đối với một số loại xu hướng nhất định và nói chung không thể
mở rộng thành hồi quy trên các biến dự đoán tùy ý, chẳng hạn như các chuỗi thời gian khác. Ví dụ,
Fuller (1996, trang 518–522) chỉ ra rằng nếu Yt = βZt + Xt , trong đó {Xt } có cấu trúc ngẫu nhiên
đơn giản nhưng {Zt } cũng là một chuỗi tĩnh, thì ước lượng bình phương nhỏ nhất của β có thể là
rất kém hiệu quả và sai lệch ngay cả đối với các mẫu lớn.
Chúng tôi đã lưu ý rằng các quy trình hồi quy tiêu chuẩn tính toán các ước tính bình phương nhỏ
nhất của các hệ số hồi quy chưa biết — betas. Do đó, các ước tính có thể được lập lại theo các
giả định tối thiểu về thành phần ngẫu nhiên {Xt }. Tuy nhiên, một số thuộc tính của đầu ra hồi quy
phụ thuộc nhiều vào giả định hồi quy thông thường rằng {Xt } là nhiễu trắng và một số phụ thuộc
vào giả định khác rằng {Xt } được phân phối gần đúng. Chúng tôi bắt đầu với các mục phụ thuộc ít
Xem xét đầu ra hồi quy được hiển thị trong Hình 3.7. Chúng tôi sẽ viết cho xu hướng
μ ^
t
giao
phối esti bất kể dạng tham số giả định cho μt . Ví dụ, đối với xu hướng
thời gian tai lin, chúng ta có μt = β0 + β1t. Đối với mỗi t, thành phần ngẫu nhiên không được quan sát
Machine Translated by Google
thì chúng ta có thể ước tính độ lệch chuẩn của Xt , cụ thể là theo stan dư γ0
sai lệch dard
1 N
S =
----------- 2
( Yt )μ -^ (3.5.1)
t
np -
t 1 =
hệ số xác định hoặc nhiều R bình phương. Một cách giải thích của R2 là
nó là bình phương của hệ số tương quan mẫu giữa chuỗi quan sát và
xu hướng ước tính. Nó cũng là một phần của sự biến đổi trong chuỗi được giải thích bởi
xu hướng ước tính. Hình 3.7 là đầu ra hồi quy hoàn chỉnh hơn khi phù hợp với
đường thẳng đến dữ liệu đi bộ ngẫu nhiên. Điều này mở rộng những gì chúng ta đã thấy trong Phụ lục 3.1 trên trang
31.
Hình 3.7 Kết quả hồi quy cho sự phù hợp với xu hướng tuyến tính của bước đi ngẫu nhiên
Theo Hình 3.7, khoảng 81% sự thay đổi trong chuỗi đi bộ ngẫu nhiên là
được giải thích bởi xu hướng thời gian tuyến tính. Giá trị bình phương R đã điều chỉnh là một điều chỉnh nhỏ
đến R2 mang lại ước tính gần đúng không chệch dựa trên số lượng tham số
ước tính trong xu hướng. Nó rất hữu ích để so sánh các mô hình với các số lượng khác nhau
thông số. Các công thức tính R2 khác nhau có thể được tìm thấy trong bất kỳ cuốn sách nào về
regres sion, chẳng hạn như Draper và Smith (1981). Độ lệch chuẩn của các hệ số
có nhãn Std. Lỗi trên đầu ra cần được giải thích cẩn thận. Chúng thích hợp
chỉ khi thành phần ngẫu nhiên là nhiễu trắng - giả định hồi quy thông thường.
Machine Translated by Google
42 Xu hướng
Ví dụ, trong Hình 3.7, giá trị 1.137 nhận được từ căn bậc hai của giá trị được cho bởi Công thức
(3.4.8) khi ρk = 0 với k > 0 và với γ0 được ước lượng bởi s 2, nghĩa là trong phạm vi làm tròn,
2 12 1,137 ()
0,008475 = ----------------------------
60 602 () 1–
Điểm quan trọng là những độ lệch chuẩn này giả định một thành phần ngẫu nhiên nhiễu trắng hiếm
khi đúng với chuỗi thời gian.
Các giá trị t hoặc tỷ lệ t được trình bày trong Phụ lục 3.7 chỉ là hệ số hệ số hồi quy ước
tính, mỗi giá trị chia cho sai số tiêu chuẩn tương ứng của chúng. Nếu thành phần ngẫu nhiên là
nhiễu trắng được phân phối bình thường, thì các tỷ lệ này cung cấp thống kê thử nghiệm thích
hợp để kiểm tra ý nghĩa của các hệ số hồi quy. Trong mỗi trường hợp, giả thuyết rỗng là hệ số
hồi quy chưa biết tương ứng bằng không. Các mức ý nghĩa và giá trị p được xác định từ phân phối
t với n - p bậc tự do.
Dự đoán thực sự là một thuật ngữ tốt hơn. Chúng tôi bảo lưu ước tính kỳ hạn để phỏng đoán một
tham số không xác định
^ và dự đoán kỳ hạn cho ước tính một biến ngẫu nhiên không được quan sát.
Ta gọi phần dư tương
vàứnglý,với
các thìlần
giả quan
định
phần dư sát
khác thứvề
sẽnhau
hoạt t. Nếugần
động
thànhmô hình
phần
giống xu
ngẫunhưhướng
thànhX
nhiên là đúng
cóphần
thể một
ngẫu
được cách
nhiên
đánh hợp
giá
thực
bằng
sự
t
cách xem xét phần dư. Nếu thành phần ngẫu nhiên là nhiễu trắng, thì phần dư sẽ hoạt động gần
giống như các biến ngẫu nhiên độc lập (bình thường) với giá trị trung bình bằng 0 và độ lệch
chuẩn s. Vì một bình phương nhỏ nhất phù hợp với bất kỳ xu hướng nào có chứa số hạng không đổi
sẽ tự động tạo ra phần dư với giá trị trung bình bằng 0, chúng tôi có thể xem xét việc chuẩn
hóa phần dư dưới dạng. Tuy nhiên, hầu hết các phần mềm thống kê sẽ tạo ra các phần dư được tiêu
chuẩn hóa bằng^cách sử dụng một sai số tiêu chuẩn phức tạp hơn trong mẫu số có tính đến mô hình
hồi quy cụ thểX đang phù hợp.
t
Với các phần dư hoặc phần dư tiêu chuẩn trong tay, bước tiếp theo là kiểm tra các ô phần dư
var ious. Đầu tiên chúng ta xem xét âm mưu của những phần dư theo thời gian. Nếu dữ liệu có thể
là theo mùa, chúng ta nên sử dụng các ký hiệu biểu đồ như chúng ta đã làm trong Phụ lục 1.9 trên
trang 7, để có thể dễ dàng xác định các phần còn lại liên quan đến cùng một mùa.
Chúng tôi sẽ sử dụng chuỗi nhiệt độ trung bình hàng tháng mà chúng tôi đã trang bị với các
phương tiện theo mùa làm ví dụ đầu tiên của chúng tôi để minh họa một số ý tưởng về phân tích
dư lượng. Hình 1.7 trên trang 6 trình bày sơ đồ chuỗi thời gian của chuỗi đó. Hình 3.8 cho thấy
một biểu đồ chuỗi thời gian cho các phần dư được tiêu chuẩn hóa của dữ liệu nhiệt độ hàng tháng
được trang bị theo mùa. Nếu thành phần ngẫu nhiên là nhiễu trắng và xu hướng được mô hình hóa
đầy đủ, chúng tôi mong đợi một âm mưu như vậy sẽ đề xuất một phân tán hình chữ nhật không có xu
hướng rõ ràng nào. Không có sự khởi hành đáng chú ý nào từ sự ngẫu nhiên rõ ràng trong màn hình này.
Machine Translated by Google
Biểu đồ 3.9 lặp lại âm mưu của chuỗi thời gian nhưng bây giờ với các ký hiệu biểu đồ theo mùa. Một
lần nữa, không có mô hình rõ ràng nào liên quan đến các tháng khác nhau trong năm.
Hình 3.8 Phần dư so với thời gian đối với nhiệt độ Phương tiện theo mùa
3
•
2 • • •
•• • •
•• ••
1
• • •• •
•• • • • •
• •
• • •• • • • • •
••• • •
• •
0
• • • • •
• • • • • ••
• •
•
• •
•
• • •
•• • ••
• • •• • • • • •
• • •
•
•
•
• •
•
• •
• ••
• • •
• •• •
• • ••
•
• • •
•
• • • •
• • • •
• • •
• •
• •
chuẩn
tiêu
được
Phần
hóa
dư • • •
••
•• • • • ••
• • •
• •
• •
•
1
2
• • •
0 20 40 60 80 100 120 140
Thời gian
Hình 3.9 Phần còn lại so với thời gian với các ký hiệu vẽ đồ thị theo mùa
3
M
J M
2 D
JO J
1 FM M J F O
F M JM NSD M
N M
Một
M DJ J D Một
Một
J J D
J SNJM
Một Một Một
Một
S J O
Một
MộtJ F D S N
0
J ON J N J
NHƯ Ô
J
Một
Một
MJ J
S F J
JJ
S SO ND F TRÊN
J J
Một
J M F F
FMột F M
BẰNG CON TRAI
Một
M JJ
JO
Một Một
O
Một
M DJM N M Một M
M
Một
D Một N
OD J
Một
JF D MJ S S
M N
chuẩn
tiêu
được
Phần
hóa
dư
M J O
J Một
1
2
J F D
M J M
Thời gian
> plot (y = rstudent (model3), x = as.vector (time (tempdub)), xlab = 'Time',> ylab = 'Standardized
Residuals', type = 'l')> points (y = rstudent (model3 ), x = as.vector (thời gian (tempdub)),
44 Xu hướng
Tiếp theo, chúng tôi xem xét các phần dư được tiêu chuẩn hóa so với ước tính xu hướng tương ứng,
hoặc giá trị phù hợp, như trong Phụ lục 3.10. Một lần nữa, chúng tôi đang tìm kiếm các mẫu. Nhỏ
phần dư liên quan đến giá trị xu hướng phù hợp nhỏ và phần dư lớn với giá trị phù hợp lớn
giá trị xu hướng? Có ít sự thay đổi hơn đối với phần dư được liên kết với một số kích thước nhất định được trang bị
giá trị xu hướng hoặc nhiều biến thể hơn với các giá trị xu hướng phù hợp khác? Có phần nào nữa
sự thay đổi đối với phần còn lại của tháng 3 và ít hơn đối với tháng 11, nhưng Hình 3.10 chắc chắn có
không chỉ ra bất kỳ mô hình ấn tượng nào có thể khiến chúng tôi nghi ngờ các phương tiện theo mùa
người mẫu.
Phụ lục 3.10 Phần dư được tiêu chuẩn hóa so với các giá trị được trang bị cho Mô hình
10
M
J M
D
5 J O J
J F M O M
J D N M
M S
F N Một
M
J D M Một
Một
J
D M Một
O S
Một
Một
J
0 J F D N
N
Một
S J
J
Một
J
Một
N M
Một
F D N
Một
S J
Một
J
J
Một O S
F
F M N O S J J
J
Một
F M
Một
Một
O
Một
Một
J
J N
Một
O M
M Một
J F D
D M N
Một
O M S
chuẩn
tiêu
được
Phần
hóa
dư
5 D N M S J Một J
J Một
O M J
J F D
J M
M
20 30 40 50 60 70
Tổng bất thường có thể được đánh giá bằng cách vẽ biểu đồ biểu đồ của các phần dư hoặc phần dư
theo tiêu chuẩn stan. Hình 3.11 hiển thị biểu đồ tần số của tiêu chuẩn hóa
phần dư từ mô hình trung bình theo mùa cho chuỗi nhiệt độ. Cốt truyện là một số đối xứng và kết
Biểu đồ 3.11 Biểu đồ lượng dư được tiêu chuẩn hóa từ Mô hình phương tiện theo
mùa
thường
xuyên
Tính
35
30
25
20
15
10
5
0
3 2 1 0 1 2 3
Độ chuẩn có thể được kiểm tra cẩn thận hơn bằng cách vẽ biểu đồ được gọi là điểm bình
thường hoặc biểu đồ lượng tử-lượng tử (QQ). Biểu đồ như vậy hiển thị các lượng tử của dữ
liệu so với các lượng tử quặng của một phân phối chuẩn. Với dữ liệu được phân phối bình
thường, âm mưu QQ trông giống như một đường thẳng. Hình 3.12 cho thấy biểu đồ điểm bình
thường QQ cho phần dư được tiêu chuẩn hóa từ mô hình trung bình theo mùa cho chuỗi nhiệt độ.
Mô hình đường thẳng ở đây hỗ trợ giả định về thành phần tic ngẫu nhiên được phân phối
chuẩn trong mô hình này.
Hình 3.12 Ô QQ: Phần dư được tiêu chuẩn hóa của mô hình phương tiện theo mùa
•
• •
•
Lượng
mẫu
tử
• • • • •
• • • • • • •
• • • • • • • • • •
• • •• •• •• •• •• •• •• •• •• •• •• ••
• • •• •• •• •• •• •• •• •• •• •• •• •• •• •• ••
• • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • •
32
2
1
0 1
• • • • • • • • • • • • • • • • • • • • •
• • • • • • • • • • • • • • • • • • • • • • • (
•
•••
•••••
••
•••••• ••••
•••••
••
•L
•
••
•
••
•
••
•••
•••
••
••
• • •
2 1 0 1 2
Lượng tử lý thuyết
46 Xu hướng
Một phép thử tuyệt vời về tính chuẩn được gọi là phép thử Shapiro-Wilk .
Mối tương quan này càng thấp, chúng ta càng có nhiều bằng chứng chống lại tính chuẩn mực. Áp dụng điều đó
kiểm tra các phần dư này cho một thống kê kiểm định là W = 0,9929 với giá trị p là 0,6954. chúng tôi
không thể bác bỏ giả thuyết rỗng rằng thành phần ngẫu nhiên của mô hình này bình thường
được phân phối.
Tính độc lập trong thành phần ngẫu nhiên có thể được kiểm tra theo một số cách. Các cuộc chạy
kiểm tra kiểm tra các phần còn lại theo trình tự để tìm kiếm các mẫu — các mẫu sẽ cung cấp
bằng chứng chống lại độc lập. Số lần chạy trên hoặc dưới mức trung bình của chúng đều được tính. Nhỏ
số lần chạy sẽ chỉ ra rằng phần dư lân cận phụ thuộc cùng chiều và
có xu hướng "gắn bó với nhau" theo thời gian. Mặt khác, quá nhiều lần chạy sẽ chỉ ra rằng
các phần dư dao động qua lại trên đường trung bình của chúng. Sau đó, phần dư lân cận
phụ thuộc tiêu cực. Vì vậy, quá ít hoặc quá nhiều lần chạy đều dẫn đến việc chúng ta từ chối
sự thiếu hiểu biết. Thực hiện kiểm tra chạy ‡ trên các phần dư này tạo ra các giá trị sau:
số lần chạy quan sát = 65, số lần chạy dự kiến = 72,875, dẫn đến giá trị p là 0,216 và chúng tôi
không thể bác bỏ tính độc lập của thành phần ngẫu nhiên trong mô hình phương tiện theo mùa này.
Một công cụ chẩn đoán rất quan trọng khác để kiểm tra sự phụ thuộc là chức năng tương quan
tự động mẫu. Xem xét bất kỳ chuỗi dữ liệu nào Y1, Y2,…, Yn — cho dù phần dư,
phần dư được chuẩn hóa, dữ liệu gốc hoặc một số biến đổi dữ liệu. Giả sử cố ý về tính cố
định, chúng tôi muốn ước tính hàm tự tương quan ρk cho nhiều loại
trễ k = 1, 2,…. Cách rõ ràng để làm điều này là tính toán mối tương quan mẫu
giữa các cặp cách nhau k đơn vị về thời gian. Nghĩa là, trong số (Y1, Y1 + k), (Y2, Y2 + k),
(Y3, Y3 + k), ..., và (Yn - k, Yn). Tuy nhiên, chúng tôi sửa đổi điều này một chút, có tính đến
rằng chúng tôi đang giả định tính ổn định, điều này ngụ ý một giá trị trung bình và phương sai chung cho
loạt. Với ý nghĩ này, chúng tôi xác định hàm tự tương quan mẫu, rk, tại độ trễ k là
N _ _
( Yt )Y - Yt( k - ) -Y
tk 1 + =
rk
= ------------------------------------------------- --------------
N _ cho k = 1, 2, ... (3.6.2)
2
()Yt- Y
t 1 =
_
Lưu ý rằng chúng tôi đã sử dụng "đại nghĩa", Yở tất cả các nơi và cũng đã chia cho
"Tổng bình phương" chứ không phải là tích của hai độ lệch chuẩn riêng biệt
được sử dụng trong hệ số tương quan thông thường. Chúng tôi cũng lưu ý rằng mẫu số là một tổng
của n số hạng bình phương trong khi tử số chỉ chứa n - k tích chéo. Đối với nhiều loại
lý do, điều này đã trở thành định nghĩa tiêu chuẩn cho chức năng tự tương quan mẫu. Biểu đồ
của rk so với độ trễ k thường được gọi là một biểu đồ tương quan.
† Royston, P. (1982) “Mở rộng Thử nghiệm W của Shapiro và Wilk về mức độ bình thường đến quy mô lớn
Mẫu." Thống kê Áp dụng, 31, 115–124.
‡ Mã R: chạy (rstudent (model3))
Machine Translated by Google
Trong bối cảnh hiện tại của chúng tôi, chúng tôi quan tâm đến việc phát hiện ra sự phụ thuộc có thể có trong
thành phần ngẫu nhiên; do đó, hàm tự tương quan mẫu cho phần dư ized tiêu chuẩn được quan tâm.
Hình 3.13 hiển thị tự tương quan mẫu cho
lượng dư được chuẩn hóa từ mô hình trung bình theo mùa của chuỗi nhiệt độ. Tất cả các giá trị
đều nằm trong các đường đứt nét ngang, được đặt ở số không cộng và trừ hai
sai số chuẩn gần đúng của các phép tự tương quan mẫu, cụ thể là 2 ⁄ ± n . Giá trị
của rk tất nhiên là ước tính của ρk. Do đó, họ có các bản phân phối lấy mẫu của riêng mình,
lỗi tiêu chuẩn và các thuộc tính khác. Hiện tại, chúng tôi sẽ sử dụng rk như một công cụ mô tả và
hoãn thảo luận về những chủ đề đó cho đến Chương 6 và 8. Theo Phụ lục 3.13, vì k
= 1, 2, ..., 21, không có giả thuyết nào trong số các giả thuyết ρk = 0 có thể bị bác bỏ với
mức ý nghĩa thông thường, và điều hợp lý là suy ra rằng thành phần ngẫu nhiên của chuỗi là màu trắng
tiếng ồn.
Phụ lục 3.13 Mẫu tự tương quan về phần dư của mô hình phương tiện theo mùa
0,15
0,05
ACF
0,05
0,15
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (rstudent (model3))
Như ví dụ thứ hai, hãy xem xét các phần dư được tiêu chuẩn hóa từ việc lắp một đường thẳng
đến chuỗi thời gian đi bộ ngẫu nhiên. Nhớ lại Phụ lục 3.2 trên trang 31, hiển thị dữ liệu và
dòng được trang bị. Biểu đồ chuỗi thời gian của các phần dư được tiêu chuẩn hóa được thể hiện trong Hình 3.14.
Machine Translated by Google
48 Xu hướng
Hình 3.14 Phần dư từ việc điều chỉnh đường thẳng của bước đi ngẫu nhiên
• • •
•• •
• • • • • •• •
•
• •• • • • ••
2
1
0
• • • •
••
•
•
•
•
• • ••
• • •
• •
• •
• • •
• •
• ••
• •
2
• •
•
• •
•
chuẩn
tiêu
được
Phần
hóa
dư
0 10 20 30 40 50 60
Thời gian
Trong cốt truyện này, các phần dư "dính vào nhau" quá nhiều cho tiếng ồn trắng - cốt truyện cũng
trơn tru. Hơn nữa, dường như có nhiều biến thể hơn trong một phần ba cuối của loạt phim hơn là
trong hai phần ba đầu tiên. Hình 3.15 cho thấy tác động tương tự với lượng dư lớn hơn kết hợp với
Hình 3.15 Phần dư so với giá trị được trang bị từ Điều chỉnh đường thẳng
2
• •
•• • • • •
•
1
• •
• • •
0 • • ••• • •
••
• •
•• • • •
• •
• •
• •
• • • •
• • •
• •
• • • •
1
• •
• • •
chuẩn
tiêu
được
Phần
hóa
dư
• • •
•
2
•
•
0246
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> plot (y = rstudent (model1), x = fit (model1),
ylab = 'Phần dư chuẩn hóa', xlab = 'Giá trị Đường xu hướng được trang bị', type = 'p')
Machine Translated by Google
Hàm tự tương quan mẫu của các phần dư chuẩn hóa, được trình bày trong Phụ lục
3.16, xác nhận sự mượt mà của biểu đồ chuỗi thời gian mà chúng tôi đã quan sát được trong Hình 3.14.
Độ trễ 1 và độ trễ 2 tự tương quan vượt quá hai lỗi tiêu chuẩn trên 0 và độ trễ 5
và độ trễ 6 tự tương quan hơn hai lỗi tiêu chuẩn dưới 0. Đây không phải là những gì
Hình 3.16 Tự tương quan mẫu của phần dư từ mô hình đường thẳng
0,6
0,4
0,2
ACF
0,2
0,4
0,0
2 4 6 số 8 10 12 14 16
Lỗi
Cuối cùng, chúng tôi quay trở lại lượng mưa hàng năm ở Los Angeles được thể hiện trong Hình 1.1 trên
trang 2. Chúng tôi không tìm thấy bằng chứng nào về sự phụ thuộc trong loạt bài đó, nhưng chúng tôi hiện đang
tìm kiếm sự khác biệt chống lại sự bình thường. Hình 3.17 hiển thị biểu đồ lượng tử-lượng tử bình thường cho điều đó
loạt. Chúng tôi thấy độ cong đáng kể trong cốt truyện. Một dòng đi qua đầu tiên và
phần tư bình thường thứ ba giúp chỉ ra điểm xuất phát từ một đường thẳng trong biểu đồ.
Machine Translated by Google
50 Xu hướng
Hình 3.17 Lô đất định lượng-định lượng của loạt mưa hàng năm ở Los Angeles
•
40
30
••
• •
•••
• •
•••••••••
20 •• •• ••
ot
••••
•
Lượng
mẫu
tử
• •
•
••
••••••
•••
•
•
•• ••••
• •
•••••
10
••
••
••
ot•
•
•••••
•
2 1 0 1 2
Lượng tử lý thuyết
Chương này liên quan đến việc mô tả, mô hình hóa và ước tính các xu hướng xác định trong
chuỗi thời gian. “Xu hướng” xác định đơn giản nhất là một hàm trung bình không đổi.
Các phương pháp ước tính giá trị trung bình không đổi đã được đưa ra nhưng quan trọng hơn là
việc đánh giá độ chính xác của các ước tính trong các điều kiện khác nhau đã được xem xét. Các
phương pháp hồi quy sau đó đã được theo đuổi để ước tính các xu hướng tuyến tính hoặc bậc hai
theo thời gian. Tiếp theo là các meth để lập mô hình các xu hướng theo chu kỳ hoặc theo mùa, và
độ tin cậy và hiệu quả của tất cả các phương pháp hồi quy này đã được nghiên cứu. Phần cuối cùng
bắt đầu nghiên cứu của chúng tôi về phân tích lượng dư để điều tra chất lượng của mô hình được
trang bị. Phần này cũng giới thiệu về hàm tự tương quan mẫu quan trọng, mà chúng ta sẽ xem lại
trong phần còn lại của cuốn sách.
BÀI TẬP
3.1 Kiểm tra Công thức (3.3.2) trên trang 30, để biết các ước lượng bình phương nhỏ nhất của β0
và của β1 khi mô hình Yt = β0 + β1t + Xt được xem xét.
3.2 Giả sử Yt = μ + et - et 1. Tìm thấy . Var
Ghi Y_ () bất kỳ kết quả bất thường nào. Đặc biệt, hãy
nhận
so sánh câu trả lời của bạn với những gì sẽ thu được nếu Yt = μ + et . (Gợi ý: Bạn có thể
tránh Phương trình (3.2.3) ở trang 28 bằng cách thực hiện một số đơn giản hóa đại số trên
N -
().) et et 1–
t 1 =
Machine Translated by Google
Bài tập 51
{Yt } có trên .
3.4 Số giờ trong tệp dữ liệu chứa các giá trị hàng tháng của số giờ làm việc trung bình mỗi tuần trong lĩnh
vực sản xuất của Hoa Kỳ từ tháng 7 năm 1982 đến tháng 6 năm 1987. (a) Hiển thị và diễn giải biểu đồ
chuỗi thời gian cho những dữ liệu này. (b) Bây giờ xây dựng một biểu đồ chuỗi thời gian sử dụng các
ký hiệu biểu đồ riêng biệt cho các tháng khác nhau. Cách giải thích của bạn có thay đổi so với phần
(a) không?
3.5 Tiền lương trong tệp dữ liệu chứa các giá trị hàng tháng của mức lương trung bình theo giờ (tính bằng
đô lars) cho công nhân trong ngành sản phẩm dệt may của Hoa Kỳ từ tháng 7 năm 1981 đến tháng 6 năm
1987. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này. (b) Sử dụng bình
phương nhỏ nhất để phù hợp với xu hướng thời gian tuyến tính với chuỗi thời gian này. Diễn giải đầu
ra hồi quy. Lưu các phần còn lại đã được chuẩn hóa từ chỗ vừa vặn để tiếp tục khám bệnh qua đường
hậu môn.
(c) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ
phần (b).
(d) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng thời gian bậc hai với chuỗi thời gian tiền
lương. Inter trước đầu ra hồi quy. Lưu lượng dư đã tiêu chuẩn hóa từ phù hợp để phân tích nhiệt
lông thú.
(e) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ
phần (d).
3.6 Tệp dữ liệu bán bia chứa doanh số bán bia hàng tháng của Mỹ (tính bằng hàng triệu thùng)
trong khoảng thời gian từ tháng 1 năm 1975 đến tháng 12 năm 1990.
(a) Hiển thị và diễn giải biểu đồ của biểu đồ chuỗi thời gian cho những dữ liệu
này. (b) Bây giờ xây dựng một biểu đồ chuỗi thời gian sử dụng các ký hiệu biểu đồ riêng biệt cho
các tháng khác nhau. Cách giải thích của bạn có thay đổi so với phần (a) không? (c) Sử dụng
bình phương nhỏ nhất để phù hợp với xu hướng theo mùa với chuỗi thời gian này. Diễn giải đầu ra hồi
quy. Lưu các phần còn lại đã được chuẩn hóa từ chỗ vừa vặn để tiếp tục khám bệnh qua đường hậu
môn.
(d) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ phần (c). Đảm bảo sử
dụng các ký hiệu biểu đồ thích hợp để kiểm tra tính thời vụ trong phần dư được tiêu chuẩn hóa.
(e) Sử dụng bình phương nhỏ nhất để phù hợp với phương tiện theo mùa cộng với xu hướng thời
gian bậc hai với chuỗi thời gian bán bia. Diễn giải đầu ra hồi quy. Lưu alu dư tiêu chuẩn từ phù hợp
để phân tích thêm. (f) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa
từ phần (e). Một lần nữa sử dụng các ký hiệu biểu đồ thích hợp để kiểm tra xem có bất kỳ độ âm
3.7 Tệp dữ liệu winnebago chứa doanh số bán xe giải trí theo đơn vị hàng tháng của Winnebago, Inc., từ tháng
11 năm 1966 đến tháng 2 năm 1972. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ
liệu này. (b) Sử dụng bình phương nhỏ nhất để vừa một dòng với dữ liệu này. Diễn giải đầu ra hồi
quy. Vẽ đồ thị phần dư được tiêu chuẩn hóa từ sự phù hợp dưới dạng một chuỗi thời gian. Diễn giải
cốt truyện. (c) Bây giờ lấy logarit tự nhiên của số liệu bán hàng hàng tháng và hiển thị và
Machine Translated by Google
52 Xu hướng
diễn giải biểu đồ chuỗi thời gian của các giá trị đã biến đổi.
(d) Sử dụng các ô vuông nhỏ nhất để vừa một dòng với dữ liệu đã ghi. Hiển thị và diễn giải thời gian
đồ thị chuỗi của các phần dư được tiêu chuẩn hóa từ sự phù hợp này.
(e) Bây giờ, hãy sử dụng bình phương nhỏ nhất để phù hợp với xu hướng thời gian tuyến tính cộng với giá
trị theo mùa với chuỗi thời gian bán hàng đã ghi và lưu phần dư được chuẩn hóa để phân tích thêm.
Kiểm tra ý nghĩa thống kê của từng hệ số hồi quy trong mô hình.
(f) Hiển thị biểu đồ chuỗi thời gian của các phần dư chuẩn hóa thu được trong phần (e).
3.8 Tệp dữ liệu bán lẻ liệt kê tổng doanh số bán lẻ của Vương quốc Anh (Vương quốc Anh) (tính bằng tỷ bảng Anh)
từ tháng 1 năm 1986 đến tháng 3 năm 2007. Dữ liệu không được “điều chỉnh theo mùa” và năm 2000 = 100 là
năm gốc. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này. Hãy chắc chắn sử dụng
âm mưu
biểu tượng cho phép bạn tìm kiếm tính thời vụ.
(b) Sử dụng bình phương nhỏ nhất để phù hợp với giá trị trung bình theo mùa cộng với xu hướng thời gian
tuyến tính với chuỗi thời gian này. Giải thích đầu ra hồi quy và lưu các phần dư chuẩn hóa từ phần
(c) Xây dựng và diễn giải biểu đồ chuỗi thời gian của các phần dư chuẩn hóa từ phần (b). Đảm bảo sử
dụng các ký hiệu biểu đồ thích hợp để kiểm tra tính thời vụ.
3.9 Kê đơn trong tệp dữ liệu cung cấp chi phí kê đơn hàng tháng của Hoa Kỳ trong các tháng từ tháng 8 năm 1986
đến tháng 3 năm 1992. Những dữ liệu này là từ Chương trình Thuốc Pre scription của Tiểu bang New Jersey
và là chi phí cho mỗi yêu cầu kê đơn. (a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ
liệu này. Sử dụng các biểu tượng biểu đồ cho phép bạn tìm kiếm tính thời vụ. (b) Tính toán và vẽ biểu
đồ trình tự thay đổi tỷ lệ phần trăm hàng tháng trong chi phí kê đơn. Một lần nữa, hãy sử dụng các
biểu tượng âm mưu cho phép bạn tìm kiếm âm sắc của biển.
(c) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng cosin có tần số cơ bản 1/12 với chuỗi thay đổi
phần trăm. Diễn giải đầu ra hồi quy. Lưu phần dư ized tiêu chuẩn.
(d) Vẽ đồ thị chuỗi các phần dư chuẩn hóa để khảo sát tính đầy đủ của mô hình xu hướng cosin. Diễn giải
cốt truyện.
3.10 (Làm tiếp bài tập 3,4) Xem xét lại chuỗi thời gian giờ .
(a) Sử dụng bình phương nhỏ nhất để phù hợp với xu hướng bậc hai cho những dữ liệu này. Diễn giải đầu
ra hồi quy và lưu các phần dư chuẩn hóa để phân tích thêm. (b) Hiển thị một biểu đồ trình tự của
các phần dư được tiêu chuẩn hóa và giải thích. Sử dụng các ký hiệu biểu đồ hàng tháng để có thể dễ dàng
(c) Thực hiện phép thử Chạy đối với các phần dư được tiêu chuẩn hóa và giải thích kết quả. (d) Tính
toán và giải thích tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(e) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (các điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
Machine Translated by Google
Bài tập 53
3.11 (Tiếp theo bài tập 3.5) Trở lại chuỗi tiền lương .
(a) Xem xét phần dư từ một hình vuông nhỏ nhất phù hợp với xu hướng thời gian bậc hai. (b) Thực
hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính toán và giải
thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
3.12 (Tiếp theo bài tập 3.6) Hãy xem xét chuỗi thời gian trong tệp dữ liệu bán hàng. (a) Lấy phần dư từ các bình
phương nhỏ nhất phù hợp với phương tiện theo mùa cộng qua
mô hình xu hướng thời gian dratic.
(b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính
toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
3.13 (Tiếp theo bài tập 3.7) Quay lại chuỗi thời gian winnebago .
(a) Tính số dư bình phương nhỏ nhất từ phương tiện theo mùa cộng với thời gian tuyến tính
mô hình xu hướng trên logarit của chuỗi thời gian bán hàng. (b) Thực
hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính toán và giải
thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
3.14 (Tiếp theo của bài tập 3.8) Tệp dữ liệu bán lẻ chứa bán lẻ hàng tháng của Vương quốc Anh
(a) Lấy phần dư bình phương nhỏ nhất từ phương tiện theo mùa cộng với thời gian tuyến tính
mô hình xu hướng.
(b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn hóa và giải thích kết quả. (c) Tính
toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
3.15 (Tiếp theo Bài tập 3.9) Xem xét lại chuỗi thời gian quy định .
(a) Lưu phần dư chuẩn hóa từ một bình phương nhỏ nhất phù hợp với xu hướng cosin với tần suất cơ bản 1/12
vào chuỗi thời gian thay đổi phần trăm. (b) Thực hiện chạy thử nghiệm trên các phần dư được tiêu chuẩn
hóa và giải thích kết quả. (c) Tính toán và giải thích các tự tương quan mẫu cho các giá trị tiêu chuẩn hóa
anh em.
(d) Điều tra tính chuẩn mực của các phần dư được tiêu chuẩn hóa (điều khoản sai số). Xem xét
biểu đồ và đồ thị xác suất bình thường. Giải thích các âm mưu.
Machine Translated by Google
54 Xu hướng
3.16 Giả sử rằng một chuỗi thời gian tĩnh, {Yt }, có một hàm tự tương quan của
dạng ρk = φk với k > 0, trong đó φ là hằng số trong khoảng ( 1, + 1).
= γ0 1 + φ - 2φ 1 φn - ()
(a) Cho thấy rằng Var Y_ ()
---- ------ -------------------
------------
.
N N 2
1 - (1 - φ)
φ (Gợi ý: Sử dụng Công thức (3.2.3) ở trang 28, tổng hình học hữu hạn
N - 1+ N d N
1 φn
φk
--------------------- =
, và tổng liên quan kφk 1– φk .)
=
k 0 = 1 - φ k 0 = dφ k 0 =
γ0 1 + φ
() (b) Nếu n lớn, lập luận rằngVar Y_
----
≈ ------------ .
N 1 - φ
(c) Ô () 1 (1
+ φ- ⁄ φ ) cho φ trong khoảng 1 đến +1. Giải thích cốt truyện theo thuật ngữ
về độ chính xác trong việc ước tính giá trị trung bình của quá trình.
3.17 Xác minh phương trình (3.2.6) trên trang 29. (Gợi ý: Bạn sẽ cần thực tế rằng
∞ 1
----------- =
φk cho 1 <φ <+1.)
k 0 = 1 - φ
3.18 Xác minh phương trình (3.2.7) trên trang 30. (Gợi ý: Bạn sẽ cần hai tổng
N N
t
n n ( ) 1+ và n n () 1+ ) 2n 1+
= --------------------
t2 = -----------------------------------------
.)
2 (6
t 1 = t 1 =
Machine Translated by Google
CHƯƠNG 4
CÁC MÔ HÌNH CHO CÁC GIAI ĐOẠN THỜI GIAN CỦA VĂN PHÒNG
Chương này thảo luận về các khái niệm cơ bản của một loại rộng các mô hình chuỗi thời gian
tham số — các mô hình đường trung bình động tự hồi phục (ARMA). Các mô hình này đã có tầm quan
trọng lớn trong việc mô hình hóa các quy trình trong thế giới thực.
Chúng tôi sẽ luôn đặt {Yt } biểu thị chuỗi thời gian được quan sát. Từ đây, chúng ta cũng sẽ để {et }
đại diện cho một chuỗi nhiễu trắng không được quan sát, nghĩa là, một chuỗi các biến ngẫu nhiên độc
lập, có giá trị trung bình bằng không, có phân phối giống hệt nhau. Đối với phần lớn công việc của
chúng tôi, giả định về tính độc lập có thể được thay thế bằng giả định yếu hơn rằng {et } là các biến
ngẫu nhiên chưa được phân loại, nhưng chúng tôi sẽ không theo đuổi tính tổng quát nhỏ đó.
Quá trình tuyến tính tổng quát, { Yt }, là một quá trình có thể được biểu diễn dưới dạng kết hợp tuyến
tính có trọng số của các thuật ngữ nhiễu trắng hiện tại và quá khứ như
Yt =et+++…
ψ1et 1– ψ2et 2– (4.1.1)
Nếu vế phải của biểu thức này thực sự là một chuỗi vô hạn, thì một số điều kiện nhất
định phải được đặt vào trọng số để vế phải có nghĩa là toán học có ý nghĩa. Đối với
mục đích của chúng tôi, đủ để giả định rằng
∞
i
2 ∞ < (4.1.2)
tôi 1 =
Chúng ta cũng cần lưu ý rằng vì {et } là không thể quan sát được, nên không có gì mất đi tính tổng
quát của Công thức (4.1.2) nếu chúng ta giả định rằng hệ số trên et là 1; hiệu quả, ψ0 = 1.
Một ví dụ quan trọng không đáng có mà chúng tôi sẽ thường xuyên quay lại là trường hợp
của hình thành một chuỗi phân rã theo cấp số nhân
=
ψj φ j
Yt =et++φet
+… 1– φ2et 2–
Đối với ví dụ
= =
này, E Yt (()φ2et
E et2–φet
) ++
1– +… 0
55
Machine Translated by Google
sao cho {Yt } có giá trị trung bình không đổi. Cũng thế,
=
Var Yt () Var ()
et ++
φet+…1– φ2et 2–
2– Var
= +++
et ()…
() φ2Var1–et( ) φ4Var et
= ( 2e 1 +++
φ2 φ)
4 …
2
σe
= -------------- (bằng cách cộng một chuỗi hình học)
1 φ2 -
Hơn nữa,
, 1– = ++ +…
, ( Cov )
() Yt
Cov Yt Cov φet
et +et
2–
+…1–
(et)φ2et
1– φet
2– +2– φ2et 2et 2– 3–
= , 1– )
( 1– et
Cov φet
+ , + …
2
= +++
φσe22 φ3σe
… φ5σe
=
φσe2(1 +++
φ2 φ)
4 …
2
φσe
= -------------- (một lần nữa tổng hợp một chuỗi hình học)
1 φ2 -
Như vậy
2 2
φσe σe
, 1– ) =
( Yt ⁄ = φ
-------------- --------------
Corr Yt
1 φ2 - 1 φ2 -
2
φkσe
Theo cách tương tự, chúng ta có thể tìm thấy () , k -
Cov Yt Yt
= --------------
1 φ2 -
và như vậy
= k
(4.1.3)
Corr Yt
- ()
Yt φ,
k
Điều quan trọng cần lưu ý là quá trình được xác định theo cách này là tĩnh - cấu trúc phương sai
autoco chỉ phụ thuộc vào độ trễ thời gian chứ không phụ thuộc vào thời gian tuyệt đối. Đối với một lin
∞
= 2 k ≥ 0
E Yt () 0 = γk Cov Yt Yt k =- () σ, e ψi ψi k +
(4.1.4)
i 0 =
với ψ0 = 1. Có thể thu được quá trình có giá trị trung bình khác không bằng cách thêm μ vào
vế phải của phương trình (4.1.1). Vì giá trị trung bình không ảnh hưởng đến sai lệch phương sai của một quá trình,
chúng tôi giả định giá trị trung bình bằng 0 cho đến khi chúng tôi bắt đầu điều chỉnh các mô hình với dữ liệu.
Machine Translated by Google
Trong trường hợp chỉ có một số hữu hạn trọng số là khác không, chúng ta có
được gọi là một quá trình trung bình động. Trong trường hợp này, chúng tôi thay đổi phần nào ký hiệu † và viết
= -
Yt et θ1et 1–
- -
(4.2.1)
θ2et 2– … Θq - etq -
Chúng ta gọi một chuỗi như vậy là đường trung bình của bậc q và viết tắt tên là MA (q).
Thuật ngữ trung bình động phát sinh từ thực tế là Yt thu được bằng cách áp dụng
- - -
trọng số 1, θ1, θ2, ..., vàetsau2,…,
θq thành các biến et , et 1, đó diet q
chuyển
trọng lượng và áp dụng chúng với et + 1, et ,- et -
q + et1 để thu được Yt + 1 , v.v. Mô hình
1, ...,
trung bình Mov lần đầu tiên được xem xét bởi Slutsky (1927) và Wold (1938).
Chúng tôi xem xét chi tiết quá trình đơn giản nhưng quan trọng của đường trung bình động của
bậc 1, tức là, chuỗi MA (1). Thay vì chuyên biệt hóa các công thức trong Phương trình
(4.1.4), nên xác định lại kết quả. Mô hình là Yt et θet
- =
1– . Từ
chỉ một θ được tham gia, chúng tôi loại bỏ chỉ số phụ dư thừa 1. Rõ ràng E Yt () = 0
và Var Yt ()
= σe
()2 +1 θ2 . Hiện nay
= - -
( Cov Yt,Yt 1– ) Cov (et θet 1–,et 1– θet 2– )
= - - =
2
( 1– ) θ, et 1– σe
Cov θet
và
, 2– ) = - -
( Yt
Cov Yt Cov (et θet 1–,et 2– θet 3– )
0 =
-
vì không có e nào có điểm chung giữa Yt và Yt 2. Tương tự,
( Cov Yt ,
Yt k - ) 0 = bất cứ khi nào k ≥ 2 ; nghĩa là, quá trình không có mối tương quan nào ngoài độ trễ
1. Thực tế này sẽ rất quan trọng sau này khi chúng ta cần chọn những mô hình phù hợp để thực
dữ liệu.
- =
Tóm lại, đối với mô hình MA (1), Yt et θet 1– ,
E Yt () 0 =
=
γ0 Var Yt () σe = ()2 +
1 θ2
- =
2
γ1 θσe (4.2.2)
= ) –Θ 1 θ2
ρ1 (⁄ () +
γk ρk = = 0 với k ≥ 2
† Lý do cho sự thay đổi này sẽ rõ ràng ở phần sau. Một số phần mềm thống kê, chẳng hạn
R, sử dụng dấu cộng trước các nhiệm vụ. Kiểm tra với của bạn để xem nó sử dụng quy ước nào.
Machine Translated by Google
Một số giá trị số cho ρ1 so với θ trong Công thức (4.2.2) giúp minh họa các khả năng có thể.
Lưu ý rằng các giá trị ρ1 đối với θ âm có thể nhận được bằng cách phủ định
giá trị cho giá trị θ dương tương ứng.
θ () + θρ11 θ2 - = ⁄
0.099 θ () + θ 1 θ2 - = ⁄
ρ1
0,1 0,6 0,441
Một đối số giải tích cho thấy rằng giá trị lớn nhất mà ρ1 có thể đạt được là ρ1 = ½ khi
θ = 1 và giá trị nhỏ nhất là ρ1 = ½, giá trị này xảy ra khi θ = +1 (xem Bài tập 4.3).
Hình 4.1 hiển thị một biểu đồ của các giá trị tự tương quan trễ 1 cho θ nằm trong khoảng từ 1 đến
+1.
Hình 4.1 Độ trễ 1 Tự tương quan của một quá trình MA (1) cho các quá trình khác nhau θ
ρ1
0,2
0,4
0,4
0,2
0,0
Bài tập 4.4 yêu cầu bạn chỉ ra rằng khi bất kỳ giá trị khác nào của θ được thay thế bằng 1 / θ,
cùng một giá trị cho ρ1 thu được. Ví dụ: ρ1 giống với θ = ½ như đối với θ = 1 / (½)
= 2. Nếu chúng ta biết rằng một quá trình MA (1) có ρ1 = 0,4, chúng ta vẫn không thể nói chính xác
giá trị của θ. Chúng ta sẽ quay lại điểm rắc rối này khi chúng ta thảo luận về khả năng nghịch đảo trong
Hình 4.2 cho thấy đồ thị thời gian của một chuỗi MA (1) được mô phỏng với θ = 0,9 và không
có nhiễu trắng phân phối theo m. Nhớ lại từ Hình 4.1 rằng ρ1 = 0,4972 cho mô hình này;
do đó có mối tương quan thuận vừa phải mạnh ở độ trễ 1. Mối tương quan này là rõ ràng
trong cốt truyện của loạt bài vì các quan sát liên tiếp có xu hướng liên quan chặt chẽ với nhau. Nếu một
quan sát trên mức trung bình của chuỗi, thì quan sát tiếp theo cũng có xu hướng
ở trên mức trung bình. Cốt truyện tương đối suôn sẻ theo thời gian, chỉ đôi khi
biến động.
Machine Translated by Google
Hình 4.2 Đồ thị thời gian của một quá trình MA (1) với θ = 0,9
• • •
•
• ••• • ••
•
• •
• ••
• • • • •
• • • • •• • •
• •
• ••• • •••• •• • •
• • •
Yt •
•
•
• • • • ••• • •
• • • ••
• • • • • •••• • • •
• •• ••
31
2
1
0
•
• •
• • • • •• •
• • •
• • • •
••
• • •
•
• ••
• •
•
• •
• • •
•
3
••
•
0 20 40 60 80 100 120
Thời gian
Tự tương quan trễ 1 thậm chí còn rõ ràng hơn trong Phụ lục 4.3, biểu đồ Yt ver
sus Yt- 1. Lưu ý xu hướng tăng mạnh vừa phải trong biểu đồ này.
Biểu đồ 4.3 Biểu đồ Yt so với Yt – 1 cho chuỗi MA (1) trong Phụ lục 4.2
3
2
• •
• •
• • •
•• • • • •
• • • •• •• •
• • • • •
•
••
•
••
• • •
•
• ••
• •
• •• •• ••
•
•
Yt
• • • • • • • •
•• •
• • • • ••
• •
•
•• • •
•
•• • •
•
•
• •
• •
•
• ••• •••
•
•
••
• •• • •
•
•
• •
• • •
•
••
•
•
• • •
• •
13
0 1
2
•
•
3 2 1 0 1 2 3
Yt-1
Biểu đồ của tự tương quan - 2 trong Hình 4.4 đưa ra một hình dung rõ ràng về số không
Yt so với Yt ở độ trễ 2 cho mô hình này.
Biểu đồ 4.4 Biểu đồ Yt so với Yt – 2 cho chuỗi MA (1) trong Phụ lục 4.2
• • •
•
••
• •• ••
•
• • • •
• • • •• •
• • • • • •
•
Yt •
• • •
• •
•• ••
• •
•
• •• • • •
• •
• •• • • • •
• • • •
• • ••
• ••
•
•
• •
• •
•
••
• • • •
••• •
• •• •• • •
• ••
•
•
•
• •
• •
• •
•
• •• •
33
2
1
0 1
2
• • • •
•
• ••
•
• •
•
3 2 1 0 1 2 3
Yt 2
Một loạt hơi khác được trình bày trong Phụ lục 4.5. Đây là chuỗi MA (1) được mô phỏng
với θ = +0,9. Nhớ lại từ Hình 4.1 rằng ρ1 = 0,497 cho mô hình này; do đó có mối tương quan
âm mạnh vừa phải ở độ trễ 1. Mối tương quan này có thể được nhìn thấy trong biểu đồ của
chuỗi vì các quan sát liên tiếp có xu hướng nằm ở phía đối diện của giá trị trung bình bằng
0. Nếu một quan sát nằm trên mức trung bình của chuỗi, thì quan sát tiếp theo có xu hướng ở
dưới mức trung bình. Cốt truyện khá lộn xộn theo thời gian — đặc biệt là khi được so sánh
với cốt truyện trong Phụ lục 4.2.
Machine Translated by Google
Hình 4.5 Biểu đồ thời gian của một quy trình MA (1) với θ = +0,9
• • •
2
•• • • • • •• •
•• • • • • • •
• • •• • • • • • • •• • ••
• •
• • •
•
• • • •• •• • • •• • • •
•
• • • ••
0 • • • • •
Yt
•• • • • •
•
•
•
• •••• •
• • •
•
• • • •
• •
••
• •
•• • •
• • • •
••
•
• •
• •• • • • •
•
•
2
4 •
•
0 20 40 60 80 100 120
Thời gian
Độ trễ âm 1 tự tương quan thậm chí còn rõ ràng hơn trong biểu đồ độ trễ của Hình
4.6.
Biểu đồ 4.6 Biểu đồ Yt so với Yt – 1 cho chuỗi MA (1) trong Phụ lục 4.5
• • •
2 • •
•
•• • • •
• • •
• • • •
• • •
•
•
•• • • •
• • • •
• • • • • • • •
• •
• •
• • •••
• • •••
•
• •
• ••• •• • •
• • • • • • • • • • • • •
• • • • • • • • • • • •
•
• • • • • •
0 • • •
Yt • • •
•
• • ••
• •• • ••
•
•
• • •
•
•
•
•
• • • ••
• ••
••
•
•
•
• •
• •
••
2
• •
•
• •
•
4 •
•
4 2 0 2
Yt-1
Hình 4.7 Đồ thị của Yt so với Yt-2 cho chuỗi MA (1) trong Hình 4.5
•••
•••• • •
• • • ••••• •
2
• • ••••••
• •••••• •• •• ••
•••• •
0 •
• •• • • •••••• ••• • • • • •
• •• • ••••
• •
• •
Yt
•• ••••• •• ••
• • ••
• • •••• •• • •
•• •
2
• ••
•
•
4
4 2 0 2
Yt 2
Các quy trình MA (1) không có tự tương quan ngoài độ trễ 1, nhưng bằng cách tăng thứ tự
của quá trình, chúng ta có thể thu được các mối tương quan bậc cao hơn.
Hãy xem xét quá trình trung bình động của bậc 2:
= θ1et
Yt et
-
1–
-
θ2et 2–
Nơi đây
2 2
= = - - =
(
γ0 Var Yt () Var et θ1et 1– θ2et 2– ) (1 2θ1+ + θ2 ) σe
( γ1= Cov Yt Yt = - - - -
, 1– ) Cov (
et θ1et 1– θ2et 2–, et 1– θ1et 2– θ2et 3– )
= Cov –θ1et
( , 1– ) + Cov (
1– et
- -
, θ2et 2– )
θ1et 2–
2
= + ( θ1 ()-])
[ θ1 - θ2 - σe
2
= + θ1θ2 ) σ e
( θ1 -
và
Machine Translated by Google
= 2– ( () ,
γ2 Cov = - - - -
Yt Yt ( θ1et 1–
Cov et θ2et 2–, et 2– θ1et 3– θ2et 4– )
= -
,)
Cov θ2et 2– và 2–
- =
2
θ2σe
θ1 - θ1θ2 +
ρ1 = ----------------------------
2
1 2θ1+ + θ2
θ2 - (4.2.3)
ρ2 = ---------------------------
2
1 2θ1+ + θ2
Yt = et et 1– + 0,6et 2– , chúng
- ta có
Đối với trường hợp cụ thể
- 1 () –0,6 –1,6
1 + ()
ρ1 = = ---------- 0,678 = -
--------------------------------------------
2,36
1 +
1 ( ) 2 +() –0,6 2
và
0,6
ρ2 = = ---------- 0,254
2,36
Biểu đồ thời gian mô phỏng quá trình MA (2) này được thể hiện trong Hình 4.8. Các
chuỗi có xu hướng di chuyển qua lại trên giá trị trung bình trong một đơn vị thời gian. Điều này phản ánh
Hình 4.8 Đồ thị thời gian của một quá trình MA (2) với θ1 = 1 và θ2 = 0,6
4
•
• ••
• •
• • •• • •
• •• • •
• • • • • • •••••• •
2
• ••• •••• •••• •• ••• •
0
• • • •• •• • ••• •• •••• • • • ••• •
• • • • •• • • • • ••••
Yt
••
•
• •
••• ••• ••
•• •
• • • • • • •
• • • • •••
2
• •
4 • •
0 20 40 60 80 100 120
Thời gian
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> data (ma2.s); plot (ma2.s, ylab = expression (Y [t]), type = 'o')
Machine Translated by Google
Cốt truyện trong Hình 4.9 phản ánh sự tự tương quan âm khá đáng kể.
Biểu đồ 4.9 Đồ thị của Yt so với Yt – 1 cho chuỗi MA (2) trong Phụ lục 4.8
4
•
•• • •
• •
•
2 • • •
•
• • • •
•
• • •• • •
•
•
•
• ••
•
• • • • • • • •
• • • • •
• •
•
• • •• ••
• • • •
• •
0 • • • •
• • • ••
• •
• •
•
•
Yt • •
•
•
••
•
• ••
• • • •
•
• •• •• • • •
• •
• •
• • ••
•
2 • •• • • ••
• • •
• • • •
••
• •
4 •
4 2 0 2 4
Yt-1
Tự tương quan dương yếu ở độ trễ 2 được hiển thị trong Hình 4.10.
Hình 4.10 Đồ thị của Yt so với Yt – 2 cho chuỗi MA (2) trong Hình 4.8
4
•
• •
• •
•
• ••
••
•
2 • •
•
•
•
• •• ••
• •
•
• ••
• •
•
•
• •
• •• •
• • • • • ••• •
•• •
• •
• •
•
•
0 •• • • • • • •
• •
•
Yt • • • • •
•
• • •
• • • •
•
• • • •
•
• • • • •
•
•• •
•• • • •
• •
• •
•
• •
• •• •
• •
2
•
• • • • •
•
4 •
4 2 0 2 4
Yt 2
Cuối cùng, việc thiếu tự tương quan ở độ trễ 3 là rõ ràng từ biểu đồ phân tán trong
Hình 4.11.
Biểu đồ 4.11 Biểu đồ của Yt so với Yt – 3 cho chuỗi MA (2) trong Phụ lục 4.8
4
••• •
• • •
• •• • •
••
• • •• • • • •• •
2
•• • • •••• •••• •
•• ••
••••• •• •• • •• •• •
• •
••
0
••• •
•• •
••
Yt
•• •
• •
• •• ••• •• •• •
•
•
•••• •• ••• • • •
•
••
• •
2
•
• •• ••
• •
4
•
4 2 0 2 4
Yt-3
= 2 2 2 2
γ0 (1 )θ1++++ θ2σe … Θq (4.2.4)
và
θk -
+ θ1θk 1++ θ2θk
++ 2+ … Θq k - θq
-------------------------------------------------- ------------------------------------------------
2 2 2 cho k = 1, 2, ..., q
=
ρk 1 ++++
θ1 θ2 … Θq (4.2.5)
0 cho kq >
trong đó tử số của ρq chỉ là θq. Chức năng tự tương quan "ngắt" sau độ trễ
q; nghĩa là, nó bằng không. Hình dạng của nó có thể là gần như bất cứ thứ gì đối với các độ trễ trước đó. Một loại khác của
process, quá trình tự hồi quy, cung cấp các mô hình cho các con nhạn biển tự tương quan
thay thế.
Machine Translated by Google
Các quy trình tự phục hồi giống như tên gọi của chúng - tự hồi quy. Cụ thể, một quy
trình tự động hồi quy bậc p {Yt } thỏa mãn phương trình
= + ++ + (4.3.1)
Yt φ1Yt 1– φ2Yt 2– … PYt p - et
Giá trị hiện tại của chuỗi Yt là sự kết hợp tuyến tính của p giá trị trong quá khứ gần đây nhất
của chính nó cộng với thuật ngữ “đổi mới” và kết hợp mọi thứ mới trong loạt phim tại
thời gian t mà không được giải thích bởi các giá trị trong quá khứ. Do đó, với mọi t, chúng ta giả sử rằng et là
không phụ thuộc vào Yt - 1, Yt - 2, Yt - 3, .... Yule (1926) thực hiện công việc gốc trên
các quy trình tự phục hồi. †
Một lần nữa, cần phải xem xét chi tiết mô hình bậc nhất, viết tắt là AR (1).
Giả sử chuỗi là đứng yên và thỏa mãn
Yt φYt 1– et + = (4.3.2)
trong đó chúng tôi đã loại bỏ chỉ số phụ 1 từ hệ số φ để đơn giản hóa. Như thường lệ, trong
những chương đầu tiên này, chúng tôi giả định rằng trung bình của quá trình đã được trừ đi để
giá trị trung bình của chuỗi là 0. Các điều kiện về tính ổn định sẽ được xem xét ở phần sau.
Đầu tiên chúng ta lấy phương sai của cả hai vế của Phương trình (4.3.2) và thu được
+ =
2
γ0 φ2γ0 σe
Lưu ý hàm ý ngay lập tức rằng - φ2 <1 hoặc φ <1 . Bây giờ lấy phương trình
cái đó (4.3.2), nhân cả hai vế với Yt - k (k = 1, 2, ...) và nhận các giá trị mong đợi
=
k -φE Yt k - Yt(1– + (
E Yt () ) E et Yt k - )
hoặc
γk φγk
= ()1– + E et Yt k -
Vì chuỗi được giả định là đứng yên với giá trị trung bình bằng 0, và vì et là vết lõm sâu của
và vì thế
† Nhớ lại rằng chúng ta đang giả định rằng Yt không có giá trị trung bình. Chúng tôi luôn có thể giới thiệu một nonzero
nghĩa là bằng cách thay thế Yt bởi Yt - μ trong các phương trình của chúng ta.
Machine Translated by Google
2
Đặt k = 1, ta được γ1 φγ0 φσe= = () 1-.Với
φ2 ⁄ k = 2, chúng ta thu được γ2 =
φ2σe 2()1 -φ2 ⁄ . Bây giờ có thể dễ dàng nhận thấy rằng nhìn chung
2
σe
= --------------
γk φk 1 (4.3.5)
φ2 -
và như vậy
= γk (4.3.6)
ρk ---- φk cho k = 1, 2, 3, ...
γ0
Vì độ lớn
φ <1của, hàm tự tương quan giảm theo cấp số nhân
khi số độ trễ, k, tăng lên. Nếu tất cả các0 mối 1 , quan là tích cực; nếu
<<φ tương
–1 <<φ 0 , tự tương quan trễ 1 là âm (ρ1 = φ) và các dấu hiệu liên tiếp
tự tương quan thay thế từ tích cực sang tiêu cực, với độ lớn của chúng giảm dần
nhanh chóng. Các phần của đồ thị của một số hàm tự tương quan được hiển thị
trong Hình 4.12.
Hình 4.12 Các chức năng tự tương quan cho một số mô hình AR (1)
•
• φ = 0,9
• • φ = 0,4
ρk
• • ρk
• •
• • •
• •
•
0,8
0,4
0,0 0,8
0,4
0,0
• • • • • • • • • • •
2 4 6 8 10 12 2 4 6 8 10 12
Lỗi Lỗi
1,0 1,0
• φ = 0,8 φ = 0,5
•
• • •
• • • • •
ρk 0,0
ρk 0,0
• • • • • • • • • •
•
• •
1,0
• 1,0
2 4 6 8 10 12 2 4 6 8 10 12
Lỗi Lỗi
Lưu ý rằng đối với φ gần ± 1 , sự phân rã theo cấp số nhân khá chậm (ví dụ: (0,9) 6 =
0,53), nhưng đối với φ nhỏ hơn, sự phân rã khá nhanh (ví dụ, (0,4) 6 = 0,00410). Với φ
ở gần ± 1 , mối tương quan mạnh mẽ sẽ kéo dài qua nhiều độ trễ và tạo ra một
Machine Translated by Google
chuỗi trơn nếu φ là dương và một chuỗi rất răng cưa nếu φ là âm.
Hình 4.13 hiển thị biểu đồ thời gian của một quy trình AR (1) được mô phỏng với φ = 0,9.
Lưu ý rằng chuỗi số này không thường xuyên vượt qua trung bình lý thuyết của nó như thế nào. Có rất nhiều
quán tính trong chuỗi — nó gắn liền với nhau, vẫn ở cùng phía của giá trị trung bình cho
thời gian kéo dài. Một người quan sát có thể khẳng định rằng loạt bài này có một số xu hướng. Chúng tôi biết
rằng trên thực tế, giá trị trung bình lý thuyết là 0 cho mọi thời điểm. Ảo tưởng về xu hướng là do
đến tự tương quan mạnh của các giá trị lân cận của chuỗi.
Hình 4.13 Biểu đồ thời gian của một chuỗi AR (1) với φ = 0,9
• •• •
• • •
•
4
• •• • •
• • •
• • • • •• •
2
• • •
• • •• • ••
• •
Yt • •
• • •
•• •
• •
•
0
•
• • •
• • •• • •
2 •
• • •
0 10 20 30 40 50 60
Thời gian
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> data (ar1.s); plot (ar1.s, ylab = expression (Y [t]), type = 'o')
Hình 4.14 Biểu đồ của Yt so với Yt - 1 cho AR (1) Chuỗi của Phụ lục 4.13
•• • •
••
• •
4
•• • ••• ••
•• •
•
• •
•• •
2 •• •• •• ••
• ••
Yt
•• ••• • • •
•
0
• •••
•
• •
• ••
2 •• •
2 0 2 4
Yt-1
Mô hình AR (1) này cũng có tự tương quan dương mạnh mẽ ở độ trễ 2, cụ thể là ρ2 =
(0,9) 2 = 0,81. Hình 4.15 cho thấy điều này khá tốt.
Hình 4.15 Biểu đồ của Yt so với Yt - 2 cho chuỗi AR (1) của Phụ lục 4.13
• •• •
•• •
• • •
4
• ••
•
• • • • • •
• •
• ••
2 •• • •
•
• •
•
Yt
• • •
• • •• ••
•
0
•••
•
•
• •
•
• •
2
• •
2 0 2 4
Yt 2
Cuối cùng, ở độ trễ 3, tự tương quan vẫn còn khá cao: ρ3 = (0,9) 3 = 0,729. Triển lãm
4.16 xác nhận điều này cho loạt bài cụ thể này.
Biểu đồ 4.16 Biểu đồ của Yt so với Yt - 3 cho chuỗi AR (1) của Phụ lục 4.13
• •• •
• • •
• • • •••• • • • •
4
•••
• •
• • • ••
2
• • • •
• •
• •
Yt
•
•• • •
••
•
0
• • •
• •••
• • •
2 •
2 0 2 4
Yt-3
Phiên bản quy trình tuyến tính chung của mô hình AR (1)
Định nghĩa đệ quy của quá trình AR (1) được đưa ra trong Công thức (4.3.2) là cực kỳ
hữu ích cho việc giải thích mô hình. Đối với các mục đích khác, thật thuận tiện để thể hiện
Mô hình AR (1) như một quá trình tuyến tính tổng quát như trong Công thức (4.1.1). Định nghĩa đệ quy
có giá trị cho mọi t. Nếu chúng ta sử dụng phương trình này với t được thay thế bởi t 1, chúng
=
ta nhận
+
được Yt 1– φYt 2– et 1– . Thay thế điều này vào biểu thức ban đầu cho
= + + et
Yt (φ φYt 2– et 1– )
Nếu chúng ta lặp lại sự thay thế này trong quá khứ, nói k - 1 lần, chúng ta nhận được
= +
Yt et φet 1– φ2et 2–
+ ++ +
… Φk 1– et k - 1 + φkYt k - (4.3.7)
= ++ + φ3e t 3– +
… (4.3.8)
Yt et φet 1– φ2et 2–
Machine Translated by Google
= ,
Đây là dạng của quá trình tuyến tính tổng quát của Phương trình (4.1.1) mà ψj φ j
chúng ta đã nghiên cứu trong Phần 4.1 trên trang 55. Lưu ý rằng biểu diễn này
nhấn mạnh lại sự cần thiết của hạn chế φ <1 .
Có thể chỉ ra rằng, tùy thuộc vào hạn chế mà không phụ thuộc vào Yt - 1 , Yt - 2,
và rằng 2 > 0
Yt - 3,… σe Yt ,φYt
nghiệm của+ AR
1– et = (1) xác định đệ quy φ <1
sẽ đứng yên nếu và chỉ khi φ <1 . Yêu cầu thường được gọi là
điều kiện ổn định cho quá trình AR (1) (Xem Box, Jenkins và Reinsel, 1994,
P. 54; Nelson, 1973, tr. 39; và Wei, 2005, tr. 32) mặc dù nhiều hơn sự cố định là
có liên quan. Đặc biệt xem các Bài tập 4.16, 4.18 và 4.25.
Tại thời điểm này, chúng ta cần lưu ý rằng hàm tự tương quan cho quá trình AR (1)
đã được bắt nguồn theo hai cách khác nhau. Phương pháp đầu tiên sử dụng quy trình tuyến tính chung
biểu diễn dẫn đến phương trình (4.1.3). Phương pháp thứ hai sử dụng định nghĩa
đệ quy và khai triển
Yt φYt 1– các
et +phương
= trình (4.3.4), (4.3.5), và
(4.3.6). Đạo hàm thứ ba thu được bằng cách nhân cả hai vế của Phương trình (4.3.7) với
- k, lấy các giá trị mong đợi của cả hai bên và sử dụng thực tế là et , et - 1, et - 2, ...,
Yt -độc
et (k -lập với Yt - k. Phương pháp thứ hai cần được đặc biệt lưu ý vì
1) nó sẽ tổng quát hóa độc đáo cho các quy trình bậc cao hơn.
= + 2– et + (4.3.9)
Yt φ1Yt 1– φ2Yt
trong đó, như thường lệ, chúng tôi giả định rằng et độc lập với Yt - 1, Yt - 2, Yt - 3, ... Để thảo luận
φ () x 1 φ1 - x φ2x2 - =
0 =
1 φ1 - x φ2x2 -
Chúng ta nhớ lại rằng một phương trình bậc hai luôn có hai nghiệm (có thể phức).
† Nó cũng áp dụng trong trường hợp bậc nhất, trong đó phương trình đặc tính AR chỉ là 1 - φx = 0
với căn 1 / φ, vượt quá 1 về giá trị tuyệt đối nếu và chỉ khi φ <1 .
Machine Translated by Google
Trong trường hợp bậc hai, nghiệm nguyên của phương trình đặc tính bậc hai dễ dàng
được tìm thấy là
±
φ1 φ12 + 4φ2
-------------------------------------
(4,3.10)
2φ2 -
Đối với tính cố định, chúng tôi yêu cầu các gốc này vượt quá 1 về giá trị tuyệt đối. Trong phụ lục
B, trang 84, chúng tôi chứng minh rằng điều này sẽ đúng nếu và chỉ khi ba điều kiện được thỏa mãn:
nd (4.3.11)
φ1 φ2 + <1, φ2 φ1 - <1, φ2 <1 một
Như với mô hình AR (1), chúng tôi gọi đây là các điều kiện cố định cho AR (2)
người mẫu. Vùng cố định này được hiển thị trong Phụ lục 4.17.
Hình 4.17 Vùng tham số trạng thái cho quy trình AR (2)
1,0
0,5 2 0 =
φ1 4φ2 +
rễ thật
φ2 0,0
rễ phức tạp
0,5
1,0
2 1 0 1 2
φ1
Để lấy được hàm tự tương quan cho trường hợp AR (2), chúng ta sử dụng phép đệ quy xác định
mối quan hệ của phương trình (4.3.9), nhân cả hai vế với Yt - k và lấy kỳ vọng.
Giả sử tính đứng yên, không có nghĩa là và et đó độc lập với Yt - k, chúng ta nhận được
=
ρk φ1ρk 1– φ2ρk+ 2– cho k = 1, 2, 3, ... (4.3.13)
Phương trình (4.3.12) và / hoặc (4.3.13) thường được gọi là phương trình Yule-Walker, đặc biệt là
tập hai phương trình thu được đối với k = 1 và 2. Đặt k = 1 và sử dụng ρ0 = 1
và ρ 1 = ρ1, ta nhận được ρ1 φ1 φ2ρ1 + = và vì thế
Machine Translated by Google
φ1
= --------------
ρ1 (4.3.14)
1 φ2 -
Sử dụng các giá trị hiện đã biết cho ρ1 (và ρ0), Công thức (4.3.13) có thể được sử dụng với k = 2 để
được
ρ2 φ1ρ1 φ2ρ0 + =
+ 2 (4.3.15)
φ2 1 φ2 () φ - 1
= -------------------------------------
1 φ2 -
Các giá trị kế tiếp của ρk có thể dễ dàng được tính bằng số từ quan hệ tương đối
đệ quy của Công thức (4.3.13).
Mặc dù Công thức (4.3.13) rất hiệu quả để tính toán các giá trị tự tương quan
về mặt số từ các giá trị đã cho của φ1 và φ2, cho các mục đích khác, điều mong muốn là có
công thức rõ ràng hơn cho ρk. Hình thức của giải pháp rõ ràng phụ thuộc rất nhiều vào
nghiệm của phương trình đặc trưng 0 = 1 φ1 - x φ2x2 - . Biểu thị những người có đi có lại
những gốc này bởi G1 và G2, nó được trình bày trong Phụ lục B, trang 84,
2 2
=
φ1 4φ2
φ1 + - φ1 φ1
4φ2 ++
-------------------------------------
a nd
G1 G2
= -------------------------------------
2 2
Đối với trường hợp G1 G2, có thể cho thấy rằng chúng ta có
2 - 2 k 1+
( 1 )G2- G1 k 1+ 1( G1
) - G2
cho k ≥ 0
ρk (4.3.16)
= ------------------------------------------------- ----------------------------
( G1 +
G2 ) -
1 G1G2 ()
2
Nếu các gốc phức tạp (nghĩa là, nếu φ1 4φ2 + 0 < ), thì ρk có thể được viết lại thành
) Θk + Φ
= ------------------------------ cho k ≥ 0
ρk Rk sin ( (4.3.17)
sin () Φ
trong R = () Φ
đó φ2 - = và Θ và Φ được xác định bởi = ⁄ (cos ()
và Θ φ1 2 φ2 ) -
rám nắng
[1
- ⁄φ2
φ2()
(1 ) + ].
2
Để hoàn chỉnh, chúng ta lưu ý rằng nếu các gốc bằng nhau ( φ1 4φ2 + 0 = ), sau đó chúng tôi có
k
1 + φ2 φ1
=
ρk k
1 + --------------
----- 2
cho k = 0, 1, 2, ... (4.3.18)
1 φ2 -
Một cuộc thảo luận tốt về nguồn gốc của các công thức này có thể được tìm thấy trong Fuller (1996,
Mục 2.5).
Các chi tiết cụ thể của các công thức này ít quan trọng đối với chúng tôi. Chúng tôi chỉ cần
lưu ý rằng hàm tự tương quan có thể giả định rất nhiều hình dạng. Trong tất cả trường hợp,
độ lớn của ρk chết nhanh theo cấp số nhân khi độ trễ k tăng lên. Trong trường hợp gốc
com plex, ρk hiển thị hành vi sóng hình sin giảm xóc với hệ số giảm chấn R, 0 R <≤ 1 ,
tần số Θ và pha Φ. Minh họa về các hình dạng có thể được đưa ra trong Phần trình bày
4.18. (Hàm R ARMAacf được thảo luận trên trang 450 rất hữu ích cho việc vẽ biểu đồ.)
Machine Translated by Google
Hình 4.18 Các chức năng tự tương quan cho một số mô hình AR (2)
2 4 6 8 10 12 2 4 6 8 10 12
Lỗi Lỗi
• • •
• • • • • • • • •
• •
0,5
1,0
0,5
0,0 • • 0,5
1,0
0,5
0,0
• • • • •
2 4 6 8 10 12 2 4 6 8 10 12
Lỗi Lỗi
Hình 4.19 hiển thị biểu đồ thời gian của một chuỗi AR (2) được mô phỏng với φ1 =
1,5 và φ2 = 0,75. Hành vi tuần hoàn của ρk được thể hiện trong Hình 4.18 được phản
ánh rõ ràng trong hành vi gần như tuần hoàn của chuỗi với cùng chu kỳ 360/30 = 12 đơn
vị thời gian. Nếu Θ được đo bằng radian, 2π / Θ đôi khi được gọi là bán kỳ của AR (2) pro
thuế.
Hình 4.19 Đồ thị thời gian của một chuỗi AR (2) với φ1 = 1,5 và φ2 = 0,75
••
••
•
• •
•
•••
••• ••
•
• •• • • •• •••
•
• • • •• • • ••• •
Yt ••
• • • ••
•
• • • • • •• • •
••
• • •
• •
• • • • • •
••
• • • •
•
•
••
• • •
•• • •
•• • •
••
• •
• • •
64
4
2
0 2
• •••
• •
• •
• •
• •
•• • • ••
•• • •
0 20 40 60 80 100 120
Thời gian
Phương sai quá trình γ0 có thể được biểu thị theo các tham số mô hình φ1, φ2, và
2
σe như sau: Lấy phương sai của cả hai vế của Phương trình (4.3.9) cho kết quả
2 2 2
γ0 = ( φ1 γ + 0 +2φ1φ2γ1 σe +
) φ2 (4.3.19)
Đặt k = 1 trong Công thức (4.3.12) đưa ra phương trình tuyến tính thứ hai cho γ0 và γ1 ,
γ1 φ1γ0 φ2γ1 + = , có thể được giải quyết đồng thời với Công thức (4.3.19) để
được
2
) σ( - e
1 φ2
γ0 = ------------------------------------------------- ------------------------
2 2 2
- -
1 φ2
() - (1 φ1 ) φ2
- 2φ2φ1
2 (4,3,20)
1 φ2 - σe
= ---------------------------------
2 2
-------------- -
1 φ2 + 1 φ2 () - φ1
Hệ số ψ trong biểu diễn quy trình tuyến tính tổng quát cho chuỗi AR (2) là
phức tạp hơn so với trường hợp AR (1). Tuy nhiên, chúng ta có thể thay thế tuyến tính chung
biểu diễn quy trình sử dụng Công thức (4.1.1) cho Yt, cho Yt - 1 và cho Yt - 2 thành
Mối =quan hệ Yt + +
φ1Yt 1– φ2Yt .
Nếu sau đó chúng ta cân bằng các hệ số của ej, chúng ta nhận được đệ quy
2– et
ψ0 1 =
ψ1 φ1ψ0 - 0 = (4.3.21)
- - = 0 cho
ψj φ1ψj 1– φ2ψj 2– j = 2, 3, ...
2
Chúng có thể được giải một cách đệ quy để thu được ψ0 = 1, ψ1 = φ1, ψ2
φ2φ1+ = , và như thế.
Các mối quan hệ này cung cấp các giải pháp số tuyệt vời cho các hệ số ψ cho
các giá trị số đã cho của φ1 và φ2.
Người ta cũng có thể chỉ ra rằng, đối với G1 G2, một giải pháp rõ ràng là
j 1+ - j 1+
G1 G2
ψj
= ---------------------------------
(4.3.22)
G1 G2 -
trong đó, như trước đây, G1 và G2 là nghịch đảo của các gốc của đặc tính AR
phương trình. Nếu các gốc phức tạp, Phương trình (4.3.22) có thể được viết lại thành
j sin [() Θ j 1+
= ]
---------------------------------
(4.3.23)
ψj R
sin () Θ
một sóng sin giảm chấn với cùng hệ số tắt dần R và tần số Θ như trong phương trình
(4.3.17) cho hàm tự tương quan.
Để hoàn chỉnh, chúng ta lưu ý rằng nếu các rễ bằng nhau thì
= 1 (4.3.24)
j ψj () φ 1 + j
Machine Translated by Google
Bây giờ hãy xem xét mô hình hồi quy tự động bậc p
=
Yt φ1Yt 1– φ2Yt+ 2–
++ + et (4.3.25)
… PYt p -
x =- φ φ1
φ2x2 () -1 x-… φpxp
-
(4.3.26)
Như đã lưu ý trước đó, giả sử rằng et độc lập với Yt - 1, Yt - 2, Yt - 3, ... một
giải pháp trạm cho Phương trình (4.3.27) tồn tại nếu và chỉ khi gốc p của đặc trưng AR
mỗi phương trình vượt quá 1 giá trị tuyệt đối (môđun). Các mối quan hệ khác giữa các
căn và hệ số đa danh có thể được sử dụng để chỉ ra rằng hai bất đẳng thức sau
là cần thiết cho sự cố định. Nghĩa là, đối với các gốc lớn hơn 1 trong môđun, nó là
cần thiết, nhưng không đủ, cả hai
φ1 φ2 … φp +++ 1 <
(4.3.28)
và
φp <1
Giả sử tính đứng yên và bằng không, chúng ta có thể nhân Phương trình (4.3.25) với Yt - k,
lấy kỳ vọng, chia cho γ0 và nhận được mối quan hệ đệ quy quan trọng
=
ρk φ1ρk 1– φ2ρk +2– φ3ρk 3–+ ++ cho k ≥ 1 (4.3.29)
… Φpρk p -
Đưa k = 1, 2, ... và p vào Công thức (4.3.29) và sử dụng ρ0 = 1 và ρ k = ρk, chúng ta nhận được
các phương trình Yule-Walker tổng quát
ρ1 = + + ++
φ1 φ2ρ1 φ3ρ2 … φpρp 1– ρ2
= ++ ++
φ1ρ1 φ2 φ3ρ1 … φpρp 2–
. (4,3,30)
.
.
= +
ρp φ1ρp 1– φ2ρp 2– φ3ρp 3– … φp + ++
Đã cho các giá trị số cho φ1, φ2, ..., φp, các phương trình tuyến tính này có thể được giải thành
lấy các giá trị số cho ρ1, ρ2, ..., ρp. Sau đó, Công thức (4.3.29) có thể được sử dụng để lấy
các giá trị số cho ρk tại bất kỳ số độ trễ cao hơn nào.
Cần lưu ý rằng
= = 2 = 2
E et Yt ([ (
) E et φ1Yt 1– +φ2Yt
++ + 2–
… PYt p - et )] E ()
et σe
chúng ta có thể nhân Phương trình (4.3.25) với Yt , lấy các kỳ vọng và tìm
= 2
+ ++ +
γ0 φ1γ1 φ2γ2 … pγp σe
Machine Translated by Google
4.4 Mô hình trung bình trượt tự động hồi phục hỗn hợp 77
2
σe
γ0
= ------------------------------------------------- -------------------
(4.3.31)
-
1 φ1ρ1 - φ2ρ2 - … Φpρp -
2
và thể hiện phương sai quá trình γ0 theo các tham số, φ1,
σe φ2, ..., φp, và
các giá trị hiện đã biết của ρ1, ρ2, ..., ρp. Tất nhiên, các giải pháp rõ ràng cho ρk về cơ bản là
không thể trong tính tổng quát này, nhưng chúng ta có thể nói rằng ρk sẽ là một tổ hợp tuyến tính của
Các số hạng phân rã theo cấp số nhân (tương ứng với các căn thực của phương trình đẳng tích
đặc trưng) và các số hạng sóng sin giảm dần (tương ứng với các căn phức của phương trình đẳng
thức đặc trưng).
Giả sử tính ổn định, quá trình cũng có thể được biểu diễn ở dạng kết quả tuyến
tính tổng quát của Phương trình (4.1.1), nhưng hệ số ψ là các hàm phức tạp của
tham số φ1, φ2, ..., φp. Các hệ số có thể được tìm thấy bằng số; xem Phụ lục C trên
trang 85.
4.4 Mô hình trung bình trượt tự động hồi phục hỗn hợp
Nếu chúng tôi giả định rằng chuỗi một phần là tự động hồi quy và một phần là đường trung bình động, chúng tôi
có được một mô hình chuỗi thời gian khá tổng quát. Nói chung, nếu
= + ++ + - -
Yt φ1Yt 1– φ2Yt 2– … PYt p - et 1et 1– θ2et
- -
(4.4.1)
2– … qet q -
chúng ta nói rằng {Yt } là một quá trình trung bình động tự hồi quy hỗn hợp của các lệnh p và q,
tương ứng; chúng tôi viết tắt tên thành ARMA (p, q). Như thường lệ, chúng tôi thảo luận về một
trường hợp đặc biệt đầu tiên. †
- + = (4.4.2)
Yt φYt 1– et θet 1–
Để suy ra các phương trình loại Yule-Walker, trước tiên chúng ta lưu ý rằng
E et Yt)(=E [et ( 1– et
φYt 1– θet
) - + ]
= 2
σe
và
† Trong các mô hình hỗn hợp, chúng tôi giả định rằng không có yếu tố chung nào trong quá trình tự phục hồi và
đa thức trung bình động. Nếu có, chúng tôi có thể hủy chúng và mô hình sẽ
giảm xuống mô hình ARMA có bậc thấp hơn. Đối với ARMA (1,1), điều này có nghĩa là θ φ.
Machine Translated by Google
E ( ( 1– et
và 1– Yt) =E[ và 1– φYt - +
θet 1– ) ]
- = 2 2
φσe θσe
= 2 () σ φ θ -e
Nếu chúng ta nhân Phương trình (4.4.2) với Yt-k và lấy các kỳ vọng, chúng ta có
+ = [1 - θφ θ (]) 2
γ0 φγ1 σe -
- = 2
γ1 φγ0 θσe (4.4.3)
= cho k ≥ 2
γk φγk 1–
= θ2
1 ()
2 -+φθ 2
(4.4.4)
γ0 ----------------------------------- σe
1 φ2 -
(1 - θφ() φθ) -
= ------------------------------------- cho k ≥ 1
ρk (4.4.5)
φk 1– 1 2 - θφ θ2 +
Lưu ý rằng hàm tự tương quan này giảm dần theo cấp số nhân khi độ trễ k tăng lên.
Hệ số tắt dần là φ, nhưng sự phân rã bắt đầu từ giá trị ban đầu ρ1, giá trị này cũng phụ thuộc
trên θ. Điều này trái ngược với tự tương quan AR (1), tự tương quan cũng phân rã với giảm xóc
hệ số φ nhưng luôn từ giá trị ban đầu ρ0 = 1. Ví dụ, nếu φ = 0,8 và θ = 0,4, thì
ρ1 = 0,523, ρ2 = 0,418, ρ3 = 0,335, v.v. Có thể có một số hình dạng cho ρk ,
phụ thuộc vào dấu của ρ1 và dấu của φ.
Dạng quy trình tuyến tính chung của mô hình có thể thu được theo cách tương tự
dẫn đến Công thức (4.3.8). Chúng ta tìm thấy
∞
j 1–
Yt + =et () φ φ θ - et j -
, (4.4.6)
j 1 =
đó là,
= j
1– ψj () φ φ θ - cho j ≥ 1
Bây giờ chúng ta nên đề cập đến điều kiện ổn định rõ ràng φ <1 , hoặc tương đương
gốc của phương trình đặc tính AR 1 - φx = 0 phải vượt quá sự thống nhất tuyệt đối
giá trị.
Đối với mô hình ARMA (p, q) tổng quát , chúng tôi nêu các dữ kiện sau mà không cần chứng minh:
Theo điều kiện et độc lập với Yt - 1, Yt - 2, Yt - 3,…, một chất tan đứng yên cho Phương
trình (4.4.1) tồn tại nếu và chỉ khi tất cả các gốc của đặc trưng AR đều bằng φ ( x) =
0 vượt quá sự thống nhất trong mô-đun.
Nếu các điều kiện cố định được thỏa mãn, thì mô hình cũng có thể được viết dưới dạng
quá trình tuyến tính tổng quát với hệ số ψ được xác định từ
Machine Translated by Google
ψ0 1 =
ψ1 - φ1
θ1 + =
= + φ2
+ φ1ψ1 (4.4.7)
ψ2 θ2 -
.
.
.
= + +
ψj θj - φpψj p - φp 1– ψj p - 1 + ++… Φ1ψj 1–
Các phương trình tương tự có thể được phát triển cho k = 1, 2, 3, ..., q liên quan đến θ1, θ2, ..., θq. Một
thuật toán phù hợp để tính toán số của hàm tự tương quan hoàn chỉnh
được đưa ra trong Phụ lục C trên trang 85. (Thuật toán này được thực hiện trong hàm R
có tên là ARMAacf.)
Chúng ta đã thấy rằng đối với quá trình MA (1), chúng ta nhận được chính xác cùng một hàm
tự tương quan nếu θ được thay thế bằng 1 / θ. Trong các bài tập, chúng tôi tìm thấy một vấn
đề tương tự với ness nonunique cho mô hình MA (2). Sự thiếu độc đáo này của các mô hình MA, do
các hàm tự tương quan, phải được giải quyết trước khi chúng tôi cố gắng suy ra giá trị của các
tham số từ chuỗi thời gian quan sát được. Nó chỉ ra rằng sự không đồng nhất này có liên quan đến
câu hỏi dường như không liên quan được nêu tiếp theo.
Quá trình tự động phục hồi luôn có thể được biểu hiện lại dưới dạng một quá trình tuyến tính chung
thông qua các hệ số ψ để một quá trình AR cũng có thể được coi là một quá trình
trung bình động bậc nhất. Tuy nhiên, đối với một số mục đích, việc phản hồi tự động
tái phạm cũng rất thuận tiện. Mô hình trung bình động có thể được biểu thị lại như một
sự phạm tội?
Để khắc phục các ý tưởng, hãy xem xét mô hình MA (1):
- =
Yt et θet 1– (4.5.1)
Đầu tiên viết lại nó dưới dạng et = Yt + θet 1 và sau đó thay t bằng t - 1 và thay thế cho
+ Yt
Yt θ etθet 2– )+
= (1–
= + +
Yt θYt 1– θ2et 2–
θ <1 , chúng tôi có thể tiếp tục thay thế này "vô hạn" trong quá khứ và có được
Nếu biểu thức [so sánh với phương trình (4.3.7) và (4.3.8)]
= ++ +…
et Yt θYt 1– θ2Yt 2–
Machine Translated by Google
hoặc
= (- - + (4.5.2)
Yt θYt 1– θ2Yt 2– )θ3Yt
––…3–
et
Nếuθ <1 ,chúng ta thấy rằng mô hình MA (1) có thể được đảo ngược thành mô hình lặn tự động
có bậc vô hạn. Chúng tôi nói rằng mô hình MA (1) là khả nghịch nếu và chỉ θkhi . với mô
<1Đối
hình MA (q) hoặc ARMA (p, q) tổng quát , chúng tôi xác định đặc tính MA
đa thức như
= - -
- x
θ () 1 θ1 - x θ2x2 - θ3x3 … Θqxq (4.5.3)
= + + ++ (4.5.5)
Yt π1Yt 1– π2Yt 2– π3Yt 3– … Et
nếu và chỉ khi nghiệm của phương trình đặc trưng MA vượt quá 1 trong môđun. (Kết hợp
điều này với tính ổn định của mô hình AR.)
Nó cũng có thể được hiển thị rằng chỉ có một tập hợp các giá trị tham số mang lại
quá trình MA nghịch đảo với một hàm tự tương quan cho trước. Ví dụ: Yt =
et + 2et - 1 và Yt = et + ½et - 1 đều có cùng một hàm tự tương quan, nhưng chỉ có
cái thứ hai với căn 2 là khả nghịch. Kể từ đây, chúng tôi sẽ hạn chế sự chú ý của mình vào
hợp lý về mặt vật lý của các mô hình không thể đảo ngược.
Đối với mô hình ARMA (p, q) tổng quát , chúng tôi yêu cầu cả tính ổn định và tính nghịch đảo.
Chương này giới thiệu đường trung bình động tự hồi quy đơn giản nhưng rất hữu ích
(ARMA) mô hình chuỗi thời gian. Các thuộc tính thống kê cơ bản của các mô hình này là
được suy ra đặc biệt cho các trường hợp đặc biệt quan trọng của đường trung bình động của đơn đặt hàng 1 và
2 và các quy trình tự phục hồi của đơn đặt hàng 1 và 2. Các vấn đề về tính ổn định và tính nghịch đảo
đã được theo đuổi cho những trường hợp này. Các thuộc tính của mô hình ARMA hỗn hợp cũng đã
đã điều tra. Bạn nên thông thạo các thuộc tính tự tương quan của các mod els này
và các đại diện khác nhau của các mô hình.
Machine Translated by Google
Bài tập 81
BÀI TẬP
4.1 Sử dụng các nguyên tắc đầu tiên để tìm hàm tự tương quan cho quá trình tĩnh
Được định nghĩa bởi
1 1
-
Yt =5 +et 2 - đặt 1–
+
4 --et 2–
4.2 Vẽ phác các hàm tự tương quan cho các mô hình MA (2) sau đây với tham số
eters như quy
định: (a) θ1 = 0,5 và θ2
= 0,4. (b) θ1 = 1,2 và θ2 =
0,7. (c) θ1 = 1 và θ2 = 0,6.
4.3 Xác minh điều đó đối với quy trình MA (1)
= 0,5 và - = 0,5
tối đa tối thiểu ρ1
ρ1 –∞θ∞ << –∞θ∞ <<
4.4 Chứng tỏ rằng khi θ được thay thế bằng 1 / θ, hàm tự tương quan cho MA (1)
quy trình không thay đổi.
4.5 Tính toán và phác thảo các hàm tự tương quan cho mỗi mô hình AR (1) sau đây. Vẽ đồ thị
cho độ trễ đủ để chức năng tự tương quan gần như không còn hoạt động. (a) φ1 = 0,6.
(b) φ1 = 0,6. (c) φ1 = 0,95. (Thực hiện đến 20 độ trễ.) (D) φ1 = 0,3.
4.6 Giả sử rằng {Yt } là một quá trình AR (1) với 1 <φ <+1. (a)
Tìm hàm tự phương sai cho Wt = Yt = Yt - Yt 1 theo φ và
2 σe.
4.10 Phác thảo các hàm tự tương quan cho từng mô hình ARMA sau:
(a) ARMA (1,1) với φ = 0,7 và θ = 0,4.
(b) ARMA (1,1) với φ = 0,7 và θ = 0,4.
4.11 Đối với mô hình ARMA (1,2) Yt = 0,8Yt - 1 + et + 0,7et - 1 + 0,6et - 2, chứng tỏ rằng
(a) ρk = 0,8ρk 1 với k > 2. (B) ρ2 = 0,8ρ1 + 0,6 / γ0. σe
2
4.12 Xét hai quá trình MA (2), một với θ1 = θ2 = 1/6 và một quá trình khác với θ1 = 1
và θ2 =
6. (a) Chứng tỏ rằng các quá trình này có cùng một hàm tự tương
quan. (b) Làm thế nào để so sánh các căn của các đa thức đặc trưng tương ứng?
4.13 Gọi {Yt } là một quá trình đứng yên với ρk = 0 với k > 1. Chứng tỏ rằng ta phải có |
…
ρ1 | ≤ ½. (Gợi ý: Hãy xem xét Var (Yn + 1 + Yn + + Y1) và sau đó là Var (Yn + 1 -
…
Yn + Yn - 1 - ± Y1). Sử dụng thực tế là cả hai điều này phải không âm với mọi n.)
4.14 Giả sử rằng {Yt } là một quá trình tĩnh, trung bình bằng 0 với | ρ1 | <0,5 và ρk = 0 với k
> 1. Chứng tỏ rằng {Yt } phải có thể biểu diễn như một quá trình MA (1). Tức là, chứng
tỏ rằng có một chuỗi nhiễu trắng {et } sao cho Yt = et - θet - 1, trong trực
đó ρ1tràng
là cor
và et
4.15 Xem xét mô hình AR (1) Yt = φYt - 1 + et . Chứng tỏ rằng nếu | φ | = 1 quá trình không
thể đứng yên. (Gợi ý: Tính phương sai của cả hai bên.)
4.16 Xem xét mô hình AR (1) “không cố định” Yt = 3Yt 1 + et .
∞ 1
etrình AR (1).
(a) Chứng tỏ rằng
( ) thỏa
- mãn
- j=Yt (b)phương
Chứng
3
j 1 = tj +
tỏ rằng quá trình được xác định trong phần (a) là đứng yên. (c)
4.17 Xét một quá trình thỏa mãn phương trình AR (1) Yt = ½Yt - 1 + et .
…
(a) Chứng tỏ rằng Yt = 10 (½) t + et + ½et - 1 + (½) 2et - 2 + là một nghiệm của AR (1)
phương
trình. (b) Dung dịch đã cho trong phần (a) có đứng yên không?
4.18 Hãy xem xét một quá trình thỏa mãn phương trình AR (1) trung bình bằng 0, Yt = φYt - 1 +
et với 1 <φ <+1. Gọi c là hằng số khác không bất kỳ và xác định Wt = Yt + cφt . (a)
Chứng tỏ rằng E (Wt ) = cφt . (b) Chứng tỏ rằng {Wt } thỏa mãn phương trình AR (1) “đứng
Bài tập 83
lớn hơn 1 ở giá trị tuyệt đối ”tương đương với tuyên bố“ Các gốc của xp φ1xp … φp 0 nhỏ
- 1– - 2– - - =
φ2xp đối. ”là(Gợi
hơn 1 ở giá trị tuyệt căn ý:
củaNếu G là trình
phương căn của
kiamột phương trình thì 1 / G có phải
không?)
4.23 Giả sử rằng {Yt } là một quá trình AR (1) với ρ1 = φ. Xác định dãy {bt } là bt = Yt - φYt
+ 1. (a) Chứng tỏ rằng Cov (bt , bt - k) = 0 với mọi t và k. (b) Chứng tỏ rằng Cov (bt ,
Yt + k) = 0 với mọi t và k > 0.
4.24 Gọi {et } là một quá trình nhiễu trắng có phương sai đơn vị. Hãy xem xét một quá trình
bắt đầu tại thời điểm t = 0 và được định nghĩa một cách đệ quy như sau. Cho Y0 = c1e0
và Y1 = c2Y0 + e1. Sau đó cho Yt = φ1Yt - 1 + φ2Yt - 2 + et với t > 1 như trong AR (2) pro
thuế.
Y0. (b) Chứng tỏ rằng với t > 0, ta có E (Yt ) = φt μ0. (c) Chứng tỏ rằng
t > 0
2
2 +φ2t σ0 cho φ
1 φ2t -
----------------
σe 1 φ2 -
1
=
Var Yt ()
2
tσe2 +
σ0 cho φ 1 =
(d) Giả sử bây giờ μ0 = 0. Lập luận rằng, nếu {Yt } đứng yên, ta phải có .
φ 1 (e) Tiếp tục giả sử μ0 = 0, chứng tỏ rằng, nếu {Yt } đứng yên thì 2
<1. 1 φ2 Var Yt () σe = ⁄ () - và do đó chúng ta phải có | φ |
Machine Translated by Google
Phụ lục B: Khu vực ổn định cho một quá trình AR (2)
Trong trường hợp bậc hai, các nghiệm nguyên của đa thức đặc trưng bậc hai dễ dàng
được tìm thấy là
φ1 ± φ1 2 +
4φ2
-------------------------------------
(4.B.1)
2φ2 -
Đối với tính cố định, chúng tôi yêu cầu các gốc này vượt quá 1 giá trị tuyệt đối. Chúng tôi bây giờ
cho thấy rằng điều này sẽ đúng nếu và chỉ khi ba điều kiện được thỏa mãn:
Chứng minh: Cho số nghịch đảo của các gốc được ký hiệu là G1 và G2. sau đó
2
2φ2 2φ2 φ1 - 4φ2 φ1 ++
G1 = ----------------------------------------- = ----------------------------------------- ------------------------------------------
2 2 2
φ1 - 4φ2 φ1
+ - φ1 - 4φ2 φ1
+ - φ1
φ1 - 4φ2 ++
2 2
(2φ2 φ1 - 4φ2 φ1
) ++ φ1 4φ2
φ1 + -
2 2
= ------------------------------------------------- ------- = -------------------------------------
φ1 - ( φ1 4φ2 ) + 2
Tương tự,
2
φ1 4φ2 φ1
++
G2 = -------------------------------------
Bây giờ chúng ta chia chứng minh thành hai trường hợp tương ứng với căn nguyên thực và phức.
2
Rễ sẽ là thực nếu và chỉ khi 4φ2 + ≥ 0φ1 .
I. Rễ Thực: Gi cho i = 1 và 2 nếu và chỉ khi
<1
2 2
φ1 4φ2 φ1 + - φ1 4φ2
φ1 ++
------------------------------------- 1
- 1<<< -------------------------------------
2 2
hoặc
2
- 2<-φ1 φ1 < φ1 + φ12 + 2 < .
4φ2 + 4φ2
2
Chỉ xem xét bất đẳng thức đầu tiên. Bây giờ - <+ - φ1
2 2 2 φ1 4φ2 nếu và chỉ khi
φ1 4φ2 + φ1 <2+ nếu và chỉ khi φ1 < 2 + + 4 nếu và chỉ khi ,
4φ2 + φ1 4φ1 φ 2 φ1 <1+
hoặc 1 <.
φ2 φ1 -
+
Bất đẳng thức φ1 4φ2 Các φ12 + trình 2 <
được xử lý tương tự và dẫn đến φ2 φ1 + 1 <.
phương
2
≥ 0
này cùng với trường hợp căn thức thực φ1 4φ2 + xác định vùng đứng yên cho
được trình bày trong Hình 4.17.
2
II. Rễ phức tạp: Bây giờ φ1 <0 .
4φ2 + Ở đây2 G1 và G2 sẽ là2 cổng conju
2 phức2 tạp và <1
G1 G2 . Nhưng mà G1 -
nếu và chỉ khi <1 =
= G1
[ φ1 + ( φ1 4φ2 ) -] ⁄ 4
. 1 <0
2 φ2 - =+ sao
xác cho
định
φ2phần
> 1– Điều này cùng với bất đẳng thức φ 4φ2
của vùng đứng yên đối với các gốc phức được thể hiện trong Hình 4.17 và thiết lập phương
trình (4.3.11). Điều này hoàn thành bằng chứng.
Machine Translated by Google
Gọi {Yt } là một quá trình ARMA (p, q) cố định, khả nghịch . Nhớ lại rằng chúng ta luôn có thể viết
một quá trình như vậy ở dạng quy trình tuyến tính chung như
∞
Yt = (4.C.1)
ψj et j
- j 0 =
trong đó trọng số ψ có thể thu được một cách đệ quy từ Công thức (4.4.7), trên trang 79.
Sau đó chúng tôi có
∞
( = = 2 cho k ≥ 0 (4.C.2)
E Yt k + et ) E ψj etkj - + et ψkσe
j 0 =
P q
= =
( γk E)YtE k φj
Yt + Ytkj - + - θj etkj - + Yt
j 1 =
j 0 =
(4.C.3)
P q
=
2 φj γk -j σe
- θj ψj k -
j 1 = jk =
trong đó θ0 = 1 và tổng cuối cùng không có nếu k > q. Đặt k = 0, 1,…, p và sử dụng γ k =
= + ++ …
- pγp
( θ0σe 2
θ1ψ1 … + ++
γ0 φ1γ1 φ2γ2 θqψq )
= + ++ …
- pγp
( θ11–
θ2ψ1 2 + ++
γ1 φ1γ0 φ2γ1 σe … θqψq 1– ) (4.C.4)
.
.
.
= … θqψq p - +)
2 ++
γp φ1γp 1– φ2γp+ 2–
++ trong … 1+
- ( θp θp Pγ0ψ1 σe
đó θj = 0 nếu j > q.
2
Đối với một bộ giá trị tham số nhất định, σe , của φ, và của θ (và do đó là của ψ), chúng ta có thể giải quyết
phương trình tuyến tính để thu được γ0, γ1 ,…, γp. Các giá trị của γk đối với k > p sau đó có
thể được đánh giá từ đệ quy trong Công thức (4.4.8), trên trang 79. Cuối cùng, ρk thu được từ ρk
= γk / γ0.
Machine Translated by Google
CHƯƠNG 5
Bất kỳ chuỗi thời gian nào không có giá trị trung bình không đổi theo thời gian đều là không cố định. Các mô hình của biểu mẫu
Yt = μt + Xt
trong đó μt là một hàm trung bình không thay đổi và Xt là một chuỗi cố định bằng 0, đã được
xem xét trong Chương 3. Như đã nêu ở đó, các mô hình như vậy chỉ hợp lý nếu có lý do chính
đáng để tin rằng xu hướng xác định là phù hợp “mãi mãi”. Có nghĩa là, chỉ vì một phân đoạn
của chuỗi có vẻ như nó đang tăng (hoặc giảm) gần đúng một cách tuyến tính, chúng ta có tin
rằng mức độ tuyến tính là nội tại của quá trình và sẽ tồn tại trong tương lai không? Thông
thường trong các ứng dụng, đặc biệt là trong kinh doanh và kinh tế, chúng ta không thể giả
định một cách hợp pháp một xu hướng xác định. Nhớ lại bước đi ngẫu nhiên được hiển thị trong
Hình 2.1, trên trang 14. Chuỗi thời gian dường như có một xu hướng tăng mạnh có thể là tuyến
tính theo thời gian. Tuy nhiên, cũng cần nhớ lại rằng quá trình đi bộ ngẫu nhiên có một ý
nghĩa, giá trị trung bình bằng 0 và không có xu hướng xác định nào cả.
Ví dụ, hãy xem xét giá hàng tháng của một thùng dầu thô từ tháng 1 năm 1986 đến tháng 1
năm 2006. Hình 5.1 hiển thị biểu đồ chuỗi thời gian. Loạt này hiển thị sự thay đổi đáng kể,
đặc biệt là kể từ năm 2001, và một mô hình tĩnh dường như không hợp lý. Chúng ta sẽ khám phá
ra trong các Chương 6, 7 và 8 rằng không có mô hình xu hướng xác định nào hoạt động tốt cho
loạt bài này nhưng một trong những mô hình phi tĩnh đã được mô tả là chứa các xu hướng ngẫu
nhiên có vẻ hợp lý. Chương này thảo luận về các mô hình như vậy. May mắn thay, như chúng ta
sẽ thấy, nhiều xu hướng ngẫu nhiên có thể được mô hình hóa với tương đối ít tham số.
87
Machine Translated by Google
Hình 5.1 Giá dầu hàng tháng: Tháng 1 năm 1986 – Tháng 1 năm 2006
thùng
mỗi
Giá
60
50
40
30
20
10
Thời gian
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> dữ liệu (oil.price)
> plot (oil.price, ylab = 'Price per Barrel', type = 'l')
Chúng tôi đã thấy rằng giả định et là một “sự đổi mới” thực sự (nghĩa là et không liên quan đến
Yt - 1, Yt - 2,…), chúng ta phải có | φ | <1. Chúng ta có thể nói gì về các giải pháp cho Phương trình
Yt 3Yt 1– et + = (5.1.2)
Lặp lại quá khứ như chúng ta đã làm trước khi mang lại kết quả
Yt =et
+ 3et 1– +32et
++ + 2– … 3t 1– e1 3t Y0 (5.1.3)
Chúng tôi thấy rằng ảnh hưởng của các giá trị trong quá khứ xa xôi của Yt và et không hề mất đi — thực sự,
trọng số áp dụng cho Y0 và e1 lớn lên theo cấp số nhân. Trong Hình 5.2, chúng tôi cho thấy
giá trị cho một mô phỏng rất ngắn của một chuỗi như vậy. Ở đây, chuỗi tiếng ồn trắng là
được tạo ra dưới dạng các biến bình thường tiêu chuẩn và chúng tôi sử dụng Y0 = 0 làm điều kiện ban đầu.
t 12345678
Hình 5.3 cho thấy sơ đồ chuỗi thời gian của mô phỏng AR (1) bùng nổ này.
•
Yt
1000
800
600
400
200
0
•
•
• • • • •
12345678
Thời gian
Hành vi bùng nổ của một mô hình như vậy cũng được phản ánh trong phương sai của mô hình
và các hàm hiệp phương sai. Chúng có thể dễ dàng tìm thấy là
1 2
= - ()
9 tσ 1– 8 (5.1.4)
Var Yt () e
và
3k 2
, k - = (5.1.5)
() Yt
Cov Yt ----- 9 tk - () σ 1– e
số 8
9t k - 1–
, k - = 3k
≈ 1 fhoặc t lớn và k vừa phải
() Yt
Corr Yt
--------------------
9t 1–
Tăng trưởng theo cấp số nhân chung hoặc hành vi bùng nổ sẽ xảy ra cho bất kỳ φ
sao cho | φ | > 1. Một loại bất ổn hợp lý hơn thu được khi φ = 1. Nếu φ = 1,
phương trình mô hình AR (1) là
Yt Yt et + = (5.1.6)
Đây là mối quan hệ được thỏa mãn bởi quá trình đi bộ ngẫu nhiên của Chương 2 (Phương trình
(2.2.9) nơi trang 12). Ngoài ra, chúng ta có thể viết lại điều này dưới dạng
Yt et = (5.1.7)
Machine Translated by Google
đâu là điểm - =
Ytkhác
Yt Yt 1–đầu tiên của Yt .
biệt Đi bộ ngẫu nhiên sau đó dễ dàng
được mở rộng sang một mô hình tổng quát hơn mà điểm khác biệt đầu tiên là một số điểm chuyên nghiệp cố
Một số tập hợp giả định hơi khác nhau có thể dẫn đến các mô hình có dif đầu tiên
ference là một quá trình tĩnh. Giả sử
Yt Mt Xt + = (5.1.8)
trong đó Mt là một chuỗi chỉ thay đổi chậm theo thời gian. Ở đây Mt có thể là
xác định hoặc ngẫu nhiên. Nếu chúng ta giả định rằng Mt xấp xỉ không đổi trên mọi
hai mốc thời gian liên tiếp, chúng tôi có thể ước tính (dự đoán) Mt tại t bằng cách chọn β0 sao cho
1
- 2
(Yt j - β0, t )
j 0 =
^ 1 1 1
- = == + 1-2 -
Yt M Yt - _
()Yt Yt
- - (Yt Yt 1-2 )
2 Yt
--
t
_
†
Đây là bội số không đổi của hiệu số đầu tiên, Yt .
Nhóm giả định thứ hai có thể là Mt trong phương trình (5.1.8) là ngẫu nhiên và
thay đổi chậm theo thời gian được điều chỉnh bởi mô hình đi bộ ngẫu nhiên. Ví dụ, giả sử,
cái đó
=
Yt Mt et + ith w Mt Mt 1– εt + = (5.1.9)
Y + =
t Mt e t
- +εt= et et 1–
Trong một trong hai tình huống này, chúng tôi được dẫn đến việc nghiên cứu Yt như một quá trình tĩnh.
Quay trở lại chuỗi thời gian giá dầu, Hình 5.4 hiển thị biểu đồ chuỗi thời gian của
sự khác biệt của logarit của chuỗi đó. ‡ Chuỗi sai khác trông tĩnh hơn nhiều khi
so sánh với chuỗi thời gian ban đầu được trình bày trong Hình 5.1, trên trang 88.
† Ghi nhãn đầy đủ hơn về sự khác biệt này sẽ là sự khác biệt đầu tiên ở độ trễ 1. ‡ Trong Phần
5.4 trên trang 98, chúng ta sẽ thấy lý do tại sao logarit thường là một phép biến đổi thuận tiện
sự.
Machine Translated by Google
(Chúng ta cũng sẽ thấy ở phần sau rằng có những điểm ngoại lệ trong loạt bài này cần được xem xét để
Hình 5.4 Chuỗi Chênh lệch của Nhật ký Thời gian Giá Dầu
(Giá)
trong
nhật
Thay
đổi
ký
0,2
0,4
0,4
0,2
0,0
Thời gian
> plot (diff (log (oil.price)), ylab = 'Change in Log (Price)', type = 'l')
Chúng tôi cũng có thể đưa ra các giả định dẫn đến các mô hình khác biệt thứ hai đứng yên.
Một lần nữa, chúng tôi giả định rằng Phương trình (5.1.8) ở trang 90 được giữ nguyên, nhưng bây giờ giả sử rằng
Mt là liên quan đến thời gian trong ba mốc thời gian liên tiếp. Bây giờ chúng tôi có thể ước tính (dự đoán) Mt tại
thời điểm giữa t bằng cách chọn β0, t β1, t và để giảm thiểu
1
2
(Yt +
j - - ( β0, t jβ1, t ))
j 1– =
^ + +
Yt 1+ Yt Yt 1–
- - = Yt
Yt M t
-------------------------------------------------- 3
1
= ( Yt 1+ 2Yt - + Yt 1– )
–--3
1
= ( Y )
–-- 3 t 1+
1
= 2 Yt(1+ )
–-- 3
bội số không đổi của hiệu số thứ hai ở giữa của Yt . Lưu ý rằng chúng tôi đã khác nhau
hai lần, nhưng cả hai sự khác biệt đều ở độ trễ 1.
Ngoài ra, chúng tôi có thể giả định rằng
Machine Translated by Google
= et where, +
Yt Mt Mt Mt= 1– Wt + nd Wt Wt 1– εt + =
một
(5.1.11)
với chuỗi thời gian tiếng ồn trắng độc lập {et } và {εt }. Đây là xu hướng ngẫu nhiên Mt là
sao cho “tốc độ thay đổi”, Mt , đang thay đổi chậm theo thời gian. sau đó
Y =
t Mt+ e = +Wt e
t t
và
2Yt Wt 2et + =
() εt et()et+- 1–
= -et 1– et 2– -
= +
εt -
et 2et 1– + et 2–
có chức năng tự tương quan của một quá trình MA (2). Điểm quan trọng là
điểm khác biệt thứ hai của quá trình không tĩnh {Yt } là tĩnh. Điều này dẫn chúng ta đến
định nghĩa chung về chuỗi thời gian trung bình động tích hợp tự động hồi phục quan trọng
các mô hình.
Chuỗi thời gian {Yt } được cho là tuân theo đường trung bình động tích hợp tự động hồi phục
mô hình nếu sự khác biệt thứ d Wt = dYt là một quá trình ARMA tĩnh. Nếu {Wt } theo sau một
Mô hình ARMA (p, q) , chúng ta nói rằng {Yt } là một quá trình ARIMA (p, d, q) . May mắn thay, cho
mục đích thực tế, chúng ta thường có thể lấy d = 1 hoặc nhiều nhất là 2.
Sau đó, hãy xem xét một quy trình ARIMA (p, 1, q) . Với Wt = Yt - Yt - 1, chúng ta có
= 1– φ2Wt+2–++
Wt φ1Wt + et - -
(5.2.1)
… ΦpWt p - 1et 1– θ2et
- -
2– … qet q -
hoặc, xét về chuỗi quan sát,
Yt -Yt 1– = ( φ1 Yt 1–2–Yt) φ - +
( 2 Yt 2– Yt- 3– ) + + (…
… φp Ytq - p - -
θqet Yt ) p - 1 -
- - - -
et + θ1et 1– θ2et 2–
Yt = +++…
) + Yt
1 φ1 ((
1– φ2 φ1 ) - Yt 2– φ3 φ2
( ) - Yt 3–
(5.2.2)
+ ( p φp
- 1– ) Yt p -- φpYt p - 1 - - et
+ -
θ1et 1– θ2et 2– - -
… Qet q -
Chúng tôi gọi đây là dạng phương trình sai khác của mô hình. Lưu ý rằng nó dường như là một
Quá trình ARMA (p + 1, q) . Tuy nhiên, đa thức đặc trưng thỏa mãn
1+
- - (φp
φ3φp
)φ2-1–
(-…
x3) xp + - -
x2φ11 - (1 φ1 () +
) x
- φ2 φpxp
-
- = 1(-…
φ1 φpxp
- x φ2x2
) (1 - x )
Machine Translated by Google
mà có thể dễ dàng kiểm tra. Việc phân tích nhân tử này rõ ràng cho thấy căn tại x = 1,
ngụ ý sự phi thường. Tuy nhiên, các rễ còn lại là rễ của đặc tính
đa thức của quá trình tĩnh Yt .
Các đại diện rõ ràng của chuỗi được quan sát dưới dạng Wt hoặc màu trắng
chuỗi nhiễu bên dưới Wt khó hơn trong trường hợp tĩnh. Vì các quá trình tĩnh không nonsta không
ở trạng thái cân bằng thống kê, chúng ta không thể giả định rằng chúng hoàn toàn đi vào quá khứ
t thời
hoặc chúng bắt đầu khi chúng bắt đầu vào một - = điểm
∞ . Tuy
nàonhiên, chúng hạn,
đó, chẳng tôi có thểthời
tại và sẽ giả chúng
điểm định rằng
t m– tiện,
ta quan sát chuỗi đầu tiên. Để thuận = khác
chúng
nhau lấy-–MYt
ta Yt Yt =-sớm =hơn
01 với thời
Wtt có m.điểm
< thể được tgiải
Phương =trình
1, lúc
bằng
enceđó
cách
Yt = Wj
(5.2.3)
j m– =
t m + (5.2.4)
= ()
Wt jj 1+
- j 0 =
Các biểu diễn này được sử dụng hạn chế nhưng có thể được sử dụng để điều tra hiệp phương sai
thuộc tính của các mô hình ARIMA và cũng để thể hiện Yt theo chuỗi tiếng ồn trắng
{et }. Chúng tôi trì hoãn các tính toán cho đến khi chúng tôi đánh giá các trường hợp cụ thể.
Nếu quy trình không chứa các điều khoản tự động hồi tố, chúng tôi gọi đó là quy trình di chuyển tích hợp
trung bình và viết tắt tên thành IMA (d, q). Nếu không có điều khoản trung bình động nào,
chúng tôi ký hiệu mô hình là ARI (p, d). Trước tiên, chúng tôi xem xét chi tiết IMA quan trọng (1,1)
người mẫu.
Mô hình IMA (1,1) đơn giản thể hiện thỏa đáng nhiều chuỗi thời gian, đặc biệt
những phát sinh trong kinh tế và kinh doanh. Ở dạng phương trình sai khác, mô hình là
- + =
Yt Yt 1– et θet 1– (5.2.5)
Để viết Yt một cách rõ ràng dưới dạng một hàm của các giá trị nhiễu hiện tại và quá khứ, chúng ta sử dụng Phương trình
(5.2.3) và thực tế là Wt = et - θet - 1 trong trường hợp này. Sau khi sắp xếp lại một chút, chúng tôi có thể
viết
Yt
= +et () 1et- 1–
θ
+ ()θ 1và- 2– ++ … () 1e -– θm θe– - 1 m - (5.2.6)
Lưu ý rằng trái ngược với các mô hình ARMA tĩnh của chúng tôi, trọng số của tiếng ồn trắng
các điều khoản không biến mất khi chúng ta đi vào quá khứ. Vì chúng ta giả sử rằng m <1 và 0 < t,
chúng ta có thể nghĩ một cách hữu ích về Yt chủ yếu là sự tích lũy có trọng số như nhau của một số
lượng lớn các giá trị nhiễu trắng.
Machine Translated by Google
Từ công thức (5.2.6), chúng ta có thể dễ dàng suy ra các phương sai và tương quan. Chúng ta có
2
= 1 +θ2
()] t+ m
(1+ -σe
θ 2 [) (5.2.7)
Var Yt ()
và
Corr Yt
1 - θ +θ2+ (1 - θ 2 )() tmk - +
() Yt
, k - = ------------------------------------------------- ---------------------------
1 2 /
[(
Var Yt ( ) Var Yt k - )]
tmk - + (5.2.8)
≈ --------------------
t m +
Chúng ta thấy rằng khi t tăng, Var Yt () tăng và có thể khá lớn. Ngoài ra, mối tương quan
giữa Yt và Yt - k sẽ rất dương đối với nhiều độ trễ k = 1, 2,….
Các giả định của phương trình (5.1.11) dẫn đến mô hình IMA (2,2). Trong phương trình khác biệt
hình thức, chúng tôi có
= - -
2Yt et θ1et 1– θ2et 2–
hoặc
=
Yt 2Yt 1– Yt -2– + et -θ1et 1– -
(5.2.9)
θ2et 2–
Biểu diễn của Công thức (5.2.4) có thể được sử dụng để biểu thị Yt dưới dạng et, et - 1,….
t m +
+ = -
Yt et ψj et j () θ [ t m + + 1 1 + (t m + ) ] e–
θ2 1 m -
- j 1 = (5.2.10)
-
()
1 θ t m
2e– 2 +
m +
-
trong đó ψj = 1 + θ2 + (1 - θ1 - θ2) j với j = 1, 2, 3,…, t + m. Một lần nữa, chúng tôi thấy rằng
Trọng số ψ không chết đi mà tạo thành một hàm tuyến tính của j.
Một lần nữa, các phương sai và tương quan đối với Yt có thể nhận được từ biểu diễn
được đưa ra trong Công thức (5.2.10), nhưng các phép tính rất tẻ nhạt. Chúng tôi chỉ cần lưu ý rằng
phương sai của Yt tăng nhanh theo t và một lần nữa () gầnCorr , ktất cả
bằngYt1 Yt
với
- vừa phải k.
Kết quả mô phỏng quá trình IMA (2,2) được hiển thị trong Phụ lục 5.5.
Lưu ý sự thay đổi trơn tru trong các giá trị quy trình (và sự không quan trọng của giá trị trung bình bằng 0
hàm số). Phương sai ngày càng tăng và các mối tương quan láng giềng mạnh mẽ, tích cực
chi phối sự xuất hiện của cốt truyện chuỗi thời gian.
Machine Translated by Google
•
30
••• ••••••••
••••••••••••• •••••••
•• ••
•• ••
20
•
••• ••
••
••••
••
•••
(2,2)
phỏng
IMA
Mô
• •
••
10
5
0
•••
0 10 20 30 40 50 60
Thời gian
Hình 5.6 cho thấy biểu đồ chuỗi thời gian của sự khác biệt đầu tiên của chuỗi mô phỏng.
Chuỗi này cũng không cố định, vì nó được điều chỉnh bởi mô hình IMA (1,2).
Hình 5.6 Sự khác biệt đầu tiên của Dòng IMA được mô phỏng (2,2)
4
•
• •
• • •
2
• •••
• • •• •
• •• • • • •
• ••
0 •• ••
•• • •
•••••
•
• ••
• ••
••
• •
tiên
biệt
khác
đầu
Sự • • • •
• ••
• •• •
•
2
4
0 10 20 30 40 50 60
Thời gian
Cuối cùng, sự khác biệt thứ hai của các giá trị chuỗi IMA (2,2) được mô phỏng được vẽ
trong Hình 5.7. Các giá trị này phát sinh từ mô hình MA (2) đứng yên với θ1 = 1 và θ2 =
0,6. Từ Công thức (4.2.3) ở trang 63, các phép tự tương quan lý thuyết cho mô hình này là
ρ1 = 0,678 và ρ2 = 0,254. Những giá trị tương quan này dường như được phản ánh trong sự
xuất hiện của cốt truyện chuỗi thời gian.
Machine Translated by Google
Hình 5.7 Sự khác biệt thứ hai của Dòng IMA được mô phỏng (2,2)
4
2 • • •
• • • •• •
•• • • • •• • • • • •
• • •
• • •
• •
• • • •• • ••• • • • •• • •
•
biệt
khác
lần
Hai
• • • • • • •
• •
0 4
2
• • •
• •
10 20 30 40 50 60
Thời gian
hoặc
= -
()φ 1Yt+ 1– φYt 2– + (5.2.12)
Yt et
ở đâu | φ | <1. †
Để tìm trọng số trong trường hợp này, chúng ta sẽ sử dụng một kỹ thuật sẽ tổng quát hóa thành
mô hình ARIMA tùy ý. Có thể chỉ ra rằng các trọng số ψ có thể nhận được bằng cách cân
bằng các lũy thừa của x trong danh tính:
- -
( 1 φ1 - x φ2x2 - … Φpxp ) () () 1 -)dx 1
θqxq 1 +θ1
ψ1x
+- 3xψ2x2
…
θ2x2 ψ3x ++- = (-…
- θ3x3
(5.2.13)
-
Trong trường hợp của chúng tôi, mối quan hệ này giảm xuống
()()1 (- φx 1 - x 1+ψ1x
+ 3ψ2x2
… 1 =
ψ3x ++ )
hoặc
) ++ (φ
[1 1 - (] x φx2 1+ ψ1x
+ + ψ2x2
3 … 1ψ3x
= + )
Tương tự như lũy thừa của x trên cả hai vế, chúng ta thu được
† Lưu ý rằng đây giống như một mô hình AR (2) đặc biệt. Tuy nhiên, một trong những gốc của
đa thức đặc trưng AR (2) tương ứng là 1 và điều này không được phép trong AR cố định (2)
các mô hình.
Machine Translated by Google
5.3 Các điều khoản không đổi trong các mô hình ARIMA 97
- ()φ 1ψ1+ + 0 =
φ -() ψ 1 + φ 1+ ψ2
= 0
và nói chung,
=
ψk () ψ 1 + φ k 1– φψk 2–
- cho k ≥ 2 (5.2.14)
với ψo = 1 và ψ1 = 1 + φ. Đệ quy này với các giá trị bắt đầu cho phép chúng tôi tính toán như
nhiều trọng lượng ψ khi cần thiết. Nó cũng có thể được chỉ ra rằng trong trường hợp này, một giải pháp rõ ràng
(Ví dụ, có thể dễ dàng chứng minh rằng biểu thức này thỏa mãn Công thức (5.2.14).
5.3 Các điều khoản không đổi trong các mô hình ARIMA
Đối với mô hình ARIMA (p, d, q) , dYt = Wt là quá trình ARMA (p, q) tĩnh . Giả định stan
dard của chúng tôi là các mô hình tĩnh có giá trị trung bình bằng 0; đó là, chúng tôi thực sự
làm việc với độ lệch so với giá trị trung bình không đổi. Giá trị trung bình của hằng số khác
không, μ, trong mô hình ARMA tĩnh {Wt } có thể được điều chỉnh theo một trong hai cách. Chúng ta có thể
giả sử
=
( Wt - μ φ1 Wt 1– ) φ - +μ (++ () - Wt
μ… 2–
φp Wt 2 p -) - μ
- - -
et + 1et 1– θ2et 2– -… qet q -
Ngoài ra, chúng ta có thể đưa một số hạng không đổi θ0 vào mô hình như sau:
+ =φ1Wt
Wt θ0 + ++
1– φ2Wt 2– … PWt p -
+ et
- θ1et 1– θ2et 2– - - -
… qet q -
Lấy các giá trị mong đợi trên cả hai mặt của biểu thức sau, chúng tôi thấy rằng
θ0 +φ1= φ2
(μ … φp ) +++ μ
để có thể
θ0
μ = -------------------------------------------------
- -
(5.3.16)
1 φ1 φ2 - -… φp
- -
= μ 1 φ1 φ2 - -… φp )
( θ0 (5.3.17)
Vì các đại diện thay thế là tương đương, chúng tôi sẽ sử dụng bất kỳ thông số nào
thuận tiện.
Machine Translated by Google
Ảnh hưởng của ý nghĩa khác không đối với Wt trên chuỗi Yt không khác biệt sẽ như thế nào?
Hãy xem xét trường hợp IMA (1,1) với một số hạng không đổi. Chúng ta có
= + θet
Yt Yt 1– θ0 et + -1–
hoặc
Wt θ0- et
+ et
= 1–
Bằng cách thay thế vào Công thức (5.2.3) trên trang 93 hoặc bằng cách lặp lại quá khứ, chúng tôi
tìm thấy điều đó
= +
Yt et () 1 - 1–
θ et + ()θ 1và- 2– ++ …-(1 - θ e –) m θe– ( t 1 m -
(5.3.18)
+ mθ+0+ 1)
So sánh điều này với Công thức (5.2.6), chúng ta thấy rằng chúng ta có thêm một định thức tuyến tính
Sau đó, một đại diện tương đương của quá trình sẽ là
Yt = +Yt+' t
β0 β1
' '
đâu là chuỗi
Yt IMA (1,1) với E Yt () = 0 Evà( Y = β1. t )(Đối
dYtvới mô
q) tổng quát trong đó E ) hình ARIMA 0,
(p,có
d,thể lập luận rằng Yt =
' '
Yt μt + , trong đó μt là đa thức xác định bậc d và là ARIMA (p,Ytd, q)
'
với E =Yt0. Với d = 2 và θ0 0, một xu hướng bậc hai sẽ được ngụ ý.
Chúng tôi đã thấy sự khác biệt có thể là một chuyển đổi hữu ích để đạt được sự ổn định như thế nào.
Tuy nhiên, phép biến đổi logarit cũng là một phương pháp hữu ích trong một số trường hợp nhất định.
Chúng tôi thường xuyên gặp phải các chuỗi trong đó sự phân tán gia tăng dường như được liên kết với
cấp độ cao hơn của chuỗi — cấp độ của chuỗi càng cao, thì càng có nhiều biến thể
xung quanh mức đó và ngược lại.
Cụ thể, giả sử rằng Yt > 0 với mọi t và
E Yt () μt =
và Var Yt () μt = σ (5.4.1)
sau đó
2
và Var () σ log ≈
E []
Yt μ log ()
log≈ () t Yt () (5.4.2)
Những kết quả này sau khi lấy các giá trị và phương sai mong đợi của cả hai bên của
(Taylor) mở rộng
Yt μt -
≈ + ---------------
Nhật ký Yt () μt log ()
μt
Nói cách khác, nếu độ lệch chuẩn của chuỗi tỷ lệ với mức của chuỗi,
sau đó biến đổi sang logarit sẽ tạo ra một chuỗi có độ biến thiên xấp xỉ không đổi
theo thời gian. Ngoài ra, nếu mức độ của chuỗi thay đổi gần như theo cấp số nhân, thì
Machine Translated by Google
chuỗi được biến đổi log sẽ thể hiện xu hướng thời gian tuyến tính. Do đó, chúng ta có thể muốn lấy
những điểm khác biệt đầu tiên. Một tập hợp các giả định thay thế dẫn đến sự khác biệt của dữ liệu đã ghi
theo sau.
Giả sử Yt có xu hướng thay đổi tỷ lệ phần trăm tương đối ổn định từ một khoảng thời gian đến
tiếp theo. Cụ thể, giả sử rằng
=
Yt 1 Xt
) (+ Yt 1–
trong đó 100Xt là phần trăm thay đổi (có thể âm) từ Yt-1 đến Yt . sau đó
Yt
Yt log () - log () Yt 1– = log -----------
Yt 1–
= log ( 1 +Xt )
Nếu Xt bị hạn chế, giả sử, | Xt | <0,2 (nghĩa là phần trăm thay đổi tối đa là ± 20%),
sau đó, để gần đúng, log (1 + Xt ) ≈ Xt . Do đó,
sẽ tương đối ổn định và có lẽ được mô hình hóa tốt bởi một quá trình tĩnh. Thông báo rằng
chúng tôi ghi nhật ký trước và sau đó tính toán sự khác biệt đầu tiên — thứ tự quan trọng. Trong tài chính
văn học, sự khác biệt của logarit (tự nhiên) thường được gọi là lợi nhuận.
Ví dụ, hãy xem xét chuỗi thời gian được hiển thị trong Phụ lục 5.8. Loạt bài này mang lại cho
tổng lượng điện hàng tháng được tạo ra ở Hoa Kỳ tính bằng hàng triệu kilowatt giờ.
Các giá trị cao hơn hiển thị nhiều biến thể hơn đáng kể so với các giá trị thấp hơn.
Điện
lực
350000
250000
150000
Thời gian
Hình 5.9 hiển thị biểu đồ chuỗi thời gian của logarit của các giá trị điện.
Lưu ý rằng số lượng biến động xung quanh xu hướng tăng hiện đồng đều hơn nhiều
trên các giá trị cao và thấp của chuỗi.
Biểu đồ 5.9 Chuỗi thời gian Đồ thị lôgarit của các giá trị điện
12,8
12.4
(điện)
Nhật
ký
12.0
Thời gian
Sự khác biệt của logarit của các giá trị điện được hiển thị trong Hình ảnh minh họa
5.10. Trên cơ sở của biểu đồ này, chúng ta có thể xem xét một mô hình cố định là thích hợp.
Hình 5.10 Sự khác biệt của Logarit đối với chuỗi thời gian điện
0,1
(điện)
Nhật
biệt
khác
của
ký
Sự
0,1
0,2
0,0
Thời gian
Một họ các phép biến đổi linh hoạt, các phép biến đổi sức mạnh, đã được giới thiệu bởi
Box và Cox (1964). Đối với một giá trị nhất định của tham số λ, phép biến đổi được xác định
qua
xλ 1–
--------------
cho λ 0
= λ (5.4.4)
g x ()
nhật
x cho λ 0 =
ký
Thuật ngữ xλ là phần quan trọng của biểu thức đầu tiên, trừ 1 và chia
bởi λ làm cho g (x) thay đổi thuận lợi khi λ tiến gần đến 0. Trên thực tế, một đối số giải tích †
cho thấy rằng dưới dạng λ 0 , (xλ - 1) / λ log (x). Chú ý rằng λ = ½ tạo ra căn bậc hai
phép biến đổi hữu ích với dữ liệu giống Poisson và λ = 1 tương ứng với một nghịch đảo
sự biến đổi.
Việc chuyển đổi công suất chỉ áp dụng cho các giá trị dữ liệu dương. Nếu một số giá trị
là âm hoặc 0, một hằng số dương có thể được thêm vào tất cả các giá trị để làm cho chúng
tất cả đều tích cực trước khi thực hiện chuyển đổi điện năng. Sự thay đổi thường được xác định một
cách cẩn thận. Ví dụ: đối với dữ liệu đánh bắt không âm trong sinh học, sự xuất hiện của các số không là
thường được xử lý bằng cách thêm một hằng số bằng giá trị dữ liệu dương nhỏ nhất vào tất cả
các giá trị dữ liệu. Một cách tiếp cận thay thế bao gồm sử dụng các phép biến đổi áp dụng cho
bất kỳ dữ liệu nào — tích cực hay không. Một hạn chế của cách tiếp cận thay thế này là các diễn giải
của các phép biến đổi như vậy thường ít đơn giản hơn so với cách diễn giải của
các phép biến đổi công suất. Xem Yeo và Johnson (2000) và các tài liệu tham khảo có
trong đó.
Chúng ta có thể coi λ là một tham số bổ sung trong mô hình được ước tính từ
dữ liệu quan sát. Tuy nhiên, ước tính chính xác của λ thường không được bảo đảm. Đánh giá của
một loạt các phép biến đổi dựa trên lưới các giá trị λ, chẳng hạn như ± 1, ± 1/2, ± 1/3, ± 1/4 và 0,
† Bài tập (5.17) yêu cầu bạn xác minh điều này.
Machine Translated by Google
95%
1500
1480
1460
nhật
năng
ghi
Khả
ký
1440
1420
2 1 0 1 2
Chương này đã giới thiệu khái niệm về sự khác biệt để tạo ra sự ổn định trên một số
các quy trình phi tĩnh. Điều này dẫn đến việc di chuyển tự động hồi phục tích hợp quan trọng
mô hình trung bình (ARIMA). Các thuộc tính của các mô hình này sau đó được triệt để
đã khám phá. Các phép biến đổi khác, cụ thể là thay đổi tỷ lệ phần trăm và logarit, sau đó
được xem xét. Nói chung hơn, các phép biến đổi công suất hoặc phép biến đổi Box-Cox là
được giới thiệu là các phép biến đổi hữu ích thành tính đứng yên và thường là tính chuẩn.
Machine Translated by Google
BÀI TẬP
5.1 Xác định những điều sau đây là các mô hình ARIMA cụ thể. Tức là p, d và q là gì và
giá trị của các tham số (của φ và θ) là gì? (a) Yt = Yt - 1 - 0,25Yt - 2 + et -
0,1et - 1. (b) Yt = 2Yt - 1 - Yt 2 + et . (c) Yt = 0,5Yt - 1 - 0,5Yt - 2 + et -
0,5et - 1+ 0,25et - 2.
5.2 Đối với mỗi mô hình ARIMA dưới đây, hãy cung cấp các giá trị cho E ( Yt ) và Var ( Yt ).
(a) Yt = 3 + Yt - 1 + et - 0,75et -
Bây giờ, giả sử rằng A và B là các biến ngẫu nhiên độc lập với bước đi ngẫu nhiên {Xt }.
5.5 Sử dụng các giá trị nhiễu trắng được mô phỏng trong Phụ lục 5.2, trên trang 88, xác minh giá trị
5.6 Xem xét một quá trình tĩnh {Yt }. Chứng tỏ rằng nếu ρ1 <½, Yt có phương sai lớn hơn
hơn Yt .
5.7 Xét hai mô hình: A: Yt
= 0,9Yt - 1 + 0,09Yt - 2 + et .
B: Yt = Yt - 1 + et -
0.1et - 1. (a) Xác định mỗi mô hình là một mô hình ARIMA cụ thể. Tức là p,
d và q là gì và giá trị của các tham số, của φ và θ là gì? (b) Hai mô hình
khác nhau ở những điểm nào? (c) Hai mô hình giống nhau ở những điểm nào? (So
sánh trọng lượng ψ và
π-trọng lượng.)
Machine Translated by Google
5.8 Hãy xem xét một quy trình “AR (1)” không cố định được định nghĩa là một giải pháp cho Phương trình
(a) Suy ra một phương trình tương tự như Phương trình (5.1.3) trên trang 88, cho trường hợp khác
(b) Tìm ra một phương trình tương tự như Phương trình (5.1.4) ở trang 89, cho chi tiết này
trường hợp eral.
(c) Tìm ra một phương trình tương tự như Phương trình (5.1.5) ở trang 89, cho chi tiết này
trường hợp eral.
(d) Có đúng với bất kỳ | φ | > 1, () ≈ 1Corr Yt Yt ,k - cho t lớn và k vừa phải ?
5.10 Chuỗi ARIMA không cố định có thể được mô phỏng bằng cách đầu tiên mô phỏng chuỗi ARMA tĩnh tương ứng
nó). Sử dụng phần mềm thống kê để mô phỏng nhiều chuỗi IMA (1,1) và IMA (2,2)
với nhiều giá trị tham số. Lưu ý bất kỳ "xu hướng" ngẫu nhiên nào trong mô phỏng
loạt.
5.11 Tệp dữ liệu winnebago chứa doanh số bán xe giải trí theo đơn vị hàng tháng
(RV) từ Winnebago, Inc., từ tháng 11 năm 1966 đến tháng 2 năm 1972.
(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.
(b) Bây giờ lấy logarit tự nhiên của số liệu bán hàng hàng tháng và hiển thị thời gian
biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.
(c) Tính các thay đổi tương đối của phân số, (Yt - Yt - 1) / Yt - 1, và so sánh chúng
với sự khác biệt của logarit (tự nhiên), log (Yt ) = log (Yt ) - log (Yt - 1).
Làm thế nào để họ so sánh cho các giá trị nhỏ hơn và cho các giá trị lớn hơn?
5.12 Tệp dữ liệu SP chứa chứng khoán Chỉ số Tổng hợp Standard & Poor hàng quý
giá trị từ quý đầu tiên của năm 1936 đến quý thứ tư của năm 1977.
(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.
(b) Bây giờ lấy logarit tự nhiên của các giá trị hàng quý và hiển thị và thời gian
biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.
(c) Tính các thay đổi tương đối (phân số), (Yt - Yt - 1) / Yt - 1, và so sánh
chúng với sự khác biệt của logarit (tự nhiên), log (Yt ). Làm thế nào để họ chia sẻ cho các
giá trị nhỏ hơn và cho các giá trị lớn hơn?
5.13 Đường bay tệp dữ liệu chứa số dặm hành khách hàng không hàng tháng của Hoa Kỳ bay từ tháng 1 năm 1949
đến tháng 12 năm 1960. Đây là chuỗi thời gian cổ điển được phân tích trong Box
và Jenkins (1976).
(a) Hiển thị và diễn giải biểu đồ chuỗi thời gian cho những dữ liệu này.
(b) Bây giờ lấy logarit tự nhiên của các giá trị hàng tháng và hiển thị và thời gian
biểu đồ chuỗi của các giá trị đã biến đổi. Mô tả ảnh hưởng của logarit lên
hành vi của chuỗi.
(c) Tính các thay đổi tương đối (phân số), (Yt - Yt - 1) / Yt - 1, và so sánh
chúng với sự khác biệt của logarit (tự nhiên), log (Yt ). Làm thế nào để họ chia sẻ cho các
giá trị nhỏ hơn và cho các giá trị lớn hơn?
Machine Translated by Google
5.14 Xem xét dữ liệu về lượng mưa hàng năm của Los Angeles được trình bày trong Phụ lục 1.1, trên trang
2. Biểu đồ bình thường lượng tử-lượng tử của những dữ liệu này, được hiển thị trong Phụ lục 3.17, trên trang
50, thuyết phục chúng tôi rằng dữ liệu không bình thường. Dữ liệu nằm trong tệp tin .
(a) Sử dụng phần mềm để tạo ra một biểu đồ tương tự như Phụ lục 5.11, trên trang 102, và xác định giá trị
(b) Hiển thị một biểu đồ lượng tử-lượng tử của dữ liệu được biến đổi. Họ có nhiều hơn cũng không
con đực?
(c) Tạo một biểu đồ chuỗi thời gian của các giá trị đã biến đổi.
(d) Sử dụng các giá trị đã chuyển đổi để hiển thị biểu đồ Yt so với Yt - 1 như trong Hình minh họa
1.2, ở trang 2. Chúng ta có nên mong đợi sự biến đổi để thay đổi sự phụ thuộc
5.15 Thu nhập hàng quý trên mỗi cổ phiếu của Công ty Johnson & Johnson được đưa ra trong
tệp dữ liệu có tên JJ. Dữ liệu bao gồm các năm từ 1960 đến 1980.
(a) Hiển thị biểu đồ chuỗi thời gian của dữ liệu. Giải thích các tính năng thú vị trong
kịch bản.
(b) Sử dụng phần mềm để tạo ra một biểu đồ tương tự như Phụ lục 5.11, trên trang 102, và xác định giá trị
"tốt nhất" của λ cho phép biến đổi lũy thừa của những dữ liệu này.
(c) Hiển thị biểu đồ chuỗi thời gian của các giá trị đã biến đổi. Cốt truyện này có gợi ý không
(d) Hiển thị biểu đồ chuỗi thời gian về sự khác biệt của các giá trị đã biến đổi. Làm
âm mưu này gợi ý rằng một mô hình tĩnh có thể thích hợp cho các chủng tộc khác nhau?
5.16 Tệp có tên vàng chứa giá vàng hàng ngày (tính bằng đô la trên một ounce troy) cho
(a) Hiển thị biểu đồ chuỗi thời gian của những dữ liệu này. Diễn giải cốt truyện.
(b) Hiển thị biểu đồ chuỗi thời gian về sự khác biệt của logarit của những dữ liệu này.
(c) Tính toán và hiển thị ACF mẫu cho sự khác biệt của logarit của
những dữ liệu này và lập luận rằng logarit dường như tuân theo một bước đi ngẫu nhiên
người mẫu.
(d) Hiển thị sự khác biệt của các bản ghi trong biểu đồ và diễn giải.
(e) Hiển thị sự khác biệt của các bản ghi trong một biểu đồ bình thường lượng tử-lượng tử và liên
xinh đẹp.
5.17 Sử dụng phép tính để chỉ ra rằng, với bất kỳ x > 0 cố định nào, khi λ 0 λx 1–
, ⁄
λ
()logx .
Machine Translated by Google
Nhiều cuốn sách khác và phần lớn văn học loạt thời gian sử dụng cái được gọi là sự dịch chuyển ngược
để thể hiện và thao tác các mô hình ARIMA . Toán tử dịch chuyển ngược, ký hiệu là B,
hoạt động dựa trên chỉ mục thời gian của một chuỗi và dịch chuyển thời gian trở lại một đơn vị thời gian để tạo thành một
† Đặc biệt,
=
BYt Yt 1–
Toán tử dịch chuyển ngược là tuyến tính vì đối với bất kỳ hằng số a, b, c và chuỗi Yt và Xt , nó
dễ dàng nhận thấy điều đó
B (aYt +bXt
+ c ) = aBYt +bBXt + c
Bây giờ hãy xem xét mô hình MA (1). Về mặt B, chúng ta có thể viết
= == -
Yt et θet 1– et θBet - 1 () - θB et
=
θ () B et
=
B2Yt Yt 2–
với mọi số nguyên dương m. Đối với mô hình MA (q) tổng quát , chúng ta có thể viết
= - - ––
Yt et θ1et 1– θ2et 2– … Qet q
= ––
- et θ1Betθ2B2et
- 1 θ1 - … θqBqe
t
=
θqBq
- B )
θ2B2
–– et
- (…
hoặc
=
Yt θ () B et
trong đó, một lần nữa, θ (B) là đa thức đặc trưng MA được đánh giá tại B.
Đối với mô hình tự động hồi quy AR (p), trước tiên, chúng tôi chuyển tất cả các thuật ngữ liên quan đến Y sang
phía tay trái
- - -
Yt φ1Yt 1– φ2Yt 2– -… φpYt p - et =
và sau đó viết
Yt φ1BYt -φ2B2Yt -
-… φpBpYt - et =
hoặc
-
- 1(-…
φ1 φpBp
- B φ2B2
) Yt et =
φ () B Yt et =
=
φ () B Yt θ () B et
Sự khác biệt cũng có thể được thể hiện một cách thuận tiện trong điều khoản B. Chúng tôi có
Y = - = -
t Yt Yt 1– Yt BYt
= ()
1 - B Yt
=
2Yt ( 1 - B 2Yt )
2
Thực tế , = 1 - B và 2 = (1 - B) .
Mô hình ARIMA (p, d, q) chung được diễn đạt một cách ngắn gọn như
=
() B ()1 - B dYt θ () B et φ
Trong tài liệu, người ta phải cẩn thận phân biệt với ngữ cảnh, việc sử dụng B như một
toán tử dịch chuyển ngược và việc sử dụng nó như một biến thực (hoặc phức) bình thường. Ví dụ,
điều kiện đứng yên thường được đưa ra bằng cách nói rằng các gốc của φ (B) = 0 phải là
lớn hơn 1 về giá trị tuyệt đối hoặc tương đương, phải nằm ngoài vòng tròn đơn vị trong
mặt phẳng phức tạp. Ở đây, B được coi là một biến giả trong một phương trình chứ không phải là
toán tử lùi xe.
Machine Translated by Google
CHƯƠNG 6
Chúng tôi đã phát triển một nhóm lớn các mô hình tham số cho cả chuỗi thời gian tĩnh và không
tĩnh — các mô hình ARIMA. Bây giờ chúng tôi bắt đầu nghiên cứu và triển khai
suy luận thống kê cho các mô hình như vậy. Các chủ đề của ba chương tiếp theo, tương ứng, là:
1. làm thế nào để chọn các giá trị thích hợp cho p, d, và q cho một loạt các;
2. cách ước lượng các tham số của một mô hình ARIMA (p, d, q) cụ thể ;
3. làm thế nào để kiểm tra sự phù hợp của mô hình được trang bị và cải thiện nó nếu cần.
Chiến lược tổng thể của chúng tôi trước tiên sẽ là quyết định các giá trị hợp lý - nhưng mang tính dự kiến -
cho p, d và q. Sau khi làm như vậy, chúng tôi sẽ ước tính φ's, θ's và σe cho mô hình đó trong
cách hiệu quả nhất. Cuối cùng, chúng ta sẽ xem xét kỹ lưỡng mô hình được trang bị do đó thu được
để kiểm tra tính đầy đủ của nó, giống như cách chúng ta đã làm trong Phần 3.6 trên trang 42. Nếu
theo một cách nào đó, mô hình có vẻ bất cập, chúng tôi coi bản chất của sự không phù hợp là
giúp chúng tôi chọn một mô hình khác. Chúng tôi tiến hành ước tính mô hình mới đó và kiểm tra
sự đầy đủ.
Với một vài lần lặp lại của chiến lược xây dựng mô hình này, chúng tôi hy vọng sẽ đạt được kết quả tốt nhất
mô hình khả thi cho một loạt nhất định. Cuốn sách của George EP Box và GM Jenkins
(1976) đã phổ biến kỹ thuật này đến nỗi nhiều tác giả gọi quy trình là “phương pháp Box
Jenkins”. Chúng ta bắt đầu bằng cách tiếp tục điều tra các thuộc tính của hàm tự tương quan sam
ple.
6.1 Các thuộc tính của chức năng tự tương quan mẫu
Nhớ lại từ trang 46 định nghĩa của mẫu hoặc hàm tự tương quan ước lượng.
N
_ _
( k - ) -Y
( Yt )Y - Yt
tk 1 + =
rk
= ------------------------------------------------- --------------
cho k = 1, 2, ... (6.1.1)
N _
2
( Yt )Y -
t 1 =
Mục tiêu của chúng tôi là nhận ra, trong phạm vi có thể, các mẫu trong rk là đặc trưng
của các mẫu đã biết trong ρk cho các mô hình ARMA phổ biến. Ví dụ, chúng tôi biết rằng
ρk = 0 với k> q trong mô hình MA (q) . Tuy nhiên, vì rk chỉ là ước tính của ρk, chúng tôi
109
Machine Translated by Google
cần phải điều tra các đặc tính lấy mẫu của chúng để tạo điều kiện thuận lợi cho việc so sánh các
tương quan với tương quan lý thuyết.
Từ định nghĩa của rk, một tỷ lệ của các hàm bậc hai có thể phụ thuộc ables,
cần rõ ràng rằng các đặc tính lấy mẫu của rk sẽ không dễ dàng thu được.
Ngay cả giá trị kỳ vọng của rk cũng khó xác định — hãy nhớ rằng giá trị kỳ vọng của
một tỷ lệ không phải là tỷ lệ của các giá trị kỳ vọng tương ứng. Chúng tôi sẽ hài lòng khi chấp nhận một
kết quả mẫu lớn tổng quát và xem xét ý nghĩa của nó trong các trường hợp đặc biệt. Bartlett (1946)
thực hiện các công việc ban đầu. Chúng ta sẽ lấy một kết quả tổng quát hơn từ Anderson (1971).
Một cuộc thảo luận gần đây về những kết quả này có thể được tìm thấy trong Shumway và Stoffer (2006, tr.
519).
Chúng tôi cho rằng
∞
Yt +
μ = ψj et j -
j 0 =
trong đó et là độc lập và được phân phối giống nhau với phương tiện bằng không và phương sai hữu
hạn, khác không, phổ biến. Chúng tôi giả định thêm rằng
∞ ∞
2
∞ <và ψj ∞jψj
<
j 0 = j 0 =
(Những điều này sẽ được đáp ứng bởi bất kỳ mô hình ARMA cố định nào.)
Sau đó, đối với bất kỳ m cố định nào , phân phối chung của
r1()ρ1- n , n ()…
r2 ρ2- n,,
rm-()
ρm
phương pháp tiếp cận, n ∞ , một phân phối chuẩn chung với giá trị trung bình bằng 0, phương sai cjj và
∞
- - 2
+ + (6.1.2)
cij = ( ρk i + ρk j + ρk i - ρk j + 2ρi ρkρk j + 2ρj ρkρk i + 2ρi ρj ρk )
k - = ∞
Đối với n lớn, chúng ta sẽ nói rằng rk được phân phối xấp xỉ chuẩn với giá trị trung bình ρk
và phương sai ckk / n. Hơn nữa, () giao , xấp
ckj ckkcjj
phối . Lưu
⁄≈ xỉ Corr rk rj của ýrkrằng phương
tỷ lệ sai
nghịch
với kích thước mẫu, nhưng (), Là
Corr rk rj
xấp xỉ không đổi đối với n lớn .
Vì Công thức (6.1.2) rõ ràng là khó giải thích theo tính tổng quát hiện tại của nó, chúng tôi
sẽ xem xét một số trường hợp đặc biệt quan trọng và đơn giản hóa. Trước tiên, giả sử rằng {Yt }
là tiếng ồn trắng. Sau đó, Công thức (6.1.2) giảm đáng kể, và chúng tôi thu được
1
≈ (6.1.3)
Var rk () (- và Corr rk rj ), 0 cho kj ≈
N
Tiếp theo, giả sử rằng {Yt } được tạo ra bởi một quá trình AR (1) với ρk = φk với k > 0.
Sau đó, sau đại số đáng kể và tính tổng một số chuỗi hình học, Phương trình
(6.1.2) với i = j sản lượng
1 1 φ2 +) (1- φ2k ()
≈ - ------------------------------------------
-
(6.1.4)
Var rk ()
N
2kφ2k 1 φ2 -
Machine Translated by Google
6.1 Các thuộc tính của chức năng tự tương quan mẫu 111
Đặc biệt,
1 φ2 -
Var r1 ()
≈ --------------
(6.1.5)
N
Lưu ý rằng φ càng gần ± 1, ước tính của chúng ta về ρ1 (= φ) càng trở nên chính xác hơn.
Đối với độ trễ lớn, các thuật ngữ trong Công thức (6.1.4) liên quan đến φk có thể bị bỏ qua, và chúng tôi
có
-1 1 φ2 +
Var rk () ≈ -------------- cho k lớn (6.1.6)
N
1 φ2 -
Lưu ý rằng ở đây, trái ngược với Công thức (6.1.5), các giá trị của φ gần với ± 1 ngụ ý rằng biến thể
lớn φk ≈ 0
dấu ngoặc cho rk. Vì vậy, chúng ta không nên mong đợi ước tính gần như chính xác của ρk = cho
-
= ()φ ji - φ ji + 1 φ2
+ () + () φ ji - ji -- () φ ji + ji + (6.1.7)
-------------------------------------------------- ---
cij
1 φ2 -
1 φ2 -
, () ≈ 2φ (6.1.8)
---------------------------------
Corr r1 r2
1 2φ2 3φ4 - +
Dựa trên các phương trình (6.1.4) đến (6.1.8), Phụ lục 6.1 đưa ra tiêu chuẩn gần đúng
sai lệch và tương quan đối với một số độ trễ và một vài giá trị của φ trong các mô hình AR (1).
Phụ lục 6.1 Kết quả mẫu lớn cho rk được chọn từ Mô hình AR (1)
Đối với trường hợp MA (1), Công thức (6.1.2) đơn giản hóa như sau:
= - 2
2 + = + cho k > 1 (6.1.9)
c11 1 3ρ1 4 và ckk 4ρ1 1 2ρ1
Hơn nữa,
= 2
( c12 2ρ1 1 ρ1) - (6.1.10)
Dựa trên các biểu thức này, Phụ lục 6.2 liệt kê các độ lệch chuẩn mẫu lớn và quan
hệ cor cho tự tương quan mẫu đối với một số độ trễ và một số giá trị θ. Để ý
một lần nữa rằng các tự tương quan mẫu có thể tương quan cao và tiêu chuẩn
độ lệch của rk lớn hơn đối với k > 1 so với k = 1.
Machine Translated by Google
Phụ lục 6.2 Kết quả mẫu lớn cho rk được chọn từ Mô hình MA (1)
θ
Var r1 () Var rk () cho k > 1 Corr r1 (),
r2
± 0,9 0,71 ⁄ n 1,22 ⁄ n + 0,86
Đối với quy trình MA (q) tổng quát và i = j = k, Công thức (6.1.2) giảm xuống
q
ckk 1 2 ρj2 cho kq >
+ =
j 1 =
để có thể
q
1 2
= - 1 2 + (6.1.11)
Var rk ()
N cho ρj kq >
j 1 =
Đối với một chuỗi thời gian được quan sát, chúng ta có thể thay thế ρ bằng r, lấy căn bậc hai, và
thu được độ lệch chuẩn ước tính của rk, nghĩa là, sai số chuẩn của rk đối với
trễ. Kiểm tra giả thuyết rằng chuỗi là MA (q) có thể được thực hiện bằng cách so sánh
rk để cộng và trừ hai lỗi tiêu chuẩn. Chúng tôi sẽ bác bỏ giả thuyết vô hiệu nếu và chỉ
nếu rk nằm ngoài các giới hạn này. Nói chung, chúng ta không nên mong đợi mẫu autocorrela tion
mô phỏng quá trình tự tương quan thực một cách chi tiết. Vì vậy, chúng ta không nên ngạc nhiên khi
xem các gợn sóng hoặc "xu hướng" trong rk mà không có đối tác nào trong ρk.
Vì đối với các mô hình MA (q) , hàm tự tương quan bằng 0 đối với độ trễ vượt quá q,
nên tự tương quan sam sung là một chỉ báo tốt về thứ tự của quá trình. Tuy nhiên, các
quan hệ autocor của một mô hình AR (p) không trở thành 0 sau một số độ trễ nhất định — chúng
chết đi chứ không phải cắt bỏ. Vì vậy, một chức năng khác là cần thiết để giúp xác định thứ tự
của các mô hình tự phục hồi. Một chức năng như vậy có thể được định nghĩa là mối tương quan giữa Yt
và Yt - k sau khi loại bỏ ảnh hưởng của các biến can thiệp Yt - 1, Yt - 2, Yt - 3,…,
Yt - k + 1. Hệ số này được gọi là tự tương quan từng phần ở độ trễ k và sẽ được ký hiệu là
bởi φkk. (Lý do cho chỉ số phụ kép dường như dư thừa trên φkk sẽ trở thành
rõ ràng sau này trong phần này.)
Có một số cách để làm cho định nghĩa này chính xác. Nếu {Yt } là một phân phối bình thường
chuỗi thời gian đã định, chúng ta có thể để
= Yt Yt k - ,| Yt 1– Yt 2– ,,
φkk Corr … Yt k - 1 + () (6.2.1)
Nghĩa là, φkk là mối tương quan trong phân phối lưỡng biến của Yt và Yt - k với điều kiện
Yt - 1, Yt - 2,…, Yt - k + 1.
Machine Translated by Google
6.2 Các chức năng tự tương quan một phần và mở rộng 113
Một cách tiếp cận thay thế, không dựa trên tính chuẩn mực, có thể được phát triển như sau
đường. Xem xét dự đoán Yt dựa trên một hàm tuyến tính của các biến can thiệp Yt - 1,
…
Yt - 2,…, Yt - k + 1, giả sử, β1Yt - 1+ β2Yt - 2 + + βk - 1Yt - k + 1, với β được chọn để
giảm thiểu sai số bình phương trung bình của dự đoán. Nếu chúng ta giả định rằng các β đã như vậy
được lựa chọn và sau đó suy nghĩ ngược lại theo thời gian, điều đó xảy ra theo lý do rằng
= - -
,
φkk Corr Y ( t β1Yt 1– β2Yt 2–
1– ––… βk β2Yt k - 2 +
Yt 2–
(6.2.2)
- - -
Yt k - β1Yt k - 1 + … - βk 1– Yt 1– )
(Đối với chuỗi phân phối chuẩn, có thể chứng minh rằng hai định nghĩa trùng khớp.)
quy ước, ta lấy φ11 = 1.
Ví dụ, hãy xem xét φ22. Nó được hiển thị trong Phụ lục F trên trang 218 rằng tốt nhất
dự đoán tuyến tính của Yt dựa trên riêng Yt - 1 chỉ là ρ1Yt - 1. Do đó, theo Công thức
(6.2.2), chúng tôi sẽ thu được φ22 bằng máy tính
- - = - - 2 2 ) + = ()
Cov (Yt ρ1Yt 1–,Yt 2– ρ1Yt 1– ) ρ2 2ρ1( γ0 2 ρ1 - ρ1 γ0 ρ2 ρ1
Từ
- = -
Var (Yt ρ1Yt 1– ) Var (Yt 2– ρ1Yt 1– )
2 2
= ()
γ0 1-ρ1+ 2ρ1
2
= ( γ0) 1- ρ1
chúng ta có rằng, đối với bất kỳ quá trình tĩnh nào, tự tương quan một phần độ trễ 2 có thể là
thể hiện như
- 2
ρ2 ρ1
φ22
----------------- =
(6.2.3)
- 2
1 ρ1
Bây giờ hãy xem xét một mô hình AR (1). Nhớ lại rằng ρk = φk để
= φ2 φ2 -
= ----------------- 0
φ22
1 φ2 -
Chúng ta sẽ sớm thấy rằng đối với trường hợp AR (1), φkk = 0 với mọi k > 1. Do đó, quan hệ lấy nét tự
động một phần là khác 0 đối với độ trễ 1, thứ tự của quá trình AR (1), nhưng bằng 0 đối với tất cả độ trễ
lớn hơn 1. Chúng tôi sẽ chỉ ra rằng điều này nói chung là trường hợp của các mô hình AR (p). Đôi khi
chúng ta nói rằng hàm tự tương quan một phần cho một quá trình AR (p) bị cắt sau khi
độ trễ vượt quá thứ tự của quá trình.
Hãy xem xét một trường hợp AR (p) tổng quát . Nó sẽ được chỉ ra trong Chương 9 rằng tuyến tính tốt nhất
dự đoán Yt dựa trên hàm tuyến tính của các biến Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1
…
với k > p là φ1Yt - 1 + φ2Yt - 2 + + φpYt - p. một Ngoài ra, dự đoán tuyến tính tốt nhất của Yt - k là
số hàm của Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1, gọi nó là h (Yt - 1, Yt - 2,…, Yp,…, Yt - k + 1).
Vì vậy, hiệp phương sai giữa hai sai số dự đoán là
Machine Translated by Google
-
Cov Y ( t φ1Yt 1– ––… φpYt p, --
2– φ2Yt
Yt k - -( h Yt k - ,
1 + Yt k -1–2 )+ ,,)
… Yt
= k - h(-Yt(,kCov Yt k - 2 + ,
- 1et+ Yt 0 vì et ,,… Đúng 1–))
= độc lập với Yt k - Yt k - 1 + Yt k ,- 2 + , ,,… Đúng 1–
Do đó, chúng tôi đã thiết lập một thực tế quan trọng rằng, đối với mô hình AR (p) ,
Đối với mô hình MA (1), Phương trình (6.2.3) nhanh chóng tạo ra
θ2 -
φ22
= ---------------------------
(6.2.5)
1 +
θ2 +θ4
Hơn nữa, đối với trường hợp MA (1), có thể chỉ ra rằng
θk 1 ()
θ2 -
φkk - = ---------------------------- cho k ≥ 1 (6.2.6)
1 -θ2 () k 1+
Lưu ý rằng tự tương quan từng phần của một mô hình MA (1) không bao giờ bằng 0 mà tự
nhiên giảm dần về 0 nhanh theo cấp số nhân khi độ trễ tăng lên — giống như hàm
autocorrela tion của quy trình AR (1). Nhìn chung hơn, có thể chỉ ra rằng một phần
tự tương quan của một mô hình MA (q) hoạt động rất giống như tự tương quan của một
Mô hình AR (q) .
Một phương pháp chung để tìm hàm tự tương quan từng phần cho bất kỳ
quá trình với hàm tự tương quan ρk như sau (xem Anderson 1971, trang 187–188,
Ví dụ). Với độ trễ k cho trước, có thể chứng minh rằng φkk thỏa mãn Yule-Walker
phương trình (xuất hiện lần đầu trong Chương 4 trên trang 79):
= + (6.2.7)
ρj φk1ρj 1– φk2ρj 2– φk3ρj 3–
1 2… ,,,…
φkkρj
k k - + ++ cho j =
Rõ ràng hơn, chúng ta có thể viết k phương trình tuyến tính này dưới dạng
Ở đây chúng ta đang xử lý ρ1, ρ2,…, ρk như đã cho và muốn giải cho φk1, φk2,…, φkk
(bỏ tất cả trừ φkk).
Các phương trình này mang lại φkk cho bất kỳ quá trình tĩnh nào. Tuy nhiên, nếu quy trình trong
thực tế AR (p), do đó đối với k = p Phương trình (6.2.8) chỉ là phương trình Yule-Walker
(trang 79), mà mô hình AR (p) đã biết để thỏa mãn, chúng ta phải có φpp = φp. Nói
cách khác, như chúng ta đã thấy bằng một đạo hàm thay thế, φkk = 0 với k > p. Do đó,
tự tương quan mệnh giá hiển thị hiệu quả thứ tự p chính xác của một quá trình tự hồi quy
là độ trễ cao nhất k trước khi φkk trở thành 0.
Machine Translated by Google
6.2 Các chức năng tự tương quan một phần và mở rộng 115
Đối với một chuỗi thời gian được quan sát, chúng ta cần có khả năng ước tính tự tương quan một phần
hoạt động ở nhiều độ trễ. Với các mối quan hệ trong phương trình (6.2.8), một điều hiển nhiên
phương pháp là ước lượng ρ's với tự tương quan mẫu, r tương ứng , và
sau đó giải các phương trình tuyến tính thu được cho k = 1, 2, 3,… để có được các ước lượng của φkk. Chúng tôi gọi
k 1–
ρk - φk 1–, j ρk j -
j 1 =
φkk
= ------------------------------------------------- -
(6.2.9)
k 1–
1
- φk 1–, j ρj
j 1 =
ở đâu
= -
cho j =,,,
1 2 …
k 1–
φk j , φk 1–, j φkkφk 1– , kj -
-
= ρ2 φ11ρ1 -
------------------------- 2 ρ2 ρ1
= -----------------
φ22 - 2
1 φ11ρ1 - 1 ρ1
(như trước) với φ21 φ11 φ22φ11 - = , cần thiết cho bước tiếp theo.
sau đó
ρ3 φ21ρ2 - φ22ρ1 -
= ----------------------------------------------
φ33
1 φ21ρ1 - φ22ρ2 -
Do đó, chúng tôi có thể tính toán số lượng nhiều giá trị cho φkk như mong muốn. Như đã nói,
các phương trình đệ quy này cung cấp cho chúng ta các tự tương quan từng phần theo lý thuyết, nhưng bằng cách
thay thế ρ's bằng r, chúng ta thu được các tự tương quan từng phần được ước lượng hoặc lấy mẫu.
Để đánh giá mức độ có thể có của tự tương quan từng phần mẫu, Quenoulle
(1949) đã chỉ ra rằng, theo giả thuyết rằng một mô hình AR (p) là đúng, mẫu
tự tương quan từng phần ở độ trễ lớn hơn p được phân phối gần đúng bình thường
với không có nghĩa và phương sai 1 / n. Do đó, với k > p, 2 ⁄ ± n có thể được sử dụng làm giới hạn tới hạn
^
trên φ kk để kiểm tra giả thuyết rỗng rằng mô hình AR (p) là đúng.
Hình 6.3 tóm tắt hành vi của tự tương quan và tự tương quan một phần
các chức năng hữu ích trong việc chỉ định mô hình.
Machine Translated by Google
Phụ lục 6.3 Hành vi Chung của ACF và PACF đối với Mô hình ARMA
ACF và PACF mẫu cung cấp các công cụ hiệu quả để xác định AR (p) hoặc MA (q) thuần túy
các mô hình. Tuy nhiên, đối với mô hình ARMA hỗn hợp, ACF và PACF lý thuyết của nó
có rất nhiều giá trị khác không, gây khó khăn cho việc xác định các mô hình hỗn hợp
từ ACF sam sung và PACF. Nhiều công cụ đồ họa đã được đề xuất để giúp bạn dễ dàng hơn
xác định các thứ tự ARMA, ví dụ, phương pháp góc (Becuin và cộng sự, 1980),
phương pháp tự tương quan mở rộng (EACF) (Tsay và Tiao, 1984), và phương pháp nhỏ nhất
phương pháp tương quan kinh điển (SCAN) (Tsay và Tiao, 1985), trong số những phương pháp khác. Chúng ta sẽ
phác thảo phương pháp EACF, phương pháp này dường như có các đặc tính lấy mẫu tốt cho
các cỡ mẫu cực lớn hiện đại theo một nghiên cứu mô phỏng so sánh được thực hiện bởi WS
Chan (1999).
Phương pháp EACF sử dụng thực tế là nếu phần AR của mô hình ARMA hỗn hợp là
được biết, "lọc ra" sự tự động hồi phục khỏi chuỗi thời gian đã quan sát dẫn đến kết quả thuần túy
Quy trình MA hưởng đặc tính cắt trong ACF của nó. Các hệ số AR có thể được ước tính
bởi một chuỗi hồi quy hữu hạn. Chúng tôi minh họa quy trình cho trường hợp
mô hình thực là mô hình ARMA (1,1):
= + -
Yt φYt 1– et θet 1–
Trong trường hợp này, một hồi quy tuyến tính đơn giản của Yt trên Yt - 1 dẫn đến ma
trận ước tính không nhất quán là φ, ngay cả với vô số dữ liệu. Thật vậy, hệ số hồi quy lý thuyết
bằng ρ1 = (φ - θ) (1 - φθ) / (1 - 2φθ + θ2), không phải φ. Nhưng phần còn lại từ hồi quy này
chứa thông tin về quá trình lỗi {et }. Một hồi quy bội thứ hai được hình thành bao
gồm hồi quy Yt trên Yt - 1 và trên độ trễ 1 của các phần dư từ ~
hồi quy đầu tiên. Hệ số của Yt - 1 φ trong hồi quy thứ hai, ký hiệu là, lần lượt
- =
trở thành một công cụ ước tính nhất quán của Wt
φ. Yt
Xác định
φ ~ sau đó, gần đúng là một quá
Yt 1–
trình MA (1). Đối với mô hình ARMA (1,2), hồi quy thứ ba hồi quy Yt
về độ trễ 1 của nó, độ trễ 1 của phần còn lại từ hồi quy thứ hai và độ trễ 2 của
phần dư từ hồi quy đầu tiên dẫn đến hệ số Yt - 1 là hệ số ước lượng nhất quán của φ.
Tương tự, các hệ số AR của mô hình ARMA (p, q) có thể nhất quán
ước tính thông qua một chuỗi q hồi quy.
Vì lệnh AR và MA không xác định, nên cần phải có một quy trình lặp lại. Để cho
~ ~
––– =
Wtkj , Yt φ 1Yt 1– … Φ kYt k - (6.2.10)
là phần dư hồi quy tự động được xác định với hệ số AR được ước tính lặp đi lặp lại
giả sử thứ tự AR là k và thứ tự MA là j. Các tự tương quan mẫu của Wt, k, j
được gọi là tự tương quan mẫu mở rộng. Với k = p và j ≥ q, {Wt, k, j } là
xấp xỉ một mô hình MA (q) , để tự tương quan lý thuyết của nó về độ trễ q + 1 hoặc
Machine Translated by Google
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 117
cao hơn bằng không. Đối với k > p, xảy ra vấn đề trang bị quá mức và điều này làm tăng
Thứ tự MA cho quá trình W nhỏ nhất của k - p và j - q. Tsay và Tiao (1984)
đề xuất tóm tắt thông tin trong EACF mẫu bằng một bảng có phần tử
trong hàng thứ k và cột thứ j bằng ký hiệu X nếu độ trễ j + 1 tương quan mẫu của
Wt, k, khác đáng kể so với 0 (nghĩa là, nếu độ lớn của nó lớn hơn
j 1,96 ⁄ njk –– vì tự tương quan mẫu là tiệm cận N (0,1 / (n - k - j)) nếu
W là một quá trình MA (j) ) và 0 thì ngược lại. Trong một bảng như vậy, một
Quá trình MA (p, q) sẽ có một mô hình lý thuyết là một tam giác các số 0, với
đỉnh bên trái tương ứng với các lệnh ARMA. Hình 6.4 hiển thị sơ đồ
mẫu cho mô hình ARMA (1,1). Đỉnh phía trên bên trái của tam giác số không là
được đánh dấu bằng ký hiệu 0 * và nằm ở hàng p = 1 và cột q = 1 — một dấu hiệu của mô hình
ARMA (1,1).
Hình 6.4 ACF mở rộng lý thuyết (EACF) cho Mô hình ARMA (1,1)
AR / MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 xxxxxxxxxxxxxx
1 x 0 * 0 0 0 0 0 0 0 0 0 0 0 0
2 xx000000000000
3 xxx00000000000
4 xxxx0000000000
5 xxxxx000000000
6 xxxxxx00000000
7 xxxxxxx0000000
Tất nhiên, EACF mẫu sẽ không bao giờ rõ ràng như thế này. Hiển thị như Hình 6.4
sẽ chứa 8 × 14 = 112 tương quan ước tính khác nhau và một số sẽ được thống kê
khác biệt đáng kể so với tình cờ (xem Phụ lục 6.17 trên trang 124, để biết đề thi). Chúng tôi
sẽ minh họa việc sử dụng EACF trong hai phần tiếp theo và trong suốt
phần còn lại của cuốn sách.
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng
Để minh họa lý thuyết của Phần 6.1 và 6.2, chúng ta sẽ xem xét mối tương quan tự động lấy mẫu
và mối tương quan từng phần của mẫu của một số chuỗi thời gian mô phỏng.
Phụ lục 6.5 hiển thị một biểu đồ của tự tương quan mẫu đến độ trễ 20 cho chuỗi thời gian bị
lỗi mô phỏng mà chúng ta đã thấy lần đầu tiên trong Phụ lục 4.5 trên trang 61. Chuỗi này, có độ dài 120,
được tạo ra từ mô hình MA (1) với θ = 0,9. Từ Hình 4.1 trên trang 58, tự tương quan quặng ở
độ trễ 1 là 0,4972. Giá trị ước tính hoặc giá trị mẫu được hiển thị ở độ trễ
1 trên đồ thị là 0,474. Sử dụng Hình 6.2 trên trang 112, sai số chuẩn gần đúng
Machine Translated by Google
N
của ước tính này là 0,71 / = 0,71 / sai 120 = 0,065, vì vậy ước tính tốt trong vòng hai khổ
số dard của giá trị thực.
Hình 6.5 Tự tương quan mẫu của một quá trình MA (1) với θ = 0,9
0,1
ACF
0,1
0,3
0,5
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> dữ liệu (ma1.1.s)
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (ma1.1.s, xaxp = c (0,20,10))
Các đường ngang đứt nét trong Hình 6.5, được vẽ ở 2 ⁄ ± n = ± 0,1826, là
nhằm cung cấp các giá trị tới hạn để kiểm tra xem hệ số tự tương quan có hay không
khác đáng kể so với số không. Các giới hạn này dựa trên giá trị lớn gần đúng
lỗi tiêu chuẩn mẫu áp dụng cho quá trình nhiễu trắng, cụ thể là 1 ⁄ n . Thông báo rằng
các giá trị ACF mẫu vượt quá các giá trị tới hạn thô này ở độ trễ 1, 5 và 14. Tất nhiên,
Hình 6.6 hiển thị cùng một ACF mẫu nhưng với các giới hạn quan trọng dựa trên cộng
và trừ đi hai trong số các lỗi tiêu chuẩn phức tạp hơn được ngụ ý bởi Công thức (6.1.11) trên
trang 112. Khi sử dụng Công thức (6.1.11), chúng ta thay thế ρ's bằng r's, đặt q bằng 1, 2, 3, ...
thành công, và lấy căn bậc hai để có được những sai số tiêu chuẩn này.
Machine Translated by Google
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 119
Phụ lục 6.6 Các giới hạn thay thế cho ACF mẫu cho MA (1)
Quá trình
0,1
ACF
0,1
0,3
0,5
2 4 6 số 8 10 12 14 16 18 20
Lỗi
Bây giờ giá trị ACF mẫu ở độ trễ 14 là không đáng kể và giá trị ở độ trễ 5 chỉ là
hầu như không đáng kể. Độ trễ tự tương quan 1 vẫn có ý nghĩa rất lớn và thông tin được đưa ra
trong hai biểu đồ này được thực hiện cùng nhau khiến chúng tôi xem xét mô hình MA (1) cho điều này
loạt. Hãy nhớ rằng mô hình là dự kiến tại thời điểm này và chúng tôi chắc chắn muốn
xem xét các mô hình thay thế “lân cận” khác khi chúng tôi thực hiện chẩn đoán mô hình.
Ví dụ thứ hai, Phụ lục 6.7 cho thấy ACF mẫu cho chuỗi được hiển thị trong
Hình 4.2 trên trang 59, được tạo bởi mô hình MA (1) với θ = 0,9. Các giá trị quan trọng
dựa trên sai số tiêu chuẩn rất gần đúng trỏ đến mô hình MA (1) cho loạt bài này
cũng.
Hình 6.7 Tự tương quan mẫu cho một quá trình MA (1) với θ = 0,9
0,4
0,2
ACF
0,0
0,2
2 4 6 số 8 10 12 14 16 18 20
Lỗi
Đối với ví dụ thứ ba của chúng tôi, chúng tôi sử dụng dữ liệu được hiển thị trong Phụ lục 4.8 trên trang 63,
được mô phỏng từ mô hình MA (2) với θ1 = 1 và θ2 = 0,6. Đĩa ACF mẫu đóng vai trò quan trọng ở độ
trễ 1, 2, 5, 6, 7 và 14 khi chúng tôi sử dụng lỗi tiêu chuẩn đơn giản
giới hạn.
Hình 6.8 ACF mẫu cho một quá trình MA (2) với θ1 = 1 và θ2 = 0,6
0,2
0,2
0,0
ACF
0,6
2 4 6 số 8 10 12 14 16 18 20
Lỗi
Hình 6.9 hiển thị ACF mẫu với lỗi tiêu chuẩn phức tạp hơn
giới hạn. Bây giờ, độ trễ 2 ACF không còn đáng kể nữa và dường như MA (1) có thể
Được áp dụng. Chúng ta sẽ phải đợi cho đến khi chúng ta tiến xa hơn trong lĩnh vực xây dựng mô hình
chuyên nghiệp để thấy rằng mô hình MA (2) — mô hình chính xác — là mô hình thích hợp nhất cho
những dữ liệu này.
Phụ lục 6.9 Các giới hạn thay thế cho ACF mẫu cho MA (2)
Quá trình
0,2
0,2
0,0
ACF
0,6
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> acf (ma2.s, ci.type = 'ma', xaxp = c (0,20,10))
Machine Translated by Google
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 121
Các kỹ thuật này hoạt động như thế nào đối với các mô hình tự phục hồi? Hình 6.10 cho
ACF mẫu cho quy trình AR (1) được mô phỏng mà chúng tôi đã thấy trong Phụ lục 4.13 trên trang 68.
giá trị ACF mẫu dương ở độ trễ 1, 2 và 3 phản ánh sức mạnh của các tàu quan hệ bị trễ mà chúng ta
đã thấy trước đó trong các Phần trình bày 4.14, 4.15 và 4.16. Tuy nhiên, lưu ý rằng ACF sam ple
giảm tuyến tính hơn theo cấp số nhân như lý thuyết cho thấy. Cũng trái ngược với
lý thuyết, ACF mẫu sẽ âm ở độ trễ 10 và vẫn như vậy trong nhiều độ trễ.
Hình 6.10 ACF mẫu cho một quy trình AR (1) với φ = 0,9
0,6
ACF
0,2
0,2
2 4 6 số 8 10 12 14 16
Lỗi
> data (ar1.s); acf (ar1.s, xaxp = c (0,20,10))
Tự tương quan từng phần mẫu (PACF) được trình bày trong Phụ lục 6.11, cho
hình ảnh rõ ràng hơn về bản chất của mô hình tạo. Dựa trên biểu đồ này, chúng tôi sẽ
chắc chắn giải trí với mô hình AR (1) cho chuỗi thời gian này.
Phụ lục 6.11 ACF từng phần mẫu cho quy trình AR (1) với φ = 0,9
0,6
0,2
phần
một
ACF
0,2
2 4 6 số 8 10 12 14 16
Lỗi
Machine Translated by Google
Hình 6.12 hiển thị ACF mẫu cho chuỗi thời gian AR (2) của chúng tôi. Chuỗi thời gian
biểu đồ cho loạt bài này được trình bày trong Phụ lục 4.19 trên trang 74. Mẫu ACF trông
phần nào giống như sóng bị hãm mà Công thức (4.3.17) trên trang 73 và Hình 4.18
gợi ý. Tuy nhiên, ACF mẫu không giảm nhanh như lý thuyết
dự đoán.
Hình 6.12 ACF mẫu cho một quá trình AR (2) với φ1 = 1,5 và φ2 = 0,75
0,6
ACF
0,2
0,6
0,2
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> acf (ar2.s, xaxp = c (0,20,10))
PACF mẫu trong Phụ lục 6.13 đưa ra một dấu hiệu mạnh mẽ mà chúng ta nên xem xét
mô hình AR (2) cho những dữ liệu này. PACF mẫu có vẻ quan trọng ở độ trễ 9 sẽ
cần được nghiên cứu thêm trong quá trình chẩn đoán mô hình.
Hình 6.13 PACF mẫu cho một quá trình AR (2) với φ1 = 1,5 và φ2 = 0,75
0,5
0,0
phần
một
ACF
0,5
2 4 6 số 8 10 12 14 16 18 20
Lỗi
Machine Translated by Google
6.3 Đặc điểm kỹ thuật của một số chuỗi thời gian mô phỏng 123
Ví dụ cuối cùng, chúng tôi đã mô phỏng 100 giá trị của mô hình ARMA (1,1) hỗn hợp với
φ = 0,6 và θ = 0,3. Biểu đồ chuỗi thời gian được trình bày trong Phụ lục 6.14 và ACF và
PACF mẫu được trình bày trong Phụ lục 6.15 và Phụ lục 6.16, tương ứng. Những điều này dường
như chỉ ra rằng mô hình AR (1) nên được chỉ định.
Hình 6.14 Chuỗi ARMA được mô phỏng (1,1) với φ = 0,6 và θ = 0,3.
•
4
•
• •
• •
2 •• • • •
•
•
• •
• • • •
•
• •
• •• • •
•
• • •
•
• •
•
•
• •
•• • ••
Yt 0 •
• • •
• •• •
•
• •• •
•
••
• • • •
•• •
• •
•
• ••••• •
• •
•
•
• •••
•
• • • •
2
• •
• • •
•
• ••
• •
0 20 40 60 80 100
Thời gian
Hình 6.15 ACF mẫu cho dòng ARMA (1,1) được mô phỏng
ACF 0,6
0,4
0,2
0,2
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> acf (arma11.s, xaxp = c (0,20,10))
Machine Translated by Google
Hình 6.16 PACF mẫu cho dòng ARMA (1,1) được mô phỏng
phần
một
ACF
0,2
0,6
0,4
0,2
0,0
2 4 6 số 8 10 12 14 16 18 20
Lỗi
Tuy nhiên, vùng tam giác của các số không được thể hiện trong EACF mẫu trong Phụ lục 6.17
chỉ ra khá rõ ràng rằng một mô hình hỗn hợp với q = 1 và với p = 1 hoặc 2 sẽ nhiều hơn
phù hợp. Chúng tôi sẽ minh họa các cách sử dụng khác của EACF khi chúng tôi chỉ định một số
loạt bài trong Phần 6.6.
Hình 6.17 EACF mẫu cho dòng ARMA (1,1) được mô phỏng
AR / MA 0 1 2 3 4 5 6 7 8 9 10 11 12 13
0 xxxx oooooooooo
1 xooooooooooooo
2 xooooooooooooo
3 xxoooooooooooo
4 xoxooooooooooo
5 xooooooooooooo
6 xoooxooooooooo
7 xoooxooooooooo
6.4 Sự phi lý
Như đã chỉ ra trong Chương 5, nhiều loạt bài thể hiện sự bất thường có thể được giải thích bằng cách
các mô hình ARMA tích hợp. Sự bất thường sẽ thường xuyên rõ ràng theo thời gian
cốt truyện hàng loạt của bộ truyện. Nên xem lại các Phần trình bày 5.1, 5.5 và 5.8 tại đây.
ACF mẫu được tính cho chuỗi không tĩnh cũng sẽ thường chỉ ra
phi lý tính. Định nghĩa ngầm định của hàm tự tương quan mẫu
giả định sự cố định; ví dụ: chúng tôi sử dụng các sản phẩm bị tụt hậu có độ lệch so với tổng thể
trung bình, và mẫu số giả định một phương sai không đổi theo thời gian. Vì vậy, nó không phải là ở tất cả
rõ ràng ACF mẫu đang ước tính những gì cho một quá trình không cố định. Tuy nhiên, đối với
loạt không ổn định, ACF mẫu thường không chết nhanh chóng vì độ trễ
tăng. Điều này là do xu hướng chuỗi không tĩnh trôi chậm, hoặc lên hoặc
giảm, với “xu hướng” rõ ràng. Các giá trị của rk không cần lớn ngay cả đối với độ trễ thấp, nhưng
thường là họ.
Hãy xem xét chuỗi thời gian giá dầu được trình bày trong Phụ lục 5.1 trên trang 88. Mẫu
ACF cho logarit của những dữ liệu này được hiển thị trong Phụ lục 6.18. Tất cả các giá trị được hiển thị là
"Xa đáng kể so với 0" và mô hình duy nhất có lẽ là giảm tuyến tính với
tăng độ trễ. PACF mẫu (không được hiển thị) cũng không xác định.
Hình 6.18 ACF mẫu cho Chuỗi thời gian giá dầu
0,8
ACF 0,4
0,0
2 4 6 số 8 10 12 14 16 18 20 22
Lỗi
> dữ liệu (oil.price)
> acf (as.vector (dầu. giá), xaxp = c (0,24,12))
ACF mẫu được tính toán dựa trên sự khác biệt đầu tiên của các nhật ký của chuỗi giá dầu
được thể hiện trong Phụ lục 6.19. Bây giờ mô hình xuất hiện rõ ràng hơn nhiều - sau khi phân
biệt, mô hình trung bình động bậc 1 có vẻ phù hợp. Mô hình cho bản gốc
Khi đó chuỗi giá dầu sẽ là mô hình IMA (1,1) không cố định. (ACF “quan trọng”
ở độ trễ 15, 16 và 20 hiện bị bỏ qua.)
Machine Translated by Google
Phụ lục 6.19 ACF mẫu cho sự khác biệt của chuỗi giá dầu gỗ
0,2
0,1
ACF
0,1
0,0
2 4 6 số 8 10 12 14 16 18 20 22
Lỗi
> acf (diff (as.vector (log (oil.price))), xaxp = c (0,24,12))
Nếu sự khác biệt đầu tiên của một chuỗi và ACF mẫu của nó dường như không hỗ trợ
mô hình ARMA tĩnh, thì chúng tôi lấy một sự khác biệt khác và tính toán lại mẫu
ACF và PACF để tìm kiếm các đặc điểm của quy trình ARMA tĩnh. Thường là một
hoặc nhiều nhất là hai sự khác biệt, có thể được kết hợp với một lôgarit hoặc phép biến đổi khác,
sẽ thực hiện việc giảm này đến trạng thái đứng yên. Các thuộc tính bổ sung của ACF mẫu
được tính toán trên dữ liệu phi tĩnh được đưa ra trong Wichern (1973), Roy (1977) và Hasza
(1980). Xem thêm Box, Jenkins, và Reinsel (1994, trang 218).
Từ bài tập 2.6 trang 20, chúng ta biết rằng sự khác biệt của bất kỳ chuỗi thời gian đứng yên nào
cũng đứng yên. Tuy nhiên, chênh lệch quá mức đưa các mối tương quan không cần thiết vào một
hàng loạt và sẽ làm phức tạp quá trình mô hình hóa.
Ví dụ: giả sử chuỗi quan sát của chúng tôi, {Yt }, trên thực tế là một cuộc dạo chơi ngẫu nhiên để một
sự khác biệt sẽ dẫn đến một mô hình nhiễu trắng rất đơn giản
Y t
= -
Yt Yt 1– = et
Tuy nhiên, nếu chúng ta khác biệt một lần nữa (nghĩa là chênh lệch quá mức), chúng ta có
- =
2Yt et 1– _
là một mô hình MA (1) nhưng với θ = 1. Nếu chúng ta lấy hai điểm khác biệt trong tình huống này, chúng ta
không cần thiết phải ước lượng giá trị chưa biết của θ. Chỉ định mô hình IMA (2,1)
sẽ không thích hợp ở đây. Mô hình đi bộ ngẫu nhiên, có thể được coi là
IMA (1,1) với θ = 0, là mô hình chính xác .
† Mô hình đi bộ ngẫu nhiên cũng có thể được coi là ARI (1,1) với φ = 0 hoặc như AR
không tĩnh (1) với φ = 1.
Machine Translated by Google
ible model — xem Phần 4.5 về các vấn đề 79. † Mô hình không thể thay đổi cũng tạo ra sự nghiêm túc
trên trang khi chúng tôi cố gắng ước tính các tham số của chúng — xem Chương 7.
Để minh họa chênh lệch quá mức, hãy xem xét bước đi ngẫu nhiên được hiển thị trong Phụ lục 2.1 trên
trang 14. Lấy một điểm khác biệt sẽ dẫn đến nhiễu trắng - một mô hình rất đơn giản. Nếu chúng ta
lấy nhầm hai điểm khác biệt (nghĩa là chênh lệch quá mức) và tính ACF mẫu,
chúng ta thu được đồ thị trong Hình 6.20. Dựa trên cốt truyện này, chúng tôi có thể sẽ chỉ định
ít nhất một mô hình IMA (2,1) cho chuỗi ban đầu và sau đó ước tính MA không cần thiết
tham số. Chúng tôi cũng có một giá trị ACF mẫu đáng kể ở độ trễ 7 để suy nghĩ và xử lý
với.
Hình 6.20 ACF mẫu của Đi bộ ngẫu nhiên sai biệt quá mức
0,4
0,2
ACF
0,2
0,6
2 4 6 số 8 10 12 14 16
Lỗi
> dữ liệu (rwalk)
> acf (diff (rwalk, chênh lệch = 2), ci.type = 'ma', xaxp = c (0,18,9))
Ngược lại, Phụ lục 6.21 hiển thị ACF mẫu của sự khác biệt đầu tiên của chuỗi đi bộ dom đã
chạy. Khi xem biểu đồ này, chúng tôi có thể muốn xem xét sự chính xác
mô hình — sự khác biệt đầu tiên trông rất giống tiếng ồn trắng.
=
† Trong ký hiệu dịch chuyển ngược, nếu mô hình chính xác là φ () B ()
1 - B Yt θ () B e t
, quá chênh lệch
= 1 - B )e =
(dẫn đến φ () B 1()- B 2Yt θ () B θ '() B e , giả sử, trong đó θ '() B = () 1
θ - B () B
tt θ '() B
và gốc "bị cấm" trong tại B = 1 là hiển nhiên.
Machine Translated by Google
Phụ lục 6.21 ACF mẫu của Đi bộ ngẫu nhiên có sai biệt chính xác
0,2
ACF
0,2
0,0
2 4 6 số 8 10 12 14 16
Lỗi
> acf (diff (rwalk), ci.type = 'ma', xaxp = c (0,18,9))
Để tránh chênh lệch quá mức, chúng tôi khuyên bạn nên xem xét cẩn thận từng điểm khác biệt trong
kế thừa và giữ nguyên tắc phân tích luôn được ghi nhớ — các mô hình nên
đơn giản, nhưng không quá đơn giản.
Trong khi sự phân rã tuyến tính gần đúng của ACF mẫu thường được coi là một triệu chứng
chuỗi thời gian cơ bản là không ổn định và yêu cầu sự khác biệt, nó cũng hữu ích để
định lượng bằng chứng về sự không bất thường trong cơ chế tạo dữ liệu. Điều này có thể là
được thực hiện thông qua kiểm tra giả thuyết. Xem xét mô hình
trong đó {Xt } là một quá trình tĩnh. Quá trình {Yt } là không tĩnh nếu hệ số α
= 1, nhưng nó đứng yên nếu | α | <1. Giả sử rằng {Xt } là một quá trình AR (k) : Xt = φ1Xt - 1 +
…
+ φkXt - k + et . Theo giả thiết rỗng rằng α = 1, Xt = Yt - Yt - 1. Đặt a = α -
1, chúng tôi có
- = - + Xt
Yt Yt 1– (α 1) Yt 1–
= + ++ +
aYt 1– φ1Xt 1– … ΦkXt k - et (6.4.1)
= + - + + - +
( aYt
1– φ1 Yt 1– Yt 2– ) (… Φk Yt k - Yt k 1–– ) et
trong đó a = 0 theo giả thuyết rằng Yt là sự khác biệt không cố định. Mặt khác,
nếu {Yt } đứng yên sao cho 1 <α <1, thì có thể xác minh rằng Yt vẫn thỏa mãn một
phương trình tương tự như phương trình trên nhưng với các hệ số khác nhau; ví dụ, a =
…
(1 - φ1 - φk) (1 - α) <0. Thật vậy, {Yt } khi đó là một quá trình AR (k + 1) có phương trình
biểu diễn đặc tính AR được cho bởi Φ (x) (1 - αx) = 0 , trong đó Φ (x) = 1 - φ1x -… - φkxk . Nên
giả thuyết rỗng tương ứng với trường hợp đa thức đặc trưng AR có
căn bậc hai và giả thuyết thay thế nói rằng nó không có căn bậc hai. Do đó,
Machine Translated by Google
kiểm tra số lượng chênh lệch với kiểm tra một đơn vị gốc trong khối đa giác đặc trưng AR
của {Yt }.
Bằng cách phân tích ở trên, giả thuyết rỗng rằng α = 1 (tương đương a = 0) có thể được
kiểm tra bằng cách hồi quy sự khác biệt đầu tiên của chuỗi thời gian quan sát trên độ trễ 1
của chuỗi quan sát và k độ trễ trong quá khứ của sự khác biệt đầu tiên của loạt quan sát.
Sau đó, chúng tôi kiểm tra xem hệ số a = 0 — giả thuyết rỗng cho rằng quá trình là khác
biệt không cố định. Đó là, quá trình này là không ổn định nhưng trở thành tĩnh sau lần đầu
tiên khác biệt. Giả thuyết thay thế là a <0 và do đó {Yt } là đứng yên.
Thống kê kiểm định Dickey-Fuller (ADF) tăng cường là thống kê t của hệ số ước tính đủ a từ
phương pháp hồi quy bình phương nhỏ nhất. Tuy nhiên, thống kê kiểm định ADF không được phân
phối xấp xỉ t theo giả thuyết rỗng; thay vào đó, nó có một phân phối mẫu lớn không chuẩn
nhất định theo giả thuyết rỗng của một đơn vị gốc. May mắn thay, điểm phần trăm của phân
phối giới hạn (null) này đã được lập bảng; xem Fuller (1996).
Trong thực tế, ngay cả sau khi phân biệt lần đầu, quá trình này có thể không phải là
một quá trình AR có thứ tự hữu hạn, nhưng nó có thể gần đúng với một số quá trình AR với
thứ tự AR tăng theo kích thước mẫu. Said và Dickey (1984) (xem thêm Chang và Park, 2002) đã
chỉ ra rằng với thứ tự AR tăng theo kích thước mẫu, thử nghiệm ADF có cùng phân phối rỗng
mẫu lớn như trường hợp chênh lệch đầu tiên của chuỗi thời gian là một quy trình AR có thứ
tự hữu hạn. Thông thường, thứ tự AR gần đúng có thể được ước tính trước dựa trên một số
tiêu chí thông tin (ví dụ: AIC hoặc BIC) trước khi thực hiện kiểm tra ADF. Xem Phần 6.5
trên trang 130 để biết thêm thông tin về các tiêu chí AIC và BIC.
Trong một số trường hợp, quá trình có thể có xu hướng không ổn định theo nghĩa là nó
có xu hướng xác định (ví dụ, một số xu hướng tuyến tính) nhưng ngược lại là đứng yên. Một
thử nghiệm gốc đơn vị có thể được thực hiện với mục đích phân biệt điểm ổn định của sự khác
biệt với điểm ổn định của xu hướng. Điều này có thể được thực hiện bằng cách thực hiện kiểm
tra ADF với dữ liệu được chia nhỏ. Tương tự, điều này có thể được thực hiện bằng cách hồi
quy sự khác biệt đầu tiên trên các hiệp biến xác định xu hướng, độ trễ 1 của dữ liệu gốc và
độ trễ trong quá khứ của sự khác biệt đầu tiên của dữ liệu gốc. Thống kê t dựa trên ước
lượng hệ số của độ trễ 1 của dữ liệu gốc cung cấp thống kê thử nghiệm ADF, thống kê này có
phân phối rỗng mẫu lớn không chuẩn khác. Xem Phillips và Xiao (1998) để biết khảo sát về
kiểm thử đơn vị gốc.
Bây giờ chúng tôi minh họa kiểm định ADF với bước đi ngẫu nhiên được mô phỏng trong
Hình 2.1 trên trang 14. Đầu tiên, chúng tôi xem xét việc kiểm tra giả thuyết rỗng của đơn
vị gốc so với giả thuyết thay thế rằng chuỗi thời gian đứng yên với giá trị trung bình chưa
biết. Do đó, hồi quy được xác định bởi Công thức (6.4.1) được tăng thêm một số chặn để cho
phép giá trị trung bình có thể khác không theo giả thuyết thay thế. (Đối với giả thuyết
thay thế rằng quá trình là một quá trình tĩnh có giá trị trung bình bằng 0, thống kê kiểm
định ADF có thể thu được bằng cách chạy hồi quy không liên hợp được xác định bởi Công thức
(6.4.1).) Để thực hiện kiểm tra, nó vẫn phải
tiênxác
củađịnh k. † Theo
dữ liệu, AIC
k được với
tìm sự khác
thấy là 8,biệt đầu
trong
trường hợp đó thống kê thử nghiệm ADF trở thành 0,601, với giá trị p lớn hơn 0,1. ‡ Mặt
† Mã R: ar (diff (rwalk))
Machine Translated by Google
đến thống kê ADF -1,738, với giá trị p vẫn lớn hơn 0,1 . Thứ hai, hãy nhớ lại rằng
ngẫu nhiên được mô phỏng
đi bộ dường như có một xu hướng tuyến tính. Do đó, xu hướng tuyến tính cộng với các dạng lỗi cố định
một giải pháp thay thế hợp lý khác cho giả thuyết vô hiệu của đơn vị gốc (sự khác biệt số
arity). Đối với thử nghiệm này, chúng tôi bao gồm cả thuật ngữ chặn và thời gian hiệp biến trong
hồi quy được xác định bởi Công thức (6.4.1). Với k = 8, thống kê kiểm định ADF bằng 2.289
với giá trị p lớn hơn 0,1; nghĩa là, chúng ta không bác bỏ giả thuyết vô hiệu của căn bậc hai.
Mặt khác, đặt k = 0, thứ tự thực sự chưa biết trong thực tế, kiểm tra ADF
thống kê trở thành 3,49 với giá trị p bằng 0,0501. ‡ Do đó, có bằng chứng yếu
rằng quá trình là tuyến tính-xu hướng không cố định; nghĩa là, quá trình tương đương với xu hướng thời gian tuyến tính
cộng với sai số cố định, trái với sự thật rằng quá trình là một bước đi ngẫu nhiên,
là khác biệt không cố định! Ví dụ này cho thấy rằng với kích thước mẫu nhỏ, có thể khó
để phân biệt giữa tính bất thường của xu hướng và tính không bất thường của sự khác biệt.
Một số cách tiếp cận khác đối với đặc tả mô hình đã được đề xuất kể từ Box và
Công việc quan trọng của Jenkins. Một trong những nghiên cứu được nghiên cứu nhiều nhất là rion Ghi chép
thông tin (AIC) của Akaike (1973 ). Tiêu chí này cho biết để chọn mô hình giảm thiểu
AIC = - 2 log
khả năng
() +tối
k đa 2 (6.5.1)
AIC là công cụ ước lượng phân kỳ Kullback-Leibler trung bình của mô hình kết hợp
esti với mô hình thực. Gọi p (y1, y2,…, yn) là pdf thực sự của Y1, Y2, …, Yn,
và qθ (y1, y2,…, yn) là pdf tương ứng trong mô hình với tham số θ. Các
Phân kỳ Kullback-Leibler của qθ từ p được xác định bởi công thức
∞ ∞ ∞ () ,,,
… p y1 y2 … yn
D (p qθ ,) = () ,,, log ddd yn
p y1
() y2
,,,… qθ
yn y1 y2 … yn
--------------------------------------------------
-------- y1 y2…
–∞ –∞ –∞
^
AIC ước tính , , đâu là công cụ ước tính khả năng xảy ra tối đa của
E Dpqθ ˆ [ )] θ (tham
số vectơ θ. Tuy nhiên, AIC là một công cụ ước lượng chệch và độ chệch có thể áp dụng
cho tham số lớn trên mỗi tỷ lệ dữ liệu. Hurvich và Tsai (1989) đã chỉ ra rằng độ chệch
có thể được loại bỏ gần như bằng cách thêm một thuật ngữ hình phạt nonstochastic khác vào
AIC, dẫn đến AIC đã hiệu chỉnh, được ký hiệu là AICc và được xác định bằng công thức
2 ()
( k 1+ ) k 2+
AICc AIC+ = ------------------------------------- (6.5.2)
nk 2––
ở trên loại trừ phương sai tiếng ồn. Kết quả mô phỏng của Hurvich và Tsai (1989) cho thấy rằng
đối với các trường hợp có k / n lớn hơn 10%, AICc hoạt động tốt hơn nhiều mô hình khác
Một cách tiếp cận khác để xác định đơn đặt hàng ARMA là chọn một mô hình nhỏ
bắt chước Tiêu chí Thông tin Schwarz Bayesian (BIC) được định nghĩa là
BIC = - log
khả(2
năng lớn nhất) + kn log () (6.5.3)
Nếu quy trình thực tuân theo mô hình ARMA (p, q), thì người ta biết rằng các đơn đặt hàng được
xác định bằng cách tối thiểu hóa BIC là nhất quán; nghĩa là, họ tiếp cận các đơn đặt hàng thực như
kích thước mẫu tăng lên. Tuy nhiên, nếu quy trình thực sự không phải là quy trình ARMA bậc hữu hạn,
sau đó giảm thiểu AIC giữa một lớp ngày càng lớn các mô hình ARMA thích
thuộc tính hấp dẫn mà nó sẽ dẫn đến một mô hình ARMA tối ưu gần với sự thật
Bất kể chúng tôi sử dụng AIC hay BIC, các phương pháp này đều yêu cầu thực hiện
Ước lượng khả năng tối đa. Tuy nhiên, ước tính khả năng xảy ra tối đa cho một
Mô hình ARMA dễ gặp các vấn đề về số do khả năng xảy ra đa phương thức
chức năng và vấn đề trang bị quá mức khi lệnh AR và MA vượt quá giá trị true
đơn đặt hàng. Hannan và Rissanen (1982) đã đề xuất một giải pháp thú vị và thiết thực để
vấn đề này. Quy trình của họ bao gồm việc đầu tiên lắp một quy trình AR bậc cao với
thứ tự được xác định bằng cách giảm thiểu AIC. Bước thứ hai sử dụng phần còn lại từ
bước đầu tiên làm proxy cho các điều khoản lỗi không thể quan sát được. Do đó, mô hình ARMA (k, j) có thể là
ước tính gần đúng bằng cách hồi quy chuỗi thời gian của chính nó trễ 1 đến k với nhau
với độ trễ từ 1 đến j của phần dư từ quá trình tự động hóa bậc cao; BIC của cái này
mô hình tự hồi quy là một ước tính của BIC thu được với khả năng xảy ra tối đa. Hannan và Rissanen
(1982) đã chứng minh rằng giảm thiểu giá trị gần đúng
BIC vẫn dẫn đến ước tính nhất quán về các lệnh ARMA.
Xác định thứ tự liên quan đến vấn đề tìm tập con của các hệ số khác không của mô hình ARMA
với các đơn hàng ARMA đủ cao. Một tập hợp con ARMA (p, q)
mô hình là một mô hình ARMA (p, q) với một tập con các hệ số của nó được biết là không. Vì
ví dụ, mô hình
Yt = 0,8Yt 12 + et + 0,7et 12 (6.5.4)
là một mô hình ARMA tập hợp con (12,12) hữu ích để lập mô hình một số thời gian theo mùa hàng tháng
loạt. Đối với các mô hình ARMA có đơn đặt hàng rất cao, chẳng hạn như ARMA trước đó (12,12)
mô hình, việc tìm kiếm một mô hình ARMA tập hợp con xấp xỉ đầy đủ điểm chuyên nghiệp cơ bản là
quan trọng hơn từ quan điểm thực tế hơn là chỉ đơn giản xác định ARMA
đơn đặt hàng. Phương pháp của Hannan và Rissanen (1982) để ước tính các đơn hàng ARMA
có thể được mở rộng để giải quyết vấn đề tìm kiếm một mô hình ARMA tập con tối ưu.
† Độ gần được đo bằng phân kỳ Kullback-Leibler — một phép đo độ lệch giữa các
mô hình. Xem Shibata (1976) và thảo luận trong Stenseth et al. (2004).
Machine Translated by Google
Thật vậy, một số tiêu chí lựa chọn mô hình (bao gồm AIC và BIC) của tập hợp con
Mô hình ARMA (p, q) (2p được + q trong số chúng!) có thể xấp xỉ, toàn bộ và nhanh chóng
tính bằng phương pháp hồi quy theo bước nhảy vọt (Furnival và Wilson, 1974)
được áp dụng cho hồi quy tập hợp con của Yt với độ trễ của chính nó và độ trễ của phần dư từ một
Cần thận trọng khi kiểm tra một vài mô hình ARMA tập hợp con tốt nhất (ví dụ:
BIC) để đưa ra một số mô hình dự kiến hữu ích để nghiên cứu thêm. Mô hình của
độ trễ nào của chuỗi thời gian được quan sát và quá trình lỗi nào đi vào mô hình tập hợp con var ious
best có thể được tóm tắt ngắn gọn trong một màn hình như được hiển thị trong
Hình 6.22. Bảng này dựa trên mô phỏng của mô hình ARMA (12,12) được hiển thị trong
Phương trình (6.5.4). Mỗi hàng trong triển lãm tương ứng với một mô hình ARMA tập hợp con trong đó
các ô của các biến được chọn cho mô hình được tô bóng. Các mô hình được sắp xếp
theo BIC của họ, với các mô hình tốt hơn (BIC thấp hơn) được đặt ở các hàng cao hơn và với
sắc thái đậm hơn. Hàng trên cùng cho chúng ta biết rằng mô hình ARMA tập hợp con (14,14) với BIC ước
tính nhỏ chỉ chứa độ trễ 8 và 12 của chuỗi thời gian được quan sát và độ trễ 12 của lỗi
quá trình. Mô hình tốt nhất tiếp theo có độ trễ 12 của chuỗi thời gian và độ trễ 8 trong số các lỗi,
trong khi mô hình tốt thứ ba chứa độ trễ 4, 8 và 12 của chuỗi thời gian và độ trễ 12 của
các lỗi. Trong chuỗi thời gian mô phỏng của chúng tôi, mô hình tốt thứ hai là mô hình tập hợp con thực sự.
Tuy nhiên, các giá trị BIC cho ba mô hình này đều rất giống nhau và cả ba (cộng
mô hình tốt thứ tư) đáng được nghiên cứu thêm. Tuy nhiên, độ trễ 12 của chuỗi thời gian
và lỗi đó là hai biến thường gặp nhất trong các tập hợp con khác nhau
các mô hình được tóm tắt trong triển lãm, cho thấy rằng có lẽ chúng quan trọng hơn
Phụ lục 6.22 Lựa chọn ARMA cho tập con tốt nhất dựa trên BIC
(Intercept)
error
error
lag3
lag12
test
lag7
test
lag6
test
lag5
test
lag4
test
lag3
test
lag2
test
lag1
test -lỗi
lag11
lag1
lag10
-lỗi
test
test
lỗi
test
test
test
lag9
test
lag8 lag7
lag6
-lỗi
lag5
-lỗi
lag4
-lỗi
-lỗi
lag14
lag13
lag2 8 lag14
lag13
lag11
-lỗi
lag10
-lỗi
lỗi
-lỗi
-lỗi
-lỗi9
12
-lỗi
lỗi
140
140
140
BIC 140
140
140
130
130
Machine Translated by Google
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 133
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế
Bây giờ hãy xem xét đặc điểm kỹ thuật của các mô hình cho một số chuỗi thời gian thực tế mà chúng ta đã thấy
Tổng lượng mưa hàng năm của Los Angeles được trình bày trong Phụ lục 1.1 trên trang 2. Trong Chương
3, chúng tôi đã lưu ý trong Phụ lục 3.17 trên trang 50, rằng lượng mưa không được phân phối bình
thường. Như được thể hiện trong Hình 6.23, việc sử dụng logarit cải thiện tính chuẩn mực theo
Biểu đồ 6.23 QQ Bình thường Đồ thị Logarit của Lượng mưa hàng năm LA
•
• •
• • • • •
• • • • • • • •
• • • • • • • • • •
• •• •• •• •• •• •• •• •• •• •• ••
• • • • • • • • • • • • • • •
• • • • • • • • • • • • • • •
• •• •• •• •• •• •• •• •• •• •• •• •• •• •• •• (• •
• • • •
Lượng
mẫu
tử
•••
•••
•• ••••
• • • •
••••••••••••••••
• • • • • •
•••••••••••••••••••••••••••••••
•• •• •• •• •• •• •• •• ••
• • • • • • • • •
••
3,5
3,0
2,5
2,0
1,5
(•)
2 1 0 1 2
Lượng tử lý thuyết
> dữ liệu (larain); win.graph (width = 2.5, height = 2.5, pointsize = 8)>
qqnorm (log (larain)); qqline (log (larain))
Machine Translated by Google
Phụ lục 6.24 hiển thị các tự tương quan mẫu cho logarit của năm
loạt mưa.
Hình 6.24 ACF mẫu về Logarit của lượng mưa hàng năm LA
0,1
ACF
0,1
0,2
0,0
2 4 6 số 8 10 12 14 16 18 20
Lỗi
> win.graph (chiều rộng = 4,875, chiều cao = 3, kích thước điểm = 8)
> acf (log (larain), xaxp = c (0,20,10))
Việc chuyển đổi nhật ký đã cải thiện tính bình thường, nhưng không có gì có thể nhận biết được
sự phụ thuộc trong chuỗi thời gian này. Chúng tôi có thể lập mô hình logarit của lượng mưa hàng năm
là các biến ngẫu nhiên độc lập, bình thường với trung bình 2,58 và độ lệch chuẩn 0,478.
Cả hai giá trị này đều được tính bằng đơn vị log (inch).
Thuộc tính màu của quá trình hóa chất công nghiệp được hiển thị trong Phụ lục 1.3 trên trang 3,
cho thấy nhiều hứa hẹn hơn về mô hình chuỗi thời gian thú vị — đặc biệt là dựa trên
sự phụ thuộc của các lô kế tiếp được thể hiện trong Phụ lục 1.4 trên trang 4. ACF mẫu
được vẽ trong Hình 6.25 thoạt nhìn có thể gợi ý mô hình MA (1), vì chỉ có độ trễ 1
tự tương quan khác 0 có ý nghĩa.
Machine Translated by Google
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 135
Phụ lục 6.25 ACF mẫu cho dòng thuộc tính màu
0,4
0,2
0,0
ACF
0,4
2 4 6 số 8 10 12 14
Lỗi
> dữ liệu (màu); acf (color, ci.type = 'ma')
Tuy nhiên, sự xuất hiện sóng hình sin được làm ẩm của biểu đồ khuyến khích chúng ta xem
xét quá trình tự tương quan từng phần của mẫu. Hình 6.26 hiển thị âm mưu đó, và bây giờ chúng tôi
thấy rõ rằng mô hình AR (1) đáng được xem xét đầu tiên. Như mọi khi, các mô hình dự kiến cụ thể
của chúng tôi là dự kiến và có thể sửa đổi trong giai đoạn chẩn đoán mô hình
của việc xây dựng mô hình.
Phụ lục 6.26 ACF một phần mẫu cho dòng thuộc tính màu
phần
một
ACF
0,2
0,4
0,2
0,0
2 4 6 số 8 10 12 14
Lỗi
> pacf (màu)
Machine Translated by Google
Chuỗi thời gian về số lượng thỏ rừng phong phú hàng năm của Vịnh Hudson ở Canada được trình bày trong
Hình 1.5 trên trang 5, và sự phụ thuộc hàng năm được chứng minh trong
Hình 1.6. Trong tài liệu, người ta đã gợi ý rằng một phép biến đổi có thể được sử dụng để
tạo ra một mô hình tốt cho những dữ liệu này. Hình 6.27 hiển thị khả năng ghi nhật ký như một chức
năng của tham số công suất, λ. Cực đại xảy ra ở λ = 0,4, nhưng hệ thức trans căn bậc hai với λ = 0,5
nằm trong khoảng tin cậy đối với λ. Chúng tôi sẽ lấy
căn bậc hai của các giá trị phong phú cho tất cả các phân tích sâu hơn.
Hình 6.27 Kết quả chuyển đổi điện năng Box-Cox cho sự dồi dào
95% 95%
50
nhật
năng
ghi
Khả
ký
50
2 1 0 1 2
Hình 6.28 cho thấy ACF mẫu cho loạt chuyển đổi này. Khá mạnh
tự tương quan lag 1 chiếm ưu thế, nhưng một lần nữa, có một dấu hiệu mạnh mẽ về hành vi tiềm ẩn của
oscil bị hãm.
Machine Translated by Google
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 137
Phụ lục 6.28 ACF mẫu cho Căn bậc hai của Hare dồi dào
0,6
0,2
ACF
0,2
0,6
2 4 6 số 8 10 12 14
Lỗi
> acf (hare ^ .5)
Tự tương quan từng phần mẫu cho chuỗi đã biến đổi được hiển thị trong Phần trình bày
6.29. Nó cung cấp bằng chứng mạnh mẽ để hỗ trợ mô hình AR (2) hoặc có thể là AR (3) cho những
dữ liệu.
Phụ lục 6.29 ACF một phần mẫu cho Căn bậc hai của Hare dồi dào
0,4
0,0
phần
một
ACF
0,4
2 4 6 số 8 10 12 14
Lỗi
> pacf (thỏ rừng ^ .5)
Machine Translated by Google
Trong Chương 5, chúng tôi bắt đầu xem xét chuỗi thời gian giá dầu hàng tháng và lập
luận một cách chặt chẽ rằng sự khác biệt của logarit có thể được coi là đứng yên — xem Hình
5.1 trên trang 88. Triển khai phần mềm của thử nghiệm đơn vị gốc Augmented Dickey-Fuller
được áp dụng cho nhật ký của giá gốc dẫn đến thống kê thử nghiệm là 1,119 và giá trị p
của 0,9189. Với sự cố định là giả thuyết thay thế, điều này cung cấp bằng chứng mạnh mẽ
về tính không ổn định và sự phù hợp của việc lấy sự khác biệt của các bản ghi. Đối với điều này
kiểm tra, phần mềm đã chọn giá trị k = 6 trong Công thức (6.4.1) trên trang 128 dựa trên
lý thuyết mẫu lớn.
Hình 6.30 cho thấy bảng EACF tóm tắt về sự khác biệt của các logarit
của dữ liệu giá dầu. Bảng này gợi ý mô hình ARMA với p = 0 và q = 1.
Phụ lục 6.30 ACF mở rộng cho sự khác biệt của lôgarit của chuỗi giá dầu
AR / MA 0 1 2 3 4 5 6 7 số 8 9 10 11 12 13
0 xoooooo ooooooo
1 xxooooooooxooo
2 oxooooo ooooooo
3 oxooooo ooooooo
4 oxxoooo ooooooo
5 oxoxoooooooooo
6 oxoxoooooooooo
7 xxoxoooooooooo
6.6 Đặc điểm kỹ thuật của một số chuỗi thời gian thực tế 139
Kết quả của cách tiếp cận ARMA tập con tốt nhất được hiển thị trong Hình 6.31.
Hình 6.31 Mô hình ARMA bộ phụ tốt nhất cho sự khác biệt của bản ghi (dầu)
chặn)
(Đánh DiffLog
lag1 DiffLog
lag2 DiffLog
lag3 DiffLog
lag4 DiffLog-
lag5 DiffLog
lag6 DiffLog-
lag7 error-
lag1 error
lag2 error-
lag3 error-
lag4 error-
lag5 error-
lag6 error-
lag7
3,4
0,91
BIC
2,5
5.2
8.8
13
18
Ở đây gợi ý là Yt = log (Oilt ) nên được mô hình hóa theo Yt - 1 và Yt - 4 và không cần
độ trễ (1,1,0)
trong các
trên
điều
logarit
khoản cũng
lỗi. cần
Mô hình
được tốt
nghiên
nhất
cứu
thứ
thêm.
hai bỏ qua số hạng trễ 4 để mô hình ARIMA