You are on page 1of 7

Ví dụ 1 :

Harry Vernon đã thu thập dữ liệu về số lượng sản phẩm được bán bởi Cửa hàng
âm nhạc của Vernon vào năm ngoái. Dữ liệu được trình bày trong bảng 1.

Bảng 1

Bảng 2
Bảng 2 cho thấy các phép tính dẫn đến tính toán hệ số tự tương quan với độ
trễ(Lag) là 1 tháng. Hình 4 chứa sơ đồ phân tán của các cặp quan sát ¿ ¿).

Với hệ số tương quan ( r 1) có độ trễ là 1 tháng hoặc tương quan giữa Y t và Y t −1


được tính bằng cách sử dụng dữ liệu từ bảng 2 và công thức 1 (với công thức 1
là)

Từ đó ta có :
Theo gợi ý từ sơ đồ phân tán 4:

Ta thấy hệ số tương quan với độ trễ dương 1 tồn tại trong suốt thời gian
này. Hệ số tương quan giữa Y t và Y t −1 là 0.572. Điều này có nghĩa là doanh số
bán VCR hàng tháng liên tiếp có mối tương quan nào đó với nhau. Thông tin
này có thể cung cấp cho Harry những hiểu biết có giá trị về chuỗi thời gian của
anh ấy, có thể giúp anh ấy chuẩn bị sử dụng phương pháp dự báo nâng cao và có
thể cảnh báo anh ấy về việc sử dụng phân tích hồi quy với dữ liệu của mình.

Hệ số tương quan với độ trễ là 2 tháng (r 2) :


Ta thấy rằng r 1 >r 2 điều này thể hiện rằng độ trễ càng lớn thì hệ số tương quan
càng giảm.

Dưới đây là biểu đồ tương quan với độ trễ khác nhau của chuỗi thời gian.
Với cách hiển thị như trong Hình 5, có thể nghiên cứu các mẫu dữ liệu, bao gồm
xu hướng và tính thời vụ. Hệ số tương quan cho các độ trễ thời gian khác nhau
của một biến có thể được sử dụng để trả lời các câu hỏi sau về chuỗi thời gian:

1. Dữ liệu có ngẫu nhiên không?

2. Dữ liệu có xu hướng không (chúng không cố định)?

3. Dữ liệu có cố định không?

4. Dữ liệu có mang tính thời vụ không?


Khi dữ liệu ngẫu nhiên : thì các mối tương quan tự động giữa Yt và tại bất
kỳ độ trễ thời gian k nào đều gần bằng 0. Các giá trị liên tiếp của chuỗi thời gian
không liên quan đến nhau.

Khi dữ liệu có xu hướng các quan sát liên tiếp có mối tương quan cao và
các hệ số tương quan thường khác biệt đáng kể so với 0 trong một số độ trễ thời
gian đầu tiên và sau đó giảm dần về 0 khi số lượng độ trễ tăng lên.

Khi dữ liệu có tính cố định khi giá trị trung bình, phương sai và cấu trúc
tự tương quan không đổi theo thời gian.

Khi dữ liệu có tính mùa hệ số tự tương quan đáng kể sẽ xảy ra ở độ trễ


thời gian theo mùa hoặc bội số của độ trễ theo mùa. Độ trễ theo mùa là 4 đối với
dữ liệu hàng quý và 12 đối với dữ liệu hàng tháng.

Để xác định liệu hệ số tự tương quan có khác biệt đáng kể so với 0 đối với
dữ liệu trong Bảng 1 hay không các nhà nghiên cứu đã chứng minh rằng các hệ
số tự tương quan của dữ liệu ngẫu nhiên có phân phối mẫu có thể gần đúng bằng
một đường cong chuẩn có giá trị trung bình bằng 0 và độ lệch chuẩn gần đúng là
1
(với n là số lượng quan sát trong chuỗi thời gian )
√n

Công thức dưới đây, để tính độ lệch chuẩn (hoặc sai số chuẩn) của hệ số
tự tương quan. Công thức này giả định rằng bất kỳ hiện tượng tự tương quan nào
trước độ trễ thời gian k đều khác 0 và bất kỳ hiện tượng tự tương quan nào tại
1
thời điểm trễ lớn hơn hoặc bằng k là : (vd 2 sẽ dùng công thức này )
√n
Thay vì tìm sai số cho từng giá trị r k Tác giả đề xuất sử dụng kiểm định
portmanteau dựa trên thống kê Ljung-Box Q( sẽ được minh họa ở ex3) :

Tác giả giới thiệu mô hình nhiễu trắng thể hiện trong công thức dưới đây :

Với c là mức tổng thể ε t là sai số .

Để biết data ở bảng 1 có phù hợp với mô hình trên hay không ex2,3 sẽ
giải quyết vấn đề trên.

You might also like