You are on page 1of 7

PHẦN DỊCH

Ví dụ 2
Một thử nghiệm giả thuyết được tạo ra để xác định xem một hệ số tự tương quan cụ thể
có khác biệt đáng kể so với 0, đối với biểu đồ tương quan được hiển thị trong Hình 5 hay không.
Các giả thuyết không và giả thuyết thay thế để kiểm tra tầm quan trọng của hệ số tự tương quan
tổng thể độ trễ 1 là:
H0: p1 = 0
H1: p1 ≠ 0
Nếu giả thuyết H1 đúng, thống kê kiểm định

có phân bố t với df = n - 1 . Tại đó, n – 1 = 12 – 1 = 11 , xét với mức ý nghĩa 5%, nguyên tắc
quyết định như sau:
Nếu t < 2.2 hoặc t > 2.2, bác bỏ H0 và kết luận tự tương quan độ trễ 1 khác biệt đáng kể so với 0.
Các giá trị quan trọng ± 2.2 là điểm trên và dưới 0.025 của phân phối t với 11 bậc tự do. Sai số

chuẩn của r1 là SE(r1) =


√ 1
12
= √ 0.083= 0.289 , và giá trị của thống kê kiểm định là:

Sử dụng nguyên tắc quyết định như trên, H0 : p1 = 0 không thể bị bác bỏ, vì -2.2 < 1.98 < 2.2.
Lưu ý giá trị của thống kê kiểm định, t = 1.98, giống với số trong hàng Lag 1 dưới tiêu đề T
trong đầu ra Minitab ở Hình 5.

Hình trích từ Hình 5: Biểu đồ tương quan hoặc Hàm tự


tương quan cho dữ liệu được sử dụng trong ví dụ 1
Các giá trị T trong đầu ra Minitab chỉ đơn giản là các giá trị của thống kê kiểm định để
kiểm tra tự động tương quan bằng không ở các độ trễ khác nhau, xét:
H0: p1 = 0
H1: p1 ≠ 0
Và thống kê kiểm định

Sử dụng phương trình 2,

Và ta được

Kết quả này phù hợp với giá trị T cho Lag 2 trong đầu ra Minitab trong Hình 5.
Sử dụng nguyên tắc quyết định như trên, H0 : p1 = 0 không thể bị bác bỏ ở mức 0.05, vì -2.2 <
1.25 < 2.2. Một cách khác để kiểm tra tự tương quan đáng kể là xây dựng giới hạn tin cậy 95%
tập trung ở 0. Các giới hạn này cho độ trễ thời gian 1 và 2 như sau:
Tự động tương quan khác biệt đáng kể với 0 được chỉ định bất cứ khi nào một giá trị của
rk nằm ngoài giới hạn tin cậy tương ứng. Giới hạn tin cậy 95% được thể hiện trong Hình 5 bằng
các đường đứt nét trong màn hình đồ họa của hàm tự tương quan.

Hình trích từ Hình 5: Biểu đồ tương quan hoặc Hàm tự


tương quan cho dữ liệu được sử dụng trong ví dụ 1

Ví dụ 3
Minitab được sử dụng để tạo chuỗi thời gian gồm 40 số giả ngẫu nhiên có ba chữ số được
hiển thị trong Bảng 3. Hình 6 cho thấy biểu đồ chuỗi thời gian của những dữ liệu này. Bởi vì
những dữ liệu này là ngẫu nhiên (độc lập với nhau và tất cả từ cùng tổng thể), tự tương quan cho
tất cả các độ trễ thời gian về mặt lý thuyết phải bằng không.

Bảng 3: Chuỗi thời gian gồm 40 số ngẫu nhiên cho ví dụ 3


Tất nhiên, 40 giá trị trong Bảng 3 chỉ là một tập hợp của một số lượng lớn các mẫu có thể
có kích thước 40. Hầu hết các mẫu này sẽ tạo ra các mẫu tự tương quan gần bằng không. Tuy
nhiên, có thể có một mẫu sẽ tạo ra hệ số tự tương quan khác biệt đáng kể so với 0 một cách ngẫu
nhiên. Tiếp theo, hàm tự tương quan hiển thị trong Hình 7 được xây dựng bằng Minitab. Lưu ý
rằng hai đường đứt nét hiển thị giới hạn tin cậy 95%. Mười độ trễ thời gian được kiểm tra và tất
cả các hệ số tự tương quan riêng lẻ nằm trong các giới hạn này. Không có lý do gì để nghi ngờ
rằng mỗi hệ số tự tương quan cho 10 độ trễ đầu tiên bằng không. Tuy nhiên, dù các tương quan
mẫu riêng lẻ không khác biệt đáng kể so với không, liệu tổng các giá trị tương quan đầu tiên r k
trong 10 giá trị đó có lớn hơn so với những gì ta mong đợi dưới giả thuyết không có tương quan
tự lặp lại ở bất kỳ độ trễ nào không? Câu hỏi này được trả lời bằng thống kê Ljung-Box Q (LBQ
trong Minitab).

Hình 6: Sơ đồ chuỗi thời gian gồm 40 số ngẫu nhiên được sử dụng trong ví dụ 3

Hình 7: Hàm tự tương quan cho dữ liệu được sử dụng trong ví dụ 3


Nếu không có hiện tượng tự tương quan ở bất kỳ độ trễ nào, thống kê Q có phân phối khi
bình phương, trong trường hợp này là df=10. Do đó, giá trị lớn của Q (ở phần cuối của phân bố
khi bình phương) là bằng chứng chống lại giả thuyết không. Từ Hình 7, giá trị của Q (LBQ) cho
10 thời gian trễ là 7,75. Từ Bảng 4 trong Phụ lục: Bảng, điểm 0,05 trên của phân bố khi bình
phương với 10 bậc tự do là 18,31. Vì 7,75 < 18,31, giả thuyết không không thể bị bác bỏ ở mức ý
nghĩa 5%. Những dữ liệu này không tương quan tại bất kỳ thời điểm nào, một kết quả phù hợp
với mô hình trong Phương trình 4 (Yt = c + ε t).

Hình trích từ Bảng 4 trong Phụ lục: Bảng


Dữ liệu có xu hướng không? Nếu chuỗi có xu hướng, tồn tại một mối quan hệ đáng kể
giữa các giá trị chuỗi thời gian liên tiếp. Các hệ số tự tương quan thường lớn trong các độ trễ thời
gian đầu tiên và sau đó giảm dần về 0 khi số lượng độ trễ tăng lên. Chuỗi dừng là một chuỗi có
các thuộc tính thống kê cơ bản, chẳng hạn như giá trị trung bình và phương sai, không đổi theo
thời gian. Do đó, một chuỗi thay đổi ở một mức cố định (không tăng hoặc giảm) theo thời gian
được cho là ổn định. Một chuỗi có xu hướng được coi là không dừng. Các hệ số tự tương quan
của một chuỗi dừng giảm xuống 0 khá nhanh, thường là sau độ trễ thời gian thứ hai hoặc thứ ba.
Mặt khác, mẫu tự tương quan đối với một chuỗi không dừng vẫn khá lớn trong một số khoảng
thời gian. Thông thường, để phân tích chuỗi không
dừng, xu hướng sẽ bị loại bỏ trước khi mô hình
hóa bổ sung được thực hiện. Một phương pháp gọi
là Chuyển hóa sai phân bậc 1 thường được dùng
để loại bỏ xu hướng ra khỏi chuỗi không dừng. Dữ
liệu VCR ban đầu được trình bày trong Bảng 1
được hiển thị lại trong Hình 8, cột A.
Các giá trị Yt bị trễ một khoảng, được thể hiện ở cột B. Giá trị sai phân, Y t – Y t −1(cột A –
cột B), được thể hiện ở cột C. Ví dụ, giá trị sai phân đầu tiên là Y2 - Y1 = 130 - 123 = 7.

Hình 8: Kết quả Excel để phân biệt dữ liệu VCR của ví dụ 1


Lưu ý sự tăng trưởng hoặc xu hướng đi lên của dữ liệu VCR được thể hiện ở Hình 9, biểu
đồ A. Bây giờ hãy quan sát mô hình dừng của các dữ liệu sai phân trong Hình 9, đồ thị B. Việc
lấy vi phân dữ liệu đã loại bỏ xu hướng.

Hình 9: Sơ đồ chuỗi thời gian của dữ liệu VCR và dữ liệu VCR sai phân trong ví dụ 1

You might also like