Professional Documents
Culture Documents
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Giới thiệu
Hồi quy tuyến tính thường được sử dụng trong các bài toán
phân tích, dự đoán. Ví dụ
Chiều Độ Giới Chế độ
= β0 + β1 + β2 + β3
cao tuổi tính dinh dưỡng
Phân loại
Y = β0 + β1 z + ε
Y = β0 + β1 z1 + · · · + βn zn + ε
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Mô hình hồi quy với duy nhất biến phản hồi có dạng
Y = β0 + β1 z1 + β2 z2 + · · · + βr zr + ε
trong đó
• zi : biến dự đoán
• Y : biến phản hồi
• βi : tham số chưa biết
• ε : nhiễu ngẫu nhiên
Ta giả thiết rằng E (ε) = 0 và Var(ε) = σ 2 (σ chưa biết)
Với n quan sát độc lập Yi với các biến dự đoán tương ứng zij
(i = 1, n, j = 1, r ), mô hình hồi quy dưới dạng ma trận sẽ có dạng
Y1 1 z11 z12 . . . z1r β0 ε1
Y2 1 z21 z22 . . . z2r β1 ε2
.. = .. .. .. + ..
.. ..
. . . . . . .
Yn 1 zn1 zn2 . . . znr βr εn
Hay
Y = Z β + E
n×1 n×(r +1)(r +1)×1 n×1
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
kEk = kY − Z βk
đạt giá trị nhỏ nhất. Để cho thuận tiện thì ta sẽ chọn k · k = k · k2 .
Như vậy
Vector βb được gọi là ước lượng bình phương cực tiểu của β
Đặt
Y
b := Z βb
E
b := Y − Z βb
Y E
b
(P) := span{colk (Z )}rk=1
+1
col2 (Z )
Khi đó
Y
b
(P)
kEk22 min = kEk
b 2⇔Y
2
b = Z βb = projY col1 (Z )
(P)
Nhận thấy E
b = Y − Z βb ⊥ colk (Z )
nên
E
Z 0 (Y − Z β) Y
b
b =0
col2 (Z )
Nếu rank Z = r + 1 (full rank) thì
Y
βb = (Z 0 Z )−1 Z 0 Y
b
(P)
col1 (Z )
βb = (Z 0 Z )−1 Z 0 Y
H := Z (Z 0 Z )−1 Z 0
Y
b := Z βb = HY
E
b := Y − Y b = (I − H)Y
(Ước lượng bình phương cực tiểu chứa trọng số) Xét mô hình hồi
quy tuyến tính Y = Z β + E với E (E) = 0, Cov(EE 0 ) = σ 2 W ,
ma trận Z có hạng đầy đủ và ma trận W đối xứng nửa xác định
dương. Khi đó ước lượng bình phương cực tiểu chứa trọng số của
β là
βbW = (Z 0 W −1 Z )−1 Z 0 W −1 Y
Hơn nữa, ta còn có ước lượng của σ 2 trong trường hợp có ma trận
trọng số W là
1
b2 =
σ (Y − Z βbW )0 W −1 (Y − Z βbW )
n−r −1
(Mô hình hồi quy tuyến tính với ma trận suy biến) Xét mô hình
hồi quy tuyến tính Y = Z β + E với E (E) = 0, Cov(EE 0 ) = σ 2 I
(Ma trận Z không nhất thiết có hạng đầy đủ). Khi đó ước lượng
bình phương cực tiểu của β là
βb = (Z 0 Z )∗ Z 0 Y
AA∗ A = A
Nghịch đảo tổng quát của ma trận suy biến có thể không duy nhất
MI CTTN K64 - Group 8 SAMI
Mô hình hồi quy tuyến tính bội 15 / 129
Phần 1 Phần 2 Phần 3 Phần 4 Phần 5 Phần 6 Phần 7 Phần 8 Phần 9 Phần 10 Kết thúc
Nhận thấy rằng ma trận Z 0 Z là ma trận đối xứng nửa xác định
dương. Do đó nó sẽ có các trị riêng λk ứng với vector riêng v k
thỏa mãn
λ1 ≥ λ2 ≥ · · · ≥ λr ∗ +1 > λr ∗ +2 = · · · = λr +1 = 0
Z 0 Z = λ1 v 1 v 01 + λ2 v 2 v 02 + · · · + λr ∗ +1 v r ∗ +1 v 0r ∗ +1
Khi đó một nghịch đảo tổng quát của Z 0 Z được xác định bởi
(Z 0 Z )∗ = λ−1 0 −1 0 −1 0
1 v 1 v 1 + λ2 v 2 v 2 + · · · + λr ∗ +1 v r ∗ +1 v r ∗ +1
Định lý 3.2
E (β)
b =β và b = σ 2 (Z 0 Z )−1
Cov(β)
E (E)
b = 0 và b = σ 2 (I − H)
Cov(E)
b E)
Hơn nữa, Cov(β, b =0
Định lý 3.3
Hệ số xác định R 2
Ta có
Y 0 Y = (Y b 0 (Y
b + E) b + E) b 0Y
b =Y b 0E
b +E b
n
1X
Đặt Y = Yk . Khi đó biểu thức trên tương đương với
n
k=1
n
X n
X n
X
(Yk − Y )2 = (Ybk − Y )2 + εb2k
k=1 k=1 k=1
Định nghĩa
b 0Y
b − nY 2
Pn Pn
2 Y k=1 (Yk − Y )
b 2 b2k
k=1 ε
R := 2
= Pn 2
= 1 − Pn 2
Y 0 Y − nY k=1 (Yk − Y ) k=1 (Yk − Y )
Hệ số xác định R 2
R 2 được gọi là hệ số xác định của mô hình hồi quy, phản ánh
mức độ phù hợp của mô hình.
Y
b Y
b
•
• •• • •• •
• •
• ••
•• • •
• • • •
• • • •
• • •
Y Y
R2 = 0 R 2 = 0.4
Y
b Y
b
• •
• ••
• • •• •
• • • ••
• •• ••
••
•
• • • ••
Y Y
R 2 = 0.8 R2 = 1
MI CTTN K64 - Group 8 SAMI
Mô hình hồi quy tuyến tính bội 20 / 129
Phần 1 Phần 2 Phần 3 Phần 4 Phần 5 Phần 6 Phần 7 Phần 8 Phần 9 Phần 10 Kết thúc
2
Hệ số hiệu chỉnh Radj
R 2 có tính chất tăng khi số điểm dữ liệu tăng, như vậy hệ số này
sẽ không phù hợp khi đánh giá bộ điểm dữ liệu có nhiều outlier.
Để khắc phục điều này, ta sẽ sử dụng giá trị R 2 hiệu chỉnh
2 (1 − R 2 )(n − 1)
Radj =1−
n−r −1
2 với một mẫu, chứ không sử dụng đối với một
Ta chỉ sử dụng Radj
tổng thể.
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Định lý 4.1
βb ∼ Nr +1 (β, σ 2 (Z 0 Z )−1 )
nb b 0E
σ2 = E b ∼ σ 2 χ2
n−r −1
Hơn nữa, βb và E
b là hai biến độc lập
b 0E
E b
Giá trị s 2 := sẽ rất hữu dụng cho các nghiên cứu về sau
n−r −1
của mô hình hồi quy
Định lý 4.2
Hệ quả. Khoảng tin cậy đồng thời mức 100(1 − α)% của các giá
trị βi (i = 0, r ) được xác định bởi
q
βbi ± (s 2 (Z 0 Z )−1 )(i+1)(i+1) (r + 1)Fr +1,n−r −1 (α) (4.1)
Thực tế, người ta sẽ không dùng khoảng (4.1) để làm ước lượng
khoảng của βi . Thay vào đó, ta sẽ sử dụng khoảng
α q
βbi ± tn−r −1 (s 2 (Z 0 Z )−1 )(i+1)(i+1)
2
Ví dụ
Y z1 z2 Y z1 z2
Giá bán Tổng diện tích Giá ước tính Giá bán Tổng diện tích Giá ước tính
($1000) (100 ft2 ) ($1000) ($1000) (100 ft2 ) ($1000)
74.8 15.31 57.3 74.8 15.31 57.3
74.0 15.20 63.8 74.0 15.20 63.8
72.9 16.25 65.4 72.9 16.25 65.4
70.0 14.33 57.0 70.0 14.33 57.0
74.9 14.57 63.8 74.9 14.57 63.8
76.0 17.33 63.2 76.0 17.33 63.2
72.0 14.48 60.2 72.0 14.48 60.2
73.5 14.91 57.7 73.5 14.91 57.7
74.5 15.25 56.4 74.5 15.25 56.4
73.5 13.89 55.6 73.5 13.89 55.6
Ví dụ
trong đó
Đối với bộ dữ liệu có quá nhiều biến dự đoán, ta chỉ cần trích ra
một số biến có ảnh hưởng đáng kể đối với biến phản hồi, các biến
còn lại có thể lược bỏ.
Xét mô hình hồi quy tuyến tính cổ điển với ma trận đầy hạng,
viết lại mô hình dưới dạng
β(1)
Z (1) Z (2) (q+1)×1
Y = Zβ + E = +E
n×(r −q) β(2)
n×(q+1)
(r −q)×1
h i
Định lý 4.3∗ sẽ trở về Định lý 4.3 nếu C = 0 I
(r −q)×(r −q)
Ví dụ
Y z1 z2 z3 z4 z5
log-Chu kỳ Cường độ Cường độ Độ sâu Nhiệt Điện thế
tới hạn sạc (A) xả (A) của xả (%) độ (◦ C) tối đa (V)
4.615 0.375 3.13 60.0 40 2.00
4.949 1.000 3.13 76.8 30 1.99
4.564 1.000 3.13 60.0 20 2.00
4.828 1.000 3.13 60.0 20 1.98
3.761 1.625 3.13 43.2 10 2.01
2.773 1.625 3.13 60.0 20 2.00
5.236 1.625 3.13 60.0 20 2.02
2.303 0.375 5.00 76.8 10 2.01
1.099 1.000 5.00 43.2 10 1.99
5.956 1.000 5.00 43.2 30 2.01
Ví dụ
Y z1 z2 z3 z4 z5
log-Chu kỳ Cường độ Cường độ Độ sâu Nhiệt Điện thế
tới hạn sạc (A) xả (A) của xả (%) độ (◦ C) tối đa (V)
3.807 1.000 5.00 100.0 20 2.00
0.693 1.625 5.00 76.8 10 1.99
4.331 0.375 1.25 76.8 10 2.01
4.356 1.000 1.25 43.2 10 1.99
5.075 1.000 1.25 76.8 30 2.00
1.099 1.000 1.25 60.0 0 2.00
5.375 1.625 1.25 43.2 30 1.99
4.290 1.625 1.25 60.0 20 2.00
5.749 0.375 3.13 76.8 30 1.99
5.136 0.375 3.13 60.6 20 2.00
Ví dụ
b 0 (C (Z 0 Z )−1 C 0 )−1 (C β)
(C β) b = 25.304
s 2 (r − q)Fr −q,n−r −1 (α) = 8.566
Do 25.304 > 8.566, ta bác bỏ giả thuyết H0 với mức ý nghĩa 95%
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Giả sử Y0 là giá trị phản hồi của mô hình hồi quy khi biến dự đoán
0
là Z 0 = 1 z01 z02 . . . z0r Khi đó
Theo Định lý 3.3, ước lượng bình phương cực tiểu của E (Y0 |Z 0 )
là Z 00 β.
b Hơn nữa, còn là ước lượng hiệu quả của E (Y0 |Z 0 ), với
phương sai
Var(Z 00 β)
b = Z 0 (Z 0 Z )−1 Z 0 σ 2
0
Định lý 5.1
Với Z 0 là vector cho trước, thay vào mô hình hồi quy ta được
Y0 = Z 00 β + ε0
trong đó Var(Y0 − Z 00 β)
b = σ 2 (1 + Z 0 (Z 0 Z )−1 Z 0 )
0
Hệ quả. Khoảng dự đoán mức 100(1 − α)% của Y0 được cho bởi
α q
Z 00 βb ± tn−r −1 s 2 (1 + Z 00 (Z 0 Z )−1 Z 0 )
2
Ví dụ
Y z1 z2
Tuổi thọ CPU Số đơn đặt Lượng đơn vị vào-ra
(Giờ) (Nghìn) (Nghìn)
141.5 123.5 2.108
168.9 146.1 9.213
154.8 133.9 1.905
146.5 128.5 0.815
172.8 151.5 1.061
160.1 136.2 8.603
108.5 92.0 1.125
Ví dụ
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Ta đặt
z −µ
z∗ =
σ
trong đó z là giá trị quan sát, z là giá trị trung bình mẫu và s là
độ lệch chuẩn mẫu
Tác dụng
• Đo lường xem z cách xa z bao nhiêu.
• Áp dụng công thức này với toàn bộ dữ liệu Z , ta sẽ nhận
được mẫu Z ∗ mới có trung bình là 0 và độ lệch chuẩn là 1
Outlier
Outlier là điểm dữ liệu bất thường, khác biệt so với phần còn lại
của dữ liệu.
•
•
Outlier •••
••
• •••
••
•• • •
• •
•
•
• ••
•• • •
••••• •••
•• • •• •••
• •• ••
• •
Leverage
1 (zj − z)2
hjj = + Pn 2
n j=1 (zj − z)
Nhận xét.
• Càng có nhiều điểm dữ liệu nằm gần nhau thì sức ảnh hưởng
hay độ lớn của điểm high leverage càng giảm.
• Các điểm outlier có tác động rất lớn đến mô hình, điểm nào
có giá trị của biến dự đoán nằm càng xa khỏi bộ dữ liệu thì
tác động càng lớn.
• Ngưỡng chọn Outlier thường là 2p/n hoặc 3p/n
IQR = Q3 − Q1
Khi đó nếu x ∈
/ [Q1 − 1.5IQR; Q3 + 1.5IQR] thì x được coi là một
điểm outlier
Ta sử dụng tiêu chuẩn F để kiểm tra tính phụ thuộc vào biến zi
của mô hình, hay là mô hình chỉ phụ thuộc vào mỗi giá trị tự do là
hằng số β0
(n − k − 1)R 2
F =
k(1 − R 2 )
trong đó
b 0Y
b − nY 2
Pn Pn
2 Y k=1 (Yk − Y )
b 2 b2k
k=1 ε
R := 2
= Pn 2
= 1 − Pn 2
Y 0 Y − nY k=1 (Yk − Y ) k=1 (Yk − Y )
Các biến Zi có thể có tương quan, hiện tượng này dẫn tới việc
det(Z 0 Z ) → 0, hay các hệ số βbi trở nên rất lớn, khó kiểm soát sai
số.
1
trong đó s00 = sy2 và s0i = Yj zji − Y z i
( n
loại Zi ra khỏi mô hình nếu |r0i | < |r0j |
Nếu |rij | > 0.7 thì
loại Zj ra khỏi mô hình nếu |r0i | > |r0j |
3 Thực hiện hồi quy sau khi ma trận Z đã loại bỏ biến Zi hay Zj
βbi
t-statistic = q
D(
b βbi )
Gía trị p-value là xác suất quan sát được một số có giá trị tuyệt
đối bằng t-statistic hoặc lớn hơn
trong đó CDF là hàm phân phối tích luỹ của phân phối Student.
MI CTTN K64 - Group 8 SAMI
Mô hình hồi quy tuyến tính bội 50 / 129
Phần 1 Phần 2 Phần 3 Phần 4 Phần 5 Phần 6 Phần 7 Phần 8 Phần 9 Phần 10 Kết thúc
Hệ quả
• Nếu có mối liên hệ giữa Zi và Y , ta kì vọng t-statistic có
phân phối Student với n − 2 bậc tự do
• Giả thuyết bị bác bỏ khi p-value < 5% hoặc p-value < 1%
• Khi n ≥ 30, chúng lần lượt tương ứng với t-statistic ≥ 2 hoặc
t-statistic ≥ 2.75
Ta đưa ra tiêu chuẩn Student để chấp nhận hay bác bỏ giả thuyết
H0 : E ∼ Nn (0, σ 2 I )
hay
b ∼ Nn (0, σ 2 (I − H))
H0 : E
Ta có bổ đề sau
Bổ đề 6.1
Nếu ma trận A là ma trận lũy đẳng (A2 = A) thì nó sẽ chỉ có trị
riêng là 0 hoặc 1
v 1 , v 2 , . . . , v n−r −1
I − H = PΛP 0
trong đó P = v 1 v 2 . . . v n là hệ các vector riêng trực
chuẩn, Λ = diag{1, . . . , 1, 0, . . . , 0}
Đặt 0
e = P 0E
b = e1 e2 . . . en
Khi đó với E ∼ Nn (0, σ 2 I ) thì
E (e) = P 0 E (E)
b =0
Cov(e) = P 0 Cov(σ 2 (I − H))P = σ 2 P 0 PΛP 0 P = σ 2 Λ
Đặt
n n−r −1
1X 1 X
e= ej ; ee = ej
n n−r −1
j=1 j=1
Khi đó ne = (n − r − 1)e
e khi H0 đúng. Hơn nữa,
n−r
X −1 n−r
X −1
ej2 − (n − r − 1)e
e2 = (ej − ee)2
j=1 j=1
Xét thống kê
s
n−r −2
T = ne
(n − r − 1) nj=1 ej2 − n2 e 2
P
Khi tiêu chuẩn Student đưa đến bác bỏ giả thuyết E không tuân
theo phân phối chuẩn Nn (0, σ 2 In ), đồ thị phần dư thể biểu diễn
được những lỗi sau của model:
• Phần dư εbj phụ thuộc vào biến Ybj
• Phương sai không phải là hằng số
• Mô hình dự đoán bỏ sót biến dự đoán zj
• Phần dư εbj không có phân phối chuẩn
(1) (Hình 6.1) Đồ thị phần dư phụ thuộc vào biến Ybj
(2) (Hình 6.2) Đồ thị phần dư với phương sai biến thiên
εb εb
•• •• •
•••• • •
•• •• •••• •• •
••• •• • •••••• •••• •• •• •••
•
••••• •• •• •• • • •
•••• • •• •• •••
•• •
• ••••••••••• •••• ••••• •• •
•• ••• ••••• •••• • •• •• •• •
•••• ••• ••••••
•• ••• • ••
•••• • •• ••• • • • •
• •
•• ••• • ••• •• •• •• •••••••••••• ••• •
• ••••• •• •• •
• • •• • •
• ••• • •••• ••••• Y
••• •
••••• •••••• •
•••
••••••
••••• •••
• ••• • • •••• • •••• • Y
• •• •• • • •• •
•• •• ••• • • • ••••
b b
• • •••• • ••
•
•
• • • • • •• • •••••••••••• • •
••• ••• •
• •••••••••••••• • • • •• •
• • •• • ••
•• ••• • ••• • •• •
••
• • •• • • • •• •••• •
••••• •• • • • • ••• ••
•
•
• • • •• •
••• •••
•• •
•
(3) (Hình 6.3) Đồ thị phần dư với một biến dự báo hoặc với tích
các biến dự đoán
(4) (Hình 6.4) Đồ thị phần dư lý tưởng, phương sai bằng nhau và
không phụ thuộc vào biến dự đoán
εb εb
•• •
•• • • • ••
• • •• •• •
•••••••• ••••• ••••••• ••• • •••••••••••••••••••••• z1 Y
••
•••••• •••••••••••••••••••••••••••• •••••••
b
•••• •• •• •• ••••••••••• •
• • •••••• ••• •••
• • ••• • ••• •• ••• ••••• ••••••• • • • ••••••• ••
(5) Đồ thị Q − Q kiếm định tính phân phối chuẩn của εbj
•
εb •••
•
••
••
••
•••
•• •
•• •
•••••
•••
•
••
• ••
••
•
•
••
•••
••
• Y
b
••
••
Hình 6.5
Kiểm tra tính không tương quan của các phần dư theo thời gian
Giả sử Yj được theo dõi theo thời gian j = 1, 2, .. Khi đó, thường
xảy ra các trường hợp εj có tương quan với nhau.
Giải pháp. Sử dụng tiêu chuẩn Durbin-Watson để kiểm tra tính
tương quan này. Đại lượng
Pn
εj − εbj−1 )2
j=2 (b
DW = Pn
b2j
j=1 ε
Kiểm tra tính không tương quan của các phần dư theo thời gian
Tổng kết
Để dựng một mô hình hồi quy hoàn chỉnh, ta làm theo các bước
sau
1 Tiền xử lí dữ liệu
• Chuẩn hóa tập mẫu
z −z
z∗ =
s
• Khảo sát tính đơn - đa cộng tuyến tính của các biến dự đoán
• Sử dụng tứ phân vị để lọc outliers
2 Xác định các biến quan trọng
• Ước lượng các hệ số hồi quy: βb = (Z 0 Z )−1 Z 0 Y
• Sử dụng tiêu chuẩn F , kiểm tra mối liên hệ giữa Z và Y
• Xác định hệ số R, t-statistic, p-value của từng biến Zi
• Lựa chọn các biến quan trọng, loại bỏ biến không cần thiết
• Lặp lại tới khi nào thoả mãn điều kiện mà ta đặt ra
Tổng kết
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Ở mô hình hồi quy tuyến tính đa bội, biến phản hồi Y có m thành
phần Y1 , Y2 , Y3 , . . . , Ym
Y1 = β01 + β11 Z1 + · · · + βr 1 Zr + ε1
Y2 = β02 + β12 Z1 + · · · + βr 2 Zr + ε2
...
Ym = β0m + β1m Z1 + · · · + βrm Zr + εm
trong đó,
y1j
y2j
Y (j) = .
..
ynj
trong đó,
β1j
β2j
β(j) = .
..
βrj
trong đó,
ε1j
ε2j
E (j) = .
..
εnj
Ở đây,
E (E (j) ) = 0 và Cov(E (i) , E (j) ) = σij I i, j = 1, n
và
Var (E j ) = Σ = {σij } i, j = 1, m
MI CTTN K64 - Group 8 SAMI
Mô hình hồi quy tuyến tính bội 73 / 129
Phần 1 Phần 2 Phần 3 Phần 4 Phần 5 Phần 6 Phần 7 Phần 8 Phần 9 Phần 10 Kết thúc
Với mỗi thành phần thứ j của biến phản hồi, RSS(j) được cực tiểu
hóa bởi βb(j) = (Z 0 Z )−1 Z 0 Y (j) . Lại có RSS của cả bài toán là
n
X
RSS(Z ) = RSS(j)
j=1
Do đó ma trận
h i
[β]
b = βb(1) βb(2) . . . βb(m)
= (Z 0 Z )−1 Z 0 Y (1) Y (2) . . .
Y (m)
= (Z 0 Z )−1 Z 0 [Y ]
Ước lượng [Y ]
Với [β]
b vừa tìm được, ta ước lượng [Y ] bằng
[Y
b ] = Z [β]
b
Ngoài ra,
b (j) ⊥ E
Hay nói cách khác, Y b (k) . Hơn nữa,
[Y ]0 [Y ] = [Y
b ]0 [Y b 0 [E]
b ] + [E] b
Ước lượng Σ
Định lý 7.1
Xét mô hình hồi quy tuyến tính bội [Y ] = Z [β] + [E] với
rank(Z ) = r + 1 ≤ n − m và nhiễu [E] có phân phối chuẩn.
Khi đó
b = 1 [E]
Σ b = 1 ([Y ] − Z [β])
b 0 [E] b 0 ([Y ] − Z [β])
b
n n
là ước lượng hợp lý cực đại của Σ
L([β], Σ, [Y ])
n
!
1 1X 0 −1
= mn n exp − (Y i − Z i [β]) Σ (Y i − Z i [β])
(2π) 2 det(Σ) 2 2
i=1
Khi đó [β]
b là nghiệm của hệ phương trình
∂
log L([β], Σ, [Y ]) = 0
∂βij
Ta có
E (E
b (j) ) = E (Y (j) − Z βb(j) ) = E (Z β(j) ) − Z β(j) = 0
Biến đổi
b0 E
E (E 0 0 −1 0
(j) (k) ) = E (E (j) (I − Z (Z Z ) Z )E (k) )
b
= tr((I − Z (Z 0 Z )−1 Z 0 )σjk I )
= σjk (n − r − 1)
Từ đây ta có,
b 0 [E])
E ([E] b = (n − r − 1)Σ hay b = n − r − 1Σ
E (Σ)
n
n b 0 [E]
Ta còn có ước lượng không chệch [E] b của Σ
n−r −1
MI CTTN K64 - Group 8 SAMI
Mô hình hồi quy tuyến tính bội 81 / 129
Phần 1 Phần 2 Phần 3 Phần 4 Phần 5 Phần 6 Phần 7 Phần 8 Phần 9 Phần 10 Kết thúc
Đặt
Z (1) Z (2)
Z=
(q+1)×m (r −q)×m
Như vậy
[β(1) ]
Z (1) Z (2) (q+1)×m
E ([Y ]) = Z [β] =
(r −q)×m [β(2) ]
(q+1)×m
(r −q)×m
[β(1) ] = (Z 01 Z 1 )−1 Z 01 [Y ]
b 1 = 1 ([Y ] − Z [βb(1) ])0 ([Y ] − Z [βb(1) ])
Σ
n
max L([β(1) ], Σ) !n
2
[β(1) ],Σ |Σ|
b
Λ= =
max L([β], Σ) |Σb 1|
[β],Σ
Xét mô hình hồi quy tuyến tính bội [Y ] = Z [β] + [E] với
rank(Z ) = r + 1 ≤ n − m và nhiễu [E] có phân phối chuẩn.
Khi đó ta bác bỏ giả thuyết H0 nếu
!
|Σ|
b
−2 ln(Λ) = −n ln
|Σb 1|
nhận giá trị lớn
Ngoài phương pháp kiểm định Wilk’s Lambda như trên ta còn một
số phương pháp kiểm định khác. Đặt
và
nE
b ∼ W p,n−r −1 (Σ)
Khi đó ta có thống kê T 2
!0 −1 !
b 0 z 0 − [β]0 z 0
[β] n b 0 z − [β]0 z 0
[β]
2
T = p 0 0 Σ
b p 0 0
z 0 (Z Z )−1 z 0 n−r −1 z 00 (Z Z )−1 z 0
Định lý 7.3
Xét mô hình hồi quy tuyến tính bội [Y ] = Z [β] + [E] với
rank(Z ) = r + 1 ≤ n − m và nhiễu [E] có phân phối chuẩn.
Khi đó miền tin cậy đồng thời mức 100(1 − α)% của β 0 z 0 là
!0 −1 !
b 0 z − [β]0 z 0
[β] n [ b 0 z 0 − [β]0 z 0
β]
p 0 0 Σ
b ≤
z 00 (Z 0 Z )−1 z 0
p
z 00 (Z Z )−1 z 0 n−r −1
0 0 −1 m(n − r − 1)
≤ z 0 (Z Z ) z 0 Fm,n−r −m (α)
n−r −m
Hệ quả. Khoảng tin cậy đồng thời mức 100(1 − α)% của E (Y i )
= z 00 β(i) là
z 0 β(i) ±
r s
m(n − r − 1) 0 0 −1
n
Fm,n−r −m (α) z 0 (Z Z ) z 0 σ
bii
n−r −m n−r −1
Định lý 7.4
Xét mô hình hồi quy tuyến tính bội [Y ] = Z [β] + [E] với
rank(Z ) = r + 1 ≤ n − m và nhiễu [E] có phân phối chuẩn.
Khi đó miền dự đoán mức 100(1 − α)% của Y 0 là
−1
n
(Y 0 − [β]0 z 0 )0 Σ
b (Y 0 − [β]0 z 0 ) ≤
n−r −1
0 0 −1 m(n − r − 1)
≤ (1 + z 0 (Z Z ) z 0 ) Fm,n−r −m (α)
n−r −m
Hệ quả. Miền dự đoán đồng thời mức 100(1 − α)% của Y0i là
z 0 β(i) ±
r s
m(n − r − 1) 0 0 −1
n
Fm,n−r −m (α) (1 + z 0 (Z Z ) z 0 ) σ
bii
n−r −m n−r −1
Ví dụ
Y1 Y2 z1 z2 z3 z4 z5
TOT AMI GEN AMT PR DIAP QRS
3389 3149 1 7500 220 0 140
1101 653 1 1975 200 0 100
1131 810 0 3600 205 60 111
596 448 1 675 160 60 120
896 844 1 750 185 70 83
1767 1450 1 2500 180 60 80
807 493 1 350 154 80 98
1111 941 0 1500 200 70 93
1412 963 1 2250 175 45 125
Ví dụ
Y1 Y2 z1 z2 z3 z4 z5
TOT AMI GEN AMT PR DIAP QRS
645 547 1 375 137 60 105
628 392 1 1050 167 60 74
1360 1283 1 3000 180 60 80
652 458 1 450 160 64 60
860 722 1 1750 135 90 79
500 384 0 2000 160 60 80
781 501 0 4500 180 0 100
1070 405 0 1500 170 90 120
1754 1520 1 3000 180 0 129
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Y = β0 + β1 Z1 + . . . βr Zr + ε = β0 + β 0 Z + ε
σYY σZ0 Y
µY
1×r
µ= , Σ=
µZ
σZ Y ΣZ Z
r ×1 1×r r ×r
Yb = β0 + β 0 Z
εb = Y − Yb = Y − β0 − β 0 Z
Ta cần tìm β0 và β để giá trị trung bình bình phương của sai số là
nhỏ nhất, hay
b = argmin E (Y − β0 − β 0 Z )2
(βb0 , β)
(β0 ,β)
βb0 = µY − β 0 µZ , βb = Σ−1
Z Z ΣZ Y
Định nghĩa
σZ0 Y Σ−1
Z Z σZ Y
ρ2Y (Z ) :=
σYY
ρ2Y (Z ) được gọi là hệ số tương quan bội tổng thể, là tương quan
của biến Y so với biến dự đoán tuyến tính tốt nhất (Chính là biến
βb0 + βb0 Z ). Với cách đặt trên,
1
E (Y − β0 − β 0 Z )2 = σYY (1 − ρ2Y (Z ) ) =
(Σ−1 )11
Giả thiết biến Y có quan hệ tuyến tính với biến Z khá "gần" với
giả thiết các biến Y , Z tuân theo phân phối chuẩn. Thật vậy, giả
sử rằng
Y
∼ Nr +1 (µ, Σ)
Z
r ×1
Khi đó
∼ N µY + σZ0 Y Σ−1 0 −1
Y Z =[z
1 z2 ... zr ]0 ZZ (Z − µZ ), σYY − σZ Y ΣZZ σZ Y
Như vậy
E (Y |Z = z) = µY + σZ0 Y Σ−1 0
ZZ (z − µZ ) = β0 + β z
Định lý 8.2
0
Giả sử Y Z 0 ∼ Nr +1 (µ, Σ). Đặt
s 0Z Y
" # " #
Y sYY
µ
b= và S =
Z sZY SZZ
thứ tự là trung bình mẫu và ma trận hiệp phương sai mẫu của
một mẫu kích thước n từ tổng thể có phân phối chuẩn như trên.
Khi đó ước lượng hợp lý cực đại cho các hệ số trong mô hình hồi
quy là
βb = S −1
ZZ sZY và βb0 = Y − s 0Z Y S −1
ZZ Z
Hệ quả 1. Ước lượng hợp lý cực đại của giá trị E (Y − β0 − βb0 Z )2
là
n
n−1 1X
σ
bYY ·Z = (sYY − s 0Z Y S −1
Z Z sZY ) = (Y − βb0 − βb0 Z i )2
n n
i=1
bYY ·Z là ước lượng chệch. Ta có thể hiệu chỉnh ước lượng trên
σ
thành
n
∗ nb
σYY ·Z 1 X
σ
bYY ·Z = = (Y − βb0 − βb0 Z i )2
n−r −1 n−r −1
i=1
σYY σZ0 Y
" # " #
µY
µ= và Σ =
µZ σZ Y ΣZ Z
lần lượt là
b Z0 Y
" # " #
Y σ
bYY σ n−1
µ
b= và Σ
b = = S
Z σ
bZ Y Σ
b ZZ n
trong đó
µY ΣY Y ΣY Z
m×1 m×m m×r
µ= và Σ =
µZ ΣZ Y ΣZ Z
r ×1 r ×m r ×r
Với giả thiết tổng thể có phân phối chuẩn, ta có kết quả sau
E (Y |Z = z) = µY + ΣY Z Σ−1
Z Z (z − µZ )
Cụ thể hơn
Định lý 8.3
0
Giả sử Y 0 Z 0
∼ Nm+r (µ, Σ). Khi đó hàm hồi quy của
vector Y với các biến phản hồi Z là
Y = β0 + [β]z = µY − ΣY Z Σ−1
Z Z (z − µZ )
kích thước n được lấy ra từ tổng thể này, ước lượng hợp lý cực
đại của hàm hồi quy tuyến tính là
Y b = Y + S Y Z S −1 (z − Z )
b = βb0 + [β]z
ZZ
Hơn nữa, ước lượng hợp lý cực đại của ma trận hiệp phương sai
ΣY Y ·Z là
b Y Y ·Z = n − 1 (S Y Y − S Y Z S −1 S Z Y )
Σ
n ZZ
thì rYi Yj ·Z chính là ước lượng hợp lý cực đại của ρYi Yj ·Z
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Phương trình hồi quy tuyến tính của mỗi biến phải hồi Yj là
βi zij = βi (zij − z i ) + βi z i
Khi đó
Hay
Y = Zc βc + E
n×1 n×(r +1)(r +1)×1 n×1
Theo công thức của ước lượng bình phương cực tiểu,
βbc = (Z 0c Z c )−1 Z 0c Y
Hay
βe
b
" #
βb1
Y
=
.. (Z 0c∗ Z c∗ )−1 Z c∗ Y
.
βbr
Như vậy
Yb = βe + βbc0 (z − z) = Y + Y 0 Z c (Z 0c Z c )−1 (z − z)
b
Khi nghiên cứu sâu về các phương pháp số, để đảm bảo tính ổn
định cho mô hình hồi quy, người ta sử dụng biến chuẩn hóa
zij − z i zij − z i
Pn 2
=p
i=1 (zij − z i ) (n − 1)szi zi
Chú ý rằng
Y 0 Z c∗ = (Y − Y 1)0 Z c∗ + Y 10 Z c∗ = (Y − Y 1)0 Z c∗
Khi đó
Như vậy
• Đối với cách tiếp cận gán Zi = zi cố định,
b = Y + Y 0 Z c (Z 0 Z c )−1 (z − z)
Y c
= Y + s 0Z Y S −1
Z Z (z − z) (9.1)
• Đối với cách tiếp cận coi Y , Zi là các biến ngẫu nhiên,
Y b Y + σZ0 Y Σ−1
b =µ
Z Z (z − µ
bZ ) (9.2)
Mặc dù hai cách tiếp cận cùng cho ra một kết quả, nhưng về mặt
bản chất thì khác nhau hoàn toàn. Các giả thiết của cách tiếp cận
thứ hai có phần minh bạch hơn.
6 Kiểm tra mô hình và các khía cạnh khác của hồi quy
8 Một cách tiếp cận khác của mô hình hồi quy tuyến tính
Mô hình chuỗi thời gian là mô hình áp dụng trên các chuỗi đặc
thù có yếu tố thay đổi theo thời gian
Hình 10.1. Doanh số bán lẻ của Mỹ trong những năm 1990 - 2020
Xt = β0 + β1 Xt−1 + · · · + βr Xt−r + εt
trong đó
• Xt là giá trị tại thời điểm hiện tại
• Xt−k là giá trị tại thời điểm về trước đó k đơn vị thời gian so
với hiện tại (Thường được gọi là giá trị LAG chỉ số k)
Đặt vấn đề. Ta sẽ biểu diễn Xt thông qua các giá trị Xt−k nào để
mô hình là tốt nhất?
PACF phản ánh mức độ tương quan của biến Xt so với biến Xt−k ,
sau khi lược bỏ đi các tương quan gián tiếp của 2 biến này
NOTE
Thường ta chỉ lấy chỉ số LAG tới
lnm
min 10dlog10 ne, −1
2
3 6 7
LAG
5
trong đó
• µ : trung bình của chuỗi dữ liệu
• θi : tham số chưa biết
• εi : nhiễu trắng (E (εi ) = 0, Var(εi ) = α và Cov(εi , εj ) = 0)
Công thức (10.1) còn có thể biểu diễn dưới dạng
Xt = µ + (1 + θ1 L + · · · + θq Lq )εt (10.2)
Xt = LXt+1
và đối thuyết
H1 : |φ| < 1 (Chuỗi dừng)
Với giá trị ngưỡng kiểm định DF = (φ̂1 − 1)/RSS(φ̂1 ), ta sẽ so
sánh giá trị ngưỡng kiểm định này với giá trị tới hạn của phân phối
Dickey - Fuller để đưa ra kết luận về chấp nhận hoặc bác bỏ giả
thuyết H0
Hình 10.3. Đồ thị minh họa cho sự thay đổi của phương sai
∆Xt = Xt+1 − Xt
Khi đó nếu chuỗi Xt có xu hướng tăng "tuyến tính" như hình 10.3
thì chuỗi ∆Xt sẽ là chuỗi dừng. Tổng quát hơn, ta có thể sử dụng
sai phân cấp n
Nếu như đã dự đoán được ∆Xt , làm sao để ta khôi phục lại Xt ?
Xt = Xt−1 + ∆Xt−1
= Xt−2 + ∆Xt−2 + ∆Xt−1
= ...
t−`
X
= X` + ∆Xt−k
k=1