Professional Documents
Culture Documents
Chuong 7 Hien Tuong Phuong Sai Thay Doi
Chuong 7 Hien Tuong Phuong Sai Thay Doi
2
NỘI DUNG
2 Hậu quả
3
7.1 Bản chất
• Xét ví dụ mô hình hồi qui 2 biến trong đó biến
phụ thuộc Y là tiết kiệm của hộ gia đình và
biến giải thích X là thu nhập khả dụng của hộ
gia đình
4
7.1 Bản chất
Y Y
(a) (b)
0 X 0 X
X1 X2 Xn X1 X2 Xn
Hình 7.1: (a) Phương sai của sai số không đổi và (b) Phương sai của sai số thay đổi
5
7.1 Bản chất
• Hình 7.1a cho thấy tiết kiệm trung bình có
khuynh hướng tăng theo thu nhập. Tuy nhiên
mức độ dao động giữa tiết kiệm của từng hộ
gia đình so với mức tiết kiệm trung bình không
thay đổi tại mọi mức thu nhập.
• Đây là trường hợp của phương sai sai số
(nhiễu) không đổi, hay phương sai bằng nhau.
E(ui2) = 2
6
7.1 Bản chất
• Trong hình 7.1b, mức độ dao động giữa tiết
kiệm của từng hộ gia đình so với mức tiết
kiệm trung bình thay đổi theo thu nhập. Đây
là trường hợp phương sai của sai số thay đổi.
E(ui2) = i2
7
Giải thích
• Những người có thu nhập cao, nhìn chung, sẽ
tiết kiệm nhiều hơn so với người có thu nhập
thấp nhưng sự biến động của tiết kiệm sẽ cao
hơn.
• Đối với người có thu nhập thấp, họ chỉ còn để
lại một ít thu nhập để tiết kiệm.
• Phương sai sai số của những hộ gia đình có
thu nhập cao có thể lớn hơn của những hộ có
thu nhập thấp.
8
7.1 Nguyên nhân của phương sai thay đổi
9
7.1 Nguyên nhân của phương sai thay đổi
10
7.1 Hậu quả của phương sai thay đổi
11
7.1 Hậu quả của phương sai thay đổi
ˆ
2 2 *
t
SE ( ˆ2 )
12
7.1 Hậu quả của phương sai thay đổi
13
7.2 Phương pháp phát hiện phương sai thay đổi
14
1. Dựa vào bản chất vấn đề nghiên cứu
15
2. Xem xét đồ thị của phần dư
Biến
phụ
thuộc
Đường hồi qui ước lượng
16
2. Xem xét đồ thị của phần dư
u u
Hình a cho
Hình b,c,d
thấy
cho
biến đổi
thấy các
của các
ei2 thay
e i2 đổi khi
không Y tăng
có tính
Y
hệ Y
(a)
thống u (b)
Y Y
(c) (d)
17
3. Kiểm định Park
• Park cho rằng i2 là một hàm số nào đó của
biến giải thích X
i2 = B1 + B2ln|Xi |+ vi trong đó vi là
phần sai số ngẫu nhiên.
• Vì i2 chưa biết, Park đề nghị sử dụng lnei2
thay cho i2 và chạy mô hình hồi qui sau
lnei2 = B1 + B2 ln|Xi|+ vi (*)
ei2 được thu thập từ mô hình hồi qui gốc
18
3. Kiểm định Park
• Các bước của kiểm định Park:
1)Chạy hàm hồi qui gốc Yi = 1 + 2Xi + Ui
Yˆ
2) Từ hàm hồi qui, tính , phần
i dư ei và lnei2
3. Chạy hàm hồi qui (*), sử dụng biến giải thích
của hàm hồi qui ban đầu. Nếu có nhiều biến
giải thích, chạy hồi qui cho từng biến giải
thích đó. Hay, chạy hồi qui mô hình với biến
giải thích là
Yˆi
19
3. Kiểm định Park
20
4. Kiểm định Glejser
• Tương tự như kiểm định Park: Sau khi thu thập
được phần dư từ mô hình hồi qui gốc, Glejser
đề nghị chạy hồi qui | ei | theo biến X nào mà
có quan hệ chặt chẽ với i2.
• Glejser đề xuất một số dạng hàm hồi qui sau:
|ei| = B1 + B2Xi + vi
ei = B1 + B2 X i + vi
1
ei = B1 + B2 + vi
Xi
21
4. Kiểm định Glejser
1
ei = B1 + B2 + vi
Xi
ei = B1 + B2 X i + vi
ei = B1 + B2 X i2 + vi
22
4. Kiểm định Glejser
• Kiểm định Glejser có một số vấn đề như kiểm
định Park như sai số vi trong các mô hình hồi qui
có giá trị kỳ vọng khác không, nó có tương quan
chuỗi.
– 4 mô hình đầu cho kết quả tốt khi sử dụng
OLS
– 2 mô hình sau (phi tuyến tính tham số) không
sử dụng OLS được
• Do vậy, kiểm định Glejser được dùng để chẩn
đoán đối với những mẫu lớn.
23
5. Kiểm định Goldfeld - Quandt
• Xét mô hình hồi qui sau:
Yi = 1 + 2Xi + ui
Giả sử i2 có quan hệ dương với biến X theo
cách sau:
i2 = 2Xi2 trong đó 2 là hằng số.
• Các bước thực hiện kiểm định Goldfeld -
Quandt như sau:
1. Sắp xếp các quan sát theo thứ tự tăng dần về
giá trị của biến X.
24
5. Kiểm định Goldfeld - Quandt
25
5. Kiểm định Goldfeld - Quandt
26
5. Kiểm định Goldfeld - Quandt
4. Tính tỷ số
RSS 2 / df
λ=
RSS1 / df
27
6. Kiểm định White
• White đã đề nghị một phương pháp không cần
đòi hỏi u có phân phối chuẩn.
• Xét mô hình hồi qui sau:
Yi = 1 + 2X2i + 3X3i + ui
Bước 1: Ước lượng mô hình trên bằng OLS,
thu được các phần dư ei.
Bước 2: Ước lượng một trong các mô hình sau
28
6. Kiểm định White
hay
ei2 = 1 + 2X2i + 3X3i + 4X2i2 + 5X3i2 +
6X2iX3i + V2i (2)
(1) và (2) có thể có số mũ cao hơn và nhất thiết
phải có hệ số chặn bất kể mô hình gốc có
hay không.
R2 là hệ số xác định bội, thu được từ (1) với mô
hình không có số hạng chéo hay (2) với mô
hình có số hạng chéo.
29
6. Kiểm định White
• Bước 3
Đặt GT Ho: 2 = 3 = 4 = 5 = 0 (1)
2 = 3 = 4 = 5 = 6 = 0 (2)
Tương đương H0: phương sai của sai số không đổi.
• nR2 có phân phối xấp xỉ 2(df), với df bằng số
hệ số của mô hình (1) và (2) không kể hệ số
chặn.
30
6. Kiểm định White
• Bước 4 Quy tắc quyết định
• nR2 < 2(df): chấp nhận Ho
• nR2 > 2(df): bác bỏ Ho, hay có hiện tượng
phương sai sai số thay đổi.
31
32
7. Phương pháp bình phương
nhỏ nhất tổng quát
• 1. Phương pháp bình phương nhỏ nhất có
trọng số
• 2. Phương pháp bình phương nhỏ nhất tổng
quát
hay
Yi 1 X i ei
1 2
i i i i
*
Yi 1* 2* X i* ei*
35
Ước lượng bình phương
bé nhất có trọng số
• Phương pháp OLS
2 2
ei Yi 1 X i
1 2 min
i i i i
*
w w X Y w X w X
i i i i i i i i
2
w w X w X
i i i
2
i i
2
wi 1 / i
36
Ước lượng bình phương
bé nhất có trọng số
37
1. Trường hợp đã biết i2
Khi đó
ei Var (ei ) i2
Var 2
2 1, i
i i i
39
2. Trường hợp chưa biết i2
40
2. Trường hợp chưa biết i2
Yi 1 Xi ui
1 2
Xi Xi Xi Xi
1
1 2 X i vi
Xi
41
2. Trường hợp chưa biết i2
• Khi đó
ui Var (ui )
Var 2 , i
X Xi
i
42
2. Trường hợp chưa biết i2
44
2. Trường hợp chưa biết i2
Khi đó:
ui Var (ui )
Var 2
2
, i
Xi Xi
45
2. Trường hợp chưa biết i2
47
2. Trường hợp chưa biết i2
Trường hợp 4: Định dạng lại mô hình.
Thay vì ước lượng mô hình hồi qui gốc, ta có thể
ước lượng mô hình hồi qui:
lnYi = 1 + 2lnXi + ui
Tình trạng phương sai sai số không đồng nhất sẽ
bớt nghiêm trọng hơn so với mô hình gốc bởi vì
khi được logarit hóa, độ lớn các biến bị
‘nén lại’.
Một ưu thế của phép biến đổi này là hệ số 2 sẽ đo
lường hệ số co giãn của Y theo X, nghĩa là, nó
cho biết % thay đổi của Y khi X thay đổi 1%.
48
Lưu ý:
• Khi nghiên cứu mô hình có nhiều biến giải
thích thì việc chọn biến nào để biến đổi cần
phải được xem xét cẩn thận.
• Phép biến đổi logarit không dùng được khi các
giá trị của các biến âm.
• Khi i2 chưa biết, nó sẽ được ước lượng từ một
trong các cách biến đổi trên. Các kiểm định t,
F mà chúng ta sử dụng chỉ đáng tin cậy khi cỡ
mẫu lớn, do đó chúng ta phải cẩn thận khi giải
thích các kết quả dựa trên các phép biến đổi
khác nhau trong các mẫu nhỏ.
49
Ví dụ
• Cho số liệu quan sát như sau: Y: thu nhập
trung bình (USD/giờ) X1: số năm kinh
nghiệm (năm) X2: số năm được đào tạo
(năm)
1.Ước lượng mô hình hồi quy Y= β0 + β1. X1
+ β2.X2 +U
2. Mô hình có phương sai thay đổi không?
Vì sao?
3.Nếu xảy ra phương sai thay đổi, hãy tìm
cách khắc phục.
50
1. Ước lượng mô hình
51
2. Phát hiện phương sai thay đổi
• 1. Vẽ đồ thị phần dư
52
b. Kiểm định Park
• B1. Tạo biến mới umu=resid
• B2: Chạy hồi quy theo từng Xi hoặc theo Y^ theo
mô hình:
LOG(umu^2) c LOG(X2)
Hoặc LOG(umu^2) c LOG(X3)
Hoặc LOG(umu^2) c LOG(Ymu)
3. Đặt giả thuyết H0: β2 = 0, hay “không có
phương sai thay đổi”
53
b. Kiểm định Park
LOG(umu^2) c LOG(Ymu)
54
b. Kiểm định Glejser
1. Hồi quy theo mô hình sau
ABS(umu) c X2
Hoặc ABS(umu) c X3
2. Đặt giả thuyết H0: β2 = 0, hay không có
phương sai thay đổi
55
56
c. Kiểm định White
B1. Mở eq01
B2. View\ Residual Tests\ White Heteroskedasticity
(cross terms)
GT Ho: 2 = 3 = 4 = 5 = 6 = 0
Hoặc
• View\ Residual Tests\ White Heteroskedasticity (no
cross terms)
GT Ho: 2 = 3 = 4 = 5 = 0
Ta có kết quả sau
57
58
Kết quả
• Theo kết quả bảng trên, ta thấy n*R2 (Obs*R-
squared) = 14,70020.
• Với mức ý nghĩa 5%, 2(df)= 2(5)= 11,0705. Ta
thấy n*R2 > 2(5)
=>bác bỏ Ho 2 = 3 = 4 = 5 = 6 = 0
Cách 2: n*R2 có xác suất p-value= 0,011724 < α =5%.
Vậy bác bỏ giả thiết Ho: phương sai không đổi.
Tức mô hình hồi quy của Y theo X1 và X2 có
phương sai thay đổi.
59
3. Biện pháp khắc phục
B1. Hồi quy Y, X1, X2 dựa vào các giả thiết
B2: Kiểm định tiếp xem có phương sai thay đổi
không
Thực hành:
B1: Do ta chưa biết các i2 nên theo các giả thiết
sau:
• a. E(ui2) = 2Xi2
Chạy hồi quy (Y/X1 ) (1/X1 ) c (X2 / X1 )
60
• Dùng kiểm định White có số hạng tích chéo
(cross terms)
61
• b. E(ui2) = 2Xi
Chạy hồi quy (Y/SQR(X1 )) 1/SQR(X1 ) SQR(X1 ) (X2 / SQR(X1 ) )
62
Dùng kiểm định White có số
hạng tích chéo (cross terms)
63
c. Dùng phép biến đổi
logarit
• Chạy hồi quy LOG(Y) C LOG(X1) LOG(X2)
64
Dùng kiểm định White có
số hạng tích chéo (cross
terms)
65
Vd2
• Hồi quy lương (W, $) theo số lượng nhân viên (N) tại 30
công ty có các kết quả sau
W=7.5 + 0.009N +e R2=0.9 (1)
t na (16.10)
W/N=0.008 + 7/8(1/N) +e R2=0.99 (2)
t (14.43) (76.58)
1. Giải thích ý nghĩa các hệ số hồi quy.
2. Tại sao tác giả chuyển từ mô hình 1 sang mô hình 2?
3. Hệ số tự do và hệ số góc của hai mô hình có liên hệ như
thế nào?
66
Ví dụ
• Cho số liệu quan sát như sau: Y: thu nhập
trung bình (USD/giờ) X1: số năm kinh
nghiệm (năm) X2: số năm được đào tạo
(năm)
1.Ước lượng mô hình hồi quy Y= β0 + β1. X1
+ β2.X2 +U
2. Mô hình có phương sai thay đổi không?
Vì sao?
3.Nếu xảy ra phương sai thay đổi, hãy tìm
cách khắc phục.
67
STT X1 X2 Y
1 0 6 4.71 26 25 2 12.8
2 1 3 3.6 27 25 0 5.2
3 2 0 4.37 28 27 4 8.12
4 2 4 4.64 29 28 7 17.54
5 3 1 3.27 30 28 4 22.52
6 5 0 4.26 31 30 3 5.47
7 6 7 6.14 32 31 1 13.67
8 7 5 6.74 33 32 0 4.84
9 8 0 6.11 34 34 5 38.52
10 8 2 5.53 35 34 2 9.98
11 8 6 5.53 36 37 6 27.73
12 10 1 5.36 37 37 0 5.06
13 11 7 8.73 38 37 1 4.36
14 13 0 5.85 39 38 7 23.96
15 15 0 6.88 40 38 4 30.77
16 15 2 7.17 41 39 0 20.68
17 15 7 10.8 42 40 2 50.9
18 18 0 5.06 43 42 3 3.96
19 19 6 13.69 44 42 0 7.58
20 21 0 8.01 45 43 4 6.18
21 21 2 17.13 46 44 3 43.25
22 23 1 7.75 47 44 1 32.04
23 24 0 6.2 48 45 0 3.35
24 24 5 17.72 49 45 2 18.35
25 24 3 8.8 50 46 0 4.95
68
1. Ước lượng mô hình
69
• Nhìn đồ thị ta thấy độ rộng của phần dư tăng khi Yi^ tăng. Vậy
mô hình ước lượng ở câu 1 có thể có phương sai thay đổi.
70
b. Kiểm định Park
• B1. Tạo biến mới umu=resid
• B2: Chạy hồi quy theo từng Xi hoặc theo Y^ theo
mô hình:
LOG(umu^2) c LOG(X2)
Hoặc LOG(umu^2) c LOG(X3)
Hoặc LOG(umu^2) c LOG(Ymu)
3. Đặt giả thiết H0: β2 = 0, hay “không có phương
sai thay đổi”
71
LOG(umu^2) c LOG(Ymu)
72
b. Kiểm định Glejser
1. Hồi quy theo mô hình sau
ABS(umu) c X2
Hoặc ABS(umu) c X3
2. Đặt giả thiết H0: β2 = 0, hay không có phương
sai thay đổi
73
74
c. Kiểm định White
B1. Mở eq01
B2. View\ Residual Tests\ White Heteroskedasticity
(cross terms)
GT Ho: 2 = 3 = 4 = 5 = 6 = 0
Hoặc
• View\ Residual Tests\ White Heteroskedasticity (no
cross terms)
GT Ho: 2 = 3 = 4 = 5 = 0
Ta có kết quả sau
75
76
• Theo kết quả bảng trên, ta thấy n*R2 (Obs*R-
squared) = 14,70020.
• Với mức ý nghĩa 5%, 2(df)= 2(5)= 11,0705. Ta
thấy n*R2 > 2(5)
=>bác bỏ Ho 2 = 3 = 4 = 5 = 6 = 0
Cách 2: n*R2 có xác suất p-value= 0,011724 < α =5%.
Vậy bác bỏ giả thiết Ho: phương sai không đổi.
Tức mô hình hồi quy của Y theo X1 và X2 có
phương sai thay đổi.
77
3. Biện pháp khắc phục
B1. Hồi quy Y, X1, X2 dựa vào các giả thiết
B2: Kiểm định tiếp xem có phương sai thay đổi
không
Thực hành:
B1: Do ta chưa biết các i2 nên theo các giả thiết
sau:
• a. E(ui2) = 2Xi2
Chạy hồi quy (Y/X1 ) (1/X1 ) c (X2 / X1 )
78
• Dùng kiểm định White có số hạng tích chéo
(cross terms)
79
• Ta thấy Obs*R-squared có p = 0,515373> 5% nên
chấp nhận Ho. Vậy không còn phương sai thay
đổi.
• Ta có hàm hồi quy mới như sau:
^
Yi 2,782082 0,209166. X 2i
0,353691
X 1i X 1i X 1i
80
• b. E(ui2) = 2Xi
Chạy hồi quy (Y/SQR(X1 )) 1/SQR(X1 ) SQR(X1 ) (X2 / SQR(X1 ) )
81
Dùng kiểm định White có số hạng tích
chéo (cross terms)
83
Dùng kiểm định White có số hạng
tích chéo (cross terms)
84
Bài tập
Làm lại các ví dụ 7.1, ví dụ trang 169, các
bài tập trong chương 7 (các file dữ liệu
tương ứng đã đưa lên Team)
1.Yêu cầu hồi quy Y theo các Xi,
2. Vẽ đồ thị phần dư theo Y,
3. Kiểm định hiện tượng phương sai thay
đổi bằng kiểm định Park, kiểm định Gleijer,
kiểm định White,
4. Định lại mẫu với các giá trị Y và X >0,
thực hiện hồi quy Y theo X dưới dạng Ln 85