You are on page 1of 30

Chương 5: Mô hình hồi quy biến giả

5.1. Bản chất của biến giả


5.2. Mô hình hồi quy trong đó biến giải thích đều là
biến định tính
5.3. Mô hình hồi quy trong đó biến giải thích có một
biến định lượng và k biến định tính
5.4. Mô hình hồi quy trong đó biến giải thích có hai
biến định lượng và 1 biến định tính
Chương 5: Mô hình hồi quy biến giả

5.1. Bản chất của biến giả


Biến giả là gì?
Biến giả là biến định tính hay biến định lượng
Ví dụ về biến giả?

Biến giả là biến lượng hóa của biến định tính


Biến giả là biến định lượng, Kí hiệu là D nhận hai giá trị 0 và 1
Ví dụ: Biến giới tính (Nam gắn giá trị 0, Nữ gắn giá trị 1)
D = 0 ứng với nam
D = 1 ứng với nữ
D chính là biến giả
Chương 5: Mô hình hồi quy biến giả

5.2. Mô hình hồi quy trong đó biến giải thích đều là biến định tính
5.2.1 Một biến định tính
a, Có hai phạm trù (Thuộc tính)
MH1: Yi = b1 + b2.Di + Ui
D = 1 ứng với phạm trù 1
D = 0 ứng với phạm trù 2
MHHQ 2 biến (k = 2)
Ý nghĩa:
b1 GTTB Y ứng với phạm trù 2
b2 chênh lệch GTTB Y giữa hai phạm trù
Chương 5: Mô hình hồi quy biến giả
5.2. Mô hình hồi quy trong đó biến giải thích đều là biến định tính
5.2.1. Một biến định tính
b, Có ba phạm trù (Thuộc tính)
MH2: Yi = b1 + b2.D2i + b3.D3i + Ui
D2i = 1 ứng với phạm trù 1
D2i= 0 ứng với phạm trù khác
D3i = 1 ứng với phạm trù 2
D3i= 0 ứng với phạm trù khác
MHHQ 3 biến (k = 3)
Ý nghĩa:
b1 GTTB Y ứng với phạm trù 3
b2 chênh lệch GTTB Y giữa hai phạm trù 1 và 3
Chương 5: Mô hình hồi quy biến giả

5.2.  Mô hình hồi quy trong đó biến giải thích đều là biến định

tính
5.2.1. Một biến định tính
c, Có m phạm trù (Thuộc tính)
Số biến giả đưa vào mô hình là m-1
5.2.2. Có k biến định tính
Số biến giả đưa vào mô hình là:
n=
mi: số phạm trù của biến định tính i
Chương 5: Mô hình hồi quy biến giả
5.3. Mô hình hồi quy trong đó biến giải thích có một biến định lượng và k biến định
tính
5.3.1. Một biến định tính
a, Có hai phạm trù (Thuộc tính)
MH3: Yi = b1 + b2.Xi + b 3.Di + Ui
Di = 1 ứng với phạm trù 1
Di= 0 ứng với phạm trù 2
MHHQ 3 biến (k = 3)
Ý nghĩa:
b 1 GTTB Y khi X = 0 ứng với phạm trù 2
b 2 khi X thay đổi 1 đơn vị, GTTB Y thay đổi b 2 (đúng với cả hai phạm
trù
b 3 chênh lệch GTTB Y giữa hai phạm trù
Chương 5: Mô hình hồi quy biến giả
5.3. Mô hình hồi quy trong đó biến giải thích có một biến định lượng và k biến định
tính
5.3.1. Một biến định tính
a, Có hai phạm trù (Thuộc tính)
MH4: Yi = b 1 + b2.Xi + b 3.Xi.Di + Ui
Di = 1 ứng với phạm trù 1
Di= 0 ứng với phạm trù 2
MHHQ 3 biến (k = 3)
Ý nghĩa:
b 1 GTTB Y khi X = 0 (đúng với cả hai phạm trù)
b 2 khi X thay đổi 1 đơn vị, GTTB Y thay đổi b 2 ứng với phạm trù thứ 2
b 3 khi X thay đổi 1 đơn vị, GTTB Y giữa hai phạm trù thay đổi chênh
lệch b 3 đơn vị.
Chương 5: Mô hình hồi quy biến giả
5.3. Mô hình hồi quy trong đó biến giải thích có một biến định lượng và k biến định tính
5.3.1. Một biến định tính
a, Có hai phạm trù (Thuộc tính)
MH5: Yi = b1 + b2.Xi + b3.Di + b4.(X.D)i + Ui
Di = 1 ứng với phạm trù 1
Di= 0 ứng với phạm trù 2
MHHQ 4 biến (k = 4)
Ý nghĩa:
b1 GTTB Y khi X = 0 ứng với phạm trù thứ 2
b2 khi X thay đổi 1 đơn vị, GTTB Y thay đổi b2 ứng với phạm trù thứ 2
b3 chênh lệch GTTB Y giữa hai phạm trù khi X = 0
b4 khi X thay đổi 1 đơn vị, GTTB Y giữa hai phạm trù thay đổi chênh lệch b4 đơn vị.
Chương 5: Mô hình hồi quy biến giả

5.3. Mô hình hồi quy trong đó biến giải thích có một biến định lượng và k biến định tính
5.3.1. Một biến định tính
b, Có ba phạm trù (Thuộc tính)
MH6: Yi = b1 + b2.Xi + b3.D3i + b4.D4i+ Ui
D3i = 1 ứng với phạm trù 1
D3i = 0 ứng với phạm trù khác
D4i = 1 ứng với phạm trù 2
D4i = 0 ứng với phạm trù khác
MHHQ 4 biến (k = 4)
Ý nghĩa:
b1 GTTB Y khi X = 0 ứng với phạm trù thứ 3
b2 khi X thay đổi 1 đơn vị, GTTB Y thay đổi b2 ứng với cả 3 phạm trù
b3 chênh lệch GTTB Y giữa phạm trù 1 và 3
b4 chênh lệch GTTB Y giữa phạm trù 2 và 3
Chương 5: Mô hình hồi quy biến giả
  hình hồi quy trong đó biến giải thích có một biến định lượng và k biến định tính
5.3. Mô

5.3.2. k biến định tính
Số biến giả đưa vào mô hình là:
n=
mi: số phạm trù của biến định tính I
Xét trường hợp hai biến định tính (mỗi biến định tính có hai phạm trù)
MH7: Yi = b1 + b2.Xi + b3.D3i + b4.D4i+ Ui
D3i = 1 ứng với phạm trù 1 (biến định tính 1)
D3i = 0 ứng với phạm trù 2 (biến định tính 1)
D4i = 1 ứng với phạm trù 1 (biến định tính 2)
D4i = 0 ứng với phạm trù 2 (biến định tính 2)
MHHQ 4 biến (k = 4)
Ý nghĩa:
b1 GTTB Y khi X = 0 ứng với phạm trù thứ 2 của cả hai biến định tính
b2 khi X thay đổi 1 đơn vị, GTTB Y thay đổi b2 ứng với các phạm trù của cả hai biến định tính
b3 chênh lệch GTTB Y giữa hai phạm trù của biến định tính 1
b4 chênh lệch GTTB Y giữa hai phạm trù của biến định tính 2
BÀI TẬP
Bài 1: Có số liệu quan sát về chi tiêu cá nhân (triệu đồng/tháng), thu nhập cá nhân (triệu
đồng/tháng), giới tính (Di = 1 nếu là nam và Di = 0 nếu là nữ) ở bảng sau. Cho mức ý nghĩa
5%:

Yi 0.8 0.9 1 1.2 1.3 1.4 1.6 1.5 2 2.5

Xi 1 1.5 1.5 1.8 2 2.5 3 3.2 3.5 4

Di 1 1 1 1 1 0 0 0 0 0

Tiến hành hồi quy chi tiêu theo thu nhập (MH1) và chi tiêu theo thu nhập và giới tính
(MH2) được kết quả sau:
Dependent Variable: Y Dependent Variable: Y
Included observations: 10 Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob.

C 0.222703 0.145424 1.531398 0.1642 C -0.399079 0.359289 -1.110747 0.3034


X 0.498874 0.056402 8.845020 0.0000 X 0.678728 0.109014 6.226082 0.0004
D 0.380263 0.205455 1.850831 0.1066
R-squared 0.907230 Mean dependent var 1.420000
R-squared 0.937712 Mean dependent var 1.420000
Adjusted 0.895633 S.D. dependent var 0.520256
R-squared Adjusted 0.919915 S.D. dependent var 0.520256
S.E. of 0.168073 Akaike info criterion -0.551978 R-squared
regression S.E. of 0.147229 Akaike info criterion -
regression 0.750330
Sum 0.225989 Schwarz criterion -0.491461
squared Sum 0.151735 Schwarz criterion -
resid squared 0.659555
Log 4.759891 F-statistic 78.23439 resid
likelihood Log 6.751650 F-statistic 52.69020
likelihood
Durbin- 1.261431 Prob(F-statistic) 0.000021
Durbin- 1.826101 Prob(F-statistic) 0.000060
Watson Watson
stat stat
Bài 1

1. Trong hai mô hình để dự báo ta nên dùng mô hình nào?


2. Trong MH2:
 Có thể nói chi tiêu không phụ thuộc vào giới tính được không?
 Khi thu nhập thay đổi 2 triệu đồng/tháng thì chi tiêu của nam và nữ thay đổi như thế nào? Tối
đa bao nhiêu? Tối thiểu bao nhiêu?
 Chi tiêu của nam có lớn hơn chi tiêu của nữ không?
3. Tiến hành hồi quy Y theo X, D và X.D ta thu được MH3:
Dependent Variable: Y
Included observations: 10 - Trong MH3 chi tiêu có phụ thuộc vào giới
Variable Coefficient Std. Error t-Statistic Prob. tính hay không?
C -0.632588 0.432930 -1.461179 0.1943 - Khi thu nhập bằng 0, chi tiêu của nữ thay
X 0.750799 0.132055 5.685516 0.0013
DZ 0.859861 0.533558 1.611560 0.1582 đổi trong khoảng nào? Có khác chi tiêu của
D.X
X*Z -0.229820 0.235813 -0.974584 0.3674
nam không?
R-squared 0.946224 Mean dependent var 1.420000
Adjusted R-squared 0.919337 S.D. dependent var 0.520256 - Khi thu nhập thay đổi 1 triệu đồng/tháng thì
S.E. of regression 0.147760 F-statistic 35.19156
Sum squared resid 0.130997 Prob(F-statistic) 0.000333
chi tiêu của nam và nữ thay đổi có khác
nhau không?
Chương 5: Mô hình hồi quy biến giả

5.4. Mô hình hồi quy trong đó biến giải thích có hai biến định lượng và 1 biến định tính
5.4.1. Hai phạm trù (thuộc tính)
MH8: Yi = b1 + b2.X2i + b3.X3i + b4.Di + Ui
Di = 1 ứng với phạm trù 1
Di= 0 ứng với phạm trù 2
MHHQ 4 biến (k = 4)
Ý nghĩa:
b1 GTTB Y khi X2= X3 = 0 ứng với phạm trù thứ 2
b2 khi X2 thay đổi 1 đơn vị, GTTB Y thay đổi b2 đúng với cả hai phạm trù (X3
không đổi)
b3 khi X3 thay đổi 1 đơn vị, GTTB Y thay đổi b3 đúng với cả hai phạm trù (X2
không đổi)
b4 chênh lệch GTTB Y giữa hai phạm trù
Chương 5: Mô hình hồi quy biến giả

5.4. Mô hình hồi quy trong đó biến giải thích có hai biến định lượng và 1 biến định tính
5.4.1. Hai phạm trù (thuộc tính)
MH9: Yi = b1 + b2.X2i + b3.X3i + b4.X2i. Di + + b5.X3i. Di + Ui
Di = 1 ứng với phạm trù 1
Di= 0 ứng với phạm trù 2
MHHQ 5 biến (k = 5)
Ý nghĩa:
b1 GTTB Y khi X2= X3 = 0 ứng với 2 phạm trù
b2 khi X2 thay đổi 1 đơn vị, GTTB Y thay đổi b2 ứng với phạm trù 2 (X3 không đổi)
b3 khi X3 thay đổi 1 đơn vị, GTTB Y thay đổi b3 ứng với phạm trù 2 (X2 không đổi)
b4 khi X2 thay đổi 1 đơn vị, GTTB Y giữa hai phạm trù thay đổi chênh lệch b4 đơn vị (X3
không đổi)
b5 khi X3 thay đổi 1 đơn vị, GTTB Y giữa hai phạm trù thay đổi chênh lệch b5 đơn vị (X2
không đổi)
Bài 2: Một công ty có số liệu về doanh số bán (Y – triệu đồng), chi phí chào hàng (X2 –
triệu đồng) và chi phí quảng cáo (X3- triệu đồng) ở 10 khu vực bán hàng trong năm 2014
như sau. Cho độ tin cậy 90%.

Y 200 220 240 250 250 260 280 290 300 320

X2 2 2 3 4 5 6 6 7 8 9

X3 12 14 15 16 17 18 19 19 20 21

D 0 0 1 1 0 0 0 1 1 0

Hồi quy Y theo X2, X3 (MH1) ta được:

Dependent Variable: Y
Method: Least Squares
Date: 08/07/19 Time: 16:56
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 84.44023 42.61705 1.981372 0.0880
X2 4.563567 4.395549 1.038225 0.3337
X3 8.937381 3.769049 2.371256 0.0495
R-squared 0.968179 Mean dependent var 261.0000
Adjusted R-squared 0.959087 S.D. dependent var 36.95342
S.E. of regression 7.474543 Akaike info criterion 7.104208
Sum squared resid 391.0816 Schwarz criterion 7.194984
Log likelihood -32.52104 F-statistic 106.4898
Durbin-Watson stat 1.176158 Prob(F-statistic) 0.000006
a, Có thể nói cả chi phí quảng cáo và chi phí chào hàng đều không ảnh hưởng đến doanh
số bán không?

b, Khi chi phí chào hàng không đổi, nếu chi phí quảng cáo tăng 5 triệu đồng thì doanh số
bán được tăng trong khoảng nào? Tối đa? Tối thiểu?

c, Khi chi phí quảng cáo không đổi, có thể nói lượng tăng của doanh số bán lớn hơn lượng
tăng của chi phí chào hàng?

d, Có ý kiến cho rằng doanh số bán được còn phụ thuộc vào thái độ của nhân viên bán
hàng, nên cho thêm biến D vào mô hình (D =1 nếu nhân viên bán hàng có thái độ niềm nở,
D = 0 nếu nhân viên bán hàng có thái độ bình thường) và thu được mô hình (MH2) sau:

Dependent Variable: Y
Method: Least Squares
Date: 08/07/19 Time: 16:57
Sample: 1 10
Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
C 95.54667 41.60163 2.296705 0.0701
X2 6.573333 4.668440 1.408036 0.2182
X3 7.520000 3.782690 1.988003 0.1035
X2*D -3.096405 3.213561 -0.963543 0.3795
X3*D 1.356013 1.061215 1.277792 0.2574
R-squared 0.979787 Mean dependent var 261.0000
Adjusted R-squared 0.963617 S.D. dependent var 36.95342
S.E. of regression 7.048627 Akaike info criterion 7.050395
Sum squared resid 248.4157 Schwarz criterion 7.201688
Log likelihood -30.25198 F-statistic 60.59191
Durbin-Watson stat 1.312776 Prob(F-statistic) 0.000200
-
- Bằng kiểm định thu hẹp hãy nhận xét ý kiến trên.
- Khi yếu tố khác không đổi, chi phí chào hàng thay đổi 1 đơn vị thì doanh số bán
giữa 2 thái độ thay đổi có khác nhau hay không? Điều đó còn đúng với chi phí
quảng cáo không?
Chương 6: Sự vi phạm giả thiết

6.1. Đa cộng tuyến


6.2. Phương sai sai số thay đổi
6.3. Tự tương quan
Chương 6: Sự vi phạm giả thiết
6.1. Đa cộng tuyến
6.1.1. Bản chất của đa cộng tuyến
Xét hàm hồi quy tuyến tính k biến
Nếu tồn tại các con l1, l 2, . . . . . , l k sao cho:
+ l1+ l 2.X2i + ..... + lk. Xki = 0 thì giữa các biến Xi xảy ra
hiện tượng đa cộng tuyến hoàn hảo.
+ l1+ l 2.X2i + ..... + lk. Xki + Vi = 0 (với Vi là sai số ngẫu
nhiên) thì giữa các biến Xi xảy ra hiện tượng đa cộng tuyến không
hoàn hảo.
Chương 6: Sự vi phạm giả thiết

6.1. Đa cộng tuyến


6.1.2. Cách phát hiện đa cộng tuyến
Hồi quy phụ, tức là hồi quy một biến giải thích theo các
biến còn lại, sau đó đánh giá mức độ phù hợp của mô hình.
Nếu mô hình hồi quy phụ mà phù hợp thì xảy ra hiện
tượng đa cộng tuyến và ngược lại.
Tiến hành hồi quy phụ 2 biến độc lập trong mô hình 3 biến, thu được kết quả sau:
Dependent Variable: X
Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob.

C 0.786191 1.153165 0.681768 0.5146


Z 0.488590 0.317362 1.539533 0.1622
Kiểm định trên nhằm mục đích gì:
A. Phát hiện đa cộng tuyến
B. Phát hiện phân phối sác xuất của đại lượng ngẫu nhiên
C. Phát hiện tự tương quan
D. Phát hiện phương sai sai số thay đổi
Theo kết quả trên, mô hình có vi phạm giả thiết, với mức ý nghĩa 5%?
A. Có B. Không
Chương 6: Sự vi phạm giả thiết

6.2. Phương sai sai số thay đổi


6.2.1. Bản chất của phương sai sai số thay đổi
Phương sai sai số thay đổi là sự vi phạm giả thiết var(Ui/Xi) =
s2,
Khi đó phương sai của sai số sẽ phụ thuộc vào từng quan sát,
tức là:
var(Ui/Xi) = si2 (i = 1, 2,…n): phương sai có điều kiện của Yi
thay đổi khi Xi thay đổi.
Chương 6: Sự vi phạm giả thiết
6.2. Phương sai sai số thay đổi
6.2.2. Cách phát hiện phương sai sai số thay đổi
Kiểm định Park:
+ Bước 1: Ước lượng hồi quy gốc. Tính được ei.
+ Bước 2: Ước lượng mô hình:
Ln(ei2) = b1 + b2.Ln(Xi) + ui.
+ Bước 3:
KĐGT: H0: b2 = 0 (không có hiện tượng phương sai sai số thay đổi)
H1: b2  0 (có hiện tượng phương sai sai số thay đổi)
Nếu bác bỏ giả thiết H0 thì có hiện tượng phương sai sai số thay đổi và ngược
lại.
Chương 6: Sự vi phạm giả thiết
6.2.  Phương sai sai số thay đổi

6.2.2. Cách phát hiện phương sai sai số thay đổi


Kiểm định Glejser:
+ Bước 1, bước 3 tương tự KĐ Park
+ Bước 2: Ước lượng mô hình:
= b1 + b2.Xi + ui
= b1 + b2. + ui
= b1 + b2.(1/Xi )+ ui
= b1 + b2.(1/ )+ ui
Nghi ngờ mô hình có khuyết tật, tiến hành kiểm định thu được kết quả sau
Dependent Variable: ABS(RESID)
Variable Coefficient Std. Error t-Statistic Prob.
C 1.032960 1.670757 0.618259 0.5502
X 0.152382 0.130431 1.168299 0.2698
F-statistic 1.364923 Prob(F-statistic) 0.269784
Kiểm định trên nhằm mục đích gì:
A. Phát hiện đa cộng tuyến
B. Phát hiện phân phối sác xuất của đại lượng ngẫu nhiên
C. Phát hiện tự tương quan
D. Phát hiện phương sai sai số thay đổi
Theo kết quả trên, mô hình có vi phạm giả thiết với mức ý nghĩa 10%?
A. Có B. Không
Nghi ngờ mô hình có khuyết tật, tiến hành kiểm định thu được kết quả sau
White Heteroskedasticity Test:

F-statistic 0.474356 Probability 0.637001


Obs*R-squared 1.144324 Probability 0.564304

Kiểm định trên nhằm mục đích gì:


A. Phát hiện đa cộng tuyến
B. Phát hiện phân phối sác xuất của đại lượng ngẫu nhiên
C. Phát hiện tự tương quan
D. Phát hiện phương sai sai số thay đổi
Theo kết quả trên, mô hình có vi phạm giả thiết với mức ý nghĩa 10%?
A. Có B. Không
Chương 6: Sự vi phạm giả thiết

6.3. Tự tương quan


6.3.1. Bản chất của tự tương quan
Tự tương quan trong mô hình hồi quy tuyến tính cổ điển là sự vi
phạm giả thiết không có sự tương quan giữa các Ui,khi đó sai số
ngẫu nhiên của các quan sát phụ thuộc vào nhau, tức là:
cov(Ui,Uj)≠ 0
Chương 6: Sự vi phạm giả thiết

6.3. Tự tương quan


6.3.2. Phát hiện tự tương quan
Kiểm định d của Durbin-Watson
+ Bước 1: Tính d (thường có trong các phần mềm kinh tế lượng)
+ Bước 2: Áp dụng quy tắc kiểm định đơn giản sau:
 Nếu 0 < d < 1 thì kết luận mô hình có tự tương quan dương
 Nếu 1 < d < 3 thì kết luận mô hình không có tự tương quan
 Nếu 3 < d < 4 thì kết luận mô hình có tự tương quan âm
Dependent Variable: Y
Method: Least Squares
Date: 09/28/18 Time: 17:13
Sample: 1 10
Included observations: 10

Variable Coefficient Std. Error t-Statistic Prob.  

C 12.27273 3.803659 3.226558 0.0121


X 0.535455 0.021197 25.26091 0.0000

R-squared 0.987618     Mean dependent var 103.3000


Adjusted R-squared 0.986071     S.D. dependent var 32.62600
S.E. of regression 3.850620     Akaike info criterion 5.711202
Sum squared resid 118.6182     Schwarz criterion 5.771719
Log likelihood -26.55601     Hannan-Quinn criter. 5.644815
F-statistic 638.1134     Durbin-Watson stat 2.870002
Prob(F-statistic) 0.000000
Chương 6: Sự vi phạm giả thiết
6.3. Tự tương quan
6.3.2. Phát hiện tự tương quan
Kiểm định BG
Nghi ngờ mô hình có khuyết tật, tiến hành kiểm định thu được kết quả sau
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 1.000733 Probability 0.350451
Obs*R-squared 1.250801 Probability 0.263400

Kiểm định trên nhằm mục đích gì:


A. Phát hiện đa cộng tuyến
B. Phát hiện phân phối sác xuất của đại lượng ngẫu nhiên
C. Phát hiện tự tương quan
D. Phát hiện phương sai sai số thay đổi
Theo kết quả trên, mô hình có vi phạm giả thiết với mức ý nghĩa 10%?
A. Có B. Không
THỰC HÀNH EVIEWS
Một công ty có số liệu về doanh số bán (Y – triệu đồng), chi phí chào hàng (X2 – triệu đồng) và chi phí
quảng cáo (X3- triệu đồng) ở 10 khu vực bán hàng trong năm 2014 như sau. Cho độ tin cậy 90%.
Y 200 220 240 250 250 260 280 290 300 320
X2 2 2 3 4 5 6 6 7 8 9
X3 12 14 15 16 17 18 19 19 20 21
D 0 0 1 1 0 0 0 1 1 0

1. Tìm bảng Equation mô tả mối quan hệ Y theo X2 (MH1 lưu tên EQ01), Y theo X3
(MH2 lưu tên EQ02), Y theo X2 và X3 (MH3 lưu tên EQ03), Y theo X2, X3 và D
(MH4 lưu tên EQ04)
2. Phát hiện trong MH3 có sự vi phạm giả thiết đa cộng tuyến, phương sai sai số
thay đổi, và tự tương quan hay không?

You might also like