You are on page 1of 15

1.

Mô hình 1

Dependent Variable: WAGE


Method: Least Squares
Date: 01/16/24 Time: 13:59
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C -11.20210 4.627702 -2.420662 0.0164


EDUC 2.494950 0.324147 7.696971 0.0000

R-squared 0.230301 Mean dependent var 23.65235


Adjusted R-squared 0.226413 S.D. dependent var 15.33695
S.E. of regression 13.48942 Akaike info criterion 8.051638
Sum squared resid 36028.97 Schwarz criterion 8.084622
Log likelihood -803.1638 Hannan-Quinn criter. 8.064986
F-statistic 59.24337 Durbin-Watson stat 2.045528
Prob(F-statistic) 0.000000

Bảng 1. Mô hình 1
^
WAGE = -11,2021 + 2,4950EDUC

a. Giải thích ý nghĩa hệ số:


 ^
β = 2,4950: Nếu số năm đi học tăng 1 năm thì trung bình thu nhập trong mỗi giờ tăng
2

2,4950$.
 R2 = 0,2303: Số năm đi học giải thích được 23,03% sự biến động của thu nhập trong mỗi
giờ xung quanh giá trị trung bình, còn lại 76,97% sự biến động là do các yếu tố khác gây
nên.
b. Kiểm định sự phù hợp của hàm hồi quy tuyến tính đó với tổng thể, với mức ý nghĩa
5%.

{
2
H 0 : R =0
H 1 : R2 ≠ 0

Pvalue= 0.0000 < 0.05, bác bỏ H0, chấp nhận H1


Kết luận: Vậy với mức ý nghĩa 5%, có thể cho rằng mô hình hồi quy phù hợp với tổng thể.
2. Mô hình 2

Dependent Variable: WAGE


Method: Least Squares
Date: 01/17/24 Time: 15:17
Sample: 163 362 IF FAMINC>0
Included observations: 128

Variable Coefficient Std. Error t-Statistic Prob.

C -9.913879 11.29420 -0.877785 0.3817


EDUC 2.736366 0.419281 6.526326 0.0000
LOG(FAMINC) -0.423586 0.869657 -0.487073 0.6271

R-squared 0.258822 Mean dependent var 24.27281


Adjusted R-squared 0.246963 S.D. dependent var 14.86084
S.E. of regression 12.89590 Akaike info criterion 7.974854
Sum squared resid 20788.02 Schwarz criterion 8.041698
Log likelihood -507.3907 Hannan-Quinn criter. 8.002013
F-statistic 21.82518 Durbin-Watson stat 2.039344
Prob(F-statistic) 0.000000

Bảng 2. Mô hình 2
^
WAGE = -9.913879 + 2.736366.EDUC + -0.423586.lnFAMINC + e
a. Giải thích ý nghĩa các hệ số:
 β1: Nếu không đi học và thu nhập khác của gia đình là 1$ thì trung bình thu nhập trong
mỗi giờ bằng -9.913879$
 β2: Nếu tăng 1 năm đi học, thu nhập khác của gia đình không đổi thì trung bình thu nhập
trong mỗi giờ tăng 2.736366$
 β3: Nếu số năm đi học không đổi, thu nhập khác của gia đình tăng 1% thì trung bình thu
nhập trong mỗi giờ giảm 0.0042$
b. Số năm đi học có tác động đến thu nhập không, với mức ý nghĩa 5%?
H0: β2 = 0
H1: β2 ≠ 0
P-value = 0.0000 < α: bác bỏ H0. Chấp nhận H1
Vậy với độ tin cậy 5%, số năm đi học có tác động đến thu nhập.
3. Mô hình 3

Dependent Variable: WAGE


Method: Least Squares
Date: 01/16/24 Time: 16:50
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C -16.07940 4.718601 -3.407662 0.0008


EDUC 2.395336 0.316791 7.561254 0.0000
METRO 7.935326 2.288683 3.467201 0.0006

R-squared 0.274569 Mean dependent var 23.65235


Adjusted R-squared 0.267204 S.D. dependent var 15.33695
S.E. of regression 13.12896 Akaike info criterion 8.002405
Sum squared resid 33956.83 Schwarz criterion 8.051880
Log likelihood -797.2405 Hannan-Quinn criter. 8.022427
F-statistic 37.28129 Durbin-Watson stat 2.040694
Prob(F-statistic) 0.000000

Bảng 3. Mô hình 3

EDUC: số năm đi học


METRO = 1 nếu gần khu vực tàu điện ngầm
WAGE : thu nhập trong mỗi giờ, $
PRM: WAGE= β1 + β2.EDUC + β3.METRO + u

(^
WAGE |METRO=0 ) = -16,07940 + 2,395336.EDUC + e

(^
WAGE |METRO=1 ) = -16,07940 + 2,395336.EDUC + 7,935326.1 + e

= -8,144074 + 2,395336. EDUC


a. Giải thích ý nghĩa các hệ số:
 β1= -16,07940 cho biết: Nếu người ở xa khu vực tàu điện ngầm có số năm đi học bằng 0
thì trung bình thu nhập trong mỗi giờ là -16,07940 $.
 β2= 2,395336 cho biết: Dù là người ở gần hay ở xa khu vực tàu điện ngầm thì nếu tăng lên
1 năm đi học thì trung bình thu nhập trong mỗi giờ tăng 2,395336 $
 β3= 7,935326 cho biết: Nếu có cùng số năm đi học bằng 0 thì trung bình thu nhập trong 1
giờ của người gần khu vực gần tàu điện ngầm so với người ở xa cao hơn 7,935326 $.
b. Đối với những người ở gần khu vực tàu điện ngầm, khi tăng số năm đi học lên 1 năm
thì trung bình thu nhập trong mỗi giờ thay đổi trong khoảng nào? Với độ tin cậy
95%.
Giải: t0.025(197) = 2.259
Đối với những người ở gần khu vực tàu điện ngầm, khi tăng số năm đi học lên 1 năm
thì trung bình thu nhập trong mỗi giờ tăng β2 $.
=> Cần tìm khoảng tin cậy đối xứng cho β2
2,395336 - t0.025(200-3).0,316791 ≤ β2 ≤ 2,395336 + t0.025(200-3).0,316791
(=) 1,679705 ≤ β2 ≤ 3,110966
Vậy với độ tin cậy 95% thì đối với những người gần khu vực tàu điện ngầm, kh tăng số
năm đi học lên 1 năm thì trung bình thu nhập mỗi giờ tăng lên trong khoảng từ
1,679705% đến 3,110966%.

4. Mô hình 4

Dependent Variable: WAGE


Method: Least Squares
Date: 01/15/24 Time: 22:23
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C -13.14307 5.005682 -2.625631 0.0093


EDUC 2.643642 0.347788 7.601297 0.0000
BLACK 17.23289 13.54951 1.271846 0.2049
EDUC*BLACK -1.452768 1.016421 -1.429298 0.1545

R-squared 0.239178 Mean dependent var 23.65235


Adjusted R-squared 0.227533 S.D. dependent var 15.33695
S.E. of regression 13.47966 Akaike info criterion 8.060038
Sum squared resid 35613.42 Schwarz criterion 8.126004
Log likelihood -802.0038 Hannan-Quinn criter. 8.086733
F-statistic 20.53874 Durbin-Watson stat 2.050183
Prob(F-statistic) 0.000000

Bảng 4. Mô hình 4

PRM: WAGE = β1 + β2.EDUC + β3.BLACK + β4.EDUC*BLACK + u

(^
WAGE /BLACK=0) = -13,1431 + 2,6375.EDUC

(^
WAGE /BLACK=1) = -13,1431 + 2,6375.EDUC + 17,2329.BLACK + -1,4528.EDUC*BLACK

a) Giải thích ý nghĩa các hệ số:

 β1 = -13,1431: Nếu lao động không phải là người da màu và không đi học thì có thu nhập
trung bình là -13,1431$/giờ.
 β2 = 2,6375: Nếu lao động không phải người da màu và có hơn nhau 1 năm đi học thì thu
nhập trung bình tăng 2,6375$/giờ.
 β3 = 17,2329: Nếu lao động có số năm đi học như nhau thì thu nhập trung bình của người
da màu so với người không phải nhiều hơn 17,2329$/giờ.
 β4 = -1,4528: Nếu lao động cùng hơn nhau 1 năm đi học thì mức giảm của người da màu
so với người không phải ít hơn 1,4528$/giờ.

b.Với mức ý nghĩa 5%, kiểm định ý kiến cho rằng thu nhập mỗi giờ của người lao động
bị ảnh hưởng bởi màu da.

H0: β3 = 0
H1: β3 ≠ 0
P-value = 0.2049 > α: chưa có cơ sở bác bỏ H0
Vậy với độ tin cậy 5% thu nhập mỗi giờ của người lao động không bị ảnh hưởng bởi màu da.

5. Kiểm định giả thiết


Kiểm định và khắc phục mô hình 3 với mức ý nghĩa 5%

a. Kiểm định hiện tượng Đa cộng tuyến ( dùng VIF):


Variance Inflation Factors
Date: 01/16/24 Time: 17:05
Sample: 163 362
Included observations: 200

Coefficient Uncentered Centered


Variable Variance VIF VIF

C 22.26519 25.83423 NA
EDUC 0.100356 23.73345 1.008293
METRO 5.238072 4.801397 1.008293

Bảng 5.1. Mô hình Kiểm định Đa cộng tuyến (VIF)

Nhận thấy VIF(EDUC) < 10 và VIF(METRO) < 10 nên mô hình không có hiện tượng đa cộng
tuyến.

b. Kiểm định Ramsey Reset ( thiếu 1 biến ):

Ramsey RESET Test


Equation: UNTITLED
Omitted Variables: Squares of fitted values
Specification: WAGE C EDUC METRO

Value df Probability
t-statistic 2.442871 196 0.0155
F-statistic 5.967617 (1, 196) 0.0155
Likelihood ratio 5.998542 1 0.0143

F-test summary:
Sum of Sq. df Mean Squares
Test SSR 1003.336 1 1003.336
Restricted SSR 33956.83 197 172.3697
Unrestricted SSR 32953.50 196 168.1301

LR test summary:
Value
Restricted LogL -797.2405
Unrestricted LogL -794.2412

Unrestricted Test Equation:


Dependent Variable: WAGE
Method: Least Squares
Date: 01/16/24 Time: 17:09
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C 11.22663 12.11040 0.927024 0.3551


EDUC -0.144145 1.085609 -0.132778 0.8945
METRO -0.715256 4.201072 -0.170256 0.8650
FITTED^2 0.024057 0.009848 2.442871 0.0155

R-squared 0.296003 Mean dependent var 23.65235


Adjusted R-squared 0.285228 S.D. dependent var 15.33695
S.E. of regression 12.96650 Akaike info criterion 7.982412
Sum squared resid 32953.50 Schwarz criterion 8.048379
Log likelihood -794.2412 Hannan-Quinn criter. 8.009108
F-statistic 27.47013 Durbin-Watson stat 2.088196
Prob(F-statistic) 0.000000

Bảng 5.2.1. Ramsey Reset Test


Kiểm định:
H0: có dạng hàm đúng / không thiếu biến giải thích
H1: có dạng hàm sai / có thiếu biến giải thích
Nhận thấy Prob[F-Statistic] = 0.0155 < α = 0.05
=> bác bỏ H0 => Mô hình 3 thiếu biến giải thích.
Khắc phục thêm biến EDUC2

Dependent Variable: WAGE


Method: Least Squares
Date: 01/17/24 Time: 15:09
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C 2.882293 10.38617 0.277513 0.7817


EDUC -0.615727 1.505460 -0.408996 0.6830
METRO 7.168683 2.301155 3.115255 0.0021
EDUC^2 0.116321 0.056876 2.045151 0.0422

R-squared 0.289726 Mean dependent var 23.65235


Adjusted R-squared 0.278854 S.D. dependent var 15.33695
S.E. of regression 13.02418 Akaike info criterion 7.991290
Sum squared resid 33247.33 Schwarz criterion 8.057256
Log likelihood -795.1290 Hannan-Quinn criter. 8.017985
F-statistic 26.64994 Durbin-Watson stat 2.090495
Prob(F-statistic) 0.000000

Bảng 5.2.2. Mô hình 3 sau thêm biến

Ramsey RESET Test


Equation: UNTITLED
Omitted Variables: Squares of fitted values
Specification: WAGE C EDUC METRO EDUC^2

Value df Probability
t-statistic 0.376128 195 0.7072
F-statistic 0.141473 (1, 195) 0.7072
Likelihood ratio 0.145047 1 0.7033

F-test summary:
Sum of Sq. df Mean Squares
Test SSR 24.10347 1 24.10347
Restricted SSR 33247.33 196 169.6292
Unrestricted SSR 33223.23 195 170.3755

LR test summary:
Value
Restricted LogL -795.1290
Unrestricted LogL -795.0564

Unrestricted Test Equation:


Dependent Variable: WAGE
Method: Least Squares
Date: 01/17/24 Time: 15:09
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C 1.276081 11.25093 0.113420 0.9098


EDUC 0.163536 2.562954 0.063808 0.9492
METRO 5.550525 4.881294 1.137101 0.2569
EDUC^2 0.059262 0.162055 0.365691 0.7150
FITTED^2 0.005784 0.015378 0.376128 0.7072

R-squared 0.290241 Mean dependent var 23.65235


Adjusted R-squared 0.275682 S.D. dependent var 15.33695
S.E. of regression 13.05280 Akaike info criterion 8.000564
Sum squared resid 33223.23 Schwarz criterion 8.083022
Log likelihood -795.0564 Hannan-Quinn criter. 8.033934
F-statistic 19.93527 Durbin-Watson stat 2.085148
Prob(F-statistic) 0.000000

Bảng 5.2.3. Ramsey Reset Test sau thêm biến


Nhận xét: Prob[F-statistic] = 0.7072 > 0.05 nên mô hình không bị thiếu biến
=> Sau khi thêm biến EDUC2 đã khắc phục được lỗi thiếu biến.

c. Kiểm định phương sai sai số thay đổi


White Test – Cross Term
Heteroskedasticity Test: White
Null hypothesis: Homoskedasticity

F-statistic 3.941780 Prob. F(4,195) 0.0042


Obs*R-squared 14.96165 Prob. Chi-Square(4) 0.0048
Scaled explained SS 40.32148 Prob. Chi-Square(4) 0.0000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 01/17/24 Time: 15:12
Sample: 163 362
Included observations: 200
Collinear test regressors dropped from specification

Variable Coefficient Std. Error t-Statistic Prob.

C 327.2453 528.6316 0.619042 0.5366


EDUC^2 2.138216 1.729694 1.236182 0.2179
EDUC*METRO 25.47031 31.32557 0.813084 0.4172
EDUC -49.86838 57.67544 -0.864638 0.3883
METRO^2 -228.4529 431.0920 -0.529940 0.5968

R-squared 0.074808 Mean dependent var 169.7842


Adjusted R-squared 0.055830 S.D. dependent var 401.1833
S.E. of regression 389.8235 Akaike info criterion 14.79395
Sum squared resid 29632659 Schwarz criterion 14.87641
Log likelihood -1474.395 Hannan-Quinn criter. 14.82732
F-statistic 3.941780 Durbin-Watson stat 1.967806
Prob(F-statistic) 0.004230

Bảng 5.3.1. White Test – Cross Term

H0: Mô hình gốc có PSSS đồng đều

H1: Mô hình gốc có PSSS thay đổi

P-Value 1= 0.0042 < α: bác bỏ H0, thừa nhận H1

P-Value 2= 0.0048 < α: bác bỏ H0, thừa nhận H1


P-Value 3= 0.0000 < α: bác bỏ H0, thừa nhận H1

Kết luận: Với mức ý nghĩa 5%, có thể cho rằng mô hình có phương sai sai số thay đổi

White Test – No Cross Terms

Heteroskedasticity Test: White


Null hypothesis: Homoskedasticity

F-statistic 7.491511 Prob. F(2,197) 0.0007


Obs*R-squared 14.13606 Prob. Chi-Square(2) 0.0009
Scaled explained SS 38.09652 Prob. Chi-Square(2) 0.0000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 01/17/24 Time: 15:15
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C -156.5263 88.90788 -1.760544 0.0799


EDUC^2 1.128160 0.354343 3.183809 0.0017
METRO^2 121.9859 67.99495 1.794043 0.0743

R-squared 0.070680 Mean dependent var 169.7842


Adjusted R-squared 0.061246 S.D. dependent var 401.1833
S.E. of regression 388.7039 Akaike info criterion 14.77840
Sum squared resid 29764871 Schwarz criterion 14.82787
Log likelihood -1474.840 Hannan-Quinn criter. 14.79842
F-statistic 7.491511 Durbin-Watson stat 1.960845
Prob(F-statistic) 0.000732

Bảng 5.3.2. White Test – No Cross Terms

H0: Mô hình gốc có PSSS đồng đều


H1: Mô hình gốc có PSSS thay đổi

P-Value 1= 0.0007 < α: bác bỏ H0, thừa nhận H1

P-Value 2= 0.0009 < α: bác bỏ H0, thừa nhận H1

P-Value 3= 0.0000 < α: bác bỏ H0, thừa nhận H1

Kết luận: Với mức ý nghĩa 5%, có thể cho rằng mô hình có phương sai sai số thay đổi

BPG Test

Heteroskedasticity Test: Breusch-Pagan-Godfrey


Null hypothesis: Homoskedasticity

F-statistic 6.941044 Prob. F(2,197) 0.0012


Obs*R-squared 13.16573 Prob. Chi-Square(2) 0.0014
Scaled explained SS 35.48151 Prob. Chi-Square(2) 0.0000

Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 01/17/24 Time: 15:42
Sample: 163 362
Included observations: 200

Variable Coefficient Std. Error t-Statistic Prob.

C -328.3564 140.0659 -2.344300 0.0201


EDUC 28.30588 9.403546 3.010129 0.0030
METRO 130.0094 67.93676 1.913682 0.0571

R-squared 0.065829 Mean dependent var 169.7842


Adjusted R-squared 0.056345 S.D. dependent var 401.1833
S.E. of regression 389.7172 Akaike info criterion 14.78361
Sum squared resid 29920262 Schwarz criterion 14.83308
Log likelihood -1475.361 Hannan-Quinn criter. 14.80363
F-statistic 6.941044 Durbin-Watson stat 1.952489
Prob(F-statistic) 0.001222

Bảng 5.3.2. BPG Test

H0: Mô hình gốc có PSSS đồng đều

H1: Mô hình gốc có PSSS thay đổi

P-Value 1= 0.0012< α: bác bỏ H0, thừa nhận H1

P-Value 2= 0.0014 < α: bác bỏ H0, thừa nhận H1

P-Value 3= 0.0000 < α: bác bỏ H0, thừa nhận H1

Kết luận: Với mức ý nghĩa 5%, có thể cho rằng mô hình có phương sai sai số thay đổi

Khắc phục: Dùng phương pháp GLS

d. Kiểm định tự tương quan


Kiểm định Durbin – Watson mô hình 3
Dựa vào bảng 3 có Durbin – Watson stat = 2.0407 ≈ 2 nên mô hình không có tự tương quan
e. Kiểm định u sai số chuẩn
Kiểm định Jarque-Bera

Bảng 5.5.1 Kiểm định Jarque-Bera


H0: u phân phối chuẩn
H1: u không phân phối chuẩn
Có P-value < alpha (0.0000<0.05) nên bác bỏ H0 thừa nhận H1
Vậy mô hình có sai số ngẫu nhiên không tuân theo quy luật chuẩn
Khắc phục: lấy log biến phụ thuộc WAGE, ta được:

Bảng 5.5.2 Kiểm định Jarque-Bera sau khắc phục

Có P-value > alpha (0.5104<0.05) : chưa có cơ sở bác bỏ H0


Vậy mô hình không có sai số ngẫu nhiên không tuân theo quy luật chuẩn

You might also like