You are on page 1of 6

HƯỚNG DẪN THỰC HÀNH

Sử dụng dữ liệu của tập tin wage1.csv với các biến:


 wage: tiền lương theo giờ (USD/giờ);
 educ: số năm đi học;
 exper: số năm kinh nghiệm;
 female: biến giả, =1 nếu là nữ và =0 nếu là nam;

Xét mô hình hồi quy sau:


log(wage) = 0 + 1educ + 2exper + 3female + 4educfemale + u
Kết quả hồi quy từ phần mềm R như sau:

> hq1 <- lm(log(wage) ~ educ + exper + female + educ:female, data=wage)


> summary(hq1)

Call:
lm(formula = log(wage) ~ educ + exper + female + educ:female,
data = wage)

Residuals:
Min 1Q Median 3Q Max
-1.89635 -0.26323 -0.03843 0.26973 1.28348

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.461499 0.126747 3.641 0.000299 ***
educ 0.092779 0.008978 10.334 < 2e-16 ***
exper 0.009430 0.001452 6.496 1.93e-10 ***
female -0.295884 0.178793 -1.655 0.098548 .
educ:female -0.003815 0.013975 -0.273 0.784962
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: ????? on 521 degrees of freedom


Multiple R-squared: ????? , Adjusted R-squared: ?????
F-statistic: 70.95 on 4 and 521 DF, p-value: < 2.2e-16

1) Viết hàm hồi quy mẫu và cho biết ý nghĩa của hệ số hồi quy đứng trước biến exper
trong hàm hồi quy mẫu?

2) Tính R2 và R2?

3) Bảng kết quả sau đây dùng để làm gì? Nêu kết luận.
> confint(hq1,level=0.95)
2.5 % 97.5 %
(Intercept) 0.212501746 0.71049710
educ 0.075142275 0.11041628
exper 0.006578124 0.01228234
female -0.647127437 0.05535971
educ:female -0.031269356 0.02363905

4) Dựa vào hàm hồi quy tổng thể, hãy tìm biểu thức tác động của số năm đi học đến tiền
lương theo giờ? Tác động này có như nhau đối với nam và nữ hay không, xét với mức
ý nghĩa 9%?

5) Cho bảng phân tích phương sai:


> anova(hq1)
Analysis of Variance Table

Response: log(wage)
Df Sum Sq Mean Sq F value Pr(>F)
educ 1 27.561 27.5606 149.5394 < 2.2e-16 ***
exper 1 9.424 9.4244 51.1353 2.934e-12 ***
female 1 15.309 15.3089 83.0634 < 2.2e-16 ***
educ:female 1 0.014 0.0137 0.0745 0.785
Residuals 521 96.022 0.1843
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Dựa vào bảng này, hãy tính sai số chuẩn hồi quy σ^ ?

6) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 2%?
> linearHypothesis(hq1,c("female=0","educ:female=0"))
Linear hypothesis test

Hypothesis:
female = 0
educ:female = 0

Model 1: restricted model


Model 2: log(wage) ~ educ + exper + female + educ:female

Res.Df RSS Df Sum of Sq F Pr(>F)


1 523 111.345
2 521 96.022 2 15.323 41.569 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

7) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 4%?
> library(lmtest)
> bptest(hq1, ~ fitted(hq1) + I(fitted(hq1)^2))

studentized Breusch-Pagan test

data: hq1
BP = 7.7447, df = 2, p-value = 0.02081
8) Bảng kết quả sau đây dùng để làm gì? Nêu cặp giả thuyết H0 và H1? Kết luận với mức ý
nghĩa 3%?
> resettest(hq1)

RESET test

data: hq1
RESET = 10.997, df1 = 2, df2 = 519, p-value = 2.1e-05
HƯỚNG DẪN

1) Hàm hồi quy mẫu:


^
log ⁡(wage)=0,4615+ 0 , 0928 educ+0,0094 exper−0 ,2959 female−0,003 8 educ × female
^β =0 , 0094 : trong điều kiện các yếu tố khác không đổi, ….
2
2) (Xem lại bài thực hành số 2)
3) (Xem lại bài thực hành số 1)
4) Lấy đạo hàm hai vế để tìm tác động biên.
Kiểm định H0: 4 = 0 và H1: 4 ≠ 0

5) Suy ra từ công thức .


6) (Xem lại bài thực hành số 1)
7) Bảng này dùng để kiểm định xem sai số u có phương sai thay đổi hay không. (Chương
8)
H0: Sai số u có phương sai không đổi.
H1: Sai số u có phương sai thay đổi.

8) Bảng này dùng để kiểm định xem mô hình có bị sai dạng hàm (bỏ sót biến) hay không.
(Chương 9)
H0: Mô hình không có bỏ sót biến (không có sai dạng hàm).
H1: Mô hình có bỏ sót biến (có sai dạng hàm).
HƯỚNG DẪN THỰC HÀNH

 Kiểm định phương sai thay đổi:


Cách 1: Dùng kiểm định Breusch-Pagan:
> #Tải gói lệnh lmtest về cài đặt vào máy.
> install.packages("lmtest")
> library(lmtest)

> #Thực hiện kiểm định Breusch-Pagan:


> bptest(hq1)

studentized Breusch-Pagan test

data: hq1
BP = 7.3247, df = 4, p-value = 0.1197
Giả thuyết H0: Sai số u có phương sai không đổi.
Hướng dẫn: nhìn p-value để kết luận.

Cách 2: Dùng kiểm định White:


> bptest(hq1, ~ fitted(hq1) + I(fitted(hq1)^2))

studentized Breusch-Pagan test

data: hq1
BP = 1.0882, df = 2, p-value = 0.5804
Hướng dẫn: nhìn p-value để kết luận.

 Tìm sai số chuẩn cải thiện và kiểm định t với sai số chuẩn cải thiện:
> library(lmtest)
> library(car)
> coeftest(hq1, vcov=hccm)

t test of coefficients:

Estimate Std. Error t value Pr(>|t|)


(Intercept) 6.75880371 0.55129854 12.2598 < 2.2e-16 ***
log(area) 0.52883925 0.08386017 6.3062 9.627e-10 ***
rooms 0.05933127 0.02216327 2.6770 0.0078161 **
baths 0.11909588 0.03570178 3.3359 0.0009517 ***
age -0.00376299 0.00072172 -5.2139 3.349e-07 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hướng dẫn: Cột Std.Error cho biết các sai số chuẩn cải thiện, cột t value cho biết các giá trị
t khi tính bằng sai số chuẩn cải thiện.

 Kiểm định F với sai số chuẩn cải thiện:


> library(lmtest)
> library(car)
> linearHypothesis(hq1, c("log(area)=0","rooms=0"), vcoc=hccm)
Linear hypothesis test
Hypothesis:
log(area) = 0
rooms = 0

Model 1: restricted model


Model 2: log(price) ~ log(area) + rooms + baths + age

Res.Df RSS Df Sum of Sq F Pr(>F)


1 318 31.663
2 316 25.595 2 6.0678 37.457 2.521e-15 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hướng dẫn: nhìn p-value để kết luận.

 Kiểm định bỏ sót biến (sai dạng hàm): Kiểm định Reset
> library(lmtest)
> resettest(hq1)

RESET test

data: hq1
RESET = 6.4577, df1 = 2, df2 = 314, p-value = 0.001785
Giả thuyết H0: Mô hình không có bỏ sót biến (không có sai dạng hàm).
Hướng dẫn: nhìn p-value để kết luận.

You might also like