You are on page 1of 4

BÀI TẬP 2

Sử dụng dữ liệu của tập tin hprice3.csv với các biến:


 price: giá bán nhà;
 area: diện tích ngôi nhà (feet vuông);
 rooms: số phòng trong nhà;
 baths: số phòng tắm;
 age: tuổi của ngôi nhà;

Xét mô hình hồi quy 1 (MH1):


log(price) = 0 + 1log(area) + 2rooms + 3baths + 4age + 5age2 + u
1) Tìm tác động biên của tuổi ngôi nhà đến giá bán nhà? Tác động này có phụ thuộc vào tuổi
ngôi nhà hay không?
2) Kết quả hồi quy MH1 từ phần mềm R như sau:
> hq2 <- lm(log(price) ~ log(area) + rooms + baths + age + I(age^2), data=hprice)
> summary(hq2)

Call:
lm(formula = log(price) ~ log(area) + rooms + baths + age + I(age^2),
data = hprice)

Residuals:
Min 1Q Median 3Q Max
-1.38002 -0.18929 -0.00412 0.19281 0.88033

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.914e+00 4.607e-01 15.008 < 2e-16 ***
log(area) 5.447e-01 6.863e-02 7.937 3.67e-14 ***
rooms 4.141e-02 2.348e-02 1.764 0.07870 .
baths 7.037e-02 3.752e-02 1.875 0.06167 .
age -8.838e-03 1.665e-03 -5.310 2.08e-07 ***
I(age^2) 3.446e-05 1.070e-05 3.222 0.00141 **
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2805 on 315 degrees of freedom


Multiple R-squared: ?????, Adjusted R-squared: ?????
F-statistic: 93.21 on 5 and 315 DF, p-value: < 2.2e-16

a) Viết hàm hồi quy mẫu từ kết quả trên?


b) Hãy giải thích ý nghĩa hệ số hồi quy của biến rooms?
c) Tính R2 và R2?
d) Hãy cho biết biến baths và biến rooms có ý nghĩa thống kê riêng lẻ hay không, với mức
ý nghĩa 5%?
e) Để kiểm định xem biến baths và biến rooms có ý nghĩa thống kê đồng thời hay không
thì ta tiến hành hồi quy mô hình ràng buộc là mô hình nào? Biết rằng khi hồi quy mô
hình ràng buộc và mô hình hồi quy phụ, ta thu được n R2u=8,765024 . Biến baths và biến
rooms có ý nghĩa thống kê đồng thời hay không, với mức ý nghĩa 5%?
f) Phát biểu giả thuyết cho rằng tuổi ngôi nhà không ảnh hưởng đến giá bán nhà? Kết luận
với mức ý nghĩa 1%. Biết rằng khi hồi quy mô hình đã gán ràng buộc, ta thu được
SSRR =29,4361.
g) Phát biểu giả thuyết cho rằng ảnh hưởng của tuổi ngôi nhà đến giá bán nhà là một hằng
số? Kết luận với mức ý nghĩa 6%.
h) Nếu một ngôi nhà đã được 10 năm tuổi thì giá bán sang năm của ngôi nhà ấy được dự
kiến sẽ thay đổi như thế nào? (Gợi ý: suy ra từ câu 1)

Xét mô hình hồi quy 2 (MH2):


log(price) = 0 + 1area + 2rooms + 3baths + 4age + 5arearooms + u
3) Tìm tác động biên của số phòng ngủ đến giá bán nhà? Tác động này có phụ thuộc vào diện
tích ngôi nhà hay không?
4) Kết quả hồi quy MH2 từ phần mềm R như sau:
> hq2 <- lm(log(price) ~ area + rooms + baths + age + area:rooms, data=hprice)
> summary(hq2)

Call:
lm(formula = log(price) ~ area + rooms + baths + age + area:rooms,
data = hprice)

Residuals:
Min 1Q Median 3Q Max
-1.35463 -0.17773 0.01418 0.19096 0.88757

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.089e+01 3.071e-01 35.451 < 2e-16 ***
area -8.587e-05 1.511e-04 -0.568 0.570174
rooms -4.208e-02 4.825e-02 -0.872 0.383882
baths 1.253e-01 3.308e-02 3.788 0.000182 ***
age -4.393e-03 5.583e-04 -7.870 5.77e-14 ***
area:rooms 5.161e-05 2.158e-05 2.392 0.017338 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 0.2777 on 315 degrees of freedom


Multiple R-squared: 0.6048, Adjusted R-squared: 0.5985
F-statistic: 96.39 on 5 and 315 DF, p-value: < 2.2e-16

a) Viết hàm hồi quy mẫu từ kết quả trên?


b) Phát biểu giả thuyết cho rằng số phòng ngủ không ảnh hưởng đến giá bán nhà? Kết
luận với mức ý nghĩa 1%. Biết rằng khi hồi quy mô hình đã gán ràng buộc, ta thu được
SSRR =25,2739.
c) Phát biểu giả thuyết cho rằng tác động của số phòng ngủ đến giá bán nhà là một hằng
số? Kết luận với mức ý nghĩa 3%.
HƯỚNG DẪN

Xét mô hình 1 (MH1):


1) Lấy đạo hàm 2 vế.
Tác động này không phụ thuộc vào tuổi ngôi nhà nếu 5 = 0.
2)
a. Hàm hồi quy mẫu:
^
log ⁡( price)=6,914+ 0,5447 log ( area )+ 0,04141rooms +0,07037 baths−0,00884 age+ 0,00003 age
2

b. (Tự làm) (xem slide cuối chương 2)


c. Suy ra từ công thức của F (giá trị của F đã cho ở dòng cuối bảng).
d. Kiểm định H0: 2 = 0 và H1: 2 ≠ 0
Kiểm định H0: 3 = 0 và H1: 3 ≠ 0
e. Kiểm định ràng buộc loại trừ: H0: 2 = 3 = 0. (Dùng kiểm định nhân tử Lagrange ở
chương 5).
f. Kiểm định H0: 4 = 5 = 0 (Dùng kiểm định F, trong đó SSRUR được suy ra từ công

thức )
g. Kiểm định H0: 5 = 0 và H1: 5 ≠ 0 (nếu 5 = 0 thì tác động của tuổi ngôi nhà lên giá
bán nhà là (1004)% và là hằng số)
h. Thay age = 10 vào biểu thức ở câu (1), với age = 1, ta được:
^
∂ log ⁡( price) ^
= β 4 +2 ^β5 age=−0,00884 +2 ×0,00003 ×10=…%
∂ age

Xét mô hình 2 (MH2):


3) Lấy đạo hàm 2 vế.
Tác động này không phụ thuộc vào diện tích ngôi nhà nếu 5 = 0.
4)
a. Hàm hồi quy mẫu:
^ −5 −2 −3
log ⁡( price)=10,89−8,587 × 10 area−4,208× 10 rooms+ 0,1253baths−4,393 ×10 age+5,161× 10
−5

b. Kiểm định H0: 2 = 5 = 0 (Dùng kiểm định F, trong đó SSRUR được suy ra từ công

thức )
c. Kiểm định H0: 5 = 0 và H1: 5 ≠ 0 (nếu 5 = 0 thì tác động của số phòng ngủ lên giá
bán nhà là (1002)% và là hằng số)
HƯỚNG DẪN THỰC HÀNH

 Tính toán thống kê nhân tử Lagrange: (Để kiểm định ràng buộc loại trừ)
> #Hồi quy mô hình đã gán ràng buộc và lấy phần dư:
> hq_restrict <- lm(log(price) ~ log(area) + age + I(age^2), data=hprice)
> phandu_res <- resid(hq_restrict)

> #Hồi quy phần dư theo các tất cả các biến giải thích (hồi quy phụ) và thu được R-bình
phương:
> hq_phu <-lm(phandu_res ~ log(area) + rooms + baths + age + I(age^2), data = hprice)
> r2_phu <- summary(hq_phu)$r.squared

> #Tính toán thống kê nhân tử Lagrange:


> LM <- nobs(hq_phu)*r2_phu
> LM
[1] 8.765024
Hướng dẫn: tra bảng Chi-bình phương và so sánh với LM để kết luận.

 Tìm SSR của mô hình hồi quy: (Để kiểm định ràng buộc loại trừ)
> #Hồi quy mô hình:
> hq3 <- lm(log(price) ~ log(area) + rooms + baths, data=hprice)

> #Tìm SSR:


> anova(hq3)
Analysis of Variance Table

Response: log(price)
Df Sum Sq Mean Sq F value Pr(>F)
log(area) 1 26.4256 26.4256 284.579 < 2.2e-16 ***
rooms 1 1.4150 1.4150 15.238 0.0001158 ***
baths 1 4.1624 4.1624 44.825 9.801e-11 ***
Residuals 317 29.4361 0.0929
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Hướng dẫn: SSR nằm ở dòng Residuals: SSR = 29,4361.

You might also like