Professional Documents
Culture Documents
Bai Tap 3 Va Thuc Hanh R
Bai Tap 3 Va Thuc Hanh R
Call:
lm(formula = log(price) ~ log(area) + rooms + baths + age + y81,
data = hprice)
Residuals:
Min 1Q Median 3Q Max
-1.23623 -0.12216 0.00395 0.12986 0.97979
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 7.658009 0.359854 21.281 < 2e-16 ***
log(area) 0.361645 0.054168 6.676 1.11e-10 ***
rooms 0.071860 0.017686 4.063 6.12e-05 ***
baths 0.164210 0.026768 6.134 2.56e-09 ***
age -0.002899 0.000421 -6.886 3.12e-11 ***
y81 0.378389 0.025096 15.078 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Title:
Jarque - Bera Normalality Test
Test Results:
STATISTIC:
X-squared: 316.8244
P VALUE:
Asymptotic p Value: < 2.2e-16
f) Hãy cho biết bảng kết quả sau đây dùng để làm gì? Nêu kết luận của mình.
> library(car)
Loading required package: carData
> vif(hq3)
log(area) rooms baths age y81
2.309699 1.722520 2.884587 1.274614 1.056738
g) Hãy cho biết bảng kết quả sau đây dùng để làm gì? Nêu kết luận của mình.
> c <- data.frame(area = 4000, rooms = 9, baths = 3, age = 20, y81 = 1)
> predict(hq3, c, interval="confidence", level=0.97)
fit lwr upr
1 12.11729 12.02507 12.20952
h) Hãy cho biết bảng kết quả sau đây dùng để làm gì? Nêu kết luận của mình.
> c <- data.frame(area = 4000, rooms = 9, baths = 3, age = 20, y81 = 1)
> predict(hq3, c, interval="prediction", level=0.98)
fit lwr upr
1 12.11729 11.59979 12.6348
i) Xét lại mô hình 1 (trong bài tập thực hành 1):
> hq1 <- lm(log(price) ~ log(area) + rooms + baths + age, data=hprice)
> summary(hq1)
Call:
lm(formula = log(price) ~ log(area) + rooms + baths + age, data = hprice)
Residuals:
Min 1Q Median 3Q Max
-1.3856 -0.1901 0.0122 0.1992 0.8413
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 6.7588037 0.4649094 14.538 < 2e-16 ***
log(area) 0.5288392 0.0694604 7.614 3.11e-13 ***
rooms 0.0593313 0.0231439 2.564 0.010822 *
baths 0.1190959 0.0348483 3.418 0.000715 ***
age -0.0037630 0.0005464 -6.887 3.09e-11 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Tính toán nhân tử phóng đại phương sai VIF: (Để xét xem mô hình có đa cộng
tuyến không)
> library(car)
Loading required package: carData
> vif(hq3)
log(area) rooms baths age y81
2.309699 1.722520 2.884587 1.274614 1.056738
Dự đoán khoảng tin cậy của giá trị trung bình của biến phụ thuộc khi biết giá trị
của các biến độc lập:
Giả sử ta muốn dự đoán về giá trị trung bình của log(price) của các ngôi nhà có diện
tích 4500 feet vuông, có 10 phòng, 4 phòng tắm, tuổi thọ 25 năm vào thời điểm năm
1978 thì ta tìm khoảng tin cậy 95% của giá bán trung bình đó như sau:
> d <- data.frame(area = 4500, rooms = 10, baths = 4, age = 25, y81 = 0)
> predict(hq3, d, interval="confidence", level=0.95)
fit lwr upr
1 12.00308 11.9055 12.10065
Từ bảng kết quả này, ta nhận thấy khoảng tin cậy 95% cho giá trị trung bình của
log(price) là: (11,9055; 12,100065).
Dự đoán khoảng tin cậy của giá trị cá biệt của biến phụ thuộc khi biết giá trị của
các biến độc lập:
Giả sử ta muốn dự đoán về một giá trị cụ thể của log(price) của ngôi nhà có diện tích
4500 feet vuông, có 10 phòng, 4 phòng tắm, tuổi thọ 25 năm vào thời điểm năm 1978
thì ta tìm khoảng tin cậy 95% của giá bán trung bình đó như sau:
> d <- data.frame(area = 4500, rooms = 10, baths = 4, age = 25, y81 = 0)
> predict(hq3, d, interval="prediction", level=0.95)
fit lwr upr
1 12.00308 11.56465 12.4415
Hướng dẫn: Từ bảng kết quả, ta suy ra khoảng tin cậy 95% cho giá trị cá biệt của
log(price).