You are on page 1of 7

Họ và tên: Trần Thanh Nhã

MSSV: K214051670

Homework

4.5 Với file “Ch4.xlsx”, sheet “Baitap4.2” trong Homework 4.2 bạn hãy
trả lời các câu hỏi sau:
a) Nếu đơn vị đo lường của Total_area (m2) được đổi thành đơn vị là
(cm2) thì hệ số đứng trước Total_area sẽ thay đổi như thế nào. Giải thích ý
nghĩa hệ số này
b) Nếu Price (triệu đồng) được đổi thành đơn vị là (tỉ đồng) thì hệ số
đứng trước Total_area sẽ thay đổi như thế nào. Giải thích ý nghĩa hệ số này.
c) Nếu đơn vị đo lường của Total_area (m2) được đổi thành đơn vị là
(cm2) và Price (triệu đồng) được đổi thành đơn vị là (tỉ đồng) thì hệ số đứng
Bài làm

a. Nếu đơn vị đo lường của Total_area (m2) được đổi thành đơn vị
là (cm2) thì hệ số đứng trước Total_area sẽ thay đổi như thế nào. Giải
thích ý nghĩa hệ số này

Hàm hồi quy mẫu: = -657.5051 + 35.94554X


Trong đó Y: price, X: total_area
Ta có: 1m2 = 10,000 cm2 => X* = X x 10,000 => k1 = 10,000
=> = -657.5051 + 35.94554x(k1/k1)X <=> = -657.5051 + 0.003594554X*
Ý nghĩa: Khi diện tích của căn hộ tăng 1 cm2 thì giá căn hộ sẽ tăng 1 lượng
trung bình là 0.3594554.

b. Nếu Price (triệu đồng) được đổi thành đơn vị là (tỉ đồng) thì hệ số
đứng trước Total_area sẽ thay đổi như thế nào. Giải thích ý nghĩa hệ số
này.
Ta có: 1 triệu đồng = 0.001 tỷ đồng => Y* = Y x 0.001 => k2 = 0.001
=> (k2/k2) = -657.5051 + 35.94554X <=> *= -0.657505.1 + 0.03594554X
Ý nghĩa: Khi diện tích của căn hộ tăng 1 m2 thì giá căn hộ sẽ tăng 1 lượng trung
bình là 0.03594554.

c. Nếu đơn vị đo lường của Total_area (m2) được đổi thành đơn vị là
(cm2) và Price (triệu đồng) được đổi thành đơn vị là (tỉ đồng) thì hệ số
đứng trước Total_area sẽ thay đổi như thế nào. Giải thích ý nghĩa hệ số
này

Ta có: k1 = 10,000, k2 = 0.001


=> (k2/k2) = -657.5051 + 35.94554(k1/k1)X <=> *= -0.6575051 +
0.000003594554X*
Ý nghĩa: Khi diện tích của căn hộ tăng 1 cm2 thì giá căn hộ sẽ tăng 1 lượng
trung bình là 0.000003594554.

4.5.1 Với file “Ch4.xlsx”, sheet “Baitap4.5” với mô hình hồi quy đa
biến
Price = f(Total_area, Duration, No_of_bedroom,
No_of_bathroom,Travel_time, Distance, Popu_density ) + ε
a) Hãy tìm hàm hồi quy mẫu.
b) Ước lượng các tham số với độ tin cậy 95%
c) Kiểm định tính có ý nghĩa của các tham số với mức ý nghĩa 5%.
d) Sử dụng Adjust R-squared để chọn lựa được mô hình phù hợp. Giải
thích R-squared với mô hình đã được chọn lựa phù hợp.
e) Sự khác biệt giữa R-squared và Adjust R-squared là gì trong hồi quy
đa biến.
f) Kiểm định Wald – test là gì ? Hãy sử dụng kiểm định Wald –test để
chọn Lựa mô
hình tốt nhất với mức ý nghĩa 5%.

a. Hãy tìm hàm hồi quy mẫu.


Ta có hàm hồi quy mẫu: = -878.55 + 26.14X1 + 31.21X2 + 173.67X3 + 589.98X4 - 7.08X5 - re44.72X6 + 0.003008X7
Trong đó:
X1: total_are, X2: duration, X3: no_of_bedroom, X4: no_of_bathroom, X5: travel_time, X6: distance, X7:
popu_density

b. Ước lượng các tham số với độ tin cậy 95%

Khoảng ước lượng của tham số là (-1804.57 ; 47.46)


Khoảng ước lượng của tham số là (22.09 ; 30.19)
Khoảng ước lượng của tham số là (4.91 ; 57.51)
Khoảng ước lượng của tham số là (-82.31 ; 429.65)
Khoảng ước lượng của tham số là (327.31 ; 852.64)
Khoảng ước lượng của tham số là (-22.66 ; 8.50)
Khoảng ước lượng của tham số là (-72.14 ; -17.29)
Khoảng ước lượng của tham số là (-0.009 ; 0.015)

c. Kiểm định tính có ý nghĩa của các tham số với mức ý nghĩa 5%.

Ta có các cặp giả thuyết:


(1)

{𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸:=03 ¿ 𝑀𝐸𝑅𝐺𝐸𝐹𝑂𝑅𝑀𝐴𝑇 :≠ 0 ; ( 2) {𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸 3 ¿ 𝑀𝐸𝑅


𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸 3 ¿ 𝑀𝐸
(5)

{𝐸𝑀𝐵𝐸𝐷 {𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛. 𝐾𝑆𝐸𝐸 3¿ 𝑀𝐸


𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸 3 ¿ 𝑀𝐸𝑅𝐺𝐸𝐹𝑂𝑅𝑀𝐴𝑇 :=0 ;(6) 𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸 3 ¿ 𝑀𝐸
𝐸𝑀𝐵𝐸𝐷 𝐸𝑞𝑢𝑎𝑡𝑖𝑜𝑛 . 𝐾𝑆𝐸𝐸 3 ¿ 𝑀𝐸𝑅𝐺𝐸𝐹𝑂𝑅𝑀𝐴𝑇 :≠ 0
Ta có
(1) (4) (6) (8) có p-value > 0.05 => Chấp nhận => Vậy hệ số , , , không
có ý nghĩa trong mô hình hồi quy
(2) (3) (5) (7) có p-value < 0.05 => Bác bỏ => Vậy hệ số , , , có ý
nghĩa trong mô hình hồi quy
d. Sử dụng Adjust R-squared để chọn lựa được mô hình phù hợp.
Giải thích R-squared với mô hình đã được chọn lựa phù hợp.

Ta có Adjust R-squared = 0.4067


===

Ta có Adjust R-squared = 0.4102


===
Ta có Adjust R-squared = 0.4429
===

Ta có Adjust R-squared = 0.4609


===

Ta có Adjust R-squared = 0.4627


===
Ta có Adjust R-squared = 0.4741
===

Ta có Adjust R-squared = 0.4735


===
Vậy Adjust R-squared max = 0.4741 => Mô hình phù hợp là mô hình
gồm các biến: total_area, duration, no_of_bedroom, no_of_bathroom,
travel_time và distance. Với R-squared = 0.479, cho biết có 47.9% giá trị của
price được giải thích qua các biến: total_area, duration, no_of_bedroom,
no_of_bathroom, travel_time, distance và 52.1% được giải thích qua các biến
khác.

e. Sự khác biệt giữa R-squared và Adjust R-squared là gì trong hồi


quy đa biến.
- Adjust R-squared < R-squared
- Nếu R-squared đủ nhỏ thì Adjust R-squared có thể mang giá trị âm
Trong hồi quy đa biến hệ số Adjust R-squared được sử dụng để đo
lường sự phù hợp của mô hình, còn R-squared được dùng để giải thích % sự
thay đổi của Y theo các biến giải thích khi đã chọn lựa được mô hình phù hợp
(kiểm định sự phù hợp)

f. Kiểm định Wald – test là gì ? Hãy sử dụng kiểm định Wald –test
để chọn lựa mô hình tốt nhất với mức ý nghĩa 5%.

Kiểm định Wald – test Kiểm định Wald-test là kiểm định cho phép loại
bỏ các biến không có ý nghĩa cùng một lúc trong mô hình.
Từ câu c ta có các hệ số , , , không có ý nghĩa trong mô hình hồi quy =>
có 3 biến không có ý nghĩa là: no_of_bedroom, travel_time, popu_density
Ta có cặp giả thuyết:
H0: Loại cùng lúc 3 biến: no_of_bedroom, travel_time, popu_density
H1: Không loại cùng lúc 3 biến: no_of_bedroom, travel_time,
popu_density

Ta thấy p_value > 0.05 (0.4249 > 0.05) => Chấp nhận H0
Vậy với mức ý nghĩa 5%, mô hình tốt nhất gồm các biến: price, total_area,
duration, no_of_bathroom, distance.

You might also like