You are on page 1of 6

e) Để chọn lựa được mô hình hồi quy phù hợp nhất (các biến giải thích có ý

nghĩa) bạn có những phương pháp nào để thực hiện việc này?. Hãy thực hiện các
phương pháp này và so sánh kết quả nhận được giữa các phương pháp này.

Các phương pháp lựa chọn mô hình hồi quy phù hợp nhất:

1. Sử dụng hệ số xác định R2: đo lường tỷ lệ biến thiên của biến phụ thuộc được
giải thích bởi các biến giải thích. Giá trị của nó nằm giữa 0 và 1. 0 cho biết hầu
như không phù hợp và 1 là phù hợp hoàn hảo. R2 thường nằm giữa hai giá trị
này; càng gần 0 thì càng ít phù hợp; càng gần 1 thì càng phù hợp.
2. Sử dụng hệ số xác định điều chỉnh R2: R2 và R2 tương đương nhau nhưng
người ta thường chọn R2 để đo sự phù hợp của mô hình. Nguyên nhân là vì khi
thêm biến giải thích vào mô hình (kể cả các biến không cần thiết) càng nhiều
thì R2 càng tăng, điều này đã thổi phồng mức độ phù hợp của mô hình và dẫn
đến một vấn đề là R2 không còn ý nghĩa trong hồi quy đa biến nữa. Chính vì
vậy, người ta chọn R2 là đại lượng đo lường mức độ phù hợp của mô hình
chính xác hơn so với R2 vì khi thêm biến giải thích vào mô hình thì R2 có thể
tăng hoặc không tăng tùy vào biến giải thích đó có ý nghĩa hay không. Điều
này đã khắc phục được khuyết điểm của R2 trong hồi quy đa biến, tức là R2
ngăn chặn được việc thêm các biến giải thích không có ý nghĩa vào mô hình.
3. Sử dụng tiêu chuẩn AIC (Akaike Info Criterion): Giống như R2 điều chỉnh,
tiêu chuẩn AIC đưa một mức phạt khắc nghiệt hơn cho việc đưa nhiều biến giải
thích vào mô hình. AIC được định nghĩa như sau:

AIC =

Tiêu chuẩn AIC hữu ích khi so sánh hai hoặc nhiều mô hình. Mô hình với AIC
thấp nhất thường là mô hình được chọn.
4. Sử dụng tiêu chuẩn Schwarz (SIC): Đây là một cách khác của tiêu chí AIC,
tiêu chuẩn Schwarz được định nghĩa như sau:

Giống AIC, giá trị SIC thấp hơn thì mô hình tốt hơn.
5. Sử dụng tiêu chuẩn Hannan - Quinn (HQ criterion):
f) Với mô hình hồi quy đã chạy ở Chapter 2 sau
Ln(HousingPrice) = β 0 + β 1*Old_planned + β 2*New_planned + β 3*Spontaneous +
β 4 *Between + β 5*Front + β 6*Villas + β 7*Condo + β 8*Vehicular + β 9*Other + β 10
*Rent + β 11*Office + β 12*Total_area + β 13*No_of_bedroom + β 14
*No_of_bathroom+ β 15 *Travel_Time + β 16*Mothly_Expenditure + β 17*Distance
+ β 18*Graduate + β 19*Undergraduate + u
Bạn hãy giải thích ý nghĩa của các hệ số gồm β 6, β 12, β 18

Mô hình ước lượng đầy đủ của các biến có dạng như sau:
Ln(HousingPrice)=6.36+0.25*Old_planned + 0.04*New_planned - 0.22*Spontaneous
- 0.019*Between + 0.29*Front + 0.65*Villas - 0.28*Condo + 0.12*Vehicular -
0.24*Other + 0.33*Rent + 0.22*Office + 0.004*Total_area + 0.096*No_of_bedroom
+ 0.114*No_of_bathroom - 0.001*Travel_Time + 0.006*Mothly_Expenditure -
0.008*Distance + 0.22*Graduate + 0.165*Undergraduate + u

Giải thích ý nghĩa của hệ số đứng trước biến:


Hệ số β 6 = 0.65 có nghĩa trong trường hợp các yếu tố khác không đổi, thì giá nhà
trung bình của biệt thự cao hơn 65% so với loại hình nhà hẻm nhỏ.
Hệ số β 12 = 0.004 có nghĩa là trong trường hợp các yếu tố khác không đổi, khi tổng
diện tích sàn tăng thêm 1m2 thì giá nhà trung bình tăng 0.4%.
Hệ số β 18 = 0.22 có nghĩa là trong trường hợp các yếu tố khác không đổi, thì giá nhà
trung bình của ngôi nhà có người mua đạt trình độ học vấn Sau Đại học cao hơn 22%
so với mức giá trung bình của ngôi nhà có người mua đạt trình độ học vấn THCS hoặc
THPT hoặc Trung cấp nghề/Cao đẳng.

g) Vẫn mô hình câu 2 f), Bạn hãy dự đoán giá nhà sẽ là bao nhiêu nếu biết các
thông tin sau:
- Nhà biệt thự ở khu vực đô thị quy hoạch cũ
- Nhà chỉ dùng để ở, có diện tích 250m2 , 4 phòng ngủ và 5 phòng tắm
- Thời gian di chuyển đến nơi làm việc là 10 phút
- Chi tiêu hàng tháng là 30 triệu
- Khoảng cách đến trung tâm thành phố là 5km
- Trình độ học vấn của chủ hộ là sau đại học

Ln(HousingPrice) = β 0 + β 1*Old_planned + β 2*New_planned + β 3*Spontaneous + β 4


*Between + β 5*Front + β 6*Villas + β 7*Condo + β 8*Vehicular + β 9*Other + β 10*Rent
+ β 11*Office + β 12*Total_area + β 13*No_of_bedroom + β 14*No_of_bathroom+ β 15
*Travel_Time + β 16*Mothly_Expenditure + β 17*Distance + β 18*Graduate + β 19
*Undergraduate + u

Mô hình ước lượng đầy đủ của các biến có dạng như sau:
ln ¿=6.36+0.25*Old_planned+0.04*New_planned- 0.22*Spontaneous -
0.019*Between + 0.29*Front + 0.65*Villas - 0.28*Condo + 0.12*Vehicular -
0.24*Other + 0.33*Rent + 0.22*Office + 0.004*Total_area + 0.096*No_of_bedroom
+ 0.114*No_of_bathroom - 0.001*Travel_Time + 0.006*Mothly_Expenditure -
0.008*Distance + 0.22*Graduate + 0.165*Undergraduate

Tạo biến giả dựa trên dữ liệu của biến HOUSING_TYPE:


- Front = 1 nếu là nhà liên kế mặt phố và Front = 0 nếu không phải là nhà liên kế mặt
phố.
- Villas=1 nếu là biệt thự và Villas=0 nếu không phải là biệt thự.
- Condo = 1 nếu là chung cư và Condo = 0 nếu không là chung cư.
- Vehicular = 1 nếu là nhà nằm trong hẻm lớn và Vehicular = 0 nếu không là nhà nằm
trong hẻm lớn.
- Other = 1 nếu là nhà thuộc loại khác và Other = 0 nếu không là nhà thuộc loại khác.
- Khi đó nếu tất cả các biến trên đều bằng 0 thì là nhà trong hẻm nhỏ.
Do đó, khi nhà là biệt thự: Villas = 1 và Front,Condo,Vehicular,Other = 0
Tạo biến giả dựa trên dữ liệu của biến URBAN_AREA :
- Old_planned=1 nếu thuộc khu vực đô thị quy hoạch cũ và Old_planned=0 nếu không
thuộc khu vực đô thị quy hoạch cũ
- New_planned=1 nếu thuộc khu vực đô thị quy hoạch mới và New_planned =0 nếu
không thuộc khu vực đô thị quy hoạch mới.
- Spontaneous = 1 nếu thuộc khu vực đô thị tự phát và Spontaneous = 0 nếu không
thuộc khu vực đô thị tự phát
- Betweens =1 nếu thuộc khu vực đô thị xen giữa các khu vực trên và Betweens =0
nếu không thuộc khu vực đô thị xen giữa các khu vực trên
Do đó, khi nhà ở khu vực đô thị quy hoạch cũ:
Old_planned =1 và New_planned,Spontaneous, Betweens = 0

Tạo biến giả dựa trên dữ liệu của biến FUNCTION:


- Rent = 1 nếu nhà có chức năng dùng để ở và một phần cho thuê và Rent=0 nếu nhà
không có chức năng dùng để ở và một phần cho thuê.
- Office = 1 nếu nhà có chức năng dùng để ở và kinh doanh văn phòng và Office = 0
nếu nhà không có chức năng dùng để ở và kinh doanh văn phòng.
- Khi đó nếu cả 2 biến trên đều bằng 0 thì nhà có chức năng chỉ dùng để ở.
Do đó, khi nhà chỉ dùng để ở: Rent = 0 và Office = 0

- Diện tích 250m2: Total_area= 250

- 4 phòng ngủ và 5 phòng tắm: No_of_bedroom= 4; No_of_bathroom= 5


- Thời gian di chuyển đến nơi làm việc là 10 phút: Travel_Time= 10
- Chi tiêu hàng tháng là 30 triệu: Mothly_Expenditure= 30
- Khoảng cách đến trung tâm thành phố là 5km: Distance= 5

Tạo biến giả dựa trên dữ liệu của biến EDUCATION:


- Graduate=1 nếu trình độ học vấn là sau đại học và Graduate=0 nếu trình độ học vấn
không phải là sau đại học.
- Undergraduate=1 nếu trình độ học vấn là đại học và Undergraduate=0 nếu trình độ
học vấn không phải là đại học.
- Khi cả 2 biến trên đều bằng 0 thì trình độ học vấn THCS hoặc THPT hoặc Trung cấp
nghề/Cao đẳng
Do đó, khi trình độ học vấn của chủ hộ là sau đại học: Graduate=1 và
Undergraduate=0

Thay vào mô hình ước lượng trên:


- Villas = 1 và Front,Condo,Vehicular,Other = 0
- Old_planned =1 và New_planned,Spontaneous, Betweens = 0
- Rent = 0 và Office = 0
- Total_area= 250
- No_of_bedroom= 4; No_of_bathroom= 5
- Travel_Time= 10
- Mothly_Expenditure= 30
- Distance= 5
- Graduate=1 và Undergraduate=0

Ta có:
ln ¿=6.36 + 0.25+ 0.65 + 0.004.250 + 0.096.4 + 0.114.5 - 0.001*10 + 0.006*30 -
0.008*5 + 0.22 =9.564.
=> giá nhà trung bình là 14 242.7 triệu.

h) Bạn hãy tạo các biến tương tác sau:


Rent_area: bằng tích của hai biến Rent và Total_area
Office_area: bằng tích của hai biến Office và Total_area
Uớc lượng mô hình:
Ln(HousingPrice) = β 0 + β 1*Rent + β 2*Office + β 3*Total_area
+ β 4 *No_of_bedroom + β 5*No_of_bathroom + β 6*Travel_Time
+ β 7*Mothly_Expenditure + β 8*Distance+ β 9*Rent_area + β 10*Office_area
Bạn hãy cho biết ý nghĩa của hệ số β 3, β 9, β 10.

Sau khi chạy Stata, ta có mô hình ước lượng:


Ln(HousingPrice) = 6.46 + 0.653*Rent + 0.6488*Office + 0.006*Total_area +
0.0909*No_of_bedroom + 0.14*No_of_bathroom - 0.0006*Travel_Time+
0.009*Mothly_Expenditure - 0.015*Distance - 0.002*Rent_area - 0.003 *Office_area

Ý nghĩa của hệ số β 3, β 9, β 10.


^
β 3 = 0.006 : nghĩa là trong trường hợp các yếu tố khác không đổi, khi tổng diện tích
sàn tăng thêm 1m2 thì giá nhà trung bình tăng 0.6%.
^
β 9 = -0.002: nghĩa là trong trường hợp các yếu tố khác không đổi, khi tổng diện tích
sàn tăng thêm 1m2 thì giá nhà trung bình cho nhà ở và một phần cho thuê sẽ giảm
nhiều hơn nhà chỉ để ở 0.2%.
^
β 10 = -0.003: nghĩa là trong trường hợp các yếu tố khác không đổi, khi tổng diện tích
sàn tăng thêm 1m2 thì giá nhà trung bình cho nhà ở và kinh doanh văn phòng giảm
nhiều hơn nhà chỉ để ở 0.3%.

You might also like