You are on page 1of 5

R-squared: thước đo mức độ “phù hợp” của đường hồi quy với bộ dữ liệu

R- square càng tiến về 1, độ phù hợp càng tốt


R-sq ≥0,1→ đường hồi quy có sự phù hợp với bộ dữ liệu
Regression analysis: phân tích hồi quy
Có 2 loại hồi quy:
Simple linear regression: hồi quy chỉ có 1 biến độc lập
Multiple regression (hồi quy đa biến/ hồi quy bội): gồm 2 hay nhiều hơn các biến
độc lập
Biến độc lập: là biến hoàn toàn tự do, nó tác động đến biến phụ thuộc
Biến phụ thuộc: biến chịu tác động của biến độc lập

Quy trình chạy hồi quy:

Analyze → Regression → Linear →


(cái nào thay đổi khi cái khác thay đổi thì đưa vào dependent; cái nào không đổi khi cái khác đổi thì đưa vào biến
Independent)

→ OK
Phân tích:
B1: Đánh giá độ phù hợp (đánh giá bằng Adjusted R-sq khi 2 cái R-sq khác biệt; giống nhau
thì cái nào cũng được)
Model Summary

Model R R Square Adjusted R Square Std. Error of the Estimate

1 .731a .535 .523 $7,287.72271


dimension0

a. Predictors: (Constant), Square Feet

- Adjusted R-square = 0,523→ đường hồi quy có sự phù hợp với bộ dữ liệu
- 52,3% sự biến đổi của biến market value được giải thích bởi biến Square feet (sự
biến đổi của biến phụ thuộc được giải thích bằng biến độc lập)

B2: Đánh giá Anova:

ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 2.442E9 1 2.442E9 45.972 .000a

Residual 2.124E9 40 5.311E7

Total 4.566E9 41

a. Predictors: (Constant), Square Feet


b. Dependent Variable: Market Value

+ H0: hệ số phương trình hồi quy bằng 0


H1: hệ số của phương trình hồi quy khác 0 (→ tồn tại phương trình hồi quy)
+ F=45,972
p= 0,001≤0,05→ có tồn tại ít nhất là 1 hệ số của phương trình hồi quy có ý nghĩa
thống kê
B3: Đánh giá hệ số

Coefficientsa

Model Standardized
Unstandardized Coefficients Coefficients

B Std. Error Beta t Sig.

1 (Constant) 32673.220 8831.951 3.699 .001


Square Feet 35.036 5.167 .731 6.780 .000

a. Dependent Variable: Market Value


• Constant: t=3,699
p=0,001
→ Có ý nghĩa thống kê
• Square Feet: t=6,780
p<0,001

→ Có ý nghĩa thống kê

* Lập phương trình hồi quy:


+ Dạng Unstandardized (hệ số chưa chuẩn hóa)
MB= 32673,22+35,036*Square feet
+ Dạng Standardized (đã chuẩn hóa)
MB=0,731*SF
* Tính chất dự báo: chỉ dùng được với hệ số chưa chuẩn hóa
vd: một ngôi nhà có diện tích 1000 feet vuông, …, tính tiền nhà chả hạn

VD: liệu thu nhập hô gia đình có bị tác động bởi tuổi, số năm làm việc vs ông chủ
hiện tại và education
B1: Đánh giá độ phù hợp
Model Summary

Model R R Square Adjusted R Square Std. Error of the Estimate

dimension0
1 .625a .390 .390 61.48507

a. Predictors: (Constant), Level of education, Age in years, Years with current employer

+ Adjusted R square= 0,39 → đường hồi quy có sự phù hợp với bộ dữ liệu
+ 39% sự biến đổi của các biến icome được giải thích bởi biến age, employ, ed
B2: Đánh giá ANOVA:
ANOVAb

Model Sum of Squares df Mean Square F Sig.

1 Regression 1.547E7 3 5157532.679 1364.277 .000a

Residual 2.418E7 6396 3780.413

Total 3.965E7 6399

a. Predictors: (Constant), Level of education, Age in years, Years with current employer
b. Dependent Variable: Household income in thousands

+ H0: Hệ số phương trình hồi quy bằng 0


H1: Hệ số phương trình hồi quy khác 0
+ F= 1364,277
p<0,001→ có tồn tại ít nhất một hệ số của phương trình hồi quy có ý nghĩa thống kê
B3: Đánh giá hệ số:

Coefficientsa

Model Standardized
Unstandardized Coefficients Coefficients

B Std. Error Beta t Sig.

1 (Constant) -15.638 3.459 -4.522 .000

Age in years -.279 .080 -.043 -3.495 .000

Years with current employer 5.337 .103 .659 52.052 .000

Level of education 15.631 .658 .238 23.761 .000

a. Dependent Variable: Household income in thousands

- Constant: t= -4,522
p<0,001→ có ý nghĩa thống kê
- Age: t= -3,495
p<0,001→ có ý nghĩa thống kê
- Employ: t=52,052
p<0,001→ có ý nghĩa thống kê
- Edu: t=23,761
p<0,001→ có ý nghĩa thống kê
Lập phương trình hồi quy:
- Chưa chuẩn hóa:
IM= -15,638-0,279*age+5,337*employ+15,631*ed
- Đã chuẩn hóa:
IM= -0,043*age+0,659*employ+0,238*ed
KL: vở

ví dụ phương pháp enter trong hồi quy

Coefficientsa

Model Standardized
Unstandardized Coefficients Coefficients
B Std. Error Beta t Sig.

1 (Constant) .725 .198 3.672 .000

Gender .028 .079 .011 .350 .726

Age category -.019 .038 -.016 -.502 .616

Item quality satisfaction .112 .033 .125 3.391 .001

Distance from home -.005 .035 -.005 -.153 .879

Shopping frequency -.005 .038 -.005 -.142 .888

Price satisfaction .224 .044 .228 5.057 .000

Variety satisfaction .151 .045 .156 3.357 .001

Service satisfaction .298 .037 .322 8.049 .000

a. Dependent Variable: Overall satisfaction

bắt buộc các biến thể hiện ra dù có ý nghĩa hay không, âm là ko có ý nghĩa, dương
là có ý nghĩa

You might also like