Professional Documents
Culture Documents
Chuong 4b - HOI QUY BOI - HQ Logistic
Chuong 4b - HOI QUY BOI - HQ Logistic
𝑇𝑟𝑜𝑛𝑔 do :
^𝑡
𝑦
∑ 𝑖 ∑ 𝑖 𝑦𝑖 ¿ −−>𝑀𝑖𝑛
Nghĩa là:
𝑒 = (2
𝑌 − ^ 2
𝑆𝑎𝑙𝑒𝑠=306,526−24,975(Pr𝑖𝑐𝑒)+74,131(𝑎𝑑𝑣𝑒𝑟𝑡𝑖sin𝑔)
Từ phương trình trên, b1= -24,975, có nghĩa
là khi giá tăng lên 1 usd thì số lượng bán giảm
trung bình 24,975 cái với chi phí quảng cáo là giữ
cố định. Phân tích tương tự với b2.
RESIDUAL OUTPUT – Bảng 2.3 Kết quả rút ra từ việc xử lý bảng 2.1
Observation Predicted Pie Sales Residuals
1 413.7953606 -63.79536065
2 363.8451816 96.15481839
3 329.1183496 20.88165039
4 440.3147858 -10.31478584
5 359.088457 -9.088457029
6 415.7368519 -35.73685186
7 416.5311629 13.46883708
8 420.9701631 49.02983692
9 391.1589179 58.84108213
10 478.1745756 11.82542435
11 386.1639 -46.16389997
12 346.4420501 -46.44205006
13 455.6969951 -15.69699508
14 441.1090969 8.890903095
15 331.8541519 -31.85415188
2.3 Hệ số xác định
Để đánh giá mức độ phù hợp của mô hình
(model fit) đối với mô hình hồi quy bội, ta cũng
dựa vào hệ số xác định.
Trong mô hình hồi quy tuyến tính đơn, hệ số
xác định r2 = SSR/SST đo lường sự biến thiên
của Y được giải thích bởi biến độc lập X (đo
lường sự phù hợp đối với phương trình hồi quy
ước lượng).
Trong mô hình hồi quy bội, hệ số xác định
nó thể hiện phần biến thiên của Y được giải thích
bởi một tập hợp các biến độc lập được chọn.
Hệ số xác định trong hồi quy bội:
𝑆𝑆𝑅 29460,03
𝑀𝑆𝑅= = =14730,0
𝑘 2
Fkiểm định = 14730/ 2252,8 =6,539
F2,12,0.05 = 3,89
Fkiểm định = 6,539 > F2,12,0.05 =3,89. Ta bác bỏ H0
Hay từ bảng xử lý bằng SPSS:
p-value = 0,012 < 0,05. Ta bác bỏ H0
Đủ bằng chứng để kết luận các biến độc lập đưa
vào giải thích một cách có ý nghĩa cho biến thiên biến phụ
p-value ≤ α
Hoặc t ≤ - tn-k-1,α/2 hay t ≥ tn-k-1,α/2
Từ bảng trên với kết quả xử lý bằng SPSS:
b1 = -24,975 Sb1 = 10,832
b2 = 74,131 Sb2 = 25,967
ttest statistic = -24,9751/10,83213 = -2,31
và ttest statistic = 74,13096/25,96732 = 2,85
Sử dụng mức ý nghĩa 0.05, ta tính:
tn-k-1,α/2 = t15-2-1,0.025 = 2,179
Với 2,31 > 2,179, ta bác bỏ H0: β1 = 0
Với 2,85 > 2,179, ta bác bỏ H0: β2 = 0
bi ± tn-k-1,α/2Sbi
Từ ví dụ: 2.1 (slide 14, ước lượng độ tin
cậy 95% cho β1 và β2.
Tự tương quan
Đối với mô hình hồi quy với dữ liệu thời gian
(Dữ liệu chuỗi) có mắc phải hiện tượng tự tương quan
– Sai số ngẫu nhiên tại các thời gian khác nhau là có
tương quan với nhau.
4 - dU 4 - dL 4
0 dL dU 2
4 – dU = 2,46 4
dL=0,95 dU =1,54 2
dL = 0,95 và dU = 1,54
(Tra trong bảng phân phối Durbin-Watson với α = 0.05 và n=15, k=2)
Từ file: HOIQUYBOI.sav
Continue
xong vào
save
Tiếp theo vào Plots
Kết quả xử lý bằng SPSS 20.0
Kết quả xử lý bằng SPSS 20.0
Kết quả xử lý bằng SPSS 20.0
Chúng ta thấy St.
Predicted Value và e
(Standard. Residual)
độc lập nhau và
phương sai của e
không thay đổi. Mô
hình hồi qui tuyến
tính là phù hợp (xem:
Nguyễn Đình Thọ
(2011), Phương pháp
nghiên cứu khoa học
trong kinh doanh (tr.
498-499)).
Phần dư phân tán ngẫu nhiên trong 1 vùng xung quanh
đường đi qua tung độ 0, thì giả định tuyến tính được thỏa
mãn.
Dựa vào phân phối tần số của phần dư, ta thấy μ gần như bằng
0 và độ lệch chuẩn = 0,926 xấp xỉ 1. Kết luận phần dư có phân ph ối
chuẩn.
Từ file: HOIQUYBOI.sav
Ta có thể dựa vào P-P Plot để kết luận phần dư có
phân phối chuẩn (xem phần hồi qui tuyến tính đơn).
Bài tập tại lớp 1: Bảng ANOVA đối với mô hình hồi
quy bội với 2 biến độc lập
Nguồn biến Bậc tự do Tổng bình Trung bình F
thiên phương bình phương
Hồi quy 2 30
Sai số 10 120
Total 12 150
(2) Trong mô hình hồi quy có chứa các biến giải thích
với lũy thừa bậc cao dần của biến giải thích.
(3) Trường hợp khi mô hình hồi quy có nhiều biến
giải thích hơn kích thước mẫu hay số quan sát.
(4) Do bản chất của mối liên hệ giữa các biến giải
thích, chẳng hạn vốn và lao động trong cùng ngành
thường có quan hệ tuyến tính khá chặt chẽ vì những
doanh nghiệp có nhiều vốn thường sử dụng nhiều lao
động.
Có thể nhận thấy hiện tượng đa cộng tuyến
qua các công cụ:
Kết quả bảng dưới đây cho thấy các VIF đều nhỏ hơn 2,
cho nên không có hiện tượng đa cộng tuyến.
Sử dụng phương trình hồi quy ước lượng để ước
lượng và dự báo
□ Thuû tuïc ñeå öôùc löôïng giaù trò trung bình cuûa Y
vaø dự báo moät giaù trò caù bieät cuûa Y trong hoài quy
boäi töông töï vôùi caùc thuû tuïc trong hoài quy ñôn .
□ Chuùng ta thay caùc giaù trò ñaõ cho cuûa x1, x2, . . . ,
xk vaøo phöông trình hoài quy öôùc löôïng vaø söû
duïng caùc giaù trò töông öùng cuûa y như là öôùc
löôïng ñieåm.
Từ ví dụ 2.1, ta đã xác định được phương trình
hồi quy ước lượng là:
¿
Dự báo số lượng bán được/tuần, với giá bán
là 5,5 usd và chi phí quảng cáo là 3,50 (100 usd):
¿
Biến độc lập định tính
(Dummy variables – Biến giả)
□ Trong nhieàu tình huoáng ta phaûi laøm vieäc vôùi
caùc bieán ñoäc laäp ñònh tính nhö giôùi tính (nam,
nöõ), phöông thöùc thanh toaùn (tieàn maët, seùc, theû
tín duïng), v.v…
□ Ví duï nhö biến x2 coù theå laø giôùi tính: trong ñoù
0 chỉ nam
x2 =
□ Trong tröôøng hôïp naøy, x2 ñöôïc
1 chægoïinöõ.
laø moät bieán
giaû hay bieán chæ baùo.
Ví dụ 2.2: Giám đốc kinh doanh của hãng sản xuất
xe gắn máy HD muốn xác định các nhân tố ảnh
hưởng đến số lượng xe gắn máy bán ở các đại lý.
Để phát triển kế hoạch kinh doanh, ông ta
chọn ngẫu nhiên 12 chủ đại lý. Từ 12 người này ông
đã nhận được: số xe bán ra trong tháng qua, thời
gian quảng cáo trên TV (phút), số nhân viên và chủ
đại lý đã (chưa) qua lớp đào tạo về bán hàng. Dữ
liệu cho trong bảng dưới đây:
Số xe Thời Số Đã Số xe Thời Số Đã
bán gian nhân qua bán gian nhân qua
tháng QC viên, đào tháng QC viên, đào
qua, trên X2 tạo, qua, trên X2 tạo,
Yi TV, X1 X3 Yi TV, X1 X3
Trong đó:
Y = Số xe bán trong tháng
x1 = Thời gian quảng cáo TV
x2 = số nhân viên
x3 = 1 nếu chủ đại lý đã qua lớp bán hàng
x3 = 0 nếu chủ đại lý chưa qua lớp bán hàng
x3 ñöôïc xem nhö laø moät bieán giaû.
Thực hiện trên SPSS
□ Chọn Analyze → Regression → Linear
□ Đưa biến phụ thuộc vào Dependent
□ Đưa 1 hoặc nhiều biến độc lập (định lượng)
sang ô Independents
□ Chọn Enter ở ô Method (mặc định)
□ Click Statistics chọn Estimates và Model fit
(mặc định)
□ Chọn thêm Collinearity diagnostics (Xem xét
đa cộng tuyến), Durbin-Watson (xem xét tính độc lập
của phần dư), Casewise diagnostics (Xem xét outlier)
→ Continue
□ Vào Plots, chọn ZPRED chuyển sang hộp X : và
ZRESID chuyển sang hộp Y: (vẽ biểu đồ nhằm xem
xét giả định về phương sai không đổi).
□ Chọn produce all partial plots (để xem xét biểu đồ
phân tán giữa từng biến độc lập với biến phụ thuộc
→ Continue
Vào Save chọn Cook’s và Leverage values (để xem
xét Influential points và Leverage points → continue
→ OK
Kết quả xử lý bằng SPSS 20.0
Phương trình hồi quy ước lượng tìm được:
y 31,133 2,152QCTV 5, 014 NV 5, 665 DT
200
0
0 20 40 60 80 100 120
Sample Percentile