You are on page 1of 37

CHƯƠNG 3

SUY DIỄN THỐNG KÊ VÀ DỰ BÁO


TỪ MÔ HÌNH HỒI QUY

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 2 / 38


TÌNH HUỐNG
Xem xét tác động của giá bán sản phẩm (GIA - trăm nghìn đồng),
chi phí quảng cáo trên truyền hình (TH - triệu đồng) và chi phí QC
trên báo (BAO - triệu đồng) lên số lượng sản phẩm bán được (SL -
tấn) của một loại sản phẩm.
SL = β1 + β2 .GIA + β3 .TH + β4 .BAO + U
• Giá tăng 1 đơn vị thì số lượng SP bán được thay đổi trong
khoảng nào?
• Nếu tăng chi phí QC truyền hình lên 2 triệu và giảm chi phí QC
trên báo 1 triệu thì số lượng SP bán thay đổi trong khoảng nào?
• Mô hình này liệu có phù hợp hay không?
• Nếu bán với giá 5 trăm nghìn đồng và chi phí QC trên truyền
hình và báo tương ứng là 5 và 2 triệu thì kỳ vọng số lượng SP bán
trong khoảng nào?
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 3 / 38
KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY

Khoảng tin cậy cho một hệ số hồi quy: đánh giá


tác động khi một biến độc lập thay đổi
+ Khoảng tin cậy đối xứng: (hệ số biến động trong
khoảng nào)
 
(n−k) (n−k)
βj − se(βj ).tα/2 < βj < βj + se(βj ).tα/2
b b b b

+ Khoảng tin cậy bên trái: (giá trị tối đa của hệ số)
 
(n−k)
− ∞ < βj < βj + se(βj ).tα
b b

+ Khoảng tin cậy bên phải: (giá trị tối thiểu của hệ số)
 
(n−k)
βj − se(βj ).tα
b b < βj < +∞
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 4 / 38
KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY

1) Khi CP QC truyền hình tăng thêm 1 triệu thì số lượng


SP bán tăng thêm trong khoảng nào?
2) Khi CP QC trên báo giảm 500 nghìn đồng thì số
lượng SP bán giảm ít nhất là bao nhiêu?
3) Khi giá bán sản phẩm tăng 1 trăm nghìn đồng thì số
lượng SP bán giảm trong khoảng nào? Tối đa là bao
nhiêu?
(Sử dụng độ tin cậy 1 − α = 90%).

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 5 / 38


Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 6 / 38
KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY

KTC cho biểu thức của hai hệ số hồi quy: đánh


giá tác động khi hai biến độc lập cùng thay đổi
+ Khoảng tin cậy đối xứng:
(n−k)
(aβb2 +b βb3 )−se(aβb2 +b βb3 ).tα/2 < aβ2 +bβ3 < (aβb2 +b βb3 )+se(aβb2 +b βb3
q
se(aβb2 + b βb3 ) = a2 var(βb2 ) + b 2 var(βb3 ) + 2abcov(βb2 , βb3 )
+ Khoảng tin cậy bên trái:
 
(n−k)
− ∞ < aβ2 + bβ3 < (aβ2 + b β3 ) + se(aβ2 + b β3 ).tα
b b b b

+ Khoảng tin cậy bên phải:


 
(aβb2 + b βb3 ) − se(aβb2 + b βb3 ).tα(n−k) < aβ2 + bβ3 < +∞

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 7 / 38


KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY

Nếu tăng chi phí QC truyền hình lên 2 triệu và giảm chi
phí QC trên báo 1 triệu thì số lượng SP bán tăng trong
khoảng nào? Cho biết ma trận hiệp phương sai

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 8 / 38


Ý NGHĨA KHOẢNG TIN CẬY

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 9 / 38


KHOẢNG TIN CẬY CHO PHƯƠNG SAI SSNN

σ2
 (n − k)b
2 σ2 
(n − k)b
KTC hai phía: 2(n−k)
6σ 6 2(n−k)
χα/2 χ1−α/2
σ2
 (n − k)b 
KTC bên phải 2(n−k)
; +∞
χα
 (n − k)b σ2 
KTC bên trái 0; 2(n−k)
χ1−α
2(n−k)
χα : giá trị tới hạn khi bình phương, tra bảng D.4
trang 164-165

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 10 / 38


KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

SL = β1 + β2 .GIA + β3 .TH + β4 .BAO + U

• Chi phí QC trên báo có tác động đến số lượng SP bán


được không?
• Tăng giá có làm giảm số lượng SP bán được không?
• Nếu tăng CP QC truyền hình lên 2 triệu và giảm CP
QC trên báo 1 triệu thì số lượng SP bán có tăng không?
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 11 / 38
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ

Các bước kiểm định giả thuyết thống kê:

B1 Xác định cặp giả thuyết thống kê (H0 , H1 )


GT phải thể hiện được vấn đề đang cần kiểm định
H0 luôn có dấu = (≤, ≥, =), H1 không có dấu =
(>, <, 6=)
B2 Tính giá trị quan sát Gqs
B3 Tra bảng tìm giá trị tới hạn
B4 So sánh Gqs và giá trị tới hạn để ra quyết định về H0

Cách khác: dựa trên p − value, nếu p − value < α0 thì


bác bỏ H0 ở mức ý nghĩa α0 (α0 = 0, 01; 0, 05; 0, 1)
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 12 / 38
KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Kiểm định giả thuyết về một hệ số hồi quy

Giả thuyết H0 : βj = (≥, ≤)β0


βbj − β0
Giá trị quan sát: t =
se(βbj )
Tra bảng Student (Table D.2, trang 157)
So sánh ra quy tắc quyết định theo bảng sau

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 13 / 38


KĐ GT P. pháp Quy tắc bác bỏ H0
(n−k)
Hai H0 : βj = βj0 Khoảng TC βj0 ∈
/ βbj ± tα/2 .se(βbj )
(n−k)
phía H1 : βj 6= βj0 GT tới hạn |t0 | > tα/2
p-value p − value < α
 
(n−k)
H0 : βj > βj0 Khoảng TC βj0 ∈
/ βbj − tα .se(βbj ); +∞
(n−k)
Trái H1 : βj < βj0 GT tới hạn t0 < −tα
p-value p − value/2 < α
 
(n−k)
H0 : βj 6 βj0 Khoảng TC βJ0 ∈
/ − ∞; βbj + tα .se(βbj )
(n−k)
Phải H1 : βj > βj0 GT tới hạn t0 > tα
p-value p − value/2 < α
p − value = P(|tα | > |t0 |)
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 14 / 38
KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

1) Chi phí QC trên báo có tác động đến số lượng SP bán


được không? Xét các mức ý nghĩa 5%, 10%.
2) Tăng giá có làm giảm số lượng SP bán được không?
3) Có thể cho rằng khi giảm CP QC truyền hình đi 1
triệu đồng thì số lượng SP bán giảm 110 tấn hay không?
4) Khi CP QC trên báo tăng 2 triệu đồng thì số lượng
SP bán tăng dưới 60 tấn. Hãy cho nhận xét về nhận định
này?

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 15 / 38


Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 16 / 38
KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

βbTH = 104, 01 6= βbBAO = 27, 46


Liệu ảnh hưởng của QC trên truyền hình và trên báo có
khác nhau không?
βTH 6= βBAO ? ⇒ H0 : βTH − βBAO = 0; H1 : βTH − βBAO 6= 0

βbTH = 104, 01 > βbBAO = 27, 46

Liệu QC trên truyền hình hiệu quả hơn QC trên báo hay
không?
βTH > βBAO ? ⇒ H0 : βTH − βBAO ≤ 0; H1 : βTH − βBAO > 0

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 17 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Kiểm định giả thuyết về một ràng buộc giữa các


hệ số hồi quy

Giả thuyết H0 : aβi + bβj = (≤, ≥)a∗


(aβbj + b βbs ) − a∗
Giá trị quan sát: t0 =
se(aβbj + b βbs )
Tra bảng Student (Table D.2, trang 157)
So sánh ra quy tắc quyết định theo bảng sau

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 18 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Loại KĐ Giả thuyết Quy tắc bác bỏ H0


(n−k)
Hai phía H0 : aβj + bβs = a∗ |t0 | > tα/2
H1 : aβj + bβs 6= a∗
(n−k)
Bên trái H0 : aβj + bβs > a∗ t0 < −tα
H1 : aβj + bβs < a∗
(n−k)
Bên phải H0 : aβj + bβs 6 a∗ t0 > tα
H1 : aβj + bβs > a∗

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 19 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

1) Ảnh hưởng của QC trên TH và trên báo có khác nhau không?


2) QC trên truyền hình hiệu quả hơn QC trên báo hay không?
3) Nếu tăng chi phí QC truyền hình lên 2 triệu và giảm chi phí QC
trên báo 1 triệu thì số lượng SP bán tăng hay giảm?

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 20 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

QC trên truyền hình và QC trên báo đều không ảnh


hưởng đến số lượng SP bán được?
Kiểm định: βTH = 0 và βBAO = 0
hay H0 : βTH = 0, βBAO = 0
2 2
H1 : ít nhất 1 hệ số khác 0 ⇔ H1 : βTH + βBAO >0
Bài toán kiểm định về nhiều ràng buộc

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 21 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Bài toán kiểm định về nhiều ràng buộc


Y = β0 + β1 X1 + · · · + βm Xm + βm+1 Xm+1 + · · · + βk−1 Xk−1 + U (U)
(
H0 : β1 = 0, ..., βm = 0
H1 : β12 + · · · + βm
2
>0

Nếu H0 đúng thì:

Y = β1 + βm+1 Xm+1 + · · · + βk−1 Xk−1 + U (R)

(U) là mô hình không có ràng buộc (mô hình lớn)


(R) là mô hình có ràng buộc (mô hình nhỏ, mô hình bị thu hẹp)

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 22 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Kiểm định giả thuyết về nhiều ràng buộc giữa các


hệ số hồi quy
H0 : β1 = 0, ..., βm = 0; H1 : β12 + · · · + βm2 > 0
(RSSR − RSSU )/m
Giá trị quan sát: F0 =
RSSU /(n − kU )
Tra bảng Fisher tìm fα (m, n − kU )
(Table D.3, trang 158-163)
F0 > fα (m, n − kU ) bác bỏ giả thuyết H0

Kiểm định Wald

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 23 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

LƯU Ý
Khi biến phụ thuộc của hai mô hình (U) và (R) cùng
dạng thì

(RSSR − RSSU )/m (RU2 − RR2 )/m


F0 = =
RSSU /(n − kU ) (1 − RU2 )/(n − kU )

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 24 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

SL = β1 + β2 .GIA + β3 .TH + β4 .BAO + U


QC trên truyền hình và QC trên báo đều không ảnh
hưởng đến số lượng SP bán được?
(U) SL = β1 + β2 .GIA + β3 .TH + β4 .BAO + U
(R) SL = β1 + β2 .GIA + U
Cho biết: RSSU = 2383696; RSSR = 3529166;
RU2 = 0, 601301; RR2 = 0, 409709
Tính được: F0 = 4, 805 > f0,05 (2, 20)

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 25 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

SL = β1 + β2 .GIA + β3 .TH + β4 .BAO + U

Phải chăng tất cả các biến độc lập trong mô hình đều
không ảnh hưởng đến số lượng SP bán được?
Kiểm định: H0 : β2 = β3 = β4 = 0

⇔ H0 : R 2 = 0
Bài toán kiểm định về sự phù hợp của hàm hồi quy

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 26 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ HỆ SỐ HỒI QUY

Kiểm định GT về sự phù hợp của hàm hồi quy


Y = β1 + β2 X2 + · · · + βk Xk + U

H0 : β2 = · · · = βk = 0; H1 : β22 + · · · + βk2 > 0

⇔ H0 : R 2 = 0; H1 : R 2 > 0

(RU2 − RR2 )/m R 2 /(k − 1)


F0 = =
(1 − RU2 )/(n − kU ) (1 − R 2 )/(n − k)
Tra bảng Fisher tìm fα (m, n − kU ) = fα (k − 1, n − k)
F0 > fα (k − 1, n − k) bác bỏ giả thuyết H0 (Hay mô
hình là phù hợp)
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 27 / 38
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 28 / 38
SO SÁNH KIỂM ĐỊNH T VÀ KIỂM ĐỊNH F

MH 1: Y = β1 + β2 X2 + β3 X3 + U
MH 2: Y = β1 + β2 X2 + V
Kết quả ước lượng với mẫu gồm 12 quan sát:
Yb = 328, 1383 + 4, 64951X2 + 2, 560152X3
se = 71, 99136 0, 469146 0, 379411; R12 = 0, 967693
Yb = 667, 0205 + 6, 16512X2
se = 120, 4502 0, 961828 R22 = 0, 80425
Kiểm định giả thuyết H0 : β3 = 0 bằng kiểm định t và F?

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 29 / 38


KIỂM ĐỊNH T VÀ KIỂM ĐỊNH F

Kiểm định giả thuyết H0 : β2 = β3 = 0


Và các giả thuyết H0 : β2 = 0; H0 : β3 = 0

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 30 / 38


KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƯƠNG SAI SSNN

Giả thuyết kiểm định: H0 : σ 2 = σ02 .


(n − k)bσ2
Giá trị kiểm định: χ20 = .
σ02

Loại KĐ Giả thuyết PP Quy tắc bác bỏ H0


 (n − k)bσ 2 (n − k)bσ2 
KTC σ02 ∈
/ 2(n−k)
; 2(n−k)
χα/2 χ1−α/2
2(n−k)
H0 : σ 2 = σ02 Giá trị χ20 > χα/2
2(n−k)
Hai phía H1 : σ 2 6= σ02 tới hạn hoặc χ20 < χ1−α/2
p-value p − value < α/2 hoặc
p − value > 1 − α/2
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 31 / 38
KIỂM ĐỊNH GIẢ THUYẾT VỀ PHƯƠNG SAI SSNN

Loại KĐ Giả thuyết Phương pháp Quy tắc bác bỏ H0


 (n − k)b σ2 
H0 : σ 2 6 σ02 KTC 2
σ0 ∈
/ 2(n−k)
; +∞
χα
2(n−k)
Bên phải H1 : σ 2 > σ02 Giá trị TH χ20 > χα
p-value p − value < α
 (n − k)bσ2 
H0 : σ 2 > σ02 KTC σ02 ∈
/ − ∞; 2(n−k)
χ1−α
2(n−k)
Bên trái H1 : σ 2 < σ02 Giá trị TH χ20 < χ1−α
p-value p − value > 1 − α

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 32 / 38


DỰ BÁO GIÁ TRỊ BIẾN PHỤ THUỘC

Dự báo giá trị trung bình có điều kiện của Y với giá
trị X = X 0
Dự báo giá trị riêng biệt Y0 của Y với giá trị
X = X 0.

Dự báo mức tiêu dùng trung bình của các hộ có thu


nhập 10 triệu đồng/tháng
Dự báo mức tiêu dùng của hộ có thu nhập 10 triệu
đồng/tháng
Khoảng nào rộng hơn?

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 33 / 38


DỰ BÁO GIÁ TRỊ BIẾN PHỤ THUỘC

Dự báo giá trị trung bình có điều kiện


 
(n−k) 0 (n−k)
Y0 − se(Y0 ).tα/2 < E (Y /X ) < Y0 + se(Y0 ).tα/2
b b b b

Yb0 = βb1 + βb2 X20 + ... + βbk Xk0


q p
se(Yb0 ) = var(Yb0 ) = σ b2 (X 0 )T (X T .X )−1 .X 0

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 34 / 38


DỰ BÁO GIÁ TRỊ BIẾN PHỤ THUỘC

Dự báo giá trị riêng biệt


 
(n−k) (n−k)
Yb0 − se(Y0 − Yb0 ).tα/2 < Y0 < Yb0 + se(Y0 − Yb0 ).tα/2

q
2
var(Y0 −Yb0 ) = var(Yb0 )+b
σ ; se(Y0 −Yb0 ) = var(Y0 − Yb0 )

b2 (X 0 )T (X T .X )−1 .X 0
var(Yb0 ) = σ

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 35 / 38


DỰ BÁO GIÁ TRỊ BIẾN PHỤ THUỘC

Với mô hình hồi quy hai biến Y = β1 + β2 X + U:


" #
2
1 (X0 − X )
b2
var(Yb0 ) = σ + Pn
n
xi2
i=1

" #
2
1 (X0 − X )
b2 1 + + P
var(Y0 − Yb0 ) = σ n b2
= var(Yb0 ) + σ
n
xi2
i=1

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 36 / 38


ĐÁNH GIÁ SAI SỐ DỰ BÁO

Dựa trên giá trị thực tế (Yi ) và giá trị ước lượng (Ybi )
v
uP n
u (Yi − Ybi )2
t
RMSE = i=1
n
Pn
|Yi − Ybi |
MAE = i=1
n
n Y −Y
i
P bi
i=1 Yi
MAPE =
n
Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 37 / 38
KẾT THÚC CHƯƠNG 3

Chương 3: Suy diễn TK và dự báo Ngày 9 tháng 11 năm 2019 38 / 38

You might also like