You are on page 1of 30

KINH TẾ LƯỢNG

Chương 4: Suy diễn thống kê & Dự báo

ĐINH NGUYỄN DUY HẢI

haidnd@hub.edu.vn

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP. HCM.

Ngày 8 tháng 10 năm 2023

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


1 /NGÂN
27 HÀNG TP. HCM.
Các chương trước sử dụng trực tiếp βbj để phân tích, là sử
dụng ước lượng điểm, chỉ phản ánh xu thế của mẫu, chưa
phải của tổng thể.
Các bài toán suy diễn thống kê: ước lượng khoảng (khoảng
tin cậy), kiểm định giả thuyết về tham số tổng thể → phân
tích cho tổng thể
Gắn với mức xác suất nhất định (1 − α) hay α
Sử dụng kết quả từ phần mềm máy tính để phân tích

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


2 /NGÂN
27 HÀNG TP. HCM.
Nội dung chương 4

1 Quy luật phân phối xác suất


2 Khoảng tin cậy cho các hệ số hồi quy
3 Kiểm định giả thuyết về các hệ số hồi quy
4 Dự báo giá trị biến phụ thuộc

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


3 /NGÂN
27 HÀNG TP. HCM.
1. Quy luật phân phối xác suất

Mô hình k biến: Y = β1 + β2 X2 + β3 X3 + · · · + βk Xk + u
Mẫu: Ybi = βb1 + βb2 X2i + βb3 X3i + · · · + β
ck Xki
Muốn dùng các ước lượng βbj để suy diễn về hệ số βj
(j = 1, . . . , k) cần biết quy luật phân phối xác suất
Giả thiết 5: Sai số ngẫu nhiên có phân phối chuẩn

ui ∼ N(0, σ 2 )

Khi đó: βbj ∼ N(βj , Var (βbj ))

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


4 /NGÂN
27 HÀNG TP. HCM.
Suy ra
βbj − βj βbj − βj
u=r = ∼ N(0, 1)
  σβbj
Var βjb

Nếu thay σβbj = Se(βbj ), thì thống kê

βbj − βj
t= ∼ t(n − k) (phân phối Student (n − k) bậc tự do)
Se(βbj )

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


5 /NGÂN
27 HÀNG TP. HCM.
2. Khoảng tin cậy cho các hệ số hồi quy

Với độ tin cậy 1 − α, khoảng tin cậy hai phía (đối xứng), phía trái
và phía phải chứa βj (j = 1, . . . , k) lần lượt được xác định như sau:
   
βbj − Se βbj t α2 (n − k) < βj < βbj + Se βbj t α2 (n − k),
 
βj < βbj + Se βbj tα (n − k),
 
βj > βbj − Se βbj tα (n − k)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


6 /NGÂN
27 HÀNG TP. HCM.
Khoảng tin cậy tổ hợp hai hệ số
Với độ tin cậy 1 − α, khoảng tin cậy hai phía (đối xứng), phía trái
và phía phải chứa aβj + bβs lần lượt được xác định như sau:
(
(aβbj + b βbs ) − Se(aβbj + b βbs )t α2 (n − k) < aβj + bβs
aβj + bβs < (aβbj + b βbs ) + Se(aβbj + b βbs )t α (n − k),
2

aβj + bβs < (aβbj + b βbs ) + Se(aβbj + b βbs )tα (n − k),


aβj + bβs > (aβbj + b βbs ) − Se(aβbj + b βbs )tα (n − k),

trong đó
q
Se(aβbj + b βbs ) = a2 Var (βbj ) + b 2 Var (βbs ) + 2abCov (βbj , βbs )
r h i2 h i2
= a2 Se(βbj ) + b 2 Se(βbs ) + 2abCov (βbj , βbs )

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


7 /NGÂN
27 HÀNG TP. HCM.
Ý nghĩa của khoảng tin cậy: Ví dụ với độ tin cậy 95% (tức
là mức ý nghĩa 5%), nếu lấy rất nhiều mẫu, tính được nhiều
khoảng tin cậy, thì 95% khoảng đó chứa tham số của tổng thể
Độ tin cậy lớn thì khả năng đúng cao, nhưng khoảng tin cậy
rộng

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


8 /NGÂN
27 HÀNG TP. HCM.
3. Kiểm định giả thuyết về các hệ số hồi quy

3.1. Kiểm định t về hệ số hồi quy


Kiểm định so sánh βj chưa biết với số thực β ∗ - Xem giáo trình

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


9 /NGÂN
27 HÀNG TP. HCM.
Kiểm định t về tổ hợp hai hệ số

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


10 NGÂN
/ 27 HÀNG TP. HCM.
Giá trị xác suất p của các thống kê kiểm định
Kí hiệu là p-value; Prob.; Significant value; Sig.
p-value là mức ý nghĩa nhỏ nhất mà giả thuyết H0 bị bác bỏ
tương ứng giá trị quan sát của thống kê kiểm định
Quy tắc:
Nếu p-value < α thì bác bỏ H0
Nếu p-value > α thì chưa có cơ sở bác bỏ H0

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


11 NGÂN
/ 27 HÀNG TP. HCM.
Ví dụ 1. Y phụ thuộc K, L

Với Y là sản lượng, K là vốn, L là lao động


Hiệp phương sai ước lượng hai hệ số góc = 0,00012
Xét α = 5%
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
12 NGÂN
/ 27 HÀNG TP. HCM.
(a) Giải thích ý nghĩa kết quả ước lượng
(b) Biến K có thực sự giải thích cho Y?
(c) Hệ số nào có ý nghĩa thống kê?
(d) L tăng 1 đơn vị, K không đổi thì Y thay đổi thế nào?
(e) K và L cùng tăng 1 đơn vị thì Y thay đổi thế nào?
(f) K tăng 1 đơn vị, L giảm một đơn vị thì Y có giảm?
(g) Kiểm định giả thuyết tổng hai hệ số góc = 3,6?

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


13 NGÂN
/ 27 HÀNG TP. HCM.
3.2. Kiểm định F
Ví dụ 2. Xét mô hình

Y = β1 + β2 X2 + β3 X3 + β4 X4 + u (1)

(
H0 : β3 = β4 = 0
Kiểm định:
H1 : β32 + β42 ̸= 0 (ít nhất một hệ số khác 0)
gọi là kiểm định ràng buộc, số ràng buộc bằng 2
Không thể dùng kiểm định t
Nếu H0 đúng, tức là 2 ràng buộc đúng, thì mô hình là

Y = β1 + β2 X2 + u (2)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


14 NGÂN
/ 27 HÀNG TP. HCM.
Chú ý
Kiểm định t gọi là kiểm định 1 ràng buộc (1 dấu =) về hệ số
Kiểm định m ràng buộc (m ≥ 1) cùng lúc về các hệ số: kiểm
định F
Mô hình gốc:

Y = β1 +β2 X2 +. . . +βk−m Xk−m +βk−m+1 Xk−m+1 +...+βk Xk +u

Gọi là mô hình không có ràng buộc (U : unrestricted )


Nếu có m ràng buộc, làm giảm số hệ số của mô hình (U), thu
được về mô hình ít hệ số hơn, gọi là mô hình có ràng buộc
(R: restricted )

MH (R) : Y = β1′ + β2′ X2 + . . . + βk−m



Xk−m + u ′

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


15 NGÂN
/ 27 HÀNG TP. HCM.
MH (U): Y = β1 + β2 X2 + β3 X3 + . . . + βk Xk + u
H0 : m ràng buộc là đúng, MH (R) là đúng (MH (R) phù hợp
hơn)
H1 : ít nhất 1 ràng buộc sai, MH (U) là đúng (MH (U) phù
hợp hơn)
Thống kê F
(RSSR − RSSU )/m
F = ,
RSSU /(n − kU )
trong đó: RSSU là tổng bình phương phần dư của mô hình U,
RSSR là tổng bình phương phần dư của mô hình R, kU số hệ
số hồi quy của mô hình U (kU = k), m là chênh lệch biến của
hai mô hình (hay số ràng buộc trong H0 )
Nếu F > Fα (m, n − kU ) thì bác bỏ H0

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


16 NGÂN
/ 27 HÀNG TP. HCM.
Nếu hai mô hình cùng biến phụ thuộc, thì ta có thể sử dụng

(RU2 − RR2 )/m


F =
(1 − RU2 )/(n − kU )

Các ràng buộc có thể là


Kiểm định bớt biến: (U) là trước khi bớt, (R) là sau khi bớt
biến
Kiểm định thêm biến: (R) là trước khi thêm, (U) là sau khi
thêm

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


17 NGÂN
/ 27 HÀNG TP. HCM.
Một số dạng ràng buộc
MH gốc (U) : Y = β1 + β2 X2 + β3 X3 + β4 X4 + u
Dạng 1: Các hệ số bằng 0

H0 : β 3 = β 4 = 0 (m = 2)

MH có ràng buộc (R) : Y = β1 + β2 X2 + u


Dạng 2: Tổng các hệ số bằng 0

H0 : β 3 + β 4 = 0 (m = 1)

MH (R):

Y = β1 + β2 X2 + β3 (X3 − X4 ) + u
Y = β1 + β2 X2 + β3 (X ∗ ) + u

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


18 NGÂN
/ 27 HÀNG TP. HCM.
Dạng 3: Tổng các hệ số bằng số khác 0

H0 : β 3 + β 4 = 1 (m = 1)

MH (R):

Y = β1 + β2 X2 + β3 X3 + (1 − β3 )X4 + u
Y − X4 = β1 + β2 X2 + β3 (X3 − X4 ) + u
Y ∗ = β1 + β2 X2 + β3 (X ∗ ) + u

Lưu ý: Biến phụ thuộc thay đổi


Dạng 4: Các ràng buộc khác

H0 : β2 = 2 và β3 + β4 = 1 (m = 2)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


19 NGÂN
/ 27 HÀNG TP. HCM.
Kiểm định F về sự phù hợp của mô hình
Giả sử ta có:

MH (U) : Y = β1 + β2 X2 + β3 X3 + . . . + βk Xk + u,
MH (R) : Y = β1′ + u ′ ,

nghĩa là: RR2 = 0, m = kU − 1, kU = k. Khi đó:


H0 : β2 = . . . = βk = 0 (hàm hồi quy MH (U) không phù
hợp)
H1 : ít nhất một hệ số góc ̸= 0 (hàm hồi quy MH (U) phù hợp)
Kiểm định F được xác định như sau
RU2 /(k − 1)
F =
1 − RU2 /(n − k)


Nếu F > Fα (k − 1, n − k), thì bác bỏ H0


Ta có thể dùng: nếu p-value < α, thì bác bỏ H0 với mức ý
nghĩa α
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
20 NGÂN
/ 27 HÀNG TP. HCM.
Liên hệ giữa kiểm định F và t

Với kiểm định 1 ràng buộc, có thể dùng t hoặc F


(n−k) 2
h i
Khi đó F = t 2 và Fα (1, n − kU ) = tα/2
Kiểm định F dùng cho mọi ràng buộc dạng tuyến tính
p-value được tính bởi phần mềm chuyên dụng

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


21 NGÂN
/ 27 HÀNG TP. HCM.
Ví dụ 1 (tiếp theo)
(h) Kiểm định sự phù hợp của mô hình
(j) Khi bớt biến K thì hệ số xác định giảm xuống còn 0,65. Vậy
có nên bỏ biến đó không? So sánh kết quả với kiểm định t
(k) Khi thêm hai biến K 2 và K 3 vào mô hình thì hệ số xác định
tăng lên đến 0,9664. Vậy có nên thêm hai biến đó vào không?

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


22 NGÂN
/ 27 HÀNG TP. HCM.
4. Dự báo biến phụ thuộc

4.1. Dự báo với mô hình hai biến


Giả sử mô hình hồi quy hai biến sau đây đã được xác định là phù
hợp:
(
Y = β1 + β2 X + u
PRF :
E (Y |X ) = β1 + β2 X


(
Y = βb1 + βb2 X + e
SRF :
Yb = βb1 + βb2 X

Bây giờ ta sử dụng mô hình này để dự báo giá trị trung bình có
điều kiện E (Y |X ) và giá trị cá biệt của Y khi cho biến giải thích
X nhận giá trị X0 .

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


23 NGÂN
/ 27 HÀNG TP. HCM.
4.1.1. Dự báo điểm
Thay X = X0 vào SRF, ta nhận được Y c0 = βb1 + βb2 X0 là một
đại lượng ngẫu nhiên (do β1 , β2 là các đại lượng ngẫu nhiên).
Ta dùng Yc0 để ước lượng điểm cho cả giá trị trung bình và
giá trị cá biệt của biến phụ thuộc YX0 . Trong đó YX0 là những
giá trị của biến phụ thuộc Y ứng với X = X0 .

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


24 NGÂN
/ 27 HÀNG TP. HCM.
4.1.1. Dự báo điểm
Thay X = X0 vào SRF, ta nhận được Y c0 = βb1 + βb2 X0 là một
đại lượng ngẫu nhiên (do β1 , β2 là các đại lượng ngẫu nhiên).
Ta dùng Yc0 để ước lượng điểm cho cả giá trị trung bình và
giá trị cá biệt của biến phụ thuộc YX0 . Trong đó YX0 là những
giá trị của biến phụ thuộc Y ứng với X = X0 .
4.1.2. Dự báo khoảng
Với điều kiện u ∼ N(0, σ 2 ) thì Y
c0 = βb1 + βb2 X0 có phân phối
chuẩn với
c0 ) = E (Y |X = X0 ),
kỳ vọng: E (Y
2
 
2 1 (X0 −X̄ )
phương sai: Var (Y0 ) = σ
c b n + Pn 2 ,
i=1 (Xi −X̄ )
q
Se(Y
c0 ) = Var (Y c0 ).

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


24 NGÂN
/ 27 HÀNG TP. HCM.
4.1.2.1. Dự báo khoảng cho giá trị trung bình E (Y
c0 )

Công thức
   
c0 − Se Y
Y c0 t α (n − 2) < E (Y c0 t α (n − 2).
c0 + Se Y
c0 ) < Y
2 2

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


25 NGÂN
/ 27 HÀNG TP. HCM.
4.1.2.1. Dự báo khoảng cho giá trị trung bình E (Y
c0 )

Công thức
   
c0 − Se Y
Y c0 t α (n − 2) < E (Y c0 t α (n − 2).
c0 + Se Y
c0 ) < Y
2 2

4.1.2.2. Dự báo khoảng cho giá trị cá biệt YX0

Khi dùng Y
c0 để dự báo cho YX thì sai số dự báo
0

c0 = YX − Y
U c0
0

là một đại lượng ngẫu nhiên. Ta có Var (U c0 + σ 2 . Vì vây


c0 ) = Y
   
c0 − Se U
Y c0 t α (n − 2) < YX < Yc0 + Se U c0 t α (n − 2).
2 0 2

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


25 NGÂN
/ 27 HÀNG TP. HCM.
4.1.2.1. Dự báo khoảng cho giá trị trung bình E (Y
c0 )

Công thức
   
c0 − Se Y
Y c0 t α (n − 2) < E (Y c0 t α (n − 2).
c0 + Se Y
c0 ) < Y
2 2

4.1.2.2. Dự báo khoảng cho giá trị cá biệt YX0

Khi dùng Y
c0 để dự báo cho YX thì sai số dự báo
0

c0 = YX − Y
U c0
0

là một đại lượng ngẫu nhiên. Ta có Var (U c0 + σ 2 . Vì vây


c0 ) = Y
   
c0 − Se U
Y c0 t α (n − 2) < YX < Yc0 + Se U c0 t α (n − 2).
2 0 2

Áp dụng: Xem Ví dụ 6.3 trang 127 của giáo trình Trường Đại học
tài chính Marketing.
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
25 NGÂN
/ 27 HÀNG TP. HCM.
4.2. Dự báo với mô hình nhiều hơn 2 biến (Xem giáo trình)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


26 NGÂN
/ 27 HÀNG TP. HCM.
Tóm tắt chương 4

1 Giả thiết: Sai số ngẫu nhiên phân phối chuẩn


2 Khoảng tin cậy cho từng hệ số, nhiều hệ số
3 Kiểm định t về các hệ số, hệ số có ý nghĩa thống kê
4 Kiểm định F về hệ số và sự phù hợp
5 Kiểm định thêm, bớt biến, ràng buộc
6 Dự báo biến phụ thuộc

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


27 NGÂN
/ 27 HÀNG TP. HCM.

You might also like