You are on page 1of 29

HỒI QUY VÀ TƯƠNG QUAN

Là các PP toán học thường được vận dụng để nghiên


cứu các quan hệ thống kê.

Phân tích tương quan Phân tích hồi qui

Mục đích Đo cường độ mối quan hệ Ước lượng (dự báo) giá trị
giữa các biến của các biến trên cơ sở giá
trị cho trước của các biến
khác
Kỹ thuật Các biến là ĐLNN và có tính Biến phụ thuộc là ĐLNN
đối xứng (ryx = rxy ) Biến độc lập là xác định
Không có tính đối xứng
1
PHÂN TÍCH HỒI QUY

Nghiên cứu mối quan hệ giữa một biến gọi là biến phụ
thuộc (biến được giải thích (Y)) với một hoặc một số
biến khác được gọi là biến độc lập (biến giải thích (X))

Các nội dung cơ bản của phân tích hồi qui

1. Xác định mức độ thay đổi của Y tương ứng với sự thay đổi của X

2. Kiểm định bản chất của sự phụ thuộc

3. Ước lượng (dự báo) giá trị biến Y tương ứng với giá trị đã biết của X

2
HÀM HỒI QUI TỔNG THỂ (PRF)

 Là hàm hồi qui phản ánh mối quan hệ thực tế


giữa các biến trên phạm vi tổng thể nghiên cứu.
 Ví dụ có một tổng thể gồm 30 HGĐ, thu thập dữ
liệu về chi tiêu TD (Y) và thu nhập (X) trong một
ngày, kết quả như sau:
X
50 70 90 110 130 150 170 190

35 41 45 71 91 99 113 133

40 49 56 90 100 115 131 145


Y
45 63 85 94 102 131 146 147

67 88 107 149

76 151
3
HÀM HỒI QUI TỔNG THỂ
 Với một cột của bảng chính là phân phối xác suất
của chi tiêu với thu nhập cho trước (P(Y/Xi)
X
50 70 90 110 130 150 170 190

1/3 1/4 1/5 1/3 1/4 1/3 1/3 1/5

1/3 1/4 1/5 1/3 1/4 1/3 1/3 1/5


P(Y/Xi)
1/3 1/4 1/5 1/3 1/4 1/3 1/3 1/5

1/4 1/5 1/4 1/5

1/5 1/5
E(Y/Xi)
40 55 70 85 100 115 130 145

4
HÀM HỒI QUI TỔNG THỂ
E(Y/Xi) là hàm theo Xi, được mô tả: E(Y/Xi) = f(Xi)

E(Y/Xi) = f(Xi): được gọi là hàm hồi qui tổng thể.


(Cho biết giá trị trung bình của Y thay đổi như thế nào theo X)
Dạng hàm f(Xi) chưa biết, có thể tuyến tính hay phi tuyến 5
7.1.1. Mô hình tuyến tính (linear)

 Giả sử f(Xi) là hàm tuyến tính, ta có:

i 1 2Xi
E(Y| X)
β1, β2 : Các tham số của hàm hồi qui
β1 : hệ số chặn (tham số tự do, không phụ thuộc bất
kỳ biến nào)
β2 : hệ số góc (phản ánh mức độ ảnh hưởng của biến
X đối với biến Y) (Khi X tăng lên 1 đơn vị thì giá trị
trung bình của Y tăng β2 đơn vị)

6
7.1.1. Mô hình tuyến tính (linear)
 Vì E(Y/Xi) là giá trị trung bình của Y với X đã biết
nên giá trị cá biệt Yi xoay quanh E(Y/Xi).
 Kí hiệu: ui = Yi - E(Y/Xi), ta có: Yi = E(Y/Xi)+ ui
 Hay: Yi 1 2Xi  ui

Trong đó:
Yi : các giá trị cá biệt (giá trị ngẫu nhiên của Y)
ui : nhiễu (sai lệch ngẫu nhiên) (+,-) (phản ánh ảnh
hưởng của các yếu tố ngoài mô hình (yếu tố ngẫu
nhiên) đối với sự biến động của Y

7
HÀM HỒI QUI TỔNG THỂ
 Với dữ liệu ở bảng trên, sai số ngẫu nhiên được xác
định như sau:
X
50 70 90 110 130 150 170 190

-5 -14 -25 -14 -9 -16 -17 -12

0 -6 -14 5 0 0 1 0
ui
5 8 15 9 2 16 16 2

12 18 7 4

6 6
E(ui/Xi)
0 0 0 0 0 0 0 0
 E(ui/Xi) =0 (trung bình ảnh hưởng của các yếu tố ngẫu nhiên đến
biến phụ thuộc bằng 0) 8
HÀM HỒI QUI MẪU (SRF)

 Là hàm hồi qui được xây dựng trên cơ sở dữ liệu


mẫu. Tương ứng với hàm hồi qui tổng thể, hàm hồi
qui mẫu có dạng:
ˆ1  
ˆi  
Y ˆ2 X i
ˆ1  
Yi   ˆ2X i  ei
Trong đó:
Ŷi : Ước lượng của E(Y|Xi)
ˆ1 , 
 ˆ 2 : Ước lượng của β1, β2
ei : Ước lượng của ui

9
7.1.1. Mô hình tuyến tính (linear)
Xác định các hệ số hàm hồi quy mẫu:
Giả sử có n cặp quan sát (Xi,Yi):

Xi 3 5 1 4 2 … 6
Yi 0,6 1,0 0,2 1,4 0,8 … 1,8

Phương pháp bình phương bé nhất thường được sử


n n
dụng, sao cho:  i  i 1 2 i  Min
(Y  ˆ
Y ) 2
 (Y  ( ˆ
  ˆ
 X ) 2
i
i 1 i 1

ˆ1 , 
Lấy đạo hàm riêng theo  ˆ 2 để tìm cực tiểu, ta
được công thức:
ˆ XY  X Y ˆ1  Y  
ˆ2 X
2  2 và 
X  ( X )2 10
7.1.1. Mô hình tuyến tính (linear)
Xác định các hệ số hàm hồi quy mẫu:
Ví dụ: Có dữ liệu về quy mô hộ Xi và chi cho thực
phẩm Yi của 6 hộ. Hộ Xi Yi XiYi Xi2
1 3 0,6 1,8 9,0
ˆ XY  X Y 2 5 1,0 5,0 25,0
2  2
X  ( X )2 3 1 0,2 0,2 1,0
4 4 1,4 5,6 16,0
4,17  3,5 * 0,97 5 2 0,8 1,6 4,0
  0,269
15,17  3,5 2
6 6 1,8 10,8 36,0
TB 3,5 0,97 4,17 15,17

ˆ1  Y  ˆ2 X  0,97  0,269 * 3,5  0,027

Hàm hồi quy mẫu: ˆi  0,027  0,269Xi


Y
11
7.1.1. Mô hình tuyến tính (linear)
Các giả thiết của mô hình

(1) Không xét đến tính ngẫu nhiên của biến độc lập
trong mô hình.
(2) Đường hồi quy tổng thể đi qua trung bình của biến
phụ thuộc tại tất cả các Xi: E(Ui|Xi)=0
(3) Phương sai của các yếu tố nhiễu Ui bằng nhau tại
các Xi khác nhau.
(4) Không có tương quan giữa các yếu tố nhiễu Ui tại
các Xi khác nhau.
(5) Không có tương quan giữa các yếu tố nhiễu Ui và
các Xi.
(6) Yếu tố nhiễu có phân phối chuẩn 12
Hệ số xác định
 Để xem xét mức độ phù hợp của mô hình với dữ
2
liệu quan sát, sử dụng hệ số xác định (r )
n n n
Ta có:
 i
(Y
i1
 Y) 2
  i
ˆ
(Y
i1
 Y) 2
  i i
(Y
i 1
 ˆ
Y) 2

TSS = ESS + RSS


TSS (Total Sum of Square): phản ánh toàn bộ biến động của
biến phụ thuộc do ảnh hưởng của tất cả các nguyên nhân
ESS (Explained Sum of Square): phản ánh biến động của
biến phụ thuộc được giải thích bởi mô hình (do biến độc lập
trong mô hình gây ra)
RSS (Residual Sum of Square): phản ánh biến động của biến
phụ thuộc chưa được giải thích bởi mô hình (do các yếu tố
ngẫu nhiên gây ra) ESS RSS
 Hệ số xác định: r 2
  Hay: r  1 
2
13
TSS TSS
Hệ số xác định

ESS
Công thức: r 
2

TSS

Ý nghĩa:

Hệ số xác định đo độ phù hợp của SRF. Nó cho biết mô hình


đã giải thích được bao nhiêu % biến động của biến phụ
thuộc là do ảnh hưởng bởi biến độc lập trong MH.

Tính chất:
 0 ≤ r2 ≤ 1
 r2 = 1 : Đường hồi quy mẫu phù hợp hoàn hảo
 r2 = 0 : Giữa X và Y không có mối quan hệ
 r2 càng gần 1 hàm hồi quy mẫu càng phù hợp
14
Ví dụ: Xét dữ liệu

Hộ Xi Yi Ŷ i yi2 ŷi2
1 3 0,6 0,83 0,13 0,02 Trong đó:
2 5 1,0 1,37 0,00 0,16
yˆi Yˆi Y
3 1 0,2 0,30 0,59 0,45
4 4 1,4 1,10 0,19 0,02 yi  Yi  Y
5 2 0,8 0,56 0,03 0,16
6 6 1,8 1,64 0,69 0,45
Tổng 21 5,8 5,8 1,63 1,26
TB 3,5 0,97 0,97 0,27 0,21
n

ESS  i
ŷ 2
1, 26
Hệ số xác định: r  2
 i 1
n
  0, 77
TSS 1, 63
 i
y 2

i 1
15
Kiểm định sự phù hợp của mô hình hồi quy
tổng thể (kiểm định t)
+ Giả thuyết: Ho: β2 = 0
H1: β2 ≠ 0
ˆ2
 ˆ 2
t với: Se (ˆ2 ) 
+ Tiêu chuẩn kiểm định: ˆ2 )
Se ( n

n i
x 2

Trong đó: i
e 2 i 1

xi  Xi  X 
ˆ  ei Yi Yˆi
2 i 1
n2
+ Tra bảng Tn-2, α/2
+ So sánh, kết luận:
| t | > Tn-2, α/2 : Bác bỏ Ho, mô hình phù hợp.
| t | ≤ Tn-2, α/2 : Chưa đủ cơ sở bác bỏ Ho.
16
Ví dụ: Xét dữ liệu

Hộ Xi Yi Ŷ i xi2 e i2 Trong đó:


1 3 0,6 0,83 0,25 0,05
xi  Xi  X
2 5 1,0 1,37 2,25 0,14
3 1 0,2 0,30 6,25 0,01 ei Yi Yˆi
4 4 1,4 1,10 0,25 0,09 n
5 2 0,8 0,56 2,25 0,06 i
e 2
0,37
6 6 1,8 1,64 6,25 0,03 ˆ 
2 i 1
  0,09
Tổng 21 5,8 5,8 17,5 0,37 n 2 62
TB 3,5 0,97 0,97 2,92 -

ˆ 2 0,09
Se (ˆ2 )  n
  0,073
17,5
i
x 2

i 1 17
7.1.1. Mô hình tuyến tính (linear)

+ Giả thuyết: Ho: β2 = 0


H1: β2 ≠ 0
ˆ 2 0,269
+ Tiêu chuẩn kiểm định: t    3,68
Se ( ˆ 2 ) 0,073
+ Tra bảng: Tn-2, α/2 = T4;0,025= 2,77

+ So sánh: | t |>Tn-2, α/2 : Bác bỏ Ho, mô hình phù hợp.

18
Kiểm định sự phù hợp của mô hình hồi quy
tổng thể (kiểm định F)
+ Giả thuyết: Ho: r2 = 0
H1: r2 ≠ 0
ESS
+ Tiêu chuẩn kiểm định: F  1
RSS
n2
+ Tra bảng F1,n-2, α

+ So sánh, kết luận:


F > F1,n-2, α : Bác bỏ Ho, mô hình phù hợp.
F ≤ F1,n-2, α : Chưa đủ cơ sở bác bỏ Ho.
19
Ví dụ: Xét dữ liệu

Hộ Xi Yi Ŷ i ŷi2 e i2 Trong đó:


1 3 0,6 0,83 0,02 0,05
yˆi Yˆi Y
2 5 1,0 1,37 0,16 0,14
3 1 0,2 0,30 0,45 0,01 ei Yi Yˆi
4 4 1,4 1,10 0,02 0,09 n

5 2 0,8 0,56 0,16 0,06 ESS   yˆ i2  1,26


i 1
6 6 1,8 1,64 0,45 0,03 n
Tổng 21 5,8 5,8 1,26 0,37 RSS   i  0,37
e 2

TB 3,5 0,97 0,97 0,21 - i 1

ESS
1 1, 26
F    13,6
RSS 0,37
n2 62
20
Kiểm định sự phù hợp của mô hình hồi quy
tổng thể (kiểm định F)
+ Giả thuyết: Ho: r2 = 0
H1: r2 ≠ 0
ESS
1 1, 26
+ Tiêu chuẩn kiểm định: F    13,6
RSS 0,37
n2 62
+ Tra bảng F1,n-2, α = F1;4;0,05 = 7,71

+ So sánh, kết luận:

F > F1,n-2, α : Bác bỏ Ho, mô hình phù hợp.


21
7.1.2. Mô hình hàm luỹ thừa (power)
 Hàm hồi quy mẫu:
ˆ ˆ ˆ2
 Ŷi
Yi  1.Xi
 Hình dáng trên đồ thị:

 Dạng biến đổi tuyến tính:


X

ˆ1  
ˆi  ln 
ln Y ˆ2 ln Xi

22
7.1.3. Mô hình hàm mũ (exponential)
ˆ ˆ
 Hàm hồi quy mẫu: Y i   1 .e
ˆ 2 X i

Ŷi
 Hình dáng trên đồ thị:

 Dạng biến đổi tuyến tính (log-log model):

ln Yˆi  ln ˆ1  ˆ 2 X i

 Tuyến tính hóa dữ liệu bằng Yi* = lnYi .

23
7.1.4. Mô hình hàm lôgarith (logarithmic)

 Hàm hồi quy mẫu: ˆ1  


ˆi  
Y ˆ2 ln X i

Ŷi

 Hình dáng trên đồ thị: X

 Tuyến tính hóa dữ liệu bằng Xi* = lnXi .

24
7.1.8. Lựa chọn mô hình hồi quy
Tiêu chuẩn lựa chọn:

 Mô hình càng đơn giản càng tốt.


 Mô hình giải thích được càng nhiều sự biến động của
biến phụ thuộc càng tốt. Tức là R2 (hoặc R2 hiệu chỉnh
nếu số tham số khác nhau) càng cao càng tốt.
 Mô hình vững về mặt lý thuyết. Tức là mô hình phải
dựa trên một lý thuyết kinh tế nào đó và các hệ số hồi
quy phải có dấu phù hợp với các lý thuyết đó.
 Mô hình phải phù hợp với thực tiễn. Tức mô hình phải
có khả năng dự báo đúng các hiện tượng trong thực tế.
25
7.2. Hồi quy mối liên hệ giữa nhiều tiêu
thức định lượng

 Dựa trên các lý thuyết kinh tế hoặc các hiểu biết thực
tế về hiện tượng nghiên cứu, chọn các tiêu thức gây tác
động làm các biến độc lập (X1, X2, X3,…, Xk,), tiêu thức
chịu tác động làm biến phụ thuộc (Y).

 Mô hình hàm tuyến tính đa biến thường được chọn


nhất vì đơn giản và khá phù hợp với nhiều hiện tượng
trong thực tế.

26
Ví dụ: Tỉ suất lợi nhuận (Y) có khả năng phụ thuộc
vào: Vốn (X2), Tỉ suất chi phí trên doanh số (X3), Tiền
lương trung bình (X4). Ta chọn Y làm biến phụ thuộc,
X2, X3 và X4 làm ba biến độc lập.
Doanh TSLN VKD TSCP TLTB
nghiệp (Y) (X2) (X3) (X4)
1 16 2,4 0,05 2,0
2 13 1,8 0,01 1,8
3 12 1,5 0,03 1,9
4 15 2,0 0,08 1,7
5 19 2,6 0,10 2,1
6 14 2,2 0,02 1,9
7 17 2,5 0,04 1,7
8 15 3,8 0,05 1,6
9 13 1,6 0,03 1,7
10 11 2,2 0,01 1,5

Yˆi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ˆ4 X 4i 27


7.2.1. Mô hình hồi quy mẫu tuyến
tính đa biến
ˆ1  
ˆi  
Y ˆ2 X2i  
ˆ3X3i  
ˆ4 X4i  ...  
ˆk X
ˆ ki

Hoặc: ˆ1  
Yi   ˆ2 X 2 i  
ˆ3X3i  
ˆ4 X 4i  ...  
ˆk X
ˆ ki  ei

 Xji : Giá trị i của biến (tiêu thức) độc lập j


 Yi : Giá trị cá biệt của biến (tiêu thức) phụ thuộc
 Ŷ i : Ước lượng tốt nhất của E(Y|Xi)
ˆ1 , 
  ˆ2 , 
ˆ 3 ,...
ˆ k : Các hệ số của mô hình hồi quy mẫu

 i : Quan sát thứ i


 ei : Phần dư hay thành phần ngẫu nhiên
28
7.2.1. Mô hình hồi quy mẫu tuyến
tính đa biến

ˆ1  
ˆi  
Y ˆ2 X2i  
ˆ3X3i  
ˆ4 X4i  ...  
ˆk X
ˆ ki

 Việc xác định các hệ số hàm hồi qui và thực hiện


các kiểm định đối với hàm hồi quy trên được tiến
hành tương tự hồi qui đơn nhưng phức tạp hơn nhiều.
 Ngày nay với sự hỗ trợ của các phần mềm vi tính
công việc nói trên được tiến hành rất nhanh chóng và
chính xác.

29

You might also like