You are on page 1of 72

KINH TẾ LƯỢNG

CHƯƠNG II HỒI QUY 2 BIẾN

1
2.1. Giới thiệu
2.1.1. Khái niệm về hồi quy
Phân tích hồi quy là tìm quan hệ phụ thuộc
của một biến, được gọi là biến phụ thuộc vào
một hoặc nhiều biến khác, được gọi là biến độc
lập nhằm mục đích ước lượng hoặc tiên đoán giá
trị kỳ vọng của biến phụ thuộc khi biết trước giá
trị của biến độc lập.

2
2.1.2. Sự khác nhau giữa các dạng quan hệ
•Hồi quy và quan hệ nhân quả
Có thể hồi quy số vụ trộm theo số nhân viên cảnh sát
hoặc ngược lại
Quan hệ nhân quả chỉ ra rằng số cảnh sát tăng do số
vụ trộm tăng.
•Hồi quy và tương quan
Phân tích tương quan chỉ cho thấy độ mạnh yếu của
mối quan hệ tuyến tính giữa hai biến số

3
2.2.Mô hình hồi quy tổng thể và hồi quy mẫu
2.2.1. Mô hình hồi quy tổng thể (PRF)
Ví dụ 2.1. Hồi quy tiêu dùng Y theo thu nhập X. Xét
sự phụ thuộc chi tiêu của một gia đình vào thu nhập ở
một địa phương có tổng cộng 40 hộ gia đình. Ta được
số liệu cho ở bảng sau:

4
Bảng 2.1. Chi tiêu và thu nhập của hộ gia đình:
X 80 100 120 140 160 180 200
Y 55 65 79 80 102 110 120

60 70 84 93 107 115 136

65 74 90 95 110 120 140

70 80 94 103 116 130 144

75 85 98 108 118 135 145

88 113 125 140

115
 325 462 445 707 678 750 685
E(Y/Xi) 65 77 89 101 113 115 137

5
Mô hình hồi quy tổng thể:
E(Y/Xi) = f(Xi) = b1 + b2Xi
b1 : là hệ số chặn – tung độ gốc
b2 : hệ số góc - hệ số đo độ dốc đường hồi quy
Ví dụ ở hộ gia đình có mức chi tiêu 130 ta có:
130 = b1 + b2.180 + 15
115
Mô hình hồi quy tổng thể ngẫu nhiên:
Yi = b1 + b2Xi + ui
ui:sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i
ui: đại diện những nhân tố còn lại ảnh hưởng đến chi tiêu
6
Sai số ngẫu nhiên hình thành từ nhiều nguyên
nhân:
- Bỏ sót biến giải thích.
- Sai số khi đo lường biến phụ thuộc.
- Các tác động không tiên đoán được.
- Dạng mô hình hồi quy không phù hợp.

7
160 Haø
m hoàiquy toång theå
0 Yi = b1 + b2Xi + ui
140 Yi = b1 + b2Xi + ui
Tiêu
ui
dùng 120 E(Y/Xi)=b1 + b2Xi
?
Y
100

80 Yi
b2
Y = E(Y/Xi)
60

40 b1

0
Xi
0 80 100 120 140 160 180 200 220
0
Thu nh?p kh? d?ng X
Hình 2.1. Mô hình hồi quy tổng thể tuyến tính 8
2.2.2. Mô hình hồi quy mẫu (SRF)
Mô hình hồi quy mẫu:
Yˆi = bˆ1 + bˆ2 X i
Trong đó
bˆ1 : ước lượng cho b1.
b̂ 2 : Ước lượng cho b2.
Yˆi : Ước lượng cho E(Y/Xi)
Mô hình hồi quy mẫu ngẫu nhiên
Yi = bˆ1 + bˆ2 X i + ei 9
Tiêu dùng, Y (XD)

140
(PRF)

120
(SRF)

E(Y/Xi) ui
100
Yi

Yi ei
80

b2
60 b1
b2

40
b1
Xi
0
0 80 100 120 140 1600 180 200 210 220

Thu nhập khả dụng, X (XD)

Hình 2.1. Mô hình hồi quy tổng thể và mẫu tuyến tính
10
2.2.3. Mô hình hồi quy tuyến tính (LRF)
Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong
các tham số, không yêu cầu tuyến tính trong biến số.
* Mô hình 1
Y = b1 + b 2 + ui
X
là mô hình tuyến tính trong các tham số nhưng phi
tuyến theo biến số.
* Mô hình
Y = b1 + (1 − b 2 ) X + ui
2

là mô hình phi tuyến trong các tham số nhưng tuyến


tính trong biến số.
Hồi quy tuyến tính theo OLS chỉ chấp nhận dạng mô
hình tuyến tính trong tham số. 11
2.3. Ước lượng các hệ số của mô hình hồi quy theo
phương pháp bình phương tối thiểu-OLS (ordinary
least square)
2.3.1.Các giả định của mô hình hồi quy tuyến tính
cổ điển
Giả thiết 1:Các biến giải thích là phi ngẫu nhiên tức là
các giá trị của chúng được cho trước hoặc được xác
định.
Giả thiết 2: Kỳ vọng của yếu tố ngẫu nhiên ui bằng 0,
tức là: E ui X i  = 0
Giả thiết 3: Các ui có phương sai bằng nhau (phương
 i i  
sai thuần nhất) var u X = var u X =  2
ji i  12
Giả thiết 4: Không có tự tương quan giữa các ui:
   
cov ui u j X i , X j = E ui u j X i , X j = 0
Giả thiết 5: Không tự tương quan giữa ui với Xi:
Cov (ui,Xi) = 0

Định lý Gauss-Markov
Với các giả định của mô hình hồi quy tuyến tính
cổ điển, mô hình hồi quy tuyến tính theo phương pháp
bình phương tối thiểu là ước lượng tuyến tính không
thiên lệch tốt nhất
13
2.3.2. Nội dung của phương pháp
Cho n quan sát của 2 đại lượng (Yi, Xi) i = 1, n
Mô hình hồi quy mẫu ngẫu nhiên
Yi = bˆ1 + bˆ2 X i + ei
ei = Yi − Yˆi
e1 = Y1 − Yˆ1 = Y1 − ( bˆ1 + bˆ2 . X 1 )  min  0
e2 = Y2 − Yˆ2 = Y2 − (bˆ1 + bˆ2 . X 2 )  0
e3 = Y3 − Yˆ3 = Y3 − (bˆ1 + bˆ2 . X 3 )  0

14
2.3.2. Nội dung của phương pháp
Tại sao chúng ta không tìm ∑e => 0?
=> tìm ∑ei2 => 0: Phương pháp bình phương bé nhất

( )
n n 2

 2
e
i =  Yi − ˆ − bˆ X
b1 2 i
Điềui =kiện
1 i =1
để phương trình trên đạt cực trị là:
 n 2
  e i 
 i =1  = −2 ( )
n n

b1ˆ 
i =1
Yi − ˆ −b
b 1 2 i 
ˆ X = −2 e = 0
i =1
i

 n 2
  e i 
 i =1  = −2 ( )
n n

ˆ
b 2

i =1
Yi − ˆ −b
b1 2 i i 
ˆ X X = −2 e X = 0
i =1
i i
15
2.3.2. Nội dung của phương pháp
Giải hệ phương trình trên, chúng ta thu được:
bˆ1 = Y − bˆ2 X
n

Y X i i − n. X .Y
b̂ 2 = i =1
n

X
i =1
i
2
− n.( X ) 2

đặt xi = X i − X y x i i
bˆ 2 = i =1
yi = Yi − Y n

x
i =1
2
i
16
Ví dụ 2.2: quan sát sự biến động của nhu cầu gạo Y
(tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta được các
số liệu cho ở bảng. Hãy lập mô hình hôi quy mẫu biễu
diễn mối phụ thuộc về nhu cầu vào đơn giá gạo
Stt Xi Yi XiYi X^2
1 1 10 10 1
2 4 6 24 16
3 2 9 18 4
4 5 5 25 25
5 5 4 20 25
6 7 2 14 49
sum 24 36 111 120
17
Giả sử mô hình hồi quy mẫu là: Yˆi = bˆ1 + bˆ2 X i

24 36
X = =4 Y = =6
6 6
n

Y X i i − n. X .Y
111 − 6.4.6
bˆ2 = i =1
= = −1,375
n
120 − 6.(4) 2

X
i =1
i
2
− n.( X ) 2

bˆ1 = Y − bˆ2 X = 6 − (−1,375).4 = 11.5


18
Như vậy, mô hình hồi quy mẫu
Yˆi = 11,5 − 1,375. X i
=> X và Y có quan hệ nghịch biến

* 1= 11,5: nhu cầu tối đa là 11,5 tấn/tháng
* b̂ 2 = -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu
trung bình sẽ giảm 1,375 tấn/tháng với các yếu tố khác
trên thị trường không đổi.

19
38 42
86 92

20
2.3.3. Các tính chất của hệ số hồi quy:
- bˆ1 , b̂ 2 là các ước lượng duy nhất với một mẫu xác định
gồm n quan sát (𝑋𝑖 ,𝑌𝑖 ).
- bˆ1 , b̂ 2 là các ước lượng điểm của 𝛽1 , 𝛽2
- bˆ1, b̂ 2 là các đại lượng ngẫu nhiên, giá trị của chúng
thay đổi theo mẫu dùng để ước lượng.
- Hàm hồi quy mẫu đi qua điểm trung bình của dữ liệu
mẫu (𝑋, ഥ 𝑌)

- (Đối với biến phụ thuộc, giá trị trung bình của
ước lượng bằng giá trị trung bình của quan sát).
- Tổng phần dư 𝑢𝑖 =0, σ𝑛𝑖=1 𝑢𝑖 =0
- Các phần dư 𝑢𝑖 và Yˆi không tương quan với nhau.
- Các phần dư 𝑢𝑖 và 𝑋ฎ𝑖 không tương quan với nhau
21
22
23
24
25
26
27
2.4. Phương sai, sai số chuẩn của các ước lượng, hệ
số xác định R2, hệ số tương quan r
2.4.1. Phương sai và sai số chuẩn của các ước lượng
Ước lượng bˆ1 n b̂ 2
X 2

( ) ( ) 
i 2
Phương sai var bˆ1 = i =1
n
 2
var bˆ2 = n
n x
x
2 2
i
i =1
i
i =1
n

X i
2

Sai số chuẩn SE ( bˆ1 ) = i =1
 SE ( bˆ2 ) =
x
n
n x
2
2
i
i 28
i =1
Var(ei) được dùng để ước lượng cho 2 và dùng ước
lượng không chệch là:

e 2
i
ˆ
 =2 i =1
n−2

29
2.4.2. Hệ số xác định R2 và hệ số tương quan r
Thước đo độ phù hợp của mô hình đối với dữ liệu
là R2Y

SRF

Yi

Yi − Yˆi = ei
Yi
Yi − Y = yi Yˆi − Y = yˆ i
Y

30
Xi X
31
32
33
34
35
36
37
38
39
40
41
42
2.5. Phân bố xác suất của các ước lượng
Giả thiết: ui có phân phối N(0, 2)

Với các giả thiết nêu trên, các ước lượng 1 2, ˆ
b , ˆ 2

các tính chất sau:
- Chúng là các ước lượng không chệch
- Có phương sai cực tiểu
- Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ
với giá trị thực của phân phối
ˆ
b1 ~ N ( b1 ,  bˆ 1 )
2

ˆ
b 2 ~ N ( b 2 ,  bˆ 2 )
2

48
2.6. Khoảng tin cậy của các tham số
Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa
a (độ tin cậy 1-a) như sau
bi  ( bˆi −  i ; bˆi +  i )  i = t( n − 2,a / 2 ) SE ( bˆi )

49
50
51
52
53
2.7. Kiểm định giả thiết về hệ số hồi quy
H 0 : b2 = b 2 *

H1 : b 2  b 2*

Có 3 cách để kiểm định giả thiết:


Cách 1: Kiểm định t
ˆ
b2 − b2 *
t=
SE ( bˆ2 )
Quy tắc quyết định
Nếu t  t( n −2,a / 2) thì bác bỏ H0.
Nếu t  t( n−2,a / 2) thì ta không thể bác bỏ H0.
54
f(t)

a/2 a/2

-t t
a/2 a/2

-4 -3 -2 -1 0 1 2 3 4
t
55
Cách 2: Phương pháp khoảng tin cậy
Giả sử ta tìm được khoảng tin cậy của bi là:
bi  (bˆi −  i ; bˆi +  i )  i = t( n−2,1−a / 2) SE (bˆi )
với mức ý nghĩa a trùng với mức ý nghĩa của gt H0

Quy tắc quyết định


- Nếu bi  ( bˆi −  i ; bˆi +  i ) chấp nhận H0
*

- Nếu i  ( bˆi −  i ; bˆi +  i ) bác bỏ H0


b *

56
57
Cách 3: Phương pháp P-value
ˆ
bi − bi *
ti =
SE ( bˆi )

Tính P(T  ti ) = p

Quy tắc quyết định


- Nếu p ≤ a : Bác bỏ H0
- Nếu p > a: Chấp nhận H0
(Phương pháp này thường dùng khi tiến hành trên máy vi tính)

58
59
60
61
Quy tắc thực hành-Trị thống kê t trong các phần
mềm kinh tế lượng
Mức ý nghĩa hay được dùng trong phân tích hồi quy là
a=5%.
Giả thiết: H0 : b2 = 0
H1 : b 2  0

trị thống kê trở thành: bˆ2


t=
SE ( bˆ2 )
Quy tắc quyết định
Nếu t  2 thì bác bỏ H0.
Nếu t  2 thì ta không thể bác bỏ H0.
62
2.8. Kiểm định sự phù hợp của mô hình – Dự báo
2.8.1. Kiểm định sự phù hợp của mô hình
Kiểm định giả thiết H0: R2 = 0 với mức ý nghĩa a hay
độ tin cậy 1 - a
Xét thống kê
R ( n − 2)
2
F =
1− R2
Quy tắc quyết định
- Nếu F > Fa(1,n-2): Bác bỏ H0
- Nếu F ≤ Fa(1,n-2): Chấp nhận H0

63
Thống kê F
F a=0,05

Miền bác bỏ

Miền chấp nhận

Fa(1,n-2) 64
2.8.2. Dự báo
Cho trước giá trị X = X0, hãy dự báo giá trị trung bình
và giá trị cá biệt của Y với mức ý nghĩa a hay độ tin
cậy 1 - a.
Yˆi = bˆ1 + bˆ2 X i
* Dự báo điểm

Yˆ0 = bˆ1 + bˆ2 X 0

65
66
* Dự báo giá trị trung bình của Y

E (Y / X 0 )  (Yˆ0 −  0 ;Yˆ 0+ 0 )

Với:  0 = SE (Yˆ0 )t( n −2,1−a / 2)

SE(Yˆ0 ) = Var(Yˆ0 )

ˆ ˆ 2 1 (X − X0) 2
Var (Y0 ) =  ( + )
n  xì2

67
* Dự báo giá trị cá biệt của Y
ˆ ˆ
Y0  (Y0 −  0 ;Y 0+ 0 )
' '

Với:  = SE (Y0 )t( n − 2,1−a / 2 )


'
0

SE (Y0 ) = Var (Y0 )

ˆ 1 (X − X0) 2
Var (Y0 ) =  (1 + +
2
)
n  xì2

68
Ví dụ 2.3: Với số liệu và kết quả ở ví dụ 2.2
a. Tìm khoảng tin cậy của b1, b2 với a=0,05
b. Hãy xét xem nhu cầu của loại hàng trên có phụ
thuộc vào đơn giá của nó không với a=0,05.
c. Hãy dự báo nhu cầu trung bình và nhu cầu cá biệt
của loại hàng trên khi đơn giá ở mức 6.000 đồng/kg
với độ tin cậy 95%.

69
Stt Xi Yi xi yi xi^2 yi^2
1 1 10 -3 4 9 16
2 4 6 0 0 0 0
3 2 9 -2 3 4 9
4 5 5 1 -1 1 1
5 5 4 1 -2 1 4
6 7 2 3 -4 9 16
Sum 24 36 0 0 24 46
Average 4 6
Mô hình hồi quy mẫu: Yˆi = 11,5 − 1,375. X i
70
Bài giải:

a. Ta có bˆ1 − t ( n−2,1−a / 2) SE ( bˆ1 )  b1  bˆ1 + t ( n−2,1−a / 2) SE ( bˆ1 )


bˆ2 − t ( n−2,1−a / 2) SE (bˆ2 )  b 2  bˆ2 + t ( n−2,1−a / 2) SE (bˆ2 )
n
ˆ
b 2
2 x 2
i
(−1,375) 2 .24
Mà: R2 = n
i =1
= = 0,9864
y 2 46
i
i =1
n
(1 − R ) y2 2

ˆ
i
(1 − 0,9864).46
=>  =2 i =1
= = 0,15625
n−2 6−2 71
Var ( bˆ ) =
 X i
2

ˆ =
2 120
0,15625 = 0,1303
n x
1 2
i 6.24

 SE ( bˆ1 ) = Var ( bˆ1 ) = 0,3609

ˆ 2
0,15625
Var ( bˆ2 ) = = = 0,0065
 xi
2
24

 SE ( bˆ2 ) = Var ( bˆ2 ) = 0,0806

72
1 = t( n −2,1−a / 2) SE ( bˆ1 ) = 2,776 x0,3609 = 1,0019
 2 = t( n −2,1−a / 2) SE ( bˆ2 ) = 2,776 x0,0806 = 0,2237
10,4981  b1  12,5019
− 1,5987  b 2  −1,1513

73
b. Kiểm định giả thiết b2 = 0 H0: b2 = 0
C1: Sử dụng kết quả ở câu a, với a = 0,05, b2 không
thuộc khoảng tin cậy => bác bỏ H0
bˆ2 − b 2* − 1,375 − 0
C2: t = = = −17,0379
SE ( bˆ2 ) 0,0806

=> t = 17,0379  t4,0,025 = 2,776

=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc
vào đơn giá

74
C3: sử dụng kiểm định F đối với mô hình hai biến
(n − 2) R 2
(6 − 2)0,9864
F= = = 290,12
(1 − R )
2
(1 − 0,9864)
Mà F0,05(1,4) = 7,71 < Ftt

=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc
vào đơn giá

75
c. Dự báo
-Dự báo điểm: Yˆ0 = 11,5 − 1,375 x6 = 3,25(tấn/tháng)
- Dự báo giá trị trung bình của Y

E (Y / X = 6)  Yˆ0  t( n−2,a / 2) .SE (Yˆ0 )

1 ( X − X ) 2
1 ( 6 − 4) 2
Var (Yˆ0 ) = ˆ 2 ( + 0
) = 0,1562( + ) = 0,052
n  xi2
6 24

SE(Yˆ0 ) = Var(Yˆ0 ) = 0,2283

E (Y / X = 6)  (2,6162;3,8838)
76
- Dự báo giá trị cá biệt của Y

Y0  Yˆ0  t( n − 2,a / 2 ) .SE (Y0 − Yˆ0 )


ˆ ˆ
Var (Y − Y ) = Var (Y ) +  = 0,20835 ˆ 2
0 0 0

SE(Y0 − Yˆ0 ) = Var(Y0 − Yˆ0 ) = 0,4565


Y0  (1,9828;4,5172)
Vậy, khi đơn giá là 6.000 đồng/kg ở một tháng nào
đó thì nhu cầu sẽ dao động từ 2-4,5 tấn.

77

You might also like