You are on page 1of 62

KINH TẾ LƯỢNG

CHƯƠNG III: MÔ HÌNH HỒI QUY BỘI

1
3.1. Mô hình hồi quy tuyến tính 3 biến
Mô hình hồi quy tổng thể

Mô hình hồi quy tổng thể ngẫu nhiên:

ui: sai số ngẫu nhiên của tổng thể


3.1.1. Ước lượng các tham số của mô hình (OLS)
Cho n quan sát của 3 đại lượng Y, X1, X2, ký hiệu quan
sát thứ i là Yi, X1i, và X2i.
u i  Yi  Yˆi sai số của mẫu ứng với quan sát thứ i 2
2
Q   u i   (Yi   0  1 X 1i   2 X 2i )  min
 ˆ ˆ ˆ 2

dQ
 2 (Yi  ˆ0  ˆ1 X 1i  ˆ2 X 2 i )  0
d ˆ0

dQ
 2 (Yi  ˆ0  ˆ1 X 1i  ˆ2 X 2i )( X 1i )  0
d ˆ1

dQ
 2 (Yi  ˆ0  ˆ1 X 1i  ˆ2 X 2i )( X 2i )  0
d ˆ2
3
ˆ0  Y  ˆ1 X 1  ˆ2 X 2

ˆ1 
 y x x  y x x
i 1i
2
2i i 2i 1i x2i
 x  x  ( x x )
2
1i
2
2i 1i 2i
2

ˆ2 
 y x x  y x x x
i 2i
2
1i i 1i 1i 2 i

 x  x  ( x x )
2
1i
2
2i 1i 2 i
2

xi  X i  X yi  Yi  Y
4
Pi (nghìn
Quan Di đồng/
sát (bông) bông) INi (nghìn đồng/tuần)
1 130 1.5 1583.11
2 162 1 1734.36
152 Di là số lượng hoa
3 1.2 1659.26
hồng bán ra trong tuần
4 133 2 1720.92 (bông)
5 138 2.3 1781.46
6 166 1.7 1988.62 Pi là giá bán buôn hoa
7 165 1.1 1864.28 hồng (nghìn
8 138 3 1883.98 đồng/bông)
9 135 2.6 1805.49
INi là thu nhập trung
10 123 3.1 1837.33
bình theo tuần của một
11 143 2.4 1810.87 hộ gia đình (nghìn
12 175 1 1854 đồng/tuần)
13 137 2.8 1847
14 171 1.3 1881.2
15 123 2.9 1758.67
16 155 1.8 1886 5
 𝑦 2
𝑦=𝑌− 𝑌´
   𝑥1  𝑥2
𝑦× 𝑥1 𝑦× 𝑥2 𝑥1 ×𝑥2
❑2 ❑2
 = -  = -      

-0.48 -222.92 -16.63 0.23 49,695.28 8.00 3,706.12 107.28 276.39


-0.98 -71.67 15.38 0.96 5,137.22 -15.09 -1,101.99 70.33 236.39
-0.78 -146.77 5.38 0.61 21,542.72 -4.20 -788.91 114.67 28.89
0.02 -85.11 -13.63 0.00 7,244.46 -0.26 1,159.68 -1.60 185.64
0.32 -24.57 -8.63 0.10 603.90 -2.75 211.95 -7.83 74.39
-0.28 182.59 19.38 0.08 33,337.51 -5.45 3,537.60 -51.35 375.39
-0.88 58.25 18.38 0.78 3,392.55 -16.19 1,070.26 -51.33 337.64
1.02 77.95 -8.63 1.04 6,075.52 -8.79 -672.28 79.41 74.39
0.62 -0.54 -11.63 0.38 0.30 -7.19 6.33 -0.34 135.14
1.12 31.30 -23.63 1.25 979.42 -26.43 -739.36 35.01 558.14
0.42 4.84 -3.63 0.18 23.38 -1.52 -17.53 2.02 13.14
-0.98 47.97 28.38 0.96 2,300.70 -27.84 1,361.02 -47.07 805.14
0.82 40.97 -9.63 0.67 1,678.18 -7.88 -394.29 33.54 92.64
-0.68 75.17 24.38 0.46 5,649.87 -16.61 1,832.16 -51.21 594.14
0.92 -47.36 -23.63 0.84 2,243.38 -21.71 1,118.98 -43.52 558.14
-0.18 79.97 8.38 0.03 6,394.50 -1.52 669.71 -14.49 70.14
Tổng 8.58 146,298.8 -155.41 10,959.46 173.54 4,415.75
9
6
ˆ1 
 y x x  y x x
i 1i
2
2i i 2i x
1i 2 i
 20,1
 x  x  ( x x )
2
1i
2
2i 1i 2 i
2

ˆ2  0,1
ˆ0  8,1
 Di  8,1  20,1Pi  0,1IN i  u i
7
3.1.2. Phương sai của các ước lượng

Var ( ˆ0 )
1 X 1  x  X 2  x  2 X 1i X 2i  x1i x2i 2
2 2

(  2i 1i
)
n  x1i  x2i  ( x1i x2i )
2 2 2

8
3.1.2. Phương sai của các ước lượng (tiếp)

Var ( ˆ1 ) 
x 2
2i
 2

x x
2
1i
2
2i  ( x1i x2i ) 2

2

 1i
x 2
(1  r 2
12 )

Var ( ˆ2 ) 
 1i
x 2

 2

 1i  2i  ( x1i x2i )
x 2
x 2 2

2

 2i
x 2
(1  r 2
12 ) 9
3.1.2. Phương sai của các ước lượng
(tiếp)

u i2
2
   
(1  R 2 ) yi2
n3 n3
 r12 là

10
3.1.3. Hệ số xác định và hệ số xác định hiệu chỉnh
Hệ số xác định R2

n
u i2
ESS RSS 
R 
2
 1  1 i 1
n
TSS TSS
y
i 1
2
i

11
Ý nghĩa của hệ số xác định bội R2
 R2 bằng phần trăm thay đổi trong giá trị
của biến phụ thuộc được giải thích bởi
mô hình
 R2 cho biết tác động tổng hợp của tất cả
các biến độc lập lên biến phụ thuộc
 Thông thường, R2 là hàm tăng theo số
biến độc lập trong mô hình
12
  Hệ số xác định hiệu chỉnh

2
u
 i
(n  k  1)
R  1
2
2
yi
 (n  1)
Với k là số biến độc lập của mô hình
“Hiệu chỉnh”: Điều chỉnh theo bậc tự do tương
ứng của các độ lệch bình phương
13
  Hệ số xác định hiệu chỉnh
   k > 0 thì < 1
Khi
 có thể nhỏ hơn 0
 Mục đích:
 Dùng để so sánh độ phù hợp của các mô hình hồi quy
có số biến độc lập khác nhau

 Dùng để xem xét việc đưa thêm biến vào mô hình.


Biến đưa thêm vào phải thỏa mãn:
14
 
Mối quan hệ giữa R2 và
n 1
R  1  (1  R )
2 2

n  k 1

15
3.2. Mô hình hồi quy k biến
Mô hình hồi quy tổng thể
E (Y | X 1 ,... X k )   0  1 X 1i  ...   k X ki
Mô hình hồi quy mẫu ngẫu nhiên:
Yi  ˆ0  ˆ1 X 1i  ...  ˆk X ki  u i

u  Y  Yˆ  Y  ˆ
  ˆ
 X  ˆ
 X  ...  ˆ

=> i i i i 0 1 1i 2 2i k X ki

16
2.2.1. Ước lượng các tham số của mô hình (OLS)
2

 
n 2 n

  i 0 1 1i 2 2i
  Y  ˆ  ˆ X  ˆ X  ...  ˆ X
u
i 1
i
i 1
k ki  min
2
 ui

 2(Yi  
 
0
 X  ...  
1 1i
 X )(1)  0
k ki

 0
2
 ui

 2(Yi  
 
0
 X  ...  
1 1i
 X )( X )  0
k ki 1i

 1

...
2
 ui

 2(Yi  
 
0
 X  ...  
1 1i
 X )( X )  0
k ki ki 17


k
Các giả định của
mô hình hồi quy tuyến tính cổ điển
 GT1:
 GT2:
 GT3:
 GT4:
 GT5:
 GT6:
 GT7: Không có hiện tượng đa cộng tuyến hoàn hảo
giữa các biến độc lập.

18
Mối quan hệ phi tuyến tính giữa
X và Y

  hình Log – log
 Mô ln Yi   0  1 ln X i  ui
 :
 Mô hình bán log
ln Yi   0  1 X i  ui
Yi   0  1 ln X i  ui
 Mô hình log-tuyến tính: :

 Mô hình tuyến t ính – log: :



Mô hình đa thức (hàm bậc 2, bậc 3)

Yi   0  1 X i   2 X  uii
2

19
MỘT SỐ ĐỒ THỊ HÀM HỒI QUY
CƠ BẢN

20
Hàm sản xuất Cobb - Douglas
 Hàm sản xuất Cobb – Douglas dưới dạng ngẫu
nhiên:  
Yi   0 X 1i 1 X 2i2 e
u i

 Where: Y = sản lượng


X2 = lao động
X3 = vốn
u = sai số ngẫu nhiên
e = cơ số logarit tự nhiên
 Khi biến đổi logarit mô hình, ta có:
ln Yi  ln  0  1 ln X 1i   2 ln X 2i  ui 21
Mô hình dạng bậc hai

 Example: Xét tác động của quảng cáo đến doanh thu.
 Mô hình hồi quy tuyến tính:
Si   0  1 Pi   2 Ai  ui
 Where: S = doanh thu (đơn vị: $1000)
P = giá (đơn vị $)
A = chi phí quảng cáo (đơn vị $1000)
 Sử dụng số liệu có sẵn, ta có mô hình ước lượng sau:
S i  118.91  7.9 Pi  1.86 Ai
 Tăng chi phí quảng cáo sẽ tăng doanh thu mãi mãi. Điều này có
đúng không? 22
Mô hình dạng bậc hai

 Xét mô hình sau


Si   0  1 Pi   2 Ai  3 Ai  ui
2

 Mô hình này cho phép quy luật lợi tức giảm


dần của quảng cáo.

 Tác động của sự thay đổi quảng cáo lên


doanh thu: E ( S )
?
A
23
Mô hình dạng bậc hai

  Sử dụng số liệu có sẵn, ta có:


S i  109.72  7.64 P  12.15 A  2.77 A2
i i i
 Khi đó, tác động của quảng cáo lên doanh thu sẽ là:
E ( S )

A
 Tác động lớn nhất khi ta chưa đầu tư vào quảng cáo (A=0)
 Khi A tăng lên, tác động của việc đầu tư thêm vào quảng cáo
giảm dần.
 Nên dừng đầu tư vào quảng cáo khi MB MC hay E ( S )  ?
A
24
CHƯƠNG 4:

SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ


MÔ HÌNH HỒI QUY

25
Giả thiết về phân phối của nhiễu
  Giả thiết 7: Sai số ngẫu nhiên ui có phân
phối chuẩn
ui N(0,)
 Khi mô hình đảm bảo được các giả thiết 1-7,
các ước lượng OLS:

26
Các định lý
 Khi các giả thiết 1 – 7 được thỏa mãn, ta có:
 Định lý 1:
  N (  , var( 
 ))
j j j

 Định lý 2:

  )
(
j
j
t T n  k 1
se( 
 ) 27
j
Nhắc lại xác suất thống kê
X 
X  N (  ,( / n)) t x
T
2
x 
n
  )
(
j
  N (  , var( 
 )) j
t T n  k 1
se( 
 )
j j j

j
28
 Phân phối của và t

  β𝑗 0
  )
(
j

  N (  , var( 
 )) j
t T n  k 1
se( 
 )
j j j

j
29
Các bài toán kiểm định
 Kiểm định ý nghĩa thống kê của một hệ số hồi quy
 Khoảng tin cậy
 Giá trị tới hạn t
 P-value
 Kiểm định đồng thời nhiều hệ số hồi quy (đa ràng
buộc tuyến tính)
 Kiểm định độ phù hợp của mô hình hồi quy
 Kiểm định sự thu hẹp mô hình hồi quy
 Kiểm định sự bằng nhau của 2 hệ số hồi quy 30
Bài toán kiểm định
 Giả thuyết thống kê: là một nhận định, giả sử,
nghi ngờ về một hiện tượng, quan hệ hay tình
huống dự định khảo sát.
 Ví dụ:

 Luôn có cặp: H0 và H1

31
Cặp giả thuyết thống kê
 Giả thuyết không H0:
 Là một phát biểu về tham số của hàm hồi quy
tổng thể
 Được cho là đúng đến khi nó bị chứng minh là
sai (bác bỏ)
 Giả thuyết thay thế H1:
 Một trường hợp khác giả thuyết H0
 Được cho là đúng khi H0 được chứng minh là
sai 32

 Thường là điều ta muốn chứng minh là đúng


4.1. Kiểm định giả thiết về hệ số hồi quy

H0 :  j   *
j
Kiểm định hai phía:
H1 :  j   *
j

H 0 :  j   *j
Kiểm định phía phải
H1 :  j   j *

Kiểm định phía trái H0 :  j   j *

H1 :  j   j * 33
4.1.1. Phương pháp khoảng tin cậy
(KTC)
2 bước:
 Xây dựng khoảng tin cậy cho hệ số hồi quy
 Kiểm định giá trị của hệ số hồi quy sử dụng
khoảng tin cậy

34
Xây dựng KTC
 Mức ý nghĩa α
α = 1%, 5%, 10%
 Độ tin cậy (1 – α)
(1 – α) = 99%, 95%, 90%
 Ta có:
t
P (  
 /2 t t
s  /2
)  (1   )
P(t s  t  )  (1   )
P(t s  t  )  (1   )
35
Xây dựng KTC
  Kí hiệu tα, n-k-1
Với bậc tự do là n-k-1
Hai chiều: P (|t| tα/2) = α

Một chiều: P(t tα) = α


36

hoặc: P(t -t ) = α
Khoảng tin cậy đối xứng
Ta  có:
  
 j
P (t  t )  (1   )
j
 /2  /2
se( 
 )
 j


P   ) j
  t  /2se(   t  / 2se(
 
)   (1   )
 j j j j 

Khi đó:
 
  j  t  / 2se(  j ),  j  t  / 2se(  j ) 
  
Là KTC đối xứng (1-α) của 37
Ý nghĩa Khoảng tin cậy
Ý   nghĩa KTC cho hệ số hồi quy:
Với độ tin cậy là (1-α), khi biến tăng 1 đơn vị
và các yếu tố khác không đổi thì giá trị trung bình
của biến phụ thuộc tăng trong khoảng này.
 se() càng lớn thì KTC càng lớn
 KTC có tính ngẫu nhiên

38
Ví dụ
 Xét mô hình hồi quy mẫu:
CT  56, 60  0, 794TN  0, 015TS
(se) (9,65) (0,016) (0,004)
được xây dựng từ bộ số liệu có 30 quan sát.
- Tại mức ý nghĩa 1%, hệ số hồi quy ứng với
biến TS có thực sự lớn hơn 0 hay không?
- Thiết lập KTC đối xứng cho hệ số hồi quy
ứng với biến TN với độ tin cậy 95%.
39
KTC trái, KTC phải
 KTC trái
 
 j
  ,   t  ,n  k 1se(  ) 


j

j 

 KTC phải
 
 j
    t  ,n  k 1se(  ),  
 j

j 
40
Quy tắc quyết định
- Nếu
 *
j  KTC
 j  KTC
*

- Nếu

41
Kiểm định dùng t – giá trị tới hạn
Các bước thực hiện kiểm định t:

Bước 1: Thiết lập cặp giả thuyết H0, H1


Bước 2: Tính giá trị kiểm định ts

ts  ?
42
Kiểm định dùng t – giá trị tới hạn
Các bước thực hiện kiểm định t:

Bước 3: Xác định miền bác bỏ


Xác định giá trị tới hạn tc (dùng bảng giá trị tới hạn)
Bậc tự do: n – k -1
Mức ý nghĩa: Kiểm định 1 phía: α
Kiểm định 2 phía: α/2
Bước 4: So sánh giá trị ts và tc, đưa ra kết luận
43
Kiểm định dùng t – giá trị tới hạn
Quy tắc quyết định
Loại kiểm định Cặp giả thiết Bác bỏ H0

Kiểm định hai phía |t| > tn-k-1; α/2


H0 :  j   *
j
Kiểm định phía H1 :  j   *j
t > tn-k-1; α
phải
H 0 :  j   *j (  j   *j )
Kiểm định phía
H1 :  j   *j
trái
H 0 :  j   ( j   )
* * t < -tn-k-1; α
j j

H1 :  j   *j 44
Kiểm định dùng p-value
 P-value là mức ý nghĩa nhỏ nhất mà H0 có thể
bị bác bỏ.
Bước 1: Thiết lập cặp giả thuyết H0, H1
Bước 2: Tìm giá trị kiểm định, từ đó tìm p-value
tương ứng.
Hoặc: Tìm giá trị p-value từ bảng kết quả ước
lượng
Bước 3: Xác định mức ý nghĩa α
Bước 4: Bác bỏ Ho nếu: p < α
45
XÁC ĐỊNH P-VALUE
 Trong Excel: Dùng hàm T.DIST
Với kiểm định 2 phía: p-value = T.DIST.2T (ts, d.f.)
 Kiểm định 1 phía H1:  j  :p-value
*
j = T.DIST(ts, d.f.)

 Kiểm định 1 phía H1: j  *
j : p-value = T.DIST.RT(ts,
d.f.)
 Trong bảng kết quả STATA:
 Cách xác định p-value của kiểm định 1 phía: từ kết quả ước lượng
STATA với p-value* là p-value của kiểm định 2 phía.
Xác định p-value của kiểm định 1 Ước lượng mẫu
phía

0 p-value*/2 1 – p-value*/2
46
H1
0 1 – p-value*/2 p-value*/2
XÁC ĐỊNH P-VALUE
Giá trị kiểm định t Giá trị p-value của
của kiểm định sự kiểm định 2 phía
khác 0 của về sự khác 0 của
hệ số hồi quy hệ số hồi quy

47
4.2. Kiểm định sự phù hợp của hàm
hồi quy
  giả thuyết:
 Cặp
H0: 1 = 2 =…= k = 0;
    ...   (ít
2 2 2
H1: 0 nhất 1 tham số khác 0)
1 2 k

 Giả thuyết H0: toàn bộ các biến độc lập trong mô hình
không giải thích gì cho giá trị của biến phụ thuộc, hay
R2 = 0
 Cặp giả thuyết tương đương:
H0: R2 = 0
H1: R2 0
48
4.2. Kiểm định sự phù hợp của mô hình tức là kiểm
định giả thiết đồng thời bằng không:

Bước 1: Thiết lập cặp giả thuyết


Bước 2: Tính giá trị kiểm định Fs:
2
R
k R (n  k  1)
2

F s

(1  R )
2

(1  R )(k )
2

(n  k  1)
Bước 3: Xác định giá trị tới hạn F(k, n-k-1)
49
Bước 4: So sánh và kết luận
Kiểm định sự phù hợp của hàm hồi quy
Nguyên tắc quyết định:
 Nếu F > F(k, n-k-1):

 Nếu F ≤ F(k, n-k-1):

 Dùng p-value:

50
Kết quả từ STATA
Source SS df MS Number of obs = 534
F( 3, 530) = 59.88
Model 3563.62709 3 1187.8757 Prob > F = 0.0000
Residual 10513.0715 530 19.8359839 R-squared = 0.2532
Adj R-squared = 0.2489
Total 14076.6985 533 26.4103162 Root MSE = 4.4538

wage Coef. Std. Err. t P>|t| [95% Conf. Interval]

education .9405066 .0788634 11.93 0.000 .7855834 1.09543


experience .1133003 .0167082 6.78 0.000 .0804779 .1461228
sex -2.337632 .3880624 -6.02 0.000 -3.099962 -1.575303
_cons -4.166875 1.18667 -3.51 0.000 -6.49803 -1.83572

51
Thống kê F
=0,05

Miền bác bỏ

Miền chấp nhận

52
F(k,n-k-1)
4.3. Kiểm định thu hẹp hồi quy:

 Kiểm định ràng buộc các hệ số hồi quy


Giả sử có MH: Y = β0 + β1X1+..+ β5X5 + u (1)
 Nếu β2 = β4=0? ( Liệu 2 biến độc lập tương ứng
với 2 hệ số hồi quy này có đồng thời không có ảnh
hưởng đến giá trị của biến phụ thuộc không?)
Chạy MH (1) thu được R²(U)
Chạy MH : Y = β0 + β1X1+ β3X3+ β5X5 + u (2)
=> R2(R)
53
Kiểm định thu hẹp hồi quy
 
 Bước 1: Thiết lập cặp giả thuyết
H0: β2 = β4=0; H1: β²2 + β²4 0
 Bước 2: Tính giá trị kiểm định Fs
R 
2
U RR
2

m R
2
 R
2
n  k 1
Fs   
U R
1  RU
2
1  RU2
m
n  k 1
 Bước 3: Xác định giá trị tới hạn Fα(m, n-k)
 Bước 4: So sánh và đưa ra kết luận
Nếu F > Fα(m, n-k)=> Bác bỏ H0 54
Kiểm định kết hợp tuyến tính
giữa các hệ số hồi quy
  Tổ hợp tuyến tính của các hệ số:
a + b = c (1)
 Trong đó:
 a, b, c là các hằng số
 i, j = 1, 2, …, k
 (1)  a + b - c = 0
 Kiểm định giả thuyết H0: a + b - c = 0
 Giá trị kiểm định:
a  b
i
 c0
j
55
se(a 
  b
i
  c)
j
Kiểm định sự bằng nhau
của 2 hệ số hồi quy
  Xét mô hình: Y = β0 + β1X1+..+ β5X5 + u
 Liệu ? (Liệu tác động của biến X3 và X4 đến biến
phụ thuộc Y có như nhau không?)
 Kiểm định giả thuyết:
H 0 : 3   4 H 0 : 3   4  0
hoặc H1 :  3   4  0
H1 :  3   4

 Giá trị kiểm định:


(
   )0
ts  3 4

se( 
 
3
 )
4
56
Kiểm định sự bằng nhau
của 2 hệ số hồi quy
 4 bước
 B1: Thiết lập cặp giả thuyết thống kê.
 B2: Tính giá trị kiểm định (giá trị t quan sát) ts

(
  )  (   ) *
ts  3 4 3 4

se( 
  )
3 4
 Trong đó

se( 
 
3
 )  var( 
4
 )  var( 
3
 )  2 cov( 
4
 ,
3
 )
4

 B3: Xác định miền bác bỏ


 B4: So sánh ts với tc. Rút ra kết luận. 57
4.4. Dự báo từ kết quả hồi quy
Dự  báo giá trị của biến phụ thuộc Y khi biết giá

trị của biến độc lập:
 Dự báo điểm
 Dự báo giá trị trung bình E(Y|X)
 Dự báo giá trị cá biệt

58
Dự báo
Xét mô hình hồi quy 2 biến:
Y i
  X u
i i
0 1

Và hàm hồi quy mẫu tương ứng


Yˆi  ˆ0  ˆ1 X i

Cho trước giá trị X = Xa, hãy dự báo giá trị trung bình
và giá trị cá biệt của Y với mức ý nghĩa  hay độ tin
cậy 1 - .

59
4.4.1. Dự báo điểm
  Tìm ước lượng với các ước lượng điểm có
được từ hàm hồi quy mẫu

Yˆa  ˆ0  ˆ1 X a

60
Dự báo giá trị trung bình E(Y|Xa)

E (Y | X a )  (Yˆa   a ; Yˆ a  a )

Với:  a  SE (Yˆa )t( n  2, / 2)

SE (Yˆa )  Var (Yˆa )

ˆ 1 (X  Xa)
2
2
Var (Ya )   ( 
 )
n  xì2

61
4.4.3. Dự báo giá trị cá biệt Ya
ˆ ˆ
Ya  (Ya   a ; Y a  a )
' '

Với:   SE (Ya  Y a )t( n  2, / 2)


'
a

SE (Ya  Yˆa )  Var (Ya  Yˆa )

 2
 1 (X  Xa) 2
Var (Ya  Y a )   (1   )
n  xì2

62

You might also like