You are on page 1of 67

TBP

Chương 2
MÔ HÌNH HỒI QUY BỘI

TBP 3/18/2020
TBP
1. Mô hình hồi quy 3 biến
1.1. Hàm hồi quy tổng thể (PRF)

Yi  1   2 X 2i  3 X 3i  U i
Trong đó

•Y là biến phụ thuộc


•X2,X3 là các biến độc lập
•X2i, X3i là giá trị thực tế của X2, X3
•Ui là các sai số ngẫu nhiên
TBP 3/18/2020
 T
B
1.2. Các giả thiết của mô hình P

 Giá trị trung bình của đại lượng ngẫu


nhiêu Ui bằng 0
 Phương sai của Ui không thay đổi

 Không có sự tương quan giữa các Ui


 Không có sự tương quan (cộng tuyến)
giữa X2 và X3
 Không có sự tương quan giữa các Ui và
X2,X3
TBP 3/18/2020
I. Moâ hình hoài quy tuyeán tính 3 bieán
TBP

1.3. Ước lượng các tham số


Chúng ta sử dụng phương pháp bình phương
nhỏ nhất OLS

PRF : Yi  1   2 X 2i  3 X 3i  U i
Hàm hồi quy mẫu tương ứng sẽ là :

SRF : Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ei

Yˆi  ˆ1  ˆ2 X 2i  ˆ3 X 3i


Hay:

TBP 3/18/2020
TBP
1.3. Ước lượng các tham số

ei  Yi  Yˆi  Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i


Theo phương pháp OLS thì các tham số

ˆ1 , ˆ2 , ˆ3 được chọn sao cho

 e 
2
i Y  
 i 1 2 2i 3 3i
ˆ  ˆ X  ˆ X
 2
 min

Như vậy , công thức tính của các tham số như sau :

TBP 3/18/2020
TBP
1.3. Ước lượng các tham số
Ký hiệu: yi  Yi  Y
x2i  X 2i  X 2
x3i  X 3i  X 3

̂ 2 

̂ 3 

̂1 
TBP 3/18/2020
TBP
1.3. Ước lượng các tham số
Người ta chứng minh được
x   X  n X 2 
2 2 2
2i 2i

x   X  nX 3 
2 2 2
3i 3i

 y  Y  nY 
2 2 2
i i

x 2i 3ix   X 2i X 3i  nX 2 X 3

y x i 2i  Yi X 2i  nY . X 2

y x i 3i  Yi X 3i  nY . X 3

TBP 3/18/2020
TBP

Ví dụ
Bảng dưới đây cho các số liệu về doanh số bán (Y), chi
phí chào hàng (X2) và chi phí quảng cáo (X3) của một
công ty
Hãy ước lượng hàm hồi quy tuyến tính của doanh số
bán theo chi phí chào hàng và chi phí quảng cáo

TBP 3/18/2020
Doanh số bán Yi (trđ) Chi phí chào hàng X2 Chi phí quảng cáoTBP
X3

1270 100 180


1490 106 248
1060 60 190
1626 160 240
1020 70 150
1800 170 260
1610 140 250
1280 120 160
1390 116 170
1440 120 230
1590 140 220
1380 150 150 TBP 3/18/2020
TBP

Từ số liệu trên, ta tính được các tổng như sau :

 Y  16956  X  188192
i
2
2i

 X  1452  X X  303608
2i 2i 3i

 X  2448  X  518504
3i
2
3i

 Y  24549576
i
2
Y  1413
 Y X  3542360
i 3iX  121 2

 Y X  2128740
i X  204
2i 3
TBP 3/18/2020
TBP

y   Yi  nY   590748
2 2 2
i

x   X  nX 2   12500
2 2 2
2i 2i

x   X  nX 3   19112
2 2 2
3i 3i

yx i 2i   Yi X 2i  nY X 2  77064
yx i 3i   Yi X 3i  nY X 3  83336
x x
2 i 3i   X 2i X 3i  nX 2 X 3  7400
TBP 3/18/2020
TBP

TBP 3/18/2020
TBP
1.4. Hệ số xác định của mô hình

TSS   (Yi  Y ) 
2

ESS 

RSS 
R 
2

TBP 3/18/2020
TBP
1.4. Hệ số xác định của mô hình
Đối với mô hình hồi quy bội, người ta tính
R2 có hiệu chỉnh như sau :

R  2

k là số tham số trong mô hình

Khi k>1 thì R  R 1


2 2

TBP 3/18/2020
TBP

1.4. Hệ số xác định của mô hình


Ví dụ : Tính hệ số xác định của mô hình hồi quy theo
số liệu của ví dụ trước

TSS   (Yi  Y )  Yi  nY


2 2 2

ESS  ˆ2  yi x2i ˆ3  yi x3i

RSS  TSS  ESS

TBP 3/18/2020
TBP
1.4. Hệ số xác định của mô hình

R 2

R 2

TBP 3/18/2020
TBP
3.4. Hệ số xác định của mô hình

Chú ý: Khi tăng số biến độc lập trong mô hình


thì R2 cũng tăng cho dù các biến độc lập tăng
thêm có ảnh hưởng mô hình hay không. Do đó
không thể dùng R2 để quyết định có nên thêm
biến vào mô hình hay không mà thay vào đó
có thể sử dụng hệ số xác định được hiệu chỉnh.

TBP 3/18/2020
TBP

• Cách sử dụng để quyết định đưa thêm biến


R 2

vào mô hình

TBP 3/18/2020
TBP

TBP 3/18/2020
TBP

TBP 3/18/2020
TBP
1.5. Phương sai của hệ số hồi quy
Phương sai của các tham số hồi quy được tính
theo các công thức sau:

 1 X 22  x32i  X 32  x22i  2 X 2 X 3  x2i x3i 


 ˆ  ˆ  
2 2

 x2i  x3i   x2i x3i 
2
1
 n 2 2


TBP 3/18/2020
TBP
1.5. Phương sai của hệ số hồi quy

 2
 ˆ 
2
  x 2
3i


  x2i  x3i   x2i x3i  
ˆ
2 2 2 2

TBP 3/18/2020
TBP

1.5. Phương sai của hệ số hồi quy

 2
 ˆ 
2
  x 2
2i


  x2i  x3i   x2i x3i  
ˆ3 2 2 2

Với ˆ 
2

TBP 3/18/2020
TBP
1.6. Khoảng tin cậy của các hệ số hồi quy

Khoảng tin cậy của 1 Với độ tin cậy là 1-α

Khoảng tin cậy của  2

TBP 3/18/2020
TBP

1.6. Khoảng tin cậy của các hệ số hồi quy

Khoảng tin cậy của  3

Lưu ý khi tra bảng T-Student, trong trường


hợp hàm hồi quy 3 biến thì bậc tự do là ……

TBP 3/18/2020
TBP
1.6. Khoảng tin cậy của các hệ số hồi quy

Ví dụ : Tính khoảng tin cậy của β2 và β3 mô


hình hồi quy theo số liệu của ví dụ trước với
độ tin cậy 95%

TBP 3/18/2020
TBP
1.6. Khoảng tin cậy của các hệ số hồi quy

Khoảng tin cậy của β2 là

Khoảng tin cậy của β3 là

TBP 3/18/2020
TBP
1.7. Kiểm định giả thiết
a) Kiểm định giả thiết về β1, β2 β3
Ho:βi= βo
H1:βi≠ βo

- Cách 1: Khoảng tin cậy


Bước 1 : Lập khoảng tin cậy
Bước 2 : Nếu β0 thuộc khoảng tin cậy thì chấp nhận Ho.
Nếu β0 không thuộc khoảng tin cậy thì bác bỏ Ho
Ví dụ : (theo số liệu trước), yêu cầu kiểm định các giả
thiết β2 , β3 Với độ tin cậy 95%
TBP 3/18/2020
TBP
1.7. Kiểm định giả thiết

a) Kiểm định giả thiết về β1, β2 β3

- Cách 2: Giá trị tới hạn t

- Cách 3: P-value

TBP 3/18/2020
TBP

TBP 3/18/2020
TBP

TBP 3/18/2020
TBP
1.7. Kiểm định giả thiết
b) Kiểm định giả thiết về R2
Ho:R2= 0
H1:R2≠ 0
Bước 1 : tính

Bước 2 : Tra bảng tìm F(2,n-3), mức ý nghĩa là α

Bước 3 : Nếu F>F(2,n-3) ,


Nếu F≤F(2,n-3) ,
TBP 3/18/2020
TBP
1.7. Kiểm định giả thiết
b) Kiểm định giả thiết về R2
Ví dụ: Yêu cầu kiểm định giả thiết
Ho:R2= 0
H1:R2≠ 0
Giải
:

TBP 3/18/2020
TBP
2. Một số dạng hàm
2.1. Hàm sản xuất Cobb-Douglas

Hàm sản xuất Cobb-Douglas được biểu diễn như


sau:   U
Yi  1 X 2i X 3i e
2 3 i

Trong đó : Y : sản lượng của doanh nghiệp


i
X2i : lượng vốn
X3i : lượng lao động
Ui : sai số ngẫu nhiên

Hàm sản xuất Cobb-Douglas có thể đưa được về


dạng tuyến tính bằng cách lấy logarit hai vế
TBP 3/18/2020
TBP
2. Một số dạng hàm
2.1. Hàm sản xuất Cobb-Douglas

ln Yi  ln 1   2 ln X 2i  3 ln X 3i  U i
Đặt Yi  ln Yi
*

1  ln 1
*

X  ln X 2i
*
2i

X  ln X 3i
*
3i

Dạng tuyến tính sẽ là :


Yi     2 X  3 X  U i
* *
1
*
2i
*
3i
TBP 3/18/2020
TBP

2.2. Hàm hồi quy đa thức bậc 2

Yi  1   2 X i  3 X i2  U i
Mặc dù chỉ có một biến độc lập Xi nhưng nó xuất
hiện với các luỹ thừa khác nhau khiến cho mô hình
trở thành hồi quy ba biến

TBP 3/18/2020
TBP
3. HỐI QUY TUYẾN TÍNH K BIẾN

3.1. Hàm hồi quy tổng thể (PRF)

Yi  1  2 X 2i  3 X 3i  ...  k X ki  Ui
Trong đó
•Y là biến phụ thuộc
•X2,X3,…,Xk là các biến độc lập
•Ui là các sai số ngẫu nhiên
•β1 :Hệ số tự do
β 2, β 3,…, β k là các hệ số hồi quy riêng
TBP 3/18/2020
TBP
3.1. Hàm hồi quy tổng thể (PRF)

Ký hiệu

 Y1   1   U1 
     
 Y 2     U 2
Y  2
U
 ...   ...   ... 
     
 Yn   k  U n 

TBP 3/18/2020
TBP

3.1. Hàm hồi quy tổng thể (PRF)

Và 1 X 21 X 31 ... X k1 
 
 1 X X 32 ... X k 2 
X 22

 ... ... ... ... ... 


 
 1 X 2n X 3n ... X kn 

TBP 3/18/2020
TBP

3.1. Hàm hồi quy tổng thể (PRF)

Khi đó , hệ thống các quan sát có thể được


viết lại dưới dạng :

Y  X .  U

TBP 3/18/2020
TBP
3.2. Các giả thiết của mô hình hồi quy k biến
Giả thiết 1 : Các biến độc lập X1, X2,…,Xk đã cho và
không ngẫu nhiên
Giả thiết 2 : Các sai số ngẫu nhiên Ui có giá trị trung
bình bằng 0 và có phương sai không đổi
Giả thiết 3: Không có sự tương quan giữa các sai số Ui

Giả thiết 4 : Không có hiện tượng cộng tuyến giữa các


biến độc lập X2, X3,…,Xk

Giả thiết 5 : Không có tương quan giữa các biến độc lập
X2,X3,…,Xk với các sai số ngẫu nhiên Ui
TBP 3/18/2020
TBP

3.2. Các giả thiết của mô hình hồi quy k biến

Hàm hồi quy mẫu :

SRF: Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki  ei


hoặc: Yˆ  ˆ  ˆ X  ˆ X  ...  ˆ X
i 1 2 2i 3 3i k ki
Hay : (Viết dưới dạng ma trận )

ˆ
Y  X e
TBP 3/18/2020
TBP

3.3. Ước lượng các tham số

Với
 ˆ1   e1 
   
ˆ
 2  e 2
ˆ
   e
...  ... 
   
 ˆ   en 
 k
TBP 3/18/2020
TBP
3.3. Ước lượng các tham số
SRF: Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki  ei

hoặc: Yˆi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki


Khi đó

ei  (Yi  Yˆi )
 Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki
TBP 3/18/2020
TBP
3.3. Ước lượng các tham số
Theo phương pháp OLS thì các tham số

ˆ1 , ˆ2 , ˆ3 ,..., ˆk được chọn sao cho

  i i  
2
e 2
Y  ˆ
Y
i


  Yi  ˆ1  ˆ2 X 2i  ˆ3 X 3i  ...  ˆk X ki 
2

 min
TBP 3/18/2020
TBP
3.3. Ước lượng các tham số

Ta ký hiệu T T ˆ
X ,Y ,  , eT T là các ma trận

chuyển vị của X , Y , ˆ , e
Tức là

Y  Y1 , Y2 ,..., Yn 
T

e   e1 , e2 ,..., en 
T

ˆ ˆ ˆ
  1 ,  2 ,...,  k
T ˆ  TBP 3/18/2020
TBP

3.3. Ước lượng các tham số

 1 1 1 ... 1 
 
 X X 22 X 23 ... X 2 n 
X
T 21

 ... ... ... ... ... 


 
 k1
X Xk2 X k3 ... X kn 

TBP 3/18/2020
TBP
3.3. Ước lượng các tham số

Khi đó :

ˆ
  (X X ) X Y
T 1 T

TBP 3/18/2020
TBP
3.3. Ước lượng các tham số
Trong đó (XTX) là ma trận có dạng

 n

X 2i X 3i ... X ki


XX
T   X 2i X 2
2i X X 2i 3i ... X X
2 i ki 
 ... ... ... ... ... 
 
  X ki  X ki X 2i  X ki X 3i  X ki 
2 
...

  Yi   165 
   
X Y    Yi X 2i    1028 
T

  Y X   813 
 i 2i    TBP 3/18/2020
TBP

3.3. Ước lượng các tham số

Ví dụ minh hoạ
Bảng dưới đây cho các số liệu về lượng hàng bán
được của một loại hàng hóa(Y), thu nhập của người
tiêu dùng (X2) và giá bán của loại hàng này (X3)
Tìm hàm hồi quy tuyến tính

ˆ ˆ ˆ ˆ
Yi  1  2 X 2i  3 X 3i

TBP 3/18/2020
TBP
Yi (tấn/tháng) X2 (triệu X3(ngàn
đồng/năm) đồng/kg)
20 8 2
18 7 3
19 8 4
18 8 4
17 6 5
17 6 5
16 5 6
15 5 7
13 4 8
12 3 8 TBP 3/18/2020
TBP

Giải Từ số liệu trên, ta tính được các tổng như sau:

 Y  165  X  388
i
2
2i

 X  60  X X  282 2i 2i 3i

 X  52  X  3083i
2
3i

 Y  2781 Y  16,5
i
2

 Y X  813
i X 6 3i 2

 Y X  1029
i X  5, 22i 3
TBP 3/18/2020
TBP

 n

X X2i 3i   10 60 52 
  
X X    X 2i
T
X X X
2
2i 2i 3i    60 388 282 
 X 2   
 3i X X X
3i 2i 3i   52 282 308 

 26.165 -2.497 -2.131


1  
( X X )   -2.497 0.246 0.196 
T

 -2.131 0.196 0.183 


 
TBP 3/18/2020
TBP

  Yi   165 
   
X Y    Yi X 2i   1028 
T

  Y X   813 
 i 2i   

14.992  ˆ1  14,992


ˆ  
  ( X X ) X Y   0.762 
T 1 T
ˆ  0,762
Vậy: 2
 -0.589 
  ˆ3  0,589

Yˆi  14,992  0,762 X 2i  0,589 X 3i


TBP 3/18/2020
TBP

3.4. Hệ số xác định của mô hình

TSS  Y Y  n(Y )
T 2

ˆ
ESS   X Y  n(Y )
T T 2

RSS  TSS  ESS


ESS
R 
2

TSS
TBP 3/18/2020
TBP

3.4. Hệ số xác định của mô hình


Đối với mô hình hồi quy bội, người ta tính
R2 có hiệu chỉnh như sau :

n 1
R  1  (1  R )
2 2

nk
k là số tham số trong mô hình

Khi k>1 thì R  R 1


2 2

2
R Có thể âm, trong trường hợp âm, ta coi giá trị
của nó bằng 0 TBP 3/18/2020
TBP
3.5. Khoảng tin cậy và kiểm định giả thiết

Gọi cjj là phần tử nằm ở dòng j cột j của ma trận (XTX)-1

Khi đó :  2
ˆ
  .c jj  ˆ .c jj
2 2
j

ˆ
se(  j )   ˆ
2
j

RSS
Với ˆ 
2
(k là số tham số)
nk
TBP 3/18/2020
TBP
3.5. Khoảng tin cậy và kiểm định giả thiết

Khoảng tin cậy của βj là

( ˆ j  t se( ˆ j ); ˆ j  t se( ˆ j ))
2 2

Hoặc tính giá trị tới hạn của βj là


ˆ
j j *

t Bậc tự do là (n-k)
se( ˆ )j
TBP 3/18/2020
TBP
3.5. Khoảng tin cậy và kiểm định giả thiết

Kiểm định giả thiết về R2 Ho:R2= 0


Với độ tin cậy 1-α H1:R2≠ 0

R 2 (n  k )
Bước 1 : tính F 

(k  1) 1  R 2 
Bước 2 : Tra bảng tìm F(k-1,n-k), mức ý nghĩa là α

Bước 3 : Nếu F>F(k-1,n-k) , bác bỏ H0


Nếu F≤F(k-1,n-k) , chấp nhận H0
TBP 3/18/2020
TBP

3.6. Vấn đề dự báo

 1 
 0
 X 2 
Cho Xo 
 ... 
 0
 Xn 

Yêu cầu dự báo giá trị Y0 của Y

TBP 3/18/2020
TBP

3.6. Vấn đề dự báo

Dự báo điểm :

ˆ ˆ ˆ ˆ ˆ
Y0  0  2 X 2  3 X 3  ...  k X k
0 0 0

Dự báo khoảng :
(Yˆ0  t se(Yˆ0 ); Yˆ0  t se(Yˆ0 ))
2 2

Bậc tự do là (n-k)
TBP 3/18/2020
TBP

3.6. Vấn đề dự báo

  ˆ X ( X X ) X 0
2
Yˆ0
2 T
0
T 1

ˆ
se(Y0 )   Yˆ
2
0

TBP 3/18/2020
TBP

Ví dụ (số liệu trước)

Ví dụ : Tính khoảng tin cậy của β2 theo số


liệu của ví dụ trước với độ tin cậy 95%

TBP 3/18/2020
TBP

Ví dụ (số liệu trước)

yêu cầu kiểm định các giả thiết

Ho:β2= 0
H1:β2≠ 0

Với độ tin cậy 95%

TBP 3/18/2020
TBP

Ví dụ (số liệu trước)

Yêu cầu kiểm định các giả thiết

Ho: R2= 0
H1: R2≠ 0

Với độ tin cậy 95%

TBP 3/18/2020
TBP

Ví dụ (số liệu trước)

Yêu cầu dự báo giá trị của Y khi X2=9 và X3=9


với độ tin cậy 95%

TBP 3/18/2020
TBP
Y: Doanh thu, X2 Chi phí quaûng caùo, X3= Löông nhaân
vieân
Y X2 X3 Y X2 X3
126 17 11 160 23 15
148 23 14 127 15 11
105 18 9 138 16 12
162 22 16 143 21 14
101 14 9 158 22 15
175 24 17 137 13 13

1. Vieát phöông trình hoài quy


2. Tìm R2 vaø R2 hieäu chænh
3. Tìm khoaûng tin caäy cuûa caùc heä soá hoài quy
4. Kieåm ñònh giaû thieát H0 ß1 = 0, H0 ß2 = 0 vôùi α=5%
5. Döï baùo doanh thu cty neáu löông 10tr, quaûng caùo 100tr
TBP 3/18/2020

You might also like