You are on page 1of 79

CHƯƠNG 2:

MÔ HÌNH HỒI QUY 2 BIẾN


ƯỚC LƯỢNG &
KIỂM ĐỊNH GIẢ THIẾT

1
NỘI DUNG CHƯƠNG 2

1
2 Phương pháp bình phương nhỏ nhất (OLS)

2 Các giả thiết của phương pháp OLS

3 Phương sai và sai số tiêu chuẩn

4 Hệ số xác định và hệ số tương quan

2
NỘI DUNG CHƯƠNG 2

5
2 Phân phối xác suất của các ước lượng

6 Khoảng tin cậy của β1, β2 và σ2

7 Kiểm định giả thiết về các hệ số hồi quy

8 Kiểm định sự phù hợp của hàm hồi quy

3
NỘI DUNG CHƯƠNG 2

9
2 Ứng dụng của phân tích hồi quy

10 Trình bày kết quả phân tích hồi quy

11 Đánh giá kết quả phân tích hồi quy

4
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)

E (Y / X i ) = 1 +  2 X i
PRF
Yi = E (Y / X i ) + U i = 1 +  2 X i + U i

Yˆi = ˆ1 + ˆ2 X i


SRF
Yi = ˆ1 + ˆ2 X i + ei = Yˆ + ei

5
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)



● ● ●
● ● ●
● ● ●
● ●●
● ● ● ● ●
● ●● ●
● ●●
● ● ● ● ●●
● ● ●
● ●●

6
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)

Y ●

● SRF
Yi ●

ei e7

Ŷi ●

e1

X
7
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Mẫu: n cặp quan sát (Yi, Xi), i = 1, n
Theo phương pháp OLS, tìm Ŷi càng gần với Yi
càng tốt

ei = Yi − Yˆi = Yi − ˆ1 − ˆ2 X i càng nhỏ càng tốt

( )
n n

  i 1 2 i
ˆ − ˆ X 2
e = Y −
2
i  ➔ min
i =1 i =1

8
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Vậy, cần tìm ˆ , ˆ sao cho:
1 2

( ) ( )
n
f 1 ,  2 =  Yi − 1 −  2 X i  min
ˆ ˆ ˆ ˆ 2

i =1
n n

 X Y − nX .Y  x y
i i i i
̂ 2 = i =1
= i =1
ˆ1 = Y − ˆ2 X
− n( X )
n n

X x
2 2 2
i i
i =1 i =1

Với: xi = X i − X yi = Yi − Y
9
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)

Ví dụ: Cho số liệu về thu nhập (X – USD/tuần) và


chi tiêu (Y – USD/tuần) của một mẫu gồm 10 hộ
gia đình. Giả sử Y và X có mối quan hệ tương
quan tuyến tính. Ước lượng hàm hồi quy của Y
theo X.

Xi 80 100 120 140 160 180 200 220 240 260


Yi 70 65 90 95 110 115 120 140 155 150

10
Ta có bảng tính sau:
Obs Xi Yi Xi2 Yi2 Xi.Yi
1 80 70 6400 4900 5600
2 100 65 10000 4225 6500
3 120 90 14400 8100 10800
4 140 95 19600 9025 13300
5 160 110 25600 12100 17600
6 180 115 32400 13225 20700
7 200 120 40000 14400 24000
8 220 140 48400 19600 30800
9 240 155 57600 24025 37200
10 260 150 67600 22500 39000
Tổng 1700 1110 322000 132100 205500
11
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Như vậy, ta có:

X=
 X i
=
1700
= 170 Y =
 Y i
=
1110
= 111
n 10 n 10

X i
2
= 322000  i = 132100
Y 2

 X Y = 205500
i i

12
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
n

 X Y − nX .Y
i i
205500− 10.170.111
 ˆ2 = i =1
= = 0,5091
− n( X ) 322000− 10.(170)
n 2

X 2 2
i
i =1

 ˆ1 = Y − ˆ2 X = 111− 0,5091x170 = 24,4545

 Yˆi = 24,4545+ 0,5091. X i

13
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Có thể tìm ̂ 2 như sau:
n n

 x y =  X Y − nX .Y = 205500−10.170.111 = 16800
i =1
i i
i =1
i i

− n(X ) = 322000− 10.(170) = 33000


n n

x = X 2 2 2 2
i i
i =1 i =1
n

x y i i
16800
 ˆ2 = i =1
n
= = 0,5091
x 2 33000
i
i =1
14
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Chất lượng của các ước lượng phụ thuộc:
➢ Phụ thuộc vào kích thước mẫu
➢ Dạng hàm của mô hình được lựa chọn
➢ Phụ thuộc vào các Xi và Ui

15
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 1:
Biến giải thích Xi là phi ngẫu nhiên, các giá trị của
chúng phải được xác định trước.

Giả thiết 2:
Kỳ vọng của yếu tố ngẫu nhiên Ui bằng 0:
E(Ui/Xi) = 0

16
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 3: (Phương sai thuần nhất)
Các Ui có phương sai bằng nhau
Var(Ui/Xi) = Var(Uj/Xj) = σ2 , ∀ i≠j

Giả thiết 4:
Không có sự tương quan giữa các Ui:
Cov(Ui/Uj) = 0 , ∀ i≠j

17
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 5:
Ui và Xi không tương quan với nhau
Cov(Ui/Xi) = 0

Định lý Gauss - Markov: Với 5 giả thiết của


phương pháp OLS, các ước lượng của phương
pháp OLS là các ước lượng tuyến tính, không
chệch và có phương sai nhỏ nhất trong lớp các
ước lượng tuyến tính không chệch.

18
3. PHƯƠNG SAI VÀ SAI SỐ CHUẨN
CỦA CÁC ƯỚC LƯỢNG
Phương sai Sai số chuẩn
n

 i
X 2

Var ( ˆ1 ) =  2ˆ = i =1


n
2 ( )
se( ˆ1 ) =  ˆ = var ˆ1 =  2ˆ
n x
1 1 1
2
i
i =1

Var( ˆ2 ) =  2ˆ =


2
n
( )
se( ˆ2 ) =  ˆ = var ˆ2 =  2ˆ
x
2 2 2
2
i
i =1
Trong đó : 2 = var (Ui). Do 2 chưa biết nên dùng
ước lượng của nó là: n

 ei
2

ˆ 2 = i =1 19
n−2
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Y

Yi ● SRF
Yi - Ŷi
Ŷi Yi − Y
Ŷi − Y
Y

Xi X
20
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Ký hiệu:
( ) = e
n n
RSS =  Yi − Yˆi
2 2
i
i =1 i =1

( ) = (ˆ )  x
n 2 n
ESS =  Yˆi − Y
2 2
2 i
i =1 i =1

TSS =  (Yi − Y ) =  Yi − n(Y )


n n
2 2 2

i =1 i =1

Người ta đã chứng minh được rằng:


TSS = ESS + RSS
21
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Y R2 = ESS/TSS tăng RSS giảm
ESS tăng
Yi ●
Yi - Ŷi
Ŷi Yi − Y
Ŷi − Y
Y

Xi X
22
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Ta định nghĩa: ESS RSS
R =
2
= 1−
TSS TSS
R2 gọi là hệ số xác định và được dùng để đo mức
độ phù hợp của hàm hồi quy

Miền xác định của R2 :


0  R2  1
R2 = 1 : hàm hồi qui phù hợp “hoàn hảo”
R2 = 0 : X và Y không có quan hệ
23
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Từ ví dụ trước, ta tính được:

 i = 132100
Y 2
Y = 111
n

 i = 33000
x 2

i =1
ˆ2 = 0,5091

 TSS =  Y − n(Y )
n

i
2 2
( )
= 132100− 10. 111 = 8890
2

i =1

 ESS = ˆ2 ( ) x 2 n 2
i = (0,5091)  33000 = 8552,73
2

i =1
24
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN

ESS 8552,73
R =2
= = 0,9621
TSS 8890

Trong hàm hồi quy mẫu, biến X (thu nhập) giải


thích 96,21% sự thay đổi của biến Y (chi tiêu)

25
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Hệ số tương quan (r): là số đo mức độ chặt chẽ
của quan hệ tuyến tính giữa X và Y.

r=
 (X − X )(Y − Y )
i i
hay r =
x y i i

 (X − X )  (Y − Y )  x . y
2 2 2 2
i i i i

Có thể chứng minh được: r =  R2


Và dấu của r trùng với dấu của ̂ 2

Với R2 = 0,9621  r = 0,9621 = +0,981


(
ˆ = 0,5091 0
2 ) 26
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Tính chất của hệ số tương quan:
➢ Dấu của r phụ thuộc dấu của hệ số góc
➢ -1≤r≤1
➢ rXY = rYX
➢ r độc lập với gốc tọa độ và các tỷ lệ
➢ Nếu X, Y độc lập ⇒ r = 0
r = 0 ⇏ X, Y độc lập
➢ r không mô tả quan hệ phi tuyến

27
5. PHÂN PHỐI XÁC SUẤT
CỦA CÁC ƯỚC LƯỢNG
Giả thiết 6: Ui có phân phối N(0, σ2)

ˆ ˆ
Với các giả thiết từ 1 – 6, các ước lượng 1 ,  2 , ˆ
2

có các tính chất sau:


1. Chúng là các ước lượng không chệch
2. Có phương sai cực tiểu
3. Khi số quan sát đủ lớn thì các ước lượng này
xấp xỉ giá trị thực của phân phối

28
5. PHÂN PHỐI XÁC SUẤT
CỦA CÁC ƯỚC LƯỢNG
ˆ

ˆ 1 − 1
4. 1 ~ N ( 1 ,  ˆ )  Z =
2
~ N (0,1)
1
 ˆ
1

ˆ −

5. ˆ
 ~ N (  ,  2
)  Z = 2 2
~ N (0,1)
ˆ
 ˆ
2 2 2
2

(n − 2)ˆ 2
6. ~  ( n − 2)
2

 2

(
7. Yi ~ N 1 +  2 X i ,  2 )
29
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.1 Một số khái niệm:

( )
P βˆ 2 −ε  β 2  βˆ 2 + ε = 1 −α
(βˆ 2 − ε; ˆ
β )
2 +ε
là khoảng ngẫu nhiên
1 – α được gọi là hệ số tin cậy/độ tin cậy
α (0 < α < 1) gọi là mức ý nghĩa
ε gọi là độ chính xác của ước lượng (ε > 0)
βˆ 2 − ε là giới hạn tin cậy dưới
βˆ 2 + ε là giới hạn tin cậy trên 30
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.2 Khoảng tin cậy của β2
ˆ2 −  2
t= ~ T (n − 2)
( )
se ˆ2
Sử dụng phân phối của thống kê t, ta thiết lập
được khoảng tin cậy cho β2 với hệ số tin cậy 1-α
như sau:

( ( ) ( ))
P βˆ 2 − tα/2 .se βˆ 2  β 2  βˆ 2 + tα/2 .se βˆ 2 = 1 − α
31
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.3 Khoảng tin cậy của β1
Tương tự, ta có:

( ( ) ( ))
P βˆ 1 − tα/2 .se βˆ 1  β 1  βˆ 1 + tα/2 .se βˆ 1 = 1 − α

Ngắn gọn hơn, với hệ số tin cậy 1-α, khoảng tin


cậy của β1 là:
( )
βˆ 1  tα/2 .se βˆ 1

32
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
f(t)

α/2 1-α α/2

- tα/2 tα/2 t
tα/2 là giá trị của đại lượng ngẫu nhiên T phân phối
theo quy luật Student với bậc tự do (n-2) sao cho
P(|T| > tα/2) = α 33
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
Từ ví dụ trước, ta tính được:
n

 i = 33000
x 2

i =1
X i
2
= 322000

TSS = 8890 ESS = 8552,73


n
 RSS =  ei2 = TSS − ESS = 8890 − 8552,73 = 337,27
i =1
n

i
e 2
337,27
 ˆ = 2
=i =1
= 42,15875
n − 2 10 − 2
34
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
n

 i
X 2
322000
 var( ˆ ) =
1
i =1
n
 =
2
 42,15875 = 41,13672
n xi 2 10x33000
i =1

( )
 se( ˆ1 ) = var ˆ1 = 41,13672 = 6,4138

2 42,15875
 var( ˆ2 ) = n
= = 0,0012775
i 2 33000
x
i =1

( )
 se( ˆ2 ) = var ˆ2 = 0,0012775 = 0,035742
35
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2

Với độ tin cậy 95% thì tα/2(n-2) = t0,025(8) = 2,306

Với ˆ1 = 24,4545 , khoảng tin cậy của β1 là:

( )
β̂1  t α/2 .se β̂1 = 24,4545 2,306 6,4138

hay: (9,6643 < β1 < 39,2448)

36
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2

Với ˆ2 = 0,5091 , khoảng tin cậy của β2 là:

( )
β̂ 2  t α/2 .se β̂ 2 = 0,5091 2,306 0,035742

hay: (0,4268 < β2 < 0,5914)

Với điều kiện các yếu tố khác không thay đổi, khi
thu nhập tăng 1 USD/tuần thì chi tiêu tiêu dùng
trung bình của một gia đình tăng trong khoảng từ
0,4268 đến 0,5914 USD/tuần
37
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.4 Khoảng tin cậy của σ2

 (n − 2 )ˆ 2 (n − 2 ) 
ˆ 2
P  
2
 = 1 − 
  / 2 1− / 2 
2 2

 / 2 ; 
2 2
là các giá trị của đại lượng ngẫu
1− / 2
nhiên 
2
phân phối theo quy luật “Chi bình
phương” với bậc tự do là n – 2 thỏa mãn điều
kiện: P (2
  2
 /2)=  / 2; P (
 2
  2
)
1− / 2 = 1 −  / 2

38
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
1. Một số khái niệm cơ bản:
Giả thiết không: H0: βi = β*
Giả thiết đối: H1: βi ≠ β*

Ví dụ: H0: β2 = 0,8


H1: β2 ≠ 0,8

39
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
2. Phương pháp khoảng tin cậy:
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*

Thiết lập khoảng tin cậy (với độ tin cậy 1-α) cho βi:

(βˆ −  ; βˆ +  )
i i i i với ( )
 i = t / 2 .se ˆi
Quy tắc quyết định:
(
  βˆi −  i ; βˆi +  i

) ⇒ không thể bác bỏ H0

 
 (βˆ −  ; βˆ +  )
i i i i ⇒ bác bỏ H0
40
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
2. Phương pháp khoảng tin cậy:
Ví dụ:
Với ví dụ đã cho, giả sử β2 = 0,3. Ta kiểm định giả
thiết: H0: β2 = 0,3 ; H1: β2 ≠ 0,3

Khoảng tin cậy (với độ tin cậy 95%) của β2:


(0,4268 < β2 < 0,5914)

⇒ bác bỏ H0 (0,3 ∉ (0,4268; 0,5914))

41
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
3. Phương pháp kiểm định mức ý nghĩa:
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*
ˆ
i −  
Bước 1: Tính giá trị t =
( )
se ˆi
Bước 2: Tra bảng phân phối Student với mức ý
nghĩa α/2 và bậc tự do (n-2) để tìm tα/2
Bước 3: Quyết định:
Nếu |t| > tα/2 ⇒ Bác bỏ H0
Nếu |t| < tα/2 ⇒ Không thể bác bỏ H0 42
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
Ví dụ 1:
Kiểm định giả thiết H0: β2 = 0,3 ; H1: β2 ≠ 0,3
ˆ
2 −  
0,5091− 0,3
t= = = 5,85
Bước 1:
( )
se ˆ2 0,035742
Bước 2: Vì có n=10 quan sát ⇒ bậc tự do là 8.
Với mức ý nghĩa α=5%, tra bảng ta được:
tα/2 (n-2) = t0,025 (8) = 2,306

Bước 3: Vì |t| > tα/2 ⇒ Bác bỏ H0


43
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
Ví dụ 2:
Kiểm định giả thiết H0: β2 = 0 ; H1: β2 ≠ 0
ˆ
2 −  
0,5091− 0
Bước 1: t = = = 14,243
( )
se ˆ2 0,035742
Bước 2: tα/2 (n-2) = t0,025 (8) = 2,306

Bước 3: Vì |t| > tα/2 ⇒ Bác bỏ H0


Vì β2 ≠ 0, vậy biến thu nhập thực sự ảnh hưởng tới
biến chi tiêu
44
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY

Quy tắc quyết định đối với kiểm định giả thiết về βi :

Loại giả thiết H0 H1 Miền bác bỏ


Hai phía βi = β* βi ≠ β* |t| > tα/2
Phía phải βi ≤ β* βi > β* t > tα
Phía trái βi ≥ β* βi < β* t < - tα

45
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
3. Phương pháp kiểm định mức ý nghĩa (giá trị
p-value):
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*
ˆi −  
t=
Bước 1: Tính giá trị
( )
se ˆi
Bước 2: Tính p-value = P(|T| > t)
(p-value được tính bởi phần mềm ứng dụng)
Bước 3: Cho trước mức ý nghĩa α:
Nếu p-value < α ⇒ Bác bỏ H0
Nếu p-value > α ⇒ Không thể bác bỏ H0 46
8. KIỂM ĐỊNH SỰ PHÙ HỢP
CỦA HÀM HỒI QUY
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0
R (n − 2 )
2
Bước 1: Tính F =
1− R 2

Bước 2: Tìm giá trị tới hạn Fα(1, n-2) (tra bảng F
với mức ý nghĩa α và hai bậc tự do (1, n-2))

Bước 3: So sánh F và Fα(1, n-2) :


Nếu F > Fα(1, n-2) ⇒ Bác bỏ H0
Nếu F < Fα(1, n-2) ⇒ Không thể bác bỏ H0
47
8. KIỂM ĐỊNH SỰ PHÙ HỢP
CỦA HÀM HỒI QUY
Ví dụ: Từ ví dụ trước, ta tính được R2 = 0,9621.
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0
R 2 (n − 2) 0,9621 (10 − 2)
Bước 1: Tính F = = = 203,08
1− R 2
1 − 0,9621
Bước 2: Fα (1, n-2) = F0,05 (1, 8) = 5,32

Bước 3: Vì F > Fα (1, n-2) ⇒ Bác bỏ H0

➔ Hàm hồi quy mẫu SRF phù hợp với mẫu khảo sát
48
8. KIỂM ĐỊNH SỰ PHÙ HỢP
CỦA HÀM HỒI QUY
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0 theo
phương pháp p-value
R 2 (n − 2)
Bước 1: Tính F0 =
1− R2
Bước 2: Tính p-value = P(F > F0),
(p-value được tính bởi phần mềm ứng dụng)
Bước 3: So sánh p-value và mức ý nghĩa α:
Nếu p-value < α ⇒ Bác bỏ H0
Nếu p-value > α ⇒ Không thể bác bỏ H0
49
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị trung bình
Cho X = X0, dự báo E(Y/X0) = β1 + β2X0
Ước lượng điểm của E(Y/X0) là : Yˆ0 = ˆ1 + ˆ2 X 0
Dự báo khoảng của E(Y/X0) là :
ˆ 0 − t α/2 .se(Y
Y ˆ 0 )  E(Y/X0 )  Y
ˆ 0 + t α/2 .se(Y
ˆ0)
 
 1 (X − X )2 
( )
Trong đó: var Yˆ0 =   + 0n
2
( )
; se Yˆ0 = var Yˆ0 ( )
n 
 
i =1
xi
2
 50
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị riêng biệt
Cho X = X0, dự báo Y0
Ta có : Yˆ0 = ˆ1 + ˆ2 X 0
 
 1 (X − X )2 
( )
var Y0 − Yˆ0 =  2 1 + + 0n ( ) (
; se Y0 − Yˆ0 = var Y0 − Yˆ0 )
 n 
 i =1
xi
2


Dự báo giá trị riêng biệt Y0 khi X = X0 là :


ˆ 0 − tα/2 .se(Y0 − Y
Y ˆ 0 )  Y0  Y
ˆ 0 + tα/2 .se(Y0 − Y
ˆ0)
51
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Ví dụ: Theo ví dụ trước, ta có hàm hồi quy mẫu
Yˆi = 24,4545+ 0,5091. X i
Dự báo giá trị trung bình và giá trị riêng biệt của
chi tiêu tiêu dùng khi thu nhập ở mức 100
USD/tuần (X0) với hệ số tin cậy 95%

Ta đã có: t0,025 (8) = 2,306

Yˆ0 = ˆ1 + ˆ2 X 0 = 24,4545+ 0,5091100 = 75,3645


52
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị trung bình

1 (100 − 170) 
( )  2
ˆ
var Y0 = 42,15875 +  = 10,4758
10 33000 

( ) ( )
 se Yˆ0 = var Yˆ0 = 10,4578 = 3,2366

Vậy, dự báo khoảng của E(Y/X=100) là :


75,3645 2,306 3,2366
hay: (67,9 < E(Y/X=100) < 82,8)
53
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị riêng biệt

( )  1
var Y0 − Yˆ0 = 42,158751 + +
(100 − 170)2

 = 52,63456
 10 33000 

( ) ( )
 se Y0 − Yˆ0 = var Y0 − Yˆ0 = 52,63456 = 7,25497

Vậy, dự báo khoảng của Y0 là :


75,3645  2,306 7,25497
hay: (58,6 < Y0 < 92,1)
54
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Y Khoảng tin cậy
SRF
của giá trị trung bình

92,1

82,9 ●

Khoảng tin cậy


67,9 ●
của giá trị cá biệt

58,6

55
0 100 X=170 X
10. TRÌNH BÀY KẾT QUẢ
PHÂN TÍCH HỒI QUY

Ŷi = 24,4545 + 0,5091 Xi R2 = 0,9621


se = (6,4138) (0,0357) df = 8
t = (3,813) (14,243) F(1,8) = 203,08
p = (0,005) (0,000) p = (0,000)

56
11. ĐÁNH GIÁ KẾT QUẢ
PHÂN TÍCH HỒI QUY
➢ Dấu của các hệ số hồi quy ước lượng có phù
hợp với lý thuyết hay tiên nghiệm hay không.
➢ Các hệ số hồi quy ước lượng có ý nghĩa về mặt
thống kê hay không.
➢ Mức độ phù hợp của mô hình (R2).
➢ Kiểm tra xem mô hình có thỏa mãn các giả thiết
của mô hình hồi quy tuyến tính cổ điển hay
không.
57
VÍ DỤ

Giả sử có số liệu về lãi suất ngân hàng (X –


%/năm) và tổng vốn đầu tư (Y – tỷ đồng) trên địa
bàn tỉnh A qua 10 năm liên tiếp như sau:

Xi 7,0 6,5 6,5 6,0 6,0 6,0 5,5 5,5 5,0 4,5
Yi 28 32 30 34 32 35 40 42 48 50

58
VÍ DỤ
Yêu cầu:
1. Lập mô hình hồi quy tuyến tính mô tả quan hệ
giữa tổng vốn đầu tư và lãi suất ngân hàng.
Nêu ý nghĩa kinh tế của hệ số hồi quy ước
lượng được.
2. Kiểm định giả thiết hệ số hồi quy của X trong
hàm hồi quy tổng thể bằng 0 với mức ý nghĩa
2% và nêu ý nghĩa kết quả.
3. Với mức ý nghĩa 5%, có thể xem hệ số góc của
mô hình hồi quy bằng -11 được không?

59
VÍ DỤ
Yêu cầu
4. Xác định khoảng tin cậy của hệ số góc, với độ
tin cậy 90%.
5. Xác định khoảng tin cậy của hệ số chặn, với độ
tin cậy 95%.
6. Kiểm định giả thiết hệ số chặn của mô hình hồi
quy bằng 0 với mức ý nghĩa 5%.

60
VÍ DỤ
Yêu cầu
7. Đánh giá mức độ phù hợp của mô hình hồi quy
ước lượng được với mức ý nghĩa 1%.
8. Xác định khoảng tin cậy cho phương sai của
nhiễu, với độ tin cậy 95%.
9. Trình bày kết quả hồi quy của các kết quả tính
được.

61
VÍ DỤ
Trước tiên, ta đặt giả thiết:
➢ Tổng vốn đầu tư (Y) phụ thuộc vào lãi suất
ngân hàng (X)
➢ Mối quan hệ này là tuyến tính

62
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính

X i = 7,0 + 6,5 + ... + 4,5 = 58,5

Y = 28 + 32 + ... + 50 = 371
i

 X Y = 7,0  28 + 6,5  32 + ... + 4,5  50 = 2121


i i

X = (7,0 ) + (6,5) + ... + (4,5) = 347,25


2 2 2 2
i

Y = (28) + (32) + ... + (50) = 14281


2 2 2 2
i

63
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
Như vậy, ta có:

X=
 X i
=
58,5
= 5,85 Y =
 Y
=
i 371
= 37,1
n 10 n 10

 i = 347,25
X 2
 i = 14281
Y 2
 X Y = 2121
i i

x = X − n(X ) = 347,25 − 10  (5,85) = 5,025


2 2 2 2
i i

64
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
n

 X Y − nX .Y
i i
2121− 10  5,85  37,1
 ˆ2 = i =1
= = −9,8209
− n( X ) 347,25 − 10  (5,85)
n 2

X 2 2
i
i =1

 ˆ1 = Y − ˆ2 X = 37,1 − (− 9,8209) 5,85 = 94,5522

 Yˆi = 94,5522 − 9,8209. X i


65
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
Ý nghĩa của hệ số hồi quy:
➢ β̂2 = −9,8209 : khi lãi suất ngân hàng tăng 1%
thì lượng vốn đầu tư trung bình ở tỉnh A có xu
hướng giảm tương ứng xấp xỉ 9,8209 tỷ đồng
(trong điều kiện các yếu tố khác không đổi).
➢ Khi lãi suất ngân hàng càng giảm thì vốn đầu tư
có xu hướng càng tăng. Khi lãi suất tiến về 0 thì
vốn đầu tư tiến về giá trị lớn nhất. Vậy:
β̂1 = 94,5522 : phản ánh lượng vốn đầu tư
trung bình tối đa trên địa bàn tỉnh A.

66
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%

TSS =  Yi − n(Y ) = 14281− 10  (37,1) = 516,9


n
2 2 2

i =1

( ) x
ESS = ˆ2
2 n 2
i = (− 9,8209)  5,025 = 484,6616
2

i =1

n
RSS =  ei2 = TSS − ESS = 516,9 − 484,6616 = 32,2384
i =1

67
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%
n

e 2
i
32,2384
 ˆ =
2
=
i =1
= 4,0298
n−2 10 − 2

2 4,0289
 var( ˆ2 ) = n
= = 0,8019
i 2 5,025
x
i =1

( )
 se( ˆ2 ) = var ˆ2 = 0,8019 = 0,8955

68
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%

Kiểm định giả thiết H0: β2 = 0 ; H1: β2 ≠ 0

ˆ
2 −  
− 9,8209 − 0
t= = = −10,9669
Bước 1:
( )
se ˆ2 0,8955
Bước 2: tα/2 (n-2) = t0,01 (8) = 2,896

Bước 3: Vì |t| > tα/2 ⇒ Bác bỏ H0


Vì β2 ≠ 0, vậy biến lãi suất ngân hàng thực sự có
ảnh hưởng đến lượng vốn đầu tư
69
VÍ DỤ
3. Kiểm định β2 = -11 với α = 5%

Kiểm định giả thiết H0: β2 = -11 ; H1: β2 ≠ -11

ˆ
2 −  
− 9,8209 − (− 11)
Bước 1: t = = = 1,3166
( )
se ˆ2 0,8955
Bước 2: tα/2 (n-2) = t0,025 (8) = 2,306

Bước 3: Vì |t| < tα/2 ⇒ Không thể bác bỏ H0


Vậy, có thể xem β2 = -11
70
VÍ DỤ
4. Khoảng tin cậy của β2 với 1-α = 90%

Với độ tin cậy 90% thì tα/2(n-2) = t0,05(8) = 1,860

Với ˆ2 = −9,8209 , khoảng tin cậy của β2 là:

( )
βˆ2  tα/ 2.se βˆ2 = −9,8209 1,860 0,8955

hay: (- 11,4865 < β2 < - 8,1553)

71
VÍ DỤ
5. Khoảng tin cậy của β1 với 1-α = 95%

 i
X 2
347,25
 var( ˆ ) = i =1
 =
2
 4,0298 = 27,8477
10  5,025
1 n
n xi 2

i =1

( )
 se( ˆ1 ) = var ˆ1 = 27,8477 = 5,2771

72
VÍ DỤ
5. Khoảng tin cậy của β1 với 1-α = 95%

Với độ tin cậy 95% thì tα/2(n-2) = t0,025(8) = 2,306

Với ˆ1 = 94,5522 , khoảng tin cậy của β1 là:

( )
βˆ1  tα/ 2.se βˆ1 = 94,5522  2,306 5,2771

hay: (82,3832 < β1 < 106,7212)

73
VÍ DỤ
6. Kiểm định β1 = 0 với α = 5%

Kiểm định giả thiết H0: β1 = 0 ; H1: β1 ≠ 0

Theo câu 5, ta có khoảng tin cậy của β1 với độ tin


cậy 95% là (82,3832 ; 106,7212)

Giá trị 0 không thuộc khoảng tin cậy này, vậy ta


bác bỏ giả thiết H0

74
VÍ DỤ
7. Mức độ phù hợp của mô hình

Để đánh giá mức độ phù hợp của mô hình hồi quy


ước lượng với mức ý nghĩa 1%, ta cần tính R2 và
kiểm định ý nghĩa thống kê của giá trị tìm được

ESS 484,6616
R =
2
= = 0,9376
TSS 516,9

75
VÍ DỤ
7. Mức độ phù hợp của mô hình
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0
R 2 (n − 2) 0,9376 (10 − 2)
Bước 1: Tính F = = = 120,2051
1− R 2
1 − 0,9376
Bước 2: Fα (1, n-2) = F0,01 (1, 8) = 11,3
Bước 3: Vì F > Fα (1, n-2) ⇒ Bác bỏ H0
➔ Hàm hồi quy mẫu SRF phù hợp với mẫu khảo sát
Vậy, yếu tố lãi suất ngân hàng giải thích được
93,76% sự thay đổi của lượng vốn đầu tư
76
VÍ DỤ
8. Khoảng tin cậy của σ2 với 1-α = 95%
Với độ tin cậy 1 - α = 0,95, ta có :
2 / 2 (n − 2) =  02,025 (8) = 17,5
1− / 2 (n − 2) =  0,975 (8) = 2,18
2 2

Vậy khoảng tin cậy của σ2 là :


 (n − 2 )ˆ 2 (n − 2 )ˆ 2 
 ; 
  / 2 1− / 2 
2 2

 (10 − 2) 4,0298 (10 − 2) 4,0298


~  ; 
 17,5 2,18 
~ (1,8421 ; 14,7882) 77
VÍ DỤ
9. Trình bày kết quả hồi quy
ˆ1 94,5522
Ta tính được: t1 = = = 17,9174
( )
se ˆ1 5,2771

Kết quả phân tích hồi quy:

Ŷi = 94,5522 - 9,8209 Xi R2 = 0,9376


se = (5,2771) (0,8955) df = 8
t = (17,9174) (-10,9669) F(1,8) = 120,2051
p = (0,000) (0,000) p = (0,000)
78
79

You might also like