Professional Documents
Culture Documents
1
NỘI DUNG CHƯƠNG 2
1
2 Phương pháp bình phương nhỏ nhất (OLS)
2
NỘI DUNG CHƯƠNG 2
5
2 Phân phối xác suất của các ước lượng
3
NỘI DUNG CHƯƠNG 2
9
2 Ứng dụng của phân tích hồi quy
4
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
E (Y / X i ) = 1 + 2 X i
PRF
Yi = E (Y / X i ) + U i = 1 + 2 X i + U i
5
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
●
●
● ● ●
● ● ●
● ● ●
● ●●
● ● ● ● ●
● ●● ●
● ●●
● ● ● ● ●●
● ● ●
● ●●
6
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Y ●
●
● SRF
Yi ●
●
ei e7
●
Ŷi ●
●
e1
●
X
7
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Mẫu: n cặp quan sát (Yi, Xi), i = 1, n
Theo phương pháp OLS, tìm Ŷi càng gần với Yi
càng tốt
( )
n n
i 1 2 i
ˆ − ˆ X 2
e = Y −
2
i ➔ min
i =1 i =1
8
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Vậy, cần tìm ˆ , ˆ sao cho:
1 2
( ) ( )
n
f 1 , 2 = Yi − 1 − 2 X i min
ˆ ˆ ˆ ˆ 2
i =1
n n
X Y − nX .Y x y
i i i i
̂ 2 = i =1
= i =1
ˆ1 = Y − ˆ2 X
− n( X )
n n
X x
2 2 2
i i
i =1 i =1
Với: xi = X i − X yi = Yi − Y
9
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
10
Ta có bảng tính sau:
Obs Xi Yi Xi2 Yi2 Xi.Yi
1 80 70 6400 4900 5600
2 100 65 10000 4225 6500
3 120 90 14400 8100 10800
4 140 95 19600 9025 13300
5 160 110 25600 12100 17600
6 180 115 32400 13225 20700
7 200 120 40000 14400 24000
8 220 140 48400 19600 30800
9 240 155 57600 24025 37200
10 260 150 67600 22500 39000
Tổng 1700 1110 322000 132100 205500
11
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Như vậy, ta có:
X=
X i
=
1700
= 170 Y =
Y i
=
1110
= 111
n 10 n 10
X i
2
= 322000 i = 132100
Y 2
X Y = 205500
i i
12
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
n
X Y − nX .Y
i i
205500− 10.170.111
ˆ2 = i =1
= = 0,5091
− n( X ) 322000− 10.(170)
n 2
X 2 2
i
i =1
13
1. PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT (OLS)
Có thể tìm ̂ 2 như sau:
n n
x y = X Y − nX .Y = 205500−10.170.111 = 16800
i =1
i i
i =1
i i
x = X 2 2 2 2
i i
i =1 i =1
n
x y i i
16800
ˆ2 = i =1
n
= = 0,5091
x 2 33000
i
i =1
14
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Chất lượng của các ước lượng phụ thuộc:
➢ Phụ thuộc vào kích thước mẫu
➢ Dạng hàm của mô hình được lựa chọn
➢ Phụ thuộc vào các Xi và Ui
15
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 1:
Biến giải thích Xi là phi ngẫu nhiên, các giá trị của
chúng phải được xác định trước.
Giả thiết 2:
Kỳ vọng của yếu tố ngẫu nhiên Ui bằng 0:
E(Ui/Xi) = 0
16
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 3: (Phương sai thuần nhất)
Các Ui có phương sai bằng nhau
Var(Ui/Xi) = Var(Uj/Xj) = σ2 , ∀ i≠j
Giả thiết 4:
Không có sự tương quan giữa các Ui:
Cov(Ui/Uj) = 0 , ∀ i≠j
17
2. CÁC GIẢ THIẾT CỦA PHƯƠNG PHÁP
BÌNH PHƯƠNG NHỎ NHẤT
Giả thiết 5:
Ui và Xi không tương quan với nhau
Cov(Ui/Xi) = 0
18
3. PHƯƠNG SAI VÀ SAI SỐ CHUẨN
CỦA CÁC ƯỚC LƯỢNG
Phương sai Sai số chuẩn
n
i
X 2
ei
2
ˆ 2 = i =1 19
n−2
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Y
Yi ● SRF
Yi - Ŷi
Ŷi Yi − Y
Ŷi − Y
Y
Xi X
20
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Ký hiệu:
( ) = e
n n
RSS = Yi − Yˆi
2 2
i
i =1 i =1
( ) = (ˆ ) x
n 2 n
ESS = Yˆi − Y
2 2
2 i
i =1 i =1
i =1 i =1
Xi X
22
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Ta định nghĩa: ESS RSS
R =
2
= 1−
TSS TSS
R2 gọi là hệ số xác định và được dùng để đo mức
độ phù hợp của hàm hồi quy
i = 132100
Y 2
Y = 111
n
i = 33000
x 2
i =1
ˆ2 = 0,5091
TSS = Y − n(Y )
n
i
2 2
( )
= 132100− 10. 111 = 8890
2
i =1
ESS = ˆ2 ( ) x 2 n 2
i = (0,5091) 33000 = 8552,73
2
i =1
24
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
ESS 8552,73
R =2
= = 0,9621
TSS 8890
25
4. HỆ SỐ XÁC ĐỊNH &
HỆ SỐ TƯƠNG QUAN
Hệ số tương quan (r): là số đo mức độ chặt chẽ
của quan hệ tuyến tính giữa X và Y.
r=
(X − X )(Y − Y )
i i
hay r =
x y i i
(X − X ) (Y − Y ) x . y
2 2 2 2
i i i i
27
5. PHÂN PHỐI XÁC SUẤT
CỦA CÁC ƯỚC LƯỢNG
Giả thiết 6: Ui có phân phối N(0, σ2)
ˆ ˆ
Với các giả thiết từ 1 – 6, các ước lượng 1 , 2 , ˆ
2
28
5. PHÂN PHỐI XÁC SUẤT
CỦA CÁC ƯỚC LƯỢNG
ˆ
ˆ 1 − 1
4. 1 ~ N ( 1 , ˆ ) Z =
2
~ N (0,1)
1
ˆ
1
ˆ −
5. ˆ
~ N ( , 2
) Z = 2 2
~ N (0,1)
ˆ
ˆ
2 2 2
2
(n − 2)ˆ 2
6. ~ ( n − 2)
2
2
(
7. Yi ~ N 1 + 2 X i , 2 )
29
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.1 Một số khái niệm:
( )
P βˆ 2 −ε β 2 βˆ 2 + ε = 1 −α
(βˆ 2 − ε; ˆ
β )
2 +ε
là khoảng ngẫu nhiên
1 – α được gọi là hệ số tin cậy/độ tin cậy
α (0 < α < 1) gọi là mức ý nghĩa
ε gọi là độ chính xác của ước lượng (ε > 0)
βˆ 2 − ε là giới hạn tin cậy dưới
βˆ 2 + ε là giới hạn tin cậy trên 30
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.2 Khoảng tin cậy của β2
ˆ2 − 2
t= ~ T (n − 2)
( )
se ˆ2
Sử dụng phân phối của thống kê t, ta thiết lập
được khoảng tin cậy cho β2 với hệ số tin cậy 1-α
như sau:
( ( ) ( ))
P βˆ 2 − tα/2 .se βˆ 2 β 2 βˆ 2 + tα/2 .se βˆ 2 = 1 − α
31
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.3 Khoảng tin cậy của β1
Tương tự, ta có:
( ( ) ( ))
P βˆ 1 − tα/2 .se βˆ 1 β 1 βˆ 1 + tα/2 .se βˆ 1 = 1 − α
32
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
f(t)
- tα/2 tα/2 t
tα/2 là giá trị của đại lượng ngẫu nhiên T phân phối
theo quy luật Student với bậc tự do (n-2) sao cho
P(|T| > tα/2) = α 33
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
Từ ví dụ trước, ta tính được:
n
i = 33000
x 2
i =1
X i
2
= 322000
i
e 2
337,27
ˆ = 2
=i =1
= 42,15875
n − 2 10 − 2
34
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
n
i
X 2
322000
var( ˆ ) =
1
i =1
n
=
2
42,15875 = 41,13672
n xi 2 10x33000
i =1
( )
se( ˆ1 ) = var ˆ1 = 41,13672 = 6,4138
2 42,15875
var( ˆ2 ) = n
= = 0,0012775
i 2 33000
x
i =1
( )
se( ˆ2 ) = var ˆ2 = 0,0012775 = 0,035742
35
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
( )
β̂1 t α/2 .se β̂1 = 24,4545 2,306 6,4138
36
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
( )
β̂ 2 t α/2 .se β̂ 2 = 0,5091 2,306 0,035742
Với điều kiện các yếu tố khác không thay đổi, khi
thu nhập tăng 1 USD/tuần thì chi tiêu tiêu dùng
trung bình của một gia đình tăng trong khoảng từ
0,4268 đến 0,5914 USD/tuần
37
6. KHOẢNG TIN CẬY CỦA β1; β2; σ2
6.4 Khoảng tin cậy của σ2
(n − 2 )ˆ 2 (n − 2 )
ˆ 2
P
2
= 1 −
/ 2 1− / 2
2 2
/ 2 ;
2 2
là các giá trị của đại lượng ngẫu
1− / 2
nhiên
2
phân phối theo quy luật “Chi bình
phương” với bậc tự do là n – 2 thỏa mãn điều
kiện: P (2
2
/2)= / 2; P (
2
2
)
1− / 2 = 1 − / 2
38
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
1. Một số khái niệm cơ bản:
Giả thiết không: H0: βi = β*
Giả thiết đối: H1: βi ≠ β*
39
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
2. Phương pháp khoảng tin cậy:
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*
Thiết lập khoảng tin cậy (với độ tin cậy 1-α) cho βi:
(βˆ − ; βˆ + )
i i i i với ( )
i = t / 2 .se ˆi
Quy tắc quyết định:
(
βˆi − i ; βˆi + i
) ⇒ không thể bác bỏ H0
(βˆ − ; βˆ + )
i i i i ⇒ bác bỏ H0
40
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
2. Phương pháp khoảng tin cậy:
Ví dụ:
Với ví dụ đã cho, giả sử β2 = 0,3. Ta kiểm định giả
thiết: H0: β2 = 0,3 ; H1: β2 ≠ 0,3
41
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
3. Phương pháp kiểm định mức ý nghĩa:
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*
ˆ
i −
Bước 1: Tính giá trị t =
( )
se ˆi
Bước 2: Tra bảng phân phối Student với mức ý
nghĩa α/2 và bậc tự do (n-2) để tìm tα/2
Bước 3: Quyết định:
Nếu |t| > tα/2 ⇒ Bác bỏ H0
Nếu |t| < tα/2 ⇒ Không thể bác bỏ H0 42
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
Ví dụ 1:
Kiểm định giả thiết H0: β2 = 0,3 ; H1: β2 ≠ 0,3
ˆ
2 −
0,5091− 0,3
t= = = 5,85
Bước 1:
( )
se ˆ2 0,035742
Bước 2: Vì có n=10 quan sát ⇒ bậc tự do là 8.
Với mức ý nghĩa α=5%, tra bảng ta được:
tα/2 (n-2) = t0,025 (8) = 2,306
Quy tắc quyết định đối với kiểm định giả thiết về βi :
45
7. KIỂM ĐỊNH GIẢ THIẾT
VỀ CÁC HỆ SỐ HỒI QUY
3. Phương pháp kiểm định mức ý nghĩa (giá trị
p-value):
Kiểm định giả thiết: H0: βi = β* ; H1: βi ≠ β*
ˆi −
t=
Bước 1: Tính giá trị
( )
se ˆi
Bước 2: Tính p-value = P(|T| > t)
(p-value được tính bởi phần mềm ứng dụng)
Bước 3: Cho trước mức ý nghĩa α:
Nếu p-value < α ⇒ Bác bỏ H0
Nếu p-value > α ⇒ Không thể bác bỏ H0 46
8. KIỂM ĐỊNH SỰ PHÙ HỢP
CỦA HÀM HỒI QUY
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0
R (n − 2 )
2
Bước 1: Tính F =
1− R 2
Bước 2: Tìm giá trị tới hạn Fα(1, n-2) (tra bảng F
với mức ý nghĩa α và hai bậc tự do (1, n-2))
➔ Hàm hồi quy mẫu SRF phù hợp với mẫu khảo sát
48
8. KIỂM ĐỊNH SỰ PHÙ HỢP
CỦA HÀM HỒI QUY
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0 theo
phương pháp p-value
R 2 (n − 2)
Bước 1: Tính F0 =
1− R2
Bước 2: Tính p-value = P(F > F0),
(p-value được tính bởi phần mềm ứng dụng)
Bước 3: So sánh p-value và mức ý nghĩa α:
Nếu p-value < α ⇒ Bác bỏ H0
Nếu p-value > α ⇒ Không thể bác bỏ H0
49
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị trung bình
Cho X = X0, dự báo E(Y/X0) = β1 + β2X0
Ước lượng điểm của E(Y/X0) là : Yˆ0 = ˆ1 + ˆ2 X 0
Dự báo khoảng của E(Y/X0) là :
ˆ 0 − t α/2 .se(Y
Y ˆ 0 ) E(Y/X0 ) Y
ˆ 0 + t α/2 .se(Y
ˆ0)
1 (X − X )2
( )
Trong đó: var Yˆ0 = + 0n
2
( )
; se Yˆ0 = var Yˆ0 ( )
n
i =1
xi
2
50
9. ỨNG DỤNG CỦA PHÂN TÍCH HỒI QUY
VẤN ĐỀ DỰ BÁO
Dự báo giá trị riêng biệt
Cho X = X0, dự báo Y0
Ta có : Yˆ0 = ˆ1 + ˆ2 X 0
1 (X − X )2
( )
var Y0 − Yˆ0 = 2 1 + + 0n ( ) (
; se Y0 − Yˆ0 = var Y0 − Yˆ0 )
n
i =1
xi
2
1 (100 − 170)
( ) 2
ˆ
var Y0 = 42,15875 + = 10,4758
10 33000
( ) ( )
se Yˆ0 = var Yˆ0 = 10,4578 = 3,2366
( ) 1
var Y0 − Yˆ0 = 42,158751 + +
(100 − 170)2
= 52,63456
10 33000
( ) ( )
se Y0 − Yˆ0 = var Y0 − Yˆ0 = 52,63456 = 7,25497
92,1
●
82,9 ●
55
0 100 X=170 X
10. TRÌNH BÀY KẾT QUẢ
PHÂN TÍCH HỒI QUY
56
11. ĐÁNH GIÁ KẾT QUẢ
PHÂN TÍCH HỒI QUY
➢ Dấu của các hệ số hồi quy ước lượng có phù
hợp với lý thuyết hay tiên nghiệm hay không.
➢ Các hệ số hồi quy ước lượng có ý nghĩa về mặt
thống kê hay không.
➢ Mức độ phù hợp của mô hình (R2).
➢ Kiểm tra xem mô hình có thỏa mãn các giả thiết
của mô hình hồi quy tuyến tính cổ điển hay
không.
57
VÍ DỤ
Xi 7,0 6,5 6,5 6,0 6,0 6,0 5,5 5,5 5,0 4,5
Yi 28 32 30 34 32 35 40 42 48 50
58
VÍ DỤ
Yêu cầu:
1. Lập mô hình hồi quy tuyến tính mô tả quan hệ
giữa tổng vốn đầu tư và lãi suất ngân hàng.
Nêu ý nghĩa kinh tế của hệ số hồi quy ước
lượng được.
2. Kiểm định giả thiết hệ số hồi quy của X trong
hàm hồi quy tổng thể bằng 0 với mức ý nghĩa
2% và nêu ý nghĩa kết quả.
3. Với mức ý nghĩa 5%, có thể xem hệ số góc của
mô hình hồi quy bằng -11 được không?
59
VÍ DỤ
Yêu cầu
4. Xác định khoảng tin cậy của hệ số góc, với độ
tin cậy 90%.
5. Xác định khoảng tin cậy của hệ số chặn, với độ
tin cậy 95%.
6. Kiểm định giả thiết hệ số chặn của mô hình hồi
quy bằng 0 với mức ý nghĩa 5%.
60
VÍ DỤ
Yêu cầu
7. Đánh giá mức độ phù hợp của mô hình hồi quy
ước lượng được với mức ý nghĩa 1%.
8. Xác định khoảng tin cậy cho phương sai của
nhiễu, với độ tin cậy 95%.
9. Trình bày kết quả hồi quy của các kết quả tính
được.
61
VÍ DỤ
Trước tiên, ta đặt giả thiết:
➢ Tổng vốn đầu tư (Y) phụ thuộc vào lãi suất
ngân hàng (X)
➢ Mối quan hệ này là tuyến tính
62
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
Y = 28 + 32 + ... + 50 = 371
i
63
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
Như vậy, ta có:
X=
X i
=
58,5
= 5,85 Y =
Y
=
i 371
= 37,1
n 10 n 10
i = 347,25
X 2
i = 14281
Y 2
X Y = 2121
i i
64
VÍ DỤ
1. Lập mô hình hồi quy tuyến tính
n
X Y − nX .Y
i i
2121− 10 5,85 37,1
ˆ2 = i =1
= = −9,8209
− n( X ) 347,25 − 10 (5,85)
n 2
X 2 2
i
i =1
66
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%
i =1
( ) x
ESS = ˆ2
2 n 2
i = (− 9,8209) 5,025 = 484,6616
2
i =1
n
RSS = ei2 = TSS − ESS = 516,9 − 484,6616 = 32,2384
i =1
67
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%
n
e 2
i
32,2384
ˆ =
2
=
i =1
= 4,0298
n−2 10 − 2
2 4,0289
var( ˆ2 ) = n
= = 0,8019
i 2 5,025
x
i =1
( )
se( ˆ2 ) = var ˆ2 = 0,8019 = 0,8955
68
VÍ DỤ
2. Kiểm định β2 = 0 với α = 2%
ˆ
2 −
− 9,8209 − 0
t= = = −10,9669
Bước 1:
( )
se ˆ2 0,8955
Bước 2: tα/2 (n-2) = t0,01 (8) = 2,896
ˆ
2 −
− 9,8209 − (− 11)
Bước 1: t = = = 1,3166
( )
se ˆ2 0,8955
Bước 2: tα/2 (n-2) = t0,025 (8) = 2,306
( )
βˆ2 tα/ 2.se βˆ2 = −9,8209 1,860 0,8955
71
VÍ DỤ
5. Khoảng tin cậy của β1 với 1-α = 95%
i
X 2
347,25
var( ˆ ) = i =1
=
2
4,0298 = 27,8477
10 5,025
1 n
n xi 2
i =1
( )
se( ˆ1 ) = var ˆ1 = 27,8477 = 5,2771
72
VÍ DỤ
5. Khoảng tin cậy của β1 với 1-α = 95%
( )
βˆ1 tα/ 2.se βˆ1 = 94,5522 2,306 5,2771
73
VÍ DỤ
6. Kiểm định β1 = 0 với α = 5%
74
VÍ DỤ
7. Mức độ phù hợp của mô hình
ESS 484,6616
R =
2
= = 0,9376
TSS 516,9
75
VÍ DỤ
7. Mức độ phù hợp của mô hình
Kiểm định giả thiết: H0: R2 = 0; H1: R2 ≠ 0
R 2 (n − 2) 0,9376 (10 − 2)
Bước 1: Tính F = = = 120,2051
1− R 2
1 − 0,9376
Bước 2: Fα (1, n-2) = F0,01 (1, 8) = 11,3
Bước 3: Vì F > Fα (1, n-2) ⇒ Bác bỏ H0
➔ Hàm hồi quy mẫu SRF phù hợp với mẫu khảo sát
Vậy, yếu tố lãi suất ngân hàng giải thích được
93,76% sự thay đổi của lượng vốn đầu tư
76
VÍ DỤ
8. Khoảng tin cậy của σ2 với 1-α = 95%
Với độ tin cậy 1 - α = 0,95, ta có :
2 / 2 (n − 2) = 02,025 (8) = 17,5
1− / 2 (n − 2) = 0,975 (8) = 2,18
2 2