Professional Documents
Culture Documents
1
HỒI QUY ĐƠN BIẾN
2
NỘI DUNG
1 Mô hình
5 Ví dụ
3
Ví dụ
Cho số liệu về số lượng gạo bán (tấn) hàng tháng của 6 cửa
hàng gạo. Nếu anh A mở một của hàng gạo thì dự báo
lượng gạo bán hàng tháng.
8
2.1 MÔ HÌNH
Y SRF
ˆ2
PRF
2
1
ˆ1
X
Hình 2.1: Hệ số hồi quy trong hàm hồi quy PRF và SRF
9
2.2 PHƯƠNG PHÁP OLS
Giả sử có n cặp quan sát (Xi, Yi). Tìm giá trị Ŷi sao
cho Ŷi gần giá trị Yi nhất, tức ei= |Yi - Ŷi| càng nhỏ
càng tốt.
Tuy nhiên, ei thường rất nhỏ và thậm chí bằng 0
vì chúng triệt tiêu lẫn nhau. Để tránh tình trạng này,
ta dùng phương pháp bình phương nhỏ nhất (
Ordinary least squares OLS ).
Với n cặp quan sát, muốn
2
n n
ˆ ˆ2 X i
e
i 1
2
i Y
i 1
i 1 min(*)
10
2.2 PHƯƠNG PHÁP OLS
Điều kiện (*) có nghĩa tổng bình phương các sai lệch
giữa giá trị thực tế (Yi ) và giá trị tính theo hàm hồi
quy mẫu Ŷi là nhỏ nhất.
Bài toán thành tìm ˆ1 ,ˆ2 sao cho f min
Điều kiện để phương trình trên đạt cực trị là:
n 2
e i
n n
i 1 2 Yi ˆ 1 ˆ 2 X i 2 e i 0
ˆ 1
i 1 i 1
n 2
e i
n n
i 1 2 ˆ
ˆ X X 2 e X 0
ˆ
2
i 1
Yi 1 2 i i
i 1
i i
11
2.2 PHƯƠNG PHÁP OLS
Hay
n n
nˆ1 ˆ2 X i Y i
i 1 i 1
n n n
ˆ ˆ
1 X i 2 X i
2
XY i i
i 1 i 1 i 1
12
2.2 PHƯƠNG PHÁP OLS
n
• Giải hệ ta được
Y X i i n. X .Y
ˆ1 Y ˆ2 X ̂ 2 i 1
n
X
i 1
i
2
n.( X ) 2
n
xi X i X y x i i
ˆ 2 i 1
n
yi Yi Y
i
x 2
i 1
13
2.2 PHƯƠNG PHÁP OLS
Với
Y
Yi
X
Xi
n n
là trung bình mẫu (theo biến)
xi X i X yi Yi Y
gọi là độ lệch giá trị của biến so với giá trị
trung bình mẫu
14
2.2 PHƯƠNG PHÁP OLS
Với số liệu của thí dụ 2 chương 2 data giáo trình
kinh tế lượng.
16
Đặc điểm của đường hồi quy mẫu
Hình 2.2: Đường hồi quy mẫu qua giá trị trung bình
17
Đặc điểm của đường hồi quy mẫu
2. Giá trị ước lượng trung bình của Y bằng với giá trị
trung bình của Y quan sát.
18
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
^ ^
(Y Y ) (Y Y ) (Y Y )
i
2
i i
2
i
2
19
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
• TSS (Total Sum of Squares - Tổng bình phương sai số tổng cộng – tổng bình
phương tất cả các sai lệch giữa giá trị quan sát Y với giá trị trung bình của
chúng )
n
2
ˆ
2 2 2 ˆ
ESS (Yˆi Y ) ( 2 ) xi ( 2 ) * ( X i n( X ))
2 2
i 1
20
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
ˆ 2 2 ˆ
RSS e (Yi Yi ) yi 2 xi
2 2 2
i
21
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH
Y
SRF
ESS Tổng
Ŷi TSS
chênh lệch
RSS
Yi
Xi X
23
HỆ SỐ XÁC ĐỊNH R2
n
2 ESS RSS i
e 2
R 1 1 i 1
n
TSS TSS
i
y 2
i 1
y
i 1
2
i
24
TÍNH CHẤT CỦA HỆ SỐ XÁC ĐỊNH R2
0≤ R2≤1
Cho biết % sự biến động của Y được giải thích
bởi các biến số X trong mô hình.
R2 =1: đường hồi quy phù hợp hoàn hảo
R2 =0: X và Y không có quan hệ
Nhược điểm: R2 tăng khi số biến X đưa vào mô
hình tăng, dù biến đưa vào không có ý nghĩa.
=>Sử dụng R2 điều chỉnh (adjusted R2 -R2) để
quyết định đưa thêm biến vào mô hình.
25
HỆ SỐ XÁC ĐỊNH ĐIỀU CHỈNHR2
2 2 n 1
R 1 (1 R )
nk
26
HỆ SỐTƯƠNG QUAN r
yx i i
r i 1
n n
y x
i 1
2
i
i 1
2
i
27
TÍNH CHẤT HỆ SỐTƯƠNG QUAN r
•
1 r 1
• r > 0: giữa X và Y có quan hệ đồng biến
r-> ± 1: X và Y có quan hệ tuyến tính chặt chẽ
r-> 0: X và Y có quan hệ tuyến tính không chặt chẽ
r < 0: X và Y có quan hệ nghịch biến
• Hệ số tương quan có tính chất đối xứng: rXY = rYX
• Nếu X, Y độc lập theo quan điểm thống kê thì hệ số
tương quan giữa chúng bằng 0.
• r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ
thuộc tuyến tính, r không có ý nghĩa để mô tả quan hệ
phi tuyến.
28
HỆ SỐTƯƠNG QUAN r
Có thể chứng minh được
2
r R
29
HIỆP TƯƠNG QUAN MẪU
(X i X )(Yi Y )
S X ,Y Cov( X , Y ) i 1
n 1
30
Tiếp tục với ví dụ trên, tính TSS, ESS, RSS
2 2
R R S xy
31
Buổi 3:
• Gửi bảng giá trị;
• Bài tập: với số liệu các bài tập chương 2, vẽ đồ
thị, tìm phương trình hồi quy, hệ số xác định,
hệ số tương quan giữa các biến.
• Ôn lại bài, trước khi học tiếp; cách sử dụng
máy tính để tính các hệ số.
32
2.3 Các giả thiết của phương pháp OLS
• Giả thiết 1: Các giá trị Xi được xác định trước và
không phải là đại lượng ngẫu nhiên. VD: Mẫu 1
Mẫu 2
Chi tiêu Y Thu nhập X
Chi tiêu Y Thu nhập X 55 80
70 80 88 100
65 100 90 120
90 120 80 140
95 140 118 160
110 160 120 180
115 180 145 200
120 200 135 220
140 220 145 240
155 240 175 260
150 260
33
2.3 Các giả thiết của phương pháp OLS
34
2.3 Các giả thiết của phương pháp OLS
Phương
sai sai số
đồng
nhất:
Var(U/Xi
) = σ2
35
2.3 Các giả thiết của phương pháp OLS
37
Một số kiểu mẫu biến thiên của thành phần
nhiễu
38
2.3 Các giả thiết của phương pháp OLS
39
2.4 TÍNH CHẤT CÁC ƯỚC LƯỢNG
ˆ1 , ˆ2 là ước lượng điểm của 1 , 2 tìm
được bằng phương pháp OLS có tính chất:
• ˆ1 , ˆ2 được xác định một cách duy nhất với
n cặp giá trị quan sát (Xi , Yi)
ˆ ˆ
• 1 , 2 là các đại lượng ngẫu nhiên, với các
40
Sai số chuẩn của các ước lượng OLS
2 = Var (Ui )
-> thực tế khó biết được giá trị 2 -> dùng ước lượng không chệch
ˆ 2
e
RSS
2
i
n2 n2
41
Sai số chuẩn của các ước lượng OLS
ˆ ˆ 2
42
Sai số chuẩn của các ước lượng OLS
X 2
var(ˆ )
1
i .ˆ 2
se( ˆ1 ) var(ˆ1 )
n x 2
i
2
ˆ
ˆ
var( 2 ) se( ˆ 2 ) var(ˆ 2 )
x 2
i
43
Sai số chuẩn của các ước lượng OLS
ˆ
2
ˆ 2 .
var(ˆ 2 ) 2
.
ESS
X
i 2
.ˆ 2 . ˆ
2
var(ˆ1 )
n.ESS 2
X 2
ˆ
var( 1 ) i . var(ˆ 2 ).
n 44
Định lý Gauss-Markov
• Định lý: Với những giả thiết (từ 1 đến 5) của mô
hình hồi quy tuyến tính cổ điển, mô hình hồi quy
tuyến tính theo phương pháp bình phương tối
thiểu là ước lượng tuyến tính không chệch tốt
nhất, tức là, chúng là BLUE.
45
Định lý Gauss-Markov
• Một ước lượng được gọi là “ước lượng không chệch
tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện:
– Nó là tuyến tính, có nghĩa là một hàm tuyến tính
n
của một biến ngẫu nhiên, ˆ k Y
j
i 1
i i
– Nó không chệch, E ( ˆ j ) j
P(i - i i i + i) = 1 - .
với
i t ( / 2, n 2 ) SE ( ˆi )
47
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
– (i - i, i + i) : là khoảng tin cậy,
– i : độ chính xác của ước lượng
– 1 - : hệ số tin cậy,
– với (0 < < 1): là mức ý nghĩa.
– t (/2, n-2): giá trị tới hạn (tìm bằng cách
tra bảng số t-student)
– n: số quan sát
• Ví dụ: nếu = 0,05 = 5%, ta đọc “xác suất để
khoảng tin cậy chứa giá trị thực của 1 , 2 là
95%. 48
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
– Với ví dụ trên, hãy tìm khoảng tin cậy của 1,2
– Tính ˆ 2
e
2
RSS
i
n2 n2
2
– Tính ˆ ˆ
ˆ 2
ˆ )
– Tính var( ˆ ) ; 2 se ( var(ˆ 2 )
xi
2 2
49
2.4 KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
X 2
Tính ˆ
var( ) i .ˆ se; ( ˆ1 ) var(ˆ1 )
2
1
n x 2
i
– Tra bảng phân phối t – student giá trị t ( / 2, n 2 )
– Tính i t ( / 2, n 2 ) SE ( ˆi )
– Tính (i - i, i + i) : là khoảng tin cậy,
50
2.4 KHOẢNG TIN CẬY CỦA 2
(n 2)ˆ 2
P( 12 / 2 2
2
/2 ) 1
hay (n 2)ˆ 2 ( n 2) ˆ 2
P( 2 ) 1
/ 2
2
1 / 2
2
2
1 / 2 2
/2
2
2 2 2 2
P( 1 / 2 ) 1 ; P( /2 ) /2
51
2.4 KHOẢNG TIN CẬY CỦA 2
- Tính RSS
– Tra bảng phân phối Chi – square giá trị
2
2
1 / 2 và /2
– Tính : ;
là khoảng tin cậy của 2
2
ˆ
Lưu ý (vì RSS /( n 2)
2
Nên thay (n-2) ˆ trong công thức bằng RSS)
52
• Bài tập: với số liệu các bài tập ở chương 2, tìm
khoảng tin cậy của các hệ số hồi quy.
53
• Buổi 4. Ôn lại bài, trước khi học tiếp
54
2.5 KIỂM ĐỊNH GIẢ THUYẾT
55
2.5 KIỂM ĐỊNH GIẢ THUYẾT
1. Kiểm định giả thuyết về hệ số hồi quy
H 0 : i i*
Hai phía:
H1 : i i*
Phía phải: H 0 : i i*
*
H1 : i i
*
Phía trái: H 0 : i i
H1 : i i*
56
1. Kiểm định giả thuyết về hệ số hồi quy
H 0 : i i*
H1 : i i*
Cách 1: Phương pháp giá trị tới hạn
Bước 1: Tính t
ˆi i*
t
SE ( ˆi )
Bước 2: Tra bảng t-student để có giá trị tới hạn t ( n 2, / 2 )
Bước 3: Quy tắc quyết định
Nếu t t ( n 2, / 2 ) bác bỏ H0.
Nếu t t( n 2 , / 2 ) chấp nhận H0.
57
1. Kiểm định giả thuyết về hệ số hồi quy
Với số liệu cho ở thí dụ trên, kiểm định t
giả thiết H 0 : 2 0
H1 : 2 0
- Tính 2 ;SE ( ˆ 2 )
ˆ
- Tính t i i
*
SE ( ˆ ) i
Miền chấp nhận Ho
Miền bác bỏ Ho Miền bác bỏ Ho
-t t
-4 -3 -2 -1 0 1 2 3 4
t
59
1. Kiểm định giả thuyết về hệ số hồi quy
Cách 2: Phương pháp khoảng tin cậy
Khoảng tin cậy của i:
- Nếu 0 ˆ 2 2 ; ˆ 2 2 bác bỏ H 0
61
1. Kiểm định giả thuyết về hệ số hồi quy
Cách 3: Phương pháp p-value
ˆ
*
Bước 1: Tính ti i i
SE ( ˆi )
Bước 2: Tính P (T ti ) p
62
1. Kiểm định giả thuyết về hệ số hồi quy
Cách 3: Phương pháp p-value
Bước 1: Tính ˆ
*
i i
ti
SE ( ˆi )
Genr t= (( i i ) / SE ( ˆi ))
ˆ *
63
1. Kiểm định giả thuyết về hệ số hồi quy
Bước 2: Tính P (T t i ) p
t i tự do)
- Bằng Eviews: genr p=@tdist( ,bậc
Vd: genr p=@tdist(2.4469,6)
64
1. Kiểm định giả thuyết về hệ số hồi quy
65
1. Kiểm định giả thuyết về hệ số hồi quy
Bước 3: Quy tắc quyết định
- Nếu p ≤ : Bác bỏ H0
- Nếu p > : Chấp nhận H0
66
1. Kiểm định giả thuyết về hệ số hồi quy
67
Thực tế H0 đúng H0 sai
Quyết định
Không bác Quyết định đúng, Quyết định sai, xác
bỏ xác suất 1-α suất β (Sai lầm loại 2)
Quyết định sai, Quyết định đúng, xác
Bác bỏ xác suất α suất 1-β
(Sai lầm loại 1)
68
1. Kiểm định giả thuyết về hệ số hồi quy
69
Kiểm định phía phải
f(t)
H0 : βi ≤ βi*
H1 : βi > βi*
Miền bác bỏ Ho
t
0 t
70
Kiểm định phía trái
f(t)
H0 : βi ≥ βi*
H1 : βi < βi*
Miền bác bỏ Ho
-t
0
t
71
2. Kiểm định sự phù hợp của mô hình
Kiểm định giả thiết H0: R2 = 0
(tương đương H0: β2= 0)
với mức ý nghĩa hay độ tin cậy 1 -
Bước 1:
Tính R 2 ( n 2)
F
1 R2
a. Phương pháp giá trị tới hạn
Bước 2: Tra bảng F với mức ý nghĩa và hai bậc
tự do (1, n-2)
Bước 3: Quy tắc quyết định
- Nếu F > F(1,n-2): Bác bỏ H0
- Nếu F ≤ F(1,n-2): Chấp nhận H0
72
2. Kiểm định sự phù hợp của mô hình
73
1. Kiểm định giả thuyết về hệ số hồi quy
Với số liệu cho ở thí dụ trên, kiểm định giả
thiết
2
H0 : R 2
0
H1 :R 0
74
Thống kê F
F =0,05
Miền bác bỏ Ho
F(1,n-2) 75
• Buổi 5. Bài tập:
• Với số liệu bài tập 2.7 ở chương 2, cho cơ cấu
đầu tư chứng khoán hiệu quả như sau:
Ei=β1+β2Ϭi Kiểm tra xem số liệu có hỗ trợ lý
thuyết không
• Với số liệu bài tập 2.9 ở chương 2, Có ý kiến
cho rằng trong các thời kỳ trước người ta vẫn
dùng 70% thu nhập để chi tiêu cho tiêu dùng.
Nhận xét ý kiến này. Kiểm định giả thiết hệ số
hồi quy của biến x trong hàm hồi quy tổng thể
bằng 0 và cho biết ý nghĩa.
76
• Buổi 5. Ôn lại bài, trước khi học tiếp
77
2.6 DỰ BÁO
78
2.6 DỰ BÁO
* Dự báo giá trị trung bình của Y
0 SE (Yˆ0 )t ( n 2, / 2 )
ˆ ˆ 1 ( X X ) 2
Var (Y0 ) (
2 0
)
n ìx 2
80
2.6 DỰ BÁO
• Dự báo giá trị trung bình của Y
Lưu ý ˆ 2
var( ˆ2 )
x 2
i
ˆ 2
i var(ˆ )
x 2
1 ( X X ) ˆ )
2 var(
ˆ ˆ
Var (Y0 ) (
2 0 2
)
n ˆ 2
81
2.6 DỰ BÁO
Yi ˆ1 ˆ2 X i ei
Nếu đơn vị đo của biến X, Y thay đổi thì không
cần hồi quy lại. Mô hình hồi quy mới là
* ˆ * ˆ * * *
Yi 1 2 X i e i
Trong đó
ˆ ˆ ˆ k1 ˆ
Y *i k1Yi ; X *i k 2 X i 1 k11 ; 2
* *
2
k2
2
k1
var( 1 ) k1 . var( 1 ); var( 2 ) . var( ˆ2 )
ˆ ˆ ˆ
* 2 *
k2
83
VÍ DỤ 1
STT Xi Yi
1 1 10
2 4 6
3 2 9
4 5 5
5 5 4
6 7 2
84
• Với số liệu ví dụ 2 ở chương 2, hãy dự báo
điểm, khoảng cá biệt, khoảng trung bình của y
khi x=280
85
VÍ DỤ 1
a.Hãy lập mô hình hồi quy mẫu biễu diễn mối phụ thuộc về
nhu cầu vào đơn giá gạo
b.Tìm khoảng tin cậy của 1, 2 với =0,05
c. Hãy xét xem nhu cầu của loại hàng trên có phụ thuộc vào
đơn giá của nó không với =0,05.
d. Có thể nói rằng nếu giá gạo tăng 1.000đ/kg thì nhu cầu
gạo trung bình giảm 2 tấn/tháng không? Cho với =0,05
e. Hãy kiểm định sự phù hợp của mô hình. Cho =0,05.
f. Hãy dự báo nhu cầu trung bình và nhu cầu cá biệt của loại
hàng trên khi đơn giá ở mức 6.000 đồng/kg với độ tin cậy
95%.
g. Hãy viết lại hàm hồi quy nếu nhu cầu gạo được tính theo
đơn vị là tạ và giá có đơn vị là đồng.
h. Tính TSS, ESS, RSS, R2
i. Tính r, 86
VÍ DỤ 1
a. Mô hình hồi quy mẫu biễu diễn mối phụ thuộc về nhu
cầu vào đơn giá gạo
Y X i i n. X .Y
111 6.4.6
ˆ2 i 1
n
2
1,375
120 6.(4)
X
i 1
i
2
n.( X ) 2
89
VÍ DỤ 1
n
(1 R ) y
2 2
i
(1 0,9864).46
ˆ 2 i 1
0,15625
=>
n2 62
90
VÍ DỤ 1
Var ( ˆ )
X i
2
ˆ
2 120
0,15625 0,1303
n x
1 2
i 6.24
91
VÍ DỤ 1
Tra bảng ta có t 4, 0.025 2,776
1 t( n 2, / 2) SE ( ˆ ) 2,776 x0,3609 1,0019
1
93
VÍ DỤ 1
(n 2) R 2 (6 2)0,9864
F 2
290,12
(1 R ) (1 0,9864)
Mà F0,05(1,4) = 7,71 < Ftt
=> Bác bỏ H0, hay nhu cầu trung bình có phụ thuộc
vào đơn giá
94
VÍ DỤ 1
d. Dự báo
-Dự báo điểm: Yˆ0 11,5 1,375 x 6 3,25 (tấn/tháng)
-Dự báo giá trị trung bình của Y
E (Y / X 6) Yˆ0 t( n2, / 2 ) .SE (Yˆ0 )
2 2
1 ( X X ) 1 ( 6 4)
Var (Yˆ0 ) ˆ 2 ( 0
) 0,1562( ) 0,052
n xi2
6 24
98
1. Viết hàm hồi quy Y theo X. Ý nghĩa các hệ số
hồi quy
2. Tính khoảng tin cậy của B2. Ý nghĩa của khoảng
tin cậy này là gì? Cho độ tin cậy 95%.
3. Nếu thu nhập của hộ gia đình tăng 1 USD/tuần
thì chi tiêu trung bình của hộ gia đình có tăng
0.7 USD/tuần không? Cho mức ý nghĩa 5%.
4. Mô hình có phù hợp không? Cho mức ý nghĩa
1%.
5. Dự báo chi tiêu và chi tiêu trung bình của hộ gia
đình khi thu nhập là 300 USD/tuần. Cho mức ý
nghĩa 5% và X trung bình là 170 USD/tuần.
99
VÍ DỤ 2
Trình bày kết quả phân tích hồi quy
Lưu ý
ˆ j
tj
se( ˆ j )
100
Bài tập
Bài 2.2
1. Ước lượng hàm hồi quy tuyến tính
2. Nêu ý nghĩa kinh tế của các hệ số hồi quy đã ước
lượng được
3. tìm khoảng tin cậy của B1 và B2 với độ tin cậy 95%?
4 kiểm định giả thiết H0: B2 = 0; H1: B1 ≠ 0 với mức ý
nghĩa 5%.
5. Tính R2 và đánh giá mức độ phù hợp của mô hình?
6. Dự báo chi tiêu của một người có mức thu nhập 40
USD/tuần.
101
Bài tập
Bài 2.4
1. Hãy lập mô hình hồi quy tuyến tính.
2. Kiểm định giả thiết các hệ số hồi quy với độ tin
cậy 95%.
3. Dự báo tổng vốn đầu tư trung bình khi lãi suất là
4.8 %/năm với độ tin cậy 95%.
102
Bài tập
Bài 2.9
1 Viết hàm hồi quy tuyến tính mẫu.
2. Trong các thời kỳ trước người ta vẫn dùng 70%
thu nhập để chi tiêu tiêu dùng. Bạn hãy nhận xét về
ý kiến này.
3. kiểm định giả thiết các hệ số hồi quy.
4. Đánh giá mức độ phù hợp của mô hình.
103