Professional Documents
Culture Documents
1
Phần 1. Mô hình hồi quy 2 biến
1.1. Phân tích hồi quy
(Regression analysis)
2
Thí dụ: “Luật Francis Galton - Karl Pearson”
3
• Kết quả nghiên cứu của F.Galton – K.Pearson :
- Với chiều cao đã biết của người bố thì chiều cao của
các cháu trai sẽ là một khoảng, dao động quanh giá trị
trung bình;
- Chiều cao của người bố tăng thì chiều cao của các
cháu trai cũng tăng (hệ số góc lớn hơn 0);
- Với nhóm các ông bố có chiều cao nhỏ (thấp) thì
chiều cao trung bình của các cháu trai cao hơn bố.
Ngược lại, với nhóm các ông bố có chiều cao lớn
(cao) thì chiều cao trung bình của các cháu trai thấp
hơn bố (hệ số góc nhỏ hơn 1).
4
Các thí dụ khác
6
b. Phân tích hồi quy và các quan hệ khác
7
• Phân tích hồi quy và quan hệ hàm số
8
• Phân tích hồi quy và phân tích tương quan
9
• Phân tích hồi quy và quan hệ nhân quả
10
1.2. Bản chất nguồn số liệu cho phân tích
hồi quy
11
b. Nguồn gốc các số liệu
12
c. Bản chất chung của số liệu KT – XH
13
1.3. Mô hình hồi qui tổng thể
• Tổng thể (Population) là toàn bộ tập hợp các
phần tử đồng nhất theo một dấu hiệu nghiên
cứu định tính hoặc định lượng nào đó .
• Giả sử có một tổng thể nghiên cứu gồm N
phần tử với hai dấu hiệu nghiên cứu X, Y tạo
thành một biến ngẫu nhiên hai chiều (X, Y).
• Để nghiên cứu BNN (X, Y) ta lập các bảng
phân phối xác suất.
14
• Bảng phân phối xác suất đồng thời của X và Y
X1 X2 … Xk
… … … … …
h k
P(Y , X ) 1
j 1 i 1
j i
15
• Kỳ vọng toán của Y với điều kiện của Xi:
h
E (Y / X i ) Y j P (Y j / X i ) E (Y / X i ) f ( X i )(i 1 k )
j 1
X = X i (Y/X i ) ! E(Y/X i )
16
• Nếu hàm hồi quy tổng thể có một biến độc
lập X thì gọi là hàm hồi quy đơn
• Nếu hàm hồi quy tổng thể có hơn một biến
độc lập X thì gọi là hàm hồi quy bộI
17
• Giả sử PRF có dạng tuyến tính:
E (Y / X i ) 1 2 X i (i 1 k )
hoặc E (Y / X ) 1 2 X
• Hàm này gọi là hàm hồi quy tuyến tính đơn
• Trong đó:
1 E (Y / X i 0) gọi là hệ số chặn (intercept
coefficient)
dE (Y / X )
2
dX gọi là hệ số góc (slope coefficient)
18
• Tại một giá trị cá biệt của Yi ta có:
Yi 1 2 X i U i (i 1 N )
gọi là mô hình hồi quy tổng thể (Population Regression
Model – PRM)
• Thuật ngữ “tuyến tính” được hiểu theo hai nghĩa
+ Tuyến tính đối với các tham số ( 1 , 2 )
+ Tuyến tính đối với các biến số (X, Y)
• Khi nói đến “hàm hồi quy tuyến tính” tức là hàm hồi
quy tuyến tính đối với các tham số, nó có thể là tuyến
tính hoặc phi tuyến đối với các biến số.
E(Y/X) = 1 + 2X2
E(Y/X) = 1 + 2lnX
E(Y/X) = 1X2
19
1.4. Sai số ngẫu nhiên và bản chất của nó
20
1.5. Hàm hồi qui mẫu
• Khái niệm:
• Mẫu ngẫu nhiên là một bộ phận mang thông tin của
tổng thể được lấy ra từ tổng thể theo những nguyên
tắc nhất định.
• Giả sử từ tổng thể N lập một mẫu ngẫu nhiên (mẫu cụ
thể) kích thước n: W = {(Xi ,Yi) ; i =1÷n}
21
Nếu hàm PRF có dạng: E(Y/Xi) = 1 + 2Xi
hàm SRF có dạng: Yˆi ˆ1 ˆ2 X i
Trong đó:
ˆ1 , ˆ2 (Estimated regression coefficients) là các ước
lượng điểm của 1 , 2 .
Yˆ (Fitted value) là ước lượng điểm của E(Y/Xi).
i
22
• Mẫu ngẫu nhiên βˆ1 , βˆ2 là ngẫu nhiên
Ước lượng ngẫu nhiên (estimates) của
tham số 1,2
23
• Tại một giá trị cá biệt của Y ta có
Yi ˆ1 ˆ2 X i ei (i 1 n)
gọi là mô hình hồi quy mẫu (Sample Regression
Model – SRM)
• Đặt e Y gọi
Yˆ là phần dư (Residual)
i i i
• Phần dư ei là sai số ngẫu nhiên của mẫu, thực
chất chúng là các ước lượng điểm của các sai số
ngẫu nhiên Ui trong tổng thể.
• Bản chất của ei giống như các sai số ngẫu nhiên
Ui
24
Tổng thể Mẫu
(Population) (Sample)
25
Các thuật ngữ cơ bản
Tiếng Anh Tiếng Việt
Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
Panel data Số liệu bảng
Population Tổng thể
PRF – Population Regression Function Hàm hồi quy tổng thể
26
Các thuật ngữ cơ bản
27
2.1. Phương pháp bình phương nhỏ nhất - OLS
n n 2
e i i
Y2
Yˆ min
i
i 1 i 1
28
• Ta có
ei Yi Yˆi Yi ˆ1 ˆ2 X i
n n n
i i i 1 2 i
e
i 1
(Y2
i Yˆ )
i 1
(Y ˆ ˆ X ) 2 f ( ˆ , ˆ )
2
i 1
1 2
f ( ˆ1 , ˆ2 ) n
n n
ˆ
1
0
2
i 1
(Yi ˆ ˆ X ) 0
1 2 i
1 2 i
ˆ n ˆ X Y
i 1
i 1
i
n n (I )
f ( ˆ1 , ˆ2 ) 0 2 X (Y ˆ ˆ X ) 0 ˆ X ˆ X 2 Y X
n n
ˆ i i 1 2 i
1 i
i1
2 i i i
2
i 1 i 1 i 1
29
• Ký hiệu
1 n
X Xi
n i 1
1 n
Y Yi
n i 1
• Khi đó ˆ1 Y ˆ2 X
n n n
n. Yi X i X i Yi
(I )
ˆ i 1 i 1 i 1
(?)
2 n n
n X i2 ( X i ) 2
i 1 i 1
30
• Ký hiệu các sai lệch
xi X i X
yi Yi Y n
• Giải hệ I Khi đó x i yi
̂ 2 i 1
n
i 1
xi2
ˆ1 Y ˆ 2 . X
• Các hệ số ˆ , ˆ là các ước lượng của , được tính
1 2 1 2
bằng phương pháp OLS - gọi là các ước lượng OLS
31
b. Các tính chất của các ước lượng OLS
32
Ví dụ 1
33
• Ví dụ 2: Cho bộ số liệu như sau:
Xi 7 8 9 10 12 13 15 17 18 23
Yi 52 44 43 44 38 39 34 32 30 29
(ĐVT: $)
– a. Tìm SRF, PRF, PRM, SRM? Giải thích ý nghĩa
các hệ số tìm được?
34
• Các hệ số là các ước lượng điểm của 1 , 2
ˆ1 , ˆ2
được tìm bằng phương
pháp OLS. Chất lượng của chúng phụ thuộc
vào các yếu tố sau:
35
2.2. Các giả thiết cơ bản của phương pháp OLS
37
2.3. Độ chính xác của các ước lượng OLS
i
X 2
var ˆ1
2 ; se ˆ1 var ˆ1 ;
n xi2
2 var(Ui )
38
- Do không xác định được 2 nên nó được thay thế bằng
một ước lượng điểm:
n n
e 2
i i
e 2
ˆ 2 i 1
ˆ i 1
(n 2) (n 2)
ˆ gọi là sai số chuẩn của đường hồi quy (Standard Error of Regression)
39
• Đối với ̂ 2
- Phương sai (Var); sai số tiêu chuẩn (Se)
2
var( ˆ2 ) ; se( ˆ2 ) var( ˆ2 )
i
x 2
- Chú ý:
Để đi tìm ước lượng điểm của 2 có thể sử dụng các
công thức sau:
40
• Ký hiệu
n n
TSS yi2 (Yi Y ) 2
i 1 i 1
n n n n
ESS yˆ i2 (Yˆi Yˆ ) 2 (Yˆi Y )2 ˆ22 xi2
i 1 i 1 i 1 i 1
n n
RSS ei2 (Yi Yˆi ) 2
i 1 i 1
TSS = ESS + RSS => RSS = TSS - ESS
TSS = Total Sum of Squares
ESS = Explained Sum of Squares
RSS = Residual sum of squares
41
• Ví dụ 3: Tìm Var, và Se của các giá trị ước
lượng ở Ví dụ 1(bài 2.9)
42
2.4. Hệ số R2 đo độ phù hợp của SRF
• Ký hiệu
2 ESS RSS
R 1
TSS TSS
gọi là hệ số xác định của mô hình (Determination coeffcient - r-Squares)
• 0 <= R2 <= 1
• Ý nghĩa
R2 đo tỷ lệ % sự biến thiên của Y được giải thích thông
qua hàm hồi quy, tức là được giải thích thông qua biến
độc lập của mô hình. Nó được sử dụng để đặc trưng cho
mức độ thích hợp của hàm hồi quy.
43
• Ký hiệu
2 ESS RSS
R 1
TSS TSS
44
• Ta có 2
xi yi
R2
2 2
i i
x y
- Nếu R2 = 0: Hàm hồi quy hoàn toàn không giải thích sự
biến thiên của Y.=> Hàm ko phù hợp
- Nếu R2 = 1: Hàm hồi quy giải thích 100% sự biến thiên
của Y.
- Nếu R2 = 0,9: Hàm hồi quy giải thích 90% sự biến động
của Y, tức là sự biến động của biến giải thích trong hàm
hồi quy chi phối 90% sự biến động của Y.
45
• Ta có
r R 2
46
VÍ DỤ 4.
TÌM HỆ SỐ R2 CỦA MÔ HÌNH HỒI QUY Ở VÍ DỤ 1(BÀI
2.9)? VÀ GiẢI THÍCH Ý NGHĨA CỦA HỆ SỐ ĐÓ?
47
2.5. Khoảng tin cậy và kiểm định giả thiết về các
hệ số hồi quy
48
Ước lượng khoảng tin cậy đối với j ( j 1 2)
ˆ j *j
• Ta có t ~ T ( n 2) do đó với độ tin cậy (1 - ) ta có
Se( ˆ )j
2 2
-Với hệ số tin cậy (1 – α), khoảng tin cậy của βj là:
49
• Chú ý: Để tìm t(n-2)α/2 ta tra bảng ở phần phụ
lục hoặc dùng hàm trong excel. Vd: với số bậc
tự do là n – 2 = 8, α = 5% thì t0,025 =
TINV(0,05,8) = 2,306
50
• Ví dụ 5:
Tìm khoảng tin cậy của các hệ số của mô hình ở
ví dụ 1 biết α =0,05?
51
2.6.Kiểm định giả thiết đối với j ( j 1 2)
ˆ j *j
• Tiêu chuẩn kiểm định t
Se( ˆ j )
• Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước
của các cặp giả thiết
- Với cặp giả thiết (1) W t : t t ( n2)
/2
- Với cặp giả thiết (2) W t : t t( n 2 )
- Với cặp giả thiết (3) W t : t t ( n 2 )
52
• Trường hợp đặc biệt
H 0 : j 0 H 0 : j 0 H 0 : j 0
(1), (2), (3)
H1 : j 0 H1 : j 0 H1 : j 0
53
• Ví dụ 6.( từ bài ví dụ 1 bài 2.9)
a. Kiểm định xem mô hình có ý nghĩa thống kê hay không?
b. Có ý kiến cho rằng khi thu nhập tăng lên 1 $ thì chi tiêu
tăng lên 2 $. Đúng hay sai? Tại sao?
c. Có ý kiến cho rằng khi thu nhập tăng lên 1$ thì chi tiêu
tăng nhiều hơn 1$? Đ/S? Tại sao
d. Có ý kiến cho rằng khi thu nhập tăng1 $ thì chi tiêu giảm ít
hơn 1$? Đ/S? Tại sao?
BTVN:
e. Thu nhập tăng 3 $ thì chi tiêu có thể tăng ít hơn 4 $ không?
Kiểm định giả thiết này?
f. Hệ số chặn có ý nghĩa thống kê hay không?
g. Thu nhập giảm thì chi tiêu sẽ giảm ít hơn so với mức giảm
của thu nhập? Kiểm định?
54
a ) kđđg:
H 0 : 2 0
H1 : 2 0
ˆ2 0 0,955 0
t qs 4,046
Se( ˆ2 ) 0,236
n2
t /2 t 8
0 , 025 2,306
t 2,306
55
b) kđđg:
H 0 : 2 2
H1 : 2 2
ˆ2 2 0,955 2
t qs 4,43
Se( ˆ2 ) 0,236
n2
t
/2 t 8
0 , 025 2,306
t 2,306
=> Bác bỏ Ho
=> Kết luận:
56
c ) kđđg
H 0 : 2 1
H1 : 2 1
ˆ2 1 0,955 1
t qs 0,19
Se( ˆ2 ) 0,236
tn 2 t 08, 05 1,86
t 1,86
=> Chưa đủ cơ sở bác bỏ Ho
=> Kết luận: Thu nhập tăng 1$ thì chi tiêu
tăng nhiều hơn 1$ là sai
57
d ) kđđg
H 0 : 2 1
H1 : 2 1
ˆ2 1 0,955 1
t qs 0,19
Se( ˆ2 ) 0,236
tn 2 t 08, 05 1,86
t 1,86
=> Chưa đủ cơ sở bác bỏ Ho
=> Kết luận: Thu nhập tăng 1$ thì chi tiêu
giảm ít hơn 1$ là sai
58
CÁC BƯỚC KIỂM ĐỊNH t
• Bước 1: Xác định cặp giả thiết
Bước 2: Tính toán giá trị t quan sát
ˆ j j
t
Se( ˆ j )
• Bước 3: So sánh t với giá trị tới hạn của t
Trong miền bác bỏ
• Bước 4: Kết luận
59
• Cặp giả thiết cơ bản (kiểm tra mô hình có ý nghĩa
thống kê hay không?)
H 0 : 2 0
H1 : 2 0
• Nếu bác bỏ H0: hệ số hồi qui 2 có ý nghĩa thống
kê (statistically significal), mô hình có ý nghĩa;
ngược lại thì hệ số 2 gọi là không có ý nghĩa
thống kê, mô hình không có ý nghĩa thống kê.
60
2.7. Kiểm định sự phù hợp của hàm hồi quy
• R2tổng thể = 0 : hàm hồi qui không phù hợp
• Kiểm định cặp giả thiết
H 0 : 2 0 H 0 : r 0
2
H1 : 2 0 H1 : r 0
2
• Ta có
2
F
ˆ2 i
x 2
R 2 (n 2)
ˆ 2
1 R2
• Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước
W F : F F (1, n 2)
61
• Cho F0,05 (k-1,n-k)=5,32
Ví dụ : Kiểm định sự phù hợp của hàm hồi quy ở Ví
dụ 1?
62
Kđ .gt
H 0 : R 0
2
H1 : R 0
2
F0 , 05 (1,10 2) 5,32
R 2 ( n 2) 0,672.(10 2)
Fqs 16,39
1 R 2
1 0,672
Fqs 5,32
64
a. Dự báo giá trị trung bình của biến phụ thuộc
• SRF cho ta một ước lượng điểm của E(Y/X0) trên mẫu
Yˆ0 ˆ1 ˆ2 X 0
• Để dự báo E(Y/X0) cho tổng thể ta ƯL khoảng tin cậy của nó.
ˆ E (Y / X )
Y
2
• Ta có T 0 0
~T ( n 2 ) 1
ˆ ) 2
X X
Var (Y
0
Se(Yˆ0 ) 0
n xi
2
1 ( X X ) 2
Se(Yˆ0 ) ˆ. 0 2
n xi
• Do đó với độ tin cậy (1-) cho trước
Yˆ0 E (Y / X 0 )
P t / 2 t / 2 1
se (Yˆ)
0
(Yˆ t ( n 2 )
.Se (Y ˆ ); Yˆ t ( n2) ˆ
• Dự báo giá trị TB: 0 /2 0 0 / 2 .Se(Y0 ))
65
b.Dự báo giá trị cá biệt của biến phụ thuộc
• SRF cho ta một ước lượng điểm của Y0 = (Y/X0) trên mẫu
Yˆ0 ˆ1 ˆ2 X 0
• Để dự báo Y0 của tổng thể ta ƯL khoảng tin cậy của nó.
2
• Ta có
ˆ
Y0 Y0 1 X X
T ~T ( n2) Var (Y ) 2
1 0
0 2
n x
Se(Yˆ0 ) i
1 ( X 0 X )2
Se(Y0 ) 1
n i x 2
66
Phần 3. Mô hình hồi quy ba biến
3.1. Mô hình hồi quy ba biến
• Xét mô hình:
PRF : E (Y / X 2i , X 3i ) 1 2 X 2i 3 X 3i
PRM :Yi 1 2 X 2i 3 X 3i U i (i 1 N )
• Trong đó
Yi: là biến phụ thuộc
X2i, X3i : là hai biến độc lập
β1 là hệ số chặn
β2, β3 là các hệ số góc riêng phần (hệ số hồi quy riêng)
67
• Ý nghĩa:
Hệ số β1 = E(Y/X2i = X3i = 0) là giá trị trung bình của Y
khi X2i = X3i = 0.
E (Y / X 2 , X 3 )
2
X 2
β2 cho biết khi X2 tăng một đơn vị thì trung bình của Y
thay đổi như thế nào trong điều kiện X3 không thay đổi.
E (Y / X 2 , X 3 )
3
X 3
β3 cho biết khi X3 tăng một đơn vị thì trung bình của Y
thay đổi như thế nào trong điều kiện X 2 không thay đổi.
68
3.2. Các giả thiết của mô hình
• GT6: Các sai số ngẫu nhiên có phân phối chuẩn
~ N (0, 2 )
Ui
• GT7: Các biến giải thích không có quan hệ tuyến tính
69
3.3. Ước lượng các tham số của mô hình hồi
quy ba biến
• Trong tổng thể
PRF : E (Y / X 2i , X 3i ) 1 2 X 2i 3 X 3i
PRM :Yi 1 2 X 2i 3 X 3i U i (i 1 N )
• Trong mẫu W (Yi , X 2i , X 3i ) : i 1 n
SRF :Yˆi ˆ1 ˆ2 X 2i ˆ3 X 3i
SRM : Yi ˆ1 ˆ2 X 2i ˆ3 X 3i ei (i 1 n)
ˆ , ˆ , ˆ là các ước lượng điểm của β1,β2,β3
1 2 3
i 1 i 1 i 1
f ( ˆ , ˆ , ˆ )
n
1 2 3
2 X 2i (Yi ˆ1 ˆ2 X 2i ˆ3 X 3i ) 0
ˆ
2 i 1
ˆ , ˆ , ˆ )
f ( n
1 2 3
2 X 3i (Yi ˆ1 ˆ2 X 2i ˆ3 X 3i ) 0
ˆ3 i 1
71
• Ký hiệu
1 n
Y Yi ; yi Yi Y
n i 1
1 n
X 2 X 2i ; x2i X 2i X 2
n i 1
1 n
X 3 X 3i ; x3i X 3i X 3
n i 1
72
• Ta có
i 1 i 1 i 1
73
3.4. Phương sai và độ lệch chuẩn của các ước lượng OLS
n n n
1 ( X 2 x3i ) ( X 3 x2i ) (2 X 2 X 3 x3i x2i )
2 2 2 2
Var ( ˆ1 ) 2 i 1
n n
i 1
n
i 1
Se ( ˆ ) Var ( ˆ )
1 1
n
( x22i )( x32i ) ( x3i x2i ) 2
i 1 i 1 i 1
n
3i
x 2
2
Var ( ˆ2 ) n n
i 1
n
2
n
Se( ˆ2 ) Var ( ˆ2 )
( x22i )( x32i ) ( x3i x2i ) 2 2i 23 )
x 2
(1 r 2
i 1 i 1 i 1 i 1
n
2i
x 2
2
Var ( ˆ3 ) n n
i 1
n
2 n
Se( ˆ3 ) Var ( ˆ3 )
( x22i )( x32i ) ( x3i x2i ) 2 3i 23 )
x 2
(1 r 2
i 1 i 1 i 1 i 1 74
• Trong đó
Sai số tiêu chuẩn
n
của đường hồi quy
i
e 2
ˆ 2 i 1
n3
r23 là hệ số tương quan của biến X2 ,X3
n
( x2i x3i ) 2
r
2
23 n
i 1
n
2 i 3i
x 2
i 1
x 2
i 1
75
• Hệ số xác định bội của mô hình
n n
ˆ2 x2i yi ˆ3 x3i yi
ESS RSS
R
2
1 i 1
n
i 1
TSS TSS
i
y 2
i 1
n n
ESS ˆ2 yi x2i ˆ3 yi x3i TSS yi2 ; RSS ei2
i 1 i 1
76
• Hệ số tương quan:
- Hệ số tương quan bội:
r / R 2
đo mức độ tương quan tuyến tính chung giữa Y, X2 và X3
- Hệ số tương quan cặp(Simple correlation coefficent)
n n n
( x2i yi ) 2
( x3i yi ) 2
( x2i x3i ) 2
r122 n
i 1
n
; r132 n
i 1
n
; r232 n
i 1
n
i 1
x y
i 1
2
2i
2
i
i 1
x y
i 1
2
3i
2
i x
i 1
2
2i 3i
x 2
i 1
+ Hệ số r12 đo mức độ tương quan tuyến tính giữa Y và X2
+ Hệ số r13 đo mức độ tương quan tuyến tính giữa Y và X3
+ Hệ số r23 đo mức độ tương quan tuyến tính giữa X 2 và X3
-1 < = r <= 1
77
• Hệ số xác định bội đã hiệu chỉnh
RSS /(n k ) 2 n 1
R 1
2
1 (1 R )
TSS /(n 1) nk
- Mục đích của việc hiệu chỉnh là để xem xét
việc có nên đưa thêm biến giải thích vào mô
hình hay không.
- Một biến mới sẽ được đưa vào mô hình nếu hệ
số của biến mới đưa vào mô hình có ý nghĩa
thống kê và hệ số R 2 còn tăng.
78
3.5. Kiểm định giả thiết và khoảng tin cậy của các
hệ số hồi quy– kiểm định T
79
Ước lượng khoảng tin cậy đối với j ( j 1 k)
ˆ j j
• Ta có t ~ T (n -k) do đó với độ tin cậy (1 - ) ta có
Se( ˆ ) j
P(t ( nk )
/2 t t /2 ) 1
( nk )
P( j t / 2 .Se( j ) j j t / 2 .Se( ˆ j )) 1
ˆ ( nk ) ˆ ˆ ( nk )
( j t / 2 .Se( j ); j t / 2 .Se( ˆ j ))
ˆ ( n 3) ˆ ˆ ( n 3)
80
Kiểm định giả thiết đối với j ( j 1 k)
ˆ j *j
• Tiêu chuẩn kiểm định T
Se( ˆ j )
• Miền bác bỏ giả thiết H0 với mức ý nghĩa cho trước
của các cặp giả thiết W t : t t / 2 ( n 3)
- Với cặp giả thiết (1)
- Với cặp giả thiết (2) W t : t t
( n 3)
- Với cặp giả thiết (3) W t : t t ( n 3)
81
• Trường hợp đặc biệt
H 0 : j 0 H 0 : j 0 H 0 : j 0
(1), (2), (3)
H1 : j 0 H1 : j 0 H1 : j 0
• Cặp giả thiết: β2 = 0; β2 ≠ 0
ÞCho biết hệ số của biến X2i có ý nghĩa thống kê hay
không.
• Cặp giả thiết: β3 = 0; β3 ≠ 0
=> Cho biết hệ số của biến X3i có ý nghĩa thống kê hay
không.
82
BT1:Cho bảng số liệu của lượng cam bán Y (tạ) theo giá cam X2
(chục ngàn đồng/kg) và giá quýt X3 (chục ngàn đồng/kg)
Y 14 10 12 7 8 9 6 6 9 11
X2 2 2 3 4 5 5 5 6 4 3
X3 3 1 3 2 3 5 2 5 5 4
83
3.6. Kiểm định sự phù hợp của hàm hồi quy
• R2tổng thể = 0 : hàm hồi qui không phù hợp
• Kiểm định cặp giả thiết
H 0 : 2 3 ... k 0 H 0 : R 2 0
H 1 : ! j 0 H
1 : R 2
0
• Ta có
R /( k 1)
2
F ~ F(k - 1, n - k)
(1 R ) /( n k )
2
• Miền bác bỏ của giả thiết H0 với mức ý nghĩa cho trước\
W F : F F (k 1, n k )
84
Phần 4. Biến giả
4.1. Bản chất của biến giả (Dummy variable)
87
Quy tắc đặt biến giả
• Để đặc trưng cho biến định tính có n (n ≥ 2)
phạm trù thì dùng (n - 1) biến giả D.
• Biến giả D chỉ nhận 2 giá trị là 0 hoặc 1
• Thuộc tính ảnh hưởng không tốt đến biến
phụ thuộc Y là phạm trù cơ sở và thường gán
giá trị 0
88
- Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc
vào khu vực làm việc (D).
- Khu vực làm việc được chia thành: khu vực nông
thôn; khu vực thành thị và khu vực miền núi.
1 Nếu công chức làm việc ở nông thôn
D2i
0 Nếu công chức làm việc ở khu vực khác
1 Nếu công chức làm việc ở thành thị
D3i Nếu công chức làm việc ở khu vực khác
0
- Mô hình hồi quy
Yi 1 2 D2i 3 D3i U i
89
- Phân tích
+ Thu nhập trung bình của công chức làm việc ở miền núi
E (Yi / D2i D3i 0) 1
+ Thu nhập trung bình của công chức làm việc ở nông thôn
E (Yi / D2i 1, D3i 0) 1 2
+ Thu nhập trung bình của công chức làm việc ở thành thị
E (Yi / D2i 0, D3i 1) 1 3
+ Để xem có sự khác biệt về thu nhập giữa công chức làm
việc ở các khu vực khác nhau hay không ta kiểm định cặp
giả thiết:
H 0 : j 0
j 2,3
H1 : j 0
90
4.3. Mô hình có hai biến độc lập là biến định tính
• Với mỗi biến độc lập là biến định tính tuỳ thuộc vào số
phạm trù của nó mà ta đưa số biến giả thích hợp vào
mô hình.
• Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc
vào giới tính và khu vực làm việc.
- Mô hình:
Yi 1 2 D2i 3 D3i 4 D4i U i
- Trong đó:
+ D2i đặc trưng cho biến giới tính
+ D3i, D4i đặc trưng cho biến khu vực làm việc
91
Nhận xét
• Nếu mô hình có k biến độc lập là biến định tính với số
phạm trù tương ứng là n1, n2, …, nk thì tổng cộng số
biến giả phải dùng để tránh rơi vào hiện tượng đa công
tuyến hoàn hảo là (n1-1)+ (n2-1)+ …+ (nk-1).
• Phạm trù được lựa chọn để so sánh với các phạm trù
khác (phạm trù mà tất cả các biến giả đều nhận giá trị
bằng 0) gọi là phạm trù cơ sở.
• Các hệ số góc được gọi là hệ số chênh lệch vì nó phản
ánh mức độ chênh lệch của phạm trù đang xét với phạm
trù cơ sở.
92
4.4. Phân tích ảnh hưởng tương tác giữa các
biến định tính
• Trong các mô hình hồi quy có nhiều biến giả có thể xảy
ra sự tương tác giữa các biến giả với nhau.
• Ví dụ: hồi quy chi tiêu hàng năm về quần áo (Y) phụ
thuộc vào thu nhập (X), giới tính(nam, nữ) và thành
phần lao động(công chức, công nhân)
- Mô hình Yi 1 2 D2i 3 D3i 4 X i U i
1 Nếu đối tượng là nam
D2i
0 Nếu đối tượng là nữ
1 Nếu đối tượng là công chức
D3i
0 Nếu đối tượng là công nhân
93
• Để phân tính sự ảnh hưởng tương tác giữa
các biến giả ta hồi quy mô hình:
Yi 1 2 D2i 3 D3i 4 ( D2i * D3i ) 5 X i U i
Trong đó D2i.D3i thể hiện sự tương tác giữa
hai biến giả
• Để xem có ảnh hưởng tương tác giữa hai biến
giả hay không ta kiểm định cặp giả thiết:
H 0 : 4 0
• Nếu chấp nhận giả thiết H1 thì
H có
: nghĩa
0 là có
1 4
sự khác nhau về chi tiêu cho quần áo giữa
“nam công chức” và các đối tượng khác (nữ
công chức, nữ công nhân, nam công nhân).
94
4.5. Sử dụng biến giả để phân tích biến động
mùa vụ
95
• Ví dụ: hồi quy tiêu dùng về quần áo, dụng cụ gia đình
của hộ gia đình (Y) phụ thuộc vào thu nhập (X) và yếu
tố mùa vụ (các quí).
1 Nếu quan sát nằm ở quí 2
D2i
0 Nếu quan sát nằm ở quí khác
1 Nếu quan sát nằm ở quí 3
D3i
0 Nếu quan sát nằm ở quí khác
1 Nếu quan sát nằm ở quí 4
D4i
0 Nếu quan sát nằm ở quí khác
• Để phân tích ảnh hưởng của yếu tố mùa vụ đến chi tiêu
ta sử dụng mô hình:
Yi 1 2 D2i 3 D3i 4 D4i 5 X i Ui (1)
96
• Để phân tích ảnh hưởng tương tác giữa yếu tố
mùa vụ và thu nhập đến chi tiêu ta sử dụng mô
hình tổng quát:
Yi 1 2 D2i 3 D3i 4 D4i 5 X i
6 ( D2i * X i ) 7 ( D3i * X i ) 8 ( D4i * X i ) U i (2)
• Việc thực hiện các kiểm định đối với các hệ số
của mô hình (1) và (2) sẽ cho ta các biết ảnh
hưởng của yếu tố mùa vụ cũng như ảnh hưởng
tương tác của yếu tố mùa vụ và thu nhập đến chi
tiêu.
97
4.6. So sánh hai hồi quy
• Giả sử có hai hàm hồi quy:
- Giai đoạn 1: Yt 1 2 X t U t (*) với n1 quan sát
- Giai đoạn 2: Yt 1 2 X t U t (**) với n2 quan sát
• Có 4 trường hợp có thể xảy ra:
- Hai hàm hồi quy trùng nhau (α1 = γ1, α2 = γ2)
- Hai hàm hồi quy song song (α1 ≠ γ1, α2 = γ2)
- Hai hàm hồi quy có cùng hệ số chặn (α1 = γ1, α2 ≠ γ2)
- Hai hàm hồi quy hoàn toàn khác nhau (α1 ≠ γ1, α2 ≠ γ2)
• Đồ thị
98
4.7. Hồi quy tuyến tính từng khúc
• Nhiều hiện tượng kinh tế có sự thay đổi cấu trúc theo
thời gian song vẫn phải đảm bảo tính liên tục theo thời
gian của hiện tượng. Khi đó ta sử dụng biến giả để thể
hiện cho sự thay đổi cấu trúc này.
• Ví dụ: Giả sử tiêu dùng của Việt Nam trong 2 thời kỳ
trước và sau chuyển đổi (1986) là khác nhau.
• Ký hiệu năm chuyến đổi cơ cấu kinh tế là t0.
1 Nếu t > t0
Dt
0 Nếu t ≤ t0
99
• Xây dựng mô hình
Yt 1 2 X t 3 ( X t X t ) Dt U t
0
• Trong đó:
Yt là tiêu dùng
Xt là thu nhập
Xt0 là thu nhập trong năm bắt đầu chuyến đổi cơ cấu kinh tế.
Xt0 X
100
• Phân tích
- Tiêu dùng trung bình trong những năm trước khi
chuyển đổi cơ cấu kinh tế.
E (Yt / X t , Dt 0) 1 2 X t
- Tiêu dùng trung bình trong những năm sau khi
chuyển đổi cơ cấu kinh tế.
E (Yt / X t , Dt 1) ( 1 3 X t0 ) ( 2 3 ) X t
- Tại thời điểm t0 ta có
E (Yt0 ) ( 1 3 X t0 ) ( 2 3 ) X t0 1 2 X t0
- Để xem mô hình có thay đổi cấu trúc hay không ta
kiểm định cặp giả thiết:
H 0 : 3 0
H1 : 3 0
101
• Khi mô hình có sự thay đổi cấu trúc trong
nhiều giai đoạn khác nhau của dãy số liệu
thì ta có thể sử dụng số biến giả và mô hình
phù hợp để phân tích.
• Chú ý: mô hình thay đổi cấu trúc n giai
đoạn thì sử dụng (n-1) biến giả
102
Lưu ý khi ước lượng mô hình có 1 biến
lượng và 1 biến định tính có 2 thuộc tính
PRF : Yi 1 2 . X i 3 .Di U i
SRF : Yˆ ˆ ˆ . X ˆ .D
i 1 2 i 3 i
103
n n n n
( xi yi )( d ) ( d i yi )( d i .xi )
i
2
ˆ2 i 1
n
i 1
n
i 1
n
i 1
i i ii
x 2
i 1
. d 2
( d x
i 1
) 2
i 1
n n n n
( d i yi )( xi2 ) ( xi yi )( d i .xi )
ˆ3 i 1
n
i 1
n
i 1
n
i 1
x . d
i 1
2
i
i 1
i
2
( d i xi )
i 1
2
(d i Di D )
ˆ1 Y ˆ2 . X ˆ3 .D
104