Professional Documents
Culture Documents
Chuong 2
Chuong 2
haidnd@hub.edu.vn
Tên gọi khác: Mô hình hồi quy tuyến tính đơn, Mô hình hồi
quy tuyến tính cổ điển, Mô hình chuẩn, Mô hình Gauss
Mô hình này được coi là nền tảng của hầu hết lý thuyết kinh
tế lượng
Được xem là cổ điển vì được phát triển lần đầu tiên bởi Gauss
vào năm 1821, kể từ đó mô hình này được coi như là một
khuôn mẫu hay tiêu chuẩn khi so sánh với các mô hình khác
không thỏa mãn giả thuyết của Gauss
Đánh giá tác động của một biến X lên một biến Y
Ví dụ: X là thu nhập, Y là chi tiêu
Thể hiện quan hệ hàm số
Chi tiêu = f (Thu nhập)?
Đơn giản nhất là dạng tuyến tính
Chi tiêu = β1 + β2 Thu nhập
Thực tế luôn có sai số
Chi tiêu = β1 + β2 Thu nhập + sai số
Giá và lượng bán một loại hàng tại một số cửa hàng
Thu nhập và chi tiêu của một số hộ gia đình
Tổng quát: Y = β1 + β2 X + u
Các biến số:
Y là biến phụ thuộc (dependent variable)
X là biến độc lập, biến giải thích, biến điều khiển
(independent, explanatory, control variable)
Sai số ngẫu nhiên (random error ): u
Các hệ số hồi quy (regression coefficient): β1 , β2
Yb = βb1 + βb2 X
ei = Yi − Ybi ,
thì
Yi = βb1 + βb2 Xi + ei .
Ta gọi βb1 , βb2 là hệ số hồi quy mẫu (hay hệ số ước lượng) và
chính là ước lượng (estimator) cho hệ số tổng thể β1 , β2
Phần dư ei là phản ánh sai số ui trong tổng thể
Ybi là giá trị ước lượng (fitted value) cho E (Y |Xi )
Dựa trên tham số: Hàm hồi quy tuyến tính (linear regression
function) nếu tuyến tính theo tham số
E (Y |X ) = β1 + β2 X 2
E (Y |X ) = β1 + β2 ln X
Yi = E (Y |Xi ) + ui = β1 + β2 Xi + ui
Yi = E (Y |Xi ) + ui = β1 + β2 Xi + ui
2. Mẫu
Ybi = βb1 + βb2 Xi là SRF
Yi = βb1 + βb2 Xi + ei
Trong đó
+ βb1 và βb2 lần lượt là ước lượng cho β1 và β2
+ ei là đại diện cho ui
+ Ybi là ước lượng cho E (Y |Xi )
Yi = E (Y |Xi ) + ui = β1 + β2 Xi + ui
2. Mẫu
Ybi = βb1 + βb2 Xi là SRF
Yi = βb1 + βb2 Xi + ei
Trong đó
+ βb1 và βb2 lần lượt là ước lượng cho β1 và β2
+ ei là đại diện cho ui
+ Ybi là ước lượng cho E (Y |Xi )
3. Vấn đề là phải tìm Ybi sao cho càng gần với giá trị thực Yi có
thể được, tức là phần dư ei = Yi − Ybi càng nhỏ càng tốt
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
15 NGÂN
/ 40 HÀNG TP. HCM.
2. Phương pháp ước lượng OLS
Sử dụng phương pháp cực trị của hàm số, ta tìm được
βb1 = Y − βb2 X
P−
βb1 = Y βb2 X
n
XY − X .Y hay xi yi
βb2 = 2
βb2 = Pi=1n 2
X − (X )2 i=1 xi
Trong đó xi = Xi − X , yi = Yi − Y
Y = β1 + β2 X + u
E (Y |X ) = β1 + β2 X
X 1 2 2 3 4
Y 4 6 5 7 9
P5
xi yi 8, 6 43 29
β2 = Pi=1
b
n 2
= = ; βb1 = Y − βb2 X =
x
i=1 i 5, 2 26 13
29 43
Ybi = + Xi
13 26
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
18 NGÂN
/ 40 HÀNG TP. HCM.
Ví dụ 1 (tiếp theo). Thực hành máy Casio
5
X 5
X
Xi = 12; Yi = 31; X = 2, 4; Y = 6, 2
1 1
5
X 5
X 5
X
Xi Yi = 83; Xi2 = 34; Yi2 = 207;
1 1 1
5
X 5
X
xi yi = Xi Yi − 5 × X × Y = 8, 6;
1 1
5 5 5 5
X X 2 X X 2
xi2 = Xi2 − 5 × X = 5, 2; yi2 = Yi2 − 5 × Y = 14, 8;
1 1 1 1
βb2 = 1, 6538 (lệnh 5 : Reg → 2 : B);
βb1 = 2, 2308 (lệnh 5 : Reg → 1 : A).
1 βb1 , βb2 được xác định một cách duy nhất với n cặp quan sát
(Xi , Yi )
1 βb1 , βb2 được xác định một cách duy nhất với n cặp quan sát
(Xi , Yi )
2 βb1 , βb2 là các ước lượng điểm của β1 , β2 và là các đại lượng
ngẫu nhiên, với các mẫu khác nhau chúng có giá trị khác nhau
1 βb1 , βb2 được xác định một cách duy nhất với n cặp quan sát
(Xi , Yi )
2 βb1 , βb2 là các ước lượng điểm của β1 , β2 và là các đại lượng
ngẫu nhiên, với các mẫu khác nhau chúng có giá trị khác nhau
3 Ybi = βb1 + βb2 Xi (SRF) có các tính chất sau đây:
SRF đi qua trung bình mẫu (X , Y ), nghĩa là Y = βb1 + βb2 X
Giá trị trung bình của Ybi bằng giá trị trung bình của các quan
sát,
Pn nghĩa là Yi = Yi
b
e
i=1 i = 0
Các
Pn phần dư ei không tương quan với Ybi , nghĩa là
i=1 Yi ei = 0
b
Các
Pn phần dư ei không tương quan với Xi , nghĩa là
i=1 Xi ei = 0
Giả thiết 3: Phương sai sai số ngẫu nhiên không đổi, nghĩa là
Var (u|X ) = σ 2
Var (ui |Xi ) = Var (uj |Xj ) ∀i ̸= j
Cov (ui , uj ) = 0 ∀i ̸= j
Cov (ui , Xi ) = 0 ∀i
σ 2 ni=1 Xi2 2
P
Var (β1 ) = Pn
b ; Var (βb2 ) = P σ .
n
n i=1 xi2 2
i=1 xi
Trong đó: σ 2 = Var (Ui ) là phương sai của sai số ngẫu nhiên
Ui .
σ 2 được ước lượng bởi
Pn
2 e2
b = i=1 i
σ
n−2
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
23 NGÂN
/ 40 HÀNG TP. HCM.
5. Độ chính xác của các ước lượng OLS (tiếp theo)
Sai số chuẩn (Standard error) của βb1 và βb2 lần lượt được tính
là: s P s
2 2
σ X b2
σ
P 2i ;
b
Se(βb1 ) = Se(βb2 ) = P 2
n xi xi
Khi có hệ số chặn: 0 ≤ R 2 ≤ 1
R 2 là hệ số xác định (coefficient of determination)
Ý nghĩa:
Hệ số xác định R 2 cho biết tỉ lệ (%) sự biến động của biến
phụ thuộc trong mẫu được giải thích bởi mô hình (bởi sự biến
động của biến độc lập)
R 2 được sử dụng để đo sự thích hợp của hàm hồi quy. Cụ thể:
R 2 = 0 thì mô hình hồi quy không phù hợp; R 2 ̸= 0 thì mô
hình hồi quy phù hợp
R 2 (n − k) 0, 961.(5 − 2)
F = 2
= = 73, 9231;
(1 − R )(k − 1) (1 − 0, 961).(2 − 1)
Fα (1, n − 2) = F0,05 (1, 3) = 10, 128.
k. Có người cho rằng: "Trong điều kiện các yếu tố khác không
đổi, khi thâm niên công tác tăng 1 năm, thì thu nhập sẽ tăng
thêm trung bình khoảng 1,1 triệu đồng/1 tháng". Theo
anh/chị thì nhận định trên có đúng hay không với độ tin cậy
là 95%?
k. Có người cho rằng: "Trong điều kiện các yếu tố khác không
đổi, khi thâm niên công tác tăng 1 năm, thì thu nhập sẽ tăng
thêm trung bình khoảng 1,1 triệu đồng/1 tháng". Theo
anh/chị thì nhận định trên có đúng hay không với độ tin cậy
là 95%?
Đặt giả thuyết: H0 : β2 = 1, 1 và H1 : β2 ̸= 1, 1.
k. Có người cho rằng: "Trong điều kiện các yếu tố khác không
đổi, khi thâm niên công tác tăng 1 năm, thì thu nhập sẽ tăng
thêm trung bình khoảng 1,1 triệu đồng/1 tháng". Theo
anh/chị thì nhận định trên có đúng hay không với độ tin cậy
là 95%?
Đặt giả thuyết: H0 : β2 = 1, 1 và H1 : β2 ̸= 1, 1.
Ta có
βb2 − β2 1, 6538 − 1, 1
t= = = 2, 8799;
Se(βb2 ) 0, 1923
tα/2 (n − 2) = t0,025 (3) = 3, 182.
k. Có người cho rằng: "Trong điều kiện các yếu tố khác không
đổi, khi thâm niên công tác tăng 1 năm, thì thu nhập sẽ tăng
thêm trung bình khoảng 1,1 triệu đồng/1 tháng". Theo
anh/chị thì nhận định trên có đúng hay không với độ tin cậy
là 95%?
Đặt giả thuyết: H0 : β2 = 1, 1 và H1 : β2 ̸= 1, 1.
Ta có
βb2 − β2 1, 6538 − 1, 1
t= = = 2, 8799;
Se(βb2 ) 0, 1923
tα/2 (n − 2) = t0,025 (3) = 3, 182.
k. Có người cho rằng: "Trong điều kiện các yếu tố khác không
đổi, khi thâm niên công tác tăng 1 năm, thì thu nhập sẽ tăng
thêm trung bình khoảng 1,1 triệu đồng/1 tháng". Theo
anh/chị thì nhận định trên có đúng hay không với độ tin cậy
là 95%?
Đặt giả thuyết: H0 : β2 = 1, 1 và H1 : β2 ̸= 1, 1.
Ta có
βb2 − β2 1, 6538 − 1, 1
t= = = 2, 8799;
Se(βb2 ) 0, 1923
tα/2 (n − 2) = t0,025 (3) = 3, 182.
Vì |t| < tα/2 (n − 2) nên chấp nhận giả thiết H0 . Kết luận:
Nhận định trên là đúng.
Vấn đề hệ số chặn
Không phải lúc nào cũng có ý nghĩa kinh tế
Khi không có ý nghĩa, không phân tích hệ số chặn
Hệ số chặn có ý nghĩa kĩ thuật, để tránh các sai lệch
Nếu không có hệ số chặn, R 2 mất ý nghĩa
X ∗ = mX
c∗ = β2
b
c∗ = βb1
β β
1 2
m
c∗ ) = Se(βb1 ) c∗ ) = Se(βb2 )
Se(β 1 Se(β 2
m
c∗ = Ybi
Yi R ∗2 = R 2
X ∗ = mX Y ∗ = sY