You are on page 1of 28

KINH TẾ LƯỢNG

Chương 5: Hồi quy với biến định tính

ĐINH NGUYỄN DUY HẢI

haidnd@hub.edu.vn

TRƯỜNG ĐẠI HỌC NGÂN HÀNG TP. HCM.

Ngày 20 tháng 10 năm 2023

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


1 /NGÂN
28 HÀNG TP. HCM.
Các biến xét trong chương trước là biến định lượng: đo lường
và có đơn vị
Có các yếu tố định tính cũng tác động đến biến phụ thuộc,
cần đưa vào mô hình
Ví dụ: giới tính người lao động, khu vực cư trú của hộ gia
đình, hình thức sở hữu doanh nghiệp, chính sách của nhà
nước, ...

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


2 /NGÂN
28 HÀNG TP. HCM.
Nội dung Chương 5

1 Biến định tính và Biến giả


2 Mô hình chứa biến định tính có hai phạm trù
Mô hình có một biến độc lập là biến giả
Mô hình có biến độc lập là biến giả và biến độc lập định lượng
Mô hình có biến tương tác
3 Mô hình chứa biến định tính có nhiều hơn hai phạm trù

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


3 /NGÂN
28 HÀNG TP. HCM.
1. Biến định tính - Biến giả
1.1 Biến định tính
Biến định tính không có đơn vị, có thể mã hóa qua con số,
nhưng không phải đại lượng đo lường
Biến định tính có từ 2 phạm trù (thuộc tính) trở lên, xét biến
định tính tác động đến biến phụ thuộc (định lượng) như thế
nào?
Ví dụ: Giới tính (nam, nữ) có tác động đến Thu nhập trung
bình của người lao động trong cùng một ngành nghề không?
Nếu có thì tác động như thế nào?
Ví dụ. Trong các biến sau, biến nào là biến định tính, biến nào là
biến định lượng và tại sao?
Chiều cao
Cân nặng
Khu vực sinh sống: thành thị - nông thôn
Thuế thu nhập cá nhân
Tình hình giá cổ phiếu: lên - xuống
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
4 /NGÂN
28 HÀNG TP. HCM.
1.2. Biến giả
Giả sử biến phụ thuộc (thu nhập) là Y
(
D = 1 nếu người lao động là nam
Đặt biến
D = 0 nếu người lao động là nữ
Mô hình: Y = β1 + β2 D + u
Đối với nam: Y = β1 + β2 + u
Đối với nữ: Y = β1 + u
Nếu β2 = 0 thì Thu nhập không phụ thuộc vào giới tính
Biến D được gọi là Biến giả (dummy)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


5 /NGÂN
28 HÀNG TP. HCM.
Ví dụ 1. Số liệu với YD là thu nhập, CONS là chi tiêu, GEN = 1
nếu là Nam và GEN = 0 nếu là nữ, 40 quan sát

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


6 /NGÂN
28 HÀNG TP. HCM.
Ví dụ 1 (tiếp theo)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


7 /NGÂN
28 HÀNG TP. HCM.
2. Mô hình chứa biến định tính có hai phạm trù

2.1. Mô hình có một biến độc lập là biến giả


Biến phụ thuộc Y
Nếu biến định tính có 2 phạm trù A và A
(
D = 1 nếu quan sát ở A
Đặt biến giả
D = 0 nếu quan sát ở A
Mô hình: Y = β1 + β2 D + u
Tại A: E (Y |D = 1) = β1 + β2
Tại A: E (Y |D = 0) = β1
Ý nghĩa của β2 : β2 là chênh lệch về trung bình Y giữa 2 phạm
trù A và A
Nếu β2 = 0 thì biến định tính D không có tác động đến Y
Nếu β2 ̸= 0 thì biến định tính D có tác động đến Y

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


8 /NGÂN
28 HÀNG TP. HCM.
2.2. Mô hình có biến độc lập là biến giả và biến độc lập định
lượng
Biến phụ thuộc Y , biến độc lập định lượng X
Biến định tính có 2 phạm trù A và A
(
D = 1 nếu quan sát ở A
Đặt biến giả
D = 0 nếu quan sát ở A
Mô hình: Y = β1 + β2 D + β3 X + u
Tại A: E (Y |D = 1) = β1 + β2 + β3 X
Tại A: E (Y |D = 0) = β1 + β3 X
Ý nghĩa của β2 : β2 là chênh lệch về trung bình Y giữa 2 phạm
trù A và A có cùng X
Nếu β2 ̸= 0 thì hệ số chặn là khác nhau, hàm hồi quy Y theo
X song song

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


9 /NGÂN
28 HÀNG TP. HCM.
Ví dụ 2.
Số liệu của Ví dụ 1; CONS là chi tiêu, YD là thu nhập,
40 quan sát: 18 nam và 22 nữ

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


10 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 2 (tt)
Thêm biến giả GEN = 1 với nam; GEN = 0 với nữ

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


11 NGÂN
/ 28 HÀNG TP. HCM.
2.3. Mô hình có biến tương tác
Biến phụ thuộc Y , biến độc lập định lượng X
Biến định tính có 2 phạm trù A và A
(
D = 1 nếu quan sát ở A
Đặt biến giả
D = 0 nếu quan sát ở A
Dạng 1:
Mô hình: Y = β1 + β2 X + β3 X ∗ D + u
X ∗ D được gọi là biến tương tác giữa X và D
Tại A : E (Y |D = 1) = β1 + (β2 + β3 ) X
Tại A : E (Y |D = 0) = β1 + β2 X
Ý nghĩa của β3 : Khi X tăng 1 đơn vị thì trung bình Y tại A
tăng nhiều hơn tại A là β3 đơn vị (nếu β3 > 0) hay tăng ít hơn
tại A là β3 đơn vị (nếu β3 < 0)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


12 NGÂN
/ 28 HÀNG TP. HCM.
Dạng 2:
Mô hình: Y = β1 + β2 X + β3 D + β4 X ∗ D + u
Tại A : E (Y |D = 1) = (β1 + β3 ) + (β2 + β4 ) X
Tại A : E (Y |D = 0) = β1 + β2 X
Ý nghĩa của β1 : khi X = 0 thì trung bình Y tại A là β1 đơn vị
Ý nghĩa của β2 : khi X tăng 1 đơn vị thì trung bình Y tại A
thay đổi 1 lượng β2 đơn vị
Ý nghĩa của β3 : khi X = 0 thì trung bình Y tại A chênh lệch
so với tại A là β3 đơn vị
Ý nghĩa của β4 : khi X tăng 1 đơn vị thì trung bình Y tại A
tăng nhiều hơn tại A là β4 đơn vị (nếu β4 > 0) hay tăng ít hơn
tại A là β4 đơn vị (nếu β4 < 0)

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


13 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 3.
CONS là chi tiêu, YD là thu nhập, GEN = 1 với nam

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


14 NGÂN
/ 28 HÀNG TP. HCM.
Các ví dụ

Ví dụ 1.
Nghiên cứu hiệu quả kinh doanh của các doanh nghiệp thương
mại. Nếu muốn so sánh hiệu quả của các doanh nghiệp có gian
hàng Online với các doanh nghiệp còn lại, thì mô hình nào sau đây
là phù hợp hơn cả?
MH1. TR = β1 + β2 K + β3 L + u
MH2. TR = β1 + β2 K + β3 Onl + u
MH3. TR = β1 + β3 Onl + u
MH4. TR = β1 + β2 K + β3 L + β4 Onl + u
Trong đó, TR là doanh thu, K là vốn, L là lao động và Onl là biến
giả phân nhóm doanh nghiệp, Onl = 1 nếu có gian hàng trực
tuyến, Onl = 0 nếu với doanh nghiệp khác

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


15 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 2. Xét mô hình hồi quy với wage là lương, grade là trình độ
học vấn của người lao động, union là biến giả nhận giá trị bằng 1
nếu người lao động có tham gia công đoàn, = 0 nếu ngược lại.

ln(wage) = 1, 91 + 0, 04grade + 0, 3union + e


se = (0, 19) (0, 012) (0, 108)
n = 100

a) Giải thích ý nghĩa hệ số của biến grade và biến union trong kết
quả hồi quy trên?
b) Với mức ý nghĩa 3%, có thể cho rằng việc tham gia công đoàn
sẽ giúp tiền lương trung bình của nhân viên cao hơn 28% không?

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


16 NGÂN
/ 28 HÀNG TP. HCM.
a) PRM: ln(wage) = β1 + β2 grade + β3 union + u
βb2 = 0, 04: khi các yếu tố khác không đổi, tăng thêm 1 năm
đi học thì lương trung bình tăng thêm 4%
Cách khác. βb2 = 0, 04: giữa những lao động cùng nhóm
(tham gia hoặc không tham gia công đoàn), người nào học
vấn cao hơn 1 năm đi học thì lương trung bình cao hơn 4%
b) Nếu tham gia công đoàn thì wage trung bình tăng 100β3 (%)
Xét giả thuyết H0 : β3 = 0, 28; H1 : β3 ̸= 0, 28
βb3 −0,28
t= = 0, 1852; tα/2 (n − k) = t0,015 (97) = 2, 17
se(βb3 )
Vì |t| < tα/2 (n − k) nên chưa có cơ sở bác bỏ H0 . Vậy với
mức ý nghĩa 3%, có thể cho rằng việc tham gia công đoàn sẽ
giúp tiền lương trung bình của nhân viên cao hơn 28%

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


17 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 3. Xét mô hình hồi quy với wage là lương, grade là trình độ
học vấn của người lao động, union là biến giả nhận giá trị bằng 1
nếu người lao động có tham gia công đoàn, = 0 nếu ngược lại.

ln(wage) = 1, 91 + 0, 04grade + 0, 013grade ∗ union + e


se = (0, 19) (0, 012) (0, 008)
n = 100

a) Giải thích ý nghĩa hệ số của biến grade ∗ union trong kết quả
hồi quy trên?
b) Với mức ý nghĩa 5%, hãy ước lượng khoảng cho chênh lệch tác
động của trình độ học vấn giữa người có tham gia và không tham
gia công đoàn

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


18 NGÂN
/ 28 HÀNG TP. HCM.
a) PRM: ln(wage) = β1 + β2 grade + β3 grade ∗ union + u
Tham gia công đoàn: ln(wage) = β1 + (β2 + β3 )grade + u
Không tham gia công đoàn: ln(wage) = β1 + β2 grade + u
βb3 = 0, 013: nếu cùng tăng 1 năm học vấn, thì lương trung
bình của người trong công đoàn tăng nhiều hơn một lượng
1,3% (100β3 %)
b) Khoảng tin cậy cho β3 :
(βb3 − tα/2 (n − k)se(βb3 ); βb3 + tα/2 (n − k)se(βb3 )).


tα/2 (n − k) = t0,025 (97) = 1, 96
nên khoảng tin cậy cho β3 là
(−0, 0027; 0, 0287).
Vậy với mức ý nghĩa 5%, chênh lệch tác động của trình độ học vấn
giữa người có tham gia và không tham gia công đoàn nằm trong
khoảng (−0, 0027; 0, 0287).
ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC
19 NGÂN
/ 28 HÀNG TP. HCM.
3. Biến định tính có nhiều hơn hai phạm trù

Ví dụ biến định tính có 3 phạm trù: Thu nhập trung bình của
người lao động có phụ thuộc vào Miền (Bắc – Trung – Nam)
không?
Tổng quát: Biến định tính gồm m phạm trù A1 , . . . , Am
Dùng tối đa (m − 1) biến giả
Phạm trù tất cả biến giả = 0 là phạm trù gốc (cơ sở). Khi đó
việc so sánh được tiến hành với phạm trù này

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


20 NGÂN
/ 28 HÀNG TP. HCM.
Biến A có m phạm trù A1 , A2 , . . . , Am ; lấy A1 là cơ sở
Mô hình:Y = β1 + β2 D2 + β3 D3 + . . . + βm Dm + u
Tại A1 : Y = β1 + u
Tại A2 : Y = β1 + β2 + u
Tại A3 : Y = β1 + β3 + u
...
Tại Am : Y = β1 + βm + u
Nếu các hệ số góc = 0: Đồng nhất giữa các phạm trù
Chọn phạm trù gốc phù hợp mục đích phân tích

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


21 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 1. Hãy lập mô hình mô tả quan hệ giữa thu nhập của giáo
viên với thâm niên giảng dạy và vùng giảng dạy (thành phố, đồng
bằng, miền núi)
Gọi Y là thu nhập (triệu đồng/năm), X là thâm niên giảng
dạy (năm)
Z1 , Z2(là các biến giả với
1 nếu giảng dạy ở thành phố
Z1 =
0 nếu giảng dạy ở nơi khác
(
1 nếu giảng dạy ở đồng bằng
Z2 =
0 nếu giảng dạy ở nơi khác
Với cách đặt như trên, giảng dạy ở miền núi nếu Z1 = Z2 = 0
(vì vậy phạm trù giảng dạy ở miền núi là phạm trù cơ sở)
Khi đó, ta có mô hình

Y = β1 + β2 X + β3 Z1 + β4 Z2 + u

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


22 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 1 (tiếp theo)

Ý nghĩa:
β2 : trong điều kiện các yếu tố khác không đổi, khi thâm niên
giảng dạy tăng lên 1 năm thì thu nhập trung bình tăng thêm
β2 triệu đồng/năm
β3 là chênh lệch thu nhập giữa người giảng dạy ở thành phố
với người giảng dạy ở miền núi
β4 là chênh lệch thu nhập giữa người giảng dạy ở đồng bằng
với người giảng dạy ở miền núi

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


23 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 2.
Bộ số liệu VN-Quartely
S1, S2, S3, S4 là các biến giả ứng với các quý 1 đến 4
INF là tỷ lệ lạm phát, lấy Quý 1 làm cơ sở

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


24 NGÂN
/ 28 HÀNG TP. HCM.
INF là tỷ lệ lạm phát, lấy Quý 3 làm cơ sở

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


25 NGÂN
/ 28 HÀNG TP. HCM.
4. Kiểm định sự ổn định (xem thêm)

Mô hình gốc: Y = [hệ số chặn] + [hệ số góc]X + u


Có hai phạm trù A và A
Tại A : Y = α1 + α2 X + u
Tại A : Y = β1 + β2 X + u
(
H0 : α1 = β1 và α2 = β2
Kiểm định
H1 : ít nhất một cặp hệ số khác nhau
H0 : hàm hồi quy ổn định (stability: đồng nhất trong hai
trường hợp A và A)
Có thể dùng suy luận từ biến giả

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


26 NGÂN
/ 28 HÀNG TP. HCM.
Kiểm định Chow

Trong A: mẫu kích thước n1 → RSS(1)


Trong Ā: mẫu kích thước n2 → RSS(2)
Gộp hai mẫu, kích thước n = n1 + n2 → RSS
Kiểm định F

RSS − RSS(1) + RSS(2) /k
F = 
RSS(1) + RSS(2) /(n − 2k)

Nếu F > Fα (k, n − 2k) thì bác bỏ H0


Thống kê F kiểm định Chow và kiểm định thu hẹp biến giả là
bằng nhau

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


27 NGÂN
/ 28 HÀNG TP. HCM.
Ví dụ 1.
Với bộ số liệu xếp theo thứ tự 22 nữ, 18 nam
LS CONS C YD → View → Stability Diagnostics → Chow
Breakpoint Test → 23

ĐINH NGUYỄN DUY HẢI haidnd@hub.edu.vn TRƯỜNG ĐẠI HỌC


28 NGÂN
/ 28 HÀNG TP. HCM.

You might also like