You are on page 1of 40

CHƯƠNG 5:

HỒI QUY VỚI BIẾN GIẢ

1
NỘI DUNG CHƯƠNG 5

1
2 Bản chất của biến giả

Hồi quy với một biến định lượng


2 & một biến định tính

Hồi quy với một biến định lượng


3 & hai biến định tính

4 Sử dụng biến giả trong phân tích mùa


2
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Biến định lượng: giá trị quan sát là những con số
Ví dụ: thu nhập, chi tiêu, giá cả,...
Biến định tính: biểu thị có hay không một tính
chất hoặc biểu thị mức độ khác nhau của một tiêu
thức thuộc tính nào đó
Ví dụ: giới tính, tôn giáo, ngành nghề kinh doanh,
địa bàn kinh doanh,...
Để lượng hóa được những biến định tính,
trong phân tích hồi quy, ta sử dụng biến giả.

3
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 1 :
Một công ty sử dụng 2 công nghệ sản xuất: công
nghệ A và công nghệ B.
Ta dùng mô hình:
Yi = β1 + β2 Di + Ui (5.1)
Y: năng suất ; D: biến giả
Di = 1 : nếu năng suất là của công nghệ A
Di = 0 : nếu năng suất là của công nghệ B

4
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 1 :
Yi = β1 + β2 Di + Ui
Ta có: E(Yi/Di = 0) = β1 : năng suất trung bình
của công nghệ B
E(Yi/Di = 1) = β1 + β2 : năng suất trung bình
của công nghệ A
β2 : chênh lệch về năng suất trung bình giữa công
nghệ A và công nghệ B
Giả thiết H0: β2 = 0 : giữa công nghệ A và công
nghệ B không có sự khác nhau về năng suất 5
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 1 :
Nếu công ty sử dụng 3 công nghệ khác nhau (A, B
và C), ta sử dụng 2 biến giả D1 và D2
Mô hình: Yi = β1 + β2 D1i + β3 D2i + Ui
D1i = 1 : năng suất của công nghệ A
D1i = 0 : năng suất của công nghệ khác
D2i = 1 : năng suất của công nghệ B
D2i = 0 : năng suất của công nghệ khác

6
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 1 :
Ta có:
E(Yi/D1i= 1, D2i= 0) = 1+ 2 : năng suất trung bình
của công nghệ A
E(Yi/ D1i= 0, D2i= 1) = 1+ 3 : năng suất trung bình
của công nghệ B
E(Yi/ D1i= 0, D2i= 0) = 1 : năng suất trung bình của
công nghệ C

7
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 2 :
Khảo sát về năng suất của 2 công nghệ sản xuất,
ta có bảng số liệu sau:

Zi 0 1 1 0 0 1 0 1 1 0
Yi 28 32 35 27 25 37 29 34 33 30

Yi : năng suất (tấn/ngày)


Zi = 1 : công nghệ A ; Zi = 0 : công nghệ B

8
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Ví dụ 2 :
Ta sử dụng mô hình hồi quy: Y = β1 + β2 Di + Ui
Di = 1 : công nghệ A ; Di = 0 : công nghệ B
Hàm hồi quy mẫu:

Ŷi = 27,8 + 6,4Di


Năng suất của công nghệ B là: 27,8 tấn
Năng suất của công nghệ A là: 27,8 + 6,4 = 34,2 tấn
9
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Kết quả từ Eviews:

Dependent Variable: Y

Variable Coefficient Std. Error t-Statistic Prob.


C 27.80000 0.860233 32.31684 0.0000
Z 6.400000 1.216553 5.260768 0.0008

R-squared 0.775758 Mean dependent var 31.00000


Adjusted R-squared 0.747727 S.D. dependent var 3.829708
Log likelihood -19.61533 F-statistic 27.67568
Durbin-Watson stat 2.356757 Prob(F-statistic) 0.000764
10
1. BẢN CHẤT BIẾN GIẢ -
MÔ HÌNH BIẾN GIẢI THÍCH LÀ BIẾN GIẢ
Chú ý:
➢ Để phân biệt m mức độ (m phạm trù), người ta
dùng m-1 biến giả.
➢ Phạm trù được gán giá trị 0 là phạm trù cơ sở.
Việc so sánh được tiến hành với phạm trù này.

11
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Trong trường hợp biến định tính có 2 phạm trù, ta
chỉ cần sử dụng 1 biến giả.
Ví dụ: Xét mô hình: Yi = β1 + β2Xi + β3Di + Ui
Trong đó:
Y : tiền lương của công nhân (ngàn đồng/tháng)
X : bậc thợ
Di = 1 : công nhân làm việc trong khu vực tư nhân
Di = 0: công nhân làm việc trong khu vực quốc
doanh

12
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Ta có:
E(Yi/Xi, Di = 0) = β1 + β2Xi (5.4) : tiền lương trung
bình của công nhân trong khu vực quốc doanh
E(Yi/Xi, Di = 1) = β1 + β2Xi + β3 (5.5) : tiền lương
trung bình của công nhân trong khu vực tư nhân
β3 : mức chênh lệch về tiền lương trung bình của
công nhân cùng bậc thợ ở hai khu vực
β2 : tốc độ tăng lương theo bậc thợ

13
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Giả thiết H0 : β3 = 0 không bị bác bỏ : tiền lương
trung bình của công nhân ở 2 khu vực không
chênh lệch nhau
Y β1, β2, β3 > 0 Yi = β1 + β2Xi + β3 + Ui

β1 + β3 Yi = β1 + β2Xi + Ui

β1

X
14
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Ở mô hình (5.4) và (5.5) ta đặt giả thiết tốc độ tăng
lương theo bậc thợ của 2 khu vực là như nhau.
Nếu tốc độ tăng lương theo bậc thợ của 2 khu vực
khác nhau tức mô hình (5.4) và (5.5) khác nhau
về hệ số độ dốc. Khi đó xảy ra các trường hợp:
a. Tung độ gốc của hai mô hình giống nhau
b. Tung độ gốc của hai mô hình khác nhau

15
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
a. Trường hợp tung độ gốc giống nhau:
Ta sử dụng mô hình :
Yi = β1 + β2Xi + β3XiDi + Ui
Biến XD gọi là biến tương tác, biểu thị ảnh hưởng
đồng thời của cả bậc thợ và khu vực đối với lương
Tiền lương trung bình của công nhân trong khu
vực quốc doanh: E(Yi/Xi, Di = 0) = β1 + β2Xi
Tiền lương trung bình của công nhân trong khu
vực tư nhân: E(Yi/Xi, Di = 1) = β1 + (β2+β3)Xi
16
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Giả thiết H0 : β3 = 0 bị bác bỏ : tiền lương trung
bình của công nhân ở 2 khu vực khác nhau về tốc
độ tăng lương theo bậc thợ
Y β1, β2, β3 > 0 Yi = β1 + (β2 + β3)Xi + Ui

Yi = β1 + β2Xi + Ui

β1

X
17
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
b. Trường hợp tung độ gốc khác nhau:
Ta sử dụng mô hình :
Yi = β1 + β2Xi + β3Di + β4XiDi + Ui
Tiền lương trung bình của công nhân trong khu
vực quốc doanh: E(Yi/Xi, Di = 0) = β1 + β2Xi
Tiền lương trung bình của công nhân trong khu
vực tư nhân: E(Yi/Xi, Di = 1) = (β1+β3) + (β2+β4)Xi
Giả thiết H0 : β3 = β4 = 0 không bị bác bỏ : tiền
lương trung bình của công nhân ở 2 khu vực
không chênh lệch nhau 18
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Nếu có ít nhất một trong hai hệ số (β3 , β4) khác 0 :
tiền lương trung bình của công nhân ở hai khu vực
là khác nhau
Nếu chỉ có β4 ≠ 0 : tốc độ tăng lương theo bậc thợ
của 2 khu vực là khác nhau
Nếu chỉ có β3 ≠ 0 : tốc độ tăng lương theo bậc thợ
của 2 khu vực là giống nhau nhưng có sự chênh
lệch về tiền lương trung bình của những công
nhân cùng bậc thợ của hai khu vực
19
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Đồ thị minh họa:
Y β1, β2, β3 > 0

Yi = (β1+β3) + (β2+β4) Xi + Ui

Yi = β1 + β2Xi + Ui
β1 + β3
β1

X
20
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Thực tế, ta không xác định trước được bài toán rơi
vào trường hợp nào. Vì vậy, ta xét các mô hình
hồi quy ứng với các trường hợp khác nhau rồi
chọn mô hình hồi quy phù hợp nhất
Tung độ gốc khác nhau: Yi = β1 + β2Xi + β3Di + Ui
Độ dốc khác nhau: Yi = β1 + β2Xi + β3XiDi + Ui
Tung độ gốc và độ dốc khác nhau:
Yi = β1 + β2Xi + β3Di + β4XiDi + Ui

21
2.1 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ 2 PHẠM TRÙ
Ta có thể sử dụng mô hình:
Yi = β1 + β2Xi + β3Di + β4XiDi + Ui
Nếu giả thiết H0: β3 = β4 = 0 không bị bác bỏ: ta sử
dụng mô hình: Yi = β1 + β2Xi + Ui
Nếu giả thiết H0: β3 = β4 = 0 bị bác bỏ: ta kiểm định
riêng từng hệ số
Nếu H0: β3 = 0 không bị bác bỏ: ta sử dụng
mô hình: Yi = β1 + β2Xi + β4XiDi + Ui
Nếu H0: β4 = 0 không bị bác bỏ: ta sử dụng
mô hình: Yi = β1 + β2Xi + β3Di + Ui 22
2.2 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ HƠN 2 PHẠM TRÙ
Trường hợp biến định tính có m phạm trù (m > 2),
ta sử dụng m-1 biến giả làm biến giải thích

Ví dụ: Chúng ta nghiên cứu thu nhập của giáo


viên phổ thông trung học theo thâm niên và nơi
giảng dạy. Nơi giảng dạy được phân thành 3
vùng: các thành phố lớn, các tỉnh đồng bằng, các
tỉnh miền núi.

23
2.2 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ HƠN 2 PHẠM TRÙ
Ta sử dụng mô hình:
Yi = β1 + β2Xi + β3D1i + β4D2i + Ui
Trong đó:
Y: thu nhập của giáo viên (triệu đồng/năm)
X: thâm niên giảng dạy (năm)
D1i = 1 : giảng dạy ở thành phố
D1i = 0 : giảng dạy ở nơi khác
D2i = 1 : giảng dạy ở đồng bằng
D2i = 0 : giảng dạy ở nơi khác
24
2.2 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ HƠN 2 PHẠM TRÙ

Thu nhập trung bình của giáo viên có thâm niên Xi


giảng dạy ở miền núi:
E(Yi/Xi, D1i = 0, D2i = 0) = β1 + β2Xi

Thu nhập trung bình của giáo viên có thâm niên Xi


giảng dạy ở đồng bằng:
E(Yi/Xi, D1i = 0, D2i = 1) = β1 + β2Xi + β4

25
2.2 HỒI QUY VỚI 1 BIẾN ĐỊNH LƯỢNG &
1 BIẾN ĐỊNH TÍNH CÓ HƠN 2 PHẠM TRÙ

Thu nhập trung bình của giáo viên có thâm niên Xi


giảng dạy ở thành phố:
E(Yi/Xi, D1i = 1, D2i = 0) = β1 + β2Xi + β3

Sau khi ước lượng hàm hồi quy:


Yi = β1 + β2Xi + β3D1i + β4D2i + Ui
Ta sẽ xác định được mức chênh lệch về thu nhập
của giáo viên giảng dạy ở thành phố và đồng bằng
so với giáo viên giảng dạy ở miền núi
26
3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG
& HAI BIẾN ĐỊNH TÍNH
Công thức xác định số biến giả trong mô hình:
k
n =  (n i − 1)
i =1

Trong đó:
n – số biến giả đưa vào mô hình
k – số biến định tính
ni – số mức độ/phạm trù của biến định tính thứ i
27
3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG
& HAI BIẾN ĐỊNH TÍNH
Ví dụ:
Xét tiếp ví dụ về thu nhập của giáo viên nêu trên.
Ta thêm yếu tố môn giảng dạy vào mô hình với ba
nhóm môn là: Tự nhiên, xã hội và anh văn.
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + β6D4i + Ui
Trong đó:
Y: thu nhập của giáo viên (triệu đồng/năm)
X: thâm niên giảng dạy (năm)

28
3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG
& HAI BIẾN ĐỊNH TÍNH
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + β6D4i + Ui
D1i = 1 : giảng dạy ở thành phố
D1i = 0 : giảng dạy ở nơi khác
D2i = 1 : giảng dạy ở đồng bằng
D2i = 0 : giảng dạy ở nơi khác
D3i = 1 : giảng các môn tự nhiên
D3i = 0 : giảng các môn khác
D4i = 1 : giảng các môn xã hội
D4i = 0 : giảng các môn khác
29
3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG
& HAI BIẾN ĐỊNH TÍNH

E(Yi/Xi, D1i=0, D2i=0, D3i=0, D4i=0) = β1 + β2Xi


Thu nhập trung bình của giáo viên có thâm niên Xi
giảng dạy ở miền núi, môn anh văn

E(Yi/Xi, D1i=0, D2i=0, D3i=0, D4i=1) = β1 + β2Xi + β6


Thu nhập trung bình của giáo viên có thâm niên Xi
giảng dạy ở miền núi, môn xã hội

30
3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG
& HAI BIẾN ĐỊNH TÍNH

E(Yi/Xi, D1i=0, D2i=1, D3i=1, D4i=0) = β1+ β2Xi+ β4+ β5


Thu nhập trung bình của giáo viên có thâm niên Xi
giảng dạy ở đồng bằng, môn tự nhiên

E(Yi/Xi, D1i=1, D2i=0, D3i=0, D4i=1) = β1+ β2Xi+ β3+ β6


Thu nhập trung bình của giáo viên có thâm niên Xi
giảng dạy ở thành phố, môn xã hội

31
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Nhiều chuỗi thời gian trong kinh tế có tính chất
thời vụ rất rõ.
Ví dụ:
- Doanh số bán ra của các cửa hàng quần áo vào
dịp tết
- Lượng điện tiêu thụ theo mùa
Thông thường, ta muốn loại nhân tố mùa ra khỏi
chuỗi thời gian để tập trung phân tích các thành
phần khác của chuỗi.
32
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA

Biến giả được sử dụng để loại yếu tố mùa khỏi


chuỗi thời gian dựa vào các giả thiết:
1. Yếu tố mùa chỉ ảnh hưởng đến hệ số chặn
2. Yếu tố mùa ảnh hưởng đến cả hệ số góc

Ứng với mỗi giả thiết, ta xét mô hình khác nhau.

33
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Ví dụ:
Nghiên cứu mối liên hệ giữa thu nhập và chi tiêu
cho việc mua sắm quần áo, dụng cụ gia đình.
Để biết chi tiêu mua sắm trong các quý có khác
nhau hay không, người ta dùng mô hình:
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui
Trong đó:
Y : chi tiêu ; X : thu nhập

34
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui

D1i = 1 : quan sát ở quý 2;


D1i = 0 : quan sát ở quý khác
D2i = 1 : quan sát ở quý 3;
D2i = 0 : quan sát ở quý khác
D3i = 1 : quan sát ở quý 4;
D3i = 0 : quan sát ở quý khác
35
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Chi tiêu trung bình trong quý 1:
E(Yi/Xi, D1i = 0, D2i = 0, D3i = 0) = β1 + β2Xi
Chi tiêu trung bình trong quý 2:
E(Yi/Xi, D1i = 1, D2i = 0, D3i = 0) = β1 + β2Xi + β3
β2 : tốc độ tăng (β2>0) hay giảm (β2<0) của chi
tiêu theo thu nhập
β3 : biểu thị mức chênh lệch về chi tiêu giữa quý
2 và quý 1 (giá bán không khác nhau ở cả 2 quý)
β3 > 0 : chi tiêu quý 2 lớn hơn quý 1 một lượng β3
β3 < 0 : chi tiêu quý 2 ít hơn quý 1 một lượng |β3|
36
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA

Chi tiêu trung bình trong quý 3:


E(Yi/Xi, D1i = 0, D2i = 1, D3i = 0) = β1 + β2Xi + β4

Chi tiêu trung bình trong quý 4:


E(Yi/Xi, D1i = 0, D2i = 0, D3i = 1) = β1 + β2Xi + β5

Ý nghĩa kinh tế của β4 và β5 tương tự như β3

37
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Giả sử có sự ảnh hưởng tương tác giữa mùa và
thu nhập lên chi tiêu, nói cách khác biến giả có
ảnh hưởng lên cả hệ số góc của hồi quy, ta sử
dụng mô hình:
Yi = β1 + β2Xi + β3Z1i + β4Z2i + β5Z3i +
+ β6(Z1iXi) + β7(Z2iXi) + β8(Z3iXi) + Ui

38
4. SỬ DỤNG BIẾN GIẢ
TRONG PHÂN TÍCH MÙA
Chi tiêu trung bình trong quý 1:
E(Yi/Xi, Z1i = 0, Z2i = 0, Z3i = 0) = β1 + β2Xi
Chi tiêu trung bình trong quý 2:
E(Yi/Xi, Z1i = 1, Z2i = 0, Z3i = 0) = (β1+β3) + (β2+β6)Xi
Chi tiêu trung bình trong quý 3:
E(Yi/Xi, Z1i = 0, Z2i = 1, Z3i = 0) = (β1+β4) + (β2+β7)Xi
Chi tiêu trung bình trong quý 4:
E(Yi/Xi, Z1i = 0, Z2i = 0, Z3i = 1) = (β1+β5) + (β2+β8)Xi
39
40

You might also like