You are on page 1of 73

CHƯƠNG 5

BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY


BIẾN GIẢ

1. Biết cách đặt biến giả


MỤC
TIÊU 2. Nắm phương pháp sử dụng
biến giả trong phân tích hồi quy

2
NỘI DUNG

1 Khái niệm biến giả

2 Sử dụng biến giả trong mô hình hồi quy

3 Kỹ thuật sử dụng biến giả


5.1 KHÁI NIỆM

• Biến định lượng: các giá trị quan sát được thể
hệ bằng con số
• Biến định tính: thể hiện một số tính chất nào
đó
• Để đưa những thuộc tính của biến định tính
vào mô hình hồi quy, cần lượng hóa chúng =>
sử dụng biến giả (dummy variables)

4
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ

• Ví dụ: khảo sát năng suất của 2 công nghệ,


người ta thu được các số liệu cho ở bảng sau:

Zi B A A B B A B A A B
Yi 28 32 35 27 25 37 29 34 33 30
Trong đó Yi : năng suất
Zi: công nghệ tương ứng

5
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ

Di: là biến giả


Di = 1 nếu là công nghệ A
Di = 0 nếu là công nghệ B
Ta có bảng số liệu như sau
Di 0 1 1 0 0 1 0 1 1 0
Yi 28 32 35 27 25 37 29 34 33 30

6
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ

Sử dụng mô hình hồi quy


Yi = β1 + β2Di + Ui (hãy tìm hàm hồi quy mẫu ?)
• Như vậy β1 + β2 biểu hiện năng suất trung bình
của công nghệ A
• β2 phản ánh chênh lệch năng suất trung bình
giữa công nghệ B và công nghệ A
• β2 = 0 chính là giả thiết cho rằng giữa công nghệ
A và công nghệ B không có sự khác biệt
7
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ

Sử dụng số liệu ở bảng trên, tìm hàm hồi quy


tuyến tính mẫu Y theo D:
Ŷi = 27,8 + 6,4Di
Năng suất trung bình của công nghệ A ?
Năng suất trung bình của công nghệ B ?

8
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ

Chú ý: để phân biệt m mức độ người ta dùng


m-1 biến giả để tránh hiện tượng đa cộng tuyến.

9
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH

• Ví dụ: khảo sát lượng hàng bán được ở một cửa hàng,
người ta thu được các số liệu cho ở bảng sau:
Yi 20 19 18 18 17 17 16 16 15 15 14 14 13 12 12 15 16 12 10 11

xi
2 3 3 4 4 3 4 4 5 5 5 6 6 7 7 5 4 7 8 8

1 0 1 0 1 1 0 1 1 1 0 1 0 1 0 1 0 1 0 1
Di
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán
Di: Khu vực khảo sát: Di = 0 nếu khu vực khảo sát ở nông
thôn, Di = 1 nếu khu vực khảo sát ở thành phố

10
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH

Sử dụng mô hình hồi quy


Yi = β1 + β2Xi + β3Di + Ui
Yi = β1 + β2Xi (mô hình 1) lượng bán ở khu vực nông thôn
Yi = β1 + β2Xi + β3 D2 (mô hình 2) lượng bán ở khu vực thành thị
β3 biểu thị mức chênh lệch về lượng bán ở khu vực nông và thành thị
Ý nghĩa của β2 ?
Β3 = 0 ?
YI = 22.606 -1.533*XI + 0.097*DI
YI = 22.606 -1.533*XI

11
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH

Với ví dụ trên: giả sử khu vực khảo sát được chia làm ba vùng
khác nhau gồm thành thị, nông thôn, miền núi.
Chúng ta sử dụng mấy biến giả?
Chúng ta sử dụng mô hình sau
Yi = β1 + β2Xi + β3D1i + β4D2i + Ui
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán; Di: Khu vực khảo sát: với 2 biến giả D1i và D2i
D1i = 1 nếu khu vực khảo sát ở nông thôn, D1i = 0 nếu khu vực
khảo sát ở nơi khác,
D2i = 1 nếu khu vực khảo sát ở thành phố, D2i = 0 nếu khu vực
khảo sát ở nơi khác
12
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH

Như vậy Yi = β1 + β2Xi + β3D1i + β4D2i + Ui


Lượng bán trung bình của một cửa hàng ở miền núi là phạm
trù cơ sở (D1i = D2i = 0) ta có
Yi = β1 + β2Xi + Ui
Lượng bán trung bình của một cửa hàng ở nông thôn là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β3 D1 + Ui
Lượng bán trung bình của một cửa hàng ở thành phố là
(D1i= ?; D2i= ?) ta có
Yi = β1 + β2Xi + β4 D2 + Ui
13
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH

Giả sử chúng ta muốn ước lượng mức thu nhập của nhân
viên bán hàng được quyết định bởi số năm kinh nghiệm,
trình độ học vấn (dưới đại học, đại học, trên đại học) và
giới tính nam hay nữ (để xem giới tính có ảnh hưởng thu
nhập hay không). Mấy phạm trù, đặt máy biến giả ?

14
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH

Ta đặt Yi: thu nhập


Xi: số năm kinh nghiệm, D1i = 1: nhân viên có trình độ đại học, D2i = 1
nhân viên có trình độ trên đại học, D3i = 1: nhân viên nam.
(D1i = 0, D2i = 0, D3i = 0): Nữ dưới đại học – phạm trù cơ sở
nam dưới đại học, nữ đại học, nam đại học, nữ sau đại học, nam
sau đại học?
(D1i = 0, D2i = 0, D3i = 1): Nam dưới đại học
(D1i = 1, D2i = 0, D3i = 0): Nữ đại học;
(D1i = 1, D2i = 0, D3i = 1): Nam đại học;
(D1i = 0, D2i = 1, D3i = 0 ): Nữ sau đại học
(D1i = 0, D2i = 1, D3i = 1): Nam sau đại học;
15
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH

Mô hình hồi quy tổng quát như sau:


Yi = β1 + β2Xi + β3D1i + β4D2i + β5D3i + Ui
Thu nhập của nữ có trình độ dưới đại học:
E(Y/X, D1i = 0, D2i = 0, D3i = 0) = β1 + β2Xi + Ui
Thu nhập của nam có trình độ dưới đại học: ?
E(Y/X, D1i = 0, D2i = 0, D3i = 1) = β1 + β2Xi + β5 + Ui
Thu nhập của nữ có trình độ đại học:
E(Y/X, D1i = 1, D2i = 0, D3i = 0) = β1 + β2Xi + β3+ Ui

16
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH

Thu nhập của nam có trình độ đại học:


E(Y/X, D1i = 1, D2i = 0, D3i = 1) = β1 + β2Xi + β3+ β5+ Ui
Thu nhập của nữ có trình độ sau đại học:
E(Y/X, D1i = 0, D2i = 1, D3i = 0) = β1 + β2Xi + β4 + Ui
Thu nhập của nam có trình độ sau đại học:
E(Y/X, D1i = 0, D2i = 1, D3i = 1) = β1 + β2Xi + β4 + β5+ Ui

17
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH

Từ mô hình trên ta có thể so sánh mức thu nhập với nhiều


trường hợp khác nhau
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ
không có bằng đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nữ có
bằng trên đại học.
-Giữa nhân viên nữ có bằng đại học với nhân viên nam có
bằng đại học.
-Giữa nhân viên nam có bằng đại học với nhân viên nam
không có bằng đại học…
18
5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU

Giả sử ta hồi quy thu nhập (biến Y) của nhân viên nam và
nữ, có mức lương khởi điểm (β1) và thâm niên công tác
(Biến X). Trong đó thâm niên công tác như nhau nhưng
tốc độ tăng lương giữa nam và nữ có thể khác nhau.
Giả sử đặt hệ số tăng lương của nhân viên nữ là β2 , hệ số
tăng lương của nhân viên nam khác nhân viên nữ một
khoảng α2 tức hệ số tăng lương của nhân viên nam là (β2 +
α2)

19
5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU

Thu nhập của nhân viên nữ: Yi = β1 + β2Xi + Ui


Thu nhập của nhân viên nam: Yi = β1 + (β2 + α2) Xi + Ui
Nếu đặt Di là biến giới tính với Di = 1 nếu là nam, Di = 0 nếu là nữ,
Mô hình tổng quát trở thành:
Yi = β1 + (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + β2 Xi + α2 Di Xi + Ui)
α2 > 0 tốc độ tăng thu nhập của nhân viên nam nhanh hơn nhân
viên nữ, α2 < 0 tốc độ tăng thu nhập của nhân viên nam chậm
hơn nhân viên nữ.

20
5.6. BIẾN GiẢ VỚI TUNG ĐỘ GỐC VÀ HỆ SỐ GÓC KHÁC NHAU

Tiếp tục với ví dụ trên.


Giả sử lương khới điểm của nhân viên nữ (chưa có thâm
niên hay X = 0); là β1;
Lương khởi điểm của nhân viên nam (chưa có thâm niên
hay X = 0) khác lương khởi điểm của nhân viên nữ một
khoản là α1 tức lương khởi điểm của nhân viên nam là
(β1 + α1 )
Mô hình tổng quát trở thành:
Yi = (β1 + α1Di )+ (β2 + α2 Di )Xi + Ui
(Hay: Yi = β1 + α1Di + β2 Xi + α2 Di Xi + Ui)
21
Bài tập:
Mã hóa bảng số liệu dưới đây và tìm hàm hồi quy mẫu
Trình độ văn
Quy Chi tiêu của hóa của chủ Tuổi của Giới tính Nơi sinh
Mã hộ mô hộ hộ hộ chủ hộ chủ hộ sống
Yi
38820 4 10097.37 3 48 Nam Nông thôn
38818 6 14695.2 8 42 Nữ Nông thôn
38817 8 11733.34 4 37 Nữ Nông thôn
38816 3 7087.489 0 21 Nữ Nông thôn
38815 9 22809.3 6 48 Nữ Nông thôn
38813 4 9554.563 2 76 Nữ Nông thôn
11212 7 69258.09 9 42 Nữ Thành thị
11211 3 13680.91 0 77 Nữ Thành thị
11209 3 27651.65 13 32 Nữ Thành thị
11208 4 32102.67 8 47 Nữ Thành thị
11207 2 11464.6 7 38 Nam Thành thị
11206 4 17199.63 5 93 Nam Thành thị
22
Bài tập:
Mã hóa bảng số liệu dưới đậy và tìm hàm hồi quy mẫu
Trình độ văn
Quy Chi tiêu của hóa của chủ Tuổi của Giới tính Nơi sinh
Mã hộ mô hộ hộ hộ chủ hộ chủ hộ sống
X1i Yi X2i X3i D1i D2i
38820 4 10097.37 3 48 1 0
38818 6 14695.2 8 42 0 0
38817 8 11733.34 4 37 0 0
38816 3 7087.489 0 21 0 0
38815 9 22809.3 6 48 0 0
38813 4 9554.563 2 76 0 0
11212 7 69258.09 9 42 0 1
11211 3 13680.91 0 77 0 1
11209 3 27651.65 13 32 0 1
11208 4 32102.67 8 47 0 1
11207 2 11464.6 7 38 1 1
11206 4 17199.63 5 93 1 1 23
5.7. BIẾN GiẢ TRONG PHÂN TÍCH THỜI VỤ

24
5.9. HỒI QUY TUYẾN TÍNH TỪNG KHÚC

25
5.10. HỒI QUY BiẾN PHỤ THUỘC LÀ BiẾN GiẢ

26
27
Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của
chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi
sinh sống của hộ
Trình độ Tuổi
văn hóa của Giới
Quy của chủ chủ tính
Mã hộ mô hộ Chi tiêu của hộ hộ hộ chủ hộ Nơi sinh sống
38820 4 10097.37 3 48 Nam Nông thôn
38818 6 14695.2 8 42 Nữ Nông thôn
38817 8 11733.34 4 37 Nữ Nông thôn
38816 3 7087.489 0 21 Nữ Nông thôn
38815 9 22809.3 6 48 Nữ Nông thôn
38813 4 9554.563 2 76 Nữ Nông thôn
11212 7 69258.09 9 42 Nữ Thành thị
11211 3 13680.91 0 77 Nữ Thành thị
11209 3 27651.65 13 32 Nữ Thành thị
11208 4 32102.67 8 47 Nữ Thành thị
11207 2 11464.6 7 38 Nam Thành thị
11206 4 17199.63 5 93 Nam Thành thị
28
Ví dụ
• Có hai biến độc lập định tính là giới tính của chủ
hộ và nơi sinh sống của hộ. Để phân tích hồi quy
cần phải lượng hóa hai biến định tính này.
• Thực hiện: Giới tính gồm hai biểu hiện là nam và
nữ và mã hóa như sau: Nam=1, Nữ=0.
• Nơi sinh sống của hộ gồm thành thị và nông thôn
nên mã hóa như sau: Thành thị=1, Nông thôn=0.
(Việc chọn số mã hóa tùy nhà phân tích).

29
Dữ liệu đã mã hóa
Trình độ văn Giới
Chi tiêu của hóa của chủ Tuổi của tính chủ Nơi sinh
Mã hộ Quy mô hộ hộ hộ chủ hộ hộ sống
38820 4 10097.37 3 48 1 0
38818 6 14695.2 8 42 0 0
38817 8 11733.34 4 37 0 0
38816 3 7087.489 0 21 0 0
38815 9 22809.3 6 48 0 0
38813 4 9554.563 2 76 0 0
11212 7 69258.09 9 42 0 1
11211 3 13680.91 0 77 0 1
11209 3 27651.65 13 32 0 1
11208 4 32102.67 8 47 0 1
11207 2 11464.6 7 38 1 1
11206 4 17199.63 5 93 1 1
30
Ví dụ
Trình độ văn
Chi tiêu hóa của chủ Tuổi của Nghề nghiệp
Mã hộ Quy mô hộ của hộ hộ chủ hộ chủ hộ
38820 4 10097.37 3 48 Bác sĩ
38818 6 14695.2 8 42 Giáo viên
38817 8 11733.34 4 37 Nông dân
38816 3 7087.489 0 21 Bác sĩ
38815 9 22809.3 6 48 Giáo viên
38813 4 9554.563 2 76 Nông dân
11212 7 69258.09 9 42 Bác sĩ
11211 3 13680.91 0 77 Giáo viên
11209 3 27651.65 13 32 Nông dân
11208 4 32102.67 8 47 Bác sĩ
11207 2 11464.6 7 38 Giáo viên
11206 4 17199.63 5 93 Nông dân
31
Ví dụ
1. Nghề nghiệp có 3 nghề (3 phạm trù)
2. Chọn 1 nghề làm phạm trù cơ sở
Ví dụ: chọn bác sĩ
3. Hai nghề còn lại là hai biến mới
Vậy số biến mới = số phạm trù -1
4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên;
0 nếu không phải là giáo viên
5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông
dân; 0 nếu không phải là nông dân

32
Trình độ
văn hóa
Quy Chi tiêu của chủ Tuổi của Nghề nghiệp
Mã hộ mô hộ của hộ hộ chủ hộ chủ hộ Giáo viên Nông dân
### 4 ### 3 48 Bác sĩ 0  0
### 6 ### 8 42 Giáo viên 1  0
### 8 ### 4 37 Nông dân 0  1
### 3 ### 0 21 Bác sĩ 0  0
### 9 ### 6 48 Giáo viên 1  0
### 4 ### 2 76 Nông dân    
### 7 ### 9 42 Bác sĩ    
### 3 ### 0 77 Giáo viên    
### 3 ### 13 32 Nông dân    
### 4 ### 8 47 Bác sĩ    
### 2 ### 7 38 Giáo viên    
### 4 ### 5 93 Nông dân    

33
Câu hỏi

• Nếu có thêm nghề kế toán thì sao?

34
HỒI QUY VỚI BiẾN ĐỊNH TÍNH
Quy tắc: Nếu biến định tính có m biểu hiện thì
sử dụng m-1 biến.
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào
(1)Giới tính của chủ hộ
(2)Số thành viên trong hộ
(3)Vùng nơi hộ sinh sống (có 8 vùng)
Biến định tính là biến nào?

35
5.2 Sử dụng biến giả trong mô hình hồi quy

Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui

với
Y Tiền lương (triệu đồng/tháng)
X Bậc thợ
D=1 nếu công nhân làm trong khu vực tư nhân
D=0 nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
36
5.2 Sử dụng biến giả trong mô hình hồi quy

Y (thu nhập) X (số năm) D (nơi làm


việc)
4 3 1
5 5 0
3 3 0
6 4 1
7 5 1

37
5.2 Sử dụng biến giả trong mô hình hồi quy

E(Y/X,D) = 1 + 2Xi + 3Di (5.1)


E(Y/X,D=0) = 1 + 2Xi (5.2)
E(Y/X,D=1) = 1 + 2Xi + 3 (5.3)
(5.2): tiền lương trung bình của công nhân làm
việc trong khu vực quốc doanh với bậc thợ là X
(5.3): tiền lương trung bình của công nhân làm
việc trong khu vực tư nhân với bậc thợ là X
38
5.2 Sử dụng biến giả trong mô hình hồi quy

2 tốc độ tăng lương theo bậc thợ


3 chênh lệch tiền lương trung bình của công
nhân làm việc ở hai khu vực và cùng bậc thợ
(Giả thiết của mô hình: tốc độ tăng lương theo
bậc thợ ở hai khu vực giống nhau)

39
E(Y/X,Z) = 1 + 2Xi + 3Di
Y

ˆ1  ˆ3
ˆ3
ˆ1

X
Hình 5.1 mức thu nhập bình quân tháng của người lao động tại
KVQD và KVTN khi có bậc thợ là X

40
5.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1 và Z2 với
Z1i =1 nơi làm việc tại DNNN
Z1i =0 nơi làm việc tại nơi khác
Z2i =1 nơi làm việc tại DNTN
Z2i =0 nơi làm việc tại nơi khác

Z1i = 0 và Z2i = 0 phạm trù cơ sở


41
5.2 Sử dụng biến giả trong mô hình hồi quy

Y (thu X (số Nơi làm Z1 Z2


nhập) năm) việc
4 3 DNNN 1 0
5 5 DNTN 0 1
3 3 DNLD 0 0
6 4 DNTN 0 1
7 5 DNNN 1 0

42
5.2 Sử dụng biến giả trong mô hình hồi quy
E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i
E(Y/X,Z1=0,Z2=0) = 1 + 2Xi
E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3
E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4
• 3 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNNN và DNLD khi có cùng
thời gian làm việc X năm
• 4 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNTN và DNLD khi có cùng
thời gian làm việc X năm
43
5.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ
người lao động (từ đại học trở lên, cao đẳng và
khác)

D1i 1: nếu trình độ từ đại học trở lên


=
0: trường hợp khác
D2i = 1: nếu trình độ cao đẳng
0: trường hợp khác
Một chỉ tiêu chất lượng có n phạm trù (thuộc
tính) khác nhau thì dùng n-1 biến giả

44
5.2 Sử dụng biến giả trong mô hình hồi quy

Giả sử Y, X là biến định lượng, Z là biến giả (định tính)

TH1: Y= 1 + 2Z + 3X + U

TH2: Y= 1 + 2X + 3(ZX) + U

TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U

45
5.2 Sử dụng biến giả trong mô hình hồi quy

VD 5.4: Khảo sát lương của nhân viên theo số


năm kinh nghiệm và giới tính
TH1: Y= 1 + 2Z + 3X + U

TH2: Y= 1 + 2X + 3(ZX) + U

TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U


Trong đó
Y lương
X số năm kinh nghiệm
Z giới tính với Z=1: nam; Z=0: nữ
46
5.2 Sử dụng biến giả trong mô hình hồi quy

TH1: Lương khởi điểm của nv nam và nữ


khác nhau nhưng tốc độ tăng lương theo số
năm kinh nghiệm như nhau

TH2: Lương khởi điểm như nhau nhưng


tốc độ tăng lương khác nhau

TH3: Lương khởi điểm và tốc độ tăng


lương khác nhau

47
5.2 Sử dụng biến giả trong mô hình hồi quy
TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc
độ tăng lương theo số năm kinh nghiệm như nhau

Hàm PRF: Y= 1 + 2Z + 3X + U

Hàm SRF ứng với nữ (Z=0) :

Hàm SRF ứng với nam (Z=1) :

Yˆ  ˆ1  ˆ3 X

Yˆ  ˆ1  ˆ2  ˆ3 X 48


5.2 Sử dụng biến giả trong mô hình hồi quy

Y
Yˆ  ˆ1  ˆ2  ˆ3 X

Yˆ  ˆ1  ˆ3 X

ˆ1  ˆ2
ˆ1 , ˆ2 , ˆ3  0
̂1

0
X
Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau

49
5.2 Sử dụng biến giả trong mô hình hồi quy
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng
lương khác nhau
Hàm PRF:
Y= 1 + 2X + 3(ZX) + U

Với ZX gọi là biến tương tác


Hàm SRF ứng với nữ (Z=0) :

Hàm SRF ứng với nam (Z=1) :


Yˆ  ˆ1  ˆ2 X

Yˆ  ˆ1  ˆ2 X  ˆ3 X  ˆ1  ( ˆ2  ˆ3 ) X


50
5.2 Sử dụng biến giả trong mô hình hồi quy

Y
Yˆ  ˆ1  ( ˆ2  ˆ3 ) X

Yˆ  ˆ1  ˆ2 X

ˆ1 , ˆ2 , ˆ3  0


ˆ1

0
X
Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác
nhau
51
5.2 Sử dụng biến giả trong mô hình hồi quy
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau

Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U

Hàm SRF ứng với nữ (Z=0) :

Yˆ nam
Hàm SRF ứng với  ˆ :
(Z=1) ˆ3 X
1

Yˆ  ˆ1  ˆ2  ˆ3 X  ˆ4 X  ( ˆ1  ˆ2 )  ( ˆ3  ˆ4 ) X

52
5.2 Sử dụng biến giả trong mô hình hồi quy

Y
Yˆ  ( ˆ1  ˆ2 )  ( ˆ3  ˆ4 ) X

Yˆ  ˆ1  ˆ3 X

ˆ1  ˆ2
ˆ1 , ˆ2 , ˆ3 , ˆ4  0
ˆ1

0
X
Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau

53
54
5.3 Ứng dụng sử dụng biến giả
5.3.1 Sử dụng biến giả trong phân tích mùa
Y chi tiêu cho tiêu dùng
X thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)
TH1: Nếu yếu tố mùa chỉ TH2: Nếu yếu tố mùa có
ảnh hưởng đến hệ số ảnh hưởng đến hệ số
chặn góc
Yˆi  ˆ1  ˆ2 X i  ˆ3 Z i Yˆi  ˆ1  ˆ2 X i  ˆ3 Z i  ˆ4 X i Z i (*)
Mô hình * có tính tổng quát hơn. Qua việc kiểm định
giả thiết để biết được hệ số góc nào có ý nghĩa.
55
Ví dụ
Có bảng số liệu sau về doanh số bán từng quý
(triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến
giả và viết mô hình hồi quy.
Năm Quý Doanh số Năm Quý Doanh số
1970 1 992.7 1971 4 1918.3
1970 2 1077.6 1972 1 2163.9
1970 3 1185.9 1972 2 2417.8
1970 4 1326.4 1972 3 2631.7
1971 1 1434.2 1972 4 2957.8
1971 2 1549.2 1973 1 3069.3
1971 3 1718 1973 2 3304.8

56
Ví dụ
Năm Quý Doanh số D2 D3 D4
1970 1 992.7 0 0 0
1970 2 1077.6 1 0 0
1970 3 1185.9 0 1 0
1970 4 1326.4 0 0 1
1971 1 1434.2 0 0 0
1971 2 1549.2 1 0 0
1971 3 1718 0 1 0
1971 4 1918.3 0 0 1
1972 1 2163.9 0 0 0
1972 2 2417.8 1 0 0
1972 3 2631.7 0 1 0
1972 4 2957.8 0 0 1
1973 1 3069.3 0 0 0
1973 2 3304.8 1 0 0

57
Viết mô hình hồi quy mẫu và ý nghĩa các hệ số 58
5.3 Ứng dụng sử dụng biến giả
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy
Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước
Anh từ 1946-63 (triệu pounds)
TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập
1946 0.36 8.8 1955 0.59 15.5
1947 0.21 9.4 1956 0.9 16.7
1948 0.08 10 1957 0.95 17.7
1949 0.2 10.6 1958 0.82 18.6
1950 0.1 11 1959 1.04 19.7
1951 0.12 11.9 1960 1.53 21.1
1952 0.41 12.7 1961 1.94 22.8
1953 0.5 13.5 1962 1.75 23.9
1954 0.43 14.3 1963 1.99 25.2

59
5.3 Ứng dụng sử dụng biến giả
Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu
trúc giữa 2 thời kỳ hay không.
Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ
Thời kỳ tái thiết: 1946-54
Yi  1   2 X i  U1i (5.3.1)

Thời kỳ hậu tái thiết: 1955-63


Yi  1  2 X i  U 2i (5.3.2)

Và kiểm định các trường hợp sau


1  1 1  1 1  1 1  1
 2  2  2  2  2  2  2  2
60
Kiểm định Chow
Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau
B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS
có bậc tự do df= n1+n2-k từ mô hình hồi quy
Yi  1   2 X i  U 2i

B2: Ước lượng (5.3.1) và (5.3.2) và thu được


RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt
RSS*=RSS1+RSS2
B3: Tính F
 *
RSS  RSS / k 
*
RSS /( n1  n2  2k )

B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0


61
62
63
64
5.3 Ứng dụng sử dụng biến giả
Cách 2 Sử dụng biến giả
B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ

Yi  ˆ1  ˆ2 X i  ˆ3 Z i  ˆ4 X i Z i  ei


Với n = n1 + n2
Z=1 quan sát thuộc thời kỳ tái thiết
Z=0 quan sát thuộc thời kỳ hậu tái thiết
B2. Kiểm định giả thiết H0: 3=0
Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình
B3. Kiểm định giả thiết H0: 4=0
Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình
65
66
5.3 Ứng dụng sử dụng biến giả
Kết quả hồi quy theo mô hình như sau
Yi  1,75  0,15045 X i  1,4839Z i  0,1034 X i Z i  ei
t = (-5,27) (9,238) (3,155) (-3,109)
p = (0,000) (0,000) (0,007) (0,008)
Nhận xét
•Tung độ gốc chênh lệch và hệ số góc chênh lệch
có ý nghĩa thống kê
•Các hồi quy trong hai thời kỳ là khác nhau

67
5.3 Ứng dụng sử dụng biến giả

Thời kỳ tái thiết: Z = 1

Yˆi  1,75  0,15045 X i  1,4839  0,1034 X i


Yˆi  0,2661  0,0475 X i
Thời kỳ hậu tái thiết: Z = 0

Yˆi  1,75  0,15045 X i

68
5.3 Ứng dụng sử dụng biến giả

Tiết kiệm Yˆi  1,75  0,15045 X i


Thời kỳ hậu tái thiết
Yˆi  0,2661  0,0475 X i

Thời kỳ tái thiết


Thu nhập
-0.27

-1.75

Hình 5.6 Mô hình hồi quy cho 2 thời kỳ

69
5.3 Ứng dụng sử dụng biến giả
5.3.3. Hàm tuyến tính từng khúc
Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng
sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng
*
Yi  1   2 X i   3 ( X i  X ) Z i  ui
Y Tiền hoa hồng
X Doanh thu
X* Giá trị ngưỡng sản lượng
Zi =1 nếu Xi > X*
Zi =0 nếu Xi ≤ X*
70
5.3 Ứng dụng sử dụng biến giả
Y

X *
X
Hình 5.7 Hàm tuyến tính từng khúc
•Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
71
5.3 Ứng dụng sử dụng biến giả
Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
*
Yi  1   2 X i   3 ( X i  X ) Z i  ui
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng


1 : X i  X *

Z1i   *

0 : X i  X
72
5.3 Ứng dụng sử dụng biến giả

CP 256 414 634 778 1003


SL 1000 2000 3000 4000 5000
CP 1839 2081 2423 2734 2914
SL 6000 7000 8000 9000 10000

Ta có kết quả hồi quy như sau:

*
Yi  145,717  0,279 X i  0,095( X i  X ) Z i  ei
= (-0,824) (6,607) (1,145)
R2 = 0,9737 X* = 5500
73

You might also like