You are on page 1of 37

CHƯƠNG 7

BIẾN GIẢ TRONG PHÂN


TÍCH HỒI QUY
Lecturer: Nguyễn Văn Phú
nguyenvanphu@iuh.edu.vn
NỘI DUNG

2. Sử dụng
3. Ứng dụng
1. Khái biến giả
biến giả
niệm biến trong mô
trong phân
giả hình hồi
tích hồi quy
quy
1. Khái niệm biến giả
• Biến định lượng: Các giá trị quan sát được thể hệ bằng
con số
• Biến định tính: Các giá trị quan sát là các thuộc tính, các
thuộc tính này được mã hóa bằng các con số.
• Ví dụ:
• Giới tính: các thuộc tính của giới tính là Nam, Nữ
• Ngành học: CNTT, QTKD, TCNH,..
• Để đưa những thuộc tính của biến định tính vào mô hình
hồi quy, cần lượng hóa chúng => sử dụng biến giả
(dummy variables)
• Biến định tính ……………..> Biến giả Di =
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Ví dụ 1: Mô hình hồi quy về mức thu nhập của công chức (Y) phụ
thuộc vào giới tính (D)
• Biến phụ thuộc (thu nhập) là biến Y
• Đặt:
• D = 1 nếu Công chức là Nam
• D = 0 nếu Công chức là Nữ
• Khi đó mô hình sẽ là:
• Y = 1 + 2D + u
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Ví dụ 2:
• Mô hình hồi quy về mức thu nhập của công chức (Y) phụ thuộc vào
khu vực làm việc (D): Nông thôn; Thành thị; Miền núi
• Khi đó đặt biến giả D:
• D2i =
• D3i =
• Mô hình hồi quy có dạng:
• Y = 1 + 2D2i + 2D3i + u
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Tổng quát:
• Biến định tính có m thuộc tính/ tính chất A 1, A2, …, Am
• Ta đặt tối đa m-1 biến giả
• D1 = 1 khi m có giá trị A1; D1 = 0 khi m có giá trị Ai*
• D2 = 1 khi m có giá trị A2; D2 = 0 khi m có giá trị Ai*
• ….
• Dm-1 = 1 khi m có giá trị Am-1 ; Dm-1 =0 khi m có giá trị Ai*
• Giá trị D1 = D2 = … = Dm-1 = 0 được gọi là giá trị cơ sở
• Khuyến nghị: Khi tạo biến giả, việc gán trị trị nên thực hiện theo
kiểu liệt kê
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

• Ví dụ 3: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui

• Trong đó:

• Y: Tiền lương (triệu đồng/tháng)

• X: Bậc thợ

• D=1: Nếu công nhân làm trong khu vực tư nhân

• D=0: Nếu công nhân làm trong khu vực nhà nước

• D được gọi là biến giả trong mô hình


2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

• E(Y/X,D) = 1 + 2Xi + 3Di (7.1)

• E(Y/X,D=0) = 1 + 2Xi (7.2)

• E(Y/X,D=1) = 1 + 2Xi + 3 (7.3)

• (7.2): Tiền lương trung bình của công nhân làm việc trong
khu vực quốc doanh với bậc thợ là X
• (7.3): Tiền lương trung bình của công nhân làm việc trong
khu vực tư nhân với bậc thợ là X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

• 2 Tốc độ tăng lương theo bậc thợ

• 3 Chênh lệch tiền lương trung bình của công nhân làm việc
ở hai khu vực và cùng bậc thợ
• (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai
khu vực giống nhau)
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

E(Y/X,Z) = 1 + 2Xi + 3Di


Y

ˆ1  ˆ3
̂ 3
ˆ1

X
Hình 7.1 Mức thu nhập bình quân tháng của người lao động tại KVQD
và KVTN khi có bậc thợ là X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• Ví dụ 4: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào
thời gian công tác (X) (năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
• Dùng 2 biến giả Z1 và Z2 với
Z1i =1 Nơi làm việc tại DNNN
Z1i =0 Nơi làm việc tại nơi khác
Z2i =1 Nơi làm việc tại DNTN
Z2i =0 Nơi làm việc tại nơi khác

Z1i = 0 và Z2i = 0 phạm trù cơ sở


2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i (7.4)

• E(Y/X,Z1=0,Z2=0) = 1 + 2Xi (7.5)


(7.6)
• E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3
(7.7)
• E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4
• 3 Chênh lệch thu nhập trung bình của nhân viên làm việc
tại DNNN và DNLD khi có cùng thời gian làm việc X năm
• 4 Chênh lệch thu nhập trung bình của nhân viên làm việc
tại DNTN và DNLD khi có cùng thời gian làm việc X năm
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
Ví dụ 5. thu nhập còn phụ thuộc vào trình độ người lao
động (từ đại học trở lên, cao đẳng và khác)

D1i = 1: nếu trình độ từ đại học trở lên


0: trường hợp khác
D2i = 1: nếu trình độ cao đẳng
0: trường hợp khác

Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác
nhau thì dùng n-1 biến giả
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• Các trường hợp:
• Trường hợp 1: Tác động lên hệ số chặn
• E(Y/Xi,Di) = 1 + 2Xi + 3Di
• Trường hợp 2: Tác động lên hệ số góc
• E(Y/Xi,Di) = 1 + 2Xi + 3(DX)i
• Trường hợp 3: Tác động lên cả hai hệ số:
• E(Y/Xi,Di) = 1 + 2Xi + 3Di + 4(DX)i
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• VD 6: Khảo sát lương của giáo viên theo số năm giảng dạy
• Mô hình: Yi = 1 + 3Xi
• Trong đó
• Y lương giáo viên
• X số năm giảng dạy
• và xem xét yếu tố giới tính có tác động đến thu nhập không
• Z giới tính với Z=1: nam; Z=0: nữ
TH1: Lương khởi điểm của gv nam và nữ khác nhau nhưng tốc độ
tăng lương theo số năm giảng dạy như nhau
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác
nhau
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH1: Dịch chuyển số hạng tung độ gốc

• Hàm PRF: Y= 1 + 2Z + 3X + U

• Hàm SRF ứng với nữ (Z=0) :

Yˆ  ˆ1  ˆ3 X
• Hàm SRF ứng với nam (Z=1) :

Yˆ  ˆ1  ˆ2  ˆ3 X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

Y
Yˆ  ˆ1  ˆ2  ˆ3 X

Yˆ  ˆ1  ˆ3 X

ˆ1  ˆ2
ˆ1 , ˆ2 , ˆ3  0
ˆ1

0
X
Hình 7.2 Lương khởi điểm của gv nam và nữ khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH2: Dịch chuyển số hạng độ dốc
• Hàm PRF: Y= 1 + 2X + 3(ZX) + U
• Với ZX gọi là biến tương tác
• Hàm SRF ứng với nữ (Z=0) :
Yˆ  ˆ1  ˆ2 X

• Hàm SRF ứng với nam (Z=1) :

Yˆ  ˆ1  ˆ2 X  ˆ3 X  ˆ1  ( ˆ2  ˆ3 ) X


2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

Y
Yˆ  ˆ1  ( ˆ2  ˆ3 ) X

Yˆ  ˆ1  ˆ2 X

ˆ1 , ˆ2 , ˆ3  0


ˆ1

0
X
Hình 7.3 Mức tăng lương theo số năm giảng dạy của gv nam và nữ khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH3: Dịch chuyển số hạng tung độ gốc và số hạng độ dốc

• Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U

• Hàm SRF ứng với nữ (Z=0) :


Yˆ  ˆ1  ˆ3 X

• Hàm SRF ứng với nam (Z=1) :


Yˆ  ˆ1  ˆ2  ˆ3 X  ˆ4 X  ( ˆ1  ˆ2 )  ( ˆ3  ˆ4 ) X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng

Y
Yˆ  ( ˆ1  ˆ2 )  ( ˆ3  ˆ4 ) X

Yˆ  ˆ1  ˆ3 X

ˆ1  ˆ2

ˆ1 , ˆ2 , ˆ3 , ˆ4  0


ˆ1

0
X

Hình 7.4 Lương khởi điểm và mức tăng lương của gv nam
và nữ khác nhau
3. Các bước xây dựng mô hình hồi quy biến giả
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Nêu ý nghĩa của từng hệ số hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước
• Xác định các tính chất trên có ảnh hưởng đến mô hình không?
• Dự báo và làm chính sách
4. Ứng dụng biến giả trong phân tích hồi quy
4.1 Sử dụng biến giả trong phân tích hồi quy 2 biến
• Y biến phụ thuộc
• Z biến định tính
• Z = 1 doanh số bán ở thị trường thành thị
• Z = 0 doanh số bán ở thị trường nông thôn

ˆ ˆ ˆ
Yi  1   2 Z i
Mối quan hệ giữa doanh số bán và thị trường
Sản lượng bán (ngàn sản phẩm) Thị trường

37 Nông thôn
40 Thành thị
42 Thành thị
35 Nông thôn
37 Nông thôn
48 Thành thị
35 Nông thôn
43 Thành thị
45 Thành thị
37 Nông thôn
Bảng số liệu biến thị trường sau khi đặt biến giả
Y Z
37 0
40 1
42 1
35 0
37 0
48 1
35 0
43 1
45 1
37 0
Bảng Y và Z và những giá trị tương ứng
TT Y Z Z2 Y2 ZY
1 37 0 0 1369 0
2 40 1 1 1600 40
3 42 1 1 1764 42
4 35 0 0 1225 0
5 37 0 0 1369 0
6 48 1 1 2304 48
7 35 0 0 1225 0
8 43 1 1 1849 43
9 45 1 1 2025 45
10 37 0 0 1369 0
Tổng 399 5 5 16099 218
Tính hệ số Beta

Y Z i i  n.Z .Y
ˆ2  i 1
n
 7, 4
 i
Z 2

i 1
 n.( Z ) 2

ˆ1  Y  ˆ2 Z  36,2


Hàm hồi quy mẫu có dạng
Sản lượng bán = 36,2 + 7,4 (thị trường)
Ý nghĩa của hàm hồi quy
- Doanh nghiệp bán ở thị trường sản lượng trung bình là 43,6 đơn vị
sản phẩm.
- Doanh nghiệp bán ở thị trường nông thôn sản lượng trung bình là
36,2 đơn vị sản phẩm.
CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH

TSS   (Yi  Y ) 2   Yi 2  n.(Y ) 2   yi2  178,9

ˆ 2 ˆ
ESS   (Yi  Y )  (  )  zi  136,9
2 2

RSS   ei2   (Yi  Yˆi ) 2   yi2  ˆ22  zi2  42

ˆ 2

e 2
i
 5,25
n2
Sai số chuẩn của các ước lượng

var( ˆ1 ) 
X i
2

.
 2
 1,05
z
2
n
i

se ( ˆ1 )  var( ˆ1 )  1,02469508


2
ˆ 
var(  2 )   2,1
z 2
i

se ( ˆ2 )  var( ˆ2 )  1,44913767


Xác định độ phù hợp của hàm hồi quy mẫu
n

2 ESS RSS  i
e 2

R   1  1 i 1
n
 0,765
TSS TSS

i 1
yi2

2
r  R  0,874
KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
• Xác suất của khoảng ( - i, + i) chứa giá trị thực của i là 1
-  hay:
• P( - i  i  + i) = 1 - .
• Với:

 i  t ( / 2 , n  2 ) SE ( ˆi )
• Với độ tin cậy 95% thì α = 1 - 95% = 5%
• t(8;0,025)= 2,306
• 4,0582 2  10,7417
• 33,8370 1  38,5629
Kiểm định giả thuyết

ˆ2
t ˆ   5,1066
2
SE ( ˆ2 )

tβ2 =5,1066 > 2,306 nên bác bỏ H0 chấp nhận H1:β2≠0, nhìn
lại khoảng β2 [4,0582;10,7417] như vậy, khoảng này không
có số 0 nên chấp nhận hệ số β2.
Kiểm định giả thuyết
ˆ
2
t ˆ   5,1066
2 ˆ
SE (  2 )

tβ2 =5,1066 > 2,306 nên bác bỏ H0 chấp nhận H1:β2≠0, nhìn lại
khoảng β2 [4,0582;10,7417] như vậy, khoảng này không có số
0 nên chấp nhận hệ số β2.
Kiểm định giả thuyết

2
R ( n  2)
F 2
 26,0761
1 R

• So sánh với F(α,1,n-2) = 5,32 bằng cách tra bảng phân phối
chuẩn F.
• Với kết quả tính ở trên thì F = 26,0761>5,32 hàm số được
chấp nhận dùng dự báo.
BÀI TẬP NHÓM
• BÀI 1
• Người ta tiến hành điều tra về mức chi tiêu cá nhân bình quân (Y)
giữa Nam và Nữ (giới tính).
• Nhóm hãy:
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước
BÀI TẬP NHÓM
• BÀI 1
• Người ta tiến hành điều tra về mức chi tiêu cá nhân bình quân (Y)
giữa Nam và Nữ (giới tính).
• Nhóm hãy:
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước

You might also like