Professional Documents
Culture Documents
Chuong 7Biến Giả Trong Phân Tích Hồi Quy
Chuong 7Biến Giả Trong Phân Tích Hồi Quy
2. Sử dụng
3. Ứng dụng
1. Khái biến giả
biến giả
niệm biến trong mô
trong phân
giả hình hồi
tích hồi quy
quy
1. Khái niệm biến giả
• Biến định lượng: Các giá trị quan sát được thể hệ bằng
con số
• Biến định tính: Các giá trị quan sát là các thuộc tính, các
thuộc tính này được mã hóa bằng các con số.
• Ví dụ:
• Giới tính: các thuộc tính của giới tính là Nam, Nữ
• Ngành học: CNTT, QTKD, TCNH,..
• Để đưa những thuộc tính của biến định tính vào mô hình
hồi quy, cần lượng hóa chúng => sử dụng biến giả
(dummy variables)
• Biến định tính ……………..> Biến giả Di =
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Ví dụ 1: Mô hình hồi quy về mức thu nhập của công chức (Y) phụ
thuộc vào giới tính (D)
• Biến phụ thuộc (thu nhập) là biến Y
• Đặt:
• D = 1 nếu Công chức là Nam
• D = 0 nếu Công chức là Nữ
• Khi đó mô hình sẽ là:
• Y = 1 + 2D + u
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Ví dụ 2:
• Mô hình hồi quy về mức thu nhập của công chức (Y) phụ thuộc vào
khu vực làm việc (D): Nông thôn; Thành thị; Miền núi
• Khi đó đặt biến giả D:
• D2i =
• D3i =
• Mô hình hồi quy có dạng:
• Y = 1 + 2D2i + 2D3i + u
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình chỉ có biến giả
• Tổng quát:
• Biến định tính có m thuộc tính/ tính chất A 1, A2, …, Am
• Ta đặt tối đa m-1 biến giả
• D1 = 1 khi m có giá trị A1; D1 = 0 khi m có giá trị Ai*
• D2 = 1 khi m có giá trị A2; D2 = 0 khi m có giá trị Ai*
• ….
• Dm-1 = 1 khi m có giá trị Am-1 ; Dm-1 =0 khi m có giá trị Ai*
• Giá trị D1 = D2 = … = Dm-1 = 0 được gọi là giá trị cơ sở
• Khuyến nghị: Khi tạo biến giả, việc gán trị trị nên thực hiện theo
kiểu liệt kê
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• Trong đó:
• X: Bậc thợ
• D=0: Nếu công nhân làm trong khu vực nhà nước
• (7.2): Tiền lương trung bình của công nhân làm việc trong
khu vực quốc doanh với bậc thợ là X
• (7.3): Tiền lương trung bình của công nhân làm việc trong
khu vực tư nhân với bậc thợ là X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• 3 Chênh lệch tiền lương trung bình của công nhân làm việc
ở hai khu vực và cùng bậc thợ
• (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai
khu vực giống nhau)
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
ˆ1 ˆ3
̂ 3
ˆ1
X
Hình 7.1 Mức thu nhập bình quân tháng của người lao động tại KVQD
và KVTN khi có bậc thợ là X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• Ví dụ 4: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào
thời gian công tác (X) (năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
• Dùng 2 biến giả Z1 và Z2 với
Z1i =1 Nơi làm việc tại DNNN
Z1i =0 Nơi làm việc tại nơi khác
Z2i =1 Nơi làm việc tại DNTN
Z2i =0 Nơi làm việc tại nơi khác
Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác
nhau thì dùng n-1 biến giả
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• Các trường hợp:
• Trường hợp 1: Tác động lên hệ số chặn
• E(Y/Xi,Di) = 1 + 2Xi + 3Di
• Trường hợp 2: Tác động lên hệ số góc
• E(Y/Xi,Di) = 1 + 2Xi + 3(DX)i
• Trường hợp 3: Tác động lên cả hai hệ số:
• E(Y/Xi,Di) = 1 + 2Xi + 3Di + 4(DX)i
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• VD 6: Khảo sát lương của giáo viên theo số năm giảng dạy
• Mô hình: Yi = 1 + 3Xi
• Trong đó
• Y lương giáo viên
• X số năm giảng dạy
• và xem xét yếu tố giới tính có tác động đến thu nhập không
• Z giới tính với Z=1: nam; Z=0: nữ
TH1: Lương khởi điểm của gv nam và nữ khác nhau nhưng tốc độ
tăng lương theo số năm giảng dạy như nhau
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác
nhau
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH1: Dịch chuyển số hạng tung độ gốc
Yˆ ˆ1 ˆ3 X
• Hàm SRF ứng với nam (Z=1) :
•
Yˆ ˆ1 ˆ2 ˆ3 X
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
Y
Yˆ ˆ1 ˆ2 ˆ3 X
Yˆ ˆ1 ˆ3 X
ˆ1 ˆ2
ˆ1 , ˆ2 , ˆ3 0
ˆ1
0
X
Hình 7.2 Lương khởi điểm của gv nam và nữ khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH2: Dịch chuyển số hạng độ dốc
• Hàm PRF: Y= 1 + 2X + 3(ZX) + U
• Với ZX gọi là biến tương tác
• Hàm SRF ứng với nữ (Z=0) :
Yˆ ˆ1 ˆ2 X
Y
Yˆ ˆ1 ( ˆ2 ˆ3 ) X
Yˆ ˆ1 ˆ2 X
0
X
Hình 7.3 Mức tăng lương theo số năm giảng dạy của gv nam và nữ khác nhau
2. Sử dụng biến giả trong mô hình hồi quy
Mô hình có biến giả và biến định lượng
• TH3: Dịch chuyển số hạng tung độ gốc và số hạng độ dốc
Y
Yˆ ( ˆ1 ˆ2 ) ( ˆ3 ˆ4 ) X
Yˆ ˆ1 ˆ3 X
ˆ1 ˆ2
0
X
Hình 7.4 Lương khởi điểm và mức tăng lương của gv nam
và nữ khác nhau
3. Các bước xây dựng mô hình hồi quy biến giả
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Nêu ý nghĩa của từng hệ số hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước
• Xác định các tính chất trên có ảnh hưởng đến mô hình không?
• Dự báo và làm chính sách
4. Ứng dụng biến giả trong phân tích hồi quy
4.1 Sử dụng biến giả trong phân tích hồi quy 2 biến
• Y biến phụ thuộc
• Z biến định tính
• Z = 1 doanh số bán ở thị trường thành thị
• Z = 0 doanh số bán ở thị trường nông thôn
ˆ ˆ ˆ
Yi 1 2 Z i
Mối quan hệ giữa doanh số bán và thị trường
Sản lượng bán (ngàn sản phẩm) Thị trường
37 Nông thôn
40 Thành thị
42 Thành thị
35 Nông thôn
37 Nông thôn
48 Thành thị
35 Nông thôn
43 Thành thị
45 Thành thị
37 Nông thôn
Bảng số liệu biến thị trường sau khi đặt biến giả
Y Z
37 0
40 1
42 1
35 0
37 0
48 1
35 0
43 1
45 1
37 0
Bảng Y và Z và những giá trị tương ứng
TT Y Z Z2 Y2 ZY
1 37 0 0 1369 0
2 40 1 1 1600 40
3 42 1 1 1764 42
4 35 0 0 1225 0
5 37 0 0 1369 0
6 48 1 1 2304 48
7 35 0 0 1225 0
8 43 1 1 1849 43
9 45 1 1 2025 45
10 37 0 0 1369 0
Tổng 399 5 5 16099 218
Tính hệ số Beta
Y Z i i n.Z .Y
ˆ2 i 1
n
7, 4
i
Z 2
i 1
n.( Z ) 2
ˆ 2 ˆ
ESS (Yi Y ) ( ) zi 136,9
2 2
ˆ 2
e 2
i
5,25
n2
Sai số chuẩn của các ước lượng
var( ˆ1 )
X i
2
.
2
1,05
z
2
n
i
2 ESS RSS i
e 2
R 1 1 i 1
n
0,765
TSS TSS
i 1
yi2
2
r R 0,874
KHOẢNG TIN CẬY CỦA HỆ SỐ HỒI QUY
• Xác suất của khoảng ( - i, + i) chứa giá trị thực của i là 1
- hay:
• P( - i i + i) = 1 - .
• Với:
i t ( / 2 , n 2 ) SE ( ˆi )
• Với độ tin cậy 95% thì α = 1 - 95% = 5%
• t(8;0,025)= 2,306
• 4,0582 2 10,7417
• 33,8370 1 38,5629
Kiểm định giả thuyết
ˆ2
t ˆ 5,1066
2
SE ( ˆ2 )
tβ2 =5,1066 > 2,306 nên bác bỏ H0 chấp nhận H1:β2≠0, nhìn
lại khoảng β2 [4,0582;10,7417] như vậy, khoảng này không
có số 0 nên chấp nhận hệ số β2.
Kiểm định giả thuyết
ˆ
2
t ˆ 5,1066
2 ˆ
SE ( 2 )
tβ2 =5,1066 > 2,306 nên bác bỏ H0 chấp nhận H1:β2≠0, nhìn lại
khoảng β2 [4,0582;10,7417] như vậy, khoảng này không có số
0 nên chấp nhận hệ số β2.
Kiểm định giả thuyết
2
R ( n 2)
F 2
26,0761
1 R
• So sánh với F(α,1,n-2) = 5,32 bằng cách tra bảng phân phối
chuẩn F.
• Với kết quả tính ở trên thì F = 26,0761>5,32 hàm số được
chấp nhận dùng dự báo.
BÀI TẬP NHÓM
• BÀI 1
• Người ta tiến hành điều tra về mức chi tiêu cá nhân bình quân (Y)
giữa Nam và Nữ (giới tính).
• Nhóm hãy:
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước
BÀI TẬP NHÓM
• BÀI 1
• Người ta tiến hành điều tra về mức chi tiêu cá nhân bình quân (Y)
giữa Nam và Nữ (giới tính).
• Nhóm hãy:
• Xác định hệ số hồi quy của hàm hồi hồi quy mẫu
• Nêu ý nghĩa của từng hệ số hồi quy mẫu
• Kiểm định giả thuyết hệ số hàm hồi quy mẫu
• Kiểm định giả thuyết hàm hồi quy mẫu
• Xác định hệ số hồi quy của hàm hồi quy tổng thể
• Kiểm định giả thuyết hệ số hồi quy tổng thể với mức ý nghĩa cho
trước