Professional Documents
Culture Documents
2
NỘI DUNG
• Biến định lượng: các giá trị quan sát được thể
hệ bằng con số
• Biến định tính: thể hiện một số tính chất nào
đó
• Để đưa những thuộc tính của biến định tính
vào mô hình hồi quy, cần lượng hóa chúng =>
sử dụng biến giả (dummy variables)
4
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ
Zi B A A B B A B A A B
Yi 28 32 35 27 25 37 29 34 33 30
Trong đó Yi : năng suất
Zi: công nghệ tương ứng
5
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ
6
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ
8
5.2. MÔ HÌNH TRONG ĐÓ BIẾN GiẢI THÍCH ĐỀU LÀ BIẾN GiẢ
9
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH
• Ví dụ: khảo sát lượng hàng bán được ở một cửa hàng,
người ta thu được các số liệu cho ở bảng sau:
Yi 20 19 18 18 17 17 16 16 15 15 14 14 13 12 12 15 16 12 10 11
xi
2 3 3 4 4 3 4 4 5 5 5 6 6 7 7 5 4 7 8 8
1 0 1 0 1 1 0 1 1 1 0 1 0 1 0 1 0 1 0 1
Di
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán
Di: Khu vực khảo sát: Di = 0 nếu khu vực khảo sát ở nông
thôn, Di = 1 nếu khu vực khảo sát ở thành phố
10
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH
11
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH
Với ví dụ trên: giả sử khu vực khảo sát được chia làm ba vùng
khác nhau gồm thành thị, nông thôn, miền núi.
Chúng ta sử dụng mấy biến giả?
Chúng ta sử dụng mô hình sau
Yi = β1 + β2Xi + β3D1i + β4D2i + Ui
Trong đó Yi : Lượng hàng bán được (tấn/tháng)
Xi: giá bán; Di: Khu vực khảo sát: với 2 biến giả D1i và D2i
D1i = 1 nếu khu vực khảo sát ở nông thôn, D1i = 0 nếu khu vực
khảo sát ở nơi khác,
D2i = 1 nếu khu vực khảo sát ở thành phố, D2i = 0 nếu khu vực
khảo sát ở nơi khác
12
5.3. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ MỘT BIẾN ĐỊNH
TÍNH
Giả sử chúng ta muốn ước lượng mức thu nhập của nhân
viên bán hàng được quyết định bởi số năm kinh nghiệm,
trình độ học vấn (dưới đại học, đại học, trên đại học) và
giới tính nam hay nữ (để xem giới tính có ảnh hưởng thu
nhập hay không). Mấy phạm trù, đặt máy biến giả ?
14
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH
16
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH
17
5.4. HỒI QUY VỚI MỘT BIẾN ĐỊNH LƯỢNG VÀ HAI BIẾN ĐỊNH
TÍNH
Giả sử ta hồi quy thu nhập (biến Y) của nhân viên nam và
nữ, có mức lương khởi điểm (β1) và thâm niên công tác
(Biến X). Trong đó thâm niên công tác như nhau nhưng
tốc độ tăng lương giữa nam và nữ có thể khác nhau.
Giả sử đặt hệ số tăng lương của nhân viên nữ là β2 , hệ số
tăng lương của nhân viên nam khác nhân viên nữ một
khoảng α2 tức hệ số tăng lương của nhân viên nam là (β2 +
α2)
19
5.5. BIẾN GiẢ VỚI HỆ SỐ GÓC KHÁC NHAU
20
5.6. BIẾN GiẢ VỚI TUNG ĐỘ GỐC VÀ HỆ SỐ GÓC KHÁC NHAU
24
5.9. HỒI QUY TUYẾN TÍNH TỪNG KHÚC
25
5.10. HỒI QUY BiẾN PHỤ THUỘC LÀ BiẾN GiẢ
26
27
Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của
chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi
sinh sống của hộ
Trình độ Tuổi
văn hóa của Giới
Quy của chủ chủ tính
Mã hộ mô hộ Chi tiêu của hộ hộ hộ chủ hộ Nơi sinh sống
38820 4 10097.37 3 48 Nam Nông thôn
38818 6 14695.2 8 42 Nữ Nông thôn
38817 8 11733.34 4 37 Nữ Nông thôn
38816 3 7087.489 0 21 Nữ Nông thôn
38815 9 22809.3 6 48 Nữ Nông thôn
38813 4 9554.563 2 76 Nữ Nông thôn
11212 7 69258.09 9 42 Nữ Thành thị
11211 3 13680.91 0 77 Nữ Thành thị
11209 3 27651.65 13 32 Nữ Thành thị
11208 4 32102.67 8 47 Nữ Thành thị
11207 2 11464.6 7 38 Nam Thành thị
11206 4 17199.63 5 93 Nam Thành thị
28
Ví dụ
• Có hai biến độc lập định tính là giới tính của chủ
hộ và nơi sinh sống của hộ. Để phân tích hồi quy
cần phải lượng hóa hai biến định tính này.
• Thực hiện: Giới tính gồm hai biểu hiện là nam và
nữ và mã hóa như sau: Nam=1, Nữ=0.
• Nơi sinh sống của hộ gồm thành thị và nông thôn
nên mã hóa như sau: Thành thị=1, Nông thôn=0.
(Việc chọn số mã hóa tùy nhà phân tích).
29
Dữ liệu đã mã hóa
Trình độ văn Giới
Chi tiêu của hóa của chủ Tuổi của tính chủ Nơi sinh
Mã hộ Quy mô hộ hộ hộ chủ hộ hộ sống
38820 4 10097.37 3 48 1 0
38818 6 14695.2 8 42 0 0
38817 8 11733.34 4 37 0 0
38816 3 7087.489 0 21 0 0
38815 9 22809.3 6 48 0 0
38813 4 9554.563 2 76 0 0
11212 7 69258.09 9 42 0 1
11211 3 13680.91 0 77 0 1
11209 3 27651.65 13 32 0 1
11208 4 32102.67 8 47 0 1
11207 2 11464.6 7 38 1 1
11206 4 17199.63 5 93 1 1
30
Ví dụ
Trình độ văn
Chi tiêu hóa của chủ Tuổi của Nghề nghiệp
Mã hộ Quy mô hộ của hộ hộ chủ hộ chủ hộ
38820 4 10097.37 3 48 Bác sĩ
38818 6 14695.2 8 42 Giáo viên
38817 8 11733.34 4 37 Nông dân
38816 3 7087.489 0 21 Bác sĩ
38815 9 22809.3 6 48 Giáo viên
38813 4 9554.563 2 76 Nông dân
11212 7 69258.09 9 42 Bác sĩ
11211 3 13680.91 0 77 Giáo viên
11209 3 27651.65 13 32 Nông dân
11208 4 32102.67 8 47 Bác sĩ
11207 2 11464.6 7 38 Giáo viên
11206 4 17199.63 5 93 Nông dân
31
Ví dụ
1. Nghề nghiệp có 3 nghề (3 phạm trù)
2. Chọn 1 nghề làm phạm trù cơ sở
Ví dụ: chọn bác sĩ
3. Hai nghề còn lại là hai biến mới
Vậy số biến mới = số phạm trù -1
4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên;
0 nếu không phải là giáo viên
5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông
dân; 0 nếu không phải là nông dân
32
Trình độ
văn hóa
Quy Chi tiêu của chủ Tuổi của Nghề nghiệp
Mã hộ mô hộ của hộ hộ chủ hộ chủ hộ Giáo viên Nông dân
### 4 ### 3 48 Bác sĩ 0 0
### 6 ### 8 42 Giáo viên 1 0
### 8 ### 4 37 Nông dân 0 1
### 3 ### 0 21 Bác sĩ 0 0
### 9 ### 6 48 Giáo viên 1 0
### 4 ### 2 76 Nông dân
### 7 ### 9 42 Bác sĩ
### 3 ### 0 77 Giáo viên
### 3 ### 13 32 Nông dân
### 4 ### 8 47 Bác sĩ
### 2 ### 7 38 Giáo viên
### 4 ### 5 93 Nông dân
33
Câu hỏi
34
HỒI QUY VỚI BiẾN ĐỊNH TÍNH
Quy tắc: Nếu biến định tính có m biểu hiện thì
sử dụng m-1 biến.
Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào
(1)Giới tính của chủ hộ
(2)Số thành viên trong hộ
(3)Vùng nơi hộ sinh sống (có 8 vùng)
Biến định tính là biến nào?
35
5.2 Sử dụng biến giả trong mô hình hồi quy
với
Y Tiền lương (triệu đồng/tháng)
X Bậc thợ
D=1 nếu công nhân làm trong khu vực tư nhân
D=0 nếu công nhân làm trong khu vực nhà nước
D được gọi là biến giả trong mô hình
36
5.2 Sử dụng biến giả trong mô hình hồi quy
37
5.2 Sử dụng biến giả trong mô hình hồi quy
39
E(Y/X,Z) = 1 + 2Xi + 3Di
Y
ˆ1 ˆ3
ˆ3
ˆ1
X
Hình 5.1 mức thu nhập bình quân tháng của người lao động tại
KVQD và KVTN khi có bậc thợ là X
40
5.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y)
(triệu đồng/tháng) vào thời gian công tác (X)
(năm) và nơi làm việc của người lao động
(DNNN, DNTN và DNLD)
Dùng 2 biến giả Z1 và Z2 với
Z1i =1 nơi làm việc tại DNNN
Z1i =0 nơi làm việc tại nơi khác
Z2i =1 nơi làm việc tại DNTN
Z2i =0 nơi làm việc tại nơi khác
42
5.2 Sử dụng biến giả trong mô hình hồi quy
E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i
E(Y/X,Z1=0,Z2=0) = 1 + 2Xi
E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3
E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4
• 3 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNNN và DNLD khi có cùng
thời gian làm việc X năm
• 4 chênh lệch thu nhập trung bình của nhân
viên làm việc tại DNTN và DNLD khi có cùng
thời gian làm việc X năm
43
5.2 Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ
người lao động (từ đại học trở lên, cao đẳng và
khác)
44
5.2 Sử dụng biến giả trong mô hình hồi quy
45
5.2 Sử dụng biến giả trong mô hình hồi quy
47
5.2 Sử dụng biến giả trong mô hình hồi quy
TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc
độ tăng lương theo số năm kinh nghiệm như nhau
Yˆ ˆ1 ˆ3 X
Y
Yˆ ˆ1 ˆ2 ˆ3 X
Yˆ ˆ1 ˆ3 X
ˆ1 ˆ2
ˆ1 , ˆ2 , ˆ3 0
̂1
0
X
Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau
49
5.2 Sử dụng biến giả trong mô hình hồi quy
TH2: Lương khởi điểm như nhau nhưng tốc độ tăng
lương khác nhau
Hàm PRF:
Y= 1 + 2X + 3(ZX) + U
Y
Yˆ ˆ1 ( ˆ2 ˆ3 ) X
Yˆ ˆ1 ˆ2 X
0
X
Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác
nhau
51
5.2 Sử dụng biến giả trong mô hình hồi quy
TH3: Lương khởi điểm và tốc độ tăng lương khác nhau
Yˆ nam
Hàm SRF ứng với ˆ :
(Z=1) ˆ3 X
1
52
5.2 Sử dụng biến giả trong mô hình hồi quy
Y
Yˆ ( ˆ1 ˆ2 ) ( ˆ3 ˆ4 ) X
Yˆ ˆ1 ˆ3 X
ˆ1 ˆ2
ˆ1 , ˆ2 , ˆ3 , ˆ4 0
ˆ1
0
X
Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau
53
54
5.3 Ứng dụng sử dụng biến giả
5.3.1 Sử dụng biến giả trong phân tích mùa
Y chi tiêu cho tiêu dùng
X thu nhập
Z = 1 nếu quan sát trong mùa (tháng 1-6)
Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12)
TH1: Nếu yếu tố mùa chỉ TH2: Nếu yếu tố mùa có
ảnh hưởng đến hệ số ảnh hưởng đến hệ số
chặn góc
Yˆi ˆ1 ˆ2 X i ˆ3 Z i Yˆi ˆ1 ˆ2 X i ˆ3 Z i ˆ4 X i Z i (*)
Mô hình * có tính tổng quát hơn. Qua việc kiểm định
giả thiết để biết được hệ số góc nào có ý nghĩa.
55
Ví dụ
Có bảng số liệu sau về doanh số bán từng quý
(triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến
giả và viết mô hình hồi quy.
Năm Quý Doanh số Năm Quý Doanh số
1970 1 992.7 1971 4 1918.3
1970 2 1077.6 1972 1 2163.9
1970 3 1185.9 1972 2 2417.8
1970 4 1326.4 1972 3 2631.7
1971 1 1434.2 1972 4 2957.8
1971 2 1549.2 1973 1 3069.3
1971 3 1718 1973 2 3304.8
56
Ví dụ
Năm Quý Doanh số D2 D3 D4
1970 1 992.7 0 0 0
1970 2 1077.6 1 0 0
1970 3 1185.9 0 1 0
1970 4 1326.4 0 0 1
1971 1 1434.2 0 0 0
1971 2 1549.2 1 0 0
1971 3 1718 0 1 0
1971 4 1918.3 0 0 1
1972 1 2163.9 0 0 0
1972 2 2417.8 1 0 0
1972 3 2631.7 0 1 0
1972 4 2957.8 0 0 1
1973 1 3069.3 0 0 0
1973 2 3304.8 1 0 0
57
Viết mô hình hồi quy mẫu và ý nghĩa các hệ số 58
5.3 Ứng dụng sử dụng biến giả
5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy
Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước
Anh từ 1946-63 (triệu pounds)
TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập
1946 0.36 8.8 1955 0.59 15.5
1947 0.21 9.4 1956 0.9 16.7
1948 0.08 10 1957 0.95 17.7
1949 0.2 10.6 1958 0.82 18.6
1950 0.1 11 1959 1.04 19.7
1951 0.12 11.9 1960 1.53 21.1
1952 0.41 12.7 1961 1.94 22.8
1953 0.5 13.5 1962 1.75 23.9
1954 0.43 14.3 1963 1.99 25.2
59
5.3 Ứng dụng sử dụng biến giả
Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu
trúc giữa 2 thời kỳ hay không.
Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ
Thời kỳ tái thiết: 1946-54
Yi 1 2 X i U1i (5.3.1)
67
5.3 Ứng dụng sử dụng biến giả
68
5.3 Ứng dụng sử dụng biến giả
-1.75
69
5.3 Ứng dụng sử dụng biến giả
5.3.3. Hàm tuyến tính từng khúc
Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng
sẽ khác với khi doanh thu trên X*.
Hàm hồi quy có dạng
*
Yi 1 2 X i 3 ( X i X ) Z i ui
Y Tiền hoa hồng
X Doanh thu
X* Giá trị ngưỡng sản lượng
Zi =1 nếu Xi > X*
Zi =0 nếu Xi ≤ X*
70
5.3 Ứng dụng sử dụng biến giả
Y
X *
X
Hình 5.7 Hàm tuyến tính từng khúc
•Kiểm định giả thiết H0: 3=0
Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc
71
5.3 Ứng dụng sử dụng biến giả
Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
*
Yi 1 2 X i 3 ( X i X ) Z i ui
Y: Chi phí; X: sản lượng;
X*=5.500 tấn: giá trị ngưỡng sản lượng
1 : X i X *
Z1i *
0 : X i X
72
5.3 Ứng dụng sử dụng biến giả
*
Yi 145,717 0,279 X i 0,095( X i X ) Z i ei
= (-0,824) (6,607) (1,145)
R2 = 0,9737 X* = 5500
73