Professional Documents
Culture Documents
Chuong 5
Chuong 5
1
5.1. Sử dụng biến giả trong mô hình hồi quy
Ví dụ 5.1: Xét sự phụ thuộc của thu nhập (Y) (triệu
đồng/tháng) vào thời gian công tác (X) (năm) và nơi
làm việc của người lao động (DNNN và DNTN).
Z = 1: làm trong DNNN và Z = 0: làm trong DNTN
Trong đó Y và X là biến số lượng, còn Z là chỉ tiêu
chất lượng cho biết có hay không một thuộc tính nào
đó. Z được gọi là biến giả trong mô hình
2
E(Y/X,Z) = 1 + 2Xi + 3Zi (5.1)
E(Y/X,Z=0) = 1 + 2Xi (5.2)
E(Y/X,Z=1) = 1 + 2Xi + 3 (5.3)
(5.2): mức thu nhập bình quân tháng của người lao
động tại DNTN khi có thời gian công tác là X năm.
ˆ3 0,4 : 2 người có cùng thời gian công tác thì
trung bình mức thu nhập của người làm tại DNNN cao
hơn người làm tại DNTN 0,4 triệu đồng/tháng.
3
E(Y/X,Z) = 1 + 2Xi + 3Zi
Y
ˆ1 ˆ3
̂ 3
̂1
X
Hình 5.1 4
E(Y/X,Z) = 1 + 2Xi + 3Zi + 4XiZi
Y
ˆ1 ˆ3
ˆ3
̂1
Hình 5.2 X 5
Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu
đồng/tháng) vào thời gian công tác (X) (năm) và nơi
làm việc của người lao động (DNNN, DNTN và
DNLD)
Z1i = 0 phạm trù
Z2i = 0 cơ sở
8
Tổng quát: số biến giả đưa vào mô hình phụ thuộc
vào số biến định tính và số phạm trù có ở mỗi biến
định tính. Số biến giả đưa vào mô hình có thể được
xác định theo công thức sau:
k
n ( ni 1)
i 1
9
5.2. Sử dụng biến giả trong phân tích mùa
Z = 1, nếu quan sát trong mùa, và Z=0 nếu quan sát
không nằm trong mùa.
Từ tháng 1-6: trong mùa, Tháng 7-12: ngoài mùa.
Y: chi tiêu cho quần áo, X: thu nhập khả dụng
- Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn
Yˆi ˆ1 ˆ2 X i ˆ3 Z i
- Nếu yếu tố mùa có ảnh hưởng đến hệ số góc thì
Yˆi ˆ1 ˆ2 X i ˆ3 Z i ˆ4 X i Z i
Mô hình sau có tính tổng quát hơn. Thông qua việc
kiểm định giả thiết chúng ta sẽ biết được hệ số góc
nào có ý nghĩa. 10
5.3. Kiểm định sự ổn định cấu trúc của các mô hình
hồi quy bằng biến giả
Ví dụ 5.4. Cho số liệu tiết kiệm và thu nhập cá nhân ở
nước Anh từ 1946-63 (triệu pounds)
TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập
1946 0.36 8.8 1955 0.59 15.5
1947 0.21 9.4 1956 0.9 16.7
1948 0.08 10 1957 0.95 17.7
1949 0.2 10.6 1958 0.82 18.6
1950 0.1 11 1959 1.04 19.7
1951 0.12 11.9 1960 1.53 21.1
1952 0.41 12.7 1961 1.94 22.8
1953 0.5 13.5 1962 1.75 23.9
11
1954 0.43 14.3 1963 1.99 25.2
Hàm tiết kiệm
Thời kỳ tái thiết: 1946-54
Yi 1 2 X i vi
Thời kỳ hậu tái thiết
Yi 1 2 X i i
có các trường hợp sau xảy ra:
1 1 1 1 1 1 1 1
2 2 2 2 2 2 2 2
12
Chúng ta kiểm tra xem hàm tiết kiệm có bị thay đổi
cấu trúc giữa 2 thời kỳ hay không. Chúng ta xét hàm
tiết kiệm tổng quát của cả 2 thời kỳ:
Yi ˆ1 ˆ2 X i ˆ3 Z i ˆ4 X i Z i ei
Với n = n1 + n2
Trong đó Z = 1: quan sát thuộc thời kỳ tái thiết
Z = 0 : quan sát thuộc thời kỳ hậu tái thiết
* Kiểm định giả thiết H0: 3=0
Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình
* Kiểm định giả thiết H0: 4=0
Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình
13
Từ số liệu ở bảng ta có kết quả hồi quy theo mô hình
như sau:
Yi 1,75 0,15045 X i 1,4839Z i 0,1034 X i Z i ei
t = (-5,27) (9,238) (3,155) (-3,109)
pt = (0,000) (0,000) (0,007) (0,008)
14
Từ kết quả trên, chúng ta có thể tính hồi quy cho 2
thời kỳ như sau:
Thời kỳ tái thiết: Z = 1
Yi 1,75 0,15045 X i 1,4839 0,1034 X i ei
Yi 0,2661 0,0475 X i ei
Thời kỳ hậu tái thiết: Z = 0
Yi 1,75 0,15045 X i ei
15
Tiết kiệm
Yˆi 1,75 0,15045 X i
Thu nhập
-0.27
-1.75
16
5.4. Hàm tuyến tính từng khúcYX
Ví dụ 5.5: Sản lượng dưới X*, thì chi phí hoa hồng
sẽ khác với khi sản lượng trên X*.
Hàm hồi quy sẽ có dạng:
*
Yi 1 2 X i 3 ( X i X ) Z i ui
Y: Chi phí; X: sản lượng;
X*: giá trị ngưỡng sản lượng
1 : X i X
*
Z1i *
0 : X i X
17
Y
X* X
18
Trong đó tổng SL làm thay đổi độ dốc (X*) là 5500
tấn
CP 256 414 634 778 1003
SL 1000 2000 3000 4000 5000
CP 1839 2081 2423 2734 2914
SL 6000 7000 8000 9000 10000
Ta có kết quả hồi quy như sau:
*
Yi 145,717 0,279 X i 0,095( X i X ) Z i ei
t = (-0,824) (6,607) (1,145)
R2 = 0,9737 X* = 5500 19
Lưu ý: Nếu biến phụ thuộc là biến giả:
Nếu ta có một biến phụ thuộc là biến giả tức là biến
chỉ nhận hai giá trị 0 và 1. Chúng ta không thể sử
dụng phương pháp bình phương bé nhất (OLS) để ước
lượng hàm hồi quy mà phải dùng các phương pháp
khác để ước lượng như:
-Mô hình xác suất tuyến tính (LPM)
-Mô hình Logit (Logit model)
-Mô hình Probit (Probit model)
-Mô hình Tobit (Tobit model)
20