You are on page 1of 11

MÔ HÌNH HỒI QUY BINARY LOTISTICS

Ví dụ: Nghiên cứu các yếu tố ảnh hưởng đến thay đổi thu nhập của người dân bị
thu hồi đất ở các khu công nghiệp.
I. Vấn đề nghiên cứu
- Quá trình hình thành & phát triển các khu công nghiệp (KCN). Dẫn đến, Thu
hồi đất trên địa bàn cả nước, nhất là ở vùng nông thôn. Quan tâm một cách đầy
đủ đến sự thay đổi cuộc sống và thu nhập của người dân bị mất đất.
- Những hộ nông dân bị thu hồi đất phải đương đầu với sự thay đổi nguồn lực để
tạo ra sinh kế và thu nhập của mình.
- Một nguyên lý cơ bản của thu hồi đất là phải đảm bảo cho người dân có cuộc
sống và thu nhập thay đổi theo hướng tốt hơn và giới hạn là ít nhất là ngang
bằng như trước khi bị thu hồi đất.
- Tìm hiểu về thay đổi thu nhập và các yếu tố ảnh hưởng đến thu nhập của người
dân bị thu hồi đất là một thách thức của các nhà khoa học và chính sách.
II. Khung lý thuyết
- ADB (1995) chỉ ra rằng những người ảnh hưởng nên được hỗ trợ để họ cải
thiện mức sống, hoặc ít nhất là bằng cuộc sống cũ hoặc cao hơn trước khi họ bị
thu hồi đất và di chuyển.
- Theo Ngân hàng thế giới (2004), phục hồi thu nhập là một phần quan trọng của
chính sách thu hồi đất khi những người bị ảnh hưởng mất đi cơ sở sản xuất,
kinh doanh, việc làm hoặc các nguồn thu nhập khác.
Các phương án tạo thu nhập
- (1) Tín dụng trực tiếp đối với kinh doanh nhỏ và tự làm; (2) Xây dựng các kỹ
năng thông qua đào tạo; (3) Hỗ trợ trong việc tìm kiếm các cơ hội trong các
doanh nghiệp nhà nước và tư nhân; (4) Ưu tiên đối với những người bị ảnh
hưởng trong việc tuyển chọn lao động liên quan đến dự án hoạt động.
Giả thiết H0:
- Thay đổi thu nhập của hộ thu hồi đất phụ thuộc vào (1) Trình độ học vấn của
chủ hộ, (2) Tuổi của chủ hộ, (3) Tỷ lệ phụ thuộc, (4) Số lao động trong hộ, (5)
Diện tích đất bị thu hồi, (6) Sử dụng tiền đền bù để đầu tư sản xuất kinh doanh
sau khi bị thu hồi đất, (7) lao động được làm việc trong KCN.
III. Dạng tổng quát của mô hình Hồi quy Binary Logistics
Trong hồi quy tuyến tính đơn, các biến độc lập Xi và phụ thuộc Y là biến số liên tục
liên hệ qua phương trình:
Y= +∑ +u (1)
Với Xi là biến độc lập, Y là biến phụ thuộc

1
Trong hồi quy Logistic, biến phụ thuộc Y chỉ có 2 trạng thái 1 (ví dụ: Thu nhập hộ
tăng sau thu hồi đất) và 0 (ví dụ: Thu nhập hộ không tăng sau thu hồi đất). Muốn đổi
ra biến số liên tục người ta tính xác suất của 2 trạng thái này. Nếu gọi P là xác suất để
một biến cố xảy ra (ví dụ: Thu nhập hộ tăng sau thu hồi đất), thì 1-P là xác suất để
biến cố không xảy ra (ví dụ: Thu nhập hộ không tăng sau thu hồi đất). Phương trình
hồi quy Logistic phát biểu:
Phương trình hồi quy Binary Logistics

( )
Ln [ ]= + + +…+ (2)
( )

Trong đó:
( ) = : Xác suất xảy ra sự kiện. Trong bài này là xác suất để hộ gia đình bị thu
hồi đất tăng thu nhập
( )= 1- : Xác xuất không xảy ra sự kiện. Trong bài này là xác suất để hộ gia
đình bị thu hồi dất không tăng thu nhập.
Xi: Các biến độc lập; Ln: Log của cơ số e (e = 2.714).
Hệ số Odds:

( )
( )

Thế vào (2) ta được: Ln(Odds) = + + +…+ (3)


Đây là một dạng hàm Logit. Từ đó suy ra, hàm Ln của hệ số Odds là một hàm hồi quy
tuyến tính với các biến độc lập Xi.
Hàm xác suất trên được gọi là hàm phân bố logistic. Trong hàm logistic này khi nhận
các giá trị từ -∞ đến +∞ thì xác suất Pi nhận giá trị từ 0 đến 1. Do là phi tuyến đối với
X và các tham số và Y chỉ nhận một trong hai giá trị 0 –> 1, vì vậy chúng ta không thể
áp dụng trực tiếp phương pháp bình phương nhỏ nhất (OLS) để ước lượng các tham số
của phương trình, người ta dùng ước lượng hợp ý tối đa (Maximum Likelihood) để
ước lượng Bi.
Dạng hàm dự báo hồi quy Binary Logistics:

Từ phương trình (3), ta có thể tính được xác suất tiên đoán về hài lòng theo trị số của
Xi như sau:

2
( )

E(Y/Xi): Xác suất để Y = 1 xuất hiện khi biến độc lập Xi có giá trị cụ thể.

IV. Dữ liệu:
Điều tra trực tiếp 120 hộ gia đình bị thu hồi đất tại khu công nghiệp A Tp. HCM.
File SPSS: Data thu hoi dat

Tên biến Ký hiệu Định nghĩa Đơn vị Giả


tính thuyết

Biến phục Y Biến nhị phân (Dummy),


thuộc Biến Dummy, nhận giá trị 1
khi thu nhập của hộ tăng
lên, và là giá trị 0 nếu thu
nhập của hộ không tăng.

Trình độ Học_vấn Số năm đi học của chủ hộ Năm +


học vấn (X1)

Tuổi của Tuổi Là số tuổi của chủ hộ Năm +


chủ hộ (X2)

Tỷ lệ phụ Tỷ_lệ_phụ_thuộc Tỷ lệ giữa số người nằm % -


thuộc (X3) ngoài độ tuổi lao động trên
tổng số người trong gia đình

Số lao động Số_người Số lao động trong hộ gia Người +


trong hộ (X4) đình

Diện tích Diện_tích_đất_thu_ Diện tích đất nông nghiệp M2 +


đất bị thu hồi và phi nông nghiệp bị thu
hồi (X ) hồi
5

Sử dụng Tiền_đầu_tư Tiền_đầu-tư là biến giả. +


tiền đền bù (X6) Nếu hộ sử dụng tiền đền bù
để đầu tư để đầu tư sản xuất kinh
sản xuất doanh sau khi bị thu hồi đất
kinh doanh thì Tiều_đầu_tư = 1; nếu

3
không thì Tiều_đầu_tư = 0

Lao động Được_làm_việc Được_làm_việc là biến giả. +


được làm (X7) X7 = 1 nếu hộ có lao động
việc khu làm việc trong khu công
công nghiệp nghiệp; và X7 = 0 nếu hộ
không có lao động làm việc
trong khu công nghiệp.

V. Dạng tổng quát của mô hình hồi quy Binary Logistics


Phương trình:
( )
Ln [ ]= + + +…+ (2)
( )

Trong đó:
( ) = : Xác suất xảy ra sự kiện. Trong bài này là xác suất để hộ gia đình bị thu
hồi đất tăng thu nhập
( )= 1- : Xác xuất không xảy ra sự kiện. Trong bài này là xác suất để hộ gia
đình bị thu hồi dất không tăng thu nhập.
Xi: Các biến độc lập; Ln: Log của cơ số e (e = 2.714).
Ý nghĩa:
Giả định X1: số năm đi học của chủ hộ (năm); hệ số hồi quy B1 = 0.308.
Nếu chủ hộ gia đình tăng thêm 1 năm đi học, với điều kiện các yếu tố khác không đổi,
thì Log của tỷ lệ xác suất cải thiện thu nhập so với xác suất không cải hiện thu nhập
tăng thêm 0.308 lần.
Cách giải thích này không rõ nghĩa lắm trong phân tích kinh tế có cách giải thích thay
thế như sau;
Đặt P0: Xác suất ban đầu; P1: Xác suất thay đổi. P1 được tính theo công thức sau:

( )
Khi B = 0.308; P0 = 10%; e = 2.714 thế vào tính P1 kết quả như sau:

( ) ( ) ( )
Như vậy, khi chủ hộ gia đình tăng thêm 1 năm đi học, xác suất cải thiện thu nhập của
hộ sẽ tăng lên 13.1% tức là tăng thêm 3.1% so với xác suất ban đầu là 10%.
Khái quát:

4
( )
Khi yếu tố Xk tăng lên một đơn vị thì xác suất cải thiện thu nhập của một hộ gia đình
sẽ chuyển dịch từ P0 sang P1.
Sử dụng chương trình SPSS
Từ Menu Analyse / Regresion / Binary Logistic

VI. Hệ thống kiểm định


1. Kiểm định Wald

Variables in the Equation

B S.E. Wald df Sig. Exp(B) 95% C.I.for


EXP(B)

Lower Upper

Học_vấn .315 .110 8.205 1 .004 1.370 1.105 1.700

Tuổi .019 .026 .556 1 .456 1.019 .969 1.073

Tỷ_lệ_phụ_thuộc -3.773 1.732 4.743 1 .029 .023 .001 .686

Step Số_người 1.118 .362 9.522 1 .002 3.059 1.504 6.222


a
1 Diện_tích_đất_thu_hồi .000 .000 11.150 1 .001 1.000 .999 1.000

Tiền_đầu_tư 2.223 .669 11.045 1 .001 9.237 2.489 34.274

Được_làm_việc 1.457 .591 6.079 1 .014 4.293 1.348 13.672

Constant -4.164 1.984 4.404 1 .036 .016

a. Variable(s) entered on step 1: Học_vấn, Tuổi, Tỷ_lệ_phụ_thuộc, Số_người, Diện_tích_đất_thu_hồi,


Tiền_đầu_tư, Được_làm_việc.

- Nhìn vào bảng trên, ta thấy Sig của biến tuổi (tuổi của chủ hộ) là 0.456 > 0.1
nên mối liên hệ giữa sự thay đổi thu nhập của hộ và tuổi của chủ hộ không có ý
nghĩ thống kê.
- Giá trị Sig của các biến Học_vấn, Tỷ_lệ_phụ_thuộc, số_người,
Diện_tích_đất_thu_hồi, Tiền_đầu_tư, Được_làm_việc lần lượt là 0.004, 0.029,
0.002, 0.001, 0.001, 0.014 < 0.04 nên mối liên hệ giữa biến phụ thuộc và các
biến độc lập còn lại có ý nghĩa thống kê với mức tin cậy chung là trên 96%.
Thực hiện phân tích hồi quy Binary Logistic bằng SPSS và loại biến Tuổi (Sig < 0.05)
được kết quả như sau:

B S.E. Wald df Sig. Mức ý nghĩa

a
Học_vấn .286 .101 8.075 1 .004 Mức tin cậy > 99%
Step 1
Tỷ_lệ_phụ_thuộc -3.755 1.724 4.742 1 .029 Mức tin cậy > 97%

5
Số_người 1.150 .362 10.076 1 .002 Mức tin cậy > 99%

Diện_tích_đất_thu_hồi .000 .000 11.044 1 .001 Mức tin cậy > 99%

Tiền_đầu_tư 2.288 .666 11.816 1 .001 Mức tin cậy > 99%

Được_làm_việc 1.525 .584 6.813 1 .009 Mức tin cậy > 99%

Constant -3.143 1.381 5.180 1 .023 Mức tin cậy > 97%

- Từ kết quả phân tích hồi quy Logistic trên ta thấy, giá trị mức ý nghĩa Sig của
các biến đều có giá trị < 0.05 nên các biến độc lập trong mô hình hồi quy
Binary Logistic có mối tương quan với biến phụ thuộc là mức độ tăng (giảm)
thu nhập khi thu hồi đất. Mức ý nghĩa thống kê của các hệ số hồi quy trên đều
có độ tin cậy trên 97%, dấu của các hệ số hồi quy phù hợp với mong đợi.

2. Kiểm định mức độ phù hợp của mô hình (Kiểm định Omnibus)

Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 72.902 6 .000

Step 1 Block 72.902 6 .000

Model 72.902 6 .000

- Dựa vào kết quả kiểm định mức độ phù hợp của mô hình, ta có Sig. < 0.05 như
vậy mô hình tổng quát cho thấy mối tương quan giữa biến phụ thuộc và các
biến độc lập trong mô hình có ý nghĩa thống kê với khoảng tin cậy trên 99%.

3. Kiểm định mức độ giải thích của mô hình

Model Summary

Step -2 Log likelihood Cox & Snell R Nagelkerke R


Square Square
a
1 90.743 .455 .612

a. Estimation terminated at iteration number 6 because


parameter estimates changed by less than .001.

6
- Hệ số mức độ giải thích của mô hình: Nagelkerke = 0.612. Điều này có
nghĩa là 61.2% sự thay đổi của biến phụ thuộc được giải thích bởi 6 biến độc
lập trong mô hình, còn lại là do các yếu tố khác.

4. Kiểm định mức độ dự báo tính chính xác của mô hình

a
Classification Table

Predicted
(Y) So sánh sự thay đổi thu Percentage
nhập của hộ sau thu hồi đất Correct
Observed
với trước thu hồi đất
Thu nhập của Thu nhập của
hộ không tăng hộ tăng

(Y) So sánh sự thay đổi Thu nhập của hộ không


58 11 84.1
thu nhập của hộ sau thu tăng
Step 1 hồi đất với trước thu hồi
Thu nhập của hộ tăng 11 40 78.4
đất

Overall Percentage 81.7

a. The cut value is .500

- Trong 69 trả lời thu nhập của hộ không tăng (xét theo cột gồm 58 và 11), mô
hình dự báo chính xác là 58. Vậy tỷ lệ đúng là 84.1%
- Tương tự, trong 51 trả lời thu nhập của hộ tăng (xét theo cột gồm 11 và 40), mô
hình dự báo chính xác là 40. Vậy tỷ lệ đúng là 78.4%. Vậy tỷ lệ dự báo đúng
của toàn bộ mô hình là 81.7%

5. Thảo luận kết quả hồi quy

Variables in the Equation

B S.E. Wald df Sig. Exp(B) 95% C.I.for


EXP(B)

Lower Upper

Học_vấn .286 .101 8.075 1 .004 1.331 1.093 1.622

Tỷ_lệ_phụ_thuộc -3.755 1.724 4.742 1 .029 .023 .001 .687

Step Số_người 1.150 .362 10.076 1 .002 3.160 1.553 6.429


a
1 Diện_tích_đất_thu_hồi .000 .000 11.044 1 .001 1.000 .999 1.000

Tiền_đầu_tư 2.288 .666 11.816 1 .001 9.859 2.674 36.348


Được_làm_việc 1.525 .584 6.813 1 .009 4.597 1.462 14.451

7
Constant -3.143 1.381 5.180 1 .023 .043

a. Variable(s) entered on step 1: Học_vấn, Tỷ_lệ_phụ_thuộc, Số_người, Diện_tích_đất_thu_hồi, Tiền_đầu_tư,


Được_làm_việc.

a) Biến Học_vấn: Số năm đi học của chủ hộ. Có B1 = 0.339 , = 10% và =


1.331

= = = 0.129 = 12.9%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này có thêm 1
năm học, xác suất cải thiện thu nhập của hộ gia đình sẽ là 12.9% (tăng 2.9% so với
xác suất ban đầu là 10%).
b) Biến Tỷ_lệ_phụ_thuộc: tỷ lệ phụ thuộc. Có B2 = - 3.755, = 10% và =
0.023

= = = 0.003 = 0.3%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này có thêm 1%
tỷ lệ phụ thuộc, xác suất cải thiện thu nhập của hộ gia đình sẽ là 0.3% (giảm 9.7% so
với xác suất ban đầu là 10%).
c) Biến Số_người: Số lao động trong hộ gia đình. Có B3 = 1.150, = 10% và
= 3.160

= = = 0.260 = 26.0%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này có thêm 1 lao
động trong hộ gia đình, xác suất cải thiện thu nhập của hộ gia đình sẽ là 26.0% (tăng
16.0% so với xác suất ban đầu là 10%).
d) Biến Diện_tích_đất_thu_hồi: Diện tích đất bị thu hồi. Có B4 = 0.000, =
10% và = 1.000

= = = 0.100 = 10%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này bị thu hồi
thêm 1 m2 đất, xác suất cải thiện thu nhập của hộ gia đình sẽ là 10.0% (không thay đổi
so với xác suất ban đầu là 10%).

8
e) Biến Tiền_đầu_tư: Hộ dùng tiền đền bù đầu tư sản xuất kinh doanh. Có B5 =
2.288, = 10% và = 9.859

= = = 0.523 = 52.3%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này dùng tiền đền
bù đầu tư sản xuất kinh doanh, xác suất cải thiện thu nhập của hộ gia đình sẽ là 52.3%
(tăng 42.3% so với xác suất ban đầu là 10%).
f) Biến Được_làm_việc: Hộ có lao động làm việc trong khu công nghiệp. Có B6
= 1.525, = 10% và = 4.597

= = = 0.338 = 33.8%
( ) ( )

Nếu xác suất cải thiện thu nhập ban đầu của hộ gia đình bị thu hồi đất để xây dựng
khu công nghiệp là 10%, khi các yếu tố khác không đổi, nếu chủ hộ này có thêm 1 lao
động làm việc trong khu công nghiệp, xác suất cải thiện thu nhập của hộ gia đình sẽ là
33.8% (tăng 23.8% so với xác suất ban đầu là 10%).
6. Vai trò ảnh hưởng của các yếu tố
Từ đó, ta xác định được vai trò ảnh hưởng của các yếu tố được lập trong bảng sau:
Bảng: Tổng hợp các biến có ý nghĩa thống kê.

Xác suất
ban đầu Tốc độ
tăng Vị trí
Stt Biến B EXP(B) P0 = ảnh
10% (giảm)
hưởng
%
P1
1 Học_vấn .286 1.331 12.9% 2.9% 5
2 Tỷ_lệ_phụ_thuộc -3.755 0.023 0.3% -9.7% 4
3 Số_người 1.150 3.160 26.0% 16.0% 3
4 Diện_tích_đất_thu_hồi .000 1.000 10.0% 0.0% 6
5 Tiền_đầu_tư 2.288 9.859 52.3% 42.3% 1
6 Được_làm_việc 1.525 4.597 33.8% 23.8% 2
Trong các biến ảnh hưởng đến cãi thiện thu nhập, biến Tiền_đầu_tư (sử dụng tiền
đền bù đất đầu tư vào sản xuất kinh doanh) có ảnh hưởng mạnh nhất, và còn lại theo
thứ tự là: Được_làm_việc (hộ có lao động làm việc trong KCN), Số_người (Số lao
động của hộ), Tỷ_lệ_phụ_thuộc (Tỷ lệ phụ thuộc), Học_vấn (Số năm đi học),
Diện_tích_đất_thu_hồi (Diện tích đất thu hồi).
7. Dự báo của mô hình hồi quy Logistic

9
Variables in the Equation

B S.E. Wald df Sig. Exp(B) 95% C.I.for


EXP(B)

Lower Upper

Học_vấn .286 .101 8.075 1 .004 1.331 1.093 1.622

Tỷ_lệ_phụ_thuộc -3.755 1.724 4.742 1 .029 .023 .001 .687

Số_người 1.150 .362 10.076 1 .002 3.160 1.553 6.429


Step
a
Diện_tích_đất_thu_hồi .000 .000 11.044 1 .001 1.000 .999 1.000
1
Tiền_đầu_tư 2.288 .666 11.816 1 .001 9.859 2.674 36.348

Được_làm_việc 1.525 .584 6.813 1 .009 4.597 1.462 14.451

Constant -3.143 1.381 5.180 1 .023 .043

a. Variable(s) entered on step 1: Học_vấn, Tỷ_lệ_phụ_thuộc, Số_người, Diện_tích_đất_thu_hồi, Tiền_đầu_tư,


Được_làm_việc.

Phương trình hồi quy Logistic tổng quát có dạng:


( )

Từ bảng kết quả phân tích hồi quy Logistic, ta viết được phương trình tương quang
Logistic theo hướng kinh tế như sau:

Ln(Odds) = -3.143 + 0.286* học_vấn – 3.755* Tỷ_lệ_phụ_thuộc + 1.15* Số_người +


0.000* Diện_tích_đất_thu_hồi + 2.288* Tiền_đầu_tư + 1.525* Được_làm_việc

( )
( ) ( )

E (Y/X): Xác suất để Y = 1 xuất hiện khi biến độc lập X có giá trị cụ thể Xi.

Dự báo mức độ hài lòng của du khách có các yếu tố như sau:
Nếu một hộ bị thu hồi đất có các yếu tố như sau:
Biến Học_v Tỷ_lệ_phụ_t Số_ng Diện_tích_đất_t Tiền_đầu Được_làm Const
ấn huộc ười hu_hồi _tư _việc ant
B 0.286 -3.755 1.15 0 2.288 1.525 -3.143
Giá trị của
các biến 12 0.1 4 500 1 1
Dựa vào số liệu trên tính Ln(Odds) và thế vào phương trình sau:

10
( )
( ) ( )

Kết luận: Mô hình cho biết khả năng hộ này tăng thu nhập tới 99.98%.
Nếu một hộ bị thu hồi đất có các yếu tố như sau:
Biến Học_v Tỷ_lệ_phụ_t Số_ng Diện_tích_đất_t Tiền_đầu Được_làm Const
ấn huộc ười hu_hồi _tư _việc ant
B 0.286 -3.755 1.15 0 2.288 1.525 -3.143
Giá trị của 12 0.3 3 500 0 0
các biến
Dựa vào số liệu trên tính Ln(Odds) và thế vào phương trình sau:
( )
( ) ( )

Kết luận: Mô hình cho biết khả năng hộ này tăng thu nhập tới 93.17%.
8. Kết luận và dự báo chính sách
Kết luận: Có 6 yếu tố ảnh hưởng đến cãi thiện thu nhập cho các hộ bị thu hồi đất và
theo thứ tự ảnh hưởng là: (1) Sử dụng tiền đền bù để đầu tư sản xuất – kinh doanh; (2)
Lao động được làm việc khu công nghiệp; (3) Số lao động trong hộ; (4) Tỷ lệ phụ
thuộc; (5) Số năm đi học của chủ hộ và (6) Diện tích đất bị thu hồi.
Gợi ý chính sách:
1. Hướng dẫn vào tạo điều kiện cho các hộ sử dụng tiền đền bù để đầu tư sản xuất
– kinh doanh.
2. Quan tâm đến ưu tiên sử dụng lao động của các hộ gia đình bị thu hồi đất vào
làm việc cho các công ty trong khu công nghiệp.
3. Có chính sách ưu tiên tuyển dụng lao động và chính sách xã hội cho những hộ
nhiều diện tích dất bị thu hồi và hộ có tỷ lệ phụ thuộc cao.
4. Khuyến khích và tạo điều kiện cho người dân được đến trường, đặc biệt là đối
với những hộ gia đình có đất bị thu hồi.
5. Khuyến khích hộ gia đình nhận tiền giải tỏa thu hồi đất nhanh để tăng diện tích
đất cho các khu công nghiệp và đồng thời tăng thu nhập của các hộ gia đình.

- - - o0o - - -

11

You might also like