You are on page 1of 3

Bài tập 3.

Mô hình Logit
a. Bạn hãy sử dụng file dữ liệu về tình huống của các hộ bị thu hồi đất ở Việt
Nam (kèm theo Sách của thầy Đinh Phi Hổ về Phương pháp nghiên cứu kinh tế
và viết luận văn thạc sĩ), tham khảo tình huống này, tham khảo bài báo cùng
chủ đề của thầy Nguyễn Hoàng Bảo và cộng sự để thực hiện một phân tích về
ảnh hưởng của thu hồi đất và một số biến khác lên xác suất mà thu nhập của hộ
tăng lên

Omnibus Tests of Model Coefficients

Chi-square df Sig.

Step 184.133 6 .000

Step 1 Block 184.133 6 .000

Model 184.133 6 .000

Nhận xét: Gioosng kiểm định F bên hồi quy đa biến, Sig=0.000 < 0.05 => mô hình
hồi quy có ý nghĩa thống kê.

Classification Tablea

Observed Predicted

Y Percentage

Không áp dụng Có Áp dụng Correct

CMKT CMKT

Không áp dụng CMKT 61 3 95.3


Y
Step 1 Có Áp dụng CMKT 3 103 97.2

Overall Percentage 96.5

a. The cut value is .500

Nhận xét: Bảng Classification Tablea cho thấy phân loại đối tượng không áp dụng
CMKT và có áp dụng CMKT theo 2 tiêu chí: quan sát thực tế và dự đoán. Ý nghĩa:
-Trong 64 trường hợp quan sát không áp dụng CMKT thì dự đoán có 61 trường hợp
không áp dụng CMTK. Vậy tỉ lệ dự đoán đúng là 61/64=95.3%
- Trong 106 trường hợp quan sát có áp dụng CMKT thì dự đoán có 103 trường hợp có
áp dụng CMTK. Vậy tỉ lệ dự đoán đúng là 103/106=97.2%
Như vậy, tỷ lệ trung bình dự đoán đúng là (61+103)/(61+103+3+3)=164/170=96.5%

Variables in the Equation

B S.E. Wald df Sig. Exp(B)


a
Step 1 VON .270 .065 17.124 1 .000 1.310

NLUC .008 .027 .080 1 .778 1.008

KTRA 2.057 .941 4.782 1 .029 7.826


TUVAN 1.567 .892 3.086 1 .079 4.790

ROS .079 .031 6.465 1 .011 1.082

ITC 1.081 .466 5.378 1 .020 2.946

Constant -18.207 3.585 25.795 1 .000 .000

a. Variable(s) entered on step 1: VON, NLUC, KTRA, TUVAN, ROS, ITC.

Bảng Variables in the Equation cung cấp nhiều thông tin về phương trình hồi quy.
Chúng ta sẽ quan tâm cột Sig của kiểm định Wald đầu tiên. Cụ thể trong trường hợp
này, Sig kiểm định Wald của VON, KTRA, ROS, ITC nhỏ hơn 0.05 ( độ tin cậy
95%), 4 biến VON, KTRA, ROS ITC đều có sự ảnh hưởng lên khả năng. Biến NLUC
và TUVAN có sig kiểm định Wald lần lượt bằng 0.778 và 0.079 đều >0.05, NLUC và
TUVAN không có sự tác động lên khả năng.
Cột B là hệ số hồi quy của các biến độc lập, B mang dấu dương thể hiện biến độc lập
tác động thuận lên biến phụ thuộc. Với kết quả ở trên, thế vào phương trình hồi quy
logistic ta có:

^ e −18.207+0.27 ∗ VON +2.057 ∗ KTRA+0.079 ∗ ROS+1.081 ∗ ITC


P(Y =1) =
1+ e− 18.207+0.27 ∗VON +2.057∗ KTRA +0.079∗ ROS +1.081∗ ITC
b. Bạn hãy thực hành lại tình huống trên bằng Stata, và copy kết quả từ Stata.
. use "C:\Users\ASUS\Downloads\C5_mhlogistic_lec.dta"

. logit Y VON NLUC KTRA TUVAN ROS ITC

Iteration 0: log likelihood = -112.59267


Iteration 1: log likelihood = -30.498163
Iteration 2: log likelihood = -21.97023
Iteration 3: log likelihood = -20.548223
Iteration 4: log likelihood = -20.526287
Iteration 5: log likelihood = -20.526218
Iteration 6: log likelihood = -20.526218

Logistic regression Number of obs = 170


LR chi2(6) = 184.13
Prob > chi2 = 0.0000
Log likelihood = -20.526218 Pseudo R2 = 0.8177

Y Coef. Std. Err. z P>|z| [95% Conf. Interval]

VON .2699956 .0652458 4.14 0.000 .1421162 .3978749


NLUC .0075274 .0266701 0.28 0.778 -.044745 .0597998
KTRA 2.057426 .940895 2.19 0.029 .2133055 3.901546
TUVAN 1.5666 .8918153 1.76 0.079 -.1813263 3.314525
ROS .0789022 .0310315 2.54 0.011 .0180815 .1397229
ITC 1.080603 .4659814 2.32 0.020 .1672961 1.993909
_cons -18.20712 3.584845 -5.08 0.000 -25.23329 -11.18095

-Trong bảng kết quả có hệ số Coefficients, sai số chuẩn Standard errors, kiểm định z
z-statistic, p-values và 95% confidence interval of the coefficients. Ta thấy biến VON,
KTRA, ROS, ITC có hệ số P > |z| <0.05 nên quan hệ có ý nghĩa thống kê.
-Hệ số hồi quy coefficients cho biết sự thay đổi của LOG ODDS của biến phụ thuộc
khi biến độc lập tăng 1 đơn vị
+ Khi biến độc lập VON tăng 1 đơn vị thì LOG ODDS của áp dụng CMKT tăng 0.27.
+ Khi biến độc lập KTRA tăng 1 đơn vị thì LOG ODDS của áp dụng CMKT tăng
2.05.
+ Khi biến độc lập ROS tăng 1 đơn vị thì LOG ODDS của áp dụng CMKT tăng 0.78.
+ Khi biến độc lập ITC tăng 1 đơn vị thì LOG ODDS của áp dụng CMKT tăng 1.08.

. estat class

Logistic model for Y

True
Classified D ~D Total

+ 103 3 106
- 3 61 64

Total 106 64 170

Classified + if predicted Pr(D) >= .5


True D defined as Y != 0

Sensitivity Pr( +| D) 97.17%


Specificity Pr( -|~D) 95.31%
Positive predictive value Pr( D| +) 97.17%
Negative predictive value Pr(~D| -) 95.31%

False + rate for true ~D Pr( +|~D) 4.69%


False - rate for true D Pr( -| D) 2.83%
False + rate for classified + Pr(~D| +) 2.83%
False - rate for classified - Pr( D| -) 4.69%

Correctly classified 96.47%

Theo quan sát thực tế có 61+3= 64 trường hợp không áp dụng CMKT, và có
103+3=106 trường hợp áp dụng CMKT. Theo dự đoán có 61+3=64 không áp dụng
CMKT và 3+103=106 áp dụng CMKT. Như vậy trong 64 trường hợp không áp dụng
CMKT, có 61 trường hợp dự đoán đúng, như vậy tỉ lệ dự đoán đúng là 61/64=
95.31%. Trong 106 trường hợp áp dụng CMKT, dự đoán đúng 103 trường hợp, như
vậy tỉ lệ dự đoán đúng là 103/106=97.1%. Vậy trung bình tỉ lệ dự đoán đúng là
( 61+103)/(61+103+3+3)=96.47%
. mfx

Marginal effects after logit


y = Pr(Y) (predict)
= .91140355

variable dy/dx Std. Err. z P>|z| [ 95% C.I. ] X

VON .0218014 .00987 2.21 0.027 .002455 .041148 44.8


NLUC .0006078 .00211 0.29 0.773 -.00352 .004735 60.4941
KTRA* .2005935 .12542 1.60 0.110 -.045225 .446412 .570588
TUVAN* .149877 .11795 1.27 0.204 -.081305 .381059 .6
ROS .0063711 .00368 1.73 0.084 -.000844 .013586 36.2471
ITC .0872556 .04942 1.77 0.077 -.009601 .184112 2.78824

c (*) dy/dx is for discrete change of dummy variable from 0 to 1

You might also like