Professional Documents
Culture Documents
Bài Nhóm D Báo-Stata
Bài Nhóm D Báo-Stata
1 X1 Y11 A21 B31 C41 D51 E61 F71 G81 H91 I101 K201
2 X2 Y12 A22 B32 C42 D52 E62 F72 G82 H92 I102 K202
3 X3 Y13 A23 B33 C43 D53 E63 F73 G83 H93 I103 H203
n Xn Y1n A2n B3n C4n D5n E6n F7n G8n H9n I10n K20n
c/ Biến phụ thuộc và các biến độc lập trong mô hình là những biến gì?
Theo như mô hình, ta có thể xác định biến phụ thuộc và biến độc lập như sau:
Biến phụ thuộc: lwage.
Các biến độc lập: IQ, educ, exper, tenure, age, married, black, south, urban, bl_so.
Trong đó biến IQ giải thích khi biến IQ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽1 đơn
vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến educ giải thích khi biến educ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽2
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến exper giải thích khi biến exper tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽3
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến tenure giải thích khi biến tenure tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽4 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến age giải thích khi biến age tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽5 đơn
vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến married giải thích khi biến married tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽6 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến black giải thích khi biến black tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽7
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến south giải thích khi biến south tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽8
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến urban giải thích khi biến urban tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽9
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến bl_so giải thích khi biến bl_so tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽10 đơn vị trong điều kiện các yếu tố khác không đổi.
d/ Thống kê mô tả các biến trong mô hình và diễn giải kết quả
• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)
• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ
thuộc trong mô hình.
Để thống kể mô tả các biến trong Stata, ta dùng lệnh summarize.
Kết quả trên stata được mô tả lại ở dưới đây:
Cột 1 cho biết tên các biến, cột 2 cho biết số quan sát của từng biến, cột 3 cho biết giá trị
trung bình của từng biến, cột 4 cho biết độ lệch chuẩn của từng biến, cột 5 và cột 6 lần lượt là
nhỏ nhất và giá trị lớn nhất của từng biến.
Cụ thể biến wage có 935 số quan sát, giá trị trung bình là 957.9455, giá trị sai số tiêu chuẩn là
404.3608, giá trị nhỏ nhất và lớn nhất lần lượt là 115 va 3078.
Tương tự cho các biến khác, ta sẽ lập 1 bảng diễn giải kết quả của kết quả thống kê mô tả
trong stata:
Tên biến Số quan sát Giá trị trung bình Sai số chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
wage 935 957.9455 404.3608 115 3078
IQ 935 101.2824 15.05264 50 145
educ 935 13.46845 2.196654 9 18
exper 935 11.56364 4.374586 1 23
tenure 935 7.234225 5.075206 0 22
age 935 33.08021 3.107803 28 38
married 935 .8930481 .3092174 0 1
black 935 .1283422 .3346495 0 1
south 935 .3411765 .4743582 0 1
urban 935 .7176471 .4503851 0 1
black2 935 .0812834 .2734161 0 1
lwage 935 6.779004 .4211439 4.744932 8.032035
Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm các
giá trị phân vị và phương sai của biến.
Cụ thể như ta quan sát của biến IQ có: số quan sát là 935, tổng trọng số là 935, trung
bình=101.2824, độ lệch chuẩn = 15.05264, phương sai = 226.5819. Các phân vị: giá trị tứ
phân vị thứ nhất Q1=92, giá trị tứ phân vị thứ hai Q2= 102, giá trị tứ phân vị thứ ba Q3=112,
hệ số bất đối xứng: -0.3404246 < 0 nên phân phối lệch trái, GTLN = 145, GTNN = 50.
Dưới đây là bảng thống kê mô tả của biến IQ:
Tương tự như vậy đối với các biến còn lại, ta có thống kê mô tả chi tiết như sau:
• Biến wage: số quan sát là 935, tổng trọng số là 935, trung bình: 957.9455 ,độ lệch
chuẩn:404.3608, phương sai: 163507.7 các phân vị: giá trị tứ phân vị thứ nhất
Q1= 668, giá trị tứ phân vị thứ hai Q2= 905,giá trị tứ phân vị thứ ba Q3=1160, hệ
số bất đối xứng: 1.199259>0 nên phân phối lệch phải, GTLN:3078, GTNN:115
• Biến educ: số quan sát là 935 , tổng trọng số là 935, trung bình:13.46845, độ lệch
chuẩn: 2.196654, phương sai: 4.825288, các phân vị: giá trị tứ phân vị thứ nhất
Q1=12, giá trị tứ phân vị thứ hai Q2= 12,giá trị tứ phân vị thứ ba Q3=16, hệ số bất
đối xứng:0.5477959>0 nên phân phối lệch phải, GTLN:9, GTNN:18
• Biến exper: số quan sát là 935 , tổng trọng số là 935, trung bình: 11.56364 độ lệch
chuẩn: 4.374586 phương sai: các phân vị: giá trị tứ phân vị thứ nhất Q1=8, giá trị
tứ phân vị thứ hai Q2=11 giá trị tứ phân vị thứ ba Q3= 15, hệ số bất đối xứng:
0.077676>0 nên phân phối lệch phải, GTLN:23, GTNN:1
• Biến terune: số quan sát là 935, tổng trọng số là 935 , trung bình: 7.234225,độ
lệch chuẩn: 5.075206, phương sai:25.75771, các phân vị: giá trị tứ phân vị thứ
nhất Q1= 3, giá trị tứ phân vị thứ hai Q2=7, giá trị tứ phân vị thứ ba Q3=11, hệ số
bất đối xứng:0.431838>0 nên phân phối lệch phải, GTLN:22, GTNN:0
• Biến age: số quan sát là 935, tổng trọng số là 935, trung bình: 33.08021, độ lệch
chuẩn: 3.107803, phương sai: 9.658441, các phân vị: giá trị tứ phân vị thứ nhất
Q1=30, giá trị tứ phân vị thứ hai Q2=33, giá trị tứ phân vị thứ ba Q3=75, hệ số
bất đối xứng: 0.1185453>0 nên phân phối lệch phải, GTLN: 38, GTNN:28
.02
.01
0
50 100 150
IQ score
.6
.4
.2
0
4 5 6 7 8
lwage
Dùng lệnh scatter cho các cặp biến phụ thuộc-độc lập: lwage-IQ, lwage-educ, lwage-exper,
lwage-tenure, lwage-age, ta được các biểu đồ phân tán dưới đây:
lwage-IQ
8
7
lwage
6
5
50 100 150
IQ score
lwage-educ
8
7
lwage
6
5
8 10 12 14 16 18
years of education
lwage-exper
8
7
lwage
6
5
0 5 10 15 20 25
years of work experience
lwage-tenure
8
7
lwage
6
5
0 5 10 15 20
years with current employer
lwage-age
8
7
lwage
6
5
28 30 32 34 36 38
age in years