Professional Documents
Culture Documents
ECON-BDS-A1-Nguyễn Đức Tài-Nguyễn Thị Hồng Nguyên
ECON-BDS-A1-Nguyễn Đức Tài-Nguyễn Thị Hồng Nguyên
1 X1 Y11 A21 B31 C41 D51 E61 F71 G81 H91 I101 K201
2 X2 Y12 A22 B32 C42 D52 E62 F72 G82 H92 I102 K202
3 X3 Y13 A23 B33 C43 D53 E63 F73 G83 H93 I103 H203
n Xn Y1n A2n B3n C4n D5n E6n F7n G8n H9n I10n K20n
c/ Biến phụ thuộc và các biến độc lập trong mô hình là những biến gì?
Theo như mô hình, ta có thể xác định biến phụ thuộc và biến độc lập như sau:
Biến phụ thuộc: lwage.
Các biến độc lập: IQ, educ, exper, tenure, age, married, black, south, urban, bl_so.
Trong đó biến IQ giải thích khi biến IQ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽1 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến educ giải thích khi biến educ tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽2 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến exper giải thích khi biến exper tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽3 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến tenure giải thích khi biến tenure tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽4 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến age giải thích khi biến age tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽5 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến married giải thích khi biến married tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽6 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến black giải thích khi biến black tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽7 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến south giải thích khi biến south tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽8 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến urban giải thích khi biến urban tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽9 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến bl_so giải thích khi biến bl_so tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽10 đơn vị trong điều kiện các yếu tố khác không đổi.
d/ Thống kê mô tả các biến trong mô hình và diễn giải kết quả
• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)
• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ
thuộc trong mô hình.
Để thống kể mô tả các biến trong Stata, ta dùng lệnh summarize.
Kết quả trên stata được mô tả lại ở dưới đây:
Cột 1 cho biết tên các biến, cột 2 cho biết số quan sát của từng biến, cột 3 cho biết giá trị
trung bình của từng biến, cột 4 cho biết độ lệch chuẩn của từng biến, cột 5 và cột 6 lần lượt là
nhỏ nhất và giá trị lớn nhất của từng biến.
Cụ thể biến wage có 935 số quan sát, giá trị trung bình là 957.9455, giá trị sai số tiêu chuẩn là
404.3608, giá trị nhỏ nhất và lớn nhất lần lượt là 115 va 3078.
Tương tự cho các biến khác, ta sẽ lập 1 bảng diễn giải kết quả của kết quả thống kê mô tả
trong stata:
Tên biến Số quan sát Giá trị trung bình Sai số chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
wage 935 957.9455 404.3608 115 3078
IQ 935 101.2824 15.05264 50 145
educ 935 13.46845 2.196654 9 18
exper 935 11.56364 4.374586 1 23
tenure 935 7.234225 5.075206 0 22
age 935 33.08021 3.107803 28 38
married 935 .8930481 .3092174 0 1
black 935 .1283422 .3346495 0 1
south 935 .3411765 .4743582 0 1
urban 935 .7176471 .4503851 0 1
black2 935 .0812834 .2734161 0 1
lwage 935 6.779004 .4211439 4.744932 8.032035
Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm
các giá trị phân vị và phương sai của biến.
Cụ thể như ta quan sát của biến IQ có: số quan sát là 935, tổng trọng số là 935, trung
bình=101.2824, độ lệch chuẩn = 15.05264, phương sai = 226.5819. Các phân vị: giá trị tứ
phân vị thứ nhất Q1=92, giá trị tứ phân vị thứ hai Q2= 102, giá trị tứ phân vị thứ ba Q3=112,
hệ số bất đối xứng: -0.3404246 < 0 nên phân phối lệch trái, GTLN = 145, GTNN = 50.
Dưới đây là bảng thống kê mô tả của biến IQ:
Tương tự như vậy đối với các biến còn lại, ta có thống kê mô tả chi tiết như sau:
• Biến wage: số quan sát là 935, tổng trọng số là 935, trung bình: 957.9455 ,độ lệch
chuẩn:404.3608, phương sai: 163507.7 các phân vị: giá trị tứ phân vị thứ nhất
Q1= 668, giá trị tứ phân vị thứ hai Q2= 905,giá trị tứ phân vị thứ ba Q3=1160, hệ
số bất đối xứng: 1.199259>0 nên phân phối lệch phải, GTLN:3078, GTNN:115
• Biến educ: số quan sát là 935 , tổng trọng số là 935, trung bình:13.46845, độ lệch
chuẩn: 2.196654, phương sai: 4.825288, các phân vị: giá trị tứ phân vị thứ nhất
Q1=12, giá trị tứ phân vị thứ hai Q2= 12,giá trị tứ phân vị thứ ba Q3=16, hệ số bất
đối xứng:0.5477959>0 nên phân phối lệch phải, GTLN:9, GTNN:18
• Biến exper: số quan sát là 935 , tổng trọng số là 935, trung bình: 11.56364 độ lệch
chuẩn: 4.374586 phương sai: các phân vị: giá trị tứ phân vị thứ nhất Q1=8, giá trị
tứ phân vị thứ hai Q2=11 giá trị tứ phân vị thứ ba Q3= 15, hệ số bất đối xứng:
0.077676>0 nên phân phối lệch phải, GTLN:23, GTNN:1
• Biến terune: số quan sát là 935, tổng trọng số là 935 , trung bình: 7.234225,độ
lệch chuẩn: 5.075206, phương sai:25.75771, các phân vị: giá trị tứ phân vị thứ
nhất Q1= 3, giá trị tứ phân vị thứ hai Q2=7, giá trị tứ phân vị thứ ba Q3=11, hệ số
bất đối xứng:0.431838>0 nên phân phối lệch phải, GTLN:22, GTNN:0
• Biến age: số quan sát là 935, tổng trọng số là 935, trung bình: 33.08021, độ lệch
chuẩn: 3.107803, phương sai: 9.658441, các phân vị: giá trị tứ phân vị thứ nhất
Q1=30, giá trị tứ phân vị thứ hai Q2=33, giá trị tứ phân vị thứ ba Q3=75, hệ số
bất đối xứng: 0.1185453>0 nên phân phối lệch phải, GTLN: 38, GTNN:28
.02
.01
0
50 100 150
IQ score
.6
.4
.2
0
4 5 6 7 8
lwage
• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ thuộc
trong mô hình.
Dùng lệnh scatter cho các cặp biến phụ thuộc-độc lập: lwage-IQ, lwage-educ, lwage-exper,
lwage-tenure, lwage-age, ta được các biểu đồ phân tán dưới đây:
Biểu đồ phân tán lwage-IQ
8
7
lwage
6
5
50 100 150
IQ score
6
5
8 10 12 14 16 18
years of education
6
5
0 5 10 15 20 25
years of work experience
6
5
0 5 10 15 20
years with current employer
6
5
28 30 32 34 36 38
age in years
Biến giả
g/ Số lượng quan sát và biến trong file số liệu? Cấu trúc dữ liệu kinh tế trong file số liệu
là gì?
Số lượng quan sát: 26 quan sát
Sử dụng lệnh describe trong stata, ta có cái nhìn sơ lược nhất về và ý nghĩa từng biến.Ở đây
ta biết được:
Số lượng quan sát: 26
Số lượng biến được thực hiện: 4 biến
Tổng kích cỡ của bộ dữ liệu là 286 dữ liệu.
Cấu trúc dữ liệu trong file dữ liệu là kiểu dữ liệu bảng
h/ Đặc điểm các biến trong mô hình:
Từ kết quả của lệnh describe, ta cũng có thể thấy được đặc điểm các biến trong mô hình, sẽ
đươc trình bày dưới dạng bảng dưới đây:
Biến observation: kiểu số nguyên, mô tả thời gian theo năm.
Biến savings: kiểu số thực, biến định lượng, là biến mô tả tiết kiệm của quốc gia
Biến Income: kiểu số thực, biến định lượng, mô tả GDP của quốc gia
Biến Dummy: biến giả, biến định tính, biến để phân biệt thành 2 giai đoạn trong dữ liệu
1970-1981 và 1982-1995. Nếu dummy=1 là trong giai đoạn 1982-1995 sau thực thi chính
sách tiền tệ
Đặc điểm của từng biến được tóm tắt trong bảng dưới đây:
Tên biến Kiểu dữ liệu Dạng hiển thị Ý nghĩa
observation Số nguyên Độ dài 8 chữ mô tả thời gian theo năm
số
savings Số thực Độ dài 8 chữ biến mô tả tiết kiệm của
số quốc gia
Số
Giá trị trung Sai số Gt nhỏ Gt lớn
Tên biến quan
bình chuẩn nhất nhất
sát
observation 26 1982.5 7.648529 1970 1995
savings 26 162.0885 63.20446 61 272.6
income 26 2645.119 1469.282 727.1 5320.8
dummy 26 .5384615 .5083911 0 1
Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm
các giá trị phân vị và phương sai của biến.
Cụ thể ta có quan sát của các biến:
• Biến savings : số quan sát là 26, tổng trọng số là 26, trung bình: 162.0885, độ lệch
chuẩn: 63.20446, phương sai: 3994.803, các phân vị: giá trị tứ phân vị thứ nhất
Q1=97.6, giá trị tứ phân vị thứ hai Q2=178.1, giá trị tứ phân vị thứ ba Q3=206.2,
hệ số bất đối xứng: -0.1371236<0 nên phân phối lệch trái, GTLN: 272.6,
GTNN:61
• Biến income : số quan sát là 26, tổng trọng số là 26, trung bình: 2645.119, độ lệch
chuẩn: 1469.282, phương sai: 2158791, các phân vị: giá trị tứ phân vị thứ nhất
Q1=1273, giá trị tứ phân vị thứ hai Q2=2434.85, giá trị tứ phân vị thứ ba
Q3=3894.5, hệ số bất đối xứng: 0.3085444>0 nên phân phối lệch phải, GTLN:
5320.8, GTNN:727.1
Ma trận hệ số tương quan
Dùng lệnh correlate để lập ma trận hệ số tương quan, ta được kết quả như bảng dưới đây :
Ở đây ta thấy giữa các biến độc lập và biến phụ thuộc, và giữa các biến phụ thuộc đều có
tương quan thuận với nhau. Tuy nhiên vì hệ số tương quan quá cao ( > 0.8 ) nên ta có thể
nghi ngờ mô hình mắc đa cộng tuyến.
• Vẽ biểu đồ phân phối tần suất của biến savings, income
Dùng lệnh histogram để tạo bảng phân phối tần suất cho các biến savings và income, ta được
kết quả dưới đây :
Bảng phân phối tần suất của biến savings.
.008
.006
Density
.004
.002
• Vẽ biểu đồ phân tán giữa các biến độc lập (income) và biến phụ thuộc
(savings) trong mô hình.
Dùng lệnh scatter cho cặp biến phụ thuộc-độc lập: saving-income, ta được biểu đồ phân tán
dưới đây:
150
100
50
100
50
200
150