You are on page 1of 10

Câu 1/ Mô hình:

log(𝑤𝑎𝑔𝑒) = 𝛽0 + 𝛽1*𝐼𝑄 + 𝛽2*educ + 𝛽3*exper + 𝛽4*tenure + 𝛽5*age + 𝛽6*married


+ 𝛽7*black + 𝛽8*south + 𝛽9* urban + 𝛽10*bl_so + u
Với:
wage: Tiền lương ($/tháng)
IQ: Chỉ số IQ
educ: Số năm đi học
exper: Số năm kinh nghiệm làm việc
tenure: Số năm nắm giữ chức vụ
age: Tuổi
married: =1 nếu đã kết hôn.
black: =1 nếu người da màu
south: =1 nếu sống ở phía nam
urban: =1 nếu sống ở thành thị
lwage: = log(wage)
bl_so: = black*south: thể hiện nếu một người da màu sống ở phía nam sẽ tăng/giảm 𝛽9%
lương so với một người da màu không ở phía nam.
a/ Số lượng quan sát và biến trong file số liệu? Cấu trúc dữ liệu kinh tế trong file số liệu
là gì?
Sử dụng lệnh describe trong stata, ta có cái nhìn sơ lược nhất về và ý nghĩa từng biến.
Ở đây ta biết được:
Số lượng quan sát: 935 quan sát
Số lượng biến được thực hiện: 12 biến
Tổng kích cỡ của bộ dữ liệu là 18700 dữ liệu.
Cấu trúc dữ liệu trong file dữ liệu là kiểu dữ liệu chéo, được thể hiện dưới dạng:
ID wage IQ educ exper tenure age married black south urban lwage bl_so

1 X1 Y11 A21 B31 C41 D51 E61 F71 G81 H91 I101 K201

2 X2 Y12 A22 B32 C42 D52 E62 F72 G82 H92 I102 K202

3 X3 Y13 A23 B33 C43 D53 E63 F73 G83 H93 I103 H203
n Xn Y1n A2n B3n C4n D5n E6n F7n G8n H9n I10n K20n

b/ Trình bày đặc điểm các biến trong mô hình?


Từ kết quả của lệnh describe, ta cũng có thể thấy được đặc điểm các biến trong mô hình, sẽ
đươc trình bày dưới dạng bảng dưới đây:
Biến wage: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến tiền lương hàng tháng
Biến IQ: kiểu dữ liệu số nguyên, biến định lượng,ý nghĩa là biến chỉ số IQ
Biến EDU: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số năm đi học
Biến EXPER: kiểu dữ liệu số nguyên, biến định lượng,ý nghĩa là biến số năm kinh nghiệm
làm việc
Biến TENURE: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số năm nắm giữ
chức vụ
Biến AGE: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số tuổi
Biến MARRIED: biến định tính, biến giả, với MARRIED=1 là người đã kết hôn và
MARRIED= 0 là người chưa kết hôn
Biến BLACK: biến định tính, biến giả, với BLACK=1 là người da màu và BLACK=0 là
người không da màu
Biến SOUTH: biến định tính, biến giả, với SOUTH=1 là người sống ở phía nam và
SOUTH=0 là người không sống ở phía nam
Biến URBAN:biến định tính, biến giả, với URBAN=1 là người sống ở thành thị và
URBAN=0 là người không sống ở thành thị
Biến BLACK2: biến định tính, là biến người da màu sống ở phía nam nếu BLACK=1 và
SOUTH=1
Đặc điểm của từng biến được tóm tắt trong bảng dưới đây:
Tên biến Kiểu dữ liệu Dạng hiển thị Ý nghĩa
wage Số nguyên Độ dài 9 chữ số Tiền lương ($/tháng)

IQ Số nguyên Độ dài 9 chữ số Chỉ số IQ


educ Số nguyên Độ dài 9 chữ số Số năm đi học
exper Số nguyên Độ dài 9 chữ số Số năm kinh nghiệm làm việc
tenure Số nguyên Độ dài 9 chữ số Số năm nắm giữ chức vụ
age Số nguyên Độ dài 9 chữ số Tuổi
married Số nguyên Độ dài 9 chữ số Giá trị =1 nếu đã kết hôn.
black Số nguyên Độ dài 9 chữ số Giá trị =1 nếu người da màu
south Số nguyên Độ dài 9 chữ số Giá trị =1 nếu sống ở phía nam
urban Số nguyên Độ dài 9 chữ số Giá trị =1 nếu sống ở thành thị
lwage Số thực Độ dài 9 chữ số Giá trị = log(wage)
bl_so Số thực Độ dài 9 chữ số Giá trị = black*south: thể hiện nếu
một người da màu sống ở phía nam sẽ
tăng/giảm 𝛽9% lương so với một
người da màu không ở phía nam.

c/ Biến phụ thuộc và các biến độc lập trong mô hình là những biến gì?
Theo như mô hình, ta có thể xác định biến phụ thuộc và biến độc lập như sau:
Biến phụ thuộc: lwage.
Các biến độc lập: IQ, educ, exper, tenure, age, married, black, south, urban, bl_so.
Trong đó biến IQ giải thích khi biến IQ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽1 đơn
vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến educ giải thích khi biến educ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽2
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến exper giải thích khi biến exper tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽3
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến tenure giải thích khi biến tenure tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽4 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến age giải thích khi biến age tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽5 đơn
vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến married giải thích khi biến married tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽6 đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến black giải thích khi biến black tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽7
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến south giải thích khi biến south tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽8
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến urban giải thích khi biến urban tăng/giảm 1 đơn vị thì biến lwage tăng/giảm 𝛽9
đơn vị trong điều kiện các yếu tố khác không đổi.
Trong đó biến bl_so giải thích khi biến bl_so tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽10 đơn vị trong điều kiện các yếu tố khác không đổi.
d/ Thống kê mô tả các biến trong mô hình và diễn giải kết quả
• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)
• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ
thuộc trong mô hình.
Để thống kể mô tả các biến trong Stata, ta dùng lệnh summarize.
Kết quả trên stata được mô tả lại ở dưới đây:
Cột 1 cho biết tên các biến, cột 2 cho biết số quan sát của từng biến, cột 3 cho biết giá trị
trung bình của từng biến, cột 4 cho biết độ lệch chuẩn của từng biến, cột 5 và cột 6 lần lượt là
nhỏ nhất và giá trị lớn nhất của từng biến.
Cụ thể biến wage có 935 số quan sát, giá trị trung bình là 957.9455, giá trị sai số tiêu chuẩn là
404.3608, giá trị nhỏ nhất và lớn nhất lần lượt là 115 va 3078.
Tương tự cho các biến khác, ta sẽ lập 1 bảng diễn giải kết quả của kết quả thống kê mô tả
trong stata:

Tên biến Số quan sát Giá trị trung bình Sai số chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
wage 935 957.9455 404.3608 115 3078
IQ 935 101.2824 15.05264 50 145
educ 935 13.46845 2.196654 9 18
exper 935 11.56364 4.374586 1 23
tenure 935 7.234225 5.075206 0 22
age 935 33.08021 3.107803 28 38
married 935 .8930481 .3092174 0 1
black 935 .1283422 .3346495 0 1
south 935 .3411765 .4743582 0 1
urban 935 .7176471 .4503851 0 1
black2 935 .0812834 .2734161 0 1
lwage 935 6.779004 .4211439 4.744932 8.032035

Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm các
giá trị phân vị và phương sai của biến.
Cụ thể như ta quan sát của biến IQ có: số quan sát là 935, tổng trọng số là 935, trung
bình=101.2824, độ lệch chuẩn = 15.05264, phương sai = 226.5819. Các phân vị: giá trị tứ
phân vị thứ nhất Q1=92, giá trị tứ phân vị thứ hai Q2= 102, giá trị tứ phân vị thứ ba Q3=112,
hệ số bất đối xứng: -0.3404246 < 0 nên phân phối lệch trái, GTLN = 145, GTNN = 50.
Dưới đây là bảng thống kê mô tả của biến IQ:

Giá trị phân Giá trị nhỏ


Phân vị
vị nhất
1% 64 50
5% 74 54
10% 82 55 Số quan sát 935
25% 92 59 Sum of Wgt. 935
50% 102 Trung bình 101.2824
Giá trị lớn
Độ lệch chuẩn 15.05264
nhất
75% 112 134
90% 120 134 Phương sai 226.5819
95% 125 137 Độ lệch chuẩn của phân phối -.3404246
99% 132 145 Độ lệch chuẩn của trung bình 2.977035

Tương tự như vậy đối với các biến còn lại, ta có thống kê mô tả chi tiết như sau:
• Biến wage: số quan sát là 935, tổng trọng số là 935, trung bình: 957.9455 ,độ lệch
chuẩn:404.3608, phương sai: 163507.7 các phân vị: giá trị tứ phân vị thứ nhất
Q1= 668, giá trị tứ phân vị thứ hai Q2= 905,giá trị tứ phân vị thứ ba Q3=1160, hệ
số bất đối xứng: 1.199259>0 nên phân phối lệch phải, GTLN:3078, GTNN:115
• Biến educ: số quan sát là 935 , tổng trọng số là 935, trung bình:13.46845, độ lệch
chuẩn: 2.196654, phương sai: 4.825288, các phân vị: giá trị tứ phân vị thứ nhất
Q1=12, giá trị tứ phân vị thứ hai Q2= 12,giá trị tứ phân vị thứ ba Q3=16, hệ số bất
đối xứng:0.5477959>0 nên phân phối lệch phải, GTLN:9, GTNN:18
• Biến exper: số quan sát là 935 , tổng trọng số là 935, trung bình: 11.56364 độ lệch
chuẩn: 4.374586 phương sai: các phân vị: giá trị tứ phân vị thứ nhất Q1=8, giá trị
tứ phân vị thứ hai Q2=11 giá trị tứ phân vị thứ ba Q3= 15, hệ số bất đối xứng:
0.077676>0 nên phân phối lệch phải, GTLN:23, GTNN:1
• Biến terune: số quan sát là 935, tổng trọng số là 935 , trung bình: 7.234225,độ
lệch chuẩn: 5.075206, phương sai:25.75771, các phân vị: giá trị tứ phân vị thứ
nhất Q1= 3, giá trị tứ phân vị thứ hai Q2=7, giá trị tứ phân vị thứ ba Q3=11, hệ số
bất đối xứng:0.431838>0 nên phân phối lệch phải, GTLN:22, GTNN:0
• Biến age: số quan sát là 935, tổng trọng số là 935, trung bình: 33.08021, độ lệch
chuẩn: 3.107803, phương sai: 9.658441, các phân vị: giá trị tứ phân vị thứ nhất
Q1=30, giá trị tứ phân vị thứ hai Q2=33, giá trị tứ phân vị thứ ba Q3=75, hệ số
bất đối xứng: 0.1185453>0 nên phân phối lệch phải, GTLN: 38, GTNN:28

• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)


Dùng lệnh histogram cho các biến wage, IQ và lwage, ta được các biểu đồ phân phối tần suất
dưới đây:
Bảng phân phối tần suất của biến wage
.0015
.001
Density
5.0e-04

0 1000 2000 3000


monthly earnings

Bảng phân phối tần suất của biến IQ


.04
.03
Density

.02
.01
0

50 100 150
IQ score

Bảng phân phối tần suất của biến lwage


1
.8
Density

.6
.4
.2
0

4 5 6 7 8
lwage

Dùng lệnh scatter cho các cặp biến phụ thuộc-độc lập: lwage-IQ, lwage-educ, lwage-exper,
lwage-tenure, lwage-age, ta được các biểu đồ phân tán dưới đây:
lwage-IQ
8
7
lwage

6
5

50 100 150
IQ score

lwage-educ
8
7
lwage

6
5

8 10 12 14 16 18
years of education

lwage-exper
8
7
lwage

6
5

0 5 10 15 20 25
years of work experience

lwage-tenure
8
7
lwage

6
5

0 5 10 15 20
years with current employer

lwage-age
8
7
lwage

6
5

28 30 32 34 36 38
age in years

e/ Hồi quy mô hình theo phương pháp OLS


Để có thể hồi quy mô hình một cách toàn diện, ta cần phải thực hiện lần lượt các bước sau:
1. Ước lượng hàm hồi quy
2. Kiểm định đa cộng tuyến
3. Kiểm định phương sai thay đổi
4. Hồi quy có khắc phục phương sai
Đầu tiên ta dùng lệnh regress chạy mô hình hồi quy theo phương pháp OLS.

You might also like