You are on page 1of 19

Hồi quy bội

log(𝑤𝑎𝑔𝑒) = 𝛽0 + 𝛽1*𝐼𝑄 + 𝛽2*educ + 𝛽3*exper + 𝛽4*tenure + 𝛽5*age + 𝛽6*married


+ 𝛽7*black + 𝛽8*south + 𝛽9* bl_so + u + 𝛽10* urban.
Với:
wage: Tiền lương ($/tháng)
IQ: Chỉ số IQ
educ: Số năm đi học
exper: Số năm kinh nghiệm làm việc
tenure: Số năm nắm giữ chức vụ
age: Tuổi
married: =1 nếu đã kết hôn.
black: =1 nếu người da màu
south: =1 nếu sống ở phía nam
urban: =1 nếu sống ở thành thị
lwage: = log(wage)
bl_so: = black*south: thể hiện nếu một người da màu sống ở phía nam sẽ tăng/giảm 𝛽9%
lương so với một người da màu không ở phía nam.
a/ Số lượng quan sát và biến trong file số liệu? Cấu trúc dữ liệu kinh tế trong file số liệu
là gì?
Sử dụng lệnh describe trong stata, ta có cái nhìn sơ lược nhất về và ý nghĩa từng biến.
Ở đây ta biết được:
Số lượng quan sát: 935 quan sát
Số lượng biến được thực hiện: 12 biến
Tổng kích cỡ của bộ dữ liệu là 18700 dữ liệu.
Cấu trúc dữ liệu trong file dữ liệu là kiểu dữ liệu chéo, được thể hiện dưới dạng:
ID wage IQ educ exper tenure age married black south urban lwage bl_so

1 X1 Y11 A21 B31 C41 D51 E61 F71 G81 H91 I101 K201

2 X2 Y12 A22 B32 C42 D52 E62 F72 G82 H92 I102 K202

3 X3 Y13 A23 B33 C43 D53 E63 F73 G83 H93 I103 H203
n Xn Y1n A2n B3n C4n D5n E6n F7n G8n H9n I10n K20n

b/ Trình bày đặc điểm các biến trong mô hình?


Từ kết quả của lệnh describe, ta cũng có thể thấy được đặc điểm các biến trong mô hình, sẽ
đươc trình bày dưới dạng bảng dưới đây:
Biến wage: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến tiền lương hàng tháng
Biến IQ: kiểu dữ liệu số nguyên, biến định lượng,ý nghĩa là biến chỉ số IQ
Biến edu: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số năm đi học
Biến exper: kiểu dữ liệu số nguyên, biến định lượng,ý nghĩa là biến số năm kinh nghiệm làm
việc
Biến tenure: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số năm nắm giữ chức
vụ
Biến age: kiểu dữ liệu số nguyên, biến định lượng, ý nghĩa là biến số tuổi
Biến married: biến định tính, biến giả, với married=1 là người đã kết hôn và married= 0 là
người chưa kết hôn
Biến black: biến định tính, biến giả, với black=1 là người da màu và black=0 là người không
da màu
Biến south: biến định tính, biến giả, với south=1 là người sống ở phía nam và south=0 là
người không sống ở phía nam
Biến urban: biến định tính, biến giả, với urban=1 là người sống ở thành thị và urban=0 là
người không sống ở thành thị
Biến bl_so: biến định tính, là biến người da màu sống ở phía nam nếu BLACK=1 và
SOUTH=1
Đặc điểm của từng biến được tóm tắt trong bảng dưới đây:
Tên biến Kiểu dữ liệu Dạng hiển thị Ý nghĩa
wage Số nguyên Độ dài 9 chữ số Tiền lương ($/tháng)

IQ Số nguyên Độ dài 9 chữ số Chỉ số IQ


educ Số nguyên Độ dài 9 chữ số Số năm đi học
exper Số nguyên Độ dài 9 chữ số Số năm kinh nghiệm làm việc
tenure Số nguyên Độ dài 9 chữ số Số năm nắm giữ chức vụ
age Số nguyên Độ dài 9 chữ số Tuổi
married Số nguyên Độ dài 9 chữ số Giá trị =1 nếu đã kết hôn.
black Số nguyên Độ dài 9 chữ số Giá trị =1 nếu người da màu
south Số nguyên Độ dài 9 chữ số Giá trị =1 nếu sống ở phía nam
urban Số nguyên Độ dài 9 chữ số Giá trị =1 nếu sống ở thành thị
lwage Số thực Độ dài 9 chữ số Giá trị = log(wage)
bl_so Số thực Độ dài 9 chữ số Giá trị = black*south: thể hiện nếu
một người da màu sống ở phía nam sẽ
tăng/giảm 𝛽9% lương so với một
người da màu không ở phía nam.

c/ Biến phụ thuộc và các biến độc lập trong mô hình là những biến gì?
Theo như mô hình, ta có thể xác định biến phụ thuộc và biến độc lập như sau:
Biến phụ thuộc: lwage.
Các biến độc lập: IQ, educ, exper, tenure, age, married, black, south, urban, bl_so.
 Trong đó biến IQ giải thích khi biến IQ tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽1 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến educ giải thích khi biến educ tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽2 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến exper giải thích khi biến exper tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽3 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến tenure giải thích khi biến tenure tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽4 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến age giải thích khi biến age tăng/giảm 1 đơn vị thì biến lwage tăng/giảm
𝛽5 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến married giải thích khi biến married tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽6 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến black giải thích khi biến black tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽7 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến south giải thích khi biến south tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽8 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến urban giải thích khi biến urban tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽9 đơn vị trong điều kiện các yếu tố khác không đổi.
 Trong đó biến bl_so giải thích khi biến bl_so tăng/giảm 1 đơn vị thì biến lwage
tăng/giảm 𝛽10 đơn vị trong điều kiện các yếu tố khác không đổi.
d/ Thống kê mô tả các biến trong mô hình và diễn giải kết quả
• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)
• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ
thuộc trong mô hình.
Để thống kể mô tả các biến trong Stata, ta dùng lệnh summarize.
Kết quả trên stata được mô tả lại ở dưới đây:
Cột 1 cho biết tên các biến, cột 2 cho biết số quan sát của từng biến, cột 3 cho biết giá trị
trung bình của từng biến, cột 4 cho biết độ lệch chuẩn của từng biến, cột 5 và cột 6 lần lượt là
nhỏ nhất và giá trị lớn nhất của từng biến.
Cụ thể biến wage có 935 số quan sát, giá trị trung bình là 957.9455, giá trị sai số tiêu chuẩn là
404.3608, giá trị nhỏ nhất và lớn nhất lần lượt là 115 va 3078.
Tương tự cho các biến khác, ta sẽ lập 1 bảng diễn giải kết quả của kết quả thống kê mô tả
trong stata:

Tên biến Số quan sát Giá trị trung bình Sai số chuẩn Giá trị nhỏ nhất Giá trị lớn nhất
wage 935 957.9455 404.3608 115 3078
IQ 935 101.2824 15.05264 50 145
educ 935 13.46845 2.196654 9 18
exper 935 11.56364 4.374586 1 23
tenure 935 7.234225 5.075206 0 22
age 935 33.08021 3.107803 28 38
married 935 .8930481 .3092174 0 1
black 935 .1283422 .3346495 0 1
south 935 .3411765 .4743582 0 1
urban 935 .7176471 .4503851 0 1
black2 935 .0812834 .2734161 0 1
lwage 935 6.779004 .4211439 4.744932 8.032035

Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm
các giá trị phân vị và phương sai của biến.
Cụ thể như ta quan sát của biến IQ có: số quan sát là 935, tổng trọng số là 935, trung
bình=101.2824, độ lệch chuẩn = 15.05264, phương sai = 226.5819. Các phân vị: giá trị tứ
phân vị thứ nhất Q1=92, giá trị tứ phân vị thứ hai Q2= 102, giá trị tứ phân vị thứ ba Q3=112,
hệ số bất đối xứng: -0.3404246 < 0 nên phân phối lệch trái, GTLN = 145, GTNN = 50.
Dưới đây là bảng thống kê mô tả của biến IQ:

Giá trị phân Giá trị nhỏ


Phân vị
vị nhất
1% 64 50
5% 74 54
10% 82 55 Số quan sát 935
25% 92 59 Sum of Wgt. 935
50% 102 Trung bình 101.2824
Giá trị lớn
Độ lệch chuẩn 15.05264
nhất
75% 112 134
90% 120 134 Phương sai 226.5819
95% 125 137 Độ lệch chuẩn của phân phối -.3404246
99% 132 145 Độ lệch chuẩn của trung bình 2.977035

Tương tự như vậy đối với các biến còn lại, ta có thống kê mô tả chi tiết như sau:
• Biến wage: số quan sát là 935, tổng trọng số là 935, trung bình: 957.9455 ,độ lệch
chuẩn:404.3608, phương sai: 163507.7 các phân vị: giá trị tứ phân vị thứ nhất
Q1= 668, giá trị tứ phân vị thứ hai Q2= 905,giá trị tứ phân vị thứ ba Q3=1160, hệ
số bất đối xứng: 1.199259>0 nên phân phối lệch phải, GTLN:3078, GTNN:115
• Biến educ: số quan sát là 935 , tổng trọng số là 935, trung bình:13.46845, độ lệch
chuẩn: 2.196654, phương sai: 4.825288, các phân vị: giá trị tứ phân vị thứ nhất
Q1=12, giá trị tứ phân vị thứ hai Q2= 12,giá trị tứ phân vị thứ ba Q3=16, hệ số bất
đối xứng:0.5477959>0 nên phân phối lệch phải, GTLN:9, GTNN:18
• Biến exper: số quan sát là 935 , tổng trọng số là 935, trung bình: 11.56364 độ lệch
chuẩn: 4.374586 phương sai: các phân vị: giá trị tứ phân vị thứ nhất Q1=8, giá trị
tứ phân vị thứ hai Q2=11 giá trị tứ phân vị thứ ba Q3= 15, hệ số bất đối xứng:
0.077676>0 nên phân phối lệch phải, GTLN:23, GTNN:1
• Biến terune: số quan sát là 935, tổng trọng số là 935 , trung bình: 7.234225,độ
lệch chuẩn: 5.075206, phương sai:25.75771, các phân vị: giá trị tứ phân vị thứ
nhất Q1= 3, giá trị tứ phân vị thứ hai Q2=7, giá trị tứ phân vị thứ ba Q3=11, hệ số
bất đối xứng:0.431838>0 nên phân phối lệch phải, GTLN:22, GTNN:0
• Biến age: số quan sát là 935, tổng trọng số là 935, trung bình: 33.08021, độ lệch
chuẩn: 3.107803, phương sai: 9.658441, các phân vị: giá trị tứ phân vị thứ nhất
Q1=30, giá trị tứ phân vị thứ hai Q2=33, giá trị tứ phân vị thứ ba Q3=75, hệ số
bất đối xứng: 0.1185453>0 nên phân phối lệch phải, GTLN: 38, GTNN:28

• Vẽ biểu đồ phân phối tần suất của biến WAGE, IQ và log(WAGE)


Dùng lệnh histogram cho các biến wage, IQ và lwage, ta được các biểu đồ phân phối tần suất
dưới đây:
Bảng phân phối tần suất của biến wage
.0015
.001
Density
5.0e-04

0 1000 2000 3000


monthly earnings

Bảng phân phối tần suất của biến IQ


.04
.03
Density

.02
.01
0

50 100 150
IQ score

Bảng phân phối tần suất của biến lwage


1
.8
Density

.6
.4
.2
0

4 5 6 7 8
lwage

• Vẽ biểu đồ phân tán giữa các biến độc lập (ngoài trừ các biến giả) và biến phụ thuộc
trong mô hình.
Dùng lệnh scatter cho các cặp biến phụ thuộc-độc lập: lwage-IQ, lwage-educ, lwage-exper,
lwage-tenure, lwage-age, ta được các biểu đồ phân tán dưới đây:
Biểu đồ phân tán lwage-IQ
8
7
lwage

6
5

50 100 150
IQ score

Biểu đồ phân tán lwage-educ


8
7
lwage

6
5

8 10 12 14 16 18
years of education

Biểu đồ phân tán lwage-exper


8
7
lwage

6
5

0 5 10 15 20 25
years of work experience

Biểu đồ phân tán lwage-tenure


8
7
lwage

6
5

0 5 10 15 20
years with current employer

Biểu đồ phân tán lwage-age


8
7
lwage

6
5

28 30 32 34 36 38
age in years

e/ Hồi quy mô hình theo phương pháp OLS


Để có thể hồi quy mô hình một cách toàn diện, ta cần phải thực hiện lần lượt các bước sau:
1. Ước lượng hàm hồi quy
2. Kiểm định đa cộng tuyến
3. Kiểm định phương sai thay đổi
4. Hồi quy có khắc phục phương sai
Đầu tiên ta dùng lệnh regress chạy mô hình hồi quy theo phương pháp OLS. Ta được các kết
quả sau :
Số quan sát là 935 mẫu
Giá trị kiểm định F=34.07 với 10 nhân tố và 924 bậc tự do
Mức ý nghĩa của kiểm định F, ở đây bé hơn 5% chứng tỏ R bình phương của tổng thể khác 0.
Nói cách khác là các hệ số hồi quy của phương trình hồi quy tổng thể không đồng thời bằng 0
R bình phương = 0.2694
R bình phương hiệu chỉnh = 0.2615, nghĩa là các biến độc lập giải thích được 26.15% biến
thiên của biến phụ thuộc.
Sau khi xem xét các giá trị p-value ( P>|t| p-value, nếu giá trị này bé hơn 5%( 0.05) thì mối
quan hệ giữa biến độc lập này và biến phụ thuộc có ý nghĩa thống kê ), các biến age và black
không mang ý nghĩa thống kê trong mô hình nên ta loại bỏ. Sau đó dựa theo cột giá trị hệ số
hồi quy chưa chuẩn hóa, ta rút ra ra được phương trình hồi quy:
Lwage= 4,980236 + 0.0036968*IQ + 0.0520102*EDUC + 0.0110454*EXPER +
0.0107608*TENURE + 0.2033698*MARRIED – 0.0557451*SOUTH -
0.1721174*BLACK _SOUTH + 0.1773076*URBAN
Tiếp đến ta kiểm tra hiện tượng đa cộng tuyến bằng lệnh vif.
Ta được kết qủa là hầu hết các giá trị hệ số vif đều nhỏ hơn 2, chỉ có 2 biến là black và
black2 là có hệ số lớn hơn 2 (lần lượt là 2.82 và 2.96), vậy nên ở 2 biến này có xảy ra hiện
tượng đa cộng tuyến, và Mean vif có giá trị 1.69 < 2 nên có thể kết luận phương trình không
xảy ra hiện tượng đa cộng tuyến.
Sau đó ta hồi quy lại nhưng có khắc phục hiện tượng phương sai thay đổi thông qua lệnh:
reg lwage IQ educ exper tenure age married black south urban black2 ,robust
Ta được kết quả như sau :
Số quan sát là 935 mẫu
Giá trị kiểm định F= 39.43 với 10 nhân tố và 924 bậc tự do
Mức ý nghĩa của kiểm định F, ở đây bé hơn 5% chứng tỏ R bình phương của tổng thể khác 0.
Nói cách khác là các hệ số hồi quy của phương trình hồi quy tổng thể không đồng thời bằng 0
R bình phương = 0.2694
Sau khi xem xét các giá trị p-value ( P>|t| p-value, nếu giá trị này bé hơn 5%( 0.05) thì mối
quan hệ giữa biến độc lập này và biến phụ thuộc có ý nghĩa thống kê ), các biến age black và
south không mang ý nghĩa thống kê trong mô hình nên ta loại bỏ. Sau đó dựa theo cột giá trị
hệ số hồi quy chưa chuẩn hóa, ta rút ra ra được phương trình hồi quy:
Lwage= 4,980236 + 0.0036968*IQ + 0.0520102*EDUC + 0.0110454*EXPER +
0.0107608*TENURE + 0.2033698*MARRIED - 0.1721174*BLACK _SOUTH +
0.1773076*URBAN
f/ Kiểm định giả thuyết: 𝛽7 = 𝛽8 = 𝛽9 = 𝛽10 = 0. Giải thích kết quả?
Để kiểm định xem các biến black, south, bl_so và urban có ảnh hưởng đến tiền lương
lwage hay không, ta sử dụng kiểm định F-test với lệnh test, với giả thuyết:
H0: 𝛽7 = 𝛽8 = 𝛽9 = 𝛽10 = 0
H1: 𝛽7, 𝛽8, 𝛽9, 𝛽10 không đồng thời bằng 0
Ta được kết quả dưới đây:
F( 4, 924) = 19.85
Prob > F = 0.0000
Kết quả này có ý nghĩa giá trị kiểm định F= 19.85 với 4 nhân tố và 924 bậc tự do, đồng thời
mức ý nghĩa của kiểm định F < 5%, chứng tỏ ta bác bỏ giả thuyết H0, hay 𝛽7, 𝛽8, 𝛽9, 𝛽10
không đồng thời bằng 0.

Biến giả
g/ Số lượng quan sát và biến trong file số liệu? Cấu trúc dữ liệu kinh tế trong file số liệu
là gì?
Số lượng quan sát: 26 quan sát
Sử dụng lệnh describe trong stata, ta có cái nhìn sơ lược nhất về và ý nghĩa từng biến.Ở đây
ta biết được:
Số lượng quan sát: 26
Số lượng biến được thực hiện: 4 biến
Tổng kích cỡ của bộ dữ liệu là 286 dữ liệu.
Cấu trúc dữ liệu trong file dữ liệu là kiểu dữ liệu bảng
h/ Đặc điểm các biến trong mô hình:
Từ kết quả của lệnh describe, ta cũng có thể thấy được đặc điểm các biến trong mô hình, sẽ
đươc trình bày dưới dạng bảng dưới đây:
Biến observation: kiểu số nguyên, mô tả thời gian theo năm.
Biến savings: kiểu số thực, biến định lượng, là biến mô tả tiết kiệm của quốc gia
Biến Income: kiểu số thực, biến định lượng, mô tả GDP của quốc gia
Biến Dummy: biến giả, biến định tính, biến để phân biệt thành 2 giai đoạn trong dữ liệu
1970-1981 và 1982-1995. Nếu dummy=1 là trong giai đoạn 1982-1995 sau thực thi chính
sách tiền tệ
Đặc điểm của từng biến được tóm tắt trong bảng dưới đây:
Tên biến Kiểu dữ liệu Dạng hiển thị Ý nghĩa
observation Số nguyên Độ dài 8 chữ mô tả thời gian theo năm
số
savings Số thực Độ dài 8 chữ biến mô tả tiết kiệm của
số quốc gia

Income Số thực Độ dài 8 chữ mô tả GDP của quốc gia


số
Dummy Số nguyên Độ dài 8 chữ biến giả, biến định tính,
số biến để phân biệt thành 2
giai đoạn trong dữ liệu
1970-1981 và 1982-1995.
Nếu dummy=1 là trong
giai đoạn 1982-1995 sau
thực thi chính sách tiền tệ

i/ Thống kê mô tả và diễn giải kết quả


• Ma trận hệ số tương quan
• Vẽ biểu đồ phân phối tần suất của biến savings, income
• Vẽ biểu đồ phân tán giữa các biến độc lập (income) và biến phụ thuộc
(savings) trong mô hình.
Để thống kể mô tả các biến trong Stata, ta dùng lệnh summarize.
Kết quả trên stata được mô tả lại ở dưới đây:
Cột 1 cho biết tên các biến, cột 2 cho biết số quan sát của từng biến, cột 3 cho biết giá trị
trung bình của từng biến, cột 4 cho biết độ lệch chuẩn của từng biến, cột 5 và cột 6 lần lượt là
nhỏ nhất và giá trị lớn nhất của từng biến.
Cụ thể biến savings có 26 số quan sát, giá trị trung bình là 162.0885, giá trị sai số tiêu chuẩn
là 63.20446, giá trị nhỏ nhất và lớn nhất lần lượt là 61 va 272.6
Tương tự cho các biến khác, ta sẽ lập 1 bảng diễn giải kết quả của kết quả thống kê mô tả
trong stata:

Số
Giá trị trung Sai số Gt nhỏ Gt lớn
Tên biến quan
bình chuẩn nhất nhất
sát
observation 26 1982.5 7.648529 1970 1995
savings 26 162.0885 63.20446 61 272.6
income 26 2645.119 1469.282 727.1 5320.8
dummy 26 .5384615 .5083911 0 1

Ta cũng có thể dùng lệnh: “sum ,detail” để mô ta chi tiết các biến hơn, ở đây ta thấy thêm
các giá trị phân vị và phương sai của biến.
Cụ thể ta có quan sát của các biến:
• Biến savings : số quan sát là 26, tổng trọng số là 26, trung bình: 162.0885, độ lệch
chuẩn: 63.20446, phương sai: 3994.803, các phân vị: giá trị tứ phân vị thứ nhất
Q1=97.6, giá trị tứ phân vị thứ hai Q2=178.1, giá trị tứ phân vị thứ ba Q3=206.2,
hệ số bất đối xứng: -0.1371236<0 nên phân phối lệch trái, GTLN: 272.6,
GTNN:61
• Biến income : số quan sát là 26, tổng trọng số là 26, trung bình: 2645.119, độ lệch
chuẩn: 1469.282, phương sai: 2158791, các phân vị: giá trị tứ phân vị thứ nhất
Q1=1273, giá trị tứ phân vị thứ hai Q2=2434.85, giá trị tứ phân vị thứ ba
Q3=3894.5, hệ số bất đối xứng: 0.3085444>0 nên phân phối lệch phải, GTLN:
5320.8, GTNN:727.1
Ma trận hệ số tương quan
Dùng lệnh correlate để lập ma trận hệ số tương quan, ta được kết quả như bảng dưới đây :

savings observation income dummy


savings 1.0000
observation 0.8992 1.0000
income 0.8759 0.9913 1.0000
dummy 0.8313 0.8641 0.8564 1.0000

Ở đây ta thấy giữa các biến độc lập và biến phụ thuộc, và giữa các biến phụ thuộc đều có
tương quan thuận với nhau. Tuy nhiên vì hệ số tương quan quá cao ( > 0.8 ) nên ta có thể
nghi ngờ mô hình mắc đa cộng tuyến.
• Vẽ biểu đồ phân phối tần suất của biến savings, income
Dùng lệnh histogram để tạo bảng phân phối tần suất cho các biến savings và income, ta được
kết quả dưới đây :
Bảng phân phối tần suất của biến savings.
.008
.006
Density

.004
.002

50 100 150 200 250


Savings

Bảng phân phối tần suất của biến income.


4.0e-04
3.0e-04
Density
2.0e-04
1.0e-04

1000 2000 3000 4000 5000


Income

• Vẽ biểu đồ phân tán giữa các biến độc lập (income) và biến phụ thuộc
(savings) trong mô hình.

Dùng lệnh scatter cho cặp biến phụ thuộc-độc lập: saving-income, ta được biểu đồ phân tán
dưới đây:

Biểu đồ phân tán saving-income:


300
250
200
Savings

150
100
50

1000 2000 3000 4000 5000


Income

Biểu đồ phân tán saving-income giai đoạn 1970-1981:


200
150
Savings

100
50

500 1000 1500 2000 2500


Income

Biểu đồ phân tán saving-income giai đoạn 1982-1995:


300
250
Savings

200
150

2000 3000 4000 5000 6000


Income

g. Viết mô hình trong giai đoạn 1970-1981


Mô hình trong giai đoạn 1970-1981 được thể hiện dưới dạng:
Savingt = α1 + β1incomet + ut
Đầu tiên ta dùng lệnh regress chạy mô hình hồi quy theo phương pháp OLS. Ta được các kết
quả sau :
Số quan sát là 12 mẫu
Giá trị kiểm định F= 92.19 với 1 nhân tố và 10 bậc tự do
Mức ý nghĩa của kiểm định F, ở đây bé hơn 5% chứng tỏ R bình phương của tổng thể khác 0.
Nói cách khác là các hệ số hồi quy của phương trình hồi quy tổng thể không đồng thời bằng 0
R bình phương = 0.9021
R bình phương hiệu chỉnh = 0.8924, nghĩa là các biến độc lập giải thích được 89.24% biến
thiên của biến phụ thuộc.
Sau khi xem xét các giá trị p-value ( P>|t| p-value, nếu giá trị này bé hơn 5%( 0.05) thì mối
quan hệ giữa biến độc lập này và biến phụ thuộc có ý nghĩa thống kê ), biến income thỏa mãn
pt hồi quy. Sau đó dựa theo cột giá trị hệ số hồi quy chưa chuẩn hóa, ta rút ra ra được phương
trình hồi quy:
Saving = 1.016115 + 0.0803319*income + ut

h. Viết mô hình trong giai đoạn 1982- 1995


Mô hình trong giai đoạn 1982-1995 được thể hiện dưới dạng:
Savingt = α2 + β2incomet + ut
Đầu tiên ta dùng lệnh regress chạy mô hình hồi quy theo phương pháp OLS. Ta được các kết
quả sau :
Số quan sát là 14 mẫu
Giá trị kiểm định F= 3.14 với 1 nhân tố và 12 bậc tự do
Mức ý nghĩa của kiểm định F, ở đây lớn hơn 5% chứng tỏ R bình phương của tổng thể khác
0. Phương trình này không thỏa mãn kiểm định F
R bình phương = 0.2072
R bình phương hiệu chỉnh = 0.1411, nghĩa là các biến độc lập giải thích được 14.11% biến
thiên của biến phụ thuộc.
Sau khi xem xét các giá trị p-value ( P>|t| p-value, nếu giá trị này bé hơn 5%( 0.05) thì mối
quan hệ giữa biến độc lập này và biến phụ thuộc có ý nghĩa thống kê ), biến income không
thỏa mãn pt hồi quy. Nên ta không thể đưa ra phương trình hồi quy cho giai đoạn này.
i/ Kiểm định giả thuyết “tiết kiệm tự định thay đổi sau khi chính sách tiền tệ được thực
thi”. Giả thuyết này được kiểm định bằng kiểm định gì? Giải thích kết quả kiểm định?
Để kiểm định giả thuyết này, đầu tiên ta tạo ra 2 biến mới là income1 là income trong thời
gian từ 1970-1981, và income2 là income trong giai đoạn 1982-1995.
Sau đó ta hồi quy phương trình: saving = α + β1income1 + β2income2
Dùng lệnh regress và thông quá các quá trình xử lí như ở câu j, ta có kết quả:
Savings = 57.66676 + 0.0419065*income1 + 0.0387556*income2
Sau đó ta dùng kiểm định F-test với giả thuyết:
H0: 𝛽1 = 𝛽2
H1: 𝛽1 khác 𝛽2
Với ý nghĩa nếu 𝛽1 khác 𝛽2 thì tiết kiệm tự định thay đổi sau khi chính sách tiền tệ được thực
thi.
Ta được kết quả dưới đây:
F( 1, 23) = 0.07
Prob > F = 0.7898
Kết quả này có ý nghĩa giá trị kiểm định F= 0.07 với 1 nhân tố và 23 bậc tự do, đồng thời
mức ý nghĩa của kiểm định F > 5%, vì vậy ta không thể kết luận “tiết kiệm tự định thay đổi
sau khi chính sách tiền tệ được thực thi.”

You might also like