计量经济学及Stata应用 (非高级) 陈强部分课后答案

《计量经济学与 Stata 应用》陈强 (非高级版)
部分习题参考答案
【注意】
1. 答案仅供参考，因制作答案较匆忙，可能会出现错别字、公式打错、答案错误等问题。
2. 代码运行在 Stata17 上，每个大题下的代码需依次运行 (可自行调整)，单独运行某小题代码可能会出现

问题。
3. 部分编程题目，答案代码可能较为简洁，读者可根据教材代码加以补充。
4. 数据与课件可在教材作者提供的网址http://econometrics-stata.com/col.jsp?id=101上进行下载。
5. 如对本份答案有疑问，可发送邮件至tu01git01@qq.com，我会及时回复的。
目录
第 1 章导论 3
第 2 章 Stata 入门 4
第 3 章数学回顾 5
第 4 章一元线性回归 8
第 5 章多元线性回归 12
第 6 章大样本 OLS 15
第 7 章异方差 19
第 8 章自相关 22
第 9 章模型设定与数据问题 25
第 10 章工具变量法 30
第 11 章二值选择模型 34
1
第 12 章面板数据 39
第 13 章平稳时间序列 42
第 14 章单位根与协整 48
第 15 章如何做实证研究 50
2
第1章导论
本章无习题。
3
第2章 Stata 入门
2.1 安装 Stata 软件，并将本章的 Stata 命令与实例操作一遍。
略.
4
第3章数学回顾
3.1 对于随机变量 X，证明 Var.X / D E.X 2 / ŒE.X /2 。
证：
记 D E.X /，则
Var.X / D EŒ.X /2 D E.X 2 2X C 2 /
D E.X 2 / 2E.X / C 2 D E.X 2 / 22 C 2
D E.X 2 / 2 D E.X 2 / ŒE.X /2
3.2 对于随机变量 X 与 Y ，证明 Cov.X; Y / D E.X Y / E.X /E.Y /。

证：
Cov.X; Y / D EfŒX E.X /ŒY E.Y /g D EŒX Y XE.Y / YE.X / C E.X /E.Y /
D E.X Y / E.Y /E.X / E.X /E.Y / C E.X /E.Y / D E.X Y / E.X /E.Y /
3.3 对于随机变量 X; Y; Z，证明 Cov.X; Y C Z/ D Cov.X; Y / C Cov.X; Z/。

证：
Cov.X; Y C Z/ D EŒ.X E.X //.Y C Z E.Y C Z//0
D EŒ.X E.X //.Y C Z E.Y / E.Z//0
D EŒ.X E.X //.Y E.Y //0 C .X E.X //.Z E.Z//0
D Cov.X; Y / C Cov.X; Z/
0 1
0 1 0 1 a11 a12
X1 1 B C
B C
3.4 二维随机向量 X D @ A 的期望为 E.X / D D @ A。A D Ba21 a22 C 为常数矩阵。证明以下等式。
X2 2 @ A
a31 a32
(1) E.AX / D A。(提示：使用期望算子的线性性及矩阵乘法的定义。)
(2) Var.X/ D E.XX 0 / 0 。(提示：使用协方差矩阵定义，期望与转置算子的线性性。)
(3) Var.AX/ D A0 Var.X /A。(提示：使用协方差矩阵定义，以及 (1) 的结论。)
证：
20 1 3 0 1
a11 a12 0 1 a11 a12 0 1
6B C X 7 B C X1
6B C 1 7 B C
(1) E.AX / D E 6Ba21 a22 C @ A7 D Ba21 a22 C E @ A D A。
4@ A X2 5 @ A X2
a31 a32 a31 a32
5
(2) Var.X/ D EŒ.X E.X //.X E.X //0 D EŒ.X /.X /0 D E.XX 0 X0 X C 0 / D
E.XX 0 / 0 0 C 0 D E.XX 0 / 0 。
(3) Var.AX/ D EŒ.AX E.AX //.AX E.AX //0 D EŒA.X /.X /0 A0 D AEŒ.X /.X /0 A0 D
A0 Var.X/A。
3.5 (不相关，但不满足均值独立的例子) 假设 X 与 Z 都服从标准正态分布，且相互独立，定义 Y D X 2 C Z。
(1) 计算 E.Y jX/。该条件期望是否依赖于 X ？
(2) 计算 E.Y /。条件期望是否等于无条件期望？
(3) 计算 E.X Y /。(提示：奇函数在对称区间的积分为 0。)
(4) 证明 Cov.X; Y / D 0。
证：
(1) E.Y jX/ D E.X 2 C ZjX/ D E.X 2 jX/ C E.ZjX/ D X 2 C 0 D X 2 ，该条件期望依赖于 X 。
(2) E.Y / D E.X 2 C Z/ D E.X 2 / C E.Z/ D ŒE.X /2 C Var.X/ D 1 ¤ X 2 ，条件期望不等于无条件期望。

ˆ C1
2 2 3 1 x2
(3) E.XY / D EŒX.X C Z/ D E.X C XZ/ D E.X / D x 3 p e 2 dx D 0。
1 2
(4)
Cov.X; Y / D Cov.X; X 2 C Z/ D Cov.X; X 2 / C Cov.X; Z/
D E.X 3 / E.X /E.X 2 / C 0
D0 0C0
D0
3.6 假设随机变量 Y 服从两点分布，即 P .Y D 1/ D p，而 P .Y D 0/ D 1 p。从 Y 的分布中抽取独立同分

布的随机样本 fY1 ; ; Yn g。记 pO 为此样本中成功 (即 Y D 1) 的比例。
n
1X
(1) 证明 pO D YN Yi 。
n nD1
(2) 证明估计量 pO 是 p 的无偏估计。
p.1 p/
(3) 证明估计量 pO 的方差为 Var.p/
O D 。
n
证：
n
1X
(1) 因为 Y B.1; p/，则 E.Y / D p，所以 pO D YN Yi 。
n nD1
n
! n
!
1X 1 X
(2) E.p/
O DE Yi D E Yi D E.Yi / D p。
n nD1 n nD1
6
n
! n
!
1X 1 X 1 p.1 p/
(3) Var.p/
O D Var Yi D 2 Var Yi D Var.Yi / D 。
n nD1 n nD1
n n
3.7 假设 Yi N.0; 2 /，且为独立同分布，i D 1; ; n。
(1) 证明 E.Yi2 = 2 / D 1。(提示：使用公式 E.X 2 / D Var.X / C ŒE.X /2 。)

n
1 X 2
(2) 证明 W Y 服从 2 .n/ 分布。
2 nD1 i
(3) 证明 E.W / D n。
Y1
(4) 证明 V s 服从 t .n 1/ 分布。
P
n
Yi2
nD2
n 1
证：
Yi
(1) 因为 Yi N.0; 2 /，所以 N.0; 1/，则

2 2
Yi Yi Yi
E 2
D Var C E D1C0D1

n
Yi Y2 1 X 2
(2) 因为 N.0; 1/，且 Yi 独立同分布，则 i2 2 .1/，所以 W 2 Y 服从 2 .n/ 分布。
nD1 i
2
Yi
(3) E.W / D nE D n。
2
Xn
Y1 Yi2 Y1 Y1 =
(4) 因为 N.0; 1/; 2
2 .n 1/，则 V s Ds t .n 1/。
nD2
Pn
2
P
n
2 2 Yi Yi =
nD2 nD2
n 1 n 1
7
第4章一元线性回归
4.1 考虑以下消费函数 (consumption function)：
Ci D ˛ C ˇYi C "i (4.41)
其中，Ci 为个体 i 的消费开支，而 Yi 为个体 i 的可支配收入。假设 OLS 回归所得的样本回归线为
O i
CO i D ˛O C ˇY (4.42)
(1) 斜率 ˇO 的经济含义是什么？
(2) 截距项 ˛O 的经济含义是什么？
(3) 对于个体 i，计算其平均消费倾向 (average propensity to consume)Ci =Yi 。假如 ˛O > 0，则随着个体 i 可
支配收入的增加，其平均消费倾向将如何变化？
解：
(1) 个体 i 的可支配收入每增加 1 个单位，个体 i 的消费开支就增加 ˇO 个单位。
(2) 当个体 i 的可支配收入为 0 时，个体 i 的消费开支为 ˛。 O

Ci ˛O O Ci
(3) 因为 D C ˇ，所以当 ˛O > 0 时，Yi 增加会导致减少，即平均消费倾向将减少。
Yi Yi Yi
30
X 30
X
4.2 假设把 y 对 x 进行回归，样本容量为 30， yi D 150; xi D 60。如果截距项的 OLS 估计值为 2，则
i D1 iD1
斜率的 OLS 估计值是多少？
解：
对回归方程两边求平均，可得 yN D ˛O C ˇO x。 N
60 150 yN ˛O 5 2
而 xN D D 2; yN D D 5，代入 ˛O D 2，则 ˇO D D D 1:5。
30 30 xN 2
P
n P
n
xi yi nxN yN .xi x/.y
N i y/
N n n
iD1 i D1 1X 1X
4.3 证明 D ，其中 xN xi ; yN D yi 。(提示：从等式右边向左边
Pn P
n
n iD1 n i D1
xi2 nxN 2 .xi N 2
x/
iD1 i D1
证明。)
8
证：
P
n P
n
.xi x/.y
N i y/
N .xi yi xy
N i yx
N i C xN y/
N
i D1 i D1
D
P
n P
n
.xi N 2
x/ .xi2 N i C xN 2 /
2xx
iD1 iD1
P
n
xi yi nxN yN nxN yN C nxN yN
i D1
D
P
n
xi2 2nxN 2 C nxN 2
iD1
P
n
xi yi nxN yN
i D1
D
Pn
xi2 nxN 2
i D1
4.4 考虑只有常数项的回归：
yi D ˛ C "i (4.43)
其中，常数项 ˛ 是唯一的解释变量。推导 ˛ 的 OLS 估计量，并证明此回归的 R2 等于 0。

解：
X X X
需 min Q D ei2 D .yi yOi /2 D .yi O 2 ，则
˛/
@Q X 1X
D 2 .yi ˛/
O D 0 ) ˛O D yi D yN
@˛O n
所以 P P P
2 ei2 .yi O 2
˛/ .yi N 2
y/
R D1 P D1 P D1 P D1 1D0
.yi N 2
y/ .yi N 2
y/ .yi N 2
y/
4.5 考虑如下线性回归：
yi D ˛ C ˇxi C "i (4.44)
其中，假设已知 ˛ D 3，推导 ˇ 的 OLS 估计量。

解：
X X X
需 min Q D ei2 D .yi yOi /2 D .yi 3 O i /2 ，则
ˇx
P P
@Q X xi yi 3 xi
D 2 .yi 3 O i /xi D 0 ) ˇO D
ˇx P 2
@ˇO xi
4.6 考虑有常数项的回归：
yi D ˛ C ˇxi C "i .i D 1: ; n/ (4.45)
P n
.yi y/.
N yOi y/
O
2 2 iD1
证明 R D ŒCorr.yi ; yOi / ，其中 Corr.yi ; yOi / s s 。(提示：利用以下性质，即
P
n P
n
NO 2
.yi y/N 2 .yi y/
iD1 iD1
yNO D y;
N yi D yOi C ei ，以及 OLS 的正交性。)
9
证：
Cov.yi ; yOi /
Corr.yi ; yOi / D p p
Var.yi / Var.yOi /
P NO
.yi y/.N yOi y/
D qP P
.yi y/ N 2 .yOi y/ NO 2
P
.yi yOi C yOi y/. N yOi y/ N
D qP P
P P
.yi yOi /.yOi y/ N C .yOi y/ N 2
D qP P
P
0 C .yOi y/ N 2
D qP P
sP
.yOi y/N 2
D P
.yi y/ N 2
p
D R2
所以 R2 D ŒCorr.yi ; yOi /2 。
4.7 数据集 galton.dta 包含 Galton(1886) 的原始数据。变量 pare nt 为父母的平均身高 (英寸)，而 child 为子

女身高 (英寸)。其中，为平衡身高的性别差异，女性身高 (包括母亲与女儿) 均乘以 1.08。
(1) 计算变量 child 与 pare nt 的基本统计特征。
(2) 将变量 child 与 pare nt 的散点图与线性拟合图画在一起。
(3) 考虑以下回归方程：
chi ldi D ˛ C ˇpare nti C "i (4.46)
其中，随机扰动项 "i 代表哪些因素？
(4) 使用 OLS 估计方程 (4.46) 并回答：父母身高每增加 1 英寸，子女身高平均将增加多少？父母身高可

解释子女身高变动的百分之几？
(5) 定义 pare nt _dev 为父母身高减去父母那一辈人群的平均身高，并定义 ge ngap 为子女身高减去父

母身高。将 ge ngap 对 pare nt _dev 进行回归。是否存在“回归均值现象”(参见附录 A4.1)？
解：
(1) 代码如下：
summarize child parent
(2) 代码如下：
twoway scatter child parent || lfit child parent
10
(3) 代码如下：
reg child parent
随机扰动项包含除了父母身高以外影响子女身高的其他所有因素。
(4) ˇ D 0:6463，说明父母身高每增加 1 英寸，子女身高平均增加 0.6463 英寸；

R2 D 0:2105，说明父母身高可解释子女身高变动的 21.05%。
(5) 代码如下：
summarize parent
gen parent_dev = parent - r(mean)
gen gengap = child - parent
reg gengap parent_dev
ˇD 0:3537 < 1，说明父辈的优势在子辈有所削弱，说明存在“回归均值现象”。
4.8 重复本章 4.9 节的蒙特卡罗模拟，但将样本容量从 30 增加到 100。此时，对于截距项与斜率的估计是否更

为准确？将总体回归线、样本回归线以及散点图画在一起。
解：
set obs 100
set seed 10101
gen x = rnormal(3, 2)
gen e = rnormal(0, 3)
gen y = 1 + 2*x + e
reg y x
twoway function PRF = 1+2*x, range(-10 15) || scatter y x || lfit y x, lpattern(dash)
斜率的估计值为 2.148356，截距项的估计值为 0.5526799，比样本容量为 30 时更接近 2 和 1，更为准确，

但仍存在一定的抽样误差。
11
第5章多元线性回归
5.1 从残差 ei yi .ˇO1 C ˇO2 xi2 C C ˇOK xiK / 出发，证明残差向量 e D y O
X ˇ。
证：
将 ei 从 e1 ; ; en 写出，则
e1 D y1 .ˇO1 C ˇO2 x12 C C ˇOK x1K /

::
:
en D yn .ˇO1 C ˇO2 xn2 C C ˇOK xnK /

0 1 0 1 0 1 0 1
e1 y1 1 x12 x1K ˇ
B C B C B C B 1C
B C: B C: B: :: :: C O B :: C O
令 e D B :: C ; y D B :: C ; X D B :: : : C ; ˇ D B : C，则 e D y X ˇ。
@ A @ A @ A @ A
en yn 1 xn2 xnK ˇK
5.2 考虑一元回归模型 yi D ˇ1 C ˇ2 xi C "i 。证明：E."i jxi / D 0 意味着 E.yi jxi / D ˇ1 C ˇ2 xi 。

证：
E."i jxi / D 0 ” E.ˇ1 C ˇ2 xi C "i jxi / D ˇ1 C ˇ2 xi ” E.yi jxi / D ˇ1 C ˇ2 xi
5.3 考虑只对常数项进行回归，即 yi D ˇ1 C "i 。写出其数据矩阵 X ，并根据公式 ˇO D .X 0 X/ 1 X 0 y 推导 ˇ1 的

OLS 估计量。
解：
由题知：X D .1; ; 1/0 ，且 X 是 n 1 维的。
所以
1 1X
ˇO D .X 0 X/ 1 X 0 y D .1; ; 1/y D yi ) ˇO1 D yN
n n
0 1
1 2
B C
B C
B1 2C
B C
B C
5.4 假设数据矩阵为 X D B1 2C。
B C
B C
B1 2C
@ A
1 2
(1) 此数据矩阵是否满列秩？
(2) 写出数据矩阵 X 的转置。
(3) 计算矩阵 X 0 X，其逆矩阵 .X 0 X / 1

是否存在？
解：
(1) 由题意，rank.X/ D 1 < 2，所以 X 不是满列秩的。
12
0 1
1 1 1 1 1
(2) X 0 D @ A。
2 2 2 2 2
0 1
1 2
B C
0 1B
B1
C
2C 0 1
1 1 1 1 1 B C 5 10
(3) X 0 X D @ AB
B1
C
2C D @ A，det.X 0 X / D 0，所以逆矩阵 .X 0 X/ 1
不存在。
2 2 2 2 2 BB
C
C 10 20
B1 2C
@ A
1 2
5.5 数据集 airq.dta 包含 1972 年美国加州 30 个大城市的如下变量：ai rq (空气质量指数，越低越好)，vala (公

司的增加值，千美元)，rai n (降雨量，英寸)，coast (是否为海岸城市)，de nsi ty (人口密度，每平方英里)，
i ncome (人均收入，美元)。
(1) 把 ai rq 对其他变量进行 OLS 回归。
(2) 检验原假设“平均收入对空气质量没有影响”。
(3) 检验经济变量 density 与 i ncome 的联合显著性。
(4) 检验环境变量 rai n 与 coast 的联合显著性。
(5) 检验所有解释变量的联合显著性。
解：
(1) 代码如下：
reg airq vala rain coast density income
(2) 代码如下：
test income = 0
p 值为 0:5205 > 0:05，说明接受原假设，认为“平均收入对空气质量没有影响”。
(3) 代码如下：
test density income
p 值为 0:6857 > 0:05，说明接受原假设，认为 de nsi ty 和 i ncome 对 ai rq 的共同影响不显著。
(4) 代码如下：
test rain coast
p 值为 0:0141 < 0:05，说明拒绝原假设，认为 rai n 与 coast 对 ai rq 的共同影响显著。
(5) 代码如下：
test vala rain coast density income
p 值为 0:0313 < 0:05，说明拒绝原假设，认为方程整体显著。
13
5.6 穷国能否赶上富国？由于穷国的资本较少，故资本的边际产出较高。因此，一种理论认为，穷国的经济增
长速度应比富国快，并收敛于富国，称为“绝对收敛”(absolute convergence)。另一种观点则认为，只有
在控制其他因素 (比如人力资本) 的情况下，穷国的增长速度才快于富国，称为“条件收敛”(conditional
convergence)。使用 Gallup, Sachs and Mellinger(1999) 的部分跨国数据集 geodata_short.dta，检验是否存在
绝对收敛或条件收敛。该数据集的被解释变量为 gdpg6590 (1965-1990 年人均 GDP 的增长率)，而解释变
量包括 lgdp65 (1965 年人均 GDP 的对数)，以及 syr1965 (1965 年平均受中学教育年限的对数)。
(1) 以 5% 的显著性水平检验是否存在绝对收敛。
(2) 以 5% 的显著性水平检验是否存在条件收敛。
解：
(1) 代码如下：
reg gdpg6590 lgdp65
lgdp65 系数 t 检验的 p 值为 0:076 > 0:05，说明接受原假设，认为不存在绝对收敛。
(2) 代码如下：
reg gdpg6590 lgdp65 syr1965
lgdp65 系数 t 检验的 p 值为 0:021 < 0:05，说明拒绝原假设，认为存在条件收敛。
5.7 使用回归模型进行餐馆选址。数据集 Woody3.dta 包含 33 家 Woody’s 连锁餐馆的以下变量：y (毛销售收

入)，compet it ors (两英里内直接竞争者的数目)，pop (三英里内的居民人数)，i ncome (三英里内的家庭
平均收入)。
(1) 把 y 对其他变量进行多元回归。
(2) 评论拟合优度，以及各变量系数的符号与显著性。
(3) 解释此回归结果如何有助于为一家新的 Woody’s 餐馆选址。
解：
(1) 代码如下：
reg y competitors pop income
(2) R2 D 0:6182；
compet itors 的系数为 9074:674 < 0，对应 p 值约为 0 < 0:05，说明拒绝原假设，认为该系数显著；
pop 的系数为 0:3546684 > 0，对应 p 值约为 0 < 0:05，说明拒绝原假设，认为该系数显著；
i ncome 的系数为 1:287923 > 0，对应 p 值为 0:025 < 0:05，说明拒绝原假设，认为该系数显著。
(3) 应选址在两英里内直接竞争者的数目较少，三英里内的居民人数较多和家庭平均收入较高的地方。
14
第6章大样本 OLS
n
1X
6.1 假设随机变量 y 的期望为，抽样得到其 iid 随机样本 fy1 ; ; yn g，记样本均值为 yN yi 。
n iD1
(1) yN 是的无偏估计。yN 2 是否是 2 的无偏估计？
(2) yN 是的一致估计。yN 2 是否是 2 的一致估计？
解：
(1)
2 !2 3
n
X
1
E.yN 2 / D E 4 2 yi 5
n i D1
1
D E.y12 C C yn2 C 2y1 y2 C C 2yn 1 yn /
n2
1 2.n 1/ 2
D E.y12 / C
n n
¤ 2
所以 yN 2 不是 2 的无偏估计。
p p
(2) 不失一般性，我们可直接证明：若 f 是连续函数，且 ˇn ! ˇ，则 f .ˇn / ! f .ˇ/。
因为 f 是连续函数，则 8" > 0，有 9ı > 0，使得当 jx ˇj ı 时，jf .x/ f .ˇ/j "，这也等价于
当 jx ˇj > ı 时，jf .x/ f .ˇ/j > "。
而
P .jf .ˇn / f .ˇ/j > "/ D P f! 2 W jf .ˇn .!// f .ˇ/j > "g
D P .ˇn 1 Œfx 2 R W jf .x/ f .ˇ/j > "g/
P .jˇn ˇj > ı/ D P f! 2 W jˇn .!/ ˇj:ıg
D P .ˇn 1 Œfx 2 R W jx ˇj > ıg/
同时 fx 2 R W jx ˇj > ıg fx 2 R W jf .x/ f .ˇ/j > "g，

所以 P .jf .ˇn / f .ˇ/j > "/ P .jx ˇj > ı/。
p p
而因为 ˇn ! ˇ，则 lim P .jˇn ˇj > ı/ D 0，所以 lim P .jf .ˇn / f .ˇ/j > "/，则 f .ˇn / ! f .ˇ/。
n!1 n!1
N ˇ D ; f .x/ D x 2 ，则 yN 2 是 2 的一致估计。
取 ˇn D y;
6.2 考虑随机序列 fxn g1

nD1 ，其中 xn 取值为 0 的概率为 1 .1=n/，而取值为 n 的概率为 1=n。证明此序列的
方差发散，即 lim Var.xn / D 1。
n!1
证： 0 1
0 n
由题意：xn @ A，所以 E.xn / D 1; E.xn2 / D n，于是
1 1
1 n n
Var.xn / D E.xn2 / ŒE.xn /2 D n 1 ) lim Var.xn / D 1

n!1
15
6.3 证明线性模型的离差形式，即方程 (6.22)。
证：
首先将 yi D ˛ C ˇxi C "i 从 y1 ; ; yn 写出：
y1 D ˛ C ˇx1 C "1
::
:
yn D ˛ C ˇxn C "n
所有等式左边与右边分别相加并除以 n，可得
1 1 1
.y1 C C yn / D ˛ C ˇ.x1 C C xn / C ."1 C C "n /
n n n
即 yN D ˛ C ˇ xN C "N，将此式与 yi D ˛ C ˇxi C "i 相减，可得
yi yN D ˛ C ˇ.xi x/
N C ."i "Ni /
证毕。
p
6.4 当 n ! 1 时，是否稳健标准误 SE .bk / ! 0？为什么？
解： r r
1 b b p 1b p
是，因为 SE .bk / D AVar.b/，而 AVar.b/ ! ŒE.xi0 xi / 1 S ŒE.xi0 xi / 1 ，则 SE .bk / D AVar.b/ !
r n n
1 p
ŒE.xi0 xi / 1 SŒE.xi0 xi / 1 ，显然当 n ! 1 时，SE .bk / ! 0。
n
6.5 使用数据集 grilic.dta，以稳健标准误估计以下回归方程：
ln w D ˇ1 C ˇ2 s C ˇ3 expr C ˇ4 t e nure C ˇ5 smsa C " (6.43)
其中，ln w 为工资对数，s 为教育年限，expr 为工龄，t e nure 为在现单位工作年限，而 smsa 表示是否

住在大城市。另外，变量 rns 表示是否住在美国南方。
(1) 使用全样本，估计方程 (6.43)。
(2) 使用美国南方的子样本，估计方程 (6.43)。
(3) 使用美国北方的子样本，估计方程 (6.43)。
(4) 与全样本相比，子样本估计量的标准误有何变化，为什么？
解：
(1) 代码如下：
reg lnw s expr tenure smsa, r
(2) 代码如下：
16
reg lnw s expr tenure smsa if rns, r
(3) 代码如下：
reg lnw s expr tenure smsa if !rns, r
(4) 两个子样本估计量的标准误均比全样本估计量的标准误要大。因为减少样本容量，会使得样本的代
表性更差，与实际数值相差更多，误差更大。
6.6 房屋的价格如何决定？一种理论认为，房价由房屋性能所决定，称为“特征价格法”(hedonic price)。数据

集 hprice2a.dta 包含美国波士顿 506 个社区的房屋中位数价格的横截面数据。考虑以下特征价格回归：
lpricei D ˇ1 C ˇ2 lnoxi C ˇ3 ld i sti C ˇ4 roomsi C ˇ5 st rat i oi C "i (6.44)
其中，lpri ce 为房价的对数，lnox 为空气污染程度的对数，ld i st 为社区到就业中心的距离，rooms 为房

屋的平均房间数，st rat io 为社区学校的学生-教师比例，下标 i 表示社区 i 。
(1) 使用普通标准误进行回归，并评论解释变量系数的符号、统计显著性及经济意义。
(2) 使用稳健标准误进行回归，稳健标准误与普通标准误差别大吗？
(3) 使用稳健标准误，以 5% 的显著性水平，检验 H0 W ˇ3 D ˇ5 。
(4) 使用稳健标准误，以 5% 的显著性水平，分别检验 H0 W ˇ4 D 0:31 与 H0 W ˇ4 D 0:30。
解：
(1) 代码如下：
reg lprice lnox ldist rooms stratio
lnox 的系数为 0:95354 < 0，p 值约为 0，说明系数显著，表明其他条件不变时，空气污染程度每增
加 1%，房价平均下跌 0.9535%；
ld i st 的系数为 0:1343401 < 0，p 值为 0.002，说明系数显著，表明其他条件不变时，社区到就业中
心的距离每增加 1%，房价平均下跌 0.1343%；
rooms 的系数为 0:2545271 > 0，p 值约为 0，说明系数显著，表明其他条件不变时，房屋的平均房间
数每增加 1 个单位，房价平均上涨 0.2345%；
st rati o 的系数为 0:0524512 < 0，p 值约为 0，说明系数显著，表明其他条件不变时，社区学校的
学生-教师比例每增加 1 个单位，房价平均下跌 0.0525%。
(2) 代码如下：
reg lprice lnox ldist rooms stratio, r
整体变动不大。
(3) 代码如下：
test ldist = stratio
17
p 值为 0:1322 > 0:05，说明接受原假设，认为 ˇ3 D ˇ5 。
(4) 代码如下：
test rooms = 0.31
test rooms = 0.30
H0 W ˇ4 D 0:31：p 值为 0:0253 < 0:05，说明拒绝原假设，认为 ˇ4 ¤ 0:31；
H0 W ˇ4 D 0:30：p 值为 0:0664 > 0:05，说明接受原假设，认为 ˇ4 D 0:30。
18
第7章异方差
7.1 考虑有关啤酒月消费量的线性模型：
beer D ˇ1 C ˇ2 i nc C ˇ3 pri ce C ˇ4 educ C ˇ5 f e male C " (7.21)
其中，E."ji nc; price; educ; f e male/ D 0; Var."ji nc; pri ce; educ; f e male/ D 2 i nc 2 。对此模型进行变
换，使得变换后的扰动项为同方差。
解：
1 1
由题意：Var."ji nc; price; educ; f e male/ D 2 i nc 2 ，则 v D i nc 2 ，取 p D ，方程两边同时乘以
v i nc
1
，即
i nc
beer 1 pri ce edu f e male "
D ˇ1 C ˇ2 C ˇ3 C ˇ4 C ˇ5 C
i nc i nc i nc i nc i nc i nc
" ˇ 1 2
ˇ
此时 Var ˇ i nc; price; educ; f e male D i nc 2 D 2 ，说明变换后的扰动项为同方差。
i nc i nc 2
7.2 房价回归是否存在异方差？数据集 hprice2a.dta 包含美国波士顿 506 个社区的房屋中位数价格的横截面数
据 (参见第 6 章)。考虑以下特征价格回归：
lpricei D ˇ1 C ˇ2 lnoxi C ˇ3 ld i sti C ˇ4 roomsi C ˇ5 st rat i oi C "i (7.22)
其中，lpri ce 为房价的对数，lnox 为空气污染程度的对数，ld i st 为社区到就业中心的距离，rooms 为房

屋的平均房间数，st rat io 为社区学校的学生-教师比例，下标 i 表示社区 i 。
(1) 以 5% 的置信度，使用 BP 检验，检验是否存在异方差 (假设扰动项为独立同分布，分别以拟合值 yO

以及所有解释变量进行检验)。
(2) 以 5% 的置信度，使用怀特检验，检验是否存在异方差。
解：
(1) 代码如下：
reg lprice lnox ldist rooms stratio
estat hettest, iid
estat hettest, iid rhs
p 值均为 0，则拒绝原假设，认为存在异方差。
(2) 代码如下：
estat imtest, white
p 值为 0，则拒绝原假设，认为存在异方差。
7.3 恩格尔曲线是否存在异方差？数据集 food.dta 包含有关每周食物开支 .f ood _exp/ 与每周收入 .i ncome/

的 40 个观测值。
19
(1) 将 f ood _exp 与 i ncome 的散点图与线性拟合图画在一起。根据此图，是否可能存在异方差？此异方
差与收入的关系是怎样的？
(2) 将 f ood _exp 对 i ncome 进行回归。
(3) 以 5% 的显著性水平，使用 BP 检验，检验是否存在异方差 (假设扰动项为 iid)。
(4) 以 5% 的显著性水平，使用怀特检验，检验是否存在异方差。
(5) 定义食物开支比例 f ood _share 为 f ood _exp 除以 i ncome，将 f ood _share 与 i ncome 的散点图与
线性拟合图画在一起。从图上看，是否还存在异方差？
(6) 将 f ood _share 对 i ncome 进行回归。
(7) 以 5% 的显著性水平，使用 BP 检验，检验是否存在异方差 (假设扰动项为 iid)。
(8) 以 5% 的显著性水平，使用怀特检验，检验是否存在异方差。
解：
(1) 代码如下：
twoway scatter food_exp income || lfit food_exp income
随着解释变量的增大，散点偏离回归直线的程度增加，可能存在异方差，且扰动项的异方差与解释变
量正相关，即异方差与收入呈正相关。
(2) 代码如下：
reg food_exp income
(3) 代码如下：
estat hettest, iid
p 值为 0:0066 < 0:05，则拒绝原假设，认为存在异方差。
(4) 代码如下：
estat imtest, white
p 值为 0:0229 < 0:05，则拒绝原假设，认为存在异方差。
(5) 代码如下：
gen food_share = food_exp/income
twoway scatter food_share income || lfit food_share income
各点大致均匀分布在拟合直线附近，波动幅度近似相同，可大致判断不存在异方差。
(6) 代码如下：
reg food_share income
(7) 代码如下：
estat hettest, iid
20
p 值为 0:7748 > 0:05，则接受原假设，认为不存在异方差。
(8) 代码如下：
estat imtest, white
p 值为 0:2722 > 0:05，则接受原假设，认为不存在异方差。
21
第8章自相关
8.1 PW 估计法比 CO 估计法更有效率吗？为什么？
解：
从理论上，CO 法的差分过程使得样本容量由 n 下降为 n 1；而 PW 法在 CO 法的基础上补充了一个方
程，使样本容量回到原来的 n，因此更有效率，是 BLUE。
但是，尽管 PW 估计法在理论上确实比 CO 估计法更有效率，而根据文献 [1] 和文献 [2]，PW 估计法的拒
绝率较高，且高于 CO 估计法，因此，在实践中，不能单纯地认为 PW 估计法比 CO 估计法更有效率，也
要具体情况具体分析。
Œ1 Dielman T E . Email: A Note on Hypothesis Tests after Correction for Autocorrelation: Solace for the Cochrane-
Orcutt Method?[J]. Journal of Modern Applied Statal Methods, 2009, 8(1):100-109.
Œ2 Kobayashi M . Comparison of Efﬁciencies of Several Estimators for Linear Regressions With Autocorrelated
Errors[J]. Journal of the American Statistical Association, 1985, 80(392):951-953.
8.2 假设扰动项存在二阶自相关，即 "t D 1 "t 1 C 2 "t 2 C ut ，其中 ut 为白噪声。此时，还可以使用 CO 估

计法吗？若可以，如何进行？
解：
不可以，CO 估计法仅适用于 AR.1/，即序列只存在一阶自相关的情况下。
8.3 使用数据集 gasoline.dta 估计美国 1953—2004 年的汽油需求函数。考虑如下回归：
lgasqt D ˇ1 C ˇ2 li ncomet C ˇ3 lgaspt C ˇ4 lpnct C ˇ5 lpuct C "t (8.33)
其中，被解释变量 lgasq 为人均汽油消费量的对数，解释变量 li ncome 为人均收入的对数，lgasp 为汽油

价格指数的对数，lpnc 为新车价格指数的对数，lpuc 为二手车价格指数的对数。
(1) 使用 OLS 估计方程 (8.33)。评论各变量系数的符号、显著性与经济意义。
(2) 计算残差，并记为 e1。将残差与其一阶滞后的散点图与线性拟合图画在一起。根据此图，是否可能

存在自相关？
(3) 画残差的自相关图。
(4) 用 BG 检验，检验扰动项是否存在自相关。
(5) 用 Q 检验，检验扰动项是否存在自相关。
(6) 计算 DW 统计量。
(7) 使用 HAC 标准误进行回归，将阶段参数设为 n1=4 。
(8) 使用迭代式 CO 估计法进行 FGLS 估计。
(9) 使用迭代式 PW 估计法进行 FGLS 估计。
22
(10) 考虑到消费可能存在惯性，将被解释变量 lgasq 的一阶滞后作为解释变量，加入回归方程 (8.33)。此
滞后项是否显著？
(11) 对于修改后的模型，再次进行 BG 检验与 Q 检验，是否还存在自相关？
解：
(1) 代码如下：
reg lgasq lincome lgasp lpnc lpuc
li ncome 的系数为 1:095874 > 0，p 值约为 0，说明系数显著，表明其他条件不变时，人均收入每增
加 1%，人均汽油消费量增加 1.0959%；
lgasp 的系数为 0:0212072 < 0，p 值为 0:630 > 0:05，说明系数不显著，表明其他条件不变时，汽
油价格指数每增加 1%，人均汽油消费量减少 0.0212%；
lpnc 的系数为 0:3736126 < 0，p 值为 0:021 < 0:05，说明系数显著，表明其他条件不变时，新车价
格指数每增加 1%，人均汽油消费量减少 0.3736%；
lpuc 的系数为 0:0200343 > 0，p 值为 0:847 > 0:05，说明系数不显著，表明其他条件不变时，二手
车价格指数每增加 1%，人均汽油消费量增加 0.0200%。
(2) 代码如下：
predict e1, res
twoway scatter e1 L.e1 || lfit e1 L.e1
散点分布大致在一条斜率为正的直线上，故扰动项可能存在一阶自相关。
(3) 代码如下：
ac e1
(4) 代码如下：
estat bgodfrey
estat bgodfrey, nomiss0
p 值均为 0，拒绝原假设，认为存在自相关。
(5) 代码如下：
wntestq e1
corrgram e1
p 值均为 0，拒绝原假设，认为存在自相关。
(6) 代码如下：
estat dwatson
(7) n1=4 D 2:6853，取 3，代码如下：

newey lgasq lincome lgasp lpnc lpuc, lag(3)
23
(8) 代码如下：
prais lgasq lincome lgasp lpnc lpuc, corc
(9) 代码如下：
prais lgasq lincome lgasp lpnc lpuc, nolog
(10) 代码如下：
reg lgasq L.lgasq lincome lgasp lpnc lpuc
滞后项的 p 值约为 0，说明拒绝原假设，认为滞后项显著。
estat bgodfrey
predict e2, res
wntestq e2
corrgram e2
p 值均大于 0.05，说明接受原假设，认为不存在自相关。
24
第9章模型设定与数据问题
9.1 在使用样本数据估计回归方程 y D ˛ C ˇx C " 时，如果怀疑 x 对 y 的作用还依赖于另一变量 z，应该如
何检验此依赖性？
解：
方法 1(图形分析)：在 z 的不同取值下，绘制 x 和 y 的散点图，如果在不同的 z 取值下，x 和 y 之间的关
系呈现出明显的差异，可能存在依赖性。
方法 2(子样本分析)：将样本数据按照 z 的取值分成几个子样本，然后对每个子样本分别估计回归方程。
比较在不同子样本中的 x 的系数是否存在显著差异。如果在不同子样本中，x 的系数有显著不同的取值，
那么可能存在依赖性。
方法 3(RESET 检验)：构造辅助回归 y D ˛ C ˇx C xz C " 并检验 D 0，若检验结果显著，说明存在依
赖性。
9.2 假设所估计的成本函数为 ln C D ˛ C ˇ ln Q C .ln Q/2 C "，其中 C 为成本，而 Q 为产量。在 ln Q 的样

本均值处，应该如何检验成本的产出弹性 (elasticity of cost with respect to output) 为 1 的原假设？
解：
对方程两边求导：
1 dC ˇ 1
D C 2 ln Q
C dQ Q Q
Q dC
成本的产出弹性 E D D ˇ C 2 ln Q，令 ln Q 的样本均值为 k，那么需检验
C dQ
H0 W ˇ C 2 k D 1; H1 W ˇ C 2 k ¤ 1
计算 ln C D ˛ C ˇ ln Q C .ln Q/2 C " 的 SSR 与 ln C D ˛ C .1 2 k/ ln Q C .ln Q/2 C " 的 SSR ，构造

检验统计量
.SSR SSR/=m
F D F .m; n k/
SSR=.n K/
其中，m D 1; K D 3; n 为样本容量。
9.3 使用数据集 nerlove.dta，估计以下模型：
ln tci D ˇ1 C ˇ2 ln qi C ˇ3 ln pli C ˇ4 ln pki C ˇ5 ln pfi C " (9.47)
其中，ln tc; ln q; ln pl; ln pk 与 ln pf 分别为电力企业的总成本、总产量、小时工资率、资本使用成本、燃

料价格的对数 (参见第 6 章)。
(1) 使用稳健标准误，对方程 (9.47) 进行 OLS 回归。
(2) 计算 VIF。是否存在多重共线性？
(3) 使用拟合值进行 RESET 检验。是否遗漏了非线性项？
25
(4) 在方程 (9.47) 中，加入 ln q 的平方项，重新进行回归。
(5) 再次使用拟合值进行 RESET 检验。是否还遗漏了非线性项？
(6) 再次计算 VIF。是否存在多重共线性？
(7) 从经济理论出发，以上两个回归结果，哪个更可信？
解：
(1) 代码如下：
reg lntc lnq lnpl lnpk lnpf, r
(2) 代码如下：
estat vif
VIF 值均小于 10，认为不存在多重共线性。
(3) 代码如下：
estat ovtest
p 值约为 0，说明拒绝原假设，认为遗漏了非线性项。
(4) 代码如下：
gen lnq2 = (lnq)^2
reg lntc lnq lnq2 lnpl lnpk lnpf, r
(5) 代码如下：
estat ovtest
p 值为 0:3165 > 0:05，说明接受原假设，认为没有遗漏了非线性项。
(6) 代码如下：
estat vif
ln q 和 .ln q/2 的 VIF 值大于 10，认为存在多重共线性。
(7) 两种模型都存在问题，前者遗漏了非线性项，后者存在多重共线性，均不可信。可以尝试添加其他的
非线性项来使得新模型不出现上述问题。
9.4 使用数据集 Growth.dta 考察贸易与增长的关系。该数据集的被解释变量为 65 个国家 1960—1995 年的平

均增长率 .growt h/，而主要解释变量为 1960—1995 年的平均贸易开放度 .t radeshare/。
(1) 将 growth 与 t radeshare 的散点图与线性拟合图画在一起。二者看上去是否有关系？
(2) 有一个国家马耳他 (Malta)，其贸易开放度比其他国家高很多。在散点图上找出马耳他。马耳他是否

像极端值？
(3) 使用全样本，把 growt h 对 t radeshare 进行回归。该回归的斜率与截距项估计值分别是多少？
26
(4) 计算每个观测值的影响力 .leverage/，以及此影响力的最大值与平均值之比。
(5) 去掉马耳他，重复上述回归，并再次回答 (3) 中的问题。(提示：可使用选择项“if _n<65”来去掉马

耳他，其中“_n”表示第 n 个观测值。)
(6) 马耳他在哪？马耳他的贸易开放度为什么这么高？是否应在本研究中去掉马耳他？
(7) 把 growth 对 t radeshare，rgdp60 (1960 年的人均 GDP)，yearsschool (1960 年的平均受教育年限)，

rev_coups (1960—1995 年的年平均政变次数)，以及 assassi nat i ons (1960—1995 年的年平均政治暗
杀次数) 进行回归。评论各变量系数的符号、统计显著性与经济意义。
(8) 为什么将变量 rgdp60 与 yearsschool 的取值定为期初的 1960 年？
解：
(1) 代码如下：
twoway scatter growth tradeshare || lfit growth tradeshare
从散点图上看具有一定的线性关系，但不是非常明显。
(2) 代码如下：
twoway scatter growth tradeshare, mlabel(country) || lfit growth tradeshare
马耳他位于图右上角的散点，符合极端值的特征。
(3) 代码如下：
reg growth tradeshare
斜率和截距项的估计值分别为 2.3064 和 0.6403。
(4) 代码如下：
predict lev, leverage
sum lev
dis r(max)/r(mean)
(5) 代码如下：
reg growth tradeshare if _n<65
斜率和截距项的估计值分别为 1.6809 和 0.9574。
(6) 马耳他位于地中海，是地中海的一个岛国。马耳他天然良港便于货物进出口，基础设施完善，地理位
置优越。马耳他的数据属于极端值，代表性较差，可以删除。
(7) 代码如下：
reg growth tradeshare rgdp yearsschool rev_coups assasinations
t radeshare 的系数为 1:561696 < 0，p 值为 0:044 < 0:05，说明系数显著，表明其他条件不变时，平
均贸易开放度每增加 1 个单位，平均增长率增加 1.5617 个单位；
27
rgdp 的系数为 0:0004693 < 0，p 值为 0:002 < 0:05，说明系数显著，表明其他条件不变时，人均
GDP 每增加 1 个单位，平均增长率减少 0.0005 个单位；
yearsschool 的系数为 0:5748461 > 0，p 值约为 0，说明系数显著，表明其他条件不变时，平均受教
育年限每增加 1 个单位，平均增长率增加 0.5748 个单位；
rev_coups 的系数为 2:157503 < 0，p 值为 0:057 > 0:05，说明系数不显著，表明其他条件不变时，
年平均政变次数每增加 1 个单位，平均增长率减少 2.1575 个单位；
assassi nat ions 的系数为 0:3540784 > 0，p 值为 0:461 > 0:05，说明系数不显著，表明其他条件不变
时，年平均政治暗杀次数每增加 1 个单位，平均增长率增加 0.3541 个单位。
(8) 将 rgdp60 与 yearsschool 的取值定为期初的 1960 年，是为了观察其期初 1960 年的水平，将对未来

36 年的 growt h 增长率的走势的影响是什么样，以指导人们对 1995 年之后的 growt h 增长率的预测
与判断。
9.5 美国的汽油需求函数是否稳定？使用数据集 gasoline.dta，估计美国 1953—2004 年的汽油需求函数 (参见

第 8 章)：
lgasqt D ˇ0 C ˇ1 lgasqt 1 C ˇ2 li ncomet C ˇ3 lgaspt C ˇ4 lpnct C ˇ5 lpuct C "t (9.48)
其中，被解释变量 lgasq 为人均汽油消费量的对数，解释变量 li ncome 为人均收入的对数，lgasp 为汽油

价格指数的对数，lpnc 为新车价格指数的对数，lpuc 为二手车价格指数的对数。
(1) 将 lgasq 与 lgasp 的时间趋势图画在一起。根据此图，在 1953—2004 年期间，美国的汽油需求函数

是否曾出现结构变动？
(2) 使用 OLS 估计方程 (9.48)。
(3) 使用 BP 检验与怀特检验，检验是否存在异方差。
(4) 使用 BG 检验与 Q 检验，检验是否存在自相关。
(5) 1973 年 10 月爆发石油危机，可能引起汽油需求的结构变动。使用虚拟变量法，检验美国的汽油需求

函数是否在 1974 年发生结构变动。根据 (3) 与 (4) 的检验结果决定是否应使用稳健标准误。
解：
(1) 代码如下：
twoway connect lgasq lgasp year, msymbol(circle) msymbol(triangle)
twoway connect lgasq year
单独考察汽油需求函数 lgasq，可以发现 1975 年左右，前后的斜率出现比较明显的变化，因此石油
需求函数可能存在结构变动。
(2) 代码如下：
reg lgasq L.lgasq lincome lgasp lpnc lpuc
28
(3) 代码如下：
estat hettest, iid
estat imtest, white
BP 检验 p 值为 0:5788 > 0:05，说明接受原假设，认为不存在异方差；
怀特检验 p 值为 0:0321 < 0:05，说明拒绝原假设，认为存在异方差。
(4) 代码如下：
estat bgodfrey
predict e1, res
wntestq e1
corrgram e1
BG 检验的 p 值均大于 0.05，说明接受原假设，认为不存在自相关；
Q 检验的 p 值均大于 0.05，说明接受原假设，认为不存在自相关。
(5) 代码如下：
gen d = (year > 1973)
gen lgaspd = lgasp * d
reg lgasq L.lgasq lincome lgasp lpnc lpuc d lgaspd, r
test d lgaspd
p 值为 0:0006 < 0:05，认为拒绝原假设，认为结构发生了变动。
29
第 10 章工具变量法
10.1 假设真实模型为 y D ˛ C ˇx C "，其中 ˇ ¤ 0，而 Cov.x; "/ D 0。y 无法精确预测，但能观测到 y，二
者满足 y D y C v，其中 v 为测量误差。
(1) 考虑回归模型 y D ˛ C ˇx C u，证明其扰动项 u D " C v。
(2) 证明只要被解释变量的测量误差 v 与解释变量 x 不相关，则 OLS 为一致估计量。
(3) 被解释变量测量误差 v 的存在，是否会增大扰动项 u 的方差？
解：
(1) y D ˛ C ˇx C u D y C v D ˛ C ˇx C " C v，所以 u D " C v。
(2) Cov.v; x/ D Cov.u "; x/ D Cov.u; x/ Cov."; x/ D Cov.u; x/，所以只要 v 和 x 不相关，那么 u 和

x 就不相关，满足古典假定，OLS 为一致估计量。
(3) Var.u/ D Var." C v/ D Var."/ C Var.v/ C 2Cov."; v/，若不存在 v，Var.u/ D Var."/ < Var."/ C Var.v/ C
2Cov."; v/，所以 v 的存在增大了 u 的方差。
10.2 证明方程 (10.17) 存在严格多重共线性，即可以找到 xO 1 与 xO 2 的线性组合为常数。

证：
因为 xO 1 D m0 C m1 z; xO 2 D n0 C n1 z，要证可以找到 xO 1 与 xO 2 的线性组合为常数，即证存在 k1 ; k2 ¤ 0 使
得 k1 xO 1 C k2 xO 2 D k1 .m0 C m1 z/ C k2 .n0 C n1 z/ D k1 m0 C k2 n0 C .k1 m1 C k2 n1 /z D C 。
只需取 k1 m1 C k2 n1 D 0，即有 k1 xO 1 C k2 xO 2 D k1 m0 C k2 n0 ，所以可以找到 xO 1 与 xO 2 的线性组合为常数。
10.3 如果“工具变量”与扰动项相关，ˇOIV 是否为一致估计？(提示：根据 2SLS 的第二阶段回归进行说明。)

解：
如果“工具变量”与扰动项相关，即 Cov.zt ; "t / ¤ 0，则
Cov.zt ; "t / D CovŒzt ; ut C ˇ.pt pOt /
D Cov.zt ; ut / C ˇCov.zt ; pt pOt /
D ˇCov.zt ; pt / ˇCov.zt ; pOt /
D ˇŒCov.zt ; pt / Cov.zt ; pOt / ¤ 0
4
所以 Cov.zt ; pt / ¤ Cov.zt ; pOt /，即 Cov.pt ; zt / ¤ Cov.pt ; zt /，于是
plim ˇOIV D plim

4
Cov.qt ; zt /
¤
Cov.qt ; zt /
Dˇ
n!1 4
n!1 Cov.p ; z /
t t
Cov.pt ; zt /
所以 ˇOIV 不是一致估计。
10.4 在方程 (10.10) 中，假设 Cov.ut ; zt / ¤ 0(不满足外生性)，而 Cov.pt ; zt / ¤ 0(依然满足相关性)。
30
(1) 证明 ˇOIV 不是 ˇ 的一致估计，即 plim ˇOIV ¤ ˇ。
n!1

(2) 计算大样本偏差 plim ˇOIV ˇ 。在什么情况下，此偏差的绝对值会变大？
n!1
解：
(1) 因为 Cov.ut ; zt / ¤ 0，
则 Cov.qt ; zt / D Cov.˛Cˇpt Cut ; zt / D ˇCov.pt ; zt /CCov.ut ; zt / ¤ ˇCov.pt ; zt /，
所以
plim ˇOIV D plim
4
Cov.qt ; zt /
D
Cov.qt ; zt /
DˇC
Cov.ut ; zt /
¤ˇ
n!1 4
n!1 Cov.p ; z /
t t
Cov.pt ; zt / Cov.pt ; zt /
(2) 大样本偏差为
Cov.ut ; zt /
plim ˇOIV ˇD
n!1 Cov.pt ; zt /
偏差的绝对值为 ˇ ˇ ˇ ˇ
ˇ ˇ ˇ Cov.ut ; zt / ˇ
ˇ plim ˇOIV ˇ ˇˇ D ˇˇ ˇ
ˇn!1 Cov.p ; z / ˇ
t t
所以，当 jCov.ut ; zt /j 增大，或 jCov.pt ; zt /j 减少时，绝对值会变大。
10.5 使用数据集 acemoglu.dta 复制 Acemoglu et al. (2001) 的部分结果。该数据集包含 64 个曾为欧洲殖民地的

国家，主要变量为 log pgp95 (1995 年人均 GDP，购买力平价)，avexpr (1985—1995 年间的平均产权保护
程度，0 为最低，10 为最高)，lat _abst (首都纬度的绝对值除以 90)，以及 log e m4 (殖民者死亡率的对数)。
另外，变量 short nam 以三个字母作为每个国家的简称。
(1) 为了直观地考察产权保护与经济发展的关系，将 log pgp95 与 avexpr 的散点图与线性拟合图画在一

起，并为每个散点标注国家简称。
(2) 使用稳健标准误，把 log pgp95 对 avexpr 及 lat _abst 进行回归，评论变量系数的符号、统计显著性

及经济意义。
(3) 由于 avexpr 可能为内生解释变量，使用 log em4 作为 avexpr 的工具变量，重新进行 (2) 的回归。工

具变量回归的结果与 OLS 有何不同？
(4) log em4 是否为弱工具变量？
解：
(1) 代码如下：
twoway scatter logpgp95 avexpr, mlabel(shortnam) || lfit logpgp95 avexpr
(2) 代码如下：
reg logpgp95 avexpr lat_abst, r
avexpr 的系数为 0:4678871 > 0，p 值约为 0，说明系数显著，表明其他条件不变时，平均产权保护
程度每增加 1 个单位，人均 GDP 增加 0.4679%；
31
lat_abst 的系数为 1:576884 > 0，p 值为 0:018 < 0:05，说明系数显著，表明其他条件不变时，首都
纬度的绝对值除以 90 每增加 1 个单位，人均 GDP 增加 1.5769%。
(3) 代码如下：
ivregress 2sls logpgp95 lat_abst (avexpr = logem4), r
虽然回归方程仍显著，但 R2 下降为 10.25%，说明模型的解释能力下降了；并且解释变量 lat _abst
不再显著，认为国家首都的地理位置对经济发展的影响不大；avexpr 的回归系数说明，在其他条件
不变的情况下，1985—1995 十年间平均产权保护程度每上升 1 个单位，会使 1995 年按购买力平价的
人均 GDP 平均提高约 1%，仍然是比较合理的范围。
(4) 代码如下：
ivregress 2sls logpgp95 (avexpr = logem4), r
estat firststage
F 统计量为 16:3206 > 10，说明 log em4 不是弱工具变量。
10.6 生育行为如何影响劳动力供给？具体来说，如果妇女多生一位小孩，其劳动力供给将下降多少？本题使用
来自美国 1980 年人口普查的数据集 fertility_small.dta 进行估计。此数据集包含美国 21 35 岁已婚且有
两个或更多子女的妇女信息，主要变量为 weeks (1979 年的工作周数)，morekids (是否有两个以上小孩)，
以及 samesex (头两个小孩是否性别相同)。
(1) 把 weeks 对虚拟变量 morekids 进行回归。有两个以上小孩的妇女是否比有两个小孩的妇女工作更

少？少多少？此效应是否在统计上显著？
(2) 上面 (1) 的回归能否估计生育行为对劳动力供给的因果效应？为什么？
(3) 把 morekids 对 samesex 进行回归。如果头两个小孩性别相同，是否更可能生第三个小孩？此效应

大吗？是否在统计上显著？
(4) 在 weeks 对 morekids 的回归中，能否将 samesex 作为有效工具变量？为什么？
(5) samesex 是否为弱工具变量？
(6) 以 samesex 为工具变量，把 weeks 对 morekids 进行回归。生育行为对劳动力供给的效应有多大？

是否在统计上显著？
(7) 数据集中还有其他控制变量，比如 age (年龄)，black (是否黑人)，hi span (是否拉丁裔)，以及 ot hrace

(是否其他族裔)。在 (6) 的工具变量回归中加入这些控制变量 (假定它们为外生)，回归结果是否有变
化？为什么？
(1) 代码如下：
reg weeks morekids
有两个以上小孩的妇女比有两个小孩的妇女工作更少，少 6.0082 周，此效应 p 值约为 0，说明在统
计上显著。
32
(2) 不能，可能存在双向因果。从经济含义的角度分析，一方面，子女数量增加会导致妇女工作时间的减
少；另一方面，工作时间的减少会导致妇女有时间或者动机去养育更多的子女。因此模型可能存在联
立方程偏差，需考虑使用工具变量法处理。
(3) 代码如下：
reg morekids samesex
头两个小孩性别相同更可能生第三个小孩，但此效应较弱，p 值约为 0，说明在统计上显著。
(4) 工具变量需满足相关性与外生性。
在相关性上，工具变量 samesex 和内生解释变量 morekids 之间的相关性仍是统计上显著的，认为
具有相关性。
在外生性上，由于 samesex 作为工具变量，工具变量个数等于内生解释变量个数，恰好识别，无法
进行过度识别检验，只能定性讨论，由于 samesex 只能通过 morekids 来影响 weeks，所以认为具
有外生性。
综上，samesex 可以作为工具变量。
(5) 代码如下：
ivregress 2sls weeks (morekids = samesex)
estat firststage
F 统计量为 143:15 > 10，说明 samesex 不是弱工具变量。
(6) 代码如下：
ivregress 2sls weeks (morekids = samesex)
生育行为对劳动力供给的效应为 6:033，p 值为 0:108 > 0:05，说明在统计学上不显著。
(7) 代码如下：
ivregress 2sls weeks age black hispan othrace (morekids = samesex)
回归结果有变化，因为增加了解释变量，使得模型更加完整，也会产生更多不同的细节。
33
第 11 章二值选择模型
11.1 假设离散型随机变量 Y 服从如下概率分布：P .Y D 1/ D p; P .Y D 2/ D q，而 P .Y D 3/ D 1 p q。从
此分布中抽取独立同分布的随机样本 fY1 ; ; Yn g。
(1) 写出参数 p 与 q 的似然函数。
(2) 推导 p 与 q 的最大似然估计量。
解：
(1) 设 n 个样本中，取 1 的样本有 n1 个，取 2 的有 n2 个，则取 3 的有 n n1 n2 个。

所以 L.p; q/ D p n1 q n2 .1 p q/n n1 n2
。
(2) 令 l.p; q/ D ln L.p; q/ D n1 ln p C n2 ln q C .n n1 n2 / ln.1 p q/，于是

8
ˆ
ˆ @l n1 n n1 n2
< D D0 n1 n2
@p p 1 p q )pD ;q D
ˆ @l n2 n n1 n2 n n
:̂ D D0
@q q 1 p q
11.2 假设二值选择行为可通过不可观测的“潜变量”(latent variable) y 来考察，其中 y 是该行为的净收益 (收

益减成本)。如果净收益大于 0，则选择做，记 y D 1；否则，选择不做，记 y D 0。假设净收益的决定因
素为
y D x0ˇ C " (11.32)
其中，x 为解释变量，而 " 为扰动项。证明：
(1) 如果 " 服从逻辑分布，则 y 为 Logit 模型。(提示：P .y D 1jx/ D P .y > 0jx/。)
(2) 如果 " N.0; 1/，则 y 为 Probit 模型。
(3) 更一般地，如果 " N.0; 2 /，其中 ¤ 1，则 y 为 Probit 模型。(提示：在方程 (11.32) 的两边同时
除以。)
证：
(1)
P .y D 1jx/ D P .y > 0jx/ D P .x 0 ˇ C " > 0jx/
D P ." > x 0 ˇ/ D 1 P ." x 0 ˇ/
D1 ƒ. x 0 ˇ/
D ƒ.x 0 ˇ/
所以 y 为 Logit 模型。
34
(2)
D P ." > x 0 ˇ/ D 1 P ." x 0 ˇ/
D1 ˆ. x 0 ˇ/
D ˆ.x 0 ˇ/
所以 y 为 Probit 模型。
(3)
D P ." > x 0 ˇ/ D 1 P ." x 0 ˇ/

" x0ˇ
D1 P

x0ˇ
Dˆ

所以 y 是一个特殊的 Probit 模型。
11.3 泰坦尼克号在施救时奉行的政策是“妇女儿童优先”(women and children ﬁrst)。此政策是否得到彻底执行？

具体来说，三等舱的妇女或儿童的存活概率是否高于一等舱的男子？根据数据集 titanic.dta 回答此问题。
解：
代码如下：
logit survive child female class1 class2 class3 [fweight = freq], or nolog
predict prob
list prob female child class3 if (female | child) & class3 == 1 & survive == 1
list prob female child class1 if female == 0 & class1 == 1 & survive == 1
可以发现，在存活概率上三等舱男童 > 一等舱男童 > 三等舱妇女 >> 一等舱男子 > 三等舱男童，可以认

为“妇女儿童优先”政策得到彻底执行。
11.4 使用数据集 loanapp.dta 考察美国的按揭贷款 (mortgage loan) 是否存在种族歧视。如果申请人的按揭贷款

获批，则被解释变量 approve 取值为 1，反之，approve 取值为 0。主要解释变量为 whi t e (是否白人)。
数据集中的其他种族为 black (是否黑人) 与 hi span (是否拉丁裔)。本题统一使用稳健标准误。
(1) 把 approve 对 white 进行 OLS 回归。变量 whi t e 的系数是否显著？此效应有多大？
(2) 把 approve 对 white 进行 Probit 回归。此回归结果与线性概率模型有何不同？
(3) 根据 (1) 与 (2) 的回归结果，是否可认为美国的按揭贷款市场对非白人 .nonwhi t e/ 存在歧视？为什

么？
35
(4) 加入控制变量 hrat (房供占总收入比例)，obrat (其他债务支出占总收入比例)，loanprc (贷款额占房
价比例)，une m (所在行业的失业率)，male (是否男性)，marri ed (是否已婚)，dep (家属人数)，sch
(是否受过 12 年及以上教育)，cosign (是否有担保人)，chi st .1 D 怠账未及 60 天，0 D 怠账 60 天及
以上)，pubrec (是否曾申请破产)，mort lat1 (有 1 2 次逾期付款)，mort lat 2 (有 2 次以上逾期付
款)，以及 vr (所在小区的空置率是否高于平均值)，再次进行 Probit 回归。是否存在歧视非白人的统
计证据？
(5) 使用 Logit，重复 (4) 的回归。Logit 模型的系数显著性是否与 Probit 模型相同？
(6) 使用 Logit，重复 (4) 的回归，但汇报几率比。在给定其他控制变量的情况下，比较白人与非白人成功

申请贷款的几率比。
解：
(1) 代码如下：
reg approve white, r
whit e 的系数 t 检验的 p 值约为 0，说明拒绝原假设，认为系数显著。此效应为 0.2006。
(2) 代码如下：
probit approve white, r
Probit 模型不是线性的，线性概率模型是线性的；
Probit 模型的 R2 高于线性概率模型。
(3) 代码如下：
margins, dydx(*)
线性概率模型下，在其他条件不变时，白人获得贷款的概率比其他人种高 20.06%；
Probit 模型下，在其他条件不变时，白人获得贷款的概率比其他人种高 15.07%。
综上，可以认为美国的按揭贷款市场对非白人 .nonwhi t e/ 存在歧视。
(4) 代码如下：
probit approve white hrat obrat loanprc unem male married dep sch cosign chist
pubrec mortlat1 mortlat2 vr, r
margins, dydx(*)
新的 Probit 模型下，在其他条件不变时，白人获得贷款的概率比其他人种高 8.64%，可以认为在统计
上美国市场歧视非白人。
(5) 代码如下：
logit approve white hrat obrat loanprc unem male married dep sch cosign chist
pubrec mortlat1 mortlat2 vr, r
36
Probit 模型下，hrat; male; dep; sch; cosign; mort lat1; mort lat 2 系数不显著；
Logit 模型下，hrat; male; dep; sch; cosign; mort lat1; mort lat 2 系数不显著；
综上，两个模型的系数显著性一致。
(6) 代码如下：
logit approve white hrat obrat loanprc unem male married dep sch cosign chist
pubrec mortlat1 mortlat2 vr, or nolog r
在给定其他控制变量的情况下，白人与非白人成功申请贷款的几率比为 2.5543。
11.5 Chen(2015) 研究中原王朝被游牧民族征服的概率，以每十年为观测单位建立公元前 221 年至 1911 年的时

间序列。数据集 nomadic_conquest.dta 的被解释变量为 conquered (中原王朝是否被征服)。主要解释变量
包括：d iff (中原王朝早于游牧政权建立的年数)，age (中原王朝的绝对年龄)，wal l (中原是否在长城的
有效保护之下)，以及 drought1 (中国北方在十年中发生旱灾的年数比例的一阶滞后)。另外，时间变量为
decade (十年)。
(1) 作为参照系，把 conquered 对 d iff; age; wal l; drought1 进行 OLS 回归，并使用稳健标准误。
(2) 使用 Logit，重复 (1) 的回归，并使用稳健标准误。评论变量系数的符号、统计显著性与经济意义。
(3) 计算所有变量的平均边际效应，并与线性概率模型的边际效应相比较。
(4) 通过几率比，说明 d iff 与 drought1 对于游牧征服效应的大小。
(5) 计算 Logit 模型正确预测的百分比。
(6) 预测中原王朝被征服的概率，
记为 conquered1。将预测征服概率 .conquered1/ 与实际征服 .conqu
ered / 的时间趋势画在一起进行对比。(提示：使用 Stata 命令“tsline conquered1 conquered”。)
(7) 使用 Probit，重复 (1) 的回归，并使用稳健标准误。
(8) 计算 Probit 模型的平均边际效应，并与 Logit 模型相比较。
(9) 计算 Probit 模型正确预测的百分比，并与 Logit 模型相比较。
解：
(1) 代码如下：
reg conquered diff age wall drought1, r
(2) 代码如下：
logit conquered diff age wall drought1, or nolog r
d iff 的系数为 1:0394 > 0，p 值约为 0，说明系数显著，表明在其他条件不变时，中原王朝早于游牧
政权建立的年数每增加一年，被征服的几率比就平均提高 3.94%；
age 的系数为 0:7684089 > 0，p 值为 0:006 < 0:05，说明系数显著，表明在其他条件不变时，中原王
朝的绝对年龄每增加一年，被征服的几率比就平均降低 23.16%；
37
wal l 的系数为 0:0831943 > 0，p 值为 0:052 > 0:05，说明系数不显著，表明在其他条件不变时，有
长城的中原王朝被征服的几率比平均是没长城的中原王朝的 8.32%；
drought1 的系数为 50:17439 > 0，p 值为 0:004 < 0:05，说明系数显著，表明在其他条件不变时，中
国北方在十年中发生旱灾的年数比例的一阶滞后每增加一个单位，被征服的几率比就增加 4917.44%。
(3) 代码如下：
margins, dydx(*)
Logit 模型与线性概率模型的边际效应类似，无显著变化。
(4) d iff 表明在其他条件不变时，中原王朝早于游牧政权建立的年数每增加一年，被征服的几率比就平

均提高 3.94%；
drought1 表明在其他条件不变时，中国北方在十年中发生旱灾的年数比例的一阶滞后每增加一个单
位，被征服的几率比就增加 4917.44%。
(5) 代码如下：
estat clas
(6) 代码如下：
predict conquered1
tsline conquered1 conquered
(7) 代码如下：
probit conquered diff age wall drought1, nolog r
(8) 代码如下：
margins, dydx(*)
Probit 模型与 Logit 模型的平均边际效应类似，无显著变化。
(9) 代码如下：
estat clas
Probit 模型与 Logit 模型的正确预测百分比类似，无显著变化。
38
第 12 章面板数据
12.1 考虑横截面数据的一元线性回归：
yi D ˛ C ˇxi C "i .i D 1; ; n/ (12.24)
证明 OLS 估计量 ˇO 等价以下离差模型的 OLS 估计量：
yi yN D ˇ.xi x/
N C ."i "N/ .i D 1; ; n/ (12.25)
n
1X
其中，y; N "N 分别为 y; x; " 的样本均值，比如 yN D
N x; yi 。(提示：使用无常数项的 OLS 公式。)
n i D1
证：
将离差模型转化为 Yi D ˇXi C Ui ，其中 Y; X; U 分别代表 y y;
N x x;
N " "N，则为计算其 OLS 估计量，需
P P P O i /2 ，所以
min Q D ei2 D .Yi YOi /2 D .Yi ˇX
P
@Q X Xi Yi
D 2 .Yi O O
ˇXi /Xi D 0 ) ˇ D P 2
@ˇO Xi
P P
X i Y i .xi x/.y
N i y/N
而 ˇO D P 2 D P 2
，这与一元线性回归模型的 OLS 估计量一致，证毕。
Xi .xi x/
N
12.2 证明当 T D 2 时 (两期面板)，差分估计量等价于组内估计量，即 ˇOFD D ˇOFE 。

证：
当 T D 2 时，有
0
yi1 D xi1 ˇ C zi0 ı C ui C "i1
0
yi2 D xi2 ˇ C zi0 ı C ui C "i2
对 FE 估计量：
yi1 yNi D .xi1 xN i /0 ˇ C ."i1 "Ni /
yi 2 yNi D .xi 2 xN i /0 ˇ C ."i 2 "Ni /
)yi 2 yi1 D .xi2 xi1 /0 ˇ C ."i2 "i1 /
对 FD 估计量：
yi 2 yi1 D .xi2 xi1 /0 ˇ C ."i 2 "i1 /
综上，当 T D 2 时，ˇOFD D ˇOFE 。
12.3 数据集 munnell.dta 包含美国 48 个州、1970—1986 年的年度数据。为了估计公共资本对经济增长的贡献，

使用此数据集进行以下回归：
ln yi t D ˇ0 C ˇ1 ln k1;it C ˇ2 ln k2;i t C ˇ3 ln laborit C ˇ4 une mpit C ui C "it (12.26)
39
其中，y 为州产值 (gross state product)，k1 为公共资本 (包括高速公路、街道、供水、下水道及其他公共建
筑)，k2 为私人资本存量 (private capital stock)，labor 为非农劳动力，une mp 为州失业率 (反映影响产出
的经济周期因素)。面板变量为 st at e (州)，而时间变量为 year (年份)。
(1) 进行混合回归，评论 ln k1 的系数符号、显著性与经济意义。
(2) 对随机效应模型进行 FGLS 估计。ln k1 的系数符号与显著性是否有变化？检验是否存在个体效应。
(3) 对随机效应模型进行 MLE 估计。
(4) 对固定效应模型进行组内估计。ln k1 的系数符号与显著性是否有变化？
(5) 对固定效应模型进行 LSDV 估计。检验是否存在个体固定效应。
(6) 进行传统的豪斯曼检验。
(7) 进行稳健的豪斯曼检验。
(8) 在组内估计中，加入时间趋势项。时间趋势项是否显著？
(9) 在组内估计中，加入时间虚拟变量，估计双向固定效应模型。时间效应是否显著？
(10) 计算一阶差分估计量。ln k1 的系数符号与显著性是否有变化？
(11) 计算组间估计量。此估计量是否可信？
解：
(1) 代码如下：
xtset state year
reg lny lnk1 lnk2 lnlabor unemp, vce(cluster state)
ln k1 的系数为 0:155007 > 0，p 值为 0:014 < 0:05，说明系数显著，表明其他条件不变时，公共资本
每增加 1%，州产值将平均增加 0.1550%。
(2) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp, re r theta
p 值约为 0，说明拒绝原假设，认为存在个体效应。
(3) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp, mle nolog
(4) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp, fe r
ln k1 的系数由正变负，p 值为 0:671 > 0:05，系数由显著变为不显著。
(5) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp i.state, vce(cluster state)
40
大部分个体虚拟变量的 p 值接近于 0，拒绝原假设，认为存在个体效应。
(6) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp, fe
estimates store FE
xtreg lny lnk1 lnk2 lnlabor unemp, re
estimates store RE
hausman FE RE, constant sigmamore
(7) 代码如下：
ssc install xtoverid
quietly xtreg lny lnk1 lnk2 lnlabor unemp, re r
xtoverid
(8) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp t, fe r
时间趋势项的 p 值约为 0，说明拒绝原假设，认为时间趋势项显著。
(9) 代码如下：
xtreg lny lnk1 lnk2 lnlabor unemp i.year, fe r
结果中 1974、1975、1976、1979、1980、1981、1982 年的 p 值大于 0.05，认为时间效应不显著，其
他年份的时间效应显著。
xtserial lny lnk1 lnk2 lnlabor unemp, output
ln k1 的系数变回正的，p 值为 0:011 < 0:05，说明系数显著。
xtreg lny lnk1 lnk2 lnlabor unemp, be
(6) 的豪斯曼检验中 p 值大于 0.05，说明接受原假设，认为不存在个体效应，倾向于选择固定效应模
型；(7) 的豪斯曼检验也认为倾向于选择固定效应模型，而组间估计量属于随机效应模型，所以此估
计量不可信。
41
第 13 章平稳时间序列
13.1 根据第 6 章大样本理论，扰动项存在自相关本身，并不会导致 OLS 估计不一致。那么，为什么 ADL 模型
要求其扰动项无自相关？
解：
在 ADL 模型中，除了解释变量的滞后外，还存在被解释变量的滞后，要求扰动项无自相关可以保证在存
在被解释变量的滞后时，OLS 估计的一致性。
不妨假设 ADL(1, 0) 模型：yt D ˇ1 yt 1 C "t ，同时 "t D "t 1 C ut . ¤ 0/，对 yt D ˇ1 yt 1 C "t 两边同时
减去 yt 1 ，可得
yt D .ˇ1 C /yt 1 ˇ1 yt 2 C ut
令 k D Cov.yt ; yt k/ D Cov.yt ; ytCk /，于是有
0 D .ˇ1 C / 1 ˇ1 2 C u2
1 D .ˇ1 C / 0 ˇ1 1
2 D .ˇ1 C / 1 ˇ1 0
1
结合 OLS 法，可知 ˇO1 D .ˇ1 C / ˇ1 ，再求解 0; 1; 2 ，代入 ˇO1 ，于是有
0
ˇ1 C
plimˇO1 D
1 C ˇ1
只有当 D 0 时，plimˇO1 D ˇ1 ，这也说明了 ADL 模型中要求扰动项无自相关的必要性。
13.2 考虑模型 ln yt D ˇ0 C ˇ1 ln yt 1 C 1 ln xt 1 C 2 ln xt 2 C "t ，计算 yt 对 xt 的长期弹性，即长期而言，当

xt 增加 1% 时，yt 将增加百分之几？
解：
令 ln y D E.ln yt / D E.ln yt 1 /，ln x

D E.ln xt 1/ D E.ln xt 2 /，那么对方程两边求期望可得
ln y D ˇ0 C ˇ1 ln y C 1 ln x C 2 ln x
两边同时对 x 求导可得
dy =dx dy =dx 1 1
D ˇ 1 C 1 C 2
y y x x
dy x 1 C 2 1 C 2
于是
D ，即当 xt 增加 1% 时，yt 增加 %。
dx y 1 ˇ1 1 ˇ1
13.3 使用数据集 gdp_china.dta，回答以下问题：
(1) 估计 dlny (GDP 对数差分) 的 AR.1/ 与 AR.2/ 模型，并检验其残差是否存在自相关。
(2) 考虑预测 2013 年的 GDP，如果使用 AR.3/ 模型，其预测能力是否强于 AR.2/？
42
解：
(1) 代码如下：
reg dlny L.dlny
estat bgodfrey
reg dlny L(1/2).dlny
estat bgodfrey
predict ar2dlny1
list ar2dlny1 if year == 2013
dis exp(lny[35] + ar2dlny1[36])
AR.1/：p 值为 0:0129 < 0:05，拒绝原假设，认为存在一阶自相关。
AR.2/：p 值为 0:8853 > 0:05，接受原假设，认为不存在一阶自相关。
(2) 代码如下：
reg dlny L(1/3).dlny
predict ar3dlny1
list ar3dlny1 if year == 2013
dis exp(lny[35] + ar3dlny1[36])
dis y[36]
AR.3/ 的预测值为 95908.312，AR.2/ 的预测值为 95733.271，2013 年的实际值为 95089.211，AR.2/
的预测误差小于 AR.3/，所以 AR.3/ 的预测能力并不强于 AR.2/。
13.4 你能预测股市吗？数据集 szzs.dta 包含 2008 年 11 月 27 日至 2014 年 12 月 11 日的上证指数日收益率 .r/，

定义为“当日收盘指数除以上一交易日收盘指数，再减去 1”。
(1) 画股指收益率 r 的时间趋势图。能看出股指收益率的变化有什么规律吗？
(2) 估计有关 r 的 AR.1/; AR.2/ 及 AR.3/ 模型。从变量的显著性来看，这些自回归模型有助于预测未来

的股指收益率吗？
(3) 根据 AIC 与 BIC 信息准则，确定有关 r 的 AR.p/ 模型的滞后阶数 p。(提示：将 AR.p/ 视为一维 VAR，
使用 Stata 命令 varsoc。)
(1) 代码如下：
tsline r
股指收益率围绕 0 波动，波动范围较大，有一定周期性。
(2) 代码如下：
reg r L.r
reg r L(1/2).r
43
reg r L(1/3).r
三种模型下的变量的 p 值均大于 0.05，说明变量不显著，可以认为自回归模型并没有有助于预测未
来的股指收益率。
(3) 代码如下：
varsoc r, maxlag(10)
根据结果，发现不应该使用 AR 模型，应尝试其他类型的时间序列模型。
13.5 数据集 phillips.dta 包含美国 1948—2003 年的失业率 .une m/、通胀率 .i nf / 以及通胀率差分 .d i nf / 的年

度数据。本题统一使用异方差稳健的标准误。
(1) 为了预测通胀率的变化，估计有关 d i nf 的 AR.p/ 模型。使用序贯 t 规则确定滞后阶数 p。本题统一

使用异方差稳健的标准误。
(2) 根据菲利普斯曲线，通胀率的变化与失业率有关。为此，将失业率 .une m/ 的滞后项加入自回归模型，

估计 ADL.p; q/ 模型。使用序贯 t 规则确定滞后阶数 .p; q/。
(3) 失业率的滞后是否有助于预测通胀率的变化？滞后失业率的系数的经济含义是什么？
(4) 计算失业率每增加一个百分点，对于通胀率变化的短期效应与长期效应。
解：
(1) 代码如下：
reg dinf L(1/6).dinf, r
确定滞后阶数 p D 4。
(2) 代码如下：
reg dinf L(1/4).dinf L(1/6).unem, r
reg dinf L(1/2).dinf L.unem, r
确定 .p; q/ D .2; 1/。
44
(3) 由于失业率的一阶滞后的系数对应的 p 值为 0:06 < 0:1，说明系数显著，认为失业率的滞后有助于预
测通胀率的变化。
失业率的一阶滞后的系数为 0:3755，表明在其他条件不变时，失业率每增加 1%，下一期通胀率的
变化将下降 0.3755%。
(4) 代码如下：
dis -0.3754654/(1 + 0.0202007 + 0.4836144)
失业率每增加一个百分点，短期内下一期通胀率的变化将下降 0.3755%，长期内通胀率的变化将下降
0.2497%。
13.6 Bai and Kung (2011) 使用公元前 219 年至 1839 年的时间序列数据，以每十年为观测单位，考察游牧民族进

攻中原王朝的次数 .y1/ 与中原王朝进攻游牧民族的次数 .y2/ 之间的相互影响。使用数据集 bai_kung.dta，
估计关于 .y1; y2/ 的 VAR 模型。
(1) 使用信息准则，确定此 VAR 模型的滞后阶数。
(2) 估计关于 .y1; y2/ 的 VAR 模型。
(3) 游牧民族对中原王朝的进攻可能由气候冲击所驱动。为此，在此 VAR 模型引入以下外生变量：中国

北方每十年有旱灾年份的比例 .x1/，每十年有黄河决堤的比例 .x2/，中国北方每十年有雪灾年份的
比例 .w1/，中国北方每十年有霜冻灾害年份的比例 .w2/，平均气温 .w3/，中原是否由游牧民族所统
治 .w4; w5; w6/，以及时间趋势项 w7。(提示：使用选择项 exo(varlist)。)
(4) x1 与 x2 对 y1 的作用是否显著？评论其经济含义。
(5) 检验 VAR 模型的各阶系数是否显著。
(6) 检验 VAR 模型的残差是否有自相关。
(7) 检验 VAR 模型是否平稳。
(8) 考察 y1 与 y2 之间的格兰杰因果关系。
(9) 画 VAR 模型的脉冲响应图。
(10) 根据格兰杰因果关系确定变量排序，画 VAR 模型的正交化脉冲响应图。
解：
(1) 代码如下：
varsoc y1 y2, maxlag(10)
此 VAR 模型的滞后阶数为 2 阶。
(2) 代码如下：
var y1 y2, lags(1/2)
45
(3) 代码如下：
var y1 y2, lags(1/2) exog(x1 x2 w1 w2 w3 w4 w5 w6 w7)
(4) x1 与 x2 对 y1 的系数 p 值均小于 0.05，说明系数显著，即作用显著。

x1 对 y1 的系数为 2.577393，表明其他条件不变时，中国北方每十年有旱灾年份的比例每增加 1 个单
位，中原王朝进攻游牧民族的次数就上升 2.5774 个单位；
x2 对 y1 的系数为 3:616682，表明其他条件不变时，每十年有黄河决堤的比例每增加 1 个单位，中
原王朝进攻游牧民族的次数就下降 3.6167 个单位。
(5) 代码如下：
varwle
p 值均小于 0.05，说明各阶系数均显著。
(6) 代码如下：
varlmar
p 值均大于 0.05，说明接受原假设，认为残差没有自相关。
(7) 代码如下：
varstable, graph
所有特征值的模均小于 1，即均在单位圆内部，故此 VAR 系统是稳定的。
(8) 代码如下：
vargranger
H0 W y2 不是 y1 的格兰杰因果关系：p 值为 0:600 > 0:05，说明接受原假设，认为 y2 不是 y1 的格兰
杰因果关系。
H0 W y1 不是 y2 的格兰杰因果关系：p 值为 0:032 < 0:05，说明拒绝原假设，认为 y1 是 y2 的格兰杰
因果关系。
(9) 代码如下：
irf creat y12, set(bai_kung)
irf graph oirf, i(y1) r(y2) yline(0)
13.7 数据集 cpi_month.dta 包含中国居民消费价格同比指数 .cpi / 的月度数据 (1987 年 1 月至 2014 年 10 月)。

检验变量 cpi 是否存在季节效应。
解：
代码如下：
tsset month
tsline cpi
46
gen mon = month(dofm(month))
tab mon, gen(m)
reg cpi m2-m12
predict cpi_r, r
sum cpi
gen cpi_ar = cpi_r + r(mean)
tsline cpi_ar cpi, lpattern(dash)
发现调整前与调整后的曲线基本重合，说明 cpi 不存在季节效应。
47
第 14 章单位根与协整
5
14.1 对于 AR.2/，yt D 3 C yt 1 yt 2 C "t ，写出其特征方程 '.z/，并确定其稳定性。
2
解：
5 1
特征方程 '.z/ D 1 z C z 2 ，令 '.z/ D 0，解得 z1 D ; z2 D 2，因为 jz1 j < 1，则该 AR.2/ 模型不平稳。
2 2
14.2 使用数据集 nelson_plosser.dta，检验变量 lcpi (消费价格指数的对数) 与 lsp500 (SP500 股指的对数) 是否
为单位根过程。
解：
代码如下：
dis 12*(111/100)^(1/4)
dfuller lcpi, lags(11) reg
dfuller lcpi, lags(2) reg
dfuller lsp500, lags(11) reg
dfuller lsp500, lags(1) reg
lcpi ：统计量为 0:259 > 2:889，说明无法拒绝原假设，认为 lcpi 是单位根过程。

lsp500：统计量为 0:298 > 2:892，说明无法拒绝原假设，认为 lsp500 是单位根过程。
14.3 太阳黑子是否包含单位根？使用数据集 sunspot_year.dta 回答此问题。该数据集包含 1700—1988 年间每年

太阳黑子的数目 .sunspot/。
解：
代码如下：
dis 12*(289/100)^(1/4)
dfuller sunspot, lags(14) trend reg
dfuller sunspot, lags(14) reg
dfuller sunspot, lags(8) reg
统计量为 2:384 > 2:879，说明无法拒绝原假设，认为 sunspot 包含单位根。
14.4 使用数据集 nelson_plosser.dta，考察工资对数 .lwg/、GNP 平减指数的对数 .lprgnp/ 与 CPI 对数 .lcpi/

是否存在协整关系 (假设三者均为单位根过程)。
(1) 将 lwg; lprgnp 与 lcpi 的时间趋势画在一起，从图上看是否存在协整关系？
(2) 使用 AIC 信息准则，确定 VAR 模型的滞后阶数。
(3) 检验 .lwg; lprgnp; lcpi / 的协整秩 (假设无时间趋势)，即存在几个协整关系。
(4) 如果存在协整关系，估计 VCEM 模型。
48
(5) 检验 VECM 模型的残差是否存在自相关。如果有自相关，则增加滞后阶数，重新估计 VECM 模型，
直至残差无自相关。
(6) 检验此 VECM 模型是否稳定，并画图。
(7) 评论协整系数的统计显著性及经济意义。
解：
(1) 代码如下：
tsline lwg lprgnp lcpi
三者时间趋势类似，可能存在协整关系。
(2) 代码如下：
varsoc lwg lprgnp lcpi, maxlag(10)
确定 VAR 模型的滞后阶数为 2 阶。
(3) 代码如下：
vecrank lwg lprgnp lcpi, lags(2) max
存在 1 个协整关系。
(4) 代码如下：
vec lwg lprgnp lcpi, lags(2) rank(1)
(5) 代码如下：
veclmar
2 阶 p 值为 0:01 < 0:05，说明拒绝原假设，认为存在自相关。
增加滞后阶数后的代码如下：
vec lwg lprgnp lcpi, lags(3) rank(1)
veclmar
此时 p 值均小于 0.05，说明接受原假设，认为不存在自相关。
(6) 代码如下：
vecstable, graph
除了 VECM 模型本身所假设的单位根之外，其余特征值的模均小于 1，即落在单位圆之内，认为
VECM 模型稳定。
(7) 协整向量为 .1; 8:0809; 7:0982/，函数可写为 l wg D b 3:4444 8:0809lprgnp C 7:0982lcpi，其中，

GNP 平减指数的弹性为 8:0809，CPI 的弹性为 7:0982。
GNP 平减指数的弹性为 8:0809，表明在其他条件不变时，GNP 平减指数每增加 1%，工资就下降
8.0809%；
CPI 的弹性为 7:0982，表明在其他条件不变时，CPI 每增加 1%，工资就上升 7.0982%。
49
第 15 章如何做实证研究
15.1 找一篇你感兴趣的经典论文，下载其数据，并复制 (replicate) 其实证结果。
略.
50

计量经济学及Stata应用 (非高级) 陈强 部分课后答案

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

计量经济学及Stata应用 (非高级) 陈强 部分课后答案

Uploaded by

Copyright:

Available Formats

《计量经济学与 Stata 应用》陈强 (非高级版)

2. 代码运行在 Stata17 上，每个大题下的代码需依次运行 (可自行调整)，单独运行某小题代码可能会出现

Var.X / D EŒ.X /2  D E.X 2 2X C 2 /

D E.X 2 / 2E.X / C 2 D E.X 2 / 22 C 2

D E.X 2 / 2 D E.X 2 / ŒE.X /2

3.2 对于随机变量 X 与 Y ，证明 Cov.X; Y / D E.X Y / E.X /E.Y /。

3.3 对于随机变量 X; Y; Z，证明 Cov.X; Y C Z/ D Cov.X; Y / C Cov.X; Z/。

Cov.X; Y C Z/ D EŒ.X E.X //.Y C Z E.Y C Z//0 

D EŒ.X E.X //.Y C Z E.Y / E.Z//0 

D EŒ.X E.X //.Y E.Y //0 C .X E.X //.Z E.Z//0 

(1) E.AX / D A。(提示：使用期望算子的线性性及矩阵乘法的定义。)

(2) Var.X/ D E.XX 0 / 0 。(提示：使用协方差矩阵定义，期望与转置算子的线性性。)

(3) Var.AX/ D A0 Var.X /A。(提示：使用协方差矩阵定义，以及 (1) 的结论。)

3.5 (不相关，但不满足均值独立的例子) 假设 X 与 Z 都服从标准正态分布，且相互独立，定义 Y D X 2 C Z。

(1) 计算 E.Y jX/。该条件期望是否依赖于 X ？

(2) 计算 E.Y /。条件期望是否等于无条件期望？

(3) 计算 E.X Y /。(提示：奇函数在对称区间的积分为 0。)

(1) E.Y jX/ D E.X 2 C ZjX/ D E.X 2 jX/ C E.ZjX/ D X 2 C 0 D X 2 ，该条件期望依赖于 X 。

(2) E.Y / D E.X 2 C Z/ D E.X 2 / C E.Z/ D ŒE.X /2 C Var.X/ D 1 ¤ X 2 ，条件期望不等于无条件期望。

Cov.X; Y / D Cov.X; X 2 C Z/ D Cov.X; X 2 / C Cov.X; Z/

D E.X 3 / E.X /E.X 2 / C 0

3.6 假设随机变量 Y 服从两点分布，即 P .Y D 1/ D p，而 P .Y D 0/ D 1 p。从 Y 的分布中抽取独立同分

3.7 假设 Yi  N.0;  2 /，且为独立同分布，i D 1; ; n。

(1) 证明 E.Yi2 = 2 / D 1。(提示：使用公式 E.X 2 / D Var.X / C ŒE.X /2 。)

Ci D ˛ C ˇYi C "i (4.41)

其中，Ci 为个体 i 的消费开支，而 Yi 为个体 i 的可支配收入。假设 OLS 回归所得的样本回归线为

(2) 截距项 ˛O 的经济含义是什么？

(1) 个体 i 的可支配收入每增加 1 个单位，个体 i 的消费开支就增加 ˇO 个单位。

(2) 当个体 i 的可支配收入为 0 时，个体 i 的消费开支为 ˛。 O

其中，常数项 ˛ 是唯一的解释变量。推导 ˛ 的 OLS 估计量，并证明此回归的 R2 等于 0。

其中，假设已知 ˛ D 3，推导 ˇ 的 OLS 估计量。

所以 R2 D ŒCorr.yi ; yOi /2 。

4.7 数据集 galton.dta 包含 Galton(1886) 的原始数据。变量 pare nt 为父母的平均身高 (英寸)，而 child 为子

(1) 计算变量 child 与 pare nt 的基本统计特征。

(2) 将变量 child 与 pare nt 的散点图与线性拟合图画在一起。

其中，随机扰动项 "i 代表哪些因素？

(4) 使用 OLS 估计方程 (4.46) 并回答：父母身高每增加 1 英寸，子女身高平均将增加多少？父母身高可

(5) 定义 pare nt _dev 为父母身高减去父母那一辈人群的平均身高，并定义 ge ngap 为子女身高减去父

(4) ˇ D 0:6463，说明父母身高每增加 1 英寸，子女身高平均增加 0.6463 英寸；

4.8 重复本章 4.9 节的蒙特卡罗模拟，但将样本容量从 30 增加到 100。此时，对于截距项与斜率的估计是否更

斜率的估计值为 2.148356，截距项的估计值为 0.5526799，比样本容量为 30 时更接近 2 和 1，更为准确，

e1 D y1 .ˇO1 C ˇO2 x12 C C ˇOK x1K /

en D yn .ˇO1 C ˇO2 xn2 C C ˇOK xnK /

5.2 考虑一元回归模型 yi D ˇ1 C ˇ2 xi C "i 。证明：E."i jxi / D 0 意味着 E.yi jxi / D ˇ1 C ˇ2 xi 。

5.3 考虑只对常数项进行回归，即 yi D ˇ1 C "i 。写出其数据矩阵 X ，并根据公式 ˇO D .X 0 X/ 1 X 0 y 推导 ˇ1 的

(2) 写出数据矩阵 X 的转置。

(3) 计算矩阵 X 0 X，其逆矩阵 .X 0 X / 1

(1) 由题意，rank.X/ D 1 < 2，所以 X 不是满列秩的。

5.5 数据集 airq.dta 包含 1972 年美国加州 30 个大城市的如下变量：ai rq (空气质量指数，越低越好)，vala (公

(1) 把 ai rq 对其他变量进行 OLS 回归。

(3) 检验经济变量 density 与 i ncome 的联合显著性。

(4) 检验环境变量 rai n 与 coast 的联合显著性。

5.7 使用回归模型进行餐馆选址。数据集 Woody3.dta 包含 33 家 Woody’s 连锁餐馆的以下变量：y (毛销售收

(3) 解释此回归结果如何有助于为一家新的 Woody’s 餐馆选址。

(1) yN 是  的无偏估计。yN 2 是否是 2 的无偏估计？

(2) yN 是  的一致估计。yN 2 是否是 2 的一致估计？

D P .ˇn 1 Œfx 2 R W jf .x/ f .ˇ/j > "g/

P .jˇn ˇj > ı/ D P f! 2  W jˇn .!/ ˇj:ıg

D P .ˇn 1 Œfx 2 R W jx ˇj > ıg/

同时 fx 2 R W jx ˇj > ıg  fx 2 R W jf .x/ f .ˇ/j > "g，

6.2 考虑随机序列 fxn g1

Var.xn / D E.xn2 / ŒE.xn /2 D n 1 ) lim Var.xn / D 1

ln w D ˇ1 C ˇ2 s C ˇ3 expr C ˇ4 t e nure C ˇ5 smsa C " (6.43)

计量经济学及Stata应用 (非高级) 陈强部分课后答案

计量经济学及Stata应用 (非高级) 陈强部分课后答案

Var.X / D EŒ.X /2 D E.X 2 2X C 2 /

D E.X 2 / 2E.X / C 2 D E.X 2 / 22 C 2

D E.X 2 / 2 D E.X 2 / ŒE.X /2

Cov.X; Y C Z/ D EŒ.X E.X //.Y C Z E.Y C Z//0

D EŒ.X E.X //.Y C Z E.Y / E.Z//0

D EŒ.X E.X //.Y E.Y //0 C .X E.X //.Z E.Z//0

(1) E.AX / D A。(提示：使用期望算子的线性性及矩阵乘法的定义。)

(2) Var.X/ D E.XX 0 / 0 。(提示：使用协方差矩阵定义，期望与转置算子的线性性。)

(2) E.Y / D E.X 2 C Z/ D E.X 2 / C E.Z/ D ŒE.X /2 C Var.X/ D 1 ¤ X 2 ，条件期望不等于无条件期望。

3.7 假设 Yi N.0; 2 /，且为独立同分布，i D 1; ; n。

(1) 证明 E.Yi2 = 2 / D 1。(提示：使用公式 E.X 2 / D Var.X / C ŒE.X /2 。)

所以 R2 D ŒCorr.yi ; yOi /2 。

(1) yN 是的无偏估计。yN 2 是否是 2 的无偏估计？

(2) yN 是的一致估计。yN 2 是否是 2 的一致估计？

D P .ˇn 1 Œfx 2 R W jf .x/ f .ˇ/j > "g/

P .jˇn ˇj > ı/ D P f! 2 W jˇn .!/ ˇj:ıg

D P .ˇn 1 Œfx 2 R W jx ˇj > ıg/

同时 fx 2 R W jx ˇj > ıg fx 2 R W jf .x/ f .ˇ/j > "g，

Var.xn / D E.xn2 / ŒE.xn /2 D n 1 ) lim Var.xn / D 1

8.2 假设扰动项存在二阶自相关，即 "t D 1 "t 1 C 2 "t 2 C ut ，其中 ut 为白噪声。此时，还可以使用 CO 估

Cov.zt ; "t / D CovŒzt ; ut C ˇ.pt pOt /

D ˇŒCov.zt ; pt / Cov.zt ; pOt / ¤ 0