You are on page 1of 63

《高级计量经济学与 Stata 应用 (第二版)》陈强

部分习题参考答案

【注意】

1. 答案仅供参考,因制作答案较匆忙,可能会出现错别字、公式打错、答案错误等问题。

2. 代码运行在 Stata17 上,每个大题下的代码需依次运行 (可自行调整),单独运行某小题代码可能会出现


问题。

3. 部分编程题目,答案代码可能较为简洁,读者可根据教材代码加以补充。

4. 数据与课件可在教材作者提供的网址http://econometrics-stata.com/col.jsp?id=101上进行下载。

5. 如对本份答案有疑问,可发送邮件至tu01git01@qq.com,我会及时回复的。

目录

第 1 章 绪论 3

第 2 章 概率统计回顾 4

第 3 章 小样本 OLS 6

第 4 章 Stata 简介 10

第 5 章 大样本 OLS 11

第 6 章 最大似然估计法 13

第 7 章 异方差与 GLS 15

第 8 章 自相关 18

第 9 章 模型设定与数据问题 21

第 10 章 工具变量,2SLS 与 GMM 22

第 11 章 二值选择模型 24

1
第 12 章 多值选择模型 27

第 13 章 排序与计数模型 29

第 14 章 受限被解释变量 31

第 15 章 短面板 33

第 16 章 长面板与动态面板 36

第 17 章 面板二值选择模型 38

第 18 章 随机实验与自然实验 40

第 19 章 蒙特卡罗法与自助法 41

第 20 章 平稳时间序列 43

第 21 章 单位根与协整 47

第 22 章 自回归条件异方差模型 50

第 23 章 似不相关回归 51

第 24 章 联立方程模型 53

第 25 章 非线性回归与门限回归 54

第 26 章 分位数回归 55

第 27 章 非参数与半参数估计 56

第 28 章 处理效应 57

第 29 章 空间计量经济学 59

第 30 章 久期分析 60

第 31 章 贝叶斯估计简介 61

第 32 章 如何做规范的实证研究 63

2
第1章 绪论
本章无习题。

3
第2章 概率统计回顾
2.1 假设 X 为 n 维随机列向量,其期望为 E.X / D 。A 为 m  n 常数矩阵。证明:

(1) E.AX / D A。

(2) Var.X/ D E.XX 0 / 0 。

(3) Var.AX/ D A0 Var.X /A。

证:

(1) E.AX / D AE.X / D A。

(2) Var.X/ D EŒ.X E.X //.X E.X //0  D EŒ.X /.X /0  D E.XX 0 X0 X 0 C 0 / D
E.XX 0 / 0 0 C 0 D E.XX 0 / 0 。

(3) Var.AX/ D EŒ.AX E.AX //.AX E.AX //0  D EŒA.X /.X /0 A0  D AEŒ.X /.X /0 A0 D
A0 Var.X/A。

2.2 假设 X; Y; Z 分别为一维随机变量,证明:Cov.X; Y C Z/ D Cov.X; Y / C Cov.X; Z/。


证:

Cov.X; Y C Z/ D EŒ.X E.X //.Y C Z E.Y C Z//0 

D EŒ.X E.X //.Y C Z E.Y / E.Z//0 

D EŒ.X E.X //.Y E.Y //0 C .X E.X //.Z E.Z//0 

D Cov.X; Y / C Cov.X; Z/

2.3 假设连续型随机变量 X; Y 相互独立,证明 Y 均值独立于 X 。(提示:使用随机变量相互独立的定义。)


证:
f .x; y/
因为 X; Y 相互独立,则 f .x; y/ D fX .x/fY .y/,则 f .yjx/ D D fY .y/,所以
fX .x/
ˆ 1 ˆ 1
E.Y jx/ D yf .yjx/ dy D yfY .y/ dy D E.Y /
1 1

所以 Y 均值独立于 X。

2.4 假设 X  t.k/,证明 X 2  F .1; k/。


证: !2
Z Z 2 =1
因为 X  t.k/,不妨设 Z  N.0; 1/; Y  2 .k/,且 Z; Y 相互独立,则 X 2 D p D 。
Y =k Y =k
由于 Z  N.0; 1/,则 Z 2  2 .1/,所以 X 2  F .1; k/。

4
2.5 (选做题) 假设 X 为 n  K 矩阵,n > K,且矩阵 X 满列秩,证明 X 0 X 为正定矩阵。(提示:基于 X 0 X 半
正定,使用反证法进一步证明其为正定。)
证:
先证明 X 0 X 半正定:8y 2 RK ,y 0 X 0 Xy D .Xy/0 Xy  0。
再证明 X 0 X 正定:若 X 满列秩,则 Xy D 0 只有 y D 0 解,即 8y 2 RK ¤ 0,有 y 0 X 0 Xy > 0。

5
第3章 小样本 OLS
3.1 定义投影矩阵 P  X.X 0 X/ 1 X 0 ,消灭矩阵为 M  In P 。证明:PX D X; P e D 0; M X D 0; P 0 D
P; M 0 D M; P 2 D P; M 2 D M 。
证:
PX D X.X 0 X/ 1 X 0 X D X 。
P e D X.X 0 X / 1 X 0 .y Xb/ D X.X 0 X / 1 X 0 y X.X 0 X / 1 X 0 Xb D Xb Xb D 0。
MX D X PX D X X D 0。
P 0 D ŒX.X 0 X/ 1 X 0 0 D XŒ.X 0 X/ 1 0 X 0 D XŒ.X 0 X /0  1 X 0 D X.X 0 X / 1 X 0 D P 。
M 0 D In0 P D In P D M。
P D X.X X/ X X.X 0 X/ 1 X 0 D X.X 0 X / 1 X 0 D P 。
2 0 1 0

M 2 D .In P /2 D In 2P C P 2 D In 2P C P D In P D M。

3.2 假定一元回归方程为 yi D ˇ1 C ˇ2 xi2 C "i .i D 1; 2;    ; n/。写出其正规方程组,并解出最小二乘估计值


b1 ; b 2 。
解:
P P P
需 min .yi yOi /2 ,令 Q D .yi yOi /2 D .yi b1 b2 xi 2 /2 ,于是

@Q X @Q X
D 2.yi b1 b2 xi2 /; D 2xi2 .yi b1 b2 xi 2 /
@b1 @b2
8 8
ˆ P P ˆ
ˆ
< yi D nb1 C b2 xi2 ; <b1 D yN b2 xN 2 ;
则正规方程组为 ,
解得最小二乘估计值为 P P P
:̂P xi2 yi D b1 P xi2 C b2 P x 2 ˆb D n P xi2 yi
P
xi2 yi
:̂ 2
i2 n xi22 . xi2 /2

3.3 使用最小二乘法估计含截距项的回归方程 yi D ˇ1 C ˇ2 xi 2 C    C ˇK xiK C "i .i D 1; 2;    ; n/。证明:


n
X n
X
(1) 残差和 ei D 0; xik ei D 0.k D 2;    ; K/;(提示:使用正规方程组。)
iD1 i D1
NO
(2) 被解释变量的均值等于其预测值的均值,即 yN D y;
n
X
(3) 平方和分解公式,即被解释变量的变动 (离差平方和) 等于预测值的变动加上残差平方和, .yi
i D1
n
X n
X n
X n
X
N 2D
y/ .yOi NO 2 C
y/ ei2 。[提示: .yi N 2D
y/ .yi yOi C yOi N 2 ,并使用上面的结果。]
y/
iD1 iD1 iD1 iD1
解释为什么在没有常数项的情况下,平方和分解公式不再成立?

证:

6
P P P
(1) 需 min .yi yOi /2 ,令 Q D .yi yOi /2 D .yi b1 b2 xi 2    bK xiK /2 ,于是
8 X X
ˆ @Q
ˆ
ˆ D 2.yi b1 b2 xi 2    bK xiK / D 2 ei D 0;
ˆ
ˆ @b1
ˆ
ˆ X X
ˆ @Q
ˆ
< D 2xi2 .yi b1 b2 xi 2    bK xiK / D 2 xi2 ei D 0;
@b2
ˆ
ˆ
ˆ
ˆ 
ˆ
ˆ
ˆ @Q
ˆ X X
:̂ D 2xiK .yi b1 b2 xi 2    bK xiK / D 2 xiK ei D 0:
@bK
n
X n
X
所以 ei D 0; xik ei D 0.k D 2;    ; K/。
iD1 i D1
P P 1X X
NO D 0,即 yN D y。
NO
(2) 由 (1),有 0 D ei D .yi yOi /,则 .yi yOi / D .yN y/
n
(3)
X X
.yi N 2D
y/ .yi yOi C yOi N 2
y/
X X X
D .yi yOi /2 C .yOi y/N 2C2 .yi yOi /.yOi y/
N
X X X
D .yOi NO 2 C
y/ ei2 C 2 ei .yOi y/
N
X X X n Xn n
X
而 ei .yOi y/
N D
ei .b1 C b2 xi 2 C    C bK xiK y/N D 0,所以 .yi y/ N 2D .yOi NO 2 C
y/ ei2 。
X i D1 iD1 iD1
P
若没有常数项, ei ¤ 0,则 ei .yOi y/ N ¤ 0,所以平方和分解公式不再成立。
 n 2
P N
.yi y/.
N yOi y/ O
2 2 iD1
3.4 证明在有常数项的情况下,R D ŒCorr.yi ; yOi /   n   n 。
P P NO 2
.yi y/ N 2  .yOi y/
i D1 i D1
证:
Cov.yi ; yOi /
Corr.yi ; yOi / D p p
Var.yi / Var.yOi /
P NO
.yi y/.N yOi y/
D qP P
.yi y/ N 2 .yOi y/ NO 2
P
.yi yOi C yOi y/. N yOi y/ N
D qP P
.yi y/ N 2 .yOi y/ NO 2
P P
.yi yOi /.yOi y/ N C .yOi y/ N 2
D qP P
.yi y/ N 2 .yOi y/ NO 2
P
0 C .yOi y/ N 2
D qP P
.yi y/ N 2 .yOi y/ NO 2
sP
.yOi y/N 2
D P
.yi y/ N 2
p
D R2

7
 2
P
n
NO
.yi y/.
N yOi y/
2 2 iD1
所以 R D ŒCorr.yi ; yOi /     n 。
P
n P NO 2
.yi N 2 
y/ .yOi y/
i D1 i D1

2 y 0 X.X 0 X/ 1 X 0 y
3.5 证明 Ruc D 。
y0y
证:
2 yO 0 yO .P y/0 .P y/ y 0 X.X 0 X / 1 X 0 y
Ruc D 0
D 0
D
yy yy y0y

3.6 假设 n 阶对称矩阵 A 半正定。证明:A 的任何主对角线元素均为非负。这个结论有助于理解高斯-马尔可


O
夫定理,即 Var.ˇjX/ Var.bjX / 为半正定矩阵。
证:
因为 A D .aij /nn 半正定,则 8x 2 Rn ¤ 0,有 x 0 Ax  0,取 x D ei0 D .0;    ; 1;    ; 0/,则 x 0 Ax D ai i  0,
即 A 的任何主对角线元素均为非负。

3.7 在假定 3.1-3.4 之下,是否存在 ˇ 的一个线性估计量 (不一定是无偏估计),其方差小于 OLS 估计量 b 的方


差?如果存在,此方差最小能取什么值?
解:
存在,考虑估计量 b D .X 0 X C In / 1 X 0 y (事实上这是岭估计中使用的估计量),很明显这是个有偏估计
量。
因为 b D .X 0 X C In / 1 X 0 y D .X 0 X C In / 1 X 0 X.X 0 X/ 1 X 0 y D .X 0 X C In / 1 X 0 Xb,则其方差为:

Var.b / D .X 0 X C In / 1 X 0 XŒVar.b/Œ.X 0 X C In / 1 X 0 X0

D .X 0 X C In / 1 X 0 XŒ 2 .X 0 X/ 1 X 0 X.X 0 X C In / 1

D  2 .X 0 X C In / 1 X 0 X.X 0 X C In / 1

为比较 Var.b /; Var.b/,令 W D X 0 X.X 0 X C In / 1 ,则 Var.b / D  2 W 0 .X 0 X / 1 W ,于是

Var.b/ Var.b / D  2 .X 0 X/ 1
 2 W 0 .X 0 X/ 1 W D  2 .X 0 X C In / 1 Œ2In C 2 .X 0 X/ 1 .X 0 X C In / 1

若  > 0,因为 .X 0 X CIn / 1 ; 2In C2 .X 0 X/ 1


正定,则 .X 0 X CIn / 1 Œ2In C2 .X 0 X / 1 .X 0 X CIn / 1

正定,即 Var.b/ Var.b / 正定,Var.b/ > Var.b /。


2 4
3.8 证明:Var.s 2 jX / D 。[提示:如果随机变量服从 2 .m/ 分布,则其期望为 m,而方差为 2m。]
n K
证:
1 X P RS S
因为 s 2 D ei2 ,则 RSS D ei2 D .n K/s 2 ,而  2 .n K/,则
n K 2
 
.n K/s 2 .n K/2 Var.s 2 / 2 2 4
2.n K/ D Var 2
D ) Var.s jX / D
 4 n K

8
3.9 (单边 t 检验) 对于原假设 H0 W ˇk D ˇNk ,替代假设 H1 W ˇk > ˇNk ,写出其检验步骤。
解:
ˇk ˇNk
第一步:计算 tk D p ;
Var.ˇk /
第二步:计算显著性水平 ˛ 对应的 t˛ 值,P .t .n K/ > t˛ .n K// D ˛;
第三步:若 tk > t˛ ,则拒绝原假设,认为 ˇk > ˇNk ;若 tk  t˛ ,则没有充分理由拒绝原假设,认为 ˇk D ˇNk 。

9
第4章 Stata 简介
中国的 GDP(以购买力平价计) 何时能超过美国?从 Penn World Table(权威的跨国宏观数据集) 下载中美
两国 1978-2010 年有关人口与人均 GDP 的数据,导入 Stata 中,将两国 log.GDP/ 的时间趋势画在一张图上,
并进行简单外推预测 (假设未来的增长率与 1978-2010 年间相同)。下载地址为 (或搜索“Penn World Table”):
http://pwt.econ.upenn.edu/php_site/pwl_index.php。下载时选 csv 格式,根据网站说明存储数据。
略.

10
第5章 大样本 OLS
5.1 确定性序列 fxn g1
nD1 可以被看成是退化的随机序列。证明:如果 lim xn D a,则 plim xn D a。
n!1 n!1
证:
因为 lim xn D a,则 8" > 0,有
n!1
" #
1 [
\ 1  
P jxn aj  " D P lim jxn aj  " D 0
n!1
kD1 nDk

从而 " # " #
1 [
\ 1 1
[
0DP jxn aj  " D lim P jxn aj  "
k!1
kD1 nDk nDk


1
\
fjxk aj  "g  fjxn aj  "g
nDk

所以 !
1
\
P .jxk aj  "/  P fjxn aj  "g
nDk

令 k ! 1,得 lim P .jxk aj  "/ D 0,即 plim xn D a。


k!1 n!1

p d p
5.2 假设 n.ˇOn ˇ/ ! N.0;  2 /,证明 ˇOn ! ˇ。
证:
1 p O 1 1 p
因为 ˇOnˇDp n.ˇn ˇ/,而 p ! 0,根据第 5.1 题,有 p ! 0,
n n n
p O d p p
又有 n.ˇn ˇ/ ! N.0;  2 /,则 ˇOn ˇ ! 0,即 ˇOn ! ˇ。

5.3 假设 ˇO 是 ˇ 的一致估计量。定义 d  log.ˇ/,证明 O  log.ˇ/


O 是 ˇ 的一致估计量。

证:
p p
不失一般性,我们可直接证明:若 f 是连续函数,且 ˇn ! ˇ,则 f .ˇn / ! f .ˇ/。
因为 f 是连续函数,则 8" > 0,有 9ı > 0,使得当 jx ˇj  ı 时,jf .x/ f .ˇ/j  ",这也等价于当
jx ˇj > ı 时,jf .x/ f .ˇ/j > "。

P .jf .ˇn / f .ˇ/j > "/ D P f! 2  W jf .ˇn .!// f .ˇ/j > "g

D P .ˇn 1 Œfx 2 R W jf .x/ f .ˇ/j > "g/

P .jˇn ˇj > ı/ D P f! 2  W jˇn .!/ ˇj:ıg

D P .ˇn 1 Œfx 2 R W jx ˇj > ıg/

11
同时 fx 2 R W jx ˇj > ıg  fx 2 R W jf .x/ f .ˇ/j > "g,所以 P .jf .ˇn / f .ˇ/j > "/  P .jx ˇj > ı/。
p p
而因为 ˇn ! ˇ,则 lim P .jˇn ˇj > ı/ D 0,所以 lim P .jf .ˇn / f .ˇ/j > "/,则 f .ˇn / ! f .ˇ/,取
n!1 n!1
f .x/ D log.x/,该命题得证。

5.4 鞅差分过程一定是白噪声吗?为什么?
解:
不一定,考虑以下例子:设 gi D "i  "i 1 ,其中 f"i g 是独立白噪声序列,显然 fgi g 不是独立同分布的白噪
声序列,但有

E.gi jgi 1;    ; g2 / D EŒE."i  "i 1 j"i 1 ;    ; "2 /jgi 1;    ; g2 

D EŒ"i 1 E."i j"i 1 ;    ; "2 /jgi 1;    ; g2 

D0

这说明 fgi g 是鞅差分过程。

5.5 假设 fxi g 是确定性序列,其取值随 i 而变化。f"i g 是独立同分布的随机序列,期望为 0,方差存在。回答


以下问题,并解释原因。

(1) 序列 fxi "i g 是独立同分布的吗?

(2) 序列 fxi "i g 存在自相关吗?

(3) 序列 fxi "i g 是鞅差分序列吗?

(4) 序列 fxi "i g 是严格平稳序列吗?

解:

(1) 因为 fxi g 是确定性序列且 f"i g 独立同分布,所以 fxi "i g 独立,但方差会随着 i 的变化而变化,则不


是独立同分布的。

(2) 由 (1),不存在自相关。

(3) 由 (1),是鞅差分序列。

(4) 由 (1),不是严格平稳序列,因为方差 (二阶矩) 与 i 相关。


p
5.6 当 n ! 1 时,是否 SE .bk / ! 0?为什么?
解: r r
 1 b p
b 1 b p
是,因为 SE .bk / D AVar.b/,而 AVar.b/ ! ŒE.xi0 xi / 1 S ŒE.xi0 xi / 1 ,则 SE .bk / D AVar.b/ !
r n n
1 p
ŒE.xi0 xi / 1 SŒE.xi0 xi / 1 ,显然当 n ! 1 时,SE .bk / ! 0。
n

12
第6章 最大似然估计法
k e 
6.1 假设离散型随机变量 y 服从泊松分布,其概率分布率为 P .y D k/ D ; k D 0; 1; 2; 。对于随机样本

fy1 ; y2 ;    ; yn g,求  的 MLE 估计量。
解:
n
Y yi e 
最大似然函数为 L./ D ,取对数,记为 l./,则
iD1
yi Š
n
X   n
X
yi e 
l./ D ln L./ D ln D  C yi ln  ln.yi Š/
iD1
yi Š iD1

于是 P P
@l./ yi yi
D nC D0)D
@  n
P
yi
所以 O MLE D 。
n
6.2 假设随机变量 y 服从在 Œ0;   区间的均匀分布。对于随机样本 fy1 ; y2 ;    ; yn g,求  的 MLE 估计量。
解: 8
< 1 ; x 2 Œ0; 
ˆ
随机变量 y 的概率密度函数为 f .y/ D  ,则最大似然函数为 L./ D  n
,显然 L./ 关于
:̂0; x … Œ0; 

 单调递减,则 OMLE D y.n/ D maxfy1 ; y2 ;    ; yn g。

6.3 假设样本 fy1 ; y2 ;    ; yn g 为独立同分布的,且 yi  N.; 1/。分别用 Wald 检验、LR 检验、LM 检验来检
验原假设 H0 W  D 0 。证明这三个检验量相等。
证:
Wald 检验:
2 1
根据概率统计的知识,我们知道正态分布均值的 MLE 为 U D y,则
N Var.U / D Var.y/
N D D ,其
n n
检验量为
W D n.yN 0 /2

LR 检验: " #
 n n
1 1X 2 n
根据概率统计的知识,我们知道 L./ D p exp .yi / ,则 ln L./ D ln.2/
2 2 i D1 2
n
1X
.yi /2 ,其检验量为
2 iD1
" n n
#
1X 1X
LR D 2 .yi N 2C
y/ .yi 0 /2 D n.yN 0 /2
2 i D1 2 i D1

LM 检验:
n n
n 1X @ ln L./ X
根据概率统计的知识,
我们知道 ln L./ D ln.2/ .yi /2 ,
则 D .yi / D n.yN /,
2 2 iD1 @ i D1

13
 
@2 ln L./
而 I./ D E D E. n/ D n,则检验量为
@2
 
1
LM D n2 .yN 0 /2  D n.yN 0 /2
n

综上,这三个检验量相等。

14
第7章 异方差与 GLS
7.1 在条件异方差情况下,普通的非稳健标准误是真实标准误的一致估计吗?请具体说明为什么。
解:
2
否,因为在 Avar.b/ D ŒE.xi xi0 / 1 E."2i xi xi0 /ŒE.xi xi0 / 1
中,E."2i xi xi0 / ¤ E."2i /E.xi xi0 /。

7.2 假设 Var."jX/ D  2 V ¤  2 In ,其中 V 为对称正定矩阵且已知。

(1) 计算 Var.bjX /,其中 b 为 OLS 估计量。

(2) 计算 Var.ˇOGLS jX /,其中 ˇOGLS 为 GLS 估计量。

(3) 矩阵 Var.bjX / 与 Var.ˇOGLS jX/ 有何关系?

解:

(1) 因为 b D .X 0 X / 1 X 0 y D .X 0 X / 1 X 0 .Xb C "/,所以 E.b/ D EŒ.X 0 X/ 1 X 0 Xb C .X 0 X/ 1 X 0 " D


b C .X 0 X/ 1 X 0 ",于是

Var.bjX/ D EŒ.b E.b//.b E.b//0 jX

D EŒ.X 0 X/ 1 X 0 ""0 X.X 0 X / 1 jX 

D .X 0 X / 1 X 0 E.""0 jX /X.X 0 X/ 1

D  2 .X 0 X / 1 X 0 V X.X 0 X/ 1

(2) 因为 ˇOGLS D .X 0 V 1
X/ 1 X 0 V 1
y D .X 0 V 1
X / 1X 0V 1
.Xb C "/,则

E.ˇOGLS / D EŒ.X 0 V 1
X / 1X 0V 1
Xb C .X 0 V 1
X/ 1 X 0 V 1
" D b C .X 0 V 1
X / 1X 0V 1
"

于是

Var.ˇOGLS jX/ D EŒ.ˇOGLS E.ˇOGLS //.ˇOGLS E.ˇOGLS //0 jX

D E..X 0 V 1
X/ 1 X 0 V 1
""0 V 0 1 X.X 0 V 0 1 X/ 1 jX /

D .X 0 V 1
X / 1X 0V 1
E.""0 jX/V 0 1 X.X 0 V 0 1 X / 1

D  2 .X 0 V 1
X/ 1 X 0 V 1
V V 0 1 X.X 0 V 0 1 X/ 1

D  2 .X 0 V 1
X/ 1

(3) 若 X 为方阵,则 Var.bjX / D Var.ˇOGLS jX/。若 X 不为方阵,根据 GLS 为 BLUE,则 Var.bjX/ 


Var.ˇOGLS jX/。

7.3 数据集 hprice2a.dta 包含了美国波士顿 506 个社区的房屋中位数价格的横截面数据。考虑如下的“特征价


格回归”(Hedonic Price Regression,即认为房价由房屋性能所决定):

lpricei D ˇ1 C ˇ2 lnoxi C ˇ3 ldisti C ˇ4 roomsi C ˇ5 stratioi C "i

15
其中,lprice 为房价的对数,lnox 为空气污染程度的对数,ldist 为社区到就业中心的距离,rooms 为房屋
的平均房间数,stratio 为社区学校的学生-教师比例,下标 i 表示“第 i 个社区”。

(1) 使用普通标准误进行回归,并分别检验“H0 W ˇ2 D ˇ5 ”与“H0 W ˇ4 D 0:33”。

(2) 使用稳健标准误进行回归,并分别检验“H0 W ˇ2 D ˇ5 ”与“H0 W ˇ4 D 0:33”。

(3) 以 5% 的置信度,使用怀特检验,检验是否存在异方差。

(4) 以 5% 的置信度,使用 BP 检验,检验是否存在异方差 (假设扰动项为独立同分布,分别以拟合值 yO


以及所有解释变量进行检验)。

(5) 假设条件异方差仅依赖于拟合值 y(不含常数项),进行


O FWLS 估计。

解:

(1) 代码如下:
reg lprice lnox ldist rooms stratio
test lnox = stratio
test rooms = 0.33

(2) 代码如下:
reg lprice lnox ldist rooms stratio, robust
test lnox = stratio
test rooms = 0.33

(3) 代码如下:
estat imtest, white
p 值为 0,则拒绝原假设,认为存在异方差。

(4) 代码如下:
estat hettest, iid
estat hettest, rhs iid
p 值均为 0,则拒绝原假设,认为存在异方差。

(5) 代码如下:
quietly reg lprice lnox ldist rooms stratio
predict y_hat, xb
predict e1, res
g e2 = e1^2
g lne2 = log(e2)
reg lne2 y_hat, noc
predict lne2f

16
g e2f = exp(lne2f)
reg lprice lnox ldist rooms stratio [aw = 1/e2f]

17
第8章 自相关
8.1 证明当 n ! 1 时,Box-Pierce Q 与 Ljung-Box Q 统计量之差依概率收敛于 0。
p p p 0
Œ 提示:定义 xn  . nO1 /2 ; . nO2 /2 ;    ; . nOp /2 ,并把两个统计量之差写成 an0 xn 的形式。
证:  0
p p p 0 nC2 nC2 nC2
令 xn  . nO1 /2 ; . nO2 /2 ;    ; . nOp /2 ,e D .1; 1;    ; 1/01p ,bn D ; ; ; ,
n 1 n 2 n p
0
则有 QBP D e xn ; QLB D bn0 xn ,则
QBP QLB D .e bn /0 xn

而  
nC2 nC2 nC2 n!1
e bn D 1 ;1 ; ;1 ! .0; 0;    ; 0/01p
n 1 n 2 n p
于是 lim QBP QLB D 0,所以 Box-Pierce Q 与 Ljung-Box Q 统计量之差依概率收敛于 0。
n!1

8.2 考虑在只有一阶自相关的情况下使用 GLS,对于变换后的新扰动项


p 0
"Q  1 2 "1 ; ."2 "1 /;    ; ."n "n 1 / ,直接证明 "Q 满足同方差的假定。
证: 0p 1
1 2 0    0 0
B C
B C
B  1    0 0C
p 1 B C
B C
因为 "Q D 1 2 C ",其中 C D p B 0     0 0C ,
1  B 2
B :: :: ::
C
:: C
B : : : :C
@ A
0 0   1
p
2 1 0
且 Var."jX/ D  V; V D C C ,则 E."Q/ D 1  CE."/ D 0,于是
2

Var.Q"jX / D E.Q""Q0 jX/

D EŒ.1 2 /C ""0 C 0 jX

D .1 2 /CE.""0 jX/C 0

D  2 .1 2 /C V C 0

D  2 .1 2 /C C 1
C 0 1C 0

D  2 .1 2 /In

所以 "Q 满足同方差的假定。

8.3 PW 估计法比 CO 估计法更有效率吗?为什么?


解:
从理论上,CO 法的差分过程使得样本容量由 n 下降为 n 1;而 PW 法在 CO 法的基础上补充了一个方
程,使样本容量回到原来的 n,因此更有效率,是 BLUE。
但是,尽管 PW 估计法在理论上确实比 CO 估计法更有效率,而根据文献 [1] 和文献 [2],PW 估计法的拒

18
绝率较高,且高于 CO 估计法,因此,在实践中,不能单纯地认为 PW 估计法比 CO 估计法更有效率,也
要具体情况具体分析。
Œ1 Dielman T E . Email: A Note on Hypothesis Tests after Correction for Autocorrelation: Solace for the Cochrane-
Orcutt Method?[J]. Journal of Modern Applied Statal Methods, 2009, 8(1):100-109.
Œ2 Kobayashi M . Comparison of Efficiencies of Several Estimators for Linear Regressions With Autocorrelated
Errors[J]. Journal of the American Statistical Association, 1985, 80(392):951-953.

8.4 假设扰动项存在二阶自相关,即 "t D 1 "t 1 C  2 "t 2 C ut ,其中 ut 为白噪声。此时,还可以使用 CO 估


计法吗?若可以,如何进行?
解:
不可以,CO 估计法仅适用于 AR.1/,即序列只存在一阶自相关的情况下。

8.5 使用数据集 ukrates.dta,考察英国政府如何根据长期利率 .r20/ 的变换来调整短期利率 .rs/,即货币政策


反应函数。

(1) 作如下回归:
rst D ˛ C ˇr20t 1 C "t

其中,rst D rst rst 1 ,r20t D r20t r20t 1。

(2) 画残差散点图 .et 1 ; et /;

(3) 画残差的自相关图与偏自相关图,以显示其各阶自相关与偏自相关系数;

(4) 用 BG 检验,检验扰动项是否存在自相关;

(5) 用 Q 检验,检验扰动项是否存在自相关;

(6) 计算 DW 统计量;

(7) 使用异方差与自相关稳健的标准误 (HAC) 重新进行估计,将滞后期数设为 n1=4 ;

(8) 使用迭代式 PW 估计法进行 FGLS 估计;

(9) 使用迭代式 CO 估计法进行 FGLS 估计。

解:

(1) 代码如下:
gen drs = D.rs
gen dr20 = D.r20
reg drs dr20

(2) 代码如下:
predict e1, res
scatter e1 L.e1

19
(3) 代码如下:
ac e1
pac e1

(4) 代码如下:
estat bgodfrey
p 值为 0,拒绝原假设,认为存在自相关。

(5) 代码如下:
wntestq e1
p 值为 0,拒绝原假设,认为存在自相关。

(6) 代码如下:
estat dwatson

(7) n1=4 D 4:789,取 5,代码如下:


newey drs dr20, lag(5)

(8) 代码如下:
prais drs dr20

(9) 代码如下:
prais drs dr20, corc

20
第9章 模型设定与数据问题
9.1 使用数据集 hprice2a.dta,对习题 7.3 中的回归方程,进行如下操作。

(1) 进行 RESET 检验 (分别使用拟合值 rO 与 rhs 解释变量);

(2) 计算信息准则 AIC 与 BIC;

(3) 计算所有解释变量的方差膨胀因子 (VIF)。存在严重多重共线性吗?

(4) 计算观测数据的 lev 的最大值与平均值。最大值是平均值的几倍?列出影响力最大的前 3 个数据。

解:

(1) 代码如下:
reg lprice lnox ldist rooms stratio
estat ovtest
estat ovtest, rhs

(2) 代码如下:
estat ic

(3) 代码如下:
estat vif

(4) 代码如下:
predict lev, leverage
gsort -lev
sum lev
dis r(max)/r(mean)
list lev in 1/3

9.2 使用数据集 ukrates.dta,检验英国的货币政策反应函数是否在 1973 年 10 月石油危机后发生结构变动。提


示:定义虚拟变量“g d = (month > tm(1973m10))”,其中“tm”表示月度数据格式。
解:
代码如下:
gen d = (month > tm(1973m10))
gen r20d = r20 * d
reg rs r20 d r20d
test d r20d

p 值为 0,认为拒绝原假设,认为结构发生了变动。

21
第 10 章 工具变量,2SLS 与 GMM
10.1 如果“工具变量”不满足外生性,则 ˇOIV 还是 ˇ 的一致估计量吗?为什么?
解:
不是。因为

ˇOIV D .Z 0 X/ 1 Z 0 y

D .Z 0 X/ 1 Z 0 .Xˇ C "/

D ˇ C .Z 0 X / 1 Z 0 "
Cov.Z; "/
DˇC
Cov.Z; X /
因为“工具变量”不满足外生性,即 Cov.Z; "/ ¤ 0,则
Cov.Z; "/
plim ˇOIV D plim ˇ C ¤ˇ
Cov.Z; X /
所以 ˇOIV 不是 ˇ 的一致估计量。

10.2 考虑以下简单宏观经济模型中的消费函数
8
ˆ
<Ct D ˛0 C ˛1 Yt C "t

:̂Yt D Ct C It C Gt C Xt

其中,Yt ; Ct ; It ; Gt ; Xt 分别为国民收入、总消费、总投资、政府净支出与净出口。证明:如果单独对第一
个消费方程进行 OLS 估计,将得到不一致的估计。
证:
令 ˛ D .˛0 ; ˛1 /0 ,Y D .1n1 ; .Y1 ; Y2 ;    ; Yn /0 /,C D .C1 ; C2 ;    ; Cn /0 ," D ."1 ;    ; "n /0 。若仅对第一个方
程进行 OLS 估计,则可得 ˛O D .Y 0 Y / 1 Y 0 C ,则

˛O D .Y 0 Y / 1 Y 0 C

D .Y 0 Y / 1 Y 0 .Y ˛ C "/

D ˛ C .Y 0 Y / 1 Y 0 "
Cov.Y; "/
D˛C
Var.Y /

Cov.Yt ; "t / D Cov.Ct C It C Gt C Xt ; "t / ¤ 0

所以
Cov.Y; "/
plim ˛O D plim ˛ C ¤˛
Var.Y /
即这是个不一致的估计。

22
10.3 在上题中,假设消费函数没有常数项,即 Ct D ˛1 Yt C "t (费里德曼的消费函数)。证明:

(1) 可以用常数项作为工具变量 (放宽对工具变量相关性的要求为“不与解释变量正交”);


n n
1X 1X
(2) 工具变量估计量为 ˛O 1;IV D CN =YN ,其中 CN  Ct ; YN  Yt (提示:对消费方程两边同时取期
n t D1 n t D1
望)。

证:

(1) 因为若以常数项作为工具变量,则 Z D X ,并且此时的 Z 满足相关性与外生性,


则 ˛O IV D .Z 0 X/ 1 Z 0 y D .X 0 X/ 1 X 0 y,这就是 OLS 估计量。
X  1 X CN
(2) 根据 (1),则 ˛O 1;IV D Yt Ct D 。
YN
10.4 (对效率 GMM 的 GLS 解释) 考虑回归模型 yn1 D XnK ˇK1 C "n1 ,而 ZnL 为由工具变量构成的矩阵
(每列都是一个工具变量),L  K。将原模型两边同时左乘 Z 0 可得,Z 0 y D Z 0 Xˇ C Z 0 "。记 S  Var.Z 0 "/,
而 SO 为 S 的一致估计,对此转换后的模型使用 FGLS 估计,并证明它是最优 GMM 估计量。
解:
由于 ˇOFGLS D .X 0 VO 1
X/ 1 X 0 VO 1
y,则代入本题数据,则

ˇOFGLS D Œ.Z 0 X/0 SO 1


Z 0 X 1 .Z 0 X/0 SO 1
Z 0 y D .X 0 Z SO 1
Z 0 X / 1 X 0 Z SO 1
Z0y

1X 1 1
而因为 SZX D zi xi0 D Z 0 X; SZy D Z 0 y,则最优 GMM 估计量为
n n n
  1
1 0 O1 0 1 0 O1 0
ˇOGMM .SO / D X ZS Z X X ZS Z y
n n n n
D .X 0 Z SO 1
Z 0 X / 1 X 0 Z SO 1
Z0y

D ˇOFGLS

即 FGLS 估计量是最优 GMM 估计量。

10.5 参照本章的 Stata 实例,使用数据集 grilic.dta 中 1980 年的变量重新进行 OLS,2SLS,GMM 估计以及相


应的检验,比如“reg lw80 s80 iq expr80 tenure80 rns80 smsa80, r”。
解:
代码与书本 10.10 节基本一致,只需在书写变量名时,在变量名后加 80 即可。

23
第 11 章 二值选择模型
11.1 对于二值变量 yi ,考虑线性概率模型 yi D ˇ0 C ˇ1 xi C "i ,其中 P .yi D 1jxi / D ˇ0 C ˇ1 xi 。

(1) 证明 E."i jxi / D 0。

(2) 求 Var."i jxi / 的表达式。

(3) 扰动项 "i 是否存在异方差?为什么?

解:

(1) 根据期望公式有 E.yi jxi / D P .yi D 1jxi / D ˇ0 C ˇ1 xi ,同时根据模型有 E.yi jxi / D E.ˇ0 C ˇ1 xi C
"i jxi / D ˇ0 C ˇ1 xi C E."i jxi /,于是 E."i jxi / D 0。

(2) 因为 Var.yi jxi / D P .yi D 1jxi /Œ1 P .yi D 1jxi /,则 Var."i jxi / D P .yi D 1jxi /Œ1 P .yi D 1jxi /。

(3) 由 (2),很明显 Var."i jxi / 的值会随着观测值的变化而变化,因此 "i 存在异方差。

11.2 假定第 i 个家庭选择消费水平 ci 与捐赠水平 qi ,来求解以下预算约束条件下的效用最大化问题:

max Ui D ci C ai ln.1 C qi /
ci ;qi

s:t: ci C pi qi  mi ; ci ; qi  0

其中,mi 为收入,pi 为捐赠的“价格”且 pi < 1(因为捐赠可以抵税),ai 表示捐赠的边际效用。将 mi


与 pi 均视为外生变量。可以证明,如果 8 ai  pi ,则最优捐赠 qi D 0;反之,如果 ai > pi ,则最优捐赠
ˆ
<1; 若qi > 0
qi D .ai =pi / 1。定义二值变量 yi D ,假设家庭的捐赠偏好 ai 取决于 ai D exp.xi0 ˇ C "i /,
:̂0; 若qi D 0
其中 xi 为可观测的家庭特征,而 "i 为不可观测的扰动项。假定 "i 独立于 .xi ; mi ; pi /,且 "i  N.0;  2 /。
求 P .yi D 1jxi ; mi ; pi / 的表达式。这是一个 Probit 模型吗?
解:
因为 "i  N.0;  2 /,所以

P .yi D 1jxi ; mi ; pi / D P .qi > 0jxi ; mi ; pi / D P .ai > pi jxi ; mi ; pi /

D P ."i > ln pi xi0 ˇjxi ; mi ; pi /


 
ln pi xi0 ˇ
D1 ˆ

 0 
xi ˇ ln pi



所以这是一个特殊的 Probit 模型。

24
11.3 数据集 hmda_short.dta 包含了美国波士顿有关房贷申请的航截面数据,包括以下变量:虚拟变量 deny(房
贷申请被拒),piratio(payment to income ratio,支出占收入比重),score(信用分数,1 最高,6 最低),black(是
否为黑人)。考虑以下模型

denyi D ˇ0 C ˇ1 piratioi C ˇ2 scorei C ˇ3 blacki C "i

(1) 用 OLS 估计线性概率模型;

(2) 估计 Probit 模型,计算边际效应及正确预测的比率;

(3) 估计 Logit 模型,计算边际效应及正确预测的比率;

(4) 估计条件异方差 Probit 模型,并确定是否存在条件异方差。

解:

(a) 代码如下:
reg deny piratio score black, r

(b) 代码如下:
probit deny piratio score black, nolog
margins, dydx(*)
estat clas

(c) 代码如下:
logit deny piratio score black, nolog
margins, dydx(*)
estat clas

(d) 代码如下:
hetprob deny piratio score black, het(piratio score black)
p 值为 0.3654,接受原假设,认为不存在条件异方差。

11.4 数据集 gss_cdvm.dta 来自 2000 年与 2002 年的 General Social Survey,包含以下变量:虚拟变量 trust(是否


信任大多数人),www(是否用互联网),educate(教育年限),income(家庭收入),age(年龄),male(是否男性)。

(1) 估计 Probit 模型,考察 educate, income, age, male 对 trust 的影响。

(2) 估计 Probit 模型,考察 educate, income, age, male 对 www 的影响。

(3) 估计双变量 Probit 模型,同时考察 trust 与 www 的决定。是否有必要使用双变量 Probit 模型?

解:

(1) 代码如下:

25
probit trust educate income age male, nolog

(2) 代码如下:
probit www educate income age male, nolog

(3) 代码如下:
biprobit trust www educate income age male, r nolog
p 值为 0.0004,拒绝原假设,认为有必要使用双变量 Probit 模型。

26
第 12 章 多值选择模型
12.1 (此题来自 Cameron and Trivedi, 2005) 考虑潜变量模型 yi D xi0 ˇ C "i ,其中 "i  N.0; 1/。假设可观测变量
yi D 2,如果 yi < ˛;yi D 1,如果 ˛  yi < Ui ;yi D 0,如果 yi  Ui 。其中,Ui 已知但可随个体 i 而
变,而 ˛ 为未知。

(1) 给定 xi ,计算 yi D 0; yi D 1,及 yi D 2 的条件概率。

(2) 具体说明,如何一致地估计 ˛ 与 ˇ。

解:

(1) P .yi D 0jxi / 如下:

P .yi D 0jxi / D P .yi  Ui jxi / D P .xi0 ˇ C "i  Ui jxi /


 
Ui xi0 ˇ
D1 ˆ
1
D ˆ.xi0 ˇ Ui /

类似地可得到:P .yi D 1jxi / D ˆ.Ui xi0 ˇ/ ˆ.˛ xi0 ˇ/ 和 P .yi D 2jxi / D ˆ.˛ xi0 ˇ/。

(2) 可以使用工具变量法或极大似然估计法,具体步骤略。

12.2 数据集 mlogit.dta 包含 200 名高中学生的如下变量:定性变量 ice_eream(取值为 chocolate,vanilla 与 straw-


berry),female(是否女性),video(电子游戏成绩),puzzle(猜谜成绩)。

(1) 估计一个多项 Logit 模型,以变量 female,video 与 puzzle 解释这些学生对冰淇淋口味的偏好。

(2) 解释此模型估计结果的经济意义。

(3) 对 II A 假定,进行豪斯曼检验。

(4) 根据多项 Logit 模型,预测每位学生选择冰淇淋口味的可能性。

(5) 汇报此模型的相对风险比率 (RRR)。

(6) 使用同样的变量,估计一个多项 Probit 模型。

(7) 根据多项 Probit 模型,预测每位学生选择冰淇淋口味的可能性。

(8) 比较这两种模型预测结果的相关性。

解:

(1) 代码如下:
mlogit ice_cream female video puzzle

27
(2) 上题结果显示,在 5% 的显著性水平上,给定其他变量,女性更不可能选择 chocolate,但是否女性对
选择 strawberry 没有显著影响。电子游戏成绩高低对选择何种 ice_eream 没有显著影响。猜谜成绩越
高越不会选择 chocolate 和 strawberry。

(3) 代码如下:
mlogtest, hausman base

(4) 代码如下:
predict ice_cream1 ice_cream2 ice_cream3
list ice_cream1 - ice_cream3 in 1/3

(5) 代码如下:
mlogit ice_cream female video puzzle, nolog rrr

(6) 代码如下:
mprobit ice_cream female video puzzle

(7) 代码如下:
predict ice_cream1p ice_cream2p ice_cream3p

(8) 代码如下:
corr ice_cream1 ice_cream1p
corr ice_cream2 ice_cream2p
corr ice_cream3 ice_cream3p

12.3 数据集 travel.dta 包含有关交通工具选择的以下变量:subject(个体 ID),mode(1 = Air,2 = Train,3 = Bus,


4 = Car),choice(1 = 选中的交通工具),time(等待时间),cost(成本),income(家庭收入),air(1 = 乘飞机),
train(坐火车),bus(1 = 坐公交车),car(1 = 自驾车),air_inc(air 与 income 的互动项)

(1) 使用解释变量 time,cost,air_inc,估计条件 Logit 模型。

(2) 将交通工具分为两组,即空中交通 (fly) 与地面交通 (ground),进行嵌套 Logit 估计。

解:

(1) 代码如下:
clogit choice time cost air_inc, group(subject) nolog or

(2) 代码如下:
nlogitgen type = mode(fly:1, ground:2 | 3 | 4)
nlogit choice time cost air_inc || type:, base(fly) || mode:income, base(3) case(
subject) nolog notree

28
第 13 章 排序与计数模型
1
X
13.1 对于零膨胀泊松回归,证明 P .yi D j jxi / D 1。
j D0
证:
1
X 1
X
P .yi D j jxi / D P .yi D 0jxi / C P .yi D j jxi /
j D0 j D1
1
X .1  /e i ji
DC
j D1
j Š.1 ei /
1
1  X e i ji
DC
1 ei j D1 j Š
1 
DC .1 ei /
1 ei
D  C .1 /

D1

13.2 使用排序数据集“mus18data1.dta”,估计以下模型,

healthi D ˇ0 C ˇ1 agei C ˇ2 linci C ˇ3 ndiseasei C "i

其中,health 为健康状况 (1 = 差,2 = 好,3 = 非常好),age 为年龄,linc 为收入的对数,ndisease 为患慢性


疾病的个数。

(1) 进行 OLS 回归;

(2) 进行 ordered probit 回归;

(3) 进行 ordered logit 回归。

解:

(1) 代码如下:
reg health age linc ndisease

(2) 代码如下:
oprobit health age linc ndisease

(3) 代码如下:
ologit health age linc ndisease

13.3 使用数据集“poissonreg.dta”,估计决定“初中生旷课天数”(daysabs) 的计数模型,解释变量为“语言艺


术课成绩”(langarts) 与“是否男性”(male)。

29
(1) 估计泊松回归模型;

(2) 估计负二项回归模型;

(3) 计算被解释变量的均值与方差,是否方差比均值大很多?

(4) 根据 LR 检验,应该使用泊松回归,还是负二项回归?

(5) 估计零膨胀泊松回归模型;

(6) 估计零膨胀负二项回归模型;

(7) 应该使用零膨胀模型吗?

注:本教材出版于 2014 年,在 2015 年有学者证明了 Vuong 检验并不适用于测试零膨胀模型。因此,本题


的 (5)、(6) 问所给出答案仍使用书本代码,但 Stata17 会报错,如果强行想要输出结果,请将“vuong”
改为“forcevuong”。
解:

(1) 代码如下:
poisson daysabs langarts male, r irr

(2) 代码如下:
nbreg daysabs langarts male, r exposure(langarts)

(3) 代码如下:
sum daysabs, detail

(4) 第 (2) 问的代码输出结果中,˛ 的置信区间为 Œ1:132623; 1:624057,所以拒绝原假设,认为应使用负


二项回归。

(5) 代码如下:
zip daysabs langarts male, inf(_cons) vuong nolog

(6) 代码如下:
zinb daysabs langarts male, inf(_cons) vuong nolog

(7) 根据第 (5) 问的输出结果,p 值为 0,认为应该使用零膨胀泊松回归模型。根据第 (6) 问的输出结果,


p 值为 0.5001,认为不应该使用零膨胀负二项回归模型。

30
第 14 章 受限被解释变量
14.1 数据集 tobacco.dta 包含了 1995 年 2724 个比利时家庭的以下变量:share2(budget share of tobacco,烟草占
预算比重),age(年龄),ln x(家庭开支的对数),nadults( number of adults in household,家庭中成年人数),
nkids(number of kids > 2 year old,两岁以上儿童数),nkids2(number of kids < 2 year old,两岁及以下儿童
数)。考虑以下恩格尔函数 (用于烟草的开支比重随着总开支而变化):

share2i D ˇ0 C ˇ1 ln xi C ˇ2 agei C ˇ3 nadultsi C ˇ4 nkidsi C ˇ5 nkids2i C "i

(1) 进行 OLS 回归;

(2) 假设在被解释变量“share2 = 0”处存在左边断尾,进行断尾回归;

(3) 假设在被解释变量“share2 = 0”处存在左边归并,进行归并回归 (Tobit);

(4) 将被解释变量“share2 = 0”的取值定义为“缺失”,然后用 MLE 进行样本选择回归,选择方程的解


释变量为“age”,“nadults”,“nkids”与“nkids2”(选择是否抽烟,可能不取决于收入,而取决于对
自己及家人健康的考虑)。

(5) 恩格尔定律适用于烟草吗 (即用于烟草的开支比重随总开支的增加而下降)?

解:

(1) 代码如下:
reg share2 lnx age nadults nkids nkids2

(2) 代码如下:
truncreg share2 lnx age nadults nkids nkids2, ll(0) nolog

(3) 代码如下:
tobit share2 lnx age nadults nkids nkids2, ll(0) nolog

(4) 代码如下:
foreach i in share2 {
replace ‘i’=. if ‘i’==0
}
heckman share2 lnx age nadults nkids nkids2, select (age nadults nkids nkids2)
twostep nolog

(5) 根据第 (1)-(4) 问的输出结果,ˇO1 < 0 总成立,则用于烟草的开支比重随总开支的增加而下降,所以


恩格尔定律适用于烟草。

14.2 重复上题,但把被解释变量改为“share1”(budget share of alcohol,酒精占预算比重)。


解:

31
第 (1)-(4) 题代码与上题类似,只需将“share2”改为“share1”,即可,第 (1) 和 (3) 题说明恩格尔定律
不适用,第 (2) 和 (4) 题说明恩格尔定律适用。

32
第 15 章 短面板
15.1 证明当 T D 2 时,ˇOFD D ˇOFE 。
证:
当 T D 2 时,有

0
yi1 D xi1 ˇ C zi0 ı C ui C "i1
0
yi2 D xi2 ˇ C zi0 ı C ui C "i2

对 FE 估计量:

yi1 yNi D .xi1 xN i /0 ˇ C ."i1 "Ni /

yi 2 yNi D .xi 2 xN i /0 ˇ C ."i 2 "Ni /

)yi 2 yi1 D .xi2 xi1 /0 ˇ C ."i2 "i1 /

对 FD 估计量:
yi 2 yi1 D .xi2 xi1 /0 ˇ C ."i 2 "i1 /

综上,当 T D 2 时,ˇOFD D ˇOFE 。

15.2 证明经过广义离差变换后的随机效应模型,其扰动项不再存在自相关,即

Cov Œ.1 /ui C ."it  "Ni /; .1 /ui C ."i s  "Ni / D 0; t ¤ s

"
其中,  1 。
.T u2 C "2 /1=2
证:
先计算
EŒ.1  /ui C ."i t  "Ni / D .1  /E.ui / C E."i t / E.N"i / D 0
2 2  2
因为 .1  /2 u2 D ,于是
" T

Cov Œ.1  /ui C ."it  "Ni /; .1 /ui C ."is  "Ni /


˚
D E Œ.1 /ui C ."i t  "Ni /Œ.1  /ui C ."i s  "Ni /0
2 2 T  2 2
D .1 /2 u2
 C 2 "
 T " T 
2 2
  2
D "2 .1  /2 u2 C
" T
 2 2

2 2   2
D " C
T T
D0

33
15.3 面板数据集 mus08psidextract.dta 包含 595 名美国工人 1976-1982 年的以下变量:lwage(工资对数),ed(教
育年限),exp(工龄),exp2( exp 的平方),wks(工作周数,weeks worked)。考虑以下模型:

lwagei t D ˛ C ˇ1 expi t Cˇ2 exp 2it C ˇ3 wksi t C ˇ4 edit C ui C "i t

(1) 进行混合回归;

(2) 对随机效应模型进行 FGLS 估计,检验是否存在个体效应;

(3) 对随机效应模型进行 MLE 估计;

(4) 对固定效应模型计算组内估计量;

(5) 对固定效应模型进行 LSDV 估计,检验是否存在个体效应;

(6) 估计带时间效应的固定效应模型;

(7) 计算一阶差分估计量;

(8) 计算组间估计量;

(9) 进行传统的豪斯曼检验;

(10) 进行稳健的豪斯曼检验。

解:

(1) 代码如下:
xtset id t
reg lwage exp exp2 wks ed, vce(cluster id)

(2) 代码如下:
xtreg lwage exp exp2 wks ed, re r theta
p 值为 0,拒绝原假设,认为存在个体效应。

(3) 代码如下:
xtreg lwage exp exp2 wks ed, mle

(4) 代码如下:
xtreg lwage exp exp2 wks ed, fe r

(5) 代码如下:
xtreg lwage exp exp2 wks ed i.id, r
大部分个体虚拟变量的 p 值接近于 0,拒绝原假设,认为存在个体效应。

(6) 代码如下:
xtreg lwage exp exp2 wks ed i.id, fe r

34
(7) 代码如下:
xtserial lwage exp exp2 wks ed, output

(8) 代码如下:
xtreg lwage exp exp2 wks ed, be

(9) 代码如下:
xtreg lwage exp exp2 wks ed, fe
estimates store FE
xtreg lwage exp exp2 wks ed, re
estimates store RE
hausman FE RE, constant sigmamore

(10) 代码如下:
quietly xtreg lwage exp exp2 wks ed, re
scalar theta = e(theta)
global yandxforhausman lwage exp exp2 wks ed
sort id
foreach x of varlist $yandxforhausman {
by id:egen mean‘x’ = mean(‘x’)
gen md‘x’ = ‘x’ - mean‘x’
gen red‘x’ = ‘x’ - theta * mean‘x’
}
quietly reg redlwage redexp redexp2 redwks reded mdexp mdexp2 mdwks mded, vce(
cluster id)
test mdexp mdexp2 mdwks mded
// 或
ssc install xtoverid
quietly xtreg lwage exp exp2 wks ed, re r
xtoverid

35
第 16 章 长面板与动态面板
16.1 对于随机系数模型,证明复合扰动项 .xi0 t vi C "i t / 与解释变量 xi t 不相关。
证:
因为 E.vi jxit / D 0,所以 vi ; xi t 独立,且 E.vi / D EŒE.vi jxi t / D 0,所以

Cov.xit0 vi C "it ; xi t / D Cov.xi0 t vi ; xit /

D EŒ.xit0 vi E.xi0 t vi //.xit E.xit //0 jxit 

D EŒxi0 t vi xit0 xi0 t vi E 0 .xit / E.xi0 t vi /xit0

C E.xi0 t vi /E 0 .xit /jxit 

D xit0 E.vi jxit /xi t xi0 t E.vi jxit /E 0 .xit /

E.xi0 t jxi t /E.vi jxit /xi0 t C E.xit0 jxi t /E.vi jxi t /E 0 .xi t /

D0

即 .xi0 t vi C "it / 与 xit 不相关。

16.2 面板数据集 grunfeld.dta 包含了 10 个公司 1935-1954 年的以下变量:invest(投资额),mvalue(公司市场市


值),与 kstock(公司资本存量)。考虑估计以下投资函数:

investi t D ˇ0 C ˇ1 mvaluei t C ˇ2 kstockit C ui C "it

参照本章实例,将其视为“长面板数据”进行各种估计与检验。
解:
代码如下:
reg invest mvalue kstock i.company t, vce(cluster company)
estimates store OLS
xtpcse invest mvalue kstock i.company t
estimates store PCSE

16.3 尝试对数据集 traffic.dta 进行动态面板估计。动态面板模型适用于该数据集吗?


解:
代码如下:
xtabond fatal beertax spircons unrate perinck, lags(2) maxldep(2) twostep vce(robust)
estimates store DiffGMM
estat abond
xtabond fatal beertax spircons unrate perinck, lags(2) maxldep(2) twostep
estat sargan

36
xtdpdsys fatal beertax spircons unrate perinck, lags(2) maxldep(2) twostep vce(robust)
estimates store SysGMM
estat abond
xtdpdsys fatal beertax spircons unrate perinck, lags(2) maxldep(2) twostep
estat sargan
estimates table DiffGMM SysGMM, b se

结果说明动态面板模型不适用于该数据集。

37
第 17 章 面板二值选择模型
17.1 使用 Stata 提供的数据集 union.dta 估计面板二值选择模型。被解释变量为 union(是否工会成员),解释变量
包括 age(年龄)、grade(教育年限)、south(是否南方)、black(是否黑人) 以及 not_smsa(不在大城市)。

(1) 进行混合 Logit 回归;

(2) 估计随机效应的面板 Logit 模型;

(3) 估计固定效应的面板 Logit 模型;

(4) 通过豪斯曼检验,确定应使用以上哪种模型;

(5) 估计随机效应的面板 Probit 模型。

解:

(1) 代码如下:
logit union age grade south black not_smsa, vce(cluster idcode)
estimates store POOLED

(2) 代码如下:
xtlogit union age grade south black not_smsa
estimates store RE

(3) 代码如下:
xtlogit union age grade south black not_smsa, fe
estimates store FE

(4) 代码如下:
logit union age grade south black not_smsa
estimates store POOLED
hausman FE POOLED
hausman RE POOLED
FE 与 POOLED 的 p 值为 0.2073,接受原假设,认为使用混合 Logit 回归模型。RE 与 POOLED 的 p
值为 0,拒绝原假设,认为使用随机效应的面板 Logit 模型。

(5) 代码如下:
xtprobit union age grade south black not_smsa

17.2 使用数据集 patr7079.dta 估计面板计数模型。此数据集来自 Cameron and Trivedi (2005),最初为 Hall et


al(1986) 所使用。该数据集包括 346 家企业在 1970-1979 年所获专利数据。被解释变量为 PAT(企业于该年申
请并最终获批的专利数),主要解释变量为 LOGR(企业该年的 R&D 支出),其他解释变量包括 SCISECT(企
业是否属于科学部门,the scientific sector),以及 LOGK(1972 年的企业账面资本额)。

38
(1) 进行混合泊松回归;

(2) 进行随机效应的面板泊松回归;

(3) 进行固定效应的面板泊松回归;

(4) 进行随机效应的面板负二项回归;

(5) 进行固定效应的面板负二项回归;

(6) 通过豪斯曼检验,确定应使用以上哪个回归。

解:

(1) 代码如下:
poisson PAT LOGR SCISECT LOGK, vce(cluster id) irr
estimates store POI

(2) 代码如下:
xtpoisson PAT LOGR SCISECT LOGK, fe irr
estimates store POIFE

(3) 代码如下:
xtpoisson PAT LOGR SCISECT LOGK, re irr
estimates store POIRE

(4) 代码如下:
xtnbreg PAT LOGR SCISECT LOGK, fe irr
estimates store NBFE

(5) 代码如下:
xtnbreg PAT LOGR SCISECT LOGK, re irr
estimates store NBRE

(6) 代码如下:
sum PAT, detail
dis r(Var) / r(mean)
hausman NBFE NBRE
因为被解释变量 PAT 的方差是均值的 152 倍,因此负二项回归更为合适。而对于 NBFE、NBRE 的豪
斯曼检验,p 值为 0,拒绝原假设,认为使用固定效应的面板负二项回归。

39
第 18 章 随机实验与自然实验
18.1 (选自 Stock and Watson, 2011) 考虑一项旨在评估在宿舍里安装互联网对大学生成绩的影响的研究。在一个
大宿舍里,随机地选择半个宿舍安装宽带互联网 (实验组),并收集所有宿舍成员的期末成绩。以下的哪种
情况会对该随机实验的“内部有效性”产生威胁?(回答“会”或“不会”)。

(1) 在学年中间,所有男性运动员都搬出了大学宿舍,住进了兄弟会 (fraternity),因此退出了此项研究 (观


测不到他们的期末成绩);

(2) 被分到控制组的工程专业学生自行安装了一个局部网,分享一个私人无线互联网,并共同付费;

(3) 实验组中的艺术专业学生一直没有学会如何使用互联网账户;

(4) 实验组中的经济专业学生为控制组成员提供互联网服务,并收费。

解:

(1) 会。这是中途退出实验 (attrition) 的例子。在男运动员离开实验后,剩下的受试者是代表一个不包括


男运动员的群体。如果这个群体的平均因果效应与包括男运动员的群体的平均因果效应相同,那么
减员就不会影响实验的内部有效性。另一方面,如果男运动员的平均因果效应与其他人群不同,那么
内部有效性就会受到影响。

(2) 会。这是未能完全遵从实验 (partial compliance) 的例子。自行安装的局部网导致未能完全遵守实验,


这会导致平均因果效应的 OLS 估计量产生偏差。

(3) 不会。该研究的重点是宿舍互联网对成绩的影响。实验组会在宿舍里安装互联网而不是使用互联网。
因此,艺术专业学生符合实验组的要求 (尽管他们选择不使用互联网)。

(4) 会。这也是未能完全遵从实验 (partial compliance) 的例子。不遵守实验要求会导致 OLS 估计量产生


偏差。

40
第 19 章 蒙特卡罗法与自助法
19.1 对于野自助法,证明:

(1) E.O"i / D 0;

(2) Var.O"i / D "O2i 。

证:

(1)
p p p p
5C1 1 5 5 1 1C 5
E.O"i / D p  "Oi C p  "Oi
2 5 2 2 5 2
1 1
D p "Oi C p "Oi
5 5
D0

(2) 因为
p p !2 p p !2
2 5 C 1 1 5 2 5 1 1C 5
E."Oi / D p  "Oi C p  "O2i
2 5 2 2 5 2
p p
5 1 5C1
D p "O2i C p "O2i
2 5 2 5
D "O2i

所以,Var.O"i / D E."O2
i / ŒE.O"i /2 D "O2i 。

19.2 针对数据集 nerlove.dta(参见第 4 章),使用自助标准误估计成本函数。


解:
代码如下:
reg lntc lnq lnpl lnpk lnpf, vce(boot, reps(400) seed(10101) nodots)

19.3 (选做) 针对面板数据集 traffic.dta(参见第 15 章),使用自助法进行稳健的豪斯曼检验,以确定应该使用固


定效应模型,还是随机效应模型。
解:
代码如下:
program hausmantest, eclass
tempname b bols biv
xtreg fatal beertax spircons unrate perinck, fe
matrix ‘bols’ = e(b)
xtreg fatal beertax spircons unrate perinck, re

41
matrix ‘biv’ = e(b)
matrix ‘b’ = ‘bols’ - ‘biv’
ereturn post ‘b’
end
bootstrap _b, reps(400) seed(10101) nodots nowarn: hausmantest
test beertax spircons unrate perinck _cons
dis chi2tail(1, 59.29)

p 值约为 0,拒绝原假设,认为应使用固定效应模型。

42
第 20 章 平稳时间序列
20.1 (部分调整模型,partial adjustment model) 记 yt 为 yt 的最优值或理想值 (比如,yt 为资本存量,而 yt 为最
优资本存量),满足以下关系,yt D ˛ C ˇxt C ut ,其中 ut 为独立于 fxt g 的扰动项。假设 yt 不能立即调
整为最优值 yt ,而只能进行部分调整,即 yt yt 1 D .yt yt 1 /,其中 0 <  < 1。证明 fyt g 为 ADL
模型。
证:
1  1
因为 yt yt 1 D .yt yt 1 /,则 yt D yt C yt 1 ,所以
 
1  1
yt D ˛ C ˇxt C ut ” yt C yt 1 D ˛ C ˇxt C ut
 
” yt D ˛ C . 1/yt 1 C ˇxt C  ut

显然,fyt g 为 ADL 模型。

20.2 (使用 Yule-Walker equations 求解自协方差) 对于 AR.2/ 模型,yt D ˇ0 C ˇ1 yt 1 C ˇ2 yt 2 C "t ,其中 "t 为
白噪声,对此方程两边分别求与 yt k 的协方差,其中 k D 0; 1; 2,得到关于 0; 1; 2 (0,1,2 阶自协方差)
的三元一次方程组。对于 k > 2,给出 k 的递推公式 (将 k 表示为 k 1 与 k 2 的函数)。
解:
对方程两边分别求与 yt k 的协方差,则有
8
ˆ
ˆ
ˆ
ˆ 0 D ˇ1 1 C ˇ2 2
ˆ
<
ˆ 1 D ˇ1 0 C ˇ2 1
ˆ
ˆ
ˆ
:̂ 2 D ˇ1 1 C ˇ2 0

则对于 k > 2, k D ˇ1 k 1 C ˇ2 k 2。

20.3 假设模型为 yt D ˇ0 C ˇ1 yt 1 C ˇ2 yt 2 C 0 xt C 1 xt 1 C 2 xt 2 C "t ,推导其对应的误差修正模型。提示:


假设 .x; y/ 之间的长期均衡关系为 y D  C x。
解:
设 y  D E.yt / D E.yt 1/ D E.yt 2 /,x

D E.xt / D E.xt 1/ D E.xt 2 /,对方程两边求期望,则

y  D ˇ0 C ˇ1 y  C ˇ2 y  C 0x

C 1x

C 2x


于是
ˇ0 0 C 1 C 2 
y D C x
1 ˇ1 ˇ2 1 ˇ1 ˇ2
ˇ0 0 C 1 C 2
则 D ; D 。
1 ˇ1 ˇ2 1 ˇ1 ˇ2
在方程两边减去 yt 1 ,
并在方程右边加上、 减去 0 xt 1 与 2 xt 1 ,
并代入 ˇ0 D .1 ˇ1 ˇ2 / 与 0C 1C 2 D

43
.1 ˇ1 ˇ2 /,则

yt D .1 ˇ1 ˇ2 /. yt 1/ ˇ2 yt 1 C 0 xt C .1 ˇ1 ˇ2 /xt 1 2 xt 1 C "t

D .ˇ1 C ˇ2 1/.yt 1  xt 1/ C 0 xt 2 xt 1 ˇ2 yt 1 C "t

20.4 使用美国 1960-2002 年季度数据集 macro_swatson.dta,估计如下的经验菲利普斯曲线 ADL(2, 1) 模型:

inft D ˇ0 C ˇ1 inft 1 C ˇ2 inft 2 C ˇ3 unemt 1 C "t

其中,inf 为通货膨胀率,unem 为失业率。使用 BG 检验,检验是否存在一阶自相关;如果有,则使用滞


后一阶的 HAC 标准误。ˇO3 的符号是否与宏观理论相一致?
解:
代码如下:
reg dinf L.dinf L2.dinf L.unem
estat bgodfrey

p 值为 0.0248,拒绝原假设,认为存在一阶自相关。
newey dinf L.dinf L2.dinf L.unem, lag(1)

ˇO3 D 0:2476 < 0,说明失业率与通货膨胀率负相关,符号与宏观理论相一致。

20.5 数据集 lutkepohl2.dta 包含了联邦德国 1960-1982 年的以下季度宏观变量:inv(投资),inc(收入),consump(消


费),
ln_inv(投资之对数),
ln_inc(收入的对数), dln_inv(ln_inv 的一阶差分),
ln_consump(消费的对数), dln_inc(ln_inc
的一阶差分),ln_consump(ln_consump 的一阶差分)。估计一个关于 (dln_inv, dln_inc, dln_consump) 的 VAR
模型,并进行相关的检验。
解:
代码如下:
varsoc dln_inv dln_inc dln_consump

根据 varsoc 的结果,综合考虑,选择滞后 2 阶。
var dln_inv dln_inc dln_consump, lags(1/2)
varwle
varlmar
varstable, graph
varnorm

方程整体显著,残差不存在自相关,VAR 系统稳定,残差正态分布假定不成立。

20.6 使用数据集 consumption_china.dta 估计一个有关 .c; y/ 的 VAR 模型,画脉冲响应图,并进行格兰杰因果


检验 (究竟是消费拉动增长,还是钱多了才消费)。

44
解:
代码如下:
varsoc c y, maxlag(20)

根据 varsoc 的结果,综合考虑,选择滞后 6 阶。
var c y, lags(1/6)
vargranger
irf create iuf, set(consumpvar) step(20)
irf graph oirf, yline(0)

根据脉冲响应图,可以认为是消费拉动增长。
i
X
20.7 证明在表达式 (20.67) 中, 0  In ,而其余的 i 可通过递推公式 i D i j €j 来确定。提示:使用关
j D1
2
系式 . 0 C 1L C 2L C    /€.L/ D In 。
证:
2
令 ‰.L/ D 0 C 1L C 2L C    ,且 ‰.L/€.L/ D In ,则

2
In D . 0 C 1L C 2L C    /.In €1 L    €p Lp /
0 1
Xi
D 0 C. 1 0 €1 /L C    C
@ i i j €j
A Li C   
j D1

所以 8
ˆ
ˆ
ˆ
ˆ In D 0
ˆ
ˆ
ˆ
ˆ
ˆ
< 1 0 €1 D 0

ˆ :
::
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ Pi
ˆ
:̂ i i j €j D 0
j D1

i
X
即 0 D In , i D i j €j 。
j D1

20.8 对于数据集 turksales.dta 中的变量 sales,先取对数,再使用回归法进行季节调整,并将此结果通过画图与


正文中不取对数的季节调整结果进行对比。
解:
代码如下:
gen lnsales = log(sales)
gen quarter = quarter((dofq(t)))
tab quarter, gen(q)
reg sales q2-q4

45
predict sales_sa
reg lnsales q2-q4
predict lnsales_sa
sum sales
gen sales_sa_reg = sales_sa + r(mean)
sum lnsales
gen lnsales_sa_reg = lnsales_sa + r(mean)
tsline sales_sa_reg lnsales_sa_reg, lpattern("_")

46
第 21 章 单位根与协整
5
21.1 对于 AR.2/,yt D 2 C yt 1 yt 2 C "t ,写出其特征方程 '.z/,并确定其稳定性。
2
解:
5 1
特征方程 '.z/ D 1 z C z 2 ,令 '.z/ D 0,解得 z1 D ; z2 D 2,因为 jz1 j < 1,则该 AR.2/ 模型不平稳。
2 2
21.2 考虑 AR.1/ 模型,yt D yt 1 C "t ; t D 2;    ; T ,其中 jj < 1,"t 为白噪声且独立于 fyt g。记  的 OLS 估
计量为 。
O

(1) 计算 E.yt2 /。
p d
(2) 根据定理 5.1, T .O / ! N.0; Avar.//。证明
O Avar./
O D1 2 (提示:使用同方差情形下 Avar./
O
的简化公式)。
p p
(3) 假设  D 1 时,(2) 的结论依然成立。证明 T .O / ! 0。
d
(4) (此题不必做) 可以证明,当  D 1 时,T .O
/ ! 非退化分布。因此,在单位根情形下,O 的收敛
p
速度为 T ,快于平稳情况下 OLS 估计量的收敛速度 T ,称为“超一致”(superconsistency),详见
Hamilton(1994, p. 486-488)。

解:

(1) 因为 E.yt / D E.yt 1 /; Var.yt / D Var.yt 对方程两边同时取均值,


1 /, 则 E.yt / 则 E.yt / D 0。
D E.yt /,
2
"
并且,对方程两边同时取方差,则 Var.yt / D 2 Var.yt / C "2 ,则 Var.yt / D 。
1 2
2
"
于是 E.yt2 / D Var.yt / C ŒE.yt /2 D 。
1 2
 2
1 2 2
(2) 由于 Avar./O D ŒE.yt2 / 1 E."2t yt2 /ŒE.yt2 / 1 D 2
"2 " 2 D 1 2 。
" 1 
p p p
(3) 根据弱大数定理,有 O ! ,则 T .O / ! 0。

(4) 证明可参考题干中所提到的参考教材,但需用到维纳过程,超出本书知识,此处略。

21.3 使用 ADF,PP,DF-GLS 及 KPSS 检验,检验数据集 mpyr.dta 中各主要变量是否含有单位根。


解:
ADF 检验代码如下:
di 12*(90/100)^(1/4)
dfuller logm1, lags(11) reg
dfuller logp, lags(11) reg
dfuller logy, lags(11) reg
dfuller logmr, lags(11) reg
dfuller logv, lags(11) reg

47
p 值说明 logm1、logp、logy、logmr、logv 中均含有单位根。
PP 检验代码如下:
pperron logm1
pperron logp
pperron logy
pperron logmr
pperron logv

p 值说明 logm1、logp、logy、logmr、logv 中均含有单位根。


DF-GLS 检验代码如下:
dfgls logm1
dfgls logp
dfgls logy
dfgls logmr
dfgls logv

DF-GLS  值说明 logm1、logp、logy、logmr、logv 中均含有单位根。


KPSS 检验代码如下:
ssc install kpss
kpss logm1, notrend
kpss logp, notrend
kpss logy, notrend
kpss logmr, notrend
kpss logv, notrend

统计量值说明 logm1、logp、logy、logmr、logv 中均含有单位根。

21.4 使用 ADF,PP,DF-GLS 及 KPSS 检验,检验数据集 lutkepohl2.dta 中以下变量是否含有单位根:


ln_inc(收入的对数),ln_consump(消费的对数),以及 ln_inv(投资的对数)。
解:
ADF 检验代码如下:
di 12*(92/100)^(1/4)
dfuller ln_inc, lags(11) reg
dfuller ln_consump, lags(11) reg
dfuller ln_inv, lags(11) reg

p 值说明 ln_inc、ln_consump、ln_inv 中均含有单位根。


PP 检验代码如下:

48
pperron ln_inc
pperron ln_consump
pperron ln_inv

p 值说明 ln_inc、ln_consump、ln_inv 中均含有单位根。


DF-GLS 检验代码如下:
dfgls ln_inc
dfgls ln_consump
dfgls ln_inv

DF-GLS  值说明 ln_inc、ln_consump、ln_inv 中均含有单位根。


KPSS 检验代码如下:
ssc install kpss
kpss ln_inc, notrend
kpss ln_consump, notrend
kpss ln_inv, notrend

统计量值说明 ln_inc、ln_consump、ln_inv 中均含有单位根。

21.5 假设数据集 lutkepohl2.dta 中变量 ln_inv,ln_inc 及 ln_consump 均为一阶单整。使用 Johansen 方法对 (ln_inc,
ln_consump,ln_inv) 进行协整分析。长期均衡关系的系数符号合理吗?
解:
代码如下:
vecrank ln_inc ln_consump ln_inv, trend(trend)
varsoc ln_inc ln_consump ln_inv
vec ln_inc ln_consump ln_inv, lags(3)
1
所以 ln_inct D 0:1514 C 1:0535ln_consumpt 0:0194ln_invt ,收入与消费的系数符号合理,收入与投资的
系数符号不合理。

49
第 22 章 自回归条件异方差模型
22.1 考虑 ARCH.p/ 模型,t2 D ˛0 C ˛1 "2t 1 C    C ˛p "2t p 。为了保证 t2 为正,以及 f"t g 为平稳过程,需要
对参数 f˛0 ; ˛1 ;    ; ˛p g 进行哪些限制?
解:
为保证 t2 为正,需 ˛0 ; ˛1 ;    ; ˛p  0。
为保证 f"t g 为平稳过程,需 ˛0 ; ˛1 ;    ; ˛p < 1 且 ˛0 C ˛1 C    C ˛p < 1。
所以,0  ˛0 ; ˛1 ;    ; ˛p < 1 且 0  ˛0 C ˛1 C    C ˛p < 1。

22.2 数据集 dow1.dta 包含了 1953-1990 年美国道琼斯股指的收盘价。计算道琼斯股指的日收益率,画其时间趋


势图,并参照本章实例进行 ARCH/GARCH 估计。
解:
代码如下:
gen r = log(dowclose / L.dowclose)
line r t
varsoc r, maxlag(10)
reg r L(1/6).r
estat archlm, lags(1/6)
predict e1, res
gen e2 = e1^2
varsoc e2
arch r L(1/6).r, arch(1/3) nolog
arch r L(1/6).r, arch(1) garch(1) nolog
arch r L(1/6).r, arch(1) garch(1) tarch(1) nolog
arch r L(1/6).r, arch(1/3) archm nolog
arch r L(1/6).r, earch(1) egarch(1) nolog

50
第 23 章 似不相关回归
23.1 证明:如果  是单位矩阵,则系统 GLS 估计等价于单一方程 OLS 估计。
证:
系统 GLS 估计为
ˇOGLS D .X 0 X / 1 X 0  1 y

当  D In 时,ˇOGLS D .X 0 X/ 1 X 0 y D ˇOOLS 。

23.2 证明克罗内克尔乘积的三个性质。
证:

(1) .A ˝ B/.C ˝ D/ D .AC / ˝ .BD/:


令 A D .aij /mn ; B D .bij /st ; C D .cij /np ; D D .dij /t q ,则
0 1 0 1
a11 B    a1n B c11 D    c1n D
B C B C
B : :: :: C B :: :: :: C
.A ˝ B/.C ˝ D/ D B :: : : C B : : : C
@ A @ A
am1 B    amn B cm1 D    cmn D
0P n Pn 1
a c BD    aik ckp BD
B kD1 1k k1 C
B kD1 C
B :: : :: :
:: C
D B : C
B C
@P n Pn A
amk ck1 BD    amk ckp BD
kD1 kD1

D .AC / ˝ .BD/

(2) .A ˝ B/0 D A0 ˝ B 0 :
令 A D .aij /mn ; B D .bij /pq ,则
0 1 0
a B  a1n B
B 11 C
0 B :: :: :: C
.A ˝ B/ D B : : : C
@ A
am1 B    amn B
0 1
a B0    am1 B 0
B 11 C
B : :: :: C
D B :: : : C
@ A
a1n B 0    amn B 0

D A0 ˝ B 0

1 1 1
(3) .A ˝ B/ DA ˝B :

51
令 A D .aij /mm ; B D .bij /nn ,则

1 1
.A ˝ B/.A ˝B / D .AA 1 / ˝ .BB 1
/ 利用性质 (1)

D Im ˝ In

D Imn

1 1 1
所以 .A ˝ B/ DA ˝B 。

23.3 面板数据集 grunfeld.dta 包含了 10 个公司 1935-1954 年的以下变量:invest(投资额),mvalue(公司市场市


值),kstock(公司资本存量)。考虑以下投资函数:

investi t D ˇ0 C ˇ1 mvaluei t C ˇ2 kstockit C ut C "it

使用 SUR 估计一个变系数面板模型,即允许 ˇ0 ; ˇ1 ; ˇ2 随公司的不同而不同。


解:
代码如下:
reshape wide invest mvalue kstock, i(year) j(company)
sureg (invest1 mvalue1 kstock1) (invest2 mvalue2 kstock2) (invest3 mvalue3 kstock3) (
invest4 mvalue4 kstock4) (invest5 mvalue5 kstock5) (invest6 mvalue6 kstock6) (
invest7 mvalue7 kstock7) (invest8 mvalue8 kstock8) (invest9 mvalue9 kstock9) (
invest10 mvalue10 kstock10), corr

52
第 24 章 联立方程模型
24.1 证明方程 (24.31)。
证:
根据第 10 章,我们知道 ˇO2SLS D ŒX 0 Z.Z 0 Z/ 1 Z 0 X 1 X 0 Z.Z 0 Z/ 1 Z 0 y。
在本节中,ZO D X.X 0 X/ 1 X 0 Z,则

ıO2SLS D .ZO 0 Z/
O 1 ZO 0 y

D ŒZ 0 X.X 0 X / 1 X 0 X.X 0 X/ 1 X 0 Z 1 Z 0 X.X 0 X / 1 X 0 y

D ŒZ 0 X.X 0 X / 1 X 0 Z 1 Z 0 X.X 0 X/ 1 X 0 y

而在 ıO2SLS 中,Z 为解释变量,X 为工具变量,与 ˇO2SLS 的形式相一致,即证明了该公式。

24.2 对于数据集 supDem.dta,考虑以下商品市场的供需均衡模型:


8
ˆ
<quantity D ˛0 C ˛1 price C ˛2 pcompete C ut
t t t

:̂quantity D ˇ0 C ˇ1 price C ˇ2 praw C vt


t t t

其中,第一个方程为需求函数,第二个方程为供给函数,quantity 为商品数量,price 为商品价格,pcompele


为替代商品的价格,praw 为原材料价格。

(1) 需求方程与供给方程为不可识别、恰好识别或过度识别?

(2) 使用 OLS 分别估计需求与供给方程;

(3) 使用 2SLS 分别估计需求与供给方程;

(4) 使用 3SLS 估计整个方程系统 (提示:由于两个方程的被解释变量均为 quantity,故在使用 Stata 命令


reg3 时,应加上选择项“endog(price)”,指定 price 也为内生变量)。

解:

(1) 由题,M D 2; K D 2,则


需求方程:K1 D 2; M1 D 1,则 K1 D K K1 D 0 < M1 D 1,则需求方程不可识别。
供给方程:K1 D 2; M1 D 1,则 K1 D K K1 D 0 < M1 D 1,则供给方程不可识别。

(2) 代码如下:
reg3 (quantity price pcompete) (quantity price praw), ols

(3) 代码如下:
reg3 (quantity price pcompete) (quantity price praw), 2sls

(4) 代码如下:
reg3 (quantity price pcompete) (quantity price praw), endog(price) first

53
第 25 章 非线性回归与门限回归
25.1 使用数据集 mpyr.dta,估计货币流通速度的对数 .log v/ 与名义利率 .r/ 的以下非线性回归模型:

log vt D ˇ1 C ˇ2 rtˇ3 C "t

将其结果与线性回归比较。其中,非线性参数 ˇ3 显著吗?
解:
代码如下:
nl(logv = {beta1} + {beta2}*r^{beta3=1}), r nolog
reg logv r

ˇ3 的 p 值为 0,拒绝原假设,认为非线性参数 ˇ3 显著。

54
第 26 章 分位数回归
26.1 参照本章实例,使用数据集 nerlove.dta 对成本函数进行分位数回归 (参见第 4 章)。
解:
代码如下:
qreg lntc lnq lnpl lnpk lnpf, nolog

26.2 参照本章实例,使用数据集 hprice2a.dta 对房价的决定因素进行分位数回归 (参见第 7 章)。


解:
代码如下:
qreg lprice lnox ldist rooms stratio, nolog

55
第 27 章 非参数与半参数估计
27.1 使用数据集 mpyr.dta,进行以下估计。

(1) 画变量 logv 的直方图;

(2) 画变量 logv 的核密度图,使用眼球法选择适当的带宽;

(3) 作为对照,在 logv 的核密度图上加上正态分布密度图。

解:

(1) 代码如下:
hist logv

(2) 代码如下:
kdensity logv

(3) 代码如下:
kdensity logv, norm

27.2 参照本章的实例,使用数据集 consumption_china.dta 对中国的消费函数进行以下非参数估计。

(1) 核密度回归;

(2) k 近邻回归;

(3) 局部多项式回归 (一阶);

(4) Lowess 回归。

解:

(1) 代码如下:
ssc install kernreg1
kernreg1 c y, k(3) np(100) gen(c_kern y_grid)

(2) 代码如下:
knnreg c y, knum(10) gen(c_knn)

(3) 代码如下:
lpoly c y, b($S_1) degree(1) gen(y_grid_l c_lpoly)

(4) 代码如下:
lowess c y, b($S_1) gen(c_lowess)

56
第 28 章 处理效应
28.1 使用数据集 jtrain3.dta 估计参加就业培训 (train) 对 1978 年实际收入 (re78) 的处理效应。该数据集中的变
量解释类似于本章正文使用的数据集 ldw_exper.dta。

(1) 把 re78 对 train 进行一元回归。

(2) 加入控制变量进行多元回归。

(3) 进行一对一的倾向得分匹配估计。

(4) 进行 k 近邻倾向得分匹配,令 k D 4。

(5) 进行卡尺内一对四倾向得分匹配。

(6) 进行倾向得分核匹配。

(7) 进行倾向得分线性回归匹配。

(8) 进行马氏匹配。

(9) 计算偏差校正的匹配估计量。

解:

(1) 代码如下:
reg re78 train, r

(2) 代码如下:
reg re78 train age educ black hisp married re74 re75 unem74 unem75, r

(3) 代码如下:
ssc install psmatch2
set seed 10101
gen ranorder = runiform()
sort ranorder
psmatch2 train age educ black hisp married re74 re75 unem74 unem75, outcome(re78)
n(1) ate ties logit common

(4) 代码如下:
psmatch2 train age educ black hisp married re74 re75 unem74 unem75, outcome(re78)
n(4) ate ties logit common quietly

(5) 代码如下:
psmatch2 train age educ black hisp married re74 re75 unem74 unem75, outcome(re78)
n(4) cal(0.01) ate ties logit common quietly

57
(6) 代码如下:
psmatch2 train age educ black hisp married re74 re75 unem74 unem75, outcome(re78)
kernel ate ties logit common quietly

(7) 代码如下:
psmatch2 train age educ black hisp married re74 re75 unem74 unem75, outcome(re78)
llr ate ties logit common quietly

(8) 代码如下:
psmatch2 train, outcome(re78) mahal(age educ black hisp married re74 re75 unem74
unem75) n(4) ai(4) ate

(9) 代码如下:
ssc install nnmatch, replace
nnmatch re78 train age educ black hisp married re74 re75 unem74 unem75, tc(att) m
(4) robust(4)

28.2 使用数据集 angrist.dta,利用断点回归估计班级规模对阅读成绩的影响。详见 Angrist and Lavy(1999)。


解:
代码如下:
ssc install rd, replace
rd read intended_classize observed_classize, z0(10) gr bdep oxline

58
第 29 章 空间计量经济学
本章无习题。

59
第 30 章 久期分析
30.1 假设寿命服从指数分布。证明个体在 .0; t2 / 区间死亡的概率等于在已知个体存活至时刻 t1 的情况下,其
在 .t1 ; t1 C t2 / 区间死亡的概率。
证:
设个体寿命为 X,则 X  Exp./,则题目等价于证明:P .0 < X < t2 / D P .t1 < X < t1 C t2 jX > t1 /。

P .t1 < X < t1 C t2 /


P .t1 < X < t1 C t2 jX > t1 / D
P .X > t1 /
´ t1 Ct2
t
e x dx
D ´1 1
t1
e x dx
t1 .t1 Ct2 /
e e
D t1
e
t2
D1 e
ˆ t2
x
D e dx
0

D P .0 < X < t2 /

所以个体在 .0; t2 / 区间死亡的概率等于在已知个体存活至时刻 t1 的情况下,其在 .t1 ; t1 C t2 / 区间死亡的


概率。

30.2 使用数据集 kennan-1985.dta 进行久期分析。Kennan(1985) 使用此数据集研究美国制造业 1968-1976 年的


罢工持续时间,主要变量包括 t(罢工持续时间) 与 prod(产量对数,已作季节调整并去掉时间趋势)。
解:
代码如下:
stset t, failure(prod)
streg prod, d(e) nohr nolog noshow

30.3 使用数据集 ema1996.dta 分析失业持续时间 (spell) 的决定因素。McCall(1996) 使用此数据集分析失业保险


制度 (失业者可获得一定上限的兼职收入而不影响领取失业救济) 对失业时间的影响。
解:
代码如下:
stset spell
streg houshead married female child ychild nonwhite, d(e) nohr nolog noshow

60
第 31 章 贝叶斯估计简介
31.1 一名贝叶斯学派的研究者从总体 y  N.; 100/ 中抽了一个样本容量为 4 的随机样本,得到样本均值为
56。该学者得出结论, 的后验分布为 N.52; 100/。该学者对  的先验分布是什么?
注:本题数据有问题,需保证  的后验分布方差小于 25 才能求解,故下面计算以  的后验分布为 N.52; 10/
进行计算。
解:  
1 .y /2
设   N.u;  2 /,则由题意,f .yj/ D p exp ,于是
2 2 2
ˆ 1  
1 .y u/2
f .y/ D f .yj/./ d D p exp
1 2. 2 C  2 / 2. 2 C  2 /

而 "
p  2 #
f .yj/./ n= 2 C 1= 2
n= 2 C 1= 2N 2 C u= 2
ny=
f .jy/ D D p  exp
f .y/ 2 2 n= 2 C 1= 2
 
148 2 50 148 50
代入本题数据,可得 u D ; D ,即  的先验分布是 N ; 。
3 3 3 3
31.2 (正态分布的杰佛里先验分布) 假设 y  N.;  2 /。

(1) 假设  未知而  2 已知,证明 I./ D n= 2 ;

(2) 假设  2 未知而  已知,证明 I. 2 / D n=2 4 ;

(3) 假设  与  2 皆未知,证明 I.;  2 / D n=2 6 。

注:本题第三问应该是 jI.;  2 /j D n2 =2 6 。


证:
 n " n
#
1 1 X
(1) 根据概率统计的知识,我们知道 L.;  2 / D p exp .yi /2 ,
2 2 2 2 i D1
n n
n 1 X @ ln L.;  2 / 1 X n
则 ln L./ D ln.2 2 / 2
.y i / 2
, D 2
.yi / D 2 .yN /,
2 2 i D1 @  iD1 
 2 
@ ln L./ n
于是 I./ D E 2
D 2。
@ 
n n
2
@ ln L.;  / n 2 1 X 2 @ ln2 L.;  2 / n 1 X
(2) 由 (1), D C 4 .yi / , D .yi /2 ,而
@ 2 2 2 2 2 i D1 @. 2 /2 2 4  6 i D1
hX i n
E .yi /2 D nE.yi2 / 2nE.yi / C n2 D 4

 2 
@ ln L./ n
于是 I. 2 / D E 2 2
D 。
@. / 2 2
@ ln2 L.;  2 / @ ln2 L.;  2 / 1 X
(3) 由 (1) 和 (2),我们有 D D .yi /,而
@@ 2 @ 2 @ 4
hX i
E .yi / D nE.yi / n D 0

61
0n 1
0 2
于是 I.;  2 / D @ 
2
A ,则 jI.;  2 /j D n 。
n 2 6
0 2
2

62
第 32 章 如何做规范的实证研究
32.1 学习实证研究的好方法是复制 (replicate) 经典论文或最新工作论文的结果。挑选你感兴趣的几篇论文,下
载其数据集,并复制其结果。
略.

63

You might also like