You are on page 1of 272

高等院校经济学管理学系列教材

基本有用的
计量经济学
Mostly Useful Science of
Econometrics
赵西亮著

龜 扣 i .泳 豸 出 版 社
PEKING UNIVERSITY PRESS
图 书 在 版 编 目 (C 1 P )数 据

基本有用的计量经济学/ 赵西亮著. 一北京:


北京大学出版社,
2017. 7

(高等院校经济学管理学系列教材)
IS B N 978-7-301-28481-0

I . ①基… n . ①赵… m . ① 计 量 经 济 学 一 高 等 学 校 一 教 材 I V . ① F2 2 4 .0

中 国 版 本 图 书 馆 C I P 数 据 核 字 (2 0 1 7 ) 第 1 5 4 3 9 1 号

书 名 基 本 有 用 的 计 S 经济 学
JI B E N Y O U Y O N G D E J1L1ANG J I N G J I X U E
著 作 责 任 者 赵 西 亮 著
策 划 编 辑 杨 丽 明 姚 文 海 呂 正
责 任 编 辑 朱 梅 全 杨 丽 明
标 准 书 号 IS BN 978-7-301-28481-0
出版发行北京大学出版社
地 址 北 京 市 海 淀 区 成 府 路 205号 100S71
网 址 http :
/ / www. pup. cn
电 子 信 箱 sdyy_2005@126. com
新 浪微博@北京大学出版社
电 话 邮 购 部 62752015 发 行 部 62750672 编 辑 部 021-'620H998
印 刷 者 三 河 市 北 燕 印 装 有 限 公 司
经 销 者 新 华 书 店
7 3 0 毫 米 X 9 8 0 毫米 1 6 开本 1 7 印张 2 9 6 千字
2017年 7 月 第 1 版 2 0 1 7 年 7 月 第 1 次印刷
定 价 45. 0 0 元

未 经 许 可 ,不 得 以 任 何 方 式 复 制 或 抄 袭 本 书 之 部 分 或 全 部 内 容 。
版抆所有,侵权必究
举 报 电 话 :010-62752024 电 子 信 箱 :I d ® pup. pku. c d u .c n
图 书 如 有 印 装 质 量 问 题 ,请 与 出 版 部 联 系 ,电 话 :010-6 2 7 3 6 3 7 0
经 过 三 十 多 年 的 努 力 ,中 国 经 济 已 经 从 计 划 经 济 模 式 成 功 转 型 为 以 公 有 制
为 主 导 的 社 会 主 义 市 场 经 济 模 式 。在 经 济 转 型 与 发 展 过 程 中 ,
从中央到地方的
各 种 经 济 政 策 发 挥 了 主 导 作 用 。在 国 家 层 次 上 ,有 “五 年 计 划 ”、《中 国 制 造
2025》
《新 劳 动 合 同 法 M 社 会 保 险 法 》等 规 划 或 法 律 法 规 ,国 家 支 持 新 兴 战 略 产
业政策,
京津冀一体化战略,
长 江 流 域 发 展 战 略 ,自 贸 区 战 略 ,
“一 带 一 路 ”愿 景 ,
当然也包括财政、
货 币 政 策 等 。在 地 方 层 次 上 ,有 地 方 “五 年 计 划 ”、
地方产业政
策以及地方性财政政策等。
各级政府的各种经济政策,
大都是在调査研究、
智库论证、
征求有关各方意-
见 的 基 础 上 形 成 的 。但 是 ,
不少调查研究、
征求意见并不一定经过充分、
仔细的
论 证 。尤 其 是 各 级 政 府 领 导 人 政 务 繁 忙 ,很 多 人 没 有 充 分 时 间 进 行 系 统 的 调 研
与征求意见,
也 有 不 少 停 留 在 召 开 座 谈 会 或 会 议 讨 论 ,存 在 一 定 程 度 的 形 式 主
义 。 由 于 时 间 等 因 素 的 限 制 ,很 难 充 分 征 求 社 会 各 方 面 的 意 见 。一 些 从 属 于 各
级政府部门的智库,
本 身 可 能 并 不 具 有 很 高 的 专 业 性 ,有 时 还 需 要 揣 摩 上 级 主
要领导的意图,
缺 乏 必 要 的 独 立 性 。相 反 ,
身在中国高校与科研机构、
立场比较
超然的经济学者的经济政策研究,
往 往 具 有 较 高 的 专 业 性 和 独 立 性 。但 是 ,中
国经济学者在从事经济政策研究时,
经常是在经过比较简单的定性分析之后,
即提出自己的观点、
政 策 建 议 。这 些 观 点 与 政 策 建 议 ,
大多不是基于经济数据
进 行 分 析 ,通 过 严 谨 的 推 断 过 程 所 获 得 的 结 论 ,因 此 不 具 备 较 高 的 科 学 性 。诚
然,
除经济数据外,
还 必 须 对 经 济 的 现 状 、历 史 有 深 刻 的 理 解 与 丰 富 的 感 性 认
识 。但 是 ,只 有 建 立 在 经 济 数 据 基 础 上 的 严 谨 的 实 证 研 究 ,才 能 从 复 杂 的 经 济
现象中揭示经济变量之间的因果关系和内在规律,
从而使结论以及建立在结论
基础上的政策建议具有较高的科学性。
因 此 ,中 国 经 济 学 者 关 于 经 济 政 策 研 究 的 一 个 努 力 方 向 ,
是提倡以数据分
析为基础的实证研究,
特 别 是 对 各 个 时 期 的 各 种 经 济 政 策 进 行 量 化 评 估 。最近
二十年来,
计量经济学出现了一个新的领域,
称 为 政 策 (或 项 目 )评 估 计 量 经 济
学 (econometrics of program evaluation) ,并 广 泛 应 用 于 评 估 各 种 社 会 经 济
政策。
所谓政策评估计量经济学,
是在经济数据的基础上应用计量经济学方法与
2 基本有用的计量经济学

工 具 对 社 会 经 济 政 策 进 行 量 化 分 析 ,其 主 要 目 的 是 测 度 某 个 政 策 实 施 后 对 某 个
群体、
某 个 行 业 或 某 个 地 区 的 “因 果 ”影 《
向。 由 于 经 济 现 象 的 不 可 实 验 性 (如四
万 亿 元 刺 激 计 划 不 可 能 再 重 复 一 次 ),
政策评估的最主要困难是识别因果关系
和 测 量 政 策 效 应 的 大 小 或 强 弱 ^政 策 评 估 计 量 经 济 学 因 此 提 出 了 各 种 条 件 下
的量化评估方法,
其核心是估计无法观测到的虚拟事实(
counterfactuals) ,即没
有 实 施 某 种 政 策 时 的 效 果 ,这 样 ,
某项政策的效应可测度为实际政策作用下的
结 果 与 虚 拟 事 实 之 差 。在 国 外 ,
政策评估计量经济学已被广泛应用于经济学和
社会科学很多领域, 包括劳动经济学、 工 业 组 织 、发 展 经 济 学 、
社 会 学 等 。例 如 ,
Card and Krueger (1994)运 用 双 重 差 分 法 (
difference in difference)考察了美国
最 低 工 资 调 整 对 就 业 的 影 响 。Dehejia and W a h b a (1999)使 用 倾 向 得 分 匹 配
(propensity score matching)估 计 就 业 再 训 练 政 策 对 于 收 人 的 影 响 。 H a h n et
al. (1999)应 用 断 点 回 归 方 法 评 估 了 美 国 反 歧 视 联 邦 法 对 少 数 族 裔 就 业 的 影
响 。Abadie et al. (2002)则 使 用 分 位 数 处 理 效 应 模 型 估 计 美 国 大 型 的 就 业 再 培
训 计 划 对 于 收 人 分 配 的 影 响 。Jacob and Lefgren (2004)利 用 美 国 芝 加 哥 公 立
学 校 1 996年教育改革数据评估了芝加哥公立学校所实施的设立暑期培训班以
及 学 生 成 绩 不 好 需 要 留 级 的 教 育 政 策 对 学 习 成 绩 的 影 响 。Lalive (2008)评估
了 奥 地 利 “区 域 扩 展 福 利 计 划 " (regional extended benefits program)实 施 后 对
男性与女性工人失业持续期的影响。
政 策 评 估 计 量 经 济 学 ,渊 源 于 统 计 学 科 的 流 行 病 (epidemiological statis-
tics)统 计 以 及 所 谓 的 处 理 效 应 (treatment effect)统 计 。作 为 政 策 评 估 的 重 要 方
法论,
政策评估计量经济学可用于对中国各种社会经济政策进行严谨的定量评
估,
这 将 大 大 提 高 中 国 社 会 经 济 政 策 研 究 的 科 学 性 。特 别 是 现 在 已 进 人 大 数 据
时代,
各种形式的经济数据非常丰富,
也 便 于 运 用 强 大 的 计 量 机 进 行 处 理 。事
实上,
一 段 时 间 以 来 ,已 有 一 些 智 库 和 学 者 开 始 运 用 计 量 经 济 学 方 法 评 估 中 国
各种经济政策,
并 提 出 相 关 的 经 济 政 策 建 议 。例 如 ,中 国 科 学 院 预 测 科 学 研 究
中 心 汪 寿 阳 教 授 所 带 领 的 政 策 研 究 团 队 ,多 年 来 运 用 计 量 经 济 学 方 法 ,
研究各
种中国经济政策,
很 多 建 议 获 得 政 府 采 纳 。美 国 南 加 州 大 学 萧 政 教 授 等 (Hsiao
et al.,2012)提 出 了 一 种 面 板 数 据 的 政 策 评 估 方 法 ,
并评'估了中国内地与香港
的经济关系,
他 们 发 现 虽 然 “九 七 ”回 归 这 一 政 治 事 件 对 香 港 经 济 增 长 没 有 显 著
影响,
但 是 内 地 和 香 港 关 于 建 立 更 紧 密 经 贸 关 系 的 安 排 (C E P A )对 香 港 实 际
G D P 增 长 贡 献 了 约 4 % 。韩 乾 、
洪 永 淼 (2014)利 用 上 海 证 券 交 易 所 提 供 的 一 组
市场交易数据,
评 估 了 国 务 院 2010年通过的支持七大新兴战略产业的政策对
证券市场投资的影响,
他们发现这个利好产业政策只是为少数机构投资者提供
序 3

了操作机会并造成财富从大量散户向机构投资者转移,
并没有起到引导证券市
场 投 资 者 向 七 大 产 业 投 资 。 O u y a n g and Peng (2015) 扩 展 了 Hsiao et al.
(2012)的 方 法 ,
使 用 半 参 数 的 方 法 评 估 2008— 2 0 0 9 年 实 施 四 万 亿 元 财 政 刺 激
计 划 的 效 果 。他 们 的 研 究 发 现 ,财 政 刺 激 政 策 起 初 的 确 促 进 了 经 济 增 长 ,
特别
是 在 2009年第三季度左右,
G D P 增 速 提 高 了 约 5. 4 % ,
但这一政策效果随后迅
速降低,
在 2 0 1 0 年 第 四 季 度 之 后 甚 至 变 成 了 负 值 。 因 此 ,四 万 亿元的财政刺激
政策只是临时对经济有促进作用,
并无长期影响。
与其他经济学研究方法一样,
计 量 经 济 学 并 不 是 放 之 四 海 而 皆 准 的 “灵丹
妙 药 ”,
它既有科学性,
也 有 局 限 性 。在 应 用 计 量 经 济 学 方 法 与 工 具 评 估 社 会 经
济政策时,
首先需要注意,
每种方法和工具都有其适用的范围与条件,
特别因为
经济现象具有不可操控实验的特点,
很多方法与工具是建立在一些假设基础之
上,
在应用时需要注意这些假设条件的合理性。
其 次 ,计 量 经 济 学 的 方 法 论 基 础 是 概 率 论 与 统 计 学 ,因 此 数 据 样 本 的 选 择
是 一 个 实 际 应 用 中 必 然 遇 到 的 重 要 问 题 。如 何 选 取 一 个 具 有 代 表 性 的 数 据 样
本,
避免样本选择偏差,
与 方 法 和 工 具 的 选 择 一 样 重 要 。另 外 ,
数据质量也是一
个 潜 在 问 题 。大 数 据 时 代 ,
数据收集与处理成本越来越低,
数据质量越来越高。
但是在中国,
各 个 地 K 特 别 是 各 地 政 府 部 门 所 收 集 的 数 据 ,可 能 会 存 在 这 样 那
样的系统性偏差^ 应该提倡随机抽样调査,
或者收集整理数据,
建立比较具有
独立性和代表性的经济数据库。
再 次 ,经 济 政 策 定 量 评 估 还 必 须 与 定 性 分 析 以 及 其 他 各 种 研 究 方 法 相 结
合,
包括理论逻辑分析、
历 史 逻 辑 分 析 、实 地 调 査 研 究 等 ,而 不 是 去 取 代 现 有 研
究 方 法 。 中 国 高 校 的 经 济 学 者 经 常 被 批 评 不 熟 悉 中 国 经 济 实 际 状 况 ,因此必 须
通 过 调 査 研 究 等 方 法 获 得 第 一 手 资 料 ,丰 富 自 己 的 感 性 认 识 。但 是 ,
感性认识
并不能确保政策研究的科学性,
我 们 还 需 要 科 学 的 理 论 思 维 和 分 析 方 法 。天文
物理学家正是依靠科学的研究方法与工具探索天体物体的运动规律,
这值得我
们学习和借鉴。
最后,
对经济政策的定量评估与分析,
需要注意对量化结果进行经济解释。
经济政策评估与分析不是以严谨的学术期刊论文发表为主 要 目 的 ,
应该用通俗的
语 言 和 直 观 的 表 达 方 式 向 政 府 部 门 和 社 会 公 众 传 播 研 究 结 果 。当 然 ,
直观表达
和 通 俗 解 释 并 不 意 味 着 降 低 量 化 评 估 分 析 的 标 准 。社 会 经 济 政 策 评 估 是 经 济
政策研究的重要组成部分和重要方法,
是提升经济政策研究与政策咨询之科学
性 和 有 效 性 的 重 要 途 径 。尤 其 在 目 前 经 济 下 行 态 势 下 ,
研究如何制定最佳经济
政策组合促进中国经济持续稳定快速发展,
具 有 重 要 的 现 实 意 义 ,而 定 量 评 估
4 基本有用的计量经济学

各 种 社 会 经 济 政 策 的 实 际 效 果 是 制 定 最 佳 政 策 组 合 的 关 键 环 节 。 中国经济学
者应该大力倡导应用计量经济学等现代经济学分析方法与工具对中国各种社
会 经 济 政 策 进 行 定 量 评 估 与 分 析 ,从 而 推 动 建 设 有 中 国 特 色 的 高 水 平 的 新 型 经
济智库。
关 于 政 策 评 估 计 量 经 济 学 ,目 前 国 内 暂 无 详 细 介 绍 的 计 量 经 济 学 教 材 ,

近,
厦 门 大 学 经 济 学 系 赵 西 亮 博 士 写 了 一 本 《基 本 有 用 的 计 量 经 济 学 》,
该书利
用潜在结果语言,
从总体视角出发,
集中探讨了政策评估过程中常用的因果效
应 识 别 策 略 。全 书 以 随 机 化 实 验 为 基 础 ,
首先介绍了潜在结果和分配机制的概
念,
并 利 用 潜 在 结 果 定 义 因 果 效 应 。然 后 介 绍 了 随 机 化 实 验 ,
一种特殊的分配
机制,
可以消除选择偏差,
成 为 观 测 研 究 中 各 种 识 别 策 略 的 基 础 。所 有 的 识 别
策略都是通过一定的设计模拟随机化实验,
从 而 得 到 可 信 的 因 果 效 应 估 计 。另
外,
作者还简要介绍了因果图方法,
它是与潜在结果框架完全等价的因果模型,
但是更加直观,
容 易 使 用 。在 这 三 个 理 论 的 基 础 上 ,
该 书 介 绍 了 线 性 回 归 、匹配
方法、
工 具 变 量 法 、面 板 数 据 方 法 和 断 点 回 归 设 计 等 几 种 在 观 测 研 究 中 常 用 的
因 果 效 应 识 别 策 略 。全 书 的 主 要 特 色 是 用 潜 在 结 果 语 言 和 因 图 果 介 绍 各 种 识
别 策 略 。对 于 每 种 识 别 策 略 ,
作 者 还 利 用 具 体 实 例 讲 解 各 策 略 在 Stata软件中
的 实 现 。当 然 ,
该 书 介 绍 的 方 法 也 有 一 定 的 局 限 性 ,正 如 我 上 文 及 该 书 结 语 中
所述,
各种识别策略模拟随机化实验,
可以得到更为可信的因果效应,
但是往往
不能回答具体的内在影响机制,
读者在使用的时候需要了解各识别策略的假设
前提和内在限制。
赵西亮博士嘱我为该书作序,
我欣然命笔,
并认为该书是有关政策评估计
量 经 济 学 的 一 本 很 好 的 入 门 教 材 ,推 荐 给 大 家 。是 为 序 。

洪永森
康奈尔大学 ErnestS. Liu 经 济 学 与 国 际 研 究 讲 席 教 授
厦门大学经济学院和王亚南经济研究院院长
2017年 2 月 6 曰
目前,国 内 计 量 经 济 学 的 训 练 (无 论 是 本 科 生 还 是 研 究 生 )主 要 集 中 于 统 计
推 断 (statistical inference) ,即 如 何 利 用 样 本 信 息 获 得 总 体 信 息 的 估 计 以 及 如 何
进 行 假 设 检 验 以 判 断 估 计 结 果 的 统 计 显 著 性 。在 经 济 学 实 证 中 ,
我们拿到的往
往是总体的一个样本,
利用样本信息进行的估计是否能够反映总体,
是实证研
究 中 一 个 非 常 重 要 的 问 题 。但 是 ,
统计推断本身往往很少能够给出因果关系的
信 息 。随 着 信 息 技 术 的 发 展 ,数 据 获 取 的 成 本 越 来 越 低 ,我 们 开 始 进 入 一 个 大
数据的时代,
这意味着我们可以获得的数据样本容量越来越大,
甚至可以获得
总 体 信 息 。这 样 ,
统 计 推 断 的 作 用 可 能 就 越 来 越 小 ,比 如 ,如 果 拿 到 了 总 体 数
据 ,那 么 传 统 意 义 上 的 统 计 推 断 就 没 有 用 武 之 地 了 。但 是 ,就 算 我 们 有 总 体 数
据,
也不能回答因果关系的问题。比如,
假设我们有中国人口普查的数据,
想考
察教育如何影响个人收人,
仍 然 是 没 有 办 法 获 得 因 果 效 应 的 知 识 的 。 因 而 ,因
果效应无关样本大小,
对于因果效应的探讨是更加底层的问题,
是任何科学获
得 知 识 的 关 键 。所 以 ,
要获得变量之间因果效应的知识,
必须要进行因果推断
(causal inference) 。
目 前,
经 济 学 的 经 验 研 究 正 在 经 历 一 场 研 究 范 式 的 转 变 (paradigm shift)
(Panhans and Singleton, 2016),
从 统 计 推 断 向 因 果 推 断 转 变 。越 来 越 多 的 实
证 研 究 开 始 探 讨 如 何 才 能 科 学 地 识 别 经 济 变 量 之 间 的 因 果 影 响 ,而 非 集 中 于 估
计量的统计显著性问题,
统 计 推 断 往 往 是 相 对 次 要 的 问 题 (second order prob-
lem),而 因 果 推 断 才 是 获 取 知 识 的 首 要 问 题 。这 种 研 究 范 式 的 转 变 被 Angrist
and Pischke (2010)称 为 经 济 学 经 验 研 究 的 “可 信 性 革 命 ”,
其关键特征是引入
潜在结果框架清晰定义因果,
利用随机化实验的思想作为因果效应识别的基
础 ,因 而 新 研 兖 范 式 有 时 也 被 称 为 “以 实 验 设 计 为 基 础 的 计 量 经 济 学 ”或 计 量 经
济 学 的 “实 验 学 派 ”(Angrist and Pischke,2017)。尽 管 其 他 计 量 经 济 学 家 并 不
一 定 完 全 认 同 “可 信 性 革 命 ”的 说 法 ,
但是,
“实 验 学 派 ”的 计 量 经 济 学 确 实 使 经
济 学 经 验 研 究 获 得 很 多 “基 本 有 用 的 经 验 知 识 ”(Rust, 2016) 。最 近 二 十 多 年
来,
“实 验 学 派 ”计 量 经 济 学 方 法 在 经 济 学 经 验 分 析 中 的 影 响 越 来 越 大 ,
研究范
式 的 “技 术 进 步 ”也 不 断 在 其 他 学 科 中 “技 术 扩 散 ”(B o w e n et al.,forthcom­
ing) ,
但是在经济学教学中,
本 科 生 和 研 究 生 所 使 用 的 《计 量 经 济 学 》教 材 仍 然 沿
2 基本有用的计量经济学

用了老的研究范式,
在经济学经验研究文献中广泛采用的因果推断方法仍然没
有 进 人 《计 量 经 济 学 》教 科 书 。Angrist and Pischke (2017)指 出 ,
传统计量经济
学 教 材 中 的 很 多 指 导 是 过 时 的 ,比 如 有 关 异 方 差 、
序列相关等问题的讨论,
这些
问题都不会影响因果效应的识别,
而 这 些 问 题 的 解 决 只 需 要 利 用 White (1980)
的 异 方 差 一 致 性 标 准 误 差 或 N e w e y and West (1987) 的 序 列 相 关 及 异 方 差 一 致
性 标 准 误 差 进 行 修 正 。Angrist and Pischke (2017) 提 议 新 的 研 究 范 式 更 加 有
趣、
相关性更强、
识别结果更加令人满意,
为什么不能让我们的学生也获得这些
技能呢?
本书顺应了 Angrist and Pischke (2017)的 号 召 ,
将经济学经验研究新范式
介 绍 给 我 们 的 学 生 。本 书 分 成 两 大 部 分 :理 论 基 础 和 识 别 策 略 。理 论 基 础 部
分,
首 先 介 绍 潜 在 结 果 框 架 。潜 在 结 果 概 念 的 引 人 ,
便于清晰定义因果效应,

而 避 免 L o r d 悖 论 。然 后 ,
介 绍 随 机 化 实 验 。随 机 化 实 验 是 所 有 识 别 策 略 的 基
础,
本书介绍的所有识别策略在一定的识别条件下都可以看作是一种随机化实
验 。另 外 ,
我们还介绍了因果图。因果图是与潜在结果框架完全等价的因果模
M(Pearl, 2009),
但是更加直观。
第 二 部 分 主 要 介 绍 了 经 济 学 经 验 研 究 中 常 见 的 几 种 识 别 策 略 。首 先 是 线
性回归,
主要关注在什么样的识别条件下,
线性回归系数可以解释为因果效应
参 数 。我 们 强 调 在 线 性 回 归 中 ,
我们关心的解释变量和其他控制变量的地位是
不同的,
其 他 控 制 变 量 的 引 入 是 为 了 识 别 我 们 关 心 的 解 释 变 量 的 因 果 效 应 ,为
强调这一点,
我 们 将 关 心 的 解 释 变 量 称 为 原 因 变 量 或 干 预 变 量 。然 后 ,
我们讨
论 了 匹 配 方 法 的 识 别 条 件 。线 性 回 归 和 匹 配 方 法 有 着 密 切 的 联 系 ,
具有相同的
识 别 条 件 。我 们 强 调 回 归 和 匹 配 的 识 别 条 件 都 是 C I A ,都 不 能 解 决 内 生 性 问
题 。接 着 是 工 具 变 量 法 。工 具 变 量 法 是 经 济 学 中 一 种 相 对 比 较 成 熟 的 方 法 ,

是利用潜在结果语言和引人异质性之后,
工具变量法有了新的内涵,
工具变量
所能识别的因果效应参数是依从者的因果效应,
并且在异质性框架下,
不 同的
工 具 变 量 识 别 不 同 的 因 果 效 应 参 数 。在 有 多 期 数 据 的 情 况 下 ,
可以利用多期数
据的特点,
消除不随时间变化的混杂因素的影响,
从而使双重差分法模拟增量
上的随机化实验另外,
我们还讨论了可以允许时变混杂因素的合成控制法和
回 归 控 制 法 。最 后 ,
我们讨论了最接近完全随机化实验的一种识别策略■
^ 断
点回归设计( R D D ),
它利用断点附近个体具有高度相似性的特点来识别因果效
应 。另 外 ,
对最新发展的弯折回归设计( R K D ) 也进行了简要介绍。
本 书 主 要 根 据 我 为 厦 门 大 学 经 济 学 院 研 究 生 和 高 年 级 本 科 生 开 设 的 “应用
微 观 计 量 经 济 学 ”课 程 讲 义 修 改 而 成 。本 书 的 主 要 特 色 是 利 用 潜 在 结 果 语 言 和
前 言 3

因果图讲解各种识别策略,
另 外 辅 以 具 体 案 例 讲 解 各 种 识 别 策 略 在 S t a U 软件
中 的 实 现 。适 合 从 事 经 济 学 经 验 研 究 的 学 者 和 本 科 生 、
研究生使用,
也适合从
事社会学、
政治学、
流行病学等相关学科研究的学者作为因果推断方面的参考
书 。限 于 作 者 水 平 有 限 ,
时间紧迫,
定有很多错漏之处,
欢迎读者批评指正。

赵西亮
2017年 2 月 2 0 日
致 谢

首先感谢北京大学出版社杨丽明编辑,
没有她两年前的邀请,
可能就没有
本 书 今 天 的 出 版 。另 外 ,在 本 书 的 出 版 过 程 中 ,杨 编 辑 做 了 大 量 细 致 的 工 作 。
特 别 感 谢 洪 永 淼 教 授 在 百 忙 之 中 为 本 书 作 序 。洪 永 淼 教 授 是 国 际 计 量 经 济 学
领域的著名学者,
一直致力于中国的计量经济学教育事业,
对国内年轻学者也
给 予 了 很 多 帮 助 。非 常 感 谢 洪 永 淼 教 授 对 笔 者 的 鼓 励 和 对 本 书 的 评 价 。
感谢上海交通大学安泰经济与管理学院朱喜教授与笔者的有益讨论,
感谢
上海交通大学安泰经济与管理学院博士后梁文泉博士为笔者提供的相关资料,
另 外 ,梁 文 泉 博 士 还 通 读 了 初 稿 ,指 出 了 文 中 的 多 处 错 别 字 ,
在 此 一 并 感 谢 。感
谢 厦 门 大 学 研 究 生 院 副 院 长 方 颖 、厦 门 大 学 经 济 学 系 主 任 龙 小 宁 、厦 门 大 学 经
济学系副系主任赵建等教授对笔者的帮助和支持。
非 常 感 谢 选 修 笔 者 课 程 的 学 生 ,自 2 0 1 3 年 开 课 以 来 ,已 有 四 届 7 个 班 (
4 个
本科生班、
3 个 研 究 生 班 )近 2 0 0 名 学 生 选 修 了 以 本 书 为 基 础 的 课 程 ,
与学生的
讨 论 使 本 书 内 容 不 断 完 善 。本 书 初 稿 完 成 后 ,
部分学生分别阅读了部分章节,
并修改了明显的错别字及语句问题,
他们是厦门大学经济学系博士研究生范振
中、
彭 骏 ,硕 士 研 究 生 陶 宇 、
张惠杰、
唐梦莹等,
在此表示感谢。
目录
Contents

第 一 章 绪 论 ................................................................................................................ (1
第 一 节 引 言 ................................................... (1
第 二 节 因 果 推 断 简 史 .......................................... (3
第 三 节 经 济 学 研 究 的 基 本 问 题 .................................(5
第 四 节 本 书 安 排 .............................................. (6

第 二 章 潜 在 结 畢 框 架 ................................................ (9)
第 一 节 潜 在 结 果 ............................................. (9)
第 二 节 稳 定 性 假 设 ............................................ (12)
第 三 节 分 配 机 制 .............................................. (13)
第 四 节 潜 在 结 果 和 L o r d 悖 论 ................................. (15)
第 五 节 因 果 效 应 参 数 .......................................... (19)
第 六 节 总 结 ....................................... ........... (24)

第 三 章 随 机 化 实 验 ................................................ (
25)
第 一 节 随 机 化 实 验 的 作 用 .............. ............... ....... (25)
第 二 节 随 机 化 实 验 与 选 择 偏 差 ................................. (
28)
第 三 节 随 机 化 实 验 的 分 类 ................... ..................(
30)
第 四 节 随 机 化 实 验 的 分 析 ..................................... (
32)
2 基本有用的计量经济学

第 五 节 随 机 化 实 验 的 缺 陷 ..................................... (37)
第 六 节 总 结 ................................................... (38)

第 四 章 因 果 图 ............................................................................................................(
40)
第一节 基 本 概 念 ...............................................(
40)
第 二 节 因 果 图 和 边 际 独 立 性 ................................... (
41)
第 三 节 选 择 偏 差 和 因 果 效 应 识 别 ........................... ...(45)
第 四 节 选 择 偏 差 的 处 理 ....................................... (50)
第 五 节 总 结 .................................... .............. (52)

第 五 章 线 性 回 归 .................................................... (55)
第 一 节 条 件 期 望 函 数 和 线 性 回 归 .......................... .... (55)
第 二 节 线 性 回 归 和 因 果 效 应 ..................................... (66)
第 三 节 回 归 方 法 的 软 件 实 现 ..................................... (72)
第 四 节 总 结 .................................................... (75)

第 六 章 匹 配 方 法 .....................................................(
77)

第 一 节 协 变 量 匹 配 方 法 ............................. ............ (77)


第 二 节 倾 向 指 数 匹 配 方 法 ....................................... (
80)
第 三 节 匹 配 方 法 的 基 本 步 骤 ..................................... (
83)
第 四 节 倾 向 指 数 匹 配 方 法 的 软 件 实 现 .............................(97)
第五节总结 ................................................ (
117)

第 七 章 工 具 变 量 法 ............ _•................................ (119)


第 一 节 同 质 性 工 具 变 量 法 ...................... ............ (119)
第 二 节 异 质 性 工 具 变 量 法 ................................... (
130)
第 三 节 工 具 变 量 法 的 软 件 实 现 .............................. (140)
第 四 节 总 结 ................................................ (145)
目 录 3

第 八 章 面 板 数 据 方 法 ............................................ (147)
第 一 节 固 定 效 应 方 法 .............................................. :.... (147)
第 二 节 双 重 差 分 法 .......................................... (
149)
第 三 节 合 成 控 制 法 ....................... .................. (162)
第 四 节 回 归 合 成 方 法 ....................................... (171)
第 五 节 面 板 评 估 方 法 的 软 件 实 现 ............................ (176)
第 六 节 总 结 ................................................ (185)

第 九 章 断 点 回 归 设 计 ............................................ (1S6)
第 一 节 断 点 回 归 设 计 ....................................... (186)
第 二 节 断 点 回 归 设 计 的 图 形 分 析 ............................ (194)
第 三 节 断 点 回 归 设 计 的 估 计 ................................. (199)
第 四 节 弯 折 回 归 设 计 ........................................ 乂208)
第 五 节 断 点 回 归 设 计 的 软 件 实 现 ............................ (217)
第 六 节 总 结 ................................................ (
229)

第 十 章 结 语 ..................................................... (
231)

附 彔 S t a t a 数 据 处 理 编 程 简 介 ..................................... (
234)
第 一 节 常 用 命 令 ............................................ (234)
第二节 d o 文 件 .............................................. (
235)
第三节结果呈现利器:
estout软 件 包 .......................... (
240)
第四节练习 ................................................ (
246)

参 考 文 献 ......................................................... (
250)
第一章绪 论

物 有 本 末 ,事 有 终 始 ,
知所先后,
则近道矣。
一 《大 学 》

第一节引 言

在经济学研究中,
我 们 非 常 关 心 经 济 变 量 之 间 的 因 果 关 系 。尽 管 其 他 相 关
关系也很重要,
但 是 在 政 策 评 价 中 ,因 果 关 系 是 更 根 本 的 。关 于 因 果 关 系 的 讨
论 ,可 以 有 两 个 方 向 。一 个 是 看 到 结 果 ,寻 找 结 果 背 后 的 原 因 ,即 考 察 “结果 的
原 因 ”(CaUSe of effect)。这 种 研 究 非 常 重 要 ,
往 往 是 科 学 研 究 的 起 点 。但 寻 找
结果背后的原因,
非 常 复 杂 。某 一 种 结 果 产 生 的 原 因 可 能 有 很 多 ,
需要通过详
细的调查、
深 人 的 分 析 才 能 找 到 。另 一 个 是 看 “原 因 的 结 果 " (effect of cause),
主 要 关 注 某 一 干 预 对 结 果 的 影 响 。对 于 政 策 评 价 而 言 ,往 往 仅 关 注 某 一 项 原
因,
考 察 这 一 原 因 变 动 时 ,结 果 会 有 怎 样 的 变 动 。相 对 而 言 ,
这一方向更加简
单 ,可 操 作 性 更 强 。事 实 上 ,
两个方向的分析是密切相关的,
搞 清 楚 了 “原 因的
结 果 ”,
才 有 利 于 考 察 “结 果 的 原 因 ”以 及 每 一 种 原 因 在 产 生 结 果 中 的 作 用 。 因
而,
很多情况下,
我 们 更 关 注 “原 因 的 结 果 ”。 比 如 ,
在微观经济学中,
我们关心
某 些 措 施 或 干 预 对 个 体 行 为 的 影 响 ,比 如 班 级 规 模 对 儿 童 学 习 效 果 有 什 么 影
响 ?安 全 带 是 否 可 以 增 加 乘 客 在 车 祸 中 的 生 还 机 会 ?教 育 对 个 人 就 业 及 未 来
收入有什么样的影响?助 学 金 是 否 可 以 增 加 贫 困 大 学 生 的 升 学 率 ?对农民工
进行职业培训是否可 以 增 加 他 们 的 就 业 机 会 和 收 入 水 平 ?在 宏 观 经 济 学 中 ,

们 关 心 大 学 生 扩 招 是 否 增 加 了 大 学 毕 业 生 的 就 业 难 度 ?货 币 政 策 调 控 是 否 能
够 抑 制 通 货 膨 胀 ? 限 购 政 策 是 否 能 够 抑 制 房 价 的 持 续 上 涨 ? 2 0 0 8 年 的 4 万亿
刺 激 方 案 是 否 促 进 了 我 国 的 经 济 发 展 和 就 业 扩 张 ?这 些 问 题 都 是 在 探 讨 “原因
的 结 果 ”,
也是本书的主要研究对象。
— 项 干 预 © 对 结 果 变 量 产 生 的 影 响 通 常 称 为 因 果 效 应 (causal effects)或干

①干预可以指一项措施、
政策、
行动或暴露,
在 英 文 中 对 应 词 有 manipulation,treatment, interven-
.tion, exposure等 , 对 应 的 变 量 我 们 称 为 干 预 变 或 原 因 变 丨
本书中我们通称为干预,
2 基本有用的计量经济学

预 效 应 (treatment effects) D® 类 似 于 在 医 学 领 域 对 病 人 的 治 疗 ,如 果 采 用 某 一
种新药或治疗措施,
会对病人的康复有 什 么 样 的 影 响 ?在 医 学 领 域 称 为 治 疗 效 果
(treatment effects),
在经济学及其他社会科学中也 经 常 遇 到 类 似 的 问 题 ,
对这些问
题 的考察称 为 因 果 效 应 分 析 。下面 看 两 个 简 单 的 例 子 ,
了 解 因果推断的困难。

例 1. 1 ( 新 药 的 治 疗 效 果 ) 假 设 现 在 想 考 察 一 项 新 药 的 治 疗 效 果 ,通过调
查 获 得 了 某 医 院 的 新 药 使 用 情 况 ,见 表 1. 1 。

表 1 .1 Yule-Simpson 悖论

总样本 生还 死亡 生还率
干预组 20 20 50 %
控制组 16 24 40%
男性样本 生还 死亡 生还率
干预组 18 , 12 60%
控制组 7 3 70%
女性样本 生还 死亡 生还率
干预组 2 8 20%
控制组 9 21 30%

从总样本看,
共调查了 8 0 个 病 人 ,
4 0 个 病 人 使 用 了 新 药 ,另 外 4 0 个癍人没
有 使 用 新 药 。使 用 了 新 药 的 病 人 归 为 干 预 组 ,没 有 使 用 新 药 的 病 人 归 为 控 制
组 。 结 果 显 示 ,干 预 组 生 还 率 为 5 0 % ,控 制 组 生 还 率 为 4 0 % ,干 预 组 生 还 率 更
高 。从 总 体 样 本 上 看 ,
新 药 采 用 与 生 还 率 正 相 关 ,但 这 并 不 一 定 说 明 新 药 真 的
有 治 疗 效 果 。表 1 . 1 的 第 2 部 分 和 第 3 部 分 分 别 按 照 性 别 列 出 男 性 和 女 性 病
人 的 结 果 。 可 以 看 出 ,对 于 男 性 而 言 ,干 预 组 生 还 率 低 于 控 制 组 ;对 于 女 性 而
言,
也 是 干 预 组 生 还 率 低 于 控 制 组 。从 而 出 现 ,按 照 性 别 分 层 后 ,男 性 和 女 性 群
体中,
均 出 现 了 新 药 使 用 与 生 还 率 的 负 相 关 关 系 。这 种 现 象 在 统 计 学 中 称 为
Yule-Simpson 棒 论 。

上 面 的 例 子 来 自 Pearl (2.009),
是人为构造的,
下面看一个真实的案例。

例 1 . 2 ( 美 国 加 州 大 学 伯 克 利 分 校 研 究 生 录 取 存 在 性 别 歧 视 吗 ?) 1 9 7 3 秋
季,
美 国 加 州 大 学 伯 克 利 分 校 研 究 生 招 生 录 取 工 作 中 ,有 1 2 7 6 3 名 学 生 申 请 ,男

® 本书关注因果关系,
所关注的变量具有明确的干预, 从 而 关 注 的 结 果 变 ffi会 有 多 个 状 态 的 水 平 。
实验研究中干预状态分配是由研究者控制的,
观 测 研 究 (observational studies)中 干 预 不 是 由 研 究 者 控 制
的 。另 一 类 研 究 , 没有干预, 从 而 结 果 变 fi只 有 一 个 水 平 ,
这 种 研 究 称 为 描 述 性 研 究 (Holland and Rubin,
1982),比 如 研 究 男 性 身 高 比 女 性 身 高 高 多 少 ,
今年我国的宏观经济形势如何等^
生 8 4 4 2 人 ,女 生 4 3 2 1 人 。最 终 录 取 5 2 3 2 人 ,
其 中 男 生 录 取 3 7 3 8 人 ,女 生 录 取
4 9 4 人 ,男 生 录 取 率 为 4 4 % ,女 性 录 取 率 为 3 5 % 。男 生 录 取 率 高 于 女 生 ,因而一
些 人 认 为 伯 克 利 分 校 研 究 生 录 取 中 存 在 性 别 歧 视 。真 的 存 在 性 别 歧 视 吗 ?
Bicke et al. (1975)对 此 进 行 了 研 究 ,
发现尽管总体上,
男生录取率高,
但如果按
照专业划分之后,
几 乎 每 个 专 业 中 均 是 女 生 的 录 取 率 更 高 。表 1 . 2 给 出 了 两 个
专业的假想数据, ® ,总 体 上 看 ,男 生 录 取 率 为 4 4 % , 高 于 女 生 的 录 取 率 3 8 % ,

是 每 个 专 业 中 ,女 生 的 录 取 率 都 更 高 。 为 什 么 总 体 而 言 ,男 生 录 取 率 更 高 呢 ?
因 为 男 女 生 的 专 业 分 布 不 同 ,男 生 大 多 数 集 中 于 申 请 录 取 率 相 对 较 高 的 (或是
冷门 )专 业 2 ,而 女 生 却 集 中 于 相 对 录 取 率 较 低 的 专 业 1 。

表 1.2 伯克利分校的研究生录取率
男生 女生
专业
申请人数 录取数 录取率 申请人 数 录取数 录取率
专业1 200 40 20% 400 120 30 %
专业2 800 400 50% 100 70 70 %
合计 1000 440 44% 500 190 3 8%

上 面 两 个 例 子 告 诉 我 们 ,简 单 的 直 观 印 象 往 往 是 错 误 的 ,
真理的揭示是非
常困难的,
需要更加深人地分析,
才有可能找出现象背后的真相。同 时 也 说 明 ,
寻找真理的过程是非常吸引人的。

第二节因果推断简史

在哲学领域很早就有关于因果的讨论,
但真正可以操作的因果概念还是来
自 于 统 计 学 领 域 。统 计 学 领 域 流 行 的 观 点 是 统 计 工 具 只 能 考 察 和 识 别 相 关 关
系,
不能考察因果关系,
相 关 关 系 不 是 因 果 关 系 。N ey m a n ( 1 9 2 3 ,1990)在研究
农业实验中首次提出了潜在结果的概念,
但由于其论文是用波兰语写成的,

没 有 引 起 学 术 界 的 关 注 。② Fisher (1935)提 出 ,
随 机 化 实 验 (randomized experi-
ments)是 因 果 推 断 的 基 础 。2 0 世 纪 7 0 年 代 以 来 ,
Rubin (1974, 1977,1978) 的
一系列论文,
重新独立地提出了潜在结果的概念,
并将之推广到观测研究,
从而
构造出适用于随机化实验和观测研究的基本分析框架,
Rubin提出的潜在结果
框 架 被 称 为 R u b i n 因 果 模 型 (Holland, 1986)。
③ R u b i n 因 果 模 型 (Rubin Caus-

① 详 细 数 据 请 参 考 Bickel et al. (1975) 。


② 直 到 1990年 , 该文才被译成英文, 发 表 在 Statistical Science上 。
③有时也称为 Neyman-Rubin Model (Pearl,1996) „
4 基本有用的计量经济学

al Model, R C M ) 的 关 键 是 提 出 了 “潜 在 结 果 ”的 基 本 概 念 ,
第二章会详细介绍
R u b i n 潜 在 结 果 框 架 。 目 前 ,R C M 已 经 成 为 因 果 推 断 的 基 本 理 论 基 础
在经济学文献中,
因 果 推 断 可 以 追 溯 到 Ashenfelter (1978)、H e c k m a n and
R o b b (1985)等 。关 于 潜 在 结 果 的 概 念 ,实 际 上 在 H aavelmo (1943)关 于 供 求
分 析 的 联 立 方 程 理 论 中 有 所 涉 及 ,文 中 他 区 分 了 供 给 函 数 中 “任 何 想 像 的 价 格
兀”和 “实 际 价 格 ^ ”,
但是后来的计量经济学理论发展没有沿着潜在结果的方向
走下去,
而是开始对观测结果直接进行建模,
将潜在结果和分配机制杂糅在一
起,
使 因 果 效 应 的 识 别 变 得 难 以 理 解 ,并 且 引 人 的 假 设 也 越 来 越 多 (Rubin,
2008 ;Imbens and Wooldridge, 2009) 0
经 济 学 界 历 来 存 在 着 “计 量 经 济 学 是 否 是 科 学 ”的 争 论 (Hendry, 1980;
Sims, 1980),Learner (1983)更 是 指 出 :
“计 量 经 济 学 的 艺 术 就 是 ,
研究者在计
算 机 终 端 中 拟 合 许 多 (甚 至 上 千 个 )统 计 模 型 ,
从中选择一个或几个符合作者预
期的估计结果在论文中进行报告。
”“我 们 发 现 我 们 正 处 于 一 种 令 人 沮 丧 和 不 科
学 的 境 地 。没 有 人 将 数 据 分 析 看 作 严 肃 的 事 情 ,
或者更准确地,
没有人把别人
的数据分析当回事。
”Leamei: (1983)提 议 让 我 们 将 计 量 经 济 学 中 的 “谎 言 和 欺
骗 ”剔 除 出 来 ,
他 提 出 的 解 决 方 案 是 “敏 感 性 分 析 ”(sensitivity analysis)。然 而 ,
“敏 感 性 分 析 ”并 不 能 真 正 解 决 实 证 分 析 结 果 的 “可 信 性 ”问 题 (Angrist and Pis-
chke, 2010)。传 统 计 量 经 济 学 方 法 的 “可 信 性 危 机 ”在 当 时 逐 渐 显 现 出 来 ,
La-
Londe (1986)利 用 美 国 7 0 年 代 进 行 的 一 项 就 业 培 训 的 随 机 化 实 验 数 据 ,
考察
利 用 传 统 计 量 经 济 学 方 法 是 否 能 够 模 拟 随 机 化 实 验 的 结 果 。他 以 随 机 化 实 验
作 为 基 准 (benchmark),利 用 观 测 数 据 作 为 控 制 组 ,运 用 回 归 、固 定 效 应 、H e c k ­
man 选择模型等计量经济学常用方法估计了培训对收人的影响,
发现这些计量
经 济 学 方 法 都 无 法 复 制 随 机 化 实 验 的 结 果 。因 而 得 到 观 察 研 究 中 ,
计量经济学
方 法 无 法 可 信 地 估 计 出 因 果 效 应 的 悲 观 结 论 。L a L onde (1986) 的 研 究 直 接 推
动 了 经 济 学 经 验 研 究 的 “可 信 性 革 命 ”。经 济 学 家 开 始 关 注 计 量 娃 济 学 方 法 的
可信性问题,
Dehejia and W a h b a (1999)利 用 倾 向 指 数 匹 配 方 法 重 新 考 察 了 La ­
Londe (1986)探 讨 的 问 题 ,
他们发现,
尽 管 LaLonde尽量通过手工方式使两组
个体相似,
但 是 ,L a L o n d e 构 造 的 控 制 组 个 体 与 实 验 中 的 干 预 组 个 体 仍 然 具 有
较 大 的 特 征 差 异 。他 们 利 用 倾 向 指 数 匹 配 方 法 ,
获得与干预组个体更为相似的
控 制 组 个 体 ,发 现 估 计 的 因 果 效 应 与 随 机 化 实 验 的 结 果 非 常 相 似 。LaLonde

①关于潜在结果框架的归属, 在 统 计 学 界 和 经 济 学 界 存 在 着 争 议 。现 在 经 济 学 界 (主 要 是 He c k ­
man) 将 潜 在 结 果 框 架 归 属 于 R o y (1951),而 R u b h i 等 统 计 学 家 认 为 R o y (1951)并 没 有 提 出 真 正 的 潜 在
结 果 框 架 ,因 为 R o y (1951)文 中 全 是 文 字 表 述 , 并 没 有 明 确 的 模 型 和 潜 在 结 果 符 号 (Rubbi, 2005)。
第一章绪 论 5

(1986)和 Dehejia.and W a h b a (1999)的 研 究 引 起 了 很 多 学 者 的 关 注 和 讨 论 ,



而 引 发 了 计 量 经 济 学 的 “可 信 性 革 命 ”(Angrist and Pischke, 2010)。① 随 后 ,

很多文献考察观测研究如何才能复制随机化实验的结果,
如何才能使经济学的
经 验 研 究 更 加 可 信 。“可 信 性 革 命 ”的 一 个 重 要 特 点 是 强 调 设 计 ,以 随 机 化 实 验
作为研究设计的基础,
对潜在结果直接进行建模,
而不是对观测结果进行建模,
将潜在结果和分配机制分离开来,
通过科学的设计,
让数据自动呈现因果效应,
尽 量 避 免 有 关 函 数 形 式 和 模 型 设 定 这 种 假 设 因 素 ,与 结 构 计 量 经 济 学 学 派 形 成
清 晰 的 差 别 。引 领 这 场 经 济 学 经 验 研 究 “可 信 性 革 命 ”的 代 表 人 物 包 括 加 州 大
学 伯 克 利 分 校 的 David Card、普 林 斯 顿 的 Alan Krueger、斯 坦 福 大 学 的 Guido
Imbe n s、麻 省 理 工 学 院 的 Joshua Angrisl;、哈 佛 大 学 的 Alberto A b a d i e 等 人 ,

常 称 之 为 计 量 经 济 学 的 “实 验 学 派 ”。

第三节经济学研究的基本问题

一个好的经济学研究计划,
需 要 回 答 四 个 基 本 问 题 :感 兴 趣 的 因 果 效 应 问
题 是 什 么 ?为 了 估 计 因 果 效 应 所 需 要 的 理 想 化 实 验 是 什 么 ?识 别 策 略 是 什 么 ?
是否满足统计充分性?
在经济学经验研究中,
首 先 要 问 的 问 题 是 感 兴 趣 的 因 果 关 系 是 什 么 ? 因果
关 系 是 科 学 探 素 的 起 点 。找 到 关 心 的 因 果 关 系 ,
需要思考理想的随机化实验是
什 么 ?尽 管 我 们 手 头 的 数 据 可 能 不 是 实 验 数 据 ,
思考理想的实验可以帮助我们
进行研究设计。比如在劳动经济学中,
教育对个人收人的影响是一个经典的问
题 。对 于 教 育 如 何 影 响 个 人 收 人 ,理 想 的 实 验 是 如 果 能 够 对 个 人 的 教 育 进 行 随
机化分配,
那 么 不 同 教 育 程 度 个 体 收 人 的 比 较 就 可 以 得 到 教 育 的 因 果 效 应 。但
是,
我们获得的数据往往是调查数据,
而 非 实 验 数 据 。因 而 ,
我们需要问第三个
问 题 ,识 别 策 略 是 什 么 ?识 别 策 略 是 用 观 测 数 据 近 似 理 想 实 验 的 方 法 (Angrist
and Krueger, 1999)。利 用 观 测 数 据 识 别 因 果 关 系 ,
就是要通过研究设计,
用观
测 数 据 来 模 拟 随 机 化 实 验 。本 书 第 二 部 分 主 要 讨 论 各 种 识 别 策 略 ,
识别策略实
际 上 是 本 书 的 主 要 内 容 。第 四 个 问 题 讨 论 估 计 结 果 的 统 计 充 分 性 。一 般 经 济
学经验分析中,
获 得 的 数 据 为 样 本 信 息 ,利 用 样 本 信 息 推 断 总 体 信 息 ,
需要讨论
统 计 量 的 抽 样 分 布 以 判 断 估 计 结 果 的 统 计 显 著 性 。本 书 主 要 关 注 识 别 策 略 ,因
而,
采 用 总 体 视 角 ,即 假 设 我 们 有 总 体 数 据 ,
从而避免了对统计推断的讨论。
®

① Imbens (2010) 称 之 为 “自然实验革命”。


② 关 于 计 经 济 学 的 统 计 推 断 问 题 可 以 参 考 Hayashi (2000) 、洪 永 淼 (
2011) 等 。
6 基本有用的计量经济学

第 四 节 本 书 安 排

本 书 分 为 两 大 部 分 :理 论 基 础 和 研 究 设 计 。
第 一 部 分 介 绍 “实 验 学 派 ”计 量 经 济 学 的 基 本 理 论 基 础 ,
包 括 三 章 。第二章
介 绍 R u b i n 因 果 模 型 的 基 本 内 容 ,主 要 介 绍 潜 在 结 果 和 分 配 机 制 的 概 念 ,以及
因 果 效 应 参 数 的 定 义 。第 三 章 介 绍 随 机 化 实 验 的 基 本 思 想 。 随 机 化 实 验 是 因
果推断的基础,
也 是 本 书 的 灵 魂 . 第 四 章 介 绍 因 果 图 ,因 果 图 是 R u b i n 因果模
型的一种直观表述形式,
本 质 上 与 R C M 是等价的。主要介绍三种路径结构,

因果效应识别提供一种直观分析工具。
第二部分是研究设计,
主要介绍利用观测数据进行因果推断时几种常见的
识 别 策 略 。这 些 识 别 策 略 都 是 以 随 机 化 实 验 为 蕋 础 的 ,
正 如 Rubin (2008)指出
的,
观测研究类似于一种复杂的随机化实验,
但是分配机制是缺失的,
研究者必
须通过科学的设计,
将 缺 失 的 分 配 机 制 恢 复 出 来 。 因 而 ,观 测 研 究 的 关 键 即 如
何通过研究设计让它可以模拟随机化实验,
这 一 设 计 过 程 即 识 别 策 略 。识别策
略 是 经 验 研 究 结 果 可 信 性 的 关 键 。我 们 将 主 要 介 绍 五 种 常 用 的 识 别 策 略 ,
分别
是 回 归 、匹 配 、
工具变量法、
双重差分法(
包 括 合 成 控 制 法 和 回 归 合 成 方 法 )和断
点 回 归 设 计 (包 括 弯 折 回 归 设 计
从第二部分开始,
对于每种识别策略,
都会通过一个实例,
讨 论 其 在 Stata软
件 中 的 具 体 实 现 过 程 。相 关 数 据 集 可 以 到 https://github. com/zhaoxiliang/caus-
alinference下 载 ,
也 可 关 注 本 书 微 信 公 众 号 CausaHnference获 得 相 关 信 息 。

f推荐阅读
I m b e n s a n d R u b i n ( 2015 ) 第 3 章 对 因 果 推 断 历 史 进 行 了 筒 体 介 绍 。 A n ­

grist a n d P i s c h k e ( 2009 ) 第 1 章 介 绍 了 经 济 学 研 究 需 要 回 答 的 四 个 基 本 问 题 D
R u b i n ( 2008 ) 提 供 了 观 测 研 究 的 基 本 步 骤 。 丁 鹏 (2012 ) 对 因 果 推 断 方 法 进 行
了 很 好 的 简 要 介 绍 赵 西 亮 (2017 ) 对 经 济 学 经 验 研 究 的 “ 可 信 性 革 命 ”进行了
简要梳理。
第一篇
理论基础
第二章潜在结果框架

潜 在 结 果 的 概 念 最 早 是 由 N e y m a n (1923,
1990)在 研 究 重 复 随 机 化 农 业 实
验 中 提 出 的 ,由 于 该 文 用 波 兰 语 写 成 ,当 时 没 有 引 起 学 界 的 关 注 。 Rubin
(1974)重 新 独 立 地 提 出 了 潜 在 结 果 的 概 念 ,
并将它的使用推广到观测研究领
域,
从而形成了目前的潜在结果框架,
也 称 为 R u b i n 因 果 模 型 (Holland,1986)
或 Neyman-Rubin模 型 (
Pearl,1996)。R u b i n 因 果 模 型 或 潜 在 结 果 框 架 有 三 个
基 本 构 成 要 件 :潜 在 结 果 、
稳定性假设和分配机制(
assignment mechanism) 。

第 一 节 潜 在 结 果

在因果推断中,
必须有干预,
没 有 干 预 就 没 有 因 果 (R u b i n ,1974)。这 里的
干预可以是一项政策、
一 项 措 施 或 者 一 项 活 动 等 ,比 如 实 施 4 万 亿 的 财 政 刺 激
方案,
对 农 民 工 进 行 职 业 培 训 。® 本 书 主 要 关 注 二 值 的 干 预 变 量 ,
©两 个 值 分 别
对应于积极的行动和被动的行动,
分 别 称 为 (积 极 )干 预 和 控 制 (干 预 ),通 常 简
称为干预和控制,
受到对应干预的个体分别称为干预组和控制组。 比如,
对农
民 工 进 行 培 训 ,(积 极 )干 预 是 参 加 培 训 ,
控 制 (干 预 )是 没 有 参 加 培 训 。在 这 里 ,
干预和控制只是干预变量两种状态的标签,
具 体 哪 个 干 预 状 态 称 为 干 预 ,哪个
状态称为控制并不重要,
干预状态的两种称呼实际上是对0 称 的 ,
可以互换,

决于研究者的目的和偏好。
对应于每个干预状态,
就 有 一 个 (潜 在 )结 果 。在 干 预 状 态 实 现 之 前 ,
有几
个干预状态就有几个潜在结果,
而 干 预 状 态 实 现 之 后 ,只 有 一 个 潜 在 结 果 是 可
以观测的。比如,
考 察 大 学 教 育 对 个 人 收 人 的 影 响 ,干 预 变 量 或 原 因 变 量 是 大
那 么 对 于 任 意 个 体 i有 两 种 干 预 状 态 ,
学教育, 用 D,.来 表 示 ,
以 = 1 表示个体i
完成了大学教育, = 0 表 示 个 体 i 完 成 高 中 教 育 。无 论 个 体 实 际 是 完 成 大 学
教育还是高中教育,
事前每个个体均有两种可能的状态:
完成高中教育或完成

① 英 文 表 述 有 manipulation,treatment, intervention, exposure等 ,


表 7K对个体的^■种干预或暴露
(通 常 在 医 学 研 究 中 ),
② 我 们 也 称 之 为 原 因 变 量 。因果效应分析中,
关注的是干预对结果的影响,
这项干预就是我们关
心的原因。
10 基本有用的计量经济学

大 学 教 育 。每 一 个 状 态 下 对 应 于 一 个 潜 在 结 果 表 示 个 体 £ 在 状 态 = i 下
的 潜 在 结 果 , 表 示 个 体 〗在 状 态 认 = 0 下 的 潜 在 结 果 。对 个 体 而 言 ,这 两 个
潜在结果可以看作是确定性的变量,
不因个体干预变量的实现状态而改变。比
如 个 体 i 完 成 大 学 教 育 状 态 下 的 收 人 为 8 0 0 0 元 ,即 Y 1;= 800 0 ,
仅完成高中教育
状 态 下 收 入 为 6 0 0 0 元 ,即 Y w = 6000。如 果 个 体 i 最 后 实 际 完 成 了 大 学 教 育 ,

么 其 两 种 干 预 状 态 下 的 潜 在 结 果 仍 然 是 (8 0 0 0 ,6 0 0 0 ) ,
如 果 个 体 i 最后实际完
成的是高中教育,
其 两 种 干 预 状 态 下 的 潜 在 结 果 还 是 (8000,6000) ,
不因个体最
后 实 现 的 状 态 而 改 变 。可 以 将 潜 在 结 果 看 作 常 数 ,
对于每个特定的个体,
他在
两种干预状态下的潜在结果是给定的,
不依赖于最终实现的干预状态,
这一点
对 于 理 解 Rubin因果模型很关键。
® '
当干预状态实现后,
我们仅能观测到实现状态下的潜在结果,
没有实现状
态 下 的 潜 在 结 果 是 无 法 观 测 的 。无 法 观 测 到 的 潜 在 结 果 ,
通常称为反事实结果
(counterfactual outcome)。无 论 干 预 状 态 有 几 个 ,
干预状态实现后,
我们仅能观
测 到 实 现 状 态 下 的 潜 在 结 果 。 比 如 个 体 ;最 终 完 成 了 大 学 教 育 ,
那么观测到的
干 预 状 态 是 D, = l ,
我 们 可 以 观 测 到 潜 在 结 果 Y w ,即 个 体 ;完 成 大 学 教 育 后 的
收 入 。他 完 成 了 大 学 教 育 ,
我们就不能观测到他没有完成大学教育时的潜在结
果 y Df,即 仅 完 成 高 中 教 育 时 的 收 入 。一 个 人 不 可 能 同 时 踏 入 两 条 河 流 ,
不可能
同时处于两种状态,
因 而 ,观 测 研 究 中 ,
不可能同时看到个体所有的潜在结果。
无 法 同 时 观 测 到 个 体 所 有 潜 在 结 果 的 现 象 称 为 因 果 推 断 的 基 本 问 题 (Holland,
1986)。观 测 结 果 1 与 潜 在 结 果 之 间 的 关 系 ,
可以用下面的公式表示:
Y,.= D , U ( 1 — D,.)Yof
— fYi = y u , 如果 d; = l .i
( y ;= Y 0i, 如果 Di = 0
即 如 果 干 预 状 态 是 D, = l ,
则可以观测到潜在结果,
如 果 干 预 状 态 是 1);= 0 ,
则可以观测到潜在结果Y 。
,.,
但不能同时观测到两个潜在结果。
潜 在 结 果 和 观 测 结 果 Y ,.之 间 的 区 分 是 现 代 统 计 学 和 现 代 计 量 经
济学的重要标志,
是 经 济 学 经 验 研 究 “可 信 性 革 命 ”的 关 键 ,
也是区分描述性研
究 (descriptive study)和 因 果 研 究 (
causal study)的 标 志 。描 述 性 研 究 中 没 有 干
预,
从 而 结 果 只 有 一 种 状 态 下 的 观 测 结 果 ,因 果 研 究 中 ,有 明 确 的 干 预 ,
结果会
依 赖 于 不 同 的 干 预 状 态 ,每 个 个 体 都 有 多 个 潜 在 结 果 (Holland and Rubin,
1982)。潜 在 结 果 的 表 述 非 常 简 单 ,
但潜在结果的概念使因果效应的表述更加

① 事 实 上 ,
假设潜在结果是固定的,
只 是 一 种 简 化 ,这 种 简 化 使 我 们 更 容 易 理 解 R u b i n 因果模型的
精 髓 。其 实 ,
潜在结果可以是不依赖于干预状态的随机变量。
第二章潜在结果框架 11

清 晰 。有 了 潜 在 结 果 的 概 念 ,
个体因果效应的定义非常直观,
不需要对分配机
制进行任何内生性或外生性的假设,
也不需要对结果变暈的函数形式进行任何
假 设 。对 于 个 体 i,
某 项 干 预 的 因 果 效 应 是 两 种 状 态 下 潜 在 结 果 的 比 较 ,即 :
r,. = y 1;- y oi (2.2)
关于因果效应的定义有两点说明:
首 先 ,因 果 效 应 的 定 义 仅 依 赖 于 潜 在 结
果,
与哪一个潜在结果被观测到没有关系。回到前面大学教育如何影响收人的
例子,
无论个 体i是否完成了大学教育,
大学教育对其个人的因果影响都仅取决
于其两种状态下的潜在结果,
并 且 是 固 定 不 变 的 ,不 依 赖 于 个 体 最 终 实 现 的 干
预 状 态 。如 果 个 体 ;完 成 了 大 学 教 育 ,
大 学 教 育 (相 对 于 仅 完 成 高 中 教 育 )对其
收 入 的 影 响 是 每 月 收 人 增 加 2 0 0 0 元 。如 果 个 体 i 仅 完 成 高 中 教 育 ,
那么如 果 他
能够完成大学教育,
则 其 每 月 收 人 也 是 增 加 2 0 0 0 元 。因 而 ,因 果 效 应 的 定 义 仅
依赖于潜在结果,
不 依 赖 于 实 际 实 现 的 观 测 结 果 。其 次 ,因 果 效 应 是 干 预 后 同
一 时 间 、同 一 物 理 个 体 潜 在 结 果 的 比 较 。 比 如 考 察 某 种 药 对 感 冒 的 治 疗 效 果 ,
干预状态是吃药或不吃药,
对 应 的 潜 在 结 果 是 治 愈 感 冒 或 没 有 治 愈 。因果效 应
应该定义为我现在吃药和不吃药对应潜在结果的比较,
而不能用我现在吃药和
昨 天 我 没 有 吃 药 时 的 潜 在 结 果 进 行 比 较 。 因 为 昨 天 的 “我 ”和 今 天 的 “我 ”不是
同一个“我 ”,我 今 天 不 吃 药 的 潜 在 结 果 和 昨 天 不 吃 药 的 潜 在 结 果 可 能 是 不 一 样
的,
所以在评价今天我吃药的因果效应时,
应该是今天我吃药和今天我不吃药
时潜在结果的比较。
因果效应的定义仅依赖于潜在结果,
是 不 同 状 态 下 潜 在 结 果 的 比 较 。但研
究 者 仅 能观测到一个状态下的潜在结果。因 而 ,
如果仅有一个个体,
我们是没
有办法得到个体因果效应的。因 果 推 断 的 核 心 内 容 ,
实际上是想办法将未观测
到 的 潜 在 结 果 (即 反 事 实 结 果 )估 计 出 来 。估 计 未 规 测 的 潜 在 结 果 或 反 事 实 结
果 必 须 要 用 到 多 个 个 体 。多 个 个 体 的 选 择 有 两 种 方 式 :同 一 物 理 个 体 不 同 时 间
或同一时间的不同物理个体。比如,
判断一种药物是否对感冒有治疗效果,

们 往 往 根 据 自 己 以 往 的 经 历 。我 以 前 感 冒 的 时 候 吃 药 感 冒 就 好 了 ,
我今天没吃
药,
头 就 很 痛 ,因 而 ,
我 们 认 为 药 物 有 治 疗 效 果 。其 实 这 种 推 断 中 ,
我们进行了
很强的假设,
我 们 假 设 过 去 的 经 验 可 以 作 为 今 天 吃 药 的 反 事 实 结 果 。如 果 这 一
假设不成立,
我 们 就 不 能 用 过 去 吃 药 的 结 果 作 为 今 天 吃 药 的 反 事 实 结 果 。 因为
今 天 的 “我 ”与 过 去 的 “我 ”是 不 同 的 个 体 ,我 今 天 可 能 心 情 不 好 ,
不吃药头很痛,
即使吃药,
头 仍 然 是 痛 的 。这 并 不 一 定 说 明 药 没 有 治 疗 效 果 ,而 是 因 为 我 心 情
沮 丧 ,使 我 的 头 更 痛 了 ,即 我 的 头 痛 还 混 杂 了 其 他 的 影 响 因 素 ,
今 天 的 “我 ”和昨
天 的 “我 ”不 可 比 。很 多 时 候 ,
我们的推断是利用同一时间不同个体的信息来估
12 基本有用的计量经济学

计 反 事 实 结 果 。 比 如 考 虑 大 学 教 育 对 收 人 的 影 响 。在 上 大 学 之 前 ,
我们不确定
大 学 能 给 我 们 带 来 什 么 。我 们 只 知 道 目 前 我 的 结 果 是 什 么 样 子 ,
或收人是什么
水 平 。但 不 知 道 大 学 毕 业 之 后 收 人 会 是 什 么 水 平 。那 我 们 在 决 定 是 否 上 大 学
时,
是怎么作出决定的呢?我 们 可 能 会 观 察 那 些 上 了 大 学 的 人 ,
可能是亲戚或
朋友家的孩子,
现在已经大学毕业了,
有个很好的工作,
获得比较满意的收入。
那我们在作决策时是怎么做的呢?我们可能将他们的结果或收人作为我们上
大孪的潜在收人,
从 而 决 定 是 否 上 大 学 。事 实 上 ,后 面 章 节 的 识 别 策 略 就 是 利
用 这 种 方 式 来 推 断 的 。这 种 情 况 下 ,因 果 推 断 的 可 信 性 ,
依赖于我们与亲戚肋
友家孩子的相似性,
越相似,
这种推断越可信。

第二节稳定性假设

潜 在 结 果 框 架 的 第 二 个 要 件 是 稳 定 个 体 干 预 值 假 设 (T h e Stable Unit
Treatment Value Assumption, S U T V A ) ,
简 称 稳 定 性 假 设 (Rubin, 1980) 0 稳
定性假设有两层含义:
第一,
不同个体的潜在结果之间不会有交互影响;
第二,
干预水平对所有个体都是相同的。
稳定性假设的第一个要求是每个个体的潜在结果不依赖于其他个体的干
预 状 态 。我 和 你 住 在 同 一 间 宿 舍 ,
我 们 两 个 都 感 冒 了 。如 果 药 物 对 我 头 痛 的 治
疗效果依赖于你有没有吃药,
那么就不满足稳定性假设。比如,
我吃药但你不
吃药,
你的头在痛,
我尽管吃药了,
但 你 的 呻 吟 声 使 我 很 头 痛 ,我 的 头 痛 并 没 有
因为吃药而消失,
这并不是因为药物没有治疗效果,
原因是我的潜在结果依赖
于你是否吃药,
你 没 吃 药 直 接 影 响 了 我 吃 药 时 的 潜 在 结 果 。换 言 之 ,
我们的潜
在 结 果 存 在 交 互 影 响 。这 时 ,
我们每个人的状态不再是二值的,
而是四值的,

四个潜在结果,
分別对应于我们俩都吃药,
我们俩都没吃药,
我吃药你没吃和我
没 吃 你 吃 了 。但 是 ,
如果满足不存在交互影响的稳定性假设,
你是否吃药不会
影响我的潜在结果,
每个人的干预状态只有两个,
吃药还是没吃药,
每个人的潜
在结果也只有两个。
在 社 会 科 学 中 ,没 有 交 互 影 响 的 假 设 可 能 不 成 立 。社 会 科 学 特 别 是 经 济
学,
研究对象往往是人的行为,
个人的行为之间往往存在交互影响。比如 ,
研究
班 级 规 模 对 个 体 学 习 效 果 的 影 响 ,同 学 之 间 往 往 存 在 一 定 的 外 部 性 ,如 果 一 个
班级里好学生比较多,
他 们 之 间 相 互 讨 论 、相 互 促 进 ,
产生正的外部性,
从而提
高 大 家 的 学 习 效 率 。相 反 ,
如果调皮的学生比较多,
可能产生负外部性,
整个班
级的学习效果都不好。比如考察培训对农民工收人的影响,
如果项目的规模比
第二章潛在结果框架 13

较小,
不 会 对 项 目 外 的 劳 动 力 市 场 产 生 影 响 。但 如 果 项 目 规 模 比 较 大 ,可 能改
变整个劳动力市场的技能结构,
从 而 影 响 整 个 劳 动 力 市 场 的 技 能 供 给 。培训 规
模比较小,
接 受 培 训 的 农 民 工 可 能 很 容 易 找 工 作 ,收 人 也 不 错 。但 如 果 培 训 规
模很大,
这种技能劳动力供给很多,
则接受培训的农民工工作就没有那么容易
找到,
收 入 也 可 能 会 低 一 些 。这 在 经 济 学 中 称 为 一 般 均 衡 效 应 。但 是 不 存 在 交
互影响的假设下,
因果推断更加容易,
因而,
在本书中通常假设不同个体之间不
存在交互影响。
稳 定 性 假 设 的 第 二 个 要 求 是 对 所 有 的 个 体 干 预 水 平 是 相 同 的 。 比如 考 察
药物的治疗效果,
那么给所有病人的药物在药效上都应该是一样的,
不能有的
人有效成分是全额的,
有 的 人 是 半 额 的 。考 察 培 训 对 农 民 工 收 人 的 影 响 ,
那么,
对所有农民工的培训从质量到数量都应该是相同的,
不能有的人培训农业生产
技术,
有的人培训家政服务技术,
有的人培训3 天 ,
有 的 人 培 训 1 周 。干 预 要 具
体,
当考察一项干预影响时,
这项干预要对所有个体程度和水平都是一样的。
干预越具体,
因 果 效 应 测 度 越 精 确 。但 是 ,
在经济学研究中,
往往很难完全满足
这一要求。比如,
在 大 学 教 育 对 个 人 收 入 影 响 的 例 子 中 ,干 预 是 大 学 教 育 。这
里大学教育的概念其实是比较笼统的,
对不同个体而言,
大学教育这一干预水
平可能是不同的,
专 科 教 育 、本 科 教 育 甚 至 研 究 生 教 育 都 可 以 称 为 大 学 教 育 。
另外,
不同大学的教育质量也有相当的差别,
严格意义上是不满足稳定性假设
第 二 项 要 求 的 。在 应 用 中 往 往 忽 略 这 种 差 异 ,
将大学教育看作一种相同程度的
干 预 。因 而 ,
应 用 中 我 们 更 加 关 注 稳 定 性 假 设 的 第 一 项 要 求 ,即 要 求 不 同 个 体
潜在结果之间没有交互影响。

第 三 节 分 配 机 制

潜 在 结 果 框 架 的 第 三 个 要 件 是 分 配 机 制 。分 配 机 制 是 描 述 为 什 么 有 的 人
在干预组,
有的人在控制组,
或者分配机制是描述哪个潜在结果可以被观测到
的 机 制 。® 因 果 推 断 中 分 配 机 制 非 常 重 要 ,
对分配机制的了解有助于进行正确
的 因 果 推 断 。下 面 看 一 个 简 单 的 例 子 了 解 分 配 机 制 的 作 用 。

① 分 配 机 制 的 说 法 一 般 用 在 实 验 中 ,因 为 实 验 设 计 者 或 研 究 者 可 以 控 制 分 配 机 制 ,
让哪些个体进
人干预组,
哪 些 个 体 进 人 控 制 组 。而 在 观 测 研 究 中 ,
个 体 往 往 根 据 自 己 的 效 用 选 择 进 人 不 同 的 群 组 。因
而,
在观测研究中,
分配机制也可称为选择机制《
14 基本有用的计量经济学

表 2. 1 手术相对于药物的治疗效果

潜在结果 因果效应
个体 干预状态 观测结果
1 0 Yi,--Yo,-

病人1 7 1 6 1 7

病人2 5 6 -1 0 6
病人3 5 1 4 1 5
病人4 7 8 -1 0 8

平均因果效应 2

一个总体有4 个病人,
考 察 手 术 治 疗 相 对 于 药 物 治 疗 的 效 果 。手 术 治 疗 是
积极干预,
用 1 表示,
药物治疗是保守治疗,
用 0 表 示 。表 2, 1 列 出 了 每 个 病 人
两种干预状态下的潜在结果,
从 而 可 以 计 算 出 每 个 病 人 的 因 果 效 应 。® 表 2. 1
显 示 病 人 1 手 术 治 疗 后 寿 命 为 7 年 ,而 药 物 治 疗 为 1 年 ,因 而 手 术 治 疗 相 对 于
药 物 治 疗 的 因 果 效 应 是 6 年 。病 人 2 手 术 治 疗 寿 命 为 5 年 ,而 药 物 治 疗 是 6
年,
手 术 治 疗 相 对 于 药 物 治 疗 的 效 果 是 一 1 年 。总 体 平 均 而 言 ,
4 个病人手术治
疗比药物治疗寿命多2 年。
假设现实中医生具有很好的医术或鉴别力,
可以让病人选择对他们最有利
的治疗方案,
从 而 实 现 的 干 预 状 态 见 表 2. 1 第 4 列 ,
让 1、
3 病人接受手术治疗,
2、
4 病人接受药物治疗,
最 终 我 们 可 以 观 测 到 1 、3 病 人 的 Y h 、2 、4 病 人 的 y 。
,。
如果不了解分配机制,
直接利用两组观测结果进行比较,
将发现手术治疗平均
寿命6 年,
药物治疗平均寿命7 年 ,
从 而 得 到 药 物 治 疗 更 有 效 的 错 误 结 论 。为
了得到正确的因果效应,
必 须 了 解 分 配 机 制 ,即 为 什 么 1 、
3 病人在干预组,
而 2、
4 病人在控制组。
在进行因果推断时,
必 须 对 反 事 实 结 果 进 行 估 计 或 预 测 ,而 这 种 预 测 往 往
是很困难的,
涉及对分 配 机 制 或 选 择 机 制 的 了 解 。为 了 搞 清 楚 分 配 机 制 ,
往往
需 要 一 些 干 预 前 变 量 (pretreatment variables)或 协 变 量 (covariates) 。协变量 包
括两类:
一类是个体属性,
不 随 干 预 状 态 变 化 而 变 化 的 变 量 ,比 如 性 别 、民族等
变 量 。另 一 类 是 干 预 实 施 之 前 取 值 的 变 量 ,比 如 研 究 培 训 的 作 用 时 ,
培训前的
收 入 水 平 及 经 济 社 会 特 征 等 都 是 协 变 量 。协 变 量 的 基 本 特 点 是 这 些 变 量 均 不
受干预变量的影响,
相反,
这些变量往往决定个体的干预状态。
根据分配机制是否已知,
可 以 将 分 配 机 制 分 成 两 类 :随 机 化 实 验 和 观 测 研

①现实中仅能观测到一个结果,
这里假设我们可以看到所有的潜在结果^
第二章潜在结果框架 15

究 。这 两 类 机 制 有 共 同 特 点 ,
都 是 研 究 某 项 干 预 的 因 果 效 应 。® 随 机 化 实 验 中 ,
分配机制是由实验者或研究者控制的,
是 已 知 的 。观 测 研 究 中 ,
分配机制是未
知 的 。观 测 研 究 的 目 的 就 是 想 办 法 将 未 知 的 分 配 机 制 识 别 出 来 ,
从而估计因果
效应。
下 面 引 人 一 个 关 键 概 念 ---- 非 混 杂 性 (unconfoundedness) 。非 混 杂 性 也 称
为 条 件 独 立 性 (conditional independence)或 根 据 观 测 变 量 进 行 的 选 择 (selection
on observables),
是 指 控 制 观 测 变 量 X,.后 ,
个体干预状态的分配不依赖于潜在
结 果 ,个 体 到 底 在 干 预 组 还 是 在 控 制 组 是 独 立 于 潜 在 结 果 的 。非 混 杂 性 可 以 表
示为:

(Yo^Yi,) JLD,- | X, (2.3)
其 中 ,1 表 示 相 互 独 立 ,
X,.表 示 协 变 量 。式 (2.3)表 示 ,以 先 决 变 量 足 为 条 件 ,
干 预 变 量 A . 独 立 于 潜 在 结 果 以 及 潜 在 结 果 的 任 何 函 数 ,比 如 个 体 因 果
效 应 r,.也 独 立 于 干 预 变 量 认 。满 足 非 混 杂 性 的 分 配 机 制 实 际 上 排 除 了 R o y
(1951)的 选 择 模 型 ,
在 R 0y(1951)模 型 中 ,
个 体 可 以 根 据 自 己 的 潜 在 结 果 (在捕
鱼 或 狩 猎 上 的 生 产 率 )决 定 干 预 状 态 (是 进 行 捕 鱼 还 是 狩 猎 ),因 而 他 们 最 终 从
事 的 职 业 类 型 是 其 根 据 个 人 的 比 较 优 势 进 行 选 择 的 结 果 ,不 满 足 非 混 杂 性
要求。
根 据 分 配 机 制 是 否 满 足 非 混 杂 性 条 件 (2. 3 ) ,可 以 将 分 配 机 制 分 成 三 类 。
如果分配机制满足非混杂性且函数形式已知,
称 为 经 典 随 机 化 实 验 。如 果 满 足
非混杂性,
但分配机制的函数形式未知,
称 为 规 则 分 配 机 制 (regular assignment
mechanism)。其 他 机 制 为 不 规 则 机 制 (irregular assignment mechanism) „

第 四 节 潜 在 结 果 和 L o r d 悖论

有了潜在结果的概念,
对 理 清 所 要 研 究 的 因 果 问 题 、定 义 因 果 效 应 非 常 有
帮 助 。有 些 因 果 问 题 的 探 析 ,
必须从潜在结果概念出发才能搞清楚因果效应是
否 有 清 晰 的 定 义 。从 观 测 结 果 出 发 进 行 建 模 往 往 不 能 清 晰 地 表 述 所 研 究 的 因 果
效应问题,
从 而 出 现 各 种 悖 论 ^ 统 计 学 中 有 一 个 著 名 的 L o r d 悖 论 (Lord’
s Par-
adox),
这 一 悖 论 是 由 美 国 教 育 考 试 服 务 中 心 (Educational Testing Service,

① Ros e nbaum (2002)将 观 测 研 究 定 义 为 对 干 预 、政 策 或 暴 露 .和 影 响 的 一 种 经 验 研 究 。 与 实 验 不


同,
观测研究中,
调查者不能控制个体干预状态的分配。
②在完全随机化实验中, 非混杂性可以表示为(
h , •,
¥,,O J L A ,
统计学中,
非混杂性也称为可忽略
性 (ignorability)0
16 基本有用的计量经济学

E T S ) 统 计 学 家 Frederic L o r d 于 1 9 6 7 年 提 出 来 的 ,
最 终 由 同 在 E T S 工作的 另
外 两 位 统 计 学 家 Paul Ho l l a n d 和 Donald R u b i n 于 1 9 8 2 年 圆 满 解 决 。

..K

01
100 120 140 160 180
X: 1963年9月入学时的体赏
图 2. 1 Lord悖论

Lord (1967)构 造 了 一 个 假 想 的 案 例 。一 所 大 学 想 考 察 其 食 堂 膳 食 对 学 生
体重的影响以及影响的性别差异,
为此,
收 集 了 学 生 9 月份人学时的体重,
然后
次 年 6 月 份 又 获 得 了 学 生 在 校 一 学 年 后 的 体 重 。两 个 统 计 学 家 分 别 利 用 这 个
数据考察了学校食堂对学生体重的影响,
但 得 到 了 完 全 不 同 的 结 论 。第 一 个 统
计学家用了比较初等的方法,
计算了男生和女生入学时的平均体重, 分 别 是 150
磅 和 1 3 0 磅 。然 后 又 计 算 了 入 学 1 学 年 后 男 、
女生的平均体重,
发 现 仍 然 是 150
磅 和 1 3 0 磅 。因 而 ,
第一位统计学家认为学生食堂膳食对学生体重没有影响。
第二个统计学家采用了更加高等的方法— 回归分析,
他认为为了考察食堂对
学生体重的影响,
必 须 比 较 两 个 初 始 体 重 相 同 的 人 ,因 而 ,
他构造了一个回归模
型,
控制了个体人学时的体重,
并 考 察 了 性 别 的 差 异 , 回 归 结 果 表 明 ,同样体重
的男生、
女生相比,
男 生 的 体 重 增 加 更 大 ,比 女 生 平 均 高 7. 3 磅 。两 个 统 计 学 家
利用同一数据,
采用不同的方法,
得到几乎相反的结果,
一个说无因果影响,

个说对男生的影响更大,
这 种 矛 盾 的 结 果 被 称 为 L o r d 悖 论 。那 么 ,
这两个统计
学家的分析,
哪 一 个 正 确 呢 ?我 们 首 先 用 R u b i n 因 果 模 型 的 框 架 套 用 到 该 问 题
上,
见 表 2.2:
第二章潛在结果框架 17

表 2 . : 1 L o r d 悖论问题的基本构件

研究设计:
总‘
体 某 大 学 19G3— 1 9 6 4 学 年 全 部 学 生
积极干预 学校食堂膳食
控制干预 ?

干预变量 对所有的学生,
均 有 D, = 1

变量:
G 性 别 (1 = 男 生 ,2 = 女 生 )
X 1963年 9 月入学时的体重
Y 1964年 6 月放假时的体重

表 2. 2 中 的 问 号 (?)表 示 ,
尽管积极干预是非常清晰的^ ■ 学校食堂膳食,
它对学生体重的影响是想研究的问题,
但没有清晰的控制干预,
不在学校食堂
吃饭时是在家吃饭还是在外下馆子,
我 们 不 清 楚 。这 意 味 着 潜 在 结 果 Y 。的定
义是模糊的,
这 一 点 是 解 决 L o r d 悖 论 的 关 键 。h 表 示 1 9 6 4 年 6 月份学生没在
学 校 食 堂 吃 饭 时 的 体 重 。然 而 ,
没 有 学 生 在 控 制 组 ,A. = l ,
所有学生都在学校
食 堂 吃 饭 。为 了 回 答 上 文 提 出 的 因 果 效 应 问 题 ,
必 然 要 引 入 一 些 有 关 K 的不可
检验的假设。
食 堂 膳 食 对 学 生 体 重 的 个 体 影 响 可 以 写 成 A — Y 。,对 所 有 学 生 的 平 均 影
响可以写成:
\ G = Q, i- 1,2 (2.4)
平均因果影响的性别差异为:
= (2.5)
A 也可以写成:
A = { E [ Y { | G = 1] - E[Y, | G = 2] 丨
- {EIY 0 | G = l]-£[Yo I 2]} (2.6)
第 1 个统计学家根据男女生人学前和放假后平均体重的对比得到没有影
响的结论,
他估计的参数为:
dt = E [ Y X - X \ G ^ i ] , . i= 1 ?2 (2.7)
影响的性别差异为:
d — S] —82 (2.8)
第 i 个统计学家观测到男、
女 生 开 学 和 放 假 时 的 平 均 体 重 没 有 变 化 ,即 (2. 7 ) 中
的 8 , 都 为 0 ,从 而 得 到 学 校 食 堂 膳 食 对 学 生 体 重 没 有 影 响 并 且 影 响 没 有 性 别 差
异 的 结 论 。但 是 ,
得到这一结论,
需 要 对 潜 在 结 果 Y 。施 加 一 些 假 设 ,
一个可能
18 基本有用的计量经济学

的假设是如果不在学校食堂吃饭,
学 生 的 体 重 等 于 其 人 学 时 的 体 重 ,即假设
Y0- X (2.9)
在 这 一 完 全 无 法 检 验 的 假 设 下 ,(
2. 7 ) 中 的 表 才 会 等 于 式 (2. 4 ) 中 的 平 均 因 果 效
应 参 数 么 。然 而 ,
这 一 假 设 未 必 合 理 ,不 在 学 校 吃 饭 ,
在家吃饭,
说不定体重也
会增加,
从 而 使 假 设 不 成 立 。但 就 数 据 而 言 ,
该假设实际上是无法证明的。
第 2 个 统 计 学 家 认 为 应 该 控 制 开 学 时 的 体 重 ,比 较 相 同 体 重 的 人 放 假 时 体
重 的 变 化 。因 而 ,同 样 初 始 体 重 为 X 的 个 体 ,
体重的增細为:
d i O O - EIY, - X | X , G - i], i = 1,2 (2.10)
增量的性别差异为:
8 (X) = d 1 ( X ) - d 2 (X) (2.11)
为了简单起见,
L o r d 假 设 条 件 期 望 函 数 均 为 线 性 且 男 女 生 斜 率 相 同 ,即
E[Y, |X , G = i~\ = ai+ b X , i - 1,2 (2.12)
则 <KX)可以简化为:
diX) ^ a, ~ a z (2.13)
第 2 个 统 计 学 家 将 扒 X ) 解 释 为 6 月份男生平均体重超过女生平均体重的
部分,
这一解释是正确的,
但 并 不 是 因 果 效 应 的 差 额 。 因 为 W X ) 与 (2. 4 ) 和
(2. 5)中 的 因 果 效 应 参 数 A 和 4 没 有 直 接 关 系 。但 是 ,在 一 定 的 假 设 下 ,

2 个 统 计 学 家 的 估 计 结 果 等 于 因 果 效 应 参 数 。 比如假设
Y 0 - a + bX (2.14)
假 设 (2. 14)要 求 学 生 不 在 食 堂 吃 饭 时 6 月 份 的 体 重 完 全 由 9 月 份 的 初 始 体 重
线性决定,
并 且 对 所 有 性 别 的 学 生 都 一 样 。在 这 一 假 设 下 ,
则有
E [ Y 1 — Y 。| G = H - E C Y . - Y o I G = 2]
= EiYr-a-bX | 1]-£:
[ ^ - a - 6 X 1 G = 2]
= ElY, - b X | G = 1] - ElYr -~bX | G = 2]
- E [ E [ Y , 丨X ,
G = H - b X | G = 1]
- £[E[y, | X ’
G = 2 ] - b X | G = 2]
= £ [ « ! + b X - b X | G = l 2 - E l a 2 - h b X - b X 丨G = 2]
= ax—az = 8 {X) (2.15)
第 四 行 使 用 了 全 期 望 公 式 (5. 2 ) 。所 以 ,
如 果 假 设 (2. 14)成 立 .则 第 2 个统
计 学 家 得 到 的 结 果 等 于 因 果 效 应 参 数 的 差 异 。但 假 设 (2. 14)要 求 y 。完全线 性
依赖于初始体重,
这一假设也是不可检验的。
因而,
如果要考察在食堂吃饭这一干预的影响,
必须比较两种状态下的潜
在 结 果 。本 例 中 所 有 学 生 人 学 后 都 在 食 堂 吃 饭 ,
都在干预组,
没有在控制组中
第二章潜在结果框架 19

的 个 体 ,因 而 ,
根 本 没 有 办 法 估 计 食 堂 的 因 果 影 响 ,除 非 施 加 很 强 的 假 设 。如果
假设每个个体1 学年后,
如果不去食堂吃饭,
其体重就是入学时的体重,
或平均
而言,
等于人学时的体重,
那 么 第 1 个 统 计 学 家 的 结 烯 就 是 正 确 的 。如 果 假 设
不去食堂吃饭的体重是入学时体重的线性函数,
那 么 第 2 个统计学家的结论是
正 确 的 。然 而 ,
这 些 假 设 都 不 一 定 成 立 ,因 而 ,
两个统计学家的结论可能都是错
的 。有 了 潜 在 结 果 的 概 念 ,
有利于定义清楚要识别的因果效应问题,
避 免 Lord
悖论。

第五节因果效应参数

实证研究中,
我 们 关 心 的 往 往 不 是 某 一 特 定 个 体 的 因 果 效 应 ,而 是 干 预 的
平 均 因 果 效 应 。假 设 有 N 个 个 体 ,
©用 〗
= 1 ,
"*,
^ / 表 示 。D ,.是 干预变量或原因
变 量 并 且 D ,士 { 0 ,
1 丨。个 体 因 果 效 应 为 :
r; - y , , . - y 0/, i = I,…,
N (2.16)
个体因果效应往往无法估计,
因 而 ,我 们 关 注 总 体 平 均 因 果 效 应 (Average Caus­
al Effect 或 Average Treatment Effect, A C E 或 A T E ) ,
定义为所有个体因果效
应 的 平 均 值 。它 表 示 从 总 体 中 随 机 抽 取 一 个 个 体 进 行 干 预 的 平 均 因 果 效 应 。
用公式表示为:
rATE = E [ y 1(- Y o J (2. 17)
在政策评价中,
我们更关心那些受到政策影响的个体的平均因果效应,

为干预组平均因果效应(
Average Treatment Effect for the Treated, A T T ),公
式表示为:
■^att = E[_Yu —Y 0i | Di — 1] (2. 18)
有些时候,
我们关注那些没受到政策影响的个体如果接受政策干预的话,
其 平 均 因 果 效 应 是 多 少 ,这 一 参 数 称 为 控 制 组 平 均 因 果 效 应 (Average Treat­
ment Effect for the Control,A T C ) ,
公式表示为:
rATc = E [ Y u - Y 0i | D, = 0] (2. 19)
这三个因果效应参数是政策评估中最常用的参数,
根据研究需要,
还可以
定义根据不同协变量分组的平均因果效应参数,
不同的因果效应参数回答不同
的政策问题。比如考察大学教育对个体收人的影响,
将大学教育看作一项积极
干预,
高 中 教 育 看 作 一 项 控 制 干 预 。如 果 想 知 道 大 学 教 育 对 所 有 国 民 的 平 均 影

①本书主要关注因果效应参数的识别,
因 而 ,我 们 主 要 从 总 体 的 角 度 进 行 分 析 ,
不考虑参数的抽样
分布及相关统计推断问题。
20 基本有用的计量经济学

响,
估 计 的 参 数 是 总 体 的 平 均 因 果 效 应 (A T E ) ,
它反映的是如果全部国民均接
受 大 学 教 育 相 对 于 均 接 受 高 中 教 育 全 部 国 民 的 平 均 收 人 增 长 。如 果 关 心 的 政
策问题是大学教育给接受者带来了多大程度的收人增加,
需要估计的参数是干
预 组 平 均 因 果 效 应 ( A T T ) 。如 果 想 知 道 那 些 仅 完 成 高 中 教 育 的 个 人 ,
如果他们
能够完成大学教育的话,
他们的收人将增长多少,
则需要估计的参数是控制组
平均因果效应(
A T C )。
表 2. 3 构 造 了 一 个 简 单 的 例 子 示 范 三 个 因 果 效 应 参 数 的 计 算 。假 设 一 个
总体只有4 个个体,
并 且 可 以 同 时 看 到 两 种 干 预 状 态 下 的 潜 在 结 果 (现实中 只
能 看 到 一 种 状 态 下 的 结 果 ),从 而 每 个 个 体 的 个 体 因 果 效 应 也 可 以 计 算 出 来 。
根据干预变量的取值,
前两个个体在干预组,
后两个个体在控制组。

表 2 . 3 因果效应参数

i Yu Yo,- Y, D;

1 3 0 3 1 3
2 1 1 1 1 0
3 1 0 0 0 1

4 1 1 1 0 0

首 先 计 算 总 体 平 均 因 果 效 应 (A T E ) ,它 是 所 有 个 体 因 果 效 应 的 平 均 值 ,
因而:
rATE = E C Y i ;— Y 0,.]= 3 • (1/4) + 0 • (1/4) + 1 • (1/4) + 0 • (1/4) = 1
即平均而言,
这项干预使个体结果增加1。由于前两个个体在干预组,
那么干预
组的平均因果效应为:
rATT = E [ Y U - y 0, I A- = 1] = 3 • ( 1 / 2 ) + 0 • (1/2) = 1.5
受 到 干 预 的 两 个 个 体 因 为 干 预 使 其 结 果 平 均 增 加 1. 5 。 同 样 地 ,
对于在控制组
中的两个个体,
如果他们也接受干预的话,
干预的影响为:
rATC = £:
[ y 1( - Y 0i 丨 = 0] = 1 • (1/2) + 0 • (1/2) = 0 . 5
因为在这个简单的小例子中,
我们假设可以同时观测到两种干预状态下的
潜在结果,
个 体 因 果 效 应 也 可 以 观 测 到 ,因 而 所 有 的 因 果 效 应 参 数 都 可 以 计 算
出 来 。现 实 中 ,
我们仅能观测到一种状态下的潜在结果,
对于前两个个体,
他们
在干预组,
辽= 1 ,
我 们 可 以 观 测 到 它 们 在 积 极 干 预 状 态 下 的 潜 在 结 果 Y w ,即
= h,,
但观测不到他们在控制状态下的潜在结果Y 。
,.。 当 然 也 没 有 办 法 观 测 到
或 计 算 出 他 们 的 个 体 因 果 效 应 Y。
,.。 同 样 地 ,
后两个个体在控制组,
A.
=0,
可以观测到Y 。
,,但 无 法 观 测 到 I ,,也 没 有 办 法 观 测 到 或 计 算 出 它 们 的 个
体 因 果 效 应 r,.。从 而 ,
前面计算的三个因果效应参数也没有办法计算出来了。
第二章潜在结果框架 21

首先看干预组平均因果效应:
rATT = £:
[¥„■ — | D,. = 1] = E LY u | D, 二 1] 一 E [ Y 0, | D,- = 1]
对于干预组的个体,
第 一 项 £ [ 1 , 1A. = 1]是 可 以 观 测 到 的 ,即 E[Y,. |D, = l ] -
E t Y w i L ^ l ] 。但 第 二 项 反 事 实 结 果 ID,'= 1]是 观 测 不 到 的 ,
必须通过一
定的方法将其估计出来,
才 能得到干预组平均因果效应的估计。同样的 道 理 ,
对于控制组个体,
可 以 观 测 到 E [ Y oi|D i= 0 ] ,但 观 测 不 到 E [ y 1; |Di = 0 ] , E [ Y U
ID,=0]也是需要估计的反事实结果。由 于 A T T 和 A T C 都 不 可 观 测 ,
平均因
果效应(
A T E ) 也 无 法 观 测 。因为
rATE=
= E C E C ^ - Y o , | D ,-]],使 用 全 期 望 公 式 E [ Y ] = £ [ £ [ Y | X ] ]
= E [ Y U —Y 。
,. | D,' = 1] • P r [ D r- 二 1]
+ E [ Y 1; - Y 01- I D, = 0] • PrLD, - 0]
= r An 'P r [ D ; ^ l ] + r ATC( l — P r [D , = 1 ] ) (2 , 2 0 )
在观测研究中,
我 们 仅 能 观 测 到 一 种 状 态 下 的 潜 在 结 果 。在 表 2 . 3 中 ,
列和列实际上是观测不到的,
只 能 看 到 Y,和 D , 两 列 。学 过 回 归 分 析 的 学 生
可 能 禁 不 住 想 用 H D , . 回 归 ,这 也 是 计 量 经 济 学 的 基 本 建 模 方 式 ,
用观测结
果 y,■作 为 被 解 释 变 量 ,
用 干 预 变 量 A . 作 为 解 释 变 量 。但 是 这 种 回 归 并 不 能 识
别出任何因果效应参数。比如我们建立一个简单的双变量回归模型:
Y,- - a + r D ;+£,.
根 据 初 等 计 量 经 济 学 的 知 识 ,用 一 个 容 量 为 N 的 随 机 样 本 去 估 计 上 述 简 单 回 归
模 型 , 的回归系数为:
N
2 ( u ) ( a — 乃)
--------------- (2.21)
S ( D ;- D ) 2
i- I

其中,
JV
x = ( 1 / N ) 2 _ r ;, x, = Y ,-或 _x,. = D,

当 干 预 变 量 为 二 值 时 ,可 以 证 明 回 归 系 数 等 于 干 预 组 与 控 制 组 样 本 均 值 之
差 。干 预 变 量 A . 是 二 值 的 ,
取 1 表 示 个 体 在 干 预 组 ,取 o 表 示 个 体 在 控 制 组 。
干预组样本数N , 和控制组样本数N , 可以分别表示为:
N N

N t = Y j D ', N (. = $ ] ( 1 — O,) (2.22)


i= 1 != 1

干预组和控制组观测结果的样本均值可以分别表示为:
22 基本有用的计量经济学

N N
y, = a / N . ^ D ^ , y c = a / N c) ^ a - D i)Yi (2.23)
iW /= 1

首 先 看 (2. 21)的 分 母 ,

2 ( 0 , - D ) 2 - 2 [ D f — m ( N , / N ) + ( N t/ N ) 2]
r —1 ; —1

= N r- 2 N W N + Nf / N =. N t(l - N t/N) (2.24)


则 回 归 系 数 ?& 可 以 重 新 表 述 为 :
iV V
j

2 ( A —m 2 ^ > - N f/N)r,-

r °S = N ta ~ N t/N) = N , ( l - i V f/ N ) "

自 眺 韻 . ^ fD ^ - ( l - D , . ) N f1r
NjTe N^fc \Yi

= S ed ./n ^ ci - d ^/n j y ,.
t= l

- 堂 ;( A . y , M ) - 念 ( i - A . ) y " 凡
:■
=1 i =1
N N

= ( 1/]\/,)2>;1 - ( 1 / 队 )2 ] ( 1 - 0 , . ) 1 = y ( ~ y f (2.25>
;= 1 i=l

在大样本的情况下,

f ols = y , - y f - ^ K [ y , - i d, = i ] - K[r,-1 d, = o] = rols (2.26)


产是总体回归系数,
r°ls— 般 不 能 反 映 任 何 因 果 效 应 参 数 ,除 非 施 加 一 定 的 假
设 。下 面 讨 论 总 体 回 归 系 数 i^s与 三 个 因 果 效 应 参 数 之 间 的 关 系 。
首 先 考 察 总 体 回 归 系 数 与 干 预 组 平 均 因 果 效 应 (A T T ) 之 间 的 关 系 ,由
(2. 25)(2.26)得 :
r D]5= E [Y i I D, = 1] H I A . = 0]
= E [Y U I D ; = 1] — E [Y Qi 丨 以 = 0 ]

- ECYi,- -To,- 1 Di = 1 ] + E [ y 0l- I A = 1]- 取 0,. I A = 0] (2. 27)


s------------------V------------------ ' '
-------------------------------V-------------- ' '
ATT 选择偏差
可 见 ,回 归 系 数 和 因 果 效 应 参 数 A T T 之 间 相 差 E [ Y j D , . = l] — £:
[YcJA =
0],
它表示干预组和控制组个体在控制状态下的潜在结果差异,
也称为基线潜
在 结 果 差 异 (difference in baseline potential outcomes) 0 如 果 没 有 实 施 干 预 状
态下,
两组个体潜在结果就有显著差异,
那么在干预状态下两组结果的差别就
不 完 全 是 由 干 预 造 成 的 ,即 用 回 归 结 果 估 计 干 预 组 平 均 因 果 效 应 会 有 偏 差 。这
第二章潜在结果框架 23

一 偏 差 通 常 称 为 选 择 偏 差 (selection bias) 0 (2. 27)也 说 明 ,


如果选择偏差为零,
则 回 归 系 数 就 是 干 预 组 平 均 因 果 效 应 。 因 而 ,回 归 系 数 就 是 A T T 当 且 仅 当 ,
E [ Y oi | D, = 1] = E C Y oi | 0] (2. 28)
观察假设(
2. 28) ,
左 边 是 反 事 实 结 果 表 示 干 预 组 个 体 在 未 干 预
状态下的潜在结果,
是 观 测 不 到 的 。但 在 假 设 (
2. 28)下 ,
可以用控制组的观测
结 果 扛 4 也 = 0 ] 来 代 替 干 预 组 的 反 事 实 结 果 £:
[匕丨0,_ = 1],从而两组观测
结果均值之差就是干预组平均因果效应,

^att— E[Yu — y 0i | D, = 1] = E [Y u | D ;= 1] ~ E [ y 0l- | D, = 1]
- ELY1; I D i = 1 ] - E [Y 0i I A = 0]
| D,. = i]-£[r,. | D ; = 0]
= r oIs

比如教育收益率的例子,
大学教育和高中教育两组个体收人相比较,
如果大学
教育具有正向选择性,
潜在收人高的个体倾向于选择上大学,
那么,
上大学的个
体即使仅完成高中教育,
他 们 的 收 人 也 会 比 高 中 组 来 得 高 。两 组 个 体 观 测 收 入
平均值之差就不能解释为大学教育对个人收入的因果影响,
选 择 偏 差 为 正 ,回
归系数将高估教育对收人的影响。 如果两组个体在受高中教育状态下的潜在
收 人 相 似 ,满 足 假 设 (2. 2 8 ),则 回 归 系 数 就 是 大 学 教 育 对 个 体 收 人 的 影 响
(ATT)。
'
类似地,
总 体 回 归 系 数 也 不 是 控 制 组 平 均 因 果 效 应 (A T C ) 。
r0,s= E l Y i | D, = 1 ] - E [ Y , | D, = 0]
= E [ Y U | D ;= 1 ] - E [ y 0/ ! A = 0]
= E L Y U - Y 0i \ D, = 0] + E I Y U I D ; = 1] — E [ Y U [ D, = 0] (2. 29)
、m Y 4 、 一 V ,
ATC 选择偏差
只 有 施 加 下 列 假 设 ,回 归 系 数 才 等 于 A T C ,
E [ Y U | D,. - 1] = E [ Y U I D ; 二 0] (2. 30)
总体回归系数通常也不是平均因果效应(
ATE),
r0,s= E l Y u ~ Y 0i^ - h E [ Y 0i | D, = 1] — E [ Y 0i 丨D,. = 0] + {1 — Pr[D,- = 1]}
v ' ' Y .
ATE 选择偏差

‘{ E \ Y u - Y 0l I D, = I D,. = 0]} (2. 31)


两俎因果效应差异
只 有 同 时 施 加 假 设 (2. 28)和 假 设 (2. 30)时 ,
总体回归系数才可解释为总体平均
因果效应。
在后面章节的学习中,
会 发 现 假 设 (2. 28)和 假 设 (2. 30)很 有 用 。很 多 情 况
下,
通过合理的设计,
可以保证这两个条件或其中之一满足,
从而可以利用回归
24 基本有甩的计量经济学

方法获得相关因果效应参数的估计。

第六节总 结

本章主要介绍了潜在结果的三个基本要件:
潜在结果、
稳定性假设和分配
机 制 。潜 在 结 果 的 概 念 使 因 果 效 应 的 定 义 非 常 清 晰 。 因 果 推 断 主 要 对 潜 在 结
果建模,
而 不 是 根 据 观 测 结 果 建 模 。稳 定 性 假 设 是 因 果 推 断 的 一 个 技 术 性 简
化,
在考察的对象可能存在着交互影响时,
可以选择合适的个体定义,
从而使稳
定 性 假 设 得 到 满 足 。 比 如 考 察 班 级 规 模 对 学 生 成 绩 的 影 响 ,由 于 同 一 班 级 不 同
学 生 之 间 可 能 存 在 外 溢 效 应 (peer effect),
如果个体是单个学生,
可能不满足稳
定 性 假 设 。但 如 果 将 研 究 对 象 定 义 为 班 级 ,
则不同班级之间可能不存在交互影
响,
稳 定 性 假 设 就 会 成 立 。分 配 机 制 决 定 了 个 体 哪 个 潜 在 结 果 实 现 ,
可以被观
测 到 。根 据 分 配 机 制 的 特 征 ,
可以将分配机制分成三类:
随机化机制、
规则 机 制
和 不 规 则 机 制 。对 后 两 种 机 制 ,
计量经济学中分别称为根据观测变量的选择机
制 (selection on observables)和 根 据 未 观 测 变 量 的 选 择 机 制 (selection on unob-
servables)。在 因 果 推 断 中 ,
必 须 对 个 体 分 配 机 制 进 行 深 人 分 析 ,才 能 作 出 科 学
的 推 断 。如 果 干 预 为 二 值 变 量 ,
简单回归系数实际是两组个体的观测结果平均
值 差 异 。通 常 情 况 下 ,
总体.回 归 系 数 不 能 解 释 为 任 何 因 果 效 应 参 数 。但 在 一 定
的 假 设 条 件 下 ,回 归 系 数 会 有 因 果 效 应 的 解 释 。对 于 这 一 点 ,
第五章还会详细
讨论。
需要注意的是,
潜在结果框架仅关注因果效应,
不能说明变量之间的影响
机 制 ,因 果 效 应 是 一 个 “黑 箱 ”,只 能 给 出 因 果 效 应 的 大 小 ,
不能给出产生这一因
果 效 应 的 内 在 机 制 (H e c k m a n ,2001,2010;Rucker et al.,2010)。

推荐阅读
Imbens and Rubin (2015)第 1 章和 M o r g a n and Winship (2015)第 2 章对
潜 在 结 果 框 架 有 一 个 很 妤 的 介 绍 。N e y m a n (1923,1990)首 次 在 农 业 随 机 化 实
验中引入了潜在结果的概念,
Rubin (1974)重 新 独 立 提 出 了 潜 在 结 果 的 概 念 并
且 推 广 到 观 测 研 究 中 ,可 以 参 考 阅 读 。
第三章随机化实验

本章主要介绍随机化实验的作用以及为什么随机化实验可以消除选择偏
差 (selection bias)。在 实 验 中 ,
研究者可以控制个体的干预状态,
研究者可以通
过 一 定 的 机 制 决 定 哪 个 个 体 进 入 干 预 组 ,哪 个 个 体 进 入 控 制 组 。 随 机 化 实 验
中,
干 预 状 态 可 以 通 过 一 定 的 随 机 机 制 实 现 ,比 如 利 用 投 硬 币 的 方 式 ,
正面去干
预组,
反面去控制组,
每 个 个 体 均 有 1 / 2 的 可 能 性 进 人 干 预 组 和 控 制 组 。因 而 ,
随机化实验中,
研究者知道随机机制及分配概率。

第一节随机化实验的作用

随 机 化 实 验 是 因 果 推 断 的 黄 金 标 准 (Rubin, 200 8 ;Imbens and W o o l ­


dridge, 2009; Angrist and Pischke, 2 009),
是 观 测 研 究 的 基 础 。随机化实验在
统计学中不是什么新内容,
但 在 经 济 学 研 究 中 是 比 较 新 的 。近 年 来 ,
在 MIT经
济 学 教 授 Duflo和 Banerjee夫 妇 等 人 的 推 动 下 ,
成为经济政策研究的重要实证
方 法 。在 传 统 的 因 果 推 断 思 想 中 ,
尤其是自然科学的研究中,
人 们 往 往 采 用 “控
制 ”的 方 法 ,
将影响结果的所有其他因素控制住,
仅 让 关 心 的 变 量 变 化 ,看看 结
果 如 何 变 化 。这 种 情 况 下 ,
结 果 的 变 化 就 是 关 心 的 变 量 造 成 的 影 响 。比如物理
学 中 ,自 然 状 态 下 ,
铁 球 和 羽 毛 的 运 行 规 律 是 不 同 的 。物 体 的 运 动 受 到 地 球 引
力、
空气阻力、
温度、
湿度等因素的影响,
但物理学家主要关注地球引力对物体
运 动 的 影 响 。因 而 ,
他们采用控制的方法,
通过抽真空的方式,
将影响物体运动
的其他因素控制住,
发 现 铁 球 和 羽 毛 的 运 行 规 律 相 同 。经 济 学 家 在 进 行 因 果 推
断时,
也 经 常 采 用 “控 制 ”方 法 ,
计 量 经 济 学 所 讲 的 “其 他 变 量 保 持 不 变 ”(Ceteds
paribus)实 际 就 是 控 制 方 法 。保 持 其 他 变 量 相 同 ,
这一变量变化造成的结果变
化 即 因 果 影 响 。随 机 化 实 验 采 用 不 同 的 思 路 ,它 不 要 求 将 所 有 其 他 影 响 因 素 控
制住,
只 要 求 干 预 分 配 是 随 机 化 的 。随 机 化 的 分 配 机 制 可 以 帮 助 排 除 其 他 因 素
的影响,
这 是 与 “控 制 法 ”完 全 不 同 的 一 种 思 维 方 式 。
Fisher (1935)在 其 经 典 著 作 《实 验 设 计 》中 首 次 提 出 了 “随 机 化 实 验 ”的思
想,
指 出 我 们 不 必 控 制 其 他 变 量 差 异 ,现 实 中 也 没 有 办 法 完 全 控 制 所 有 的 其 他
变量,
只 要 让 随 机 机 制 决 定 干 预 变 量 的 分 配 ,就 可 以 获 得 正 确 的 因 果 效 应 。随
26 基本有用的计量经济学

机 化 的 好 处 在 于 不 需 要 控 制 其 他 的 可 能 影 响 因 素 ,因 为 我 们 关 心 的 原 因 变 量 取
值是随机化的,
从而使干预组和控制组两组个体的其他影响因素差异都是偶然
性的,
两组个体结果变量的比较,
就 是 该 原 因 变 量 对 结 果 变 量 的 影 响 。 回到教
育收益率的例子,
假设可以做随机化实验,
考 察 大 学 教 育 D 对 个 人 收 人 Y 的影
响 。对 于 一 个 特 定 总 体 ,
对 他 们 的 教 育 进 行 随 机 化 分 配 ,比 如 通 过 投 均 勻 硬 币
的方式,
正面让他接受大学教育,
反 面 就 只 让 他 完 成 高 中 教 育 。如 果 可 以 完 成
这样一个假想的随机化实验,
那么,
直接比较这两类人的收人就可以得到大学
教 育 对 个 人 收 人 的 平 均 因 果 效 应 。尽 管 这 两 组 个 体 除 随 机 化 赋 值 的 教 育 变 量
外,
在 其 他 方 面 ,比 如 能 力 、家 庭 背 景 等 可 能 仍 然 存 在 着 差 异 ,
但这种差异是随
机 性 的 ,由“随 机 定 律 ”控 制 ,
不 会 影 响 估 计 结 果 。用 经 典 计 量 经 济 学 的 语 言 表
述,
可以构建下列模型:
log(Y, ) = 爲 + 热D,+e,.
其中左边是对数收入,
右 边 是 教 育 变 量 D,.,e,.为 其 他 影 响 因 素 。尽 管 还 有 很 多
其他影响收人的因素,
但 教 育 变 量 D,.的 取 值 是 随 机 化 的 ,
与 其 他 未 观 测 因 素 e,.
(其 他 影 响 收 人 的 因 素 )不 相 关 ,满 足 经 典 线 性 回 归 模 型 的 基 本 假 设 ,因而可以
得到教育收益率A 的一致估计。
随机化的关键作用是可以平衡两组个体其他因素的分布,
®使 得 两 组 个 体
的 各 协 变 量 (包 括 可 观 测 变 量 和 未 观 测 变 量 )具 有 相 同 的 分 布 。 比 如 ,
前面教育
变 量 如 果 是 随 机 化 取 值 (简 单 起 见 ,
假 设 仅 取 二 值 :大 学 教 育 或 高 中 教 育 ),
尽管
影响收人的因素还有能力等变量,
但通过随机化分配,
使得接受大学教育和高
中教育的这两组群体,
除教育变量之外,
其他特征在统计分布意义上都非常相
似,
包括可观测的和不可观测的变量,
如 年 龄 ,能 力 等 。随 机 化 实 验 的 作 用 就 是
使 (除 原 因 变 量 之 外 的 )因 素 能 够 分 布 平 衡 ,
从而使得两组个体具有可比性。
下 面 看 一 个 随 机 化 实 验 的 例 子 ,美 国 国 家 支 持 工 作 示 范 项 目 (National
Supported W o r k Demonstration, N S W )是美 国 在 1975— 1980 年 实 施 的 一 项 随
机化实验,
该实验的主要目的是考察职业培训对个体收人等方面的影响。

例 3 . 1 ( 美国国家支持工作示范项目) 美国国家支持工作示范项目主要针
对服务业女性和建筑业男性中的低收入群体,
通常地方管理机构选择符合资格
的人员,
然 后 随 机 分 配 到 干 预 组 接 受 培 训 或 分 配 到 控 制 组 不 进 行 任 何 干 预 。干
预 组 个 体 会 得 到 N S W 项 目 的 资 助 以 参 加 培 训 ,控 制 组 个 体 没 有 受 到 N S W 的
干预,
仍 然 从 事 原 有 的 职 业 。下 面 的 数 据 来 自 于 Dehejia and W a h b a (1999) ,

①这些因紫应该是在干预分配之前已经确定的变量,
不受干预变量的影响,
通 常 称 为 协 变 fi:。
第三章随机化实验 27

含 1975年 1 2 月进入N S W 项目、


1 9 7 8 年 1 月 离 开 N S W 项目随机化实验的男
性 。 因 为 个 体 是 19乃 年 1 2 月 进 入 实 验 ,因 而 ,
1 9 7 4 年 和 1 9 7 5 年 的 收 入 是干 预
前 变 量 ,没 有 受 到 培 训 的 影 响 。1 9 7 8 年 收 入 是 参 与 N S W 项 目 培 训 后 的 结 果 ,
受 到 N S W •项 目 培 训 的 影 响 。数 据 共 有 3 7 0 个 ,
其 中 1 8 5 人 在 干 预 组 ,另 外 185
人 在 控 制 组 。相 关 协 变 量 数 据 见 表 3. 1 。表 3. 1 显 示 ,千 预 组 和 控 制 组 两 组 个
体的先决变量平均值和分布非常相似。

表 3 .1 N S W 实 验 协变量统 计 表

协变量 干预状态 均值 25 K 5 0% 7b%

年龄 干预组 2 5 .8 2 20 25 29
控制 组 2 5 .7 0 20 25 29
教育 干预组 1 0 .3 5 9 11 12
控制组 10. 19 9 10 11

协变量 干预状态 均值 Percent $ 0

1 9 7 4 年收人 干预组 2096 71%


控制组 2009 75%
1975年收人 干预组 1532 60%
控制组 1485 64%

协变量 干预状态 Percent

Black 干预组 84 %
控制组 85 %
Hispanic 干预组 6%
控制组 s%
Married 干预组 19%
控制组 20%
No High School 干预组 71%
Degree 控制 组 77%

表 3. 1 首 先 说 明 ,随 机 化 可 以 产 生 相 对 可 比 的 干 预 组 和 控 制 组 ;其 次 表 3, 1
中 的 8 个 协 变 量 没 有 影 响 干 预 状 态 的 分 配 ,即 N S W 项 目 组 没 有 根 据 这 8 个变
量决定个体是否进人干预组,
这 一 点 很 重 要 。这 8 个 变 量 不 是 通 过 人 为 方 式 进
行平衡的,
而是通过干预状态的随机化分配达到的,
这使我们有理由相信两组
个 体 的 未 观 测 特 征 也 是 平 衡 的 。 当 然 ,两 组 个 体 特 征 并 不 是 完 全 相 同 ,
这种差
异是由随机化机制造成的,
在统计上一般是不显著的。

例 3 .2 (美国田纳西州教育实验(
ST A R )项 目 ) 为 了考 察 学校的班级规模
28 基本有用的计量经济学

与 学 生 学 习 效 果 的 关 系 ,1985— 1 9 8 9 年 ,田 纳 西 州 开 展 了 一 项 为 期 4 年的教育
改 革 随 机 化 实 验 ,称 为 学 生 教 师 成 就 率 项 目 ,筒 称 S T A R ( Student/Teacher
Achievement Ratio)项 目 》1985— 1 9 8 6 学 年 开 始 ,
7 9 个学校的幼儿园学生和教
师 被 随 机 分 配 到 三 种 规 模 的 班 级 :小 班 (13— 1 7 个 学 生 )、正 常 班 (22— 2 5 个学
生)和 正 常 / 辅 导 班 (22— 2 5 个 学 生 加 上 一 个 全 职 辅 导 老 师 )。每 年 大 约 6000—
7000名学生参与项目,
4 年 共 11600名学生参与。项目要求参与学校每种类型
的 班 级 至 少 有 一 个 班 ,随 机 化 分 配 是 在 学 校 内 部 进 行 的 ,
每学年学期末会进行
一次标准化的考试以检验学生学习效果。

表 3.2 STAR实验两组特征比较

班级规模 两组特征相等
变量
小班 正常 班 正 常 /辅 导 班 的々值

是否提供免费午餐 0.47 0.48 0. 50 0 .0 9

白 人 /亚 裔 0. 68 0.67 0. 66 0. 26
1985年时年龄 5. 44 5 .4 3 5. 42 0. 32

流失率 0. 49 0. 52 0 .5 3 0. 02

班级规模 15. 10 2 2.4 0 2 2,8 0 0 .0 0

成绩 54. 70 48. 90 50 .0 0 0.00


注:
摘自 Krueg er ( 1 9 9 9 ) 表 I 。

表 3. 2 给 出 了 三 种 班 级 的 主 要 特 征 变 量 和 分 数 的 比 较 统 计 。表 3. 2 显 示 ,
前三个协变量基本相似: 是否提供免费午餐、 种 族 、年 龄 分 布 。但 流 失 率 有 较 大
差异,
小班流失率低,
而正常班的流失率会高一些,
在分析时需要考虑这一点。
不过,
表 3. 2 提 供 了 与 表 3. 1 相 似 的 信 息 ,
如果干预是随机化分配的,
那么,

同组特征将非常相似,
从而具有可比性。

第二节随机化实验与选择偏差

在随机化实验中,
干 预 状 态 是 随 机 化 分 配 的 。这 意 味 着 ,
对于每一个个体,
它 的 两 个 潜 在 结 果 哪 一 个 会 实 现 ,
是由分配机制随机决定的,
并且分
配 机 制 不 依 赖 于 潜 在 结 果 ,即 满 足 非 混 杂 性 :
®
( m ) JLA. (3.1)
(3. 1)表 示 潜 在 结 果 ( y u ,
y。,)与 干 预 变 量 D , 是 相 互 独 立 的 ,即 干 预 变 量 D , 的

① ill称 为 可 忽 略 性 (Rubin,2005)或 独 立 性 (Angrist and Pischke,2009) 。


第三章随机化实验 29

取值完全独立于两个潜在结果( Y w ,
>V)。

表 3. 3 随机化实验的作用

i Yu Yo;
1 ? 3 1 3
2 ? 5 1 5
3 ? 0 2 0

N —2 4 ? 0 4
JV—1 0 ? 0 0•
N 1 0 1

假设实验对象有N 个 ,
则对于这N 个个体,
潜 在 结 果 1^ 有 N 个 ,
Y u 也有
N 个 。当 利 用 随 机 化 机 制 决 定 分 配 向 量 后 ,
假 设 N , 个 个 体 进 入 了 干 预 组 ,那
么,
这 N t 个 个 体 的 Y 1;实 现 了 ,
我们可以观察到,
另 外 的 N —N , 个 个 体 的 没
有实现, 从 而 相 当 于 观 测 到 的 N ,个
我们观察不到。由于分配机制是随机化的,
是 来 自 于 N 个 I , 总 体 的 一 个 随 机 子 样 本 。同 样 地 ,
iV — iV,个 个 体 的 y 。
,实
现了,
其他的凡个7。
;没 有 实 现 ,
从 而 观 察 到 的 ^/一 凡 个 7 。
,.是来自于尺个
总 体 的 一 个 随 机 子 样 本 。假 设 i V 足 够 大 ,由 大 数 定 律 ,
样本信息近似于总体信
息,
从而,
我们有:

F, (3.2)

n ^ S - ^ E [ Y 0l] (3.3)

因而,
在随机化实验中,
两 组 观 测 结 果 的 平 均 值 之 差 (或 回 归 系 数 )将 趋 近 于 总
体 平 均 因 果 效 应 ,即

严 ^ y , ~ Y c^ rATE = E [ Y U -Yo,-] (3,4)


随机化实验可以消除选择偏差,
为 什 么 ? 因 为 可 以 随 机 化 分 配 ,(3. 1)意味
着下列两式成立:
E [ Y 0i I D, ^ 1] = E [ Y 0i \ Di ^ 0] (3. 5)
ELYu I D, - 1] - E [ Y U | D, = 0] (3. 6)
从而,
选择偏差 E [ y 0l- E [ y 0l | D , = 0] —0 o
因而,
在随机化实验中,
两组观测结果之差为:
取 . | D ; = l ] - £ :[y,- | D,. = 0]
= E l Y u - Y Q! | D ; = l ] + £ :
[ y 0, I D t - 1 ] - E [ y 0, 丨D, - 0]
30 基本有用的计量经济学

= E [ Y U - Y 0i | D ; = 1]
= E [ Y ];- Y 0/] (因 为 潜 在 结 果 独 立 于 干 预 变 量 A.)
事实上,
两 组 观 测 结 果 之 差 ?dif反 映 的 是 变 量 D ; 和 观 测 结 果 之 间 的 相 关
性,
因而,
在 随 机 化 实 验 中 ,相 关 关 系 就 是 因 果 关 系 ,下 面 的 式 子 说 明 了 上 述
结论。
Cov(D,-,y,.)= E [ D , y , ] - E [ D , M Y ;]
- E [ y ; I D ; = 1] . .E[Y] ( 其中 f = P r [ D f = 1])
= E[Y, \ D t = l]- p - p 2 » E [ Y ; | D, - 1]
一 汐 j D i - 0]
= p i l - p ) { E \ Y i | D,. = 1] ~ E [ Y ; | D, - 0]}
整理一下,

r dif= £:[Y,- i D, = 1 1 - E L Y , | D, 0]

_ Cov(D,-,y,) _ C o v ( D ;,y ;)
(3.7)
p(l —p) VarCD,)
其中,
Var(D,) = E [ D f ] - E 2[ D ;] = p - p z = p ( l ~ p )
(3. 7)实 际 上 是 Y,.对 认 的 总 体 回 归 系 数 ,因 而 ,
两 组 观 测 结 果 平 均 值 之 差 f dif
实 际 是 I 对 D,•的 样 本 回 归 系 数 。这 说 明 ,
在随机化实验中,
线性回归可以得到
因果效应的解释。

第三节随机化实验的分类

在经典的随机化实验中,
个体干预状态是随机化分配的,
分配不依赖于个
体的潜在结果,
并 且 分 配 概 率 是 已 知 的 。根 据 分 配 机 制 的 设 定 不 同 ,
可以分成
四类:
伯努利实验(
Bernoulli Trials) 、完 全 随 机 化 实 验 (completely randomized
experiments) 、
分 层 随 机 化 实 验 (stratified randomized experiments) 、配 对 随 机
化实验(
paired randomized experiments) 0
在伯努利实验中,
可 以 利 用 投 硬 币 方 式 决 定 每 个 个 体 的 干 预 状 态 。如果是
均勻硬币,
则 每 个 个 体 进 人 干 预 组 的 可 能 性 为 1/2,
硬 币 也 可 以 是 不 均 匀 的 ,比
如 每 个 个 体 进 入 干 预 组 的 可 能 性 可 以 是 1/3。如 果 实 验 总 体 共 有 i V 个 ,
则分配
向 量 共 有 2W 种 。分 配 向 量 是 描 述 个 体 干 预 状 态 的 向 量 D 。假 设 我 们 的 实 验 总
体为2,
那么,
在伯努利实验中,
共 有 4 种可能的分配向量,
分别是:
第三章随机化实验 31

即 两 个 个 体 均 在 控 制 组 ,一 个 在 控 制 组 、一 个 在 干 预 组 ,一 个 在 干 预 组 、一 个 在
控制组,
两 个 个 体 均 在 干 预 组 这 四 种 情 况 。在 伯 努 力 随 机 化 实 验 中 ,
可能会出
现所有个体均在干预组或控制组的情况,
尽管当实验个体数目较大时,
全部个
体在干预组或控制组的概率很低,
但 仍 然 有 出 现 的 可 能 。当 所 有 个 体 均 在 干 预
组或控制组时,
就 没 有 办 法 通 过 两 组 个 体 结 果 的 比 较 进 行 因 果 推 断 。这 是 伯 努
利实验的一个主要缺点。
为 了 克 服 伯 努 利 实 验 的 缺 陷 ,我 们 可 以 事 先 设 定 一 个 固 定 的 干 预 个 体 数
凡 ,
© 其 余 i V _ N (个个体进人控制组,
这种方式的随机化实验称为完全随机化
实 验 。完 全 随 机 化 实 验 是 比 较 常 见 的 随 机 化 实 验 。在 完 全 随 机 化 实 验 中 ,
分配
向量共有C;
J 个 。假 设 实 验 对 象 有 4 个 ,
设定 其 中 2 个进入干预组,
另 外 2 个进
人控制组,
则 共 有 6 个可能的分配向量,
分别是:
i 丄 丄 u u 0
1 0 0 1 1 0
D 6 > > >
0 1 0丨 1丨 0 1
0 0 1 0 1 1
假设在随机化实验中,
某 些 个 体 特 征 或 变 量 X 对 潜 在 结 果 有 重 要 影 响 。这
时,
可以首先根据特征X 进行分层,
然而在层内再实施完全随机化实验,
这种实
验称为分层随机化实验。比如,
一 个 6 人的总体,
男性4 人,
女 性 2 人 。 因为性
别 可 能 对 潜 在 结 果 有 重 要 影 响 ,我 们 可 以 首 先 根 据 性 别 进 行 分 层 ,
然后再分别
对 男 性 和 女 性 进 行 完 全 随 机 化 实 验 。 比 如 ,男 、女 性 均 有 一 半 的 个 体 进 人 干 预
组,
这 时 分 配 向 量 共 有 = 个 ,分 别 是 :
■r i -_r u 0 u
l 0 l 1 0
0 l 0 l 0 1
0 l 0 1 1
l l l l 1 1
n n o 0
d e
i— _ r _r u 0
l 0 l 1 0
0 l 0 i 1
0 l 0 1 1
0 0 0 0
i i i 1 1 1

①如何确定干预个体数,
取决于实验设计和研究预算,
具 体 方 法 可 以 参 见 Duflo et al. (2008) 0
32 基本有用的计量经济学

有一种特殊的分层随机化实验,
称 为 配 对 随 机 化 实 验 。在 这 种 随 机 化 实 验
中,
根据某个特征,
将 所 有 个 体 分 成 iV/2组 (iV为 偶 数 ),
每组只有2 个个体,

且两个个体随机化分配,
1 个在干预组,
1 个在控制组。
四种随机化实验的主要差别在于对干预向量的限制,
表 3. 4 给 出 了 上 述 4
种 随 机 化 实 验 的 比 较 。表 3. 4 中 ,
完全随机化实验假设一半的个体进人干预
组,
分层随机化实验假设分成两层,
每层个体数各一半,
并且每层内有一半个体
进 入 干 预 组 。可 以 看 出 ,
这四种经典随机化实验的主要差异在于分配向量的多
少不同,
越向下,
对实验施加的限制就越多,
从 而 分 配 向 量 就 越 少 。当 实 验 个 体
数 增 加 到 3 2 时 ,即 使 是 限 制 最 强 的 配 对 随 机 化 实 验 ,
它的分配向量数也超过了
6 万 个 。因 此 ,
在 真 正 的 随 机 化 实 验 中 ,可 能 没 有 办 法 将 所 有 的 分 配 向 量 写 出
来 。现 实 中 ,
完 全 随 机 化 实 验 和 分 层 随 机 化 实 验 是 比 较 常 用 的 。还 有 其 他 类 型
的随机化实验,
这里不再详述。

表 3 . 4 四种经典随机实验的分配向量数目对照表

样本容量
实验类型 分配向量数目 ----------------------------- -
4 8 16
2 ,V
伯努利实验 16 256 65536 4. 2 X 1 0 3

完全随机化实验 c r 6 70 12870 0. 6 X 1 0 °

分层随机化实验 4 36 4900 0. 2 X 1 0 9

配对随机化实验 zN/2 4 16 256 65536

第四节随机化实验的分析

在随机化实验中,
干预变量A 独立于潜在结果,
从而消除了选择偏差,
使
干预组和控制组观测结果之差等于总体平均因果效应。因 而 ,
如果数据来自于
随机化实验,
那 么 因 果 效 应 的 分 析 非 常 简 单 。我 们 主 要 分 析 完 全 随 机 化 实 验 、
分层随机化实验和配对随机化实验所得数据。
首先,
如果数据来自于完全随机化实验,
假 设 iV个 个 体 ,
N , 个接受干预,
K 个为控制干预, + 这时,
两组观测结果之差就是平均因果效应,
即 rdif是 rATK的 无 偏 估 计 量 ,
其中,
f dif = y, - y f
r ATK = E D ^ , ] m , . ]
并 且 f dif的 方 差 可 以 用 下 列 式 子 估 计 :
第三章随机化实验 33

— _ = 务 + 务 (3.8)

其中,

卜 ] ‘


丄/ : D 广 。 iy t 1 i , Di = l

因而,
如 果 数 据 来 自 于 完 全 随 机 化 实 验 ,因 果 效 应 的 估 计 非 常 简 单 ,干预组
和 控 制 组 观 测 结 果 之 差 f dif即 是 平 均 因 果 效 应 的 无 偏 估 计 。 当 然 ,
也可以使用
线 性 回 归 分 析 。上 一 章 我 们 已 经 证 明 (
参 见 (2.26)式 ),
观 测 结 果 y ,.对 干 预 变 量
D , 的 简 单 回 归 系 数 f°ls实 际 上 等 于 两 组 观 测 结 果 平 均 值 之 差 P if。 因 而 ,
对于完
全随机化实验数据,
我 们 可 以 采 用 简 单 线 性 回 归 方 法 ,回 归 系 数 0 s将 是 总 体 平
均 因 果 效 应 r.vrE m 无 偏 估 计 量 。
在线性回归分析中通常施加一个关键假设,
零条件均值假设或正确模型设
定 假 设 (洪 永 森 ,
2011),
要求以解释变量为条件,
误 差 项 的 条 件 期 望 值 为 零 ,即
E [ £i|D,] = 0 o 在 应 用 中 ,
这一假设无法检验,
也无法保证,
但是在随机化实验
中,
这 一 条 件 可 以 得 到 保 证 。下 面 进 行 简 单 推 导 以 证 明 这 一 点 。
首先,
观 测 结 果 ■ 可 以 用 潜 在 结 果 和 干 预 变 量 表 示 ,即
Y ;= D iY u + ( l - D i)Y0i
^ Y 0l-h(Yli- Y 0,)Di
= or+ tate D,- +£/ (3. 9)
其中 a = £ [ Y 。
,.], Y fl,.— rATE)。注 意 ,
误差项可以写成:
(Y;- a 如果 1 ^ = 0
£, — | , (3.10)
— cr — rATE 如果 D, — 1

E[e,. | D ;= 0 ] = E [ Y ;—a | D,. = 0] = E [ Y 0i | D ;= 0] — o;= 0
£[e,. | Di — 1 ] = E [ Y ;—a~~ rATE I D,. — 1]
^ 丨; I Di = 1] — a— r A TE = 0
上面两式的推导均运用了完全随机化实验的基本特征,
干预分配独立于潜在结
果 ,即(
3.1)式 。 因 而 ,
在 完 全 随 机 化 实 验 中 ,回 归 方 程 (3. 9 )总 是 满 足 零 条 件 期
望 假 设 £[e,.|I^] = 0 。在 完 全 随 机 化 实 验 中 ,
这一条件并不是假设,
它的成立完
全 来 自 于 分 配 机 制 的 随 机 化 。所 以 ,对 于 来 自 于 完 全 随 机 化 实 验 的 数 据 ,
完全
可以利用线性回归进行分析,
构造下列模型:
= a + r D ;+e,
得 到 的 回 归 系 数 就 是 平 均 因 果 效 应 参 数 rATE的 无 偏 估 计 。
34 基本有用的计量经济学

完全随机化实验可以保证干预组和控制组干预前变量或协变量平衡,
但是
仍 然 会 有 一 定 的 差 异 ,当 然 这 种 差 异 是 偶 然 性 的 ,
来自于干预分配的随机化。
为了降低这种随机差异,
可 以 在 回 归 分 析 中 引 人 协 变 量 进 行 调 整 。只 是 这 时 ,
回 归 系 数 不 再 是 总 体 平 均 因 果 效 应 的 无 偏 估 计 ,而 是 一 致 估 计 。用 X i 表示干
预前变量,
完全随机化实验也可用下列回归模型进行分析:
Y, ^ a + r D ;+ X^-he, (3.11)
可以证明:
®

r ols- ^ r ATE = E [ Y 1;- Y 0;] (3. 12)


如果协变量尤对结果具有重要影响,
那么引人协变量足后,
将 提 高 f°
ls的估
计 精 度 ,降 低 估 计 标 准 误 差 。
有时,
研 究 者 希 望 引 入 干 预 变 量 A . 与 协 变 量 X,.的 交 叉 项 以 降 低 模 型 误 设 ,
进 一 步 提 高 估 计 精 度 。可 以 构 造 下 列 回 归 模 型 :
+ rD, + X S + D.iX,- — X ) y + e(. (3.13)
可以证明,
该 模 型 的 回 归 系 数 仍 然 是 总 体 平 均 因 果 效 应 rATE的 一 致 估 计 。
事实上,
在 完 全 随 机 化 实 验 中 ,函 数 形 式 并 不 重 要 ,
任何函数形式都可得到因果
效应参数的一致估计,
这也是完全随机化实验的优势之一。
如果在随机化实验中,
某 些 特 征 会 使 结 果 具 有 较 大 差 异 ,比 如 考 察 某 项 治
疗 对 病 人 的 影 响 ,由 于 男 女 生 理 差 异 ,
使治疗效果对男女性的作用有所不同,

时 性 别 因 素 是 影 响 治 疗 效 果 的 重 要 变 量 。在 设 计 随 机 化 实 验 时 ,
研究者可以针
对 男 性 和 女 性 分 别 进 行 完 全 随 机 化 实 验 ,这 种 随 机 化 实 验 称 为 分 层 随 机 化 实
验 。在 分 层 随 机 化 实 验 中 ,
首先根据某些影响潜在结果的协变量将个体进行分
层 (分 组 ),
然后在层内进行完全随机化实验,
不同层可以采用不同的干预分配
概 率 。用 表 示 作 为 分 层 依 据 的 协 变 量 ,
那么,
在 分 层 随 机 化 实 验 中 ,有下列
条件成立:
( H ) J L D ,.丨X ; (3.14)
(3. 14)称 为 非 混 杂 性 或 条 件 独 立 性 (C I A ),即 以 协 变 量 足 为 条 件 ,
潜在结果独
立 于 干 预 分 配 ,或 者 说 ,
根 据 协 变 量 X ;分 层 ,
层内是完全随机化实验,
从而相 同
足的群体中,
潜 在 结 果 是 独 立 于 干 预 变 量 的 。 因 为 层 内 是 完 全 随 机 化 实 验 ,因
而 上 文 关 于 完 全 随 机 化 实 验 的 分 析 方 法 适 用 于 层 内 因 果 效 应 的 分 析 。但 是 ,总
体平均因果效应应该如何计算?
为了表述方便,
假设共有J 层 ,
用 …,
/}表 示 个 体 f 所在的组别或

① 参 见 lmbens and Rubin (2015,p. 123) 。


第三章随机化实验 35

层 。每 层 内 进 行 完 全 随 机 化 实 验 ,
用 N , ( j ) 表示 > 层 中 接 受 干 预 个 体 的 数 量 ,
N ( » 表 示 j 层个体总数,
则 N,(y)/N())是 层 个 体 接 受 干 预 的 可 能 性 ,
也称
j

为 倾 向 指 数 (propensity score),
不 同 组 内 倾 向 指 数 可 以 不 同 。N = , 干

预 组 个 体 数 为 N, = 控 制 组 个 体 数 为 A ^ = i V —况 。总 体 平 均 因 果 效

应可以表示为: ^
^ATE = ■E[Y1,. — V"(H]
= ^ [ £ [ 7 ! , - ^ , ' 丨G f] ]
J
- J ^ E L Y V - Y 0;I G ; = i ] P r [ G , = >]

- J

= S r ATE 0 ' ) p ( > )

其 中 ,r AT E 0") = - £ [ ^ 1.-—Y oiIGi = > ] , ^0') =Pr [ G , = > ] o 根 据 矩 估 计 方 法 原 理 ,


可以用下列估计量估计总体平均因果效应:

t s(im = (3.15)

其 中 户 1,
…丄 可 以 证 明 :

r stat- ^ r ATE (3.16)


并且,

^ 錄丁 • V a rC K ,)), V arCK ,))=線 線


+

(3. 17)
对于分层随机化实验产生的数据,
也 可 以 用 回 归 分 析 方 法 进 行 分 析 ,可以
构建下列回归分析模型:
j
y, = zDi + 2 a • KG,. = j) +£,■ (3. 18)

其 中 i( • ) 为 示 性 函 数 ,
条件成立^ 1 ,
不 成 立 取 0 ,在 上 式 中 实 际 上 是 不 同 层 的
标识变量,
如 果 个 体 i 属 于 )层 ,
则 l(G,=j)取 值 1,
相当于引人了 J 个 虚 拟 变
量,
代 表 不 同 的 群 组 。上 述 回 归 实 际 上 是 一 种 饱 和 回 归 ,在 第 五 章 中 还 会 有 详
细 介 绍 。不 过 回 归 方 程 (3. 18)的 回 归 系 数 f°ls并 不 是 总 体 平 均 因 果 效 应 rATE的
一致估计,
它实际上趋近于下列参数
36 基本有用的计量经济学

^ ojCjI tate O')


f ols 上 L — (3. 19)

其中 co(j)=q(j)p(j)(l—p(j)) , Ute ( j ) ^ E l Y n —Yoi |G,.=y], q(j)=N(j)/


N , tw 不 一 定 等 于 rATE,tw 只 是 对 rATE的 近 似 。关 于 这 一
点 会 在 第 五 章 中 进 行 讨 论 。为 了 用 回 归 方 法 得 到 一 致 估 计 ,
需要构造下列回归
方程:

I 一 •樂7設 +办 -KW)
+ § 耶 . D,^1(G, = i ) - l ( G , = J) • (3.20)

可以证明(
3.20 ) r 的 O L S 回 归 系 数 ,
®

r oIs- ^ r ATE
配 对 随 机 化 实 验 是 一 种 特 殊 的 分 层 随 机 化 实 验 ,每 层 只 有 两 个 个 体 ,
这两
个个体在层内随机化分配,
一个 进 人 干 预 组 ,
一 个 进 人 控 制 组 。因 而 ,
每层内的
平 均 因 果 效 应 可 以 用 干 预 个 体 与 控 制 个 体 观 测 结 果 之 差 进 行 测 度 ,g卩f — =
K j O —K j ) ,j = l ,
…,N / 2 。总 体 平 均 因 果 效 应 可 以 用 进 行 估 计 ,

r dif = ^ i ] ^ air(;) 二 ~ Y A j ) ) - Y t- Y c (3.21)

可以建立下列回归方程进行分析:
f pa:
r(>) = r + e; (3.22)
如果引人协变量,
可以采用下列回归方程:
r - - r + ^ A x>J + y ( X ;— X) + e,- (3. 23)

①在层内为完全随机化实验,
对于完全随机化实验,
可以直接用简单回归得到总体平均因果效应
的 无 偏 估 计 。因 而 ,
在分层随机化实验中,
对 于 )层 的 个 体 ,
可以构造如下回归方程估计j 层的平均因果
效应:
y,(y) = /9 0 ') + ^ ) 0 , + e , 0 ' )
对于任意个体其观测结果可以写为:
j
y, = ^ u g ; = py.O')
J-l

= 公 (j)l(G, = j) + 2 r O ) D , l ( G , = j ) + = jk(j)
J J 3

因为 r..vn: = 所 以 ,r ( J ) = f tate 一 2<?0')^0') ] qU),将 )代 人 上 式 并 整 理 即 得

(3.20).
第三章随机化实验 37

(3. 22) (3. 23)常 数 项 即 是 对 总 体 平 均 因 果 效 应 的 估 计 。

例 3 . 3 ( N S W 数据分析} 利 用 Dehejia and Wahba_ (1999)整理的随机化实


验 数 据 (n s w 一dw. dta),筒 单 统 计 见 表 3. 1 ,
运用上文提供的分析方法,
得到的估
计 结 果 见 表 3.5;

表 3.S N S W 数据分析

参数 估计 标准误差
-dif 1794.34 670.99
(简单回归) 1794.34 670.82
(协变量) 1676.90 648.72
严(
交互项) 1632.71 646.88

第 一 行 是 两 组 平 均 结 果 之 差 ,即 = 1 - 1 = 1794. 3 4 ,标 准 误 差 为
670. 9 9 ,
说 明 接 受 培 训 的 工 人 因 为 参 加 培 训 而 受 益 ,其 平 均 收 入 会 增 加 1 7 9 4 美
元 。第 二 行 是 简 单 回 归 分 析 ,得 到 的 结 果 和 第 一 行 完 全 相 同 ,
标准误差的估计
也 相 似 ,原 因 在 于 简 单 回 归 系 数 就 是 两 组 平 均 结 果 之 差 。 第 三 行 引 入 了 协 变 量
(年 龄 、教 育 、种 族 、婚 姻 状 态 、
7 4 年收入、
7 5 年 收 入 ),这 时 ,回 归 系 数 是 总 体 平
均因果效应的一致估计,
结 果 为 1 6 7 6 . 9 0 美 元 ,与 前 两 行 估 计 结 果 差 别 不 大 ,并
且标准误有所降低,
这 也 是 引 入 协 变量 的好 处。第 四行 在第 三行 的 基础 上 ,

一步引入交互项,
估 计 模 型 (3. 23 ) ,
估 计 结 果 为 1632.71元 ,
标准误差有进一步
的降 低 。

第五节随机化实验的缺陷

随机化实验是因果推断的黄金标准,
但 也 有 缺 陷 。在 随 机 化 实 验 中 ,
参与
个 体 是 被 动 地 随 机 化 分 配 到 干 预 组 和 控 制 组 的 ,干 预 状 态 不 是 个 体 选 择 的 结
果 。随 机 化 实 验 得 到 的 结 果 只 能 解 释 为 总 体 的 平 均 因 果 效 应 。现 实 中 一 项 干
预或政策实施,
是 否 受 到 干 预 往 往 是 个 人 选 择 的 结 果 ,接 受 干 预 的 个 体 并 不 是
总体的随机样本,
他 们 的 平 均 因 果 效 应 并 不 一 定 是 总 体 平 均 因 果 效 应 。 比如考
察 大 学 教 育 对 个 人 收 入 的 影 响 ,如 果 能 进 行 随 机 化 实 验 ,则 随 机 化 实 验 得 到 的
结 果 是 总 体 上 大 学 教 育 的 平 均 收 益 率 。但 现 实 中 大 学 教 育 往 往 是 个 人 选 择 的
结果,
如果存在正向选择性,
潜在教育收益率更高的个体选择了接受大学教育,
而 收 益 率 较 低 的 没 有 选 择 接 受 大 学 教 育 。那 么 ,
现实中大学教育的平均收益率
38 基本有用的计量经济学

应该高于总体平均的教育收益率。因 而 ,
仅仅利用随机化实验得到的结果,

不 一 定 是 现 实 中 政 策 的 因 果 效 应 (H e c k m a n ,200 1 ,2010 ;Rucker et al.,
2010),
利用随机化实验进行因果推断时需要清楚这一点。

第六节总 结

本章主要介绍了随机化实验的作用以及为什么随机化实验可以消除选择
偏 差 。随 机 化 实 验 产 生 的 数 据 ,由 于 两 组 特 征 平 衡 ,可 以 直 接 用 回 归 方 法 估 计
因 果 效 应 参 数 。但 随 机 化 实 验 压 制 了 个 人 选 择 ,
提供的因果效应与现实中的政
策效应并不完全一致,
应用中需要更深人的分析,
但随机化实验的结果可以作
为一个基本的参照。

推荐阅读
参考 R o s e n b a u m (2002)第 3 章 、Imbens and Rubin (201 5 )第 4— 11 章 。
N e y m a n (1923,1990)和 Fisher (1935)是 随 机 化 实 验 的 经 典 文 献 ,可 参 考 阅 读 。

g二 二 附 录 • 女 士 叩 余

Fisher (1935)在 其 经 典 著 作 《实 验 设 计 》中 提 出 过 一 个 著 名 的 案 例 女
士 品 茶 ”。® 故 事 是 这 样 的 ,一 天 下 午 ,Fisher和 他 的 同 事 们 在 一 起 喝 下 午 茶 。
他的一位女同事说,
奶茶的味道和制作奶茶时加奶和茶水的次序有关系,
先加
牛 奶 和 先 加 茶 水 ,制 作 出 来 的 奶 茶 味 道 是 不 一 样 的 ,
大 家 对 此 议 论 纷 纷 。Fisher
深思片刻说,
我 们 可 以 做 一 个 实 验 检 验 这 一 论 断 。制 作 8 杯 奶 茶 ,其 中 4 杯先
加 牛 奶 ,另 外 4 杯 先 加 茶 水 ,然 后 随 机 给 该 女 士 品 尝 。在 这 里 ,有 关 杯 子 大 小 、
温 度 等 差 异 不 必 要 求 完 全 相 同 ,只 要 保 证 杯 子 的 排 序 是 完 全 随 机 化 的 。在《实
验 设 计 》中 ,
Fisher花 了 近 1 0 页 的 篇 幅 来 介 绍 这 一 随 机 化 实 验 的 设 计 ,并强调
随机化机制的重要性。
下 面 看 一 下 Fisher的 推 断 过 程 。 首 先 ,
假 设 该 女 士 的 说 法 是 错 误 的 ,即先
加 牛 奶 和 先 加 茶 水 ,味 道 没 有 差 异 ,
或 者 说 该 女 士 没 有 辨 别 能 力 。再 看 分 配 机

① 有 一 本 书 叫 做 《女 士 品 茶 》,
看到这本书不要以为是一本讲如何品茶的书籍,
它实际上是一本有
关统计学发展历史的书,
里面讲了很多统计学家有趣的故事,
可以找来读一读《
第三章随机化实验 39

制,
共 8 杯 奶 茶 ,随 机 选 取 4 杯 先 加 牛 奶 ,另 外 4 杯 先 加 茶 水 ,
这 样 共 有 C|==70
种 可 能 的 分 配 向 量 ,比 如 分 配 向 量 (1 ,1 ,
0 ,0 , 0 ,1 , 1 ,
0 ) 表 示 第 1 、2 、6 、7 杯为先
加 牛 奶 ,另 外 第 3 、
4、5、
8 杯 为 先 加 茶 水 。在 随 机 化 机 制 下 ,共 有 7 0 个 这 样 的 分
配 向 量 。如 果 该 女 士 没 有 辨 别 能 力 或 两 种 奶 茶 味 道 没 有 差 别 ,
那么该女士纯粹
乱 猜 ,一 次 实 验 中 ,
全 部 猜 对 的 可 能 性 为 1 / 7 0^0. 014, Fisher称 这 一 可 能 性 为
P 值 。如 果 我 们 用 该 女 士 说 对 的 杯 数 (T ) 来 作 为 统 计 量 ,
则在原假设下,
她猜对
8 杯 的 可 能 性 为 P r[ T > 8 ] = 0.014。尸 值 就 是 在 原 假 设 下 统 计 量 超 过 观 测 值 的
极端可能性,
可能性越大,
原 假 设 越 可 能 正 确 ;可 能 性 越 小 ,原 假 设 越 可 能 错 误 。
这里,
在 女 士 完 全 没 有 辨 别 能 力 的 假 设 下 ,完 全 乱 猜 ,
猜 对 的 可 能 性 只 有 1 .4% 。
如果一次实验,
她就猜对了,
说 明 她 真 的 有 辨 别 能 力 ,需 要 拒 绝 原 假 设 。
下 面 再 来 看 看 她 能 够 至 少 猜 对 6 杯 的 可 能 性 。她 不 可 能 猜 对 7 杯 ,只 要 1
杯猜错就要错2 杯^ 恰 好 猜 对 6 杯 的 可 能性是对应每种类型的奶茶均猜对3
杯,
共 1 6 种 可 能 性 ,因而,
在 她 没 有 辨 别 能 力 的 原 假 设 下 ,猜 对 至 少 6 杯的可能
性 为 P r [ T > 6 ] = 17/70;0. 2 4 ,
这 不 是 一 个 小 概 率 。 因 而 ,如 果 在 一 次 实 验 中 ,
她猜对了 6 杯 ,在 她 没 有 辨 别 能 力 的 原 假 设 下 ,出 现 猜 对 6 杯 的 可 能 性 高 达
2 4 % 。 因 而 ,猜 对 6 杯 不 足 以 证 明 她 真 的 有 辨 别 能 力 ,因 而 ,不 能 拒 绝 原 假 设 。
Fisher用 这 样 一 个 筒 单 的 随 机 化 实 验 对 该 女 士 提 出 的 命 题 进 行 了 验 证 ,发现该
女士的说法是对的。
在 这 个 例 子 中 ,也揭示出了 Fisher的 精 确 P 检 验 方 法 。Fisher精 确 P 检
验 (Fisher、 Exact P Test, F E P Test)主 要 分 成 三 个 部 分 :首 先 ,设 定 精 确 原 假
设(
sharp null hypotheses),然 后 ,
构造统计量,
最后计算精确P 值并进行推断。
Fishei•精 确 原 假 设 具 有 下 列 形 式 :
H 0 :Yi,- - , i = 1’
…,N (3.24)
即 干 预 对 所 有 个 体 均 没 有 影 响 。这 一 假 设 与 N e y m a n 的 原 假 设 不 同 ,
Neyman
关 心 的 是 平 均 效 应 是 否 为 零 ,即
H o ^EY h - Y o,-] = 0 (3.25)
有 关 Fisher精 确 P 检 验 及 N e y m a n 的 假 设 检 验 参 见 Imbens and Rubin(2015) 。
第 四 章 因 果 图

第 一 节 基 本 概 念

因 果 图 方 法 是 由 计 算 机 科 学 家 Pearl (1995,2009)提 出 的 ,
Pearl (2009)指
出因果图模型与潜在结果框架实际上是一致的,
每个因果图背后都对应一个潜
在结果模型,
但因果图方法更加直观。

图 4 . 1 因果图

因 果 图 的 基 本 构 成 要 素 包 括 点 (nodes)和 箭 头 (edges),
点表示变量,
两个变
量 乏 间 如 果 有 箭 头 连 接 ,表 示 至 少 对 总 体 中 的 一 个 个 体 两 变 量 之 间 有 因 果 关
系 。 比 如 图 4 . 1 中 三 个 点 分 别 代 表 三 个 变 量 D 、X 、
Y ,
D 和 Y 之间有箭头连接,
并且由D 指向Y ,
表 示 D 对 Y 有 因 果 影 响 ,即 至 少 对 总 体 中 的 一 个 个 体 有 D 影
响 Y 。受 D 直 接 影 响 的 变 量 Y 称 为 D 的 子 变 量 ,
受 D 间 接 影 响 的 变 量 S 称为
D 的孙变量,
直接影响Y 的变量D 称 为 Y 的父变量,
间 接 影 响 Y 的 变 量 Z 称为
Y 的 祖 变 量 。两 个 变 量 之 间 如 果 没 有 箭 头 连 接 ,
表 示 总 体 上 对 于 任 何 个 体 ,两
个变量之间均没有因果关系,
是相互独立的。
由变量X 出发,
有两个箭头分别指向D 和 称 为 D 和 Y 的共同原因
( c o m m o n c a u s e ) 称 为 D 影 响 Y 的 混 杂 因 素 (confounder) 。 图 中 有 两 个 箭
头 指 向 Y ,说 明 Y 是 D 和 X 的 共 同 结 果 (c o m m o n effect)或 交 汇 变 量 (colli­
der) ,D 是 久 和 Z 的 交 汇 变 量 D
将 两 个 变 量 连 接 起 来 即 形 成 路 径 (paths),图 中 连 接 变 量 D 和 Y 有 两 条 路
径,
分 别 是 D — Y 和 前 者 称 为 因 果 路 径 (causal path) ,
后者称 为 后 门
路 径 (backdoor path)。 因 果 路 径 是 指 由 原 因 变 量 或 干 预 变 量 D 指 向 结 果 变 量
Y 的路径,
可以是直接指向,
也 可 以 是 通 过 中 介 变 量 间 接 指 向 结 果 变 量 ,比 如 ,
第 四 章 因 果 图 41

如 果 D 到 Y 的因果路径上还有一个中介变量B ,
那么因果路径可以表示为
B —Y 。后 门 路 径 是 指 连 接 原 因 变 量 D 和 结 果 变 量 y ,
并且有指向原因变量D
的 箭 头 的 非 因 果 路 径 。图 中 路 径 D — X — Y 连 接 原 因 变 量 D 和 结 果 变 量 Y ,并
且 路 径 上 有 指 向 原 因 变 量 D 的 箭 头 ,因 而 是 后 门 路 径 。
因果图中,
变量通常按照发生的先后顺序排列,
先发生的变量在左边,
后发
生 的 变 量 在 右 边 ,比 如 图 4 . 1 中 ,
X 在 D 前发生,
D 在 Y 前 发 生 。 另 外 ,因果图
中 不 包 括 循 环 路 径 ,即 结 果 不 可 能 影 响 原 因 ,
未 来 不 可 能 影 响 现 在 。也 就 是 说 ,
图 4 . 1 中 不 可 能 出 现 Y 指 向 D 的 路 径 ,当 然 也 不 包 括 指 向 变 量 自 身 的 路 径 。 因
而 ,因 果 图 也 称 为 因 果 有 向 无 环 图 (Causal Directed Acyclic Graph, Causal
D A G )。
在画因果图时,
凡是图中变量的共同原因,
均 应 包 括 在 因 果 图 中 。影 响 变
量 的 扰 动 因 素 ,如 果 独 立 于 其 他 变 量 ,
可以不在因果图中显示。
® 图 4. 1 中 X
应 该 显 示 在 因 果 图 中 。另 外 ,影 响 Y 的 因 素 还 有
是 D 和 Y 的 共 同 原 因 ,因 而 ,
其他未观测扰动因素,
影 响 D 的 因 素 还 有 其 他 扰 动 因 素 eD ,
但这些扰动因素
均 独 立 于 其 他 变 量 ,因 而 ,
可以不出现在因果图中,
但如果某些未观测扰动因素
不 独 立 于 图 中 的 其 他 变 量 ,比 如 , 除影响Y 之外,
还会影响D ,
那 么 ,ey就是
变 量 D 和 Y 的另一个共同原因或混杂因素,
应该包括在因果图中,
此 时 ,因果
图 如 图 4, 2 所 示 :

图 4.2 因果图

第二节因果图和边际独立性

因果关系是潜在结果的比较,
如果原因变量D 对结果变量y 有因果影响,
则 有 £:
[ Y D,]关£[¥,,.],
或至少对于某些个体f有 i= l,… ,
N 。相关性

① 参 见 Pearl (2009,p. 68) .Morgan and Winship (2015 , p. 88) 0


42 基本有用的计量经济学

是观测结果的比较,
如 果 变 量 D 与 Y 相 关 ,则 有 E[Y,. 10, = 1 ] # £ :
[兄丨从=
0 ] 。® 如 果 变 量 D 对 r 有 因 果 影 响 ,
则 D 和 Y 肯定相关,
但两者相关,
则不一
定有因果关系。比如,
利用随机化实验考察培训(
£>)对 个 人 收 人 ( y ) 的 影 响 ,

果培训对个人收人有因果影响,
在 因 果 图 中 将 有 D 指 向 Y 的 因 果 路 径 。但影
响 个 人 收 入 的 还 有 很 多 其 他 影 响 因 素 ,比 如 能 力 ,
是 否 应 该 进 入 因 果 图 呢 ?不
用 。因为在随机化实验中,
原 因 变 量 D 是随机化分配的,
从而独立于其他变量,
尽管能力影响个体收人,
但能力独立于原因变量,
从而能力不会是混杂因素,

正 是 随 机 化 实 验 的 作 用 。此 时 ,因 果 图 非 常 简 单 ,只 有 D 到 Y 的 一 条 因 果 路
径,
见 图 4. 3 。因 为 D 对 Y 有 因 果 影 响 ,
那么,
两 者 肯 定 相 关 。® 当 然 ,
相反方向
不一定成立,
两 变 量 相 关 不 一 定 有 因 果 关 系 。另 外 ,因 果 关 系 是 有 向 的 ,总是原
因影响结果或原因变量指向结果变量,
而相关关系是对称的,
没有方向性,
如果
D 影 响 y , 则 d 和 y 相 关 ,当 然 ,
y 和 d 也相关。

d ---------------- - y
图 4. 3 因果图和相关性

下面看第二种情况,
见 图 4.4。为 了 便 于 描 述 ,
我们给图中的变量赋予特定
含义,
变 量 L 表示是否有抽烟行为,
变 量 D 表示是否有随身带打火机的习惯,
变 量 Y 表 示 患 肺 癌 的 风 险 。一般 认 为 ,
抽烟行为L 会导致患肺癌风险Y 增加,
因而,
L 对 Y 有 因 果 影 响 。如 果 个 人 有 抽 烟 行 为 L ,
则该个体随身带打火机的
可能性D 会更大,
从 而 抽 烟 行 为 L 直 接 影 响 个 人 是 否 随 身 携 带 打 火 机 D 。是否
携带打火机D 对个体患肺癌风险Y 没有影响,
从 而 D 和 Y 是独立的,
但在这里
两者不是不相关的。比如,
现 在 有 人 想 研 究 随 身 携 带 打 火 机 D 是否对个体肺癌
风 险 Y 有因果影响,
假设他通过抽样调查获得了 D 和 Y 的 数 据 ,
并直接利用观
测数据进行比较,
他将发现,
随机携带打火机的人,
患肺癌的可能性会更高。因
为随身携带打火机的人,
抽烟的可能性更大,
而 抽 烟 的 人 ,患 肺 癌 的 风 险 也 更
大 。尽 管 两 者 实 际 上 没 有 因 果 关 系 ,
但 观 测 数 据 显 示 两 者 具 有 相 关 性 。原因在
于,
变 量 D 和 y 有 一 个 共 同 的 原 因 L ,即 使 D 和 Y 之 间 没 有 因 果 关 系 ,
共同原
因 L 也 会 使 两 者 表 现 出 相 关 性 。共 同 原 因 L 通 常 称 为 变 量 D 到 Y 的 混 杂 因

①在第三章我们已经证明观测结果的比较反映的是相关性,
参 见 (3. 7 ) 式 。
② D 对 Y 有 因 果 影 响 ,即 ] —£ [ Y o , ] ^ 0 ,

E[y,- | D, = 1] - E [Y , I Di = 0 ] = E C Y l I D, = 1] — E l Y a I D, = 0]
= E l Y u l — £ [Y o ,-]尹 0
第二行利用了随机化实验中,
D 独 立 于 潜 在 结 果 (Y 3i,
Y W) 。从 而 说 明 , 如 果 D 对 y 有因果影响,
则两者
存在相关关系^
第 四 章 因 果 图 43

素 。混 杂 因 素 造 成 的 相 关 称 为 混 杂 偏 差 (confounding bias)。如 果 要 得 到 D 到
7 的因果影响,
必须想办法消除混杂因素L 的影响。

图 4, 4 因果图和相关性:
共同原因

再看一种情况,
见 图 4. 5 。变 量 D 和 Y 之 间 没 有 箭 头 连 接 ,
表示两者之间
没 有 直 接 的 因 果 关 系 ,但 它 们 共 同 决 定 变 量 C ,
C 称 为 变 量 D 和 Y 的共同结果
或 交 汇 变 量 。为 了 便 于 解 释 ,
假设变量D 表示民族,
Y 表示学习能力,
C 表示是
否 被 大 学 录 取 。不 同 民 族 的 学 生 智 力 分 布 总 体 上 是 差 不 多 的 ,
学习能力也不会
有太大差异,
那 么 民 族 D 和 学 习 能 力 Y ■之 间 没 有 直 接 的 因 果 关 系 。但 在 大 学
录取中,
我国有少数民族优惠政策,
少 数 民 族 学 生 会 有 一 定 的 加 分 。这 样 ,同样
高考成绩下,
少数民族学生被录取的可能性会更大,
从 而 D 会影响大学的录取
C 。当 然 ,
如果学习能力强,
高考成绩高,
那 么 被 大 学 录 取 的 可 能 性 也 更 大 。如
果一个研究者获得了民族D 、
学 习 能 力 Y ( 比 如 高 中 三 年 的 平 均 成 绩 )和 是 否 被
大学录取C 的信息,
他能否根据民族D 判 断 学 生 的 学 习 能 力 答 案 显 然 是 否
定的,
知 道 民 族 D 的 信 息 对 预 测 学 生 的 学 习 能 力 Y 没 有 任 何 帮 助 。实 际 上 ,因
果图理论告诉我们,
如果两个变量有一个共同结果,
在该路径上,
两变量就是不
相关的。

图 4 . 5 因果图和相关性:
共同结果

小结一下,
两 个 变 量 之 间 什 么 时 候 会 表 现 出 相 关 性 ? 有 两 种 情 形 :一 是两
变量具有因果关系,
则两者会有相关性,
如 图 4. 3 所 示 ;二 是 两 变 量 有 一 个 共 同
的原因,
这时即使两者没有因果关系,
也 会 表 现 出 相 关 性 。另 外 ,
如果两变量有
一个共同的结果,
但两者没有因果关系,
则两者也没有相关性。
从上文可看出,
即使没有因果关系,
如 果 有 共 同 原 因 (即 混 杂 因 素 ),
变量也
会 表 现 出 相 关 性 。那 么 ,
如何才能消除相关性,
将真正的因果关系揭示出来呢?
还 是 回 到 培 训 的 随 机 化 实 验 。前 面 提 到 培 训 D 对 个 体 收 人 Y 有 因 果 影 响 ,仔
44 基本有用的计量经济学

细考察影响机制,
培训可以增加个人的人力资本或技能H ,
而人力资本提高会
增 加 个 体 收 人 ,即 培 训 D 是 通 过 影 响 人 力 资 本 形 成 H 间 接 地 影 响 个 人 收 人 Y ,
变 量 H 称 为 中 介 变 量 (mediator) 。

D ------------ ^ 回 ------------ ^

图 4 . 6 因果图和边际独立性:
以中介变量为条件

现 在 我 们 想 知 道 ,如 果 以 中 介 变 量 H 为条件或根据变量H 将数据分层
(stratification) ,
在 层 内 D 和 y 是 否 还 有 相 关 性 ?答 案 是 否 定 的 。 图 4. 6 中 H
加了方框,
表 示 以 变 量 H 为 条 件 或 根 据 H 进 行 分 层 。培 训 D 会 影 响 个 人 的 人
力资本h ,
而 人 力 资 本 h 又 会 影 响 个 人 收 人 y 。如 果 人 力 资 本 H 相 同 ,
无论个
人是否参与了培训D ,
个人收人Y 都应该有相同的分布,
培 训 D 和个人收人Y
将 不 再 相 关 。中 介 变 量 H 阻断了 D 到 Y 的 因 果 路 径 ,
使变量D 与结果变量Y
相 互 独 立 ’即 有 乃 上 ^ 。,
1^ ) ! / / 。
再 回 到 图 4. 4 ,
现 在 考 虑 如 果 以 L 为 条 件 (即 变 量 L 加 上 方 框 ,
见 图 4. 7),
D 和 Y 是 否 还 有 相 关 性 ?答 案 也 是 否 定 的 。如 果 将 考 察 对 象 限 制 在 非 抽 烟 者
a = i ) ,
这时,
知道某个体是否携带打火机D ,
并不能预测其得肺癌的风险F 。
因为此时,
带不带打火机的两组人得肺癌风险的分布是相同的,
从而D 1 Y 丨
L。
因而,
我 们 得 到 第 二 个 结 论 :当 以 两 个 变 量 的 共 同 原 因 或 混 杂 因 素 为 条 件 时 ,

变 量 之 间 的 相 关 路 径 被 阻 断 。图 4. 7 中 ,以 L 为 条 件 , D 和 7 之 间 的 相 关 性 被
阻断。

图 4.7 因果图和边际独立性:
以共同原因为条件

下面再回到前面共同结果的例子,
见 图 4. 8 。D 和 Y 有 一 共 同 结 果 C ,
D
和 Y 之间没有直接的因果路径,
则 两 者 之 间 没 有 相 关 性 。现 在 考 察 ,
如果以共
同 结 果 C 为条件,
变 量 D 和 Y 是 否 相 关 ?还 是 回 到 具 体 的 例 子 ,
D 表示民族、
F
表示学习能力、
C 表 示 是 否 被 大 学 录 取 。如 果 现 在 以 被 大 学 录 取 为 条 件 ,民族
和学习能力之间是否表现出相关性呢?因为民族和学习能力共同决定了是否
被 大 学 录 取 ,因 而 ,
如果以大学录取为条件,
少数民族由于国家优惠政策,
其高
考 分 数 可 以 低 一 点 。如 果 研 究 者 仅 调 查 已 经 考 入 大 学 的 学 生 ,
那么,
研究者可
能发现两者存在着负相关性,
得到少数民族学生学习能力稍微差一些的错误结
第 四 章 因 果 图 45

论 。因 而 ,
如果以共同结果为条件,
蒋 打 开 路 径 D —C — 使 D 和 y 表现出相
关 性 。事 实 上 ,
如 果 以 共 同 结 果 的 结 果 为 条 件 ,同 样 也 会 打 开 相 关 路 径 ,
见 图 4.
9 o 以共同结果为条件造成估计结果的偏差,
称 为 样 本 速 择 偏 差 (sample selec-
tion bias) ,
最早由 H e c k m a n ( 1 9 7 9 ) 提 出 。


图 4. 8 因果图和边际独立性:
以共同结果为条件

^ ^ ^ 门
D Y ---------- _ C ---------- 叫 S |

图 4 . 9 因果图和边际独立性:
共同结果的结果

总结一下,
两个变量相关的情况包括:
• 一个变量是另一个变量的原因,
• 它 们 具 有 共 同 的 原 因 ,D —
• 它 们 具 有 共 同 的 结 果 (collider)并 以 结 果 为 条 件 时 ,
或以共同结果的结
果为条件时,
D — 回 一 y 或 D — C —Y
I

什么时候会阻断相关性使两变量相互独立呢?
• 以 中 介 变 量 (mediator)为 条 件 时 ,

• 以 共 同 原 因 (c o m m o n cause)为 条 件 时 ,D^-(TT}-»Y;
• 有 共 同 结 果 (collider)时 ,D — L —Y 。

第三节选择偏差和因果效应识别

两个变量之间有因果关系肯定会表现出相关性,
但 反 过 来 不 一 定 成 立 。从
上文的内容,
我 们 知 道 ,即 使 两 变 量 之 间 没 有 因 果 关 系 ,
如果它们有一个共同的
原因,
或者以它们的共同结果为条件,
两 者也会表现出相关性。因 而 ,
在利用观
测数据分析变量之间的因果关系时,
我们需要深人分析变量之间的相关性是真
正的因果关系,
还 是 由 于 共 同 原 因 或 以 共 同 结 果 为 条 件 造 成 的 相 关 性 。 由共同
46 基本有用的计量经济学

原 因 造 成 的 相 关 性 称 为 混 杂 偏 差 (confounding bias) ,由 以 共 同 结 果 为 条 件 造 成
的 相 关 性 称 为 样 本 选 择 偏 差 (sample selection bias) ,
这两种偏差统称为选择偏
差 (selection bias) D 因 而 ,
实证分析的关键就是如何消除这些选择偏差,
将真正
的因果关系识别出来。
上 文 中 提 到 的 阻 断 相 关 性 的 三 种 情 况 ,在 因 果 图 方 法 中 称 为 后 门 规 则
(back-door criteria)。Pearl (2009)证 明 因 果 效 应 可 以 通 过 以 一 些 变 量 的 集 合
Z 为 条 件 进 行 识 别 ,当 且 仅 当 所 有 的 原 因 变 量 和 结 果 变 量 之 间 的 后 门 路 径 可 以
通 过 以 Z 为 条 件 而 阻 断 。他 证 明 所 有 的 后 门 路 径 可 以 被 Z 阻 断 ,当且仅当每条
后门路径满足:
( 1 ) 包 含 一 个 中 介 路 径 A — C — _6,
其中中介变量C 6 Z ,
® 或者
(2)包含一个共同原因的路径A —C —B ,
其中C 6 Z ,
或者
( 3 ) 包含一个共同结果的路径A —C —S ,
但 共 同 结 果 C 及 所 有 C 的子孙不
在 Z 中。
利用观测数据进行实证分析时,
根据后门规则,
将所有后门路径造成的相
关性阻断之后,
两 变 量 之 间 表 现 出 的 相 关 性 就 是 两 者 之 间 的 因 果 效 应 。首 先 考
察混杂偏差,
下面我们来看几个经济学的例子:
( 1 ) 教 育 收 益 率 。劳 动 经 济 学 中 一 个 经 典 的 问 题 是 关 于 教 育 ( D )对 个 人 收
人 (y)的影响,
而个人能力(
A ) 往往会同时影响教育选择(
D ) 和个人收人0 0 ,
即个人能力04)是 教 育 ( D ) 和个 人 收 入 (Y)的 混 杂 因 素 ,
用因果图表示如下:

图 4. 1 0 显 示 ,
D 和 Y 之间有两条路径,
一 条 因 果 路 径 D —Y ,
一条后门 路 径
因而,
D 到 Y 的相关性包含了两部分,
一部分是真正的因果关系造
成的相关性,
另 一 部 分 是 由 于 混 杂 因 素 A 造 成 的 相 关 性 。为 了 得 到 真 正 的 教 育
( D ) 对 收 人 ( Y ) 的 影 响 ,只 要 想 办 法 将 后 门 路 径 造 成 的 相 关 性 阻 断 即 可 。利用
后 门 规 则 第 二 条 ,以 共 同 因 素 能 力 变 量 ( A ) 为 条 件 ,
将阻断教育和能力之间的非
因果路径。
( 2 ) 班 级 规 模 与 学 习 效 果 。在 教 育 经 济 学 中 ,
很多文献关注班级规模(
D)

①注意因果路径上的中介变量不能进人2 。
第 四 章 因 果 图 47

对 小 孩 学 习 效 果 ( y ) 的 影 响 。学 校 班 级 规 模 往 往 是 由 学 校 所 在 地 区 政 府 财 力
(A)决 定 ,
而 移 民 在 社 区 中 所 占 的 比 重 ( U ) 往 往 决 定 了 地 方 政 府 财 力 水 平 ,同时
语 言 问 题 也 影 响 到 移 民 家 庭 小 孩 的 学 习 成 绩 。 因 果 图 苋 4. 1 1 。D 到 y 同样有
两条路径:
因 果 路 径 JD—y 和 后 门 路 径 d —a —u — y 。根 据 后 门 规 则 第 一 条 或
第 二 条 ,以 A 为 条 件 或 以 1 / 为 条 件 均 可 以 阻 断 后 门 路 径 从 而 识 别 出 D 对 Y
的因果影响。

图 4 . 1 1 因果图:
班级规模与学习成绩

( 3 ) 幸 福 的 决 定 因 素 。幸 福 经 济 学 对 幸 福 感 是 由 哪 些 因 素 决 定 的 非 常 感 兴
趣 ,因 果 图 4.1 2 描 述 一 种 可 能 的 决 定 机 制 。教 育 (
A ) 会 影 响 个 人 收 入 (D ),个
人收入会影响个人幸福感(y)。同 时 ,
教 育 (a)还会影响个人的宗教信仰(
u),
个人宗教信仰a/)又 会 影 响 到 个 人 幸 福 感 (
Y ) 。D 到 Y 包 含 两 条 路 径 :因果 路
径 D —Y 和 后 门 路 径 D —A —U —Y 。根 据 后 门 规 则 第 一 条 或 第 二 条 ,
可以利用
变 量 或 A 阻断后门路径的相关性。

图 4 . 1 2 因果图:
幸福的决定因素

在上面的例子中,
混 杂 偏 差 具 有 相 同 的 结 构 ,均 是 由 于 出 现 了 原 因 变 量 D
和 结 果 变 量 Y 的 共 同 原 因 ( A 或 U ),从 而 产 生 了 D 到 y 的 后 门 路 径 。根据 后
门规则,
如果后门路径可以被阻断,
那 么 干 预 变 量 D 和 结 果 变 量 Y 之间的因果
效 应 可 以 识 别 。因 而 ,
下面两种情况下因果效应可以识别:
( 1 ) 没 有 共 同 原 因 。如 果 变 量 间 因 果 关 系 如 图 4. 3 所 示 ,没 有 干 预 变 量 和
结果变量的共同原因,
则 没 有 任 何 后 门 路 径 需 要 阻 断 ,因 果 效 应 可 以 识 别 。
(2) 有 共 同 原 因 ,但 有 足 够 的 观 测 变 量 可 以 阻 断 所 有 后 门 路 径 。 如图
4. 1 0 - 4 . 1 2 , 观 测 变 量 A 可 以 阻 断 后 门 路 径 ,
从 而 识 别 出 D 和 Y 之间的因果效
应 。变 量 A 可 以 是 共 同 原 因 或 是 后 门 路 径 上 的 中 介 变 量 ,即以共同原 因 或 中 介

① 当 然 也 可 以 同 时 以 A 和 [J为条件阻断后门路径。
48 基本有用的计量经济学

变量为条件可以阻断后门路径,
消除混杂偏差。
现实中,
正 确 地 找 出 变 量 之 间 的 因 果 关 系 非 常 重 要 。 图 4. 1 3 列 出 了 三 个
主要变量C 、
D 、
y 之间的关系,
1^、
?72为 未 观 测 变 量 。1 ^ 是 (:、
7 的共同原因,

而 C 和 Y 相关,
R 是 C 和 D 的 共 同 原 因 ,因 而 C 和 D 相 关 。但 仏 和 仏 是 未
观测因素,
如果没有正确的因果图,
则 可 能 将 c 看 成 D 和 y 的一个共同原因,
从 而 将 因 果 图 画 成 图 4. 10。这 时 ,以 C 条 件 不 但 不 能 阻 断 后 门 路 径 ,
反而.打开
了 后 门 路 径 。因 为 事 实 上 C 是 一 个 交 汇 变 量 ,
是 仏 和 U 2的 共 同 结 果 ,
根据后
门标准第三条,
C 本来就阻断了 D 到 Y 的 后 门 路 径 ,
如 果 以 C 为条件,
反 而打
开了该路径的相关性,
使 得 仏 和 U 2相 关 ,
从而D 和 Y 相关,
造 成 估 计 偏 差 。这
种 由 于 以 共 同 结 果 为 条 件 造 成 的 偏 差 称 为 样 本 选 择 偏 差 (H e c k m a n ,1979)或
内生选择偏差(
Elwert and Winship,2014) 。

图 4. 1 3 因果图:
样本选择偏差

样 本 选 择 偏 差 (sample selection bias)是 由 于 采 用 非 随 机 样 本 造 成 的 偏 差 ,


非随机样本可能来自于个体的自选择行为,
也可能是由于调查者的抽样规则造
成 的 。非 随 机 样 本 不 能 代 表 所 关 心 的 总 体 ,
用非随机样本估计总体信息,
将造
成 样 本 选 择 偏 差 (H e c k m a n , 1979,2001)。用 因 果 图 的 语 言 描 述 ,
样本选择偏
差是由于以两个变量的共同结果为条件造成的,
这两个变量中一个是原因变量
或 与 原 因 变 量 相 关 ,另 一 个 变 量 是 结 果 变 量 或 与 结 果 变 量 相 关 (Herndn and
Robins, forthcoming).这 一 共 同 结 果 或 交 汇 变 量 可 以 发 生 在 结 果 之 后 ,
可以
发 生 在 干 预 变 量 与 结 果 变 量 之 间 ,也 可 以 发 生 在 干 预 变 量 之 前 (Elwert and
Winship, 2014)。下 面 看 几 个 例 子 :
( 1 ) 教 育 收 益 率 。H a u s m a n and Wise (1977)考 察 了 教 育 (D )对 个 人 收 人
(Y)的 影响,
但 使 用 了 一 个 仅 包 括 低 收 人 者 的 样 本 。 图 4. 1 4 是 相 应 的 因 果 图 ,
假 设 D 与 U 是 独 立 的 ,因果
教 育 D 和其他 未 观 测 因 素 L7同时决定个人收人Y ,
路 径 D —Y 体现了教育对收人的因果影响,
但由于样本限于低收人个体,
相当
于 以 结 果 为 条 件 。Y 是 D 和 L 7 的 共 同 结 果 ,
是 交 汇 变 量 ,以 F 为 条 件 ,
将使D
与 U 相关,
图 中 用 虚 线 表 示 。这 时 ,
D 到 Y 的相关性,
除了反映因果路径D i Y
第 四 章 因 果 图 49

外,
还 包 括 路 径 D —U — Y 产 生 的 相 关 性 ,
从而产生样本选择偏差。

D— - 0

图 4. 1 4 因果图:
样本选择偏差

另 一 个 例 子 是 关 于 中 国 农 村 教 育 收 益 率 的 估 计 。文 献 发 现 农 村 教 育 收 益
率低于城市教育收益率,
原因在于现有文献往往仅利用调查数据中的农村样本
进行估计,
农村样本是一个选择性样本。由于户籍的限制,
在城市化过程中,

村 中 有 能 力 的 个 体 率 先 通 过 升 学 、参 军 等 途 径 突 破 户 籍 限 制 进 人 了 城 市 体 系 ,
在调查样本中无法观测到这些已经成为城市居民的原农村居民,
而调查数据中
的个体是那些没有办法突破户籍限制的样本,
它与农村总体并不完全相同,
使
用 这 一 样 本 估 计 农 村 教 育 收 益 率 将 大 大 低 估 农 村 教 育 的 作 用 (赵 西 亮 ,2016) 。
因 果 图 见 图 4、15,D 表 示 教 育 ,
Y 表示收入,
H 表示户籍,
利用农村调查样本估
计农村教育收益率,
相当于以H 为条件,
打 开 了 非 因 果 路 径 D — n —y ,
从而 产
生样本选择偏差。

图 4 . 1 S 因果图:
样本选择偏差

现 实 中 有 很 多 类 似 的 例 子 ,比 如 Angrist and Pischke (2009)第 2 章 有 一 个


例 子 讨 论 去 医 院 看 病 对 身 体 健 康 的 影 响 。利 用 调 査 数 据 进 行 比 较 分 析 ,
发现去
医 院 的 个 体 身 体 健 康 情 况 反 而 更 差 。原 因 在 于 这 是 一 个 选 择 性 样 本 ,只有健康
状 况 不 佳 的 人 才 会 选 择 去 医 院 看 病 。 因 果 图 仍 然 可 以 用 图 4. 1 4 表 示 ,
D 表示
是否去医院,
Y 表示健康状况,
U 是 影 响 健 康 的 其 他 因 素 。利 用 调 查 数 据 进 行
分析时,
相当于以健康状况为条件,
从 而 产 生 样 本 选 择 偏 差 。 H e c k m a n (1979)
考察过已婚女性的劳动洪给问题,
利用调查数据考察劳动力供给函数时,
存在
着 选 择 性 样 本 ,因 为 只 有 参 与 劳 动 力 市 场 的 已 婚 女 性 才 能 让 我 们 看 到 她 的 工 作
时间和市场工资,
没有进人劳动力市场的已婚女性工资及工作时间都是缺失
的,
仅利用有工资数据的样本估计供给函数存在着样本选择偏差。
( 2 ) 研 发 缋 效 。在 利 用 面 板 数 据 进 行 研 究 时 ,往 往 会 遇 到 样 本 流 失 问 题
(attrition)。在 跟 踪 调 查 中 ,由 于 各 种 原 因 ,有 些 样 本 可 能 会 流 失 ,
这也会造成
50 基本有用的计量经济学

样 本 选 择 偏 差 。 比如,
利用中国工业企业数据考察研发对企业绩效的影响,

果我们根据初始年份限定分析样本,
在 随 后 的 年 份 中 ,由 于 企 业 生 死 或 抽 样 原
因,
有些企业可能会不在初始限定的样本中了,
这种数据流失可能会产生样本
选 择 偏 差 。图 4. 1 6 是 因 果 图 ,
£)表 示研发,
Y 表示企业绩效,
C 表示是否流失,
L T 是 影 响 Y 和 C 的 未 观 测 变 量 。D 到 Y 是 因 果 路 径 。研 发 失 败 ,
亏损严重,

至退出市场,
可 能 不 会 出 现 在 后 面 的 调 查 中 ,因 而 ,
D 会 影 响 C 。U 是 其 他 影 响
企 业 业 绩 的 未 观 测 因 素 ,比 如 宏 观 经 济 形 势 ,
U 也 会 影 响 到 企 业 是 否 流 失 ,比如
中国工业企业数据主要统计的是规模以上的工业企业,
如果由于经济形势,

业销售额达不到标准,
也 可 能 不 会 出 现 在 后 面 的 调 査 样 本 中 ,因 而 U 也 影 响 C 。
如果利用调查数据考察研发行为对企业绩效的影响,
相当于以目前没有流失的
样本为条件,
即 以 C 为 条 件 。从 图 中 可 以 看 出 ,
C 是 交 汇 变 量 ,以 C 为 条 件 ,

打 开 非 因 果 路 径 D — C —U — Y ,
从 而 产 生 样 本 选 择 偏 差 。这 里 样 本 选 择 偏 差 出
现在干预变量和结果变量之间。

样 本 选 择 偏 差 也 可 能 出 现 在 干 预 变 量 之 前 ,比 如 图 4. 1 3 ,
如果样本选择发
生在 D 之前,
相当于以C 为条件,
打开了后门路径D — C— Y ,
从而产
生 样 本 选 择 偏 差 。一 般 认 为 ,
干 预 前 的 样 本 选 择 造 成 的 偏 差 往 往 比 较 小 (Elw-
ert and Winship, 2014) 。

第四节选择偏差的处理

对于混杂偏差,
处 理 方 法 比 较 简 单 。在 完 全 随 机 化 实 验 中 ,由 于 干 预 是 随
机化分配的,
不 会 有 混 杂 因 素 出 现 ,因 而 ,
完全随机化实验不会产生混杂偏差。
在分层随机化实验中,
干预是在层内随机化分配的,
原因变量及潜在结果与分
层有关系,
用 于 分 层 的 变 量 是 对 应 的 混 杂 因 素 ,因 而 ,以 分 层 变 量 为 条 件 将 消 除
混 杂 偏 差 。在 观 测 研 究 中 ,
如 果 能 够 识 别 出 清 晰 的 混 杂 因 素 ,可 以 刹 用 回 归 方
法 或 匹 配 方 法 ,以 混 杂 因 素 为 条 件 可 以 消 除 混 杂 偏 差 。匹 配 方 法 是 以 影 响 干 预
的 变 量 为 条 件 消 除 混 杂 偏 差 ,回 归 是 以 影 响 结 果 变 量 的 混 杂 变 量 为 条 件 消 除 偏
第 四 章 因 果 图 51

差 。 图 4.1 7 显 示 ,
匹 配 控 制 S ,回 归 控 制 X , 均 可 阻 断 后 门 路 径 D — S — X —Y 。
当然,
这种区分并不是完全绝对的,
在后面的章节中会详细讨论回归和匹配这
两种方法。

图 4 . 1 7 因果图:
匹配和回归方法消除混杂偏差

样本选择偏差不但会出现在观测研究中,
也 会 出 现 在 随 机 化 实 验 中 。随机
化实验中,
如 果 存 在 参 与 个 体 流 失 (attrition),
也 会 产 生 样 本 选 择 偏 差 。 比如用
随机化实验考察培训对收人的影响,
随机分配到干预组接受培训的个体没有参
加培训,
如果这种流失是潜在收入比较高的个体,
那么利用剩余的样本进行估
计会产生选择性偏差。
出现样本选择偏差时,
针 对 不 同 的 情 况 ,可 以 采 用 不 同 的 解 决 办 法 。如果
数据允许,
可 以 通 过 调 整 样 本 的 方 式 消 除 样 本 选 择 偏 差 ,比 如 赵 西 亮 (2016)通
过调整农村居民样本,
将永久移民重新纳入农村样本方式修正样本选择偏差。
如 果 造 成 选 择 性 样 本 的 非 因 果 路 径 上 存 在 可 以 观 测 的 变 量 ,那 么 ,可 以 利 用 调
整 混 杂 偏 差 的 方 法 调 整 样 本 选 择 偏 差 。 比 如 图 4. 1 8 ,以 C 为 条 件 产 生 样 本 选
择偏差,
从 而 非 因 果 路 径 Y 使 D 与 Y 表 现 出 相 关 性 。如果变

量 L 或 U 是可观测的,
可以通过以L 或 U 为条件,
阻断该非因果路径造成的相
关性,
从 而 识 别 D 对 7 的 因 果 影 响 。 另 外 ,在 正 态 分 布 假 设 下 ,H e c k m a n
(1979)提 出 了 一 种 解 决 方 法 ,即 著 名 的 H e c k m a n 两 步 法 。
®

图 4 . 1 8 因果图:
修正样本选择偏差

① 具 体 参 考 Cameron and Trivedi (2005)和 Wooldridge(2010) 。


52 基本有用的计量经济学

第五节总 结

本 章 介 绍 了 因 果 图 的 基 本 概 念 ,因 果 图 是 与 潜 在 结 果 框 架 等 价 的 一 种 描 述
语言,
但 更 加 直 观 。我 们 介 绍 了 三 种 路 径 结 构 :因 果 路 径 、共 同 原 因 和 共 同 结
果 。三 种 情 况 下 两 变 量 之 间 表 现 出 相 关 性 :
有因果关系、
有共同原因或以共同
结 果 为 条 件 。因 果 推 断 的 目 的 就 是 排 除 以 共 同 原 因 和 共 同 结 果 为 条 件 造 成 的
相 关 性 .从 而 将 由 因 果 路 径 造 成 的 相 关 性 分 离 出 来 ,因 果 路 径 体 现 的 相 关 性 就
是 因 果 效 应 。后 门 规 则 提 供 了 三 条 基 本 的 识 別 策 略 ,以 中 间 变 量 、
共同原因为
条件可以阻断后门路径产生的相关性,
如 果 有 共 同 结 果 ,不 要 以 共 同 结 果 为 条
件 .从 而 不 会 产 生 非 因 果 路 径 的 相 关 性 。 由 共 同 原 因 造 成 的 偏 差 称 为 混 杂 偏
差 ,以 共 同 结 果 为 条 件 造 成 的 偏 差 称 为 样 本 选 择 偏 差 ,
实证分析的主要目的是
消除这两种偏差,
将因果效应识别出来。

_ i ] 推荐阅读

H e r n a n and Robins (forthcoming)第 6 一 8 章 对 因 果 图 及 混 杂 偏 差 和 样 本


选择偏差进行了很好的阐述,
R o t h m a n et al. (2008)第 2 1 章 对 因 果 图 进 行 了 基
本 的 介 绍 ,Morg a n and Winship (2015)第 3 、
4 章对因果图进行了比较好的介
绍 。 Elwert and Winship (2014)对 样 本 选 择 偏 差 从 因 果 图 角 度 进 行 了 很 好 的 综
述 。 H e c k m a n (1979 ,2001)对 样 本 选 择 偏 差 进 行 了 理 论 描 述 ,
并 提出 修正 样本
选 择 偏 差 的 H e c k m a n 两步法。
识别策略
第五章线性回归

回 归 分 析 是 经 济 学 实 证 研 究 中 应 用 最 广 泛 的 一 种 工 具 。回归分析容易实
施,
很多计量经济学软件都有专门的回归命令,
0 因而成为经济学家广泛应用的
工 具 。但 是 ,回 归 分 析 本 身 只 能 给 出 相 关 性 ,不 能 直 接 给 出 因 果 效 应 的 估 计 。
什 么 条 件 下 回 归 分 析 有 因 果 效 应 的 解 释 ?什 么 情 况 下 才 能 用 回 归 分 析 回 答 我
们 关 心 的 因 果 效 应 问 题 ?在 这 一 章 里 ,
我 们 首 先 讨 论 条 件 期 望 函 数 (Condition­
al expectation function, C E F ) 的 性 质 、条 件 期 望 函 数 和 回 归 函 数 之 间 的 关 系 ,
以及回归分析及其统计推断,
然后,
探讨回归函数和因果效应之间的关系。

第一节条件期望函数和线性回归

1. 条件期望函数的性质

在经济分析中,
我 们 往 往 关 注 一 个 变 量 X 对 另 一 个 变 量 Y 的 平 均 影 响 ,即
条 件 期 望 函 数 £[Y,. I X ,.],比 如 前 文 定 义 的 因 果 效 应 参 数 都 是 条 件 期 望 函 数 的
形式。
® 条 件 期 望 函 数 是 兄 的 函 数 ,
X,.是 随 机 变 量 ,因 而 ,
C E F 也是
随 机 变 量 。期 望 本 身 是 总 体 概 念 ,
现 实 中 ,我 们 得 到 的 数 据 往 往 是 总 体 的 一 个
样 本 ,因 而 ,
需 要 用 样 本 信 息 去 推 断 总 体 信 息 ,比 如 用 样 本 均 值 推 断 总 体 期 望 。
在利用经济数据分析我们关心的经济问题的时候,
需要进行统计推断,
但总体
才是我们关心的目标群体。因 而 ,
后文的分析中,
我们主要从总体角度探讨因
果效应识别,
避 免 讨 论 样 本 信 息 到 总 体 信 息 的 统 计 推 断 问 题 。没 有 特 别 指 明 ,
后 面 章 节 均 假 设 有 总 体 数 据 ,不 讨 论 估 计 量 的 抽 样 分 布 和 统 计 推 断 ,
@ 我们将研
究 目 标 集 中 在 因 果 效 应 的 识 别 上 。C E F 的 一 个 重 要 性 质 是 全 期 望 公 式 (5.1) ,
它描述的是无条件期望可以写成条件期望的总体平均。
ELY;
1 = E[E[y,. | X,.]] (5.1)
比如,
估计全班同学的平均身高,
有两种做法:
一种是分别测量每位同学的

① 在 Stata中 , 可 以 使 用 regress命 令 进 行 线 性 回 归 a
② 有 些 学 者 直 接 将 条 件 期 望 函 数 称 为 回 归 函 数 ,比 如 Hastieetal. (2009)、
洪永森(
2 0 1 1 h 为了叙
述方便, 后 文 “回归函 数 ”特 指 线 性 回 归 函 数 ,条件期望函数直接用C E F 表示。
③ 关 于 抽 样 分 布 和 统 计 推 断 请 参 考 Hayashi (2000)、
洪永淼(
2011)等 。
56 基本有用的计量经济学

身高,
然后进行平均,
这 就 是 无 条 件 期 望 。另 一 种 是 将 同 学 分 成 男 生 、女 生 两
组,
分别测量女生和男生的身高,
计 算 他 /她 们 的 平 均 身 高 ,
这是条件期望,
然后
再用男女生人数占全班人数的比重进行加权,
得到全班同学的平均身高,
这就
是 全 期 望 公 式 (5.1)右 边 的 部 分 。
另一个重要的全期望公式为:
E [ Y t I X (] = E[E[Y, I | X,-] (5. 2)
全 期 望 公 式 (5. 2)与 公 式 (5. 1)类 似 ,
证 明 见 本 章 附 录 。直 观 解 释 ,
想估计女生
的身高,
我们可以分别测量每个女生的身高,
然后计算平均值,
这就是条件期望
E [ Y i|X , ] ,
Y,表 示 身 高 ,
;C,.表 示 性 别 ^ 也 可 以 将 女 生 进 行 分 组 ,比如根据地域将
女生分成两组,
来自北方或南方,
用 Z,.表 示 。分 别 测 量 北 方 和 南 方 女 生 的 身 高
并进行平均,
得 到 f:
[Y,.l;
C,,
Z ,.],
再根据北方女生和南方女生在全部女生中所
占 比 重 进 行 加 权 则 可 得 到 全 部 女 生 的 平 均 身 高 ,即 £[Y,.IX,.]。这 两 个 全 期 望
公式很有用,
在后面的分析中会经常用到。
下 面 介 绍 C . E F 的 三 个 基 本 性 质 。第 一 个 性 质 称 为 C E F 分 解 特 征 ,
任意两
个随机变量y,、
x ,,
都可将一个随机变量分解成条件期望加一个剩余项的形
式 ,即
y ; = E l Y ;| X,-]-h£,. (5.3)
并 且 剩 余 项 e,均 值 独 立 于 X , ,即 E[e,. |X ] = 0 o 证 明 很 简 单 :
E[e,- | X,] = E £ Y i— ELY, | X,.] | X,] = £[y,- | X ,-]— 取 | X,] = 0
剩 余 项 e,.均 值 独 立 于 X,•具 有 很 强 的 内 涵 。首 先 ,
意 昧 着 ^ 的无条件期望为零,
£[e,.] = E [ E [ e ; i X,-]] = 0
其 次 ,s,与 X , 不 相 关 或 两 者 正 交 ,即
E l X i • £i] = K{X,- • E[e; | X , ] } - 0
实际上,
e,. 与 X , 的 任 意 函 数 都 不 相 关 ,
假 设 7i(X;) 是 兄 .的 任 意 函 数 ,
则有
[/i(Xy) . e,-] = E l H X , ) • E [ e ; | X,]] = 0
£:
总结一下,
■E[e,] = 0
£■[£,. | X,J = 0=>< E [Xi * SiJ — 0
E [ A ( 兄 )• £,] = 0 对 于 任 意 函 数 AC*)
因为对于任意两个随机变量,
总是可以将一个随机变量分解为它的条件期
望 函 数 和 一 个 剩 余 项 的 形 式 。相 应 地 ,
一个随机变量的方差也可以分解成两个
部分:
条件期望函数的方差和剩余项的方差。
第 五 章 线性 回归 57

V a r ( y , ) = Var(£[Y, | X,-] + e ;)
= V a r ( E [ y ; | X , ] ) + V a r ( e , ) + 2Cov(£[Y,. | X,•],£,)
= V a r C E C Y , 丨X , ] ) + £ [ € ]
- V a r ( £ [ Y , 丨X J ) + £ [ V a r(Y,. | X,)] (5. 4)
第 一 行 直 接 根 据 C E F 的 分 解 特 征 ,第 二 行 第 三 项 为 零 是 因 为 e,'均 值 独 立 于 任
何 X , 的 函 数 ,包 括 U ,],第 四行因为
E[ef] = F[E[ef 丨X ;]] - E[Var(y, | X ;)]
这 一 公 式 有 一 定 的 应 用 价 值 ,比 如 研 究 收 人 差 距 ,
通常关注各种影响因素对收
人差距的贡献, 方 差 可 以 作 为 收 人 差 距 的 一 种 衡 量 指 标 。 如 果 Y ,.表 示 个 人 收
人 ,X,表 示 教 育 、
性别、 地E 等决定收人的因素, 那么收入差距就可以分解为由
个 人 特征变量X,决定的差距及其他因素的影响,
并且可以测算每种因素在收人
差距中的贡献。
最 后 ,C E F 是 用 足 的 函 数 去 预 测 Y,.时 的 最 优 预 测 ,最 优 是 指 均 方 误 差
( M e a n Squared Error, M S E ) 最 小 。这 是 C E F 的 一 个 重 要 特 征 ,它 说 明 用 X,.
去 预 测 最 好 的 预 测 就 是 假 设 用 m (兄.)去 预 测 K ,
预测误差是
Y, —m ( X , ) ,
使 M S E 最小即使预测误差平方期望最小,
E[(Y, ~ m ( X t))2J ^ E { ( Y ;-E[Y,- | X,]) + (E[Y,. | X,] - }2
= 取 - 取 1 X,]]2 +2E{(E[Y,. | X JJ - m ( X r))(V/ - E [ Y / | X,-]))
+ E[E[Y,- | X , . ] - ^ ( X , ) ] 2
= E [ Y i- E [ Y i 丨X,]]2 + £ :
[£[K |X j - m C X J ] 2 (5.5)
第二行
E{(E[YiI X,.]-mCX,.))(Y/- E [ y i. 丨兄.])} - - 0
其 中 ,&(兄 )= ( £ :
[¥,|叉,]—m (足 ))。因 而 , 预测的均方误差等于两项, 第一项
与 函 数 m (兄.)无关, 最 小 化 均 方 误 差 等 价 于 使 第 二 项 E(E[Y,' |
最 小 。第 二 项 最 小 当 且 仅 当 爪 (兄.)= £ :
[Y,.丨
X , ] ,因 而 ,C E F 是 对 Y ,.的 最 优
预测。

2 . 线 性 回 归 和 条件期望函数

线性回归是经济学实证分析中应用最广泛的一种方法,
它与条件期望函数
之间有什么关系?因为条件期望函数与因果效应参数有着密切的联系,
如果线
性回归模型与条件期望函数可以建立起某种联系,
则可以利用回归分析估计因
果 效 应 参 数 。下 面 讨 论 线 性 回 归 与 条 件 期 望 函 数 之 间 的 关 系 。
58 基本有用的计量经济学

首先回顾线性回归模型,
® 假 设 有 总 体 的 数 据 (Y , ,
兄.),
这里兄是K X 1的
向 量 。我 们 想 用 一 个 兄 的 线 性 方 程 去 拟 合 Y ,.,
要使线性方程尽可能地靠近所
有的点,
可 以 采 用 最 小 二 乘 估 计 ,即 普 通 最 小 二 乘 法 (O L S ) 。估 计 出 的 线 性 方 程
称为总体回归方程或总体回归函数,
相 应 的 系 数 称 为 总 体 回 归 系 数 。具 体 地 ,
选 择 一 个 系 数 向 量 /?使 下 列 均 方 误 差 最 小 :
/S = arg minE[y,- — X\b~\z (5. 6)
b

卢为总体回归系数, 为 总 体 回 归 方 程 。上 式 是 6 的 二 次 函 数 ,一 阶 条 件 为 :
£[X , (Y,- - X ;
6)] = 0 (5.7)
整理得总体回归系数向量:
卢- ( 5 . 8)
预测误差在回归分析中通常称为残差,
定义总体回归残差为
由 一 阶 条 件 (5. 7)得
E[X,'e;] - 0 (5. 9)
注 意 式 (5. 9)不 是 假 设 ,
是线性回归的必然结果,
它实际是回归系数估计过程中
的一阶条件,
只要是线性回归,
得到的回归残差将与解释变量正交或不相关。
线 性 回 归 直 接 给 我 们 变 量 之 间 的 线 性 相 关 性 ,比 如 简 单 回 归 模 型 +
其总体回归系数为:
C o v ( H )
Va r(X;)

对 于 多 元 线 性 回 归 ,总 体 回 归 系 数 用 矩 阵 方 式 表 示 ,即
[X, Y,-] ,
解 释 变 量 X ki的 总 体 回 归 系 数 可 以 表 示 为 :

A = (5.10)
V a r (x )

其 中 是 ;
^ 对 所 有 其 他 解 释 变 量 的 总 体 回 归 残 差 ,即
也就是说,
要得到解释变量兄的回归系数爲,
可 以 进 行 两 步 回 归 。第 一 步 ,

释 变 量 X k 对 所 有 其 他 解 释 变 量 又 _,进 行 回 归 ,
得 到 回 归 残 差 么 ,.,
然后,
再用被
解 释 变 量 y,对王H 进 行 回 归 。第 一 步 回 归 中 相 当 于 将 解 释 变 量 分 解 为 两 部
分 :与 其 他 解 释 变 量 相 关 的 部 分 和 与 其 他 解 释 变 量 不 相 关 的 部 分 h ,
h 是剔除了其他因素影响后的;
0, (Angrist and Pischke, 200 9 ;Wooldridge,
2010)。第 二 步 ,
直 接 用 Y i 对 回 归 就 得 到 1 与 X k;的 直 接 相 关 性 了 。证明也

①有关线性回归的计量经济学理论,
可 以 参 考 Hayashi (2000)、
洪 永 淼 (2011)。
第五 章线 性回归 59

很容易,
运 用 回 归 性 质 (5, 9 ) ,

CovCx*;,y ,-)= C o v ( x w ,l3kX k;+ xi ki^-k + e,.).
= l^kCov(x k;, ) ~f- Cov(^,- ,X-ki) ^ k + CovCx*;,
匕)
= 戽C 0VC^,.,
X 二y + h )
= ^kCov(xki,xLii)y-\-^kCov(xt;,xfa)
U a K D
其中第二行第2 项 、
第 3 项 和 第 四 行 第 1 项 运 用 回 归 性 质 (5. 9)均 为 零 ,
整理一
下 即 得 式 (5. 10)。(
5. 10)式 说 明 ,
无 论 是 简 单 回 归 还 是 多 元 回 归 ,回 归 系 数 实
际反映的是解释变量与被解释变量之间的相关性。由于因果效应参数是用条
件期望函数进行定义的,
我们想了解回归系数和因果效应参数之间的关系,

首先讨论线性回归函数和条件期望函数之间的关系。
根据上一节的分析,
我们知道,
条件期望函数E m IX J 本 身 是 又 的 函 数 ,
但 对 函 数 形 式 没 有 进 行 任 何 限 制 ,因 而 C E F 可 以 是 又 的 线 性 或 非 线 性 函 数 ,
并 且 C E F 是 对 V 的 最 优 预 测 (均 方 误 差 最 小 意 义 上 )。 首 先 ,如 果 C E F 是线
性的,
那么总体回归函数将与C E F 完全一致,
见 定 理 5. 1 。

定 理 5. 1 ( 线 性 C E F 定 理 ) 如 果 C E F 是 线 性 的 ,则 总 体 回 归 函 数 就
是 C E F 。①
证 明 假 设 E[Y,.丨
XJ = ,由 C E F 分 解 特 征 ,
E[X,-(Y,-- E [ y ; |X,])]
= 0 。将 £:
[1 = 代 人 ,得 ^ .]=/?,从 而 说 明
^ =%/9,
E l Y A X ^ X : 即总体回归函数与条件期望函数一致。
如果条件期望函数不是线性的,
那 么 ,总 体 回 归 函 数 将 与 条 件 期 望 函 数 不
一 致 。但 总 体 回 归 函 数 仍 然 是 对 条 件 期 望 函 数 的 最 优 线 性 预 测 。

定 理 5. 2 ( 回归一 C E F 定 理 ) 总 体 回 归 函 数 叉 化 是 (最 小 均 方 误 差 意 义
上 )对 I X ,.]的最优线性近似 ,即
/3 = arg min£(E[y,. | X , ] - X ;
6) 2 (5,11)
b

① 回 忆 前 面 讨 论 的 均 值 独 立 性 条 件 £[e,. I X ,] - 0 ,
洪 永 淼 (2 0 1 1 )称 之 为 模 型 正 确 设 定 假 设 。根据
线性 CEF定理, 如 果 C E F 函数是线性的, C E F 就 是 总 体 回 归 方 程 。根 据 C E F 分 解 特 征 ,总 体 回 归 残 差
必 然 满 足 £ |> , i X ,] = 0 。反 过 来 ,
如果均值独立性条件满足, 那 么 C E F 必 然 等 于 总 体 回 归 方 程 。 因 而 ,只
有 C E F 真的是线性的,
总 体 回 归 函 数 才 等 于 C E F ,从 而 E U I X ,. ] = 0 ,因 而 ,
可以称该条件为正确模型设
定 假 设 。详 细 讨 论 参 见 洪 永 森 (2011)第 2 章 。
60 基本有用的计量经济学

证明
E(y,.-x; D ^ | x^-x-b)}2
6)2= E{(y,-E[y,. | x j ) + (£:
= E [ Y i一 E [ Y ; I X J ] 2 + E L E l Y i \ X,] - X b J
+ 2E[(Y,.-£[y,. I X,])(E[y, | X , . ] ~ X ;
6)]
- E l Y ;- E[Y,. I X,]]2 + E I E I Y ; | X t] — X ^ b J
利 用 C E F 分解特征,
第 三 行 交 叉 项 为 零 。根 据 定 义 ,总 体 回 归 系 数 最 小 化 左 边
MSE,
等价于最小化右边两项,
第 一 项 与 选 择 向 量 6 没 有 关 系 。因 而 ,
最小化 左
边 等 价 于 使 右 边 第 二 项 最 小 化 。命 题 得 证 。
定 理 5. 2 说 明 ,即 使 条 件 期 望 函 数 本 身 是 非 线 性 的 ,总 体 回 归 函 数 仍 然 有
用,
总 体 回 归 函 数 是 对 条 件 期 望 函 数 的 最 优 线 性 近 似 。定 理 5. 1 和 定 理 5. 2 为
使用回归分析提供了理论基础,
尽 管 经 济 变 量 之 间 的 关 系 往 往 是 非 线 性 的 ,回
归分析仍然可以得到最优的近似,
尤其当解释变量限制比较小的变动范围内
时 ,回 归 函 数 对 C E F 的 近 似 越 好 ,
这 正 是 局 部 线 性 回 归 (Local Linear Regres­
sion, L L R ) 的 基 本 思 想 。
定 理 5. 2 提 供 了 一 种 估 计 回 归 系 数 的 方 法 ,即 可 以 用 条 件 期 望 对 解 释 变 量
回 归 。根 据 回 归 系 数 (5.8 ) ,

^ E l X ^ - T ' E l X . Y ^ = E l X iX :
2 ^ E l X iE L Y i | X,-]] (5. 12)
上 式 第 二 个 等 号 使 用 全 期 望 公 式 (5. 1)而 得 ,可 以 看 到 ,E d IX ;] 替 代 了 前 面
Y , 的 位 置 ,即 利 用 EtiYjXi]对 X i 回 归 ,
也 可 以 得 到 回 归 系 数 向 量 13。这 一 点 具
有 应 用 价 值 。有 时 ,
我们无法获得个体层面的数据,
但可以获得加总的数据,

用加总的数据也可以估计个体回归系数。比如牯计教育收益率时,
如果我们获
得的是根据教育年限加总的平均收人数据,
用平均收入对教育年限回归,
仍然
可以获得个体教育收益率的估计。
用 2 0 0 2 年 中 国 居 民 收 入 调 査 (C H I P ) 城 镇 数 据 获 得 以 下 回 归 。A 部 分 是
利用个体数据进行的回归,
共 9581个样本点,
得 到 的 教 育 收 益 率 为 0,0715。B
部分是利用教育年限进行加总的数据进行的估计,
教 育 年 限 为 0— 2 3 年 2 4 个
样 本 点 。利 用 各 层 次 教 育 个 体 数 量 作 为 权 重 进 行 加 权 最 小 二 乘 估 计 ,
得到的教
育 收 益 率 也 是 0. 0715,当 然 标 准 误 差 不 同 。
第 五章 线性回 归 61

A Individual-level data
, reg lwage e duc ,vce(robust)
Linear regression Number of obs = 9581
F( 1 ,9 5 7 9 ) = 779.01
Prob > F = 0.0000
R-squared = 0.0776
Root MSE = .72906

Robust
lwage Coef. t P>|t| [ 9 5 % Conf, Interval]
Std* Err.
educ .0715452 .0025634 27.91 0.000 ,0665205 ,0765699
_cons 8.297527 .0315587 262.93 0.000 8.235765 8.359489

. collapse (count) n = lwage (mean) lwage, by (educ)


B — Means by years of schooling
. reg lwage educ [aweight = n ] ,vce( robust)
(sum of wgt is 9. 5810e + 03)
Linear regression Number of obs = 24
F( 1 ,22) = 77.60
Prob > F = 0.0000
R-squared = 0.8545
Hoot MSE = .09112

Robust
lwage Coef. t P > 111 [ 9 5 % Conf. Interval]
Std. Err.
educ . 0715452 ,008122 8.81 0.000 ,0547012 •0883891
cons 8.297627 .1061443 78.17 0.000 8.077497 8.517757

3. O L S 估 计 量 的渐近特征

在这一节暂时回到样本的角度,
对 O L S 估计量的渐近特征进行简要回顾,
详 细 讨 论 可 以 参 见 洪 永 淼 (2011)或 Hayashi (2000) 。假 设 有 总 体 的 一 个 随 机
样本,
利 用 样 本 信 息 去 推 断 总 体 回 归 系 数 。根 据 大 数 定 律 ,
用样本矩估计总体
矩,
样本回归系数向量可以写成:
卜 (X,X 、
-1X,Y (5.13)

卢= [务 S U ; 广 (5.14)

因 为 回 归 函 数 为 为 总 体 回 归 残 差 ,
将之代人式(
5. 14) ,

卜 /3+ [务 写 [务 S i 叫 (
5.15)
62 基本有用的计量经济学

根据大数定律,

[ 士 —^ E [ X ;
X- ]_1 , ;e;—^ E [ X j g , ] = 0

(5.16)
从而,
卢 或 plimjff = ^ (5. 17)
即 O L S 估计量是总体回归系数向量的一致估计。
由于 £ [ 叉& ] = 0 ,其方差协方差矩阵可以表示为:
l = Var(Xiei) = E l X i X U U .
利用中心极限定理,
可以得到

|— > N (0,2) (5.18)

从而,
由式(
5. 14)得

厕卜於= [去 2 > , X ; ] _1 . # [务 I X 叫 (5.19)

根 据 Slutsky 定理,
上式将渐近服从于正态分布。
® 根据(
5. 16) 式和(
5. 18) 式 ,
(5. 1 9 ) 式 第 一 项 的 渐 近 极 限 是 ,第 二 项 服 从 渐 近 正 态 分 布
N(0,
2 ) 。因而,
(5. 19)式服从渐近正态分布 E [ X fX 门一1 • iV(0 ,
I:),
它的均值
为0,
方差是三明治形式:
E I X X T ^ E I X ^ ^ = E lX ^ - T ^ lX ^ U n E L X ^ ^ - 1 (5.20)
其 中 ,总 体 残 差 e,.用 样 本 残 差 e、= Y _ 估 计 ,中 间 项 的 估 计 量 为
l/ N X ^ X X e U , 而 0 L S 估计量的标准误差就是方差协方差矩阵对角线元素
开方后的数值。由于该方差协方差矩阵没有施加同方差的假设, 根据它计算的
标准误差通常称为异方差一致性标准误差或稳健标准误差(
robust standard er­
ror) D 在 Stata软件中,
默认的是同方差假设下的标准误差,
要获得稳健标准误
差,
回归命令需要加上vce(robust)选项。
如果引入同方差假设,
即 E [ e H X j ^ 2,

E lX X .e U = E[X,.X ;
E [ e? | X,.]] - Y E [ K ]

从而 j 的渐近协方差矩阵为:
E [ X ;X ;
T 'E lX X e U E L X ^ - T 1= E [ X , X ;]-V£[X,.X; ] £ [ X , X ;
]~J

① Slutsky定 理 说 ,
如果两个随机变量,
一个有渐近极限,
一个有渐近分布,
两者的乘积也将有渐近
分布,
并且是两者渐近极限乘积的分布1
第 五章 线性回 归 63

- ^ELXiX-T1 (5.21)
这 正 是 Stata 回 归 命 令 默 认 的 标 准 误 差 ,
也是经典线性回归模型理论中同方差
的 标 准 误 差 公 式 。根 据 前 文 的 分 析 ,我 们 知 道 回 归 实 际 是 对 C E F 的 近 似 ,因
而,
异 方 差 就 是 很 自 然 的 事 情 。 即 使 数 据 真 的 是 同 方 差 的 ,V a r(y,.jX,.)=ff2 ,

果 C E F 是线性的,
那 么 回 归 残 差 确 实 会 是 同 方 差 的 。但 是 ,
如 果 C E F 是非线性
的,
那 么 即 使 原 始 数 据 是 同 方 差 的 ,回 归 残 差 也 将 是 异 方 差 的 。具 体 地 ,
E[e! | | X,]
^E{[(y,.-£[Y,. | X,]) + (E[Y,. | X J - X ;
/?)]2 [ X,'}
- V a r [ Y ; | X J + EECECY, j X , ] - X ;
/?)2 | X,] (5.22)
由 上 式 可 以 看 出 ,即 使 原 始 数 据 是 同 方 差 的 ,满 足 V a r( m ) = ff2 ,但 是 如 果
C E F 是非线性的,
那么第二项将不等于零,
而 是 又 的 函 数 ,因 而 ,回 归 残 差 仍 然
是 异 方 差 的 。直 观 上 也 很 容 易 理 解 ,条 件 期 望 函 数 本 身 是 非 线 性 的 ,
用线性方
程去拟合非线性数据,
就会出现有些地方拟合得好,
有些地方拟合得差,
从而使
回 归 残 差 的 波 动 性 与 X ; 有 关 系 ,回 归 残 差 出 现 异 方 差 。 即 使 C E F 是 线 性 的 ,
仍 然 不 能 保 证 同 方 差 ,比 如 后 面 要 介 绍 的 线 性 概 率 模 型 (L P M ) ,C E F 是 线 性
的,
但 回 归 残 差 仍 然 是 异 方 差 的 。因 而 ,
异 方 差 是 常 态 ,同 方 差 是 特 殊 情 况 。在
使 用 Stata软 件 进 行 实 证 分 析 时 ,不 要 忘 记 加 上 vce(robust)选 项 。
初 等 计 量 经 济 学 的 课 程 中 一 般 会 讨 论 O L S 估 计 量 的 无 偏 性 。什 么 情 况
下 ,才 能 保 证 O L S 估 计 量 是 无 偏 的 ?根 据 (5. 15)式 ,
容 易 证 明 条 件 |兄 ] =
0 可以保证估计量的无偏性。

e W =/?+e|[ 2 兄1 ; ] —15 > , 匕}

= (3 + E ^ ^ X iX ^ y 1 \X,]j

第 二 行 第 2 项 利 用 了 全 期 望 公 式 (5.1)。什 么 时 候 [e,.| X , 0 = 0 才 会 成 立 呢 ? 根
据 定 理 5. 2 和 C E F 的 分 解 特 征 ,
如 果 C E F 是线性函数,
C E F 就是总体回归方
程,
从 而 总 体 回 归 残 差 就 会 满 足 均 值 独 立 性 条 件 。事 实 上 ,随 机 化 实 验 可 以 保
证均值独立性条件成立。
无偏性也适合于小样本推断,
一 致 性 仅 适 用 于 大 样 本 。如 果 一 个 估 计 量 是
无偏的,
无论样本大小,
多次估计,
其 平 均 值 都 会 接 近 于 总 体 参 数 。如 果 估 计 量
是一致的,
只有在样本量很大时,
估 计 量 才 会 接 近 于 总 体 参 数 。如 果 样 本 量 太
小,
可能会产生较大偏差,
这一点在应用研究中需要注意。
64 基本有用的计量经济学

4 . 饱和回归

经济变量的关系往往是非线性的, 但有一种回归模型的条件期望函数总是
线性的,这 种回归使兄的每一个取值都产生一个虚拟变量作为模型的协变量,
如 果 X;是多元的,
除每个值的虚拟变量外,
还要引人解释变量之间的交叉项,
这 种 回 归 模 型 称 为 饱 和 回 归 。它 实 际 上 来 自 于 实 验 的 分 层 模 式 (stratifica­
tion) 。比如,
我们考察大学教育收益率,
针对大学和高中两种教育程度,
还探讨
性别 差 异 。回归模型包括两个变量:教 育 和 性 别 。因为教育和性别均是二值变
量,
根 据 这 两 个 变量可以将数据分成4 组 :
大学男性、
大学女性、
高中男性和高
中女性,
从而每组个体的平均收入均可以计算出来。比如,
用 叉 ^&分 别 表 示
教育和性别,
取 1 分别表示大学和男性,
即 4 组个体的平均收人可以写成:
E [ y ; | x u = o ,x 2;= o] - «
e[y,- l x u = 1 ,xZ
i= o] = a + /S
E[Yi| X u = 0 ,XZ
i= 1]= a~hr
£[y,' I Xu- = 1 ,X 2;= 1] = a + ^ + 7 + S
即高中女性平均收人为《,
大学女性平均收入为《+ 仏 高 中 男性平均收人为a +
y,
大学男性平均收入为a+ / ? + y + 夂 C E F 可以写为:
E[y,. | X 1(., X 2,.] = a + /2X lf.+ + ^ X lfX 2i (5.23)
其中X,、
X 2 的 系 数 /?、
7 称为主效应(
main effects), S 称 为 交 互 效 应 (interac­
tion effect) 。如果没有交叉影响,
不同性别教育收益率相同,
那 么 <5=0。在一般
的模型构建中,
可以没有交互效应,
但 不 能没有主效应。如果只有交互效应,

型往往很难解释。
如果解释变量是多值的,比如教育变量有5 个 取 值 即 3 = 0 ,
1,…,
4,分别表
示没受过教育、
小学、
初中、
高中、
大学,
那么相应的饱和回归模型可以写成:
4

EIY, | X u, X 2l-] = + j 9 X 2; + •X 2 (5. 24)


0 .r = 0
其 中 如 =1(;
^ = ^ ) , 1 ( • ) 为示性函数,
条件满足取值1 ,
不 满 足 取 值 0 。d r 分
性 别 X2本 身 是 二 值 的 ,
别对应于教育变量五个层次产生的5 个虚拟变量, 因
而,
教育和性别两个变量将总体分成了 1 0 组 。上 述 条 件 期 望 函 数 描 述 了 这 10
组个体的平均收人。如 果 没 有 交 互 影 响 ,即 教育收益率没 有 性 别 差 异 ,
上述回
归 函 数 通 常 可 以 称 为 根 据 兄 分 层 的 饱 和 回 归(
saturated m l )。

5. 二 元因变量模型

在回归分析中,
被 解 释 变 量 有 时 是 二 值 的 ,比如是否就业、
竞选是否成功、
第五 章线 性 回归 65

贷 款 是 否 批 准 等 等 。被 解 释 变 量 是 否 是 二 值 的 (或 离 散 变 量 )并 不 影 响 定 理 5. 2
的 成 立 。唯 一 的 差 异 在 于 其 条 件 期 望 函 数 的 解 释 及 回 归 系 数 的 解 释 。 比如考
察什么因素影响就业参与,
Y,.表 示 是 否 就 业 ,为 二 值 变 量 ,取 1 表 示 就 业 ,
取 0
表 示 未 就 业 。X , 表 示 个 体 教 育 、家 庭 收 人 、孩 子 数 量 等 可 能 的 影 响 因 素 ,构造
线性回归模型:
Y,' = a + X ;
/? + e,
假 设 £ [ £,.丨足] = 0 ,
则总体回归函数为:
ELYi ] X ; ] = a + X ;
^3

由于 是 二 值 的 ,
总体回归函数可以写成:
Pr[Y, = 1 丨足] = « + 久;卢 (5.25)
回归系数解释为解释变量对就业概率( K = :
l )的 边 际 影 响 。被 解 释 变 量 可 以 解
释为成功的概率,
上 述 模 型 通 常 称 为 线 性 概 率 模 型 (U n ear Probability Model,
L P M ) C 线性概率模型残差总是异方差的,
E l s i \ x,.]= E[[y,.-p[y,. = i | x ,.]]2 | x,]
- [ i - p[y,- = i I x ,.] ] 2p [ y , - 11 x,.]
+ 尸[y,. = 1 1 x ,.]2[ i - p [ 7 , - 1 1 x j ]
- P [ Y ; = 1 i X , ] [ 1 - F [ Y , = 1 ! X,]]
L P M 模型被解释变量反映的是成功的概率,
其取值范围在[0,
1]之 间 ,

L P M 右边为线性函数,
无法保证其拟合值在[0,
i]之 间 ,
尤 其 当 X , 取值变动较
大时,
可 能 会 出 现 拟 合 值 为 负 或 大 于 1 的 情 形 。另 外 ,L P M 的 边 际 影 响 是 常
数 。比如就业参与模型中,
6 岁以下孩子的数量可能是影响母亲就业决策的一
个 重 要 因 素 。在 L P M 模 型 中 ,
孩子数量的系数是一个常数,
那么,
孩子数量从
0 增加到1 个,
可能对就业概率产生较大影响,
孩子数量从1 再增加到2 时,

影响程度可能就没有第1 个孩子的影响大,
L P M 模型无法反映这一点。
为了克服上述两个缺陷,
计量经济学家构造出了非线性概率模型J 一种
解决方法是引人潜变量,
对 潜 变 量 建 模 而 不 是 对 观 测 结 果 建 模 。 比如考察个体
的就业决策,
就 业 选 择 取 决 于 就 业 和 待 业 两 种 状 态 下 个 体 效 用 的 比 较 。假设 两
种 状 态 下 个 体 效 用 的 差 用 潜 变 量 Y * 表 示 ,潜 变 量 模 型 为 :
Y ; = a + X ^ + e,- (5.26)
其中, = 则条件期望函数可以写为:

① 有 关 离 散 选 择 模 型 的 详 细 分 析 ,可 以 参 考 Wooldridge (2010)第 15— 1 9 章 和 Cameron and


Trivedi (2005)第 14 和 16 章 „
66 基本有用的计量经济学

Pr[Y,- = 1 | X , ] - Pr[Y; > 0 | X,-] = Pr[a + X ^ + £; > 0 | X ;]


= Pr[e; + 丨X ;] - 1 - G ( - ( a + X ;
^))
= Gda+X-^ (5.27)
其 中 ,G( • ) 是 e,.的 分 布 函 数 ,
假 设 为 对 称 分 布 。现 在 条 件 期 望 函 数 为 非 线 性
函数,
并 且 右 侧 模 型 总 是 在 [0,1]之 间 。边 际 效 应 不 再 是 一 个 常 数 ,

dF— ^ Z 1 1 足 ] = 8 ^ + X ,
雜 (5. 28)
o^ki
其 中 $ ( • ) 为 概 率 密 度 函 数 。在 应 用 研 究 中 ,
通 常 假 设 e,.服 从 标 准 正 态 分 布 或
逻 辑 分 布 。如 果 是 正 态 分 布 ,
上 述 模 型 称 为 probit模 型 。如 果 是 逻 辑 分 布 ,

为 logit模 型 。其 中 ,
标准正态分布和逻辑分布的密度函数分别为:

Hz) = 士 e,2/2 r(z) -


-JU l + ez
probit模 型 和 logit模 型 是 非 线 性 模 型 ,
可 以 用 极 大 似 然 法 进 行 估 计 。在
Stata软 件 中 ,
使 用 命 令 probit和 logit进 行 估 计 ,得 到 的 系 数 不 能 直 接 解 释 成
边 际 影 响 ,(
5. 28)式 显 示 ,
边际影响的方向和系数方向一致,
但边际效应的大小
还多一项g U + X M ) ,
依 赖 于 兄 。因而 ,
边 际 效 应 不 是 常 数 ,随 X ,.的变化而变

化 。在 应 用 中 ,
往 往 估 计 平 均 的 边 际 效 应 ,即 对 于 平 均 特 征 X 的 个 体 ,
其边际
效 应 是 多 少 。Stata软 件 中 ,可 以 使 用 ma r g i n s 命 令 获 得 边 际 效 应 的 估 计 。关
于模型拟合的好坏,
可 以 用 M c F a d d e n 提出伪 尺 2(pseudo _R2)进 行 测 度 ,
定义为
1 一! 其中为原模型的对数似然值,
& 为只有常数项模型的对数似然
值 。关 于 离 散 选 择 模 型 的 更 多 讨 论 参 考 C a m e r o n and Trivedi (2005) ^ W o o l ­
dridge (2010)0

第二节线性回归和因果效应

1. 线性回归和因果效应

上 文 讨 论 了 线 性 回 归 函 数 与 条 件 期 望 函 数 之 间 的 关 系 。定 理 5. 1 和定 理
5. 2 告 诉 我 们 ,
如 果 C E F 是线性函数,
则 C E F 和 总 体 回 归 函 数 一 致 ;如 果 C E F
是非线性函数,
则 总 体 回 归 函 数 是 对 C E F 的 最 优 线 性 近 似 。什 么 时 候 回 归 系
数 有 因 果 效 应 的 解 释 呢 ?一 个 简 单 的 回 答 是 当 总 体 回 归 函 数 所 近 似 的 C E F 有
因 果 效 应 解 释 的 时 候 。第 二 章 曾 经 推 出 简 单 回 归 系 数 实 际 是 两 组 结 果 平 均 值
之差,
而两组结果平均值之差要有因果效应解释,
必 须 满 足 条 件 (2. 2 8 ) 或/ 和
(2. 30),并 且 不 同 的 条 件 会 给 出 不 同 的 因 果 效 应 参 数 。再 回 到 潜 在 结 果 框 架 ,
第 五 章 线 性回 归 67

将观测结果表示成潜在结果的形式:
Y, - D £Y u + ( 1 - D , ) y 0,- - Y 0f + ( Y u - Y o ^ B i
= Yo,- + D i = /i。 + dsDi + v0i
= "o + ("i — ) D f + [v。
,.+ D; —% ) ] (5.29)
其中抑= E [ Y 。
],〜 =Y。
,一E D V ] ,
内 一E D M U f Y h —E [ Y 1;] ,
或直接写成:
y,- = a + Tate -D/ + e; (5. 30)
其 中 《= 埤 ,£, - v 0i. + D i( ^ - v 0i) o 注 意 (5. 30)式 是 潜 在 结 果 模 型 ,
不 是 线性回
归模型,
尽 管 看 起 来 很 像 简 单 回 归 。在 (5. 30)式 中 ,rATE是 总 体 平 均 因 果 效 应 。
两组结果平均值分别为:
E [ Y ; [ D ; = 1] - a + rATE + E[e,. | X,] (5. 31)
E[Y,- | A. = 0] = a + £ :
[>,. | X J (5. 32)
(5.31) —(5.32)得
rols= E [ Y ; !A = 1]—取 . !A = 0]
= rATE + El^i | D ; = 1] — E[ e £| D,. = 0]
= rATE + E[_vl{ | Di = 1] — E[_v0i I Di = 0]
= rATE + e [y 0i. | ^ = l ] 一 e [y 0i- I d ; = o]
+ a ~ - p ) { E [ y li~ Y , i | d ; = i ] - E [ y 1;- y 0l I d, = o]} (5.33 )
其 中 />= Pr[D,. = l] 。 因而,
要 使 回 归 系 数 r°ls可 以 解 释 为 平 均 因 果 效 应 rATE,

须 使 上 式 最 后 两 项 等 于 零 。第 一 项 为 零 即 条 件 (2. 2 8 ) ,要 求 基 线 潜 在 结 果 Y 0;
均 值 独 立 于 JD,',不 存 在 选 择 偏 差 。第 二 项 为 零 ,
要求两组个体因果效应不存在
差异,
如 果 (2. 28)成 立 ,
则 第 二 项 为 零 意 味 着 条 件 (2. 30)成 立 。 因 而 ,
简单 回 归
系数要有因果效应的解释,
特别是想解释为A T E ,
必须要求下列两个条件同时
成 立 。 (5. 34)(5,35)实 际 是 (2. 28)(2. 30)的 复 制 。
| D ; = 1] =
E [ Y 0; E [ Y 0iI D t ^ 0] (5.34)
E [ Y U \ D ; = 1] - E [ Y 1;
i D ; = 0] (5. 35)
那么,
什 么 时 候 回 归 系 数 可 以 解 释 为 干 预 组 平 均 因 果 效 应 呢 ?利用与上面
同样的方法,
可以将观测结果写成下列潜在结果形式:
Yi — a-^ TxrrDi + e;
其 中 a = ij.^,£;
=Voi + D ;
(Yi, —V"。
,.一tatt) ,
利用同样的方法,
可以证明:
rols = rATT + E [ Y oi \ D, = 1] — E [ Y 0;| D,- = 0]
因 而 ,回 归 系 数 r°u可 以 解 释 成 ttatt,(5. 34)必 须 成 立 。 同 理 ,
可 以 证 明 ,回归系
数要解释为控制组平均因果效应,
条 件 (5. 35)必 须 成 立 。
68 基本有用的计量经济学

综上,
如 果 只 有 条 件 (5. 34)成 立 ,回 归 系 数 可 以 解 释 为 干 预 组 平 均 因 果 效
应;
如 果 只 有 条 件 (5. 35)成 立 ,
.回 归 系 数 可 以 解 释 为 控 制 组 平 均 因 果 效 应 ;
如果
两 个 条 件 (5. 34)和 (5. 3 5 ) 同 时 成 立 ,回 归 系 数 可 以 解 释 为 总 体 平 均 因 果 效 应
(其 实 此 时 三 个 因 果 效 应 参 数 相 同 )。这 两 个 条 件 与 独 立 性 假 设 密 切 相 关 ,
在完
全随机化实验中,
我 们 知 道 潜 在 结 果 独 立 于 分 配 变 量 ,即 (
Y p U J L A .。独立
性条件成立,
则 (5. 34 ) 和 (5. 35)成 立 ,
但 反 过 来 不 一 定 。 因 而 ,条 件 (5. 34) 和
(5. 3 5 ) 比 独 立 性 假 设 弱 一 些 ,也 称 为 均 值 独 立 性 。它 只 对 一 阶 矩 有 限 制 ,
对高
阶矩没有要求,
而独立性是针对整个分布。
如 果 条 件 (5. 34)和 (5. 35)不 满 足 ,
简单回归系数将没有因果效应的解释。
或者说,
用回归系数去估计因果效应参数,
存 在 着 偏 差 。解 决 办 法 是 引 人 控 制
变量,
实 施 多 元 回 归 。多 元 回 归 在 什 么 情 况 下 有 因 果 效 应 的 解 释 呢 ?换 言 之 ,
如何引人控制变量呢?下 面 ,
将 控 制 变 量 X,.引 人 简 单 回 归 模 型 ,
为了得到显性
的解,
我们考察下面的饱和回归:
Y ;— rD,. + ^ , a rdx +£•; (5. 36)
J*

其 中 d r = l ( X , ^:r)。 因 为 饱 和 模 型 的 C E F 是 线 性 的 ,
从 而 上 式 满 足 E [ s ;| D ,.,
X,-] - 0 D 利 用 (5.10),D ; 的 回 归 系 数 为 :

产 = Cov(y^D,) = g[Y二
•D j (其 中 疚 = D : 一E [ D ; | x ;
])
Var(D,) E[Df]

= E L D iE l Y i | _ E[D,(E[y, | D ;= 0 , X t] + rxD ;)]


E i m
(利 用 虹 Y, | D ^ X . 3 = E [ r ; | D, - +

= E [ D , D , t x ] = E l D h x ^ = £ [ £ [ 玢 | X,]rx ]
ELDH £:
® ] E [ £ [ D f | X,]]
_ E [ E [ ( D ;- E l D , ] X,.])2 | X,]i-x ] _ £[Var(D, | X,)rx]
E [ E [ ( D , - - E [ D , | X,.])3 | X,.]] " E[Var(D, | X,-)]

= £ [ £ [ V a r ( D ,丨
丨X ;)]r x ] (5.37)

其 中 ,疚 是 D , 对 X,.饱 和 回 归 的 总 体 残 差 。饱 和 回 归 的 C E F 是 线 性 函 数 ,因

而 E[D,.丨兄. ] = 0 ,£ [ 方,.]=0。第 二 行 第 一 个 等 号 利 用 全 期 望 公 式 (5. 1 ) ,


第二
个等号中的定义为:
zx = E l Y i | X l>D i = l ] - £ [ y , [ X ;,D, - 0] (5.38)
第 五 章 线 性回 归 69

^ 实 际 上 是 用 特 征 为 X,.的 子 样 本 作 简 单 回 归 得 到 的 回 归 系 数 。第 三 行 利 用

C E F 分 解 特 征 ,E [ 5 , £ :
[ D , H x] = 0 。所 以 ,回 归 系 数 严 是 对 u 的 加 权 平
均 。因 而 ,
如果想使产有因果效应的解释,
其中的必须要有因果效应的解
释。 什 么 情 况 下 有 因 果 效 应 解 释 呢 ?将 ^ 写 成 潜 在 结 果 的 形 式 :
rx = IX^D, = 1]-E [ Y , I = 0]
= E l Y it | X ;,Di = 1 ] - E [ Y 0;I X ;, D (. = 0]
= E [ y ];
- y 0;I X , , D ; - l ] + E [ Y 0i | X ;,D, - 1] - E [ Y 0l | X ;,D, 0 ]'

V--------------------- ----------------------^
^ ------ ^ " —----V ;
=

rA T T CXO 选择偏左

(5.39)
- - Vo,' I X,.] + E [ y 0l I X,,D, = 1] - E [ Y 0, I X , ,
D,' = 0]
V " V
rA TE(JV.) 选抒偏差

+ ( i - ^ ( x > ) { E [ y u - y 0( i 足 ,a = i l - E [ Y u - Y oi I m = o ]}
两组闪果效应偏差

(5.40)
从第三行可以看出,
要 想 将 rx 解 释 成 特 征 为 X 群 体 的 干 预 组 平 均 因 果 效 应 ,

须 满 足 选 择 偏 差 为 零 ,即 满 足 下 列 条 件 :
E [ Y 0;丨 - 1] - E [ Y 0l- [ X i,Di = 0] (5.41)
第四行表明,
要 想 将 ^ 解释成特征为X 群体的平均因果效应,
必须满足选择偏
差 和 两 组 因 果 效 应 偏 差 同 时 为 零 ,即 需 要 同 时 满 足 条 件 (5. 41)和 (5. 42) 。
E[YU |X ;,D,- - 1] = E [ Y U | X, ,D, = 0] (5. 42)
rx 有 因 果 效 应 的 解 释 ,
t°1s也 具 有 因 果 效 应 的 解 释 。 (5. 4 1)和 (5. 4 2 )两个
条 件 称 为 条 件 均 值 独 立 性 假 设 (Conditional M e a n Ind印endence,C M I ) 。一个
更 强 的 条 件 是 条 件 独 立 性 假 设 (Conditional Independence Assumption, C I A ) ,
它要求以X;为条件,
潜 在 结 果 独 立 于 干 预 变 量 ,即 以 X i 为 条 件 ,
干预变量的分
配近似于完全随机化实验,
用公式表示为:
(Y0i,Yu )±D, | X r- (5.43)
启示:
为 什 么 要 引 人 多 元 回 归 ? 引 人 其 他 控 制 变 量 的 目 的 是 什 么 ? 在 利用
回归分析进行因果推断时,
如 果 条 件 (5. 34)或 /和 (5. 35)能 够 满 足 ,
简 单 回归系
数 就 可 以 有 因 果 效 应 的 解 释 。如 果 只 有 条 件 (5. 34)成 立 ,
简单回归系数可以解
释 成 干 预 组 平 均 因 果 效 应 。如 果 只 有 条 件 (5. 35)成 立 ,
简单回归系数可以解释
成控制组平均因果效应,
如 果 两 个 条 件 同 时 成 立 ,则 回 归 系 数 可 以 解 释 成 总 体
平 均 因 果 效 应 。如 果 条 件 (5. 34)和 ( 则 考 虑 引 人 控 制 变 量 X ;。
5. 35)都 不 成 立 ,
70 基本有用的计量经济学

控制变量的引人不是任意的,
引入控制变量的目的是使条件独立性假设能够成
立,
或 至 少 条 件 均 值 独 立 性 假 设 (5. 41 ) 或/ 和 (5. 4 2 ) 能 够 成 立 。如 果 只 有 条 件
(5. 41)成 立 ,引 人 控 制 变 量 后 ,回 归 系 数 可 以 近 似 解 释 为 干 预 组 平 均 因 果 效
应。
® 如 果 只 有 条 件 (5. 42)成 立 ,回 归 系 数 可 以 近 似 解 释 为 控 制 组 平 均 因 果 效
应 。 当 两 条 件 均 成 立 时 ,回 归 系 数 可 以 近 似 解 释 为 总 体 平 均 因 果 效 应 。

是 想 在 引 人 控 制 变 量 X ;后 ,
我们之所以引人多元回归, 使条件独立性假设
或至少条件均值独立性假设成立,
从 而 回 归 系 数 具 有 因 果 效 应 的 解 释 。对于这
一点,
也 可 以 用 因 果 图 进 行 描 述 。如 果 条 件 (5. 34)和 (5. 35)满 足 或 独 立 性 条 件
(Yo,.,
Y lf) J L U . 满 足 ,因 果 图 类 似 于 图 4. 3 , D 到 Y 的 因 果 效 应 可 以 直 接 识 别 ,回
归 系 数 体 现 出 的 相 关 性 就 是 两 变 量 之 间 的 因 果 效 应 。(5. 34)和 (5. 35)不 成 立 ,
因 果 图 为 图 5.1(a)。有 后 门 路 径 D —e—Y ,回 归 系 数 包 括 因 果 路 径 产 生 的 相 关
性 和 后 门 路 径 产 生 的 相 关 性 。后 门 路 径 造 成 的 相 关 性 和 因 果 路 径 产 生 的 相 关
性 混 杂 在 一 起 ,回 归 系 数 不 能 解 释 为 因 果 效 应 ,
存 在 选 择 偏 差 。如 果 混 杂 e 可
以分解成X 和 e 两部分,
并且造成e 混杂的主要原因是由X 造成的,
那么,
在简
单回归中引人控制变量X ,
相 当 于 图 5. 1(b)中 以 X 为 条 件 。根 据 后 门 规 则 ,阻
断 了 后 门 路 径 产 生 的 相 关 性 。那 么 ,回 归 系 数 表 现 出 的 相 关 性 只 剩 下 因 果 路 径
的 相 关 性 了 。控 制 变 量 X 的 引 人 ,
消除了混杂偏差,
使回归系数具有因果效应
的解释。

图 5 . 1 回归分析和因果效应

在多元回归分析中,
我们关心的解释变量和控制变量的地位是不一样的。
为强调这一点,
本 书 中 将 我 们 关 心 的 解 释 变 量 称 为 原 因 变 量 或 干 预 变 量 。在回
归分析中,
我 们 主 要 关 心 原 因 变 量 的 系 数 是 否 有 因 果 效 应 的 解 释 。对 于 控 制 变

① 在 满 足 茶 件 独 立 性 或 条 件 均 值 独 立 性 假 设 时 ,回 归 系 数 可 以 布 因 果 效 应 的 解 释 ,
但回归系数在
数值上并不完全等于平均因果效应或干预组平均因果效应。因 而 , 是对因果效应参数的近似, 至少得到
的 影 响 方 向 是 一 致 的 。在 下 一 章 的 匹 配 方 法 中 还 会 讨 论 。
② 事 实 上 ,如 果 两 个 条 件 均 成 立 , 总体平均因果效应、 干预组平均因果效应和控制组平均因果效应
三个因果效应参数完全一致。
第 五 章 线 牲回 归 71

量,
引人它们的目的是为了保证原因变量系数有因果效应的解释,
控制变量本
身 的 系 数 是 否 有 因 果 效 应 解 释 并 不 重 要 。 比 如 ,图 5. 2 有 两 条 后 门 路 径 。 当以
X 为条件后,
这两条后门路径均可以阻断,
从 而 在 回 归 分 析 中 引 入 控 制 变 量 X,
D 的 系 数 将 有 因 果 效 应 的 解 释 。但 X 的 系 数 并 不 是 X 对 y 的 因 果 影 响 ,因为
X 到 Y 存 在 混 杂 因 素 e 。对 于 我 们 关 心 的 因 果 问 题 而 言 ,
X 的系数是否有因果
效 应 解 释 并 不 重 要 ,重 要 的 是 引 入 X 之 后 ,
原因变量的回归系数将有因果效应
的解释。

图 5 . 2 原因变量和控制变量

2. 好 控 制 变 量 和 差 控 制 变 量

利用回归分析进行因果效应参数识别时,
应 该 如 何 选 择 控 制 变 量 呢 ? 或者
说什么样的变量才是好的控制变量,
什 么 样 的 变 量 是 差 的 控 制 变 量 ?根据第 四
章有羌选择偏差的讨论,
我们知道,
好的控制变量应该是发生在原因变量之前
或 取 值 不 随 原 因 变 量 变 化 的 变 量 ,即 好 的 控 制 变 量 是 潜 在 的 混 杂 因 素 。在 估 计
大学教育收益率时,
影 响 个 体 教 育 决 策 的 变 量 是 好 的 控 制 变 量 ,比 如 考 大 学 时
的 个 体 特 征 (不 随 教 育 决 策 变 化 的 性 别 、民 族 等 )、家 庭 背 景 (当 时 父 母 的 收 人 、
教 育 等 )、
学 习 成 绩 (高 中 学 习 成 绩 )、
地 域 等 。而 今 天 的 家 庭 背 景 等 信 息 不 是 好
的控制变量。
相应地,
可能受到原因变量影响的变量或发生在原因变量之后的变量不是
好 的 控 制 变 量 。仍 然 以 教 育 收 益 率 的 估 计 为 例 ,
个人职业和就业行业就不是好
的 控 制 变 量 。为 什 么 ? 因 为 个 人 职 业 及 就 业 行 业 往 往 是 教 育 完 成 之 后 个 人 选
择的结果,
也 就 是 说 ,这 些 变 量 发 生 在 教 育 之 后 ,可 能 受 到 教 育 的 影 响 。事实
上,
教育对职业选择有重要影响,
职业和行业往往存在着密切的联系,
这些变量
就 可 能 成 为 教 育 和 收 人 的 交 汇 变 量 ,以 交 汇 变 量 (
包 括 交 汇 变 量 的 子 孙 变 量 )为
条件,
将产生样本选择偏差。
72 基本有用的计量经济学

⑷好的控制 (b) 差的控制

图 5.3 好坏控制变量

好 的 控 制 变 量 如 图 5,3(a)中 的 X , 控 制 X 可 以 消 除 后 门 路 径 D — X — Y 造
成的混杂偏差,
差 的 控 制 变 量 如 图 5. 3 ( b ) 中 的 C ,控 制 C 将 打 开 非 因 果 路 径
c —y ,
从而造成样本选择偏差。

3 . 回归分析的缺陷

回归分析的好处是它很容易实现,
多数计量经济学软件均可以用一条命令
自 动 完 成 回 归 分 析 。正 因 为 回 归 分 析 的 自 动 性 ,
可能使用者不知道软件估计出
的 回 归 系 数 代 表 什 么 ? 即 使 总 体 上 C I A 条 件 成 立 ,在 利 用 样 本 进 行 回 归 分 析
时 ,由 于 抽 样 的 随 机 性 ,
可能使某些变量根据X 进行分层后,
层内只有干预组或
控制组样本,
从 而 (5. 37)式 中 rA. 没 有 定 义 ,回 归 将 对 这 些 样 本 赋 于 0 的 权 重 ,
或者说,
软 件 会 自 动 丢 弃 那 些 层 内 只 有 一 组 个 体 的 样 本 ,而 使 用 者 往 往 对 此 一
无 所 知 。 即 使 满 足 C I A 或 C M I ,丢 弃 样 本 后 所 得 的 回 归 系 数 也 不 能 解 释 为 总
体因果效应。
下 一 章 将 介 绍 匹 配 方 法 。在 匹 配 方 法 中 ,
使 用 哪 些 样 本 、丢 弃 了 哪 些 样 本
都非常清晰,
从而得到的估计解释为哪些群体的因果效应也非常清楚,
这是匹
配方法优于回归分析的地方。

第三节回归方法的软件实现

本 节 主 要 介 绍 回 归 方 法 在 Stata软 件 中 的 实 现 。首 先 简 要 介 绍 使 用 的 数
据,
然后介绍回归命令,
最后用回归方法估计中国城镇居民教育收益率。

1 . 数据

本 节 使 用 的 数 据 来 自 于 中 国 居 民 收 人 调 查 项 目 (C H I P ) 2 0 0 2 年 的 城 镇 样
本,
对 应 数 据 集 为 chip2002.dta 。主 要 变 量 包 括 个 人 年 收 入 、
年龄、
性别、
教育程
度、
工作年限、
所在城市、
就 业 行 业 等 基 本 信 息 。变 量 描 述 如 下 :
第 五 章线性 回归 73

. des
Contains data from chip2002. dta
obs : 9260
vars: 14 4 Dec 2016 1 1 ;
49
444480

storage display value


variable name variable label
type format label
prov int %Q.0g province code
city float %9.0g counties
id double %1 2 . Of unique household member code
wage float %9.0g annual income
Iwage float %9.0g log wage
male int % 9 ‘0g male 1 male 0 female
age float %9.0g age
edu int %9.0g edu _ education attainment
educ float %9.0g years of schooling
exper float %9.0g experience
industry int %9.0g industry

2. S ta t a 软件中的回归 命令

Stata软 件 的 回 归 命 令 为 regress,基 本 语 法 和 选 项 如 下 :

regress depvar [indepvars] [if] [in] [weight] [ ,options]

options Description

Model
noconstant suppress constant term

SE/Robust
vce(vcetype) vcetype may be o l s , robust,cluster clustvar, bootstrap,
jackknife, h c 2 f or hc3

Reporting
level( 掉) set confidence level ;default is level(95)

Stata中 回 归 实 现 非 常 简 单 ,
直 接 利 用 命 令 regress即 可 进 行 回 归 分 析 。必
选 项 depvar为 被 解 释 变 量 ,
可 选 项 indepvars是 解 释 变 量 列 表 ,
可以加也可以不
加,
if可 以 加 条 件 ,
in可 以 设 定 观 测 值 范 围 ,
weig h t 可 以 施 加 权 重 ,
选 项 nocon-
stant估 计 不 带 常 数 项 的 模 型 ,
选 项 vCe(vCetyPe)可 以 选 择 标 准 误 差 的 形 式 ,

74 基本有用的计量经济学

认 选 项 ols为 同 方 差 的 标 准 误 差 ,
其 他 类 型 包 括 稳 健 标 准 误 差 robust,
聚类 标 准
误 差 cluster clustvar,自 抽 样 标 准 误 差 bootstrap,刀 切 标 准 误 差 jackknife等 ,

细 可 以 参 考 regress的 帮 助 文 件 。选 项 level改 变 置 信 水 平 。 下 面 利 用 C H I P
数 据 估 计 基 本 的 Minc e r 方 程 ,
结果如下:

• reg lwage educ exper expersq, vce(robust)


Linear regression Number of obs = 9260
F( 3, 9256) = 499.77
Prob > F = 0.0000
R-squared = 0.1584
Root MSE = .69258
, ^ Robust ^ . , 「 „/
lwage Coef. tP > | t | [ 9 5
Std. Err,
educ .0873412 .0026585 32.85 0.000 .08213 .0925524
exper .0372778 .0031867 11.70 0.000 .0310312 .0435243
expersq - .0003619 .0000766 - 4.73 0.000 - .000512 - .0002119
_cons 7.544462 .0477489 158.00 0.000 7.450864 7.63806

输出结果包括两部分,
右上角显示样本数、
F 检验值及其p 值 、
拟合优度和
均 方 误 差 标 准 差 。第 二 部 分 显 示 回 归 结 果 ,包 括 各 解 释 变 量 系 数 、标 准 误 差 ^
统计量、
> 值 和 系 数 的 置 信 区 间 等 信 息 。如 果 上 述 模 型 满 足 C I A 条 件 ,
教育的
系 数 就 是 教 育 对 收 入 的 因 果 影 响 ,结 果 显 示 ,教 育 增 加 一 年 ,对 数 收 人 会 增 加
0 .087,
或 者 教 育 收 益 率 约 为 8.7% 。

3 . 中 国城镇居 民教育 收益率

表 5 . 1 用回归方法估计教育收益率

Cl) ⑵ . C3) (4 )
OLS OLS OLS OLS
educ 0 .0 8 7 3 *** 0.08 23 "** 0 .0 6 1 8 *** 0 .0618**'
(0.0027) CO.0026) (0.0026) (0.0041)
exper 0. 0 3 7 3 “ * 0. 0427*** 0. 0423*,, 0.0423*“
(0.0032) ( 0 .0 0 3 1 ) (0.0030) (0.0040)
expersq -0 .0 0 0 4 “ * - 0 .0 0 0 6 “ * -0 .0 0 0 7 *“ - 0 . 0007“ *
(0.0001) (0.0001) (0.0001) (0.0001)
male 0. 1938'** 0. 1802*** 0. 1802 ***
(0. 0141). (0.0137) (0.0222)
第 五 章 线 性 回 e 75
■----- 1

(续 表 )

(1) (2) (3 ) (4 )
OLS OLS OLS OLS

city No Yes Y es Yes

industry No NO Yes Ye s

N 9260 9260 9260 9260

Adj. R 2 0 .1 5 81 0. 2740 0. 3259 0. 3259

Standard errors in parentheses


*p<. 10, ** /><.05,… p<.01

我 们 估 计 4 个 模 型 。第 1 个 模 型 是 基 本 的 M i n Cer方 程 ,
解释变量只包括
教育年限、
工 作 经 验 及 工 作 经 验 平 方 。第 2 个 模 型 在 第 1 个 模 型 基 础 上 再 控 制
性 别 和 所 在 城 市 。第 3 个 模 型 在 第 2 个 模 型 基 础 上 进 一 步 控 制 行 业 。第 4 个
模 型与第3 个模型相同,
但 采 用 聚 类 到 城 市 的 标 准 误 ,而 前 三 个 模 型 均 采 用 稳
健 标 准 误 差 。估 计 结 果 见 表 5 .1,
其 中 city表 示 是 否 控 制 城 市 固 定 效 应 ,
indus­
try 表 示 是 否 控 制 行 业 。第 1 列 显 示 估 计 的 教 育 收 益 率 为 8 . 7 % 。第 2 列 估 计
的 教 育 收 益 率 为 8 . 2 % 。第 3 列 估 计 的 教 育 收 益 率 为 6.2% 。前 三 列 均 使 用 选
项 vCe(robUSt)报 告 稳 健 标 准 误 差 。第 4 列 采 用 了 与 第 3 列 一 样 的 模 型 设 定 ,

采 用 聚 类 到 城 市 的 稳 健 标 准 误 差 vceUkister city),
教育收益率估计没有变化,
标准误差估计有所不 同 。

第四节总 结

总 体 回 归 函 数 和 条 件 期 望 函 数 有 着 密 切 的 联 系 。如 果 条 件 期 望 函 数 是 线
性的,
两 者 完 全 一 致 (定 理 5. 1)。如 果 条 件 期 望 是 非 线 性 的 ,回 归 函 数 是 对 条 件
期 望 函 数 (均 方 误 最 小 意 义 上 )的 最 优 线 性 近 似 (定 理 5. 2 )。如 果 条 件 期 望 函 数
有 因 果 效 应 的 解 释 ,回 归 函 数 就 有 因 果 效 应 的 解 释 。如 果 满 足 条 件 独 立 性 假 设
或 条 件 均 值 独 立 性 假 设 ,回 归 系 数 可 以 解 释 为 总 体 的 平 均 因 果 效 应 。在 回 归 分
析中,
引 入 控 制 变 量 的 目 的 就 是 希 望 能 够 使 条 件 (均 值 )独 立 性 假 设 成 立 。

輯 ,推 荐 阅 读

Angrist and Pischke (2009)第 3 章 'Morgan and Winship (2015)第 6 章均


对 回 归 和 因 果 效 应 参 数 的 关 系 进 行 了 很 好 的 讨 论 。 洪 永 淼 (2 0 1 1 ) 第 2 章对正
76 基本有用的计量经济学

确模型设定进行了详细讨论 。

全 期 望 公 式 (5 . 2 ) 的一个证明。
E L Y ; 丨X,] - E I E [ Y ; I X,,Z J | X ;]
证 明 假 设 Y 、Z 为离散型随机变量,
E [ E [ Y | X = x , Z ] | X = x]

二 ^ j E [ Y iX = = zj • Pr[Z = z | X = x]

— H :
V * P r[Y = = = Pr[Z — z \ X ~ x']
~ y

_ ^ ^ Pr[Y — y,X = a:,Z — z] Pr[Z — z>X = a: J


~ V , ~Pr[X = x , Z - z ] • P r [ X =\r]
— ▽ ▽ Pr[y = y , X — x ,Z — z3
= P r [ X = 工丁
= Pr[Y-^,X^x]
一 Pr[X - : ]

二 2 》Pr[Y = ^ i x =- ^]

= ElY | X = .r]
在这一章,
我们将讨论另一种流行的方法,
这种方法的使用前提也是要求
条 件 独 立 性 假 设 ( C I A ) 或 条 件 均 值 独 立 性 假 设 (C M I ) 成 立 。 因 而 ,
无论是回归
方法还是匹配方法,
如果要使其估计量有因果效应的解释,
必须要满足C I A 或
C M 1 。事 实 上 ,回 归 也 是 一 种 匹 配 ,
在后文中会具体讨论两者的关系。

第一节协变量匹配方法

1. 协变量匹配

在 估 计 因 果 效 应 的 时 候 ,我 们 面 临 着 因 果 推 断 的 基 本 问 题 (Holland,
1986) ,
只 能 观 察 到 一 种 干 预 状 态 下 的 结 果 ,无 法 观 察 到 其 他 干 预 状 态 下 的 结
果 。匹 配 方 法 的 基 本 思 想 就 是 对 于 干 预 组 个 体 ,
在控制组中寻找特征相似的控
制组个体与其相匹配,
从而用控制组个体的结果来估计干预组个体的反事实结
果 。回 顾 因 果 效 应 参 数 A T T :
rATT = E \ Y U —Yoi I Di = 1]
= E [ Y U | D, = 1] 一 E [ y 0,- I A. = 1] (6. 1)
第一项是干预组1 的期望值,
在数据中是可观测的,
第二项是干预组的期
望 值 ,在 数 据 中 是 观 测 不 到 的 ,
是反事实结果。
在 完 全 随 机 化 实 验 中 ,由 于 干 预 是 随 机 化 分 配 的 ,
有 |D ;= l] = E [ Y 0l.
IA . = 0 ] , 可 以 直 接 用 控 制 组 的 观 测 结 果 £[Y,. ID,. = 0]来 作 为 干 预 组 反 事 实 结
果 = 的估计,
从 而 可 以 估 计 出 A T T 。在 分 层 随 机 化 实 验 中 ,
在层内
为 完 全 随 机 化 实 验 ’ 满 足 C I A 条 件 ,即 ( Y 0l , y 1;)JL D ;IX ;,则 有 E [ y 0,-1 X,-,D i=
i ] = £ [ y w U,.,
A = o ] ,即 在 相 同 的 足 层 内 ,干 预 组 的 反 事 实 结 果 E [ y 0,-1x,,
D,. = l]可 以 用 控 制 组 的 观 测 结 果 E [ m . ,
D , = 0 ] 来 进 行 估 计 。干 预 组 的 反 事
实 结 果 E [ Y 0l IDi = 1]很 谷 易 估 计 ,即
E [ Y oi |D ;二 1 ] = E { E L Y oi | X i,Di = 1] 丨 D; = 1}
= E { £ [ Y 0i- I X t,D, = 0] 1 D ; = 1}
= E{E[Y, | X , ,
D ‘= 0] | D, = 1}
在观测研究中,
如 果 条 件 独 立 性 假 设 (C I A ) 成 立 ,

78 基本有用的计量经济学

( Y 0,^i,) JLD, | Xi (6.2)


则 因 果 效 应 参 数 可 以 识 别 。(6. 2)说 明 控 制 观 测 协 变 量 X,.后 ,
干预组和控制组
两组潜在结果分布相似,
未观测变量不会对潜在结果分布有系统性影垧,
从而
相 同 的 X,•层 内 ,
数据类似于完全随机化实验,
在层内两组观测结果平均值之差
是 对 层 内 平 均 因 果 效 应 的 估 计 。 因 而 ,匹 配 方 法 近 似 于 分 层 随 机 化 实 验 ,
这要
求根据兄分层后,
未观测变量不会造成潜在结果的差异^ 因而,
如 果 满 足 CIA
条件,
则干预组平均因果效应可以识别。
rAT T = E l Y u —y 0i I Di -= 1]
= E i E C Y H - Y c , - I X 1,Di = 1] I D, = 1}
= EiECYn- I X,.,A = l ] - E [ Y 0l- ] X i,Di = 1] | D ; = 1} (6.3)
其 中 第 二 行 利 用 全 期 望 公 式 (5. 2)。C I A 条 件 意 味 着 有 下 式 成 立 :
E l Y oi | X ,,D1 - 1] - E l Y 0i | X t,Di = 0] (6. 4)
即 相 同 的 协 变 量 的 情 况 下 ,两 组 基 线 潜 在 结 果 将 分 布 相 同 ,
从 而 均 值 相 同 ^上
式左边是干预组的反事实结果,
是不可观测的,
右边是控制组的观测结果,
从而
在 C I A 条件下,
可以利用可观测的控制组结果来作为干预组反事实结果的估
计,
将 (6. 4)代 人 (6. 3 ) ,
则有
rATT= E { E l Y u | X ;,
D, - l ] - E [ Y 0,- I X,,D, = 0] | D, = 1}
= EiElY, | X,,D,- = 1] — £[Y, | = 0] | = 1} (6.5)
. y ' '

其中,
rx = E l Y t | X,-,
A = 1 ] - £:
[Y, | X , , D f - 0] (6.6)
r x 是 相 同 协 变 量 X,.层 内 两 组 结 果 平 均 值 之 差 。 (6. 4 ) 和 (6. 5)说 明 如 果 C I A
满足,
根 据 观 测 特 征 X ;进 行 匹 配 ,
从 控 制 组 中 找 到 相 同 特 征 的 控 制 组 个 体 ,匹
配后,
利 用 具 有 相 同 特 征 的 控 制 组 结 果 作 为 干 预 组 反 事 实 结 果 的 估 计 ,即 (6.
4 ) 。匹 配 样 本 因 果 效 应 的 估 计 体 现 在 (6. 5 ) 和 (6. 6 ) 。 (6. 5) 式 显 示 ,
根据协变
量匹配后,
层 内 平 均 因 果 效 应 为 rx ,
则干预组平均因果效应是利用协变量在干
预 组 中 的 分 布 Pi"[X=a:
丨1),.= 1]对 ^ 进 行 加 权 得 到 ,
相应的样本形式即干预组
平 均 因 果 效 应 的 匹 配 估 计 量 fATT。如 果 X , 为 离 散 变 量 ,

rATT = E I tx I D, = 1] = ^ IU = 1] (6. 7)
J

事实上,
不同的因果效应参数,
对 应 于 对 的 不 同 加 权 ,比 如 总 体 平 均 因
果 效 应 A T T ,则 相 应 的 匹 配 测 度 为 :

Fate = £ [ r x ] = y^r^Pr[X,- = x] (6. 8)


第 六 章 匹 配 方 法 79

(6. 7 ) 和 (
6. 8 ) 显 示 ,所 有 的 匹 配 估 计 量 都 依 赖 rx ,而 rx 是 具 有 相 同 特 征
X , 的干预组和控制组观测结果平均值之差。因 而 ,
要 估 计 出 rx ,
就要求总体上
特 征 为 X , 的个体在干预组和控制组都有个体存在,
否则,
仅有一组个体,
rx 将
没有定义,
相应的匹配估计测度也没有定义。因 而 ,
为了保证能够实施匹配,

需要另一个条件:
共 同 区 间 要 求 (c o m m o n support) ,
用公式表示为:
0 < Pr[E»,- - 1 i X ;] < 1 (6.9)
Pr[D,. = l 丨
X f]实 际 上 是 倾 向 指 数 (propensity score),
反 映 的 是 具 有 特 征 X /的
通 常 简 记 为 p C X O 。 (6. 9)表 示 ,
个 体 接 受 干 预 的 可 能 性 ,因 为 它 是 X,.的 函 数 ,
根 据 观 测 变 量 X,.分 层 后 ,
层内均有干预组和控制组两组个体,
从 而 保 证 tx 有
定义,
可以利用匹配方法估计相关因果效应参数。
因而,
在 使 用 匹 配 方 法 估 计 总 体 平 均 因 果 效 应 (A T E ) 时 ,
需 要 满 足 (6. 2 )和
(6. 9 ) 两 个 条 件 。 当 然 ,如 果 关 心 的 因 果 效 应 参 数 是 干 预 组 平 均 因 果 效 应
(ATT),上述两个条件都可以放松一些,
只需要基线潜在结果满足条件独立性
假设,
并 且 只 需 要 倾 向 指 数 小 于 1 ,即
y 0, X D , - | X,- (6.10)
和 Pr[D,. = 1 | X,] < 1 (6.11)
事实上,
为 了 识 别 干 预 组 平 均 因 果 效 应 ,只 需 要 满 足 条 件 (6. 10)甚 至 更 弱
的 条 件 (6. 4 ) 。在 匹 配 时 ,
可以允许相同特征的控制组个体没有对应的干预组
个 体 ,即 P r[ D ,.二 11足 ] = 0 ,
但 相 同 特 征 的 干 预 组 个 体 ,总 是 能 找 到 相 应 的 控 制
组 个 体 相 匹 配 ,即 P i A - l U J C l 。®

2 . 匹配与回归

匹 配 方 法 和 回 归 方 法 要 识 别 因 果 效 应 参 数 都 要 求 C I A 条 件 成 立 ,这 不 奇
怪,
事 实 上 ,回 归 方 法 也 是 一 种 匹 配 方 法 。在 上 一 章 ,我 们 推 得 的 回 归 系 数
(5. 37)复 制 到 这 里 ,g卩


's = e [ e I v ^ w ! \ x ;)]r x ] (6,12)

可以看出,
总 体 回 归 系 数 也 是 对 tx 的 加 权 ,与 上 文 的 匹 配 估 计 测 度 (6. 7 ) 和
(6. 8)相 似 ,只 是 加 权 的 权 重 有 所 不 同 。
Var(D,- | 兄 )= p ( X , ) ( l - p ( X ;))
其 中 ,/>(兄 )= ^ 1 :
[以 = 1 1 足.],
总体回归系数可以写成:

© 同 样 地 ,如 果 只 关 心 控 制 组 平 均 因 果 效 应 A T C ,那 么 识 别 条 件 只 需 要 或 fTCYwl
X.’
D e U - E T Y h . l U e O ]和 P r [ D , = l U , ] > 0 。
80 基本有用的计量经济学

, ( p(x) (1 — /?(x) )Pr[X, = x ] )


^ = ? [ s c ^ ( x ) ( l - />(x))]Pr[X, = x ])Tx
r° (6.13)
.r

因 而 ,回 归 系 数 是 条 件 方 差 加 权 的 ,
相应地,
A T T 的匹配测度为:
^att = y ^ r^ P rC X ;= x 丨Di = 1]
■r

— PrEA. = 1 | X/ = x]Fr[X/ = x]
^ ^ ) P r [ D / = 1 丨足= xJPr^Xi = x^\
,r

▽^厂 p(a:
)Pr[X, = .r] A
(6. U )

(6. 13)和 (6. 14)在 形 式 上 非 常 相 似 ,


差 异 主 要 体 现 在 回 归 系 数 (6. 13 ) 中分
子 分 母 多 了 一 项 1 —/K:r)。 回 归 系 数 是 干 预 变 量 的 条 件 方 差 进 行 加 权 的 ,
条件
方 差 在倾向指数/K:r)=0.5时取值最大从而回归系数对那些层内两组个体数
目 相 同 的 层 赋 予 更 大 的 权 重 。 (6. 14) 中 匹 配 估 计 测 度 是 利 用 倾 向 指 数 进 行 加
权的,
并且对那些层内干预组个体更多,
’即倾向指数更大的层赋予更大的权重。
两 个 参 数 一 般 情 况 下 是 不 枏 同 的 ,因 而 ,回 归 系 数 尽 管 在 满 足 C I A 条 件 下 有 因
果效应的解释,
也 往 往 与 因 果 效 应 参 数 在 数 值 上 有 差 异 。但 有 两 种 情 况 两 者 是
一致的,
一种情况是倾向指数是常数,
/>(足 )= / > ,
类似于完全随机化实验,
无论
个体特征如何,
接受干预的可能性均为p ,
此时回归系数与因果效应参数一致。
第 二 种 情 况 是 r.Y 是 常 数 ,
不同特征的个体平均因果效应相同,
从而是符合常数
因果效应模型,
上述两个参数在这种情况下,
都 等 于 常 数 ,因 而 ,
如果不存在异
质 性 ,回 归 系 数 等 于 因 果 效 应 参 数 。
另 外 ,(
6. 13)还 表 明 ,回归系数对于丨顷向指数为0 或 为 1 的 层 ,
将赋予0 权
重 。 回 归 时 它 会 自 动 丢 弃 那 些 仅 有 一 组 个 体 的 层 ,而 研 究 者 往 往 不 知 道 丢 弃 了
哪些层,
得到回归系数不能解释为对总体平均因果效应的估计,
真正进入回归
的 样 本 已 经 不 能 反 映 总 体 的 信 息 。协 变 量 匹 配 测 度 的 好 处 就 在 于 匹 配 时 ,
需要
考 虑 共 同 区 间 要 求 (6. 9)是 否 满 足 ,
从而很清楚哪些样本进人E 配 ,
哪些样本被
丢弃,
从 而 清 楚 所 得 到 的 匹 配 估 计 量 可 以 解 释 为 哪 些 子 总 体 的 因 果 效 应 ,这也
是匹配方法相对于回归方法的优势之一。

第二节倾向指数匹配方法

要 实 施 匹 配 方 法 ,除 满 足 条 件 独 立 性 假 设 外 ,还 需 要 满 足 共 同 区 间 要 求 。
即使总体上满足共同区间条件,
但由于抽样的随机性,
也有可能使我们拿到的
第 六章 匹 配 方 法 81

样 本 出 现 根 据 X,.分 层 后 ,
层 内 只 有 一 组 个 体 的 情 况 。另 外 ,当 观 测 变 量 很 多 ,即
X,是高维度向量,
根 据 X,.分 层 时 ,
也可能出现层内仅有一组个体的情形。比
如,
一 个 调 查 数 据 中 有 1 7 个 协 变 量 ,即 使 每 个 变 量 只 取 两 个 值 ,根 据 这 1 7 个变
量进行分层,
共 有 217 = 1 3 1 0 7 2 个 层 ,
如果样本容量仅有几千个点,
那么根据协
变量匹配时,
肯 定 出 现 很 多 层 内 没 有 数 据 或 仅 有 一 组 数 据 的 情 形 。上 述 两 种 情
况 都 会 使 得 rAi 有 定 义 ,
从 而 无 法 计 算 因 果 效 应 参 数 。为 了 解 决 这 一 “维 度 诅
咒 ”问 题 ,
Ro s e n b a u m and Rubin (1983)提 出 了 倾 向 指 数 匹 配 方 法 ,
使根据观测
变 量 X i 进行匹配转向对一维的倾向指数进行匹配。

定 义 1(倾 向 指 数 ) 倾 向 指 数 定 义 为 :
p ( X O = E l D t I X ;J = P r [ D t - 1 | X,] (6, 15)
上文已经提到,
倾向指数反映的是具有特征兄的个体接受干预的可能性,
实际
上 是 个 体 的 干 预 分 配 概 率 。在 随 机 化 实 验 中 ,这 一 概 率 是 由 实 施 实 验 者 控 制
的,
而在观测研究中,
倾向指数往往是未知的,
需要进行估计。

定 义 6, 2 ( 平 衡 指 数 ) 函 数 6(_r)是 一 个 平 衡 指 数 ,
如 果 满 足 D,. JLX, I
MX,).
平 衡 指 数 可 以 使 两 组 协 变 量 平 衡 ,即 以 平 衡 指 数 为 条 件 ,
干预组和控制组
协 变 量 分 布 相 同 。平 衡 指 数 不 是 唯 一 的 ,比 如 X , 本 身 就 是 平 衡 指 数 ,
事实上,
X,-的 函 数 都 是 平 衡 指 数 ,
而我们更关心低维度的平衡指数,
倾向指数就是一个
平 衡 指 数 ,并 且 是 一 维 的 。

引 理 6.1(倾 向 指 数 的 平 衡 指 数 特 征 } 倾 向 指 数 是 一 个 平 衡 指 数 ,即 D, JL
X,|p(X,)0
证 明 要证明 D,. JLX ,.|> ( X ,.) ,
等价于证明 P r [ D f= 1 丨兄,
/>(X , )] = Pr[D,.
= 1 1/)(X;
)]o 左 边 为 :
/;(兄.)]二 E [ D ;| X,-] =
Pr[D,- = 1 | X (^(X,-)] = £ [D,-丨兄,
(6. 16)
其中,
第二个等号利用条件期望性质耵y U ,
g(;
G]=£:
[ Y U ],
最后的等号利
用 倾 向 指 数 的 定 义 。右 边 为 .*
Pr[D,. = 1 | ^ ( X , ) ] = E [ D ; | p(X,)l = E[E[D,- | | ^(X,)]
= E l p ( X ;) | ^CX,)] = p i X )
第 二 个 等 号 利 用 全 期 望 公 式 (5. 2 ) ,
第 三 个 等 号 利 用 (6. 16)的 结 果 ,
从而两边相
等,
命题得证。
平衡指数特征是倾向指数本身的特征,
并不是假设,
也不是条件独立性假
82 基本有用的计量经济学

设 的 结 果 。在 倾 向 指 数 估 计 中 ,
可 以 用 来 检 验 倾 向 指 数 模 型 是 否 充 分 (adequa­
cy) 。 如 果 估 计 的 倾 向 指 数 没 有 问 题 ,
那么它应该满足平衡指数特征,
相 反 ,如
果发现不满足平衡指数特征,
说明倾向指数模型可能存在问题,
需要修正。
倾向指数的另一个重要特征是,
如 果 分 配 机 制 满 足 (相 对 于 X,.)非 混 杂 性 ,
那么,
它也是相对于倾向指数非混杂的,
这正是倾向指数定理的基本内容。

定理 6 , 1 ( 倾 向 指 数 定 理 , Rosenbaum and R u bin ,1 9 8 3 ) 如 果 有 (Y Qi,


Y U)

证 明 要 证 明 (Y Di,Y U J L D; 丨
p ( X i ) ,等 价 于 证 明 化 [ 以 = 1 丨Y 0i, Y 1;
,

p C X i G - P / f D i - l l p C X i )]。
Pr[D,- = 1 | U p d . ) ] = E [ D ; | Y 0;,Y u ,p(X,)J
= E i E W , 丨Y 0,-,YH ,
;Cf,
/p(X,.)] | Y o m Y h ^ C X , ) }
- E { E [ D i | X.-^CX,-)] | Y,i,Yy,,p{Xi))
= E { E [ D , | ^(X,)] | Y 0itY iltp ( X ;)}
= E [ D ;| j!>(X,)] = P r [ D ;== 1 | jt'CX,)]
第 二 行 利 用 全 期 望 公 式 (5. 2 ) ,第 三 行 利 用 C Z A 条 件 ,
E[D,. I = ElDi |X n p ( X ^
第四行利用倾向指数是平衡指数的特征,

E L D ; | X , . ^ ( X , . ) ] ^ E [ D ; 丨AX,.)]
倾向指数定理6.1告诉我们,
如果以观测变量Xi为条件,
分配机制类似于
随机化实验,
那 么 ,以 倾 向 指 数 p(Xi)为 条 件 ,
分配机制也近似于随机化实验,
因而,
可以根据倾向指数进行匹配,
总体平均因果效应的倾向指数匹配估计测
度可以写成:
d E [ y lt. - y 0f] = E { E [ n , . | p ( x ;^ }
= E { E l Y u I / . ( X . O D - E C Y o , - | 夕(X - ) ] } ■
= E { E [ Y U I p ( X i),Di = l ] - E [ Y 0i | p ( X i),Di = 0]}
- E{E[Y,. | ^ ( X , ) , D ;- l ] ~ E [ y f | 》(X,.),
D,. = 0 ]}
= £[rj (6.17)
第 二 行 利 用 全 期 望 公 式 (5.1),
第四行利用倾向指数定理,
其 中 T p 是相同倾向指
数的两组个体观测结果之差,
定义为:
rp — E[Yi | p(Xi) — p,Di = 1] — E[Yj | p{X,) ^ p , D ;= 0] (6. 18)
类似地,
干预组平均因果效应的倾向指数匹配估计测度为:
rAT7 — E\^zp 丨£),. = 1] (6. 19)
在观测研究中,
倾 向 指 数 匹 配 包 含 两 个 步 骤 :第 一 步 ,估 计 倾 向 指 数 ;
第二
第 六 章 匹 配 方 法 83

步,
根 据 估 计 的 倾 向 指 数 进 行 匹 配 。具 体 实 施 方 法 下 一 节 介 绍 。

第三节匹配方法的基本步骤

上文讨论了匹配方法的基本思想,
推出了协变量匹配测度和倾向指数匹配
测 度 。下 面 ,
我们转向样本视角,
讨 论 匹 配 方 法 的 实 施 步 骤 。匹 配 方 法 可 以 分
成 四 个 基 本 的 步 骤 :定 义 相 似 性 、实 施 匹 配 、
评价匹配样本的匹配效果、
估 计因
果 效 应 (Stuart, 2010)。前 两 个 步 骤 可 能 需 要 重 复 多 次 ,
直至达到较好的匹配
效 果 。前 三 个 步 骤 通 常 称 为 “设 计 ”阶 段 ,
在前三个步骤中,
不涉及结果变量,

像 在 真 正 的 随 机 化 实 验 中 一 样 。在 进 行 实 验 设 计 时 ,
研究者还没有看到结果,
在观测研究中,
观测结果往往已经存在于数据中,
但为了保证设计的科学性,

免研究者有意或无意的主观性— 根据结果选择模型或样本,
在 “设 计 ”阶段是
不需要观测结果的,
这 也 是 实 证 研 究 “科 学 性 ”和 “可 信 性 ”的 关 键 。 当“设 计 ”阶
段完成之后,
获得满意的匹配样本,
再 引 人 结 果 变 量 进 行 因 果 效 应 估 计 。下面
分别就这四个阶段进行讨论。 .

1. 定义相似性

匹配方法是为每个干预组个体寻找特征相似的控制组个体进行匹配或者
为 每 个 控 制 组 个 体 寻 找 特 征 相 似 的 干 预 组 个 体 进 行 匹 配 ,因 而 ,如 何 定 义 相 似
性 是 匹 配 方 法 实 施 的 基 础 。定 义 相 似 性 阶 段 包 含 两 个 层 面 的 工 作 :
第一,
应该
选择哪些变量作为定义相似性的依据;
第二,
如何将这些变量形成一个相似性
的测度。
首先,
考 察 应 该 选 择 哪 些 变 量 作 为 定 义 相 似 性 的 依 据 。选 择 变 量 的 主 要 依
据是条件独立性假设,
C I A 说 明 一 旦 控 制 了 协 变 量 ,干 预 组 和 控 制 组 个 体 没 有
未 观 测 差 异 。因 而 ,同 时 影 响 干 预 变 量 和 结 果 变 量 的 混 杂 因 素 都 应 作 为 协 变 量
作 为 匹 配 依 据 。在 倾 向 指 数 匹 配 中 ,
如果引入与干预变量没有关系的变量不会
有太大影响,
它 们 对 倾 向 指 数 模 型 没 有 影 响 ,当 这 些 变 量 是 影 响 结 果 变 量 的 重
要因素时,
引 人 它 们 可 以 提 高 估 计 精 度 。如 果 引 人 与 结 果 变 量 没 有 关 系 的 变 量
会 稍 微 增 加 估 计 标 准 误 差 。如 果 遗 漏 重 要 的 混 杂 因 素 将 会 造 成 显 著 的 偏 差 。
因而,
对结果变量有重要影响的协变量,
无论是否与干预变量有关系,
均可以引
84 基本有用的计量经济学

人 协 变 量 作 为 匹 配 的 依 据 。®
其次,
定义相似性需要一个测度,
一般应用中通常可以采用欧氏距离或马
氏 距 离 (Mahalanobis metric)。欧 氏 距 离 定 义 为 :

diX^Xj) =
V k^\
其中,
协 变 量 ,
石 ,
…, 是 K X 1 维的向量, 为了消除不同协变量量
纲的差异,
也可以采用标准化的欧氏距离,
定义为:
diX^Xj) = ^ { X . - X jY A - H X ^ X j )
其中A 是一个K X K 维的对角矩阵,
对 角 元 素 是 协 变 量 的 方 差 4 ,々= 1 ,… ,
K a 因而,
标准化欧氏距离也可以写成:

d(X,-,Xp - ( X ';~ 2 ^ ~ (6.20)

标 准 化 欧 氏 距 离 的 好 处 是 消 除 了 量 纲 的 影 响 ,比 如 协 变 量 中 包 括 年 龄 和 收 人 ,
一个干预组个体与一个控制组个体年龄相差1 岁 ,
收 人 相 差 1000元 ,
与另一 个
控制组个体年龄相差5 岁 ,
收人相差100元 ,
那么,
这两个控制组个体哪一个与
干 预 组 个 体 更 相 似 呢 ?如 果 直 接 用 欧 氏 距 离 进 行 测 度 ,
第 一 个 距 离 约 为 1000,
第 二 个 距 离 约 为 10 0 ,
因而,
第 二 个 控 制 组 个 体 与 干 预 组 个 体 更 相 似 Q 如果将 收
入的计量单位改为千元,
这时,
再计算欧氏距离,
第 一 个 距 离 约 为 1.4,
第二个 距
离约为5,
结 果 会 是 第 一 个 个 体 与 干 预 组 个 体 更 相 似 。因 而 ,
协变量计量单位不
同,
找 到 的 匹 配 对 象 将 发 生 显 著 变 化 。但 是 标 准 化 的 欧 氏 距 离 不 会 出 现 这 一 问
题 ,因 为 当 计 量 单 位 变 化 时 ,
标准差的单位也发生了相应变化,
两者的比值是不
会 变 化 的 。因 而 ,
在匹配方法实施中,
利用标准化欧氏距离更合适。
马氏距离与标准化欧氏距离类似,
也是一种消除量纲差异的距离测度,

进 一 步 考 虑 了 不 同 协 变 量 之 间 的 相 关 性 。马 氏 距 离 定 义 为 :
d C X ^ X j ) = V ( X i- X jy2-xl( X i~ X J) (6.21)
其中, 是 协 变 量 X 的 方 差 协 方 差 矩 阵 。一 般 而 言 ,
如果估计的因果效应参数
是 A T T ,厶 是 控 制 组 协 变 量 的 方 差 协 方 差 矩 阵 ;如 果 估 计 的 是 A T E ,_SX 是所
有 协 变 量 的 方 差 协 方 差 矩 阵 (Stuart, 2010) 。

① Imbens and Rubin (2015)提 出 一 种 递 归 的 方 法 a 在 估 计 倾 向 指 数 模 型 时 ,


应该引人哪些协变量
作为匹配的依据,他们指出可以先根据经济理论和直觉,首 先 引 人 一 些 基 本 的 协 变 — 那些被认为是
造成两组结果差异的混杂因素,估计一个基本的模型,然后再分别引人其他变量, 并 利 用 似 然比检验判断
是否应该引人,
最后根据估计的倾向指数检验其是否满足平衡指数特征, 不满足则继续引人协变量的二
次项和交叉项,
重复上面的过程, 直到满足平衡指数特征为止。
第 六 章 匹 配 方法 85

在倾向指数匹配中,
仍然可以采用标准化欧氏距离或马氏距离,
可以直接
利 用 倾 向 指 数 定 义 相 似 性 ,即 4 ( A )),
但应用中往往采用线性化倾向
指 数 。线 性 化 倾 向 指 数 即 对 数 或 然 比 (log odds ratio),定 义 为 :

li = (6.22)
倾向指数本身是协变量的非线性函数,
根据倾向指数进行匹配,
倾向指数
距离相同,
但 协 变 量 距 离 将 不 相 同 。 比 如 ,在 倾 向 指 数 为 0. 3 的 位 置 和 倾 向 指
数 为 ◦. 7 的 位 置 变 化 ◦. 1 ,
相 对 应 的 协 变 量 的 变 化 后 者 将 更 大 。因 而 ,
倾向指数
意义上的相似并不能完全反映协变量意义上的相似,
而线性化的倾向指数会使
两 者 一 致 。在 倾 向 指 数 估 计 中 ,
通 常 使 用 logit模 型 ,
logit模 型 有 一 个 特 征 ,

是 对 数 或 然 比 是 协 变 量 的 线 性 函 数 。logit模 型 如 下 :

p i X ;) = P r [ D ; = 1 | X,.] = 1 ?XP(5 v ^ (6- 23)


1 + exp(Xi{3)
则容易证明:

^ ln〔
r ^ y > 0 ( 6 ’2 4 )

因而,
线 性 化 倾 向 指 数 定 义 的 相 似 性 与 根 据 协 变 量 定 义 的 相 似 性 是 一 致 的 。在
利用倾向指数匹配方法时,
更 为 合 适 的 相 似 性 测 度 是 七 /,,
/;),
^/( • ) 为 欧 氏 距
离或马氏距离。
在定义相似性时,
上 述 几 种 测 度 可 以 结 合 起 来 使 用 。对 于 协 变 量 中 的 离 散
变量,
可以进行精确匹配,
使 距 离 完 全 为 零 定 义 为 相 似 性 。对 于 连 续 变 量 ,
需要
进 行 不 精 确 匹 配 ,比 如 根 据 (线 性 化 的 )倾 向 指 数 进 行 匹 配 ,为 了 保 证 不 精 确 匹
配的匹配效果,
可 以 根 据 倾 向 指 数 设 定 卡 尺 (caliper),将 相 似 性 定 义 在 一 定 的
卡尺范围内。比如,
有卡尺的马氏距离匹配将距离定义为:

似 ,
幻 = p — 如 果 机 (6 25)

其 中 C 是 卡 尺 。上 述 距 离 定 义 说 明 ,只 有 当 在 卡 尺 范 围 内 时 才 有 可 能 相 似 ,在
卡尺范围之外,
将 不 可 能 是 相 似 的 。R o s e n b a u m and Rubin (1985)建 议 利 用 线
性 化 倾 向 指 数 标 准 差 的 0 , 2 5 倍作为卡尺
关 于 倾 向 指 数 模 型 的 估 计 ,目 的 不 是 协 变 量 对 干 预 的 因 果 效 应 ,
而是保证
倾 向 指 数 满 足 平 衡 指 数 特 征 。lmbens and Rubin (2015)提 出 了 一 种 估 计 倾 向
指数模型的方法,
它包括下面几个步骤:
第一步,
根据经济理论或直觉构造一个
基本的倾向指数模型。比如,
考 察 大 学 教 育 对 个 人 收 人 的 影 响 ,基 本 的 倾 向 指
数 模 型 可 以 包 括 影 响 个 体 教 育 决 定 的 因 素 ,如 在 1 8 岁 左 右 考 大 学 时 的 个 人 特
86 基本有用的计量经济学

征、
高中学业成绩、
家 庭 背 景 等 信 息 可 能 需 要 进 人 倾 向 指 数 模 型 。利 用 logit模
型估计基本模型,
得到拟合的倾向指数,
检验基本模型是否满足平衡指数特征
(引 理 6.1)。如 果 不 满 足 ,
进人第二步,
如果满足,
则 停 止 。第 二 步 ,
如果发现估
计的倾向指数不满足平衡指数特征,
说明倾向指数模型不充分,
需要对倾向指
数 模 型 进 行 修 正 。如 果 还 有 其 他 协 变 量 没 有 引 人 模 型 ,则 通 过 逐 步 回 归 的 方
式,
再逐渐引人其他的协变量,
利 用 似 然 比 检 验 ,临 界 值 为 1 ,
超 过 1 的引人模
型,
否 则 不 引 入 。引 入 完 成 后 ,
再返回第一步重新估计倾向指数并进行平衡指
数检验,
若通过则完成,
若不通过,
返回第二步,
继续修改模型,
引人协变量二次
项 和 交 叉 项 ,仍 然 利 用 似 然 比 检 验 ,
临 界 值 调 整 为 2. 71 。经 过 一 、二 步 多 次 重 复
直 到 估 计 的 倾 向 指 数 满 足 平 衡 指 数 特 征 为 止 。研 究 发 现 ,
在倾向指数匹配中,
倾 向 指 数 模 型 误 设 (比 如 ,
真 实 模 型 有 二 次 项 而 在 估 计 中 没 有 引 人 二 次 项 )对因
果效应估计影响不大,
但 是 结 果 模 型 误 设 会 对 因 果 效 应 估 计 造 成 很 大 偏 差 (D e ­
hejia and W a h b a , 1999 ;赵 西 亮 ,
2015) 。

2 . 匹配实施方法

一旦定义如何测度相似性,
就 可 以 根 据 定 义 的 距 离 实 施 匹 配 了 。具 体 实 施
有很多方法,
常用的方法包括两种,
第一种是近邻匹配,
第二种是分层匹配。
(1) 近邻匹配
近邻匹配是一种常见的容易实施的匹配方法,
包括一对一最近邻匹配和一
对 多 近 邻 匹 配 。一 对 一 最 近 邻 匹 配 是 指 为 每 一 个 干 预 组 个 体 在 控 制 组 中 寻 找
一个距离最近的控制组个体与其匹配,
相应地,
一对多近邻匹配就是为每个干
预 组 个 体 在 控 制 组 寻 找 多 个 个 体 与 其 匹 配 。两 者 相 比 较 ,
一对一最近邻匹配,
最终的匹配样本比较少,
估计方差较大,
但每个干预组个体寻找到的都是最近
的 ,因 而 ,
偏 差 比 较 小 D 相 反 ,一 对 多 近 邻 匹 配 ,由 于 寻 找 的 匹 配 比 较 多 ,匹配样
本容量比较大,
估计精度提高,
但由于一对多近邻匹配中,
与干预组个体相匹配
的第二个、
第三个等后面的控制组个体与干预组个体的相似性下降,
从而估计
偏 差 会 增 加 。因 而 ,
在选择匹配方法的时候面临着估计方差和估计偏差的权
衡 。一 般 而 言 ,
一对一最近邻匹配会得到比较好的匹配样本,
如果控制组样本
数量很多时,
可 以 考 虑 一 对 多 近 邻 匹 配 。利 用 近 邻 匹 配 方 法 得 到 的 与 干 预 组 个
体 i相 匹配的控制组样本集M + , 定 义 为 :
M jU、= {j | d i X ^ X j X d i X ^ X j ^ ) )
或 M 仲 = {j I d C l ^ l j X d a ^ l j c o ) } (6.26)
其 中 D,. = l ,
D,=0,
X,(i)、
/ # 表 示 与 干 预 个 体 i相匹配的控制组个体的特征或
第 六 章 匹 配 方 法 87

线 性 化 倾 向 指 数 。如 果 是 最 近 邻 匹 配 ,M # 只 有 一 个 元 素 ,
若 是 一 对 6 近邻匹
配,
]^.(,.)有 々 个 元 素 。
在 实 施 一 对 一 最 近 邻 匹 配 的 时 候 ,由 于 为 每 个 干 预 组 个 体 寻 找 一 个 距 离 最
近的控制组个体相匹配,
在 匹 配 时 可 能 遇 到 两 个 问 题 :第 一 ,
如果出现距离相同
的 多 个 控 制 组 个 体 时 如 何 处 理 。一 种 方 法 是 随 机 地 选 择 一 个 作 为 匹 配 。另一
种方法是根据排序,
在 前 面 的 首 先 匹 配 ,这 样 最 终 的 匹 配 样 本 将 与 控 制 组 个 体
出 现 的 顺 序 有 密 切 关 系 ,比 如 Dehejia and W a h b a ( 1 9 9 9 )建 议 将 倾 向 指 数 由 高
到低排序,
先匹配倾向指数最高的也是最难匹配的,
再 匹 配 倾 向 指 数 低 的 。第
三种方法是利用距离相同的多个控制组个体的平均值作为干预组个体的四配。
第二个问题是当控制组与干预组特征差异较大时,
一对一最近邻匹配总是要在
控制组中找一个距离最近的与干预组个体匹配,
可能出现匹配上的个体实际上
特征差异比较大,
从 而 估 计 偏 差 较 大 。这 种 情 况 下 ,
可以通过设定卡尺的方式
避免,
在进行一对一对最近邻匹配时,
可以事先设定卡尺,
在卡尺范围内寻找与
干 预 组 个 体 距 离 最 近 的 控 制 组 个 体 相 匹 配 。在 设 定 卡 尺 情 况 下 会 出 现 有 些 干
预组个体在卡尺范围内找不到匹配的情况,
尤其是当干预组和控制组特征差异
较大时,
这样最终得到的匹配样本中,
可 能 会 丢 弃 部 分 干 预 组 个 体 。利 用 这 一
匹配样本得到的因果效应就不能解释成原样本的干预组平均因果效应,
在诠释
估 计 结 果 的 时 候 需 要 注 意 。带 卡 尺 的 近 邻 匹 配 ,得 到 的 匹 配 控 制 集 可 以 表
示为:
M jU) - {j | d i X ^ X - ) diX^Xj) < c }
或 = {j j dili,Ij) ^ d (l;^Lja)) , d(L;
,Lj) ^ c}

其中, 为设定的卡尺。
另 一 个 相 关 的 问 题 是 控 制 组 个 体 是 否 可 以 重 复 匹 配 。允 许 重 复 使 用 往 往
可以降低偏差,
如果某些控制组个体被重复匹配,
说明相对于不能重复匹配,

些 个 体 与 某 些 干 预 组 个 体 距 离 更 近 ,因 而 ,
重复使用控制组个体会降低匹配偏
差 。当 然 ,
允许重复使用会降低最终匹配样本的样本量,
可能会使估计精度下
降 。当 控 制 组 样 本 容 量 较 小 ,又 不 想 损 失 干 预 组 样 本 的 情 况 下 ,
允许重复匹配
不 失 为 一 种 解 决 办 法 。当 然 ,
如果允许重复匹配,
样本排序将不是问题,
一对 多
近 邻 匹 配 也 有 上 面 类 似 的 问 题 ,在 实 施 过 程 中 均 需 要 考 虑 。
在一对一最近邻匹配中,
往 往 采 用 所 谓 的 贪 楚 匹 配 (greedy matching) ,对
每 一 个 干 预 组 个 体 都 在 控 制 组 中 寻 找 一 个 距 离 最 近 的 。但 是 保 证 每 一 对 距 离
最近,
对全部干预组个体而言,
匹配上的控制组样本并不一定是总体上最近的。
另一种匹配方法,
称 为 最 优 EE配 (optima丨matching) ,不 是 一 个 一 个 地 进 行 匹
88 基本有用的计量经济学

配,
而 是 总 体 上 对 所 有 的 干 预 组 个 体 同 时 进 行 匹 配 ,寻 找 对 所 有 干 预 组 个 体 而
言 匹 配 上 的 总 距 离 最 小 。最 优 匹 配 和 贪 婪 匹 配 相 比 ,
计 算 量 大 大 增 加 。如果我
们关心的是平均因果效应,
从而主要想匹配出相似的干预组和控制组样本,

优匹配并没带来多大收益,
所获得的样本平衡性与贪婪匹配相比并没有优势
但是,
如果关心的是每个个体的匹配效果,
最优匹配方法会得到更平衡的成对
匹配。
当控制组个体样本容量非常大时,
每一个干预组个体都可能有多个控制组
个体距离相近,
并且与不同干预组个体匹配上的控制组个体数目可以不同,

的多有的少,
这 种 情 况 下 ,可 以 采 用 半 径 E 配 (radials matching) 。半 径 匹 配 是
事先设定一个半径,
半径之内的定义为相似,
之外的则不相似,
从而对于每个干
预组个体,
所有落在半径范围内的控制组个体都是该个体的匹配,
并且不同的
干 预 组 个 体 所 寻 找 的 匹 配 数 也 不 相 同 。另 外 ,
可以根据半径的选择来控制匹配
质量,
半径越小,
匹配质量越髙,
偏差越小,
但半径越小,
越 难 找 到 匹 配 。半 径 越
大,
寻找的匹配数越多,
估计精度提高,
但匹配质量下降,
偏 差 增 加 。得 到 的 干
预 组 个 体 / 匹配集合可以表示为:
M jU) = {j | d i X ^ X ^ ^ r } 或 M J(r> = {j | d d 山 、< r ) (6.27)
其 中 D, = l ,
D;=0,
r 是设定的匹配半径。
(2) 分层匹配
分 层 匹 配 是 根 据 协 变 量 或 倾 向 指 数 进 行 分 层 (stratification) ,
使层内两组
个体特征比较相似,
从 而 降 低 估 计 偏 差 的 方 法 。R o s e n b a u m and Rubin (1985)
证 明 根 据 倾 向 指 数 分 成 5 个 区 间 就 可 以 将 由 协 变 量 差 异 造 成 的 偏 差 降 低 90 % ,
因而,
在 应 用 中 通 常 分 成 5— 1 0 个 区 间 ,
如果样本足够大,
也可以分成更多的区
间 。分 层 匹 配 是 上 文 匹 配 测 度 (6. 7)(6. 8)(6. 1 7 ) 和 (6, 19 ) 的 实 现 。如 果 协 变
量是离散变量,
则 可 以 直 接 根 据 协 变 量 的 取 值 进 行 分 层 。对 于 连 续 性 协 变 量 ,
只 能 做 到 相 近 的 协 变 量 或 倾 向 指 数 进 行 分 层 。那 么 怎 么 知 道 应 该 分 多 少 层 呢 ?
以 及 什 么 时 候 层 内 的 协 变 量 或 倾 向 指 数 足 够 相 似 呢 ? Imbens and Rubin
(2015)提 出 了 一 种 方 法 ,
利 用 f检验判断多少分层是充分的。
以 倾 向 指 数 分 层 为 例 ,首 先 为 满 足 公 共 区 间 要 求 ,
根据干预组和控制组倾
向指数,
将 相 互 覆 盖 的 区 域 作 为 共 同 区 间 。通 常 ,干 预 组 倾 向 指 数 会 更 大 ,
控制
组的倾向指数会更小,

60 = min ^(Xi ) bx — m a x / > ( X ;)
i: = 1 “D. = 0

其 中 >(x,)为倾向指数估计值,
满足共同区间要求的倾向指数范围为
该区间外的样本无法进行匹配。
第 六 章 匹 配 方 法 89

在判断分层充分性时,
有两个基本的步骤:
检验层内倾向指数相似性和继
续 分 层 。假 设 现 在 已 经 将 倾 向 指 数 分 成 了 J 层 ,
首先要检验每层内倾向指数是
用 B;
否巳经相似。比如对于j 层 , J表 示 个 体 i 是 否 在 j 层 , 即 个 体 z•在 > 层 ,
B;J
=1,
否则为0,
从而层中干预组和控制组的样本数分别为:

Bij N rj — Bjj
I.:D ,. = 0

相应的线性化倾向指数平均值为:
^ tj — ili IfJ- 二 .>) Bn I
B;
q h D(. = 0
其 中 为 个 体 / 的 线 性 化 倾 向 指 数 估 计 值 。用 t 统 计 量 检 验 层 内 倾 向 指 数 的 相
似性,
£统计量如下:

tj = I" I fJ --- (6.28)


Js-j.a/NtJ+ l / N cj)
其中, 丨

< ^ N, + N, 二2 (,.2 。
仏(卜 〜 ) 2 + 系 ,K "”)
Imbens and Rubin (2015)建 议 临 界 值 取 imax — 1 ,
如 果 上 述 t值 小 于 1 ,
则认
为 层 内 两 组 倾 向 指 数 相 似 。如 果 f 值 大 于 1 ,
说明两组倾向指数相似性不够充
分,
则进人第二步,
根 据 j 层内倾向指数的中位数,
将 j 层进一步分成样本量相
同的两个新的子层,
对 于 新 划 分 的 子 层 ,再 利 用 上 一 步 的 方 法 检 验 充 分 性 。这
两个步骤不断重复进行,
直到每层i值 均 小 于 1,
或样本量小到不能再进一步分
层为止。

3 . 匹配效果诊断

匹配方法的目的是构造更加相似的样本,
使干预组和控制组更具有可比
性 。事 实 上 ,
在匹配之前就需要检验协变量的平衡性,
如果协变量比较平衡,

组个体本来就具有比较好的可比性,
也 就 没 有 必 要 实 施 匹 配 了 ,可 以 直 接 利 用
回 归 等 方 法 进 行 因 果 效 应 的 估 计 。如 果 发 现 两 组 个 体 协 变 量 有 较 大 差 异 ,
直接
回归往往会造成很大的估计偏差,
实 施 匹 配 才 是 必 要 的 。匹 配 方 法相当于从观
测 数 据 中 将 隐 藏 的 随 机 化 实 验 样 本 寻 找 出 来 (King and Nielsen, 2 0 16),因 而 ,
对于匹配完成后形成的匹配样本,
需 要 检 验 是 否 近 似 于 随 机 化 实 验 。常 用 的 检
验 指 标 包 括 标 准 化 平 均 值 差 异 (standardized difference in averages)和对数标准
差 比 (log ratio of standard deviations) 0
标准化平均值差异定义为:
90 基本有用的计量经济学

^ ^ ~ (6.29)
•Jisz, + Sc ) / 2

其 中 ,又, d = i,
C 表示干预组或控制组某协变量的平均值, 表示干预组或控
制组某协变量的样本方差,
分别定义为;

^ - 1/(N, - 1 ) 2 (足 — 兄 )2 s> = 1/(风 - 1 ) 2 (兄 — 兄 )2


:D 广 1 itD. = 0

可以看到,
如果两组个体协变量完全平衡,
标 准 化 平 均 值 差 异 将 接 近 于 ◦,因 而 ,
& 的值越接近于0 ,
说明样本越有可能平衡。

注 意 (6. 29)不 同 于 t 统 计 量 ,
标准化平均值差异丄与样本容量无关,
它考
察的是给定样本两组协变量平均值是否相同,
是 样 本 内 特 征 ,和 样 本 容 量 没 有
关 系 。Imbens and Rubin(2015)强 调 不 要 使 用 t 检 验 来 检 验 平 衡 性 ,因 为 z 统计
量 与 样 本 容 量 有 关 ,当 样 本 容 量 很 大 时 ,即 使 协 变 量 平 衡 也 可 能 发 现 显 著 差 异
的 结 果 。另 外 ,
在匹配过程中,
往 往 需 要 计 算 匹 配 前 后 的 标 准 化 平 均 值 差 异 ,以
判 断 匹 配 的 效 果 。需 要 注 意 的 是 ,
在 计 算 标 准 化 平 均 值 差 异 的 时 候 ,(6. 2 9 )分
母 上 的 平 均 标 准 差 在 匹 配 前 后 的 计 算 中 要 使 用 同 一 个 标 准 差 ,比 如 均 使 用 匹 配
前的平均标准差,
这样计算的数值在匹配前后才有可比性。
标准化平均值差异主要考察了一阶矩,
另一个指标对数标准差比考察的是
二阶矩的差异,
定义为:
= ln(.sv)-In(5f> (6.30)
如 果 两 组 协 变 量 分 布 平 衡 ,那 么 两 组 协 变 量 标 准 差 将
根据上述公式可以看出,
相同,
从 而 两 组 协 变 量 标 准 差 的 对 数 比 将 接 近 于 (X
一般情况下,
检验上述两个指标就可以大概地了解两组变量的协变量平衡'
性 。在 非 正 态 分 布 中 ,
前 两 阶 矩 不 一 定 决 定 整 个 分 布 ,因 而 ,
前两阶矩平衡并不
一 定 代 表 整 个 分 布 平 衡 。为 此 ,
可 以 检 验 倾 向 指 数 的 平 衡 性 J m b e n s and Rubin
(2015)证 明 ,
如果两组倾向指数的期望值相同,
那么两组个体的协变量分布将
相同D 因而,
在匹配前后,
可以比较两组个体的倾向指数平均值,
计算倾向指数
的标准化平均值差异,
就可以检验两组协变量分布的平衡性。

K = lt lc- - (6.31)
祝 + 0 / 2

其 中 ,L 是 两 组 个 体 线 性 化 倾 向 指 数 的 平 均 值 ,
sL/是 两 组 倾 向 指 数 估 计 值 的 样
本方差。
除了上述三个检验指标外,
还 有 一 些 直 观 的 诊 断 方 法 ,主 要 包 括 倾 向 指 数
分布图、
分 位 数 分 布 图 (Q Q 图 )和 标 准 化 平 均 值 差 异 变 化 图 。倾 向 指 数 分 布 图
第 六 章 匹 配 方 法 91

是估计出倾向指数后,
直 接 画 出 干 预 组 和 控 制 组 的 倾 向 指 数 分 布 图 (直 方 图 或
概 率 密 度 图 ),
观 察 两 组 个 体 倾 向 指 数 分 布 的 差 异 ,如 果 分 布 相 似 ,
说明协变量
平 衡 ;如 果 分 布 差 异 较 大 ,
说 明 协 变 量 分 布 差 异 较 大 ,匹 配 效 果 不 好 。可 以 同 时
画出匹配前后的倾向指数分布图,
进 行 比 较 并 判 断 匹 配 的 效 果 。Q Q 图 是 将 干
预组和控制组的协变量或倾向指数按照分位由低到高分别画在横轴和纵轴上,
以检验两组个体协变量分布是否相似,
如果完全相似,
Q Q 图 形 将 与 4 5 度线重
合,
偏离越大,
说 明 两 组 协 变 量 差 异 越 大 。标 准 化 平 均 值 差 异 变 化 图 是 将 每 个
协变量匹配前后的标准化均值差异用图形的方式呈现出来,
从而可以直观地观
察匹配效果。

4. 因果效应估计

前 ® 三 个 阶 段 是 设 计 阶 段 ,在 这 三 个 阶 段 中 ,没 有 考 虑 结 果 变 量 。通 过 定
义 相 似 性 ,运 用 合 适 的 匹 配 方 法 得 到 匹 配 样 本 ,
并检验匹配样本的匹配质量。
如果匹配样本使协变量平衡,
从而匹配样本近似于随机化实验数据,
则可以进
人 分 析 阶 段 。设 计 阶 段 相 当 于 将 隐 藏 于 观 测 数 据 中 的 随 机 化 实 验 样 本 寻 找 出
来 ,后 面 的 分 析 可 以 借 鉴 随 机 化 实 验 数 据 的 分 析 方 法 。
这里主要讨讼干预组平均因果效应的匹配估计量,
所有匹配估计量可以写
成 下 列 形 式 (分 层 匹 配 有 所 不 同 ,
在 后 文 单 独 讨 论 ):

r A TT = -TT — w(z,>)yy | (6. 32)

其 中 是 上 文 定 义 的 与 干 预 组 个 体 i 相匹配的控制组个体的
集合。
不同匹配方法的主要差别在于权重的差异,
对于一对一最近邻匹配,
j) = i,而 不 在 匹 配 集 m ; (;>中 的 控 制 组 个 体 权 重 均 为 o 。对 于 u a > i )近邻匹
配, 同样地,
不 在 匹 配 集 碼 ⑺ 中 的 控 制 组 个 体 权 重 均 为 0 。对于
半径匹配,
w G ,
_;’
)= 1 / # M m ,# M & , 表 示 是 集 合 中 的 元 素 数 目 ,同 样 地 ,
不 在 集 M , (D中 的 控 制 组 个 体 权 重 也 为 H e c k m a n et al. (1998)提 出 一 种 核 匹
配方法,
这 种 方 法 对 每 一 个 干 预 组 个 体 都 会 用 所 有 的 控 制 组 个 体 作 为 匹 配 ,只
是为每个控制组个体赋予不同的权重,
与 个 体 £距离越近的赋予的权重越高,

远的权重越低,
具 体 地 ,其 权 重 函 数 写 为 :
" .、 K ( X j ~ X t)
— .Nf„. ----------

堂 K(X厂 XO

其 中 ,K ( • ) 为 核 函 数 , 为与干预组个体i 相匹配的控制组个体的数目。
92 基本有用的计量经济学

除精确匹配可以保怔匹配样本与干预组个体协变量完全相同外,
非精确匹
配,
无论采用哪种匹配方法,
所获得的匹配个体与干预组个体往往存在着一定
的差异,
尽管经过匹配后,
差异比较小,
但仍然不完全相同,
这种差异可能造成
一 定 的 估 计 偏 差 。匹 配 偏 差 可 以 写 为 :

右= 务 S 油 •,
抓 1—
卩广] l y€Ar-£.j J 八 ":,)广 j

=务 八 广
S
jeMjCn
y.)
>
( 6. 33)

其中第一行第一项是干预组平均因果效应的匹配估计量,
第二项是干预组的平
均因果效应,
两 者 之 差 是 估 计 偏 差 。 (6. 33)式 表 明 ,匹 配 偏 差 主 要 是 由 于 用 匹
配样本观测值估计干预组 反 事 实 结 果 造 成 的 偏 差 。匹 配 样 本 中 ,
干预组个
体与控制组个体应该具有相似的协变量分布,
在 C I A 假设下,
它们的基线潜在
结果也应该相似,
但由于协变量不完全相同,
从而造成基线结果估计的差异。
回到总体的视角,
避免讨论抽样误差问题,
匹配偏差可以写为:
E \ Y X- Y , mm | X,,
X > ,Dt = 1]
- E l Y u ~ Y 0i | D, - 1]

= E l Y oi | ,D,- = l ] - £ [ Y o , | ,D,- 二 0]

= E [ y 0j | X , ] - E [ y 0/ I X w,(;
)]
= fiAX,) ~ fic{X,njU)) (6.34)
其 中 表 示 与 个 体 f 相匹配^ 控制组个体,仏(X,) = E [ Y 0l-1 X ;] 。
(6. 34)式 称 为 干 预 组 个 体 i 的 匹 配 误 差 ,匹 配 上 的 两 组 个 体 的 协 变 量 或 倾
向 指 数 相 似 ,当 协 变 量 差 异 比 较 小 时 ,
线性回归函数是对条件期望函数非常好
的 近 似 ,因 而 ,
可 以 用 线 性 回 归 方 法 估 计 化 (兄 ),
令 & 则匹配偏
差可以记为:
= (X^X^Y^ (6.35)
估 计 汉 的 方 法 有 两 种 ,一 种 是 直 接 利 用 匹 配 样 i 中 控 制 组 样 本 信 息 (1 : 1 最近
邻 匹 配 中 会 有 /V, 个 控 制 组 样 本 ,1 : k 近 邻 匹 配 中 将 有 A N , 个 控 制 组 样 本 ),

计下列回归模型:
^(;
> _ 〜 + X mj(n汉 + v,i
将 得 到 的 估 计 系 数 含 代 人 (6. 3 5 ) ,即 可 得 到 每 个 干 预 组 个 体 的 匹 配 偏 差 估 计 。
另一种方法是利用全部匹配样本估计下列回归模型:
V,-= 义+ rD,. + X - ^ + v, (6. 36)
同样地,
将上述模型估 计 的 或 代 人 (6. 35),
可以得到千预组个体的匹配偏差估
第 六 章 匹 配 方 法 93

计 。将 估 计 的 匹 配 偏 差 代 人 (6. 34)即 可 得 到 调 整 后 的 匹 配 估 计 量 :

^a!t — ^ATT _ d '~ X c) (6. 37)


事 实 上 ,(6. 36)式 中 ,系 数 r 的 估 计 即 为 调 整 后 的 匹 配 估 计 量 (6. 3 7 ) 。Abadie
and Imbens (2011)证 明 偏 差 调 整 的 匹 配 估 计 量 比 没 有 调 整 的 匹 配 估 计 量 效 果
更好。 ■
对于分层匹配,
根 据 协 变 量 或 倾 向 指 数 进 行 分 层 后 ,每 一 层 内 均 类 似 于 完
全 随 机 化 实 验 。假 设 将 样 本 分 成 J 层 ,j’
= l,
…,J 。对 于 任 意 层 > ,
可以用 层 内
两 组 观 测 结 果 之 差 作 为 层 内 平 均 因 果 效 应 的 估 计 ,BP

fdifO') = Y t{ j ) ~ Y c(j) j = U …,
J

其 中 匕 (y) = i / N dj d=0,
l ,是 在 > 层 内 干 预 组 和 控 制 组 观 测 结 果
i: = d

的 平 均 值 。总 体 平 均 因 果 效 应 估 计 量 等 于 各 层 平 均 因 果 效 应 的 加 权 平 均 ,
权重
为 各 层 样 本 数 的 分 布 ,即
J
f';
TE = X N(j)/N (6. 38)

其 中 N(j)、
N 分别表示j 层样本,
数 和 总 样 本 数 。干 预 组 平 均 因 果 效 应 估 计 量
是 利 用 干 预 组 各 层 样 本 分 布 进 行 加 权 ,即
J
« - 2 > 抓0 ) X N t(j)/Nt (6. 39)
J= l
其中,
iV,())、
]V,分 别 表 示 层 内 干 预 组 样 本 数 和 全 部 干 预 组 样 本 数 。
分层匹配不是单独为每个干预组个体寻找匹配,
而是根据协变量或倾向指
数,
划出不同层,
相同层内两组个体匹配在一起。同一层内两组个体的协变量
或倾向指数相差很小,
但仍然存在差异,
就像上文对匹配偏差的讨论一样,
分层
匹 配 也 会 有 一 定 的 匹 配 偏 差 。考 虑 i 层 内 的 因 果 效 应 参 数 ,
rdifO ' ) = E [ Y i | D t = U B 0 = 1 ] - E [ y , | D, = 0,B, ^ 1]
= E[Yi ;| D,- — 1, (7 ) ] — E[_Y0i | D,. = 0 ,
X c(j)]
= E [ Y U - Y 0i | A = l ,Xt( j n - h E [ Y 0i | D, = 1 ,
X,(_/)]
-£ :
[& I A . = 0,
足 ()) ]
- E [ y „ . - y 0,. I X , 0 ) ] + { E [ Y OI. i x , ( j ) ] - E [ y 0l. | x 山•)]}
其中第一项是j 层的平均因果效应,
第 二 项 则 是 匹 配 偏 差 。 同 样 地 ,因 为 在 层
内两组个体协变量尽管有差异,
但差异比较小,
这时线性回归对条件期望的近
似会非常好,
因 而 ,同样可以假设
E [ y 0i I x , - x ] = 1 + 工%
94 基本有用的计量经济学

则 j 层内的匹配偏差为:

Bj = E [ Y 0i I x , ( y ) ] - E [ y 0, I x f( j ) ] = [龙 ( j ) - 又山_)]汍 (6.40)
从 而 )层 内 偏 差 调 整 的 分 层 匹 配 估 计 量 为 :
fadi0 ) = i m- B j (6.41)
fadj( P 可 以 直 接 用 回 归 方 法 估 计 出 来 ,
利用层内的所有样本,
估计下列回归方
程即可得到:
Y,- = «(>) + r 0 ' ) D , + X ;
i3 0 ) + s f
调整后的总体平均因果效应分层匹配估计量为:

代?T di = 2 ? di0 ‘
)X (6. 42)

调整后的干预组平均因果效应分层匹配估计量为:

x - C6.43)

5 . 逆概加权方法

对于倾向指数的使用,
可以通过倾向指数匹配或分层匹配获得因果效应参
数 的 估 计 。倾 向 指 数 还 可 以 通 过 逆 概 加 权 的 方 式 获 得 因 果 效 应 的 估 计 。逆挺
加 权 方 法 最 早 是 由 Horvitz and T h o m p s o n (1952)在 研 究 抽 样 代 表 性 时 提 出 的
一种加权方法,
他们证明,
为了获得总体特征的无偏估计,
可以利用抽样概率的
倒 数 对 抽 样 个 体 进 行 加 权 。Robins et al. (1992) 等 将 之 引 人 因 果 效 应 参 数 估
计 。事 实 上 ,

£[ 黑 H { E [ ^ y h ] h E { ^ y E [肌 1x 『
.]}
- E { ^ y £ [ Y , ]D ;= 1,
足 > ( 足 )}

= £:
{取 |D,- = 1,X,]} ^ £:
{£:
[yu | 足] } = ElYul
类似地,

从而总体的平均因果效应可以写成:
rA丁戶 ElYu — y 。
,.]

[pix^ l-pax^ \ ^[pcx^a-pcx^)!


事实上,
第 六 章 匹配 方法 95

r (D - p(X,))y,- I
E\
Ucx^ci-pcx,.)) I ■ '

X ; ,D,
E [pct

+ E[r f ^ T U . = 0 ] G —P O O )

= 取 IU - 1]-E[Y,. | X t,D, = 0]
= 取 u-Yo,' I X,.] (6.45)
从而,
总体平均因果效应为,
rAT E = E L Y u - Y o.1 = E l E [ Y u - Y ol | X ] ]
= r r ^( uD - p K( AX ;))Yi

类 似 地 ,干 预 组 平 均 因 果 效 应 的 逆 概 加 权 测 度 为 :
rATr = ElY,i~ Y 0i | 辽 = 1] = E [ E [ Y 1; - Y 0i 丨X,.,
D, = 1] | A. 1]
= E [ E [ Y U - Y 0i | X,.] | D ; = 1]

(D-p(x))Yi
[夕(x)(l —p(x))
J
Xi = x Pr[X,- = a:[ D; = 1]

▽ r 「( D - p ( x ) ) Y i p (x)Pr[X,- — x']
x,.
i/>(x) Cl — p(x)) Pr[D, = 1]
1 • y 'p r ( D — p(x)~)Yj
X ;= Pr[X ;= x ]
Pr[D,- = 1] [ (1 — pix))
■(D- p ( X i))Yl-
(6. 46)
— P r [ A = 1] [— (兄 )) J
(6. 44)和 (6. 46)说 明 利 用 逆 概 加 权 方 法 也 需 要 两 个 基 本 的 步 骤 ,
首先估计
倾向指数,
然后利用倾向指数对两组个体进行加权,
相应的估计量如下:
D,-^(X,)
rlr (6.47)
N 2>,. p c x o a - p c x i ) )

(6. 48)
1-piX,)
逆概加权方法和匹配方法需要相同的识别条件:
C I A 和 共 同 区 间 假 设 。逆
概 加 权 估 计 量 (6. 47)和 (6. 48)显 示 ,
逆 概 加 权 估 计 量 依 赖 于 倾 向 指 数 ,如 果 倾
向指数模型存在模型误设,
则 会 产 生 较 大 估 计 偏 差 ,尤 其 在 极 端 的 倾 向 指 数 附
近,
估 计 量 将 变 得 不 稳 健 ,比 如 倾 向 指 数 接 近 于 1 或 0 ,
f = E将 趋 于 无 穷 大 ;同样
96 基本有用的计量经济学

地,
对 于 技 ;T ,倾 向 指 数 趁 近 于 1 时 ,
也趋于无穷大,
从而估计结果将不稳定。

6 . 条件独立性假设检验

回 归 方 法 和 匹 配 方 法 识 别 因 果 效 应 参 数 均 需 要 条 件 独 立 性 假 设 (6. 2 ) ,即
两组观测结果的差异是由可观测协变量造成的,
未观测因素对两组结果没有系
统性影响,
从 而 选 择 是 由 观 测 变 量 决 定 的 (selection on observables)。但 是 C I A
依赖于潜在结果,
而对于任一个体,
现 实 中 只 能 观 察 到 一 个 潜 在 结 果 ,因 而 ,
CIA
本 身 是 无 法 检 验 的 ,除 非 引 人 很 强 的 假 定 。l m b e n s (2004)、lmbens and Rubin
(2015)总 结 了 两 种 间 接 的 检 验 方 法 :
伪 结 果 方 法 (pseudo outcome)和 伪 干 预 方
法 (pseudo treatment) 。
伪结果方法利用一个事实上没有受到干预影响的变量作为伪结果,
检验控
制了协变量后,
相应的伪结果平均因果效应是否为零。因为伪结果事实上是没
有受到干预的,
用它来作为潜在结果y 。
,.的 代 理 变 量 ,
一般选择滞后结果变量作
为 伪 结 果 变 量 ,干 预 组 和 控 制 组 的 伪 结 果 都 是 可 观 测 的 ,如 果 控 制 协 变 量 兄
后,
影响潜在结果的所有混杂因素均被控制,
那 么 ,未 观 测 因 素 将 不 会 对 两 组 结
果产生系统性影响,
那么对于伪结果Y f ,
相 应 的 平 均 因 果 效 应 将 为 零 。相 反 ,

果发现利用伪结果估计的平均因果效应不为零,
说明控制协变量兄后,
两组结
果仍然存在着系统性差异,
从而可能仍然存在着未观测的混杂因素没有控制,
那么,
C I A 条 件 将 不 成 立 。 当 然 ,如 果 发 现 利 用 伪 结 果 估 计 的 平 均 因 果 效 应 为
零,
我 们 并 不 能 肯 定 C I A 成 立 。伪 结 果 方 法 检 验 下 列 假 设 :
H 0:
E{ElYf | X i,Di = 1 ] - E [ y f | = 0]} = 0 (6.49)
其 中 Y f 是伪结果,
通常用滞后一期或滞后二期的结果变量,
伪结果变量可以理
解 为 潜 在 结 果 的 代 理 变 量 ,该 检 验 的 有 效 性 也 依 赖 于 这 一 点 ,伪 结 果 越 是 接
近于基线潜在结果,
该检验越有帮助。_ 然 ,
这一检验并不是充分条件,
不能拒
绝 假 设 (6. 49)时 ,
也不能保证C I A 成立,
;但 是 提 供 了 没 有 发 现 C I A 不 成 立 的 证
从 而 使 我 们 有 信 心 相 信 因 果 效 应 估 计 有 因 果 效 应 的 解 释 。如果拒绝假设
据,
(6.4 9 ) ,
则 说 明 C I A 不 成 立 ,匹 配 估 计 量 可 能 存 在 较 大 偏 差 ,需 要 重 新 设 计
匹配。
伪干预方法是利用多个控制组的比较来检验C I A 是否成立的一种方法。
假设有两个控制组,
用了, . 6 { _ 1 ,
0,1}来 表 示 分 组 ,
0,. = 1(了,.= 1 ) ,
1( • ) 为示性
函数,
括号内条件为真取1,
为 假 取 0 ,即 T, = — 1 ,
0 为 两 个 控 制 组 ,了,.= 1 为干
预 组 。考 察 一 种 更 强 的 C I A 条 件 (简 记 为 S C I A ) ,以 协 变 量 X,.为 条 件 ,
潜在结
果 独 立 于 该 条 件 成 立 ,
意 味 着 通 常 的 C I A 条 件 (Y。
,.,
第 六章 匹配方法 97

y „ ) J L A l X ; 成 立 。 当 然 两 者 并 不 完 全 等 价 ,C I A 成 立 不 一 定 有 S C I A 成 立 。
Imbens and Rubin (2015)认 为 ,
在应用中,
如果每一个控制组都满足C I A 条 件 ,
没 有 理 由 认 为 S C I A 不 成 立 。S C I A 具 有 可 检 验 的 内 涵 ,因 为 S C I A 成 立 ,
意味
着有( A U J L T J X , ,
A = 0 ,
对于两个控制组也会有条件独立性假设成立,

对于两个控制组,
均没有受到干预,
它们的基线潜在结果Y 。
,都 是 可 以 观 测 的 ,
而 对 于 基 线 潜 在 结 果 是 否 条 件 独 立 于 伪 干 预 变 量 T,,是 可 以 检 验 的 。伪 干 预 方
法 主 要 检 验 T , 是否成立,
可以检验下面原假设:
E { E [ y ( | X,,
H 0: T ; - 0 ] - E [ Y ; 丨X 丨,
T ; = — 1]} = 0 (6.50)
将了,.看 作 一 项 伪 干 预 ,
T , ; 0 为伪干预组,
丁 = 一 ;I为 伪 控 制 组 。事 实 上 ,
两组
均为控制组,
均没有受到干预,
如果控制足后,
伪干预组和伪控制组之间的差异
是非系统性的,
那 么 ,伪 干 预 的 平 均 因 果 效 应 将 为 零 ,上 述 原 假 设 应 为 真 。 当
然,
这一检验也不是充分的,
不能拒绝原假设时,
也不能说明C I A 或 SCIA成
立 。但 是 ,如 果 拒 绝 了 假 设 (6. 50) ,
则 说 明 C I A 条 件 不 成 立 。直 观 理 解 ,
如果控
制 X, 后 ,
根据两个控制组计算的平均因果效应为零,
说明决定结果变量的主要
混杂因素已经控制;
相反,
如果控制X , 之后,
根据两个控制组计算的平均因果
效应显著不为零,
说明除兄外,
存在未观测因素影响结果变量,
从而使两 组 控 制
组 平 均 结 果 出 现 差 异 。那 么 ,
我们也有理由相信原干预组和控制组仅控制协变
量兄也是不充分的,
从 而 C I A 条件不成立。

第四节倾向指数匹配方法的软件实现

在这一节,
我 们 讨 论 匹 配 方 法 在 Stata软 件 中 的 实 现 。为 了 便 于 说 明 ,
首先
介 绍 一 下 将 使 用 的 数 据 ,然 后 介 绍 常 用 的 匹 配 命 令 ,
最 后 ,以 倾 向 指 数 匹 配 为
例,
提供一个完整的由设计到结果估计的实现过程。

1. 数据说明

本 节 使 用 的 数 据 来 自 于 Dehejia and W a h b a (1999) 的 培 训 数 据 ,参 见 例


3. 1 。我 们 主 要 使 用 数 据 集 n s w _ d w . d t a 和 cps_controls. dta,前 者 是 Dehejia
and W a h b a (1999)所 使 用 的 完 全 随 机 化 实 验 数 据 ,干 预 组 1 8 5 个 ,
控 制 组 260
个,
后 者 是 美 国 的 当 前 人 口 调 查 数 据 ,共 1 5 9 9 2 个 样 本 点 。主 要 变 量 如 下 表
所示:
表 6, 1 数据变量说明

变 ffl 含义

treat 干预状态(
= 1 接受培训,
= 0 未接受培训)

age 年龄
education 教育年限
black 黑人
hispanic 西班牙裔
married 婚姻状态(
= 1 表示已婚,
= 0 其他)
nodegree 是否有高中学历(= 1 表示没有高中学历,
= 0 表示有高中学历)
re74 1 9 7 4 年收入
re75 1 9 7 5 年收入
re78 1 9 7 8 年收人

2. S t a t a 软 件 中 的匹配命令

自 13.0版开始,
Stata开 始 提 供 匹 配 命 令 teffects,
它主要包括七个子命令,
分别是 i p w 、
aipw、
ipwra、
nn m a t c h 、
psmatch、
ra、
overlap,
其中前三个子命令对应
于逆概加权方法,
nnmatch是 近 邻 匹 配 命 令 ,
p s m a t c h 是 倾 向 指 数 匹 配 命 令 ,ra
是回归调整命令,
overlap用 于 画 干 预 组 和 控 制 组 的 倾 向 指 数 分 布 图 以 显 示 共
同 覆 盖 的 程 度 。另 外 ,
Stata还 提 供 辅 助 命 令 tebalance,用 于 检 验 协 变 量 的 平 衡
性 。相 应 的 使 用 方 法 可 以 利 用 help teffects和 help tebalance命 令 进 行 查 询 。
这 里 简 要 介 绍 teffects nnmatch 和 teffects psmatch 的 用 法 ,
teffects nnmatch 是
协变量匹配命令,
teffect p s m a t c h 是 倾 向 指 数 匹 配 命 令 。
teffect n n m a t c h 的 基 本 命 令 语 法 和 主 要 选 项 如 下 :

teffects nnmatch Covar omvarlist) (tvar) 匸


weight]〔,
-stat options]
stat Description
社。 estimate average treatment effect in population^ the de­
fault
atet estimate average treatment effect on the treated
Model ...... .
nneighbor( # ) specify number of matches per observation ;
default is nneighbor(l)
biasadj(varlist) correct for large - sample bias using specified variables
eraatch(varlist) match exactly on specified variables
第 六 章 匹 配方 法 99

SE/Hobust
vce(vcetype) vcetype may be
vce(robust [ ,nn( # )) ; use robust Abadie - Imbens standard errors with 弁 matches
vce(iid) ;use default Abadie - Imbens standard errors

Advanced
caliper( # ) specify the maximum distance for which two observations
are potential neighbors
generate(stub) generate variables containing the observation numbers of
the nearest neighbors
metric(metric) select distance metric for covariates

metric Description
mahalanobis inverse sample covariate covariance ;the default
ivariance inverse diagonal sample covariate covariance
euclidean identity

其中,
ovar为 结 果 变 量 ,
omvarlist为 结 果 模 型 中 的 协 变 量 ,
tvar为 干 预 变 量 ,

三项为必选项,
第一个栝号为结果变量模型,
第 二 个 栝 号 为 干 预 变 量 。选 项 stat
包含两个可以选择的估计量,
ate为 总 体 平 均 因 果 效 应 (6. 8 ) 的 估 计 量 ,atet为
干 预 组 平 均 因 果 效 应 (6. 7 ) 的 估 计 量 。关 于 匹 配 模 型 有 三 个 选 项 ,
B B eighbor
( 弁)为 近 邻 匹 配 ,
改 变 # 的 值 可 以 决 定 是 选 择 1 • 1 最 近 邻 匹 配 还 是 1 • k 近邻
匹配,
bisadjCvarlist)可 以 根 据 括 号 内 变 量 进 行 匹 配 偏 差 调 整 得 到 偏 差 调 整 的 匹
配 估 计 (6. 3 7),
ematch(varlist)可 以 根 据 括 号 内 的 变 量 列 表 进 行 精 确 匹 配 ,
这里
的 变 量 列 表 应 该 是 离 散 变 量 。标 准 误 差 可 以 选 择 Abadie and Imbens (2006)构
造的两种估计量,
另外,
还 可 以 选 择 卡 尺 calipeK # ) 以 提 高 匹 配 质 量 ,
选 项 gen-
erate(stub)会 产 生 新 的 变 量 ,
对应每个个体最近邻的观测号,
选 项 metric(met-
ric)可 以 选 择 定 义 相 似 性 的 距 离 测 度 ,
共 提 供 三 种 距 离 测 度 ,mahalanobis为马
氏距离,
ivarance为 标 准 化 的 欧 氏 距 离 ,
euclidean为 欧 氏 距 离 ,
默认马氏距离。
下 面 我 们 利 用 Dehejia and W a h b a (1999)使 用 的 完 全 随 机 化 实 验 数 据 ,

计 培 训 对 个 人 收 人 的 干 预 组 平 均 因 果 效 应 ,采 用 1 : 1 最 近 邻 匹 配 ,
估计结果
如下:

. global xlist "age education black hispanic married nodegree re74 re75 々
• teffects nnmatch (re78 $ xlist) (treat) ,atet nn(l)
Treatment-effects estimation Number of obs =445
Estimator : nearest-neighbor matchin^atches :requested = 1
Outcome model ;matching min = 1
100 基本有用的计量经济学

Distance metric :Mahalanobis max - 8

Al Robust
re78 Coef. z P > U I 〔
9 5 % Conf, Interval]
S t d‘Err,

MET
treat
(1 vs 0) 2453,076 771.4713 3.18 0,001 941.0203 3965.132

如果认为匹配后,
7 5 年收入匹配效应不好,
仍然存在着一定的协变量差异,
可 以 根 据 7 5 年 收 人 进 行 匹 配 偏 差 调 整 ,在 前 述 命 令 基 础 上 加 上 选 项 biasadj
(re75),
估计结果如下:

. teffects nnmatch (re78 $ xlist) (treat) satet nn(l) biasadj(re75)


Treatment-effects estimation Number of obs = 44 5
Estimator ;nearest-neighbor matchin^atches ;requested = 1
Outcome model :matching min = 1
Distance metric •• Mahalanobis max - 8

Al Robust
re78 Coef. z P>!z( [_95% Conf. Interval]
Std. Err.

ATET
treat
(1 vs 0) 2290.232 771.1574 2.97 0.003 778.791 3801.672

倾 向 指 数 匹 配 命 令 teffects p s m a t c h 的 语 法 和 基 本 选 项 如 下 :

teffects psmatch (ovar) (tvar tmvarlist [ ,tmodel]) [if] [in] [weight] [ ,stat op-
tions]

同样地,
ovar表 示 结 果 变 量 ,
tvar表 示 干 预 变 量 ,tmvarlist表 示 倾 向 指 数 模
型 中 的 协 变 量 ,可 选 项 tmode丨 设 定 倾 向 指 数 模 型 的 形 式 ,可 以 选 择 l o g k 或
probit模 型 ,
默 认 为 logit模 型 ,
选 项 stat可 以 选 择 ate或 atet估 计 不 同 的 因 果
效应参数,
另外,
还 有 其 他 的 选 项 与 rmmatch类 似 ,
读 者 可 以 参 考 该 命 令 的 help
文件。
下 面 用 倾 向 指 数 匹 配 命 令 估 计 培 训 的 因 果 效 应 •.

• teffects psmatch (re78) (treat $ xlist) ,atet nn(l)


Treatment-effects estimation Number of obs = 44 5
Estimator :propensity-score matchin^Iatches :requested = 1
Outcome model ;matching min = 1
Treatment model :logit max
第 六 章 匹 配方 法 101

Al Robust
re78 Coef. z P>|z| [ 9 5 K Conf Interval]
Std. Err.

ATET
treat
(1 vs 0) 2639.865 714.7758 3.69 0.000 1238.93 4040.799

倾向指数匹配完成后,
可 以 使 用 辅 助 命 令 teffects overlap画 出 干 预 组 和 控
制 组 的 倾 向 指 数 分 布 图 ,以 判 断 两 组 结 果 是 否 满 足 共 同 区 间 要 求 。 ’

Propensity score,treat=0
| ----- - treat=0 一 ■…treat^l

图 6 ,1 teffects overlap 画 出 的 倾 向 指 数 分 布 图

另 一 个 官 方 的 辅 助 命 令 是 tebalancdStata 1 4 开 始 提 供 ),
它主要用于检验
协变量的平衡性,
包 括 4 个子命令,
分 别 是 box、
density、
overid、
summarize。 te-
balance b o x 可 以 画 出 匹 配 前 后 协 变 量 的 箱 形 图 ,只 能 在 n n m a t c h 和 psmatch
命 令 后 面 使 用 。tebalance density画 出 两 组 个 体 的 核 密 度 分 布 图 ,
teffects子命
令 后 均 可 使 用 。overid平 衡 性 检 验 只 能 在 i p w 命 令 后 使 用 。s u m m a r i z e 可以 计
算标准化平均值差异和两组协变量的方差比,
teffects命 令 后 均 可 以 使 用 。
在前面的协变量匹配之后,
可 以 用 tebalance summarize计 算 所 有 协 变 量 的
标准化平均值差异和协变量方差比。
102 基本有困的计量经济学

. tebalance summarize
note: refitting the model using the generate() option
Covariate balance summary

Raw Matched

Number of obs = 445 370


Treated obs = 185 185
Control obs = 260 185

Standardized differences Variance ratio


Raw Matched Raw Matched

age .1072771 ,156455 1.027755 1.143346


education .1412198 - .00 5 6 9 8 8 1,551284 1,281513
black .0438866 0 ,9250286 1
hispanic -.1745611 0 .5828804 1
married .0936407 .0563479 1.180212 1.099707
nodegree - . 3 039864 -.0118903 1.499755 1,011149
re74 - . 0 021599 .1628147 .7380953 1.857613
re75 .0838632 .2022192 1,076344 2.241771

上 述 表 格 前 两 列 报 告 了 各 协 变 量 的 标 准 化 平 均 值 差 异 ,R a w 表 示 原 始 样
本,
Matched表示匹配样本,
最后两列显示干预组和控制组协变量方差比,
从结
果上看,
各 变 量 标 准 化 平 均 值 差 异 基 本 接 近 0 ,方 差 比 基 本 接 近 1 ,
尤其是匹配
除 74年 和 7 5 年收人匹配后变差,
后, 其 他 变 量 平 衡 性 均 变 好 了 。总 体 上 看 ,

据是比较平衡的,
这不奇怪,
因为使用的是完全随机化实验数据。
可 以 用 tebalance density或 tebalance b o x 画 出 各 协 变 量 的 分 布 图 ,图 6, 2
是教育变量匹配前后的分布图,
尽管随机化实验数据本身协变量就比较平衡,
但 仍 然 存 在 着 一 定 的 差 异 ,匹 配 后 协 变 量 平 衡 性 变 好 。官 方 命 令 的 使 用 方 法 ,
可 以 参 考 其 help文 件 ,
在此不再赘述。
除上述官方命令之外,
匹配方法还有一些用户写的命令,
常 用 的 包 括 Bee-
ker and Ichino (2002)的 pscore 软 件 包 、
Leuven and Sianesi (2003)的 psmatch2
软 件 包 、Abadie et al. (2004)的 n n m a t c h 软 件 包 。Stata官 方 的 匹 配 命 令 主 要 是
根 据 Abadie et al. (2004)的 n n m a t c h 软 件 重 新 设 计 的 ,
两者非常相似,
不再作
详 细 介 绍 。下 面 ,
主 要 介 绍 一 下 ?3 « ^ 和 p s m a t c h 2 两 个 用 户 写 的 匹 配 命 令 。
pscore 软 件 包 共 包 括 6 个 命 令 ,pscore、attnd、attnw、atts、attr、attk。
pscore可 以 进 行 倾 向 指 数 模 型 估 计 ,
并检验倾向指数模型是否满足平衡指数特
第 六 章 匹配 方法 103

Balance plot
Raw Matched

education
--------- control ----------- treated

图 6 .2 tebalance density education 画 出 的 匹 配 前 后 教 育 变 量 密 度 图

征 。attnd和 attnw可 以 进 行 最 近 邻 匹 配 ,
两者的不同主要在于对相同距离匹
配的处理上,
如果有多个个体与干预组个体具有相同的最近距离,
attnd是 随 机
地选择一个作为干预组个体的匹配,
attnw是将所有相同距离的控制组个体的
平 均 值 作 为 干 预 组 个 体 的 匹 配 。atts是 分 层 匹 配 命 令 ,
attr是 半 径 匹 配 命 令 ,
attk是 核 匹 配 命 令 。这 6 个 命 令 的 基 本 语 法 均 类 似 于 Stata的 回 归 命 令 ,
这里
主 要 介 绍 pscore和 atts,
其他命令具有相似的语法,
读 者 可 以 自 行 参 考 其 help
文件。
pscore可 以 用 来 估 计 倾 向 指 数 模 型 ,
并检测倾向指数模型是否满足平衡指
数特征,
pscore命 令 基 本 语 法 和 选 项 如 下 :

pscore treatment varlist [weight] [if exp] [in r a n g e ] ,pscore(newvar)


[blockid(newvar) detail logit comsup level( # ) numblo( 弁)]
Options
pscore(newvar) is required and asks users to specify the variable name for
the estimated propensity score, which is added to the dataset,
bl ock id (ne wvar) allows users to specify the variable name for the block num­
ber of the estimated propensity score,which is added to the dataset,
detail displays more detailed output documenting the steps performed to ob­
tain the final results,
logit uses a logit model to estimate the propensity score instead of the de­
fault probit model
comsup restricts the analysis of the balancing property to all treated plus
those controls in the region of common support. A dummy variable named co-
104 基本有用的计量经济学

msup is added to the dataset to identify the observations in the common


support.
level(real) allows to set the significance level of the tests of the balan­
cing property. The default is 0. 01,
numbloCreal) allows to set the number of blocks of equal score range to be
used at the beginning of the test of the balancing hypothesis. The default
is set to 5 blocks.

其中,
treatment是 干 预 变 量 ,
vaHist是 进 人 倾 向 指 数 模 型 的 协 变 量 ,
pscore
(newvar)是 必 选 项 ,
命令运行后,
会 将 拟 合 的 倾 向 指 数 保 存 在 该 选 项 设 定 的 ne-
w v a r 中,
如果后面想根据估计的倾向指数进行分层匹配,
在估计倾向指数模型
时,
需 要 加 上 选 项 blockid(newvar) ,
命令运行后会将分好的层标识保存在该选
项 的 newvar中,
便于后面分层匹配时利用,
加 上 可 选 项 detail将 详 细 报 告 分 层
及 平 衡 指 数 特 征 检 验 的 过 程 。如 果 加 上 可 选 项 logit,将 运 用 logit模 型 估 计 倾
向 指 数 模 型 。否 则 利 用 probit模 型 估 计 倾 向 指 数 模 型 ,
可 选 项 c o m s u p 将平衡
指 数 特 征 检 验 限 制 在 共 同 区 间 上 进 行 ,可 选 项 m m i b b ( # )可 以 允 许 用 户 自 行
设 定 分 层 数 ,默 认 为 5 层 ,
leveK#)设定平衡指数特征检验时的显著性水平,

认 为 1% 。
下 面 用 pscore命 令 估 计 一 个 基 本 的 倾 向 指 数 模 型 ,
加 上 可 选 项 logit,必选
项 p SCOre(pS)生 成 了 一 个 新 的 变 量 pS ,
并将拟合的倾向指数保存在p s 中,
为了
后面进行分层匹配,
加 上 可 选 项 blockid(id)新 生 成 一 个 变 量 id表 示 不 同 的 层 ,
加 上 可 选 项 c o m s u p 以 保 证 平 衡 指 数 特 征 检 验 在 共 同 区 间 上 进 行 ,输 出 结 果
如下:

. pscore treat a g e - r e 7 5 ,pscore(ps) blockidC id) logit comsup


* * * 关於关 * * * * * * * 长长关* 并 并 ■并* * *
Algorithm to estimate the propensity score

The treatment is treat


treat Freq. Percent Cum.
0 260 58.43 58.43
1 185 41.57 100.00
Total 445 100.00

Estimation of the propensity score


Iteration 0 :log likelihood = - 302.1
Iteration 1 ;log likelihood = - 293.62952

teration2: log likelihood = - 293.60822
Iteration 3 ;log likelihood = - 293.60822
第 六 章 匹 配 方 法 105

Logistic regression Number of obs 445


LR chi2(8) 16.98
Prob > chi2 0.0303
Log likelihood 3.60822 Pseudo R2 0.0281

treat Coef. Std. Err. P>lz| [ 9 5 % Conf. Interval]

age .0046982 *0143268 0.33 0.743 - . 0 2 33819 .0327782


education —.071239 ,0717266 一0.99 0.321 -.2118206 .0693425
black -. 2 2 4 7 0 0 5 ,3655324 -0.61 0.539 -,9411308 .4917297
hispanic —.8527818 .5065604 ™ 1 :68 0.092 - 1.845622 .1400582
married .1636176 .2769247 0.59 0,555 -.3 7 9 1 4 4 9 .7063802
nodegree - . 9 0 35053 .3134894 -2.88 0.004 - 1 . 5 1 7 9 3 3 --.2890773
re74 -.0000316 .0000258 —1.22 0.221 — •0000Q23 .000019
re75 .0000616 .0000436 1. 41 0. 157 一 .0000238 .000147
_cons 1-177674 1.055966 1.12 0.265 —.8919813 3,247329

Note: the common support option has been selected


The region of common support is [,23791343,.67556101]

Description of the estimated propensity score


in region of common support
Estimated propensity score

Percentiles Smallest
1% .2423395 .2379134
5% .285614 .2402362
10% .3430459 ,2405133 Obs 434
25% .3614771 .2406011 Sum of Wgt. 434
50% .3921638 Mean .4205563
Largest Std. Dev. .0921653
15% ,4772232 ’
6523377
90% .5594795 .655084 Variance .0084944
95% .5948073 ,6615352 Skewness .62618
99% .6432808 .675561 Kurtosis 2.704369
* * 关妗* * * 关於 * * * * * * ^x- * * ^
Step 1 :Identification of the optimal number of blocks
Use option detail if you want more detailed output

The final number of blocks is 4


This number of blocks ensures that the mean propensity score
is not different for treated and controls in each blocks
106 基本有用的计量经济学

Step 2 :Test of balancing property of the propensity score


Use option detail if you want more detailed output

The balancing property is satisfied


This table shows the inferior bound, the number of treated
and the number of controls for each block

Inferior
of block treat
of pscore 0 1 Total

.2 156 82 238
.4 84 93 177
.6 9 10 19
Total 249 185 434

N o t e :the common support option has been selected


* 关* * 长* * * * * * 关 ■长* 共
End of the algorithm to estimate the pscore

首 先 ,它 会 给 出 干 预 变 量 列 表 ,
提示利用逻辑回归估计倾向指数模型,
然后
提 醒 公 共 区 间 为 [0. 2379,0. 6756],
接着对拟合的倾向指数进行简单统计,
列出
分 布 信 息 。下 面 进 人 第 一 步 ,
识 别 最 优 分 层 数 ,因 为 没 有 加 可 选 项 @ a i l ,所以
直 接 报 告 最 终 得 到 的 最 优 分 层 数 为 4 层 。然 后 ,
进入第二步倾向指数的平衡指
数特征检验,
显示满足平衡指数特征,
说明倾向指数模型是充分的,
可以作为倾
向 指 数 匹 配 的 依 据 了 。加 上 @_taU会 显 示 详 细 的 平 衡 指 数 特 征 检 验 过 程 ,为节
约空间,
在 此 省 略 。最 后 ,将 满 足 共 同 区 间 的 分 层 信 息 显 示 出 来 ,包 括 3 层 ,
[0.2,
0 . 4 ] 、[0.4,
0,6]及 0 . 6 以 上 ,
有一层不满足共同区间要求,
没有报告。
在 估 计 出 倾 向 指 数 之 后 ,即 可 以 采 用 相 应 的 匹 配 命 令 进 行 倾 向 指 数 匹 配
了,
我们只列出分层匹配命令的语法,
其他命令语法相似。

atts outcome treatment [if exp] [in r a n g e ] ,pscore(scorevar)


block id (blockvar) [ comsup detail bootstrap bs—options ]
Options
ps c o r e ( v amame) is a compulsory option that specifies the name of the user-
provided variable containing the estimated propensity score.
blockid(varname) is a compulsory option that specifies the name of the user-
provided variable containing the block identifier of the estimated pro­
pensity score.
comsup restricts the computation of the ATT to the region of common support.
第 六 章 匹 配 方 法 107

detail displays more detailed output documenting the steps performed to ob­
tain the final results,
bootstrap bootstraps the standard error of the treatment effect,
bs options allows the use of all options coming with Stata 8rs bootstrap com­
mand.

在 pscore命 令 之 后 ,
可以使用各匹配命令估计相应的因果效应参数,
上面
列出了分层匹配命令的基本语法和选项,
outcome表 示 结 果 变 量 ,
treatment为
干预变量,
pscore(scorevar)告 诉 命 令 atts估 计 中 使 用 scorevar提 供 的 倾 向 指
数,
blockid(blockvar)告 诉 atts分 层 标 识 。还 有 4 个 可 选 项 ,
bootstrap可 以 利
用 自 抽 样 方 法 估 计 匹 配 估 计 量 的 标 准 误 差 ,b S_ 0p t k m S 设 置 相 应 的 自 抽 样 选
项 。用 分 层 匹 配 估 计 培 训 的 影 响 ,
估计结果如下:

. atts re78 treat, pscore(ps) blockidC id)

ATT estimation with the Stratification method


Analytical standard errors

n. treat* n. contr. ATT Std. Err. t

185 249 1830.437 681.845 2.685

结果显示,
干 预 组 185个 ,
控 制 组 249个 ,
干 预 组 平 均 因 果 效 应 为 1 830,

准 误 差 为 681,t 值 为 2. 685,结 果 显 著 不 为 零 。
另 一 个 广 泛 使 用 的 命 令 是 pSm a t c h 2 ,
除了能够实施近邻匹配、
半径匹配、

匹配之外,
还增加了局部线性回归匹配、
样条匹配等方法,
该软件包还包括两个
辅 助 命 令 ,用 于 协 变 量 平 衡 性 检 验 的 pstest命 令 和 倾 向 指 数 分 布 图 命 令 ps-
graph。psmatch2 命 令 语 法 和 选 项 如 下 :

psmatch2 depvar [indepvars] [if exp] [in r a n g e ] 〔,outcome(varlist) pscore


(varname) neighbor(integer) radius caliper(real) mahalanobis(varlist) a i ( inte­
ger) population altvariance kernel H r kernel type ( type ) bwidth ( real ) spline
nknots(integer) common trimCreal) noreplacement descending odds index logit ties
quietly w(matrix) ate]

其 中 depvar是 干 预 变 量 ,可 选 项 indepvars是 进 入 倾 向 指 数 模 型 的 协 变 量 ,
如 果 想 让 p s match2估 计 倾 向 指 数 ,
需要加上协变量,
如果已经估计好了倾向指
数,
可 以 使 用 选 项 pscore(varname)告 诉 软 件 使 用 v a r n a m e 变 量 提 供 的 倾 向 指
数 。可 选 项 outcomdvarlist)是 告 诉 软 件 结 果 变 量 列 表 ,
该命令可以同时估计
多 个 结 果 的 平 均 因 果 效 应 。选 项 pighbor(integer)可 以 进 行 近 邻 匹 配 ,
通过该
选项括号内的数字决定是进行1 : 1 最近邻匹配,
还 是 1 : k 近 邻 匹 配 。radius
108 基本有用的计量经济学

选项进行半径匹配,
caliper(real)可 以 设 定 卡 尺 范 围 。mahalanobis(varlist) 使
用马氏距离,
ai(integer)使 用 Abadie and Imbens (2006) 的 异 方 差 一 致 性 标 准
误差,
population和 altvariance是 当 使 用 ai选 项 时 两 种 计 算 标 准 误 差 的 方 法 。
kernel为 核 匹 配 ,
llr为 局 部 线 性 回 归 匹 配 ,
kerneltype(type)可 以 选 择 核 类 型 ,
默 认 为 0.06。spline是 样 条 匹 配 ,nknots设定样条 平 滑
bwidth(real)设 置 带 宽 ,
的 内 部 节 点 数 量 。c o m m o n 设 定 共 同 区 间 ,
trim(r.eal)通 过 截 尾 方 式 设 定 共 同 区
间 。noreplacement只 能 在 1 : 1 最 近 邻 匹 配 中 使 用 ,
加上该选项控制组个体不
会重复匹配,
没 有 该 选 项 则 允 许 重 复 匹 配 。descending只 用 于 1 : 1 最 近 邻 匹
配,
加上该选项匹配以降序进行,
否 则 为 升 序 。o d d s 选 项 根 据 线 性 化 的 倾 向 指
数进行匹配,
index利 用 潜 在 变 量 指 数 进 行 匹 配 ,
logit利 用 logit模 型 估 计 倾 向
指 数 。ties选 项 允 许 在 最 近 邻 匹 配 中 ,多 个 相 同 倾 向 指 数 的 控 制 组 个 体 与 干 预
组 个 体 相 匹 配 。HHietly不 输 出 倾 向 指 数 估 计 结 果 。w(matrix)在 马 氏 距 离 中 使
用 用 户 提 供 的 矩 阵 。加 上 a t e 选 项 ,除 提 供 A T T 估 计 量 外 ,还 提 供 A T E 和
A T C 的匹配估计量D
下面利用不放回的降序最近邻匹配方法估计培训对收入的影响,
利用选 项
ate分 别 报 告 A T T 、
ATC(ATU)、
A T E 三个因果效应参数的估计:

. psmatch2 treat ,outcome(re78) n(l) ai(l) odds pscore(ps) ate norepl descending
Make sure that the sort order is random before calling psmatch2.

Variable Sample ' Treated Controls Difference S,E. T-stat

re78 Unmatched 6349.1435 4554.80112 1794.34238 632.853392 2.84


ATT 6349.1435 4362.23331 1986.91019 682.193739 2.91
ATIJ 4418.01981 6349.1435 1931.12369 707.401494 2.73
ATE 1959.01694 688.582197 2.85
Not e :Sample S. E,

psmatch2 ; psmatch2 ;ConuTion


Treatment support
assignment Off suppo 0 n suppor Total
Untreated 75 185 260
Treated 0 185 .185

Total 75 370 445

匹配完成后,
可 以 利 用 pstest命 令 检 验 协 变 量 平 衡 性 ,
pstest类似于官方的
tebalance命 令 ,
可以计算协变量的标准化平均值差异和协变量方差比,
还可以
画出协变量匹配前后的分布图。
第 六 章 匹 配 方 法 109

下 面 是 利 用 pstest命 令 检 测 变 量 age、
re75匹 配 前 后 的 平 衡 性 :

. pstest age re7 5 , both

Unmatched Mean % reduct t-test V(T)/


Variable
Matched Treated Control %bias |biasl t P > |t| V(C)

age U 25.816 25.054 10.7 1.12 0.265 1.03


M 25.816 26.568 - 10,6 1.4 -0.92 0.356 0.88
re75 U 1532.1 1266.9 8.4 0.87 0.382 1.08
M 1532.1 1635.7 -3.3 60.9 -0.27 0.784 0.77

M if variance ratio outside [0. 75 ;1.34] for U and [0. 7 5 ;1.34] for M

第 i 列是变量名,
第 2 列 对 应 每 个 变 量 有 两 行 ,u 表 示 匹 配 前 原 始 样 本 ,
M
表示匹配样本,
第 3、
4 列分别是干预组和控制组的变量平均值,
第 5 列为标准
化 平 均 值 差 异 ,以 百 分 数 形 式 表 示 ,
第 6 列为匹配后标准化平均值差异下降的
幅 度 ,最 后 一 列 为 协 变 量 方 差 比 ,中间提供了 t 检 验 值 和 相 应 的 P 值 。另 外 ,

以 用 p s g raph画 出 两 组 的 倾 向 指 数 分 布 图 。

3 . 培训的影响:
倾向指数匹配方法案例

下 面 用 Dehejia and W a h b a (1999)的 随 机 化 实 验 干 预 组 样 本 (n s w _ d w .


dta)和 C P S 调 查 数 据 (cps_controls. dta)合 并 为 一 个 数 据 集 ,
利用倾向指数匹配
方 法 ,牯 计 干 预 组 平 均 因 果 效 应 。
首先构造数据集:

use nsw_dw,clear / / 打开随机化实验数据


drop if treat = = 0 / / 删除实验数据的控制组
append using cps_controls // 将 CPS 数据追加上来
save nsw_cps,replace // 将新数据保存为 nsw一cps.dta

数据构造完成后,
检测协变量是否平衡,
先做个简单统计或平衡性检验:
®

estpost tabstat age - r e 7 5 ,


by( treat) sCmean sd) coluinn(s) listwise //用 tabstat
分组简单统计
eststo sum / / 结果保存到s u m 中
esttab sum, main(mean) aux(sd) unstack nonumber nomtitle nogap // 将统计结果歹ll到
显示器上

① estposUeststCKesttab等 是 用 户 写 的 命 令 ,
需要先安装才可以使用,
具体参考本书附录。
110 基本有用的计量经济学

显示统计信息如下:

. esttab sum, main(mean) aux(sd) unstack nonumber noratitle nogap

control treated Total

age 33,23 25,82 33, 14


(11.05) (7.155) (11,04)
education 12,03 10.35 12.01
(2.871) (2.011) (2.868)
black 0.0735 0.843 0.0823
(0,261) (0.365) (0,275)
hispanic 0.0720 0,0595 0.0719
(0.259) (0.237) (0.258)
married 0.712 0.189 0.706
CO.453) (0.393) (0.456)
nodegree 0.296 0.708 0,301
(0.456) (0.455) (0,459)
re74 14016.8 2095.6 13880.5
(9569,8) (4886.6) (9613.1)
re75 13650.8 1532,1 13512,2
(9270.4) (3219.3) (9313.2)

N 15992 185 16117

mean coefficients ;sd in parentheses.

也 可 以 使 用 pstest检 验原始数据协变量的平衡性;

• pstest age-re75, raw t( treat)

Mean t-test V(T)/


Variable %bias
Treated Control t p>|t| V(C)

age 25,816 33.225 —79. 6 -9.10 0.000 0.42*


education 10.346 12.028 -67.9 -7.94 0.000 0.49*
black •84324 .07354 242.8 39.66 0.000
hispanic .05946 .07204 - 5.1 -0.66 0.510
married •18919 •71173 -123.3 -15.62 0.000
nodegree .70811 .29584 90.4 12.22 0.000
re74 2095.6 14017 - 156.9 - 16.92 0.000 0.2S*
re75 1532.1 13651 -174.6 -17.77 0.000 0.12'*
关 if variance ratio outside [0. 75; 1. 34]

无论是从简单统计还是平衡性检验上看,
干预组和控制组两组差异都非常
第 六 章 匹 配 方 法 111

显著,
不能直接利用线性回归,
考 虑 利 用 倾 向 指 数 匹 配 方 法 构 造 匹 配 样 本 。第
二 步 进 行 倾 向 指 数 匹 配 。采 用 l o g i t 模 型 估 计 倾 向 指 数 ,
从一个最基本的模型
出 发 ,将 主 要 协 变 量 均 引 人 倾 向 指 数 模 型 ,并 利 用 倾 向 指 数 的 平 衡 指 数 特 征 ,

验 倾 向 指 数 模 型 是 否 充 分 。如 果 不 满 足 平 衡 指 数 特 征 ,
则需要重新调整倾向指
数 模 型 。第 二 阶 段 的 估 计 可 能 要 进 行 多 次 反 复 修 改 。

. pscore treat age - r e 7 5 , pscore(ps) blockid(id) logit

(其他部分省略)

Step 2 :Test of balancing property of the propensity score


Use option detail if you want more detailed output

Variable married is not balanced in block 9


Variable re74 is not balanced in block 9
Variable re75 is not balanced in block 9
Variable age is not balanced in block: 12
The balancing property is not satisfied
Try a different specification o£ the propensity score

结果显示,
基 础 模 型 没 有 通 过 平 衡 指 数 特 征 检 验 ,因 而 ,
仅将协变量纳人倾
向 指 数 模 型 并 不 充 分 。尝 试 引 人 协 变 量 高 阶 项 ,
在 基 础 模 型 的 基 础 上 ,又 引 人
了 married和 r e 7 5 的 交 叉 项 及 a g e 与 r e 7 4 的 交 叉 项 ,
估计结果如下:

, pscore treat age education black hisp married re74 re75 marriedre75 agere74,
> pscore(ps) blockid(id) comsup logit

(其他部分省略)
* * 并并关关关* 关关关* * * 长关关长* 关关关矢 * 关长关* * * * * 务 * *
Step 2 :Test of balancing property of the propensity score
Use option detail if you want more detailed output

The balancing property is satisfied

This table shows the inferior bound, the number of treated


and the number of controls for each block
112 基本有用的计量经济学

Inferior
of block treat
of pscore 0 1 Total
.0009204 4872 29 4901
.05 166 13 179
133 24 157
.2 155 75 230
.4 51 43 94
.6 0 1 1

Total 5377 185 5562

N o t e :the common support option has been selected

这一次发现倾向指数模型通过了平衡指数特征检验,
说明现在倾向指数模
型比较充分了,
并 且 划 分 了 6 个 层 ,每 层 的 样 本 分 布 情 况 列 在 上 面 的 表 格 里 。
可以看到最后一层内,
只有一个干预组个体,
很难找到合适的匹配,
为了保证匹
配质量,
该 干 预 组 个 体 可 以 删 除 。估 计 出 倾 向 指 数 后 ,也 可 以 用 histogram或
t w o w a y kdensity命 令 画 出 两 组 个 体 的 倾 向 指 数 分 布 图 ,以 比 较 两 组 协 变 量 的
差 异 。图 6. 3 画 出 了 倾 向 指 数 分 布 的 直 方 图 。

0> 1
o 60 r

40 -

20 -

0 L , ......一 ...____
0 0.2 0.4 0.6
Graphs by treat Estimated propensity score

图 6. 3 倾向指数估计值分布图

从 图 6. 3 可 以 看 出 ,
两组倾向指数差异很大,
控制组个体很多集中在0 附
近,
这也证明两组协变量极不平衡,
不能直接进行分析,
需 要 进 行 调 整 。下面利
第 六 章 匹 配 方 法 113

用 1 : 1 不重复降序最近邻匹配方法, 在最近邻匹配中,
如果同时有多个个体
与干预组个体具有相同的最近距离,
那么,
p s m a tc h 2 会 选 择 首 先 遇 到 的 控 制 组
个 体 作 为 匹 配 ,因 而 ,
样本的排列顺序将会影响到匹配样本,
样 本 排 序 不 同 ,匹
配 样 本 也 会 不 同 。为 保 证 排 序 的 随 机 性 ,
可以通过生成随机数的形式来保证样
本 的 随 机 排 序 。因 而 ,
在 进 行 正 式 匹 配 之 前 ,可 以 先 利 用 下 列 语 句 对 样 本 进 行
随机排序:

set seed 2342 / / 设定随机产生器种子


gen u = runiforraO / / 产生一个标准均匀分布的随机变量 u
sort u / / 根 据 u 进行排序

当然,
在 最 近 邻 匹 配 时 ,如 果 遇 到 多 个 控 制 组 个 体 与 干 预 组 个 体 具 有 相 同
的最近距离,
那么可以用所有相同最近距离的控制组个体的平均结果作为干预
组个体的匹配,
在 匹 配 命 令 中 加 上 选 项 t i e s 可 以 实 现 这 一 功 能 。如 果 选 用 了
ties ,
样本排序将不重要了,
上 述 语 句 就 不 需 要 了 。为 了 方 便 构 造 匹 配 样 本 ,

里 不 加 选 项 ties ,
随 机 选 择 其 中 的 一 个 作 为 匹 配 。估 计 结 果 如 下 :

. psmatch2 treat, outcome(re78) p(ps_nsw) n(l) norepl descending odds


There are observations with identical propensity score values.
The sort order of the data could affect your results.
Make sure that the sort order is random before calling psmatch2.

Variable Sample Treated Controls Difference S.E. T-stat

re78 Unmatched 6349.1435 14846.6597 - 8497.51615 712.02072 -11.93


ATT 6349.1435 4850,27418 1498.86932 745.57336 2.01
N o t e :S.E. does not take into account that the propensity score is estimated.

psmatch2 ;
psmatch2 : Common
Treatment support
assignment On suppor Total
Untreated 15992 15992
Treated 185 185

Total 16177 16177

①因为控制组样本比较多,
不需要使用重复匹配,按照降序是首先匹配倾向指数最高也是最难匹
配的,
然后再匹配容易的,
匹配时根据对数或然比进行。
114 基本有用的计量经济学

ps m atch2命 令 的 输 出 结 果 显 示 ,
原 始 样 本 (U n m a t c h e d ) 干 预 组 7 8 年平均
收 入 为 6349美 元 ,
控 制 组 为 14846美 元 ,
两 组 平 均 收 入 之 差 为 一8 4 9 7 美 元 !匹
配 样 本 干 预 组 平 均 收 人 为 6349美 元 ,
控 制 组 平 均 收 人 为 4 8 5 0 美 元 ,干 预 组 平
均 因 果 效 应 为 1499美 元 ,
标 准 误 差 为 7 4 6 “值 为 2. 0 1 ,
说明培训对参与培训的
个体收人具有显著的正向影响,
影 响 程 度 为 1499美 元 。
最近邻匹配已经使两组个体特征非常相似,
事实上,
可 以 直 接 在 pSm a t Ch2
命令之后,
再做一次协变量平衡性检验,
结果如下:

. pstest age-re75, both


Unmatched Mean % reduct t-test V(T)/
Variable Matched Treated Control %bias |biasj t P > 11| V(C)
age U 25.816 33.225 - 7 9 ,6 -9.10 0.000 0,42*
M 25.816 26.859 -11.2 85,9 -1,07 0,285 0 , 4 1 st
education U 10.346 12.028 -67.9 -7,94 0.000 O W
M 10.346 10.346 0.0 100,0 -0.00 1.000 0,5CT
black U .84324 .07354 242.8 39.66 0*000
M .84324 .83784 1,7 99.3 0.14 0.887
hispanic U .05946 ■07204 -5.1 -0.66 0.510
M .05946 .05946 0.0 100.0 0.00 1.000
married U .18919 .71173 -123.3 一15.62 0.000
M .18919 .20541 -3.8 96.9 -0.39 0.696
nodegree U .70811 .29584 90.4 12.22 0.000
M .70811 .57297 29.6 67.2 2.73 0. 007
re74 U 2095.6 14017 -156.9 -16.92 0.000 CL26*
M 2095.6 1651 5,9 96.3 1.05 0.295 2. 5 4 u
re75 U 1532.1 13651 -174.6 -17.77 0.000 0 . 1 2 3*
M 1532.1 1392.5 2.0 98.8 0.45 0.656 1.34
* if variance ratio outside [0. 75 j 1. 34] for U and [0. 75 j 1. 34] for M

可以看出,
匹配后,
干预组和控制组协变量已经非常相似,
标准化平均值差
异均接近0,
所 有 协 变 量 匹 配 后 不 平 衡 性 均 显 著 降 低 。从 方 差 比 看 ,
两组协变量
的方差仍然存在着一定的差异,
但 我 们 更 关 心 协 变 量 平 均 值 的 平 衡 性 。当 然 ,
上 述 不 平 衡 检 验 结 果 也 反 映 出 ,匹 配 后 两 组 样 本 之 间 仍 然 存 在 着 一 定 的 差 异 ,
这些微小差异可能造成估计偏差,
可 以 采 用 Abadie and Imbens ( 2 0 U ) 的方法
进行偏差修正,
为此,
将 匹 配 好 的 样 本 识 别 出 来 。psmatCh 2 在 匹 配 过 程 中 会 产
生 一 些 变 量 ,_treat 记 录 了 千 预 变 量 ,
在 本 例 中 等 同 于 原 数 据 中 的 treat变 量 ,
第 六 章 匹 配 方 法 115

_id是 匹 配 前 各 观 测 的 编 码 或 顺 序 号 ,
_ n l 是与对应个体相匹配的个体编码,
—o u t c o m e 是 与 干 预 组 相 匹 配 的 结 果 ,
本 例 中 会 产 生 匹 配 结 果 变 量 _re78。根据
这些信息,
可以将匹配好的匹配样本识别出来,
具体程序如下:

sort _id I I 恢复原始排序


gen pair = _id if _treated = = 0 / / 如果是控制组个体,
将其对应编码赋给变量 pair
replace pair = _nl if _treated = - I f f 如果是干预组个体,
将与其相匹配的个体的
编码赋给变量 pair
bysort pai r :egen paircount = count (pair) / / 这里与干预组相匹配的个体的编码将
出现两次,
统计一下次数
drop if paircount ! = 2 / / 仅保留会出现两次的样本,
只有E 配样本才会出现两次
save match, replace // 保存匹配样本

对 于 匹 配 样 本 ,因 为 本 身 协 变 量 比 较 平 衡 ,
类似于完全随机化实验产生的
数据,
可以直接利用回归分析的方法来估计因果效应参数,
事实上,
利用匹配样
本 ,回 归 分 析 所 得 的 结 果 可 以 解 释 为 偏 差 修 正 的 匹 配 估 计 量 (Imbens and R u ­
bin, 2015) 0 直 接 利 用 下 面 程 序 可 以 得 到 调 整 的 因 果 效 应 估 计 ,
输出结果如下:

, quietly reg re78 treat ?vce(robust)


. eststo ml
. quietly reg re78 treat age - r e 7 4 ,vce(robust)
. eststo m2
. esttab ml ra2, b ( % 1 0 . 2f) se( % 1 0 . 2f) mtitlesCunadjustecf "adjustecD
> keep (treat) star( * .10 关 关 .05 ^ .01) nogap ar2

(1) (2)
unadjusted adjusted
treat 1498,87“ 1473,28**
(745,57) (715,70)
N 370 370
adj. R-sq 0.008 0.068

Standard errors in parentheses ,


* p < . 1 0 ,“ p < . 0 5 ,… p < . 0 1

第 l 列 是 直 接 用 匹 配 样 本 两 组 观 测 收 人 之 差 ,即 简 单 回 归 系 数 ,
实际上就
是上文中估计出的干预组平均因素效应,
没 有 进 行 任 何 的 偏 差 调 整 。第 2 列是
引入了主要的协变量,
相 当 于 Abadie and Imbens (2011) 的 偏 差 修 正 的 干 预 组
平均因果效应,
进一步调整了匹配样本可能的协变量差异造成的估计偏差,

116 基本有用的计量经济学

计 结 果 显 示 偏 差 调 整 的 平 均 效 应 为 1473美 元 ,
并 且 在 5 % 水平下显著。
估计出平均因果效应之后,
需 要 检 验 C I A 是 否 成 立 。如 果 C I A 不 成 立 ,

面 估 计 的 结 果 不 能 解 释 为 因 果 效 应 。只 有 C I A 成 立 时 ,
上文的估计结果才有因
果 效 应 的 解 释 。可 以 利 用 前 文 介 绍 的 伪 结 果 方 法 和 伪 干 预 方 法 进 行 检 验 。 因
为 我 们 有 干 预 实 施 之 前 的 个 体 收 人 re74、
re75,这 里 用 re7 5 作 为 一 个 伪 结 果 ,

一 看 根 据 协 变 量 age-fe74进 行 匹 配 ,两 组 的 re75平 均 值 是 否 有 显 著 差 异 ,
如果
有显著差异,
说 明 除 这 些 协 变 量 之 外 .,可 能 还 有 其 他 的 未 观 测 因 素 影 响 收 人
re75,
那 么 这 些 未 观 测 因 素 也 有 可 能 是 影 响 re78的 重 要 因 素 ,
从而说明CIA条
件 不 成 立 。否 则 ,
如果没有显著差异,
尽 管 不 能 说 C I A —定 成 立 ,
但至少证 明 没
有 发 现 C I A 不成立,
从 而 估 计 结 果 有 一 定 的 可 信 性 。利 用 类 似 的 方 法 ,
估计的
伪结果效应如下:

. set seed 2342


. gen u = runiform()
. sort u
. psmatch2 treat, outcorae(re75) p(ps nsw) n(l) norepl descending odds
There are observations with identical propensity score values.
The sort order of the data could affect your results.
Make sure that the sort order is random before calling psmatch2.

Variable Sample Treated Controls Difference S.E. T-stat

re75 Unmatched 1532.05531 13650.8035- -12118.7482 682.067154 - 17.77


ATT 1532.05531 1392.45485 139.600459 312.978955 0.45
Not e :S.E. does not take into account that the propensity score is estimated.

结果显示,
培 训 对 7 5 年收人没有显著影响,
说明没有证据表明这些协变量
后,
未 观 测 变 量 对 伪 结 果 re75有 显 著 影 响 ,
没 有 发 现 C I A 条件不成立的证据。
第 二 种 方 法 是 伪 干 预 方 法 ,因 为 有 随 机 化 实 验 的 控 制 组 ,另 外 ,调 査 数 据
cps_controlS. dta也 未 受 到 干 预 ,对 于 这 两 个 均 没 有 受 到 干 预 的 样 本 可 以 构 造
一个伪干预,
利 用 两 个 控 制 组 检 测 控 制 所 有 的 协 变 量 age-re75后 ,
看看两个控
制 组 的 结 果 re78是 否 有 显 著 差 异 。 因 为 两 组 同 在 控 制 组 ,
如果没有差异,
说明
控制这些协变量是充分的,
未 观 测 因 素 不 会 对 结 果 re78产 生 系 统 性 影 响 ,
从而
使我们相信,
在 干 预 组 和 控 制 组 之 间 进 行 比 较 时 ,控 制 这 些 协 变 量 也 应 该 是 充
分的,
剩 下 的 结 果 差 异 就 是 干 预 的 影 响 。检 验 结 果 如 下 :
第 六 章 匹配 方法 117

. psmatch2 w age education black hispanic married re74 re75 marriedre75 agere74»
> outcome(re78) n(l) norepl descending odds ties

Variable Sample Treated Controls Difference S,


E. T-stat

re78 Unmatched 4554.80112 14846.6597- 10291.8585 599.887485 一17.16


ATT 4554.80112 5330.9612 - 776.1600 524.145335 -1.48
Note :S-E- does not take into account that the propensity score is estimated.

其 中 XV 表 示 两 个 控 制 组 :
实验的控制组(
w = l ) 和 调 查 数 据 C P S ( W = 0 ) 。利用
与 上 文 相 同 的 倾 向 指 数 匹 配 方 法 重 新 估 计 了 因 果 效 应 参 数 A T T 。结 果 显 示 ,
两 组 收 人 re78并 没 有 显 著 差 异 ,
说明控制主要的协变量之后,
未观测因素对结
果 re78没 有 系 统 性 影 响 ,
C I A 条 件 可 能 成 立 。伪 结 果 方 法 和 伪 干 预 方 法 均 没
有 发 现 C I A 不成立的证据,
匹配估计具有一定的可信性。
本节主要介绍了倾向指数匹配方法的基本实施步骤,
其他匹配估计量的估
计类似,
不再赘述。

第五节总 结

本 章 主 要 介 绍 了 协 变 量 匹 配 和 倾 向 指 数 匹 配 方 法 及 其 实 施 步 骤 。然后 利
用一个具体的例子,
详 细 介 绍 了 倾 向 指 数 匹 配 方 法 在 Stata软 件 中 的 实 现 。需
要强调的是,
匹配方法和上一章的回归方法本质上并没有什么区别,
两种策略
所 需 要 的 识 别 条 件 都 是 条 件 独 立 性 假 设 (C I A ) , 也 就 晕 说 ,
控制所有可观测因素
之后,
未 观 测 变 量 不 会 对 两 组 观 测 结 果 造 成 系 统 性 如 果 C I A 条件不成
立 ,即 控 制 所 有 可 观 测 变 量 后 ,
仍然有未观测因素对两组观测结果造成系统性
差 异 ,出 现 所 谓 的 内 生 性 问 题 ,
那么匹配方法和回归方法一样,
是无法解决的。
内生性问题意味着未观测因素可能是潜在的混杂因素,
影 响 个 体 的 选 择 ,同时
对结果产生影响,
控制可观测因素后,
选 择 偏 差 仍 然 存 在 。 因 而 ,匹 配 方 法 不 能
解 决 内 生 性 问 题 ,国 内 有 些 文 献 利 用 匹 配 方 法 来 解 决 内 生 问 题 是 错 误 的 。 当
然,
匹 配 方 法相对于回、
归 方 法 确 实 有 它 的 优 势 。 当 两 组 协 变 量 差 异 很 大 时 ,回
归分析一般不能得到稳健的估计结果,
估计结果对模型函数形式非常敏感,

且回归分析对于具体使用了哪些样本不会给出显性的提示,
从而使使用者往往
倾 向 于 将 得 到 的 估 计 结 果 解 释 为 总 体 的 平 均 因 果 效 应 。匹 配 方 法 通 过 匹 配 ,

协变量不平衡的观测样本中,
分离出一个协变量相对平衡的匹配样本,
用 King
and Nielsen (2016)的 语 言 表 述 ,
就是匹配方法将隐藏在观测数据中的随机化实
验 样 本 寻 找 出 来 ,因 而 ,
我们很清楚地知道采用了哪些样本估计匹配估计量,

118 基本有甩的计量经济学

到 的 匹 配 估 计 量 可 以 解 释 为 哪 些 个 体 的 因 素 效 应 。另 外 ,
利用匹配样本进行分
析,
估计结果往往更加稳健,
对 函 数 形 式 不 再 敏 感 (赵 西 亮 ,2015) ,
这些都是匹
配方法相对于回归方法的优点。
King and Nielsen (2016)指 出 由 于 倾 向 指 数 匹 配 方 法 将 协 变 量 综 合 为 一 个
一维的变量,
倾 向 指 数 相 似 反 而 协 变 量 差 异 更 大 。举 个 简 单 的 例 子 ,比如研究
大学教育收益率,
考 察 接 受 大 学 教 育 对 个 人 收 人 的 影 响 。假 设 我 们 主 要 利 用 高
中学习成缋和家庭收人作为影响个体大学教育选择的因素,
那么倾向指数就是
这两个变量的一个函数,
这两个因素对接受大学教育的可能性都是正向影响,
因而,
如果两个个体倾向指数相同,
有可能一个个体学习成绩很好,
但家庭收人
较低,
另一个个体则相反,
学习成绩较差,
但家庭收人较高,
那么尽管倾向指数
相同,
但 协 变 量 差 异 却 很 大 。King and Nielsen (2016)证 明 有 时 倾 向 指 数 匹 配
反 而 会 使 协 变 量 平 衡 性 变 差 ,因 而 ,King and Nielsen (2016)建 议 采 用 协 变 量
匹 配 方 法 进 行 样 本 匹 配 。倾 向 指 数 匹 配 是 以 完 全 随 机 化 实 验 为 基 础 的 ,
所获得
的匹配样本类似于完全随机化实验,
而协变量匹配则是以分层随机化实验为基
础的,
所 获 得 的 匹 配 样 本 类 似 于 分 层 随 机 化 实 验 ,协 变 量 匹 配 由 于 考 察 了 协 变
量的差异,
可以保证匹配样本协变量的平衡性。

推荐阅读
Imbens (2004)和 Stuart (2010)对 匹 配 方 法 进 行 了 很 好 的 综 述 。Imbens
and Rubin (2015)第 12— 2 2 章 对 匹 配 方 法 从 理 论 上 和 方 法 上 进 行 了 非 常 好 的
论 述 。关 于 匹 配 方 法 和 回 归 方 法 的 关 系 可 以 参 考 Angrist and Pischke (2009)
第 3 章 & M o r g a n and Winship (2015)第 5 章 也 有 关 于 匹 配 方 法 的 介 绍 。
第七章工具变量法

通过前面两章的学习,
我 们 知 道 ,如 果 满 足 条 件 独 立 性 假 设 (C I A ) ,匹配估
计 量 或 回 归 估 计 量 具 有 因 果 效 应 的 解 释 。但 是 如 果 控 制 观 测 变 量 X,.后 ,
两组
潜 在 结 果 仍 然 存 在 着 显 著 差 异 ,则 说 明 存 在 未 观 测 混 杂 因 素 ,同 时 影 响 原 因 变
量和潜在结果,
这时仅仅以观测变量X ;为条件,
原因变量将不独立于潜在结
果,
从 而 C I A 条 件 不 成 立 。C I A 条 件 不 成 立 意 味 着 未 观 测 因 素 会 造 成 选 择 偏
差,
从 而 出 现 由 于 未 观 测 因 素 而 造 成 的 选 择 问 题 (selection on unobservable),
也称为内生性问题,
® 匹 配 方 法 或 回 归 方 法 将 无 法 识 别 因 果 效 应 参 数 。工 具变
量法是解决内生性问题的一种经典方法,
也是实证研究中仅次于线性回归的一
种 实 证 分 析 方 法 。工 具 变 量 法 最 早 起 源 于 W r i g h t 父 子 1 9 2 8 年 关 于 亚 麻 籽 供
求联立方程组的求解,
他们发现仅仅利用可以观测到的市场均衡价格和均衡数
量的数据是无法估计出亚麻籽的供给方程和需求方程的,
他们提出的办法是引
入 需 求 的 扰 动 因 素 (demand shifter)来 估 计 供 给 方 程 ,引 人 供 给 的 扰 动 因 素
(supply shifter)来 估 计 需 求 方 程 ,这 两 个 扰 动 因 素 现 在 称 为 工 具 变 量 。
® 工具
变量法根据其发展,
可以分为两种类型,
第一种类型假设干预对所有个体的影
响 是 相 同 的 ,即 同 质 性 工 具 变 量 法 ,第 二 种 类 型 是 后 来 lmbens and Angrist
(1994),Angrist et al. (1996)发 展 的 异 质 性 工 具 变 量 法 ,
假设干预对个体的影
响 是 异 质 的 。本 章 首 先 介 绍 传 统 的 工 具 变 量 法 ,
然 后 再 介 绍 Angrist等 人 发 展
的异质性工具变量 法 。

第一节同质性工具变量法

还是以教育对收入的影响为例,
假设因果效应模型如下:
y f - a - i - T D i + A - r + Vi (7.1)
其 中 Y,.为 (对 数 )收 人 , 为 教 育 年 限 , 为 能 力 ,
奶为误差项,
并 且 满 足 Eb,.l
D,.,A,] = 0 o 常 数 r 是 因 果 效 应 参 数 ,
反映的是教育对收人的影响,
并且对所有

①在回归分析中, 通常将模型误差项或未观测因素与原因变量相关称为内生性问题,
从而通常的
O L S 估计量存在偏差, 不是总体参数的一致估计量。
② 关 于 工 具 变 量 法 起 源 的 介 绍 可 以 参 考 Angrist and Kroeger (2001) „
120 基本有用的计量经济学

个体都是相同的。
对 于 模 型 (7 . 1 ) ,
如 果 能 力 变 量 A,.是 可 观 测 的 ,
那 么 要 识 别 教 育 D ; 对收人
Y,.的 影 响 ,
可 以 直 接 利 用 回 归 分 析 或 根 据 A,.进 行 匹 配 ,
均可以得到正确的因果
效 应 估 计 。图 7 . 1 ( a ) 给 出 了 相 应 的 因 果 图 。如 果 能 力 变 量 A 是 可 以 观 测 的 ,A
是 造 成 混 杂 偏 差 的 唯 一 因 素 ,因 而 ,
只要以A 为条件,
则可以阻断后门路径D —
A —Y ,
从 而 识 别 出 D — Y 的因果效应。

(a)控制法 (
b) 工具变量法
图 7. 1 工具变量法因果图

但是,
如果能力变量A 不可观测,
那么我们就没有办法控制A 或根据A 进
行 匹 配 。如 果 能 够 找 到 一 个 工 具 变 量 Z 满 足 下 面 两 个 基 本 条 件 ,
也可以识别D
对 Y 的因果影响:
(1) 相 关 性 。工 具 变 量 必 须 与 原 因 变 量 相 关 ,即 :
Co v C D , ,Z ,)乒 0 (7.2)
(2) 外 生 性 。工 具 变 量 外 生 于 我 们 关 心 的 经 济 系 统 ,
工具变量不通过未观
测因素影响结果,
或者说工具变量分配类似于随机化实验,
独立于潜在结果,
从而
C o v (切,
Z,)=0 (7.3)
其中 0 = 。
图 7. 1 ( b ) 给 出 了 工 具 变 量 法 的 因 果 图 。Z 为 工 具 变 量 ,
直 接 影 响 D ,从而
与 D 密切相关,
满 足 相 关 性 条 件 。其 次 ,
Z 与 A 和 z;都 不 相 关 ,
Z 不会通过A

和^ 影响y ,
从 而 满 足 外 生 性 。从 图 中 可 以 直 观 地 理 解 为 何 工 具 变 量 Z 可 以 识
别 D 对 Y 的因果影响。图中显示,
D 到 Y 有两条路径表现出D 与 Y 的相关性,

由于混杂因素A 造 成 的 D 与 Y 的相 关性和真正的因果路径 D — Y 造成的相关


性 混 杂 在 一 起 ,当 A 不 可 观 测 时 ,
我们没有办法利用匹配或控制的方法阻断后
门路径,
从 而 产 生 混 杂 偏 差 。如 果 我 们 有 图 中 的 工 具 变 量 Z ,
可以看到当Z 变
化时,
直接影响D 变化,
最终会影响Y 变化,
并 且 我 们 知 道 此 时 Y 的变化是因
为 Z 的变化通过D 影 响 到 Y ,
此 时 D 和 Y 反 映 出 的 相 关 性 就 是 D — Y 的因果
第七章工具变量法 121

影响J 用公式表示,
可以计算工具与结果之间的相关性:
C o v ( Y ;,Z,) - Cov(a,Z,) + r C o v ( D y,Z,) + Cov(V;
,Z,)
因 为 《为 常 数 项 ,
所 以 ,C o v U ,乙 )= 0 , 由 外 生 性 条 件 ,C o v ( 7,.,
Z,.)=0,
并且由
相关性条件,
C 0v(D,.,
& ) 关0 ,
所以上式整理,
得:
. Cov(Y,,Z,) _ C o V( y ,.,Z ,.) / V a i ■(乙 )
r/v — Cov(D,-,Z;) — Cov(D,., Z,)/Var(Z,)'
其中,
分 子 实 际 是 F,.对 乙 的 总 体 回 归 系 数 ,通 常 称 为 简 化 式 ,
® 分 母 是 D ,对乙
的总体回归系数,
通 常 称 为 第 一 阶 段 。 (7. 4)称 为 工 具 变 量 估 计 测 度 ,
对应的样
本形式即工具变量估计量:
N
2( z , . — z)(y,'— f)
iiv = ------------------ . (7. 5)

工具变量法就是利用工具变量的外生性假设来识别原因变量和结果变量
之间的因果关系的,
但是,
工具变量的选择并不容易,
需要保证工具变量的外生
性条件成立,
往往需要研究者对所研究问题的背景知识具有相当的了解,
有些
工 具 变 量 来 自 于 外 生 的 “自 然 实 验 ”,因 而 工 具 变 量 有 时 被 称 为 “自 然 的 礼 物 ”
(Rosenzweig and Wolpin, 2000) 。
下 面 看 一 个 经 典 的 例 子 ,Angrist and Krueger (1991)利 用 美 国 的 普 查 数
据 估 计 了 美 国 的 教 育 收 益 率 。在 教 育 收 益 率 的 研 究 中 ,
能力变量是一个文献中
公认的混杂因素,
会影响个体的教育选择,
也会影响个体的收入水平,
但 是 ,能
力往往无法观测,
@ 无 法 利 用 匹 配 或 回 归 方 法 得 到 教 育 的 正 确 因 果 效 应 ,为 此 ,
考虑寻找教育的工具变量,
这个工具变量需要与教育密切相关,
但不能与能力
或 其 他 未 观 测 因 素 有 关 。Angrist and Krueger (1991)利 用 美 国 义 务 教 育 法 对
人学年龄和退学年龄的限制,
找 到 工 具 变 量 即 个 人 的 出 生 季 度 。个 人 出 生 季 度
为 什 么 可 以 作 为 教 育 的 工 具 变 量 呢 ?首 先 ,
美国各州一般规定到当年年底前年

① 工 具 变 量 z 的 作 用 是 将 因 果 路 径 d —y 造 成 的 相 关 性 分 离 出 来 ,
从而排除了其他混杂因素造成
的影响„
②简化式的概念来自于联立方程模型, 是 所 有 内 生 变 量 对 所 有 外 生 变 进 行 回 归 的 模 型 ,与之相
对应,
结构式是根据经济理论或行为假设构造的模型, 结 构 式 左 右 边 可 以 同 时 有 内 生 变 萤 和 外 生 变 量 ,而
简化式是左手边全部为内生变量, 右 手 边 全 部 为 外 生 变 量 。从 而 对 于 简 化 式 ,可以直接利用回归方法进
行参数估计,
再 从 简 化 式 参 数 中 反 推 出 结 构 式 参 数 。凡 是 恰 好 能 够 从 简 化 式 反 推 出 唯 一 一 组 结 构 式 参 数
的,
称为恰好识别, 如果可以从简化式中推出多个满足结构式的参数, 称为过度识别, 如果无法从简化式
推出结构式参数,
称 为 不 可 识 别 。尽 管 现 在 联 立 方 程 组 方 法 已 经 不 再 流 行 ,
但与之相关的概念仍然在计
量经济学中广泛应用。
③ 有 些 文 献 利 用 I Q 指 数 作 为 能 力 的 代 理 变 跫 ,但 这 也 依 赖 于 数 据 是 否 提 供 类 似 代 理 变 蛩 。
122. 基本有用的计量经济学

满 6 岁 的 孩 子 可 以 在 当 年 9 月 份 人 学 ,这 一 限 制 会 使 个 体 人 学 年 龄 产 生 差 异 ,
1 2 月份出生的孩子,
人学时年龄还不到6 岁 ,
然 而 ,1 月 份 出 生 的 孩 子 人 学 时 年
龄 已 经 接 近 7 岁 。 因 而 ,出 生 季 度 不 同 ,
意味着A 学年龄不同,
第四季度出生的
孩 子 入 学 时 年 龄 较 小 ,而 第 一 季 度 出 生 的 孩 子 人 学 时 年 龄 较 大 ,
两者相差近1
岁 。® 仅 仅 根 据 这 一 点 还 不 能 保 证 出 生 季 度 是 合 适 的 工 具 变 量 ,美 国 义 务 教 育
法还明确规定,
小孩年龄必须达到1 6 岁才能退学,
人学年龄限制和退学年龄限
制,
这两点结合起来, 对于准备在16岁
使出生季度与教育年限之间发生关系,
退 学 的 孩 子 而 言 ,出 生 于 第 一 季 度 的 由 于 人 学 年 龄 较 大 ,
1 6 岁退学时的受教育
年限不足10年,
而对于第四季度出生的孩子由于人学年龄较小,
1 6 岁退学时受
教 育 年 限 超 过 1 0 年 ,因 而 ,
平 均 而 言 ,出 生 于 第 一 季 度 的 受 教 育 年 限 较 短 ,
而出
生于第四季度的受教育年限相对较长,
使得受教育年龄与出生季度有关系。图
7 . 2 复制了 Angrist and Krueger (1991)文 章 中 的 图 I ,
总体上看,
平均教育年
限有增长的趋势,
这 与 社 会 发 展 和 人 们 对 教 育 的 重 视 有 关 ,出 生 年 份 越 晚 的 个
体倾向于受更多的教育,
对于这一点可以通过控制出生年份来消除影响。
®我
们主要关注教育年限与出生季度之间的关系,
三 、四 季 度 出 生 的 个 体 比 一 、
二季
度出生的个体倾向于受更多的教育,
并且所有出生年份的个体均有类似模式,
从 而 说 明 教 育 与 出 生 季 度 之 间 确 实 有 密 切 的 关 系 :。事 实 上 ,图 7. 2 反 映 了 工 具
变 量 估 计 量 的 第 一 阶 段 ,即 (
7. 5)分 母 上 的 部 分 。
直 觉 上 看 ,出 生 季 度 不 会 直 接 影 响 个 体 收 人 ,
用人单位不会因为出生季度
的 不 同 而 支 付 不 同 的 工 资 ,因 而 ,出 生 季 度 满 足 外 生 性 条 件 。但 是 ,
个人收人与
出生季度之间的关系也表现出类似于教育与出生季度之间的模式,
参 见 图 7.3。
图 7. 3 显 示 ,
总体上收入比较平缓,
不同年份出生的人平均收人差异不大,
有一
点点向下倾斜的趋势,
主 要 是 因 为 年 长 的 人 工 作 经 验 更 多 ,这 一 点 可 以 通 过 控
制 出 生 年 份 或 年 龄 来 消 除 。我 们 关 注 的 仍 然 是 出 生 季 度 与 收 入 之 间 的 关 系 ,

以 看 出 ,一 、二 季 度 出 生 的 个 体 相 对 于 三 、四 季 度 出 生 的 个 体 ,
平均收人要低一
些,
并 且 对 所 有 年 份 出 生 的 个 体 均 有 类 似 模 式 。但 是 ,出 生 季 度 不 会 对 收 入 产
生直接影响,
为何收入表现出上述变动模式呢?唯一的原因可能是出生季度通
过影响教育间接影响个人收人,
从而使个人收人与出生季度之间出现类似变动

© 中国的人学年龄往往是以当年8 月 3 1 日前年满6 岁 的 可 以 当 年 9 月 份 人 学 , 这 样 8 月份出生


的孩子当年可以人学,人 学 年 龄 刚 满 6 岁 ,而 9 月 份 出 生 的 孩 子 要 第 二 年 才 能 人 学 ,入 学 时 年 龄 接 近 7
岁 。对 于 中 国 的 情 形 , 第三季度出生的孩子人学年龄小, 而第四季度出生的孩子人学年龄大, 两者相差近
1 岁 „ 但 中 国 义 务 教 育 法 并 没 有 关 于 退 学 年 龄 的 规 定 ,尽 管 有 九 年 义 务 教 育 的 要 求 ,
但强制性并不强„
因 而 ,出 生 季 度 作 为 教 育 的 工 具 变 S 可 能 并 不 适 用 于 中 国 的 情 形 《
② 所 谓 cohort effect^
第七章工具变量法 123

醛掛 賴

te

1 2 . 2 ..................................................................................................
30 31 32 33 34 35 36 37 38 39 40
出生季度
图 7 . 2 教育与出生季度的关系

模 式 。 图 7. 3 呈 现 的 实 际 上 是 简 化 式 ,即 工 具 变 量 估 计 量 (7, 5)分 子 上 的 部 分 。

5 '93 [)■ 1、2季 度 -


° 3 、4 季度
5.92 ■

溆 5-91
H
§ 5.%

5.89

5.88

5.87 卜............................................. .............................................


30 31 32 33 34 35 36 37 38 39 40
出生季度
图 7 . 3 收入与出生季度的关系

上述的两张图形可以写成下列计量经济学模型:
Di — X{7tio + K n £i,- (7,6)
Y ; = X!7r20~l-7r21Z ;-he2i (7.7)
(7. 6)是 第 一 阶 段 回 归 ,
是 控 制 X ; 后 工 具 变 量 乙 对 原 因 变 量 D,.的 影 响 ,
(7. 7)是 简 化 式 ,
®反映的是控制兄后,
工 具 变 量 Z,.对 结 果 I 的 影 响 。因为引入

① 在 联 立 方 程 理 论 中 ,(
7. 6 ) 和 (
7. 7 ) 均 称 为 简 化 式 ,因 为 内 生 变 量 均 在 左 手 边 ,
外 生变U 均在右手
边。
124 基本有用的计量经济学

了协变量足,
相应的结构式可以写为:
Y; = X ;
a + rD,- + 77, (7,8)
在本例中,
X,.表 示 出 生 年 份 ,以 控 制 不 同 年 份 对 教 育 和 收 人 的 影 响 ,所 谓 同 辈
效应(
cohort effects)^ 兄 包 括 常 数 1 ,
从 而 不 用 写 出 常 数 项 。将 (7. 6 )代 入 结
构 式 (7. 8 ) ,
得:
Yi — + r[X/7Tio + TTnZ; + £],-] + Tji

= X ;[ff + Z7T10] + T7ru Z ;+ [ze1; + rji~\


= X- k2o + 7T2iZ ;+ e 2,. (7. 9)
(7. 9)第 三 行 实 际 上 是 简 化 式 (
7. 7 ) ,与 第 二 行 相 对 照 ,
可以得到简化式系数与
结构式系数之间的对应关系,
即 a + TKl0=7T20、
r7Tn ^7T2i、
rew + 切 。因为在简
化 式 中 ,右 手 边 均 是 外 生 变 量 ,与 误 差 项 没 有 相 关 性 ,从 而 简 化 式 可 以 用 O L S
方法得到一致的估计,
结构式因为有未观测能力变量造成的混杂影响无法利用
◦ LS得 到 一致估计,
我们可以利用简单式和结构式的参数关系,
将结构式参数
从 简 化 式 参 数 中 恢 复 出 来 。根 据 结 构 式 和 简 化 式 参 数 关 系 ,
可以得到因果效应
参数:

r = ^ (7‘10)
丌]1
利 用 (5. 10),(7. 6)和 (7. 7)中 工 具 变 量 的 系 数 可 以 分 别 写 为 :
_ __ CoviD ;
,Zj) __ CovCY/ ,Zi)
Kn = Va~r(z;) , 兀21 = " V a r ( z ;)
其 中 ?,是 乙 对 X,.进 行 回 归 得 到 的 回 归 残 差 D 因 而 ,
(7. 10)可 以 写 为 ,
妲 = C o v C Y ,-,^ )
tth CovCD,-,^)
对照(
7. 4 ) ,(7. 11)也 是 工 具 变 量 估 计 测 度 ,
只 是 5",替代了 Z,.,(7. 10)的样本形
式在计量经济学中通常称为间接最小二乘法估计量。
观 察 (7. 9)第 二 行 ,
整理一下可以写为:
y,- = X ;
a + r [ X ^ i o + 7 r n Z , . ] + e 2! (7. 12)
其 中 ^ 7 T 1Q+ ;
r n Z ; 是 原 因 变 量 D , 对 X , 和 Z,.的 总 体 回 归 方 程 ,由 于 Z . 和 X,
与 k 是 不 相 关 的 ,(7. 12)可 以 直 接 用 O L S 回 归 得 到 t 的 一 致 估 计 。我们可以利
用工具变量乙采用一种两阶段的方法估计因果效应参数,
第一步估计第一阶
段 回 归 (7. 6 ) ,
然 后 将 第 一 阶 段 得 到 的 D , 的 拟 合 值 代 人 结 构 方 程 (7. 8 ) ,
然后进
行第二阶段的回归(
7. 12),
这 种 方 法 称 为 两 阶 段 最 小 二 乘 法 ( 2 S L S ) 。具体应用
中使用样本数据,
第一阶段得到样本回归方程:

D, ~ X i K 10 7C] \Zi
第七章工具变量法 125

其 中 七 。、
^ 是 对 方 程 (7.6)进 行 O L S 估 计 得 到 的 回 归 系 数 ,
根据上述样本回归

方 程 得 到 A . 的 拟 合 值 亡 ,,
并 用 A 替 代 结 构 式 (7. 8 ) 中 的 A .进 行 第 二 阶 段 的
回 归 ,即 :
= X;
a + vD ;+ O + t (D;— D,)] (7. 13)
因为

rji+ r(D,- —Dj)) — Cov(l3‘


Cov(Di, .,
切)+ r C o v ( D ;,
D, — D, ) == 0

所以,
第 二 阶 段 回 归 (7. 13)可 以 得 到 r 的 一 致 估 计 ,
其中第一项A 是足和乙

的 线 性 组 合 ,由 工 具 变 量 的 外 生 性 条 件 (7. 3),第 一 项 为 零 ;第 二 项 A 是第
一 阶 段 (7. 6)的 回 归 残 差 ,
根 据 回 归 系 数 的 性 质 (5, 9 ) ,回 归 残 差 与 解 释 变 量 X ,、

乙是正交的,
戍 是 X,.和 Z , 的 线 性 组 合 ,因 而 ,回 归 残 差 U - A 也 与 戌 .是 正 交
的,
从 而 第 二 项 也 为 零 。对 (7. 13) 回 归 得 到 的 估 计 量 称 为 两 阶 段 最 小 二 乘 估 计
量 ,但 要 注 意 一 点 ,
直 接 对 (7. 13)进 行 回 归 ,
得 到 的 标 准 误 差 是 不 正 确 的 ,因为

直 接 回 归 得 到 的 残 差 是 7, + 1 ( 辽一戍.),而 不 是 $ ,
正确的方法是利用两阶段回
归估计量计算出正确的残差:
7/ = « 2sls '^ hslsD,. (7. 14)
并利用其估计正确的标准误差。当然 ,
很多软件中均有相关的命令进行处理,
比 如 在 Stata软 件 中 dvregress命 令 就 可 以 直 接 进 行 两 阶 段 最 小 二 乘 法 的 估 计 ,
并 且 得 到 的 标 准 误 差 是 调 整 后 的 正 确 标 准 误 差 。很 容 易 证 明 两 阶 段 回 归 估 计
量是工具变量估计量,
观 察 第 二 阶 段 回 归 (7. 13),利 用 (5. 10)可 以 将 两 阶 段 回
归估计量写为:
- Cov(U,.) /n 1!r、
•r2sls = ------ (7. 15)
Var(D,)

其中5;是 对 X,.的 回 归 残 差 ,因为

Cov(D,.,
S;) = Cov(D, + (D, —D , ) , D ;)

= C o v ( D ;, D ;) + Cov(D,- — D, , D ;)

其中第二项中A 是第一阶段回归(
7. 6)的 回 归 残 差 ,
根 据 回 归 性 质 (5, 9 ) ,

回 归 残 差 d,.— 与 亡 是 尤 和 乙 的 线 性 组 合 )不 相 关 ,
而 +

D ;) ,gp 5 , 是 的 一 部 分 ,
因 而 ,回 归 残 差 A —A 也与氏不相关,
从而上式第
二项为零,

C o v C D ^ D , ) ^ Cov(D,,D,) = Cov((D, - D , ) + D (,D.)
126 基本有钼的计量经济学

= Cov(Z);— D ; ,
D ;) + V a r ( D ; )

其 中 舡 一 •是 A 对 x , 的样本回归方程,
5,' 是 相 应 的 回 归 残 差 ,因 而 Cov(i),

U ;) = 0 ,
则 V aK 5 , . ) = C o V ( D,,
A ) J t A S ( 7 . 1 5),
得:

,2s]s ^ C o v O ^ ) (7.16)
C o v ( D f, D ;)

与(
7. 4)具 有 相 似 的 形 式 ,
不 过 是 用 5 ,.替代了 Z ,.,
两阶段回归相当于用氐作为
工 具 变 量 ,因 而 ,
两阶段最小二乘估计量也是工具变量估计量。
如果工具变量乙为二值的,
则 工 具 变 量 估 计 量 具 有 更 为 简 单 的 形 式 ,定义
Z,-= l 的 概 率 为 /»,

C o v ( y 1,z,)= £ [ y ,z ;]
- E L Z ^ l Y , 丨Z J ] — 坤 :[ E [ l | Z J J
= p E [ Y ( I Z, - 1 ] - p ( p E l Y ; 丨Z' = 1]
+ (1-/»)E[Y,- | Z, = 0])
= p a - p H E i Y , I z, = 1 ] - E [ y ; I z' = 0] }
同样地,
Cov(D, ,Z,) = p { \ - p ) { E l D i | Z, - 1] - ElDi | Z t = 0]}
则工具变量估计测度为:
— C o v ( U ) — ElY, 1 Z f = l] - g [ Y , - | 2,- = 0]
IV Cov(D, ,2i) — E l D i 「2,. = 1] — E l D ; | Z, = 0] ’

上 式 称 为 W a l d 估 计 测 度 (Angrist and Pischke, 2009),即 W a l d 估 计 量 的 总 体


形 式 。W a l d 估 计 量 可 以 更 加 直 观 透 明 地 分 析 工 具 变 量 识 别 因 果 效 应 的 过 程 。
工具变量识别因果效应主要是利用工具变量只通过影响原因变量这一途径影
响结果变量,
工 具 变 量 不 会 通 过 其 他 影 响 结 果 变 量 的 因 素 而 影 响 到 K 。 由于工
具 变 量 是 二 元 变 量 ,因 而 第 一 阶 段 和 简 化 式 均 可 以 表 示 为 根 据 工 具 变 量 分 组 的
观 测 结 果 平 均 值 之 差 。 比 如 ,回 到 刚 才 Angrist and Krueger(1991)的 文 章 ,

用 出 生 季 度 作 为 工 具 估 计 教 育 对 收 入 的 因 果 效 应 ,如 果 用 第 一 季 度 (相 对 于 第
四 季 度 )作 为 工 具 ,
那么,
工 具 变 量 的 识 别 结 果 可 以 用 表 7. 1 表 示 ,
第 1 列列出
了出生在第一季度的个体的收人和教育年限平均值,
第 2 列列出了出生在第四
季度的个体的收人和教育年限平均值,
第 3 列 列 出 的 是 1、
2 列平均值之差及对
应 的 标 准 误 差 。可 以 看 到 ,
出生于第一季度的个人平均周工资比出生在第四季
度 的 低 0. 0 1 3 5 ,
同时,
平 均 教 育 年 限 也 低 0. 1 5 1 年 ,对 应 的 两 者 之 比 即 为 教 育 收
益 率 的 W a l d 估 计 量 为 0. 0 8 9 ,
教 育 收 益 率 约 为 8. 9 % 。第 四 行 教 育 收 益 率 的
第七章工具变量法 127

O LS估 计 量 为 7% ,
W a ld 估 计 量 比 O L S 估 计 量 高 ,说 明 O LS估计可能低估了

教育收益率。

表 7 .1 利 用 出 生 季 度 工 具 的 教 育 收 益 率 W a ld 估计

⑴ (2 ) (3 )
第一季度 第四季度 平均值之差
⑴ 一 (2 )

In( 周 工 资 ) 5.892 5. 905 - .0 1 3 5

(.0 0 3 4 )

教育年限 12.688 12.839 -.1 5 1

(.0 1 6 )

教 育 收 益 率 的 W a ld 估计量 .089

(■021)

教 育 收 益 率 的 O L S 估计量 .070

(.0 0 0 5 )

注: 括号内为标准误差, 数 据 来 自 1980年 美 国 人 口 普 查 数 据 5 % 的 随 机 样 本 , 本表样本


为 1930— 1 9 3 9 年 在 美 国 出 生 的 男 性 ,样 本 容 量 为 162515 。 本 表 来 自 A n grist and Pischke
(2 0 0 9 ) 。

在 另 一 篇 有 趣 的 文 章 中 ,A n g riSt(l990)考 察 了 越 战 期 间 服 兵 役 对 个 人 收
人的影响,
充分体现了 W a l d 估 计 量 的 威 力 。2 0 世 纪 7 0 年 代 越 战 期 间 ,
为了 保
证征兵的透明性和公正性,
美国采用了一种特殊的征兵机制,
为每一天赋予一
个随机的数字,
一 年 3 6 5 天 共 1一 3 6 5 个 数 字 随 机 地 分 配 到 每 一 天 ,
从而使每个
人的生日均对应一个随机化的数字,
不 妨 称 之 为 征 兵 随 机 数 。征 兵 随 机 数 产 生
之后,
美 国 国 防 部 会 给 出 一 个 门 槛 ,比 如 1 9 7 0 年 为 195,所 有 生 日 对 应 的 随 机 数
字 低 于 195的获得参军资格,
而 生 日 对 应 随 机 数 字 高 于 1 9 5 的 不 需 要 参 军 ,当
然获得参军资格的人也可能由于身体或升学原因而免除参军义务,
没有参军资
格的人也有部分志愿参军,
但 数 量 非 常 少 ,可 以 忽 略 。 由 于 征 兵 随 机 数 的 产 生
机 制 使 参 军 资 格 完 全 独 立 于 个 体 特 征 ,但 参 军 资 格 却 对 是 否 参 军 具 有 重 要 影
响,
因而,
参 军 资 格 成 为 一 个 天 然 的 工 具 。用 乙 来 表 示 参 军 资 格 ,
乙 = 1 表示 获
得 参 军 资 格 (即 个 人 生 日 对 应 的 随 机 数 低 于 门 槛 ),
乙= 0 表示没有参军资格。
获得参军资格参军的可能性会更大,
除非由于身体或升学原因才能免除参军义
D,. = l 表 示 个 体 i 在 越 战 期 间 参 军 了 ,
务 。用 D , 表 示 最 终 是 否 参 军 , A. = 0 表
示 没 有 参 军 。Z ; 和 D,.之 间 密 切 相 关 ,由 于 征 兵 随 机 数 生 成 的 随 机 性 ,
可以认为
乙 独 立 于 个 体 的 潜 在 收 人 ,即 是 否 获 得 参 军 资 格 并 不 直 接 影 响 个 人 收 人 ,因而
是一个合适的工具变量。
基本有用的计蠆经济学
128

表 7. 2 越 战 期 间 参 军 对 美 国 白 人 男 性 收 入 影 响 的 W ald 估 计 量

收 人 ( y ,) 参军状态( D ;)
--------------------------------------------------------------------------------- W akH 古计量
年份 均值 资格效应 均值 资格效应 (5)
(1) (2) (3) (4)

1981 16461 — 4 3 5 :8 7267 7159 —2741


( 2 1 0 .5 ) ( .0 4 0 ) (1324)
1971 3338 一 3 2 5 .9 —2050
(46. 6) (2 9 3 )
1969 2299 — 2 .0
_________________________________ ( 3 4 .5 ) ____________________________________________________
注:
来 自 A ngriSK l9 9 0 〉。括 号 内 为 t示 准 误 差 ,
样 本 容 量 为 13500 。资 格 效 应 是 有 资 格 和
没 有 资 格 观 测 结 果 平 均 值 之 差 ,即 对 应 于 W ald 估 计 量 分 子 和 分 母 上 的 部 分 。

表 7. 2 列 出 的 是 出 生 于 1 9 5 0 年 的 美 国 白 人 ,
1970年他们面临服兵役,
从而
受 到 影 响 。第 1 列 是 对 应 年 份 的 平 均 收 人 ,
第 2 列资格效应是对应于有资格的
个 体 和 没 有 资 格 的 个 体 平 均 收 人 的 差 额 ,即 £:
[>,. IZ, = 丨乙= 0] 。可
以 看 到 1971年 参 军 1 年 后 ,
两组人群收入就有差异,
有资格的人和没有资格的
人相比,
平 均 收 人 下 降 3 2 6 美 元 。十 年 之 后 ,当 年 获 得 参 军 资 格 的 个 体 平 均 收
人仍然显著低于另一组人群,
平 均 收 人 下 降 4 3 6 美 元 。然 而 ,
1969年两组人群
(参 军 之 前 的 )
平均收人并没有显著差异,
这说明参军资格并没有直接影响个人
收入,
而 可 能 是 通 过 参 军 影 响 到 收 人 。第 3 列 显 示 ,
1950年出生的美国白人中
参军者占26.7%,
第 4 列资格效应说明有参军资格的参军可能性比没有参军资
格的参军可能性要高15.9%,
即 E[D,|2, = 1 ] - £ :
[ A I ^ = 0]d 第 5 列是相应
的 W a k H 古计量,
反 映 的 是 参 军 (D,.)对 个 人 收 人 (
匕 )的 影 响 ,
结果显示,
参军一
年后,
个人收人就因为参军而降低了 2050美 元 ,
十 年 后 ,影 响 仍 然 存 在 ,
参军使
收 入 降 低 2 7 4 1 美 元 。Angrist (1990)从 参 军 影 响 个 人 在 劳 动 力 市 场 上 的 人 力
资本积累的角度提供了一种解释。
有效的工具变量需要满足相关性和外生性两个基本条件,
相关性很容易检
验,
第一阶段的回归系数即可以反映出工具变量是否与原因变量相关,
可以利
用 t 统 计 量 或 F 统计量进行检验。困难的是对外生性的判断,
很多时候是依赖
于研究者对所研究问题的制度背景的把握和经济直觉。
® W a l d 估计量的一个

①如果一个内生变量有多个工具变蛩,
在同质性工具变量法框架下,
可以用过度识别检验来考察
外 生 性 条 件 是 否 成 立 ,即 ^ ^ [ ^ ^ ^ ^ ,
相 应 样 本 矩 记 为 切 仍 山 }) - l / N ^ > 冲 (
厂沾),检 验 估 计 量

为 J = iV„,(r2SLs M _ 1m ( r m . s ) 〜 f ( Q — 1 〉,
其 中 Q 为 工 具 变 a 数 目 „ 详 细 讨 论 可 以 参 考 Angrist and
Pischke(2009);洪 永 淼 ( 2011) a
第七章工具变量法 129

重要优势是识别外生性假设比较直观,
W a l d 估计量识别因果效应的主要依据
是, 随 乙 变 化 的 唯 一 原 因 是 E[D,.lZ,.]随 乙 变 化 造 成 的 。
( D 而对于这
一点可以有两种办法,
一 种 办 法 是 检 验 工 具 变 量 Z ,• 是 否 与 影 响 兄 的 观 测 变 量
兄相关,
如 果 乙 与 部 分 影 响 Y,.的 观 测 变 量 X,.相 关 ,
则说明工具变量还通过其
他 途 径 影 响 到 Y,.,
尤 其 是 担 心 2,.也 可 能 通 过 影 响 1 6 的 未 观 测 因 素 影 响 到 Y ,,

而 不 满 足 外 生 性 。上 文 中 ,
作 者 利 用 1969年 的 收 人 ,
观察工具是否影响收入,
发现工具对收人没有影响,
从而说明工具没有通过影响收人的其他因素影响到
收人,
就 是 利 用 了 这 种 方 法 。另 一 种 方 法 是 利 用 Z,.与 D , 不 相 关 的 样 本 ,
检验
Z,■
是否与K 相关,
这 种 方 法 依 赖 于 数 据 。AngriSt(1990)指 出 ,
1973年美国也针
对 1953年出生的个体实施了征兵随机数的分配,
但 是 ,国 防 部 最 终 没 有 根 据 这
—数 字 进 行 征 兵 ,
从 而 使 作 者 获 得 一 个 工 具 与 原 因 变 量 没 有 关 系 的 子 样 本 ,利
用 1953年出生的个人的数据,
发现参军资格与个人收入之间没有关系,
从而证
明 征 兵 随 机 数 不 会 直 接 影 响 个 人 收 入 。这 两 种 方 法 可 以 用 图 7. 4 表 示 ,
为了 检
验 工 具 Z 只 通 过 D 这 一 途 径 影 响 Y , 而 不 会 通 过 其 他 影 响 Y 的 变 量 影 响 Y 。图
7 . 4 U ) 是 检 验 Z 与 X 是 否 相 关 。这 一 方 法 并 不 完 全 充 分 ,事 实 上 ,
如果2 与X
相关,
X 可以观测, 控 制 X 后 ,Z 只 要 不 与 未 观 测 变
则我们可以利用后门规则,
量 v 相关,
Z 仍然满足外生性,
是 有 效 的 工 具 变 量 。 图 7. 4(b)是 Z 与 D 没有 关
系时,
检 验 Z 与 Y 是否相关,
如果Z 与 y 不相关,
则 说 明 Z 没有通过其他影响
Y 的因素影响到Y 。

①有些人认为,
要 检 验 z 只通过d 影 响 Y ,
而不通过其他路径影响y,可以通过控制d 后 检 验z
和 y 之 间 是 否 相 关 。这 种 方 法 具 有 一 定 的 作 用 , 如果控制d 后发现z 与 y 不相关, 可 以 说 明 2•仅 通 过 o
影响y , 从 而 2 满 足 外 生 性 条 件 。但 是 , 如 果 发 现 控 制 1)后 ,
2 与 Y 相关, 并 不 能 说 明 Z 不满足外生性条
件 。图 7. 1(b)中 Z 是 有 效 的 工 具 变 量 ,满 足 外 生 性 ,由 于 D 是 Z 和 A 的 交 汇 变 量 (collider) ,以 D 为条
件, 2 和 A 将 表 现 出 相 关 性 ,从 而 2 与 y 之 间 表 现 出 相 关 性 。因 而 ,如果控制D 后发现2 与 Y 相关, 并不
能说明工具变量不满足外生性条件。
130 基本有用的计量经济学

工 具 变 量 估 计 量 是 一 致 估 计 量 ,只 有 当 样 本 容 量 足 够 大 时 ,
工具变量估计
量才接近于真实值,
在有限样本下,
估计偏差可能会比较大,
尤其当工具变量外
生性条件不满足并且存在弱工具变量时,
工具变量估计量的估计偏差可能会更
大 。 回 到 (7. 4)式 ,
如 果 Cov(v,.,
乙 )关0 ,

... C o v ( Y ^ Z ;) C o v(t?,.,
Z,.)
riV_ C o v ( D ,., 乙) CovCD^Zi)
_ , CovC??,-,
Z,.)
" Co錢 , 乙)

其 中 纟 是 估 计 偏 差 ,
如果此时工具变量相关性不强,
存在弱工具变量
问 题 ,即 C o v ( D , ,
Z,.)比 较 小 ,即 使 C o v b ,
^ ) 比较小,
也可能产生很大的估计
偏差。
即使使用完全随机化产生的工具变量也不能完全保证外生性条件的成立。
比如,
A n g riSt(1990)利 用 征 兵 随 机 数 作 为 参 军 状 态 的 工 具 变 量 识 别 参 军 对 个 人
收人的影响;
H e Ck m a n (1997)指 出 ,征 兵 随 机 数 分 配 之 后 ,国 防 部 公 布 门 槛 之
前,
如果雇主根据雇员的随机数进行相应的人力资本投资,
对于那些随机数较
小、
参 军 可 能 性 较 大 的 雇 员 ,降 低 他 们 的 职 业 培 训 机 会 或 安 排 他 们 从 事 一 些 短
期性的工作,
从而他们的收入相对较低,
就会使征兵随机数和个人收人相关,

.兵 随 机 数 不 再 满 足 外 生 性 要 求 。
传统工具变量法假设干预对所有个体的影响是相同的,
而现实中干预的影
响 往 往 是 异 质 的 ,同 样 的 政 策 干 预 对 有 些 个 体 影 响 大 ,
对 有 些 个 体 影 响 小 ,同样
是接受大学教育,
有些人因此收人有很大提高,
有些人收人并没有因教育而变
化 多 少 ,因 而 ,同 质 性 假 设 往 往 不 符 合 现 实 。如 果 干 预 对 个 体 的 影 响 具 有 异 质
性,
工具变量只是识别一部分个体的平均因果效应,
不能将工具变量估计量解
释 为 总 体 的 平 均 因 果 效 应 或 简 单 地 解 释 为 干 预 组 的 平 均 因 果 效 应 。不 同 的 工
具 变 量 往 往 估 计 的 是 不 同 群 体 的 平 均 因 果 效 应 ,因 而 ,
不同的工具识别不同的
因果效应参数,
下一节将对此进行详细讨论。

第二节异质性工具变量法

下 面 讨 论 异 质 性 框 架 下 的 工 具 变 量 法 。所 谓 异 质 性 是 指 干 预 对 个 体 的
影 响 会 因 人 而 异 ,同 样 一 项 政 策 对 不 同 的 人 的 影 响 可 能 会 不 同 ,同 样 完 成 了
大学教育,
有些人收人提高很多,
有 些 人 收 人 没 有 太 大 提 髙 。 现 实 中 ,异 质 性
第七章工具变量法 131

是 常 态 。 Imbens and AngrisK 1 9 9 4 ) 、Angrist et al. ( 19 9 6 )首 先 将 异 质 性 因 果


效 应 引 人 工 具 变 量 法 ,利 用 潜 在 结 果 框 架 的 语 言 重 新 ,表 述 了 工 具 变 量 法 ,

而 使 工 具 变 量 法 的 解 释 更 加 清 晰 。仍 然 从 二 元 工 具 变 量 出 发 ,
并引人一些新
的符号。
用 Y,•(山 z)表 示 个 体 f 在 干 预 状 态 A. = d 和 工 具 变 量 乙 下 的 潜 在 结
果,
为分析简便,
这 里 原 因 变 量 A . 和 工 具 变 量 Z'均 为 二 元 变 量 ,
从而我们将
有 4 个潜在结果,
分 别 对 应 于 (D,.,
乙)四 种 取 值 状 态 。Y,.(1,
Z ;) _ Y , ( 0 ,
Z ,)表
示相同工具变量取值情况下的个体因果效应,
Y, (D,.,1) 一Y,.(!),.,
0 )表 示 相 同
干预变量取值下,
工 具 变 量 对 结 果 的 个 体 因 果 效 应 。可 以 将 工 具 变 量 对 结 果
变量的影响看作一因果链,
工 具 变 量 乙 直 接 影 响 原 因 变 量 D,.,
原 因 变 量 D ,.最
终 影 响 到 结 果 变 量 y,、 为 了 反 映 工 具 变 量 Z , 对 原 因 变 量 D , 的 因 果 影 响 ,

认 ,.表 示 工 具 变 量 乙 = 1 时 原 因 变 量 的 取 值 ,
D。,.表 示 工 具 变 量 Z,. = 0 时 原 因 变
量取值,
原 因 变 量 依 赖 于 工 具 变 量 的 状 态 ,从 而 观 测 到 的 原 因 变 量 D ,• 可 以
写为:
Di = D 0;+ ( D b — D 0l-)Zi = 7r0 + ttj.Z;+ Si (7. 18)
[ 1 \ ] ,7tu 三 D u - D 0i, ^ - D 0 - E l D 0^ o 〜是 工 具 变 量 对 原 因 变 量
其中吩= £ :
的个体因果效应,
允 许 不 同 个 体 对 工 具 变 量 的 反 应 不 同 ,因 而 ,
有 下 标 z‘
。与潜
在 结 果 一 样 ,以 ,.和 D 。
,•只 能 观 察 到 一 个 ,以 Angrist(1990)为 例 ,
2 ,.表 示 是 否 有
参军资格, 表示没有参军资格时个体的参军状态,
D h.表 示 有 参 军 资 格 时 个 体
的参军状态,
两 者 之 差 则 反 映 了 参 军 资 格 对 个 体 参 军 状 态 的 影 响 。为 了 考 察 异
质性情况下工具变量法的基本内含,
引人几个关键假设。
第 一 个 假 设 是 独 立 性 假 设 ,它 要 求 工 具 变 量 类 似 于 完 全 随 机 化 分 配 的 ,

立于所有的潜在结果。

例 7. 1 (独 立性假设)
D o , - , D 1 ; } X Z t- (7.19)
在这一假设下,
简化式m 回归的回归系数可以写为:
E lYi 乙
| = i ] - £ [ y ,-丨乙 = o ] = E [ y , . ( d u ,
i ) ] 一E [ y , . ( d 。,• ,( ) ) ]

同样地,
第一阶段辽对的回归系数可以写为:
E L D t | Z,- - 1 ] - E [ D ; | Z, = 0]
^ E L D l; | Z, = 1] — E [ D 0i | Z ; = 0] = E l D l; — D 。
,] (7. 20)
第 二 个 假 设 是 排 除 性 假 设 (exclusion assumption) ,
它要求工具变量排除在
所关心的因果效应模型之外,
工具变量不直接影响潜在结果。
132 基本有用的计量经济学

例 7 .2 (排除性假设)
O) = Y,.(d ,
Y'.W’ l) , d = 0,1 (7.21)
排除性假设说明一旦原因变量D , 取值给定,
工 具 变 量 Z ; 不会改变潜在结
果,
或者说一旦原因变量取值给定,
潜 在 结 果 不 依 赖 于 工 具 变 量 。在 这 一 假 设
下,
前面所讲的4 个潜在结果又会恢复到2 个 ,
从而可以用原来的潜在结果符
号 ,即
y 0f. = y (.(0 ,i) - y;( 0 ,
0)
Y。
;= Y , ( l , l ) - Y ,( 1 ,0 )
独立性假设和排除性假设两者结合起来,
实际上是上一节工具变量的外生
性 要 求 。但 外 生 性 假 设 要 求 工 具 变 量 与 模 型 未 观 测 因 素 不 相 关 ,
但并不清楚怎
么 样 才 能 不 相 关 。现 在 将 这 一 假 设 具 体 化 为 两 个 假 设 ,
对工具变量的外生性要
求 就 更 加 清 楚 了 。独 立 性 假 设 要 求 工 具 变 量 对 结 果 有 因 果 影 响 ,
但排除性假设
则要求原因变量一旦确定,
工具变量排除在因果模型之外,
从而说明工具变量
只通过影响原因变量这一唯一途径影响潜在结果。

例 7. 3 ( 单调性假设)
D u ^ Do, 或者 A, (7.22)
单调性假设是说工具变量对个体的影响方向一致。比如,
单调性
成立,
表示当工具变量由0 变 为 1 时,
会推动部分个体干预变量的选择由0 变
为 1,
而 不 会 出 现 个 体 干 预 变 量 选 择 由 1 变 为 0 的 情 况 。当 给 个 体 参 与 资 格 时 ,
受 到 影 晌 的 个 体 就 会 选 择 接 受 资 格 从 而 选 择 参 与 ,在 正 向 单 调 性 假 设 下 ,
不会
出现给予资格时,
他 反 而 选 择 退 出 的 情 况 。很 多 时 候 ,
单调性假设是合理的。
在正向单调性下, 当 工 具 变 量 由 乙 = 0 变 为 Z, = l 时 ,
原因变量
■D,只 有 二 种 可 能 性 ,
认 ,.= D n = 0 、
D。,.= = 1 = 0 且 D!,.= 1 。第 ~■种 情 况 ,
无 论 工 具 变 量 怎 么 变 化 ,个 体 总 是 选 择 不 参 与 ,这 种 个 体 称 为 从 不 参 与 者
(never takers)。第 二 种 情 况 ,
无论工具变量怎么变化,
个 体 总 是 选 择 参 与 ,因而
称 为 总 是 参 与 者 (always takers) 0 第 三 种 情 况 ,
个体选择会随着工具变量变化
而变化,
并且遵守工具变量的激励,
不 给 予 资 格 就 不 参 与 ,给 予 资 格 就 会 参 与 ,
这 类 个 体 称 为 依 从 者 (compliers)。还 有 一 种 个 人 ,
满 足 = 1 且 D h= 0 ,
这种
个 体 不 给 予 他 资 格 时 他 偏 要 参 与 ,而 给 予 他 资 格 时 他 不 参 与 ,因 而 称 为 叛 逆 者
(defiers)。但 在 正 向 单 调 性 假 设 下 ,
不 会 出 现 叛 逆 者 。如 果 是 负 向 的 单 调 性 假
设 成 立 ,
则包含叛逆者,
不 包 含 依 从 者 。很 多 时 候 正 向 单 调 性 假 设 更
符 合 现 实 ,因 而 ,
后文若无特别说明,
单调性均指正向单调性。
给 定 独 立 性 假 设 、排 除 性 假 设 、
单调性假设和第一阶段存在四个基本条件
第七章工具变量法 133

下,
工具变量估计测度可以解释为受到工具变量影响的这一部分个体的平均因
果效应,
这 一 因 果 效 应 测 度 通 常 称 为 局 部 平 均 因 果 效 应 (Local Average Treat­
ment Effect, L A T E ) 0

定理 7 .1 (LATE 定 理 (
Imbens and A ngrist,1 9 9 4 ) ) 假设
( 1 ) 独 立 性 ,{ n . ’ o m ' d l ) ,D0, ,
D W} JLZ, ’
( 2 ) 排除性, ^= 0, 1
( 3 ) 第 一 阶 段 存 在 ,E [ D W —D 。
,]乒 0
( 4 ) 单调性,

S r l t = - ^ [ A ^ o ] = 咖 飞 .1 > D。
'.](7-23)
(7. 23)左 边 是 W a l d 估 计 测 度 ,
对应于工具变量估计测度,
右边认,.〉 /)。
,•等
价 于 1)1;= 1,1)。
,.=0,即 依 从 者 。 因 而 ,
定 理 7. 1 说 明 ,
如果满足上述四个基本
假 设 ,那 么 工 具 变 量 估 计 测 度 估 计 的 是 依 从 者 的 平 均 因 果 效 应 L A T E 定理
7. 1 非 常 重 要 ,
告诉我们工具变量到底估计的是什么参数,
工具变量估计量估计
的 是 依 从 者 的 平 均 因 果 效 应 。在 异 质 性 因 果 效 应 框 架 下 ,
不能简单地将工具变
量估计解释为总体的平均因果效应, 工具变量只能估计出受工具变量影响的这
一 部 分 群 体 的 平 均 因 果 效 应 ,那 些 对 该 工 具 变 量 没 有 反 应 的 个 体 的 平 均 因 果 效
应 是 没 有 办 法 利 用 工 具 变 量 法 估 计 出 来 的 。工 具 变 量 可 以 识 别 因 果 效 应 ,
得到
可信的因果效应参数估计,
从 而 具 有 内 部 有 效 性 。但 由 于 工 具 变 量 只 能 估 计 出
依从者的平均因果效应,
而依从者的因果效应并不一定能推广到其他个体,

而 不 一 定 具 有 外 部 有 效 性 。利 用 工 具 变 量 法 进 行 因 果 效 应 估 计 时 ,
必须要清楚
这一点,
不 能 将 工 具 变 量 估 计 量 直 接 推 广 到 其 他 群 体 。在 Angrist and Krueger
(1991)一 文 中 ,
工具变量估计量可以解释为那些准备在1 6 岁退学的孩子的教
育收益率,
这些孩子有可能是相对学习能力比较差的学生,
也可能是其上学机
会成本比较大的学生,
他 们 的 教 育 收 益 率 可 能 与 总 体 的 教 育 收 益 率 不 同 。An -
grist (1990)估 计 的 是 那 些 没 有 参 军 资 格 就 不 参 军 而 给 予 参 军 资 格 就 会 参 军 的
群体的平均因果效应,
参军资格工具变量不能估计出自愿参军者或免除参军义
务者的平均因果效应。
在异质性因果效应框架下,
工具变量估计量估计的是依从者的平均因果效
应,
因而,
工具变量不同,
工 具 变 量 的 依 从 者 通 常 也 会 不 同 ,因 而 ,
不同的工具变

①如果使用负向单调性假设,
则 工 具 变 fl估 计 测 度 表 示 为 叛 逆 者 的 平 均 因 果 效 应 《
基 本 有 用 的计量经济学

fi将 会 识 别 不 同 的 因 果 效 应 参 数 ,
得到不:同 的 估 计 结 果 。工 具 变 量 只 能 识 别 对
其 有 反 应 的 人 群 的 平 均 因 果 效 应 。如 果 有 多 个 工 具 变 量 ,
两阶段最小二乘估计
量 将 是 各 工 具 变 量 估 计 的 局 部 平 均 因 果 效 应 的 加 权 平 均 值 (Angrist and Pisch­
ke, 2009),
很 难 解 释 其 经 济 意 义 ,因 为 不 同 工 具 估 计 不 同 人 群 的 因 果 效 应 ,
加权
平 均 之 后 代 表 的 是 哪 部 分 群 体 很 难 定 义 ,因 而 ,
在异质性框架下,
最好利用单一'
的工具来估计特定人群的平均因果效应(
M o r g a n and Winship,2015) 。下面给
出 L A T E 定理的证明^
证 明 首先,
Wald估计测度分子部分,
ELY, | z t = i ] = E [ y 0;+ cr 1;U ; I Z' = 1]
= E l Y 0i + (Yu - Y 0i) D u 丨乙= 1 ]
= E i Y 0i + ( Y u - Y 0;
) D U']
其中第一行和第二行利用观测结果与潜在结果之间的关系,
第三行利用独立性
假设。
同样地,
E L Y ; | z,. = 0 ] = E [ y 0l-+ ( y w —
两式相减,
得:
ELY, I Z,- - 1] - E [ y , - I Z, = 0] = E [ ( y u -YcOCD,,. - D 0(.)] (7. 24)
单 调 性 假 设 意 味 着 认 ,一D 。
,.等 于 1 或 0 ,
所以
E [ ( Y 1/-yo,)(r>1,.-Do,)] = ,I Dl; > Doi2PrlDu > D 0;
— Y。 ]
同样地,
可以得到:
E I D ; ! Z ; = 1] - E l D { | Z, = 0] = E L D V — D 0;
] = P r [ D 1; > D 0t-]
(7.25)
(7.24)/(7.25)即 得 证 。
下面看一下为什么要引人单调性假设,
如 果 没 有 单 调 性 假 设 ,认 ,.一D 。
,将
可 以 取 0 、1 、一 1 三 个 值 ,
W a l d 估计测度分子上的部分可以写成:
ELY, | Z ; = | 2, = 0]

= - n ,- i D u > D 0;
] P r [ D J(. > D 。
,.]
~ E l Y u ~ Y o i I D u < D 0,.]Pr[D1; < O 0,]
其中第一项是依从者的平均因果效应乘以依从者在总体中的比重,
第二项为叛
逆 者 的 平 均 因 果 效 应 乘 以 叛 逆 者 在 总 体 中 的 比 重 。此 时 ,
工具变量估计量估计
的是这两类群体平均效应的加权平均,
最终结果将无法解释,
尤其两者的效应
可能相互抵消,
从 而 工 具 变 量 得 到 没 有 影 响 的 结 果 ,但 事 实 上 干 预 对 这 两 类 人
第七章工具变量法 135

均 有 影 响 。正 向 单 调 性 可 以 保 证 总 体 中 没 有 叛 逆 者 ,消 除 了 第 二 项 影 响 ,
从而
可 以 将 工 具 变 量 估 计 量 解 释 为 对 依 从 者 平 均 因 果 效 应 的 估 计 。在 传 统 工 具 变
量 法 中 ,由 于 假 设 因 果 效 应 是 同 质 的 ,
单调性假设是不需要的,
利用上式,
如果
假设个体因果效应为常数,
即 则
E [ Y i | Z ; = 1 ] - E [ Y ; \ Z i ^ 0]
= r{Pr[Di ;> Do,] 一 P r [ D 1; < D 0i]} = r E [ D u — D 0;
]
从 而 W a l d 估 计 测 度 就 等 于 总 体 平 均 因 果 效 应 r。

1. 谁是依从者 •

L A T E 定理告诉我们,
工 具 变 量 法 估 计 的 是 依 从 者 的 平 均 因 果 效 应 。谁是
依 从 者 呢 ?根 据 上 文 的 定 义 ,
依 从 者 是 那 些 会 依 从 于 工 具 变 量 取 值 的 个 体 ,即
乙= 0 时 ,
其 个 人 选 择 严 0,
厶= 1 时 ,
其 个 人 选 择 1 ^ = 1 。但 是 ,
对于任一个
体其对应工具变量要么Z,=0,
要么乙= 1 ,
在数据中不可能同时看到个体f
在两个工具变量取值下的选择,
或者说潜在结果D 。
,.、
!),,.只 能 观 测 到 1 个 ,
也就
是 说 ,一般 而 言 ,
谁 是 依 从 者 是 无 法 观 测 到 的 。所 能 观 测 到 的 是 D ,.,
谁接受干预
谁没有接受干预是可以观测的,
我们关心的因果效应参数往往是定义在可观测
的 原 因 变 量 基 础 上 的 ,比 如 干 预 组 平 均 因 果 效 应 ( A T T )或 控 制 组 平 均 因 果 效 应
(ATC),
然而依从者往往与接受干预者和没有接受干预者并不完全相同,
因而,
L A T E 往 往 不 能 解 释 为 A T T 或 A T C 。但 是 ,
在 一 些 特 殊 的 情 况 下 ,可 以 识 别
出部分依从者。
首 先 讨 论 干 预 组 中 个 体 的 构 成 ,因 为 及 一 认 ‘
+ 彳以,.一A u ) Z , 。 因 而 ,D,.=
1 在正向单调性
假设下, = 1 意味着1^ = 1,
从 而 这 部 分 个 体 为 总 是 参 与 者 。另一部分
0,D,;—D 0,= l 且 乙 = 1 , 说 明 A , = l ,
D a,.= 0,是 依 从 者 。 因 而 ,干 预 组 中 包 括
两 部 分 群 体 :总 是 参 与 者 和 依 从 者 ,
因而,
E [ Y 1;-Yo, I D; = 1] = ELYw- Y o , - ! D 0l = l]P r [ D Q, - 1 I D ; = 1]
V y - . 、 V '

千预组平均因來效应 总是参与者平均因采软应

+ E [ Y 1;-Yo, I Du > r U P r [ D 1; > D0i ,Z; - 1 I D, = l] (7. 26)


n y- /
依从者平均因烘效应

也就是说,
干预组平均因果效应实际上是总是参与者和依从者这两类人的平均
因果效应的加权平均,
而 工 具 变 量 法 只 能 识 别 出 依 从 者 的 平 均 因 果 效 应 ,如果
干预组中总是参与者比重非常小,
依从者的比重非常大,
那么工具变量估计量
可以近似地估计出干预组的平均因果效应。
对于控制组中个体的构成,
类似地,
控 制 组 中 也 包 栝 两 种 个 体 :从 不 参 与 者
和 依 从 者 ,因 而 ,
控制组平均因果效应可以写为:
136 基本有用的计量经济学

ElY j, — y Q;j D; = 0] = ElYu — y 0l- I Du = 0]Pr[Di ;— 0 | D (- ^ 0]


控制组平均因果效应 从不参与者平均因果效应
[ y h. --r 0;| Dv > DoJPrCDi,.
+ E _. ^ > D 0,,
Z, = 0 ! D ; - 0 ] (7.27)
依从奔平均因果效应
同样地,
如果控制组中从不参与者很少的话, 工具变量估计量可以近似地解释
为控制组平均因果效应。
在一些特殊的设计中,
可以识别出部分的依从者。比如, 在研究孩子数量
对女性劳动力供给的影响时,Angrist et al. (2010)利用第二胎是否是双胞胎作
为生育第三个孩子的工具变量。如果第二胎是双胞胎 Z, = l ,
那么肯定会有第
三个孩子 D f= l ,
不会出现有双胞胎而没有第三个孩子的情形,即不可能出现
= 换言之,
不会出现从不参与者,
从而在控制组中全部是依从者,
这时工
具变量估计量可以解释为控制组平均因果效应。另 一 个 例 子 是 Oreopoulos
(2006) ,
作者利用英国 1 9 4 7 年义务教育法将法定退学年龄由 1 4 岁 提 高 到 15
岁的自然实验作为工具变量, 估计英国的教育收益率 。Z ,.= 1 表示退学年龄提
2,.= 0 表示退学年龄为 1 4 岁 ,
高到15岁, D i 表示受教育程度,
受到该工具变量
影响的主要是在 1 4 岁准备退学的个体。由于法律的强制性, 当法定退学年龄
提 高 到 1 5 岁时,
1 4 岁退学的人非常少了,
作者数据显示,
1 4 岁退学比例由 1946
年 的 6 0 % 下 降 到 1948 年 的 不 足 1 0 % 。这种情况下,
也不存在从不参与者,

制组中几乎全部是依从者,
工具变量估计量可以解释为控制组平均因果效应,
即工具变量估计的是那些1 5 岁退学的个体的教育收益率。
一般情况下,
依从者是无法观测到的,
干预组和控制组中均包含依从者,

又不完全是依从者。因而,
了解依从者在总体中的比重及依从者的基本特征有
助于了解工具变量估计量的解释能力,为此,
可以计算总体中依从者的占比,

及干预组和控制组中依从者的占比。
总体中依从者的占比上文已经计算过, 就是第一阶段(7: 20)(7. 25 ), 即
,.] = E [ D ; | Z ; = 1]-E[D,. j Z,. 二 0]
P r [ D 1; > D 0/] ^ E [ D W — D 。
(7. 28)
干预组中依从者的比重为:

P r [ D u > D 0l | = 1] - P r [ D ' 二
-11 > D。
'.]

= Pr[Z,- ^ 1]{£[D, | Zt 二 1 ] - £ [ D , | Z, 二 0]} n 9Q、


— ^ ' Pr[D, = 1]
其中第二行利用了
Pr[D; = 1 | Dlt- ,.] = Pr\_Zi = 1 | D b-〉 _D0/]
D。
第七章工具变量法 137

即对于依从者而言,
原因变量和工具变量完全一致。由独立生假设:
Pr[Z; = 1 [ D u > D o ,-:= Pr[Z, = 1]
依 从 者 占 总 体 的 比 重 ?1"[以 , . > 0 。
,]等 于 第 一 阶 段 参 数 估 计 £:
[1),.|2,. = 1] —
ECD,•丨乙= 0 ] 。 同 样 地 ,
控制组中依从者的比重为:
Pr[D u > Doi | D, = 0]
_ ( l - P r [ Z , = 1]){£[D,- 1 乙 = 1^-ElDi \ = 0]} n
- I - F r [ D ; = 1] ( . )
根 据 上 述 公 式 (7. 28)(7. 2 9 K 7 . 30 ) 可 以 估 计 出 依 从 者 在 总 体 中 、干预 组
中及控制组中的比重,
从 而 可 以 判 断 依 从 者 的 代 表 性 。如 果 依 从 者 所 占 比 重
比较大,
那 么 工 具 变 量 牯 计 量 的 解 释 力 可 能 会 更 强 。如 果 依 从 者 所 占 比 重 较
小,
那么,
所得到的工具变量估计量就不能简单地解释为总体的平均因果效
应 或 者 干 预 组 平 均 因 果 效 应 ,只 能 解 释 为 对 工 具 变 量 有 反 应 的 人 群 的 平 均 因
果效应。 '
尽 管 可 以 计 算 出 依 从 者 的 比 '重 ,
但仍然无法识别出谁是依从者,
从而无法
将 依 从 者 分 离 出 来 。但 是 ,
可以大概地了解依从者的基本特征,
假 设 X , 为一二
元 变 量 ,比 如 表 示 是 否 为 大 学 教 育 ,
则可以计算依从者中是大学教育的可能性,
Pr[X,- = 1 | D n > Dp,] = P r [Du > D oi J X,- = 1]
P r[X ; - 1] ~ Pr[D b. > Do,-]
_ E j D ;| Z,- = 1 ,
X; = 1] — E\_D;| Zj = 0,X, ^ 1] (1 .
: E[A. I Z,- = 1 ]-E [D ,- 1 Z t = 0] •
其中分母反映的是总体中依从者的比重,
分子表示的是具有大学教育特征的总
体 中 依 从 者 的 比 重 。如 果 上 式 大 于 1 ,
说明依从者中大学教育者可能性更大。
通过计算上述公式,
可以大概地了解依从者具有什么样的基本特征。

2 . 引入协变量

有时无法寻找到满足完全独立于潜在结果的工具变量,
我们可以引入条件
独立性假设,
工具变量满足以协变量为条件后独立于潜在结果,

{Yo,-,Y,/,Do,-,D1;} JLZ,- | X,- (7.32)
这 里 相 当 于 假 设 工 具 变 量 1 、类 似 于 分 层 随 机 化 实 验 产 生 的 数 据 ,
在相同的协
变 量 层 内 工 具 变 量 独 立 于 潜 在 结 果 ,
可 以 用 因 果 图 7 . 5 描述此时的识
别 方 法 。Z 本 身 不 是 独 立 于 所 有 潜 在 结 果 的 ,
Z 到 D 和 Y 存 在 后 门 路 径 Z —X
— 夕和之― 叉— 这两条后门路径 均 可 以阻断,
但是一旦控制协变量X , 从而
满足 Z 仅通过D 影 响 即 满 足 独 立 性 和 排 除 性 假 设 D 因而,
可以根据X 分
层,
在层内,
Z 满 足 独 立 性 假 设 。假 设 在 层 内 也 满 足 正 向 单 调 性 和 第 一 阶 段 存
138 基本有用的计量经济学

在,
则 上 文 的 L A T E 定理在协变量X 层内仍然满足,
从而
E l Y t | X,-,Z, = 1] - £[Y,- j 足 ,Z, = 0]
E l D { | X , ,Z, - 1 ] - E [ D , - | H - 0]
= ELYU- Y 0;| X , , D 1;> D 0i] = r c(X,) (7.33)

图 7. S 引 入 协 变 量后的工 具 变 量 识 别

即在协变量层内,
如 果 满 足 独 立 性 、排 除 性 、
第一阶段和单调性四个假设,
层 内 工 具 鸾 量 估 计 量 6 ( 足 .)可 以 解 释 为 具 有 特 征 兄 的 依 从 者 的 平 均 因 果 效
应 。如 果 想 得 到 依 从 者 的 无 条 件 平 均 因 果 效 _ ,
可以利用协变量的分布进行加
权 ,即
E [ Y U - Y 0i | D u > Do,] = E[ r c( X ;) | D u > D 0l] (7. 34)
假 设 X ;为 离 散 变 量 ,
则上式可以写成:
ElYu - Y 0i | D u > U,-] = 5>fCx)Pr[;
C. - x | D h > D0
;]
J
— r 、Pr[X,- = x^PrWu > Dp,- j X ;= _r]
—4" f Pr[Dlt> D 0iJ

= V Pr[X \ X, = -r,z,- = 1] — g [ A 丨X,.= 工,


2,. = Q]}
一 + r , E [ A I Z ^ U - E L D , . |Z,— 0]
(7. 35)
上 式 中 权 重 正 是 前 面 计 算 的 具 有 特 征 足 依 从 者 所 占 的 相 对 比 重 (7. 31 ) ,

以 根 据 数 据 计 算 出 来 。 当 然 ,如 果 将 第 一 阶 段 和 简 化 式 均 表 示 为 饱 和 回 归 模
型,
具 有 协 变 量 调 整 的 工 具 变 量 法 也 可 以 用 两 阶 段 法 估 计 量 来 进 行 表 示 ,即
Di — 7TX + kixZ ;+ e1; (7.36)
其 中 TTx表 示 根 据 X,.的 取 值 产 生 的 虚 拟 变 量 ,
相 当 于 7TX 是 一 系 列 取 值 为 1(X,.
的协变量系数,
;rlX是 工 具 变 量 与 一 系 列 协 变 量 取 值 交 叉 项 的 系 数 ,同样
地,
简化式写为:
Y ; = ax + rcD ;+ 7), (7. 37)
则得到的两阶段回归估计量可以表示为:
tc = E [ w ( X , ) r f( X ;
)] (7.38)
其中,
第七章工具变量法 139

. ,v 、 V ar(E [D f | X (,Z,] | X ,)
如 O = E[Var(E[D,- | X ifZ j | X ;)]
Var(E[D,- 1 U ] 丨X,.)
= E{E[D,- I U ] ( 取 ' I X itZ ;
l ~ E [ D ; [ X J ) I X,}

3 . 随 机 化 实 验 与工具变量法

在随机化实验中,
通 过 随 机 机 制 可 以 将 个 体 分 配 到 干 预 组 和 控 制 组 。但是
在现实的随机化实验中,
会 出 现 非 依 从 的 现 象 。分 配 到 干 预 组 的 个 体 有 可 能 不
愿意接受积极的干预,
而分配到控制组的个体有时希望接受干预,
从而随机化
分 组 和 实 际 是 否 接 受 干 预 之 间 不 一 致 。有 些 时 候 ,由 于 控 制 组 往 往 不 需 要 施 加
任 何 积 极 的 干 预 ,因 而 ,
实验者可以控制分配到控制组的个体接受积极干预,

是,
分 配 到 干 预 组 的 个 体 需 要 接 受 积 极 的 干 预 ,如 果 参 与 者 不 愿 意 接 受 ,
实 验者
往往不能进行强制,
从 而 出 现 分 配 到 干 预 组 的 个 体 退 出 积 极 干 预 的 情 况 ,出现
单边的非依从现象,
即分配到控制组的个体都会依从于分配,
保持在控制组里
面,
但分配到干预组的个体,
有些可能不愿意接受积极干预而不依从于分配,
退
出 干 预 组 ,从 而 回 到 控 制 组 中 。这 种 情 况 卞 ,我 们 不 能 用 接 受 干 预 的 个 体 和 没
有 接 受 干 预 的 个 体 的 结 果 直 接 进 行 比 较 ,因 为 接 受 干 预 的 个 体 可 能 存 在 着 选 择
性样本。
考 虑 例 3. 1 提 到 的 关 于 培 训 的 随 机 化 实 验 ,通 过 随 机 机 制 将 有 资 格 的 个 体
分配到干预组和控制组,
干 预 组 个 体 将 接 受 政 府 资 助 的 职 业 培 训 ,而 控 制 组 个
体 没 有 相 应 的 职 业 培 训 。被 分 配 到 干 预 组 的 个 体 有 些 没 有 参 与 职 业 培 训 ,
可能
是他找到了更好的工作,
或 其 他 原 因 。如 果 退 出 干 预 组 的 个 体 都 是 那 些 相 对 就
业能力更强的个体,
那么最终真正接受培训的干预组个体将与控制组个体不相
同 ,由 于 分 配 到 干 预 组 中 的 能 力 较 强 者 退 出 ,剩 下 的 都 是 相 对 能 力 较 弱 者 ,这
样,
实际接受干预的个体和没有接受干预的个体就不再具有可比性,
根据实际
实施的干预状态进行的比较分析存在着样本选择偏差。
在 随 机 化 实 验 中 ,出 现 这 种 非 依 从 的 现 象 后 ,
不能根据实际实施的干预状
态来进行分组比较,
在医学中,
通 常 使 用 所 谓 的 意 向 性 干 预 分 析 。意 向 性 干 预
分析是指不管事后实际分组如何,
仍然以原来的随机化分组为基础比较分析两
组 结 果 的 差 异 ,以 避 免 根 据 实 际 分 组 可 能 造 成 的 样 本 选 择 性 偏 差 。用 乙 来 表
示随机化分配的干预状态,
D , 表 示 实 际 实 施 的 干 预 状 态 , 表示事后的观测结

果 。那 么 意 向 性 分 析 主 要 是 考 察 随 机 化 分 配 变 量 乙 与 之 间 的 关 系 ,由 于 乙
140 基本有用的计量经济学

是 随 机 化 分 配 的 ,因 而 ,
乙对结果I 的影响可以用两组结果之差来进行测度,
因而,
Z , 对 匕 的 影 响 称 为 意 向 因 果 效 应 (Intention to Treat, I T T ) ,
定义为:
riTT_Y = ElY,- | Z, = 1 ] - E [ Y ;| Z, - 0] (7. 39)
意 向 因 果 效 应 并 不 完 全 是 原 因 变 量 的 因 果 影 响 ,因 为 随 机 化 分 配 的 干 预 组
中有一部分没有接受积极的干预^ 假设因果影响是正向的,
那 么 I T T 会低估干
预 组 平 均 因 果 效 应 。实 际 上 ,在 这 种 随 机 化 实 验 中 ,
可以利用工具变量法进行
估 计 。由于干预分配的随机性,
使乙独立于所有的潜在结果,
而随机化分配的
干 预 状 态 乙 与 实 际 接 受 的 干 预 状 态 D,.之 间 密 切 相 关 。如 果 分 配 到 干 预 组 ,

接受干预的可能性会更高,
而分配到控制组,
则 不 会 接 受 干 预 。因 而 ,
随机化分
配 的 干 预 状 态 Z,.天 然 是 接 受 的 干 预 状 态 认 的 有 效 工 具 变 量 。 (7. 39)估计出
的意向因果效应实际上是工具变量法中简化式估计系数,
可以利用第一阶段估
计 量 去 修 正 ,只 不 过 在 单 边 非 依 从 的 情 况 下 ,
所有接受干预的个人都是被随机
化 分 配 为 干 预 组 的 个 体 ,不 存 在 被 随 机 化 分 配 到 控 制 组 而 实 际 接 受 干 预 的 个
体 ,因 而 ,
P r [ D ; = 1 丨Z,. = 0] = E[D,- | Z,. = 0] = 0
第一阶段简化为:
, r rrn) — I 2, = 1] — E{_D;J 7., — 0 ] — £ [ D ,.丨 Z,' — 1]

从而,
工具变量估计量为:

r,TTD E[D,- ! Z, = 1]
如果出现双边非依从的现象,
被分配到控制组中的个体有人接受了积极的
干预,
但 接 受 干 预 的 可 能 性 应 该 更 低 。那 么 ,
仍然可以用随机化分配的干预状
态 乙 作 为 实 际 接 受 的 干 预 状 态 D,.的 工 具 变 量 ,
那 么 ,因 果 效 应 估 计 就 是 上 文
导 出 的 结 果 (7.23) 。

第三节工具变量法的软件实现

1. 数据说明

本 节 使 用 的 数 据 来 自 Angrist and Krueger (1991)使 用 的 1 9 8 0 年美国普查


数 据 5 % 的 一 个 随 机 子 样 本 ,我 们 仅 使 用 其 出 生 在 1930— 1 9 3 9 年 的 样 本 ,共
32 95 0 9 个 样 本 点 ,
相 应 数 据 集 为 angrist. dta。主 要 变 量 包 括 个 人 收 人 (L W K -
第七章工具变量法 141

13\\^^)、
个 人 年 龄 (八0 £ ) 、教 育 年 限 (£ 〇1 1 0 、出 生 年 份 (丫0 6 ) 、出 生 季 度
( Q 0 B K 8 个地区虚拟变量、
9 个出生年份虚拟变量等信息。

2. Stata软 件 中 的 工 具 变 量 估 计 命 令

Stata软 件 中 的 工 具 变 量 估 计 命 令 为 ivregress,它 的 基 本 语 法 和 选 项 如 下 :

ivregress estimator depvar [varlistl] (varlist2 = varlist^iv) [if] [in] [weight]


options^
estimator . Description

2sls two-stage least squares (2SLS)


liml limited-information maximum likelihood (lilML)
gnun generalized method of moments (GMM)

options Description

SE/Robust
vce C vcetype) vcetype may be unadjusted, robust, cluster clustvar,
bootstrap ,
jackknife, or hac kernel
Reporting
level( # ) set confidence level ;default is level(95)
first report first _ stage estimates

ivregress可 以 采 用 三 种 类 型 的 估 计 量 ,
除了前面介绍的两阶段最小二乘估
计 量 2sls,还 包 括 有 限 信 息 极 大 似 然 估 计 limi和 广 义 矩 估 计 g m m ,
这里重点考
察 两 阶 段 最 小 二 乘 估 计 量 。depvar是 被 解 释 变 量 ,varlistl是 观 测 协 变 量 X ,,
为可选项,
(varlist2 = varlist_iv)为 必 选 项 ,
等号左边为内生变量列表,
等号右
边 为 工 具 变 量 列 表 ,选 项 vceCvcetype)可 以 选 择 稳 健 标 准 误 差 robust、
聚类到分
组 变 量 clustvar的 标 准 误 差 、自 抽 样 标 准 误 差 等 。选 项 first可 以 输 出 第 一 阶 段
估 计 结 果 。工 具 变 量 回 归 之 后 ,
还 有 三 个 相 关 的 命 令 :estat endogenous, estat
firststageNestat overid。ivregress命 令 之 后 可 以 使 用 这 三 个 命 令 进 行 相 关 的 检
验,
estat endogenous可 以 检 验 内 生 性 是 否 存 在 ,
estat firststage报 告 第 一 阶 段
回归的相关统计量,
包括 尺 2、
F 检验等,
estat overid可 以 进 行 过 度 识 别 检 验 ,

果工具变量数多于内生变量数时,
在同质性框架下,
可以使用过度识别检验检
验外生性假设是否成立。
下面,
估 计 一 个 简 单 的 模 型 ,只 有 教 育 一 个 内 生 变 量 ,
没有任何控制变量,
142 基本有用的计量经济学

利用第一季度作为工具变量,
两阶段最小二乘估计结果如下:

. ivregress 2sls LWKLYWGE (EDUC = QTR1) ,vce(robust) first


First-stage regressions
Kiunber of obs = 329509
F( 1 ,329507) = 66.78
Prob > F = 0.0000
R-squared = 0.0002
Adj R-squared = 0.0002
Soot MSE = 3.2809

Robust
EDUC Coef. t P > 11| [ 9 5 % Conf. Interval]
Std. Err.
QTR1 - ,1088179 .0133159 - 8,17 0/000 - .1349166 -.0827192
_cons 12.79688 .0065712 1947.43 0.000 12,784 12,80976

Instrumental variables (2SLS) regression Number of obs = 329509


Wald chi2(l) = 18.01
Prob > chi2 = 0.0000
R-squared = 0.0946
Root MSE = .64591

Robust
LWKLYWGE Coef. z P>|e| [ 9 5 % Conf. Interval]
Std. Err.
EDUC .101995 ' .0240315 4.24 0.000 .0548941 _1490959
一cons 4,597477 .306889 14.98 0.000 3.995985 5.198968

Instrumented :EDUC
Instruments :QTR1

因为加上了 first选 项 ,
所 以 ivregress首 先 报 告 了 第 一 阶 段 回 归 结 果 ,
反映
了教育与出生季度之间的相关性,
工 具 变 量 系 数 为 一 O . l l d 值 为 8. 1 7 ,
说明出
生 于 第 一 季 度 的 个 体 教 育 年 限 显 著 低 于 出 生 于 其 他 季 度 的 个 体 ,平 均 低 0. 11
年 。接 着 报 告 第 二 阶 段 的 估 计 结 果 ,
结 果 显 示 教 育 收 益 率 为 10. 2 % , 并 且 非 常
显 著 。如 果 不 想 报 告 第 一 阶 段 的 结 果 ,
可 以 不 加 first选 项 。如 果 使 用 多 个 工 具
变量,
工 具 变 量 估 计 结 果 之 后 可 以 利 用 estat overid进 行 过 度 识 别 检 验 以 判 断
工 具 是 否 外 生 。下 面 用 三 个 关 于 出 生 季 度 的 虚 拟 变 量 Q T R 1 、
Q T R 2 、Q T R 3 作
为教育的工具,
重新估计并进行过度识别检验,
结果如下,
第七章工具变量法 143

. ivregress 2sls LWKLYWGE (EDUC= QTR1 QTR2 QTR3) ,vce(robust)


Instrumental variables (2SLS) regression Number of obs = 329509
Wald chi2 ⑴ = 27.60
Prob > chi2 = 0.0000
R-squared = 0.0937
Root MSE •64622

Robust
LWKLYWGE Coef. z P > |z| [ 9 5 % Conf. Interval]
Std. Err.
EDUC .1025976 .0195281 5.25 0.000 .0643233 .1408719
_cons 4.589781 .249385 18.40 0,000 4.100996 5.078567

Instrumented ;EDUC
Instruments :QTR1 QTR2 QTR3
. estat overid
Test of overidentifying restrictions ;
Score chi2(2) = 2.88386 (p = 0.2365)

结果显示,
教育收益率仍然为10 . 3 % ,
并 且 很 显 著 。过 度 识 别 检 验 统 计 量
服从自由度为2 的卡方分布,
可 以 利 用 卡 方 分 布 的 临 界 值 ,软 件 已 经 计 算 出 了
相 应 的 p 值 4 值 为 0. 2365 ,
远 远 髙 于 5 % 的 水 平 ,因 而 ,
没有办法拒绝原假设,
从而外生性条件成:
E[Z;
7.-]^0可 能 成 立 。

3 . 估计教育收益率

在这一节,
我 们 利 用 3 0 年 代 出 生 的 个 体 数 据 ,以 出 生 季 度 作 为 工 具 变 量 ,
重 现 Angrist and Krueger (1991)的 图 I 、图 V 和 表 IV。 图 I 和 图 V 描 述 的 是
平均教育年限、
平均对数周工资与出生季度之间的关系,
先 利 用 collapse命 令

将数据平均到季度:

use angrist, clear / / 将数据调人系统


gen year = YOB + (QOB- 1)/4 //产生年份季度顺序变量
collapse (mean) EDUC LWKLYWGE, by(year) //将教育年限和收人平均到季度
twoway connected EDUC year, savingCeduc, replace) // 画出教育与季度的关系图

twoway connected LWKLYWGE year, savingClwage, replace) //画出收人与季度关系图

.上 述 语 句 可 以 重 现 Angrist and Krueger (1991)文 中 的 图 I 和 图 V ,


稍加
修 改 即 可 以 得 到 图 7. 2 和 图 7, 3 。下 面 ,
我 们 复 制 Angrist and Krueger (1991)
的 表 仅 。表汉估计了 8 个 模 型 ,
4 个 OLS 回归,
4 个 IV回 归 ,
模型差别主要在于
控制的协变量不同,
1 、2 列 仅 控 制 了 出 生 年 份 ,
3、4 列进一步控制了年龄及其平
144 基本有用的计量经济学

方,
5 、6 列 控 制 了 出 生 年 份 、
所 在 地 区 、种 族 、城 市 及 婚 姻 状 态 ,7 、8 列 在 5 、6 列
基 础 上 进 一 步 控 制 年 龄 及 其 平 方 。使 用 的 工 具 变 量 为 所 有 出 生 季 度 及 出 生 年
份的交叉项,
估计程序如下:

global YR "YR20 YR21 YR22 YR23 YR24 YR25 YR26 YR27 YR2&" // 定义出生年份宏
global RG "NEWENG MIDATL EN0CEN1 WHOCENT SOATL ESOCENT WSOCENT MT" // 定义地区宏
global IV "QTR120 - QTR129 QTR220 - QTR229 QTR3Z0 - QTR329 YR20 - YR28" // 定义工具
变量宏
* *•估计 1 、
3、 7 列 * * *
5、
reg LWKLYWGE EDUC $ YR-
est sto olsl
reg LWKLYWGE EDUC $ YR AGEQ AGEQSQ
est sto ols2
reg LWKLYWGE EDUC RACE MARRIED $ YR $ RG
est sto ols3
reg LWKLYWGE EDUC RACE MARRIED AGEQ AGEQSQ $ YR $ RG
est sto ols4

* * 估计 2 、
4、 8 列* * *
6、
ivregress 2sls LWKLYWGE $ YR (EDUC = $ IV)
est sto ivl
ivregress 2sls LWKLYWGE $ YR AGEQ AGEQSQ (EDUC = $ IV)
est sto iv2
ivregress 2sls LWKLYWGE RACE MARRIED SMSA $ YR $ RG (EDUC = $ IV)
est sto iv3
ivregress 2sls LWKLYWGE RACE MARRIED $ YR $ RG AGEQ AGEQSQ (EDUC = $ IV)
est sto iv4

x- * 估计结果表格输出到文件〜 angrist, rtf * *


esttab olsl ivl ols2 iv2 ols3 iv3 ols4 iv4 using angrist. rtf, ///
drop( $ YR $ RG _cons) star( * .10 * * . 05 * * * . 01) b ( % 8 . 4f) s e ( % 8 . 4 f )
ar2 /// .
mtitlerOLS" "2SLS" "OLS" "2SLS" "OLS" "2SLS" "OLS" "2SLST) nogap replace

得 到 的 估 计 结 果 见 表 7. 3:
第七章工具变量法 145

表 7. 3 美国教育收益率估计

OLS 2SLS OIJ 2SL S 01^ 2SLS OLS 2SL S
EDUC 0. 0711**“ 0. 0891 … 0. 0711 … 0.0760*** 0. 0632 *** 0. 0S06 讲 0‘
0632^* 0.0600^
(0.0003) (0,0161) (0.0003) (0. 0290) (0.0003) (0.0164) <0.0003) (0.0290)
AGEQ - 0 ,0 7 7 2 —O’0801 -0.0760 -0. 0741
(0.0621) <0.0645) (0.0604) (0.062G)
AGEQSQ 0. 0003 0.0008 0‘OOOS 0.0007
<0.0007) (0.0007) (0‘0007) (0.0007)
RACE - 0 . 2575 - 0 . 2302 … U575 … - 0. 2G26***
(0.0040 CO.0261J <0.0040) (0, CM5S)
MARRIED 0r2479^ 0.2440 … 0.2479 … 0.2 4 8 6 …
(0.0032 (0.0049) (0_0032) (0.0073)
SMSA 一。
-1763, -0. 1581 … - 0. 1763 … -0. 1797 ^**
(0.0029) (0.0174) (0.0029) (0. 0305)

Region NO NO NO NO Yes
329509 329509 329509 329509 329509 329509 329509 329509
0. 1177 0‘
1101 0.1177 0,1172 0. 1650 0.1584 0.1650 0.1647
Standard errors in parentheses
# p < . 10, /»<. 05t … p <

第四节 结

当 条 件 独 立 性 假 设 不 成 立 时 ,回 归 和 匹 配 方 法 都 没 有 办 法 识 别 因 果 效 应 参
数 。如 果 能 够 找 到 与 原 因 变 量 密 切 相 关 且 不 通 过 原 因 变 量 之 外 的 其 他 途 径 影
响 结 果 变 量 的 工 具 变 量 时 ,仍 然 可 以 识 别 出 因 果 效 应 参 数 。在 同 质 性 因 果 效 应
假设下,
满足相关性和外生性假设的工具变量可以识别出总体平均因果效应。
但是,
在异质性假设下,
工具变量只能识别出受工具变量影响的部分群体的平
均因果效应。由于不同的工具变量,
对其有反应的依从者群体往往也不相同,
从 而 不 同 的 工 具 变 量 将 识 别 不 同 的 因 果 效 应 参 数 。 因 而 ,在 利 用 工 具 变 量 估 计
因果效应参数时,
如果没有足够的证据证明同质性假设成立,
所得到的工具变
量估计量在解释的时候一定要小心,
不能简单地将工具变量估计量解释为总体
的因果效应或干预组平均因果效应,
必须考察依从者在总体或干预组中的代表
性,
不能简单地将依从者的因果效应推广到干预组或整个总体。
- 工具变量的选择非常重要,
而工具变量的寻找也有相当的难度,
往 往 是 “自
然 的 礼 物 ”(Rosenzweig and Wolpin, 2000),必 须 对 所 研 究 问 题 和 相 关 制 度 背
景有深入的理解,
才 能 找 到 合 适 的 “自 然 实 验 ”构 造 充 分 的 工 具 变 量 。 即使是来
自于自然实验的工具, 也 不 一 定 满 足 外 生 性 (独 立 性 和 排 除 性 )条 件 ,比如上文
146 基本有用的计量经济学

提 到 的 Angrist ( 1 9 9 0 ) 所 使 用 的 征 兵 随 机 数 工 具 ,
本身是随机机制产生的,

是如果雇主会根据随机数决定对个体的人力资本投资,
使随机数与个人收人发
生相关性,
从 而 不 满 足 外 生 性 条 件 了 (H e c k m a n ,1997) 。
工具变量寻找如此困难,
有 没 有 其 他 办 法 克 服 内 生 性 问 题 。如 果 有 面 板 数
据或多期截面数据,
我们会有更多的办法,
下一章将介绍多期数据的因果效应
识别策略。

推荐阅读
美 国 M I T 教 授 Joshua Angrist在 异 质 性 工 具 变 量 法 方 面 做 出 了 很 多 贡
献,
在 其 教 科 书 《几 乎 无 害 的 计 量 经 济 学 》中花 费 近 1 / 3 的 篇 幅 介 绍 工 具 变 量
法,
本章很大程度上参考了 Angrist and Pischke ( 2 0 0 9 ) 第 4 章 的 内 容 ,
建议读
者 阅 读 。M o r g a n and Winship (2015)第 9 章 对 工 具 变 量 也 有 较 好 的 介 绍 。I m -
bens and Rubin (2015)第 21— 2 3 章 从 实 验 的 角 度 介 绍 了 工 具 变 量 法 。
第八章面板数据方法

通过前面章节的学习,
我 们 知 道 ,如 果 条 件 独 立 性 假 设 或 非 混 杂 性 假 设 成
立,
可 以 利 用 回 归 分 析 或 匹 配 方 法 得 到 因 果 效 应 参 数 的 估 计 。如 果 条 件 独 立 性
假 设 不 成 立 ,但 是 能 够 找 到 与 原 因 变 量 相 关 但 不 通 过 其 他 路 径 (除 通 过 原 因 变
量 这 一 途 径)影 响 结 果 变 量 的 工 具 变 量 ,
那么,
利用工具变量可以得到依从者平
均 因 果 效 应 的 估 计 。然 而 ,工 具 变 量 往 往 很 难 寻 找 ,它 往 往 是 “自 然 的 礼 物 ”。
如果找不到合适的工具变量,
是 否 有 其 他 途 径 识 别 因 果 效 应 参 数 ?如 果 有 同 一
个 体 多 期 的 数 据 或 不 同 个 体 不 同 时 期 的 数 据 ,即 面 板 数 据 或 者 重 复 截 面 数 据 ,
我们有新的工具可以解决未观测混杂因素的影响,
从 而 识 别 因 果 效 应 参 数 。本
章 主 要 介 绍 面 板 数 据 的 固 定 效 应 方 法 、双 重 差 分 法 、
合成控制法及萧政等人的
回归合成方法。

第一节固定效应方法

面板数据是截面个体有多期的数据,
与截面数据每个个体只有一个样本点
不同,
面板数据中,
每 个 个 体 都 可 以 看 到 其 多 期 的 信 息 。为 便 于 描 述 ,
仍然关注
一个二元原因变量2 ^ 对结果变量I 的因果影响,
这 里 变 量 有 两 个 下 标 “ 表示
截 面 ,f 表 示 时 间 。用 又 ^ 表 示 可 观 测 的 混 杂 因 素 ,
17, 表 示 不 可 观 测 的 混 杂 因

素,
但 是 未 观 测 混 杂 不 随 时 间 变 化 。如 果 所 有 变 量 都 是 可 以 观 测 的 ,
那么,
可以
通过控制所有的混杂因素而获得因果效应参数的估计,
换言之,
如果所有混杂
因素均可观测,
那 么 条 件 独 立 性 假 设 成 立 ,即
( y lif, Y 0 i) J L D , 丨X p U i ’ t ( 8 .1 )
其中K h Y 。
,.,是 对 应 于 原 因 变 量 2 ^ 取 值 的 两 个 潜 在 结 果 ,与以前章节的符号一
致,
只 是 现 在 有 多 期 数 据 ,因 而 多 了 一 个 下 标 条 件 独 立 性 假 设 成 立 意 味 着 条
件均值独立性成立,

E [ Y oi! 1 尤 ,
1/,.山 认 ] = E l Y 0it | (8.2)
对 于 潜 在 结 果 也 有 一 个 类 似 的 公 式 。如 果 仅 关 心 干 预 组 平 均 因 果 效 应 ,

么,
条 件 (8. 2 ) 就 可 以 保 证 我 们 识 别 因 果 效 应 参 数 r A T T 。条 件 (8. 2 ) 满 足 ,
可以根
据 观 测 变 量 进 行 匹 配 ,
从而得到因果效应参数的估计,
148 基本有用的计量经济学

t*ATT ( X u ,
Uj,
t~) — E\_Ylit _ You I ,
Ui,
t,Dn = 1]
= E [ Y iU | A ,
U,.山 认 = 1 ] - E l Y 0U | X,.,,
17,.山 认 = 1 ]
= E [ Y U | X it,U{,t,D, = 1] - ELY, | X,v ,
U, ,t,Dir - 0]
= ELY, | X ^ U ^ t ^ D , = l~]-E[Y;
t | X it,U;,t,Dtl = 0] (8.3)
第 三 行 利 用 了 条 件 (8. 2 ) ,因 而 ,如 果 所 有 混 杂 因 素 均 可 观 测 ,可 以 根 据

[/,.、
〖进 行 匹 配 ,
并 利 用 X u、
U ,.、
〖的 分 布 进 行 加 权 就 可 以 得 到 总 体 的 干 预 组
平 均 因 果 效 应 A T T 。如 果 条 件 期 望 为 线 性 函 数 ,
那么,
可以直接利用回归方法
到 得 到 因 果 效 应 参 数 的 估 计 。假 设 ,
,.,| Xit,
£[y。 U,. + A, + X s + U W
进 一 步 假 设 ,因 果 效 应 是 同 质 的 ,g卩
E l Y lit | X , ,
LT; “] = E l Y 0il I X , ,
L/,. j ] + r
从而观测结果的条件期望函数可以写为:
ELY, | x u ,u;,1,0,3= E[D,yi, + ( 1 - D , ) y 0,> I 兄 ,
= E [ y 0lf + rD, | XifU,-,t,D^
+rD„+X^ + U;
y (8.4)
相应的回归方程可以写为:
y. = ^ H - A ; + rD,v + X ^ + L7;
y + £l> (8.5)

y„ - ^ + A f+ r D , + X - / ? + £i,, …,
i = 1’ N,t= 1,
…,:
T (8.6)
其中; 通 常 称 为 固 定 效 应 ,(8. 6)通 常 称 为 固 定 效 应 模 型 。如 果 K
也可以观测到,
在 假 设 (8. 2)下 ,(
8. 5 ) 可 以 直 接 利 用 回 归 方 法 得 到 因 果 效 应 参
数 r 的 一 致 估 计 或 至 少 是 最 优 线 性 近 似 。上 式 的 关 键 是 U ; 不 可 观 测 ,
仅控制
I 不能消除所有混杂,
L7,.将 留 在 误 差 项 中 ,
从而使复合的误差项与原因变量
A,相关,
C I A 条 件 不 再 成 立 。未 观 测 因 素 U,-或 固 定 效 应 + 不 随 时 间 变 化 ,

们 可 以 利 用 面 板 数 据 多 期 数 据 的 特 点 ,消 除 固 定 效 应 的 影 响 。通 常 具 有 两 种 处
理方法,
差 分 法 或 去 均 值 方 法 (d e m e a n ) ,
后一种方法通常称为固定效应方法。
这 里 只 介 绍 固 定 效 应 方 法 ,(
8. 6)式 针 对 同 一 个 体 内 部 按 时 间 进 行 平 均 ,
得组间
回归方程:

(8.7)
其中,
第八章面板数据方法 149

•X代 表 上 面 的 Y 、
A、L>、
X 各 变 量 。(
8. 6) — (8. 7)得 组 内 回 归 方 程 :
©

Y, - = A , - A , + r(D, 一 D,. ) + (X, - X, ) > + slV — e'. (8.8)


组 内 回 归 方 程 (8. 8)已 经 没 有 固 定 效 应 片 ,
去均值时已经去掉了,
方 程 (8. 8 )不
再有内生性问题,
从 而 可 以 直 接 利 用 回 归 方 法 得 到 因 果 效 应 参 数 r 的一致估
计,
r 的 估 计 量 通 常 称 为 固 定 效 应 估 计 量 Uixed effect estimator)或 组 内 回 归 估
计量(
within regression estimator)。对 于 模 型 (
8. 6)的 分 析 还 有 另 一 种 假 设 ,

为 随 机 效 应 模 型 (random effect mode l ) ,它 假 设 固 定 效 应 是 随 机 的 ,与原因
变 量 认 不 相 关 。在 随 机 效 应 模 型 假 设 下 ,
对因果效应参数的估计没有什么影
响,
C I A 条 件 仍 然 是 成 立 的 ,可 以 直 接 利 用 O L S 得 到 因 果 效 应 参 数 的 一 致 估
计,
唯一的影响是复合的误项会序列相关,
会影响参数估计的标准误差,
可以利用广义差分法修正序列相关,
或 者 直 接 采 用 N e w e y and West (1987)序
列相关及异方差一致性标准误差,
® 相 关 介 绍 参 见 Hsiao (2014) 。
固定效应方法也适用于一些其他的情形,
不一定是多期数据可以表示不
同 的 群 组 ,比 如 家 庭 、
地区、
城市等,
而 i表示家庭内部的个体,
或地区、
城市内部
的企业、
个 人 等 。在 教 育 收 益 率 研 究 中 ,
为了消除遗漏能力变量偏差,
有些学者
利用双胞胎的数据估计教育收益率,
这 时 ,/ 表 示 不 同 的 家 庭 ,
/ 代表来自同一家
庭的两个双胞胎子女,
如 果 认 同 双 胞 胎 在 基 因 方 面 相 同 (尤 其 是 同 卵 双 胞 胎 ),
家庭背景相同,
从而能力也基本相同的假设,
那么,
我们就可以利用差分法或去
均值的方法消除能力偏差的影响。

第二节双重差分法

在 讨 论 双 重 差 分 法 (Difference in Difference, D I D ) 之 前 ,我 们 先 讨 论 一 种
简单的情形,
在 某 一 时 刻 ^ 某 一 个 体 受 到 一 项 政 策 干 预 ,我 们 将 探 讨 该 项 政 策
干预对该个体结果的影响。比如,
2008年世界经济危机,
为了应对经济危机对
中 国 经 济 的 影 响 ,中 央 政 府 在 2 0 0 8 年底 出 台 了 4 万 亿 元 的 经 济 刺 激 计 划 ,
那么
这项经济刺激计划对中国随后的经济增长有什么样的影响呢?
现在关注最简单的情形,
假 设 只 有 两 期 4 一1 期 表 示 政 策 实 施 之 前 ^期 表

① 在 Stata软 件 中 可 以 使 用 xtreg命 令 加 fe选 项 进 行 这 一 模 型 的 估 计 ,相 应 命 令 用 法 可 以 利 用


help xtreg进 行 查 询 。
② Angrist and Pischke (2009
设,
而 利 用 广 义 差 分 法 获 得 的 收 益 是 否 超 过 引 人 新 的 假 设 所 带 来 的 可 能 损 失 不 得 而 知 ,因 而 ,
更加安全的
做法是直接使用稳健的标准误差,
将序列相关直接考虑进去^
150 基本有用的计量经济学

示政策实施之后,
我 们 关 心 政 策 实 施 之 后 对 结 果 的 影 响 。仍 然 沿 用 第 二 章 的 潜
在结果符号’
用 ^ ^ ^ ^ 上 ^ ^ ^ ^ 分 别 表 示 t 期 和 Z — 1 期 的 潜 在 结 果 ,由于这
里 只 有 一 个 个 体 ,因 而 ,
省略了个体的下标,
并 引 人 了 时 间 的 下 标 。关 心 的 政 策
影 响 是 ^ 期 的 个 体 因 果 效 应 ,即 Y u —Y 。
,,由 于 该 个 体 在 ^ 期 受 到 了 政 策 干 预 ,因
而 匕 ,
即 其 i 期 的 观 测 结 果 Y , 就 是 其 潜 在 结 果 Y 1;,而 I V 是 无 法 观 测 到 的
反事实结果。因而 ,
政 策 评 价 的 关 键 是 如 何 估 计 反 事 实 结 果 A ,。
一 种 简 单 的 办 法 就 是 假 设 如 果 没 有 政 策 干 预 d 期 的 结 果 将 与 £一 1 期结果
相 同 ,即 ^ 二^ - ^ ^ … 因 为 广 丄 期 没 有 政 策 干 预 ’因 而 ^一 }期 的 观 测 结 果
就 是 在 上 述 假 设 下 ,
反 事 实 结 果 从 而 可 以 得 到 政 策 干 预 的 因
果 效 应 。当 然 ,
上 述 假 设 太 强 了 ,即 使 没 有 政 策 干 预 ,
该个体的观测结果也会随
时间变化,
如 果 有 多 期 的 数 据 ,比 如 还 有 t - 2 期 的 数 据 ,
也 许 可 以 引 人 一 个更弱
一些的假设,
如果没有政策干预,
?期 结 果 的 增 长 率 将 与 £ _ 1 期 的 增 长 率 相 同 ,
从而我们可以用兄^ 作为反事实结果r 。
,的 估 计 ,
可以估计出政
策 干 预 的 因 果 效 应 。这 一 假 设 比 上 一 个 适 应 性 假 设 似 乎 好 一 点 ,
尤其是当政策
干 预 前 时 期 比 较 长 时 ,可 以 利 用 时 间 序 列 得 到 增 长 趋 势 比 较 好 的 预 测 。但 是 ,
如 果 结 果 变 量 发 生 了 结 构 性 变 化 ,比 如 2 0 0 8 年 经 济 危 机 可 能 使 中 国 经 济 发 生
了结构性的变化,
利 用 2008年 前 的 经 济 增 长 信 息 去 预 测 2008年以后的经济增
长 就 可 能 出 现 较 大 的 偏 差 。因 而 ,
这一假设可能没办法克服结构性变化造成的
影 响 。如 果 还 有 其 他 个 体 ,
这些个体没有受到政策干预的影响,
在时间序列上,
它 们 可 能 受 到 相 同 因 素 的 影 响 ,结 构 性 变 化 可 能 也 会 相 似 。那 么 ,
利用这些没
有受到政策影响的个体作为控制组,
可能会得到反事实结果更好的估计,

就是双重差分方法的基本思路。

1. 双 重差分法

双重差分方法适用于事前所有个体都没有受到政策干预,
而事后只有一组
个体受到政策干预,
受 到 政 策 干 预 的 组 称 为 干 预 组 ,没 有 受 到 政 策 干 预 的 为 控
制 组 。政 策 实 施 的 时 间 点 和 是 否 受 到 政 策 干 预 这 两 个 变 量 将 样 本 分 成 了 四 组
群体,
见 表 8. 1:

表 8 . 1 双重差分方法的适用场景

T=0 T=1

D =1 干 预 组 (干 预 未 实 施 ) 干 预 组 (干 预 实 施 )
D= 0 控制组 控制组
第八章面板数据方法 151

在政策评估中,
关 心 的 因 果 效 应 参 数 往 往 是 A T T ,即 政 策 干 预 对 受 到 影 响
的个体的影响,
rATT = ^[^1, - Yo, I D { = 1] = ElY, | D,. - 1 ] - E [ Y 0, | D ; = 1],
(8.9)
其 中 分 别 表 示 个 体 纟 在 〖期 的 两 个 潜 在 结 果 。 因 为 政 策 干 预 仅 在 一 个
时间点发生变化,
变量没有引人时间下标,
事后受到干预的个体,
D, = l ,

后没有受到干预的个体,
A = 0 ,
这样可以简化符号,
从 而 D ,.表 示 是 干 预 组 还 是
控 制 组 。(
8. 9)右 边 第 1 项 是 可 以 观 测 的 ,
为干预组事后的平均结果,
第 2项E
[ I V ID,. = 1]是 反 事 实 结 果 ,
因而,
政策评价的关键是如何将该反事实结果科学
地估计出来。
假 设 条 件 独 立 性 (8. 1)或 条 件 均 值 独 立 性 (8. 2)成 立 ,
G 是不随时间变化的
混杂因素,
如 果 均 可 观 测 ,
那么直接利用第i期的数据,
根据观测变量
X,、
U ; 进 行 匹 配 ,即 可 得 到 政 策 影 响 A T T ,
参 见 (8. 3 ),并 且 可 以 利 用 干 预 前 两
组 个 体 的 结 果 检 验 平 衡 性 是 否 满 足 。 问 题 是 这 里 L7,是 不 可 观 测 的 ,
仅仅根据
可观测变量;
^ 进 行 匹 配 不 能 保 证 两 组 个 体 的 相 似 性 ,因 而 ,匹 配 方 法 在 这 种 情
况 下 不 能 使 用 。与 固 定 效 应 方 法 类 似 ,双 重 差 分 方 法 通 过 两 期 数 据 的 比 较 ,可
以 消 除 未 观 测 因 素 的 影 响 。下 面 讨 论 双 重 差 分 方 法 的 基 本 假 设 。

例 8. 1(共 同 趋 势 假 设 ) 干 顸 组 个 体 如 果 没 有 接 受 干 预 ,其 结 果 的 变 动 趋
势 将 与 控 制 组 的 变 动 趋 势 相 同 ,即
ELYo, 一 Yo,-, i X k , D ; = 1] = E l Y 0U — Yo,-! I X lt,Di = 0] (8. 10)
或写为:
E l A Y 0U I X, ,D,. = 1] = E l A Y 0il | X u ,D, = 0] (8. 11)

共 同 趋 势 假 设 (c o m m o n trend assumption)是 双 重 差 分 方 法 的 关 键 假 设 ,
它要求
如果没有受到政策影响的话,
干预组个体的变化模式与控制组个体的变化模式
是 一 样 的 。换 言 之 ,
未 观 测 因 素 对 两 组 个 体 的 影 响 是 相 同 的 。当 然 ,
这一要求
总体上不一定满足,
一个更弱的共同趋势假设是要求控制可观测变量后满
足 共 同 趋 势 假 设 。不 过 这 里 的 协 变 量 足 >必 须 是 在 政 策 实 施 之 前 取 值 或 不 受 政
策干预影响的变量,
受政策影响的观测变量将会造成样本选择偏差。
观 察 假 设 (8. 11) ,
这一假设与我们在匹配方法和回归方法中讨论的条件均
值 独 立 性 假 设 (5. 41)很 相 似 ,
不 过 (5. 4 1)是 针 对 潜 在 结 果 的 水 平 量 ,
而 (8. 11)
是 针 对 潜 在 结 果 的 增 加 量 。因 而 ,
D I D 方法也可以看作是一种匹配方法,
不过,
是对增量的匹配,
不是直接对水平量的匹配。由于水平量受到未观测混杂因素
152 基本有用的计量经济学

U,的影响,
水 平 量 匹 配 无 法 消 除 未 观 测 混 杂 因 素 的 影 响 ,但 是 ,
进行增量匹配
消除掉未观测混杂因素认的影 响 ,
时 ,由 于 计 算 增 加 量 时 利 用 两 期 结 果 的 差 分 ,
从而在共同趋势假设下,
获得反事实结果的估计。
共 同 趋 势 假 设 也 可 以 写 成 另 一 种 形 式 ,BP
E [ Y 0lt | X , ,
D, - l ] - £ [ Y o , I X,v ,D; = 0]
= £ [ y 0,-i I Xu ,D; = 1 ] - E [ Y 0,-1 I x t>,D,. = 0] (8. 12)
或写为:
(x) (8.13)
其中,
B,(x) = E l Y 0it | X, - x , D { = 1 ] - E [ Y 0, I X , = = 0]
即如果没有政策干预,
两 组 事 前 事 后 结 果 的 差 异 应 该 是 相 同 的 ,因 而 ,
共同趋势
假 设 有 时 也 称 为 不 变 偏 差 假 设 (constant bias assumption)。这 一 点 也 说 明 ,

预组与控制组不必相似,
与 匹 配 方 法 不 同 ,只 要 事 前 事 后 两 组 差 别 相 同 ,
DID方
法 即 可 识 别 因 果 效 应 参 数 。关 于 共 同 趋 势 或 不 变 偏 差 假 设 的 作 用 见 图 8.1:

图 中 变 量 卩 =°表 示 控 制 组 事 前 事 后 的 观 测 结 果 , 表 示 干
预组事前事后的观测结果, 所有观测结果均用实心圆点表示广是干预组广

期的反事实结果,
用 空 心 圆 点 表 示 。共 同 趋 势 假 设 是 说 如 果 没 有 政 策 干 预 ,

未观测因素K 的影响,
两 组 结 果 的 变 动 趋 势 相 同 ,即 图 中 虚 线 与 连 接 控 制 组 两
期观测结果的线段应该平行,
从而干预组结果的变化包括政策的影响和时间趋
势 两 部 分 ,因 而 ,
在干预组两期增量中扣除共同趋势后,
剩余的部分就是政策的
影响,
图中空心圆点所表示的结果就是干预组在f 期的反事实结果,
政策影 响 就
是 干 预 组 f 期实际观测结果与反事实结果之差,
即图中所示的因果效应。
上 文 提 到 共 同 趋 势 假 设 也 称 为 不 变 偏 差 假 设 ,即 两 组 个 体 在 干 预 实 施 之
前 ,即 使 控 制 可 观 测 协 变 量 后 ,
仍然不完全相似,
可以允许这种差异,
而这种
第八章面板数据方法 153

差异主要是由未观测混杂因素造成的,
所 以 在 图 8. 1 中 ,政 策 干 预 之 前 ,

组 观 测 结 果 ypri1和 在 控 制 观 测 协 变 量 X 。之 后 ,
仍然可以有差异,
意味 着
两 组 根 据 X,.,匹 配 后 ,
并不完全相似,
这 种 差 异 在 D I D 方 法 中 是 允 许 的 ,只要这
种差异不随时间变化或影响这一差异的因素G 是不随时间变化的,
那么,
如果
没有政策干预,
在 t 期 两 组 结 果 的 差 异 应 该 相 同 ,即 具 有 不 变 偏 差 。从而事后两
组观测结果之差里面包含政策影响和其他因素影响的不变偏差,
将不变偏
差从事后两组观测结果差异中扣除,
就 可 以 得 到 政 策 干 预 的 因 果 效 应 。无论 是
从 共 同 趋 势 假 设 还 是 从 不 变 偏 差 假 设 出 发 ,最 终 的 政 策 效 应 都 是 两 次 差 分 ,因
而,
这 种 因 果 效 应 识 别 方 法 称 为 双 重 差 分 方 法 。具 体 地 ,
T (X ,> )^ E [y i;
r^TD ( -yo,> I D i - 1,X,V]
— I D ;— 1 >Xi, ] — ■EllYoa | D ;— 1 >X u
— E[_Y^ I D { ~ 1»X/,J ~ ■{£"[Yoi(-i I D; = 1 ?Xu 3
+ E l Y 0it- Y 0,-1 | D ^ O ’
X"]}
= {E[y, | D ; = H I I H | D, = 1,X,V]}
y ‘
干预组结采增钍

— { E [ n I D r = 0 , X , ] - E [ y ^ | D, = 0,X,]} (8. 14)


~: Y(
控制组钴果增址

= {ElY, | D i = I D i = 0 ?X , ] }
垠后两组结粜差异

- {£ [y ,- i I D i - l , X , ] - E [ y , _ t | D t = 0 , X , ] } (8.15)
' ' V
事前两组结采差界

(8. 14)是 沿 用 共 同 趋 势 假 设 ,
从干预组两期结果变化中减去控制组的两期结果
的变化,
从 而 扣 除 了 共 同 趋 势 的 影 响 ,剩 下 的 就 是 政 策 效 应 。 (8. 15 )是 沿 用 不
变偏差假设,
从事后两组观测结果差异中扣除事前两组观测结果差异,
从而扣
除了不变偏差的影响,
剩 下 的 也 是 政 策 效 应 。总 的 政 策 影 响 可 以 表 示 为 :
r^TT = E l z ^ ( X u) \ D,. = 1]. (8. 16)
上 文 我 们 提 到 D I D 方 法 类 似 于 增 量 上 的 匹 配 方 法 ,如 果 可 以 根 据 协 变 量
进行结果增量的匹配,
那么,
类似于匹配方法,
为了保证根据观测协变量X u
分层后,
层 内 不 能 仅 有 干 预 组 个 体 ,而 没 有 控 制 组 个 体 ,
必须满足共同区间假设
( c o m m o n support) 0

假 设 8. 2 ( 共 同 区 间 假 设 )
Pr[D, - 1 ] > 0 且 Pr[D,T, - 1 | X (>] < 1 (8. 17)
154 基本有用的计量经济学

Pr[D, = l ] > 0 要 求 总 体 中 存 在 两 组 个 体 ,Pr[D,.T(= l IX , ] < 1 要 求 有 干 预 组


个 体 必 须 也 有 控 制 组 个 体 ,从 而 可 以 进 行 匹 配 。
由 于 D I D 方 法 类 似 于 匹 配 方 法 ,如 果 共 同 趋 势 假 设 成 立 ,
或者更强的条件
独立性假设A Y w J L D j X i 成立,
那么,
根 据 R o s e n b a u m and Rubin (1983)提出
的 倾 向 指 数 定 理 6. 1 ,
也 可 以 根 据 倾 向 指 数 声 (兄 )= P r [ Z ^ = l 丨尤] 进 行 匹 配 。
因而,
公 式 (8. 14)和 (8. 15)中 的 协 变 量 X 。可 以 直 接 更 换 为 从 而 得 到 倾
向 指 数 匹 配 D I D 估 计 量 ,记 为 P S M - D I D 估 计 量 (H e c k m a n et al., 1997,
1998)。P S M - D I D 估 计 测 度 可 以 表 示 为 :
t a t t ( f ) ~ 泛 \ Di = 19 ) = p~\ — E[Y \ Di = 1 ^p( Xu) = p~\)
n ^ Y •

干预组结果增盘

- {^[y, i d, ^ o,pixu) =p2-E\yu-l | 以 ^ o,pix;t) = >]}


' V ,
控制组结* 增ffi

(8. 18)
= { E [ y , | D, = l,p(X,>) = p J - E C Y , | D, = 0 ,p(X,) = p]}
■ ■ v
帘后两组结采差界

一 {ELY,-, | D, =- 1,/>(XU) - p] -y E[y-a-, | D, = 0,p(X,) = pi)


亊前两M 结果差异

(8.19)
为 了 保 证 D I D 方法有效,
还 有 两 个 暗 含 的 假 设 需 要 强 调 ,一 是 要 求 协 变 量
不受政策干预的影响,
二是政策干预不能有交互影响或溢出效应。

假 设 8. 3 ( 外 生 性 假 设 )
Xi" = Xoit — Xu
这 里 类 似 潜 在 结 果 的 符 号 ,
表示可以观测的协变量外生于政策干预,

会 受 到 政 策 干 预 的 影 响 。如 果 协 变 量 受 到 政 策 干 预 的 影 响 ,
那么控制它将可能
产 生 样 本 选 择 偏 差 ,因 而 ,
协 变 量 X 。应 该 是 发 生 在 政 策 干 预 实 施 之 前 或 者 不 随
政策干预而变化的变量。

假 设 8.4(SUVTA) 政 策 干 预 只 影 响 干 预 组 ,不 会 对 控 制 组 产 生 交 互 影
响,
或政策干预不会有溢出效应。

如果政策对干预组产生影响,
并且干预组的影响会对控制组个体产生外溢
效应,
从而使政策干预也会对控制组产生一定程度的影响,
那 D I D 识别策略将
无 法 识 别 出 真 正 的 政 策 效 应 ,因 为 控 制 组 的 趋 势 变 化 中 也 包 含 了 政 策 的 部 分 影
响,
从而不能用控制组的变化趋势作为构成干预组反事实趋势的基础。
第八章面板数据方法 155

第六章我们介绍过倾向指数匹配方法,
倾向指数除了可以用于匹配样本,
也 可 以 通 过 逆 概 加 权 的 方 式 得 到 因 果 效 应 参 数 的 估 计 ,D I D 方 法 类 似 于 增 量 上
的匹配方法,
因而,
D I D 估计量也可以用倾向指数进行逆概加权得到。

定 理 84 1 (Abadie 半 参 数 D I D 估 计 量 ) 如 果 假 设 8. 1 成 立 并 且 0 <
F r [ D = l | X ] < l ,则有
E [ Y U! - Yo, I X , D - 1] - El-w . (Y, - y , - , ) | X ] (8.20)
从而,

E L Y lit - y 0i I D = 1] = E 卜(L -y ,-i). 七x ] ]

— r\y 卜1 . D — Pr[D = 1 I X ] 1 ,o 91.


~ ^ [ P r [ D = 1] 1 - Pr[D ^ 1 | X] J (8.21)
其中,
_ D - P r [ D 二 1 1 X ] ________
W — P r [ D = 1 | X ] ( l - P r [ D = 1 [ X] )
定 理 8. 1 证 明 参 见 Abadie(2005)。上 述 定 理 说 明 在 假 设 8. 1 和 假 设 8. 2
下,
对两期观测结果之差进行简单的加权平均即可以得到政策干预的因果效
应,
权 重 依 赖 于 倾 向 指 数 p ( X ) = P r[ L ) = l | X ] 。公 式 (8. 21)提 供 了 一 种 简 单 的

得到倾向指数拟合值f ( b ,
两 阶 段 法 参 数 估 计 方 法 :首 先 估 计 倾 向 指 数 模 型 ,
然后,
将 代 人 (
8. 21)得 到 干 预 组 平 均 因 果 效 应 ,
在 这 里 我 们 不 再 详 述 。下
面 看 一 个 D I D 的例子。
Card and K r u eger(1994)是 一 篇 较 早 的 D I D 方 法 的 经 典 文 献 ,
作者研究最
低 工 资 调 整 对 就 业 的 影 响 。他 们 利 用 1 9 9 2 年 4 月 发 生 在 新 泽 西 州 最 低 工 资 调
整 的 自 然 实 验 ,以 最 有 可 能 受 最 低 工 资 影 响 的 快 餐 业 为 考 察 对 象 ,
利用与新泽
西 州 相 邻 的 宾 夕 法 尼 亚 州 作 为 控 制 组 ,同 期 宾 州 没 有 发 生 最 低 工 资 调 整 。作者
搜集了 1 9 9 2 年 2 月 和 1 9 9 2 年 1 1 月 两 州 相 关 快 餐 店 的 就 业 信 息 ,
并 利 用 DID
方法估计了新泽西州最低工资调整对快餐业就业的影响。
我们利用他们的平衡样本,
包 括 7 6 家 新 泽 西 州 快 餐 店 和 3 1 4 家宾州快餐
店的面板数据,
估 计 结 果 见 第 1 7 8 页 。Baseline表 示 政 策 实 施 之 前 ,即 1 9 9 2 年
2 月,
控制组宾州快餐店平均就业人数约为2 0 人 ,
干预组新泽西州快餐店平均
就业人数约为17人 ,
事前两者差距约为3 人 ,
并且非常显著,
这是事前的偏差,
可 能 是 由 于 一 些 未 观 测 因 素 造 成 两 者 的 不 同 。Follow-up表 示 政 策 实 施 之 后 ,
即 1992年 U 月 ,
控 制 组 和 干 预 组 平 均 就 业 人 数 均 为 17. 5 人 ,
两州就业人数没
有 显 著 差 异 。事 后 两 州 结 果 差 异 中 包 含 政 策 干 预 的 影 响 和 其 他 政 策 之 外 因 素
156 基本有用的计量经济学

的影响,
而事前两州就业差异均是其他政策之外因素的影响,
因而,
如果不变偏
差假设成立,
那么,
事后两组结果差异减去事前两组结果差异,
得到的将是政策
干 预 的 影 响 。结 果 显 示 ,
新泽西州最低工资提高,
造成快餐业店均雇佣人数反
而上升约3 人 ,
这一结果与经济理论的预测相反,
详 细 讨 论 参 见 Angrist and
Pischke (2009)。 当 然 ,
表中的估计结果也可以换个维度来看,
首先可以看控制
组 宾 州 店 均 就 业 人 数 事 前 事 后 的 变 化 ,由 事 前 的 2 0 人 降 低 到 事 后 的 17. 5 人 ,
降 低 2. 5 人 ,
而 干 预 组 新 泽 西 州 店 均 就 业 人 数 由 事 前 的 17. 1 人 增 加 到 事 后 的
17.5人 ,
增 加 0.4人 ,
如果新泽西州不调整最低工资,
其就业人数变化与宾州具
有相同的趋势,
那么,
新 泽 西 州 平 均 也 将 降 低 2. 5 人 ,现 在 却 增 加 了 0. 4 人 ,

肯定是政策调整造成的影响,
政 策 的 影 响 为 0 . 4 — (一 2 . 5 ) = 2 . 9 人 。 当 然 ,为
了证明上述结果能够表示为最低工资调整的影响,
必须要求上述设计满足Dro
方法的基本假设,
最 重 要 的 是 共 同 趋 势 假 设 成 立 。如 果 有 事 前 多 期 的 数 据 ,

可以利用事前数据检测在没有受到政策影响时,
两 州 是 否 有 共 同 趋 势 。另一方
面,
D I D 政策有效的前提是,
政策的影响不能具有交互效应,
如果新泽西州的最
低工资提高,
吸引了宾州就业的店员到新泽西州去就业,
从而出现溢出效应,

出 效 应 会 使 新 泽 西 州 就 业 增 加 ,而 宾 州 就 业 下 降 。 因 而 ,如 果 上 文 的 稳 定 性 假
设 8. 4 不 成 立 ,
那 么 D I D 估计量可能高估了政策的影响。

2 . 回归双重差分法

在满足上文4 个基本假设下,
可以利用(
8. 14)(8. 15)或 (8. 1 8 X 8 . 19)直接
计算事前事后干预组和控制组的结果,
从 而 计 算 出 D I D 估 计 量 。在 应 用 中 ,

果愿意假设条件期望函数为线性函数或者利用线性函数去近似我们关心的条
件期望函数,
那么,
可 以 利 用 回 归 方 法 估 计 D I D 估 计 量 。如果使用面板数据或
重复截面数据,
没有协变量,
可以利用下面回归方程得到D I D 估计量:
a+ + X T)+e„ (8.22)
其 中 ,_E[e,>|D,.,了] = 0 ,
从而,
E[Y„ | D,-,T] = a + j 2 D , + ^ r + r(D,- X T)
则 丨 £>,. = 0 , T = 0] = a
E[y, I D i- 0 , T = 1] = a + 占
E [Y ,v | Di ^ 1 ,T = 0 ] = q;
+ 召
E [ Y * 丨 D , —1 , T = 1 ] = a + j3-\-S + r
即控制组事前平均结果为a ,
控制组事后平均结果为控制组事前事后平均
结果变化为A 干预组事前的平均结果为a + P ,
干预组事后的 平 均 结 果 为 a+y9+
第八章面板数据方法 157

占+ r ,
干 预 组 事 前 事 后 平 均 结 果 的 变 化 为 5 + r ,而 干 预 组 事 前 事 后 平 均 结 果 的
变化中包括政策影响和共同趋势,
将共同趋势的影响扣除,
最终的政策影响为
r ,即
r = { E [ Y , | D, = 1, T = 1 ] - E [ Y , | D ; - 1 , T = 0]}
- {ELYU | D,- - 0, T = 1 ] - £ & | D ( = 0 , T = 0]}
如 果 共 同 趋 势 必 须 在 控 制 协 变 量 X , 后 才 成 立 ,并 且 这 些 协 变 量 不 会 受 到
政策干预的影响,
那么,
相应的回归双重差分模型可以写为:
®
r, = a + jSD;+ + r(D,- X T) + + e, (8.23)
下 面 我 们 看 一 项 有 趣 的 研 究 ,Abadie and Dermisi (2008)利 用 回 归 D I D 方
法 考 察 了 恐 怖 袭 击 威 胁 对 C B D 经 济 的 影 响 。2 0 0 1 年 9 月 1 1 日,
美国纽约世贸
大 楼 受 到 恐 怖 分 子 袭 击 轰 然 倒 塌 ,这 一 事 件 不 但 直 接 影 响 了 纽 约 市 的 城 市 经
济,
也 对 其 他 城 市 经 济 产 生 影 响 。Abadie and Dermisi (2008)利 用 美 国 中 部 城
市 芝 加 哥 1996年 第 2 季 度 到 20 0 6 年 第 1 季度的数据,
考 察 了 “9 • 11”事 件对
芝 加 哥 市 办 公 写 字 楼 租 赁 市 场 的 影 响 。 以“9 • 11”事 件 作 为 一 项 冲 击 或 干 预 ,
以芝加哥市最高的三座建筑作为锚点,
离三座标志性建筑越近遭受恐怖威胁的
可 能 性 越 大 ,半 径 0 . 3 英 里 (大 约 5 0 0 米 )范 围 内 的 办 公 写 字 楼 定 义 为 干 预 组 ,
作者称之为阴影区域,
®0. 3 英 里 之 外 的 作 为 控 制 组 。写 字 楼 分 布 见 图 8, 2 。作
者 主 要 考 察 “9 • 11”事 件 对 芝 加 哥 市 办 公 写 字 楼 出 租 情 况 的 影 响 ,主 要 的 结 果
变 量 是 办 公 室 空 置 率 。 图 8 . 3 列 出 了 两 类 办 公 楼 空 置 率 的 变 化 趋 势 。从图 上
可以看出,
在 “9 • 11”事 件 之 前 ,
两类办公楼空置率具有基本相似的变化趋势,
并 且 没 有 非 常 明 显 的 差 异 。而 “9 • 11”事 件 之 后 ,
起初两年两类办公楼空置率
也没有发生明显的差异,
@ 但 2 0 0 3 年i 右 开 始 ,
两类办公室空置率发生了明显
的分化,
非阴影区域的空置率基本保持平稳,
但阴影区域空置率发生了显著的
增 加 。 图 8. 3 实际上 提 供 了 D D D 策 略 共 同 趋 势 假 设 的 一 种 验 证 ,可 以 看 出 ,

“9 • 11”事 件 之 前 ,
所有年份数据显示两类区域的写字楼基本具有相同的空置
率变化趋势,
从 而 事 后 两 类 区 域 写 字 楼 空 置 率 的 差 异 可 以 解 释 为 “9 • 11”事件

① 如 果 是 面 板 数 据 ,回 归 D I D 模 型 也 可 以 写 为 = 各+ rD,. + ,
详 细 参 考 Card and Krue­
ger (1994) <,
© 选 择 0. 3 英 里 的 依 据 是 在 “9 • 11”事 件 中 倒 塌 的 世 贸 大 楼 造 成 的 影 响 大 约 是 0. 3 英 里 。芝加哥
市 的 三 座 标 志 性 建 筑 是 美 国 最 高 的 建 筑 西 尔 斯 塔 (Sears T o w e r ) 、
美 国 第 三 高 的 建 筑 怡 安 中 心 (A o n Cen-
ter)和 美 国 第 四 高 的 建 筑 汉 考 克 中 心 (Hancock Center), 三座建筑是芝加哥市最高的三座写宇楼, 被恐怖
袭 击 的 风 险 相 对 于 其 他 较 矮 的 写 字 楼 更 高 ,因 而 ,
作 者 选 择 以 这 三 座 标 志 性 建 筑 为 锚 点 0 . 3 英里范围内
的写 字 楼 作 为 干 预 组 。
③由于租赁合同的期限限制, “9 _ 11”事 件 的 影 响 可 能 没 有 马 上 显 现 出 来 ,
等合同到期后,
很多公
司 可 能 退 出 了 受 恐 怖 威 胁 可 能 性 更 大 的 阴 影 区 域 ,随 后 导 致 阴 影 区 域 办 公 楼 空 置 率 的 上 升 。
158 基本有用的计量经济学

后恐怖袭击威胁对阴影区域写字楼空置率的影响。

Crosses represent Class A and Class B office buildings in Chicago's Central Business District-Shaded
circles represent 0.3-mile radius “ shadow areas” surroflnding the three mam Chicago landmark buildings:
the Aon Center, the Hancock Center, and the Sears Tower.

图 8 , 2 芝加哥市中心商务区办公楼和阴影区域

为了考察恐怖威胁对阴影区域写字楼空置率的影响,
作 者 采 用 D I D 识别策
略,
构建下列模型:
vacancy rateit = r(shadow,- X post-9/11,) + ft + 切 (8. 24)
其 中 vacancy rateit表 示 写 字 楼 ;在 i 期 的 空 置 率 ,
sh a d o w , 表 示 写 字 楼 z 是否在
阴 影 区 域 ,取 1 表 示 在 阴 影 区 域 ,
取 0 表 示 在 非 阴 影 区 域 ,post-9/ll,表示时 间
是 否 在 “9 • 11”事 件 发 生 之 后 ,
取 1 表 示 “9 • 11”事 件 后 ,
取 0 表 示 “9 • 11”事件
之 前 。/ , 控 制 时 间 效 应 , 为 个 体 固 定 效 应 。 因 为 有 多 期 的 数 据 ,
作者采用了
类似于固定效应模型的设定,
事 实 上 ,固 定 效 应 方 法 是 D I D 方 法 的 一 般 形 式 。
为了验证估计结果的稳健性,
作者还引人了另外三个模型,
分别是:
1= r(distance to anchor;X post-9/11,) -f /, + rj;+ e* (8.25)
vacancy rate;
vacancy rate;
,= r(distance to non-shadow area,. X post-9/11,)
+ / , + 7,+e,v (8. 26)
第八章面板数据方法 159

year

图 8 ,3 阴影和非阴影区域的办公楼平均空置率

vacancy rateit= r(height,. X post-9/11,) + f, + 々


,.+ e,> (8, 27)
其 中 distance to anchor表 示 到 锚 点 的 距 离 ,
离锚点越近,
受到的恐怖威胁越大,
公司搬离的可能性越高,
从 而 空 置 率 可 能 越 高 ,因 而 其 系 数 预 期 为 负 ;
distance
to non-shadow area是 距 离 阴 影 边 界 的 距 离 ,因 为 在 阴 影 之 外 ,
距离再增加,

怖威胁的影响不会再发生变化,
所以作者又将考察对象限定在阴影区域内,

离边界越远即离锚点越近,
恐 怖 威 胁 越 大 ,公 司 搬 离 的 可 能 性 越 高 ,因 而 ,空置
率可能越高,
该系数预期为正;
height表 示 办 公 楼 的 高 度 ,
这是从另一个维度考
察,
楼 层 越 高 的 建 筑 越 有 可 能 成 为 恐 怖 分 子 的 袭 击 目 标 ,因 而 ,
恐怖威胁越大,
公司搬离高层建筑的可能性越大,
空置率越高,
影 响 预 期 为 正 。这 三 个 模 型 实
际 是 D I D 模 型 的 变 化 ,用 连 续 的 变 量 替 换 了 (8. 24 ) 的 虚 拟 变 量 ,
估计结果见表
8.2:

表 8. 2 “9 • U ”事 件 和 芝 加 哥 市 中 心 商 务 区 办 公 楼 空 置 率

D e p e n d e n t variable:Building vacancy rate (1) (2) (3) (4)

s h a d o w a r e a X post-9/11 . 0303*
(.0166)

distance to anchor X post-9/11 一 .0617*

(.0362)
160 基本有用的计量经济学

(续 表 )

Dep e n d e n t variable:Building vacancy rate (1) (2) (3) (4)

distance to n o n - s h a d o w a r e a X post-9/11 .2302”


(.0633)
height X post-9/11 • 0052**
(.0022)
i?-squared .39 .39 .39 .39
N u m b e r of observation 9922 992 2 9922 9922
注 :
摘 自 A b a d i e and Dermisi ( 2 0 0 8 )表 2 。

表 8 . 2 第 1 列 对 应 于 模 型 (8. 2 4 ) ,系 数 为 0.0303,
显著为正,
说 明 “9 • 11”
事件后显著增加了阴影区域写字楼的空置率,
第 2 列 对 应 于 模 型 (8. 25 ) ,系数
为一 0.0617,
显著为负,
说明离锚点距离越远,
“9 • 11”事 件 对 空 置 率 的 影 响 越
小,
第 3 列 对 应 于 模 型 (8. 26),
系 数 为 0, 2302,
显著为正,
说明在阴影区域离锚点
越近,
“9 • 11”事 件 对 空 置 率 的 影 响 越 大 ,
与 第 2 列的结果相互印证,
第 4 列对应
于 模 型 (8. 27),
系 数 为 0. 0052,
显著为正,
说明楼层越高,
“9 • 11”事 件 对 其 空 置 率
影响越大。
上 述 结 果 可 以 解 释 为 “9 • 11”事 件 影 响 的 关 键 是 共 同 趋 势 假 设 成 立 ,由于
作 者 有 “9 • 11”事 件 前 多 期 的 数 据 ,
于 是 利 用 事 前 的 数 据 做 了 证 伪 检 验 (falsifi-
cation test)。① 他 们 利 用 1 9 9 6 年 到 2 0 0 1 年 的 数 据 ,以 1 9 9 8 年 第 4 季 度 作 为 虚
拟的政策干预时点,
重复了前面的分析,
估 计 结 果 见 表 8. 3 。结 果 显 示 ,
“9 • 11”
事件之前均没有显著的政策影响,
从而说明,
共同趋势假设有可能成立,
至少没
有发现不成立的证据。

表 8 . 3 利 用 “ 9 • 11” 事 件 之 前 的 数 据 进 行 的 回 归 :
证伪检验

D e p e n d e n t variable:Building vacancy rate (1) (2) (3) C4)

s h a d o w areaXsafter 1998 . 0120


(.0165)
distance to a n c h o r X safter 1998 — . 313
(•0370)
distance to n o n - s h a d o w areaXsafter 1998 . 1017
(•0839)
heightXafter 1998 .0026
(.0025)

① 也 称 为 安 慰 剂 检 验 (placebo test) •这 种 称 谓 主 要 来 自 于 医 学 实 验 。

第八章面板数据方法 161

(续表)

De p e n d e n t variable:Building vacancy rate (1) (2) (3) (4)

■R-squared .48 .48 .48 .48

N u m b e r of observation 5324 5324 5324 5324

注:
摘自 Abadie and Dermisi (2 0 0 8 )表 5 。

3. 小结

在满足共同趋势假设、
共同区间假设、
外 生 性 假 设 及 无 交 互 影 响 (S U V T A )
等四个假设下,
双 重 差 分 策 略 可 以 识 别 出 政 策 干 预 效 应 。在 四 个 假 设 中 ,
最关
键 的 是 共 同 趋 势 假 设 。上 文 讨 论 过 ,
共同趋势假设相当于增量上的条件均值独
立 性 假 设 ,因 而 ,
D I D 方法类似于匹配方法,
但 是 两 者 仍 然 有 很 大 的 不 同 ,匹配
方法要求条件独立性或至少是条件均值独立性假设成立,
但 是 D K ) 方法允许
C I A 不 成 立 ,允 许 存 在 不 随 时 间 变 化 的 未 观 测 混 杂 因 素 ,因 而 ,
D I D 可以解决部
分的内生性问题,
可以解决由于不随时间变化的因素造成的内生性,
这一点类
似于固定效应方法,
通过两期的差分或去均值可以消除未观测混杂因素的影
响,
从而识别出因果效应参数。
当共同趋势假设不能满足时,
可以理解为存在时变的混杂因素使得即
使没有政策干预时,
干 预 组 和 控 制 组 两 组 结 果 也 不 会 平 行 变 化 。如 果 我 们 还 能
找到与我们关心的干预组和控制组相似的另外两组个体,
不妨称为类干预组和
类 控 制 组 ,在 没 有 政 策 干 预 时 ,
干 预 组 和 控 制 组 由 于 C/,,造 成 的 差 异 与 另 外 一 对
类干预组和类控制组差异相似,
或 者 说 ,此 时 增 量 不 满 足 共 同 趋 势 ,
但是增量的
增量满足共同趋势,
此 时 可 以 采 用 三 重 差 分 策 略 (D D D ) 来 识 别 因 果 效 应 参 数 。
这种情况下,
直观理解, 一 重 差 分 不 能 消 除 未 观 测 因 素 的 影 响 ,即 A U i 不 为 零 ,
但 是 Al/丨在 我 们 关 心 的 组 里 和 类 组 里 相 同 ,
从而可以通过再进行一次差分的方
式,
将 AL/,.的 影 响 消 除 掉 ,
相应的关键假设可以写为:
E [ A 2Y 0, | X , D = 1] = £ [ A 2Y 0!v I X , D - 0]
但 基 本 的 思 想 仍 然 与 双 重 差 分 类 似 ,因 而 ,
不再展开。
从上文的分析也看到,
关 键 的 共 同 趋 势 假 设 具 有 函 数 依 赖 性 (scale depend-
ence),
是结果水平量的增量相同,
还 是 结 果 取 对 数 后 增 量 相 同 ,或 其 他 函 数 形
式变化后增量相同,
不同函数的共同趋势假设,
将 得 到 不 同 的 估 计 。从 这 种 意
义上而言,
D I D 方法是一种半参数识别策略,
并且函数形式的选择往往要依赖
于 所 研 究 的 问 题 。因 而 ,
在利用D I D 方法估计因果效应参数时,
需要仔细思考
共同趋势假设应该在哪种函数形式上更有可能成立。
162 基本有用的计量经济学

D I D 方法比较适合于面板数据,
对于重复截面数据也可以使用D I D 策略。
当利用重复截面数据时,
需要仔细考察政策干预前后两组个体的构成是否发生
变 化 ,即 事 前 的 干 预 组 与 事 后 的 干 预 组 是 否 相 似 ,
事前的控制组与事后的控制
组 是 否 相 似 。如 果 两 组 事 前 事 后 的 构 成 不 同 ,可 能 出 现 样 本 选 择 偏 差 ,
从而使
D I D 策略失效,
这一点是利用重复截面数据估计D I D 时需要注意的。

第三节合成控制法

在很多比较研究中,
往往关注一个地区、
城市或国家加总的信息,
这种情况
下,
政 策 干 预 的 个 体 往 往 只 有 一 个 ,如 何 科 学 地 评 价 政 策 干 预 对 该 个 体 的 影 响
成 为 一个重要的议题。比 如 评 价 2008年 我 国 出 台 的 4 万亿刺激方案对我国宏
观 经 济 的 影 响 ,出 台 4 万 亿 刺 激 方 案 的 只 有 中 国 ,如 何 评 价 这 一 政 策 对 中 国 经
济 的 影 响 。这 个 时 候 ,
潜在的控制组个体,
如 用 其 他 发 展 中 国 家 或 O E C D 国家
数据作为控制组,
这些国家同期没有出台4 万亿刺激方案,
但是其中任何国家
与中国均存在着较大的差异,
如何才能构造更好的控制组,
从而估计中国的反
事 实 结 果 呢 ? Abadie and Gardeazabal (2003)、
Abadie et al. (2010)提出一种新
的方法,
称 为 合 成 控 制 法 (synthetic control methods) 0 它 的 基 本 思 想 是 ,
尽管
控制组中的任何个体与干预组个体都不相似,
但是通过为每个控制组个体赋予
一个权重,
加 权 平 均 后 构 造 出 一 个 合 成 的 控 制 组 。权 重 的 选 择 使 得 合 成 控 制 组
的行为与干预组政策干预之前的行为非常相似,
从而期望事后干预组如果没有
受到政策干预,
其 行 为 仍 然 与 合 成 控 制 组 非 常 相 似 ,即 合 成 控 制 组 事 后 的 结 果
可以作为干预组个体的反事实结果,
干预组和合成控制组事后结果的差异就是
政策干预的影响。

1. 合成 控 制 法的 基本 设 定

合成控制法的适用场景类似于双重差分法,
某一时刻起一项政策影响了干
预组,
但对控制组个体没有产生影响,
从而事前两组个体均没有受到政策的影
响,
而事后只有干预组个体受到政策影响D 与双重差分法适用场景不同的地方
在于合成控制法中干预组只有一个个体,
往 往 是 一 个 城 市 、地 区 或 国 家 。基本
的设定如下,
假 设 有 J V + 1 个 地 区 ,区 域 1 在 T 。期 后 受 到 政 策 干 预 ,
其他N 个
地 区 没 有 受 到 政 策 干 预 。沿 用 以 前 的 符 号 , 表 示 个 体 〖在 Z 期 接 受 政 策 干 预
时 的 潜 在 结 果 ,:
^ ^ 表示个体/ 在 Z 期没有受到政策干预时的潜在结果,
从而个
体因果效应为:
第八章面板数据方法 163

rit = — You » i 二 1,
…,iV + 1 ,t — 1, ••• ,T
表 示 个 体 ;在 £ 期 的 干 预 状 态 ,
个 体 i 在 〖期 受 到 政 策 干 预 ,i ^ - 1 ,
其他取0。
个 体 /在 i 期的观测结果为:
y, = d ,y U[ + ( i - d , ) y 0i = y 0,v + t,d ,
为叙述方便, 0 期 后 受 到 政 策 干 预 ,而 其 他 N
假 设 第 1 个 个 体 在 乃 (1 < ^ < :
个 个 体 所 有 时 期 均 没 有 受 到 政 策 影 响 ,即
= 1 ’t > T 0
( 0 其他
我 们 的 目 标 是 估 计 政 策 影 响 (r1Io+l,
…, 对 于 t > T 0,
r1T) ,
rl/ = ^11/ — — y n _ Yolr
第 1 个 个 体 受 到 政 策 干 预 ,因 而 ,
在(> 了。期 ,
我 们 可 以 观 测 到 潜 在 结 果 Y 1It,

无 法 观 测 到 如 果 它 没 有 受 到 政 策 干 预 时 的 潜 在 结 果 A u ,因 而 ,
政策评价的关键
是 如 何 估 计 出 个 体 1 7 V 期 后 的 反 事 实 结 果 Y & 。为 了 估 计 个 体 1 的 反 事 实 结
果 ,假 设 可 以 用 下 列 模 型 表 示 :
You = = 氏 + dtZi + Xtfii + e,'t , Z = 1 ,… ,iV + 1 , £ = 1 ,
… ,.了 (8. 28)
其 中 &是 一 未 知 的 公 共 因 子 , 对所有个体 具 有 相 同 的 影 响 ,
乙 是 K X 1 . 维(
不受
政 策 影 响 的 )可 观 测 协 变 量 向 量 (可 能 是 混 杂 因 素 ),
久 是 1 X K 维未知系数向
量 ,A,是 1 X F 维 的 未 观 测 公 共 因 子 是 F X 1 维 系 数 向 量 a 是 未 观 测 的 暂 时
性冲击,
假设在地区层面满足零均值。
考 虑 N X 1 的权重向量 W = b 2,…,
w N+1) ,
满 足 叫 > 0 ,_/= 2 ,
…,N + 1,
并 且 … + WiV+1= l 。这 里 将 权 重 限 制 为 非 负 ,
相当于用控制组个体的凸组
合来合成控制组,
是 为 了 避 免 外 推 造 成 的 可 能 偏 差 。每 个 特 定 的 权 重 向 量 W
代表一个特定的合成控制, 对于权重W , 合成控制模型为:
iV+l w-l N+l N±l
= dr + d t'^J-wjZ j + A f + S £yv
;= 2 j=2 j=2 j= 2

假 设 存在权重向量=(w;,
…,t^ +1),使得
N+l N-t-1
= Y>2 = Yl2, …,
j=2

N +l N-hl

^ r 0 = Yrr。, !> / A = 乙 <8. 29)




Abadie et al. (2010)在 其 附 录 B 中 证 明 ,
如 果 是 非 奇 异 的 ,
则有
/=1

N十] 』
Y+1T0 r T0 \-1
^01/ —
j = 2
Yj'
j ^2 5=1
2a42
V »=1
久 丄 又 : (£jS — eu)
J
164 基本有用的计量经沆学

一 > /W* (£jt 一 ) (8. 30)


;=1

可 以 证 明 ,当 干 预 之 前 时 期 足 够 长 (了。
— 00),(8. 30)式 趋 近 于 零 ,
从而干预组个
体 1 的 反 事 实 结 果 近 似 可 以 用 合 成 控 制 组 来 进 行 表 示 ,即
' N+1
^01/ — 〉]^>i Yj!

因 而 干 预 组 个 体 1 的 政 策 干 预 效 应 可 ^表 示 为 :
N+1
iu = Yu - Yi' » t = 了。+1’ … ’ 了 (8.31)
>=2
条 件 (8. 29)是 关 键 ,
如果存在权重向量v r ,
使得干预前各期合成控制组的观
测结果与干预组观测结果相等, 所有可观测因素相同, 从而意味着事前合成控
j\r+l
制 组 的 未 观 测 因 素 也 会 与 干 预 组 未 观 测 因 素 相 同 ,即 h 。这意味着

合成控制组与干预组将非常相似,
从而可以将合成控‘组的行为模式作为干预
组 个 体 反 事 实 结 果 的 估 计 。 事 实 上 ,条 件 (8. 2 9 ) 中 的 等 式 一 般 不 会 完 全 相 等 ,
除 非 干 预 组 事 前 信 息 ( T „ ,… , 名 )在 K Y 21,… ,
h r 。,
名 ),… ,(
Y』v + u ,… ,
的 凸 包 内 。在 应 用 中 ,
很 难 保 证 条 件 (8. 29)等 号 恰 好 成 立 ,
一般
是 保 证 (S. 29)等 号 近 似 成 立 ,
如 果 干 预 组 向 量 ( Y u ,… , ,Z;)在 控 制 组 凸 包
之外,
可能无法找到合适的权重向量,
这时,
将无法找到合适的合成控制组,

要 使 用 其 他 的 方 法 ,比 如 允 许 权 重 为 负 (回 归 合 成 方 法 )。
与双重差分法类似,
合 成 控 制 法 也 有 一 些 暗 含 的 假 设 。首 先 ,
干预组和控
制组无交互影响,
如果政策干预对干预组的影响会溢出到控制组,
那么,
控制 组
就会受到污染,
控 制 组 事 后 的 结 果 就 部 分 地 体 现 了 政 策 的 影 响 ,因 而 ,
合成控 制
组的事后结果就不是干预组很好的反事实结果的估计,
得到的因果效应也将产
生 偏 差 。其 次 ,
构造合成控制组时,
两 组 个 体 特 征 变 量 Z i ,… ,
么V+1必 须 是 干 预
前 的 变 量 或 不 受 政 策 干 预 影 响 的 变 量 。如 果 有 事 后 变 量 ,
则可能会受到政策干
预的影响,
从而造成样本选择性偏差。

2. 合成控制法的实施

合 成 控 制 法 实 施 的 关 键 是 找 到 满 足 条 件 (8. 29)的 权 重 向 量 :
W = ( w 2 ,… ,
w jV+i ) j zvj ^ 0, j = 2 ,… ,
N + 1

且 = i , 即 合 成 控 制 组 是 控 制 组 个 体 的 一 个 凸 组 合 。令 x , 是 干 预 组 个
j=2
体事前的特征,
包括可观测协变量乙和事前结果的若干线性组合,
为M X 1维
第八章面板数据方法 165

的 向 量 。同 样 地 ,
令 X。
为控制组的事前特征,
为M X N 的矩阵合成控制权
重 W* ,
…,u ^ +1)'最 小 化 下 面 距 离 ,
II X, 一 x Qw || = y c x :- X o W ) V ( x 1 - x 0w T

= J ^ A X ^ - X ^ w y (8.32)

其 中 v 是 — 个 M X M 的 对 称 正 定 矩 阵 ,通 常 是 对 角 阵 ,
对角元素为
… ,iW ,
K 是一个权重,
反映了在干预组和控制组协变量差异中的相对重要性,
是 个 体 i 的 第 m 个 协 变 量 。V 的 选 择 很 重 要 ,
合 成 控 制 W •将 依 赖 于 V 的
选择,
不 同 的 V•将 得 到 不 同 的 合 成 控 制 组 合 成 控 制 V T ( V )的 目 的 是 复
制 干 预 组 在 没 有 受 到 政 策 干 预 时 的 行 为 ,因 而 ,
A ,… , 的选择应该反映协变
量的预测能力。 …,
~的 选 择 可 以 根 据 研 究 者 对 各 协 变 量 预 测 力 的 主 观 评
价,
也 可 以 利 用 回 归 分 析 看 看 哪 些 协 变 量 具 有 更 强 的 预 测 能 力 。一 个 较 好 的 办
法是选择使事前均方预测误差(
m e a n squared predicted error,
M S P E )最小的矩
阵 V C Abadie et al.,2010),即 选 择 V 最小化
/V+l \2

1=2 )
如果事前时期足够长,
也可以使用交叉验证的方法,
将事前样本分成训练
期 (training period)和 验 证 期 (validation period) 0 给 定 任 意 矩 阵 V% 利用训练期
数 据 计 算 权 重 矩 阵 (V),然 后 利 用 验 证 期 数 据 最 小 化 ( V ) 的 M S P E 。

3 . 合成控制法假设检验

在利用合成控制法进行比较研究中,
一 般 个 体 数 不 会 太 多 ,因 而 ,
基于大样
本 的 假 设 检 验 方 法 往 往 不 合 适 。Abadie et al. (2010)提 出 了 一 种 类 似 于 置 换 检
验(
permutation test)的 推 断 方 法 ,
与 Fisher(1935)的 精 确 尸 检 验 方 法 相 似 (
Im-
bens and Rubin, 2015)。为 了 检 验 合 成 控 制 法 得 到 的 参 数 估 计 是 否 显 著 ,
原假
设 是 政 策 效 应 不 显 著 ,即 假 设 政 策 干 预 对 个 体 没 有 因 果 影 响 ,
将干预组个体放

① 兄 和 X 。可 以 包 括 亊 前 结 果 或 事 前 结 果 的 线 性 组 合 ^ 具 体 地 ,
定义向量M = ( % ,… ,
— Tc __
干 预 前 结 果 的 一 个线性组 合 表 示 为 另 w = , 比 如 mi = … = 0、
w r fl = 1 ,
则 yM =
3-1

Y 1?0。 = TV* i y ts. 假 设 W 个 这 样 的 线 性 组 合 ,


分 别 为 M 丨,… ,
s=l
iWw,
则 Xi = ( Z ;,7^1 •,
巧V / 是 (K + W = M ) X 1 维 干 预 组 个 体 的 事 前 特 征 向 量 ,同 样 地 ,X«?是 M X
N 维控制组个体的事前特征矩阵,
其 j 行 向 量 为 (Z L F f i ,… ,巧 % )'。详 细 参 考 Abadie et al. (2010) „
166 基本有用的计量经济学

到 控 制 组 个 体 中 ,随 机 抽 出 一 个 个 体 ,
利用上文的合成控制方法,
估计出相应的
政 策 效 应 。这 样 ,
对应于N 个控制组个体,
会 得 到 N 个相应的政策效应的估
计,
从 而 可 以 得 到 政 策 效 应 估 计 的 一 个 具 体 分 布 (exact distribution) 0 然 后 检
测 估 计 的 干 预 组 个 体 因 果 效 应 在 整 个 分 布 中 所 处 的 位 置 ,如 果 处 于 分 布 的 尾
部 ,比 如 处 于 尾 部 的 5 % ,
则说明如果原假设成立,
那么观测到估计的政策效应
的可能性低于5 % ,
原 假 设 可 能 为 假 ,如 果 设 定 5 % 的显著性水平,
则 可 以拒绝
没有政策影响的原假设,
从 而 说 明 估 计 是 显 著 的 。如 果 发 现 估 计 的 政 策 效 应 参
数在整个精确分布的中间位置,
则意味着随机抽取一个个体作为干预组,
就可
以以较大的概率得到观测到的因果效应,
说明无法拒绝原假设,
从而估计的因
果效应参数不显著。
®
这 种 检 验 方 法 实 际 上 是 一 种 安 慰 剂 检 验 (placebo test)或 证 伪 检 验 (falsifi­
cation test)。为 了 检 验 估 计 的 政 策 效 应 是 否 显 著 ,随 机 从 控 制 组 中 抽 出 一 个 个
体作为一个伪干预组,
利 用 同 样 的 合 成 控 制 方 法 去 估 计 政 策 效 应 。对 伪 干 预 个
体,
它事实上没有受到政策干预,
如果估计的结果发现也有较大的政策效应,

说明前面的分析可能存在着问题,
因为没有受到政策影响的个体作为伪干预组
也可以发现类似于利用真实干预组得到的政策效应,
从而说明这一效应可能不
是政策干预的影响,
而 是 其 他 因 素 造 成 的 影 响 。相 反 ,利 用 所 有 控 制 组 个 体 作
为伪干预组,
均无法得到类似于利用真实干预组得到的政策效应,
则证明得到
的政策效应是显著的。
上 面 的 类 置 换 检 验 实 际 上 是 在 截 面 个 体 上 进 行 的 安 慰 剂 检 验 。如 果 事 前
时期很长,
还可以构造另一种形式的安慰剂检验,
根据时间随机置换的安慰剂
检验,
称 为 伪 干 预 时 间 检 验 (pseudo treatment) 。 因 为 所 使 用 的 数 据 都 是 干 预
之前的信息,
所有个体都没有受到真正的干预,
利用同样的合成控制方法,
如果
得到显著的政策效应,
则说明,
前 面 的 估 计 可 能 存 在 着 问 题 。相 反 ,
如果发现没
有显著的政策效应,
则证明,
前面的合成控制方法可能是有效的,
未观测的混杂
因素利用合成控制法基本得到充分控制。

4 . 案例:
加州香烟控制项目对其香烟消费的影响

Abadie et al. (2010)考 察 了 美 国 加 州 香 烟 控 制 9 9 法 案 对 加 州 香 烟 消 费 的

① Abadie et al. (2010)还 提 出 了 另 一 种 检 测 指 标 ,


计算事后均方预测误差与事前均方误差的比率,
利用随机置换估计,
可以得到这一比率的精确分布, 检测利用真实干预组进行合成控制得到的比率,在比
率分布中的位置。推断过程一样,如果观测到的比率处于精确分布的尾端,则说明在原假设下出现的可
能性较小,
而现在出现了,说明原假设可能为假,从而合成控制结果显著. 相反,如果观测到的比率处于
巾间位置,
则说明在原假设下出现的可能性较大, 从而没有办法拒绝原假设,参数估计不显著.
第八章面板数据方法 167

影 响 。为 了 限 制 香 烟 消 费 ,
1988年 U 月 ,
加 州 政 府通过 了 9 9 法 案 ,
主要内容是
将香烟消费税每包提高2 5 美 分 ,
该 法 案 1989年 1 月正式生效,
作者主要考察
这 一 政 策 对 香 烟 消 费 的 抑 制 作 用 有 多 大 。干 预 组 为 加 州 ,
美国其他州为潜在控
制 组 (donor pool),为 了 避 免 其 他 类 似 政 策 污 染 控 制 组 ,
作者删除了在考察期出
台相 似 香 烟 控 制 政 策 的 州 ,
最 终 得 到 3 8 个 州 作 为 控 制 组 。作 者 使 用 的 数 据 为
1 970-2000年州层面的年度面板数据,
结果变量为州年度人均香烟消费量,

变量包括香烟平均零售价格、
州 人 均 收 入 (取 对 数 )、
州 人 口 中 15— 2 4 岁所占百
分比、
州人均啤酒消费量,
这 些 协 变 量 均 用 1980— 1 9 8 8 年 平 均 值 。另 外 ,还引
人了 1975、
1980、1 9 8 5 年 三 个 年 份 的 人 均 香 烟 消 费 量 作 为 协 变 量 ,
详细数据信
息请参 考 Abadie et al. (2010) 0
图 8.4显示的是加州的人均香烟销售量趋势和其他控制州的人均香烟销
售 量 平 均 值 变 化 趋 势 。可 以 看 出 ,
两 组 在 事 前 变 动 趋 势 并 不 完 全 相 同 ,因 而 ,

制组州并不是加州很好的反事实估计。由 于 变 动趋势不同,
也不大适用于双重
差 分 策 略 。下 靣 利 用 合 成 控 制 方 法 构 建 合 成 控 制 组 ,采 用 上 文 所 述 的 估 计 步
骤,
最 后 得 到 的 合 成 控 制 权 重 见 表 8. 4 。可 以 看 到 ,
在合成控制组中,
很多州的
权 重 为 0,只 有 5 个 州 最 终 进 人 了 合 成 控 制 组 ,
事 前 加 州 可 以 用 0. 3 3 2 个 U t a h 、
0 .234 个 Neva d a 、。. 196 个 M o n t a n a 、
。. 167 .个 Colorado、
。. 07 个 Connecticut
进 行 合 成 。合 成 效 果 可 以 参 见 表 8. 5 ,
可以看到,
加 州 的 主 要 协 变 量 与 3 8 个控
制州的协变量平均值还是有较大差异,
尤 其 是 1975、1980、1 9 8 8 三 年 的 人 均 香
烟销售量差异非常大,
合 成 的 加 州 各 协 变 量 与 实 际 的 加 州 已 经 非 常 相 似 ,除人
均 收 人 有 一 点 差 别 。图 8 . 5 显 示 的 是 加 州 与 合 成 加 州 的 人 均 香 烟 销 量 趋 势 图 ,
从图上可以看出,
在 99法案实施之前,
图中合成加州与真实加州的人均香烟销
售几乎完全重合,
合成加州较好地拟合了加州9 9 法案实施之前人均香烟销售
的变动趋势,
说 明 合 成 加 州 较 好 地 控 制 了 未 观 测 混 杂 因 素 (包 括 随 时 间 变 化 的
未 观 测 混 杂 因 素 )的 影 响 ,因 而 ,
有 理 由 相 信 ,如 果 加 州 没 有 实 施 9 9 法 案 ,
那么
随后加 州 人 均 香 烟 销 售 量 也 应 该 基 本 能 够 用 合 成 加 州 人 均 香 烟 销 售 量 的 变 化
来进行拟合,
从而,
合成加州人均香烟销售量可以作为真实加州人均香烟销售
量 反 事 实 结 果 的 估 计 。事 后 真 实 加 州 与 合 成 加 州 两 条 曲 线 的 差 异 反 映 的 就 是
9 9 法案的政策影响,
图 8. 5 显 示 ,
真 实 加 州 人 均 香 烟 销 售 量 1 9 8 9 年起就开始低
于合成加州的人均香烟销售量,
并且差距越来越大。
168 基本有用的计量经济学

year

图 8 . 4 人 均 香 烟 销 售 量 趋 势 :加 州 和 其 他 州

表 8. 4 合成控制组各州权重

State Weight State Weight State We i g h t

Alabama 0 Ar k a n s a s 0 Colorado .167

Connecticut .07 Delaware 0 Georgia 0


Idaho 0 Illinois 0 Indiana 0
Iowa 0 Kansas 0 Kentucky 0
Louisiana 0 Maine 0 Minnesota 0
Mississippi 0 Missouri 0 Montana ,196
Nebraska 0 Nevada .234 N e w Hampshire 0
N e w Mexico 0 N o r t h Carolina 0 N o r t h Dako t a 0
Ohio 0 Oklahoma 0 Pennsylvania 0
R h o d e Island 0 S o u t h Carolina 0 S outh D a k o t a 0
Ten n essee 0 Texas 0 Utah .332
Vermont 0 Virginia 0 W e s t Virginia 0
Wisconsin 0 Wyoming 0

注 :复 制 A b a d i e et al. ( 2 0 1 0 ) 表 2 。
第八章面板数据方法 169

表 8. 5 协变量均值

California A v e r a g e of
Variables ------------------------------ n ,
Real Synthetic 38 control states

Beer consu m p t i o n per capita 2 4 .28 24. 19 23.46

L n ( G D P per capita) 10. 08 9. 85 9. 86

Retail price 89. 42 89. 33 1 0 8 ‘04

Percent aged 15— 24 0. 17 0. 17 0. 18

Cigarette sales per capita 1988 90. 10 91. 67 113.22

Cigarette sales per capita 1980 12 0 . 2 0 120. 46 137.63

Cigarette sales per capita 1975 12 7 , 1 0 127. 02 136.68

注 :
复 制 Abadie et al. ( 2 0 1 0 ) 表 1 。

year

图 8 . 5 人均香烟销售量:
加州与合成加州

图 8. 6 是 利 用 加 州 的 人 均 香 烟 消 费 减 去 合 成 加 州 的 人 均 香 烟 消 费 得 到 的
政策效应,
与 图 8. 5 提 供 了 相 同 的 信 息 ,
可以看到,
在 99法案实施之前,
政策效
应基本为零,
而在法案实施之后,
政策效应开始显现,
9 9 法案使加州人均香烟消
费量逐年下降,
1989— 2 0 0 0 年 ,
年人均香烟消费量平均下降约20包 ,
降幅接近
2 5 % (Abadie et ah , 2010) 0 但 是 ,
这 一 政 策 效 应 在 统 计 上 是 否 显 著 呢 ? 作者
采用了上文提到的随机置换检验方法,
从控制组中随机抽出一个州作为伪干预
组 个 体 ,利 用 与 上 文 同 样 的 合 成 控 制 方 法 ,
估计政策效应,
可 以 得 到 类 似 图 8.6
的政策效应路径,
对 于 38个控制州,
共 可 以 得 到 38个另外的政策效应路径。
将上文估计的政策效应路径放到这3 8 个 政 策 效应路径中,
看看它在政策效应
170 基本有用的计量经济学

.S,
C/3

year

图 8 . 6 政策效应:
加州与合成加州人均香烟销售量差异

路径分布中的位置,
如果非常极端,
说明上文估计的政策效应是显著的,
否则则
不 显 著 。图 8. 7 显 示 的 是 相 应 的 显 著 性 检 验 ,图 中 黑 色 实 线 与 图 8. 6 相 同 ,

9 9 法案对加州人均香烟消费的影响,
其 他 浅 色 的 线 为 以 其 他 3 8 个州为伪干预
个体得到的伪政策效应,
如 果 9 9 法案对加州人均香烟消费没有影响的原假设
成立,
那么上文估计的政策效应路径出现的可能性应该比较大,
但是在图中可
以看出,
实 线 处 在 所 有 路 径 分 布 的 比 较 极 端 的 部 分 ,只 有 一 个 州 在 实 线 的 下 方 ,
因而,
在没有政策影响的原假设下,
得 到 实 线 的 政 策 效 应 的 可 能 性 只 有 2/39 =

z/i
"5
Z/i

CO

year

图 8. 7 随机置换检验
第八章面板数据方法 171

5. 1 3 % ,
因而,
在 1 0 % 的显著性水平下,
我 们 可 以 拒 绝 没 有 政 策 效 应 的 原 假 设 。在
Abadie et al. (2010)文 章 中 ,
还 作 了 进 一 步 的 处 理 ,比 如 删 除 事 前 拟 合 比 较 差 的 情
况,
只利用事前拟合度比较好的或均方预测误差比较低的结果,
看看上文得到的
政策效应路径在其他伪干预路径分布中的位置,
发 现 99法案的政策影响路径更
加极端,
从 而 证明上文的估计在政策上是显著的。

5. 小结

合成控制法是一种政策评估方法,
它适用于政策干预在某一时刻只影响某
一个地区或国家等,
而 其 他 地 区 或 国 家 在 所 有 时 期 都 没 有 受 到 政 策 影 响 。适用
场景类似于双重差分策略,
但干预组只有一个,
并且往往是针对加总的变量,

非 个 人 或 单 个 企 业 的 信 息 。另 外 ,
双重差分策略可以解决不随时间变化的未观
测混杂因素造成的内生性问题,
但往往不能克服具有时变性的未观测混杂因素
造 成 的 内 生 性 问 题 。在 合 成 控 制 中 ,
允许时变未观测混杂因素的存在,
通过合
成控制,
将未观测混杂因素的影响也可以考察进去,
潜 在 结 果 模 型 (8. 28)允许
未 观 测 因 素 随 时 间 和 个 体 而 变 化 。由于合成控制法要求权重必须在0_1
之 间 ,因 而 ,
如果干预组观测特征远远大于或小于控制组个体特征,
将无法找到
合 适 的 权 重 拟 合 干 预 组 个 体 ,即 干 预 组 特 征 向 量 无 法 用 控 制 组 特 征 向 量 的 凸 组
合进行构建,
此时,
将无法使用合成控制法。当然,
如果愿意放松假设,
允许负
的权重,
从而允许外推,
那么,
仍然可以通过类似合成控制法的方法,
得到一个
合成的控制组(
Abadie et al. , 2015)。Hsiao et al. (2012)的 面 板 政 策 评 估 方 法
就允许负的权重,
下 一 节 我 们 介 绍 Hsiao et ai. (2012)的 面 板 政 策 评 估 方 法 。

第四节回归合成方法

Hsiao et al. (2012)提出了 一 种 面 板 数 据 政 策 评 估 方 法 ,与 Abadie et al.


(2010)的 合 成 控 制 方 法 类 似 ,
也是利用未受到干预的控制组个体的信息来估计
干 预 组 个 体 的 反 事 实 结 果 。为 了 叙 述 方 便 ,
Hsiao et al. (2012)提 出 的 面 板 数 据
政 策 评 估 方 法 后 文 中 简 称 为 “回 归 合 成 方 法 ”。 回 归 合 成 方 法 的 基 本 思 想 是 利
用截面个体之间的相关性估计干预组个体事后的反事实结果,
他们将这种相关
性 归 因 于 驱 动 截 面 个 体 的 共 同 因 子 。从 这 种 意 义 上 而 言 ,回 归 合 成 方 法 与 合 成
控制法有共同之处,
合成控制法实际上也是利用共同因子的推动朵预测干预组
反事实结果的,
但是,
二者权重不同^ ^ 在合成控制方法中,
权重非负,
不允许
外推,
合 成 控 制 组 为 控 制 组 个 体 的 凸 组 合 ,而 在 回 归 合 成 方 法 中 ,允 许 权 重 为
172 基本有用的计量经济学

负,
并且允许常数项的存在以修正合成控制组与干预组之间的差异。

1. 回 归 合成方法的基本设定

与合成控制法设萣类似,
也是只有一个干预组个体在某一时刻受到政策干
预,
而 其 他 个 体 在 所 有 考 察 时 期 均 没 有 受 到 政 策 干 预 。同 样 地 ,
假设有N + 1 个
个体,
第 1 个 个 体 在 t > T 0 期受到政策干预,
其 他 N 个个体为潜在的控制组,

有 受 到 政 策 干 预 。用 来 表 示 个 体 i 在 f 期 的 干 预 状 态 ,
则有
j-1 I = 1, t > T 0
Di! = 1 0 其他情况
同样,
用Yu、
Y。,,表 示 两 个 潜 在 结 果 ,
匕表示观测结果,

Y" - D.Yur + ( 1 - D , ) Y 0l> - Y 0, + ruD u
其中,
^ = 匕一Y&,
为 个 体 f 第 t 期 的 政 策 效 应 。这 里 关 心 的 是 干 预 组 个 体 1
在 政 策 干 预 之 后 的 政 策 效 应 ,即
tu = Y u, ~ Y 0i! ^ y,-, — y 0,v t — T 0 + 1, ,T (8.33)
假设所有个体的基线潜在结果服从下列共同因子模型:
You = y-i + bf;
f, +e,-, i = 1,***,N + 1, t = (8. 34)
其 中 & 为个体固定效应,
/,为 K X 1 维的未观测时变共同因子A 为不随时间
变化但可能随个体变化的常数,
h 为 误 差 项 ,满 足 E [ e;
f] = 0 。将 模 型 (8. 34 )写
成矩阵形式:
Yo, = v + B / , + e , (8.35)
其 中 ,Vo, = ( Y 。
],,
…,Yon+i, ) ^= ("i,… ,
" iv+i ) = (£i,,… ,
ew+i,) fB —Cbi ?
…,
6,v+1)'为 (
N + 1 ) X K 的 共 同 因 子 系 数 矩 阵 。引 人 下 列 假 设 :
假设1 对 于 所 有 个 体 “有 丨
|bi II = c < w 。
假设2 £,〜 7(0),
并 且 £:
[£」- 0 ,
£ [ £,£: ] = ^ 为 对 角 常 数 矩 阵 。
假设 3 £:
[£,/;] - 0 o
假设 4 Rank(B)=K。
假设 5 £ [ e > | D j = 0 ,)六 。
模型(
8. 34)假 设 个 体 结 果 由 两 部 分 构 成 :影 响 所 有 个 体 结 果 的 时 变 共 同 因
子 /,和 个 体 固 定 效 应 ^ 及 个 体 扰 动 项 h 。
.假 设 个 体 特 质 部 分 之 间 是 不 相 关 的 ,
个体结果之间的相关性主要是由共同因子造成的,
但是共同因子对个体的影响
可 以 不 同 ,即 ‘
6,.# 匕。对 于 共 同 因 子 的 时 间 序 列 特 征 没 有 施 加 任 何 限 制 ,
可以是
平稳序列,
也 可 以 是 非 平 稳 序 列 。假 设 4 意 味 着 截 面 个 体 数 大 于 共 同 因 子 数 ,
即 N + 1 > K 。假 设 5 对 个 体 同 期 扰 动 项 g 和 政 策 变 量 !^ 没 有 要 求 ,
它们可以
第八章面板数据方法 173

相关,
也 可 以 独 立 。如 果 同 期 两 者 相 关 ,
则 存 在 根 据 未 观 测 因 素 进 行 的 选 择 (se­
lection on unobservables),如 果 两 者 相 互 独 立 ,则 满 足 R o s e n b a u m and Rubin
(1983)的 条 件 独 立 性 假 设 。假 设 5 只 要 求 个 体 j 的 误 差 项 均 值 独 立 于 D ,>,
j 參 /,
说明除共同因子之外,
个体之间没有溢出效应。
如果能够识别内 、
在 假 设 1一 5 下 , b' 和 /,,
则 可 以 利 用 么 1(= 妁 =
L + 1 ,… ,T 来 预 测 政 策 实 施 后 干 预 组 的 反 事 实 结 果 Y 0it。但 是 ,
这里个体固定
效应、
共 同 因 子 都 是 不 可 观 测 的 ,因 而 ,
无法直接估计干预组个体事后的政策效
应 。根 据 上 文 的 假 设 ,
所有个体都受到时变共同因子的影响,
事后共同因子的

,
影 响 将 体 现 在 控 制 组 的 观 测 结 果 中 ,因 而 ,
推出时变因子 并利用事前干预组观测结果与控制组事前观测结果之间受共同
可以从事后控制组的观测结果中反

因子影响而造成的相关关系, 估计出事后如果干预组个体没有受到政策干预的
反 事 实 结 果 。实 际 上 ,回 归 合 成 方 法 直 接 利 用 控 制 组 观 测 结 果 作 为 干 预 组 个 体
观测结果的预测变量,
其基本逻辑是由于所有个体均受到共同因子的影响,

而 造 成 截 面 个 体 之 间 的 相 关 性 ,根 据 事 前 截 面 个 体 之 间 的 相 关 性 ,
预测干预组
和控制组个体之间的关系,
如果事后干预组个体没有受到政策干预,
那么,
各截
面个体将维持相似的依赖关系,
从而利用这种事前的依赖关系,
并利用事后控
制组的观测结果估计出如果干预组个体没有接受千预的反事实结果。
令 a = (1 ,一 y ) 为 B 零 空 间 中 的 一 个 向 量 ,即 a'S = 0 ,
具体地, 其 中 7=
(h,… 模 型 (8.35)两 边 同 乘 以 《',则 可 消 去 共 同 因 子 /,,
从而得:
Vo., = 7! (8.36)
其中 =£/€,=£】
,一/ e , = …,
由于 < 依 赖 于 所 有 的 误 差 项 = …,
iV+1,
显然,
€[与 相 关 。为
此,
可以 将 d 分解为两部分,
e,;= E L eu 1Y, ] + 奶,,
其中如= G — IL ] ,因
而,
£ U , l Y , ] = 0 。(
8. 36)可 以 写 为 :
Yoi, = y i + / Y , + E [ ^ 1 + ^ (8.37)
假设 6 E^eulYj-d^dX.
由 假 设 6 ,(
8.37)可 以 写 为 :
Yoi, = A + ^ Y t+ v u (8.38)
其中 = y, +(5, x/3=y+<^>E[fi, Iy,] = 0, Hsiao et al. (2012)证 明 ,如果 T 0—
o o , O L S 估 计 量 将 是 参 数 的 一 致 估 计 。可 以 利 用 事 前 数 据 估 计 模 型 (8. 38 )的参
数,
得到预测模型:
y 0i, = (8.39)
因而,
相应的政策效应为:
= Y lf- Y 01(, t= T 0+ 1,-,T (8.40)
174 基本有用的计量经济学

反 事 实 结 果 Y c m ,(= 丁0 + 1 ,
…,r 依赖于个体固定效应& 、
共 同 因 子 /,、

体 对 共 同 因 子 的 反 应 以 及 个 体 特 质 性 因 素 elt。然 而 ,
预 测 模 型 (8. 39 ).并不
需要这些信息,
原因在于共同因子的信息已经蕴含在控制组观测结果I 之 中 ,
从而可以利用控制组信息I 代替共同因子来实现对政策效应的估计。
回归合成方法与上一节的合成控制方法具有很多相似之处,
事实上,
合成
控制法也可以纳入回归合成方法的框架,
观 察 合 成 控 制 模 型 (8. 2 8 ) ,
令 &==0,
= ( 4 ,劣 ,A : ) ,则 合 成 控 制 模 型 (8. 2 8 ) 也 可 以 写 成 模 型

(8. 34)的 形 式 ,
但 为 了 保 证 (8. 36)成 立 ,
需要7 3 = 0 ,
这 一 条 件 要 求 = 0,
i=l
jV-H1 N +l JV十1

= 0 。合 成 控 制 法 通 过 么 u = 来构造干预组的反
/=1 1=1 i=2

事实结果,
不 过 它 要 求 〜 > 0 并 且 ga,. = 1 ,回 归 合 成 方 法 中 不 需 要 施 加 这 一

限制,
从 而 允 许 外 推 。® 1

2 . 回归合成控制组的选择

通过上文的讨论,
我 们 知 道 ,回 归 合 成 方 法 主 要 利 用 政 策 实 施 之 前 的 数 据
来 估 计 模 型 (8. 3 8 ) ,
将估计的模型参数代人事后的控制组个体信息,
得到干预
组 个 体 事 后 反 事 实 结 果 的 估 计 。当 事 前 时 期 远 远 大 于 控 制 组 个 体 数 时 ,即 T 0
》N ,N/T。 — co,可 以 利 用 所 有 控 制 组 个 体 作 为 潜 在 的 合 成 控 制 。但 是 ,在应
用中,
1 和 ]\//了。往 往 是 有 限 的 ,
进人模型的控制组个体越多,
上述模型的自由
度损失越多,
估 计 精 度 会 越 低 ,因 而 ,
在模型拟合时存在着拟合程度与估计精度
之间的权衡。
Hsiao et al. (2012)提 出 了 一 种 两 步 法 来 解 决 这 一 问 题 ,
首先,
依 次 选 择 1,
2,
…,iV个 控 制 组 个体进入模型,
利 用 拟 合 优 度 记 或 似 然 值 来 选 择 模 型 。对于
有 m 个控制组进人模型时,
共需要估计CS=m! /[N! ( i V _ m ) ! ] 个 模 型 ,

用 W 或似然值,
从中选择拟合最好的一个模型,
记 为 M ( m r 。依 次 选 择 下 来 ,
共 得 到 iV个 模 型 即 M ( 1 T ,… ,
M ( J V r 。然 后 ,
利用模型选择标准,
选择最优的
模 型 . Hsiao et al. (2012)建 议 利 用 A I C 或 A I C C 标 准 进 行 选 择 ,
两个模型 选 择
标准定义如下:

AlCip) = To 2(^ + 2) (8.41)

AICCCp) = AlCCp) + l (p + .2)上《、


+ 3)- (8. 42)
』0 — ( 夕十1) — 」

① 两 种 方 法 的 详 细 比 较 可 以 参 见 Hsiao et ah (2012) 。
第八章面板数据方法 175

其 中 p 为模型中包含的控制组个体数,
^ 为 相 应 模 型 的 O L S 回归残差向量。

3 . 案例:
C E P A 对香港 经 济 的 影 响

Hsiao et al. (2012)考察了 1997年 香 港 回 归 以 及 2 0 0 3 年 在 香 港 签 署 的 《内地


与 香 港 关 于 建 立 更 紧 密 经 贸 关 系 的 安 排 K C E P A )对 香 港 经 济 的 影 响 。 作 者 发 现
香港回归对香港经济没有明显影响,担 C E P A 对香港经济 具 有 显 著 的 正 向 影 响 。
这 里 主 要 考 察 C E P A 对 香 港 经 济 的 影 响 。主 要 的 结 果 变 量 是 经 济 增 长 率 ,
C E P A 于 2004年正式实施,
因 而 ,自 2 0 0 4 年 起 香 港 经 济 可 能 受 到 C E P A 安排
的 影 响 。为 了 估 计 C E P A 对 香 港 经 济 的 影 响 ,
需要估计如果没有C E P A 安排,
香 港 的 经 济 会 是 什 么 状 态 ,即 估 计 香 港 经 济 增 长 的 反 实 结 果 。
因为香港是一个城市,
从经济规模上而言,
相对较小,
香港应该不会对其他
经济体有很大的影响,
为 此 ,选 择 澳 大 利 亚 、
奥地利、
加 拿 大 、中 国 大 陆 、
丹麦、

兰、
法国、
德 国 、印 度 尼 西 亚 、意 大 利 、日 本 、
韩 国 、马 来 西 亚 、墨 西 哥 、
荷兰、
新西
兰、
挪 威 、菲 律 宾 、
新加坡、
瑞 士 、台 湾 地 区 、泰 国 、
英 国 和 美 国 等 2 4 个国家或地
区 作 为 潜 在 的 控 制 组 (donor pool),
使 用 1 9 9 3 年 第 1 季 度 到 2 0 0 8 年 第 1 季度
的季度数据进行估计。
首先,
利用上文提出的两步法以及2004年之前的数据,
估 计 模 型 (8. 38),
对于同样数目的地区进人控制组时,
利用记来选择最优的模型M ( m 广 ,
m=l,
…,
24,
然 后 再 利 用 模 型 选 择 校 准 A I C C 进 行 比 较 选 择 最 优 的 模 型 。通 过 这 一
方 法 ,最 终 合 成 的 控 制 组 包 括 奥 地 利 、意 大 利 、
韩 国 、墨 西 哥 、
挪威和新加坡等6
个 国 家 ,具 体 权 重 见 表 8. 6 。 因 而 ,
反 事 实 香 港 地 区 可 以 用 一 1 个 奥 地 利 、一0. 3
个意大利、
0. 3 个 韩 国 、
0. 3 个 墨 西 哥 、
0. 3 个 挪 威 和 0. 2 个 新 加 坡 进 行 合 成 ,

合成控制法要求不同,
这里奥地利和意大利的权重为负值。

表 8 .6 合成控制组的权重:
AICC, 1993:Q1—20 0 3 :Q4

p std. err. /-stat

Constant - 0 . 0019 0 . 00 3 7 - 0 . 5240


Austria — 1.0116 0. 1682 -6.0128
Italy 一 0.3177 0. 1591 - 1 . 9971
Korea 0.3447 0.0469 7.3506
Mexico 0.3129 0. 0510 6.1335
Norway 0. 3222 0 . 03 5 8 5. 9912
Singapore 0.1845 0 . 05 4 6 3 .38 1 2
注 :
复 制 Hs i a o et al. ( 2 0 1 2 ) 的 表 X X 。
176 基本有用的计量经济学

Actual and Counterfactual Path

&S0

&

&so
a


b


呀 so

寸 寸

寸 so

< N 寸4 N 寸< N 寸g
b

bso

900
K>i66I

&6661

bso
(N CN
b
b i

CN
bsl

bgo

(N CN
&S66I

&g100Z

<y o a a o a oC
,go

69,
so

b
bsoo
cy cy
6962

r n <吁寸的的
66I

ro On
2

Ov ?n Os OS Os oo
C
oz

O' Os Os On Os On On
^ wm

tN tN
rJ
rs r)r) tN (N
{n (NtN
图 8 . 8 香港实际经济增长率和预测的经济增长率

合 成 效 果 和 政 策 效 应 见 图 8. 8 ,图 中 实 线 为 香 港 实 际 的 经 济 增 长 率 ,虚线为
合成香港的经济增长率,
可以看出,
2004年 C E P A 安 排 正 式 实 施 之 前 ,
两者几
乎完全重合,
说 明 合 成 控 制 组 基 本 上 与 香 港 的 运 行 模 式 相 一 致 。2 0 0 4 年 起 ,

条曲线产生明显的差异,
虚线在实线的下方,
意味着,
如果没有C E P A 安排,

港的经济增长率将比实际的要低一些,
这 说 明 C E P A 安排促进了香港的经济增
长 。具 体 地 ,C E P A 对 香 港 经 济 增 长 率 的 平 均 影 响 为 4. 03 % ,标 准 误 差 为
0. 0 1 6 0 ,因 而 ,
政策影响是显著的

第五节面板评估方法的软件实现

1 . 双 重 差 分 方 法 在 Stata中的实现

对于双重差分方法,
可 以 使 用 Stata软 件 的 回 归 命 令 regress进 行 分 析 ,

用 回 归 D I D 方 法 估 计 双 重 差 分 估 计 量 。这 里 介 绍 一 个 用 户 写 的 命 令 diff,diff
除 了 可 以 做 经 典 的 D I D 回 归 之 外 ,还 可 以 进 行 核 匹 配 D I D 和 分 位 数 D I D ,
diff
第八章面板数据方法 177

的语法和基本选项为:
©

diff outcome 一var [if] [in] [weight] ? perioc£(varname) treated(varname)


[cov(varlist) kernel id(varname) b w ( # ) ktype(kernel) res qdid(quantile)
pscore (varname) logit support addcov( varlist) cluster (varname) robust
bs reps(int) test report nostar export(filename)3

outcome_var是 结 果 变 量 ,
必选 项 geriodO告 诉 软 件 时 期 变 量 ,
treated( ) 告
诉 软 件 干 预 变 量 。其 他 选 项 全 部 是 可 选 项 ,如 果 需 要 控 制 协 变 量 ,
可以加人可
选项 S0v(varlist),
vadist为 协 变 量 列 表 ;
如果想利用核匹配方法,
可以选择可选
项 kernel,
用 核 匹 配 必 须 加 上 选 项 i d ( v a m a m e ) 告 诉 软 件 面 板 的 截 面 id变 量 ,同
时 b w ( # ) 可以选择带宽,
默 认 为 0.06,
g y p e ( k ernel)可 以 选 择 核 函 数 类 型 ,

果已经估计出了倾向指数,
可 以 利 用 选 项 £ ^ o r e(Va m a m e)将 估 计 好 的 倾 向 指 数
提供给软件,
如果想让软件自己估计,
需要提供进人倾向指数模型的协变量,

认 使 用 pvCvarlist)提 供 的 协 变 量 列 表 ,如 果 还 需 要 引 入 额 外 的 协 变 量 ,可 以通
过选 项 — cov(varlist)添 加 。软 件 默 认 利 用 probit模 型 估 计 倾 向 指 数 ,如 果想
利用丨ogit模 型 估 计 ,
可 以 使 用 logit选 项 。如 果 匹 配 限 制 在 共 同 区 间 上 ,
可以加
— port选 项 。在 核 匹 配 时 ,
如果使用的是重复截面数据,
可 以 使 用 r e s 告 诉软
件,
并 且 不 需 要 加 选 项 id(varname)。旦uster和 robust分 别 可 以 选 择 标 准 误 差
的形式,
如 果 两 者 都 不 选 ,默 认 为 同 方 差 假 设 下 的 标 准 误 差 。test可 以 进 行 协
变量平衡性检验, 选 项 可 以 报 告 协 变 量 的 系 数 信 息 。选 项 b s 和 reps
(int) 可 以 利 用 自 助 法 估 计 标 准 误 差 ,reps (int)选 择 重 复 抽 样 次 数 ,export
(filename)可 以 将 估 计 结 果 输 出 到 文 本 文 件 。
下面利用 Card and Krueger (1994)的数据 cardkruegerl994. dta,
估计新泽
西州最低工资调整对新泽西州快餐业就业的影响,
数 据 为 两 期 面 板 数 据 ,主要
变量含义如下:
i d 为 快 餐 店 I D ; Z 为 时 间 ,干 预 前 取 0 ,
干 预 后 取 1; treated为分
组 变 量 ,1 为 新 泽 西 州 ,
0 为宾州;
fte为 全 职 就 业 人 数 ,主 要 的 协 变 量 b k 、fkc、
roys、
wendys为四家快餐店连锁品牌。
首先,
估计一个最基本的D I D 模型,
不控制任何协变量,
结果如下

① diff为 用 户 写 的 命 令 ,
在使用之前首先要安装该程序包,
可 以 通 过 命 令 ssc install diff, replace安
装 或 利 用 findh diff找 到 安 装 源 进 行 安 装 。
② 这 一 结 果 实 际 上 可 以 利 用 回 归 命 令 reg fte # treated, vce( robust)得 到 。
178 基本有用的计量经济学

, diff f t e ,period(t) treated(treated) robust

DIFFERENCE-IN-DIFFEREHCES ESTIMATION RESULTS


Number of observations in the DIFF-IN-DIFF :780
Baseline Follow-up
Control ; 76 76 152
Treated : 314 314 628
390 390

Outcome var. fte S. Err, t P>|t|

Baseline
Control 20*013
Treated 17.069
Diff (T-C) -2 . 9 4 4 1.440 -2.04 0.041**

Follow-up
Control 17.523
Treated 17.518
Diff (T-C) -0.005 1.037 -0.00 0.996
Diff-in-Iiiff 2.939 1.774 1.66 0.098*

R-square :0. 01
— Means and Standard Errors are estimated by linear regression
— Robust Std. Errors
** Inference ;… p < 0 . 0 1 ? “ p < 0 . 0 5 ;* p < 0 . 1

结果显示,
最低工资调整使新泽西州快餐业店均雇佣人员上升3 人 ,
并且
在 1 0 % 显 著 性 水 平 下 显 著 。为 了 控 制 不 同 快 餐 店 连 锁 品 牌 的 差 异 ,
可以通过
引 人 选 项 cov(bk fkc royS)对 快 餐 店 类 型 进 行 控 制 。下 面 使 用 核 匹 配 方 法 估 计
PSM-DID估计量,
估计结果如下:

. diff fte, period(t) treated(treated) robust cov(bk kfc roys) kernel id(id)
(输出略)

这里让软件自行估计倾向指数模型,
软 件 默 认 用 probh模型进行估计,
diff
会 产 生 — 个 新 的 变 量 _ p s 保 存 拟 合 的 倾 向 指 数 。P S M - D I D 估 计 量 为 3. 0 8 8 ,

然 在 1 0 % 水 平 下 显 著 。如 果 想 看 政 策 干 预 对 不 同 分 位 的 影 响 ,比如想了解新泽
西州最低工资调整对9 0 分位上的快餐店的影响程度,
可 以 利 用 qdicKquantile)
选项,
估计结果显示,
在 9 0 分位上,
政策调整对就业有显著影响,
工 资 调 整 使 90
分 位 上 的 快 餐 店 就 业 人 数 增 加 6. 2 5 人 !
第八章面板数据方法 179

. diff fte, period(t) treated(treated) cov(bk kfc roys) qdid(0. 9)

(输出略)

可 以 通 过 引 人 选 项 test检 验 协 变 量 的 平 衡 性 ,下 面 的 输 出 结 果 显 示 ,三个
协 变 量 bk、
fkc、
r0ys在 干 预 组 和 控 制 组 之 间 没 有 显 著 的 差 异 ,
因而满足平衡性。

. diff fte, period(t) treatedCtreated) cov(bk kfc roys) test


TWO-SAMPLE T TEST
Number of observations (baseline) :390
Baseline Follow-up
Control : 76 一 76
Treated ; 314 — 314
390 -
t-test at period - 0 j

VariableCs) Kean Control Mean Treated Diff. 丨


t| Pr(|T|>|t|)

fte 20.013 17.069 -2.944 2,43 0 ,01 5 5 “


bk 0.447 0.411 -0.037 0.58 0.5634
kfc 0.158 0.217 0.059 1.14 0.2569
roys 0.224 0.248 0,025 0.45 0.6533
*** p < 0 , 0 1 | p < 0 (0 5 ;* p < 0 . 1

2 . 合 成 控 制 法 在 Stata软件中的实现

Abadie et al. (2010)的 作 者 提 供 了 合 成 控 制 法 的 Stata软 件 包 synth,


①使
用 之 前 要 先 进 行 安 装 ,可 以 使 用 命 令 ssc install synth, replace或 通 过 findit
s y n t h 搜 索 到 程 序 源 后 点 击 安 装 。synth命 令 的 语 法 和 基 本 选 项 如 下 :

synth depvar predictorvars, trunit( # ) trperiod( 并) [counit(numlist)xperiod


(numlist) mspeperiod() resultsperiodO nested allopt unitnames (varname) figure
keep(file) customV(numlist) optsettings]

depvar是 结 果 变 量 ,
predictorvars是 模 型 (8. 2 8 ) 的 可 观 测 变 量 Z ,.,
有两个必选
项,
;^ u n i t ( # ) 用 于 设 定 干 预 组 个 体 ,# 为 干 预 组 个 体 的 代 码 ,
;p e r i o d # 来设定
政 策 干 预 时 点 ,# 为丁。,比 如 政 策 干 预 1 9 8 8 年 通 过 ,
1989年 正 式 实 施 ,
那么,

①作者还提供了 Matlab 和 R 语言的相应程序包,


可以参考http://W eb. S t a n f o r d , edu/〜 jhain/
synthpage. htmU
180 基本有用的计量经济学

策 干 预 时 点 为 1988。剩 下 的 全 是 可 选 项 ,

^ n i t(ru i m H s t )是 选 择 控 制 组 个 体 的
代码列表,
如 果 不 加 该 选 项 ,默 认 数 据 中 除 干 预 组 个 体 外 的 所 有 个 体 都 是 控 制
组个体,
如果不想使用全部的控制组作为备选,
可以利用该可选项来选择想使
用的控制组个体;
xperiodUumlist)设 定 协 变 量 进 行 平 均 的 时 间 段 ,比如想利用
1980— 1 9 8 8 年 的 平 均 值 作 为 协 变 量 的 取 值 ,则 可 加 选 项 xpe.riod (1980(1)
1988),
如 果 不 加 该 可 选 项 ,默 认 利 用 政 策 干 预 时 点 前 的 所 有 数 据 进 行 平 均 ;
m s p e p e r i o d O 用 来 设 定 参 数 估 计 时 使 M S P E 最 小 化 的 干 预 前 时 期 ,如 果 不 加
该可选项,
默 认 参 数 估 计 时 利 用 干 预 时 点 前 所 有 时 期 数 据 使 M S P E 最 小 D re-
sultsperiodO用 来 设 定 产 生 的 图 形 中 所 显 示 的 时 期 ,如 果 只 想 显 示 出 1980—
1990年间的合成情况,
可 以 加 上 选 项 resultsperiod(1980(l) 1990) ,
如果不加该
可选项,
默 认 显 示 数 据 所 有 时 期 ;如 果 加 上 nested选 项 ,程 序 会 在 所 有 对 角 正
定 矩 阵 中 进 行 搜 索 以 找 到 拟 合 更 优 的 权 重 向 量 ;如 果 选 用 了 nested选 项 ,
还可
以 加 上 allopt可 选 项 ,
得 到 更 稳 健 的 估 计 结 果 ,当 然 需 要 更 多 的 计 算 时 间 ;
imit-
names( varname)可 以 将 个 体 代 码 显 疋 为 它 们 的 名 称 ,
varname是包含个体名称
的 字 符 型 变 量 。加 上 可 选 项 f ^ u r e 可 以 输 出 干 预 组 及 合 成 控 制 组 的 变 化 曲 线
图 4eep(file)可 以 将 合 成 控 制 结 果 保 存 到 文 件 file, d t a 中 ,
从而用于后续的分
析,
如果加上该选项,
产 生 的 数 据 file, dta包 括 以 下 几 个 变 量 tim e 是原始数据
的时间变量,
„Y_treated是 原 始 数 据 中 干 预 组 个 体 的 观 测 结 果 ,
_ Y „ s y n t h etic
是 合 成 控 制 组 结 果 ,即 估 计 的 干 预 组 反 事 实 结 果 ,
_ C 0„ N u m b e r 是 控 制 组 名 称 ,
_ W _ w e i g h t 为 对 应 控 制 组 个 体 的 合 成 控 制 权 重 。用 户 可 以 利 用 可 选 项 cus-
tomV(numlist)来 设 定 初 始 的 矩 阵 M ,optsettings可 以 设 定 其 他 的 最 优 化 参 数 。
下 面 我 们 使 用 Abadie et al. (2010)的 数 据 smoking, dta,
评 估 加 州 9 9 法案
对 加 州 人 均 香 烟 消 费 的 影 响 。smoking, d t a 包 含 7 个 主 要 变 量 ,state是 州 代
码,
3 为加州,
其 余 为 3 8 个潜在控制州,
y e a r 为 年 份 变 量 ,cigsale为 人 均 香 烟 销
售量,
lnincome为 对 数 州 人 均 G D P , b e e r 为 人 均 啤 酒 消 费 量 ,
agel5t02 4 为州人
口 中 15— 2 4 岁 人 口 所 占 比 重 ,
retpHce为 香 烟 零 售 价 格 。 图 8. 4 显 示 出 3 8 个
控制州香烟消费的平均值并不是加州人均香烟消费量很好的反事实结果估计。
下 面 使 用 synth命 令 构 造 合 成 控 制 组 。
在 使 用 synth命 令 之 前 ,
首 先 要 告 诉 Stata使 用 的 数 据 为 面 板 数 据 ,
可以使
用 xtset或 tsset命 令 将 数 据 设 置 为 面 板 数 据 ,
然 后 才 能 使 用 synth命 令 。使用
命 令 tsset state y e a r 将 数 据 设 置 为 面 板 数 据 ,
下 面 结 果 显 示 ,state是 截 面 个
体 变 量 (平 衡 面 板 ),
yeai■是 时 间 变 量 ,
从 1970到 2 0 0 0 年 ,
间距为1 年。
第八章面板数据方法 181

, tsset state year


panel variable ;state (strongly balanced)
time variable :year, 1970 to 2000
delta :1 unit

利 用 3 8 个潜在的控制组进行合成控制运算,
beer(1984(.l)1988)表 示 利 用
1984— 1 9 8 8 年 的 人 均 啤 酒 消 费 量 平 均 值 ,协 变 量 lnincorae、retprice、
agel5to24没 有 加 时 间 限 制 ,
它 们 是 根 据 后 面 Xperiod(1980(l) 1988)设 定 的 时
间计算平均值,
另外,
还引人了三年的人均香烟消费量作为协变量,
分 别 是 cig-
sale(1988)、
cigsale(1980)、
cigsale(1975) 。干预组加 州 代 码 为 3 ,
使用必选项
trunit(3),政 策 干 预 期 为 1 9 8 8 年 后 ,
使 用 必 选 项 trperiod(1988) ,并 加 上 可 选
项 fig将 估 计 出 的 合 成 加 州 和 实 际 加 州 人 均 香 烟 消 费 量 用 线 型 图 呈 现 出 来 。
这 里 没 有 限 制 备 选 控 制 组 个 体 以 及 数 据 拟 合 的 时 期 ,因 而 使 用 默 认 的 除 加 州 外
的所有州作为控制组,
并拟合所有时期的结果。
运 行 结 果 如 下 ,首 先 报 告 数 据 准 备 情 况 ,数 据 准 备 成 功 ,会 显 示 干 预 组 个
体、
控制组个体构成,
然 后 报 告 因 变 量 为 cigsale,
在哪些时期上最小化均方预
测误差,
本 例 为 1970— 1 9 8 7 年 ,
接着是预测结果时间段,
本例没有限制时间段,
预 测 时 期 为 全 部 时 间 段 ,即 1970— 2 0 0 0 年 。接 着 报 告 主 要 的 协 变 量 ,
就是在命
令中设定的形式,
并且指出,
如果没有专门设定,
对 应 协 变 量 为 x p e r i o d O 设定
时间段的平均值,
本 例 为 1980— 1 9 8 8 年 ,b e e r 和 三 个 年 份 的 cigsale设 定 了 时
间,
不 受 该 时 期 限 制 的 影 响 。至 此 ,
数 据 准 备 完 成 。接 着 进 入 第 二 阶 段 ,
运用最
优化程序,
估计合成控制权重W ,
这 里 如 果 加 上 了 可 选 项 n e s t e d ^ l l o p t ,运
行 时 间 会 较 长 。优 化 完 成 后 ,
进人第三步,
报 告 结 果 。首 先 报 告 预 测 均 方 误 差 ,
然后报告合成控制权重,
最后报告干预组和合成控制组各变量平均值,
进行平
衡 性 比 较 。如 果 加 上 可 选 项 f ig,则 会 画 出 干 预 组 实 际 结 果 及 合 成 控 制 组 的 预
测结果,
见 图 8.5。

. synth cigsale beer( 1984(1)1988) lnincome retprice agel5to24 cigsale(1988) cig


> sale(1980) cigsale(1975) ,trunit(3) trperiod(1988) xperiod(1980(1)1988) fig

Synthetic Control Method for Comparative Case Studies

First Step :Data Setup

Data Setup successful


182 基本有用的计量经济学

Treated Unit :California


Control Units ;Alabama, Arkansas, Colorado, Connecticut,
Delaware, Georgia, Idaho, Illinois ,IndianaT
Iowa, Kansas, Kentucky, Louisiana, Maine.
Minnesota, Mississippi, Missouri> Montanaf
Nebraska? Nevada,New Hampshire, New Mexico j
North Carolina, North Dakota j Ohio, Oklahoma,
Pennsylvania, Rhode Island, South Carolina, South
Dakota, Tennessee, Texas, Utah, Vermont,
Virginia, West Virginia, Wisconsin, Wyoming

Dependent Variable ;cigsale


MSPE minimized for periods ;1970 1971 1972 1973 1974 1975 1976 1977 1978 1979
1980 1981 1982 1983 1984 1985 1986 1987
Results obtained for periods ;1970 1971 1972 1973 1974 1975 1976 1977 1978 1979
1980 1981 1982 1983 1984 1985 1986 1987 1988 1989
1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
2000

Predictors :beer(1984(1) 1988) lnincome retprice agel5to24


cigsale(1988) cigsale(1980) cigsale(1975)

Unless period is specified


predictors are averaged over :1980 1981 1982 1983 1984 1985 1986 1987 1988

Second S t e p ;Run Optimization

Optimization done

Third S t e p :Obtain Results

L o s s :Root Mean Squared Prediction Error

RMSPE 1.997492
第八章面板数据方法 183

Unit Weights :

Co—No Unit_Weight
Alabama 0
Arkansas 0
Colorado .314
Connecticut .117
Delaware 0
Georgia 0
Idaho 0
Illinois 0
Indiana 0
Iowa 0
Kansas 0
Kentucky ! 0
Louisiana 0
Maine 0
Minnesota 0
Mississippi 0
Missouri 0
Montana 0
Nebraska 0
Nevada .226
New Hampshire 0
New Mexico 0
North Carolina 0
North Dakota 0
Ohio 0
Oklahoma 0
Pennsylvania 0
Rhode Island 0
South Carolina 0
. South Dakota 0
Tennessee 0
Texas 0
Utah .342
Vermont 0
Virginia 0
West Virginia 0
Wisconsin 0
Wyoming
184 基本有用的计量经济学

Predictor Balance :

Treated Synthetic

beer(1984(l)1988) 24,28 23,2213


lnincome 10.07656 9.902686
retprice 89,42222 89.70972
agel5to24 .1735324 ,1747484
cigsale(1988) 90.1 92.8454
cigsale(1980) 120.2 120.6818
cigsale(1975) 127.1 126.3262

如果想将估计结果保存下来,
用于后面的分析,
可以加上选项k e e p U U e ),
估 计 结 果 将 会 保 存 到 file, d t a 中 。可 以 利 用 数 据 fUe.dta的变量_ Y _ t reated和—
Y —synthetic 通 过 命 令 generate te = _Y_treated — _Y_synthetic 得 到 各 期
的政策效应,
然 后 用 命 令 line te _ t i m e 画 出 类 似 图 8. 6 的 图 形 。如 果 想 检 验
估计结果的显著性,
可 以 将 每 个 控 制 组 个 体 单 独 拿 出 来 ,将 它 作 为 伪 控 制 组 个
体替代加州的位置,
将 加 州 放 回 到 控 制 组 ,重 复 上 面 的 过 程 ,
可 以 得 到 另 外 38
个 类 似 于 8. 6 的 图 形 ,
检验加州的政策效应在所有3 8 个控制州伪政策效应中
的分布情况,
如果处于分布的极端,
说明加州的政策效应显著,
相应图形类似于
图 8.7。

3 . 回 归 合 成 法 在 Stata软件中的实现

Hsiao et al. (2012)的 回 归 合 成 法 在 Stata软 件 中 很 容 易 实 现 ,


主要使用回
归 命 令£ ^ reSS。回 归 合 成 法 分 成 两 个 步 骤 ,
第一步,
首 先 分 别 引 人 1 个控制组个
体,
2 个 控 制 组 个 体 ,… ,J V 个 控 制 组 个 体 作 为 协 变 量 进 行 回 归 ,比 如 对 于 引 人
1 个控制组个体作为协变量,
共 需 要 跑 C:v = N 个 回 归 ,
然后从中取记或似然值
最大的模型作为M ( 1 广 ,
•对 于 引 入 2 个 控 制 组 个 体 作 为 协 变 量 ,
共 需 要 跑 =
N ( N — 1 ) / 2 个 回 归 ,同 样 地 ,
从中选择记或似然值最大的模型作为M ( 2 广 ,

此类推,
直 到 得 到 M ( A 0 ' 为 止 。第 二 步 ,
利 用 A I C 或 A I C C 模型选择标准,

M ( i r ,… ,M ( N y 中 选 择 A I C 或 A I C C 最 小 的 模 型 M ( m ) * ,
模 型 M (所广对
第八章面板数据方法 185

应的权重就是最优的合成控制组权重,
相对比较容易实现,
不再详述。
®

第六节总 结

本章介绍了面板数据政策评估的主要方法,
首先介绍了最常用的固定效应
模型,
它 可 以 用 来 克 服 不 随 时 间 变 化 的 混 杂 因 素 造 成 的 内 生 性 问 题 。然 后 介 绍
了双重差分法,
它实际是固定效应模型的一种变化,
但更直观,
适用于政策影响
部分群体的情形,
主要的识别条件是共同趋势假设或不变偏差假设,
它与固定
效应方法一样,
是 可 以 克 服 不 随 时 间 变 化 的 混 杂 因 素 造 成 的 内 生 性 问 题 。合成
控制法和回归合成法均类似于双重差分方法,
但适用于干预组只有一个个体,
往 往 是 地 区 或 国 家 ,两 种 方 法 类 似 ,
均假设所有个体受到时变未观测混杂因素
的共同推动,
使干预组个体与控制组个体之间发生依赖关系,
从这种依赖关系
中 估 计 干 预 组 的 反 事 实 结 果 。两 种 方 法 均 允 许 存 在 随 时 间 变 化 的 未 观 测 混 杂
因素,
从而要求的识别条件比D I D 和固定效应方法弱。

推荐阅读
Angrist and Pischke (2009)第 5 章 对 D I D 和 固 定 效 应 方 法 进 行 了 简 要 介
绍 。关 于 面 板 数 据 固 定 效 应 方 法 更 详 细 的 讨 论 可 以 参 考 Wooldridge(2010) 和
Hsiao(2014)。lmbens and Wooldridge(2009) ,Lechner(2010) 对 D I D 方法进
行 了 很 好 的 综 述 。合 成 控 制 法 可 以 参 考 Abadie and Gardeazabal (2003) ,
Aba­
die et al. (2010)和 Abadie et al. (2015)等 。关 于 回 归 合 成 方 法 可 以 参 考 Hsiao
et al. (2012) ,O uyang and Peng (2015)等 。

① V eg a-BayO (2015)构 造 了 回 归 合 成 控 制 法 的 R 语 言 宏 包 p a m p e ,
熟 悉 R 语言的读者可以使用
p a mpe进行回归合成估计,
在此不再赘述《
第九章断点回归设计

断 点 回 归 设 计 (Regression Discontinuity Design, R D D )最 早 是 由 Thistle-


thwait and Campbell (1960)在 研 究 奖 学 金 对 学 生 未 来 成 绩 影 响 的 时 候 提 出 的 。
因 为 奖 学 金 的 评 比 根 据 以 往 的 学 习 成 绩 ,当 成 绩 满 足 某 一 特 定 门 槛 时 ,
学生将
获得奖学金的资助,
低于该门槛将得不到奖学金,
成绩在门槛附近两边的学生
具有很 好 的 可 比 性 ,因 而 可 以 利 用 奖 学 金 评 比 中 的 成 绩 门 槛 形 成 的 断 点 作 为 一
种 自 然 实 验 来 识 别 奖 学 金 对 学 生 未 来 成 绩 的 因 果 影 响 。但 是 ,
这种方法提出以
后没有引起学术界的关注,
作者也认为断点回归设计适用场景有限,
0 直到经 济 _
学家重新将R D D 策略挖掘出来,
特 别 是 H a h n et al. (2001)对 R D D 策略的识别
条件、
估计方法、
统计推断进行了理论上的证明,
从 而 使 R D D 策略重新焕发生
随后有关R D D 的理论和应用文献大量涌现,
机, 在经 济 学 、政 治 学 及 社 会 学 等
领域广泛应用,
成为目前经验分析中最为热门的一种研究设计策略。
®
本章主要介绍精确断点回归设计(Sharp R D D ) 和模糊断点回归设计(Fuzz-
y 1^ © ) @ 的识 别 条 件和估计方法 ,另 夕卜,
对 弯折回归设计(Regression Kink D e ­
sign) 也会进行简要介绍Q

第一节断点回归设计

断 点 回 归 设 计 的 基 本 思 想 是 一 个 原 因 变 量 或 干 预 ( D )完 全 依 赖 于 一 个 参 考
变量(X),
® 参考变量本身可以对结果有影响,
也可以没有影响,
如果有影响,

设结果变量m 与 参 考 变 量 (x ) 之 间 的 关 系 是 连 续 的 ,
其他可能影响结果的因
素(
z)在断点处也是连续的,
那么,
结 果 变 量 y 在断点处的跳跃就可以解释为原
因 变 量 d 的 影 响 。断 点 回 归 设 计 根 据 干 预 的 分 配 规 则 可 以 分 为 两 类 :精确断点

① Compbeil认 为 K D D 仅 适 用 于 教 育 学 领 域 荷 限 的 场 景 。关 于 断 点 回 归 设 计 的 历 史 和 发 展 可 以
参考 Cook(2008>„
② 有 关 R D D 方法的综述可
Lemieux (2010)、
Keele and Titiunik(2015) ^Skovron and Titiunik(2015) 等 &
③ 模 糊 断 点 回 归 的 称 谓 来 自 于 T r 0chim(1984) 。
④ 英 文 中 称 之 为 running variable、
forcing variable或 assignment variable,
我们称之为参考变貴
为 原 因 变 量 或 千 预 的 分 配 完 全 参 考 这 一 变 ft是 否 超 过 一 个 临 界 值 。
第九章断点回归设计 187

回 归 和 模 糊 断 点 回 归 。精 确 断 点 回 归 是 指 干 预 分 配 完 全 由 参 考 变 量 是 否 超 过
临界值决定,
用公式表示,
D = l ( X > x Q) ,
其 中 1( • ) 为 示 性 函 数 ,条 件 成 立 取
1,
条件不成立取0 ,
x 。是 临 界 值 ,因 而 ,如 果 参 考 变 量 超 过 (或 等 于 )临 界 值 ,

个体接受干预,
D = l , 如果参考变量不超过临界值,
则个体没有被干预,
1) = 0 。
以 Thistlethwait and Campbell (1960)关 于 奖 学 金 的 影 响 为 例 ,如 果 学 生 成 绩
超过门槛则获得奖学金,
如果没有超过门槛则没有得到奖学金,
这种情况下,

否得到奖学金完全由参考变量— 学 生 分 数 是 否 超 过 门 槛 值 决 定 。如 果 干 预
的分配不是完全由参考变量决定的,
干预分配还受到其他研究者看不到的因素
影响,
但是,
断 点 左 右 个 体 接 受 干 预 的 可 能 性 不 同 ,比 如 ,如 果 奖 学 金 的 评 比 除
了以往学习成绩,
还看学生领导能力,
但是领导能力不可测度或者能力测度研
究者无法观测,
那 么 我 们 将 看 到 ,有 些 学 生 成 绩 超 过 了 门 槛 ,
但没有得到奖学
金,
而有些学生成绩低于门槛,
但 得 到 了 奖 学 金 。但 是 总 体 上 看 ,
学生成绩超过
门槛得到奖学金的可能性将高于低于门槛的学生,
这种情况适用于模糊断点回
归 。用 公 式 表 示 ,
在模糊断点回归中,
D = /XT,
e) ,
其 中 了 = 1 ( 乂> 0 :
。),
&是 影
响干预的其他未观测因素,
并且
P r [ D = 1 | T = 1] ^ P r [ D = 1 | T = 0]
即在断点左右个体接受干预的可能性不同。
断 点 回 归 设 计 的 因 果 图 可 以 用 图 9. 1 表 示 。图 9. 1 U )表 示 精 确 断 点 回 归
设 计 是 参 考 变 量 ,比 如 表 示 以 前 的 学 习 成 绩 ,
D 为 干 预 变 量 或 原 因 变 量 ,表
示是否获得奖学金,
D 完全由参考变量X 决 定 ,
Y 是未来的学习成绩,
U 是其他
影 响 学 习 成 绩 的 因 素 ,比 如 学 生 的 能 力 ,
它不但影响未来的学习成绩,
对以前的
学习成绩也会有影响,
但 是 可 能 不 可 观 测 。从 图 9. 1(a)可 以 看 出 ,
混 杂 因 素 C/
产 生 一 条 后 门 路 径 D —X — L7— 不可观测,
但 是 X 是可以观测的,
读者可
能会想到,
我们可以利用后门规则,
以 X 为条件阻断该后门路径,
从而识别因果
路 径 所 反 映 的 因 果 效 应 。问 题 是 当 我 们 以 X 为 条 件 时 ,由 于 参 考 变 量 X
完全决定D ,
从 而 D 不再有变动性,
也 就 无 法 识 别 D 对 Y 的 因 果 影 响 。事实
上 ,由 于 精 确 断 点 回 归 设 计 情 形 下 ,
参考变量完全决定了干预分配,
从而一旦控
制也就没有任何变动性了,
将 独 立 于 任 何 随 机 变 量 ,当 然 也 独 立 于 潜 在 结
果 ,因而 在 回 归 方 法 和 匹 配 方 法 中 要 求 的 识 别 条 件 C I A 在 这 里 显 然 是 满 足 的 ,
即 丨 足 。但 是 共 同 区 间 假 设 0 < P r L D 严 是 不 满 足 的 ,

考变量一旦超过临界值,
所有个体都进人了干预组,
从而
1,
而一旦低于临界值,
所有个体都进人了控制组,
?1"[1), = 1|足 < 0 :
。] = 0 , 因 而 ,
无 法 利 用 回 归 方 法 或 匹 配 方 法 获 得 因 果 效 应 的 估 计 。精 确 断 点 回 归 就 是 利 用
188 基本有用的计量经济学

个体在断点处如果不能精确控制参考变量,
使得在断点附近近似于完全随机化
实验,
从 而 在 断 点 附 近 两 边 的 个 体 具 有 非 常 相 似 的 特 征 ,可 以 利 用 两 边 个 体 结
果 的 差 异 来 估 计 干 预 的 因 果 效 应 。从 图 上 看 ,
如果我们将关注的个体集中在断
点附近的区域,
相 当 于 切 断 了 图 中 的 后 门 路 径 D — X —U — Y ,
从而可以利用随
机 化 实 验 中 的 分 析 方 法 来 进 行 因 果 效 应 的 分 析 ,问 题 是 应 该 选 择 多 近 的 区 域 ,
在后文中我们会进行详细讨论。

(a)精确断点 (
b) 模糊断点

图 9.1 R D D 因果图

图 9. 1(b)描 述 的 是 模 糊 断 点 回 归 设 计 。个 体 的 干 预 状 态 不 完 全 取 决 于 参
考变量,
还 受 到 其 他 未 观 测 因 素 的 影 响 ,干 预 状 态 D 同 时 受 到 T 和 £ 的 影 响 ,
丁 是 完 全 由 参 考 变 量 X 决 定 的 。 同 样 地 ,未 观 测 混 杂 因 素 U 可能
同时 影 响 X 和 结 果 变 量 此 外 ,
影 响 D 的 未 观 测 因 素 s 也 可 能 同 时 影 响结果
变 量 Y 。我 们 关 心 的 是 因 果 路 径 所 体 现 的 因 果 效 应 ,
但混杂了两条后门
路 径 D — 了― X — L7— Y 和 D — Y 的 影 响 。仍 然 用 奖 学 金 的 例 子 ,现 在 假 设
奖学金的评比除了参考以往的成绩X ,
还参考学生领导能力等平时表现e,
但这
一因素研究者无法观测,
•了 表 示 学 生 以 往 分 数 是 否 超 过 临 界 点 ,
会直接影响学
生是否能获得奖学金,
但 与 精 确 断 点 回 归 设 计 不 同 ,它 并 不 完 全 决 定 最 终 的 奖
学 金 分 配 状 态 D ; 未 观 测 因 素 L7表 示 学 生 的 学 习 能 力 ,同 时 影 响 学 生 以 往 的 学
习成绩;
C 和未来的学习成绩Y ,
而 e 可 能 也 会 影 响 个 人 成 绩 。这 时 ,
我们可 以
利 用 后 门 规 则 ,以 X 或 丁 为 条 件 ,可 以 阻 断 后 门 路 径 D — 了― X — 的影
响,
但 是 后 门 路 径 D — e— Y 造 成 的 混 杂 影 响 仍 然 无 法 消 除 。如 果 个 体 不 能 精
确地控制参考变量X ,
在 断 点 附 近 近 似 于 完 全 随 机 化 实 验 ,了 近 似 于 完 全 随 机
化分配的,
在 断 点 附 近 两 边 的 个 体 具 有 较 好 的 可 比 性 ^与 精 确 断 点 回 归 设 计 不
同的地方在于,
断 点 两 边 的 个 体 与 实 际 接 受 的 干 预 状 态 并 不 一 致 ,即 在 断 点 右
边的个体不一定接受干预,
断 点 左 边 个 体 也 有 可 能 接 受 干 预 。不 妨 假 设 断 点 右
边个体接受干预的可能性更大,
奖学金的例子中,
分数超过临界点则获得奖学
金 的 可 能 性 会 更 高 。但 是 ,
获得奖学金的个体和没有获得奖学金的个体即使在
断 点 附 近 也 可 能 不 可 比 ,比 如 获 得 奖 学 金 的 个 体 很 多 可 能 在 平 时 表 现 上 获 得 了
第九章断点回归设计 189

加分,
而 未 获 得 奖 学 金 的 学 生 在 平 时 表 现 上 可 能 会 差 一 些 。但 是 ,
对于断点附
近 群 体 ,以 往 成 绩 是 否 超 过 断 点 ,即 变 量 r ,
会 对 最 终 是 否 获 得 奖 学 金 d 有着重
要的影响,
或密切相关,
但了在断点附近近似于随机化分配的,
从而使得:
r成
为 D 天 然 的 工 具 变 量 。在 图 9. 1 ( b ) 中 ,当 我 们 将 样 本 限 制 在 断 点 附 近 较 小 的
领域内时,
近似相当于固定了 x 值 ,
从 而 阻 断 了 后 门 路 径 D — T — 入一C7— r 造
成的混杂影响,
但 是 另 一 条 后 门 路 径 o —e— y 造 成 的 混 杂 影 响 仍 然 存 在 ,当第
—条后门路径的影响消除之后,
了就成为d 的一个有效的工具变量,
从而可以
识 别 出 D 对 Y 的 因 果 影 响 。至 于 如 何 选 择 断 点 附 近 较 小 的 领 域 ,我 们 后 文 进
行 讨 论 。下 面 ,
我们讨论断点回归设计的基本识别条件。

假 设 9. 1 ( 断 点 假 设 ) 假设极限
p+ = I i m E [ D ,-丨X,. = - ] , p ~ = limE[D,- | X, -= jc]

存在,
并 且 其 中 U.=IX乃,
s ) ,T,. = l(X,.>:r。),
如 果 是 精 确 断 点 ,则
D t= Tr, 为倾向指数,
表示参考变量
为 x 的 个 体 进 入 干 预 组 的 概 率 ,如 果 是 精 确 断 点 ,则 = 1, = 0 ,即断点右
侧 个 体 都 进 入 干 预 组 ,左 侧 个 体 进 入 控 制 组 。®

假 设 9. 1 是 说 个 体 分 配 概 率 在 临 界 值 左 右 有 跳 跃 ,
存 在 断 点 。如 果 是 精 确
断点,
那 么 个 体 干 预 状 态 以 与 断 点 T,.完 全 依 从 ,
在右侧均进入干预组,
在左侧
均 进 入 控 制 组 。如 果 是 模 糊 断 点 ,
则存在着不完全依从的现象,
从 而 D,.乒 r ,,

时 我 们 要 求 断 点 左 右 的 分 配 概 率 存 在 间 断 ,比 如 要 求 断 点 右 侧 个 体 接 受 干 预 的
概率高于断点左侧的概率。

假 设 9. 2(连 续 性 假 设 } X,.= 工] 、
E[YU 丨
X , = 工] 是 x 的 函 数 ,并且
在A 处 是 连 续 的 ,即
limE[Y;/ | X ;— x 0 s'] = limE[Yj7 丨X,. = x 0 — s ] , j = 0,1
C— 0 £~*0

如果只关心干预组的平均因果效应(
ATT),
那么只需要£[Y。
, IX ;= X ] 在 A 处
连 续 。通 常 假 设 两 潜 在 结 果 的 条 件 期 望 函 数 均 是 连 续 函 数 ,只 假 设 在 一 点 连 续
而 在 其 他 点 不 连 续 是 比 较 奇 怪 的 ,因 而 ,
应 用 中 通 常 假 设 在 所 有 点 上 连 续 (Im-
bens and Lemieux, 2008) 。

①当然也可以反过来,
右侧个体均进入控制组,
而 左 侧 个 体 均 进 人 干 预 组 ,即 有 > + = o ,
/>- = i ,只
要满足断点左右的分配概率存在间断就满足该基本假设,
但正向性依从的假设往往更符合现实》
190 基本有用的计量经济学

假 设 9. 3 ( 局 部 随 机 化 假 设 ) 假 设 在 断 点 附 近 近 似 于 完 全 随 机 化 实 验 ,即
( Y u ^ o i ) ALD, | X,- € 沢 办 ) (9 .1 )
其 中 5 U Q) = ( x 。一5 ,
文。+ 幻 为 々 的 <5邻 域 ,
冗> 0 为 任 意 小 的 正 数 。

局部随机化假设要求个体不能精确控制或操纵参考变量使之超过临界值,
在奖学金的例子中,
学 生 对 学 习 成 绩 具 有 一 定 的 控 制 能 力 ,学 生 知 道 未 来 奖 学
金会根据学习成绩进行分配,
从 而 努 力 学 习 以 超 过 临 界 成 绩 ,当 然 对 于 成 绩 很
好 或 成 绩 很 差 者 ,即 离 断 点 很 远 的 学 生 存 在 着 很 大 的 差 异 ,
但是在断点附近,

绩是否能够超过临界点,
可能存在着运气的成分,
在 断 点 附 近 ,比 如 在 百 分 制 成
绩中,
超过临界点1 分和低于 临 界 点 1 分的学生学习能力等特征可能非常相
似,
1 分差异可能是偶然的成分或运气的成分造成的,
但 是 高 于 临 界 点 1 分的就
获得了奖学金,
而 低 于 1 分 的 就 没 有 拿 到 奖 学 金 。只 要 学 生 不 能 精 确 地 控 制 成
绩,
那么,
在临界点附近的学生干预状态的分配就近似于完全随机化实验的结
果 。正 是 基 于 这 一 点 ,Lee and Lemieux (2010)认 为 R D D 策 略 更 加 透 明 ,
估计
结果更加令人信服,
他 们 指 出 R D D 是 随 机 化 实 验 的 近 亲 , 他们还比较分析了
R D D 策略和随机化实验的相似性以及与其他识别方法的差别,
读者可以参考
他 们 的 原 文 。如 果 个 体 能 够 精 确 地 控 制 参 考 变 量 ,比 如 学 生 可 以 通 过 找 老 师 或
其他方式修改自己的成绩,
这样在断点附近两边的学生就可能出现较大差异,
那么局部随机化假设将不再满足,
从 而 R D D 策 略 失 效 。局 部 随 机 化 假 设 是
R D D 策 略 有 效 的 关 键 假 设 之 一 ,可 以 利 用 参 考 变 量 分 布 在 断 点 处 是 否 连 续 进
行判断,
M c C m r y (2008)提 出 了 一 种 基 于 非 参 数 的 密 度 函 数 检 验 方 法 ,
后文会进
行介绍。

定 理 9 . 1 ( H a h n et al.,2001,
定 理 2) 如 果 断 点 假 设 9. 1 、
连 续 性 假 设 9. 2
和局部随机化假设9.3成立,
则有

Elz; | X, - - ^Z^p- (9.2)

其中 = Y U ~ Y 0;
为 个 体 因 果 效 应 ,"(x) Y; = Y 0i + r ;D ;…十=
|X ;= x ] ,
,[T = lim 0

定 理 9. 1 说 明 如 果 干 预 分 配 概 率 在 临 界 点 处 有 间 断 ,
但总体而言潜在结果
是参考变量的连续函数,
并且个体没有能力对参考变量进行精确的操纵,
从而

① 原 文 是 “… ,namely that R D designs are particularly compelling because they are close cousins of
randomised experiments,?CLee and Lemieux, 2010,p. 285) 。
第九章断点回归设计 191

在 断 点 局 部 近 似 于 完 全 随 机 化 实 验 ,那 么 ,我 们 可 以 识 别 出 在 断 点 处 的 平 均 因
果 效 应 。如 果 是 精 确 断 点 ,
断点完全决定干预分配状态,
则 >+ = i,/r=o,
从而
在 断 点 处 的 平 均 因 果 效 应 为 £[>,.丨兄= 工。] = ;
«+ - /^ ,即 在 断 点 处 结 果 平 均 值
的 跳 跃 可 以 解 释 为 干 预 的 影 响 。下 面 我 们 给 出 该 定 理 的 证 明 :
证明考虑在断点左右观测结果的期望值变化,
对 于 0<s<^,
E [ Y i | X, = X o + s ] - E[Y; 1 = X 。 一 e]
- E l Y 0i + r,D; | X, = x 。+ e] — £ [ Y 。
,-十 | X, = _r。一 e]
二 { E [ Y 0l- I X ; = a + s ] — I Xi = x o - e ] }
+ {E[r,D; | X, = x 0 + e ] - E [ r ;D,- | X ; = x 0 - e ] } (9.3)
其中第一行等号利用观测结果与潜在结果之间的关系
y. - d ;y 1; + a — d ;) y 0!- = y 0;+ ( y ,;- v 0i) D ;
当 £— 0 ,
根 据 连 续 性 假 设 9. 2 ,(9. 3)第 二 行 第 一 项 将 趋 近 于 0 ,即
lim{E[y0;| X, = x 。+ e ] — E [ Y 0;1 X,.= 工。一 e]} = 0 (9. 4)
£—0
考 虑 (9. 3)第 二 项 ,利 用 局 部 随 机 化 假 设 9. 3 ,X,.eS(x。), 有 it,.JLD,.|X,.,

E [ r (D ; | X ; - x 。+ s ] -E[r,.D,. | X ( = x 0 - s ]
= K[ r ; | X ; = xo + e ] E [ D f | X ; - x 0 + e ]
— E[r,. | = x , - e ] E l D i | X,- = ^ 0 - e ]
两 边 取 极 限 ,由 连 续 性 假 设 9. 2 得
\[m{ElriD 1 \ X ; = x a + e] - | X, - -r0 ~ e ] }
t-*-0
~ lim{E[ri | X; = xQ + e ] E [ D ;丨X, = x 。+ e ] }
e—0
— lim{_E[r/ 丨Xi = x 0 一 e]E[A. 1 X; = x 。一 e]}
e— 0

~ Elr ;丨X, = x 0]/?+ — Elzj | Xi = x0~\p~


= _E[r,.丨X ; = 工。
] 厂) (9.5)
对 (9. 3)两 边 求 极 限 ,
并 利 用 (9. 4)和 (9. 5 )得
" 十一/•£_ = Wmfiixo + £) 一 \\mfj.{xo - e)
e-^0 e-*0

^ E^Ti | X { = xo^ip^—p~)
从而,

E[ri | X, = a:0] = p + ^ ,~

定 理 9. 1 依 赖 于 局 部 随 机 化 假 设 ,即 假 设 在 断 点 附 近 干 预 变 量 的 分 配 近 似
于完全随机化实验,
从 而 排 除 了 个 人 根 据 预 期 收 益 进 行 的 自 选 择 问 题 。这一 假
192 基本有用的计量经济学

设有可能不成立,
尤其是在模糊断点情形下,
断点可以激励一部分个体进入干
预组,
但由于其他未观测因素的影响,
或一些个体出于自身原因,
即使参考变量
超过断点,
也可能选择不接受干预。相反地,
一些个体尽管在断点左侧,
仍然可
能有激励选择进人干预组,
这样,
我们可能就没有办法保证在断点附近,
干预的
分配独立于潜在结果,
个体有可能根据潜在的预期收益决定是否接受断点给予
的激励,
这种可能的自选择行为使断点左右的个体不具有可比性,
从而局部随
机化假设可能不满足。在精确断点情况下, 如果个体不能精确地控制参考变
量,
局部随机化假设满足。但在模糊断点情况下, 局部随机化假设往往不能满
足,
下面, 针对模糊断点识别引人另外的假设替代局部随机化假设。
定 义 D,(:r)表示参考变量为 1 个体的干预状态, 表
示参考变量在断点右侧时个体 / 的参与状态。同样地, 定 义 Z \ . ( x ) = A U ),
•r<Cr。表示参考变量在断点左侧时个体的参与状态,

Dj —
D0i (x) x <. x 0

假 设 9.4( 独立性假设) 假设潜在结果 ^ . ,


^.,
^ ^ ,
认 ,^)在 断 点 附
近独立于参考变量 X ,,即
(y.^yo,), d u( j :
) , d 0,(x) xx,-, x,- e ^ 0) (9 .6 )

独立性假设要求断点独立于所d 的潜在结果, 断点本身不会受到潜在结果或个


人选择的影响, 断点是外生的。用 乃 = 1 ( 兄> ^ ) 表示断点的分配, 独立性假设
9. 4 实际上说明所有潜在结果独立于断点的分配, 即 T ,.的分配近似于完全随机
化实验。独立性假设仍然要求个体不能完全精确控制参考变量,
从而在断点附
近左右 T , 分配近似于完全的随机化实验。

假 设 9. 5( 单调性假设) 假设断点对所有个体的影响方向是相同的,
这里
我们假设正向单调性成立,
即存在 3 > 0 ,
使得对于任意 ■xeSOr。
),有
D]i (x) ^ D 0;
(x) (9.7)
定 理 9.2 (Hahn et al.,2001, 定 理 3) 如果断点假设 9. 1 、
连续性假设
9. 2 、
独立性假设 9, 4 和单调性假设 9. 5 成立,

limELr, | DuU ) > D 0,(x)] 二 ":一 (9. 8)


P —P
证明考虑(
9. 3)第二项,
对于0 < £ < 3 ,
EltiDi | X ;— x 0 + e ] — EiviD ;| X := x 0 — e]
= E[r,D1;(^0 十e) | X; = x0 + e ] — £[r,D0,(x0 — e) 丨X; = ^ — e]
第九章断点回归设计 193

= ECr/DiiC^o + £ > ] — E l z iD ^ ix o 一 e)]

= E[r,.(Dw (x0 + e ) — D 0lCx0 一 e))]


= f[ r ; | D u (x0 + e ) > D 0,(x0 一 e)]
. Pr[Di ;
(x 0 + e ) > Doi(x0 一 e)]
第一行利用潜在结果的定义,
第 二 行 利 用 独 立 性 假 设 9. 4 ,
第四行利用单调性假
设 9. 5 ,
其中,
Pr[Di;
(a:
c + c ) > D 0;
(jc0 — e)]
= £ [ D w O 。+ e ) — A j / O 。一 e)] .
= E [ D U (x0 + e) | X,- - x 0 + e ] - E [ D 0;U 。一 e) [ X,- - x 0 - s ]
— ElDi | Xi = x 0 + s ] — K [D, | Xi -= x 0 — s]
第 二 行 利 用 独 立 性 假 设 9. 4 ,
第三行根据原因变量观测结果与潜在结果的定义。
因而,
lim{E[Y,. | X,. - x o + e D - E C Y , 丨X,. - x 0 - £ ] }
e—0

= U m { E [ y 0;I X, ^ jc0 + e] — E [ Y 0i I X, = x 0 — e]}

+ limE[r;| Di,(x0 + e ) > D 0,(x0 — e)]


t—0

• {E[D,- | X; = x 0 + e ] — E [ D ;| X, = x 0 — s]}
根 据 连 续 性 假 设 9. 2 ,
上 式 等 号 右 边 第 一 项 为 零 ,因 而 ,
limECr, | D u (x0 + e ) > D 0i(x0 — e)]
£—0
limE[y; | X, = A + e] — limE[y; | X,- = x 。一 e]
— t— 0___ __________________ e—0 _____________
l i m E [ D ;| Xi = 工0 + £] — limE[D,- [ X ;= x 0 — e]
e—0 e—0

^ "+ —
P +- P —

(9. 8)右 边 实 际 上 是 W a l d 估 计 测 度 (lmbens and .Angrist, 1994) ,因 为 断 点 独


立于潜在结果,
并 且 假 设 9. 1 保 证 第 一 阶 段 存 在 ,因 而 ,
这里断点相当于个体干
预 变 量 的 工 具 变 量 。在 单 调 性 假 设 下 ,
断点和个体选择变量可以将个体分成三
种类型:
对 于 ■ rGSUo),D u ( x ) ^ D 0i(x) = l 为 总 是 参 与 者 ,
无论个体参考变量
是否超过临界点,
个 体 都 会 接 受 干 预 ;D 1;( 1 ) = 1 ) 。
;(:
1:
) = 0 为从不参与者,
无论
个体参考变量是否超过临界点,
个体都不会接受干预;
以 ,(x) = 1 ,D 0;-(a:
)= 0
为依从者,
个体参考变量超过临界点就接受干预,
不超过临界点就不接受干预。
定 理 9. 2 说 明 如 果 千 预 分 配 概 率 存 在 断 点 ,
潜 在 结 果 在 断 点 处 连 续 ,断 点 独 立
于潜在结果,
并且断点对个体选择的影响是同方向的,
那么,
可以用断点作为干
194 基本有用的计量经济学

预变量的工具变量,
并 且 可 以 识 别 出 在 断 点 上 依 从 者 的 平 均 因 果 效 应 。定理
9. 2 实 际 上 是 第 七 章 的 L A T E 定 理 在 断 点 回 归 设 计 情 形 下 的 应 用 。
再 举 个 熟 悉 的 例 子 ,比 如 考 察 研 究 生 教 育 对 个 体 收 人 的 影 响 ,
这是经典的
教育收益率问题,
可 以 利 用 推 免 资 格 作 为 一 种 断 点 回 归 设 计 。根 据 学 生 的 综 合
成 绩 是 否 超 过 一 个 临 界 点 来 确 定 推 免 资 格 ,从 而 使 得 在 断 点 附 近 的 学 生 比 较 相
似, 但是学生最终是否选择读研究生, 还取决于其个体的一些未观测因素, 这些
未观测因素会影响个体的选择,
也可能影响到个体的收人,
从而是未观测的混
杂因素,
直接利用读研和未读研学生的比较显然有问题E 如果成绩临界点是由
学校官方给定的,
可能满足外生性的假设,
断点独立于学生个体的潜在结果,

且 推 免 资 格 显 然 影 响 个 体 的 读 研 行 为 ,因 而 断 点 可 以 作 为 是 否 读 研 的 工 具 变
量 。那 些 无 论 是 否 有 推 免 资 格 都 会 读 研 的 学 生 为 总 是 参 与 者 ,
那些无论是否有
推免资格都不会读研的为从不参与者,
而 那 些 有 资 格 会 读 研 ,没 有 资 格 就 不 读
研 的 学 生 是 依 从 者 。如 果 读 研 的 因 果 效 应 存 在 个 体 异 质 性 ,
那么,
工具变量估
计 量 所 识 别 出 的 是 依 从 者 的 平 均 因 果 效 应 ,即 在 断 点 附 近 ,
那些有资格就读研,
没有资格就不读研的学生的平均因果效应。

第二节断点回归设计的图形分析

断点回归设计与其他识别方法不同的地方在于其设计的透明性和清晰性,
根据上文的理论分析,
;R D D 的 基 本 识 别 条 件 是 干 预 分 配 概 率 在 临 界 点 会 有 跳
跃,
结果变量在临界点也会有跳跃,
而其他影响结果的变量在临界点没有跳跃,
从 而 可 以 将 结 果 变 量 的 跳 跃 归 因 为 干 预 变 量 的 影 响 。因 而 ,
在进行具体的实证
分析之前,
通 常 可 以 画 出 干 预 分 配 概 率 与 参 考 变 量 之 间 的 关 系 图 ,判 断 是 适 用
精 确 断 点 回 归 还 是 模 糊 断 点 回 归 。然 后 ,
可以画出结果变量与参考变量之间的
关系图,
看 看 结 果 变 量 在 断 点 处 是 否 有 跳 跃 ,另 外 也 可 以 检 测 在 参 考 变 量 的 其
他位置是否也存在着跳跃,
从 而 作 为 一 种 证 伪 检 验 ,即 如 果 在 非 断 点 位 置 ,
发现
结果变量有跳跃,
则说明可能是其他因素引起的,
那么,
我们就怀疑在断点处的
跳跃可能混杂了其他因素的影响,
则 间 断 回 归 设 计 就 可 能 存 在 问 题 。另 外 ,为
了 验 证 间 断 回 归 设 计 的 有 效 性 ,如 果 存 在 其 他 影 响 结 果 的 可 观 测 协 变 量 ,
则可
以 画 出 这 些 协 变 量 与 参 考 变 量 之 间 的 关 系 图 ,检 验 它 们 在 临 界 点 处 是 否 有 间
断,
如果其他协变量在间断点处有跳跃,
那么,
结果的跳跃有可能是这些协变量
造成的,
就不能完全将结果的跳跃归因为干预变量的影响,
从而,
R D D 会存在
问题,
相反,
如果其他协变量在断点处是连续的,
则 R D D 结 果 更 为 可 信 。最 后 ,
第九章断点回归设计 195

为了保证R D D 设计的有效性,
个体不能精确控制参考变量,
一种图形检验方法
是 画 出 参 考 变 量 的 分 布 图 ,如 果 个 体 不 能 精 确 控 制 参 考 变 量 ,
其分布在断点处
应该是连续的,
如果发现参考变量集中于断点的一侧,
则个体可能可以精确控
制参考变量。
Lee(2008)分 析 了 美 国 各 地 区 众 议 员 选 举 中 在 位 党 在 竞 选 中 是 否 具 有 优
势 。美 国 具 有 两 大 党 派 ,一 党 所 获 选 票 份 额 如 果 超 过 竞 争 对 手 ,
那么,
该党在该
地区将成为在位党,
Lee以民主党所获选票份额与共和党所获选票份额的差额
作为参考变量,
间断点为0,
只要上次竞选中,
参 考 变 量 大 于 临 界 点 0 即意味着
民主党在位,
否则共和党在位。由于两党选票份额差额不可能大于1,
作者将参
考 变 量 限 制 在 断 点 左 右 0. 5 范 围 内 ,因 为 0. 5 之 外 的 样 本 点 较 少 。结 果 变 量 为
未来竞选中民主党所获得的选票份额,
各 党 的 竞 选 经 费 、候 选 人 质 量 等 是 竞 选
选 票 份 额 的 其 他 协 变 量 。 由 于 民 主 党 份 额 超 过 共 和 党 ,民 主 党 就 成 为 在 位 党 ,
不 存 在 不 依 从 的 情 况 ,因 而 Lee(2008)利 用 精 确 断 点 回 归 分 析 在 位 党 派 的 在 位
优 势 。下 面 ,
我们利用他的例子,
探讨断点回归中的图形分析。

1. 结 果变量与参考变量关系图

首先可以画出结果变量与参考变量之间的关系图,
看看结果变量是否在间
断点处跳跃,
但避免直接利用原始数据画图,
原始数据中噪音太多,
可以通过适
当 的 平 均 后 再 画 图 。通 常 可 以 将 参 考 变 量 划 分 为 一 系 列 区 间 ,区 间 的 宽 度 相
同,
并 且 保 证 断 点 左 边 和 右 边 分 别 在 不 同 的 区 间 里 ,避 免 将 处 于 不 同 干 预 状 态
的个体 混 在 同 一 区 间 。然 后 将 所 有 区 间 里 个 体 结 果 变 量 的 平 均 值 与 区 间 的 中
点进行描点,
可以得到结果变量相对于参考变量的关系图,
可以通过多项式分
别 对 断 点 两 边 的 点 进 行 拟 合 ,同 时 将 拟 合 的 曲 线 描 在 图 上 。
具体地,
选 择 某 一 带 宽 h 相 应 断 点 左 右 所 划 分 的 区 间 数 分 别 为 K 。和 ,
目 的 是 构 造 一 系 列 区 间 々= 1 ,
… ,尺 二 仏 + 仏 ,
其中
bk — — (K0 — 々+ l)/i
区间々中个体结果的平均值为:
— 7 N
Y, = 士 < 6 , +1) (9.9)
队 i=i
其 中 N k 为区间々中个体的数量,
可以表示为:
®
N
Nk= (9.9)

①该数量可以用于检测个体是否可以精确控制参考变显,
参 见 M CCrary(2008) 。
196 基本有用的计量经济学

):
ti
C0P U
3S

HC
CO
MS

I:
足 0>
c

Democratic Vote Share Margin of Victory,Electiont Democratic Vote Share Margin of Victory, Electioi
Note: Replicate figure 6 of Lee Note: Replicate figure 9 of Lee and
and L e m i e u m x (2010) L e m i e u m x (2010)

(a) 选 票 份 额 (b) 成功概率

图 9 . 2 结 果 变 量 与 参 考 变 量 关 系 图 ,带 宽 为 0 . 0 2 ( 5 0 个 区 间 )

图 9 . 2 选 择 0, 0 2 的 带 宽 ,
将 参 考 变 量 分 成 了 5 0 个 区 间 ,图 中 的 点 为 每 个
区间中结果变量的平均值,
横 坐 标 对 应 于 相 应 区 间 的 中 点 ,图 中 曲 线 是 利 用 4
阶多项式分别对断点左右的点拟合而得的。
® 图 9. 2(a)显 示 ,
结果变量在断点
处有一个非常明显的跳跃,
在 断 点 右 侧 ,民 主 党 选 票 份 额 超 过 50 % ,
而在断点左
侧 ,民 主 党 选 票 份 额 为 4 5 % 左 右 ,
相差8 % 左右,
并且在参考变量的其他位置没
有 发 现 明 显 的 跳 跃 。如 果 将 下 一 次 民 主 党 竞 选 成 功 的 概 率 作 为 结 果 变 量 ,
断点
则更加明显,
图 9.2(b)显 示 ,断 点 右 侧 民 主 党 竞 选 成 功 的 概 率 超 过 60% , 而断
点左侧民主党竞选成功的概率仅有2 0 % ,
相 差 接 近 4 0 % ,即 如 果 民 主 党 为 在 位
党,
那 么 民 主 党 在 下 一 次 众 议 员 选 举 中 成 功 的 概 率 会 提 高 40% , 在参考变量的
其他位置没有发现明显的跳跃。
结果变量与参考变量之间的关系图可以帮助我们观测结果变量在临界点
处 是 否 出 现 间 断 .,
另外,
也可以帮助我们检测在参考变量的其他位置结果变量
是 否 出 现 间 断 。正 是 由 于 这 一 点 ,
使 得 R D D 方法与其他识别方法相比,
更加清
晰透明,
避 免 研 究 者 在 研 究 设 计 上 有 意 或 无 意 的 主 观 偏 差 ,从 而 使 R D D 的识别
结 果 更 加 可 信 。在 L ee(2 0 0 8 ) 选 票 的 例 子 中 ,
是精确断点回归设计,
如果是模
糊断点回归设计,
还可以画出干预分配状态与参考变量之间的关系图,
检验干
预 分配概率是否在断点处跳跃。当 然 ,
在 画 这 类 图 形 时 ,面 临 着 应 该 划 分 多 少

① 具 体 地 ,
拟合方程为I = Q t (又4 — .rc V 十 其 中 沁 为 区 间 是 的 中 点 ,即 兄 .= (6, +
第九章断点回归设计 197

区间以及每个区间应该多宽的问题,
如果区间过窄,
可能无法消除噪音,
从而无
法将断点位置的跳跃呈现出来,
如果区间过宽,
则可能造成较大的偏差,
从而扭
曲 跳 跃 的 幅 度 。一 种 简 单 的 方 法 是 通 过 采 用 不 同 的 带 宽 ,
试 画 相 应 的 图 形 ,检
验 相 应 的 间 断 点 跳 跃 是 否 仍 然 存 在 ,如 果 存 在 ,说 明 断 点 跳 跃 可 能 是 稳 健 的 。
另 一 种 更 为 正 式 的 方 法 是 利 用 交 叉 验 证 方 法 (cross validation) ,同 时 权 衡 估 计
偏差和估计精度,
选择一个最优的带宽,
下文将对该方法进行详细讨论。
结果变量与参考变量关系图、
干预变量与参考变量关系图使我们看到结果
变量和干预变量在断点处的行为,
但是为了建立结果变量与干预变量之间的因
果关系,
我 们 还 需 要 其 他 影 响 结 果 变 量 的 因 素 在 断 点 处 连 续 变 化 ,因 而 ,
我们可
以画出其他协变量与参考变量的关系图。

2. 可 观 测 协 变 量 与 参 考 变 量 关 系 图

为 了 检 验 连 续 性 假 设 9. 2 是 否 成 立 ,
我们可以采用与上一节同样的方法,
画 出 可 观 测 协 变 量 与 参 考 变 量 之 间 的 关 系 图 。L ee(2008)用 以 前 民 主 党 在 众 议
员席位竞选中的选票份额来反映民主党的竞争力,
相应的关系图如下:

图 9 . 3 前一期民主党选票份额与参考变量关系图

图 9. 3 显 示 ,民 主 党 候 选 人 的 总 体 竞 争 力 在 临 界 点 处 并 没 有 明 显 的 跳 跃 ,
从 而 说 明 民 主 党 竞 选 前 的 竞 争 力 是 连 续 的 。如 果 还 可 以 观 测 到 其 他 的 协 变 量 ,
比如竞选经费,
也可以画出类似的图形检验是否在断点处连续。当然,
我们期
望其他未观测因素在断点处也是连续的,
但 无 法 进 行 检 验 ,只 能 利 用 那 些 所 有
198 基本有用的计量经济学

可 能 影 响 结 果 的 可 观 测 因 素 进 行 检 测 ,以 期 望 未 观 测 因 素 也 是 符 合 连 续 性 要 求
的 。如 果 发 现 有 些 协 变 量 在 临 界 点 处 有 间 断 ,
那么,
说 明 R D D 设计可能存在问
题,
结 果 变 量 在 断 点 的 跳 跃 有 可 能 是 由 这 一 观 测 因 素 的 跳 跃 造 成 的 ,而 不 完 全
是干预的影响。

3 , 参考变量分布图

R D D 的 另 一 个 关 键 识 别 条 件 是 个 体 不 能 精 确 地 控 制 或 操 纵 临 界 点 ,如果
个体能够精确控制断点,
那 么 可 能 使 得 断 点 左 右 个 体 分 布 差 异 很 大 ,因 而 ,
可以
通过画出参考变量分布图进行检验,
如果参考变量分布在断点处是连续的,

明个体不能精确地控制断点,
如果参考变量在断点处不连续,
则说明个体可能
可以操纵断点,
从 而 使 得 断 点 左 右 个 体 具 有 较 大 差 异 。Lee(2008) 的 参 考 变 量
分 布 图 见 图 9. 4 。图 9. 4 显 示 ,
参 考 变 量 分 布 在 断 点 0 处 并 没 有 明 显 的 跳 跃 ,当
然,
图 9 . 4 只 是 一 种 直 观 的 显 示 ,图 形 的 模 式 与 带 宽 的 选 择 也 有 关 系 ,
McCrary
(2008)提 出 了 一 种 参 考 变 量 分 布 在 断 点 处 是 否 连 续 的 非 参 数 统 计 检 验 方 法 ,

以 使 用 McCrary(2008 ) 的 密 度 检 验 统 计 量 进 一 步 检 验 参 考 变 量 是 否 在 断 点 处
有跳跃。

Democratic Vote Share Margin of Victory, Electiont


Note: Replicate figure 16 of Lee and L e m i e u m x (2010)

图 9 . 4 民主党选票份额边际分布图

经过上面三种图形的分析,
如果发现结果变量在临界点有跳跃,
其他协 变
量在临界点没有明显的跳跃,
并且参考变量分布在断点处也没有明显的间断,
那么,
我们基本可以建立起干预变量与结果变量之间的因果关系,
将结果变量
第九断点回归设计 199

的跳跃归因为干预的影响。当 然 ,
具 体 的 因 果 效 应 需 要 进 一 步 的 估 计 。但 是 ,
利用断点回归设计,
图 形 分 析 往 往 是 具 体 估 计 之 前 的 第 一 步 ,图 形 分 析 可 以 帮
助 了 解 所 研 究 的 问 题 是 否 适 用 断 点 回 归 设 计 ,以 及 适 用 于 哪 种 类 型 的 断 点 回 归
谖计。

第三节断点回归设计的估计

R D D 的 估 计 方 法 主 要 有 边 界 非 参 数 回 归 (nonparametric regression at the


boundary),
局 部 线 性 回 归 (Local Linear Regression,L L R ) 和 局 部 多 项 式 回 归
(Local Polynomial Regression, L P R ) ,由 于 非 参 数 回 归 在 边 界 上 收 敛 速 度 比 较
慢,
在 断 点 处 的 估 计 并 不 理 想 ,H a h n et al. ( 2 0 0 1 ) ,lmbens and Lemieux
(2008), Lee and Lemieux (2010) 等 建 议 采 用 非 参 数 局 部 线 性 回 归 方 法
C L L R ),
从 而 避 免 在 边 界 上 收 敛 速 度 慢 的 问 题 。下 面 我 们 分 别 对 三 种 估 计 方 法
进行介绍。

1. 边界非参数回归

以精确断点回归的估计为例,
要估计的因果效应参数为断点处的平均因果
效应,
®
] 二
rfTDE = E [ Y U - Y 0i | X, = _r。 (9. 10)
可 以 利 用 标 准 的 非 参 数 回 归 估 计 和 假 设 我 们 使 用 核 K U ) 满足

\K(u) = 1 ,则 在 点 i 处 的 非 参 数 回 归 函 数 可 以 写 成 :

u ix) = ---^ ------------------

① 在 定 理 9.1的假设下,
rlrE= E l n | Xi -= xol = E [Yu I X« =
= Hm ELYi ;| Xi = xa + e l -
办 ] —E [ Y 0i I X, ~ x0]
I X,- = ^ 0 - e ]
c-*0 c—0
= li m E [ y ( ] Xi — xo+e] —lim_E[YV I X( = + e]
e—0

其中第三行利用连续性假设,
确地控制参考变量,
第 四 行 利 用 局 部 随 机 化 假 设 。只 有 满 足 局 部 随 机 化 假 设 ,


左右两边个体结果的分布才能与总体潜在结果的分布相同, 也可以写成
个体无法完全精

lim£[y1; |X = x0+e,D, = l] = limE[Yf I X, = _r。+e, D,. = 1]



e—0 r-»0
lim £[Y o, IX ,.= 九 一e ,
D, = 0 ] = lim £ [ Y ; | X , = j - 0 - e , D f - 0 ]
200 基本有用的计量经济学

2 Y/ . K i i X i - x V h )
jj^ ( 工) " - X' ^ \ ---------------------
2_jK((X,-j:
)/h)

其 中 a 为带宽^
比如,
利 用 矩 形 核 函 数 K U ) = l/2 • K U I< 1 ) ,相 应 估 计 量 可 以 写 为 :
N
2 X - • l(x K X; < JC)
K ⑴ = ^ ----------------------
—h ^ X ;<C. x)
i=\
jV

2 > , . . l ( x < X , < ^ + /1)


々+ (x) = -------------- --------
' ^ ] l ( x < X i< x + h^
i=l
则 R D D 估计量为:
f ^ K = 々+ (x0) - p r (x0) (9.11)
对 于 矩 形 核 函 数 ,R D D 估 计 量 实 际 上 是 断 点 左 右 /^范 围 内 观 测 结 果 平 均 值 之
差 ,即 断 点 右 边 [xo,
x 。+ / 0 结 果 变 量 Y 的 平 均 值 与 断 点 左 边 [〜 一/i,巧 ]结 果 变
量 Y 平 均 值 之 差 。® 图 9. 5 是 利 用 计 算 机 模 拟 的 数 据 画 出 的 ,
带 宽 为 1 的矩形
核估计对应于图中的两条水平线段,
而 两 线 段 间 的 差 距 就 是 R D D 估 计 量 。® 如
果 在 带 宽 A 范围内满足局部随机化假设,
我们完全可以使用第三章分析随机化
实验数据的方法,
上述矩形核非参数估计量实际上是随机化实验中的两组结果
平 均 值 之 差 。但 问 题 是 局 部 随 机 化 假 设 要 求 在 断 点 附 近 很 小 的 范 围 内 成 立 ,

现实中,
断点附近很小的范围内,
往往无法得到足够的样本点,
从而无法得到较
高 精 度 的 估 计 。 比 如 图 9. 5 中 如 果 将 带 宽 限 制 在 0 . 0 1 的 范 围 内 ,
几乎没有样
本点,
也 就 无 法 估 计 出 两 组 结 果 之 差 。另 外 ,如 果 参 考 变 量 X 本 身 也 对 潜 在 结
果有影响,
那么断点两边的个体必然不相似,
至少它们的特征X 会有所不同,

管 断 点 附 近 这 种 差 异 可 能 非 常 微 小 。正 如 在 完 全 随 机 化 实 验 中 一 样 ,即使干预
分配是完全随机化的,
两组个体在一些观测特征方面仍然可能存在着一定的差
异 。尽 管 这 些 差 异 不 是 系 统 性 的 ,
但在一次随机化实验中,
这些差异却是可能

①对于其他核函数,
对带宽范围内的样本点施加了不同的权重,
往往是离断点越近的样本点权重
越大, 而 离 断 点 越 远 的 样 本 点 权 重 越 小 。但 是 非 参 数 估 计 在 内 点 偏 差 是 o u 2) , 但在边界点上造成的偏
差是O U ) ,
收敛速度慢, 偏差较大, 往往不建议使用.
© 数 据 生 成 过 程 为 K = 2 + 2 A + 2 X , . + 30,X.. + u,,
其中 D, = 1(X,.> 3 ) , X ; 〜 N ( 3 , 2 ) ,
《,.〜 N ( 0 ,
1),
样 本 数 为 100。
第九章断点回归设计 201

出 现 的 。在 随 机 化 实 验 中 ,
可以利用回归调整方法降低协变量差异造成的估计
偏 差 。在 这 里 也 是 一 样 ,
为了避免局部平均可能造成的偏差,
可以利用线性回
归针对参考变量的差异进行偏差调整,
这就是局部线性回归方法

running variable, X
Note: Data is generated by Y = 2 + 2 D + 2 X + 3 D X + u ,u 〜 N (0,
1), X ^ N (3,2),D = 1 ( X > 3 ) , Obs^lOO

图9 . 5 矩形核函数R D D 估计量示意图

2. 局部线性回归

由于非参数回归在边界点上的表现不好,
在断点回归设计的估计中,
通常
建议利用局部线性回归方法( L L R ) ,
L L R 方 法 可 以 避 免 边 界 问 题 (H a h n et al. ,
刚才利用矩形核实际上是对断点两边h 范围内个体进行局部
2001)。简 单 而 言 ,
平均,
现 在 分 别 在 断 点 左 右 两 边 /i范 围 内 利 用 线 性 回 归 进 行 拟 合 ,
利用回归调
整 参 考 变 量 不 同 而 造 成 的 可 能 偏 差 。无 论 真 正 的 潜 在 结 果 与 参 考 变 量 之 间 是
什 么 样 的 函 数 形 式 ,即 使 是 高 度 非 线 性 的 ,
只 要 带 宽 /i足 够 小 ,
线性回归函数都
将是条件期望函数非常好的近似,
这 一 回 归 调 整 在 参 考 变 量 X 也会影响结果变
量 的 时 候 尤 其 重 要 。具 体 地 ,利 用 断 点 左 右 h 范 围 内 的 样 本 分 别 估 计 下 列 两 个
线性回归模型:
N / V _ \
m m 'Z l (Y i - a l - b l • ( X .— 工。) )2 • K \ A i ~ X° • 1 (X ; < ^ 0)
urh> \ h J

和 — a r- 6 r • (X, - x 0))2 • k ( X ,^ - X° )^ 1(X,- > a :


0)
'夂 二 、 h J
其 中 K U ) 为核函数,如果是矩形核, 上述两个方程可以写为:
202 基本有用的计量经济学

min I (y ,.-山一匕 • ( X , - ^ ) ) 2 . l U o - h ^ X ^ X o ) (9.12)


ar l/t /-i
N
和 min^^CY,- 一 ar —br • ( X ;— x 。))
2 • l(x0 X{ ^ x 0 h) (9, 13)

估计上述两个方程得到的拟合值为:
jT (xo) = a t + b i O 0 — 工0) = d,

和 (x0) = d/ + brixo — x 。) = aT
从而得到在断点处的平均因果效应其实是两条局部线性回归曲线在断点处的
截 距 之 差 ,即
Tate = ( 工o) _ ( 工。)~ a r — a t (9. 14)
另外,
也 可 以 利 用 下 面 的 回 归 方 程 得 到 断 点 处 平 均 因 果 效 应 的 直 接 估 计 (Im-
bens and Lemieux, 2008 ) :

m min ^~]l (x0 ~~ h Xi ^ xo h)


a^b,ZrY

• (Y, - a-6(X,- - x 0) - rD, - /D, (X,- - x 0) )2 (9. 15)


其中系数r 的回
I— 归估
4 ^-1 IM 计 量 就 是 Par
■ tde ◦
-ATE 。图 9. v6 显 示 利 用 局 nr^Ai
IJ/〜 部线性 回
i_i- » 归 y方 法 进 行 的
—i^

估计。

30
2
o
olqJE

.2
1A8^30
I
o

running variable, X
Note: Data is generated by Y 二2 + 2 D f 2 X + 3 D X + u ,u〜N ( 0 ,
1), X 〜N (3,2),D - l ( X > 3 ) ,0bs=100

图 9. 6 RDD估计的局部线性回归法

如 果 还 存 在 着 其 他 的 协 变 量 Z , 在 上 面 的 回 归 方 程 (9. 15) 中 也 可 以 引 入 这
第九章断点回归设计 203

些可以观测的协变量,
这些协变量在断点处应该连续,
通常,
是 否 引 入 协 变 量 Z,.
不 会 影 响 R D D 的识别策略,
如 果 样 本 限 制 在 非 常 靠 近 临 界 点 x 。的 范 围 ,
那么
近 似 有 乙 是 否 引 人 协 变 量 乙 对 估 计 结 果 不 会 有 影 响 。但 是 ,
如果使用的样本并不是离临界点足够近,
那么引入协变量乙可以消除由于这
些 协 变 量 可 能 造 成 的 部 分 偏 差 。如 果 协 变 量 乙 是 影 响 潜 在 结 果 的 重 要 因 素 ,

么,
引 人 乙 将 可 以 提 髙 参 数 的 估 计 精 度 。 引 人 协 变 量 Z,.,
R D D 估计量可以直
接通过估计下列模型得到:
N
min

• ( Y ;一 a — b(X ;— ^:
o) _ r_D; — y D ,•(X ;— ) — ^ Z, )2 (9. 16)

3 . 局部多项式回归

如 果 断 点 附 近 样 本 量 太 少 ,为 了 得 到 相 对 比 较 精 确 的 参 数 估 计 ,
有时我们
不得不选择较大的带宽,
带宽较大时,
线性近似所造成的偏差可能就会增大,

时局部多项式回归可以捕捉结果变量与参考变量之间的髙阶非线性关系,
可以
得到更好的拟合,
从 而 降 低 估 计 偏 差 。与 局 部 线 性 回 归 类 似 ,
局部多项式回归
也是利用断点左右的样本分别估计下列模型:

njin客 ( Y , U K ⑵ 1(:,. < 0 ) (9.17)

和 m i n S d > 0) (9. 18)


br ,= 1 J
其中, = —工。是 标 准 化 后 的 参 考 变 量 ,临 界 点 变 为 0 ,6;= (b0j,b:j, … ,
&)', j = …,
4 / 。相应的 R D D 估 计 量 为 :

X-ATE = (工。) ~ h ~ ( 2 。) = k r — bol (9.19)


也可以利用下列模型直接估计R D D 估 计 量 :
N
min^)(Y,- — b'x — D, • c x Y K i x j K ) (9. 20)
h“
其 中 6 = ( 6 。,6i,… ,
bp) ,c=(r,7i ?72 ,…,
八 ),
参 数 r 的回归估计量就是相应的
R D D 估 计 量 。图 9. 7 是 利 用 4 阶 多 项 式 对 模 拟 数 据 进 行 的 估 计 ,
带宽增加为
2,估 计 结 果 与 局 部 线 性 回 归 相 似 。
204 基本有用的计量经济学

^ 20

running variable, X
1),X 〜N (3,2 ) ,D=1 ( X > 3 ) ; 0 b s=100
Note: Data is generated by Y =2+2D +2X +3D X +u, u〜N (0,

图 9 . 7 局 部 多 项 式 回 归 估 计 RDD估计量

4 . 模糊断点回归设计的估计

在模糊断点回归中,
我们需要估计一个比率,
见 (9. 8 ) 。仍 然 可 以 采 用 上 文
提到的三种方法,
不过需要针对结果变量和干预变量分别对断点进行回归,

个 回 归 得 到 的 参 数 的 比 率 就 是 模 糊 断 点 回 归 估 计 量 。下 面 以 局 部 线 性 回 归 为
例,
另外两种方法类似。
首先利用结果变量对断点进行局部线性回归,
得 到 估 计 量 fy :

m in
Wy » ,
Ty •yy

(y,- - a y - by(X{- X o ) -.ry T,- — 7y 丁 (X ,. — 工◦) ) 2 (9.21)


其 中 T ;= l ( X f> A ) ,
然后利用原因变量对断点进行局部线性回归,
得到估计量

• (Y,- - a D - b D ( X , - x 0) - to T, - /dT.CX,-^))2 (9. 22)


相应的模糊断点回归估计量为:

(9. 23)

l m b e n s a n d L e m i e u x ( 2 0 0 8 ) 指出,
如 果 上 面 (9 . 2 1 ) (9. 2 2 ) 米用矩形核,
并且米
第九章断点回归设计 205

用相同的带宽,
那么,
模糊断点回归估计量也可以用T,作 为 认 的 工 具 变 量 ,

用两阶段最小二乘法估计下列模型得到:
Y ;^ a + tD ; j3(X, —x 0) ST;
( X ;— x 0) + e; (9. 24)
其中第一阶段回归为:
Di — a0 + t dT ;+ Zjd ( Xj — x Q) + TdT, ( X,- —x 0) +

5.带宽选择和滞后阶数’

R D D 的参数估计依赖于一个重要的参数— 带 宽 /^的 选 择 ,
带宽比较小,
断点左右的个体特征差异较小,
估 计 偏 差 较 小 。但 是 ,
带宽小意味着断点左右h
范 围 内 的 样 本 容 量 可 能 较 小 ,估 计 量 的 方 差 较 大 ,估 计 精 度 较 低 。如 果 带 宽 较
大,
断点左右A 范围内的样本容量较大,
估计量方差较小,
估计精度提高,
但是
大的带宽,
意味着有些个体特征差异较大,
相似度降低,
从 而 估 计 偏 差 增 大 。因
而,
带 宽 的 选 择 存 在 着 估 计 偏 差 和 估 计 方 差 的 权 衡 。Ludw i g and Miller (2007)
和 lmbens and Lemieux(2008)提 出 了 一 种 选 择 最 优 带 宽 的 交 叉 验 证 方 法 (cross
validation).交 叉 验 证 的 基 本 思 想 是 在 所 有 可 能 的 带 宽 下 ,
选择使拟合的均方
误 差 最 小 的 带 宽 。具 体 地 ,
对 于 给 定 带 宽 /I,
在 >r处 的 回 归 估 计 为 :
(di (x) x <C x 0
[ar{x) ,x ^
其 中 & ( 工)、
匕(_r)分 别 对 应 于 (9. 12)和 (9. 13)的 解 只 是 把 其 临 界 点 -ro
换 成 I 。为 了 模 拟 R D D 在 边 际 上 的 回 归 估 计 ,在 断 点 左 侧 只 估 计 4 (:r) ,
右侧
只 估 计 并 且 在 估 计 时 ,
不 将 边 界 点 工 = 兄 包 括 在 样 本 中 ,即 只 利 用 x - h
<Xj<x+h, x = 估 计 回 归 模 型 ,然 后 利 用 估 计 的 回 归 参 数 得 到 在
工= 兄 处 的 拟 合 值 / K 兄 )。交 叉 验 征 标 准 为 :
1 N
C V Y(h) = (9.25)

相 应 的 最 优 带 宽 是 最 小 化 上 述 标 准 ,即
= arg m i n C V y (A)
it
利用交叉验证方法搜索最优带宽时,
不 一 定 利 用 全 部 样 本 进 行 搜 索 ,可以
根据参考变量将样本限制在断点左右一个相对较小的范围内,
从而可以提高搜
索 速 度 。用 ^ 表 示 参 考 变 量 在 断 点 左 侧 的 8 分 位 数 , 表示参考变量在断点
右 侧 的 1 _ 5 分 位 数 。可 以 将 最 优 带 宽 搜 索 限 制 在 范 围 之 内 ,即
1 N
/i.cvpt = arg min ^ X ;^ x ^ s)
206 基本有用的计量经济学

比 如 Ludwig and Miller (2007)在 计 算 最 优 带 宽 时 ,


将样本限制在断点左右5 %
的 数 据 范 围 内 。对 于 模 糊 断 点 回 归 ,
R D D 估 计 量 (9. 8 )分 子 分 母 需 要 进 行 两 次
最优带宽选择,
可 以 采 用 类 似 于 (9. 25)的 交 叉 验 证 标 准 估 计 分 母 的 最 优 带 宽 ,
1 jV
C V D (/i) - 士 2 瓜 (9. 26)
^ i= l

Imbens and L e m i eUx(2008)建 议 分 子 分 母 采 用 相 同 的 带 宽 ,因 而 ,


可以选择结
果方程和选择方程两个最优带宽中最小的那个作为共同的最优带宽,

Acv = min{arg m i n C V y (/i) , arg m i n C V D (h) }
h h h
一 般 而 言 ,当 干 预 分 配 的 依 从 比 率 较 高 时 ,干 预 变 量 的 回 归 方 程 会 比 较 平
坦,
选 择 方 程 的 最 优 带 宽 往 往 会 比 较 大 ,因 而 ,
可以直接将结果方程的最优带宽
作 为 共 同 的 最 优 带 宽 (Lee and L e m i e u x ,2010)。关 于 最 优 带 宽 的 选 择 ,I m ­
bens and Kalyanaraman(2012)和 Calonico et al. (2014a) 对 交 叉 验 证 方 法 作 了
进一步的改进,
后 文 我 们 称 为 I K 最 优 带 宽 和 C C T 最 优 带 宽 。 图 9. 8 是 利 用
Lee(2008)数 据 画 出 的 交 叉 验 证 标 准 函 数 图 ,
C V 标 准 选 择 的 最 优 带 宽 为 0. 2 8 。

Grid of bandwidth (h)

图 9 . 8 最优带宽的交叉验证标准函数

在利用局部多项式进行R D D 估计时,
还 需 要 选 择 滞 后 阶 数 h 可以采用常
用 的 模 型 选 择 标 准 ,比 如 A I C 标 准 、
A I C C 标 准 或 B I C 标 准 。一 般 而 言 ,
带宽越
大,
需 要 选 择 的 滞 后 阶 数 越 大 ;带 宽 越 小 ,
滞 后 阶 数 越 小 。表 9. 1 使 用 图 9. 5 的
模拟数据,
利用全部样本估计多项式模型,
可 以 看 到 A I C 标 准 和 B I C 标准都是
选 择 阶 数 1 ,即 局 部 线 性 回 归 是 合 适 的 模 型 。事 实 上 ,
数据生成过程就是线性模
型,
这也证明两种标准都能选择出正确的模型。
第九章断点回归设计 207

表 9 . 1 局部多项式阶数选择

阶数 样本容量 自由度 A IC BIC

1 100 4 3 0 0 .4775 3 1 0 .8982


2 100 6 303. 3535 318. 9845
3 100 8 3 0 5 .9032 3 2 6 .7446
4 100 10 3 0 9 .1177 3 3 5 .1694

6 . 模型设定 检验

模型估计完成后,
可 以 进 行 下 列 模 型 设 定 检 验 ,以 判 断 估 计 结 果 的 稳 健 性 。
(1)协变量连续性检验,
也 称 为 伪 结 果 检 验 (pseudo outcome)。以 协 变 量
作为伪结果,
利用与前面相同的方法,
检验相应的R D D 估计量是否显著,
如果
显著说明这些协变量不符合连续性假设,
上 文 的 R D D 估计量可能存在问题。
( 2 ) 参 考 变 量 分 布 连 续 性 检 验 。如 果 参 考 变 量 分 布 连 续 ,
意味着在断点处
个体没有精确操纵参考变量的能力,
局部随机化假设成立,
从而保证断点附近
左 右 样 本 能 够 代 表 断 点 处 的 总 体 。可 以 采 用 McCrary(2008)提 出 的 方 法 进 行
检验,
将 参 考 变 量 划 分 成 不 同 的 区 间 并 计 算 各 区 间 中 的 个 体 数 量 (9. 9 ) ,
如果个
体能够操纵参考变量,
我 们 将 能 观 测 到 断 点 左 右 个 体 数 量 有 较 大 差 别 ,比如很
多个体通过操纵到了断点的右侧,
那 么 ,在 断 点 右 侧 的 区 间 中 个 体 数 量 可 能 将
大大超过断点左侧区间中个体的数量,
利用上文的带宽选择和曲线拟合方法,
可以检验在断点处N k 是否存在跳跃。
( 3 ) 伪 断 点 检 验 (pseudo cutoff p o i m ) 。在 参
左 右 两 侧 中 点 位 置 作 为 伪 断 点 ,利 用 同 样 的 方 法 估 计 R D D 估 计 量 ,
我们知道在
伪 断 点 干 预 效 应 为 零 ,如 果 发 现 伪 断 点 的 R D D 估 计 量 不 为 零 ,
则说明我们的
R D D 设计可能有问题,
可能混杂了其他未观测因素的影响,
得到的因果效应可
能是由其他未观测混杂的跳跃造成的,
而不完全是干预的影响。
( 4 ) 带 宽 选 择 的 敏 感 性 检 验 。选 择 不 同 的 带 宽 对 R D D 估 计 量 进 行 重 新 估
计,
检 验 估 计 结 果 是 香 有 较 大 的 变 量 ,如 果 差 异 较 大 ,
尤其是影响方向有变化,
则 说 明 R D D 设计可能有问题。

7 . 小 结 : R D D 方法应用步骤

前面讨论了 R D D 方 法 的 基 本 理 论 和 估 计 方 法 ,
简单总结一下应用步骤:
( 1 ) 图 形 分 析 。首 先 ,
画出结果变量与参考变量之间的关系图,
如果是模糊
断点,
再画出原因变量与参考变量的关系图,
呈现结果变量和原因变量在断点
208 基本有用的计量经济学

处的行为,
为研究设计提供直观的依据。
( 2 ) 因 果 效 应 估 计 。分 别 利 用 断 点 左 右 的 数 据 估 计 线 性 回 归 模 型 或 多 项 式
模型,
可 以 使 用 矩 形 核 函 数 加 权 (Imbens and Lemieux, 2008)或 三 角 核 函 数 加
权(
Calonico et al. 2014a),
其实,
核函数选择对估计结果没有太大影响;
也可以
直 接 利 用 (9. 15)估 计 R D D 参 数 。如 果 是 模 糊 断 点 ,可 以 用 断 点 作 为 原 因 变 量
的工具变量,
估计方程(
9. 24) ,
并且可以直接使用两阶段最小二乘法标准误差
进 行 统 计 推 断 (Imbens and Lemieux, 2008)。
( 3 ) 稳 健 性 检 验 。主 要 进 行 上 文 提 到 的 各 种 稳 健 性 检 验 。首先是协 变 量 连
续性检验,
可以画出协变量与参考变量的关系图,
检 测 在 断 点 处 是 否 连 续 。其
次,
参考变量分布函数连续性检验,
也 可 以 画 出 参 考 变 量 的 分 布 图 。再 次 ,
伪断
点检验,
看看在其他位置,
R D D 估 计 量 是 否 显 著 。最 后 ,
可以选择不同的带宽,
检 验 R D D 估计结果是否稳健。

第四节弯折回归设计

断点回归设计是利用结果变量和原因变量在断点处的跳跃来识别因果效
应,
如 果 其 他 因 素 在 断 点 处 没 有 跳 跃 ,我 们 就 可 以 将 结 果 变 量 的 跳 跃 归 因 为 原
因 变 量 的 因 果 影 响 。有 些 时 候 ,结 果 变 量 和 原 因 变 量 往 往 是 连 续 变 量 ,
并没有
明显的跳跃,
那么,
R D D 方 法 就 无 法 识 別 因 果 效 应 。但 是 ,如 果 结 果 变 量 和 原
因 变 量 在 断 点 处 存 在 弯 折 (kink),而 在 其 他 位 置 都 是 平 滑 的 ,
并且其他影响因
素在断点处也是平滑的,
那么,
我们仍然可以使用与R D D 类似的方法,
将结果
变量在断点处的弯折归因为是由原因变量在断点处的弯折造成的,
这种识别策
略 称 为 弯 折 回 归 设 计 (Regression Kink Design, R K D ) 0® 弯 折 回 归 设 计 实 际
上是结果变量和原因变量相对于参考变量导数的断点回归设计,
在弯折回归设
计中,
结果变量和原因变量在断点处没有跳跃,
是连续的,
但是它们相对于参考
变量的导数在断点处有跳跃,
R K D 就是利用断点处的导数变化来识别因果效
应 。下 面 简 单 介 绍 D o n g (2014)提 出 的 概 率 弯 折 回 归 和 Card et al. (2015b) 提
出的更一般化的弯折回归设计。

1 . 概率弯折回归

D o ng(2014)考 察 了 一 个 二 元 的 原 因 变 量 在 断 点 处 不 是 间 断 性 的 跳 跃 ,
而是

① Nielsen et al. (2010)首 次 将 这 种 方 法 命 名 为 弯 折 回 归 设 计 。


第九章断点回归设计 209

弯 折 (kink)的时候.,
在 满 足 平 滑 性 假 设 下 ,她 证 明 可 以 利 用 弯 折 识 别 因 果 效 应 。
另外,
她 还 进 一 步 给 出 了 存 在 跳 跃 或 / 和 弯 折 的 时 候 更 一 般 的 识 别 方 法 。 因为
D ong(2014)主 要 关 注 二 元 的 原 因 变 量 ,
从而干预分配概率在断点处存在弯折,
为 与 Card et al. (2015b)的 弯 折 回 归 设 计 (R K D ) 相 区 别 ,
我们称之为概率弯折
回归设计( P R K D )。
假 设 一 个 二 元 的 原 因 变 量 D ,.,
其状态分配依赖于参考变量足是否超过临
界 点 x 。,
但断点并不完全决定干预分配状态,
还有其他未观测因素可能影响干
预 的 分 配 ,因 而 ,
与 模 糊 断 点 回 归 设 计 的 情 景 相 似 。令 = 表示断
点,
定 义 潜 在 的 原 因 变 量 为 D h C x ) 和 D Qi.(:
c),
从 而 T,. = l 时 ,
D,. = D H (_r) ,即参
考 变 量 为 的 个 体 ,
观 测 到 的 原 因 变 量 就 是 D n C r ) 。 同 样 地 ,T , = 0 日牝参
考 变 量 为 的 个 体 ,
观测到的原因变量就是D 。
,.(
x ), D; = jD。
,.(
_r)。断点右
侧 个 体 的 反 事 实 原 因 变 量 为 断 点 左 侧 个 体 的 反 事 实 原 因

变 量 力 D u (x0) = H m D 1;( x ) 0 为 方 便 起 见 ,
将 两 个 潜 在 原 因 变 量 简 写 为 D h.,

^ ,
观测原因变量以- 乃 队 + ^ ^ - 乃 沁 。
,-。
在断点附近,
断 点 和 原 因 变 量 将 个 体 分 成 四 类 (Angrist et al.,1996):总是
参 与 者 八 = { 纟:仏 = 1 ) 。
,_= 1},
从 不 参 与 者 /\/={/:1)1,=1)。
,.二0 } ,
依 从 者 (:= { ^ :
D。
;二0 ,D 】
,.= 1 } ,
叛逆者 Defiers = { i:D 。
,.= 1 ,
D u = ◦}。用 {A ,iV,
C, Defi-
ers}表 示 四 种 类 型 个 体 的 集 合 。
潜 在 结 果 变 量 仍 然 用 7 1,.,
1^ 表 示 ,观 测 结 果 为 ;
^-1),.1,. + ( 1 _ 0 , . ) 7 。
,-。
仍然定义
" ( x ) = E [ Y ; | Xi = x ] p U ) = ELD, I X = x]
力 、 d p (x)

Bx p ⑴ = -aT~
/i+ = lim"(*z) yT =

//+= (x) }/~ — \imfx ix)


n 0
— Yimp(x) p~ — Ximpix)

/ / + = limpf(x) p'~ = lim p' ix)

定 义 9. 1 如 果 则称干预分配概率p
尹0 , U 、在 断 点 々 处跳跃
叩 ),
如 果 / / + - 々/_关0 ,则 称 干 预 分 配 概 率 f O ) 在 断 点 x Q处 弯 折 (
kink) 。

下 面 的 讨 论 没 有 特 别 指 明 ,均 限 制 在 断 点 附 近 一 个 较 小 的 邻 域 内 ,即
210 基本有用的计量经济学

兄e u 。

假 设 9.6(平 滑 性 假 设 } 对于X , 和 / x ( 2 )是连续可导


的,
/ X0(_r| 抑 和 / x O :
) 是参考变量的密度函数。

平 滑 性 假 设 9. 6 要 求 个 体 不 能 精 确 控 制 参 考 变 量 ,与 R D D 不 同 ,
这里不 但
要 求 参 考 变 量 在 断 点 处 连 续 ,而 且 要 求 其 导 数 也 要 连 续 ,从 而 在 增 量 水 平 上 也
不能有操纵的可能,
这 一 要 求 比 R D D 更 强 。 Dong(2014) 证 明 如 果 满 足 平 滑 性
假 设 9. 6 和 单 调 性 假 设 9. 5 ,
那么所有潜在结果在断点处将连续可微。

引 理 9.1 (Dong, 2 0 1 4 ,
引 理 1) 如 果 单 调 性 假 设 9, 5 和 平 滑 性 假 设 9. 6 成
立,
那么, >= 0 ,
1 和 ?1*[少丨兄= ^ ] ,
蜇 = { 八,
^/,
0 } 在断点工 0
处连续可微。

单 调 性 假 设 9. 5 排 除 了 叛 逆 者 ,引 理 9. 1 说 明 在 平 滑 性 假 设 9. 6 下 ,
所有
类 型 个 体 的 潜 在 结 果 和 分 配 机 制 都 是 连 续 可 微 的 。引 理 9 . 1 的 条 件 可 以 识 别
平均因果效应,
假 设 9. 6 的 要 求 比 引 理 9 . 1 的 要 求 更 强 ,它 可 以 用 于 识 别 因 果
效 应 的 分 布 。如 果 只 关 心 平 均 因 果 效 应 ,
那么,
可以直接假设引理9,1成立,

需要限制参考变量分布连续。

引 理 9 . 2(Dong,2 014,
引 理 2) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立,

/?+— 厂 = P r [ C 丨X = :r。] , v ( p +~~p~) (9.27)
如 果 />+— #0,

r= (9. 28)
P+~ P

引 理 9. 2 实 际 上 复 制 了 前 面 定 理 9. 2 的 结 果 ,
在 断 点 处 存 在 跳 跃 、单调性
假设和平滑性假设下,
可 以 识 别 出 断 点 处 依 从 者 的 平 均 因 果 效 应 Y。
,'|
C ,X ;
= 工0] 。

定 理 9. 3 (Dong, 2014,
定 理 1) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立 ,则

n = 尹 r[C ^ 二 ^
OX
(9. 29)

假设不存在跳跃,
仅 存 在 弯 折 ,即 p+ —p- = 0 , 关0,

r 二 " /+— 广 (9. 30)
r 广一广
第九章断点回归设计 211

定 理 9. 3 说 明 ,
如果在断点处不存在跳跃,
而是存在弯折,
我们仍然可以利
用 弯 折 识 别 出 依 从 者 的 因 果 效 应 。直 观 理 解 ,如 果 看 到 结 果 变 量 在 断 点 处 弯
折,
干预分配概率也在断点处弯折,
而其他影响结果变量的因素在断点处平滑,
不存在弯折,
并且个体不能完全控制断点,
那么,
我们可以将结果变量的弯折归
因为原因变量的弯折造成的,
从 而 可 以 识 别 出 断 点 处 的 平 均 因 果 效 应 。基 本思
想与断点回归设计相似,
不过断点回归是利用断点处的跳跃,
概率弯折回归是
利用断点处的弯折。
Dong(2014)进 一 步 证 明 ,
如果不确定在断点处是跳跃还是弯折,
仍然可以
利用断点识别出依从者的平均因果效应。

定 理 9.4(Dong,2 0 1 4 ,
定 理 2) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立,
假设存在一个断点,
或弯折,
或 同 时 存 在 断 点 和 弯 折 ,对 于 任 意 非 零 权 重 序
列 w n,
满 足 limw„ = 0 ,

- - 叫 (//+ — / / 一) n-, x
p+—p ~ - \ ~ w„ (p /+— p '~) .

如 果 只 存 在 断 点 " / _ = 0 ,p /+ —/ / - = 0 , ( 9 . 3 1 )退 化 为 断 点 回 归 估
计 量 (9 . 2 8 h 如 果 只 有 弯 折 ,
/ =0,
则 (9.31)退 化 为 概 率
弯 折 回 归 估 计 量 (9. 30)。如 果 同 时 存 在 断 点 和 弯 折 ,
利用两者得到的估计量为
(9.31)。一 般 而 言 ,
两者都存在时,
可以利用断点回归估计量得到近似的估计。
如 果 平 均 因 果 效 应 在 断 点 附 近 较 小 的 邻 域 内 为 常 数 ,即 对 于 工 6 仏 x 。),
有 / =
d E d . - Y 0;1C ,
X,. =.r]/dx = 0,那 么 ,
断点和弯折可以识别出同样的因果效应
参 数 ,即
r= = d
p+—p— p ,Ar~ p '~
关于权重的选择,
可 以 利 用 自 助 法 (bootstrap)选 择 使 估 计 量 标 准 误 差 最 小 的 权
重,
也可以用两阶段最小二乘估计量选择合适的权重。
下面讨论上述识别条件与工具变量法之间的关系,
与 R D D 估计一样,
考虑
下列局部线性回归模型:
Yi = a + 6 (X i — 尤。)+ rD f + e,. (9.32)
其中a、
6、r 为系数,
e,为 可 能 与 D , 相 关 的 误 差 项 。正 如 模 糊 断 点 回 归 设 计 中 断
点 T , 可以作为D ; 的工具变量,
在 这 里 乃 和 弯 折 x 。)都 可 以 作 为 A 的
工具变量,
因 而 ,因 果 效 应 参 数 (9. 31)可 以 利 用 两 阶 段 最 小 二 乘 法 进 行 估 计 。
第一阶段回归为:
212 基本有用的计量经济学

D, = A T,- + 爲了,.(
兄 一 ) + 呙(X ; — 如 )+ 爲 + ?1; (9. 33)
其 中 所 有 /?为 估 计 系 数 ,
将 (9. 33)代 人 (9. 32)得 结 果 变 量 简 化 式 :
Y,- 二 7. T, + 7 2T, ( X , - - x 0) + 7 3( X , . - x 0) + 7 . ! + ^ , (9.34)
其中 7i= 呙r ,72=啟 r ,y3= a + p 4r ,各 = r $ h +e,.。 由 (9. 33)和 (9. 34)得
p +— p- = h , p !+— p r—= 曰2 ■
> (9. 35)
}T — 7i ? {j^—{T = /2. (9.36)
因而,
标 准 的 断 点 回 归 设 计 估 计 量 为 (引 理 9. 2 ) :

r = ^- (9.37)
A
概 率 弯 折 回 归 设 计 估 计 量 为 (定 理 9. 3 ) :

f= ^ (9.38)
A
断 点 和 弯 折 同 时 存 在 时 ,同 时 利 用 断 点 和 弯 折 作 为 干 预 变 量 的 工 具 ,
两阶段最
小二乘估计量为:

x= + C9. 39)
h + ttjs2
其 中 ,& 是 下 列 权 重 的 样 本 形 式 :
= C o v ( D ;,
Z 2* )
切 — covcd ;, z r )
D - 是 £>,.对 (足.一:
^ ) 的回归残差,
2 : 是 T , 对 (X,.—a ) 的 回 归 残 差 ,忍 是
^ 乂广^ ^ 对^ —^ “ 的 回 归 残 差 。

2 . 弯折回归设计

Card et al. (2015b) X a r d et al. (2016)提 出 的 弯 折 回 归 设 计 (R K D )的基本


思 想 类 似 于 D ong(2014)的 概 率 弯 折 回 归 设 计 ,
不 过 ,Card et al. (2015b)考虑
的 是 连 续 的 原 因 变 量 ,而 非 二 元 变 量 。 他 们 考 察 的 结 果 方 程 具 有 更 一 般 的
形式:
Y ;= yiD^X^U^ (9.40)
其 中 Yi是结果变量,
D,.是 一 个 连 续 的 原 因 变 量 ,
X , 是参考变量,
U 是影响结
果 的 其 他 未 观 测 因 素 ,函 数 火 以 ,兄 ,
U,.)是 潜 在 结 果 方 程 ,如 果 D ,.是 二 元 变
则 1,.二 3'(1,
量, 1/,.),Y,i= y { 0 ^ X t,Ui)a 定 义 :
足 , y,(么 工 ,《) = 办 (^/,
^:,《)/
dd, 假 设 边 际 效 应 _y2 (山 ,
m )是 所 有 参 数 的 连 续
函数。
首 先 讨 论 精 确 弯 折 回 归 设 计 (Sharp R K D ) ,与 精 确 断 点 回 归 设 计 一 样 ,

第九章断点回归设计 213

因变量完全由参考变量尤决定,
用 公 式 表 示 为 !>,.=^(兄 ),
这 里 a .是连 续
变量,
在 断 点 X 。处 ,函 数 A 兄 )发 生 弯 折 ,即 但 是 其 他

T一if
影响因素认在断点处是平滑的,
不存在弯折,
或者说潜在结果在断点处不存在
弯 折 。那 么 ,
可以将结果变量在断点处的弯折归因为原因变量的弯折造成的。

假 设 9. 7(变 折 假 设 ) d( • )为 已 知 连 续 函 数 ,cK . ) 在 断 点 两 侧 是 连 续 可
导的,
但 断 点 两 侧 的 导 数 不 相 同 ,l i m Y C r ) # l i m Z ( :
c ) ,即 存 在 弯 折 。

r''x0

弯 折 假 设 9. 7 说 明 研 究 者 知 道 函 数 d U ) ,
并 且 在 断 点 & 处 D,.和 X ; 之间
存 在 一 个 弯 折 。假 设 9, 7 要 求 函 数 ^/ U )是 连 续 函 数 排 除 了 D ; 在 断 点 处 存 在
跳跃的可能。

假 设 9.8(平 滑 性 假 设 ) 在 断 点 〜 处 是 连 续 的 ,即
lim 3^2 id ,x,u) = lim^2 (d,x^u)

平 滑 性 假 设 9. 8 是 说 在 断 点 办 附 近 ,
潜在结果:
v(A:
r,《)是 参 考 变 量 工 的
连续可导函数,
其 对 a,的 偏 导 数 :y2W , ^ ,
《)在 断 点 处 没 有 跳 跃 ,
是连续的,
从而
潜在结果在X 。处不存在弯折^

假 设 9. 9(密 度 平 滑 假 设 ) 条 件 密 度 函 数 / 靡 (
工U ) 及 其 导 数 ^ ^

在 断 点 X 。处 连 续 。 •

假 设 9. 9 是 保 证 R K D 设 计 有 效 的 另 一 个 重 要 假 设 ,
这里不但要求参考变
量密度连续,
而 且 要 求 参 考 变 量 密 度 函 数 的 导 数 连 续 ,才 能 保 证 弯 折 断 点 回 归
的 识 别 。这 一 点 可 以 通 过 估 计 参 考 变 量 的 分 布 来 进 行 检 验 ,
如果参考变量的分
布在断点处存在跳跃或弯折,
则证明上述假设可能不成立。

定 理 9. 5 如 果 假 设 9. 7 、
9. 8 、
9. 9 成 立 ,那 么 ,
(1) P r [ L T < w | X = : r ;
]在 断 点 处 是 连 续 可 导 的 。
(2 ) 在断点处的因果效应为:

r= = ELyi (仏 々 ),
々,⑴ | 兄. =

定 理 9. 5 ( 1 ) 说明其他影响因素的分布在断点处连续且可导,
这一点可以进
214 基本有用的计量经济学

行检验,
利 用 数 据 可 以 估 计 其 他 变 量 的 分 布 ,如 果 在 断 点 处 弯 折 ,
那么,
则证明
上 述 结 果 不 成 立 。定 理 9. 5(2)说 明 平 滑 性 假 设 和 密 度 平 滑 假 设 以 及 弯 折 假 设
下,
弯 折 可 以 识 别 出 断 点 处 的 平 均 因 果 效 应 参 数 。定 理 9. 5 的 证 明 参 见 Card et
al. (2015b) 0
在现实应用中,
原 因 变 量 可 能 并 不 是 完 全 由 参 考 变 量 X,.决 定 的 , 还受
一些研究者未观测到的因素的影响, 即 使 实 际 的 干 预 分 配 规 则 D,.=七 足 )是完
全 由 参 考 变 量 X,.决 定 的 ,
但由于测量误差,
观测到的千预分配往往也不是完全
由参考变量决定,
实际观测到的干预分配规则可以描述为参考变量兄和其他
未 观 测 因 素 e,•共 同 决 定 ,即 A = d ( X , . , e,.)。基 于 此 ,Card et al. (2015b)进一步
引 人 了 模 糊 弯 折 回 归 设 计 (Fuzzy R K D ) ,
并引人单调性假设,
证明弯折可以识
别出一个局部平均因果效应。
正 如 R D D 估 计 量 可 以 用 局 部 线 性 回 归 (L L R ) 进 行 估 计 ,
R K D 可以用局部
二 次 方 程 回 归 (Local Quadratic Regression)进 行 估 计 ,当 然 R K D 也 可 以 利 用
局 部 多 项 式 (L P R ) 进 行 估 计 。具 体 地 ,
对于精确弯折回归估计量,
第一阶段是
一 个 已 知 的 函 数 • ),
我们只需要在断点左右估计下列两个最优化问题:

j - 1(X;< x c ) (9.42)

_ ^ X. V (Xi
m m ^ \ Y i - x Dy \ • 1(X,- > ^ 0) (9.43)
^rj i= 1 、
其 中 A,,
民 ,)= i ,… ,
/>为 断 点 左 右 回 归 的 回 归 系 数 ,
k ( m )为 核 函 数 ,
a 为带
宽 。关 于 核 函 数 、
带宽和滞后阶数的选择,
参 照 上 一 节 讨 论 的 方 法 。在 精 确 断
点回归中,
原因变量的分配规则W x ) 是已知的,
其 在断点左右的导数也是巳知
的,
不妨记4 = 则 精 确 R K D 估计量为:

^SRKD = 鲁 —S (9 . 44)

在模糊断点回归中,
康因变量的分 配 规 则 不再是确定性的,
需要估
计在断点左右分配规则斜率的变化, 可以估计下列两个优化问题:
.V / P
m i n ^ j D ,. — 2 % ― 工。 ) , K:
rx '~- 0V 1(X,. < x 0) (9.45)
{Kt) ^ i = l V j= 0

- ^ K rj ( X i - X o V ' j • °^)« 1 ( 0 : 。) (9.46)

得 到 的 分 配 函 数 斜 率 变 化 的 估 计 量 为 Z —F ,
则 模糊R K D 估计量为:

^FRKD = ^ ~ ^ (9.47)
fct —fCl
第九章断点回归设计 215

Card et al. (2015a)利 用 R K D 策 略 估 计 了 失 业 保 险 对 个 人 失 业 持 续 时 间 的


影 响 。失 业 保 险 制 度 是 在 个 人 失 业 后 一 定 时 期 内 给 予 一 定 保 险 收 人 的 制 度 ,

失 业 人 员 提 供 短 期 的 保 障 ,以 便 失 业 人 员 度 过 失 业 持 续 期 。失 业 保 险 收 益 往 往
根 据 个 体 失 业 前 收 入 水 平 的 某 个 比 率 (替 换 率 )提 供 ,
并且一般有最高金额限
制 ,比 如 美 国 密 苏 里 州 的 失 业 保 险 金 是 根 据 个 人 失 业 前 4 个 季 度 中 最 高 收 入 的
4 % 支 付 周 保 险 金 (替 换 率 为 5 2 % ) ,
但 周 保 险 金 收 益 最 高 限 为 $ 250(2007年
前 )或 $ 320 ( 2 0 0 8 年 后 )。另 外 ,
失业保险也不能太慷慨,
有文献认为,
失业保
险 可 能 降 低 了 失 业 人 员 寻 找 工 作 的 激 励 ,使 得 失 业 保 险 收 益 越 高 ,
失业人员寻
找工作的激励越 低 ,
失业持续期会越长。由于失业保险支付的制度设计,
失业
保 险 金 额 并 不 完 全 是 个 人 失 业 前 收 人 的 线 性 函 数 ,而 是 在 最 高 支 付 限 额 处 弯
折 ,比 如 密 苏 里 州 的 失 业 保 险 会 在 失 业 前 季 度 最 高 收 入 为 $ 6 2 5 0 或 $ 8 0 0 0 时
发 生 弯 折 ,Card et al. (2015a)正 是 利 用 这 一 弯 折 来 识 别 失 业 保 险 对 失 业 持 续 期
的 影 垧 。作 者 使 用 2003— 2 0 1 3 年 的 数 据 ,由 于 保 险 金 上 限 的 不 同 ,
作者分成两
个 时 期 进 行 分 析 ,即 2 0 0 8 年 金 融 危 机 之 前 和 危 机 之 后 。
图 9. 9 显 示 的 是 失 业 保 险 金 支 付 额 与 个 人 失 业 前 季 度 最 高 收 入 之 间 的 关
系,
横 轴 表 示 个 人 最 高 季 度 收 益 ,已 经 通 过 减 去 门 槛 值 进 行 标 准 化 ,
0 左图表示
危机之前,
右 图 为 危 机 之 后 。可 以 看 出 保 险 金 的 支 付 在 0 处 存 在 弯 折 ,断 点 左
侧,
支 付 规 则 斜 率 为 4 % ; 断 点 右 侧 ,即 失 业 前 收 入 超 过 门 槛 值 ,
则按照最高上限
支付失业保险金,
斜 率 为 0。

Panel A.2003-2007 Panel B.2008-2013

350 350
o
;unoUIB

30

j 300
5
2
s s s q X>

2 250
ts
tD
| 200
0
2
o1
5

150
<1
2^

o
0
1

100
9

-5000-2500 0 2500 5000 7500 10000 12500 -5000 -2500 0 2500 5000 7500 1000012500
o

High quarter (s) earnings, normalized High quarter (s) earnings, normalized

图 9 . 9 失亚保险金支付规则(
第一阶段)

① 横 轴 表 示 标 准 化 季 度 收 入 ,利 用 季 度 最 高 收 人 减 去 门 槛 值 ,
危 机 之 前 门 槛 值 为 $ 6250,
危机之后
为 $8000 „
216 基本有用的计量经济学

图 9. 1 0 显 示 的 是 失 业 持 续 期 相 对 于 失 业 前 最 高 季 度 收 人 的 关 系 图 ,
可以
看出,
失 业 持 续 期 在 断 点 处 有 一 个 明 显 的 弯 折 。断 点 左 侧 ,
失业前收入越高,

业持续期越长; 失业前收人越高,
断点右侧, 失 业 持 续 期 越 短 。如 果 其 他 潜 在 的
影 响 因 素 在 断 点 处 没 有 弯 折 ,并 且 个 人 没 有 精 确 操 纵 断 点 的 能 力 ,
那么,
我们就
可以将失业持续期在断点的弯折归因为失业保险支付规则的弯折造成的。

Panel A.2003-2007 Panel B.2008-20I3

uopsnpJ ds s l
:
43 ■*
* ■

V* • •• *
*•
f
.2
l! 叻01

.s
-5000 -2500 0 2500 5000 7500 1000012500 -5000 -2500 0 2500 5000 7500 1000012500
High quarter (s) earnings, normalized High quarter (s) earnings, normalized

图 9. 1 0 对数失业持续期

图 9. 1 1 给 出 了 相 应 的 参 数 估 计 。 中 间 的 线 为 估 计 结 果 ,上 下 的 线 为 相 应
的 置 信 区 间 。图 中 垂 直 实 线 和 虚 线 分 别 对 应 于 使 用 两 种 最 优 带 宽 选 择 标 准 所
获得的估计,
实线为I K 方法,
虚 线 为 C V 方 法 。左 图 为 危 机 前 的 估 计 结 果 ,
IK
估 计 结 果 为 0. 373(0. 0 4 9 ) ,
C V 估 计 结 果 为 0. 356(0. 0 4 1 ) ,
括号内为标准误差,
两 种 带 宽 下 所 获 得 的 参 数 估 计 均 为 正 值 ,即 失 业 保 险 越 高 ,
失业持续期会越长,
危 机 前 弹 性 在 0. 356 一 0. 3 7 3 左 右 。右 图 为 危 机 后 的 估 计 结 果 ,I K 结 果 为
0.882(0. 200),C V 结 果 为 0. 684(0. 067),
影响方向仍然是正向的,
但影响程度
增加了,
危 机 后 的 弹 性 为 0. 684— 0. 8 8 2 左 右 。
Panel A.2003-2007 Panel B.2008-2013

2000 4000 6000 8000


Bandwidth Bandwidth

图 9. ] 不同带宽下的局部线性回归估计
第九章断点回归设计 217

第五节断点回归设计的软件实现

在 Stata软 件 中 ,
断点回归设计的估计很简单,
可以使用线性回归命令进行
估 计 。下 面 我 们 使 用 Lee (2008)的 数 据 iee. dt a 为 例 ,
估计在位党的竞选优势。
数 据 lee,dta包 括 两 个 主 要 变 量 :vote是 民 主 党 本 次 的 选 票 份 额 ,
m a r g i n 是民主
党 上 次 竞 选 中 所 获 选 票 边 际 ,即 民 主 党 选 票 份 额 减 去 共 和 党 选 票 份 额 。margin
是参考变量,
如 果 m a r g i n 大 于 0 ,民 主 党 就 是 在 位 党 ,
这是一个精确断点回归设
计,
我们关心在位党是否因为在位而获得更多的选票,
是 否 具 有 在 位 优 势 。与
Lee and LemieUx(2010)— 致 ,
我 们 将 样 本 限 制 在 民 主 党 上 次 选 票 边 际 在 ±0. 5
之间,
共 4900个样本点。
首先画出结果变量与参考变量之间的关系图,
选 择 带 宽 0. 0 1 ,
共 1 0 0 个区
间,
可 以 利 用 e g e n 的 cut()函 数 实 现 这 一 点 :

use lee, clear


keep if m a r g i n < = *5 S m a r g i n > = - .5 // 限制样本范围
local h = o.oi // 改变带宽
egen group = cut (margin),at ( - . 50 ( ‘h ’). 50) // 根 据 参 考 变 量 ,
划分成相同距离
区间
collapse (count) n = vote (mean) vote margin,b y (group) // 按区间计算平均值,
并计
算每个区间中的个体数
gen x = 一.5 + l / „ N * _ n - l / ( _ N * 2 ) I I 参考变量区间中点
-.5
gen x2 == x"2
gen x3 = xr3
gen x4 =:x M
* 利 用 4 阶多项式拟合
reg vote x x2 x3 x4 if x < 0
predict votel if e( sample)
reg vote x x2 x3 x4 if x!> = 0
predict voter if e(sample)
* 画出结果变量(
v o t e ) 与 参 考变量(
margin ) 关系图
sc vote x ,xline(O) I lline votel x| |line voter x ,legend(off) ///
xlabelC - 0. 5(0.1)0. 5) xti11 e("Democrat ic Vote Share Margin of Victory, Election

O Hi
note (Note :Replicate figure 7 of Lee and Lemieumx (2010))
218 基本有用的计量经济学

上述命令生成的图形如下图所示,
可以看出民主党选票份额在断点处有明
显的跳跃,
可以选择不同的带宽,
检测图形中显示的跳跃是否仍然存在。

0.8 r

0,4

0.2
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0,5
Democratic Vote Share Margin of Victory, Electiont
Note: Replicate figure 7 of Lee and Lemieumx (2010)

图 9. 1 2 结果变量与参考变量关系图

上 述 图 形 也 可 以 利 用 用 户 写 的 命 令 rdplot画 出 ,
具体命令形式为:

rdplot vote margin ,c(0) nbiny(50)


j» ■

其 中 c(0)设 置 断 点 为 0 ,
n binS( # ) 用 来 设 置 断 点 左 右 区 间 数 ,
也可以不设
定,
程序会自动选择最优的带宽,
获 得 相 应 的 区 间 数 。接 着 上 面 的 程 序 ,
也可以
画 出 参 考 变 量 的 分 布 图 ,以 判 断 个 体 是 否 能 够 精 确 控 制 断 点 。

replace n = n/4900 * 100 / / 换算成概率分布


reg n x x2 x3 x4 if x<C0
predict nl if e( sample)
reg n x x2 x3 x4 if x > = 0
predict nr if e( sample)
* 画 出 参考变量〜 margin 〜的分布图
sc n x ,xline(O) | |line nl x| |line nr x, legend(off) x l a b e K - 0. 5(0.1)0. 5) ///
ylabel(0(. 5)2) xfcitleCDeraocratic Vote Share Margin of Victory, Election t") ///
note (Note: Replicate figure 16 of Lee and Lemieumx (2010))

得 到 参 考 变 量 密 度 图 9. 4 ,
从点上看,
在断点处没有明显的跳跃,
但利用4
次多项式拟合的曲线,
似乎存在着跳跃,
需 要 利 用 M c C rary(2008)密 度 检 验 统
计 量 进 行 检 验 ,以 判 断 在 统 计 上 跳 跃 是 否 显 著 ,实 际 上 跳 跃 在 断 点 处 是 不 显 著
第九章断点回归设计 219

的,
从而证明个体没有精确控制断点的能力。
下面进入第二步,
估 计 在 断 点 处 的 因 果 效 应 。可 以 利 用 局 部 简 单 平 均 值
法,
类似于完全随机化实验的分析,
也可以采用局部线性回归方法,
两种方法都
需要选择带宽,
第 三 种 方 法 是 多 项 式 回 归 ,可 以 使 用 相 对 较 大 的 带 宽 或 适 用 于
整个样本^ 另一个相关的是核函数的选择,
Imbens and Lemieux(2008)指 出 矩
形 核 函 数 所 得 到 的 结 果 与 其 他 核 函 数 得 到 的 结 果 没 有 太 大 差 异 ,由 于 矩 形 核 比
较简单,
这里便使用矩形核,
对 所 有 个 体 施 加 相 同 的 权 重 。使 用 用 户 写 的 命 令
rdbwselect进 行 最 优 带 宽 选 择 ,
该 命 令 提 供 了 Ludwig and MiUer(2007)的交叉
验证方法(
VC)、
Imbens and Kalyanaraman (2012)的 带 宽 选 择 方 法 (
IK)和 C a 卜
onico et al. (2014a)的 带 宽 选 择 方 法 ( C C T ) 三 种 最 优 带 宽 选 择 方 法 ,
我们选择交
叉验证方法,
利用下列命令估计最优带宽,
得 到 的 最 优 带 宽 为 0. 2 8 。

rdbwselect vote margin, c(0) kernel (uni) bwselect(CT) cvgrid_min(0. 1) cvgrid_max( 0.


5) cvplot①

选 项 c(0)表 示 断 点 为 0 ,kem e U u n i ) 可 以 选 择 核 类 型 ,
这里使用矩形核,
bwseiectO用 于 选 择 最 优 带 宽 估 计 方 法 ,包 括 C V 、
IK、
C C T 三种方法可供选择,
我 们 使 用 CV,cvgrid_min( # )和 cvgird—m a x 来 限 制 画 出 交 叉 验 证 目 标 函 数 时
的起始和结束位置,
使 用 cvplot画 出 交 叉 验 证 目 标 函 数 图 ,
运行上述命令后,

显 示 出 图 9. 8,利 用 另 外 两 种 方 法 会 得 到 更 小 的 带 宽 。下 面 ,
我们将带宽限制在
0. 2 8 范 围 内 ,
利用局部平均值法和局部线性回归法估计R D D 因果效应参数。
利 用 (9. 15)估 计 下 列 回 归 :

keep if margin〉 = - 0. 2 8 & m a r g i n < = 0. 28


gen d = margin〉 0
eststo ml :reg vote 1. d, vce(robust)
eststo m2: reg vote d # 拌c.margin ,vce(robust)
esttab ml m2 using Hr. rtf, star( ^ .10 * * .05 * .01) ncgap nonumber replace ///
mtitle("Local Average" "LLR") se( % 5 . 4f) ar2 keep(l. d margin 1. d # c. margin cons)

表 9. 2 是 上 述 程 序 估 计 出 的 回 归 结 果 ,
d 的系数是R D D 估计量,
第 1 列为
局 部 平 均 估 计 量 ,即 两 组 结 果 平 均 值 之 差 ,为 0. 19。图 9. 1 2 显 示 ,
局部平均显
示不是很好的估计,
图中显示在断点附近,
结果变量与参考变量之间呈现正向
斜 率 ,因 而 局 部 线 性 回 归 可 能 是 更 好 的 选 择 。表 9. 2 第 2 列 是 相 应 的 局 部 线 性

①该命令为老版命令,
通过SSC install rdrobust, replace 或 findit rdrobust 安装使用。
220 基本有用的计量经济学

回 归 ,回 归 系 数 为 0.084,
并 且 在 1 % 水 平 下 显 著 。这 一 结 果 表 明 ,民 主 党 在 位
会 使 其 获 得 8, 4 % 的 选 票 优 势 ,
这一优势仅仅是因为民主党在位而获得的。

表 9.2 局 部 平 均 和 局 部 线 性 回 归 结 果 ,/^= 0.28


(1) (2)
Local A v e r a g e Local Linear Regression ( L L R )

d 0. 190*** 0. 0 8 4 V
(0.0044) (0.0080)
margin 0. 366***

(CL 0 3 4 3 ) .
d 拌 c. ma r g i n 0. 0560

(0. 0556)
_cons 0.401*** 0. 451***
(0.0028) (0.0052)

N 3075 307 5

adj. R 2 0. 379 0.4 2 2

Standard errors in parentheses* * p < C . 1 0 , p < i . 0 5 ,# 01

下面使用全部样本,
利 用 多 项 式 重 新 估 计 R D D 参 数 。相 应 程 序 如 下 :

use lee, clear


keep if m a r g i n < = .5 & m a r g i n > = — .5
gen d = margin〉 0
gen x = margin
gen x2 = x"2
gen x3 = jt 3

gen x4 - :
r4

eststo ml ;reg vote d # # c. x, vce(robust)


eststo m2: reg vote d # ^ c . (x x 2 ), vce(robust)
eststo m3 :reg vote d # # c. (x x2 x3) , vce(robust)
eststo m4 :reg vote d # # c. (x x2 x3 x 4 ) , vce(robust)
esttab ml m2 m3 ra4 using lpr. rtf ,star( * .10 ^ * .05 * * * .01) nogap replace ///
mtitleCp = 1一p = 2" "p = 3 〜 p = 4") se(%5. 4f) ar2 aic(%10. 4f) bic(%10. 4f) ///
drop(0b. d 0b. d 拌co. x 0b. d 梓co. x2 0b. d 掉co. x3 0b. d # co. x4)

表 9. 3 是 相 应 的 估 计 结 果 ,
最后一行显示了 A I C 和 B I C 标 准 ,
根据AIC标
准,
最 优 的 阶 数 是 > = 3 ,因 而 ,
利用全部样本进行回归,
最优的多项式模型为三
阶多项式,
相 应 的 估 计 结 果 为 0.0676。B I C 标 准 显 示 最 优 阶 数 为 ^ = 1 ,即线性
第九章断点回归设计 221

回归,
得 到 的 因 果 效 应 为 0. 0 8 9 7 ,
与上面的局部线性回归结果相似,
表明在位党
在 竞 选 中 因 为 在 位 优 势 选 票 份 额 会 增 加 6. 7 6 % — 8. 97. % 。如 果 其 他 协 变 量 在
断点处连续,
并且个体没有精确操纵断点的可能,
那么,
得 到 的 R D D 估计量就
可 以 解 释 为 在 位 党 的 在 位 优 势 。下 面 进 行 相 关 稳 健 性 检 验 。

表 9.3 多项式估计

Cl) (2) (3) (4)


阶数
p = l P = 2 P = 3

d 0.0897 … 0.0824*** 0. 0676*** 0.06 5 9 …

(0.0062) CO.0092) (0.0120) (0.0144)

X 0.362*** 0.331*** 0. 656*** 0. 632**

(0.0177) (0.0653) (0.1535) (0.2798)

d # c. x 0.0161 0. 171* - 0 . 108 0.00719

(0.0256) (0.0962) (0.2241) (0.4241)

x2 -0.0652 1. 6 2 0 “ 1. 390

(0.1388) (0.7660) (2.4425)

d # c. x2 - 0 . 191 -2. Ill* - 2 . 711

(0. 2001) (1.1099) (3.7006)

x3 2. 314** 1.576

(1. 0705) (7. 8388)

d # c. x3 - 1 . 997 1. 364

( 1.5344) (11.7467)

x4 — 0. 757

(8.2240)

d# c. x4 - 1 , 897

(12.1532)

—cons 0. 451*** 0.449*** 0.462*** 0.461"**

(0.0042) (0.0062) (0.0082) (0.0097)

N 4900 4900 4900 4900

adj. R 2 0. 551 0. 551 0. 551 0. 551

AIC - 6 4 5 2 . 35 2 4 _-6452. 2 4 4 8 -6452.4765 - 6 4 4 8 . 5844

BIC - 6 4 2 6 . 3644 --6413. 2 6 2 8 -6400.5005 - 6 3 8 3 . 6145

Robust Standard errors in parentheses? * /><. 10,“/><. 0 5 ,… p<i. 01


222 基本有用的计量经济学

首 先 是 其 他 协 变 量 的 连 续 性 检 验 ,民 主 党 的 实 力 是 重 要 的 混 杂 因 素 ,
使用
上 一 期 民 主 党 在 众 议 员 席 位 竞 选 中 的 选 票 份 额 (voteprev)作 为 民 主 党 实 力 的 代
理变量,
该 协 变 量 相 对 于 参 考 变 量 的 断 点 回 归 图 形 见 图 9. 3 ,
可以看出在断点处
没 有 明 显 的 跳 跃 。将 民 主 党 实 力 作 为 伪 结 果 变 量 ,进 行 断 点 回 归 ,
选 择 4 阶多
项式,
估计结果如下,
可 以 看 出 断 点 ^ 的 系 数 为 0.0015,非 常 小 ,
并 且 不 显 著 ,因
'而 可 以 认 为 该 协 变 量 在 断 点 处 是 连 续 的 。

. reg voteprev d # # c. (x x2 x3 x 4 ) ,vce(robust)


Linear regression Number of obs = 4901
9, 4891) = 14109,64
Prob > F = 0. 0000
R-squared = 0,9646
Root MSE = .02344

Robust
voteprev Coef. Std. Err. t P>|t| □95% Conf, Interval]
l.d .001455 .003431 0.42 0.672 一.0052712 .0081813
X .655964 .074585 8.79 0.000 ,509744 .802184
x2 1.190371 .6318029 1.88 0.060 -■048246 2.428989
x3 1.147626 1.990867 0.58 0.564 -2.755368 5.050621
x4 - . 5 3 3 7773 2.069692 -0.26 0.796 -4.591304 3,523749

d # c, x
1 - . 2 7 2 1905 .0972093 -2.80 0.005 -.4627643 -.0816166
d#c.x2
1 1,920351 .8062912 2.38 0.017 .3396579 3.501044
dtt c. x3
1 - 1 4 , 1 2467 2.49588 -5.66 0.000 - 1 9 . 0 1 7 7 1 - 9 . 2 31619
d # c. x4
1 14.59153 2.554633 5. 71 0.000 9.583304 19.59976
_cons .4877442 .0026102 186.86 0.000 .482627 .4928615

我们还需要检测个体是否能够精确地操纵断点,
检验方法是判断参考变量
分 布 在 断 点 处 是 否 存 在 跳 跃 ,如 果 在 断 点 左 右 个 体 数 量 显 著 不 同 ,
则某些个体
可能具有控制断 点 的 能 力 ,
前 面 图 9 . 4 画 出 了 参 考 变 量 的 分 布 图 。图上点没有
明显的跳跃,
但拟合的曲线显示有一定的跳跃,
需要进一步的统计检验,
使用用
户 写 的 命 令 rddensity估 计 McCrary(2008)密 度 检 验 统 计 量 ,
结果显示统计量
为一 0. 3032,p 值 为 0. 7617,
说明参考变量在断点处没有显著跳跃。
第九章断点回归设计 223

. rddensity margin ?c(0)


Computing data-driven bandwidth selectors.
RD Manipulation Test using local polynomial density estimation.
Running variable ;margin.

Method T p> | t |

Robust Bias-Corrected -0,3032 0.7617

还可以进行伪干预检验,
这是另一种形式的安慰剂检验或证伪检验,
检验
其 他 位 置 是 否 存 在 跳 跃 ,比 如 将 在 断 点 左 右 参 考 变 量 分 别 为 ±0.2.5的位置作为
检 验 在 这 些 位 置 结 果 变 量 是 否 存 在 跳 跃 。可 以 利 用 下 列 语 句 画 出 结 果
伪断点,
变量在伪断点处的关系图;

rdplot vote margin if r a a r g i n < 0 ,c( —,25) graph_options(legend(off) titleC")


xlabel( - .5(.1)0))
rdplot vote margin if margin> = 0 ,c(. 25) graph_options(legend(off) titleC")
xlabel(0(,l),5))

图 9.13是相应的关系图,
可 以 看 出 无 论 是 在 伪 断 点 _ 0 . 2 5 还 是 + 0. 25,结
果 变 量 都 没 有 明 显 的 跳 跃 。也 可 以 用 前 面 的 估 计 方 法 估 计 伪 断 点 的 因 果 效 应 ,
看看是否存在显著的影响,
具 体 的 检 验 过 程 留 给 读 者 操 作 。前 面 估 计 主 要 使 用
0. 2 8 的 带 宽 ,
还 可 以 选 择 其 他 的 带 宽 ,更 小 的 和 更 宽 的 ,
看看估计结果是否稳
健 ,估 计 过 程 与 上 文 的 方 法 一 致 ,
在此省略。

(a)断点为一0.25 (b)新点为+0.25

图 9 . 1 3 伪断点检验
224 基本有用的计量经济学

Calonico et al. (2014b) 提 供 了 一 个 专 门 进 行 断 点 回 归 分 析 的 程 序 包 irdro-


bus t ,
® 包括三个主要的命令:
rdplot,画 断 点 回 归 图 形 ;rdbwselect,
选择最优
带 宽 ;rdrobust,
估 计 断 点 回 归 估 计 量 。在 使 用 之 前 首 先 要 进 行 安 装 ,
可以通过
findit rdirobust搜 索 到 程 序 包 ,
® 然 后 安 装 使 用 ,Calonico et al. (2017b)对该
程序包进打 了 更 新 ,
可 以 通 过 命 令 net install rdrobust,from (http :
//www-personal.
umich. edu/cattaneo/software/rdrobust/stata) replace 安装 0
下 面 对 三 个 命 令 的 用 法 进 行 简 要 介 绍 ,读 者 可 以 参 考 Calonico et al.
(2014b)和 Calonico et al. (2017b)了 解 相 关 命 令 的 具 体 用 法 D 首 先 介 绍 rdplot
命令,
它可以用来画R D D 图。

rdplot depvar indepvar [if] [in] [ ,cC # ) p ( 祛)kernel(kernelfn) weights(weights-


var) h( # # ) nbins( # # ) binselect (binmethod) scale ( # # ) ci(cilevel)
shade generate(id_var meanx_var meany_var cil_var c i r —var) graph_options
(gphopts) hide ]

其中,
有两个必选项,
depvar可 以 是 结 果 变 量 、
原因变量或其他协变量,
indepvar
是参考变量,
其 他 的 全 部 是 可 选 项 。c ( # ) 用 于 设 定 断 点 位 置 ,
默 认 为 0 。p ( 并)
设定多项式阶数,
默 认 为 4 。kernel(kernelfn)设 定 多 项 式 拟 合 时 的 核 函 数 , ker­
nelfn 可 以 有 三 种 选 择 :
三 角 核 函 数 triangular、
Epanechnikov核 函 数 epanechni-
kov、
矩 形 核 函 数 ^iforni,默 认 为 矩 形 核 。h ( # # ) 设 定 断 点 左 右 用 于 l i 合的带
宽,
如果没有设定带宽,
则 使 用 全 部 数 据 计 算 核 函 数 ,如 果 两 个 数 字 都 已 设 定 ,
第一个作为断点左边的带宽,
第 二 个 作 为 断 点 右 侧 的 带 宽 •,
如果只有一个数字,
则 作 为 断 点 左 右 共 同 的 带 宽 。nbinS( # # ) 设 定 划 分 的 区 间 数 ,
提供两个数值,
则 分 别 为 左 右 的 区 间 数 ;提 供 一 个 数 值 ,则 断 点 左 右 使 用 共 同 的 区 间 数 。binse-
leCt ( b m m ethod)设 定 带 宽 选 择 方 法 ,
可 以 根 据 参 考 变 量 划 出 等 份 的 区 间 ,也可
以根据参考变量分位数划分区间,
前者每个区间中个体数目不同,
后者每个区
间个体数目相同,
但区间大小不同,
默 认 为 前 者 。dCcilevel)可 以 根 据 设 定 的 ci-
level画 出 每 个 区 间 拟 合 点 的 置 信 区 间 ,
选 加 shade置 信 区 间 用 阴 影 表 示 。选项
g e n e m t e O 可 以 将 划 分 的 区 间 以 及 拟 合 的 数 值 保 存 在 相 应 的 变 量 中 ,其 中 id—
var为 区 间 r o ,
meanx_var为每个区间中点位置,
m e a n y _ v a r 为 每 个 区 间 depvar
的样本均值,
dl„va r 为 样 本 均 值 置 信 区 间 左 边 界 值 ,chr_var为 样 本 均 值 置 信 区
间 右 边 界 值 。graph_options(gphopts)可 以 添 加 Stata图 形 选 项 。hide选 项 不

①详细内容可以参考 https://sites.google, com/site/rdpackages,该地址还提供了 McCrary(2008)


的密度检验程序rddensity, 前面已经使用过,
②这种方式安装的是老版程序。
第九章断点回归设计 225

显 示 R D D 图 。前 面 图 9. 1 2 也 可 以 用 rdpl o t 命 令 画 出 。

rdplot vote margin if margin〉 = - .5 S m a r g i n < = ,5 ,c(0) nbins(50) graph_options


(legend(off) ///
x l a b e K - 0.5(0.1)0. 5) xtitle("Democratic Vote Share Margin of Victory, Election
t") III
ytitleC^Vote Share,Election t + 1") note (Note ;Replicate figure 7 of Lee and Le-
mieumx (2010)))

第 二 个 命 令 rdbwselect用 于 最 优 带 宽 选 择 ,
基本语法如下:

rdbwselect depvar indepvar [if] [in] [ ,c( # ) p ( 弁)q( # ) deriv( # ) fuzzy(fuzzy-


var [sharpbw])
covs(covars) kernel(kernelfn) bwselect(bwmethod) scaleregul( 弁)
vce(vcetype [vceoptl vceopt2^) all}

其 中 必 选 项 与 rdplot相 同 ,
可 选 项 c( # )设 置 断 点 ,
默 认 为 0,p( # )为多项式阶
数,
默 认 取 1 为局部线性回归,
q ( # ) 为偏差修正的多项式阶数,
默认为2,
®de-
H v ( # ) 可 以 用 于 估 计 弯 折 回 归 ,默 认 为 0 ,即 断 点 回 归 ,取 1 为 弯 折 回 归 估 计
( R K D )。fuzzy ( fuzzyvar [ s harpbw]) 用 于 模 糊 断 点 回 归 或 模 糊 弯 折 回 归 ,
fuzzyvar是 原 因 变 量 ,其 中 可 选 项 s h a r p b w 表 示 使 用 结 果 变 量 的 最 优 带 宽 。
covs(covars)可 以 引 人 其 他 的 协 变 量 。kernel (kernelfn)设 置 核 函 数 ,与 rplot
—样 ,
有三种类型核函数,
此 处 默 认 为 三 角 核 。bwselect(bwmethod)是 最 优 带
宽估计方法,
共提供了十种方法,
前 五 种 带 宽 选 择 使 均 方 误 差 (M S E ) 最 小 ,
仍然
沿 用 C V J K X T T 的 方 法 ,后 五 种 使 覆 盖 误 差 率 最 小 (Calonico et al.,2017a),
下面只列出前五种使均方误差最小的方法,
默 认 为 第 一 种 mserd。

mserd 断点两侧选择使均方误差 (MSE) 最小的共同带宽。


rasetwo 断点两侧分别选择使 M S E 最小的带宽。
msesum 断点左右估计参数加总的 M S E 最小的共同带宽。
msecombl 取 min(mserd ,msesum)0
msecomb2 取 median(msetwo ,mserd, msesum) ,
并且在断点左右分别估计。

scaleregu K # ) 设 定 是 否 带 有 带 宽 公 式 分 母 上 的 正 则 项 ,
取 0 不带,
取 1带,
默认
取 1 。vce()设 定 标 准 误 差 类 型 ,
共有 n n 、hc0、hcl、hc2、hc3、nncluster' cluster
七种,
默 认 为 vce(nn 3 ) ,
详 细 参 见 Calonico et al. (2017b) ^ 加 上 选 项 all,
会报

①关于偏差调整以获得更稳健的置信区间,
参 考 Calonico ot al. (2014a) 。
226 基本有用的计量经济学

告所有方法估计的最优带宽值。
下面,
我 们 选 用 矩 形 核 ,利 用 rdbwselect提 供 的 所 有 最 优 带 宽 选 择 方 法 ,
估 计 Lee(2008)数 据 中 的 最 优 带 宽 ,
估计结果如下,
前五种方法得到的带宽基本
在 0. 11— 0. 1 3 之 间 ,
后 五 种 方 法 得 到 的 带 宽 基 本 在 0. 0 8 左 右 ,比 先 前 采 用 的
交叉验证方法小很多。因 而 ,
在具体的应用中,
采用不同的带宽检验估计结果
的稳健性很有必要。

. rdbwselect vote margin, c(0) kernel (uni) all


Bandwidth estimators for sharp RD local polynomial regression.
Number of obs = 4900
Cutoff c ^ 0 Left of c Right of c
Kernel = Uniform
Number of obs 2354 2546
VCE method = M
Min of margin -0.500 0.000
Max of margin - 0.000 0.500
Order loc. poly, (p) 1 1
Order bias (q) 2 2

Outcome :vote. Running variable :margin.

BW loc. poly. BW bias (b)


Method Left of c Righ of c Left of c Right of c
mserd 0.114 14 0.228 0*228
msetwo 28 0.229 238
msesum 9 29 0.248 248
msecoinbl 4 14 0.228 0 228
rasecomb2 28 0.229 238
cerrcf 075 0.228 228
certwo 084 0.229 238
cersum 丨
84 084 0,248 248
cercombl 5 075 CL 228 228
cercomb2 084 0.229 238

第 三 个 命 令 是 R D D 估 计 命 令 rdrobust,
其基本语法和选项为:

rdrobust depvar runvar [if] [in] [ ,c( # ) pC ) qC # ) deriv( # ) fuzzyCfuzzyvar


[sharpbw ] 〉
covs(covars) kernel(kernelfn) h( # # ) b( ft # ) rho( # ) scalepar ( # ) bwselect
(bwmethod)
scaleregul( # ) vce( vcetype [vceoptl vceopt2]) level( # ) all ]
第九章断点回归设计 227

rdrobust的 选 项 与 rdbwselect的 选 项 相 似 ,
下面只简单介绍一下不一样
的 选 项 。h ( # # ) 可 以 手 动 限 制 断 点 左 右 的 带 宽 ,
b ( # 拉)设 定 估 计 偏 差 调 整 的
多项式带宽,
带宽和偏差带宽两选项不加,
程 序 会 自 动 利 用 rdbwselect估 计 带
宽 。rh o ( # ) 设 定 带 宽 与 偏 差 比 ,默 认 为 1 。scaleparC#)设 定 R D D 参 数 调 整
项,
默 认 为 1 。l e v e K # ) 设 定 置 信 区 间 。加 上 选 项 all,
程序会报告三种不同的
方差估计量估计的标准误差:
通常方差估计量、
偏差修正方差估计量和偏差修
正的稳健估计 量 。
下 面 利 用 rdrobust命 令 估 计 在 位 党 竞 选 优 势 。结 果 显 示 ,总 样 本 数 为
4 9 0 0 个 ,断 点 左 右 样 本 数 分 别 为 2 3 5 4 和 2546,利 用 m s e r d 选 择 最 优 带 宽 ,
左右
两侧使用相同的带宽,
为 0. 114,
偏 差 调 整 的 带 宽 为 0. 2 2 8 ,
在带宽内断点左右
有 效 样 本 数 为 6 6 0 和 695。多 项 式 阶 数 选 择 f = l ,因 而 ,
使用局部线性回归。
偏差调整多项式阶数为9= 2 ,
使 用 局 部 二 项 式 回 归 。因 为 加 了 选 项 all,
所 以报
告了三种方法估计的R D D 参数和标准误差,
三种方法得到的结果均在6% 左
右,
说明结果比较稳健。

■rdrobust vote margin, c(0) kernel (uni) all


Sharp RD estimates using local polynomial regression.
Number of obs 4900
Cutoff c = 0 Left of c Right of c
BW type mserd
Number of obs 2354 2546
Kernel Uniform
Eff- Number of obs 650 695
VCE method NN
Order loc. poly, (p) 1 1
Order bias (q) 2 2
BW loc. poly, (h) 0.114 0,114
BW bias (b) 0.228 0,228
rho (h/b) 0.501 0.501

Outcome ;vote. Running variable :margin.

Method Coef. Std. Err. z P>U| [ 9 5 % Conf. Interval]

Conventional •062S4 .01141 5.4890 0.000 .040275 .085011


B ias-co rrec t ed .05985 .01141 5.2446 0.000 •037486 .082222

Robust .05985 .01291 4,6368 0.000 .034554 ,085154

rcfmbust也 可 以 估 计 Card et al. (2015b)提 出 的 弯 折 回 归 设 计 (R K D )估计


量 。下 面 ,我 们 利 用 一 个 模 拟 数 据 ,
演 示 利 用 rdrobust命 令 估 计 R K D 估 计 量 。
数据生成过程如下:
228 基本有用的计量经济学

y,- - 2 D , - 0 . 5 X , +£,
Dj ^ min(0. 5X, + u;,0. 5x0 + u;)
u 〜J V ( 0 , 1 ) ,
£,■ 〜 JV(0,1) ,X,- 〜i V ( 1 0 , 2 ) ,Xo - 10
图 9. 1 4 是 模 似 数 据 的 R K D 图 形 ,
可以看出在断点X = i O 处 ,
原因变量发生弯
折,
结 果 变 量 也 发 生 弯 折 ,当 然 ,
D 并 不 完 全 是 由 X 决 定 的 ,因 而 ,
适用于 模 糊 弯
折回归设计。

X X
(a) D vs.X (b) Y vs.X

图 9 . 1 4 结果变量和原因变量与参考变量关系图

利 用 rdrobust估 计 结 果 见 下 页 输 出 表 格 ,
选 用 矩 形 核 ,采 用 默 认 的 mserd
方法选择最优带宽,
结 果 显 示 程 序 选 择 的 最 优 带 宽 为 1.563,
选择的多项式阶数
为声= 2 ,
估计的是二阶多项式,
第一阶段显示的是断点对原因变量D 的影响,
影 响 程 度 为 一0. 7 左 右 ,
对 应 于 图 9. 14(a)中 斜 率 的 变 化 ,即 模 糊 R K D 估 计 量
(9. 47)分 母 上 的 部 分 。最 后 得 到 的 R K D 估 计 量 为 1. 89— 1. 9 6 之 间 ,与实际值
2 非常相近,
说明上述估计结果具有一定的可信性。

. rdrobust Y X, c(10) kernel(uni) all fuzzy(D) deriv(l)


Fuzzy kink RD estimates using local polynomial regression.
Number of obs 10000
Cutoff c = 10 Left of c Right of c
BW type mserd
Number of obs 4979 5021
Kernel Uniform
E ff. Number of obs 2821 2782
VCE method NN
Order loc. poly. Cp) 2 2
Order bias (q) 3 3
BW loc. poly, (h) 1.563 1.563
BW bias (b) 2.597 2.597
rho (h/b) 0.602 0.602
第九章断点回归设计 229

First-stage estimates. Outcome :D. Running variable :X.

Method Coef. Std. Err. z P>|z| [ 9 5 % Conf• Interval]

Conventional -.69886 .23664 - 2.9532 0.003 -1.16267 -,235046


Bias-corrected -,7128 .23664 -3.0122 0.003 -1.17661 -.248993
Robust - .7128 ■
31388 -2,2709 0.023 - 1 .32801 -_0976

Treatment effect estimates. Outcome: Y. Running variable :X. Treatment Status ;D.

Method Coef. Std. Err. z P>|z| [ 9 5 % Conf. Interval]

Conventional 1.9591 .33951 5.7704 0.000 1.29369 2.62456


Bias-corrected 1.8932 .33951 5.5762 0.000 1,22777 2.55865
Robust 1.8932 .45068 4.2008 0.000 1.00989 2.77653

第六节总 结

本 章 讨 论 了 断 点 回 归 设 计 和 弯 折 回 归 设 计 ,由 于 断 点 回 归 设 计 与 完 全 随 机
化实验非常相似,
是 完 全 随 机 化 实 验 的 近 亲 (Lee and Lemieux, 2010),
RDD策
略 所 得 到 的 因 果 效 应 参 数 是 最 为 可 信 的 ,因 而 ,
R D D 策略成为目前经济学实证
工 具 箱 中 最 受 欢 迎 的 识 别 策 略 。 自 从 2 0 世 纪 9 0 年 代 末 经 济 学 家 将 R D D 策略
重新挖掘出来,
特 别 是 H a h n et al. (2001)从 理 论 上 严 格 证 明 了 R D D 策 略 的 识
别条件和估计方法,
R D D 策 略 的 理 论 及 应 用 文 献 大 量 涌 现 。本 章 介 绍 了 最 基
本 的 断 点 回 归 设 计 及 弯 折 回 归 设 计 ,对 多 元 参 考 变 量 的 处 理 (Jacob and Lef-
gren, 2004;Caliendo. et al.,2013),参 考 变 量 的 测 量 误 差 问 题 (Ping,2 012;
Pei Shen, 2016),
分 位 数 断 点 回 归 设 计 (Frandsen et al.,2012) ,以及断点的自
选 择 问 题 D o n g (2016)等 没 有 进 行 讨 论 ,
有兴趣的读者可以跟踪最新的文献。
断点回归设计近似于完全随机化实验,
具有很强的内部有效性,
估计结果
具 有 很 强 的 可 信 性 。但 是 ,也 与 完 全 随 机 化 实 验 一 样 ,
R D D 策略得到的估计往
往只是断点处的平均因果效应,
不能简单地推广到其他位置,
外部有效性较弱,
这是断点回归设计的主要限制,
在 使 用 R D D 或 R K D 策略的时候,
需要将这一
点 考 虑 进 来 。有 些 时 候 断 点 处 的 因 果 效 应 就 是 我 们 感 兴 趣 的 ,
R D D ( R K D ) 策略
是 回 答 这 类 问 题 的 最 好 工 具 。但 是 ,如 果 关 心 断 点 之 外 地 方 的 因 果 效 应 ,就需
要 引 人 一 定 的 假 设 才 能 外 推 ,外 推 有 效 性 依 赖 于 假 设 是 否 成 立 。D o n g and
Lewbel (2015)提 出 了 一 种 测 度 局 部 R D D 估 计 量 变 化 的 方 法 ,
称为干预效应导
数 (Treatment Effect Derivative, T E D ) ,它 反 映 的 是 在 断 点 处 ,干 预 效 应 的 变
230 基本有用的计量经济学

化率,
可以测度在断点附近,
如果稍微改变断点位置,
干预效应会有什么样的变
化 。如 果 T E D 为 零 ,
则意味着在断点附近其他位置干预效应不变,
从而RDD
估 计 可 以 外 推 到 其 他 的 位 置 。如 果 T E D 不 为 零 ,
意 味 着 离 开 断 点 ,因果效应就
会发生变化,
因 而 不 能 进 行 简 单 的 外 推 。Angrist and Ro k k a n e n (2015)提出了
一 种 外 推 的 方 法 用 于 分 析 在 断 点 之 外 其 他 位 置 的 因 果 效 应 。他 们 引 人 了 类 似
于匹配方法的条件独立性假设,
假设引人其他的协变量后,
参考变量与潜在结
果之间是独立的,
从 而 可 以 根 据 其 他 协 变 量 进 行 匹 配 ,而 无 需 再 考 虑 参 考 变 量 ,
从而可以估计断点左右任意位置的因果效应。

推荐阅读
有■
关 R D D 的 理 论 和 应 用 的 综 述 可 以 参 考 van der K l a a u w (2008)、
Lee and
Lemieux (2010) 、 DiNardo and Lee (20ll)、Keele and Titiunik (2015)、Choi
and Lee(2016) 等 。 关 于 R D D 策 略 应 用 指 导 建 议 可 以 参 考 lmbens and L e ­
mieux (2008)'Lee and Lemieux (2010)和 Skovron and Titiunik (2015)。Cook
(2008)对 R D D 的 前 世 今 生 以 及 在 心 理 学 、统 计 学 和 经 济 学 领 域 的 发 展 与 应 用
进行了很好的概括。关 于 R K D 理 论 和 应 用 可 以 参 考 Dong(20l4)、
C a rd et al.
(2015b) 和 Card et al. (2016) 。 关 于 分 位 数 R D D 可 以 参 考 Frandsen et al.
(2012)。 关 于 存 在 测 量 误 差 的 R D D 可 以 参 考 Ping ( 2 0 1 2 ) 和 Pei and Shen
(2016)。 关 于 R D D 外 推 的 文 献 可 以 参 考 D o n g and Lewbel (2015)和 Angrist
and R okkanen (2015) 。 还 有 很 多 不 断 增 加 的 文 献 ,在 此 不 再 一 一 列 出 ,有兴趣
的读者可以自行网上搜索。
第十章结 语

观测研究所提供证据的质量和可信度很大程度上取决于它的研究设
计 。再 好 的 分 析 方 法 也 没 有 办 法 拯 救 一 个 设 计 糟 糕 的 研 究 。®
---- Paul R o s e n b a u m

任何学科的终极目标都是在寻找世界的内在规律,
揭示不同变量之间的因
果关系,
透 过 自 然 现 象 或 社 会 现 象 寻 找 其 背 后 的 真 理 。经 济 学 也 不 例 外 ,
然而,
在经济学的研究中,
往往很难像自然科学研究一样,
通过大量实验获取支配自
然 界 各 种 现 象 的 自 然 规 律 。人 们 往 往 把 各 种 经 济 现 象 的 相 关 性 ,
通过一定的抽
象和假设,
获得一些理论假说,
并用社会现象所表现出的相关性来支撑经济假
设 的 正 确 性 或 适 用 性 。对 同 一 个 经 济 现 象 ,
会有多种理论学派提供不同的理论
体系,
都 可 以 在 一 定 时 期 一 定 程 度 上 解 释 特 定 的 经 济 现 象 。然 而 ,真 理 应 该 只
有 一 个 ,支 配 这 些 经 济 现 象 的 内 在 规 律 和 各 经 济 变 量 之 间 的 因 果 关 系 应 该 只 有
一种,
我 们 往 往 无 法 从 经 济 变 量 之 间 的 相 关 性 中 获 得 真 理 的 全 部 知 识 。特 别 是
在经济学的经验研究中,
很 少 有 人 相 信 经 济 学 家 的 实 证 研 究 结 果 。“计 量 经 济
学的艺术就是,
研 究 者 在 计 算 机 终 端 中 拟 合 许 多 (甚 至 上 千 个 )统 计 模 型 ,
从中
选择一个或几个符合作者预期的估计结果在论文中进行报告。
”“我 们 发 现 我 们
正 处 于 一 种 令 人 沮 丧 和 不 科 学 的 境 地 。没 有 人 将 数 据 分 析 看 作 严 肃 的 事 情 ,
或~
者 更 准 确 地 ,没 有 人 把 别 人 的 数 据 分 析 当 回 事 。
”(Learner, 1983) Learner
(1983)所 描 述 的 是 2 0 世 纪 七 八 十 年 代 美 国 经 济 学 界 的 情 形 ,
而我国经济学界
也 曾 处 于 类 似 的 境 地 。然 而 ,
经过三十多年的发展,
经济学的实证研究已经大
为改观,
经 济 学 实 证 结 果 的 可 信 度 越 来 越 高 。在 这 场 经 济 学 经 验 研 究 “可 信 性
革 命 ”中 扮 演 重 要 角 色 的 是 随 机 化 实 验 和 潜 在 结 果 框 架 的 引 入 。随 机 化 实 验 的
思 想 使 我 们 关 注 研 究 设 计 ,尤 其 是 Rubin(2008)等 人 主 张 在 观 测 研 究 的 设 计 阶
段,
要将结果变量先剔除,
就像真正的实验一样,
从而避免研究者选择一个适合
自 己 预 期 的 样 本 或 统 计 模 型 ,减 少 研 究 者 的 自 由 度 ,
增加研究设计的透明性和

① T h e quality and strength of evidence provided by an observational study is determined largely by


its design. Excellent methods of analysis will not salvage a poorly designed study (R o s e n b a u m » 2010,
Preface).
232 基本有用的计量经济学

客 观 性 。潜 在 结 果 框 架 的 引 人 使 因 果 的 定 义 更 加 清 晰 简 洁 ,
使经济学家更容易
定义清楚关心的因果效应问题,
从而将精力集中在研究设计和识别策略上。
本 书 介 绍 的 识 别 策 略 或 研 究 设 计 ,正 是 促 使 经 济 学 经 验 研 究 “可 信 性 革 命 ”
的 主 要 工 具 。所 有 这 些 策 略 的 一 个 共 同 特 点 ,
就是通过这些策略的设计,
使观
测研究近似于随机化实验。回归方法或匹配方法所得到的估计量,
要有因果效
应的解释,
基 本 的 识 别 条 件 是 非 混 杂 性 (unconfoundedness) 或 条 件 独 立 性 假 设
(CIA),
在 计 量 经 济 学 中 也 称 为 根 据 观 测 变 量 进 行 的 选 择 (selection on observa-
bles),
基本的含义是根据可观测的协变量为条件,
干预的分配是近似于随机化
的,
原 因 变 量 与 潜 在 结 果 是 独 立 的 。事 实 上 ,
如 果 C I A 条件成立,
数据生成过程
就 可 以 看 作 一 个 分 层 随 机 化 实 验 (stratified randomized experiment) D 这里 需
要强调一点,
本质上匹配方法和回归方法是相同的,
所要求的识别条件也是一
样的,
如 果 C I A 条件不成立,
匹配方法和回归方法一样都是不能解决内生性问
题的。
® 如 果 C I A 条 件 不 满 足 ,意 味 着 只 根 据 观 测 变 量 进 行 分 层 ,
无法保证干
预分配独立于潜在结果,
仍 然 有 未 观 测 因 素 影 响 干 预 的 分 配 。工 具 变 量 法 就 是
寻找一个决定干预分配,
但 独 立 于 潜 在 结 果 的 工 具 变 量 ,工 具 变 量 法 的 本 质 类
似 于 一 个 非 依 从 的 随 机 化 实 验 。干 预 的 随 机 化 分 配 是 工 具 ,而 个 体 实 际 接 受 的
干预状态是原因变量,
利用干预分配的随机性可识别出受工具变量影响的个体
的 因 果 效 应 (L A T E ) 。
® 如果有多期的数据,
尤其是面板数据,
可以帮助我们克
服不随时间变化的未观测混杂因素的影响,
通 过 差 分 或 去 均 值 (d e m e a n ) 的方
法,
使 得 增 量 上 满 足 C I A ,因 而 ,
D I D 策略或固定效应方法本质上是增量上的分
层 随 机 化 实 验 。® 。R D D 策 略 是 最 接 近 完 全 随 机 化 实 验 的 一 种 研 究 设 计 ,
它主
要 的 识 别 条 件 是 局 部 随 机 化 假 设 ,即 个 体 没 有 精 确 控 制 断 点 的 能 力 ,
从而使在
断点附近的个体具有高度的相似性,
在断点附近,
个体在左还是在右,
完全是由
不可控的随机性造成的,
从 而 干 预 的 分 配 近 似 于 一 个 完 全 随 机 化 实 验 D® R D D
策略通过断点来识别因果效应,
识别条件非常清晰,
也很容易检验,
研究者个人
操纵的可能性较低,
成 为 最 透 明 和 最 可 信 的 研 究 设 计 ,因 而 ,
成为经济学家最喜
欢的识別工具。 自从经济学家从历史的尘埃中把它挖掘出来,
迅速焕发生机,
理论文献和应用文献大量涌现,
现在仍然以指数级别在增加。
当然,
这些策略也不是完美的,
这些策略模拟随机化实验,
从而继承了随机

①在我国经济学的实证研究中,
仍然有人认为匹配方法可以解决内生性问题,
这是误解,
详细讨论
参见本书第五章和第六章。
②详细讨论参见第七章。
© 详细讨论参见第八章。
© 详细讨论参见第九章。
第十章结 语 233

化实验的优势,
使因果效应的估计非常可信,
具 有 很 强 的 内 部 有 效 性 。 同时也
继承了随机化实验的劣势,
估计的因果效应往往很难外推,
对经济变量之间的
影 响 机 制 也 很 少 涉 及 。政 策 评 估 一 般 包 括 三 种 类 型 ,
第一种是对已经发生的政
策进行效果评估,
第二种是对已经采用的政策应用到不同的群体的效果评价,
第 三 种 是 对 从 来 没 有 发 生 过 的 政 策 的 评 价 (H e c k m a n , 2001,2010)。本 书 介 绍
的识别策略往往只能回答第一类政策评估问题,
对于第二类政策评估,
需要讨
论一种政策在另外一种环境或群体中的政策效应,
需 要 外 推 。本 书 介 绍 的 方 法
对于第三类政策评估无能为力,
要 对 一 个 从 来 没 有 的 政 策 进 行 评 价 ,必 须 要 有
一定的结构,
才 能 对 未 来 进 行 预 测 ,因 而 必 须 使 用 结 构 计 量 经 济 学 的 工 具 。从
实验出发的计量经济学,
主 要 关 注 因 果 效 应 或 原 因 的 结 果 (effect of cause) ,

注的重点不是结果的原因(
cause of effect) ,
尽管对原因的结果的探讨对理解结
果的原因是有帮助的,
但 在 一 个 特 定 的 研 究 中 ,以 实 验 为 基 础 的 计 量 经 济 学 方
法只能识别某一特定原因的结果,
而不能揭示结果的原因,
这也是本书方法的
限 制 。对 于 变 量 之 间 内 在 机 制 的 分 析 ,
仍然需要从经济理论和结构计量经济学
中 寻 找 。另 外 ,
随 机 化 实 验 中 压 制 了 个 体 的 选 择 ,而 经 济 学 的 研 究 对 象 往 往 是
个 人 ,关 注 的 是 个 体 的 选 择 ,因 而 ,实 验 中 所 反 映 的 因 果 效 应 ,往 往 与 现 实 中 政
策 实 施 的 因 果 效 应 是 不 同 的 (H e c k m a n , 2001, 2010;Rucker et al.,2010),详
细 介 绍 可 以 参 见 第 三 章 第 五 节 “随 机 化 实 验 的 缺 陷 ”。当 然 ,
任何方法都不能完
成所有的工作,
本 书 介 绍 的 以 实 验 为 基 础 的 计 量 经 济 学 ,它 的 优 势 就 是 在 于 分
析第一类的政策评估, 对已经实施的政策或干预可以得到当前环境下非常可信
的估计,
这 类 研 究 可 以 为 第 二 类 和 第 三 类 政 策 评 估 提 供 一 定 的 参 考 ,为 构 造 合
理 的 结 构 模 型 提 供 依 据 。H e Ck m a n (2010)指 出 :
两 种 方 法 《相 互 补 充 ,
事实上已
有文献将两种方法结合起来,
利用实验来验证结构模型的合理性,
并利用实验
校 准 的 结 构 模 型 再 进 行 第 二 类 和 第 三 类 的 政 策 评 估 (Fehr and Goette, 2007) 。

① 即 结 构 计 fl经 济 学 方 法 和 本 书 介 绍 的 项 目 评 估 方 法 。
附 录 Stata数据处理编程简介

Stata软 件 是 目 前 经 济 学 经 验 研 究 中 最 常 用 的 软 件 之 一 ,
它体积小,
具有较
强的编辑能力,
可 以 进 行 数 据 处 理 和 统 计 分 析 ,因 而 ,
成为经济学家最喜欢的计
量 经 济 学 软 件 之 一 。下 面 简 单 介 绍 一 下 数 据 处 理 过 程 中 的 编 程 问 题 。假 设 读
者 对 Stata有 一 些 初 步 的 了 解 ,没 有 接 触 过 Stata的 读 者 可 以 参 考 B a u m
(2006)、C a meron and Trivedi ( 2010 ) 等 ,关 于 Stata 编 程 可 以 参 考 B a u m
(2016)。网 络 上 也 有 大 量 关 于 Stata的 资 料 ,
推荐两个网站,
一个是加州大学洛
杉 肌 分 校 数 字 研 究 与 教 育 研 究 所 (idre)的 网 站 :http:
/ / w w w . ats. ucla. edu/
stat/stata/ ,
另 一 个是 Stata 公 司 官 网 :
http://w w w . stata. com/support/。Sta­
ta 的 官 方 手 册 可 以 直 接 从 Stata软 件 帮 助 菜 单 中 调 取 。

第 一 节 常 用 命 令

Stata用 户 手 册 给 出 了 每 个 用 户 都 应 该 知 道 的 4 2 个 命 令 ,
我们对其中更常
用 的 命 令 进 行 简 单 介 绍 。所 有 Stata命 令 的 使 用 语 法 基 本 都 符 合 下 列 格 式 :

] command [varlist] [ = exp][if][in][weight][using.filename ] [ y options]


[prefix:

其中的方括号表示可选项,
有 些 命 令 可 以 加 前 缀 prefix,
有些命令需要加变量列
表 varlist,
有些还可以加其他选项,
if表 示 加 条 件 ,i n 可 以 限 制 使 用 的 样 本 范
围,
weight可 以 施 加 权 重 。
根据本人使用经验,
使 用 最 多 的 两 个 命 令 是 h e l p 和 s e a r c h 或 findit,

一个命令是当知道某一命令,
但不知道或忘记了使用方法或具体选项时,
可以
通 过 help c o m m a n d 的 方 式 查 询 ;
后者是不知道使用什么命令,
但想实现某一种
功能,
这 时 可 以 利 用 “f i n d i t + 关 键 词 ”的 方 式 进 行 搜 索 ,
该 命 令 会 在 Stata系统
和网络上搜索相应内容。比如想查询是否有进行双重差分估计的命令,
可以通
过 findit difference in difference 或 search difference in difference,
all进行搜索,
运 行 该 命 令 后 会 弹 出 一 个 viewer窗 口 显 示 搜 索 到 的 相 关 信 息 。
在 利 用 Stata进 行 研 究 分 析 之 前 ,
一般会在工作盘建立一个特定的目录,

应 于 相 应 的 研 究 项 目 。有 两 个 相 关 的 D O S 命 令 非 常 有 用 :
c d 和 dir。c d 是改
附 录 Stat。数 据 处 理 编 程 简 介 235

变当前工作路径,
在 打 开 或 保 存 文 件 时 ,Stata— 般 会 在 当 前 工 作 目 录 中 寻 找 ,
如果文件不在当前目录,
往 往 需 要 加 上 完 整 的 路 径 信 息 ,比 较 麻 烦 。因 而 ,
一般
在写处理程序时,
第一步就可以利用c d 命 令 ,
将工作路径调整为数据所在或项
目所 在 的 目 录 。d i r 用 于 査 询 当 前 目 录 的 文 件 信 息 。
关于文件处理,
下 面 5 个命令可能是最常用的,
包 括 保 存 文 件 save,保 存 成
前 一 版 本 可 读 的 文 件 saveold,打 开 Stata格 式 的 数 据 文 件 u s e ,追 加 数 据 ap­
pen d ,合并数据 merge。还 有 ,
数 据 导 入 命 令 import、infile、
odbc;数 据 呈 现 命
-^-display^ describe^ 士ist、count、tableN tabulate;数 据 处 理 命 令 sumarize、
tabs tat ^generate、
replace、
rename、clear、
drop、
kee p 、sort、
recode、reshape、
order、collapse、destring/tostring、encode、decode ;画 图 命 令 [ graph
twoway] yatter、histogram、kdensity、line,
具 体 使 用 方 法 参 考 各 命 令 的 help
文 件 。Stata软 件 的 学 习 方 法 ,可 以 结 合 help或 findit命 令 的 辅 助 ,
边用边学,
在此不再赘述。

第 二 节 d◦文件

Stata程 序 文 件 包 括 两 种 :d o 文 件 和 自 执 行 a d o 文 件 。a d o 文 件 主 要 用 于
写 类 似 于 Stata官 方 命 令 的 用 户 命 令 ,d o 文 件 是 一 般 的 数 据 处 理 程 序 文 件 。do
文件很简单,
就是在交互命令窗口将直接执行的命令罗列到一个文本文件中,
并 保 存 为 扩 展 名 为 . d o 的 文 件 ,比 如 myfile. d o 。在 命 令 窗 口 输 人 do myfile.
do,
Stata就 会 读 人 myfile.do中 的 命 令 并 逐 条 执 行 ,
非 常 方 便 。在 进 行 研 究 项
目的分析过程中,
很难直接通过交互方式完成整个项目的数据处理和分析过
程,
一般将整个数据处理和分析过程写到d o 文件中,
这样便于修改或后期重现
早期的估计结果。

1. 注释

一个研究项目的处理程序最终可能有几百行,
甚 至 上 千 行 。为 了 增 加 程 序
的可读性,
适 当 加 一 些 注 释 是 必 要 的 。尤 其 当 项 目 是 多 人 合 作 的 时 候 ,为 了 让
别人读懂你的程序,
也 需 要 在 程 序 中 加 人 适 当 的 注 释 。在 Stata中 有 三 种 基 本
的注释方式,
第 一 种 是 加 星 号 “* ”,* 号 后 的 语 句 在 执 行 时 会 自 动 忽 略 。第二
种是加//,
一般用在一行命令后面,
进 行 简 要 说 明 。第 三 种 是 加 / * * / 或///,
在 / * 和 * / 之 间 的 语 句 均 被 Stata忽 略 ,因 而 ,可 以 用 / * * / 进行大段的注释
或 暂 时 注 释 掉 某 些 不 想 执 行 的 语 句 。Stata命 令 是 按 行 来 执 行 的 ,有 时 命 令 行
236 基本有用的计量经济学

比较长,
一行没有办法写完,
这时一条命令要分几行写,
对于跨行命令,
需要告
诉 Stata这 几 行 是 一 个 命 令 ,
这时可以利用注释命令/* * / 或 ///将 多 行 语 句
连 接 成 一 个 命 令 。举 个 简 单 的 例 子 ,比 如 一 条 命 令 ,
先清除系统然后打开数据
auto, dta,
写成两行,
但它是一个命令,
用第三种注释方法把它们连接在一起。
下面两种方法都可以:

use III 或 use / ^


auto, clear 关/ auto,clear

上面两种方式,
Stata看 到 ///或 / * * /都 直 接 跳 到 下 一 行 接 着 读 ,
将两行语句
当 作 一 条 命 令 执 行 。对 于 跨 行 命 令 较 多 时 ,
还 可 以 利 用 # 如 1:11^1:命 令 重 新 设
定 语 句 结 束 符 ,比 如 下 面 语 句 定 义 分 号 为 命 令 结 束 符 ,
则 Stata不 再 按 行 读 人 语
句,
而是寻找分号,
分号出现时,
命令结束。

井delimit ;use auto, clear;弁delimit cr

2. 两种函数

Stata的 很 多 命 令 会 有 返 回 值 ,
返回值会保存在两种函数中,
一般估计命令
的 返 回 值 会 保 存 在 e()函 数 中 ,
其 他 命 令 的 返 回 值 会 保 存 在 r() 函 数 中 ,
命令后
的返回值,
可 以 通 过 l i s t 或 eretmrn l i s t 进 行 查 询 。 比 如 下 面 显 示 的
是 用 g m a r i z e 命 令 返 回 的 结 果 。这 些 返 回 结 果 可 以 通 过 新 的 变 量 取 出 来 ,
用于
后面的语句中。当 运 行 另 外 的 语 句 时 ,
K ) 函 数 中 储 存 的 值 会 发 生 变 化 ,因 而 ,
要 取 出 来 先 保 存 在 特 定 的 变 量 或 宏 中 ,以 便 后 面 程 序 使 用 。

. sysuse auto, clear


(1978 Automobile Data)

, s\m mpg

Variable Obs Mean Std. Dev. Min Max

mpg 74 21.2973 5.785503 12 41

scalars ;
附 录 SW 。数 据 处 理 编 程 简 介 237

r(N) = 7 4
r(sum_w) = 7 4
r(mean) =21.2972972972973
r(Var) =33.47204738985561
r(sd) =5.785503209735141
r(min) = 1 2
r(max) = 4 1
r(sum) =1576

下 面 是 做 了 一 个 简 单 的 线 性 回 归 模 型 后 e()所 保 存 的 结 果 。

, qui reg mpg weight price, vce(robust)


. eret list
scalars ;
e(N 74
e(df_m 2
e(df_r 71
e(F 51.14373982809451
e(r2 .6531446579233133
e(rmse 3.454996314099513
e(mss 1595.932492798133
e(rss 847.5269666613266
e(r2_a ■6433740849070686
e(ll -195.2169813478502
e(ll_0 - 234.3943376482347
e(rank 3

e(cmdline) "regress mpg weight price,vce (robust)"


e(title) "Linear regression"
e(marginsok) "XB default"
e(vce) "robust"
e(depvar) "rapg"
eCcmd) "regress"
e(properties) "b矿

e(predict) "regres_p"
e(model) "ols"
e(estatcmd) "regress_estat"
e(vcetype) "Robust"
238 基本有用的计量经济学

matrices :
e(b) : 1x3
e(V) : 3x3
e( V_modelbased) ; 3x3
functions :
e(sample)

3 . 两种宏

有时需要一些中间变量,
在数据处理过程中, 但不想将它保存在数据中,

者 有 些 语 句 需 要 重 复 书 写 ,这 时 可 以 考 虑 使 用 Stata提 供 的 宏 命 令 (macro) 。
Stata提 供 了 两 种 宏 :
全 局 宏 和 局 部 宏 。全 局 宏 会 在 整 个 进 程 中 有 效 ,
直到关闭
Stata软 件 ,
局部宏只在相应程序中有效,
程序结束,
局 部 宏 消 失 。一 般 应 用 中
很 少 使 用 全 局 宏 ,因 为 全 局 宏 比 较 危 险 ,它 可 能 会 影 响 到 所 有 程 序 中 相 同 名 字
宏的调用,
一 般 情 况 下 不 建 议 使 用 全 局 宏 ,除 非 用 户 非 常 清 楚 全 局 宏 的 影 响 。
宏 是 用 一 个 字 符 串 代 替 另 一 个 字 符 串 ,可 以 将 它 理 解 成 一 个 盒 子 ,
而里面会装
一些东西,
调 用 时 就 是 用 盒 子 里 的 东 西 来 替 换 宏 。全 局 宏 用 g l o b a l 定 义 ,
用$
调用,
局 部 宏 用 local定 义 ,
用 ‘,调 用 下 面 定 义 了 二 个 全 局 宏 xlist和一个
局 部 宏 xlist2,
它 们 里 面 都 装 了 字 符 串 price weight,
调 用 时 全 局 宏 用 $ xlist,
局部宏用‘
x l i s t 2 % 都 会 将 宏 中 的 字 符 串 取 出 来 ,可 以 利 用 display "xlist"和
display .•‘
xlist2 显示宏里面的字符串内容。

global xlist "price weight"


d i " $ xlist"
reg rapg $ xlist // 等价于命令 reg mpg price weight
local xlist2 "price weight"
d:T‘
xlist2,
"
reg mpg 6x l i s t 2 ,// 等价于命令 reg mpg price weight

使用宏的好处是,
有时要重复输入比较长的变量列表,
可以用宏来进行代替,

样可以避免不同的模型中变量输人的错误,
还 可 以 节 约 程 序 输 人 的 字 符 。另一
个好处是,
有时需要不断地调整一些参数,
而这些参数如果在程序的不同位置,
每次变更就会很麻烦,
但 是 如 果 用 宏 代 替 ,只 需 要 在 程 序 开 始 处 ,
对宏的内容进
行调整,
则此后所有语句中使用的宏的内容也就相应变化。因而,
灵活使用宏

①注意这里的左单引号是P C 键盘左上角〜键上的点.
附 录 St心 数 据 处 理 编 程 简 介 239

变量可以大大提高编程效率,
降低错误率。

4 . 三种循环语句

在 数 据 处 理 过 程 中 ,经 常 遇 到 一 些 重 复 处 理 的 工 作 ,
如果基本的处理过程
相似,
可 以 通 过 使 用 循 环 语 句 来 提 高 效 率 。Stata中 提 供 了 三 种 循 环 语 句 ,
分别
是 foreach、forvalues和 while。f o r e a c h 针 对 变 量 列 表 或 宏 列 表 ,非 常 有 弹
性,
进 行 循 环 的 可 以 是 没 有 任 何 规 律 的 变 量 列 表 。f o r v alues主 要 针 对 数 值 型
的循环,
wh i l e 更 加 自 由 ,
可 以 根 据 用 户 需 要 设 计 。下 面 看 一 个 简 单 的 循 环 ,

生 4 个随机数,
并 把 它 们 加 和 起 来 。先 用 下 列 语 句 生 成 4 个 标 准 均 匀 分 布 的 随
机数 x l 、
x2、
x3、
x4。

clear / / 关闭系统中的数据
set obs 100 / / 产 生 1 0 0 个样本点
set seed 1234 / / 设定随机产生器种子
gen xl = r un i f o r m O / / 产生一个标准均匀分布随机数
gen x2 = r u n i formO
gen x3 = runiformO
gen x4 = runiformO

下面,
我们用三种循环语句构造求和,
首 先 利 用 foreach实 现 :

gen sum = 0 / / 产生一个变量 sum


gen sum = 0
作为后面计算和的变量
local xlist "xl x2 x3 x4"
foreach var of varlist xl x2 x3 x4 foreach var of local xlist
qui replace sum = sum + 4varJ qui replace sum = sum +
} }
di "The sum of xl - x4 = " sum di "The sum of xl — x4 = "

上面两个程序都可以实现求和的效果,
左边利用变量列表,
右边是定义了
一个局部宏,
然 后 利 用 宏 列 表 。可 以 看 到 foreach后 面 的 参 数 是 一 个 局 部
宏,
调用时用单引号。
因 为 4 个变量具有一定的规律性,
其 中 的 数 字 是 按 顺 序 的 ,因 而 ,
也可
以 利 用 forvalues来 实 现 。

replace sum = 0 / / 重 置变量 s u m 为 零 ,


作为后面计算和的变量
forvalues i = 1/4 {
240 基本有用的计量经济学

qui replace sum = sum + x 4

}
di "The sum of xl - x4 = " sum

用 while也 可 以 实 现 。

replace sum = 0 // 重置 sum - 0

local i = 1 / / 设定初始指针
while ‘i ’< = 4 { / / 注意这里条件的设定,
i 是局部宏,
调用时用单引号
qui replace sum = sura +
local i = ‘ + 1

}
di "The sum of xl - x4 = " sura

上面举了个简单的小例子说明三种循环的使用,
具 体 应 用 方 法 可 k 参 考 Stata
的 帮 助 文 件 或 Baum(2016)Q

第 三 节 结 果 呈 现 利 器 :e S t o u t 软件包

在经济学实证分析中,
往往需要进行变量的简单统计和估计结果呈现,

果估计的模型比较多,
制作符合学术论文要求的表格往往需要花费一定的时
间,
瑞 士 苏 黎 世 大 学 社 会 学 研 究 所 的 Ben J a n n 提 供 了 一 个非常优秀的'結果呈现
软件包 estout,
①共包括 esttati、estout、
eststo、
estadd、
estpost 等 命 令 。est-
tab、
e stout命 令 将 Stata估 计 命 令 保 存 在 e()函 数 中 的 信 息 自 动 生 成 基 本 符 合
学术期刊要求的表格,
稍加修改一般就可以用在学术论文中,
对 于 不 提 供 e()的
命令,
可 以 使 用 estpost收 集 相 关 结 果 ,
并 将 它 们 推 送 (post)到 e ( ) 中 用 于 制 作
表格^ e s t s t o 类 似 于 Stata的 官 方 命 令 estimate store,可 以 将 估 计 结 果 保
存 起 来 用 于 后 面 的 分 析 。e s t a d d 可 以 将 没 有 包 含 在 e ( ) 函 数 中 的 结 果 添 加 到
结 果 中 去 。 因 为 estout软 件 包 不 是 官 方 命 令 ,
使 用 之 前 需 要 通 过 命 令 ssc in­
stall estout,replace进 行 安 装 ,
或 利 用 findit esto u t 搜 索 后 安 装 。
esttab的命令语法如下:

esttab [ namelist ] [ using filename ] [_,options estout_options ]

① 关 于 estout 软 件 包 的 详 细 介 绍 可 以 参 见 hup://repec. org/bocode/e/estout/i‘


ndex. html。
② postf ile、
post是另一组有用的命令, 具 体 用 法 可 以 参 考 Cameron and Trivedi(2010) 0
附 录 Stoto 数 据 处 理 编 程 简 介 241

它的作用是将保存的回归结果输出成表格。由于参考选项很多,
不再一一
介绍,
读 者 可 以 利 用 help estt a b 调 出 其 帮 助 文 件 进 行 査 询 ,
下面举一些例子,
管 窥 一 下 它 的 用 途 。首 先 利 用 Stata自 带 的 数 据 auto, dta估 计 两 个 线 性 回 归 模
型,
将 回 归 结 果 保 存 到 estl、est 2 中 ,
并 用 esttab命 令 将 估 计 结 果 表 格 输 出 到
Stata结 果 窗 口 。

. sysuse auto, c l e a r / / 打开系统自带数椐 auto, dta

(1978 Automobile Data)


. eststo :qui regress mpg weight price, vce(robust) // 将回归结果保存到 estl 中
(estl stored)

qui regress mpg weight price mpg foreign, vce(robust) //将回归结果保存


. eststo;
到 est2中
(est2 stored)
. e s t t a b / / 将刚才估计的两个结果输出到屏幕

(1) •.⑵
mpg
weight - 0 . 0 0 5 8 2 ”" -0.00678…
(-8.91) (-7.49)
price - 0.0000935 0.0000566
(-0.53) (0-29)
foreign -1,856
( —1,44)
_cons 3 9 . 4 4 “* 41,96…
(19.56) (17.65)

M 74 74

t statistics in parentheses
* p < 0 . 0 5 ,“ p < 0 _ 0 1 ,… p < 0 . 0 0 1

上 面 是 esttab输 出 的 结 果 ,
默认报告估计系数的t统计量,
也可以通过改变相
应 选 项 换 成 标 准 误 差 (se)、
p 值 (P ) 、置 信 区 间 (ci)或 估 计 中 生 成 的 任 意 参 数 统
计 量 (参 见 选 项 a u x ( ) 的 说 明 ),可 以 让 e s t t a b 报 告 调 整 的 i?2 (ar2) ,伪
i?2(pr2)、
AIC(aic)和 BlC(bic)模 型 选 择 标 准 。 另 外 ,可 以 通 过 选 项 scalars()
添 加 估 计 结 果 中 保 存 的 任 何 标 量 统 计 量 ,比 如 p 值 、
F 值、
模 型 自 由 度 (d f _ m )和
残差自由度(
df_r)等 ,
如果想 让 t 统计量或标准误差与系数并排排列,
可以加上
选 项 wide,输 出 宽 表 。 .
242 基本有用的计量经济学

. esttab, wide se ar2 scalars(F df rn df_r)

(1) (2)
rapg mpg
weight - 0.00582 … (0,000653) -0.00678“ (0,000905)
price - 0.0000935 (0.000175) 0.0000566 (0.000192)
foreign -1,856 (1,289)
_cons 39,44^ (2.016) 41. 9 6 … (2.378)
N 74 74
adj. R-sq 0.643 0. 649
F 51. 14 45,93
df_m 2 3
df_r 71 70

Standard errors in parentheses


* p<0.05, ” p<0.01, p<0.001

可 以 看 到 ,上 表 的 输 出 结 果 系 数 小 数 位 比 较 长 ,可 以 通 过 修 改 系 数
(b(fmt))、
标 准 误 差 (se(fmt))、拟 合 优 度 (ar2(fmt))等 参 数 输 出 格 式 改 变 输 出
小 数 位 数 。可 以 通 过 nost a r 选 项 禁 止 标 出 * ,也 可 以 通 过 star()选 项 改 变 星
号所代表的显著性水平,
还可以通过加选项mtitleO改变列标题。

• esttab, b ( % 1 2 . 4 f ) s e ( % 5 . 4 f ) a r 2 ( % 1 2 . 4 f ) star( * .10 ** .05 *** .01)


> m t i t l e C O L S 1" "OLS 2") wide

(1 ) (2 )
OLS 1 OLS 2
weight -0,0058… (0.0007) (0.0009)
price -0.0001 (0.0002) 0.0001 (0.0002)
foreign -1.8559 (1.2891)
_cons 3 9.4397“* (2.0163) 41+9595… (2.3777)
N 74 74
adj. R-sq 0.6434 , 0.6487

Standard errors in parentheses


’p < 0 . 1 0 ,” p < 0 . 0 5 , … p < 0 . 0 1

可 以 通 过 加 label选 项 ,
让 esttab报 告 变 量 的 标 签 而 非 变 量 名 ,可 以 通 过
nonumbers去 掉 每 列 的 数 字 ,可 以 通 过 选 项 t i t l e O 加 表 格 标 题 ,
addnote()增加
脚 注 。有 时 需 要 添 加 一 些 e s t t a b 选 项 中 没 有 定 义 的 参 数 ,
可 以 利 用 命 令 es-
tadd添 加 ,
利 用 s t a t s O 选 项 调 用 estadd构 造 的 宏 变 量 ,
用 scalars()调 用 es-
附 录 Stct。数 据 处 理 编 程 简 介 243

tadd产 生 的 标 量 。e sttab也 可 以 将 表 格 输 出 到 文 件 中 ,
利 用 using选 项 ,
可以
将 表 格 保 存 为 E xcel文 件 (.csv)、
W o r d 文 件 (.rtf)或 L a T e X 文 件 (.tex) 。

• qui reg mpg weight price, vce(robust)


. estadd local Control_foreign = "No" //Control_foreign 显示是否控制 foreign
added macro ;
e(Control foreign) :"NcT
. eststo ml
. qui reg rapg weight price foreign, vce(robust)
. estadd local Control—foreign = "Yes"//Control_foreign 显示是否控制 foreign
added raacro:
e( Control_foreign) ;"Yes"
. eststo m2
. esttab ral ra2,b( % 1 2 , 4 f ) se( % 5 . 4f) starC * ,10 * * .05 * * * .01) mtitle
("OLS " OLS 2") label stats(Control_foreign N r 2 _ a ,f m t ( % 3 s % 5 . Of % 5 . 4 f ))
title ("A si mple regression table") addnote("Source :auto, dta") wide
A simple regression table

(1) (2)
OLS 1 OLS 2
- 0.0058" *

Weight (lbs.) (0.0007) - 0.0068 (0.0007)
Price -0,0001 (0.0002) 0.0001 (0.0002)
Car type -1.8559 (1.4197)
3 9,4397“*

Constant (2.0163) 41.9595 (1,7330)
Control_foregin No Yes
N 74 74
r2_a 0.6434 0.6487

Standard errors in parentheses


Source :auto, dta
* p < . 1 0 ,^ p < . 0 5 ,… p < . 0 1

其 中 stats(,
[fmt()])调 用 est a d d 产 生 的 参 数 和 es t t a b 默 认 的 一 些 统 计 量 ,
fiutO设 定 对 应 参 数 的 显 示 格 式 。如 果 加 上 using filename, r t f 选 项 ,
上述结
果 将 保 存 到 文 件 fUename. rt f 中 ,不 再 显 示 在 屏 幕 上 ,可 以 用 W o r d 打 开
filename, rtf。下 面 的 命 令 将 上 述 表 格 保 存 在 文 件 table.rtf中 。
244 基本有用的计量经济学

. esttab ml m2 using table, rtf, b(%12.4f) se( %5. 4f) star( * .10 * * .05 * * *
. 01)

> m title C O L S 1" "OLS 2") label stats(Control foregin N r 2 _ a ,f m t ( % 3 s % 5 . Of % 5 .


> 4f)) t i t l e d simple regression table") addnote("Source ;auto, dta") wide comp
> ress replace
(output written to table, rtf)

用 W o r d 打 开 table, rtf后 ,
显 示 类 似 于 表 格 A. 1 ,
经 过 稍 加 修 改 后 ,即可以
粘贴到论文中使用,
这 样 就 可 以 集 中 精 力 进 行 研 究 设 计 ,而 不 必 在 输 出 结 果 上
花费太多时间,
大大提高了生产效率。

表 A. 1 A simple regression table

(1) (2)
OLS 1 OLS 2

Weight (lbs.) -0.0058** * (0.0007) - 0 . 0068*** (0.0007)

Price -0.0001 (0.0002) 0.0001 (0.0002)

Car type — 1.8559 Cl.4197)

Constant 39. 4397*“ (2.0163) 41.9595*" (1.7330)

Control—foregin No Yes

N 74 74

r2_a 0.6434 0.6487

Standard errors in parentheses


S o u r c e :auto, dta
s p<. 10,“p d … p<.0\

研究论文中一般需要报告变量的简单统计或假设检验,
变量的简单统计,
在 Stata软 件 中 可 以 使 用 £^mmarize、
tabstat等 命 令 ,
但这些命令返回值保存在
K ) 函数中,
estt a b 无 法 直 接 调 用 r()构 造 表 格 ,
需 要 利 用 estpost命 令 将 r()函
数 保 存 的 统 计 量 推 送 (post)到 e()函 数 中 ,
然 后 可 以 利 用 esttab输出相应的简
单统计表格。
附 录 S tM 数 据 处 理 编 程 简 介 245

. sysuse auto
(1978 Automobile Data)
. estpost summarize mpg weight price foreign

e(count) e ( s u m w ) e(mean) e(Var) e(sd) e(min) e(max)

74 74 21.2973 33.47205 5.785503 12 41


weight 74 74 3019.459 604029.8 777.1936 1760 4840
price 74 74 6165.257 8699526 2949.496 3291 15906
foreign 74 74 .2972973 .2117734 .4601885 0 1

e(suia)

mpg 1576
weight 223440
price 456229
foreign 22

. esttab ., c e l l sCmean sd count") noobs nonumber

mean sd count

mpg 21.2973 5.785503 74


weight 3019.459 1 1 1 .1936 74
price 6165.257 2949.496 74
foreign .2972973 .4601885 74

利 用 tabstat进 行 分 组 统 计 ,
也 可 以 利 用 using filename选 项 将 结 果 保 存 到
文 件 中 去 。另 外 ,
estpost 还 可 以 推 送 ttest、
@bulate、
£2£relate、
ci、margins 等生
成 的 r()函 数 结 果 ,
限于篇幅,
在此不再一一详述,
读 者 可 以 自 行 参 考 estpost帮
助文件。

. sysuse aut o } clear


(1978 Automobile Data)
• estpost tabstat mpg weight price, by (foreign) statistics (mean sd) columns (sta­
tistics)
Summary statistics ;mean sd
for variables :mpg weight price
by categories of :foreign
246 基本有用的计量经济学

foreign e(rnean) e(sd)

Domestic
mpg 19.82692 . 4,743297
weight 3317.115 695,3637
price 6072,423 3097,104
Foreign
mpg 24.77273 6.611187
weight 2315.909 433.0035
price 6384.682 2621,915
Total

mpg 21,2973 5,785503


weight 3019.459 777.1936
price 6165.257 2949.496

. esttab . ,main(mean) aux(sd) unstack noobs label nogap nonnmber

Domestic Foreign Total

Mileage (mpg) 19.83 24. 77 21.30


(4.743) (6.611) (5.786)
Weight (lbs.) 3317.1 2315.9 3019.5
(695,4) (433.0) (777.2)
Price 6072.4 6384.7 6165.3
(3097.1) (2621.9) (2949.5)

mean coefficients ;sd in parentheses


* p<0.05, p<0"01 , … p<0.001

第四节练 习

1. 随 机化 实验 数 据 分 析

利 用 美 国 国 家 培 训 示 范 项 目 (N S W ) 实 验 数 据 n s w —dw. dta,
估计培训的平
均因果效应,
请利用下列四种方法估计培训的影响,
并写出相应的do文件。
1 . 两组结果平均值之差P 7 。
2.简单回归系数产。
3. 控 制 协 变 量 a ge、
education、
black、
married、
re74、
r e 7 5,
参考(
3. 11) 。
4 . 控 制 协 变 量 ag e 、education、
black、
married、
re74、re75 及 其 与 干 预 变
附 录 stm o 数 据 处 理 编 程 简 介 247

量 treat的交叉项,
注 意 交 叉 项 中 的 协 变 量 要 去 均 值 (deme a n ) ,参 见 (
3. 13)。

2 . 教育收益率估计

利 用 第 7 3 页 描 述 的 2 0 0 2 年 中 国 居 民 收 入 调 查 (C H I P ) 城 镇 数 据
chip2002,
用 回 归 命 令 regress估 计 四 个 模 型 ,
并 将 估 计 结 果 生 成 类 似 表 5. 1 的
表格。
第 1 个 回 归 估 计 基 本 的 Mincer方 程 ,
控 制 educ、exper、
expersq,
第 2 个回
归 在 模 型 1 基础上再控制性别male和城市固定效应,
第 3 个 回 归 在 模 型 2 的基
础上再控制行业固定效应,
前 三 个 模 型 均 使 用 修 正 异 方 差 的 稳 健 标 准 误 差 vce
(robust),
第 4 个回归与模型3 相同,
但 使 用 聚 类 到 城 市 的 标 准 误 差 vCe(C lus-
ter city),将 估 计 过 程 所 需 程 序 写 到 d o 文 件 中 。

3 . 培训的作用:
倾 向 指 数匹配方法

利 用 N S W 实 验 数 据 n s w —dw. d t a 的 干 预 组 和 美 国 人 口 调 査 数 据 cps一con­
trols, dta 合并为 一 个 数 据 集 (利用 append u s i n g 命 令 ),
并利用合并好的数据
集 复 制 (replicate)Dehejia and W a h b a (1999)表 1 的 简 单 统 计 和 表 3 的 估 计 结
果 。请 编 写 d o 文 件 完 成 下 列 工 作 :
( 1 ) 将 随 机 化 实 验 数 据 nsw_dw. dta的 干 预 组 (treat = 1) ,
与 C P S 数 据 cps_
controls. dta(treat=0)合 并 在 一 起 ,
并进行简单统计,
生 成 类 似 于 第 1 1 0 页的分
组 (干 预 组 和 控 制 组 )简 单 统 计 结 果 。
(2)估计倾向指数,
并 画 出 倾 向 指 数 分 布 (根 据 干 预 状 态 进 行 分 组 ,
可以使
用 histogram或 k d ensity命 令 ),比 较 两 组 倾 向 指 数 分 布 的 差 别 。
( 3 ) 进 行 样 本 匹 配 。利 用 1 : 1 最近邻匹配,
获得
体,
并构造匹配样本。
(4)检验匹配样本协变量平衡性,
并估计干预组平均因果效应(
A T T )。
( 5 ) 利 用 随 机 化 实 验 控 制 组 数 据 与 C P S 调 査 数 据 ,检 测 C I A 条 件 是 否
成立。

4 . 教育收益率估计:
I V 方法

利 用 Angrist and Krueger(1991)提 供 的 数 据 集 angrist. dta,


利用出生季度
作为工具变量,
估 计 教 育 收 益 率 。数 据 集 信 息 见 第 1 3 9 页 。请 编 写 d o 文 件 分
别 利 用 O L S 和 I V 方法估计下列4 组模型,
并 将 最 终 结 果 输 出 为 类 似 于 第 143
页的表格。
248 基本有用的计量经济学

- ( 1 ) 只 引 人 教 育 变 量 (E D U C ) 和 出 生 年 度 (
Y R 2 0 — Y R 2 8 ) 的 Micer方 程 。
(2)在 模 型 1 基础上控制年龄及其平方( A G E Q 、
A G E Q S Q )。
( 3 ) 在 模 型 1 基 础 上 控 制 种 族 (R A C E ) 、婚 姻 状 态 (M A R R I E D ) 、城 市
(S M S A ) 和 地 区 (N E W E N G 、M I D A T L 、E N O C E N T 、W N O C E N T 、
SOATL、
ES-
OCENT、
WSOCENT、
M T )。
( 4 ) 在 模 型 3 基础上控制年龄及平方( A G E Q ' A G E Q S Q h

5. 最 低 工 资 对 就 业 的 影 响

利用 Card and Krueger (1994)提供的数据 cardkruegerl994. dta,利用双重


差 分 法 估 计 最 低 工 资 调 整 对 新 泽 西 州 快 餐 业 就 业 的 影 响 。 数 据 说 明 见 第 173
页 。编 写 d o 文 件 ,
完成下列估计:
(1)利 用 回 归 D I D 估计最低工资对新泽西州快餐店就业的影响,
分别估计
不控制和控制快餐店品牌类型的模型。
( 2 ) 比较最低工资调整对就业2 0 % 分 位 和 8 0 % 分位上的影响差别。
(3)利 用 核 匹 配 D H X P S M - D I D ) 方法估计最低工资调整的影响^

6 . 加州香烟控制法案的影响:
合成控制法

利 用 Abadie et al. (2010)提 供 的 数 据 smoking, dta,


利用合成控制法估计
加 州 香 烟 控 制 9 9 法 案 对 加 州 香 烟 消 费 的 影 响 。编 写 d o 文 件 ,
完成下列工作:
( 1 ) 重 现 (replicate) Abadie et alo. (2010)的图 1 ,
类似于图 8 . 4 。
(2)估计合成控制组,
计算平均因果效应,
并 复 制 Abadie et al. (2010)的图
2 和 图 3,
类 似 于 图 8 . 5 和 图 8. 6 。
(3)进行置换检验,
画 出 类 似 图 8. 7 的图形^

7 . 在位党在竞选中是否有在位优势?

利 用 Lee(2008)的 数 辩 lee. dta,


数 据 说 明 参 见 第 2 1 7 页 。请 用 断 点 回 归 设
计(RDD),
估 计 民 主 党 在 位 是 否 有 助 于 其 在 下 一 轮 竞 选 中 获 胜 。编 写 d o 文 件 ,
完成下列工作:
( 1 ) 画 出 结 果 变 量 vote与 参 考 变 量 m a r g i n 之 间 的 关 系 图 ,
检验是否在断
点处存在跳跃。
( 2 ) 利 用 局 部 线 性 回 归 方 法 (L L R ) 估 计 在 位 党 竞 选 优 势 ,
用交叉验证方法
( C V )估 计 最 优 带 宽
( 3 ) 画 出 参 考 变 量 分 布 图 ,检 査 在 断 点 处 是 否 存 在 跳 跃 ,
并 利 用 McCrary
附 录 Stot。数 据 处 理 编 程 简 介 249

(2008)密 度 检 验 法 检 验 个 体 是 否 有 精 确 操 控 断 点 的 能 力 。
( 4 ) 稳 健 性 检 验 。检 验 其 他 协 变 量 在 断 点 处 是 否 连 续 ,
检验在参考变量其
他位置是否存在跳跃,
画出相应图形并进行相应检验。

8 . 弯折回归设计(
R K D )估计

利 用 第 2 28页的数据生成过程,
编 写 do文件,
生成一个样本容量为100的
样本,
画 出 类 似 于 图 9.1 4 的 图 形 ,
并 利 用 断 点 估 计 R K D 估 计 量 ,讨 论 估 计 出 的
D 对 Y 的影响与实际值的差异。
参考文献

1 . 洪永淼. 高级计量经济学. 北 京 :
高 等 教 育 出 版 社 ,2011.
2. 丁 鹏 . 因 果 推 断 简 介 之 一 至 八 . http://cos,

3 . 韩 乾 、洪 永 淼 . 国 家 产 业 政 策 、资 产 价 格 与 投 资 者 行 为 . 经 济 研 究 ,2 0 1 4 ,( 1 2 ) ;
143— 158.
4 . 赵西亮. 倾向指数匹配方法:
模型设定和变量选择问题. 数量经济技术经济研究,
2 0 1 5 ,(1 2 ) :133— 147.
5 . 赵 西 亮 ,教 育 、户 籍 转 换 与 城 乡 教 育 收 益 率 差 异 . 工 作 论 文 ,2016.
. 6 . 赵 西 亮 . 也 谈 经 济 学 经 验 研 究 的 “可 信 性 革 命 经 济 资 料 译 丛 ,20 1 7 ,(2 ) ;8 0 - 9 0 ,
7. Alberto Abadie- Semiparametirc Difference-in-Differences. Review of Economic

Studies y?2:
l— 19, 2005,
8. Alberto A b a d i e and Sofia Dermisi. Is Terrorism Eroding Agglomeration E c o n o m i c s in

Central Business Districts? Lessons f r o m the Office Real Estate M a r k e t in D o w n t o w n

Chicago. J o u r n a l o f U r b a n E c o n o m i c s , 6 4 : 4 5 1 — 4 6 3 ,2008.

9. A lberto A badie and Javier Gardeazabal. The Economic C o sts of C on flict:A Case
Study of the B a s q u e Country. A m e r i c a n E c o n o m i c R e v i e i v ,93(1) :1 1 3 一 132 j 2003-

10. Alberto A b a d i e and G u i d o W . lmbens. La r g e S a m p l e Properties of Matc h i n g

Estimators for A v e r a g e T r e a t m e n t Effects. E c o n o m e t r i c a ,7 4 :


2 3 5 — 267, 2006.

11. Alberto A b a d i e and G u i d o W . lmbens. Bias-corrected M a t c h i n g Estimators for

A v e r a g e T r e a t m e n t Effects. J o u r n a l o f busitiess &- e c o n o m i c statistics , 29(1) :1— 1 1 ,2011.

12» Alberto A b a d i e ,Joshua D. Angr i s t ,an d G u i d o W . lmbens. Instrumental Variables

Estimates of the Effect of Subsidized Training o n the Quantiles of Trainee Earnings.

Econometrica , 70: 91 一 1 1 7 ,2002.


13. Alberto A b a d i e , David D r u k k e r , Jane L e b e r H e r r , and Guido W. lmbens.

I mplementing M a t c h i n g Estimators for A v e r a g e T r e a t m e n t Effects in Stata. The Stata

Journal, 4(3) :290— 3 1 1 ,2004.


14. Alberto A b a d i e ,Alexis D i a m o n d ,a nd Jens Hainmueller. Synthetic Control M e t h o d s

for Compa r a t i v e C a s e Studies Estimating the Effect of California’


s T o b a c c o Control Program.

J o u r n a l o f the A m e r i c a n Statistical Association 5 105(490) :493— 5 0 5 ,2010.

15. Alberto Abadie, Alexis D i a m o n d , an d Jens Hainmueller. Comparative Politics and

the Synthetic Control Method. American Journal o f Political Science > 59 ( 2 ) :495—
510,2015.
参考文献 251

16. Joshua D, A n g r i s t Lifetime Earnings a n d the V i e t n a m era Draft Lottery :Evidence

f r o m Social Security Administrative Records. A m e r i c a n E c o n o m i c R e v i e w ,80(3) :


313— 3 3 6 ,
1990,

17. Joshua D, Angrist a nd A l a n B, Krueger. D o e s C o m p u l s o r y Schooling Affect

Schooling a n d Earnings. Q u a r t e r l y J o u r n a l o f E c o n o m i c s ^ C V I C 4 ) :
9 7 9 * ^ 1 0 1 4 ,1991.

18. Joshua D, Angrist a nd A l a n B. Krueger. Instrumental Variables and the Search for

Identification;F r o m S u p p l y and D e m a n d to Natural Experiments. Journal o f Economic

Perspectives , 15(4): 6 9 _ 8 5 ,2001,


19. Joshua D. Angrist a n d A l a n B, Kruger. Empirical Strategies in L a b o r Economics.
In A, Ashenfelter an d D. Card, Editors, H a n d b o o k o f Labor Economics, Volume 3,
Elsevier Science, 1999.

20. Joshua D Angrist an d Jorn-Steffen Pischke. M o s t l y H a r m l e s s E c o n o m e t r i c s : A n


E m p i r i - cist 、 C o m p a n i o n , Princeton University Press, 2009.

21. Joshua D, Angrist an d Jorn-Steffen Pischke. T h e Credibility Revolution in Empirical

E c o n o m i c s ;H o w Better Research Design is T a k i n g the C o n out of Econometrics. J o u r n a l o f


E c o n o m i c P e r s p e c t i v e s ,24(2) :
3— 3 0 ,2010,

22* Joshua D. Angrist a nd Miikka Rokkanen, Wanna Get away? Regression

Discontinuity Estimation of Exam School Effects away from the Cutoff. Journal o f the
A m e r i c a n Statistical Association , 1 1 0(512) :1 3 3 1 — 1344, 2015.
23. Joshua D. Angrist,G u i d o W . I m b e n s ,a n d D o n a l d B. Rubin. Identificatin of Causal
Effects U s i n g Instrumental Variables, J o u r n a l o f the A m e r i c a n Statistical Association ? 91

(434):444— 4 5 5 ,1996.
24* Joshua D. Angrist, Victor Lavy, a n d Analia Schlossen Multiple Experiments for

the Causal L i n k b e t w e e n the Quantity an d Quality of Children. J o u r n a l o f L a b o r E c o n o m i c s ,

28(4) :
7 7 3 — 824, 2010.
25. Joshua D, Angrist and Jorn-Steffen Pischke. Undergraduate Econometrics
Instruction; T h r o u g h our Classes, Darkly. W o r k i n g P aper 2 3 1 1 4 , National Bur e a u of

E c o n o m i c Research, February 2017.


26. Orley Ashenfelter, Estimating the Effect of Training P r o g r a m s on Earnings. The

R e v i e w o f E c o n o m i c s a n d Statistics ,4 7 — 5 7 ,1978,

27. Christopher F f B a u m , A n Introduction to M o d e r n E c o n o m e t r i c s U s i n g Stata. Stata


Pr e s s ,2006.

28. Christopher F. Baum. An Introduction to Stata P r o g r a m m i n g . Stata P r ess, 2


edition, 2016.

29. Sascha O. Becker an d A n d r e a Ichino. Estimation of A v e r a g e T r e a t m e n t Effects


Bas e d o n Propensity Scores. T h e Stata J o u r n a l ,2(4) :
3 5 8 — 3 7 7 ,2002.

30. P. J. Bickel, E. A, H a m m e l , a nd J. W. O'Connell- S e x Bias in Graduate


252 基本有用的计量经济学

A d m i s s i o n s :Data f r o m Berkeley, Sc i e n c e ,187:398'~ 4 0 4 ,1975.


31. Donald E. Bowen, Laurent Fresard, and J e r o m e P. Taillard. W h a t s Your
Identification Strategy? Innovatin in Corporate Finance Research. M a7 i a g e m e ? i t S c i e n c e ,

Forthcoming.

32. M. Caliendo, , K. Tatsiramos, and A. Uhlendorff. Benefit Duration,


U n e m p l o y m e n t Duration and J ob M a t c h Quality: A Regression-discontinuity Approach.

Jouranl o f Appllitd Econometrics , 28(4) :


604— 6 2 7 ,2013,
33. Sebastian Calonico, Matias D. Caltaneo, a nd Rocio Titiunik. R o b u s t Nonparametric

Confidence Intervals for Regression-discontinuity Designs, E c o u o m e l r i c a ? 82 ( 6 ) :2 2 9 5 —

2 3 2 6 ,2014a.

34. Sebastian Calonico, Matias D. Cat t a n e o ,an d Rocio Titiunik, R o b u s t Data-driven


Inference in the Regression-discontinuity Design. The Stata Journal f 14 ( 4 ) ;9 0 9 —

9 4 6 ,2014b. •
35. Sebastian Calonico, Matias D. Cattaneo,and M a x H, Farrell, O n the Effect of Bias

Estimation o n C o v e r a g e Acc u r a c y in Nonparametric Inference, J o u r n a l o f the A m e r i c a n

Satisiical Association ,2017a.


36. Sebastian Calonico* Matias D, Cat t a n e o , M a x H. FarreLU and Rocio Titiunik.

rdrobust:Software for Regression-discontinuity Designs. T h e Staia J o u r n a l ? 2017b.


37. A Colin Cameron a nd Pravin K Trivedi. Microeconometrics; M e t h o d s and

A p p l i c a t i o n s . C a m b r i d g e University P r e s s ,2005.

38. A Colin C a m e r o n a nd Pravin K Trivedi, M i c r o e c o n o m e t r i c s U s i n g S t a t a . Stata

Press? 2010.
39. D avid C a r d a n d A l a n B» Krueger. M i n i m u m W a g e s a nd E m p l o y m e n t :A Case Study

of the Fast-food Industry in N e w Jersey a nd Pennsylvania, A m e r i c a n E c o n o m i c R e v i e z v , 84

( 4 ) : 7 7 2 — 7 9 3 ,1994.

40. David Card, A n d r e w Johnston, Pauline L e u n g , A l e x andre M a s ? and Z h u a n Pei.

T h e Effect of U n e m p l o y m e n t Benefits o n the Duration of U n e m p l o y m e n t Insurance Receipt:


N e w Evidence f r o m a Regression K i n k Design ii> Missouri, 2 0 0 3 — 2013, A m e r i c a ? ! E c o n o m i c
R e v i e w • Papers &- Proceedings , 105(5) ;
126— 1 3 0 ,2015a.
41. David C a r d ,David S. L e e ,Z h u a n Pei, a nd A n d r e a W e b e r . Inference o n Causal

Effects in a Generalized Regression Kink Design. Econometrica» 83(6) :


2453—2483 ,2015b.
42. David Card, David S. Lee, Z h u a n Pei,a nd A n d r e a W e b e r . Regression K i n k D e s i g n ;

T h e o r y and Practice, W o r k i n g Paper 2 2 7 8 1 ,National B u r e a u of E c o n o m i c Research, 2016.


43. Jin-young Choi and Myoung-jae Lee. Regression Discontinuity: R e v i e w with

Extensions. Statistical Papers ’V ~ 30 j 2016. doi :10. 1007/s00362-016-0745-z.


44. T h o m a s D. Cook. “Waiting for Life to Arrive,
,:A History of the Regression-
discontinuity Design in Psychologyi Statistics an d Economics. J o u r n a l o f Eco?iometrics , 142
参考文献 253

(2):
6 36 — 654, 2008.-

45. R. Dehejia and S, W a h b a . Causal Effects in Nonexperimental Studies:Reevaluating


the Evaluation of Training Programs. Journal o f Ajnerican Statistical Association,9 4 ( 3 ) ;
1053— 1062, 1999.
46. J o h n D i N a r d o and David S. Lee. P r o g r a m Evaluation and Research Designs.

C h a p t e r S ,H a n d b o o k of L a b o r Economics, Vol. 4 :4 6 3 — 536 (Editor;O r l e y ,Ashenfelter


and D a v i d ♦C a r d ) , Elsevier,2011.

47. Yingying D ong. J u m p or K i n k ? Identification of Binary T r e a t m e n t Regression


Discontinu-ity Design without the Discontinuity, W o r k i n g paper, University of California
Irvine, 2014.

48. Yingying Do n g - Regression Discontinuity Designs with S a m p l e Selection. W o r k i n g


Paper, University of California Irvine,2016,

49. Yingying D o n g a nd A r t h u r Lewbel. Identifying the Effect of C h a n g i n g the Policy


Thresh-old in Regression Discountinuity Models. T h e Reviezv o f E c o n o m i c s a n d Statistics ,

97 ( 5 ) ;1 0 8 1 — 1092, 2015.

50* Esther D u f l o , Rachel Glennerster, a n d Michael Kre mer. U s i n g Randomization in

D evel-opment E c o n o m i c s R e s e a r c h : A Toolkit. In T. Paul Schultz and J o h n Strauss,

Editors, H a n d b o o k o f D e v e l o p m e n t E c o n o m i c s , V o l u m e 4 , 3 8 9 5 — 3962, North-Holland?


A m s t e r d a m ,2008,

51- Felix Elwert and Christopher Winship, E n d o g e n o u s Selection Bias:T h e P r o b l e m of

Conditioning o n a Collider Variable, A n n a l R e v i e z v o f S o c i o l o g y , 40: 3 1 — 5 3 ,2014.

52* Ernst F e h r and Lorenz Goette. Do Workers Work More if W a g e s are H i g h ?


Evidence f r o m a R a n d o m i z e d Field Experiment, The Amtrican Economic R e v i e w , 9 7 ( 1 ) ;

2 9 8 — 3 1 7 ,2007,

53. R o n a l d A y l m e r Fisher. T h e D e s i g n o f K x p e r i m e n l s . Oliver B o y d ,1935.


54. B r i g h a m R, F r a n d s e n , M a r k u s Frolich, an d Blaise Melly. Quantile Tr e a t m e n t

Effects in the Regression Discontinuity Design. J o u r n a l o f E c o n o m e t r i c s ,168(2) ;


382— 3 9 5 ,

2012 .
55. Trygve Haavelmo. The Statistical Implications of a S y s t e m of Simultaneous

Equations. 'Econometrica^ 11(1) :1 ^ 1 2 ,1943,


56. Jinyong H a h n , Petra T o d d , and Wilbert V a n der K l a a u w * Evaluating the Effect of

a n Antidiscrimination L a w U s i n g a Regre^ssion-discontinuity Design, W o r i n g Paper 7 1 3 1 ,

National Bureau of E c o n o m i c Research* 1999.


57. Jinyong H a h n , Petra T o d d , and Wilbert van der Kllaauw. Identification and

Estimation of Treatment Effects with a Regression Discontinuity Design. Ecojwmetrica, 69


( 1 ) : 2 0 1 — 2 0 9 ,2001.

58. Trevor Hastie? Robert Tibshirani, and Jerome Friedman. The Elements of
254 基本有用的计量经济学

Statistical Learning ; Data Mining, Inference, a n d Prediction. Springer Series in

Statistics. Springer, 2 n d edition, 2009.


59. J, A. H a u s m a n an d D. A, Wise, Social Experiment, Truncated Distributions and

Efficient Estimation. E c o n o m e t r i c a , 9 1 9 一 9 3 8 ,1977,

60. F u m i o Hayashi. E conometrics. Princeton University P r e s s ,2000.


61. J a m e s J, H e c k m a n , S a m p l e Selection Bias as a Specification Error, E c o n o m e t r i c a ,

74(1 ) :153— 1 6 1 ,1979.


62* J a m e s J. Heckman. Instrumental Variables: A Studey of Implicit Behavioral
A s s u m p t i o n s U s e d in M a k i n g P r o g r a m Evaluations, j o u r n a l o f H u m a n R e s o u r c e s , 32 :
441—

462, 1997-
63. J a m e s J, Heckman. Mi c r o data, Heterogeneity, a n d the Evaluation of Public
Policy:Nobel Lecture. Journal o f Political E c o n o m y ,109(4) :673— 7 4 8 ,2001.
64. J a m e s J. H e c k m a n . Building Bridges b e t w e e n Sturctural a n d P r o g r a m Evaluation

A p-proaches to Evaluating Policy‘J o u r n a l o f E c o n o m i c L i t e r a t u r e ,4 8(2) ;


35 6 — 3 9 8 ,2010,
65. J a m e s J. H e c k m a n a n d Richard R o b b . Alternative M e t h o d s for Evaluating the

Impact of Interventions;A n Overview. J o u r n a l o f E c o n o m e t r i c s ? 30(1) :


2 3 9 — 267, 1985*
66. James J, Heckman, Hidehiko I c himura, a n d Petra T o dd. Matching as an

Econometric Evaluation E stimator: Evidence f r o m Evaluating a Job Training P r o g r a m m e .

R evi e w o f Economic Studies ,6 4 ;


605— 6 5 4 ,1997.
67. James J, H e c k m a n , H i dehiko Ichimura? and Petra T o d d . Matching as an

Econometric Evaluation Estimator. R e v i e w o f Eco?iomic S t u d i e s ,65 ;26 1 — 294 f 1998.

68. David F. Hendry. Econometrics-alchemy or Science? E c o n o m i c a l 47 (188) :3 8 7 _

406, 1980.
69» Migu e l A. H e r n a n and J a m e s M . Robins. C a u s a l I n f e r e n c e t Boca R a t o n ;C h a p m a n

H a l l / C R C , Forthcoming-
70. Paul W . Holland. Statistics a n d Causal Inference. Journal o f the A m e r i c a n

Statistical Association , 81 :
9 4 5 970, 1986.
71. Paul W . H olland and D o n a l d B, Rubin, O n Lord’
s Paradox. Technical R e p o r t ,

Educa-tional Testing Service? Princeton, N e w Jersey 08541, M a y 19S2.


72. D. G- Horvitz and D. J. Thompson. A Generalization of Sampling without

Replacement from a Finite Universe. Jouranl o f the American Statistical Association,47


(260):
6 6 3 — 685, 1952.

73. C h e n g Hsiao. A n a l y s i s o f P a n e l D a t a . C a m b r i d g e University Press, 2014.


74. C h e n g Hsiao, H. Steve Ching, a nd Shui Ki W a n . A Panel Data A p p r o a c h for

P r o g r a m Evaluation; M e a s u r i n g the Benefits of Political a nd Economic Integration of

Hongkong with Mainland China. Journal of Applied E c o n o m e t r i c s t 27 ( 5 ): 7 0 5 —

740, 2012.
参考文献 255

75. G u i d o W . Imbens. Nonparametric Estimation of A v e r a g e T r e a t m e n t Effects under


Exo-geneity:A Review. R e v i e w o f E c o n o m i c s a n d Statistics ,86(1) :
4 — 29? 2004,

76. G u i d o W , Imbens. Better Late than N o t h i n g :S o m e C o m m e n t s o n Deaton (2009)


and H e c k m a n and Urzua (2009). Journal o f Economic Literature ,48(2) :
399— 4 2 3 ,2010.
77. G u i d o W t I m b e n s a nd Joshua D. Angrist. N o n p arametric Estimation of A v e r a g e

Treat-ment Effects under Ex o g e n e i t y:A review. E c o n o m e t r i c a , 62(2) :


4 6 7 — 475, 1994.

78. G u i d o W . I m b e n s a nd Karthik Kal y a n a r a m a n , Optimal B a n d w i d t h Choice for the


R e g r e s s i o n Discontinuity Estimator. The Review of Economic S t u d i e s , 79 ( 3 ): 9 3 3 —

9 5 9 ,2012.

79. G u i d o W , I m b e n s a nd T h o m a s L e m ieux. Regression Discontinuity Designs: A Gui d e


to Practice, Journal o f Econometrics ? 142(2) :
6 1 5 ~ 635* 2008.
80. G u i d o W , I m b e n s an d D o n a l d B. Rubin, C a u s a l In f e r e n c e in Statistics ? Social 9

and Biomedical Sciences : A n Introduction• Cambridge and New Y o r k ; Cambridge


University Press, 2015.

81. Guido W . Imbens a nd Jeffrey M P Wooldridge. Recent D e v elopments in the


Econometrics of P r o g r a m Evaluation, J o u r n a l o f E c o n o m i c L i t e r a t u r e ,47(1) :1 ~ -81,2009,

82. Brian A. Jacob a n d Lars Lefgren. R e m e d i a l Education and Student A c h i e v e m e n t ;A


Regression-discontinuity Analysis. The Review o f Economics and Statistics ,86(1) :226—
2 4 4 ’2004.

83. Luke J, Keele an d Rocio Titiunik* Geographic Boundaries as Regression

Discontinuities. Political Analysis , 23(1) :


127— 15.5,2015.
84. G a r y K i n g an d Richard Nielsen, W h y Propensity Scores Should not be U s e d for
Matching. W o r k i n g Paper, H a r v a r d University, 2016.

85. A l a n B. Krueger, Experimental Estimates of Education Production Functions. T h e

Quar~terly Journal o f Economics 、114(2) :


497— 532, 1999*
86. Rafael Lalive. How do E x t e n d e d Benefits Affect U n e m p l o y m e n t Duration? a
Regression Discontinuity Approach. J o u r n a l o f E c o n o m e t r i c s , 142(2) :
78 5 一 806, 2008.

87. Robert J. L a L o n d e . Evaluating the E conometric Evaluations of Training P r o g r a m s


with Experimental Data, T h e A m e r i c a n E c o n o m i c R e v iezv , 76(4) :
6 0 4 — 620 ? 1986.
88. E d w a r d E. Learner, Let’
s T a k e the C o n out of Econometrics. The American

Economic Review^ 73(1) :


31 一4 3 ,1983.
89. Michael. Lechner. T h e Estimation o£ Causal Effects by Difference-in-difference
Methods. F o u n d a t i o n s a n d T r e n d s in E c o n o m e t r i c s , 4(3) :165一 224, 2010-
90. David S* Lee. R a n d o m i z e d Exper i m e n t s f r o m N o n r a n d o m Selection in U* S. H o u s e

Election, Journal o f Econometrics i 142(2) :


675— 697, 2008.
91. David S. L ee a nd Thomas L e m ieux. Regression Discountinuity Designs in

Eonomics. Journal o f Economic Literature i 48(2) :


281— 3 5 5 ,2010.
256 基本有用的计量经济学

92. E. L e u v e n and B* Sianesi, P s m a t c h 2 :Stata M o d u l e 10 P e r f o r m full Mahalanobis and


Propensity Score M a t c hing, C o m m o n Support Graphing, a nd Covariate Imbalance Testing.

http;
//ideas. repec. org/c/boc/bocode/s432001. html, 2003.

93. F. Lord. A paradox in the Interpretation of Gro u p Comparisons. Psychological


Bulletin, 68:304— 305, 1967,
94. Jens L u d w i g and Douglas L. Miller. Does H e a d Start Improve Children's Life
Chances? Evidence from a Regression Discontinuity Design, Quarterly Jounml of

Economics , 122 (1):159— 2 0 8 ,2007.


95. Justin McCrary. Manipulaiton of the Running Variable in the Regression

Discontinuity D e s i g n ;A Density Test. J o u r n a l o f E c o n o m e t r i c s » 142(2) :6 98— 7 1 4 ,2008.


96. Stephen L. Morgan and Christopher Winship. Counterfactuals and Causal

I n f e r e n c e :M e t h o d s a n d Principles f o r Social R e s e a r c h • Cambridge University Press,

second edition, 2015.


97. W h i t n e y K. Newey and K e n n e t h D. West. A Simple, Positive Semidefinite,

Heteroskedavs-ticity and Autocorrelation Consistent Covariance Matrix, Econometrica ? 55


(3);
70 3 — 708, 1987.
98. Jerzy Neyman. On the Application of Probability Theory to Agricultural

Experiments. Essay on Principles. Section 9. Statistical Scicuce f 5 ( 4 ) :4 6 5 一 472,

1923,1990.
99. H . S. Nielsen, 丁. Sorensen, and C. R. Taber. Estimating the Effect of Student

Aid o n College Enrollment :Evidence fro m a G o v e r n m e n t G r a nt Policy Reform. American

Economic J o u n m l :Erowo/mV ,2:185— 215, 2010.


100. Philip Oreopoulos. Estimating A v e r a g e a nd Local A v e r a g e Tr e a t m e n t Effect of

Education W h e n C o m p u l s o r y Schooling L a w s Really Matter. A m e r i c a n E c o n o m i c R e v i e w ^ 96


(1): 1 52 — 175, 2006.
101. M i n O u y a n g and Yulei Peng» T h e Treatment-effect Estimation:A Case Study of

the 2008 E c o n o m i c Stimulus P a c k a g e of China. J o u r n a l o f Eccmojnetrics , 188 (2): 545 —


5 5 7 ,2015.

102. M a t t h e w T. P a n h a n s an d J o h n D. Singleton. T h e Empirical El o n o m i s t ^ Toolkit:


F r o m M o d e l s to M e t h o d s . W o r k i n g Paper, D u k e University, 2016.

103. Judea Pearl- Causal D i a g r a m s for Empirical Research. B i o m e t r i k a •> 8 2 ( 4 ) : 66 9 —

6 8 8 ,1995.
104. Judea PearL Causation, A c t i o n ,a nd Counterfactuals. In P r o c e e d i n g s o f the 6th
C o n f e r ence on Theoretical A s p e c t s o f R a t ionality cuid Kfttrw l e d g e ,T A R K ,
9 6 ,5 1 — 7 3 ,San

Francisco,C A , U S A ,1996. M o r g a n K a u f m a n n Publishers Inc* I S B N 1-55860-417-9.


105. Judea Pearl. Causality. C a m b r i d g e University P r e s s ,2009.

106. Z h u a n Pei and Yi Shen. T h e Devil is in the Tails :Regression Discontinuity Design Wit h
参考文献 257

Measur e m e n t Error in the Assignment Variable. W o r k i n g Paper? Cornell Univeristy, 2016,

107. Yu Ping. Identification in Regression Discontinuity Designs with M e a s u r e m e n t


Error. W o r k i n g P a p e r ,University of A u c k l a n d ? 2012.

108. J a m e s M . Robins, Steven D. M a r k ,a n d W h i t n e y K, N e w e y . Estimating E x p o s u r e

Effects b y M o d e l i n g the Expectation of Exposure Conditional o n Confounders, Biometrics,


4 8 ;479— 4 9 5 ,1992.
109. Paul R. R o s e n b a u m . O b s ervational Studies, Springer Verlag^ 2002,

110. Paul R, Rosenbaum. Design of Observational Studies. Springer Series in


Statistics, Springer,N e w Y o r k ,L o n d o n ,2010,

111. Paul R. R o s e n b a u m a nd D o n a l d B, Rubin, T h e Central Role of the Propensity

Score in Observational Studies for Causal Effects. B i o nietrika ,7 0 : 4 1 — 5 5 ,1983.


112. Paul R. R o s e n b a u m an d D o n a l d B. Rubin. Constructing a Control G r o u p U s i n g

Multi-variate M a t c h e d Samp l i n g M e t h o d s that Incorporate the Propensity Score. A m e r i c a ”


Statisticia?}, 39:33— 3 8 ,1985.
113* M a r k R. R o s e n z w e i g and K e n n e t h I. Wolpin. Natural “Natural E x p e r i m e n t ” in
eco-nomics, J o u n m l o f Ecojwmic Literature ? 38:827— 8 7 4 ,2000.
114. Kenneth J. Rothman, Sander Greenland, and Timothy L. Lash. Modern

Epidemioiogy. Philadelphia, P A : Lippincott, Williams 8^ Wilkins, 3rd edition

edition f 2008.

115. A n d r e w Donald Roy, S o m e T h o u g h t s o n the Distribution of Earnings. Oxford

Economic papers » 3(2) : — 1 4 6 ,1951.


135—
11(3. Donald B, Rubin. Estimating Causal Effects of Treatments in R a n d o m i z e d an d

N o n r an- d o m i z e d Studies, J o u r n a l o f E d u c a t i o n a l P s y c h o l o g y ,66(5) :


6 8 8 — 701, 1974,

117. D o n a l d B. Rubin. A s s i g n m e n t to T r e a t m e n t G r o u p o n the Basis of a Covariate.

Journal o f Educational a n d Behavioral Statistics,2(1) ;


1— 2 6 ,1977.
118. Dona l d B. Rubin. Bayesian Inference for Causal Effects; T h e Role of
Randomization. T h e A i m a l s o f Statistics , 6 :3 4 ^ -58^ 1978,

119. D o n a l d B. Rubin, Randomization Analysis of Experimental D a t a : T h e Fisher

Randomi 2a-tton Test Comment. Journal o f the American Statistical Association ,75(371 ):
591— 5 9 3 ,1980-
120. D o n a l d B. Rubin* Fo r Objective Causal Inference? Design T r u m p s Analysis. The

A n n a h o f Applied Statistics,2(3) ;
808— 8 4 0 ,2008,
121. Duonald B. Rubin. Causal Inference Using Potential O u t c o m e s : Design,
Modeling ,Deci-sions. Journal of the A?nerica?i Staihiical Association , 100 (469): 322—

3 3 1 ,2005.
122. Gerta Rucker? Erika Graf* and Martin Schumacher. W h a t is M e a n t by the Effect of a
Treatment on the Treated? Letter to the Editor, University Medical Center Freiburg, 2010.
258 基本有用的计量经济学

123. John Rust, Mostly Useless Econometrics? Assessing the Causal Effect of

Econometric Theory. F o u n d a t i o n s a n d T r e n d s in A c c o u n t i n g ,10 ( 2 — 4) :


1 25— 2 0 3 ,2016.
124. Christopher A. Sims. M a c r o e c o n o m i c s and Reality. E c o n o m e t r i c a 、48 ( 1) ;1 —

48, 1980.

125. Christopher Skovron an d Rocio Titiunik. A Practice Guide to Regression

Discontinuity Designs in Political Science, Working Paper,University of Michigan, 2015.


126. Elizabeth A. Stuart. M a t c h i n g M e t h o d s for Causal Inference : A R e v i e w and a

L o o k Forward. Statistical Science > 25(1) :1— 2 1 ,2010,


127. D o n a l d L. Thistlethwaite a nd D o n a l d T. Compbell. Regression-discontinuity
Analysis; A n Alternative to the E x p o s t Facto Experiment, Journal of Educational

Psychology , 51 (6) :
309— 317, I960.
128. William M, K. Trochim. Research Design for Program Evaluation : T h e

Re g ression-Discontinuity A p p r o a c h . Beverly Hills:Sage Publications,1984,

229. Wilbert van der Klaauw, Regression-discountinuity Analysis:A Survey of Recent


Deve i - o p m e n t s in Economics. L a b o u r ,22C2) :
2 1 9 一 2 4 5 ,2008,

130. A i n h o a Vega-Bayo. A n R P a c k a g e for the Panel A p p r o a c h M e t h o d for P r o g r a m


Evalua-tion:P a m p e . T h e R J o u r n a l ,7(2): 1 0 5 — 1 2 1 ,2015.

131. Halbert White. A Heteroskedasticity-consistent Covariance Matrix Estimator and a

Direct Test for Heteroskedasticity. Econometrica, 48(4):817— 8 3 7 ,1980‘


132. Jeffrey M , Wooldridge. E c o n o m e t r i c A n a l y s i s o f Cr o s s Section a n d Pa?iel D a t a .
T h e M I T Press, 2010.

You might also like