Professional Documents
Culture Documents
基本有用的
计量经济学
Mostly Useful Science of
Econometrics
赵西亮著
龜 扣 i .泳 豸 出 版 社
PEKING UNIVERSITY PRESS
图 书 在 版 编 目 (C 1 P )数 据
(高等院校经济学管理学系列教材)
IS B N 978-7-301-28481-0
I . ①基… n . ①赵… m . ① 计 量 经 济 学 一 高 等 学 校 一 教 材 I V . ① F2 2 4 .0
中 国 版 本 图 书 馆 C I P 数 据 核 字 (2 0 1 7 ) 第 1 5 4 3 9 1 号
书 名 基 本 有 用 的 计 S 经济 学
JI B E N Y O U Y O N G D E J1L1ANG J I N G J I X U E
著 作 责 任 者 赵 西 亮 著
策 划 编 辑 杨 丽 明 姚 文 海 呂 正
责 任 编 辑 朱 梅 全 杨 丽 明
标 准 书 号 IS BN 978-7-301-28481-0
出版发行北京大学出版社
地 址 北 京 市 海 淀 区 成 府 路 205号 100S71
网 址 http :
/ / www. pup. cn
电 子 信 箱 sdyy_2005@126. com
新 浪微博@北京大学出版社
电 话 邮 购 部 62752015 发 行 部 62750672 编 辑 部 021-'620H998
印 刷 者 三 河 市 北 燕 印 装 有 限 公 司
经 销 者 新 华 书 店
7 3 0 毫 米 X 9 8 0 毫米 1 6 开本 1 7 印张 2 9 6 千字
2017年 7 月 第 1 版 2 0 1 7 年 7 月 第 1 次印刷
定 价 45. 0 0 元
未 经 许 可 ,不 得 以 任 何 方 式 复 制 或 抄 袭 本 书 之 部 分 或 全 部 内 容 。
版抆所有,侵权必究
举 报 电 话 :010-62752024 电 子 信 箱 :I d ® pup. pku. c d u .c n
图 书 如 有 印 装 质 量 问 题 ,请 与 出 版 部 联 系 ,电 话 :010-6 2 7 3 6 3 7 0
经 过 三 十 多 年 的 努 力 ,中 国 经 济 已 经 从 计 划 经 济 模 式 成 功 转 型 为 以 公 有 制
为 主 导 的 社 会 主 义 市 场 经 济 模 式 。在 经 济 转 型 与 发 展 过 程 中 ,
从中央到地方的
各 种 经 济 政 策 发 挥 了 主 导 作 用 。在 国 家 层 次 上 ,有 “五 年 计 划 ”、《中 国 制 造
2025》
《新 劳 动 合 同 法 M 社 会 保 险 法 》等 规 划 或 法 律 法 规 ,国 家 支 持 新 兴 战 略 产
业政策,
京津冀一体化战略,
长 江 流 域 发 展 战 略 ,自 贸 区 战 略 ,
“一 带 一 路 ”愿 景 ,
当然也包括财政、
货 币 政 策 等 。在 地 方 层 次 上 ,有 地 方 “五 年 计 划 ”、
地方产业政
策以及地方性财政政策等。
各级政府的各种经济政策,
大都是在调査研究、
智库论证、
征求有关各方意-
见 的 基 础 上 形 成 的 。但 是 ,
不少调查研究、
征求意见并不一定经过充分、
仔细的
论 证 。尤 其 是 各 级 政 府 领 导 人 政 务 繁 忙 ,很 多 人 没 有 充 分 时 间 进 行 系 统 的 调 研
与征求意见,
也 有 不 少 停 留 在 召 开 座 谈 会 或 会 议 讨 论 ,存 在 一 定 程 度 的 形 式 主
义 。 由 于 时 间 等 因 素 的 限 制 ,很 难 充 分 征 求 社 会 各 方 面 的 意 见 。一 些 从 属 于 各
级政府部门的智库,
本 身 可 能 并 不 具 有 很 高 的 专 业 性 ,有 时 还 需 要 揣 摩 上 级 主
要领导的意图,
缺 乏 必 要 的 独 立 性 。相 反 ,
身在中国高校与科研机构、
立场比较
超然的经济学者的经济政策研究,
往 往 具 有 较 高 的 专 业 性 和 独 立 性 。但 是 ,中
国经济学者在从事经济政策研究时,
经常是在经过比较简单的定性分析之后,
即提出自己的观点、
政 策 建 议 。这 些 观 点 与 政 策 建 议 ,
大多不是基于经济数据
进 行 分 析 ,通 过 严 谨 的 推 断 过 程 所 获 得 的 结 论 ,因 此 不 具 备 较 高 的 科 学 性 。诚
然,
除经济数据外,
还 必 须 对 经 济 的 现 状 、历 史 有 深 刻 的 理 解 与 丰 富 的 感 性 认
识 。但 是 ,只 有 建 立 在 经 济 数 据 基 础 上 的 严 谨 的 实 证 研 究 ,才 能 从 复 杂 的 经 济
现象中揭示经济变量之间的因果关系和内在规律,
从而使结论以及建立在结论
基础上的政策建议具有较高的科学性。
因 此 ,中 国 经 济 学 者 关 于 经 济 政 策 研 究 的 一 个 努 力 方 向 ,
是提倡以数据分
析为基础的实证研究,
特 别 是 对 各 个 时 期 的 各 种 经 济 政 策 进 行 量 化 评 估 。最近
二十年来,
计量经济学出现了一个新的领域,
称 为 政 策 (或 项 目 )评 估 计 量 经 济
学 (econometrics of program evaluation) ,并 广 泛 应 用 于 评 估 各 种 社 会 经 济
政策。
所谓政策评估计量经济学,
是在经济数据的基础上应用计量经济学方法与
2 基本有用的计量经济学
工 具 对 社 会 经 济 政 策 进 行 量 化 分 析 ,其 主 要 目 的 是 测 度 某 个 政 策 实 施 后 对 某 个
群体、
某 个 行 业 或 某 个 地 区 的 “因 果 ”影 《
向。 由 于 经 济 现 象 的 不 可 实 验 性 (如四
万 亿 元 刺 激 计 划 不 可 能 再 重 复 一 次 ),
政策评估的最主要困难是识别因果关系
和 测 量 政 策 效 应 的 大 小 或 强 弱 ^政 策 评 估 计 量 经 济 学 因 此 提 出 了 各 种 条 件 下
的量化评估方法,
其核心是估计无法观测到的虚拟事实(
counterfactuals) ,即没
有 实 施 某 种 政 策 时 的 效 果 ,这 样 ,
某项政策的效应可测度为实际政策作用下的
结 果 与 虚 拟 事 实 之 差 。在 国 外 ,
政策评估计量经济学已被广泛应用于经济学和
社会科学很多领域, 包括劳动经济学、 工 业 组 织 、发 展 经 济 学 、
社 会 学 等 。例 如 ,
Card and Krueger (1994)运 用 双 重 差 分 法 (
difference in difference)考察了美国
最 低 工 资 调 整 对 就 业 的 影 响 。Dehejia and W a h b a (1999)使 用 倾 向 得 分 匹 配
(propensity score matching)估 计 就 业 再 训 练 政 策 对 于 收 人 的 影 响 。 H a h n et
al. (1999)应 用 断 点 回 归 方 法 评 估 了 美 国 反 歧 视 联 邦 法 对 少 数 族 裔 就 业 的 影
响 。Abadie et al. (2002)则 使 用 分 位 数 处 理 效 应 模 型 估 计 美 国 大 型 的 就 业 再 培
训 计 划 对 于 收 人 分 配 的 影 响 。Jacob and Lefgren (2004)利 用 美 国 芝 加 哥 公 立
学 校 1 996年教育改革数据评估了芝加哥公立学校所实施的设立暑期培训班以
及 学 生 成 绩 不 好 需 要 留 级 的 教 育 政 策 对 学 习 成 绩 的 影 响 。Lalive (2008)评估
了 奥 地 利 “区 域 扩 展 福 利 计 划 " (regional extended benefits program)实 施 后 对
男性与女性工人失业持续期的影响。
政 策 评 估 计 量 经 济 学 ,渊 源 于 统 计 学 科 的 流 行 病 (epidemiological statis-
tics)统 计 以 及 所 谓 的 处 理 效 应 (treatment effect)统 计 。作 为 政 策 评 估 的 重 要 方
法论,
政策评估计量经济学可用于对中国各种社会经济政策进行严谨的定量评
估,
这 将 大 大 提 高 中 国 社 会 经 济 政 策 研 究 的 科 学 性 。特 别 是 现 在 已 进 人 大 数 据
时代,
各种形式的经济数据非常丰富,
也 便 于 运 用 强 大 的 计 量 机 进 行 处 理 。事
实上,
一 段 时 间 以 来 ,已 有 一 些 智 库 和 学 者 开 始 运 用 计 量 经 济 学 方 法 评 估 中 国
各种经济政策,
并 提 出 相 关 的 经 济 政 策 建 议 。例 如 ,中 国 科 学 院 预 测 科 学 研 究
中 心 汪 寿 阳 教 授 所 带 领 的 政 策 研 究 团 队 ,多 年 来 运 用 计 量 经 济 学 方 法 ,
研究各
种中国经济政策,
很 多 建 议 获 得 政 府 采 纳 。美 国 南 加 州 大 学 萧 政 教 授 等 (Hsiao
et al.,2012)提 出 了 一 种 面 板 数 据 的 政 策 评 估 方 法 ,
并评'估了中国内地与香港
的经济关系,
他 们 发 现 虽 然 “九 七 ”回 归 这 一 政 治 事 件 对 香 港 经 济 增 长 没 有 显 著
影响,
但 是 内 地 和 香 港 关 于 建 立 更 紧 密 经 贸 关 系 的 安 排 (C E P A )对 香 港 实 际
G D P 增 长 贡 献 了 约 4 % 。韩 乾 、
洪 永 淼 (2014)利 用 上 海 证 券 交 易 所 提 供 的 一 组
市场交易数据,
评 估 了 国 务 院 2010年通过的支持七大新兴战略产业的政策对
证券市场投资的影响,
他们发现这个利好产业政策只是为少数机构投资者提供
序 3
了操作机会并造成财富从大量散户向机构投资者转移,
并没有起到引导证券市
场 投 资 者 向 七 大 产 业 投 资 。 O u y a n g and Peng (2015) 扩 展 了 Hsiao et al.
(2012)的 方 法 ,
使 用 半 参 数 的 方 法 评 估 2008— 2 0 0 9 年 实 施 四 万 亿 元 财 政 刺 激
计 划 的 效 果 。他 们 的 研 究 发 现 ,财 政 刺 激 政 策 起 初 的 确 促 进 了 经 济 增 长 ,
特别
是 在 2009年第三季度左右,
G D P 增 速 提 高 了 约 5. 4 % ,
但这一政策效果随后迅
速降低,
在 2 0 1 0 年 第 四 季 度 之 后 甚 至 变 成 了 负 值 。 因 此 ,四 万 亿元的财政刺激
政策只是临时对经济有促进作用,
并无长期影响。
与其他经济学研究方法一样,
计 量 经 济 学 并 不 是 放 之 四 海 而 皆 准 的 “灵丹
妙 药 ”,
它既有科学性,
也 有 局 限 性 。在 应 用 计 量 经 济 学 方 法 与 工 具 评 估 社 会 经
济政策时,
首先需要注意,
每种方法和工具都有其适用的范围与条件,
特别因为
经济现象具有不可操控实验的特点,
很多方法与工具是建立在一些假设基础之
上,
在应用时需要注意这些假设条件的合理性。
其 次 ,计 量 经 济 学 的 方 法 论 基 础 是 概 率 论 与 统 计 学 ,因 此 数 据 样 本 的 选 择
是 一 个 实 际 应 用 中 必 然 遇 到 的 重 要 问 题 。如 何 选 取 一 个 具 有 代 表 性 的 数 据 样
本,
避免样本选择偏差,
与 方 法 和 工 具 的 选 择 一 样 重 要 。另 外 ,
数据质量也是一
个 潜 在 问 题 。大 数 据 时 代 ,
数据收集与处理成本越来越低,
数据质量越来越高。
但是在中国,
各 个 地 K 特 别 是 各 地 政 府 部 门 所 收 集 的 数 据 ,可 能 会 存 在 这 样 那
样的系统性偏差^ 应该提倡随机抽样调査,
或者收集整理数据,
建立比较具有
独立性和代表性的经济数据库。
再 次 ,经 济 政 策 定 量 评 估 还 必 须 与 定 性 分 析 以 及 其 他 各 种 研 究 方 法 相 结
合,
包括理论逻辑分析、
历 史 逻 辑 分 析 、实 地 调 査 研 究 等 ,而 不 是 去 取 代 现 有 研
究 方 法 。 中 国 高 校 的 经 济 学 者 经 常 被 批 评 不 熟 悉 中 国 经 济 实 际 状 况 ,因此必 须
通 过 调 査 研 究 等 方 法 获 得 第 一 手 资 料 ,丰 富 自 己 的 感 性 认 识 。但 是 ,
感性认识
并不能确保政策研究的科学性,
我 们 还 需 要 科 学 的 理 论 思 维 和 分 析 方 法 。天文
物理学家正是依靠科学的研究方法与工具探索天体物体的运动规律,
这值得我
们学习和借鉴。
最后,
对经济政策的定量评估与分析,
需要注意对量化结果进行经济解释。
经济政策评估与分析不是以严谨的学术期刊论文发表为主 要 目 的 ,
应该用通俗的
语 言 和 直 观 的 表 达 方 式 向 政 府 部 门 和 社 会 公 众 传 播 研 究 结 果 。当 然 ,
直观表达
和 通 俗 解 释 并 不 意 味 着 降 低 量 化 评 估 分 析 的 标 准 。社 会 经 济 政 策 评 估 是 经 济
政策研究的重要组成部分和重要方法,
是提升经济政策研究与政策咨询之科学
性 和 有 效 性 的 重 要 途 径 。尤 其 在 目 前 经 济 下 行 态 势 下 ,
研究如何制定最佳经济
政策组合促进中国经济持续稳定快速发展,
具 有 重 要 的 现 实 意 义 ,而 定 量 评 估
4 基本有用的计量经济学
各 种 社 会 经 济 政 策 的 实 际 效 果 是 制 定 最 佳 政 策 组 合 的 关 键 环 节 。 中国经济学
者应该大力倡导应用计量经济学等现代经济学分析方法与工具对中国各种社
会 经 济 政 策 进 行 定 量 评 估 与 分 析 ,从 而 推 动 建 设 有 中 国 特 色 的 高 水 平 的 新 型 经
济智库。
关 于 政 策 评 估 计 量 经 济 学 ,目 前 国 内 暂 无 详 细 介 绍 的 计 量 经 济 学 教 材 ,
最
近,
厦 门 大 学 经 济 学 系 赵 西 亮 博 士 写 了 一 本 《基 本 有 用 的 计 量 经 济 学 》,
该书利
用潜在结果语言,
从总体视角出发,
集中探讨了政策评估过程中常用的因果效
应 识 别 策 略 。全 书 以 随 机 化 实 验 为 基 础 ,
首先介绍了潜在结果和分配机制的概
念,
并 利 用 潜 在 结 果 定 义 因 果 效 应 。然 后 介 绍 了 随 机 化 实 验 ,
一种特殊的分配
机制,
可以消除选择偏差,
成 为 观 测 研 究 中 各 种 识 别 策 略 的 基 础 。所 有 的 识 别
策略都是通过一定的设计模拟随机化实验,
从 而 得 到 可 信 的 因 果 效 应 估 计 。另
外,
作者还简要介绍了因果图方法,
它是与潜在结果框架完全等价的因果模型,
但是更加直观,
容 易 使 用 。在 这 三 个 理 论 的 基 础 上 ,
该 书 介 绍 了 线 性 回 归 、匹配
方法、
工 具 变 量 法 、面 板 数 据 方 法 和 断 点 回 归 设 计 等 几 种 在 观 测 研 究 中 常 用 的
因 果 效 应 识 别 策 略 。全 书 的 主 要 特 色 是 用 潜 在 结 果 语 言 和 因 图 果 介 绍 各 种 识
别 策 略 。对 于 每 种 识 别 策 略 ,
作 者 还 利 用 具 体 实 例 讲 解 各 策 略 在 Stata软件中
的 实 现 。当 然 ,
该 书 介 绍 的 方 法 也 有 一 定 的 局 限 性 ,正 如 我 上 文 及 该 书 结 语 中
所述,
各种识别策略模拟随机化实验,
可以得到更为可信的因果效应,
但是往往
不能回答具体的内在影响机制,
读者在使用的时候需要了解各识别策略的假设
前提和内在限制。
赵西亮博士嘱我为该书作序,
我欣然命笔,
并认为该书是有关政策评估计
量 经 济 学 的 一 本 很 好 的 入 门 教 材 ,推 荐 给 大 家 。是 为 序 。
洪永森
康奈尔大学 ErnestS. Liu 经 济 学 与 国 际 研 究 讲 席 教 授
厦门大学经济学院和王亚南经济研究院院长
2017年 2 月 6 曰
目前,国 内 计 量 经 济 学 的 训 练 (无 论 是 本 科 生 还 是 研 究 生 )主 要 集 中 于 统 计
推 断 (statistical inference) ,即 如 何 利 用 样 本 信 息 获 得 总 体 信 息 的 估 计 以 及 如 何
进 行 假 设 检 验 以 判 断 估 计 结 果 的 统 计 显 著 性 。在 经 济 学 实 证 中 ,
我们拿到的往
往是总体的一个样本,
利用样本信息进行的估计是否能够反映总体,
是实证研
究 中 一 个 非 常 重 要 的 问 题 。但 是 ,
统计推断本身往往很少能够给出因果关系的
信 息 。随 着 信 息 技 术 的 发 展 ,数 据 获 取 的 成 本 越 来 越 低 ,我 们 开 始 进 入 一 个 大
数据的时代,
这意味着我们可以获得的数据样本容量越来越大,
甚至可以获得
总 体 信 息 。这 样 ,
统 计 推 断 的 作 用 可 能 就 越 来 越 小 ,比 如 ,如 果 拿 到 了 总 体 数
据 ,那 么 传 统 意 义 上 的 统 计 推 断 就 没 有 用 武 之 地 了 。但 是 ,就 算 我 们 有 总 体 数
据,
也不能回答因果关系的问题。比如,
假设我们有中国人口普查的数据,
想考
察教育如何影响个人收人,
仍 然 是 没 有 办 法 获 得 因 果 效 应 的 知 识 的 。 因 而 ,因
果效应无关样本大小,
对于因果效应的探讨是更加底层的问题,
是任何科学获
得 知 识 的 关 键 。所 以 ,
要获得变量之间因果效应的知识,
必须要进行因果推断
(causal inference) 。
目 前,
经 济 学 的 经 验 研 究 正 在 经 历 一 场 研 究 范 式 的 转 变 (paradigm shift)
(Panhans and Singleton, 2016),
从 统 计 推 断 向 因 果 推 断 转 变 。越 来 越 多 的 实
证 研 究 开 始 探 讨 如 何 才 能 科 学 地 识 别 经 济 变 量 之 间 的 因 果 影 响 ,而 非 集 中 于 估
计量的统计显著性问题,
统 计 推 断 往 往 是 相 对 次 要 的 问 题 (second order prob-
lem),而 因 果 推 断 才 是 获 取 知 识 的 首 要 问 题 。这 种 研 究 范 式 的 转 变 被 Angrist
and Pischke (2010)称 为 经 济 学 经 验 研 究 的 “可 信 性 革 命 ”,
其关键特征是引入
潜在结果框架清晰定义因果,
利用随机化实验的思想作为因果效应识别的基
础 ,因 而 新 研 兖 范 式 有 时 也 被 称 为 “以 实 验 设 计 为 基 础 的 计 量 经 济 学 ”或 计 量 经
济 学 的 “实 验 学 派 ”(Angrist and Pischke,2017)。尽 管 其 他 计 量 经 济 学 家 并 不
一 定 完 全 认 同 “可 信 性 革 命 ”的 说 法 ,
但是,
“实 验 学 派 ”的 计 量 经 济 学 确 实 使 经
济 学 经 验 研 究 获 得 很 多 “基 本 有 用 的 经 验 知 识 ”(Rust, 2016) 。最 近 二 十 多 年
来,
“实 验 学 派 ”计 量 经 济 学 方 法 在 经 济 学 经 验 分 析 中 的 影 响 越 来 越 大 ,
研究范
式 的 “技 术 进 步 ”也 不 断 在 其 他 学 科 中 “技 术 扩 散 ”(B o w e n et al.,forthcom
ing) ,
但是在经济学教学中,
本 科 生 和 研 究 生 所 使 用 的 《计 量 经 济 学 》教 材 仍 然 沿
2 基本有用的计量经济学
用了老的研究范式,
在经济学经验研究文献中广泛采用的因果推断方法仍然没
有 进 人 《计 量 经 济 学 》教 科 书 。Angrist and Pischke (2017)指 出 ,
传统计量经济
学 教 材 中 的 很 多 指 导 是 过 时 的 ,比 如 有 关 异 方 差 、
序列相关等问题的讨论,
这些
问题都不会影响因果效应的识别,
而 这 些 问 题 的 解 决 只 需 要 利 用 White (1980)
的 异 方 差 一 致 性 标 准 误 差 或 N e w e y and West (1987) 的 序 列 相 关 及 异 方 差 一 致
性 标 准 误 差 进 行 修 正 。Angrist and Pischke (2017) 提 议 新 的 研 究 范 式 更 加 有
趣、
相关性更强、
识别结果更加令人满意,
为什么不能让我们的学生也获得这些
技能呢?
本书顺应了 Angrist and Pischke (2017)的 号 召 ,
将经济学经验研究新范式
介 绍 给 我 们 的 学 生 。本 书 分 成 两 大 部 分 :理 论 基 础 和 识 别 策 略 。理 论 基 础 部
分,
首 先 介 绍 潜 在 结 果 框 架 。潜 在 结 果 概 念 的 引 人 ,
便于清晰定义因果效应,
从
而 避 免 L o r d 悖 论 。然 后 ,
介 绍 随 机 化 实 验 。随 机 化 实 验 是 所 有 识 别 策 略 的 基
础,
本书介绍的所有识别策略在一定的识别条件下都可以看作是一种随机化实
验 。另 外 ,
我们还介绍了因果图。因果图是与潜在结果框架完全等价的因果模
M(Pearl, 2009),
但是更加直观。
第 二 部 分 主 要 介 绍 了 经 济 学 经 验 研 究 中 常 见 的 几 种 识 别 策 略 。首 先 是 线
性回归,
主要关注在什么样的识别条件下,
线性回归系数可以解释为因果效应
参 数 。我 们 强 调 在 线 性 回 归 中 ,
我们关心的解释变量和其他控制变量的地位是
不同的,
其 他 控 制 变 量 的 引 入 是 为 了 识 别 我 们 关 心 的 解 释 变 量 的 因 果 效 应 ,为
强调这一点,
我 们 将 关 心 的 解 释 变 量 称 为 原 因 变 量 或 干 预 变 量 。然 后 ,
我们讨
论 了 匹 配 方 法 的 识 别 条 件 。线 性 回 归 和 匹 配 方 法 有 着 密 切 的 联 系 ,
具有相同的
识 别 条 件 。我 们 强 调 回 归 和 匹 配 的 识 别 条 件 都 是 C I A ,都 不 能 解 决 内 生 性 问
题 。接 着 是 工 具 变 量 法 。工 具 变 量 法 是 经 济 学 中 一 种 相 对 比 较 成 熟 的 方 法 ,
但
是利用潜在结果语言和引人异质性之后,
工具变量法有了新的内涵,
工具变量
所能识别的因果效应参数是依从者的因果效应,
并且在异质性框架下,
不 同的
工 具 变 量 识 别 不 同 的 因 果 效 应 参 数 。在 有 多 期 数 据 的 情 况 下 ,
可以利用多期数
据的特点,
消除不随时间变化的混杂因素的影响,
从而使双重差分法模拟增量
上的随机化实验另外,
我们还讨论了可以允许时变混杂因素的合成控制法和
回 归 控 制 法 。最 后 ,
我们讨论了最接近完全随机化实验的一种识别策略■
^ 断
点回归设计( R D D ),
它利用断点附近个体具有高度相似性的特点来识别因果效
应 。另 外 ,
对最新发展的弯折回归设计( R K D ) 也进行了简要介绍。
本 书 主 要 根 据 我 为 厦 门 大 学 经 济 学 院 研 究 生 和 高 年 级 本 科 生 开 设 的 “应用
微 观 计 量 经 济 学 ”课 程 讲 义 修 改 而 成 。本 书 的 主 要 特 色 是 利 用 潜 在 结 果 语 言 和
前 言 3
因果图讲解各种识别策略,
另 外 辅 以 具 体 案 例 讲 解 各 种 识 别 策 略 在 S t a U 软件
中 的 实 现 。适 合 从 事 经 济 学 经 验 研 究 的 学 者 和 本 科 生 、
研究生使用,
也适合从
事社会学、
政治学、
流行病学等相关学科研究的学者作为因果推断方面的参考
书 。限 于 作 者 水 平 有 限 ,
时间紧迫,
定有很多错漏之处,
欢迎读者批评指正。
赵西亮
2017年 2 月 2 0 日
致 谢
首先感谢北京大学出版社杨丽明编辑,
没有她两年前的邀请,
可能就没有
本 书 今 天 的 出 版 。另 外 ,在 本 书 的 出 版 过 程 中 ,杨 编 辑 做 了 大 量 细 致 的 工 作 。
特 别 感 谢 洪 永 淼 教 授 在 百 忙 之 中 为 本 书 作 序 。洪 永 淼 教 授 是 国 际 计 量 经 济 学
领域的著名学者,
一直致力于中国的计量经济学教育事业,
对国内年轻学者也
给 予 了 很 多 帮 助 。非 常 感 谢 洪 永 淼 教 授 对 笔 者 的 鼓 励 和 对 本 书 的 评 价 。
感谢上海交通大学安泰经济与管理学院朱喜教授与笔者的有益讨论,
感谢
上海交通大学安泰经济与管理学院博士后梁文泉博士为笔者提供的相关资料,
另 外 ,梁 文 泉 博 士 还 通 读 了 初 稿 ,指 出 了 文 中 的 多 处 错 别 字 ,
在 此 一 并 感 谢 。感
谢 厦 门 大 学 研 究 生 院 副 院 长 方 颖 、厦 门 大 学 经 济 学 系 主 任 龙 小 宁 、厦 门 大 学 经
济学系副系主任赵建等教授对笔者的帮助和支持。
非 常 感 谢 选 修 笔 者 课 程 的 学 生 ,自 2 0 1 3 年 开 课 以 来 ,已 有 四 届 7 个 班 (
4 个
本科生班、
3 个 研 究 生 班 )近 2 0 0 名 学 生 选 修 了 以 本 书 为 基 础 的 课 程 ,
与学生的
讨 论 使 本 书 内 容 不 断 完 善 。本 书 初 稿 完 成 后 ,
部分学生分别阅读了部分章节,
并修改了明显的错别字及语句问题,
他们是厦门大学经济学系博士研究生范振
中、
彭 骏 ,硕 士 研 究 生 陶 宇 、
张惠杰、
唐梦莹等,
在此表示感谢。
目录
Contents
第 一 章 绪 论 ................................................................................................................ (1
第 一 节 引 言 ................................................... (1
第 二 节 因 果 推 断 简 史 .......................................... (3
第 三 节 经 济 学 研 究 的 基 本 问 题 .................................(5
第 四 节 本 书 安 排 .............................................. (6
第 二 章 潜 在 结 畢 框 架 ................................................ (9)
第 一 节 潜 在 结 果 ............................................. (9)
第 二 节 稳 定 性 假 设 ............................................ (12)
第 三 节 分 配 机 制 .............................................. (13)
第 四 节 潜 在 结 果 和 L o r d 悖 论 ................................. (15)
第 五 节 因 果 效 应 参 数 .......................................... (19)
第 六 节 总 结 ....................................... ........... (24)
第 三 章 随 机 化 实 验 ................................................ (
25)
第 一 节 随 机 化 实 验 的 作 用 .............. ............... ....... (25)
第 二 节 随 机 化 实 验 与 选 择 偏 差 ................................. (
28)
第 三 节 随 机 化 实 验 的 分 类 ................... ..................(
30)
第 四 节 随 机 化 实 验 的 分 析 ..................................... (
32)
2 基本有用的计量经济学
第 五 节 随 机 化 实 验 的 缺 陷 ..................................... (37)
第 六 节 总 结 ................................................... (38)
第 四 章 因 果 图 ............................................................................................................(
40)
第一节 基 本 概 念 ...............................................(
40)
第 二 节 因 果 图 和 边 际 独 立 性 ................................... (
41)
第 三 节 选 择 偏 差 和 因 果 效 应 识 别 ........................... ...(45)
第 四 节 选 择 偏 差 的 处 理 ....................................... (50)
第 五 节 总 结 .................................... .............. (52)
第 五 章 线 性 回 归 .................................................... (55)
第 一 节 条 件 期 望 函 数 和 线 性 回 归 .......................... .... (55)
第 二 节 线 性 回 归 和 因 果 效 应 ..................................... (66)
第 三 节 回 归 方 法 的 软 件 实 现 ..................................... (72)
第 四 节 总 结 .................................................... (75)
第 六 章 匹 配 方 法 .....................................................(
77)
第 八 章 面 板 数 据 方 法 ............................................ (147)
第 一 节 固 定 效 应 方 法 .............................................. :.... (147)
第 二 节 双 重 差 分 法 .......................................... (
149)
第 三 节 合 成 控 制 法 ....................... .................. (162)
第 四 节 回 归 合 成 方 法 ....................................... (171)
第 五 节 面 板 评 估 方 法 的 软 件 实 现 ............................ (176)
第 六 节 总 结 ................................................ (185)
第 九 章 断 点 回 归 设 计 ............................................ (1S6)
第 一 节 断 点 回 归 设 计 ....................................... (186)
第 二 节 断 点 回 归 设 计 的 图 形 分 析 ............................ (194)
第 三 节 断 点 回 归 设 计 的 估 计 ................................. (199)
第 四 节 弯 折 回 归 设 计 ........................................ 乂208)
第 五 节 断 点 回 归 设 计 的 软 件 实 现 ............................ (217)
第 六 节 总 结 ................................................ (
229)
第 十 章 结 语 ..................................................... (
231)
附 彔 S t a t a 数 据 处 理 编 程 简 介 ..................................... (
234)
第 一 节 常 用 命 令 ............................................ (234)
第二节 d o 文 件 .............................................. (
235)
第三节结果呈现利器:
estout软 件 包 .......................... (
240)
第四节练习 ................................................ (
246)
参 考 文 献 ......................................................... (
250)
第一章绪 论
物 有 本 末 ,事 有 终 始 ,
知所先后,
则近道矣。
一 《大 学 》
第一节引 言
在经济学研究中,
我 们 非 常 关 心 经 济 变 量 之 间 的 因 果 关 系 。尽 管 其 他 相 关
关系也很重要,
但 是 在 政 策 评 价 中 ,因 果 关 系 是 更 根 本 的 。关 于 因 果 关 系 的 讨
论 ,可 以 有 两 个 方 向 。一 个 是 看 到 结 果 ,寻 找 结 果 背 后 的 原 因 ,即 考 察 “结果 的
原 因 ”(CaUSe of effect)。这 种 研 究 非 常 重 要 ,
往 往 是 科 学 研 究 的 起 点 。但 寻 找
结果背后的原因,
非 常 复 杂 。某 一 种 结 果 产 生 的 原 因 可 能 有 很 多 ,
需要通过详
细的调查、
深 人 的 分 析 才 能 找 到 。另 一 个 是 看 “原 因 的 结 果 " (effect of cause),
主 要 关 注 某 一 干 预 对 结 果 的 影 响 。对 于 政 策 评 价 而 言 ,往 往 仅 关 注 某 一 项 原
因,
考 察 这 一 原 因 变 动 时 ,结 果 会 有 怎 样 的 变 动 。相 对 而 言 ,
这一方向更加简
单 ,可 操 作 性 更 强 。事 实 上 ,
两个方向的分析是密切相关的,
搞 清 楚 了 “原 因的
结 果 ”,
才 有 利 于 考 察 “结 果 的 原 因 ”以 及 每 一 种 原 因 在 产 生 结 果 中 的 作 用 。 因
而,
很多情况下,
我 们 更 关 注 “原 因 的 结 果 ”。 比 如 ,
在微观经济学中,
我们关心
某 些 措 施 或 干 预 对 个 体 行 为 的 影 响 ,比 如 班 级 规 模 对 儿 童 学 习 效 果 有 什 么 影
响 ?安 全 带 是 否 可 以 增 加 乘 客 在 车 祸 中 的 生 还 机 会 ?教 育 对 个 人 就 业 及 未 来
收入有什么样的影响?助 学 金 是 否 可 以 增 加 贫 困 大 学 生 的 升 学 率 ?对农民工
进行职业培训是否可 以 增 加 他 们 的 就 业 机 会 和 收 入 水 平 ?在 宏 观 经 济 学 中 ,
我
们 关 心 大 学 生 扩 招 是 否 增 加 了 大 学 毕 业 生 的 就 业 难 度 ?货 币 政 策 调 控 是 否 能
够 抑 制 通 货 膨 胀 ? 限 购 政 策 是 否 能 够 抑 制 房 价 的 持 续 上 涨 ? 2 0 0 8 年 的 4 万亿
刺 激 方 案 是 否 促 进 了 我 国 的 经 济 发 展 和 就 业 扩 张 ?这 些 问 题 都 是 在 探 讨 “原因
的 结 果 ”,
也是本书的主要研究对象。
— 项 干 预 © 对 结 果 变 量 产 生 的 影 响 通 常 称 为 因 果 效 应 (causal effects)或干
①干预可以指一项措施、
政策、
行动或暴露,
在 英 文 中 对 应 词 有 manipulation,treatment, interven-
.tion, exposure等 , 对 应 的 变 量 我 们 称 为 干 预 变 或 原 因 变 丨
本书中我们通称为干预,
2 基本有用的计量经济学
预 效 应 (treatment effects) D® 类 似 于 在 医 学 领 域 对 病 人 的 治 疗 ,如 果 采 用 某 一
种新药或治疗措施,
会对病人的康复有 什 么 样 的 影 响 ?在 医 学 领 域 称 为 治 疗 效 果
(treatment effects),
在经济学及其他社会科学中也 经 常 遇 到 类 似 的 问 题 ,
对这些问
题 的考察称 为 因 果 效 应 分 析 。下面 看 两 个 简 单 的 例 子 ,
了 解 因果推断的困难。
例 1. 1 ( 新 药 的 治 疗 效 果 ) 假 设 现 在 想 考 察 一 项 新 药 的 治 疗 效 果 ,通过调
查 获 得 了 某 医 院 的 新 药 使 用 情 况 ,见 表 1. 1 。
表 1 .1 Yule-Simpson 悖论
总样本 生还 死亡 生还率
干预组 20 20 50 %
控制组 16 24 40%
男性样本 生还 死亡 生还率
干预组 18 , 12 60%
控制组 7 3 70%
女性样本 生还 死亡 生还率
干预组 2 8 20%
控制组 9 21 30%
从总样本看,
共调查了 8 0 个 病 人 ,
4 0 个 病 人 使 用 了 新 药 ,另 外 4 0 个癍人没
有 使 用 新 药 。使 用 了 新 药 的 病 人 归 为 干 预 组 ,没 有 使 用 新 药 的 病 人 归 为 控 制
组 。 结 果 显 示 ,干 预 组 生 还 率 为 5 0 % ,控 制 组 生 还 率 为 4 0 % ,干 预 组 生 还 率 更
高 。从 总 体 样 本 上 看 ,
新 药 采 用 与 生 还 率 正 相 关 ,但 这 并 不 一 定 说 明 新 药 真 的
有 治 疗 效 果 。表 1 . 1 的 第 2 部 分 和 第 3 部 分 分 别 按 照 性 别 列 出 男 性 和 女 性 病
人 的 结 果 。 可 以 看 出 ,对 于 男 性 而 言 ,干 预 组 生 还 率 低 于 控 制 组 ;对 于 女 性 而
言,
也 是 干 预 组 生 还 率 低 于 控 制 组 。从 而 出 现 ,按 照 性 别 分 层 后 ,男 性 和 女 性 群
体中,
均 出 现 了 新 药 使 用 与 生 还 率 的 负 相 关 关 系 。这 种 现 象 在 统 计 学 中 称 为
Yule-Simpson 棒 论 。
上 面 的 例 子 来 自 Pearl (2.009),
是人为构造的,
下面看一个真实的案例。
例 1 . 2 ( 美 国 加 州 大 学 伯 克 利 分 校 研 究 生 录 取 存 在 性 别 歧 视 吗 ?) 1 9 7 3 秋
季,
美 国 加 州 大 学 伯 克 利 分 校 研 究 生 招 生 录 取 工 作 中 ,有 1 2 7 6 3 名 学 生 申 请 ,男
® 本书关注因果关系,
所关注的变量具有明确的干预, 从 而 关 注 的 结 果 变 ffi会 有 多 个 状 态 的 水 平 。
实验研究中干预状态分配是由研究者控制的,
观 测 研 究 (observational studies)中 干 预 不 是 由 研 究 者 控 制
的 。另 一 类 研 究 , 没有干预, 从 而 结 果 变 fi只 有 一 个 水 平 ,
这 种 研 究 称 为 描 述 性 研 究 (Holland and Rubin,
1982),比 如 研 究 男 性 身 高 比 女 性 身 高 高 多 少 ,
今年我国的宏观经济形势如何等^
生 8 4 4 2 人 ,女 生 4 3 2 1 人 。最 终 录 取 5 2 3 2 人 ,
其 中 男 生 录 取 3 7 3 8 人 ,女 生 录 取
4 9 4 人 ,男 生 录 取 率 为 4 4 % ,女 性 录 取 率 为 3 5 % 。男 生 录 取 率 高 于 女 生 ,因而一
些 人 认 为 伯 克 利 分 校 研 究 生 录 取 中 存 在 性 别 歧 视 。真 的 存 在 性 别 歧 视 吗 ?
Bicke et al. (1975)对 此 进 行 了 研 究 ,
发现尽管总体上,
男生录取率高,
但如果按
照专业划分之后,
几 乎 每 个 专 业 中 均 是 女 生 的 录 取 率 更 高 。表 1 . 2 给 出 了 两 个
专业的假想数据, ® ,总 体 上 看 ,男 生 录 取 率 为 4 4 % , 高 于 女 生 的 录 取 率 3 8 % ,
但
是 每 个 专 业 中 ,女 生 的 录 取 率 都 更 高 。 为 什 么 总 体 而 言 ,男 生 录 取 率 更 高 呢 ?
因 为 男 女 生 的 专 业 分 布 不 同 ,男 生 大 多 数 集 中 于 申 请 录 取 率 相 对 较 高 的 (或是
冷门 )专 业 2 ,而 女 生 却 集 中 于 相 对 录 取 率 较 低 的 专 业 1 。
表 1.2 伯克利分校的研究生录取率
男生 女生
专业
申请人数 录取数 录取率 申请人 数 录取数 录取率
专业1 200 40 20% 400 120 30 %
专业2 800 400 50% 100 70 70 %
合计 1000 440 44% 500 190 3 8%
上 面 两 个 例 子 告 诉 我 们 ,简 单 的 直 观 印 象 往 往 是 错 误 的 ,
真理的揭示是非
常困难的,
需要更加深人地分析,
才有可能找出现象背后的真相。同 时 也 说 明 ,
寻找真理的过程是非常吸引人的。
第二节因果推断简史
在哲学领域很早就有关于因果的讨论,
但真正可以操作的因果概念还是来
自 于 统 计 学 领 域 。统 计 学 领 域 流 行 的 观 点 是 统 计 工 具 只 能 考 察 和 识 别 相 关 关
系,
不能考察因果关系,
相 关 关 系 不 是 因 果 关 系 。N ey m a n ( 1 9 2 3 ,1990)在研究
农业实验中首次提出了潜在结果的概念,
但由于其论文是用波兰语写成的,
并
没 有 引 起 学 术 界 的 关 注 。② Fisher (1935)提 出 ,
随 机 化 实 验 (randomized experi-
ments)是 因 果 推 断 的 基 础 。2 0 世 纪 7 0 年 代 以 来 ,
Rubin (1974, 1977,1978) 的
一系列论文,
重新独立地提出了潜在结果的概念,
并将之推广到观测研究,
从而
构造出适用于随机化实验和观测研究的基本分析框架,
Rubin提出的潜在结果
框 架 被 称 为 R u b i n 因 果 模 型 (Holland, 1986)。
③ R u b i n 因 果 模 型 (Rubin Caus-
al Model, R C M ) 的 关 键 是 提 出 了 “潜 在 结 果 ”的 基 本 概 念 ,
第二章会详细介绍
R u b i n 潜 在 结 果 框 架 。 目 前 ,R C M 已 经 成 为 因 果 推 断 的 基 本 理 论 基 础
在经济学文献中,
因 果 推 断 可 以 追 溯 到 Ashenfelter (1978)、H e c k m a n and
R o b b (1985)等 。关 于 潜 在 结 果 的 概 念 ,实 际 上 在 H aavelmo (1943)关 于 供 求
分 析 的 联 立 方 程 理 论 中 有 所 涉 及 ,文 中 他 区 分 了 供 给 函 数 中 “任 何 想 像 的 价 格
兀”和 “实 际 价 格 ^ ”,
但是后来的计量经济学理论发展没有沿着潜在结果的方向
走下去,
而是开始对观测结果直接进行建模,
将潜在结果和分配机制杂糅在一
起,
使 因 果 效 应 的 识 别 变 得 难 以 理 解 ,并 且 引 人 的 假 设 也 越 来 越 多 (Rubin,
2008 ;Imbens and Wooldridge, 2009) 0
经 济 学 界 历 来 存 在 着 “计 量 经 济 学 是 否 是 科 学 ”的 争 论 (Hendry, 1980;
Sims, 1980),Learner (1983)更 是 指 出 :
“计 量 经 济 学 的 艺 术 就 是 ,
研究者在计
算 机 终 端 中 拟 合 许 多 (甚 至 上 千 个 )统 计 模 型 ,
从中选择一个或几个符合作者预
期的估计结果在论文中进行报告。
”“我 们 发 现 我 们 正 处 于 一 种 令 人 沮 丧 和 不 科
学 的 境 地 。没 有 人 将 数 据 分 析 看 作 严 肃 的 事 情 ,
或者更准确地,
没有人把别人
的数据分析当回事。
”Leamei: (1983)提 议 让 我 们 将 计 量 经 济 学 中 的 “谎 言 和 欺
骗 ”剔 除 出 来 ,
他 提 出 的 解 决 方 案 是 “敏 感 性 分 析 ”(sensitivity analysis)。然 而 ,
“敏 感 性 分 析 ”并 不 能 真 正 解 决 实 证 分 析 结 果 的 “可 信 性 ”问 题 (Angrist and Pis-
chke, 2010)。传 统 计 量 经 济 学 方 法 的 “可 信 性 危 机 ”在 当 时 逐 渐 显 现 出 来 ,
La-
Londe (1986)利 用 美 国 7 0 年 代 进 行 的 一 项 就 业 培 训 的 随 机 化 实 验 数 据 ,
考察
利 用 传 统 计 量 经 济 学 方 法 是 否 能 够 模 拟 随 机 化 实 验 的 结 果 。他 以 随 机 化 实 验
作 为 基 准 (benchmark),利 用 观 测 数 据 作 为 控 制 组 ,运 用 回 归 、固 定 效 应 、H e c k
man 选择模型等计量经济学常用方法估计了培训对收人的影响,
发现这些计量
经 济 学 方 法 都 无 法 复 制 随 机 化 实 验 的 结 果 。因 而 得 到 观 察 研 究 中 ,
计量经济学
方 法 无 法 可 信 地 估 计 出 因 果 效 应 的 悲 观 结 论 。L a L onde (1986) 的 研 究 直 接 推
动 了 经 济 学 经 验 研 究 的 “可 信 性 革 命 ”。经 济 学 家 开 始 关 注 计 量 娃 济 学 方 法 的
可信性问题,
Dehejia and W a h b a (1999)利 用 倾 向 指 数 匹 配 方 法 重 新 考 察 了 La
Londe (1986)探 讨 的 问 题 ,
他们发现,
尽 管 LaLonde尽量通过手工方式使两组
个体相似,
但 是 ,L a L o n d e 构 造 的 控 制 组 个 体 与 实 验 中 的 干 预 组 个 体 仍 然 具 有
较 大 的 特 征 差 异 。他 们 利 用 倾 向 指 数 匹 配 方 法 ,
获得与干预组个体更为相似的
控 制 组 个 体 ,发 现 估 计 的 因 果 效 应 与 随 机 化 实 验 的 结 果 非 常 相 似 。LaLonde
①关于潜在结果框架的归属, 在 统 计 学 界 和 经 济 学 界 存 在 着 争 议 。现 在 经 济 学 界 (主 要 是 He c k
man) 将 潜 在 结 果 框 架 归 属 于 R o y (1951),而 R u b h i 等 统 计 学 家 认 为 R o y (1951)并 没 有 提 出 真 正 的 潜 在
结 果 框 架 ,因 为 R o y (1951)文 中 全 是 文 字 表 述 , 并 没 有 明 确 的 模 型 和 潜 在 结 果 符 号 (Rubbi, 2005)。
第一章绪 论 5
第三节经济学研究的基本问题
一个好的经济学研究计划,
需 要 回 答 四 个 基 本 问 题 :感 兴 趣 的 因 果 效 应 问
题 是 什 么 ?为 了 估 计 因 果 效 应 所 需 要 的 理 想 化 实 验 是 什 么 ?识 别 策 略 是 什 么 ?
是否满足统计充分性?
在经济学经验研究中,
首 先 要 问 的 问 题 是 感 兴 趣 的 因 果 关 系 是 什 么 ? 因果
关 系 是 科 学 探 素 的 起 点 。找 到 关 心 的 因 果 关 系 ,
需要思考理想的随机化实验是
什 么 ?尽 管 我 们 手 头 的 数 据 可 能 不 是 实 验 数 据 ,
思考理想的实验可以帮助我们
进行研究设计。比如在劳动经济学中,
教育对个人收人的影响是一个经典的问
题 。对 于 教 育 如 何 影 响 个 人 收 人 ,理 想 的 实 验 是 如 果 能 够 对 个 人 的 教 育 进 行 随
机化分配,
那 么 不 同 教 育 程 度 个 体 收 人 的 比 较 就 可 以 得 到 教 育 的 因 果 效 应 。但
是,
我们获得的数据往往是调查数据,
而 非 实 验 数 据 。因 而 ,
我们需要问第三个
问 题 ,识 别 策 略 是 什 么 ?识 别 策 略 是 用 观 测 数 据 近 似 理 想 实 验 的 方 法 (Angrist
and Krueger, 1999)。利 用 观 测 数 据 识 别 因 果 关 系 ,
就是要通过研究设计,
用观
测 数 据 来 模 拟 随 机 化 实 验 。本 书 第 二 部 分 主 要 讨 论 各 种 识 别 策 略 ,
识别策略实
际 上 是 本 书 的 主 要 内 容 。第 四 个 问 题 讨 论 估 计 结 果 的 统 计 充 分 性 。一 般 经 济
学经验分析中,
获 得 的 数 据 为 样 本 信 息 ,利 用 样 本 信 息 推 断 总 体 信 息 ,
需要讨论
统 计 量 的 抽 样 分 布 以 判 断 估 计 结 果 的 统 计 显 著 性 。本 书 主 要 关 注 识 别 策 略 ,因
而,
采 用 总 体 视 角 ,即 假 设 我 们 有 总 体 数 据 ,
从而避免了对统计推断的讨论。
®
第 四 节 本 书 安 排
本 书 分 为 两 大 部 分 :理 论 基 础 和 研 究 设 计 。
第 一 部 分 介 绍 “实 验 学 派 ”计 量 经 济 学 的 基 本 理 论 基 础 ,
包 括 三 章 。第二章
介 绍 R u b i n 因 果 模 型 的 基 本 内 容 ,主 要 介 绍 潜 在 结 果 和 分 配 机 制 的 概 念 ,以及
因 果 效 应 参 数 的 定 义 。第 三 章 介 绍 随 机 化 实 验 的 基 本 思 想 。 随 机 化 实 验 是 因
果推断的基础,
也 是 本 书 的 灵 魂 . 第 四 章 介 绍 因 果 图 ,因 果 图 是 R u b i n 因果模
型的一种直观表述形式,
本 质 上 与 R C M 是等价的。主要介绍三种路径结构,
为
因果效应识别提供一种直观分析工具。
第二部分是研究设计,
主要介绍利用观测数据进行因果推断时几种常见的
识 别 策 略 。这 些 识 别 策 略 都 是 以 随 机 化 实 验 为 蕋 础 的 ,
正 如 Rubin (2008)指出
的,
观测研究类似于一种复杂的随机化实验,
但是分配机制是缺失的,
研究者必
须通过科学的设计,
将 缺 失 的 分 配 机 制 恢 复 出 来 。 因 而 ,观 测 研 究 的 关 键 即 如
何通过研究设计让它可以模拟随机化实验,
这 一 设 计 过 程 即 识 别 策 略 。识别策
略 是 经 验 研 究 结 果 可 信 性 的 关 键 。我 们 将 主 要 介 绍 五 种 常 用 的 识 别 策 略 ,
分别
是 回 归 、匹 配 、
工具变量法、
双重差分法(
包 括 合 成 控 制 法 和 回 归 合 成 方 法 )和断
点 回 归 设 计 (包 括 弯 折 回 归 设 计
从第二部分开始,
对于每种识别策略,
都会通过一个实例,
讨 论 其 在 Stata软
件 中 的 具 体 实 现 过 程 。相 关 数 据 集 可 以 到 https://github. com/zhaoxiliang/caus-
alinference下 载 ,
也 可 关 注 本 书 微 信 公 众 号 CausaHnference获 得 相 关 信 息 。
f推荐阅读
I m b e n s a n d R u b i n ( 2015 ) 第 3 章 对 因 果 推 断 历 史 进 行 了 筒 体 介 绍 。 A n
grist a n d P i s c h k e ( 2009 ) 第 1 章 介 绍 了 经 济 学 研 究 需 要 回 答 的 四 个 基 本 问 题 D
R u b i n ( 2008 ) 提 供 了 观 测 研 究 的 基 本 步 骤 。 丁 鹏 (2012 ) 对 因 果 推 断 方 法 进 行
了 很 好 的 简 要 介 绍 赵 西 亮 (2017 ) 对 经 济 学 经 验 研 究 的 “ 可 信 性 革 命 ”进行了
简要梳理。
第一篇
理论基础
第二章潜在结果框架
潜 在 结 果 的 概 念 最 早 是 由 N e y m a n (1923,
1990)在 研 究 重 复 随 机 化 农 业 实
验 中 提 出 的 ,由 于 该 文 用 波 兰 语 写 成 ,当 时 没 有 引 起 学 界 的 关 注 。 Rubin
(1974)重 新 独 立 地 提 出 了 潜 在 结 果 的 概 念 ,
并将它的使用推广到观测研究领
域,
从而形成了目前的潜在结果框架,
也 称 为 R u b i n 因 果 模 型 (Holland,1986)
或 Neyman-Rubin模 型 (
Pearl,1996)。R u b i n 因 果 模 型 或 潜 在 结 果 框 架 有 三 个
基 本 构 成 要 件 :潜 在 结 果 、
稳定性假设和分配机制(
assignment mechanism) 。
第 一 节 潜 在 结 果
在因果推断中,
必须有干预,
没 有 干 预 就 没 有 因 果 (R u b i n ,1974)。这 里的
干预可以是一项政策、
一 项 措 施 或 者 一 项 活 动 等 ,比 如 实 施 4 万 亿 的 财 政 刺 激
方案,
对 农 民 工 进 行 职 业 培 训 。® 本 书 主 要 关 注 二 值 的 干 预 变 量 ,
©两 个 值 分 别
对应于积极的行动和被动的行动,
分 别 称 为 (积 极 )干 预 和 控 制 (干 预 ),通 常 简
称为干预和控制,
受到对应干预的个体分别称为干预组和控制组。 比如,
对农
民 工 进 行 培 训 ,(积 极 )干 预 是 参 加 培 训 ,
控 制 (干 预 )是 没 有 参 加 培 训 。在 这 里 ,
干预和控制只是干预变量两种状态的标签,
具 体 哪 个 干 预 状 态 称 为 干 预 ,哪个
状态称为控制并不重要,
干预状态的两种称呼实际上是对0 称 的 ,
可以互换,
取
决于研究者的目的和偏好。
对应于每个干预状态,
就 有 一 个 (潜 在 )结 果 。在 干 预 状 态 实 现 之 前 ,
有几
个干预状态就有几个潜在结果,
而 干 预 状 态 实 现 之 后 ,只 有 一 个 潜 在 结 果 是 可
以观测的。比如,
考 察 大 学 教 育 对 个 人 收 人 的 影 响 ,干 预 变 量 或 原 因 变 量 是 大
那 么 对 于 任 意 个 体 i有 两 种 干 预 状 态 ,
学教育, 用 D,.来 表 示 ,
以 = 1 表示个体i
完成了大学教育, = 0 表 示 个 体 i 完 成 高 中 教 育 。无 论 个 体 实 际 是 完 成 大 学
教育还是高中教育,
事前每个个体均有两种可能的状态:
完成高中教育或完成
大 学 教 育 。每 一 个 状 态 下 对 应 于 一 个 潜 在 结 果 表 示 个 体 £ 在 状 态 = i 下
的 潜 在 结 果 , 表 示 个 体 〗在 状 态 认 = 0 下 的 潜 在 结 果 。对 个 体 而 言 ,这 两 个
潜在结果可以看作是确定性的变量,
不因个体干预变量的实现状态而改变。比
如 个 体 i 完 成 大 学 教 育 状 态 下 的 收 人 为 8 0 0 0 元 ,即 Y 1;= 800 0 ,
仅完成高中教育
状 态 下 收 入 为 6 0 0 0 元 ,即 Y w = 6000。如 果 个 体 i 最 后 实 际 完 成 了 大 学 教 育 ,
那
么 其 两 种 干 预 状 态 下 的 潜 在 结 果 仍 然 是 (8 0 0 0 ,6 0 0 0 ) ,
如 果 个 体 i 最后实际完
成的是高中教育,
其 两 种 干 预 状 态 下 的 潜 在 结 果 还 是 (8000,6000) ,
不因个体最
后 实 现 的 状 态 而 改 变 。可 以 将 潜 在 结 果 看 作 常 数 ,
对于每个特定的个体,
他在
两种干预状态下的潜在结果是给定的,
不依赖于最终实现的干预状态,
这一点
对 于 理 解 Rubin因果模型很关键。
® '
当干预状态实现后,
我们仅能观测到实现状态下的潜在结果,
没有实现状
态 下 的 潜 在 结 果 是 无 法 观 测 的 。无 法 观 测 到 的 潜 在 结 果 ,
通常称为反事实结果
(counterfactual outcome)。无 论 干 预 状 态 有 几 个 ,
干预状态实现后,
我们仅能观
测 到 实 现 状 态 下 的 潜 在 结 果 。 比 如 个 体 ;最 终 完 成 了 大 学 教 育 ,
那么观测到的
干 预 状 态 是 D, = l ,
我 们 可 以 观 测 到 潜 在 结 果 Y w ,即 个 体 ;完 成 大 学 教 育 后 的
收 入 。他 完 成 了 大 学 教 育 ,
我们就不能观测到他没有完成大学教育时的潜在结
果 y Df,即 仅 完 成 高 中 教 育 时 的 收 入 。一 个 人 不 可 能 同 时 踏 入 两 条 河 流 ,
不可能
同时处于两种状态,
因 而 ,观 测 研 究 中 ,
不可能同时看到个体所有的潜在结果。
无 法 同 时 观 测 到 个 体 所 有 潜 在 结 果 的 现 象 称 为 因 果 推 断 的 基 本 问 题 (Holland,
1986)。观 测 结 果 1 与 潜 在 结 果 之 间 的 关 系 ,
可以用下面的公式表示:
Y,.= D , U ( 1 — D,.)Yof
— fYi = y u , 如果 d; = l .i
( y ;= Y 0i, 如果 Di = 0
即 如 果 干 预 状 态 是 D, = l ,
则可以观测到潜在结果,
如 果 干 预 状 态 是 1);= 0 ,
则可以观测到潜在结果Y 。
,.,
但不能同时观测到两个潜在结果。
潜 在 结 果 和 观 测 结 果 Y ,.之 间 的 区 分 是 现 代 统 计 学 和 现 代 计 量 经
济学的重要标志,
是 经 济 学 经 验 研 究 “可 信 性 革 命 ”的 关 键 ,
也是区分描述性研
究 (descriptive study)和 因 果 研 究 (
causal study)的 标 志 。描 述 性 研 究 中 没 有 干
预,
从 而 结 果 只 有 一 种 状 态 下 的 观 测 结 果 ,因 果 研 究 中 ,有 明 确 的 干 预 ,
结果会
依 赖 于 不 同 的 干 预 状 态 ,每 个 个 体 都 有 多 个 潜 在 结 果 (Holland and Rubin,
1982)。潜 在 结 果 的 表 述 非 常 简 单 ,
但潜在结果的概念使因果效应的表述更加
① 事 实 上 ,
假设潜在结果是固定的,
只 是 一 种 简 化 ,这 种 简 化 使 我 们 更 容 易 理 解 R u b i n 因果模型的
精 髓 。其 实 ,
潜在结果可以是不依赖于干预状态的随机变量。
第二章潜在结果框架 11
清 晰 。有 了 潜 在 结 果 的 概 念 ,
个体因果效应的定义非常直观,
不需要对分配机
制进行任何内生性或外生性的假设,
也不需要对结果变暈的函数形式进行任何
假 设 。对 于 个 体 i,
某 项 干 预 的 因 果 效 应 是 两 种 状 态 下 潜 在 结 果 的 比 较 ,即 :
r,. = y 1;- y oi (2.2)
关于因果效应的定义有两点说明:
首 先 ,因 果 效 应 的 定 义 仅 依 赖 于 潜 在 结
果,
与哪一个潜在结果被观测到没有关系。回到前面大学教育如何影响收人的
例子,
无论个 体i是否完成了大学教育,
大学教育对其个人的因果影响都仅取决
于其两种状态下的潜在结果,
并 且 是 固 定 不 变 的 ,不 依 赖 于 个 体 最 终 实 现 的 干
预 状 态 。如 果 个 体 ;完 成 了 大 学 教 育 ,
大 学 教 育 (相 对 于 仅 完 成 高 中 教 育 )对其
收 入 的 影 响 是 每 月 收 人 增 加 2 0 0 0 元 。如 果 个 体 i 仅 完 成 高 中 教 育 ,
那么如 果 他
能够完成大学教育,
则 其 每 月 收 人 也 是 增 加 2 0 0 0 元 。因 而 ,因 果 效 应 的 定 义 仅
依赖于潜在结果,
不 依 赖 于 实 际 实 现 的 观 测 结 果 。其 次 ,因 果 效 应 是 干 预 后 同
一 时 间 、同 一 物 理 个 体 潜 在 结 果 的 比 较 。 比 如 考 察 某 种 药 对 感 冒 的 治 疗 效 果 ,
干预状态是吃药或不吃药,
对 应 的 潜 在 结 果 是 治 愈 感 冒 或 没 有 治 愈 。因果效 应
应该定义为我现在吃药和不吃药对应潜在结果的比较,
而不能用我现在吃药和
昨 天 我 没 有 吃 药 时 的 潜 在 结 果 进 行 比 较 。 因 为 昨 天 的 “我 ”和 今 天 的 “我 ”不是
同一个“我 ”,我 今 天 不 吃 药 的 潜 在 结 果 和 昨 天 不 吃 药 的 潜 在 结 果 可 能 是 不 一 样
的,
所以在评价今天我吃药的因果效应时,
应该是今天我吃药和今天我不吃药
时潜在结果的比较。
因果效应的定义仅依赖于潜在结果,
是 不 同 状 态 下 潜 在 结 果 的 比 较 。但研
究 者 仅 能观测到一个状态下的潜在结果。因 而 ,
如果仅有一个个体,
我们是没
有办法得到个体因果效应的。因 果 推 断 的 核 心 内 容 ,
实际上是想办法将未观测
到 的 潜 在 结 果 (即 反 事 实 结 果 )估 计 出 来 。估 计 未 规 测 的 潜 在 结 果 或 反 事 实 结
果 必 须 要 用 到 多 个 个 体 。多 个 个 体 的 选 择 有 两 种 方 式 :同 一 物 理 个 体 不 同 时 间
或同一时间的不同物理个体。比如,
判断一种药物是否对感冒有治疗效果,
我
们 往 往 根 据 自 己 以 往 的 经 历 。我 以 前 感 冒 的 时 候 吃 药 感 冒 就 好 了 ,
我今天没吃
药,
头 就 很 痛 ,因 而 ,
我 们 认 为 药 物 有 治 疗 效 果 。其 实 这 种 推 断 中 ,
我们进行了
很强的假设,
我 们 假 设 过 去 的 经 验 可 以 作 为 今 天 吃 药 的 反 事 实 结 果 。如 果 这 一
假设不成立,
我 们 就 不 能 用 过 去 吃 药 的 结 果 作 为 今 天 吃 药 的 反 事 实 结 果 。 因为
今 天 的 “我 ”与 过 去 的 “我 ”是 不 同 的 个 体 ,我 今 天 可 能 心 情 不 好 ,
不吃药头很痛,
即使吃药,
头 仍 然 是 痛 的 。这 并 不 一 定 说 明 药 没 有 治 疗 效 果 ,而 是 因 为 我 心 情
沮 丧 ,使 我 的 头 更 痛 了 ,即 我 的 头 痛 还 混 杂 了 其 他 的 影 响 因 素 ,
今 天 的 “我 ”和昨
天 的 “我 ”不 可 比 。很 多 时 候 ,
我们的推断是利用同一时间不同个体的信息来估
12 基本有用的计量经济学
计 反 事 实 结 果 。 比 如 考 虑 大 学 教 育 对 收 人 的 影 响 。在 上 大 学 之 前 ,
我们不确定
大 学 能 给 我 们 带 来 什 么 。我 们 只 知 道 目 前 我 的 结 果 是 什 么 样 子 ,
或收人是什么
水 平 。但 不 知 道 大 学 毕 业 之 后 收 人 会 是 什 么 水 平 。那 我 们 在 决 定 是 否 上 大 学
时,
是怎么作出决定的呢?我 们 可 能 会 观 察 那 些 上 了 大 学 的 人 ,
可能是亲戚或
朋友家的孩子,
现在已经大学毕业了,
有个很好的工作,
获得比较满意的收入。
那我们在作决策时是怎么做的呢?我们可能将他们的结果或收人作为我们上
大孪的潜在收人,
从 而 决 定 是 否 上 大 学 。事 实 上 ,后 面 章 节 的 识 别 策 略 就 是 利
用 这 种 方 式 来 推 断 的 。这 种 情 况 下 ,因 果 推 断 的 可 信 性 ,
依赖于我们与亲戚肋
友家孩子的相似性,
越相似,
这种推断越可信。
第二节稳定性假设
潜 在 结 果 框 架 的 第 二 个 要 件 是 稳 定 个 体 干 预 值 假 设 (T h e Stable Unit
Treatment Value Assumption, S U T V A ) ,
简 称 稳 定 性 假 设 (Rubin, 1980) 0 稳
定性假设有两层含义:
第一,
不同个体的潜在结果之间不会有交互影响;
第二,
干预水平对所有个体都是相同的。
稳定性假设的第一个要求是每个个体的潜在结果不依赖于其他个体的干
预 状 态 。我 和 你 住 在 同 一 间 宿 舍 ,
我 们 两 个 都 感 冒 了 。如 果 药 物 对 我 头 痛 的 治
疗效果依赖于你有没有吃药,
那么就不满足稳定性假设。比如,
我吃药但你不
吃药,
你的头在痛,
我尽管吃药了,
但 你 的 呻 吟 声 使 我 很 头 痛 ,我 的 头 痛 并 没 有
因为吃药而消失,
这并不是因为药物没有治疗效果,
原因是我的潜在结果依赖
于你是否吃药,
你 没 吃 药 直 接 影 响 了 我 吃 药 时 的 潜 在 结 果 。换 言 之 ,
我们的潜
在 结 果 存 在 交 互 影 响 。这 时 ,
我们每个人的状态不再是二值的,
而是四值的,
有
四个潜在结果,
分別对应于我们俩都吃药,
我们俩都没吃药,
我吃药你没吃和我
没 吃 你 吃 了 。但 是 ,
如果满足不存在交互影响的稳定性假设,
你是否吃药不会
影响我的潜在结果,
每个人的干预状态只有两个,
吃药还是没吃药,
每个人的潜
在结果也只有两个。
在 社 会 科 学 中 ,没 有 交 互 影 响 的 假 设 可 能 不 成 立 。社 会 科 学 特 别 是 经 济
学,
研究对象往往是人的行为,
个人的行为之间往往存在交互影响。比如 ,
研究
班 级 规 模 对 个 体 学 习 效 果 的 影 响 ,同 学 之 间 往 往 存 在 一 定 的 外 部 性 ,如 果 一 个
班级里好学生比较多,
他 们 之 间 相 互 讨 论 、相 互 促 进 ,
产生正的外部性,
从而提
高 大 家 的 学 习 效 率 。相 反 ,
如果调皮的学生比较多,
可能产生负外部性,
整个班
级的学习效果都不好。比如考察培训对农民工收人的影响,
如果项目的规模比
第二章潛在结果框架 13
较小,
不 会 对 项 目 外 的 劳 动 力 市 场 产 生 影 响 。但 如 果 项 目 规 模 比 较 大 ,可 能改
变整个劳动力市场的技能结构,
从 而 影 响 整 个 劳 动 力 市 场 的 技 能 供 给 。培训 规
模比较小,
接 受 培 训 的 农 民 工 可 能 很 容 易 找 工 作 ,收 人 也 不 错 。但 如 果 培 训 规
模很大,
这种技能劳动力供给很多,
则接受培训的农民工工作就没有那么容易
找到,
收 入 也 可 能 会 低 一 些 。这 在 经 济 学 中 称 为 一 般 均 衡 效 应 。但 是 不 存 在 交
互影响的假设下,
因果推断更加容易,
因而,
在本书中通常假设不同个体之间不
存在交互影响。
稳 定 性 假 设 的 第 二 个 要 求 是 对 所 有 的 个 体 干 预 水 平 是 相 同 的 。 比如 考 察
药物的治疗效果,
那么给所有病人的药物在药效上都应该是一样的,
不能有的
人有效成分是全额的,
有 的 人 是 半 额 的 。考 察 培 训 对 农 民 工 收 人 的 影 响 ,
那么,
对所有农民工的培训从质量到数量都应该是相同的,
不能有的人培训农业生产
技术,
有的人培训家政服务技术,
有的人培训3 天 ,
有 的 人 培 训 1 周 。干 预 要 具
体,
当考察一项干预影响时,
这项干预要对所有个体程度和水平都是一样的。
干预越具体,
因 果 效 应 测 度 越 精 确 。但 是 ,
在经济学研究中,
往往很难完全满足
这一要求。比如,
在 大 学 教 育 对 个 人 收 入 影 响 的 例 子 中 ,干 预 是 大 学 教 育 。这
里大学教育的概念其实是比较笼统的,
对不同个体而言,
大学教育这一干预水
平可能是不同的,
专 科 教 育 、本 科 教 育 甚 至 研 究 生 教 育 都 可 以 称 为 大 学 教 育 。
另外,
不同大学的教育质量也有相当的差别,
严格意义上是不满足稳定性假设
第 二 项 要 求 的 。在 应 用 中 往 往 忽 略 这 种 差 异 ,
将大学教育看作一种相同程度的
干 预 。因 而 ,
应 用 中 我 们 更 加 关 注 稳 定 性 假 设 的 第 一 项 要 求 ,即 要 求 不 同 个 体
潜在结果之间没有交互影响。
第 三 节 分 配 机 制
潜 在 结 果 框 架 的 第 三 个 要 件 是 分 配 机 制 。分 配 机 制 是 描 述 为 什 么 有 的 人
在干预组,
有的人在控制组,
或者分配机制是描述哪个潜在结果可以被观测到
的 机 制 。® 因 果 推 断 中 分 配 机 制 非 常 重 要 ,
对分配机制的了解有助于进行正确
的 因 果 推 断 。下 面 看 一 个 简 单 的 例 子 了 解 分 配 机 制 的 作 用 。
① 分 配 机 制 的 说 法 一 般 用 在 实 验 中 ,因 为 实 验 设 计 者 或 研 究 者 可 以 控 制 分 配 机 制 ,
让哪些个体进
人干预组,
哪 些 个 体 进 人 控 制 组 。而 在 观 测 研 究 中 ,
个 体 往 往 根 据 自 己 的 效 用 选 择 进 人 不 同 的 群 组 。因
而,
在观测研究中,
分配机制也可称为选择机制《
14 基本有用的计量经济学
表 2. 1 手术相对于药物的治疗效果
潜在结果 因果效应
个体 干预状态 观测结果
1 0 Yi,--Yo,-
病人1 7 1 6 1 7
病人2 5 6 -1 0 6
病人3 5 1 4 1 5
病人4 7 8 -1 0 8
平均因果效应 2
一个总体有4 个病人,
考 察 手 术 治 疗 相 对 于 药 物 治 疗 的 效 果 。手 术 治 疗 是
积极干预,
用 1 表示,
药物治疗是保守治疗,
用 0 表 示 。表 2, 1 列 出 了 每 个 病 人
两种干预状态下的潜在结果,
从 而 可 以 计 算 出 每 个 病 人 的 因 果 效 应 。® 表 2. 1
显 示 病 人 1 手 术 治 疗 后 寿 命 为 7 年 ,而 药 物 治 疗 为 1 年 ,因 而 手 术 治 疗 相 对 于
药 物 治 疗 的 因 果 效 应 是 6 年 。病 人 2 手 术 治 疗 寿 命 为 5 年 ,而 药 物 治 疗 是 6
年,
手 术 治 疗 相 对 于 药 物 治 疗 的 效 果 是 一 1 年 。总 体 平 均 而 言 ,
4 个病人手术治
疗比药物治疗寿命多2 年。
假设现实中医生具有很好的医术或鉴别力,
可以让病人选择对他们最有利
的治疗方案,
从 而 实 现 的 干 预 状 态 见 表 2. 1 第 4 列 ,
让 1、
3 病人接受手术治疗,
2、
4 病人接受药物治疗,
最 终 我 们 可 以 观 测 到 1 、3 病 人 的 Y h 、2 、4 病 人 的 y 。
,。
如果不了解分配机制,
直接利用两组观测结果进行比较,
将发现手术治疗平均
寿命6 年,
药物治疗平均寿命7 年 ,
从 而 得 到 药 物 治 疗 更 有 效 的 错 误 结 论 。为
了得到正确的因果效应,
必 须 了 解 分 配 机 制 ,即 为 什 么 1 、
3 病人在干预组,
而 2、
4 病人在控制组。
在进行因果推断时,
必 须 对 反 事 实 结 果 进 行 估 计 或 预 测 ,而 这 种 预 测 往 往
是很困难的,
涉及对分 配 机 制 或 选 择 机 制 的 了 解 。为 了 搞 清 楚 分 配 机 制 ,
往往
需 要 一 些 干 预 前 变 量 (pretreatment variables)或 协 变 量 (covariates) 。协变量 包
括两类:
一类是个体属性,
不 随 干 预 状 态 变 化 而 变 化 的 变 量 ,比 如 性 别 、民族等
变 量 。另 一 类 是 干 预 实 施 之 前 取 值 的 变 量 ,比 如 研 究 培 训 的 作 用 时 ,
培训前的
收 入 水 平 及 经 济 社 会 特 征 等 都 是 协 变 量 。协 变 量 的 基 本 特 点 是 这 些 变 量 均 不
受干预变量的影响,
相反,
这些变量往往决定个体的干预状态。
根据分配机制是否已知,
可 以 将 分 配 机 制 分 成 两 类 :随 机 化 实 验 和 观 测 研
①现实中仅能观测到一个结果,
这里假设我们可以看到所有的潜在结果^
第二章潜在结果框架 15
究 。这 两 类 机 制 有 共 同 特 点 ,
都 是 研 究 某 项 干 预 的 因 果 效 应 。® 随 机 化 实 验 中 ,
分配机制是由实验者或研究者控制的,
是 已 知 的 。观 测 研 究 中 ,
分配机制是未
知 的 。观 测 研 究 的 目 的 就 是 想 办 法 将 未 知 的 分 配 机 制 识 别 出 来 ,
从而估计因果
效应。
下 面 引 人 一 个 关 键 概 念 ---- 非 混 杂 性 (unconfoundedness) 。非 混 杂 性 也 称
为 条 件 独 立 性 (conditional independence)或 根 据 观 测 变 量 进 行 的 选 择 (selection
on observables),
是 指 控 制 观 测 变 量 X,.后 ,
个体干预状态的分配不依赖于潜在
结 果 ,个 体 到 底 在 干 预 组 还 是 在 控 制 组 是 独 立 于 潜 在 结 果 的 。非 混 杂 性 可 以 表
示为:
②
(Yo^Yi,) JLD,- | X, (2.3)
其 中 ,1 表 示 相 互 独 立 ,
X,.表 示 协 变 量 。式 (2.3)表 示 ,以 先 决 变 量 足 为 条 件 ,
干 预 变 量 A . 独 立 于 潜 在 结 果 以 及 潜 在 结 果 的 任 何 函 数 ,比 如 个 体 因 果
效 应 r,.也 独 立 于 干 预 变 量 认 。满 足 非 混 杂 性 的 分 配 机 制 实 际 上 排 除 了 R o y
(1951)的 选 择 模 型 ,
在 R 0y(1951)模 型 中 ,
个 体 可 以 根 据 自 己 的 潜 在 结 果 (在捕
鱼 或 狩 猎 上 的 生 产 率 )决 定 干 预 状 态 (是 进 行 捕 鱼 还 是 狩 猎 ),因 而 他 们 最 终 从
事 的 职 业 类 型 是 其 根 据 个 人 的 比 较 优 势 进 行 选 择 的 结 果 ,不 满 足 非 混 杂 性
要求。
根 据 分 配 机 制 是 否 满 足 非 混 杂 性 条 件 (2. 3 ) ,可 以 将 分 配 机 制 分 成 三 类 。
如果分配机制满足非混杂性且函数形式已知,
称 为 经 典 随 机 化 实 验 。如 果 满 足
非混杂性,
但分配机制的函数形式未知,
称 为 规 则 分 配 机 制 (regular assignment
mechanism)。其 他 机 制 为 不 规 则 机 制 (irregular assignment mechanism) „
第 四 节 潜 在 结 果 和 L o r d 悖论
有了潜在结果的概念,
对 理 清 所 要 研 究 的 因 果 问 题 、定 义 因 果 效 应 非 常 有
帮 助 。有 些 因 果 问 题 的 探 析 ,
必须从潜在结果概念出发才能搞清楚因果效应是
否 有 清 晰 的 定 义 。从 观 测 结 果 出 发 进 行 建 模 往 往 不 能 清 晰 地 表 述 所 研 究 的 因 果
效应问题,
从 而 出 现 各 种 悖 论 ^ 统 计 学 中 有 一 个 著 名 的 L o r d 悖 论 (Lord’
s Par-
adox),
这 一 悖 论 是 由 美 国 教 育 考 试 服 务 中 心 (Educational Testing Service,
E T S ) 统 计 学 家 Frederic L o r d 于 1 9 6 7 年 提 出 来 的 ,
最 终 由 同 在 E T S 工作的 另
外 两 位 统 计 学 家 Paul Ho l l a n d 和 Donald R u b i n 于 1 9 8 2 年 圆 满 解 决 。
..K
01
100 120 140 160 180
X: 1963年9月入学时的体赏
图 2. 1 Lord悖论
Lord (1967)构 造 了 一 个 假 想 的 案 例 。一 所 大 学 想 考 察 其 食 堂 膳 食 对 学 生
体重的影响以及影响的性别差异,
为此,
收 集 了 学 生 9 月份人学时的体重,
然后
次 年 6 月 份 又 获 得 了 学 生 在 校 一 学 年 后 的 体 重 。两 个 统 计 学 家 分 别 利 用 这 个
数据考察了学校食堂对学生体重的影响,
但 得 到 了 完 全 不 同 的 结 论 。第 一 个 统
计学家用了比较初等的方法,
计算了男生和女生入学时的平均体重, 分 别 是 150
磅 和 1 3 0 磅 。然 后 又 计 算 了 入 学 1 学 年 后 男 、
女生的平均体重,
发 现 仍 然 是 150
磅 和 1 3 0 磅 。因 而 ,
第一位统计学家认为学生食堂膳食对学生体重没有影响。
第二个统计学家采用了更加高等的方法— 回归分析,
他认为为了考察食堂对
学生体重的影响,
必 须 比 较 两 个 初 始 体 重 相 同 的 人 ,因 而 ,
他构造了一个回归模
型,
控制了个体人学时的体重,
并 考 察 了 性 别 的 差 异 , 回 归 结 果 表 明 ,同样体重
的男生、
女生相比,
男 生 的 体 重 增 加 更 大 ,比 女 生 平 均 高 7. 3 磅 。两 个 统 计 学 家
利用同一数据,
采用不同的方法,
得到几乎相反的结果,
一个说无因果影响,
一
个说对男生的影响更大,
这 种 矛 盾 的 结 果 被 称 为 L o r d 悖 论 。那 么 ,
这两个统计
学家的分析,
哪 一 个 正 确 呢 ?我 们 首 先 用 R u b i n 因 果 模 型 的 框 架 套 用 到 该 问 题
上,
见 表 2.2:
第二章潛在结果框架 17
表 2 . : 1 L o r d 悖论问题的基本构件
研究设计:
总‘
体 某 大 学 19G3— 1 9 6 4 学 年 全 部 学 生
积极干预 学校食堂膳食
控制干预 ?
干预变量 对所有的学生,
均 有 D, = 1
变量:
G 性 别 (1 = 男 生 ,2 = 女 生 )
X 1963年 9 月入学时的体重
Y 1964年 6 月放假时的体重
表 2. 2 中 的 问 号 (?)表 示 ,
尽管积极干预是非常清晰的^ ■ 学校食堂膳食,
它对学生体重的影响是想研究的问题,
但没有清晰的控制干预,
不在学校食堂
吃饭时是在家吃饭还是在外下馆子,
我 们 不 清 楚 。这 意 味 着 潜 在 结 果 Y 。的定
义是模糊的,
这 一 点 是 解 决 L o r d 悖 论 的 关 键 。h 表 示 1 9 6 4 年 6 月份学生没在
学 校 食 堂 吃 饭 时 的 体 重 。然 而 ,
没 有 学 生 在 控 制 组 ,A. = l ,
所有学生都在学校
食 堂 吃 饭 。为 了 回 答 上 文 提 出 的 因 果 效 应 问 题 ,
必 然 要 引 入 一 些 有 关 K 的不可
检验的假设。
食 堂 膳 食 对 学 生 体 重 的 个 体 影 响 可 以 写 成 A — Y 。,对 所 有 学 生 的 平 均 影
响可以写成:
\ G = Q, i- 1,2 (2.4)
平均因果影响的性别差异为:
= (2.5)
A 也可以写成:
A = { E [ Y { | G = 1] - E[Y, | G = 2] 丨
- {EIY 0 | G = l]-£[Yo I 2]} (2.6)
第 1 个统计学家根据男女生人学前和放假后平均体重的对比得到没有影
响的结论,
他估计的参数为:
dt = E [ Y X - X \ G ^ i ] , . i= 1 ?2 (2.7)
影响的性别差异为:
d — S] —82 (2.8)
第 i 个统计学家观测到男、
女 生 开 学 和 放 假 时 的 平 均 体 重 没 有 变 化 ,即 (2. 7 ) 中
的 8 , 都 为 0 ,从 而 得 到 学 校 食 堂 膳 食 对 学 生 体 重 没 有 影 响 并 且 影 响 没 有 性 别 差
异 的 结 论 。但 是 ,
得到这一结论,
需 要 对 潜 在 结 果 Y 。施 加 一 些 假 设 ,
一个可能
18 基本有用的计量经济学
的假设是如果不在学校食堂吃饭,
学 生 的 体 重 等 于 其 人 学 时 的 体 重 ,即假设
Y0- X (2.9)
在 这 一 完 全 无 法 检 验 的 假 设 下 ,(
2. 7 ) 中 的 表 才 会 等 于 式 (2. 4 ) 中 的 平 均 因 果 效
应 参 数 么 。然 而 ,
这 一 假 设 未 必 合 理 ,不 在 学 校 吃 饭 ,
在家吃饭,
说不定体重也
会增加,
从 而 使 假 设 不 成 立 。但 就 数 据 而 言 ,
该假设实际上是无法证明的。
第 2 个 统 计 学 家 认 为 应 该 控 制 开 学 时 的 体 重 ,比 较 相 同 体 重 的 人 放 假 时 体
重 的 变 化 。因 而 ,同 样 初 始 体 重 为 X 的 个 体 ,
体重的增細为:
d i O O - EIY, - X | X , G - i], i = 1,2 (2.10)
增量的性别差异为:
8 (X) = d 1 ( X ) - d 2 (X) (2.11)
为了简单起见,
L o r d 假 设 条 件 期 望 函 数 均 为 线 性 且 男 女 生 斜 率 相 同 ,即
E[Y, |X , G = i~\ = ai+ b X , i - 1,2 (2.12)
则 <KX)可以简化为:
diX) ^ a, ~ a z (2.13)
第 2 个 统 计 学 家 将 扒 X ) 解 释 为 6 月份男生平均体重超过女生平均体重的
部分,
这一解释是正确的,
但 并 不 是 因 果 效 应 的 差 额 。 因 为 W X ) 与 (2. 4 ) 和
(2. 5)中 的 因 果 效 应 参 数 A 和 4 没 有 直 接 关 系 。但 是 ,在 一 定 的 假 设 下 ,
第
2 个 统 计 学 家 的 估 计 结 果 等 于 因 果 效 应 参 数 。 比如假设
Y 0 - a + bX (2.14)
假 设 (2. 14)要 求 学 生 不 在 食 堂 吃 饭 时 6 月 份 的 体 重 完 全 由 9 月 份 的 初 始 体 重
线性决定,
并 且 对 所 有 性 别 的 学 生 都 一 样 。在 这 一 假 设 下 ,
则有
E [ Y 1 — Y 。| G = H - E C Y . - Y o I G = 2]
= EiYr-a-bX | 1]-£:
[ ^ - a - 6 X 1 G = 2]
= ElY, - b X | G = 1] - ElYr -~bX | G = 2]
- E [ E [ Y , 丨X ,
G = H - b X | G = 1]
- £[E[y, | X ’
G = 2 ] - b X | G = 2]
= £ [ « ! + b X - b X | G = l 2 - E l a 2 - h b X - b X 丨G = 2]
= ax—az = 8 {X) (2.15)
第 四 行 使 用 了 全 期 望 公 式 (5. 2 ) 。所 以 ,
如 果 假 设 (2. 14)成 立 .则 第 2 个统
计 学 家 得 到 的 结 果 等 于 因 果 效 应 参 数 的 差 异 。但 假 设 (2. 14)要 求 y 。完全线 性
依赖于初始体重,
这一假设也是不可检验的。
因而,
如果要考察在食堂吃饭这一干预的影响,
必须比较两种状态下的潜
在 结 果 。本 例 中 所 有 学 生 人 学 后 都 在 食 堂 吃 饭 ,
都在干预组,
没有在控制组中
第二章潜在结果框架 19
的 个 体 ,因 而 ,
根 本 没 有 办 法 估 计 食 堂 的 因 果 影 响 ,除 非 施 加 很 强 的 假 设 。如果
假设每个个体1 学年后,
如果不去食堂吃饭,
其体重就是入学时的体重,
或平均
而言,
等于人学时的体重,
那 么 第 1 个 统 计 学 家 的 结 烯 就 是 正 确 的 。如 果 假 设
不去食堂吃饭的体重是入学时体重的线性函数,
那 么 第 2 个统计学家的结论是
正 确 的 。然 而 ,
这 些 假 设 都 不 一 定 成 立 ,因 而 ,
两个统计学家的结论可能都是错
的 。有 了 潜 在 结 果 的 概 念 ,
有利于定义清楚要识别的因果效应问题,
避 免 Lord
悖论。
第五节因果效应参数
实证研究中,
我 们 关 心 的 往 往 不 是 某 一 特 定 个 体 的 因 果 效 应 ,而 是 干 预 的
平 均 因 果 效 应 。假 设 有 N 个 个 体 ,
©用 〗
= 1 ,
"*,
^ / 表 示 。D ,.是 干预变量或原因
变 量 并 且 D ,士 { 0 ,
1 丨。个 体 因 果 效 应 为 :
r; - y , , . - y 0/, i = I,…,
N (2.16)
个体因果效应往往无法估计,
因 而 ,我 们 关 注 总 体 平 均 因 果 效 应 (Average Caus
al Effect 或 Average Treatment Effect, A C E 或 A T E ) ,
定义为所有个体因果效
应 的 平 均 值 。它 表 示 从 总 体 中 随 机 抽 取 一 个 个 体 进 行 干 预 的 平 均 因 果 效 应 。
用公式表示为:
rATE = E [ y 1(- Y o J (2. 17)
在政策评价中,
我们更关心那些受到政策影响的个体的平均因果效应,
称
为干预组平均因果效应(
Average Treatment Effect for the Treated, A T T ),公
式表示为:
■^att = E[_Yu —Y 0i | Di — 1] (2. 18)
有些时候,
我们关注那些没受到政策影响的个体如果接受政策干预的话,
其 平 均 因 果 效 应 是 多 少 ,这 一 参 数 称 为 控 制 组 平 均 因 果 效 应 (Average Treat
ment Effect for the Control,A T C ) ,
公式表示为:
rATc = E [ Y u - Y 0i | D, = 0] (2. 19)
这三个因果效应参数是政策评估中最常用的参数,
根据研究需要,
还可以
定义根据不同协变量分组的平均因果效应参数,
不同的因果效应参数回答不同
的政策问题。比如考察大学教育对个体收人的影响,
将大学教育看作一项积极
干预,
高 中 教 育 看 作 一 项 控 制 干 预 。如 果 想 知 道 大 学 教 育 对 所 有 国 民 的 平 均 影
①本书主要关注因果效应参数的识别,
因 而 ,我 们 主 要 从 总 体 的 角 度 进 行 分 析 ,
不考虑参数的抽样
分布及相关统计推断问题。
20 基本有用的计量经济学
响,
估 计 的 参 数 是 总 体 的 平 均 因 果 效 应 (A T E ) ,
它反映的是如果全部国民均接
受 大 学 教 育 相 对 于 均 接 受 高 中 教 育 全 部 国 民 的 平 均 收 人 增 长 。如 果 关 心 的 政
策问题是大学教育给接受者带来了多大程度的收人增加,
需要估计的参数是干
预 组 平 均 因 果 效 应 ( A T T ) 。如 果 想 知 道 那 些 仅 完 成 高 中 教 育 的 个 人 ,
如果他们
能够完成大学教育的话,
他们的收人将增长多少,
则需要估计的参数是控制组
平均因果效应(
A T C )。
表 2. 3 构 造 了 一 个 简 单 的 例 子 示 范 三 个 因 果 效 应 参 数 的 计 算 。假 设 一 个
总体只有4 个个体,
并 且 可 以 同 时 看 到 两 种 干 预 状 态 下 的 潜 在 结 果 (现实中 只
能 看 到 一 种 状 态 下 的 结 果 ),从 而 每 个 个 体 的 个 体 因 果 效 应 也 可 以 计 算 出 来 。
根据干预变量的取值,
前两个个体在干预组,
后两个个体在控制组。
表 2 . 3 因果效应参数
i Yu Yo,- Y, D;
1 3 0 3 1 3
2 1 1 1 1 0
3 1 0 0 0 1
4 1 1 1 0 0
首 先 计 算 总 体 平 均 因 果 效 应 (A T E ) ,它 是 所 有 个 体 因 果 效 应 的 平 均 值 ,
因而:
rATE = E C Y i ;— Y 0,.]= 3 • (1/4) + 0 • (1/4) + 1 • (1/4) + 0 • (1/4) = 1
即平均而言,
这项干预使个体结果增加1。由于前两个个体在干预组,
那么干预
组的平均因果效应为:
rATT = E [ Y U - y 0, I A- = 1] = 3 • ( 1 / 2 ) + 0 • (1/2) = 1.5
受 到 干 预 的 两 个 个 体 因 为 干 预 使 其 结 果 平 均 增 加 1. 5 。 同 样 地 ,
对于在控制组
中的两个个体,
如果他们也接受干预的话,
干预的影响为:
rATC = £:
[ y 1( - Y 0i 丨 = 0] = 1 • (1/2) + 0 • (1/2) = 0 . 5
因为在这个简单的小例子中,
我们假设可以同时观测到两种干预状态下的
潜在结果,
个 体 因 果 效 应 也 可 以 观 测 到 ,因 而 所 有 的 因 果 效 应 参 数 都 可 以 计 算
出 来 。现 实 中 ,
我们仅能观测到一种状态下的潜在结果,
对于前两个个体,
他们
在干预组,
辽= 1 ,
我 们 可 以 观 测 到 它 们 在 积 极 干 预 状 态 下 的 潜 在 结 果 Y w ,即
= h,,
但观测不到他们在控制状态下的潜在结果Y 。
,.。 当 然 也 没 有 办 法 观 测 到
或 计 算 出 他 们 的 个 体 因 果 效 应 Y。
,.。 同 样 地 ,
后两个个体在控制组,
A.
=0,
可以观测到Y 。
,,但 无 法 观 测 到 I ,,也 没 有 办 法 观 测 到 或 计 算 出 它 们 的 个
体 因 果 效 应 r,.。从 而 ,
前面计算的三个因果效应参数也没有办法计算出来了。
第二章潜在结果框架 21
首先看干预组平均因果效应:
rATT = £:
[¥„■ — | D,. = 1] = E LY u | D, 二 1] 一 E [ Y 0, | D,- = 1]
对于干预组的个体,
第 一 项 £ [ 1 , 1A. = 1]是 可 以 观 测 到 的 ,即 E[Y,. |D, = l ] -
E t Y w i L ^ l ] 。但 第 二 项 反 事 实 结 果 ID,'= 1]是 观 测 不 到 的 ,
必须通过一
定的方法将其估计出来,
才 能得到干预组平均因果效应的估计。同样的 道 理 ,
对于控制组个体,
可 以 观 测 到 E [ Y oi|D i= 0 ] ,但 观 测 不 到 E [ y 1; |Di = 0 ] , E [ Y U
ID,=0]也是需要估计的反事实结果。由 于 A T T 和 A T C 都 不 可 观 测 ,
平均因
果效应(
A T E ) 也 无 法 观 测 。因为
rATE=
= E C E C ^ - Y o , | D ,-]],使 用 全 期 望 公 式 E [ Y ] = £ [ £ [ Y | X ] ]
= E [ Y U —Y 。
,. | D,' = 1] • P r [ D r- 二 1]
+ E [ Y 1; - Y 01- I D, = 0] • PrLD, - 0]
= r An 'P r [ D ; ^ l ] + r ATC( l — P r [D , = 1 ] ) (2 , 2 0 )
在观测研究中,
我 们 仅 能 观 测 到 一 种 状 态 下 的 潜 在 结 果 。在 表 2 . 3 中 ,
列和列实际上是观测不到的,
只 能 看 到 Y,和 D , 两 列 。学 过 回 归 分 析 的 学 生
可 能 禁 不 住 想 用 H D , . 回 归 ,这 也 是 计 量 经 济 学 的 基 本 建 模 方 式 ,
用观测结
果 y,■作 为 被 解 释 变 量 ,
用 干 预 变 量 A . 作 为 解 释 变 量 。但 是 这 种 回 归 并 不 能 识
别出任何因果效应参数。比如我们建立一个简单的双变量回归模型:
Y,- - a + r D ;+£,.
根 据 初 等 计 量 经 济 学 的 知 识 ,用 一 个 容 量 为 N 的 随 机 样 本 去 估 计 上 述 简 单 回 归
模 型 , 的回归系数为:
N
2 ( u ) ( a — 乃)
--------------- (2.21)
S ( D ;- D ) 2
i- I
其中,
JV
x = ( 1 / N ) 2 _ r ;, x, = Y ,-或 _x,. = D,
当 干 预 变 量 为 二 值 时 ,可 以 证 明 回 归 系 数 等 于 干 预 组 与 控 制 组 样 本 均 值 之
差 。干 预 变 量 A . 是 二 值 的 ,
取 1 表 示 个 体 在 干 预 组 ,取 o 表 示 个 体 在 控 制 组 。
干预组样本数N , 和控制组样本数N , 可以分别表示为:
N N
干预组和控制组观测结果的样本均值可以分别表示为:
22 基本有用的计量经济学
N N
y, = a / N . ^ D ^ , y c = a / N c) ^ a - D i)Yi (2.23)
iW /= 1
首 先 看 (2. 21)的 分 母 ,
2 ( 0 , - D ) 2 - 2 [ D f — m ( N , / N ) + ( N t/ N ) 2]
r —1 ; —1
2 ( A —m 2 ^ > - N f/N)r,-
r °S = N ta ~ N t/N) = N , ( l - i V f/ N ) "
自 眺 韻 . ^ fD ^ - ( l - D , . ) N f1r
NjTe N^fc \Yi
= S ed ./n ^ ci - d ^/n j y ,.
t= l
- 堂 ;( A . y , M ) - 念 ( i - A . ) y " 凡
:■
=1 i =1
N N
= ( 1/]\/,)2>;1 - ( 1 / 队 )2 ] ( 1 - 0 , . ) 1 = y ( ~ y f (2.25>
;= 1 i=l
在大样本的情况下,
比如教育收益率的例子,
大学教育和高中教育两组个体收人相比较,
如果大学
教育具有正向选择性,
潜在收人高的个体倾向于选择上大学,
那么,
上大学的个
体即使仅完成高中教育,
他 们 的 收 人 也 会 比 高 中 组 来 得 高 。两 组 个 体 观 测 收 入
平均值之差就不能解释为大学教育对个人收入的因果影响,
选 择 偏 差 为 正 ,回
归系数将高估教育对收人的影响。 如果两组个体在受高中教育状态下的潜在
收 人 相 似 ,满 足 假 设 (2. 2 8 ),则 回 归 系 数 就 是 大 学 教 育 对 个 体 收 人 的 影 响
(ATT)。
'
类似地,
总 体 回 归 系 数 也 不 是 控 制 组 平 均 因 果 效 应 (A T C ) 。
r0,s= E l Y i | D, = 1 ] - E [ Y , | D, = 0]
= E [ Y U | D ;= 1 ] - E [ y 0/ ! A = 0]
= E L Y U - Y 0i \ D, = 0] + E I Y U I D ; = 1] — E [ Y U [ D, = 0] (2. 29)
、m Y 4 、 一 V ,
ATC 选择偏差
只 有 施 加 下 列 假 设 ,回 归 系 数 才 等 于 A T C ,
E [ Y U | D,. - 1] = E [ Y U I D ; 二 0] (2. 30)
总体回归系数通常也不是平均因果效应(
ATE),
r0,s= E l Y u ~ Y 0i^ - h E [ Y 0i | D, = 1] — E [ Y 0i 丨D,. = 0] + {1 — Pr[D,- = 1]}
v ' ' Y .
ATE 选择偏差
方法获得相关因果效应参数的估计。
第六节总 结
本章主要介绍了潜在结果的三个基本要件:
潜在结果、
稳定性假设和分配
机 制 。潜 在 结 果 的 概 念 使 因 果 效 应 的 定 义 非 常 清 晰 。 因 果 推 断 主 要 对 潜 在 结
果建模,
而 不 是 根 据 观 测 结 果 建 模 。稳 定 性 假 设 是 因 果 推 断 的 一 个 技 术 性 简
化,
在考察的对象可能存在着交互影响时,
可以选择合适的个体定义,
从而使稳
定 性 假 设 得 到 满 足 。 比 如 考 察 班 级 规 模 对 学 生 成 绩 的 影 响 ,由 于 同 一 班 级 不 同
学 生 之 间 可 能 存 在 外 溢 效 应 (peer effect),
如果个体是单个学生,
可能不满足稳
定 性 假 设 。但 如 果 将 研 究 对 象 定 义 为 班 级 ,
则不同班级之间可能不存在交互影
响,
稳 定 性 假 设 就 会 成 立 。分 配 机 制 决 定 了 个 体 哪 个 潜 在 结 果 实 现 ,
可以被观
测 到 。根 据 分 配 机 制 的 特 征 ,
可以将分配机制分成三类:
随机化机制、
规则 机 制
和 不 规 则 机 制 。对 后 两 种 机 制 ,
计量经济学中分别称为根据观测变量的选择机
制 (selection on observables)和 根 据 未 观 测 变 量 的 选 择 机 制 (selection on unob-
servables)。在 因 果 推 断 中 ,
必 须 对 个 体 分 配 机 制 进 行 深 人 分 析 ,才 能 作 出 科 学
的 推 断 。如 果 干 预 为 二 值 变 量 ,
简单回归系数实际是两组个体的观测结果平均
值 差 异 。通 常 情 况 下 ,
总体.回 归 系 数 不 能 解 释 为 任 何 因 果 效 应 参 数 。但 在 一 定
的 假 设 条 件 下 ,回 归 系 数 会 有 因 果 效 应 的 解 释 。对 于 这 一 点 ,
第五章还会详细
讨论。
需要注意的是,
潜在结果框架仅关注因果效应,
不能说明变量之间的影响
机 制 ,因 果 效 应 是 一 个 “黑 箱 ”,只 能 给 出 因 果 效 应 的 大 小 ,
不能给出产生这一因
果 效 应 的 内 在 机 制 (H e c k m a n ,2001,2010;Rucker et al.,2010)。
推荐阅读
Imbens and Rubin (2015)第 1 章和 M o r g a n and Winship (2015)第 2 章对
潜 在 结 果 框 架 有 一 个 很 妤 的 介 绍 。N e y m a n (1923,1990)首 次 在 农 业 随 机 化 实
验中引入了潜在结果的概念,
Rubin (1974)重 新 独 立 提 出 了 潜 在 结 果 的 概 念 并
且 推 广 到 观 测 研 究 中 ,可 以 参 考 阅 读 。
第三章随机化实验
本章主要介绍随机化实验的作用以及为什么随机化实验可以消除选择偏
差 (selection bias)。在 实 验 中 ,
研究者可以控制个体的干预状态,
研究者可以通
过 一 定 的 机 制 决 定 哪 个 个 体 进 入 干 预 组 ,哪 个 个 体 进 入 控 制 组 。 随 机 化 实 验
中,
干 预 状 态 可 以 通 过 一 定 的 随 机 机 制 实 现 ,比 如 利 用 投 硬 币 的 方 式 ,
正面去干
预组,
反面去控制组,
每 个 个 体 均 有 1 / 2 的 可 能 性 进 人 干 预 组 和 控 制 组 。因 而 ,
随机化实验中,
研究者知道随机机制及分配概率。
第一节随机化实验的作用
机 化 的 好 处 在 于 不 需 要 控 制 其 他 的 可 能 影 响 因 素 ,因 为 我 们 关 心 的 原 因 变 量 取
值是随机化的,
从而使干预组和控制组两组个体的其他影响因素差异都是偶然
性的,
两组个体结果变量的比较,
就 是 该 原 因 变 量 对 结 果 变 量 的 影 响 。 回到教
育收益率的例子,
假设可以做随机化实验,
考 察 大 学 教 育 D 对 个 人 收 人 Y 的影
响 。对 于 一 个 特 定 总 体 ,
对 他 们 的 教 育 进 行 随 机 化 分 配 ,比 如 通 过 投 均 勻 硬 币
的方式,
正面让他接受大学教育,
反 面 就 只 让 他 完 成 高 中 教 育 。如 果 可 以 完 成
这样一个假想的随机化实验,
那么,
直接比较这两类人的收人就可以得到大学
教 育 对 个 人 收 人 的 平 均 因 果 效 应 。尽 管 这 两 组 个 体 除 随 机 化 赋 值 的 教 育 变 量
外,
在 其 他 方 面 ,比 如 能 力 、家 庭 背 景 等 可 能 仍 然 存 在 着 差 异 ,
但这种差异是随
机 性 的 ,由“随 机 定 律 ”控 制 ,
不 会 影 响 估 计 结 果 。用 经 典 计 量 经 济 学 的 语 言 表
述,
可以构建下列模型:
log(Y, ) = 爲 + 热D,+e,.
其中左边是对数收入,
右 边 是 教 育 变 量 D,.,e,.为 其 他 影 响 因 素 。尽 管 还 有 很 多
其他影响收人的因素,
但 教 育 变 量 D,.的 取 值 是 随 机 化 的 ,
与 其 他 未 观 测 因 素 e,.
(其 他 影 响 收 人 的 因 素 )不 相 关 ,满 足 经 典 线 性 回 归 模 型 的 基 本 假 设 ,因而可以
得到教育收益率A 的一致估计。
随机化的关键作用是可以平衡两组个体其他因素的分布,
®使 得 两 组 个 体
的 各 协 变 量 (包 括 可 观 测 变 量 和 未 观 测 变 量 )具 有 相 同 的 分 布 。 比 如 ,
前面教育
变 量 如 果 是 随 机 化 取 值 (简 单 起 见 ,
假 设 仅 取 二 值 :大 学 教 育 或 高 中 教 育 ),
尽管
影响收人的因素还有能力等变量,
但通过随机化分配,
使得接受大学教育和高
中教育的这两组群体,
除教育变量之外,
其他特征在统计分布意义上都非常相
似,
包括可观测的和不可观测的变量,
如 年 龄 ,能 力 等 。随 机 化 实 验 的 作 用 就 是
使 (除 原 因 变 量 之 外 的 )因 素 能 够 分 布 平 衡 ,
从而使得两组个体具有可比性。
下 面 看 一 个 随 机 化 实 验 的 例 子 ,美 国 国 家 支 持 工 作 示 范 项 目 (National
Supported W o r k Demonstration, N S W )是美 国 在 1975— 1980 年 实 施 的 一 项 随
机化实验,
该实验的主要目的是考察职业培训对个体收人等方面的影响。
例 3 . 1 ( 美国国家支持工作示范项目) 美国国家支持工作示范项目主要针
对服务业女性和建筑业男性中的低收入群体,
通常地方管理机构选择符合资格
的人员,
然 后 随 机 分 配 到 干 预 组 接 受 培 训 或 分 配 到 控 制 组 不 进 行 任 何 干 预 。干
预 组 个 体 会 得 到 N S W 项 目 的 资 助 以 参 加 培 训 ,控 制 组 个 体 没 有 受 到 N S W 的
干预,
仍 然 从 事 原 有 的 职 业 。下 面 的 数 据 来 自 于 Dehejia and W a h b a (1999) ,
包
①这些因紫应该是在干预分配之前已经确定的变量,
不受干预变量的影响,
通 常 称 为 协 变 fi:。
第三章随机化实验 27
表 3 .1 N S W 实 验 协变量统 计 表
年龄 干预组 2 5 .8 2 20 25 29
控制 组 2 5 .7 0 20 25 29
教育 干预组 1 0 .3 5 9 11 12
控制组 10. 19 9 10 11
Black 干预组 84 %
控制组 85 %
Hispanic 干预组 6%
控制组 s%
Married 干预组 19%
控制组 20%
No High School 干预组 71%
Degree 控制 组 77%
表 3. 1 首 先 说 明 ,随 机 化 可 以 产 生 相 对 可 比 的 干 预 组 和 控 制 组 ;其 次 表 3, 1
中 的 8 个 协 变 量 没 有 影 响 干 预 状 态 的 分 配 ,即 N S W 项 目 组 没 有 根 据 这 8 个变
量决定个体是否进人干预组,
这 一 点 很 重 要 。这 8 个 变 量 不 是 通 过 人 为 方 式 进
行平衡的,
而是通过干预状态的随机化分配达到的,
这使我们有理由相信两组
个 体 的 未 观 测 特 征 也 是 平 衡 的 。 当 然 ,两 组 个 体 特 征 并 不 是 完 全 相 同 ,
这种差
异是由随机化机制造成的,
在统计上一般是不显著的。
例 3 .2 (美国田纳西州教育实验(
ST A R )项 目 ) 为 了考 察 学校的班级规模
28 基本有用的计量经济学
与 学 生 学 习 效 果 的 关 系 ,1985— 1 9 8 9 年 ,田 纳 西 州 开 展 了 一 项 为 期 4 年的教育
改 革 随 机 化 实 验 ,称 为 学 生 教 师 成 就 率 项 目 ,筒 称 S T A R ( Student/Teacher
Achievement Ratio)项 目 》1985— 1 9 8 6 学 年 开 始 ,
7 9 个学校的幼儿园学生和教
师 被 随 机 分 配 到 三 种 规 模 的 班 级 :小 班 (13— 1 7 个 学 生 )、正 常 班 (22— 2 5 个学
生)和 正 常 / 辅 导 班 (22— 2 5 个 学 生 加 上 一 个 全 职 辅 导 老 师 )。每 年 大 约 6000—
7000名学生参与项目,
4 年 共 11600名学生参与。项目要求参与学校每种类型
的 班 级 至 少 有 一 个 班 ,随 机 化 分 配 是 在 学 校 内 部 进 行 的 ,
每学年学期末会进行
一次标准化的考试以检验学生学习效果。
表 3.2 STAR实验两组特征比较
班级规模 两组特征相等
变量
小班 正常 班 正 常 /辅 导 班 的々值
白 人 /亚 裔 0. 68 0.67 0. 66 0. 26
1985年时年龄 5. 44 5 .4 3 5. 42 0. 32
流失率 0. 49 0. 52 0 .5 3 0. 02
表 3. 2 给 出 了 三 种 班 级 的 主 要 特 征 变 量 和 分 数 的 比 较 统 计 。表 3. 2 显 示 ,
前三个协变量基本相似: 是否提供免费午餐、 种 族 、年 龄 分 布 。但 流 失 率 有 较 大
差异,
小班流失率低,
而正常班的流失率会高一些,
在分析时需要考虑这一点。
不过,
表 3. 2 提 供 了 与 表 3. 1 相 似 的 信 息 ,
如果干预是随机化分配的,
那么,
不
同组特征将非常相似,
从而具有可比性。
第二节随机化实验与选择偏差
在随机化实验中,
干 预 状 态 是 随 机 化 分 配 的 。这 意 味 着 ,
对于每一个个体,
它 的 两 个 潜 在 结 果 哪 一 个 会 实 现 ,
是由分配机制随机决定的,
并且分
配 机 制 不 依 赖 于 潜 在 结 果 ,即 满 足 非 混 杂 性 :
®
( m ) JLA. (3.1)
(3. 1)表 示 潜 在 结 果 ( y u ,
y。,)与 干 预 变 量 D , 是 相 互 独 立 的 ,即 干 预 变 量 D , 的
取值完全独立于两个潜在结果( Y w ,
>V)。
表 3. 3 随机化实验的作用
i Yu Yo;
1 ? 3 1 3
2 ? 5 1 5
3 ? 0 2 0
N —2 4 ? 0 4
JV—1 0 ? 0 0•
N 1 0 1
假设实验对象有N 个 ,
则对于这N 个个体,
潜 在 结 果 1^ 有 N 个 ,
Y u 也有
N 个 。当 利 用 随 机 化 机 制 决 定 分 配 向 量 后 ,
假 设 N , 个 个 体 进 入 了 干 预 组 ,那
么,
这 N t 个 个 体 的 Y 1;实 现 了 ,
我们可以观察到,
另 外 的 N —N , 个 个 体 的 没
有实现, 从 而 相 当 于 观 测 到 的 N ,个
我们观察不到。由于分配机制是随机化的,
是 来 自 于 N 个 I , 总 体 的 一 个 随 机 子 样 本 。同 样 地 ,
iV — iV,个 个 体 的 y 。
,实
现了,
其他的凡个7。
;没 有 实 现 ,
从 而 观 察 到 的 ^/一 凡 个 7 。
,.是来自于尺个
总 体 的 一 个 随 机 子 样 本 。假 设 i V 足 够 大 ,由 大 数 定 律 ,
样本信息近似于总体信
息,
从而,
我们有:
F, (3.2)
n ^ S - ^ E [ Y 0l] (3.3)
因而,
在随机化实验中,
两 组 观 测 结 果 的 平 均 值 之 差 (或 回 归 系 数 )将 趋 近 于 总
体 平 均 因 果 效 应 ,即
= E [ Y U - Y 0i | D ; = 1]
= E [ Y ];- Y 0/] (因 为 潜 在 结 果 独 立 于 干 预 变 量 A.)
事实上,
两 组 观 测 结 果 之 差 ?dif反 映 的 是 变 量 D ; 和 观 测 结 果 之 间 的 相 关
性,
因而,
在 随 机 化 实 验 中 ,相 关 关 系 就 是 因 果 关 系 ,下 面 的 式 子 说 明 了 上 述
结论。
Cov(D,-,y,.)= E [ D , y , ] - E [ D , M Y ;]
- E [ y ; I D ; = 1] . .E[Y] ( 其中 f = P r [ D f = 1])
= E[Y, \ D t = l]- p - p 2 » E [ Y ; | D, - 1]
一 汐 j D i - 0]
= p i l - p ) { E \ Y i | D,. = 1] ~ E [ Y ; | D, - 0]}
整理一下,
得
r dif= £:[Y,- i D, = 1 1 - E L Y , | D, 0]
_ Cov(D,-,y,) _ C o v ( D ;,y ;)
(3.7)
p(l —p) VarCD,)
其中,
Var(D,) = E [ D f ] - E 2[ D ;] = p - p z = p ( l ~ p )
(3. 7)实 际 上 是 Y,.对 认 的 总 体 回 归 系 数 ,因 而 ,
两 组 观 测 结 果 平 均 值 之 差 f dif
实 际 是 I 对 D,•的 样 本 回 归 系 数 。这 说 明 ,
在随机化实验中,
线性回归可以得到
因果效应的解释。
第三节随机化实验的分类
在经典的随机化实验中,
个体干预状态是随机化分配的,
分配不依赖于个
体的潜在结果,
并 且 分 配 概 率 是 已 知 的 。根 据 分 配 机 制 的 设 定 不 同 ,
可以分成
四类:
伯努利实验(
Bernoulli Trials) 、完 全 随 机 化 实 验 (completely randomized
experiments) 、
分 层 随 机 化 实 验 (stratified randomized experiments) 、配 对 随 机
化实验(
paired randomized experiments) 0
在伯努利实验中,
可 以 利 用 投 硬 币 方 式 决 定 每 个 个 体 的 干 预 状 态 。如果是
均勻硬币,
则 每 个 个 体 进 人 干 预 组 的 可 能 性 为 1/2,
硬 币 也 可 以 是 不 均 匀 的 ,比
如 每 个 个 体 进 入 干 预 组 的 可 能 性 可 以 是 1/3。如 果 实 验 总 体 共 有 i V 个 ,
则分配
向 量 共 有 2W 种 。分 配 向 量 是 描 述 个 体 干 预 状 态 的 向 量 D 。假 设 我 们 的 实 验 总
体为2,
那么,
在伯努利实验中,
共 有 4 种可能的分配向量,
分别是:
第三章随机化实验 31
即 两 个 个 体 均 在 控 制 组 ,一 个 在 控 制 组 、一 个 在 干 预 组 ,一 个 在 干 预 组 、一 个 在
控制组,
两 个 个 体 均 在 干 预 组 这 四 种 情 况 。在 伯 努 力 随 机 化 实 验 中 ,
可能会出
现所有个体均在干预组或控制组的情况,
尽管当实验个体数目较大时,
全部个
体在干预组或控制组的概率很低,
但 仍 然 有 出 现 的 可 能 。当 所 有 个 体 均 在 干 预
组或控制组时,
就 没 有 办 法 通 过 两 组 个 体 结 果 的 比 较 进 行 因 果 推 断 。这 是 伯 努
利实验的一个主要缺点。
为 了 克 服 伯 努 利 实 验 的 缺 陷 ,我 们 可 以 事 先 设 定 一 个 固 定 的 干 预 个 体 数
凡 ,
© 其 余 i V _ N (个个体进人控制组,
这种方式的随机化实验称为完全随机化
实 验 。完 全 随 机 化 实 验 是 比 较 常 见 的 随 机 化 实 验 。在 完 全 随 机 化 实 验 中 ,
分配
向量共有C;
J 个 。假 设 实 验 对 象 有 4 个 ,
设定 其 中 2 个进入干预组,
另 外 2 个进
人控制组,
则 共 有 6 个可能的分配向量,
分别是:
i 丄 丄 u u 0
1 0 0 1 1 0
D 6 > > >
0 1 0丨 1丨 0 1
0 0 1 0 1 1
假设在随机化实验中,
某 些 个 体 特 征 或 变 量 X 对 潜 在 结 果 有 重 要 影 响 。这
时,
可以首先根据特征X 进行分层,
然而在层内再实施完全随机化实验,
这种实
验称为分层随机化实验。比如,
一 个 6 人的总体,
男性4 人,
女 性 2 人 。 因为性
别 可 能 对 潜 在 结 果 有 重 要 影 响 ,我 们 可 以 首 先 根 据 性 别 进 行 分 层 ,
然后再分别
对 男 性 和 女 性 进 行 完 全 随 机 化 实 验 。 比 如 ,男 、女 性 均 有 一 半 的 个 体 进 人 干 预
组,
这 时 分 配 向 量 共 有 = 个 ,分 别 是 :
■r i -_r u 0 u
l 0 l 1 0
0 l 0 l 0 1
0 l 0 1 1
l l l l 1 1
n n o 0
d e
i— _ r _r u 0
l 0 l 1 0
0 l 0 i 1
0 l 0 1 1
0 0 0 0
i i i 1 1 1
①如何确定干预个体数,
取决于实验设计和研究预算,
具 体 方 法 可 以 参 见 Duflo et al. (2008) 0
32 基本有用的计量经济学
有一种特殊的分层随机化实验,
称 为 配 对 随 机 化 实 验 。在 这 种 随 机 化 实 验
中,
根据某个特征,
将 所 有 个 体 分 成 iV/2组 (iV为 偶 数 ),
每组只有2 个个体,
并
且两个个体随机化分配,
1 个在干预组,
1 个在控制组。
四种随机化实验的主要差别在于对干预向量的限制,
表 3. 4 给 出 了 上 述 4
种 随 机 化 实 验 的 比 较 。表 3. 4 中 ,
完全随机化实验假设一半的个体进人干预
组,
分层随机化实验假设分成两层,
每层个体数各一半,
并且每层内有一半个体
进 入 干 预 组 。可 以 看 出 ,
这四种经典随机化实验的主要差异在于分配向量的多
少不同,
越向下,
对实验施加的限制就越多,
从 而 分 配 向 量 就 越 少 。当 实 验 个 体
数 增 加 到 3 2 时 ,即 使 是 限 制 最 强 的 配 对 随 机 化 实 验 ,
它的分配向量数也超过了
6 万 个 。因 此 ,
在 真 正 的 随 机 化 实 验 中 ,可 能 没 有 办 法 将 所 有 的 分 配 向 量 写 出
来 。现 实 中 ,
完 全 随 机 化 实 验 和 分 层 随 机 化 实 验 是 比 较 常 用 的 。还 有 其 他 类 型
的随机化实验,
这里不再详述。
表 3 . 4 四种经典随机实验的分配向量数目对照表
样本容量
实验类型 分配向量数目 ----------------------------- -
4 8 16
2 ,V
伯努利实验 16 256 65536 4. 2 X 1 0 3
完全随机化实验 c r 6 70 12870 0. 6 X 1 0 °
分层随机化实验 4 36 4900 0. 2 X 1 0 9
第四节随机化实验的分析
在随机化实验中,
干预变量A 独立于潜在结果,
从而消除了选择偏差,
使
干预组和控制组观测结果之差等于总体平均因果效应。因 而 ,
如果数据来自于
随机化实验,
那 么 因 果 效 应 的 分 析 非 常 简 单 。我 们 主 要 分 析 完 全 随 机 化 实 验 、
分层随机化实验和配对随机化实验所得数据。
首先,
如果数据来自于完全随机化实验,
假 设 iV个 个 体 ,
N , 个接受干预,
K 个为控制干预, + 这时,
两组观测结果之差就是平均因果效应,
即 rdif是 rATK的 无 偏 估 计 量 ,
其中,
f dif = y, - y f
r ATK = E D ^ , ] m , . ]
并 且 f dif的 方 差 可 以 用 下 列 式 子 估 计 :
第三章随机化实验 33
— _ = 务 + 务 (3.8)
其中,
卜 ] ‘
、
卜
丄/ : D 广 。 iy t 1 i , Di = l
因而,
如 果 数 据 来 自 于 完 全 随 机 化 实 验 ,因 果 效 应 的 估 计 非 常 简 单 ,干预组
和 控 制 组 观 测 结 果 之 差 f dif即 是 平 均 因 果 效 应 的 无 偏 估 计 。 当 然 ,
也可以使用
线 性 回 归 分 析 。上 一 章 我 们 已 经 证 明 (
参 见 (2.26)式 ),
观 测 结 果 y ,.对 干 预 变 量
D , 的 简 单 回 归 系 数 f°ls实 际 上 等 于 两 组 观 测 结 果 平 均 值 之 差 P if。 因 而 ,
对于完
全随机化实验数据,
我 们 可 以 采 用 简 单 线 性 回 归 方 法 ,回 归 系 数 0 s将 是 总 体 平
均 因 果 效 应 r.vrE m 无 偏 估 计 量 。
在线性回归分析中通常施加一个关键假设,
零条件均值假设或正确模型设
定 假 设 (洪 永 森 ,
2011),
要求以解释变量为条件,
误 差 项 的 条 件 期 望 值 为 零 ,即
E [ £i|D,] = 0 o 在 应 用 中 ,
这一假设无法检验,
也无法保证,
但是在随机化实验
中,
这 一 条 件 可 以 得 到 保 证 。下 面 进 行 简 单 推 导 以 证 明 这 一 点 。
首先,
观 测 结 果 ■ 可 以 用 潜 在 结 果 和 干 预 变 量 表 示 ,即
Y ;= D iY u + ( l - D i)Y0i
^ Y 0l-h(Yli- Y 0,)Di
= or+ tate D,- +£/ (3. 9)
其中 a = £ [ Y 。
,.], Y fl,.— rATE)。注 意 ,
误差项可以写成:
(Y;- a 如果 1 ^ = 0
£, — | , (3.10)
— cr — rATE 如果 D, — 1
则
E[e,. | D ;= 0 ] = E [ Y ;—a | D,. = 0] = E [ Y 0i | D ;= 0] — o;= 0
£[e,. | Di — 1 ] = E [ Y ;—a~~ rATE I D,. — 1]
^ 丨; I Di = 1] — a— r A TE = 0
上面两式的推导均运用了完全随机化实验的基本特征,
干预分配独立于潜在结
果 ,即(
3.1)式 。 因 而 ,
在 完 全 随 机 化 实 验 中 ,回 归 方 程 (3. 9 )总 是 满 足 零 条 件 期
望 假 设 £[e,.|I^] = 0 。在 完 全 随 机 化 实 验 中 ,
这一条件并不是假设,
它的成立完
全 来 自 于 分 配 机 制 的 随 机 化 。所 以 ,对 于 来 自 于 完 全 随 机 化 实 验 的 数 据 ,
完全
可以利用线性回归进行分析,
构造下列模型:
= a + r D ;+e,
得 到 的 回 归 系 数 就 是 平 均 因 果 效 应 参 数 rATE的 无 偏 估 计 。
34 基本有用的计量经济学
完全随机化实验可以保证干预组和控制组干预前变量或协变量平衡,
但是
仍 然 会 有 一 定 的 差 异 ,当 然 这 种 差 异 是 偶 然 性 的 ,
来自于干预分配的随机化。
为了降低这种随机差异,
可 以 在 回 归 分 析 中 引 人 协 变 量 进 行 调 整 。只 是 这 时 ,
回 归 系 数 不 再 是 总 体 平 均 因 果 效 应 的 无 偏 估 计 ,而 是 一 致 估 计 。用 X i 表示干
预前变量,
完全随机化实验也可用下列回归模型进行分析:
Y, ^ a + r D ;+ X^-he, (3.11)
可以证明:
®
层 。每 层 内 进 行 完 全 随 机 化 实 验 ,
用 N , ( j ) 表示 > 层 中 接 受 干 预 个 体 的 数 量 ,
N ( » 表 示 j 层个体总数,
则 N,(y)/N())是 层 个 体 接 受 干 预 的 可 能 性 ,
也称
j
为 倾 向 指 数 (propensity score),
不 同 组 内 倾 向 指 数 可 以 不 同 。N = , 干
预 组 个 体 数 为 N, = 控 制 组 个 体 数 为 A ^ = i V —况 。总 体 平 均 因 果 效
应可以表示为: ^
^ATE = ■E[Y1,. — V"(H]
= ^ [ £ [ 7 ! , - ^ , ' 丨G f] ]
J
- J ^ E L Y V - Y 0;I G ; = i ] P r [ G , = >]
- J
t s(im = (3.15)
其 中 户 1,
…丄 可 以 证 明 :
(3. 17)
对于分层随机化实验产生的数据,
也 可 以 用 回 归 分 析 方 法 进 行 分 析 ,可以
构建下列回归分析模型:
j
y, = zDi + 2 a • KG,. = j) +£,■ (3. 18)
其 中 i( • ) 为 示 性 函 数 ,
条件成立^ 1 ,
不 成 立 取 0 ,在 上 式 中 实 际 上 是 不 同 层 的
标识变量,
如 果 个 体 i 属 于 )层 ,
则 l(G,=j)取 值 1,
相当于引人了 J 个 虚 拟 变
量,
代 表 不 同 的 群 组 。上 述 回 归 实 际 上 是 一 种 饱 和 回 归 ,在 第 五 章 中 还 会 有 详
细 介 绍 。不 过 回 归 方 程 (3. 18)的 回 归 系 数 f°ls并 不 是 总 体 平 均 因 果 效 应 rATE的
一致估计,
它实际上趋近于下列参数
36 基本有用的计量经济学
I 一 •樂7設 +办 -KW)
+ § 耶 . D,^1(G, = i ) - l ( G , = J) • (3.20)
可以证明(
3.20 ) r 的 O L S 回 归 系 数 ,
®
r oIs- ^ r ATE
配 对 随 机 化 实 验 是 一 种 特 殊 的 分 层 随 机 化 实 验 ,每 层 只 有 两 个 个 体 ,
这两
个个体在层内随机化分配,
一个 进 人 干 预 组 ,
一 个 进 人 控 制 组 。因 而 ,
每层内的
平 均 因 果 效 应 可 以 用 干 预 个 体 与 控 制 个 体 观 测 结 果 之 差 进 行 测 度 ,g卩f — =
K j O —K j ) ,j = l ,
…,N / 2 。总 体 平 均 因 果 效 应 可 以 用 进 行 估 计 ,
可以建立下列回归方程进行分析:
f pa:
r(>) = r + e; (3.22)
如果引人协变量,
可以采用下列回归方程:
r - - r + ^ A x>J + y ( X ;— X) + e,- (3. 23)
①在层内为完全随机化实验,
对于完全随机化实验,
可以直接用简单回归得到总体平均因果效应
的 无 偏 估 计 。因 而 ,
在分层随机化实验中,
对 于 )层 的 个 体 ,
可以构造如下回归方程估计j 层的平均因果
效应:
y,(y) = /9 0 ') + ^ ) 0 , + e , 0 ' )
对于任意个体其观测结果可以写为:
j
y, = ^ u g ; = py.O')
J-l
= 公 (j)l(G, = j) + 2 r O ) D , l ( G , = j ) + = jk(j)
J J 3
(3.20).
第三章随机化实验 37
表 3.S N S W 数据分析
参数 估计 标准误差
-dif 1794.34 670.99
(简单回归) 1794.34 670.82
(协变量) 1676.90 648.72
严(
交互项) 1632.71 646.88
第 一 行 是 两 组 平 均 结 果 之 差 ,即 = 1 - 1 = 1794. 3 4 ,标 准 误 差 为
670. 9 9 ,
说 明 接 受 培 训 的 工 人 因 为 参 加 培 训 而 受 益 ,其 平 均 收 入 会 增 加 1 7 9 4 美
元 。第 二 行 是 简 单 回 归 分 析 ,得 到 的 结 果 和 第 一 行 完 全 相 同 ,
标准误差的估计
也 相 似 ,原 因 在 于 简 单 回 归 系 数 就 是 两 组 平 均 结 果 之 差 。 第 三 行 引 入 了 协 变 量
(年 龄 、教 育 、种 族 、婚 姻 状 态 、
7 4 年收入、
7 5 年 收 入 ),这 时 ,回 归 系 数 是 总 体 平
均因果效应的一致估计,
结 果 为 1 6 7 6 . 9 0 美 元 ,与 前 两 行 估 计 结 果 差 别 不 大 ,并
且标准误有所降低,
这 也 是 引 入 协 变量 的好 处。第 四行 在第 三行 的 基础 上 ,
进
一步引入交互项,
估 计 模 型 (3. 23 ) ,
估 计 结 果 为 1632.71元 ,
标准误差有进一步
的降 低 。
第五节随机化实验的缺陷
随机化实验是因果推断的黄金标准,
但 也 有 缺 陷 。在 随 机 化 实 验 中 ,
参与
个 体 是 被 动 地 随 机 化 分 配 到 干 预 组 和 控 制 组 的 ,干 预 状 态 不 是 个 体 选 择 的 结
果 。随 机 化 实 验 得 到 的 结 果 只 能 解 释 为 总 体 的 平 均 因 果 效 应 。现 实 中 一 项 干
预或政策实施,
是 否 受 到 干 预 往 往 是 个 人 选 择 的 结 果 ,接 受 干 预 的 个 体 并 不 是
总体的随机样本,
他 们 的 平 均 因 果 效 应 并 不 一 定 是 总 体 平 均 因 果 效 应 。 比如考
察 大 学 教 育 对 个 人 收 入 的 影 响 ,如 果 能 进 行 随 机 化 实 验 ,则 随 机 化 实 验 得 到 的
结 果 是 总 体 上 大 学 教 育 的 平 均 收 益 率 。但 现 实 中 大 学 教 育 往 往 是 个 人 选 择 的
结果,
如果存在正向选择性,
潜在教育收益率更高的个体选择了接受大学教育,
而 收 益 率 较 低 的 没 有 选 择 接 受 大 学 教 育 。那 么 ,
现实中大学教育的平均收益率
38 基本有用的计量经济学
应该高于总体平均的教育收益率。因 而 ,
仅仅利用随机化实验得到的结果,
并
不 一 定 是 现 实 中 政 策 的 因 果 效 应 (H e c k m a n ,200 1 ,2010 ;Rucker et al.,
2010),
利用随机化实验进行因果推断时需要清楚这一点。
第六节总 结
本章主要介绍了随机化实验的作用以及为什么随机化实验可以消除选择
偏 差 。随 机 化 实 验 产 生 的 数 据 ,由 于 两 组 特 征 平 衡 ,可 以 直 接 用 回 归 方 法 估 计
因 果 效 应 参 数 。但 随 机 化 实 验 压 制 了 个 人 选 择 ,
提供的因果效应与现实中的政
策效应并不完全一致,
应用中需要更深人的分析,
但随机化实验的结果可以作
为一个基本的参照。
推荐阅读
参考 R o s e n b a u m (2002)第 3 章 、Imbens and Rubin (201 5 )第 4— 11 章 。
N e y m a n (1923,1990)和 Fisher (1935)是 随 机 化 实 验 的 经 典 文 献 ,可 参 考 阅 读 。
g二 二 附 录 • 女 士 叩 余
Fisher (1935)在 其 经 典 著 作 《实 验 设 计 》中 提 出 过 一 个 著 名 的 案 例 女
士 品 茶 ”。® 故 事 是 这 样 的 ,一 天 下 午 ,Fisher和 他 的 同 事 们 在 一 起 喝 下 午 茶 。
他的一位女同事说,
奶茶的味道和制作奶茶时加奶和茶水的次序有关系,
先加
牛 奶 和 先 加 茶 水 ,制 作 出 来 的 奶 茶 味 道 是 不 一 样 的 ,
大 家 对 此 议 论 纷 纷 。Fisher
深思片刻说,
我 们 可 以 做 一 个 实 验 检 验 这 一 论 断 。制 作 8 杯 奶 茶 ,其 中 4 杯先
加 牛 奶 ,另 外 4 杯 先 加 茶 水 ,然 后 随 机 给 该 女 士 品 尝 。在 这 里 ,有 关 杯 子 大 小 、
温 度 等 差 异 不 必 要 求 完 全 相 同 ,只 要 保 证 杯 子 的 排 序 是 完 全 随 机 化 的 。在《实
验 设 计 》中 ,
Fisher花 了 近 1 0 页 的 篇 幅 来 介 绍 这 一 随 机 化 实 验 的 设 计 ,并强调
随机化机制的重要性。
下 面 看 一 下 Fisher的 推 断 过 程 。 首 先 ,
假 设 该 女 士 的 说 法 是 错 误 的 ,即先
加 牛 奶 和 先 加 茶 水 ,味 道 没 有 差 异 ,
或 者 说 该 女 士 没 有 辨 别 能 力 。再 看 分 配 机
① 有 一 本 书 叫 做 《女 士 品 茶 》,
看到这本书不要以为是一本讲如何品茶的书籍,
它实际上是一本有
关统计学发展历史的书,
里面讲了很多统计学家有趣的故事,
可以找来读一读《
第三章随机化实验 39
制,
共 8 杯 奶 茶 ,随 机 选 取 4 杯 先 加 牛 奶 ,另 外 4 杯 先 加 茶 水 ,
这 样 共 有 C|==70
种 可 能 的 分 配 向 量 ,比 如 分 配 向 量 (1 ,1 ,
0 ,0 , 0 ,1 , 1 ,
0 ) 表 示 第 1 、2 、6 、7 杯为先
加 牛 奶 ,另 外 第 3 、
4、5、
8 杯 为 先 加 茶 水 。在 随 机 化 机 制 下 ,共 有 7 0 个 这 样 的 分
配 向 量 。如 果 该 女 士 没 有 辨 别 能 力 或 两 种 奶 茶 味 道 没 有 差 别 ,
那么该女士纯粹
乱 猜 ,一 次 实 验 中 ,
全 部 猜 对 的 可 能 性 为 1 / 7 0^0. 014, Fisher称 这 一 可 能 性 为
P 值 。如 果 我 们 用 该 女 士 说 对 的 杯 数 (T ) 来 作 为 统 计 量 ,
则在原假设下,
她猜对
8 杯 的 可 能 性 为 P r[ T > 8 ] = 0.014。尸 值 就 是 在 原 假 设 下 统 计 量 超 过 观 测 值 的
极端可能性,
可能性越大,
原 假 设 越 可 能 正 确 ;可 能 性 越 小 ,原 假 设 越 可 能 错 误 。
这里,
在 女 士 完 全 没 有 辨 别 能 力 的 假 设 下 ,完 全 乱 猜 ,
猜 对 的 可 能 性 只 有 1 .4% 。
如果一次实验,
她就猜对了,
说 明 她 真 的 有 辨 别 能 力 ,需 要 拒 绝 原 假 设 。
下 面 再 来 看 看 她 能 够 至 少 猜 对 6 杯 的 可 能 性 。她 不 可 能 猜 对 7 杯 ,只 要 1
杯猜错就要错2 杯^ 恰 好 猜 对 6 杯 的 可 能性是对应每种类型的奶茶均猜对3
杯,
共 1 6 种 可 能 性 ,因而,
在 她 没 有 辨 别 能 力 的 原 假 设 下 ,猜 对 至 少 6 杯的可能
性 为 P r [ T > 6 ] = 17/70;0. 2 4 ,
这 不 是 一 个 小 概 率 。 因 而 ,如 果 在 一 次 实 验 中 ,
她猜对了 6 杯 ,在 她 没 有 辨 别 能 力 的 原 假 设 下 ,出 现 猜 对 6 杯 的 可 能 性 高 达
2 4 % 。 因 而 ,猜 对 6 杯 不 足 以 证 明 她 真 的 有 辨 别 能 力 ,因 而 ,不 能 拒 绝 原 假 设 。
Fisher用 这 样 一 个 筒 单 的 随 机 化 实 验 对 该 女 士 提 出 的 命 题 进 行 了 验 证 ,发现该
女士的说法是对的。
在 这 个 例 子 中 ,也揭示出了 Fisher的 精 确 P 检 验 方 法 。Fisher精 确 P 检
验 (Fisher、 Exact P Test, F E P Test)主 要 分 成 三 个 部 分 :首 先 ,设 定 精 确 原 假
设(
sharp null hypotheses),然 后 ,
构造统计量,
最后计算精确P 值并进行推断。
Fishei•精 确 原 假 设 具 有 下 列 形 式 :
H 0 :Yi,- - , i = 1’
…,N (3.24)
即 干 预 对 所 有 个 体 均 没 有 影 响 。这 一 假 设 与 N e y m a n 的 原 假 设 不 同 ,
Neyman
关 心 的 是 平 均 效 应 是 否 为 零 ,即
H o ^EY h - Y o,-] = 0 (3.25)
有 关 Fisher精 确 P 检 验 及 N e y m a n 的 假 设 检 验 参 见 Imbens and Rubin(2015) 。
第 四 章 因 果 图
第 一 节 基 本 概 念
因 果 图 方 法 是 由 计 算 机 科 学 家 Pearl (1995,2009)提 出 的 ,
Pearl (2009)指
出因果图模型与潜在结果框架实际上是一致的,
每个因果图背后都对应一个潜
在结果模型,
但因果图方法更加直观。
图 4 . 1 因果图
因 果 图 的 基 本 构 成 要 素 包 括 点 (nodes)和 箭 头 (edges),
点表示变量,
两个变
量 乏 间 如 果 有 箭 头 连 接 ,表 示 至 少 对 总 体 中 的 一 个 个 体 两 变 量 之 间 有 因 果 关
系 。 比 如 图 4 . 1 中 三 个 点 分 别 代 表 三 个 变 量 D 、X 、
Y ,
D 和 Y 之间有箭头连接,
并且由D 指向Y ,
表 示 D 对 Y 有 因 果 影 响 ,即 至 少 对 总 体 中 的 一 个 个 体 有 D 影
响 Y 。受 D 直 接 影 响 的 变 量 Y 称 为 D 的 子 变 量 ,
受 D 间 接 影 响 的 变 量 S 称为
D 的孙变量,
直接影响Y 的变量D 称 为 Y 的父变量,
间 接 影 响 Y 的 变 量 Z 称为
Y 的 祖 变 量 。两 个 变 量 之 间 如 果 没 有 箭 头 连 接 ,
表 示 总 体 上 对 于 任 何 个 体 ,两
个变量之间均没有因果关系,
是相互独立的。
由变量X 出发,
有两个箭头分别指向D 和 称 为 D 和 Y 的共同原因
( c o m m o n c a u s e ) 称 为 D 影 响 Y 的 混 杂 因 素 (confounder) 。 图 中 有 两 个 箭
头 指 向 Y ,说 明 Y 是 D 和 X 的 共 同 结 果 (c o m m o n effect)或 交 汇 变 量 (colli
der) ,D 是 久 和 Z 的 交 汇 变 量 D
将 两 个 变 量 连 接 起 来 即 形 成 路 径 (paths),图 中 连 接 变 量 D 和 Y 有 两 条 路
径,
分 别 是 D — Y 和 前 者 称 为 因 果 路 径 (causal path) ,
后者称 为 后 门
路 径 (backdoor path)。 因 果 路 径 是 指 由 原 因 变 量 或 干 预 变 量 D 指 向 结 果 变 量
Y 的路径,
可以是直接指向,
也 可 以 是 通 过 中 介 变 量 间 接 指 向 结 果 变 量 ,比 如 ,
第 四 章 因 果 图 41
如 果 D 到 Y 的因果路径上还有一个中介变量B ,
那么因果路径可以表示为
B —Y 。后 门 路 径 是 指 连 接 原 因 变 量 D 和 结 果 变 量 y ,
并且有指向原因变量D
的 箭 头 的 非 因 果 路 径 。图 中 路 径 D — X — Y 连 接 原 因 变 量 D 和 结 果 变 量 Y ,并
且 路 径 上 有 指 向 原 因 变 量 D 的 箭 头 ,因 而 是 后 门 路 径 。
因果图中,
变量通常按照发生的先后顺序排列,
先发生的变量在左边,
后发
生 的 变 量 在 右 边 ,比 如 图 4 . 1 中 ,
X 在 D 前发生,
D 在 Y 前 发 生 。 另 外 ,因果图
中 不 包 括 循 环 路 径 ,即 结 果 不 可 能 影 响 原 因 ,
未 来 不 可 能 影 响 现 在 。也 就 是 说 ,
图 4 . 1 中 不 可 能 出 现 Y 指 向 D 的 路 径 ,当 然 也 不 包 括 指 向 变 量 自 身 的 路 径 。 因
而 ,因 果 图 也 称 为 因 果 有 向 无 环 图 (Causal Directed Acyclic Graph, Causal
D A G )。
在画因果图时,
凡是图中变量的共同原因,
均 应 包 括 在 因 果 图 中 。影 响 变
量 的 扰 动 因 素 ,如 果 独 立 于 其 他 变 量 ,
可以不在因果图中显示。
® 图 4. 1 中 X
应 该 显 示 在 因 果 图 中 。另 外 ,影 响 Y 的 因 素 还 有
是 D 和 Y 的 共 同 原 因 ,因 而 ,
其他未观测扰动因素,
影 响 D 的 因 素 还 有 其 他 扰 动 因 素 eD ,
但这些扰动因素
均 独 立 于 其 他 变 量 ,因 而 ,
可以不出现在因果图中,
但如果某些未观测扰动因素
不 独 立 于 图 中 的 其 他 变 量 ,比 如 , 除影响Y 之外,
还会影响D ,
那 么 ,ey就是
变 量 D 和 Y 的另一个共同原因或混杂因素,
应该包括在因果图中,
此 时 ,因果
图 如 图 4, 2 所 示 :
图 4.2 因果图
第二节因果图和边际独立性
因果关系是潜在结果的比较,
如果原因变量D 对结果变量y 有因果影响,
则 有 £:
[ Y D,]关£[¥,,.],
或至少对于某些个体f有 i= l,… ,
N 。相关性
是观测结果的比较,
如 果 变 量 D 与 Y 相 关 ,则 有 E[Y,. 10, = 1 ] # £ :
[兄丨从=
0 ] 。® 如 果 变 量 D 对 r 有 因 果 影 响 ,
则 D 和 Y 肯定相关,
但两者相关,
则不一
定有因果关系。比如,
利用随机化实验考察培训(
£>)对 个 人 收 人 ( y ) 的 影 响 ,
如
果培训对个人收人有因果影响,
在 因 果 图 中 将 有 D 指 向 Y 的 因 果 路 径 。但影
响 个 人 收 入 的 还 有 很 多 其 他 影 响 因 素 ,比 如 能 力 ,
是 否 应 该 进 入 因 果 图 呢 ?不
用 。因为在随机化实验中,
原 因 变 量 D 是随机化分配的,
从而独立于其他变量,
尽管能力影响个体收人,
但能力独立于原因变量,
从而能力不会是混杂因素,
这
正 是 随 机 化 实 验 的 作 用 。此 时 ,因 果 图 非 常 简 单 ,只 有 D 到 Y 的 一 条 因 果 路
径,
见 图 4. 3 。因 为 D 对 Y 有 因 果 影 响 ,
那么,
两 者 肯 定 相 关 。® 当 然 ,
相反方向
不一定成立,
两 变 量 相 关 不 一 定 有 因 果 关 系 。另 外 ,因 果 关 系 是 有 向 的 ,总是原
因影响结果或原因变量指向结果变量,
而相关关系是对称的,
没有方向性,
如果
D 影 响 y , 则 d 和 y 相 关 ,当 然 ,
y 和 d 也相关。
d ---------------- - y
图 4. 3 因果图和相关性
下面看第二种情况,
见 图 4.4。为 了 便 于 描 述 ,
我们给图中的变量赋予特定
含义,
变 量 L 表示是否有抽烟行为,
变 量 D 表示是否有随身带打火机的习惯,
变 量 Y 表 示 患 肺 癌 的 风 险 。一般 认 为 ,
抽烟行为L 会导致患肺癌风险Y 增加,
因而,
L 对 Y 有 因 果 影 响 。如 果 个 人 有 抽 烟 行 为 L ,
则该个体随身带打火机的
可能性D 会更大,
从 而 抽 烟 行 为 L 直 接 影 响 个 人 是 否 随 身 携 带 打 火 机 D 。是否
携带打火机D 对个体患肺癌风险Y 没有影响,
从 而 D 和 Y 是独立的,
但在这里
两者不是不相关的。比如,
现 在 有 人 想 研 究 随 身 携 带 打 火 机 D 是否对个体肺癌
风 险 Y 有因果影响,
假设他通过抽样调查获得了 D 和 Y 的 数 据 ,
并直接利用观
测数据进行比较,
他将发现,
随机携带打火机的人,
患肺癌的可能性会更高。因
为随身携带打火机的人,
抽烟的可能性更大,
而 抽 烟 的 人 ,患 肺 癌 的 风 险 也 更
大 。尽 管 两 者 实 际 上 没 有 因 果 关 系 ,
但 观 测 数 据 显 示 两 者 具 有 相 关 性 。原因在
于,
变 量 D 和 y 有 一 个 共 同 的 原 因 L ,即 使 D 和 Y 之 间 没 有 因 果 关 系 ,
共同原
因 L 也 会 使 两 者 表 现 出 相 关 性 。共 同 原 因 L 通 常 称 为 变 量 D 到 Y 的 混 杂 因
①在第三章我们已经证明观测结果的比较反映的是相关性,
参 见 (3. 7 ) 式 。
② D 对 Y 有 因 果 影 响 ,即 ] —£ [ Y o , ] ^ 0 ,
则
E[y,- | D, = 1] - E [Y , I Di = 0 ] = E C Y l I D, = 1] — E l Y a I D, = 0]
= E l Y u l — £ [Y o ,-]尹 0
第二行利用了随机化实验中,
D 独 立 于 潜 在 结 果 (Y 3i,
Y W) 。从 而 说 明 , 如 果 D 对 y 有因果影响,
则两者
存在相关关系^
第 四 章 因 果 图 43
素 。混 杂 因 素 造 成 的 相 关 称 为 混 杂 偏 差 (confounding bias)。如 果 要 得 到 D 到
7 的因果影响,
必须想办法消除混杂因素L 的影响。
图 4, 4 因果图和相关性:
共同原因
再看一种情况,
见 图 4. 5 。变 量 D 和 Y 之 间 没 有 箭 头 连 接 ,
表示两者之间
没 有 直 接 的 因 果 关 系 ,但 它 们 共 同 决 定 变 量 C ,
C 称 为 变 量 D 和 Y 的共同结果
或 交 汇 变 量 。为 了 便 于 解 释 ,
假设变量D 表示民族,
Y 表示学习能力,
C 表示是
否 被 大 学 录 取 。不 同 民 族 的 学 生 智 力 分 布 总 体 上 是 差 不 多 的 ,
学习能力也不会
有太大差异,
那 么 民 族 D 和 学 习 能 力 Y ■之 间 没 有 直 接 的 因 果 关 系 。但 在 大 学
录取中,
我国有少数民族优惠政策,
少 数 民 族 学 生 会 有 一 定 的 加 分 。这 样 ,同样
高考成绩下,
少数民族学生被录取的可能性会更大,
从 而 D 会影响大学的录取
C 。当 然 ,
如果学习能力强,
高考成绩高,
那 么 被 大 学 录 取 的 可 能 性 也 更 大 。如
果一个研究者获得了民族D 、
学 习 能 力 Y ( 比 如 高 中 三 年 的 平 均 成 绩 )和 是 否 被
大学录取C 的信息,
他能否根据民族D 判 断 学 生 的 学 习 能 力 答 案 显 然 是 否
定的,
知 道 民 族 D 的 信 息 对 预 测 学 生 的 学 习 能 力 Y 没 有 任 何 帮 助 。实 际 上 ,因
果图理论告诉我们,
如果两个变量有一个共同结果,
在该路径上,
两变量就是不
相关的。
图 4 . 5 因果图和相关性:
共同结果
小结一下,
两 个 变 量 之 间 什 么 时 候 会 表 现 出 相 关 性 ? 有 两 种 情 形 :一 是两
变量具有因果关系,
则两者会有相关性,
如 图 4. 3 所 示 ;二 是 两 变 量 有 一 个 共 同
的原因,
这时即使两者没有因果关系,
也 会 表 现 出 相 关 性 。另 外 ,
如果两变量有
一个共同的结果,
但两者没有因果关系,
则两者也没有相关性。
从上文可看出,
即使没有因果关系,
如 果 有 共 同 原 因 (即 混 杂 因 素 ),
变量也
会 表 现 出 相 关 性 。那 么 ,
如何才能消除相关性,
将真正的因果关系揭示出来呢?
还 是 回 到 培 训 的 随 机 化 实 验 。前 面 提 到 培 训 D 对 个 体 收 人 Y 有 因 果 影 响 ,仔
44 基本有用的计量经济学
细考察影响机制,
培训可以增加个人的人力资本或技能H ,
而人力资本提高会
增 加 个 体 收 人 ,即 培 训 D 是 通 过 影 响 人 力 资 本 形 成 H 间 接 地 影 响 个 人 收 人 Y ,
变 量 H 称 为 中 介 变 量 (mediator) 。
D ------------ ^ 回 ------------ ^
图 4 . 6 因果图和边际独立性:
以中介变量为条件
现 在 我 们 想 知 道 ,如 果 以 中 介 变 量 H 为条件或根据变量H 将数据分层
(stratification) ,
在 层 内 D 和 y 是 否 还 有 相 关 性 ?答 案 是 否 定 的 。 图 4. 6 中 H
加了方框,
表 示 以 变 量 H 为 条 件 或 根 据 H 进 行 分 层 。培 训 D 会 影 响 个 人 的 人
力资本h ,
而 人 力 资 本 h 又 会 影 响 个 人 收 人 y 。如 果 人 力 资 本 H 相 同 ,
无论个
人是否参与了培训D ,
个人收人Y 都应该有相同的分布,
培 训 D 和个人收人Y
将 不 再 相 关 。中 介 变 量 H 阻断了 D 到 Y 的 因 果 路 径 ,
使变量D 与结果变量Y
相 互 独 立 ’即 有 乃 上 ^ 。,
1^ ) ! / / 。
再 回 到 图 4. 4 ,
现 在 考 虑 如 果 以 L 为 条 件 (即 变 量 L 加 上 方 框 ,
见 图 4. 7),
D 和 Y 是 否 还 有 相 关 性 ?答 案 也 是 否 定 的 。如 果 将 考 察 对 象 限 制 在 非 抽 烟 者
a = i ) ,
这时,
知道某个体是否携带打火机D ,
并不能预测其得肺癌的风险F 。
因为此时,
带不带打火机的两组人得肺癌风险的分布是相同的,
从而D 1 Y 丨
L。
因而,
我 们 得 到 第 二 个 结 论 :当 以 两 个 变 量 的 共 同 原 因 或 混 杂 因 素 为 条 件 时 ,
两
变 量 之 间 的 相 关 路 径 被 阻 断 。图 4. 7 中 ,以 L 为 条 件 , D 和 7 之 间 的 相 关 性 被
阻断。
图 4.7 因果图和边际独立性:
以共同原因为条件
下面再回到前面共同结果的例子,
见 图 4. 8 。D 和 Y 有 一 共 同 结 果 C ,
D
和 Y 之间没有直接的因果路径,
则 两 者 之 间 没 有 相 关 性 。现 在 考 察 ,
如果以共
同 结 果 C 为条件,
变 量 D 和 Y 是 否 相 关 ?还 是 回 到 具 体 的 例 子 ,
D 表示民族、
F
表示学习能力、
C 表 示 是 否 被 大 学 录 取 。如 果 现 在 以 被 大 学 录 取 为 条 件 ,民族
和学习能力之间是否表现出相关性呢?因为民族和学习能力共同决定了是否
被 大 学 录 取 ,因 而 ,
如果以大学录取为条件,
少数民族由于国家优惠政策,
其高
考 分 数 可 以 低 一 点 。如 果 研 究 者 仅 调 查 已 经 考 入 大 学 的 学 生 ,
那么,
研究者可
能发现两者存在着负相关性,
得到少数民族学生学习能力稍微差一些的错误结
第 四 章 因 果 图 45
论 。因 而 ,
如果以共同结果为条件,
蒋 打 开 路 径 D —C — 使 D 和 y 表现出相
关 性 。事 实 上 ,
如 果 以 共 同 结 果 的 结 果 为 条 件 ,同 样 也 会 打 开 相 关 路 径 ,
见 图 4.
9 o 以共同结果为条件造成估计结果的偏差,
称 为 样 本 速 择 偏 差 (sample selec-
tion bias) ,
最早由 H e c k m a n ( 1 9 7 9 ) 提 出 。
回
图 4. 8 因果图和边际独立性:
以共同结果为条件
^ ^ ^ 门
D Y ---------- _ C ---------- 叫 S |
图 4 . 9 因果图和边际独立性:
共同结果的结果
总结一下,
两个变量相关的情况包括:
• 一个变量是另一个变量的原因,
• 它 们 具 有 共 同 的 原 因 ,D —
• 它 们 具 有 共 同 的 结 果 (collider)并 以 结 果 为 条 件 时 ,
或以共同结果的结
果为条件时,
D — 回 一 y 或 D — C —Y
I
回
什么时候会阻断相关性使两变量相互独立呢?
• 以 中 介 变 量 (mediator)为 条 件 时 ,
• 以 共 同 原 因 (c o m m o n cause)为 条 件 时 ,D^-(TT}-»Y;
• 有 共 同 结 果 (collider)时 ,D — L —Y 。
第三节选择偏差和因果效应识别
两个变量之间有因果关系肯定会表现出相关性,
但 反 过 来 不 一 定 成 立 。从
上文的内容,
我 们 知 道 ,即 使 两 变 量 之 间 没 有 因 果 关 系 ,
如果它们有一个共同的
原因,
或者以它们的共同结果为条件,
两 者也会表现出相关性。因 而 ,
在利用观
测数据分析变量之间的因果关系时,
我们需要深人分析变量之间的相关性是真
正的因果关系,
还 是 由 于 共 同 原 因 或 以 共 同 结 果 为 条 件 造 成 的 相 关 性 。 由共同
46 基本有用的计量经济学
原 因 造 成 的 相 关 性 称 为 混 杂 偏 差 (confounding bias) ,由 以 共 同 结 果 为 条 件 造 成
的 相 关 性 称 为 样 本 选 择 偏 差 (sample selection bias) ,
这两种偏差统称为选择偏
差 (selection bias) D 因 而 ,
实证分析的关键就是如何消除这些选择偏差,
将真正
的因果关系识别出来。
上 文 中 提 到 的 阻 断 相 关 性 的 三 种 情 况 ,在 因 果 图 方 法 中 称 为 后 门 规 则
(back-door criteria)。Pearl (2009)证 明 因 果 效 应 可 以 通 过 以 一 些 变 量 的 集 合
Z 为 条 件 进 行 识 别 ,当 且 仅 当 所 有 的 原 因 变 量 和 结 果 变 量 之 间 的 后 门 路 径 可 以
通 过 以 Z 为 条 件 而 阻 断 。他 证 明 所 有 的 后 门 路 径 可 以 被 Z 阻 断 ,当且仅当每条
后门路径满足:
( 1 ) 包 含 一 个 中 介 路 径 A — C — _6,
其中中介变量C 6 Z ,
® 或者
(2)包含一个共同原因的路径A —C —B ,
其中C 6 Z ,
或者
( 3 ) 包含一个共同结果的路径A —C —S ,
但 共 同 结 果 C 及 所 有 C 的子孙不
在 Z 中。
利用观测数据进行实证分析时,
根据后门规则,
将所有后门路径造成的相
关性阻断之后,
两 变 量 之 间 表 现 出 的 相 关 性 就 是 两 者 之 间 的 因 果 效 应 。首 先 考
察混杂偏差,
下面我们来看几个经济学的例子:
( 1 ) 教 育 收 益 率 。劳 动 经 济 学 中 一 个 经 典 的 问 题 是 关 于 教 育 ( D )对 个 人 收
人 (y)的影响,
而个人能力(
A ) 往往会同时影响教育选择(
D ) 和个人收人0 0 ,
即个人能力04)是 教 育 ( D ) 和个 人 收 入 (Y)的 混 杂 因 素 ,
用因果图表示如下:
图 4. 1 0 显 示 ,
D 和 Y 之间有两条路径,
一 条 因 果 路 径 D —Y ,
一条后门 路 径
因而,
D 到 Y 的相关性包含了两部分,
一部分是真正的因果关系造
成的相关性,
另 一 部 分 是 由 于 混 杂 因 素 A 造 成 的 相 关 性 。为 了 得 到 真 正 的 教 育
( D ) 对 收 人 ( Y ) 的 影 响 ,只 要 想 办 法 将 后 门 路 径 造 成 的 相 关 性 阻 断 即 可 。利用
后 门 规 则 第 二 条 ,以 共 同 因 素 能 力 变 量 ( A ) 为 条 件 ,
将阻断教育和能力之间的非
因果路径。
( 2 ) 班 级 规 模 与 学 习 效 果 。在 教 育 经 济 学 中 ,
很多文献关注班级规模(
D)
①注意因果路径上的中介变量不能进人2 。
第 四 章 因 果 图 47
对 小 孩 学 习 效 果 ( y ) 的 影 响 。学 校 班 级 规 模 往 往 是 由 学 校 所 在 地 区 政 府 财 力
(A)决 定 ,
而 移 民 在 社 区 中 所 占 的 比 重 ( U ) 往 往 决 定 了 地 方 政 府 财 力 水 平 ,同时
语 言 问 题 也 影 响 到 移 民 家 庭 小 孩 的 学 习 成 绩 。 因 果 图 苋 4. 1 1 。D 到 y 同样有
两条路径:
因 果 路 径 JD—y 和 后 门 路 径 d —a —u — y 。根 据 后 门 规 则 第 一 条 或
第 二 条 ,以 A 为 条 件 或 以 1 / 为 条 件 均 可 以 阻 断 后 门 路 径 从 而 识 别 出 D 对 Y
的因果影响。
图 4 . 1 1 因果图:
班级规模与学习成绩
( 3 ) 幸 福 的 决 定 因 素 。幸 福 经 济 学 对 幸 福 感 是 由 哪 些 因 素 决 定 的 非 常 感 兴
趣 ,因 果 图 4.1 2 描 述 一 种 可 能 的 决 定 机 制 。教 育 (
A ) 会 影 响 个 人 收 入 (D ),个
人收入会影响个人幸福感(y)。同 时 ,
教 育 (a)还会影响个人的宗教信仰(
u),
个人宗教信仰a/)又 会 影 响 到 个 人 幸 福 感 (
Y ) 。D 到 Y 包 含 两 条 路 径 :因果 路
径 D —Y 和 后 门 路 径 D —A —U —Y 。根 据 后 门 规 则 第 一 条 或 第 二 条 ,
可以利用
变 量 或 A 阻断后门路径的相关性。
图 4 . 1 2 因果图:
幸福的决定因素
在上面的例子中,
混 杂 偏 差 具 有 相 同 的 结 构 ,均 是 由 于 出 现 了 原 因 变 量 D
和 结 果 变 量 Y 的 共 同 原 因 ( A 或 U ),从 而 产 生 了 D 到 y 的 后 门 路 径 。根据 后
门规则,
如果后门路径可以被阻断,
那 么 干 预 变 量 D 和 结 果 变 量 Y 之间的因果
效 应 可 以 识 别 。因 而 ,
下面两种情况下因果效应可以识别:
( 1 ) 没 有 共 同 原 因 。如 果 变 量 间 因 果 关 系 如 图 4. 3 所 示 ,没 有 干 预 变 量 和
结果变量的共同原因,
则 没 有 任 何 后 门 路 径 需 要 阻 断 ,因 果 效 应 可 以 识 别 。
(2) 有 共 同 原 因 ,但 有 足 够 的 观 测 变 量 可 以 阻 断 所 有 后 门 路 径 。 如图
4. 1 0 - 4 . 1 2 , 观 测 变 量 A 可 以 阻 断 后 门 路 径 ,
从 而 识 别 出 D 和 Y 之间的因果效
应 。变 量 A 可 以 是 共 同 原 因 或 是 后 门 路 径 上 的 中 介 变 量 ,即以共同原 因 或 中 介
① 当 然 也 可 以 同 时 以 A 和 [J为条件阻断后门路径。
48 基本有用的计量经济学
变量为条件可以阻断后门路径,
消除混杂偏差。
现实中,
正 确 地 找 出 变 量 之 间 的 因 果 关 系 非 常 重 要 。 图 4. 1 3 列 出 了 三 个
主要变量C 、
D 、
y 之间的关系,
1^、
?72为 未 观 测 变 量 。1 ^ 是 (:、
7 的共同原因,
因
而 C 和 Y 相关,
R 是 C 和 D 的 共 同 原 因 ,因 而 C 和 D 相 关 。但 仏 和 仏 是 未
观测因素,
如果没有正确的因果图,
则 可 能 将 c 看 成 D 和 y 的一个共同原因,
从 而 将 因 果 图 画 成 图 4. 10。这 时 ,以 C 条 件 不 但 不 能 阻 断 后 门 路 径 ,
反而.打开
了 后 门 路 径 。因 为 事 实 上 C 是 一 个 交 汇 变 量 ,
是 仏 和 U 2的 共 同 结 果 ,
根据后
门标准第三条,
C 本来就阻断了 D 到 Y 的 后 门 路 径 ,
如 果 以 C 为条件,
反 而打
开了该路径的相关性,
使 得 仏 和 U 2相 关 ,
从而D 和 Y 相关,
造 成 估 计 偏 差 。这
种 由 于 以 共 同 结 果 为 条 件 造 成 的 偏 差 称 为 样 本 选 择 偏 差 (H e c k m a n ,1979)或
内生选择偏差(
Elwert and Winship,2014) 。
图 4. 1 3 因果图:
样本选择偏差
外,
还 包 括 路 径 D —U — Y 产 生 的 相 关 性 ,
从而产生样本选择偏差。
D— - 0
图 4. 1 4 因果图:
样本选择偏差
另 一 个 例 子 是 关 于 中 国 农 村 教 育 收 益 率 的 估 计 。文 献 发 现 农 村 教 育 收 益
率低于城市教育收益率,
原因在于现有文献往往仅利用调查数据中的农村样本
进行估计,
农村样本是一个选择性样本。由于户籍的限制,
在城市化过程中,
农
村 中 有 能 力 的 个 体 率 先 通 过 升 学 、参 军 等 途 径 突 破 户 籍 限 制 进 人 了 城 市 体 系 ,
在调查样本中无法观测到这些已经成为城市居民的原农村居民,
而调查数据中
的个体是那些没有办法突破户籍限制的样本,
它与农村总体并不完全相同,
使
用 这 一 样 本 估 计 农 村 教 育 收 益 率 将 大 大 低 估 农 村 教 育 的 作 用 (赵 西 亮 ,2016) 。
因 果 图 见 图 4、15,D 表 示 教 育 ,
Y 表示收入,
H 表示户籍,
利用农村调查样本估
计农村教育收益率,
相当于以H 为条件,
打 开 了 非 因 果 路 径 D — n —y ,
从而 产
生样本选择偏差。
图 4 . 1 S 因果图:
样本选择偏差
样 本 选 择 偏 差 。 比如,
利用中国工业企业数据考察研发对企业绩效的影响,
如
果我们根据初始年份限定分析样本,
在 随 后 的 年 份 中 ,由 于 企 业 生 死 或 抽 样 原
因,
有些企业可能会不在初始限定的样本中了,
这种数据流失可能会产生样本
选 择 偏 差 。图 4. 1 6 是 因 果 图 ,
£)表 示研发,
Y 表示企业绩效,
C 表示是否流失,
L T 是 影 响 Y 和 C 的 未 观 测 变 量 。D 到 Y 是 因 果 路 径 。研 发 失 败 ,
亏损严重,
甚
至退出市场,
可 能 不 会 出 现 在 后 面 的 调 查 中 ,因 而 ,
D 会 影 响 C 。U 是 其 他 影 响
企 业 业 绩 的 未 观 测 因 素 ,比 如 宏 观 经 济 形 势 ,
U 也 会 影 响 到 企 业 是 否 流 失 ,比如
中国工业企业数据主要统计的是规模以上的工业企业,
如果由于经济形势,
企
业销售额达不到标准,
也 可 能 不 会 出 现 在 后 面 的 调 査 样 本 中 ,因 而 U 也 影 响 C 。
如果利用调查数据考察研发行为对企业绩效的影响,
相当于以目前没有流失的
样本为条件,
即 以 C 为 条 件 。从 图 中 可 以 看 出 ,
C 是 交 汇 变 量 ,以 C 为 条 件 ,
将
打 开 非 因 果 路 径 D — C —U — Y ,
从 而 产 生 样 本 选 择 偏 差 。这 里 样 本 选 择 偏 差 出
现在干预变量和结果变量之间。
样 本 选 择 偏 差 也 可 能 出 现 在 干 预 变 量 之 前 ,比 如 图 4. 1 3 ,
如果样本选择发
生在 D 之前,
相当于以C 为条件,
打开了后门路径D — C— Y ,
从而产
生 样 本 选 择 偏 差 。一 般 认 为 ,
干 预 前 的 样 本 选 择 造 成 的 偏 差 往 往 比 较 小 (Elw-
ert and Winship, 2014) 。
第四节选择偏差的处理
对于混杂偏差,
处 理 方 法 比 较 简 单 。在 完 全 随 机 化 实 验 中 ,由 于 干 预 是 随
机化分配的,
不 会 有 混 杂 因 素 出 现 ,因 而 ,
完全随机化实验不会产生混杂偏差。
在分层随机化实验中,
干预是在层内随机化分配的,
原因变量及潜在结果与分
层有关系,
用 于 分 层 的 变 量 是 对 应 的 混 杂 因 素 ,因 而 ,以 分 层 变 量 为 条 件 将 消 除
混 杂 偏 差 。在 观 测 研 究 中 ,
如 果 能 够 识 别 出 清 晰 的 混 杂 因 素 ,可 以 刹 用 回 归 方
法 或 匹 配 方 法 ,以 混 杂 因 素 为 条 件 可 以 消 除 混 杂 偏 差 。匹 配 方 法 是 以 影 响 干 预
的 变 量 为 条 件 消 除 混 杂 偏 差 ,回 归 是 以 影 响 结 果 变 量 的 混 杂 变 量 为 条 件 消 除 偏
第 四 章 因 果 图 51
差 。 图 4.1 7 显 示 ,
匹 配 控 制 S ,回 归 控 制 X , 均 可 阻 断 后 门 路 径 D — S — X —Y 。
当然,
这种区分并不是完全绝对的,
在后面的章节中会详细讨论回归和匹配这
两种方法。
图 4 . 1 7 因果图:
匹配和回归方法消除混杂偏差
样本选择偏差不但会出现在观测研究中,
也 会 出 现 在 随 机 化 实 验 中 。随机
化实验中,
如 果 存 在 参 与 个 体 流 失 (attrition),
也 会 产 生 样 本 选 择 偏 差 。 比如用
随机化实验考察培训对收人的影响,
随机分配到干预组接受培训的个体没有参
加培训,
如果这种流失是潜在收入比较高的个体,
那么利用剩余的样本进行估
计会产生选择性偏差。
出现样本选择偏差时,
针 对 不 同 的 情 况 ,可 以 采 用 不 同 的 解 决 办 法 。如果
数据允许,
可 以 通 过 调 整 样 本 的 方 式 消 除 样 本 选 择 偏 差 ,比 如 赵 西 亮 (2016)通
过调整农村居民样本,
将永久移民重新纳入农村样本方式修正样本选择偏差。
如 果 造 成 选 择 性 样 本 的 非 因 果 路 径 上 存 在 可 以 观 测 的 变 量 ,那 么 ,可 以 利 用 调
整 混 杂 偏 差 的 方 法 调 整 样 本 选 择 偏 差 。 比 如 图 4. 1 8 ,以 C 为 条 件 产 生 样 本 选
择偏差,
从 而 非 因 果 路 径 Y 使 D 与 Y 表 现 出 相 关 性 。如果变
量 L 或 U 是可观测的,
可以通过以L 或 U 为条件,
阻断该非因果路径造成的相
关性,
从 而 识 别 D 对 7 的 因 果 影 响 。 另 外 ,在 正 态 分 布 假 设 下 ,H e c k m a n
(1979)提 出 了 一 种 解 决 方 法 ,即 著 名 的 H e c k m a n 两 步 法 。
®
图 4 . 1 8 因果图:
修正样本选择偏差
第五节总 结
本 章 介 绍 了 因 果 图 的 基 本 概 念 ,因 果 图 是 与 潜 在 结 果 框 架 等 价 的 一 种 描 述
语言,
但 更 加 直 观 。我 们 介 绍 了 三 种 路 径 结 构 :因 果 路 径 、共 同 原 因 和 共 同 结
果 。三 种 情 况 下 两 变 量 之 间 表 现 出 相 关 性 :
有因果关系、
有共同原因或以共同
结 果 为 条 件 。因 果 推 断 的 目 的 就 是 排 除 以 共 同 原 因 和 共 同 结 果 为 条 件 造 成 的
相 关 性 .从 而 将 由 因 果 路 径 造 成 的 相 关 性 分 离 出 来 ,因 果 路 径 体 现 的 相 关 性 就
是 因 果 效 应 。后 门 规 则 提 供 了 三 条 基 本 的 识 別 策 略 ,以 中 间 变 量 、
共同原因为
条件可以阻断后门路径产生的相关性,
如 果 有 共 同 结 果 ,不 要 以 共 同 结 果 为 条
件 .从 而 不 会 产 生 非 因 果 路 径 的 相 关 性 。 由 共 同 原 因 造 成 的 偏 差 称 为 混 杂 偏
差 ,以 共 同 结 果 为 条 件 造 成 的 偏 差 称 为 样 本 选 择 偏 差 ,
实证分析的主要目的是
消除这两种偏差,
将因果效应识别出来。
_ i ] 推荐阅读
回 归 分 析 是 经 济 学 实 证 研 究 中 应 用 最 广 泛 的 一 种 工 具 。回归分析容易实
施,
很多计量经济学软件都有专门的回归命令,
0 因而成为经济学家广泛应用的
工 具 。但 是 ,回 归 分 析 本 身 只 能 给 出 相 关 性 ,不 能 直 接 给 出 因 果 效 应 的 估 计 。
什 么 条 件 下 回 归 分 析 有 因 果 效 应 的 解 释 ?什 么 情 况 下 才 能 用 回 归 分 析 回 答 我
们 关 心 的 因 果 效 应 问 题 ?在 这 一 章 里 ,
我 们 首 先 讨 论 条 件 期 望 函 数 (Condition
al expectation function, C E F ) 的 性 质 、条 件 期 望 函 数 和 回 归 函 数 之 间 的 关 系 ,
以及回归分析及其统计推断,
然后,
探讨回归函数和因果效应之间的关系。
第一节条件期望函数和线性回归
1. 条件期望函数的性质
在经济分析中,
我 们 往 往 关 注 一 个 变 量 X 对 另 一 个 变 量 Y 的 平 均 影 响 ,即
条 件 期 望 函 数 £[Y,. I X ,.],比 如 前 文 定 义 的 因 果 效 应 参 数 都 是 条 件 期 望 函 数 的
形式。
® 条 件 期 望 函 数 是 兄 的 函 数 ,
X,.是 随 机 变 量 ,因 而 ,
C E F 也是
随 机 变 量 。期 望 本 身 是 总 体 概 念 ,
现 实 中 ,我 们 得 到 的 数 据 往 往 是 总 体 的 一 个
样 本 ,因 而 ,
需 要 用 样 本 信 息 去 推 断 总 体 信 息 ,比 如 用 样 本 均 值 推 断 总 体 期 望 。
在利用经济数据分析我们关心的经济问题的时候,
需要进行统计推断,
但总体
才是我们关心的目标群体。因 而 ,
后文的分析中,
我们主要从总体角度探讨因
果效应识别,
避 免 讨 论 样 本 信 息 到 总 体 信 息 的 统 计 推 断 问 题 。没 有 特 别 指 明 ,
后 面 章 节 均 假 设 有 总 体 数 据 ,不 讨 论 估 计 量 的 抽 样 分 布 和 统 计 推 断 ,
@ 我们将研
究 目 标 集 中 在 因 果 效 应 的 识 别 上 。C E F 的 一 个 重 要 性 质 是 全 期 望 公 式 (5.1) ,
它描述的是无条件期望可以写成条件期望的总体平均。
ELY;
1 = E[E[y,. | X,.]] (5.1)
比如,
估计全班同学的平均身高,
有两种做法:
一种是分别测量每位同学的
① 在 Stata中 , 可 以 使 用 regress命 令 进 行 线 性 回 归 a
② 有 些 学 者 直 接 将 条 件 期 望 函 数 称 为 回 归 函 数 ,比 如 Hastieetal. (2009)、
洪永森(
2 0 1 1 h 为了叙
述方便, 后 文 “回归函 数 ”特 指 线 性 回 归 函 数 ,条件期望函数直接用C E F 表示。
③ 关 于 抽 样 分 布 和 统 计 推 断 请 参 考 Hayashi (2000)、
洪永淼(
2011)等 。
56 基本有用的计量经济学
身高,
然后进行平均,
这 就 是 无 条 件 期 望 。另 一 种 是 将 同 学 分 成 男 生 、女 生 两
组,
分别测量女生和男生的身高,
计 算 他 /她 们 的 平 均 身 高 ,
这是条件期望,
然后
再用男女生人数占全班人数的比重进行加权,
得到全班同学的平均身高,
这就
是 全 期 望 公 式 (5.1)右 边 的 部 分 。
另一个重要的全期望公式为:
E [ Y t I X (] = E[E[Y, I | X,-] (5. 2)
全 期 望 公 式 (5. 2)与 公 式 (5. 1)类 似 ,
证 明 见 本 章 附 录 。直 观 解 释 ,
想估计女生
的身高,
我们可以分别测量每个女生的身高,
然后计算平均值,
这就是条件期望
E [ Y i|X , ] ,
Y,表 示 身 高 ,
;C,.表 示 性 别 ^ 也 可 以 将 女 生 进 行 分 组 ,比如根据地域将
女生分成两组,
来自北方或南方,
用 Z,.表 示 。分 别 测 量 北 方 和 南 方 女 生 的 身 高
并进行平均,
得 到 f:
[Y,.l;
C,,
Z ,.],
再根据北方女生和南方女生在全部女生中所
占 比 重 进 行 加 权 则 可 得 到 全 部 女 生 的 平 均 身 高 ,即 £[Y,.IX,.]。这 两 个 全 期 望
公式很有用,
在后面的分析中会经常用到。
下 面 介 绍 C . E F 的 三 个 基 本 性 质 。第 一 个 性 质 称 为 C E F 分 解 特 征 ,
任意两
个随机变量y,、
x ,,
都可将一个随机变量分解成条件期望加一个剩余项的形
式 ,即
y ; = E l Y ;| X,-]-h£,. (5.3)
并 且 剩 余 项 e,均 值 独 立 于 X , ,即 E[e,. |X ] = 0 o 证 明 很 简 单 :
E[e,- | X,] = E £ Y i— ELY, | X,.] | X,] = £[y,- | X ,-]— 取 | X,] = 0
剩 余 项 e,.均 值 独 立 于 X,•具 有 很 强 的 内 涵 。首 先 ,
意 昧 着 ^ 的无条件期望为零,
£[e,.] = E [ E [ e ; i X,-]] = 0
其 次 ,s,与 X , 不 相 关 或 两 者 正 交 ,即
E l X i • £i] = K{X,- • E[e; | X , ] } - 0
实际上,
e,. 与 X , 的 任 意 函 数 都 不 相 关 ,
假 设 7i(X;) 是 兄 .的 任 意 函 数 ,
则有
[/i(Xy) . e,-] = E l H X , ) • E [ e ; | X,]] = 0
£:
总结一下,
■E[e,] = 0
£■[£,. | X,J = 0=>< E [Xi * SiJ — 0
E [ A ( 兄 )• £,] = 0 对 于 任 意 函 数 AC*)
因为对于任意两个随机变量,
总是可以将一个随机变量分解为它的条件期
望 函 数 和 一 个 剩 余 项 的 形 式 。相 应 地 ,
一个随机变量的方差也可以分解成两个
部分:
条件期望函数的方差和剩余项的方差。
第 五 章 线性 回归 57
V a r ( y , ) = Var(£[Y, | X,-] + e ;)
= V a r ( E [ y ; | X , ] ) + V a r ( e , ) + 2Cov(£[Y,. | X,•],£,)
= V a r C E C Y , 丨X , ] ) + £ [ € ]
- V a r ( £ [ Y , 丨X J ) + £ [ V a r(Y,. | X,)] (5. 4)
第 一 行 直 接 根 据 C E F 的 分 解 特 征 ,第 二 行 第 三 项 为 零 是 因 为 e,'均 值 独 立 于 任
何 X , 的 函 数 ,包 括 U ,],第 四行因为
E[ef] = F[E[ef 丨X ;]] - E[Var(y, | X ;)]
这 一 公 式 有 一 定 的 应 用 价 值 ,比 如 研 究 收 人 差 距 ,
通常关注各种影响因素对收
人差距的贡献, 方 差 可 以 作 为 收 人 差 距 的 一 种 衡 量 指 标 。 如 果 Y ,.表 示 个 人 收
人 ,X,表 示 教 育 、
性别、 地E 等决定收人的因素, 那么收入差距就可以分解为由
个 人 特征变量X,决定的差距及其他因素的影响,
并且可以测算每种因素在收人
差距中的贡献。
最 后 ,C E F 是 用 足 的 函 数 去 预 测 Y,.时 的 最 优 预 测 ,最 优 是 指 均 方 误 差
( M e a n Squared Error, M S E ) 最 小 。这 是 C E F 的 一 个 重 要 特 征 ,它 说 明 用 X,.
去 预 测 最 好 的 预 测 就 是 假 设 用 m (兄.)去 预 测 K ,
预测误差是
Y, —m ( X , ) ,
使 M S E 最小即使预测误差平方期望最小,
E[(Y, ~ m ( X t))2J ^ E { ( Y ;-E[Y,- | X,]) + (E[Y,. | X,] - }2
= 取 - 取 1 X,]]2 +2E{(E[Y,. | X JJ - m ( X r))(V/ - E [ Y / | X,-]))
+ E[E[Y,- | X , . ] - ^ ( X , ) ] 2
= E [ Y i- E [ Y i 丨X,]]2 + £ :
[£[K |X j - m C X J ] 2 (5.5)
第二行
E{(E[YiI X,.]-mCX,.))(Y/- E [ y i. 丨兄.])} - - 0
其 中 ,&(兄 )= ( £ :
[¥,|叉,]—m (足 ))。因 而 , 预测的均方误差等于两项, 第一项
与 函 数 m (兄.)无关, 最 小 化 均 方 误 差 等 价 于 使 第 二 项 E(E[Y,' |
最 小 。第 二 项 最 小 当 且 仅 当 爪 (兄.)= £ :
[Y,.丨
X , ] ,因 而 ,C E F 是 对 Y ,.的 最 优
预测。
2 . 线 性 回 归 和 条件期望函数
线性回归是经济学实证分析中应用最广泛的一种方法,
它与条件期望函数
之间有什么关系?因为条件期望函数与因果效应参数有着密切的联系,
如果线
性回归模型与条件期望函数可以建立起某种联系,
则可以利用回归分析估计因
果 效 应 参 数 。下 面 讨 论 线 性 回 归 与 条 件 期 望 函 数 之 间 的 关 系 。
58 基本有用的计量经济学
首先回顾线性回归模型,
® 假 设 有 总 体 的 数 据 (Y , ,
兄.),
这里兄是K X 1的
向 量 。我 们 想 用 一 个 兄 的 线 性 方 程 去 拟 合 Y ,.,
要使线性方程尽可能地靠近所
有的点,
可 以 采 用 最 小 二 乘 估 计 ,即 普 通 最 小 二 乘 法 (O L S ) 。估 计 出 的 线 性 方 程
称为总体回归方程或总体回归函数,
相 应 的 系 数 称 为 总 体 回 归 系 数 。具 体 地 ,
选 择 一 个 系 数 向 量 /?使 下 列 均 方 误 差 最 小 :
/S = arg minE[y,- — X\b~\z (5. 6)
b
卢为总体回归系数, 为 总 体 回 归 方 程 。上 式 是 6 的 二 次 函 数 ,一 阶 条 件 为 :
£[X , (Y,- - X ;
6)] = 0 (5.7)
整理得总体回归系数向量:
卢- ( 5 . 8)
预测误差在回归分析中通常称为残差,
定义总体回归残差为
由 一 阶 条 件 (5. 7)得
E[X,'e;] - 0 (5. 9)
注 意 式 (5. 9)不 是 假 设 ,
是线性回归的必然结果,
它实际是回归系数估计过程中
的一阶条件,
只要是线性回归,
得到的回归残差将与解释变量正交或不相关。
线 性 回 归 直 接 给 我 们 变 量 之 间 的 线 性 相 关 性 ,比 如 简 单 回 归 模 型 +
其总体回归系数为:
C o v ( H )
Va r(X;)
对 于 多 元 线 性 回 归 ,总 体 回 归 系 数 用 矩 阵 方 式 表 示 ,即
[X, Y,-] ,
解 释 变 量 X ki的 总 体 回 归 系 数 可 以 表 示 为 :
A = (5.10)
V a r (x )
其 中 是 ;
^ 对 所 有 其 他 解 释 变 量 的 总 体 回 归 残 差 ,即
也就是说,
要得到解释变量兄的回归系数爲,
可 以 进 行 两 步 回 归 。第 一 步 ,
解
释 变 量 X k 对 所 有 其 他 解 释 变 量 又 _,进 行 回 归 ,
得 到 回 归 残 差 么 ,.,
然后,
再用被
解 释 变 量 y,对王H 进 行 回 归 。第 一 步 回 归 中 相 当 于 将 解 释 变 量 分 解 为 两 部
分 :与 其 他 解 释 变 量 相 关 的 部 分 和 与 其 他 解 释 变 量 不 相 关 的 部 分 h ,
h 是剔除了其他因素影响后的;
0, (Angrist and Pischke, 200 9 ;Wooldridge,
2010)。第 二 步 ,
直 接 用 Y i 对 回 归 就 得 到 1 与 X k;的 直 接 相 关 性 了 。证明也
①有关线性回归的计量经济学理论,
可 以 参 考 Hayashi (2000)、
洪 永 淼 (2011)。
第五 章线 性回归 59
很容易,
运 用 回 归 性 质 (5, 9 ) ,
得
CovCx*;,y ,-)= C o v ( x w ,l3kX k;+ xi ki^-k + e,.).
= l^kCov(x k;, ) ~f- Cov(^,- ,X-ki) ^ k + CovCx*;,
匕)
= 戽C 0VC^,.,
X 二y + h )
= ^kCov(xki,xLii)y-\-^kCov(xt;,xfa)
U a K D
其中第二行第2 项 、
第 3 项 和 第 四 行 第 1 项 运 用 回 归 性 质 (5. 9)均 为 零 ,
整理一
下 即 得 式 (5. 10)。(
5. 10)式 说 明 ,
无 论 是 简 单 回 归 还 是 多 元 回 归 ,回 归 系 数 实
际反映的是解释变量与被解释变量之间的相关性。由于因果效应参数是用条
件期望函数进行定义的,
我们想了解回归系数和因果效应参数之间的关系,
要
首先讨论线性回归函数和条件期望函数之间的关系。
根据上一节的分析,
我们知道,
条件期望函数E m IX J 本 身 是 又 的 函 数 ,
但 对 函 数 形 式 没 有 进 行 任 何 限 制 ,因 而 C E F 可 以 是 又 的 线 性 或 非 线 性 函 数 ,
并 且 C E F 是 对 V 的 最 优 预 测 (均 方 误 差 最 小 意 义 上 )。 首 先 ,如 果 C E F 是线
性的,
那么总体回归函数将与C E F 完全一致,
见 定 理 5. 1 。
定 理 5. 1 ( 线 性 C E F 定 理 ) 如 果 C E F 是 线 性 的 ,则 总 体 回 归 函 数 就
是 C E F 。①
证 明 假 设 E[Y,.丨
XJ = ,由 C E F 分 解 特 征 ,
E[X,-(Y,-- E [ y ; |X,])]
= 0 。将 £:
[1 = 代 人 ,得 ^ .]=/?,从 而 说 明
^ =%/9,
E l Y A X ^ X : 即总体回归函数与条件期望函数一致。
如果条件期望函数不是线性的,
那 么 ,总 体 回 归 函 数 将 与 条 件 期 望 函 数 不
一 致 。但 总 体 回 归 函 数 仍 然 是 对 条 件 期 望 函 数 的 最 优 线 性 预 测 。
定 理 5. 2 ( 回归一 C E F 定 理 ) 总 体 回 归 函 数 叉 化 是 (最 小 均 方 误 差 意 义
上 )对 I X ,.]的最优线性近似 ,即
/3 = arg min£(E[y,. | X , ] - X ;
6) 2 (5,11)
b
① 回 忆 前 面 讨 论 的 均 值 独 立 性 条 件 £[e,. I X ,] - 0 ,
洪 永 淼 (2 0 1 1 )称 之 为 模 型 正 确 设 定 假 设 。根据
线性 CEF定理, 如 果 C E F 函数是线性的, C E F 就 是 总 体 回 归 方 程 。根 据 C E F 分 解 特 征 ,总 体 回 归 残 差
必 然 满 足 £ |> , i X ,] = 0 。反 过 来 ,
如果均值独立性条件满足, 那 么 C E F 必 然 等 于 总 体 回 归 方 程 。 因 而 ,只
有 C E F 真的是线性的,
总 体 回 归 函 数 才 等 于 C E F ,从 而 E U I X ,. ] = 0 ,因 而 ,
可以称该条件为正确模型设
定 假 设 。详 细 讨 论 参 见 洪 永 森 (2011)第 2 章 。
60 基本有用的计量经济学
证明
E(y,.-x; D ^ | x^-x-b)}2
6)2= E{(y,-E[y,. | x j ) + (£:
= E [ Y i一 E [ Y ; I X J ] 2 + E L E l Y i \ X,] - X b J
+ 2E[(Y,.-£[y,. I X,])(E[y, | X , . ] ~ X ;
6)]
- E l Y ;- E[Y,. I X,]]2 + E I E I Y ; | X t] — X ^ b J
利 用 C E F 分解特征,
第 三 行 交 叉 项 为 零 。根 据 定 义 ,总 体 回 归 系 数 最 小 化 左 边
MSE,
等价于最小化右边两项,
第 一 项 与 选 择 向 量 6 没 有 关 系 。因 而 ,
最小化 左
边 等 价 于 使 右 边 第 二 项 最 小 化 。命 题 得 证 。
定 理 5. 2 说 明 ,即 使 条 件 期 望 函 数 本 身 是 非 线 性 的 ,总 体 回 归 函 数 仍 然 有
用,
总 体 回 归 函 数 是 对 条 件 期 望 函 数 的 最 优 线 性 近 似 。定 理 5. 1 和 定 理 5. 2 为
使用回归分析提供了理论基础,
尽 管 经 济 变 量 之 间 的 关 系 往 往 是 非 线 性 的 ,回
归分析仍然可以得到最优的近似,
尤其当解释变量限制比较小的变动范围内
时 ,回 归 函 数 对 C E F 的 近 似 越 好 ,
这 正 是 局 部 线 性 回 归 (Local Linear Regres
sion, L L R ) 的 基 本 思 想 。
定 理 5. 2 提 供 了 一 种 估 计 回 归 系 数 的 方 法 ,即 可 以 用 条 件 期 望 对 解 释 变 量
回 归 。根 据 回 归 系 数 (5.8 ) ,
得
^ E l X ^ - T ' E l X . Y ^ = E l X iX :
2 ^ E l X iE L Y i | X,-]] (5. 12)
上 式 第 二 个 等 号 使 用 全 期 望 公 式 (5. 1)而 得 ,可 以 看 到 ,E d IX ;] 替 代 了 前 面
Y , 的 位 置 ,即 利 用 EtiYjXi]对 X i 回 归 ,
也 可 以 得 到 回 归 系 数 向 量 13。这 一 点 具
有 应 用 价 值 。有 时 ,
我们无法获得个体层面的数据,
但可以获得加总的数据,
利
用加总的数据也可以估计个体回归系数。比如牯计教育收益率时,
如果我们获
得的是根据教育年限加总的平均收人数据,
用平均收入对教育年限回归,
仍然
可以获得个体教育收益率的估计。
用 2 0 0 2 年 中 国 居 民 收 入 调 査 (C H I P ) 城 镇 数 据 获 得 以 下 回 归 。A 部 分 是
利用个体数据进行的回归,
共 9581个样本点,
得 到 的 教 育 收 益 率 为 0,0715。B
部分是利用教育年限进行加总的数据进行的估计,
教 育 年 限 为 0— 2 3 年 2 4 个
样 本 点 。利 用 各 层 次 教 育 个 体 数 量 作 为 权 重 进 行 加 权 最 小 二 乘 估 计 ,
得到的教
育 收 益 率 也 是 0. 0715,当 然 标 准 误 差 不 同 。
第 五章 线性回 归 61
A Individual-level data
, reg lwage e duc ,vce(robust)
Linear regression Number of obs = 9581
F( 1 ,9 5 7 9 ) = 779.01
Prob > F = 0.0000
R-squared = 0.0776
Root MSE = .72906
Robust
lwage Coef. t P>|t| [ 9 5 % Conf, Interval]
Std* Err.
educ .0715452 .0025634 27.91 0.000 ,0665205 ,0765699
_cons 8.297527 .0315587 262.93 0.000 8.235765 8.359489
Robust
lwage Coef. t P > 111 [ 9 5 % Conf. Interval]
Std. Err.
educ . 0715452 ,008122 8.81 0.000 ,0547012 •0883891
cons 8.297627 .1061443 78.17 0.000 8.077497 8.517757
3. O L S 估 计 量 的渐近特征
在这一节暂时回到样本的角度,
对 O L S 估计量的渐近特征进行简要回顾,
详 细 讨 论 可 以 参 见 洪 永 淼 (2011)或 Hayashi (2000) 。假 设 有 总 体 的 一 个 随 机
样本,
利 用 样 本 信 息 去 推 断 总 体 回 归 系 数 。根 据 大 数 定 律 ,
用样本矩估计总体
矩,
样本回归系数向量可以写成:
卜 (X,X 、
-1X,Y (5.13)
或
卢= [务 S U ; 广 (5.14)
因 为 回 归 函 数 为 为 总 体 回 归 残 差 ,
将之代人式(
5. 14) ,
得
卜 /3+ [务 写 [务 S i 叫 (
5.15)
62 基本有用的计量经济学
根据大数定律,
[ 士 —^ E [ X ;
X- ]_1 , ;e;—^ E [ X j g , ] = 0
(5.16)
从而,
卢 或 plimjff = ^ (5. 17)
即 O L S 估计量是总体回归系数向量的一致估计。
由于 £ [ 叉& ] = 0 ,其方差协方差矩阵可以表示为:
l = Var(Xiei) = E l X i X U U .
利用中心极限定理,
可以得到
从而,
由式(
5. 14)得
根 据 Slutsky 定理,
上式将渐近服从于正态分布。
® 根据(
5. 16) 式和(
5. 18) 式 ,
(5. 1 9 ) 式 第 一 项 的 渐 近 极 限 是 ,第 二 项 服 从 渐 近 正 态 分 布
N(0,
2 ) 。因而,
(5. 19)式服从渐近正态分布 E [ X fX 门一1 • iV(0 ,
I:),
它的均值
为0,
方差是三明治形式:
E I X X T ^ E I X ^ ^ = E lX ^ - T ^ lX ^ U n E L X ^ ^ - 1 (5.20)
其 中 ,总 体 残 差 e,.用 样 本 残 差 e、= Y _ 估 计 ,中 间 项 的 估 计 量 为
l/ N X ^ X X e U , 而 0 L S 估计量的标准误差就是方差协方差矩阵对角线元素
开方后的数值。由于该方差协方差矩阵没有施加同方差的假设, 根据它计算的
标准误差通常称为异方差一致性标准误差或稳健标准误差(
robust standard er
ror) D 在 Stata软件中,
默认的是同方差假设下的标准误差,
要获得稳健标准误
差,
回归命令需要加上vce(robust)选项。
如果引入同方差假设,
即 E [ e H X j ^ 2,
则
E lX X .e U = E[X,.X ;
E [ e? | X,.]] - Y E [ K ]
从而 j 的渐近协方差矩阵为:
E [ X ;X ;
T 'E lX X e U E L X ^ - T 1= E [ X , X ;]-V£[X,.X; ] £ [ X , X ;
]~J
① Slutsky定 理 说 ,
如果两个随机变量,
一个有渐近极限,
一个有渐近分布,
两者的乘积也将有渐近
分布,
并且是两者渐近极限乘积的分布1
第 五章 线性回 归 63
- ^ELXiX-T1 (5.21)
这 正 是 Stata 回 归 命 令 默 认 的 标 准 误 差 ,
也是经典线性回归模型理论中同方差
的 标 准 误 差 公 式 。根 据 前 文 的 分 析 ,我 们 知 道 回 归 实 际 是 对 C E F 的 近 似 ,因
而,
异 方 差 就 是 很 自 然 的 事 情 。 即 使 数 据 真 的 是 同 方 差 的 ,V a r(y,.jX,.)=ff2 ,
如
果 C E F 是线性的,
那 么 回 归 残 差 确 实 会 是 同 方 差 的 。但 是 ,
如 果 C E F 是非线性
的,
那 么 即 使 原 始 数 据 是 同 方 差 的 ,回 归 残 差 也 将 是 异 方 差 的 。具 体 地 ,
E[e! | | X,]
^E{[(y,.-£[Y,. | X,]) + (E[Y,. | X J - X ;
/?)]2 [ X,'}
- V a r [ Y ; | X J + EECECY, j X , ] - X ;
/?)2 | X,] (5.22)
由 上 式 可 以 看 出 ,即 使 原 始 数 据 是 同 方 差 的 ,满 足 V a r( m ) = ff2 ,但 是 如 果
C E F 是非线性的,
那么第二项将不等于零,
而 是 又 的 函 数 ,因 而 ,回 归 残 差 仍 然
是 异 方 差 的 。直 观 上 也 很 容 易 理 解 ,条 件 期 望 函 数 本 身 是 非 线 性 的 ,
用线性方
程去拟合非线性数据,
就会出现有些地方拟合得好,
有些地方拟合得差,
从而使
回 归 残 差 的 波 动 性 与 X ; 有 关 系 ,回 归 残 差 出 现 异 方 差 。 即 使 C E F 是 线 性 的 ,
仍 然 不 能 保 证 同 方 差 ,比 如 后 面 要 介 绍 的 线 性 概 率 模 型 (L P M ) ,C E F 是 线 性
的,
但 回 归 残 差 仍 然 是 异 方 差 的 。因 而 ,
异 方 差 是 常 态 ,同 方 差 是 特 殊 情 况 。在
使 用 Stata软 件 进 行 实 证 分 析 时 ,不 要 忘 记 加 上 vce(robust)选 项 。
初 等 计 量 经 济 学 的 课 程 中 一 般 会 讨 论 O L S 估 计 量 的 无 偏 性 。什 么 情 况
下 ,才 能 保 证 O L S 估 计 量 是 无 偏 的 ?根 据 (5. 15)式 ,
容 易 证 明 条 件 |兄 ] =
0 可以保证估计量的无偏性。
= (3 + E ^ ^ X iX ^ y 1 \X,]j
第 二 行 第 2 项 利 用 了 全 期 望 公 式 (5.1)。什 么 时 候 [e,.| X , 0 = 0 才 会 成 立 呢 ? 根
据 定 理 5. 2 和 C E F 的 分 解 特 征 ,
如 果 C E F 是线性函数,
C E F 就是总体回归方
程,
从 而 总 体 回 归 残 差 就 会 满 足 均 值 独 立 性 条 件 。事 实 上 ,随 机 化 实 验 可 以 保
证均值独立性条件成立。
无偏性也适合于小样本推断,
一 致 性 仅 适 用 于 大 样 本 。如 果 一 个 估 计 量 是
无偏的,
无论样本大小,
多次估计,
其 平 均 值 都 会 接 近 于 总 体 参 数 。如 果 估 计 量
是一致的,
只有在样本量很大时,
估 计 量 才 会 接 近 于 总 体 参 数 。如 果 样 本 量 太
小,
可能会产生较大偏差,
这一点在应用研究中需要注意。
64 基本有用的计量经济学
4 . 饱和回归
经济变量的关系往往是非线性的, 但有一种回归模型的条件期望函数总是
线性的,这 种回归使兄的每一个取值都产生一个虚拟变量作为模型的协变量,
如 果 X;是多元的,
除每个值的虚拟变量外,
还要引人解释变量之间的交叉项,
这 种 回 归 模 型 称 为 饱 和 回 归 。它 实 际 上 来 自 于 实 验 的 分 层 模 式 (stratifica
tion) 。比如,
我们考察大学教育收益率,
针对大学和高中两种教育程度,
还探讨
性别 差 异 。回归模型包括两个变量:教 育 和 性 别 。因为教育和性别均是二值变
量,
根 据 这 两 个 变量可以将数据分成4 组 :
大学男性、
大学女性、
高中男性和高
中女性,
从而每组个体的平均收入均可以计算出来。比如,
用 叉 ^&分 别 表 示
教育和性别,
取 1 分别表示大学和男性,
即 4 组个体的平均收人可以写成:
E [ y ; | x u = o ,x 2;= o] - «
e[y,- l x u = 1 ,xZ
i= o] = a + /S
E[Yi| X u = 0 ,XZ
i= 1]= a~hr
£[y,' I Xu- = 1 ,X 2;= 1] = a + ^ + 7 + S
即高中女性平均收人为《,
大学女性平均收入为《+ 仏 高 中 男性平均收人为a +
y,
大学男性平均收入为a+ / ? + y + 夂 C E F 可以写为:
E[y,. | X 1(., X 2,.] = a + /2X lf.+ + ^ X lfX 2i (5.23)
其中X,、
X 2 的 系 数 /?、
7 称为主效应(
main effects), S 称 为 交 互 效 应 (interac
tion effect) 。如果没有交叉影响,
不同性别教育收益率相同,
那 么 <5=0。在一般
的模型构建中,
可以没有交互效应,
但 不 能没有主效应。如果只有交互效应,
模
型往往很难解释。
如果解释变量是多值的,比如教育变量有5 个 取 值 即 3 = 0 ,
1,…,
4,分别表
示没受过教育、
小学、
初中、
高中、
大学,
那么相应的饱和回归模型可以写成:
4
5. 二 元因变量模型
在回归分析中,
被 解 释 变 量 有 时 是 二 值 的 ,比如是否就业、
竞选是否成功、
第五 章线 性 回归 65
贷 款 是 否 批 准 等 等 。被 解 释 变 量 是 否 是 二 值 的 (或 离 散 变 量 )并 不 影 响 定 理 5. 2
的 成 立 。唯 一 的 差 异 在 于 其 条 件 期 望 函 数 的 解 释 及 回 归 系 数 的 解 释 。 比如考
察什么因素影响就业参与,
Y,.表 示 是 否 就 业 ,为 二 值 变 量 ,取 1 表 示 就 业 ,
取 0
表 示 未 就 业 。X , 表 示 个 体 教 育 、家 庭 收 人 、孩 子 数 量 等 可 能 的 影 响 因 素 ,构造
线性回归模型:
Y,' = a + X ;
/? + e,
假 设 £ [ £,.丨足] = 0 ,
则总体回归函数为:
ELYi ] X ; ] = a + X ;
^3
由于 是 二 值 的 ,
总体回归函数可以写成:
Pr[Y, = 1 丨足] = « + 久;卢 (5.25)
回归系数解释为解释变量对就业概率( K = :
l )的 边 际 影 响 。被 解 释 变 量 可 以 解
释为成功的概率,
上 述 模 型 通 常 称 为 线 性 概 率 模 型 (U n ear Probability Model,
L P M ) C 线性概率模型残差总是异方差的,
E l s i \ x,.]= E[[y,.-p[y,. = i | x ,.]]2 | x,]
- [ i - p[y,- = i I x ,.] ] 2p [ y , - 11 x,.]
+ 尸[y,. = 1 1 x ,.]2[ i - p [ 7 , - 1 1 x j ]
- P [ Y ; = 1 i X , ] [ 1 - F [ Y , = 1 ! X,]]
L P M 模型被解释变量反映的是成功的概率,
其取值范围在[0,
1]之 间 ,
但
L P M 右边为线性函数,
无法保证其拟合值在[0,
i]之 间 ,
尤 其 当 X , 取值变动较
大时,
可 能 会 出 现 拟 合 值 为 负 或 大 于 1 的 情 形 。另 外 ,L P M 的 边 际 影 响 是 常
数 。比如就业参与模型中,
6 岁以下孩子的数量可能是影响母亲就业决策的一
个 重 要 因 素 。在 L P M 模 型 中 ,
孩子数量的系数是一个常数,
那么,
孩子数量从
0 增加到1 个,
可能对就业概率产生较大影响,
孩子数量从1 再增加到2 时,
其
影响程度可能就没有第1 个孩子的影响大,
L P M 模型无法反映这一点。
为了克服上述两个缺陷,
计量经济学家构造出了非线性概率模型J 一种
解决方法是引人潜变量,
对 潜 变 量 建 模 而 不 是 对 观 测 结 果 建 模 。 比如考察个体
的就业决策,
就 业 选 择 取 决 于 就 业 和 待 业 两 种 状 态 下 个 体 效 用 的 比 较 。假设 两
种 状 态 下 个 体 效 用 的 差 用 潜 变 量 Y * 表 示 ,潜 变 量 模 型 为 :
Y ; = a + X ^ + e,- (5.26)
其中, = 则条件期望函数可以写为:
dF— ^ Z 1 1 足 ] = 8 ^ + X ,
雜 (5. 28)
o^ki
其 中 $ ( • ) 为 概 率 密 度 函 数 。在 应 用 研 究 中 ,
通 常 假 设 e,.服 从 标 准 正 态 分 布 或
逻 辑 分 布 。如 果 是 正 态 分 布 ,
上 述 模 型 称 为 probit模 型 。如 果 是 逻 辑 分 布 ,
称
为 logit模 型 。其 中 ,
标准正态分布和逻辑分布的密度函数分别为:
化 。在 应 用 中 ,
往 往 估 计 平 均 的 边 际 效 应 ,即 对 于 平 均 特 征 X 的 个 体 ,
其边际
效 应 是 多 少 。Stata软 件 中 ,可 以 使 用 ma r g i n s 命 令 获 得 边 际 效 应 的 估 计 。关
于模型拟合的好坏,
可 以 用 M c F a d d e n 提出伪 尺 2(pseudo _R2)进 行 测 度 ,
定义为
1 一! 其中为原模型的对数似然值,
& 为只有常数项模型的对数似然
值 。关 于 离 散 选 择 模 型 的 更 多 讨 论 参 考 C a m e r o n and Trivedi (2005) ^ W o o l
dridge (2010)0
第二节线性回归和因果效应
1. 线性回归和因果效应
上 文 讨 论 了 线 性 回 归 函 数 与 条 件 期 望 函 数 之 间 的 关 系 。定 理 5. 1 和定 理
5. 2 告 诉 我 们 ,
如 果 C E F 是线性函数,
则 C E F 和 总 体 回 归 函 数 一 致 ;如 果 C E F
是非线性函数,
则 总 体 回 归 函 数 是 对 C E F 的 最 优 线 性 近 似 。什 么 时 候 回 归 系
数 有 因 果 效 应 的 解 释 呢 ?一 个 简 单 的 回 答 是 当 总 体 回 归 函 数 所 近 似 的 C E F 有
因 果 效 应 解 释 的 时 候 。第 二 章 曾 经 推 出 简 单 回 归 系 数 实 际 是 两 组 结 果 平 均 值
之差,
而两组结果平均值之差要有因果效应解释,
必 须 满 足 条 件 (2. 2 8 ) 或/ 和
(2. 30),并 且 不 同 的 条 件 会 给 出 不 同 的 因 果 效 应 参 数 。再 回 到 潜 在 结 果 框 架 ,
第 五 章 线 性回 归 67
将观测结果表示成潜在结果的形式:
Y, - D £Y u + ( 1 - D , ) y 0,- - Y 0f + ( Y u - Y o ^ B i
= Yo,- + D i = /i。 + dsDi + v0i
= "o + ("i — ) D f + [v。
,.+ D; —% ) ] (5.29)
其中抑= E [ Y 。
],〜 =Y。
,一E D V ] ,
内 一E D M U f Y h —E [ Y 1;] ,
或直接写成:
y,- = a + Tate -D/ + e; (5. 30)
其 中 《= 埤 ,£, - v 0i. + D i( ^ - v 0i) o 注 意 (5. 30)式 是 潜 在 结 果 模 型 ,
不 是 线性回
归模型,
尽 管 看 起 来 很 像 简 单 回 归 。在 (5. 30)式 中 ,rATE是 总 体 平 均 因 果 效 应 。
两组结果平均值分别为:
E [ Y ; [ D ; = 1] - a + rATE + E[e,. | X,] (5. 31)
E[Y,- | A. = 0] = a + £ :
[>,. | X J (5. 32)
(5.31) —(5.32)得
rols= E [ Y ; !A = 1]—取 . !A = 0]
= rATE + El^i | D ; = 1] — E[ e £| D,. = 0]
= rATE + E[_vl{ | Di = 1] — E[_v0i I Di = 0]
= rATE + e [y 0i. | ^ = l ] 一 e [y 0i- I d ; = o]
+ a ~ - p ) { E [ y li~ Y , i | d ; = i ] - E [ y 1;- y 0l I d, = o]} (5.33 )
其 中 />= Pr[D,. = l] 。 因而,
要 使 回 归 系 数 r°ls可 以 解 释 为 平 均 因 果 效 应 rATE,
必
须 使 上 式 最 后 两 项 等 于 零 。第 一 项 为 零 即 条 件 (2. 2 8 ) ,要 求 基 线 潜 在 结 果 Y 0;
均 值 独 立 于 JD,',不 存 在 选 择 偏 差 。第 二 项 为 零 ,
要求两组个体因果效应不存在
差异,
如 果 (2. 28)成 立 ,
则 第 二 项 为 零 意 味 着 条 件 (2. 30)成 立 。 因 而 ,
简单 回 归
系数要有因果效应的解释,
特别是想解释为A T E ,
必须要求下列两个条件同时
成 立 。 (5. 34)(5,35)实 际 是 (2. 28)(2. 30)的 复 制 。
| D ; = 1] =
E [ Y 0; E [ Y 0iI D t ^ 0] (5.34)
E [ Y U \ D ; = 1] - E [ Y 1;
i D ; = 0] (5. 35)
那么,
什 么 时 候 回 归 系 数 可 以 解 释 为 干 预 组 平 均 因 果 效 应 呢 ?利用与上面
同样的方法,
可以将观测结果写成下列潜在结果形式:
Yi — a-^ TxrrDi + e;
其 中 a = ij.^,£;
=Voi + D ;
(Yi, —V"。
,.一tatt) ,
利用同样的方法,
可以证明:
rols = rATT + E [ Y oi \ D, = 1] — E [ Y 0;| D,- = 0]
因 而 ,回 归 系 数 r°u可 以 解 释 成 ttatt,(5. 34)必 须 成 立 。 同 理 ,
可 以 证 明 ,回归系
数要解释为控制组平均因果效应,
条 件 (5. 35)必 须 成 立 。
68 基本有用的计量经济学
综上,
如 果 只 有 条 件 (5. 34)成 立 ,回 归 系 数 可 以 解 释 为 干 预 组 平 均 因 果 效
应;
如 果 只 有 条 件 (5. 35)成 立 ,
.回 归 系 数 可 以 解 释 为 控 制 组 平 均 因 果 效 应 ;
如果
两 个 条 件 (5. 34)和 (5. 3 5 ) 同 时 成 立 ,回 归 系 数 可 以 解 释 为 总 体 平 均 因 果 效 应
(其 实 此 时 三 个 因 果 效 应 参 数 相 同 )。这 两 个 条 件 与 独 立 性 假 设 密 切 相 关 ,
在完
全随机化实验中,
我 们 知 道 潜 在 结 果 独 立 于 分 配 变 量 ,即 (
Y p U J L A .。独立
性条件成立,
则 (5. 34 ) 和 (5. 35)成 立 ,
但 反 过 来 不 一 定 。 因 而 ,条 件 (5. 34) 和
(5. 3 5 ) 比 独 立 性 假 设 弱 一 些 ,也 称 为 均 值 独 立 性 。它 只 对 一 阶 矩 有 限 制 ,
对高
阶矩没有要求,
而独立性是针对整个分布。
如 果 条 件 (5. 34)和 (5. 35)不 满 足 ,
简单回归系数将没有因果效应的解释。
或者说,
用回归系数去估计因果效应参数,
存 在 着 偏 差 。解 决 办 法 是 引 人 控 制
变量,
实 施 多 元 回 归 。多 元 回 归 在 什 么 情 况 下 有 因 果 效 应 的 解 释 呢 ?换 言 之 ,
如何引人控制变量呢?下 面 ,
将 控 制 变 量 X,.引 人 简 单 回 归 模 型 ,
为了得到显性
的解,
我们考察下面的饱和回归:
Y ;— rD,. + ^ , a rdx +£•; (5. 36)
J*
其 中 d r = l ( X , ^:r)。 因 为 饱 和 模 型 的 C E F 是 线 性 的 ,
从 而 上 式 满 足 E [ s ;| D ,.,
X,-] - 0 D 利 用 (5.10),D ; 的 回 归 系 数 为 :
产 = Cov(y^D,) = g[Y二
•D j (其 中 疚 = D : 一E [ D ; | x ;
])
Var(D,) E[Df]
= E [ D , D , t x ] = E l D h x ^ = £ [ £ [ 玢 | X,]rx ]
ELDH £:
® ] E [ £ [ D f | X,]]
_ E [ E [ ( D ;- E l D , ] X,.])2 | X,]i-x ] _ £[Var(D, | X,)rx]
E [ E [ ( D , - - E [ D , | X,.])3 | X,.]] " E[Var(D, | X,-)]
= £ [ £ [ V a r ( D ,丨
丨X ;)]r x ] (5.37)
其 中 ,疚 是 D , 对 X,.饱 和 回 归 的 总 体 残 差 。饱 和 回 归 的 C E F 是 线 性 函 数 ,因
^ 实 际 上 是 用 特 征 为 X,.的 子 样 本 作 简 单 回 归 得 到 的 回 归 系 数 。第 三 行 利 用
C E F 分 解 特 征 ,E [ 5 , £ :
[ D , H x] = 0 。所 以 ,回 归 系 数 严 是 对 u 的 加 权 平
均 。因 而 ,
如果想使产有因果效应的解释,
其中的必须要有因果效应的解
释。 什 么 情 况 下 有 因 果 效 应 解 释 呢 ?将 ^ 写 成 潜 在 结 果 的 形 式 :
rx = IX^D, = 1]-E [ Y , I = 0]
= E l Y it | X ;,Di = 1 ] - E [ Y 0;I X ;, D (. = 0]
= E [ y ];
- y 0;I X , , D ; - l ] + E [ Y 0i | X ;,D, - 1] - E [ Y 0l | X ;,D, 0 ]'
、
V--------------------- ----------------------^
^ ------ ^ " —----V ;
=
rA T T CXO 选择偏左
(5.39)
- - Vo,' I X,.] + E [ y 0l I X,,D, = 1] - E [ Y 0, I X , ,
D,' = 0]
V " V
rA TE(JV.) 选抒偏差
+ ( i - ^ ( x > ) { E [ y u - y 0( i 足 ,a = i l - E [ Y u - Y oi I m = o ]}
两组闪果效应偏差
(5.40)
从第三行可以看出,
要 想 将 rx 解 释 成 特 征 为 X 群 体 的 干 预 组 平 均 因 果 效 应 ,
必
须 满 足 选 择 偏 差 为 零 ,即 满 足 下 列 条 件 :
E [ Y 0;丨 - 1] - E [ Y 0l- [ X i,Di = 0] (5.41)
第四行表明,
要 想 将 ^ 解释成特征为X 群体的平均因果效应,
必须满足选择偏
差 和 两 组 因 果 效 应 偏 差 同 时 为 零 ,即 需 要 同 时 满 足 条 件 (5. 41)和 (5. 42) 。
E[YU |X ;,D,- - 1] = E [ Y U | X, ,D, = 0] (5. 42)
rx 有 因 果 效 应 的 解 释 ,
t°1s也 具 有 因 果 效 应 的 解 释 。 (5. 4 1)和 (5. 4 2 )两个
条 件 称 为 条 件 均 值 独 立 性 假 设 (Conditional M e a n Ind印endence,C M I ) 。一个
更 强 的 条 件 是 条 件 独 立 性 假 设 (Conditional Independence Assumption, C I A ) ,
它要求以X;为条件,
潜 在 结 果 独 立 于 干 预 变 量 ,即 以 X i 为 条 件 ,
干预变量的分
配近似于完全随机化实验,
用公式表示为:
(Y0i,Yu )±D, | X r- (5.43)
启示:
为 什 么 要 引 人 多 元 回 归 ? 引 人 其 他 控 制 变 量 的 目 的 是 什 么 ? 在 利用
回归分析进行因果推断时,
如 果 条 件 (5. 34)或 /和 (5. 35)能 够 满 足 ,
简 单 回归系
数 就 可 以 有 因 果 效 应 的 解 释 。如 果 只 有 条 件 (5. 34)成 立 ,
简单回归系数可以解
释 成 干 预 组 平 均 因 果 效 应 。如 果 只 有 条 件 (5. 35)成 立 ,
简单回归系数可以解释
成控制组平均因果效应,
如 果 两 个 条 件 同 时 成 立 ,则 回 归 系 数 可 以 解 释 成 总 体
平 均 因 果 效 应 。如 果 条 件 (5. 34)和 ( 则 考 虑 引 人 控 制 变 量 X ;。
5. 35)都 不 成 立 ,
70 基本有用的计量经济学
控制变量的引人不是任意的,
引入控制变量的目的是使条件独立性假设能够成
立,
或 至 少 条 件 均 值 独 立 性 假 设 (5. 41 ) 或/ 和 (5. 4 2 ) 能 够 成 立 。如 果 只 有 条 件
(5. 41)成 立 ,引 人 控 制 变 量 后 ,回 归 系 数 可 以 近 似 解 释 为 干 预 组 平 均 因 果 效
应。
® 如 果 只 有 条 件 (5. 42)成 立 ,回 归 系 数 可 以 近 似 解 释 为 控 制 组 平 均 因 果 效
应 。 当 两 条 件 均 成 立 时 ,回 归 系 数 可 以 近 似 解 释 为 总 体 平 均 因 果 效 应 。
②
是 想 在 引 人 控 制 变 量 X ;后 ,
我们之所以引人多元回归, 使条件独立性假设
或至少条件均值独立性假设成立,
从 而 回 归 系 数 具 有 因 果 效 应 的 解 释 。对于这
一点,
也 可 以 用 因 果 图 进 行 描 述 。如 果 条 件 (5. 34)和 (5. 35)满 足 或 独 立 性 条 件
(Yo,.,
Y lf) J L U . 满 足 ,因 果 图 类 似 于 图 4. 3 , D 到 Y 的 因 果 效 应 可 以 直 接 识 别 ,回
归 系 数 体 现 出 的 相 关 性 就 是 两 变 量 之 间 的 因 果 效 应 。(5. 34)和 (5. 35)不 成 立 ,
因 果 图 为 图 5.1(a)。有 后 门 路 径 D —e—Y ,回 归 系 数 包 括 因 果 路 径 产 生 的 相 关
性 和 后 门 路 径 产 生 的 相 关 性 。后 门 路 径 造 成 的 相 关 性 和 因 果 路 径 产 生 的 相 关
性 混 杂 在 一 起 ,回 归 系 数 不 能 解 释 为 因 果 效 应 ,
存 在 选 择 偏 差 。如 果 混 杂 e 可
以分解成X 和 e 两部分,
并且造成e 混杂的主要原因是由X 造成的,
那么,
在简
单回归中引人控制变量X ,
相 当 于 图 5. 1(b)中 以 X 为 条 件 。根 据 后 门 规 则 ,阻
断 了 后 门 路 径 产 生 的 相 关 性 。那 么 ,回 归 系 数 表 现 出 的 相 关 性 只 剩 下 因 果 路 径
的 相 关 性 了 。控 制 变 量 X 的 引 人 ,
消除了混杂偏差,
使回归系数具有因果效应
的解释。
图 5 . 1 回归分析和因果效应
在多元回归分析中,
我们关心的解释变量和控制变量的地位是不一样的。
为强调这一点,
本 书 中 将 我 们 关 心 的 解 释 变 量 称 为 原 因 变 量 或 干 预 变 量 。在回
归分析中,
我 们 主 要 关 心 原 因 变 量 的 系 数 是 否 有 因 果 效 应 的 解 释 。对 于 控 制 变
① 在 满 足 茶 件 独 立 性 或 条 件 均 值 独 立 性 假 设 时 ,回 归 系 数 可 以 布 因 果 效 应 的 解 释 ,
但回归系数在
数值上并不完全等于平均因果效应或干预组平均因果效应。因 而 , 是对因果效应参数的近似, 至少得到
的 影 响 方 向 是 一 致 的 。在 下 一 章 的 匹 配 方 法 中 还 会 讨 论 。
② 事 实 上 ,如 果 两 个 条 件 均 成 立 , 总体平均因果效应、 干预组平均因果效应和控制组平均因果效应
三个因果效应参数完全一致。
第 五 章 线 牲回 归 71
量,
引人它们的目的是为了保证原因变量系数有因果效应的解释,
控制变量本
身 的 系 数 是 否 有 因 果 效 应 解 释 并 不 重 要 。 比 如 ,图 5. 2 有 两 条 后 门 路 径 。 当以
X 为条件后,
这两条后门路径均可以阻断,
从 而 在 回 归 分 析 中 引 入 控 制 变 量 X,
D 的 系 数 将 有 因 果 效 应 的 解 释 。但 X 的 系 数 并 不 是 X 对 y 的 因 果 影 响 ,因为
X 到 Y 存 在 混 杂 因 素 e 。对 于 我 们 关 心 的 因 果 问 题 而 言 ,
X 的系数是否有因果
效 应 解 释 并 不 重 要 ,重 要 的 是 引 入 X 之 后 ,
原因变量的回归系数将有因果效应
的解释。
图 5 . 2 原因变量和控制变量
2. 好 控 制 变 量 和 差 控 制 变 量
利用回归分析进行因果效应参数识别时,
应 该 如 何 选 择 控 制 变 量 呢 ? 或者
说什么样的变量才是好的控制变量,
什 么 样 的 变 量 是 差 的 控 制 变 量 ?根据第 四
章有羌选择偏差的讨论,
我们知道,
好的控制变量应该是发生在原因变量之前
或 取 值 不 随 原 因 变 量 变 化 的 变 量 ,即 好 的 控 制 变 量 是 潜 在 的 混 杂 因 素 。在 估 计
大学教育收益率时,
影 响 个 体 教 育 决 策 的 变 量 是 好 的 控 制 变 量 ,比 如 考 大 学 时
的 个 体 特 征 (不 随 教 育 决 策 变 化 的 性 别 、民 族 等 )、家 庭 背 景 (当 时 父 母 的 收 人 、
教 育 等 )、
学 习 成 绩 (高 中 学 习 成 绩 )、
地 域 等 。而 今 天 的 家 庭 背 景 等 信 息 不 是 好
的控制变量。
相应地,
可能受到原因变量影响的变量或发生在原因变量之后的变量不是
好 的 控 制 变 量 。仍 然 以 教 育 收 益 率 的 估 计 为 例 ,
个人职业和就业行业就不是好
的 控 制 变 量 。为 什 么 ? 因 为 个 人 职 业 及 就 业 行 业 往 往 是 教 育 完 成 之 后 个 人 选
择的结果,
也 就 是 说 ,这 些 变 量 发 生 在 教 育 之 后 ,可 能 受 到 教 育 的 影 响 。事实
上,
教育对职业选择有重要影响,
职业和行业往往存在着密切的联系,
这些变量
就 可 能 成 为 教 育 和 收 人 的 交 汇 变 量 ,以 交 汇 变 量 (
包 括 交 汇 变 量 的 子 孙 变 量 )为
条件,
将产生样本选择偏差。
72 基本有用的计量经济学
图 5.3 好坏控制变量
好 的 控 制 变 量 如 图 5,3(a)中 的 X , 控 制 X 可 以 消 除 后 门 路 径 D — X — Y 造
成的混杂偏差,
差 的 控 制 变 量 如 图 5. 3 ( b ) 中 的 C ,控 制 C 将 打 开 非 因 果 路 径
c —y ,
从而造成样本选择偏差。
3 . 回归分析的缺陷
回归分析的好处是它很容易实现,
多数计量经济学软件均可以用一条命令
自 动 完 成 回 归 分 析 。正 因 为 回 归 分 析 的 自 动 性 ,
可能使用者不知道软件估计出
的 回 归 系 数 代 表 什 么 ? 即 使 总 体 上 C I A 条 件 成 立 ,在 利 用 样 本 进 行 回 归 分 析
时 ,由 于 抽 样 的 随 机 性 ,
可能使某些变量根据X 进行分层后,
层内只有干预组或
控制组样本,
从 而 (5. 37)式 中 rA. 没 有 定 义 ,回 归 将 对 这 些 样 本 赋 于 0 的 权 重 ,
或者说,
软 件 会 自 动 丢 弃 那 些 层 内 只 有 一 组 个 体 的 样 本 ,而 使 用 者 往 往 对 此 一
无 所 知 。 即 使 满 足 C I A 或 C M I ,丢 弃 样 本 后 所 得 的 回 归 系 数 也 不 能 解 释 为 总
体因果效应。
下 一 章 将 介 绍 匹 配 方 法 。在 匹 配 方 法 中 ,
使 用 哪 些 样 本 、丢 弃 了 哪 些 样 本
都非常清晰,
从而得到的估计解释为哪些群体的因果效应也非常清楚,
这是匹
配方法优于回归分析的地方。
第三节回归方法的软件实现
本 节 主 要 介 绍 回 归 方 法 在 Stata软 件 中 的 实 现 。首 先 简 要 介 绍 使 用 的 数
据,
然后介绍回归命令,
最后用回归方法估计中国城镇居民教育收益率。
1 . 数据
本 节 使 用 的 数 据 来 自 于 中 国 居 民 收 人 调 查 项 目 (C H I P ) 2 0 0 2 年 的 城 镇 样
本,
对 应 数 据 集 为 chip2002.dta 。主 要 变 量 包 括 个 人 年 收 入 、
年龄、
性别、
教育程
度、
工作年限、
所在城市、
就 业 行 业 等 基 本 信 息 。变 量 描 述 如 下 :
第 五 章线性 回归 73
. des
Contains data from chip2002. dta
obs : 9260
vars: 14 4 Dec 2016 1 1 ;
49
444480
2. S ta t a 软件中的回归 命令
Stata软 件 的 回 归 命 令 为 regress,基 本 语 法 和 选 项 如 下 :
options Description
Model
noconstant suppress constant term
SE/Robust
vce(vcetype) vcetype may be o l s , robust,cluster clustvar, bootstrap,
jackknife, h c 2 f or hc3
Reporting
level( 掉) set confidence level ;default is level(95)
Stata中 回 归 实 现 非 常 简 单 ,
直 接 利 用 命 令 regress即 可 进 行 回 归 分 析 。必
选 项 depvar为 被 解 释 变 量 ,
可 选 项 indepvars是 解 释 变 量 列 表 ,
可以加也可以不
加,
if可 以 加 条 件 ,
in可 以 设 定 观 测 值 范 围 ,
weig h t 可 以 施 加 权 重 ,
选 项 nocon-
stant估 计 不 带 常 数 项 的 模 型 ,
选 项 vCe(vCetyPe)可 以 选 择 标 准 误 差 的 形 式 ,
默
74 基本有用的计量经济学
认 选 项 ols为 同 方 差 的 标 准 误 差 ,
其 他 类 型 包 括 稳 健 标 准 误 差 robust,
聚类 标 准
误 差 cluster clustvar,自 抽 样 标 准 误 差 bootstrap,刀 切 标 准 误 差 jackknife等 ,
详
细 可 以 参 考 regress的 帮 助 文 件 。选 项 level改 变 置 信 水 平 。 下 面 利 用 C H I P
数 据 估 计 基 本 的 Minc e r 方 程 ,
结果如下:
输出结果包括两部分,
右上角显示样本数、
F 检验值及其p 值 、
拟合优度和
均 方 误 差 标 准 差 。第 二 部 分 显 示 回 归 结 果 ,包 括 各 解 释 变 量 系 数 、标 准 误 差 ^
统计量、
> 值 和 系 数 的 置 信 区 间 等 信 息 。如 果 上 述 模 型 满 足 C I A 条 件 ,
教育的
系 数 就 是 教 育 对 收 入 的 因 果 影 响 ,结 果 显 示 ,教 育 增 加 一 年 ,对 数 收 人 会 增 加
0 .087,
或 者 教 育 收 益 率 约 为 8.7% 。
表 5 . 1 用回归方法估计教育收益率
Cl) ⑵ . C3) (4 )
OLS OLS OLS OLS
educ 0 .0 8 7 3 *** 0.08 23 "** 0 .0 6 1 8 *** 0 .0618**'
(0.0027) CO.0026) (0.0026) (0.0041)
exper 0. 0 3 7 3 “ * 0. 0427*** 0. 0423*,, 0.0423*“
(0.0032) ( 0 .0 0 3 1 ) (0.0030) (0.0040)
expersq -0 .0 0 0 4 “ * - 0 .0 0 0 6 “ * -0 .0 0 0 7 *“ - 0 . 0007“ *
(0.0001) (0.0001) (0.0001) (0.0001)
male 0. 1938'** 0. 1802*** 0. 1802 ***
(0. 0141). (0.0137) (0.0222)
第 五 章 线 性 回 e 75
■----- 1
(续 表 )
(1) (2) (3 ) (4 )
OLS OLS OLS OLS
industry No NO Yes Ye s
我 们 估 计 4 个 模 型 。第 1 个 模 型 是 基 本 的 M i n Cer方 程 ,
解释变量只包括
教育年限、
工 作 经 验 及 工 作 经 验 平 方 。第 2 个 模 型 在 第 1 个 模 型 基 础 上 再 控 制
性 别 和 所 在 城 市 。第 3 个 模 型 在 第 2 个 模 型 基 础 上 进 一 步 控 制 行 业 。第 4 个
模 型与第3 个模型相同,
但 采 用 聚 类 到 城 市 的 标 准 误 ,而 前 三 个 模 型 均 采 用 稳
健 标 准 误 差 。估 计 结 果 见 表 5 .1,
其 中 city表 示 是 否 控 制 城 市 固 定 效 应 ,
indus
try 表 示 是 否 控 制 行 业 。第 1 列 显 示 估 计 的 教 育 收 益 率 为 8 . 7 % 。第 2 列 估 计
的 教 育 收 益 率 为 8 . 2 % 。第 3 列 估 计 的 教 育 收 益 率 为 6.2% 。前 三 列 均 使 用 选
项 vCe(robUSt)报 告 稳 健 标 准 误 差 。第 4 列 采 用 了 与 第 3 列 一 样 的 模 型 设 定 ,
但
采 用 聚 类 到 城 市 的 稳 健 标 准 误 差 vceUkister city),
教育收益率估计没有变化,
标准误差估计有所不 同 。
第四节总 结
总 体 回 归 函 数 和 条 件 期 望 函 数 有 着 密 切 的 联 系 。如 果 条 件 期 望 函 数 是 线
性的,
两 者 完 全 一 致 (定 理 5. 1)。如 果 条 件 期 望 是 非 线 性 的 ,回 归 函 数 是 对 条 件
期 望 函 数 (均 方 误 最 小 意 义 上 )的 最 优 线 性 近 似 (定 理 5. 2 )。如 果 条 件 期 望 函 数
有 因 果 效 应 的 解 释 ,回 归 函 数 就 有 因 果 效 应 的 解 释 。如 果 满 足 条 件 独 立 性 假 设
或 条 件 均 值 独 立 性 假 设 ,回 归 系 数 可 以 解 释 为 总 体 的 平 均 因 果 效 应 。在 回 归 分
析中,
引 入 控 制 变 量 的 目 的 就 是 希 望 能 够 使 条 件 (均 值 )独 立 性 假 设 成 立 。
輯 ,推 荐 阅 读
确模型设定进行了详细讨论 。
全 期 望 公 式 (5 . 2 ) 的一个证明。
E L Y ; 丨X,] - E I E [ Y ; I X,,Z J | X ;]
证 明 假 设 Y 、Z 为离散型随机变量,
E [ E [ Y | X = x , Z ] | X = x]
二 ^ j E [ Y iX = = zj • Pr[Z = z | X = x]
— H :
V * P r[Y = = = Pr[Z — z \ X ~ x']
~ y
二 2 》Pr[Y = ^ i x =- ^]
= ElY | X = .r]
在这一章,
我们将讨论另一种流行的方法,
这种方法的使用前提也是要求
条 件 独 立 性 假 设 ( C I A ) 或 条 件 均 值 独 立 性 假 设 (C M I ) 成 立 。 因 而 ,
无论是回归
方法还是匹配方法,
如果要使其估计量有因果效应的解释,
必须要满足C I A 或
C M 1 。事 实 上 ,回 归 也 是 一 种 匹 配 ,
在后文中会具体讨论两者的关系。
第一节协变量匹配方法
1. 协变量匹配
在 估 计 因 果 效 应 的 时 候 ,我 们 面 临 着 因 果 推 断 的 基 本 问 题 (Holland,
1986) ,
只 能 观 察 到 一 种 干 预 状 态 下 的 结 果 ,无 法 观 察 到 其 他 干 预 状 态 下 的 结
果 。匹 配 方 法 的 基 本 思 想 就 是 对 于 干 预 组 个 体 ,
在控制组中寻找特征相似的控
制组个体与其相匹配,
从而用控制组个体的结果来估计干预组个体的反事实结
果 。回 顾 因 果 效 应 参 数 A T T :
rATT = E \ Y U —Yoi I Di = 1]
= E [ Y U | D, = 1] 一 E [ y 0,- I A. = 1] (6. 1)
第一项是干预组1 的期望值,
在数据中是可观测的,
第二项是干预组的期
望 值 ,在 数 据 中 是 观 测 不 到 的 ,
是反事实结果。
在 完 全 随 机 化 实 验 中 ,由 于 干 预 是 随 机 化 分 配 的 ,
有 |D ;= l] = E [ Y 0l.
IA . = 0 ] , 可 以 直 接 用 控 制 组 的 观 测 结 果 £[Y,. ID,. = 0]来 作 为 干 预 组 反 事 实 结
果 = 的估计,
从 而 可 以 估 计 出 A T T 。在 分 层 随 机 化 实 验 中 ,
在层内
为 完 全 随 机 化 实 验 ’ 满 足 C I A 条 件 ,即 ( Y 0l , y 1;)JL D ;IX ;,则 有 E [ y 0,-1 X,-,D i=
i ] = £ [ y w U,.,
A = o ] ,即 在 相 同 的 足 层 内 ,干 预 组 的 反 事 实 结 果 E [ y 0,-1x,,
D,. = l]可 以 用 控 制 组 的 观 测 结 果 E [ m . ,
D , = 0 ] 来 进 行 估 计 。干 预 组 的 反 事
实 结 果 E [ Y 0l IDi = 1]很 谷 易 估 计 ,即
E [ Y oi |D ;二 1 ] = E { E L Y oi | X i,Di = 1] 丨 D; = 1}
= E { £ [ Y 0i- I X t,D, = 0] 1 D ; = 1}
= E{E[Y, | X , ,
D ‘= 0] | D, = 1}
在观测研究中,
如 果 条 件 独 立 性 假 设 (C I A ) 成 立 ,
即
78 基本有用的计量经济学
其中,
rx = E l Y t | X,-,
A = 1 ] - £:
[Y, | X , , D f - 0] (6.6)
r x 是 相 同 协 变 量 X,.层 内 两 组 结 果 平 均 值 之 差 。 (6. 4 ) 和 (6. 5)说 明 如 果 C I A
满足,
根 据 观 测 特 征 X ;进 行 匹 配 ,
从 控 制 组 中 找 到 相 同 特 征 的 控 制 组 个 体 ,匹
配后,
利 用 具 有 相 同 特 征 的 控 制 组 结 果 作 为 干 预 组 反 事 实 结 果 的 估 计 ,即 (6.
4 ) 。匹 配 样 本 因 果 效 应 的 估 计 体 现 在 (6. 5 ) 和 (6. 6 ) 。 (6. 5) 式 显 示 ,
根据协变
量匹配后,
层 内 平 均 因 果 效 应 为 rx ,
则干预组平均因果效应是利用协变量在干
预 组 中 的 分 布 Pi"[X=a:
丨1),.= 1]对 ^ 进 行 加 权 得 到 ,
相应的样本形式即干预组
平 均 因 果 效 应 的 匹 配 估 计 量 fATT。如 果 X , 为 离 散 变 量 ,
则
rATT = E I tx I D, = 1] = ^ IU = 1] (6. 7)
J
事实上,
不同的因果效应参数,
对 应 于 对 的 不 同 加 权 ,比 如 总 体 平 均 因
果 效 应 A T T ,则 相 应 的 匹 配 测 度 为 :
(6. 7 ) 和 (
6. 8 ) 显 示 ,所 有 的 匹 配 估 计 量 都 依 赖 rx ,而 rx 是 具 有 相 同 特 征
X , 的干预组和控制组观测结果平均值之差。因 而 ,
要 估 计 出 rx ,
就要求总体上
特 征 为 X , 的个体在干预组和控制组都有个体存在,
否则,
仅有一组个体,
rx 将
没有定义,
相应的匹配估计测度也没有定义。因 而 ,
为了保证能够实施匹配,
还
需要另一个条件:
共 同 区 间 要 求 (c o m m o n support) ,
用公式表示为:
0 < Pr[E»,- - 1 i X ;] < 1 (6.9)
Pr[D,. = l 丨
X f]实 际 上 是 倾 向 指 数 (propensity score),
反 映 的 是 具 有 特 征 X /的
通 常 简 记 为 p C X O 。 (6. 9)表 示 ,
个 体 接 受 干 预 的 可 能 性 ,因 为 它 是 X,.的 函 数 ,
根 据 观 测 变 量 X,.分 层 后 ,
层内均有干预组和控制组两组个体,
从 而 保 证 tx 有
定义,
可以利用匹配方法估计相关因果效应参数。
因而,
在 使 用 匹 配 方 法 估 计 总 体 平 均 因 果 效 应 (A T E ) 时 ,
需 要 满 足 (6. 2 )和
(6. 9 ) 两 个 条 件 。 当 然 ,如 果 关 心 的 因 果 效 应 参 数 是 干 预 组 平 均 因 果 效 应
(ATT),上述两个条件都可以放松一些,
只需要基线潜在结果满足条件独立性
假设,
并 且 只 需 要 倾 向 指 数 小 于 1 ,即
y 0, X D , - | X,- (6.10)
和 Pr[D,. = 1 | X,] < 1 (6.11)
事实上,
为 了 识 别 干 预 组 平 均 因 果 效 应 ,只 需 要 满 足 条 件 (6. 10)甚 至 更 弱
的 条 件 (6. 4 ) 。在 匹 配 时 ,
可以允许相同特征的控制组个体没有对应的干预组
个 体 ,即 P r[ D ,.二 11足 ] = 0 ,
但 相 同 特 征 的 干 预 组 个 体 ,总 是 能 找 到 相 应 的 控 制
组 个 体 相 匹 配 ,即 P i A - l U J C l 。®
2 . 匹配与回归
匹 配 方 法 和 回 归 方 法 要 识 别 因 果 效 应 参 数 都 要 求 C I A 条 件 成 立 ,这 不 奇
怪,
事 实 上 ,回 归 方 法 也 是 一 种 匹 配 方 法 。在 上 一 章 ,我 们 推 得 的 回 归 系 数
(5. 37)复 制 到 这 里 ,g卩
r°
's = e [ e I v ^ w ! \ x ;)]r x ] (6,12)
可以看出,
总 体 回 归 系 数 也 是 对 tx 的 加 权 ,与 上 文 的 匹 配 估 计 测 度 (6. 7 ) 和
(6. 8)相 似 ,只 是 加 权 的 权 重 有 所 不 同 。
Var(D,- | 兄 )= p ( X , ) ( l - p ( X ;))
其 中 ,/>(兄 )= ^ 1 :
[以 = 1 1 足.],
总体回归系数可以写成:
© 同 样 地 ,如 果 只 关 心 控 制 组 平 均 因 果 效 应 A T C ,那 么 识 别 条 件 只 需 要 或 fTCYwl
X.’
D e U - E T Y h . l U e O ]和 P r [ D , = l U , ] > 0 。
80 基本有用的计量经济学
因 而 ,回 归 系 数 是 条 件 方 差 加 权 的 ,
相应地,
A T T 的匹配测度为:
^att = y ^ r^ P rC X ;= x 丨Di = 1]
■r
— PrEA. = 1 | X/ = x]Fr[X/ = x]
^ ^ ) P r [ D / = 1 丨足= xJPr^Xi = x^\
,r
▽^厂 p(a:
)Pr[X, = .r] A
(6. U )
第二节倾向指数匹配方法
要 实 施 匹 配 方 法 ,除 满 足 条 件 独 立 性 假 设 外 ,还 需 要 满 足 共 同 区 间 要 求 。
即使总体上满足共同区间条件,
但由于抽样的随机性,
也有可能使我们拿到的
第 六章 匹 配 方 法 81
样 本 出 现 根 据 X,.分 层 后 ,
层 内 只 有 一 组 个 体 的 情 况 。另 外 ,当 观 测 变 量 很 多 ,即
X,是高维度向量,
根 据 X,.分 层 时 ,
也可能出现层内仅有一组个体的情形。比
如,
一 个 调 查 数 据 中 有 1 7 个 协 变 量 ,即 使 每 个 变 量 只 取 两 个 值 ,根 据 这 1 7 个变
量进行分层,
共 有 217 = 1 3 1 0 7 2 个 层 ,
如果样本容量仅有几千个点,
那么根据协
变量匹配时,
肯 定 出 现 很 多 层 内 没 有 数 据 或 仅 有 一 组 数 据 的 情 形 。上 述 两 种 情
况 都 会 使 得 rAi 有 定 义 ,
从 而 无 法 计 算 因 果 效 应 参 数 。为 了 解 决 这 一 “维 度 诅
咒 ”问 题 ,
Ro s e n b a u m and Rubin (1983)提 出 了 倾 向 指 数 匹 配 方 法 ,
使根据观测
变 量 X i 进行匹配转向对一维的倾向指数进行匹配。
定 义 1(倾 向 指 数 ) 倾 向 指 数 定 义 为 :
p ( X O = E l D t I X ;J = P r [ D t - 1 | X,] (6, 15)
上文已经提到,
倾向指数反映的是具有特征兄的个体接受干预的可能性,
实际
上 是 个 体 的 干 预 分 配 概 率 。在 随 机 化 实 验 中 ,这 一 概 率 是 由 实 施 实 验 者 控 制
的,
而在观测研究中,
倾向指数往往是未知的,
需要进行估计。
定 义 6, 2 ( 平 衡 指 数 ) 函 数 6(_r)是 一 个 平 衡 指 数 ,
如 果 满 足 D,. JLX, I
MX,).
平 衡 指 数 可 以 使 两 组 协 变 量 平 衡 ,即 以 平 衡 指 数 为 条 件 ,
干预组和控制组
协 变 量 分 布 相 同 。平 衡 指 数 不 是 唯 一 的 ,比 如 X , 本 身 就 是 平 衡 指 数 ,
事实上,
X,-的 函 数 都 是 平 衡 指 数 ,
而我们更关心低维度的平衡指数,
倾向指数就是一个
平 衡 指 数 ,并 且 是 一 维 的 。
引 理 6.1(倾 向 指 数 的 平 衡 指 数 特 征 } 倾 向 指 数 是 一 个 平 衡 指 数 ,即 D, JL
X,|p(X,)0
证 明 要证明 D,. JLX ,.|> ( X ,.) ,
等价于证明 P r [ D f= 1 丨兄,
/>(X , )] = Pr[D,.
= 1 1/)(X;
)]o 左 边 为 :
/;(兄.)]二 E [ D ;| X,-] =
Pr[D,- = 1 | X (^(X,-)] = £ [D,-丨兄,
(6. 16)
其中,
第二个等号利用条件期望性质耵y U ,
g(;
G]=£:
[ Y U ],
最后的等号利
用 倾 向 指 数 的 定 义 。右 边 为 .*
Pr[D,. = 1 | ^ ( X , ) ] = E [ D ; | p(X,)l = E[E[D,- | | ^(X,)]
= E l p ( X ;) | ^CX,)] = p i X )
第 二 个 等 号 利 用 全 期 望 公 式 (5. 2 ) ,
第 三 个 等 号 利 用 (6. 16)的 结 果 ,
从而两边相
等,
命题得证。
平衡指数特征是倾向指数本身的特征,
并不是假设,
也不是条件独立性假
82 基本有用的计量经济学
设 的 结 果 。在 倾 向 指 数 估 计 中 ,
可 以 用 来 检 验 倾 向 指 数 模 型 是 否 充 分 (adequa
cy) 。 如 果 估 计 的 倾 向 指 数 没 有 问 题 ,
那么它应该满足平衡指数特征,
相 反 ,如
果发现不满足平衡指数特征,
说明倾向指数模型可能存在问题,
需要修正。
倾向指数的另一个重要特征是,
如 果 分 配 机 制 满 足 (相 对 于 X,.)非 混 杂 性 ,
那么,
它也是相对于倾向指数非混杂的,
这正是倾向指数定理的基本内容。
证 明 要 证 明 (Y Di,Y U J L D; 丨
p ( X i ) ,等 价 于 证 明 化 [ 以 = 1 丨Y 0i, Y 1;
,
p C X i G - P / f D i - l l p C X i )]。
Pr[D,- = 1 | U p d . ) ] = E [ D ; | Y 0;,Y u ,p(X,)J
= E i E W , 丨Y 0,-,YH ,
;Cf,
/p(X,.)] | Y o m Y h ^ C X , ) }
- E { E [ D i | X.-^CX,-)] | Y,i,Yy,,p{Xi))
= E { E [ D , | ^(X,)] | Y 0itY iltp ( X ;)}
= E [ D ;| j!>(X,)] = P r [ D ;== 1 | jt'CX,)]
第 二 行 利 用 全 期 望 公 式 (5. 2 ) ,第 三 行 利 用 C Z A 条 件 ,
E[D,. I = ElDi |X n p ( X ^
第四行利用倾向指数是平衡指数的特征,
有
E L D ; | X , . ^ ( X , . ) ] ^ E [ D ; 丨AX,.)]
倾向指数定理6.1告诉我们,
如果以观测变量Xi为条件,
分配机制类似于
随机化实验,
那 么 ,以 倾 向 指 数 p(Xi)为 条 件 ,
分配机制也近似于随机化实验,
因而,
可以根据倾向指数进行匹配,
总体平均因果效应的倾向指数匹配估计测
度可以写成:
d E [ y lt. - y 0f] = E { E [ n , . | p ( x ;^ }
= E { E l Y u I / . ( X . O D - E C Y o , - | 夕(X - ) ] } ■
= E { E [ Y U I p ( X i),Di = l ] - E [ Y 0i | p ( X i),Di = 0]}
- E{E[Y,. | ^ ( X , ) , D ;- l ] ~ E [ y f | 》(X,.),
D,. = 0 ]}
= £[rj (6.17)
第 二 行 利 用 全 期 望 公 式 (5.1),
第四行利用倾向指数定理,
其 中 T p 是相同倾向指
数的两组个体观测结果之差,
定义为:
rp — E[Yi | p(Xi) — p,Di = 1] — E[Yj | p{X,) ^ p , D ;= 0] (6. 18)
类似地,
干预组平均因果效应的倾向指数匹配估计测度为:
rAT7 — E\^zp 丨£),. = 1] (6. 19)
在观测研究中,
倾 向 指 数 匹 配 包 含 两 个 步 骤 :第 一 步 ,估 计 倾 向 指 数 ;
第二
第 六 章 匹 配 方 法 83
步,
根 据 估 计 的 倾 向 指 数 进 行 匹 配 。具 体 实 施 方 法 下 一 节 介 绍 。
第三节匹配方法的基本步骤
上文讨论了匹配方法的基本思想,
推出了协变量匹配测度和倾向指数匹配
测 度 。下 面 ,
我们转向样本视角,
讨 论 匹 配 方 法 的 实 施 步 骤 。匹 配 方 法 可 以 分
成 四 个 基 本 的 步 骤 :定 义 相 似 性 、实 施 匹 配 、
评价匹配样本的匹配效果、
估 计因
果 效 应 (Stuart, 2010)。前 两 个 步 骤 可 能 需 要 重 复 多 次 ,
直至达到较好的匹配
效 果 。前 三 个 步 骤 通 常 称 为 “设 计 ”阶 段 ,
在前三个步骤中,
不涉及结果变量,
就
像 在 真 正 的 随 机 化 实 验 中 一 样 。在 进 行 实 验 设 计 时 ,
研究者还没有看到结果,
在观测研究中,
观测结果往往已经存在于数据中,
但为了保证设计的科学性,
避
免研究者有意或无意的主观性— 根据结果选择模型或样本,
在 “设 计 ”阶段是
不需要观测结果的,
这 也 是 实 证 研 究 “科 学 性 ”和 “可 信 性 ”的 关 键 。 当“设 计 ”阶
段完成之后,
获得满意的匹配样本,
再 引 人 结 果 变 量 进 行 因 果 效 应 估 计 。下面
分别就这四个阶段进行讨论。 .
1. 定义相似性
匹配方法是为每个干预组个体寻找特征相似的控制组个体进行匹配或者
为 每 个 控 制 组 个 体 寻 找 特 征 相 似 的 干 预 组 个 体 进 行 匹 配 ,因 而 ,如 何 定 义 相 似
性 是 匹 配 方 法 实 施 的 基 础 。定 义 相 似 性 阶 段 包 含 两 个 层 面 的 工 作 :
第一,
应该
选择哪些变量作为定义相似性的依据;
第二,
如何将这些变量形成一个相似性
的测度。
首先,
考 察 应 该 选 择 哪 些 变 量 作 为 定 义 相 似 性 的 依 据 。选 择 变 量 的 主 要 依
据是条件独立性假设,
C I A 说 明 一 旦 控 制 了 协 变 量 ,干 预 组 和 控 制 组 个 体 没 有
未 观 测 差 异 。因 而 ,同 时 影 响 干 预 变 量 和 结 果 变 量 的 混 杂 因 素 都 应 作 为 协 变 量
作 为 匹 配 依 据 。在 倾 向 指 数 匹 配 中 ,
如果引入与干预变量没有关系的变量不会
有太大影响,
它 们 对 倾 向 指 数 模 型 没 有 影 响 ,当 这 些 变 量 是 影 响 结 果 变 量 的 重
要因素时,
引 人 它 们 可 以 提 高 估 计 精 度 。如 果 引 人 与 结 果 变 量 没 有 关 系 的 变 量
会 稍 微 增 加 估 计 标 准 误 差 。如 果 遗 漏 重 要 的 混 杂 因 素 将 会 造 成 显 著 的 偏 差 。
因而,
对结果变量有重要影响的协变量,
无论是否与干预变量有关系,
均可以引
84 基本有用的计量经济学
人 协 变 量 作 为 匹 配 的 依 据 。®
其次,
定义相似性需要一个测度,
一般应用中通常可以采用欧氏距离或马
氏 距 离 (Mahalanobis metric)。欧 氏 距 离 定 义 为 :
diX^Xj) =
V k^\
其中,
协 变 量 ,
石 ,
…, 是 K X 1 维的向量, 为了消除不同协变量量
纲的差异,
也可以采用标准化的欧氏距离,
定义为:
diX^Xj) = ^ { X . - X jY A - H X ^ X j )
其中A 是一个K X K 维的对角矩阵,
对 角 元 素 是 协 变 量 的 方 差 4 ,々= 1 ,… ,
K a 因而,
标准化欧氏距离也可以写成:
标 准 化 欧 氏 距 离 的 好 处 是 消 除 了 量 纲 的 影 响 ,比 如 协 变 量 中 包 括 年 龄 和 收 人 ,
一个干预组个体与一个控制组个体年龄相差1 岁 ,
收 人 相 差 1000元 ,
与另一 个
控制组个体年龄相差5 岁 ,
收人相差100元 ,
那么,
这两个控制组个体哪一个与
干 预 组 个 体 更 相 似 呢 ?如 果 直 接 用 欧 氏 距 离 进 行 测 度 ,
第 一 个 距 离 约 为 1000,
第 二 个 距 离 约 为 10 0 ,
因而,
第 二 个 控 制 组 个 体 与 干 预 组 个 体 更 相 似 Q 如果将 收
入的计量单位改为千元,
这时,
再计算欧氏距离,
第 一 个 距 离 约 为 1.4,
第二个 距
离约为5,
结 果 会 是 第 一 个 个 体 与 干 预 组 个 体 更 相 似 。因 而 ,
协变量计量单位不
同,
找 到 的 匹 配 对 象 将 发 生 显 著 变 化 。但 是 标 准 化 的 欧 氏 距 离 不 会 出 现 这 一 问
题 ,因 为 当 计 量 单 位 变 化 时 ,
标准差的单位也发生了相应变化,
两者的比值是不
会 变 化 的 。因 而 ,
在匹配方法实施中,
利用标准化欧氏距离更合适。
马氏距离与标准化欧氏距离类似,
也是一种消除量纲差异的距离测度,
它
进 一 步 考 虑 了 不 同 协 变 量 之 间 的 相 关 性 。马 氏 距 离 定 义 为 :
d C X ^ X j ) = V ( X i- X jy2-xl( X i~ X J) (6.21)
其中, 是 协 变 量 X 的 方 差 协 方 差 矩 阵 。一 般 而 言 ,
如果估计的因果效应参数
是 A T T ,厶 是 控 制 组 协 变 量 的 方 差 协 方 差 矩 阵 ;如 果 估 计 的 是 A T E ,_SX 是所
有 协 变 量 的 方 差 协 方 差 矩 阵 (Stuart, 2010) 。
在倾向指数匹配中,
仍然可以采用标准化欧氏距离或马氏距离,
可以直接
利 用 倾 向 指 数 定 义 相 似 性 ,即 4 ( A )),
但应用中往往采用线性化倾向
指 数 。线 性 化 倾 向 指 数 即 对 数 或 然 比 (log odds ratio),定 义 为 :
li = (6.22)
倾向指数本身是协变量的非线性函数,
根据倾向指数进行匹配,
倾向指数
距离相同,
但 协 变 量 距 离 将 不 相 同 。 比 如 ,在 倾 向 指 数 为 0. 3 的 位 置 和 倾 向 指
数 为 ◦. 7 的 位 置 变 化 ◦. 1 ,
相 对 应 的 协 变 量 的 变 化 后 者 将 更 大 。因 而 ,
倾向指数
意义上的相似并不能完全反映协变量意义上的相似,
而线性化的倾向指数会使
两 者 一 致 。在 倾 向 指 数 估 计 中 ,
通 常 使 用 logit模 型 ,
logit模 型 有 一 个 特 征 ,
就
是 对 数 或 然 比 是 协 变 量 的 线 性 函 数 。logit模 型 如 下 :
^ ln〔
r ^ y > 0 ( 6 ’2 4 )
因而,
线 性 化 倾 向 指 数 定 义 的 相 似 性 与 根 据 协 变 量 定 义 的 相 似 性 是 一 致 的 。在
利用倾向指数匹配方法时,
更 为 合 适 的 相 似 性 测 度 是 七 /,,
/;),
^/( • ) 为 欧 氏 距
离或马氏距离。
在定义相似性时,
上 述 几 种 测 度 可 以 结 合 起 来 使 用 。对 于 协 变 量 中 的 离 散
变量,
可以进行精确匹配,
使 距 离 完 全 为 零 定 义 为 相 似 性 。对 于 连 续 变 量 ,
需要
进 行 不 精 确 匹 配 ,比 如 根 据 (线 性 化 的 )倾 向 指 数 进 行 匹 配 ,为 了 保 证 不 精 确 匹
配的匹配效果,
可 以 根 据 倾 向 指 数 设 定 卡 尺 (caliper),将 相 似 性 定 义 在 一 定 的
卡尺范围内。比如,
有卡尺的马氏距离匹配将距离定义为:
似 ,
幻 = p — 如 果 机 (6 25)
其 中 C 是 卡 尺 。上 述 距 离 定 义 说 明 ,只 有 当 在 卡 尺 范 围 内 时 才 有 可 能 相 似 ,在
卡尺范围之外,
将 不 可 能 是 相 似 的 。R o s e n b a u m and Rubin (1985)建 议 利 用 线
性 化 倾 向 指 数 标 准 差 的 0 , 2 5 倍作为卡尺
关 于 倾 向 指 数 模 型 的 估 计 ,目 的 不 是 协 变 量 对 干 预 的 因 果 效 应 ,
而是保证
倾 向 指 数 满 足 平 衡 指 数 特 征 。lmbens and Rubin (2015)提 出 了 一 种 估 计 倾 向
指数模型的方法,
它包括下面几个步骤:
第一步,
根据经济理论或直觉构造一个
基本的倾向指数模型。比如,
考 察 大 学 教 育 对 个 人 收 人 的 影 响 ,基 本 的 倾 向 指
数 模 型 可 以 包 括 影 响 个 体 教 育 决 定 的 因 素 ,如 在 1 8 岁 左 右 考 大 学 时 的 个 人 特
86 基本有用的计量经济学
征、
高中学业成绩、
家 庭 背 景 等 信 息 可 能 需 要 进 人 倾 向 指 数 模 型 。利 用 logit模
型估计基本模型,
得到拟合的倾向指数,
检验基本模型是否满足平衡指数特征
(引 理 6.1)。如 果 不 满 足 ,
进人第二步,
如果满足,
则 停 止 。第 二 步 ,
如果发现估
计的倾向指数不满足平衡指数特征,
说明倾向指数模型不充分,
需要对倾向指
数 模 型 进 行 修 正 。如 果 还 有 其 他 协 变 量 没 有 引 人 模 型 ,则 通 过 逐 步 回 归 的 方
式,
再逐渐引人其他的协变量,
利 用 似 然 比 检 验 ,临 界 值 为 1 ,
超 过 1 的引人模
型,
否 则 不 引 入 。引 入 完 成 后 ,
再返回第一步重新估计倾向指数并进行平衡指
数检验,
若通过则完成,
若不通过,
返回第二步,
继续修改模型,
引人协变量二次
项 和 交 叉 项 ,仍 然 利 用 似 然 比 检 验 ,
临 界 值 调 整 为 2. 71 。经 过 一 、二 步 多 次 重 复
直 到 估 计 的 倾 向 指 数 满 足 平 衡 指 数 特 征 为 止 。研 究 发 现 ,
在倾向指数匹配中,
倾 向 指 数 模 型 误 设 (比 如 ,
真 实 模 型 有 二 次 项 而 在 估 计 中 没 有 引 人 二 次 项 )对因
果效应估计影响不大,
但 是 结 果 模 型 误 设 会 对 因 果 效 应 估 计 造 成 很 大 偏 差 (D e
hejia and W a h b a , 1999 ;赵 西 亮 ,
2015) 。
2 . 匹配实施方法
一旦定义如何测度相似性,
就 可 以 根 据 定 义 的 距 离 实 施 匹 配 了 。具 体 实 施
有很多方法,
常用的方法包括两种,
第一种是近邻匹配,
第二种是分层匹配。
(1) 近邻匹配
近邻匹配是一种常见的容易实施的匹配方法,
包括一对一最近邻匹配和一
对 多 近 邻 匹 配 。一 对 一 最 近 邻 匹 配 是 指 为 每 一 个 干 预 组 个 体 在 控 制 组 中 寻 找
一个距离最近的控制组个体与其匹配,
相应地,
一对多近邻匹配就是为每个干
预 组 个 体 在 控 制 组 寻 找 多 个 个 体 与 其 匹 配 。两 者 相 比 较 ,
一对一最近邻匹配,
最终的匹配样本比较少,
估计方差较大,
但每个干预组个体寻找到的都是最近
的 ,因 而 ,
偏 差 比 较 小 D 相 反 ,一 对 多 近 邻 匹 配 ,由 于 寻 找 的 匹 配 比 较 多 ,匹配样
本容量比较大,
估计精度提高,
但由于一对多近邻匹配中,
与干预组个体相匹配
的第二个、
第三个等后面的控制组个体与干预组个体的相似性下降,
从而估计
偏 差 会 增 加 。因 而 ,
在选择匹配方法的时候面临着估计方差和估计偏差的权
衡 。一 般 而 言 ,
一对一最近邻匹配会得到比较好的匹配样本,
如果控制组样本
数量很多时,
可 以 考 虑 一 对 多 近 邻 匹 配 。利 用 近 邻 匹 配 方 法 得 到 的 与 干 预 组 个
体 i相 匹配的控制组样本集M + , 定 义 为 :
M jU、= {j | d i X ^ X j X d i X ^ X j ^ ) )
或 M 仲 = {j I d C l ^ l j X d a ^ l j c o ) } (6.26)
其 中 D,. = l ,
D,=0,
X,(i)、
/ # 表 示 与 干 预 个 体 i相匹配的控制组个体的特征或
第 六 章 匹 配 方 法 87
线 性 化 倾 向 指 数 。如 果 是 最 近 邻 匹 配 ,M # 只 有 一 个 元 素 ,
若 是 一 对 6 近邻匹
配,
]^.(,.)有 々 个 元 素 。
在 实 施 一 对 一 最 近 邻 匹 配 的 时 候 ,由 于 为 每 个 干 预 组 个 体 寻 找 一 个 距 离 最
近的控制组个体相匹配,
在 匹 配 时 可 能 遇 到 两 个 问 题 :第 一 ,
如果出现距离相同
的 多 个 控 制 组 个 体 时 如 何 处 理 。一 种 方 法 是 随 机 地 选 择 一 个 作 为 匹 配 。另一
种方法是根据排序,
在 前 面 的 首 先 匹 配 ,这 样 最 终 的 匹 配 样 本 将 与 控 制 组 个 体
出 现 的 顺 序 有 密 切 关 系 ,比 如 Dehejia and W a h b a ( 1 9 9 9 )建 议 将 倾 向 指 数 由 高
到低排序,
先匹配倾向指数最高的也是最难匹配的,
再 匹 配 倾 向 指 数 低 的 。第
三种方法是利用距离相同的多个控制组个体的平均值作为干预组个体的四配。
第二个问题是当控制组与干预组特征差异较大时,
一对一最近邻匹配总是要在
控制组中找一个距离最近的与干预组个体匹配,
可能出现匹配上的个体实际上
特征差异比较大,
从 而 估 计 偏 差 较 大 。这 种 情 况 下 ,
可以通过设定卡尺的方式
避免,
在进行一对一对最近邻匹配时,
可以事先设定卡尺,
在卡尺范围内寻找与
干 预 组 个 体 距 离 最 近 的 控 制 组 个 体 相 匹 配 。在 设 定 卡 尺 情 况 下 会 出 现 有 些 干
预组个体在卡尺范围内找不到匹配的情况,
尤其是当干预组和控制组特征差异
较大时,
这样最终得到的匹配样本中,
可 能 会 丢 弃 部 分 干 预 组 个 体 。利 用 这 一
匹配样本得到的因果效应就不能解释成原样本的干预组平均因果效应,
在诠释
估 计 结 果 的 时 候 需 要 注 意 。带 卡 尺 的 近 邻 匹 配 ,得 到 的 匹 配 控 制 集 可 以 表
示为:
M jU) - {j | d i X ^ X - ) diX^Xj) < c }
或 = {j j dili,Ij) ^ d (l;^Lja)) , d(L;
,Lj) ^ c}
其中, 为设定的卡尺。
另 一 个 相 关 的 问 题 是 控 制 组 个 体 是 否 可 以 重 复 匹 配 。允 许 重 复 使 用 往 往
可以降低偏差,
如果某些控制组个体被重复匹配,
说明相对于不能重复匹配,
这
些 个 体 与 某 些 干 预 组 个 体 距 离 更 近 ,因 而 ,
重复使用控制组个体会降低匹配偏
差 。当 然 ,
允许重复使用会降低最终匹配样本的样本量,
可能会使估计精度下
降 。当 控 制 组 样 本 容 量 较 小 ,又 不 想 损 失 干 预 组 样 本 的 情 况 下 ,
允许重复匹配
不 失 为 一 种 解 决 办 法 。当 然 ,
如果允许重复匹配,
样本排序将不是问题,
一对 多
近 邻 匹 配 也 有 上 面 类 似 的 问 题 ,在 实 施 过 程 中 均 需 要 考 虑 。
在一对一最近邻匹配中,
往 往 采 用 所 谓 的 贪 楚 匹 配 (greedy matching) ,对
每 一 个 干 预 组 个 体 都 在 控 制 组 中 寻 找 一 个 距 离 最 近 的 。但 是 保 证 每 一 对 距 离
最近,
对全部干预组个体而言,
匹配上的控制组样本并不一定是总体上最近的。
另一种匹配方法,
称 为 最 优 EE配 (optima丨matching) ,不 是 一 个 一 个 地 进 行 匹
88 基本有用的计量经济学
配,
而 是 总 体 上 对 所 有 的 干 预 组 个 体 同 时 进 行 匹 配 ,寻 找 对 所 有 干 预 组 个 体 而
言 匹 配 上 的 总 距 离 最 小 。最 优 匹 配 和 贪 婪 匹 配 相 比 ,
计 算 量 大 大 增 加 。如果我
们关心的是平均因果效应,
从而主要想匹配出相似的干预组和控制组样本,
最
优匹配并没带来多大收益,
所获得的样本平衡性与贪婪匹配相比并没有优势
但是,
如果关心的是每个个体的匹配效果,
最优匹配方法会得到更平衡的成对
匹配。
当控制组个体样本容量非常大时,
每一个干预组个体都可能有多个控制组
个体距离相近,
并且与不同干预组个体匹配上的控制组个体数目可以不同,
有
的多有的少,
这 种 情 况 下 ,可 以 采 用 半 径 E 配 (radials matching) 。半 径 匹 配 是
事先设定一个半径,
半径之内的定义为相似,
之外的则不相似,
从而对于每个干
预组个体,
所有落在半径范围内的控制组个体都是该个体的匹配,
并且不同的
干 预 组 个 体 所 寻 找 的 匹 配 数 也 不 相 同 。另 外 ,
可以根据半径的选择来控制匹配
质量,
半径越小,
匹配质量越髙,
偏差越小,
但半径越小,
越 难 找 到 匹 配 。半 径 越
大,
寻找的匹配数越多,
估计精度提高,
但匹配质量下降,
偏 差 增 加 。得 到 的 干
预 组 个 体 / 匹配集合可以表示为:
M jU) = {j | d i X ^ X ^ ^ r } 或 M J(r> = {j | d d 山 、< r ) (6.27)
其 中 D, = l ,
D;=0,
r 是设定的匹配半径。
(2) 分层匹配
分 层 匹 配 是 根 据 协 变 量 或 倾 向 指 数 进 行 分 层 (stratification) ,
使层内两组
个体特征比较相似,
从 而 降 低 估 计 偏 差 的 方 法 。R o s e n b a u m and Rubin (1985)
证 明 根 据 倾 向 指 数 分 成 5 个 区 间 就 可 以 将 由 协 变 量 差 异 造 成 的 偏 差 降 低 90 % ,
因而,
在 应 用 中 通 常 分 成 5— 1 0 个 区 间 ,
如果样本足够大,
也可以分成更多的区
间 。分 层 匹 配 是 上 文 匹 配 测 度 (6. 7)(6. 8)(6. 1 7 ) 和 (6, 19 ) 的 实 现 。如 果 协 变
量是离散变量,
则 可 以 直 接 根 据 协 变 量 的 取 值 进 行 分 层 。对 于 连 续 性 协 变 量 ,
只 能 做 到 相 近 的 协 变 量 或 倾 向 指 数 进 行 分 层 。那 么 怎 么 知 道 应 该 分 多 少 层 呢 ?
以 及 什 么 时 候 层 内 的 协 变 量 或 倾 向 指 数 足 够 相 似 呢 ? Imbens and Rubin
(2015)提 出 了 一 种 方 法 ,
利 用 f检验判断多少分层是充分的。
以 倾 向 指 数 分 层 为 例 ,首 先 为 满 足 公 共 区 间 要 求 ,
根据干预组和控制组倾
向指数,
将 相 互 覆 盖 的 区 域 作 为 共 同 区 间 。通 常 ,干 预 组 倾 向 指 数 会 更 大 ,
控制
组的倾向指数会更小,
取
60 = min ^(Xi ) bx — m a x / > ( X ;)
i: = 1 “D. = 0
其 中 >(x,)为倾向指数估计值,
满足共同区间要求的倾向指数范围为
该区间外的样本无法进行匹配。
第 六 章 匹 配 方 法 89
在判断分层充分性时,
有两个基本的步骤:
检验层内倾向指数相似性和继
续 分 层 。假 设 现 在 已 经 将 倾 向 指 数 分 成 了 J 层 ,
首先要检验每层内倾向指数是
用 B;
否巳经相似。比如对于j 层 , J表 示 个 体 i 是 否 在 j 层 , 即 个 体 z•在 > 层 ,
B;J
=1,
否则为0,
从而层中干预组和控制组的样本数分别为:
Bij N rj — Bjj
I.:D ,. = 0
相应的线性化倾向指数平均值为:
^ tj — ili IfJ- 二 .>) Bn I
B;
q h D(. = 0
其 中 为 个 体 / 的 线 性 化 倾 向 指 数 估 计 值 。用 t 统 计 量 检 验 层 内 倾 向 指 数 的 相
似性,
£统计量如下:
< ^ N, + N, 二2 (,.2 。
仏(卜 〜 ) 2 + 系 ,K "”)
Imbens and Rubin (2015)建 议 临 界 值 取 imax — 1 ,
如 果 上 述 t值 小 于 1 ,
则认
为 层 内 两 组 倾 向 指 数 相 似 。如 果 f 值 大 于 1 ,
说明两组倾向指数相似性不够充
分,
则进人第二步,
根 据 j 层内倾向指数的中位数,
将 j 层进一步分成样本量相
同的两个新的子层,
对 于 新 划 分 的 子 层 ,再 利 用 上 一 步 的 方 法 检 验 充 分 性 。这
两个步骤不断重复进行,
直到每层i值 均 小 于 1,
或样本量小到不能再进一步分
层为止。
3 . 匹配效果诊断
匹配方法的目的是构造更加相似的样本,
使干预组和控制组更具有可比
性 。事 实 上 ,
在匹配之前就需要检验协变量的平衡性,
如果协变量比较平衡,
两
组个体本来就具有比较好的可比性,
也 就 没 有 必 要 实 施 匹 配 了 ,可 以 直 接 利 用
回 归 等 方 法 进 行 因 果 效 应 的 估 计 。如 果 发 现 两 组 个 体 协 变 量 有 较 大 差 异 ,
直接
回归往往会造成很大的估计偏差,
实 施 匹 配 才 是 必 要 的 。匹 配 方 法相当于从观
测 数 据 中 将 隐 藏 的 随 机 化 实 验 样 本 寻 找 出 来 (King and Nielsen, 2 0 16),因 而 ,
对于匹配完成后形成的匹配样本,
需 要 检 验 是 否 近 似 于 随 机 化 实 验 。常 用 的 检
验 指 标 包 括 标 准 化 平 均 值 差 异 (standardized difference in averages)和对数标准
差 比 (log ratio of standard deviations) 0
标准化平均值差异定义为:
90 基本有用的计量经济学
^ ^ ~ (6.29)
•Jisz, + Sc ) / 2
其 中 ,又, d = i,
C 表示干预组或控制组某协变量的平均值, 表示干预组或控
制组某协变量的样本方差,
分别定义为;
可以看到,
如果两组个体协变量完全平衡,
标 准 化 平 均 值 差 异 将 接 近 于 ◦,因 而 ,
& 的值越接近于0 ,
说明样本越有可能平衡。
注 意 (6. 29)不 同 于 t 统 计 量 ,
标准化平均值差异丄与样本容量无关,
它考
察的是给定样本两组协变量平均值是否相同,
是 样 本 内 特 征 ,和 样 本 容 量 没 有
关 系 。Imbens and Rubin(2015)强 调 不 要 使 用 t 检 验 来 检 验 平 衡 性 ,因 为 z 统计
量 与 样 本 容 量 有 关 ,当 样 本 容 量 很 大 时 ,即 使 协 变 量 平 衡 也 可 能 发 现 显 著 差 异
的 结 果 。另 外 ,
在匹配过程中,
往 往 需 要 计 算 匹 配 前 后 的 标 准 化 平 均 值 差 异 ,以
判 断 匹 配 的 效 果 。需 要 注 意 的 是 ,
在 计 算 标 准 化 平 均 值 差 异 的 时 候 ,(6. 2 9 )分
母 上 的 平 均 标 准 差 在 匹 配 前 后 的 计 算 中 要 使 用 同 一 个 标 准 差 ,比 如 均 使 用 匹 配
前的平均标准差,
这样计算的数值在匹配前后才有可比性。
标准化平均值差异主要考察了一阶矩,
另一个指标对数标准差比考察的是
二阶矩的差异,
定义为:
= ln(.sv)-In(5f> (6.30)
如 果 两 组 协 变 量 分 布 平 衡 ,那 么 两 组 协 变 量 标 准 差 将
根据上述公式可以看出,
相同,
从 而 两 组 协 变 量 标 准 差 的 对 数 比 将 接 近 于 (X
一般情况下,
检验上述两个指标就可以大概地了解两组变量的协变量平衡'
性 。在 非 正 态 分 布 中 ,
前 两 阶 矩 不 一 定 决 定 整 个 分 布 ,因 而 ,
前两阶矩平衡并不
一 定 代 表 整 个 分 布 平 衡 。为 此 ,
可 以 检 验 倾 向 指 数 的 平 衡 性 J m b e n s and Rubin
(2015)证 明 ,
如果两组倾向指数的期望值相同,
那么两组个体的协变量分布将
相同D 因而,
在匹配前后,
可以比较两组个体的倾向指数平均值,
计算倾向指数
的标准化平均值差异,
就可以检验两组协变量分布的平衡性。
K = lt lc- - (6.31)
祝 + 0 / 2
其 中 ,L 是 两 组 个 体 线 性 化 倾 向 指 数 的 平 均 值 ,
sL/是 两 组 倾 向 指 数 估 计 值 的 样
本方差。
除了上述三个检验指标外,
还 有 一 些 直 观 的 诊 断 方 法 ,主 要 包 括 倾 向 指 数
分布图、
分 位 数 分 布 图 (Q Q 图 )和 标 准 化 平 均 值 差 异 变 化 图 。倾 向 指 数 分 布 图
第 六 章 匹 配 方 法 91
是估计出倾向指数后,
直 接 画 出 干 预 组 和 控 制 组 的 倾 向 指 数 分 布 图 (直 方 图 或
概 率 密 度 图 ),
观 察 两 组 个 体 倾 向 指 数 分 布 的 差 异 ,如 果 分 布 相 似 ,
说明协变量
平 衡 ;如 果 分 布 差 异 较 大 ,
说 明 协 变 量 分 布 差 异 较 大 ,匹 配 效 果 不 好 。可 以 同 时
画出匹配前后的倾向指数分布图,
进 行 比 较 并 判 断 匹 配 的 效 果 。Q Q 图 是 将 干
预组和控制组的协变量或倾向指数按照分位由低到高分别画在横轴和纵轴上,
以检验两组个体协变量分布是否相似,
如果完全相似,
Q Q 图 形 将 与 4 5 度线重
合,
偏离越大,
说 明 两 组 协 变 量 差 异 越 大 。标 准 化 平 均 值 差 异 变 化 图 是 将 每 个
协变量匹配前后的标准化均值差异用图形的方式呈现出来,
从而可以直观地观
察匹配效果。
4. 因果效应估计
前 ® 三 个 阶 段 是 设 计 阶 段 ,在 这 三 个 阶 段 中 ,没 有 考 虑 结 果 变 量 。通 过 定
义 相 似 性 ,运 用 合 适 的 匹 配 方 法 得 到 匹 配 样 本 ,
并检验匹配样本的匹配质量。
如果匹配样本使协变量平衡,
从而匹配样本近似于随机化实验数据,
则可以进
人 分 析 阶 段 。设 计 阶 段 相 当 于 将 隐 藏 于 观 测 数 据 中 的 随 机 化 实 验 样 本 寻 找 出
来 ,后 面 的 分 析 可 以 借 鉴 随 机 化 实 验 数 据 的 分 析 方 法 。
这里主要讨讼干预组平均因果效应的匹配估计量,
所有匹配估计量可以写
成 下 列 形 式 (分 层 匹 配 有 所 不 同 ,
在 后 文 单 独 讨 论 ):
其 中 是 上 文 定 义 的 与 干 预 组 个 体 i 相匹配的控制组个体的
集合。
不同匹配方法的主要差别在于权重的差异,
对于一对一最近邻匹配,
j) = i,而 不 在 匹 配 集 m ; (;>中 的 控 制 组 个 体 权 重 均 为 o 。对 于 u a > i )近邻匹
配, 同样地,
不 在 匹 配 集 碼 ⑺ 中 的 控 制 组 个 体 权 重 均 为 0 。对于
半径匹配,
w G ,
_;’
)= 1 / # M m ,# M & , 表 示 是 集 合 中 的 元 素 数 目 ,同 样 地 ,
不 在 集 M , (D中 的 控 制 组 个 体 权 重 也 为 H e c k m a n et al. (1998)提 出 一 种 核 匹
配方法,
这 种 方 法 对 每 一 个 干 预 组 个 体 都 会 用 所 有 的 控 制 组 个 体 作 为 匹 配 ,只
是为每个控制组个体赋予不同的权重,
与 个 体 £距离越近的赋予的权重越高,
越
远的权重越低,
具 体 地 ,其 权 重 函 数 写 为 :
" .、 K ( X j ~ X t)
— .Nf„. ----------
堂 K(X厂 XO
其 中 ,K ( • ) 为 核 函 数 , 为与干预组个体i 相匹配的控制组个体的数目。
92 基本有用的计量经济学
除精确匹配可以保怔匹配样本与干预组个体协变量完全相同外,
非精确匹
配,
无论采用哪种匹配方法,
所获得的匹配个体与干预组个体往往存在着一定
的差异,
尽管经过匹配后,
差异比较小,
但仍然不完全相同,
这种差异可能造成
一 定 的 估 计 偏 差 。匹 配 偏 差 可 以 写 为 :
右= 务 S 油 •,
抓 1—
卩广] l y€Ar-£.j J 八 ":,)广 j
=务 八 广
S
jeMjCn
y.)
>
( 6. 33)
其中第一行第一项是干预组平均因果效应的匹配估计量,
第二项是干预组的平
均因果效应,
两 者 之 差 是 估 计 偏 差 。 (6. 33)式 表 明 ,匹 配 偏 差 主 要 是 由 于 用 匹
配样本观测值估计干预组 反 事 实 结 果 造 成 的 偏 差 。匹 配 样 本 中 ,
干预组个
体与控制组个体应该具有相似的协变量分布,
在 C I A 假设下,
它们的基线潜在
结果也应该相似,
但由于协变量不完全相同,
从而造成基线结果估计的差异。
回到总体的视角,
避免讨论抽样误差问题,
匹配偏差可以写为:
E \ Y X- Y , mm | X,,
X > ,Dt = 1]
- E l Y u ~ Y 0i | D, - 1]
,
= E l Y oi | ,D,- = l ] - £ [ Y o , | ,D,- 二 0]
= E [ y 0j | X , ] - E [ y 0/ I X w,(;
)]
= fiAX,) ~ fic{X,njU)) (6.34)
其 中 表 示 与 个 体 f 相匹配^ 控制组个体,仏(X,) = E [ Y 0l-1 X ;] 。
(6. 34)式 称 为 干 预 组 个 体 i 的 匹 配 误 差 ,匹 配 上 的 两 组 个 体 的 协 变 量 或 倾
向 指 数 相 似 ,当 协 变 量 差 异 比 较 小 时 ,
线性回归函数是对条件期望函数非常好
的 近 似 ,因 而 ,
可 以 用 线 性 回 归 方 法 估 计 化 (兄 ),
令 & 则匹配偏
差可以记为:
= (X^X^Y^ (6.35)
估 计 汉 的 方 法 有 两 种 ,一 种 是 直 接 利 用 匹 配 样 i 中 控 制 组 样 本 信 息 (1 : 1 最近
邻 匹 配 中 会 有 /V, 个 控 制 组 样 本 ,1 : k 近 邻 匹 配 中 将 有 A N , 个 控 制 组 样 本 ),
估
计下列回归模型:
^(;
> _ 〜 + X mj(n汉 + v,i
将 得 到 的 估 计 系 数 含 代 人 (6. 3 5 ) ,即 可 得 到 每 个 干 预 组 个 体 的 匹 配 偏 差 估 计 。
另一种方法是利用全部匹配样本估计下列回归模型:
V,-= 义+ rD,. + X - ^ + v, (6. 36)
同样地,
将上述模型估 计 的 或 代 人 (6. 35),
可以得到千预组个体的匹配偏差估
第 六 章 匹 配 方 法 93
计 。将 估 计 的 匹 配 偏 差 代 人 (6. 34)即 可 得 到 调 整 后 的 匹 配 估 计 量 :
fdifO') = Y t{ j ) ~ Y c(j) j = U …,
J
其 中 匕 (y) = i / N dj d=0,
l ,是 在 > 层 内 干 预 组 和 控 制 组 观 测 结 果
i: = d
的 平 均 值 。总 体 平 均 因 果 效 应 估 计 量 等 于 各 层 平 均 因 果 效 应 的 加 权 平 均 ,
权重
为 各 层 样 本 数 的 分 布 ,即
J
f';
TE = X N(j)/N (6. 38)
其 中 N(j)、
N 分别表示j 层样本,
数 和 总 样 本 数 。干 预 组 平 均 因 果 效 应 估 计 量
是 利 用 干 预 组 各 层 样 本 分 布 进 行 加 权 ,即
J
« - 2 > 抓0 ) X N t(j)/Nt (6. 39)
J= l
其中,
iV,())、
]V,分 别 表 示 层 内 干 预 组 样 本 数 和 全 部 干 预 组 样 本 数 。
分层匹配不是单独为每个干预组个体寻找匹配,
而是根据协变量或倾向指
数,
划出不同层,
相同层内两组个体匹配在一起。同一层内两组个体的协变量
或倾向指数相差很小,
但仍然存在差异,
就像上文对匹配偏差的讨论一样,
分层
匹 配 也 会 有 一 定 的 匹 配 偏 差 。考 虑 i 层 内 的 因 果 效 应 参 数 ,
rdifO ' ) = E [ Y i | D t = U B 0 = 1 ] - E [ y , | D, = 0,B, ^ 1]
= E[Yi ;| D,- — 1, (7 ) ] — E[_Y0i | D,. = 0 ,
X c(j)]
= E [ Y U - Y 0i | A = l ,Xt( j n - h E [ Y 0i | D, = 1 ,
X,(_/)]
-£ :
[& I A . = 0,
足 ()) ]
- E [ y „ . - y 0,. I X , 0 ) ] + { E [ Y OI. i x , ( j ) ] - E [ y 0l. | x 山•)]}
其中第一项是j 层的平均因果效应,
第 二 项 则 是 匹 配 偏 差 。 同 样 地 ,因 为 在 层
内两组个体协变量尽管有差异,
但差异比较小,
这时线性回归对条件期望的近
似会非常好,
因 而 ,同样可以假设
E [ y 0i I x , - x ] = 1 + 工%
94 基本有用的计量经济学
则 j 层内的匹配偏差为:
Bj = E [ Y 0i I x , ( y ) ] - E [ y 0, I x f( j ) ] = [龙 ( j ) - 又山_)]汍 (6.40)
从 而 )层 内 偏 差 调 整 的 分 层 匹 配 估 计 量 为 :
fadi0 ) = i m- B j (6.41)
fadj( P 可 以 直 接 用 回 归 方 法 估 计 出 来 ,
利用层内的所有样本,
估计下列回归方
程即可得到:
Y,- = «(>) + r 0 ' ) D , + X ;
i3 0 ) + s f
调整后的总体平均因果效应分层匹配估计量为:
代?T di = 2 ? di0 ‘
)X (6. 42)
调整后的干预组平均因果效应分层匹配估计量为:
x - C6.43)
5 . 逆概加权方法
对于倾向指数的使用,
可以通过倾向指数匹配或分层匹配获得因果效应参
数 的 估 计 。倾 向 指 数 还 可 以 通 过 逆 概 加 权 的 方 式 获 得 因 果 效 应 的 估 计 。逆挺
加 权 方 法 最 早 是 由 Horvitz and T h o m p s o n (1952)在 研 究 抽 样 代 表 性 时 提 出 的
一种加权方法,
他们证明,
为了获得总体特征的无偏估计,
可以利用抽样概率的
倒 数 对 抽 样 个 体 进 行 加 权 。Robins et al. (1992) 等 将 之 引 人 因 果 效 应 参 数 估
计 。事 实 上 ,
£[ 黑 H { E [ ^ y h ] h E { ^ y E [肌 1x 『
.]}
- E { ^ y £ [ Y , ]D ;= 1,
足 > ( 足 )}
= £:
{取 |D,- = 1,X,]} ^ £:
{£:
[yu | 足] } = ElYul
类似地,
从而总体的平均因果效应可以写成:
rA丁戶 ElYu — y 。
,.]
r (D - p(X,))y,- I
E\
Ucx^ci-pcx,.)) I ■ '
X ; ,D,
E [pct
+ E[r f ^ T U . = 0 ] G —P O O )
= 取 IU - 1]-E[Y,. | X t,D, = 0]
= 取 u-Yo,' I X,.] (6.45)
从而,
总体平均因果效应为,
rAT E = E L Y u - Y o.1 = E l E [ Y u - Y ol | X ] ]
= r r ^( uD - p K( AX ;))Yi
类 似 地 ,干 预 组 平 均 因 果 效 应 的 逆 概 加 权 测 度 为 :
rATr = ElY,i~ Y 0i | 辽 = 1] = E [ E [ Y 1; - Y 0i 丨X,.,
D, = 1] | A. 1]
= E [ E [ Y U - Y 0i | X,.] | D ; = 1]
(D-p(x))Yi
[夕(x)(l —p(x))
J
Xi = x Pr[X,- = a:[ D; = 1]
▽ r 「( D - p ( x ) ) Y i p (x)Pr[X,- — x']
x,.
i/>(x) Cl — p(x)) Pr[D, = 1]
1 • y 'p r ( D — p(x)~)Yj
X ;= Pr[X ;= x ]
Pr[D,- = 1] [ (1 — pix))
■(D- p ( X i))Yl-
(6. 46)
— P r [ A = 1] [— (兄 )) J
(6. 44)和 (6. 46)说 明 利 用 逆 概 加 权 方 法 也 需 要 两 个 基 本 的 步 骤 ,
首先估计
倾向指数,
然后利用倾向指数对两组个体进行加权,
相应的估计量如下:
D,-^(X,)
rlr (6.47)
N 2>,. p c x o a - p c x i ) )
(6. 48)
1-piX,)
逆概加权方法和匹配方法需要相同的识别条件:
C I A 和 共 同 区 间 假 设 。逆
概 加 权 估 计 量 (6. 47)和 (6. 48)显 示 ,
逆 概 加 权 估 计 量 依 赖 于 倾 向 指 数 ,如 果 倾
向指数模型存在模型误设,
则 会 产 生 较 大 估 计 偏 差 ,尤 其 在 极 端 的 倾 向 指 数 附
近,
估 计 量 将 变 得 不 稳 健 ,比 如 倾 向 指 数 接 近 于 1 或 0 ,
f = E将 趋 于 无 穷 大 ;同样
96 基本有用的计量经济学
地,
对 于 技 ;T ,倾 向 指 数 趁 近 于 1 时 ,
也趋于无穷大,
从而估计结果将不稳定。
6 . 条件独立性假设检验
回 归 方 法 和 匹 配 方 法 识 别 因 果 效 应 参 数 均 需 要 条 件 独 立 性 假 设 (6. 2 ) ,即
两组观测结果的差异是由可观测协变量造成的,
未观测因素对两组结果没有系
统性影响,
从 而 选 择 是 由 观 测 变 量 决 定 的 (selection on observables)。但 是 C I A
依赖于潜在结果,
而对于任一个体,
现 实 中 只 能 观 察 到 一 个 潜 在 结 果 ,因 而 ,
CIA
本 身 是 无 法 检 验 的 ,除 非 引 人 很 强 的 假 定 。l m b e n s (2004)、lmbens and Rubin
(2015)总 结 了 两 种 间 接 的 检 验 方 法 :
伪 结 果 方 法 (pseudo outcome)和 伪 干 预 方
法 (pseudo treatment) 。
伪结果方法利用一个事实上没有受到干预影响的变量作为伪结果,
检验控
制了协变量后,
相应的伪结果平均因果效应是否为零。因为伪结果事实上是没
有受到干预的,
用它来作为潜在结果y 。
,.的 代 理 变 量 ,
一般选择滞后结果变量作
为 伪 结 果 变 量 ,干 预 组 和 控 制 组 的 伪 结 果 都 是 可 观 测 的 ,如 果 控 制 协 变 量 兄
后,
影响潜在结果的所有混杂因素均被控制,
那 么 ,未 观 测 因 素 将 不 会 对 两 组 结
果产生系统性影响,
那么对于伪结果Y f ,
相 应 的 平 均 因 果 效 应 将 为 零 。相 反 ,
如
果发现利用伪结果估计的平均因果效应不为零,
说明控制协变量兄后,
两组结
果仍然存在着系统性差异,
从而可能仍然存在着未观测的混杂因素没有控制,
那么,
C I A 条 件 将 不 成 立 。 当 然 ,如 果 发 现 利 用 伪 结 果 估 计 的 平 均 因 果 效 应 为
零,
我 们 并 不 能 肯 定 C I A 成 立 。伪 结 果 方 法 检 验 下 列 假 设 :
H 0:
E{ElYf | X i,Di = 1 ] - E [ y f | = 0]} = 0 (6.49)
其 中 Y f 是伪结果,
通常用滞后一期或滞后二期的结果变量,
伪结果变量可以理
解 为 潜 在 结 果 的 代 理 变 量 ,该 检 验 的 有 效 性 也 依 赖 于 这 一 点 ,伪 结 果 越 是 接
近于基线潜在结果,
该检验越有帮助。_ 然 ,
这一检验并不是充分条件,
不能拒
绝 假 设 (6. 49)时 ,
也不能保证C I A 成立,
;但 是 提 供 了 没 有 发 现 C I A 不 成 立 的 证
从 而 使 我 们 有 信 心 相 信 因 果 效 应 估 计 有 因 果 效 应 的 解 释 。如果拒绝假设
据,
(6.4 9 ) ,
则 说 明 C I A 不 成 立 ,匹 配 估 计 量 可 能 存 在 较 大 偏 差 ,需 要 重 新 设 计
匹配。
伪干预方法是利用多个控制组的比较来检验C I A 是否成立的一种方法。
假设有两个控制组,
用了, . 6 { _ 1 ,
0,1}来 表 示 分 组 ,
0,. = 1(了,.= 1 ) ,
1( • ) 为示性
函数,
括号内条件为真取1,
为 假 取 0 ,即 T, = — 1 ,
0 为 两 个 控 制 组 ,了,.= 1 为干
预 组 。考 察 一 种 更 强 的 C I A 条 件 (简 记 为 S C I A ) ,以 协 变 量 X,.为 条 件 ,
潜在结
果 独 立 于 该 条 件 成 立 ,
意 味 着 通 常 的 C I A 条 件 (Y。
,.,
第 六章 匹配方法 97
y „ ) J L A l X ; 成 立 。 当 然 两 者 并 不 完 全 等 价 ,C I A 成 立 不 一 定 有 S C I A 成 立 。
Imbens and Rubin (2015)认 为 ,
在应用中,
如果每一个控制组都满足C I A 条 件 ,
没 有 理 由 认 为 S C I A 不 成 立 。S C I A 具 有 可 检 验 的 内 涵 ,因 为 S C I A 成 立 ,
意味
着有( A U J L T J X , ,
A = 0 ,
对于两个控制组也会有条件独立性假设成立,
而
对于两个控制组,
均没有受到干预,
它们的基线潜在结果Y 。
,都 是 可 以 观 测 的 ,
而 对 于 基 线 潜 在 结 果 是 否 条 件 独 立 于 伪 干 预 变 量 T,,是 可 以 检 验 的 。伪 干 预 方
法 主 要 检 验 T , 是否成立,
可以检验下面原假设:
E { E [ y ( | X,,
H 0: T ; - 0 ] - E [ Y ; 丨X 丨,
T ; = — 1]} = 0 (6.50)
将了,.看 作 一 项 伪 干 预 ,
T , ; 0 为伪干预组,
丁 = 一 ;I为 伪 控 制 组 。事 实 上 ,
两组
均为控制组,
均没有受到干预,
如果控制足后,
伪干预组和伪控制组之间的差异
是非系统性的,
那 么 ,伪 干 预 的 平 均 因 果 效 应 将 为 零 ,上 述 原 假 设 应 为 真 。 当
然,
这一检验也不是充分的,
不能拒绝原假设时,
也不能说明C I A 或 SCIA成
立 。但 是 ,如 果 拒 绝 了 假 设 (6. 50) ,
则 说 明 C I A 条 件 不 成 立 。直 观 理 解 ,
如果控
制 X, 后 ,
根据两个控制组计算的平均因果效应为零,
说明决定结果变量的主要
混杂因素已经控制;
相反,
如果控制X , 之后,
根据两个控制组计算的平均因果
效应显著不为零,
说明除兄外,
存在未观测因素影响结果变量,
从而使两 组 控 制
组 平 均 结 果 出 现 差 异 。那 么 ,
我们也有理由相信原干预组和控制组仅控制协变
量兄也是不充分的,
从 而 C I A 条件不成立。
第四节倾向指数匹配方法的软件实现
在这一节,
我 们 讨 论 匹 配 方 法 在 Stata软 件 中 的 实 现 。为 了 便 于 说 明 ,
首先
介 绍 一 下 将 使 用 的 数 据 ,然 后 介 绍 常 用 的 匹 配 命 令 ,
最 后 ,以 倾 向 指 数 匹 配 为
例,
提供一个完整的由设计到结果估计的实现过程。
1. 数据说明
变 ffl 含义
treat 干预状态(
= 1 接受培训,
= 0 未接受培训)
age 年龄
education 教育年限
black 黑人
hispanic 西班牙裔
married 婚姻状态(
= 1 表示已婚,
= 0 其他)
nodegree 是否有高中学历(= 1 表示没有高中学历,
= 0 表示有高中学历)
re74 1 9 7 4 年收入
re75 1 9 7 5 年收入
re78 1 9 7 8 年收人
2. S t a t a 软 件 中 的匹配命令
自 13.0版开始,
Stata开 始 提 供 匹 配 命 令 teffects,
它主要包括七个子命令,
分别是 i p w 、
aipw、
ipwra、
nn m a t c h 、
psmatch、
ra、
overlap,
其中前三个子命令对应
于逆概加权方法,
nnmatch是 近 邻 匹 配 命 令 ,
p s m a t c h 是 倾 向 指 数 匹 配 命 令 ,ra
是回归调整命令,
overlap用 于 画 干 预 组 和 控 制 组 的 倾 向 指 数 分 布 图 以 显 示 共
同 覆 盖 的 程 度 。另 外 ,
Stata还 提 供 辅 助 命 令 tebalance,用 于 检 验 协 变 量 的 平 衡
性 。相 应 的 使 用 方 法 可 以 利 用 help teffects和 help tebalance命 令 进 行 查 询 。
这 里 简 要 介 绍 teffects nnmatch 和 teffects psmatch 的 用 法 ,
teffects nnmatch 是
协变量匹配命令,
teffect p s m a t c h 是 倾 向 指 数 匹 配 命 令 。
teffect n n m a t c h 的 基 本 命 令 语 法 和 主 要 选 项 如 下 :
SE/Hobust
vce(vcetype) vcetype may be
vce(robust [ ,nn( # )) ; use robust Abadie - Imbens standard errors with 弁 matches
vce(iid) ;use default Abadie - Imbens standard errors
Advanced
caliper( # ) specify the maximum distance for which two observations
are potential neighbors
generate(stub) generate variables containing the observation numbers of
the nearest neighbors
metric(metric) select distance metric for covariates
metric Description
mahalanobis inverse sample covariate covariance ;the default
ivariance inverse diagonal sample covariate covariance
euclidean identity
其中,
ovar为 结 果 变 量 ,
omvarlist为 结 果 模 型 中 的 协 变 量 ,
tvar为 干 预 变 量 ,
这
三项为必选项,
第一个栝号为结果变量模型,
第 二 个 栝 号 为 干 预 变 量 。选 项 stat
包含两个可以选择的估计量,
ate为 总 体 平 均 因 果 效 应 (6. 8 ) 的 估 计 量 ,atet为
干 预 组 平 均 因 果 效 应 (6. 7 ) 的 估 计 量 。关 于 匹 配 模 型 有 三 个 选 项 ,
B B eighbor
( 弁)为 近 邻 匹 配 ,
改 变 # 的 值 可 以 决 定 是 选 择 1 • 1 最 近 邻 匹 配 还 是 1 • k 近邻
匹配,
bisadjCvarlist)可 以 根 据 括 号 内 变 量 进 行 匹 配 偏 差 调 整 得 到 偏 差 调 整 的 匹
配 估 计 (6. 3 7),
ematch(varlist)可 以 根 据 括 号 内 的 变 量 列 表 进 行 精 确 匹 配 ,
这里
的 变 量 列 表 应 该 是 离 散 变 量 。标 准 误 差 可 以 选 择 Abadie and Imbens (2006)构
造的两种估计量,
另外,
还 可 以 选 择 卡 尺 calipeK # ) 以 提 高 匹 配 质 量 ,
选 项 gen-
erate(stub)会 产 生 新 的 变 量 ,
对应每个个体最近邻的观测号,
选 项 metric(met-
ric)可 以 选 择 定 义 相 似 性 的 距 离 测 度 ,
共 提 供 三 种 距 离 测 度 ,mahalanobis为马
氏距离,
ivarance为 标 准 化 的 欧 氏 距 离 ,
euclidean为 欧 氏 距 离 ,
默认马氏距离。
下 面 我 们 利 用 Dehejia and W a h b a (1999)使 用 的 完 全 随 机 化 实 验 数 据 ,
估
计 培 训 对 个 人 收 人 的 干 预 组 平 均 因 果 效 应 ,采 用 1 : 1 最 近 邻 匹 配 ,
估计结果
如下:
. global xlist "age education black hispanic married nodegree re74 re75 々
• teffects nnmatch (re78 $ xlist) (treat) ,atet nn(l)
Treatment-effects estimation Number of obs =445
Estimator : nearest-neighbor matchin^atches :requested = 1
Outcome model ;matching min = 1
100 基本有用的计量经济学
Al Robust
re78 Coef. z P > U I 〔
9 5 % Conf, Interval]
S t d‘Err,
MET
treat
(1 vs 0) 2453,076 771.4713 3.18 0,001 941.0203 3965.132
如果认为匹配后,
7 5 年收入匹配效应不好,
仍然存在着一定的协变量差异,
可 以 根 据 7 5 年 收 人 进 行 匹 配 偏 差 调 整 ,在 前 述 命 令 基 础 上 加 上 选 项 biasadj
(re75),
估计结果如下:
Al Robust
re78 Coef. z P>!z( [_95% Conf. Interval]
Std. Err.
ATET
treat
(1 vs 0) 2290.232 771.1574 2.97 0.003 778.791 3801.672
倾 向 指 数 匹 配 命 令 teffects p s m a t c h 的 语 法 和 基 本 选 项 如 下 :
teffects psmatch (ovar) (tvar tmvarlist [ ,tmodel]) [if] [in] [weight] [ ,stat op-
tions]
同样地,
ovar表 示 结 果 变 量 ,
tvar表 示 干 预 变 量 ,tmvarlist表 示 倾 向 指 数 模
型 中 的 协 变 量 ,可 选 项 tmode丨 设 定 倾 向 指 数 模 型 的 形 式 ,可 以 选 择 l o g k 或
probit模 型 ,
默 认 为 logit模 型 ,
选 项 stat可 以 选 择 ate或 atet估 计 不 同 的 因 果
效应参数,
另外,
还 有 其 他 的 选 项 与 rmmatch类 似 ,
读 者 可 以 参 考 该 命 令 的 help
文件。
下 面 用 倾 向 指 数 匹 配 命 令 估 计 培 训 的 因 果 效 应 •.
Al Robust
re78 Coef. z P>|z| [ 9 5 K Conf Interval]
Std. Err.
ATET
treat
(1 vs 0) 2639.865 714.7758 3.69 0.000 1238.93 4040.799
倾向指数匹配完成后,
可 以 使 用 辅 助 命 令 teffects overlap画 出 干 预 组 和 控
制 组 的 倾 向 指 数 分 布 图 ,以 判 断 两 组 结 果 是 否 满 足 共 同 区 间 要 求 。 ’
Propensity score,treat=0
| ----- - treat=0 一 ■…treat^l
图 6 ,1 teffects overlap 画 出 的 倾 向 指 数 分 布 图
另 一 个 官 方 的 辅 助 命 令 是 tebalancdStata 1 4 开 始 提 供 ),
它主要用于检验
协变量的平衡性,
包 括 4 个子命令,
分 别 是 box、
density、
overid、
summarize。 te-
balance b o x 可 以 画 出 匹 配 前 后 协 变 量 的 箱 形 图 ,只 能 在 n n m a t c h 和 psmatch
命 令 后 面 使 用 。tebalance density画 出 两 组 个 体 的 核 密 度 分 布 图 ,
teffects子命
令 后 均 可 使 用 。overid平 衡 性 检 验 只 能 在 i p w 命 令 后 使 用 。s u m m a r i z e 可以 计
算标准化平均值差异和两组协变量的方差比,
teffects命 令 后 均 可 以 使 用 。
在前面的协变量匹配之后,
可 以 用 tebalance summarize计 算 所 有 协 变 量 的
标准化平均值差异和协变量方差比。
102 基本有困的计量经济学
. tebalance summarize
note: refitting the model using the generate() option
Covariate balance summary
Raw Matched
上 述 表 格 前 两 列 报 告 了 各 协 变 量 的 标 准 化 平 均 值 差 异 ,R a w 表 示 原 始 样
本,
Matched表示匹配样本,
最后两列显示干预组和控制组协变量方差比,
从结
果上看,
各 变 量 标 准 化 平 均 值 差 异 基 本 接 近 0 ,方 差 比 基 本 接 近 1 ,
尤其是匹配
除 74年 和 7 5 年收人匹配后变差,
后, 其 他 变 量 平 衡 性 均 变 好 了 。总 体 上 看 ,
数
据是比较平衡的,
这不奇怪,
因为使用的是完全随机化实验数据。
可 以 用 tebalance density或 tebalance b o x 画 出 各 协 变 量 的 分 布 图 ,图 6, 2
是教育变量匹配前后的分布图,
尽管随机化实验数据本身协变量就比较平衡,
但 仍 然 存 在 着 一 定 的 差 异 ,匹 配 后 协 变 量 平 衡 性 变 好 。官 方 命 令 的 使 用 方 法 ,
可 以 参 考 其 help文 件 ,
在此不再赘述。
除上述官方命令之外,
匹配方法还有一些用户写的命令,
常 用 的 包 括 Bee-
ker and Ichino (2002)的 pscore 软 件 包 、
Leuven and Sianesi (2003)的 psmatch2
软 件 包 、Abadie et al. (2004)的 n n m a t c h 软 件 包 。Stata官 方 的 匹 配 命 令 主 要 是
根 据 Abadie et al. (2004)的 n n m a t c h 软 件 重 新 设 计 的 ,
两者非常相似,
不再作
详 细 介 绍 。下 面 ,
主 要 介 绍 一 下 ?3 « ^ 和 p s m a t c h 2 两 个 用 户 写 的 匹 配 命 令 。
pscore 软 件 包 共 包 括 6 个 命 令 ,pscore、attnd、attnw、atts、attr、attk。
pscore可 以 进 行 倾 向 指 数 模 型 估 计 ,
并检验倾向指数模型是否满足平衡指数特
第 六 章 匹配 方法 103
Balance plot
Raw Matched
education
--------- control ----------- treated
征 。attnd和 attnw可 以 进 行 最 近 邻 匹 配 ,
两者的不同主要在于对相同距离匹
配的处理上,
如果有多个个体与干预组个体具有相同的最近距离,
attnd是 随 机
地选择一个作为干预组个体的匹配,
attnw是将所有相同距离的控制组个体的
平 均 值 作 为 干 预 组 个 体 的 匹 配 。atts是 分 层 匹 配 命 令 ,
attr是 半 径 匹 配 命 令 ,
attk是 核 匹 配 命 令 。这 6 个 命 令 的 基 本 语 法 均 类 似 于 Stata的 回 归 命 令 ,
这里
主 要 介 绍 pscore和 atts,
其他命令具有相似的语法,
读 者 可 以 自 行 参 考 其 help
文件。
pscore可 以 用 来 估 计 倾 向 指 数 模 型 ,
并检测倾向指数模型是否满足平衡指
数特征,
pscore命 令 基 本 语 法 和 选 项 如 下 :
其中,
treatment是 干 预 变 量 ,
vaHist是 进 人 倾 向 指 数 模 型 的 协 变 量 ,
pscore
(newvar)是 必 选 项 ,
命令运行后,
会 将 拟 合 的 倾 向 指 数 保 存 在 该 选 项 设 定 的 ne-
w v a r 中,
如果后面想根据估计的倾向指数进行分层匹配,
在估计倾向指数模型
时,
需 要 加 上 选 项 blockid(newvar) ,
命令运行后会将分好的层标识保存在该选
项 的 newvar中,
便于后面分层匹配时利用,
加 上 可 选 项 detail将 详 细 报 告 分 层
及 平 衡 指 数 特 征 检 验 的 过 程 。如 果 加 上 可 选 项 logit,将 运 用 logit模 型 估 计 倾
向 指 数 模 型 。否 则 利 用 probit模 型 估 计 倾 向 指 数 模 型 ,
可 选 项 c o m s u p 将平衡
指 数 特 征 检 验 限 制 在 共 同 区 间 上 进 行 ,可 选 项 m m i b b ( # )可 以 允 许 用 户 自 行
设 定 分 层 数 ,默 认 为 5 层 ,
leveK#)设定平衡指数特征检验时的显著性水平,
默
认 为 1% 。
下 面 用 pscore命 令 估 计 一 个 基 本 的 倾 向 指 数 模 型 ,
加 上 可 选 项 logit,必选
项 p SCOre(pS)生 成 了 一 个 新 的 变 量 pS ,
并将拟合的倾向指数保存在p s 中,
为了
后面进行分层匹配,
加 上 可 选 项 blockid(id)新 生 成 一 个 变 量 id表 示 不 同 的 层 ,
加 上 可 选 项 c o m s u p 以 保 证 平 衡 指 数 特 征 检 验 在 共 同 区 间 上 进 行 ,输 出 结 果
如下:
Percentiles Smallest
1% .2423395 .2379134
5% .285614 .2402362
10% .3430459 ,2405133 Obs 434
25% .3614771 .2406011 Sum of Wgt. 434
50% .3921638 Mean .4205563
Largest Std. Dev. .0921653
15% ,4772232 ’
6523377
90% .5594795 .655084 Variance .0084944
95% .5948073 ,6615352 Skewness .62618
99% .6432808 .675561 Kurtosis 2.704369
* * 关妗* * * 关於 * * * * * * ^x- * * ^
Step 1 :Identification of the optimal number of blocks
Use option detail if you want more detailed output
Inferior
of block treat
of pscore 0 1 Total
.2 156 82 238
.4 84 93 177
.6 9 10 19
Total 249 185 434
首 先 ,它 会 给 出 干 预 变 量 列 表 ,
提示利用逻辑回归估计倾向指数模型,
然后
提 醒 公 共 区 间 为 [0. 2379,0. 6756],
接着对拟合的倾向指数进行简单统计,
列出
分 布 信 息 。下 面 进 人 第 一 步 ,
识 别 最 优 分 层 数 ,因 为 没 有 加 可 选 项 @ a i l ,所以
直 接 报 告 最 终 得 到 的 最 优 分 层 数 为 4 层 。然 后 ,
进入第二步倾向指数的平衡指
数特征检验,
显示满足平衡指数特征,
说明倾向指数模型是充分的,
可以作为倾
向 指 数 匹 配 的 依 据 了 。加 上 @_taU会 显 示 详 细 的 平 衡 指 数 特 征 检 验 过 程 ,为节
约空间,
在 此 省 略 。最 后 ,将 满 足 共 同 区 间 的 分 层 信 息 显 示 出 来 ,包 括 3 层 ,
[0.2,
0 . 4 ] 、[0.4,
0,6]及 0 . 6 以 上 ,
有一层不满足共同区间要求,
没有报告。
在 估 计 出 倾 向 指 数 之 后 ,即 可 以 采 用 相 应 的 匹 配 命 令 进 行 倾 向 指 数 匹 配
了,
我们只列出分层匹配命令的语法,
其他命令语法相似。
detail displays more detailed output documenting the steps performed to ob
tain the final results,
bootstrap bootstraps the standard error of the treatment effect,
bs options allows the use of all options coming with Stata 8rs bootstrap com
mand.
在 pscore命 令 之 后 ,
可以使用各匹配命令估计相应的因果效应参数,
上面
列出了分层匹配命令的基本语法和选项,
outcome表 示 结 果 变 量 ,
treatment为
干预变量,
pscore(scorevar)告 诉 命 令 atts估 计 中 使 用 scorevar提 供 的 倾 向 指
数,
blockid(blockvar)告 诉 atts分 层 标 识 。还 有 4 个 可 选 项 ,
bootstrap可 以 利
用 自 抽 样 方 法 估 计 匹 配 估 计 量 的 标 准 误 差 ,b S_ 0p t k m S 设 置 相 应 的 自 抽 样 选
项 。用 分 层 匹 配 估 计 培 训 的 影 响 ,
估计结果如下:
结果显示,
干 预 组 185个 ,
控 制 组 249个 ,
干 预 组 平 均 因 果 效 应 为 1 830,
标
准 误 差 为 681,t 值 为 2. 685,结 果 显 著 不 为 零 。
另 一 个 广 泛 使 用 的 命 令 是 pSm a t c h 2 ,
除了能够实施近邻匹配、
半径匹配、
核
匹配之外,
还增加了局部线性回归匹配、
样条匹配等方法,
该软件包还包括两个
辅 助 命 令 ,用 于 协 变 量 平 衡 性 检 验 的 pstest命 令 和 倾 向 指 数 分 布 图 命 令 ps-
graph。psmatch2 命 令 语 法 和 选 项 如 下 :
其 中 depvar是 干 预 变 量 ,可 选 项 indepvars是 进 入 倾 向 指 数 模 型 的 协 变 量 ,
如 果 想 让 p s match2估 计 倾 向 指 数 ,
需要加上协变量,
如果已经估计好了倾向指
数,
可 以 使 用 选 项 pscore(varname)告 诉 软 件 使 用 v a r n a m e 变 量 提 供 的 倾 向 指
数 。可 选 项 outcomdvarlist)是 告 诉 软 件 结 果 变 量 列 表 ,
该命令可以同时估计
多 个 结 果 的 平 均 因 果 效 应 。选 项 pighbor(integer)可 以 进 行 近 邻 匹 配 ,
通过该
选项括号内的数字决定是进行1 : 1 最近邻匹配,
还 是 1 : k 近 邻 匹 配 。radius
108 基本有用的计量经济学
选项进行半径匹配,
caliper(real)可 以 设 定 卡 尺 范 围 。mahalanobis(varlist) 使
用马氏距离,
ai(integer)使 用 Abadie and Imbens (2006) 的 异 方 差 一 致 性 标 准
误差,
population和 altvariance是 当 使 用 ai选 项 时 两 种 计 算 标 准 误 差 的 方 法 。
kernel为 核 匹 配 ,
llr为 局 部 线 性 回 归 匹 配 ,
kerneltype(type)可 以 选 择 核 类 型 ,
默 认 为 0.06。spline是 样 条 匹 配 ,nknots设定样条 平 滑
bwidth(real)设 置 带 宽 ,
的 内 部 节 点 数 量 。c o m m o n 设 定 共 同 区 间 ,
trim(r.eal)通 过 截 尾 方 式 设 定 共 同 区
间 。noreplacement只 能 在 1 : 1 最 近 邻 匹 配 中 使 用 ,
加上该选项控制组个体不
会重复匹配,
没 有 该 选 项 则 允 许 重 复 匹 配 。descending只 用 于 1 : 1 最 近 邻 匹
配,
加上该选项匹配以降序进行,
否 则 为 升 序 。o d d s 选 项 根 据 线 性 化 的 倾 向 指
数进行匹配,
index利 用 潜 在 变 量 指 数 进 行 匹 配 ,
logit利 用 logit模 型 估 计 倾 向
指 数 。ties选 项 允 许 在 最 近 邻 匹 配 中 ,多 个 相 同 倾 向 指 数 的 控 制 组 个 体 与 干 预
组 个 体 相 匹 配 。HHietly不 输 出 倾 向 指 数 估 计 结 果 。w(matrix)在 马 氏 距 离 中 使
用 用 户 提 供 的 矩 阵 。加 上 a t e 选 项 ,除 提 供 A T T 估 计 量 外 ,还 提 供 A T E 和
A T C 的匹配估计量D
下面利用不放回的降序最近邻匹配方法估计培训对收入的影响,
利用选 项
ate分 别 报 告 A T T 、
ATC(ATU)、
A T E 三个因果效应参数的估计:
. psmatch2 treat ,outcome(re78) n(l) ai(l) odds pscore(ps) ate norepl descending
Make sure that the sort order is random before calling psmatch2.
匹配完成后,
可 以 利 用 pstest命 令 检 验 协 变 量 平 衡 性 ,
pstest类似于官方的
tebalance命 令 ,
可以计算协变量的标准化平均值差异和协变量方差比,
还可以
画出协变量匹配前后的分布图。
第 六 章 匹 配 方 法 109
下 面 是 利 用 pstest命 令 检 测 变 量 age、
re75匹 配 前 后 的 平 衡 性 :
M if variance ratio outside [0. 75 ;1.34] for U and [0. 7 5 ;1.34] for M
第 i 列是变量名,
第 2 列 对 应 每 个 变 量 有 两 行 ,u 表 示 匹 配 前 原 始 样 本 ,
M
表示匹配样本,
第 3、
4 列分别是干预组和控制组的变量平均值,
第 5 列为标准
化 平 均 值 差 异 ,以 百 分 数 形 式 表 示 ,
第 6 列为匹配后标准化平均值差异下降的
幅 度 ,最 后 一 列 为 协 变 量 方 差 比 ,中间提供了 t 检 验 值 和 相 应 的 P 值 。另 外 ,
可
以 用 p s g raph画 出 两 组 的 倾 向 指 数 分 布 图 。
3 . 培训的影响:
倾向指数匹配方法案例
数据构造完成后,
检测协变量是否平衡,
先做个简单统计或平衡性检验:
®
① estposUeststCKesttab等 是 用 户 写 的 命 令 ,
需要先安装才可以使用,
具体参考本书附录。
110 基本有用的计量经济学
显示统计信息如下:
也 可 以 使 用 pstest检 验原始数据协变量的平衡性;
无论是从简单统计还是平衡性检验上看,
干预组和控制组两组差异都非常
第 六 章 匹 配 方 法 111
显著,
不能直接利用线性回归,
考 虑 利 用 倾 向 指 数 匹 配 方 法 构 造 匹 配 样 本 。第
二 步 进 行 倾 向 指 数 匹 配 。采 用 l o g i t 模 型 估 计 倾 向 指 数 ,
从一个最基本的模型
出 发 ,将 主 要 协 变 量 均 引 人 倾 向 指 数 模 型 ,并 利 用 倾 向 指 数 的 平 衡 指 数 特 征 ,
检
验 倾 向 指 数 模 型 是 否 充 分 。如 果 不 满 足 平 衡 指 数 特 征 ,
则需要重新调整倾向指
数 模 型 。第 二 阶 段 的 估 计 可 能 要 进 行 多 次 反 复 修 改 。
(其他部分省略)
结果显示,
基 础 模 型 没 有 通 过 平 衡 指 数 特 征 检 验 ,因 而 ,
仅将协变量纳人倾
向 指 数 模 型 并 不 充 分 。尝 试 引 人 协 变 量 高 阶 项 ,
在 基 础 模 型 的 基 础 上 ,又 引 人
了 married和 r e 7 5 的 交 叉 项 及 a g e 与 r e 7 4 的 交 叉 项 ,
估计结果如下:
, pscore treat age education black hisp married re74 re75 marriedre75 agere74,
> pscore(ps) blockid(id) comsup logit
(其他部分省略)
* * 并并关关关* 关关关* * * 长关关长* 关关关矢 * 关长关* * * * * 务 * *
Step 2 :Test of balancing property of the propensity score
Use option detail if you want more detailed output
Inferior
of block treat
of pscore 0 1 Total
.0009204 4872 29 4901
.05 166 13 179
133 24 157
.2 155 75 230
.4 51 43 94
.6 0 1 1
这一次发现倾向指数模型通过了平衡指数特征检验,
说明现在倾向指数模
型比较充分了,
并 且 划 分 了 6 个 层 ,每 层 的 样 本 分 布 情 况 列 在 上 面 的 表 格 里 。
可以看到最后一层内,
只有一个干预组个体,
很难找到合适的匹配,
为了保证匹
配质量,
该 干 预 组 个 体 可 以 删 除 。估 计 出 倾 向 指 数 后 ,也 可 以 用 histogram或
t w o w a y kdensity命 令 画 出 两 组 个 体 的 倾 向 指 数 分 布 图 ,以 比 较 两 组 协 变 量 的
差 异 。图 6. 3 画 出 了 倾 向 指 数 分 布 的 直 方 图 。
0> 1
o 60 r
40 -
20 -
0 L , ......一 ...____
0 0.2 0.4 0.6
Graphs by treat Estimated propensity score
图 6. 3 倾向指数估计值分布图
从 图 6. 3 可 以 看 出 ,
两组倾向指数差异很大,
控制组个体很多集中在0 附
近,
这也证明两组协变量极不平衡,
不能直接进行分析,
需 要 进 行 调 整 。下面利
第 六 章 匹 配 方 法 113
用 1 : 1 不重复降序最近邻匹配方法, 在最近邻匹配中,
如果同时有多个个体
与干预组个体具有相同的最近距离,
那么,
p s m a tc h 2 会 选 择 首 先 遇 到 的 控 制 组
个 体 作 为 匹 配 ,因 而 ,
样本的排列顺序将会影响到匹配样本,
样 本 排 序 不 同 ,匹
配 样 本 也 会 不 同 。为 保 证 排 序 的 随 机 性 ,
可以通过生成随机数的形式来保证样
本 的 随 机 排 序 。因 而 ,
在 进 行 正 式 匹 配 之 前 ,可 以 先 利 用 下 列 语 句 对 样 本 进 行
随机排序:
当然,
在 最 近 邻 匹 配 时 ,如 果 遇 到 多 个 控 制 组 个 体 与 干 预 组 个 体 具 有 相 同
的最近距离,
那么可以用所有相同最近距离的控制组个体的平均结果作为干预
组个体的匹配,
在 匹 配 命 令 中 加 上 选 项 t i e s 可 以 实 现 这 一 功 能 。如 果 选 用 了
ties ,
样本排序将不重要了,
上 述 语 句 就 不 需 要 了 。为 了 方 便 构 造 匹 配 样 本 ,
这
里 不 加 选 项 ties ,
随 机 选 择 其 中 的 一 个 作 为 匹 配 。估 计 结 果 如 下 :
psmatch2 ;
psmatch2 : Common
Treatment support
assignment On suppor Total
Untreated 15992 15992
Treated 185 185
①因为控制组样本比较多,
不需要使用重复匹配,按照降序是首先匹配倾向指数最高也是最难匹
配的,
然后再匹配容易的,
匹配时根据对数或然比进行。
114 基本有用的计量经济学
ps m atch2命 令 的 输 出 结 果 显 示 ,
原 始 样 本 (U n m a t c h e d ) 干 预 组 7 8 年平均
收 入 为 6349美 元 ,
控 制 组 为 14846美 元 ,
两 组 平 均 收 入 之 差 为 一8 4 9 7 美 元 !匹
配 样 本 干 预 组 平 均 收 人 为 6349美 元 ,
控 制 组 平 均 收 人 为 4 8 5 0 美 元 ,干 预 组 平
均 因 果 效 应 为 1499美 元 ,
标 准 误 差 为 7 4 6 “值 为 2. 0 1 ,
说明培训对参与培训的
个体收人具有显著的正向影响,
影 响 程 度 为 1499美 元 。
最近邻匹配已经使两组个体特征非常相似,
事实上,
可 以 直 接 在 pSm a t Ch2
命令之后,
再做一次协变量平衡性检验,
结果如下:
可以看出,
匹配后,
干预组和控制组协变量已经非常相似,
标准化平均值差
异均接近0,
所 有 协 变 量 匹 配 后 不 平 衡 性 均 显 著 降 低 。从 方 差 比 看 ,
两组协变量
的方差仍然存在着一定的差异,
但 我 们 更 关 心 协 变 量 平 均 值 的 平 衡 性 。当 然 ,
上 述 不 平 衡 检 验 结 果 也 反 映 出 ,匹 配 后 两 组 样 本 之 间 仍 然 存 在 着 一 定 的 差 异 ,
这些微小差异可能造成估计偏差,
可 以 采 用 Abadie and Imbens ( 2 0 U ) 的方法
进行偏差修正,
为此,
将 匹 配 好 的 样 本 识 别 出 来 。psmatCh 2 在 匹 配 过 程 中 会 产
生 一 些 变 量 ,_treat 记 录 了 千 预 变 量 ,
在 本 例 中 等 同 于 原 数 据 中 的 treat变 量 ,
第 六 章 匹 配 方 法 115
_id是 匹 配 前 各 观 测 的 编 码 或 顺 序 号 ,
_ n l 是与对应个体相匹配的个体编码,
—o u t c o m e 是 与 干 预 组 相 匹 配 的 结 果 ,
本 例 中 会 产 生 匹 配 结 果 变 量 _re78。根据
这些信息,
可以将匹配好的匹配样本识别出来,
具体程序如下:
对 于 匹 配 样 本 ,因 为 本 身 协 变 量 比 较 平 衡 ,
类似于完全随机化实验产生的
数据,
可以直接利用回归分析的方法来估计因果效应参数,
事实上,
利用匹配样
本 ,回 归 分 析 所 得 的 结 果 可 以 解 释 为 偏 差 修 正 的 匹 配 估 计 量 (Imbens and R u
bin, 2015) 0 直 接 利 用 下 面 程 序 可 以 得 到 调 整 的 因 果 效 应 估 计 ,
输出结果如下:
(1) (2)
unadjusted adjusted
treat 1498,87“ 1473,28**
(745,57) (715,70)
N 370 370
adj. R-sq 0.008 0.068
第 l 列 是 直 接 用 匹 配 样 本 两 组 观 测 收 人 之 差 ,即 简 单 回 归 系 数 ,
实际上就
是上文中估计出的干预组平均因素效应,
没 有 进 行 任 何 的 偏 差 调 整 。第 2 列是
引入了主要的协变量,
相 当 于 Abadie and Imbens (2011) 的 偏 差 修 正 的 干 预 组
平均因果效应,
进一步调整了匹配样本可能的协变量差异造成的估计偏差,
估
116 基本有用的计量经济学
计 结 果 显 示 偏 差 调 整 的 平 均 效 应 为 1473美 元 ,
并 且 在 5 % 水平下显著。
估计出平均因果效应之后,
需 要 检 验 C I A 是 否 成 立 。如 果 C I A 不 成 立 ,
前
面 估 计 的 结 果 不 能 解 释 为 因 果 效 应 。只 有 C I A 成 立 时 ,
上文的估计结果才有因
果 效 应 的 解 释 。可 以 利 用 前 文 介 绍 的 伪 结 果 方 法 和 伪 干 预 方 法 进 行 检 验 。 因
为 我 们 有 干 预 实 施 之 前 的 个 体 收 人 re74、
re75,这 里 用 re7 5 作 为 一 个 伪 结 果 ,
看
一 看 根 据 协 变 量 age-fe74进 行 匹 配 ,两 组 的 re75平 均 值 是 否 有 显 著 差 异 ,
如果
有显著差异,
说 明 除 这 些 协 变 量 之 外 .,可 能 还 有 其 他 的 未 观 测 因 素 影 响 收 人
re75,
那 么 这 些 未 观 测 因 素 也 有 可 能 是 影 响 re78的 重 要 因 素 ,
从而说明CIA条
件 不 成 立 。否 则 ,
如果没有显著差异,
尽 管 不 能 说 C I A —定 成 立 ,
但至少证 明 没
有 发 现 C I A 不成立,
从 而 估 计 结 果 有 一 定 的 可 信 性 。利 用 类 似 的 方 法 ,
估计的
伪结果效应如下:
结果显示,
培 训 对 7 5 年收人没有显著影响,
说明没有证据表明这些协变量
后,
未 观 测 变 量 对 伪 结 果 re75有 显 著 影 响 ,
没 有 发 现 C I A 条件不成立的证据。
第 二 种 方 法 是 伪 干 预 方 法 ,因 为 有 随 机 化 实 验 的 控 制 组 ,另 外 ,调 査 数 据
cps_controlS. dta也 未 受 到 干 预 ,对 于 这 两 个 均 没 有 受 到 干 预 的 样 本 可 以 构 造
一个伪干预,
利 用 两 个 控 制 组 检 测 控 制 所 有 的 协 变 量 age-re75后 ,
看看两个控
制 组 的 结 果 re78是 否 有 显 著 差 异 。 因 为 两 组 同 在 控 制 组 ,
如果没有差异,
说明
控制这些协变量是充分的,
未 观 测 因 素 不 会 对 结 果 re78产 生 系 统 性 影 响 ,
从而
使我们相信,
在 干 预 组 和 控 制 组 之 间 进 行 比 较 时 ,控 制 这 些 协 变 量 也 应 该 是 充
分的,
剩 下 的 结 果 差 异 就 是 干 预 的 影 响 。检 验 结 果 如 下 :
第 六 章 匹配 方法 117
. psmatch2 w age education black hispanic married re74 re75 marriedre75 agere74»
> outcome(re78) n(l) norepl descending odds ties
其 中 XV 表 示 两 个 控 制 组 :
实验的控制组(
w = l ) 和 调 查 数 据 C P S ( W = 0 ) 。利用
与 上 文 相 同 的 倾 向 指 数 匹 配 方 法 重 新 估 计 了 因 果 效 应 参 数 A T T 。结 果 显 示 ,
两 组 收 人 re78并 没 有 显 著 差 异 ,
说明控制主要的协变量之后,
未观测因素对结
果 re78没 有 系 统 性 影 响 ,
C I A 条 件 可 能 成 立 。伪 结 果 方 法 和 伪 干 预 方 法 均 没
有 发 现 C I A 不成立的证据,
匹配估计具有一定的可信性。
本节主要介绍了倾向指数匹配方法的基本实施步骤,
其他匹配估计量的估
计类似,
不再赘述。
第五节总 结
本 章 主 要 介 绍 了 协 变 量 匹 配 和 倾 向 指 数 匹 配 方 法 及 其 实 施 步 骤 。然后 利
用一个具体的例子,
详 细 介 绍 了 倾 向 指 数 匹 配 方 法 在 Stata软 件 中 的 实 现 。需
要强调的是,
匹配方法和上一章的回归方法本质上并没有什么区别,
两种策略
所 需 要 的 识 别 条 件 都 是 条 件 独 立 性 假 设 (C I A ) , 也 就 晕 说 ,
控制所有可观测因素
之后,
未 观 测 变 量 不 会 对 两 组 观 测 结 果 造 成 系 统 性 如 果 C I A 条件不成
立 ,即 控 制 所 有 可 观 测 变 量 后 ,
仍然有未观测因素对两组观测结果造成系统性
差 异 ,出 现 所 谓 的 内 生 性 问 题 ,
那么匹配方法和回归方法一样,
是无法解决的。
内生性问题意味着未观测因素可能是潜在的混杂因素,
影 响 个 体 的 选 择 ,同时
对结果产生影响,
控制可观测因素后,
选 择 偏 差 仍 然 存 在 。 因 而 ,匹 配 方 法 不 能
解 决 内 生 性 问 题 ,国 内 有 些 文 献 利 用 匹 配 方 法 来 解 决 内 生 问 题 是 错 误 的 。 当
然,
匹 配 方 法相对于回、
归 方 法 确 实 有 它 的 优 势 。 当 两 组 协 变 量 差 异 很 大 时 ,回
归分析一般不能得到稳健的估计结果,
估计结果对模型函数形式非常敏感,
并
且回归分析对于具体使用了哪些样本不会给出显性的提示,
从而使使用者往往
倾 向 于 将 得 到 的 估 计 结 果 解 释 为 总 体 的 平 均 因 果 效 应 。匹 配 方 法 通 过 匹 配 ,
在
协变量不平衡的观测样本中,
分离出一个协变量相对平衡的匹配样本,
用 King
and Nielsen (2016)的 语 言 表 述 ,
就是匹配方法将隐藏在观测数据中的随机化实
验 样 本 寻 找 出 来 ,因 而 ,
我们很清楚地知道采用了哪些样本估计匹配估计量,
得
118 基本有甩的计量经济学
到 的 匹 配 估 计 量 可 以 解 释 为 哪 些 个 体 的 因 素 效 应 。另 外 ,
利用匹配样本进行分
析,
估计结果往往更加稳健,
对 函 数 形 式 不 再 敏 感 (赵 西 亮 ,2015) ,
这些都是匹
配方法相对于回归方法的优点。
King and Nielsen (2016)指 出 由 于 倾 向 指 数 匹 配 方 法 将 协 变 量 综 合 为 一 个
一维的变量,
倾 向 指 数 相 似 反 而 协 变 量 差 异 更 大 。举 个 简 单 的 例 子 ,比如研究
大学教育收益率,
考 察 接 受 大 学 教 育 对 个 人 收 人 的 影 响 。假 设 我 们 主 要 利 用 高
中学习成缋和家庭收人作为影响个体大学教育选择的因素,
那么倾向指数就是
这两个变量的一个函数,
这两个因素对接受大学教育的可能性都是正向影响,
因而,
如果两个个体倾向指数相同,
有可能一个个体学习成绩很好,
但家庭收人
较低,
另一个个体则相反,
学习成绩较差,
但家庭收人较高,
那么尽管倾向指数
相同,
但 协 变 量 差 异 却 很 大 。King and Nielsen (2016)证 明 有 时 倾 向 指 数 匹 配
反 而 会 使 协 变 量 平 衡 性 变 差 ,因 而 ,King and Nielsen (2016)建 议 采 用 协 变 量
匹 配 方 法 进 行 样 本 匹 配 。倾 向 指 数 匹 配 是 以 完 全 随 机 化 实 验 为 基 础 的 ,
所获得
的匹配样本类似于完全随机化实验,
而协变量匹配则是以分层随机化实验为基
础的,
所 获 得 的 匹 配 样 本 类 似 于 分 层 随 机 化 实 验 ,协 变 量 匹 配 由 于 考 察 了 协 变
量的差异,
可以保证匹配样本协变量的平衡性。
推荐阅读
Imbens (2004)和 Stuart (2010)对 匹 配 方 法 进 行 了 很 好 的 综 述 。Imbens
and Rubin (2015)第 12— 2 2 章 对 匹 配 方 法 从 理 论 上 和 方 法 上 进 行 了 非 常 好 的
论 述 。关 于 匹 配 方 法 和 回 归 方 法 的 关 系 可 以 参 考 Angrist and Pischke (2009)
第 3 章 & M o r g a n and Winship (2015)第 5 章 也 有 关 于 匹 配 方 法 的 介 绍 。
第七章工具变量法
通过前面两章的学习,
我 们 知 道 ,如 果 满 足 条 件 独 立 性 假 设 (C I A ) ,匹配估
计 量 或 回 归 估 计 量 具 有 因 果 效 应 的 解 释 。但 是 如 果 控 制 观 测 变 量 X,.后 ,
两组
潜 在 结 果 仍 然 存 在 着 显 著 差 异 ,则 说 明 存 在 未 观 测 混 杂 因 素 ,同 时 影 响 原 因 变
量和潜在结果,
这时仅仅以观测变量X ;为条件,
原因变量将不独立于潜在结
果,
从 而 C I A 条 件 不 成 立 。C I A 条 件 不 成 立 意 味 着 未 观 测 因 素 会 造 成 选 择 偏
差,
从 而 出 现 由 于 未 观 测 因 素 而 造 成 的 选 择 问 题 (selection on unobservable),
也称为内生性问题,
® 匹 配 方 法 或 回 归 方 法 将 无 法 识 别 因 果 效 应 参 数 。工 具变
量法是解决内生性问题的一种经典方法,
也是实证研究中仅次于线性回归的一
种 实 证 分 析 方 法 。工 具 变 量 法 最 早 起 源 于 W r i g h t 父 子 1 9 2 8 年 关 于 亚 麻 籽 供
求联立方程组的求解,
他们发现仅仅利用可以观测到的市场均衡价格和均衡数
量的数据是无法估计出亚麻籽的供给方程和需求方程的,
他们提出的办法是引
入 需 求 的 扰 动 因 素 (demand shifter)来 估 计 供 给 方 程 ,引 人 供 给 的 扰 动 因 素
(supply shifter)来 估 计 需 求 方 程 ,这 两 个 扰 动 因 素 现 在 称 为 工 具 变 量 。
® 工具
变量法根据其发展,
可以分为两种类型,
第一种类型假设干预对所有个体的影
响 是 相 同 的 ,即 同 质 性 工 具 变 量 法 ,第 二 种 类 型 是 后 来 lmbens and Angrist
(1994),Angrist et al. (1996)发 展 的 异 质 性 工 具 变 量 法 ,
假设干预对个体的影
响 是 异 质 的 。本 章 首 先 介 绍 传 统 的 工 具 变 量 法 ,
然 后 再 介 绍 Angrist等 人 发 展
的异质性工具变量 法 。
第一节同质性工具变量法
还是以教育对收入的影响为例,
假设因果效应模型如下:
y f - a - i - T D i + A - r + Vi (7.1)
其 中 Y,.为 (对 数 )收 人 , 为 教 育 年 限 , 为 能 力 ,
奶为误差项,
并 且 满 足 Eb,.l
D,.,A,] = 0 o 常 数 r 是 因 果 效 应 参 数 ,
反映的是教育对收人的影响,
并且对所有
①在回归分析中, 通常将模型误差项或未观测因素与原因变量相关称为内生性问题,
从而通常的
O L S 估计量存在偏差, 不是总体参数的一致估计量。
② 关 于 工 具 变 量 法 起 源 的 介 绍 可 以 参 考 Angrist and Kroeger (2001) „
120 基本有用的计量经济学
个体都是相同的。
对 于 模 型 (7 . 1 ) ,
如 果 能 力 变 量 A,.是 可 观 测 的 ,
那 么 要 识 别 教 育 D ; 对收人
Y,.的 影 响 ,
可 以 直 接 利 用 回 归 分 析 或 根 据 A,.进 行 匹 配 ,
均可以得到正确的因果
效 应 估 计 。图 7 . 1 ( a ) 给 出 了 相 应 的 因 果 图 。如 果 能 力 变 量 A 是 可 以 观 测 的 ,A
是 造 成 混 杂 偏 差 的 唯 一 因 素 ,因 而 ,
只要以A 为条件,
则可以阻断后门路径D —
A —Y ,
从 而 识 别 出 D — Y 的因果效应。
(a)控制法 (
b) 工具变量法
图 7. 1 工具变量法因果图
但是,
如果能力变量A 不可观测,
那么我们就没有办法控制A 或根据A 进
行 匹 配 。如 果 能 够 找 到 一 个 工 具 变 量 Z 满 足 下 面 两 个 基 本 条 件 ,
也可以识别D
对 Y 的因果影响:
(1) 相 关 性 。工 具 变 量 必 须 与 原 因 变 量 相 关 ,即 :
Co v C D , ,Z ,)乒 0 (7.2)
(2) 外 生 性 。工 具 变 量 外 生 于 我 们 关 心 的 经 济 系 统 ,
工具变量不通过未观
测因素影响结果,
或者说工具变量分配类似于随机化实验,
独立于潜在结果,
从而
C o v (切,
Z,)=0 (7.3)
其中 0 = 。
图 7. 1 ( b ) 给 出 了 工 具 变 量 法 的 因 果 图 。Z 为 工 具 变 量 ,
直 接 影 响 D ,从而
与 D 密切相关,
满 足 相 关 性 条 件 。其 次 ,
Z 与 A 和 z;都 不 相 关 ,
Z 不会通过A
和^ 影响y ,
从 而 满 足 外 生 性 。从 图 中 可 以 直 观 地 理 解 为 何 工 具 变 量 Z 可 以 识
别 D 对 Y 的因果影响。图中显示,
D 到 Y 有两条路径表现出D 与 Y 的相关性,
影响J 用公式表示,
可以计算工具与结果之间的相关性:
C o v ( Y ;,Z,) - Cov(a,Z,) + r C o v ( D y,Z,) + Cov(V;
,Z,)
因 为 《为 常 数 项 ,
所 以 ,C o v U ,乙 )= 0 , 由 外 生 性 条 件 ,C o v ( 7,.,
Z,.)=0,
并且由
相关性条件,
C 0v(D,.,
& ) 关0 ,
所以上式整理,
得:
. Cov(Y,,Z,) _ C o V( y ,.,Z ,.) / V a i ■(乙 )
r/v — Cov(D,-,Z;) — Cov(D,., Z,)/Var(Z,)'
其中,
分 子 实 际 是 F,.对 乙 的 总 体 回 归 系 数 ,通 常 称 为 简 化 式 ,
® 分 母 是 D ,对乙
的总体回归系数,
通 常 称 为 第 一 阶 段 。 (7. 4)称 为 工 具 变 量 估 计 测 度 ,
对应的样
本形式即工具变量估计量:
N
2( z , . — z)(y,'— f)
iiv = ------------------ . (7. 5)
工具变量法就是利用工具变量的外生性假设来识别原因变量和结果变量
之间的因果关系的,
但是,
工具变量的选择并不容易,
需要保证工具变量的外生
性条件成立,
往往需要研究者对所研究问题的背景知识具有相当的了解,
有些
工 具 变 量 来 自 于 外 生 的 “自 然 实 验 ”,因 而 工 具 变 量 有 时 被 称 为 “自 然 的 礼 物 ”
(Rosenzweig and Wolpin, 2000) 。
下 面 看 一 个 经 典 的 例 子 ,Angrist and Krueger (1991)利 用 美 国 的 普 查 数
据 估 计 了 美 国 的 教 育 收 益 率 。在 教 育 收 益 率 的 研 究 中 ,
能力变量是一个文献中
公认的混杂因素,
会影响个体的教育选择,
也会影响个体的收入水平,
但 是 ,能
力往往无法观测,
@ 无 法 利 用 匹 配 或 回 归 方 法 得 到 教 育 的 正 确 因 果 效 应 ,为 此 ,
考虑寻找教育的工具变量,
这个工具变量需要与教育密切相关,
但不能与能力
或 其 他 未 观 测 因 素 有 关 。Angrist and Krueger (1991)利 用 美 国 义 务 教 育 法 对
人学年龄和退学年龄的限制,
找 到 工 具 变 量 即 个 人 的 出 生 季 度 。个 人 出 生 季 度
为 什 么 可 以 作 为 教 育 的 工 具 变 量 呢 ?首 先 ,
美国各州一般规定到当年年底前年
① 工 具 变 量 z 的 作 用 是 将 因 果 路 径 d —y 造 成 的 相 关 性 分 离 出 来 ,
从而排除了其他混杂因素造成
的影响„
②简化式的概念来自于联立方程模型, 是 所 有 内 生 变 量 对 所 有 外 生 变 进 行 回 归 的 模 型 ,与之相
对应,
结构式是根据经济理论或行为假设构造的模型, 结 构 式 左 右 边 可 以 同 时 有 内 生 变 萤 和 外 生 变 量 ,而
简化式是左手边全部为内生变量, 右 手 边 全 部 为 外 生 变 量 。从 而 对 于 简 化 式 ,可以直接利用回归方法进
行参数估计,
再 从 简 化 式 参 数 中 反 推 出 结 构 式 参 数 。凡 是 恰 好 能 够 从 简 化 式 反 推 出 唯 一 一 组 结 构 式 参 数
的,
称为恰好识别, 如果可以从简化式中推出多个满足结构式的参数, 称为过度识别, 如果无法从简化式
推出结构式参数,
称 为 不 可 识 别 。尽 管 现 在 联 立 方 程 组 方 法 已 经 不 再 流 行 ,
但与之相关的概念仍然在计
量经济学中广泛应用。
③ 有 些 文 献 利 用 I Q 指 数 作 为 能 力 的 代 理 变 跫 ,但 这 也 依 赖 于 数 据 是 否 提 供 类 似 代 理 变 蛩 。
122. 基本有用的计量经济学
满 6 岁 的 孩 子 可 以 在 当 年 9 月 份 人 学 ,这 一 限 制 会 使 个 体 人 学 年 龄 产 生 差 异 ,
1 2 月份出生的孩子,
人学时年龄还不到6 岁 ,
然 而 ,1 月 份 出 生 的 孩 子 人 学 时 年
龄 已 经 接 近 7 岁 。 因 而 ,出 生 季 度 不 同 ,
意味着A 学年龄不同,
第四季度出生的
孩 子 入 学 时 年 龄 较 小 ,而 第 一 季 度 出 生 的 孩 子 人 学 时 年 龄 较 大 ,
两者相差近1
岁 。® 仅 仅 根 据 这 一 点 还 不 能 保 证 出 生 季 度 是 合 适 的 工 具 变 量 ,美 国 义 务 教 育
法还明确规定,
小孩年龄必须达到1 6 岁才能退学,
人学年龄限制和退学年龄限
制,
这两点结合起来, 对于准备在16岁
使出生季度与教育年限之间发生关系,
退 学 的 孩 子 而 言 ,出 生 于 第 一 季 度 的 由 于 人 学 年 龄 较 大 ,
1 6 岁退学时的受教育
年限不足10年,
而对于第四季度出生的孩子由于人学年龄较小,
1 6 岁退学时受
教 育 年 限 超 过 1 0 年 ,因 而 ,
平 均 而 言 ,出 生 于 第 一 季 度 的 受 教 育 年 限 较 短 ,
而出
生于第四季度的受教育年限相对较长,
使得受教育年龄与出生季度有关系。图
7 . 2 复制了 Angrist and Krueger (1991)文 章 中 的 图 I ,
总体上看,
平均教育年
限有增长的趋势,
这 与 社 会 发 展 和 人 们 对 教 育 的 重 视 有 关 ,出 生 年 份 越 晚 的 个
体倾向于受更多的教育,
对于这一点可以通过控制出生年份来消除影响。
®我
们主要关注教育年限与出生季度之间的关系,
三 、四 季 度 出 生 的 个 体 比 一 、
二季
度出生的个体倾向于受更多的教育,
并且所有出生年份的个体均有类似模式,
从 而 说 明 教 育 与 出 生 季 度 之 间 确 实 有 密 切 的 关 系 :。事 实 上 ,图 7. 2 反 映 了 工 具
变 量 估 计 量 的 第 一 阶 段 ,即 (
7. 5)分 母 上 的 部 分 。
直 觉 上 看 ,出 生 季 度 不 会 直 接 影 响 个 体 收 人 ,
用人单位不会因为出生季度
的 不 同 而 支 付 不 同 的 工 资 ,因 而 ,出 生 季 度 满 足 外 生 性 条 件 。但 是 ,
个人收人与
出生季度之间的关系也表现出类似于教育与出生季度之间的模式,
参 见 图 7.3。
图 7. 3 显 示 ,
总体上收入比较平缓,
不同年份出生的人平均收人差异不大,
有一
点点向下倾斜的趋势,
主 要 是 因 为 年 长 的 人 工 作 经 验 更 多 ,这 一 点 可 以 通 过 控
制 出 生 年 份 或 年 龄 来 消 除 。我 们 关 注 的 仍 然 是 出 生 季 度 与 收 入 之 间 的 关 系 ,
可
以 看 出 ,一 、二 季 度 出 生 的 个 体 相 对 于 三 、四 季 度 出 生 的 个 体 ,
平均收人要低一
些,
并 且 对 所 有 年 份 出 生 的 个 体 均 有 类 似 模 式 。但 是 ,出 生 季 度 不 会 对 收 入 产
生直接影响,
为何收入表现出上述变动模式呢?唯一的原因可能是出生季度通
过影响教育间接影响个人收人,
从而使个人收人与出生季度之间出现类似变动
醛掛 賴
te
1 2 . 2 ..................................................................................................
30 31 32 33 34 35 36 37 38 39 40
出生季度
图 7 . 2 教育与出生季度的关系
模 式 。 图 7. 3 呈 现 的 实 际 上 是 简 化 式 ,即 工 具 变 量 估 计 量 (7, 5)分 子 上 的 部 分 。
溆 5-91
H
§ 5.%
犮
5.89
5.88
上述的两张图形可以写成下列计量经济学模型:
Di — X{7tio + K n £i,- (7,6)
Y ; = X!7r20~l-7r21Z ;-he2i (7.7)
(7. 6)是 第 一 阶 段 回 归 ,
是 控 制 X ; 后 工 具 变 量 乙 对 原 因 变 量 D,.的 影 响 ,
(7. 7)是 简 化 式 ,
®反映的是控制兄后,
工 具 变 量 Z,.对 结 果 I 的 影 响 。因为引入
① 在 联 立 方 程 理 论 中 ,(
7. 6 ) 和 (
7. 7 ) 均 称 为 简 化 式 ,因 为 内 生 变 量 均 在 左 手 边 ,
外 生变U 均在右手
边。
124 基本有用的计量经济学
了协变量足,
相应的结构式可以写为:
Y; = X ;
a + rD,- + 77, (7,8)
在本例中,
X,.表 示 出 生 年 份 ,以 控 制 不 同 年 份 对 教 育 和 收 人 的 影 响 ,所 谓 同 辈
效应(
cohort effects)^ 兄 包 括 常 数 1 ,
从 而 不 用 写 出 常 数 项 。将 (7. 6 )代 入 结
构 式 (7. 8 ) ,
得:
Yi — + r[X/7Tio + TTnZ; + £],-] + Tji
r = ^ (7‘10)
丌]1
利 用 (5. 10),(7. 6)和 (7. 7)中 工 具 变 量 的 系 数 可 以 分 别 写 为 :
_ __ CoviD ;
,Zj) __ CovCY/ ,Zi)
Kn = Va~r(z;) , 兀21 = " V a r ( z ;)
其 中 ?,是 乙 对 X,.进 行 回 归 得 到 的 回 归 残 差 D 因 而 ,
(7. 10)可 以 写 为 ,
妲 = C o v C Y ,-,^ )
tth CovCD,-,^)
对照(
7. 4 ) ,(7. 11)也 是 工 具 变 量 估 计 测 度 ,
只 是 5",替代了 Z,.,(7. 10)的样本形
式在计量经济学中通常称为间接最小二乘法估计量。
观 察 (7. 9)第 二 行 ,
整理一下可以写为:
y,- = X ;
a + r [ X ^ i o + 7 r n Z , . ] + e 2! (7. 12)
其 中 ^ 7 T 1Q+ ;
r n Z ; 是 原 因 变 量 D , 对 X , 和 Z,.的 总 体 回 归 方 程 ,由 于 Z . 和 X,
与 k 是 不 相 关 的 ,(7. 12)可 以 直 接 用 O L S 回 归 得 到 t 的 一 致 估 计 。我们可以利
用工具变量乙采用一种两阶段的方法估计因果效应参数,
第一步估计第一阶
段 回 归 (7. 6 ) ,
然 后 将 第 一 阶 段 得 到 的 D , 的 拟 合 值 代 人 结 构 方 程 (7. 8 ) ,
然后进
行第二阶段的回归(
7. 12),
这 种 方 法 称 为 两 阶 段 最 小 二 乘 法 ( 2 S L S ) 。具体应用
中使用样本数据,
第一阶段得到样本回归方程:
D, ~ X i K 10 7C] \Zi
第七章工具变量法 125
其 中 七 。、
^ 是 对 方 程 (7.6)进 行 O L S 估 计 得 到 的 回 归 系 数 ,
根据上述样本回归
方 程 得 到 A . 的 拟 合 值 亡 ,,
并 用 A 替 代 结 构 式 (7. 8 ) 中 的 A .进 行 第 二 阶 段 的
回 归 ,即 :
= X;
a + vD ;+ O + t (D;— D,)] (7. 13)
因为
所以,
第 二 阶 段 回 归 (7. 13)可 以 得 到 r 的 一 致 估 计 ,
其中第一项A 是足和乙
的 线 性 组 合 ,由 工 具 变 量 的 外 生 性 条 件 (7. 3),第 一 项 为 零 ;第 二 项 A 是第
一 阶 段 (7. 6)的 回 归 残 差 ,
根 据 回 归 系 数 的 性 质 (5, 9 ) ,回 归 残 差 与 解 释 变 量 X ,、
乙是正交的,
戍 是 X,.和 Z , 的 线 性 组 合 ,因 而 ,回 归 残 差 U - A 也 与 戌 .是 正 交
的,
从 而 第 二 项 也 为 零 。对 (7. 13) 回 归 得 到 的 估 计 量 称 为 两 阶 段 最 小 二 乘 估 计
量 ,但 要 注 意 一 点 ,
直 接 对 (7. 13)进 行 回 归 ,
得 到 的 标 准 误 差 是 不 正 确 的 ,因为
直 接 回 归 得 到 的 残 差 是 7, + 1 ( 辽一戍.),而 不 是 $ ,
正确的方法是利用两阶段回
归估计量计算出正确的残差:
7/ = « 2sls '^ hslsD,. (7. 14)
并利用其估计正确的标准误差。当然 ,
很多软件中均有相关的命令进行处理,
比 如 在 Stata软 件 中 dvregress命 令 就 可 以 直 接 进 行 两 阶 段 最 小 二 乘 法 的 估 计 ,
并 且 得 到 的 标 准 误 差 是 调 整 后 的 正 确 标 准 误 差 。很 容 易 证 明 两 阶 段 回 归 估 计
量是工具变量估计量,
观 察 第 二 阶 段 回 归 (7. 13),利 用 (5. 10)可 以 将 两 阶 段 回
归估计量写为:
- Cov(U,.) /n 1!r、
•r2sls = ------ (7. 15)
Var(D,)
Cov(D,.,
S;) = Cov(D, + (D, —D , ) , D ;)
= C o v ( D ;, D ;) + Cov(D,- — D, , D ;)
其中第二项中A 是第一阶段回归(
7. 6)的 回 归 残 差 ,
根 据 回 归 性 质 (5, 9 ) ,
回 归 残 差 d,.— 与 亡 是 尤 和 乙 的 线 性 组 合 )不 相 关 ,
而 +
D ;) ,gp 5 , 是 的 一 部 分 ,
因 而 ,回 归 残 差 A —A 也与氏不相关,
从而上式第
二项为零,
则
C o v C D ^ D , ) ^ Cov(D,,D,) = Cov((D, - D , ) + D (,D.)
126 基本有钼的计量经济学
= Cov(Z);— D ; ,
D ;) + V a r ( D ; )
其 中 舡 一 •是 A 对 x , 的样本回归方程,
5,' 是 相 应 的 回 归 残 差 ,因 而 Cov(i),
U ;) = 0 ,
则 V aK 5 , . ) = C o V ( D,,
A ) J t A S ( 7 . 1 5),
得:
,2s]s ^ C o v O ^ ) (7.16)
C o v ( D f, D ;)
与(
7. 4)具 有 相 似 的 形 式 ,
不 过 是 用 5 ,.替代了 Z ,.,
两阶段回归相当于用氐作为
工 具 变 量 ,因 而 ,
两阶段最小二乘估计量也是工具变量估计量。
如果工具变量乙为二值的,
则 工 具 变 量 估 计 量 具 有 更 为 简 单 的 形 式 ,定义
Z,-= l 的 概 率 为 /»,
则
C o v ( y 1,z,)= £ [ y ,z ;]
- E L Z ^ l Y , 丨Z J ] — 坤 :[ E [ l | Z J J
= p E [ Y ( I Z, - 1 ] - p ( p E l Y ; 丨Z' = 1]
+ (1-/»)E[Y,- | Z, = 0])
= p a - p H E i Y , I z, = 1 ] - E [ y ; I z' = 0] }
同样地,
Cov(D, ,Z,) = p { \ - p ) { E l D i | Z, - 1] - ElDi | Z t = 0]}
则工具变量估计测度为:
— C o v ( U ) — ElY, 1 Z f = l] - g [ Y , - | 2,- = 0]
IV Cov(D, ,2i) — E l D i 「2,. = 1] — E l D ; | Z, = 0] ’
;
O LS估 计 量 为 7% ,
W a ld 估 计 量 比 O L S 估 计 量 高 ,说 明 O LS估计可能低估了
教育收益率。
表 7 .1 利 用 出 生 季 度 工 具 的 教 育 收 益 率 W a ld 估计
⑴ (2 ) (3 )
第一季度 第四季度 平均值之差
⑴ 一 (2 )
(.0 0 3 4 )
(.0 1 6 )
教 育 收 益 率 的 W a ld 估计量 .089
(■021)
教 育 收 益 率 的 O L S 估计量 .070
(.0 0 0 5 )
在 另 一 篇 有 趣 的 文 章 中 ,A n g riSt(l990)考 察 了 越 战 期 间 服 兵 役 对 个 人 收
人的影响,
充分体现了 W a l d 估 计 量 的 威 力 。2 0 世 纪 7 0 年 代 越 战 期 间 ,
为了 保
证征兵的透明性和公正性,
美国采用了一种特殊的征兵机制,
为每一天赋予一
个随机的数字,
一 年 3 6 5 天 共 1一 3 6 5 个 数 字 随 机 地 分 配 到 每 一 天 ,
从而使每个
人的生日均对应一个随机化的数字,
不 妨 称 之 为 征 兵 随 机 数 。征 兵 随 机 数 产 生
之后,
美 国 国 防 部 会 给 出 一 个 门 槛 ,比 如 1 9 7 0 年 为 195,所 有 生 日 对 应 的 随 机 数
字 低 于 195的获得参军资格,
而 生 日 对 应 随 机 数 字 高 于 1 9 5 的 不 需 要 参 军 ,当
然获得参军资格的人也可能由于身体或升学原因而免除参军义务,
没有参军资
格的人也有部分志愿参军,
但 数 量 非 常 少 ,可 以 忽 略 。 由 于 征 兵 随 机 数 的 产 生
机 制 使 参 军 资 格 完 全 独 立 于 个 体 特 征 ,但 参 军 资 格 却 对 是 否 参 军 具 有 重 要 影
响,
因而,
参 军 资 格 成 为 一 个 天 然 的 工 具 。用 乙 来 表 示 参 军 资 格 ,
乙 = 1 表示 获
得 参 军 资 格 (即 个 人 生 日 对 应 的 随 机 数 低 于 门 槛 ),
乙= 0 表示没有参军资格。
获得参军资格参军的可能性会更大,
除非由于身体或升学原因才能免除参军义
D,. = l 表 示 个 体 i 在 越 战 期 间 参 军 了 ,
务 。用 D , 表 示 最 终 是 否 参 军 , A. = 0 表
示 没 有 参 军 。Z ; 和 D,.之 间 密 切 相 关 ,由 于 征 兵 随 机 数 生 成 的 随 机 性 ,
可以认为
乙 独 立 于 个 体 的 潜 在 收 人 ,即 是 否 获 得 参 军 资 格 并 不 直 接 影 响 个 人 收 人 ,因而
是一个合适的工具变量。
基本有用的计蠆经济学
128
表 7. 2 越 战 期 间 参 军 对 美 国 白 人 男 性 收 入 影 响 的 W ald 估 计 量
收 人 ( y ,) 参军状态( D ;)
--------------------------------------------------------------------------------- W akH 古计量
年份 均值 资格效应 均值 资格效应 (5)
(1) (2) (3) (4)
表 7. 2 列 出 的 是 出 生 于 1 9 5 0 年 的 美 国 白 人 ,
1970年他们面临服兵役,
从而
受 到 影 响 。第 1 列 是 对 应 年 份 的 平 均 收 人 ,
第 2 列资格效应是对应于有资格的
个 体 和 没 有 资 格 的 个 体 平 均 收 人 的 差 额 ,即 £:
[>,. IZ, = 丨乙= 0] 。可
以 看 到 1971年 参 军 1 年 后 ,
两组人群收入就有差异,
有资格的人和没有资格的
人相比,
平 均 收 人 下 降 3 2 6 美 元 。十 年 之 后 ,当 年 获 得 参 军 资 格 的 个 体 平 均 收
人仍然显著低于另一组人群,
平 均 收 人 下 降 4 3 6 美 元 。然 而 ,
1969年两组人群
(参 军 之 前 的 )
平均收人并没有显著差异,
这说明参军资格并没有直接影响个人
收入,
而 可 能 是 通 过 参 军 影 响 到 收 人 。第 3 列 显 示 ,
1950年出生的美国白人中
参军者占26.7%,
第 4 列资格效应说明有参军资格的参军可能性比没有参军资
格的参军可能性要高15.9%,
即 E[D,|2, = 1 ] - £ :
[ A I ^ = 0]d 第 5 列是相应
的 W a k H 古计量,
反 映 的 是 参 军 (D,.)对 个 人 收 人 (
匕 )的 影 响 ,
结果显示,
参军一
年后,
个人收人就因为参军而降低了 2050美 元 ,
十 年 后 ,影 响 仍 然 存 在 ,
参军使
收 入 降 低 2 7 4 1 美 元 。Angrist (1990)从 参 军 影 响 个 人 在 劳 动 力 市 场 上 的 人 力
资本积累的角度提供了一种解释。
有效的工具变量需要满足相关性和外生性两个基本条件,
相关性很容易检
验,
第一阶段的回归系数即可以反映出工具变量是否与原因变量相关,
可以利
用 t 统 计 量 或 F 统计量进行检验。困难的是对外生性的判断,
很多时候是依赖
于研究者对所研究问题的制度背景的把握和经济直觉。
® W a l d 估计量的一个
①如果一个内生变量有多个工具变蛩,
在同质性工具变量法框架下,
可以用过度识别检验来考察
外 生 性 条 件 是 否 成 立 ,即 ^ ^ [ ^ ^ ^ ^ ,
相 应 样 本 矩 记 为 切 仍 山 }) - l / N ^ > 冲 (
厂沾),检 验 估 计 量
为 J = iV„,(r2SLs M _ 1m ( r m . s ) 〜 f ( Q — 1 〉,
其 中 Q 为 工 具 变 a 数 目 „ 详 细 讨 论 可 以 参 考 Angrist and
Pischke(2009);洪 永 淼 ( 2011) a
第七章工具变量法 129
重要优势是识别外生性假设比较直观,
W a l d 估计量识别因果效应的主要依据
是, 随 乙 变 化 的 唯 一 原 因 是 E[D,.lZ,.]随 乙 变 化 造 成 的 。
( D 而对于这
一点可以有两种办法,
一 种 办 法 是 检 验 工 具 变 量 Z ,• 是 否 与 影 响 兄 的 观 测 变 量
兄相关,
如 果 乙 与 部 分 影 响 Y,.的 观 测 变 量 X,.相 关 ,
则说明工具变量还通过其
他 途 径 影 响 到 Y,.,
尤 其 是 担 心 2,.也 可 能 通 过 影 响 1 6 的 未 观 测 因 素 影 响 到 Y ,,
从
而 不 满 足 外 生 性 。上 文 中 ,
作 者 利 用 1969年 的 收 人 ,
观察工具是否影响收入,
发现工具对收人没有影响,
从而说明工具没有通过影响收人的其他因素影响到
收人,
就 是 利 用 了 这 种 方 法 。另 一 种 方 法 是 利 用 Z,.与 D , 不 相 关 的 样 本 ,
检验
Z,■
是否与K 相关,
这 种 方 法 依 赖 于 数 据 。AngriSt(1990)指 出 ,
1973年美国也针
对 1953年出生的个体实施了征兵随机数的分配,
但 是 ,国 防 部 最 终 没 有 根 据 这
—数 字 进 行 征 兵 ,
从 而 使 作 者 获 得 一 个 工 具 与 原 因 变 量 没 有 关 系 的 子 样 本 ,利
用 1953年出生的个人的数据,
发现参军资格与个人收入之间没有关系,
从而证
明 征 兵 随 机 数 不 会 直 接 影 响 个 人 收 入 。这 两 种 方 法 可 以 用 图 7. 4 表 示 ,
为了 检
验 工 具 Z 只 通 过 D 这 一 途 径 影 响 Y , 而 不 会 通 过 其 他 影 响 Y 的 变 量 影 响 Y 。图
7 . 4 U ) 是 检 验 Z 与 X 是 否 相 关 。这 一 方 法 并 不 完 全 充 分 ,事 实 上 ,
如果2 与X
相关,
X 可以观测, 控 制 X 后 ,Z 只 要 不 与 未 观 测 变
则我们可以利用后门规则,
量 v 相关,
Z 仍然满足外生性,
是 有 效 的 工 具 变 量 。 图 7. 4(b)是 Z 与 D 没有 关
系时,
检 验 Z 与 Y 是否相关,
如果Z 与 y 不相关,
则 说 明 Z 没有通过其他影响
Y 的因素影响到Y 。
①有些人认为,
要 检 验 z 只通过d 影 响 Y ,
而不通过其他路径影响y,可以通过控制d 后 检 验z
和 y 之 间 是 否 相 关 。这 种 方 法 具 有 一 定 的 作 用 , 如果控制d 后发现z 与 y 不相关, 可 以 说 明 2•仅 通 过 o
影响y , 从 而 2 满 足 外 生 性 条 件 。但 是 , 如 果 发 现 控 制 1)后 ,
2 与 Y 相关, 并 不 能 说 明 Z 不满足外生性条
件 。图 7. 1(b)中 Z 是 有 效 的 工 具 变 量 ,满 足 外 生 性 ,由 于 D 是 Z 和 A 的 交 汇 变 量 (collider) ,以 D 为条
件, 2 和 A 将 表 现 出 相 关 性 ,从 而 2 与 y 之 间 表 现 出 相 关 性 。因 而 ,如果控制D 后发现2 与 Y 相关, 并不
能说明工具变量不满足外生性条件。
130 基本有用的计量经济学
工 具 变 量 估 计 量 是 一 致 估 计 量 ,只 有 当 样 本 容 量 足 够 大 时 ,
工具变量估计
量才接近于真实值,
在有限样本下,
估计偏差可能会比较大,
尤其当工具变量外
生性条件不满足并且存在弱工具变量时,
工具变量估计量的估计偏差可能会更
大 。 回 到 (7. 4)式 ,
如 果 Cov(v,.,
乙 )关0 ,
则
... C o v ( Y ^ Z ;) C o v(t?,.,
Z,.)
riV_ C o v ( D ,., 乙) CovCD^Zi)
_ , CovC??,-,
Z,.)
" Co錢 , 乙)
其 中 纟 是 估 计 偏 差 ,
如果此时工具变量相关性不强,
存在弱工具变量
问 题 ,即 C o v ( D , ,
Z,.)比 较 小 ,即 使 C o v b ,
^ ) 比较小,
也可能产生很大的估计
偏差。
即使使用完全随机化产生的工具变量也不能完全保证外生性条件的成立。
比如,
A n g riSt(1990)利 用 征 兵 随 机 数 作 为 参 军 状 态 的 工 具 变 量 识 别 参 军 对 个 人
收人的影响;
H e Ck m a n (1997)指 出 ,征 兵 随 机 数 分 配 之 后 ,国 防 部 公 布 门 槛 之
前,
如果雇主根据雇员的随机数进行相应的人力资本投资,
对于那些随机数较
小、
参 军 可 能 性 较 大 的 雇 员 ,降 低 他 们 的 职 业 培 训 机 会 或 安 排 他 们 从 事 一 些 短
期性的工作,
从而他们的收入相对较低,
就会使征兵随机数和个人收人相关,
征
.兵 随 机 数 不 再 满 足 外 生 性 要 求 。
传统工具变量法假设干预对所有个体的影响是相同的,
而现实中干预的影
响 往 往 是 异 质 的 ,同 样 的 政 策 干 预 对 有 些 个 体 影 响 大 ,
对 有 些 个 体 影 响 小 ,同样
是接受大学教育,
有些人因此收人有很大提高,
有些人收人并没有因教育而变
化 多 少 ,因 而 ,同 质 性 假 设 往 往 不 符 合 现 实 。如 果 干 预 对 个 体 的 影 响 具 有 异 质
性,
工具变量只是识别一部分个体的平均因果效应,
不能将工具变量估计量解
释 为 总 体 的 平 均 因 果 效 应 或 简 单 地 解 释 为 干 预 组 的 平 均 因 果 效 应 。不 同 的 工
具 变 量 往 往 估 计 的 是 不 同 群 体 的 平 均 因 果 效 应 ,因 而 ,
不同的工具识别不同的
因果效应参数,
下一节将对此进行详细讨论。
第二节异质性工具变量法
下 面 讨 论 异 质 性 框 架 下 的 工 具 变 量 法 。所 谓 异 质 性 是 指 干 预 对 个 体 的
影 响 会 因 人 而 异 ,同 样 一 项 政 策 对 不 同 的 人 的 影 响 可 能 会 不 同 ,同 样 完 成 了
大学教育,
有些人收人提高很多,
有 些 人 收 人 没 有 太 大 提 髙 。 现 实 中 ,异 质 性
第七章工具变量法 131
例 7. 1 (独 立性假设)
D o , - , D 1 ; } X Z t- (7.19)
在这一假设下,
简化式m 回归的回归系数可以写为:
E lYi 乙
| = i ] - £ [ y ,-丨乙 = o ] = E [ y , . ( d u ,
i ) ] 一E [ y , . ( d 。,• ,( ) ) ]
同样地,
第一阶段辽对的回归系数可以写为:
E L D t | Z,- - 1 ] - E [ D ; | Z, = 0]
^ E L D l; | Z, = 1] — E [ D 0i | Z ; = 0] = E l D l; — D 。
,] (7. 20)
第 二 个 假 设 是 排 除 性 假 设 (exclusion assumption) ,
它要求工具变量排除在
所关心的因果效应模型之外,
工具变量不直接影响潜在结果。
132 基本有用的计量经济学
例 7 .2 (排除性假设)
O) = Y,.(d ,
Y'.W’ l) , d = 0,1 (7.21)
排除性假设说明一旦原因变量D , 取值给定,
工 具 变 量 Z ; 不会改变潜在结
果,
或者说一旦原因变量取值给定,
潜 在 结 果 不 依 赖 于 工 具 变 量 。在 这 一 假 设
下,
前面所讲的4 个潜在结果又会恢复到2 个 ,
从而可以用原来的潜在结果符
号 ,即
y 0f. = y (.(0 ,i) - y;( 0 ,
0)
Y。
;= Y , ( l , l ) - Y ,( 1 ,0 )
独立性假设和排除性假设两者结合起来,
实际上是上一节工具变量的外生
性 要 求 。但 外 生 性 假 设 要 求 工 具 变 量 与 模 型 未 观 测 因 素 不 相 关 ,
但并不清楚怎
么 样 才 能 不 相 关 。现 在 将 这 一 假 设 具 体 化 为 两 个 假 设 ,
对工具变量的外生性要
求 就 更 加 清 楚 了 。独 立 性 假 设 要 求 工 具 变 量 对 结 果 有 因 果 影 响 ,
但排除性假设
则要求原因变量一旦确定,
工具变量排除在因果模型之外,
从而说明工具变量
只通过影响原因变量这一唯一途径影响潜在结果。
例 7. 3 ( 单调性假设)
D u ^ Do, 或者 A, (7.22)
单调性假设是说工具变量对个体的影响方向一致。比如,
单调性
成立,
表示当工具变量由0 变 为 1 时,
会推动部分个体干预变量的选择由0 变
为 1,
而 不 会 出 现 个 体 干 预 变 量 选 择 由 1 变 为 0 的 情 况 。当 给 个 体 参 与 资 格 时 ,
受 到 影 晌 的 个 体 就 会 选 择 接 受 资 格 从 而 选 择 参 与 ,在 正 向 单 调 性 假 设 下 ,
不会
出现给予资格时,
他 反 而 选 择 退 出 的 情 况 。很 多 时 候 ,
单调性假设是合理的。
在正向单调性下, 当 工 具 变 量 由 乙 = 0 变 为 Z, = l 时 ,
原因变量
■D,只 有 二 种 可 能 性 ,
认 ,.= D n = 0 、
D。,.= = 1 = 0 且 D!,.= 1 。第 ~■种 情 况 ,
无 论 工 具 变 量 怎 么 变 化 ,个 体 总 是 选 择 不 参 与 ,这 种 个 体 称 为 从 不 参 与 者
(never takers)。第 二 种 情 况 ,
无论工具变量怎么变化,
个 体 总 是 选 择 参 与 ,因而
称 为 总 是 参 与 者 (always takers) 0 第 三 种 情 况 ,
个体选择会随着工具变量变化
而变化,
并且遵守工具变量的激励,
不 给 予 资 格 就 不 参 与 ,给 予 资 格 就 会 参 与 ,
这 类 个 体 称 为 依 从 者 (compliers)。还 有 一 种 个 人 ,
满 足 = 1 且 D h= 0 ,
这种
个 体 不 给 予 他 资 格 时 他 偏 要 参 与 ,而 给 予 他 资 格 时 他 不 参 与 ,因 而 称 为 叛 逆 者
(defiers)。但 在 正 向 单 调 性 假 设 下 ,
不 会 出 现 叛 逆 者 。如 果 是 负 向 的 单 调 性 假
设 成 立 ,
则包含叛逆者,
不 包 含 依 从 者 。很 多 时 候 正 向 单 调 性 假 设 更
符 合 现 实 ,因 而 ,
后文若无特别说明,
单调性均指正向单调性。
给 定 独 立 性 假 设 、排 除 性 假 设 、
单调性假设和第一阶段存在四个基本条件
第七章工具变量法 133
下,
工具变量估计测度可以解释为受到工具变量影响的这一部分个体的平均因
果效应,
这 一 因 果 效 应 测 度 通 常 称 为 局 部 平 均 因 果 效 应 (Local Average Treat
ment Effect, L A T E ) 0
定理 7 .1 (LATE 定 理 (
Imbens and A ngrist,1 9 9 4 ) ) 假设
( 1 ) 独 立 性 ,{ n . ’ o m ' d l ) ,D0, ,
D W} JLZ, ’
( 2 ) 排除性, ^= 0, 1
( 3 ) 第 一 阶 段 存 在 ,E [ D W —D 。
,]乒 0
( 4 ) 单调性,
则
S r l t = - ^ [ A ^ o ] = 咖 飞 .1 > D。
'.](7-23)
(7. 23)左 边 是 W a l d 估 计 测 度 ,
对应于工具变量估计测度,
右边认,.〉 /)。
,•等
价 于 1)1;= 1,1)。
,.=0,即 依 从 者 。 因 而 ,
定 理 7. 1 说 明 ,
如果满足上述四个基本
假 设 ,那 么 工 具 变 量 估 计 测 度 估 计 的 是 依 从 者 的 平 均 因 果 效 应 L A T E 定理
7. 1 非 常 重 要 ,
告诉我们工具变量到底估计的是什么参数,
工具变量估计量估计
的 是 依 从 者 的 平 均 因 果 效 应 。在 异 质 性 因 果 效 应 框 架 下 ,
不能简单地将工具变
量估计解释为总体的平均因果效应, 工具变量只能估计出受工具变量影响的这
一 部 分 群 体 的 平 均 因 果 效 应 ,那 些 对 该 工 具 变 量 没 有 反 应 的 个 体 的 平 均 因 果 效
应 是 没 有 办 法 利 用 工 具 变 量 法 估 计 出 来 的 。工 具 变 量 可 以 识 别 因 果 效 应 ,
得到
可信的因果效应参数估计,
从 而 具 有 内 部 有 效 性 。但 由 于 工 具 变 量 只 能 估 计 出
依从者的平均因果效应,
而依从者的因果效应并不一定能推广到其他个体,
从
而 不 一 定 具 有 外 部 有 效 性 。利 用 工 具 变 量 法 进 行 因 果 效 应 估 计 时 ,
必须要清楚
这一点,
不 能 将 工 具 变 量 估 计 量 直 接 推 广 到 其 他 群 体 。在 Angrist and Krueger
(1991)一 文 中 ,
工具变量估计量可以解释为那些准备在1 6 岁退学的孩子的教
育收益率,
这些孩子有可能是相对学习能力比较差的学生,
也可能是其上学机
会成本比较大的学生,
他 们 的 教 育 收 益 率 可 能 与 总 体 的 教 育 收 益 率 不 同 。An -
grist (1990)估 计 的 是 那 些 没 有 参 军 资 格 就 不 参 军 而 给 予 参 军 资 格 就 会 参 军 的
群体的平均因果效应,
参军资格工具变量不能估计出自愿参军者或免除参军义
务者的平均因果效应。
在异质性因果效应框架下,
工具变量估计量估计的是依从者的平均因果效
应,
因而,
工具变量不同,
工 具 变 量 的 依 从 者 通 常 也 会 不 同 ,因 而 ,
不同的工具变
①如果使用负向单调性假设,
则 工 具 变 fl估 计 测 度 表 示 为 叛 逆 者 的 平 均 因 果 效 应 《
基 本 有 用 的计量经济学
fi将 会 识 别 不 同 的 因 果 效 应 参 数 ,
得到不:同 的 估 计 结 果 。工 具 变 量 只 能 识 别 对
其 有 反 应 的 人 群 的 平 均 因 果 效 应 。如 果 有 多 个 工 具 变 量 ,
两阶段最小二乘估计
量 将 是 各 工 具 变 量 估 计 的 局 部 平 均 因 果 效 应 的 加 权 平 均 值 (Angrist and Pisch
ke, 2009),
很 难 解 释 其 经 济 意 义 ,因 为 不 同 工 具 估 计 不 同 人 群 的 因 果 效 应 ,
加权
平 均 之 后 代 表 的 是 哪 部 分 群 体 很 难 定 义 ,因 而 ,
在异质性框架下,
最好利用单一'
的工具来估计特定人群的平均因果效应(
M o r g a n and Winship,2015) 。下面给
出 L A T E 定理的证明^
证 明 首先,
Wald估计测度分子部分,
ELY, | z t = i ] = E [ y 0;+ cr 1;U ; I Z' = 1]
= E l Y 0i + (Yu - Y 0i) D u 丨乙= 1 ]
= E i Y 0i + ( Y u - Y 0;
) D U']
其中第一行和第二行利用观测结果与潜在结果之间的关系,
第三行利用独立性
假设。
同样地,
E L Y ; | z,. = 0 ] = E [ y 0l-+ ( y w —
两式相减,
得:
ELY, I Z,- - 1] - E [ y , - I Z, = 0] = E [ ( y u -YcOCD,,. - D 0(.)] (7. 24)
单 调 性 假 设 意 味 着 认 ,一D 。
,.等 于 1 或 0 ,
所以
E [ ( Y 1/-yo,)(r>1,.-Do,)] = ,I Dl; > Doi2PrlDu > D 0;
— Y。 ]
同样地,
可以得到:
E I D ; ! Z ; = 1] - E l D { | Z, = 0] = E L D V — D 0;
] = P r [ D 1; > D 0t-]
(7.25)
(7.24)/(7.25)即 得 证 。
下面看一下为什么要引人单调性假设,
如 果 没 有 单 调 性 假 设 ,认 ,.一D 。
,将
可 以 取 0 、1 、一 1 三 个 值 ,
W a l d 估计测度分子上的部分可以写成:
ELY, | Z ; = | 2, = 0]
= - n ,- i D u > D 0;
] P r [ D J(. > D 。
,.]
~ E l Y u ~ Y o i I D u < D 0,.]Pr[D1; < O 0,]
其中第一项是依从者的平均因果效应乘以依从者在总体中的比重,
第二项为叛
逆 者 的 平 均 因 果 效 应 乘 以 叛 逆 者 在 总 体 中 的 比 重 。此 时 ,
工具变量估计量估计
的是这两类群体平均效应的加权平均,
最终结果将无法解释,
尤其两者的效应
可能相互抵消,
从 而 工 具 变 量 得 到 没 有 影 响 的 结 果 ,但 事 实 上 干 预 对 这 两 类 人
第七章工具变量法 135
均 有 影 响 。正 向 单 调 性 可 以 保 证 总 体 中 没 有 叛 逆 者 ,消 除 了 第 二 项 影 响 ,
从而
可 以 将 工 具 变 量 估 计 量 解 释 为 对 依 从 者 平 均 因 果 效 应 的 估 计 。在 传 统 工 具 变
量 法 中 ,由 于 假 设 因 果 效 应 是 同 质 的 ,
单调性假设是不需要的,
利用上式,
如果
假设个体因果效应为常数,
即 则
E [ Y i | Z ; = 1 ] - E [ Y ; \ Z i ^ 0]
= r{Pr[Di ;> Do,] 一 P r [ D 1; < D 0i]} = r E [ D u — D 0;
]
从 而 W a l d 估 计 测 度 就 等 于 总 体 平 均 因 果 效 应 r。
1. 谁是依从者 •
L A T E 定理告诉我们,
工 具 变 量 法 估 计 的 是 依 从 者 的 平 均 因 果 效 应 。谁是
依 从 者 呢 ?根 据 上 文 的 定 义 ,
依 从 者 是 那 些 会 依 从 于 工 具 变 量 取 值 的 个 体 ,即
乙= 0 时 ,
其 个 人 选 择 严 0,
厶= 1 时 ,
其 个 人 选 择 1 ^ = 1 。但 是 ,
对于任一个
体其对应工具变量要么Z,=0,
要么乙= 1 ,
在数据中不可能同时看到个体f
在两个工具变量取值下的选择,
或者说潜在结果D 。
,.、
!),,.只 能 观 测 到 1 个 ,
也就
是 说 ,一般 而 言 ,
谁 是 依 从 者 是 无 法 观 测 到 的 。所 能 观 测 到 的 是 D ,.,
谁接受干预
谁没有接受干预是可以观测的,
我们关心的因果效应参数往往是定义在可观测
的 原 因 变 量 基 础 上 的 ,比 如 干 预 组 平 均 因 果 效 应 ( A T T )或 控 制 组 平 均 因 果 效 应
(ATC),
然而依从者往往与接受干预者和没有接受干预者并不完全相同,
因而,
L A T E 往 往 不 能 解 释 为 A T T 或 A T C 。但 是 ,
在 一 些 特 殊 的 情 况 下 ,可 以 识 别
出部分依从者。
首 先 讨 论 干 预 组 中 个 体 的 构 成 ,因 为 及 一 认 ‘
+ 彳以,.一A u ) Z , 。 因 而 ,D,.=
1 在正向单调性
假设下, = 1 意味着1^ = 1,
从 而 这 部 分 个 体 为 总 是 参 与 者 。另一部分
0,D,;—D 0,= l 且 乙 = 1 , 说 明 A , = l ,
D a,.= 0,是 依 从 者 。 因 而 ,干 预 组 中 包 括
两 部 分 群 体 :总 是 参 与 者 和 依 从 者 ,
因而,
E [ Y 1;-Yo, I D; = 1] = ELYw- Y o , - ! D 0l = l]P r [ D Q, - 1 I D ; = 1]
V y - . 、 V '
千预组平均因來效应 总是参与者平均因采软应
也就是说,
干预组平均因果效应实际上是总是参与者和依从者这两类人的平均
因果效应的加权平均,
而 工 具 变 量 法 只 能 识 别 出 依 从 者 的 平 均 因 果 效 应 ,如果
干预组中总是参与者比重非常小,
依从者的比重非常大,
那么工具变量估计量
可以近似地估计出干预组的平均因果效应。
对于控制组中个体的构成,
类似地,
控 制 组 中 也 包 栝 两 种 个 体 :从 不 参 与 者
和 依 从 者 ,因 而 ,
控制组平均因果效应可以写为:
136 基本有用的计量经济学
P r [ D u > D 0l | = 1] - P r [ D ' 二
-11 > D。
'.]
即对于依从者而言,
原因变量和工具变量完全一致。由独立生假设:
Pr[Z; = 1 [ D u > D o ,-:= Pr[Z, = 1]
依 从 者 占 总 体 的 比 重 ?1"[以 , . > 0 。
,]等 于 第 一 阶 段 参 数 估 计 £:
[1),.|2,. = 1] —
ECD,•丨乙= 0 ] 。 同 样 地 ,
控制组中依从者的比重为:
Pr[D u > Doi | D, = 0]
_ ( l - P r [ Z , = 1]){£[D,- 1 乙 = 1^-ElDi \ = 0]} n
- I - F r [ D ; = 1] ( . )
根 据 上 述 公 式 (7. 28)(7. 2 9 K 7 . 30 ) 可 以 估 计 出 依 从 者 在 总 体 中 、干预 组
中及控制组中的比重,
从 而 可 以 判 断 依 从 者 的 代 表 性 。如 果 依 从 者 所 占 比 重
比较大,
那 么 工 具 变 量 牯 计 量 的 解 释 力 可 能 会 更 强 。如 果 依 从 者 所 占 比 重 较
小,
那么,
所得到的工具变量估计量就不能简单地解释为总体的平均因果效
应 或 者 干 预 组 平 均 因 果 效 应 ,只 能 解 释 为 对 工 具 变 量 有 反 应 的 人 群 的 平 均 因
果效应。 '
尽 管 可 以 计 算 出 依 从 者 的 比 '重 ,
但仍然无法识别出谁是依从者,
从而无法
将 依 从 者 分 离 出 来 。但 是 ,
可以大概地了解依从者的基本特征,
假 设 X , 为一二
元 变 量 ,比 如 表 示 是 否 为 大 学 教 育 ,
则可以计算依从者中是大学教育的可能性,
Pr[X,- = 1 | D n > Dp,] = P r [Du > D oi J X,- = 1]
P r[X ; - 1] ~ Pr[D b. > Do,-]
_ E j D ;| Z,- = 1 ,
X; = 1] — E\_D;| Zj = 0,X, ^ 1] (1 .
: E[A. I Z,- = 1 ]-E [D ,- 1 Z t = 0] •
其中分母反映的是总体中依从者的比重,
分子表示的是具有大学教育特征的总
体 中 依 从 者 的 比 重 。如 果 上 式 大 于 1 ,
说明依从者中大学教育者可能性更大。
通过计算上述公式,
可以大概地了解依从者具有什么样的基本特征。
2 . 引入协变量
有时无法寻找到满足完全独立于潜在结果的工具变量,
我们可以引入条件
独立性假设,
工具变量满足以协变量为条件后独立于潜在结果,
即
{Yo,-,Y,/,Do,-,D1;} JLZ,- | X,- (7.32)
这 里 相 当 于 假 设 工 具 变 量 1 、类 似 于 分 层 随 机 化 实 验 产 生 的 数 据 ,
在相同的协
变 量 层 内 工 具 变 量 独 立 于 潜 在 结 果 ,
可 以 用 因 果 图 7 . 5 描述此时的识
别 方 法 。Z 本 身 不 是 独 立 于 所 有 潜 在 结 果 的 ,
Z 到 D 和 Y 存 在 后 门 路 径 Z —X
— 夕和之― 叉— 这两条后门路径 均 可 以阻断,
但是一旦控制协变量X , 从而
满足 Z 仅通过D 影 响 即 满 足 独 立 性 和 排 除 性 假 设 D 因而,
可以根据X 分
层,
在层内,
Z 满 足 独 立 性 假 设 。假 设 在 层 内 也 满 足 正 向 单 调 性 和 第 一 阶 段 存
138 基本有用的计量经济学
在,
则 上 文 的 L A T E 定理在协变量X 层内仍然满足,
从而
E l Y t | X,-,Z, = 1] - £[Y,- j 足 ,Z, = 0]
E l D { | X , ,Z, - 1 ] - E [ D , - | H - 0]
= ELYU- Y 0;| X , , D 1;> D 0i] = r c(X,) (7.33)
图 7. S 引 入 协 变 量后的工 具 变 量 识 别
即在协变量层内,
如 果 满 足 独 立 性 、排 除 性 、
第一阶段和单调性四个假设,
层 内 工 具 鸾 量 估 计 量 6 ( 足 .)可 以 解 释 为 具 有 特 征 兄 的 依 从 者 的 平 均 因 果 效
应 。如 果 想 得 到 依 从 者 的 无 条 件 平 均 因 果 效 _ ,
可以利用协变量的分布进行加
权 ,即
E [ Y U - Y 0i | D u > Do,] = E[ r c( X ;) | D u > D 0l] (7. 34)
假 设 X ;为 离 散 变 量 ,
则上式可以写成:
ElYu - Y 0i | D u > U,-] = 5>fCx)Pr[;
C. - x | D h > D0
;]
J
— r 、Pr[X,- = x^PrWu > Dp,- j X ;= _r]
—4" f Pr[Dlt> D 0iJ
. ,v 、 V ar(E [D f | X (,Z,] | X ,)
如 O = E[Var(E[D,- | X ifZ j | X ;)]
Var(E[D,- 1 U ] 丨X,.)
= E{E[D,- I U ] ( 取 ' I X itZ ;
l ~ E [ D ; [ X J ) I X,}
3 . 随 机 化 实 验 与工具变量法
在随机化实验中,
通 过 随 机 机 制 可 以 将 个 体 分 配 到 干 预 组 和 控 制 组 。但是
在现实的随机化实验中,
会 出 现 非 依 从 的 现 象 。分 配 到 干 预 组 的 个 体 有 可 能 不
愿意接受积极的干预,
而分配到控制组的个体有时希望接受干预,
从而随机化
分 组 和 实 际 是 否 接 受 干 预 之 间 不 一 致 。有 些 时 候 ,由 于 控 制 组 往 往 不 需 要 施 加
任 何 积 极 的 干 预 ,因 而 ,
实验者可以控制分配到控制组的个体接受积极干预,
但
是,
分 配 到 干 预 组 的 个 体 需 要 接 受 积 极 的 干 预 ,如 果 参 与 者 不 愿 意 接 受 ,
实 验者
往往不能进行强制,
从 而 出 现 分 配 到 干 预 组 的 个 体 退 出 积 极 干 预 的 情 况 ,出现
单边的非依从现象,
即分配到控制组的个体都会依从于分配,
保持在控制组里
面,
但分配到干预组的个体,
有些可能不愿意接受积极干预而不依从于分配,
退
出 干 预 组 ,从 而 回 到 控 制 组 中 。这 种 情 况 卞 ,我 们 不 能 用 接 受 干 预 的 个 体 和 没
有 接 受 干 预 的 个 体 的 结 果 直 接 进 行 比 较 ,因 为 接 受 干 预 的 个 体 可 能 存 在 着 选 择
性样本。
考 虑 例 3. 1 提 到 的 关 于 培 训 的 随 机 化 实 验 ,通 过 随 机 机 制 将 有 资 格 的 个 体
分配到干预组和控制组,
干 预 组 个 体 将 接 受 政 府 资 助 的 职 业 培 训 ,而 控 制 组 个
体 没 有 相 应 的 职 业 培 训 。被 分 配 到 干 预 组 的 个 体 有 些 没 有 参 与 职 业 培 训 ,
可能
是他找到了更好的工作,
或 其 他 原 因 。如 果 退 出 干 预 组 的 个 体 都 是 那 些 相 对 就
业能力更强的个体,
那么最终真正接受培训的干预组个体将与控制组个体不相
同 ,由 于 分 配 到 干 预 组 中 的 能 力 较 强 者 退 出 ,剩 下 的 都 是 相 对 能 力 较 弱 者 ,这
样,
实际接受干预的个体和没有接受干预的个体就不再具有可比性,
根据实际
实施的干预状态进行的比较分析存在着样本选择偏差。
在 随 机 化 实 验 中 ,出 现 这 种 非 依 从 的 现 象 后 ,
不能根据实际实施的干预状
态来进行分组比较,
在医学中,
通 常 使 用 所 谓 的 意 向 性 干 预 分 析 。意 向 性 干 预
分析是指不管事后实际分组如何,
仍然以原来的随机化分组为基础比较分析两
组 结 果 的 差 异 ,以 避 免 根 据 实 际 分 组 可 能 造 成 的 样 本 选 择 性 偏 差 。用 乙 来 表
示随机化分配的干预状态,
D , 表 示 实 际 实 施 的 干 预 状 态 , 表示事后的观测结
果 。那 么 意 向 性 分 析 主 要 是 考 察 随 机 化 分 配 变 量 乙 与 之 间 的 关 系 ,由 于 乙
140 基本有用的计量经济学
是 随 机 化 分 配 的 ,因 而 ,
乙对结果I 的影响可以用两组结果之差来进行测度,
因而,
Z , 对 匕 的 影 响 称 为 意 向 因 果 效 应 (Intention to Treat, I T T ) ,
定义为:
riTT_Y = ElY,- | Z, = 1 ] - E [ Y ;| Z, - 0] (7. 39)
意 向 因 果 效 应 并 不 完 全 是 原 因 变 量 的 因 果 影 响 ,因 为 随 机 化 分 配 的 干 预 组
中有一部分没有接受积极的干预^ 假设因果影响是正向的,
那 么 I T T 会低估干
预 组 平 均 因 果 效 应 。实 际 上 ,在 这 种 随 机 化 实 验 中 ,
可以利用工具变量法进行
估 计 。由于干预分配的随机性,
使乙独立于所有的潜在结果,
而随机化分配的
干 预 状 态 乙 与 实 际 接 受 的 干 预 状 态 D,.之 间 密 切 相 关 。如 果 分 配 到 干 预 组 ,
则
接受干预的可能性会更高,
而分配到控制组,
则 不 会 接 受 干 预 。因 而 ,
随机化分
配 的 干 预 状 态 Z,.天 然 是 接 受 的 干 预 状 态 认 的 有 效 工 具 变 量 。 (7. 39)估计出
的意向因果效应实际上是工具变量法中简化式估计系数,
可以利用第一阶段估
计 量 去 修 正 ,只 不 过 在 单 边 非 依 从 的 情 况 下 ,
所有接受干预的个人都是被随机
化 分 配 为 干 预 组 的 个 体 ,不 存 在 被 随 机 化 分 配 到 控 制 组 而 实 际 接 受 干 预 的 个
体 ,因 而 ,
P r [ D ; = 1 丨Z,. = 0] = E[D,- | Z,. = 0] = 0
第一阶段简化为:
, r rrn) — I 2, = 1] — E{_D;J 7., — 0 ] — £ [ D ,.丨 Z,' — 1]
从而,
工具变量估计量为:
r,TTD E[D,- ! Z, = 1]
如果出现双边非依从的现象,
被分配到控制组中的个体有人接受了积极的
干预,
但 接 受 干 预 的 可 能 性 应 该 更 低 。那 么 ,
仍然可以用随机化分配的干预状
态 乙 作 为 实 际 接 受 的 干 预 状 态 D,.的 工 具 变 量 ,
那 么 ,因 果 效 应 估 计 就 是 上 文
导 出 的 结 果 (7.23) 。
第三节工具变量法的软件实现
1. 数据说明
13\\^^)、
个 人 年 龄 (八0 £ ) 、教 育 年 限 (£ 〇1 1 0 、出 生 年 份 (丫0 6 ) 、出 生 季 度
( Q 0 B K 8 个地区虚拟变量、
9 个出生年份虚拟变量等信息。
2. Stata软 件 中 的 工 具 变 量 估 计 命 令
Stata软 件 中 的 工 具 变 量 估 计 命 令 为 ivregress,它 的 基 本 语 法 和 选 项 如 下 :
options Description
SE/Robust
vce C vcetype) vcetype may be unadjusted, robust, cluster clustvar,
bootstrap ,
jackknife, or hac kernel
Reporting
level( # ) set confidence level ;default is level(95)
first report first _ stage estimates
ivregress可 以 采 用 三 种 类 型 的 估 计 量 ,
除了前面介绍的两阶段最小二乘估
计 量 2sls,还 包 括 有 限 信 息 极 大 似 然 估 计 limi和 广 义 矩 估 计 g m m ,
这里重点考
察 两 阶 段 最 小 二 乘 估 计 量 。depvar是 被 解 释 变 量 ,varlistl是 观 测 协 变 量 X ,,
为可选项,
(varlist2 = varlist_iv)为 必 选 项 ,
等号左边为内生变量列表,
等号右
边 为 工 具 变 量 列 表 ,选 项 vceCvcetype)可 以 选 择 稳 健 标 准 误 差 robust、
聚类到分
组 变 量 clustvar的 标 准 误 差 、自 抽 样 标 准 误 差 等 。选 项 first可 以 输 出 第 一 阶 段
估 计 结 果 。工 具 变 量 回 归 之 后 ,
还 有 三 个 相 关 的 命 令 :estat endogenous, estat
firststageNestat overid。ivregress命 令 之 后 可 以 使 用 这 三 个 命 令 进 行 相 关 的 检
验,
estat endogenous可 以 检 验 内 生 性 是 否 存 在 ,
estat firststage报 告 第 一 阶 段
回归的相关统计量,
包括 尺 2、
F 检验等,
estat overid可 以 进 行 过 度 识 别 检 验 ,
如
果工具变量数多于内生变量数时,
在同质性框架下,
可以使用过度识别检验检
验外生性假设是否成立。
下面,
估 计 一 个 简 单 的 模 型 ,只 有 教 育 一 个 内 生 变 量 ,
没有任何控制变量,
142 基本有用的计量经济学
利用第一季度作为工具变量,
两阶段最小二乘估计结果如下:
Robust
EDUC Coef. t P > 11| [ 9 5 % Conf. Interval]
Std. Err.
QTR1 - ,1088179 .0133159 - 8,17 0/000 - .1349166 -.0827192
_cons 12.79688 .0065712 1947.43 0.000 12,784 12,80976
Robust
LWKLYWGE Coef. z P>|e| [ 9 5 % Conf. Interval]
Std. Err.
EDUC .101995 ' .0240315 4.24 0.000 .0548941 _1490959
一cons 4,597477 .306889 14.98 0.000 3.995985 5.198968
Instrumented :EDUC
Instruments :QTR1
因为加上了 first选 项 ,
所 以 ivregress首 先 报 告 了 第 一 阶 段 回 归 结 果 ,
反映
了教育与出生季度之间的相关性,
工 具 变 量 系 数 为 一 O . l l d 值 为 8. 1 7 ,
说明出
生 于 第 一 季 度 的 个 体 教 育 年 限 显 著 低 于 出 生 于 其 他 季 度 的 个 体 ,平 均 低 0. 11
年 。接 着 报 告 第 二 阶 段 的 估 计 结 果 ,
结 果 显 示 教 育 收 益 率 为 10. 2 % , 并 且 非 常
显 著 。如 果 不 想 报 告 第 一 阶 段 的 结 果 ,
可 以 不 加 first选 项 。如 果 使 用 多 个 工 具
变量,
工 具 变 量 估 计 结 果 之 后 可 以 利 用 estat overid进 行 过 度 识 别 检 验 以 判 断
工 具 是 否 外 生 。下 面 用 三 个 关 于 出 生 季 度 的 虚 拟 变 量 Q T R 1 、
Q T R 2 、Q T R 3 作
为教育的工具,
重新估计并进行过度识别检验,
结果如下,
第七章工具变量法 143
Robust
LWKLYWGE Coef. z P > |z| [ 9 5 % Conf. Interval]
Std. Err.
EDUC .1025976 .0195281 5.25 0.000 .0643233 .1408719
_cons 4.589781 .249385 18.40 0,000 4.100996 5.078567
Instrumented ;EDUC
Instruments :QTR1 QTR2 QTR3
. estat overid
Test of overidentifying restrictions ;
Score chi2(2) = 2.88386 (p = 0.2365)
结果显示,
教育收益率仍然为10 . 3 % ,
并 且 很 显 著 。过 度 识 别 检 验 统 计 量
服从自由度为2 的卡方分布,
可 以 利 用 卡 方 分 布 的 临 界 值 ,软 件 已 经 计 算 出 了
相 应 的 p 值 4 值 为 0. 2365 ,
远 远 髙 于 5 % 的 水 平 ,因 而 ,
没有办法拒绝原假设,
从而外生性条件成:
E[Z;
7.-]^0可 能 成 立 。
3 . 估计教育收益率
在这一节,
我 们 利 用 3 0 年 代 出 生 的 个 体 数 据 ,以 出 生 季 度 作 为 工 具 变 量 ,
重 现 Angrist and Krueger (1991)的 图 I 、图 V 和 表 IV。 图 I 和 图 V 描 述 的 是
平均教育年限、
平均对数周工资与出生季度之间的关系,
先 利 用 collapse命 令
’
将数据平均到季度:
方,
5 、6 列 控 制 了 出 生 年 份 、
所 在 地 区 、种 族 、城 市 及 婚 姻 状 态 ,7 、8 列 在 5 、6 列
基 础 上 进 一 步 控 制 年 龄 及 其 平 方 。使 用 的 工 具 变 量 为 所 有 出 生 季 度 及 出 生 年
份的交叉项,
估计程序如下:
global YR "YR20 YR21 YR22 YR23 YR24 YR25 YR26 YR27 YR2&" // 定义出生年份宏
global RG "NEWENG MIDATL EN0CEN1 WHOCENT SOATL ESOCENT WSOCENT MT" // 定义地区宏
global IV "QTR120 - QTR129 QTR220 - QTR229 QTR3Z0 - QTR329 YR20 - YR28" // 定义工具
变量宏
* *•估计 1 、
3、 7 列 * * *
5、
reg LWKLYWGE EDUC $ YR-
est sto olsl
reg LWKLYWGE EDUC $ YR AGEQ AGEQSQ
est sto ols2
reg LWKLYWGE EDUC RACE MARRIED $ YR $ RG
est sto ols3
reg LWKLYWGE EDUC RACE MARRIED AGEQ AGEQSQ $ YR $ RG
est sto ols4
* * 估计 2 、
4、 8 列* * *
6、
ivregress 2sls LWKLYWGE $ YR (EDUC = $ IV)
est sto ivl
ivregress 2sls LWKLYWGE $ YR AGEQ AGEQSQ (EDUC = $ IV)
est sto iv2
ivregress 2sls LWKLYWGE RACE MARRIED SMSA $ YR $ RG (EDUC = $ IV)
est sto iv3
ivregress 2sls LWKLYWGE RACE MARRIED $ YR $ RG AGEQ AGEQSQ (EDUC = $ IV)
est sto iv4
得 到 的 估 计 结 果 见 表 7. 3:
第七章工具变量法 145
表 7. 3 美国教育收益率估计
⑶
OLS 2SLS OIJ 2SL S 01^ 2SLS OLS 2SL S
EDUC 0. 0711**“ 0. 0891 … 0. 0711 … 0.0760*** 0. 0632 *** 0. 0S06 讲 0‘
0632^* 0.0600^
(0.0003) (0,0161) (0.0003) (0. 0290) (0.0003) (0.0164) <0.0003) (0.0290)
AGEQ - 0 ,0 7 7 2 —O’0801 -0.0760 -0. 0741
(0.0621) <0.0645) (0.0604) (0.062G)
AGEQSQ 0. 0003 0.0008 0‘OOOS 0.0007
<0.0007) (0.0007) (0‘0007) (0.0007)
RACE - 0 . 2575 - 0 . 2302 … U575 … - 0. 2G26***
(0.0040 CO.0261J <0.0040) (0, CM5S)
MARRIED 0r2479^ 0.2440 … 0.2479 … 0.2 4 8 6 …
(0.0032 (0.0049) (0_0032) (0.0073)
SMSA 一。
-1763, -0. 1581 … - 0. 1763 … -0. 1797 ^**
(0.0029) (0.0174) (0.0029) (0. 0305)
Region NO NO NO NO Yes
329509 329509 329509 329509 329509 329509 329509 329509
0. 1177 0‘
1101 0.1177 0,1172 0. 1650 0.1584 0.1650 0.1647
Standard errors in parentheses
# p < . 10, /»<. 05t … p <
第四节 结
当 条 件 独 立 性 假 设 不 成 立 时 ,回 归 和 匹 配 方 法 都 没 有 办 法 识 别 因 果 效 应 参
数 。如 果 能 够 找 到 与 原 因 变 量 密 切 相 关 且 不 通 过 原 因 变 量 之 外 的 其 他 途 径 影
响 结 果 变 量 的 工 具 变 量 时 ,仍 然 可 以 识 别 出 因 果 效 应 参 数 。在 同 质 性 因 果 效 应
假设下,
满足相关性和外生性假设的工具变量可以识别出总体平均因果效应。
但是,
在异质性假设下,
工具变量只能识别出受工具变量影响的部分群体的平
均因果效应。由于不同的工具变量,
对其有反应的依从者群体往往也不相同,
从 而 不 同 的 工 具 变 量 将 识 别 不 同 的 因 果 效 应 参 数 。 因 而 ,在 利 用 工 具 变 量 估 计
因果效应参数时,
如果没有足够的证据证明同质性假设成立,
所得到的工具变
量估计量在解释的时候一定要小心,
不能简单地将工具变量估计量解释为总体
的因果效应或干预组平均因果效应,
必须考察依从者在总体或干预组中的代表
性,
不能简单地将依从者的因果效应推广到干预组或整个总体。
- 工具变量的选择非常重要,
而工具变量的寻找也有相当的难度,
往 往 是 “自
然 的 礼 物 ”(Rosenzweig and Wolpin, 2000),必 须 对 所 研 究 问 题 和 相 关 制 度 背
景有深入的理解,
才 能 找 到 合 适 的 “自 然 实 验 ”构 造 充 分 的 工 具 变 量 。 即使是来
自于自然实验的工具, 也 不 一 定 满 足 外 生 性 (独 立 性 和 排 除 性 )条 件 ,比如上文
146 基本有用的计量经济学
提 到 的 Angrist ( 1 9 9 0 ) 所 使 用 的 征 兵 随 机 数 工 具 ,
本身是随机机制产生的,
但
是如果雇主会根据随机数决定对个体的人力资本投资,
使随机数与个人收人发
生相关性,
从 而 不 满 足 外 生 性 条 件 了 (H e c k m a n ,1997) 。
工具变量寻找如此困难,
有 没 有 其 他 办 法 克 服 内 生 性 问 题 。如 果 有 面 板 数
据或多期截面数据,
我们会有更多的办法,
下一章将介绍多期数据的因果效应
识别策略。
推荐阅读
美 国 M I T 教 授 Joshua Angrist在 异 质 性 工 具 变 量 法 方 面 做 出 了 很 多 贡
献,
在 其 教 科 书 《几 乎 无 害 的 计 量 经 济 学 》中花 费 近 1 / 3 的 篇 幅 介 绍 工 具 变 量
法,
本章很大程度上参考了 Angrist and Pischke ( 2 0 0 9 ) 第 4 章 的 内 容 ,
建议读
者 阅 读 。M o r g a n and Winship (2015)第 9 章 对 工 具 变 量 也 有 较 好 的 介 绍 。I m -
bens and Rubin (2015)第 21— 2 3 章 从 实 验 的 角 度 介 绍 了 工 具 变 量 法 。
第八章面板数据方法
通过前面章节的学习,
我 们 知 道 ,如 果 条 件 独 立 性 假 设 或 非 混 杂 性 假 设 成
立,
可 以 利 用 回 归 分 析 或 匹 配 方 法 得 到 因 果 效 应 参 数 的 估 计 。如 果 条 件 独 立 性
假 设 不 成 立 ,但 是 能 够 找 到 与 原 因 变 量 相 关 但 不 通 过 其 他 路 径 (除 通 过 原 因 变
量 这 一 途 径)影 响 结 果 变 量 的 工 具 变 量 ,
那么,
利用工具变量可以得到依从者平
均 因 果 效 应 的 估 计 。然 而 ,工 具 变 量 往 往 很 难 寻 找 ,它 往 往 是 “自 然 的 礼 物 ”。
如果找不到合适的工具变量,
是 否 有 其 他 途 径 识 别 因 果 效 应 参 数 ?如 果 有 同 一
个 体 多 期 的 数 据 或 不 同 个 体 不 同 时 期 的 数 据 ,即 面 板 数 据 或 者 重 复 截 面 数 据 ,
我们有新的工具可以解决未观测混杂因素的影响,
从 而 识 别 因 果 效 应 参 数 。本
章 主 要 介 绍 面 板 数 据 的 固 定 效 应 方 法 、双 重 差 分 法 、
合成控制法及萧政等人的
回归合成方法。
第一节固定效应方法
面板数据是截面个体有多期的数据,
与截面数据每个个体只有一个样本点
不同,
面板数据中,
每 个 个 体 都 可 以 看 到 其 多 期 的 信 息 。为 便 于 描 述 ,
仍然关注
一个二元原因变量2 ^ 对结果变量I 的因果影响,
这 里 变 量 有 两 个 下 标 “ 表示
截 面 ,f 表 示 时 间 。用 又 ^ 表 示 可 观 测 的 混 杂 因 素 ,
17, 表 示 不 可 观 测 的 混 杂 因
素,
但 是 未 观 测 混 杂 不 随 时 间 变 化 。如 果 所 有 变 量 都 是 可 以 观 测 的 ,
那么,
可以
通过控制所有的混杂因素而获得因果效应参数的估计,
换言之,
如果所有混杂
因素均可观测,
那 么 条 件 独 立 性 假 设 成 立 ,即
( y lif, Y 0 i) J L D , 丨X p U i ’ t ( 8 .1 )
其中K h Y 。
,.,是 对 应 于 原 因 变 量 2 ^ 取 值 的 两 个 潜 在 结 果 ,与以前章节的符号一
致,
只 是 现 在 有 多 期 数 据 ,因 而 多 了 一 个 下 标 条 件 独 立 性 假 设 成 立 意 味 着 条
件均值独立性成立,
即
E [ Y oi! 1 尤 ,
1/,.山 认 ] = E l Y 0it | (8.2)
对 于 潜 在 结 果 也 有 一 个 类 似 的 公 式 。如 果 仅 关 心 干 预 组 平 均 因 果 效 应 ,
那
么,
条 件 (8. 2 ) 就 可 以 保 证 我 们 识 别 因 果 效 应 参 数 r A T T 。条 件 (8. 2 ) 满 足 ,
可以根
据 观 测 变 量 进 行 匹 配 ,
从而得到因果效应参数的估计,
148 基本有用的计量经济学
t*ATT ( X u ,
Uj,
t~) — E\_Ylit _ You I ,
Ui,
t,Dn = 1]
= E [ Y iU | A ,
U,.山 认 = 1 ] - E l Y 0U | X,.,,
17,.山 认 = 1 ]
= E [ Y U | X it,U{,t,D, = 1] - ELY, | X,v ,
U, ,t,Dir - 0]
= ELY, | X ^ U ^ t ^ D , = l~]-E[Y;
t | X it,U;,t,Dtl = 0] (8.3)
第 三 行 利 用 了 条 件 (8. 2 ) ,因 而 ,如 果 所 有 混 杂 因 素 均 可 观 测 ,可 以 根 据
、
[/,.、
〖进 行 匹 配 ,
并 利 用 X u、
U ,.、
〖的 分 布 进 行 加 权 就 可 以 得 到 总 体 的 干 预 组
平 均 因 果 效 应 A T T 。如 果 条 件 期 望 为 线 性 函 数 ,
那么,
可以直接利用回归方法
到 得 到 因 果 效 应 参 数 的 估 计 。假 设 ,
,.,| Xit,
£[y。 U,. + A, + X s + U W
进 一 步 假 设 ,因 果 效 应 是 同 质 的 ,g卩
E l Y lit | X , ,
LT; “] = E l Y 0il I X , ,
L/,. j ] + r
从而观测结果的条件期望函数可以写为:
ELY, | x u ,u;,1,0,3= E[D,yi, + ( 1 - D , ) y 0,> I 兄 ,
= E [ y 0lf + rD, | XifU,-,t,D^
+rD„+X^ + U;
y (8.4)
相应的回归方程可以写为:
y. = ^ H - A ; + rD,v + X ^ + L7;
y + £l> (8.5)
或
y„ - ^ + A f+ r D , + X - / ? + £i,, …,
i = 1’ N,t= 1,
…,:
T (8.6)
其中; 通 常 称 为 固 定 效 应 ,(8. 6)通 常 称 为 固 定 效 应 模 型 。如 果 K
也可以观测到,
在 假 设 (8. 2)下 ,(
8. 5 ) 可 以 直 接 利 用 回 归 方 法 得 到 因 果 效 应 参
数 r 的 一 致 估 计 或 至 少 是 最 优 线 性 近 似 。上 式 的 关 键 是 U ; 不 可 观 测 ,
仅控制
I 不能消除所有混杂,
L7,.将 留 在 误 差 项 中 ,
从而使复合的误差项与原因变量
A,相关,
C I A 条 件 不 再 成 立 。未 观 测 因 素 U,-或 固 定 效 应 + 不 随 时 间 变 化 ,
我
们 可 以 利 用 面 板 数 据 多 期 数 据 的 特 点 ,消 除 固 定 效 应 的 影 响 。通 常 具 有 两 种 处
理方法,
差 分 法 或 去 均 值 方 法 (d e m e a n ) ,
后一种方法通常称为固定效应方法。
这 里 只 介 绍 固 定 效 应 方 法 ,(
8. 6)式 针 对 同 一 个 体 内 部 按 时 间 进 行 平 均 ,
得组间
回归方程:
(8.7)
其中,
第八章面板数据方法 149
•X代 表 上 面 的 Y 、
A、L>、
X 各 变 量 。(
8. 6) — (8. 7)得 组 内 回 归 方 程 :
©
第二节双重差分法
在 讨 论 双 重 差 分 法 (Difference in Difference, D I D ) 之 前 ,我 们 先 讨 论 一 种
简单的情形,
在 某 一 时 刻 ^ 某 一 个 体 受 到 一 项 政 策 干 预 ,我 们 将 探 讨 该 项 政 策
干预对该个体结果的影响。比如,
2008年世界经济危机,
为了应对经济危机对
中 国 经 济 的 影 响 ,中 央 政 府 在 2 0 0 8 年底 出 台 了 4 万 亿 元 的 经 济 刺 激 计 划 ,
那么
这项经济刺激计划对中国随后的经济增长有什么样的影响呢?
现在关注最简单的情形,
假 设 只 有 两 期 4 一1 期 表 示 政 策 实 施 之 前 ^期 表
示政策实施之后,
我 们 关 心 政 策 实 施 之 后 对 结 果 的 影 响 。仍 然 沿 用 第 二 章 的 潜
在结果符号’
用 ^ ^ ^ ^ 上 ^ ^ ^ ^ 分 别 表 示 t 期 和 Z — 1 期 的 潜 在 结 果 ,由于这
里 只 有 一 个 个 体 ,因 而 ,
省略了个体的下标,
并 引 人 了 时 间 的 下 标 。关 心 的 政 策
影 响 是 ^ 期 的 个 体 因 果 效 应 ,即 Y u —Y 。
,,由 于 该 个 体 在 ^ 期 受 到 了 政 策 干 预 ,因
而 匕 ,
即 其 i 期 的 观 测 结 果 Y , 就 是 其 潜 在 结 果 Y 1;,而 I V 是 无 法 观 测 到 的
反事实结果。因而 ,
政 策 评 价 的 关 键 是 如 何 估 计 反 事 实 结 果 A ,。
一 种 简 单 的 办 法 就 是 假 设 如 果 没 有 政 策 干 预 d 期 的 结 果 将 与 £一 1 期结果
相 同 ,即 ^ 二^ - ^ ^ … 因 为 广 丄 期 没 有 政 策 干 预 ’因 而 ^一 }期 的 观 测 结 果
就 是 在 上 述 假 设 下 ,
反 事 实 结 果 从 而 可 以 得 到 政 策 干 预 的 因
果 效 应 。当 然 ,
上 述 假 设 太 强 了 ,即 使 没 有 政 策 干 预 ,
该个体的观测结果也会随
时间变化,
如 果 有 多 期 的 数 据 ,比 如 还 有 t - 2 期 的 数 据 ,
也 许 可 以 引 人 一 个更弱
一些的假设,
如果没有政策干预,
?期 结 果 的 增 长 率 将 与 £ _ 1 期 的 增 长 率 相 同 ,
从而我们可以用兄^ 作为反事实结果r 。
,的 估 计 ,
可以估计出政
策 干 预 的 因 果 效 应 。这 一 假 设 比 上 一 个 适 应 性 假 设 似 乎 好 一 点 ,
尤其是当政策
干 预 前 时 期 比 较 长 时 ,可 以 利 用 时 间 序 列 得 到 增 长 趋 势 比 较 好 的 预 测 。但 是 ,
如 果 结 果 变 量 发 生 了 结 构 性 变 化 ,比 如 2 0 0 8 年 经 济 危 机 可 能 使 中 国 经 济 发 生
了结构性的变化,
利 用 2008年 前 的 经 济 增 长 信 息 去 预 测 2008年以后的经济增
长 就 可 能 出 现 较 大 的 偏 差 。因 而 ,
这一假设可能没办法克服结构性变化造成的
影 响 。如 果 还 有 其 他 个 体 ,
这些个体没有受到政策干预的影响,
在时间序列上,
它 们 可 能 受 到 相 同 因 素 的 影 响 ,结 构 性 变 化 可 能 也 会 相 似 。那 么 ,
利用这些没
有受到政策影响的个体作为控制组,
可能会得到反事实结果更好的估计,
这
就是双重差分方法的基本思路。
1. 双 重差分法
双重差分方法适用于事前所有个体都没有受到政策干预,
而事后只有一组
个体受到政策干预,
受 到 政 策 干 预 的 组 称 为 干 预 组 ,没 有 受 到 政 策 干 预 的 为 控
制 组 。政 策 实 施 的 时 间 点 和 是 否 受 到 政 策 干 预 这 两 个 变 量 将 样 本 分 成 了 四 组
群体,
见 表 8. 1:
表 8 . 1 双重差分方法的适用场景
T=0 T=1
D =1 干 预 组 (干 预 未 实 施 ) 干 预 组 (干 预 实 施 )
D= 0 控制组 控制组
第八章面板数据方法 151
在政策评估中,
关 心 的 因 果 效 应 参 数 往 往 是 A T T ,即 政 策 干 预 对 受 到 影 响
的个体的影响,
rATT = ^[^1, - Yo, I D { = 1] = ElY, | D,. - 1 ] - E [ Y 0, | D ; = 1],
(8.9)
其 中 分 别 表 示 个 体 纟 在 〖期 的 两 个 潜 在 结 果 。 因 为 政 策 干 预 仅 在 一 个
时间点发生变化,
变量没有引人时间下标,
事后受到干预的个体,
D, = l ,
事
后没有受到干预的个体,
A = 0 ,
这样可以简化符号,
从 而 D ,.表 示 是 干 预 组 还 是
控 制 组 。(
8. 9)右 边 第 1 项 是 可 以 观 测 的 ,
为干预组事后的平均结果,
第 2项E
[ I V ID,. = 1]是 反 事 实 结 果 ,
因而,
政策评价的关键是如何将该反事实结果科学
地估计出来。
假 设 条 件 独 立 性 (8. 1)或 条 件 均 值 独 立 性 (8. 2)成 立 ,
G 是不随时间变化的
混杂因素,
如 果 均 可 观 测 ,
那么直接利用第i期的数据,
根据观测变量
X,、
U ; 进 行 匹 配 ,即 可 得 到 政 策 影 响 A T T ,
参 见 (8. 3 ),并 且 可 以 利 用 干 预 前 两
组 个 体 的 结 果 检 验 平 衡 性 是 否 满 足 。 问 题 是 这 里 L7,是 不 可 观 测 的 ,
仅仅根据
可观测变量;
^ 进 行 匹 配 不 能 保 证 两 组 个 体 的 相 似 性 ,因 而 ,匹 配 方 法 在 这 种 情
况 下 不 能 使 用 。与 固 定 效 应 方 法 类 似 ,双 重 差 分 方 法 通 过 两 期 数 据 的 比 较 ,可
以 消 除 未 观 测 因 素 的 影 响 。下 面 讨 论 双 重 差 分 方 法 的 基 本 假 设 。
例 8. 1(共 同 趋 势 假 设 ) 干 顸 组 个 体 如 果 没 有 接 受 干 预 ,其 结 果 的 变 动 趋
势 将 与 控 制 组 的 变 动 趋 势 相 同 ,即
ELYo, 一 Yo,-, i X k , D ; = 1] = E l Y 0U — Yo,-! I X lt,Di = 0] (8. 10)
或写为:
E l A Y 0U I X, ,D,. = 1] = E l A Y 0il | X u ,D, = 0] (8. 11)
共 同 趋 势 假 设 (c o m m o n trend assumption)是 双 重 差 分 方 法 的 关 键 假 设 ,
它要求
如果没有受到政策影响的话,
干预组个体的变化模式与控制组个体的变化模式
是 一 样 的 。换 言 之 ,
未 观 测 因 素 对 两 组 个 体 的 影 响 是 相 同 的 。当 然 ,
这一要求
总体上不一定满足,
一个更弱的共同趋势假设是要求控制可观测变量后满
足 共 同 趋 势 假 设 。不 过 这 里 的 协 变 量 足 >必 须 是 在 政 策 实 施 之 前 取 值 或 不 受 政
策干预影响的变量,
受政策影响的观测变量将会造成样本选择偏差。
观 察 假 设 (8. 11) ,
这一假设与我们在匹配方法和回归方法中讨论的条件均
值 独 立 性 假 设 (5. 41)很 相 似 ,
不 过 (5. 4 1)是 针 对 潜 在 结 果 的 水 平 量 ,
而 (8. 11)
是 针 对 潜 在 结 果 的 增 加 量 。因 而 ,
D I D 方法也可以看作是一种匹配方法,
不过,
是对增量的匹配,
不是直接对水平量的匹配。由于水平量受到未观测混杂因素
152 基本有用的计量经济学
U,的影响,
水 平 量 匹 配 无 法 消 除 未 观 测 混 杂 因 素 的 影 响 ,但 是 ,
进行增量匹配
消除掉未观测混杂因素认的影 响 ,
时 ,由 于 计 算 增 加 量 时 利 用 两 期 结 果 的 差 分 ,
从而在共同趋势假设下,
获得反事实结果的估计。
共 同 趋 势 假 设 也 可 以 写 成 另 一 种 形 式 ,BP
E [ Y 0lt | X , ,
D, - l ] - £ [ Y o , I X,v ,D; = 0]
= £ [ y 0,-i I Xu ,D; = 1 ] - E [ Y 0,-1 I x t>,D,. = 0] (8. 12)
或写为:
(x) (8.13)
其中,
B,(x) = E l Y 0it | X, - x , D { = 1 ] - E [ Y 0, I X , = = 0]
即如果没有政策干预,
两 组 事 前 事 后 结 果 的 差 异 应 该 是 相 同 的 ,因 而 ,
共同趋势
假 设 有 时 也 称 为 不 变 偏 差 假 设 (constant bias assumption)。这 一 点 也 说 明 ,
干
预组与控制组不必相似,
与 匹 配 方 法 不 同 ,只 要 事 前 事 后 两 组 差 别 相 同 ,
DID方
法 即 可 识 别 因 果 效 应 参 数 。关 于 共 同 趋 势 或 不 变 偏 差 假 设 的 作 用 见 图 8.1:
图 中 变 量 卩 =°表 示 控 制 组 事 前 事 后 的 观 测 结 果 , 表 示 干
预组事前事后的观测结果, 所有观测结果均用实心圆点表示广是干预组广
期的反事实结果,
用 空 心 圆 点 表 示 。共 同 趋 势 假 设 是 说 如 果 没 有 政 策 干 预 ,
受
未观测因素K 的影响,
两 组 结 果 的 变 动 趋 势 相 同 ,即 图 中 虚 线 与 连 接 控 制 组 两
期观测结果的线段应该平行,
从而干预组结果的变化包括政策的影响和时间趋
势 两 部 分 ,因 而 ,
在干预组两期增量中扣除共同趋势后,
剩余的部分就是政策的
影响,
图中空心圆点所表示的结果就是干预组在f 期的反事实结果,
政策影 响 就
是 干 预 组 f 期实际观测结果与反事实结果之差,
即图中所示的因果效应。
上 文 提 到 共 同 趋 势 假 设 也 称 为 不 变 偏 差 假 设 ,即 两 组 个 体 在 干 预 实 施 之
前 ,即 使 控 制 可 观 测 协 变 量 后 ,
仍然不完全相似,
可以允许这种差异,
而这种
第八章面板数据方法 153
差异主要是由未观测混杂因素造成的,
所 以 在 图 8. 1 中 ,政 策 干 预 之 前 ,
两
组 观 测 结 果 ypri1和 在 控 制 观 测 协 变 量 X 。之 后 ,
仍然可以有差异,
意味 着
两 组 根 据 X,.,匹 配 后 ,
并不完全相似,
这 种 差 异 在 D I D 方 法 中 是 允 许 的 ,只要这
种差异不随时间变化或影响这一差异的因素G 是不随时间变化的,
那么,
如果
没有政策干预,
在 t 期 两 组 结 果 的 差 异 应 该 相 同 ,即 具 有 不 变 偏 差 。从而事后两
组观测结果之差里面包含政策影响和其他因素影响的不变偏差,
将不变偏
差从事后两组观测结果差异中扣除,
就 可 以 得 到 政 策 干 预 的 因 果 效 应 。无论 是
从 共 同 趋 势 假 设 还 是 从 不 变 偏 差 假 设 出 发 ,最 终 的 政 策 效 应 都 是 两 次 差 分 ,因
而,
这 种 因 果 效 应 识 别 方 法 称 为 双 重 差 分 方 法 。具 体 地 ,
T (X ,> )^ E [y i;
r^TD ( -yo,> I D i - 1,X,V]
— I D ;— 1 >Xi, ] — ■EllYoa | D ;— 1 >X u
— E[_Y^ I D { ~ 1»X/,J ~ ■{£"[Yoi(-i I D; = 1 ?Xu 3
+ E l Y 0it- Y 0,-1 | D ^ O ’
X"]}
= {E[y, | D ; = H I I H | D, = 1,X,V]}
y ‘
干预组结采增钍
= {ElY, | D i = I D i = 0 ?X , ] }
垠后两组结粜差异
- {£ [y ,- i I D i - l , X , ] - E [ y , _ t | D t = 0 , X , ] } (8.15)
' ' V
事前两组结采差界
(8. 14)是 沿 用 共 同 趋 势 假 设 ,
从干预组两期结果变化中减去控制组的两期结果
的变化,
从 而 扣 除 了 共 同 趋 势 的 影 响 ,剩 下 的 就 是 政 策 效 应 。 (8. 15 )是 沿 用 不
变偏差假设,
从事后两组观测结果差异中扣除事前两组观测结果差异,
从而扣
除了不变偏差的影响,
剩 下 的 也 是 政 策 效 应 。总 的 政 策 影 响 可 以 表 示 为 :
r^TT = E l z ^ ( X u) \ D,. = 1]. (8. 16)
上 文 我 们 提 到 D I D 方 法 类 似 于 增 量 上 的 匹 配 方 法 ,如 果 可 以 根 据 协 变 量
进行结果增量的匹配,
那么,
类似于匹配方法,
为了保证根据观测协变量X u
分层后,
层 内 不 能 仅 有 干 预 组 个 体 ,而 没 有 控 制 组 个 体 ,
必须满足共同区间假设
( c o m m o n support) 0
假 设 8. 2 ( 共 同 区 间 假 设 )
Pr[D, - 1 ] > 0 且 Pr[D,T, - 1 | X (>] < 1 (8. 17)
154 基本有用的计量经济学
干预组结果增盘
(8. 18)
= { E [ y , | D, = l,p(X,>) = p J - E C Y , | D, = 0 ,p(X,) = p]}
■ ■ v
帘后两组结采差界
(8.19)
为 了 保 证 D I D 方法有效,
还 有 两 个 暗 含 的 假 设 需 要 强 调 ,一 是 要 求 协 变 量
不受政策干预的影响,
二是政策干预不能有交互影响或溢出效应。
假 设 8. 3 ( 外 生 性 假 设 )
Xi" = Xoit — Xu
这 里 类 似 潜 在 结 果 的 符 号 ,
表示可以观测的协变量外生于政策干预,
不
会 受 到 政 策 干 预 的 影 响 。如 果 协 变 量 受 到 政 策 干 预 的 影 响 ,
那么控制它将可能
产 生 样 本 选 择 偏 差 ,因 而 ,
协 变 量 X 。应 该 是 发 生 在 政 策 干 预 实 施 之 前 或 者 不 随
政策干预而变化的变量。
假 设 8.4(SUVTA) 政 策 干 预 只 影 响 干 预 组 ,不 会 对 控 制 组 产 生 交 互 影
响,
或政策干预不会有溢出效应。
如果政策对干预组产生影响,
并且干预组的影响会对控制组个体产生外溢
效应,
从而使政策干预也会对控制组产生一定程度的影响,
那 D I D 识别策略将
无 法 识 别 出 真 正 的 政 策 效 应 ,因 为 控 制 组 的 趋 势 变 化 中 也 包 含 了 政 策 的 部 分 影
响,
从而不能用控制组的变化趋势作为构成干预组反事实趋势的基础。
第八章面板数据方法 155
第六章我们介绍过倾向指数匹配方法,
倾向指数除了可以用于匹配样本,
也 可 以 通 过 逆 概 加 权 的 方 式 得 到 因 果 效 应 参 数 的 估 计 ,D I D 方 法 类 似 于 增 量 上
的匹配方法,
因而,
D I D 估计量也可以用倾向指数进行逆概加权得到。
定 理 84 1 (Abadie 半 参 数 D I D 估 计 量 ) 如 果 假 设 8. 1 成 立 并 且 0 <
F r [ D = l | X ] < l ,则有
E [ Y U! - Yo, I X , D - 1] - El-w . (Y, - y , - , ) | X ] (8.20)
从而,
得到倾向指数拟合值f ( b ,
两 阶 段 法 参 数 估 计 方 法 :首 先 估 计 倾 向 指 数 模 型 ,
然后,
将 代 人 (
8. 21)得 到 干 预 组 平 均 因 果 效 应 ,
在 这 里 我 们 不 再 详 述 。下
面 看 一 个 D I D 的例子。
Card and K r u eger(1994)是 一 篇 较 早 的 D I D 方 法 的 经 典 文 献 ,
作者研究最
低 工 资 调 整 对 就 业 的 影 响 。他 们 利 用 1 9 9 2 年 4 月 发 生 在 新 泽 西 州 最 低 工 资 调
整 的 自 然 实 验 ,以 最 有 可 能 受 最 低 工 资 影 响 的 快 餐 业 为 考 察 对 象 ,
利用与新泽
西 州 相 邻 的 宾 夕 法 尼 亚 州 作 为 控 制 组 ,同 期 宾 州 没 有 发 生 最 低 工 资 调 整 。作者
搜集了 1 9 9 2 年 2 月 和 1 9 9 2 年 1 1 月 两 州 相 关 快 餐 店 的 就 业 信 息 ,
并 利 用 DID
方法估计了新泽西州最低工资调整对快餐业就业的影响。
我们利用他们的平衡样本,
包 括 7 6 家 新 泽 西 州 快 餐 店 和 3 1 4 家宾州快餐
店的面板数据,
估 计 结 果 见 第 1 7 8 页 。Baseline表 示 政 策 实 施 之 前 ,即 1 9 9 2 年
2 月,
控制组宾州快餐店平均就业人数约为2 0 人 ,
干预组新泽西州快餐店平均
就业人数约为17人 ,
事前两者差距约为3 人 ,
并且非常显著,
这是事前的偏差,
可 能 是 由 于 一 些 未 观 测 因 素 造 成 两 者 的 不 同 。Follow-up表 示 政 策 实 施 之 后 ,
即 1992年 U 月 ,
控 制 组 和 干 预 组 平 均 就 业 人 数 均 为 17. 5 人 ,
两州就业人数没
有 显 著 差 异 。事 后 两 州 结 果 差 异 中 包 含 政 策 干 预 的 影 响 和 其 他 政 策 之 外 因 素
156 基本有用的计量经济学
的影响,
而事前两州就业差异均是其他政策之外因素的影响,
因而,
如果不变偏
差假设成立,
那么,
事后两组结果差异减去事前两组结果差异,
得到的将是政策
干 预 的 影 响 。结 果 显 示 ,
新泽西州最低工资提高,
造成快餐业店均雇佣人数反
而上升约3 人 ,
这一结果与经济理论的预测相反,
详 细 讨 论 参 见 Angrist and
Pischke (2009)。 当 然 ,
表中的估计结果也可以换个维度来看,
首先可以看控制
组 宾 州 店 均 就 业 人 数 事 前 事 后 的 变 化 ,由 事 前 的 2 0 人 降 低 到 事 后 的 17. 5 人 ,
降 低 2. 5 人 ,
而 干 预 组 新 泽 西 州 店 均 就 业 人 数 由 事 前 的 17. 1 人 增 加 到 事 后 的
17.5人 ,
增 加 0.4人 ,
如果新泽西州不调整最低工资,
其就业人数变化与宾州具
有相同的趋势,
那么,
新 泽 西 州 平 均 也 将 降 低 2. 5 人 ,现 在 却 增 加 了 0. 4 人 ,
这
肯定是政策调整造成的影响,
政 策 的 影 响 为 0 . 4 — (一 2 . 5 ) = 2 . 9 人 。 当 然 ,为
了证明上述结果能够表示为最低工资调整的影响,
必须要求上述设计满足Dro
方法的基本假设,
最 重 要 的 是 共 同 趋 势 假 设 成 立 。如 果 有 事 前 多 期 的 数 据 ,
则
可以利用事前数据检测在没有受到政策影响时,
两 州 是 否 有 共 同 趋 势 。另一方
面,
D I D 政策有效的前提是,
政策的影响不能具有交互效应,
如果新泽西州的最
低工资提高,
吸引了宾州就业的店员到新泽西州去就业,
从而出现溢出效应,
溢
出 效 应 会 使 新 泽 西 州 就 业 增 加 ,而 宾 州 就 业 下 降 。 因 而 ,如 果 上 文 的 稳 定 性 假
设 8. 4 不 成 立 ,
那 么 D I D 估计量可能高估了政策的影响。
2 . 回归双重差分法
在满足上文4 个基本假设下,
可以利用(
8. 14)(8. 15)或 (8. 1 8 X 8 . 19)直接
计算事前事后干预组和控制组的结果,
从 而 计 算 出 D I D 估 计 量 。在 应 用 中 ,
如
果愿意假设条件期望函数为线性函数或者利用线性函数去近似我们关心的条
件期望函数,
那么,
可 以 利 用 回 归 方 法 估 计 D I D 估 计 量 。如果使用面板数据或
重复截面数据,
没有协变量,
可以利用下面回归方程得到D I D 估计量:
a+ + X T)+e„ (8.22)
其 中 ,_E[e,>|D,.,了] = 0 ,
从而,
E[Y„ | D,-,T] = a + j 2 D , + ^ r + r(D,- X T)
则 丨 £>,. = 0 , T = 0] = a
E[y, I D i- 0 , T = 1] = a + 占
E [Y ,v | Di ^ 1 ,T = 0 ] = q;
+ 召
E [ Y * 丨 D , —1 , T = 1 ] = a + j3-\-S + r
即控制组事前平均结果为a ,
控制组事后平均结果为控制组事前事后平均
结果变化为A 干预组事前的平均结果为a + P ,
干预组事后的 平 均 结 果 为 a+y9+
第八章面板数据方法 157
占+ r ,
干 预 组 事 前 事 后 平 均 结 果 的 变 化 为 5 + r ,而 干 预 组 事 前 事 后 平 均 结 果 的
变化中包括政策影响和共同趋势,
将共同趋势的影响扣除,
最终的政策影响为
r ,即
r = { E [ Y , | D, = 1, T = 1 ] - E [ Y , | D ; - 1 , T = 0]}
- {ELYU | D,- - 0, T = 1 ] - £ & | D ( = 0 , T = 0]}
如 果 共 同 趋 势 必 须 在 控 制 协 变 量 X , 后 才 成 立 ,并 且 这 些 协 变 量 不 会 受 到
政策干预的影响,
那么,
相应的回归双重差分模型可以写为:
®
r, = a + jSD;+ + r(D,- X T) + + e, (8.23)
下 面 我 们 看 一 项 有 趣 的 研 究 ,Abadie and Dermisi (2008)利 用 回 归 D I D 方
法 考 察 了 恐 怖 袭 击 威 胁 对 C B D 经 济 的 影 响 。2 0 0 1 年 9 月 1 1 日,
美国纽约世贸
大 楼 受 到 恐 怖 分 子 袭 击 轰 然 倒 塌 ,这 一 事 件 不 但 直 接 影 响 了 纽 约 市 的 城 市 经
济,
也 对 其 他 城 市 经 济 产 生 影 响 。Abadie and Dermisi (2008)利 用 美 国 中 部 城
市 芝 加 哥 1996年 第 2 季 度 到 20 0 6 年 第 1 季度的数据,
考 察 了 “9 • 11”事 件对
芝 加 哥 市 办 公 写 字 楼 租 赁 市 场 的 影 响 。 以“9 • 11”事 件 作 为 一 项 冲 击 或 干 预 ,
以芝加哥市最高的三座建筑作为锚点,
离三座标志性建筑越近遭受恐怖威胁的
可 能 性 越 大 ,半 径 0 . 3 英 里 (大 约 5 0 0 米 )范 围 内 的 办 公 写 字 楼 定 义 为 干 预 组 ,
作者称之为阴影区域,
®0. 3 英 里 之 外 的 作 为 控 制 组 。写 字 楼 分 布 见 图 8, 2 。作
者 主 要 考 察 “9 • 11”事 件 对 芝 加 哥 市 办 公 写 字 楼 出 租 情 况 的 影 响 ,主 要 的 结 果
变 量 是 办 公 室 空 置 率 。 图 8 . 3 列 出 了 两 类 办 公 楼 空 置 率 的 变 化 趋 势 。从图 上
可以看出,
在 “9 • 11”事 件 之 前 ,
两类办公楼空置率具有基本相似的变化趋势,
并 且 没 有 非 常 明 显 的 差 异 。而 “9 • 11”事 件 之 后 ,
起初两年两类办公楼空置率
也没有发生明显的差异,
@ 但 2 0 0 3 年i 右 开 始 ,
两类办公室空置率发生了明显
的分化,
非阴影区域的空置率基本保持平稳,
但阴影区域空置率发生了显著的
增 加 。 图 8. 3 实际上 提 供 了 D D D 策 略 共 同 趋 势 假 设 的 一 种 验 证 ,可 以 看 出 ,
在
“9 • 11”事 件 之 前 ,
所有年份数据显示两类区域的写字楼基本具有相同的空置
率变化趋势,
从 而 事 后 两 类 区 域 写 字 楼 空 置 率 的 差 异 可 以 解 释 为 “9 • 11”事件
① 如 果 是 面 板 数 据 ,回 归 D I D 模 型 也 可 以 写 为 = 各+ rD,. + ,
详 细 参 考 Card and Krue
ger (1994) <,
© 选 择 0. 3 英 里 的 依 据 是 在 “9 • 11”事 件 中 倒 塌 的 世 贸 大 楼 造 成 的 影 响 大 约 是 0. 3 英 里 。芝加哥
市 的 三 座 标 志 性 建 筑 是 美 国 最 高 的 建 筑 西 尔 斯 塔 (Sears T o w e r ) 、
美 国 第 三 高 的 建 筑 怡 安 中 心 (A o n Cen-
ter)和 美 国 第 四 高 的 建 筑 汉 考 克 中 心 (Hancock Center), 三座建筑是芝加哥市最高的三座写宇楼, 被恐怖
袭 击 的 风 险 相 对 于 其 他 较 矮 的 写 字 楼 更 高 ,因 而 ,
作 者 选 择 以 这 三 座 标 志 性 建 筑 为 锚 点 0 . 3 英里范围内
的写 字 楼 作 为 干 预 组 。
③由于租赁合同的期限限制, “9 _ 11”事 件 的 影 响 可 能 没 有 马 上 显 现 出 来 ,
等合同到期后,
很多公
司 可 能 退 出 了 受 恐 怖 威 胁 可 能 性 更 大 的 阴 影 区 域 ,随 后 导 致 阴 影 区 域 办 公 楼 空 置 率 的 上 升 。
158 基本有用的计量经济学
后恐怖袭击威胁对阴影区域写字楼空置率的影响。
Crosses represent Class A and Class B office buildings in Chicago's Central Business District-Shaded
circles represent 0.3-mile radius “ shadow areas” surroflnding the three mam Chicago landmark buildings:
the Aon Center, the Hancock Center, and the Sears Tower.
图 8 , 2 芝加哥市中心商务区办公楼和阴影区域
为了考察恐怖威胁对阴影区域写字楼空置率的影响,
作 者 采 用 D I D 识别策
略,
构建下列模型:
vacancy rateit = r(shadow,- X post-9/11,) + ft + 切 (8. 24)
其 中 vacancy rateit表 示 写 字 楼 ;在 i 期 的 空 置 率 ,
sh a d o w , 表 示 写 字 楼 z 是否在
阴 影 区 域 ,取 1 表 示 在 阴 影 区 域 ,
取 0 表 示 在 非 阴 影 区 域 ,post-9/ll,表示时 间
是 否 在 “9 • 11”事 件 发 生 之 后 ,
取 1 表 示 “9 • 11”事 件 后 ,
取 0 表 示 “9 • 11”事件
之 前 。/ , 控 制 时 间 效 应 , 为 个 体 固 定 效 应 。 因 为 有 多 期 的 数 据 ,
作者采用了
类似于固定效应模型的设定,
事 实 上 ,固 定 效 应 方 法 是 D I D 方 法 的 一 般 形 式 。
为了验证估计结果的稳健性,
作者还引人了另外三个模型,
分别是:
1= r(distance to anchor;X post-9/11,) -f /, + rj;+ e* (8.25)
vacancy rate;
vacancy rate;
,= r(distance to non-shadow area,. X post-9/11,)
+ / , + 7,+e,v (8. 26)
第八章面板数据方法 159
year
图 8 ,3 阴影和非阴影区域的办公楼平均空置率
表 8. 2 “9 • U ”事 件 和 芝 加 哥 市 中 心 商 务 区 办 公 楼 空 置 率
s h a d o w a r e a X post-9/11 . 0303*
(.0166)
(.0362)
160 基本有用的计量经济学
(续 表 )
表 8 . 2 第 1 列 对 应 于 模 型 (8. 2 4 ) ,系 数 为 0.0303,
显著为正,
说 明 “9 • 11”
事件后显著增加了阴影区域写字楼的空置率,
第 2 列 对 应 于 模 型 (8. 25 ) ,系数
为一 0.0617,
显著为负,
说明离锚点距离越远,
“9 • 11”事 件 对 空 置 率 的 影 响 越
小,
第 3 列 对 应 于 模 型 (8. 26),
系 数 为 0, 2302,
显著为正,
说明在阴影区域离锚点
越近,
“9 • 11”事 件 对 空 置 率 的 影 响 越 大 ,
与 第 2 列的结果相互印证,
第 4 列对应
于 模 型 (8. 27),
系 数 为 0. 0052,
显著为正,
说明楼层越高,
“9 • 11”事 件 对 其 空 置 率
影响越大。
上 述 结 果 可 以 解 释 为 “9 • 11”事 件 影 响 的 关 键 是 共 同 趋 势 假 设 成 立 ,由于
作 者 有 “9 • 11”事 件 前 多 期 的 数 据 ,
于 是 利 用 事 前 的 数 据 做 了 证 伪 检 验 (falsifi-
cation test)。① 他 们 利 用 1 9 9 6 年 到 2 0 0 1 年 的 数 据 ,以 1 9 9 8 年 第 4 季 度 作 为 虚
拟的政策干预时点,
重复了前面的分析,
估 计 结 果 见 表 8. 3 。结 果 显 示 ,
“9 • 11”
事件之前均没有显著的政策影响,
从而说明,
共同趋势假设有可能成立,
至少没
有发现不成立的证据。
表 8 . 3 利 用 “ 9 • 11” 事 件 之 前 的 数 据 进 行 的 回 归 :
证伪检验
① 也 称 为 安 慰 剂 检 验 (placebo test) •这 种 称 谓 主 要 来 自 于 医 学 实 验 。
•
第八章面板数据方法 161
(续表)
注:
摘自 Abadie and Dermisi (2 0 0 8 )表 5 。
3. 小结
在满足共同趋势假设、
共同区间假设、
外 生 性 假 设 及 无 交 互 影 响 (S U V T A )
等四个假设下,
双 重 差 分 策 略 可 以 识 别 出 政 策 干 预 效 应 。在 四 个 假 设 中 ,
最关
键 的 是 共 同 趋 势 假 设 。上 文 讨 论 过 ,
共同趋势假设相当于增量上的条件均值独
立 性 假 设 ,因 而 ,
D I D 方法类似于匹配方法,
但 是 两 者 仍 然 有 很 大 的 不 同 ,匹配
方法要求条件独立性或至少是条件均值独立性假设成立,
但 是 D K ) 方法允许
C I A 不 成 立 ,允 许 存 在 不 随 时 间 变 化 的 未 观 测 混 杂 因 素 ,因 而 ,
D I D 可以解决部
分的内生性问题,
可以解决由于不随时间变化的因素造成的内生性,
这一点类
似于固定效应方法,
通过两期的差分或去均值可以消除未观测混杂因素的影
响,
从而识别出因果效应参数。
当共同趋势假设不能满足时,
可以理解为存在时变的混杂因素使得即
使没有政策干预时,
干 预 组 和 控 制 组 两 组 结 果 也 不 会 平 行 变 化 。如 果 我 们 还 能
找到与我们关心的干预组和控制组相似的另外两组个体,
不妨称为类干预组和
类 控 制 组 ,在 没 有 政 策 干 预 时 ,
干 预 组 和 控 制 组 由 于 C/,,造 成 的 差 异 与 另 外 一 对
类干预组和类控制组差异相似,
或 者 说 ,此 时 增 量 不 满 足 共 同 趋 势 ,
但是增量的
增量满足共同趋势,
此 时 可 以 采 用 三 重 差 分 策 略 (D D D ) 来 识 别 因 果 效 应 参 数 。
这种情况下,
直观理解, 一 重 差 分 不 能 消 除 未 观 测 因 素 的 影 响 ,即 A U i 不 为 零 ,
但 是 Al/丨在 我 们 关 心 的 组 里 和 类 组 里 相 同 ,
从而可以通过再进行一次差分的方
式,
将 AL/,.的 影 响 消 除 掉 ,
相应的关键假设可以写为:
E [ A 2Y 0, | X , D = 1] = £ [ A 2Y 0!v I X , D - 0]
但 基 本 的 思 想 仍 然 与 双 重 差 分 类 似 ,因 而 ,
不再展开。
从上文的分析也看到,
关 键 的 共 同 趋 势 假 设 具 有 函 数 依 赖 性 (scale depend-
ence),
是结果水平量的增量相同,
还 是 结 果 取 对 数 后 增 量 相 同 ,或 其 他 函 数 形
式变化后增量相同,
不同函数的共同趋势假设,
将 得 到 不 同 的 估 计 。从 这 种 意
义上而言,
D I D 方法是一种半参数识别策略,
并且函数形式的选择往往要依赖
于 所 研 究 的 问 题 。因 而 ,
在利用D I D 方法估计因果效应参数时,
需要仔细思考
共同趋势假设应该在哪种函数形式上更有可能成立。
162 基本有用的计量经济学
D I D 方法比较适合于面板数据,
对于重复截面数据也可以使用D I D 策略。
当利用重复截面数据时,
需要仔细考察政策干预前后两组个体的构成是否发生
变 化 ,即 事 前 的 干 预 组 与 事 后 的 干 预 组 是 否 相 似 ,
事前的控制组与事后的控制
组 是 否 相 似 。如 果 两 组 事 前 事 后 的 构 成 不 同 ,可 能 出 现 样 本 选 择 偏 差 ,
从而使
D I D 策略失效,
这一点是利用重复截面数据估计D I D 时需要注意的。
第三节合成控制法
在很多比较研究中,
往往关注一个地区、
城市或国家加总的信息,
这种情况
下,
政 策 干 预 的 个 体 往 往 只 有 一 个 ,如 何 科 学 地 评 价 政 策 干 预 对 该 个 体 的 影 响
成 为 一个重要的议题。比 如 评 价 2008年 我 国 出 台 的 4 万亿刺激方案对我国宏
观 经 济 的 影 响 ,出 台 4 万 亿 刺 激 方 案 的 只 有 中 国 ,如 何 评 价 这 一 政 策 对 中 国 经
济 的 影 响 。这 个 时 候 ,
潜在的控制组个体,
如 用 其 他 发 展 中 国 家 或 O E C D 国家
数据作为控制组,
这些国家同期没有出台4 万亿刺激方案,
但是其中任何国家
与中国均存在着较大的差异,
如何才能构造更好的控制组,
从而估计中国的反
事 实 结 果 呢 ? Abadie and Gardeazabal (2003)、
Abadie et al. (2010)提出一种新
的方法,
称 为 合 成 控 制 法 (synthetic control methods) 0 它 的 基 本 思 想 是 ,
尽管
控制组中的任何个体与干预组个体都不相似,
但是通过为每个控制组个体赋予
一个权重,
加 权 平 均 后 构 造 出 一 个 合 成 的 控 制 组 。权 重 的 选 择 使 得 合 成 控 制 组
的行为与干预组政策干预之前的行为非常相似,
从而期望事后干预组如果没有
受到政策干预,
其 行 为 仍 然 与 合 成 控 制 组 非 常 相 似 ,即 合 成 控 制 组 事 后 的 结 果
可以作为干预组个体的反事实结果,
干预组和合成控制组事后结果的差异就是
政策干预的影响。
1. 合成 控 制 法的 基本 设 定
合成控制法的适用场景类似于双重差分法,
某一时刻起一项政策影响了干
预组,
但对控制组个体没有产生影响,
从而事前两组个体均没有受到政策的影
响,
而事后只有干预组个体受到政策影响D 与双重差分法适用场景不同的地方
在于合成控制法中干预组只有一个个体,
往 往 是 一 个 城 市 、地 区 或 国 家 。基本
的设定如下,
假 设 有 J V + 1 个 地 区 ,区 域 1 在 T 。期 后 受 到 政 策 干 预 ,
其他N 个
地 区 没 有 受 到 政 策 干 预 。沿 用 以 前 的 符 号 , 表 示 个 体 〖在 Z 期 接 受 政 策 干 预
时 的 潜 在 结 果 ,:
^ ^ 表示个体/ 在 Z 期没有受到政策干预时的潜在结果,
从而个
体因果效应为:
第八章面板数据方法 163
rit = — You » i 二 1,
…,iV + 1 ,t — 1, ••• ,T
表 示 个 体 ;在 £ 期 的 干 预 状 态 ,
个 体 i 在 〖期 受 到 政 策 干 预 ,i ^ - 1 ,
其他取0。
个 体 /在 i 期的观测结果为:
y, = d ,y U[ + ( i - d , ) y 0i = y 0,v + t,d ,
为叙述方便, 0 期 后 受 到 政 策 干 预 ,而 其 他 N
假 设 第 1 个 个 体 在 乃 (1 < ^ < :
个 个 体 所 有 时 期 均 没 有 受 到 政 策 影 响 ,即
= 1 ’t > T 0
( 0 其他
我 们 的 目 标 是 估 计 政 策 影 响 (r1Io+l,
…, 对 于 t > T 0,
r1T) ,
rl/ = ^11/ — — y n _ Yolr
第 1 个 个 体 受 到 政 策 干 预 ,因 而 ,
在(> 了。期 ,
我 们 可 以 观 测 到 潜 在 结 果 Y 1It,
但
无 法 观 测 到 如 果 它 没 有 受 到 政 策 干 预 时 的 潜 在 结 果 A u ,因 而 ,
政策评价的关键
是 如 何 估 计 出 个 体 1 7 V 期 后 的 反 事 实 结 果 Y & 。为 了 估 计 个 体 1 的 反 事 实 结
果 ,假 设 可 以 用 下 列 模 型 表 示 :
You = = 氏 + dtZi + Xtfii + e,'t , Z = 1 ,… ,iV + 1 , £ = 1 ,
… ,.了 (8. 28)
其 中 &是 一 未 知 的 公 共 因 子 , 对所有个体 具 有 相 同 的 影 响 ,
乙 是 K X 1 . 维(
不受
政 策 影 响 的 )可 观 测 协 变 量 向 量 (可 能 是 混 杂 因 素 ),
久 是 1 X K 维未知系数向
量 ,A,是 1 X F 维 的 未 观 测 公 共 因 子 是 F X 1 维 系 数 向 量 a 是 未 观 测 的 暂 时
性冲击,
假设在地区层面满足零均值。
考 虑 N X 1 的权重向量 W = b 2,…,
w N+1) ,
满 足 叫 > 0 ,_/= 2 ,
…,N + 1,
并 且 … + WiV+1= l 。这 里 将 权 重 限 制 为 非 负 ,
相当于用控制组个体的凸组
合来合成控制组,
是 为 了 避 免 外 推 造 成 的 可 能 偏 差 。每 个 特 定 的 权 重 向 量 W
代表一个特定的合成控制, 对于权重W , 合成控制模型为:
iV+l w-l N+l N±l
= dr + d t'^J-wjZ j + A f + S £yv
;= 2 j=2 j=2 j= 2
假 设 存在权重向量=(w;,
…,t^ +1),使得
N+l N-t-1
= Y>2 = Yl2, …,
j=2
N +l N-hl
N十] 』
Y+1T0 r T0 \-1
^01/ —
j = 2
Yj'
j ^2 5=1
2a42
V »=1
久 丄 又 : (£jS — eu)
J
164 基本有用的计量经沆学
可 以 证 明 ,当 干 预 之 前 时 期 足 够 长 (了。
— 00),(8. 30)式 趋 近 于 零 ,
从而干预组个
体 1 的 反 事 实 结 果 近 似 可 以 用 合 成 控 制 组 来 进 行 表 示 ,即
' N+1
^01/ — 〉]^>i Yj!
因 而 干 预 组 个 体 1 的 政 策 干 预 效 应 可 ^表 示 为 :
N+1
iu = Yu - Yi' » t = 了。+1’ … ’ 了 (8.31)
>=2
条 件 (8. 29)是 关 键 ,
如果存在权重向量v r ,
使得干预前各期合成控制组的观
测结果与干预组观测结果相等, 所有可观测因素相同, 从而意味着事前合成控
j\r+l
制 组 的 未 观 测 因 素 也 会 与 干 预 组 未 观 测 因 素 相 同 ,即 h 。这意味着
合成控制组与干预组将非常相似,
从而可以将合成控‘组的行为模式作为干预
组 个 体 反 事 实 结 果 的 估 计 。 事 实 上 ,条 件 (8. 2 9 ) 中 的 等 式 一 般 不 会 完 全 相 等 ,
除 非 干 预 组 事 前 信 息 ( T „ ,… , 名 )在 K Y 21,… ,
h r 。,
名 ),… ,(
Y』v + u ,… ,
的 凸 包 内 。在 应 用 中 ,
很 难 保 证 条 件 (8. 29)等 号 恰 好 成 立 ,
一般
是 保 证 (S. 29)等 号 近 似 成 立 ,
如 果 干 预 组 向 量 ( Y u ,… , ,Z;)在 控 制 组 凸 包
之外,
可能无法找到合适的权重向量,
这时,
将无法找到合适的合成控制组,
需
要 使 用 其 他 的 方 法 ,比 如 允 许 权 重 为 负 (回 归 合 成 方 法 )。
与双重差分法类似,
合 成 控 制 法 也 有 一 些 暗 含 的 假 设 。首 先 ,
干预组和控
制组无交互影响,
如果政策干预对干预组的影响会溢出到控制组,
那么,
控制 组
就会受到污染,
控 制 组 事 后 的 结 果 就 部 分 地 体 现 了 政 策 的 影 响 ,因 而 ,
合成控 制
组的事后结果就不是干预组很好的反事实结果的估计,
得到的因果效应也将产
生 偏 差 。其 次 ,
构造合成控制组时,
两 组 个 体 特 征 变 量 Z i ,… ,
么V+1必 须 是 干 预
前 的 变 量 或 不 受 政 策 干 预 影 响 的 变 量 。如 果 有 事 后 变 量 ,
则可能会受到政策干
预的影响,
从而造成样本选择性偏差。
2. 合成控制法的实施
合 成 控 制 法 实 施 的 关 键 是 找 到 满 足 条 件 (8. 29)的 权 重 向 量 :
W = ( w 2 ,… ,
w jV+i ) j zvj ^ 0, j = 2 ,… ,
N + 1
且 = i , 即 合 成 控 制 组 是 控 制 组 个 体 的 一 个 凸 组 合 。令 x , 是 干 预 组 个
j=2
体事前的特征,
包括可观测协变量乙和事前结果的若干线性组合,
为M X 1维
第八章面板数据方法 165
的 向 量 。同 样 地 ,
令 X。
为控制组的事前特征,
为M X N 的矩阵合成控制权
重 W* ,
…,u ^ +1)'最 小 化 下 面 距 离 ,
II X, 一 x Qw || = y c x :- X o W ) V ( x 1 - x 0w T
= J ^ A X ^ - X ^ w y (8.32)
其 中 v 是 — 个 M X M 的 对 称 正 定 矩 阵 ,通 常 是 对 角 阵 ,
对角元素为
… ,iW ,
K 是一个权重,
反映了在干预组和控制组协变量差异中的相对重要性,
是 个 体 i 的 第 m 个 协 变 量 。V 的 选 择 很 重 要 ,
合 成 控 制 W •将 依 赖 于 V 的
选择,
不 同 的 V•将 得 到 不 同 的 合 成 控 制 组 合 成 控 制 V T ( V )的 目 的 是 复
制 干 预 组 在 没 有 受 到 政 策 干 预 时 的 行 为 ,因 而 ,
A ,… , 的选择应该反映协变
量的预测能力。 …,
~的 选 择 可 以 根 据 研 究 者 对 各 协 变 量 预 测 力 的 主 观 评
价,
也 可 以 利 用 回 归 分 析 看 看 哪 些 协 变 量 具 有 更 强 的 预 测 能 力 。一 个 较 好 的 办
法是选择使事前均方预测误差(
m e a n squared predicted error,
M S P E )最小的矩
阵 V C Abadie et al.,2010),即 选 择 V 最小化
/V+l \2
1=2 )
如果事前时期足够长,
也可以使用交叉验证的方法,
将事前样本分成训练
期 (training period)和 验 证 期 (validation period) 0 给 定 任 意 矩 阵 V% 利用训练期
数 据 计 算 权 重 矩 阵 (V),然 后 利 用 验 证 期 数 据 最 小 化 ( V ) 的 M S P E 。
3 . 合成控制法假设检验
在利用合成控制法进行比较研究中,
一 般 个 体 数 不 会 太 多 ,因 而 ,
基于大样
本 的 假 设 检 验 方 法 往 往 不 合 适 。Abadie et al. (2010)提 出 了 一 种 类 似 于 置 换 检
验(
permutation test)的 推 断 方 法 ,
与 Fisher(1935)的 精 确 尸 检 验 方 法 相 似 (
Im-
bens and Rubin, 2015)。为 了 检 验 合 成 控 制 法 得 到 的 参 数 估 计 是 否 显 著 ,
原假
设 是 政 策 效 应 不 显 著 ,即 假 设 政 策 干 预 对 个 体 没 有 因 果 影 响 ,
将干预组个体放
① 兄 和 X 。可 以 包 括 亊 前 结 果 或 事 前 结 果 的 线 性 组 合 ^ 具 体 地 ,
定义向量M = ( % ,… ,
— Tc __
干 预 前 结 果 的 一 个线性组 合 表 示 为 另 w = , 比 如 mi = … = 0、
w r fl = 1 ,
则 yM =
3-1
到 控 制 组 个 体 中 ,随 机 抽 出 一 个 个 体 ,
利用上文的合成控制方法,
估计出相应的
政 策 效 应 。这 样 ,
对应于N 个控制组个体,
会 得 到 N 个相应的政策效应的估
计,
从 而 可 以 得 到 政 策 效 应 估 计 的 一 个 具 体 分 布 (exact distribution) 0 然 后 检
测 估 计 的 干 预 组 个 体 因 果 效 应 在 整 个 分 布 中 所 处 的 位 置 ,如 果 处 于 分 布 的 尾
部 ,比 如 处 于 尾 部 的 5 % ,
则说明如果原假设成立,
那么观测到估计的政策效应
的可能性低于5 % ,
原 假 设 可 能 为 假 ,如 果 设 定 5 % 的显著性水平,
则 可 以拒绝
没有政策影响的原假设,
从 而 说 明 估 计 是 显 著 的 。如 果 发 现 估 计 的 政 策 效 应 参
数在整个精确分布的中间位置,
则意味着随机抽取一个个体作为干预组,
就可
以以较大的概率得到观测到的因果效应,
说明无法拒绝原假设,
从而估计的因
果效应参数不显著。
®
这 种 检 验 方 法 实 际 上 是 一 种 安 慰 剂 检 验 (placebo test)或 证 伪 检 验 (falsifi
cation test)。为 了 检 验 估 计 的 政 策 效 应 是 否 显 著 ,随 机 从 控 制 组 中 抽 出 一 个 个
体作为一个伪干预组,
利 用 同 样 的 合 成 控 制 方 法 去 估 计 政 策 效 应 。对 伪 干 预 个
体,
它事实上没有受到政策干预,
如果估计的结果发现也有较大的政策效应,
则
说明前面的分析可能存在着问题,
因为没有受到政策影响的个体作为伪干预组
也可以发现类似于利用真实干预组得到的政策效应,
从而说明这一效应可能不
是政策干预的影响,
而 是 其 他 因 素 造 成 的 影 响 。相 反 ,利 用 所 有 控 制 组 个 体 作
为伪干预组,
均无法得到类似于利用真实干预组得到的政策效应,
则证明得到
的政策效应是显著的。
上 面 的 类 置 换 检 验 实 际 上 是 在 截 面 个 体 上 进 行 的 安 慰 剂 检 验 。如 果 事 前
时期很长,
还可以构造另一种形式的安慰剂检验,
根据时间随机置换的安慰剂
检验,
称 为 伪 干 预 时 间 检 验 (pseudo treatment) 。 因 为 所 使 用 的 数 据 都 是 干 预
之前的信息,
所有个体都没有受到真正的干预,
利用同样的合成控制方法,
如果
得到显著的政策效应,
则说明,
前 面 的 估 计 可 能 存 在 着 问 题 。相 反 ,
如果发现没
有显著的政策效应,
则证明,
前面的合成控制方法可能是有效的,
未观测的混杂
因素利用合成控制法基本得到充分控制。
4 . 案例:
加州香烟控制项目对其香烟消费的影响
影 响 。为 了 限 制 香 烟 消 费 ,
1988年 U 月 ,
加 州 政 府通过 了 9 9 法 案 ,
主要内容是
将香烟消费税每包提高2 5 美 分 ,
该 法 案 1989年 1 月正式生效,
作者主要考察
这 一 政 策 对 香 烟 消 费 的 抑 制 作 用 有 多 大 。干 预 组 为 加 州 ,
美国其他州为潜在控
制 组 (donor pool),为 了 避 免 其 他 类 似 政 策 污 染 控 制 组 ,
作者删除了在考察期出
台相 似 香 烟 控 制 政 策 的 州 ,
最 终 得 到 3 8 个 州 作 为 控 制 组 。作 者 使 用 的 数 据 为
1 970-2000年州层面的年度面板数据,
结果变量为州年度人均香烟消费量,
协
变量包括香烟平均零售价格、
州 人 均 收 入 (取 对 数 )、
州 人 口 中 15— 2 4 岁所占百
分比、
州人均啤酒消费量,
这 些 协 变 量 均 用 1980— 1 9 8 8 年 平 均 值 。另 外 ,还引
人了 1975、
1980、1 9 8 5 年 三 个 年 份 的 人 均 香 烟 消 费 量 作 为 协 变 量 ,
详细数据信
息请参 考 Abadie et al. (2010) 0
图 8.4显示的是加州的人均香烟销售量趋势和其他控制州的人均香烟销
售 量 平 均 值 变 化 趋 势 。可 以 看 出 ,
两 组 在 事 前 变 动 趋 势 并 不 完 全 相 同 ,因 而 ,
控
制组州并不是加州很好的反事实估计。由 于 变 动趋势不同,
也不大适用于双重
差 分 策 略 。下 靣 利 用 合 成 控 制 方 法 构 建 合 成 控 制 组 ,采 用 上 文 所 述 的 估 计 步
骤,
最 后 得 到 的 合 成 控 制 权 重 见 表 8. 4 。可 以 看 到 ,
在合成控制组中,
很多州的
权 重 为 0,只 有 5 个 州 最 终 进 人 了 合 成 控 制 组 ,
事 前 加 州 可 以 用 0. 3 3 2 个 U t a h 、
0 .234 个 Neva d a 、。. 196 个 M o n t a n a 、
。. 167 .个 Colorado、
。. 07 个 Connecticut
进 行 合 成 。合 成 效 果 可 以 参 见 表 8. 5 ,
可以看到,
加 州 的 主 要 协 变 量 与 3 8 个控
制州的协变量平均值还是有较大差异,
尤 其 是 1975、1980、1 9 8 8 三 年 的 人 均 香
烟销售量差异非常大,
合 成 的 加 州 各 协 变 量 与 实 际 的 加 州 已 经 非 常 相 似 ,除人
均 收 人 有 一 点 差 别 。图 8 . 5 显 示 的 是 加 州 与 合 成 加 州 的 人 均 香 烟 销 量 趋 势 图 ,
从图上可以看出,
在 99法案实施之前,
图中合成加州与真实加州的人均香烟销
售几乎完全重合,
合成加州较好地拟合了加州9 9 法案实施之前人均香烟销售
的变动趋势,
说 明 合 成 加 州 较 好 地 控 制 了 未 观 测 混 杂 因 素 (包 括 随 时 间 变 化 的
未 观 测 混 杂 因 素 )的 影 响 ,因 而 ,
有 理 由 相 信 ,如 果 加 州 没 有 实 施 9 9 法 案 ,
那么
随后加 州 人 均 香 烟 销 售 量 也 应 该 基 本 能 够 用 合 成 加 州 人 均 香 烟 销 售 量 的 变 化
来进行拟合,
从而,
合成加州人均香烟销售量可以作为真实加州人均香烟销售
量 反 事 实 结 果 的 估 计 。事 后 真 实 加 州 与 合 成 加 州 两 条 曲 线 的 差 异 反 映 的 就 是
9 9 法案的政策影响,
图 8. 5 显 示 ,
真 实 加 州 人 均 香 烟 销 售 量 1 9 8 9 年起就开始低
于合成加州的人均香烟销售量,
并且差距越来越大。
168 基本有用的计量经济学
year
图 8 . 4 人 均 香 烟 销 售 量 趋 势 :加 州 和 其 他 州
表 8. 4 合成控制组各州权重
注 :复 制 A b a d i e et al. ( 2 0 1 0 ) 表 2 。
第八章面板数据方法 169
表 8. 5 协变量均值
California A v e r a g e of
Variables ------------------------------ n ,
Real Synthetic 38 control states
注 :
复 制 Abadie et al. ( 2 0 1 0 ) 表 1 。
year
图 8 . 5 人均香烟销售量:
加州与合成加州
图 8. 6 是 利 用 加 州 的 人 均 香 烟 消 费 减 去 合 成 加 州 的 人 均 香 烟 消 费 得 到 的
政策效应,
与 图 8. 5 提 供 了 相 同 的 信 息 ,
可以看到,
在 99法案实施之前,
政策效
应基本为零,
而在法案实施之后,
政策效应开始显现,
9 9 法案使加州人均香烟消
费量逐年下降,
1989— 2 0 0 0 年 ,
年人均香烟消费量平均下降约20包 ,
降幅接近
2 5 % (Abadie et ah , 2010) 0 但 是 ,
这 一 政 策 效 应 在 统 计 上 是 否 显 著 呢 ? 作者
采用了上文提到的随机置换检验方法,
从控制组中随机抽出一个州作为伪干预
组 个 体 ,利 用 与 上 文 同 样 的 合 成 控 制 方 法 ,
估计政策效应,
可 以 得 到 类 似 图 8.6
的政策效应路径,
对 于 38个控制州,
共 可 以 得 到 38个另外的政策效应路径。
将上文估计的政策效应路径放到这3 8 个 政 策 效应路径中,
看看它在政策效应
170 基本有用的计量经济学
.S,
C/3
year
图 8 . 6 政策效应:
加州与合成加州人均香烟销售量差异
路径分布中的位置,
如果非常极端,
说明上文估计的政策效应是显著的,
否则则
不 显 著 。图 8. 7 显 示 的 是 相 应 的 显 著 性 检 验 ,图 中 黑 色 实 线 与 图 8. 6 相 同 ,
是
9 9 法案对加州人均香烟消费的影响,
其 他 浅 色 的 线 为 以 其 他 3 8 个州为伪干预
个体得到的伪政策效应,
如 果 9 9 法案对加州人均香烟消费没有影响的原假设
成立,
那么上文估计的政策效应路径出现的可能性应该比较大,
但是在图中可
以看出,
实 线 处 在 所 有 路 径 分 布 的 比 较 极 端 的 部 分 ,只 有 一 个 州 在 实 线 的 下 方 ,
因而,
在没有政策影响的原假设下,
得 到 实 线 的 政 策 效 应 的 可 能 性 只 有 2/39 =
z/i
"5
Z/i
CO
year
图 8. 7 随机置换检验
第八章面板数据方法 171
5. 1 3 % ,
因而,
在 1 0 % 的显著性水平下,
我 们 可 以 拒 绝 没 有 政 策 效 应 的 原 假 设 。在
Abadie et al. (2010)文 章 中 ,
还 作 了 进 一 步 的 处 理 ,比 如 删 除 事 前 拟 合 比 较 差 的 情
况,
只利用事前拟合度比较好的或均方预测误差比较低的结果,
看看上文得到的
政策效应路径在其他伪干预路径分布中的位置,
发 现 99法案的政策影响路径更
加极端,
从 而 证明上文的估计在政策上是显著的。
5. 小结
合成控制法是一种政策评估方法,
它适用于政策干预在某一时刻只影响某
一个地区或国家等,
而 其 他 地 区 或 国 家 在 所 有 时 期 都 没 有 受 到 政 策 影 响 。适用
场景类似于双重差分策略,
但干预组只有一个,
并且往往是针对加总的变量,
而
非 个 人 或 单 个 企 业 的 信 息 。另 外 ,
双重差分策略可以解决不随时间变化的未观
测混杂因素造成的内生性问题,
但往往不能克服具有时变性的未观测混杂因素
造 成 的 内 生 性 问 题 。在 合 成 控 制 中 ,
允许时变未观测混杂因素的存在,
通过合
成控制,
将未观测混杂因素的影响也可以考察进去,
潜 在 结 果 模 型 (8. 28)允许
未 观 测 因 素 随 时 间 和 个 体 而 变 化 。由于合成控制法要求权重必须在0_1
之 间 ,因 而 ,
如果干预组观测特征远远大于或小于控制组个体特征,
将无法找到
合 适 的 权 重 拟 合 干 预 组 个 体 ,即 干 预 组 特 征 向 量 无 法 用 控 制 组 特 征 向 量 的 凸 组
合进行构建,
此时,
将无法使用合成控制法。当然,
如果愿意放松假设,
允许负
的权重,
从而允许外推,
那么,
仍然可以通过类似合成控制法的方法,
得到一个
合成的控制组(
Abadie et al. , 2015)。Hsiao et al. (2012)的 面 板 政 策 评 估 方 法
就允许负的权重,
下 一 节 我 们 介 绍 Hsiao et ai. (2012)的 面 板 政 策 评 估 方 法 。
第四节回归合成方法
负,
并且允许常数项的存在以修正合成控制组与干预组之间的差异。
1. 回 归 合成方法的基本设定
与合成控制法设萣类似,
也是只有一个干预组个体在某一时刻受到政策干
预,
而 其 他 个 体 在 所 有 考 察 时 期 均 没 有 受 到 政 策 干 预 。同 样 地 ,
假设有N + 1 个
个体,
第 1 个 个 体 在 t > T 0 期受到政策干预,
其 他 N 个个体为潜在的控制组,
没
有 受 到 政 策 干 预 。用 来 表 示 个 体 i 在 f 期 的 干 预 状 态 ,
则有
j-1 I = 1, t > T 0
Di! = 1 0 其他情况
同样,
用Yu、
Y。,,表 示 两 个 潜 在 结 果 ,
匕表示观测结果,
则
Y" - D.Yur + ( 1 - D , ) Y 0l> - Y 0, + ruD u
其中,
^ = 匕一Y&,
为 个 体 f 第 t 期 的 政 策 效 应 。这 里 关 心 的 是 干 预 组 个 体 1
在 政 策 干 预 之 后 的 政 策 效 应 ,即
tu = Y u, ~ Y 0i! ^ y,-, — y 0,v t — T 0 + 1, ,T (8.33)
假设所有个体的基线潜在结果服从下列共同因子模型:
You = y-i + bf;
f, +e,-, i = 1,***,N + 1, t = (8. 34)
其 中 & 为个体固定效应,
/,为 K X 1 维的未观测时变共同因子A 为不随时间
变化但可能随个体变化的常数,
h 为 误 差 项 ,满 足 E [ e;
f] = 0 。将 模 型 (8. 34 )写
成矩阵形式:
Yo, = v + B / , + e , (8.35)
其 中 ,Vo, = ( Y 。
],,
…,Yon+i, ) ^= ("i,… ,
" iv+i ) = (£i,,… ,
ew+i,) fB —Cbi ?
…,
6,v+1)'为 (
N + 1 ) X K 的 共 同 因 子 系 数 矩 阵 。引 人 下 列 假 设 :
假设1 对 于 所 有 个 体 “有 丨
|bi II = c < w 。
假设2 £,〜 7(0),
并 且 £:
[£」- 0 ,
£ [ £,£: ] = ^ 为 对 角 常 数 矩 阵 。
假设 3 £:
[£,/;] - 0 o
假设 4 Rank(B)=K。
假设 5 £ [ e > | D j = 0 ,)六 。
模型(
8. 34)假 设 个 体 结 果 由 两 部 分 构 成 :影 响 所 有 个 体 结 果 的 时 变 共 同 因
子 /,和 个 体 固 定 效 应 ^ 及 个 体 扰 动 项 h 。
.假 设 个 体 特 质 部 分 之 间 是 不 相 关 的 ,
个体结果之间的相关性主要是由共同因子造成的,
但是共同因子对个体的影响
可 以 不 同 ,即 ‘
6,.# 匕。对 于 共 同 因 子 的 时 间 序 列 特 征 没 有 施 加 任 何 限 制 ,
可以是
平稳序列,
也 可 以 是 非 平 稳 序 列 。假 设 4 意 味 着 截 面 个 体 数 大 于 共 同 因 子 数 ,
即 N + 1 > K 。假 设 5 对 个 体 同 期 扰 动 项 g 和 政 策 变 量 !^ 没 有 要 求 ,
它们可以
第八章面板数据方法 173
相关,
也 可 以 独 立 。如 果 同 期 两 者 相 关 ,
则 存 在 根 据 未 观 测 因 素 进 行 的 选 择 (se
lection on unobservables),如 果 两 者 相 互 独 立 ,则 满 足 R o s e n b a u m and Rubin
(1983)的 条 件 独 立 性 假 设 。假 设 5 只 要 求 个 体 j 的 误 差 项 均 值 独 立 于 D ,>,
j 參 /,
说明除共同因子之外,
个体之间没有溢出效应。
如果能够识别内 、
在 假 设 1一 5 下 , b' 和 /,,
则 可 以 利 用 么 1(= 妁 =
L + 1 ,… ,T 来 预 测 政 策 实 施 后 干 预 组 的 反 事 实 结 果 Y 0it。但 是 ,
这里个体固定
效应、
共 同 因 子 都 是 不 可 观 测 的 ,因 而 ,
无法直接估计干预组个体事后的政策效
应 。根 据 上 文 的 假 设 ,
所有个体都受到时变共同因子的影响,
事后共同因子的
,
影 响 将 体 现 在 控 制 组 的 观 测 结 果 中 ,因 而 ,
推出时变因子 并利用事前干预组观测结果与控制组事前观测结果之间受共同
可以从事后控制组的观测结果中反
因子影响而造成的相关关系, 估计出事后如果干预组个体没有受到政策干预的
反 事 实 结 果 。实 际 上 ,回 归 合 成 方 法 直 接 利 用 控 制 组 观 测 结 果 作 为 干 预 组 个 体
观测结果的预测变量,
其基本逻辑是由于所有个体均受到共同因子的影响,
从
而 造 成 截 面 个 体 之 间 的 相 关 性 ,根 据 事 前 截 面 个 体 之 间 的 相 关 性 ,
预测干预组
和控制组个体之间的关系,
如果事后干预组个体没有受到政策干预,
那么,
各截
面个体将维持相似的依赖关系,
从而利用这种事前的依赖关系,
并利用事后控
制组的观测结果估计出如果干预组个体没有接受千预的反事实结果。
令 a = (1 ,一 y ) 为 B 零 空 间 中 的 一 个 向 量 ,即 a'S = 0 ,
具体地, 其 中 7=
(h,… 模 型 (8.35)两 边 同 乘 以 《',则 可 消 去 共 同 因 子 /,,
从而得:
Vo., = 7! (8.36)
其中 =£/€,=£】
,一/ e , = …,
由于 < 依 赖 于 所 有 的 误 差 项 = …,
iV+1,
显然,
€[与 相 关 。为
此,
可以 将 d 分解为两部分,
e,;= E L eu 1Y, ] + 奶,,
其中如= G — IL ] ,因
而,
£ U , l Y , ] = 0 。(
8. 36)可 以 写 为 :
Yoi, = y i + / Y , + E [ ^ 1 + ^ (8.37)
假设 6 E^eulYj-d^dX.
由 假 设 6 ,(
8.37)可 以 写 为 :
Yoi, = A + ^ Y t+ v u (8.38)
其中 = y, +(5, x/3=y+<^>E[fi, Iy,] = 0, Hsiao et al. (2012)证 明 ,如果 T 0—
o o , O L S 估 计 量 将 是 参 数 的 一 致 估 计 。可 以 利 用 事 前 数 据 估 计 模 型 (8. 38 )的参
数,
得到预测模型:
y 0i, = (8.39)
因而,
相应的政策效应为:
= Y lf- Y 01(, t= T 0+ 1,-,T (8.40)
174 基本有用的计量经济学
反 事 实 结 果 Y c m ,(= 丁0 + 1 ,
…,r 依赖于个体固定效应& 、
共 同 因 子 /,、
个
体 对 共 同 因 子 的 反 应 以 及 个 体 特 质 性 因 素 elt。然 而 ,
预 测 模 型 (8. 39 ).并不
需要这些信息,
原因在于共同因子的信息已经蕴含在控制组观测结果I 之 中 ,
从而可以利用控制组信息I 代替共同因子来实现对政策效应的估计。
回归合成方法与上一节的合成控制方法具有很多相似之处,
事实上,
合成
控制法也可以纳入回归合成方法的框架,
观 察 合 成 控 制 模 型 (8. 2 8 ) ,
令 &==0,
= ( 4 ,劣 ,A : ) ,则 合 成 控 制 模 型 (8. 2 8 ) 也 可 以 写 成 模 型
(8. 34)的 形 式 ,
但 为 了 保 证 (8. 36)成 立 ,
需要7 3 = 0 ,
这 一 条 件 要 求 = 0,
i=l
jV-H1 N +l JV十1
= 0 。合 成 控 制 法 通 过 么 u = 来构造干预组的反
/=1 1=1 i=2
事实结果,
不 过 它 要 求 〜 > 0 并 且 ga,. = 1 ,回 归 合 成 方 法 中 不 需 要 施 加 这 一
限制,
从 而 允 许 外 推 。® 1
2 . 回归合成控制组的选择
通过上文的讨论,
我 们 知 道 ,回 归 合 成 方 法 主 要 利 用 政 策 实 施 之 前 的 数 据
来 估 计 模 型 (8. 3 8 ) ,
将估计的模型参数代人事后的控制组个体信息,
得到干预
组 个 体 事 后 反 事 实 结 果 的 估 计 。当 事 前 时 期 远 远 大 于 控 制 组 个 体 数 时 ,即 T 0
》N ,N/T。 — co,可 以 利 用 所 有 控 制 组 个 体 作 为 潜 在 的 合 成 控 制 。但 是 ,在应
用中,
1 和 ]\//了。往 往 是 有 限 的 ,
进人模型的控制组个体越多,
上述模型的自由
度损失越多,
估 计 精 度 会 越 低 ,因 而 ,
在模型拟合时存在着拟合程度与估计精度
之间的权衡。
Hsiao et al. (2012)提 出 了 一 种 两 步 法 来 解 决 这 一 问 题 ,
首先,
依 次 选 择 1,
2,
…,iV个 控 制 组 个体进入模型,
利 用 拟 合 优 度 记 或 似 然 值 来 选 择 模 型 。对于
有 m 个控制组进人模型时,
共需要估计CS=m! /[N! ( i V _ m ) ! ] 个 模 型 ,
利
用 W 或似然值,
从中选择拟合最好的一个模型,
记 为 M ( m r 。依 次 选 择 下 来 ,
共 得 到 iV个 模 型 即 M ( 1 T ,… ,
M ( J V r 。然 后 ,
利用模型选择标准,
选择最优的
模 型 . Hsiao et al. (2012)建 议 利 用 A I C 或 A I C C 标 准 进 行 选 择 ,
两个模型 选 择
标准定义如下:
① 两 种 方 法 的 详 细 比 较 可 以 参 见 Hsiao et ah (2012) 。
第八章面板数据方法 175
其 中 p 为模型中包含的控制组个体数,
^ 为 相 应 模 型 的 O L S 回归残差向量。
3 . 案例:
C E P A 对香港 经 济 的 影 响
表 8 .6 合成控制组的权重:
AICC, 1993:Q1—20 0 3 :Q4
&S0
&
&so
a
寸
寸
b
寸
寸
呀 so
寸 寸
寸 so
寸
寸
< N 寸4 N 寸< N 寸g
b
bso
900
K>i66I
&6661
bso
(N CN
b
b i
CN
bsl
bgo
(N CN
&S66I
&g100Z
<y o a a o a oC
,go
69,
so
b
bsoo
cy cy
6962
r n <吁寸的的
66I
ro On
2
Ov ?n Os OS Os oo
C
oz
O' Os Os On Os On On
^ wm
tN tN
rJ
rs r)r) tN (N
{n (NtN
图 8 . 8 香港实际经济增长率和预测的经济增长率
合 成 效 果 和 政 策 效 应 见 图 8. 8 ,图 中 实 线 为 香 港 实 际 的 经 济 增 长 率 ,虚线为
合成香港的经济增长率,
可以看出,
2004年 C E P A 安 排 正 式 实 施 之 前 ,
两者几
乎完全重合,
说 明 合 成 控 制 组 基 本 上 与 香 港 的 运 行 模 式 相 一 致 。2 0 0 4 年 起 ,
两
条曲线产生明显的差异,
虚线在实线的下方,
意味着,
如果没有C E P A 安排,
香
港的经济增长率将比实际的要低一些,
这 说 明 C E P A 安排促进了香港的经济增
长 。具 体 地 ,C E P A 对 香 港 经 济 增 长 率 的 平 均 影 响 为 4. 03 % ,标 准 误 差 为
0. 0 1 6 0 ,因 而 ,
政策影响是显著的
第五节面板评估方法的软件实现
1 . 双 重 差 分 方 法 在 Stata中的实现
对于双重差分方法,
可 以 使 用 Stata软 件 的 回 归 命 令 regress进 行 分 析 ,
利
用 回 归 D I D 方 法 估 计 双 重 差 分 估 计 量 。这 里 介 绍 一 个 用 户 写 的 命 令 diff,diff
除 了 可 以 做 经 典 的 D I D 回 归 之 外 ,还 可 以 进 行 核 匹 配 D I D 和 分 位 数 D I D ,
diff
第八章面板数据方法 177
的语法和基本选项为:
©
outcome_var是 结 果 变 量 ,
必选 项 geriodO告 诉 软 件 时 期 变 量 ,
treated( ) 告
诉 软 件 干 预 变 量 。其 他 选 项 全 部 是 可 选 项 ,如 果 需 要 控 制 协 变 量 ,
可以加人可
选项 S0v(varlist),
vadist为 协 变 量 列 表 ;
如果想利用核匹配方法,
可以选择可选
项 kernel,
用 核 匹 配 必 须 加 上 选 项 i d ( v a m a m e ) 告 诉 软 件 面 板 的 截 面 id变 量 ,同
时 b w ( # ) 可以选择带宽,
默 认 为 0.06,
g y p e ( k ernel)可 以 选 择 核 函 数 类 型 ,
如
果已经估计出了倾向指数,
可 以 利 用 选 项 £ ^ o r e(Va m a m e)将 估 计 好 的 倾 向 指 数
提供给软件,
如果想让软件自己估计,
需要提供进人倾向指数模型的协变量,
默
认 使 用 pvCvarlist)提 供 的 协 变 量 列 表 ,如 果 还 需 要 引 入 额 外 的 协 变 量 ,可 以通
过选 项 — cov(varlist)添 加 。软 件 默 认 利 用 probit模 型 估 计 倾 向 指 数 ,如 果想
利用丨ogit模 型 估 计 ,
可 以 使 用 logit选 项 。如 果 匹 配 限 制 在 共 同 区 间 上 ,
可以加
— port选 项 。在 核 匹 配 时 ,
如果使用的是重复截面数据,
可 以 使 用 r e s 告 诉软
件,
并 且 不 需 要 加 选 项 id(varname)。旦uster和 robust分 别 可 以 选 择 标 准 误 差
的形式,
如 果 两 者 都 不 选 ,默 认 为 同 方 差 假 设 下 的 标 准 误 差 。test可 以 进 行 协
变量平衡性检验, 选 项 可 以 报 告 协 变 量 的 系 数 信 息 。选 项 b s 和 reps
(int) 可 以 利 用 自 助 法 估 计 标 准 误 差 ,reps (int)选 择 重 复 抽 样 次 数 ,export
(filename)可 以 将 估 计 结 果 输 出 到 文 本 文 件 。
下面利用 Card and Krueger (1994)的数据 cardkruegerl994. dta,
估计新泽
西州最低工资调整对新泽西州快餐业就业的影响,
数 据 为 两 期 面 板 数 据 ,主要
变量含义如下:
i d 为 快 餐 店 I D ; Z 为 时 间 ,干 预 前 取 0 ,
干 预 后 取 1; treated为分
组 变 量 ,1 为 新 泽 西 州 ,
0 为宾州;
fte为 全 职 就 业 人 数 ,主 要 的 协 变 量 b k 、fkc、
roys、
wendys为四家快餐店连锁品牌。
首先,
估计一个最基本的D I D 模型,
不控制任何协变量,
结果如下
① diff为 用 户 写 的 命 令 ,
在使用之前首先要安装该程序包,
可 以 通 过 命 令 ssc install diff, replace安
装 或 利 用 findh diff找 到 安 装 源 进 行 安 装 。
② 这 一 结 果 实 际 上 可 以 利 用 回 归 命 令 reg fte # treated, vce( robust)得 到 。
178 基本有用的计量经济学
Baseline
Control 20*013
Treated 17.069
Diff (T-C) -2 . 9 4 4 1.440 -2.04 0.041**
Follow-up
Control 17.523
Treated 17.518
Diff (T-C) -0.005 1.037 -0.00 0.996
Diff-in-Iiiff 2.939 1.774 1.66 0.098*
R-square :0. 01
— Means and Standard Errors are estimated by linear regression
— Robust Std. Errors
** Inference ;… p < 0 . 0 1 ? “ p < 0 . 0 5 ;* p < 0 . 1
结果显示,
最低工资调整使新泽西州快餐业店均雇佣人员上升3 人 ,
并且
在 1 0 % 显 著 性 水 平 下 显 著 。为 了 控 制 不 同 快 餐 店 连 锁 品 牌 的 差 异 ,
可以通过
引 人 选 项 cov(bk fkc royS)对 快 餐 店 类 型 进 行 控 制 。下 面 使 用 核 匹 配 方 法 估 计
PSM-DID估计量,
估计结果如下:
. diff fte, period(t) treated(treated) robust cov(bk kfc roys) kernel id(id)
(输出略)
这里让软件自行估计倾向指数模型,
软 件 默 认 用 probh模型进行估计,
diff
会 产 生 — 个 新 的 变 量 _ p s 保 存 拟 合 的 倾 向 指 数 。P S M - D I D 估 计 量 为 3. 0 8 8 ,
仍
然 在 1 0 % 水 平 下 显 著 。如 果 想 看 政 策 干 预 对 不 同 分 位 的 影 响 ,比如想了解新泽
西州最低工资调整对9 0 分位上的快餐店的影响程度,
可 以 利 用 qdicKquantile)
选项,
估计结果显示,
在 9 0 分位上,
政策调整对就业有显著影响,
工 资 调 整 使 90
分 位 上 的 快 餐 店 就 业 人 数 增 加 6. 2 5 人 !
第八章面板数据方法 179
(输出略)
可 以 通 过 引 人 选 项 test检 验 协 变 量 的 平 衡 性 ,下 面 的 输 出 结 果 显 示 ,三个
协 变 量 bk、
fkc、
r0ys在 干 预 组 和 控 制 组 之 间 没 有 显 著 的 差 异 ,
因而满足平衡性。
2 . 合 成 控 制 法 在 Stata软件中的实现
depvar是 结 果 变 量 ,
predictorvars是 模 型 (8. 2 8 ) 的 可 观 测 变 量 Z ,.,
有两个必选
项,
;^ u n i t ( # ) 用 于 设 定 干 预 组 个 体 ,# 为 干 预 组 个 体 的 代 码 ,
;p e r i o d # 来设定
政 策 干 预 时 点 ,# 为丁。,比 如 政 策 干 预 1 9 8 8 年 通 过 ,
1989年 正 式 实 施 ,
那么,
政
策 干 预 时 点 为 1988。剩 下 的 全 是 可 选 项 ,
;
^ n i t(ru i m H s t )是 选 择 控 制 组 个 体 的
代码列表,
如 果 不 加 该 选 项 ,默 认 数 据 中 除 干 预 组 个 体 外 的 所 有 个 体 都 是 控 制
组个体,
如果不想使用全部的控制组作为备选,
可以利用该可选项来选择想使
用的控制组个体;
xperiodUumlist)设 定 协 变 量 进 行 平 均 的 时 间 段 ,比如想利用
1980— 1 9 8 8 年 的 平 均 值 作 为 协 变 量 的 取 值 ,则 可 加 选 项 xpe.riod (1980(1)
1988),
如 果 不 加 该 可 选 项 ,默 认 利 用 政 策 干 预 时 点 前 的 所 有 数 据 进 行 平 均 ;
m s p e p e r i o d O 用 来 设 定 参 数 估 计 时 使 M S P E 最 小 化 的 干 预 前 时 期 ,如 果 不 加
该可选项,
默 认 参 数 估 计 时 利 用 干 预 时 点 前 所 有 时 期 数 据 使 M S P E 最 小 D re-
sultsperiodO用 来 设 定 产 生 的 图 形 中 所 显 示 的 时 期 ,如 果 只 想 显 示 出 1980—
1990年间的合成情况,
可 以 加 上 选 项 resultsperiod(1980(l) 1990) ,
如果不加该
可选项,
默 认 显 示 数 据 所 有 时 期 ;如 果 加 上 nested选 项 ,程 序 会 在 所 有 对 角 正
定 矩 阵 中 进 行 搜 索 以 找 到 拟 合 更 优 的 权 重 向 量 ;如 果 选 用 了 nested选 项 ,
还可
以 加 上 allopt可 选 项 ,
得 到 更 稳 健 的 估 计 结 果 ,当 然 需 要 更 多 的 计 算 时 间 ;
imit-
names( varname)可 以 将 个 体 代 码 显 疋 为 它 们 的 名 称 ,
varname是包含个体名称
的 字 符 型 变 量 。加 上 可 选 项 f ^ u r e 可 以 输 出 干 预 组 及 合 成 控 制 组 的 变 化 曲 线
图 4eep(file)可 以 将 合 成 控 制 结 果 保 存 到 文 件 file, d t a 中 ,
从而用于后续的分
析,
如果加上该选项,
产 生 的 数 据 file, dta包 括 以 下 几 个 变 量 tim e 是原始数据
的时间变量,
„Y_treated是 原 始 数 据 中 干 预 组 个 体 的 观 测 结 果 ,
_ Y „ s y n t h etic
是 合 成 控 制 组 结 果 ,即 估 计 的 干 预 组 反 事 实 结 果 ,
_ C 0„ N u m b e r 是 控 制 组 名 称 ,
_ W _ w e i g h t 为 对 应 控 制 组 个 体 的 合 成 控 制 权 重 。用 户 可 以 利 用 可 选 项 cus-
tomV(numlist)来 设 定 初 始 的 矩 阵 M ,optsettings可 以 设 定 其 他 的 最 优 化 参 数 。
下 面 我 们 使 用 Abadie et al. (2010)的 数 据 smoking, dta,
评 估 加 州 9 9 法案
对 加 州 人 均 香 烟 消 费 的 影 响 。smoking, d t a 包 含 7 个 主 要 变 量 ,state是 州 代
码,
3 为加州,
其 余 为 3 8 个潜在控制州,
y e a r 为 年 份 变 量 ,cigsale为 人 均 香 烟 销
售量,
lnincome为 对 数 州 人 均 G D P , b e e r 为 人 均 啤 酒 消 费 量 ,
agel5t02 4 为州人
口 中 15— 2 4 岁 人 口 所 占 比 重 ,
retpHce为 香 烟 零 售 价 格 。 图 8. 4 显 示 出 3 8 个
控制州香烟消费的平均值并不是加州人均香烟消费量很好的反事实结果估计。
下 面 使 用 synth命 令 构 造 合 成 控 制 组 。
在 使 用 synth命 令 之 前 ,
首 先 要 告 诉 Stata使 用 的 数 据 为 面 板 数 据 ,
可以使
用 xtset或 tsset命 令 将 数 据 设 置 为 面 板 数 据 ,
然 后 才 能 使 用 synth命 令 。使用
命 令 tsset state y e a r 将 数 据 设 置 为 面 板 数 据 ,
下 面 结 果 显 示 ,state是 截 面 个
体 变 量 (平 衡 面 板 ),
yeai■是 时 间 变 量 ,
从 1970到 2 0 0 0 年 ,
间距为1 年。
第八章面板数据方法 181
利 用 3 8 个潜在的控制组进行合成控制运算,
beer(1984(.l)1988)表 示 利 用
1984— 1 9 8 8 年 的 人 均 啤 酒 消 费 量 平 均 值 ,协 变 量 lnincorae、retprice、
agel5to24没 有 加 时 间 限 制 ,
它 们 是 根 据 后 面 Xperiod(1980(l) 1988)设 定 的 时
间计算平均值,
另外,
还引人了三年的人均香烟消费量作为协变量,
分 别 是 cig-
sale(1988)、
cigsale(1980)、
cigsale(1975) 。干预组加 州 代 码 为 3 ,
使用必选项
trunit(3),政 策 干 预 期 为 1 9 8 8 年 后 ,
使 用 必 选 项 trperiod(1988) ,并 加 上 可 选
项 fig将 估 计 出 的 合 成 加 州 和 实 际 加 州 人 均 香 烟 消 费 量 用 线 型 图 呈 现 出 来 。
这 里 没 有 限 制 备 选 控 制 组 个 体 以 及 数 据 拟 合 的 时 期 ,因 而 使 用 默 认 的 除 加 州 外
的所有州作为控制组,
并拟合所有时期的结果。
运 行 结 果 如 下 ,首 先 报 告 数 据 准 备 情 况 ,数 据 准 备 成 功 ,会 显 示 干 预 组 个
体、
控制组个体构成,
然 后 报 告 因 变 量 为 cigsale,
在哪些时期上最小化均方预
测误差,
本 例 为 1970— 1 9 8 7 年 ,
接着是预测结果时间段,
本例没有限制时间段,
预 测 时 期 为 全 部 时 间 段 ,即 1970— 2 0 0 0 年 。接 着 报 告 主 要 的 协 变 量 ,
就是在命
令中设定的形式,
并且指出,
如果没有专门设定,
对 应 协 变 量 为 x p e r i o d O 设定
时间段的平均值,
本 例 为 1980— 1 9 8 8 年 ,b e e r 和 三 个 年 份 的 cigsale设 定 了 时
间,
不 受 该 时 期 限 制 的 影 响 。至 此 ,
数 据 准 备 完 成 。接 着 进 入 第 二 阶 段 ,
运用最
优化程序,
估计合成控制权重W ,
这 里 如 果 加 上 了 可 选 项 n e s t e d ^ l l o p t ,运
行 时 间 会 较 长 。优 化 完 成 后 ,
进人第三步,
报 告 结 果 。首 先 报 告 预 测 均 方 误 差 ,
然后报告合成控制权重,
最后报告干预组和合成控制组各变量平均值,
进行平
衡 性 比 较 。如 果 加 上 可 选 项 f ig,则 会 画 出 干 预 组 实 际 结 果 及 合 成 控 制 组 的 预
测结果,
见 图 8.5。
Optimization done
RMSPE 1.997492
第八章面板数据方法 183
Unit Weights :
Co—No Unit_Weight
Alabama 0
Arkansas 0
Colorado .314
Connecticut .117
Delaware 0
Georgia 0
Idaho 0
Illinois 0
Indiana 0
Iowa 0
Kansas 0
Kentucky ! 0
Louisiana 0
Maine 0
Minnesota 0
Mississippi 0
Missouri 0
Montana 0
Nebraska 0
Nevada .226
New Hampshire 0
New Mexico 0
North Carolina 0
North Dakota 0
Ohio 0
Oklahoma 0
Pennsylvania 0
Rhode Island 0
South Carolina 0
. South Dakota 0
Tennessee 0
Texas 0
Utah .342
Vermont 0
Virginia 0
West Virginia 0
Wisconsin 0
Wyoming
184 基本有用的计量经济学
Predictor Balance :
Treated Synthetic
如果想将估计结果保存下来,
用于后面的分析,
可以加上选项k e e p U U e ),
估 计 结 果 将 会 保 存 到 file, d t a 中 。可 以 利 用 数 据 fUe.dta的变量_ Y _ t reated和—
Y —synthetic 通 过 命 令 generate te = _Y_treated — _Y_synthetic 得 到 各 期
的政策效应,
然 后 用 命 令 line te _ t i m e 画 出 类 似 图 8. 6 的 图 形 。如 果 想 检 验
估计结果的显著性,
可 以 将 每 个 控 制 组 个 体 单 独 拿 出 来 ,将 它 作 为 伪 控 制 组 个
体替代加州的位置,
将 加 州 放 回 到 控 制 组 ,重 复 上 面 的 过 程 ,
可 以 得 到 另 外 38
个 类 似 于 8. 6 的 图 形 ,
检验加州的政策效应在所有3 8 个控制州伪政策效应中
的分布情况,
如果处于分布的极端,
说明加州的政策效应显著,
相应图形类似于
图 8.7。
3 . 回 归 合 成 法 在 Stata软件中的实现
应的权重就是最优的合成控制组权重,
相对比较容易实现,
不再详述。
®
第六节总 结
本章介绍了面板数据政策评估的主要方法,
首先介绍了最常用的固定效应
模型,
它 可 以 用 来 克 服 不 随 时 间 变 化 的 混 杂 因 素 造 成 的 内 生 性 问 题 。然 后 介 绍
了双重差分法,
它实际是固定效应模型的一种变化,
但更直观,
适用于政策影响
部分群体的情形,
主要的识别条件是共同趋势假设或不变偏差假设,
它与固定
效应方法一样,
是 可 以 克 服 不 随 时 间 变 化 的 混 杂 因 素 造 成 的 内 生 性 问 题 。合成
控制法和回归合成法均类似于双重差分方法,
但适用于干预组只有一个个体,
往 往 是 地 区 或 国 家 ,两 种 方 法 类 似 ,
均假设所有个体受到时变未观测混杂因素
的共同推动,
使干预组个体与控制组个体之间发生依赖关系,
从这种依赖关系
中 估 计 干 预 组 的 反 事 实 结 果 。两 种 方 法 均 允 许 存 在 随 时 间 变 化 的 未 观 测 混 杂
因素,
从而要求的识别条件比D I D 和固定效应方法弱。
推荐阅读
Angrist and Pischke (2009)第 5 章 对 D I D 和 固 定 效 应 方 法 进 行 了 简 要 介
绍 。关 于 面 板 数 据 固 定 效 应 方 法 更 详 细 的 讨 论 可 以 参 考 Wooldridge(2010) 和
Hsiao(2014)。lmbens and Wooldridge(2009) ,Lechner(2010) 对 D I D 方法进
行 了 很 好 的 综 述 。合 成 控 制 法 可 以 参 考 Abadie and Gardeazabal (2003) ,
Aba
die et al. (2010)和 Abadie et al. (2015)等 。关 于 回 归 合 成 方 法 可 以 参 考 Hsiao
et al. (2012) ,O uyang and Peng (2015)等 。
① V eg a-BayO (2015)构 造 了 回 归 合 成 控 制 法 的 R 语 言 宏 包 p a m p e ,
熟 悉 R 语言的读者可以使用
p a mpe进行回归合成估计,
在此不再赘述《
第九章断点回归设计
第一节断点回归设计
断 点 回 归 设 计 的 基 本 思 想 是 一 个 原 因 变 量 或 干 预 ( D )完 全 依 赖 于 一 个 参 考
变量(X),
® 参考变量本身可以对结果有影响,
也可以没有影响,
如果有影响,
假
设结果变量m 与 参 考 变 量 (x ) 之 间 的 关 系 是 连 续 的 ,
其他可能影响结果的因
素(
z)在断点处也是连续的,
那么,
结 果 变 量 y 在断点处的跳跃就可以解释为原
因 变 量 d 的 影 响 。断 点 回 归 设 计 根 据 干 预 的 分 配 规 则 可 以 分 为 两 类 :精确断点
① Compbeil认 为 K D D 仅 适 用 于 教 育 学 领 域 荷 限 的 场 景 。关 于 断 点 回 归 设 计 的 历 史 和 发 展 可 以
参考 Cook(2008>„
② 有 关 R D D 方法的综述可
Lemieux (2010)、
Keele and Titiunik(2015) ^Skovron and Titiunik(2015) 等 &
③ 模 糊 断 点 回 归 的 称 谓 来 自 于 T r 0chim(1984) 。
④ 英 文 中 称 之 为 running variable、
forcing variable或 assignment variable,
我们称之为参考变貴
为 原 因 变 量 或 千 预 的 分 配 完 全 参 考 这 一 变 ft是 否 超 过 一 个 临 界 值 。
第九章断点回归设计 187
回 归 和 模 糊 断 点 回 归 。精 确 断 点 回 归 是 指 干 预 分 配 完 全 由 参 考 变 量 是 否 超 过
临界值决定,
用公式表示,
D = l ( X > x Q) ,
其 中 1( • ) 为 示 性 函 数 ,条 件 成 立 取
1,
条件不成立取0 ,
x 。是 临 界 值 ,因 而 ,如 果 参 考 变 量 超 过 (或 等 于 )临 界 值 ,
则
个体接受干预,
D = l , 如果参考变量不超过临界值,
则个体没有被干预,
1) = 0 。
以 Thistlethwait and Campbell (1960)关 于 奖 学 金 的 影 响 为 例 ,如 果 学 生 成 绩
超过门槛则获得奖学金,
如果没有超过门槛则没有得到奖学金,
这种情况下,
是
否得到奖学金完全由参考变量— 学 生 分 数 是 否 超 过 门 槛 值 决 定 。如 果 干 预
的分配不是完全由参考变量决定的,
干预分配还受到其他研究者看不到的因素
影响,
但是,
断 点 左 右 个 体 接 受 干 预 的 可 能 性 不 同 ,比 如 ,如 果 奖 学 金 的 评 比 除
了以往学习成绩,
还看学生领导能力,
但是领导能力不可测度或者能力测度研
究者无法观测,
那 么 我 们 将 看 到 ,有 些 学 生 成 绩 超 过 了 门 槛 ,
但没有得到奖学
金,
而有些学生成绩低于门槛,
但 得 到 了 奖 学 金 。但 是 总 体 上 看 ,
学生成绩超过
门槛得到奖学金的可能性将高于低于门槛的学生,
这种情况适用于模糊断点回
归 。用 公 式 表 示 ,
在模糊断点回归中,
D = /XT,
e) ,
其 中 了 = 1 ( 乂> 0 :
。),
&是 影
响干预的其他未观测因素,
并且
P r [ D = 1 | T = 1] ^ P r [ D = 1 | T = 0]
即在断点左右个体接受干预的可能性不同。
断 点 回 归 设 计 的 因 果 图 可 以 用 图 9. 1 表 示 。图 9. 1 U )表 示 精 确 断 点 回 归
设 计 是 参 考 变 量 ,比 如 表 示 以 前 的 学 习 成 绩 ,
D 为 干 预 变 量 或 原 因 变 量 ,表
示是否获得奖学金,
D 完全由参考变量X 决 定 ,
Y 是未来的学习成绩,
U 是其他
影 响 学 习 成 绩 的 因 素 ,比 如 学 生 的 能 力 ,
它不但影响未来的学习成绩,
对以前的
学习成绩也会有影响,
但 是 可 能 不 可 观 测 。从 图 9. 1(a)可 以 看 出 ,
混 杂 因 素 C/
产 生 一 条 后 门 路 径 D —X — L7— 不可观测,
但 是 X 是可以观测的,
读者可
能会想到,
我们可以利用后门规则,
以 X 为条件阻断该后门路径,
从而识别因果
路 径 所 反 映 的 因 果 效 应 。问 题 是 当 我 们 以 X 为 条 件 时 ,由 于 参 考 变 量 X
完全决定D ,
从 而 D 不再有变动性,
也 就 无 法 识 别 D 对 Y 的 因 果 影 响 。事实
上 ,由 于 精 确 断 点 回 归 设 计 情 形 下 ,
参考变量完全决定了干预分配,
从而一旦控
制也就没有任何变动性了,
将 独 立 于 任 何 随 机 变 量 ,当 然 也 独 立 于 潜 在 结
果 ,因而 在 回 归 方 法 和 匹 配 方 法 中 要 求 的 识 别 条 件 C I A 在 这 里 显 然 是 满 足 的 ,
即 丨 足 。但 是 共 同 区 间 假 设 0 < P r L D 严 是 不 满 足 的 ,
参
考变量一旦超过临界值,
所有个体都进人了干预组,
从而
1,
而一旦低于临界值,
所有个体都进人了控制组,
?1"[1), = 1|足 < 0 :
。] = 0 , 因 而 ,
无 法 利 用 回 归 方 法 或 匹 配 方 法 获 得 因 果 效 应 的 估 计 。精 确 断 点 回 归 就 是 利 用
188 基本有用的计量经济学
个体在断点处如果不能精确控制参考变量,
使得在断点附近近似于完全随机化
实验,
从 而 在 断 点 附 近 两 边 的 个 体 具 有 非 常 相 似 的 特 征 ,可 以 利 用 两 边 个 体 结
果 的 差 异 来 估 计 干 预 的 因 果 效 应 。从 图 上 看 ,
如果我们将关注的个体集中在断
点附近的区域,
相 当 于 切 断 了 图 中 的 后 门 路 径 D — X —U — Y ,
从而可以利用随
机 化 实 验 中 的 分 析 方 法 来 进 行 因 果 效 应 的 分 析 ,问 题 是 应 该 选 择 多 近 的 区 域 ,
在后文中我们会进行详细讨论。
(a)精确断点 (
b) 模糊断点
图 9.1 R D D 因果图
图 9. 1(b)描 述 的 是 模 糊 断 点 回 归 设 计 。个 体 的 干 预 状 态 不 完 全 取 决 于 参
考变量,
还 受 到 其 他 未 观 测 因 素 的 影 响 ,干 预 状 态 D 同 时 受 到 T 和 £ 的 影 响 ,
丁 是 完 全 由 参 考 变 量 X 决 定 的 。 同 样 地 ,未 观 测 混 杂 因 素 U 可能
同时 影 响 X 和 结 果 变 量 此 外 ,
影 响 D 的 未 观 测 因 素 s 也 可 能 同 时 影 响结果
变 量 Y 。我 们 关 心 的 是 因 果 路 径 所 体 现 的 因 果 效 应 ,
但混杂了两条后门
路 径 D — 了― X — L7— Y 和 D — Y 的 影 响 。仍 然 用 奖 学 金 的 例 子 ,现 在 假 设
奖学金的评比除了参考以往的成绩X ,
还参考学生领导能力等平时表现e,
但这
一因素研究者无法观测,
•了 表 示 学 生 以 往 分 数 是 否 超 过 临 界 点 ,
会直接影响学
生是否能获得奖学金,
但 与 精 确 断 点 回 归 设 计 不 同 ,它 并 不 完 全 决 定 最 终 的 奖
学 金 分 配 状 态 D ; 未 观 测 因 素 L7表 示 学 生 的 学 习 能 力 ,同 时 影 响 学 生 以 往 的 学
习成绩;
C 和未来的学习成绩Y ,
而 e 可 能 也 会 影 响 个 人 成 绩 。这 时 ,
我们可 以
利 用 后 门 规 则 ,以 X 或 丁 为 条 件 ,可 以 阻 断 后 门 路 径 D — 了― X — 的影
响,
但 是 后 门 路 径 D — e— Y 造 成 的 混 杂 影 响 仍 然 无 法 消 除 。如 果 个 体 不 能 精
确地控制参考变量X ,
在 断 点 附 近 近 似 于 完 全 随 机 化 实 验 ,了 近 似 于 完 全 随 机
化分配的,
在 断 点 附 近 两 边 的 个 体 具 有 较 好 的 可 比 性 ^与 精 确 断 点 回 归 设 计 不
同的地方在于,
断 点 两 边 的 个 体 与 实 际 接 受 的 干 预 状 态 并 不 一 致 ,即 在 断 点 右
边的个体不一定接受干预,
断 点 左 边 个 体 也 有 可 能 接 受 干 预 。不 妨 假 设 断 点 右
边个体接受干预的可能性更大,
奖学金的例子中,
分数超过临界点则获得奖学
金 的 可 能 性 会 更 高 。但 是 ,
获得奖学金的个体和没有获得奖学金的个体即使在
断 点 附 近 也 可 能 不 可 比 ,比 如 获 得 奖 学 金 的 个 体 很 多 可 能 在 平 时 表 现 上 获 得 了
第九章断点回归设计 189
加分,
而 未 获 得 奖 学 金 的 学 生 在 平 时 表 现 上 可 能 会 差 一 些 。但 是 ,
对于断点附
近 群 体 ,以 往 成 绩 是 否 超 过 断 点 ,即 变 量 r ,
会 对 最 终 是 否 获 得 奖 学 金 d 有着重
要的影响,
或密切相关,
但了在断点附近近似于随机化分配的,
从而使得:
r成
为 D 天 然 的 工 具 变 量 。在 图 9. 1 ( b ) 中 ,当 我 们 将 样 本 限 制 在 断 点 附 近 较 小 的
领域内时,
近似相当于固定了 x 值 ,
从 而 阻 断 了 后 门 路 径 D — T — 入一C7— r 造
成的混杂影响,
但 是 另 一 条 后 门 路 径 o —e— y 造 成 的 混 杂 影 响 仍 然 存 在 ,当第
—条后门路径的影响消除之后,
了就成为d 的一个有效的工具变量,
从而可以
识 别 出 D 对 Y 的 因 果 影 响 。至 于 如 何 选 择 断 点 附 近 较 小 的 领 域 ,我 们 后 文 进
行 讨 论 。下 面 ,
我们讨论断点回归设计的基本识别条件。
假 设 9. 1 ( 断 点 假 设 ) 假设极限
p+ = I i m E [ D ,-丨X,. = - ] , p ~ = limE[D,- | X, -= jc]
存在,
并 且 其 中 U.=IX乃,
s ) ,T,. = l(X,.>:r。),
如 果 是 精 确 断 点 ,则
D t= Tr, 为倾向指数,
表示参考变量
为 x 的 个 体 进 入 干 预 组 的 概 率 ,如 果 是 精 确 断 点 ,则 = 1, = 0 ,即断点右
侧 个 体 都 进 入 干 预 组 ,左 侧 个 体 进 入 控 制 组 。®
假 设 9. 1 是 说 个 体 分 配 概 率 在 临 界 值 左 右 有 跳 跃 ,
存 在 断 点 。如 果 是 精 确
断点,
那 么 个 体 干 预 状 态 以 与 断 点 T,.完 全 依 从 ,
在右侧均进入干预组,
在左侧
均 进 入 控 制 组 。如 果 是 模 糊 断 点 ,
则存在着不完全依从的现象,
从 而 D,.乒 r ,,
这
时 我 们 要 求 断 点 左 右 的 分 配 概 率 存 在 间 断 ,比 如 要 求 断 点 右 侧 个 体 接 受 干 预 的
概率高于断点左侧的概率。
假 设 9. 2(连 续 性 假 设 } X,.= 工] 、
E[YU 丨
X , = 工] 是 x 的 函 数 ,并且
在A 处 是 连 续 的 ,即
limE[Y;/ | X ;— x 0 s'] = limE[Yj7 丨X,. = x 0 — s ] , j = 0,1
C— 0 £~*0
如果只关心干预组的平均因果效应(
ATT),
那么只需要£[Y。
, IX ;= X ] 在 A 处
连 续 。通 常 假 设 两 潜 在 结 果 的 条 件 期 望 函 数 均 是 连 续 函 数 ,只 假 设 在 一 点 连 续
而 在 其 他 点 不 连 续 是 比 较 奇 怪 的 ,因 而 ,
应 用 中 通 常 假 设 在 所 有 点 上 连 续 (Im-
bens and Lemieux, 2008) 。
①当然也可以反过来,
右侧个体均进入控制组,
而 左 侧 个 体 均 进 人 干 预 组 ,即 有 > + = o ,
/>- = i ,只
要满足断点左右的分配概率存在间断就满足该基本假设,
但正向性依从的假设往往更符合现实》
190 基本有用的计量经济学
假 设 9. 3 ( 局 部 随 机 化 假 设 ) 假 设 在 断 点 附 近 近 似 于 完 全 随 机 化 实 验 ,即
( Y u ^ o i ) ALD, | X,- € 沢 办 ) (9 .1 )
其 中 5 U Q) = ( x 。一5 ,
文。+ 幻 为 々 的 <5邻 域 ,
冗> 0 为 任 意 小 的 正 数 。
局部随机化假设要求个体不能精确控制或操纵参考变量使之超过临界值,
在奖学金的例子中,
学 生 对 学 习 成 绩 具 有 一 定 的 控 制 能 力 ,学 生 知 道 未 来 奖 学
金会根据学习成绩进行分配,
从 而 努 力 学 习 以 超 过 临 界 成 绩 ,当 然 对 于 成 绩 很
好 或 成 绩 很 差 者 ,即 离 断 点 很 远 的 学 生 存 在 着 很 大 的 差 异 ,
但是在断点附近,
成
绩是否能够超过临界点,
可能存在着运气的成分,
在 断 点 附 近 ,比 如 在 百 分 制 成
绩中,
超过临界点1 分和低于 临 界 点 1 分的学生学习能力等特征可能非常相
似,
1 分差异可能是偶然的成分或运气的成分造成的,
但 是 高 于 临 界 点 1 分的就
获得了奖学金,
而 低 于 1 分 的 就 没 有 拿 到 奖 学 金 。只 要 学 生 不 能 精 确 地 控 制 成
绩,
那么,
在临界点附近的学生干预状态的分配就近似于完全随机化实验的结
果 。正 是 基 于 这 一 点 ,Lee and Lemieux (2010)认 为 R D D 策 略 更 加 透 明 ,
估计
结果更加令人信服,
他 们 指 出 R D D 是 随 机 化 实 验 的 近 亲 , 他们还比较分析了
R D D 策略和随机化实验的相似性以及与其他识别方法的差别,
读者可以参考
他 们 的 原 文 。如 果 个 体 能 够 精 确 地 控 制 参 考 变 量 ,比 如 学 生 可 以 通 过 找 老 师 或
其他方式修改自己的成绩,
这样在断点附近两边的学生就可能出现较大差异,
那么局部随机化假设将不再满足,
从 而 R D D 策 略 失 效 。局 部 随 机 化 假 设 是
R D D 策 略 有 效 的 关 键 假 设 之 一 ,可 以 利 用 参 考 变 量 分 布 在 断 点 处 是 否 连 续 进
行判断,
M c C m r y (2008)提 出 了 一 种 基 于 非 参 数 的 密 度 函 数 检 验 方 法 ,
后文会进
行介绍。
定 理 9 . 1 ( H a h n et al.,2001,
定 理 2) 如 果 断 点 假 设 9. 1 、
连 续 性 假 设 9. 2
和局部随机化假设9.3成立,
则有
其中 = Y U ~ Y 0;
为 个 体 因 果 效 应 ,"(x) Y; = Y 0i + r ;D ;…十=
|X ;= x ] ,
,[T = lim 0
定 理 9. 1 说 明 如 果 干 预 分 配 概 率 在 临 界 点 处 有 间 断 ,
但总体而言潜在结果
是参考变量的连续函数,
并且个体没有能力对参考变量进行精确的操纵,
从而
① 原 文 是 “… ,namely that R D designs are particularly compelling because they are close cousins of
randomised experiments,?CLee and Lemieux, 2010,p. 285) 。
第九章断点回归设计 191
在 断 点 局 部 近 似 于 完 全 随 机 化 实 验 ,那 么 ,我 们 可 以 识 别 出 在 断 点 处 的 平 均 因
果 效 应 。如 果 是 精 确 断 点 ,
断点完全决定干预分配状态,
则 >+ = i,/r=o,
从而
在 断 点 处 的 平 均 因 果 效 应 为 £[>,.丨兄= 工。] = ;
«+ - /^ ,即 在 断 点 处 结 果 平 均 值
的 跳 跃 可 以 解 释 为 干 预 的 影 响 。下 面 我 们 给 出 该 定 理 的 证 明 :
证明考虑在断点左右观测结果的期望值变化,
对 于 0<s<^,
E [ Y i | X, = X o + s ] - E[Y; 1 = X 。 一 e]
- E l Y 0i + r,D; | X, = x 。+ e] — £ [ Y 。
,-十 | X, = _r。一 e]
二 { E [ Y 0l- I X ; = a + s ] — I Xi = x o - e ] }
+ {E[r,D; | X, = x 0 + e ] - E [ r ;D,- | X ; = x 0 - e ] } (9.3)
其中第一行等号利用观测结果与潜在结果之间的关系
y. - d ;y 1; + a — d ;) y 0!- = y 0;+ ( y ,;- v 0i) D ;
当 £— 0 ,
根 据 连 续 性 假 设 9. 2 ,(9. 3)第 二 行 第 一 项 将 趋 近 于 0 ,即
lim{E[y0;| X, = x 。+ e ] — E [ Y 0;1 X,.= 工。一 e]} = 0 (9. 4)
£—0
考 虑 (9. 3)第 二 项 ,利 用 局 部 随 机 化 假 设 9. 3 ,X,.eS(x。), 有 it,.JLD,.|X,.,
则
E [ r (D ; | X ; - x 。+ s ] -E[r,.D,. | X ( = x 0 - s ]
= K[ r ; | X ; = xo + e ] E [ D f | X ; - x 0 + e ]
— E[r,. | = x , - e ] E l D i | X,- = ^ 0 - e ]
两 边 取 极 限 ,由 连 续 性 假 设 9. 2 得
\[m{ElriD 1 \ X ; = x a + e] - | X, - -r0 ~ e ] }
t-*-0
~ lim{E[ri | X; = xQ + e ] E [ D ;丨X, = x 。+ e ] }
e—0
— lim{_E[r/ 丨Xi = x 0 一 e]E[A. 1 X; = x 。一 e]}
e— 0
^ E^Ti | X { = xo^ip^—p~)
从而,
E[ri | X, = a:0] = p + ^ ,~
定 理 9. 1 依 赖 于 局 部 随 机 化 假 设 ,即 假 设 在 断 点 附 近 干 预 变 量 的 分 配 近 似
于完全随机化实验,
从 而 排 除 了 个 人 根 据 预 期 收 益 进 行 的 自 选 择 问 题 。这一 假
192 基本有用的计量经济学
设有可能不成立,
尤其是在模糊断点情形下,
断点可以激励一部分个体进入干
预组,
但由于其他未观测因素的影响,
或一些个体出于自身原因,
即使参考变量
超过断点,
也可能选择不接受干预。相反地,
一些个体尽管在断点左侧,
仍然可
能有激励选择进人干预组,
这样,
我们可能就没有办法保证在断点附近,
干预的
分配独立于潜在结果,
个体有可能根据潜在的预期收益决定是否接受断点给予
的激励,
这种可能的自选择行为使断点左右的个体不具有可比性,
从而局部随
机化假设可能不满足。在精确断点情况下, 如果个体不能精确地控制参考变
量,
局部随机化假设满足。但在模糊断点情况下, 局部随机化假设往往不能满
足,
下面, 针对模糊断点识别引人另外的假设替代局部随机化假设。
定 义 D,(:r)表示参考变量为 1 个体的干预状态, 表
示参考变量在断点右侧时个体 / 的参与状态。同样地, 定 义 Z \ . ( x ) = A U ),
•r<Cr。表示参考变量在断点左侧时个体的参与状态,
则
Dj —
D0i (x) x <. x 0
假 设 9. 5( 单调性假设) 假设断点对所有个体的影响方向是相同的,
这里
我们假设正向单调性成立,
即存在 3 > 0 ,
使得对于任意 ■xeSOr。
),有
D]i (x) ^ D 0;
(x) (9.7)
定 理 9.2 (Hahn et al.,2001, 定 理 3) 如果断点假设 9. 1 、
连续性假设
9. 2 、
独立性假设 9, 4 和单调性假设 9. 5 成立,
则
• {E[D,- | X; = x 0 + e ] — E [ D ;| X, = x 0 — s]}
根 据 连 续 性 假 设 9. 2 ,
上 式 等 号 右 边 第 一 项 为 零 ,因 而 ,
limECr, | D u (x0 + e ) > D 0i(x0 — e)]
£—0
limE[y; | X, = A + e] — limE[y; | X,- = x 。一 e]
— t— 0___ __________________ e—0 _____________
l i m E [ D ;| Xi = 工0 + £] — limE[D,- [ X ;= x 0 — e]
e—0 e—0
^ "+ —
P +- P —
预变量的工具变量,
并 且 可 以 识 别 出 在 断 点 上 依 从 者 的 平 均 因 果 效 应 。定理
9. 2 实 际 上 是 第 七 章 的 L A T E 定 理 在 断 点 回 归 设 计 情 形 下 的 应 用 。
再 举 个 熟 悉 的 例 子 ,比 如 考 察 研 究 生 教 育 对 个 体 收 人 的 影 响 ,
这是经典的
教育收益率问题,
可 以 利 用 推 免 资 格 作 为 一 种 断 点 回 归 设 计 。根 据 学 生 的 综 合
成 绩 是 否 超 过 一 个 临 界 点 来 确 定 推 免 资 格 ,从 而 使 得 在 断 点 附 近 的 学 生 比 较 相
似, 但是学生最终是否选择读研究生, 还取决于其个体的一些未观测因素, 这些
未观测因素会影响个体的选择,
也可能影响到个体的收人,
从而是未观测的混
杂因素,
直接利用读研和未读研学生的比较显然有问题E 如果成绩临界点是由
学校官方给定的,
可能满足外生性的假设,
断点独立于学生个体的潜在结果,
并
且 推 免 资 格 显 然 影 响 个 体 的 读 研 行 为 ,因 而 断 点 可 以 作 为 是 否 读 研 的 工 具 变
量 。那 些 无 论 是 否 有 推 免 资 格 都 会 读 研 的 学 生 为 总 是 参 与 者 ,
那些无论是否有
推免资格都不会读研的为从不参与者,
而 那 些 有 资 格 会 读 研 ,没 有 资 格 就 不 读
研 的 学 生 是 依 从 者 。如 果 读 研 的 因 果 效 应 存 在 个 体 异 质 性 ,
那么,
工具变量估
计 量 所 识 别 出 的 是 依 从 者 的 平 均 因 果 效 应 ,即 在 断 点 附 近 ,
那些有资格就读研,
没有资格就不读研的学生的平均因果效应。
第二节断点回归设计的图形分析
断点回归设计与其他识别方法不同的地方在于其设计的透明性和清晰性,
根据上文的理论分析,
;R D D 的 基 本 识 别 条 件 是 干 预 分 配 概 率 在 临 界 点 会 有 跳
跃,
结果变量在临界点也会有跳跃,
而其他影响结果的变量在临界点没有跳跃,
从 而 可 以 将 结 果 变 量 的 跳 跃 归 因 为 干 预 变 量 的 影 响 。因 而 ,
在进行具体的实证
分析之前,
通 常 可 以 画 出 干 预 分 配 概 率 与 参 考 变 量 之 间 的 关 系 图 ,判 断 是 适 用
精 确 断 点 回 归 还 是 模 糊 断 点 回 归 。然 后 ,
可以画出结果变量与参考变量之间的
关系图,
看 看 结 果 变 量 在 断 点 处 是 否 有 跳 跃 ,另 外 也 可 以 检 测 在 参 考 变 量 的 其
他位置是否也存在着跳跃,
从 而 作 为 一 种 证 伪 检 验 ,即 如 果 在 非 断 点 位 置 ,
发现
结果变量有跳跃,
则说明可能是其他因素引起的,
那么,
我们就怀疑在断点处的
跳跃可能混杂了其他因素的影响,
则 间 断 回 归 设 计 就 可 能 存 在 问 题 。另 外 ,为
了 验 证 间 断 回 归 设 计 的 有 效 性 ,如 果 存 在 其 他 影 响 结 果 的 可 观 测 协 变 量 ,
则可
以 画 出 这 些 协 变 量 与 参 考 变 量 之 间 的 关 系 图 ,检 验 它 们 在 临 界 点 处 是 否 有 间
断,
如果其他协变量在间断点处有跳跃,
那么,
结果的跳跃有可能是这些协变量
造成的,
就不能完全将结果的跳跃归因为干预变量的影响,
从而,
R D D 会存在
问题,
相反,
如果其他协变量在断点处是连续的,
则 R D D 结 果 更 为 可 信 。最 后 ,
第九章断点回归设计 195
为了保证R D D 设计的有效性,
个体不能精确控制参考变量,
一种图形检验方法
是 画 出 参 考 变 量 的 分 布 图 ,如 果 个 体 不 能 精 确 控 制 参 考 变 量 ,
其分布在断点处
应该是连续的,
如果发现参考变量集中于断点的一侧,
则个体可能可以精确控
制参考变量。
Lee(2008)分 析 了 美 国 各 地 区 众 议 员 选 举 中 在 位 党 在 竞 选 中 是 否 具 有 优
势 。美 国 具 有 两 大 党 派 ,一 党 所 获 选 票 份 额 如 果 超 过 竞 争 对 手 ,
那么,
该党在该
地区将成为在位党,
Lee以民主党所获选票份额与共和党所获选票份额的差额
作为参考变量,
间断点为0,
只要上次竞选中,
参 考 变 量 大 于 临 界 点 0 即意味着
民主党在位,
否则共和党在位。由于两党选票份额差额不可能大于1,
作者将参
考 变 量 限 制 在 断 点 左 右 0. 5 范 围 内 ,因 为 0. 5 之 外 的 样 本 点 较 少 。结 果 变 量 为
未来竞选中民主党所获得的选票份额,
各 党 的 竞 选 经 费 、候 选 人 质 量 等 是 竞 选
选 票 份 额 的 其 他 协 变 量 。 由 于 民 主 党 份 额 超 过 共 和 党 ,民 主 党 就 成 为 在 位 党 ,
不 存 在 不 依 从 的 情 况 ,因 而 Lee(2008)利 用 精 确 断 点 回 归 分 析 在 位 党 派 的 在 位
优 势 。下 面 ,
我们利用他的例子,
探讨断点回归中的图形分析。
1. 结 果变量与参考变量关系图
首先可以画出结果变量与参考变量之间的关系图,
看看结果变量是否在间
断点处跳跃,
但避免直接利用原始数据画图,
原始数据中噪音太多,
可以通过适
当 的 平 均 后 再 画 图 。通 常 可 以 将 参 考 变 量 划 分 为 一 系 列 区 间 ,区 间 的 宽 度 相
同,
并 且 保 证 断 点 左 边 和 右 边 分 别 在 不 同 的 区 间 里 ,避 免 将 处 于 不 同 干 预 状 态
的个体 混 在 同 一 区 间 。然 后 将 所 有 区 间 里 个 体 结 果 变 量 的 平 均 值 与 区 间 的 中
点进行描点,
可以得到结果变量相对于参考变量的关系图,
可以通过多项式分
别 对 断 点 两 边 的 点 进 行 拟 合 ,同 时 将 拟 合 的 曲 线 描 在 图 上 。
具体地,
选 择 某 一 带 宽 h 相 应 断 点 左 右 所 划 分 的 区 间 数 分 别 为 K 。和 ,
目 的 是 构 造 一 系 列 区 间 々= 1 ,
… ,尺 二 仏 + 仏 ,
其中
bk — — (K0 — 々+ l)/i
区间々中个体结果的平均值为:
— 7 N
Y, = 士 < 6 , +1) (9.9)
队 i=i
其 中 N k 为区间々中个体的数量,
可以表示为:
®
N
Nk= (9.9)
①该数量可以用于检测个体是否可以精确控制参考变显,
参 见 M CCrary(2008) 。
196 基本有用的计量经济学
):
ti
C0P U
3S
HC
CO
MS
I:
足 0>
c
Democratic Vote Share Margin of Victory,Electiont Democratic Vote Share Margin of Victory, Electioi
Note: Replicate figure 6 of Lee Note: Replicate figure 9 of Lee and
and L e m i e u m x (2010) L e m i e u m x (2010)
图 9 . 2 结 果 变 量 与 参 考 变 量 关 系 图 ,带 宽 为 0 . 0 2 ( 5 0 个 区 间 )
图 9 . 2 选 择 0, 0 2 的 带 宽 ,
将 参 考 变 量 分 成 了 5 0 个 区 间 ,图 中 的 点 为 每 个
区间中结果变量的平均值,
横 坐 标 对 应 于 相 应 区 间 的 中 点 ,图 中 曲 线 是 利 用 4
阶多项式分别对断点左右的点拟合而得的。
® 图 9. 2(a)显 示 ,
结果变量在断点
处有一个非常明显的跳跃,
在 断 点 右 侧 ,民 主 党 选 票 份 额 超 过 50 % ,
而在断点左
侧 ,民 主 党 选 票 份 额 为 4 5 % 左 右 ,
相差8 % 左右,
并且在参考变量的其他位置没
有 发 现 明 显 的 跳 跃 。如 果 将 下 一 次 民 主 党 竞 选 成 功 的 概 率 作 为 结 果 变 量 ,
断点
则更加明显,
图 9.2(b)显 示 ,断 点 右 侧 民 主 党 竞 选 成 功 的 概 率 超 过 60% , 而断
点左侧民主党竞选成功的概率仅有2 0 % ,
相 差 接 近 4 0 % ,即 如 果 民 主 党 为 在 位
党,
那 么 民 主 党 在 下 一 次 众 议 员 选 举 中 成 功 的 概 率 会 提 高 40% , 在参考变量的
其他位置没有发现明显的跳跃。
结果变量与参考变量之间的关系图可以帮助我们观测结果变量在临界点
处 是 否 出 现 间 断 .,
另外,
也可以帮助我们检测在参考变量的其他位置结果变量
是 否 出 现 间 断 。正 是 由 于 这 一 点 ,
使 得 R D D 方法与其他识别方法相比,
更加清
晰透明,
避 免 研 究 者 在 研 究 设 计 上 有 意 或 无 意 的 主 观 偏 差 ,从 而 使 R D D 的识别
结 果 更 加 可 信 。在 L ee(2 0 0 8 ) 选 票 的 例 子 中 ,
是精确断点回归设计,
如果是模
糊断点回归设计,
还可以画出干预分配状态与参考变量之间的关系图,
检验干
预 分配概率是否在断点处跳跃。当 然 ,
在 画 这 类 图 形 时 ,面 临 着 应 该 划 分 多 少
① 具 体 地 ,
拟合方程为I = Q t (又4 — .rc V 十 其 中 沁 为 区 间 是 的 中 点 ,即 兄 .= (6, +
第九章断点回归设计 197
区间以及每个区间应该多宽的问题,
如果区间过窄,
可能无法消除噪音,
从而无
法将断点位置的跳跃呈现出来,
如果区间过宽,
则可能造成较大的偏差,
从而扭
曲 跳 跃 的 幅 度 。一 种 简 单 的 方 法 是 通 过 采 用 不 同 的 带 宽 ,
试 画 相 应 的 图 形 ,检
验 相 应 的 间 断 点 跳 跃 是 否 仍 然 存 在 ,如 果 存 在 ,说 明 断 点 跳 跃 可 能 是 稳 健 的 。
另 一 种 更 为 正 式 的 方 法 是 利 用 交 叉 验 证 方 法 (cross validation) ,同 时 权 衡 估 计
偏差和估计精度,
选择一个最优的带宽,
下文将对该方法进行详细讨论。
结果变量与参考变量关系图、
干预变量与参考变量关系图使我们看到结果
变量和干预变量在断点处的行为,
但是为了建立结果变量与干预变量之间的因
果关系,
我 们 还 需 要 其 他 影 响 结 果 变 量 的 因 素 在 断 点 处 连 续 变 化 ,因 而 ,
我们可
以画出其他协变量与参考变量的关系图。
2. 可 观 测 协 变 量 与 参 考 变 量 关 系 图
为 了 检 验 连 续 性 假 设 9. 2 是 否 成 立 ,
我们可以采用与上一节同样的方法,
画 出 可 观 测 协 变 量 与 参 考 变 量 之 间 的 关 系 图 。L ee(2008)用 以 前 民 主 党 在 众 议
员席位竞选中的选票份额来反映民主党的竞争力,
相应的关系图如下:
图 9 . 3 前一期民主党选票份额与参考变量关系图
图 9. 3 显 示 ,民 主 党 候 选 人 的 总 体 竞 争 力 在 临 界 点 处 并 没 有 明 显 的 跳 跃 ,
从 而 说 明 民 主 党 竞 选 前 的 竞 争 力 是 连 续 的 。如 果 还 可 以 观 测 到 其 他 的 协 变 量 ,
比如竞选经费,
也可以画出类似的图形检验是否在断点处连续。当然,
我们期
望其他未观测因素在断点处也是连续的,
但 无 法 进 行 检 验 ,只 能 利 用 那 些 所 有
198 基本有用的计量经济学
可 能 影 响 结 果 的 可 观 测 因 素 进 行 检 测 ,以 期 望 未 观 测 因 素 也 是 符 合 连 续 性 要 求
的 。如 果 发 现 有 些 协 变 量 在 临 界 点 处 有 间 断 ,
那么,
说 明 R D D 设计可能存在问
题,
结 果 变 量 在 断 点 的 跳 跃 有 可 能 是 由 这 一 观 测 因 素 的 跳 跃 造 成 的 ,而 不 完 全
是干预的影响。
3 , 参考变量分布图
R D D 的 另 一 个 关 键 识 别 条 件 是 个 体 不 能 精 确 地 控 制 或 操 纵 临 界 点 ,如果
个体能够精确控制断点,
那 么 可 能 使 得 断 点 左 右 个 体 分 布 差 异 很 大 ,因 而 ,
可以
通过画出参考变量分布图进行检验,
如果参考变量分布在断点处是连续的,
说
明个体不能精确地控制断点,
如果参考变量在断点处不连续,
则说明个体可能
可以操纵断点,
从 而 使 得 断 点 左 右 个 体 具 有 较 大 差 异 。Lee(2008) 的 参 考 变 量
分 布 图 见 图 9. 4 。图 9. 4 显 示 ,
参 考 变 量 分 布 在 断 点 0 处 并 没 有 明 显 的 跳 跃 ,当
然,
图 9 . 4 只 是 一 种 直 观 的 显 示 ,图 形 的 模 式 与 带 宽 的 选 择 也 有 关 系 ,
McCrary
(2008)提 出 了 一 种 参 考 变 量 分 布 在 断 点 处 是 否 连 续 的 非 参 数 统 计 检 验 方 法 ,
可
以 使 用 McCrary(2008 ) 的 密 度 检 验 统 计 量 进 一 步 检 验 参 考 变 量 是 否 在 断 点 处
有跳跃。
图 9 . 4 民主党选票份额边际分布图
经过上面三种图形的分析,
如果发现结果变量在临界点有跳跃,
其他协 变
量在临界点没有明显的跳跃,
并且参考变量分布在断点处也没有明显的间断,
那么,
我们基本可以建立起干预变量与结果变量之间的因果关系,
将结果变量
第九断点回归设计 199
的跳跃归因为干预的影响。当 然 ,
具 体 的 因 果 效 应 需 要 进 一 步 的 估 计 。但 是 ,
利用断点回归设计,
图 形 分 析 往 往 是 具 体 估 计 之 前 的 第 一 步 ,图 形 分 析 可 以 帮
助 了 解 所 研 究 的 问 题 是 否 适 用 断 点 回 归 设 计 ,以 及 适 用 于 哪 种 类 型 的 断 点 回 归
谖计。
第三节断点回归设计的估计
1. 边界非参数回归
以精确断点回归的估计为例,
要估计的因果效应参数为断点处的平均因果
效应,
®
] 二
rfTDE = E [ Y U - Y 0i | X, = _r。 (9. 10)
可 以 利 用 标 准 的 非 参 数 回 归 估 计 和 假 设 我 们 使 用 核 K U ) 满足
\K(u) = 1 ,则 在 点 i 处 的 非 参 数 回 归 函 数 可 以 写 成 :
① 在 定 理 9.1的假设下,
rlrE= E l n | Xi -= xol = E [Yu I X« =
= Hm ELYi ;| Xi = xa + e l -
办 ] —E [ Y 0i I X, ~ x0]
I X,- = ^ 0 - e ]
c-*0 c—0
= li m E [ y ( ] Xi — xo+e] —lim_E[YV I X( = + e]
e—0
其中第三行利用连续性假设,
确地控制参考变量,
第 四 行 利 用 局 部 随 机 化 假 设 。只 有 满 足 局 部 随 机 化 假 设 ,
;
左右两边个体结果的分布才能与总体潜在结果的分布相同, 也可以写成
个体无法完全精
2 Y/ . K i i X i - x V h )
jj^ ( 工) " - X' ^ \ ---------------------
2_jK((X,-j:
)/h)
其 中 a 为带宽^
比如,
利 用 矩 形 核 函 数 K U ) = l/2 • K U I< 1 ) ,相 应 估 计 量 可 以 写 为 :
N
2 X - • l(x K X; < JC)
K ⑴ = ^ ----------------------
—h ^ X ;<C. x)
i=\
jV
①对于其他核函数,
对带宽范围内的样本点施加了不同的权重,
往往是离断点越近的样本点权重
越大, 而 离 断 点 越 远 的 样 本 点 权 重 越 小 。但 是 非 参 数 估 计 在 内 点 偏 差 是 o u 2) , 但在边界点上造成的偏
差是O U ) ,
收敛速度慢, 偏差较大, 往往不建议使用.
© 数 据 生 成 过 程 为 K = 2 + 2 A + 2 X , . + 30,X.. + u,,
其中 D, = 1(X,.> 3 ) , X ; 〜 N ( 3 , 2 ) ,
《,.〜 N ( 0 ,
1),
样 本 数 为 100。
第九章断点回归设计 201
出 现 的 。在 随 机 化 实 验 中 ,
可以利用回归调整方法降低协变量差异造成的估计
偏 差 。在 这 里 也 是 一 样 ,
为了避免局部平均可能造成的偏差,
可以利用线性回
归针对参考变量的差异进行偏差调整,
这就是局部线性回归方法
running variable, X
Note: Data is generated by Y = 2 + 2 D + 2 X + 3 D X + u ,u 〜 N (0,
1), X ^ N (3,2),D = 1 ( X > 3 ) , Obs^lOO
图9 . 5 矩形核函数R D D 估计量示意图
2. 局部线性回归
由于非参数回归在边界点上的表现不好,
在断点回归设计的估计中,
通常
建议利用局部线性回归方法( L L R ) ,
L L R 方 法 可 以 避 免 边 界 问 题 (H a h n et al. ,
刚才利用矩形核实际上是对断点两边h 范围内个体进行局部
2001)。简 单 而 言 ,
平均,
现 在 分 别 在 断 点 左 右 两 边 /i范 围 内 利 用 线 性 回 归 进 行 拟 合 ,
利用回归调
整 参 考 变 量 不 同 而 造 成 的 可 能 偏 差 。无 论 真 正 的 潜 在 结 果 与 参 考 变 量 之 间 是
什 么 样 的 函 数 形 式 ,即 使 是 高 度 非 线 性 的 ,
只 要 带 宽 /i足 够 小 ,
线性回归函数都
将是条件期望函数非常好的近似,
这 一 回 归 调 整 在 参 考 变 量 X 也会影响结果变
量 的 时 候 尤 其 重 要 。具 体 地 ,利 用 断 点 左 右 h 范 围 内 的 样 本 分 别 估 计 下 列 两 个
线性回归模型:
N / V _ \
m m 'Z l (Y i - a l - b l • ( X .— 工。) )2 • K \ A i ~ X° • 1 (X ; < ^ 0)
urh> \ h J
估计上述两个方程得到的拟合值为:
jT (xo) = a t + b i O 0 — 工0) = d,
和 (x0) = d/ + brixo — x 。) = aT
从而得到在断点处的平均因果效应其实是两条局部线性回归曲线在断点处的
截 距 之 差 ,即
Tate = ( 工o) _ ( 工。)~ a r — a t (9. 14)
另外,
也 可 以 利 用 下 面 的 回 归 方 程 得 到 断 点 处 平 均 因 果 效 应 的 直 接 估 计 (Im-
bens and Lemieux, 2008 ) :
估计。
30
2
o
olqJE
.2
1A8^30
I
o
running variable, X
Note: Data is generated by Y 二2 + 2 D f 2 X + 3 D X + u ,u〜N ( 0 ,
1), X 〜N (3,2),D - l ( X > 3 ) ,0bs=100
图 9. 6 RDD估计的局部线性回归法
如 果 还 存 在 着 其 他 的 协 变 量 Z , 在 上 面 的 回 归 方 程 (9. 15) 中 也 可 以 引 入 这
第九章断点回归设计 203
些可以观测的协变量,
这些协变量在断点处应该连续,
通常,
是 否 引 入 协 变 量 Z,.
不 会 影 响 R D D 的识别策略,
如 果 样 本 限 制 在 非 常 靠 近 临 界 点 x 。的 范 围 ,
那么
近 似 有 乙 是 否 引 人 协 变 量 乙 对 估 计 结 果 不 会 有 影 响 。但 是 ,
如果使用的样本并不是离临界点足够近,
那么引入协变量乙可以消除由于这
些 协 变 量 可 能 造 成 的 部 分 偏 差 。如 果 协 变 量 乙 是 影 响 潜 在 结 果 的 重 要 因 素 ,
那
么,
引 人 乙 将 可 以 提 髙 参 数 的 估 计 精 度 。 引 人 协 变 量 Z,.,
R D D 估计量可以直
接通过估计下列模型得到:
N
min
• ( Y ;一 a — b(X ;— ^:
o) _ r_D; — y D ,•(X ;— ) — ^ Z, )2 (9. 16)
3 . 局部多项式回归
如 果 断 点 附 近 样 本 量 太 少 ,为 了 得 到 相 对 比 较 精 确 的 参 数 估 计 ,
有时我们
不得不选择较大的带宽,
带宽较大时,
线性近似所造成的偏差可能就会增大,
这
时局部多项式回归可以捕捉结果变量与参考变量之间的髙阶非线性关系,
可以
得到更好的拟合,
从 而 降 低 估 计 偏 差 。与 局 部 线 性 回 归 类 似 ,
局部多项式回归
也是利用断点左右的样本分别估计下列模型:
^ 20
running variable, X
1),X 〜N (3,2 ) ,D=1 ( X > 3 ) ; 0 b s=100
Note: Data is generated by Y =2+2D +2X +3D X +u, u〜N (0,
图 9 . 7 局 部 多 项 式 回 归 估 计 RDD估计量
4 . 模糊断点回归设计的估计
在模糊断点回归中,
我们需要估计一个比率,
见 (9. 8 ) 。仍 然 可 以 采 用 上 文
提到的三种方法,
不过需要针对结果变量和干预变量分别对断点进行回归,
两
个 回 归 得 到 的 参 数 的 比 率 就 是 模 糊 断 点 回 归 估 计 量 。下 面 以 局 部 线 性 回 归 为
例,
另外两种方法类似。
首先利用结果变量对断点进行局部线性回归,
得 到 估 计 量 fy :
m in
Wy » ,
Ty •yy
(9. 23)
l m b e n s a n d L e m i e u x ( 2 0 0 8 ) 指出,
如 果 上 面 (9 . 2 1 ) (9. 2 2 ) 米用矩形核,
并且米
第九章断点回归设计 205
用相同的带宽,
那么,
模糊断点回归估计量也可以用T,作 为 认 的 工 具 变 量 ,
利
用两阶段最小二乘法估计下列模型得到:
Y ;^ a + tD ; j3(X, —x 0) ST;
( X ;— x 0) + e; (9. 24)
其中第一阶段回归为:
Di — a0 + t dT ;+ Zjd ( Xj — x Q) + TdT, ( X,- —x 0) +
5.带宽选择和滞后阶数’
R D D 的参数估计依赖于一个重要的参数— 带 宽 /^的 选 择 ,
带宽比较小,
断点左右的个体特征差异较小,
估 计 偏 差 较 小 。但 是 ,
带宽小意味着断点左右h
范 围 内 的 样 本 容 量 可 能 较 小 ,估 计 量 的 方 差 较 大 ,估 计 精 度 较 低 。如 果 带 宽 较
大,
断点左右A 范围内的样本容量较大,
估计量方差较小,
估计精度提高,
但是
大的带宽,
意味着有些个体特征差异较大,
相似度降低,
从 而 估 计 偏 差 增 大 。因
而,
带 宽 的 选 择 存 在 着 估 计 偏 差 和 估 计 方 差 的 权 衡 。Ludw i g and Miller (2007)
和 lmbens and Lemieux(2008)提 出 了 一 种 选 择 最 优 带 宽 的 交 叉 验 证 方 法 (cross
validation).交 叉 验 证 的 基 本 思 想 是 在 所 有 可 能 的 带 宽 下 ,
选择使拟合的均方
误 差 最 小 的 带 宽 。具 体 地 ,
对 于 给 定 带 宽 /I,
在 >r处 的 回 归 估 计 为 :
(di (x) x <C x 0
[ar{x) ,x ^
其 中 & ( 工)、
匕(_r)分 别 对 应 于 (9. 12)和 (9. 13)的 解 只 是 把 其 临 界 点 -ro
换 成 I 。为 了 模 拟 R D D 在 边 际 上 的 回 归 估 计 ,在 断 点 左 侧 只 估 计 4 (:r) ,
右侧
只 估 计 并 且 在 估 计 时 ,
不 将 边 界 点 工 = 兄 包 括 在 样 本 中 ,即 只 利 用 x - h
<Xj<x+h, x = 估 计 回 归 模 型 ,然 后 利 用 估 计 的 回 归 参 数 得 到 在
工= 兄 处 的 拟 合 值 / K 兄 )。交 叉 验 征 标 准 为 :
1 N
C V Y(h) = (9.25)
相 应 的 最 优 带 宽 是 最 小 化 上 述 标 准 ,即
= arg m i n C V y (A)
it
利用交叉验证方法搜索最优带宽时,
不 一 定 利 用 全 部 样 本 进 行 搜 索 ,可以
根据参考变量将样本限制在断点左右一个相对较小的范围内,
从而可以提高搜
索 速 度 。用 ^ 表 示 参 考 变 量 在 断 点 左 侧 的 8 分 位 数 , 表示参考变量在断点
右 侧 的 1 _ 5 分 位 数 。可 以 将 最 优 带 宽 搜 索 限 制 在 范 围 之 内 ,即
1 N
/i.cvpt = arg min ^ X ;^ x ^ s)
206 基本有用的计量经济学
图 9 . 8 最优带宽的交叉验证标准函数
在利用局部多项式进行R D D 估计时,
还 需 要 选 择 滞 后 阶 数 h 可以采用常
用 的 模 型 选 择 标 准 ,比 如 A I C 标 准 、
A I C C 标 准 或 B I C 标 准 。一 般 而 言 ,
带宽越
大,
需 要 选 择 的 滞 后 阶 数 越 大 ;带 宽 越 小 ,
滞 后 阶 数 越 小 。表 9. 1 使 用 图 9. 5 的
模拟数据,
利用全部样本估计多项式模型,
可 以 看 到 A I C 标 准 和 B I C 标准都是
选 择 阶 数 1 ,即 局 部 线 性 回 归 是 合 适 的 模 型 。事 实 上 ,
数据生成过程就是线性模
型,
这也证明两种标准都能选择出正确的模型。
第九章断点回归设计 207
表 9 . 1 局部多项式阶数选择
6 . 模型设定 检验
模型估计完成后,
可 以 进 行 下 列 模 型 设 定 检 验 ,以 判 断 估 计 结 果 的 稳 健 性 。
(1)协变量连续性检验,
也 称 为 伪 结 果 检 验 (pseudo outcome)。以 协 变 量
作为伪结果,
利用与前面相同的方法,
检验相应的R D D 估计量是否显著,
如果
显著说明这些协变量不符合连续性假设,
上 文 的 R D D 估计量可能存在问题。
( 2 ) 参 考 变 量 分 布 连 续 性 检 验 。如 果 参 考 变 量 分 布 连 续 ,
意味着在断点处
个体没有精确操纵参考变量的能力,
局部随机化假设成立,
从而保证断点附近
左 右 样 本 能 够 代 表 断 点 处 的 总 体 。可 以 采 用 McCrary(2008)提 出 的 方 法 进 行
检验,
将 参 考 变 量 划 分 成 不 同 的 区 间 并 计 算 各 区 间 中 的 个 体 数 量 (9. 9 ) ,
如果个
体能够操纵参考变量,
我 们 将 能 观 测 到 断 点 左 右 个 体 数 量 有 较 大 差 别 ,比如很
多个体通过操纵到了断点的右侧,
那 么 ,在 断 点 右 侧 的 区 间 中 个 体 数 量 可 能 将
大大超过断点左侧区间中个体的数量,
利用上文的带宽选择和曲线拟合方法,
可以检验在断点处N k 是否存在跳跃。
( 3 ) 伪 断 点 检 验 (pseudo cutoff p o i m ) 。在 参
左 右 两 侧 中 点 位 置 作 为 伪 断 点 ,利 用 同 样 的 方 法 估 计 R D D 估 计 量 ,
我们知道在
伪 断 点 干 预 效 应 为 零 ,如 果 发 现 伪 断 点 的 R D D 估 计 量 不 为 零 ,
则说明我们的
R D D 设计可能有问题,
可能混杂了其他未观测因素的影响,
得到的因果效应可
能是由其他未观测混杂的跳跃造成的,
而不完全是干预的影响。
( 4 ) 带 宽 选 择 的 敏 感 性 检 验 。选 择 不 同 的 带 宽 对 R D D 估 计 量 进 行 重 新 估
计,
检 验 估 计 结 果 是 香 有 较 大 的 变 量 ,如 果 差 异 较 大 ,
尤其是影响方向有变化,
则 说 明 R D D 设计可能有问题。
7 . 小 结 : R D D 方法应用步骤
前面讨论了 R D D 方 法 的 基 本 理 论 和 估 计 方 法 ,
简单总结一下应用步骤:
( 1 ) 图 形 分 析 。首 先 ,
画出结果变量与参考变量之间的关系图,
如果是模糊
断点,
再画出原因变量与参考变量的关系图,
呈现结果变量和原因变量在断点
208 基本有用的计量经济学
处的行为,
为研究设计提供直观的依据。
( 2 ) 因 果 效 应 估 计 。分 别 利 用 断 点 左 右 的 数 据 估 计 线 性 回 归 模 型 或 多 项 式
模型,
可 以 使 用 矩 形 核 函 数 加 权 (Imbens and Lemieux, 2008)或 三 角 核 函 数 加
权(
Calonico et al. 2014a),
其实,
核函数选择对估计结果没有太大影响;
也可以
直 接 利 用 (9. 15)估 计 R D D 参 数 。如 果 是 模 糊 断 点 ,可 以 用 断 点 作 为 原 因 变 量
的工具变量,
估计方程(
9. 24) ,
并且可以直接使用两阶段最小二乘法标准误差
进 行 统 计 推 断 (Imbens and Lemieux, 2008)。
( 3 ) 稳 健 性 检 验 。主 要 进 行 上 文 提 到 的 各 种 稳 健 性 检 验 。首先是协 变 量 连
续性检验,
可以画出协变量与参考变量的关系图,
检 测 在 断 点 处 是 否 连 续 。其
次,
参考变量分布函数连续性检验,
也 可 以 画 出 参 考 变 量 的 分 布 图 。再 次 ,
伪断
点检验,
看看在其他位置,
R D D 估 计 量 是 否 显 著 。最 后 ,
可以选择不同的带宽,
检 验 R D D 估计结果是否稳健。
第四节弯折回归设计
断点回归设计是利用结果变量和原因变量在断点处的跳跃来识别因果效
应,
如 果 其 他 因 素 在 断 点 处 没 有 跳 跃 ,我 们 就 可 以 将 结 果 变 量 的 跳 跃 归 因 为 原
因 变 量 的 因 果 影 响 。有 些 时 候 ,结 果 变 量 和 原 因 变 量 往 往 是 连 续 变 量 ,
并没有
明显的跳跃,
那么,
R D D 方 法 就 无 法 识 別 因 果 效 应 。但 是 ,如 果 结 果 变 量 和 原
因 变 量 在 断 点 处 存 在 弯 折 (kink),而 在 其 他 位 置 都 是 平 滑 的 ,
并且其他影响因
素在断点处也是平滑的,
那么,
我们仍然可以使用与R D D 类似的方法,
将结果
变量在断点处的弯折归因为是由原因变量在断点处的弯折造成的,
这种识别策
略 称 为 弯 折 回 归 设 计 (Regression Kink Design, R K D ) 0® 弯 折 回 归 设 计 实 际
上是结果变量和原因变量相对于参考变量导数的断点回归设计,
在弯折回归设
计中,
结果变量和原因变量在断点处没有跳跃,
是连续的,
但是它们相对于参考
变量的导数在断点处有跳跃,
R K D 就是利用断点处的导数变化来识别因果效
应 。下 面 简 单 介 绍 D o n g (2014)提 出 的 概 率 弯 折 回 归 和 Card et al. (2015b) 提
出的更一般化的弯折回归设计。
1 . 概率弯折回归
D o ng(2014)考 察 了 一 个 二 元 的 原 因 变 量 在 断 点 处 不 是 间 断 性 的 跳 跃 ,
而是
弯 折 (kink)的时候.,
在 满 足 平 滑 性 假 设 下 ,她 证 明 可 以 利 用 弯 折 识 别 因 果 效 应 。
另外,
她 还 进 一 步 给 出 了 存 在 跳 跃 或 / 和 弯 折 的 时 候 更 一 般 的 识 别 方 法 。 因为
D ong(2014)主 要 关 注 二 元 的 原 因 变 量 ,
从而干预分配概率在断点处存在弯折,
为 与 Card et al. (2015b)的 弯 折 回 归 设 计 (R K D ) 相 区 别 ,
我们称之为概率弯折
回归设计( P R K D )。
假 设 一 个 二 元 的 原 因 变 量 D ,.,
其状态分配依赖于参考变量足是否超过临
界 点 x 。,
但断点并不完全决定干预分配状态,
还有其他未观测因素可能影响干
预 的 分 配 ,因 而 ,
与 模 糊 断 点 回 归 设 计 的 情 景 相 似 。令 = 表示断
点,
定 义 潜 在 的 原 因 变 量 为 D h C x ) 和 D Qi.(:
c),
从 而 T,. = l 时 ,
D,. = D H (_r) ,即参
考 变 量 为 的 个 体 ,
观 测 到 的 原 因 变 量 就 是 D n C r ) 。 同 样 地 ,T , = 0 日牝参
考 变 量 为 的 个 体 ,
观测到的原因变量就是D 。
,.(
x ), D; = jD。
,.(
_r)。断点右
侧 个 体 的 反 事 实 原 因 变 量 为 断 点 左 侧 个 体 的 反 事 实 原 因
变 量 力 D u (x0) = H m D 1;( x ) 0 为 方 便 起 见 ,
将 两 个 潜 在 原 因 变 量 简 写 为 D h.,
^ ,
观测原因变量以- 乃 队 + ^ ^ - 乃 沁 。
,-。
在断点附近,
断 点 和 原 因 变 量 将 个 体 分 成 四 类 (Angrist et al.,1996):总是
参 与 者 八 = { 纟:仏 = 1 ) 。
,_= 1},
从 不 参 与 者 /\/={/:1)1,=1)。
,.二0 } ,
依 从 者 (:= { ^ :
D。
;二0 ,D 】
,.= 1 } ,
叛逆者 Defiers = { i:D 。
,.= 1 ,
D u = ◦}。用 {A ,iV,
C, Defi-
ers}表 示 四 种 类 型 个 体 的 集 合 。
潜 在 结 果 变 量 仍 然 用 7 1,.,
1^ 表 示 ,观 测 结 果 为 ;
^-1),.1,. + ( 1 _ 0 , . ) 7 。
,-。
仍然定义
" ( x ) = E [ Y ; | Xi = x ] p U ) = ELD, I X = x]
力 、 d p (x)
则
Bx p ⑴ = -aT~
/i+ = lim"(*z) yT =
定 义 9. 1 如 果 则称干预分配概率p
尹0 , U 、在 断 点 々 处跳跃
叩 ),
如 果 / / + - 々/_关0 ,则 称 干 预 分 配 概 率 f O ) 在 断 点 x Q处 弯 折 (
kink) 。
下 面 的 讨 论 没 有 特 别 指 明 ,均 限 制 在 断 点 附 近 一 个 较 小 的 邻 域 内 ,即
210 基本有用的计量经济学
兄e u 。
平 滑 性 假 设 9. 6 要 求 个 体 不 能 精 确 控 制 参 考 变 量 ,与 R D D 不 同 ,
这里不 但
要 求 参 考 变 量 在 断 点 处 连 续 ,而 且 要 求 其 导 数 也 要 连 续 ,从 而 在 增 量 水 平 上 也
不能有操纵的可能,
这 一 要 求 比 R D D 更 强 。 Dong(2014) 证 明 如 果 满 足 平 滑 性
假 设 9. 6 和 单 调 性 假 设 9. 5 ,
那么所有潜在结果在断点处将连续可微。
引 理 9.1 (Dong, 2 0 1 4 ,
引 理 1) 如 果 单 调 性 假 设 9, 5 和 平 滑 性 假 设 9. 6 成
立,
那么, >= 0 ,
1 和 ?1*[少丨兄= ^ ] ,
蜇 = { 八,
^/,
0 } 在断点工 0
处连续可微。
单 调 性 假 设 9. 5 排 除 了 叛 逆 者 ,引 理 9. 1 说 明 在 平 滑 性 假 设 9. 6 下 ,
所有
类 型 个 体 的 潜 在 结 果 和 分 配 机 制 都 是 连 续 可 微 的 。引 理 9 . 1 的 条 件 可 以 识 别
平均因果效应,
假 设 9. 6 的 要 求 比 引 理 9 . 1 的 要 求 更 强 ,它 可 以 用 于 识 别 因 果
效 应 的 分 布 。如 果 只 关 心 平 均 因 果 效 应 ,
那么,
可以直接假设引理9,1成立,
只
需要限制参考变量分布连续。
引 理 9 . 2(Dong,2 014,
引 理 2) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立,
则
/?+— 厂 = P r [ C 丨X = :r。] , v ( p +~~p~) (9.27)
如 果 />+— #0,
则
r= (9. 28)
P+~ P
引 理 9. 2 实 际 上 复 制 了 前 面 定 理 9. 2 的 结 果 ,
在 断 点 处 存 在 跳 跃 、单调性
假设和平滑性假设下,
可 以 识 别 出 断 点 处 依 从 者 的 平 均 因 果 效 应 Y。
,'|
C ,X ;
= 工0] 。
定 理 9. 3 (Dong, 2014,
定 理 1) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立 ,则
n = 尹 r[C ^ 二 ^
OX
(9. 29)
假设不存在跳跃,
仅 存 在 弯 折 ,即 p+ —p- = 0 , 关0,
则
r 二 " /+— 广 (9. 30)
r 广一广
第九章断点回归设计 211
定 理 9. 3 说 明 ,
如果在断点处不存在跳跃,
而是存在弯折,
我们仍然可以利
用 弯 折 识 别 出 依 从 者 的 因 果 效 应 。直 观 理 解 ,如 果 看 到 结 果 变 量 在 断 点 处 弯
折,
干预分配概率也在断点处弯折,
而其他影响结果变量的因素在断点处平滑,
不存在弯折,
并且个体不能完全控制断点,
那么,
我们可以将结果变量的弯折归
因为原因变量的弯折造成的,
从 而 可 以 识 别 出 断 点 处 的 平 均 因 果 效 应 。基 本思
想与断点回归设计相似,
不过断点回归是利用断点处的跳跃,
概率弯折回归是
利用断点处的弯折。
Dong(2014)进 一 步 证 明 ,
如果不确定在断点处是跳跃还是弯折,
仍然可以
利用断点识别出依从者的平均因果效应。
定 理 9.4(Dong,2 0 1 4 ,
定 理 2) 如 果 单 调 性 假 设 9. 5 和 平 滑 性 假 设 9. 6 成
立,
假设存在一个断点,
或弯折,
或 同 时 存 在 断 点 和 弯 折 ,对 于 任 意 非 零 权 重 序
列 w n,
满 足 limw„ = 0 ,
有
- - 叫 (//+ — / / 一) n-, x
p+—p ~ - \ ~ w„ (p /+— p '~) .
如 果 只 存 在 断 点 " / _ = 0 ,p /+ —/ / - = 0 , ( 9 . 3 1 )退 化 为 断 点 回 归 估
计 量 (9 . 2 8 h 如 果 只 有 弯 折 ,
/ =0,
则 (9.31)退 化 为 概 率
弯 折 回 归 估 计 量 (9. 30)。如 果 同 时 存 在 断 点 和 弯 折 ,
利用两者得到的估计量为
(9.31)。一 般 而 言 ,
两者都存在时,
可以利用断点回归估计量得到近似的估计。
如 果 平 均 因 果 效 应 在 断 点 附 近 较 小 的 邻 域 内 为 常 数 ,即 对 于 工 6 仏 x 。),
有 / =
d E d . - Y 0;1C ,
X,. =.r]/dx = 0,那 么 ,
断点和弯折可以识别出同样的因果效应
参 数 ,即
r= = d
p+—p— p ,Ar~ p '~
关于权重的选择,
可 以 利 用 自 助 法 (bootstrap)选 择 使 估 计 量 标 准 误 差 最 小 的 权
重,
也可以用两阶段最小二乘估计量选择合适的权重。
下面讨论上述识别条件与工具变量法之间的关系,
与 R D D 估计一样,
考虑
下列局部线性回归模型:
Yi = a + 6 (X i — 尤。)+ rD f + e,. (9.32)
其中a、
6、r 为系数,
e,为 可 能 与 D , 相 关 的 误 差 项 。正 如 模 糊 断 点 回 归 设 计 中 断
点 T , 可以作为D ; 的工具变量,
在 这 里 乃 和 弯 折 x 。)都 可 以 作 为 A 的
工具变量,
因 而 ,因 果 效 应 参 数 (9. 31)可 以 利 用 两 阶 段 最 小 二 乘 法 进 行 估 计 。
第一阶段回归为:
212 基本有用的计量经济学
D, = A T,- + 爲了,.(
兄 一 ) + 呙(X ; — 如 )+ 爲 + ?1; (9. 33)
其 中 所 有 /?为 估 计 系 数 ,
将 (9. 33)代 人 (9. 32)得 结 果 变 量 简 化 式 :
Y,- 二 7. T, + 7 2T, ( X , - - x 0) + 7 3( X , . - x 0) + 7 . ! + ^ , (9.34)
其中 7i= 呙r ,72=啟 r ,y3= a + p 4r ,各 = r $ h +e,.。 由 (9. 33)和 (9. 34)得
p +— p- = h , p !+— p r—= 曰2 ■
> (9. 35)
}T — 7i ? {j^—{T = /2. (9.36)
因而,
标 准 的 断 点 回 归 设 计 估 计 量 为 (引 理 9. 2 ) :
r = ^- (9.37)
A
概 率 弯 折 回 归 设 计 估 计 量 为 (定 理 9. 3 ) :
f= ^ (9.38)
A
断 点 和 弯 折 同 时 存 在 时 ,同 时 利 用 断 点 和 弯 折 作 为 干 预 变 量 的 工 具 ,
两阶段最
小二乘估计量为:
x= + C9. 39)
h + ttjs2
其 中 ,& 是 下 列 权 重 的 样 本 形 式 :
= C o v ( D ;,
Z 2* )
切 — covcd ;, z r )
D - 是 £>,.对 (足.一:
^ ) 的回归残差,
2 : 是 T , 对 (X,.—a ) 的 回 归 残 差 ,忍 是
^ 乂广^ ^ 对^ —^ “ 的 回 归 残 差 。
2 . 弯折回归设计
因变量完全由参考变量尤决定,
用 公 式 表 示 为 !>,.=^(兄 ),
这 里 a .是连 续
变量,
在 断 点 X 。处 ,函 数 A 兄 )发 生 弯 折 ,即 但 是 其 他
■
T一if
影响因素认在断点处是平滑的,
不存在弯折,
或者说潜在结果在断点处不存在
弯 折 。那 么 ,
可以将结果变量在断点处的弯折归因为原因变量的弯折造成的。
假 设 9. 7(变 折 假 设 ) d( • )为 已 知 连 续 函 数 ,cK . ) 在 断 点 两 侧 是 连 续 可
导的,
但 断 点 两 侧 的 导 数 不 相 同 ,l i m Y C r ) # l i m Z ( :
c ) ,即 存 在 弯 折 。
■
r''x0
弯 折 假 设 9. 7 说 明 研 究 者 知 道 函 数 d U ) ,
并 且 在 断 点 & 处 D,.和 X ; 之间
存 在 一 个 弯 折 。假 设 9, 7 要 求 函 数 ^/ U )是 连 续 函 数 排 除 了 D ; 在 断 点 处 存 在
跳跃的可能。
假 设 9.8(平 滑 性 假 设 ) 在 断 点 〜 处 是 连 续 的 ,即
lim 3^2 id ,x,u) = lim^2 (d,x^u)
平 滑 性 假 设 9. 8 是 说 在 断 点 办 附 近 ,
潜在结果:
v(A:
r,《)是 参 考 变 量 工 的
连续可导函数,
其 对 a,的 偏 导 数 :y2W , ^ ,
《)在 断 点 处 没 有 跳 跃 ,
是连续的,
从而
潜在结果在X 。处不存在弯折^
假 设 9. 9(密 度 平 滑 假 设 ) 条 件 密 度 函 数 / 靡 (
工U ) 及 其 导 数 ^ ^
在 断 点 X 。处 连 续 。 •
假 设 9. 9 是 保 证 R K D 设 计 有 效 的 另 一 个 重 要 假 设 ,
这里不但要求参考变
量密度连续,
而 且 要 求 参 考 变 量 密 度 函 数 的 导 数 连 续 ,才 能 保 证 弯 折 断 点 回 归
的 识 别 。这 一 点 可 以 通 过 估 计 参 考 变 量 的 分 布 来 进 行 检 验 ,
如果参考变量的分
布在断点处存在跳跃或弯折,
则证明上述假设可能不成立。
定 理 9. 5 如 果 假 设 9. 7 、
9. 8 、
9. 9 成 立 ,那 么 ,
(1) P r [ L T < w | X = : r ;
]在 断 点 处 是 连 续 可 导 的 。
(2 ) 在断点处的因果效应为:
r= = ELyi (仏 々 ),
々,⑴ | 兄. =
定 理 9. 5 ( 1 ) 说明其他影响因素的分布在断点处连续且可导,
这一点可以进
214 基本有用的计量经济学
行检验,
利 用 数 据 可 以 估 计 其 他 变 量 的 分 布 ,如 果 在 断 点 处 弯 折 ,
那么,
则证明
上 述 结 果 不 成 立 。定 理 9. 5(2)说 明 平 滑 性 假 设 和 密 度 平 滑 假 设 以 及 弯 折 假 设
下,
弯 折 可 以 识 别 出 断 点 处 的 平 均 因 果 效 应 参 数 。定 理 9. 5 的 证 明 参 见 Card et
al. (2015b) 0
在现实应用中,
原 因 变 量 可 能 并 不 是 完 全 由 参 考 变 量 X,.决 定 的 , 还受
一些研究者未观测到的因素的影响, 即 使 实 际 的 干 预 分 配 规 则 D,.=七 足 )是完
全 由 参 考 变 量 X,.决 定 的 ,
但由于测量误差,
观测到的千预分配往往也不是完全
由参考变量决定,
实际观测到的干预分配规则可以描述为参考变量兄和其他
未 观 测 因 素 e,•共 同 决 定 ,即 A = d ( X , . , e,.)。基 于 此 ,Card et al. (2015b)进一步
引 人 了 模 糊 弯 折 回 归 设 计 (Fuzzy R K D ) ,
并引人单调性假设,
证明弯折可以识
别出一个局部平均因果效应。
正 如 R D D 估 计 量 可 以 用 局 部 线 性 回 归 (L L R ) 进 行 估 计 ,
R K D 可以用局部
二 次 方 程 回 归 (Local Quadratic Regression)进 行 估 计 ,当 然 R K D 也 可 以 利 用
局 部 多 项 式 (L P R ) 进 行 估 计 。具 体 地 ,
对于精确弯折回归估计量,
第一阶段是
一 个 已 知 的 函 数 • ),
我们只需要在断点左右估计下列两个最优化问题:
j - 1(X;< x c ) (9.42)
_ ^ X. V (Xi
m m ^ \ Y i - x Dy \ • 1(X,- > ^ 0) (9.43)
^rj i= 1 、
其 中 A,,
民 ,)= i ,… ,
/>为 断 点 左 右 回 归 的 回 归 系 数 ,
k ( m )为 核 函 数 ,
a 为带
宽 。关 于 核 函 数 、
带宽和滞后阶数的选择,
参 照 上 一 节 讨 论 的 方 法 。在 精 确 断
点回归中,
原因变量的分配规则W x ) 是已知的,
其 在断点左右的导数也是巳知
的,
不妨记4 = 则 精 确 R K D 估计量为:
^SRKD = 鲁 —S (9 . 44)
在模糊断点回归中,
康因变量的分 配 规 则 不再是确定性的,
需要估
计在断点左右分配规则斜率的变化, 可以估计下列两个优化问题:
.V / P
m i n ^ j D ,. — 2 % ― 工。 ) , K:
rx '~- 0V 1(X,. < x 0) (9.45)
{Kt) ^ i = l V j= 0
得 到 的 分 配 函 数 斜 率 变 化 的 估 计 量 为 Z —F ,
则 模糊R K D 估计量为:
^FRKD = ^ ~ ^ (9.47)
fct —fCl
第九章断点回归设计 215
350 350
o
;unoUIB
30
j 300
5
2
s s s q X>
2 250
ts
tD
| 200
0
2
o1
5
150
<1
2^
o
0
1
100
9
-5000-2500 0 2500 5000 7500 10000 12500 -5000 -2500 0 2500 5000 7500 1000012500
o
High quarter (s) earnings, normalized High quarter (s) earnings, normalized
图 9 . 9 失亚保险金支付规则(
第一阶段)
① 横 轴 表 示 标 准 化 季 度 收 入 ,利 用 季 度 最 高 收 人 减 去 门 槛 值 ,
危 机 之 前 门 槛 值 为 $ 6250,
危机之后
为 $8000 „
216 基本有用的计量经济学
图 9. 1 0 显 示 的 是 失 业 持 续 期 相 对 于 失 业 前 最 高 季 度 收 人 的 关 系 图 ,
可以
看出,
失 业 持 续 期 在 断 点 处 有 一 个 明 显 的 弯 折 。断 点 左 侧 ,
失业前收入越高,
失
业持续期越长; 失业前收人越高,
断点右侧, 失 业 持 续 期 越 短 。如 果 其 他 潜 在 的
影 响 因 素 在 断 点 处 没 有 弯 折 ,并 且 个 人 没 有 精 确 操 纵 断 点 的 能 力 ,
那么,
我们就
可以将失业持续期在断点的弯折归因为失业保险支付规则的弯折造成的。
uopsnpJ ds s l
:
43 ■*
* ■
V* • •• *
*•
f
.2
l! 叻01
.s
-5000 -2500 0 2500 5000 7500 1000012500 -5000 -2500 0 2500 5000 7500 1000012500
High quarter (s) earnings, normalized High quarter (s) earnings, normalized
图 9. 1 0 对数失业持续期
图 9. 1 1 给 出 了 相 应 的 参 数 估 计 。 中 间 的 线 为 估 计 结 果 ,上 下 的 线 为 相 应
的 置 信 区 间 。图 中 垂 直 实 线 和 虚 线 分 别 对 应 于 使 用 两 种 最 优 带 宽 选 择 标 准 所
获得的估计,
实线为I K 方法,
虚 线 为 C V 方 法 。左 图 为 危 机 前 的 估 计 结 果 ,
IK
估 计 结 果 为 0. 373(0. 0 4 9 ) ,
C V 估 计 结 果 为 0. 356(0. 0 4 1 ) ,
括号内为标准误差,
两 种 带 宽 下 所 获 得 的 参 数 估 计 均 为 正 值 ,即 失 业 保 险 越 高 ,
失业持续期会越长,
危 机 前 弹 性 在 0. 356 一 0. 3 7 3 左 右 。右 图 为 危 机 后 的 估 计 结 果 ,I K 结 果 为
0.882(0. 200),C V 结 果 为 0. 684(0. 067),
影响方向仍然是正向的,
但影响程度
增加了,
危 机 后 的 弹 性 为 0. 684— 0. 8 8 2 左 右 。
Panel A.2003-2007 Panel B.2008-2013
图 9. ] 不同带宽下的局部线性回归估计
第九章断点回归设计 217
第五节断点回归设计的软件实现
在 Stata软 件 中 ,
断点回归设计的估计很简单,
可以使用线性回归命令进行
估 计 。下 面 我 们 使 用 Lee (2008)的 数 据 iee. dt a 为 例 ,
估计在位党的竞选优势。
数 据 lee,dta包 括 两 个 主 要 变 量 :vote是 民 主 党 本 次 的 选 票 份 额 ,
m a r g i n 是民主
党 上 次 竞 选 中 所 获 选 票 边 际 ,即 民 主 党 选 票 份 额 减 去 共 和 党 选 票 份 额 。margin
是参考变量,
如 果 m a r g i n 大 于 0 ,民 主 党 就 是 在 位 党 ,
这是一个精确断点回归设
计,
我们关心在位党是否因为在位而获得更多的选票,
是 否 具 有 在 位 优 势 。与
Lee and LemieUx(2010)— 致 ,
我 们 将 样 本 限 制 在 民 主 党 上 次 选 票 边 际 在 ±0. 5
之间,
共 4900个样本点。
首先画出结果变量与参考变量之间的关系图,
选 择 带 宽 0. 0 1 ,
共 1 0 0 个区
间,
可 以 利 用 e g e n 的 cut()函 数 实 现 这 一 点 :
O Hi
note (Note :Replicate figure 7 of Lee and Lemieumx (2010))
218 基本有用的计量经济学
上述命令生成的图形如下图所示,
可以看出民主党选票份额在断点处有明
显的跳跃,
可以选择不同的带宽,
检测图形中显示的跳跃是否仍然存在。
0.8 r
0,4
0.2
-0.5 -0.4 -0.3 -0.2 -0.1 0 0.1 0.2 0.3 0.4 0,5
Democratic Vote Share Margin of Victory, Electiont
Note: Replicate figure 7 of Lee and Lemieumx (2010)
图 9. 1 2 结果变量与参考变量关系图
上 述 图 形 也 可 以 利 用 用 户 写 的 命 令 rdplot画 出 ,
具体命令形式为:
其 中 c(0)设 置 断 点 为 0 ,
n binS( # ) 用 来 设 置 断 点 左 右 区 间 数 ,
也可以不设
定,
程序会自动选择最优的带宽,
获 得 相 应 的 区 间 数 。接 着 上 面 的 程 序 ,
也可以
画 出 参 考 变 量 的 分 布 图 ,以 判 断 个 体 是 否 能 够 精 确 控 制 断 点 。
得 到 参 考 变 量 密 度 图 9. 4 ,
从点上看,
在断点处没有明显的跳跃,
但利用4
次多项式拟合的曲线,
似乎存在着跳跃,
需 要 利 用 M c C rary(2008)密 度 检 验 统
计 量 进 行 检 验 ,以 判 断 在 统 计 上 跳 跃 是 否 显 著 ,实 际 上 跳 跃 在 断 点 处 是 不 显 著
第九章断点回归设计 219
的,
从而证明个体没有精确控制断点的能力。
下面进入第二步,
估 计 在 断 点 处 的 因 果 效 应 。可 以 利 用 局 部 简 单 平 均 值
法,
类似于完全随机化实验的分析,
也可以采用局部线性回归方法,
两种方法都
需要选择带宽,
第 三 种 方 法 是 多 项 式 回 归 ,可 以 使 用 相 对 较 大 的 带 宽 或 适 用 于
整个样本^ 另一个相关的是核函数的选择,
Imbens and Lemieux(2008)指 出 矩
形 核 函 数 所 得 到 的 结 果 与 其 他 核 函 数 得 到 的 结 果 没 有 太 大 差 异 ,由 于 矩 形 核 比
较简单,
这里便使用矩形核,
对 所 有 个 体 施 加 相 同 的 权 重 。使 用 用 户 写 的 命 令
rdbwselect进 行 最 优 带 宽 选 择 ,
该 命 令 提 供 了 Ludwig and MiUer(2007)的交叉
验证方法(
VC)、
Imbens and Kalyanaraman (2012)的 带 宽 选 择 方 法 (
IK)和 C a 卜
onico et al. (2014a)的 带 宽 选 择 方 法 ( C C T ) 三 种 最 优 带 宽 选 择 方 法 ,
我们选择交
叉验证方法,
利用下列命令估计最优带宽,
得 到 的 最 优 带 宽 为 0. 2 8 。
选 项 c(0)表 示 断 点 为 0 ,kem e U u n i ) 可 以 选 择 核 类 型 ,
这里使用矩形核,
bwseiectO用 于 选 择 最 优 带 宽 估 计 方 法 ,包 括 C V 、
IK、
C C T 三种方法可供选择,
我 们 使 用 CV,cvgrid_min( # )和 cvgird—m a x 来 限 制 画 出 交 叉 验 证 目 标 函 数 时
的起始和结束位置,
使 用 cvplot画 出 交 叉 验 证 目 标 函 数 图 ,
运行上述命令后,
会
显 示 出 图 9. 8,利 用 另 外 两 种 方 法 会 得 到 更 小 的 带 宽 。下 面 ,
我们将带宽限制在
0. 2 8 范 围 内 ,
利用局部平均值法和局部线性回归法估计R D D 因果效应参数。
利 用 (9. 15)估 计 下 列 回 归 :
表 9. 2 是 上 述 程 序 估 计 出 的 回 归 结 果 ,
d 的系数是R D D 估计量,
第 1 列为
局 部 平 均 估 计 量 ,即 两 组 结 果 平 均 值 之 差 ,为 0. 19。图 9. 1 2 显 示 ,
局部平均显
示不是很好的估计,
图中显示在断点附近,
结果变量与参考变量之间呈现正向
斜 率 ,因 而 局 部 线 性 回 归 可 能 是 更 好 的 选 择 。表 9. 2 第 2 列 是 相 应 的 局 部 线 性
①该命令为老版命令,
通过SSC install rdrobust, replace 或 findit rdrobust 安装使用。
220 基本有用的计量经济学
回 归 ,回 归 系 数 为 0.084,
并 且 在 1 % 水 平 下 显 著 。这 一 结 果 表 明 ,民 主 党 在 位
会 使 其 获 得 8, 4 % 的 选 票 优 势 ,
这一优势仅仅是因为民主党在位而获得的。
d 0. 190*** 0. 0 8 4 V
(0.0044) (0.0080)
margin 0. 366***
(CL 0 3 4 3 ) .
d 拌 c. ma r g i n 0. 0560
(0. 0556)
_cons 0.401*** 0. 451***
(0.0028) (0.0052)
N 3075 307 5
下面使用全部样本,
利 用 多 项 式 重 新 估 计 R D D 参 数 。相 应 程 序 如 下 :
gen x4 - :
r4
表 9. 3 是 相 应 的 估 计 结 果 ,
最后一行显示了 A I C 和 B I C 标 准 ,
根据AIC标
准,
最 优 的 阶 数 是 > = 3 ,因 而 ,
利用全部样本进行回归,
最优的多项式模型为三
阶多项式,
相 应 的 估 计 结 果 为 0.0676。B I C 标 准 显 示 最 优 阶 数 为 ^ = 1 ,即线性
第九章断点回归设计 221
回归,
得 到 的 因 果 效 应 为 0. 0 8 9 7 ,
与上面的局部线性回归结果相似,
表明在位党
在 竞 选 中 因 为 在 位 优 势 选 票 份 额 会 增 加 6. 7 6 % — 8. 97. % 。如 果 其 他 协 变 量 在
断点处连续,
并且个体没有精确操纵断点的可能,
那么,
得 到 的 R D D 估计量就
可 以 解 释 为 在 位 党 的 在 位 优 势 。下 面 进 行 相 关 稳 健 性 检 验 。
表 9.3 多项式估计
x2 -0.0652 1. 6 2 0 “ 1. 390
x3 2. 314** 1.576
d # c. x3 - 1 . 997 1. 364
( 1.5344) (11.7467)
x4 — 0. 757
(8.2240)
d# c. x4 - 1 , 897
(12.1532)
首 先 是 其 他 协 变 量 的 连 续 性 检 验 ,民 主 党 的 实 力 是 重 要 的 混 杂 因 素 ,
使用
上 一 期 民 主 党 在 众 议 员 席 位 竞 选 中 的 选 票 份 额 (voteprev)作 为 民 主 党 实 力 的 代
理变量,
该 协 变 量 相 对 于 参 考 变 量 的 断 点 回 归 图 形 见 图 9. 3 ,
可以看出在断点处
没 有 明 显 的 跳 跃 。将 民 主 党 实 力 作 为 伪 结 果 变 量 ,进 行 断 点 回 归 ,
选 择 4 阶多
项式,
估计结果如下,
可 以 看 出 断 点 ^ 的 系 数 为 0.0015,非 常 小 ,
并 且 不 显 著 ,因
'而 可 以 认 为 该 协 变 量 在 断 点 处 是 连 续 的 。
Robust
voteprev Coef. Std. Err. t P>|t| □95% Conf, Interval]
l.d .001455 .003431 0.42 0.672 一.0052712 .0081813
X .655964 .074585 8.79 0.000 ,509744 .802184
x2 1.190371 .6318029 1.88 0.060 -■048246 2.428989
x3 1.147626 1.990867 0.58 0.564 -2.755368 5.050621
x4 - . 5 3 3 7773 2.069692 -0.26 0.796 -4.591304 3,523749
d # c, x
1 - . 2 7 2 1905 .0972093 -2.80 0.005 -.4627643 -.0816166
d#c.x2
1 1,920351 .8062912 2.38 0.017 .3396579 3.501044
dtt c. x3
1 - 1 4 , 1 2467 2.49588 -5.66 0.000 - 1 9 . 0 1 7 7 1 - 9 . 2 31619
d # c. x4
1 14.59153 2.554633 5. 71 0.000 9.583304 19.59976
_cons .4877442 .0026102 186.86 0.000 .482627 .4928615
我们还需要检测个体是否能够精确地操纵断点,
检验方法是判断参考变量
分 布 在 断 点 处 是 否 存 在 跳 跃 ,如 果 在 断 点 左 右 个 体 数 量 显 著 不 同 ,
则某些个体
可能具有控制断 点 的 能 力 ,
前 面 图 9 . 4 画 出 了 参 考 变 量 的 分 布 图 。图上点没有
明显的跳跃,
但拟合的曲线显示有一定的跳跃,
需要进一步的统计检验,
使用用
户 写 的 命 令 rddensity估 计 McCrary(2008)密 度 检 验 统 计 量 ,
结果显示统计量
为一 0. 3032,p 值 为 0. 7617,
说明参考变量在断点处没有显著跳跃。
第九章断点回归设计 223
Method T p> | t |
还可以进行伪干预检验,
这是另一种形式的安慰剂检验或证伪检验,
检验
其 他 位 置 是 否 存 在 跳 跃 ,比 如 将 在 断 点 左 右 参 考 变 量 分 别 为 ±0.2.5的位置作为
检 验 在 这 些 位 置 结 果 变 量 是 否 存 在 跳 跃 。可 以 利 用 下 列 语 句 画 出 结 果
伪断点,
变量在伪断点处的关系图;
图 9.13是相应的关系图,
可 以 看 出 无 论 是 在 伪 断 点 _ 0 . 2 5 还 是 + 0. 25,结
果 变 量 都 没 有 明 显 的 跳 跃 。也 可 以 用 前 面 的 估 计 方 法 估 计 伪 断 点 的 因 果 效 应 ,
看看是否存在显著的影响,
具 体 的 检 验 过 程 留 给 读 者 操 作 。前 面 估 计 主 要 使 用
0. 2 8 的 带 宽 ,
还 可 以 选 择 其 他 的 带 宽 ,更 小 的 和 更 宽 的 ,
看看估计结果是否稳
健 ,估 计 过 程 与 上 文 的 方 法 一 致 ,
在此省略。
(a)断点为一0.25 (b)新点为+0.25
图 9 . 1 3 伪断点检验
224 基本有用的计量经济学
其中,
有两个必选项,
depvar可 以 是 结 果 变 量 、
原因变量或其他协变量,
indepvar
是参考变量,
其 他 的 全 部 是 可 选 项 。c ( # ) 用 于 设 定 断 点 位 置 ,
默 认 为 0 。p ( 并)
设定多项式阶数,
默 认 为 4 。kernel(kernelfn)设 定 多 项 式 拟 合 时 的 核 函 数 , ker
nelfn 可 以 有 三 种 选 择 :
三 角 核 函 数 triangular、
Epanechnikov核 函 数 epanechni-
kov、
矩 形 核 函 数 ^iforni,默 认 为 矩 形 核 。h ( # # ) 设 定 断 点 左 右 用 于 l i 合的带
宽,
如果没有设定带宽,
则 使 用 全 部 数 据 计 算 核 函 数 ,如 果 两 个 数 字 都 已 设 定 ,
第一个作为断点左边的带宽,
第 二 个 作 为 断 点 右 侧 的 带 宽 •,
如果只有一个数字,
则 作 为 断 点 左 右 共 同 的 带 宽 。nbinS( # # ) 设 定 划 分 的 区 间 数 ,
提供两个数值,
则 分 别 为 左 右 的 区 间 数 ;提 供 一 个 数 值 ,则 断 点 左 右 使 用 共 同 的 区 间 数 。binse-
leCt ( b m m ethod)设 定 带 宽 选 择 方 法 ,
可 以 根 据 参 考 变 量 划 出 等 份 的 区 间 ,也可
以根据参考变量分位数划分区间,
前者每个区间中个体数目不同,
后者每个区
间个体数目相同,
但区间大小不同,
默 认 为 前 者 。dCcilevel)可 以 根 据 设 定 的 ci-
level画 出 每 个 区 间 拟 合 点 的 置 信 区 间 ,
选 加 shade置 信 区 间 用 阴 影 表 示 。选项
g e n e m t e O 可 以 将 划 分 的 区 间 以 及 拟 合 的 数 值 保 存 在 相 应 的 变 量 中 ,其 中 id—
var为 区 间 r o ,
meanx_var为每个区间中点位置,
m e a n y _ v a r 为 每 个 区 间 depvar
的样本均值,
dl„va r 为 样 本 均 值 置 信 区 间 左 边 界 值 ,chr_var为 样 本 均 值 置 信 区
间 右 边 界 值 。graph_options(gphopts)可 以 添 加 Stata图 形 选 项 。hide选 项 不
显 示 R D D 图 。前 面 图 9. 1 2 也 可 以 用 rdpl o t 命 令 画 出 。
第 二 个 命 令 rdbwselect用 于 最 优 带 宽 选 择 ,
基本语法如下:
其 中 必 选 项 与 rdplot相 同 ,
可 选 项 c( # )设 置 断 点 ,
默 认 为 0,p( # )为多项式阶
数,
默 认 取 1 为局部线性回归,
q ( # ) 为偏差修正的多项式阶数,
默认为2,
®de-
H v ( # ) 可 以 用 于 估 计 弯 折 回 归 ,默 认 为 0 ,即 断 点 回 归 ,取 1 为 弯 折 回 归 估 计
( R K D )。fuzzy ( fuzzyvar [ s harpbw]) 用 于 模 糊 断 点 回 归 或 模 糊 弯 折 回 归 ,
fuzzyvar是 原 因 变 量 ,其 中 可 选 项 s h a r p b w 表 示 使 用 结 果 变 量 的 最 优 带 宽 。
covs(covars)可 以 引 人 其 他 的 协 变 量 。kernel (kernelfn)设 置 核 函 数 ,与 rplot
—样 ,
有三种类型核函数,
此 处 默 认 为 三 角 核 。bwselect(bwmethod)是 最 优 带
宽估计方法,
共提供了十种方法,
前 五 种 带 宽 选 择 使 均 方 误 差 (M S E ) 最 小 ,
仍然
沿 用 C V J K X T T 的 方 法 ,后 五 种 使 覆 盖 误 差 率 最 小 (Calonico et al.,2017a),
下面只列出前五种使均方误差最小的方法,
默 认 为 第 一 种 mserd。
scaleregu K # ) 设 定 是 否 带 有 带 宽 公 式 分 母 上 的 正 则 项 ,
取 0 不带,
取 1带,
默认
取 1 。vce()设 定 标 准 误 差 类 型 ,
共有 n n 、hc0、hcl、hc2、hc3、nncluster' cluster
七种,
默 认 为 vce(nn 3 ) ,
详 细 参 见 Calonico et al. (2017b) ^ 加 上 选 项 all,
会报
①关于偏差调整以获得更稳健的置信区间,
参 考 Calonico ot al. (2014a) 。
226 基本有用的计量经济学
告所有方法估计的最优带宽值。
下面,
我 们 选 用 矩 形 核 ,利 用 rdbwselect提 供 的 所 有 最 优 带 宽 选 择 方 法 ,
估 计 Lee(2008)数 据 中 的 最 优 带 宽 ,
估计结果如下,
前五种方法得到的带宽基本
在 0. 11— 0. 1 3 之 间 ,
后 五 种 方 法 得 到 的 带 宽 基 本 在 0. 0 8 左 右 ,比 先 前 采 用 的
交叉验证方法小很多。因 而 ,
在具体的应用中,
采用不同的带宽检验估计结果
的稳健性很有必要。
第 三 个 命 令 是 R D D 估 计 命 令 rdrobust,
其基本语法和选项为:
rdrobust的 选 项 与 rdbwselect的 选 项 相 似 ,
下面只简单介绍一下不一样
的 选 项 。h ( # # ) 可 以 手 动 限 制 断 点 左 右 的 带 宽 ,
b ( # 拉)设 定 估 计 偏 差 调 整 的
多项式带宽,
带宽和偏差带宽两选项不加,
程 序 会 自 动 利 用 rdbwselect估 计 带
宽 。rh o ( # ) 设 定 带 宽 与 偏 差 比 ,默 认 为 1 。scaleparC#)设 定 R D D 参 数 调 整
项,
默 认 为 1 。l e v e K # ) 设 定 置 信 区 间 。加 上 选 项 all,
程序会报告三种不同的
方差估计量估计的标准误差:
通常方差估计量、
偏差修正方差估计量和偏差修
正的稳健估计 量 。
下 面 利 用 rdrobust命 令 估 计 在 位 党 竞 选 优 势 。结 果 显 示 ,总 样 本 数 为
4 9 0 0 个 ,断 点 左 右 样 本 数 分 别 为 2 3 5 4 和 2546,利 用 m s e r d 选 择 最 优 带 宽 ,
左右
两侧使用相同的带宽,
为 0. 114,
偏 差 调 整 的 带 宽 为 0. 2 2 8 ,
在带宽内断点左右
有 效 样 本 数 为 6 6 0 和 695。多 项 式 阶 数 选 择 f = l ,因 而 ,
使用局部线性回归。
偏差调整多项式阶数为9= 2 ,
使 用 局 部 二 项 式 回 归 。因 为 加 了 选 项 all,
所 以报
告了三种方法估计的R D D 参数和标准误差,
三种方法得到的结果均在6% 左
右,
说明结果比较稳健。
y,- - 2 D , - 0 . 5 X , +£,
Dj ^ min(0. 5X, + u;,0. 5x0 + u;)
u 〜J V ( 0 , 1 ) ,
£,■ 〜 JV(0,1) ,X,- 〜i V ( 1 0 , 2 ) ,Xo - 10
图 9. 1 4 是 模 似 数 据 的 R K D 图 形 ,
可以看出在断点X = i O 处 ,
原因变量发生弯
折,
结 果 变 量 也 发 生 弯 折 ,当 然 ,
D 并 不 完 全 是 由 X 决 定 的 ,因 而 ,
适用于 模 糊 弯
折回归设计。
X X
(a) D vs.X (b) Y vs.X
图 9 . 1 4 结果变量和原因变量与参考变量关系图
利 用 rdrobust估 计 结 果 见 下 页 输 出 表 格 ,
选 用 矩 形 核 ,采 用 默 认 的 mserd
方法选择最优带宽,
结 果 显 示 程 序 选 择 的 最 优 带 宽 为 1.563,
选择的多项式阶数
为声= 2 ,
估计的是二阶多项式,
第一阶段显示的是断点对原因变量D 的影响,
影 响 程 度 为 一0. 7 左 右 ,
对 应 于 图 9. 14(a)中 斜 率 的 变 化 ,即 模 糊 R K D 估 计 量
(9. 47)分 母 上 的 部 分 。最 后 得 到 的 R K D 估 计 量 为 1. 89— 1. 9 6 之 间 ,与实际值
2 非常相近,
说明上述估计结果具有一定的可信性。
Treatment effect estimates. Outcome: Y. Running variable :X. Treatment Status ;D.
第六节总 结
本 章 讨 论 了 断 点 回 归 设 计 和 弯 折 回 归 设 计 ,由 于 断 点 回 归 设 计 与 完 全 随 机
化实验非常相似,
是 完 全 随 机 化 实 验 的 近 亲 (Lee and Lemieux, 2010),
RDD策
略 所 得 到 的 因 果 效 应 参 数 是 最 为 可 信 的 ,因 而 ,
R D D 策略成为目前经济学实证
工 具 箱 中 最 受 欢 迎 的 识 别 策 略 。 自 从 2 0 世 纪 9 0 年 代 末 经 济 学 家 将 R D D 策略
重新挖掘出来,
特 别 是 H a h n et al. (2001)从 理 论 上 严 格 证 明 了 R D D 策 略 的 识
别条件和估计方法,
R D D 策 略 的 理 论 及 应 用 文 献 大 量 涌 现 。本 章 介 绍 了 最 基
本 的 断 点 回 归 设 计 及 弯 折 回 归 设 计 ,对 多 元 参 考 变 量 的 处 理 (Jacob and Lef-
gren, 2004;Caliendo. et al.,2013),参 考 变 量 的 测 量 误 差 问 题 (Ping,2 012;
Pei Shen, 2016),
分 位 数 断 点 回 归 设 计 (Frandsen et al.,2012) ,以及断点的自
选 择 问 题 D o n g (2016)等 没 有 进 行 讨 论 ,
有兴趣的读者可以跟踪最新的文献。
断点回归设计近似于完全随机化实验,
具有很强的内部有效性,
估计结果
具 有 很 强 的 可 信 性 。但 是 ,也 与 完 全 随 机 化 实 验 一 样 ,
R D D 策略得到的估计往
往只是断点处的平均因果效应,
不能简单地推广到其他位置,
外部有效性较弱,
这是断点回归设计的主要限制,
在 使 用 R D D 或 R K D 策略的时候,
需要将这一
点 考 虑 进 来 。有 些 时 候 断 点 处 的 因 果 效 应 就 是 我 们 感 兴 趣 的 ,
R D D ( R K D ) 策略
是 回 答 这 类 问 题 的 最 好 工 具 。但 是 ,如 果 关 心 断 点 之 外 地 方 的 因 果 效 应 ,就需
要 引 人 一 定 的 假 设 才 能 外 推 ,外 推 有 效 性 依 赖 于 假 设 是 否 成 立 。D o n g and
Lewbel (2015)提 出 了 一 种 测 度 局 部 R D D 估 计 量 变 化 的 方 法 ,
称为干预效应导
数 (Treatment Effect Derivative, T E D ) ,它 反 映 的 是 在 断 点 处 ,干 预 效 应 的 变
230 基本有用的计量经济学
化率,
可以测度在断点附近,
如果稍微改变断点位置,
干预效应会有什么样的变
化 。如 果 T E D 为 零 ,
则意味着在断点附近其他位置干预效应不变,
从而RDD
估 计 可 以 外 推 到 其 他 的 位 置 。如 果 T E D 不 为 零 ,
意 味 着 离 开 断 点 ,因果效应就
会发生变化,
因 而 不 能 进 行 简 单 的 外 推 。Angrist and Ro k k a n e n (2015)提出了
一 种 外 推 的 方 法 用 于 分 析 在 断 点 之 外 其 他 位 置 的 因 果 效 应 。他 们 引 人 了 类 似
于匹配方法的条件独立性假设,
假设引人其他的协变量后,
参考变量与潜在结
果之间是独立的,
从 而 可 以 根 据 其 他 协 变 量 进 行 匹 配 ,而 无 需 再 考 虑 参 考 变 量 ,
从而可以估计断点左右任意位置的因果效应。
推荐阅读
有■
关 R D D 的 理 论 和 应 用 的 综 述 可 以 参 考 van der K l a a u w (2008)、
Lee and
Lemieux (2010) 、 DiNardo and Lee (20ll)、Keele and Titiunik (2015)、Choi
and Lee(2016) 等 。 关 于 R D D 策 略 应 用 指 导 建 议 可 以 参 考 lmbens and L e
mieux (2008)'Lee and Lemieux (2010)和 Skovron and Titiunik (2015)。Cook
(2008)对 R D D 的 前 世 今 生 以 及 在 心 理 学 、统 计 学 和 经 济 学 领 域 的 发 展 与 应 用
进行了很好的概括。关 于 R K D 理 论 和 应 用 可 以 参 考 Dong(20l4)、
C a rd et al.
(2015b) 和 Card et al. (2016) 。 关 于 分 位 数 R D D 可 以 参 考 Frandsen et al.
(2012)。 关 于 存 在 测 量 误 差 的 R D D 可 以 参 考 Ping ( 2 0 1 2 ) 和 Pei and Shen
(2016)。 关 于 R D D 外 推 的 文 献 可 以 参 考 D o n g and Lewbel (2015)和 Angrist
and R okkanen (2015) 。 还 有 很 多 不 断 增 加 的 文 献 ,在 此 不 再 一 一 列 出 ,有兴趣
的读者可以自行网上搜索。
第十章结 语
观测研究所提供证据的质量和可信度很大程度上取决于它的研究设
计 。再 好 的 分 析 方 法 也 没 有 办 法 拯 救 一 个 设 计 糟 糕 的 研 究 。®
---- Paul R o s e n b a u m
任何学科的终极目标都是在寻找世界的内在规律,
揭示不同变量之间的因
果关系,
透 过 自 然 现 象 或 社 会 现 象 寻 找 其 背 后 的 真 理 。经 济 学 也 不 例 外 ,
然而,
在经济学的研究中,
往往很难像自然科学研究一样,
通过大量实验获取支配自
然 界 各 种 现 象 的 自 然 规 律 。人 们 往 往 把 各 种 经 济 现 象 的 相 关 性 ,
通过一定的抽
象和假设,
获得一些理论假说,
并用社会现象所表现出的相关性来支撑经济假
设 的 正 确 性 或 适 用 性 。对 同 一 个 经 济 现 象 ,
会有多种理论学派提供不同的理论
体系,
都 可 以 在 一 定 时 期 一 定 程 度 上 解 释 特 定 的 经 济 现 象 。然 而 ,真 理 应 该 只
有 一 个 ,支 配 这 些 经 济 现 象 的 内 在 规 律 和 各 经 济 变 量 之 间 的 因 果 关 系 应 该 只 有
一种,
我 们 往 往 无 法 从 经 济 变 量 之 间 的 相 关 性 中 获 得 真 理 的 全 部 知 识 。特 别 是
在经济学的经验研究中,
很 少 有 人 相 信 经 济 学 家 的 实 证 研 究 结 果 。“计 量 经 济
学的艺术就是,
研 究 者 在 计 算 机 终 端 中 拟 合 许 多 (甚 至 上 千 个 )统 计 模 型 ,
从中
选择一个或几个符合作者预期的估计结果在论文中进行报告。
”“我 们 发 现 我 们
正 处 于 一 种 令 人 沮 丧 和 不 科 学 的 境 地 。没 有 人 将 数 据 分 析 看 作 严 肃 的 事 情 ,
或~
者 更 准 确 地 ,没 有 人 把 别 人 的 数 据 分 析 当 回 事 。
”(Learner, 1983) Learner
(1983)所 描 述 的 是 2 0 世 纪 七 八 十 年 代 美 国 经 济 学 界 的 情 形 ,
而我国经济学界
也 曾 处 于 类 似 的 境 地 。然 而 ,
经过三十多年的发展,
经济学的实证研究已经大
为改观,
经 济 学 实 证 结 果 的 可 信 度 越 来 越 高 。在 这 场 经 济 学 经 验 研 究 “可 信 性
革 命 ”中 扮 演 重 要 角 色 的 是 随 机 化 实 验 和 潜 在 结 果 框 架 的 引 入 。随 机 化 实 验 的
思 想 使 我 们 关 注 研 究 设 计 ,尤 其 是 Rubin(2008)等 人 主 张 在 观 测 研 究 的 设 计 阶
段,
要将结果变量先剔除,
就像真正的实验一样,
从而避免研究者选择一个适合
自 己 预 期 的 样 本 或 统 计 模 型 ,减 少 研 究 者 的 自 由 度 ,
增加研究设计的透明性和
客 观 性 。潜 在 结 果 框 架 的 引 人 使 因 果 的 定 义 更 加 清 晰 简 洁 ,
使经济学家更容易
定义清楚关心的因果效应问题,
从而将精力集中在研究设计和识别策略上。
本 书 介 绍 的 识 别 策 略 或 研 究 设 计 ,正 是 促 使 经 济 学 经 验 研 究 “可 信 性 革 命 ”
的 主 要 工 具 。所 有 这 些 策 略 的 一 个 共 同 特 点 ,
就是通过这些策略的设计,
使观
测研究近似于随机化实验。回归方法或匹配方法所得到的估计量,
要有因果效
应的解释,
基 本 的 识 别 条 件 是 非 混 杂 性 (unconfoundedness) 或 条 件 独 立 性 假 设
(CIA),
在 计 量 经 济 学 中 也 称 为 根 据 观 测 变 量 进 行 的 选 择 (selection on observa-
bles),
基本的含义是根据可观测的协变量为条件,
干预的分配是近似于随机化
的,
原 因 变 量 与 潜 在 结 果 是 独 立 的 。事 实 上 ,
如 果 C I A 条件成立,
数据生成过程
就 可 以 看 作 一 个 分 层 随 机 化 实 验 (stratified randomized experiment) D 这里 需
要强调一点,
本质上匹配方法和回归方法是相同的,
所要求的识别条件也是一
样的,
如 果 C I A 条件不成立,
匹配方法和回归方法一样都是不能解决内生性问
题的。
® 如 果 C I A 条 件 不 满 足 ,意 味 着 只 根 据 观 测 变 量 进 行 分 层 ,
无法保证干
预分配独立于潜在结果,
仍 然 有 未 观 测 因 素 影 响 干 预 的 分 配 。工 具 变 量 法 就 是
寻找一个决定干预分配,
但 独 立 于 潜 在 结 果 的 工 具 变 量 ,工 具 变 量 法 的 本 质 类
似 于 一 个 非 依 从 的 随 机 化 实 验 。干 预 的 随 机 化 分 配 是 工 具 ,而 个 体 实 际 接 受 的
干预状态是原因变量,
利用干预分配的随机性可识别出受工具变量影响的个体
的 因 果 效 应 (L A T E ) 。
® 如果有多期的数据,
尤其是面板数据,
可以帮助我们克
服不随时间变化的未观测混杂因素的影响,
通 过 差 分 或 去 均 值 (d e m e a n ) 的方
法,
使 得 增 量 上 满 足 C I A ,因 而 ,
D I D 策略或固定效应方法本质上是增量上的分
层 随 机 化 实 验 。® 。R D D 策 略 是 最 接 近 完 全 随 机 化 实 验 的 一 种 研 究 设 计 ,
它主
要 的 识 别 条 件 是 局 部 随 机 化 假 设 ,即 个 体 没 有 精 确 控 制 断 点 的 能 力 ,
从而使在
断点附近的个体具有高度的相似性,
在断点附近,
个体在左还是在右,
完全是由
不可控的随机性造成的,
从 而 干 预 的 分 配 近 似 于 一 个 完 全 随 机 化 实 验 D® R D D
策略通过断点来识别因果效应,
识别条件非常清晰,
也很容易检验,
研究者个人
操纵的可能性较低,
成 为 最 透 明 和 最 可 信 的 研 究 设 计 ,因 而 ,
成为经济学家最喜
欢的识別工具。 自从经济学家从历史的尘埃中把它挖掘出来,
迅速焕发生机,
理论文献和应用文献大量涌现,
现在仍然以指数级别在增加。
当然,
这些策略也不是完美的,
这些策略模拟随机化实验,
从而继承了随机
①在我国经济学的实证研究中,
仍然有人认为匹配方法可以解决内生性问题,
这是误解,
详细讨论
参见本书第五章和第六章。
②详细讨论参见第七章。
© 详细讨论参见第八章。
© 详细讨论参见第九章。
第十章结 语 233
化实验的优势,
使因果效应的估计非常可信,
具 有 很 强 的 内 部 有 效 性 。 同时也
继承了随机化实验的劣势,
估计的因果效应往往很难外推,
对经济变量之间的
影 响 机 制 也 很 少 涉 及 。政 策 评 估 一 般 包 括 三 种 类 型 ,
第一种是对已经发生的政
策进行效果评估,
第二种是对已经采用的政策应用到不同的群体的效果评价,
第 三 种 是 对 从 来 没 有 发 生 过 的 政 策 的 评 价 (H e c k m a n , 2001,2010)。本 书 介 绍
的识别策略往往只能回答第一类政策评估问题,
对于第二类政策评估,
需要讨
论一种政策在另外一种环境或群体中的政策效应,
需 要 外 推 。本 书 介 绍 的 方 法
对于第三类政策评估无能为力,
要 对 一 个 从 来 没 有 的 政 策 进 行 评 价 ,必 须 要 有
一定的结构,
才 能 对 未 来 进 行 预 测 ,因 而 必 须 使 用 结 构 计 量 经 济 学 的 工 具 。从
实验出发的计量经济学,
主 要 关 注 因 果 效 应 或 原 因 的 结 果 (effect of cause) ,
关
注的重点不是结果的原因(
cause of effect) ,
尽管对原因的结果的探讨对理解结
果的原因是有帮助的,
但 在 一 个 特 定 的 研 究 中 ,以 实 验 为 基 础 的 计 量 经 济 学 方
法只能识别某一特定原因的结果,
而不能揭示结果的原因,
这也是本书方法的
限 制 。对 于 变 量 之 间 内 在 机 制 的 分 析 ,
仍然需要从经济理论和结构计量经济学
中 寻 找 。另 外 ,
随 机 化 实 验 中 压 制 了 个 体 的 选 择 ,而 经 济 学 的 研 究 对 象 往 往 是
个 人 ,关 注 的 是 个 体 的 选 择 ,因 而 ,实 验 中 所 反 映 的 因 果 效 应 ,往 往 与 现 实 中 政
策 实 施 的 因 果 效 应 是 不 同 的 (H e c k m a n , 2001, 2010;Rucker et al.,2010),详
细 介 绍 可 以 参 见 第 三 章 第 五 节 “随 机 化 实 验 的 缺 陷 ”。当 然 ,
任何方法都不能完
成所有的工作,
本 书 介 绍 的 以 实 验 为 基 础 的 计 量 经 济 学 ,它 的 优 势 就 是 在 于 分
析第一类的政策评估, 对已经实施的政策或干预可以得到当前环境下非常可信
的估计,
这 类 研 究 可 以 为 第 二 类 和 第 三 类 政 策 评 估 提 供 一 定 的 参 考 ,为 构 造 合
理 的 结 构 模 型 提 供 依 据 。H e Ck m a n (2010)指 出 :
两 种 方 法 《相 互 补 充 ,
事实上已
有文献将两种方法结合起来,
利用实验来验证结构模型的合理性,
并利用实验
校 准 的 结 构 模 型 再 进 行 第 二 类 和 第 三 类 的 政 策 评 估 (Fehr and Goette, 2007) 。
① 即 结 构 计 fl经 济 学 方 法 和 本 书 介 绍 的 项 目 评 估 方 法 。
附 录 Stata数据处理编程简介
Stata软 件 是 目 前 经 济 学 经 验 研 究 中 最 常 用 的 软 件 之 一 ,
它体积小,
具有较
强的编辑能力,
可 以 进 行 数 据 处 理 和 统 计 分 析 ,因 而 ,
成为经济学家最喜欢的计
量 经 济 学 软 件 之 一 。下 面 简 单 介 绍 一 下 数 据 处 理 过 程 中 的 编 程 问 题 。假 设 读
者 对 Stata有 一 些 初 步 的 了 解 ,没 有 接 触 过 Stata的 读 者 可 以 参 考 B a u m
(2006)、C a meron and Trivedi ( 2010 ) 等 ,关 于 Stata 编 程 可 以 参 考 B a u m
(2016)。网 络 上 也 有 大 量 关 于 Stata的 资 料 ,
推荐两个网站,
一个是加州大学洛
杉 肌 分 校 数 字 研 究 与 教 育 研 究 所 (idre)的 网 站 :http:
/ / w w w . ats. ucla. edu/
stat/stata/ ,
另 一 个是 Stata 公 司 官 网 :
http://w w w . stata. com/support/。Sta
ta 的 官 方 手 册 可 以 直 接 从 Stata软 件 帮 助 菜 单 中 调 取 。
第 一 节 常 用 命 令
Stata用 户 手 册 给 出 了 每 个 用 户 都 应 该 知 道 的 4 2 个 命 令 ,
我们对其中更常
用 的 命 令 进 行 简 单 介 绍 。所 有 Stata命 令 的 使 用 语 法 基 本 都 符 合 下 列 格 式 :
其中的方括号表示可选项,
有 些 命 令 可 以 加 前 缀 prefix,
有些命令需要加变量列
表 varlist,
有些还可以加其他选项,
if表 示 加 条 件 ,i n 可 以 限 制 使 用 的 样 本 范
围,
weight可 以 施 加 权 重 。
根据本人使用经验,
使 用 最 多 的 两 个 命 令 是 h e l p 和 s e a r c h 或 findit,
前
一个命令是当知道某一命令,
但不知道或忘记了使用方法或具体选项时,
可以
通 过 help c o m m a n d 的 方 式 查 询 ;
后者是不知道使用什么命令,
但想实现某一种
功能,
这 时 可 以 利 用 “f i n d i t + 关 键 词 ”的 方 式 进 行 搜 索 ,
该 命 令 会 在 Stata系统
和网络上搜索相应内容。比如想查询是否有进行双重差分估计的命令,
可以通
过 findit difference in difference 或 search difference in difference,
all进行搜索,
运 行 该 命 令 后 会 弹 出 一 个 viewer窗 口 显 示 搜 索 到 的 相 关 信 息 。
在 利 用 Stata进 行 研 究 分 析 之 前 ,
一般会在工作盘建立一个特定的目录,
对
应 于 相 应 的 研 究 项 目 。有 两 个 相 关 的 D O S 命 令 非 常 有 用 :
c d 和 dir。c d 是改
附 录 Stat。数 据 处 理 编 程 简 介 235
变当前工作路径,
在 打 开 或 保 存 文 件 时 ,Stata— 般 会 在 当 前 工 作 目 录 中 寻 找 ,
如果文件不在当前目录,
往 往 需 要 加 上 完 整 的 路 径 信 息 ,比 较 麻 烦 。因 而 ,
一般
在写处理程序时,
第一步就可以利用c d 命 令 ,
将工作路径调整为数据所在或项
目所 在 的 目 录 。d i r 用 于 査 询 当 前 目 录 的 文 件 信 息 。
关于文件处理,
下 面 5 个命令可能是最常用的,
包 括 保 存 文 件 save,保 存 成
前 一 版 本 可 读 的 文 件 saveold,打 开 Stata格 式 的 数 据 文 件 u s e ,追 加 数 据 ap
pen d ,合并数据 merge。还 有 ,
数 据 导 入 命 令 import、infile、
odbc;数 据 呈 现 命
-^-display^ describe^ 士ist、count、tableN tabulate;数 据 处 理 命 令 sumarize、
tabs tat ^generate、
replace、
rename、clear、
drop、
kee p 、sort、
recode、reshape、
order、collapse、destring/tostring、encode、decode ;画 图 命 令 [ graph
twoway] yatter、histogram、kdensity、line,
具 体 使 用 方 法 参 考 各 命 令 的 help
文 件 。Stata软 件 的 学 习 方 法 ,可 以 结 合 help或 findit命 令 的 辅 助 ,
边用边学,
在此不再赘述。
第 二 节 d◦文件
Stata程 序 文 件 包 括 两 种 :d o 文 件 和 自 执 行 a d o 文 件 。a d o 文 件 主 要 用 于
写 类 似 于 Stata官 方 命 令 的 用 户 命 令 ,d o 文 件 是 一 般 的 数 据 处 理 程 序 文 件 。do
文件很简单,
就是在交互命令窗口将直接执行的命令罗列到一个文本文件中,
并 保 存 为 扩 展 名 为 . d o 的 文 件 ,比 如 myfile. d o 。在 命 令 窗 口 输 人 do myfile.
do,
Stata就 会 读 人 myfile.do中 的 命 令 并 逐 条 执 行 ,
非 常 方 便 。在 进 行 研 究 项
目的分析过程中,
很难直接通过交互方式完成整个项目的数据处理和分析过
程,
一般将整个数据处理和分析过程写到d o 文件中,
这样便于修改或后期重现
早期的估计结果。
1. 注释
一个研究项目的处理程序最终可能有几百行,
甚 至 上 千 行 。为 了 增 加 程 序
的可读性,
适 当 加 一 些 注 释 是 必 要 的 。尤 其 当 项 目 是 多 人 合 作 的 时 候 ,为 了 让
别人读懂你的程序,
也 需 要 在 程 序 中 加 人 适 当 的 注 释 。在 Stata中 有 三 种 基 本
的注释方式,
第 一 种 是 加 星 号 “* ”,* 号 后 的 语 句 在 执 行 时 会 自 动 忽 略 。第二
种是加//,
一般用在一行命令后面,
进 行 简 要 说 明 。第 三 种 是 加 / * * / 或///,
在 / * 和 * / 之 间 的 语 句 均 被 Stata忽 略 ,因 而 ,可 以 用 / * * / 进行大段的注释
或 暂 时 注 释 掉 某 些 不 想 执 行 的 语 句 。Stata命 令 是 按 行 来 执 行 的 ,有 时 命 令 行
236 基本有用的计量经济学
比较长,
一行没有办法写完,
这时一条命令要分几行写,
对于跨行命令,
需要告
诉 Stata这 几 行 是 一 个 命 令 ,
这时可以利用注释命令/* * / 或 ///将 多 行 语 句
连 接 成 一 个 命 令 。举 个 简 单 的 例 子 ,比 如 一 条 命 令 ,
先清除系统然后打开数据
auto, dta,
写成两行,
但它是一个命令,
用第三种注释方法把它们连接在一起。
下面两种方法都可以:
上面两种方式,
Stata看 到 ///或 / * * /都 直 接 跳 到 下 一 行 接 着 读 ,
将两行语句
当 作 一 条 命 令 执 行 。对 于 跨 行 命 令 较 多 时 ,
还 可 以 利 用 # 如 1:11^1:命 令 重 新 设
定 语 句 结 束 符 ,比 如 下 面 语 句 定 义 分 号 为 命 令 结 束 符 ,
则 Stata不 再 按 行 读 人 语
句,
而是寻找分号,
分号出现时,
命令结束。
2. 两种函数
Stata的 很 多 命 令 会 有 返 回 值 ,
返回值会保存在两种函数中,
一般估计命令
的 返 回 值 会 保 存 在 e()函 数 中 ,
其 他 命 令 的 返 回 值 会 保 存 在 r() 函 数 中 ,
命令后
的返回值,
可 以 通 过 l i s t 或 eretmrn l i s t 进 行 查 询 。 比 如 下 面 显 示 的
是 用 g m a r i z e 命 令 返 回 的 结 果 。这 些 返 回 结 果 可 以 通 过 新 的 变 量 取 出 来 ,
用于
后面的语句中。当 运 行 另 外 的 语 句 时 ,
K ) 函 数 中 储 存 的 值 会 发 生 变 化 ,因 而 ,
要 取 出 来 先 保 存 在 特 定 的 变 量 或 宏 中 ,以 便 后 面 程 序 使 用 。
, s\m mpg
scalars ;
附 录 SW 。数 据 处 理 编 程 简 介 237
r(N) = 7 4
r(sum_w) = 7 4
r(mean) =21.2972972972973
r(Var) =33.47204738985561
r(sd) =5.785503209735141
r(min) = 1 2
r(max) = 4 1
r(sum) =1576
下 面 是 做 了 一 个 简 单 的 线 性 回 归 模 型 后 e()所 保 存 的 结 果 。
e(predict) "regres_p"
e(model) "ols"
e(estatcmd) "regress_estat"
e(vcetype) "Robust"
238 基本有用的计量经济学
matrices :
e(b) : 1x3
e(V) : 3x3
e( V_modelbased) ; 3x3
functions :
e(sample)
3 . 两种宏
有时需要一些中间变量,
在数据处理过程中, 但不想将它保存在数据中,
或
者 有 些 语 句 需 要 重 复 书 写 ,这 时 可 以 考 虑 使 用 Stata提 供 的 宏 命 令 (macro) 。
Stata提 供 了 两 种 宏 :
全 局 宏 和 局 部 宏 。全 局 宏 会 在 整 个 进 程 中 有 效 ,
直到关闭
Stata软 件 ,
局部宏只在相应程序中有效,
程序结束,
局 部 宏 消 失 。一 般 应 用 中
很 少 使 用 全 局 宏 ,因 为 全 局 宏 比 较 危 险 ,它 可 能 会 影 响 到 所 有 程 序 中 相 同 名 字
宏的调用,
一 般 情 况 下 不 建 议 使 用 全 局 宏 ,除 非 用 户 非 常 清 楚 全 局 宏 的 影 响 。
宏 是 用 一 个 字 符 串 代 替 另 一 个 字 符 串 ,可 以 将 它 理 解 成 一 个 盒 子 ,
而里面会装
一些东西,
调 用 时 就 是 用 盒 子 里 的 东 西 来 替 换 宏 。全 局 宏 用 g l o b a l 定 义 ,
用$
调用,
局 部 宏 用 local定 义 ,
用 ‘,调 用 下 面 定 义 了 二 个 全 局 宏 xlist和一个
局 部 宏 xlist2,
它 们 里 面 都 装 了 字 符 串 price weight,
调 用 时 全 局 宏 用 $ xlist,
局部宏用‘
x l i s t 2 % 都 会 将 宏 中 的 字 符 串 取 出 来 ,可 以 利 用 display "xlist"和
display .•‘
xlist2 显示宏里面的字符串内容。
使用宏的好处是,
有时要重复输入比较长的变量列表,
可以用宏来进行代替,
这
样可以避免不同的模型中变量输人的错误,
还 可 以 节 约 程 序 输 人 的 字 符 。另一
个好处是,
有时需要不断地调整一些参数,
而这些参数如果在程序的不同位置,
每次变更就会很麻烦,
但 是 如 果 用 宏 代 替 ,只 需 要 在 程 序 开 始 处 ,
对宏的内容进
行调整,
则此后所有语句中使用的宏的内容也就相应变化。因而,
灵活使用宏
①注意这里的左单引号是P C 键盘左上角〜键上的点.
附 录 St心 数 据 处 理 编 程 简 介 239
变量可以大大提高编程效率,
降低错误率。
4 . 三种循环语句
在 数 据 处 理 过 程 中 ,经 常 遇 到 一 些 重 复 处 理 的 工 作 ,
如果基本的处理过程
相似,
可 以 通 过 使 用 循 环 语 句 来 提 高 效 率 。Stata中 提 供 了 三 种 循 环 语 句 ,
分别
是 foreach、forvalues和 while。f o r e a c h 针 对 变 量 列 表 或 宏 列 表 ,非 常 有 弹
性,
进 行 循 环 的 可 以 是 没 有 任 何 规 律 的 变 量 列 表 。f o r v alues主 要 针 对 数 值 型
的循环,
wh i l e 更 加 自 由 ,
可 以 根 据 用 户 需 要 设 计 。下 面 看 一 个 简 单 的 循 环 ,
产
生 4 个随机数,
并 把 它 们 加 和 起 来 。先 用 下 列 语 句 生 成 4 个 标 准 均 匀 分 布 的 随
机数 x l 、
x2、
x3、
x4。
clear / / 关闭系统中的数据
set obs 100 / / 产 生 1 0 0 个样本点
set seed 1234 / / 设定随机产生器种子
gen xl = r un i f o r m O / / 产生一个标准均匀分布随机数
gen x2 = r u n i formO
gen x3 = runiformO
gen x4 = runiformO
下面,
我们用三种循环语句构造求和,
首 先 利 用 foreach实 现 :
上面两个程序都可以实现求和的效果,
左边利用变量列表,
右边是定义了
一个局部宏,
然 后 利 用 宏 列 表 。可 以 看 到 foreach后 面 的 参 数 是 一 个 局 部
宏,
调用时用单引号。
因 为 4 个变量具有一定的规律性,
其 中 的 数 字 是 按 顺 序 的 ,因 而 ,
也可
以 利 用 forvalues来 实 现 。
}
di "The sum of xl - x4 = " sum
用 while也 可 以 实 现 。
local i = 1 / / 设定初始指针
while ‘i ’< = 4 { / / 注意这里条件的设定,
i 是局部宏,
调用时用单引号
qui replace sum = sura +
local i = ‘ + 1
}
di "The sum of xl - x4 = " sura
上面举了个简单的小例子说明三种循环的使用,
具 体 应 用 方 法 可 k 参 考 Stata
的 帮 助 文 件 或 Baum(2016)Q
第 三 节 结 果 呈 现 利 器 :e S t o u t 软件包
在经济学实证分析中,
往往需要进行变量的简单统计和估计结果呈现,
如
果估计的模型比较多,
制作符合学术论文要求的表格往往需要花费一定的时
间,
瑞 士 苏 黎 世 大 学 社 会 学 研 究 所 的 Ben J a n n 提 供 了 一 个非常优秀的'結果呈现
软件包 estout,
①共包括 esttati、estout、
eststo、
estadd、
estpost 等 命 令 。est-
tab、
e stout命 令 将 Stata估 计 命 令 保 存 在 e()函 数 中 的 信 息 自 动 生 成 基 本 符 合
学术期刊要求的表格,
稍加修改一般就可以用在学术论文中,
对 于 不 提 供 e()的
命令,
可 以 使 用 estpost收 集 相 关 结 果 ,
并 将 它 们 推 送 (post)到 e ( ) 中 用 于 制 作
表格^ e s t s t o 类 似 于 Stata的 官 方 命 令 estimate store,可 以 将 估 计 结 果 保
存 起 来 用 于 后 面 的 分 析 。e s t a d d 可 以 将 没 有 包 含 在 e ( ) 函 数 中 的 结 果 添 加 到
结 果 中 去 。 因 为 estout软 件 包 不 是 官 方 命 令 ,
使 用 之 前 需 要 通 过 命 令 ssc in
stall estout,replace进 行 安 装 ,
或 利 用 findit esto u t 搜 索 后 安 装 。
esttab的命令语法如下:
它的作用是将保存的回归结果输出成表格。由于参考选项很多,
不再一一
介绍,
读 者 可 以 利 用 help estt a b 调 出 其 帮 助 文 件 进 行 査 询 ,
下面举一些例子,
管 窥 一 下 它 的 用 途 。首 先 利 用 Stata自 带 的 数 据 auto, dta估 计 两 个 线 性 回 归 模
型,
将 回 归 结 果 保 存 到 estl、est 2 中 ,
并 用 esttab命 令 将 估 计 结 果 表 格 输 出 到
Stata结 果 窗 口 。
(1) •.⑵
mpg
weight - 0 . 0 0 5 8 2 ”" -0.00678…
(-8.91) (-7.49)
price - 0.0000935 0.0000566
(-0.53) (0-29)
foreign -1,856
( —1,44)
_cons 3 9 . 4 4 “* 41,96…
(19.56) (17.65)
M 74 74
t statistics in parentheses
* p < 0 . 0 5 ,“ p < 0 _ 0 1 ,… p < 0 . 0 0 1
上 面 是 esttab输 出 的 结 果 ,
默认报告估计系数的t统计量,
也可以通过改变相
应 选 项 换 成 标 准 误 差 (se)、
p 值 (P ) 、置 信 区 间 (ci)或 估 计 中 生 成 的 任 意 参 数 统
计 量 (参 见 选 项 a u x ( ) 的 说 明 ),可 以 让 e s t t a b 报 告 调 整 的 i?2 (ar2) ,伪
i?2(pr2)、
AIC(aic)和 BlC(bic)模 型 选 择 标 准 。 另 外 ,可 以 通 过 选 项 scalars()
添 加 估 计 结 果 中 保 存 的 任 何 标 量 统 计 量 ,比 如 p 值 、
F 值、
模 型 自 由 度 (d f _ m )和
残差自由度(
df_r)等 ,
如果想 让 t 统计量或标准误差与系数并排排列,
可以加上
选 项 wide,输 出 宽 表 。 .
242 基本有用的计量经济学
(1) (2)
rapg mpg
weight - 0.00582 … (0,000653) -0.00678“ (0,000905)
price - 0.0000935 (0.000175) 0.0000566 (0.000192)
foreign -1,856 (1,289)
_cons 39,44^ (2.016) 41. 9 6 … (2.378)
N 74 74
adj. R-sq 0.643 0. 649
F 51. 14 45,93
df_m 2 3
df_r 71 70
可 以 看 到 ,上 表 的 输 出 结 果 系 数 小 数 位 比 较 长 ,可 以 通 过 修 改 系 数
(b(fmt))、
标 准 误 差 (se(fmt))、拟 合 优 度 (ar2(fmt))等 参 数 输 出 格 式 改 变 输 出
小 数 位 数 。可 以 通 过 nost a r 选 项 禁 止 标 出 * ,也 可 以 通 过 star()选 项 改 变 星
号所代表的显著性水平,
还可以通过加选项mtitleO改变列标题。
(1 ) (2 )
OLS 1 OLS 2
weight -0,0058… (0.0007) (0.0009)
price -0.0001 (0.0002) 0.0001 (0.0002)
foreign -1.8559 (1.2891)
_cons 3 9.4397“* (2.0163) 41+9595… (2.3777)
N 74 74
adj. R-sq 0.6434 , 0.6487
可 以 通 过 加 label选 项 ,
让 esttab报 告 变 量 的 标 签 而 非 变 量 名 ,可 以 通 过
nonumbers去 掉 每 列 的 数 字 ,可 以 通 过 选 项 t i t l e O 加 表 格 标 题 ,
addnote()增加
脚 注 。有 时 需 要 添 加 一 些 e s t t a b 选 项 中 没 有 定 义 的 参 数 ,
可 以 利 用 命 令 es-
tadd添 加 ,
利 用 s t a t s O 选 项 调 用 estadd构 造 的 宏 变 量 ,
用 scalars()调 用 es-
附 录 Stct。数 据 处 理 编 程 简 介 243
tadd产 生 的 标 量 。e sttab也 可 以 将 表 格 输 出 到 文 件 中 ,
利 用 using选 项 ,
可以
将 表 格 保 存 为 E xcel文 件 (.csv)、
W o r d 文 件 (.rtf)或 L a T e X 文 件 (.tex) 。
(1) (2)
OLS 1 OLS 2
- 0.0058" *
…
Weight (lbs.) (0.0007) - 0.0068 (0.0007)
Price -0,0001 (0.0002) 0.0001 (0.0002)
Car type -1.8559 (1.4197)
3 9,4397“*
…
Constant (2.0163) 41.9595 (1,7330)
Control_foregin No Yes
N 74 74
r2_a 0.6434 0.6487
其 中 stats(,
[fmt()])调 用 est a d d 产 生 的 参 数 和 es t t a b 默 认 的 一 些 统 计 量 ,
fiutO设 定 对 应 参 数 的 显 示 格 式 。如 果 加 上 using filename, r t f 选 项 ,
上述结
果 将 保 存 到 文 件 fUename. rt f 中 ,不 再 显 示 在 屏 幕 上 ,可 以 用 W o r d 打 开
filename, rtf。下 面 的 命 令 将 上 述 表 格 保 存 在 文 件 table.rtf中 。
244 基本有用的计量经济学
. esttab ml m2 using table, rtf, b(%12.4f) se( %5. 4f) star( * .10 * * .05 * * *
. 01)
用 W o r d 打 开 table, rtf后 ,
显 示 类 似 于 表 格 A. 1 ,
经 过 稍 加 修 改 后 ,即可以
粘贴到论文中使用,
这 样 就 可 以 集 中 精 力 进 行 研 究 设 计 ,而 不 必 在 输 出 结 果 上
花费太多时间,
大大提高了生产效率。
(1) (2)
OLS 1 OLS 2
Control—foregin No Yes
N 74 74
研究论文中一般需要报告变量的简单统计或假设检验,
变量的简单统计,
在 Stata软 件 中 可 以 使 用 £^mmarize、
tabstat等 命 令 ,
但这些命令返回值保存在
K ) 函数中,
estt a b 无 法 直 接 调 用 r()构 造 表 格 ,
需 要 利 用 estpost命 令 将 r()函
数 保 存 的 统 计 量 推 送 (post)到 e()函 数 中 ,
然 后 可 以 利 用 esttab输出相应的简
单统计表格。
附 录 S tM 数 据 处 理 编 程 简 介 245
. sysuse auto
(1978 Automobile Data)
. estpost summarize mpg weight price foreign
e(suia)
mpg 1576
weight 223440
price 456229
foreign 22
mean sd count
利 用 tabstat进 行 分 组 统 计 ,
也 可 以 利 用 using filename选 项 将 结 果 保 存 到
文 件 中 去 。另 外 ,
estpost 还 可 以 推 送 ttest、
@bulate、
£2£relate、
ci、margins 等生
成 的 r()函 数 结 果 ,
限于篇幅,
在此不再一一详述,
读 者 可 以 自 行 参 考 estpost帮
助文件。
Domestic
mpg 19.82692 . 4,743297
weight 3317.115 695,3637
price 6072,423 3097,104
Foreign
mpg 24.77273 6.611187
weight 2315.909 433.0035
price 6384.682 2621,915
Total
第四节练 习
1. 随 机化 实验 数 据 分 析
利 用 美 国 国 家 培 训 示 范 项 目 (N S W ) 实 验 数 据 n s w —dw. dta,
估计培训的平
均因果效应,
请利用下列四种方法估计培训的影响,
并写出相应的do文件。
1 . 两组结果平均值之差P 7 。
2.简单回归系数产。
3. 控 制 协 变 量 a ge、
education、
black、
married、
re74、
r e 7 5,
参考(
3. 11) 。
4 . 控 制 协 变 量 ag e 、education、
black、
married、
re74、re75 及 其 与 干 预 变
附 录 stm o 数 据 处 理 编 程 简 介 247
量 treat的交叉项,
注 意 交 叉 项 中 的 协 变 量 要 去 均 值 (deme a n ) ,参 见 (
3. 13)。
2 . 教育收益率估计
利 用 第 7 3 页 描 述 的 2 0 0 2 年 中 国 居 民 收 入 调 查 (C H I P ) 城 镇 数 据
chip2002,
用 回 归 命 令 regress估 计 四 个 模 型 ,
并 将 估 计 结 果 生 成 类 似 表 5. 1 的
表格。
第 1 个 回 归 估 计 基 本 的 Mincer方 程 ,
控 制 educ、exper、
expersq,
第 2 个回
归 在 模 型 1 基础上再控制性别male和城市固定效应,
第 3 个 回 归 在 模 型 2 的基
础上再控制行业固定效应,
前 三 个 模 型 均 使 用 修 正 异 方 差 的 稳 健 标 准 误 差 vce
(robust),
第 4 个回归与模型3 相同,
但 使 用 聚 类 到 城 市 的 标 准 误 差 vCe(C lus-
ter city),将 估 计 过 程 所 需 程 序 写 到 d o 文 件 中 。
3 . 培训的作用:
倾 向 指 数匹配方法
利 用 N S W 实 验 数 据 n s w —dw. d t a 的 干 预 组 和 美 国 人 口 调 査 数 据 cps一con
trols, dta 合并为 一 个 数 据 集 (利用 append u s i n g 命 令 ),
并利用合并好的数据
集 复 制 (replicate)Dehejia and W a h b a (1999)表 1 的 简 单 统 计 和 表 3 的 估 计 结
果 。请 编 写 d o 文 件 完 成 下 列 工 作 :
( 1 ) 将 随 机 化 实 验 数 据 nsw_dw. dta的 干 预 组 (treat = 1) ,
与 C P S 数 据 cps_
controls. dta(treat=0)合 并 在 一 起 ,
并进行简单统计,
生 成 类 似 于 第 1 1 0 页的分
组 (干 预 组 和 控 制 组 )简 单 统 计 结 果 。
(2)估计倾向指数,
并 画 出 倾 向 指 数 分 布 (根 据 干 预 状 态 进 行 分 组 ,
可以使
用 histogram或 k d ensity命 令 ),比 较 两 组 倾 向 指 数 分 布 的 差 别 。
( 3 ) 进 行 样 本 匹 配 。利 用 1 : 1 最近邻匹配,
获得
体,
并构造匹配样本。
(4)检验匹配样本协变量平衡性,
并估计干预组平均因果效应(
A T T )。
( 5 ) 利 用 随 机 化 实 验 控 制 组 数 据 与 C P S 调 査 数 据 ,检 测 C I A 条 件 是 否
成立。
4 . 教育收益率估计:
I V 方法
- ( 1 ) 只 引 人 教 育 变 量 (E D U C ) 和 出 生 年 度 (
Y R 2 0 — Y R 2 8 ) 的 Micer方 程 。
(2)在 模 型 1 基础上控制年龄及其平方( A G E Q 、
A G E Q S Q )。
( 3 ) 在 模 型 1 基 础 上 控 制 种 族 (R A C E ) 、婚 姻 状 态 (M A R R I E D ) 、城 市
(S M S A ) 和 地 区 (N E W E N G 、M I D A T L 、E N O C E N T 、W N O C E N T 、
SOATL、
ES-
OCENT、
WSOCENT、
M T )。
( 4 ) 在 模 型 3 基础上控制年龄及平方( A G E Q ' A G E Q S Q h
5. 最 低 工 资 对 就 业 的 影 响
6 . 加州香烟控制法案的影响:
合成控制法
7 . 在位党在竞选中是否有在位优势?
(2008)密 度 检 验 法 检 验 个 体 是 否 有 精 确 操 控 断 点 的 能 力 。
( 4 ) 稳 健 性 检 验 。检 验 其 他 协 变 量 在 断 点 处 是 否 连 续 ,
检验在参考变量其
他位置是否存在跳跃,
画出相应图形并进行相应检验。
8 . 弯折回归设计(
R K D )估计
利 用 第 2 28页的数据生成过程,
编 写 do文件,
生成一个样本容量为100的
样本,
画 出 类 似 于 图 9.1 4 的 图 形 ,
并 利 用 断 点 估 计 R K D 估 计 量 ,讨 论 估 计 出 的
D 对 Y 的影响与实际值的差异。
参考文献
1 . 洪永淼. 高级计量经济学. 北 京 :
高 等 教 育 出 版 社 ,2011.
2. 丁 鹏 . 因 果 推 断 简 介 之 一 至 八 . http://cos,
3 . 韩 乾 、洪 永 淼 . 国 家 产 业 政 策 、资 产 价 格 与 投 资 者 行 为 . 经 济 研 究 ,2 0 1 4 ,( 1 2 ) ;
143— 158.
4 . 赵西亮. 倾向指数匹配方法:
模型设定和变量选择问题. 数量经济技术经济研究,
2 0 1 5 ,(1 2 ) :133— 147.
5 . 赵 西 亮 ,教 育 、户 籍 转 换 与 城 乡 教 育 收 益 率 差 异 . 工 作 论 文 ,2016.
. 6 . 赵 西 亮 . 也 谈 经 济 学 经 验 研 究 的 “可 信 性 革 命 经 济 资 料 译 丛 ,20 1 7 ,(2 ) ;8 0 - 9 0 ,
7. Alberto Abadie- Semiparametirc Difference-in-Differences. Review of Economic
Studies y?2:
l— 19, 2005,
8. Alberto A b a d i e and Sofia Dermisi. Is Terrorism Eroding Agglomeration E c o n o m i c s in
Chicago. J o u r n a l o f U r b a n E c o n o m i c s , 6 4 : 4 5 1 — 4 6 3 ,2008.
9. A lberto A badie and Javier Gardeazabal. The Economic C o sts of C on flict:A Case
Study of the B a s q u e Country. A m e r i c a n E c o n o m i c R e v i e i v ,93(1) :1 1 3 一 132 j 2003-
the Synthetic Control Method. American Journal o f Political Science > 59 ( 2 ) :495—
510,2015.
参考文献 251
Schooling a n d Earnings. Q u a r t e r l y J o u r n a l o f E c o n o m i c s ^ C V I C 4 ) :
9 7 9 * ^ 1 0 1 4 ,1991.
18. Joshua D, Angrist a nd A l a n B. Krueger. Instrumental Variables and the Search for
Discontinuity Estimation of Exam School Effects away from the Cutoff. Journal o f the
A m e r i c a n Statistical Association , 1 1 0(512) :1 3 3 1 — 1344, 2015.
23. Joshua D. Angrist,G u i d o W . I m b e n s ,a n d D o n a l d B. Rubin. Identificatin of Causal
Effects U s i n g Instrumental Variables, J o u r n a l o f the A m e r i c a n Statistical Association ? 91
(434):444— 4 5 5 ,1996.
24* Joshua D. Angrist, Victor Lavy, a n d Analia Schlossen Multiple Experiments for
28(4) :
7 7 3 — 824, 2010.
25. Joshua D, Angrist and Jorn-Steffen Pischke. Undergraduate Econometrics
Instruction; T h r o u g h our Classes, Darkly. W o r k i n g P aper 2 3 1 1 4 , National Bur e a u of
R e v i e w o f E c o n o m i c s a n d Statistics ,4 7 — 5 7 ,1978,
Forthcoming.
2 3 2 6 ,2014a.
9 4 6 ,2014b. •
35. Sebastian Calonico, Matias D. Cattaneo,and M a x H, Farrell, O n the Effect of Bias
A p p l i c a t i o n s . C a m b r i d g e University P r e s s ,2005.
Press? 2010.
39. D avid C a r d a n d A l a n B» Krueger. M i n i m u m W a g e s a nd E m p l o y m e n t :A Case Study
( 4 ) : 7 7 2 — 7 9 3 ,1994.
(2):
6 36 — 654, 2008.-
97 ( 5 ) ;1 0 8 1 — 1092, 2015.
2 9 8 — 3 1 7 ,2007,
2012 .
55. Trygve Haavelmo. The Statistical Implications of a S y s t e m of Simultaneous
58. Trevor Hastie? Robert Tibshirani, and Jerome Friedman. The Elements of
254 基本有用的计量经济学
462, 1997-
63. J a m e s J, Heckman. Mi c r o data, Heterogeneity, a n d the Evaluation of Public
Policy:Nobel Lecture. Journal o f Political E c o n o m y ,109(4) :673— 7 4 8 ,2001.
64. J a m e s J. H e c k m a n . Building Bridges b e t w e e n Sturctural a n d P r o g r a m Evaluation
406, 1980.
69» Migu e l A. H e r n a n and J a m e s M . Robins. C a u s a l I n f e r e n c e t Boca R a t o n ;C h a p m a n
H a l l / C R C , Forthcoming-
70. Paul W . Holland. Statistics a n d Causal Inference. Journal o f the A m e r i c a n
Statistical Association , 81 :
9 4 5 970, 1986.
71. Paul W . H olland and D o n a l d B, Rubin, O n Lord’
s Paradox. Technical R e p o r t ,
740, 2012.
参考文献 255
9 5 9 ,2012.
http;
//ideas. repec. org/c/boc/bocode/s432001. html, 2003.
1923,1990.
99. H . S. Nielsen, 丁. Sorensen, and C. R. Taber. Estimating the Effect of Student
6 8 8 ,1995.
104. Judea PearL Causation, A c t i o n ,a nd Counterfactuals. In P r o c e e d i n g s o f the 6th
C o n f e r ence on Theoretical A s p e c t s o f R a t ionality cuid Kfttrw l e d g e ,T A R K ,
9 6 ,5 1 — 7 3 ,San
106. Z h u a n Pei and Yi Shen. T h e Devil is in the Tails :Regression Discontinuity Design Wit h
参考文献 257
edition f 2008.
Randomi 2a-tton Test Comment. Journal o f the American Statistical Association ,75(371 ):
591— 5 9 3 ,1980-
120. D o n a l d B. Rubin* Fo r Objective Causal Inference? Design T r u m p s Analysis. The
A n n a h o f Applied Statistics,2(3) ;
808— 8 4 0 ,2008,
121. Duonald B. Rubin. Causal Inference Using Potential O u t c o m e s : Design,
Modeling ,Deci-sions. Journal of the A?nerica?i Staihiical Association , 100 (469): 322—
—
3 3 1 ,2005.
122. Gerta Rucker? Erika Graf* and Martin Schumacher. W h a t is M e a n t by the Effect of a
Treatment on the Treated? Letter to the Editor, University Medical Center Freiburg, 2010.
258 基本有用的计量经济学
123. John Rust, Mostly Useless Econometrics? Assessing the Causal Effect of
48, 1980.
Psychology , 51 (6) :
309— 317, I960.
128. William M, K. Trochim. Research Design for Program Evaluation : T h e