You are on page 1of 238

还在督 自己 天进步一点吗?

还在 持 天阅读 习 吗?

还在为找不 自己喜欢 书籍烦 吗?

那~

与我成为书友吗?

国 外当下流行书籍

各图书销量排行 书籍

量工具书籍

我们受 终 书籍

……

海量 版、纸质版书籍及 程

还有贴心 “ 习管 ” 务哦!
微 :shuyou099
图书在版 目(CIP)数据

裸裸 计 /( ) 伦著;曹 . —北京:中 出版社,2013.11

书名原文:Naked Statistics

ISBN 978-7-5086-4215-4

①I. …II. ① …III. ① 济 计 -通 读 Ⅳ. ①F222-49

中国版本图书 CIP 数据核字(2013)第215055 号

 
 
Copyright © 2013 by Charles Wheelam

All rights reserved including the rights of reproduction in whole or in part in any

form.

Simpli.ed Chinese translation copyright © 2013 by China CITIC Press

ALL RIGHTS RESERVED

本书仅限中国 陆地区发行销售

 
 
裸裸 计

 
 
著 :[ ] 尔斯· 伦
:曹

策划推广:中 出版社(China CITIC Press)

出版发行:中 出版集团股份有限公司

(北京市 阳区 新东街甲4号 厦2座邮 100029)

(CITIC Publishing Group)

 
 
字数:240千字

版次:2013年11月第1版

京权图字:01-2013-1461 广告 营 可证:京 工商广字第8087号

书号:ISBN 978-7-5086-4215-4/F·3002

价:42.00

 
 
版权所有· 权必究

凡 本社图书, 有 页、 页、 页,由发行公司 责退换。

务 :010-84849555 务传真:010-84849000

稿邮箱:author@citicpub.com

中 出版社官 : http://www.publish.citic.com/
官方微博: http://weibo.com/citicpub

更 书,尽在中 飞书 App: http://m.feishu8.com (中 书直销平台)

书排版:济南斯 尔数字出版技 有限公司

裸裸 计
 
 
[ ] 尔斯· 伦 著

中 出版社

引言 我为什么憎恶微积分却偏爱统计学?
我天 就很排斥数 。我对数字本 没有任何 ,对那些在现实世

中 无 人公式也没有什么 印 。我尤其不喜欢 中 微积分

,原因很简单,因为从 就没有人告诉过我 习这门 义是什么


—有 会在乎抛 下方 区 代表什么?

事实上就在 中三年级 时 ,我迎 了人 中 一个重要时刻,那


时我正在 第一 微积分 程 末 ,虽 那几天我也算 功

习了,但 体 还是以偷 为主,因为几个星 我就申请 了


,当 随之 是我对这门 本 就少得可怜 习动 也
消 尽。 那天我盯着 卷上 题目,发现 们竟是 此陌 。这

已 不是会不会答 问题了, 是根本就搞不清 题目问 是什么。我


对“裸 ”其实并不陌 , 国国防部 部长唐纳德· 斯菲尔

德 话 就是,我 是知道我有不知道 东西。但这次 比以往 题

目都 ,我草草地 了一下 卷,几乎没有会答 题。我 教室

, 老师—我们 微积分老师卡 ·史 斯 ,“史 斯


夫人,”我 ,“ 卷上 很 东西我都不 。”

相比起我对史 斯夫人 “喜 ”, 对我 “不喜 ”要更 。是


,现在我承 作为 会主席 我,有时会动 中有限 权 安

排一些 性 集会,这样史 斯夫人 微积分 就被迫取消了。我和

友们也曾以“一位神秘 仰 ” 名义派人在 上给 送花,

后看 尴尬地环顾四周, 我们则在教室后 得 地窃笑。是 ,在我

得知自己被 录取之后,我就真 再也没有 过任何作业了。

所以,当我 史 斯夫人 ,告诉 那些题目看上去很陌 时

, 并没有流 出一丝 同 。“ 尔斯,” —表 上是对


我 ,但 却 着 同 ,以确 教室里 一个人都 听

—“ 功了,这些题目看上去就会 得 。”这一点确实很有

,所以我只得溜回座位。几分钟以后,我们 这门 “尖

”布莱恩·阿尔 特尔 教室 ,和史 斯夫人 了几句,史


斯夫人也 地回了几句,之后,一件十分离奇 事 发 了。“同

们,请注 一下,”史 斯夫人宣布,“我 把下 题发给


们了。”当时 已 进行了一 时间,所以这次 不得不取消择日
重 。我当时 欣喜之 无以 表。

在我之后 人 中,我 了一位漂亮 , 有3个 康 。我出


版了几本书,游览过泰 陵和吴哥窟这样 名 。但是,那天微积分老

师得 “因 报应” 一幕, 旧是我人 中最 忘 5个时刻之一。

(事实上,在之后 补 中我差点 没及格,但这一点 都没有 这一

人 历褪色丝 。)

微积分 小插曲 地 明了我和数 之间 关 ,但这并不是事

实 部。有 是,尽管 也 要进行 微积分 那样令人厌烦


演算,但我在 中时却十分喜欢 。这又是为什么?因为

有一个明确 目 。我清 地记得在世 业 赛 间,我们

老师教我们 何运 加速度 基本公式 测一个本 打 打 远。

这简直酷 了—这个公式在 活中也有很 重要 应 。

上 之后,我彻底沉醉于 之中,因为 同样为我在洞 现实

活中 一些有 场景提 了 释。回 过往,我 让我 恨微积分

不是数 , 是从 就没有人 要告诉我数 义是什么。


没有被“ 雅” 公式本 所吸引—反正我是一点 都不觉得有什

么“ 雅” —那么, 对 只会是 公式,至少我 老

师当 就是这样把 们教给我 。
也正是因为这一点,我与 计 了 (本书所 计 包

在 )。我 计 。 活中 一切一切,从 氧核糖核酸(DNA) 测

买彩票 白 行为, 计 通通都 出 释。 计 帮助我们

发 些 因 ,比 和心 ; 计 还 帮助我们在

化 中 作弊行为; 计 至 帮助 在 游戏节目中获
。在我 童时代有一 常出名 节目,叫作《让我们作个交

易》,由当时 受欢迎 蒙提· 尔主持。在 天节目快要 束时,

出 选 和蒙提都会站在3 门 ,蒙提· 尔会告诉观众和选

,在其中一 门 门后会有一项 奖, 一辆小轿 , 另外两

门 门后则各站着一 山 。 法很简单:选 选择一 门, 后就会


得 这 门后 奖品。

当选 和蒙提· 尔站在这3 门 时,这位选 中 奖 为


1/3。但是,这 节目却有其微 之 ,这让 计 们欣喜万分(却也

其他人困 不已)。在选 选择了其中一 门之后,蒙提· 尔会先

打开剩下 两 门中 一 , 打开 这 门后 站着 永远是一 山

。举个 , 设选 选择了1号门,那么蒙提会先打开3号门,

后 站着一 山 ,此时1号门和2号门 闭。 奖就在1号


门后 ,则选 获 ; 奖在2号门后 ,则选 败。但节目进行

这里 时 ,会变得更加有戏 性:蒙提会 向选 ,问其是否更改

之 决 (在这个 中就是把1号门改为2号门)。 要注 是,

此时剩下 两 门 是关着 , 选 得 唯一 新 息,就是他


之 没选 那两 门中,有一 门 后 证实是一 山 。
那么,这位选 是否应该更改之 选择?

答 是 。为什么呢?本书之后 会 出 释。

计 就在于,从 比赛 击 成功 国 选

, 几乎无 不在,但是这个 科本 却因为乏味无 和 以


“臭名昭著”。 计 方 书籍和 程也都过 地 斥着数

和 。相 我,技 细节十分重要(也十分有 ),但是 不知

道 们 出发点是什么,那么摆在 将会是一 天书般 符号。


连 自己都不相 习 计 是一件有 义 事 ,那么 根

本不会去关心所 出发点。本书中 一章都旨在回答我向 中微积


分老师提出 那个基本问题: 习 计 义是什么?

这是一本有关直觉 书。书中很少出现计算、公式和图表;当 们

时 ,我 证 们都存在一个清晰和 有启发性 目 。与此同时,


书中常常会出现很 ,目 就是让 相 , 习 计 是很有必要
。 计 真 可以 常有 , 且其中绝 部分 也没有那么

在 习过史 斯夫人 授 微积分 程后不久,我就萌发了 这本书


法。那 “不 回 ” 历就发 在我读研究 间,那时我

是 济 与公共政策专业。在开 习这门 之 ,我和 上 部分


同 都 无 外地被 派 了一个“数 营”进行集训,为接下
“数 轰炸”作 。在3周 集训时间里,我们整天待在一间没有窗

地下室里 数 —真 一点 都不 张。

就在其中 一天,我离顿 仅有 厘之差。那时, 责集训 老师正


在费劲地教我们在 些 下 从一个无穷级数求得一个有限数。请
不要 过这一 ,因为这一 念 上就会清晰起 (现在, 可以

我在那个没有窗 教室里是什么 受了吧)。无穷级数 是一


个可以无限地 下去 数字组合, 1+1/2+1/4+1/8……最后 省 号表

示这个算式还将无限地 下去。

了这一步,我们基本上已 开 困 了。老师 图通过一些我早


已遗忘 向我们证明,一个无穷尽 算式 可以通过求和得 一
个( )确 数 。尽管有很 令人 数 证明,但 上

尔同 却 活不 接受这一 (老实 ,我自己对此也心存 )。


无限 东西 过叠加怎么可 得 一个有限 呢?

突 我灵光一现,更 确地 ,是我 直觉让我 通了老师要表达

思。我对 尔 了我 里刚刚闪现出 法: 自己站在离一


正 两英尺(约0.6米) 地方。

现在 方向移动1/2 离(即1英尺),这样 离 就只剩下1

英尺 离了。

再 向 方向移动1/2 离(即6英寸 1/2英尺), 重 相同


动作(即移动3英寸 1/4英尺),再移动剩下 离中 1/2(即1.5英
寸 1/8英尺),不断重 。

最终 将十分贴近 , 设现在 离 只剩下1/1024英寸, 后

还 要 方向移动1/2 离,即1/2048英寸,但 永远都不会撞


,因为 上 所移动 一步都只有剩余 离 1/2。也就是
, 将无限接近 但永远碰不 , 我们 一 英尺作为计

量单位,那么 所移动 离就可以表示为1+1/2+1/4+1/8……

问题 核心就是:即 正在不 地 近 , 且 一步都是剩余


离 1/2,但 所 过 离永远都不可 过两英尺,也就是一开

与 之间 离。出于计算 目 , 所 程 长度可以简单
地估算为两英尺,但数 会 1+1/2+1/4+1/8……最终收敛于2,这也
是那天老师 要教给我们 。

关键在于我 了 尔,也 了自己。虽 我不记得这道题 数 推


证过程,但我 是可以在 上寻找答 , 且当我找 答 时
,我 还 看出一点 门道 。以我 看,直觉会让数 和

其他技 细节更加 易 ,但是反过 就不一 得通了。

本书 目 就在于 重要 计 念变得更加直观和 于 ,不仅


让我们这些被迫在没有窗 教室里苦 过 人,更可以让任何对数字

和数据 人 量 兴 人都 上 计 。

刚刚我还在 计 核心并没有那么 直观和 ,现在我却要提


出一个 似自相矛盾 观点: 计 可以变得 常 ,任何人只要
有数据和一台 ,就可以通过简单地敲击几下键盘 成 杂
计流程。问题是 数据不 ,又 计方法错 ,那么得出

将会 以千里, 至还会有潜在 危险。就比 下 这 虚 上


新闻快讯:工作时小 人更易 于 。 在上 时这个 题突

从页 弹出呈现在 眼 , 会怎么 ?一项基于3.6万名办公室白领


( 数据组啊!) 显示,那些表示会在工作 间偶尔离开办
公室休息10分钟 员工在未 5年 要比那些从不离开办

公室 同事 41%。显 我们 要为此 点什么,比 在 国范围 掀


起一股 办公 间小 潮。

,我们只 要对员工在休息 10分钟里干了什么事 作些思 。我

工作 告诉我,这些离开办公室休息 员工中有很 人都 在办公


口 吸 (其他人 要进 出 都必须一 扎进他们吞

吐 “云 ”之中)。那么,我会进一步推断是 小 引发了
。我举 这个 当 十分荒 ,但现实 活中有 计 在
过 之后,也产 了类似荒 效 。

计 就 是一种 智商武器:正确地 帮助我们,但错 地

也会产 灾 性 后 。本书不会将 变成一个 计 专 ,但


会让 对这个领 持 和尊重,不至于酿成 祸。

这是一本 计 教科书,那么各种 念和方法都会 其中, 不

管普通读 是否 消化。不过,本书 创作 衷就是介 那些与日常


活 最为 计 念。科 们是 何 因 ?
是 何发挥作 (哪些方 又会出问题)?哪些人设计了“
计陷阱”,这些人又是 何 ? 卡公司是 何根据 消

费数据, 断 是否会错过还 限 ( 笑, 们真 得 )?

要 新闻中出现 数字 后 含义,并见 “数据” 巨


量, 计 就是 不二法宝。最后,我还 与 分享瑞典数

、作 安德 斯 一句话: 数据 易,但是 数据 出真相却


很 。读 此书,我希 们也 同 受。

除此之外,我还有一个更加 伟 目 ,那就是让作为读 真正地

喜欢上 计 。这是一门 满乐 且与我们 活息息相关 科,关


键在于 何将 习过程中涉及 技 细节与那些重要 念 离开 ,
这就是 裸裸 计 。

目录
第1章 统计学是大数据时代最炙手可热的学问
第2章 描述统计学
第3章 统计数字会撒谎
第4章 相关性与相关系数
第5章 概率与期望值
第6章 蒙提·霍尔悖论
第7章 黑天鹅事件
第8章 数据与偏见
第9章 中心极限定理
第10章 统计推断与假设检验
第11章 民意测验与误差幅度
第12章 回归分析与线性关系
第13章 致命的回归错误
第14章 项目评估与“反现实”
基尼 数是否是衡量社会分配公平程度最 ? 站是 何

知道 喜欢 影类 ?祈祷真 让 人 后康 改善吗?
是什么导致自闭 发 一直 ?哪些人最有可 成为 怖分 ?

我注 一个有 现 。 们在 上常常 怨 计 程有 么

和无关 要;可一离开教室,他们又会在午饭时开心地讨 位

星 击 成功 ( 天) 数( 天),又 彼此成绩 平
分数(永 话题)。他们会 出 国 业 (NFL)采 “传

效绩 数” 以将一个四分卫 场上表现浓 为一个数字 不当之

, 为以此作为 价 员 据 显武断,但可以通过 整其中所包

含数据( 成 、平 过 码数、 地得分 、 等) 权重比


重新计算,以得出一个与原 不同,但同样可 员表现 数。但只

要是看过 比赛 人都会觉得,没有比 一个单一数字 衡量四分

卫 表现更加方 了。

关于四分卫表现 这个 价 数是 吗?当 不是,无 是什么问


题, 计 都 少提 唯一 “正确”方法。但是,这个 数是否以一

种易于 方式提 了一些有 义 息呢?那是 , 快

速地对 场比赛 两名四分卫 表现 出比较,那么这个 数会是一个

不错 工具。我是芝加哥 队 粉丝,在2011年季后赛 间, 队与芝


加哥包装工队进行了一场比赛,以后 告终。我可以通过很 种

方式 描述那场比赛,包 长篇 牍 分 和令人眼花 乱 原 数

据,但这里我为 提 了一种更加简洁 分 方法。芝加哥 队 四


分卫杰·卡特 传 效绩 数为31.8;与此同时,格 湾队 四分卫

亚伦· 杰斯 传 效绩 数为55.4。同样 ,我们可以将杰·卡特

与他之 格 湾队比赛时 表现进行对比,在那场比赛中他 传 效

绩 数 达85.6。两 相比较,我 就不 为什么 队在常


赛时击败了包装工队,但在季后赛时却输给了包装工队。

这对于 场上进行 比赛 常有 。传 效绩 数是否起 了简化问

题 作 ?是 ,但这同时也反映了描述 计 优 和 。仅 一

个数字, 就可以知道杰·卡特 在与格 湾 那场比赛中败给了亚伦


· 杰斯;但 却无法从这个数字中读出运动员在比赛中 运 是 是

坏;不知道他是否传出了一个漂亮 过人 却被 蠢 队友错过了,导

致这个 最终被对方 获;不知道他是否在比赛 些关键时刻顶住压


发挥出色(因为 一次 成功发 在 计时都被同等对待,不 是决

性 三次 地还是比赛接近尾 时那些 无 义 发 );不知道那

一场 防守是否 糕透顶……读不出 息还有很 。

令人 奇 是,同样一 人,在 体 、天 成绩 时 提 数据

时还是兴 采 ,但是当研究人员开 向他们 释基尼 数时,他们


心却出汗了。基尼 数是衡量收 不 济 工具,我在之

后 中将对其 出 释,但是现在我要 最重要 事 是,基尼

数实质上与传 效绩 数没有 区 ,都是将一 杂数据浓


成一个单一数字 捷工具。正因 此,基尼 数也 有描述 计
数优 , 比较两个国 个国 不同时 收 分配

,该 数就为 提 了一个简单易行 方式。

基尼 数 于衡量一个国 财 ( 收 )分配 公平程度,最小为


0,最 为1。计算基尼 数可以看 资产,也可以看年收 ;可以以个

人为计算和比较单位,也可以以 庭为单位。所有这些数据都是

,但不会 相同。就 传 效绩 数一样,基尼 数只是一个


作比较 工具,其数字本 并无实质 义。在一个 庭财 等 国

里,基尼 数为0;与此相反, 一个国 所有财 都集中在一个

庭里,那么这个国 基尼 数等于1。 已 猜 了,一个国

基尼 数越接近于1,那么这个国 财 分配就越不公平。根据 国中
局提 数据(顺 一句,这可是一个巨 数据收集 ),

国 基尼 数为0.45。那又怎么样?

将这一数字放 实际 中,我们就可以得 息。 ,瑞

典 基尼 数为0.23,加 为0.32,中国为0.42,巴西为0.54,南
[1]
为0.65。 观这些数字,我们 觉 国在收 公平分配方

相对落后, 比 国 都要 糕。我们同样可以对不同时 收

分配 公平 进行比较,1997年 国 基尼 数为0.41,但在接下
10年 ,基尼 数就上升 了0.45(最近一次 自 国中 局 数据

是在2007年),这就客观地告诉我们在这10年 时间里, 国虽 变得

更加 裕,但财 分配也变得更加不公平。现在我们再 看一下其他

国 在这一时 基尼 数 变化 ,加 在过去10年中 收 分
配 基本上 持不变;瑞典 济虽 在过去20年 时间里得 了长

发展,但其基尼 数却从1992年 0.25降 了2005年 0.23,也就是

瑞典不但变得更为 裕,其社会也变得更加公平。

基尼 数是否就是社会分配公平程度最 衡量 呢?绝对不是,

正 传 效绩 数也不是衡量四分卫比赛表现 一样。不过,
基尼 数确实以一种 捷易 形式为我们提 了一个重要社会现

一些宝贵 息。

我们 地又回 了 文中所提出 那个问题: 习 计 义是什

么? 计 帮助我们 数据, 数据只不过是包裹着华丽外衣


息。在很 时 、很 事 上,数据不仅 碎 且并 那么重要,比

比赛数据 计;但有 时 数据却 为 打开一 洞 人类存在本质

窗 ,比 基尼 数。

但是,正 所有 息宣传片都会 出 :这不是所有 ! 席


济 范里安在接受《 约时报》采访时曾 ,在未 10年 计

将会成为“性 业”。对此我不得不承 , 济 有 时

对“性 ” 确实 同寻常。但我们还是 看看下 这些彼此不相

干 问题:

我们 何确 那些在 中作弊 ?

飞(Netflix)是 何知道 喜欢 影类 ?
既 不 对人体进行 发 ,那我们 何才 得知哪些 质

为会 发 ?

祈祷真 让 人 改善吗?

从顶尖 毕业是否就 味着更 济收 ?

是什么推 了自闭 发 ?

计 帮助我们回答这些问题(至少也会加快我们 决这些问题
步伐)。这个世 正在 造出越 越 数据, 且速度越 越快。但

是正 《 约时报》所 出 ,“数据只不过是知 原材料”。无

是在寻找被低估 运动员,还是在更公平地分配教师工资 问题

上, 计 都是我们分 息获得有 义 最有 工具。下 ,我


们就 快速了 一下 计 是 何赋予原 数据以 义 。

描述性数据——击 与 分

得分是一个描述性 数据, 击 也是。对于绝 数

国 体 迷 ,从5岁开 ,他们就已 精通这些赛场上 描述 计


了。在体 以及 活中 其他领 ,我们 数字 息。

运动员米奇· 底有 ?他 击 达0.298。对于一个 迷

,这就是一个 有 义 陈述、一个 常耀眼 成就,这个数字囊


了他长达18个赛季 业 涯(但我却觉得有那么一点 沮丧,

一个伟 运动员一 斗 不过就是一个数字)。当 , 迷

们也承 , 击 这类描述性数据在 一个运动员 价 时,具有


其他衡量 不可比 优 。

在 国,衡量一个 中和 业表现 方法是计算平 成绩点

(GPA),通 点 就是 在 平 成绩。 一门 成绩为

A,那么就可以获得4点,B是3点,C是2点,以此类推。当 中毕业 申

请 、 毕业 找工作时,GPA就是 价他们 潜 一个方 快


捷 。一个GPA为3.7 显 要比另一个GPA只有2.5 实

强,这就 得GPA成为一个受人欢迎 描述性数据,不仅计算 易、

易, 且对不同 进行比较也很 易。

但这一衡量 并不 。GPA没有反映不同 所选 程 易程度,


设一个GPA为3.4 选 都是相对没有 性 , 另一名GPA

只有2.9 程表里尽是微积分、 这类 ,我们 一口

优 吗?我以 所在 中就 图 决这一问题, 比

较 程会有额外 加分,这些 程 末成绩为A,那么就会有


5点 奖励, 原 4点。但这也带 了新 问题,我 亲很快就

反应过 ,在新 GPA计算方法下,对于一个选了很 加分 程

(比 我),其他普通 程就算 最 ,也就是 了A,最终


平 分也会被 下 。因此,我 长不 我在 中选修 ,因为
即 我 ,也有可 会因为这门 错 进 顶尖 会,
进 断送了我成为 销书作 程。但不 开 也是不行 ,于

是 自己掏钱送我去一 私人 开 ,那个暑 晚上我基

本都是在 里度过 。

很 吧?但本书 主题之一就是,对于描述 计 过分 会带

导性 导致不良行为。上一句话我原先 短 是“过分简化
描述 计 ”,可后 我把“过分简化”给 掉了,因为这个形

是 余 ,描述 计 存在 义就是简化,因此不可避 地会丢 一

些 和细节,任何一个数字工作 对此都要心知 明。

样数据 决 问题

有 少无 可归 人在芝加哥街 流浪?已 人 久过一次性 活?

这些问题看上去 不相及,但事实上 们都可以通过对基本 计工

具 运 予以 答(虽 答 并 那么 )。 计 一个核心功
就是 中已有 数据进行合 推测,以回答那些我们还未掌握所有

息 “ ”问题。简 之,我们 “已知世 ” 数据

对“未知世 ”进行推断。

那么,我们就从“流浪 ”这个问题开 。对于一个 都市 ,要把

活在其中 无 可归 一个一个都数出 ,不仅成本 昂, 且在实


际操作中也困 重重。但这又是一个 常重要 数据, 为当地政府

开展社会救济、向州和 邦政府争取拨 以及在 国国会上获得支持提


据。一种重要 计 法就是 样,也就是在一小片区 进行

数据收集,比 10 个街区, 后再根据得 数据进行推断,对整个

市 流浪人口作一个明智 断。 样所 资源要比 计数少得


, 得当,同样可以获得 确 。

也是 样 一种形式。由一 数量 庭组成 样本 代表

所属 体人口 观点,舆 研究 会与这些 庭取得 ,针对 一

个特 事件 选人 问 庭成员 看法。显 ,这要比 整

个州 国所有 庭要简单。盖洛普 和研究 为,一个符


合 计 方法、包含1000个 庭 样本 代表整个 国 所有 庭,

两 基本 持一致。

通过这种方式,我们 计出了 国人性 活 、对 和方式。20世

90年代中 ,芝加哥 国 研究中心(NORC)针对 国人性


行为开展了一项 常雄心 研究,其选取了 量具有代表性 国

成年人作为样本, 就是基于这些人 对各类问题时所 出 反

应和回答得出 。 读下去, 证会在第10章找 这项研究


。 真 ,现在有几本 计 著作 向 承诺这些?

、 险与 作弊

从长远看,赌场 是 挣 钱, 且无一 外。这并不是 赌场 时

刻都在赚钱, 当赌场里 钟 和口哨 响起时,就代表 位幸运


赌客刚刚 了几千 。整个博彩事业是建立在 遇游戏之上 ,也
就是 任何一次 掷和 牌 牌都是不确 。但与此同
时,相关事件 潜在 又是已知 ,比 “ 杰 ” 中21点 “轮

盘赌” 色 是固 。当这些游戏 对赌场有 时(赌

场当 不会亏钱),不管场 钟 和口哨 有 闹, 赌客 里

赌注积 得有 ,赌场永远都是最终 。

这一 计现 在 活中所产 影响远比在赌场里 得 。 公司会


对 些最不 遇 险进行 估,公司 管 层都知道 要

避 这些 险是不可 ,就 赌场没法 证赌客们 一 牌都会输

一样。但是,任何一 对不确 因 公司都可以通过商业流程 设


计 管 这些 险,将从环 灾 不合格产品等一 不 因 出

现 降至可接受 范围 。华尔街各 公司 常会对 们 资组合

进行 险 估, 分 虑不同 景 出现 以设计出合 应对方


。2008年金融危 发 部分原因,就是一 之 被 为是 不可

发 市场事件都成为现实,就 赌场里 一位赌客在 一晚同

时 中 奖一样。我会在之后 章节里向 释,其实华尔街 资

都存在 陷,这些公司 估 险 数据也过于局限,但此时此


刻,我 是,任何一个 险 估 都必须以 作为基础。

对 以接受 险, 个人和企业无法 避,就会通过其他方式寻

求 护。 险业应运 ,通过收取 费, 险公司为其客 在遭遇

祸、火灾等不良事件后提 护。 险公司并不是通过消除这些不良
事件 挣钱,因为 祸和火灾 天都会发 , 至汽 有可 会一下
撞进房 里引起火灾。 险公司收取 额 费, 于支付 祸、火灾

等 料之中 险 金, 后往往还会有 量 余。( 险公司还

可以通过宣传安 、在游泳池周围装设围 、为 个卧室安装


探测器等方式 少 损 。)

在有些 下 至可以被 断 作弊。一 由 国

估 (SAT) 一位开发 创办 安 公司,专注于提 “数据

取证” 务,为客 寻找 作弊 蛛丝 迹。举个 ,在


点进行 , 名 以同样 答 答错同一道题 是 少见

,通常发 只有不 百万分之一, 有类似 出现,该

公司就会予以 记。其数 逻辑源自一个事实,即当 部分 对 道

题都给出了正确答 时,我们并不会 小 ,因为这是他们应该


事 。这些 有作弊 可 ,但他们 一己之 对题 可 性

更 。但是当这一 答错题 时 ,他们 错 答 不应该是

一样 , 错 答 一样,那么他们就有可 是相互 袭(
通过短 息分享答 )。此外,还有几种 会引起该公司 注 ,比

在一场 中, 在 题上 正确 于 易 题(这 味着

他们有可 提 就知道答 );又 在一场 中,收上 答题卡


上“错改对” 涂改 迹要明显 于“对改错”(这 味着有可 是老

师 人员在 束后对答题卡动了 )。

当 , 也不 看出 也有其局限性。一 在 道题上出现相

同 错 答 有可 是巧合,事实上, 参与 估
越 ,我们就越有可 为这类 实属巧合。并不是 我们一旦在
计时发现异常 ,就 上 存在作弊现 。 自亚特兰 德

尔 ·金尼在2008年中了价 100万 彩票, 知 了2011年又中了

价 100万 彩票。这种同一个人连 两次中 奖 只有25万亿

分之一,可我们不 仅 几乎为零就以诈 将金尼先 关进


(但我们 可以 一下,他是否有亲 在彩票公司工作)。 就

是武器库里 一件武器, 要 有较强 断 。

哪些人最有可 成为 怖分 ?

吸 会 发 吗?虽 现在我们已 有了答 ,但得出这个答 过

程却要比 数人 中 杂 。 要求证一个科 设,科

方法要求我们必须进行控 实 ,也就是要有一个对 组,除了要求证

变量以外( 吸 ),实 组和对 组之间不 有任何不同。 我


们在这两组 观 中发现了明显 不同( ),那么我们就

推断这个变量是引起不同 原因。但是,我们不 以人为实

对 。 我们 设是吸 发 ,那么就不 随 两组
毕业 ,将其分为吸 组和不吸 组, 后在年后 同 会上打听

得了 —这是不道德 。( 我们 设是 种新研 药品

法 改善人类 康,那么我们可以在人 上进行控 实 。我


[2]
们不 在明知可 会带 不良后 提下以人为实 对 。)
现在 会 ,我们 没有必要在一开 时 就进行这项可 会

违 伦 实 。 观 吸 所带 影响?很简单, 过这套令人

晕目眩 方法 ,直接 往那 毕业 20周年毕业 会,去看看参加


会 人数有 少就可以了。

不行。吸 和不吸 除了吸 与否方 不同,在 活 很 习

方 都会有差异。比 ,吸 人 常会有更 嗜 , 酗酒和暴饮

暴食,后两 也会给 康造成损 。就算在20周年 会上那些吸


康 尤其 糕,我们也不 这些都是吸 造成 ,也有可 是他

们 其他坏习 带 。 且在数据 采集上我们也会遇 烦,要知

道数据是我们作分 据,但那些吸 友 上了严重

, 有可 会 席20周年 会(已 离世 吸 就更不可 在 会


上 了)。因此,由于那些 康 良 友是最有可 出现在

会上 ,任何基于出席 康 分 和推断(吸 其他变量)都

会是有 陷 , 且 离毕业 时间越长,比 40年 50年,这种 陷


就越严重。

我们不 对待实 室里 小白 那样对待同 ,因此, 计 更 是

侦探们 事。数据里隐藏着 和 ,沿着这些 和 ,我们

最终 得 有 义 。就 那些让人印 深刻 类
, 《 现场 : 约篇》, 中展现有 探和取证专

不放过丝 细微 证据— 蒂上 DNA、苹 上 咬 、 座 上 一

根 维, 后再根据这些证据顺藤摸 地 住 残 。这部 最吸
引人 地方就在于,里 专 们并不是通过那些常 证据, 目击
证人、 控录 等 坏人 , 是 助了科技 。 计 基本上也

是干这些事 , 乱无章 数据就 是 现场, 计分 员就是

探,通过对原 数据进行分 和加工得 有 义 。

在读 本书第11章 之后,我希 会对《 现场 :回归分

》产 兴 ,因为这部“ ”与其他类似 动作 匪 有一点 不

同。回归分 是研究 分 两个变量之间关 工具, 吸 和


,但同时又要 证其他重要因 及其影响不变, 饮食、运动、体
重等。 在报纸上读 天吃一个 可以 少 肠 发

, 不 要杞人忧天地 着有一 不幸 人被关在 邦实 室


个地下室, 天被强迫着吃下 , 在 里 控 组则
可以享 培根和 蛋。事实上,实 人员会对数以千计 人进行详尽

息收集,包 他们吃 , 后 回归分 方法 成


两个关键步 :(1)量化吃 和 肠 之间 关 ( ,在其
他影响 发 因 相同 下,吃 人 肠

发 要比不吃 人低9%);(2)量化吃 和 肠 发
下降之间 关 只是巧合 ( 真 成立,则否 了上述关于饮
食和 康之间关 发现,这对于该实 无 是一个逆 )。

当 ,《 现场 :回归分 》里 主演们都是 ,比现实

活中 这些数据 们要 心 目得 。这些 (所有人


看上去都只有二十三四岁,但都 人地获得了博 位)会对 量数据
进行分 ,通过 最先进 计 工具 回答重要 社会问题:什么
是打击暴 最有效 武器?

哪些人最有可 成为 怖分 ?在本书随后 里,将会为 介

一个 念—“具有 计 义 ”发现,也就是 ,通过分 发现 两


个变量之间 并不只是单 巧合。对于 研究人员 ,这类
发现在 计 上就代表“确凿 证据”。在那部 中,我看 一名研

究人员在计算 实 室里“ 灯 ”(因为白天 作为沙滩排 队


队员代表 国队参加 运会),在这名研究员把 计分 打印出

之后, 终于找 了一直以 以求 :在 数据集合里,


有一个 为可 会是 常重要 变量与自闭 之间有着“具有 计
义 ” 。 必须 上与同事们分享这一重 突破!

这位研究人员 着那页纸飞 厅,但由于 穿着 和一件过于

色短裙,所以速度稍微受 影响。 了 友
—一个 材 硕、 肤晒得 帅哥,对于一个 要在地下实 室里
天工作14个小时 人 ,他是怎么 此 康 呢?这名研究人

员把 计 给 友看,他 捋了捋下巴上修剪得整整
山 ,从 屉里 出一把格洛 18 自动 ,插 位于腋下
套里, 了 上价 5000 波 西装(我又忍不住 问一句,

对于一个起 年薪才3.8万 年 人 ,这 西 是不是贵了一


些?)。随后,这两位回归分 专 迅速 近他们 上司—一位刚刚
历了 败 和戒酒 年迈老兵……
吧,有这么精彩 节铺 , 上述 计研究 重要

性,但其实就算没有 努 , 计研究本 也应该是精彩万


分 。所有我们关心 社会 都少不了对 量数据集合 性分
(在很 时 ,相关数据 收集是 常 费财 和时间 工作,但在分

过程中又起 了 常关键 作 ,有关这一点会在第7章 中


)。刚刚关于《 现场 :回归分 》这部 描述,我
会对 中 人 有所修 ,但对他们所要 对 那些问题 重要性,我

是一点 都不 张 。有一篇 文 就是以 怖分 和“人 炸


弹”为主题 , 这类 题要是直接以人( 实 室老 )作为研究对
,是很 获得有 。我所在研究 院 一位 计 教授 了

一本书,叫作《 怖分 从何 ?》,该书对 怖主义袭击进


行了数据 计,得出 之一是: 怖分 不是 端 困 人,受教

程度也不低。这位普 斯顿 济 阿兰· 格
道:“ 怖分 通常 自受过良 教 中产阶级 收 庭。”

这是为什么呢? 吧,这暴 了回归分 一个局限所在。我们可以通


过 计分 确 两个变量之间 强 ,但却无法 释为什么存在

着这样 ,在 些 下,我们也无法确 这种 是否为因 关


,也就是 ,不知道其中一个变量 变化是否真 引起另一个变量
变化。在 怖主义 中, 格教授推测,由于 怖分 行动

一般都带有政治目 ,所以只有受过 等教 和 实 人才有最


动 去改变社会,这些人尤其忍受不了 些政府部门对自由 压 ,
从 向 怖主义。根据 格教授 研究,在其他因 相同 提
下, 怖活动 出现 国 往往是那些实行 压政策 国 。

以上 这个讨 又把我们带回了那个问题: 习 计 义是什么?


义并不是要去 数 计算题, 在 友和同事 耀 级

计技巧, 是通过 习知 清我们 活。

计数字 后 与真相

即 是在最 下, 计分 也很少告诉我们“真相”。我们通

常所 ,只是 并不 数据 就事 事,因此,我们 会看
有一些态度严 不同 些 计 推 , 最为基本
就是对 要 答 问题本 产 质 。体 们对于 是“史上

最 运动员”这一问题似乎永远都达不成共 ,因为对于“最
”二字从 就没有一个客观 义。令人眼花 乱 描述性数据可以
从 些 度对这个问题进行回答,但 是无法给出一个令所有人都

最终答 。正 本书下一章即将 ,还有很 具有深刻社会 义


问题都成为上述 牺 品。 国中产阶级 济 康 底出了什

么问题?问题 答 取决于我们 何 义“中产阶级”和“ 济


康”。

我们所 收集 数据以及所 进行 实 种类 归是有限 。阿兰·


格对于 怖分 研究也没有 张 几十年 时间对几千名年

人进行 ,从 确 他们中 哪些人最后变成了 怖分 ,因为这根


本就是不可 实现 。我们同样也不 创造出两个 相同 国 ,其
中一个国 在政治上实行 压管 , 另一个没有 压政策, 后比较
发 在这两个国 自 式 炸数量 少。即 我们在人 上进

行 量 控 实 , 要成功也不是一件 易 事, 且哪 那么
资金?针对我们之 所提出 那个有关祈祷是否 少 后并发 问

题,研究人员专门对此进行了 分 ,在这个过程中 费了
整整24万 (至于 何,请 心读 第13章就知道了)。

国国防部 部长唐纳德· 斯菲尔德有一句名 :“ 争是为了与


真实存在 敌人作 , 不是与 敌作 。”不 何看待 斯

菲尔德 这句话(以及他对伊 争 读),我们在研究领 同样


得上这句话。我们运 最 数据、 和资源 进行 计分 ,但
这一过程并不等同于加法 除法,正确 技 不一 得 “正确

”答 , 也不一 比人 更加 确和无 可击, 计分 更 是


成一个 探所要干 工作(我可没有为《 现场 :回归分 》
打广告 思)。数据 是 要告诉我们一些 息,但是 对这些

息, 明又 实 人 常有不同 看法。

但 告诉过 ,只要是 计 人就一 是 明又 实 呢?正


之 所述,本书是向1954年发行、销量 过百万 典作品《 计数字
会撒 》致敬 。现实就是, 既可以 计数字撒 ,也有可 因为

计数字 不小心 错。无 是哪种 , 计分 所包含 数 精度


都会被亵渎。本书将会带 那些最常见 计 方 错 和曲
,这样 就不至于 了错还被蒙在 里。

那么,让我们再次回 本章中反 出现 那个问题: 习 计 义

是什么?

量 数据。

出正确 决 。

回答重要 社会问题。

并运 那些 改善我们日常 法 ,卖更 尿片、


……

作弊 ,让作 受 法律 审 。

价政策、项目、药品、医 程序和其他创新 有效性。

揪出那些运 相同 计 干坏事 败类。

在 这些事 同时,还 得体地穿着波 西装 色 短裙

散发 ,那么 将会成为《 现场 :回归分 》 下一位明


星。
[1] 基尼 数有时 会乘以100得 一个整数, 文中 , 国 基尼 数也可以是

45。

[2] 医 伦 远要比这有 和 杂,这里只是进行了 度 简化和 。


一直 买 一 连衣裙,商场售价为4999 ,先降价25%后再提价
25%, 算出这 连衣裙 最终售价是 少吗?

让我们先 思 两个看上去 不相干 问题:(1) 国中产阶级 济


康 出了什么问题?(2) 是有史以 最伟 运动员?

第一个问题 为重要,几乎 成了 次 国 选举和社会运动 核

心。中产阶级是 国 心 ,这一 体 济 是整个国 济运行


康与否 关键性 。相比之下,第二个问题就显得微不 道了,但

会持有不同 见。这两个问题 共同之 就在于,当


运 数字和数字运算 原 数据 描述 计 时, 们都
明其优点和局限所在。

我 证明德瑞 ·基特是一位 么伟 ,我可以先让 坐

下, 后向 道 基特在 场 业 比赛中 一次击 ,这就


是原 数据, 且 要花很长一 时间 消化,因为基特为 约洋基
队效 了17个赛季,上场击 次数 计达 了9868次。

我也可以告诉 ,在2011赛季 束 时 ,德瑞 ·基特 击

为0.313,这是一个描述性数据,即一个“ 计量”。显 易见,击


是对基特参加 所有17个赛季 简化 计,不仅易于 , 且简单,
但所 传达 息却十分有限。 运动专 们 中还有很 在他们

看 比击 更有价 描述性数据。史蒂夫·莫 是一 为客 提
量原 数据 息 决方 公司 老 ,之 我与他通了 话,
特地向他咨 了几个问题:(1)哪些是 价 天才最重要 数据?
(2) 是史上最伟 ?在介 景之后,我会向 公布莫

答 。

现在让我们回 那个更加重要 问题上 , 国中产阶级 济


康 。当 我们 找 类似于击 这样 简 赅 , 至更
济衡量 ,那是最 ,我们 要一个简单且 确 数字,

明一个典 国工人最近几年 济 ,那些我们称之为“中


产阶级” 人 底是更 了、更穷了,还是在原地 步?一个合 答
— 不会有“正确” 答 —就是,计算一代 国人( 约为30

年) 人 收 ,观 其变化趋 。人 收 是一个简单 平 数:
收 除以人口数,这样得出 就是 国 人 年收 从1980年
7787 上升 2010年 26487 。 看,真是一个 得庆祝 成就!

但只有一个小问题,我 计算方法在技 上是正确 ,但是对于我一开


提出 那个问题 ,却是 错 。 先,上 数据没有 虑
通货膨胀因 ,1980年 7787 相当于2010年 约19600 。但仅进

行通货膨胀因 还不 ,更 问题是,我们 要知道 是普通


国人 收 , 不是泛泛 人 收 ,这两 有本质上 区 。

人 收 仅仅是将整个国 所有人 收 加起 再除以 人口数,我们


无法从这个计算 中得知各阶级收 所占 比 ,无 是1980年还是

2010年。正 “占领华尔街”运动 示 所 出 , 于收 排行
顶端 那1% 人,他们收 炸性 长 显著地 动人 收 水平
整体提升,但同时不 要往剩下 那99% 人 口袋里 放一分钱。也

就是 ,在普通 国人 活陷 水深火 同时, 国 人 收


节节攀升。

与之 有关 问题一样,这次我又请教了专 ,咨 我们应该 何
看待 国中产阶级 济问题。我找 了两位知名 劳动 济专 ,其

中包 国 巴 级 济顾问, 问他们会采 哪些描述性数


据 价一个典 国人 济 是否良 。是 ,作为读 , 也
会读 他们 答 ,不过在那之 ,我们还是要对描述 计 有一个

体 ,这样才 更 地 专 观点。

从 收 ,对 量 息进行归纳是 数据时最基本 任务。 国


有3.3亿名居 ,一张记录 位 国人 姓名和收 表格包含了我
们衡量这个国 济 康 所 所有 息,但这张 息过量 表格

其实相当于什么都没有告诉我们。这就是让人觉得讽刺 地方: 常是
数据越 ,事实越 糊。因此,我们 要简化,将一 杂 数据序
少为几个 起 描述作 数字,正 运会体操比赛中,我们

将一套 度组合 杂动作浓 为一个得分:9.8。

消息是,这些描述性数据为我们提 了一个针对 一现 可操作、


有 义 ,这也是本章所要 。但坏消息是,任何一种简化都会

临被滥 危险。描述性数据就 是在 交友 站上 :虽
一 都是 确 ,但同时也相当具有 导性。
设 在上 ,此刻正无所事事地浏览 站,无 间 浏览了一篇报

道,是关于 国 乐 名 金·卡 和 业 里斯·亨弗里斯


活 ,这篇报道里详细记录了他们两个人72天“短命”

点点滴滴。 正津津有味地看 他们 第7天 活时, 老板 里


着两份厚厚 文件出现在 办公 。其中一份文件包含了 所在
公司 一年售出 57334台激光打印 修 息( 售出一台打印 ,

文件中都会记录下这台打印 修 质量问题和返修次数);另一
份文件记录了公司最主要 竞争对 在 一年售出 994773台激光打印
修 息。老板 让 对两 公司 打印 质量作一个对比。

幸运 是, 阅读卡 活报道 这台 里恰 安装了基

本 计软件包,但应该从哪里 呢?听从直觉 召唤一般 是没


错 :描述任务 第一步通常是估量 套数据 “中间位 ”,也就是
计 所 “集中趋 ”。在比较 过程中, 所在公司打印

质量体 体 何?对于数据分布 “中间位 ”,最基本 估量方法


就是求平 数,具体 这个 ,我们 要知道 公司和竞争对 公
司平 台打印 质量问题分 有 少个。简单 , 先数出 修

所有记录在 质量问题,再除以打印 销售 数就可以了(相


同 一台打印 在 修 可 会出现 个质量问题)。之后再算出另
一 公司 数据,这样就 得出一个重要 描述性数据:已售打印

平 质量问题数。
设竞争对 售出 打印 在 修 平 台反 质量问题数为2.8
个, 公司所售打印 平 质量问题数为9.1个,这样 直白了
吧?通过计算,两 公司共计100 万台打印 息就被 提 浓 为

问题 核心所在: 公司 打印 常出现问题。现在 就可以给


老板发一封简短 邮件, 数据告诉他两 公司打印 质量差 ,
后点开之 页 看那位名 金·卡 后第8天 活。

, 也可以等会 再浏览 页。刚才 数据分布 “中间位

”时我并没有展开,其实所 平 数、平 在这里是有一些问题


,即 们 易受 远离中心区 “异常 ” 干 出现 真。为

了 让 更 地 ,我 举个 ,在西雅图 一 中 酒吧
吧台 ,坐着10个人,他们 年 平 收 都是3.5万 ,也就是 ,
这组人 人 年收 为3.5万 。这时 ,比尔·盖茨 进了这 酒

吧, 膀上立着一只会 话 (其实这只 与这个事 一点 关


都没有,之所以要提一下 是 给这个 加点 乐 ), 设
他在这个 中 年收 为10亿 。当比尔·盖茨在吧台 第11把

上坐下后,这组人 平 年收 迅速上升 了将近9100万 。


很显 ,之 那10个人丝 没有变得更 有(尽管比尔·盖茨很有可
会帮他们付一两次酒账,但仅此 已)。 我 吧台 这 人平

年收 为9100万 ,这句话在数据上是正确 ,但同时也相当具有


导性。这里不是一个亿万 会 常光顾 酒吧,只不过正 有一
收 不 普通人坐在了比尔·盖茨和他 会 话 旁边。平 数

必须对“异常 ”有 敏 性,这也是为什么我们不应该 人 收
衡量 国中产阶级 济 康 。因为在收 分配 顶端,有着
一 收 暴涨 国人—公司 管、对冲基金 ,以及 德瑞 ·基

特这样 运动员,普通 国人 收 会被这些巨 们 光环掩盖,就


一 普通人坐在比尔·盖茨 边一样。

出于这个原因,我们还有一个数据可以 表示分配 “中间位 ”,


但与平 数有所不同,这个中间位 就是中位数。中位数正 将一组数

字一分为二,1/2位于中位数之 ,另外1/2位于中位数之后( 遇上
一组数字 数量为偶数,那么中位数就是中间两个数 平 )。回
刚刚酒吧 那个 ,原先坐在吧台 10个人 年 收 中位数为3.5

万 ,当比尔·盖茨和他 座之后,这11个人 年收 中位数


为3.5万 。 将他们 收 少 排座 话,那么坐在第
6把 上 人 收 就代表了整组人收 中位数。 此时沃伦·巴

菲特 了进 并坐在了比尔·盖茨 边,他们 中位数还是不会改


[1]
变。

一组数据分布中没有特 离 异常 ,那么 们 中位数和平

数将会是差不 。下图中,我 了一张对 公司打印 质量数据


计图, 要特 注 是,我 出了“ 数分布” 数据。 台打印
出现质量问题 次数被 次排 在X 上, 根 度代表售出

这 打印 中出现相应数量质量问题 打印 占 数 百分比,即Y 上
数, ,在 修 ,36% 打印 出现过两次质量问题。这一数
据分布涵盖了所有可 出现 质量问题 数量,包 零故 ,因此所有

数相加 等于1( 100%)。

图2-1 对手公司打印机质量问题频数分布
由于上图 数据分布 基本上是对称 ,因此平 数和中位数两 相
对接近。坐 右边还有一小部分故 数量较 打印 ,这些异常
将会 平 数,但是对中位数没有影响。 在 将质量 计

发给老板之 , 决 对两 公司打印 质量问题求一下中位


数,在敲击几下键盘之后, 得出了 。对 公司 质量 诉中位数
为2, 所在公司 这一数字则为1。

瞧怎么样? 所在公司 台打印 质量问题 中位数实际上要小于

对 公司。此时,由于卡 活已 开 变得 乏味, 且
也深深地被 刚才 发现所吸引,于是 忍不住为自己公司 质量问
题 了一张 数分布图。
图2-2 你所在公司打印机质量问题频数分布
从图中可以清 地看 , 所在公司 产品并不存在一个普遍 质量问

题,但却有一个 烦:一些数量不 打印 存在 量 质量问


题。这些异常 抬 了质量问题 平 数,但没有对其中位数造成影
响。从 产 度看,更为重要 一点是,公司无须更新 重组整个

产流程 产设 ,唯一 要 就是 这 问题很 质打印


,找出源 并予以 决。

无 是中位数还是平 数,要求出 们并不 ,关键在于根据具体

确 哪一个“中间位 ” 更 确地反映问题 实质。与此同时,中


位数还有一些有 “亲 ”,正 我们之 已 讨 过 ,中位数将
一组数据从中间分为两部分,这组数据其实还可以 分为4部分,我们

称之为“四分位数”。第一四分位数由 于底部 25% 数据 成,往后


25% 数据 成了第二四分位数,以此类推。同样 ,收 分配数据还
可以分为“十分位数”, 组包含10% 数据。 收 属于 国人

收 分配顶层 那10%,那么这 味着 要比90% 国人挣得都 。


我们还可以细分下去,将收 数据分为100份,也就是“百分位数”,
个百分位数都代表1% 数据,也就是 ,第一百分位数表示位于底部
1% 人 收 ,第99百分位数代表收 分配数据中收 最 那1%

人。

这类描述性数字 在于, 们描述了 个具体 在与其他数据进


行比较时所 位 。 我告诉 , 在阅读 中 成绩
于 级 第三百分位数(有97% 分数比 ), 该即刻

人应该在 习方 辅导 。 没必要知道任何有关
本 ,以及 在 中答对了 少道题目。一个以百分位
数显示 成绩就已 告诉 , 得分在所有 中 排名。

题目比较简单,那么 数 都会获得一个 分,
答对 题目数量还是少于其他同 ; 题目特 ,那么所有

正确 都不会 , 答题正确 比其他 要更低一


些。

现在我 穿插介 几个有 计 。一个“绝对”分数、号码 数


字具有一些与 义,比 ,我在一场18洞 尔夫 比赛中打出

了83 ,这就是一个绝对分数; 那天 温正 是14摄 度,这也


是一个绝对数字。通常 ,在没有任何 景 额外 息 提下,绝
对数字 被 。当我告诉 我在18洞 尔夫 比赛中 成绩是83

时 , 不 要知道其他 尔夫 员取得 成绩,就可以对我


表现给出一个 价(除 那天 环 为 ,又 场地 件有所限
)。又比 ,在一场 尔夫 锦 赛中我 排名是第9位,这是一个相
对数据。一个“相对” 数字只有在比较 于一个更 景中时

才有 义,比 有8位 在比赛中发挥得比我出色。绝 数


化 给出 都只具有相对 义, 我告诉 伊 诺伊州 小
一个三年级 在满分为60分 州 数 中 成绩是43分,这一

绝对分数并没有太 义。

但是,当我将其 换为一个百分位数,也就是将这一原 分数代 伊


诺伊州所有三年级 数 成绩中作对比,那么含义将会得
丰 。 43分 成绩 于第83百分位数,就代表这个 成绩要

优于 州 部分 同 人。 他 于第8百分位数 位 ,那么他真
要加点 油了。在这个 中,百分位数(相对分数)比答对题目 数
量(绝对分数)要更有 义。

差也是一个 帮助我们在一 杂乱无章 数字中发现真

计数 ,我们 衡量数据相对于平 分散程度。根据 差,


我们可以知道所观 数 分散 。 我要收集 飞往波 顿
航 上 250名乘客 体重数据,还有250名有资格参加波 顿 松比

赛 运动员 体重, 设这两组人 平 体重差不 都是155磅(约为


70.3千 )。任何一个曾 在 挤不 飞 里费劲地挤进自己座位和

争 人都清 ,一 典 商 客 上有 人 体重都 过155


磅,但同时 也 回忆起在这些乱哄哄、人挤人 航 上还有不少
啼哭 和不听话 ,他们 活量不小,但是体重就很 了。
在计算航 上乘客 平 体重时,尽管坐在 边 运动员有 达
320磅 体重,但平 体重仍有可 被 排正在尖叫 和后排正在

座 6岁小 体重 低。

目 为止, 我们所 描述 计 工具 看,航 乘客和 松运


动员 体重几乎是相等 ,但事实并 此。是 ,两组人 体重有着

相差无几 平 数,但是航 乘客 体重 离平 数 差要远 于


松运动员,也就是 体重分布要更加分散。连我8岁
都会 , 松运动员们 体重看上去都差不 ,但飞 上 乘客就很

了,有 在怀里 ,也有 得离 人。航 乘客们 体


重“更加分散”,这是在形 两组人 体重时 要提 一个重要特
征。 差这一描述性数据 让我们 一个 立 数字 表示 离平

数 离散程度。 于计算 差和方差(另一个由 差推导


于衡量离散程度 ) 公式在本章后 中可以找 。现
在, 先让我们 衡量离散程度 重要性。

我们再 作一个 景 设。自从被提 为北 地区打印 产品 质量

后, 就一直 ,于是 决 去看医 。医 给 了血,几


天后他 助 在 话答录 上 ,告知 HCb2 (一个虚
血液 )为134。 立刻打开 ,搜 这个年 人 HCb2平

是 少, 页上显示是122( 且中位数也几乎是这个 )。我


天! 换作我,我可 就要开 遗嘱了, 后噙满泪水地给我
、 人、 和 友们 告 。 这些之后,我会 自己还有
什么未 成 心 。我要去 一次伞,还要 我余下 时间 一部小

。最后,我还要 一封令人 泪 下 控诉 给我 老板, 狠狠


措辞把这几年在他那里受 都发泄出 — 且从 尾都要
英文!

,上 这些事 中没有一件是必要 (那封发给老板 带 后

可 会很严重)。当 回拨医 话,打算安排 临终事宜时,


他 助 告诉 , 在正常范围 。但这怎么可 呢?“我
HCb2 比平 出12!” 不断地 话那 人重 着这句

话。

“HCb2 差是18。”对方淡淡地 了一句。

这又是什么?

HCb2 与其他 数 现 ( )一样,都存在天 差异。尽管


这一虚 平 为122,但 数 康 人体 时得 都会

有 有低,只有在HCb2 特 特 低时才会对 康 成 胁。那


么,对于HCb2 ,上下浮动 少才算是数 异常呢?正 我们之
提 , 差是衡量离散 ,反映了分散在平 周围 数据

合程度。对于 典 数据分布 ,有很 比 数 都位于


们 平 数 个 差范围以 ,也就是 ,这些数 有 比平
,有 比平 小,但都是在一个正常范围之 。举个简单

, 国成年 性 平 为70英寸(1.778米), 差约为3英寸


(0.0762米),这 味着有很 一部分 国成年 性 在67英寸
(约1.7米) 73英寸(约1.85米)之间。

换 之,任何一个 介于上述区间 国成年 性都不会被 为


异常。让我们再回 刚刚那个困 HCb2 问题上。是 ,

是比平 了12个数 ,但还没有 过 差范围,这就 比


为72英寸一样—这没有什么 奇 。当 , 离平 两个
差 数 会 少,3~4个 差 数 就更少了。以 为 , 一

个 国成年 性 于平 3个 差,那么他 至少为79英寸


(约2米 )。

不同 体对 数据分布 离散 是不同 。可以这么 ,航 上250


名乘客体重 差要比250名 松运动员 , 将两组人 体重

数据 成 数分布图 话, 要比后 更“ ”(分散)。对于


任何一组数据 ,只要知道了平 数和 差,我们就 进行简单

计 分 ,得出一些可以 。比 ,我告诉 国SAT数


平 分为500分, 差为100,与 一样, 部分参加
成绩都会在一个 差范围 浮动,比 400~600分。那

么, 觉得又有 少名 成绩会 于720分呢?估计不会有很 ,因


为这比平 分 出两个 差还要 。

事实上,我们 不仅只是“ 人数不会有很 ”这样 回答。现


在就向 隆重介 计 里最重要、最有 、最常见 分布之一:正
态分布。数据 分布一般 都是对称 ,以平 数为中 呈现类似
于“钟” 形 ,我 对此应该不会 陌 。

正态分布可 于描述 常见 现 。 我们要给 米花 “

炸”过程 一张 数分布图,那么分布图 应该是:一开 时


只有少量 米粒 开, 秒可 只有一两颗 米粒 开;在10~15秒之
后, 米粒就进 了 “ 炸” 阶 , 后 地, 秒 开

米粒 数量又变少了,重新回 了一开 秒只有一两颗 米粒 炸


态。 国成年 性 分布也是对称 ,要么比70英寸 平
,要么 低, 且越接近平 ,人数越 。 一次SAT 都

过精心设计,以得 一个平 分为500分、 差为100 成绩 正态分


布。根据《华尔街日报》 报道, 国人 至连在 商场 都呈现
出正态分布,正对着商场 口 地方 数量最 ,也就是正态曲

“峰 ”,在 口左右两侧 数量逐渐变少,即曲 两端下滑


“尾巴”。

正态分布 “ ” 比迈 尔·乔丹在 场上 量、灵巧和优雅,


自于一个事实,那就是我们通过 义就 清 地知道,有 少数

位于平 一个 差 范围之 (68.2%),有 少数 位于两个


差 范围以 ( 95.4% ) , 还 有 少数 位于3个 差 范围以
(99.7%),以此类推。这听上去似乎挺 ,但事实上这就是 计

基础之一。本书将会在之后 篇章中 更深层次 问题时再对正态分


布展开讨 。
图2-3 正态分布
中间 那 代表平 ,通常由希腊字 μ表示; 差通常由
希腊字 σ表示; 色带 代表一个 差。

描述 计 常会比较两个数据 数量。 ,我比我 哥哥 1英寸,

今天 温比历史平 9摄 度等。这些比较之所以易于 ,是因


为我们 部分人都对其中所包含 数量单位并不陌 。当形 时,1
英寸并不是很 ,因此 可以推测我和我 哥哥 看上去其实差不

;相反 ,无 是在一年中 哪个季节哪个时刻,9摄 度都是一个


常引人注目 温差,因此我们可以 那一天比平时要 很 。但 我
告诉 , 品牌 片中A配方 钠含量要比B配方 31 ,除 恰

得很 关于钠 知 (以及该品牌 片 食 分量),否则上 这句


话并不 给 带 特 具体 息。又 我对 ,我 外 阿尔在
2013年比2012年少挣了5.3万 ,我是不是应该对他表示 心呢?阿尔

也 是一位对冲基金 ,5.3万 只不过是他年薪 一个零 。


在钠含量和收 这两个 里,我们都 少 景资料。赋予这些比较

数据 义 最简单 方法就是 百分比。 我 , 品牌 片A


配方 钠含量比B配方 了50%,我 外 阿尔在2013年 收 与2012年
相比 少了47%,是不是就更 易 了? 百分比 表示变化,可以让

我们有一种 刻度测量 觉。

在小 四年级 时 就已 会 何计算百分比了,所以
过接下 几 文字,我表示 ,但在此之 ,请帮我 一道简
单 练习题。 设 百货商场正在出售一 连衣裙,售价为 100

,随后该商场 将所有商品 价格都下 了25%。但这位


很快就被 雇了,原因就是有人举报他在一 酒吧里 比尔·盖茨喝
酒。新 将所有商品 价格又上 了25%。那么那一 连衣裙最

终 售价为 少? ( )100 话,那我建议 还是不


要 过接下 任何一 话了。

连衣裙 最终售价应该是93.75 。这不只是一个在 尾酒派对上

逗乐和 耀 问 把戏。百分数是一个 常有 工具,但同时也 易


产 混淆, 至具有 性。计算百分数差( 变化) 公式是这样
:(新数据-原数据)/原数据。分 (分数 上半部分)就是变化

绝对 ,分 (分数 下半部分) 作 是将这一变化与原数据进行比


较,也就是为变化添加 景。我们可以 这个简洁明了 公式 答刚刚
提出 那个问题。 任 将 价格为100 连衣裙 价格下

25%,那么原价100 25%就是25 ,这一折 导致连衣裙 售价降


为75 。将这些数字带 公式也可以得 相同 :(100 -75
)/100 =0.25=25%。

当连衣裙 价格为75 时,新 将价格上 25%,这里就是


人 易 错 地方。上浮 25%参 是连衣裙 新价格, 最开

价格,所以上涨 价格应该是25%×75 =18.75 ,最后 售价为


75 +18.75 =93.75 ( 不是很 人 为 100 )。这个
关键在于,百分数变动表示 是 个数字相对于其他事 变化

,因此我们最 先弄清 其他事 底是什么。

我曾 资过 室友开 一 公司。由于这是一 私营公司,因此在向


股东披 息方 并没有什么硬性要求。 眼几年过去了,我 这笔
资 命运 何,我 不知 ,我 这位 室友对于这个话题也是只字不

提。最后,我终于收 了一封 , 上 公司 润相比 一年提 了


46%。但 底提 了 少 , 上没 ,也就是 我还是 不知道自
己 资 底表现 何。 设上一年公司 27 分—基本等同于没

有,那么这一年公司 就为39 分—还是基本等同于零,但就从27


分 39 分 ,公司 润 确上涨了46%,这一点没有问题。

告诉 公司两年 计 还不 买一杯星巴 咖啡,那么收 这样


股东 件可真 晦 。

但是,我 室友是这样 人吗?显 不是。他最终把公司卖掉了,换回


了数亿 资金,我 那份 资 回报 也 达100%。但 还是不知

道我最后赚了 少钱,因为我并没有告诉 我最 了 少钱,这不是


更加 证明我 观点吗?读 这里, 是不是对什么是“其他事 ”有
点 觉了?

要注 是,百分差和百分 是不同 ,我们千万不 混为一 。比

通常会以百分数 形式体现, 伊 诺伊州 消费税 为6.75%,我


出书所得版税 15%要支付给我 代 商,诸 此类 比 都是基于 个
量 计算 , 所得税就是基于收 征收 。可见百分 可以上

浮,也可以下 ,但百分差 描述方式就 不同了,虽 两 表述


形式十分接近。最近就有一个绝 :伊 诺伊州 个人所得税税
由原 3%上 了5%。我们看 有两种不一样 法 描述这一税

变化, 且这两 在技 上都是正确 。主张并 成这次个税改


主 (正确无 地) 出,伊 诺伊州 个人所得税税 上升了两
个百分点,从3%上涨 5%;共和 (同样正确无 地) 出,该州 所

得税税 上 升 了 67% , 我 们 可 以 刚刚 会 公式 证 一 下 , ( 5-

3)/3=2/3,即67%。

国 主 将重点放在了税 绝对变化上, 共和 则更关注税

百分差。 刚才所 ,两 在技 上都是正确 ,但我可 会觉得共和


描述更加 确地传达了税 变化所带 影响,因为我以后要 纳

给政府 个人所得税—一笔我真 会在乎 钱—正 共和 所 那

样,确确实实上涨了67%。

现 都无法 一个数据 描述。就比 比赛四分卫亚伦

· 杰斯 传 离为365码,但没有 地得分; 另一个四分卫 顿·


传 离仅为127码,却 成了3次 地得分。 创造了更

得分,但 常 , 杰斯 长传 让他 队友得以突破对方 员 防
守、在场上 得更远。这两位四分卫 表现更 ?在第1章中,我介

了 国 业 采 “传 效绩 数” 决这一 计 题,

是一个描述性数据, 且是由 其他描述性数据 成 。我们将这些


从不同 度对比赛进行 价 数据浓 成一个数字,并 这个数字进行

比较,得出四分卫在 个比赛日中 排名, 至整个 业 涯 四分卫

排名等 。 比赛也有一个类似 数,那么本章一开 提出


历史上最伟 是 问题是不是就有答 了?

将一 杂 息浓 成一个数字,这是所有 数都具 优点。我

们可以因此对原先无法展开简单比较 事 进行排名,从四分卫 表现
优 ,再 选 比赛。在 国小 选 比赛中,所有 出

成绩都是由5个部分 成绩组成 :个人 、泳装展示、晚礼 展示、

才艺表演和现场问答(“亲善小 ”称号 选则单 由参赛 们相互


选产 )。

同时,将一 杂 息浓 成一个数字,这也是所有 数 点所
在。我们有各种各样 方式 浓 息, 种方式都有可 导致一个不

同 。 尔科 ·格雷德 尔在《 约客》上发表了一篇 性文

章, 睿智 地 出我们对排名 (他尤其对 排名嗤

之以 )。格雷德 尔以《名 志》杂志对3 排名为 ,这3


分 是 时捷卡 、 佛兰科尔维特和莲花 特斯。《名 志》设
计了一个计算公式,其中包含了21项 价 ,最终 时捷卡

得 筹。但格雷德 尔却 出,“外观”项在公式中 分量仅占 了


4%,这一 对于 价 简直低得离 。 将 外观 权

重上 25%,那么莲花 特斯 将会是第一名。

接下 ,格雷德 尔还 出, 价 分量在《名 志》 价过程


中相对 也被低估了, 上 价比 (这样就 证价格、外观

和性 这三项 在 价时各分秋色),那么 佛兰科尔维特就将成为

新 “ 之 ”。

所有 数 取决于其 成 描述性数据以及 们 权重,任何一点 微

小 变化都有可 引起 改变,因此,即 是最终得 那个

数,可 是一种 不 但有现实 义 ,也可 是 不合 。


举一个 一种 — 合国 人类发展 数(HDI),这是一个比

单 收 更加广泛 济 康衡量 数。人类发展 数将收 作为

价 组成部分之一,同时还 虑 了寿命和受教 程度。 国在人


济产出方 位居世 第11位(排在卡 尔、文莱、科 特等几个石油国

之后),但在人类发展方 居 第4名。 确, 人类发展 数

里 组成 发 变化 话,最终 排名也会不一样,但可以
是,只要是符合常 整,无 何都不会出现津巴布 越挪

。当我们 要了 世 各地人 活水平 差异时,人类发展

数为我们提 了一个简单方 且相对 确 排名。


描述 计 为我们所关心 现 打开了一 窗,让我们更加接近事实

真相。 了,现在我们终于可以回 本章一开 提出 那些问题了。

是史上最伟 运动员? 合本章所 主要 ,我们 先会


问:哪些描述性数据最 帮助我们回答上述问题?根据 息 决方

公司 裁史蒂夫·莫 法, 价任何一个 运动员 3个最有

价 数据(除了年 )是:

1.上 (OBP OBA),就是 员上 ,包 送上 在

(这一点是不包含在击 计算 )。

2.长打 (SLG),就是衡量 员 长打得分 。一 记1

分,二 记2分,三 记3分,本 记4分。也就是 , 一个 员

在5次打数中,打出了一个一 和一个三 ,则其长打 为


(1+3)/5=80%。

3.打数(AB), 成上 和长打 比较 景。 技不 员

也会有发挥 常 时 ,但仅限于 几场比赛。只有通过打数 积


,将成千上万次 击打表现综合起 ,我们才 是真正

级 员。

在莫 看 ,最伟 运动员 比· 斯莫属,因为 比 有无

可比 击 和 。直 今天, 比· 斯创下 69% 长打

是 员 以撼动 涯 录。
那么, 国中产阶级 济 康 又是 何呢?我再一次将问题抛给

了专 。我给杰夫· 洛格(我在芝加哥 同事)和阿兰· 格

(研究 怖分 普 斯顿 济 、 国 巴 级 济
顾问)发送了一封邮件,他们基本上给出了相同 答 ,只有一些细节

上 区 。要 价 国“中间阶级” 济 ,我们 要了 (通货

膨胀 整后 )工资中位数在过去几十年中 变化,他们还建议我
一下 于第25百分位数和第75百分位数人 工资变化,因为这两拨人

通常被 为是中产阶级中 收 和低收 人 。

还有一组必须分清 念就是,在 价 济 过程中,不 将收


和工资等同起 。这两 是不同 ,工资是我们付出 固 份额 劳

动所得, 时薪 周薪;收 是 部所得 和, 源有 种。 一

个工人找了一份兼 , 加 很 个小时,那么这个人 收 会
,但工资却没有发 变化。这就 明,即 一个人 工资下降,他

收 有可 上升, 他加 话。但 这些人不得不付

出更 劳动 取得更 收 ,那么我们很 价他们 整体 活质


量 底是更 还是更 。因此,相比于收 ,工资是 价 国人劳

动收 一个更加直观 ,工资越 ,工人们 工作1小时 领

钱也就越 。

了那么 ,下 我们 看一幅过去30年 国人工资水平 变化图,在

图中我还加 了第90百分位数人 数据,以此对比相同时间 中产阶

级工人和10%最 裕人 工资 长水平。
图2-4 不同收入群体的周薪变化
资料 源:《1979~2009年 国工人时薪分配变化》, 国国会 算办公室,2011年2月16日。图
中具体数据参见

http://www.cbo.gov/sites/default/.les/cbo.les/ftpdocs/120xx/doc12051/02-16-
wagedispersion.pdf

从这些数据中,我们可以得出有关中产阶级 济 各种 ,但都

不会共同 向一个唯一“正确” 答 。从中我们 看 ,典 国


工人挣着中位数工资,在原地 步了将近30年;但 于第90百分位数

人们就 了。幸 有描述 计 ,我们终于在这个问题上 建出了

一个 , 还要接着往下 点什么 话,那就是其他 和政治


事 了。

本章补充知识点
表2-1 打印机质量问题统计表

方差和 差 运算公式

方差和 差是测量和描述数据分布 离散 最常 计 技

巧。方差通常 符号σ2表示,体现各个数 离 们 平
离远近。但要注 是,在计算时 要对具体数 和平 之差进

行平方, 后再 平方数之和除以数 个数。

举 明:

设有一组数量为n 数字x 1 、x 2 、x 3 ……x n , 们 平 为

μ。

2 2 2 2
们 方差σ =[(x 1 -μ) +(x 2 -μ) +(x 3 -μ) +
2
……+(x n -μ) ]/n。
由于在计算方差时对 个数 和平 之差都进行了平方,因此那
些远离平 数 即异常 就会被放 ,下 以 为 。

表2-2 身高统计
*与平 之差 绝对 表示两个数 之间 离,不 虑方向(正

)因 ,因此绝对 是为正。这里 绝对 表示 是 个人
与平 之间相差 英寸数。

两组 平 都是70英寸, 一组 个体与平 差异

之和也都是14, 目 为止,这两组 离散程度是 相


同 。但是,第二组 方差要 些,这是因为萨哈和纳西

两个 数 离平 比其他 都要远,从 导致了

方差计算公式中 分 变 。

在描述 计 中,方差很少被直接 于 当中,往往是作为计算

差 中间环节, 差才是一个更为直观 描述性数据。

差就是方差 平方根,计算公式 下:

设有一组数量为n 数字x 1 、x 2 、x 3 ……x n , 们 平 为

μ。

们 差
[1] 吧台 一共有12个人,那么中位数应该是收 排在第六位和第七位 两个人 平 , 这

两个人 收 都是3.5万 ,因此中位数也是3.5万 。 一个人挣3.5万 ,另一个人挣


3.6万 ,那么整组人 收 中位数则为3.55万 。
1950年人们 平 时薪是1 ,2012年人们 平 时薪是5 , 觉

得我们 工资水平涨了吗?

对于任何一个约会过 人 ,通常会对“他这人还不错”这类表述引
起 ,不是因为这句描述一 是错 , 是因为这句话中还有其他

潜台 ,诸 其实这个人曾 坐过 , 他 离 “还没 办

”等。我们丝 不怀 他 人品不错,只不过 心这么一句看似正确


陈述,其 可 在于掩 淡化其他 息,从 导听 (我 不

会有人 与一个还没离 有重 底 人约会吧)。这类陈述严格

并不 被称作 ,哪怕 人 了也不会被 伪证 ,但由于其


确性实在不敢 维,所以最 不要相 。

计 也是 此。虽 计 是扎根于数 土 里 , 且数 又是一


门以 确著称 科,但 计 描述 杂现 这一过程并不是

精确无 ,这就为掩盖真相创造了 量 空间。 ·吐温有一句名

是这样 ,“ 有三种: 、该 ,以及 计 ”。正


一章所 ,我们关心 数现 都可以 种方式进行描述。

对 一事 描述存在 种方式( “他人不错” “他曾 因证

诈 被 ”),那么我们所选择 ( 回避) 描述性数据


就会影响 人对此事 印 。一些 有 心 人 至会 光 事实和

数据 支持真 存 不成立 。

先,我们应该弄明白“精确”和“ 确”这两个 之间至关重要 区


。这两个 不可以相互替代。“精确”反映 是我们描述事 精
度,比 在描述 从 公司 离时,“41.6英里”就比“ 约40英

里”更精确,当 比“相当长 一 ”更精确一些。 问我最近

加油站在哪里,我会告诉 往东1.265英里,这就是一个精确 回答。


但问题也随之 : 加油站在西边,那么这样 一个回答就是

不 确 。也就是 , 我告诉 : 约10分钟,当 看 一

售卖摊点时,加油站就在 右 方几百码 地方, 过

厅,就 明 开过了。这样 一个回答虽 没有“往东


1.265英里”那么精确,但显 更 ,因为我为 明了 往加油站 正

确方向。一个数据 确与否表明了其与真相是否一致,因此将“精

确”和“ 确”混为一 是要付出代价 。 一个答 是 确 ,那


么在这个基础上当 是越精确越 ;但 答 从一开 就是不 确

,那么再精确也 无 义。

让我 “精确”和“ 确” 区 ,是一件发 在 个圣诞节

事 。那一天,我 给我买了一个 尔夫测 仪,以 让我测量

尔夫 洞之间 离。这个设 是通过 些激光原 进行工作 ,


我站在 尔夫 旁, 后将测 仪对 远 草地上 洞 ,之后仪器

上就会显示我应该击 精确 离。相比起原 码数 记 ,

这个设 在性 方 有了很 提升,因为原先我们只 通过看场上


记 估算出测量位 与 场中心 离(因此,测 仪让 尔夫 这

项运动变得更加精确,但却更加不 确)。通过这个 尔夫测 仪,我

终于知道了我 离 洞还有147.2码。我 待这一先进 技 助我


提升 技,但事实是,我打得越 越差。
这里有两个问题。第一,在我 了这个设 3个月 时间之后,我才猛
计量单位是“米” “码”,因此, 一次看似 确 测量

(147.2)都是错 。第二,有些时 我会不小心地将激光束对 场

后 干, 洞 ,因此我 “ ”击 就会导致“ ”
—在空中划出一道漂亮 弧 , 后越过整个 场落 里。这

个 告诉我,即 是最为精确 计算 测量都应该 一下是否符合

常 。这一点适 于所有 计分 。

再举一个严 一点 。在2008年金融危 发之 ,华尔街

险管 都 常精确,“ 险 ” 念让这些公司得以将其在
不同 下可 损 资产进行精确量化,但问题是,这些 级 杂

就 比是将我 尔夫测 仪 长度单位设 成“米” 不

是“码”。数 运算 为 杂和晦涩,得出 精确 几乎没有人会

怀 其真实性。但嵌 这些 中 有关 市场可 会发 险
设其实是错 ,因 精确计算所得出 从根本上 就是不 确

,这不仅坑苦了华尔街,更是把 济都“ 下水”。

即 是最为精确和精 描述性数据,都有可 临一个根本性 问

题: 乏清晰度,不知道我们 底要 义、描述 释什么。 计参数

与 败 有着 共同点,争 双方往往都 不了对方。思 一


个重要 济问题: 国 造业有 康?人们 常 听 , 国

造业正在 去 量 工作 会,这些工作岗位源源不断地流向中

国、印度以及其他低工资国 。人们还 听 , 国 科技 造业
挺, 国 是世 上最 商品出口国之一。 底哪个 法才
是对 ?这就涉及 计 另一个方 :对优质数据 合 分 有

效地 和对立 观点。 国 造业是有 可图且在国际上有竞争 ,

还是 临激 外国竞争正 于萎 过程之中?

答 是两 兼有。英国新闻杂志《 济 人》通过下 曲 图将看上

去似乎矛盾 两个观点融合在了一起,为我们展现出一幅关于 国 造

业 趋 图。

图3-1 “铁锈地带”的复苏
这一对看似矛盾 观点取决于我们 何 义 国 造业 “ 康

”。从 产和所售商品 价 —产出 看, 国 造业自2000年


以 一直 持稳 长,直 2008年 济 衰退才遭受重创, 此后

又出现了强劲反弹。这一点与 国中 局 《世 》里 数据相吻
合, 国是世 上第三 造业出口国,排在中国和德国之后。 今,
国 是一个 造业 国。

但《 济 人》杂志 曲 图上还有一 曲 ,展示了 国 造业

就业 。 国 造部门 岗位数量一直 于下降之中,在过去10年


时间里有差不 600万人丢了饭碗。这两个故事— 加 产出和 少 工

作岗位—共同组成了关于 国 造业 一个 整 故事。 国 造业

产 在不断提升,也就是 ,工厂可以通过雇 更少 工人 成更
产出。这一点从国际竞争 度 是有 ,因为 国 造 商

品相比低工资国 更具市场竞争 (与一 仅 支付时薪两

公司抗衡 方式之一,就是提 产效 ,让自己 公司在支付时薪40


同时,将工人 产效 提 对 公司 20 )。 这样

话, 造行业所 岗位就会 少,这对于那些亟须这点 工资养

糊口 业工人 是一个巨 打击。

既 本书 是关于 计 造业 知 ,那么就让我们 归正

传, 国 造业 “ 康 ”。 何 价一个行业是否 康,

这一点量化起 似乎并不 ,就看我们 何选择了,是选择以产出量还


是就业 为衡量 ?在这个 (以及 其他 )中,最

整 故事往往都会包含两方 ,《 济 人》在上图中就作了明智

示范。

即 我们对成功 衡量 达成了 个共 ,比 分数,

仅此一项 计还是会有 裕 空间。举个 ,下 两个陈述句


都可以 是正确 ,但看看 是否 将这两 和在一起。

政客甲( ):“我们 教 水平正变得越 越 !2013年有6

成 成绩低于2012年。”

政客乙(在任 ):“我们 教 水平正变得越 越 !2013年有8


成 成绩 于2012年。”

给 一点提示:并不是所有 人数都是一样 。 我们回


过 再看这两句似乎相互矛盾 陈述, 会发现政客甲将 当作其

分 单位(“有6成 ……”), 政客乙则是将 作为其分 单位

(“有8成 ……”)。在 计 中,分 单位是作为比较 描述 对

存在 —其中一位政客选择了 表现, 另一位政客选择了


表现。 成绩上升 正 自办 常 ,那么

部分 在 业上有所进步 部分 成绩正在退步,这两 是

有可 同时发 。为了让这个 更加直观,我们可以 国各


州 济 进行 明。

政客甲(平 主义 ):“我们 济一 糊涂!2012年有30个州


收 都出现了下滑。”

政客乙(更接近精英派):“我们 济 一片光明。2012年有

70% 国人 收 都 加了。”
从这两句话中,我 读出 息是:诸 约、加 福尼亚、得 萨

斯、伊 诺伊等州 济形 最 , 收 下滑 那30个州更有可 是


比较小 州, 佛蒙特、北达科他、 德岛等。由于各个州 积

小不同, 部分州 济下滑和 部分 国人 收 上升是 有可

同时存在 。关键就在于分清分 单位,描述 对 底是 ( 什


么),以及不同 人口中 ( 什么)是不是存在差异?

刚刚举了两个虚 , 接下 这个 是一个真实且至关重要

计 问题:世 各地人 收 不 衡因为 化 是改善


了,还是 化了?一种 是, 化只是加 了现有 收 不

,1980年时 裕国 (以人 国 产 为参 )在之后 20年

间 长速度 过了 困国 。 国会变得更 ,这 明贸易、外包、


外国 资以及其他 化 组成部分沦为了发达国 济 权 工

具。

换一种分 单位,同样 数据也可以(也应该)以一种 不同

方式 读。我们不关心穷国,我们只关心穷人。恰巧世 上有绝对比

穷人 活在中国和印度,这两个国 都是人口 国(人口数量

过10亿), 且在1980年 时 这两个国 都 于相对 穷 发展阶


。但是,在过去 几十年时间里,中国和印度 济都 历了 速发

展,这在很 程度上要归功于 们与世 上其他国 日 加深 济一

体化。《 济 人》这样 价中国和印度:“ 们都是‘迅速 化


’。” 虑 我们 目 是改善人类本 穷困,因 在衡量 化
给 世 穷人带 影响时,将中国(13亿人口)和 里求斯(130万人

口)当成是比重相同 两个国 看待是不合 。

上述 分 对 应该是人, 不是国 。1980~2000年这20年 时

间 底发 了什么?回 一下刚刚那个虚 。世 上 部

分穷人恰 都 活在两个 国里, 这两个 国在融 化 过程中


都 历了 济 飞速发展。正确 分 得出了一个 不同 :

化有 于 世 穷人。《 济 人》杂志 出:“ 虑 是

人 不是国 ,那么 不平等现 正在迅速 少。”

国 两 业巨 国 话 报公司和 瑞 最近卷 了一场

广告之争, 白了也是因为 两可 描述所引发 。这两 公司都提

移动通 务,对于绝 数 ,他们最关心 问题无


就是 务 络 覆盖范围和通话质量,最不 看见 就是在 要拨打

接听 话时却没有 号。因此,从逻辑上 ,要比较这两 公司

坏,只要看 们各自通 络 和质量就行了。为了迎合消费


对于更 、更 络覆盖 求,两 公司在衡量这一看不见、摸

不着 求时采取了不同 分 。 瑞 公司发动了一场

浩 广告 ,四 售其无所不在 络覆盖,给消费 下这样


一个印 :在辽阔 国国土上, 瑞 公司 基站几乎遍布

国 各个 落, 与之形成对比 ,是 国 话 报公司 相对零碎

地 覆盖。 瑞 公司所选择 分 单位是 络覆盖 地 范围,


这是因为这 公司 确在这方 要强一些。
与此同时, 国 话 报公司也发动了反击 ,选择了另一个分 单

位。在其巨 广告牌上 着“ 国 话 报公司 满 97%

国人 通 求”,注 这里 是“ 国人”, 不是“ 国”。


国 话 报公司所强 重点在于,绝 数 国人并不住在蒙

州 远乡村 是亚 那州 沙漠之中,既 国 人口在地 上

并不是平 分布 。这则广告 下之 就是,一个 通 务


络 关键就在于,将 务重点放在那些 真正 活和工作 区

, 不是他们偶尔才会去野炊 地方。但由于我 常要回新 布什尔

乡下,因此在这个问题上,我可 还是会选择 瑞 公司作为我


移动 话 务商。

我们 “老 友”平 数和中位数同样会被心 不正 人 。在上一

章 中我们介 了这两个 念,希 还 回忆起 ,无 是平


数还是中位数,都是衡量一组数据 “中间位 ” “中心趋 ”。

平 数就是所有数据求和之后再除以个数(3、4、5、6、102 平 数是

24)。中位数就是一组数据最中间 那个点,有一半数据位于这个点之
,有一半数据位于这个点之后(3、4、5、6、102 中位数是5)。现

在, 明 读 一 会注 24和5之间存在着巨 差异。所以,

出于 种 虑, 要让这组数据在描述时显得数 一些,那么我会选
择求 们 平 数;但 我 让数 看上去小一些,我 会将关注

点放在中位数上。
现在,我们 看一下这在现实 活中是怎么操作 。以 国 小布

什 税政策为 ,根据小布什政府 法,这一政策将 及绝 数

国 庭。相关政府官员 出,在这项政策推行之后,将会有9200万
国人享受 税待遇,人 税额 过1000 (具体数字应该是1083

)。但这个关于 税政策 确吗?《 约时报》 价

:“数据本 并没有撒 ,只不过有些数据没有发出 了。”

是不是会有9200万 国人将享受 税待遇?答 是 。

那么,这些人中 部分人都可以少 纳约1000 税 吗?不是


。因为 税额 中位数还不 100 。

只有数量相对少 巨 们才有资格享受 额 税, 正是这些人 了

平 ,让人 税额看起 比绝 数 国人真正享受 要 。中


位数对异常 并不敏 ,因此在这个 中, 要看小布什政府

税政策对普通 庭 影响,中位数可 会是一个更为 确 描述性数

据。

当 ,也正是因为中位数对异常 不敏 ,所以在 些 下中位数同

样会掩盖事实真相。 设 上了 种不治之 , 消息是有一种新药

刚刚研发出 ,可 会对 产 积 效,坏消息是这种药 价格
常昂贵, 且 作 有很 。“真 有效吗?” 会对这种药 满

。医 告诉 这种新药 延长 此 人 “半数 寿

命”(也就是这些 人寿命 中位数)达两周。这根本就算不上是什么


消息,相比起那么贵 药价和不良反应,这两周 寿命不要也 。同
时, 险公司也 绝为这项治 承 费 。这是一个基于半数

寿命 典 。

但在这个 中,中位数 会成为一个相当有 导性 数据。 设有

人对这种新药 没反应,但同时也有相当数量(30%~40%)

人 治 了。 ,后 成功并不 在中位数中得 体现(虽


接受新药治 人 平 寿命看上去 常令人振 )。对 ,与

自己 度相关、真正影响 决 反 是那些接受了新药治 并活了

很 年 人,也就是 计 里 异常 。 且,这并不是一个虚
。进化 史蒂芬·杰·古尔德曾 被诊断出 有 种 ,

他 半数 寿命只有区区8个月。但20年过去了,古尔德 于另一种不

相关 。古尔德 过一篇 常有名 文章,题目为“中位数不


等于真 息”,他在文章里 出了他只 活8个月是一个错 ,并表

示是他 里积 计 科 知 将他从错 中 救了出 。

中位数 义告诉我们有1/2 人活不 8个月,但另外1/2 人至少


可以活8个月, 比8个月 时间更长( 至是活 老),其 亡分布

是“右 ” 。因此, 恰 上了这种 ,这一数据 义要比

一个单 技 丰 得 。

上述 表明,中位数 决 性特征—不 虑数据 离中间位 有 远

是 近, 是关注 们是 于中间位 还是低于中间位 —反 成为

弱点。与之相反,平 数恰恰是由数据分布决 。从 确性
度 看,平 数和中位数 取 舍,关键就在于这个数据分布里 异常
对事实 真相是起 扭曲 作 ,还是其重要 组成部分。再次强

, 断比数 更重要。当 ,没有人强 一 得选中位数 平

数,任何一个 杂综合 数据分 都会包含这两个数据。所以,当只有


其中一个数据出现 时 , 就要注 了,有可 只是出于 简 赅

虑,但也有可 是 些人 有 心地 数据“ ” 。

上了一 年 人 会记得一部《 尔夫》 影,里 两位


主演分 是 维·蔡斯和泰德·奈特,他们在 尔夫 场 更衣室里有

过这么一 对话:

泰德:刚刚打得怎样?

维:啊,我没记数。

泰德:那 什么 人比啊?

维: 。

我引 这 影台 目 不是 明 有 幽 , 是 其实 计

里也有很 这类“苹 和 ”作比较 把戏。 比较伦敦和

巴 酒店房间价格,可 会让 6岁 录 站搜 — 方
永远不是 对 , 后 向 汇报巴 房价更贵一些,

晚 价格约为180 , 相同 次 房间在伦敦 晚只 要150英

镑。
此时, 会滔滔不绝地向 释英镑和 之间 区 , 后让
他回去重新 找这两种货币之间 汇 ,这样 就 对两个 市 房价

作一个有 义 比较。这个 其实在现实中也挺常见,我 看见

我在印度 100卢比买了一 茶,于是 就问我为什么在印度无 买什么


东西都那么贵。显 ,在我们将不同国 货币 换成同一种货币单位

之 ,比较这些货币上印着 数字是没有 义 。英镑和 汇 是

少? 和卢比 汇 又是 少?

这似乎是一节 苦 启蒙 ,虽 事实很明显,但却 常被忽 ,尤其

是政客和 莱 片商。这些人当 知道 和英镑之间 差 ,但就

比苹 和 ,他们反 会忽 一个更为细微 因 :通货膨


胀。今天 1 和60年 1 价 是不一样 :今天 1 买

东西更少。由于通货膨胀 存在,1950年花1 买 东西在

2011年可 要花9.37 。因此,在没有 虑通货膨胀因 下,


任何有关1950年与2011年 金钱比较都是不 确 , 且比 与英镑

比较更加离 ,因为 和英镑 价差比1950年 与2011年

价差还小。

济 至为这一重要 现 以专业 ,以表示相关数据是否

虑了通货膨胀因 。名义数据就是没有就通货膨胀 出 整 数字,比

较1970年 项政府项目 名义花费与2011年政府在相同项目上 名义花


费,实际上看 仅仅是政府财政部在这两年所开出 支票 票 金额,

并没有 虑1970年 1 买 东西比2011年买 东西 。 设政府


在1970年时为老兵 住房补助项目 了1000万 , 了2011年,政

府在此项目上 了4000万 , 邦政府在这个项目上 努 实际上


是退步了。花费 金钱在名义上 确是 了,但这并没有反映出

价 变化。1970年 1 相当于2011年 5.83 ,也就是 ,政府

2011年 要在老兵 住房补助项目上 5830万 才是与1970年


1000万 持平。

实际数据是 虑了通货膨胀因 并 出 整 数字。最常见 方法就是


将所有数据 一换算成一个相同 单位, 2011年 ,这样就可以

将“苹 与 ”之间 比较变为“苹 与苹 ” 比较。包 国劳

工 计局在 站,都提 简易 通胀计算器, 我们对不同时


价 进行比较。下 是一张 国政府最低工资图,上 出了

最低工资 名义 及其实际 买 (都换算成2011年 )。通过这

张图,我们不 发现 虑了通货膨胀因 并 出 整 数据会产 常


不一样 效 。
图3-2 美国政府最低工资图
资料 源:http://oregonstate.edu/instruct/anth484/minwage.xhtml

国最低工资 是由 国国会 。 在 国工作, 就会在

办公室 个 落 公告板上看 最低工资 。当 最低工资


为 小时7.25 ,这是一个名义 。 上司才不会 会现在

7.25 买 东西是不是和两年 一样 ,他只 要 证 支付

给 时薪不少于7.25 。上司只 支票上 数字, 该数字


后 买 。

随着时间 推移,通货膨胀会逐渐 弱最低工资 买 (以及其他名

义工资 买 ,这也是为什么工会代表在与雇主 时 会 “
活成本 整” 问题)。 商品价格 上涨速度快于 国国会 最

低工资 速度,那么 小时 获得 最低工资 实际价 就会 水。


最低工资 支持 们应该关注这一工资 实际价 ,因为这项法律

出台 衷就是为了 护低收 工人 , 证他们 小时 劳动所


获得 报酬 换 一 水平 买 以维持 活, 不是让他们在付

出劳动后却得 一张什么都买不起 额支票。 这都不 证,那

就相当于给这些低收 工人支付 是卢比, 。

莱 在比较不同年份 影票房时, 是会对通胀因 不见,

是因为无知,但更有可 是出于对 虑。 止 2011年,史上

最卖座 5部 影 次为:

1.《阿凡达》(2009)。

2.《泰 尼 号》(1997)。

3.《蝙蝠 传II:暗 》(2008)。

4.《星 IV》(1977)。

5.《 史莱 II》(2004)。

这个排名看上去是不是有点奇 ? 确,里 绝 部分 影都 称
典,但是,《 史莱 II》应该 其中吗?这部 影真 在票房成

绩上要 过《乱世 人》、《教 》、《 白 》吗?当 不是这样

。 莱 最常 事就是让最新 片看上去比上一部 场 更 、
更加成功。为达 这个目 ,一种方法就是 印度卢比 计算票房成

绩,以此 成就令人振 报纸 , “《哈 ·波特》周末票房破


1.3万亿卢比,打破票房 录”。但即 是对金钱最不敏 些影迷,

也 破这类 买 较差 货币 计 “注水”票房成绩。事实上,

莱 (以及 责 体 影报道版 记 )很少 名义数据,因为这


一 法会让现在 影在票房上很 易地 过10年、20年 是50年

影— 都知道现在 票价比以 贵 了(当《乱世 人》在1939年

上映 时 ,那时 国 地 一张 影票售价只有0.5 )。比较不同


时 影 商业成功最 确 方法就是, 虑了通货膨胀因 后 出

整 票房成绩。1939年1亿 票房可比2011年5亿 票房 观

了。这样 看,将通货膨胀 虑在 , 国史上最卖座 5部 影 底是


哪些?

1.《乱世 人》(1939)。

2.《星 IV》(1977)。

3.《 乐之 》(1965)。

4.《外星人E·T》(1982)。

5.《十 》(1956)。

以 除通胀因 实际票房成绩 看,《阿凡达》只排 了第14位,

《 史莱 II》则落 了第31位。

有 时 即 是 苹 与苹 进行比较,也可以 不费 地 他人。
上一章 里曾 过, 计 一个重要 色就是描述数量随着时
间推移所发 变化。我们 税是不是越 越 ?与2012年相比,

2013年 汉 销量 何?饮 水中 砷含量 底降低了 少?我们 常

百分 描述这些变化,因为百分 让我们相对直观地有一个
比 和 景 受。很 人会 饮 水中 砷含量降低了22%是什么

思,但 知 一单位水中 少1微 砷(绝对 少量) 底是 是少

人就没几个了。百分 不会撒 ,但 们会 其辞。让 长出现

“ 炸” 方法之一就是与一个 常低 起点进行百分 比较。我住在

伊 诺伊州 库 郡,一天我得知我 纳 税 中 于支持库 郡郊区

核 养院 比 上升了527%!我着实吃了一 。 怒 我 上开
筹划一场 抗税集会, 就在此时,我才知道这一变化给我 加

还不 一个火 三文治 钱。 核 养院 年接收 人才100

,并不是一个 庞 昂贵 。据《芝加哥太阳报》报道,对
于一个普通 庭 ,其支付 税额仅仅是从1.15 上升 了6 。

研究人员有时 会特 出 项 长数据是由“一个较低 基数”得出

,哪怕是很小 一点 长在进行百分 比较时,看上去都会很可


观。

除此之外,百分 另一 也是很可怕 ,那就是一个庞 数额 微小

比 也会是一个很 数字。 国国防部部长 ,2013年 军费开


支仅 长4%—这看上去可是一 消息啊!作为纳税人 我们,是不是

应该庆祝?其实并不尽 ,因为 国 国防 算是在7000亿 左右,

4% 比 就是280亿 ,这笔钱 买 少个火 三文治啊!事实上,区


区4% 军费开支就已 过了 国国 航空航天局(NASA) 部

算,相当于 国劳工部和财政部 算 和。

同样 , 一下 有一个菩萨心肠 老板,出于公平 虑,他决


2013年为公司 一位员工加薪10%— 么 决 啊!只不过有一

点,老板 年薪是100万 , 年只挣5万 ,老板将会得 10

万 加薪, 只有0.5万 加薪。“2013年 个人都将获得


10% 加薪”听上去要比“我 加薪是 20 ” 受太 了—虽 这两

句话都没错。

只要是对一 时间 数字变化进行比较,就 离不开一个起点和一


个终点,但我们有时 通过操 这些点 影响 息 表达。曾 有一

个教我 教授,他对 国共和 和 主 操 数据 伎 十分清 ,尤

其是在军费开支 问题上,他 出就算是 对 相同 数据,不同


分 方法也 产 不同 效 ,既可以 取 主 支持 ,也

不会让共和 护 。因此,在 件时他会 两个版本 幻

灯片,当为共和 人上 时,就 出“共和 版” 件,为 主 人


上 时,自 就会换成“ 主 版” 件,但里 数据是 相同

,不同 只是组织数据 方式。就比 今天 这节 他 听众主要是

共和 人,他 幻灯片上就会出现下 有关 纳德·里根(共和 人)


政 间 军费开支 计图。 都清 里根为 国 得了 ,

对国防安 出了卓越贡 。在看着这些数字 时 ,无人不为里根

政务时所表现出 钢铁般 决心击掌喝彩。


图3-3 美国军费开支,1981~1988年
对 国 主 人时,我 这位教授还是 相同 (名义)数据,但在

时间 度上稍长一些。他对这 听众 出,吉米·卡特( 主 人)
是开启国防建设 当之无 先 。正 下 这张“ 主 版”

幻灯片所示,卡特掌权 1977~1980年间, 国 军费 长趋 与 任

里根 同小异, 上帝让 自安纳波 斯 海军军官吉米·


卡特带领 国 上了军事自强之 !
图3-4 美国军费开支,1977~1988年
资料 源:http://www.usgovernmentspending.com/spend.php?

span=usgs302&year=1988&view=1&expand=30&expandC=&units=b&fy=fy12&local=s&state=US&pie
=#usgs302

虽 计 要点在于为我们所关心 事 描绘一幅有 义 ,但

是在 时 我们同样希 为这些数字 些什么。 国 业


队希 获得四分卫成绩 简单 计,这样他们就 在众

中寻找 天才 员;企业通过 核 提 那些有价 员工、开

除那些 粹混日 人。在商 流传着一句至 名 :“ 无法管

无法衡量 事 ”。这句话千真万确,但 最 要 证 所衡量 ,正


是 努 去管 。
质量,这是一个必须予以衡量 关键问题,因为我们都希

奖励并效仿“ ” ,惩 整顿“差” (具体 部,我


们在衡量教师 教 水平问题上也 临类似 题)。 核 和教师

最常 方法就是看 分数, 束后, 优异成绩就

是教师和 最 金字 牌;与之相反 , 糕 成绩无 会释放出


一个清晰 号:相关教师应该被辞退, 且越早辞退越 。这样看

,仅 分数我们就 彻底改善公共教 了,对吗?

错。在 价教师和 时, 只看 分数是会铸成 错 。不同

,他们 景和 是很不一样 ,比 , 教

程度和收 会对 成绩产 不可忽 影响,不 上 是哪所


。在这里,我们所 少 那个数据恰 就是 答这个问题唯一 要

: 业表现有 有差,但其中有 少比 要归功 归咎于

( 所在 级)呢?

从小就 活在衣食无忧、书 门第 庭里 ,一般 从进 幼

园 第一天起就有可 会比 成绩 。相反 同样成立,

有些 天资平平,虽 教师教得很 ,但是 成绩还是


在一个低水平上, 没有这些老师 付出,那些 成绩会更加惨

不忍睹。所以,我们 要在 , 至 级层 上将一些“附加 ”纳

核。 成绩 绝对水平对于 答我们 问题没有 义,我们 知


道 是这些 表现中有 少是受 了 和教师 影响,我们 要

估 其实是这些教 因 。
有人会 这并不 ,只 要在开 时给 安排一场摸底 即可,再

将这次 成绩与 之后 成绩进行对比,就 断


业是进步了还是退步了,并由此对其所在 级进行 价。

但这种方法还是错 。不同 景 在 习上 进步程度也

是不同 。一些 在领会知 点方 就是比其他 快, 这与老师


教 质量没有关 。 让优质 A 和各方 都稍差 B

同时开 习相同 度 代数 ,一年以后,A 代数成绩

更 ,原因可 是A 教师教 更强,也可 是A 习


更强,还有可 二 兼有。研究人员正在致 于开发一套针对不同

和 景 教 质量 计 价方法,在此 间,我们所有关于

寻找“最 ” 努 都有可 适得其反, 导 众。

年秋天,芝加哥 几 当地报纸和杂志都会对该区 中进行一

次排名,其主要参 据通常是州 成绩。从 计 度看,这些排


名 会有一些让人捧腹 地方,比 常年位居 单 几位 都是一些

选择性 , 思是 要进 这些 中,就必须提出申请,

申请 中只有很小一部分 人 , 这些 在 选 时最重
要 参 据就是 成绩。我们就这个问题作个小 :(1)这

些 因其 在州 中 出色发挥 被 为是“优质” ;(2)要

进 这些 习, 先 要有 常 分数。这一逻辑就 比
是给一支篮 队 奖, 由是这支篮 队 训练在 进 长 方 贡

卓著。
对 要衡量和管 对 ,就算 找 了一个有效 价 ,

也并未 束。 消息是“ 计 进行管 ” 让相关个人 组织


潜在行为往 方向改变。 计算出一 产 上 产出 产

品 不合格 , 且这些不合格产品是由组装工人自 原因造成 ,

那么对那些 产出 产品不合格 低 工人给予 些奖励, 在一


程度上激励 厂工人积 工作 态度,这就是一个 计 优化工作

。无 是 ,都不会对激励措施(哪怕仅仅是几句 扬 一个地

一点 位)无动于衷 。 计 帮我们得 重要 ,激励措施


给我们改善 由。

坏消息则是,在 些时 , 计 功 仅仅是让数据看上去更顺眼。

个 中是根据其毕业 占所在 区毕业 数 比 估


领导 , 至是奖金分配方 ,那么这些领导们 工作重心 会

放在提 毕业人数方 。当 ,他们 也会 出一点精 放在

提升本 毕业 ,但归根 底毕业人数和毕业 并不是一回事。


,还没毕业就离 可以被归类为“ ” 不是“辍 ”。

这不是一个虚 , 国教 部 部长 德· 奇就是因为这个问

题 受 责。 国 小布什之所以提名 奇掌管 国教 部,就


是因为他成功地降低了休斯敦地区 辍 、提 了 分

数。

一直 地记下我引 为数不 商业 句,那么请在笔记本

上 下这么一句话:“当《60分钟》 新闻杂志 目 组敲 门
时 , 没有什么 事。”之 丹· 瑟和《60分钟》 目组专门去

了一 休斯敦,发现教 部对 计数据 操 远远 过了教 水平 提

升。将辍 归类为 、出国 攻读一般同等 (GED)文 ,


在当地 中是一个 为普遍 现 ,在官方 计数据中,这些 都

不会被 计 辍 中。休斯敦市公布 辍 为1.5%, 《60分钟》

目组暗访计算出 实际辍 为25%~50%。

在 分数 计过程中,也出现了同样 作弊现 。在休斯敦

( 是其他任何一个 市),提 成绩 方式之一就是改善教 质


量,这样 就 更 知 ,并且在 中取得进步,改善教

质量确实是较 方法。 比较差 方法则是 办法让那些成绩最差

“远离” 场,即 剩余参加 成绩没有任何长进,最


终 平 成绩也会有所提升。在得 萨斯州,10年级 要参加

州 ,有证据表明休斯敦 中 有 让 习 较差 级,

不让他们升为10年级 。休斯敦曾曝出过一个令人 事 :一个


连 3年当9年级 , 后直接升 了11年级—通过这样一种狡 运

作,既 让一个成绩较差 于在10年级 中 体分数下滑,

又不至于让他因辍 影响 升 。

德· 奇 底有没有在他 任 参与策划这些操 计数字阴 ,

我们并不清 ,但有一点是 ,他曾 布了一个严格 问责政策,

以奖励那些达 升 目 和 分数目 长,同时对那些


没 达 长予以 降 。可 知,整个休斯敦 长们
必 会积 响应,在这 “ ”上他们可不 落后。但我们必须清醒地

,要 在 估报告上 放异彩,这些 长必须时刻将目 放在心

中,任何与其有冲突 管 方法都不会有 下场。

约州就因为类似 计陷阱 栽了 ,付出了惨 代价。州政

府之 出台了“记分卡” 度,对接受心 搭 人 亡 进

行 计,以 让公众在选择心 科医 时有一个参 。这似乎是一个


合 合 , 且有所帮助 描述 计 在政策 过程中 应 。心

搭 是治 心 最常 和有效 方法,心 人在搭 过

程中 亡比 当 是一个 常重要 数据, 作为个人根本没有办法


了 确切数据,因此政府出 收集并向公众公开这一数据是合乎

。但就是这么一个“ ”政策,却导致了更 人 亡。

心 科医 会在 他们 “记分卡”。但是对于一个外科医

,降低 人 亡 最简单 方法并不是降低 亡人数,因为 部

分医 在救 伤方 已 竭尽 了。降低 亡 最简单易行 方法
是 绝为那些 最严重 人动 。 彻斯特 医 与 医 院

一项 表明,以 务 人为 衷 记分卡, 反 会给 人造

成伤 :在参与 心 科医 中,有83% 医 表示正是由于公开了


亡 数据,一些本 可以从搭 中获 人最终没 被安排进

行 ;79% 医 表示收集并公开 亡 数据 少地影响了他们

治 决策。这一看似有 描述性数据存在一个可 矛盾, 心


科医 也只 性地接受并采取自己 对策,就是让那些最 要心 搭
人远离 台。

作为一个 计 ,不仅时常会“携带”其他描述性数据可 存在 陷

阱, 且就其自 ,将 数据融合为一个单一 数字,这


少都会对现实和真相产 扭曲。从 义 看,任何一个 数对其 成都

是十分敏 ;无 是所采 数据 变化,还是各个数据 权重

变化,都会对 数 最终呈现产 影响。举 ,为什么 国国


式 (NFL)在计算传 效绩 数时不将第三次 地 成

虑在 ?在计算 个国 人类发展 数时, 字 和人 收 两

权重该 何确 ?最终,我们必须 对 重要问题就是, 计算过

程 不 确性无法 ,那么花那么 将众 数据压 成一个数字

就只是为了简单和易于 ,这一切是否 得?有些时 ,这样 确

不 得,就比 (我们之 提 )《 国新闻与世 报道》 排


名。

这份排名动 了16个 计 为 国 院、 和专业院 打分、排


名。以2010年为 ,在为综合性 和文 院排名 过程中,“录取

新 ”占15%。基于 录取 “录取新 ” ,是 所录取 中

成绩占其所在 中年级 10% 比 ,以及录取 SAT 和


ACT( 国 录取 ) 平 分。《 国新闻与世 报道》

排名 在于,这份 单以一种简单易 方式囊 了 几千所

海量 息,就连其 们也承 ,其中收集 有关 国 很


息都是有价 。 有远见 都会 要知道心仪 毕业
和 级平 。

当 ,提 有 义 息与将这些 息浓 成一个权 排名 是两码


事。

在 眼里,这份排名设计粗糙、 人 弟、对 中毕业 长远

发展有百 无一 。“问题之一就在于将教 以数字顺序进行排


名, 原 数据本 并不支持 此精确 操作。”明尼苏达州 卡 斯

特 院 长迈 尔· 弗逊 。 什么“ 友捐 ”要占 综合得

分 5%? 这项 真 很重要,那么为什么不干 占10% 比 ?

《 国新闻与世 报道》 法,“ 一项 都存在一个权重

(表现为百分比 形式),我们会根据这些 重要程度 断不同


权重 小。”可是,有时 断和专断 就是那么 糊。在

这个 国 等院 排名 中,权重最 是“ 名 ”,该

是基于其他院 责人所 一份“同行 估 ”以及 中

升 导员 计得出 。 尔科 ·格雷德 尔向 对排名持怀


态度, 排名更是他猛 击 对 ,特 是同行 估法,在他

看 就是一个笑话。 尔科 ·格雷德 尔举了一个 , 根最

法院 一位已 退休 法官曾 向100 位律师 发了一份问卷,让他


们选出心目中最 10所法 院。宾夕法尼亚州州立 法 院 名字

也出现这份问卷上,其最后 计排名 是宾夕法尼亚州州立 法


院 教 质量居中等 下。但问题出现了,在那个时 ,宾夕法尼亚
州州立 法 院还没有成立。

对《 国新闻与世 报道》收集 所有数据,我们不知道这些排名

底是 给那些即将 门 中毕业 们哪方 导。站在


立场,最 得关注 方 应该是 业本 : 我申请了这所

,我 在 业上获得怎样 帮助? 迷 在一起时 常会 怨传

效绩 数 成,但却没有人否 其组成部分— 成 、码数、 地


得分和 —同样是 估一名四分卫 整体表现不可 重要参 。

但回 排名上 , 就 不同了。《 国新闻与世 报道》过

于强 “输 ”( ,录取了哪些 、教 员工 薪资待遇、
教授所占 比 等),反 忽 了教 “输出”,除了仅有 两个 外

—新 级 和毕业 ,但实际上就连这两个 也不是衡量教 质量

。正 迈 尔· 弗逊所 出 :“从这份排名中,我们无从知晓进
所 过4年 习之后, 是否提 了,他们 知 是

否 长了。”

虽 排名看上去是一些无伤 雅 计数据,但事实上, 会导致

一些对 等教 无 行为。举 明, 以计算排名 数据之

一就是 个 获得 资助,可这些钱花得 不 得,排名中却没


有一个相应 衡量数据。那些花更少 钱却给予 更 教 (因此

费也会低很 ) ,却在排名中体现不出优 。此外, 等院

都希 申请本 人数越 越 ,包 那些根本没有任何希


,因为这可以让 们变得 常 门,有助于提升自己 排名。但提
排名无 对 还是对 都是一种浪费, 方 要花 量精 吸

引 , 部分 最后发现自己 也是无 功。

鉴于下一章 与 有关,因此我不 在此打一个赌:《 国新闻


与世 报道》 排名时日不 了。巴德 院 院长 昂·波特斯

得很精辟:“人们喜欢看 简单 答 。什么是最 ?当 是第一

名。”

本章 一直在强 , 计陷阱与数 关 不 。哪怕是令人叹

为观止 精确计算也会混淆 听, 至成为不良动 掩护。有时 哪

怕 确无 地计算出平 数,也无法改变中位数在对真相 描述中更


加 确这样一个事实。 断和正直成为关键所在,就 比一个人 常

法也不 阻止其 下 行一样。渊博 计 知 无法遏 不道德 行

为,无 是 计 还是法律,坏人 是清 地知道自己在 什么!


站根本不知道我是 ,但 又是怎么知道我喜欢看人 录片

不是 连 、动作片 科幻片 ?

有一 时间, 当我打开 飞 页 , 是会弹出一 收看提示,

建议我观看 录片《布 》—一部关于巴基斯 尔·布

平与 惨遭遇 “ 有深度与 动性” 影。我对这部 影 印


不错, 且也把《布 》加 了我 观看 表中。最神奇 是,在

那些 飞推荐给我 影片中, 是我之 看过 影片,那么 无 问

这些影片都是我 常喜 。

飞公司是 何 这一点 ?在其公司 部是不是有一 实习 ,

整天在 站上搜 有关我 息,并综合了我 人和 友 观影


兴 ,得出我可 会对一位巴基斯 录片 兴 ?当

不可 。 飞公司只不过是掌握了一些 常 杂、精 计

。 飞公司 至根本不知道我是 ,但却知道我过去喜欢看什么类


影(因为我曾 在 站上为这些 影打过分)。基于这一 息,再

加上其他 分以及一台强 , 飞公司对于我 影品位

测精 得令人 。

我将会告诉 飞公司 出这些 测 具体算法,现在最重要 一点

是:这所有 一切都基于相关性。 飞向我推荐 影与我喜欢 其他

影片类似,此外,该 站还向我推荐得 些 友 度 价 影片,


这些 友 打分恰恰与我 打分 常接近,可以 这些 友是一 与

我“臭味相 ” 观影 。 录片《布 》之所以会出现在我 页


上,是因为我给另外两部 录片打了满分五颗星,这两部影片分 是

《屋 明人》和《 争之 》。

相关性体现 是两个现 之间相互关 程度, 在 天,温度

低与 淇淋 销量就存在相关性,当温度升 时, 淇淋 销量也会相

应提 。 其中一个变量 改变引发另一个变量 着相同 方向变


化,那么我们 这两个变量存在正相关性,就比 与体重之间 关

,(一般 )个 人体重会重些,个 矮 人体重会 些。

一个变量 改变引发另一个变量 着相反 方向变化,那么这两个变


量就存在 相关性,比 锻 与体重。

凡事都没有那么简单,有些时 也会出现与上述相关性相违 现 。

有些个 矮 人就是比个 人重一些,有些从 不运动 人 至比


运动 苗 ,但无 怎样, 与体重、锻 与体重之间 是存在

着有 义 关 。

对 国成年人 、体重进行随 取样,我们会得 下一幅散

点分布图:
图4-1 身高与体重散点分布图
我们要绘 一幅关于锻 ( 周进行 运动 分钟数)和体重

散点分布图,就会看 一个相反 趋 ,即运动量越 体重越 。但

是,这样一张 由分散 点 成 图怎么看都不 是一个简 易行


计工具。设 一下, 飞公司是以这种方式向我推荐影片 ,那

么公司 部估计早已被数百万名 分散点淹没了。与之相反,相

关性作为一个 计工具 就在于将两个变量 关 精 成一个描述


性数据:相关 数。

相关 数 有两个无与伦比 优 。第一个优 体现在数 表达上,从


本章后 中我们 发现,相关 数是一个区间为-1 1 常数。

相关 数为1,即 相关,表示一个变量 任何改变都会导致另一

个变量 着相同方向发 等量 改变。 相关 数为1,即 相


关,代表一个变量 任何变化都将会引发另一个变量 着相反方向发

等量 改变。
相关 数越接近1 -1,变量间 关 性就越强。 相关 数为零(

接近零),则 味着变量之间不存在有 义 ,就比 一个人

码和 成绩之间 关 。

第二个吸引人 优 在于,相关 数不受变量单位 限 。我们可以计

算 和体重之间 关 性,哪怕 和体重 单位分 是英寸和磅。

我们 至还可以计算出 中 里 数量和他们 成绩之间


关 性, 且我敢 证是正相关(之后 中我会给出 释)。这

就是相关 数 为我们 成 一件 常神奇 事 :将 量芜杂无

序、单位不 一 杂数据(就比 上 、体重散点分布)加工


成一个简洁、优雅 描述性数据。

实现过程是怎样 ?

之 一样,我已 在本章后 添加了一个常 相关 数计算

公式。相关 数通常不是一个徒 计算出 计参数, 是 要 助

微软Excel办公软件 其他办公软件, 只 要输 数据,软件就会自动


求得两个变量之间 相关 数。整个过程 起 并不是很 ,相关

数 计算过程 下:

1.计算出两个变量 平 数和 差。还是以 和体重为 ,我


们会得出样本人 平 和平 体重,以及 们 差。

2.对所有数据进行 换,表现为 离(也就是 差) 形式。请


我 述,这一步并没有 那么 杂。 设样本 平
为66英寸( 差为5英寸),平 体重为177磅( 差为10
磅)。 为72英寸,体重为168磅,就表明 于平

1.2个 差, 公式 表述即为[(72-66)/5]=1.2, 于平

体重0.9个 差,即[(168-177)/10]=-0.9。 确,
于平 ,体重却 于平 体重,我们可以 “异常” 形

,但是既 花钱买了我 书,那我就不 不 下 —暂且

又 又苗 吧。注 了,在此之 和体重数据后 还


着单位—“英寸”和“磅”,现在却被 换成了简简单单 1.2

和-0.9,单位神奇地消 了。

3. 了这一步,我只 要,让 成剩下 工作。通过公式,

会整合样本里所有人 和体重 差数据,并最终为我

们揭示 和体重之间 关 。 样本中有些人 于平


1.5 2个 差,那么他们 体重相对于平 会呈现一种

什么 ?那些 接近平 人,他们 体重又会有什么变

化?

一个变量和平 之间 离与另一个变量和平 之间 离在

相同方向上 度吻合( , 特 矮 人 体重一般也会特

重 ),那么我们就可以断 这两个变量之间存在着强 正相关关


一个变量和平 之间 离与另一个变量和平 之间 离在

相反方向上 度吻合( ,锻 时长 于平 人,他们 体


重也 低于平 ),那么我们就可以断 这两个变量之间存在着强
相关关 。

两个变量无 在什么分 式下都无法呈现出 律( 尺码


和锻 时长),那么这两个变量之间就不存在 基本不存在相关性。

上述 让 受苦了, 消息是我们 上就要 松 付费 影

话题了。但在此之 ,我们先 活中另一个与相关性息息相关


事 :SAT 。是 ,就是 名 国 测 ,也叫SAT推

测 。这一 化 由3部分组成:数 、阅读和 作。 曾

参加过SAT , 很快 将参加这项 ,但是 很有可 从 没有


过参加这个 底有什么 义。该测 目 在于,

,并 测他们进 后 表现。当 ,有人会问(尤其是那些

不喜欢 化 人):这 道不是 中应该 事吗? 道在


老师 眼里,一场历时4个小时 道比 中4年 成绩都重

要?

这些问题 答 其实都隐藏在第1章和第2章 里。 中时 成绩
是一个有 陷 描述性数据。一个选修了数 、科 等 性较

程 ,可 末成绩很一般,但其 和潜 可 要优于那些

虽 成绩很 但选 程都较为简单 同 同 。 将 个 进行
向比较,那么这类差异就会更 了。 国 委员会 责SAT测 出

题和管 ,据委员会成员介 ,SAT测 衷就在于“让 位 在申

请 时都 得 公平 对待”。 得对!SAT将 进行了 化


加工,让 在录取 时有了一个简单明了 参 。但SAT测 究
竟是不是一个 价 呢? 要找一个 价 一 并

不 ,我们可以让所有 中毕业 一个百米测 ,也 分出优 ,

且比SAT花费少和易于操作。不过有一个问题,百米短 成绩与
表现可以 不相关,这是两个不相关 变量,虽 数据收集并不费

劲,但 也不会告诉我们有 义 。

那么,SAT在这方 表现 何?我有一个不幸 消息要告诉未 中


毕业 ,SAT成绩在 测 一年级 成绩方 表现得相当不错。

国 委员会 会发布相关性报告。零代表 不相关,1代表 相

关, 中平 成绩与 第一年 平 成绩之间 相关 数为


0.56(为了让 有一个直观 比较,我为 提 一个数据,那就是

国成年 和体重之间 相关 数 约为0.4), SAT综合成绩

(阅读、数 和 作)与 第一年 平 成绩之间 相关 数同样为


0.56。既 SAT测 在 测 表现方 并没有比 中 平 成绩更

优秀,那为什么还要设立这样一个 呢?事实上, 将SAT成绩和

中平 成绩综合起 ,就 得 一个相关 数为0.64 最 测 数。


所以,亲 同 ,我只 了,乖乖地 SAT 吧。

在本章 讨 过程中,我们必须 记一点,那就是相关关 并不等于因

关 。两个变量存在正相关 相关 关 ,这并不代表其中一个变
量 改变是由另一个变量 变化引起 。举个 ,之 我提了一句,

SAT成绩和其 里 数量呈正相关关 ,但这句话 思并


不是 成 长 买5台 摆在 里, 成绩就 提

了,也不是 , 在 看 有助于提 业成绩。

对这样一个相关性最符合逻辑 释应该是,受过良 教 长既

买得起 台 ,也 很 地辅导 习, 其在 中发挥出


色。 数量和 分数很可 都是由第三个变量— 长 受教

程度决 。我无法证明 中 有 数量和 SAT分数之间

相关性(因为教 委员会并没有提 这方 数据),但我 证明


实 SAT分数要普遍 于 庭 活 件相对困 。 国教

委员会提 数据显示, 庭年收 过20万 ,他们 SAT

数 平 分为586; 庭年收 低于两万 ,他们 SAT数


平 分仅为460。与此同时,年收 于20万 庭也 有可 (在

个房产 ) 有 台 , 数量 必要 于年收 低于两万

庭。

几天 ,我开 了本章 创作,也 此 会观看了 录片 影《布

》。太精彩了!这是一部关于一个伟 庭 伟 影。详细 影

资料,从1947年印度和巴基斯 分治一直 2007年 ·布 遇刺,让人


看 荡 回肠。布 演 和采访原 穿插 片, 穿 一 。观毕

此片,我 不吝啬地打了5颗星, 符合 飞 测。

归根 底, 飞运 还是相关性 念。我在 站上给以 看过


影 分, 飞将我 分与其他 进行比较,从中筛选出与我相关性

最 ,这些人 影品位可以 与我是最接近 。数据库一旦建


立, 飞就会向我推荐那些与我品位相同 打了 分, 我又恰

没有看过 影。

当 ,这只是简 介 ,真正 方法要比这个 杂得 。2006年,

飞公司发起了一场比赛,邀请公众参与设计影片推荐 ,以帮助 飞

在现有 推荐方 上提 至少10% 确 (即 在观看 推荐影片后

给出 分正 对应 站之 测),比赛 可以获得100万
奖励。

报名参赛 个人 团队都会收 一套“训练数据”,包含了48万名 飞

注册 对1.8万部 影共计1亿 次 分,但其中有280万个 分


是“ ” ,即只有 飞公司知道 分 具体 ,参赛 是不知道

。参赛 要通过自己 算法和程序, 测出这些“ ” 分

, 飞公司会根据 位参赛 所提交 断其 确程度。在

过3年 时间里,有 自180 个国 团队提交了改进方 ,但在参

之 他们必须满 两个 件:第一,获 必须将算法程序授权给

飞公司;第二,获 必须“向 世 描述 是 何 ”。

2009年 飞公司终于宣布了比赛 最终 :获 为一个7人团队,由

计 和计算 专 组成,他们分 自 国、 地 、加 和以
色 。遗 是,我无法在这里向各位介 他们 获 ,就算本章

补 知 点对此也没有提及,因为他们 成 介 长达92页纸。 飞

影片推荐 品质 庸 ,但无 包装 何精 , 底还是一件

十分普通 事, 至早在 影工业 就已 出现了:找几个 有相


同 味 人并让他们向 推荐一些 影。既 那么 看我喜欢
影,厌 我 为不 看 影,那么 觉得乔治· 尼 新片怎么

样?

这就是相关性 真 。

本章补充知识点
要计算两组数据 相关 数,我们 要 以下几个步 进行。为了

让 更 地 ,这里 个步 都是基于一张15个

与体重 数据表。

1.将 个 换为 :( -平 )/ 差。

2.将 个 体重 换为 :(体重-平 )/ 差。

3.将 个 体重 和 相乘, 会发现,当一个

和体重都 离平 较远时,乘积 绝对 也会较 。

4.将第三步求得 乘积相加,再除以 计对 数量(在这个

中为15),就可以得 相关 数。

这一组 与体重 相关 数为0.83, 虑 相关 数 范


围是从-1 1,因此我们可以 为 和体重之间存在着较强 正相

关关 。
在我们介 相关 数 公式之 ,有必要了 几个数 符号。求和

符号Σ是一个常 计 运算工具,表示 在其后 数据


和。 设有一组数据x 1 、x 2 、x 3 和x 4 ,那么Σ(x i )就 味着

我们应该将4个数相加:x 1 +x 2 +x 3 +x 4 ,即Σ(x i )=x 1 +x 2

+x 3 +x 4 。那么,这组数据 平 公式就为:平 =Σ(x i

)/n。

更符合数 范 格式 表述,那么求和公式就应该 成:

表示x 1 +x 2 +x 3 +……x n ,求和公式 第一项为x 1 (当i=1时),

最后一项为x n (当i=n时)。对于n个数据 ,其平 公式就可

以表示为:
再加上其他通 符号,变量x和y 相关 数r 运算公式可以表示

为:
其中,n代表数据个数,x¯代表变量x 平 ,y¯代表变量y 平

,σ x 代表变量x 差,σy代表变量y 差。所有 计软

件都具 计算两个变量 相关 数 功 。 , 微软Excel办公

软件 决之 15个 和体重 相关性问题, 运算得

相关 数与 动计算 是一致 ,都是0.83。


买福 彩票,去赌场豪赌、 资股票 货,哪种方式让 《福布

斯》 豪排行 可 性更 ?

1981年, 国约瑟夫·施 茨酿酒公司斥170万 巨资为该公司旗下

旗舰品牌—施 茨啤酒开展了一场 险 市场营销活动。当 国

级杯 赛(即“ 级碗”) 中场休息时间一 ,施 茨公司

就会当着 亿万 观众 ,现场直播一场 开 啤酒品鉴


会, 选 对 不是 人,正是施 茨 对 —米切 啤酒,更让

人 眼镜 是,参加品鉴会 不是 人,正是100名米切 啤酒 忠实

。这样 广告从 至终出现在季后赛 一场比赛当中。类似

直播啤酒品鉴会 共有5场, 场 都 会 邀 请 100 名 品牌啤酒“

”,包 百 、米 、米切 等,让这些啤酒 在自己最钟

啤酒和施 茨啤酒之间进行“盲品”。一边是 火 荼正在进行 业


季后赛,一边是同样激 啤酒品鉴会,那时 广告 至打

出了“看季后赛,喝施 茨啤酒” 字样。

广告噱 很明确:即 是那些自 为喜欢另一种品牌 啤酒 ,在

盲品时也会发现自己更 施 茨啤酒。啤酒公司 至还请了一位

业 赛 裁 督整个活动过程。 虑 在数量众 观

众 举办这样一场 满 险 啤酒品鉴会, 会觉得施 茨啤酒

口 一 特 ,否则哪会有 搞这样 宣传,是吗?

那可不一 。施 茨只 要 产出口 平平 啤酒,再掌握一些扎实

计 知 ,就 确 这项计 会成功—注 ,我在 作时通常会


常 地 “计 ”这样 ,尤其是 举啤酒广告这样 。

施 茨所 产 这种啤酒喝起 没什么特 , 绝 数其他品牌

同类啤酒几乎没有太 差 ;但讽刺 是,正是这一点成为施 茨啤酒

广告营销 核心。可以 是, 在街上随 找几个喜欢喝啤酒

人,他们基本上区分不出施 茨、百 、米切 米 啤酒。

因此,取其中任 两种品牌 啤酒进行盲品测 ,猜对品牌 基本

上和扔硬币差不 。 体 看,有1/2 人会选择施 茨,剩下1/2 人

会选择“ ”品牌 啤酒,单看这样 可 无法 成一个有

广告营销(我们 不 “既 口 都差不 ,就选择施 茨


吧”)。 且,施 茨啤酒公司绝对不会 自己 忠实 ,因

为差不 有1/2 会“不小心” 选其他品牌 啤酒。

一 原本忠实于 品牌啤酒 消费 在盲品时竟 觉得竞争对


啤酒 喝,这个品牌该有 哀啊,所以,施 茨就让这样 事 发

在其他品牌 上。施 茨 明之 在于,只邀请那些 称自己 另

外一个品牌啤酒 消费 参加测 。 盲品 真 抛硬币一

样,那么就会有1/2 百 、米 米切 啤酒 最终选择施

茨。这下施 茨扬眉吐 了,因为有1/2 百 啤酒 更喜欢喝施

茨!

更 是,这一切都在 决赛 中场进行直播, 且由一位

穿裁 裁 法整个盲品过程。毕竟是 直播,就算施
茨已 私底下进行了 量 ,并证明了有1/2 米切 啤酒 会
选择施 茨啤酒,又有 证在最终直播 时 不出岔 ?万

一“ 级碗”直播时选取 100名米切 味觉特 灵敏呢?虽

盲品测 在 上等同于抛硬币,但万一就是有绝 部分人恰巧选择了

米切 呢? 我们让100个人排成一队,逐个抛硬币,出现85 90个硬
币反 向上 可 性也是 存在 。对于施 茨公司 ,在直播时

碰上这样 将会对 们 品牌造成 灭性 打击(更不必 于

买广告时 那170万 了)。

计 在这种时刻就体现出 了。 这个世 上存在一个 计

领 “ 级英雄”,那么这时 就会是这个英雄俯 飞 施

茨公司 部,并向在场 层揭开被 计 称为二项分布(又名伯努

) 秘。二项分布 主要特点有, 次数是固 ( 100

位啤酒盲品 ), 一次 都有两个可 (施 茨 米切

), 且 一次“成功” 都是相等 ( 设选择任 一个品牌


啤酒 为50%, 选择施 茨 就表示 “成功”)。我

们同时还 所有 都是各自 立 ,即一位盲品 决 不会影

响其他人 选择。

有了这些 息,这位 计 “ 级英雄”就 计算出所有可 出现

不同 , 52人选择施 茨,另外48人选择米切 , 是31

人选择施 茨,另外69人选择米切 ,这种 发 是 少。当

,对于我们这些不具 级运算 凡人 , 助一台 同样

也可以办 。 所 有 100 位 盲 品 都选择米切 是


1/1267650600228229401496703205376,这可 比这些人在中场休息时被
陨石砸中 还低。重要 是,重 这些基本运算, 让我们知道

个 范围 积 , 有不 于40位盲品 选择施 茨

是 少。这些数据 以让施 茨 市场营销人员松一口 。

让我们 设,要让施 茨公司满 ,100位盲品 中至少要有40位选择施

茨啤酒。这是一个 常可观 数字,因为所有参加盲品直播 人都曾

旦旦地 明自己是米切 忠实 。 要达 这样 效 ,其实

一点 都不 。 盲品会 真 抛硬币一样,那么运 基本

知 ,就 得出至少有40人选择施 茨 为98%,至少有45人选择施

茨 为86%。从 上 看,这场 营销活动其实并没有很


险。

那么,现实中 又 何呢?在1981年“ 级碗”中场休息 现场,


正 有50% 米切 啤酒 消费 在盲品测 中选择施 茨,不 不少,

正 1/2。

从这个 中,我们可以得 两个重要 启示:第一, 是一个 常


强 计 工具;第二,20世 80年代 销品牌 啤酒确实在

口 上没有什么区 。本章将主要就第一个启示展开叙述。

是一门研究不确 事件和 问。 资股市存在着不确


性,抛硬币同样也存在着不确 性,因为有 时 得 是硬币 正

,有 时 是硬币 反 。连 4次抛一 硬币更是 加了这种不确


性,因为 一次都有可 是正 反 , 里有一 硬币并且连

抛了4次,我事先无从得知4次 确 ( 也不 ),但我可以事

先告诉 一些 ( 两个正 、两个反 )出现 要 于另一些

( 4个正 )。从施 茨 里我们已 看 , 这类基于 推导

出 会发挥 不 作 。事实上, 弄清 了为什么连


4次抛同一 硬币 是正 为1/16,那么 (再稍微 一

点功 )就 活中那些与 相关 现 ,从 险业 运作原

队 排兵布阵和赛场取舍。

我们先从简单 部分开 起。 事件 是明确 , 抛一

硬币 是正 为1/2,掷一粒 得 1点 为1/6,还有

一些事件 从过去 数据中推导出 。在 国 业 比赛

中, 地得分后 位 再得一分 平 为0.94,也就是 , 100

个 位 中有94个会成功。当 ,这一数据会随着不同 员、不同天


环 以及其他因 改变 有所不同,但不会发 变化。在获得并

任此类 息 提下,决策 常常 看清 险、作出决 。举个

,澳 亚运输安 局发布了一份有关乘坐不同交通工具致 险

量化报告, 都觉得飞行 常可怕,但实际上商业航空旅行 险是

微乎其微 。澳 亚自20世 60年代起就再没有发 过一起商业航空

致 事故,因此航空旅行 一亿公里 致 基本为0。汽 一亿公里


旅行 致 为0.5,真正吓人 是摩 致 , 立志成为一

名器官捐 ,那么 就选择摩 出行吧,因为摩 致 比汽

整整 出35 。
2011年9月, 国航空航天局 一颗重达6.5吨 卫星退役, 计在进

地 层后开 分 。那地 上 人被卫星残骸砸中 有


呢?我们是不是应该让 们待在 中不去上 ?据 国航空航天局

一名火箭科 计算,任何一个人被坠落 卫星残骸砸 是21万

亿分之一。要知道,在地 上任何一个 落不幸被 撞 可是

3200分之一。最终,卫星在坠落地 过程中 体,科 们无法确

所有碎片 具体位 ,当 ,也没有出现任何人员伤亡 报告。 并

不会确凿地告诉我们将会发 什么,但我们通过 计算 知道很有


可 发 什么、不太可 发 什么。 明 人会 这类数据为自己

事业和 活 明方向,比 当 从广播里得知将要有一颗卫星坠落

时,不会 上一台摩 速开回 提醒 人不要出门。

当涉及 险 问题时, 惧会让我们忽 数字 后 真相,反 对那些

真正 危险 不见。在史蒂芬· 维特和史蒂芬·都伯纳所著 《

济 》一书中,提 了一个 人 发现,那就是后院 游泳池远比

里 得危险。 维特和都伯纳计算,10岁以下 童在游泳池

溺 要比 击事故中 外中弹 亡 100 。康奈尔

3位研究人员嘉瑞 ·布雷 、维 达·卡地亚丽和丹尼尔·西蒙在一


篇引人 文中这样 道,可 有数以千计 国人在“9·11”

怖袭击事件发 之后由于 怕坐飞 于 命。我们永远都不知道遭

受 怖袭击 真正 险 底有 ,但我们知道开 确实是一件危险

事。在“9·11” 怖袭击事件发 之后,越 越 国人选择自 出

行, 不选择乘坐飞 。据 计,在 虑平 亡 和天 等导致


交通事故因 提下,2001年10~12月,平 个月因交通事故致

人数比以往 了344人。该效应随着时间 推移逐渐 弱,这是因为

对 怖主义 惧在 消退,但这项研究 作 为,“9·11”

怖袭击事件导致 亡人数 已 过2000人。

有时 还可以在事后告诉我们,什么 是最有可 发 , 什

么 是最没有可 发 ,比 DNA分 。 《 现场 :迈

阿 》里有这样一个场景,技 人员在 现场附近收集 一个丢弃

苹 核,上 残 着唾液,当 唾液上不可 着 人 名字,


就算让一位英 技 员 最先进 显微镜也观 不出什么。但是,唾

液( 发、 肤、 碎片等)里却 找 DNA片 ,这里 包含着

一无二 基因 息— 个人 基因都是不同 (除 是共享相同DNA 同

卵双 )。 医 专 证实DNA样本吻合,就 明 方 取证工作取

得了重要进展,但这还远不是 部。是 ,从 现场收集回 DNA样

本必须与 人 上 DNA相匹配,但 方同时还必须证明这两个


DNA样本相吻合不是一个巧合。

人类 DNA序 中有很 片 是相同 ,就 我们中有很 人 有相同

码、相同 、相同颜色 眼睛,事实上我们 DNA序 中有 过


99% 片 都是 一样 。 研究人员只 获得一小部分DNA样本,

那么这上 基因数量也是有限 ,很有可 有数百万人 基因片 与

实 室中 这部分DNA样本 吻合。因此,基因数量越 ,上 自
遗传变异也就越 ,取证 确 也就越 。换 之,DNA样本与 个人

DNA相吻合 也就越低。

不知道 是否看明白了。让我们 一下, 设 “DNA数据”由

和社 号码组成,这19个数字组成了 一无二 。 一个数

字都代表一个有10种变化可 基因:0、1、2、3等。 在 现
场, 人员发现 “DNA数据”残 片 为:__459___4_0_9817___,

且正 与 “DNA数据”相吻合。 吗?

应该明确3件事。 先,除 是 部19个数字都吻合,否则 会有不确


性存在;其次,数字发现得越 ,不确 性就越少;最后,不要忽

景和事件 去 。 发现 时 , 正在 速 汽

逃离事故现场, 且口袋里还装着受 卡,那 这个“DNA数

据”尽管不 确 ,但也 以 方将 绳之以法了。

在资源和时间都 常 分 下,研究人员会对DNA中 13个不同区

进行一一比对,两个人 DNA在所有13次比对中都吻合 是 常低

。“9·11” 怖袭击事件发 以后, 国政府就是 DNA技 核实

遗体 份 。收集袭击现场找 DNA样本,再与受 人提 DNA


样本进行比对,在这个过程中出现 错遗体 是10亿分之一, 至

更低。随着越 越 遗体被 并 领,剩下 遗体数量越 越少,

出现混淆 也在下降,因此DNA比对 也逐渐放宽。


但在很 时 我们 资源是有限 ,可 是收集 DNA样本太小,也有

可 是样本已 被污 ,导致无法 测出 部13个基因片 , 闻

和争议由此引发。《洛 矶时报》在2008年 时 连载了一组报道,讨

方是否应该将DNA 测 纳 刑事 件 举证范围 。该报特 提

出了一项质 ,在法律实施过程中 是否低估了巧合 可

性,因为收集 世 一个人 DNA 息毕竟是不现实 ,可以 国


邦 局和其他 提交给法庭 DNA证据都是估计出 。

亚 那州一个 实 室 分 员在测 本州DNA数据库时,发现两个

没有血 关 重 DNA序 中 第9组基因相吻合,这一发现引发

了 波,因为根据 国 邦 局 法,无血 关 两个人第9

组基因相吻合 仅为1130亿分之一。在随后 中,其他州 DNA

数据库也发现了第9组 至更 组基因吻合 人,数量 过1000对。这个


问题将 何 决,还是 给法律 行 及辩护律师去思 吧。我现在

是, 科技耀眼光环 DNA分 ,归根 底仍 是一个 问

题。

很 时 ,了 重事件同时发 是很有价 。 且 发

灵 可 性有 ?两个 立事件同时发 取决于这两个

事件各自 ,也就是 ,事件A与事件B同时发 是这两个事

件发 乘积。举个 可 会更直观一些,抛一 硬币得

正 上 为 1/2 , 连 抛两次都得 正 上 为

1/2×1/2=1/4,连 抛3次都得 正 上 为1/8,连 抛4次都得


正 上 为1/16,以此类推。同样,连 抛4次硬币都得 反
上 也应该为1/16。这也 释了为什么 办公室 会

弹出一个对话 ,提醒 提 开 码 “安 级 ”。 设 开

码 为 6 位 , 且 是 数 字 , 那 么 共 有
6
10×10×10×10×10×10=10 种数字排 组合,不要以为这种组合很

杂,对于计算 ,不 一秒钟,就可以将这些数字排 组合 都

一遍。

所以, 设在 管 员向 发表长篇 之后, 终于同 将字

加 码设 范围 ,那样 话,6位 码就有了36种选择:26个

字 加 上 10 个 数 字 。 可 组合出 码数量也上升 了
6
36×36×36×36×36×36=36 个, 过20亿个。 要求将 码长

度 加为8位, 且强 建议 #、@、%、!等符号—芝加哥 就
8
是这样 ,那么可 组合出 码数量 升至46 , 过20万亿
个。

有一点必须再次强 :这一公式只适 于相互 立 事件,也就是 ,

一个事件 发 及其 对另一个事件不会造成任何影响。 , 第
一次抛硬币得 正 上 并不会影响 第二次抛硬币得 正

上 。相反 ,今天下 与昨天是否下 并不是相互孤立

,因为下 作为一种天 现 具有连 性,有时 常连 几天都下

。同样 , 今年出 祸 与明年出 祸 也不是相互孤立

,今年导致 出 祸 原因很有可 也会导致 明年发 类似

祸,比 有可 常酒后 、喜欢 人 、习 开 时发短


, 技很差。这也是为什么 险费 会在发 祸后上升,
并不仅仅是因为 险公司 要从 这里挽回一点 们为 支付

金,更重要 是, 们 有了关于 未 发 祸 新 息—当

开 撞向 库 门之后,这个 就上升了。

对发 这个事件 发 那个事件 兴 ,也就是出现 A

出现 B (再次 设两个事件是相互 立 ),这个 就是

A和B各自 之和:A +B 。举个 ,掷一次 得 1点、2

点 3点 就是 们各自 之和:1.6+1.6+1.6=3.6=1/2。这个

问题 起 应该不 ,掷 会得 6种可 ,点数1、2 3出


现 占了所有出现 1/2,因此我们有50% 掷出1、2 3

点。 我们在 斯 加斯赌双 ,掷出7点 11点 就是两颗

点数相加为7 11 组合数除以 共可 出现 点数组合数,得 答

是8/36。

通过 计算,我们还可以得 在所有管 决策 过程中,尤其是在

金融领 是最实 计工具: 。 是基础 升级

版。 个事件 买彩票 收 ,实际上就是所有不同

和,其中 个 都是由各自 和收 相乘 。 往常一样,我

们还是 明这个问题。 设 参与了一个掷 游戏,游戏


则是掷出1点可以获得1 ,掷出2点可以获得2 ,掷出3点可以获

得3 ,以此类推。那么在这个游戏中,掷一次 是 少?

一个 都有1/6 ,因此 为:
1.6(1 )+1.6(2 )+1.6(3 )+1.6(4 )+1.6(5

)+1.6(6 )=21.6,即3.5 。

粗 看一下,3.5 似乎是一个无效数据,毕竟 不可 掷一

次 就获得3.5 (因为所有收 都是整数)。但事实上, 是

一个 常有 参 数据,通过比较成本 和 收 , 就 知道

这件事是不是“ 得”。 在上述游戏中, 掷一次 要 纳3

, 还 吗?当 ,因为 回报(3.5 )要 于游戏成本(3


)。这虽 并不代表 第一次 就 证 赚 钱,但至少可以帮助

清哪些事 得 险。

在上 这个 基础上,我们可以进一步将 延伸 国 业

领 。之 提 ,在比赛中 地得分之后, 队将会 临两个选

择,要么直接射门再得一分,要么进行一次两分 尝 。 选择

,则在三码 点 穿过 门 即可; 选择后 ,则 要

从三码 将 带 传 门区把对方逼成 ,可以 其 度之

。因此, 队可以选择简单 打法得1分,也可以选择 度 打法得


2分。应该怎么选?

计 不 ,也从不和啦啦队队长约会,但他们却 为

队教练提 导。在 文中已 提 , 地后成功点射 为


0.94,也就是 这一尝 为0.94,因为回报(1分)乘以成功

(0.94)得 为0.94分。没有队伍 在比赛中打出0.94分,但


这个数字 量化 地后 一种选择,从 与另一种选择—2分尝 进行
直观 比较。2分尝 要低得 ,才

0.74分,虽 回报很 (2分),但成功 却低得可怜(0.37)。由此可

见, 比赛只剩下一秒钟 时间,一支队伍在 地得分后还落后对 2


分,这支队伍 无选择,只 进行2分尝 ;但 支队伍 于领先,

其目 只是在比赛中 比分优 ,那么就应该采取得1分策 。

运 与上述 相同 基础性分 ,我们还可以 释为什么永远不要买

彩票。在伊 诺伊州, 张彩票 都印着不同 法和等级 中奖

, 我买了一张1 即开 彩票,在彩票 印着 细小文字里

我可以找 不同等级奖金 中奖 :1/10(1 ,即 费再 一

张)、1/15(2 )、1/42.86(4 )、1/75(5 ),一直

为1/40000 1000 。我将 一个等级 中奖 乘以奖金额度,最

后将得 相加,计算出 买此类彩票 。 是这种1


彩票 回报 约为0.56 ,所以这绝对是一项 糕 资。但我

运 还不错,中了2 。

虽 我中了2 , 无法改变 买彩票是一种 蠢行为 事实,这就

是 教给我们 重要 之一。通过 计算得出 决策,有时会

得 坏 ; 坏 决策— 在伊 诺伊州 买1 即开 彩票—有

时还是会有 ,至少从短 看是这样。但最终“笑 江湖” 还是

,因为 也打败不了 。有一个重要 律叫作 数 律,即随

着 次数 , 平 会越 越接近 。是 ,我今天
买彩票 确中了2 ,我明天也有可 再中2 ,但 长年 月地

买下去, 天买 都是这种 回报为0.56 1 即开 彩票,那

么 钱将是 庸 事, 了买 100万张彩票 那一天(也就 味着

我花了100万 ),我最终 中奖金额约为56万 。

我们也可以 数 律 释为什么赌场从长 看 是挣钱 问题。

赌场 所有项目 都是有 于赌场老板 (出“老千” 赌客不

虑在 )。 赌场 营业时间 长,吸引 下注人数也 ,那


么赌场从赌 赚 钱 要比付出 要 。通过 数 律,我们还可

以 释为什么施 茨要在“ 级碗”中场休息时邀请100位 不是10位啤

酒 参与啤酒盲品测 。下 是“施 茨 ”测 “ 度

数”,测 人数分 为10、100和1000。不要被这个 数 名称吓 ,

其实 数本 并不 杂,X 了各种可 出现 ,Y 表示 是

对应 出现 。 要在这里重申一遍 是:我们 提是所有品


牌啤酒 口 是差不 ,品尝选择 过程类似于扔硬币, 位盲品

选择施 茨 都为50%。我们可以从以下 3幅 数图中看 ,随着

盲品 人数 ,越 越 向中间(也就是有一半 人选

择施 茨啤酒)集中;与此同时,位于曲 两端 端 出现

则下降得 常厉 。
图5-1 选择施利茨啤酒的盲品者人数

图5-2 选择施利茨啤酒的盲品者人数

图5-3 选择施利茨啤酒的盲品者人数
在 文中我 过, 有 于 等于40% 米切 啤酒 在盲品测

中选择了施 茨啤酒,那么施 茨 层就满 了。下 就 举了不同

盲品人数 件下得 满 :

10人:0.83。

100人:0.98。

1000人:0.9999999999。

1000000人:1。

读 这里,我 很 人已 领会“千万 为 价99 打印

买 修延长 务” 含义了。整个 险行业都是建立在 基础之

上, 修只不过是 险 一种表现形式 已。为 件东西上 险也就

味着与 险公司签订了合同,明确 当 些 外发 时, 人

获得一 数额 付。 ,在 汽 被盗 撞 上之后, 就可
以根据所 买 险合同进行 。但在享受 这一项 务之 ,

要支付一笔费 ,以换得一 限 。对于 险公司 ,为

了从 这里获得 额 费, 们 要承 被盗、撞 ,

至因为 差劲 技 引起 各种 辆损坏 险。

为什么这些公司 承 这些 险?原因就在于, 险公司

费 正确合 ,从长 看将会给公司带 不菲 收 。 事达

险(财 500强公司之一)承 辆中 有一些会被盗,还有一些


会因 主 撞 消防 送进修 厂,我 中时 友就遇 过这

种 ,不仅 辆撞坏, 还要 那个被撞坏 消防 —贵 令

人无 。但无 是 事达还是其他任何一 险公司, 们承 辆


中绝 部分都不会发 事故。为了挣 钱, 险公司只 要 证收取

费 于付出 金就行了,为了 这一点,公司必须清 地知道

合同里 一项 可 会带 金额,行业 叫作“ 损

”。这和 是 相同 念,只不过是套上了 险 外衣。

设 额度为4万 , 年被盗 是1/1000,那么该 年

损 为40 , 险 费组成中盗窃险种 价就应该 于40 ,


这样看 , 险公司和赌场、伊 诺伊州彩票 性质是一样 , 们都

要付出,但从长 看,得 要比付出 。

作为消费 , 应该知道,从长远 看, 险并不 为 省钱。 险


为 是,当 遭遇一些 以承受 巨 损 时, 价 4万 汽

被盗、35万 房 被烧 等,为 提 付,帮 渡过 关。从

计 度 看, 买 险是一项“ 糕 资”,因为平 看,

支付给 险公司 钱永远要比得 付 。但 防止一些 以

掉 活 出现, 险就是一个 性 工具。讽刺 是,一些巨

巴菲特 是可以不 买 险、房屋险, 至医 险,从 省下不


少钱,因为就算有再 糕 事 发 在他 上,他都 承 得起。

最后,我们 那价 99 打印 。 设 刚刚从百思买 其
他地方精 细选了一台 潮 激光打印 。当 账 时 ,销售
人员会向 提 一份详细 修延长清单,比 额外支付25 ,可

以延长一年 费修 更换 务,支付50 可以延长维修 务两

年。现在 对 、 险以及基础 济 已 有了一些基本 了 ,

可以很快 以下几点:(1)百思买是一个以 为目 商 ,因

此追求 润最 化是 不变 追求;(2)销售助 正在竭尽所 地劝

买 修延长 务;(3)从 两点 推测出, 买 修延长 务 代


价要 于商 为 修 更换打印 成本, 不是这样,那么

商 就不可 会 此卖 地推销了;(4)就算价 99 打印 坏

了, 要自掏腰包 修 换一台新 器,也不会给 活造成太

困 。

一般 , 为延长 修 务所支付 金额要 于打印 修 费。

应该时刻 记为那些 无法 松承受 外上 险, 其他 就不要

浪费钱了,这是个人 财 核心原则之一。

有些事 可 会在不同时间 出现各种不同 外 ,在 临这类

杂抉择时, 同样 帮助我们 清思 。 设 一个 友建议

向一 研究中心 资100万 于开发 性防 发产品, 会问

成功 有 , 友 回答很 杂。由于这是一个研发项

目,因此研发团队研 成功 只有30%, 最终研 产品 败了,


那么 将收回25万 ,因为这部分资金原本是 着 于市场推广(

测 、广告宣传等) ;即 最终产品研 成功了, 国食品药品

督管 局 为这一神奇 治 发 产品对人体安 并 进 市场
也只有60%; 了那个时 ,即 我们 产品安 有效, 还有

10% 会出现一个强劲 竞争对 ,带着更 产品与我们一同进

市场,占据 部 市场份额。 一切顺 —产品安 、有效, 且竞

争 也没有出现,那么 将获得最 2500万 资回报。

动心了吗?

友提 息量令人眼花 乱。潜在 回报很 人,回报 金额是

资额 整整25 ,在这一过程中,同样 满了各种潜在 陷阱和 败。

一个 出现 都是 确 ,那么 一张决策 形图,

帮助我们 清 息,决 下一步应该 什么、怎么 。决策 形图 出


了 一个不确 因 源,还有所有可 出现 及其 。在

形图 下方,给出了所有回报可 金额和 。 我们将 一个回

报额乘以 ,再将得 相加,就可以算出这一 资 会

。通过观看下图 帮助我们更 地 问题。


图5-4 投资决策
此看 ,这项 资 回报是 常 人 , 达422.5万 。但我
还是不建议 辛辛苦苦积攒 、 将 给 读 钱 进行

资。观 决策 形图, 会发现 回报 于一开 资额,但

不要忘记,最有可 发 是研发 败,以致治 性 发 产品

最终没有 世, 只 回剩下 25万 。至于 对这项 资

口 底有 ,就要取决于 险 向了。对此, 数 律给出 建

议是,对于一 资公司 巴菲特这样 可敌国 个人 资 ,


应该尽可 地发掘上述 这类 不确 但 回报很丰厚 资

会, 且数量越 越 ,几百个项目里 有一些会成功,一些会

败,但平 看,这些 资 最终会 险公司 赌场那样挣 钱。

收 对 有 ,那么涉 项目越 ,赚钱 会就越 。

同样 道 ,我们还可以 释一个有违直觉 现 。有时 ,针对

国人口 测 艾滋 这类 见但严重 是行不通 。 设我们

对 种 见 测 有相当 确度,举 , 10万人中会有

一个人 上 种 , 测 确 为99.9999%,可以 证在 测过程中

不产 一 伪阴性(也就是从不漏过任何一个 上该 人),但产
伪阳性(也就是一个没有 上该 康人被 测为阳性) 为万

分之一。这样就会导致一个 ,虽 这种 测 确

常之 ,但绝 部分被诊断为阳性(也就是 有该 ) 人实际上根


本没有得此 。这会在那些诊断 为阳性 人 中产 巨 ,后

测和治 也会浪费有限 医 资源。

我们对 国所有成年人,即约1.75亿人口进行 测,决策 形图

图5-5所示。

图5-5 某疾病全美国筛查情况
只有1750位成年人 有该 ,他们 测 为阳性。有 过1.74

亿成年人未 ,在这部分 康人 中,有99.999% 人得 了正确

测 ,只有0.01% 人被 为阳性。但1.74亿 0.01% 是一个

常 数字,因此在实际操作中平 将会有1.75万 康 人被告知 有

该 。
这 味着什么?我们一起 分 一下。 共有19250人 测 为阳

性,但真正 只有9%, 且这还是一个 确性 常 、伪阳性 常


低 测。我 不 要作太 释, 就 为什么在 医 开

支 过程中,我们该 不是对 康人 加强 筛 , 是 少这类

测。以艾滋 为 ,公共 康官员 是建议将有限 资源 在“刀

”上,即 在 同性 、采取 注射 吸 分 等 危人

上。

有时 ,我们 助 发现一些可 事 。在第1章 里,我

介 了 化 过程中出现 组织作弊问题,还顺带提 了专门 责

发现此类作弊行为 安 公司。 实际上, 责 行证 交易相关


法律 国证 交易委员会在稽 幕交易行为 过程中, 也是

类似 方法。( 幕交易包 法 部 息 交易相关公司 股票

证 , 即将开展 公司收 —这类 息一般 只有 责此事 律

师事务所才知道)。 国证 交易委员会动 计算 强 分

数亿 股票交易, 图寻找可 行为, 公司收 息即将披

之 进行 额股票 、公司正 宣布亏损 量抛售等。那些


常年取得 收 资 们也是 国证 交易委员会 重点 对

,因为无 是 济 还是历史数据都告诉我们, 年 收 都 过

平 水平对于一个 资 ,几乎是不可 。当 , 明绝顶

资 们 是 测 市场 ,在法律 范围 设计出

资策 ,获得 于市场平 数 收 。一个 资 不一 得

不正当 ,不过 是怎么区分 人和坏人 呢?我 次致


国证 交易委员会 法部门,咨 他们是 助哪些 确 行

为 ,但他们至今也没有给我回 。

在 影《少数派报告》(2002)中,汤 · 斯扮演 是一位 防

探员, 助科技 在坏人作 之 , 测他们 行为。

2002年,这部 影还只是一部科幻片,但 了2011年,这就成了现实。

《 约时报》在这一年 了一篇报道, 题为“在 发 派遣

”, 是圣 兹市 局 程序 测出闹市区 一个 场

将有可 发 汽 盗窃 件,于是自动派遣了一队 往现场, 场

随后逮捕了两个形迹可 、偷瞟 窗 人,其中一个人是 局

常客,另外一个人 上携带着 品。

圣 兹市 程序是由两位数 、一位人类 和一位刑事

共同设计 。芝加哥 局还专门设立了一个 测分 小组,原因

是这个 市 暴 主要源自团伙作 , 这些团伙 作 往往


有 律可循。在《数据 掘和 测分 : 报收集和 分 》一书

中,作 将 计 运 法过程中,开篇是这样 :“目 在

侦 领 , 测未 已 成为可 ,诸 趋 、 断社区

点、优化资源 度等,以求最有效 地为市 提 最 护。”(对

了,这些 我 给 们看就行了,亲 读 们就不必费心再去读

那本书了。)
“ 测 法”属于 测分 一部分。 是带有不确 成分,

就 没有一方 确切地 会撞 、 会还不起贷 。在 临这些


险时, 帮助我们 上正确 分 道 。此外, 息 收集

和积 让我们更 地 相关事件 。在 满不确 性 商业

世 里,商人们 是希 将他们 险量化,放贷 会要求 看贷

人 收 证明和 分,但这些迟钝 工具在 测未 方

作 其量不过是史 洞穴人 中 石器, 量 数据和廉价

计算才真正 为我们揭示人类 行为。 险推销员 确地将他们


行业描述为“ 险 移”,因此他们最 先 移 险究竟是什

么。 事达这样 险公司之所以成功,是因为 们知道并重 那些

在 人眼里可 无关 随 事件:

●年 为20~24岁 司 最有可 造成致命交通事故。

● 在伊 诺伊州最 常 窃 是本田思 (亚 巴 州为 尺寸

佛兰 卡)。

● 一边开 一边发短 易造成事故,但各州出台 禁止开 发短

法律似乎并没有遏 这种行为。事实上,这些法律 至有可


让 变得更 ,因为司 在发短 时会 办法将 藏得更为隐

蔽,更加不把心思放在专心开 上。

卡公司一直 于这类分 法 沿,原因有二:这些公司 数据库


里 存着 量有关我们消费习 数据, 且 们 商业 式离不开那
些 险适中 客 。那些 有最 记录 客 个月 时

付清账单, 卡公司没法从他们 上赚得一点 息;那些账单数额

巨 且 常忘记 时还 客 才是 卡公司 “金主”, 额

息给公司带 了丰厚 润,只要这些客 不违约就行。 营汽 产品

及其他零售商品 加 轮 公司有一位“ 数 席 行

官”J·P· 丁,他专门研究在 对商品时,哪些人更 掏钱消费,


哪些人 向于 离开。这是一个 常有 题, 丁对上一年

加 轮 名 卡消费 一笔交易数据进行了数据分 ,发现

在综合 虑收 、 录等传 计 基础上,观 消费 买

了什么商品 确地 测出他们接下 消费行为。

《 约时报》上一篇 题为“ 卡公司对 知道 少?” 文章

描述了 丁发现 一些有 现 :“选择 买价格 宜、通 汽油 消

费 有错过 卡还 日 可 , 那些选择 名牌商品 消费

是 常 时还 ,那些会为 里添 一氧化碳探测器 套防止


伤地板 人几乎从 不会延 还 ,所有 买骷 造 汽 挂 对

汽 排 进行 排量改装 人基本上不会 时还 。”

当我们在 活中遇 不确 因 时, 是一个可 参 工具。


不应该 买彩票; 有一个长远 资 野,那么 应该把钱

股市(因为股票是 带 长 收 一种典 资品种); 应该为

些东西 买 险,其他东西就算了; 至还 助 在游戏竞赛

节目中 (下一章 就会 )。
虽 了( 了)这么 ,但还是要再 一句: 并不是确 。

不应该 买彩票,但 有可 通过 买彩票发财。是 ,

帮助我们揪出作弊 、追 坏蛋,但若 不当,我们就有可


把无辜 人送进 。这就是为什么我要 第7章 。
在《让我们 个交易》节目中,主持人打开 3号门后 是一 ,在剩

下 1号门和2号门中必 有一 门后 是汽 , 应该 何选择才 中

奖?

“蒙提· 尔 ”是一个著名 题。1963年 国开播 游

戏节目《让我们 个交易》中,参赛 们就会 临这个 题。正是这个

亘古不变却又兴致 ,让这类竞赛游戏长 不衰,至今有


国 台 在 作并播放类似 节目。记得读小 时 一回

我就会打开 观看《让我们 个交易》。这个节目给 计 带 了

巨 喜,关于这一点我在序 里已 过了。 一 节目播 最

后, 会有一个参赛 颖 出,站在主持人蒙提· 尔旁边,在他们

眼 有3 巨 门, 号分 为1、2、3。蒙提会告知参赛 ,其中

一 门 门后摆放着 为 人 奖(比 一辆小轿 ), 另外


两 门 后 各站着一 ,参赛 要在这3 门中选择一 门,并获

得那 门后 奖品。( 有参赛 选中了 ,我怀 他们是不是真

会把那 回 ,因为在普通人看 ,绝 数参赛 都希 开

一辆新 回去。)

游戏刚开 时,中 奖 一目了 ,两 和一辆 ,参赛 有1/3

选中那 后 是轿 门。但正 之 提 ,这个节目及其

主持人蒙提· 尔之所以 在 国 本中占得一席之地,是因

为这个节目还有一个精心 安排。当参赛 选择了一 门之后,蒙提会

打开剩下 两 门中 一 ,向观众和选 展示这 门后 奖品—一


, 后蒙提会再次 问参赛 是否要改变当 选择,也就是在最
选择 那 门和剩下 那 门中再选择一次。

为了让表述更加清 ,我们 设参赛 最 选择 是1号门,蒙提随后打

开了3号门,发现门后站着一 活 。此时,场上还有两 门是关着 ,


1号门和2号门, 小轿 藏在1号门 后 ,那么参赛 就中奖了,

小轿 藏在2号门 后 ,参赛 就会与 奖 之交臂。但就在这个时

,蒙提并不 于揭晓答 , 是再次 问参赛 是否 持原 选

择, 参赛 改变主 了,就相当于放弃了一开 选 1号门, 改选

2号门。记住,这两 门此时 旧 闭着。参赛 唯一得 新 息是,

在自己刚刚没有选择 那两 门中,至少有一 门 后 是一 。

参赛 应不应该改变最 选择?

答 是 。 参赛 持最 选择,那么中 奖 为1/3;

改选剩下 那 门,那么中奖 就是2/3。 不相 话,

请往下读。

我承 这样 一个答 似乎有违直觉,因为在这个过程中,参赛 中

奖 似乎一直都是1/3,不管这个参赛 后 有没有改变选择。一共

有3 关闭 门,一开 时 一 门后 藏着 奖 都是
1/3,但是当参赛 改变自己最 选择 选择另一 门之后,中奖

会随之变化吗?
问题 关键就在于,主持人蒙提· 尔本人是知道 一 门 后 奖品

。 参赛 选择了1号门, 且恰 小轿 就在这 门 门后,那么

蒙提就可以在2号 3号门中随 选一 门打开,向观众展示一 。

参赛 选择了1号门, 小轿 在2号门后,那么蒙提就会打开3号

门。

参赛 选择了1号门, 小轿 在3号门后,那么蒙提就会打开2号

门。

通过改变之 选择,参赛 就 从两次选择中获 , 自 要比一

次选择 。为了 ,我会 3种不同 方法 证明这一分 正确

性。

第一种是从 主义 度出发 。2008年,《 约时报》专 作 约

·泰 尼专门就“蒙提· 尔现 ” 了一篇文章。随后这份报纸还在

站上开辟了一个互动专题,读 可以亲 体 这个游戏,包 提示

是否要改变选择,游戏 最后 至还有可 小 和小轿 从门后 出

揭晓答 。这个游戏会记录下 改变和 持最 选择 成功 , 可


以 一下。我特地让我 小 了100次这个游戏, 次都在打开一

有 门后改变最 选择; 后又找 哥哥 了100次, 都 持一

开 选择。我 有72次中了 奖, 只中了33次。他们都从我

这里获得了两 辛苦费。
《让我们 个交易》节目 计 也印证了这一点。《醉汉

步》 作 纳德·蒙洛迪诺也证实,那些改变选择并得 奖 参赛
人数是 持最 选择并中奖 参赛 两 。

我 第二个 释是从直觉出发。 设游戏 则有变, 先参赛 会在1、


2、3号门中 选一 , 后主持人蒙提在打开一 门之 ,问道“ 是

否 放弃 之 选择,换取另外两 门后 奖品?”也就是 ,

选择 是1号门, 可以放弃那 门,从 获得2号和3号门后

奖品; 选择 是3号门, 可以换成1号和2号门。

这并不是一个 常 作 决 。显 易见, 应该放弃一 门换取两

门,这样 中 奖 就从1/3上升 了2/3。接下 ,就是见证奇迹

时刻了:蒙提· 尔在节目中展示一 门后 ,其实 是相同

事 。一个最基本 道 , 选择两 门,那其中 有一 门

门后是 。主持人在问 是否要更换选择之 ,打开了一 门后有


门,实际上是为 了一件 事!他 下之 就是,“ 没有选

那两 门有2/3 中 奖, 且 看,我已 帮 排除一 门

了!”

我们 一下, 设 选择了1号门,蒙提接着问 是否要换成2号和3号

门, 后 接受了,放弃一 门换 两 门, 此时得 轿 也

就上升为2/3。 就在这个时 ,蒙提打开了3号门—也就是 选择 两

门中 一 —发现门后是一 , 会有什么 受?是觉得自己中奖


希 变渺茫了?当 不是! 轿 藏在3号门 后 ,那么他打开

会是2号门!蒙提可以 是什么都没干。

游戏正常进行,蒙提实际上是给 提 了两个选择,要么 持最

选 那 门,要么选择剩下 两 门—只不过其中有一 后 是 门

被打开了,在这个过程中,蒙提还告诉了 另外两 门中哪一 门后

没有 奖,因此在 下 两种 中 中 奖 是相同 :

1.先选择1号门, 后在任何一 门打开之 同 换成2号和3号门。

2.先选择1号门, 后在蒙提打开有 3号门之后同 换成2号门

( 在蒙提打开有 2号门之后同 换成3号门)。

在这两种 下,通过改变选择, 中奖 都由原 一 门 加

两 门,因此 也从1/3上涨为2/3。

我 第三种 释更 是第二种 释 端版。 设摆在 不是3


门, 是100 门。当 选择其中一 门(比 47号门)之后,蒙提·

尔在剩下 99 门中打开了98 有 门,此时就剩两 门没有打开

了,一 是 最 选择 47 号 门 , 一 是蒙提剩下 (比 61 号

门), 要换吗?

绝对要换!小轿 有99% 藏在 没有选 那99 门 后 , 蒙提

还 心地为 打开了其中 98 门,他知道这98 门 后 都没有小轿

。也就是 , 持最 选择(47号门),那么 开着小轿


回 仅为1%, 一 回 却 达99%; 最 选择

是错 ,那么小轿 就 藏在另外一 门后 (61号门),

中 奖,那就应该将最 47号门换成最后剩下 61号门。

简 之, 有 会参加《让我们 个交易》节目,当蒙提· 尔

( 是他 任 )问 是否要改变选择时, 要 不 豫地点 。
更 张 法是,这个 告诉我们, 对 本 有时 会将

引 歧途。
本书由「ePUBw.COM」整理,ePUBw.COM 提供最新最全
的优质电子书下载!!!
样章 此 束

要 整版

下 二维码

加微 :shuyou099

领取
为什么样 工作压 更 易 场人 猝 ,是“ 乏控 和话

权” 工作,还是“权 ,责任也 ” 工作?

工作压 过 会致人 亡吗?答 是 ,有 量证据表明工作压

会导致早逝,尤其 心 猝 陡 。但这种致命 压
有所不同。公司 管们几乎 天都要 出重要决策,这些决策
关 他们公司 途命运,但他们所承受 险要远远小于他们 秘

书,后 必须 业业地接听 话, 成上级布 各种任务。但这怎


么可 呢?其实最危险 一类工作压 自于对自己 工作任务“ 乏
控 ”。针对数千名英国公务员 项 (“白厅”研究)发现,

那些对自己 工作没有支配 雇员—也就是基本上对干什么、怎么


干没有话 权 人—相比起那些 有更 决策权 雇员 ,
亡 更 。由此表明,并不是那些“权 越 ,责任也越 ” 压

于 地, 是那种等着上司给 布 任务,但自己又没有权 决 怎
么 成、何时 成这些任务 压 把人压 了。

本章并不是要 工作压 、心 英国 公务员等 。之所以要提


“白厅”研究,是为了引出本章真正要讨 问题:研究人员是 何
得出这样 ?很显 ,类似于上 问题都无法 随 方
式 决,因为我们不可 把人强行分配 各个工作岗位并强迫他们在那
里工作 几年, 后再看看 因公殉 (就算不 虑道德因 ,这样

也会把英国政府 日常公务弄得一团 )。在实际操作中,研究人员在


很长一 时间里对英国政府 数千名公务员进行了详细 向数据
收集,这些数据 过分 提 有 义 相关关 息, “ 乏控
” 工作与 心 发 之间 关 等。

一个简单 相关关 ,并不 以让人得出 类工作对 康有 。


在发现了英国政府 中低级 雇员更 易 上心 之后,我们还
必须 虑 其他可 因 。 ,我们可以 见这些低级 雇员 受

教 水平要比 层官员们低;这些人更有可 上 ( 是因为他


们在工作中郁郁不得志);低级 雇员小时 体质较弱,从 影响了
长 后 工作 景;又 较低 收 得他们无法享受 医 资
源等。重点在于,任何一项只是简单地比较 个 人 中个体( 不
同人 ) 康 研究都不会告诉我们太 有 ,在这样庞杂
数据中有太 干 因 会 糊我们对那些真正 得注 关 看

法。心 真 是“低级 工作”导致 吗?又 只是这类雇员所共


有 一些因 共同导致 ? 我们 同了后 ,那就等于 无 一

个真正 公共 康 胁。

回归分 就是帮助我们 这类问题 计 工具。具体 ,回归分

在控 其他因 提下,对 个具体变量与 个特 之间

关 进行量化。也就是 ,我们 在 持其他变量效 不变


下,将 个变量 效 分离出 , 从事 项特 工作。“白

厅”研究 回归分 衡量低级 工作对 个人 康 伤 ,


这类人 在工作 活中 其他方 都是相似 , 吸 习 (低级
雇员 数 确要比他们 上级 ,但这对整个政府 员工 心

发 差异 影响相对 并不是很 )。

在报纸上读 绝 数研究成 ,都是以回归分 作为基础 。研究

人员发现,在幼 园长 升 小 后比没上过幼 园 更

易出现行为问题,这项研究并没有将几千名 童随 分配给幼 园
人抚养,也不是简单地将在不同环 中长 小 进行比较, 忽

了其他可 会对他们 行为造成影响 根本性因 。不同 庭对


抚养决策是不同 ,这是因为 个 庭和 个 都是不同 。一些

庭双亲 在,一些 庭则没有那么幸运;一些 庭 双亲都有工作,


一些 庭则并 此;一些 庭更加 裕, 长 受教 程度也更 ,

一些 庭却没有这么 件。所有这些因 都会影响 长 决

策, 这些决策会进一步影响 在小 间 表现。 得
当,回归分 排除其他因 影响( 庭收 、 庭成员 、

长受教 水平等),辅助我们 清幼 园对 升 小 后 行为影


响。

在上述这句话中,有两个关键 。第一个关键 是“ 得当”,


具 数据和一台笔记本 ,一个关于6 岁小 回归分 就

在一个基础 计程序上 成。 出现让回归分 变得 不费 ,

因此问题 核心不是回归分 技 性部分, 在于确 分 过程中要


哪些变量以及 何才 将这些变量 作 发挥 最 。回归分 就

是一件外观华丽、功 强 工具, 起 常 易,但若要


得 ,就得下一 功夫了, 且 不当,还会带 不 危

第二个关键 是“辅助”,刚刚那个研究并没有给我们提 一个关于幼


园与 在小 行为表现之间关 “正确”回答, 是针对 个

特 时间 特 童量化了这一关 。我们 从中得出可以

推 广之 吗?当 ,但是和其他类 推断一样,我们也是有限

和 件 。 先, 取 样本必须 代表我们所关心 体,一项

包含2 000 名瑞典 童 并不 导我们 何在 西哥 乡村地区


开展最 教 。其次,不同样本之间应该存在差异。在 样方法

善且相似 提下, 我们 取不同 样本进行研究, 一份样本

彼此之间应该存在细微 差异。

回归分 与 测 相类似。 消息是,在样本数量 、具有代表性且

方法 成立 下,样本数据所呈现 相关性基本上与 体人口 现

实 差 不 。 样本 量 为10 000 人,那么 周锻 3 次 以

上样本组 人 心血管 发 要 低于从 不锻 样本组 人


(但这两组人在其他重要方 都相似),对于 体人口 ,锻 和心

血管 之间就很有可 存在类似 关 。这也是为什么我们要进行这

些研究(记住,研究 重点并不是在研究 束时告诉 年 时应该

运动)。

坏消息是,我们并不 确切地证明运动可以 防心 ,我们只是推

了“运动与心 无关” 零 设。具体 ,该项研究 作 在报告


中 道, 运动与心 并无相关关 ,那么 常运动 人和不运
动 人得心 比 出现 此巨 差异 将不 5% , 将 计

基本 门 设 为5% ,那么这一个发现就具有了 计 义。

等一下,让我们先 思 一下上述这个 。 设这项研究对比 是

一 打 人和一 从不运动 人—两类人 体重相当。打

确对 强心 功 有 ,但是,我们也不 忽 这种运动并不

是一般人 长 消费得起 ,那些有打 习 人通常是社会 上流


人 ,他们加 一些 乐部常常有 场地 他们 。同时, 有

人所 接 医 资源自 更为丰 ,这也有 于他们 持心

康。 研究人员 草草了事,当 可以将这些人 心 康归功于打

,但事实上真正 康受 于 支撑 运动习 财 (打

也是相同 道 ,有人 参与 运动 人更 康,其实这也是财


和优质医 功劳,不 都知道打 过程中真正锻 了 体 主

要是 )。

还有可 是因 关 ,会不会是 有了 康 体才更 运动

呢?当 有可 。那些体弱 人,尤其是心 有先天性 陷 人不

宜从事 运动,他们不 可 去打 。但 研究分 过于敷

衍和简单化,就会 运动有 于 体 康, 实际上却是那些天 体

不 人不 常从事运动。 这个观点,打 并没有让任何人变得更


康, 只不过是将 康 人与体质差 人区分开 了。
回归陷阱 形式 种 样,在下一章中我将会为 介 一些最“ 名

昭著” 错 。现在,让我们把 点放在正确 法上。回归分 强

表现在:将我们所关心 计关 离出 , 工作中 支配

和心 ,同时还不忘 虑其他可 会对这一相关关 产 影响 因

具体是 何 呢? 我们得知英国政府中低级 雇员 体要比

他们上司 体质更弱,那我们怎么确 在心血管 康 不 致 原


因里,有 少比 源于他们低级 工作, 少比 因为吸 ?这两个

因 看上去似乎是彼此 、 不可分 。

通过回归分 就 将 们 开。为了让 都 其中 ,我必

须从基础 起,无 是哪种形式 回归分 —从最简单 计 关

诺 尔奖获得 搭建 杂 ,都离不开 基本 念。最核心 一点

是,回归分 寻找 是两个变量之间 最 合 性关 。举个简单

, 和体重 关 。虽 不是绝对 ,但 较 人一般体重


应该更重。我们将一组 毕业 和体重 记在坐 上,不知

道 会不会回忆起我们在 文中 过 。
图12-1 身高与体重散点分布图
让 描述一下上 图, 会 “体重看上去似乎随着
加 ”之类 话, 得很对,但离满分还有点 离。回归分
让我们更进一步, 更加精确 话 描述这两个变量之间 性关

致 看,符合 和体重数据趋 有很 ,但我们 何知道哪


一 才是“最 ” ?我们又 何 义“最 ”这两个字?回归分

一个常 方法为最小二乘法(OLS),为什么OLS 得出最 合 性


关 ,我们 给更 阶 本去 释,这里 关键点在于,OLS 直 可
以让所有数据 残差平方和为最小— ,这句话其实并没有那么 以

。在我们 与体重数据组中, 一个数据都有一个残差,即


离回归 垂直 度差, 对于那些直接落在回归 上 数据点, 们

残差则为零。在下图中,A 同 残差( e 表示)被 了出 。


残差 和越 ,则回归 就越不 确,这一点很 。OLS 公式中
唯一不 地方在于,在相加之 ,我们 要将 个数据 残差平
方(这就 加了那些离回归 特 远 数据,即 端异常 在 中

比重)。

下图就展示了一 可以让所有数据 残差平方和为最小 OLS 直 。

图12-2 身高和体重的最佳拟合回归线
文中提及 技 性描述让 话,请记住一点:OLS 是

两个变量 性关 最 描述。当 , 不仅仅是一 直 ,


还记得 中几何 程 话,一 回 起一个直 方程,也就是我们所
回归方程:y=a + bx,其中y 表示体重(磅),a 为 (当x=0

时y ),x 为 (英寸)。 OLS 所决 直 “坡度”,就


描述了这个 中 和体重之间 “最 ” 性关 。

当 ,回归 不可 把数据组中 一个点都包含进去,但若要在

和体重之间寻找 一个有 义 关 ,回归 是我们所 最 描


述。同时, 一个数据都可以 一个方程式 表示:体重=a+b ( )
+e ,其中e 作为残差,代表 是相同 件下不同体重 人 差异。
最后,通过这 回归 我们还可以得出,该组数据中 根据 猜测
体重,最 办法是求出a+b ( ) 。虽 绝 部分 数据并

恰 落在回归 上, 们 残差之和 有可 为零,这是因为有些人


体重 过回归 测体重, 有些人 体重却比回归 测体重

是不是快要对本章 去 心了?那我们就一起 看一些取自“变化


一 ”项目研究 真实数据吧。 先,还是向 介 几个基本

。被 释 变量—在这个 中变量为体重—被称作因变量(这是因
为 于其他因 ), 我们 释因变量 变量被称作 释变
量,有些时 , 释变量又被称作自变量 控 变量。我们先

释“变化 一 ”项目 研究对 体重,随后再加 其他潜在


释因 。在“变化 一 ”研究中,一共有3 537 名成年 国人参与,

即我们 数据量n(有些研究 文会记作n=3 537)。接下 ,我们对这


些研究对 数据进行简单 回归分 , 体重为因变量, 为唯
一 释变量, 得 了 下 :

体重=-135 + 4.5 ×

a =-135 。这是回归 在Y 上 ,本 并没有什么特 含义。


( 仅从表 上 , 代表 是一个人 为零英寸,则体重
为-135 磅,但这显 是不可 发 事。)我们也会将其称为 量,因

为这是计算所有体重 起点。
b=4.5 。我们称为回归 数( 数) b 计算为4.5 ,此为
对“变化 一 ”项目 研究对 和体重关 最 描述。我们

对回归 数有一个简单、实 读:自变量( ) 加一个单


位,因变量(体重)就 加4.5 个单位。放在我们 数据样本中,就

味着 加1 英寸,体重就会相应 加4.5 磅。在没有其他额外相


关 息 下,我们对“变化 一 ”里一个 为70 英寸 参与
体重 最 测为-135 + 4.5×70=180 磅。

看 了吧,这就是回报,因为我们已 量化了“变化 一 ”项目 研


究对 与体重 最 性关 。通过同样 原 ,我们还可以 释
更加 杂 关 和 决更加具有社会 义 问题。对于任 一个回归

数,我们只 要关心3 件事 就行了:正 、 小和含义。正 。回归


数 正 揭示了自变量与因变量之间相关关 方向。在上述简单

中, 数为正,也就是 , 人 向于体重 重。
有一些关 正 相反,比 运动量和体重。 “变化 一 ”研究
中还包含了 “ 个月 步 英里数”,那我可以 这个“英里

数”就是 ,通常 得越 ,体重就会越 。

小。自变量 底 对因变量产 影响?这种影响会达 何种程


度?在上述 中, 英寸 都关 着4.5 磅 体重, 4.5 磅对于

一个人 体重 是一个不小 重量。在 释一些人为什么比另一些人


体重更重时, 自 是一个重要 因 。但在其他研究中,我们有
时 会发现一个奇特 现 : 个 释变量在 计 义上对 有着
常巨 影响,也就是 出现这样 不可 是巧合,但这个 释
变量 社会 义却渺小 几乎可以被忽 。举个 ,影响收 决

性因 。为什么一些人比另外一些人挣得 ? 释变量最有可 是教
、 、从业时间等。在一个 数据组中,研究人员还发现在其他

因 相似 提下, 白 人平 年要比其他人 挣86 。这些


研究对 有着相同 件:教 、工作 等(我在以下 中会为
释研究人员是 何神奇地 这一点 ),“洁白 数”为

正, 且具有 计 义。该 计分 显示,一口洁白 与 年


挣86 之间存在相关关 , 且基本上排除了这一 是巧合 可

性。也就是 (1)我们刚刚 分 自 推 了“ 洁白和 收 没


有关 ” 零 设;(2) 对其他数据样本进行分 ,我们也会在洁
白 和更 收 之间找 类似 相关关 。

但是,那又怎么样?我们 确发现了一个具有 计 义 现 ,但从

社会 度 看 其实无关 要。 先,86 并不是一笔 以改变人


金钱,在公共政策 眼里,86 还不 年

费 ,因此我们 至无法向年 雇员推荐这类 资。此外,虽 下一


章 会着重 回归分 中 陷阱,但我还是忍不住 要就方法
这方 先 几句。 , 有 很有可 与本人 性格

特点有关,正是因为这种性格特点,才带 了更 收 ,他们之所以
挣得比 人 ,是因为他们具 护 这种性格, 本 。这

个 告诉我们,要时刻关注 释变量与我们所关心 之间相关关


小。
含义。 计 底是一个基于 糕数据样本 错 ,还是 反映整
个 体普遍真相 有 义 相关关 ?在之 个章节里,我们其实

一直在反 追问这个问题。放 和体重 中,我们是否 在


其他代表性样本中寻找 这两个变量之间类似 正相关关 ?回答这个

问题,我们可以 之 过 推断方法。我们 回归 数所描述 是


组具体 样本数据中 和体重 关 , 我们在同一个人 中再随
取另一组 样本,该样本 和体重数据 会有所不同,因

此,就会得出另一个不同 回归 数。“白厅”研究(英国政府官员
)数据里 和体重 关 很有可 与“变化 一 ”项目 研究

对 和体重 关 有所区 。但是,由中心 限 可知,一个


正确 取 样本 平 并不会特 离其所在 体 平 ,同
样 ,我们也可以 ,不同变量之间 关 ( 和体重)不会因为

样本 不同 发 特 变化,当 提是这些样本都 自同一个


体, 且都是正确 取 样本。

设 一下,我们发现“变化 一 ” 研究对 和体重存在正相

关关 — 加 英寸 都对应着 加4.5 磅体重,但在另外一组包


含3 000 名成年 国人 样本中却没有找 和体重之间 任何相关
关 ,这可 吗?几乎不可 (但也不 排除偶 性)。

这为我们 证回归分 是否具有 计 义,提 了第一

。与 测 其他形式 推 类似,我们也可以计算出回归 数
差。 差衡量 是,对取自相同 体 个样本进行回归分
所得出 回归 数 离散程度。 我们 取3 000 名 国成年人进
行 和体重数据 收集,那么在回归分 中我们可 会发现,他们平

1 英寸,相应 体重 加 为4.3 磅; 重 样和计


算,那么 英寸 所对应 体重 加 有可 变成5.2 磅。正态分布
又一次成为我们 友。对于 “变化 一 ”这样 数据样本

,我们可以 设不同 回归 数围 着 体 国成年人 和体重


真实 呈正态分布。在此基础上计算得出 差,我们就 对

不同样本 回归 数 分布有一个 体 。接下 ,我将不再占 宝


贵 篇幅 介 差 计算方程式了,原因有二:一是因为 量
数 运算会干 本章 研究方向,二是所有最基本 计软件都可以帮

成这一计算。

但是,我必须 告 是,对于小 样本数据( 20 位成年人


“变化 一 ”项目 3 000 人 ) ,正态分布将不再是我们

“ 友”。具体 , 我们对不同 小 样本进行回归分 ,

就不 这些回归 数会围 着 体 国成年人 和体重 真实


呈正态分布,此时 分布 我们称为“t 分布”(简单 之,t

分布比起正态分布 更加分散,因此左右两 “尾巴” 幅度更

)。其他 也是一样 ,任何一 基础 计软件都 易地 决


这个稍微 杂 问题,因此有关t 分布 种种细节请参 本章 尾 补

知 点。
还是回 数据(以及正态分布)上 ,我们必须 差

重要性。从 测 和其他 计推断中我们可以 见,有 过50% 回


归 数会落在真实人口参数一个 差 范围 ,约95% 回归 数

会落在两个 差 范围 ,以此类推。在 了这一点以后,我们

基本上就算弄清 了,因为现在我们就可以进行 设 了( 真 ,
告诉我 已 忘了有这么一步了!)一旦得出了回归 数和

差,我们 对“ 释变量和因变量之间没有相关关 (即回归 数为

0)” 零 设进行 了。

在上述有关 和体重 简单 中, 对于 体人口 和体

重并不存在任何相关关 ,那么我们在“变化 一 ”样本中得出 英


寸 对应4.5 磅体重 有 ?我在 上 一 最基础 计

软件进行了回归运算,得出 数 差为0.13 ,也就是 ,

我们重 此分 ,比 有100 个不同 样本,那么 计将会有约95


个回归 数落在人口真实参数两个 差 范围 。

由此,我们可以 两种不同但彼此相关 方式呈现这一 。第一种方

式是,我们可以建立一个95% 区间(4.5±0.26),也就是 ,在

95% 下回归 数会落在此区间里,也就是4.24~4.76 之间, 基

本 计软件就 算出这一区间。第二种方式是,我们可以 在 和
体重 相关性95% 区间里不包 零。由此,我们就 有95% 把

握推 “ 与体重之间不存在相关关 ” 零 设了。这个 显
著性水平为0.05 ,也就是 在推 零 设这件事 上只有5% 是

错 。

事实上,我们 计 还要更 端。 差(0.13)相比起回归

数(4.5) ,是一个 小 数字,一个 法则就是,当回归 数至

少是 差 两 以上 时 ,该 数 有可 具有 计 义。
计软件还可以计算出这个 中 约为零,这就 味着

整体人口 和体重真 不存在任何相关性 话,那么得 此

端( 更加 端) 基本上为零。要记住,我们并没有证明
人 体重就一 更重,我们只不过表明了,由“变化 一

”样本得出 与体重相关性 不为真 话,那会是一件 为反

常 事。

通过基础 回归分 ,我们还可以得出一个 得注 计 : 以衡


2
量所有 回归方程表示 数据 和R 。在“变化 一 ”样本中,

仅体重一项就有 量不同 数 ,有一些人重于所有人 体重平 ,


2
有一些人 体重还不 平 ,通过R ,我们 可以知道这些围 在平

周围 体重与 两项因 之间 相关关 底有 “亲 ”,即


回归 数。在这个 中,答 是0.25 25% 。也就是 ,我们 样本

中 有 75% 体重数据无法在回归方程上表现出 。对于“变化 一

”项目 研究对 ,影响他们体重 因 显 不仅 这一项,


着 ,有 上就要 了。
我必须承 是,本章一开 回归分 时 ,我是把 当成社会

科 研究过程中神奇 “万金油” 介 。 目 为止,我 所有


事 就是 计软件和一组数据 明 人比 矮 人重。

任何人只要去 中心 一圈, 怕都 得出相同 。现在,既

都对基本知 了 得差不 了,那么,就 了释放回归分 真正


“ ” 时 了。

我所承诺 ,回归分 让我们 开 种影响因 和 个 所

关心 ( 分数、收 心 )之间 错综 杂 关 。当

我们将 个变量都纳 回归方程式时,接下 分 可以让我们计算出

因变量与 个 释变量之间 性关 ,与此同时,可 其他变量为常


数,相当于把其他变量放 “控 组”里。还是上述有关体重 。

我们已 找 了 与体重之间 关 ,同时我们还知道其他一些

释体重 因 (年 、性 、饮食、运动等),回归分 (当有 过


一个 释变量 时 ,我们通常称其为 回归分 变量 回归分

)会为回归方程中 一个 释变量配 一个 数。具体 ,那些

性 和 都相同 人,他们 年 和体重是怎样一种关 ?当我们


释变量数目 过一个时,就无法在一个二维 坐 中将数据表示出

。 一下, 将“变化 一 ”项目 一位研究对 体重、

性 、 和年 都在一个 维 图中表示出 ,将会是 么 观 一

幅图景。但要记住 是,我们 基本原 并没有改变,无 是之 简单


与体重变量,还是现在 个变量,只要将 们输 上

计软件,就会自动 成让残差平方和最小 回归 数与回归方程。


我们暂时还是以“变化 一 ”为 ,后 我将通过另外一个 直观

地告诉 变量回归分 是 何在我们 活中创造奇迹 。 先,

我们为“变化 一 ”项目 研究对 体重再 加一个 释变量:年


。在 中输 相关 和年 数据后,我们得 了 下 方程

式:

体重=-145 + 4.6 × + 0.1 ×年

年 回归 数是0.1 ,也就是 ,在其他变量不变 件下,年

加一岁,体重相应地 加0.1 磅。对于任 一组相同 人 ,

年 人 平 体重要 于年 小 人,年长10 岁表现在体重上就是


体重重1 磅。从方程式上看,虽 年 对于体重 并不是一个很显著

影响因 ,但确实和我们在 活中看 一致,该 数 显著性水平

为0.05 。

可 还注 了 回归 数比之 加了一点 。当把年 变量


虑进 后,我们对于 对体重 影响有了一个更加精确 。样

本里相同年 人中,也就是“当年 为常量时”, 加1 英

寸,体重 加4.6 磅。

我们再加 一个变量:性 。这次就有一点不同了,因为性 只存在两

种可 性: 性 性。我们 不 把“ ”和“ ”放 回归方程式


里吧?这时 我们 要 二进 变量(又称虚 变量)。在输 数据

时 , 参与 是 性,我们就 1 表示; 参与 是 性,
我们就 0 表示。性 数可以 为,在其他因 不变 下对

性体重 影响。该 数为-4.8 ,并没有出乎 数人 料,具体


,就是对于相同 和年 人 , 性要比 性 4.8磅。现在,

我们可以开 领 回归分 一些神奇之 了。我们知道 性一般

要比 性矮一点 ,但 在我们已 将 “控 ”起 ,因此最后呈


现 数也应该会表现出 性比 性矮 特点。最新 回归方程式

下:

体重=-118 + 4.3 × + 0.12 ×年 -4.8 ×性 ( 性为1, 性为

0)

对于一位 为 65 英 寸 53 岁 性 , 体重最有可 约

为-118×4.3 ×65 + 0.12 ×53-4.8=163 磅。对于一位 75 英寸


35 岁 性 ,他 体重最有可 约 为 -118 + 4.3×75 + 0.12

×35=209 磅,我们之所以 过回归方程式 最后一项(- 4.8),是因

为这个人不是 性。

现在,我们可以开 思 那些更有 但也更 以 测 因 了,比 教


。教 何对体重产 影响? 是我,我会 设受教 程度 个

人对 康更加关注,因此在其他 都相同 件下,这类人 体重会

一些。我们还没仔细 虑过体 锻 对体重 影响。我会 为,在其


他因 不变 提下,运动量越 ,体重就会越 。
困这一因 又有何影响呢?在 国,收 低也会表现在体重方

吗?“变化 一 ”项目 研究人员会向 一位研究对 问他们是否

正在接受 国政府 粮食补助,这是一个衡量 困程度 方法。此


外,我对种族也很 兴 。众所周知,在 国有色人种有着不一样

活体 ,与种族相关 文化和居住因 会对体重造成影响, 市至

今还 持着 度 种族 离, 洲裔 国人比起其他 国人,更有可

居住在“食品沙漠”中,也就是销售水 、蔬菜和其他新 食 食品
杂货店匮乏 区 。

我们可以通过回归分 将上述 释因 所造成 影响单 分 出 进行

观 。 ,我们可以先 持其他社会 济因 —比 教 景和 困

水平相同,单 分 种族和体重 相关关 ,对于接受政府粮食补助


中 历人 ,他们 体重和肤色之间存在着怎样 计 关 ?

这里,我们 回归方程式已 变得 常 杂了,也就不在这里为

展示了。 是 文,一般 会在这个时 插 一个庞

表格 各种回归方程 ,在本章 补 知 点中 们可以找


一个 整 回归分 表格。与此同时,我要为 一下当加 教

、运动量、 困水平(是否接受政府粮食补助),以及种族因 后所

发 变化。

我们原 所有 变量( 、年 和性 )都还是有 义 ,但随着

释变量 不断加 ,原 回归 数发 了微小 变化。我们所有 新


变量都以0.05 作为显著性水平,此时R2 从0.25 上升 了0.29 (要记
2
住,当R 为0 时,表示我们 回归方程式 测样本中个体体重 并
2
没有比“平 ” 少;当R 为1 时,表示我们 回归方程式

地 测样本中 个人 体重),但还是有很 人 体重无法落在回

归 上。

正 我所 ,教 与体重呈现 相关关 。在“变化 一 ”项目

所有研究对 中,受教 时间 加一年,体重就相应 少1.3 磅。

运动与体重也呈现 相关关 ,这一点并不令人 外。“变化 一


”项目组专门 设了运动 数 衡量 位研究对 运动量水平。在

持其他因 不变 件下,运动量最 后 1/5 人要比其他人平

重4.5 磅,比运动量最 1/5 人重将近9 磅。

接受政府食 补助(在本次回归分 中代表 困) 个人要比其他人

重。在其他因 持不变 件下,接受补助 人要比其他研究对 平


重5.6 磅。

种族变量是其中最有 变量。就算将上述所有因 都“控 ”起 ,

种族因 对体重有着举 重 影响。“变化 一 ”参与 中

西 裔成年 人要比其他人平 重10 磅,无 是从绝对 义上还是与


回归方程式中 其他 释因 对体重产 影响相比较,10 磅都是一个

常 数字。 且这还不是一个数据错 ,因为该虚 变量

(怕 过了这么久忘了,再次提醒一下, 就是在零 设成立


提下,出现所观 样本 以及更 端 )为零,95%

区间是7.7~16.1 磅。

底出现了什么 ?一个 实 回答是:其实我也不太清 。让我

重申一下之 深藏 一个观点:我在这里只是 数据 明回归分


工作原 ,仅此 已。刚刚所作 那些分 在真正 和研究人员眼

里根本就是小 科,就 NBA 员在看街 小 打篮 。 这是一

个严 研究项目,那么将会有长达数周 至几个月 分 ,以

观 稳 性。我唯一 就是,我在这里向 展示了为什么


在 对一个 杂 数据样本时 回归分 是寻找有 义 最

工具。在一开 时 ,我们只 进行一个“老掉 ” 练习:量化

和体重之间 相关关 , 今我们已 在讨 真正具有社会 义


话题了。

既 这里了,我们就 看一个真实 、具有深刻社会 义 回归分

研究 : 场 性 歧 。 歧 ,一个最 受就是隐晦和

不易 觉。没有一个雇主会公开 工资比 人少是出于种族 性


原因,又 没有录 是基于 些歧 性 由(这样 易导致这些

求 败 只 找其他工资待遇较低 工作)。所以我们只 另辟

径,看看不同种族和性 人 收 差 有 :白人挣得比 人 ,

人挣得比 人 ……方法 带给我们 是,这些收 差 也有可


是由于个人选择 不同 引起 ,与 场歧 并无关 , 更
性 向于选择半日 工作。那么,收 差 中有 少是因为工作量 不
同,又有 少是因为 场歧 呢?我 这是所有人都 关心 问题。

回归分 可以帮助我们回答这个问题。但是,我们这次采 方法就没


那么直 了当了,会比之 释体重 影响因 时 显 杂。我们会

虑其他一些影响收 传 因 , 教 、工作 、行业等,在控

这些因 相同 件下, 还存在显著 收 差 ,那么就有可 是


歧 因 在作祟。无法 释 收 差 成分越 , 场歧 也

就越 。举个 ,3 位 济 对毕业于芝加哥 布斯商 院约2

500 名工商管 硕 (MBA) 收 迹进行了 研究,毕业时,


毕业 起薪 体相等: 性 收 为13 万 , 性 收 为11.5

万 。但是10 年以后,他们 收 出现了巨 差异: 性 平 收

(24.3 万 )比 性收 (44.2 万 )低了45% 。在另一个


样本中,1990~2006 年间毕业并进 场 18 万名MBA 里, 性 收

要比 性低29% 。离开 以后,我们 同 都怎么了?

根据研究人员(布斯商 院 丽安· 特兰德以及哈佛 劳迪

安· 尔丁和劳伦斯·卡茨) ,其实绝 部分收 差 与歧 因

关 并不 。当有越 越 释变量加 分 中去,性 差异对


收 影响就变得越 越微不 道。 ,在 间 性选择金融相关

程 人数比 性 ,成绩平 分也 于 性,当将这些数据作为控

变量加 回归方程式之后, 收 差 中无法 释 成分就下降 了


19% 。再将毕业后 工作 历、不在公司 时间作为变量放 回归方程
式去, 收 差 中无法 释 成分又进一步降 了9% 。 加 其

他与工作特点有关 释变量, 雇主类 和加 时长, 收 差

中无法 释 成分已 不 4% 了。

对于 行10 年 雇员 ,他们之间存在 收 差 有99% 都可以


歧 性因 释,只有1% 与歧 有关。研究人员 道:“我

们发现有3 个最主要 因 影响了 性和 性之间不断 收 差

:MBA 习 间不同 程选择、事业中断 原因和时间长度 差


、 周工作长度 不同。这3 个决 因 基本上可以 释 性和 性

在 成MBA 业 年之后 收 差 。”

我希 通过我 介 , 可 回归分 价 所在,尤其是

在控 其他变量 件下单 虑 个 释变量给 带 影响。但

是,我还没给 举 明这一神奇 计 “万金油” 底是 何发


挥作 。在其他因 相同 下,当我们 回归分 法 教

和体重之间 关 时, “变化 一 ”项目 研究对 在其他方

都不 一样,那 计软件是 何控 、性 、年 、收 等 释
因 呢?

下 ,我们就先分离出 个单一变量(比 教 )并观 其对体重 影

响,为了让 反应过 ,我们先 设 下 形。

设“变化 一 ”项目 所有研究对 都被召集在同一个地方— 萨诸

州 弗雷明汉, 先将他们 性 进行区分, 后再以 为 将


性和 性由 矮作进一步划分,并安排 不同 房间里。现在,我
们有一个房间里 都是 为6 英尺 性, 房间是 为6 英
尺1 英寸 性,以此类推, 性 也是 此。 我们 研究对

数量 ,那么还可以将 个房间里 人 收 再进行分类。

最后,研究对 都被安排进了 积不同 房间, 个房间里 人除了

教 和体重以外其他方 都相同,此时教 和体重是我们所关心 两


个变量。有一个房间里 都是年 为45 岁、 为5 英尺5 英寸、年收

在3 万~4 万 性, 房间里可 是年 为45 岁、

为5 英尺5 英寸、年收 在3 万~4 万 之间 性,诸 此类。

个房间里个人 体重还是有所差 ,相同性 、 和收 人在


体重上不一 都相同—但 , 个房间里 体重差异应该要小于

整体样本 体重差异。那我们现在 目 就是,确 个房间里剩余

体重差异里有 少成分可以 教 因 释,换句话 ,教 和体重


之间 最 性关 是什么?

现在就剩下最后一个 了,那就是 何 决这些房间 出现 不同

回归 数 问题。整个过程 重点就是,在 持其他因 不变

下,计算出一个单一 数 对整个样本 教 和体重关 进行一个最

描述。我们 要看 是, 这个唯一 数 所有房间 不同体重


残差平方和为最小。那怎样 一个 数才 达 此效 呢?答

就是回归 数,因为在性 、 和收 相同 件下,回归 数

最 地描述教 和体重之间 性关 。
最后 一句题外话,现在 见 数据组 厉 了吧。 们 让

研究人员在控 了 因 之后,还 让 个“房间”里都有数据可以

被记录和观 。当 ,我们 不 要费 地让几千人 波于各个房


间,只要有一台 ,所有这一切在一秒时间 就 成了。

让我们回 本章一开 提 那个 ,再 看看工作压 和心 之

间 关 。 年以 ,“白厅”研究项目一直在观 英国 公务员

体, 图发现岗位层级和心 亡 之间 关 。一项早 开展 研
究对17 530 名公务员进行了长达7 年半时间 连 观 ,发现“低级

性雇员相比起 级 性雇员 , 较矮、体重较重、血压

较 、血糖较 、吸 较 、下 后 活动较少。

虑 这些因 以及 血 对 康 危 ,研究人员 回归分 方法

对其进行了控 ,但即 此,工作控 与 亡 (表现为心 相关


)之间 相关关 还是十分明显。”这项研究告诉我们,在其他

康因 相同 下(包 ,因为 可以很 地衡量 童时

康和营养 ),在一个低级 岗位工作真 可以“ 人于


地”。

有 读 看 这里 会怀 了,这一点很 ,因为在 计 中,持怀

态度是 得提 第一反应。我在本章一开 时 就表示低级

工作对 康不 ,这里 “低级 ” 是对自 工作 控 和话

权不 ,不一 与行政级 挂钩,一项对包含10 308 名英国公务员 样


本 研究就 图 清这其中 差 。这一次雇员们还是 行政级
进行划分— 级、中级和低级,只不过这一次参与 还必须 成一份
15 个题目 问卷,这份问卷主要是 价他们 “决策 控 ”水

平,其中设 问题包 “ 可以选择自己在工作中从事哪些项目

吗?”对应 选项 程度划分(“从不” “ 常”);还有陈述句,


比 “我在工作中可以决 何时 下 休息”。研究 们发现整个观

过程中“控 低” 雇员 上 心 险要 于“控 ” 雇

员。同时,研究人员还发现对工作要求 雇员 心 险并没
有比其他人 ,在社会 可度低 岗位上工作 雇员也没有表现出 易

上心 向。因此,似乎只有对工作 乏控 和话 权才
是“ 命 ”。

“白厅”研究有两个 常突出 特点,称得上是当之无 “最 研


究”。 先,其研究 在其他地方 找 佐证。 搜 发表 公共

康文 ,会发现“低控 ” 观点已 发展成为一个专有名 —工


作 劳,专 那些“精神 重”、“决策水平低” 工作。1981~
1993 年间,已发表36 项研究成 关于此类 题,其中绝 数 研究

成 都发现工作 劳和心 之间存在显著 正相关关 。

其次,研究人员探 并发现了相关 证据, 释为什么这一特殊


工作压 导致 康 化。要求严格但控 低 工作环
导致一 反应( 释放与压 有关 荷尔蒙),长此以往会

加 心 类 险, 至连动 研究都为 释其 变原 发挥了


作 。研究人员发现,地位低 和 ( 们与权 中 于底
层 公务员 遇有着相似之 )与地位 同类在 些 上存
在差异, 得 更 易 上心 血管 。

所以,最 还是不要 一 地位低下 “ ”—我 常向我 们

灌输这一个观点,尤其是我 。除此之外,一个更重要 息是,


回归分 可 是在 数据 过程中帮助我们发现有 义 最
重要工具。尤其是在 价工作歧 寻找心 因 时 ,我们是无

法进行控 实 ,因此对于这些以及其他具有深刻社会 义 题
,我们 要 本章所 研究 。 不 张地 ,在过去 半个

世 社科领 (尤其自计算 普及以 ),有很 一部分 重要发现


都要归功于回归分 。

回归分 地 实了科 方法, 人类更 地 了这个世 、 体


更加 康、 活更加安 。

那么,在 这样一个强 、实 计工具时,我们又应该注 些什

么呢?请接着阅读下一章 。

本章补充知识点
在进行回归分 ( 其他形式 计推断)时,小 样本数据会让

推断过程变得稍微 杂一点。 设我们要分 是体重和 之间


相关关 , 中 样本只包含25 名成年人, 不是之 “变化
一 ”那样庞 数据库。逻辑告诉我们,只有25 人 样本分
没有3 000 人样本更 体现整体成年人口 体重特征,本

书一直在强 一点就是:样本越小, 就越分散。虽 一个25


人 样本也 为我们提 有 义 息,5人、10 人也是 此,但
这些 息 义 有 ?

t 分布可以回答这个问题。就算我们 次 取25 个成年人作为样本

分 和体重之间 关 , 一次得出 数最后也不会


围 着“真实” 数呈正态分布,虽 们 确分散在真实 数
周围,但得 形 绝不会是我们所 代表正态分布

“钟”形。随着样本 量 降低, 一次 样得 数会分布


得更加离散,因此分布曲 两端 “尾巴”相比起正态分布曲
会显得“肥 ”。 样本 量 少 10,那么离散程度会更 ,

得 “尾巴”会更“肥 ”。t 分布实际上 是各种不同 量


样本 度集体 “ 族”,具体 ,样本中所包含 个体

数量越 ,那我们在分配适当 分布区间 价研究 时所 有


“自由度”就越 。在更 阶 程中, 会 习 何精确地计
算出“自由度”,我们在这里 且将其等同于样本中个体 数量。

举个 ,一个样本 量为10、 释变量个数为1 基本回归分


自由度为9。自由度越 ,我们对该样本 代表 体人口越有
心,其分布也会越“ ”, 图12-3 所示。
图12-3 t 分布图
随着自由度 ,t 分布逐渐向正态分布 。这也是为什么当
我们在 数据组时,可以直接 正态分布曲 基本特点

作为计算 据。

对于整本书一直在 彻 计推断过程,t 分布 引 只不过稍微


丰 了这个工具,我们 思 并没有改变, 是先提出一个零
设, 后 据一些观 数据 其真伪。 得 零 设

常低,那么我们就可以推 零 设。t 分布唯一 变化就在


于这些 发 与正态分布曲 有所不同。 曲 “尾
巴”越“肥 ”( 自由度为8 t 分布曲 ),数据离散 程

度越 ,巧合 就越 易出现,推 零 设 心越显不 。

, 设我们正在计算一个回归方程式,零 设是 个具体变量
回归 数为零。在得 回归 以后,我们 可以计算出一个t

计量,也就是所得 数与该 数 差 比。 后,再根据适


合于样本 量 t 分布(样本 量 小直接决 了自由度水平)
价所得 t 计量。当t 计量 时,也就是我们观 得

数与零 设相差 远,那么就可以在 个显著性水平基础上


推 零 设。再强 一遍,这与整本书一直在 计推断 基
本流程是一样 。
自由度越低(相对应 t 分布曲 “尾巴”越“肥 ”),所
要 t 计量越 ,这样我们才可以在 个显著性水平 基础上推

零 设。在上 设 回归 中, 我们 自由度为4,我们
所 要 t 计量至少要达 2.13,才 在0.05 显著性水平上
(在单尾 设 中)推 零 设。

但是, 我们 自由度为20 000 ( 以符合正态分布对样本 量

要求),t 计量只 要达 1.65 ,就可以在显著性水平为0.05


单尾 设 中推 零 设。

表12-1 体重回归方程式表
世 上3 本最有 医 上 49 篇 研究 文中有1/3 后
都被推 了,所以,“尽量不要 回归分 研究 人”。

在进行回归分 时, 要记住 最重要 一点就是:尽量不要 人。


至可以在 屏幕旁贴上一句话时刻提醒自己:“不要 研

究 人”。因为即 一些 常 明 伙有时 都 不了违反这


从20 世 90 年代起, 医 相 支持一个观点:上了年

性可以通过摄 激 防心 、 质 松以及其他与更年 有
关 。 止 2001 年,有差不 1 500 万名 性正在 激 ,
开药 医 称 们 激 以后 体会更 康。为什么呢?因为当

时 研究采 了我们在上一章 中所 基本 计方法,得出


给 性 人开 激 药 是一个合 治 。具体 ,一项针对
12.2 万名 性 向 (“护 康研究”项目)显示, 激 摄

量和心 之间存在 相关关 , 摄 激 性突发心


只有其他 性 1/3 。要知道,这可不是几个 少年在 亲
上一边搜 成人 、一边 计软件随 得出 回归方程式,“护

康研究”项目是由哈佛 医 院和公共卫 院共同主持 。

与此同时,科 和医 们还为补 激 有 于 性 康提 了医
上 支持。随着年 长, 性卵巢分泌 激 下降,
激 真 对 体 常重要 话,那么在老年时补 这一不 将有

于 性 长 康,因此他们还为这种治 方法取了名字: 激 补
法。一些研究人员 至开 建议上了年 性也应该适当补 一些
激 。

在数百万 性听从了医 建议,开 接受荷尔蒙补 法 同时,

激 也进 了最为严格 科 审 阶 :临床 。与之 观 一个


数据( “护 康研究”样本)并得出一个可 具有因 关
计 关 不同,临床 包含了控 实 。一组样本 激 补

片 ,另一组样本只是 安 片 , 显示,摄 激 性
心 、中 、血 、乳腺 和其他 险要 于对 组。补
激 确实存在一些 ,但这些 其他 险相比根本不 一提。从

2002 年开 ,医 被建议尽量避 对年长 性 人开具 激 类药


。《 约时报杂志》提出了一个敏 但又有深刻社会 义 问题:有
少 性是因为 了医 “出于 人 康” 虑开出 激 药片

中 上乳腺 过早离世 ?

回答是:“合 估计至少有上万人。”

回归分 可以 是 计 弹药库中 “氢弹”。无 是 ,只要有一台


和一个 样本数据,在 中 办公室里就 成为一个研究员。

这样 会出什么错呢?各种错 。回归分 为 杂 问题提 了精确


答 ,但这些答 却不一 确。在错 运 这一 计工具 人
中,回归分 会得出 导 至错 ;但就 激 所示,即

在正确运 这一 计工具 人 中,这一强 计工具 可以


让我们在错 方向上危险 速、越 越远。本章 作 衷就是为了
提 一个平衡, 释最常见 回归“错 ”,我之所以将错 打上引

号,是因为 所有其他类 计分 一样, 明 人有时 也会出于


邪 目 “明知故 ”。

以下就是让回归分 这一 凡 工具沦为“邪 ”工具 7 个最常见


错 。

用回归方程式来分析非线性关系。 不知道 是否 过吹

上贴 那句 示 —禁止在浴 中 。 看 了,心里一

会 :“有 会 在浴 里吹 发呢?”吹 是 器,我们都知道


在有水 环 中应该远离 器,因为会 。 回归分 也有一个类
似 示 ,那么上 就会是:当分 两个变量之间不存在

性关 时禁止 。请记住,回归 数所描述 是那 “数据最 合


直 ” 坡度,一 要是一 直 , 不是,就 要在另外 地方
不一样 坡度方程 释。举个 , 下是我 个月上 尔夫

( 释变量)和 场18 洞练习 平 数(因变量)之间 关 ,


所见,两 之间并不存在一致 性关 。
图13-1 高尔夫球课程对打球成绩的影响
上图中并 没有 律,只不过是 以 一 直 描述 了。 几

节 尔夫 我 数快速降了下 ,因此在这个阶 ,我 程数
与 数是呈 相关关 ,斜度为 ,也就是 ,上 降低了我 数
(对于 尔夫 这是一件 事)。

但是,当我 费 计交 了200~300 时,这个阶 程似乎对

我 场表现没有太 帮助。 尔夫 程与我 成绩之间似乎不存


在一个明确 关 ,因此斜度为零。

随着上 次数越 越 ,我 成绩 至出现了下滑。当 计 费达


300 以上, 加 程反 我 数越 越 ,在这个阶 斜

就为正了(后 我会为 释为什么是发挥不 导致了 习更


程, 不是 习更 程导致了发挥不 )。
最重要 一点是,我们无法 一个 数 确 尔夫 程和成绩
之间 关 。对于上述关 ,一个最 描述方式是: 尔夫
程与我 挥 数之间存在着若干个不同 性关 。 看得 这种

,但是在 上 计软件却看不 。 一股 地把这些数据


输 回归方程中, 也会 成一个 数,但这个 数将无法 确地反
映不同变量之间 真正关 ,这其实与在浴室里 吹 是一样 。

只有当变量之间 关 为 性时,回归分 才可派上 场。 本以及其

他 阶 计 本还将介 更 有关回归分 主要 念,但万变不离


其宗 是,无 是什么工具,离 功 差越 ,其效 就会越

差,有时 至还会有危险。

相关关系并不等同于因果关系。 我之 所 ,回归分 只

证明两个变量之间存在关 ,至于是不是其中一个变量发 变化就一


导致另一个变量也发 变化,仅 数据我们无法给出证明。事实
上,一个并不十分严 回归分 也 在两个 不相关 变量之间找

显著且有 计 义 关 。 设我们正在探寻过去20 年里 国 自
闭 不断 原因。我们 因变量—也就是我们正在 图对其
出 释 现 — 要对自闭 进行量化,比 千名 个年 童中

自闭 数量。与此同时, 我们将中国 人 年收 看作一个


释变量,我们 在过去20 年里激 中国人 收 和上升
国 童自闭 确诊 之间发现一个正相关且具有显著 计 义 关


这是为什么呢?因为 们在同一时 都出现了快速上涨 趋 。但是,
我 度怀 即 中国出现 济衰退, 国 自闭 童也不会因此

少。为了公平起见, 我在中国 速 长 济和中国国 自闭 确


诊 之间发现了显著 相关关 ,那么我 会开 一些与 济
长相关 环 因 , 工业污 等,这些因 释这一相关

关 。

我刚刚 这种存在于两个变量之间 错 相关关 只不过


是“ 山一 ”,曲 至错 释A 与B 之间相关关 法还有很
,广义上我们将这类现 称为伪因 关 。

因果倒置。 A 与B 之间存在 计 关 ,我们不 直接推出A

导致B,因为 有可 是B 导致A。还记得刚刚 那个 尔夫
吗?我当时已 暗示了这种现 存在。在我搭建 释 里,击
成绩 终是因变量, 释变量一直锁 在 计 程上。也就是 ,上

越 ,成绩越差!一种 释是我 尔夫 教练教得很差,但另一


种更加 得通 释是,我在 态不 时 是会 着 上几节 — 态
不 导致了更 程, 不是相反 。(对于这类问题 ,我

们在方法 上有 种 决办法。 ,我可以将这个月 尔夫 作


为下个月成绩 释变量)。

正 本章一开 所 ,因 关 有时 是双向 。 设 正在
一项 显示, 国在K-12 ( 从幼 园 12 年级 童教 )上
州 济 长 要 于K-12 项目 少 州。但就算这两个变量

之间 正相关关 再显著,我们也无法从中看出因 关 方向。我们


既可以 K-12 教 推动了 济 长,也可以 为只有那些 济实
雄厚 州才有钱在K-12 教 上 更 ,因此是 长 济带 了教

。还可以 ,教 支出推动了 济 长, 为进一步加 教


提 了可 ,即 们互为因 。

关键在于,我们不应该 那些(我们正在花 释 )受 影
响 释变量,不 话,因和 将会永无休止地 下去。举

, 释GDP 长时,在回归方程中加 业 因 是不合适 ,因为


业 很显 会受GDP 长 影响。 换一个 度 看,通过回归
分 ,发现 业 下降会 进GDP 长,这样 是可笑 、没

有任何 义 ,因为为了降低 业 ,通常 法是 进GDP 长。

我们应该确 释变量会影响因变量, 不是相反 。

变量遗漏偏差。 下次当 在报纸上读 类似于《常打 尔夫易 心

、 和关节炎》这类 题时,千万不要 。 尔夫 员 上
这些 比不打 尔夫 人 —关于这一点我一点 都不觉得

奇 ,但我同时也 为打 尔夫 有 康,因为 不仅 丰
社交 活,还 为 提 适当 运动量。我应该 何在这两个 不同
观点之间进行取舍呢? 常 易。无 什么研究,在量化 尔夫 对

康 影响时都必须正确控 “年 ”变量,通常 ,年 越 ,打
尔夫 时间和 会越 ,尤其是在退休之后。在打 尔夫 这个

题上,任何没有将年 作为 释变量 研究都不可避 地遗漏了一个事


实,那就是打 尔夫 人 体上比不打 尔夫 人年长。因此,
人 不是 尔夫 , 是衰老, 且那些正在老去 人恰巧对打 尔夫

乐此不 。 将年 纳 回归分 中去,得 将很有可 是


另外一幅光景:在年 相仿 一 人中,打 尔夫 可 还会对严重

防起 正 效 。这 提 报纸 题有着天 之 。

在这个 中,年 是一个被遗漏 重要变量。当我们 回归方程式


释打 尔夫 与心 其他 关 时, 将年 因 排除在
外,那“打 尔夫 ”就会 出自 释作 , 相当于扮演了两个

释因 色: 不仅告诉我们打 尔夫 对心 影响, 且还
告诉我们年 长对心 影响(因为打 尔夫 人通常比其他
人要年老一些)。 计 表达,就是打 尔夫 这个变量“覆

盖”了年 这个变量 影响。也就是 ,这两种不同 影响在分 中被


混为一 ,就算计算得再仔细, 也逃 不了一团 宿命,当 ,
最 糕 就是 为打 尔夫 对 康有损 , 真实 却恰恰相

反。

回归方程式中遗漏了 个重要 释变量,尤其是当方程式中 其


他变量又恰 “覆盖”了遗漏 释变量 影响,那么回归分
就会变得 常具有 导性, 至与真相 道 。 设我们要 估

质量,必须了 一点是:什么样 才是 ?我们 因变量即


质量 量化衡量 ,最有可 是 分数。基本可以 是,我们
会将 开销作为一个 释变量,希 量化开销和分数之间 关
。花钱花得 在 中 分数也会更 一些吗? 开销

是唯一 释变量,那么 无 问,我们将会在开销和 分数之间寻


找 具有显著 计 义 相关关 。但是,这样 一个暗示“分数可
以通过 量花钱推升” 发现,是存在巨 漏洞 。

有 重要 潜在 释变量在分 中被遗漏了,其中最关键 一个变量

就是 长 教 。受教 程度 庭更有可 住在相对 裕 地区,


配套 设施更 ,开销自 更 ,培养出 在 中 表现
也更有可 比穷人 出色。 在回归分 中没有将 体所

在 庭 社会 济地位作为 释变量进行控 ,那么回归分 将


有可 显示 开销和 分数之间存在显著 正相关关 。 实际

上,分数 低取决于 进 门 优 , 不是教 造价


低。

我记得一位 教授曾 出,SAT 分数与 庭 汽 数量之间存


在 度 相关性。因此,这位教授暗示SAT 在 录取这个问题上是一

个 常不公平、不适合 参 工具。SAT 确存在 陷,但我最关心


并不是这门 与 庭汽 数量之间 相关关 — 裕 庭就算额外
再 买3 辆汽 ,也无法 证将 送进 。私人 库里 汽 数量

在一 程度上反映了这个 庭 收 、教 等社会 济地位 低,


人 在SAT 中 表现优于穷人 早已不是什么新闻
( 文提 , 庭收 于20 万 SAT 阅读 部分 平
分要比 庭收 低于两万 出134 分)。一个更 隐忧在

于,SAT 分是不是可以被“训练”出 ? 通过参加 私人培


训 提 少分? 培训和分数之间存在任何 正相关关 ,那么
就 易占 “ 宜”。 两个天资和 都相同

,一个 自于 人 庭,一个 自于穷人 庭, 参加了 培训


并取得了不错 成绩, 后 本 也可以 出一样 分,但由于
因 没有 会参加培训 ,不得已在 中 于 。

高度相关的解释变量(多元共线性)。 在一个回归方程式

中, 两个 两个以上 释变量彼此之间 度相关,那么回归分

将有可 无法分清 一个变量与因变量之间 真实关 。举


明, 设我们 要知道吸 对SAT 分数 影响,我们会 问研究对
是否吸食过可卡因 海洛因(并且 设已 对其他 变量进行了控

),并 回归分 方法,在控 其他变量 基础上(包 海洛因


),计算出可卡因对SAT 分数 影响;再同 计算出海洛因

对 影响。

但即 我们最后分 求出了海洛因和可卡因 回归 数, 无法揭开


真实 。方法 上 一 在于,通常吸食可卡因 人同时也在
吸食海洛因,只吸食过其中一种 品 人 人数 常少,因此在计算两

种 品 立影响时 得上 数据量 常小, 且差异将不会很 。


回 上一章 释回归分 那个虚 场景,我们将数据样本分配
不同 “房间”里, 个房间里 人除了 个变量不同,其他 都相
同,这样我们就 在控 其他潜在混淆因 提下观 一个因 对

影响。在我们 样本人 中,可 有692 个人曾 吸食过可卡因


和海洛因,但有3 个人只吸食过可卡因,2 个人只吸食过海洛因。任何

有关海洛因 可卡因 立影响 计推断,都只 从这些微小 数据


中 。

无 是可卡因还是海洛因 回归 数都不可 告诉我们有 计 义


, 且还会让SAT 成绩与吸食 品之间 关 变得更加 迷离。

当两个 释变量 度相关时,研究人员通常会在回归方程中只采 其中


一个, 创造一个新 综合变量, “吸食过可卡因 海洛因”。
,当研究人员 要控 整体 济 景时,他们会将 双方

受教 程度都纳 方程式中,因为这才是 庭教 景 有 参 。但
是, 回归分 目 是单 离 亲 亲 受教 程度,那么将
两个因 都纳 虑范围反 会引起混淆,让分 变得 糊。丈夫和

受教 程度存在着相当 相关性,以至于我们无法通过回归分
得出一个有 义 关于 个 长 教 程度 数(就 我们 以区分
可卡因和海洛因对 影响一样)。

脱离数据进行推断。 和所有其他形式 计推断一样,回归分

目 是帮助我们更 地 这个世 ,发现 适 于所有人口

律。但 要强 是,我们 仅仅是对与所分 样本相似 人口有


效。在上一章中,我设计了一个回归方程,通过几个 立 释变量
测体重,最终我 R2 为0.29 ,表示其 较 地 释 量个

体不同 体重, 且 量 个体恰 都是成年人。

当我们 这个回归方程式 测新 体重时,又会发 什么呢?现


在就 一 。我 在出 时 为21 寸,年 设 为零,教 程
度为零,锻 为零, 还是一个白人 性。再将这些 息输 由“变

化 一 ”数据样本得 回归方程式中去,计算出我刚出 体
重为-19.6 磅( 实际上, 刚出 时 体重为8.5 磅)。

上一章所提 “白厅”研究项目 作 在给出 时就明确地 了

适 范围,可以 具体得不 再具体了:“从事 乏控 工作将会


加未 上 心 险,该 仅适 于受雇于政府部门 性和
性。”

数据矿(变量过多)。 遗漏重要 释变量会带 诸

烦,那是不是就是 在回归方程式中加 量 释变量, 且加 变

量越 越 ,就一 可以 决问题了呢?并不是, 必反。

变量过 ,尤其当无关变量过 时 ,回归分 就会被冲


淡 稀释。举个 ,我们在设计研究策 时千万不 下方法行
事:既 我们不知道是什么引起了自闭 ,那就应该在回归方程式中加

尽可 潜在 释变量,看看最后有哪些变量具 显著 计
义, 那个时 我们 就会得 一些答 了。 在回归方程式中加
了 无关变量,那么 会有一个恰 达 显著性水平 门 ,
且 这类无关变量并不是那么 易被 觉 。至于为什么 些在实际
操作中 不通 变量在方程式里具有了显著 计 义, 明 研究
人员 是 在事后建立 时给出 释。

为了 明这一点,我 常会回 介 时所举 那个抛硬币 。

在一个约40 人 级里,我会让 一个 都抛一 硬币,抛 反


上 自动退出,剩下 接着抛;在第二轮中,抛 反 上
退出,剩下 接着抛第三轮,就这样一直进行下去,直 有一个 一

连抛出五六次正 上 。 还记得对那个 提出 一些搞


笑问题:“ 秘 是什么?诀窍是在 吗? 教 怎么 硬币
一直正 上吗?有没有可 是因为 今天穿了哈佛 文化衫?”

连 抛硬币 都是正 上显 只是 运 ,周围 都是见证

人。

但是, 计 却有可 不这么 为。连 5 次抛出正 上 为


1/32,约0.03, 低于我们通常要推 零 设时所 0.05 门 。

在这个 中,我们 零 设是 抛硬币时并不存在特殊 ; 刚


刚连 抛出5 次正 上 运 ( 我召集了 量 参与实 ,那
么这种 至少 发 在一位同 上)就 以让我们推 零 设,

宣布 择 设成立,即这位 有抛硬币 是正 上 特殊 。
在他 束了这一令人印 深刻 “神技”表演之后,我们 可以从他下
,寻找成功抛硬币 蛛丝 迹了:他抛硬币 动作、他 体 训练、
当硬币在空中时他 注 放在哪里,等等。自 ,所有这一切 最后
都可以 “荒唐”二字 。

这一现 至还蔓延 了正式、严 研究中。一个广为接受 研究

是,在零 设成立 提下, 个 小于 等于1/20 偶


真 发 了,则我们就可以推 零 设。当 , 我们进行20 次
, 在 个回归方程式中加 20 个无关变量,那么一般 就会出现

一个具有 计 义 伪发现。《 约时报》就引 了医 计专 和


流行 德·彼 话很 地 了这一令人不安 现实:“流
行 是一门 此 科,为我们了 人类 命和 亡提 了重要

,但同时也出版了 得令人咋舌 垃 。”

至连医 研究 金 —采取随 样 临床 都应该以怀


眼光 审 。2011 年,《华尔街日报》 版 了一篇有关医 研究
“一个不可见人 秘 ” 文章,报纸这样 道:“绝 部分

,包 那些 在顶级同行间审阅 上 文,都是无法
。”(同行间审阅 上 研究成 和文章,在 之 都 要
过同领 其他专 审阅以确 研究 可 性,这类 被 作

研究成 “把关人”。)之所以会有这样一个“不可见人 秘
”,其中一个原因就是在 章节中介 “发表性 见”,
研究人员和医 杂志 量关注 性发现 忽 否 性发现,那么 们

就有可 发表唯一 一篇 为 药 有效 文, 忽 其他19


篇证明该药 没有 效 文。 些临床 同样有可 采 小 样本
(比 一种 见 ),这样就提升了观 中一些随 离
数据在 计 过程中被过度重 可 性。此外,研究人员可 原本就

具有一些有 无 见, 是出于 个先 为主、根深蒂固 观


点, 是因为 项 性发现对他们 事业更有帮助(毕竟,没有人
会因为证明 药不 治 发财 出名 )。

出于上述种种原因,有 量发表 专 研究最后被证明是错 。希腊


医 和流行 约 ·艾 尼蒂斯对3 本最有 医 里
49 篇 研究 文进行了 计, 一篇 文 研究发现都被 引了至

少1 000 次,但其中差不 有1/3 研究成 都被后 研究否 了。


( ,有一些研究是支持 激 补 法 )。根据艾 尼蒂斯博
观 ,在已 出版 科 文中,差不 有1/2 最终会被证明是错

。他 研究成 在《 国医 协会 报》上,有 是这就是他


所研究 3 本 中 其中一本。这 令人产 困 : 艾 尼蒂
斯博 研究发现是正确 ,那他 研究发现就很有可 是错 。

无 怎么样,回归分 是一个 常 计 工具( 吧,我承

上一章中将其形 为“神奇 万金油”有一点 过其实), 让


我们从 数据样本中寻找 关键 相关关 , 这些相关关 又通
常是重要 医 和社会科 研究 关键所在。 计 为我们在 价这些

相关关 时提 了客观 , 得当,回归分 将会是科 方


法 一个重要组成部分。那么,就把这一章看作必须引起重 示篇
吧。
本章精选 所有 示其实都可以浓 为两个基本 。第一,设计一个

回归方程式, 清 应该 虑哪些变量、应该从哪里收集数据,一
个 方程式要比 计计算本 更加重要。这个过程可以通过对方程式
价和回归方程 具体化 实现。优秀 研究人员 对变量进行逻

辑思 ,决 哪些变量可以加 回归方程式中,发现还有哪些遗漏
变量,以及正确 读最终 分 。

第二,与绝 部分 计推断一样,回归分 终以观 样本为立 点。


两个变量之间 相关关 就 是 现场 一个 纹, 为我们 出

正确 方向,但在 数时 还不 以 (有些时 在 现场发现


纹 至都不是 )。对于任何回归分 ,都 要在以下方
得 支持:为什么方程式里要有这些 释变量?通过其他 科领

是否也 释这个分 ? ,我们为什么会 为穿 色 可


以提 SAT 数 部分 成绩?为什么吃 米花可以帮助 防 腺

?分 得出 要具有可 性,至少也得与其他科 发现相一


致。

不 示操作,那么就算是“神奇 万金油”也会 效 。
哈佛 等世 顶尖 毕业 进 社会后,其收 往往 于一般
毕业 ,让他们获得 收 究竟是常春藤 教 优 ,还是

他们本 就很出色?

出色 研究 之所以出色,并不是因为他们不 纸笔就可以在 中进行


杂 计算,也不是因为他们 在 智 竞赛中 得更 奖品
(虽 这些本领也很重要)。这些改变了我们 知 世 研究 之所

以 得 我们 尊敬和崇 ,主要是因为他们作为个人 团队, 是


找 有创 方式 控 变量, 得对 实 进行下去。在对
项 法 种介 进行测量时,我们 要 一些类似于 尺

东西 提 参 。上哈佛 会给 人 带 什么影响?要回答这个
问题,我们就必须知道 去哈佛 读书以后发 了什么, 没去哈
佛 读书又发 了什么。显 ,这两个数据我们是无法兼得 ,但

明 研究 就 找 有创 方式 测量 种 法 介 (比 去

哈佛 念书) 影响,也就是在现实与“反现实”(在介
提下所发 )之间搭建比较 。

为了让 更 地 ,我们先 回答一个看上去相对简单 问


题:派出 量 上街巡逻 降低 吗?这是一个 常具有社会

义 问题,因为 加 了社会运行 成本,给普通人 活带 了巨

损 。 更 站岗 巡逻 通过自 以及 捕坏人
少了 ,那么这项在 加 方 就可 是收 了很 效

。但是, 这项举措对 少 没有 几乎没有任何作 ,那么政


府就应该 虑 何更 地 这笔资金(比 打击 科技

运 上, 加 控摄 安装数量等)。

更 与 因 关 是什么?这样一个看似简单 问题其实

暗藏 ,让人无从下 。 了本书 这一章,作为读 一 也

了我们不 简单地 人 数这一个变量 释 。苏 世


不是洛 矶,就算是位于 国 市, 们彼此之间也存在 以

忽 差异,洛 矶、 约、休斯敦、迈阿 、底特律以及芝加哥都是

有着各自特征 市, 们 人口组成不同,打击 所 临 也
各不相同。

我们通常 法是 图 出一个回归方程式,对这些差异进行控 ,但
这次就算是 回归分 也无 为 了。 我们 图 人 数量

作为 释变量(同时控 其他因 ) 释 (因变量),就存在

一个 常严重 因 问题。尽管从 上 ,我们有确凿 证据


证明派更 上街巡逻 降低 ,但也 有可 是

“导致”了更 不得不上街巡逻。我们可以 松地在 和

数量之间找 一个显著,但也 具 导作 正相关关 : 有最


地方也是 问题最严重 地方。当 , 有最 医 地方

常常也是 人最为 集 地方,但并不是这些医 导致人们 ,他

们只不过是 了那些最 要医 地方 已(与此同时, 人们也会

集 这些 提 优质医 务 地方)。在佛 里达州有 量


专 和心 专 , 将他们赶 其他州去治 人,佛 里达州

退休人口会因此变得更加 康吗?显 不会。

欢迎 项目 估阶 ,在这里我们会探 与测量 些介 因

作 ,从新 药 就业 决政策,从 中 辍 派更

上街巡逻。所有这些我们所关心 介 都可以称为“治 ”,
虽 这个 更 是出现在 计 里 日常口 中。治 可以是

其表 含义,即 种医 干 ,也可以表示上 、出 后参加就业

培训等。关键在于将 个因 效 分离出 , 景是,将除了


是否接受过“治 ”以外其他方 相同 两组人员放在一起进

行比较。

在 以弄清原因和 时 ,项目 估提 了一 于 离治 效
工具。回 刚才 和 问题上,让我们 看看宾夕法尼亚

乔纳 · 里 和乔治· 亚历山 · 巴洛 是 何

决这个问题 。他们 研究策 是 助 怖袭击 。具体


,华 顿特区由于其 都 特政治地位,自 成为 怖分 主要

袭击目 ,因此在发出“ 度戒 ” 日 里, 里 些区 会

派巡逻 。 设街 和 怖 胁之间没有相关性,那么在华
顿特区 加 就与传 之间不存在相关性,也就是所

“外 变量”。这两位研究人员最有价 贡 就在于发现了一个自

实 : 怖袭击“ 度戒 ” 会给传 带 什么影响?


回答是: 怖袭击 级 为 色时( 度 戒、更 上街)

要比 色时( 戒级 低,没有 加额外 法巡逻)低约7% 。

两位研究员还发现,在 度 戒 日 里,那些 派最 区
下降 幅度是最 (这是因为这些 区是白 、国会 厦和国

广场 所在地)。一个重要 启示就是,我们只 要开动 筋,就

回答 但很重要 社会问题。下 就 介 一些 离“治 ”效


最常 方法。

随机控制实验。 安排实 组和对 组 一个最直接 方式就是—可

出 有些 余—创造一个实 组和一个对 组。在 这种方式时

会遇 两 。第一个 是,在很 时 是没有办法 人 实

, 且这一限 怕在短 都无法 决。因此,只有当我们有 由


为治 效 可 会给人带 积 作 时,才 以人作为对 进行对

实 。但这种 少之又少( ,人们关心 更 是药 中

辍 ),因此我们就 要接着 习其他策 。

第二个 是,人作为实 对 要比实 室里 小白 变化得更 。治

效 会因为实 组和对 组在其他方 差异 变得异常 杂,

实 对 中 会有个 、个 矮 、 、 康 、 、
、 、酗酒 、 资银行 等。我们 何才 证这些不同 特

性不会影响 实 ? 消息是:人 中 得有几次 会 这次

最少 劳动换 最优 !这里所 创造实 组和对 组 最


方法就是将研究对 随 分配 两个组里。随 性 就在于,与实
无关 变量一般会在两个小组里实现平 分配,既包 那些显 易见

特性 性 、种族、年 和教 ,也包 其他 以 觉但可以干 实

特性。

设 一下, 我们 样本中包含1 000 名 性,那么当我们将这个样

本随 分成两组时,最有可 出现 是 个组中 性数量为500

名。当 ,我们无法 证 次都这么 确,但 又一次地站在了我们


这边, 一组 性数量 出另外一组 并不 (同 可知,

一组具有 种特性 个体 出另一组 也不 )。 ,在

一个数量为1 000 人 样本中, 性占1/2 ,那么有 过450 位 性同


时被分配 同一组 还不 1/100 。由此可见,样本数量越 ,随

分配 作 就越明显,实 组和对 组 相似性也越强。

医 就是典 随 控 实 。 是“双盲” 临床

,这 味着无 是 人还是医 都不知道哪一组是治 组,哪一组是

对 组。但 治 里包含了 (心 外科医 当 知道要给哪些

人 搭 ),那“双盲”显 是不可 了。但即 要 , 人


可以被蒙在 里,因为就算进了 室,他们也不知道自己是否接

受了心 搭 。我最欣 研究之一是一份有关 种 膝盖

估报告,治 组 人接受了膝盖 , 对 组 人则接受了一


次“ ”,医 只在这组 人 膝盖部位划了3 道 小 口

,“ 装在给他们动 ”。最后 是,真正 在 膝盖

方 并没有比“ ”有效。
我们可以 随 测 一些有 现 。 ,陌 人 祈祷是否
可以加快 人 后 ?人们对于宗教 和 千差万 ,

但《 国心 》主办了一次控 实 ,观 过心 搭

人是否会因为有一 陌 人为他们 康和快速 祈祷 后


并发 严重程度。一共有1 800 名 人和 自 国3 个宗教团体

人 参与其中。所有 人 接受了心 搭 并被分为3 组:第一组

没有人为他们祈祷;第二组有人为他们祈祷, 且 人自 也知道;第
三组也有人为他们祈祷,但研究人员只告诉这组 人,有可 有陌 人

为他们祈祷,也有可 没有(这样就相当于控 了祈祷 安 作 )。

与此同时, 自宗教团体 人 会为 些 人祈祷,祈祷时 何


念 人 名字也有要求,祈祷 范围也有 ,必须要包含“

成功、 康 、没有并发 ”。

何?祈祷会成为 国摇摇 坠 医 体 “救命稻草”吗?

怕没那么简单。 过30 天 观 ,研究人员并没有在得 祈祷 人和

没得 祈祷 人之间发现任何 后 上 不同。但是,也有人
这项研究遗漏了一个潜在 变量: 自于其他渠道 祈祷。《 约时

报》 道,“专 称这项研究无法 一个最 碍,即 一个人

收 自未知渠道 祈祷— 友、 人、 世 各地 天为 和
于弥 之际 人所进行 祈祷。”

在人 上 实 可 会遭 逮捕,也有可 让 坐上国际刑事法庭 被

告席,对此 应该心里有数。但是在社会科 领 ,以人作为研究对


进行随 控 实 存在空间。 名 且影响深远 田纳西州STAR
项目就是其中之一,其实 目 就是观 小 教 对 习 进效

。 级 小和 习之间 关 为重要, 世 国 都在积 寻求

提 教 水平 途径。 其他 都不变,小 教 进更加有


效 习,那么整个社会就应该在教师 培养和上岗方 加

实现小 教 。但反过 ,由于培养教师 成本 昂, 小 教

之所以 表现 是因为其他方 因 , 级 小无关,则


我们就应该 止小 教 推广, 把有限 教 费 其他方

出人 料 是, 级 小和 成绩之间 关 异常 杂。一般 ,
开设小 教 有 资源也更 ,这些 和老师与

教 存在差 。具体 部,小 教 出现原因也各

不相同。 长可 会让成绩 底 组成小 一起上 ,从 导致小


教 与 成绩之间 相关关 。 丰 教师可 会选择

去教小 ,这样 话,小 教 就可 不是因为 少老师教得

更精心, 是因为选择教小 老师水平普遍较 。

田纳西州STAR 项目 于1985 年,针对小 教 进行了控 实 。(

·亚历山 时任田纳西州州长,后被 国 老布什任命为教 部


部长)。在幼 园教 阶 , 自于79 个不同 们被随 分

小 (13~17 个 )、常 (22~25 个 ,老师和助教 为常

水平),教师也同样被随 分配 不同 级中去。 实 安排,


将会在其被分配 级中 习一整年,但不断变化 现实 是在
蚀实 随 性:一些 中途才加 实 , 一些 中途就离开

了;一些 因为违反 律被安排 了其他 级,还有一些 长四 求

终于将自己 了小 ,诸 此类。

至今,STAR 项目 是测 小 教 效 唯一 随 实 ,其 无

是在 计 义还是社会 义方 都是 凡 。 体上看,小 在

中 表现要比常 级 出0.15 个 差,小 里 人


进步更是达 了两 之 。但坏消息是,STAR 项目实 共花费约1 200

万 ,有关祈祷对 后 效 研究也花掉了240 万 ,最精

致 研究与其他任何精致 事 一样,都有一个共同点,那就是价格不
菲。

自然实验。 并不是所有人都有 随随 资几百万 运行

一个 随 实 。一个更为 济 替代方 是寻找 一个自 实 ,

当 个事件自 地发 时,恰 营造出一个接近于随 、对 实

环 。本章一开 举 那个有关华 顿特区 就是一个自


实 。 活有时 出于偶 创造了一个实 组和一个对 组,在这个

时 ,研究人员应该主动出击,对眼 现 进行分 并得出 。

要 将教 和寿命放在一起 ,那么我们会对这一对看似不相关
实则 交错 变量作何 价?受教 程度 人往往活得更久,这个

在控 了其他 收 、 享受 医 资源等因 后 存在。

《 约时报》报道:
“无 是哪个国 研究人员,一个他们达成共 与长寿相关 社会

因 就是教 。一个人受教 程度 低与寿命长短 相关性比种族和


收 因 都要显著。”但至少 目 为止,这还只是一个相关关 。在

其他 都相同 提下,更 教 是否就 带 更 康 体?

把教 看作一种“治 ”,那么接受更 “治 (教 )”是


否就 证 活得更久?

这是一个看似不可 得 回答 问题,因为选择接受教 人与不希


读更 书 人 在 些方 是不一样 。 中 历与本科 历 人之

间 差 绝不仅限于 4 年 教 ,在那些选择 求 人当中,

有可 存在 些他们所共有 除了教 以外 隐藏特性,从 得这


些人更加长寿。 这是真 ,那么让那些原本没 过 念书 人上

;对延长他们 寿命并不会有帮助。 康 改善不 归功于提

教 程度, 是 自于那类选择提 自 教 程度 人所共有 特


质。

我们不 随 实 决这一 题,因为这会让 些实 对 在不

态下过早地离开 园( 一个人 : 不 去上 ,因为


在对 组。 就觉得残忍)。测 教 对寿命 因 作 唯一可

行 办法就是, 助 些让不 深造 人 在 自 实 得出

,至少这在道德上是可以被接受 ,因为我们 测会看 一个积


正 治 效 。但是,我们还是不 强迫 人 在 ,这太不符合

国 “自由”精神了。
可 往往 不进现实。 国 一个州都 了相关法律 证最低

受教 年限,但在历史上,这些法律都曾发 过变化。 这类 研究对


本人所 决 影响受教 程度 外部变化正是研究人员 以求

。哥伦比亚 研究 德丽安 ·莱 斯- 发现, 国不同 州

在不同时 对各自 最低受教 年限进行过 整,并由此 为这是一个


具有研究潜 题。 通过 阅 量史料和人口普 数据,对这些州

义务教 法律中有关最低受教 年限 变化以及相对应 居 寿

命变化进行了记录。但 临着一个实 方法上 :即 一


个州 居 在最低受教 年限提升之后活得更久,我们也不 将寿命

延长归功于 教 加。这是因为人 平 寿命从 体上看一直在

加,无 对州法律进行何种 整, 于20 世 90 年代 人就是活得


比 于19 世 50 年代 人久。

但莱 斯- 还有一个天 对 组:那些没有对最低受教 年限进行

整 州。 研究接近于一个 实 室实 : 法律,伊 诺
伊州 居 不得不在 接受7 年 教 , 他们 邻居—印第安纳州

居 只 要 成6 年 业就可以选择离开 了。 与实 室实

唯一 区 就在于,对 组 形成 是因为一个历史巧合, 这恰恰


是“自 实 ” 应有之义。

那 是什么呢?伊 诺伊州年 在35 周岁及以上 成年人,就因为比


印第安纳州 同 人 上了一年 ,他们 寿命要比后 出一年

半。莱 斯- 研究 在其他国 研究中也得 了证实,义务教


年限 差异导致了类似 自 实 。随之 就是一些质 ,我们

至今也没搞明白 上 可以活得更久 后 原 底是什么。

非对等对照实验。 有些时 研究治 效 最 且可行 方式,并

随 地分配实 组和对 组。当环 不 我们进行随 分配


时 ,我们当 希 最终 实 组和对 组 体相似,不对

确性产 影响。 消息是,我们有一个实 组,一个对 组。坏消息

是,任何 随 分配都会产 见,至少是有存在 见 可 性。就算

为 分组 无破绽,但 在实 组和对 组之间还有一些 以


觉 差异,正是这些差异影响了小组成员 分配和组成,从 产

现实有 差 ,这就是我们所 “ 对等对 ”。

一个 对等对 组 可以成为 常有 工具。让我们回过 思

一下本章开 提出 那个问题:进 一所顶尖 习真 会给人 一

带 巨 优 吗?哈佛、普 斯顿、达特茅斯等名牌 毕业
确实 常出色,他们 工资更 , 活也更加精致和丰 彩,相比

之下那些毕业于一般院 就过得惨淡 了。(PayScale 站于

2008 年曾进行过一项 ,发现工作10~20 年 达特茅斯 毕业


工资中位数为13.4 万 ,是所有本科院 中最 ;普 斯顿

位居第二,工资中位数为13.1 万 )。我希 在这个时 应该

,这些令人 心 数字其实 达特茅斯 普 斯顿 教


价 无关 。进 达特茅斯和普 斯顿 在 中毕业申请
时就已 常出色了,这也是他们 被这些 录取 原因。无

他们是否接受过 教 ,都有可 成为 活中 。

我们所不知道 是,接受 哈佛 这类顶尖 精英教 会

产 怎样 效 ?从这些名牌 毕业出 人之所以 成功, 底

是因为他们当 在 门时就已 才华出众,还是因为这些 通过


精选优秀人才、培养他们 竞争 得他们 “附加 ” 加,又

两 都有?

我们还是不 通过随 实 方法 回答这个问题。很少有 中毕业


被随 分配 一所 就读,哈佛和达特茅斯 也不 接

收随 分配给 们 。研究似乎陷 了 局, 底怎么样才

教 效 呢?开动 筋就 找 出 !两位 济 斯 西·
尔和阿兰· 格发现,其实有很 在 中毕业时会同时申请 所

,通过对这一事实 “ 掘”,研究出现了 。一些 被名牌

录取之后 兴兴地去报 了, 有一些 在收 名牌


录取通知书后, 过再三 虑,还是去了普通 院深造。于是现

在我们就有了一个实 组(进 名牌 习 同 )和一个 对等对

组( 才华和实 以进 名牌 却选择去竞争没那么激
习)。

尔和 格对两个组 向数据进行了分 。虽 这不是一个苹

对苹 比较, 且收 只不过是人 成就 一部分,但他们


发现应该 舒 中 及其 张 绪。毕业于名牌 人在
收 方 并没有 过实 相当,但选择就读一般 人,唯一 外

就是出 于低收 庭 人,他们从名牌院 毕业后 收 会有明显

长优 。 尔和 格 方法有效地将实 效

(在名牌 读4 年书)从选择效 (最有才华 都被名牌

了)中 离了出 。阿兰· 格在《 约时报》上撰文 出,“相

比起毕业证书上 名字,正确 自己 兴 、 和 更 成
就人 一 ”,这其实也间接回答了本章升 所提出 那个问题。

差分类差分实验。 观 原因和 一个最 方式就是放 去

, 后看看会发 什么,因为这就是 和小 (有时 也包 成年

人) 世 途径。我 小 很快就发现, 他们在厨房乱扔食

(原因), 里 小 就会兴 采 地追着食 ( )。当 ,同


样 观 方式也可以帮我们 活中 其他现 。 国政府推出

了 税政策, 济就会 着 ,那么 税政策一 是 济 助推 。

,这一方式存在着一个巨 陷阱: 活可比在厨房扔食 杂

了。 确,政府 税政策 正 在 个时间点出台,但在同一时

可 还有其他“介 ”因 在发挥作 :越 越 性进

习,互 以及其他科技创新正在提升 国工人 产效 ,中国 人


币价 被低估,芝加哥小 队 被 雇,等等。无 税政

策出台后发 了什么事 ,都不 只归功 归咎于 税政策本 。任


何“ 与后”类 分 临着一个 ,那就是仅 一件事 随另

一件事 发 ,并不 推断两件事 之间存在因 关 。

“差分类差分”法可以通过两个步 明确 个介 因 效 。
先,我们对 个 体接受 项介 因 治 之 和之后 数据进行比

较, 推广 进就业政策之 和之后 个县 业 变化 。其

次,我们将这些数据与另一个没有推出就业政策 同类县同 业
进行比较。

重要 是, 于分 两个对 除了是否有介 因 ,其他方

基本上都相似;因此,两个对 观 若存在任何显著差异,就应
该被 为是所 估 项目 政策 效 。举个 , 设伊 诺伊州

一个县为了应对 业 ,推出了一个就业培训项目,但在接下 两

年时间里, 业 呈上升 ,这是不是就 味着就业培训项目


败了? 告诉我们答 ?
图14-1 就业培训项目对A 县失业率的影响
也有可 存在其他 观 济因 作 , 济 持 不景 等。
在“差分类差分”法 导下,我们对同 两个县 业 变化 进

行比较,其中一个县推广了就业培训项目,另外一个县并没有推广,除

此之外两个县在其他方 都必须 持一致:相同 工业 成、相似 人


口 等。那么,推广了就业培训项目 县在 业 数据上 变化相比

起另一个没有推广该项目 县,呈现了一幅什么光景呢?通过比较两个

县相同时间 业 变化,我们就 性地推断出就业培训项目


效 了。这就是“差分类差分”, 一个差分表示项目推广 后 业

变化,后一个差分 是两个县同 业 变化差异。另一个没有

推广就业培训项目 县在研究过程中扮演 是对 组 色,有 于我


们更 地 项目实施 后 数据变化,因为对 组会受 实 组一

样 观 济 作 。最 我们 为就业培训项目一无是 (因为在项

目实施之后 业 变得更 了),但是对 组为我们展示了更加 糕


就业 ,因此通过综合比较和分 ,就业培训项目 正 作 就显现

出 了。

不连续分析实验。 实 组和对 组还存在一种设 方式,就是将

那些刚 符合介 治 件 对 ,以及以 厘之差错 治 会

对 进行比较。那些刚 过 微不 件( 分数 最低

庭收 等) 个人,其实在 重要方 与实 组里 个人相差无


几, 一组对 接受治 、另一组对 不接受治 人为划分其实本
就是 常任 。因此,比较这两类对 可以为我们提 有关介 治
效 有 参 。

图14-2 就业培训项目对A 县失业率的影响(以B 县作为参照物)


设 个 区要求各个 暑 时间为成绩不 开设补

习 ,主管教 领导 要知道暑 补习 项目是否具有长 推广 价


。当 , 只是简单地比较参加补习 和不参加补习

, 将会是 无 义 。那些 之所以会出现在暑 补习 里就

是因为他们 成绩不 ,就算暑 补习 效 立竿见影,这些 还


是 以在 中 过 上其他不 要参加补习 同 。我们真正关心

是,这些 在参加 补习 之后 成绩与参加补习 之 相比是不

是提 了。是 ,我们可以组织一些控 对 实 将成绩不


随 分配 暑 补习 组 “闲 在 ”组,但这可 会 一些

要寻求上进 提 成绩 会。
所以,我们 实 组和对 组应该 自那些正 在 上成绩居中 同
,有一些 刚 被老师安排 补习 ,有一些 差一点 就 去

了自由自在 暑 时光。设 一下:那些在 中 中成绩不及格

与 及格 是不一样 ,但一个分数为59 分(不及格)

同 与一个分数刚 为60 分(通过 ) 同 呢? 那些在 中


中成绩不及格 必须参加补习 ,那么一个合 且有 义 实

组和对 组就应该在那些差一点 就及格 (参加补习 )和差一

点 就不及格 (不 要参加补习 )中产 ,这两组 末


成绩将会是我们关注 重点。

少年 禁,是否可以 防他们今后再次 ?这个问题我


们也可以 不连 分 法 决。显 易见,这类分 不 简单地比较

坐 与量刑较 少年 ,因为被 坐 少年

是因为 下了比其他同 人更加严重 错 才受此惩 。我们更不


随 分配刑 方式 设 实 组和对 组(除 下次闯了 灯,为

了 除刑 25 年 禁 险)。伦敦 研究员兰迪·加尔

曾在 国华 顿州开展了一项关于 少年 , 图弄清严厉
刑 与 少年今后 行为之间是否存在 种相关性。具体 ,

比较了那些刚 得上 与刚 逃过“ 之灾”(通常只

要 释) 两 少年 。

华 顿州 司法体 专门设计了一个坐 为 一位 错 少年

刑。X 表示 是他们以 过 错, 一次重 就记1 分,一次


就记1/4 分, 部加起 就是X 上 读数。与此同时,Y 表示

是当 所 行 严厉程度,级 从E(最不严重)一直 A+ (最为


严重)。那么,最后 刑就是根据他们以 和现在 错 严重程度在

坐 上体现 位 。 一个人之 所有 错 加起 为2 分,这次

又 了一个级 为B 重 ,那么他将在 少年 待上15~36 个月;


一个人过去所积 错 只有1 分,这次又 了同样 ,根据坐

显示,他将不会被送 。正是这种刑 不连 性激发了研

究人员 灵 ,加尔 比较了正 得上坐 和正 去 刑


两 少年 , 在 文中 释道:“ 两个人都 了级 为C+

,其中一个人之 计 分数为

2.75 , 另 一 个 人 积 分数为3,那么只有后 才会被 坐


。”

从研究 度 虑,这两个人几乎 相同,除了有一个人要去坐 。


但从 决书下 那一天起,他们两人 行为就进 了 不同 演变

道。被 坐 少年出 后再次 会显著降低。

无 在医 、 济、商业、司法还是其他任何领 ,我们 是在关心治


介 是不是真 起了作 。但是,因 关 是一根 啃

,我们有时 至连明显得不 再明显 原因和 都无法确 。为

了了 种介 治 真正 效 ,我们 要看 “反现实—事实
”,即 没有介 治 会发 什么。但是在 时
,“事实 ”却没有那么 易 至不可 被发现。举个 :

伊 让 国变得更加安 了吗?

这个问题在 上只有唯一 答 :我们永远也不知道。原因就是,我

们不知道也无法知道 国没有 伊 会发 什么。 确, 国

没有在伊 发现 伤性武器,但 证 国哪一天若真


兵不动,萨达 晚上在洗澡 时 会不会灵 一动从其他国 买一 氢

弹回 ?那之后又会发 什么, 知晓?

当 , 有可 在 国 兵不动 那天晚上,萨达 一边 洗澡一

边在 中 着从哪里买氢弹 时 , 下一滑,后 勺磕在了 石

浴 上一命呜呼了。 真 是那样,那 国就不 花费那么 代价


除掉萨达 了。

对于任何一个项目 估 ,其目 都是为 价治 介 效

提 种“反现实”。在随 控 实 中,对 组就是“反现实”;但


当对 实 不具有可行性 有违道德时,我们就 要寻求其他方式

“反现实”。对这个世 探 在很 时 就 于寻找“反现

实” 明才智。

结束语 统计学能够帮忙解决的5个问题
就在不久 ,数据 收集还是一件 常困 事 ,数据 分 更 要
支付 昂 费 。过去 交易记录都 要 助纸质收据,因为 于分
积数据 个人 还没有出现,但在区区几十年后 今天,我们 至

可以对 个区 过100 万张 卡 交易进行数据分 。在 萧

时 ,官方数据 得 国对 济问题 严重程度 糊。那时


国政府并没有对国 产 和 业 等 进行 计,也就是

,政客们在作 济决策 时 几乎是摸 进行,就 在 里寻

找出 ,但 上又没带 南针。1930 年 国 伯特· 佛宣布


萧 束,但其所参 据尽是些不 确 过时数据。他在国 咨文

中告诉 体国 国有250 万人没有工作,但实际 业人数已 达

500 万人, 且还在以 周10 万人 速度 加。正 斯·苏洛维奇


最近在《 约客》上撰文 出,“那时 国政府 是在一片漆 中

政策。”

今,各种数据几乎要把我们“淹没”,但从 体上看,这是一件 事

。本书所介 计 工具 帮助我们 决一些重要 社会问题。

因此,我觉得 问题 答 束 书是再合适不过了。在我们消化
和分 海量 息 同时, 下 这5 个重要(且随 ) 问题,通

过合 运 书中介 知 与工具 就 给出具有社会 义 答 。

橄榄球的未来在哪里?
2009 年, 尔科 · 格雷德 尔在《 约客》 一篇文章里提出了一

个问题:斗 和 有 不同?第一眼看 这个问题时,我 觉是


作 故 在哗众取宠、 造效 。格雷德 尔之所以将这两种运动
一起,是因为四分卫迈 尔· 曾因参与斗 被 ,出 后

又重新加 国 业 , 此时正 传 四起: 运动带

部损伤有可 会导致晚年 郁、记忆丧 、 呆以及其他神 问


题。格雷德 尔 核心观点是,无 是斗 还是 业 ,对其参与

都是具有破坏性 。读 整篇文章,我不得不承 作 眼

光。

我们所知道 是,有越 越 证据表明, 运动过程中产

荡和其他 损伤 导致严重且永久 神 伤 。( 击 和曲

运动员 上也存在类似 现 。) 知名 业 运动员都曾


在公众 分享过他们退役后与 郁、记忆丧 以及 呆等 抗争

故事。最令人 心酸 莫过于 芝加哥 队安 队员、“ 级碗”

军 夫· 尔 ,他开 束了自己 命,在遗书中他明确 示 人


将他 捐 给相关 于科研。

在一次随 话 中,有1 000 名 涯在3 年 3 年以上


业 运动员接受了采访,年 在50 岁以上 运动员中有6.1% 被诊

断 有“ 呆、阿尔茨海 其他记忆 相关 ”,是相同年

国平 水平 5 。在年 运动员 体中,类似 诊断 达 了


国平 水平 19 。至今已有数百名 国 业 运动员将

和运动 造商告上了法庭, 由是他们涉 故 隐瞒有关 部

损伤危 息。
安· 基是 萨诸 州 得福德退伍军人医院神 实 室 一名

研究员,主攻 损伤给神 带 影响(巧合 是, 基同时也主持

了弗雷明汉心 研究项目 神 部分)。 基博 在 击 、


运动员等人 中发现了异常微管相关蛋白(tau蛋白)积 证

据, tau蛋白就是导致 性创伤 部 变(CTE) “ ”,随着运

动员年 ,他们 神 乱开 变得越 越明显,其中有


与阿尔茨海 常相似。

与此同时,其他科 也在研究 和 损伤之间 关 。北卡

纳州州立 运动 荡研究中心 文·加 奇维茨在北卡 纳


州 队 一位队员 嵌 了一个 应器,以 记录下运动过

程中队员受 部撞击 度和性质。根据他所获得 数据,运动员

日常 受 一次 部撞击,就相当于坐在一辆时速为25 迈 里突 遇
祸时 袋撞上挡 所受 撞击。

但在这个 中,有一些 息是我们无法知晓 。 目 为止,我们已

发现 有关 损伤 证据是否就 权代表所有 业 运动员


退役后所 临 神 变 险?还是 ,遭遇不幸 人只是所有运动员

中 “一小撮”,即 计 上 “异常 ”?就算真 是所有 运

动员在晚年 上神 乱 险 于常人,我们也无法证明两 之间
因 关 :可 是 并从事 ( 击、曲 )运动 人天

就 易 上此类 ;也有可 是其他一些因 , 注射类固醇导致了

他们晚年 神 。
不断有证据表明, 运动与永久性 损伤之间存在清晰 因
关 ,那么一个严峻且现实 问题就摆在了运动员(以及 少年运动

员 长)、教练员、律师、NFL官员, 至政府有关人员 : 否

在 运动过程中避 少对运动员 部 损伤? 不 ,那下


一步该怎么 ?这就是 尔科 ·格雷德 尔将 与斗 放在一起

进行比较 目 ,他 释 ,公众之所以 至 斗 ,是因为

主人明知这项活动会给 带 伤 和折磨,还故 这么 ,这是为什


么?就是为了取 观众、 得奖金。在19 世 ,斗 在 国被广泛接

受,但在今天 社会,无 是在道德上还是法律上都不会接受这样一种

残忍 运动。

在回答当下 业 运动是否存在未 这个问题上,本书介 几

乎所有 计分 方法都被研究人员派上了 场。

是什么导致了自闭症患者数量的激增?
国 控 中心在2012 年披 , 88 个 国 童中就有一个被诊断
有自闭 (基于2008 年数据)。2002 年 确诊 为1/150,

了2006 年,确诊 攀升 了1/110—在不 10 年时间里 了将近一

。自闭 (ASDs)主要 是, 童在成长过程中表现出与


接 、交流和行为举止上 异常和 碍。“ ”暗示自闭 所包含

行为 广泛。 被诊断为自闭 是 5 (也

就是 , 至要 于1/88)。
第一个颇有 味 计问题就是:我们是不是正在迎 种“自闭 发
潮”、“自闭 诊断潮”, 二 合?在之 几十年 时间里,

有自闭 童可 没有被诊断出 , 他们所表现出

成长 碍被笼 地归类为“ 习 碍”。 今 医 、 长和老师对


自闭 更加清晰,因此不 自闭 本 是否正在蔓

延,其诊断人数 都是必 。

但是无 何,自闭 发 所带 必须引起 长、老师和


社会 关注。 个自闭 一 医 开销平 为350 万 ,虽

不是什么传 ,但我们对自闭 因 所知 少。 国精神 康

会主任 斯·英 尔曾 ,“(自闭 )是 引起 吗? 是


波、无糖苏打水?1 000 位 长有1 000 个答 。就目 看,我

们还不得 知。”

自闭 童 成长环 和出 景有什么不同 特 地方?他们与

自闭 童之间最显著 差异在哪里? 国各地 自闭 发 都

是一样 吗? 不是,那是什么原因导致 ? 助传 计侦
法,我们 找 一些 。

加 福尼亚 维斯分 研究人员近 进行了一项 ,发现该州

有10个地方 自闭 确诊 与周围区 相比 出一 ,这10 个地方无一


外都是受教 程度 白人 集区。这会是一个巧合,还是一个

?是不是 件相对优越 庭更 易 出自闭 童?同一 研究人

员还进行了另一项研究,从1 300 个自闭 童 庭中收集灰尘样本


分 其中 化 成分,看是否存在 些环 污 从 引起了 童自闭

在此 间,另外一些研究人员发现自闭 与基因存在关 。他们发现,

中 两个小 是同卵双 ( 有 一样 基因组成),那么


他们同时 上自闭 就要 于异卵双 两个小 。但这一发

现并不 排除环 因 强 作 ,自闭 既有可 是基因与环 共同

作 ,也有可 是后天环 所引起 。比 心 ,虽


先天 基因 成至关重要,但吸 、饮食、运动以及其他行为和环 因

都会 发心 。

目 为止, 计分 所 最有贡 事就是排除了无关因 ,这些


因 一开 会进 人们 是因为 们混淆了相关关 和因 关

区 。自闭 通常会发 于 童一周岁 日过 之后两周岁 日 之

,因此,很 人就 为在此 间接种 苗,尤其是 、腮腺炎和


三 苗(MMR)是导致 童自闭 发 “ 祸 ”, 自印第

安纳州 国国会议员丹·波顿曾对《 约时报》 ,“我 孙 在一

天 接种了9 支 苗,其中有7 支含有硫 汞, 可知道这里 有50%


都是汞啊,不久以后他就被确诊为自闭 。”

今天,科 已 排除了硫 汞与自闭 之间 相关性。就算注射


是不含任何硫 汞成分 三 苗,自闭 童也不会因此 少;在

没有推广三 苗 国 里,自闭 确诊 也没有比注射 苗 国

低 哪里去。但只要这种伪相关性存在一日,就会有 长 绝带他们
去接受 苗接种。讽刺 是,这样 不但不会 少 上自闭

险,反 会将他们 于 其他严重传 更 危险之中(并


加 这些传 在人 中 传播)。

自闭 是当今医 和社会 所 临 最严峻 之一。对于这种给人


类福祉造成 此巨 ( 且有可 还在 )冲击 ,我们 了

却少之又少。科 正在 以 日地运 本书提 一种 计 工具

(以及更 没有提 方法) 改变目 这种被动 局 。

我们依据什么来奖励优秀的教师和优质的学校?
我们 要优质 ,优质 又 要优秀 教师,因此正常逻辑要
求我们对优秀 教师和优质 给予奖励,同时 雇不 责任 教

师,关闭教 质量不 。

何才 这些?

分数为我们提 了一个客观 衡量 。但我们也知道,一些

在 中发挥出色是因为其他方 因 ,与教师和 并无关 。


要正确 价 和老师,一个看似简单 决方 是,观

后是否在 习上有所进步以及进步幅度。当 们刚开 时 ,他们

都有哪些知 ?一年后,他们对世 又丰 了 少? 通
过上 加 “附加 ”就是区 所在。
我们 至还可以通过 计 对该附加 进行更为精确 知,综合

虑 个 级里 人口 计 成, 种族、 庭收 等,以及他们
在其他测 中 表现(作为 价他们资质 参 )。 上 成

绩原 一直在及格 边 徘徊,在换了一位老师上 后没 久, 成

绩就出现了显著提升,那么这位老师 教 效 就 常 。

一切就绪!现在我们就可以 精 计 工具 衡量教师 教 质量

了。至于怎样才算得上一所优质 ,当 就是看这所 有没有

量 效 优秀教师了。

这些 计 估方法在实际应 过程中 实施效 何?2012 年,

约市 先“ 水”,对 市1.8 万名公立 教师进行了“附加


测 ” 级—在综合 虑 提下,重点观 分数

提升程度。《洛 矶时报》在2010 年 时 ,也曾对洛 矶 教师进行

过类似 级。

无 是在 约还是在洛 矶,对教师 级 度 反应都 常强 , 且

各种观点都有。 国教 部部长阿恩·邓 体上支持此类 级项目,

因为 们 补了这方 息空白。洛 矶政府公布教师 级数据之


后,邓 在接受《 约时报》采访时表示,“不 再 沉 下去

了”。 巴 政府还给各个州划拨了专 费, 于开发附加 测 项

目 导教师 工资改 和 业成长。 级 支持 们义正 严地


出,这是教师管 体 一次飞 ,过去所有教师发 都是 一 固
工资,与他们 教 表现无关,起不 激励教师改善教 质量 作

但是也有 专 告,这类教师 级数据存在 差,有可 会

导公众。 约教师工会 了十 万 在报纸上 打广告, 题就

是“教师不是这样 价 ”。项目 反对 称,附加 级带 “伪


精 ”会被那些不了 这类 级 局限所在 长和公共政策官员滥

这就是一个典 “公 公有 、 有 ” ,无 是哪一
方,都 在 种程度上站住 。达特茅斯 济 道格·斯 格

长 从事教师附加 数据方 研究,他 告 这类数据本质上是“有

漏洞” 。对于 一位教师 估, 常是建立在 一 参加 一


天 一场 基础上,这其中有太 因 会影响 他们 发挥—从

这 本 当天 空 ,可 是防不 防。这些 价 与教

师 一年 教 表现 关 度只有约0.35。(有 思 是, 价 国
业 选 与其年运动表现 关 度也是0.35,其中击

价 为击 , 价 为防御 )。

斯 格 ,虽 这类关于“以 分 英雄” 教 效 数据 常有

,但也只是 价教师 参 之一。 有关部门 积 位教

师更 年份 教 效 数据,涉及更 不同 级,就可以 少这类数


据 “漏洞”(这与 价运动员是一个道 ,掌握比赛和赛季 数据越

,给出 价就越客观)。在 约教师 级 中, 个


长都被告知应该正确看待附加 数据,清 这些数据 “先天 陷”。

但是,公众对这些“ 陷”和数据 局限性并不知 ,因此人们

常将其 作 价一位教师教 质量 决 性 。我们 是对排名心存


, 至有 时 数据根本不支持 此精 ,就比 《 国新

闻与世 报道》 排名。

斯 格最后还提醒 :我们最 证所 估 (比 次 成

绩)从长远 看与我们真正关心 持一致性。 自空军 院 一

些 特数据显示,现阶 优异 成绩并不代表未 光明 景,关于这


一点并不令人 。与其他军事 院一样,空军 院会随 安排

习不同 科目, 级微积分等。 随 分配在

价教师 教 效 时 排除了选择性 见可 对 产 影响,

只要观 长,我们就可以 设所有教师教导 都 有相同


资质(这一点与绝 数 不同,在这些 里, 可以根据自

和兴 不同,选修 退选不同 程)。针对 一门 程,空

军 院还采 了相同 教 纲和 。加 福尼亚 维斯分


斯科特·卡瑞尔教授和空军 院 斯· 斯特教授就看 了这一近

乎 教 安排,并以此 回答 等教 领 一个最为重要 问题:

哪位教授 教 效 最 ?

答 是: 少又在 名牌 取得 位 那些教授们。他们

在 级 程 中 成绩普遍较 , 且他们在教 估中
得 价也通常较 。显 易见,这些年 、 满干劲 老师对
待教 比 暴 哈佛 博 老教授要 真 责得 。那些老人

至今还在 1978 年 陈旧教 教 ,他们 还以为演示文稿软件

(PPT)是 种功 饮料—除 他们连什么是功 饮料都没见过。根据数


据,我们早就应该将这些年 过 教授 雇了, 让他们有尊严地

退休。

不过,我们先 着 雇任何人。空军 院 研究还有另一个发现—


长远表现。卡瑞尔和 斯特发现,在数 、科 等 科 级

上, 更丰 、资格更老 老师教出 在接下 中级、 级

程中 表现要优于年 教师教出 。一个符合逻辑 推 就是


那些资历尚浅 老师更 向于在 级 上“教 何去应付

”,因此他们 在 中 分数通常比较 , 自 会 开

心,给老师 价自 也不会差。

但是,那些上了年 、 固 资深教授们(我们在 一

中差点 就 雇了他们)更关注 是教授重要 和 念, 不是


,这对于 进一步 习以及一 都会是受 匪浅 。

当 ,我们还是 要对教师进行 估,但必须要采 正确 方式。相关

部门在 政策时所 临 长 是, 何在 计 基础上开发一


个 , 奖励教师在 上为 所贡 附加 。

解决全球贫困的最佳途径是什么?
何才 让 困国 摆 困 ?关于这个问题我们在很 时 真 只

“束 无策”这4 个字 形 。但是,我们却清 地知道 何区分

裕国 和 困国 ,比 从 们 教 水平、政府 务质量等方 进行

比较。 且,我们也目睹了 印度、中国等国 在过去几十年 时间里


所 历 济 发展。但即 此,我们还是不清 应该怎么 才 让

里、布基纳法 等 端 困 国 改善现 。

法国 济 艾丝特·迪弗洛对原 计 工具—随 控 实 进行

了改进,赋予其 新 功 ,改变了我们对 困问题 。迪弗

洛是一位 省 工 教授,主要研究 是不同介 方式对改善发展


中国 困现 效 。举个 ,印度 长久以 临 一 问题

就是教师居 不下 勤 ,尤其是在 远农村地区 ,这些

通常只有一位老师。迪弗洛和 研究伙伴雷 · 哈纳 助科技 设


计了一个 明 方 对印度 斯 邦 60 所只有一位教师 进

行随 样实 。在这60 所 教书 60 位教师 出勤 话,

就会得 额外 奖励,但 何才 证他们不在出勤 数据上造 呢?


创 了:迪弗洛和哈纳给他们 人发一台相 , 这台相 出

片都会有日 水印, 且这个日 是无法篡改 。教师们 天都要 他

们 合一张影,表示这一天他们 教 了。

迪弗洛和哈纳还随 取了另外60 所 作为对 , 表明,实 组

教师 勤 少了1/2,这些 成绩也提 了,越 越


顺 地进 下一个阶 习。(我敢 那些 片一 看
了!)

迪弗洛在 尼亚还进行了一项实 ,随 取一组农 在丰收之后向他


们发放小额补贴 于 买化肥。之 已 有证据表明,化肥可以显著地

提 粮食产量。农 们其实很清 这一 ,但 次开 种新庄稼 时

,他们 中剩余 钱已 不 以 买化肥了。这就导致了所 “


困陷阱”,苦苦挣扎 农 们实在是太穷了,以至于他们无 改变 困

现 。迪弗洛和 研究伙伴发现,在粮食收获之后 农 们 中

还有现金,只要为他们提 一点 补贴—化肥 费送货上门,就 将化

肥 提 2%~10%。

艾丝特·迪弗洛 至还卷 了性 争。在管 庭财产 问题上,

作决 — 人还是 人?在发达国 ,夫 两人可以就这个问题在他


们 顾问 吵上一整天;但在 困国 ,这个问题决 了 里

小 否吃 饭。从古至今,人们一直存在一个观念,那就是 中

性 是将 康和幸福 于一个 位 , 中 性更 向
于把工资都花在喝酒 其他消遣上。往差了 ,这种观念只会让一成不

变 见更加根深蒂固;往 了 ,我们只 为这是一个 以证明

观点,因为一个 庭 财政在一 程度上受 很 因 影响。丈夫和


对 中 共同财产都有支配权,那么我们该 何将二 消费选择

进行控 并逐个分 呢?
对这个 此 杂和微 问题,迪弗洛没有选择逃避。 至还为此
进行了一个令人无比着迷 自 实 。在科特迪 , 中 性和 性

共同承 种 庄稼 工作, 且一个长久以 约 成 法是, 性

和 性各自 种不同 济作 , 性种可可、咖啡等, 性种芭蕉、


等。从研究 度,这种天 安排 是 种 不同 济

作 对 量 求恰 相反:在可可和咖啡丰收 年份里, 中 性

会 有更 可支配收 ;在芭蕉和 丰收 年份里, 中 性会


有更 可支配收 。

现在,我们只 要将刚才那个 问题提出 :在科特迪 这些

庭中, 们是希 作 丰收从 让 活变得更 ,还是希 妈


妈 作 丰收从 让自己过得更幸福?

回答是:当 性 收 提升时, 们会将 中余钱 一部分 于改善


庭 伙食,但 性通常不会这么 。所以, 同 们,这次对不住了。

2010 年,迪弗洛获得了有“小诺 尔 济 奖”之称 约 · 茨·

奖,该奖项是由 国 济协会授予 , 奖对 为在 国 任
教、40 岁以下 。在 济圈,尤其是 济 “ 人”圈中,这个奖

被看作比诺 尔 济 奖分量更重 荣 ,因为约 · 茨· 奖

两年才 发一次(但是从迪弗洛获奖 这一年起, 奖周 改为一年


一次)。无 何,约 · 茨· 奖是所有 厚镜片 人心目

中 MVP(最有价 员)。
迪弗洛所作 就是项目 估, 工作以及所有采 研究方法开展

工作,切切实实地改变了穷人 命运。从 计 度看,迪弗洛


研究启发了我们对随 控 实 看法,这一长久以 被 为只属于实

室科 研究方法,原 也可以被广泛地运 现实 活中,为人类

破 活领 因 关 。

猜猜你是谁?
2012 年 天,我 雇了一个新 。 我 里 第一天,我向 介

我们 庭 景:“我是一名教授,我 是一位老师……”

“这些我都知道了,”那位 一挥,一 松 表
道,“我 录 页搜 过 。”

我心里一阵 松,因为这代表我不 要再喋喋不休地介 了,但同时我


也有点 心,在搜 里输 我 姓名,我 活 可以“一览无

余” 什么程度?通过廉价 计算成本将 息数字化再加上与互

合,我们收集和分 海量数据 在人类历史上已 达 了空

程度。在这一 新 领 ,我们越 越 要 一些新 则。

让我们以 国知名零售商 吉特公司为 , 受一下 数据 量。

与绝 数公司一样, 吉特致 于从消费 度 虑问题,以达


润 最 化。为了 这一点,公司 请了 计专 成本书在之

篇章里介 那些 测分 工作,通过销售数据与其他消费 息
合 回答“ 买了什么商品以及为什么买这些商品” 问题。当 ,

这一切都不是坏事,因为这 味着在 附近 吉特商场里就 买


要 商品。

对于这个 ,我们还可以思 得再深 一点,看看那些 计专 们在

公司 部连窗 都没有 地下室里天天忙忙碌碌研究出哪些东西。 吉


特知道,怀孕 性是养成消费习 最 人 ,在这 间一旦与 们

建立起“零售关 ”,未 几十年里都 看 这些 亲们进出 吉特

商场 影。因此, 吉特就 要从茫茫 消费 中“ 位”出孕妇


们,尤其是怀孕3~6 个月 妈妈, 办法让 们更 常地 逛商场。

《 约时报》 一位签约作 程 随了 吉特 一个 测分 团队

了 他们是 何 位并吸引孕妇 。

第一步 常简单。 吉特向会员提 了迎 礼 记 务,怀孕 会员

可以在 出 记领取 礼品。这些 性已 是 吉特


, 且 们会主动告诉商场自己怀孕 消息。此外 计专 还发现,

其他那些与上述消费 有着相似消费 向 性可 也怀孕了。举个

,怀孕 性通常会将沐浴 换成无 味 , 们会开 买维


类 品, 买 等卫 品时会选择 包装 。 吉特公司 测

分 专 们精 细选出25 种商品,这些商品共同 成了一个“怀孕 测

得分”体 ,所有分 最终目 就是向怀孕 性发放相关商品 优


以吸引 们 买,并最终让 们成为 吉特公司 长 消费 。
这一分 效 何?《 约时报》上曾 过一篇报道,

是明尼阿波 斯市 一位 亲 一 吉特商场要求见 ,他 怒
地向 诉, 他还在上 中 最近受 了 吉特 类商品

优 “轰炸”。这位 亲 问道:“ 还在上 中, 们一天

晚给 装和摇篮 优 ,是 励 怀孕吗?”

商场 当场表示 , 至几天之后他还不忘打个 话再次道 ,但

这一次那位 亲 不仅 消了,反 还 道 。 亲 :“其实

不怨 ,最近 里出了一些事 ,我之 被蒙在 里……对了,我


产 是8 月份。”

吉特 计专 至比这位 亲更早知道 怀孕 消息。

测与 计专 们 活无关 事 就是 计专 工作。但在有 时

,这会让消费 觉得自己 隐私被 了,出于这一点 虑,一些

商 今会刻 在消费 “装 ”, 装对 一无所知,但实际上


他们已 把 看得清清 。举个 , 是一位怀孕满3 个月

妈妈, 可 会在 里 箱中发现一些摇篮和纸尿布 优 ,

此外还有一张 草 打折 、一张“ 此 买 费得一双


袜” 买 。对于 , 会觉得那几张 怀孕有关 优

与其他垃 广告一同出现在 箱里 属偶 。但事实上,商 已 知

道 既不打 也不修剪草 ,这些广告只不过是一个幌 ,为了掩


盖他们知道 怀孕 事实。
(Facebook.com)已 成为世 上最有价 公司之一,但这

公司基本上没有什么实 资产。但在 资 ( )眼里,

有一个庞 无形资产:数据。 资 之所以 资 ,并


不是因为通过这个 站平台 让他们与 时 人重新取得 ,

是因为注册 一次点击 都 在不 间泄 他们 息:住

在哪里,去哪里 ,买什么东西, 什么人以及 何打发空闲时间


等。对于 要与 重 旧 注册 ,公司对这些 息

收集和分 有可 会 他们 隐私。

产品 裁 里斯· 斯告诉《 约时报》记 :“ 息时代

就是 何 这些 息。”

得太 位了。

在公共领 ,数据与科技 合更加无孔不 。世 各地 市都在公

共场合 量安装摄 ,其中有一些摄 将在不久 将 有 部


功 。 法部门通过在 辆上配 卫星 位设 实现对 辆

,并详细记录其 过 地方。这是一个 控并 防 价廉、有效

方法,还是政府滥 科技 我们 人 自由?2012 年, 国

最 法院一致 ,除 得 特殊 ,否则 法部门不得随 在私人


辆里安装 设 。

与此同时,世 各国政府还掌握了 量 DNA数据,并以此作为破 有


工具。那么,这些DNA数据库里 息都是哪些人 ?所有被 决
,所有被捕 人(不管他们最后有没有被 有 ),还是我们中

一个人?

我们正 站在科技与个人数据 十字 口,不得不提 。 这些


数据还 以 那样 地 在政府办公 积满灰尘 地下 室里,

一切都还 ;但 今随着公 数据 数字化,在世 上任何 落 任

何人都有可 助互 看 这些 息,这就是问题 严重性所在。


计 比以往任何时 都更加重要,因为我们现在有了更 会 分

数据,并从中获取有 义 息。 计 公式并不会告诉我们怎

样 数据是合适 ,怎样 是不合适 。数 并不 代替 断。

因此,我 一组 束 书:火、小刀、汽 、 膏。

一样东西都有一个重要 功 , 一样东西都 让我们 活变得更


,但 一样东西 被滥 都会造成严重 后 。

现在请 将“ 计 ”也放 这组 中去,从今天开 , 数

据!

致谢
本书是向早 国诺顿出版公司 一部 典作品—达莱尔·哈夫 《

计数字会撒 》致敬,这本 于20 世 50 年代 通 读 已 创下了

人 百万册销量。达莱尔 创作 衷与本书一样,都是要 下 计

神秘外衣,让 众读 :不 新闻 题数据 后 含义将会对


他们造成伤 。我希 我 为哈夫先 这部 典作品锦上添花,并祈

祷在未 50 年 时间里,我 这本书也 卖出100 万册。

我要深深 诺顿出版公司,尤其是德雷 · 菲 ,让我有 会


通过 作、以一种易于 方式 向普通读 阐释一些重要 题。

在过去 十 年里,德雷 一直都是我最 友和支持 。

若没有诺顿出版公司 杰夫·舍 弗,就不会有本书 世。第一次见

杰夫 人都会觉得他心地善良,根本不适合从事“ 稿”这么残酷

辑 业。但事实上,他 确 得不得了,但也正是由于他 这

种温文尔雅 激励让我得以 成创作。就 这篇致 , 稿时间是


明天上午, 我现在竟 还 神闲地码字,这 亏了杰夫。 有

这样一位 “工 ” 督 我 工作,我 常幸运。

当 ,我最 还是书中提 那些人,是他们进行了重要 研究和

分 。我既不是 计 ,也不是研究 , 对其他人所作 有 且

义深远 工作,我 责就是当一个 。我希 我 通过这本书,


向广 读 传达一个观点:良 研究和 善 分 对于改善我们

康、 加我们 财 、提升我们 安 以及 我们 知 是 么

重要。

此外,我还要 普 斯顿 济 阿兰· 格,无 是 怖

主义 根源,还是 等教 济回报,他 研究成 都 深 浅出地

进行回答,带给我无限 启发和思 。更重要 是,阿兰也是我读研究


间 一位 计 教授,他 是 在研究、教 和公共 务三 之
间找 平衡,对此我钦 不已。

作为本书最早 一 读 ,吉 ·萨 、杰夫· 洛格、帕蒂·安德


和阿瑟·米 茨都为我提 了诸 有帮助 建议, 们将我从自我

中 放出 !盖洛普 弗兰 · 波特以及《 约时报》

·卡盖伊都是我在 计方 启蒙老师,他们不厌其烦地为
我 其中 和 计方法上 细微差 , 他们 辛勤付出,书

中 还有什么错 话,不关他们 事,都是我 问题。

蒂· 德是一位不知 研究助 。我一直觉得 “不知 ”这


个 形 蒂是再合适不过 了。本书 释 计 念

事和 都出自 蒂之 ,要没有 ,就没有这些令人捧腹

了。

从上小 时起,我就一直 着有 一日 本书。帮我实现这个

,并以此为 计 就是我 代 人蒂 · 尼特了。蒂 上 着

出版行业所有 优良品质, 不仅为 将有 义 研究成 出版成书


欣喜不已, 且还 站在作 度不遗余 地为作 争取 。

最后轮 我 人, 们在本书创作过程中对我 包 。 一章
交稿 限都被贴在 箱上,有证据表明 当交稿日 临( 错过)

时,我 暴 程度会 加31%,精 竭 程度也会提升23%。我


莉亚是我所有文字 最早、最 和最重要 辑。 亲 ,在
对人 中 所有 时,那个 明 、支持我 、 伙伴 是 。

我也 将这本书 给我 卡特里 。 以 当年我 《 裸裸


[1]
济 》 时, 还只是襁褓中 , 今 已 读 这本
书 章节并提 颇有深度 见反 了。卡特里 , 是我和莉亚

,还有 菲和C·J,很快 们这两个小 伙也 阅读本书和我

稿了。

[1] 《 裸裸 济 》一书已由中 出版社于2010 年引进出版。—— 注

本书由「ePUBw.COM」整理,ePUBw.COM 提供最新最全
的优质电子书下载!!!

You might also like