随机数学引论 PDF

随机数学引论
林元烈　、梁宗霞　编　著
清华大学出版社
内容简介
　　本书的前身是清华大学自动化系、计算机系开设“随机数学引论”课程时
所使用的讲义 , 此次出版对其做了系统的修改 .书中包括 : 随机事件与概率、
随机变量及其分布、多维随机变量及其分布、数字特征、独立随机变量序列的
极限定理、泊松信号流、随机游动与马尔可夫链、布朗运动、参数估计、假设检
验共 10 章内容 .
本书可供高等院校 (特别是信息类专业) 的学生作为教材使用 , 也可供教
师和工程技术人员参考 .
图书在版编目 ( CIP)数据
随机数学引论/ 林元烈 , 梁宗霞编著 .—北京 : 清华大学出版社 , 2003

ISBN 7－302－06346－X
Ⅰ .随… 　 Ⅱ .① 林… 　 ② 梁… 　 Ⅲ .① 随机过程　 ② 概率论　 Ⅳ .O211
中国版本图书馆 CIP 数据核字( 2003) 第 010099 号
出版者 : 清华大学出版社( 北京清华大学学研大厦 , 邮编 100084)

h tt p :/ / w ww .t up .tsinghua .edu .cn
责任编辑 : 刘　颖
印刷者 : 　　　印刷厂
发行者 : 新华书店总店北京发行所
开　　本 : 850×1168 1/ 32 印张 : 13． 125 字数 : 326 千字
版　　次 : 2003 年 3 月第 1 版 2003 年 3 月第 1 次印刷
书　　号 : ISBN 7－302－06346－X/ O・285
印数:
定价: 　　元
序　　言
随机数学涉及 4 个主要部分 : 概率论、随机过程、数理统计与

随机运筹 , 概率论是后 3 者的基础 .本书主要介绍初等概率论、统
计推断及几个典型随机过程的基本概念、理论、方法及应用 .随机
数学是研究随机现象统计规律性的一个数学分支 , 大约在 17 世纪
欧洲的数学家们就开始探索用古典概率来解决赌博提出的一些问
题 .后来 , 关于诸如人口统计 , 天文观测 , 产品检查和质量控制 , 以
及天气、水文与地震预报等社会问题和自然科学问题的研究 , 大大
促进了随机数学的发展 .在 17～19 世纪 , 经过伯努利 ( Bernou lli ) ,
拉普拉斯 ( Laplace) , 马尔可夫 ( Ma rkov ) 等著名数学家的努力 , 随
机数学有了长足的发展 , 但它严格的数学基础却是在 20 世纪 30
年代由前苏联数学家柯尔莫哥洛夫 ( K olmogorov) 发表了名著《概
率论的基本概念》( 1933 年 ) 以后建立的 .在这本著作中 , 他用近代
测度论的思想 , 总结了前人的成果 , 提出了概率论的公理化体系 ,
从而为近代概率论奠定了严密的理论基础 .此后 , 随机数学的理论
研究与广泛应用获得了飞速的发展 , 至今它的基本理论与思想已
渗透到现代科学技术、经济、管理等各个领域 .例如 :
(1 ) 概率论与随机过程论的研究为统计物理学奠定了数学基
础 , 为布朗 ( Brow n) 运动、热噪声、物理现象、信息科学、现代金融
等提供了数学模型 .
(2 ) 泊松 ( P oisson) 信号流、马尔可夫过程、时间序列、数理统
计在信息科学、生物医学、控制与预测等领域均有广泛的应用 .
(3 ) 随机运筹与数理统计已成功地应用于管理科学、通信、生
Ⅱ 　序言
产与销售、随机环境与竞争条件中的决策优化等方面 .
(4 ) 随机数学与其他数学分支有愈来愈明显的相互渗透 , 例
如随机分析在偏微分方程、复杂性计算、运筹优化中成为强有力的
前沿工具 .
(5 ) 在金融与经济领域中 , 随机微分方程与数理统计已在期
权定价、投资风险分析与优化等金融数学中扮演主角 .
总之 , 在现实中所遇到的系统与对象避免不了随机性与噪声
的干扰 , 所以研究的对象本身就需要随机模型 , 这样就必须掌握和
运用随机数学的理论与方法 .可以预期 , 在人类社会面对以信息科
学与生物科学为标志的新时代 , 以及知识更新愈来愈快、竞争环境
愈来愈激烈 ( 在某种意义下 ) 的未来 , 随机数学的理论与方法将会
更为迅速地发展与普及 , 随机数学的应用将愈来愈广泛地渗透到
人类活动的各个方面 .这样 , 我们就应该对高等学校的同学 ( 特别
是重点高等学校 ) 掌握随机数学基础提出更高的要求 .
基于上述考虑 , 本书注重以下诸点 :
(1 ) 着眼于引发兴趣 , 使读者领悟其思想、魅力与威力 .
(2 ) 揭示概念的来源及背景、模型的提炼与特性以及它们的
应用和发展的踪迹 .
(3 ) 对于随机事件的表示、转化与分解 ( 特别是用随机变量表
示的事件及分解 ) 等重要基本功予以足够的重视 .
(4 ) 突出全概率公式 ( 及其推广 ) 中所蕴含的基本思想与方
法 , 把它作为贯穿本书的主导线索之一 , 并加以阐明和应用 .
(5 ) 条件数学期望作为随机数学最基本的概念之一 , 本书力
求用初等的、便于直观确切理解的方法描述它的定义与重要性质 .
这是因为现代随机数学及其应用常常更关心的是随机变量之间的
各种关系 , 而条件数学期望是刻画不同随机变量之间各种关系的
最佳工具 .
(6 ) 着重用概率的观点与方法去讨论与领略若干最基本的 ,
序言　 Ⅲ
且至今仍有活力与潜力的随机过程的主要特征与风采 .
(7 ) 着力描述统计推断的直观依据、原理 , 品尝其独特的思维
韵味 .
(8 ) 选择几个最简单且至今仍具无穷魅力与威力的典型随机
过程 , 阐明其由来与背景 , 提炼主要特性及其应用与推广 .这些模
型既是初等概率论理论与方法的综合运用与发展 , 又是读者深入
复习、检验与巩固初等概率论的极好素材 .
请读者注意 , 对书中有些较抽象的概念 , 初学者可以先跳过这
些内容 ( 特别是目录中加“ ＊ ”的部分 ) , 这样做不会影响掌握后面
的基本内容 .
本书是在第一作者编写的讲义《随机数学引论》的基础上修改
而成的本科生教材 , 亦可作为研究生、教师、工程技术与管理人员
的参考书 .本书的编写得到清华大学数学科学系同仁 , 自动化系及
计算机科学系的教师及学生的鼓励、帮助与支持 .李敬逸、康波大、
司良省、石春华、林映侠参与本书的打印、整理与校对 .作者在此对
他们表示衷心的感谢 !
限于作者水平 , 不妥与错误难免 , 敬请指正 .
编　者
2002 .8
目　　录
序言 ……………………………………………………………… Ⅰ
第 1 章　随机事件与概率 ………………………………………… 1
1 .1 　样本空间与随机事件 ………………………………… 1
1 .2 　概率的公理化定义与性质 …………………………… 10
1 .3 　古典概型的计算 ……………………………………… 24
1 .4 　条件概率与全概率公式 ……………………………… 31
1 .5 　事件的独立性 ………………………………………… 41
练习题 ……………………………………………………… 48
第 2 章　随机变量及其分布 …………………………………… 54
2 .1 　随机变量 ……………………………………………… 54
2 .2 　离散型随机变量 ……………………………………… 60
2 .3 　连续型随机变量 ……………………………………… 66
2 .4 　随机变量的分布函数 ………………………………… 75
2 .5 　条件分布函数与条件密度函数 ……………………… 80
2 .6 　随机变量函数的分布 ………………………………… 82
练习题 ……………………………………………………… 88
第 3 章　多维随机变量及其分布 ……………………………… 93
3 .1 　离散型随机变量及其分布 …………………………… 93
3 .2 　连续型随机变量及其概率密度函数 ………………… 98
Ⅵ 　目录
3 .3 　联合分布函数 ……………………………………… 101

3 .4 　连续型随机变量的条件概率密度 ………………… 107
3 .5 　随机变量的独立性 ………………………………… 111
3 .6 　随机向量函数的分布 ……………………………… 115
3 .7 　顺序统计量的分布 ………………………………… 123
练习题 ……………………………………………………… 128
第 4 章　数字特征 ……………………………………………… 137

4 .1 　数学期望 …………………………………………… 137
4 .2 　方差 ………………………………………………… 145
4 .3 　协方差和相关系数 ………………………………… 149
4 .4 　矩、协方差矩阵及 n 维正态分布 ………………… 154
4 .5 　条件数学期望 ……………………………………… 157
4 .6 　母函数 ……………………………………………… 175
练习题 ……………………………………………………… 179
第 5 章　独立随机变量序列的极限定理 ……………………… 189

5 .1 　大数定律 …………………………………………… 189
5 .2 　特征函数 …………………………………………… 193
5 .3 　中心极限定理 ……………………………………… 198
5 .4 　随机变量序列的几种收敛性＊ …………………… 203
＊
5 .5 　强大数定律 ……………………………………… 212
练习题 ……………………………………………………… 216
第 6 章　泊松信号流 …………………………………………… 222

6 .1 　随机过程的有关概念 ……………………………… 222
6 .2 　泊松信号流的定义 ………………………………… 225
6 .3 　用相继到达的时间间隔刻画泊松流 ……………… 229
目录　 Ⅶ
6 .4 　相继到达时刻的条件分布 ………………………… 236

6 .5 　剩余寿命与年龄 …………………………………… 240
6 .6 　泊松流的若干推广 ………………………………… 241
练习题 ……………………………………………………… 245
第 7 章　随机游动与马尔可夫链 ……………………………… 251

7 .1 　简单随机游动 ……………………………………… 251
7 .2 　首达时间的分布及其数学期望 …………………… 257
7 .3 　马尔可夫链定义与例子 …………………………… 263
7 .4 　转移概率矩阵 ……………………………………… 268
7 .5 　状态的分类 ………………………………………… 270
7 .6 　极限性态与平稳分布 ……………………………… 283
7 .7 　离散时间的 P hase－Type 分布 …………………… 288
练习题 ……………………………………………………… 291
第 8 章　布朗运动 ……………………………………………… 299

8 .1 　定义和性质 ………………………………………… 299
8 .2 　首中时与最大值的分布 …………………………… 306
8 .3 　布朗运动的各种变形与推广 ……………………… 308
＊
8 .4 　布朗运动轨道的性质 …………………………… 311
练习题 ……………………………………………………… 317
第 9 章　参数估计 ……………………………………………… 321

9 .1 　数理统计的研究对象及基本概念 ………………… 321
9 .2 　点估计 : 极大似然估计与贝叶斯估计 …………… 331
9 .3 　估计的优良性准则 ………………………………… 343
9 .4 　区间估计 …………………………………………… 350
9 .5 　非参数估计 ………………………………………… 356
Ⅷ 　目录
练习题 ……………………………………………………… 357
第 10 章　假设检验 …………………………………………… 363

10 .1 　问题的提法与基本概念 …………………………… 363
10 .2 　两类错误与功效函数 ……………………………… 367
10 .3 　常用的参数检验 …………………………………… 370
10 .4 　总体分布的假设检验 ……………………………… 375
练习题 ……………………………………………………… 381
附录 1 　标准正态分布表 ……………………………………… 387

附录 2 　泊松分布表 …………………………………………… 389
附录 3 　 t 分布表 ……………………………………………… 392
附录 4 　 χ2 分布表 ……………………………………………… 394
附录 5 　 F 分布表 ……………………………………………… 398
参考书目 ………………………………………………………… 407

第1章
随机事件与概率
1 .1 　样本空间与随机事件
1 　随机现象
　　自然界中有许多现象在一定条件下必然会发生 .例如 : 同性电

荷必然互相排斥 ; 在标准大气压下 , 水加热到 100 ℃必然沸腾等 ,
这类现象称为确定性现象 .在一定条件下 , 必然出现的结果称必然
事件 , 必然事件的对立面是不可能事件 .
然而自然界中还存在大量的非确定性现象 .例如 , 观察某一商
店每天来的顾客数与销售商品的数额都不是确定的 ; 正在放射 α
粒子的放射性物质 , 每天在规定的同一时间内放射的粒子数 , 事先
无法确定 .这类现象的共同点是 : 在基本条件保持不变的情况之
下 , 时而出现这样的结果 , 时而又出现那样的结果 , 而且事先无法
断言出现的究竟是哪一种结果 , 这类现象就称为随机现象 .
2 　随机试验
直观地讲 , 观察 ( 或量测 ) 在一定条件下随机现象出现的结果 ,

即称做随机试验 ( 简称试验 ) .进行一次试验就是在特定条件实现
一次并观察其结果 .在一次试验中 , 某个结果是否出现具有一定的
偶然性 .比如说 , 我们掷一次骰子 , 就可以看成是一次试验 , 因为掷
骰子出现的点数是无法预先确定的 , 即试验的结果是偶然的、随机
的 .但许多实践早已证明 : 当进行大量的重复试验时 , 其结果就会
2 　第 1 章随机事件与概率
出现某种固有的规律性 .
例如 , 在投掷一枚质地均匀的硬币时 , 只投掷一次时 , 投掷的
结果是正面还是反面是无法确定的 , 但当大量重复投掷硬币 , 就可
以看到出现正面的次数约占总试验次数的一半 .又如某人打靶射
击 , 若射击次数不多 , 靶上的弹着点似乎是随意分布的 , 但倘若进
行大量的重复射击时 , 弹着点的分布就逐渐呈现规律性 : 大体上它
们关于靶中心对称 , 靠近靶心的弹着点密 , 偏离靶心越远弹着点越
稀少 , 且弹着点落在靶内任意指定区域的次数与射击次数 n 之比
( 频率 ) 大体上保持稳定 , 且 n 越大 , 其频率稳定性就愈加明显 , 这
种在大量重复试验中随机现象所呈现的固有规律 , 通常称之为统
计规律 .
为了研究方便 , 有时也会把具有固定结果的试验 , 看成是随机
试验的极端情形 .有时 , 又需要把几次试验作为一个整体合起来看
成一次随机试验 , 例如 : 可以把连续掷 3 次骰子看成是一次随机
试验 .
若试验具有下列共同特征 :
(1 ) 在相同的条件下 , 试验可重复进行 ;
(2 ) 试验的一切可能结果是预先可以明确的 , 但每次试验前
无法预先断言究竟会出现哪个结果 .
则称之为随机试验 , 简称试验 , 记作 E 或 E 1 , E2 等 .例如 :
E1 : 掷一枚硬币 , 观察正面或反面出现的情况 .
E2 : 记录某一个服务台在时间为 8: 00 ～ 9: 00 之间到来的顾
客数 .
E3 : 在有噪声干扰的条件下 , 测量线路某一终端电压 .
3 　样本空间
对于随机试验 E, 以 ω表示它的一个可能出现的试验结果 , 称
ω为 E 的一个样本点 .样本点的全体称为样本空间 , 用 Ω 表示 .
1 .1 样本空间与随机事件　 3
即 Ω= {ω} .
从集合论的观点看 , 样本空间 Ω是由一切可能结果所构成的
集合 , 而每个样本点 ω是集合 Ω 中的元素 .对于上面的随机试
验有 :
E1 : 掷一枚硬币一次 , 观察出现正、反面的情况 , 则 E1 的样本
空间为 Ω= {ω1 ,ω2 } , 其中 ω1 表示出现的是正面 , ω2 表示出现的是
反面 ,ω1 与 ω2 分别为 Ω的样本点 .
E2 : 服务台在时间为 8 : 00 ～ 9: 00 之间到来的顾客数 , 则
Ω= { n| n = 0 , 1 , 2 , … } .可见 Ω包含可列无穷多个样本点 .
E3 : 在有噪声干扰下 , 测量某终端电压 , 则 Ω= { x | x∈R } , 其
样本点有不可数无穷多个 .
注　在同样的试验条件下 , 由于试验的考察侧重点与目的不
同 , 可能选择不同的样本空间 , 这是初学者必须要注意的 .例如 :
E4 : 一枚硬币投掷两次观察出现正面的次数 ( 注意此时投掷
两次硬币才算完成一次实验 ) .Ω4 = { 0 , 1 , 2 } , 其中 , 0 , 1 , 2 分别表
示出现正面的次数 , 共有 3 个样本点 .
E5 : 一枚硬币投掷两次观察出现正、反面的次序 , 则 Ω5 =
{ωω,ωω′,ω′
ω,ω′
ω′} ( 其中 :ω代表出现正面 ,ω′代表出现反面 ) , 包
含 4 个样本点 .
4 　随机事件
通常 , 对于某个随机试验 , 在一次试验中可能出现也可能不出
现的事件 , 就称为随机事件 .用大写英文字母 A, B, C, A i 等来表
示 .例如 :
在实验 E1 中 , A1 = {ω1 }表示出现正面这一事件 , A2 = {ω2 } 表
示出现反面这一事件 .A1 , A2 都是事件 .
在 E2 中 , A = { n | 0≤ n≤10 }表示在时间为 8 : 00 ～9: 00 之间
出现的顾客数不超过 10 人这一事件 .
在 E5 中, A = {ωω,ω′
ω}表示掷第二次出现的是正面这一事件 .
从集合论的观点看 : 粗略地说 , 所谓随机事件就是样本空间 Ω
中人们感兴趣的某些子集 .
对于事件 A Ω, 若 Ω中的某一样本点 ω( ∈ A) 在本次实验中
出现了 , 则称该次试验中事件 A 发生 ; 若 ω｜ A , 即 ω在本次实验
中没有出现 , 则称该次试验中 A 不发生 .
从随机事件的定义可以看出随机事件包含着两个极端情形 .
其一是在任何一次试验中必然出现的事件 , 称为必然事件 .由于样
本空间 Ω在每次试验中必定出现 ( 无论哪一个 ω出现 , 均有 ω∈
Ω) , 故 Ω是必然事件 .另一种是在固定的试验条件下不能发生的
事件 , 称为不可能事件 , 用空集表示不可能事件 .
例 1 .1 　将一个红球 a, 一个白球 b, 随机地放在编号分别为
Ⅰ , Ⅱ , Ⅲ的盒子中 , 观察两个球放置的所有可能结果 , 如下图用竖
线表示盒壁 , 全部结果表示如下 :
若用记号 ωk ( 1 ≤ k≤ 9 ) 表示上面第 k 个结果 ( 样本点 ) .记 :
A = 至少有一个盒放入两球 , B = 第一盒有球 , C = 第二盒无球 ,
D = 每盒恰有一球 , E = 至少有一盒是空的 ; 则 A = {ω1 , ω2 , ω3 } ,
B = {ω1 ,ω4 ,ω5 ,ω7 ,ω8 } , C= {ω1 ,ω3 ,ω5 ,ω8 } , D = , E= Ω.
例 1 .2 　若将两个不可辨的球 ( 例如两个同样的红球 ) , 随机
地放在编号分别为Ⅰ , Ⅱ , Ⅲ的盒子中 , 观察其放置的可能结果 , 若
球用 a 表示 , 则其样本点为 :
若用 ωk ( 1≤ k≤ 6) 表示上面第 k 个样本点 , 记 : A = 至少有一

盒有 2 球 , B = 第一盒有球 , C = 第二个盒是空的 , 则相应的事件可
以表示为 :
A = {ω1 ,ω2 ,ω3 } , 　 B = {ω1 ,ω4 ,ω5 } , 　 C= {ω1 ,ω3 ,ω5 } .
再如 : 上一例中球与盒都是不可区分的 , 则上例中 ω1 ～ω3 3
个样本点不再区别 , 同样 ω4 ～ω6 3 个样本点也不再区别 .于是上
例中的 6 个样本点 , 在本例中就分为两类 , 即“ 两个球放在同一盒
中”和“ 两个球放在不同盒中”, 即本例应当有两个样本点 : ω= 两
球放在同一盒中 ,ω′= 两球放在不同盒中 .
对于给定的一个随机试验 , 如何确切而恰当地建立与表示其
样本空间 , 是建模和解决问题的重要一环 , 这一点在讨论古典概型
时务请读者注意 .
5 　事件的关系与运算
从集合论的观点看 , 事件既然是一些集合 , 就必然存在着事件

之间的关系 , 以及由若干事件来定义 ( 或表示 ) 的新事件———即事
件的一些运算及其规则 .在以下的叙述中 , 设 Ω 是给定的样本空
间 , A, B, C, Ai , Bi , …均表示为其中的事件 .
事件有如下关系 .
(1 ) 包含关系
若事件 A 发生必然导致事件 B 发生 , 则称事件 B 包含事件
A , 记作 A B( 或 B A) .由于事件 A , B 均是 Ω 的子集 , 因此从集
合论的观点看来 , 若＂ ω∈ A 有 ω∈ B, 则 A B.
(2 ) 等价关系
如果 A B且 B A, 则称 A 与 B 等价 , 或称 A 等于 B , 记作
A = B .即＂ ω∈ A , 必有 ω∈ B, 而且＂ ω∈ B, 必有 ω∈ A . A = B 表
示 A 与 B 是同一事件 .在概率论中 , 对同一事件给出不同的等价
表示形式是一种重要的技巧 .
(3 ) 事件的交
定义 A∩ B 为事件 A , B 同时发生 , 称 A∩ B 为 A 与 B 的交 ,
简记作 A B .即 A∩ B = {ω| ω∈ A 且 ω∈ B} .
n
推广到 n 个事件 : 定义 k∩ A k 为事件 A 1 , A2 , … , An 同时发生 ,
= 1
n
称 k∩ A k 为事件 A 1 , A2 , … , A n 的交 , 即
=1
n
∩ A k = {ω| ω∈ Ak , 1 ≤ k ≤ n} .
k=1
∞ ∞
记 k∩ A k 为事件 A 1 , … , Ak , …同时发生 , 称 k∩ Ak 为 A 1 , … , Ak , …
=1 =1
∞
的可列交 , 即 k∩ Ak = {ω| ω∈ Ak , k≥1 } .

= 1
(4 ) 互不相容
A , B Ω, 如果 A, B 不可能同时出现 , 即 A B = , 则称两事
件互不相容 ( 或称互斥、互不相交 ) .
(5 ) 事件的并
定义 A∪ B 为事件 A , B 中至少有一事件发生 , 称 A∪ B 为 A
与 B 的并 .即 A∪ B = {ω| ω∈ A 或 ω∈ B} .
n
推广到 n 个事件 : 记∪ Ak 为事件 A k ( k = 1 , … , n) 至少有一个

k= 1
n
事件发生 , 则称 k∪ Ak 为事件 A1 , A2 , … , An 的并 , 因此
= 1
n
∪ A k = {ω| ω∈ A1 , 或 ω∈ A2 , … , 或 ω∈ An } .
k=1
∞
　　同样 , 定义 k∪ Ak 为事件 A1 , A2 , … , An , … 至少有一个发生 ,

= 1
∞
称 k∪ A k 为 A 1 , A2 , … , A n , …的并 .
=1
若 A, B 互不相容时 , 记 A∪ B = A + B, 称为 A 与 B 的和 .若
A1 , … , Ak , … 互不相容 , 则记
n ∞
n d ef ∞ de f
∪ Ak
k= 1 ∑A
k=1
k , ∪ Ak
k= 1 ∑A
k= 1
k .
　　 (6 ) 对立事件
定义 A 为 A 不发生的事件 , 称事件 A 为事件 A 的逆 , 或称 A
为 A 的对立事件 .即 A = {ω| ω∈Ω, 但 ω｜ A} .若记 B = A , 则
A ∪ B = Ω,
B = A
AB = .
　　 (7 ) 事件的差
“ 事件 A 发生 , 但事件 B 不发生”也是一个事件 , 记为 A \ B, 称
A \ B 为事件 A 与 B 的差 .即 A \ B = {ω| ω∈ A 且 ω｜ B} . 若 B
de f
A , 记 A\ B A- B.
事件的运算规则如下 .
① 交换律 : A∪ B = B∪ A, A B = B A;
② 结合律 : A∪ ( B∪ C) = ( A∪ B) ∪ C, A( BC) = ( A B) C;
③ 分配律 : A( B∪ C) = A B∪ AC, ( A∪ B) C = ( A C) ∪ ( BC) ,
A( B\ C) = ( A B) \ ( BC) ;
④ 德・摩根 ( De Morgan ) 定律 : A∪ B = A ∩ B, A∩ B =
A∪ B .
以上公式可以推广到有限个事件及可列个事件 :
∞ ∞ ∞ ∞
A k∪ Bk = k∪ ( ABk ) , 　 A ∪ ∩ Bk = k∩ ( A ∪ Bk ) ,
=1 = 1 k= 1 =1
∞ ∞ ∞ ∞
∪ Ak = k∩ Ak , 　 ∩ Ak = k∪ Ak .
k= 1 = 1 k= 1 = 1
　　我们只证明分配律和德・摩根定律 , 其余留给读者作为练习 .
分配律 : A( B∪ C) = A B∪ AC
证明 ω∈ A( B∪ C) ω∈ A 且 ω∈ ( B∪ C) ,
　
　而 ω∈ ( B∪ C) ω∈ B 或 ω∈ C,
从而得
ω∈ A( B ∪ C) ω∈ A 且 ω∈ B 或 ω∈ C,
即 ω∈ A B 或 ω∈ AC ω∈ A B∪ AC, 故 A( B∪ C) = A B∪ AC .
德・摩根定律 : A∪ B = A∩ B
证明　对于 ω∈ A∪ B ω｜ A∪ B ω｜ A 且 ω｜ B ω∈ A,
且 ω∈ B ω∈ A∩ B, 故 A∪ B = A∩ B .
6 　事件序列
设 Ak Ω( k = 1 , 2 , … ) , 称 { Ak , k≥1 } 为事件序列 .若＂ n =
d ef ∞
1 , 2 , … , An An + 1 , 则称之为单调增序列 , 定义 n→
lim An ∪ An ,
∞ n= 1
称li m An 为{ An , n≥1 }的极限 .若＂ n = 1 , 2 , … , An An + 1 , 则称之

n→ ∞
d ef ∞
为单调减序列 , 定义 lim An ∩ An , 称 lim An 为 { An , n≥ 1 } 的极

n→ ∞ n=1 n→ ∞
限 .单调增 ( 事件 ) 序列和单调减 ( 事件 ) 序列统称为单调事件序列 .

∞ ∞
对于一般事件序列{ An , n≥1 } , 令 Bn = k∪ A k , Cn = k∩ Ak , 显
= n = n
然 Bn Bn + 1 , Cn Cn + 1 , 因此 { Bn , n≥1 }和{ Cn , n≥1} 有极限 .

de f ∞ ∞
令li m An lim sup An = k∩ ∪ A n 称之为 { An , n≥ 1 } 的上极

n→ ∞ n =1n= k
限 , 它由属于无穷多个 An 的样本点构成 .
d ef ∞ ∞
令li m An lim inf A n = k∪ ∩ A n , 称之为 { An , n≥ 1 } 的下极

n→ ∞ n =1n= k
限 , 它由自某个 m 后属于所有 A n ( n≥ m) 的样本点构成 , 易证恒有

li m An lim An .
n→ ∞ n→ ∞
当li m An = lim An 时 , 称lim An = n→

lim An 为{ An , n≥ 1}的极限 .
n→ ∞ n→ ∞ n→ ∞ ∞
例 1 .3 　设事件 A , B Ω, 令 A2 n + 1 = A , A2 n = B ( n≥1 ) , 则
∞ ∞ ∞ ∞
li m An = k∩ ∪ A n = A∪ B, lim An = k∪ ∩ A n = AB .
n→ ∞ = 1 n= k n→ ∞
= 1n= k
7 　事件的示性函数
对于 A Ω, 考虑定义在样本空间 Ω上的实函数 :
1, 当 ω∈ A 即 A 发生 ,
I A (ω) = ( 1 .1)
0, 当 ω｜ A 即 A 发生 ,
d ef
称 IA I A (ω) 为事件 A 的示性函数 .
引入事件的示性函数 , 可使事件的表示、事件的关系与运算 ,
转化为数量的表示、数量的关系与运算 .它是最简单的概念与记
号 , 但它却扮演重要角色 , 尤其在现代概率论中发挥巨大的基础作
用 .容易验证 :
def
{ IA = 1} {ω| I A (ω) = 1 } = A ,
de f
{ IA = 0 } {ω | I A (ω) = 0} = A;
并且容易得到以下关系 : ＂ ω∈Ω 有
(1 ) A B I A (ω) ≤ I B (ω) ; 　 A = B I A (ω) = I B (ω) ;
(2 ) I A∪ B (ω) = I A (ω) + I B (ω) - I A B (ω) ;
I A+ B (ω) = I A (ω) + I B (ω) ;
　　 (3 ) I A B (ω) = I A (ω) I B (ω) ;
(4 ) I A (ω) + I A (ω) = 1;
(5 ) 若 B A , 则 I A - B (ω) = I A (ω) - I B (ω) ;
n
(6 ) 若记 : a∨ b = m ax ( a, b) , a∧ b = min ( a, b) , k∨ ak =
= 1
n
max { ak } , k∧ ak = 1 ≤mik≤nn { ak } , 则
1≤ k≤ n = 1
I A∪ B (ω) = I A ( ω) ∨ I B ( ω) , I A B ( ω) = I A ( ω) ∧ I B ( ω) ,
n
n
n
(ω) = k∨ ∑I ( ω) =
n
I ∪ A
k
I A k (ω) , I ∑ A k (ω) = A
k
(ω) , I ∩n A
k
k= 1 = 1 k= 1 k= 1
k= 1
n
∧ I A k (ω) .
k=1
例 1 .4 　将 n 只球 (1～ n) 随机地放进 n 只盒子 ( 1 ～ n) 中去 ,
一只盒子装一只球 , 若一只球装入与球同号的盒子中 , 称为一个配
对 , 记 X 为总的配对数 , X 如何表示呢 ?
我们自然而然地会想到示性函数 , 令 Ai 表示第 i 个球和盒子
配对 , I A i ( ω) 为事件 A i 的示性函数 , 则 X ( ω) 可表为
n
X(ω) = ∑I
i= 1
A
i
(ω) .
1 .2 　概率的公理化定义与性质
对于随机试验 , 人们不仅仅关心实验出现的可能结果 , 更关心

各种结果出现的可能性究竟有多大 .例如 : 大批量产品 , 随机抽取
3 个检验 , 发现次品的可能性有多大 ? 一部设备运行时出现故障
的可能性有多大 ? 甲、乙两队正在进行激烈角逐 , 甲队获胜的可能
性有多大 ?
既然事件在每次试验中出现的可能性有大有小 , 因此就可用
一个数字来表示事件发生的可能性 , 这个数字就称为该事件的概
率 .这就是事件概率的直观意义 .然而 , 对概率的确切描述却经过
了一个漫长的历程 , 直至 1933 年才由前苏联著名数学家柯尔莫哥
洛夫给出概率的公理化定义 , 从而使概率论这门学科有了一个严
格的理论基础 , 并在现代科学技术的推动和刺激下得以迅猛的
发展 .
为了能迅速而正确地理解和掌握事件的概率这一基本概念 ,
我们先从概率的直观背景入手 , 而后再讨论一些特殊的随机模型 ,
最后给出一般情形下的公理化定义 .
1 　古典概型
定义 2 .1 　若随机试验 E 及其样本空间 Ω 有下列两个特性 :

1 .2 概率的公理化定义与性质　 11
(1 ) 样本空间 Ω= {ω1 ,ω2 , … ,ωn }只有有限个样本点 ;

(2 ) 试验中每个样本点出现的可能性相同 ( 等可能性 ) .
则称定义在该样本空间 Ω上的概率模型为古典概型 .
这类随机现象由于具有直观、简单的特点 , 所以在概率论发展
的初期是人们研究的主要对象 .先讨论它有助于理解概率论的许
多基本概念 , 同时古典概型本身也仍然有着重要的应用背景 .
定义 2 .2 　设随机试验 E 为古典概型 , 其样本空间为 Ω =
{ω1 ,ω2 , … ,ωn } ; 对于任一事件 A, 其概率定义为
A 中包含的样本点数
P( A) = . ( 2 .1)
Ω 中包含的样本点数
　　若记 μ( A) = {事件 A 中包含的样本点数} , 则
P( A) = μ( A)/ μ( Ω) .
　　由定义 , P( A) 具有以下性质 :
(1 ) 非负性 : ＂ A Ω, P( A) ≥ 0;
(2 ) 规一性 : P(Ω) = 1;
m m
(3 ) 设事件 A1 , … , Am 互不相容 , 则 P ∑A
i= 1
i = ∑ P( A ) ;
i =1
i
　　 (4 ) 对于每一样本点 ωi ( 1≤ i≤ n) , 有
P( {ω1 } ) = P( {ω2 } ) = … = P( {ωn } ) = 1/ n .
　　证明　只证明 (4 ) , 其余的留作练习 .
设事件 A i = {ωi } ( 1 ≤ i≤ n) , 则由定义知 : P( A i ) = 1/ n, 所以
P( {ω1 } ) = P( {ω2 } ) = … = P( {ωn } ) = 1/ n .事实上“
, 每一个样本
点出现等可能”与 ( 2 .1) 式等价 , 即事件 A 的概率 P ( A) 仅与 A 中
所含的样本点数有关 , 而与它具体含有的是哪些样本点无关 .
例 2 .1 　 E1 : 掷一枚硬币一次 , 观察出现正、反面的情况 .只有
两个样本点 , 即 n = 2; 又由于硬币的均匀对称性 , 因此两个样本点
ω( 出现正面 ) 、
ω′( 出现反面 ) 是等可能的 , 故 E1 是古典概型 , 于是
P( {ω} ) = P( {ω′} ) = 1/ n = 1/ 2 .
例 2 .2 　 E2 : 掷一颗骰子观察出现的点数 , 有 6 个样本点 ( n =
6) .假定骰子是均匀对称的 , 则可认为每个样本点 ωi ( 1 ≤ i≤ 6 ) 出
现的可能性相同 , 从而 E2 为古典概型 , 则 P ( {ωi } ) = 1/ n = 1/ 6
(1 ≤ i≤6 ) .若事件 A 表示出现偶数点 , 事件 B 表示出现点数至少
为 3 , 则 A = {ω2 ,ω4 ,ω6 } , 即 μ( A) = 3 , 所以 P( A) = μ( A)/ μ( Ω) =
3/ 6 = 1/ 2 ; B = {ω3 ,ω4 ,ω5 ,ω6 } , 即 μ( B) = 4 , 所以
P( B) = μ( B)/ μ( Ω) = 4/ 6 = 2/ 3 .
　　例 2 .3 　袋中有 10 个球 , 6 个白球 , 4 个红球 .假设每个球被
取出是等可能的 , 现随机地取出 3 个 , 试求取出 k ( 0≤ k≤ 3 ) 个红
球的概率 .
解　将球编号 , 记 6 个白球依次为 1 ～ 6 , 4 个红球为 7 ～10 .
假设每球被取出的机会等可能 , 这等价于从 10 个号码中任取 3
个 , 不计次序的每一种取法是等可能的 .因而若每次随机地取出 3
个 , 只观察其号码 , 不计其次序 , 则一个样本点等价于从 10 个号码
中取其 3 , 不计次序的一种组合 , 故样本点数 μ( Ω) = C310 .记 Ak =
{取 3 个 , 取出 k 个红球} ( 0≤ k≤3) .显然 , A k 发生 , 当且仅当 3 个
球中 , 需从 7～ 10 号中取出 k( 0 ≤ k≤ 3 ) 个 , 且从 1 ～ 6 号中取出
(3 - k ) 个 .由乘法原理有 : μ( A k ) = C4k C36 - k ( 0 ≤ k ≤ 3 ) , 于是得
P( Ak ) = C4k C36 - k / C31 0 .
注意　 (1 ) 在解上题中 , 将球编号 , 目的是为了使我们建立的
样本空间中的每一个样本点出现的机会是等可能的 .倘若此题对
球不加编号 , 那么在题设的条件下 , 随机取出 3 个 , 仅观察取到红
球的个数 .此时如果相应建立的 ( 即解题者脑子中设想的 ) 样本空
间为 Ω= { A0 , A1 , A2 , A3 } , 其中 Ai 表示取出 i 个红球 .显然上述
样本空间的每个样本点 A0 , A1 , A2 , A3 不是等可能的 .这时 , 如硬
要套用古典概型的定义来求解就会发生错误 .
(2 ) 对于“ 等可能”的确切含义 , 要依据具体的题设条件给予
确切的理解与描述 .这是能否正确解决古典概型问题的关键之一 ,
务必请初学者倍加注意 .
例 2 .4 　 n 个人抽签分配 n 张彩票 , 设 n 张彩票中有 m 张有
奖彩票 (1 ≤ m < n) .假设每人抽到每一张彩票的机会是等可能的 .
试求第 k 个人 (1 ≤ k≤ n) 抽到有奖彩票的概率 .问第 1 个人抽到
有奖彩票和第 n 个人抽到有奖彩票的概率是否相等 .
解　记 Ak = 第 k 个人抽到有奖彩票 (1≤ k≤ n) .为求 P( A k ) ,
设想将彩票编号 1 ～ n, 试验只观察第 k 个人抽彩票的结果 .建立
样本空间如下 : Ω中的一个样本点对应于从 1 ～ n 张彩票中取出
一张 .显然 ,μ(Ω) = n,μ( Ak ) = m, 故 P( Ak ) = m/ n ( 1 ≤ k≤ n) .由
上知 , P( Ak ) = m/ n 与 k 无关 , 得 P( A1 ) = … = P( An ) = m/ n .
以上结果表明 , 抽到有奖彩票的概率与抽签次序无关 , 这正是
人们直观上感到抽签分配是“公平的”的理论解释 .
2 　几何概型
对于属于古典概型的随机事件 , 我们利用等可能性在有限样

本空间上定义了任一事件 A 的概率 .但是由于有“有限个等可能
样本点”这一条件的限制 , 在涉及有“无限多个可能的样本点”的随
机实验时 , 古典概型就不再适用 .然而具有无限多个等可能的样本
点的随机实验在现实中是随处可见的 .
比如我们要乘坐一班长途客车 , 客车站每半小时发一趟车 , 即
12 :00～12: 30 之间任何一刻到达的可能性都是相等的 , 就是说这
个随机试验具有无穷多个等可能的结果 , 它已不再属于古典概型 .
对于每个单个实验结果的出现 , 比如说 , 客车恰在 12: 15 到来的可
能性只能说是 0 .但客车在 12: 00 ～12: 15 到达的概率是多大呢 ?
为了求这些问题的解 , 我们把 12: 00～ 12: 30 看作数轴上的一段区
间 , 而 12: 00～ 12: 15 就成为这个区间的一个子区间 , 在这种情况
下等可能性就表现为 : 所取的点落在区间内的可能性仅与该区间
长度有关 , 而与区间的形状与位置无关 .简而言之 , 我们把古典概

型的样本空间由有限多个样本点的情形推广到样本空间有无限多
个样本点的情况 , 而每一样本点仍保持着某种等可能性 , 此时得到
了另一种随机试验的数学模型 .这就是所谓的几何概型 , 先看几个
简单的例子 .
例 2 .5 　在一维直线的 [ 0 , 10] 区域上投掷一质点 , 质点随机
地落入其中 , 且落在 [0 , 10 ] 上每一点的可能性相同 , 求质点落在
[3 , 5 ]区域上的概率 .
解　由题意 , 所有样本点充斥的区间为 [ 0 , 10 ] , 所以 Ω= [ 0 ,
10 ] , 令 A = {点落在[ 3 , 5 ] } , 因此事件 A 的概率 P ( A) 自然定义
为“[ 3 , 5] 区间的长度”与“ [0 , 10] 区间的长度”的比值 , 即
μ( A) A 中包含的线段长度
P( A) = = , ( 2 .2)
μ(Ω) Ω 中包含的线段长度
则 P( A) = (5 - 3)/ ( 10 - 0) = 1/ 5 .
易知 , 事件 A 的概率仅与 A 的长度有关 , 而与 A 的形状和位
置无关 , 这与质点随机地落在[ 0 , 10 ]上每一点等可能是等价的 .
但由实变函数论可知 , 上述 P ( A) 的定义 ( 2 .2 ) 是不严格的 ,
因为在直线上还存在着不能定义“长度”的点集 , 即存在着不可测
的点集 , 因此式 (2 .2) 只对长度可测的集合 A 才有意义 .所谓可测
集 , 直观地说就是可以定义“ 长度”的点集 , 这样就把所关心的事件
严格地限制在 Ω中所有可测的子集上 .
2 2
例 2 .6 　在一个 60000km 的海域里 , 有表面积约达 2000 km
的大陆架贮藏着石油 .假设在这片海域里随机地选定一点钻探 , 问
能找出有油的概率有多大 ?
解　假设在海域中的每点的钻探是等可能的 , Ω= {钻探的可
能区域} , 事件 A = {钻到有油的区域} , 则由等可能性应有定义 :
μ( A) A 的面积
P( A) = = , ( 2 .3)
μ(Ω) Ω 的面积
所以 P( A) = 2000/ 60000 = 1/ 30 .
此时 , 等可能性等价于 P( A ) 只与 A 的面积有关 , 而与 A 的
形状和位置无关 .
2
这里的概率 P( A) 也只对 R 上能定义面积的点集 ( 可测集 )
才有意义 , 因此我们所考虑的事件必须限制在二维可测集上才有
意义 .
以下对在一维点集上定义的长度 , 在二维点集上定义的面积 ,
在三维点集上定义的体积 , n 维点集上定义的超体积等通称为集
合的测度 .因为它们有共同点 : 是集合的函数 , 且取值非负 , 具有可
加性 .直观粗略地说 , 在一定的度量“ 标尺”下 , 能够“ 度量”与定义
测度的点集 , 称为可测集 .
定义 2 .3 　设随机试验 E 的样本空间 Ω R n 是 R n 中的可测
子集 , 具有有限的测度 μ( Ω) > 0( 记号 μ( Ω) 表示集合 Ω 的测度 ) ,
记 F 为 Ω中的可测子集全体 .若＂ A∈F, 定义
P( A) = μ( A) . ( 2 .4)
μ( Ω)
规定 ∈F, 且 μ( ) = 0 .称 A 为事件 , P( A) 为事件 A 的概率 .称
(Ω, F , P) 为几何概型 .
显然 , 由于 A 的测度 μ( A) 是集合的函数 , 且取值非负 , 具有
可加性 .故由 ( 2 .4) 式定义的概率亦是集合的函数 , 且满足 : ① 非
负性 ; ②规一性 ; ③可加性 .同样 , 由 (2 .4 ) 式定义的概率 P( A) 蕴
含着 Ω中各点的等可能性 .
与前面例子类似 , 这里概率 P( A) 只对可测集 A 才有定义 , 因
此我们所考虑的事件必须限制在 Ω中的可测子集 , 而不是 Ω的所
有子集 , 原因在于有不可测的子集存在 .几何概型在现实生活中有
着典型而广泛的应用 , 下面再举一个例子 .
例 2 .7( 布丰 (Buffon) 问题 ) 　平面中画着等距离的一些平行
线 , 线与线之间的距离为 a( a > 0 ) .向平面随机地投一长度为
l( l < a) 的针 , 试求这针与任一直线相交的概率 .
解　以 x 表示针的中点与最近一平行线的距离 , φ表示针与
平行线之间的夹角 .易知 : Ω = ( x,φ) | 0 ≤ x≤ a/ 2 , 0≤φ≤π 在
x ,φ平面上是一矩形 .设事件 A = { 针与平行线相交 } , 则事件 A
l
发生的充要条件是 : x≤ sinφ, 即
2
A = ( x ,φ) | x ≤ l sinφ, 0 ≤ x ≤ a/ 2 , 0 ≤ φ≤ π ,
2
对应于图 1 －1 中阴影面积 .
图　 1－1
这样我们的模型等价于向 Ω中等可能地投点的几何模型 , 求点落

在区域 A 中的概率 , 因此由 ( 2 .4) 式有
π
l
P( A) = μ( A) =
∫ 0 2
sinφdφ
= 2l . ( 2 .5)
μ( Ω) a aπ
π
2
3 　频率与概率的统计背景
定义 2 .4 　设 E 为一随机试验 , A 为一事件 , 在相同的条件
下 , 把 E 独立地重复做 n 次 , 以 μn ( A) 表示 A 在这 n 次试验中出
现的次数 , 称 f n = μn ( A) / n 为事件 A 在这 n 次试验中出现的频
率 , 而 μn ( A) 称为频数 .
例 2． 8 　历史上对于投掷一枚均匀硬币的实验有如下记录 :
试验者 n μn fn
De morgan( 德・摩根 ) 2048 1061 0 .5181
Buffon( 布丰 ) 4040 2048 0 .5069
Pearson(皮尔逊 ) 12000 6019 0 .5016
Pearson(皮尔逊 ) 24000 12012 0 .5005
　　其中 n 为实验次数 , μn 代表出现正面的次数 , f n = μn/ n, 从上
述实验记录可以看出 , 随着 n 的逐渐增大 , 出现正面的频率 f n 就
越来越趋近于 1/ 2 .
例 2 .9 　在对同一批产品进行质量抽验时 , 每次随机地抽取
一件 , 其结果可能是合格品 , 也可能是次品 , 而且抽到合格品的可
能性的大小是无法预知的 .下面是某次抽验结果记录 :
抽取件数 n 10 60 150 600 900 1200 1800
合格件数 μn ( A ) 7 53 131 548 820 1091 1631
合格频率 f n ( A ) 0 .7 0 .883 0 .8730 0 .913 0 .911 0 .909 0 .906
随着每次抽取件数的增多 , 抽到是合格品的频率 ( 即合格品件数与

抽取产品个数之比 ) , 总是越来越接近于某一确定值 , 即抽到合格
品的频率呈现出一定的稳定性 .上述记录表明 , 当抽取件数增多
时 , 抽到合格品的频率稳定在 0 .9 附近 .
例 2 .10 　某国统计每年出生的男婴与女婴的资料表明 , 生男
孩的频率大约在 0 .517 左右徘徊 , 生女孩的频率约在 0 .483 附近
起伏 .
以上试验说明 : 当 n 很大时 , f n ( A) 总是在某一实数 P( A) 上
下波动 , 而且随着 n 的增大 , f n ( A) 变化的总趋势是波动越来越
小 , 且越来越趋近于 P( A) .许多实践也同样证明以上事实 .而且 ,
理论也早已证明 : 在相当广泛的条件下 , 当 n→ ∞时 , 频率 f n ( A)
在一定意义下趋于常数 P ( A ) ( 详见第 5 章大数定律 ) , 因此称
P( A) 为事件 A 的概率 .当 n 充分大时 , 可以用频率 f n ( A) 作为
P( A) 的近似值 .频率的概念直观简单 , 容易掌握 .因此可以根据频
率的基本性质加以提炼与概括 , 作为定义事件概率的依据和直观
背景 .
从频率的定义可知事件 A 的频率 f n ( A) 是集函数 , 具有下述
性质 :0 ≤ f n ( A) ≤ 1 , f n (Ω) = 1; 对于任意有限多个互不相容事件
m
m
A1 , A2 , … , Am ( 即 Ai A j = , ＂ i ≠ j ) 有 fn k∪
= 1
Ak = ∑f
k=1
n ( Ak ) ,
即具有可加性 .
例 2 .11 　如果对例 2 .7 中的投针试验重复进行 n 次 , 事件 A
发生 ( 即投针与平行线相交 ) 的次数为 μn ( A) .当 n 很大时 , 其频率
f n ( A) = μn ( A)/ n 近似等于概率 P ( A) , 因此 , 若以 f n ( A) 作为
P( A) 的近似值代入 (2 .5 ) 式 , 则得到π的近似值 :
2 nl
π≈ ,
aμn ( A)
用随机试验的方法确定圆周率π, 这真是奇妙的方法 !
4 　概率的公理化定义
在概率论发展早期 , 所研究的随机现象比较简单 , 大部分可以

归入古典概型 .对于这种模型 , 概率的计算可以通过某种可能性的
假设进行 , 其结果也有相当明确的解释 .这种成功使得人们试图用
某种等可能性来定义概率 , 于是 , 由拉普拉斯给出的概率的古典定
义在整个 19 世纪为人们所广泛接受 .但是 , 这种定义的局限性很
大 , 它既要求实验的可能结果总数有限 , 又要求具有某种等可能
性 , 所以它的适用范围有限 .对一般的随机现象明确的定义概率和
其他基本概念 , 成为一个突出的问题 .通过对事件与概率这两个基
本概念的长期研究 , 人们发现事件的运算与集合的运算非常相似 ,
概率与测度都是集函数 , 且有共同的基本性质 : 满足非负性与完全
可加性 .这一事实随着当时在实变函数论中关于勒贝格
( Lebes gue) 测度和积分的研究以及一般抽象测度和积分理论的发
展而日益清晰起来 .直到 1933 年 , 前苏联数学家柯尔莫哥洛夫综
合了前人结果 , 提出了概率论公理化结构 , 从而给出事件与概率的
严格定义 , 推动了概率论的迅速发展 .
下面就来叙述概率论中的公理化结构 .
(1 ) 集类
设 Ω为一个抽象空间 , 即一个非空集合 , 它的元素称为点 , 一
般用 ω表示 , 由 Ω中的某些点构成的集合用 A , B, A1 , A2 等大写
字母表示 , 它们都是 Ω的子集 .
ω∈ A 表示 ω为 A 的一个元素 , 称作 ω属于 A .空集也是 Ω
的一个子集 .由 Ω中子集构成的集合称为集类 , 我们将用花写字
母 A, B,C 等来表示 .例 A = { , Ω} , 集类 A 中的元素是空集和
全集 Ω .A1 Ω, A2 Ω, A1 ≠ A2 , A = { A1 , A2 , } ,集类 A 由 3 个
元素构成 .
我们用 2Ω 表示由 Ω 的所有子集全体构成的集类 .
(2 ) 概率空间三要素
① 样本空间 Ω;
② σ－代数 F: 设 F 是 Ω的某些子集构成的非空集类 , 若满足
以下条件 :
( i ) 若 A∈F, 则 A∈F; ( 2 .6)
∞
( ii ) 若对＂ k≥ 1 , Bk ∈F, 则 k∪ Bk ∈F . ( 2 .7)
=1
则称 F 为 σ－代数 , 称 (Ω, F ) 为可测空间 .

③ 概率 P: P 是一个定义在 F 上的集函数 , 且它满足 :
( i ) P( A) ≥0 , 对＂ A∈F , 此即非负性 ;
( ii ) P(Ω) = 1 , 此即规一性 ;
( iii ) 若 A i ∈F ( i = 1 , 2 , … ) , 且 Ai A j = ( i≠ j) , 则
∞ ∞
P ∑A
i= 1
i = ∑ P( A )
i=1
i . ( 2 .8)
此即可列可加性 , 也称完全可加性 .
则称 P 为可测空间 ( Ω, F ) 上的一个概率测度 ( 简称为概率 ) ,
称 ( Ω, F, P) 为概率空间 , 称 F 为事件域 .若 A∈F, 称 A 为事件 , 称
P( A) 为事件 A 的概率 .
注　 Ω中的一集合 A 是否是事件 , 取决于 A 是否属于 F .在
定义 σ－域 F 时 , 一般并没有要求 Ω的全体子集都属于 F, 因而不
是任何子集都一定是事件 .但当 Ω是有限或可列集时 , 如无特别
指出 , 总是把 Ω的全体子集 2Ω = { A , A Ω}作为 F .
(3 ) σ－代数 ( 也称 σ－域 )
下面举几个 σ－代数的例子 .
例 2 .12 　 F1 = { , Ω} , 这是 Ω上最小的 σ－代数 .F2 = { A |
A Ω}是由 Ω 的全体子集构成的 , 这是 Ω上最大的σ－代数 .F3 =
{ , A , A, Ω} , 其中 A 是 Ω 的一个真子集 .
命题 2 .1 　若 F 为 σ－代数 , 则 :
① ∈F, Ω∈F;
∞ ∞ ∞ d ef
② 若 An ∈F, n≥ 1 , 则 n∩ An ∈F, n∩ ∪ Ak lim An ∈F;
= 1 = 1 k= n n→ ∞
③ 若 A , B∈F, 则 A - B∈F .
证明　留给读者作为练习 .
从定义及性质表明 , σ－代数对可列次并、交、差等所有运算是
封闭的 , 这是 σ－代数作为现代随机数学中基本概念和基本框架的
主要原因之一 .
可以证明 , 对于任意的一个集类 C, 一定存在包含 C 的最小
σ－域 .
定义 2 .5 　若 F 是包含 C 的最小 σ－域 , 其中 C 2Ω , 称 F 是由

C 生成的 σ－域 , 记 F =σ(C) .
例 2 .13 　 C1 = { A, Ω} , C2 = { A, B} ,σ( C1 ) = { , A , A, Ω} ,
σ( C2 ) = { A, A, B, B, , Ω, A∪ B, A B, A B , A B, A B , A \ B , …} .
例 2 .14 　设 A1 = { [ a, b) , a, b∈ R , a≤ b} ; A2 = { ( a, b] , a,
b∈ R , a≤ b} ; A3 = { [ a, b] , a, b∈ R , a≤ b} ; A4 = { ( a, b) , a, b∈
R , a≤ b} ; A5 = { ( r1 , r2 ) , r1 , r2 为有理数 } ; A6 = { G: G 为 R 中开
集} ; 以上集类生成相同的 σ－代数 , 即 σ( A1 ) = σ( A k ) ( 1 ≤ k≤ 6)
1
( 证明留作练习 ) .记 B = B = σ( A1 ) , 称 B 为一维博雷尔 ( Bor el )σ－
域 .B 中的集称为一维博雷尔 ( 可测 ) 集 .
直观地说 , B = σ( A1 ) 中包含一切开区间 , 闭区间 , 半开半闭
区间 , 半闭半开区间 , 单个实数 , 以及由它们经可列次交、并、差运
算而得出的集合 .
注　若样本空间 Ω 为有限集或可列集 , 如无特别声明 , 通常
取 F 为 Ω所有子集构成的集类 .
(4 ) 概率的性质
从概率的公理化定义 , 可以推出概率的如下性质 :
① P( ) =0 .
∞
证明　显然有 = ∪ ∪… , P( )= ∑
i= 1
P( ) , 由概率
非负性即得 .
② P( A) = 1 - P( A) . ( 2 .9)
请读者自己证明 .
③ 有限可加性 , 即若 A1 , A2 , … , An ∈F, 且 Ai A j = ( i≠ j) ,
则
n
n
P k∪
=1
Ak = ∑ P( A
k= 1
k ) . (2 .1 0)
　　证明　由 P( ) = 0 及完全可加性可得 .
④ ＂ A , B∈F , 则
P( A\ B) = P( A) - P( AB ) . (2 .1 1)
　　若 B A, 则
P( A - B) = P( A) - P( B) . ( 2 .11a)
　　证明　由 A = A B + ( A \ B) , 有 P( A) = P( A B) + P( A \ B) , 从
而得 (2 .1 1) 式 .当 B A 时 , 有 B = A B, 由 ( 2 .11 ) 式得 ( 2 .11a ) 式 .
⑤ P( A∪ B) = P( A) + P( B) - P( A B) . (2 .1 2)
证明　由 A∪ B = A + ( B\ A) , 有
P( A ∪ B) = P( A) + P( B \ A) ,
再利用 (2 .1 1) 式得 (2 .1 2) 式 .
⑥ 若 A B, 则 P( A) ≤ P( B) .
证明　由 A B, B = A + ( B - A) , 得
P( B) = P( A) + P( B - A) ≥ P( A) .
　　 ⑦ 若尔当 ( Jordan ) 公式＂ Ak ∈F (1 ≤ k≤ n, n≥2 ) ,
n n
P k∪ Ak = ∑ P( Ak ) - ∑ P ( Ai A j ) +
=1
k= 1 1 ≤ i< j≤ n
∑
1 ≤ i< j < k≤ n
P ( Ai A j A k ) + … +
n- 1
( - 1) P( A1 A2 … An ) . (2 .1 3)
　　证明　由 (2 .1 2) 式及数学归纳法可得 (2 .1 3) 式 .
推论
n
n
P k∪
=1
Ak ≤ ∑ P( A
k= 1
k ) 　 ( 有限次可加性 ) , (2 .1 4)
n
n
P k∪ Ak ≥ ∑ P( Ak ) - ∑ P ( Ai A j ) . (2 .1 5)
= 1
k= 1 1 ≤ i < j≤ n
　　 ⑧ 可列次可加性
∞
∞
P k∪
=1
Ak ≤ ∑ P( A
k= 1
k ) . (2 .1 6)
　　 ⑨ ( 概率连续性 ) 若{ An , n≥ 1}为单调事件序列 , 则
P n→
lim An = n→
lim P( An ) . (2 .1 7)
∞ ∞
　　证明　若{ An , n≥ 1} ∈F, 且 A1 A2 … , 我们来证明上述
性质 .记 B1 = A1 , B2 = A2 - A1 , … , Bn = An - An - 1 , 显然有 An =
n n ∞ ∞
∪ Ak =
k=1 ∑B
k=1
k , n→
lim∞
An = n∪
= 1
An = ∑B
n= 1
n 且{ Bn , n≥ 1 }两两不相交 ,
由完全可加性有
∞ ∞ n
P n→
lim∞
An = P ∑B
n=1
n = ∑ P( B
n=1
n ) = n→
lim∞∑
P( Bk )
k= 1
= n→
lim P( An ) ,
∞
即得 (2 .1 7) 式 .
对{ An , n≥ 1 }∈F , 且 A1 A2 … An … , 注意到 A1
∞ ∞
A2 … , n∪ An = ∩ A n 可得 ( 2 .17 ) 式 .详细证明留给读者作为
=1 n=1
练习 .
例 2 .15 　设样本空间 Ω= {ω1 ,ω2 , … ,ωn }仅有有限个样本点 ,
μ( A)
F = { A| A Ω} , P( A) = , 其中 μ( A) 是 A 的测度 ( 具有非负、
μ(Ω)
可加性的集函数 ) , 则称 (Ω, F , P) 是一个概率空间 , 称为有限概率
空间 .
下面的例 2 .16 初学者可跳过不看 .
例 2 .16 　设 Ω= R , F = B, B 为一维博雷尔 σ－域 .在可测空间
(Ω, F ) = ( R , B ) 上定义 P( ・ ) 满足 :
∫
- 1/ 2 - t2 / 2
＂ A ∈ F = B, P( A) = ( 2π) e dt .
t∈ A
∫
- 1/ 2 - t2 / 2
由于 P(Ω) = ( 2π) e d t = 1 ( 详见第 2 章正态分布 ) , 则
t∈ R
可证明 (Ω, F , P) = ( R , B, P) 是一概率空间 .通常称 P 为一维标

准正态概率测度 .
例 2 .17 　 (1 ) [ 0 , 1]上的博雷尔概率空间 .设 Ω= [ 0 , 1] , F =

B[ 0 , 1] , 即 B [ 0 , 1 ] 是 B 局限在 [ 0 , 1 ] 上的博雷尔 σ－域 .称 ( Ω,
F ) = ( [ 0 , 1] , B[0 , 1 ] ) 为 [0 , 1] 上的博雷尔可测空间 .设在可测空
间 ( [0 , 1] , B[0 , 1] ) 上定义一概率测度 P, 它满足 : 当＂ A = [ a, b] ∈
B[ 0 , 1]时 , P ( A) = b - a, 称 ( Ω, F, P) = ( [ 0 , 1 ] , B[ 0 , 1 ] , P ) 为
[0 , 1 ]上的博雷尔概率空间 , 称 P 为[ 0 , 1] 上的博雷尔概率测度 .
(2 ) 令 B = [0 , 1 ]上有理点全体 , B = [ 0 , 1]上无理点全体 .
① 试证 : B∈F, B∈F;
② 用公理化定义与性质 , 求证 : P( B) = 0 , P( B) = 1 .
∞
1
证明　＂ a∈ [ 0 , 1 ] , 单点集 { a} = ∩ a, a + ∈ B[ 0 , 1 ] =
n= 1 n
m
F, 而 B = { 0} ∪ 1≤ m≤ n, n, m = 1 , 2 , … 是可列单点集的并 ,
n
故 B∈F , 且 B = [ 0 , 1] - B∈F .又＂ a∈ [ 0 , 1 ] , 由概率连续性易知
P( { a} ) = 0 , 由完全可加性知 P ( B) = 0 , 而 B = [ 0 , 1 ] - B, 故
P( B) = 1 - 0 = 1 .证毕 .
1 .3 　古典概型的计算
本节重点讨论有关古典概型的计算 .
古典概型是具有以下两点性质的试验 :
(1 ) 试验的样本空间的元素只有有限个 .
(2 ) 试验中每个样本点发生的可能性相同 .
事件 A 的概率定义为
A 中包含的样本点数 μ( A)
P( A) = = .
Ω 中包含的样本点数 μ(Ω)
　　为计算样本点数 , 往往需要用到排列组合的有关知识 , 而这部
分内容在中学已经讲过 , 这里只介绍简单组合的推广 , 即 n 个元素
分为 k 组的组合数 .
1 .3 古典概型的计算　 25
设有 n 个不同元素分为 k 组 ( 2 ≤ k≤ n) , 第一组含 m1 个 , 第
k
二组含 m2 个 , ……第 k 组含 mk 个 , ∑m
i= 1
i = n .为计算其组合数 ,
可以先将 n 个元素分为 m1 , n - m1 两个组 ; 再将 n - m1 , 分为 m2 ,
n - m1 - m2 两个组 ; 如此类推 , 即可得组合数为
n! ( n - m1 ) !
・ …
m1 !( n - m1 ) ! m2 !( n - m1 - m2 ) !
( n - m1 - … - mk - 2 ) ! n!
= , ( 3 .1)
mk - 1 !( n - m1 - … - mk - 1 ) ! m1 !m2 !… mk !
n!
即有种不同的分组方法 ( 不计其次序 ) .
m1 ! m2 !… mk !
n
不难看出 : 上式是多项式 ( x1 + x2 + … + xk ) 的展开式中
x1m 1 x2m 2 … xkm k 项的系数 , 因此我们也称 ( 3 .1) 式为多项式系数 .
古典概型中事件概率的计算步骤大致为 :
(1 ) 由给定的随机试验 , 建立合适的样本空间 , 判断其等可能
性是否满足 ;
(2 ) 求出 Ω及 A 中的样本点数 μ(Ω) 及 μ( A) ;
(3 ) 求概率 P( A) .
举例如下 .
1 　抽球问题
例 3 .1 　箱中有 10 个球 , 其中 6 个白球 , 4 个红球 , 任取 3 个 ;

求 : ( 1) 恰有一红球的概率 ; ( 2) 至少有一红球的概率 .
解　将球编号 : 白球 1～ 6 , 红球 7 ～10 .
设随机试验是任取 3 球 , 只考察号码 , 而不记其取出次序 .一
个样本点对应于从 10 个号码元素中取出 3 个 , 不计其次序的一种
组合取法 , 则 μ( Ω) = C310 .令 A i = {恰取到 i 个红球 } , B = { 至少取
出一个红球} ; A i 发生当且仅当从 1 ～ 6 中取出 3 - i 个 , 从 7 ～ 10
C36 - i C4i
中取出 i 个 .故 μ( A i ) = C C , 所以 P ( Ai ) = .于是
3 - i i
6 4
C31 0
C26 C14 60 1
P( A1 ) = 3 = = .又 B = Ω - A0 , 于是 P( B) = 1 - P( A0 ) =
C10 120 2
C36 1 5
1- 3 =1- = .
C1 0 6 6
例 3 .2 　箱中有 10 个球 , 6 白 4 红 , 随机地一个个取出不放
回 , 求第 k(1≤ k≤10) 次取到红球的概率 .
解　下面给出两种解法 , 读者可以从中体会建立样本空间的
方法 .
方法 1 　将球如例 3 .1 编号 .因为所求为第 k 次取出红球
的概率 , 故试验时只观察球一个个取出时第 k 次的结果 .建立样
本空间 Ω如下 : Ω中的一个样本对应于从 10 个球中取出 1 个 , 故
1
μ(Ω) = C1 0 .令 Ak = {第 k 次取出红球 } , 则 Ak 中的样本对应于从
1
7～10 号中取出 1 个 , 故 μ( Ak ) = C4 , 所以
1 1
P( Ak ) = μ( Ak )/ μ( Ω) = C4 / C1 0 = 4/ 10 (1 ≤ k ≤ 10) .
因此 , 第 k 次取到红球的概率与 k 无关 .
方法 2 　球不编号 , 只区分红、白颜色 .试验时 , 只考察 4 个红
球占据有编号的 10 个位置中的哪 4 个位置 .于是样本空间 Ω 中
的一个样本点对应着 10 个元素中取出 4 个 , 不计其次序的一种取
法 , 故 μ( Ω) = C410 .A k = {第 k 个位置上是红球 } , Ak 发生对应当且
仅当“有一红球占据第 k 位置 , 而其余 3 个红球占据剩下的 9 个位
3 3 4
置中的 3 个”, 故μ( Ak ) = C9 , 所以 P( Ak ) = C9/ C10 = 4/ 10 .
从上面两种方法可以看出 , 在解决同一具体问题时 , 可建立不
同的样本空间 .关键在于满足古典模型的两个条件 , 并且适用于问
题的解决 .
例 3 .3 　题设同例 3 .2; 求在第三次时 , 首次取到红球的概率 .
解　同例 3 .2 将球编号 , 只观察前 3 次抽球情况 , 据此建立样
本空间 Ω .Ω 的每一个样本对应于从 10 个元素中取 3 个考虑次序

的一种排列 , 故 μ(Ω) = A310 , 令 A = 第 3 次首次取到红球 , 则 A 发
生当且仅当前两次从 1 ～6 号中取球 , 第 3 次从 7 ～10 号中取球 ,
A26 A14 1
故 P( A) = 3 = .
A10 6
另一种方法 .同例 3 .2 方法 2 , 球不编号 .只考察 4 个红球放
4
置的位置 , 此时 μ( Ω) = C10 .而事件 A 发生 , 当且仅当其中一红球
占据第 3 个位置 , 且其他 3 个红球占据从 4 ～ 10 中的 3 个 , 则
3 3 4
μ( A) = C7 .从而得 P( A) = C7 / C1 0 = 1/ 6 .
实际生活中常常会遇到各种各样的“ 抽球”问题 .比如把“ 白
球”与“ 红球”换成“ 合格品”与“ 次品”“
, 正面”与“ 反面”“
, 成功”与
“失败”“
, 有信号”与“ 无信号”等 .许多问题都能形象化地用抽球问
题加以描述 , 所以抽球问题具有典型意义 .
例 3 .4 　箱中有 a 个白球 , b 个红球 , 采用有放回和无放回两
种抽样方式从中取出 n( n≤ a + b) 个球 , 恰有 k( 0≤ k≤ n) 个红球的
概率各是多少 ?
解　由于抽样方式不同 , 即随机试验不同 , 故须分别讨论 .
(1 ) 有放回抽样 .此时 , 抽取 n 个的一种取法对应于从 ( a + b)
个元素中取 n 个的可重复排列的一种 , 故 μ( Ω) = ( a + b) n ; 令 A =
{抽出的 n 个中恰有 k 个红球} , 则
μ( A) = C nk bk a n - k , 　 0 ≤ k ≤ n .
故
k n - k
k b a
P( A) = C n .
a+ b a+ b
　　 (2 ) 无放回抽样 .抽取 n 个球 , 不考虑其次序 ; 此时 , Ω中每一
样本点对应于从 ( a + b) 个元素中取出 n 个的一种组合 , 故 μ( Ω) =
Cna + b , 而恰有 k 个红球要求 0≤ k≤ b, 有
μ( A) = C bk Cna - k , 　 0 ≤ k ≤ b, 　 1 ≤ n ≤ a + b,
故
P( A) = C bk Cna - k/ C na+ b , 　 0 ≤ k ≤ b, 　 1 ≤ n ≤ a + b .
2 　分房问题
例 3 .5 　有 n 个人 , 每个人都以同样的概率分配在 N ( n≤ N)
间房中的每一间中 , 求下列事件的概率 :
A: 某指定 n 间房中各有 1 人 ;
B: 恰有 n 间房 , 其中各有 1 人 ;
C: 某指定房间中恰有 m( m≤ n) 人 .
解　设随机试验为把每个人随机分配到 N 个房间中任一间 ,
据此建立样本空间 Ω .由于每一人分到 N 个房间中有 N 种分法 ,
由乘法原理得 μ(Ω) = N n .
现固定某 n 个房间且每间一人 , 第一人可分配到其中任一间 ,
有 n 种分法 , 第二人可分配到余下 n - 1 间中任一间 , 有 n - 1 种分
n!
法 , …… , 故 μ( A) = n !, 所以 P( A) = .
Nn
n
如果这 n 个房间可自 N 间中任意选出 , 那么只有 C N 种选法 ,
n
故 μ( B) = n !・C N , 所以
n
n !・C N
P( B) = n = n N! .
N N ( N - n) !
　　事件 C 中的 m 个人可自 n 个人中任意选出 , 故有 Cnm 种选法 ,
其余 ( n - m ) 个人可任意分配到剩下的 N - 1 间房里 , 共有
( N - 1 ) n - m 种分法 , 所以 μ( C) = Cnm ( N - 1) n - m
.故
C nm ( N - 1 ) n - m m n- m
m 1 N - 1
P( C) = n = Cn .
N N N
　　例 3 .6 　将 r 个质点 ( 不可分辨 ) 随机放入 n 个盒子中 ( 1 ≤
r≤ n) ( 假设每一种放法等可能 ) , 求下列事件的概率 : A =“ 某指定
的 r 个盒中各有一质点”, B =“某指定的一个盒中恰有 k(1≤ k≤ r)
个质点”.
解　用竖线“ | ”表示盒壁 , 用“ ＊ ”表示质点 , 将盒子和质点并
列排成一排 , 如 r = 3 , n = 4 的一种放法表示为 : | ＊＊ | | ＊ | | , 表示
各个盒子中的质点数依次为 2 , 0 , 1 , 0 .把每个壁与每个点都看成
一个位置 , 其中两端的竖线固定 , 其余的 n - 1 条竖线和 r 个“ ＊ ”
依次占据 n + r - 1 个位置 .令 Ω= { r 个质点的放法全体 } , 于是 r
个质点的一种占位就相当于 n + r - 1 个位置中 r 个被“ ＊ ”占据的
一种 .等价于从 ( n + r - 1 ) 个数中不计次序取出 r 个数的一种取
r
法 , 故 μ(Ω) = Cn + r - 1 .事件 A 只是 r 个质点的一种放法 , 故μ( A) =
1 , 所以
P( A) = μ( A) = r 1 = r !( n - 1) ! .
μ( Ω) Cn + r - 1 ( n + r - 1) !
　　 B =“ 某指定的一盒中恰有 k 个质点”.这样 , B 中的一个样本
点就对应于有 k 个质点放在指定盒中 , 而其余的 r - k 个质点放在
剩下的 n - 1 个盒中的一种放法 .
故由上分析可知 : μ( B) = C(r n- -k 1 ) + ( r - k) - 1 = Crn -+ kr - k - 2 , 所以
μ( B) Crn-+kr - k - 2
P( B) = = r .
μ(Ω) Cn + r - 1
　　本题与例 3 .5 同属“分房问题”.只是在例 3 .5 中人是可辨的 ,
即人的占据不仅依赖于每个房间的人数 , 还取决于不同人 ; 而本题
中 , 由于质点不可辨 , 所以其分布只依赖于盒的质点个数 , 这样在
计算样本点数时 , 所用的方法就不相同 , 请读者仔细体会 .
3 　随机取数问题
例 3 .7 　从 1 , 2 , … , 10 这 10 个数字中任取一个 ( 假定每个数

字都以相同的概率被取中 ) , 取后还原 .先后取出 7 个数字 , 试求下
列各事件的概率 :
A1 : 7 个数字全不相同 ;
A2 : 不含 1 和 10;
A3 : 10 恰好出现两次 ;
A4 : 至少出现两次 10 .
解　每取一次 , 有 10 种不同的取法 ; 还原后 , 再取仍有 10 种
不同的取法 ; 因此由乘法原理 , Ω中共有 107 个不同的样本点 .
A1 =“ 7 个数字全不相同”.容易看出 μ( A1 ) = 10 ×9 ×8 ×7 ×
6×5 ×4 = 10 !/ 3 !, 所以
μ( A1 ) 10 × 9 × 8 × 7 × 6 × 5 × 4
P( A1 ) = = 7 ≈ 0 .06048 .
μ(Ω) 10
　　 A2 =“不含 1 和 10”.A2 中的一个样本点对应于“ 从 2～ 9 这 8
7
个数中任取 1 个 , 重复 7 次的一种取法”, 故 μ( A2 ) = 8 , 所以
87
P( A2 ) = .
107
　　 A3 =“ 10 恰好出现两次”.出现的两次 10 可以是 7 次中的任
意两次 , 而其他 5 次 , 每次只能取剩下 9 个数字中的一个 , 故
μ( A3 ) = C27 ・95 , P ( A3 ) = C27 ・ 95/ 107 .一般地 , 10 恰好出现 k 次
C7k ・ 97 - k
( k≤7) 的概率为 Pk = .
107
A4 =“至少出现两次 10”.设 Bk = 10 恰好出现 k 次 ( k = 0 , 1 ,
7
2 , 3 , 4 , 5 , 6 , 7) , 则它们彼此互不相容 , 所以 A4 = ∑B
k=2
k ; 由此
及概率的有限可加性 , 有
7
∑C
k 7 - k
7 7 ・9
∑P
k=2
P( A4 ) = k = .
k= 2 107
1
∑C
k 7- k
1 7 ・9
k= 0
又 A4 = Ω - B0 - B1 , 所以 P( A4 ) = 1 - ∑
k= 0
Pk = 1 -
107
.
1 .4 条件概率与全概率公式　 31
从以上几类事件概率的计算 , 可以总结出 , 在求解有关古典概

型的事件概率时应做到 :
(1 ) 善于对较为复杂的事件进行分解和转化 , 变为简单易求
的概率计算 ;
(2 ) 针对具体问题 , 建立适当的样本空间 ; 对于复杂的问题可
以借助于直观表示 ;
(3 ) 善于利用排列组合的相关知识 , 正确求解 μ(Ω) ,μ( A) .
1 .4 　条件概率与全概率公式
在实际问题中 , 有时不仅要知道事件 A 发生的概率 P ( A) ; 而

且还要知道在事件 B 发生的条件下 , 事件 A 发生的条件概率 , 记
这一条件概率为 P( A| B) .由于引入“ 在事件 B 发生的条件下”这
一前提 , P( A | B) 与 P( A) 通常是不一样的 .
例 4 .1 　投掷骰子 , 观察出现的点数 .Ω= { 1 , 2 , 3 , 4 , 5 , 6} ; 若
A = {点数为偶数 } , B = { 所掷点数大于 3 } ; 易知 P( A) = 3/ 6 =
1/ 2 , P( B) = 3/ 6 = 1/ 2 .当 B 发生时 , 所有可能的样本点数为 3 , 在
此条件下 , A 发生的样本点数为 μ( A B) = 2 , 故而 P( A | B) = 2/ 3 ,
P( A) ≠ P( A| B) .
上例中 P( A) , P( B) 称为无条件概率 , P ( A | B) 称为条件概
率 .由此例可见条件概率与无条件概率不相同 , 需进一步研究 .
1 　条件概率的定义
定义 4 .1 　设 (Ω, F, P) 为概率空间 , A, B∈F, 设 P( B) > 0 ,

定义
P( AB )
P( A | B) = . ( 4 .1)
P( B)
称 P( A| B) 为事件 B 发生下 , 事件 A 发生的条件概率 .
为了区别 P( A| B) , 称 P( A) 为事件 A 发生的无条件概率 .

在古典概型中 , 若事件 B 中含有 m 个不同的样本点 , A B 中
含有 k 个不同样本点 , 而 Ω中样本点数为 n , 则由定义 4 .1 知
P( AB ) k/ n k
P( A | B) = = = .
P( B) m/ n m
　　在几何概型中 , 以 μ( A i ) 表示 Ai 的面积 ,μ( Ω) 为总面积 .则
P( A1 A2 ) μ( A1 A2 )/ μ( Ω) μ( A1 A2 )
P( A1 | A2 ) = = = .
P( A2 ) μ( A2 )/ μ(Ω) μ( A2 )
　　在事件 B 给定时 , 条件概率 P( A| B) 也是 A 的集函数 , 请读
者自己根据定义验证它具有非负性、规一性和可列可加性 .这样 ,
条件概率具备概率的所有性质 , 如果条件概率中取 B = Ω, 则
P( AΩ)
P( A| Ω) = = P( A) .因此无条件概率只是条件概率的一种
P(Ω)
特殊情况 .
2 　乘法公式和全概率公式
这里给出条件概率的 3 个基本公式 : 乘法公式 , 全概率公式和

贝叶斯 ( Bayes) 公式 .这些公式在随机数学中起着很重要的作用 ,
现在分别介绍 .
(1 ) 乘法公式
定理 4 .1 　设 A , B∈F , 若 P( B) > 0 , 则
P( A B ) = P( B) P( A | B) . ( 4 .2)
称之为乘法公式 .
证明　因为 P( B) > 0 , 由条件概率定义即证 .
推论 1 　设 A i ∈F( i = 1 , 2 , 3) , 若 P( A1 A2 ) > 0 , 则
P( A1 A2 A3 ) = P( A1 ) P( A2 | A1 ) P( A3 | A1 A2 ) .
　　证明　因为 P( A1 ) ≥ P( A1 A2 ) > 0 , 故
P( A1 A2 A3 ) = P( A1 A2 ) P( A3 | A1 A2 )
= P( A1 ) P( A2 | A1 ) P( A3 | A1 A2 ) .
　　类似的有一般的情形 .
推论 2 　设 A i ∈F ( 1≤ i≤ n) , 若 P( A1 A2 … An - 1 ) > 0 , 则
P( A1 A2 A3 … An ) = P( A1 ) P( A2 | A1 ) P( A3 | A1 A2 )
… P( An | A1 A2 … An - 1 ) .
　　例 4 .2 　袋中有 10 个球 , 6 白 4 红 , 一个一个地取出 ; 令 A k =
第 k 次取出红球 , 其中 1 ≤ k≤10; 求 P( A1 A2 ) , P( A2 ) .
解　方法 1 　按照古典概型的计算方法
2 1
C4 2 C4 2
P( A1 A2 ) = 2 = , 　 P( A2 ) = 1 = .
C10 15 C10 5
4 3 2
　　方法 2 　 P ( A1 A2 ) = P ( A1 ) P ( A2 | A1 ) = × = .由
10 9 15
A2 = ΩA2 = A1 A2 + A1 A2 , 故
P( A2 ) = P( A1 A2 + A1 A2 ) = P( A1 A2 ) + P( A1 A2 )
= P( A1 ) P( A2 | A1 ) + P( A1 ) P( A2 | A1 )
2 6 4 2
=
+ × = .
15 10 9 5
　　在方法 2 求 P( A2 ) 的过程中 , 对 Ω作如下分解 : Ω= A1 + A1 ,
且使 A1 A2 与 A1 A2 互不相容 .这种分解方法体现了以下全概率公
式的基本思想 .
(2 ) 全概率公式
定义 4 .2 　若 { Bi , i≥ 1 } 满足 : Bi ∈ F, ＂ i ≠ j, Bi B j = ,
∞
∪ Bi = Ω, 则称{ B i , i≥1} 为样本空间 Ω的一个分解 .

i= 1
定理 4 .2 　若 { Bi , 1 ≤ i≤ n}为样本空间 Ω的一个分解 , A∈F,

则
n
P( A) = ∑ P( B ) P( A |
i=1
i Bi ) , ( 4 .3)
称之为全概率公式 .
n
n
证明　因为 A = AΩ = A i∪
= 1
Bi = ∑ ( B A)
i= 1
i , 所以
P( A) = P i∪ ( Bi A ) 　 ( 事件的等价性 )
= 1
= ∑ P( Bi A ) 　 ( 有限可加性 )
i=1
= ∑ P( Bi ) P( A | Bi ) 　 ( 乘法公式 ) .
i=1
　　将事件 A 分解成若干互不相容的事件 A B i 的和 , 从而将复杂

事件 A 的概率 P ( A) 转化为事件 A Bi 的概率 P( Bi A ) 的和 .
下面几个例子说明全概率公式在简化计算方面的作用 .
例 4 .3 　从 0～9 中任取两数 , 求其和大于 10 的概率 .
解　记 A = {0 ～9 中和大于 10 两数 } , Bi = {第一次取出数 i}
9
(1 ≤ i ≤ 9 ) , 则＂ i≠ j, Bi B j = ,∪ Bi = Ω .又 P ( Bi ) = 1/ 10 ,
i= 0
P( A| B0 ) = 0 , P( A| B1 ) = 0 .当 2 ≤ i≤ 5 时 , P( A | Bi ) = ( i - 1 )/ 9;
当 6≤ i≤9 时 , P( A | Bi ) = ( i - 2)/ 9 .所以
9
P( A) = ∑ P( Bi ) P( A | Bi )
i= 0
5 9
= ∑ P( Bi ) P( A | Bi ) + ∑ P( B ) P( A |
i Bi )
i= 2 i=6
5 9
1 i - 1 1 i - 2 16
= ∑ + ∑ = .
10 i = 2 9 10 i= 6 9 45
　　例 4 .4 　设一信号接收器在 [ 0 , 1 ] 时间内到达 n 个信号的概
率为
n
pn = μ e - μ , 　 μ > 0 常数 , 　 n ∈ N = {0 , 1 , 2 , …} .
n!
一信号到达时 , 能被记录下来的概率是 0 .4 .设各信号到达时能否
被记录相互独立 , 求该接收器在 [ 0 , 1 ] 上记录 l 个信号的概率 ,
l∈ N .
解　记 A = 接收器在 [ 0 , 1 ] 上记录 l 个信号 , Bn = 接收器在
[0 , 1 ] 上到达 n 个信号 , n ∈ N . A = AΩ = n∪ ( Bn A ) , P ( Bn ) =
= l
n
μ -μ
e , P( A | Bn ) = Cln ( 0 .4) l ( 0 .6) n - l .故
n!
∞ n
μ e- μ l
P( A) = ∑ C n ( 0 .4) l ( 0 .6) n - l 　 ( 令 i = n - l)
n= l n!
l ∞ i
( 0 .4μ) - μ (0 .6μ)
= e ∑
l ! i=0 i!
( 0 .4μ) l - 0 .4 μ
= e , 　 l∈ N .
l !
　　由以上几个例子可以看出 , 全概率公式的形式虽然很简单 , 但
它所代表的“ 对样本空间进行适当分解”的思想却十分重要 , 具有
很高的技巧性 .通过对样本空间的分解 , 可以将“较复杂的”事件转
化与分解为若干不相容事件的并 , 从而使问题得以解决 .这种事件
分解的思想在后面章节中仍会不断涉及 , 它贯穿概率论的始终 , 是
概率论的一大特点 .
对于全概率公式 , 还可以做以下两点推广 .
推论 3 　若{ Bi , i≥1 }是 Ω的一个分解 , 且 P( B i ) > 0 , 则
∞
P( A) = ∑ P( B ) P( A |
n=1
i Bi ) . ( 4 .4)
　　 ( 证明提示 : 利用概率的可列可加性 .与定理 4 .2 证明类似 .)

∞
推论 4 　若＂ i≠ j , B i B j = , B i ∈F, A ∪ Bn , 则 (4 .4 ) 式亦
n= 1
成立 .
全概率公式是概率论的最基本公式之一 , 它隐含了概率论中
分析问题的基本思想与技巧 , 以后还要介绍它的各种变形与推广 .
(3 ) 贝叶斯公式
n
由全概率公式可知 , P( A) = ∑ P( B ) P( A |
i= 1
i B i ) . 由乘法公
式 , 得到
P( A B i ) = P( A) P( Bi | A) = P( Bi ) P( A | Bi ) . ( 4 .5)
将 (4 .3 ) 式代入 ( 4 .5) 式 , 得到
n
∑ P( B ) P( A |
i= 1
i Bi ) ・ P( Bi | A) = P( Bi ) P( A | Bi ) ,
所以
P( Bi ) P( A | Bi )
P( Bi | A) = n . ( 4 .6)
∑ P( B ) P( A |
i=1
i Bi )
　　定义 4 .3 　称 ( 4 .6) 式为贝叶斯公式 .
与全概率公式类似 , 贝叶斯公式也可以推广到可列无穷的情
况,即
P( Bi ) P( A | Bi )
P( Bi | A) = ∞ . ( 4 .7)
∑ P( B ) P( A |
i=1
i Bi )
　　通过贝叶斯公式 , 使我们在已知 P ( Bi ) 和 P ( A | B i ) 的情况
下 , 可以计算 P( Bi | A) 的值 , 称 P( Bi | A) 为事件 Bi 的后验概率 ( 即
已知试验结果 A 以后 B i 的概率 ) .相对地 , 称 P( Bi ) 为事件 Bi 的先
验概率 .
以下几个例子说明贝叶斯公式的应用 .
例 4 .5 　某发报机每次随机地发“ 1”与“ 0”两种信号 , 其概率
分别为 0 .6 与 0 .4 , 由于系统受随机干扰 , 其结果是在发报机发
“1”信号条件下 , 收报机收到“ 1”与“ 0”的条件概率为 0 .8 与 0 .2;
在发“0”信号条件下 , 收到“1”与“ 0”的条件概率为“ 0 .1”与“ 0 .9”.
试求在收报机收到“1”信号条件下 , 发报机发“1”的条件概率 ?
解　设 A = 发“ 1”信号 , A = 发“ 0”信号 ; B = 收“ 1”信号 , B =
收“0”信号 .由题意有 P( A) = 0 .6 , P( A) = 0 .4 , P ( B | A) = 0 .8 ,
P( B | A) = 0 .2 , P( B | A) = 0 .1 , P( B| A) = 0 .9 .由贝叶斯公式得
P( A) P( B | A)
P( A | B) =
P( A) P( B | A) + P( A) P( B | A)
0 .6 × 0 .8
= = 0 .923 .
0 .6 × 0 .8 + 0 .4 × 0 .1
此例中 , P( A) = 0 .6 , P( A) = 0 .4 是根据以往发信号的统计规律
得到的 , 相对于这个问题而言是先验概率 , 而 P( A| B) 是根据本次
得到的试验结果的信息下得到的后验概率 .
例 4 .6 　对以往数据分析结果表明 : 当机器调整良好时 , 产品
的合格率为 90 % , 而当机器发生某一故障时 , 其产品合格率仅为
30 % ; 每天早上机器开动时 , 机器调整良好的概率为 75 % .已知某
日早上第一件产品是合格品 , 试求 : 机器调整良好的概率是多少 ?
解　 A = {产品合格 } , B = {机器调整良好 } , 则题目要求的是
P( B | A) ; 由题意知 P ( A | B) = 90 % , P ( A | B) = 30 % , P ( B) =
75 % , 所以
P( B) P( A | B)
P( B | A) =
P( B) P( A | B) + P( B) P( A | B)
0 .7 5 × 0 .9
= = 0 .9 .
0 .7 5 × 0 .9 + 0 .2 5 × 0 .3
即 , 当生产出的第一件产品合格时 , 机器调整良好的概率为 90 % .
题目中 P( B) = 75 % 是根据以往的数据分析得到的 , 是先验概率 ;
而 P( B| A) 是在得到“生产了一件合格产品”这一信息条件下的修
正概率 , 是后验概率 .
(4 ) 乘法公式、全概率公式在条件概率下的形式
在某事件 C 发生的条件下 , 乘法公式、全概率公式仍然成立 ,
其形式如下 :
乘法公式 : 设 A, B, C∈F, 若 P( A C) > 0 , 则
P( AB | C) = P( A | C) P( B | AC) . ( 4 .8)
∞
　　全概率公式 : A∈F, 若 A ∪ Bi , Bi ∈F, ＂ i≠ j, Bi B j = ,

i= 1
P( CBi ) > 0 , 则
P( A | C) = ∑ P( B
i= 1
i | C) P( A | CB i ) . ( 4 .9)
　　上述形式的乘法公式和全概率公式 , 仍是无条件下相应公式

的推广 , 其证明与后者类似 , 这里不再赘述 , 留给读者作为练习 .
3 　综合举例
在引入了条件概率的 3 个重要公式———乘法公式 , 全概率公
式和贝叶斯公式后 , 我们所解决的概率问题的范围比以前大大扩
展了 .为说明它们的综合应用 , 举例如下 .
例 4 .7 　有两个口袋 , 1 号袋装有 2 个黑球和 3 个红球 ; 2 号
袋装有 3 个黑球和 2 个红球 ; 用掷一颗骰子来决定从哪个袋中取
球 .若骰子出现的点数是 1～ 4 , 则从 1 号袋取球 , 否则从 2 号袋取
球 .接着随机地从该口袋抽出一球后放回原袋 , 再从同一口袋重复
取放 n 次 .记 Bk 为第 k ( 1 ≤ k≤ n) 次取出黑球 .试求 P( B2 | B1 ) ,
P( Bn | B1 … Bn - 1 ) 及lim P( Bn | B1 … Bn - 1 ) .
n→ ∞
解　记 A1 = 从 1 号口袋 (2 黑 3 红 ) 取球 ; A2 = 从 2 号口袋 (2
红 3 黑 ) 取球 .由条件概率定义得 P( B2 | B1 ) = P ( B1 B2 )/ P( B1 ) ,
而事件 B1 = B1 ( A1 ∪ A2 ) = A1 B1 ∪ A2 B1 , 从而有
P( B1 ) = P( A1 B1 ) + P( A2 B1 )
= P( A1 ) P( B1 | A1 ) + P( A2 ) P( B1 | A2 )
= 4/ 6・2/ 5 + 2/ 6・3/ 5 = 7/ 15 .
类似地
P( B1 B2 ) = P( A1 ) P( B1 B2 | A1 ) + P( A2 ) P( B1 B2 | A2 )
2 2
= 4/ 6・ ( 2/ 5) + 2/ 6 ・ (3/ 5 ) = 17/ 75 ,
P( B1 B2 ) 17
所以 P( B2 | B1 ) = = .
P( B1 ) 35
类似地 , 若前两次抽到的都是黑球 , 则第三次抽到的也是黑球
的条件概率为
P( B1 B2 B3 )
P( B3 | B1 B2 ) =
P( B1 B2 )
4/ 6・ ( 2/ 5) 3 + 2/ 6・ ( 3/ 5) 3 43
= 2 2 = .
4/ 6・ ( 2/ 5) + 2/ 6・ ( 3/ 5) 85
　　一般地 , 若已知前 n - 1 次抽到的均是黑球 , 则从第 n 次抽到
的也是黑球的条件概率为
P( B1 B2 … Bn )
P( Bn | B1 B2 … Bn - 1 ) =
P( B1 B2 … Bn - 1 )
n n
= 4/ 6 (2/ 5n )- 1 + 2/ 6( 3/ 5) n - 1 .
4/ 6( 2/ 5) + 2/ 6( 3/ 5)
　　当 n→∞时 , 上述概率的极限为
( 2/ 5) n + ( 3/ 5) n
lim P( Bn | B1 B2 … Bn - 1 ) = n→
lim
n→ ∞ ∞ ( 2/ 5) n - 1 + (3/ 5 ) n - 1
3
= = P( B1 | B2 ) .
5
　　例 4 .8 　波利亚 ( Polya ) 坛子模型 .
有些人把这个问题当作传染病或地震的模型 , 认为某地越爆
发疾病则越容易爆发该疾病 .模型如下 ( 红球代表爆发 , 黑球代表
不爆发 ) : 坛子中有 b 个黑球 , r 个红球 ; 现从中每次取一个 , 取后
放回 , 并同时再放入 c 个与所取球同色的球 .问 :
(1 ) 前两次取出的都是黑球的概率 ;
(2 ) 第 n 次抽取的是黑球的概率 .
解　令 Bi = 第 i( i = 1 , 2 , … ) 次取出的是黑球 .
(1 ) 求 P( B1 B2 ) 　由乘法公式 , 有
b b+ c
P( B1 B2 ) = P( B1 ) P( B2 | B1 ) = .
b+ rb+ r+ c
　　 ( 2) 求 P( Bn ) 　先考虑 c = 0 与 c = - 1 的特殊情形 .这是我们
已经熟悉的有放回抽样问题与无放回抽样问题 , 易知 P ( Bn ) =
b
.下面我们证明这个结论带有一般性 , 即对任意的 c, 都有
b+ r
b
P( Bn ) = .
b+ r
考虑在前 n 次抽取中 , 对任意指定顺序取 k 个黑球和 ( n - k)
个红球的概率 .每抽取一次 , 球的总数加 c, 每抽到一个黑 ( 红 ) 球 ,
黑 ( 红 ) 球数加 c .均有
μ( Ω) = C1b+ r C1b+ r+ c …C1b+ r+ ( n - 1 ) c .
μ( 指定 k 个位置取黑球 , 其余 ( n - k) 个位置取红球 ) =
1 1 1 1 1 1
C b C b+ c …Cb+ ( k - 1 ) c Cr C r+ c …Cr+ ( n - k - 1 ) c ,
P( 指定顺序取 k 个黑球 , ( n - k) 个红球 ) =
b( b + c) …[ b + ( k - 1) c] r( r + c) …[ r + ( n - k - 1 ) c] .
( b + r) ( b + r + c) ( b + r + 2 c) …[ b + r + ( n - 1) c]
记 Ak = 前 n 次抽球中抽到 k ( k = 0 , 1 , 2 , … , n) 个黑球 , 则由全概率
n
公式 Ω= k∪ Ak 得
=0
P( Bn + 1 ) = ∑ P( A
k=0
k ) P( Bn + 1 | Ak )
n
= ∑ Cnk b( b + c)…[ b + ( k - 1) c] r( r + c)…[ r + ( n - k - 1) c] ・

k= 0 ( b + r) ( b + r + c)( b + r + 2c)… ( b + r + ( n - 1) c)
b + kc
.
b + r + nc
若记 b′= b + c, 则
n
b
P( Bn+ 1 ) = ∑
b + r k=0
C nk ・
b′( b′+ c) …[ b′+ ( k - 1 ) c] r( r + c) …[ r + ( n - k - 1 ) c]

( b′+ r) ( b′+ r + c) … [ b′+ r + ( n - 1) c]
n
b
b + r∑
= P(在 b′个黑球 , r 个红球的坛子中 , 前 n 次取 k 个黑球 )
k= 0
b
= .
b+ r
1 .5 事件的独立性　 41
　　由此可见 , P( Bn ) 的概率与 n 及 c 均无关 .不爆发传染病的概

率是不随时间而转移的 ; 也就是说 , 以前传染病爆发与否对现在没
影响 .
1 .5 　事件的独立性
1 　两个事件的独立性
　　例 5 .1 　有 10 个球 , 6 白 4 红 , 现从中每次取出一个 , 取后放
回 , 设 Ak =“第 k 次取出的是红球”, 由古典概型的概率计算 , 可以
4 4 4 4
得到 : P( A1 ) = , P( A2 ) = , P( A2 | A1 ) = , P( A2 | A1 ) = ,
10 10 10 10
即在 A1 发生或不发生的条件下 , A2 发生的条件概率都等于 A2 的
无条件概率 .这说明 A1 的发生与否对 A2 发生的概率没有影响 .这
时 , 我们可以设想 A1 , A2 是彼此独立的 , 再由 P ( A1 A2 ) =
P( A1 | A2 ) P( A2 ) , 得 P( A1 A2 ) = P( A1 ) P( A2 ) , 由此引出两个事
件独立的定义 .
定义 5 .1 　若事件 A , B 满足
P( AB ) = P( A) P( B) , ( 5 .1)
则称 A , B 相互独立 .
对于独立性 , 有如下的命题 .
命题 5 .1 　下列命题等价 : (1 ) A 与 B 相互独立 ; ( 2 ) A 与 B
独立 ; ( 3) A 与 B 独立 ; ( 4 ) A 与 B 独立 ; ( 5 ) P( A | B) = P( A) ;
(6 ) P( A | B) = P( A) ; (7 ) P( A | B) = P( A) , P( A | B) = P( A) .
证明　 ( 1 ) → ( 2 ) 　由 A = A B∪ A B 得 P ( A) = P( A B) +
P( A B) ; 由 A, B 相互独立 , 得 P( A B) = P( A) P( B) .于是 P( A B) =
P( A) - P( A B) = P ( A) - P ( A ) P ( B) = P ( A ) ( 1 - P ( B) ) =
P( A) P( B) , 故 A, B 相互独立 .同理可证 (2 ) → ( 3) → (4 ) → ( 1 ) .其
余证明留给读者练习 .
2 　几个事件的独立性
(1 ) 3 事件的独立性
定义 5 .2 　如果 3 事件 A , B, C 满足
P( A B) = P( A) P( B) , ( 5 .2)
P( AC ) = P( A) P( C) , ( 5 .3)
P( BC) = P( B) P( C) , ( 5 .4)
P( A BC) = P( A) P( B) P( C) . ( 5 .5)
则称 A , B , C 相互独立 .
当事件 A , B, C 只满足 ( 5 .2 ) 式 , ( 5 .3) 式 , (5 .4 ) 式时 , 称事
件 A , B , C 两两独立 .
一般地, 事件 A, B, C 两两独立时 P( A BC) = P( A) P( B) P( C)
不一定成立 , 即事件 A, B, C 的两两独立性不能保证事件 A , B, C
的相互独立性 , 从下例可看到这点 .
例 5 .2 　一个均匀的正四面体 , 第一面全染红色 , 第二面全染
黄色 , 第三面全染蓝色 , 第四面染红黄蓝 3 色 .在桌上将该四面体
任意掷一次 , 考察和桌面接触的那一面上出现的颜色 .记 A =“ 出
现红色”, B =“ 出现黄色”, C =“出现蓝色”.下面我们将指出这 3
个事件两两独立 , 但不相互独立 .再记 Ai =“ 第 i 面接触桌面”,
i = 1 , 2 , 3 , 4 , 由题意 P( Ai ) = 1/ 4 .又 A = A1 ∪ A4 , B = A2 ∪ A4 ,
C= A3 ∪ A4 , 所以 P ( A) = P ( B) = P ( C) = 1/ 2 .又 A B = AC =
BC = A4 , 故 P( A B) = P ( BC) = P ( A C) = 1/ 4 .可见事件 A , B , C
两两独立 .
又 P( A BC) = P ( A4 ) = 1/ 4 , P ( A ) P ( B) P ( C) = 1/ 8 , 所以
P( A B C) ≠ P( A) P( B) P( C) , 可见事件 A, B, C 不相互独立 .
命题 5 .2 　下列命题等价 : ( 1 ) A, B, C 独立 ; ( 2 ) A, B, C 独
立 ; ( 3) A , B, C 独立 ; ( 4 ) A , B, C 独立 ; ( 5 ) A , B, C 独立 ; ( 6 ) A , B,
C 独立 ; (7 ) A, B, C 独立 ; (8 ) A, B, C 独立 .
证明　类似于命题 5 .1 的证明 , 从略 .
作为练习 , 请读者证明若 A, B, C 独立 , 则 A B 与 C , A \ B 与
C, A∪ B 与 C 相互独立 .一般地 , 有命题 5 .3 .
命题 5 .3 　设 A , B, C 独立 , 记 F1 = σ( A, B) , F2 = σ( C) , 任取
A1 ∈F1 , A2 ∈F2 , 则 A1 , A2 独立 .
(2 ) n 个事件的独立性
由定义 5 .2 推而广之 , 得到 n 个事件独立性的定义 .
定义 5 .3 　 n 个事件 A1 , A2 , … , An , 如果对任意的 k ( 2 ≤
k≤ n) , 有
P( A i1 Ai2 … Ai k ) = P( A i1 ) P( Ai2 ) … P( Ai k ) , ( 5 .6)
其中 i1 , i2 , … , ik 是满足 1 ≤ i1 < i2 < … < ik ≤ n 的任意 k 个自然
数 , 则称 A1 , A2 , … , A n 相互独立 .
注意　 P( Ai1 A i2 … Ai k ) = P( Ai1 ) P( Ai2 ) … P( A i k ) 代表的等式
个数为
C2n + C3n + … + C nn = (1 + 1 ) n - C1n - C0n = 2 n - n - 1 .
　　还有如下命题 .
命题 5 .4 　若 A1 , A2 , … , Am , Am + 1 , … , An 相互独立 ( 1 ≤
m < n) , 记 F1 = σ( Ak , 1 ≤ k≤ m ) , F2 = σ( Ak , m + 1 ≤ k≤ n) , 任取
B1 ∈F1 , B2 ∈F2 , 则 B1 与 B2 相互独立 .
例 5 .3 　甲、乙、丙 3 人向同一飞机射击 , 设各人是否命中相
互独立 , 他们的命中率分别为 0 .4 , 0 .5 , 0 .7 .若只有一人射中飞机
坠毁的概率为 0 .2; 若两人同时射中飞机坠毁的概率为 0 .6 ; 若 3
人同时射中 , 飞机一定坠毁 .求飞机坠毁的概率 .
解　飞机坠毁这一事件可看成由以下几个互不相容事件的并
组成 : 因一个人击中而坠毁 , 因两人击中而坠毁 , 因 3 人击中而坠
毁 .故可依此思路进行样本空间的分解 .
设 B = 飞机坠毁 , A i = 恰由 i ( i = 0 , 1 , 2 , 3 ) 个人同时击中 , 则
Ω= A0 + A1 + A2 + A3 .记 C1 = 甲射中 , C2 = 乙射中 , C3 = 丙射中 ,
则
A0 = C1 C2 C3 , A1 = ( C1 C2 C3 ) ∪ ( C1 C2 C3 ) ∪ ( C1 C2 C3 ) ,
A2 = ( C1 C2 C3 ) ∪ ( C1 C2 C3 ) ∪ ( C1 C2 C3 ) , A3 = C1 C2 C3 .
由已知数据及概率可加性及乘法公式可计算出
P( A0 ) = 0 .6 × 0 .5 × 0 .3 = 0 .09 ,
P( A1 ) = 0 .4 × 0 .5 × 0 .3 + 0 .6 × 0 .5 × 0 .3 + 0 .6 ×
0 .5 × 0 .7 = 0 .36 ,
P( A2 ) = 0 .4 1 ,
P( A3 ) = 0 .1 4 .
由题意 P ( B | A0 ) = 0 , P ( B | A1 ) = 0 .2 , P ( B | A2 ) = 0 .6 ,
P( B | A3 ) = 1 , 故
3
P( B) = ∑ P( A i ) P( B | Ai )
n= 0
= 0 .09 × 0 + 0 .36 × 0 .2 + 0 .41 × 0 .6 + 0 .14 × 1

= 0 .458 ,
即飞机坠毁的概率为 0 .458 .
3 　试验的独立性和独立重复试验序列
(1 ) 试验的独立性
记随机试验 E( k) 的样本空间为 Ω( k) , 概率空间为 ( Ω( k) , F( k) ,
( k) (1) (2 )
P ) (1 ≤ k≤ n) , 两个试验 E 与 E 相互独立, 粗略地说, 即
(1 ) (1 ) (1 ) (2 ) (2) (2 )
E 中的每个事件 A ∈F 与 E 中的任一事件 A ∈F 相互
独立 .详述如下 .
de f
定义 5 .4 　记 n 个试验 E ( k) 的复合试验为 E E( 1 ) ×
n
d ef d ef
×… ×E ∏ E , 它对应的样本空间为 Ω Ω( 1 ) ×
(2 ) ( n) ( i)
E
i =1
n
d ef
∏Ω
(2) ( n) ( i)
Ω × … ×Ω , 相应的概率空间为 (Ω, F , P) , 其中 :
i=1
n
d ef
∏ Fi ; P 是 ( Ω, F ) 上的概率测度 . ＂ A
( k) ( k)
F ∈F ( 即 E 中仅
i=1
( k)
与第 k 次试验 E ( 1≤ k≤ n) 有关的事件 ) , 如果
( 1) (2 ) ( n) (1) (2 ) ( n)
P( A A …A ) = P( A ) P( A ) … P( A ), ( 5 .7)
则称试验 E( 1 ) , E( 2 ) , … , E( n ) 相互独立 .
注　以上定义中的 F 可以这样理解 : F =σ{ A ( 1 ) × A( 2 ) ×… ×
A ( n) , A( k) ∈F ( k) , 1≤ k≤ n} .
( 1) (2) ( n)
一般地 , 对于可列个试验 E , E , …, E , … , 若其中任意
( n)
有限个相互独立 , 则称{ E , n≥1 }为独立试验序列 .
在这里我们用事件的独立性导出了试验的独立性定义 .
(2 ) 独立重复试验序列
(1) (2) ( n) ( i) ( i)
定义 5 .5 　若 E ,E , …, E 相互独立 , 且 E = E, Ω =
n
∏Ω
( i) n (1 ) (2) ( n)
Ω, Ω = = Ω , 则称 E ,E , …, E 为 n 次独立重复试
i=1
验序列 .若每个试验只关心一个事件 A 的发生与否 ( 例如射击的
中与不中 ) , 则称之为 n 次伯努利试验 .
直观地讲 , n 次独立重复试验序列就是指独立地、重复地进行
同一个试验 n 次 ; 其中每次试验的每个结果不受其他试验结果的
影响 .
例 5 .4 　设某人独立重复的射击 n 次 , 每次击中目标的概率
为 p(0 ≤ p≤1 ) , 求 :
① 给定的 k( 0≤ k≤ n) 次击中目标 , 而其余均未击中的概率 ;
② 恰好击中 k( 0≤ k≤ n) 次 ;
③ 至少有一次击中 .
解　令 Bk 为给定的 k 次击中目标 , 而其余均未击中 ; Ck 为恰
好击中 k 次 ; D 为至少有一次击中 .由独立性知
k n - k
P( Bk ) = p (1 - p) ,
P( Ck ) = Cnk p k ( 1 - p) n - k ,
P( D) = 1 - ( 1 - p) n .
　　例 5 .5 　通信中常采取重复发送信号的办法来减少在接收中
可能发生的错误 .假定发报机只发 0 和 1 两种信号 , 接收时发生错
误 (0 收为 1 或 1 收为 0 ) 的概率为 0 .05 .为减小错误 , 采取每一信
号连发 3 次 , 接收时按数目多的来判定信号 , 求在此情形下判错一
个信号的概率 .
解　每个信号的判定包含连续 3 次信号的接收 , 这 3 次信号
的接收可视为相互独立的伯努利试验 .设 A i =“有 i 次接收错误”
( i = 1 , 2 , 3) , B =“判定信号发生错误”.由题意 P ( B) = P( A2 ) +
P( A3 ) .又 P ( Ai ) = C3i ( 0 .05 ) i ( 1 - 0 . 05 ) 3 - i , 所以 P ( B ) =
2 2 3 3
C3 (0 .05) (1 - 0 .05 ) + C3 (0 .0 5) = 0 .00725 , 因此 , 判错的概率大
大减小了 .
4 　事件的条件独立性
定义 5 .6 　若事件 A , C 及 B 满足
P( AC | B) = P( A | B) P( C | B) , ( 5 .8)
则称 A , C 关于事件 B 条件独立 .
命题 5 .5 　下列命题等价 :
(1 ) A, C 关于 B 条件独立 ;
(2 ) P( A | B C) = P( A | B) ;
(3 ) P( A | B C) = P( A | B) ;
(4 ) P( C| A B) = P( C| B) ;
(5 ) P( C| AB ) = P( C| B) ;
(6 ) A, C 关于 B 条件独立 .
证明　略 .( 有兴趣的读者可作为练习 , 自己证之 , 并考虑是否
还有其他等价命题 .)
(1 ) , (2 ) , (3 ) 说明 A, C 关于 B 条件独立 , 其直观意义是 : 在 B
事件发生的条件下 , C 发生与否不影响 A 发生的条件概率 .
注意　 A , C 关于 B 条件独立 , 一般不能推出 A, C 独立 ; 反之
亦然 .
例 5 .6 　考虑一个电子游戏机 , 它有两个状态“ 1”和“ 2”.记
B =“ 1”, B =“ 2”, Ak 为第 k 次操作游戏机出现成功事件 .已知
P( B) = 0 .3 , P( Ak | B) = 0 .15 , P( Ak | B) = 0 .20 ( k = 1 , 2 ) , 且各次
出现成功与否关于系统状态“1”和“ 2”是条件独立的 , 即
P( A1 A2 | B) = P( A1 | B) P( A2 | B) ,
P( A1 A2 | B) = P( A1 | B) P( A2 | B) .
试求 P( A1 ∪ A2 ) , 并证 A1 , A2 不独立 .
解　 P( Ak ) = P( A k | B) P( B) + P( Ak | B) P( B)
= 0 .15× 0 .30 + 0 .20× 0 .70 = 0 .185 ,
P( A1 A2 ) = P( A1 A2 | B) P( B) + P( A1 A2 | B) P( B)
= P( A1 | B) P( A2 | B) P( B) +
P( A1 | B) P( A2 | B) P( B)
= 0 .0 348 ,
故 P( A1 ∪ A2 ) = P( A1 ) + P( A2 ) - P( A1 A2 ) = 0 .335 .
P( A1 A2 )
P( A1 | A2 ) = = 0 .1878 ≠ 0 .1 850 = P( A1 ) .
P( A2 )
所以 A1 , A2 不独立 .这说明 A1 , A2 关于 B 和关于 B 条件独立 , 不
能保证 A1 , A2 独立 .
例 5 .7 　甲乙两参赛者彼此以对方作为射击目标轮流射击 ,
最先击中对方的射手为胜者 .甲乙彼此及各次射击均相互独立 .甲
每次击中对手的概率为 p1 , 乙每次击中对手的概率为 p2 .假定这
回竞赛由甲参赛者首先射击 .试求每位射手胜出的概率及竞赛将
不断地无限长进行下去的概率 .
解　设 A = 甲参赛者胜出 , B = 乙参赛者胜出 , C = 竞赛无限
长进行下去 , Ak 和 B k 分别表示甲和乙第 k ( k≥ 1) 次击中对方 , 则
显然有
A ∪ B ∪ C = Ω, A = A1 ∪ A1 B1 A2 ∪ A1 B1 A2 B2 A3 ∪ … ,
B = A1 B1 ∪ A1 B1 A2 B2 ∪ … ,
故
∞
P( A) = ∑ [ (1 - p1 ) ( 1 - p2 ) ] n p 1
n= 0
= p1/ [1 - ( 1 - p1 ) (1 - p2 ) ] ,
P( B) = (1 - p1 ) ・ p2 / [ 1 - (1 - p1 ) ( 1 - p2 ) ] ,
P( C) = 0 .
练　习　题
1 .1 　从一副扑克牌的 13 张黑桃中 , 一张接一张地有放回地
抽取 3 张 , 求 :
(1 ) 没有同号的概率 ;
(2 ) 有同号的概率 ;
(3 ) 最多只有两张同号的概率 .
1 .2 　某人有 5 把钥匙 , 但忘了开房门的是哪一把 , 逐把试
开 , 问:
(1 ) 恰好第三次打开房门锁的概率是多少 ?
(2 ) 3 次内打开的概率是多少 ?
(3 ) 如 5 把内有 2 把房门钥匙 , 3 次内打开的概率是多少 ?
1 .3 　从 6 双同样规格不同颜色的手套中任取 4 只 , 问其中恰
有一双的概率是多少 ?
1 .4 　某人写了 n 张信笺与 n 个信封 , 将信笺随便乱装入信封
内 ( 每个信封装一张信笺 ) , 问无一封信匹配的概率是多少 ?
1 .5 　两人约定某日晚 7 点至 8 点在某地会面 , 试求一人要等
另一人半小时以上的概率 .
1 .6 　指出下列各式中哪些成立 , 哪些不成立 , 若成立试证
练习题　 49
明之 .
(1 ) A ∪ B = ( A B ) ∪ B, AB = A ∪ B, A∪ B C = A B C ,
( A B) ( A B) = ;
(2 ) A \ B = A \ A B = ( A∪ B) \ B, A∩ ( B \ C) = A B\ AC;
(3 ) 称 AΔB = ( A \ B) ∪ ( B \ A) 为 A 与 B 的对称差 , 则
AΔB = ( A ∪ B) - AB , 　 AΔ = A, 　 AΔΩ = A;
　　 (4 ) A B, 则 A = A B, B = A∪ B .
1 .7 　盒中有 12 个乒乓球 , 其中 9 个是新的 .第一次比赛时从
中任取 3 个来用 , 比赛后放回盒中 .第二次比赛时再从盒中任取 3
个 , 求第二次取出的球都是新球的概率 .另外 , 如第二次取出的球
都是新球 , 求第一次取到的都是新球的概率 .
1 .8 　设某昆虫生产 k 个卵的概率为
k
pk = λ e - λ , 　 λ> 0 ,
k!
　　又设一个虫卵能孵化为昆虫的概率为 p .若卵能否孵化为虫
是相互独立的 .问此昆虫的下一代有 m 条的概率是多少 ?
1 .9 　某产品 40 件 , 其中有次品 3 件 , 现从中任取 2 件 , 求其
中至少有一件次品的概率 .
1 .10 　袋中有红、黄、白色球各一个 , 每次任取一个 , 有放回地
抽 3 次 , 求下列事件的概率 : A =“ 3 个都是红的”=“ 全红”, B =
“颜色全同”, C =“颜色全不同”, D =“颜色不全同”, E =“无黄”,
F =“ 无红且无黄”.
1 .11 　从一副扑克牌中 , 任意抽出两张 , 问都是黑桃的概率是
多少 ?
1 .12 　从一副扑克牌中 , 任取 13 张 , 求各点彼此不同的概率 .
1 .13 　设有 n 个人 , 问此 n 个人彼此有不同生日的概率是多
少 ? 其中至少有两个人有相同生日的概率是多少 ? ( 设每人出生
在一年 365 日中的每一天的机会是均等的 .)
1 .14 　分别印有 1 , 2 , … , 10 的 10 个球 , 装在一个袋中 , 现从
中任取 3 个 , 问 : 在中间的号码恰为 5 的概率是多少 ?
1 .15 　由盛有号码 1 , 2 , … , N 的球的箱子中 , 有放回地抽了
n 次球 ( 每次一个 ) , 依次记下其号码 .试求 : ( 1 ) 这些号码按严格
上升次序排列的概率 ; ( 2 ) 这些号码按上升 ( 不一定严格上升 ) 次
序排列的概率 .
1 .16 　将 10 个白球 10 个黑球随机分为 10 组 , 每组两球 , 求
每组中恰有一白球一黑球的概率 .
1 .17 　某码头只能容纳一只船 .现预知某日将独立来到两只
船 , 且在 24 小时内各时刻来到的机会均等 .如果它们需要停靠的
时间分别为 3 小时与 4 小时 , 试求有一船要在江中等待的概率 .
1 .18 　在一张打上方格的纸上投一枚直径为 1 的硬币 , 问 : 方
格要多小才能使硬币与网格线不相交的概率小于 0 .01 ?
1 .19 　袋中有 2 个红球 , 3 个黄球 , 5 个白球 , 现有放回地抽取
了 8 次 ( 每次一个 ) .问 : 恰抽到 3 红 3 黄 2 白的概率是多少 ?
1 .20 　在一个袋子里有 n 张带 1 至 n 号码的票 , 我们一张一
张地随机取出票来 ( 不放回 ) , 问 : 至少有一次所取的票号码与次序
数相一致的概率为多少 ?
1 .21 　某人带有两盒火柴 , 每盒 n 根 .每次用时他在两盒中随
机抓一盒 , 从中取出一根 .问 : 遇到一盒空而另一盒剩 r 根的概率
为多少 ( r≤ n) ?
1 .22 　设样本空间 Ω= {ω1 , ω2 , ω3 , ω4 } , A = {ω1 } , B = {ω1 ,
ω2 } , 集类 A = { A, B} .
(1 ) 试用 A, B, Ω 的运算关系表示下列各事件 : A, B 中至少
有一个发生 ; A 不发生 , B 发生 .
(2 ) 写出由集类 A 生成的 σ－域σ( A) 中的所有元素 .
1 .23 　设 Ω= R = ( - ∞ , + ∞ ) , 任取 a∈ R 固定 , 记
A = { x: x ≤ a} , 　 An = { x: x < a + 1/ n} ,
练习题　 51
B = { x: x < a} , 　 Bn = { x : x ≤ a - 1/ n} , 　 n ∈ N \ { 0} .
∞ ∞
证明 : A = n∩ An , B = n∪ Bn .
= 1 = 1
1 .24 　设 Ω= R , 记 :
A1 = { ( - ∞ , a] , a ∈ R } , A2 = { ( a, b] , a, b ∈ R } ,
A3 = { ( a, b) , a, b ∈ R } , A4 = { [ a, b) , a, b ∈ R } ,
A5 = { [ a, b] , a, b ∈ R } .
　　 (1 ) 试用集类 A2 中的元素的运算表示 A1 中的元素 , 用 A1 中
的元素的运算表示 A2 中的元素 ;
(2 ) 证明 : A1 σ( A2 ) , A2 σ( A1 ) ;
(3 ) 证明 : B =σ( A1 ) =σ( A2 ) = σ( A3 ) = σ( A4 ) =σ( A5 ) .
注　称 B 为一维博雷尔 σ－域 , B 中元素称一维博雷尔可
测集 .
1 .25 　设 (Ω, F , P) = ( [ 0 , 1 ] , B[ 0 , 1 ] , P) 是 [ 0 , 1 ] 上的博雷
尔概率空间 ( 见例 2 .17) .记 B = [ 0 , 1] 上有理数全体 , B = [ 0 , 1 ] 上
无理数全体 .试用概率公理化定义与性质求 :
P( (1/ 5 , 1/ 4 ] ) , 　 P( (1/ 5 , 1/ 4 ) ) ,
P( ( 1/ 5 , 1/ 4] ∪ ( 1/ 3 , 1/ 2) ) , 　 P( B) 及 P( B) .
　　 1 .26 　给定概率空间 ( Ω, F, P ) , 设 A , B ∈ F 且 P ( A) =
P( B) = 1 , 试用概率性质求 :
P( A B) , P( AB ) , P( A ∪ B) , P( A ∪ B) .
　　 1 .27 　设甲和乙两同学接连要做 3 次随机试验 , 每人每次试
验均有 2 种可能结果 : 成功和失败 .记 Ak 与 B k 分别表示甲、乙第
k(1≤ k≤3)次试验成功 .已知 : P( A1 ) = P( B1 ) = 0 .6 , P( A2 | A1 ) = 0 .8 ,
P( B2 | B1 ) = 0 .05 , P( A3 | A1 　A2 ) = 0 .98 , P( B3 | B1 　B2 ) = 0 .试分别
求甲成功 ( 至少有一次成功 ) 的概率和乙成功的概率 .
1 .28 　 ( 条件概率全概率公式 ) 设 A, Bn ( n ≥ 1 ) , C∈ F, Bk
∞
( k≥1) 两两互不相容 , A ∪ Bk 且 P ( Bk C) ≠0 .试证 :

k= 1
P( A | C) = ∑ P( B
k= 1
k | C) P( A | Bk C) .
　　 1 .29 　设 A , B 为两事件 , A, B 独立 , 证明下列命题等价 :
(1 ) A 与 B 独立 ; ( 2) A 与 B 独立 ; (3 ) P( A | B) = P( A) ; (4 ) P( A|
B) = P( A) ; ( 5) P( B | A) = P( B) ; ( 6) P( B | A) = P( B) .
1 .30 　设 3 事件 A, B, C 相互独立 , 证明 : A∪ B, A \ B, A B,
A B , A B 均与 C 独立 ; A , B, C 相互独立 .
1 .31 　设 A1 , A2 , A3 , A4 是 Ω的划分 , P( Ak ) = 1/ 4 , 1≤ k≤4 ,
A = A1 ∪ A4 , B = A2 ∪ A4 , C = A3 ∪ A4 .证明 : A, B , C 两两独立 , 但
它们不独立 .
1 .32 　称事件 A, C 关于 B 条件独立 , 若 P ( A C | B ) =
P( A| B) P( C| B) .证此命题与下列命题等价 :
(4 ) P( A | B C) = P( A | B) ;
(5 ) P( A | B C) = P( A | B) ;
(6 ) P( A | B C) = P( A | B) ;
(7 ) P( A | B C) = P( A | B) ;
(8 ) P( A | B C) = P( A | BC) .
试列举其他的等价命题 .
1 .33 　甲、乙两人独立地射击同一目标 , 记 A =“ 甲击中”,
B =“ 乙击中”, 已知 P( A) = 0 .6 , P( B) = 0 .7 , 现甲乙各射击一次 ,
若已知目标被击中 , 求这是被甲击中的条件概率 .
1 .34 　袋中有 10 个球 , 6 白 4 红 , 随机地一个个取出 ( 不放
回 ) , 求在第 4 次首次取到红球的概率 .
1 .35 　试证命题 2 .1 .
1 .36 　试证概率性质 (7 ) 中的 ( 2 .13 ) 式 .
练习题　 53
1 .37 　设 ( Ω, F, P) = 为 [ 0 , 1 ] 上的博雷尔概率空间 ( 见
例 2 .17 ) .令
1 3 1 1 1 1
B2 k - 1 = , + , B2 k = , + ( k ≥ 1) ,
5 8 2k + 1 4 2 2k
试求 :
(1 ) P( B1 ) , P( B2 ) , P( B1 ∪ B2 ) , P( B1 B2 ) , P( B2 \ B1 ) ;
(2 ) P n→
lim B2 n - 1 , n→
lim P( B2 n ) ;
∞ ∞
∞ ∞ ∞ ∞
(3 ) P ∩ ∪ Bn , P ∪ ∩ Bn ;
l = 1n = l l= 1 n= l
(4 ) 试写出包含 B2 的最小 σ－域σ( B2 ) 的所有元素 .

1 .38 　直线段[0 , a]上任意投 3 个点 , 试求自端点至 3 点的 3
线段能构成三角形的概率 .( 3 线段能构成三角形的充要条件是任
意两段长的和大于第三段 ) .
1 .39 　证明 : 对于任意两随机事件 A 和 B , 成立关系式 :
| P( AB ) - P( A) P( B) | ≤ 1/ 4 .
　　 1 .40 　携带 n 枚导弹的一驾轰炸机决定向一目标发射导弹 ,
直至目标被摧毁或 n 枚导弹用完为止 .设每枚导弹击中目标的概
率为 p , 若一枚导弹已击中目标 , 则目标被摧毁的条件概率为 p1 ,
0 < p1 , p < 1 , 且各枚导弹是否击中目标相互独立 .求 :
(1 ) 目标被摧毁后 , 尚有导弹未用完的概率 ;
(2 ) 目标被摧毁后 , 至少还剩下两枚导弹的概率 .
第2章
随机变量及其分布
　　在前一章 , 我们已经讨论了随机数学中一些最基本的概念和

一些最简单的概型中随机事件的概率求解方法 , 并给出了概率的
公理化定义 .这样 , 我们在遇到一些简单的具体的随机事件时 , 可
以先判断其概型 , 然后利用已有知识 , 对其概型特性进行分析 , 求
出概率 .但在实际工作中 , 我们遇到的概率问题往往是错综复杂、
千变万化的 , 并不都是我们熟知的、简单的概型 .为更全面地研究
随机实验结果以揭示随机事件中包含的客观存在的统计规律 , 我
们将随机实验的结果量化 , 这样就引入了“ 随机变量”的概念 .
引入随机变量这个概念后 , 可以用随机变量表示随机事件 , 以
便将不同的随机事件的概率及相互关系进行统一处理 , 而且有助
于研究随机事件的本质规律 .更为重要的是它极大地丰富了研究
对象与范围 , 它可以解决涉及人类生活中更为广泛的理论与应用
的问题 .随机变量是随机数学中最重要的基本概念之一 .
2 .1 　随机变量
1 　随机变量
　　先给出一些直观例子
例 1 .1 　投篮时会出现两种情况 : ω1 =“投中”, ω0 =“ 未投
中”.于是 Ω= {ω0 ,ω1 } .我们若用数字 1 代表投中 , 用 0 代表未投
中 .这样便将实验结果量化了 , 同时引入了一个变量 X, 就是
2 .1 随机变量　 55
1, ω = ω1 ,
X = X(ω) =
0, ω = ω0 .
X(ω) 随实验结果 ω不同而取不同的值 , 由于实验结果 ω∈ {ω0 ,
ω1 }的出现是随机的 , 因此 X(ω) 的取值也是随机的 , X (ω) 是随机
变量 .
例 1 .2 　在某学校中 , 随机地抽取一人 ω, 用对应的卡片 ω登
记他的身高 L (ω) , 将这些卡片放在一起 , 若从中随机地取出一张
卡片 , 那么 L(ω) 的取值随实验结果 ω的不同而不同 , 因而 L (ω)
取值也是随机的 , L(ω) 也是随机变量 .
定义 1 .1 　设 E 为随机试验 , 样本空间 Ω= {ω}为有限集或可
列集 , 若对每个样本点 ω∈ Ω, 都有一个实数 X ( ω) 与其对应 , 即
X(ω) 是定义在 Ω 上取值在 R 上的单值实值函数 ( 映射 ) , 简记
X(ω) : Ω→ R , 称 X ( ω) 为随机变量 ( random va riable , 简记作
r .v .) .
可以用随机变量 X 描述事件 , 例如在例 1 .1 中随机变量 X 取
值 1 , 记 {ω: X(ω) = 1}或简记为 { X = 1} , 就表示事件{ 投篮命中} .
例 1 .3 　某射手进行射击训练 , 他每次射中目标的概率是 p,
且各次射击是否击中相互独立 .如果射手只射击了 n 次 , 记这 n 次
射击命中目标的次数 X , 那么 X 就是一个随机变量 .如果他开始
射击 , 直到第一次命中目标后停止射击 , 记他首次命中目标时的射
击次数为 Y , Y 也是一个随机变量 .
前面对随机变量只在样本空间为有限集或可列集时给出粗略
的定义 , 其确切的定义需要用到博雷尔 σ－域的知识 .下面我们先
来说一下什么是博雷尔 σ－域 ( 有关博雷尔集的知识在第 1 章中已
有介绍 ) .
2 　博雷尔 σ－域与概率空间
(1 ) 设 Ω= R , 考虑R 中右半闭的无穷区间 ( - ∞ , a] , 全体这
56 　第 2 章随机变量及其分布
样的区间构成的集类 A, 即 A = { ( - ∞ , a] ; a∈R } , 称由 A 生成
的 σ－域σ( A) 为博雷尔σ－域 , 通常记为 B .B 中的集称为博雷尔集 .
设 g( x ) 是定义在 R 上的单值实函数 , 如果对任意 a∈ R , 有
( x: g( x) ≤ a) ∈B, 则称 g( x ) 为博雷尔可测函数 , 或 B －可测函数 .
(2 ) 设 Ω= R n , n 为任一正整数 , R n 中的右半闭无穷区间记为
n
∏( - ∞, a ]
i=1
i , 它是一个 n 维点集 .全体这样的区间构成 R n 中的集
类 A:
n
A = ∏( -
i=1
∞ , ai ] , ai ∈ R , i = 1 , 2 , … , n ,
d ef
称由 A 生成的 σ－域为 n 维博雷尔σ－域 , 通常记为 Bn σ( A ) ,
Bn 中的集称为 n 维博雷尔集 .
n
设 g( x1 , x2 , … , xn ) 是定义在R 上的单值实函数 , 如果对任
n
意实数 a, 有{ g( x1 , x2 , … , xn ) ≤ a}∈B , 则称 g( x1 , x2 , … , xn )
为 n 元博雷尔可测函数 , 或 Bn －可测函数 .
对于一般的概率空间 (Ω, F , P) , 同样可以给出定义在 Ω上取
值在R 上的实函数 X(ω) , 但是注意到引出 X (ω) 的一个重要目的
是为了用它统一表示我们关心的事件 , 并能够定义其概率 .为此 ,
要求 X(ω) 具有某些良好的性质 , 即对＂ a∈ R , 有 {ω: X(ω) ≤ a} ∈
F, 我们称满足此性质的 X(ω) 为 (Ω, F, P) 上的随机变量 .
3 　随机变量的严格定义
随机变量的确切定义如下 .
定义 1 .2 　设 ( Ω, F, P) 是一个概率空间 , X (ω) 是定义在 Ω=
(ω) 上的一个实值函数 .如果对＂ a∈R , 有
{ω: X(ω) ≤ a} ∈ F , ( 1 .1)
则称 X(ω) 为 ( Ω, F, P) 上的随机变量 .
几点说明 :
2 .1 随机变量　 57
(1 ) (ω: X(ω) ≤ a) 是指所有满足 X (ω) ≤ a 的样本点 ω 的集

合 .定义要求 (ω: X≤ a) ∈F , 即 (ω: X(ω) ≤ a) 是 (Ω, F , P) 的一个事
件 , 因而可定义它的概率 .
(2 ) 定义中 ω为自变量 , 为了书写方便 , 简记 (ω: X(ω) ≤ a) =
( X≤ a) = ( X∈ ( - ∞ , a] ) , 以下把 X(ω) 记为 X .一般随机变量符
号用大写字母 X, Y , Z 等表示 .
(3 ) X (ω) 满足 ( 1 .1 ) 式 , 则容易验证 : ＂ a, b∈ R 且 a≤ b,
( X > a) , ( X < a) , ( X = a) , ( a < X≤ b) , ( a≤ X < b) , ( a < X <
b) , ( a≤ X≤ b) ∈F ( 见练习题 ) .
(4 ) 定义在 ( Ω, F ) 上的随机变量 X(ω) , 有时称 X (ω) 是可测
空间 (Ω, F ) 到 ( R , B ) 的可测映射 .
例 1 .4 　设 A 为任一事件 , A∈F , I A (ω) 为事件 A 的示性函
数 .由于它满足
∈ F, 当 x < 0 时,
{ I A (ω) ≤ x} = A ∈ F, 当 0 ≤ x < 1 时,
Ω∈ F, 当 x≥1时 .
所以 I A (ω) 是一个随机变量 .
例 1 .5 　设 Ω= {ω1 ,ω2 ,ω3 }
X (ω) ω1 ω2 ω3
P 1/ 6 1/ 3 1/ 2
　　解　设 X (ω1 ) = 2 , X ( ω2 ) = 4 , X (ω3 ) = 5 .则上表可变成
下表 :
X (ω) = i 2 4 5
P(ω: X(ω) = i) 1/ 6 1/ 3 1/ 2
由上表可见 :
P( X(ω) ≤ 1) = 0 ,
1
P( X(ω) ≤ 3) = P( X(ω) = 2) = ,
6
P( X(ω) ≤ 4) = P( X(ω) = 2) + P( X(ω) = 4 )
= 1 + 1 = 1 ,
6 3 2
P( X(ω) ≤ 5) = P( X(ω) = 2) + P( X(ω) = 4 ) +
P( X(ω) = 5)
= 1 + 1 + 1 = 1,
6 3 2
P( X(ω) ≤ 10) = 1 .
　　例 1 .6 　若 ( Ω, F ) 中的 F = { , A , A , Ω} . A∈F 而 A1 ｜ F, 容
1
易验证 A1 的示性函数 I A 1 (ω) 使 I A1 ≤ ｜ F, 故 I A1 (ω) 对 F =
2
{ , A , A, Ω} 而言不满足随机变量的定义 .
例 1 .7 　 ( Ω, F ) , 设 { Bk } ( 1 ≤ k < ∞ ) 是 Ω 的一个分解 , 即
∞
Bk B l = ( k≠ l) ; k∪ Bk = Ω 且 B k ∈ F( 0 ≤ k < ∞ ) , 定义 X(ω) =
=1
∑x
k= 1
k I B k (ω) , 则容易验证 X(ω) 是随机变量 .
注意　＂ a∈R , {ω: X(ω) ≤ a}∈F .可见随机变量的概念 , 是

对已给的 ( Ω, F, P) 中的 σ－域 F 而言的 .对于只含有穷或可列多
个样本点的 Ω, 通常取 F 是由 Ω中的全体子集构成的 σ－域 , 则定
义在 Ω上的实函数均是随机变量 .
在第 1 章中 , 我们定义了什么是由集类生成的 σ－域 , 引出随
机变量以后 , 我们自然要问 , 什么是由随机变量生成的 σ－域 ?
定义 1 .3 　设 X 是一随机变量 , 则称 σ( X) =σ(ω: X(ω) ≤ a,
＂ a∈R ) 为由 X 生成的σ－域 .
例如 : 由示性函数 I A 生成的σ－域为 :σ( I A ) = { , A, A, Ω} .
2 .1 随机变量　 59
附　以下命题初学者看时只需了解结论即可 , 证明可先略去

不看 , 这不影响本书的学习 .
命题 1 .1 ＊　对任意 x∈R , ( X (ω) ≤ x ) ∈F 成立的充要条件
是 : 对任意 A∈B, 有 ( X(ω) ∈ A) ∈F .
证明　充分性 : 设 ( X(ω) ∈ A) ∈F 对任一 A∈B 成立 .取 A =
( - ∞ , x]∈B 即得 : ( X(ω) ≤ x ) ∈F , 对 x∈R 成立 .
必要性 : 令 L = { A: A∈ B, ( X (ω) ∈ A) ∈ F } , 即 L 是由 B
中一切使 ( X ( ω) ∈ A) ∈ F 成立的 A 构成的集类 .由 L 定义 , 有
L B .这样为证 L = B .只需证 L B, 为此只需证 L 是包含 A =
{ ( - ∞ , x] , x∈R }的 σ－域 .
下证 L 是 σ－域 : 事实上 , R ∈B, ( X(ω) ∈R ) = Ω∈F , 故 R ∈
L ; 其次 , 若 A∈L, 则 A∈B .且 ( X(ω) ∈ A) ∈F; 因 B 是σ－域 , 所以
A = R - A∈B; 再注意 F 是 σ－域 , 得{ X(ω) ∈ A} = { X(ω) ∈ A} ∈
F, 所以 A 也满足上述两个条件 , 从而 A∈L, 知 L 对余封闭 .又设
∞
A i ∈L( i = 1 , 2 , … ) , 即 Ai ∈ B, ∪ { X (ω) ∈ Ai } ∈F; 又 B 及 F 是

i=1
∞ ∞ ∞ ∞
σ－域 , 得 i∪ Ai ∈B, X(ω) ∈ i∪ Ai =∪ { X(ω) ∈ A i } ∈F, 故∪ Ai ∈

=1 =1 i=1 i=1
L , 所以 L 是包含R 的 σ－域 .再证 L 包含 A = { ( - ∞ , x] , x∈ R } ,

因为＂ x∈R , { X(ω) ∈ ( - ∞ , x] } = { X(ω) ≤ x} ∈F, 所以 ( - ∞ ,
x] = A 满足 : A∈B 且 { X(ω) ∈ A}∈F, 所以 ( - ∞ , x]∈L .这样便
证明了 L 是包含 A = { ( - ∞ , x] , x ∈ R } 的 σ－域 .由第 1 章例
2． 14 知 B 是包含 A 的最小 σ－域 , 于是 L σ( A ) = B, 得 L = B .
综上引理得证 .
常用的随机变量有两类 : 一类是离散型随机变量 , 另一类是连
续型随机变量 .下面两节将介绍这两类随机变量 .
2 .2 　离散型随机变量
1 　定义
　　定义 2 .1 　如果随机变量 X(ω) 所有可能取值是有限个或可

列多个 , 则称 X (ω) 为离散型随机变量 ( disc rete r andom va riable
简写作 d .r .v .) .
如例 1 .1 中的 X 和例 1 .3 中的 X 与 Y 都是离散型随机变量 .
刻画离散型随机变量 X 的特性 , 不仅要知道它的可能取值 , 更要
知道它取各值的概率 .
定义 2 .2 　设离散型随机变量 X (ω) 所有可能取的值为 xk ,
k∈ N\ {0 } , X(ω) 取各个值的概率为
P{ X = xk } = pk , 　 k ∈ N \ { 0} , ( 2 .1)
称 P{ X = xk } = pk ( k∈N \ {0 } ) 为离散型随机变量 X (ω) 的概率分
布或分布律 .
离散型随机变量 X (ω) 的概率分布反映了它取各种可能值的
概率分配 , 包含了它的全部概率信息 .由概率定义 , 易知 p k 满足如
下两个条件 :
(1 ) pk ≥0 , 　 k∈N \ {0 } ( 非负性 ) ,
∞
( 2 .2)
(2 ) ∑ p k = 1 　 ( 规一性 ) .
k= 1
可以这样理解分布律 , 将质量 1 分布在各个质点上 , xk 点处的

质量为 p k , 如图 2 －1 .
图　 2－1
2 .2 离散型随机变量　 61
分布律也可以用如下表格形式来表示 :
X x1 x2 x3 … xk …
Pk p1 p2 p3 … pk …
2 　几种重要的离散型随机变量的概率分布
(1 ) 两点分布
定义 2 .3 　若随机变量 X 只取 1 和 0 两个值 , 且 P( X = 1 ) =
p , P( X = 0) = 1 - p(0≤ p≤1) , 则称随机变量 X 服从参数为 p 的
两点分布 , 简记为 : X～ B( 1 , p) .
若事件 A 发生随机变量 X 取 1 , 否则 X 取 0; 即
　
1, ω∈ A , 　
＂ A ∈ F, X(ω) = I A (ω) =
0, ω｜ A .　　
则 P( A) = P{ I A (ω) = 1 } = p, P( A) = P{ I A (ω) = 0 } = 1 - p; 可见
示性函数可用来描述某随机事件发生与否 .
例 2 .1 　 200 件产品 , 190 件是合格的 , 10 件是不合格的 , 现从
中任取一件 , 若规定
　
1 , 　若取得合格产品 , 　
X = 　
0 , 　若取得不合格产品 . 　
则 X 服从参数为 0 .95 的两点分布 .
两点分布是最简单的一种分布类型 , 它可描述一切只有或只
关心两种可能结果的随机事件 .比如产品合格与不合格 , 新生婴儿
是男是女 , 比赛中的胜与负 , 电信号的正与负 , 种子是否发芽等 .
(2 ) 二项分布 ( binomial dist ribu tion )
以 X 表示 n 重伯努利试验中 A 发生的次数 , 易知 X 是一个
随机变量 , 其可能取值为 0 , 1 , 2 , … , n .由于各次试验相互独立 , 故
k k n - k
在 n 次试验中 A 发生 k 次的概率 P( X = k) = C n p ( 1 - p) (k=
0 , 1 , 2 , … , n) .
定义 2 .4 　若随机变量 X 满足 :
k k n- k
P( X = k) = C n p ( 1 - p) , 　 k = 0 , 1 , 2 , … , n, ( 2 .3)
则称随机变量 X 服从参数为 ( n, p) 的二项分布 , 又称为伯努利分
布 , 简记 X～ B( n, p) .
根据上面的定义 , 显然有
P( X = k) ≥ 0( 非负性 ) ;
n
∑C = ( p + q) n = 1( 规一性 ) , 其中 q = 1 - p .
k
p k qn - k
n
k= 1
特别地 , 当 n = 1 时 , 二项分布化为 : P( X = k) = pk q1 - k ( k = 0 , 1 ) ,
这就是两点分布 .可见 , 两点分布是二项分布的一个特例 .
例 2 .2 　某人进行射击训练 , 每次射中的概率为 0 .0 2 , 独立射
击 400 次 , 求至少击中 1 次的概率 .
解　将每次射击看作一次独立试验 , 则整个试验可看作一个
400 次的伯努利试验 .设击中的次数为 X , 则 X～ B( 400 , 0 .02 ) , X
的分布率为
k k 40 0 - k
P( X = k) = C400 0 .02 0 .98 , 　 k = 0 , 1 , 2 , … , 400 .
则所求概率为 : P( X≥1) = 1 - P( X = 0) = 1 - 0 .98400 ≈ 0 .9997 .
这个例子的实际意义十分有趣 .这个射手每次命中的概率只
有 0 .02 , 绝不是个天才 , 但他坚持射击 400 次 , 则击中目标的概率
近似为 1 , 几乎成为必然事件 .这正说明了 “
, 只要功夫深 , 铁杵磨
成针”.不要因为成功的希望小而放弃 , 只要我们锲而不舍地努力 ,
就一定会到达理想的彼岸 .这一道简单的概率题中蕴含着深刻的
哲理 : 有志者事竟成 !
上例中 , 直接计算 P( X = k) 相当麻烦 , 下面我们介绍一个当 n
相当大 , p 很小时二项分布概率的近似公式 , 这就是二项分布的泊
松逼近 .
定理 2 .1( 泊松定理 ) 　设 λ> 0 是一个常数 , n 是任一正整数 ,
设 pn = λ/ n, 则对任一固定的非负整数 k, 有
λk e - λ
lim Cnk p nk (1 - pn ) n - k = . ( 2 .4)
n→ ∞ k!
λ
　　证明　因为 pn = , 所以
n
k n- k
n( n - 1 ) … ( n - k + 1 ) λ 1 - λ
k k n - k
C p (1 - pn )
n n =
k! n n
λk 1
= 1・ 1 - 1 - 2 …
k! n n
n - k
1 - k - 1 1 - λ 1 - λ .
n n n
对任一固定的 k, 当 n→∞时
n - k
1 - λ →e , -λ
1 - λ → 1,
n n
1 2 k - 1
1 - 1 - … 1 - → 1,
n n n
k -λ
λe
故li k k n- k
m C p (1n- pnn ) = .证毕 .
n→ ∞ k!
由于 npn = λ( 常数 ) , 所以 n→∞时 pn →0 .因此当 n 很大 p n 很
小时 , 有近似公式
k -λ
k k n- k λe
C p ( 1 - pn )
n n ≈ ,
k!
其中 λ= n pn .
在例 2 .1 中 ,λ= n p = 400× 0 .02 = 8 , 故
0 -λ
P( X = 0 ) = λ e = e - 8 ,
0!
λ1 e - λ
P( X = 1 ) = = 8e - 8 ,
1!
P( X ≥ 2 ) = 1 - P( X = 0) - P( X = 1 )
- 8 -8
=1 - e - 8e ≈ 0 .997 .
　　例 2 .3 　为了保证设备正常工作 , 需配备适量的维修工人 .现
有同类型设备 300 台独立工作 , 发生故障的概率都是 0 .01 .在通
常情况下一台设备的故障可由一个人来处理 .问至少需要多少人

才能保证当设备发生故障时 , 不能及时维修的概率小于 0 .01 ?
解　设至少需配备 N 人 , 同一时刻发生故障的设备有 X 台 ,
那么 X～ B( 300 , 0 .01 ) .依题目 , 要求的 N , 应使
P{ X ≥ N} < 0 .01 .
∞ k - 3
3 e
根据泊松定理 (λ= n pn = 3 ) , 得 P{ X > N} = ∑
k = N +1 k!
.所以 N
∞ k -3
3 e < 0 .0 1 , 通过查表 , 可知满足上式的 N > 8 , 因
应满足 ∑
k= N +1 k!
此至少需 9 人 .
(3 ) 泊松分布
定义 2 .5 　若随机变量 X 满足
λk e - λ
P{ X = k} = , 　 k ∈ N = {0, 1, 2, …} , ( 2 .5)
k!
其中 λ> 0 是常数 , 则称 X 服从参数为 λ的泊松分布 , 记为 X ～
P o(λ) .
由定义易知
λk e - λ
P{ X = k} = ≥ 0, 　 k ∈ N ;
k!
∞ ∞ k -λ ∞ k
λe = e- λ λ = e - λeλ = 1 ,
∑
k= 0
P{ X = k} = ∑k= 0 k! ∑k= 0 k !
可见 P{ X = k}满足概率分布的条件 .
在信息通信、计算机网络、生物学、医学、工业管理及公用事业
的排队等问题中 , 泊松分布是常见的 .例如一“服务台”在给定时间
上到达的“顾客”数 , 容器内微生物数 , 玉器上的疵点数 , 交换台的
电话呼唤次数等 , 大多服从泊松分布 .由泊松分布引出的泊松信号
流是随机过程的一个重要分支 , 对它的详细阐述见第 6 章 .
例 2 .4 　自 1875 年至 1955 年中某 63 年间 , 某市夏季 ( 5 —
9 月 ) 共发生暴雨 180 次 .每年夏季共有 n = 31 + 30 + 31 + 31 +
30 = 153 天 .每次暴雨以 1 天计算 , 每天发生暴雨的概率则为 p =

180/ (63× 153 ) , 这个值很小 .但 n = 153 很大 .应用泊松分布 , 在
一个夏季发生 k 次暴雨的概率 p k 为
k - 2 .9
2 .9 e 180
pk = 　 λ= np k = 153 × ≈ 2 .9 .
k! 63 × 153
　　我们可通过下表来看计算值与实际观测之间相符合的情况 .例
如, 发生两次暴雨的实际有 14 个夏天, 计算值为 14 .8 个 .基本相符 .
暴雨次数 0 2 4 6 8
实际年数 4 14 10 2 1
理论年数 3 .5 14 .8 10 2 .9 0 .42
　　 (4 ) 几何分布 ( geomet ric dist ribution)

定义 2 .6 　若离散型随机变量 X 取值正整数 , 且满足
k- 1
P{ X = k} = (1 - p) p, 　 k = 1 , 2 , … , 　 0 ≤ p ≤ 1 ,
( 2 .6)
则称随机变量 X 服从参数为 p 的几何分布 , 记为 X～ G( p) .
在伯努利独立重复试验中 , 若事件 A 在一次试验中出现的概
率为 p , 即 P ( A ) = p .记 X 为首次发生 A 的试验次数 , 则 X ～
G( p) .
几何分布具有一个极特殊的性质———无记忆性 .我们假设在
前 n 次试验中事件 A 均未发生 , 则可证明 , 在此条件下 , 从第 n + 1
次试验起到首次 A 发生的第 X 次试验 , 仍服从几何分布 , 与 n 无
关 , 即 : ＂ n∈N \ {0 } , 有
k
P( X = n + k | X > n) = P( X = k) = (1 - p) p ,
k = 1, 2,…, ( 2 .7)
这就是几何分布的无记忆性 .
可以证明 , 在离散型分布中 , 只有几何分布才具有无记忆性
( 证明略 , 见习题 ) .
3 　离散型随机变量的分解与表示

∞
给定 (Ω, F, P) , 若 An ∈F, n∈ N \ { 0 } 两两不交 , 且 ∑A
n=1
n =
Ω, 即{ An , n≥ 1 } 是 Ω 的一个分解 , an ∈ R , n ∈ N \ { 0 } ; 易证 :
∞
X(ω) = ∑a I
n= 1
n A
n
(ω) , ω∈Ω为离散型随机变量 .反之 , 对于任一
离散型随机变量 X , 若其分布律为 : P ( X = xk ) ( k∈ N \ { 0 } ) , 记
def
Bk ( X = xk ) ∈F( k∈N \ {0 } ) , 则 X(ω) 可以表示为
∞
X(ω) = ∑x
k= 1
k I B k (ω) , 　 ω∈ Ω . ( 2 .8)
这说明对于任一离散型随机变量 , 总可以分解为互不交的事件的
示性函数的线性组合 .
定义 2 .7 　形如 ( 2 .8 ) 式定义的函数 , 称为 ( Ω, F ) 上的简单
函数 .
例 2 .5 　二项分布可用示性函数表示 .
若随机变量 X(ω) ～ B( n, p) , Bk = { X = k} ( 0≤ k≤ n) , 则
n n
X (ω) = ∑ k・ I
k= 0
{ X = k} (ω) = ∑ k・ I
k=0
B
k
(ω) .
　　用示性函数的线性组合表示离散型随机变量这种分解的思想
与方法在随机数学 , 特别是现代随机数学中起着巨大的作用 .
2 .3 　连续型随机变量
1 　定义
　　定义 3 .1 　若对于随机变量 X , 存在一定义在 R 上的非负函
2 .3 连续型随机变量　 67
数 f ( x) , 使对＂ L∈B, 满足
P( X ∈ L) = ∫ x∈ L
f ( x) d x, ( 3 .1)
则称 X 为连续型随机变量 , 简记为 : c .r .v .; 其中函数 f ( x) 称为 X

的概率密度函数 , 简称概率密度 ( probability den sit y function , 简
记为 p .d .f .) .
注意　由定义可看出 , 概率密度函数不是唯一的 .因为若
f ( x) 是随机变量 X 的概率密度函数 , 如在有限个点上或可列个点
上改动它的值为另一非负数 , 记为 g( x ) , 则两者在同一 L 上的积
分值相同 , 因而 g( x ) 亦是 X 的概率密度函数 .
可以证明定义 3 .1 与下列定义 3 .2 等价 ( 证明参看命题 1． 1
的证明 ) .
定义 3 .2 　若对于随机变量 X , 存在一定义在 R 上的非负函
数 f ( x) , 使对＂ a∈R , 满足
a
P( X ≤ a) = ∫ -∞
f ( x) d x,
则称 X 为连续型随机变量 , f ( x) 为 X 的概率密度函数 .
由定义易知 , 概率密度具有下列性质 :
(1 ) f ( x ) ≥0 　 ( 非负性 ) ;
+∞
∫
(2 )
- ∞
f ( x ) d x = 1 　 ( 规一性 ) ;
b
(3 ) P( a < X ≤ b) = ∫ f ( x ) d x , 　 ( a≤ b) ;
a
(4 ) 如果随机变量 X(ω) 有概率密度 f ( x ) , 则 P{ω: X (ω) =

a} = 0 ( ＂ a∈R ) ;
证明
1 1
P{ω: X(ω) = a} = nlim P a - < X ≤ a+
→+ ∞ n n
1
a+
n
= nlim
→+ ∞∫ a- 1
n
f ( x) d x = 0 .
　　可见 , 概率为 0 的事件不一定是不可能事件 .
(5 ) 若 f ( x ) 在 x 处连续 , 则
P( x < X ≤ x + h)
f ( x ) = lim , (3 .1a)
h→ 0 h
即
P( x < X ≤ x + h) = f ( x ) h + o( h) , ( 3 .1b)
o( h)
其中 o( h) 是 h 的高阶无穷小 , 即 lim =0 .
h→ 0 h
有些随机变量的概率密度函数直接求解较为困难 , 此时可通
过求微小区域上的概率的主要部分 ( 见 ( 3 .1b ) 式 ) 来求 f ( x ) , 这种
求解概率密度的方法称作微元法 .它是一种重要的方法 , 利用它可
以使一些复杂问题得到简单明了的解决 , 读者在以后的学习中将
会逐步地体会到这一点 .
由定义 3 .1 及 f ( x ) 的性质可知 , X 的概率密度函数给出了
X (ω) 的所有概率特性 .
- 3x
例 3 .1 　设随机变量 X 具有概率密度 f ( x ) = ke I ( x≥0 ) , 试
确定常数 k, 并求 P( X > 0 .1) .
∞
解　由 ∫ -∞
f ( x) d x = 1 , 解得 k = 3 , 于是 X 的概率密度为 :
f ( x) = 3e - 3 x I ( x≥ 0 ) , 所以
∞ ∞
∫ ∫
-3x
P{ X > 0 .1} = f ( x) d x = 3e d x = 0 .7408 .
0 .1 0 .1
2 　几种连续型随机变量的分布
(1 ) 均匀分布
定义 3 .3 　若连续型随机变量 X 具有概率密度
1 , x ∈ [ a, b] , 　 a < b,
f ( x) = b- a ( 3 .2)
0, 其他 .
则称 X 在区间[ a, b]上服从均匀分布 ( uniform dist ribution) , 记作

X～U[ a, b] .
由定义可知 , 在区间 [ a, b] 上服从均匀分布的随机变量 X , 落
在[ a, b] 上的任一子区间的概率只依赖于子区间的长度而与子区
间的位置无关 .事实上 , 对于任一长度为 l 的子区间 ( c, c + l) , a≤
c+ l
1 l
c < c + l≤ b, 有 P{ c < X ≤ c + l} = ∫ c b- a
dx =
b - a
.
def x
记 F( x) P( X≤ x ) =∫ - ∞
f ( t) d t, 可得
0, x < a,
x - a
F( x) = , a ≤ x ≤ b,
b - a
1, x > b,
f ( x) , F( x) 的图像分别如图 2 －2 , 图 2 －3 所示 .
图　 2－2 图　 2 －3
例 3 .2 　设电阻 R 是一随机变量 , 均匀分布在 900Ω～ 1100Ω,

求 R 的概率密度及 R 落在 950Ω～1050Ω 的概率 .
解　由题意 , R 的概率密度为
1
, 900 < x < 1100 ,
f ( r) = 1100 - 900
0, 其他 .
10 50
1
所以 P{950 ≤ R ≤ 1050 } = ∫95 0 200
d r = 0 .5 .
　　 (2 ) 正态分布
定义 3 .4 　若连续型随机变量 X 的概率密度为
2
1 - ( x -μ)
f ( x) = e 2σ2 , 　 - ∞ < x < + ∞ , ( 3 .3)
2πσ
其中 μ,σ为常数且 σ> 0 , 则称 X 服从参数为 (μ,σ2 ) 的正态分布
2
( normal distri bution) 或高斯 ( Gau ss ) 分布 , 记为 X～ N(μ,σ ) .
f ( x) 的图像如图 2 －4 所示 .
图　 2－4
f ( x) 具有以下性质 :
① 关于 x = μ对称 .这表明对于任意 h > 0 , 有
P{μ - h < X ≤ μ} = P{μ< X ≤ μ+ h} .
1
　　 ② 当 x = μ时 , f (μ) = , 取得最大值 . f ( x ) → 0 ( x→
2πσ
±∞ ) , 曲线以 x 轴为渐近线 .对于同样长度的区间 , 当区间离 μ
越远 , X 落在这个区间上的概率越小 .
③ f ( x) 在 x = μ±σ处有拐点 .
④ σ越大 , f ( x ) 的图像越“ 胖”, 表明取值较分散 ; σ越小 ,
f ( x) 的图像越“瘦”, 表明取值较集中 .
⑤ f ( x) 存在 n 阶连续导数 .
+∞
⑥∫ -∞
f ( x) d x = 1 ( 规一性 ) .
证明　只证性质⑥ .其他性质的证明留给读者作为练习 .
+∞ 2
1
∫
- ( x -μ)
记 I = e 2σ d x , 即证 I = 1 .因 I 非负 , 只需证
2
-∞
2πσ
2
I =1 .
+∞ 2 +∞ 2
1 - ( t - μ) 1 - ( s- μ)
∫ ∫
2
I = e 2σ d t 2
e 2σ ds 2
- ∞
2πσ - ∞
2πσ
+∞ +∞ 2 2
1 - ( t - μ) + ( s- μ)
=
2πσ2 ∫∫ -∞ -∞
e 2σ
2
d td s .
t-μ s-μ
令 x= , y= , 又令 x = ρsinθ, y = ρcosθ(ρ> 0 , 0≤θ< 2π) ,
σ σ
则
+∞ +∞ 2 2 2π +∞ 2
1 1 -ρ
∫∫ ∫∫
2 - x +y
I = e 2
d xd y = e 2
ρdρdθ= 1
2π - ∞ - ∞ 2π 0 0
得证 .
特别地 , 若 X～ N (0 , 12 ) , 即 X 服从参数μ= 0 ,σ= 1 的正态分
布 , 则称 X 为标准正态分布 ; 称
1 - x 2/ 2
φ( x) = e ( 3 .4)
2π
为标准正态概率密度函数 ; 称
x x
1
∫ ∫
- t2/ 2
Φ( x ) = P( X ≤ x ) = φ( x) d x = e dt
-∞ - ∞
2π
( 3 .5)
为标准正态分布函数 .对于 Φ( x ) 的值 , 可通过查表得到 ( 见附录
1) .易知 Φ( - x ) = 1 - Φ( x ) .
例 3 .3 　 X 服从标准正态分布 , 求 P{ | X | ≤1 } , P{ | X | ≤2 } ,
P{ | X | ≤3 } .
解　
P{ | X | ≤ 1 } = P{ - 1 ≤ x ≤ 1} = Φ( 1) - Φ( - 1 )
= Φ( 1) - [ 1 - Φ( 1) ] = 2Φ( 1) - 1
= 0 .6826 .
同样
P{ | X | ≤ 2 } = Φ(2 ) - Φ( - 2 ) = 0 .9545 ,
P{ | X | ≤ 3 } = Φ(3 ) - Φ( - 3 ) = 0 .9973 .
　　一般地 , 若 X～ N(μ, σ2 ) , 则只要通过一个适当的线性变换就
能将它化成标准正态分布 , 此过程也称作对随机变量 X 进行标
准化 .
2 X -μ 2
引理 3 .1 　若 X～ N (μ,σ ) , 则 Z = ～ N( 0 , 1 ) .
σ
X -μ
证明　由 Z = ,故
σ
μ+σx
( t - μ) 2
1
P{ Z ≤ x} = P{ X ≤ μ+ σx } = ∫
-
e 2σ2 d t
2πσ -∞
t - μ
令 = u
σ 1 x
u2
∫ d u = Φ( x) .
-
e 2
- ∞
2π
X -μ 2
由此 Z = ～ N( 0 , 1 ) .证毕 .
σ
这样 , 就可以利用标准正态分布来表示一般的正态分布函数 .
2
若 X～ N (μ, σ ) , 对于任意区间 ( a , b] 有
b- μ a - μ
P{ a < X ≤ b} = Φ - Φ , ( 3 .6)
σ σ
查表即可得概率值 .
对于标准正态分布随机变量 , 引入 α分位点的定义 .
定义 3 .5 　设 X ～ N ( 0 , 12 ) 若 Zα 满足条件 P { X > Zα } = α
(0 <α< 1) , 则称点 Zα 为标准正态分布上的α分位点 .
在自然现象和社会现象中 , 大量的随机变量都服从或近似服
从正态分布 .例如 , 海洋波浪的高度 , 一个地区成年男子的身高 , 生
产条件不变的许多产品的某些量度都服从正态分布 .正如二项分
布主要产生于伯努利试验 , 泊松分布主要产生于泊松流 , 正态分布
早期来源于测量误差分析 .在概率论中和数理统计的理论研究和
实际应用中 , 正态分布都占有重要地位 .
(3 ) 指数分布
定义 3 .6 　若连续型随机变量 X 的概率密度函数为
f ( x ) = λe - λx I ( x ≥ 0 ) , ( 3 .7)
其中 λ> 0 为常数 , 则称 X 服从参数为λ的指数分布 ( exponen tial
dist ribu tion ) , 记作 X～ Ex(λ) .
指数分布的两个重要性质 .
性质 1( 无记忆性 ) 　对＂ s, t > 0 , 有
P{ X > t} = P{ X > s + t | X > s} .
　　证明　左 = P{ X > t} = 1 - P{ X≤ t} = e - λt ,
P{ X > s, X > t + s} P{ X > t + s}
右= =
P{ X > s} P{ X > s}
- λ( s+ t)
e - λt
　 = - λs =e ,
e
所以
P{ X > t} = P{ X > s + t | X > s} .
　　为讨论指数分布的另一重要性质 , 先给出以下的定义 .
定义 3 .7 　设 X(ω) 为非负随机变量 ( 可理解为一元件的工作
寿命 ) , ＂ t≥0 , 若
P( t < X ≤ t + h | X > t)
lim = H ( t)
h→0 h
存在 , 则称 H ( t) 为 X 在 t 时刻的瞬时失效率 .
性质 2( 无老化性 ) 　瞬时失效率为常数 , 且 X 服从指数分布
是 X 具有无老化性的充要条件 .
证明　充分性 : 设 X～ Ex(λ) 为工作寿命 .

P{ t < X < t + h | X > t} f ( t)
lim = , 　＂ t ≥ 0,
h→ 0 h P( X > t)
即为 t 时刻的瞬时失效率 .
P{ t < X < t + h | X > t} P{ t < X < t + h}
lim = lim
h→ 0 h h→ 0 P{ X > t} h
- λt
λe
= lim - λt = λ, 　＂ t > 0, h > 0
h→ 0 e
所以 X～ Ex (λ) 时 , 具有无老化性质 .
必要性 : 记 F( t) = P( X≤ t) , 因 X 具有无老化性质 , 故瞬时
失效率 F′( t)/ (1 - F( t) ) = λ, 其中 λ为常数 .令 F( 0) = 0 , 有
d( 1 - F( t) )/ ( 1 - F( t) ) = - λd t,
t
∫λe
- λt - λu
F( t) = ( 1 - e ) I( t≥ 0 ) = d u,
0
即 X～ Ex (λ) .证毕 .
利用指数分布的这两条性质 , 有时可以简捷地解决一些涉及
指数分布的问题 .
(4 ) 贝塔分布
定义 3 .8 　若随机变量 X 的概率密度函数为
1 ・ xα- 1 ( 1 - x )β- 1 ・ I( 0 ≤ x ≤ 1 ) , 　 α> 0 , 　 β> 0 ,
f ( x) =
B(α,β)
( 3 .8)
1
∫
α- 1 β- 1
其中 B(α,β) = u (1 - u) d u 为贝塔函数 , 称 X 服从参数为
0
(α,β) 的贝塔分布 ( beta distribu tion ) , 记为 X～B(α,β) .

注意当 α= 1 ,β= 1 时 , 贝塔分布就变成 [0 , 1 ]上的均匀分布 .
(5 ) 伽玛分布
定义 3 .9 　若随机变量 X 的概率密度函数为
1 γ γ- 1 - αx
f ( x) = α x e I ( x ≥ 0 ) , 　 α> 0 , γ> 0 , ( 3 .9)
Γ(γ)
2 .4 随机变量的分布函数　 75
∫
γ- 1 - u
其中 Γ(γ) = u e d u 是伽玛函数 , 称 X 服从参数为 (α,γ) 的
0
伽玛分布 ( Ga mma dist ribu tion ) , 记为 X～G (α,γ) .

注意当 γ= 1 时 , 就化为指数分布 .
注　伽玛函数有以下性质 :Γ( z) = ( z - 1)Γ( z - 1 ) ;Γ(1 ) = 1;
1
Γ = π; 当 z = n∈N \ {0 }时 ,Γ( n) = ( n - 1) !;Γ(α) 与 B(α,β)
2
Γ(α)Γ(β)
的关系为 : B(α,β) = .
Γ(α+β)
2 .4 　随机变量的分布函数
以上我们介绍了离散型和连续型两类随机变量 , 又分别介绍

了针对它们的分布律和密度函数两种方式来描述随机变量的概率
分布特性 .其实 , 我们可以把二者统一起来 , 即可以引入所谓概率
分布函数的概念 , 来统一表达一般随机变量的概率特性 .
定义 4 .1 　设 X ( ω) 是概率空间 ( Ω, F, P) 上的随机变量 ,
＂ u∈R , 称
F X ( u) = P( X(ω) ≤ u) ( 4 .1)
为 X 的概率分布函数 ( probabilit y dist ribu tion function ) , 简称为
d .f .
说明
(1 ) 概率分布函数 F X ( u) 是定义在 R 上取值在 [ 0 , 1 ] 上的函
数 , 它表示事件 ( X(ω) ≤ u) 的概率 , 即 F X ( u) 等于 X 落在 ( - ∞ ,
u]上的概率 .当区间的右端点 u 发生变化时 , P( X (ω) ≤ u) 也发生
相应地改变 .因此 , 对给定的 X , P( X ∈ ( - ∞ , u] ) 是区间 ( - ∞ ,
u]右端点 u 的函数 .
(2 ) 随机变量 X 的概率分布函数包含了它的全部概率特性
的信息 .( 见定义 4． 2 后的注 .)
(3 ) 由第 1 章可知给定 ( Ω, F, P) , P 是定义于 F 上的集函数 .

这样为使 P( X(ω) ≤ u) 有意义 , 要求＂ u∈R , ( X≤ u) ∈F, 这正是
随机变量 X 定义中要此限制的理由 .
(4 ) 在不引起误解时 , 常将 X 省去 , 简记为 F( x) .
定理 4 .1 　概率分布函数 F X ( x ) ( x∈ R ) 具有下列性质 :
(1 ) 单调不减性 , 即若 b > a, 则 F X ( b) ≥ F X ( a) .
(2 ) 右连续 : lim+ F X ( b) = F X ( a) .
b→ a
(3 ) 令 F X ( - ∞ ) = x →lim F X ( x ) , F X ( ∞ ) = xlim FX ( x ) , 则
- ∞ →∞
F X ( - ∞ ) = 0 , FX ( ∞ ) = 1 .
　　注　若定义 F X ( x) = P( X < x) , 则 F X ( x ) 是左连续的 .
证明
( 1) 如果 b > a, 则 ( X(ω) ≤ b) = ( X(ω) ≤ a) ∪ ( a < X(ω) ≤ b) ;
等式右边两个事件不相容 , 故 F X ( b) = P( X (ω) ≤ b) = P( X(ω) ≤
a) + P( a < X(ω) ≤ b) ≥ P( X(ω) ≤ a) = F X ( a) .
(2 ) 由于 F X ( x ) 的单调不减性 , 故存在右极限 F X ( a + 0 ) =
lim F X ( b) ; 由于单调性 , 为证 F X ( a + 0 ) = F X ( a) , 只需对某一列
b→ a +
{ bn } , b1 > b2 > … > bn > a, bn → a, 证明当 bn → a 时 , 有 nlim F X ( bn ) =

→∞
∞
F X ( a) 即可 .令 An = ( a < X (ω) ≤ bn ) , 显然 An An + 1 , n∩ An = ,
=1
于是由 ( X(ω) ≤ bn ) = ( X(ω) ≤ a) ∪ ( a < X(ω) ≤ bn ) 及第 1 章连续

性定理 , 得
lim F X ( bn ) - FX ( a) = n→
lim [ F X ( bn ) - F X ( a) ]
n→ ∞ ∞
= n→
lim P( An ) = P( ) = 0,
∞
则
lim FX ( bn ) = F X ( a) , 即 lim+ F X ( b) = F X ( a) .
n→ ∞ b→ a
∞
　　 (3 ) 令 Cn = ( X(ω) ≤ - n) , 则 Cn Cn + 1 , n∩ Cn = , 由连续性
=1
定理得li m F( - n) = n→
lim P( Cn ) = P( ) = 0 , 则 F X ( - ∞ ) = 0 .同理
n→ ∞ ∞
可证 : FX ( ∞ ) = 1 .
定义 4 .2 　满足上述 ( 1 ) , ( 2 ) , ( 3 ) 的函数 F X ( x ) 称为分布
函数 .
注 1 　由此易知 , 任一随机变量的概率分布函数必是分布函
数 ; 同时 , 由测度论中已证其逆命题成立 , 即任一分布函数必是某
一概率空间上一随机变量的概率分布函数 , 故对随机变量的概率
分布函数 , 简称为分布函数 .
由定理 4 .1 , 令 FX ( b - 0) = lim- F X ( a) , 可以用 FX ( x ) 来表达
a→ b
诸如以下事件的概率 :
P( a < X ≤ b) = F X ( b) - F X ( a) ; (4 .2a)
P( X = b) = F X ( b) - F X ( b - 0 ) , P( X < b) = F X ( b - 0 ) ;
( 4 .2b)
P( X > b) = 1 - FX ( b) , P( X ≥ b) = 1 - FX ( b - 0) .
( 4 .2c)
F X ( x ) = P( X≤ x) 还可改写为 : F X ( x) = P( X∈ ( - ∞ , x] ) , 这说
明作为点 x∈ R 的函数 F X ( x ) 可看作是区间 ( - ∞ , x] 上的集函
数 .由本章 2 .1 节命题 1 .1 已证明 :
＂ x ∈ R , ( X ≤ x) ∈ F ＂ B ∈ B, ( X ∈ B) ∈ F ,
def
故对任一 A ∈ B, P ( X (ω) ∈ A) μX ( A) 都有定义 .这意味着
＂ B∈B, P( X(ω) ∈ B) 均可用 X(ω) 的分布函数 F X ( x ) 来表示 .不
难验证 ,μX ( A) 是定义在可测博雷尔空间 ( R , B) 上的概率测度 , 称
μX ( A) = P( X(ω) ∈ A) 为由随机变量的导出测度 .
注 2 　容易验证 , 若给定随机变量 X (ω) 的分布函数 F X ( x ) ,
即定义在集类 A = { ( - ∞ , a ] , a ∈ R } 上的集函数 F X ( a) =
P( X(ω) ∈ ( - ∞ , a] ) 是 ( R , A) 上的概率测度 .再由概率论中的概
率测度扩张的唯一性定理 , 由 F X ( a) 可唯一的扩张到一维博雷尔
de f
可测空间 ( R , B ) 上 , 其中 B = σ( A ) .从而 , ＂ A ∈ B, μX ( A)
P( X(ω) ∈ A) 可由 F X ( a) 唯一确定 .这意味着 , 对任一博雷尔可测
集 A∈B, ( X(ω) ∈ A) 的概率 μX ( A) = P( X(ω) ∈ A) 完全由 F X ( a)
唯一确定 .因此 , 我们可以说 , 随机变量 X(ω) 的分布函数 F X ( a) 包
含了它的全部概率特性 .
例 4 .1 　已知 X 的概率分布律如下 , 其中 p + q = 1 .求其分布
函数 F X ( x) .
X - 2 0 2
P q2 2 pq p2
　　解　当 x < - 2 时 , F X ( x) = P( X≤ x ) = P( X < - 2) = 0 .
2
当 x∈ [ - 2 , 0 ) 时 , F X ( x) = P( X≤ x ) = P( X = - 2) = q ;
当 x∈[0 , 2 )时 , F X ( x) = P( X≤ x) = P( X = - 2) + P( X = 0) =
2
q + 2 pq;
当 x≥ 2 时 , F X ( x ) = P( X≤ x ) = P( X = - 2 ) + P ( X = 0 ) +
P( X = 2 ) = 1 .
F X ( x ) 的图像如图 2 －5 .
若离散型随机变量 X 的分布律为 P( X = xk ) =
p k k ∈ N \ {0 } , pk ≥ 0 , ∑ p k = 1 , 容易验证 : ＂ a∈ R , 有
k
　 F X ( a) = P( X ≤ a) = ∑
k: x ≤ a
k
P( X = xk ) = ∑
k: x ≤ a
k
pk . (4 .3 )
对于连续型随机变量的概率密度函数与其分布函数有如下关系 .
命题 4 .1 　若随机变量 X 具有概率密度函数 f X ( u) ( u∈ R ) ,
则＂ x∈R 有
x
F X ( x ) = P( X ≤ x) = ∫ - ∞
f X ( t) d t . ( 4 .4)
图　 2－5
　　证明　由 (3 .1 ) 式 , 取 L = ( - ∞ , x] ∈B, 即得 (4． 4 ) 式 .
de f
例 4 .2 　 X～ N ( 2 , 12 ) , 令 Y (ω) = X(ω) ∨0 max ( X (ω) ,
0) , 求 Y (ω) 的分布函数 .
解　由题意知 Y ≥ 0 , 当 u < 0 时 , FY ( u) = P( Y ≤ u) = 0 , 当
u≥0 时 , 有
{ Y ≤ u} = { m ax ( X , 0 ) ≤ u} = { 0 ≤ u} ∩ { X ≤ u}
= { X ≤ u} ,
故当 u≥0 时
u - 2
FY ( u) = P( Y ≤ u) = Φ = Φ( u - 2) .
1
　　注　 P( Y = 0 ) = P( X≤ 0) = Φ( - 2) , 可见 Y 既不是离散型随
机变量 , 也不是连续型随机变量 .
若给定一个随机变量 X 的分布函数 F ( x ) , 也就给定了一个
随机变量 X 的所有的概率特性 .事实上 , 若两个随机变量 X , Y ,
它们的分布函数相同 , 即＂ a∈R , P( X≤ a) = P( Y ≤ a) , 则由本章
命题 1 .1 可以证明 : ＂ L∈B, 有 P( X∈ L ) = P( Y∈ L ) , 这表明随
机变量的分布函数决定了它所有的概率特性 .
2 .5 　条件分布函数与条件密度函数
在第 1 章 , 我们讨论了条件概率及一些相应特性 , 这一节 , 我
们将在条件概率和分布函数的基础上 , 给出条件分布函数及条件
密度函数的概念 .
定义 5 .1 　给定 ( Ω, F, P ) , 设随机变量 X 及事件 B ∈ F,
P( B) > 0 , ＂ x∈R , 称
def
FX | B ( x ) P(ω: X ≤ x | B) ( 5 .1)
为 X 关于事件 B 的条件 (概率 ) 分布函数 .若存在非负函数 f X | B ( x) ,
使得
　＂ L ∈ B, 　 ∫ x∈ L
f X | B ( x ) d x = P(ω: X(ω) ∈ L | B) , (5 .2 )
则称 f X | B ( x ) 为 X 关于事件 B 的条件 ( 概率 ) 密度函数
( conditional probability den sity function , 简记为 c .p .d .f .) .
例 5 .1 　 X～ N (2 , 12 ) , B = {ω: X≥0} , 求 X 在 B 条件下的条
件分布函数及条件概率密度函数 .
解　当 x≤ 0 时 , P( X≤ x | X≥0) = 0; 当 x > 0 时 , 有
P( X ≤ x, X ≥ 0) P(0 ≤ X ≤ x )
P( X ≤ x | X ≥ 0) = =
P( X ≥ 0 ) P( X ≥ 0)
= ( Φ( x - 2) - Φ(0 - 2 ) )/ ( 1 - Φ( 0 - 2) )
= Φ( x - 2 ) - Φ( - 2 ) ;
Φ(2 )
当 x < 0 时 , F′
X | X≥ 0 ( x ) = 0; 当 x > 0 时 , F′ ×
- 1
X | X≥ 0 ( x ) = ( 0 .9772 )
- 1 2
(2π) 2
exp( - ( x - 2 ) / 2) ; X 在 X ≥ 0 条件下的条件概率密度函
数 , 可以取为
0, x ≤ 0,
f X| B ( x ) = -1 - 1 2
( 0 .9772 ) (2π) 2
exp( - ( x - 2) / 2 ) , x > 0 .
2 .5 条件分布函数与条件密度函数　 81
　　注意 : 上例 F X | X≥ 0 ( x ) 在 x = 0 的导数不存在 .
注　若一分布函数 F( x) 在R 上连续 , 仅在可列点上导数不存
在 , 其他点上导数存在 , 且可积 , 则它的概率密度函数 f ( x ) 可取
为 : 在 F( x ) 导数存在点上取 f ( x ) = F′( x ) ; 在导数不存在的点上
任取 f ( x) = a≥0 即可 .
2
若随机变量 X～ N( 2 , 1 ) , 设事件 A 为 ( X≥ 0 ) , 定义随机变
def
量 Y, Y X・ I A (ω) .读者可再分析一下 Y 的分布函数 ( 注意 Y
为一般性随机变量 , 且分布函数在 0 点不连续 ) , 并与前两个例子
作一比较 , 以加深对条件分布及存在概率密度函数必要条件的
理解 .
注意 : 概率密度函数 f X ( x ) 表征的是随机变量在某一点 x 处
的概率特性 , 而建立在条件概率和概率密度函数基础上的条件概
率密度函数表征的是在给定事件已发生的条件下 , 随机变量在某
一点 x 处的条件概率特性 .
在许多理论研究和实际应用中 , 通常关心随机变量限制在某
一范围内的概率分布 , 为此下面我们引入截尾分布函数的定义 .
定义 5 .2 　对于一般的随机变量 X , 称 X 在 ( a < X < b) 条件
下的条件概率分布为 X 的截尾分布函数 , 其中 - ∞ ≤ a < b≤
+∞ .
易知 , 例 5 .1 实际上是求一个服从正态分布的随机变量的截
尾分布函数 .
例 5 .2 　某种型号的电子管寿命 X ( 以小时计 ) 服从参数为
λ= 2 的指数分布 , 厂家规定 : X > 4 的电子管为合格品 , 而 X > M
的电子管为优质品 , M 随顾客要求而定 ( M > 4 ) 现随机抽取一个
电子管 , 已知它为合格品 , 求其是优质品的概率 ( 此概率是 M 的
函数 ) .
解　本题也就是求符合指数分布的随机变量的截尾分布
函数 .
- λx
由于 X～ Ex (λ) , 则 f X ( x) = λe I ( x≥ 0 ) , 由题意 λ= 2 ,
- 2x - 2x
P( X ≤ x) = 1 - e , 　 P( X > x) = e .
当 M > 4 时, 有
P( X > M) e- 2 M - 2( M - 4 )
P( X > M | X > 4 ) = = - 2× 4 = e .
P( X > 4) e
可见 , X 在 X > 4 的条件下仍服从指数分布 .
在第 3 节中我们介绍了指数分布具有无记忆性 , 上例说明了
同一性质 .
条件分布函数和条件概率密度函数在概率论中具有很重要的
地位 , 因为在实际应用中 , 人们往往关心的是随机变量在某一特定
范围内的概率特性 .例如仅考虑男生的身高变化 .这相对于全班同
学的身高 , 就是有条件的 , 涉及到条件分布函数和条件概率密度函
数的相应问题 .
此外 , 深入掌握一维随机变量 , 对以后学习多维随机变量及条
件数学期望都是很有益处的 .
2 .6 　随机变量函数的分布
在实际问题中 , 我们往往会对某些随机变量的函数比对该随

机变量更感兴趣 .例如 , 在一些试验中 , 所关心的随机变量往往不
能由直接测量得到 , 而它却是某个能直接测量的随机变量的函数 .
1 2
例如 , 我们能测量圆的直径 D, 而关心的却是圆的面积 S = πD .
4
这里随机变量 S 是随机变量 D 的函数 .
在这一节中 , 要讨论的问题是 : 已知 X (ω) 的概率分布 , 求它
的函数 Y (ω) = g( X(ω) ) 的概率分布 , 其中 g( ・ ) 是已知的一元实
值函数 .然而 , 对任意随机变量 X (ω) , 是否对任意一个实函数
2 .6 随机变量函数的分布　 83
g( ・ ) , g( X(ω) ) 还是随机变量呢 ? 事实上 , 要求 g( x) 为博雷尔可

测函数 , 即 : 对＂ y∈R , 有{ x: g( x) ≤ y} ∈B .
容易验证 , 单调函数是博雷尔可测函数 , 逐段单调函数、连续
函数等均是博雷尔可测函数 .我们有以下命题 .
命题 6 .1 　设 X(ω) 是概率空间 (Ω, F, P) 上的一个随机变量 ,
d ef
g( x) 是博雷尔可测函数 , 则 Y (ω) g( X (ω) ) 也是概率空间 (Ω,
F, P) 上的一个随机变量 .
证明　要证＂ a∈R , {ω: g( X (ω) ) ≤ a} ∈F .记 B = { x : g( x)
≤ a} , 由于 g( x ) 是博雷尔可测函数 , 故 B∈B .下证{ω: g( X(ω) ) ≤
a} = {ω: X(ω) ∈ B} .
＂ ω1 ∈{ω: g( X(ω) ) ≤ a} g( X(ω1 ) ) ≤ a
X(ω1 ) ∈ B ＂ ω1 ∈ {ω: X(ω) ∈ B} .
故{ω: g( X(ω) ) ≤ a} = {ω: X(ω) ∈ B} ; 于是 {ω: X (ω) ∈ B} ∈ F
{ω: g( X(ω) ) ≤ a}∈ F, 即 Y (ω) = g( X( ω) ) 是概率空间 ( Ω, F, P)
上的一个随机变量 .
下面 , 我们讨论几个具体例子 .
2
例 6 .1 　设离散型随机变量分布律如下 , 求 Y = X + 1 的分
布律 .
X - 2 -1 0 1 2
P 2/ 15 3/ 15 5/ 15 4/ 15 1/ 15
　　解　 Y 所有可能取值为 1 , 2 , 5 , 故
2 5 1
P{ Y = 1 } = P{ X + 1 = 1 } = P{ X = 0 } = = ,
15 3
2
P{ Y = 2 } = P{ X + 1 = 2 } = P{ X = 1 } + P{ X = - 1 }
4 3 7
= + = ,
15 15 15
2
P{ Y = 5 } = P{ X + 1 = 5 }
= P{ X = 2 } + P{ X = - 2 }
1 2 1
= + = ,
15 15 5
则 Y 的分布律为
Y 1 2 5
P 1/ 3 7/ 15 1/ 5
2
　　例 6 .2 　设随机变量 X～ N (0 , 1 ) 求 : Y = X 的概率密度函数 .
2
解　设 Y 的分布函数 F Y ( y ) = P( Y≤ y) .由于 Y = X ≥ 0 , 故
y < 0 时 , FY ( y ) = 0; 当 y≥0 时 , 有
P{ Y ≤ y} = P{ X2 ≤ y} = P{ - y≤ X≤ y}
y
∫
= - y
f X ( x) d x .
1 - x2 2
用 f X ( x) = e 2
代入上式 , 然后对 y 求导 , 即得 Y = X 概率密
2π
度函数为
- 1/ 2
y - y
f Y ( y) = e 2
・ I( y ≥ 0 ) ,
2π
此时称 Y 服从自由度为 1 的卡方分布 .( 见第 3 章练习题 3 .30 .)
例 6 .3 　设随机变量 X～U ( 0 , 1) , 求 Y = Φ- 1 ( X) 的概率密度
- 1
函数 ( 其中 Φ ( x) 是标准正态分布函数 Φ( x ) 的反函数 ) .
- 1
解　先求 Y = Φ ( X ) 的分布函数 FY ( y ) = P( Y ≤ y ) , 注意
- 1
X～U ( 0 , 1) , 故有 FY ( y ) = P ( Y ≤ y ) = P( Φ ( X) ≤ y) = P( X ≤
2
Φ( y) ) = Φ( y) .于是知 Y～ N( 0 , 1 ) , 从而得 Y 的概率密度函数为
1 - 2
f Y ( y) = Φ( y) = .由此可知 , 由服从 (0 , 1 ) 上均匀分布的
y / 2
e
2π
- 1 2
随机变量 X , 经变换 Y≡Φ ( X) 得到随机变量 Y～ N( 0 , 1 ) , 这为
产生服从正态分布的随机变量提供了一个途径 .
以上 3 例都是直接求其分布律或分布函数 .这种解法可简称

为“直接法”.它的关键在于事件的转化 , 即如何将随机变量 Y 表
示的事件转化为随机变量 X 表示的事件 .
2
例 6 .4 　设随机变量 X ～ N (μ,σ ) , 试证明 X 的线性组合
Y = a X + b ( a≠ 0) 也服从正态分布 .
解　先求 Y 的分布函数 , 即需将事件{ω: Y≤ y}转化为随机变
量 X 表示的事件 .
先设 a > 0 , 则
　
y - b
FY ( y) = P{ Y ≤ y} = P{ aX + b ≤ y} = P X ≤
a 　
y- b 2
( x - μ)
1
∫
a -
2
= e 2σ d x,
-∞
2πσ
对 FY ( y) 求导 , 得概率密度函数
y- b
-μ 2 2
1 1 - a
1 - ( y - b - aμ)
2
fY ( y ) = e 2σ = e 2 ( aσ) 2 ,
a 2πσ 2πaσ
- ∞ < y <+ ∞ .
对 a< 0, 则
y - b
P( Y ≤ y) = P( aX + b ≤ y) = P X ≥
a
( y - b)/ a
1 e - ( x - μ) 2/ 2σ2 d x,
=1 - ∫ -∞
2πσ
对 y 求导得
1 - ( y - b - aμ) 2 / 2 ( aσ) 2
fY ( y ) = e ,
2π | a | σ
2 2
故 Y = aX + b～ N ( aμ+ b, a σ ) .
可见随机变量 Y 仍服从正态分布 , 其参数为 aμ+ b 和 a2 σ2 .
结论　服从正态分布的随机变量的线性函数也服从正态
分布 .
还可以采用“微元法”求随机变量函数的概率密度函数 , 在本
章第 3 节 , 我们曾提到微元法的依据 , 即 : 当 f Y ( y) 在 y 连续时 , 有
P( y < Y ≤ y + h)
f Y ( y) = lim .
h→ 0 h
这里也可以应用这种关系 , 对例 6 .4 求解 .
例 6 .5 　题设同上例 .
解　用微元法 .先设 a > 0 , 则＂ h > 0 , h 充分小 , 有
P( y < Y ≤ y + h) = P( y < aX + b ≤ y + h)
y - b y - b h
=P < X≤ +
a a a
y - b h h
= fX ・ + o ,
a a a
故
P( y < Y ≤ y + h)
f Y ( y) = lim
h→0 h
y - b h
fX ・
a a = fX y - b
= lim ・1
h→0 h a a
1 [ y - ( aμ+ b) ] 2
= exp - .
2πσ・ a 2 ( aσ) 2
当 a< 0 时 , 则
y - b y - b h
P( y < Y ≤ y + h) = P > X≥ +
a a a
y - b h h
= fX - + o .
a a a
从而得
1 [ y - ( aμ+ b) ] 2
f Y ( y) = exp - ,
2π | a | σ 2 ( aσ) 2
即 Y = aX + b～ N ( aμ+ b, ( aσ) 2 ) .
例 6 .6 　设电压 V = Asinθ, 其中 A 是已知的正常数 , 相角 θ
是一随机变量 θ
. ～ U (0 ,π) , 试求电压 V 的概率密度 .
解　用微元法 . ＂ v∈ (0 , A) 取 h > 0 充分小, 使 v + h∈ (0 , A) ,
P{ v < V ≤ v + h} = P{ v < Asinθ≤ v + h}
v < θ≤ arcsin v + h
= P a rcsi n +
A A
v+ h v
P π - arcsin ≤ θ< π - arcsin
A A
1 a rcsin v + h - a rcsin v
= +
π A A
1 a rcsin v + h - a rcsin v
.
π A A
由泰勒 ( Taylor ) 展开得
ar csin v + h = a rcsin v + 1 1 ・ h + o( h) ,
・
A A v2 A
1 - 2
A
因此有
2 1
P( v < V ≤ v + h) = ・・ h + o( h) ,
π A - v2
2
所以
P( v < V ≤ v + h) 2
f V ( v) = lim = ,
h→ 0 h π
2
A - v
2
因此
2
2 2
, 0 < v < A,
f V ( v) = π A - v
0, 其他 .
2
　　例 6 .7 　设 X～ N ( 2 , 1 ) , B = {ω: X≥ 0} .求 X 在 B 条件下
的条件概率密度函数 f X | B ( x) .
解　当 x≤0 时 , P( X≤ x, X≥0) = 0 , 故 x≤0 时, 有 f X | B ( x) =
0; 故只需考虑 x > 0 的情形 .对 x > 0 , 取 h > 0 充分小 , 则
P( x < X ≤ x + h | X ≥ 0) = P( x < X ≤ x + h)/ P( X ≥ 0)
= (1 - Φ( - 2 ) ) - 1 P( x < X ≤ x + h)
x+ h
∫
-1 - 1/ 2 2
= Φ(2 ) ( 2π) exp ( - ( u - 2 ) / 2) d u
x
= Φ(2 ) - 1 [ ( 2π) - 1/ 2 exp( - ( x - 2 ) 2/ 2) h + o( h) ] ,

所以
P( x < X ≤ x + h | X ≥ 0 )
f X | X≥ 0 ( x ) = lim
h→ 0 h
-1 - 1/ 2 2
= ( 0 .9772 ) ( 2π) exp ( - ( x - 2 ) / 2) ,
- 1 - 1/ 2 2
故 f X | X≥ 0 ( x ) = ( 0 .9772 ) (2π) exp( - ( x - 2 ) / 2) I( X > 0 ) .
π π
例 6 .8( 柯西 ( Cauchy) 分布 ) 　设随机变量 θ～ U - , ,
2 2
令 Z = rtanθ( 其中 r > 0 为常数 ) , 试求 Z 的概率密度函数 .
解　注意到 Z = rtanθ是单调增函数 , 因此＂ x∈ ( - ∞ , ∞ ) ,
则
x
P( Z ≤ x) = P( rtanθ≤ x ) = P tanθ≤
r
π x
= P - ≤ θ≤ a rctan
2 r
1 a rctan x + π 1 x 1
= = ・arctan + .
π r 2 π r 2
对上式求导可知 : Z 的概率密度函数为
1 x 1 1 r
f ( x) = arctan + ′x = ・ 2 .
π r 2 π r + x2
　　综上 , 对于求随机变量函数的分布函数与概率密度函数问题 ,
我们可以用“直接法”或“ 微元法”解决 .读者要体会两者的关键及
实质 .
练　习　题
2 .1 　一批零件中有 9 个合格品 3 个不合格品 .安装配件时 ,
练习题　 89
从这批零件中任取一个 , 如果每次取出的不合格品不再放回 , 而再
取一个零件 , 直到取得合格品为止 .求在取得合格品以前已取出不
合格品数的概率分布 .
2 .2 　先掷一枚匀称的骰子 , 然后抛个数与骰子掷出的点数相
同的硬币 .
(1 ) 求国徽朝上个数的分布列 ;
(2 ) 若得到 3 个国徽朝上 , 问骰子掷出 n 点的概率多大 ?
2 .3 　掷一颗匀称的骰子 n 次 , 设 M 与 m 分别表示所得点子
的最大值与最小值 , 求 P( m = 2 , M = 5) .
2 .4 　由某机器生产的螺栓的长度 ( cm ) 服从参数为 μ=
10． 05 ,σ= 0 .0 6 的正态分布 , 规定长度在范围 10 .05 ± 0 .12 内为
合格品 .求一螺栓为不合格品的概率 .
1
2 .5 　已知 ln X～ N( 1 , 22 ) , 求 P < X<2 .
2
2 .6 　点随机地落在中心在原点、半径为 R 的圆周上 , 并且对
弧长是匀称地分布的 , 求落点的横坐标的概率密度 .
2 .7 　设 X 的分布函数 F ( x ) 是连续函数 , 则 Y = F( X) 服从
U ( 0 , 1) .
2 .8 　抛掷一枚分币 , 直到出现“ 国徽朝上”为止 , 求抛掷次数
的概率分布 .
2 .9 　从一副扑克牌中发出 5 张 , 求其中黑桃张数的概率
分布 .
2 .10 　甲、乙两人投篮 , 投中的概率分别为 0 .6 , 0 .7 , 今各投 2
次 , 求 : (1 ) 两人投中次数相等的概率 ; ( 2 ) 甲比乙投中次数多的
概率 .
2 .11 　设 X 服从泊松分布 , 已知 P ( X = 1 ) = P( X = 2 ) , 求
P( X = 4 ) .
2 .12 　设 X 服从泊松分布 ( 参数为 λ) , 问 : k 取何值时 ,
P( X = k) 为最大 ?
2 .13 　设 X～ B( n, p) .问 : k 取何值时 , P( X = k) 为最大 ?
2 .14 　在一次核反应中某个粒子可能分裂为 2 或 3 个粒子或
不分裂 , 这 3 种可能性相应的概率分别为 p2 , p3 和 p1 , 新粒子的
分裂性态是相同的 ( 与老粒子也相同 ) , 并且分裂结果彼此独立 .求
两次反应以后粒子总数的分布 .
2 .15 　设随机变量 X 的概率密度为 f ( x ) = C x I( 0 ≤ x ≤ 1 ) , 求 :
(1 ) 常数 C; ( 2) X 落在区间 (0 .3 , 0 .7 ) 内的概率 .
2 .16 　设 X～ N ( 1 , 0 .22 ) , 求 : ( 1 ) P( X > 0 ) ; ( 2 ) P( 0 .2 <
X < 1 .8) .
π π
2 .17 　设 X～ U - , , 证明 : Y = tan X 的概率密度函数
2 2
2 - 1
为 f Y ( y ) = (π( 1 + y ) ) , - ∞ < y < + ∞ , 称 Y 是服从柯西分布
的随机变量 .
2 .18 　设随机变量 X 的概率密度 f ( x ) 为
1 2
1 - x , - 1 ≤ x ≤ 1,
(1 ) f ( x ) = π
0, 其他 ;
x, 0 ≤ x < 1,
( 2) f ( x ) = 2 - x, 1 ≤ x ≤ 2,
0, 其他 .
分别求出 X 的分布函数 F ( x ) , 并作出 ( 2 ) 中的 f ( x ) 与 F( x ) 的
图形 .
2 .19 　设随机变量 X 服从参数为 p ( 0 < p < 1 ) 的几何分布 ,
即 X～ Ge( p) , ＂ l∈ N , 求在 X≥ l 条件下的条件分布律 .
2 .20 　设随机变量 X 只取正整数值 , 若对任意 l, k∈N \ { 0 } ,
有 P( X≥ l + k | X≥ k) = P( X≥ l) , 试证 : X 服从几何分布 .
2 .21 　设 X (ω) 是定义在概率空间 ( Ω, F , P) 上的随机变量 .
练习题　 91
F( x ) ≡ P( X≤ x) 是它的分布函数 , ＂ a, b∈R , a < b .

(1 ) 证明集合 ( X > a) , ( X < a) , ( X = a) , ( a < X ≤ b) , ( a≤
X < b) , ( a < X < b) , ( a≤ X≤ b) 是随机事件 ;
(2 ) 证明 P( a < X < b) = F( b - 0 ) - F ( a) , P ( a≤ X ≤ b) =
F( b) - F( a - 0 ) , P( a≤ X < b) = F( b - 0) - F( a - 0 ) .
2 .22 　称随机变量 X 服从韦布尔分布 ( Weibull
dist ribu tion ) , 若它的概率密度函数为
m- 1 m
f ( x) = αm x exp ( - αx ) , x ≥ 0 ,
α> 0 , m > 0 ( 此分布在可靠性理论中常用 ) .
试求 : Y = X m 的概率密度函数 .
2 .23 　 F( x ) 是一分布函数 , 定义 : ＂ y ∈ ( 0 , 1 ) , F - 1 ( y ) ≡
- 1
sup{ x: F( x ) < y} .已知＂ x∈R , y∈ ( 0 , 1) 满足 ( F ( y) ≤ x ) ( 其
充要条件为 ( y≤ F( x ) ) , 对此事实有兴趣的读者可作为练习加以
证明 .) 试证 : 若 X～ U ( 0 , 1 ) , 则 Y ≡ F - 1 ( x ) 的分布函数为 F( x ) .
( 此结果在随机模拟中有重要应用 .)
- 1
2 .24 　设随机变量 X～ U ( 0 , 1) , 令 Y = - λ ln X , 其中 λ> 0
为常数 , 求 Y 的概率密度函数 .
2 .25 　设随机变量 X～ N( 0 , 12 ) , 求 Y = X2 及 Z = Y 的概率
密度函数 .
2 .26 　设随机变量 X～ Ex (λ) , 给定 l > 0 , 求 X 在 ( X≥ l) 条
件下的条件概率密度函数 .
2n-1
∑ ( k/
n
2 .27 　设随机变量 Y ～ U [ 0 , 1 ] , 令 Yn = 2 )・
k= 0
I ( k/ 2 n≤ Y < k+ 1/ 2 n ) ( n≥ 0) .求 :
(1 ) 分别求 Y1 , Y2 的分布律 ;
(2 ) Y n 的分布律 ;
(3 ) Y2 在给定 Y1 = 1/ 2 下的条件分布律 .
2 .28 　设随机变量 X～ B( n, p) , 试用示性函数的线性组合来
表示随机变量 X .
2 .29 　设随机变量 Y ～ Po (λ) , 试用示性函数的线性组合来
表示随机变量 Y .
2
2 .30 　设一批电子元件某指标 X～ N( 50 , 1 ) ( 设批量为∞ ) ,
按质量要求 : 当 | X - 50 | ≤ 2 为合格品 , 否则为次品 .求将产品中
不合格元件全部剔除后 , 剩下元件指标的概率密度函数 .
2 .31 　某批零件强度 X～ N ( 48 , 22 ) ( 设批量为 ∞ ) , 若 X ≥
46 .3 2 , 则此零件为合格品 , 否则为次品 .制定抽验方案如下 : 第一
次任取 3 个 , 若 3 个都合格 , 则接收该批零件 ; 若至少有 2 个次品 ,
则拒收该批 ; 否则再抽第二次 , 也是 3 个 .重复上述步骤直至作出
接收或拒绝决定为止 .
(1 ) 求第一次抽验 3 个而接收该批零件的概率及第一次抽验
而作出决定的概率 ;
(2 ) 求通过抽验接收该批产品的概率 ;
(3 ) 记 N 为直至作出决定的抽取次数 , 求 N 的分布律 .
2 .32 　设某电子元件在工作时 , 其两端电压 V ～ N ( 220 ,
400) .当 V∈ [200 , 240 ]时 , 其失效概率为 0 .05; 当 V < 200 时 , 其
失效概率为 0 .10; 当 V > 240 时 , 其失效概率为 0 .50 .求 : ( 1) 此元
件的失效概率 ; ( 2) 当元件失效时 ; 电压超过 240 的条件概率 .
2 .33 　设 F( x) 是一分布函数 .
x+ h
( 1 ) 证明＂ h > 0 , G1 ( x ) = ∫ x
F( u) d u/ h, G2 ( x ) =
x+ h
∫x - h
F ( u) d u/ 2 h 是分布函数 ;
( 2) 若 F(0 ) = 0 , 证明 G3 ( x) = ( F( x ) - F(1/ x ) ) I ( x ≥ 1 ) 是分布

函数 .
第3章
多维随机变量及其分布
　　上一章 , 我们研究了单一的随机变量 , 引出了刻画它的概率特

性的若干概念与性质 , 从而使描述随机现象变得清晰而简洁 .但是
在许多随机试验中 , 每次试验的结果需用几个量来表达 .例如 , 考
察一次射击的弹着点 , 需用两个量 ( 纵、横坐标 ) 表示 .又如 , 考察一
个“服务台”的情况 , 需同时考察每个“ 顾客”到达时刻、等待时间和
被服务的时间 , 等等 .这样对于每个样本点 , 试验结果必须用一个
随机向量 ( X1 (ω) , X2 (ω) , … , X n (ω) ) ∈ R n 来表示 .对于这样的随
机向量 , 不仅要研究各自的特性 , 又要研究它们之间的各种关系 ,
后者有时尤为重要 , 因此需将它们作为整体来研究 .
定义　称概率空间 ( Ω, F, P) 上 n 个随机变量 X 1 , X2 , … , X n
的整体 ( X1 , X2 , … , Xn ) 为 n 维随机向量 , 也称 n 维随机变量 .
上面的例子中炮弹的弹着点就是一个二维随机向量 , 而考察
前 n 个“ 顾客”相继到达时刻 , 则是 n 维随机向量 .
在本章中 , 我们将对多维随机向量 ( 以二维为主 ) 进行研究 , 引
出刻画它们概率特性的一些概念、性质与研究方法 .
3 .1 　离散型随机变量及其分布
1 　联合分布律
　　定义 1 .1 　给定 ( Ω, F, P) .
(1 ) 若 X = ( X1 , X2 , … , Xn ) 每一个分量都是离散型随机向
量 , 则称 X 为 n 维离散型随机变量 .
94 　第 3 章多维随机变量及其分布
(2 ) 若二维离散型随机变量 ( X , Y ) 可能取值为 ( x i , y j ) ( i, j∈
N \ {0 } ) , 则称
{ p ij = P( X = xi , Y = y j ) , 　 i, j ∈ N \ { 0} }
为 ( X , Y ) 的联合分布律 , 简称分布律 .
由定义可知二维离散型随机变量 ( X , Y ) 的联合分布律具有
以下性质 : pi j ≥ 0; ∑ ∑ p ij = 1 . 并且具有上述性质的任何数集
i j
{ pi j , i, j = 1 , 2 , …}均可作为某二维离散型随机变量的分布律 .
2 　边缘分布与条件分布
为简单起见 , 只讨论二维离散型随机变量的情形 , 多维情形的

定义和结论完全类似 .
定义 1 .2 　设 ( X , Y ) 的联合分布为 P( ( X, Y ) = ( xi , y j ) ) =
p ij ( i, j∈ N \ { 0} ) .
(1 ) 称 P( X = x i ) ( i∈ N \ { 0} ) 为 X 的边缘分布 , 称 P( Y = y j )
( j∈N \ {0 } ) 为 Y 的边缘分布 .
(2 ) 若 P( Y = yj ) > 0( j∈ N \ { 0 } ) , 称 P( X = x i | Y = yj ) ( i∈
N \ {0 } ) , 为 X 关于 ( Y = y j ) 的条件分布 .
∞ ∞
　　易知 : P( X = x i ) = ∑p
j= 1
ij , P( Y = y j ) = ∑p
i= 1
ij ,
P( X = x i | Y = yj ) = pi j/ ∑pi
ij .
例 1 .1( 多项分布 polynomial dist ribu tion) 　设有 n 次独立重

复试验 , 每次试验有 r 个可能结果 A1 , … , Ar , 每次出现 A1 的概率
为 p1 , 出现 A2 的概率为 p2 , …… , 出现 Ar 的概率为 p r , pi ≥ 0 ,
r
∑p
i=1
i = 1 . 记 X i 为 n 次试验中 A i ( 1≤ i≤ r) 出现的次数 , 则随机
向量 X = ( X1 , X2 , … , Xr ) 的联合分布律为
n!
P( X1 = n1 , X2 = n2 , … , X r = nr ) = p1n1 p2n2 … prn r ,
n1 !n2 !… nr !
( 1 .1)
3 .1 离散型随机变量及其分布　 95
其中 , 0 ≤ ni ≤ n 且 n1 + n2 + … + nr = n .称 X = ( X1 , X2 , … , X r ) 服
从参数为 ( n; r; p1 , … , pr ) 的多项分布 .
(1 ) 当 r = 4 时 , 求 X1 的分布律 ;
(2 ) 当 n = 4 时 , 求 X2 关于 X1 的条件分布律 .
解　 (1 ) ＂ n1 = i = 0 , 1 , 2 , … , n,
n!
P( X1 = i) = ∑
n +n + n = n- i
2 3 4
n1 !n2 !n3 !n4 !
p1n1 p2n2 p3n3 p4n4
i
n !p1 ( n - i) ! n2 n3 n4
= ∑ p p p
i !( n - i) !n2 + n 3 + n4 = n - i n2 !n3 !n4 ! 2 3 4
n !p1i n- i
= ( p2 + p3 + p4 )
i !( n - i) !
i i n- i
= Cn p1 (1 - p1 ) ～ B( n, p1 ) . ( 1 .2)
同理 , P( X l = i) = Cni p il ( 1 - pl ) n - i ～ B( n, pl ) (0≤ i≤ n, 1≤ l≤ r) .
(2) 为求 P( X2 = j | X1 = i) 　 ( i + j≤ n) , 先求 P( X1 = i, X2 = j) .
n!
∑
i j n n
P( X1 = i, X2 = j) = p1 p2 p3 3 p4 4
n + n = n - i- j
3 4
i !j !n3 !n4 !
n! i j n - i- j
　　 = p1 p2 ( 1 - p1 - p2 ) ,
i !j !( n - i - j) !
故
P( X1 = i, X2 = j)
P( X2 = j | X1 = i) =
P( X1 = i)
j n - i- j
( n - i) ! p2 p2
　　 = 1 -
j !( n - i - j) ! 1 - p1 1 - p1
p2
　　～ B n - i, , 　 0 ≤ i ≤ n, 　 0 ≤ i + j ≤ n .
1 - p1
n!
　　注　显然 (1 .1 ) 式中的系数 = 是多项式 ( X1 +
n1 ! n2 ! … nr !
X2 + … + Xr ) n 展开式中 x1n1 x2n2 … xrn r 的系数 .它是二项分布的推
广 , 当 r = 2 时 ( 1 .1) 式为二项分布 .
3 　和、差、积、商、极大、极小
两个离散型随机变量 ( X (ω) , Y (ω) ) , 那么它们的和、差、积、

商、极大值与极小值是否是随机变量 ? 回答是肯定的 .
命题 1 .1 　设 ( X, Y ) 是定义在 ( Ω, F, P) 上的二维离散型随机
变量 , 则 : (1 ) X + Y , (2 ) X - Y , (3 ) X Y, (4 ) X/ Y ( Y≠0 ) , (5 ) X∨ Y ,
(6 ) X∧ Y 均是离散型随机变量 .
证明　设离散型随机变量 ( X , Y ) 的分布律为
P( X = x i , Y = y j ) = p ij ≥ 0 , 　 i, j ∈ N \ {0 } ,
则＂ a∈R , ( xi , yj ) ( i, j∈N \ {0 } ) 有 : ( X = xi ) ∈F, ( Y ≤ a - xi ) ∈
F, F 为 σ－域 , 利用全概率公式证明中事件分解的基本技巧 , 有
( X + Y≤ a) = ∪i ( X = xi , Y≤ a - xi ) ∈F .类似地 , 有
( X - Y ≤ a) = ∪ ( Y = y j , X ≤ a + y j ) ∈ F,
j
( X・ Y ≤ a) = i : ∪ ( X = xi , Y ≤ a/ xi ) ∪ i: ∪
x > 0 x < 0
i i
( X = xi , Y ≥ a/ x i ) ∈ F ,
当随机变量 Y≠ 0 时
{ ( X/ Y ) ≤ a} = ∪ { Y = y j , X ≤ ay j } ∪
j: y > 0
j
∪ { Y = y j , X ≥ ay j } ∈ F,
j: y < 0
j
而{ ( X∨ Y ) ≤ a} = ( X ≤ a, Y ≤ a) ∈F , { ( X ∧ Y ) > a} = ( X > a,
Y > a) ∈F .
那么它们的分布律如何求呢 ? 举例如下 .
例 1 .2 　设离散型随机变量 ( X, Y ) 的联合分布律如下 :
( X,Y ) (1 , 1) (1 , 2) (1 , 3 ) ( 2,1 ) ( 2 , 2) (2 , 3)
P ij 1/ 18 5/ 18 3/ 18 3/ 18 4/ 18 2/ 18
求 : ( 1) X + Y 的分布律 ; ( 2) X∨ Y 的分布律 .
3 .1 离散型随机变量及其分布　 97
解　 (1 ) X + Y 的可能取值为 2～5 , 显然
P( X + Y = 2 ) = P( X = 1 , Y = 1) = 1/ 18,
P( X + Y = 3 ) = P( X = 1 , Y = 2) + P( X = 2 , Y = 1 ) = 8/ 18 ,
P( X + Y = 4 ) = P( X = 1 , Y = 3) + P( X = 2 , Y = 2 ) = 7/ 18 ,
P( X + Y = 5 ) = P( X = 2 , Y = 3) = 2/ 18 .
故
X+ Y 2 3 4 5
Pi 1/ 18 8/ 18 7/ 18 2/ 18
　　 (2 ) X∨ Y 可能取值为 1 , 2 , 3 ,
P( ( X ∨ Y ) = 1) = 1/ 18 , 　 P( ( X ∨ Y ) = 2 ) = 12/ 18 ,
P( ( X ∨ Y ) = 3) = 5/ 18 .
　　例 1 .3 　设 ( X1 , X2 , … , Xr ) 服从参数为 ( n; 4; p1 , p2 , p3 , p4 )
的多项分布 , 试求 X1 + X2 的分布律 .
解　对 0 ≤ k≤ n, 用类似于证明全概率公式中的事件分解方
k
法 , 有 ( X1 + X2 = k) = ∪ ( X1 = i, X2 = k - i) , 故由 (1 .2 ) 式有
i= 0
k
n!
P( X1 + X2 = k) = ∑
i= 0 i !( k - i) !( n - k) !
p1i p2k - i (1 - p1 - p2 ) n - k
k
n !( 1 - p1 - p2 ) n - k
k!
∑
i k- i
= p1 p2
k !( n - k) ! i= 0 i !( k - i) !
= C nk ( p1 + p2 ) k (1 - p1 - p2 ) n - k ,
故 X1 + X2 ～ B( n, p1 + p2 ) .
注　仅由以上所述 , 读者不难发现 , 全概率公式证明中所应用
的事件分解的方法是概率论中最基本的技巧 .
4 　离散型随机变量的独立性
这里只讨论三维情形 , n≥4 情形完全相类似 .

定义 1 .3 　设 ( X, Y , Z) 是三维离散型随机变量 , 联合分布为
P( X = x i , Y = y j , Z = z k ) = p ij k , 　 i, j, k ∈ N \ {0 } ;
若＂ i, j, k∈ N \ {0 }均有
P( X = xi , Y = yj , Z = zk ) = P( X = x i ) P( Y = yj ) P( Z = zk ) ,
则称离散型随机变量 ( X , Y , Z) 相互独立 .
以下略举它的若干性质 .
命题 1 .2 　设离散型随机变量 X , Y , Z 相互独立 , 则 :
(1 ) ＂ i, j, k∈ N \ {0} , P( X = xi | Y = yj ) = P( X = xi ) , P( X =
x i | Z = zk ) = P( X = xi ) , P( Y = y j | Z = zk ) = P( Y = yj ) , P( X =
x i | Y = yj , Z = z k ) = P( X = xi ) .
X 2 2 2
(2 ) X± Y 与 Z 独立 , X Y, 分别与 Z 独立 , X + Y 与 Z 相
Y
互独立 .
证略 , 留给读者作为练习 .
以上只列举了 X , Y , Z 相互独立的部分性质 , 读者有兴趣的
话 , 可进一步列出其他性质 .
3 .2 　连续型随机变量及其概率密度函数
1 　联合概率密度函数
　　定义 2 .1 　给定 ( Ω, F, P) , 若ｖ f ( x1 , … , xn ) ≥ 0 , 对＂ B∈
Bn , 有
P(ω: X(ω) ∈ B) = ∫…∫f ( x , … , x ) d x … d x ,

B
1 n 1 n
则称 X(ω) 为 n 维连续型随机变量 , f ( x1 , … , xn ) 为 X (ω) 的联合

概率密度函数 , 简记为 j .p .d .f . .
这里着重讨论二维情形 , n( n≥ 3) 维情形完全类似 .
二维随机变量 ( X , Y ) 的联合概率密度函数 f ( x, y) 具有以下
性质 :
3 .2 连续型随机变量及其概率密度函数　 99
(1 ) 非负性 : f ( x, y) ≥0;
+∞ +∞
(2 ) 规一性 : ∫∫ -∞ -∞
f ( x, y) d xd y = 1 ;
( 3) 设 G∈B2 是 xO y 平面上的一个区域 , 点 ( X, Y ) 落在 G 内
的概率为
P{ ( X , Y ) ∈ G} = f ( x, y) d xd y ,
G
几何上的值等于以 G 为底 , 以 z = f ( x, y ) 为顶面的柱体体积 .其
2
中 B 为二维博雷尔 σ－域 .
(4 ) 若 f ( x, y ) 在 ( x, y) 连续 , 则
P( x < X ≤ x + h1 , y < Y ≤ y + h2 )
f ( x, y ) = hlim .
1
→0 h1 h2
h →0
2
( 2 .1)
利用 (2 .1 ) 式 , 求 ( X , Y ) 的联合概率密度函数 .此法称为微元法 , 详
见本章 3 .6、3 .7 节及第 6 章等 .
2 　边缘密度函数
对于二维随机变量 ( X , Y ) , 其分量 X ( 或 Y ) 的密度函数称为
边缘密度函数 .我们有
∞
f X ( x) =∫ - ∞
f ( x , y) d y .
　　证明　因＂ B∈B,
+∞
P( X ∈ B) =
x∈ B
f ( x, y ) d xd y = ∫ ∫ x∈ B -∞
f ( x, y) d y d x,
∞
由上一章概率密度函数定义可知 ∫ - ∞
f ( x , y ) d y 为 X 的密度函数 .
2 2 2
例 2 .1 　二维随机变量 ( X , Y ) 在 GR = { ( x , y ) : x + y ≤ R }
1
上服从二维均匀分布, 即 f ( x, y) = 2 I( x +
2 y2 ≤ R2 ) , 求: f X ( x) , fY ( y) .
πR
解　由边缘分布的性质可得 :
当 | x| > R 时
f X ( x) = 0;
　　当 | x| ≤ R 时
+∞ R2 - x 2
1 2 R2 - x2
f X ( x) =∫ - ∞
f( x , y) d y = ∫ -
2
R - x
2
πR
2 dy =
πR
2 .
即
2 R2 - x2
f X ( x) = I( | x | ≤ R) .
πR2
　　同理可得
2 R2 - y2
fY ( y ) = I ( | y| ≤ R) .
πR2
由此可知 , 联合分布为均匀分布 , 边缘分布未必也是均匀分布 .
3 　二维正态随机变量
定义 2 .2 　若二维随机变量 ( X1 , X2 ) 的联合概率密度函数为
2
1 - 1 ( x1 - μ1 )
f ( x1 , x2 ) = ・exp 2 2 -
2πσ1σ2 1 - ρ2
2( 1 - ρ ) σ1
2
( x1 - μ1 ) ( x2 - μ2 ) ( x2 - μ2 )
2ρ + , ( 2 .2)
σ1 σ2 2
σ2
其中 μ1 ,μ2 ,σ1 ,σ2 ,ρ都是常数 , 且 σ1 > 0 ,σ2 > 0 , - 1 ≤ρ≤ 1 , 则称
( X1 , X2 ) 是参数为 (μ1 ,μ2 ,σ12 ,σ22 ,ρ) 的二维正态随机变量 , 简记为
2 2
( X1 , X2 ) ～ N (μ1 ,μ2 ,σ1 ,σ2 ,ρ) .
　　命题 2 .1 　设 ( X1 , X2 ) 为如上二维正态 , 则 Xk ～ N ( μk ,
2
σk ) ( 1≤ k≤ 2) .
解
2 2
1 - 1 ρ ( x1 - μ1 )
f ( x1 , x2 ) = ・exp -
2( 1 - ρ ) σ12
2
2πσ1σ2 1 -ρ2
3 .3 联合分布函数　 101
( x1 - μ1 ) ( x2 - μ2 ) ( x2 - μ2 ) 2 - ( x1 - μ1 ) 2
2ρ + +
σ1σ2 σ22 2σ12
2
1 exp - ( x1 - μ1 ) 1
= 2 ・・
2πσ1 2σ1 2πσ2 1 - ρ2
- 1 σ2 2
exp ( x2 - μ2 ) - ρ ( x1 - μ1 ) ,
σ1
2 2
2σ2 (1 - ρ )
由边缘概率密度函数与联合概率密度函数的关系有
+∞
f X1 ( x1 ) = ∫ - ∞
f ( x1 , x2 ) d x2 .
2 - 1 - 1 - 1
令 t = (1 - ρ ) 2
σ2 [ ( x2 - μ2 ) - ρσ2 σ1 ( x1 - μ1 ) ] , 则有
- ( x1 - μ1 ) 2 +∞ t2
1 e 1 e-
f X1 ( x1 ) =
2πσ1
2σ12
∫ -∞
2π
2
dt
2
- ( x1 - μ1 )
1 2
= e 2σ1 . ( 2 .3)
2πσ1
- ( x2 - μ2 ) 2
1
同理得 : f X 2 ( x2 ) = e 2σ22 , 而 Xk ( 1≤ k≤2) 的边缘分布为
2πσ2
一元正态分布 .
由这个命题知 , 二维正态分布的两个边缘分布都是一维正态
分布 , 且都不依赖于参数 ρ.这说明单由关于 X1 和 X2 的边缘分
布 , 一般是不能确定 X1 和 X2 的联合概率密度函数 .说明联合概
率密度函数所反映的信息 , 不仅反映各自的特征信息 , 还包含着二
者之间某种关系的信息 .
3 .3 　联合分布函数
1 　联合分布函数
2
　　定义 3 .1 　设 ( X , Y ) 为二维随机向量 , ＂ ( x, y ) ∈ R 称
F( x, y ) = P(ω: X ≤ x, Y ≤ y) 为二维随机向量 ( X , Y ) 的联合概率
分布函数 , 或称为 ( X , Y ) 的联合分布函数 .
对于二维随机变量的联合分布 , 可给出其几何解释 , 若将二维
随机变量 ( X , Y ) 视为一个平面上的“ 随机点”的坐标 , 则 F( x, y) 的
函数值就是随机点 ( X, Y ) 落在如图 3 －1 所示的阴影部分的概率 .
该概率是点 ( x, y) 的二元函数 .
图　 3－1
基于上述分析 , ( X , Y ) 落于矩形区域 ( 如图 3 －2 所示 ) , [ x1 <

x≤ x2 , y1 < y≤ y2 ]的概率为
P(ω: x1 < X ≤ x2 , y1 < Y ≤ y2 ) = F( x2 , y2 ) +
　　 F( x1 , y1 ) - F( x1 , y2 ) - F( x2 , y1 ) .
图　 3－2
3 .3 联合分布函数　 103
　　分布函数 F( x, y) 具有以下的基本性质 :
(1 ) F( x, y) 是变量 x 和 y 的单调不减函数 , 即
＂ y ∈ R , 若 x2 > x1 , 则 F( x2 , y) ≥ F( x1 , y ) ;
＂ x ∈ R , 若 y2 > y1 , 则 F( x, y2 ) ≥ F( x, y1 ) ,
其图形注释如图 3 －3 及图 3 －4
图　 3－3 图　 3 －4
　　证明　注意到＂ y∈R , 若 x2 > x1 , 有

( X ≤ x2 , Y ≤ y) = { ( X ≤ x1 , Y ≤ y ) ∪
( x1 ≤ X ≤ x2 , Y ≤ y) } ,
即得结论 .
(2 ) 0 ≤ F ( x , y ) ≤ 1 , x →li m F ( x, y ) = 0; y→lim F ( x, y ) = 0;
- ∞ - ∞
lim F( x, y) = 1 .
x→ + ∞
y→ + ∞
(3 ) ＂ x1 ≤ x2 , y1 ≤ y2 ; 有
F( x2 , y2 ) - F( x2 , y1 ) - F( x1 , y2 ) + F( x1 , y1 ) ≥ 0 .
证明　由
　 F( x2 , y2 ) + F( x1 , y1 ) - F( x1 , y2 ) - F( x2 , y1 )
= P(ω: x1 < X ≤ x2 , y1 < Y ≤ y2 ) ≥ 0
即得 .
(4 ) 对于＂ x ∈ R , F ( x , y ) 关于 y 右连续 ; 对于＂ y ∈ R ,
F( x, y ) 关于 x 右连续 .
证明　类似于一元分布函数右连续的证明 , 略 .
2 　边缘分布函数
定义 3 .2 　设二维随机变量 ( X , Y ) 的联合分布函数为 F( x,
y) , 而 X 和 Y 都是随机变量 , 相应的分布函数记为 F X ( x ) ,
FY ( y) , 依次称为 X 和 Y 的边缘分布函数 , 简称边缘分布 .
易知 :
F X ( x) = F( x , + ∞ ) ; 　 FY ( y ) = F( + ∞ , y) . ( 3 .1)
3 　分布函数与密度函数的关系
若 ( X , Y ) 具有联合概率密度函数 f ( x, y ) , 则＂ ( x , y) ∈ R 2 ,
其联合分布和 X 的边缘分布为
x y x +∞
∫∫
F( x , y ) =
-∞ -∞
f ( u, v) d ud v, F X ( x ) = ∫∫
-∞ -∞
f ( u, v) d v d u .
( 3 .2)
　　 ( 3 .2 ) 式给出联合分布、边缘分布与密度函数的关系 .可应用
于已知密度函数 , 求其联合与边缘分布 .反之 , 若密度函数未知 , 如
何去求呢 ? 以下几个命题为此提供略有不同的几种途径 .
命题 3 .1 　设 ( X , Y ) 的联合分布函数为 F( x, y ) , 且除去有限
2
F 2
点 ( x, y ) 外 , 若在 ( x, y) ∈ R 上存在且连续 , 则 ( X, Y ) 的联
y x
合密度函数存在 , 且
2
F
f ( x, y ) = . ( 3 .3)
y x
　　证明　从略 .
命题 3 .1 的条件太强 , 可稍减弱些 .
2
命题 3 .2 　设随机变量 ( X, Y ) , A R , A 是一个可列点集
2
( 或零测集 ( 面积为 0) ) , 若＂ ( x, y ) ∈ R , P( X = x, Y = y) = 0 , 且
＂ ( x, y) ∈R 2 - A, 极限
3 .3 联合分布函数　 105
P( x < X ≤ x + h1 , y < Y ≤ y + h2 )
f ( x, y) = lim
h
1
, h →0
2 h1 h2
( 3 .4)
存在且可积, 则 ( X, Y ) 的联合概率密度函数可取为
f ( x, y) IR2 - A ( x, y) .
证明　从略 .
应用 (3 .4 ) 式求 f ( x, y ) , 称为微元法 .
微元法可直观表述如下 : 为求 f ( x, y ) , 先求 P( x < X < x +
h1 , y < Y < y + h2 ) ; 其次将上述概率分为两部分之和 : 一部分是与
h1 h2 成比例的主部 , 另一部分是 o( h1 h2 ) , 即是 h1 h2 的高阶无穷
小 ; 最后 , 第一项中 h1 h2 的系数即可作为 ( X , Y ) 的联合概率密度
函数 .
关于微元法 , 在本章 3 .6 节中讨论随机变量函数的分布及第
6 章中可以看到微元法的重要作用 .
4 　随机变量序列的极限表示
本小节讨论随机变量序列的上确界 ( 下确界 ) 上极限 , 下极限

是否仍为随机变量的问题 , 有如下结论 .
命题 3 .3 　设{ Xn , n≥ 1} 是定义在 ( Ω, F, P) 上的随机变量序
列,则
sup X n (ω) = ∨ X n (ω) , 　 inf X n (ω) = ∧ X n (ω) ,
n n n n
d ef
lim s up Xn (ω) inf sup X k (ω) = n∧ ∨n X k (ω) )
( k≥
n→ ∞ n≥ 1 k≥ n ≥1
及
d ef
lim inf Xn (ω) sn≥up inf X n (ω) = n∨ ∧n X k (ω) )
( k≥
n→ ∞ 1 k≥ n ≥1
均为随机变量 .
证明　＂ a∈R , 因
s up X n (ω) ≤ a =∩ ( X n (ω) ≤ a) ∈ F,
n n
inf X n (ω) > a = ∩ ( Xn (ω) > a) ∈ F,

n n
故
C
inf X (ω) ≤ a =
n inf X (ω) > a
n ∈ F,
n n
从而
lim s up Xn (ω) = in ≥nf1 sup X k (ω)
n→ ∞ k≥ n
与
lim inf Xn (ω) = sup inf X k (ω)
n→ ∞ n≥ 1 k≥ n
均为随机变量 , 可知结论成立 .
命题 3 .4 　 ( Xn , n≥1) 同命题 3 .1 定义 .
(1 ) 记 A = ω: n→
lim inf Xn (ω) = lim sup X n (ω) , 则 A∈F;
∞ n→ ∞
(2 ) 若＂ ω∈Ω, 有 nlim i nf X n (ω) = n→

lim s up Xn (ω) , 则
→∞ ∞
de f d ef
X(ω) lim Xn (ω) lim sup X n (ω)
n→ ∞ n→ ∞
是随机变量 .
证明　 (1 ) 因珡
A = ω: lim inf X n (ω) < nlim sup X n (ω)
n→ ∞ →∞
m
∪Z k∈∪N ω: nlim
= m∈ i nf X n ≤ < lim sup X n
→∞ k n→ ∞
m
∪Z k∈∪N
= m∈ lim inf Xn (ω) ≤ ∩
n→ ∞ k
c
m
　 nli→m sup X n (ω) ≤ ∈F,
∞ k
故 A∈F .
(2 ) 由命题 3 .3 , 即得 X(ω) = n→
lim Xn (ω) 是随机变量 .
∞
5 　随机变量的离散化逼近问题
本小节讨论对一般随机变量 , 如何用离散型随机变量 ( 或称简

单函数 ) 序列的极限表示问题 .
3 .4 连续型随机变量的条件概率密度　 107
定义 3 .3 　设 ( Ω, F, P) , { A k , 1 ≤ k≤ n}是 Ω的一个有限分解
( n≥1 ) , 及互不相同的实数 { ak , 1 ≤ k≤ n} , 称随机变量 X(ω) =
n
∑a I
k= 1
k A
k
(ω) 为简单函数 ( 或阶梯随机变量 ) .
注　这里定义的简单函数 X(ω) 即为取值有限个的离散型随

机变量 .
命题 3 .5 　设 P( X(ω) < ∞ ) = 1 , 则 X (ω) 为 ( Ω, F) 上随机变
量的充要条件是存在简单函数序列 { X n (ω) , n≥ 1} , 满足 : 对每个
ω∈Ω有 X (ω) = nlim Xn (ω) , 且当 X(ω) ≥ 0 时 , { X n , n≥1 } 可取为
→∞
非负递增简单函数序列 .
证明　充分性 : 设 { X n , n≥ 1 } 为简单函数序列 , 且＂ ω∈ Ω,
X(ω) = n→
lim Xn (ω) , 由命题 3 .4 知 X (ω) 是随机变量 .
∞
必要性 : 先设 X(ω) ≥0 , 取
n・2 n - 1
k
X n (ω) = ∑ k= 0 2n
I{ k・2 - n ≤ X( ω) < ( k+ 1 ) 2 - n} + n・ I( X (ω) ≥ n ) , ( 3 .5)
1
则 Xn 是简单函数 , 且在{ X < n} 上 , 0 ≤ X - X n ≤ , 而在 { X≥ n}
2n
上 , X n = n < X , 当 n↑ 时 , 显然 Xn ↑ , 故对每个 ω∈Ω, X ( ω) =
li m X n (ω) .
n→ ∞
对一般的随机变量 X(ω) , 取 X + = X∨ 0 , X - = - ( X∧ 0 ) , 显
然 X + , X - ≥0 , 由上 , 对 X + , X - , 存在简单函数序列 , X n+ ↗ X + ;
- - + -
Xn ↗ X , 取 Xn = Xn - X n , 则对每个 ω∈ Ω, X n ( ω) →
X(ω) ( n→∞ ) .
3 .4 　连续型随机变量的条件概率密度
因为 ( X , Y ) 是连续型随机变量 , 此时对任意 x, y, P( X = x) =
0 , P( Y = y ) = 0; 因此不能直接用离散型随机变量定义条件概率分
布的方法来讨论连续型随机变量的条件分布 .
首先给出条件是连续型随机变量的条件分布函数的定义 .
定义 4 .1 　给定 y, 设＂ ε> 0 , P ( y - ε< Y ≤ y + ε) > 0 , 若
＂ x∈R ,
　 lim+ P{ X ≤ x | y - ε< Y ≤ y + ε}
ε→ 0
P{ X ≤ x, y - ε< Y ≤ y + ε}
= lim+
ε→ 0 P{ y - ε< Y ≤ y + ε}
存在 , 则称此极限为 X 在 Y = y 条件下的条件分布函数 .简称 X
关于 Y = y 条件分布 .记作 F X | Y ( x | y ) = P( X≤ x | Y = y) .
定义 4 .2 　对于二维随机变量 ( X , Y ) , 若存在非负函数
f X | Y ( x | y) , 使＂ y∈ R , ＂ B∈B, 有
P( X ∈ B | Y = y) = ∫ x∈ B
f X | Y ( x | y) d x,
则称 f X | Y ( x | y) 为 X 关于 Y = y 的条件概率密度函数 .
定理 4 .1 　设 ( X , Y ) 的联合概率密度函数为 f ( x, y) .若 f ( x,
y) , f Y ( y ) 在点 ( x, y) 及点 y 处分别连续 , 且 f Y ( y) > 0 , 则
f ( x, y )
f X| Y ( x | y ) = . ( 4 .1)
fY ( y )
　　证明
P( X ≤ x | Y = y ) = lim+ P{ X ≤ x, y - ε< Y ≤ y + ε}
ε→ 0 P{ y - ε< Y ≤ y + ε}
y+ε x
lim+
ε→ 0
∫∫ y -ε - ∞
f ( u, v) d ud v/ 2ε
= y +ε
∫
lim
ε→ 0 + y -ε
f Y ( v) d v/ 2ε
x x
f ( u, y )
∫ ∫
＊
= f ( u, y ) d u/ f Y ( y ) = d u,
　 -∞ -∞ f Y ( y)
3 .4 连续型随机变量的条件概率密度　 109
f ( x, y)
故 f X | Y ( x | y) = .
fY ( y )
( 上面带“ ＊ ”等号是根据积分中值定理 ) .
在定理 4 .1 的条件下 , 有下面的结论 .
推论 1 　　　　 f ( x, y ) = f X | Y ( x | y) f Y ( y ) . ( 4 .2)
推论 2 　　　　＂ y∈ R , 有
+∞
P( Y ≤ y) = ∫ - ∞
P( Y ≤ y | X = x) f X ( x) d x . ( 4 .3)
　　证明
+∞ y
P( Y ≤ y) = ∫∫ - ∞ - ∞
f ( u, v) d ud v
+∞ y
∫∫
=
- ∞ - ∞
f Y | X = x ( v | u) f X ( u) d ud v
+∞ y
∫∫
= - ∞ - ∞
f Y | X = u ( v | u) d v f X ( u) d u
+∞
∫
= - ∞
P( Y ≤ y | X = u) f X ( u) d u .
　　推论 2 是全概率公式的推广 .
例 4 .1 　若 ( X , Y ) 在 G = { ( x, y ) : x2 + y2 ≤ 1 } 上服从均匀分
1
布 , 即 f ( x, y ) = I 2 2
+ y ≤1 ) , 求　 fY| X = x ( y | x ) .
π (x
解　当 | x | ≤1 时 , 有
1 - x2
1 dy = 2
fX ( x) = ∫ - 1 - x
2
π π
1 - x2 ;
当 | x | > 1 时 , f X ( x) = 0 .
由定理 4 .1 易得
1
fY | X = x ( y | x ) = 2
I - 1 - x2 , 1 - x2 ( y) , 　＂ | x | < 1 .
2 1 - x
　　例 4 .2 　设随机变量 X～U ( 0 , 1) .当观察到 X = x ( 0 < x < 1)
时 , 数 Y 是区间 ( x, 1 ) 上的均匀分布 , 求 ( X , Y ) 的联合概率密度
函数 .
解　 X 具有概率密度 f X ( x) = I( 0 < x < 1) .类似地 , 在 X = x 条件
1
下 Y 的概率密度 f Y | X ( y | x) = I .
1 - x ( x< y < 1)
由推论 1 可得
1 I
f ( x, y) = f Y | X ( y | x) f X ( x) = (0 < x < y< 1) .
1 - x
　　命题 4 .1 　设 ( X, Y ) ～ N(μ1 ,μ2 ,σ12 ,σ22 ,ρ) , 则＂ x∈R ,
σ2 2 2
f Y | X = x ( y | x) ～ N μ2 + ρ ( x - μ1 ) ,σ2 (1 - ρ ) .
σ1
　　证明　由 (2 .2 ) 式 ( X , Y ) 的联合概率密度函数为
1 - 1 ( x - μ1 ) 2
f ( x, y) = ・ exp 2 2 -
2πσ1σ2 1 -ρ
2
2( 1 - ρ ) σ1
( x - μ1 ) ( y - μ2 ) ( y - μ2 ) 2
2ρ + .
σ1σ2 σ22
及 3 .2 节命题 2 .1 知
1 exp - ( x - μ1 )
+∞ 2
fX ( x) = ∫ -∞
f ( x, y) d y =
2πσ1 2σ21
.
由 (4 .1 ) 式 , 得
1 - 1
f Y | X = x ( y | x) = ・exp 2 2 ×
2πσ2 1 -ρ
2
2σ (1 - ρ )
2
σ2 2
y- μ2 + ρ ( x - μ1 ) , ( 4 .4)
σ1
与一维正态概率密度函数比较 , 可知 f Y | X = x ( y | x ) ～ N μ2 +
σ2 2 2
ρ ( x - μ1 ) ,σ2 ( 1 - ρ ) , 这说明二维正态的条件分布仍是正态
σ1
分布 .
3 .5 随机变量的独立性　 111
3 .5 　随机变量的独立性
在第 1 章中 , 我们讨论了事件的独立性 .本章第 1 节给出离散

型随机变量的独立性 .在此基础上 , 我们来讨论一般随机变量的独
立性 .
定义 5 .1 　设随机变量 ( X , Y ) , 若对＂ ( x, y) ∈R 2 , 有 P{ X≤
x , Y≤ y} = P{ X≤ x} P{ Y≤ y} , 则称 X 和 Y 是相互独立的 .
2
可见 , 随机变量 ( X , Y ) 相互独立 , 等价于 : ＂ ( x, y) ∈ R , 事件
{ X≤ x} 与{ Y≤ y}均相互独立 .
由定义 , 不难证明以下命题 .
命题 5 .1 　下列叙述等价 :
(1 ) ( X , Y ) 独立 ;
(2 ) ＂ ( x , y ) ∈R 2 , P( X≤ x | Y ≤ y) = P( X≤ x ) ;
2
(3 ) ＂ ( x , y ) ∈R , P( Y≤ y | X≤ x) = P( Y≤ y ) .
证明　留给读者作为练习 .
命题 5 .2 　若 ( X , Y ) 是具有概率密度函数的随机变量 , 则下
列 3 个命题等价 :
(1 ) X , Y 相互独立的 ;
2
(2 ) ＂ ( x , y ) ∈R , f ( x, y ) = f X ( x) f Y ( y) ( 几乎处处 ) ;
(3 ) ＂ ( x , y ) ∈R 2 , f X | Y = y ( x | y) = f X ( x) ( 几乎处处 ) .
证明　由概率密度函数的定义有
x y
P{ X ≤ x, Y ≤ y} = ∫∫ -∞ - ∞
f ( x, y ) d xd y ( 5 .1)
x y
P( X ≤ x ) P( Y ≤ y) = ∫ -∞
f X ( x) d x ∫ - ∞
fY ( y ) d y
x y
=∫∫ -∞ -∞
f X ( x) f Y ( y) d xd y . ( 5 .2)
　　先证 (1 ) ( 2) .
若 X , Y 独立 , 即＂ ( x, y ) ∈ R 2 , P { X ≤ x , Y ≤ y } =
P{ X≤ x} P{ Y≤ y} ; 即 ( 5 .1 ) 式与 ( 5 .2 ) 式相等 .可得 f ( x, y ) =
f X ( x) f Y ( y) ( 几乎处处 ) .
下证 (2 ) ( 1) . ＂ ( x, y) ∈ R2 , 若 f ( x, y ) = f X ( x ) f Y ( y ) ( 几
乎处处 ) , 可得 ( 5 .1 ) 式与 ( 5 .2 ) 式相等 , 即 P { X ≤ x , Y ≤ y } =
P{ X≤ x} P{ Y≤ y} , 所以 X , Y 相互独立 .以上证明了 (1 ) ( 2) .
其他证明留给读者 .
2 2
命题 5 .3 　设 ( X, Y ) ～ N (μ1 ,μ2 ,σ1 ,σ2 ,ρ) , 则 X, Y 相互独立
的充要条件是ρ= 0 .
证明　由前面命题 2 .1 可知
2
1 ( x - μ1 )
f X ( x) = exp - 2 ,
2πσ1 2σ1
1 ( y - μ2 ) 2
f Y ( y) = exp - 2 ,
2πσ2 2σ2
所以
1 ( x - μ1 ) 2 ( y - μ2 ) 2
f X ( x) ・ f Y ( y ) = exp - 2 - 2 .
2πσ1 σ2 2σ1 2σ2
而 X, Y 相互独立的充要条件是
f ( x, y ) = f X ( x) f Y ( y) , ＂ ( x, y) ∈R 2 ,
2
即＂ ( x, y) ∈R ,
2
1 - 1 ( x - μ1 )
・exp 2 2 +
2πσ1σ2 1 - ρ2 2( 1 - ρ ) σ1
( y - μ2 ) 2 ( x - μ1 ) ( y - μ2 ) 1 ・
　　 2 - 2ρ =
σ2 σ1σ2 2πσ1σ2
( x - μ1 ) 2 ( y - μ2 ) 2
　　 exp - - ,
2σ12 2σ22
2
上式取 x = μ1 , y = μ2 得 1 -ρ = 1 ρ= 0; 反之 , 若 ρ= 0 , 易知
＂ ( x, y) ∈R , f ( x, y) = f X ( x ) f Y ( y ) .证毕 .
2
3 .5 随机变量的独立性　 113
例 5 .1 　一负责人到达办公室的时间 X 均匀分布在 8 ～ 12
时 , 即 X～U[ 8 , 12 ] , 其秘书到达办公室的时间 Y 均匀分布在 7 ～9
时 , 即 Y～U[ 7 , 9] , 且两人到达办公室的时间独立 , 求他们到达办
公室的时间相差不超过 5 分钟 (1/ 12 小时 ) 的概率 .
解　由题设 X, Y 的概率密度函数分别为
1 1
fX ( x) = I( 8 < x < 12 ) , 　 f Y ( y) = I( 7 < y < 9 ) .
4 2
记图 3 －5 中阴影部分为 G = ( | x - y | ≤ 1/ 12 ) ∩ ( 8 ≤ x ≤ 12 ,
7≤ y≤9) , 其面积为 SG .显然题意所求概率为 P{ ( X , Y ) ∈ G} , 而
SG = 1/ 6 , 故
SG 1
P{ ( X , Y ) ∈ G} = f ( x, y) d xd y = = ,
( x, y) ∈ G
8 48
图　 3－5
即负责人和他的秘书到达办公室的时间相差不超过 5 分钟的概率
为 1/ 48 .
以上所述的关于二维随机变量的一些概率特性 , 容易推广到
n 维随机变量的情况 .
定义 5 .2 　设 X1 , … , Xn 是概率空间 (Ω, F , P) 上的 n 个随机
n
变量 , 若对＂ ( x1 , … , xn ) ∈ R , 有 P( X1 ≤ x1 , … , Xn ≤ xn ) =
P( X1 ≤ x1 ) … P( X n ≤ xn ) , 则称 X1 , … , Xn 相互独立 .
定义 5 .3 　设 n 个随机变量 X1 , … , Xn 相互独立且服从同一
分布 , 即
d ef
FX i ( x ) F( x) , 　＂ i ∈ [ 1 , n] ,
则称 X1 , … , Xn 独立同分布 ( independent identically distributed , 简
记为 i .i .d .) .
对于 n 维随机变量 , 命题 5 .2 可推广为 : 设连续型随机变量
X1 , … , Xn 的概率密度函数分别为 f 1 ( x ) , … , f n ( x ) , 则 X1 , … , X n
n
相互独立的充要条件为 f ( x1 , x2 , … , xn ) = ∏
i= 1
f i ( x i ) .证明与命
题 5 .2 证明类似 , 从略 .
命题 5 .4 　 X1 , … , X n 相互独立 , 则 :
k n k n
(1 ) ＂ 1 ≤ k < n, ∑ Xi 与 ∑ X l 相互独立 ; ∑ X 与 ∑ X2l 相 2

i
1 k+1 1 k+1
互独立 ;
(2 ) 若 Y i = g i ( Xi ) ( i = 1 , … , n) ; 即 Y i 仅是 X i 的函数 , 则
Y1 , … , Yn 独立 ;
(3 ) 若 Z1 = h1 ( X1 , X2 , … , Xk ) , Z2 = h2 ( X k+ 1 , … , Xn ) (1 ≤
k < n) , 则 Z1 、Z2 独立 .
其中 gi ( x) 　 ( i = 1 , … , n) , h1 和 h2 均为博雷尔可测函数 .
证明　 (1 ) 的证明留给读者作为练习 .(2 ) , (3 ) 的证明已超
出本书范围 , 从略 .
2
例5 .2 　设 X , Y , 独立同分布 , 且 X ～ Ex (1 ) , 而 U = X , V =
2 Y , 求 ( U , V) 的联合概率密度函数 .
2
　　解　 P( U ≤ u) = P( X ≤ u) = P(0 < X ≤ u) I( u > 0 )
u
∫e
- x - u
= d xI ( u > 0 ) = 1 - e I ( u> 0) ,
0
d - u 1
f U ( u) = P ( U ≤ u) = e ・ I( u > 0 ) ,
du 2 u
3 .6 随机向量函数的分布　 115
v
P( V ≤ v) = P( 2 Y ≤ v) = P 0 < Y ≤ I( v > 0 )
2
v
∫
2 - y - v
= e d yI ( v > 0 ) = (1 - e 2
) I( v > 0 ) ,
0
所以
v
d 1 -
f V ( v) = P ( V ≤ v) = e 2
I( v > 0 ) ,
dv 2
利用定理 5 .2 , 由 X , Y 独立 , 得 U , V 独立 , 故
v
1 - u+
f ( u, v) = f U ( u) ・ f V ( v) = e 2
I( u > 0 , v > 0 ) .
4 μ
　　定义 5 .4 　称定义在 ( Ω, F , P) 上的随机变量序列{ Xn , n≥ 1}
相互独立 , 如果其中任意有限多个随机变量相互独立 .
3 .6 　随机向量函数的分布
1 　随机向量函数的分布
　　这里主要讨论随机变量的和、差、积、商等的分布 .
(1 ) 离散型随机变量和的分布
由本章命题 1 .1 知 , 两个离散型随机变量的和、差、积、商 .极
大极小仍为离散型随机变量 , 那么如何求其分布律 ? 举例如下 .
例 6 .1 ( 泊松分布对和的封闭性 ) 　设 X1 , X2 独立 , X k ～
P o(λk ) ( k = 1 , 2 ) ; 证明 : X1 + X2 ～P o(λ1 +λ2 ) .
k
解　因为＂ k∈ N , ( X1 + X2 = k) = i∪ ( X1 = i, X2 = k - i ) 及
= 0
X1 , X2 独立 , 故
k
P( X1 + X2 = k) = ∑ P( X
i =0
1 = i) P( X2 = k - i)
k i k- i k
λ1 λ2
　　 = ∑ e - (λ1 +λ2 ) = 1 ∑ C λλ
i i k- i
k 1 2 e - (λ1 +λ2 )
i= 0 i !( k - i) ! k! i =0
(λ1 + λ2 ) k - (λ1 +λ2 )

　　 = e X1 + X2 ～ P o(λ1 + λ2 ) .
k!
　　 (2 ) 不同类型的二个随机变量的和 ( 差、积、商 ) 的分布
命题 6 .1 　设 ( X , Y ) 是 (Ω, F ) 上的随机变量 , X 为离散型随
机变量 , 则 X± Y , X・ Y , X/ Y ( Y≠0 ) 均是随机变量 .
证明　设 X 的分布律为 P ( X = xi ) = pi , 则＂ a∈R , 有
( X + Y ≤ a) = ∪ ( X = x i , Y ≤ a - xi ) ∈ F,
i
故 X + Y 也是随机变量 .
其他证明留给读者自己完成 .
例 6 .2 　设 X, Y 独立 , X～ N(μ,σ2 ) , P( Y = a1 ) = p > 0 , P( Y =
a2 ) = 1 - p = q > 0 .试问 X + Y 是否具有概率密度函数 ? 若有求
X + Y的概率密度函数 .
解　注意到这是两个不同类型的随机变量之和 , Y 为离散型
随机变量 , X 为连续型随机变量 , 它们之和 X + Y 是什么类型的随
机变量呢 ? 不妨看＂ z∈R , P( X + Y = z) = ? 显然
P( X + Y = z) = P( Y = a1 , X = z - a1 ) +
P( Y = a2 , X = z - a2 ) = 0 ,
此时断定它可能是连续型随机变量 , 因而可先求其分布函数 .注意
到 Ω= ( Y = a1 )∪ ( Y = a2 ) , ( X + Y≤ z) = ( Y = a1 , X≤ z - a1 ) ∪ ( Y =
a2 , X≤ z - a2 ) ; 又因 X , Y 独立 , 所以
P( X + Y ≤ z) = P( X ≤ z - a1 ) P( Y = a1 ) +
P( X ≤ z - a2 ) P( Y = a2 ) ,
上式两边对 z 求导存在 ( ＂ z∈ R ) , 所以 X + Y 是连续型随机变
量 , 且 X 是正态 , 故
f X+ Y ( z) = P( Y = a1 ) f X ( z - a1 ) + P( Y = a2 ) f X ( z - a2 )
1 ( z - a1 - μ) 2
= p ・exp - +
2πσ 2σ2
( z - a2 - μ) 2
　 q・ exp - .
2σ2
　　说明　 ( i) 上式 f X + Y ( z ) 是两个正态概率密度函数 f X ( z -
a1 ) , f X ( z - a2 ) 的“凸组合”, 其形状如图 3 －6 .这种概率密度函数
在工程上有着广泛的应用 .有兴趣的读者试举这种概率密度函数
的实例 .
图　 3－6
( ii ) 请读者思考 : 若 X 为连续型随机变量 , Y 为离散型随机变

量 , 如何求 X Y, X/ Y ( Y≠ 0) 的概率密度函数 .
命题 6 .2 　设 ( X , Y ) 是 ( Ω, F) 上的随机变量 , 则 X ± Y , X ・
Y , X/ Y ( Y≠0 ) 均是随机变量 .
证明　由命题 3 .5 知 : 存在离散型随机变量序列 { Xn , n≥ 1}
使 Xn → X , 由命题 6 .1 知{ X n + Y , n≥1 } 是随机变量 , 显然＂ ω∈
Ω有 X n + Y→ X + Y , 再由命题 3 .4 知 X + Y 也是随机变量 .
其他情形类似可证 , 留给读者作为练习 .
(3 ) 连续型随机变量和 ( 差、积、商 ) 的分布
预备知识
为了方便读者阅读以下内容 , 这里列举分析中有关含参量积
分和变上限积分的求导公式 .
g
设 g( x , t) 为二元连续函数 , 且连续 , 一元函数 φ( t) 关于 t
t
可导 .记
b φ( t)
∫
S1 ( t) = a
g ( x, t) d x, 　 S2 ( t) = ∫ a
g ( x, t) d x
则
b
d S1 ( t) g( x, t) d x,
dt
= ∫ a t
( 6 .1)
φ( t)
d S2 ( t) g( x, t) d x + g(φ( t) , t)φ′( t) .
dt
= ∫ a t
( 6 .2)
　　例 6 .3( 和的卷积公式 ) 　设 ( X , Y ) 的联合概率密度函数为
f ( x, y) , 它关于 ( x , y ) 连续 , 求 Z = X + Y 的分布及概率密度函数 .
解　＂ z∈R , 利用全概率公式 , 易知 Z 的分布函数为
+∞
P( X + Y ≤ z) = ∫ -∞
P( Y ≤ z - x | X = x) f X ( x) d x .
( 6 .3)
　　若 Y 关于 X = x 的条件密度函数为 f Y | X = x ( y | x ) , 由 f ( x , y)
连续 , 易知 f Y | X ( y | x) 关于 y 连续 , 故由 ( 6 .3) 式两边对 z 求导 , 得
+∞
f X+ Y ( z) = d P( X + Y ≤ z) = ∫ f Y | X = x ( z - x | x ) f X ( x ) d x,
dz - ∞
(6 .3a)
故
+∞
f X+ Y ( z) = ∫ -∞
f ( x, z - x) d x . ( 6 .4)
同理可得
+∞
f X + Y ( z) = ∫ -∞
f ( z - y, y) d y . ( 6 .5)
　　若 X, Y 为非负连续型随机变量 , 则＂ z≥0 ,
z
f X+ Y ( z) = ∫ f ( x, z -
0
x) d x . ( 6 .6)
　　若 X, Y 独立 , 则
+∞
f X+ Y ( z) = ∫ - ∞
f X ( x ) f Y ( z - x) d x . ( 6 .7)
　　注　 (6 .7 ) 式是 X , Y 独立时 , 概率密度函数的卷积公式 , 记作
f X ＊ fY .
若 X, Y 独立且非负 , 则＂ z≥0 , 有
z
f X+ Y ( z) =∫f 0
X ( x) f Y ( z - x ) d x . ( 6 .8)
　　例 6 .4 　已知 X , Y 独立同分布且 X ～U (0 , 1 ) , 求 X + Y 的概
率密度函数 .
解　由题设 X, Y 独立 .由 ( 6 .7) 式 , 有
+∞
f X ( z) = ∫ - ∞
f X ( x ) f Y ( z - x) d x .
0 < x < 1, 0< x<1

易知 : 当且仅当亦即时 , 上式右边被积
0 < z - x < 1, z- 1< x< z
函数不为零 .
参照图 3 －7 易得
图　 3－7
0, z≤ 0 或 z > 2,
z
f Z ( z) = ∫d x,
0
0 < z≤ 1,
1
∫ z- 1
dx, 1 < z≤ 2,
故得
0, z≤ 0 或 z > 2,
f Z ( z) = z, 0 < z≤ 1,
2 - z　 1 < z≤ 2 .
　　例 6 .5 　 X , Y 互相独立 , X～ N (μ1 ,σ12 ) , Y ～ N(μ2 ,σ22 ) , 证明 :
Z = X + Y 的概率密度函数为正态概率密度 , 即
X + Y ～ N(μ1 + μ2 ,σ12 + σ22 ) .
　　解　由 (6 .7 ) 式可得
+∞
∫
f Z ( z) = -∞
f X ( x) f Y ( z - x ) d x
2
+ ∞
1 ( x - μ1 )
=∫ -∞
2πσ1
exp -
2σ1
2 ・
1 ( z - x - μ2 ) 2
　 exp - 2 dx
2πσ2 2σ2
+∞ 2
1 exp - ( z - μ1 - μ2 ) ・
=∫ -∞ 2πσ1σ2 2 (σ12 + σ22 )
2 2 2 2
σ1 + σ2 x - σ2 μ1 + σ1 z - σ1 μ2
2 2
　 exp - 2 2 dx
σ12σ22 σ1 + σ2
2
1 ( z - μ1 - μ2 )
= exp - 2 2 ,
2π(σ1 + σ2 )
2 2 2 (σ1 + σ2 )
即 X + Y～ N(μ1 + μ2 ,σ12 +σ22 ) .

若 ( X, Y ) ～ N(μ1 ,σ12 ,μ2 ,σ22 ,ρ) , 其中ρ≠0 , 即 X , Y 不独立 , 求
Z = X + Y 的概率密度函数 , 则有
X + Y ～ N (μ1 + μ2 ,σ12 + σ22 + 2ρσ1 σ2 ) .
+∞
　　为证上述结论 , 只需利用公式 f Z ( z) = ∫ -∞
f ( x, z - x ) d x 及
本章 (2 .2 ) 式即可得到以上结论 .
2
若 Xi ～ N(μi ,σi ) 　 ( i = 1 , 2 , … , n) , 且它们相互独立 , 则它
们的和 Z = X1 + X2 + … + Xn 仍然服从正态分布 , 且有
n n n
∑ ∑μk , ∑σk
2
Xk ～ N .
k= 1 k= 1 k= 1
　　更一般地 , 可以证明 , 任意有限个正态随机变量 ( 可以不独立 )

的线性组合仍然服从正态分布 .
2 　随机向量变换的分布
这里讨论如下问题 : 若 n 维随机变量 X = ( X k , 1 ≤ k≤ n) 的联
合概率密度函数为 f X ( x) , x = ( xk , 1≤ k≤ n) ∈R n , 如何求 X 经变
换 ( 记为 L ) 后的 n 维随机变量 Y = ( Y k = gk ( X) , 1 ≤ k≤ n) 的分布
或联合概率密度函数 .
de f n n
设变换 L: y = ( yk = gk ( x) , 1≤ k≤ n) ( g( x) ) ∈ R , x∈ R ,
g( x) = ( gk ( x) , 1≤ k≤ n) , 对应的逆变换 L ′: x = ( xk = hk ( y) , 1≤
d ef n n
k≤ n) ( h( y) ) ∈ R , y∈R , h( y) = ( hk ( y) , 1 ≤ k≤ n) , 其中 gk ,
1)
hk 是 n 元 ( 博雷尔可测 ) 函数 .
记 X 和 Y 的取值范围为 G = { x: f X ( x) > 0 , x∈R n } , G′= { y:
xi
y = g ( x) , x∈ G} . J = det 为变换的雅可比 ( Jacobi ) 行
yj n× n
列式 .
命题 6 .3 　若上述变换 L 满足 :
g h
(1 ) 变换 L: G G′存在唯一的逆变换 L′: G′ G;
(2 ) gk , hk 有连续偏导数 ( 分别在 G 和 G′上 ) ;
(3 ) 在 G 中 , J≠ 0( 几乎处处 ) .
d ef
则 n 维随机变量向量 Y = ( Y k = gk ( X) , 1≤ k≤ n) ( g( X) ) 的联合
概率密度函数为
f Y ( y) = fY ( h( y) ) | J | , 　 y ∈ G′. ( 6 .9)
1) 所谓 g( x) 为 n 维博雷尔可测函数 , 即＂ a∈ R n { x: g( x) ≤ a}∈ B n ( B n 为 n 维博
雷尔σ－域 ( 代数 ) ) .
　　证明　＂ D′ G′, D′∈ B2 , 记 D = { x: x = h( y) , y∈ D′} , 则

G, D∈ B2 ; 显然 ( Y∈ D′) = ( X∈ D) , 故
1)
D
P( Y ∈ D′) = P( X ∈ D) = ∫…∫fx∈ D
X ( x) dx
=∫…∫f y∈ D′
X ( h( y) ) | J | dy,
由联合概率密度函数的定义知 , 可取 f Y ( y) = f X ( h( y) ) | J | ( y∈

G′) 作为 Y 的联合概率密度函数 .
例 6 .6 　设 ( X, Y ) 独立同分布 , X ～ N ( 0 , 12 ) .令 X = ρcosθ,
Y =ρsinθ, 其中 ρ≥0 , 0≤θ≤2π, 试求 (ρ,θ) 的联合概率密度函数及
边缘概率密度函数 .
2 2 - 1 y
解　令 x = rcosα, y = rsinα, 得 r = x + y ,α= tan .又
x
( X , Y ) 的联合概率密度函数为
1 2 2
f ( x, y) = exp [ - ( x + y )/ 2] ,
2π
x x
r α
而 J= = r, 故 (ρ,θ) 的联合概率密度函数为
y y
r α
1 - r2/ 2
f (ρ,θ) ( r,α) = ・ re ・ I( r≥ 0 , 0 ≤α≤ 2π) ,
2π
而 ρ的概率密度函数为
- r2 / 2
fρ ( r) = r・e ・ I( r≥ 0 ) ,
称此分布为瑞利 ( Rayleigh ) 分布 .
θ的概率密度函数为
fθ (α) = 1 ・ I( 0 ≤θ≤ 2π) ,

2π
1) 由 g, h 可测 , 则由 D′∈ B n 可得 D∈ B n , 于是 ( Y∈ D′) = ( X∈ D) ∈ F .
3 .7 顺序统计量的分布　 123
显而易见 , ＂ ( r,α) 有 fρ ( r) fθ (α) = f (ρ,θ) ( r ,α) , 故 ρ,θ独立 .

说明
(1 ) 若 ( X , Y ) 表示射击弹着点的两个坐标 , 则 (ρ,θ) 表弹着点
与原点的距离 ,θ为弹着点和原点连线与 x 轴的夹角 .
(2 ) 若 ( X , Y ) 独立同分布 , X～ N( 0 ,σ2 ) , 则 ρ是瑞利分布 .
例 6 .7 　设 X , Y 相互独立 , 都服从参数 λ= 1 的指数分布 .令
U = X + Y , V = X/ Y , 求 ( U, V ) 的联合概率密度函数 .
解　首先 ( X , Y ) 的联合概率密度函数为 f ( X , Y ) ( x, y ) =
e- ( x + y)
I( x > 0 , y > 0 ) .
对变换 u = x + y, v = x/ y, 显然满足命题的条件 ( 1 ) , ( 2 ) ,
(3 ) .解得 x = uv/ (1 + v) , y = u/ ( 1 + v) ; 求导可得
v u
1+ v (1 + v) 2 u
J = = - 2 ,
1 u (1 + v)
- 2
1+ v ( 1 + v)
故
- u u
f ( U , V) ( u, v) = e ・ I( u > 0 , v > 0 ) .
(1 + v) 2
3 .7 　顺序统计量的分布
定义 7 .1 　给定 (Ω, F , P) , { X k , 1 ≤ k≤ n} 为 n 维随机向量 .
＂ ω∈Ω, 将 X1 (ω) , …, Xn (ω) 按从小到大顺序排列 , 记为 X( 1 ) (ω) ≤
X( 2 ) (ω) ≤…≤ X ( n) (ω) , 称 X ( 1 ) (ω) , … , X ( n) (ω) 为 ( X1 , … , Xn ) 的
顺序统计量 .
例 7 .1 　设一随机实验是每次投掷红白两颗骰子 , 记 X1 (ω) ,
X2 (ω) 为相应的点数 . 如第一次试验结果是 X1 ( ω1 ) = 5 ,
X2 (ω1 ) = 2 , 则 X( 1 ) ( ω1 ) = 2 , X ( 2 ) ( ω1 ) = 5; 如第二次结果是
X1 (ω2 ) = 1 , X2 (ω2 ) = 3 , 则 X( 1 ) (ω2 ) = 1 , X( 2 ) (ω2 ) = 3; …… .

显然 ,
X ( 1 ) = 1 min X k , 　 X ( n) = 1m ax X k ,
≤ k≤ n ≤ k≤ n
称 X( 1 ) 为极小量 , X( n) 为极大量 , Rn = X( n) - X ( 1 ) 为极差 .

顺序统计量在工程管理等领域有重要应用 .本章仅限制在
{ X k , 1≤ k≤ n} 相互独立条件下讨论 .
1 　极大、极小分布
这里直接利用定义与事件转化的方法求之 .
注意到＂ z∈R ,
n n
( X( n) ≤ z) = k∩ ( Xk ≤ z) , 　 ( X( 1 ) > z) = k∩ ( Xk > z) .
= 1 = 1
又由{ X k , 1≤ k≤ n} 相互独立 , 得
n
P( X ( n) ≤ z) = ∏ P( X
k=1
k ≤ z) , ( 7 .1)
n
P( X ( 1 ) > z) = ∏ P( X
k= 1
k > z) , ( 7 .2)
进一步 , 若{ Xk , 1≤ k≤ n}独立同分布 , 则
n
P( X( n) ≤ z) = ( P( X1 ≤ z) ) , (7 .1a)
n
P( X( 1 ) > z) = ( P( X1 > z) ) . (7 .2a)
　　以下是一个有趣结果 .
命题 7 .1 　若{ Xk , 1≤ k≤ n}独立 , Xk ～ Ex(λk ) (1 ≤ k ≤ n) ,
n
则 X( 1 ) ～ Ex ∑λ
k= 1
k , 即
n
-
∑λk z
P( X ( 1 ) ≤ z) = 1 - e k= 1
・ I( z≥ 0 ) .
　　证明　由 (7 .2 ) 式立得 .
说明相互独立的指数分布其极小量仍是指数分布 .
极大极小的背景 : 设 n 个电路元件的工作寿命为 X 1 , … , Xn ,
( 1) 若将它们组成一个串联系统 , 且系统能正常工作是当且仅当 n
个元件均正常工作 , 于是该系统能正常工作的寿命为 X ( 1 ) =
min X k ; ( 2) 若将它们组成并联系统 , 且系统能正常工作是当且
1≤ k≤ n
仅当至少有一元件正常工作 , 于是系统的工作寿命为 X ( n) =
max X k .
1≤ k≤ n
有兴趣的读者试举出你生活中出现的极大极小的例子 .
2 　 ( X( 1 ) , X( n) ) 的联合分布
这里仅在{ X k , 1≤ k≤ n} 独立同分布的情况下讨论 .
为求 ( X ( 1 ) , X ( n) ) 的联合分布 P( X( 1 ) ≤ x, X( n) ≤ y) , ＂ ( x, y)
2
∈R , 我们直接用事件转化分解的方法求之 .
分区域考虑 , 不妨设 X k 与 X 同分布 .
当 x≥ y 时 , 显然 ( X( 1 ) ≤ x, X( n) ≤ y ) = ( X( n ) ≤ y) , 故有
n
P( X ( 1 ) ≤ x, X( n) ≤ y) = P( X ( n) ≤ y ) = ( P( X ≤ y ) ) .
n
　　当 x < y 时 , ( x < X( 1 ) , X( n) ≤ y ) = k∩ ( x < Xk ≤ y ) , 有

=1
n
P( x < X( 1 ) , X( n) ≤ y) = [ P( X ≤ y) - ( P( X ≤ x) ] .
由
( X( n ) ≤ y) = ( X ( 1 ) ≤ x, X( n) ≤ y) ∪ ( x < X ( 1 ) , X ( n) ≤ y ) ,
即
( X ( 1 ) ≤ x, X ( n ) ≤ y) = ( X ( n) ≤ y ) - ( x < X( 1 ) , X( n) ≤ y) .
从而当 x < y 时 , 有
P( X( 1 ) ≤ x, X( n) ≤ y) = P( X( n) ≤ y) - P( x < X( 1 ) , X( n) ≤ y) .
于是得
n
P( X( 1 ) ≤ x , X ( n) ≤ y ) = [ P( X ≤ y ) ] - [ P( X ≤ y) -
n
P( X ≤ x ) ] ,
所以
　 P( X( 1 ) ≤ x, X ( n) ≤ y)
[ P( X ≤ y ) ] n , x ≥ y,
=
[ P( X ≤ y ) ] n - [ P( X ≤ y) - P( X ≤ x ) ] n , x < y.
　　极差 : Rn = X( n ) - X ( 1 ) 是刻画 X1 , … , X n 取值波动大小的量 .
思考 : 如何求 Rn 的分布 ?
下面讨论两种主要的顺序统计量的分布 .
3 　均匀分布顺序统计量的分布
设{ Xk , 1≤ k≤ n}独立同分布且 Xk ～U[0 , t] 　 ( t > 0 ) , X( 1 ) , … ,

X( n) 为其顺序统计量 .
例 7 .2 　当 n = 2 时 , 求 ( X( 1 ) , X ( 2 ) ) 的联合概率密度函数 .
解　设 f ( x1 , x2 ) 为 ( X ( 1 ) , X ( 2 ) ) 的联合概率密度函数 , 用微元
法求之 .因 0 ≤ X ( 1 ) ≤ X ( n) ≤ t, 显然 f ( x1 , x2 ) 仅在 0 < x1 < x2 < t
区域非零 , 在其他区域上 f ( x1 , x2 ) = 0 , 故只需考虑 0 < x1 < x2 < t
的情形 .取充分小 h > 0 满足
0 < x1 < x1 + h < x2 < x2 + h < t,
则
　 { x1 < X ( 1 ) ≤ x1 + h, x2 < X( 2 ) ≤ x2 + h}
= { x1 < X1 ≤ x1 + h, x2 < X2 ≤ x2 + h} ∪ { x1 < X2 ≤
　 x1 + h, x2 < X1 ≤ x2 + h} ,
且由 x1 + h < x2 条件 , 知等式右边两事件不相容 , 故
2
P( x1 < X( 1 ) ≤ x1 + h, x2 < X ( 2 ) ≤ x2 + h) = 2 ! h2 ,
t
因而在 0 < x1 < x2 < t 上 , 有
P( x1 < X ( 1 ) ≤ x1 + h, x2 < X ( 2 ) ≤ x2 + h)
f ( x1 , x2 ) = lim
h→ 0 h2
= 22 !,
t
故 ( X ( 1 ) , X ( 2 ) ) 的联合概率密度函数为
f ( x1 , x2 ) = 22 !・ I( 0 < x 1 < x 2 < t) .

t
　　类似于例 7 .2 的证明 , 我们有下面的结论 .
命题 7 .2 　设{ Xk , 1≤ k≤ n}独立同分布且 X k ～ U[ 0 , t] ( t >
0) , 则其顺序统计量的联合概率密度函数为
n!
f ( x1 , … , xn ) = ・ I( 0 < x1 < … < x n < t) . ( 7 .3)
tn
证明留给读者 .
作为练习 , 请读者在 n = 3 时 , 给出上述命题的严格证明 , 并仔
细考虑每步做法的必要性与根据 .
例 7 .3 　当 n = 2 时 , ( 1 ) 令 Y1 = X ( 1 ) , Y2 = X( 2 ) - X ( 1 ) , 求
( Y1 , Y2 ) 的联合概率密度函数 ; (2 ) 问 Y1 , Y2 是否独立 ? 是否同分
布 ? 试证明你的猜想 .
解　从略 , 作为练习 , 留给有兴趣的读者完成 .
如读者做出例 7 .3 , 则不难证明以下结果 .( 初次读本书的读
者 , 可先跳过以下命题 .)
命题 7 .3 　设{ Xk , 1≤ k≤ n}独立同分布且 X k ～ U[ 0 , t] ( t >
0) , X ( 1 ) , … , X( n) 为其顺序统计量 , 则 X ( 1 ) , X ( 2 ) - X ( 1 ) , … , X( n) -
X( n - 1 ) , t - X( n) 不独立 , 但同分布 .
证明　从略 , 有兴趣的同学可作为练习 .
4 　指数分布顺序统计量的分布
例 7 .4 　设 X1 , X2 独立 , 且 X k ～ Ex (λk ) 　 ( 1 ≤ k≤ 2 ) , X( 1 ) ,
X( 2 ) 为其顺序统计量 , 求 ( X ( 1 ) , X ( 2 ) ) 的联合概率密度函数 .
解　设 ( X ( 1 ) , X ( 2 ) ) 的联合概率密度函数为 f ( t1 , t2 ) ; 因 0 ≤
X( 1 ) ≤ X ( 2 ) , 只需考虑 0 < t1 < t2 的情形 , 用微元法类似于例 7 .2 的
讨论可得
f ( t1 , t2 ) = λ1λ2 ( e - (λ1 t1 + λ2 t2 ) + e - (λ1 t2 + λ2 t1 ) ) I ( 0 < t1 < t2 ) .

当 λi =λ时 , f ( t1 , t2 ) = 2λ2 e - λ( t1 + t2 ) I( 0 < t1 < t2 ) .
应用微元法 , 可证以下命题 .
命题 7 .4 　设 { X k , 1 ≤ k ≤ n} 独立同分布且 Xk ～ Ex (λ) ,
X( 1 ) , … , X ( n) 为其顺序统计量 , 则 :
(1 ) ( X( 1 ) , … , X ( n) ) 的联合概率密度函数为
n - λ( t + … + t )
f ( t1 , … , tn ) = n !λ e 1 n
I( 0 < t1 < … < tn ) . ( 7 .4)
　　 (2 ) X ( 1 ) , X ( 2 ) - X ( 1 ) , … , X ( n ) - X( n - 1 ) 独立 , 但不同分布 .
　　 (3 ) X( 1 ) ～ Ex ( nλ) , ( 7 .5)
X ( k+ 1 ) - X( k) ～ Ex( ( n - k)λ) , 　 1 ≤ k ≤ n - 1 ( 7 .6)
　　以上结果,有广泛的应用 .参看第 5 章练习题及第 6 章有关内容 .
练　习　题
3 .1 　设离散型随机变量 ( X , Y ) 的联合分布律如下 :
P( X = 1 , Y = 1 ) = 2/ 27 , P( X = 1 , Y = 2) = 5/ 27 ,
P( X = 1 , Y = 3 ) = 1/ 27 , P( X = 2 , Y = 1) = 4/ 27 ,
P( X = 2 , Y = 2 ) = 7/ 27 , P( X = 2 , Y = 3) = 2/ 27 ,
P( X = 3 , Y = 1 ) = 1/ 27 , P( X = 3 , Y = 2) = 3/ 27 ,
P( X = 3 , Y = 3 ) = 2/ 27 .
　　求 : (1 ) X 及 Y 的边缘分布律 ; (2 ) X 关于 Y = i ( i = 1 , … ) 的
条件分布律 ; ( 3) X + Y 的分布律 ; ( 4) X Y 的分布律 ; ( 5) X∨ Y 的
分布律 ; ( 6) X∧ Y 的分布律 .
3 .2 　设 { Y n , n ≥ 1 } 独立同分布 , P( Y n = 1 ) = p ≥ 0 ,
n
P( Y n = - 1) = q ≥ 0 , p + q = 1 .令 X0 = 0 , X n = X0 + ∑Y
k= 1
k
( n ≥ 1) . 称{ Y n , n ≥ 1} 为伯努利随机游动 .令 A = { X3 = 1} , B =
{ X5 - X1 = 2 } .
练习题　 129
( 1) 求 P( A B) , P( B| A) ; (2) A, B 是否相容 ? 说明理由 ; (3) 当

p = 2/ 3 , q = 1/ 3 时 , A , B 是否独立 ? 证明你的结论 ; (4 ) 求 X3 的
分布律 ; ( 5) 求 ( X2 , X3 ) 的联合分布律 ; ( 6 ) 求 X3 关于 ( X2 = i )
( i = - 2 , 0 , 2) 的条件分布律 ; (7 ) 分别求 X2 n + 1 和 X2 n 对应的分布
律 ; ( 8) 求 P( X1 > 0 , X2 > 0 , X3 > 0 , X4 = k) ( 0 ≤ k≤ 4 ) ; ( 9 ) 求
P( X1 > 0 , X2 > 0 , X3 > 0 , X4 > 0 , X5 = k) 　 (0 ≤ k≤5 ) .
3 .3 　设 X = ( X1 , X2 , … , X5 ) 服从参数为 ( n; 5 ; p1 , … , p5 ) 的
多项分布 .求 : ( 1) X1 + X3 的分布律 ; ( 2) ( X1 + X3 , X2 + X4 ) 的联
合分布律 .
3 .4 　设二维随机变量 ( X , Y ) 有如下分布 :
(0 , 0 ) ( 0 , 1) (1 , 0 ) ( 1 , 1)
,
p1 0 p2 p3
其中 p i ≥0 , i = 1 , 2 , 3 , p1 + p2 + p3 = 1 .
(1 ) 求 m ax{ X , Y} 和 min { X , Y }的联合分布律 ; (2 ) 给出 X 和
Y 独立的条件 .
3 .5 　设 ( X , Y ) 的联合密度为
C
f ( x, y) = 2 2 .
(1 + x ) ( 1 + y )
　　求 : ( 1) 系数 C; (2 ) ( X , Y ) 落在以 ( 0 , 0) , ( 0 , 1) , ( 1 , 0) , ( 1 , 1)
为顶点的正方形内的概率 ; ( 3) X , Y 是否独立 ?
3 .6 　一机器制造直径为 X 的圆轴 , 另一机器制造内径为 Y
的轴衬 , 设 ( X , Y ) 的联合密度为
2500 , 0 .49 < x < 0 .51 , 0 .51 < y < 0 .53 ;
f( x , y) =
0, 其他 .
　　若轴衬内径与轴的直径之差在 (0 .0 04 , 0 .0 36 ) 内 , 则两者可以
相适衬 , 求任一轴与任一轴衬相适衬的概率 .
3 .7 　设 ( X , Y ) 的联合概率密度函数是二元正态密度函数为
1 1 (2 x2 + y2 + 2 xy - 22 x - 14 y+ 65)
f ( x, y) = exp - .
2π 2
　　 ( 1 ) 把它化为标准形式并指出 μ1 , μ2 ,σ12 ,σ22 , ρ; ( 2 ) 求出
f X ( x) 及 f Y ( y ) ; (3 ) 求 Y 在 X = x 时的条件概率密度函数 .
3 .8 　设系统 L 由两个相互独立的子系统 L1 , L2 联接而成 ,
联接的方式分别为 : ( 1) 串联 ; ( 2) 并联 ; ( 3) 备用 ( 当系统 L1 损坏
时 , 系统 L2 即开始工作 ) .已知 L1 , L2 的寿命分别为 X 和 Y , 相应
- αx - βy
的概率密度为 : f X ( x ) = αe I ( x > 0 ) , f Y ( y ) = βe I ( y > 0 ) , 其中 α>
0 ,β > 0 ,α≠β.试分别就这 3 种联接方式找出系统 L 的寿命 Z 的
概率密度 .
3 .9 　设某种商品一周的需要量是一个随机变量 , 其密度为
f ( x) = xe - x I ( x > 0 ) .如果各周的需要量是相互独立的 .试求 : ( 1 ) 2
周的需要量的概率密度 ; ( 2) 3 周的需要量的概率密度 .
3 .10 　若 X , Y 相互独立且有相同的分布 N ( 0 , 1 ) , 试证 : U =
2 2
X + Y 与 V = X/ Y 相互独立 .
3 .11 　已知 X1 , … , X n 独立且同为参数为 λ 的指数分布 ,
X( 1 ) , … , X ( n) 为其顺序统计量 .记
Y1 = X ( 1 ) , Y2 = X( 2 ) - X ( 1 ) , … , Y n = X ( n) - X ( n - 1 ) .
求证 Y1 , … , Y n 相互独立 .
3 .12 　设 X(ω) ～ N( 40 , 22 ) , 令
A = {ω:36 ≤ X(ω) ≤ 44 } ,
36 , 当 X(ω) ≤ 36 ,
Y (ω) = X(ω) ・ I A (ω) , 　
44 , 当 X(ω) ≥ 44 .
Z(ω) = X(ω) ∧44 .
试求 : ( 1) Y (ω) 及 Z(ω) 的分布函数 ; ( 2) X(ω) 在 A 发生的条
件概率密度函数 .
3 .13 　设 { X i , 1 ≤ i ≤ n} 独立 , X i 的概率密度函数为
f i ( u) ( 1 ≤ i ≤ n) ,ξ为离散型随机变量 , 分布为 P(ξ= i) = pi ≥
n
0 , ∑ p i = 1 , 且ξ与{ X i , 1 ≤ i ≤ n} 独立 .令 X = ∑I (ξ= i) ・ Xi ,
i i= 1
练习题　 131
求 X 的概率密度函数 .试举出出现这个问题的实际例子 .
3 .14 　设 X1 , X2 , … , X k 独立同分布 , 且 X i ～ G( p) .求 Sk =
k
∑i=1
X i 的概率分布 .
2
3 .15 　设 X, Y 独立 , X ～ N(μ,σ ) , P( Y = 1) = p > 0 , P( Y =
2) = 1 - p = q > 0 , 求 Z = X・ Y 的概率密度函数 .
3 .16 　设 X , Y 独立 , X ～ N(μ,σ2 ) , Y 为离散型随机变量 ,
P( Y = ak ) = pk ≥ 0( k ∈ N \ { 0} , ∑ p k = 1) .求 Z = X + Y 的
k
概率密度函数 .
3 .17 　 { Yn , n≥ 0} 独立同分布 , 且 P( Yn = 1) = p > 0 , P( Yn =
0) = 1 - p = q > 0 , N ～ P o(λ) 且与{ Y n , n ≥ 0 } 独立 .试求 S =
N
∑Y
n= 0
n 的分布律 .
2
3 .18 　设 X ～ N(10 , 2 ) , Y ～ B(10 , 2/ 3) , X 与 Y 独立, 求 Z =
X + Y 的概率密度函数 .
2 2
3 .19 　设 ( X , Y ) ～ N( 0 , 0 ,σ1 ,σ2 ,ρ) .
(1 ) 求 Z = X/ Y 的概率密度函数 ;
(2 ) 当 ρ= 0 时 , 证明 Z = X/ Y 的概率密度函数为 f 2 (δ) =
α/ π(α2 + δ2 ) , 其中 α= σ1 σ2- 1 .
2
3 .20 　设 X , Y 独立 , X ～ N (μ,σ ) , Y ～ G( p) : P( Y = k) =
(1 - p) k - 1 p , k ∈ N \ { 0} .试求 : W = X/ Y 的概率密度函数 .
3 .21 　设 { Xi , 1 ≤ i ≤ n} 独立同分布 , Xi ～ U( 0 , t) , X( 1 ) ,
n
X( 2 ) , … , X ( n) 为其顺序统计量 , Sn = ∑X i= 1
i .
(1 ) 求 S2 的概率密度函数 ;
(2 ) 求 S3 的概率密度函数 ;
(3 ) 当 n = 3 时 , 求 X ( 1 ) , X ( 2 ) , X ( 3 ) 的联合概率密度函数 ;
(4 ) 当 n = 3 时 , 试证 : X( 1 ) , X( 2 ) - X ( 1 ) , X ( 3 ) - X ( 2 ) , t - X ( 3 )
不独立但同分布 .
3 .22 　设 { X i , 1 ≤ i ≤ n} 独立 , 且 X i ～ Ex(λi ) ( i = 1 , … ,
n) .求 :
(1 ) X1 ∧ X2 , X1 ∨ X2 , X1 + X2 的概率密度函数 ;
(2 ) Zn = X1 ∧ X2 ∧ X3 ∧ … ∧ X n 的概率密度函数 ;
(3 ) X1 在 X1 ≤ X2 下的条件概率密度函数 ;
(4 ) X1 在 X1 ≤ X2 ≤ X3 下的条件概率密度函数 ;
(5 ) X2 在 X1 ≤ X2 ≤ X3 下的条件概率密度函数 .
3 .23 　设 { X i , 1 ≤ i ≤ n} 独立 , X i ～ Ex(λi ) ( i = 1 , … , n) ,
n
Sn = ∑X,X
i= 1
i ( 1) , X( 2 ) , … , X ( n) 为其顺序统计量 .( 1) 求 X1 / X2 的
概率分布函数 ; ( 2) 求 ( S1 , S2 ) 的联合概率密度函数 ; (3 ) 若 λi =
λ(1 ≤ i ≤ n) , 试问 : X ( 1 ) , X ( 2 ) - X( 1 ) , … , X ( n) - X( n - 1 ) 是否独立 ?
同分布 ? 试证你的猜想 .
3 .24 　 { X i , 1 ≤ i ≤ n} 独立同分布 , X i ～ Ex(λ) ( i = 1 , … ,
n ∞
n) , S0 = 0 , Sn = ∑X
i=1
i ＂ t ≥ 0 , 定义 N( t) = ∑I
n= 1
( S ≤ t)
n
. (1 ) 证
N (1 ) ～ Po(λ) ; (2 ) N( 1) 与 N( 2) - N( 1) 独立否 ?( 3) 求 S1 在
N (1 ) = 0 下的条件概率密度函数 ; (4 ) S1 在 N( 1) = 1 下的条件
概率密度函数 .
( 提示 : ( N( 1) = n) = ( Sn ≤ 1 < Sn + 1 ) .)
3 .25 　设 { X i , 1 ≤ i ≤ n} 独立 , X i ～ Ex(λi ) ( i = 1 , … , n) ,
n
X( 1 ) , X( 2 ) , … , X ( n) 为其顺序统计量 , ＂ t > 0 , N n ( t) = ∑I
i= 1
( X
( i)
≤ t)
( n ≥ 2) .求 : (1 ) N3 ( t) 的分布律 ; ( 2) 当 n = 2 时 , X( 1 ) 的概率密
度函数及 X ( 1 ) 在 X1 ≤ X2 下的条件概率密度函数 ; ( 3) X( 1 ) 在
N2 ( t) = 0 下的条件概率密度函数 ; ( 4) X ( 2 ) 在 N2 ( t) = 1 下的条
件概率密度函数 .
练习题　 133
3 .26 　记号和条件同上题 .(1 ) 求 X ( 1 ) , X ( 2 ) 在 N2 ( t) = 2 下

的联合条件概率密度函数 ; (2 ) 当λi = λ> 0 ( 1 ≤ i ≤ 2) 时 , 试问 :
X( 1 ) 与 X( 2 ) - X ( 1 ) 在 N2 ( t) = 2 下是否条件独立 ? 同分布 ? 试证
你的猜想 .
2
3 .27 　设 X1 , … , X n 独立同分布 , 且 X k ～ N (μ,σ ) , 令 Z1 =
n n
X1 + X2 , Z2 = X1 - X2 ,珡
Xn = ∑X/
k= 1
k n, Sn = ∑( X
k=1
k - 珡
Xn )2 .
(1 ) 求 ( Z1 , Z2 ) 的联合概率密度 ; (2 ) 证明 Z1 与 Z2 相互独立 ;
(3 ) 求珡
X n 的概率密度函数 ; ( 4) 求 S2 的概率密度函数 ; (5 ) 求
X2 , S2 ) 的联合概率密度函数 ; (6 ) 证明珡
(珡 X2 和 S2 相互独立 .
3 .28 　 { Y n , n ≥ 1} 独立同分布 , P( Y n = 1 ) = p > 0 , P( Y n =
0) = r ≥ 0 , P( Y n = - 1 ) = q > 0 , p + r + q = 1 .令 X0 = i, X n =
n
X0 + ∑ Y k , 对＂ n ≥ 1 记 An - 1 = ( X0 = i, X1 = i1 , … , X n - 1 =
k= 1
in - 1 ) , Bn = ( Xn = in ) , 　 Cn + 1 = ( X n + 1 = in + 1 ) .
(1 ) 若 P( An - 1 , Bn , Cn + 1 ) > 0 , 证明 P( Xn + 1 = in + 1 | X0 = i,
X1 = i1 , … , X n = in ) = P( Xn + 1 = in + 1 | X n = in ) ( 即证 An - 1 , Cn + 1
关于 Bn 条件独立 ) ; An - 1 , Cn + 1 是否独立 ?说明理由 .
(2 ) 当 X0 = i = 0 时 , ＂ n, m ≥ 1 , X n 与 X m+ n - X m 是否同分
布 ?是否相互独立 ?
(3 ) 求 X3 的分布律 , 及 ( X2 , X3 ) 的联合分布律 .
(4 ) X3 关于 X2 的条件分布律, X3 在 X2 ≥ 0 下的条件分布律 .
n
3 .29 　设 Y n , Xn 同上题中定义 , 记 N j ( n) = ∑I k= 1
( Y = j)
k
,j∈
{ - 1 , 0 , 1 } .求 : ( 1) N1 ( n) 的分布律 ; (2 ) ( N0 ( n) , N1 ( n) ) 的联合
分布律 ; ( 3) N0 ( n) + N1 ( n) 的分布律 .
3 .30 　设 Y n , Xn 同上题 , 但 X0 = 0 , r = 0 , p + q = 1 .记
T0 1 = min { n, n ≥ 1 , Xn = 1} , T = mi n{ n, n ≥ 1 , Xn = - 1
或 Xn = 2 } .
　　求 : (1) P( T01 = k) (1 ≤ k≤ 7); (2) T 的分布律 ; (3 ) T ∧ 7 的
分布律及 T 在 ( T ≥ 7 ) 下的条件分布律 ; (4 ) P( X T = - 1) 及
P( X T = 2 ) .
3 .31 　设某种电缆有内外两层绝缘 .记外层绝缘的寿命为
X , 内层绝缘的寿命为 Y , ( X, Y ) 有联合密度 f ( x, y ) =
2θ- 2 e - ( x + y )/ θ( 0 < x < y < + ∞ ) .(1 ) 设 U = ln( X) , 求 U 的密度函
数 ; ( 2) 求已知外层绝缘寿命为 x 时 , 内层绝缘的寿命的条件分
布 ; ( 3) 求已知外层绝缘寿命大于 x0 时 , 内层绝缘的寿命小于 y0
的条件概率 .
2
3 .32 　设 X1 , … , X n 独立同分布 , X k ～ N (0 , 1 ) , Y ～ N( 0 ,
n
∑X
2 2 2
1 ) , 且与 { Xk , 1 ≤ k ≤ n} 独立 , 记 χ ( n) = k , T ( n) =
k=1
2 1/ 2 2 2
Y/ (χ ( n)/ n) , 称 χ ( n) 为自由度为 n 的χ 分布 ; T ( n) 是自由度
为 n 的 t －分布 .它们在数理统计中有广泛应用 .求 ( 1) :χ2 ( n) 的概
率密度函数 ; ( 2) T ( n) 的概率密度函数 .
3 .33 　设 X1 , X2 独立 , 且 X1 = λ2 ( n) , X2 = λ2 ( m) , 其中
λ2 ( n) 如上题定义 , 记 F( n, m) = n- 1 X1 / m- 1 X2 , 求 F( n, m) 的概率
密度函数 .
2
注　 χ ( n) , T( n) , F( n, m) 在数理统计中是 3 个最常用的随
机变量 , 它们的概率密度函数分别称为自由度是 n 的卡方分布 , 自
由度为 n 的 t －分布及自由度为 ( n, m) 的 F－分布 .
3 .34 　设 f n , f 是定义在 (Ω, F ) 上的随机变量 ( n > 0) , 证明 :
∞ ∞ ∞
1
ω: n→
lim f n (ω) = f (ω) = k∩ ∪ ∩ ω: | f n (ω) - f (ω) | < ,
∞ =1 N =1n= N k
∞ ∞ ∞
1
ω: nlim f n (ω) ≠ f (ω) = k∪ ∩ ∪ ω: | f n (ω) - f (ω) | ≥ .
→∞ = 1 n= 1 n= N k
　　 3 .35 　设 ( X , Y ) 是 (Ω, F ) 上的随机变量 . 证明 : X + Y ,
练习题　 135
X - Y , X Y , 及 X/ Y ( Y ≠ 0) 均是随机变量 .
3 .36 　设{ Xk , 1 ≤ k ≤ n} 独立同分布 , 且 X1 与 X 同分布 , 其
分布函数为 F( x ) = P( X ≤ x ) ( 这在数理统计中称随机变量 X 为
总体 , { Xk , 1 ≤ k ≤ n} 为其样本 ) , X( 1 ) , X ( 2 ) , … , X ( n ) 为其顺序统
n
计量 . ＂ x ∈ R , 记αn ( x) = ∑I
k= 1
(X
( k)
≤ x) Fn ( x) = αn ( x )/ n, 通常称
,珟
珟
Fn ( x) 为 X 的经验分布函数 .
(1 ) 试求 :αn ( x ) 的分布律 ;
n
k k
(2 ) 试证: 对＂ x ∈ R 固定 , ∑ P 珟
Fn ( x) = = F( x) .
k= 0 n n
2 2
3 .37 　设 ( X , Y ) ～ N(μ1 ,σ1 ,μ2 ,σ2 ,ρ) , 令 Z1 = X - μ1 , Z2 =
-1
Y - μ2 - ρσ2σ1 ( X - μ1 ) .
(1 ) 求 Z2 的概率密度函数 , 及 ( Z1 , Z2 ) 的联合概率密度函数 ;
(2 ) 证明 Z1 与 Z2 相互独立 .
3 .38 　设 X = ( X1 , X2 , X3 ) 和 Y = ( Y1 , Y2 , Y3 ) 分别是参数
为 ( n; 3; p1 , p2 , p3 ) 和 ( n;3; q1 , q2 , q3 ) 的三项分布, p1 + p2 + p3 = 1 ,
X1 　 X2
q1 + q2 + q3 = 1 且 X 与 Y 相互独立 .求: Z = = X1 Y2 -
Y1 　 Y2
X2 Y1 的分布律 .
3 .39 　设 X1 , X2 独立同分布 , X i ～ N (0 ,σ2 ) , 证明 X21 + X22
与 X1 / X2 相互独立 .
3 .40 　设 ( X1 , … , Xn ) 独立同分布 , X1 ～ N( 0 , 12 ) , 证明
n n
∑X ∑X
2 2
i 与 X k/ i 相互独立 .
i=1 i=1
3 .41 　＂ t ≥ 0 , 记 N( t) 为一粒子接收器在 [0 , t] 上到达的粒

子数 .设 N(0) = 0 , S0 = 0 , Sn 为第 n 个粒子的到达时刻, 且 P( Sn =
S n + 1 ) = 0 ( ＂ n ≥ 1) .记 X k = Sk - S k - 1 ( ＂ k ≥ 1) .
(1 ) 试问能否用 ( S n ≤ t) ( n ≥ 1) 来表示 N( t) ?
(2 ) 下列各组事件是否等价 ?( N( t) ≥ n) 与 ( Sn ≤ t) , ( N( t) =
n) 与 ( Sn ≤ t < Sn + 1 ) .
n- 1
λ(λt ) - λt
(3 ) 若 Sn 的概率密度函数为 f S n ( t) = e I ( t≥ 0 ) , 试求
( n - 1) !
P( N( t) = 1) , 并证明 ( X1 , X2 ) 相互独立 .
3 .42 　设{ Xn , n ≥ 1} 独立同分布 , X n ≥ 0 , 记 v = min{ n: n ≥
1 , Xn > 1m ax X k } , 试求 P( v > n) .
≤ k≤ n
2
3 .43 　设 ( X1 , X2 , X3 ) 独立同分布 , X1 ～ N( 0 , 1 ) , 证明 Y =
2 1/ 2
( X1 + X2 X3 )/ (1 + X1 ) 是正态分布 .
3 .44 　设 { Xn , n ≥ 1 } 独立同分布 , X1 ～ Ex(λ) , 记 N1 =
n
min{ n: n ≥ 1 , ∑ X k > 1} , 求 N1 的分布律 .

k= 1
3 .45 　设 { Y k , 1 ≤ k ≤ n} 为随机变量 . ＂ ε> 0 , 试证明 :

P( | Y1 + Y2 | > ε) ≤ P( | Y1 | > ε
/ 2) + P( | Y2 | > ε
/ 2) ,
n n
P ∑Y
k= 1
k >ε≤ ∑ P( |
k= 1
Yk | > ε
/ n) .
　　 3 .46 　冯・诺伊曼 ( J .Von .Neumann) 算法　设 π( x ) 和 g( x)

是定义在[ a, b] 上的两个概率密度函数 ( a < b, a, b∈ R ) , 且存在常
数 M > 0 , 使对＂ x∈ [ a, b] ,π( x ) ≤ M g( x) 成立 .设随机变量 Y 的
概率密度为 g ( x ) , U～U[ 0 , 1] , 而随机变量 Z 由下列步骤产生 :
(1 ) 独立抽取 Y～ g( x ) , U～ U[0 , 1 ] .
(2 ) 若事件 A = {ω: U≤ M g( Y ) } 发生 , 取 Z = Y ; 否则回到步
骤 (1 ) .
试求 P( A) 并证明 Z 关于 A 的条件概率密度为 π( x ) .
第4章
数字特征
　　前面我们介绍了可以完满表达随机变量概率性质的分布函数
F( x ) .然而在理论与应用中 , 人们往往更关心随机变量的某些主
要特征和相互关系 , 这是引出数字特征的原因之一 .
数字特征是由随机变量的分布函数 F( x ) 确定的 , 是对 F( x)
进行某种运算的结果 , 以便突出反映其主要特征及相互间的某种
关系 .本章着重介绍若干常用的数字特征 , 其中 , 数学期望和条件
数学期望是最重要而又最基本的两个 .引入这些重要概念将使随
机数学的研究内容与应用更加多彩多姿 .
值得一提的是 , 由于条件数学期望能更精细和深入地刻画多
个随机变量之间的关系 , 以及它的良好性质 , 因此 , 它在现代随机
数学理论的迅猛发展和广泛应用的舞台上扮演越来越重要的
角色 .
4 .1 　数学期望
1 　数学期望的定义
　　在随机变量的数字特征中 , 我们常常关心随机变量取值“ 平
均”的大小 , 能够反映这个特征的就是随机变量的数学期望 .
我们先来看一个例子 .
例 1 .1 　某人独立射击 100 次 , 结果如下 :
击中环数 8 9 10
相应次数 10 20 70
138 　第 4 章数字特征
如何衡量该射手的射击水平 ? 显然首先要看其每次击中的平均环数 .
10 20 70
解　所求的平均环数 = 8 × + 9× + 10 × = 9 .6 .
100 100 100
可见 , 100 次射击的平均环数等于击中的环数乘以该环数出现的
频率求和 .此数更集中反映射手的水平 .
我们将上例抽象化 , 记 X 为击中的环数 , 是离散型随机变量 ,
∞
其分布律为 P( X = xi ) = p i , 则 X 的平均值为 E X = ∑x
i= 1
i pi .
定义 1 .1 　若离散型随机变量 X 的分布律为 P( X = x i ) =
p i , ( i ∈ N \ {0 } ) , 且 ∑ | x i | pi < ∞ , 则称
i
def
EX ∑x
i
i pi ( 1 .1)
为 X 的数学期望 ( Expectation) , 简称期望 .
特别地 , 当随机变量的取值为 P( X = x i ) = 1 ( 1 ≤ i ≤ n)
n
n
时 , 则 E X = 1 ∑ xi , 即是 x i ( 1 ≤ i ≤ n) 的算术平均值 .所以 , 数
n i =1
学期望是算术平均的推广 , 即加权平均值 , 故亦称为均值 ( mean) .
注　定义中要求该级数绝对收敛 , 是为了保证该和数不随求
和次序的改变而改变 .当 ∑ | x i | pi 发散时 , 称 X 的数学期望不
i
存在 .
例 1 .2 　若 X ～ B( 1 , p) , 则 E X = 0 × (1 - p) + 1 × p =
p = P( X = 1 ) , 即 E X = P( X = 1 ) .
在这里我们注意到数学期望和概率分布的关系 , 为此考察事
件 A ∈ F 的示性函数为 I A (ω) 的期望 E( I A (ω) ) = P( A) , 等于事
件 A 的概率 .这就将数学期望和事件的概率联系起来了 .因此 , 求
某事件发生的概率就可以化为求其示性函数的数学期望 , 可见引
进数学期望将丰富概率论的研究内容 .
4 .1 数学期望　 139
例 1 .3 　若 X ～ B( n, p) , 记 q = 1 - p 则
n n
kn!
∑ k P( X ∑
k n - k
EX = = k) = pq
k= 0 k=0 k !( n - k) !
n
n( n - 1) !p
= ∑
k= 1 ( k - 1 ) !( n - 1 - ( k - 1) ) !
pk - 1 qn - 1 - ( k - 1 )
n-1
( n - 1) ! k′ n - 1 - k′
= np ∑
n- 1
p q = np ( p + q) = np .
k′= 0 k′!( n - 1 - k′) !
　　例 1 .4 　若 X～P o(λ) , 则
∞ ∞
λk - 1
k
λ -λ
∑ ∑
-λ
EX = k e =λ e = λ.
k= 0 k! k= 1 ( k - 1) !
在求随机变量的期望中 , 常要用到如下结果 .
∞
1
∑x
k
(1 ) = , | x | < 1;
k= 0 1 - x
∞
1
∑ kx
k-1
(2 ) = 2 , | x | < 1;
k= 1 (1 - x)
∞ k
x = ex .
(3 ) ∑k= 0 k!
∞ ∞
1 1
因为当 | x | < 1 时 , ∑ k x ∑x ′x = ′=
k -1 k
= 2 .
k= 1 k= 0 1 - x (1 - x)
∞
1
例 1 .5 　若 X ～ G( p) , 则 E X = ∑ k(1
k= 1
- p) k - 1 p =
p
.
2
例 1 .6 　若 X ～ P o(λ) , 求 E X .
2 2
解　由于 X 为非负整数 , 此时 P( X = k ) = P( X = k) , 故
∞ ∞
λk - λ λk -λ
EX = ∑ k ∑k
2 2
e = e
k=0 k! k= 1 ( k - 1) !
∞ k ∞ k
λ λ
= ∑
k=2 ( k - 2) !
e- λ + ∑
k= 1 ( k - 1) !
e- λ
2
= λ + λ.
　　由例 1 .6 自然会想到 , 对于 X 的一般函数 Y = g( X) 是否会

有类似的结果 ?事实上 , 可以证明 , 对于离散型随机变量 X, P( X =
xk ) = pk , 若 g( x) 是连续函数或逐段单调函数 , 则 Y = g( X) 也是
离散型随机变量 .且 EY = E( g( X) ) = ∑ g( x
k
k ) P( X = xk ) .
特殊情形　设 X 为取值非负整数随机变量 , 则有
∞
EX = ∑ P( X ≥ n)
n=1
.
　　证明留作练习 .这里仅提示一下 , 注意应用下式

∞ ∞ n
EX = ∑ nP ( X =
n= 1
n) = ∑ ∑1n= 1 k=1
P( X = n) .
　　对于连续型随机变量 , 有如下的定义 .
定义 1 .2 　设连续型随机变量 X 的概率密度函数是 f ( x ) , 若
∞
∫
-∞
| x | f ( x) d x < ∞ , 则称
∞
EX = ∫ - ∞
xf ( x) d x ( 1 .2)
为 X 的数学期望 .
1
例 1 .7 　若 X ～ U[ a, b] , 即 f ( x ) = I ( x ∈ [ a, b] ) , 则
b- a
b
1 a+ b
EX = ∫x b -
a a
dx =
2
.
- λx
例 1 .8 　若 X ～ Ex(λ) , 即 f ( x ) = λe I( x > 0 ) , 则
∞ ∞ ∞
1
∫ xλe ∫e
- λx - λx - λx
EX = d x = x( - e ) + dx = .
0 0 0 λ
2
　　例 1 .9 　若 X～ N (μ,σ ) , 则
∞ 2
1 - ( x - μ)
EX =
2πσ
∫
- ∞
( x - μ+ μ) e 2σ2 d x
∞ 2 ∞ 2
1 - ( x - μ) - ( x - μ)
=
2πσ
∫ - ∞
( x - μ) e 2σ
2
dx+ ∫ -∞
μe 2σ
2
dx = μ.
4 .1 数学期望　 141
等式右边第一项中被积函数为奇函数 , 故积分为 0 .
前面分别对离散型和连续型两种随机变量定义了数学期望 ,
对于一般随机变量 , 严格定义要用到黎曼－斯蒂尔切斯 ( Rie mann－
Stieltjes ) 积分 , 下面先介绍它的定义 .
2 　黎曼－斯蒂尔切斯积分
定义 1 .3 　设 g( x ) , F( x) 是R 上的函数 ( 不妨限制在 F( x ) 为
单调函数的情形 ) , ＂ [ a, b] , 设 a = x0 < x1 < … < xn = b,
Δx k = xk - x k - 1 ,δn = 1max Δxk ; 任取 uk ∈ [ xk - 1 , xk ] , 若极限
≤ k≤ n
n
li m∑ g( uk ) ( F( xk ) - F( xk - 1 ) ) = I 存在 , 则称极限
δ →0 k=1
n
b n
∫ g ( x ) d F( x )
a
n
→ 0∑
= δlim
k=1
g( uk ) ( F( xk ) - F( xk - 1 ) ) ( 1 .3)
为 g( x ) 关于 F( x ) 在 [ a, b] 上的黎曼－斯蒂尔切斯积分 ( 简称 R－S
积分 ) .
b +∞
若 a→lim ∫ g( x ) d F( x ) =∫
- ∞
b→ + ∞
a -∞
g( x ) d F( x ) 存在且有限 , 则称此
极限值为 g( x) 关于 F( x) 在 ( - ∞ , + ∞ ) 上的黎曼－斯蒂尔切斯

积分 .
注意它有如下特性 :
+∞ +∞
(1 ) 当取 F( x ) = x 时 , 则 ∫ - ∞ ∫
g( x ) d F( x ) =
-∞
g( x) d x 化为
通常的黎曼积分 .
(2 ) 当取 g( x) = x, F( x) 是离散型随机变量 X 的分布函数
时 , 即若 P( X = xk ) = pk ( k ∈ N \ { 0} ) , 则 F( x) = ∑p x ≤ x
k
k 为台阶
形跳跃函数 , 在 xk 有跳跃高度 p k , k ∈ N \ {0 } ; 则由定义可知
+∞
∫ -∞
xd F( x) = ∑x
k
k pk = E X .
(3 ) 当取 g( x) = x, 而 F( x) 是连续型随机变量 X 的分布函
数 , X 的概率密度函数为 f ( x) 或在R 上几乎处处有 F′( x) = f ( x)
+∞ +∞
存在时 , 则可证明 ∫ - ∞
xd F( x ) = ∫ -∞
x f ( x) d x = E X .此时上式左
边为 x 关于 F( x ) 的 R－S 积分 , 而右边是函数 x f ( x ) 的黎曼积分 .

(4 ) R－S 积分与普通定积分有相类似的性质 , 如线性性 , 积分
区间叠加性等 . 值得注意的是 : 若 a 点是 F ( x ) 的跳跃点 , 则
a+
∫
a
-
g( x) d F( x) = g( a) ( F( a+ ) - F( a- ) ) .
(5 ) 设 F( x ) 是随机变量 X 的分布函数 , 即 F( x ) = P( X ≤
x ) .则＂ a, b ∈ R , B ∈ B,
b
∫d F( x)
a
= P( X ∈ [ a, b] ) , P( X ∈ B) = ∫ x∈ B
d F( x ) .
定义 1 .4 　若随机变量 X 的分布函数为 F( x ) , 且满足
∞
∫
-∞
| x | d F( x) < ∞ , 则称
d ef ∞
EX ∫ -∞
xd F( x) ( 1 .4)
为 X 的数学期望 .
对于随机变量函数的数学期望有如下的定理
定理 1 .1 　设 g( x) 是一元博雷尔可测函数, 随机变量 X 的分
∞
布函数为 F( x) , 若 ∫ -∞
| g( x) | dF( x) < ∞, 则 g( X) 的数学期望为
∞
Eg ( X) = ∫ - ∞
g( x ) d F( x) . ( 1 .5)
　　注　在第 2 章已提过 , 逐段单调函数、连续函数均为博雷尔可
测函数 .
严格证明这一定理需要用到测度论 , 已超出本书的范围 , 这里
不作要求 , 但要学会运用这一结论去推导其他性质 .例如 :
对于离散型随机变量 X, 有
4 .1 数学期望　 143
E( g( X) ) = ∑ g( x
k
k ) P( X = xk ) . ( 1 .6)
　　对于连续型随机变量 X, 其概率密度函数为 f ( x) , 则有
∞
Eg ( X) = ∫ - ∞
g( x ) f ( x ) d x . ( 1 .7)
　　有了这样的性质 , 在求 g( X) 的数学期望时 , 就可以不必求出

g( X) 的分布 , 而只需要知道 X 的分布就可以了 .若将 g( X) 特殊
化 , 就可以得到各种数字特征———矩 .有关矩的概念将在后面具体
介绍 .
特殊情形 : 设 X 为非负随机变量 , 则
∞
EX = ∫ P( X >
0
u) d u .
　　证明　留作练习 .仅提示
∞ ∞ x
EX = ∫ xd P( X ≤
0
x) = ∫∫d y
0 0
d P( X ≤ x)
∞ ∞
=∫∫ d P( X ≤
0 y
x) d y .
3 　数学期望的性质
数学期望有一些简单性质列在下面 , 其中 X, Y , Xk 均表示随
机变量 , 且它们的数学期望均存在 .
(1 ) 对于常数 C, E( C) = C, E( X + C) = E( X) + C;
(2 ) ＂ ci ∈R ( i = 1 , 2) , E( C1 X + C2 Y ) = C1 E( X) + C2 E( Y ) ;
＂随机变量 Xk ( 1≤ k≤ n) , Ci ∈ R (1 ≤ i≤ n) ,
n n
E ∑C X
k=1
k k = ∑ C EX
k=1
k k ;
　　 (3 ) 若 X , Y 独立 , 则 E( X Y ) = E X・ E Y;
(4 ) 设 g( x, y) 为博雷尔可测函数 , X , Y 为连续型随机变量 ,
其联合概率密度函数为 f ( x, y) , 若 E| g( X , Y ) | < ∞ , 则
∞ ∞
Eg( X , Y ) = ∫∫ - ∞ -∞
g( x , y) f ( x , y ) d x d y . ( 1 .8)
　　我们仅对性质 3 在 ( X , Y ) 具有联合概率密度函数时 , 给出证
明如下 :
设 ( X , Y ) 的联合概率密度函数为 f ( x , y ) , X～ f X ( x ) , Y ～
f Y ( y) , 则
( X, Y ) 独立＂ ( x, y) ∈ R 2 , f ( x, y ) = f X ( x) f Y ( y ) ,
所以
∞ ∞ ∞ ∞
∫∫
E( X Y ) = - ∞ -∞
x y f ( x, y ) d x d y = ∫∫ - ∞ -∞
x y f X ( x ) f Y ( y) d x d y
∞ ∞
=∫ - ∞
x f X ( x) d x ∫ - ∞
y f Y ( y ) d y = E X ・ EY .
　　利用数学期望的以上性质 , 可简化某些复杂的计算与推导 .举
例如下 .
例 1 .10 　设{ Yn , n ≥ 1} 独立同分布 , P( Yn = 1 ) = p ≥ 0 ,
n
P( Y n = - 1) = q ≥ 0 , p + q = 1 , 记 X0 = 0 , X n = ∑Y
k=1
k , 称为从
原点出发的 ( 伯努利 ) 随机游动 .试求 E X n .

n n
解　由 EY k = p - q, 故 EX n = E∑ Y k = ∑ EY k = n( p - q) .
k= 1 k= 1
例 1 .11 　设有 n 个形状完全相同 ( 不可辨 ) 的球 , 随机地放在

m 个有编号的盒子中 ( 假设每一个球放在每一盒是等可能的 , 每盒
放的球数不限 ) .试求放有球的期望盒数 .
解　设有球的盒子数为 X , 显然可能取值为 1 , 2 , … , m, 依题
意要求 E X .但直接按定义求较繁 .为简化 , 设 Ak 为第 k 个盒子有
m
∑I
n
球,则有 X = A
k
, 易知 P(珡
Ak ) = ( 1 - 1/ m) , P( A k ) = 1 -
k=1
n
(1 - 1/ m) , 故
m m
E X = E∑ I A k = ∑ EI
n
A
k
= m[1 - (1 - 1/ m) ] .
k= 1 k=1
4 .2 方差　 145
数学期望的定义在本章以后的各节中有基本的重要作用 .掌

握数学期望定义的确切含义及其直观意义 , 对以后概念的理解均
有很大的帮助 .
下面 , 我们就从结构角度理解数学期望的意义 .
我们知道 , 数学期望
∑x
k
k P ( X = xk ) , X 为离散型随机变量 ,
EX = ∞
X 为连续型随机变量且具有概率
∫-∞
x f ( x) d x,
密度函数 f ( x ) .
　　以离散型随机变量 X 为例 .前面我们定义了示性函数 I A (ω) ,
则
X(ω) = ∑x k
k I ( X = x k) (ω) ,
因此
EX = ∑x k
k P ( X = xk ) .
　　样本空间 Ω可以用 x k 不同取值划分为若干个不相容事件的

并集 , E X 即为 X 在这些不相容事件上取值的加权平均 ; 连续型随
机变量也是一样 , 它可以表示成示性函数的线性组合的极限 ( 见第
2 章 ) , 对 X 取值的加权平均就得到了以上的积分形式 .
一个实际变量 X 可以写成 X = E X + ( X - E X) , 若 X 是测量
值 , 则 ( X - E X) 表示测量误差 , 其中 E X 是真值 , 相当于测量中我
们真正想要的东西 , 即测量对象的精确值 , 而测量值总在真值 E X
附近波动 , 这是由于实际现象中的误差及其他偶然因素造成的 .
4 .2 　方　　差
随机变量另一个重要的数字特征是方差 , 它反映了随机变量
取值的集中与分散程度 .在实际问题中 , 研究随机变量与其均值的
偏离程度是十分重要的 , 通常用 E[ ( X - E X) 2 ] 来度量这个偏离
程度 .
定义 2 .1 　设 X 是随机变量 , 则称
DX = E[ ( X - E X ) 2 ] ( 2 .1)
为 X 的方差 ( va riance ) , 也可记作 va r X, 称 σX = D X为 X 的标
准差或均方差 .
注　 (1 ) D X 大 , 反映 X 取值比较分散 ; D X 小 , 反映 X 取值
比较集中 .
(2 ) 常用的计算方差的公式为
2 2
DX = E X - ( EX ) . ( 2 .2)
事实上
D X = E( X - E X ) 2 = E( X2 - 2 X E X + ( E X ) 2 ) = E X 2 - ( E X ) 2 .
在实际测量中 , 方差反映了随机变量取值与数学期望的离散
程度 , 用以刻画测量精度 .DX 小 , 则说明测量精度高 .
例 2 .1 　若 X ～ B(1 , p) , 则 EX = p, E X2 = p, DX = EX2 -
( E X ) 2 = p - p2 = pq .
2 2
例 2 .2 　若 X ～ B( n, p) , 则 E X = np , E X = n( n - 1 ) p +
np , D X = npq .
例 2 .3 　若 X ～ Po(λ) , 则 E X = λ, E X 2 = λ2 + λ, DX = λ.
b
a+ b 1
∫x
2 2
例 2 .4 　若 X ～ U[ a, b] ,则 EX = , EX = dx =
2 a b- a
1 ( b2 + ab + a2 ) , 而
3
2 2 1 2
DX = EX - ( EX ) = ( b - a) .
12
例 2 .5 　若 X ～ Ex(λ) , 则 E X = 1 , D X = 12 .
λ λ
2
例 2 .6 　若 X ～ N (μ,σ ) , 则 E X = μ, 试求 DX .
4 .2 方差　 147
∫
2 2 2
解　 D X = E( X - E X ) = E( X - μ) = ( x - μ) ・
- ∞
2 ∞ 2
1 - ( x -μ) x - μ σ2 - t
, 则 DX = ∫
2
e 2σ2 d x .作变换 t = t e 2
d t .应用
2πσ σ 2π -∞
∞ 2
1 - t
∫
2 2
分部积分法 , 容易验算 t e 2
d t = 1 , 因此 DX = σ .
-∞
2π
由例 2 .6 我们知道 , 正态随机变量的概率密度函数中的两个
参数 μ和σ2 分别是该随机变量的数学期望和方差 .因而 , 正态随
机变量的分布完全可由它的数学期望和方差所决定 .
注意到若 X～ N(μ,σ2 ) , 则
P(μ - 3σ< x ≤ μ+ 3σ) = Φ(3 ) - Φ( - 3) = 0 .9974 ,
P( | X - μ| ≤ 2σ) = 0 .9545 .
因此 , 对于正态随机变量 , 其值落在区间[μ- 3σ, μ+ 3σ] 内的概率
接近于 1 .这也就看出了正态随机变量的集中程度 .在工程测量中
通常取 3σ为误差限 ( 精度要求高的 ) , 也有取 2σ为误差限的 ( 一般
精度要求 ) .
方差的一些简单性质如下 :
以下设 C1 , C2 , a, b 均为常数 .
(1 ) X = C, 或 P( X = C) = 1 , 则 D X = 0;
2
(2 ) D( C1 X + C2 ) = C1 D( X) ;
(3 ) 对于随机变量 X , Y , 有
D( X ± Y ) = DX + DY ± 2 E[ ( X - E X ) ( Y - E Y ) ] ,
D( aX ± bY ) = a2 D X + b2 DY ± 2 abE[ ( X - E X ) ( Y - EY ) ] .
　　若 X, Y 独立 , 则 D( X± Y ) = D X + D Y .
证明　 D( X ± Y ) = E{ [ ( X ± Y ) - E( X ± Y ) ] 2 }
= E{ [ ( X - E X ) ± ( Y - EY ) 2 ] }
= E[ ( X - E X ) 2 + ( Y - EY ) 2 ±
　 2 ( X - E X ) ( Y - EY ) ]
= E[ ( X - E X ) 2 ] + E( Y - EY ) 2 ±
　 2 E[ ( X - E X ) ( Y - EY ) ] .
　　若 X, Y 独立 , 则 X - E X , Y - E Y 独立 , 由数学期望性质可知
E[ ( X - E X) ( Y - E Y) ] = E( X - E X) ・ E( Y - E Y) = 0 , 故
D( X± Y ) = D X + D Y .
(4 ) 切比雪夫 (Че
быще
в) 不等式　若 D X < ∞ , 则对任意 ε> 0 ,
DX
P( | X - E X | ≥ ε) ≤ .
ε2
　　证明　设 X～ F( x) , 则
| X - EX |2
左端 = ∫ | X - E X | ≥ε
d F( x) ≤ ∫ | X - E X | ≥ε ε2
d F( x) ≤
+∞
| X - EX |2 DX
∫ - ∞ ε 2 d F( x) = 2 .
ε
　　切比雪夫不等式作为一个理论工具 , 其应用是很普遍的 .该不
等式给出了在未知随机变量 X 的分布下 , 事件{ω: | X - μ| < ε} 的
概率的一种估计方法 .
(5 ) DX = 0 的充要条件是 : 存在常数 μ, 使 P( X = μ) = 1 .
证明　“ ”　由 D X = 0 及切比雪夫不等式有 : ＂ n > 0 ,
1 1
P | X - EX | ≥ ≤0 ＂ n > 0 , P | X - EX | < = 1, 又
n n
+∞
( X = E X) = n∩ | ( X - EX ) | < 1 = lim | ( X - EX ) | < 1 ,

= 1 n n→ ∞ n
1
故 P( X = E X ) = nlim P | ( X - EX ) | < = 1 .
→∞ n
“ ”　若存在常数 μ, 使
P( X = μ) = 1
FX ( x) = I( X ≥μ) ( x)
∞ μ
EX = ∫ - ∞
xd F X ( x ) = ∫ μ-
xd F X ( x ) = μ
4 .3 协方差和相关系数　 149
∫
2 2
DX = E( X - μ) = ( x - μ) d F X ( x ) = 0 .
μ-
　　由性质 (3 ) 的证明可得以下性质 .
(6 ) 若 E[ ( X - E X) ( Y - E Y) ]≠0 , 则 X , Y 不独立 .
这说明 E[ ( X - E X) ( Y - E Y) ]≠ 0 , 反映了 X , Y 之间有某种
关系 .
4 .3 　协方差和相关系数
对于二维随机向量 , 要了解各个分量之间的关系 , 只有数学期

望和方差是不够的 , 还需要引进反映它们之间关系的数字特征 .
由上节方差的性质 (6 ) 知若 E[ ( X - E X) ( Y - E Y) ] ≠0 , 可得
X , Y 不独立 , 因此可用它来刻画二者之间的某种关系程度 .
1 　定义
定义 3 .1 　设 X , Y 为两个随机变量 , 则称
cov ( X , Y ) = E[ ( X - E X ) ( Y - EY ) ] ( 3 .1)
为 X, Y 的协方差 ( covariance ) , 称
cov ( X , Y )
ρX Y = ( 3 .2)
DX DY
为 X, Y 的相关系数 ( correlation coefficient ) .
相关系数是刻画 X , Y 的线性关系是否密切的尺度 , 见下面
的性质 (8 ) .
对于一般的随机变量 , 若 D X≠ 0 , 可以对其作一定的变换使
其标准化 .事实上 , 由期望和方差的性质我们知道
X - EX 1 1 ( EX - EX ) = 0,
E = E( X - E X ) =
DX DX DX
X - EX 1 1
D = D( X - EX ) = DX = 1 .
DX DX DX
设随机变量 X, D X≠ 0 , 称随机变量
X - EX
( 3 .3)
DX
为随机变量 X 的标准化 .而
X - E X Y - EY X - E X Y - EY
cov , = E
DX DY DX DY
cov ( X , Y )
= = ρX Y .
DX DY
因此 , X , Y 的相关系数 , 即 X , Y 标准化后的协方差是一个没有量
纲的量 .
由定义易知 , cov( X , Y ) = E( X Y) - ( E X ) ( E Y) , 故
ρX Y = E( XY ) - ( E X ) ( EY ) . ( 3 .4)
DX ・ DY
　　定义 3 .2 　若 X, Y 的相关系数ρX Y = 0 , 则称 X, Y 不相关 .
2 　性质
协方差和相关系数具有如下一些性质 :
(1 ) cov( X , Y ) = cov( Y , X) , cov( X + c, Y + d) = cov( X ,
Y ) , 其中 c, d 为任意常数 ;
(2 ) cov( aX , bY ) = ab cov( X , Y ) , 其中 a, b 为任意常数 ;
(3 ) cov( X1 + X2 , Y ) = cov( X1 , Y ) + cov( X2 , Y ) ,
n m n m
cov ∑ X ,∑ Y
i= 1
i
j =1
j = ∑ ∑ cov( X , Y
i= 1 j= 1
i j );
以上性质 (1 ) ～ (3 ) 的证明留给读者 .
(4 ) 若 X , Y 独立 , 则 cov ( X, Y ) = 0 ,ρX Y = 0 , 即 X , Y 不相关 ;
证明　若 X , Y 独立 , 则由数学期望性质 E ( X Y ) =
( E X) ( E Y) 及 (3 .4 ) 式有
cov ( X , Y ) = E( XY ) - ( E X ) ( EY )
= ( E X ) ( EY ) - ( E X ) ( EY ) = 0 ,
从而 ρX Y = 0 .
利用以上性质可简化某些计算与推导 .
2
例 3 .1 　设{ Y n , n≥ 1}独立同分布 , EY n = 0 , DYn = σ < ∞ ,
n
令 X0 = 0 , X n = ∑Y
i= 1
i , 求 cov( X n , Xn + m ) .
解　由{ Y n , n≥ 1}独立同分布 , 有
n n+ m
cov( Xn , Xn + m ) = cov ∑Y ,∑Y

i =1
i
j= 1
j
n n n n+ m
= cov ∑Y ,∑Y
i =1
i
j= 1
j + cov ∑Y , ∑ Y
i=1
i
j = n+1
j
∑ cov( Y i , Y i ) = nσ .
2
=
i= 1
　　 (5 ) 施瓦兹 ( Sch wa rtz) 不等式　若 E X2 < ∞ , E Y2 < ∞ , 则

2 2 2
( E X Y ) ≤ E X EY , ( 3 .5)
cov( X , Y ) ≤ DX DY . ( 3 .6)
2 2
　　证明　因＂ t∈R , ( X - tY) ≥0 , 故 u( t) = E( X - t Y) ≥0 恒
成立 .即 E( Y2 t2 ) - 2 E( X Yt) + E( X2 ) ≥ 0 恒成立 .故二次三项式
2 2 2
u( t) 的判别式 Δ= 4 [ E( X Y) ] - 4 E X E Y ≤0 .( 3 .5) 式得证 .
由 (3 .5 ) 式有
( cov( X , Y ) ) 2 = ( E( X - E X ) ( Y - EY ) ) 2 ≤ E( X - E X ) 2 .
E( Y - EY ) 2 = D X DY ,
即 cov( X , Y ) ≤ DX DY .
(6 ) |ρX Y | ≤1 ;
证明　由 (3 .6 ) 式即得 .
(7 ) 对于随机变量 X , Y , 下列命题等价 :
① ρX Y = 0;
② cov( X , Y ) = 0;
③ E( X Y) = E X・ E Y;
④ D( X± Y ) = D X + DY .
这些均是与不相关等价的命题 , 详细的证明留给读者作为练习 .
Y - EY X - E X
(8 ) |ρX Y | = 1 P ± =0 =1 .
DY DX
证明　 |ρY | = 1 2 (ρX Y ±1 ) = 0
Y - EY X - EX Y - EY X - EX
D ± = D + D ±
DY DX DY DX
Y - EY X - EX
　　 2E = 1 + 1 ± 2ρX Y = 0 ,
DY DX
由 4 .2 节方差性质 (5 ) 知以上等价于
Y - EY ± X - E X = 0
P = 1 .
DY DX
　　可见 , 当 |ρX Y | = 1 时 , X , Y 以概率 1 取值在一条直线上 , 即
P ω: Y - EY =ê DY
( X - EX ) = 1 .
DX
　　由性质 (3 ) 知 , 若 X , Y 独立 , 则 X , Y 不相关 .然而 , X , Y 不相
关 , 两者却不一定独立 .但是 , 在一种重要的特殊场合 , 即二维正态
分布下 , 不相关和独立是等价的 .
2 2
例 3 .2 　若 ( X, Y ) ～ N(μ1 ,μ2 ,σ1 ,σ2 ,ρ) , 则 :
(1 ) cov( X , Y ) =ρσ1 σ2 ,ρX Y = ρ;
(2 ) X , Y 不相关 X, Y 独立 .
解　由已知
2 2
E X = μ1 , EY = μ2 , DX = σ1 , DY = σ2 , 而
∞ ∞
1
cov ( X , Y ) =
2πσ1σ2
∫∫
1 - ρ2 - ∞ - ∞
( x - μ1 ) ( y - μ2 ) ・
( x - μ1 ) 2 - 1 ・
exp - ・exp
2σ1 2 2
2 (1 - ρ )
2
y - μ2 x - μ1
-ρ d x dy .
σ2 σ1
1 y - μ2 x - μ1 x - μ1
　　若令 t = - ρ , u = ,则
1 -ρ
2
σ2 σ1 σ1
∞ ∞
1
∫∫
2 2
cov ( X , Y ) = (σ1 σ2 1 - ρ tu + ρσ1σ2 u ) ・
2π -∞ -∞
　　　 exp( - u2 / 2 - t2/ 2) d t d u
∞ ∞
σ1σ2 1 - ρ2
　　 =
2π ∫ -∞
u exp( - u2/ 2 )d u ∫ - ∞
t exp( - t2/ 2) d t +
∞ ∞
ρσ1 σ2
　　　
2π ∫ - ∞
u2 exp( - u2 / 2 ) d u ∫ -∞
exp ( - t2/ 2) d t
ρσ1σ2
　　 = 2π 2π = ρσ1 σ2 ,
2π
cov( X , Y )
则 ρX Y = = ρ.可知参数 ρ就是 X , Y 的相关系数 .
D X ・ DY
由第 3 章命题 (5 .3 ) 知 : ( X , Y ) 服从二维正态分布 , 则 X , Y 独
立 ρ= 0 X , Y 不相关 .
下面讨论最佳线性预测 ( 估计 ) 问题 , 进一步揭示相关系数所
刻画的概率意义 .
3 　最佳线性均方预测 ( 估计 )
对于两个随机变量 X , Y .记 μ1 = E X ,μ2 = E Y,σ21 = D X > 0 ,

2
σ2 = D Y > 0 ,ρX Y =ρ, 若 X 可观测 , 而 Y 不可观测 , 希望用 X 的线
∧
　
性函数 bX + a 作为 Y 的预测 ( 或估计 ) , 记作 Y = bX + a .称 δ= Y -
∧
　
Y = Y - ( bX + a) 为预测误差 , 称 Q ( a, b) = Eδ2 = E ( Y - ( bX +
2
a) ) 为均方预测误差 .问题是 : 如何选取 a, b, 使其均方预测误差
Q( a, b) 达最小 ( 如存在的话 ) !
命题 3 .1 　当
＊ -1
b = ρσ2 σ1 , ( 3 .7)
a＊ = μ2 - ρσ2 σ1- 1 μ1 , ( 3 .8)
∧
　
Y ＊ = b＊ X + a＊ ( 3 .9)
时 , 满足 Q( a ＊ , b＊ ) = min Q ( a, b) .
a, b
2
证明　 Q( a, b) = E[ Y - ( bX + a) ] = E{ [ Y - μ2 - b( X - μ1 ) ] +
2
(μ2 - bμ1 - a) } .注意到 E[ Y - μ2 - b( X - μ1 ) ] = 0 , 故有
Q( a, b) = E[ Y - μ2 - b( X - μ1 ) ] 2 + (μ2 - bμ1 - a) 2
2 2 2 2
= σ2 - 2 bρ
σ1 σ2 + b σ1 + (μ2 - bμ1 - a)
2 2 2 -1 2 2
= σ2 (1 - ρ ) + σ1 ( b - ρσ2σ1 ) + (μ2 - bμ1 - a) .
(3 .1 0)
2
注意到上式右边第 2 , 3 项均非负 , 故＂ a, b∈ R 有 Q ( a, b) ≥
2 2 ＊ - 1 ＊＊ - 1
σ2 (1 - ρ ) , 于是选取 b =ρσ2σ1 , a = μ2 - b μ1 = μ2 - ρσ2 σ1 μ1
时 , ( 3 .10 ) 式右边第 2 , 3 项为 0 , 即
Q( a ＊ , b＊ ) = σ22 (1 - ρ2 ) = min Q ( a, b) . (3 .1 1)
a, b
∧
　
　　定义 3 .3 　称 Y ＊ = b＊ X + a ＊ = ρσ2σ1- 1 ( X - μ1 ) + μ2 为 Y 的
最佳线性均方预测 ( 估计 ) .
由命题 3 .1 证明的最后等式 (3 .1 1) 可知 .
＊＊ 2 2
命题 3 .2 　 Q( a , b ) =σ2 ( 1 - ρ ) . (3 .1 2)
由 (3 .1 2) 式可看出 , 对于给定的 Y , 用 |ρX Y | = | ρ| 越接近于 1
＊＊
的 X, 其 b X + a 越接近于 Y ( 均方意义下 ) .这表明 |ρ| 的大小刻
画了 X, Y 之间线性关系密切的程度 .
4 .4 　矩、协方差矩阵及 n 维正态分布
前面我们介绍的数学期望、方差、协方差等是随机变量最常用
的数字特征 , 它们的自然推广是矩 .矩有以下几种 :
( 1) 原点矩 : 对任意 k∈ N \ { 0} , 称 E X k 为 X 的 k 阶原点矩 .
数学期望是一阶原点矩 .
k
(2 ) 中心矩 : 对任意 k∈ N \ { 0} , 称 E[ X - E X] 为 X 的 k 阶
4 .4 矩、协方差矩阵及 n 维正态分布　 155
中心矩 .方差是二阶中心矩 .
(3 ) 混合矩 : ( 对多维分布而言 ) : 对任意 k, l∈ N \ { 0 } , 若
k l k
E X Y 存在 , 称它为 X, Y 的 k + l 阶混合原点矩; 若 E[ ( X - E X) ・
l
( Y - E Y ) ] 存在 , 称它为 X , Y 的 k + l 阶混合中心矩 .协方差
cov( X , Y ) 是 X , Y 的二阶混合中心矩 .
例 4 .1 　若 X ～ N ( 0 , σ2 ) , 则 X 的 2 k ( k ∈ N \ { 0 } ) 阶矩
2k 2k k
E X = (2 k) ! σ / ( 2 ・ k !) .( 可以通过分部积分求得 , 留给读者作
4 4
为练习 .) 特别地, 当 k = 2 时 , E X = 3σ .
T 2
def
定义 4 .1 　设 n 维随机变量 X = ( X1 , X2 , …, Xn ) , 若 σi
DX i (1 ≤ i ≤ n) 存在, 记 σi j = cov( X i , Xj ) , 则称矩阵 Σ =
E[ ( X - EX) ( X - EX) T ] = (σij ) n× n , 为 n维随机变量 X = ( Xk , 1 ≤
T
k ≤ n) 的协方差矩阵 .
显然 , 协方差矩阵是一个对称矩阵 .易证它是非负定矩阵 .当
σi > 0时 , 它是正定矩阵 , 且对角线之元素 σii =σ2i = D Xi (1≤ i≤ n) .
2 2
例 4 .2 　设 ( X, Y ) ～ N(μ1 ,μ2 ,σ1 ,σ2 ,ρ) , 则有
2
σ1 ρσ1σ2
Σ= . ( 4 .1)
ρσ1σ2 σ22
T T T
记 : x = ( x1 , x2 ) ,μ = (μ1 , μ2 ) , 则 X = ( X1 , X2 ) 的联合概率
密度函数可表为
1 1 T - 1
f ( x) = 2 1 exp - ( x - μ) Σ ( x - μ) ,
(2π) 2 | Σ| 2 2
其中 | Σ | = detΣ .
T
这样 , 记二维正态随机变量 X = ( X1 , X2 ) ～ N (μ,Σ ) .
T
例 4 .3 　设 X = ( X1 , X2 ) ～ N(μ, Σ ) , 令 Y = AX , 其中
A = ( ai j ) 2 ×2 为非退化 2 阶矩阵 , 则
T
Y ～ N( Aμ , AΣA ) .
即二维正态分布进行了线性变换之后仍为正态分布 .证明留给读
者作为练习 .
T
以下介绍多元正态分布随机向量 . 记 :μ= (μk , 1 ≤ k ≤ n) ,
T
x = ( xk , 1 ≤ k ≤ n) 为 n 维向量 ,Σ= (σij ) 为 n 阶正定对称矩阵 .
定义 n 元函数
1 1 T -1
f ( x) = n 1 exp - ( x - μ) Σ ( x - μ) .
(2π) 2
| Σ| 2 2
( 4 .2)
∫
n
　　命题 4 .1 　 (1 ) ＂ x ∈ R , f ( x) > 0 ; ( 2) f ( x) dx = 1 .
Rn
即由 (4 .2 ) 式定义的 f ( x) 是 n 维概率密度函数 .
证明　 (1 ) 显然 .以下证 (2 ) .由Σ为正定对称方阵 , 则存在非
奇异矩阵 L, 使Σ= L LT .令线性变换 y = L- 1 ( x - μ) , 其逆变换为
1
x = Ly + μ .此变换的雅可比行列式为 | L | = | Σ| 2
.故
1 1 T
∫ ∫
1
f ( x) dx= n 1 exp - y y | Σ | 2 dy
Rn
( 2π) 2 | Σ| 2 R n 2
n
1 1
= n
( 2π) 2 | Σ|
∫∫1
2
…n exp -
R
∑
2 k=1
y2k d y1 … d yn
n
1
∫e
- u2 / 2
= du = 1 .
2π R
　　定义 4 .2 　若 n 维随机向量 X = ( X k , 1 ≤ k≤ n) T 的联合密度
函数是用 (4 .2 ) 式定义的 f ( x) , 则称 X 是服从参数 (μ, Σ) 为 n 维
正态随机向量 , 简记 X～ N (μ, Σ ) . f ( x) 为 n 维正态概率密度
函数 .
T
命题 4 .2 　设 X = ( X i , 1 ≤ i≤ n) ～ N (μ, Σ ) , 令 Y = AX, 其
T
中 A 为非退化 n 阶方阵 , 则 Y～ N( Aμ , AΣA ) .
n 维正态分布有许多优良性质将在第 5 , 8 章进一步讨论 .
4 .5 条件数学期望　 157
4 .5 　条件数学期望
条件数学期望是随机数学中最基本、最重要的概念之一 .本节
将引入条件数学期望的概念 , 并说明它的性质和应用 .为了从直观
上对此概念有个正确的理解 , 我们先从离散型随机变量入手 , 再讨
论连续性随机变量 , 最后推广到多元随机变量的情形 .
1 　以离散型随机变量作为条件的条件数学期望
(1 ) 定义与例子
定义 5 .1 　设离散型随机变量 X , Y , 分布律为 P( X = xi , Y =
y j ) , 若对＂ j∈N \ {0 } , P( Y = y j ) > 0 , 称
E( X | Y = yj ) = ∑x i
i P ( X = xi | Y = yj ) ( 5 .1)
为 X 关于 Y = y j 时的条件数学期望 .
这是一种狭义的条件数学期望 .现比较 ( 无条件 ) 数学期望
E( X) = ∑xi
i P ( X = xi ) 与条件数学期望 E( X | Y = y j ) 的异同
点 .E( X) 是对所有的 ω∈ Ω, X(ω) 取值全体的加权平均 , 而
E( X | Y = y j ) 是 X 取值局限在 ω∈ {ω: Y = yj } = B j 上的加权
平均 .可以这样理解 : 记 B j = {ω: Y = y j } , A i = {ω: X = xi } , 于是
{ Ai , i ∈ N \ {0 } } 及{ B j , j ∈ N \ {0 }} 分别是样本空间 Ω的分解 ,
当 Ai B j = 时 , P( X = xi , Y = yj ) = 0 , 于是
E( X | Y = y j ) = ∑xi
i P ( X = xi | Y = y j )
= ∑x
i∈ D1
i P ( X = xi | Y = y j ) ,
j
1
其中 Dj = { i: Ai B j ≠ } , 这正说明了 E( X | Y = y j ) 是 ω∈ Bj 时
X (ω) 的局部加权平均 .
显然 E( X | Y = y j ) 依赖于 Y = yj , 即依赖于 ω∈ B j = {ω: Y =
y j } .从全局看 , 有必要引入一个新的随机变量 E( X | Y ) , 使它在
ω∈ Bj ( 即 Y = yj ) 时 , 取值为 E( X | Y = yj ) , 称随机变量 E( X | Y ) 为
随机变量 X 关于随机变量 Y 的条件数学期望 .它亦是随机变量 Y
的函数 , 确切定义如下 .
定义 5 .2 　设离散型随机变量 X , Y , 分布律为 P ( X = xi ,
Y = y j ) , 若对＂ j∈N \ {0 } , P( Y = y j ) > 0 , 则称
E( X | Y ) = ∑
j∈ N \ { 0 }
E( X | Y = y j ) I( Y = y j ) (ω) ( 5 .2)
为随机变量 X 关于 Y 的条件数学期望 , 称 ( 5 .2 ) 式为 E( X | Y ) 的
示性函数表示式 .
上述 E( X | Y ) 定义包含如下的直观意义 :
① 随机变量 E ( X | Y ) 是 ω的函数 .当 ω∈ {ω: Y = y j } 时 ,
E( X | Y ) 的取值为 E ( X | Y = yj ) .事实上 , 它是局部平均 { E ( X |
Y = y j ) , j∈N \ {0 } } 的统一表达式 .因而条件数学期望更深入地
描述了 X, Y 之间的某种关系 .
② 当 E( X | Y = y j ) ≠ E( X | Y = yk ) ( j≠ k) 时 , P{ E( X | Y ) =
E( X | Y = y j ) } = P( Y = y j ) .否则 , 令 Dj = { k: E ( X | Y = y j ) =
E( X | Y = yk ) } , 则
P{ E( X | Y ) = E( X | Y = y j ) } = ∑ P(Y
k∈ D
j
= yk ) .
这个直观意义为我们提供了求条件数学期望分布律的简单方法 .
③ E( X | Y ) 亦是 Y 的函数 , 由 4 .1 节中随机变量函数的期望
公式 , 知它的数学期望
E{ E( X | Y ) } = ∑E( X |
j
Y = yj ) P( Y = yj ) .
　　下面举一个例子来加深对上述概念的理解和认识 .
例 5 .1 　随机变量 ( X , Y ) 的联合分布律如下表所示 , 试求
E( X | Y ) 的分布律 , E( X) , E{ E( X | Y ) } .
4 .5 条件数学期望　 159
　　 X
1 2 3 P・ j
Y　　
2 4 1 7
1
27 27 27 27
5 7 3 15
2
27 27 27 27
1 2 2 5
3
27 27 27 27
8 13 6
Pi・ 1
27 27 27
　　解　为求 E( X | Y = j) , 先求 P ( X = i | Y = j ) , 其中 i, j = 1 ,
2, 3 .
P( X = 1 , Y = 1) 2/ 27 2
P{ X = 1 | Y = 1} = = = .
P( Y = 1 ) 7/ 27 7
同理
P{ X = 2 | Y = 1 } = 4/ 7 , P{ X = 3 | Y = 1} = 1/ 7 ,
3
E( X | Y = 1 ) = ∑ x P( X =
i=1
i xi | Y = 1)
= 1 × 2 + 2 × 4 + 3 × 1 = 13 .
7 7 7 7
同理
3
E( X | Y = 2 ) = ∑ iP ( X
i=1
= i | Y = 2)
= 1 × 5 + 2 × 7 + 3 × 3 = 28 ,
15 15 15 15
3
E( X | Y = 3 ) = ∑ iP( X =
i=1
i | y = 3)
1 2 2 11
= 1× + 2× + 3× = .
5 5 5 5
得
13 28 11
E( X | Y ) = I ( Y = 1 ) (ω) + I ( Y = 2 ) (ω) + I( Y = 3 ) (ω) .
7 15 5
由前述直观意义 (2 ) , 可知 P{ E( X | Y ) = E( X | Y = j ) } = P( Y = j)
( j = 1 , 2 , 3 ) .故 E( X | Y ) 的分布律列表如下 :
13 28 11
E( X | Y)
7 15 5
7 15 5
P{ E( X | Y ) = E ( X | Y = j) } = P( Y = j)
27 27 27
于是
13 7 28 15 11 5 52
E{ E( X | Y ) } = × + × + × = ,
7 27 15 27 5 27 27
而
3
8 13 6 52
EX = ∑ i P( X = i) = 1 ×
i=1 27
+ 2×
27
+ 3×
27
=
27
.
　　可见 , E{ E( X | Y ) } = E X , 事实上 , 若 ( X , Y ) 为离散型随机变
量 , 且 E | X | < ∞时 , E{ E( X | Y ) } = E( X ) 普遍成立 , 即局部加权
平均后的加权平均等于总体的加权平均 .
为加深对条件数学期望的直观理解 , 试看下例 .
例 5 .2 　设 A , B∈F , 0 < P( B) < 1 , 若 P( A | B) , P( A | 珚
B) 已
知 , 试求 E( I A | I B ) 的示性函数表示式 .
解　当 ω∈ ( I B = 1 ) = B 时 , E ( I A | I B ) = E ( I A | I B = 1 ) =
E( I A | B) = 1・ P( I A = 1 | B) = P ( A | B) ; 当 ω∈ ( I B = 0) = 珚
B 时,
E( I A | I B ) = E( I A | I B = 0) = E( I A | 珚
B) = P( A| 珚
B) , 故
E( I A | I B ) = P( A | B) I B (ω) + P( A |珚
B) I珚B (ω) .
(2 ) 条件数学期望的性质
下面列出离散型随机变量的条件数学期望的若干性质 , 以下
均假定 E| X | < ∞ , E| X i | < ∞ ( 1≤ i≤ n) .
4 .5 条件数学期望　 161
① E( X) = E{ E( X | Y ) } ;
n n
② E ∑CX
i= 1
i i | Y = ∑ C E( X
i= 1
i i | Y) ;
③ 若 X, Y 独立 , 则 E( X | Y ) = E X ;
④ E( X | X) = X, E{ g( X) | X} = g( X) ;
⑤ ＂ g( X) , h( Y ) , 若 E | g( X) h( Y ) | < ∞, 则 E{ g( X) h( Y ) | Y} =
h( Y ) E{ g( X) | Y } ; 其中 g, h 是博雷尔可测函数 .
① 的证明　由 E( X | Y ) = ∑ E( X | Y
j
= y j ) I( Y = y j ) (ω) , 则
E{ E( X | Y ) } = E ∑ E( X |
j
Y = yj ) ・ I( Y = y j ) (ω)
= ∑ E( X | Y
j
= y j ) ・ E[ I( Y = y j ) (ω) ]
= ∑ E( X | Y
j
= y j ) ・ P( Y = y j )
= ∑ ∑xj i
i P( X = xi | Y = y j ) ・ P( Y = y j )
= ∑ x ∑ P( X =
i
i
j
xi | Y = y j ) ・ P( Y = y j )
= ∑x i
i P ( X = xi ) = E X ,
其中第二个等号由 4 .1 节性质② , 第五个等号由 E | X | < ∞ , 倒数

第二个等号是全概率公式 .
这些性质的证明请读者思考并作为练习 .
对性质① , 可作如下表述 :
E( X) = E{ E( X | Y ) } = ∑E( X |
j
Y = yj ) P( Y = yj ) ,
这样的形式与全概率公式具有相似之处 , 是全概率公式的推广 .
一般地 , 设 D ∈ B, X 关于事件 {ω: Y (ω) ∈ D} = { Y ∈ D} 的
d ef
条件数学期望为 E( X | Y ∈ D) ∑x
i
i P ( X = xi | Y ∈ D) .若 Y
为离散型随机变量 , 而 X 为一般随机变量 , 设 P( Y = y j ) > 0 , 对

＂ x∈ R , 称
P( X ≤ x, Y = yj )
F X | Y = y j ( x | yj ) =
P( y = y j )
为 X 关于 Y = y j 条件分布函数 .
定义 5． 3 　在上述记号下 , 称 E( X | Y = yj ) =
+∞
∫-∞
xd F X | Y = y j ( x | y j ) 为 X 关于 Y = y j 的条件数学期望 ; 称
E( X | Y ) = ∑ E( X | Y = yj ) I( Y = y j ) 为 X 关于 Y 的条件数学期望 .
j
下面通过两个例题来加深对性质的理解 .
例 5 .3 　设 N1 , N2 独立, Ni ～ Po(λi ) ( i = 1 , 2 ); 求 E( N1 | N1 +
N2 ) 及 E( N1 + N2 | N1 ) 的分布律 .
解　 (1 ) E( N1 | N1 + N2 ) 的分布律　＂ n∈ N \ { 0} ,
n
E( N1 | N1 + N2 = n) = ∑ kP ( N
k=0
1 = k | N1 + N2 = n) ,
而
P( N1 = k, N1 + N2 = n)
P( N1 = k | N1 + N2 = n) = ,
P( N1 + N2 = n)
(0 ≤ k ≤ n) ,
其中
P( N1 = k, N1 + N2 = n) = P( N1 = k, N2 = n - k)
k n - k
λ1 λ2 - (λ +λ )
　　 = P( N1 = k) P( N2 = n - k) = e 1 2 ,
k ! ( n - k) !
而由第 3 章例 6 .1 知 N1 + N2 ～ Po(λ1 + λ2 ) , 故
k n- k
λ1λ2 n!
P( N1 = k | N1 + N2 = n) =
k !( n - k) ! (λ1 + λ2 ) n
λ1 λ2
k n- k
k
= C n (0 ≤ k ≤ n)
λ1 + λ2 λ1 + λ2
λ1
～ B n, ,
λ1 + λ2
4 .5 条件数学期望　 163
λ1
即 N1 在 N1 + N2 = n 下的条件分布律与参数为 n, 的二
λ1 + λ2
项分布相同 .
下面用两种方法求 E( N1 | N1 + N2 = n) .
(1 ) 由定义 ( 5 .1) 式求
n
E( N1 | N1 + N2 = n) = ∑ k P( N
k=0
1 = k | N1 + N2 = n)
n k n- k
n! λ1 λ2
　　 = ∑k=0
k
(λ1 + λ2 ) k !( n - k) !
n
n
nλ1 ( n - 1) !λ1k - 1 λ2n - k
(λ1 + λ2 ) n ∑
　　 =
k = 1 ( k - 1 ) !( n - k) !
nλ1 nλ1
　　 = 1 +λ
n-1
n (λ 2 ) = ,
(λ1 + λ2 ) (λ1 + λ2 )
得到
λ1
E( N1 | N1 + N2 ) = ( N1 + N2 ) .
(λ1 + λ2 )
k n - k
λ1 λ2
　　 (2 ) P ( N1 = k | N1 + N2 = n) = C ～
k
n
λ1 +λ2 λ1 + λ2
λ1 λ1
B n, , 故 E( N1 | N1 + N2 ) = ( N1 + N2 ) .这说明
λ1 +λ2 (λ1 + λ2 )
E( N1 | N1 + N2 ) 是 ( N1 + N2 ) 的线性函数 .
由直观意义 (2 ) , 可得 E( N1 | N1 + N2 ) 的分布律为
nλ1
P E( N1 | N1 + N2 ) = = P{ N1 + N2 = n}
λ1 + λ2
(λ1 + λ2 ) n - (λ1 +λ2 )
　　 = e , 　 n ∈ N \ {0 } .
n!
　　 (2 ) E( N1 + N2 | N1 ) 的分布律
　　 E( N1 + N2 | N1 ) = E( N1 | N1 ) + E( N2 | N1 ) ( 性质 (2 ) )
= N1 + E( N2 ) 　 ( 性质 (4 ) )
= N1 + λ2 ,
所以 E( N1 + N2 | N1 = n) = n + λ2 　 ( n∈ N \ { 0} ) ,
n
λ1 - λ
P{ E( N1 + N2 | N1 ) = n + λ2 } = P( N1 = n) = e ,
n!
n ∈ N \ {0 } .
　　例 5 .4 　设 ( Y n , n ≥ 1 ) 独立同分布 , P( Y n = 1 ) = p ≥ 0 ,
n
P( Y n = - 1 ) = q = 1 - p ≥ 0 , X0 = 0 , Xn = ∑Y
k= 1
n .求 E( X3 | X2 )
的分布律及 E( X3 | X2 ≥ 0) .
解　 (1 ) E( X3 | X2 ) = E( X2 + Y3 | X2 ) = E( X2 | X2 ) +
E( Y3 | X2 ) = X2 + E( Y3 ) = X2 + p - q .E( X3 | X2 ) 的分布律如
下表所示 :
X2 - 2 0 2
E( X3 | X2 ) - 2 + ( p - q) p- q 2+ p- q
P{ E( X3 | X2 ) = X2 + p - q} (1 - p) 2 2 p(1 - p) p2
　　 (2 ) 因 E( X3 | X2 ≥0 ) = E( X2 + Y3 | X2 ≥0) = E( X2 | X2 ≥0 ) +
E Y3 , 故
E( X3 | X2 ≥ 0) = 0・ P( X2 = 0 | X2 ≥ 0) + 2・
　 P( X2 = 2 | X2 ≥ 0) + ( p - q)
2 2
= 2 p / (2 p q + p ) + ( p - q) .
2 　一般随机变量的条件数学期望
(1 ) 定义
定义 5 .4 　对二维随机变量 ( X , Y ) , 设 Y 为连续型随机变量 ,
具有概率密度函数 f Y ( s) , f X | Y = s ( t | s) 为 X 关于 Y = s 的条件概
+∞
率密度函数 ; 若 ∫ - ∞
| x | f X | Y = s ( x | s) d x < + ∞ , 则称
4 .5 条件数学期望　 165
def +∞
E( X | Y = s) ∫ - ∞
x f X | Y = s ( x | s) d x ( 5 .3)
为 X 关于 Y = s 的条件数学期望 .
类似于第 3 章 3 .4 节可以定义 X 关于 Y∈ L 的条件分布函数
及密度函数 .事实上 , 对于给定的 L∈B, ( 即对一维博雷尔集 L ) ,
若 P( Y∈ L) > 0 , 则 X 关于 Y∈ L 的条件分布函数定义为
P( X ≤ t, Y ∈ L)
P( X ≤ t | Y ∈ L) = .
P( Y ∈ L)
若对＂ B∈B, 存在非负函数 f ( t| L) , 满足
P( X ∈ B | Y ∈ L) = ∫ u∈ B
f ( u | L) d u,
称 f ( t| L) 为 X 关于 Y∈ L 下的条件概率密度函数 .
对于一般的随机变量 X , a < b, 求 X 在 a < X < b 的条件分布
函数 , 通常称为 X 的截尾分布函数 .
+∞
定义 5 .5 　给定 L ∈ B, P( Y ∈ L) > 0 ,若 ∫ -∞
| t | f ( t | L)d t <
+ ∞ , 则称
+∞
E( X | Y ∈ L) = ∫ -∞
t f ( t | L) d t ( 5 .4)
为 X 关于 Y∈ L 下的条件数学期望 .
例 5 .5 　设 X～ N (2 , 12 ) , L = { X≥0 } , 求 X 在 { X≥0} 下的条
件数学期望 .
解　由第 2 章例 5． 1 知 , X 关于 X ≥0 的条件概率密度为
2
-1 1 e - ( x -22) I( x≥ 0 ) .
f X | X ≥ 0 ( x) = ( 0 .9772 )
2π
故
+∞ 2
1 - ( u-2)
∫
- 1
E( X | X ≥ 0 ) = Φ ( 2) e 2
du
x
2π
令 t= x - 2 +∞ 2
1 - t
Φ (2 ) ∫
-1 2
= ( t + 2) e dt
- 2
2π
-1 1 -2
= Φ (2 ) e +2 .
2π
显然 , 条件数学期望 E( X | Y = y) 是 X 局限在 ω∈ { Y = y} 的局部
加权平均 , 它是 y 的函数 .类似于以离散型随机变量为条件的条
件期望 , 定义一个新的随机变量 E( X | Y ) , 使其在 ω∈{ Y = y}时的
取值为 E( X | Y = y ) .
下面讨论一般随机变量的情形 .
定义 5 .6 　对二维随机变量 ( X , Y ) , 设 E | X | < + ∞ , ＂ y∈
R , E( X | Y = y ) 存在 , 若随机变量 E( X | Y ) 满足 :
(1 ) E( X | Y ) 是 Y 的函数 , 且当 ω∈{ Y = y}时 , E( X | Y ) 的取
值为 E( X | Y = y ) ;
(2 ) 对＂ L∈B, 恒有 E{ E( X | Y ) | Y∈ L} = E{ X | Y∈ L} .
则称随机变量 E( X | Y ) 为 X 关于 Y 的条件数学期望 .
下面给出便于直观理解的等价定义 .
定义 5 .6( a) 　对于二维随机向量 ( X , Y ) , E | X | < + ∞ .记
+ -
Y = Y∨0 , Y = - ( Y∧0) , 按照第 3 章节 3 .3 命题 3 .5 , 以 (3 .5)
+ - + -
式定义的离散型随机变量 Y n , Yn , 及 Y n = Y n - Y n 有 Yn (ω) →
Y (ω) .若lim E( X | Yn ) 存在 , 则称 E( X | Y ) = n→
lim E( X | Y n ) 为 X 关
n→ ∞ ∞
于 Y 的条件数学期望 .
说明　事实上 , 可以证明 , 以上两个定义在几乎处处相等的意
义下是等价的 .两个随机变量 X1 , X2 , 若 P( X1 (ω) = X2 (ω) ) = 1 ,
则称 X1 , X2 几乎处处相等 , 简记为 X1 = X2 a .s .( 或 a .e .) .容易
证明 : 若 X1 = X2 a .s ., 则它们的分布函数相等 , 即＂ x∈R , P( X1 ≤
x ) = P( X2 ≤ x ) .以后对于用条件数学期望表示的等式 , 都是在几
乎处处意义下相等的 .
4 .5 条件数学期望　 167
(2 ) 广义的全概率公式
由上述定义 , 易知
+∞
E( X) = E{ E( X | Y ) } = ∫ - ∞
E( X | Y = y) d P( Y ≤ y ) .
( 5 .5)
这是因为 : 当取 L = R = ( - ∞ , + ∞ ) 时 , 有
E X = E{ X | Y ∈ R } = E{ E( X | Y ) | Y ∈ ( - ∞ , + ∞ ) }
+∞
= E{ E( X | Y ) } = ∫ - ∞
E( X | Y = y) d P( Y ≤ y ) ,
当取 X = I A ( ω) 时 , E ( X ) = E ( I A ) = P ( A) , 又 E ( I A | Y = y ) =
P( A| Y = y) , 则由 ( 5 .5) 式有
+∞
P( A) = ∫ - ∞
P( A | Y = y ) d P( Y ≤ y) . ( 5 .6)
(5 .5 ) 式及 ( 5 .6) 式可看作是广义的全概率公式 .
应用 (5 .6 ) 式 , 若取 A = ( X≤ x) , 则
+∞
P( X ≤ x ) = E( I( X≤ x ) (ω) ) = ∫ -∞
E( I( X≤ x) | Y = y ) d P( Y ≤ y)
+∞
=∫ -∞
P( X ≤ x | Y = y ) d P( Y ≤ y)
+∞
=∫ -∞
P( X ≤ x | Y = y ) d P( Y ≤ y) ,
得
+∞
P( X ≤ x ) = ∫-∞
P( X ≤ x | Y = y) d P( Y ≤ y) . 　
(5 .6a)
　　 (3 ) 条件数学期望的性质
设 EY , E( X i | Y ) , E( h( Y ) ) , E{ g( X) h( Y ) } 存在 , 则
① E[ E( Y | X) ] = E( Y ) ;
n n
② E ∑CX
i= 1
i i | Y = ∑ C E( X
i= 1
i i | Y ) 　 a .s .;
③ 若 X、Y 独立 , E[ h( Y ) | X] = E( h( Y ) ) 　 a .s .;
④ E( X | X) = X, E( g( X) | X) = g( X) 　 a .s .,
E[ g( X) h( Y ) | Y] = h( Y ) E[ g( X) | Y] 　 a .s ., 　 (5 .7a)
E[ g( X) h( Y ) ] = E[ h( Y ) E[ g( X ) | Y] ] 　 a .s . . ( 5 .7b)
这些性质的证明 , 仅限制在连续型的情形下 , 请读者思考并作为
练习 .
现就最后一个等式证明如下 .
设 ( X , Y ) 有联合概率密度函数 f ( x, y) , 设 f Y ( y) 是 Y 的概率
密度函数 , 于是
+∞ +∞
E{ g( X) h( Y ) } = ∫∫ -∞ - ∞
g( x ) h( y) f ( x, y) d xd y
+∞ +∞
g( x) f ( x , y)
=∫∫ -∞ - ∞ fY ( y )
d x h ( y ) f Y ( y) d y
+∞
=∫ -∞
E[ g( X) | Y = y] h( y) f Y ( y) d y
= E[ h( Y ) E[ g( X) | Y ] ] .
　　特别地 , 若取 I A (ω) = g( X) , h( Y ) = 1 得
+∞
P( A) = ∫ - ∞
P( A | Y = y) f Y ( y ) d y,
这正是全概率公式 !
下面举几个例子以加深对上述概念及性质的理解和认识 .
2 2
例 5 .6 　设 ( X, Y ) ～ N(μ1 ,μ2 ,σ1 ,σ2 ,ρ) , 求 E( Y | X) .
解　先求 Y 关于 X = x 的条件概率密度函数 .
f ( x, y) 1
f Y | X = x ( y | x) = = ・
f X ( x) 2 1/ 2
2πσ2 (1 - ρ )
1
　　 exp - 2 2 [ y - μ2 - ρσ2 σ1- 1 ( x - μ1 ) ] 2 ,
2σ (1 - ρ )
2
即
4 .5 条件数学期望　 169
f Y | X = x ( y | x ) ～ N[μ2 + ρσ2σ1- 1 ( x - μ1 ) ,σ22 ( 1 - ρ2 ) ] ,

+∞
E( Y | X = x ) = ∫ -∞
y f Y | X = x ( y | x ) d y = μ2 + ρσ2σ1- 1 ( x - μ1 ) ,
得
E( Y | X) = μ2 + ρσ2σ1- 1 ( X - μ1 ) . ( 5 .8)
　　从此例中看到 : 二元正态分布 ( X , Y ) 的条件数学期望是 X 的
线性函数 , 这也正是正态分布的重要性质之一 .
例 5 .7 　设 X1 , X2 独立 , X i ～Ex (λi ) ( i = 1 , 2 ) .求
E( X1 | X1 ≤ X2 ) .
P( X1 > x, X1 ≤ X2 )
解　 P( X1 > x | X1 ≤ X2 ) = ,
P( X1 ≤ X2 )
其中
∞
∫
-λ u
P( X1 > x, X1 ≤ X2 ) = P( X1 > x, u ≤ X2 | X1 = u)λ1 e 1 du
x
= ∫ x
P( u ≤ X2 )λ1 e - λ1 u d u
∞
λ1
= ∫ x
λ1 e - (λ1 +λ2 ) u d u =
λ1 + λ2
e - (λ1 +λ2 ) x ,
+∞
P( X1 ≤ X2 ) = ∫ 0
P( X2 ≥ x | X1 = x) d P( X1 ≤ x)
+∞
λ1
=∫ 0
e - λ2 xλ1 e - λ1 x d x =
λ1 + λ2
,
所以
+∞
E( X1 | X1 ≤ X2 ) = ∫ 0
P( X1 > x | X1 ≤ X2 ) d x
+∞
1
∫
- (λ +λ ) x
= e 1 2
dx = .
0 λ1 + λ2
　　下面来证明与这个结果相关的指数分布的一个有趣性质 .
命题 5 .1 　设 X1 , X2 独立 , 且 X i ～ Ex(λi ) ( i = 1 , 2 ) , 则
E( X1 | X1 ≤ X2 ) = E[ mi n( X1 , X2 ) ] .
　　证明　因为
P( min( X1 , X2 ) > t) = P( X1 > t, X2 > t) = e - (λ1 +λ2 ) t ,
- (λ +λ ) t
P( min ( X1 , X2 ) ≤ t) = 1 - e 1 2 ,
得 min ( X1 , X2 ) ～ Ex(λ1 + λ2 ) .
由例 5 .6 的结论得
1
E( X1 | X1 ≤ X2 ) = E[ min( X1 , X2 ) ] = .
λ1 + λ2
若推广这个结论可得下面的结论 .
命题 5 .2 　若 X1 , X2 , … , X n 独立 , 且 X i ～ Ex (λi ) ( i = 1 , … ,
n) , 则
min( X1 , … , Xn ) ～ Ex (λ1 + λ2 + … + λn ) ,
n
-1
E 1 min
≤ i≤ n
Xi = ∑λi
i =1
.
　　例 5 .8 　设 X1 , X2 , X3 独立 , X i ～ Ex(λi ) ( i = 1 , 2 , 3) .求
E( X2 | X1 ≤ X2 ≤ X3 ) .
解　 E( X2 | X1 ≤ X2 ≤ X3 ) = E ( X1 + ( X2 - X1 ) | X1 ≤ X2 ≤
X3 ) = E( X1 | X1 ≤ X2 ≤ X3 ) + E( X2 - X1 | X1 ≤ X2 ≤ X3 ) .
1
由命题 5 .2 知 E( X1 | X1 ≤ X2 ≤ X3 ) = , 根据指数分布
λ1 + λ2 + λ3
的无记忆性 , 有
E( X2 - X1 | X1 ≤ X2 ≤ X3 ) = E( X2 | X2 ≤ X3 )
1
= E( X2 ∧ X3 ) = .
λ2 + λ3
故
1 1
E( X2 | X1 ≤ X2 ≤ X3 ) = + .
λ1 + λ2 + λ3 λ2 + λ3
4 .5 条件数学期望　 171
3 　条件概率、条件分布函数的推广
现在用条件数学期望的概念对条件概率、条件分布函数的概

念加以推广 .
设二维随机变量 ( X , Y ) 及任一随机事件 B∈ B, 记 I B 为 B 的
示性函数 , 则 P( B) = E( I B (ω) ) .
称 P( B| Y ) = E( I B (ω) | Y ) 为事件 B 关于随机变量 Y 的条件
概率 ; ＂ x∈R , 取 B = (ω: X≤ x ) , 则称 F( x | Y ) = P( X ≤ x | Y ) =
E( I ( X≤ x ) | Y ) 为 X 关于 Y 的条件分布函数 .例如
P( A | I B ) = P( A | B) I B (ω) + P( A | 珚
B) I珚B (ω) ,
P( X ≤ x | I B ) = P( X ≤ x | B) I B (ω) + P( X ≤ x | 珚
B) I珚B (ω) .
　　这样 , 前面我们介绍过的条件概率及条件分布函数都可以用
条件数学期望来统一处理了 .有些等式可表示的更为简练 , 例如 :
＂ A∈F , 二维随机变量 ( X , Y ) , ＂ x∈R , 有 P( A) = E( P( A| Y ) ) ,
P( X≤ x) = E[ P ( X≤ x | Y ) ] , 这正是 ( 5 .6 ) 式 , ( 5 .6a ) 式的简洁
形式 .
4 　多元随机变量的条件数学期望
(1 ) 定义
定义 5 .7 　设 3 个离散型随机变量 ( X , Y , Z) , 且 E| X | < ∞ ,
则称
E( X | Y = y j , Z = zk ) = ∑x i
i p ( X = xi | Y = yi , Z = z k )
为 X 关于 Y = yi , Z = zk 的条件数学期望 ; 称
E( X | Y , Z) = ∑I
j, k
(Y = y ,Z= z )
i k
E( X | Y = y j , Z = z k )
为 X 关于 ( Y , Z) 的条件数学期望 .
由定义 , 易知 E( X | Y , Z) 具有以下两方面的直观意义 :
① E( X | Y , Z ) 是 ( Y , Z) 的二元函数 , 当 Y = yj , Z = z k 时 ,
E( X | Y , Z) = E( X | Y = yj , Z = zk ) ;
2
② 对任意 ( D1 , D2 ) ∈ B , E[ E( X | Y , Z ) | Y ∈ D1 , Z∈ D2 ] =
E[ X | Y∈ D1 , Z∈ D2 ] .
注意　 E( X | Y , Z ) 是 ( Y , Z ) 的二元函数 , 因此这样的条件数
学期望刻画了 X 与 ( Y , Z) 之间的概率特性 .
对于 X 是一般随机变量 , 而 ( Y , Z) 是离散型随机变量或是连
续型随机变量的情形 , 定义 E( X | Y , Z ) 与前面定义 E( X | Y ) 相类
似 .不难把以上定义推广到 n 元的情况 , 请读者自己尝试着定义 .
(2 ) 简单性质
若 E| X | < ∞ , E| X i | < ∞ ( 1 ≤ i≤ n) , E | g ( Y1 , … , Y n ) | <
∞ , 则有
n
① E( C1 X1 + … + Cn X n | Y1 , … , Y n ) = k∑ Ci E ( Xi | Y1 , … , Y n )
= 1
　 a .s .;
② E[ g( Y1 , … , Yn ) X | Y1 , …, Yn ] = g( Y1 , … , Yn ) E[ X | Y1 , … ,
Yn ] 　 a .s .;
③ 若 X 与 Y1 , … , Y n 独立 , 则 E[ X | Y1 , … , Y n ] = E X 　 a .s .;
④ E[ E( X | Y1 , … , Y n ) ] = E X , 表明各局部加权平均的加权
平均等于总的加权平均 ;
⑤ 对 ( X , Y , Z) 的情况 , 有
E( X | Y ) = E[ E( X | Y , Z) | Y] = E[ E( X | Y ) | Y , Z] 　 a .s .
( 5 .9)
　　性质①～ ④的证明均请读者自己补出 .以下给出性质 ⑤在离
散型随机变量情形下的证明 : 对任意给定的 ω∈{ Y = y j , Z = zk } ,
有 E[ E( X| Y ) | Y = yj , Z = zk ] = E[ E( X | Y = yj ) | Y = yj , Z = zk ] =
E( X | Y = y j ) E[1 | Y = yj , Z = z k ] = E( X | Y = y j ) , 故 E( X | Y ) =
E[ E( X | Y ) | Y , Z] .又因为对任意给定的 ω∈{ Y = y j }有
E[ E( X | Y , Z) | Y = yj ] = E[ E( X | Y , Z) | Y = y j ]
4 .5 条件数学期望　 173
= ∑ E( X |
k
Y = y j , Z = zk ) P( Z = z k | Y = y j )
= ∑∑x
k i
i P( X = xi | Y = y j , Z = zk ) P( Z = z k | Y = y j )
= ∑∑x
k i
i P( X = xi , Z = zk | Y = y j )
= ∑ x ∑ P( X =
i
i
k
xi , Z = zk | Y = y j )
= ∑x
i
i P ( X = xi | Y = yj )
= E( X | Y = yj ) ,
得 E( X | Y ) = E[ E( X | Y , Z) | Y] .
上式的直观意义留给读者自己解释 .最好举一实际例子 , 以加
深直观理解 .
对于条件是连续型的随机向量的条件数学期望的定义 , 性质
与以上相类似 , 不再赘述 .
5 　条件数学期望的应用 ———最佳均方预测
对二元随机变量 ( X , Y ) , 设 X 可观测 , Y 不可观测 , 但 X 与 Y
之间有一定的统计关系 .这时 , 希望用 X 的某一 ( 博雷尔可测 ) 函
数 g( X) 作为 Y 的预测 , 记作珟
Y = g ( X ) , 并力求选取这样的珟
Y使
2 ＊＊ 2
E( Y - 珟Y) 达到最小 .若珟 Y 满足 E (Y - 珟 Y ) = inf { E ( Y -
2 ＊
g( X) ) } , 则称珟
Y 为 Y 的最佳均方预测其中 inf{ } 表示集合的下
1
确界 , 即集合{ }的最大下界 , 如 inf , N≥1 = 0 .
n
＊
定理 5 .1 　若 E( Y | X) 存在 , 则珟Y = E( Y | X) .
证明　等价于证明对任意博雷尔可测函数 g ( X ) , E [ ( Y -
2 2
E( Y | X) ) ] ≤ E[ ( Y - g( X) ) ] .
E[ ( Y - g( X)) 2 ] = E{( Y - E( Y | X) ) + ( E( Y | X) - g( X) ) }2
= E[( Y - E( Y | X) )2 ] + E[ ( E( Y | X) - g( X))2 ] +
　 2 E[( Y - E( Y | X) )( E( Y | X) - g( X) ) ] ,
而
E[ ( Y - E( Y | X) ) ( E( Y | X) - g( X) ) ] = E{ E[ ( Y - E( Y | X) ) ・
　　 ( E( Y | X) - g( X) ) ] | X} = E{ [ E( Y | X) - g( X) ]・
　　 E[ E( Y | X) - E( Y | X) ] } = 0 ,
得
E( Y - g( X) ) 2 = E( Y - E( Y | X) ) 2 + E( E( Y | X ) - g( X) ) 2
2
≥ E( Y - E( Y | X) ) .
＊
故, 珟
Y = E( Y | X) , 即条件数学期望 E( Y | X) 是对 Y 的最佳均
方预测 .
这表明用 E( Y | X ) 描述 Y 与 X 之间的关系是最佳地刻画 ( 均
方意义下 ) .它比用 ρX Y 刻画两者之间线性关系的密切程度要更深
入与精细 .
在本定理的证明中 , 充分应用了条件数学期望的性质 .可见 ,
恰当地运用这些性质往往可以使问题得到大大的简化 .
Y＊ .
例 5 .9 　设 ( X, Y ) ～ N(μ1 ,μ2 ,σ12 ,σ22 ,ρ) , 用 X 预测 Y , 求珟
Y ＊ = E( Y | X) , 由例 5 .6 , E( Y | X) = μ2 +ρσ2 σ1- 1 ( X -
解　珟
μ1 ) , 故
＊ -1
珟
Y = E( Y | X) = μ2 + ρσ2 σ1 ( X - μ1 ) . (5 .1 0)
　　进一步推广如下 .
若用 X1 , X2 , … , Xn 的某一 ( 博雷尔可测 ) 函数作为 Xn + 1 的预
X n＊+ 1 = E( Xn + 1 | X1 , … , X n ) ( 如右
测 , 则 X n + 1 的最佳均方预测为珦
边存在的话 ) .
例 5 .10 　设{εn , n ≥ 1 } 独立同分布 , 且 εn ～ N (0 ,σ2 ) , X0 =
0 , Xn - aX n - 1 = εn ( | a | < 1 常数 ) , 用已知 X1 , X2 , … , Xn 去预测
Xn + 1 , 求 Xn + 1 的最佳均方预测 .
k- 1
∑ aε
h
解　由 Xk = k- h (1 ≤ k ≤ n) , 知 X1 , X2 , … , X n 与εn + 1
h= 1
独立 , 故
4 .6 母函数　 175
X n＊+ 1 = E( X n + 1 | X1 , … , X n ) = E( aX n + εn + 1 | X1 , … , X n )
珦
= E( aX n | X1 , … , X n ) + E(εn + 1 | X1 , … , Xn )
= aX n + Eεn + 1 = aX n .
6 　条件方差
2
定义 5 .8 　设二维随机变量 ( X , Y ) , 若 E( X | Y ) 存在 , 则称
D( X | Y ) = E[ ( X - E( X | Y ) ) 2 | Y] 是 X 关于 Y 的条件方差 .
易知 D( X | Y ) = E( X2 | Y ) - ( E( X | Y ) ) 2 .
4 .6 母函数
对于取值非负整数的随机变量 , 其母函数有极其良好的分析
性质且便于计算和分析 , 因此引入母函数是非常必要的 .母函数又
称生成函数 ( gener ati ng function) .
∞
∑ a s (|
n
定义 6 .1 　对于数列{ an , n ≥ 0} , 称幂级数 g( s) = n s|
n= 0
≤ 1) 为{ an , n ≥ 0 } 的母函数 .
0 1 n
例 6 .1 　对组合数列 C n , C n , … , C n , 其母函数为
n
∑C s
k k n
g( s) = n = (1 + s) .
k= 0
定义6 .2 　设 X 为非负整值随机变量 , 它的概率分布为 P( X =

k) = pk ( k = 0 , 1 , 2 , … ) , 则称
∞
∑p s
X k
g( s) = E( s ) = k , 　 | s|≤ 1 ( 6 .1)
k= 0
为 X 的概率母函数 , 简称为母函数 .
1 　几个常用分布的母函数
(1 ) 二项分布
n
设 X～ B( n, p) , 则它的母函数为 g( s) = ( q + sp) .实际上
n n
∑ ∑ Cn p (1 - p)
X k k k n- k k n
g( s) = E( s ) = pk s = s = ( q + sp ) .
k= 0 k= 0
由上式可得二点分布的母函数为 g( s) = q + sp .
(2 ) 泊松分布
λ( s - 1 )
设 X 服从 X ～P o(λ) , 则其母函数为 g( s) = e .因为
∞
λk e - λ k - λ sλ λ( s - 1 )
∑
X
g( s) = E( s ) = s = e e = e .
k= 0 k!
　　 (3 ) 几何分布
k - 1
设 X 服从参数为 p 的几何分布 , 即 P( X = k) = q p( k = 1 ,
2 , … ) , 则其母函数为 g( s) = ps/ ( 1 - qs) .事实上
∞
ps
∑q
X k- 1 k
g( s) = E( s ) = ps = .
k= 1 1 - qs
2 　母函数的基本性质
( k)
g ( 0)
(1 ) pk = , k ∈ N = {0 , 1 , 2 , …} .
k!
g( k) ( 0)
若已知 X 的母函数 , 则由 pk = 唯一地确定{ p k , k =
k!
0 , 1 , …} .所以说 , X 的概率分布 { pk , k = 0 , 1 , … } 与其母函数
g( s) 是一一对应的关系 .
(2 ) 设非负整值随机变量 X1 , X2 , … , X n 相互独立 , 而 g1 ,
n
g2 , … , gn 分别是它们的母函数 , 则 Y = ∑X
k= 1
k 的母函数为
n
g( s) = g1 ( s) g2 ( s) … gn ( s) = ∏ g ( s)
k=1
k . ( 6 .2)
　　证明　由定义可知
X + …+ X X X
g( s) = E( s 1 n
) = E( s 1 ・…・ s n )
n
∏ g ( s)
X X
= E( s 1 ) ・…・ E( s n ) = k .
k=1
上式第三个等号是由于 X1 , … , Xn 独立 .
4 .6 母函数　 177
该性质为寻找相互独立 ( 取值非负整数的 ) 随机变量之和的概

率分布带来方便 .下面给出一些例子 .
3 　几个应用
例 6 .2 　设 X1 , X2 , … , Xn 独立同分布 , Xk ～ B(1 , p) (1 ≤ k ≤
n
n) , 求 Y = ∑X
k= 1
k 的分布 .
解　 X1 服从两点分布 , 其母函数为 g1 ( z) = q + pz ; 又由于
X i ( i = 1 , 2 , … , n) 同分布 , 由定理 6 .1 可知 Y = ∑X k 的母函数为
1 ( k)
n
g( z) = ( q + pz ) , 则由 pk = g ( 0) 可求得 Y 的分布律 .
k!
例 6 .3 　设 X1 , X2 独立 , 且 X i ～ B( ni , p) ( i = 1 , 2 ) , 证明
X1 + X2 ～ B( n1 + n2 , p) .
证明　由 gX k ( s) = ( q + sp ) n 及 ( 6 .2) 式有
n n n +n
gX1 + X2 ( s) = ( sp + q) 1 ( sp + q) 2 = ( sp + q) 1 2 ,
所以 X1 + X2 ～ B( n1 + n2 , p) .证毕 .
例 6 .4 　设 T1 , T2 , … , Tn 独立同分布且 T n ～ G( p) ( 0 < p <
n
1) , 参数同为 p, 求 Sn = ∑T k=1
k 的分布 .
ps
解　 T1 服从几何分布 , 则其母函数为 g1 ( s) = .由于 Ti
1 - qs
n
ps
独立同分布 , 则 Sn 的母函数为 g ( s) = , 然后 , 将其展成
1 - qs
幂级数 , 从而找出 Sn 的分布
n ∞
ps n( n+ 1) … ( n+ k - 1)
∑
n n - n n n
= p s (1 - qs) = ps ( qs) k
1 - qs k= 0 k!
∞ ∞
∑C ∑ Cn + k - 1 p q
k n k n+ k n-1 n ( n + k) - n n+ k
= n+ k - 1 pq s = s
k= 0 k=0
∑C
n-1 n k- n k
= k-1 p q s ,
k= n
所以 Sn 的分布为 P ( Sn = k) = C nk -- 11 pn qk - n ( k = n, n+ 1 , … ) .
例 6 .5 　设 X1 , X2 相互独立 , 且 Xk ～ Po(λk ) ( k = 1 , 2 ) .证明 :
X1 + X2 ～ Po(λ1 + λ2 ) .
λ ( s - 1)
证明　由已知 Xk ～ P o(λk ) , 知 gk ( s) = e k
( k = 1 ,2) , 且
X1 , X2 互相独立 , 则 X1 + X2 的母函数 g( s) = g1 ( s) g2 ( s) =
e(λ1 +λ2 ) ( s - 1 ) , 所以 X1 + X2 ～ P o(λ1 + λ2 ) . 证毕 .
这与第 3 章的有关结论相同 , 但证明较简单 , 足见母函数的
威力 .
4 　母函数与数字特征及期望的关系
(1 ) 母函数与数字特征的关系
定理 6 .1 　母函数与期望和方差间的关系可如下表示 :
E( X) = g′(1 ) , D( X) = va r( X) = g″( 1) + g′(1 ) - [ g′( 1) ] 2 .
( 6 .3)
∞
　　证明　由定义 g( s) = ∑p s , 两边对 s 求导 , 有
k
k
k= 0
∞ ∞
∑ kp ∑ kp
k-1 k-1
g′( s) = k s = k s ,
k= 0 k= 1
∞
因此 g′(1 ) = ∑ kp
k= 1
k = EX , 而
∞
∑ k( k -
2
g″( s) | s= 1 = 1 ) pk = E[ X( X - 1) ] = E( X ) - E( X) ,
k= 2
2 2 2
所以 D X = E X - E( X) = g″(1 ) + g′(1 ) - [ g′( 1) ] .证毕 .
(2 ) 母函数的期望表示
∞
∑s P( X =
k X
由母函数的定义 gX ( s) = k) = E( s ) 可知 , X 的
k=0
母函数就是 sX 的数学期望 , 即在母函数与期望之间有紧密的联
系 , 使用母函数的期望表示可以简化母函数的运算、证明 .这一点
练习题　 179
在证明定理 6 .1 时已经看到了 .
例6 .6 　在一次核反应中 , 某个粒子可能分裂为 2 或 3 个粒子
或不分裂 .这 3 种可能性相应的概率分别为 p2 , p3 与 p1 , 新粒子的
分裂性态是相同的 ( 与原有粒子分裂性态相同 ) , 并且分裂的情形
彼此独立 , 求两次反应以后粒子总数的分布 .
解　令 X1 = 第一次反应后的粒子数 , X2 = 两次反应后的粒
子数 .
X 2 3
由题意 E( s 1 ) = g( s) = p1 s + p2 s + p3 s , 求 X2 的母函数
E( sX 2 ) .由于两次反应后的总粒子数 , 是由一次反应后各个粒子分别
独立的分裂 (或不分裂) 产生的粒子总和, 故有 X2 = Y1 + Y2 + … +
Y X1 , 这里 Y i = 第一次反应后第 i( i = 1 , 2 , 3) 个粒子分裂产生的
粒子数 , Y i 与 X 1 同分布 , 故 gi ( s) = E( sX1 ) ; 由定理 6 .1 , E( sX 2 ) =
Y + …+ Y X
E( s 1 X
1 ) , 由于 X1 是随机变量, 应用条件期望性质有 E( s 2 ) =
Y + …+ Y
E[ E( z 1 X
1 | X1 ) ] . 因为
Y + …+ Y Y +… + Y Y +… + Y
E( s 1 X
1 | X1 = k) = E( s 1 k
| X1 = k) = E( s 1 k
)
Y Y Y k
= E( s 1 ) E( s 2 ) … E( s k ) = [ g( s) ] ,
故有 E( sY 1 + … + Y X1 | X1 ) = [ g( s) ] X1 , 从而得 E( sX2 ) =
X X
E[ ( g( s) ) 1
] , 故将 E( s 1 ) = g( s) 的 s换成 g ( s) 即为 X2 的母函数
X
E( s 2 ) = g[ g( s) ] .
有关母函数的详细内容可参阅费勒 ( Feller) 名著《概率论及
其应用》第 2 卷 .
练习题
4 .1 　设随机向量 ( X , Y ) 的联合分布律同第 3 章 3 .1 题 , 试求
E( X + Y ) , E( X ∨ Y ) , E( X ∧ Y ) .
4 .2 　设{ Yn , n ≥ 1} 独立同分布 , P( Yn = 1 ) = p > 0 , P( Yn =
n
- 1) = q = 1 - p > 0 , X0 = 0 , Xn = ∑Y
k=1
k ( n ≥ 1 ) , Vn =
( q/ p) X n , T = mi n{ n, n ≥ 1 , Xn = - 1 或 X n = 2 } .求 : (1 ) E X 3 ,
E X 100 0 ; ( 2) EV n ; ( 3) ET ; (4 ) E X T ; ( 5) E( T ∧ n) ( n > 0 固定
常数 ) .
4 .3 　设随机变量 N 同第 2 章 2 .3 1 题定义 , 求 E N .
4 .4 　某箱中装有 n 张标号 1 至 n 的票券 , 按放回逐张抽
取 .问 :
(1 ) 到第一张抽出的票券再次被抽出为止 , 抽取的期望数是
多少 ?
(2 ) 到第一次出现重复为止 , 抽取的期望数是多少 ?
(3 ) 若只抽取 m 次 , 最大票券号码的期望数是多少 ?如是以无
放回方式抽取 m 次 ( m ≤ n) , 回答同一问题 .
4 .5 　对某一目标进行射击 , 直到击中 r 次为止 , 如果每次射
击的命中率为 p , 求需射击次数的均值和方差 .
4 .6 　现有编号的 n 个袋子 , 第 i 个袋中装有 a i 个红球和 b i 个
白球 ( 1 ≤ i ≤ n) .现先从 1 号袋中随机的取出一球 , 记下颜色后放
入 2 号袋中 , 再从 2 号袋随机取出一球 , 重复以上过程 , 直至从 n 号
袋任取一球 , 记下颜色为止 .记这 n 次取到红球的个数为 S n , 试
求 ES n .
4 .7 　设 X = ( X i , 1 ≤ i ≤ r) 服从参数为 ( n; r , p1 , p2 , … , pr )
的多项分布 , 试求 E X i X j , cov( X i , X j ) , 及 ρX i X j (1 ≤ i, j ≤ r) .
4 .8 　设有 n 个形状完全相同 ( 不可辨 ) 的球 , 随机地放在 m
个有编号的盒子中 ( 假设每一个球放在每一盒是等可能的 , 每盒放
的球数不限 ) .试求球超过 l 个 ( m, n ｍ l ≥ 1 ) 的期望盒数 .
4 .9 　某城市共有 m 辆汽车 , 车牌编号为 1 到 m .若随机的记
下 m 辆车的车牌号 , 其最大号记为 X , 求 E X .
练习题　 181
4 .10 　设 X 为取值非负整数随机变量, 证明 EX = ∑ P( X ≥
n= 1
n) ; 设随机变量 Y ≥ 0 , 分布函数为 F( s) , 证明
∞
EY = ∫ [1 -
0
F( s) ] ds .
4 .11 　任给 t≥ 0 , 记 N( t) 为一信号接收器在[0 , t] 上到达的信

号数 .设 N(0) = 0, S0 = 0 , Sn 为第 n( n ≥ 1 ) 个信号到达时刻 , Sn 的
分布函数为
- λt 2
P( Sn ≤ t) = [1 - e (1 + λt + (λt) / 2 ! + … +
(λt) n - 1/ ( n - 1 ) !) ] I( t≥ 0 ) .
　　 (1) 试用 ( Sn ≤ t) ( n ≥ 1) 来表示 N( t) ; ( 2) 求 EN ( t) ; (3) 求
DN ( t) , E( N( t) N( t + s) ) .
4 .12 　设{Y n , n ≥ 1} 独立同分布 P( Yn = 1) = p > 0 , P( Yn =
n
- 1) = 1 - p = q > 0, X0 = 0 , Xn = ∑Y , A
i=1
i 1 = { Y1 + Y2 + Y3 =
- 1} , A2 = { Y2 + Y3 + Y4 + Y5 = - 2 } , B1 = { X4 = 2 } , B2 =
{ Y3 + Y4 + Y5 + … + Y9 = 3} .
(1 ) A1 , A2 是否相容 ?说明理由 .当 p = 1/ 3 时 , A1 , A2 是否独
立 ?证明你的结论 ;
(2 ) 求 P( B1 B2 ) , P( B2 | B1 ) , P( B2 | 珚
B1 ) ;
(3 ) 求 E( I A2 | I A 1 ) 的示性函数表达式 ;
(4 ) 求 E( X4 | Y1 , Y2 ) , E( X4 | X2 ) 的示性函数表达式 .
4 .13 　设 P( A) = 0 .5 , P( B) = 0 .6 , P( B | A) = 0 .8 , 求
E( I A ∪ B | I A = 1 ) , E( I A∪ B | I A = 0 ) 及 E( I A∪ B | I A ) , E( I A∪ B | I A ,
I B ) 的分布律 .
4 .14 　设 A, B, C ∈ F , 试用定义证 :
(1 ) E( E( I A | I B ) ) = E( I A ) ;
(2 ) E( I A | I B ) = E( E( I A | I B , IC ) | I B )
= E( E( I A | I B ) | I B , IC ) .
4 .15 　设{ Yn , n≥ 1} 独立同分布, P( Yn = 1) = p > 0 , P( Yn =
0) = r ≥ 0 , P( Yn = - 1 ) = q > 0 , p + q + r = 1 , 令 X0 = 0 ,
n
Xn = ∑Y
i= 1
i , A = { Y1 + Y2 + Y3 = 1} , B = { X4 - X1 = 2} .
(1 ) 求 P( AB ) , P( B | A) , P( A ∪ B) ;
(2 ) 求 E X 10 0 , D X1 00 , cov( X1 00 , X4 00 ) 及 X1 00 与 X40 0 的相关
系数 ;
(3 ) 求 E( I B | I A = 1) , E( I B | I A = 0 ) 及 E( I B | I A ) 的分
布律 ;
(4 ) 求 E( X6 | I A = 1 ) 及 E( X6 | I A ) 的示性函数表示式 .
4 .16 　设{ Yn , n≥ 1} 独立同分布, P( Yn = 1) = p > 0 , P( Yn =
0) = r ≥ 0 , P( Yn = - 1 ) = q > 0 , p + q + r = 1 , 令 X0 = 0 ,
n
∑Y
X
Xn = i , Un = Xn - n( p - q) , V n = ( q/ p) n .
i= 1
(1 ) 证明 EUn = EU0 , EV n = E V0 , ＂ n ≥ 2;
(2 ) 求 E( U3 | U0 , U1 , U2 ) , E( V4 | V0 , V1 , V2 ) ;
(3 ) 证明 : E( U n + 1 | U0 , U1 , … , U n ) = U n ,
E( V n + 1 | V0 , V1 , … , V n ) = V n ;
(4 ) 试考虑 ( 3) 的结论是否可以推广 ?
4 .17 　设 N1 , N2 独立, Ni ～ p(λi ) ( i = 1 , 2) ,求 :(1) E( N1 | N1 +
N2 = n) ; ( 2) E( N1 | N1 + N2 ) 及 E( N1 + N2 | N1 ) 的分布律 .
4 .18 　若 X 的密度函数是偶函数 , 且 E( X2 ) < ∞, 试证: | X |
与 X 不相关 , 但它们不相互独立 .
4 .19 　设轮船横向摇摆的随机振幅 X 的概率密度为 f ( x ) =
2 2
A x e- I( x > 0 ) . 求 : (1 ) A; (2 ) 遇到大于其振幅均值的概率 ;
x / 2σ
(3 ) E X ; ( 4) D X .
练习题　 183
4 .20 　从 [0 , 1 ] 中随机的选 n 个点 , 分别求这 n 个值的极大
值、极小值和极差的均值 .
2 k -λ
4 .21 　设 X ～ N(μ,σ ) , Y ～ Po(λ) , P( Y = k) = λ e / k !
( k ∈ N ) , X, Y 独立 , 求 Z = X/ ( Y + 1 ) 的概率密度函数及 EZ .
4 .22 　设 { Xi , 1 ≤ i ≤ n} 独立同分布 , Xi ～ U( 0 , t) , X( 1 ) ,
n
X( 2 ) , … , X( n ) 为其顺序统计量 , Sn = ∑X i= 1
i .(1 ) 求 ES3 ; ( 2) n = 3
时 , 求 E X (1 ) , E X (2) , E X (3 ) .
2
4 .23 　设{ Xk , 1 ≤ k ≤ n} 相互独立 , X k ～ N (μk ,σk ) , Y 为离
n
散型随机变量 , 分布律为 P( Y = yk ) = p k ≥ 0 , ∑ pk = 1 , 且 Y 与
k= 1
n
{ X k , 1 ≤ k ≤ n} 独立 , 令 Z = ∑X
k= 1
k ・ I( Y = y k ) .试求 : ( 1) Z 的概率
密度函数 ; ( 2) EZ 和 D Z .
4 .24 　设随机变量 X, E | X | < ∞ , A ∈ F( A 为事件 ) ,
{ Bk , 1 ≤ k ≤ n} 为样本空间 Ω的一个分解 , P( AB k ) > 0 , ＂ k ∈
{1 , … , n} ,
n
证明 : 1) E X = ∑ P( B
k= 1
k ) E( X | Bk ) ;
n
( 2) E( X | A) = ∑ P( B
k= 1
k | A) E( X | AB k ) .
4 .25 　设水电公司在指定时间内限于设备能力 , 其发电量
4 4
X(10 kW ) ～ U[10 , 23 ] ( 均匀分布 ) , 用户用电量 Y ( 10 k W) ～
U[ 10 , 20 ] .假设 X 与 Y 独立 , 水电公司每供应 1kW 电得到 0 .32 元
的利润 , 但空耗每 kW 电损失 0 .14 元 , 而如用户用电量超过供电
量时 , 公司需从别处补电 , 每 1kW 电反而赔 0 .20 元 .求在指定时
间内 , 该公司获利 Z 的数学期望 .
4 .26 　设 U = aX + b, V = cY + d, ac > 0 .证明 ρU V = ρX Y .
4 .27 　设 X1 , X2 , 独立同分布 , X i ～ N( 0 , 12 ) , 求 E( X1 ∧
X2 ) 及 E( X1 ∨ X2 ) .
T T
4 .28 　 X = ( X1 , X2 ) ～ N (μ, Σ ) , 其中μ = (μ1 ,μ2 ) =
1 4/ 5 3 2
(1 , 2 ) T ,Σ = .令 Y = X.
4/ 5 1 2 3
(1 ) 求 Y = ( Y1 , Y2 ) T 的协方差矩阵 , E( Y2 | Y1 ) 及 E( Y1 + Y2 ) ;
(2 ) 求 E( X2 | X1 = x) 及 D( X2 | X1 = x) ≡ E{ [ X2 -
E( X2 | X1 = x ) ] 2 | X1 = x} ;
(3 ) 试问 : { X2 - E( X2 | X1 ) } 与 X1 是否独立 ?证明你的结论 .
4 .29 　设 { X i , 1 ≤ i ≤ n} 独立同分布 .
X1
(1 ) 当 X i > 0 时 , 证明 E = 1/ n;
X1 + … + X n
n n+ m
(2 ) 证明 cov ∑ X ,∑ X
i= 1
i
i= 1
i = nD X 1 ;
(3 ) 试问 ( 1) 的结果能否推广 ?请具体给出并证明 .
2n - 1
k
4 .30 　设 Y ～ U[ 0 , 1] , 令 Yn = ∑2 k=0
n I 2
k ≤ Y < k+ 1
n
2
n ( n≥ 0) .
求 : 1) EY2 , E( Y Y1 ) , E( Y2 | Y1 ) ;
( 2) EY n , E( Y3 | Y1 , Y2 ) ;
( 3) E( Yn + 1 | Y n ) , E( Y n + 1 | Y1 , … , Y n ) .
4 .31 　设 { Y n , n ≥ 1} 独立同分布 , Y k ～ N (0 ,σ2 ) (1 ≤ k ≤
2
μ nμ
n) , 令 Xn = exp 2 ( Y1 + … + Yn ) - 2 .求: (1) EX1 , E( X2 | X1 =
σ 2σ
x ) , ＂ x ∈ R ; (2 ) E( X n + 1 | X1 , … , X n ) .
2 n- 1
k
4 .32 　设 Y ～ U[0 ,1] ,令 Yn = ∑2
k= 0
n I 2
k ≤ Y < k+1
n
2
n ( n ≥ 0) , Xn =
λ( Y + 2 - n ) λY n
(e n
- e n
)・2 ( n ≥ 1) .求 : (1 ) Y 在给定 Y1 , … , Y n 下的条件
概率密度函数 ; (2 ) E( X2 | X1 ) , E( X3 | X1 , X2 ) ; (3 ) E( X n + 1 | X n ) ,
E( Xn + 1 | X1 , … , X n ) .
练习题　 185
4 .33 　设 { X i , 1 ≤ i ≤ n} 独立同分布 , X n ～ U (0 , 1 ) , 对
n
1
＂ 0 < t < 1 , 记 N n ( t) = ∑I
i= 1
( X ≤ t)
i
,珟
Fn ( t) =
n
N n ( t) ,αn ( t) =
n(珟
Fn ( t) - t) .
(1 ) 求 E N n ( t) , E珟
F n ( t) 及 D珟
F n ( t) ;
(2 ) ＂ 0 < s < t ≤ 1 , 求给定 Nn ( s) 下 Nn ( t) - N n ( s) 的条件
分布律 ;
(3 ) ＂ 0 < s < t ≤ 1 , 求 E( N n ( t) - N n ( s) | N n ( s) ) 的分布律 ;
(4 ) ＂ t ∈ [0 , 1 ] , 固定 , 证明 : ＂ ε> 0 , lim P( | 珟
Fn ( t) - t | <
n→ ∞
ε) = 1 .
1
4 .34 　设 { X k , 1 ≤ k ≤ n} 独立且 X k ～ Ex(λ) ,λ= > 0,
θ
- λt
即 X k 的分布函数为 F ( t) = ( 1 - e ) I( t≥ 0 ) , X ( 1 ) , X ( 2 ) , … , X( n) 为
n
其顺序统计量＂ t ≥ 0 , N n ( t) = ∑I
k=1
(X
( k)
≤ t) ,珟
F n ( t) = N n ( t)/ n,
k
θn , k =
珓 ∑X
i= 1
( i) + ( n - k) X ( k) / k(1 ≤ k ≤ n) .
(1 ) 求证 : ＂ t ≥ 0 , E(珟
Fn ( t) ) = F( t) ;
(2 ) 记 X( 0 ) = 0, 求: ( X( k) - X( k - 1 ) ) 的概率密度函数及 E( X( k) -
X( k - 1 ) ) ( 1 ≤ k ≤ n) ;
(3 ) 证明 : X( 1 ) , X( 2 ) - X ( 1 ) , … , X( n) - X( n - 1 ) 相互独立 ;
(4 ) 求证 E(珓
θn, k ) = θ= 1/ λ.
4 .35 　已知 n 维随机向量 X ～ N (0 , I) , Σ= I 为 n 阶单位矩
阵 , 试证 : XT Σ - 1 X ～ χ2 ( n) , 其中 χ2 ( n) 的定义见练习题 3 .32 .
6 3 2
-1
4 .36 　设 X ～ N(μ, Σ) , 其中μ = 0, Σ = 3 4 1 ,求
2 1 2
( X2 , X3 ) T 的联合密度以及 X1 = x1 的条件下 , ( X2 , X3 ) T 的条件
密度 .
4 .37 　设{ Xk , 1 ≤ k ≤ n} 独立同分布, Xk ～ U[0 , t] , X( 1 ) , … ,
X( n) 为其顺序统计量 .试求 E X ( k) ( 1 ≤ k ≤ n) .
4 .38 　设珟
Fn ( x) 与 F( x ) 同第 3 章 3 .36 题 .( 1) 求 : E珟
Fn ( x ) ;
(2 ) 利用切比雪夫不等式证明 : ＂ ε> 0 , n→
lim P( | 珟
Fn ( x ) - F( x) | <
∞
ε) = 1; (3 ) ＂ x ∈ R 固定 , 证明 P( n→
lim 珟
F n ( x) = F( x ) ) = 1 .
∞
4 .39 　设 ( X , Y ) , Z1 , Z2 同第 3 章 3 .37 题 . (1 ) 求 : cov( Z1 ,

Z2 ) ; (2 ) 证明 Z1 与 Z2 相互独立 .
T
4 .40 　设 X = ( X1 , X2 ) ～ N(μ,Σ ) 为二维正态 , 令 Y =
AX, 其中 A = ( aij ) 2×2 为非退化 2 阶矩阵 , 证明 : Y ～ N( Aμ ,
AΣAT ) .
k+ r - 1 r k
4 .41 　求负二项分布 P( X = k) = pq (r ∈
r - 1
N \ {0 } ; k = 0 , 1 , … ) 的母函数 .
4 .42 　设非负整值随机变量 X 的母函数为 g ( z) , 求 X + 1 及
2 X 的母函数 .
1 2
4 .43 　求分布列, 其母函数为: (1 ) (1 + z) ;
4
1 ; ( 3) e z - 1 .
(2 )
2 - z
4 .44 　直接找出下列特征函数的分布函数 : (1) cost; (2 ) cos2 t .
4 .45 　设非负整值随机变量 X 的母函数为 g ( z) .求 :
∞
∑ P( X ≤ k) z
k
(1 ) ;
k= 1
∞
∑ P( X
k
(2 ) = 2 k) z .
k= 0
4 .46 　在重复独立实验中 , 每次实验成功的概率为 p , 令 X 为

首次在成功之后即遇到失败的实验次数 ( 即
“ X = n”意味着第 n - 1
练习题　 187
次实验成功 , 第 n次实验失败 , 但在前 n - 2 次实验中没有一次失败

是紧跟在成功之后的 ) .求 X 的母函数 , 并找出 E( X ) , var ( X) .
4 .47 　设{ Yn , n ≥ 1 } 是独立同分布非负随机变量 , 生成函数
为 GY ( s) .Z ～ G(1 - p) 是参数为 ( 1 - p) 的几何分布 , 即 P( Z =
k- 1
k) = ( 1 - p) p ( k ∈ N \ { 0} ) , 且 Z 与{ Y n , n ≥ 1} 独立 , 令 X =
Z
∑Y
n= 1
n , 试求 X 的生成函数 .
4 .48 　设 X1 , X2 独立 .(1 ) 如 X i ～ B( ni , p) ( i = 1 , 2 ) .证明

X1 + X2 ～ B( n1 + n2 , p) ; (2 ) 如 X i ～ P(λi ) ( i = 1 , 2) , 证明 X1 +
X2 ～ P(λ1 + λ2 ) .
2
4 .49 　设 Y1 , Y2 , Y3 独立同分布 , Y k ～ N (0 ,σ ) (1 ≤ k ≤ 3 ) ,
X1 = ( Y1 - Y2 )/ 2 , X2 = ( Y1 + Y2 - 2 Y3 )/ 6 , X3 = ( Y1 + Y2 +
Y3 )/ 3 .证明 : X1 , X2 , X3 相互独立 .
2
4 .50 　设 { Y1 , … , Y n } 独立同分布 , Y k ～ N(μ,σ ) (1 ≤ k ≤
n n
∑ Y k , Zk = Y k - 珚Y( 1 ≤ k ≤ n) , Sn = ∑ ( Y k - 珚Y) .
2
n) , 记珚
Y =
k= 1 k=1
证明 : 1) 珚
Y 与 Zk = Yk - 珚
Y 相互独立 (1 ≤ k ≤ n) ;
( 2) 珚
Y 与 Z2k = ( Y k - 珚
Y ) 2 相互独立 (1 ≤ k ≤ n) ;
( 3) 珚
Y 与 S n 相互独立 .
4 .51 　 ( 马尔可夫不等式 ) 　设 E X = μ, 且 E | X - μ| k = μk
μk
存在 , 则＂ ε> 0 有 P( | X - μ| ≥ε) ≤ k ( k ≥ 1) .
ε
4 .52 　 ( 坎泰利 ( Cant elli) 不等式 ) 　设 E X = μ, D X = σ2 ,
证明 :
(1 ) P( X - μ > ε) ≤ σ2 / (σ2 + ε2 ) , 对＂ ε> 0;
2 2 2
(2 ) P( X - μ < ε) ≤ σ/ (σ + ε ) , 对＂ ε> 0 .
4 .53 　设 X ～ N (μ,σ2 ) .证明 :
2 1 - ε2/ 2
P( | X - μ| > εσ) ≤ e .
π ε
∞
∫
2 2
( 提示 : 利用不等式 : e- u / 2 d u ≤ e- x - 1 , 对＂ x > 0 .)
x / 2
4 .54 　 ( 柯尔莫哥洛夫不等式 ) 　设{ Xk , 1 ≤ k ≤ n} 是独立随

机变量 , D X k < ∞ .证明 : 对＂ ε> 0 , 有
k k
∑( X ∑ DX
2
P 1max i - EXi ) ≥ε ≤ i ε .
≤ k≤ n
i= 1 i=1
第5章
独立随机变量序列的极限定理
本章主要讨论随机变量序列一些基本的极限定理 .包括 : 独立
同分布随机变量序列的弱大数定律 ; 特征函数及其性质 ; 中心极限
定理 ; 4 种收敛概念与相互关系等 ; 强大数定律 .
5 .1 　大数定律
这里研究的大数定律 , 主要内容是研究独立随机变量序列的

前 n 项算术平均在什么条件下以概率收敛到它们的数学期望的
平均 .
众所周知 , 在 n 次独立重复伯努利试验中 , 事件 A 出现的频
μn ( A)
率 f n ( A) = 在一定概率意义下趋向事件 A 的概率 , 这早已
n
为大量试验结果所证实 .那么它的理论依据是什么 ? 如何来确切
刻画以上事实 ? 下面的定理给出答案 .
定理 1 .1( 伯努利大数定律 ) 　设 μn ( A) 是 n 次伯努利试验中
事件 A 出现的次数 , 且 P( A) = p , 则＂ ε> 0 ,
μn
lim P ω: - p <ε= 1 . ( 1 .1)
n→ ∞ n
　　证明　令
1, 第 i 次试验出现 A ,
Xi =
0, 第 i 次试验不出现 A ,
则{ X i , 1≤ i≤ n}独立同分布 , Xi ～ B( 1 , p) .E X i = p ,
190 　第 5 章独立随机变量序列的极限定理
n n
μn 1
∑ n∑
D X i = p(1 - p) .μn = Xi , E = E Xi = p ,
i=1 n i= 1
n n
μn 1
D = D ∑ X i = 12 D ∑X i = p( 1 - p) ≤ 1 ,
n n i= 1 n i=1 n 4n
故由切比雪夫不等式知 , ＂ ε> 0 ,
μn μn
0 ≤ P ω: - p ≥ ε ≤ 12 D ≤ 1 2 → 0, 　 n → ∞,
n ε n 4 nε
得
μn
lim P ω: - p < ε = 1 , 　＂ ε> 0 .
n→ ∞ n
μn
　　以上事实 , 我们称事件 A 的频率以概率收敛到 p = P( A) ,
n
μn P μn
简记为 P ( A) ( n→∞ ) .直观解释 , 由于 n→ ∞ 时 , D =
n n
μn
D - p →0 , 因而不论任给多么小的 ε> 0 , 当 n 越大时 , 事件
n
μn μn
ω: - p <ε 的概率就越大 , 且越接近于 1 , 即频率的取值
n n
落在 p 的ε小邻域中的概率越接近于 1 , 即 n→∞时 , 有
μn
P{ω: | - p | < ε} → 1 .
n
　　对于一般的独立同分布随机变量序列有以下结果 .
2
定理 1 .2 　设{Yn, n≥1}独立同分布, 且 EYn = μ, , DYn =σ < ∞ .
n
1
n∑
令 Xn = Y k , 则＂ ε> 0 ,
k= 1
lim P{ω: | Xn - μ| < ε} = 1 , ( 1 .2)

n→ ∞
称{ X n , n≥ 1}以概率收敛到 μ.简记为
n
1 P
Xn = ∑ Y k μ　 ( n → ∞ ) .
n k= 1
5 .1 大数定律　 191
2
σ
　　证明　显然 E X n = μ, D Xn = .由切比雪夫不等式有 ,
n
2
＂ ε> 0 , 0 ≤ P{ω: | X n - μ| ≥ ε} ≤ 12 ・σ ,
ε n
即
2
1 - 12 σ ≤ P{ω: | X n - μ| < ε} ≤ 1 ,
ε n
故＂ ε> 0 ,
lim P{ω: | Xn - μ| < ε} = 1 .
n→ ∞
直观解释与应用
( 1) 若 μ表测量对象的真值 ( 理论值 ) .Y k 表第 k 次测量值 , X n
表前 n 次独立重复测量的平均值 .显然它的均方误差 E( Xn - μ) 2 =
1 2 2 2
σ 要比 E( Y k - μ) = σ 小 .若 ε表测量误差限 , ( 1 .2 ) 式表明不
n
管精度要求多么高 ( 即 ε多么小 ) , 只要取测量次数 n 足够多 , 则取
其平均值 Xn 就可使落在真值的误差限内的概率就可充分接近
于1 .
(2 ) 记 An (ε) = {ω: | X n - μ| < ε} , ( 1 .2 ) 式等价于 : ＂ ε> 0 ,
P( An (ε) ) →1 ( n→∞ ) .
(3 ) 注意此处n→
lim P( An (ε) ) ≠ P( n→
lim An (ε) ) , 而且此时 n→
lim An (ε)
∞ ∞ ∞
不一定有意义 !
例 1 .1( 经验分布以概率收敛到理论分布 ) 　设随机变量 X～
F( x ) = P( X≤ x) , { Xk, 1≤ k≤ n}独立同分布 , 且 X k 与 X 同分布 ,
n
＂ x∈R , 称珟
Fn ( x ) = ∑I
k=1
( X ≤ x)
k
/ n 为随机变量 X 的经验分布 , 则
有＂ x∈R , n≥1 .
(1 ) E珟
Fn ( x) = F( x ) , D珟
Fn ( x ) = F( x ) ( 1 - F( x ) )/ n; ( 1 .3)
(2 ) ＂ ε> 0 , lim P( |珟
Fn ( x ) - F( x) | <ε) = 1 . ( 1 .4)
n→ ∞
简记 nli→m 珟
Fn ( x ) = F ( x) .
∞
解　 (1 .3 ) 式显然 , (1 .4 ) 式由 ( 1 .3) 式再利用定理 1 .2 即得 .

应用举例 .在实际工作中 , 有时理论分布 F ( x ) 未知 , 可用
珟
Fn ( x) 作为 F( x ) 的估计 ; 若事件 A 的概率 P ( A) 未知时 , 只要 n 充
分大 , 可用其频率作为估计 .特别值得一提的是 : 大数定律是近年
来发展迅速的随机算法和随机模拟方法的理论基础之一 .
例 1 .2 ( 用蒙特卡罗 ( Monte－Carlo ) 随机模拟方法计算积分 )
b
　试用随机试验模拟方法计算下面积 Ih = ∫h ( x) d x .
a
解　取随机变量序列{ X i , i≥1 } 独立同分布 , Xi ～ U[ a, b] , 即
Xi 为[ a, b]上的均匀分布的随机变量 .从而{ g( Xi ) , 1≤ i≤ n}亦独立
b
同分布, 且 Eg( Xi ) = ∫ h( x)d x/

a
( b - a) , 故而 Ih = ( b - a) E g( Xi ) .
n
1 P
n∑
由大数定律知 ^g ( X) = g( X i ) E g ( X i ) ( n → ∞ ) .于是
i= 1
当 n 充分大时 , 有 Ih = ( b - a) 1 ∑ g( X i ) .这说明 , 可以通过随

n i= 1
机试验的方法 , 生成序列{ X i , i≥ 1 } 就可以计算其积分 , 试验次数
n 可以由精度要求等因素来确定 .
定理 1 .2 可推广为以下的马尔可夫大数定律 .
定理 1 .3 　设{ Y n , n≥1} 为随机变量序列 , 若
n
1 ・D
lim
n→ ∞ n
2 ∑Y
k=1
k = 0,
则＂ ε> 0 ,
n n
1
lim P ω: ∑ Y k - 1 ・ ∑ EY k < ε = 1 .
n→ ∞ n k= 1 n k= 1
　　证明　利用切比雪夫不等式即得 .
5 .2 特征函数　 193
5 .2 　特征函数
第 4 章的讨论表明 , 数学期望、方差等数字特征只能粗略地反
映分布函数的某些性质 , 一般情况下并不能完全确定分布函数 .本
节引入特征函数的概念 , 既可完全刻画分布函数又可利用其良好
的分析性质来解决某些问题 .
在上一章中所研究的母函数为非负整值随机变量的研究带来
了很大方便 , 特征函数则是针对一般的随机变量而设立的 .
1 　特征函数的定义
定义 2 .1 　如果 X , Y 均为概率空间 ( Ω, F, P) 上的实值随机
变量 , 则称 ξ= X + iY 为一复随机变量 .且定义复随机变量ξ= X +
iY 的数学期望为 Eξ= E X + i E Y, 其中 i = - 1 为虚数 .
由以上定义知
i tX
E( e ) = E( cos tX + i sin t X ) = E( cos tX ) + i E( sin tX ) .
　　定义 2 .2 　若随机变量 X 的分布函数为 F X ( x) , 则称
+∞ +∞
∫ ∫
itX i tx
φ( t) = Ee = e d FX ( x ) = ( cos t x + i sin t x ) d F X ( x )
- ∞ -∞
( 2 .1)
为 X 的特征函数 ( 简记为 c .f . ) .
若 g( X) 是一个一维博雷尔可测函数 , Y = g( X) , 则有
+∞
∫
i tY i tg ( X) i tg ( x )
Ee = Ee = e d FX ( x ) ,
- ∞
其中 ei t Y = cos tY + i sin t Y .
简单性质 :
(1 ) 由于 | ei tX | ≤1 , 故对任一随机变量 X 及实数 t 都有意义 ,
即任一随机变量都具有特征函数 .
(2 ) 特征函数是一个实变量的复值函数 .
(3 ) 特征函数只与分布函数有关 , 因此又称为某一分布函数
的特征函数 .
(4 ) 若 X 的特征函数为φ( t) , 则 a + bX 的特征函数为
i ta
φa + bX ( t) = e φ( bt ) .
　　 (5 ) φ(0 ) = Ee0 = 1 .
(6 ) 对离散型随机变量 X , P( X = x j ) = p j ( j = 1 , 2 , … ) , 则 X
的特征函数为
∞
∑ pj e
i tx
φ( t) = j .
j= 1
　　对连续型随机变量 X , 其概率密度函数为 f ( x) , 则 X 的特征

函数为
+∞
∫
i tx
φ( t) = e f ( x) d x .
-∞
2 　几种常见分布的特征函数
(1 ) 二点分布
设 X～ B( 1 , p) , q = 1 - p, 则由定义可知
φ( t) = ei t p + e0 q = ei t p + q .
　　 (2 ) 泊松分布
λk - λ
　　设 X～ Po(λ) , 即 P( X = k) = e , k∈ N \ { 0} ; 则
k!
∞ k
φ( t) = ∑ e λ e - λ = e - λeλe = eλ( e - 1 ) .
i tk it it
k= 0 k!
　　 (3 ) 正态分布
① 标准正态分布的特征函数 .设 X～ N (0 , 12 ) , 由
+∞
x2
1 e-
∫ - ∞
sin t x
2π
2 dx = 0,
得
5 .2 特征函数　 195
+∞ +∞
x2 x2
1 - 1 -
∫ ∫
itx
φ( t) = e e 2
dx = cos t x e 2
dx,
- ∞ -∞
2π 2π
两边对 t 求导 , 有
+∞ +∞
x2 x2
1 e- 1
φ′( t) = - ∫ -∞
x sin t x
2π
2
∫
dx =
-∞
sin t x
2π
e- 2 ′d x
+∞ 2
1 -
∫
x
= - tcos t x e 2
d x = - tφ( t) ,
-∞
2π
即可得到微分方程 φ′( t ) + tφ( t ) = 0 , 加上 φ( 0 ) = 1 , 有
- t2/ 2
φ( t) = e .
2
② 对于一般的正态分布 .设 X～ N (μ,σ ) , 可以这样来看 Y =
X -μ
～ N (0 , 1 ) , 所以 X = μ+ σY; 由简单性质 (4 ) 知
σ
iμt iμt - 1 σ2 t 2
φX ( t) = e φY (σt) = e 2
.
3 　特征函数的性质
与母函数相似 , 对于一般随机变量都有定义的特征函数也具

有很好的分析特性 .它作为一种从分布函数到某类实变复值函数
的变换不仅具有一一对应性 , 而且还有某种连续性 .此外 , 它与数
字特征也有直接的联系 .
以下均设 φ( t) 为随机变量 X 的特征函数 .
性质 1 　特征函数 φ( t) , 则 | φ( t) | ≤φ( 0 ) = 1 , 且 φ( - t) =
φ( t) .
证明　显然 φ(0 ) = 1 , 而
∞ ∞
∫ ∫
i tx i tx
| φ( t) | = e d F( x) ≤ | e | d F( x ) ≤
-∞ - ∞
∫ -∞
d F( x ) = 1 = φ(0 ) ,
∞ ∞
∫ ∫
i( - t ) x - i tx
φ( - t) = e d F( x) = e d F( x) = φ( t) .
-∞ - ∞
　　性质 2 　 φ( t) 在 ( - ∞ , + ∞ ) 上一致连续 .
k
性质 3 　若 E( X ) 存在 , 则对任 t∈ ( - ∞ , + ∞ ) ,φ( t) k 阶可
导,且
φ( k) ( t) = i k E( Xk ei t X ) .特别有 φ( k) ( 0) = i k E( Xk ) .
　　性质 4 　 φ( t) 具有非负定性 , 即对任意的正整数 n 及任意实
n n
数 t1 , t2 , … , tn 与复数λ1 , λ2 , … ,λn 总有 ∑ ∑ φ( tk - tj )λk λj ≥ 0 .

k= 1 j= 1
　　证明　显然对＂ tk ∈ R ,λk (1 ≤ k≤ n) 为复数 , 有

n n n
2
∑λk e ∑λk e ∑λj e

it X it X it X
k = k j ≥ 0,
k= 1 k=1 j= 1
故
n n n
2
∑λ e ∑ ∑ E( e )λk λj
it X i( t - t ) X
E k k = k j
k= 1 k=1 j= 1
n n
= ∑ ∑φ( t
k= 1 j= 1
k - tj )λk λj ≥ 0 .
　　性质 5 　设 X1 , … , X n 相互独立 ,φ1 , … ,φn 分别为它们的特征

函数 , 则 Y = X1 + … + Xn 的特征函数为 φ( t) = φ1 ( t ) φ2 ( t) …
φn ( t) .
n n
∏ Ee ∏φ ( t)
it( X + … + X )
证明　 φ( t) = Ee i tY itX
= Ee 1 n = k = k .
k=1 k=1
( 第三个等号是根据 X1 , … , X n 相互独立 ) .
性质 5 是特征函数的一条重要性质 , 独立性问题在概率论中
具有重要的地位 , 而应用特征函数来处理独立问题是简洁明了的 .
因此特征函数在概率论中有其独特的作用 .
4 　特征函数与分布函数的关系
定理 2 .1 　分布函数 F( x ) 到特征函数 φ( t) 的变换是一一对
应的 .
5 .2 特征函数　 197
+∞
注意 φ( t) = Eei tX = ∫ -∞
ei tx d F X ( x ) , 因此 ,φ( t) 实质上是由 X
的分布函数 F ( x ) 决定的 ; 所谓一一对应 , 这里指 : 若 F1 ( x ) ≠
F2 ( x ) , 则 φ1 ( t) ≠φ2 ( t) .从 φ( t) 到 F( x ) 的具体公式如下 :
T
1 e- i t a - e- i t b
F( b) - F( a) = lim
2π T→ ∞ ∫
- T it
φ( t) d t,
其中 a < b 皆是 F ( x) 的连续点 .
证明略 .有兴趣的读者可参看文献[ 3 , 5] .
定理 2 .2 　分布函数序列{ Fn ( x) , n≥1 }与分布函数 F( x ) 具
有关系
lim Fn ( x ) = F( x) 　 ( 对任意 F( x ) 的连续点 )
n→ ∞
当且仅当lim φn ( t) = φ( t) ,
n→ ∞
其中 φ( t) f ( t) 是 F( x) 的特征函数 , 而 φn ( t) 是 Fn ( x) 的特征函数 .
证明略 .有兴趣的读者可参看文献[ 3 , 5 , 8 , 15 , 18] .
定理 2 .3 　设{ Y n , n≥ 1 } 独立同分布 , 且 E Yn = μ< ∞ , 则对
＂ ε> 0 ,
n
1
n∑
lim P ω: Yk - μ < ε = 1 . ( 2 .2)
n→ ∞ k= 1
　　证明　由 Y1 , Y2 , … , Y n 有相同的分布 , 设它们的特征函数为
φ( t) , 由于它们期望存在 E Yn = μ, 故 φ( t) = φ(0 ) + φ′(0 ) t + o( t) =
n
1
1 + iμt + o( t) ; 从而 ∑ Y k 的特征函数 φn ( t) 为
n k= 1
n n
t t t
φn ( t) = φ = 1 + iμ + o ,
n n n
iμt i μt
对固定的 t∈ R 有 φn ( t ) → e ( n→ ∞ ) .而极限函数 e 是连续函
n
数 , 它是退化分布 I ( Y = μ) 对应的特征函数 , 由此可知 1 ∑ Y k 的分

n k=1
n
1 P
布函数弱收敛于 I ( Y = μ) .由定理 2 .2 得 ∑ Y k μ.
n k= 1
5 　多元特征函数
设随机向量 X = ( X1 , …, Xn ) 的联合概率密度函数为 p( x1 , …,
xn ) , 类似于一维情形 , 我们可定义随机向量 X 的特征函数为
n
φ( t1 , t2 , … , tn ) = E exp i∑ tk X k
k=1
n
∞ ∞
=∫ …∫ -∞ -∞
exp i∑ tk x k ・ p( x1 , x2 , … , xn ) d x1 d x2 … d xn .
k= 1
　例如 , 设 X = ( X k , 1≤ k≤ n) T ～ N (μ, Σ) 为 n 维正态随机变量 ,
则其特征函数为
itT X T 1 tT Σt
φ( t) = Ee = exp iμ t - . ( 2 .3)
2
　　对于 n 元特征函数的性质与一元相类似 , 读者可参阅文献
[3 , 5 , 8 ] .
5 .3 　中心极限定理
在实际问题中 , 往往要考虑多个随机因素对某一随机现象的

指标所产生的总的影响 , 而这些指标的统计规律性常常呈现出近
似于正态分布 .这些事实的原因是什么 ? 另一方面 , 对一串随机变
n
量序列{ Y n , n≥1 } , 当 n 很大时求其前 n 项和 X n = ∑Yk= 1

k 的分布
是件复杂的事情 , 自然希望在一定条件下 X n 的极限分布能够存
在 , 这是很有意义的工作 .本节要介绍的中心极限定理就是研究在
什么条件下 , X n 的极限分布恰是正态分布 .为使问题的提法更具
一般化和应用性 , 这一节我们感兴趣的问题是 : 在什么条件下 , 随
机变量序列 { Y n , n ≥ 1 } 的前 n 项和 X n 经标准化后 , 即 Zn =
Xn - E X n
的极限分布是标准正态分布 .
D Xn
5 .3 中心极限定理　 199
1 　独立同分布的情形
定理 3 .1 ( 林德伯格－莱维 ( Lindeberg－Levy) 定理 ) 　设 { Y n ,
n
∑Y
2
n≥1} 独立同分布 , 且 E Y1 = μ, DY1 = σ < ∞ , 记 X n = k ,
k=1
Xn - E X n ∑(Y
k=1
k - μ) n
Yn - μ
Zn =
D Xn
=
n・σ
= ∑
k=1 n・σ
,
则＂ x∈R 有
x 2
1
∫
- u
lim P( Zn ≤ x ) = Φ( x ) = e 2
d u, ( 3 .1)
n→ ∞ - ∞
2π
w
简记 P( Zn ≤ x ) Φ( x) .
Yn - μ
证明　令 Y ′
n = , 则 EY ′
n = 0 , DY ′
n = 1 .设 Y ′
n 的特征函
σ
数为φ( t) = Eei tY′n , 则
2
φ″(0 ) 2 2 t 2
φ( t) = 1 + φ′(0 ) t + t + o( t ) = 1 - + o( t ) ,
2! 2
Y′
n t t2 o( t2 )
的特征函数为 φ =1 - + .故 Zn 的特征函数为
n n 2n n
2
2 2 n 2 2 - 2n - t
1 - t + o( t ) 1 - t + o( t )
t2 2
φn ( t) = = ,
2n n 2n n
t2
故 : n→ φ , ＂ x∈R .
-
lim n ( t) = e 2
∞
x 2
1
∫
- u
lim P( Zn ≤ x ) = Φ( x ) = e 2
du .
n→ ∞ - ∞
2π
　　以下是中心极限定理几个简单应用的例子 .
(1 ) 正态随机数的产生
计算机上通常可以生成服从[0 , 1 ]上均匀分布的“ 伪随机数”.

如何由此产生正态分布的随机数呢 ?
n
设{ Y k , k≥1 }独立同分布 , 且 Y k ～ U [ 0 , 1 ] , 令 X n = ∑Y
k=1
k .
记 f n ( x ) 为 X n 的概率密度函数 , 则
1, x ∈ [ 0 , 1] ,
f1 ( x) =
0, x ｜ [ 0 , 1] ;
x, x ∈ [ 0 , 1] ,
f2 ( x) = 2 - x, x ∈ [ 1 , 2] ,
0, 其他 ;
1 x2 , x ∈ [0 , 1 ] ,
2
1 ( - 2 x2 + 6 x - 3) , x ∈ [1 , 2 ] ,
f 3 ( x) = 2
1 2
( 3 - x) , x ∈ [2 , 3 ] ,
2
0, 其他 .
图　 5－1
5 .3 中心极限定理　 201
由图 5 －1 可以看出 , f3 ( x ) 已接近于正态的情形 , 为将其标准化 ,
Xn - E X n
令 Zn = .由中心极限定理有＂ x∈R ,
D Xn
w
P( Zn ≤ x ) Φ( x ) , 　 n → ∞ .
12
通常取 Z12 = ∑Y
k= 1
k - 6 作为正态分布随机变量的近似 .
(2 ) 对误差限可靠度的估计与实验次数的确定 .
在伯努利独立重复试验中 , 若事件 A 的概率 P ( A) = p 未知 ,
μn ( A)
可用 n 次试验中出现 A 的频率作为 P ( A) 的估计 .记 p^ =
n
μn ( A)
, 设估计的误差限为 δ> 0 , 误差限的可靠度 β定义为
n
^ P ω: μn - p < δ .
β=
n
　　 ① 给定 δ及试验次数 n , 以及试验结果 , 估计 β.
由中心极限定理 , 当 n 充分大时
μn
β= P ω: - p <δ
n
n μn ( A) - np n
= P ω: - δ < <δ
p (1 - p) np ( 1 - p) p ( 1 - p)
≈ 2Φ δ n - 1 .
p (1 - p)
μn ( A)
再以珟
p= 作为 p 的近似代入 , 则 β的估计珓
β 取为
n
珓
β = 2Φ δn n - 1 .
μn ( A) ( n - μn ( A) )
　　 ② 给定 δ及 β, 如何确定试验次数 n 以满足要求 .即要求 n
满足
μn ( A)
P ω: - p < δ ≥ β,
n
为此需
n n 1 +β
2Φ δ - 1 ≥ β, 即 Φ δ ≥ .
p( 1 - p) p ( 1 - p) 2
1 +β n
　　记 Zβ满足 Φ( Zβ ) = , 则需 n 满足δ ≥ Zβ , 即需
2 p (1 - p)
2 2
Zβ 1 Zβ
要 n≥ p( 1 - p) .又由 p( 1 - p) ≤ , 故当 n≥ 时, 取
δ 4 2δ
Zβ 2
nmin = + 1 , 当 n≥ nmin 时 , 即有
2δ
μn ( A)
P{ω: | - p | < δ} ≥ β.
n
2 　一般情形的中心极限定理＊
只叙述以下的林德伯格定理 .
定理 3 .2 　设 { Y k , k≥ 1 } 为独立的随机变量序列 , 记 : ak =
n
E Y k , b = DY k < ∞ , B = ∑b , Fk ( x) = P( Y k ≤ x) , 若对＂ τ> 0
2 2 2
k n k
k=1
有
n
lim 1 ∫
n→ ∞ Bn ∑
( x - ak ) 2 d Fk ( x) = 0 , ( 3 .2)
k=1 | x - a | > τB
k n
则 , 对＂ x∈R , 有
n
1
lim P ω: ∑ ( Y k - ak ) ≤ x = Φ( x) , ( 3 .3)
n→ ∞ Bn k = 1
且上式对 x 是一致收敛的 .满足 (3 .2 ) 式称为林德伯格条件 .
以上定理的证明略 .这里仅对 ( 3 .2 ) 条件的概率意义说明如
下 .记 Ak = {ω: | Y k - ak | >τBn } (1 ≤ k≤ n) , 则有
n
n
P{ω: 1max | Y k - ak | > τB n } = P k∪ Ak ≤ ∑ P( Ak )

≤ k≤ n = 1
k= 1
=∑ ∫
k=1
| x - a | > τB
k n
d Fk ( x)
5 .4 随机变量序列的几种收敛性＊　 203
≤ 1 2∑ ∫ ( x - ak ) 2 d Fk ( x ) .
(τB n ) k = 1 | x - a | > τB
k n
可见 (3 .2 ) 条件保证了 , 对＂ τ> 0 ,
| Y k - ak |
lim P ω: 1m ax > τ = 0, ( 3 .4)
n→ ∞ ≤ k≤ n Bn
这表明 : 当 n 充分大时 , 参与构成总和的每一项要以概率“均匀的
小”, 因而任一被加项对总和极限分布不会导致显著的影响 , 这样
即可使它们总和的分布趋向于正态分布 .于是定理可直观地解释
为 : 当某一随机现象的指标是由大量独立的随机因素影响 , 若这些
因素对总和的指标的影响都是“ 均匀的小”( 在概率意义下 ) , 则该
指标的分布近似于正态分布 .这个定理深刻地从理论上证明了许
多自然界中引出的随机变量可用正态分布来近似的理论根据 .
5 .4 　随机变量序列的几种收敛性＊
定义 4 .1( 几乎处处收敛 ( 以概率 1 收敛 ) 　对于随机变量序

列{ X n , n≥ 1}及 X , 若
P ω: n→
lim Xn (ω) = X (ω) = 1,
∞
则称{ Xn , n≥ 1 } 以概率 1 收敛于 X , 或者几乎处处收敛 ( almost
every wher e or al most sur ely , 简记为 a .e .或 a .s .) .记为
a .s . a .e . a .s .
lim X = X , 　或者　 X n
n X 　或者　 X n X.
n→ ∞
　　例 4 .1 　设{ Xn , n≥ 1 } , X , Y 是定义在 [ 0 , 1 ] 上博雷尔概率
空间 ( 见第 1 章例 2 .17) (Ω, F, P) = ( [0 , 1 ] , B[ 0 , 1] , P) 上的随
机变量 , 满足 : ＂ ω∈[ 0 , 1] , Y (ω) = 1 .而 X(ω) = 1 , 若 ω∈珚
B = {[0,
1] 上无理点 } ; X ( ω) = 0 , 若 ω∈ B = { [ 0 , 1 ] 上有理点全体 } .而
1 1
Xn (ω) = 1 , 若 ω∈ n , 1 ; Xn (ω) = 0, 若 ω∈ 0, n .则易知 P(ω:
2 2
X(ω) ≠ Y ( ω) ) = P ( B ) = 0 . ( ω: nlim X n ( ω) = Y ( ω) ) = Ω; ( ω:
→∞
a .s .
li m X n (ω) = X(ω) ) = 珚
B≠Ω, 但 P(珚
B) = 1 , 故lim Xn = X .
n→ ∞ n→ ∞
定义 4 .2( 以概率收敛 ) 　对于随机变量序列{ Xn , n≥1} 及 X ,

若＂ ε> 0 ,
lim P(ω: | X n (ω) - X(ω) | < ε) = 1 .
n→ ∞
则称{ X n , n≥ 1}以概率收敛于 X .记为

P P
lim Xn = X , 或者 X n X 　 ( n → ∞) .
n→ ∞
　　例 4 .2 　设{Y k , 1≤ k≤ n}独立同分布, 且 Y1 ～U[0 , 1 ] , 令 Xn =

n
P 1
∑ Y k/ n , 则由 5 .1 节大数定律可知 X n
k= 1 2
( n→∞ ) .
定义 4 .3( Lp ( p> 0) 收敛 ) 　对于随机变量序列{ Xn , n≥1 } 及

X,若
p
lim E | X n - X | = 0,
n→ ∞
Lp
则称{ X n , n≥ 1}以 Lp 收敛于 X .记为 Xn X .
2
当 p = 2 时 , n→
lim E | X n - X | = 0 , 称 { X n , n≥ 1 } 均方 ( mean
∞
squar e) 收敛到 X .记为

m .s . m .s .
lim X n = X , 　或者 X n X .
n→ ∞
1
　　例 4 .3 　设{ X k , 1≤ k≤ n}相互独立 , 且满足 P( X n = 1) = ,
n
n-1 2 1
P( X n = 0 ) = ( n≥1) , X(ω) ≡0 .则 E( X n - 0 ) = →0 , 故
n n
m .s .
= 0 , 即 Xn
2
lim E | X n - 0 | 0 .
n→ ∞
　　定义 4 .4( 依分布收敛 ( 弱收敛 ) ) 　对于随机变量序列 { Xn ,
n≥1} 及 X , 记 Fn ( x) = P( X n ≤ x ) , F( x) = P( X≤ x) 分别是 X n 和
X 的分布函数 .若对 F( x ) 的每个连续点 x 有
lim Fn ( x) = F( x ) ,
n→ ∞
则称{ X n , n≥ 1 } 依分布函数收敛于 X( Fn ( x ) 弱收敛到 F( x ) ) .记

d w
为 Xn X , 或者 Fn ( x ) F( x ) .
2
例 4 .4 　 Y n , Zn 的记号同本章定理 3 .1 .令 Z～ N ( 0 , 1 ) , 则
d
Zn Z, 即＂ x∈R , 有
lim P( Zn ≤ x ) = Φ( x ) .
n→ ∞
　　注　设{ Fn ( x) , n≥1 }为分布函数序列 , 若存在单调不减的函数

F( x) , 使得在 F( x)的连续点上有 n→
lim Fn ( x) = F( x) , 则称 Fn ( x) 弱收
∞
w
敛到 F( x) , 记为 Fn ( x ) F( x ) .注意 , 尽管 { Fn ( x) , n≥ 1 } 是分
布函数列 , F( x) 却未必是分布函数 .故“ Fn ( x ) 弱收敛到分布函数
F( x )”和“ Fn ( x ) 弱收敛到函数 F( x) ”两句话有很大差别 .例如 : 若
x < n, Fn ( x ) = 0 ; 若 x≥ n, Fn ( x) = 1; F( x ) = 0 , x∈ ( - ∞ , + ∞ ) .
则li m Fn ( x ) = F( x) , 但 F( x) 不是分布函数 .
n→ ∞
以上 4 种收敛性是常见的收敛定义 , 为了讨论 4 种收敛性的

关系 , 先引进一些记号 , 再给出博雷尔－坎泰利引理 .
∞ ∞
记 ( An , i .o .) = nlim An = n→
lim sup An = n∩ ∪ A k , 即 ( An , i .o .) =
→∞ ∞ = 1 k= n
∞ ∞
{ω:ω至少属于无穷多个 An } .又记 n→
lim An = n→
lim inf An = n∪ ∩ Ak =
∞ ∞ = 1k= n
{ω:ω至多不属于有限个 A n } .
引理 4 .1( 博雷尔－坎泰利引理 )
∞
(1 ) 若随机事件序列 { An , n ≥ 1 } 满足 ∑ P( A
n= 1
n ) < ∞ ,则
∞ ∞
P n∩ ∪ Ak = 0 .
= 1 k= n
(2 ) 若{ An , n≥1}是相互独立的随机事件序列 , 则 ∑ P( An ) =
n= 1
∞ ∞
∞ 成立的充要条件为 P n∩ ∪ Ak = 1 .
= 1 k= n
∞ ∞ ∞ ∞
证明　 (1) 0 ≤ P n∩ ∪ Ak = P n→
lim ∪ Ak = n→
lim P k∪ Ak ≤
= 1 k= n ∞ k= n ∞ = n
li m∑ P ( Ak ) = 0 . 其中第二个等号是利用了概率的连续性 , 最后
n→ ∞ k = n
一个等号是因为 ∑ P( An ) < ∞ .
n= 1
m+ n
(2 ) 先证明必要性 . 由 { An , n ≥ 1} 独立 , 有 P k∩ Ak =
= n
m+ n ∞
∞
∏ P( A
k= n
k ) , 故 P k∩
= n
Ak = ∏P( A
k= n
k ) . 又当 0 ≤ x < 1 时,
ln( 1 - x) ≤ - x; 故
∞ ∞ ∞
ln∏ 1 - P( Ak ) = ∑ l n(1 - P( Ak ) ) ≤ - ∑ P( A k ) = - ∞,
k= n k= n k= n
由此得
∞
P k∩ Ak = 0 , ＂ n ≥ 1;
= n
所以
∞
P k∪ Ak = 1; ＂ n ≥ 1 ,
= n
故
∞ ∞
P n∩ ∪ Ak = 1 .
= 1 k= n
∞
∞ ∞
再证明充分性 . 若 P ∩ ∪ A k = 1, 假设 ∑ P( An ) < ∞ ,则由 (1)知

n= 1 k= n n= 1
∞
∞ ∞
P n∩ ∪ Ak = 0 .矛盾 ! 又 P( An ) ≥0 ,故只能 ∑ P( An ) = ∞ .
= 1k= n
n= 1
定义 4 .5 　称随机变量序列 { X n , n≥ 1 }以概率 1 , 或以概率 ,
或以 Lp 是基本列 ( 柯西列 ) , 若 P ω: n→
lim ( Xn - Xm ) = 0 = 1, 或
∞
m→ ∞
＂ ε> 0 , n→
lim P ω: | X n - X m | <ε = 1 , 若 n→
lim E| X n - X m | p = 0 .
∞ ∞
m→∞ m→ ∞
以下给出一个随机变量序列几乎处处收敛的充要条件 .讨论

这个问题的关键在于事件的表示与转化 , 为此给出下面的引理 .
a .s .
引理　设li m Xn = X , 则
n→ ∞
∞ ∞ ∞
1
ω: nli→m X n (ω) = X(ω) = m∩ ∪ ∩ ω: | X k - X | < ,
∞ = 1 n= 1 k= n m
( 4 .1)
∞ ∞ ∞
ω: nli→m X n (ω) ≠ X(ω) = m∪ ∩ ∪ ω: | X k - X | ≥ 1 .

∞ = 1 n= 1 k= n m
( 4 .2)
　　证明　记 B = ω: n→
lim Xn (ω) = X(ω) , 则珚
B = ω: nlim Xn (ω) ≠
∞ →∞
X(ω) .故有＂ ω∈ B, ＂ m≥1 , ｖ n≥1 , ＂ k≥ n, 有
1
ω∈ ω: | Xk - X | < ＂ m ≥ 1, ｖ n ≥ 1,
m
∞
1
ω∈∩ ω: | X k - X | < ＂ m ≥ 1,
k= n m
∞ ∞
1
ω∈ n∪ ∩ ω: | X k - X | <
= 1 k= n m
∞ ∞ ∞
1
ω∈ m∩ ∪ ∩ ω: | Xk - X | < ,
= 1 n= 1 k= n m
故
∞ ∞ ∞
1
B = ∩ ∪ ∩ ω: | Xk - X | < .
m= 1 n= 1 k= n m
由第 1 章 1 .1 节的德・摩根事件运算规律得
∞ ∞ ∞
1
珚
B = m∪ ∩ ∪ ω: | Xk - X | ≥ .
= 1 n= 1 k= n m
a .s .
　　定理 4 .1 　 ( 1) nlim X = X 的充要条件是 : ＂ε> 0 ,

n
→∞
∞
lim P ω: k∪ { | X k - X | ≥ ε} = 0; ( 4 .3)
n→ ∞ = n
　　 (2 ) 随机变量序列{ Xn , n≥1 }以概率 1 为基本列的充要条件

是 : ＂ ε> 0 ,
lim P ω: sk≥upn | Xk - X l | ≥ε = 0 , ( 4 .4)

n→ ∞
l≥ n
或
lim P ω: sup | Xn+ k - Xn | ≥ ε = 0 .
n→ ∞ k≥ 1
　　证明　 (1 ) 记
∞ ∞
1 1 1 1
Ak = ω: | X k - X | ≥ , A = n∩ ∪ Ak ,
m m m = 1 k= n m
由
∞
1 1
P( B) = 1 P(珚 B) = P m∪ A = 0 P A = 0,
= 1 m m
＂ m≥ 1 .
∞
∞
1 1
因 P m∪
= 1
A
m
≤ ∑m= 1
P A
m
.
P( A(ε) ) = 0 , ＂ ε> 0
∞ ∞ ∞
P n∩ ∪ A k (ε) = nli→m P k∪ A k (ε) = 0 , ＂ ε> 0

= 1k= n ∞ = n
( 概率的连续性 ) ∞
lim P ω: k∪ { | Xk - X | ≥ε} = 0 .
n→ ∞ = n
∞ ∞
(2 ) 令 Dk, l (ε) = {ω: | X k + l - Xl | ≥ε} , D(ε) = ∩ ∪ Dk, l (ε) .

n= 1 k= n
l= n
由下列事件等价 D = ω: k→
lim ( Xk - X l ) ≠ 0 = ε>∪0 D (ε) =
∞
l→ ∞
∞
∪ ∩ ω: sup | Xk + l - X l | ≥ε 得
ε> 0 n = 1
k≥ n
l≥n
P( D) = 0 ∪0 D(ε)
P ε> = 0 P( D(ε) ) = 0( ＂ ε> 0)
∞ ∞
P n∩ ∪ {ω: | X k - X l | ≥ ε} =
= 1 k= n
l= n
∞
lim P k∪ {ω: | X k + l - X l | ≥ ε} = 0
n→ ∞ =1
l= n
lim P ω: sup | Xk - X l | ≥ ε = 0 , 　＂ ε> 0 .

n→ ∞ k≥ n
l≥ n
a .e .
　　推论 1 　 X n X( n→∞ ) 的充分条件是
∞
＂ ε> 0 , ∑ P {ω: | Xk - X | ≥ ε} → 0 , 　 n → ∞ .
k= n
∞
∞
　　证明　因 P ∪ (ω: | X k - X | ≥ε) ≤ ∑ P{ω: | Xk - X | ≥

k= n k= n
ε} , 立得结论 .
注　显然 , ( 4 .3) 式等价于li m P(ω: sup | Xk - X | ≥ε) = 0 .
n→ ∞ k≥ 1
∞
推论 2 　设 εn > 0 ,εn →0 ( n→ ∞ ) , 若 ∑ P{ω:

n=1
| Xn - X | ≥
εn } < ∞ , 则
a .e .
Xn X.
∞ ∞
　　证明　令 An = {ω: | Xn - X | ≥εn } , 则 P n∩ ∪ Ak = 0 , 这意味

= 1 k= n
着几乎对所有的 ω∈Ω, 存在 N = N(ω) , 对＂ n≥ N(ω) , | Xn - X | ≤

εn , 但εn →0 , 故
∞ ∞
P ω: lim Xn ≠ X = P n∩ ∪ Ak = 0 .
n→ ∞ =1k= n
a .e .
得 Xn X .
以下定理将给出几种收敛性的关系 .
定理 4 .2
a .e P
(1 ) X n X Xn X;
Lp P
(2 ) X n X Xn X;
Lp d
(3 ) X n X Xn X .
证明　 (1 ) 由定理 4 .1 的 ( 1) 及定义而得 .( 2) 由切比雪夫不等
E| X n - X | p Lp
式知＂ ε≥ 0 , P{ω: | X n - X | ≥ε} ≤ p , 由 Xn X, 即
ε
p
E| Xn - X | → 0( n→∞ ) , 故＂ ε≥ 0 , P {ω: | X n - X | ≥ε} → 0 ( n→
P
∞ ) , 即 Xn X .
(3 ) 记 F( x ) = P( X≤ x ) , Fn ( x) = P( Xn ≤ x ) , ＂ x, y∈R ,
( X ≤ y) = ( X n ≤ x, X ≤ y) ∪ ( X n > x, X ≤ y)
( Xn ≤ x ) ∪ ( X n > x, X ≤ y)
F( y ) ≤ Fn ( x) + P( | Xn - X | ≥ x - y ) .
P
当 Xn X , 可得: ＂ y < x, P{ω: Xn > x, X≤ y}≤ P{ω: | Xn - X | ≥
x - y} →0( n→∞ ) , 所以 F( y ) ≤lim Fn ( x ) .
n→ ∞
类似地有
＂ x < z , ( Xn ≤ x) = ( Xn ≤ x , X ≤ z) ∪ ( Xn ≤ x , X > z)
( X ≤ z) ∪ ( Xn ≤ x, X > z) ,
得
Fn ( x) ≤ F( z) + P( | X n - X | ≥ z - x) .
又 P{ω: X n ≤ x, X > z} ≤ P{ω: | X - X n | ≥ z - x} → 0 ( n→ ∞ ) , 故
li m Fn ( x ) ≤ F ( z ) . 对 y < x < z 有 F ( y ) ≤ lim Fn ( x ) ≤
n→ ∞ n→ ∞
li m Fn ( x ) ≤ F( z) , 如 x 是 F( x) 的连续点 , 令 y↑ x, z↓ x, 得
n→ ∞
F( x ) = nlim Fn ( x ) .
→∞
定理 4 .2 的 (1 ) ～ ( 3) 的逆不真 , 以下举例说明 .
P a .e .
例 4 .5 　 X n X ≠ > Xn X.
令 ( Ω, F, P) = ( [0 , 1 ] , B[0 , 1 ] , P) 为[ 0 , 1] 上博雷尔概率测
度 ( 见第 1 章例 2 .16) , 令 :
X1 = I ( 0 , 1 ] , 　　　 X2 = I( 0 , 1/ 2] , 　　　 X3 = I ( 1/ 2 , 1 ] ,
X4 = I ( 0 , 1/ 3 ] , X5 = I( 1/ 3 , 2/ 3 ] , X6 = I ( 2/ 3 , 1 ] ,
X7 = I ( 0 , 1/ 4 ] , … X1 0 = I( 3/ 4,1 ]
　　…
对任意正整数 n≥ 1 , 总存在两正整数 i, k ( 1 ≤ i≤ k, k≥ 1) 使 n =
( k - 1) k/ 2 + i .故对＂ n≥ 1 , 有 X n = X ( k - 1 ) k/ 2+ i = I( ( i - 1/ k, i/ k) ] (1≤
2
i≤ k, k≥ 1 ) , 则有 E X n = 1/ k, E X n = 1/ k, n = ( k - 1 ) k/ 2 + i( 1 ≤
P
i≤ k, k≥ 1) . ＂ ε> 0 , P( | Xn (ω) | ≥ε) → 0( n→∞ ) , 故 X n 0 .
k
但是对＂ ω∈ [ 0 , 1 ] , ＂ k≥ 1 , 因 ∑I
i=1
( ( i - 1 )/ k, i/ k] = I( 0 , 1 ] , 故对
＂ ω∈ [0 , 1 ]及＂ k≥ 1 存在 i k ( 1≤ ik ≤ k) , 有 I ( ( i k - 1 )/ k, i / k]
k
= 1 ,即存
在 n = ( k - 1) k/ 2 + i k , 使 X n (ω) = 1 , 而对其余的 i≠ ik ( 1 ≤ i≤ k) ,
有 Xn (ω) = 0 .由此可知 , 对＂ ω∈ [ 0 , 1 ] , 序列 { Xn (ω) , n≥1 } 中有
无穷多个 X n (ω) = 1 及有无穷多个 X n (ω) = 0 .于是 X n (ω) 对每一
个 ω∈[ 0 , 1] 都不收敛 .
a .e . P Lp
例 4 .6 　 X n X Xn X ≠ > Xn X .
设 ( Ω, F, P) = ( [0 , 1 ] , B[0 , 1 ] , P) 为[ 0 , 1] 上博雷尔概率测
度,令
n 1
e , 0 ≤ ω≤
n
X n (ω) =
1
0, < ω≤ 1 .
n
1
易见 P ω: n→
lim Xn ≠ 0 = 0 . ＂ ε> 0 , P(ω: | Xn (ω) | <ε) = 1 - →1
∞ n
np
a .e . P e p
( n→∞ ) , 则有 Xn 0 , Xn 0 .但 E | X n | = → ∞ , 即 Xn 不
n
以 L p 收敛到 0 .
Lp a .e .
例 4 .7 　 X n X ≠ > Xn X.
1
设随机变量序列{ Xn , n≥1} 满足 P( Xn = 1) = , P( Xn = 0 ) =
n
n-1 Lp
, 且{ X n , n≥ 1 } 独立 .易证明对每一个 p > 0 , X n 0 ( n→
n
∞ ∞
1
∞ ) .但 ∑ P | X n - 0 | > = ∑ 1 = ∞ , 故由博雷尔－坎泰
n= 1 2 n= 1 n
a .e .
利引理 Xn 不以概率 1 收敛到 0 , 即 n→

lim Xn ≠ 0 .
∞
P a .e .
尽管一般由 Xn X 不能推出 X n X, 但有如下的结论 .
定理 4 .3 　设随机变量序列{ X n , n≥1} 和随机变量序列 X 有
P
Xn X , 则存在一子序列 { X n k , k≥ 1}使
a .e .
X nk X, 　 k → ∞
P
　　证明　由 Xn X 的定义可知 , 若令 n1 = 1 , 则对每一个 k∈
N \ {0 } , ｖ nk , 且 nk > nk - 1 使
1 1
P ω: | X n k - X | ≥ < k ,
2k 2
l nε 1
　　所以＂ 0 <ε< 1 , 一切 k≥ N = - k ≤ε , 与 N≥ N0 有
ln2 2
∞ ∞
∑ P {ω: | X n k - X | ≥ ε}≤ ∑P ω: | Xn k - X | ≥ 1k
k= N k= N 2
∞
1 1
< ∑2
k= N
k =
2 N +1 ,
从而
∞ N
0
∑ P{ω:
k= 1
| Xn k - X | ≥ ε} = ∑ P{ω:
k= 1
| Xn k - X | ≥ ε} +
∞
1
∑ P{ω:
k= N
| Xn k - X | ≥ ε} ≤ N0 +
2 N +1
0
< ∞ .
0
lnε
最后一个不等号是因为, 对于取定的ε> 0, N0 = - < ∞ .故＂ε> 0,
ln2
∞
∑
k= 1
P{ω: | X n k - X | ≥ε} < ∞ .由推论 1 知定理成立 .
＊
5 .5 　强大数定律
本节讨论关于独立随机变量序列的前 n 项算术平均以概率 1

收敛到它们的数学期望 ( 理论平均 ) 的平均的一些基本结果 .通常
5 .5 强大数定律＊　 213
称为强大数定律 .
1 　博雷尔强大数定律
定理 5 .1 　设在伯努利独立重复试验序列中 , 事件 A 出现的
概率为 P ( A) = p , 以 μn ( A) 表示前 n 次试验中 A 出现的次数 .则
μ( A)
P ω: n→lim = p = 1 . ( 5 .1)
∞ n
　　证明　 (1 ) 成立的充要条件是
∞ ∞
μn ( A)
＂ ε> 0 , P ω: ∩ ∪ - p ≥ε = 0 . ( 5 .2)
l = 1 n= l n
μn ( A)
若记 An (ε) = ω: - p ≥ε , (5 .2 ) 式为
n
∞ ∞
＂ ε> 0 , P n∩ ∪ A k (ε) = 0 ( 5 .3)

= 1 k= n
故由博雷尔－坎泰利引理, 只需证 ∑ P{ An (ε) } < ∞ .为此记 Xn =

n= 1
n
μn ( A)
I A k , A k 表示第 k 次试验出 A 的事件 , 则 - p = 1 ∑ ( Xk -
n n k= 1
p) .由切比雪夫不等式的推广 ( 马尔可夫不等式 ) .有
4
1 μn ( A)
P{ An (ε) } ≤ 4 E - p .
ε n
又
n
μn ( A) 4
1 4
E - p = 4 E ∑ ( Xk - p)
n n k= 1
n n
1
= 4 E
n ∑( X
k= 1
k - p) ∑( X
l= 1
l - p) .
n n
∑( X
i =1
i - p) ∑( X
j= 1
j - p)
n
1
∑ E( X ∑∑ E { ( X
4 2 2
= 4 i - p) + i - p) ( Xk - p) } ,
n i= 1 i≠ k
4
在和式中注意到 E( X i - p) = 0 , 因而上式中只有 E( X i - p) 及
2 2 4
E{ ( X i - p) ( Xk - p) } ( k≠ i) 不为 0 .而 E ( Xi - p ) 有 n 项 ,
E{ ( X i - p) 2 ( Xk - p) 2 } .有 C24 C2n = 3 n( n - 1 ) 项 .又 E( X i - p) 4 =
3 3 2 2 2 2
pq( p + q ) ,且 E{( Xi - p) ( Xk - p) } = p q ( i≠ k) , 其中 q= 1 - p .故
μn ( A) 4
pq 3 3
E - p = 4 [ npq( p + q ) + 3 pqn( n - 1 ) ]
n n
≤ p3q [ p3 + q3 + 3 p q( n - 1 ) ]
n
pq 3 3
< 3 [ n( p + q ) + 3 n p q]
n
≤ 1 2 [ p3 + q3 + 3 p q( p + q) ] = 1 2 .
4n 4n
1
最后一个不等号是因为 pq≤ ,则
4
∞ ∞
P( An (ε) ) ≤ 14 12 ∑ P( An (ε) ) ≤ 14 ∑ 12 < ∞

4ε n n=1 4ε n = 1 n
∞ ∞
P n∩ ∪ A k (ε) = 0,
= 1 k= n
得
μn ( A)
P ω: n→
lim = p = 1 .
∞ n
　　例 5 .1( 强大数定律应用之一 ) 　经验分布以概率 1 收敛到理
论分布 X～ F( x) , { Xk , 1≤ k≤ n}独立同分布及珟
Fn ( x ) 同例 1 .1 ,
应用定理 5 .1 , 对＂ x∈ R , 有
P{ n→
lim 珟
Fn ( x ) = F( x) } = 1 .
∞
　　注 ( 马尔可夫不等式 ) 　对随机变量 X , 若 E| X - E X | r 存在
( r > 0 常数 ) , 则
r
＂ ε> 0 , P{ω: | X - E X | ≥ ε} ≤ E | X -r E X | , 　 r > 0 .

ε
可仿照切比雪夫不等式的证明加以证明 , 留给读者 .
5 .5 强大数定律＊　 215
2 　坎泰利强大数定律
定理 5 .2 　设{ Y n , n≥ 1}为独立的随机变量序列 , 且有有限的

四阶矩 , 即存在常数 C, 使
E | Y n - EY n | 4 < C, 　＂ n ≥ 1 .
n
1
n∑
令　 Xn = Yk , 则
k= 1
P{ω: lim ( Xn - E X n ) = 0} = 1 . ( 5 .4)

n→ ∞
　　证明　不失一般性 , 令 E Yn = 0; 由博雷尔－坎泰利引理知 , 为
证 (5 .4 ) 式成立只需证明
∞ n n
1
＂ ε> 0 , ∑ P ω: ・ ∑Y k - ∑ EY k ≥ε < ∞ .
n= 1 n k=1 k=1
∞ n 4
1
∑ n∑
为应用切比雪夫不等式 , 只需证明 E Yk < ∞ .
n=1 k= 1
注意到 E Yi = 0 , 所以
n n n
4
∑Y ∑ EY + 6∑ E Yi E Yj
4 2 2
E k = i
k=1 i =1 i, j = 1
i≠ j
n
≤ nC + 6∑
4 4
E Yi E Y j
i, j = 1
j≠ i
6 n( n - 1 )
≤ nC + C < 3 n2 C .
2
故
n ∞ n 4 ∞
1 4 3C 1 1
∑Y ∑ n∑
E k ≤ 2 E Yk ≤ 3 C∑ < ∞ .
n4 k= 1 n n= 1 k=1 n=1 n2
3 　柯尔莫哥洛夫强大数定律
(1 ) 柯尔莫哥洛夫不等式
定理 5 .3 　设{ Y n , n≥ 1} 为独立的随机变量序列 , D Yn = σn <
∞ , 令 X n = 1 ∑ Y k , 则对＂ ε> 0 ,
n k=1
DX n
P{ω: 1max | X k - E X k | ≥ ε} ≤ 2 , ( 5 .5)
≤ k≤ n ε
这是切比雪夫不等式的推广 , 是更精细的不等式 , 它是研究收敛性
的重要工具 .
证明　略 .有兴趣的读者可作为练习加以证明 .
(2 ) 柯尔莫哥洛夫强大数定律
∞
DYn
定理 5 .4 　设{ Yn , n≥1 }为独立的随机变量序列, 且 ∑ 2 <
n= 1 n
∞ ,则
n
1・
n ∑
P ω: nli→m
∞
( Y k - EY k ) = 0 = 1 . ( 5 .6)
k=1
　　证明　利用上节定理 4 .1 及定理 5 .3 可得 (5 .6 ) 式 .
练　习　题
5 .1 　将 n 个号码 1 至 n 的球随机地放入 n 个号码为 1 至 n
的盒中 , 假设每盒只能放一球 , 记 Xn 为球与盒子号码相同的盒子
P
数 .试证明 : ( X n - E Xn )/ n 0( n→∞ )
5 .2 　设{εn , n≥ 1} 为独立同分布随机变量 , Eε1 = 0 , Dε1 =σ2 <
∞ , 而{ Xn , n≥0} 满足 X0 = 0 , X n + αXn - 1 = εn ( 其中 α常数 |α| <
n
P
1) , 试求 : ∑
k= 1
X k/ n ?( n → ∞ ) .
2
5 .3 　设{ Yn , n≥1 }独立同分布 , E Y1 = μ, D Y1 =σ < ∞ , 证明 :
n
P
(1 ) Y n = ∑ Y k/ n
k= 1
μ( n → ∞ ) ;
n
P
∑ ( Yk - Y n ) / n
2 2 2
(2 ) S =n σ ( n → ∞) .
k= 1
练习题　 217
5 .4 　设{ Xk , 1≤ k≤ n}为随机变量序列 . ＂ ε> 0 , 试证明 :

P( | X1 + X2 | > ε) ≤ P( | X1 | > ε
/ 2) + P( | X2 | > ε
/ 2);
n n
P ∑X k= 1
k >ε≤ ∑ P( |
k= 1
Xk | > ε
/ n) .
　　 5 .5 　设随机变量序列 { X n , n ≥ 1 } 及 { Y n , n ≥ 1 } , X, Y ,
P P
Xn X , Yn Y .证明 :
P P
(1 ) X n ± Y n X ± Y ; ( 2) | X n | | X| ;
P
(3 ) X n ・ Y n X・Y
d P
5 .6 　若 X n C( 常数 ) , 证明 : X n C.
∞
a .e .
5 .7 　设对 p > 0 , ∑
n=1
E | X n | p < + ∞ , 证明 : X n 0 .
P P
5 .8 　设随机变量{ Xn , n≥1 } , X n X , Xn Y .证明 :
P{ω: X = Y} = 1 .
φ( t) - 1
　　 5 .9 　设 φ( t) 是特征函数 , 证明 g( t) = e 也是特征函数 .
5 .10 　将 n 个不可辨的球随机放入 m 个编号从 1 至 m 的盒
中 ( 每盒放的球数不限 , 参看第 4 章例 1 .11 ) .设某个指定的第 i 盒
球数为 Xi , 记 P( X i = k) = qik .
n
(1 ) 试求 qik = ?; ( 2 ) 求证 : 当 n→ ∞ , m→ ∞ , →λ时 , qik →
m
λk/ (1 +λ) k + 1 .
( 提示 : 利用斯特林 ( Stirling ) 公式 n ! = 2πnnn e - n (1 + o(1 ) ) .)
5 .11 　设 Xn ～ B( n, p) .证明 :
Xn - np
＂ x ∈ R , nlim P ≤ x = Φ( x) .
→∞
np ( 1 - p)
Xn - n
　　 5 .12 　设 Xn ～ Po ( n) , 证明 : ＂ x ∈ R , n→
lim P ≤x =
∞ n
Φ( x) .
5 .13 　设 X1 , … , X50 独立同参数 (λ= 0 .02) 的泊松分布, 记 Y =

50
∑X
1
i , 试利用中心极限定理近似计算 P( Y≥3 ) .
5 .14 　计算机在进行加法时 , 对每个加数取整 , 设所有的取整

误差是相互独立且同分布于 U ( - 0 .5 , 0 .5 ) .(1 ) 若将 1500 个数相
加 , 问误差总和的绝对值小于 15 的概率是多少 ? (2 ) 几个数加在
一起可使得误差总和的绝对值小于 10 的概率为 0 .90 .
5 .15 　设有 30 个同类型的电子器件 D1 , D2 , … , D30 , 它们的
使用情况如下 : D1 损坏 , D2 立即使用 , D2 损坏 , D3 立即使用 , 等
等 .设它们的寿命是独立同参数 ( a = 1 小时 ) 的指数分布 , 令 T 为
30 个器件的总寿命 .问 T 超过 350 小时的概率是多少 ?
5 .16 　某计算机实验室有 100 个终端 , 每个终端有 20 % 的时
间被占用 , 假设各段是否占用相互独立 , 试求至少有一半被占用的
概率 .
5 .17 　设{ Fn ( x ) } 为正态分布函数列 , 收敛于分布函数 F( x ) .
证明 F( x) 也是正态分布函数 .
5 .18 　设分布函数列 { Fn ( x ) } 弱收敛到连续的分布函数
F( x ) .试证此收敛对于 x∈R 是一致的 .
5 .19 　设{ Yn , n≥1 }是独立同分布随机变量序列 . P( Yn = 1 ) =
n
P( Y n = 0 ) = 1/ 2 , 记 Xn = ∑Y /
k= 1
k 2 k .试证 Xn 的分布函数收敛于
[0 , 1 ]上的均匀分布函数 .
5 .20 　设{ Yn , n≥1}是独立同分布 , EYn = μ, DYn =σ2 , 记 Yn =
n
∑Y /
k= 1
k n , 求 n 至少应取多大 , 才能使 P ( | Y n - μ| < 0 .05σ) ≥
0 .95 .
5 .21 　设{ Yn , n ≥ 1} 独立同分布 .P( Yn = 2k - 2ln k ) = 2- k ( k = 1 ,
n
1 P
n∑
2 , … ) , 证明 : n→
lim ( Y k - EY k ) 0 .
∞
k=1
练习题　 219
5 .22 　设 ( [ 0 , 1 ] , B[ 0 , 1] , P) 为 [ 0 , 1 ] 上的博雷尔概率空间
( 参见第 1 章例 2 .17 ) .令 An = [ k/ 2 m , k + 1/ 2 m ] ( m = 0 , 1 , 2 , … ,
k = 0 , 1 , … , 2 m - 1 , n = k + 2 m ) , X n = I A n ( n≥ 1) .
P a .s .
　　 (1 ) 证明 : Xn 0 ( n→ ∞ ) ; ( 2 ) 证明 : nlim Xn ≠ 0; ( 3 ) 选择
→∞
a .s .
一子序列{ X n j , j≥ 1}使 X n j 0 ( j→∞ ) .
2
5 .23 　设{ X n , n≥ 1}独立同分布 , Xn ～ N (0 , 1 ) .试证明 :
n n
∑X ∑X 渐近正态分布 N ( 0 , 12 ) .
2
(1 ) U n = n k k
k= 1 k= 1
n n
1
∑X ∑X
2 2 2
(2 ) Un = k k 渐近正态分布 N (0 , 1 ) .
k= 1 k= 1
P
5 .24 　设{ X n , n≥1 }满足 X n 0 ( n→∞ ) , 且 P( 0≤ Xn + 1 ≤
a .s .
Xn ) = 1 ( n≥1 ) .证明 : Xn 0 ( n→∞ ) .
P P
5 .25 　设 Xn X , Yn Y ( n→ ∞ ) , 且 P ( X n ≤ Yn ) =
1( ＂ n≥1) .证明 : P( X≤ Y ) = 1 .
P
5 .26 　设 Xn 0( n→∞ ) , P( | Xn | ≤Y ) = 1 , ＂ n≥1 , 且 E Yr <
Lr
∞ ( r > 0 ) .证明 : Xn X ( n→∞ ) .
5 .27 　设 (Ω, F , P) 为一概率空间 , 其上两随机变量 X , Y , 若
有 P( X≠ Y ) = 0 , 称 X 与 Y 是等价的 .记 H 为所有随机变量及其
等价类的集合 , 且对 X, Y∈ H 定义如下 d 函数 , d( X, Y ) = E( | X -
Y |/ (1 + | X - Y | ) ) .证明 :
(1 ) d 是 H 上的距离 , 记为 ( H , d) ;
P ( H , d)
(2 ) X n X Xn X( n→∞ ) ;
(3 ) ( H, d) 是完备度量空间 .
m .s . m .s .
5 .28 　设 Xn X , Yn Y ( n→∞ ) .证明 :
lim E( X n Y n ) = E( X Y ) .
n→ ∞
　　 5 .29 　设{ X n , n≥ 1}满足 P( Xn ≤ X n + 1 ) = 1( n≥1 ) , 且对任意

a .s .
m > 0 , 有 n→
lim P( X n > m) = 1 .证明 : n→
lim Xn +∞ .
∞ ∞
5 .30 　设一随机变量序列{ Y n , n≥1 } 的分布律如下 : P( Y n =

0) = 1 - 1/ n, P( Y n = 1 ) = 1/ n( n≥ 1 ) , 记 τ1 = min { n: n≥ 1 , Y n =
P
1} ,τn + 1 = mi n { k: k ≥τn , Y k = 1 } .证明 : ( 1 ) Yn 0 ( n→ ∞ ) ;
a .s .
(2 )τn ( n≥1) 以概率 1 有定义 , 且 τn + ∞ ( n→∞ ) .
5 .31 　设{ Xi , 1 ≤ i ≤ n} 独立同分布 , Xn ～ U(0 , 1) , 对＂ 0 <
n
1
t < 1, 记 N n ( t) = ∑ I( X i≤ t) , Fn ( t) =
i=1 n
N n ( t) ,αn ( t) = n( Fn ( t) -
t) .证明 : (1 ) ＂ ε> 0 , n→
lim P( | Fn ( t) - t | < ε) = 1; (2 ) ＂ x ∈ R ,
∞
n ( s) ≤ x( s( 1 - s) ) ) = Φ( x ) .
1/ 2
0 < s < 1 , lim P(α
n→ ∞
5 .32 　设 { X k , 1 ≤ k ≤ n} 独立 , 且 Xk ～ Ex(λ) ,λ= 1 > 0

θ
- λt
即 X k 的分布函数为 F ( t) = (1 - e ) I( t≥ 0 ) , X ( 1 ) , X ( 2 ) , … , X( n ) 为
n
其顺序统计量 , ＂ t ≥ 0 , N n ( t) = ∑I ( X
( k)
≤ t) ,^
Fn ( t) = N n ( t)/ n,
k=1
k
^
θn, k = ∑X
i= 1
( i) + ( n - k) X( k) / k(1 ≤ k ≤ n) .证明 :
(1 ) ＂ ε> 0 , 有 n→
lim P( | ^
Fn ( t) - F( x) | < ε) = 1 ;
∞
n
1
n∑
(2 ) ＂ ε> 0 , 有 n→
lim P X ( i ) - θ < ε = 1;
∞ i= 1
(3 ) ＂ x ∈ R , lim P ^n, n - θ)/ θ≤ x = Φ( x) , 其中

n(θ
n→ ∞
Φ( x) 为标准正态分布函数 .( 提示 : 参见 4 .28 .)
5 .33 　设随机变量序列{ Y n , n ≥ 1 } 及{τn , n ≥ 1 } 相互独立 ,
n
P P
且满足 : Y n = ∑ Y k/ n
k= 1
0 ,τn + ∞ ( n → ∞ ) .证明 :
练习题　 221
τ
n
1 P
τn ∑
Yk 0( n → ∞ ) .
k=1
　　 5 .34 　设{ Y n , n ≥ 1} 独立同分布 , Y n ～ U[0 , 1 ] , f ( x ) 是上

周期为 1 的连续函数 .证明对＂ x ∈ , 有
n 1
1 P
n∑k=1
f ( x + Yk ) ∫ f ( u) d u( n → ∞ ) .
0
　　 5 .35 　设 f ( x ) 为[ 0 , 1] 上连续函数 .
x1 + … + xn
1 1
(1 ) 试计算下列极限 n→
lim∞ ∫…∫ f 0 0 n
d x1 … d xn ;
n重
1 1
1
∫∫
n
(2 ) 证明 : nli→m … f( x1 … xn ) d x1 … d xn = f .
∞ 0 0 e
n重
　　 5 .36 　求下列随机变量的特征函数 :
- | x |/ 2
(1 ) X1 为双边指数分布 , 其密度函数为 f1 ( x) = e 　
( x∈ );
2 2
(2 ) X2 为柯西分布 , 其密度函数为 f2 ( x ) = a/ π( a + x )
( a > 0) ;
1 α α- 1 - βx
(3) X3 为Γ－分布, 其密度函数为 f3 ( x) = β x e I ( x≥ 0 )
Γ(α)
(α> 0 ,β> 0) ( 见第 2 章 2 .3 节 ) .
k
5 .37 　设随机变量 X 的特征函数为 φ( t) , 且 mk = E X , Mk =
k ( n) ( n) n
E | X | .证明 : 若 Mn < ∞ , 则 φ ( t) 存在且 mn = φ (0 )/ i .
5 .38 　 X , mk , Mk 同上题 , 设 X 的分布函数为 F ( x) , 证明若
1 M1/n
＂ n ≥ 1 , Mn 存在 , 且lim = λ< ∞ , 则 F( x ) 由它的各阶
n
sup
n→ ∞ n
矩{ mn , n ≥ 1} 唯一确定 .( 参见参考文献[ 15 ] .)
第6章
泊松信号流
6 .1 　随机过程的有关概念
在第 2 章～第 4 章中 , 我们研究了一个随机变量和 n 维随机

向量有关的基本概念、理论与方法 .第 5 章的极限理论 , 涉及了相
互独立随机变量序列的极限性态 .但是要描述一个随机动态系统
问题的概率性质 , 必须将上述情形加以推广 , 进而研究无穷多个相
互有关的随机变量族 , 并将它们作为整体加以刻画与研究 .
1 　随机过程的概念
设对一个参数 t∈ T, X ( t, ω) 是一随机变量 , 称随机变量族
X T = { X( t,ω) , t∈ T} 为一随机过程 ( st ochastic proces ses ) , 其中
T R , 称为指标集 .用函数 ( 映射 ) 的观点来描述 X T , X ( t, ω) :
T×Ω→R , 即 X( ・ , ・ ) 是定义在 T×Ω上 , 取值在 R 上的二元单
值函数 .固定 t∈ T, X( t, ・ ) 是随机变量 ; 对固定的 ω∈Ω, X ( t, ω)
是参数 t 的一般函数 , 称它是随机过程的一条 ( 样本 ) 轨道 , 或称为
一个实现 .记号 X( t,ω) 有时记为 X t (ω) , 简记为 X( t) 或 X t .
通常参数集 T R 有 3 种 : ( 1 ) T = N = { 0 , 1 , 2 , … } ; (2 ) T =
Z = { 0 , ±1 , ±2 , …} ; (3 ) T = [ a, b] R 或 T= R .
当 T 为可列集时 , 称 X T 为随机序列 .X T 的取值全体之集 , 称
n n
为状态空间 , 记作 S . S 可以是 N 、Z 、R 、R 或 C 或一般抽象
空间 .
6 .1 随机过程的有关概念　 223
2 　几个例子
(1 ) 质点在直线整数点无限制的随机游动 ( 简单随机游动 )
设一质点在开始 0 时刻在 i( 整数 ) 位置 , 以后每隔单位时间分
别以 p 及 q = 1 - p 向正 ( 右 ) 或负 ( 左 ) 方向随机游动一单位 , 且各
次游动相互独立 , 如此无穷多次重复游动下去 , 称为一随机试验 .
记 Xn 为质点在 n 时刻的位置 , 固定 n, Xn 是随机变量 .对不同的
n≥0 , { X n , n≥0 }是一随机序列 .若记 Sn ( 1) 为 n 时刻之后 , 质点到
达 1 位置的次数 ; 对不同的 n, { Sn ( 1) , n≥1} 是一随机过程 .
如果我们要考察 S1 ( 1 ) , S2 ( 1 ) , … 的概率特性 , 还要考察
{ Sn ( 1) , n≥1 }与{ Xn , n≥0} 的关系 , 这时只限在单个的 Xn 或单个
的 S n (1 ) 考虑是不够的 , 需要将 { X n , n≥0 }与{ Sn (1 ) , n≥1 }作为整
体来研究 .
作为练习 , 对给定的一次试验 , 试画出 n－X n 的图形 .
(2 ) 考虑某“ 服务站”在[ 0 , t]上到达的“ 顾客”数 , 记为 N ( t) .
固定 t, N ( t) 是一随机变量 .给定 0 < s < t, N ( s) , N ( t) 是两个随
机变量 , 因此{ N ( t) , t≥0 }是一随机过程 .又记 Sn 为第 n 个顾客到
达时刻 , 自然我们要关心 S1 , S2 , … , Sn 的情况以及它们与 N ( t) 的
关系 .这时需要对两个过程{ N ( t) , t≥0 } 与 { Sn , n≥1 } 作为整体来
研究其概率特性 .
(3 ) 考虑最简单的 R－C 电路的输入输出系统 , 该系统有一个
干扰信号电压 , 记为 ξ( t) ; 记 Q ( t ) 为 t 时电路的电容 , 它满足
d Q( t) 1
R + Q( t) =ξ( t) .若 {ξ( t) , t≥ 0 } 是一随机过程 , 则{ Q( t) ,
dt C
t≥0} 也是一个随机过程 .
3 　有限维分布族与柯尔莫哥洛夫定理
对于随机过程 X T = { X( t) , t∈ T}如何刻画它的概率特性呢 ?

224 　第 6 章泊松信号流
def
显然 , 我们要对每个 t∈ T 知道 X T 的分布 ( 函数 ) . F ( t; x ) =
P( X( t) ≤ x) , 称 F( t; x ) 为 X T 的一维分布 .对于＂ t1 , t2 ∈ T, 要刻
画 ( X( t1 ) , X( t2 ) ) 的特性 , 就需要用它们的二维分布 F( t1 , t2 ; x1 ,
x2 ) = P( X1 ( t1 ) ≤ x1 , X2 ( t2 ) ≤ x2 ) .一般地 , 对＂ tk ∈ T ( 1 ≤ k≤
n) , 称
F( t1 , … , tn ; x1 , … , xn ) = P( X ( t1 ) ≤ x1 , … , X( tn ) ≤ xn )
为 X T 的 n 维分布 .用以描述 n 个时刻的概率特性 .其全体
{ F( t1 , … , tn ; x1 , … , xn ) , tk ∈ T, 1 ≤ k ≤ n, n ≥ 1}
称为随机过程 X T 的有限维分布族 .容易看出 , 它具有以下两个
性质 :
(1 ) 对称性
对 (1 , 2 , … , n) 的任一种排列 ( j1 , j2 , … , jn ) , 均有
F( t1 , … , tn ; x1 , … , xn ) = F( tj1 , … , tj n ; x j1 , … , x j n ) .
　　 (2 ) 相容性
对 m< n有
F( t1 , … , tm , … , tn ; x1 , … , xm , ∞ , … , ∞ )
= F( t1 , … , tm ; x1 , … , xm ) .
　　自然要问 , 一个随机过程 X T 的有限维分布族 , 是否描述了该
过程的全部概率特性 ? 下面的定理给出了肯定的回答 .
定理 1 .1(柯尔莫哥洛夫存在性定理 ) 　设分布函数族{ F( t1 , …,
tn ; x1 , … , xn ) , tk ∈ T, 1 ≤ k≤ n, n≥1 } 满足以上对称性和相容性 ,
则必有一随机过程 X T = { X( t) , t∈ T} , 使
{ F( t1 , … , tn ; x1 , … , xn ) , tk ∈ T, 1 ≤ k ≤ n, n ≥ 1}
恰好是 X T 的有限维分布族 , 即
F( t1 , … , tn ; x1 , … , xn ) = P( X( t1 ) ≤ x1 , … , X( tn ) ≤ xn ) .
　　定理证明从略(有兴趣可参见王梓坤著:《随机过程论》.科学出版
社, 1965) .这说明 XT 的有限维分布族包含了 X T 的所有概率信息 .
6 .2 泊松信号流的定义　 225
4 　数字特征
对随机过程 , 自然可以利用前面介绍的数字特征来刻画过程

某些时刻的局部性质 .
2
称 m( t) = E X( t) 为 X T 的均值函数 ; D( t) = E( X ( t) - m( t) )
为其方差函数 ; R( s, t) = cov( X( s) , X( t) )为其协方差函数 ρ
. ( s, t) =
- 1/ 2
cov( X( s) , X( t) ) ( D X( s) D X( t) ) 为其相关函数 .
本教材 6～8 章着重介绍几个最简单、最基本、最具特色、最重
要 , 且在应用中越来越显示其威力 , 理论研究上越来越有魅力的随
机过程 .特别是着力于介绍具有特殊性质的随机过程 , 如何抓住其
特点 , 引出相应的概念与工具 , 从而使刻画与研究它们变得简明、
深入且便于应用是我们讨论的重点 .
本章主要讨论泊松过程及其推广 .
6 .2 　泊松信号流的定义
在历史上泊松分布是于 1837 年由法国数学家泊松在研究法

庭审判定罪概率问题时引入的 , 故得此名 .近数十年来 , 与泊松分
布紧密相关的泊松过程日益显示其重要性 , 成为随机过程中最重
要的过程之一 .其主要原因有下面两点 : 一是许多随机现象可用泊
松过程来描述 , 诸如在给定一时间区间内 , 电话交换台中来到的呼
叫流 , 公共汽车站来到的乘客流 , 计数器纪录的到达信号流 ; 又如
放射性分裂落到某区域的质点流 , 热电子的发射流 , 宇宙中的行星
流等等都要以泊松过程及其衍生过程作为主角 ; 二是对泊松过程
的深入研究 ( 特别是通过随机过程的研究 ) 已发现它具有许多特殊
的优良性质和作用 , 它是研究其他复杂随机现象及过程的最重要
的基础之一 .它在信息网络、电子学、医学、物理、生物、宇宙学、环
保及管理科学等领域有广泛的应用 .
以 N ( t) 表示 (0 , t]上的信号数 , N ( s + t) - N ( s) 代表 ( s, s + t]
上的信号数 .显然 , 它取值非负整数 , 且对＂ t1 < t2 , 都有 N ( t1 ) ≤
N ( t2 ) .称{ N ( t) , t≥0 }为计数过程 .
定义 2 .1 　若信号流{ N ( t) , t≥0 }满足下面 4 条性质 :
(1 ) N( 0) = 0;
(2 ) 增量独立性　＂ 0≤ t1 < t2 < … < tn ; N( t1 ) - N(0) , N( t2 ) -
N ( t1 ) , … , N ( tn ) - N ( tn - 1 ) 是相互独立的 .即在互不重叠的时间
区间上到达的信号数相互独立 ;
(3) 增量平稳性　＂ s, t > 0 , n∈ N , P( N ( s + t) - N ( s) = n) =
P( N( t) = n) , 即在 ( s, s + t] 内到达的信号数的概率只与时间间隔
长短有关而与时间起点 s 无关 ;
(4 ) 普通性　在充分小的时间间隔 h 中 , 最多到达一个信号 ,
来两个或两个以上信号的概率是 h 的高阶无穷小 , 即＂ t≥0 , 充分
小的 h > 0 , 有
P( N( t + h) - N( t) = 1) = λh + o( h) , 　 λ> 0 ,
P( N ( t + h) - N ( t) ≥ 2 ) = o( h) ,
o( h)
其中 o( h) 意味着 lim = 0 .则称 { N ( t) , t≥ 0} 是参数为 λ的简
h→0 h
单泊松信号流 , 简称泊松流 ( 简记 : p .p .) .
注　对于固定的 t≥ 0 , N( t) 是一个随机变量 .而 { N ( t) , t≥ 0}
通常表示与参数 t 有关的一族随机变量 .定义 2 .1 中的第 ( 4 ) 条已
隐含 (3 ) 增量平稳性 , 但为了强调定义的直观性 , 易于理解与处理 ,
仍作上述定义 .
下面我们来推导 N ( t) 的分布 .
定理 2 .1 　如果 { N ( t) , t≥ 0 } 是简单泊松流 , 那么对于＂ s,
t≥0 , 有
(λt ) n - λt
P( N ( s + t) - N ( s) = n) = e , 　 n = 0, 1, 2, …,
n!
( 2 .1)
6 .2 泊松信号流的定义　 227
即 ( N( s + t) - N ( s) ) ～ Po(λt) .
证明　令 Pn ( t) = P( N ( s + t) - N ( s) = n) , 由增量平稳性可
得 Pn ( t) = P( N ( t) = n) .为证 ( 2 .1 ) 式 , 需考察 Pn ( t) 随 t 变化的
具体规律 , 这就要分析在[ 0 , t + h] 上到达的信号数与[ 0 , t] 上到达
的信号数的关系 .取充分小的 h > 0 , 事件可分解为 : 当 n≥1 时 ,
( N ( t + h) = n) = ( N ( t) = n, N( t + h) - N( t) = 0)
∪ ( N( t) = n - 1 , N( t + h) - N( t) = 1)
n
∪ ( N( t) = n - k, N( t + h) - N( t) = k) .
k=2
( 2 .2)
当 n= 0 时 , 有
( N ( t + h) = 0 ) = ( N ( t) = 0 , N( t + h) - N( t) = 0) .
由增量独立性可得
P0 ( t + h) = P0 ( t) P0 ( h) .
再由普通性可知
P( N( t + h) - N ( t) = 0 ) = P0 ( h) = 1 - λh + o( h) ,
故
P0 ( t + h) = P0 ( t) ( 1 - λh + o( h) ) .
移项 , 两边同除以 h, 得
P0 ( t + h) - P0 ( t) - λh P0 ( t) + o( h)
= .
h h
令 h→0 , 上式两边取极限 , 及 N (0 ) = 0 , 有
0 ( t) = - λ
P′ P 0 ( t) ,
( 2 .3)
P0 (0 ) = P( N( 0) = 0 ) = 1 .
- λt
解上面的微分方程 (2 .3 ) , 可得 P0 ( t) = e .因此当 n = 0 时 , 定理
2 .1 成立 .
下面来证 n≥1 时的情况 .根据平稳性及增量独立性 , 由 ( 2 .2)
式可推出
Pn ( t + h) = Pn ( t) P0 ( h) + Pn - 1 ( t) P1 ( h) + o( h) ,
Pn ( t + h) = Pn ( t) ( 1 - λh + o( h) ) +
Pn - 1 ( t) (λh + o( h) ) + o( h) .
仿照 n = 0 时的方法 , 移项两边同除以 h, 再令 h→0 时取极限 , 有
n ( t) = - λ
P′ P n ( t) + λP n - 1 ( t) , 　 n ≥ 1 ,
( 2 .4)
Pn (0 ) = P( N( 0) = n) = 0 , 　 n ≥ 1 .
用生成函数的方法来求解上面的微分方程组 .令
∞
∑
n
P( t, x) = Pn ( t) x , ( 2 .5)
n=0
将 (2 .4 ) 式两端同乘以 xn , 且与 ( 2 .3) 式联立 , 得

0 ( t) = - λP0 ( t) ,
P′
n n n
( 2 .6)
P′
n ( t) x = - λP n ( t) x + λP n - 1 ( t) x .
将 (2 .6 ) 式两边求和 , 有
∞ ∞ ∞
∑ P′( t) x = - λ∑ Pn ( t) x + λx∑ Pn - 1 ( t) xn - 1 ,
n n
n
n= 0 n= 0 n= 1
P( t, x )
即 = - λ(1 - x ) P( t, x ) , 分离变量后积分 , 得
t
l n P( t, x ) - ln P( 0 , x ) = - λ(1 - x) t,
因
∞
P(0 , x) = ∑P
n=0
n ( 0) xn = P0 (0 ) = 1 ,
得
∞
- λt ( 1 - x ) (λt ) n e - λt n
P( t, x ) = e = ∑
n= 0 n!
x ,
将上式与 (2 .5 ) 式相比较 , 可得 (2 .1 ) 式成立 .

由定理 2 .1 可知 N ( t ) ～ Po (λt ) , 再由第 4 章例 1 .4 得出
E N( t) =λt, E N ( 1 ) = λ.可见 λ表示单位时间上到达的平均信
号数 .
由定理 2 .1 容易证明以下定理 .
6 .3 用相继到达的时间间隔刻画泊松流　 229
定理 2 .2 　若信号流{ N( t) , t≥0 } 满足 : ( 1 ) N ( 0 ) = 0; ( 2 ) 增
n
(λt) - λt
量独立性 ; ( 3) ＂ s, t≥ 0 , n∈ N , P( N ( s + t) - N ( s) ) = e .
n!
则{ N( t) , t≥0} 是参数为 λ的泊松信号流 .
这样定理 2 .2 中的 ( 1 ) 、( 2 ) 、( 3 ) 可作为泊松信号流的另一
定义 .
从定义 2 .1 第 (4 ) 条中的 P( N( t + h) - N( t) ≥2 ) = o( h) 可推
断出计数过程{ N( t) , t≥0} 在任一时刻 t > 0 实际上不可能有跃度
大于 1 的跳跃 , 即它确切表示为 P{∩ ( N { t}≤ 1 ) } = 1 , 或等价地
t>0
1
P{∪ ( N{ t}≥2 ) } = 0 .其中 N { t} = n→
lim N ( t) - N t - 表示
t>0 ∞ n
{ N( t) , t≥0} 在时刻 t 点发生的点数 .
6 .3 　用相继到达的时间间隔刻画泊松流
在介绍泊松信号流的主要性质之前 , 先引入几个具有客观背

景的变量 .记 S0 = 0 , Sn 等于“第 n 个信号到达的时刻”, X n = Sn -
S n - 1 等于“相继到达的第 n - 1 个信号与第 n 个信号之间的时间间
隔”, 即
n
S0 = 0 , 　 Sn = ∑X
k= 1
k ,
当 N( t) 表示[ 0 , t] 上到达的信号数且有定义 2 .1 中的普通性时 ,
则上述 S1 及 Sn 可确切用 N ( t) 来定义如下 :
S0 = 0 , S1 = inf{ t; t > 0 , N ( t) ≠ 0 } ,
Sn = inf{ t; t > S n - 1 , N( t) ≠ n - 1 } , 　 n > 1 , ( 3 .1)
Xn = Sn - Sn - 1 , 　 n ≥ 1 .
　　反之 , 若已给 { Xn , n≥ 1 } 为相继到达信号的时间间隔 .又令
n
S0 = 0 , S n = ∑X
k=1
k , 也可用 S0 , S1 , … , Sn , …定义 N( t) 如下 :
N( 0) = 0 , 对＂ t > 0 ,
∞
N( t) = ∑I
n= 1
( S ≤ t)
n
= max { n; n ≥ 0 , S n ≤ t} . ( 3 .2)
由 Sn 与 N ( t) 的定义及关系 , 我们可以得出当 t≥0 时有 ( Sn ≤ t)

( N( t) ≥ n) , 且 ( Sn ≤ t) ( N( t) ≥ n) , 故
( Sn ≤ t) = ( N( t) ≥ n) ,
( N ( t) = n) = ( Sn ≤ t < Sn+ 1 ) = ( Sn ≤ t) - ( Sn+ 1 ≤ t) .
( 3 .3)
　　由于 Sn > 0 是非负的随机变量 , 只需考虑 t≥ 0 时的分布函
数 , 记 Fn ( t) = P( Sn ≤ t) .由 (3 .2 ) , ( 3 .3 ) 及 ( Sn + 1 ≤ t) ( Sn ≤ t) ,
可得
Fn ( t) = P( Sn ≤ t) = P( N ( t) ≥ n) , ( 3 .4)
P( N ( t) = n) = P( Sn ≤ t) - P( Sn+ 1 ≤ t) = Fn ( t) - Fn+ 1 ( t) .
( 3 .5)
　　以上关系很重要 , 且对任一满足定义 2 .1 中的计数过程
{ N( t) , t≥0} 与其到达时刻 { S n , n ≥ 1 } 均是如此 , 以下考察当
{ N( t) , t≥0} 为简单泊松流时 , 它们之间的具体关系 .
先看 n = 1 的情形 , 若 { N ( t) , t≥ 0 } 是参数为 λ的泊松流时 ,
- λt
P( X1 ≤ t) = P( S1 ≤ t) = P( N( t) ≥ 1 ) = 1 - e .可知 X1 ～ Ex (λ)
是指数分布 ( 参数为 λ) .由此可猜想 { X n , n≥ 1 } 的规律特性是什
么 ? 为此 , 讨论{ S n , n≥1 }的特性 .
引理 3 .1 　若{ N( t) , t≥0} 是参数为 λ的泊松流 , 则 Sn 的分布
函数为
n- 1
(λt ) k
∑
- λt
Fn ( t) = P( Sn ≤ t) = 1 - e . ( 3 .6)
k= 0 k!
　　证明　由定理 2 .1 的 (2 .1 ) 式代入 ( 3 .4) 式 , 即得 ( 3 .6) .
引理 3 .2 　若 { N ( t) , t≥ 0 } 是参数为 λ的泊松流 , 则 ( S1 ,
S2 , … , Sn ) 的联合概率密度函数为
n - λy
f ( S 1 , S2 , … , S n ) ( y1 , y2 , … , yn ) = λ e n
I ( 0 < y 1 < y 2 < … < y n ) . ( 3 .7)
　　证明　为避免繁琐 , 下面只对 n = 2 情形给出证明 ( n≥3 可类
似推出 ) .当 n = 2 时 , 由于 0≤ S1 ≤ S2 , 只需考虑取 0≤ y1 < y2 及充
分小的 h1 , h2 > 0 满足 : 0 < y1 < y1 + h1 < y2 < y2 + h2 , 由下面易知
{ y1 < S1 ≤ y1 + h1 , y2 < S2 ≤ y2 + h2 }
= { N( y1 ) = 0 , N( y1 + h1 ) - N ( y1 ) = 1 ,
N ( y2 ) - N ( y1 + h1 ) = 0 ,
N( y2 + h2 ) - N( y2 ) = 1 } +
{ N ( y1 ) = 0 , N ( y1 + h1 ) - N( y1 ) = 1 ,
N ( y2 ) - N ( y1 + h1 ) = 0 ,
N( y2 + h2 ) - N ( y2 ) ≥ 2} .
再由{ N( t) , t≥0} 增量独立性及定理 2 .1 的 (2 .1 ) 式得
P( y1 < S1 ≤ y1 + h1 , y2 < S2 ≤ y2 + h2 )
- λy - λh - λ( y - y - h ) - λh
= (e 1
) (λh1 e 1
)(e 2 1 1
) (λh2 e 2
) + o( h1 h2 )
=λ2 e - λy 2 h1 h2 e - λy 2 + o( h1 h2 )
2 - λy
=λ e 2
h1 h2 ( 1 - λh2 + o( h2 ) ) + o( h1 h2 )
及
P( y1 < S1 ≤ y1 + h1 , y2 < S2 ≤ y2 + h2 )
f ( S 1 , S 2 ) ( y1 , y2 ) = hlim ,
→0
1 h1 h2
h →0
2
故
2 - λy
f ( S 1 , S2 ) ( y1 , y2 ) = λ e 2
I( 0 < y 1 < y 2 ) .
对 n≥ 3 , 可类似地证明 .
事实上 , 由 P( N( t + h) - N ( t) ≥ 2 ) = o( h) , 可推出 : ＂ n≥ 1 ,
P(0 < Sn < Sn + 1 ) = 1 .
再分析相邻事件到达的时间间隔 { X n , n≥ 1}的特性 .
引理 3 .3 　若{ N ( t) , t≥0 }是参数为 λ的简单泊松流 , 则相邻
两个事件发生的时间间隔 { Xn , n≥1 } 彼此独立 , 且均服从参数同
为 λ的指数分布 , 即{ X n , n≥1 }独立同分布 , Xn ～ Ex (λ) .

证明　证明大致思路与步骤如下 : 由 ( S1 , S2 , … , Sn ) 的联合
概率密度函数通过变换 X n = Sn - S n - 1 求 ( X1 , X2 , … , X n ) 的联合
概率密度函数 .再证 X i ( i = 1 , 2 , … , n) 独立同分布且 X n ～ Ex (λ) .
由
X1 = S1 ,
X2 = S2 - S1 ,
…
Xn = Sn - S n - 1 .
令
x1 = y1 , y1 = x1 ,
x2 = y2 - y1 , y2 = x1 + x2 ,
　　
… …
xn = yn - yn - 1 . yn = x1 + x2 + … + xn .
求得变换的雅可比行列式为
1 0 … 0
1 1 … 0
J = = 1,
… … ｗ …
1 1 … 1
于是 ( X1 , X2 , … , Xn ) 的联合概率密度函数为
n - λ( x + x + … + x )
f ( X 1 , X2 , … , X n ) ( x1 , x2 , … , xn ) = λ e 1 2 n
I ( x i ≥ 0 , 1 ≤ i≤ n) ,
为求 X k 的概率密度函数只需将上式对 x 1 , … , xk - 1 , xk + 1 , … , xn 变
元积分 .结果为
- λx
f k ( xk ) = λe k I( x k ≥ 0 ) ,
可知 , 对＂ xk ≥ 0 ( 1 ≤ k ≤ n) 有 f ( X 1 , X 2 , … , X n ) ( x1 , x2 , … , xn ) =
n
∏f
k= 1
k ( xk ) , 即{ X n , n≥1 }独立同分布且 X n ～Ex (λ) .引理得证 .
以上说明 , 相邻时间间隔 { X n , n≥1 } 独立同指数分布是简单

泊松流的必要条件 , 那么它是否是充分条件 ? 换句话说 , 它是泊松

流所特有的性质 ? 回答是肯定的 .
引理 3 .4 　设{ Xn , n≥ 1} 表示相继发生的事件 ( 信号到达 ) 的
时间间隔 , 若它们独立 , 服从参数为 λ的指数分布 , 则由 (3 .2 ) 式定
义的 N ( t) 服从泊松分布 , 即＂ t≥0 , 有
n
P( N ( t) = n) = (λt ) e - λt , 　 n = 0 , 1 , 2 , … .
n!
def
　　证明　为求 N ( t) 的分布 , 先求出 Sn 的分布 F n ( t) = P( Sn ≤
t) , 用归纳法 .
n-1 k
(λt )
∑
- λt
Fn ( t) = 1 - e , 　 t ≥ 0, ( 3 .8)
k=0 k!
当 n = 1 时 , 易知 F1 ( t) = P( S1 ≤ t) = P( X1 ≤ t) = (1 - e - λt ) I ( t≥ 0 ) .
设当 n = k 时 , ( 3 .8 ) 成立 , 须证 n = k + 1 时 , 由 Sn + 1 = S n +
Xn + 1 , 利用卷积公式
t
Fn+ 1 ( t) = ∫F ( t -
0
n u) d F1 ( u) ,
有
k- 1 i
t
(λ( t - u) )
∫ ∑
- λ( t - u ) - λu
Fk + 1 ( t) = 1 - e λe du
0 i=0 i !
k- 1
- λt - λt (λt ) i+ 1
=1 - e - e ∑
i=0 ( i + 1) !
k i
(λt ) ,
∑
- λt
=1 - e
i= 0 i !
从而 (3 .8 ) 式得证 .再由 (3 .8 ) 式 , 代入 (3 .5 ) 式 , 即证结论成立 .
由引理 3 .4 易得如下推论
推论　若 { X n , n≥ 1 } 独立同分布 , 且 Xn ～ Ex (λ) , 则由 (3 .2 )
式定义的{ N( t) , t≥0} 具有普通性 , 即＂ t≥0 及充分小的 h > 0 , 有
P( N( h) = 1) = λh + o( h) , 　 P( N ( h) ≥ 2 ) = o( h) .
　　引理 3 .5 　若{ X n , n≥ 1}独立同分布 , X n ～ Ex (λ) , 则由 (3 .2)

式定义的{ N( t) , t≥0} 具有增量平稳性 , 即
＂ s, t ≥ 0 , P( N( s + t) - N( s) = n) = P( N( t) = n) , ＂ n ∈ N .
　　证明　这里只写出对 n≥ 1 的证明 .利用全概率公式及 ( 3 .3)
式,有
∞
P( N ( s + t) - N ( s) = n) = ∑ P( N( s)
k= 0
= k, N ( s + t) = k + n)
∞
= ∑ P( Sk ≤ s < Sk+ 1 ≤ Sk+ n ≤ s + t < S k+ n+ 1 )

k= 0
= P( s < S1 ≤ S n ≤ s + t < Sn+ 1 ) +

∞ s
∑∫ P( S
k= 1 0
k ≤ s < Sk + X k+ 1 ≤ S k +
k+ n k+ n + 1
∑X
k+ 1
i ≤ s + t ≤ Sk + ∑X
k+ 1
i | Sk = u) d P( Sk ≤ u)
= P( s < S1 ≤ S n < s + t < Sn+ 1 ) +

∞ s
∑∫ P( s -
k= 1 0
u < S1 ≤ Sn ≤ s + t - u < Sn + 1 ) d P( Sk ≤ u) .
( 3 .9)
又
P( s < S1 ≤ Sn ≤ s + t < Sn+ 1 )
s+ t n n+ 1
∫
=
s
P ∑X 2
i ≤ s+ t - v < ∑X2
i | X1 = v λe - λv d v
s+ t
∫
=
s
P ( Sn - 1 ≤ s + t - v < Sn )λe - λv d v
s+ t
[λ( s + t - v) ] n - 1 - λ( s+ t - v) - λv
∫
= s ( n - 1) !
e λe d v
n
(λt ) - λ( s + t )
= e .
n!
类似地有
(λt ) n - λ( s + t - u)
P( s - u < S1 ≤ Sn ≤ s + t - u < Sn + 1 ) = e ,
n!
代入 (3 .9 ) 式得
(λt) n - λ( s + t) s
(λt) n - λ( s + t - u)
P( N ( s + t) - N( s) = n) =
n!
e + ∫ 0 n!
e λd u
n n
(λt) - λ( s + t) (λt ) - λ( s + t) λs
= e + e (e - 1)
n! n!
n
= (λt ) e - λt = P( N ( t) = n) .
n!
　　注　对 n = 0 的情形证明类似 , 留作读者练习 .
引理 3 .6 　若{ X n , n≥ 1}独立同分布 , X n ～ Ex (λ) , 则由 (3 .2)
式定义的{ N( t) , t≥ 0 } 具有增量独立性 , 即＂ 0 ≤ t1 < t2 < … < tn ,
N ( t1 ) - N (0 ) , N( t2 ) - N( t1 ) , … , N ( tn ) - N( tn - 1 ) 相互独立 .
证明　为节省篇幅 , 下面只证对＂ s, t > 0 , N ( s) 与 N ( s+ t) -
N ( s) 独立 , 即证 : ＂ m, n≥0 有 P( N( s) = m, N( s+ t) - N( s) = n) =
P( N( s) = m) P( N ( s + t) - N ( s) = n) .只写出 m≥1 与 n≥ 1 的情
形 , 其他可类似证之 .
P( N( s) = m, N ( s + t) - N ( s) = n)
= P( Sm ≤ s < S m+ 1 ≤ Sm+ n ≤ s + t < Sm+ n + 1 )
s m+ n
∫ P( s -
=
0
u < Xm+ 1 ≤ ∑ X i ≤ s + t - u ≤
m+ 1
m+ n+1
∑m+ 1
X i | Sm = u) d P( S m ≤ u)
s
∫ P( s -
= 0
u < S1 ≤ Sn < s - u + t < Sn+ 1 ) d P( Sm ≤ u)
s
(λt ) n - λ( s- u+ t) (λt ) m - 1 - λu (λs) m - λs (λt ) n - λt
∫
= 0 n!
e λ
( m - 1) !
e du =
m !
e
n!
e
= P( N( s) = m) P( N( s + t) - N( s) = n) .
综合引理 3 .2 ～3 .6 , 我们有以下重要定理 .
定理 3 .1 　计数过程 { N ( t) , t≥ 0 } 是简单泊松流的充要条件
是其信号相继到达的时间间隔 { X n , n≥ 1 } 独立同分布 , 且 X n ～
Ex(λ) .
以上结果揭示了简单泊松流与服从指数分布且相互独立的时
间间隔的内在联系 , 这不仅在理论上有价值 , 而且在应用上很有意
义 .例如 , 要检验一个计数过程是否是泊松流问题 , 可以转化为检
验{ X n , n≥ 1}是否独立同分布及 X n ～ Ex(λ) .同时 , 要在计算机上
模拟一简单泊松流 { N( t) , t≥0} .可通过以下步骤构造出 :
(1 ) 取一串{ U n , n≥1 }独立同分布 U n ～U ( 0 , 1) ;
(2 ) 令 X n = - λ- 1 l nU n (λ> 0 ) 易知 , { Xn , n≥ 1 } 独立同分布 ,
且 Xn ～ Ex(λ) ;
n
(3 ) 令 S0 = 0 , Sn = ∑X
1
k ;
∞
( 4) ＂ t≥0 定义 N ( t) = ∑I
n= 1
( S ≤ t)
n
= sup{ n: n ≥ 0 , S n ≤ t} .
则{ N( t) , t≥0} 为泊松流 .
6 .4 　相继到达时刻的条件分布
考虑在 N ( t) = n 条件下 , ( S1 , S2 , … , S n ) 的条件分布 .先看在

N ( t) = 1 下 , S1 的条件概率密度函数 , 由于 S1 ≥0 , 同时在 N( t) =
1 下 , S1 ≤ t, 故只需考察 0≤ x≤ t 的情形 .当 0≤ x≤ t 时 , 有
P( S1 ≤ x , N( t) = 1)
P( S1 ≤ x | N( t) = 1) =
P( N( t) = 1)
= P( N ( x) = 1 , N( t) - N ( x ) = 0) = x ,
P( N ( t) = 1 ) t
6 .4 相继到达时刻的条件分布　 237
1 ( 0 ≤ x≤ t )
f S 1 | N( t) = 1 ( x ) = I . ( 4 .1)
t
可见 S1 = X1 在 N( t) = 1 下的条件概率密度函数是[ 0 , t]上的均匀
分布 .一般地 , 我们有下面的结论 .
定理 4 .1 　设{ N( t) , t≥0}为泊松信号流 , 则在 N( t) = n ( n≥ 1)
下 , ( S1 , S2 , … , Sn ) 的条件概率密度函数为
n!
f ( x1 , x2 , … , xn ) = ・ I( 0 < x1 < x 2 < … < x n < t) . ( 4 .2)
tn
　　证明　为节省篇幅仅证 n = 2 .因在 N ( t) = 2 下 , 0 ≤ S1 ≤
S2 ≤ t, 故只考虑 0 < x1 < x2 < t, 取充分小 h > 0 使 0 < x1 < x1 +
h < x2 < x2 + h < t, 于是
P( x1 < S1 ≤ x1 + h, x2 < S2 ≤ x2 + h | N ( t) = 2 )
= P{ N( x1 ) = 0 , N( x1 + h) - N( x1 ) = 1 ,
N( x2 ) - N ( x1 + h) = 0 , N ( x2 + h) - N ( x2 ) = 1 ,
N( t) - N ( x2 + h) = 0 }/ P( N ( t) = 2 )
(λt ) 2 - λt
= e - λx 1 (λhe - λh ) e - λ( x 2 - x 1 - h) (λhe - λh ) e - λ( t - x - h)
2 / e
2!
2!
= 2 h1 h2 ,
t
2 !
得 f ( S 1 , S 2 | N ( t ) = 2 ) ( x1 , x2 ) = 2 I( 0 < x < x < t)
1 2
.
t
n≥3 的情况可类似证得 .
本定理说明在 N ( t) = n 的条件下 ( S1 , S2 , … , Sn ) 的条件概率
密度函数与 n 个在 [0 , t] 上相互独立同均匀分布 U1 , … , Un 的顺
序统计量 U( 1 ) , … , U( n) 的联合概率密度相同 ( 见第 3 章命题 7 .2 ) .
其逆命题如下 .
定理 4 .2 　设{ N ( t) , t≥0 } 为计数过程 ( 信号流 ) .{ Xn , n≥ 0}
为信号相继到达的时间间隔 , 独立同分布 F ( x ) = P ( X n ≤ x ) ,
F( 0) = 0 , 且＂ 0 ≤ s≤ t, P ( X1 ≤ s | N ( t) = 1 ) = ( s/ t) I( 0 ≤ s≤ t ) , 则
{ N( t) , t≥0} 为泊松信号流 .
证明　由题设 P( X1 ≤ s| N ( s + x ) = 1 ) = s/ ( s+ x) ,
P( X1 ≤ x | N( s + x) = 1 ) = x/ ( s + x ) ,
所以
P( X1 ≤ s | N ( s + x) = 1 ) +
P( X1 ≤ x | N ( s + x ) = 1) = 1 , 　 x , s > 0 . ( 4 .3)
又
P( X1 ≤ s | N ( s + x ) = 1) = P( X1 ≤ s,
X1 ≤ s + x < X1 + X2 )/ P( X1 ≤ s + x < X1 + X2 ) ,
由全概率公式可得
P( X1 ≤ s, X1 ≤ s + x < X1 + X2 )
s
=∫( 1 - 0
F( s + x - u) ) d F( u) .
同理
x+ s
P( X1 ≤ s + x < X1 + X2 ) = ∫ 0
( 1 - F( s + x - u) ) d F( u) .
由 (4 .3 ) 式可得
x s
∫( 1 -
0
F( s + x - u) ) d F( u) + ∫( 1 -0
F( s + x - u) ) d F( u)
x+ s
∫
= 0
( 1 - F( s + x - u) ) d F( u) ,
所以
s
∫ (10
- F( s + x - u) ) d F( u)
x +s
∫
= x
(1 - F( s + x - u) ) d F( u) , 　 x , s > 0 .
令 G( x) = 1 - F( x ) , 则上式可化为
G( s + x) = G( s) G( x) , 　 s, x ≥ 0 , ( 4 .4)
由 G( x) 单调不增、右连续 , 则存在右导数 G′
x ( x) ; 又 G( 0 ) = 1 , 及
6 .4 相继到达时刻的条件分布　 239
(4 .4 ) 式得 G′
s ( x + s) = G′
s ( s) G( x ) .又 G′
x ( x + s) = G′
s ( x + s) , 令
- λx
s= 0 , 则 G′
x ( x) = G′
s ( 0 ) G( x ) .令 λ= - G′
s ( 0 ) ≥ 0 , 则 G( x ) = e
( x≥0 ) .由 F( x ) 是分布函数 , 不能恒等于零 , 可得λ> 0 , 从而 F( x)

服从指数分布 .再由定理 3 .1 即证 .
注　用以上结果检验泊松信号流时 , 不必知道参数 λ.
def N ( t )
例 4 .1 　求 S( t) = k∑ ( t - Sk ) 的期望 E S( t) , 其中 { N ( t) , t≥
=1
0} 是参数为 λ的泊松流 .Sn 为其第 n 个事件发生时刻 .此例的背景

之一是 : 设 t 为火车离站时刻 , Sk 为第 k 个顾客到站时刻 , 那么
S( t) 为在 ( 0 , t]上到站乘客的候车时间之和 .
解　由条件期望性质 , 有
N( t)
ES ( t) = E E ∑(t
k= 1
- S
k
) | N ( t) ,
为此先求
N ( t)
E[ S( t) | N ( t) = n] = E ∑(t -
k=1
S k ) | N( t) = n
= E ∑(t
k= 1
- Sk ) | N ( t) = n
n n
= nt - E ∑S
k= 1
k | N ( t) = n = nt - E ∑U
k=1
( k)
n n
= nt - E ∑U k = nt - ∑ EU k = nt ,
k= 1 k= 1 2
其中 U1 , … , Un 独立同分布 , 且 U1 ～U[ 0 , 1 ] , U( 1 ) , … , U( n) 为其顺
序统计量 .故
ES ( t) = E{ E[ S( t) | N ( t) ] }
∞
λt2
= ∑ E[ S( t) | N( t) = n] P( N( t) = n) = .
n= 0 2
6 .5 　剩余寿命与年龄
本节再从不同角度刻画泊松流的特性 .设 N ( t) 表示在[ 0 , t]
上事件发生的个数 , Sn 表示第 n 个事件发生的时刻 , 那么 , SN ( t) 表
示在 t 时刻前最后一个事件发生的时刻 .S N ( t ) + 1 表示 t 时刻后首次
事件发生的时刻 .注意这里 S N ( t ) 与 SN ( t) + 1 的下标 N( t) 与 N( t) + 1
是随机变量 .令
W ( t) = S N( t) + 1 - t, ( 5 .1)
V ( t) = t - SN ( t ) , ( 5 .2)
W ( t) 与 V( t) 有许多具体背景 , 例如 , 设一零件在 t = 0 时开始工
作 , 若它失效 , 立即更换 , 一个更新的零件又开始工作 , 如此重复下
去 , 记 Sn 为第 n 次更换时刻 , 记 Xn = Sn - Sn - 1 表示第 n 个零件的
工作寿命 .此时 W ( t) 表示观察者在时刻 t 所观察的正在工作的零
件的剩余寿命 ; V ( t) 表示正在工作的零件已经工作的时间 , 称为
年龄 .还可以有别的解释 : 如 Sn 表示第 n 辆汽车到站的时刻 , 某一
乘客到站的时刻为 t, 则 W ( t) 表示该乘客的等待时间 .若 Sn 表示
第 n 次发生地震的时刻 , 则 S N( t) + 1 表 t 时刻以后首次地震的时刻 ,
W ( t) 表示 t 时刻后直到首次地震之间的剩余时间 , 等等 .所以 , 通
常称 W ( t) 为剩余寿命 , V ( t) 为年龄 .显然 , 研究 W ( t) , V ( t) 的特
性很有意义 .
定理 5 .1 　若 { N ( t) , t≥ 0 } 是参数为 λ的简单泊松信号
流 , 则:
(1 ) W ( t) 与 { Xn , n ≥1 } 同为指数分布 ;
(2 ) V ( t) 是“截尾”的指数分布 , 即
- λx
1 - e , 0 ≤ x < t,
P( V( t) ≤ x ) = ( 5 .3)
1 x≥ t .
　　证明　由{ W ( t) > x} = { N ( t + x ) - N ( t) = 0 } , 及 t > x 时 ,
6 .6 泊松流的若干推广　 241
{ V ( t) > x} = { N ( t) - N( t - x ) = 0 } , t≤ x 时 , { V ( t) > x} = ,即
得所要结论 .
推论 1 　若{ N( t) , t≥0}是参数为 λ的简单泊松流 , 则 EW( t) =
1/ λ, E V( t) = ( 1 - e - λt )/ λ.
证明　由定理 5 .1 易得 , 请读者自己完成 .
问题　＂ t > 0 , W ( t) , V ( t) 是否独立 ? 请有兴趣的读者证明
你的猜想 .
还可用 W ( t) 与 X n 的关系来刻画泊松信号流 .
定理 5 .2 　设{ Xn , n≥1} 独立同分布 , X n ≥ 0 . ＂ t≥0 , N ( t) 由
(3 .2 ) 式定义 , W ( t) 由 ( 5 .1 ) 式定义 , 若 W ( t) 与 X n 独立同分布
F( x ) , 且 F(0 ) = 0 , 则{ N( t) , t≥0} 是泊松信号流 .
证明　梗概如下 : 设 G( x ) = 1 - F( x) , 由 W ( t) 的定义及全概
率公式可证 : ＂ x, t≥0 , 有
t
P( W ( t) > x) = 1 - F( x + t) + ∫ P( W ( t -
0
u) > x) d F( u) ,
( 5 .4)
由此可得 G( t + x) = G( t) G( x ) ( t, x≥ 0 ) .类似与定理 4 .2 最后部
分的证明 .
6 .6 　泊松流的若干推广
在前面的讨论中 , 我们看到泊松信号流有许多良好的独特性

质 , 但现实问题中并不都能满足泊松流定义中的所有条件 .因此 ,
有必要讨论定义中某些条件放宽或减弱后的情形 , 下面提一下它
的一些推广 .
1 　非时齐泊松流
把泊松流定义中将增量平稳性放宽的情况 , 即去掉 λ是常数

的限制 , 即得到非时齐泊松流 .
定义 6 .1 　计数过程 { N ( t) , t≥ 0 } 称为具有强度函数 {λ( t) ,
t≥0} 的非时齐泊松流 .若它满足 :
(1 ) N( 0) = 0;
(2 ) { N ( t) , t≥0 }具有增量独立性 ;
(3 ) ＂ t≥0 , 充分小的 h > 0 , P( N( t + h) - N( t) = 1) =λ( t) h +
o( h) , P( N( t + h) - N( t) ≥ 2) = o( h) , 其中 {λ( t) , t≥ 0 }称为强度
函数 ,λ( t) ≥0 .
定理 6 .1 　若{ N ( t) , t≥ 0} 是强度函数 {λ( t) , t≥0 } 的非时齐
t
泊松流 , 令 m( t) = ∫λ( u) d u , 则＂ s, t≥ 0 有
0
n
[ m( s + t) - m( s) ]
P( N( s + t) - N( s) = n) = ・
n!
　　　 exp{ - [ m( s + t) - m( s) ] } , 　 n ∈ N . ( 6 .1)
　　证明　证法与定理 2 .1 的证法完全类似 , 留作练习 .
可以证明 , 通过适当的变换可将非时齐的泊松流转化为时齐
的泊松流 , 反之亦然 .
2 　复合泊松流
定义 6 .2 　设{ Y k , k≥1 }独立同分布 , { N ( t) , t≥ 0 }为简单泊

松流且{ N( t) , t≥0} 与{ Y k , k≥1} 独立 , 记
N ( t)
X( t) = ∑Y
k= 1
k , ( 6 .2)
称{ X( t) , t≥0 } 为复合泊松流 .
特殊情况 , 若 {ρk , k≥ 1} 独立同分布 , 是取值为正整数的随机
N( t)
变量序列 , 且{ρk , k≥1 \ }与{ N ( t) , t≥0 }独立 , 记 X( t) = ∑ρ , 则

k= 1
k
称{ X( t) , t≥0} 为平稳无后效流 .容易理解 X( t) 可用于描述成批

到达的顾客流 .
6 .6 泊松流的若干推广　 243
3 　条件泊松流
定义 6 .3 　设 Λ是一正随机变量 , 分布函数为 G( x ) ( x≥ 0 ) .
设{ N( t) , t≥0} 是计数过程 , 且在给定 Λ= λ的条件下 , { N ( t) , t≥
0} 是一时齐的泊松流 , 即＂ s, t≥ 0 , λ≥0 , n∈N , 有
(λt ) n - λt
P( N ( s + t) - N ( s) = n | Λ = λ) = e ( 6 .3)
n!
4 　更新过程
由定理 3 .1 知 , 一个计数过程 , 若他们相邻到达的时间间隔
Xn 是指数分布 , 则此过程为泊松流 .现在 , 我们来考虑 Xn 是一般
分布时的情形 , 这便是更新过程 .
定义 6 .4 　设 { Xn , n≥ 0 } 独立同分布 , Xn ≥ 0 , 分布函数为
n
F( x ) ( x≥ 0) , 且 F( 0 ) < 1 , 令 S0 = 0 , Sn = ∑X
k=1
k , 对＂ t≥ 0 , 记
∞
N ( t) = ∑I
n=1
( S ≤ t)
n
, 称{ N ( t) , t≥0 }为更新过程 .
显然 , 更新过程是一计数过程 , 并有
{ N( t) ≥ n} = { Sn ≤ t} , ( 6 .4)
{ N ( t) = n} = { Sn ≤ t < Sn+ 1 } = { Sn ≤ t} - { Sn+ 1 ≤ t} .
( 6 .5)
　　请读者考虑更新过程是否具有增量独立性 .
n
记 Fn ( x) 为 Sn 的分布函数 , 由 Sn = ∑X
k=1
k , 易知
F1 ( x) = F( x) ,
x
Fn ( x) = ∫F0
n -1 ( x - u) d F( u) , 　 n ≥ 2 ,
即 Fn ( x) 是 F( x ) 的 n 重卷积 ( 简记 Fn = Fn - 1 ＊ F) .记 m ( t) =
E N( t) , 称 m( t) 为更新函数 .
定理 6 .2 　＂ t≥0 , 有
∞
m( t) = ∑F
n= 1
n ( t) . ( 6 .6)
∞ ∞ ∞
　　证明　 m( t) = E∑ I( S n ≤ t) = ∑ EI ( S ≤ t)
n
= ∑ P( S n ≤ t) =
n=1 n=1 n= 0
∞
∑F
n= 1
n ( t) .
　　推论　若对＂ t≥0 , F( t) < 1 , 则
m( t) ≤ F( t) ( 1 - F( t) ) - 1 ( 6 .7)
　　证明　由归纳法可得 Fn ( t) ≤ ( F( t) ) n , 再利用 ( 6 .6) 式即得 .
定理 6 .3 　＂ t≥0 , m( t) 满足更新方程
t
m( t) = F( t) + ∫ m( t -
0
u) d F( u) . ( 6 .8)
∞
　　证明　由 ( 6 .6 ) 得 m( t) = F( t) + ∑F
n= 2
n ( t) , 将 Fn ( x) =
x ∞
∫ ∫
- st
Fn - 1 ( x - u) d F( u) 代入即得 ( 6 .8) .若令珦
m( s) = e d m( t) ,
0 0
珟
F( s) = ∫ 0
e - s t d F( t) , 从 ( 6 .8) 式易得
珟
F( s) 珦
m( s)
珦
m( s) = , 　　珟
F( s) = , ( 6 .9)
1 - 珟
F( s) 1+珦
m ( s)
由拉普拉斯变换与其逆变换是一一对应的 , 可知 m ( t) 与 F( t) 亦
是一一对应的 .
令 μ= E X n , 由 F(0 ) < 1 易证 μ> 0 .记 N ( ∞ ) = lim N ( t) .
t→ ∞
Sn
定理 6 .4 　 ( 1 ) P ( nlim = μ) = 1; ( 2 ) P( N ( ∞ ) = ∞ ) = 1;
→∞ n
N ( t) 1
(3 ) P t→
lim = =1 .
∞ t μ
证明　 (1 ) 由强大数定律即得 .
练习题　 245
∞ ∞
(2 ) 注意到{ N ( ∞ ) < ∞} = n∪ ( S n = ∞ ) = n∪ ( Xn = ∞ ) 即得 .
= 1 = 1
(3 ) 从略 ( 留给有兴趣的读者作为练习来完成 ) .
更新过程的最初物理原型是零件的接连更换 , 一个零件在零
时刻开始工作 , 在 X1 时刻失效 , 然后马上被第二个更换 , 一般地 ,
n
第 n 个零件在 ∑ X i 时失效 , 随之马上换一新零件 .通常假定各零

i= 1
件寿命是独立同分布的 , 即 P( X n ≤ x ) = F( x ) , 显然在这一更换过
程中 N ( t) 表示在 [ 0 , t] 的更新数目 .现在 , 更新过程在生物遗传 ,
排水系统 , 可靠性工程 , 人口增长 , 经济管理等领域有着广泛应用 .
练　习　题
6 .1 　假设在某一公路上 , 同方向行驶的汽车之间的距离是具
有均值为 100m 的指数分布 , 且相互独立 .问 : 在 5 km 的一段路上
有 50～ 60 辆汽车的概率是多少 ?
6 .2 　在某一公路上 , 可以假设运输流为强度等于 0 .5 辆/ s
的简单泊松流 , 试求出 n 辆汽车 ( 一辆接一辆 ) 通过观察岗需要时
间多于 t－s 的概率 .
6 .3 　设{ N ( t) , t≥0 }是参数为 λ的泊松流 , S0 = 0 , Sn 为第 n
个信号 ( 顾客 ) 到达时刻 .
(1 ) 下列事件是何关系 : ( N ( t) < n) 与 ( Sn > t) ; ( N ( t) ≤ n) 与
( Sn ≥ t) ; ( N ( t) > n) 与 ( Sn < t) ;
(2 ) ＂ s, t > 0 , 求 E[ N ( s) N ( t) ] , P( N ( t) = k | N ( s) = n) 及
E[ N ( t) | N ( s) ]的分布律 ;
(3 ) 求 E( S1 | N ( t) = n) 及 E( S1 | N ( t) ) 的分布律 ;
(4 ) 求 E( Sk | N( t) = n) ;
(5 ) 试问 W ( t) = SN ( t ) + 1 - t 与 V ( t) = t - SN ( t ) 是否独立 ? 试
证之 ;
(6 ) 求 δ( t) = S N ( t) + 1 - S N( t) 的概率密度函数 .
6 .4 　设{ N ( t) , t≥0 }是参数为 λ的时齐泊松过程 , { Y k , k≥1}
2
独立同分布 , 且与 { N ( t) , t≥0 }独立 , E Y1 = μ, D Y1 =σ , 令 X( t) =
N ( t)
∑Y
k= 1
k , 求 : E X( t) , D X( t) .
6 .5 　设一系统在[ 0 , t] 内受冲击的次数 { N ( t) , t≥ 0 } 是参数
为 λ的时齐泊松过程 , 第 k 次受冲击的即时损失为 D k , { Dk , k≥1}
独立同分布 , 并与{ N ( t ) , t≥ 0 } 独立 , 且损失随时间呈指数衰减 .
- αt
t = 0 的损失为 D, 经 t 时刻损失为 De .设损失可加 , t 时刻的总
N ( t)
- α( t - S )
损失为ξ( t) = ∑D e
k=1
k k . 试求 Eξ( t) (α> 0 为常数 ) .
6 .6 　设{ N ( t) , t≥0 }是参数为 λ的泊松流 , S0 = 0 , S1 , S2 , … ,

S n 为相继事件发生时刻 .
(1 ) 给定 N( t) = n 下 , 试问 S1 , S2 - S1 , … , Sn - S n - 1 是否条
件独立 ? 同分布 ? 试证明之 ;
(2 ) 求 E S1 及 E( Sk | N( t) = n) ( n≥0 , k = 1 , 2 , … ) ;
(3 ) 求 ( S1 , S2 ) 在 N ( t) = 1 下的条件概率密度函数 ;
(4 ) 求 ( S2 , S5 ) 的联合概率密度函数 ;
(5 ) ＂ 0 < t1 < t2 < t3 , 求 N ( t1 ) , N ( t2 ) - N ( t1 ) 及 N ( t3 ) -
N ( t2 ) 在给定 N( t3 ) = n 下的条件联合分布律 .
6 .7 　设{ N ( t) , t≥0 }为泊松过程 , 参数为 λ.证明 :
(1 ) 任给 0≤ s≤ t, 有 P{ N ( s) ≤ N( t) } = 1 ;
(2 ) 任给 0≤ s≤ t,ε> 0 有 lim P { N( t) - N( s) >ε} = 0 .
t→ s
6 .8 　设 U k 是独立同分布 U k ～ ( 0 , 1 ) , X k = - λ- 1 ln Uk , (λ>
0) , 求 : (1 ) X k 的分布 ;
n
(2 ) Sn = ∑X
k= 1
k 的概率密度函数 ;
练习题　 247
2
(3 ) Zn = 2λSn 的概率密度函数 , 并与 χ ( 2 n) 的概率密度函数
比较 .
n
1 t
n∑
6 .9 　证 : ＂ε> 0, n→
lim P Sk - < ε| N( t) = n = 1 ,
∞ k=1 2
其中 N ( t) 为泊松信号流 , Sn 为第 n 个信号到达时刻 , t > 0 固定 .

　　 6 .10 　考虑一更新过程 , 如果 P( X n = 1 ) = 1/ 3 , P( Xn = 2 ) =
2/ 3 .计算 : P( N (1 ) = k) , P( N (2 ) = k) , P( N (3 ) = k) .
6 .11 　设{ Xn , n≥1}独立同分布 , X 的概率密度函数为 f ( x) =
- ρ( x - δ)
ρe I( x > δ) , 其中 δ> 0 给定 .求更新过程中的概率 P( N( t)≥ k) .
6 .12 　设 Xn 的概率密度 f ( x) =λ2 xe - λx ( x≥ 0 ) .求相应的更
新函数 m( t) .
6 .13 　设{ Ni ( t) , t≥0 }是参数分别为 λi 的时齐泊松过程 , 且
相互独立 ( i = 1 , 2) .S0( i) = 0 , S(ni ) 为第 i 个过程第 n 个事件发生的
时刻 .
(1) 令 N( t) = N1 ( t) + N2 ( t) , 证明{ N( t) , t≥0 }是参数为 λ1 +
λ2 的时齐泊松过程 ;
(1 )
(2 ) 求 SN 2 ( t ) 的概率密度函数 .
6 .14 　设一信号接收器正同时接收两类相互独立且参数为 λi
( i)
的泊松信号流{ Ni ( t) , t≥0} , Ni ( 0 ) = 0 . Sn 表示第 i 类第 n 个信
号到达的时刻 , i = 1 , 2 , n≥1 ;
(1 ) ＂ 0 < s< t, 求 E{ N1 ( t) + N2 ( t) | N1 ( s) } 与 N1 ( S1( 2 ) ) 的分
布律 ;
(2 ) E{ S1( 1 ) | N1 ( t) + N2 ( t) = n} ( n = 1 , 2) ;
(3 ) 求不加分类的第 2 个信号到达时刻的数学期望 .
6 .15 　 X1 , X2 为相互独立指数分布随机变量 P ( X i > t) =
-λt
1 , 　 X1 < X2 ,
e i
( t≥ 0 , i = 1 , 2 ) .令 N = 　 U = min { X1 , X2 } ,
2 , 　 X2 ≤ X1 ,
W = | X1 - X2 | .
证明 : ( 1) P( N = i) = (λ1 +λ2 ) - 1 λi , 　 i = 1 , 2 ,
( 2) P( U > t) = exp { - (λ1 + λ2 ) t} , 　 t≥ 0 ,
( 3) N 与 U 独立 ,
( 4) P( W > t| N = 3 - i) = e - λit , 　 t≥0 , 　 i = 1 , 2 ,
( 5) U 与 W 独立 .
6 .16 　某台仪器由 A , B 两个系统构成 , 可能发生的故障有 3
种类型 .发生第 i 类 ( i = 1 , 2 , 3 ) 故障的累计次数构成 3 个相互独
立的强度分别为 λi 的泊松过程 .若发生第一类故障 , 系统 A 无法
正常运行 ; 若发生第二类故障 , 系统 B 无法正常运行 ; 若发生第三
类故障 , 系统 A, B 都无法正常运行 .以 X1 和 X2 分别记 A , B 两
个系统的寿命 .证明 :
(1 ) X1 和 X2 的联合分布为
P( X1 > s, X2 > t) = exp { - λ1 s - λ2 t - λ3 m ax( s, t) }
　　 ( 这个分布通常称为二元指数分布 ) ;
(2 ) X1 和 X2 均服从指数分布 .
( k) ( k)
6 .17 　设 N ={N ( t) , t≥0 } ( k≥1 ) , 为一列相互独立的泊
∞
∑λ
( k)
松过程, N 的强度为 λk . 又 λ = k < ∞ . 令 N ( t) =
k= 1
∞
∑ kN
( k)
( t) ( t ≥ 0 ) . 证明 N = { N( t) , t≥ 0}为复合泊松过程 .
k= 1
6 .18 　设{ N( t) , t≥0} 为计数过程 , S0 = 0 , Sn 为第 n 个事件到

达时刻 , 若{ N ( t) , t≥0 }满足普通性 , 即＂ t≥ 0 , 对任意小的 h > 0 ,
有 P( N ( t + h) - N ( t) ≥ 2) = o( h) .试证明 :
(1 ) P { N { t } ≤ 1 , ＂ t ∈ ( 0 , ∞ ) } = 1 , 其中 N { t} =
1
li m N( t) - N t - ;
n→ ∞ n
(2 ) ＂ j≠ i, P( S i ≠ S j ) = 1 .
练习题　 249
6 .19 　试证明定理 6 .1 .
6 .20 　设{ N( t) , t≥0} 为具有强度函数{λ( t) , t≥ 0 }的非时齐
泊松流 , S0 = 0 , Sn 为第 n 个信号到达时刻 .求 : (1 ) P( S1 ≤ x ) ;
(2 ) P( S1 ≤ y1 , S2 ≤ y2 ) ; ( 3) P( S1 ≤ x | N ( t) = 1) .
6 .21 　 { N ( t) , t ≥ 0 } 与 {λ( t ) , t≥ 0 } 同上题 .令 m( t) =
t
∫λ( s) d s , m
- 1 - 1
( t) 是 m ( t) 的反函数 , 即 m ( u) = inf { t: t > 0 ,
0
- 1
m( t) ≥ u, u≥0 } .记 M( u) = N ( m ( u) ) .
(1 ) 证明{ M ( u) , u≥0 }是时齐泊松流 ;
(2 ) 反之 , 若{ M ( u) , u≥ 0}是参数 λ= 1 的时齐泊松流 , 给定
强度函数{λ( t) , t≥0} .
def
证明{ N( t) = M( m( t) ) , t≥0 }是强度函数为{λ( t) , t≥ 0 }的非

时齐泊松流 .
6 .22 　设 X ( t) , N ( t) , { Y k , k≥ 1 } 同定义 6 .2 , 即 X( t) =
N ( t)
∑Y
k= 1
k , 是复合泊松流 , { N ( t) , t≥ 0 } 是参数为 λ的简单泊松流且
与{ Y k , k≥ 1 } 独立 , { Y k , k≥ 1} 独立同分布 .试证明 : ( 1 ) { X ( t) ,
t≥0} 是增量独立的 ; ( 2) { X( t) , t≥0} 是增量平稳的 ; ( 3) X( t) 的特
征函数为
+∞
∫
isX ( t) isx
Ee = exp - λt (1 - e ) d P( Y1 ≤ x)
- ∞
　　 6 .23 　 { X( t) , t≥0} , { N ( t) , t≥ 0 }及 { Y n , n≥ 1 } 同上定义 .试

求 X( t) 的分布函数 , 若 :
(1 ) Y1 ～ B(1 , p) ;
(2 ) Y1 ～ B( m, p) ( m≥1 固定常数 ) ;
(3 ) Y1 ～ G( p) ( 几何分布 ) ;
(4 ) Y1 ～ Ex(μ) ( 指数分布 ) .
6 .24 　 { X( t) , t≥0} 为复合泊松流 , 同 6 .22 题 .若 E Y1 = a, 证
X( t) a . s .
lim = λa .
n→ ∞ t
2
　　 6 .25 　记号同 6 .22 .若 E Y1 = a, D Y1 =σ < ∞ .证明 :
X( t) - λat ≤ x
＂ x ∈ R , t→
lim P = Φ( x) .
∞ σ2 λt
　　 6 .26 　设 Xn ～ G( p) ( 参数为 p 的几何分布 ) .求相应的更新
过程{ N( t) , t≥0} 的分布律及更新函数 m( t) .
6 .27 　设 { X n , n≥ 1 } 独立同分布 , X n ≥0 , P( X n ≤ t) = F( t) ,
{ N( t) , t≥0} 为相应的更新过程 .证明 : ＂ t > 0 , P ( N ( t) < ∞ ) = 1
+
的充要条件是 F( 0 ) < 1 .
6 .28 　设 X n , { N ( t) , t≥ 0 } 同上题 .记 φ( t, z) = Ez N( t) ,
∞ ∞
∫e ∫e
- st - st
L( t, z) = φ( t, z) d t, Ψ( s) = d P( X1 ≤ t) .证明 :
0 0
L( t, z) = (1 - Ψ( s) )/ s(1 - zΨ( s) ) .
　　 6 .29 　设 P( Xn ≤ x) = F( x) , F(0 + ) < 1 , 且 μ= E Xn < ∞ , Sn =
n
∑X
k= 1
k , { N ( t) , t≥0 }为相应的更新过程 .证明 :
Sn a .s . a .s .
N( t) a .s . 1
(1 ) lim = μ; ( 2) lim N ( t) = + ∞ ; ( 3) lim = .
n→ ∞ n t→ ∞ t→ ∞ t μ
6 .30 　同上题 , 且 D X n =σ2 < ∞ . 证明 : ＂ x ∈ R,
t
N( t) -
lim P μ = Φ( x) .
t→ ∞ - 3/ 2 1/ 2 ≤x
σμ t
第7章
随机游动与马尔可夫链
自然科学中的大量问题可归结为随机游动问题 , 例如随机游

动模型可以作为布朗运动的初步近似 , 概率论中的一些经典问题
也能引导到随机游动问题上 .事实上 , 随机游动也是第 9 章马氏链
的直观模型和向导 .本章只讨论在一维直线整数点上的随机游动
及其应用 .
7 .1 　简单随机游动
考虑 X 轴上的一个质点 , 假定它只能位于整数点 , 在时刻 t =

0 时 , 它处于初始位置 X0 = 0 , 以后每隔单位时间 , 它总受到一个
外力的随机作用 , 使位置发生变化 , 即随机地以概率 p 及概率 q =
1 - p 向右或向左移动一个单位 , 且各次移动相互独立 , 我们所关
心的是质点在时刻 t = n 时的位置 , 用这种方式描述的质点运动称
为一维直线上的简单随机游动 .
若令
1, 质点第 i 次向右移动 ,
Yi =
- 1, 质点第 i 次向左移动 ,
n
X0 = j, Xn = X0 + ∑ Y i , 则 Xn 表质点 ( 开始从 X0 出发 ) 第 n 时刻
i =1
的位置, 称{ Xn , n ≥ 0} 为 ( p, q) 随机游动, 称 Xn 的可能取值全体为

状态空间 , 记为 S .对于上述随机游动, 显然 S = {0 , ± 1 , ± 2 , …} .
关于质点在一维直线上整数点的随机游动 , 已进行过许多研
252 　第 7 章随机游动与马尔可夫链
究 , 下面我们介绍它的较简单的两个模型 .
1 　无限制随机游动
在这个模型中 , 质点可以在整个数轴的整数点上作游动 .随机

变量序列 { Xn , n≥ 0} 表示质点在不同时刻的位置 , 下面分别考虑
n = 1 , 2 , 3 , …的概率特性 .假定 X0 = 0 .
1, P( X1 = 1 ) = p,
当 n = 1 时 , 显然 X1 = Y1 =
- 1, P( X1 = - 1 ) = q;
当 n= 2 时 , 有
2 , 　 P( X2 = 2 )
= P( Y1 = 1 , Y2 = 1) = p2 ,
0 , 　 P( X2 = 0 ) = P( Y1 = 1 , Y2 = - 1 ) +
X2 = Y1 + Y2 =
　 P( Y1 = - 1 , Y2 = 1 ) = 2 pq ,
- 2 , 　 P( X2 = - 2)
= P( Y1 = - 1 , Y2 = - 1 ) = q2 .
类似地 , 当 n = 3 时 , 留作练习 .
对于任意时刻 t = n 的情况 , 为了使质点在 t = n 时位于 k ( k
也可以是负整数 ) 必须而且只需在前 n 次移动中向右移动的次数
比向左移动的次数多 k .若以 x 记它在前 n 次游动中向右游动的
n+ k
次数 , y 记向左游动的次数 , 则 x + y = n, x - y = k, 即 x = ,因
2
为 x 是整数 .所以 k 必须和 n 具有相同的奇偶性 .故当 - n≤ k≤ n
且 n - k 为偶数时 , 事件{ X n = k}发生相当于要求在前 n 次游动中
n+ k n - k
有次向右 , 次向左 , 这是 n 次伯努利实验问题 , 得
2 2
n+ k n+ k n-k
P( X n = k) = Cn 2 p 2
q2 . ( 1 .1)
而当 n 与 k 奇偶性相反时 , 概率为 0 .由 (1 .1 ) 式 , 可引出下面一条
命题 .
7 .1 简单随机游动　 253
Xn + n
命题 1 .1 　若令 S n = , 则 S n ～ B( n, p) , 即 Sn 服从参数
2
为 ( n, p) 的二项分布 .
证明留给读者 .
下面来看看一维直线随机游动在竞赛 ( 或赌博 ) 中的应用 .
设 A , B 两队 ( 人 ) 进行某种竞赛 ( 赌博 ) .每次 A 胜 ( 赢 ) 的概
率为 p, 负的概率为 q( p + q = 1) 规定若 A 胜 , 则加 1 分 ( 得一元 ) ,
否则减 1 分 ( 给 B 一元 ) , 且每次之间的胜负相互独立 , 于是上面
定义的 X n 就可以表示进行了 n 次竞赛 ( 赌博 ) 后 , A 的得分 ( 得
的钱 ) .
在上述背景下 , 我们来求 E( X n + 1 | X0 , X1 , … , Xn ) .
分两种情况讨论 :
(1 ) p = q = 1/ 2( 对称随机游动 )
此时 E Yn + 1 = p - q = 0 , 并注意到 Y n + 1 与 X0 , X1 , … , Xn 相互
独立 .于是
E( Xn+ 1 | X0 , X1 , … , X n ) = E( X n + Y n+ 1 | X0 , X1 , … , Xn )
= E( X n | X0 , X1 , … , Xn ) + E( Y n+ 1 | X0 , X1 , … , X n )
= Xn + EY n+ 1 = Xn .
由此可得
E( X n + 1 | X0 , X1 , … , X n ) = X n . ( 1 .2)
　　上式说明 , 在每次胜负 ( 输赢 ) 机会相等的情况下 , 即在公平竞
赛 ( 赌博 ) 前提下 , 在已知前 n 次结果 X 0 , X1 , … , Xn 的条件下 , 考
虑前 n + 1 次平均总得分 E( X n + 1 | X0 , X1 , … , Xn ) 等于前 n 次的总
得分 , 因此 , 满足 (1 .2 ) 式 .反映了由于公平竞争 ( 赌博 ) 所导致的
序列{ X n , n≥ 1 } 的一个特性 , 称具有 ( 1 .2 ) 式特性的随机序列为
鞅 , 鞅是近代概率论发展的最为迅速的一个重要分支 , 它已广泛用
于现代随机控制优化理论 , 离散随机信号的滤波 , 预测与通讯等工
程技术 , 经济管理以及随机微分方程等基础理论的多个领域 .
(2 ) p > q
同理可算得 E( Xn + 1 | X0 , X1 , … , X n ) = Xn + ( p - q) > Xn .
由于 p > q, 表示每次胜负机会不平等 ( 不公平赌博 ) , 那么 , 在
已知前 n 次结果 X0 , X1 , … , X n 的条件下 , 考虑前 n + 1 次平均总
得分 E( Xn + 1 | X0 , X1 , … , X n ) 必然大于前 n 次的总得分 , 这样的
竞赛 ( 赌博 ) 显然是对其中一方有利 , 所以是不公平的 .
2 　带有吸收壁的随机游动与输光的概率
如果参加赌博时 A 有资本 a 元 , B 有资本 b 元 , 规定一旦 A
赢 b 元或输光了 a 元时 , 赌博就停止 .下面我们讨论 A 最终赢的
概率是多大 ? 而 A 最终输的概率又是多大 ?
上述的输光问题可以抽象为两端带有吸收壁的随机游动 .假
定质点在时刻 t = 0 时 , 位于 X0 = n, 0 < n < a + b, 质点游动与 ( p,
q) 随机游动相同 , 每次仍以概率 p 和 q 分别向右和向左移动一位 ,
但在 0 及 a + b 处各有一个吸收壁 , 即质点一旦移动到达 0 或 a +
b, 质点永远停留在该处 .称 { X t , t≥ 0 } 为带吸收壁的随机游动 .求
质点最终在 0 被吸收的概率 .
记 T = min { t: t≥ 0 , X t = 0 或 X t = a + b} 为赌博停止时刻 ( 质
点停止游动时刻 ) , 事件 ( X T = 0 ) 表 A 最终输 ( 即质点停在 0 处 ) .
若以 pn = P( X T = 0 | X0 = n) 记质点的初始位置为 X0 = n 而随机
游动后在 0 点被吸收的条件概率 , 以 qn = P( X T = a + b) 记初始位
置为 n 在 a + b 点被吸收的概率 , 显然
pa+ b = 0 , 　 qa+ b = 1 , 　 p0 = 1 , 　 q0 = 0 , ( 1 .3)
( X0 = n, X T = 0 ) = ( X0 = n, X1 = n + 1 , X T = 0 ) ∪
( X0 = n, X1 = n - 1 , X T = 0) ,
即如果 0 时刻质点位于 X0 = n, 则它要被 0 吸收有两种方式来实
现 : 一种是接下去一次是向右而最后被 0 吸收 , 另一种是接下去
一次是向左的而最后被 0 吸收 .所以按全概率公式有
7 .1 简单随机游动　 255
pn = p・ pn + 1 + q・ pn - 1 , 　 n = 1 , 2 , … , a + b - 1 . ( 1 .4)
这样 , 我们得到了关于 p n 的一个有限差分方程 (1 .4) , 再利用边界
条件 (1 .3 ) , 就可以求得 pn , 下面我们来求解 .把 (1 .4 ) 式改写成
q( pn - pn - 1 ) = p( pn + 1 - p n ) ,
n = 1 ,2 ,…, a + b - 1 . ( 1 .5)
　　我们先就 p = q = 1/ 2 来解上面的方程 , 这相应于对称随机游
动的场合 , 这时方程成为 pn - pn - 1 = pn + 1 - pn .若设 pn + 1 - pn =
p n - p n - 1 = … = p1 - p0 = c, 这里 c 是常数 .由此可得 pn = p0 + nc .
因为 p0 = 1 , p a + b = 0 , 故有
n
p0 - pn = . ( 1 .6)
a+ b
　　因此从 X0 = a 出发而在 0 被吸收的概率为
a = b .
pa = 1 - ( 1 .7)
a+ b a+ b
同理可求得在对称随机游动场合 , 从 X0 = a 出发而在 a + b 被吸
收的概率为
a
qa = . ( 1 .8)
a+ b
注意到 p a + qa = 1 , 即得质点最终一定要被吸收 .
在一般情形 , 即 p≠ q 时 , 由 (1 .5 ) 式及 p0 = 1 得
n
q q
( pn + 1 - pn ) = ( Pn - pn - 1 ) = ( p1 - 1 ) ,
p p
n = 0, 1, 2, …, a + b - 1 . ( 1 .9)
又因
a+ b - 1 a+ b - 1 n
q
pa + b - p n = ∑(p
k= n
k+ 1 - pk ) = ∑
k= n p
( p1 - 1 )
n a+ b
q q
-
p p
= ( p1 - 1 ) ,
q
1 -
p
由 (1 .3 ) 式有 pa + b = 0 , 故
n a+ b
q q
-
p p
p n = ( 1 - p1 ) , (1 .1 0)
1 - q
p
因 p0 = 1 , 故
a+ b
q
1 -
p
1 = ( 1 - p1 ) , (1 .1 1)
1 - q
p
由 (1 .1 0) 及 (1 .1 1) 式立即得到
n a+ b
q q
-
p p
pn = a+ b ,
q
1 -
p
因此 , 质点从 X0 = a 出发 , 在 0 被吸收的概率为
a a+ b b
q q p
- 1 -
p p q
pa = a+ b
= . (1 .1 2)
q p a+ b
1 - 1 -
p q
　　用同样的方法可以求得从 X0 = a 出发 , 而在 a + b 被吸收的
概率为
a
q
1 -
p
qa = . (1 .1 3)
q a+ b
1 -
p
注意到 pa + qa = 1 , 因此质点最后一定要被吸收掉 .
另外 , 表达式 ( 1 .12 ) 及 ( 1 .13 ) 在 p = q = 1/ 2 时没有意义 , 这
时解为 (1 .7 ) 及 ( 1 .8) 式 , 但是 ( 1 .7) 及 ( 1 .8 ) 式也可以从 ( 1 .12 ) 及
(1 .1 3) 式中令 p→ q 并利用洛必达 ( L’H ospital ) 法则得到 .
这样 , 我们在这部分开头所提出的问题就得到了解决 .赌博过
程中 A 的钱增加和减少时对应于质点向右和向左随机游动 , A 最
7 .2 首达时间的分布及其数学期望　 257
终赢得赌博对应于质点被吸收壁 x = a + b 吸收 , 所以 A 赢的概率
为 qa , 而 A 输的概率为 p a .
7 .2 　首达时间的分布及其数学期望
接下来 , 让我们继续讨论在无限制随机游动中经常要用到的

首达时间问题 .
考虑一维直线随机游动中的首次通过时间 ( 首达时间 ) 的分布
及其数学期望 .首先让我们先来看何为首达时间 .
设{ Xn , n ≥ 0 } 为 ( p, q) 随机游动 , 不妨设 X0 = 0 .令 T0 b =
min{ n, n≥0, X0 = 0 , Xn = b} , 其中 b 为整数 ( b≠0, b > 0) .若{ n: n≥0 ,
X0 = 0, Xn = b} = , 取 T0 b = + ∞ , 则 T0 b 表示质点零时刻从原点出
发, 首次到达 b 的首达时间 .记 T00 = min{ n: n > 0 , X0 = 0 , Xn = 0} 为
首次返回 0 点的时间 .
1 　 T01 的分布及数学期望
(1 ) 两种极端情形
当 p = 1 , q = 0 时 , 显然 P( T0 1 = 1 | X0 = 0) = 1 , 且 E T01 = 1 ;
当 p = 0, q = 1 时 , 显然对于任意的 i 满足 i∈ 瓔 \ { 0} , 有
P( T01 = i | X0 = 0 ) = 0 , 于是对＂ n∈瓔 \ { 0} , P( T01 ≤ n| X0 = 0 ) =
∞
0 , P( T01 > n| X0 = 0) = 1 .又 ( T01 = ∞ ) = n∩ ( T01 > n) 且 ( T01 > n +

= 1
1) ( T01 > n) , 故 ( T01 = ∞ ) = nlim ( T01 > n) .由概率连续性 , 有

→∞
P( T01 = ∞ | X0 = 0) = P lim ( T01 > n) | X0 = 0

n→ ∞
= n→
lim P( T01 > n | X0 = 0 ) = 1 ,
∞
故 E( T0 1 | X0 = 0) = + ∞ .
(2 ) 一般情形
设 0 < p < 1 , 先求 T01 的分布律 .易知 P( T01 = 1 | X0 = 0 ) = p,
P( T01 = 2 n | X0 = 0) = 0 .以下只需讨论 P( T01 = 2 n + 1 | X0 = 0) 的

情形 .显然 ( T0 1 = 2 n + 1 ) 发生的必要条件是在 2 n + 1 次游动中 , 恰
有 n + 1 次向右游动 , n 次向左游动 , 因此 , 可设
n+ 1 n n
P( T01 = 2 n + 1 | X0 = 0 ) = an p q = an p ( pq) , 　　
( 2 .1)
其中 an 表从原点出发在 2 n + 1 时刻首次到达 1 的所有可能的不
同路径的数目 .显然 , a0 = 1 , a1 = 1 , 为求 an ( n≥2) 可以有不同的方
法 .这里只讨论用母函数的方法 .为此 , 我们先利用事件的分解导
出 an 的关系式 , 然后导出其母函数所满足的方程 .将求出的表达
式再展成 n 的级数形式 , 即可求出 an , 求解过程如下 .
① 求出 an 的关系式
令 X′ n = Xn + 1 , T′
- 10 = min { n, n > 0 , X′
0 = - 1 , X′
n = 0 } = min
{ n, n > 0 , X1 = - 1 , X n + 1 = 0 } , T′- 10 表示对 X′ n = Xn + 1 而言质点
从 - 1 点出发 , 首次到达 0 点的首达时间 .令 X ″
n = X′
T′
- 10
+ n ,
T″
0 1 = min{ n, n > 0 , X″
0 = 0 , X″ 0 1 可表示对 X ″
n = 1 } , T″ n 而言质点
从 0 点出发 , 首次到达 1 点的首达时间 .

可以证明 , T01 , T′ 0 1 ( 条件 ) 独立 , 且同分布 ( 此处留给读
- 1 0 , T″
者思考 ) .注意到 , 当 n≥1 时 , 有如下事件分解 :

n- 1
( T01 = 2 n + 1 ) = k∪ { X0 = 0 , X1 = - 1 , T′
- 10 = 2 k + 1 ,
= 0
T″
01 = 2 n - ( 2 k + 1) } ,
即质点必须先从 0 点游动一步到 - 1 点 , 再经过 2 k + 1 步从 - 1 点

首达 0 点 , 最后再经 2 n - ( 2 k + 1) 步首达 1 点 , 然后对 0≤ k≤ n - 1
求并 .又注意到{ X n , n≥ 0} 具有无后效性 , 即＂ i, j∈瓔 \ { 0} .容易
证明 P( X n + 1 = j | X0 , X1 , … , X n = i ) = P( Xn + 1 = j | X n = i ) , 我
们有
P( T0 1 = 2n + 1 | X0 = 0)
n- 1
= ∑ P( X1 = - 1 | X0 = 0) P( T′
- 10 = 2k + 1 | X0 = 0, X1 = 1)・
k= 0
　　 P( T″
- 10 = 2( n - k - 1) + 1 | X0 = 0,…, X2 k+ 2 = 0)
n- 1
　 = ∑ qP( T′
k=0
- 10 = 2k+ 1 | X′
0 = - 1)・
　　 P( T″
01 = 2( n - k - 1) + 1 | X″
0 = 0) ,
故
n- 1
P( T01 = 2 n + 1 | X0 = 0) = ∑ qP( T
k= 0
01 = 2 k + 1 | X0 = 0 ) ・
P( T0 1 = 2( n - k - 1 ) + 1 | X0 = 0) , ( 2 .2)
将 (2 .1 ) 式代入 ( 2 .2) 式 , 化简得
a0 = 1 ,
n- 1 ( 2 .3)
an = ∑aa
k= 0
k n- k -1 , 　　 n≥1 .
　　 ② 求 an
∞
∑ an x (0 ≤
n
设{ an , n ≥ 0 } 的生成函数 ( 母函数 ) 为 A( x) =
n= 0
n
x ≤ 1 ) .对 (2 .3 ) 式两边同乘以 x , 再对 n ≥ 1 求和 , 即可得到 ( 详
细的计算请读者自己完成 ) :
2
x[ A( x ) ] - A( x ) + 1 = 0 , ( 2 .4)
解 ( 2 .4 ) 式 , 并考虑到 A ( x ) 为 x 的单调增函数 ( 请读者补出证
明) , 有
1 - 1 - 4x
A( x ) = , ( 2 .5)
2x
∞
1
∑
n n
将 (2 .5 ) 式展开成幂级数 , 则有 A( x ) = C2 n x , 即得
n= 0 n+1
1
an = C2n n , 故得到 T01 的分布率为
n+1
1 C2n n p ( pq) n , 　　 n ∈ 瓔 \ { 0} .
P( T01 = 2 n + 1 | X0 = 0) =
n+1
( 2 .6)
由以上的结果 , 我们可以知道 : 当 p≥ q 时 , P( T01 < ∞ | X0 = 0) =

1 .事实上
∞
P( T0 1 < ∞ | X0 = 0 ) = P n∪ ( T0 1 = 2 n + 1) | X0 = 0
= 0
= ∑ P( T01 = 2 n + 1 | X0 = 0 )
n= 0
= ∑ an p ( pq) = pA ( pq)
n
n= 0
2
( p + q) - ( p + q) - 4 pq
=p
2 pq
p + q - ( p - q)
=p = 1 .
2 pq
当 p < q 时 , 可得
p + q - ( q - p) p
P( T01 < ∞ | X0 = 0) = p = < 1
2 pq q
p
P( T0 1 = ∞ | X0 = 0) = 1 - > 0
q
E( T01 | X0 = 0 ) = + ∞ .
此时 T0 1 不是几乎处处有限的随机变量 !
1, p ≥ q,
P( T01 < ∞ | X0 = 0) = ( 2 .7)
p/ q, p < q.
求出了 T0 1 的分布律 , 即可求出其期望值 .仅把结果列在下面 :
1
, p > q,
E( T0 1 | X0 = 0) = p - q ( 2 .8)
+ ∞, p≤ q.
详细的推导留给读者作为练习 .( 提示 : 利用期望的定义及 A( x )
的关系式 .)
2 　 T0 b ( b ≥2 ) 的分布及期望
先来分析 T0 2 , 对于 T02 的分布 , 可以类似于 T0 1 的分布律的方

法求之 .但若用如下随机变量分解的方法 , 则更简洁 .
令 X′
n = XT
01
+ n , T′
1 2 = min{ n, n > 0 , X′ n = 2 } , 容易证明
0 = 1 , X′
T0 1 与 T′
1 2 条件独立且同分布 .又注意到 T02 = T0 1 + 12 , 故
T′
2
, p > q,
E( T02 | X0 = 0) = 2 E( T0 1 | X0 = 0 ) = p - q
+ ∞, p≤ q .
令
n+ 1
P( T02 = 2 n + 2 | X0 = 0 ) = bn ( pq) ,
∞
∑b
n
B( x ) = n x , 　　0≤ x≤1 .
n= 0
易知 B( x ) = [ A( x) ] , 再利用上面的结果 , 有
2
2
1 - 1 - 4x = 1 - 2 x - 2 1 - 4x ,
2
B( x) = [ A( x) ] =
2x 2x
∞
1 C2n n++1 2 xn , 故有 bn =
将 B( x ) 级数展开 , 得 B( x) = ∑
n= 0 n+ 2
1 n +1
C2 n + 2 , 即有
n+2
1 n+ 1 n +1
P( T02 = 2 n + 2 | X0 = 0) = C2 n + 2 ( pq) . ( 2 .9)
n+ 2
对于 T0 b ( b > 2 ) 的情况 , 可仿照 T0 2 的变量分解方法 , 类似进行
处理 .
3 　 T00 的分布及期望
由 T0 0 = min{ n: n > 0 , X0 = 0 , X n = 0 }表示 ( 从 0 点出发 ) 首次

返回 0 点的时间 ( 简称为首次返回 0 点的时间 ) .求 T0 0 的分布及期
望有许多不同方法 , 这里利用上述 T0 1 的结果来求解 .记 T′
10 =
min{ n: n > 0 , X1 = 1 , X1 + n = 0 } , T - 1 0 = min { n: n > 0 , X1 = - 1 ,

X1 + n = 0} .显然
10 = 2 n - 1) ∪
( X0 = 0 , T00 = 2 n) = ( X0 = 0 , X1 = 1 , T′
( X0 = 0 , X1 = - 1 , T - 10 = 2 n - 1 ) ;
得 P( T00 = 2 n | X0 = 0 ) = p P( T′
10 = 2 n - 1 | X1 = 1 ) + qP ( T - 10 =
2 n - 1 | X1 = - 1 ) , 故
n n
P( T0 0 = 2 n | X0 = 0 ) = C2 n ( pq) . (2 .1 0)
由
( X0 = 0 , T00 < ∞ ) = ( X0 = 0 , X1 = 1 , T′
10 < ∞ ) ∪
( X0 = 0 , X1 = - 1 , T - 1 0 < ∞ ) ,
有
P( T00 < ∞ | X0 = 0 ) = pP ( T′
1 0 < ∞ | X1 = 1 ) +
qP ( T - 1 0 < ∞ | X1 = - 1 ) .
若 p = q = 1/ 2 , 由 (2 .7 ) 式而知 P( T00 < ∞ | X0 = 0) = p + q = 1; 若
p < q, 由 ( 2 . 7 ) 式 , P ( T′
10 < ∞ | X1 = 1 ) = 1 , P ( T - 1 0 < ∞ |
X1 = - 1) = p/ q, 得 P( T00 < ∞ | X0 = 0) = 2 p < 1; 若 p > q, 类似可

得 P( T00 < ∞ | X0 = 0) = 2 q < 1 .综上可得
1, p = q = 1/ 2 ,
P( T00 < ∞ | X0 = 0) = 2 p, p < q, (2 .1 1)
2 q, p > q.
由 E( T00 | X0 = 0 ) = pE ( T′
1 0 | X1 = 1 ) + qE ( T - 10 | X1 = - 1) 及
(2． 8 ) 式易知 , 对于任意 ( p, q) 随机游动 , 均有
E( T00 | X0 = 0 ) = ∞ . (2 .1 2)
　　以上讨论一维直线上随机游动的两种特殊情况 .由于应用与
理论的需要 , 以下讨论更为一般的随机游动 , 这就是以下几节要讨
论的马尔可夫链的定义、性质及简单应用 .
7 .3 马尔可夫链定义与例子　 263
7 .3 　马尔可夫链定义与例子
本章以下几节讨论离散参数 T = {0 , 1 , 2 , …} = 瓔 , 状态空间
S = { 1 , 2 , … }可列的马尔可夫过程 , 通常称为马尔可夫链 ( Markov
chains ) , 简称马氏链 ( M .C .) .马氏链最初由马尔可夫于 1906 年
研究而得名 .至今它的理论已发展得较为系统和深入 , 它在自然科
学 , 工程技术及经济管理各领域中都有广泛的应用 .
定义 3 .1 　随机序列{ X n , n≥ 0}称为马尔可夫链 , 如果对任意
i0 , i1 , … , in , in + 1 ∈ S, n∈ 瓔及 P( X0 = i0 , X1 = i1 , … , Xn = in ) >
0, 有
P( X n + 1 = in + 1 | X0 = i0 , X1 = i1 , … , Xn = in )
= P( X n + 1 = in + 1 | Xn = in ) . ( 3 .1)
(3 .1 ) 式刻画了马氏链的特性 , 称为马尔可夫性 ( 或无后效性 ) , 简
称马氏性 .
定义 3 .2 　＂ i, j∈ S, 称 P( X n + 1 = j | Xn = i) = p ij ( n) 为 n 时
刻的一步转移概率 .若对＂ i, j∈ S , p ij ( n) ≡ pi j 与 n 无关 , 则称
{ X n , n≥ 0}为齐次马氏链 .记 P = ( p i j ) , 称 P 为{ X n , n≥ 0 }的一步
转移概率矩阵 , 简称为转移矩阵 ( t ransition m atri x) .
本章仅限于讨论齐次马氏链 .
为直观理解马氏性的意义 , 设想一质点在一直线上的整数点
上作随机运动 .以 X n 表示该质点在时刻 n 的位置 .( X n = i) 表示质
点在时刻 n 处在 i 状态 ( 位置 ) 这一随机事件 .如果把时刻 n 看作
“现在”, 时刻 0 , 1 , … , n - 1 表示“ 过去”, 时刻 n + 1 表示“ 将来”,
那么 ( 1 .1 ) 式表明在已知过去 X0 = i1 , … , X n - 1 = in - 1 及现在
Xn = in 的条件下 , 质点在将来时刻 n + 1 处于状态 in + 1 ( 移动到 in + 1
位置 ) 的条件概率 , 只依赖于现在发生的事件 ( X n = in ) , 而与过去
历史曾发生过什么事件无关 .简言之 , 在已知“现在”的条件下“
, 将
来”与“ 过去”是独立的 .p i j ( n) 表示质点在时刻 n 由状态 i 出发 , 于

时刻 n + 1 转移到状态 j 的条件概率 .而齐次性: pi j ( n) = pi j 表示此
转移概率与时刻 n 无关 .
例 3 .1 　独立随机变量和的序列
设 { Y n , n ≥ 0 } 为独立同分布随机变量序列 .且 Y n 取值为非负
∞
整数 , P{ Y n = i} = ai ( ai ≥ 0 ) , 且 ∑ ai = 1 .令 X0 = 0 , X n =
i= 1
n
∑Y
i=1
i , 则易证{ Xn , n ≥ 0 } 是一马氏链 , 且
aj - i , j ≥ i,
p ij =
0, j < i.
显然{ Y n , n≥ 0}本身也是一马氏链 .
例 3 .2 　直线上的随机游动
在前两节 , 讨论了一维直线整数点上随机游动的两种最为常
见的模型 , 以下讨论一些更为一般的模型 .
(1 ) 无限制的随机游动
设有一质点在数轴上随机游动 , 每隔一单位时间 Δt ( 设 Δt =
1) 移动一次 , 每次只能向左或向右移动 Δx 单位 ( 设 Δx = 1) , 或原
地不动 .设质点在 0 时刻的位置为 a, 它向右移动的概率为 p≥ 0 ,
向左移动的概率为 q≥ 0 , 原地不动的概率为 r≥ 0 ( p + q + r = 1 ) ,
且各次移动相互独立 , 以 X n 表示质点经 n 次移动后所处的位置 .
称{ X n , n≥ 0 } 为 ( p, r, q) 随机游动 , 则 { X n , n≥0 } 是一马氏链 , 且
p i, i + 1 = p, p i, i - 1 = q, p ii = r, 其余 p i j = 0 .
(2 ) 带吸收壁的随机游动
设 (1 ) 中的随机游动限制在 S = { 0 , 1 , 2 , … , b} 内 , 当质点移动
到状态 0 或 b 后就永远停留在该位置 , 即 p0 0 = 1 , pbb = 1 , 其余 pi j
(1 ≤ i, j≤ b - 1) 同 (1 ) .这时序列 { Xn , n≥ 0 } 称为带两个吸收壁 0
和 b 的随机游动 , 是一有限状态马氏链 .
(3 ) 带反射壁的随机游动
如 (2 ) 中的质点到达 0 或 b 后 , 下一次移动必返回到 1 或 b -
1 , 即 p0 1 = 1 , pb, b - 1 = 1 , p0 j = 0 ( j≠ 1 ) , pbj = 0 ( j≠ b - 1 ) , 其余同
(1 ) .称此 { X n , n≥ 0 } 为带反射壁 0 和 b 的随机游动 , 则 { X n , n≥
0} 是一马氏链 .
(4 ) 艾伦费斯特 ( Ehrenfest ) 模型
这是一个著名的粒子通过薄膜进行扩散过程的数学模型 , 即
一质点在状态空间 S = { - a, - a + 1 , … , - 1 , 0 , 1 , 2 , … , a}中作随
机游动 , 且带有两个反射壁 a 和 - a, 其一步转移概率是
1 1+ i 1 1- i
pi , i - 1 = , pi, i + 1 = , - a+ 1 ≤ i≤ a - 1,
2 a 2 a
pa, a - 1 = 1, p- a, - a+ 1 = 1,
pi j = 0 , 其他 .
　　由上可看出 , 当质点位置 i < 0 , 即在原点左边时 , pi , i - 1 < 1/ 2 ,
p i, i + 1 > 1/ 2 , 此时质点下一步向右移动比向左移动的概率大 , 且与
离原点的距离成正比 .反之亦然 .当质点在原点时 , 向左向右的概
率相等 .这样的随机游动可作如下两种解释 .
(1 ) 考虑一容器内有 2 a 个粒子作随机游动 .设想一个薄膜
( 界面 ) 将容器分为相等的左、右两部分 A 和 B .如用 X n 表示 n 时
刻 B 内的粒子数与 A 内粒子数之差 , 并假定每次移动只有两种
可能 , 一粒子从左到右或一粒子从右到左 ( 即同一时刻有两个或两
个以上粒子移动的概率为 0 , 当 Δt→ 0 时作这种假设是合理的 ) ,
则 { X n , n≥ 0}可用上述模型来描述 .
(2 ) 设一粒子受一“ 弹簧力”作用 , 在直线上作随机游动 , 当粒
子偏离原点时 , 受到一附加的与偏离距离成正比且指向原点的力
的作用 , 从而使向原点移动的概率增大 .用 Xn 表示粒子在时刻 n
的位置 , 则同样可用上述模型来描述 .
例 3 .3 　排队模型
(1 ) 离散排队系统
考虑顾客到达一服务台排队等待服务的情况 .若服务台前至
少有一顾客等待 , 则在一单位时间周期内 , 服务员完成一个顾客的
服务后 , 该顾客立即离去 ; 若服务台前没有顾客 , 则服务员空闲 .
在一个服务周期内 , 顾客可以到达 , 设第 n 个周期到达的顾客数ξn
是一个取值为非负整数的随机变量 , 且 {ξn , n≥1 } 独立同分布 .在
每个周期开始时系统的状态定义为服务台前等待服务的顾客数 .
若现在状态为 i, 则下周期的状态 j 应为
( i - 1 ) + ξ, i ≥ 1,
j =
ξ, i = 0,
其中ξ为该周期内到达的顾客数 .记第 n 周期开始的顾客数为 X n ,
+ +
则 X n + 1 = ( X n - 1 ) +ξn , 这里 a = max ( a, 0 ) .根据马氏链的定
义 , 容易证明 { X n , n ≥ 0} 是一个马氏链 .若设 P{ξn = k} = ak
∞
( ak ≥ 0 ) 且 ∑ ak = 1 , 则 { X n , n ≥ 0} 的转移概率为
k=0
p0 j = aj , j ≥ 0,
p1 j = aj , j ≥ 0,
p ij = aj+ 1 - i , i > 1, 　 j ≥ i - 1,
p ij = 0 , i > 1, 　 j < i - 1 .
∞
直观上 , 若 Eξn = ∑ ka
k= 0
k > 1 , 则当 n充分大后 , 等待顾客的队长将
无限增大 ; 若 Eξn < 1 , 则等待服务的顾客队长趋于某种平衡 .

(2 ) G/ M/ 1 排队系统
G 表示顾客到达服务台的时间间隔 , 假设为独立同分布 , 分布
函数为 G( x) ; M 表示服务时间 , 假设为独立同指数分布 ( 设参数
为 μ) , 且与顾客到达过程相互独立 ;1 表示单个服务员 .
记 X n 表示第 n 个顾客到达服务台时系统内的顾客数 ( 包括该
顾客 ) , Tn 表示第 n 个顾客到达时刻 .易证{ Xn , n≥ 1 }为一马氏链 .
为计算它的一步转移概率矩阵 , 令 A = { Xn = i, X n + 1 = i + 1 - j} =
{ X n = i, 在 ( Tn , Tn + 1 ) 上服务完 j 个顾客} ( i≥0 , 0≤ j≤ i) 而 P{ 在
- μt j
(0 , t] 上服务完 j 个顾客} = e (μt ) / j !, 于是
+∞
P( A | Xn = i) = ∫ 0
P( A | X n = i, T n + 1 - Tn = t) d G( t)
∞
∫
- 1 - μt j
= ( j !) e (μt ) d G( t) ,
0
得
∞
∫e
- μt
(μt ) j d G( t) 　 ( i ≥ 0 , 0 ≤ j ≤ i) .
-1
pi , i + 1 - j = ( j !)
0
而 p i0 是服务员由 i 个顾客转为空闲的概率 , 易知
∞ ∞
∑∫ ( k !) e - μt (μt) k d G( t) , 　　 i ≥ 0 .
-1
pi , 0 =
k = i +1 0
　　例 3 .4 　离散分支过程
考虑某一群体 , 假定某一代的每一个个体可以产生 ξ个下一
代个体 , 其中 ξ是取值为非负整数的离散随机变量 , P{ξ= k} =
∞
ak ≥ 0( k ≥ 0) , ∑ ak = 1 , 设某一代各个体产生下一代的个数相
k= 0
互独立同分布且与上代相互独立 .记 X n 表示第 n 代个体的数目 ,

则当 X n = 0 时 , 有 X n + 1 = 0; 当 X n > 0 时 , 有 Xn + 1 = ξ1 +ξ2 + …
+ ξX n , 其中 ξi 是第 n 代中第 i 个个体产生的下一代的个数 .由此可
知 , 只要给定 Xn , 那么 Xn + 1 的分布就完全决定了 , 且与以前的
Xn - 1 , X n - 2 , … 无关 , 故{ X n , n ≥ 1 } 是一马氏链 , 其转移概率请读
者自己写出 .
下面的定理提供了一个非常有用的获得马尔可夫链的方法 ,
并可用于检验一随机过程是否为马尔可夫链 , 读者可以用前面的
有关例子验证 .
定理 3 .1 　设随机过程 { Xn , n≥0} 满足 :
(1 ) Xn = f ( X n - 1 ,ξn ) ( n≥ 0 ) , 其中 f : S× S → S,ξn 取值在
S 上;
(2 ) {ξn , n≥1 } 为独立同分布随机变量 , X0 与 {ξn , n≥ 1 } 也相

互独立 .
则{ X n , n≥ 0}是马尔可夫链 , 其一步转移概率为
p ij = P( f ( i,ξ1 ) = j) .
　　证明留给读者作为练习 .
7 .4 　转移概率矩阵
设{ X n , n≥ 0 } 为马氏链 , P = ( pi j ) , 其中 p i j = P { X n + 1 = j |
Xn = i}是一步转移概率 .显然
p ij ≥ 0 , 　　 i, j ∈ S; 　　 ∑ p i j = 1 , 　　 i ∈ S .
j∈ S
　　定义 4 .1 　称矩阵 A = ( ai j ) S× S 为随机矩阵 , 若 ai j ≥ 0( i, j ∈
S) ; 且对＂ i ∈ S, 有 ∑ a i j = 1 .
j∈ S
显然 , P = ( pi j ) 是一随机矩阵 .
记
πi ( n) = P( Xn = i) , 　　 π( n) = (π1 ( n) ,π2 ( n) , … ,πi ( n) , … ) ,
π( n) 表示 n 时刻 X n 的概率分布向量 .称{πi (0 ) , i∈ S} 为马氏链的
初始分布 .下面 , 我们将看到一个马氏链的特性完全由它的一步转
移概率矩阵 P 及初始分布向量π(0 ) 决定 .
首先 , 对任意 i0 , i1 , … , in ∈ S , 我们计算有限维联合分布
P( X0 = i0 , X1 = i1 , … , Xn = in ) .由概率的乘法公式及马氏性可知
P( X0 = i0 , X1 = i1 , … , X n = in )
= P( X0 = i0 ) P( X1 = i1 | X0 = i0 ) ・
P( X2 = i2 | X0 = i0 , X1 = i1 ) …
P( Xn = in | X0 = i0 , … , X n - 1 = in - 1 )
= P( X0 = i0 ) P( X1 = i1 | X0 = i0 ) ・
P( X2 = i2 | X1 = i1 ) … P( X n = in | Xn - 1 = in - 1 )
=πi0 ( 0) p i0 i1 p i1 i2 … pi n - 1 i n
7 .4 转移概率矩阵　 269
故
P( X0 = i0 , X1 = i1 , … , Xn = in ) = πi0 ( 0) p i0 i1 p i1 i2 … P in - 1 in ,
即 P( X0 = i0 , X1 = i1 , … , Xn = in ) 完全由 π(0 ) 及 P 决定 .
类似可以证明任意 n 个时刻的联合分布也完全由 π( 0 ) 及 P
决定 .
其次 , 有以下定理 .
定理 4 .1
π( n + 1 ) = π( n) P ( 4 .1)
π( n) = π(0 ) Pn ( 4 .2)
n
其中 P 是 P 的 n 次幂 .
证明　先对事件进行分解 ( X n + 1 = j ) = i∈
∪S ( X n = i, X n + 1 = j ) .
因为当 i≠ k 时 , ( X n = i) ∩ ( Xn = k) = ,故
P( X n + 1 = j) = ∑ P( X
i∈ S
n = i, Xn + 1 = j )
= ∑ P ( X n = i) P( Xn + 1 = j | Xn = i)
i∈ S
= ∑πi ( n) pij .
i∈ S
写成向量形式即得 π( n + 1 ) = π( n) P, 重复利用 ( 4 .1 ) 式即得
(4． 2 ) 式 .
(4 .2 ) 式表明任一时刻分布由 π( 0) 及 P 完全决定 .这些事实
表明 , 马氏链{ Xn , n≥0 }的概率性质完全由 π( 0 ) 与 P 的代数性质
决定 .
( m)
为了下述定理的书写方便 , 记 pij = P( X n + m = j | Xn = i) 为 m
( m) ( m)
步转移概率 ; P = ( p ij ) 为 m 步转移概率矩阵 .
定理 4 .2 　 ( 查普曼 ( Chapman ) －柯尔莫哥洛夫方程 )
∑p
( m+ n ) ( m) ( n)
p ij = ik p kj ( 4 .3)
k∈ S
( m+ n) m+ n m n ( m) ( n)
或 P = P = P P = P P . ( 4 .4)
　　证明　因 ( X0 = i, Xn + m = j) = k∈
∪S ( X0 = i, X m = k, X n + m = j) 故
P( Xn+ m = j | X0 = i) = ∑ P( X0 = i, Xm = k,
k∈ S
Xn + m = j)/ P( X0 = i)
= ∑ P( Xm = k | X0 = i) ・
k∈ S
P( X n + m = j | X0 = i, X m = k)
= ∑ p ik P ( X n+ m = j | X m = k)
( m)
k∈ S
( 由马氏性 ) = ∑ p ik p kj ,
( m) ( n)
k∈ S
即
p(ij m+ n) = ∑p
( m)
ik p (kjn) ,
k∈ S
写成向量形式即
( m+ n) ( m) ( n)
P = P P .
(1) ( 2) 2
再注意到 P = P, 将 m = n = 1 代入上式得 P = P P = P .从而得
到 (4 .3 ) 式及 ( 4 .4) 式 .
由上可知 , 一个马氏链运动规律的概率特性取决于它的转移
概率矩阵特性 .这样 , 研究前者就可以转化为研究后者 .( 4 .4 ) 式
简称 C －K 方程 .显然 P( m) = ( p(ij m) ) 是一随机矩阵 .
7 .5 　状态的分类
这一节我们将对马氏链的状态按其概率特性进行分类 , 并讨

论这些分类的判断准则 .
例 5 .1 　设系统有 3 种可能状态 S = { 1 , 2 , 3 } “
. 1”表示系统
运行良好“
, 2”表示运行正常“
, 3”表示系统失效 .以 X n 表示系统在
时刻 n 的状态 , 并设{ X n , n≥0 }是一马氏链 .在没有维修及更换条
件下 , 其自然转移概率为
7 .5 状态的分类　 271
17 2 1
20 20 20
P= 9 1 .
0
10 10
0 0 1
　　由 P 可以看出 , 从“ 1”或“2”状态出发经有限次转移后总要到
达“3”状态 , 而一旦到达“3”则永远停在“ 3”.显然状态“ 1”“
, 2”与状
态“3”概率性质不同 .由此我们引入如下定义
定义 5 .1 　称状态 i 为吸收态 , 若 p i i = 1 .对 i, j∈ S , 若存在
( n)
n∈ \ {0 } , 使 pi j > 0 , 称自状态 i 出发可达状态 j , 记为 i→ j .如果
i→ j 且 j→ i, 则称 i, j 相通 , 记为 i＼ j .若一马氏链的任意两个状
都相通 , 则称为不可约链 .
定义 5 .2 　首达时间为
Ti j = min{ n: n ≥ 1 , X n = j, X0 = i } .
　　若右边为空集 , 则令 Ti j = ∞ .Ti j 表示从 i 出发首次到达 j 的
时间 ; Ti i 表示从 i 出发首次回到 i 的时间 .
定义 5 .3 　首达概率为
( n)
f ij = P( T ij = n | X0 = i)
= P( Xn = j, X k ≠ j , 1 ≤ k ≤ n - 1 | X0 = i) .
∞
　　 f 表示从 i 出发经 n 步首次到达 j 的概率 .而 f ij = ∑f

( n) ( n)
ij ij
n= 1
表示由 i 出发经有限步终于到达 j 的概率 .

定义 5 .4 　若 f ii = 1 , 称 i 为常返状态 ; 若 f i i < 1 , 称 i 为非常
返状态 ( 或称为瞬时态 ) .
当 f i i = 1 时 , { f (i in) , n≥1 }是一概率分布 , 有以下定义 .
∞
∑ n f i i , 则 μi 表示从 i 出发
( n)
定义 5 .5 　如果 f i i = 1 , 记 μi =
n=1
再回到 i的平均回转时间 . 若μi < ∞ , 称 i 为正常返态 ; 若μi = ∞ ,

称 i 为零常返态 .
定义 5 .6 　如果集合{ n: n≥ 1 , p(i in) > 0 }≠ , 称该数集的最大

公约数 d ( i ) 为状态 i 的周期 .若 d ( i ) > 1 称 i 为周期的 ; 若
d( i) = 1 , 称 i为非周期的 .例如在 7． 1 节的无限制随机游动中 , 当
( n)
r = 0 , 0 < p < 1 时 , S = { … , - 1 , 0 , 1 , 2 , …} , { n: n≥ 1 , p00 > 0 } =
{2 , 4 , 6 , …} , 即状态 0 的 d( 0) = 2 , 也就是说从 0 状态出发须经 2
的整数倍次游动才能回到 0 状态 , 故它是周期的 , 且周期为 2 .当
p , q, r > 0 且 p + q + r = 1 时 , { n: n≥ 1 , p0( 0n) > 0 } = { 1 , 2 , 3 , … } ,
d(0 ) = 1 , 故此时 0 状态是非周期的 .
定义 5 .7 　若状态 i 为正常返的且非周期的 , 则称 i 为遍历
状态 .
例 5 .2 　设马氏链的 S = { 1 , 2 , 3 , 4} , 转移概率矩阵为
1 1
0 0
2 2
1 0 0 0
P= 1 2 ,
0 0
3 3
1 1
0 0
2 2
该链各状态的转移如图 7 －1 所示 .
图　 7－1
( n) ( 1) 2 ( n)
　　因此 f 44 = 0 ( n≥ 1 ) , 所以 f4 4 = 0 < 1; f3 3 = , f33 = 0
3
2
( n≥2 ) , 所以 f33 = < 1 .故状态 4 和 3 非常返 ; 由
3
7 .5 状态的分类　 273
∞
1 1
∑
(1) ( 2) ( n)
f11 = f 11 + f 11 = 1; 　 f2 2 = f 22 = 0 + + + … = 1;
n= 1 2 4
∞
μ1 = ∑nf = 1 × 1 + 2 × 1 = 3 < ∞;
( n)
11
n=1 2 2 2
∞
1 1
∑ nf
( n)
μ2 = 22 = 1×0 + 2× + … + n・ n - 1 + … = 3 < ∞ .
n= 1 2 2
故状态 1 和 2 都是正常返的 , 且易知它们是非周期的 , 从而是遍历
状态 .
下面讨论各类状态的若干性质以及如何利用转移概率矩阵 P
来判断是否为常返状态 .
p(ijn) 与 f (i jn) 有以下关系 .
定理 5 .1 　对＂ i, j∈ S, n≥1 , 有
n
∑
( n) ( l) ( n - l)
　　 (1 ) p ij = fij p jj , ( 5 .1)
l =1
∑p
( n) ( n - 1)
　　 (2 ) f ij = ik f kj I { n > 1′} + pi j I { n = 1 } , ( 5 .2)
k≠ j
　　 (3 ) i → j f i j > 0; 　 i＼ j fi j > 0 , 且 fj i > 0 .

　　证明　 (1 ) 因为
∞
{ X0 = i, Xn = j} = { X0 = i, X n = j} ∩ ∪ ( T ij = l)
l= 1
= l∪ ( X0 = i, Xn = j, T ij = l) .
= 1
于是
n
P( X0 = i) P( X n = j | X0 = i) = ∑ P( X
l =1
0 = i) ・
P( Tij = l | X0 = i) P( X n = j | X0 = i, T ij = l) ,
因此
n
P( Xn = j | X0 = i) = ∑ P( Ti j = l | X0 = i) ・
l= 1
P( Xn = j | X0 = i, Xk ≠ j,
1 ≤ k ≤ l - 1 , Xl = j) ,
n
= ∑ f (ijl ) P ( X n = j | X l = j ) ( 马氏性 )
l= 1
= ∑ f ij p j j
( l) ( n - l)
,
l= 1
即
n
∑f
( n) ( l)
p ij = ij p(j jn - l) ,
l =1
(2 ) 与 ( 3) 的证明与 (1 ) 类似 , 留给读者自己完成 .
定理 5 .2 　状态 i 为常返态 , 当且仅当
∞
∑p
( n)
ii = ∞; ( 5 .3)
n= 0
状态 i 为非常返态 , 当且仅当
∞
1
∑p
( n)
ii = < ∞ . ( 5 .4)
n= 0 1 - f ii
(0) (0 ) ( n)
证明　约定 p ii = 1 , f ii = 0 . 由 (5 .1 ) 式有 p ii =
n
∑f p(ii n - l) , 令 { p(iin) } , { f (iin) } ( i ∈ S) 的母函数分别为 P(ρ) ,

( l)
ii
l =0
F(ρ) , 即
∞ ∞
∑p ρ , 　　 F(ρ) = ∑f ρn .
( n) n ( n)
P(ρ) = ii ii
n= 0 n= 0
又
∞ ∞ n
∑p ρ = ∑ ∑f p (iin - l ) ρn
( n) n ( l)
ii ii
n= 1 n=1 l= 0
∞ ∞
∑f ∑p
( l) l ( n - l) n - l
= ii ρ ii ρ
l= 1 n= l
) ∑ p ii ρ
(0) ( n′) n′
= ( F(ρ) - f ii
n′= 0
7 .5 状态的分类　 275
= F(ρ) P(ρ) 　　 ( 因为 f (ii0 ) = 0) ,

∞ ∞
而∑ p ρ = ∑p ρn - p(ii0 ) ρ0 = P(ρ) - 1 , 因此 P(ρ) - 1 =

( n) n ( n)
ii ii
n= 1 n= 0
P(ρ) F(ρ) .
注意到 , 当 0≤ρ< 1 时 , F(ρ) < f i i ≤1 , 故
1
P(ρ) = , 　　 0 ≤ ρ< 1 . ( 5 .5)
1 - F(ρ)
又因对一切 0≤ρ< 1 及正整数 N , 有
N ∞
∑p ∑p
( n) n ( n)
ii ρ ≤ P(ρ) < ii , ( 5 .6)
n=0 n= 0
且当 ρ↑1 时 , P(ρ) 不减 , 故在 (3 .6 ) 式中先令 ρ↑ 1 , 后令 N→ ∞
可得
∞
∑p
( n)
lim- P(ρ) = ii . ( 5 .7)
ρ→ 1 n= 0
同理可得
∞
∑f
( n)
lim- F(ρ) = ii = f ii . ( 5 .8)
ρ→ 1 n= 0
于是在 (5 .5 ) 式中两边令 ρ↑ 1 , 由 (5 .7 ) 式和 ( 5 .8 ) 式便可得定理
的结论 .
为解释定理 5 .2 的直观意义 , 令
1, Xn = i,
In ( i) =
0, Xn ≠ i,
∞
及 S( i) = ∑I
n= 0
n ( i) , 则 S( i) 表示马氏链{ X n , n≥ 0} 到达 i的次数 .
于是
∞
E[ S( i) | X0 = i] = ∑ E[ In ( i) | X0 = i]
n= 0
= ∑ P( Xn = i | X0 = i)
n= 0
= ∑ pii
( n)
. ( 5 .9)
n= 0
∞
可见 ∑ p(iin ) 表示由 i 出发返回到 i 的平均次数 .当 i 为常返态时 ,

n= 0
返回 i 的平均次数为无限多次 , 反之亦然 .当 i 为非常返态时 , 再回

到 i 的平均次数至多有限次 .
推论 1 　若 j 非常返 , 则对任意 i∈ S , 有
∞
∑p < ∞,
( n)
ij (5 .1 0)
n= 1
( n)
lim pij = 0 . (5 .1 1)
n→ ∞
　　证明　若 i → j, 即对 n ≥ 1 , p(ijn) = 0 , ( 5 .10 ) 式与 ( 5 .11 ) 式

∞
显然成立 ; 若 i → j, 则由定理 5 .1 , 有 p ∑f p (j jn - l ) , 两边对 n

( n) ( l)
ij = ij
l= 1
求和得
∞ ∞ n
∑p = ∑ ∑ fij p jj
( n) ( l) ( n - l)
ij
n= 1 n= 1 l =1
∞ ∞
=∑ f ∑p
( l) ( n - l)
ij jj
l= 1 n= l
= f i j ∑ pj j
( k)
< ∞ .
k= 0
又 i→ j, 有 0 < f ij < ∞ .从而知 ( 5 .10 ) 式成立 , 从而 (5 .1 1) 亦成立 .

推论 2 　若 j 为常返态 , 则 :
(1 ) 当 i→ j 时 , 有
∞
∑p
( n)
ij = ∞ . (5 .1 2)
n= 1
　　 (2 ) 当 i 不可达 j 时 , 有
∞
∑p
( n)
ij = 0 . (5 .1 3)
n=1
　　证明　 ( 1) 当 i → j 时 , 则存在 m ≥ 1 , 使 p(ij m) > 0 , 于是对

7 .5 状态的分类　 277
∑p ∑ pij
( m+ n) ( m) ( n) ( m) ( n) ( n)
＂ n≥ 1, 有 p ij = ik p kj ≥ p ij p jj , 故 ≥
k∈ S n= 1
∞ ∞
∑p ≥ ∑p p(j jn ) = + ∞ , 即得 ( 5 .12 ) 式 .( 2) 当 i 不可达 j

( m+ n) ( m)
ij ij
n= 1 n=1
时 , 显然 ( 5． 13 ) 式成立 .
下面再从概率意义考察常返性质 .记
∞
Sm ( j) = ∑I
n= m
n ( j) ,
gi j = P( S1 ( j) = + ∞ | X0 = i)
= P( Sm + 1 ( j ) = + ∞ | Xm = i) .
事件{ Sm ( j ) = + ∞} 表示从时刻 m 起系统无穷多次到达状态 j .
显然 , { X0 = i, S1 ( j ) = + ∞} { X0 = i, T ij < + ∞ } , 故 gij ≤ f ij .
进一步 , 我们有下面的结论 .
定理 5 .3 　对任意 i, j∈ S, 有
n
gii = nlim ( f ii ) , 　　 gi j = f ij g jj . (5 .1 4)
→∞
　　证明　因{ Sm ( j ) ≥ k + 1} { Sm ( j) ≥ k} , 故
∞
( S1 ( j) = + ∞ ) = k∩ ( S1 ( j) ≥ k) = k→
lim ( S1 ( j ) ≥ k) .
=1 ∞
由概率的连续性可得
∞
gij = P( S1 ( j) = + ∞ | X0 = i) = P k∩ ( S1 ( j) ≥ k) | X0 = i
= 1
= k→
lim P( S1 ( j) ≥ k | X0 = i) . (5 .1 5)
∞
又因 ( S1 ( j ) ≥ k + 1 , X0 = i) { X0 = i, Tij < ∞} , 则有
∞
( S1 ( j) ≥ k + 1 , X0 = i) = ∪ ( T ij = l, S1 ( j) ≥ k + 1)
l=1
=∪ ( T ij = l, Sl+ 1 ( j) ≥ k) ,
l=1
故
P( S1 ( j ) ≥ k + 1 | X0 = i)
= ∑ P( T ij = l | X0 = i) ・
l=1
P( Sl+ 1 ( j ) ≥ k | X0 = i, Ti j = l)
∞
= ∑ f (i jl) P ( Sl+ 1 ( j) ≥ k | X0 = i,
l=1
X m ≠ j, 1 ≤ m ≤ l - 1 , X l = j)
∞
= ∑ f i j P ( Sl+ 1 ( j) ≥ k | X l = j) 　　 ( 马氏性 )
( l)
l=1
= ∑ f (i jl) P ( S1 ( j) ≥ k | X0 = j ) 　　 ( 时齐性 ) ,
l=1
即
P( S1 ( j ) ≥ k + 1 | X0 = i) = f ij P ( S1 ( j ) ≥ k | X0 = i) .
(5 .1 6)
反复利用上式可得
P( S1 ( j) ≥ k + 1 , X0 = i) = f ij ( f j j ) k , (5 .1 7)
由 (5 .1 7) 式立得 (5 .1 4) 式 .
定理 5 .4 　 ( 1) f ii = 1 gii = 1 , ( f ii < 1 g ii = 0 ) ; (2 ) 若状态
j 为常返 , 且 j→ i, 则 gij = f ij = 1 .
证明　 (1 ) 由 ( 5 .14 ) 式立得 . (2 ) 由 j → i, 存在 m ≥ 1 ,
( m)
p ji > 0, 再由 j 为常返 , 注意到{ X0 = i, S1 ( j) = + ∞} = k∈
∪S { X0 =
∑ p jk g kj , 从而 0 = 1 - gj j =
( m)
i, Xm = k, S1 ( j ) = + ∞} 得 gj j =
k∈ S
∑p ( 1 - g kj ) .于是对所有 k ∈ S, p(jkm) (1 - gkj ) = 0 , 这样对 i 由

( m)
jk
k∈ S
( m)
pj i > 0 必有 gij = 1 , 再由 g ij ≤ f ij ≤ 1 得 gi j = f ij = 1 .
定理 5 .4 的说明 : 若 i 常返 , 则系统从 i 出发以概率 1 无穷多
次返回 i, 即从 i 出发的几乎所有样本轨道无穷多次回到 i ; 若 i 非
常返 , 则从 i 出发几乎所有样本轨道至多有限次回到 i .
7 .5 状态的分类　 279
定理 5 .5 　设 i 常返 , 则 :
(1 ) i 为零常返 , 当且仅当　　 lim ( n)
pii = 0;
n→ ∞
( n) 1
(2 ) i 为遍历 , 当且仅当　　 lim pii = >0 . (5 .1 8)
n→ ∞ μi
证明　由定理 5 .5 容易得到 , 详细的推导留给读者 .
状态相通关系为等价关系 , 因为具有 :
(0 )
(1 ) 自反性 : i＼ i .这由下面定义可得 : pi j =δi j ;
(2 ) 对称性 : 若 i＼ j, 则 j＼ i;
(3 ) 传递性 : 若 i＼ j 且 j＼ k, 则 i＼ k .
传递性的证明如下 .
由于 i＼ j, j＼ k, 则ｖ m, n, 使 p(i jn) > 0 , p(jkm) > 0 , 则由 C－K 方程
可得
p(ikm+ n) = ∑p p (lkn) ≥ p(ij m) p(jkn) > 0 ,
( m)
il
l∈ S
故 i→ k .同理可证 k→ i, 故 i＼ k .
利用等价关系 , 可以把马氏链的状态空间分为若干等价类 .在
同一等价类内的状态彼此相通 , 在不同的等价类中的状态不可能
彼此相通 .然而 , 从某一类出发以正的概率到达另一类的情形是可
能的 .
定义 5 .8 　如一马氏链的所有状态属于同一等价类 , 则称它
是不可约链 .
例 5 .3
(1 )
1 1 1
2 4 4
1 3
S = {1 , 2 , 3 } , 　　 P = 0 ;
4 4
2 1
0
3 3
　　 (2 )
1 1 0 0 0
2 2
1 3
0 0 0
4 4
S = { 1 , 2 , 3 , 4 , 5} , 　　 P = ;
0 0 0 1 0
1 1
0 0 0
2 2
0 0 0 1 0
　　 (3 )
0 .6 0 .1 0 0 .3 0
0 .2 0 .5 0 .1 0 .2 0
S = {1 , 2 , 3 , 4 , 5 } , 　　 P = 0 .2 0 .2 0 .4 0 .1 0 .1 .
0 0　 0 1 0
0 0　 0 0 1
　　读者可以自己画状态转移图进行判断 .
(1 ) 由于所有状态相通 , 组成一等价类 , 故该链是不可约链 .
(2 ) 此链可分为两个等价类 { 1 , 2} 及{3 , 4 , 5 } .
(3 ) 此链可分为 3 个等价类{ 1 , 2 , 3} , { 4} 及{ 5 } .由{ 1 , 2 , 3 } 可
进入{4 } 或{ 5} , 反之则不行 .
对于相通的状态 , 有以下重要的定理 .
定理 5 .6 　若 i＼ j, 则 :
(1 ) i 与 j 同为常返或同为非常返 ;
(2 ) d( i) = d( j) .
证明　 (1 ) 由 i＼ j, 存在 m ≥ 1 , n ≥ 1 使 p(i jm ) > 0 , p(jin) > 0 ,
∞
> 0 , 这时 , 由 j 为常返 , 有 ∑ p ii
( m+ k+ n) ( m) ( k) ( n) ( k)
p ii ≥ p ij p jj p ji ≥
k= 0
∞ ∞
∑p ∑p
( m+ k+ n) ( m) ( n) ( k)
ii ≥p ij p ji jj = ∞ , 可知 i 亦为常返 .类似可证当 i
k= 0 k= 0
7 .5 状态的分类　 281
为非常返时 , j 必为非常返 .
( m + n) ( m) ( n) ( n + m) ( n) ( m)
(2 ) 由 ( 1 ) 有 p ii ≥ pij p ji > 0 , pj j ≥ pj i p i j > 0, 知
( k)
m + n 同时能被 d ( i) 与 d( j ) 整除 .现设 pii > 0, 则 k 及 m + n + k
( m + k + n) ( m) ( k) ( n)
可被 d ( i) 整除 , 由 p j j ≥ p ji p ii p ij > 0 , 知 m + n + k 亦能被
d ( j ) 整除 , 则 k 能被 d ( j ) 整除 , 故而数集 { k: k≥ 1 , p(ii k) > 0 }的最大
公因子 d( i) 能被 d ( j ) 整除 .类似论证 , d ( j ) 能被 d ( i) 整除 , 得
d( i) = d( j) .
该定理说明 , 对相通的状态 , 因是同类型 , 故只需选出其中之
一较容易判别的状态即可 .
关于常返态的判断 , 我们可以总结为以下重要定理 .
定理 5 .7 　下列命题等价 :
(1 ) i 为常返态 ;
∞
(2 ) P n∪ ( Xn = i) | X0 = i = 1;
= 1
(3 ) P( S1 ( i) = + ∞ | X0 = i) = 1;
∞
∑p = ∞;
( n)
(4 ) ii
n= 0
(5 ) E{ S1 ( i) | X0 = i} = + ∞ .
证明　 (1 ) ( 2) : 由于 f i i = P( T i i < ∞ | X0 = i) = 1 , 及
∞
( Tii < ∞ ) = n∪ ( Tii = n)

=1
= n∪ ( X0 = i, X l ≠ i, 0 < l < n, X n = i)
=1
= n∪ ( X0 = i, X n = i) ,
=1
因此
∞
P n∪ ( Xn = i) | X0 = i = P( T ii < ∞ | X0 = i) = f ii = 1 .
= 1
即 (1 ) 与 ( 2) 等价 . ( 1 ) ( 3 ) 见定理 5 .4; ( 1 ) ( 4 ) 见定理 5 .2;
(4 ) ( 5) 由 (5 .1 9) 式即得 .
例 5 .4 　 ( 直线上的无限制随机游动 ( p, q) ) 　在例 3 .2 (1 ) 中
已经知道{ X n , n≥ 1}是马氏链 , 且容易证明当 0 < p < 1 时 , 它的全
体状态构成一个类 .事实上 , 它其中的任意两个状态都相通 .问题
是它是常返类还是非常返类 ? 由定理 5 .6 知只需选一个“ 代表”
即可 .
由本章 7． 2 节中的 3 讨论 T0 0 的分布可知 , 当 p = q = 1/ 2 时 ,
f 0 = P( T00 < ∞ | X0 = 0) = 1 , 故此时“ 0”为常返态 , 因而其他状态
亦为常返态 ; 而当 p≠ q 时 , f0 = P( T00 < ∞ ) < 1 , 故此时全体状态
为瞬时态 .
例 5 .5 　生灭链 ( 有一反射壁的随机游动 ) 　设一随机过程
{ X n , n≥0 } , 状态空间限制在 S = {0 , 1 , 2 , … } , 转移概率为 p0 > 0 ,
r0 ≥0 , p0 + r0 = 1; p i > 0 , qi > 0 , ri ≥0 , 且 p i + ri + qi = 1 ( i≥ 1 ) .可
看作是一质点每次作向左、向右或原地不动的随机游动 ( 在原点有
一反射壁 ) .它适用描述一群体的繁衍 , 或一服务台信号的到达与
离去 .称上述为生灭链 .
以下证明 , 上述生灭链为常返链的充要条件为
∞
q1 q2 … ql
∑
l= 1 p 1 p2 … pl
= ∞ . (5 .1 9)
　　先证充分性　易知＂ i≥0 , i→ i + 1 , 故链为不可约的 , 从而只

需证明 f00 = 1 即可 .为此令 τj = inf{ n: n≥ 0 , X n = j} , 对固定状态
k > 0 及 0 ≤ i≤ k, 记 ui = P(τ0 < τk | X0 = i) , 显然 u0 = 1 , uk = 0 .由
定义及全概率公式及链的时齐性 , 有
ui = p i u i+ 1 + ri u i + qi u i - 1 , 　　＂ 1 ≤ i ≤ k - 1 ,
qi
可得 ui + 1 - ui = ( ui - ui - 1 ) , 从而
pi
q1 q2 … qi
ui+ 1 - ui = ( u1 - u0 ) , 　　＂ 0 ≤ i ≤ k - 1 .
p1 p2 … p i
(5 .2 0)
7 .6 极限性态与平稳分布　 283
记 a0 = 1 , ai = q1 q2 … qi/ p1 p2 … p i , 注意到 u0 = 1 , uk = 0 , 可得
k- 1 k- 1 -1
ui = ∑a
j= i
j
∑a
j= 0
j 　　＂ 0 ≤ i≤ k - 1 . (5 .2 1)
由上式及 (5 .1 9) 式 , 知
f1 0 = P(τ0 < ∞ | X0 = 1) = lim P(τ0 < τk | X0 = 1 )
k→ ∞
k- 1 k- 1 - 1
= kli→m
∞ ∑a
j= 1
j
∑a j= 0
j
k- 1 -1
= kli→m
∞
1 - ∑a j= 0
j = 1, (5 .2 2)
故 f0 0 = r0 f00 + p0 f 10 = 1 , 即状态为常返类 .
下证必要性　设状态 0 为常返 , 则由定理 5 .4 知 f10 = 1 , 再
k- 1 -1
由上述证明过程中知 f10 = k→
lim∞
1- ∑a
j=0
j 即 ( 5 .19 ) 式成立 .
7 .6 　极限性态与平稳分布
在实际应用中 , 人们常常关心的问题有两个 : (1 ) 当 n → ∞
时 , P( Xn = i ) = πi ( n) 的极限是否存在 ? (2 ) 在什么条件下 , 一
个马氏链是一个平稳序列 ? 对于前者, 由于 ,πj ( n) =
∑π (0 ) p
( n) ( n) ( n)
i ij , 故可转化为研究 p ij 的渐近性质 , 即 nli→m pi j 是否存
∞
i∈ S
在 ? 若存在 , 其极限是否与 i 有关 ? 对于后者 , 实际上是一个平稳

分布是否存在的问题 .这两个问题有密切联系 .
n
1 　 P 的极限性态
( n)
p ij 的渐近性态 , 在 7 .5 节中已有所涉及 , 这里分两种情形再
加以进一步讨论 .
(1 ) j 非常返或零常返
定理 6 .1 　若 j 非常返或零常返 , 则对任意 i∈ S , 有
( n)
lim pij = 0 . ( 6 .1)
n→ ∞
　　证明　当 j 为非常返时 , 已在 7 .5 节定理 5 .2 的 ( 5 .11 ) 式给
出 ; 当 j 为零常返时可由下面定理 6 .2 给出 .
(2 ) j 为正常返态
这时情况较复杂 , n→ ij 不一定存在 , 即使存在也可能与 i 有
( n)
lim p
∞
关 .但有以下结论 .
定理 6 .2 　若 j 常返 , 周期为 d, 则对任意 i∈ S 及 0≤ r≤ d -
1, 有
( n d + r) d
lim p ij = f ij ( r) , ( 6 .2)
n→ ∞ μj
∞
∑f
( m d + r)
其中 f ij ( r) = ij (0 ≤ r ≤ d - 1) .当 μj = + ∞ 时, 1/ μj = 0 .
m= 0
证明已超出本教材范围 , 从略 .可见参考文献[7 , 14] .

推论 1 　若 j 是遍历状态 , 则对任意的 i∈ S , 有
( n) fij
lim p ij = . ( 6 .3)
n→ ∞ μj
　　推论 2 　对于不可约的遍历链 ( 即所有状态遍历 ) , 对任意 i,
j∈ S, 有
( n) 1
li m pi j = , ( 6 .4)
n→ ∞ μj
1
　　定理 6 .3 　若有限状态马氏链是不可约的遍历链, 则 πi =
μi
是方程组
xj = ∑x
i∈ S
i p ij , ( 6 .5)
满足条件 x j ≥ 0 , j ∈ S, ∑ x j = 1 的唯一解 .
j∈ S
证明　记 πi = 1 , 由定理 6 .2 推论 2 有 n→ ( n) 1 = πj ≥
lim p ij =
μi ∞ μj
0 .对任意 n, 有 1 = ∑p , 令 n → ∞ , 可得 ∑πj = 1; 由 C－K 方

( n)
ij
j∈ S j∈ S
∑p
( n+ 1 ) ( n)
程有 p ij = il p lj , 如令 n → ∞ , 有
l∈ S
πj = ∑π p
l∈ S
l lj , 　　＂ j∈ S . ( 6 .6)
知{πi , i∈ S} 是 (6 .5 ) 式的解 .
　　将 ( 6 .6) 式两边乘以 p ji 并对 j 求和 , 得 πi = ∑π p
j∈ S
j ji =
∑π p , 重复上述步骤 , 于是对所有 n 及 j , 有
( 2)
l li
l∈ S
∑π p
( n)
πj = i ij , ( 6 .7)
i∈ S
　　现证唯一性 .设 { vi } 是满足条件的另一组解 , 则类似 ( 6 .7 )
式有
∑v ∑v
( n)
vj = i p ij = … = i p ij .
i∈ S i∈ S
令 n → ∞ , 则有 vj = ∑v
i∈ S
i lim p(ijn) =
n→ ∞ ∑v i∈ S
i πj = πj .
2 　平稳分布
定义 6 .1 　一个定义在 S 上的概率分布 π= {π1 ,π2 , … ,πi , …}

称为马氏链的平稳分布 , 如有
π = πP , ( 6 .8)
即＂ j∈ S, 有
πj = ∑π p i∈ S
i ij . ( 6 .9)
　　平稳分布也称马氏链的不变概率测度 .对于一个平稳分布π,

显然有
2 n
π = πP = πP = … = πP . (6 .1 0)
　　定理 6 .4 　设{ X n , n≥ 0}是马氏链 , 则{ Xn , n≥ 0}为平稳过程
的充要条件是 π( 0 ) = (πi ( 0 ) , i ∈ S ) 是平稳分布 , 即 π( 0 ) =
π( 0) P .
证明　充分性　记 π(0 ) = π, 显然 π(1 ) = π(0 ) P = π, …π( n) =

π( n - 1) P = πP = π.因此＂ ik ∈ S, tk ∈ \ { 0 } , n≥ 1 , 1 ≤ k≤ n, t∈
\ {0 }有
P( Xt1 = i1 , X t2 = i2 , … , X tn = in )
( t - t ) ( t - t )
=πi1 ( t1 ) pi1 2i2 1
… p in n- 1 inn - 1
(t - t ) ( t - t )
=πi1 ( t1 + t) pi1 2i2 1
… pi n n- 1 i nn - 1
= P( Xt1 + t = i1 , X t2 + t = i2 , … , X tn + t = in ) ,
所以{ X n , n ≥ 0 } 是严平稳过程 .
必要性　由于{ Xn , n ≥ 0} 是平稳过程 , 因此有 π( n) = π( n -
1) = … = π( 0) .又由 π( 1) = π(0 ) P 得π( 0) = π(0 ) P, 即 π(0 ) 是
平稳分布 .
由定理 6 .3 有以下结论 .
定理 6 .5 　有限状态不可约遍历链恒有唯一的平稳分布
1
πi = , 且 πj = li ( n)
m pij .
μi n→ ∞
对于一般的马氏链 , 其平稳分布是否存在 ? 若存在 , 是否唯
一 ? 这里不深入讨论 , 有兴趣的读者可参看文献[7 , 14] .
3 　 n→
lim πj ( n) 的存在性
∞
下面我们来研究li mπj ( n) 的存在性问题 .

n→ ∞
定义6 .2 　若lim πj ( n) = πj＊ ( j ∈ S) 存在 , 则称 π＊ = {π1＊ , … ,

n→ ∞
πj＊ , … } 为马氏链的极限分布 .
定理 6 .6 　有限状态非周期不可约链是正常返的充要条件是
它存在平稳分布 , 且此时平稳分布就是极限分布 .
证明　充分性　设存在平稳分布 π= {π1 , … ,πj , …} , 由此
有 π= πP = πP2 = … = πP n , 即 πj = ∑π p , 由于 x j ≥ 0 ,
( n)
i ij
i∈ S
j ∈ S, ∑ x j = 1 , 当 n → ∞ 时 , 因状态空间有限 , 极限号与和式可
j∈ S
交换 , 得
∞∑ ∑π lim p ∑π
πj = n→ πi p(i jn) = πj .
( n)
lim i ij = i
n→ ∞
i∈ S i∈ S i∈ S
因为
1
∑πj =
j∈ S
∑j∈ S μj
= 1 .
于是至少存在一个πl = 1 > 0 , 从而 lim p(iln) = 1 > 0 , 即μl < ∞ ,

μl n→ ∞ μl
故 l 为正常返状态 .由不可约性知 , 整个链是正常返的 , 且所有
πj = 1 > 0 .
μj
必要性　由于马氏链是正常返非周期链 , 即为遍历链 , 由定
＊ 1
理 6 .3 立即得证 .且所有 πj = πj = , j∈ S .
μj
由上可知 , 对于有限状态不可约遍历链 , 则极限分布π ＊ = π
存在且等于平稳分布 .这意味着当 n 充分大时 , P( X n = j ) ≈πj =
1 , 即{ Xn , n ≥ 0} 是一渐近平稳序列 .这在实际问题中是很有意
μj
义的 .
例 6 .1 　设
3 1
4 4
S = { 1 , 2} , 　　 P = .
5 3
8 8
n
求平稳分布及li mP = ?
n→ ∞
3 5 5
解　由 π= πP 得π1 = π1 + π2 及 π1 + π2 = 1 , 解得 π1 = ,
4 8 7
2 5 2 ( n) 1 7 7
π2 = , 故 π= , .由lim pi j = πj = , 故 μ1 = ,μ2 = , 且
7 7 7 n→ ∞ μj 5 2
n
3 1 5 2
4 4 7 7
li m Pn = lim = .
n→ ∞ n→ ∞
5 3 5 2
8 8 7 7
7 .7 　离散时间的 Phase－Type 分布
在有限状态马氏链中 , 从瞬时态 ( 非常返 ) 集到吸收态的时间
分布 , 称为 P hase－Type 分布 .由于它有许多优良性质与简洁的矩
阵表示 , 已成为复杂随机模型 , 特别是大规模的排队系统、排队网
络及可靠性工程中计算与分析的重要工具 .本节讨论离散时间的
P hase－Type 分布 , 以下先给出它的定义 .
定义 7 .1 　设 { Xn , n≥ 0 } 是有限状态马氏链 , 状态空间珟
S=
S∪ S0 , 其中 , S = { 1 , 2 , … , m} 为瞬时态集 , S0 = { 0 }为吸收态且转
P P0
移矩阵珟
P= , 其中 P0 = ( I - P) e, e = ( 1 , … , 1 ) T , 记 τ=
0 1
inf{ n: n≥ 0 , Xn ∈ S0 } , τ为首达吸收态的时间 , 称 τ的分布为
P hase－Type 分布 ( 或 PH 分布 ) .
令 π(0 ) = (α0 ,α) 为初始分布 , 其中 α= (α1 , … ,αm ) ,αk ≥ 0 ,
∑α
k∈ S
k = 1 , gk = P(τ= k) , ak ( i) = P(τ= k | X0 = i) ( i ∈ S) ,
∞ ∞
ak = ( ak ( i) , i ∈ S) , g(λ) ∑ g λ , g (λ) ∑ a ( i)λ ,

T k k
= k i = k
k= 0 k= 1
T
G(λ) = ( g i (λ) , i ∈ S) , 其中 λ∈ [0 , 1 ] .
为求 τ的分布函数及其母函数 , 先给出下列引理 .
n - 1
引理 7 .1 　设矩阵 Q 满足 n→
lim Q = 0, 则 ( I - Q) 存在 , 且
∞
∞
∑Q ,
- 1 k
( I - Q) = ( 7 .1)
k= 1
其中 I 为单位矩阵 .
7 .7 离散时间的 P hase－Type 分布　 289
证明　因
n -1 n
( I - Q) ( I + Q + … + Q ) = (I - Q ) . ( 7 .2)
n n n
又因li m Q = 0, 则当 n 充分大时 , det ( I - Q ) = | I - Q | ≠0 , 从而
n→ ∞
n -1
| I - Q |・| I + Q + … + Q |≠ 0 .
- 1 - 1
于是 | I - Q| ≠ 0 , 得 ( I - Q) 存在 , 再以 ( I - Q) 左乘 ( 7 .2 ) 式两
边 , 并让 n→∞即得 ( 7 .1) 式 .
定理 7 .1 　在上述记号下 , 有 :
(1 ) ＂ k∈ \ {0 } , g0 =α0 ,
k -1 k -1
gk = αP P0 = αP ( I - P) e; ( 7 .3)
ak = Pk - 1 P0 = Pk - 1 ( I - P) e . ( 7 .4)
　　 (2 ) ＂ λ∈[ 0 , 1]
- 1
g(λ) = α0 + λα( I - λP) ( I - P) e, ( 7 .5)
-1
G(λ) = λ( I - λP) ( I - P) e . ( 7 .6)
　　证明　 (1 ) 用数学归纳法 :
当 k = 0 时 , g0 = P(τ= 0) = P( X0 ∈ S0 ) = α0 ;
当 k = 1 时,
g1 = P(τ= 1 ) = P( X0 ∈ S, X1 = 0 ) = ∑α p
i∈ S
i i0 = αP0 .
　　当 k≥2 时 ,
gk = P(τ= k) = P( X0 ∈ S, X1 ∈ S, … , Xk - 1 ∈ S , X k ∈ S0 )
= ∑… ∑ αi0 pi0 i1 … pik - 1 0 = αP
k -1
P0 ,
i ∈S i ∈S
0 k- 1
即得 ( 7 . 3 ) 式 . 又注意到 k ≥ 1 时 , αk ( i ) =
0 , … , 1 , 0 , … , 0) P ( I - P e, 立得 ( 7 .4) 式 .
k- 1
第 i个元素
(2 ) 将 gk 及 ak 的表达式代入 g (λ) 及 G(λ) 中 , 并注意到 S 为

瞬时态集 , 故 n→ →0( n→∞ ) , 用引理 7 .1 可得 ( 7 .5) 式
n n n
lim P = 0,λ P
∞
及 (7 .6 ) 式 .
注　由 (7 .3 ) 式及 ( 7 .4) 式 , 离散的 P hase－Type 分布可以看作
是矩阵形式的几何分布 .显然它由 (α, P) 确定 .故可简记为 τ～
P H (α, P) .
P H 分布有如下的一些优良性质 :
(1 ) 若 τ1 ,τ2 为 P H 分布 , 相互独立 , 则 τ1 + τ2 ,τ1 ∧τ2 ,τ1 ∨τ2
均为 P H 分布 .
(2 ) τ1 , … ,τn 为 P H 分布 , 相互独立 ,ξ为离散型随机变量且与
n
τ1 , … ,τn 独立 , P(ξ= k) = pk ≥ 0 , ∑ pk = 1 (1 ≤ k ≤ n) , 则
k= 1
n
∑τ I
k= 1
k (ξ= k) 为 PH 分布 .
(3 ) 设{τn , n≥ 1} 为独立同分布的 P H 分布 ,ξ为离散 P H 分布

ξ
且与{τn , n ≥ 1 } 独立 .令 X = ∑τ , 则
k= 0
k X 为 P H 分布 .
有关 P H 分布的封闭性 , 有兴趣的读者可参看文献[ 21 ] .
记 B( 1 , m) = (α1 , …,αm ) , B( 2 , m) = (α2 , …,αm + 1 ) , B( k, m) =
(αk , … ,αk + m - 1 ) .
定理 7 .2
(1 ) ＂ k≥1 ,
αk+ 1 = Pαk ; ( 7 .7)
　　 (2 ) P 满足矩阵方程
PB( 1 , m) = B(2 , m) ; ( 7 .8)
　　 (3 ) 若 rank B(1 , m) = m, 则
- 1
P = B( 2 , m) B ( 1 , m) , ( 7 .9)
- 1 k- 1 - 1
αk = ( B(2 , m) B ( 1 , m) ) ( I - B(2 , m) B ( 1 , m) )
＂ k≥ 1 . (7 .1 0)
　　证明　由 (7 .4 ) 式可得 ( 7 .7) 式及 (7 .8 ) 式 .再 r ank B( 1 , m) =
m, 立得 ( 7 .9) 式和 (7 .10) 式 .
注　由 ( 7 .9 ) 式知 , 当 {αk , 1 ≤ k≤ m + 1 } 已知时 , 可反求矩阵
练习题　 291
P, 这在许多情形下是很有用的 ( 即反问题 .例如一系统的状态变
化可用马氏链来描述 , 其内部参数 P = ( pij ) 未知 , 但其首达时间可
以观测到 , 这时可用 ( 7 .9) 式来估计未知参数 P) .由 ( 7 .10 ) 式知 ,τ
的概率分布至多由{αk , 1≤ k≤ m + 1}确定 .
尽管 P H 分布是定义在有限状态马氏链上的 , 但有时亦可根
据具体问题灵活的应用它 , 试看下例 .
例 7 .1 　设{ X n , n≥ 0}为无限制的 ( p, r, q) 随机游动 , 且 X0 =
0( 见 7． 3 节例 3． 2 ) , 其中 p , q > 0 , r≥ 0 , p + q + r = 1 .试求 : T =
min{ n: n≥ 1 , X n = - 2 或 X n = 3 } 的分布律 .乍看此链状态空间无
限 , 好像无法利用 P H 分布来求解 .但如果将此链限制在状态空间
珟
S = { - 1 , 0 , 1 , 2 , 3 , - 2 } 上 , 选取 S = { - 1 , 0 , 1 , 2 } 且将 S0 =
{3 , - 2 想象 ( 当作 ) 吸收态集 .显然将 S0 = { 3 , - 2} 当作吸收态集
后并没有改变原来 T 的分布特性 .这样便可以应用 (7 .3 ) 式来求
T 的分布 { gk , k≥0} , 由 X0 = 0 , 显然此时 g0 = 0 , 当 k≥ 1 时 , 只需
取 α= ( 0 , 1 , 0 , 0) , 在 S = { - 1 , 0 , 1 , 2 } 上的 P, 在 S0 = { 3 , - 2 } 上
的 P0 应取为
　　 - 1 　 0 　 1 　 2 　　　　 (3 , - 2)
r p 0 0 q
q r p 0 0
P= , 　　 P0 =
0 q r p 0
0 0 q r p
代入 (7 .3 ) 式即可 .
练　习　题
7 .1 　设 { Yn , n ≥ 1} 独立同分布 , P( Yn = 1) = p > 0,
P( Yn = - 1) = q > 0, p + q = 1 , p - q > 0, Y0 = 0, X0 = 0, Xn =
∑ Yk , Un = Xn - n( p - q) , V n = ( q/ p)
X
n .求 :
k=1
(1 ) P( X1 > 0 , X2 > 0 , X3 = k) ( - 3≤ k≤3 ) ;

(2 ) P( X1 > 0 , … , Xn - 1 > 0 , Xn = k) 及 P( X1 < Xn , X2 < Xn , … ,
Xn - 1 < X n , X n = k) ( - n≤ k≤ n) ;
(3 ) Um 与 U n 的相关系数 ;
(4 ) E( U2 | X2 ) 的分布律并证明 E( Un + k | X n ) = Un , ＂ n, k≥1;
(5 ) E Vn 及 E( V8 | X7 = 3) .
7 .2 　 Y n , Xn 同 7 .1 题 ,
T01 = min{ n: n > 0 , X n = 1} , 　　 X′
n = XT
01
+ n,
T′
12 = min{ n: n > 0 , X′
n = 2} .
试证 T0 1 与 T′
1 2 条件独立且同分布 .
7 .3 　设从数字 1 , 2 , … , a 中任取一数为 X0 , n≥1 时 , 则从 1 ,

2 , … , X n - 1 中任取一数为 X n , 则{ Xn , n≥0 } 为马尔可夫链 , 试写出
它的转移概率矩阵 .
7 .4 　设连续的掷一个均匀的硬币 , 定义 Xn = 0 , 若第 n 次掷
得正面 ; Xn = k, 若第 n - 1 , … , n - k + 1 次掷得反面 , 而第 n - k 次
掷得正面 .这里我们规定第 0 次掷得正面 , 则 { X n , n≥0 }为马尔可
夫链 , 试写出它的转移概率矩阵 .
7 .5 　一个“ 传染病”, 模型如下 : 设 a 个人中某些人已患流行
性感冒 .假定 : (1 ) 当一个病人遇见一个健康者时 , 后者被传染的
概率为 α; ( 2) 所有的接触都是两人之间的接触 ; ( 3 ) 一切成对的
接触都是等可能的 ; ( 4 ) 在每个单位时间内只发生一次接触 .以
Xn 记时刻 n 患病的人数 , 则{ X1 , … , Xn } 为马尔可夫链 , 试写出它
的转移概率矩阵 .
7 .6 　考察汽车单向通过某路口的情形 .假设一秒钟可通过一
辆汽车 .路口设置有自动红绿灯 , 红灯持续 r 秒 , 绿灯持续 g 秒 .以
“红灯－绿灯”为一个单元时间 , 在第 n 个单元开始时在等候的汽车
练习题　 293
数记为 X n - 1 , 在这个单元中来到的汽车数记为 ξn .设 {ξn , n≥1 } 为

独立同分布随机变量 , 其共同分布为{ qk , k = 0 , 1 , … , r + g} , 而开
始时路口没有汽车在等候 , 则{ Xn , n≥ 0 }为马尔可夫链 , 试写出它
的转移概率矩阵 .
7 .7 　设某一水库的容量为 c m3 .以 X n 记时刻 n 水库的储水
量 , 在时间区间[ n, n + 1) 内流入水库的水量为ξn + 1 , 超过水库容量
的水即溢出 , 在时间区间[ n, n + 1 ) 末从水库放掉 m( < c) m3 水 ( 其
中包括库满而溢出的部分 , 如果溢出的水量已超过 m m3 就不再
放水 ) .假设 {ξn , n ≥ 1 } 独立同分布且与 X0 独立 , P (ξn = k ) =
αk ( k≥0 ) , 则 { X n , n ≥ 0 } 为马尔可夫链 , 试写出它的转移概率
矩阵 .
7 .8 　设{ Xn , n≥0 }为 ( p , q) －随机游动 , 0 < q < p < 1 , 初始分
布为
P( X0 = 0 ) = P( X0 = 2 ) = 1/ 2 .取 A = { 1 , 3} , 证明
P( X2 = 2 | X0 = 0 , X1 ∈ A) ≠ P( X2 = 2 | X1 ∈ A) .
这表明 : 对马尔可夫链 { X n , n≥ 0 } , 若状态集合 A 包含不止一个
状态 , 则下列等式一般不成立 ( 即使 A 只有两个状态 ) :
P( X n + 1 = j | X0 = i0 , … , Xn - 1 = in - 1 , Xn ∈ A)
= P( X n + 1 = j | X n ∈ A) .
　　 7 .9 　设 S = { 1 , 2 , 3} , 3 个马氏链的转移矩阵分别为
1 2 1 2
1 0 0 0 0
3 3 3 3
1 2
0 1 2 1 2
P1 = 3 3 , P2 = 0 , P3 = 0 .
2 3 3 3
1 2
0 1 2 1 2
3 3 0 0
3 3 3 3
　　 (1 ) 试分别对状态进行分类 ;
(2 ) 对 P3 求 T11 的分布律及 E T11 .
7 .10 　一个国家在稳定经济条件下它的出口商品能够用 3 状
态的马氏链描述如下 : 状态空间 S = { + 1 , 0 , - 1 } ; + 1: 今年比

去年增长 ;0 : 大体保持不变 ; - 1: 今年比去年减少 .由以往的统计
数据求得转移矩阵为
+1 0　　 - 1
+ 1 0 .8 0 .2 0
0 0 .35 0 .3 0 .35 .
- 1 0 0 .4 0 .6
　　试求每个状态的平均返回时间 , 并比较在稳定经济条件下增
长状态与减少状态的概率 .
7 .11 　水库供水按其水位分为下列 5 个状态 :“ 1”———危险
水平 ;“ 2”———缺水 ;“ 3”———刚够 ;“ 4”———较好 ;“ 5 ”———充裕 .
S = { 1 , 2 , 3 , 4 , 5 } , 由已有数据求得相邻时间周期的转移矩阵为
0 .1 0 .1 0 .3 0 .5 0
0 .3 0 .2 0 .2 0 .2 0 .1
P= 0 .1 0 .2 0 .4 0 .2 0 .1 .
0 0 .1 0 .2 0 .4 0 .3
0 0 .1 0 .1 0 .4 0 .4
试求出现危险水平的平均时间长度 ( 即求 μ11 = μ1 ) .
7 .12 　设{ X n , n≥ 0 } 为对称随机游动 .令 Mn = 0max X k ( n≥
≤ k≤ n
0) .证明{ Xn , n≥0 }与{ Mn - Xn , n≥0} 为马氏链 .

7 .13 　设有限马尔可夫链有 a 个状态 , k 为常返状态 .证明 :
存在常数 q(0 < q < 1 ) 使得 n > a 时 , 从 k 出发首次返回 k 的时间
n
大于 n 的概率 P k (τk > n) < q .
7 .14 　设 j 为非常返状态 , Nj 为 { Xn , n≥ 0 }中状态 j 出现的
次数 .证明
r -1
fij ( 1 - f jj ) fjj , r ≥ 1,
P( N j = r | X0 = i) =
1 - f ij , r= 0 .
　　 7 .15 　设 X = { X n , n≥0 }为马尔可夫链 ,τ为 X 的有限停时 ,
练习题　 295
即 P(τ< ∞ ) = 1 ,τ取非负整数 , 且＂ k≥ 0 , I(τ= k) 是 X0 , X1 , … X k

的函数 .令 Y = { Y n , n≥ 0} , Y n = Xτ+ n ( n≥0 ) .证明 : Y 为马尔可夫
链 , 与 X 有相同的转移概率矩阵 , 且在已知 Y0 = Xτ 的条件下 , Y
与 (τ, X0 , … , Xτ ) 条件独立 .
7 .16 　设转移概率为
p00 = 1 , p10 = ( 1 - δ) q, 　 p1 1 = δq , 　 p12 = p , 　 pii = q,
pi .i + 1 = p, 　 i ≥ 2 , 　 0 < p, 　 δ< 1 , 　 p + q = 1 .
求吸收概率 f i0 ( i≥1 ) .
7 .17 　设{ξn , n≥1 }独立同分布 , P(ξn = k) =αk ( k≥ 1 ) , 对 n≥
0 定义
0, n < ξ1 ,
Yn =
k, ξ1 + … + ξk ≤ n < ξ1 + … + ξk+ 1 , 　　 k ≥ 1 ,
Y
n
Xn = n - ∑ξ , (ξ
j= 0
j 0 = 0) ,
则{ X n , n ≥ 0 } 为常返不可约马尔可夫链 , 正常返的充要条件为
∞
∑ kα
k= 1
k < ∞ .
7 .18 　设{ Xn , n ≥ 0} 为遍历不可约马尔可夫链 , 转移概率矩

阵为 P = ( Pij ) , {ξn , n ≥ 1 } 为独立同分布随机变量 , 其分布为
P(ξn = k) =αk ( k ≥ 1) , 且{ Xn , n ≥ 0} 与{ξn , n ≥ 1} 相互独立 .令
η0 = 0 ,ηn = ξ1 + … +ξn ( n ≥ 1) , Y n = Xηn ( n ≥ 0 ) , 证 : { Y n , n ≥
∞
∑αk P ,
k
0} 为正常返不可约马尔可夫链 , 其转移概率矩阵为珟
P =
k= 1
且与{ X n , n ≥ 0 } 有相同的平稳分布 .
7 .19 　设马氏链 { X n , n≥ 0 } , S = { 1 , 2 , 3 } , 转移概率矩阵 P
如下
0 .5 0 .4 0 .1
P= 0 .3 0 .4 0 .3 .
0 .2 0 .3 0 .5
　　 (1 ) 求平稳分布 π = (π1 ,π2 ,π3 ) 及lim Pn;

n→ ∞
(2 ) 当初始分布 π(0 ) 是怎样分布时 , 此马氏链是平稳序列 ?

并求 E X n 及 D X n .
1 1 1
2 4 4
7 .20 　设 S = { 1 , 2 , 3} , 　 P = 3 1 .求 :
0
4 4
0 0 1
(1 ) T13 的分布律及 E T13 ;
(2 ) f ii ( i = 1 , 2 , 3) ;
n
(3 ) n → ∞ 时 P → ?
7 .21 　一马氏链 { X n , n ≥ 0} 的 S = { 0 , 1 , 2 , … , N} , 转移概
率为
μi , j = i - 1,
λi , j = i + 1,
P ij = 　 i, j ∈ S,
1 - λi - μi , j = i,
0, | j - i | > 1,
μ0 = λ0 = μN = λN = 0 , 　 0 < μi < 1 , 　 0 < λi < 1 ,
λi + μi = 1 , 　 1 ≤ i ≤ N - 1 , 　 X0 = k, 　 0 < k < N .
　　求 : ( 1 ) P( Xn = 0 , 某个 n≥ 0 | X0 = k ) ; ( 2 ) P( Xn = N , 某个
n≥0 | X0 = k) ; ( 3) E T k0 及 E T kN .
∞
7 .22 　设 j 为非常返状态 , 证明对任意 i ∈ S , 有 ∑ p(ijn) =

n= 1
f ij / ( 1 - f j j ) < ∞ .
7 .23 　设 { X n , n ≥ 0 } 为 ( p, r, q) 随机游动 . X0 = i, Ti =
min{ n: n ≥ 0 , X0 = i, Xn = 0 或 X n = b} , 其中 b( 0 ≤ i ≤ b) 为正
整数 .
(1 ) 当 i = 1 , b = 3 时 , 求 P( T1 = k | X0 = 1) ( k ∈ 瓔 ) 及
练习题　 297
P( X T1 = 3 | X0 = 1 ) ;
(2 ) 当 i = 2 , b = 5 时 , 求 P( T2 = k | X0 = 2) ( k ∈ 瓔 ) ;
(3 ) 求 P( X T2 = 5 | X0 = 2 ) .
7 .24 　设有两串独立的伯努利试验序列 X1 , X2 , … 及 Y1 ,
Y2 , … , 它们成功的概率分别为 p1 与 p2 , 即
P( X i = 1) = 1 - P( X i = 0) = p1 ,
P( Y i = 1) = 1 - P( Y i = 0) = p2 ,
{ Xn , n≥ 0}与 { Y n , n≥0 }独立 .为决定是否 p1 > p2 或 p2 ≥ p1 , 我们
利用下列检验 : 选取某个正整数 M 使得或者
X1 + X2 + … + X n - ( Y1 + Y2 + … + Y n ) = M ,
或者
X1 + X2 + … + Xn - ( Y1 + Y2 + … + Y n ) = - M .
若试验结果是前一情况发生 , 则判定 p1 > p2 ; 若是后一情况发生 ,
则判定 p2 ≥ p1 .记
N = min{ n: n ≥ 1 , X1 + X2 + … +
X n - ( Y1 + Y2 + … + Y n ) = ± M} .
若限制 M = 3 时 , 试证明 :
(1 ) 在 p1 > p2 条件下 , 经试验误判 p2 > p1 的概率为 1/ ( 1 +
M
λ ) , 其中 λ= p1 (1 - p2 )/ p2 (1 - p1 ) ;
M M
(2 ) E N = M(λ - 1 )/ ( p1 - p2 ) (λ + 1) .
7 .25 　设{ X n , n≥0 }是马氏链 , 状态空间 S = {0 , 1 , 2 , … , N } .
j j N - j
X0 = 2 .设 p ij = C N ( i/ N ) ( 1 - i/ N ) , 　 V n = X n ( N - Xn )/ (1 -
- 1 n
N ) , T = min{ n: n≥ 1 , Xn = 0 或 X n = N} .
试求 : ( 1) E X1 及 E ( X2 | X1 ) 的分布律 ; ( 2 ) E ( V2 | V1 ) 及
E( V n + 1 | V0 , V1 , … , V n ) ; (3 ) 求 P ( T = k | X0 = 2 ) ; ( 4 ) 当 N = 3
时 , 求 E( T | X0 = 2) .
7 .26 　证明 : 有限马氏链为不可约遍历链的充要条件是 : 存
在 m≥1 , 使得对＂ i, j∈ S, p(ij m) > 0 .
7 .27 　设{ X n , n≥ 0} 是带一个吸收壁的随机游动 .状态空间
为 S = { 0 , 1 , 2 , … } , 转移概率为 p00 = 1 , ＂ i≥ 1 , p ii + 1 = pi > 0 ,
p ii - 1 = qi > 0 , pii = ri ≥0 , pi + qi + ri = 1 , T l0 = min { n: n≥1 , X0 = l,
Xn = 0} .
( k)
(1 ) 试求 P( Tl0 = k | X0 = l ) = f l0 ( l≥ 1 ) 及 E ( T l0 | X0 = l)
( l≥1) ;
(2 ) 试讨论在什么条件下 , 该链为常返链 ?
7 .28 　若一篇文章有 m 个错误 , 每校对一次至少纠正一个错
误 , 且遗漏下来的个数在 0 到 m - 1 之间是等可能的 .现在设原稿
有 i( i > 0) 个错误 , 为了改正全部错误 , 平均需要校阅几次 .
7 .29 　设 τ1 ,τ2 为相互独立的 P H 分布 ,τ1 ～ P H (α, P) ,τ2 ～
P H (β, T) , 其中 α= (α1 ,α2 ) ,β = (β1 ,β2 ) , P = ( p ij ) , T = ( tij ) 为二
阶转移概率矩阵 .试求 : ( 1 )τ1 + τ2 的矩阵表示 ; ( 2 )τ1 ∧τ2 的分
布律 .
7 .30 　设{ X n , n≥ 0 } 为离散分支过程 ( 参见 7． 3 节例 3 .4 ) .
Xn 表示第 n 代个体的数目 ,ξ表示某一代个体产生下一代的个数 .
如 X n = 0 , 则 Xn + 1 = 0; 当 Xn > 0 时 , 有 Xn + 1 = ξ1 +ξ2 + … +ξX n , 其
中{ξi , i≥1 }相互独立 , 与 ξ同分布 , 且与 X n 独立 .设 X0 = i > 0 ,
P(ξ= 0 ) = p0 = 1/ 20 , P(ξ= 1 ) = p1 = 1/ 10 , P(ξ= 2 ) = p2 = 17/ 20 .
试求 f i0 及 P( n→
lim Xn = ∞ ) .
∞
第8章
布朗运动
布朗运动最初是由英国生物学家布朗于 1827 年根据花粉微

粒在液面上做“ 无规则运动”的物理现象提出的 .1918 年维纳
( Wiener) 对这一现象在理论上作了精确的数学描述 , 并进一步研
究了布朗运动轨道的性质 , 提出了布朗运动空间上的测度与积分 ,
使得对布朗运动及其泛函的研究得到迅速而深入的发展 .布朗运
动作为具有连续时间参数和连续空间参数的一个随机过程 , 是一
个最基本、最简单同时又是最重要的过程 .许多其他的过程常常可
以看作是它的泛函或某种意义上的推广 .今天 , 布朗运动及其推广
已广泛地出现在许多纯科学与应用科学领域 .同时 , 由于布朗运动
与微分方程 ( 如热传导方程 ) 有密切的联系 , 它又成为概率与分析
联系的重要渠道 .在这一章里 , 仅对布朗运动作一简要的介绍 .
8 .1 　定义和性质
1 　布朗运动的定义
　　我们从一维直线上的随机游动引出布朗运动 .
(1 ) 先离散化 .让我们先考虑在一直线上的简单、对称的随机
1
游动 .设质点每隔 Δt 时间 , 随机地以概率 p = 向右移动 Δx > 0
2
1
单位 , 或以概率 q = 1 - p = 向左移动 Δx 单位 , 且每次移动相互
2
独立 , 记
300 　第 8 章布朗运动
1, 第 i 次质点向右移动 ,
Xi = 　 X( t) = t 时刻质点的位置 .
- 1, 第 i 次质点向左移动 ,
设 t = 0 时 , X(0) = 0 , 那么有 X( t) = Δx X1 + X2 + … + X t ,
Δt
t
Δt
t
其中表示不超过 t 的最大整数 .显然 X( t) = Δx ∑X k 是
Δt Δt k=1
独立同分布的随机变量之和 , 因而它们在互不重叠的时间区间上 ,
2
其增量相互独立, 且 E X i = 0 , DX i = E X i = 1 , 故此时 E X ( t) = 0 ,
t
DX ( t) = (Δx) 2 .
Δt
以上简单随机游动可作为微小粒子在直线上作不规则运动的
近似 .而实际粒子的不规则运动是连续进行的 , 为此 , 考虑 Δt→0
时极限情形 .
(2 ) 精确化 .通常情况下 , 令 Δt→0 ,Δx→ 0 .由实验得知 , 在许
多情形下 , 有 Δx = C Δt ( C > 0 为常数 ) , 下面假定在 Δx =
C Δt的条件下 , 推出其极限情形 .
2
显然 , 当 Δt→ 0 时 , E X ( t ) = 0; 而 Δt→ li m0 ( Δx )
lim0 D X ( t ) = Δt→
t
= C2 t .进而由表达式 X( t) = Δx X 1 + X2 + … + X t 是独
Δt Δt
立同分布 , 方差有限的随机变量之和 .易证它在互不重叠的区间
上 , 其增量相互独立 ; 同时由中心极限定理知 , 当 Δt→ 0 时 , X ( t)
的分布趋向于正态分布 , 即 Δt→0 时 , X( t) ～ N ( 0 , C2 t) .确切地 ,
＂ x∈ , t > 0 , 有
u2
X( t) 1 x
∫
-
lim P ≤ x = Φ( x ) = e 2
du .
Δt→ 0 C2 t 2π -∞
　　有了上述简单随机游动的极限描述 , 可以引出下面的定义 .
定义 1 .1 　若一族随机变量 { X( t) , t≥0 }满足 :
8 .1 定义和性质　 301
(1 ) { X( t) , t≥0 }在不重叠的区间上 , 其增量相互独立 ;

(2 ) ＂ s, t > 0 , X ( s + t) - X ( s) ～ N ( 0 , C2 t) , 即 X ( s + t) -
X( s) 是期望为 0 , 方差为 C2 t 的正态分布 ;
(3 ) X( t) 关于 t 是连续函数 .
则称 { X ( t ) , t ≥ 0 } 是布朗运动 ( 简记 B . M .或维纳过程
( W iener process ) ) .
注　事实上 , 由定义 ( 1) 及 (2 ) 可证 : 对几乎所有轨道 , X( t) 关
于 t 连续 .上述定义加上 (3 ) 是为了下面叙述与处理方便 .
以后如无特别声明 , 约定 X( 0) = 0 .
当 C= 1 时 , 称 { X ( t) , t≥ 0 } 为标准布朗运动 , 记为 { B ( t ) ,
t≥0} .它在 t 点的概率密度函数记为
x2
1 -
p( x, t) = e 2t . ( 1 .1)
2πt
　　根据上面布朗运动的特性可知 B( t2 ) - B( t1 ) ～ N( 0 , t2 - t1 ) ,
故其概率密度函数为
2
1 x
p( x, t2 - t1 ) = exp - . ( 1 .2)
2π( t2 - t1 ) 2( t2 - t1 )
2 　布朗运动的性质
定义 1 .2 　　随机过程 { X( t) , t∈ T} , 若对任意的 ti ∈ T ( i =
1 , 2 , … , n) , ( X( t1 ) , X( t2 ) , … , X ( tn ) ) 的联合分布为 n 维正态分
布 , 则称{ X( t) , t∈ T} 为正态过程 .
定理 1 .1 　布朗运动是正态过程 .设 { B( t) , t≥ 0} 为标准布朗
运动 , 则当 t0 = 0 , B ( 0 ) = 0 时＂ 0 = t0 < t1 < … < tn , ( B ( t1 ) ,
B( t2 ) , … , B( tn ) ) 的联合概率密度函数为
n
g( x1 , x2 , … , xn ; t1 , t2 , … , tn ) = ∏ p( x
i =1
i - x i - 1 , ti - ti - 1 ) ,
( 1 .3)
2
1 - x
其中 p( x, t) = e 2t 且 x0 = 0 .
2πt
证明　利用布朗运动的增量独立性 .
令 Y1 = B( t1 ) , Y i = B( ti ) - B( ti - 1 ) ( 2 ≤ i ≤ n) , 则 B( ti ) =
i
∑Y
k= 1
k ; 由布朗运动的定义知 Y1 , Y2 , … , Y n 相互独立 , Y n ～ N( 0 ,
ti - ti - 1 ) , 则其联合密度函数为
n
1 y2i
f ( y1 , y2 , … , yn ) = ∏i= 1 2π( ti - ti - 1 )
exp -
2( ti - ti - 1 )
,
由于 B( ti ) = ∑Y
k= 1
k , 故由第 3 章命题 6 .3 得 ( B( t1 ) , B( t2 ) , … ,
B( tn ) ) 的联合概率密度函数为
g( x1 , x2 , … , xn ; t1 , t2 , … , tn ) = f ( y1 , y2 , … , yn ) ・| J | ,
且易得 | J | = 1 , 故
g( x1 , x2 , … , xn ; t1 , t2 , … , tn )
n
1 ( xi - xi - 1 ) 2
=∏ exp -
i=1 2π( ti - ti - 1 ) 2 ( ti - ti - 1 )
n
= ∏ p( xi - xi - 1 , ti - ti - 1 ) .
i=1
定理得证 .
在得出了 ( B ( t1 ) , B( t2 ) , … , B ( tn ) ) 的联合概率密度函数之
后 , 可得以下推论 .
推论 1 　＂ 0 < t1 < t2 < … < tn - 1 < tn , 在 B( t1 ) = x1 , B( t2 ) =
x2 , … , B( tn - 1 ) = xn - 1 下 B( tn ) 的条件概率密度函数为
f ( xn | x1 , x2 , … , xn - 1 )
1 ( xn - xn - 1 ) 2
= exp - . ( 1 .4)
2π( tn - tn - 1 ) 2 ( tn - tn - 1 )
尤其是
8 .1 定义和性质　 303
P( B( tn ) ≥ xn - 1 | B( t1 ) = x1 , … , B( tn - 1 ) = xn - 1 ) = 1/ 2 ,
(1 .4a)
即布朗运动具有对称性 .
推论 2
E( B( tn ) | B( t1 ) = x1 , B( t2 ) = x2 , … , B( tn - 1 ) = xn - 1 ) = xn - 1 ,
( 1 .5)
D( B( tn ) | B( t1 ) = x1 , B( t2 ) = x2 , …, B( tn - 1 ) = xn - 1 ) = tn - tn - 1 .
( 1 .6)
推论 1 和 2 可以通过求条件概率密度函数的方法很容易求得 , 这
里不再赘述 .
推论 1 表明布朗运动具有这样一条性质 : 即已知现在 , 将来与
过去条件独立 .但是 , 对于 t1 < t2 < t3 , 如果在给定 B( t1 ) 与 B( t3 )
下求 B( t2 ) 的条件概率密度函数 , 结果会怎样呢 ?
先看看取 t1 = 0 , t3 = 1 , t2 = t, 0 < t < 1 的情形 .由 ( 1 .3 ) 式知 ,
在 B( 0) = 0 下 , B( t) , B(1 ) 的联合概率密度函数为
2 2
1 1 x ( y - x)
f ( x, y) = exp - + .
2π t( 1 - t) 2 t 1 - t
1
又在 B ( 0 ) = 0 下 , B ( 1 ) 的概率密度函数为 g ( y ) =
2π
y2
exp - , 从而在 B(0 ) = B(1 ) = 0 下 , B( t) 的条件概率密度为
2
f ( x, y)
f B( t) | B( 0 ) = B( 1 ) = 0 ( x) =
g( y)
2
1 1 x
= exp - ,
2πt( 1 - t) 2 t(1 - t)
仍为正态分布 .可以看出
E[ B( t) | B( 0) = B(1 ) = 0] = 0 ,
E[ B2 ( t) | B( 0) = B(1 ) = 0] = t( 1 - t) .
　　对于一般的情形 , 我们有以下的定理 .
定理 1 .2 　对 t1 < t < t2 , 给定 B( t1 ) = a, B( t2 ) = b, B( 0 ) = 0 ,
则 B( t) 的条件概率密度函数是一正态密度 , 其均值为 a + ( b - a)
- 1 - 1
( t - t1 ) ( t2 - t1 ) , 方差为 ( t2 - t) ( t - t1 ) ( t2 - t1 ) .
证明
E[ B( t) | B( t1 ) = a, B( t2 ) = b]
= E[ B( t) - B( t1 ) + B( t1 ) | B( t1 ) - B(0 )
= a, B( t2 ) - B( t1 ) = b - a]
= E[ B( t) - B( t1 ) | B( t2 ) - B( t1 ) = ( b - a) ] + a
＊
t - t1 t - t1
= ・ [ ( b - a) - 0 ] + a
( t - t1 ) ( t2 - t1 ) t2 - t1
= a + ( b - a) ( t - t1 ) ( t2 - t1 ) - 1 ,
上式“ ＊ ”处用到了第 4 章例 5 .6 的 (5 .8 ) 式 ( 二元正态条件期望的
公式 ) .条件方差的证明与上例类似 , 留作练习 .提示 : 先求相应的
条件概率密度函数 .
定理 1 .3 　设{ B( t) , t≥ 0 } 是正态过程 , 轨道连续 , B( 0 ) = 0 ,
＂ s, t > 0 , 有 E B( t) = 0 , E[ B( s) B( t) ] = t∧ s, 则 { B( t) , t≥ 0 }是布
朗运动 .反之亦然 .
证明　先证充分性　由定理 1 .1 知 , 若{ B( t) , t≥ 0} 是布朗运
动 , 则它是正态过程 .同时由布朗运动定义知 , E B( t) = 0 , 且轨道
连续 .设 0 < s≤ t, 则
E[ B( s) B( t) ] = E[ ( B( t) - B( s) + B( s) ) B( s) ]
2
= E[ ( B( t) - B( s) ) B( s) ] + E[ B ( s) ]
= E[ B( t) - B( s) ] E[ B( s) ] + s = s,
所以
E[ B( s) B( t) ] = t ∧ s, 　　 E[ B( t) ] = 0 . ( 1 .7)
　　再证必要性　当{ B( t) , t≥0 }是正态过程 , 且满足 (1 .7) 式时 ,
8 .1 定义和性质　 305
那么＂ s, t > 0 , 有
E[ B( t) - B( s) ] = E( B( t) ) - E( B( s) ) = 0 ,
2 2 2
E[ B( t) - B( s) ] = E[ B ( t) ] + E[ B ( s) ] - 2 E[ B( t) B( s) ]
= t + s - 2 ( t ∧ s) = | t - s | .
而＂ s1 < t1 ≤ s2 < t2 , 有
E[ { B( t1 ) - B( s1 ) } { B( t2 ) - B( s2 ) } ]
= E[ B( t1 ) B( t2 ) ] - E[ B( t1 ) B( s2 ) ] -
E[ B( s1 ) B( t2 ) ] + E[ B( s1 ) B( s2 ) ]
= t1 - t1 - s1 + s1 = 0 .
再由正态分布知 : 不相关即相互独立 , 所以 B( t) 是独立增量过程 ,
且 B( t) - B( s) ～ N ( 0 , | t - s | ) .又{ B( t) , t≥0 } 轨道是连续的 , 得
{ B( t) , t≥0 }是布朗运动 .
这样就得到了判断一个正态随机过程是否为布朗运动的充分
必要条件 , 从而得出一系列很有用的结论 .
定理 1 .4 　设{ B( t) , t≥ 0}是布朗运动 , 则 :
(1 ) { B( t +τ) - B(τ) , t≥0 } , ＂ τ≥0;
1
(2 ) B (λt) , t≥0 (λ> 0 ) ;
λ
1 1 d ef
(3 ) tB , t≥0 , 其中 t B 0;
t t t= 0
(4 ) { B T - S - B T , 0≤ S≤ T} ( T > 0 ) ;
仍为布朗运动 .
证明　利用定理 1 .3 的结论易证 , 详细的推导留给读者 .
至此 , 我们已经研究了不少有关布朗运动的重要性质和定理 ,
那么 , 它和我们上一章 ( 1 .2) 式所引出的鞅有什么关系呢 ? 这是一
个很有价值的问题 .我们先引入连续参数鞅的概念 .
定义 1 .3 　随机过程 { X ( t) , t≥ 0 } , 若＂ 0 ≤ t0 < t1 < … < tn <
t, E| X( t) | < ∞ , 且
E( X( t) | X( t0 ) , X( t1 ) , … , X( tn ) ) = X( tn ) 　 ( a .s .)
则称{ X( t) , t≥0} 为鞅 .
定理 1 .5 　设{ B( t) , t≥ 0} 为标准布朗运动 , 则 { B( t) , t≥ 0 } ,
2
{ B ( t) - t, t≥0 }都是鞅 .
证明　利用布朗运动的增量独立性不难证明 , 详细的推导留
给读者 .
由以上结论可知 , 布朗运动本身既是马氏正态过程 , 又是连续
鞅 .这个结果很别致 , 但并不奇怪 .因为我们分别讨论的泊松过程、
马尔可夫链、鞅、布朗运动等随机过程 , 不过是对一些随机过程的
某些方面的特殊性质进行了专门的、分类的讨论 , 而并不排斥这些
性质可以交叉、共存于一个随机过程中 .在介绍这些概念时只能
“串行”进行 , 但实际上要能够“ 并行”应用 , 融会贯通 .
8 .2 　首中时与最大值的分布
设{ B( t) , t≥ 0 } 为标准布朗运动 , 不妨设 B ( 0 ) = 0 .记 T a =
min{ t: t > 0 , B ( t ) = a} , Ta 表示首次击中 a 的时间 ( 首中时
( hitting time ) ) ; 要研究 P( Ta ≤ t) 有多大 , 仍然从事件的等价性
入手 .
对＂ t > 0 , 记 Mt = 0max B ( u) 表示 [ 0, t ] 上的最大值
≤ u≤ t
( maxima rn val ue ) , 先假定 a > 0 , 显然存在下述事件等价关系

{ Ta ≤ t} = { Mt ≥ a} , ( 2 .1)
从而有 P{ T a ≤ t} = P{ Mt ≥ a} .为求 P{ Ta ≤ t} , 注意到
P( B( t) ≥ a) = P( B( t) ≥ a | Ta ≤ t ) P( Ta ≤ t) +
P( B( t) ≥ a | Ta > t) P( Ta > t) .
显然 , P( B( t) ≥ a| Ta > t) = 0 , 又由布朗运动的对称性知 , 在 Ta ≤ t
条件下 , 即 B( T a ) = a 时 , ( B( t) ≥ a) 与 ( B( t) < a) 是等可能的 , 即
8 .2 首中时与最大值的分布　 307
1
P( B( t) ≥ a | Ta ≤ t) = P( B( t) < a | Ta ≤ t) = ,
2
故 P( T a ≤ t) = 2 P( B( t) ≥ a) .
于是 , 当 a > 0 时 ,
+∞ u2 +∞ x2
2 2
∫ ∫
- -
P( Ta ≤ t) = e 2t
du = e 2
dx
2πt a π a
t
a
= 2 1 - Φ ;
t
当 a < 0 时 , 由布朗运动的对称性 , 显然 P( T - a ≤ t) = P( Ta ≤ t) ,
所以对于一般的 a, 有
+∞ 2
2 - x | a|
P( Ta ≤ t) = ∫
π | a|
t
e 2
dx = 2 1 - Φ
t
, ( 2 .2)
这就是首中时的分布 .
由此可以推知两个重要的结论 :
(1 ) Ta 几乎处处有限 , 即 P( Ta < ∞ ) = 1 .因为
+∞ u2
2
∫
-
P( T a < ∞ ) = t→ P( T a ≤ t) = du = 1, 　
2
lim e
∞ π 0
( 2 .3)
即 a 点首中时 T a < ∞的概率为 1 .
(2 ) E Ta = + ∞ . ( 2 .4)
证明
∞ ∞
E Ta =∫ 0
P( Ta > t) d t = ∫ [1 - 0
P( Ta ≤ t) ] d t
∞ +∞ u2
∫ 2
∫
-
2
= 1 - e du dt
0 π | a| / t
∞ | a|/ t u2
2
∫∫
-
2
= e du dt
π 0 0
∞ a2 / u 2 u2
2
∫∫
-
2
= dt e du
π 0 0
∞ 2
2 1 e - u2 d u
∫
2
=a
π 2
0 u
1 2
2 1 - u2
∫
2
≥a 2 e du
π 0 u
1
2 1
∫ u du = + ∞,
2 - 1
≥a e
π 2
0
所以 E Ta = + ∞ .
8 .3 　布朗运动的各种变形与推广
1 　吸收布朗运动
　　设
B( t) , Ta > t,
X( t) =
a, Ta ≤ t,
其中 Ta = min { t: t > 0 , B( t) = a} .称 { X ( t) , t≥ 0 } 为吸收布朗运
动 .表示一旦质点到达 a 后 , 即被吸收停留在 a 点 .
可以证明 X( t) 的概率分布为
P( X( t) ≤ y ) = 1 , 当 y > a,
∞ u2
2
∫e
-
当 y = a,
2t
P( X( t) = a) = ,
a
2πt ( 3 .1)
y 2
- u
2
P( X( t) ≤ y ) = ∫ 当 y < a.
2t
e
y -2x
2πt
2 　反射布朗运动
设 Y ( t) = | B ( t) | , 则称 { Y ( t) , t≥ 0 } 为在原点反射的布朗
运动 .
我们来推导 Y ( t) 的分布 .显然 , 当 y < 0 时 , P( Y ( t) ≤ y ) = 0;
8 .3 布朗运动的各种变形与推广　 309
当 y > 0 时, 有
P( Y ( t) ≤ y) = P( - y ≤ B( t) ≤ y) = 2 P( B( t) ≤ y) - 1
y u2
2
∫
-
2t
= e du - 1, ( 3 .2)
-∞
2πt
这样就得到了它的分布 .
3 　几何布朗运动
B( t )
设 W ( t) = e , 则称 { W ( t) , t≥ 0}为几何布朗运动 .
几何布朗运动有时可以作为相对变化为独立同分布情况的模
Y ( n)
型 .例如 , 设 Y( n) 是 n 时刻商品的价格 , = X ( n) 是独立同分布
Y( n - 1 )
n
的 .如取 Y ( 0 ) = 1 , Y ( n) = X( 1 ) X ( 2 ) … X( n) , 则 ln Y ( n) = ∑ ln X
i= 1
( i) ,所
以当 n → ∞ 时 , 根据中心极限定理知 , { ln Y ( n) , n ≥ 1 } 渐近为布朗
运动 .于是{ Y ( n) , n ≥ 0 } 就近似为几何布朗运动 .
取 B( t) 的矩母函数 ( s) = E[e sB ( t) ] , 则
∞ 2 x ts 2
1
∫
sB( t) sx -
e dx = e 2 .
2t
( s) = E[ e ] = e
-∞
2πt
相应地
t
B( t )
E( W ( t) ) = E( e ) = (1 ) = e 2 , ( 3 .3)
D( W ( t) ) = E( W2 ( t) ) - [ E( W ( t) ) ] 2 = E( e2 B( t) ) - et
= (2 ) - et = e2 t - e t . ( 3 .4)
　　这样就得到了几何布朗运动的一阶矩和二阶矩 .
4 　漂移布朗运动
设{ B( t) , t≥0 }为布朗运动 , 记 X( t) = B( t) + μt,μ为常数 , 称

{ X( t) , t≥0} 是带有漂移系数 μ的布朗运动 .
漂移布朗运动的背景是一个质点在直线上作非对称的随机游
动 , 确切叙述如下 : 一质点在直线上每经 Δt 随机地移动 Δx, 每次

向右移 Δx 的概率为 p , 向左移 Δx 的概率为 q, 且每次移动相互独
立 , 以 X( t) 表示 t 时刻质点位置 , 令
1, 第 i 次向右移 ,
Xi =
- 1, 第 i 次向左移 ,
则
X( t) = Δx X1 + X2 + … + X t .
Δt
1 1
　　设 Δx = Δt, p = (1 + μ Δt ) , q = (1 - μ Δt ) , 对于给
2 2
定的 μ> 0 , 取充分小的 Δt, 使 μ Δt < 1; 当 Δt→ 0 时 , E X ( t ) =
μt, D X( t) = t, 所以 X( t) ～ N(μt, t) .
将带漂移的布朗运动的定义写成微分形式, 得 d X( t) = d B( t) +
μd t, 即质点 t 时刻位移的增量分解为随机性增量与确定性增量
之和 .
一般地 , 有如下推广 : d X( t) = σd B( t) + μd t .若扩散系数 σ与
漂移系数 μ 不是常数 , 而是 t 与 X ( t) 的函数 , 那么有如下更一般
的随机微分方程
d X( t) = σ( t, X( t) ) d B( t) + μ( t, X( t) ) d t,
这类随机微分方程可用以描述分子的热运动 , 电子的迁移运动规
律等 .例如 , 以 X( t) 描述一个粒子在液体表面 t 时刻的速度 , 有
d X ( t) d B( t)
m = - f X( t) + , 其中 m 为质点质量 , - f X ( t) 为粒
dt dt
d B( t)
子与液面的摩擦阻力 , f > 0 为常数 , 而为由分子撞击产生的
dt
总的合力 .求解这一类方程在物理学工程中是常见的 , 而这离不开
布朗运动理论 .
可见漂移布朗运动很具有实际意义 , 只要赋予相应系数以物
理意义 , 就可以用它来刻画许多复杂的难以研究的物理过程、工程
8 .4 布朗运动轨道的性质＊　 311
技术及经济现象 .
8 .4 　布朗运动轨道的性质＊
本节将通过以下几个命题来研究布朗运动轨道的性质 .
以下均设{ B( t) , t≥0 }为标准布朗运动 , 且 B( 0) = 0 .
命题 4 .1 　对任意固定的 t > 0 , 有
n
2 2
k k - 1
∞∑
P ω: n→
lim B nt - B n t = t = 1 . ( 4 .1)
k= 1 2 2
2n 2
k k - 1
　　证明　＂ n ∈ \ { 0} 记 Xn = ∑
k= 1
B nt - B
2 2
n t ,要
a .s .
证 Xn t, 由第 5 章定理 4 .1 的推论 1 , 只需证明 : ＂ ε > 0 ,
∞
∑ P(ω:
n= 1
| Xn - t | ≥ ε) < ∞ 易知
2n
k - 1　 2
k
EX n = E ∑
k=1
B nt - B
2 2n 　
t
n
2 2
k k- 1
=∑ E B nt - B n t
k= 1 2 2
n
2
= ∑ 1n t = t,
k= 1 2
由切比雪夫不等式得
DX n
＂ ε> 0 , P(ω: | X n - t | ≥ε) ≤ 2 ,
ε
2n
k k - 1
∑Y
2
再令 Yk = B nt - B t , 则 Xn = k ; 又 Yk ～
2 2n k= 1
2n
1
N 0 , n t , 且 Y k (1 ≤ k ≤ n) 相互独立 , 所以 DX n = D∑ Y k =
2 2
2 k=1
2n
∑ DY k .再由正态分布的性质知
2
k= 1
2 2 2
2 4 1 2 2 1 1
DY = EY - ( EY ) = 3 n t
k k k - t = 2 nt ,
2 2n 2
得
2
1 n 1
DX n = 2 n t 2 = n -1 t,
2 2
故
∞ ∞ ∞
DXn
∑ P(ω: | Xn - t | ≥ ε) ≤ ∑ 2 = t2 ∑ n1- 1 = 22t < ∞ .
n= 1 n= 1 ε ε n= 1 2 ε
＂ t > 0 , 取 0 = t0 < t1 < … < tn = t, 记 λ= 1max ( tk - tk - 1 ) , 则有下面
≤ k≤ n
的命题 .
命题 4 .2 　对任意固定 t > 0 , 有
n
m .s .
λ→ 0 ∑
2
lim ( B( tk ) - B( tk - 1 ) ) t. ( 4 .2)
k= 1
　　证明　要证明以上命题 , 只需证明
n
2
∑ ( B( tk ) - B( tk - 1 ) )
2
li mE - t = 0 .
λ→ 0 k=1
为此计算
n
2
∑ ( B( tk ) - B( tk - 1 ) ) - t
2
E .
k= 1
记 Y k = B ( tk ) - B( tk - 1 ) ( 1 ≤ k≤ n) , 由 Y k ～ N ( 0 , tk - tk - 1 ) , 知
E Y4k = 3 ( tk - tk - 1 ) 2 , E Y2k = DY k = tk - tk - 1 , 且 Y2k ( 1≤ k≤ n) 相互独
立 , 故当 k≠ l 时 , E Y2k Y2l = E Y2k E Y2l = ( tk - tk - 1 ) ( tl - tl - 1 ) , 因此
n
2
∑ ( B( tk ) - B( tk - 1 ) ) - t
2
E
k=1
n n n
2 2
∑Y ∑Y ∑Y
2 2 2 2
=E k - t = E k - 2E k t+ t
k=1 k=1 k= 1
= 3∑ ( tk - tk - 1 ) 2 + 2 ∑ ( ti - ti - 1 ) ( tj - tj - 1 ) -
k=1 i< j
∑(t
2
2 k - tk - 1 ) t + t
k=1
= 2∑ ( tk - tk - 1 ) .
2
k=1
n n
又 ∑ ( tk - tk - 1 ) ≤ λ∑ ( tk - t k - 1 ) = λt , 则当 λ→ 0 时 ,
2
k= 1 k= 1
n
2
∑ ( B( tk ) - B( tk - 1 ) )
2
E - t → 0,
k= 1
故
n
m .s .
λ→ 0 ∑
2
lim ( B( tk ) - B( tk - 1 ) ) t.
k= 1
　　引理 4 .1 　对任意固定 t > 0 , 记
k k - 1
Y n = maxn | B n t - B t | ,
1 ≤ k≤ 2 2 2n
有
P ω: nlim Yn = 0 = 1 .
→∞
　　证明　为证结论 , 由第 5 章定理 4 .1 知 , 只需证＂ ε> 0 ,
∞
li m∑ P ( | Y k | ≥ε) = 0 .利用推广的切比雪夫不等式 , 对＂ ε> 0 ,

n→ ∞
k= n
有
2k
l l - 1
P( | Y k | ≥ε) = P l∪ B k t - B t ≥ε
=1 2 2k
2k
l l - 1
≤∑ P B k t - B t ≥ε
l= 1 2 2k
2k 4
l l - 1
≤ ∑ε E B k t - B
- 4 2 -4 - k
t = 3tε 2 ,
l= 1 2 2k
∞ ∞
故 ∑ P( | Y k | ≥ε) ≤ 3 t ε ∑2 = 6 t2ε- 4 2 - n → 0 ( n → ∞ ) .引理

2 -4 - k
k= n k= n
得证 .
命题 4 .3 　对任意固定 t > 0 , 有
2n
kt k - 1t
∞∑
P ω: n→
lim B n - B n = ∞ = 1 . ( 4 .3)
k= 1 2 2
　　证明　记
2n 2
k k - 1t a .s .
A = ω: ∑ B nt - B n t .
k= 1 2 2
k k - 1 a .s .
B = ω: max n B n t - B t 0 ,
1≤ k≤2 2 2n
2n
kt k - 1t
n→ ∞ ∑
C = ω: lim B n - B n = ∞ .
k=1 2 2
易知
n
2 2
k k - 1t kt k - 1t
∑
k=1
B nt - B
2 2
n ≤ maxn
1 ≤ k≤ 2
B
2
n - B
2
n
2n
k k - 1
∑
k=1
B
2 n t - B
2n
t ,
有
n
2 2
k k - 1t
∑ B nt - B
2 2
n 2
n
k k - 1
∑
k=1
≤ B n t - B n t ,
k k- 1 k= 1 2 2
max
1 ≤ k≤ 2 n B nt - B n t
2 2
由以上不等式知, 当 n → ∞, 且 ω ∈ AB 时 , 有
2n
k k - 1
∑
k= 1
B
2 n t - B
2n
t → ∞ , 故得 ω∈ C, 于是 AB C; 又由
命题 4 .1 及引理 4 .1 有 P( A) = P( B) = 1 , 而 P( A) = P( A B) +
P( A B ) , 0 ≤ P( A B ) ≤ P( B) = 1 - P( B) = 0 , 于是得 P( AB ) =
P( A) = 1 , 故而 1 = P( AB ) ≤ P( C) ≤ 1 , 从而得 P( C) = 1 .命题
得证 .
命题 4 .3 说明对 t 在任意区间上 , 对几乎所有的 ω, 布朗运动
B( t,ω) 关于 t 不是有界变差函数 .
注　可以证明对于任意固定的 t, 几乎对所有的 ω, B( t) 关于 t
没有有限的导数 .
命题 4 .4 　对任意固定 t > 0 , 有
n
m .s . 1 2 1
λ→ 0 ∑
lim B( tk - 1 ) ( B( tk ) - B( tk - 1 ) ) B ( t) - t, 　
k= 1 2 2
( 4 .4)
n
m .s . 1 2 1
λ→ 0 ∑
lim B( tk ) ( B( tk ) - B( tk - 1 ) ) B ( t) + t . ( 4 .5)
k=1 2 2
　　证明　令
n
An = ∑ B( t ) ( B( t )
k=1
k k - B( tk - 1 ) ) ,
n
Cn = ∑ B( t
k=1
k -1 ) ( B( tk ) - B( tk - 1 ) ) ( n ∈ \ {0 } ) ,
则
n
An + Cn = ∑ ( B( tk ) + B( tk - 1 ) ) ( B( tk ) - B( tk - 1 ) )
k=1
= ∑ ( B ( tk ) - B ( tk - 1 ) ) = B ( t) .
2 2 2
k=1
n
m .s .
∑ ( B( tk ) - B( tk - 1 ) )
2
由命题 4 .2 得 An - Cn = t(λ→ 0 ) , 故
k= 1
2 2
A n = B ( t) - Cn , 而由均方收敛的定义知 λlim E( A n - Cn - t) = 0 ,
→0
2 2
有lim E( B ( t) - 2 Cn - t) = 0 , 从而得
λ→ 0
2
1 B2 ( t) - 1 t
lim E Cn - = 0,
n→ ∞ 2 2
故由此得到
n 2
1 B2 ( t) - 1 t
lim E
λ→ 0 ∑ B( t
k= 1
k- 1 ) ( B( t k ) - B( tk - 1 ) ) -
2 2
= 0,
(4 .4 ) 式成立 .同理可以证明 (4 .5 ) 式 .
在介绍漂移布朗运动时 , 我们提到了随机微分方程 , 与分析中
类似 , 要想解随机微分方程 , 就必须定义随机积分 , 也称伊藤积分 ,
然后将相应的微分方程转化为积分方程来求解 .关于布朗运动的
积分是最简单也是最常用的一种 .
定义 4 .1 　 ( 伊藤积分 ) 　称一随机过程{ g( t) , t ≥ 0 } 关于布
朗运动的伊藤积分是指 : 对于区间 [ 0 , t] 的任一分割 0 = t0 <
t1 < … < tn = t, 记 λ = 1max ( tk - tk - 1 ) , 若当 λ→ 0 时和式
≤ k≤ n
n
∑ g( t
k= 1
k- 1 ) ( B( tk ) - B( tk - 1 ) ) 的均方极限存在 , 则称该极限为 g( t)
t
关于 B( t) 的伊藤积分 , 并记作 ∫ g( s) d B( s) , 也即
0
n
m .s . t
λ→ 0 ∑
lim g( tk - 1 ) ( B( tk ) - B( tk - 1 ) )
k= 1
∫ g( s) d B( s) . ( 4 .6)
0
例 4 .1 　求布朗运动关于自身的伊藤积分 ∫ B( s) d B( s) .
0
解　由定义知
n t
m .s .
λ→ 0 ∑
lim B( tk - 1 ) ( B( tk ) - B( tk - 1 ) )
k=1
∫ B( s) d B( s) ,
0
由命题 4 .4 知
n
m .s . 1 B2 ( t) - 1 t,
λ→ 0 ∑
lim B( tk - 1 ) ( B( tk ) - B( tk - 1 ) )
k= 1 2 2
故由均方收敛极限的唯一性知
t
1 2 1
∫ 0
B( s) d B( s) =
2
B ( t) -
2
t. ( 4 .7)
　　由上例可以看到 , 伊藤积分与普通积分 ( 这里指斯蒂尔杰斯的

练习题　 317
积分 , 下同 ) , 有以下几点明显的不同 :
(1 ) 伊藤积分定义中最后一步取极限是在均方意义下的极
限 , 而不能定义和理解为当 λ→0 时 , 是对每一个 ω的求极限 .这是
因为由命题 4 .3 可知 , 对几乎所有的 ω, B( t, ω) 关于 t 在任意给定
小区间[ a, b] 上都不是有界变差函数 , 故而对几乎所有的 ω, 其积
分和式都不存在有限的极限 .
(2 ) 伊藤积分在定义积分和式时 , 被积函数在小区间上要取
左端点 , 这与普通积分可任意取不同 .这样做的理由可由命题 4 .4
看出 , 若不是固定取左端点 , 而固定取右端点或任意取 , 那就会导
致极限值不同或极限根本不存在 .
(3 ) 伊藤积分的结果通常不满足普通积分中的牛顿－莱布尼
茨 ( Newt on－L eibniz ) 公式 , 以上务必请初学者注意 .
伊藤积分和伊藤随机积分方程在现代信息科学、管理科学与
金融科学中已成为最重要的数学模型之一 , 请有兴趣的读者参看
相关的文献 .
练　习　题
8 .1 　设{ B( t) , t≥0} 为标准布朗运动 ( 以下如无特殊指出 , 均

假定 B( 0) = 0) .
(1 ) ＂ s, t > 0 , 求 E[ B( s) B( t) ] ;
(2 ) 求 B( t) 在 B( s) = x1 , B( u) = x2 下的条件概率密度函数
及 E[ B( t) | B( s) = x1 , B( u) = x2 ] , 其中 0 < s < t < u;
(3 ) ＂ 0 ≤ s< t < u, 求 E[ B( s) B( u) | B( t) ] ;
(4 ) 令 X( t) = t B( 1/ t) , 当 t > 0 时 , X( 0) = 0 , 当 t = 0 时 , 问若
0 < t1 < t2 < t3 , X( t1 ) 与 X ( t3 ) - X( t2 ) 是否独立 ? 并证之 .
8 .2 　设{ B( t) , t≥0} 为标准布朗运动 .
(1 ) 给定 B( s) = x, 求 B( s + t) 的条件概率密度 ;
2
p 1 p
(2 ) 证 = 2 ;
t 2 x
( 3 ) ＂ 0 ≤ t1 < t2 < … < tn + 1 , 给定 B( ti ) = x i ( 1 ≤ i≤ n) , 求
B( tn + 1 ) 的条件概率密度 , 及 P { B ( tn + 1 ) ≤ x | B ( t1 ) = x1 , … ,
B( tn ) = xn } , E{ B( tn + 1 ) | B( t1 ) , … , B ( tn ) } , va r { B( tn + 1 ) | B( t1 ) =
x1 , … , B( tn ) = xn } , ＂ x∈ ;
(4 ) ＂ 0 < tn + 1 < tn < … < t1 , 给定 B ( ti ) = x i ( 1 ≤ i≤ n) , 求
B( tn + 1 ) 的条件概率密度函数 .
1
8 .3 　 Y ( t) = t B ( t > 0 ) , Y ( 0 ) = 0 , Z( t) = B( t) - t B( 1 ) ,
t
1
W ( t) = B( a2 t) ( a > 0 ) , U ( t) = ( t + 1) Z( t/ ( t + 1) ) .
a
(1 ) 证明 : { Y ( t) , t≥0} { W ( t) , t≥0} , { U ( t) , t≥ 0} 都是布朗
运动 ;
(2 ) 求 Z( t) 的概率密度函数 .
8 .4 　令 V ( t) = exp( - αt) B[ exp ( 2αt) ] .求证 : { V ( t) , t≥ 0}
是平稳正态过程 ( 称为奥恩斯坦－乌伦贝克 ( Orn st ein－U hlenback)
过程 ) 并求 E( V ( s) V ( t) ) 及 V ( t) 的概率密度函数 .
8 .5 　求 | B( t) | , | 0mi n B ( s) | , M ( t) = 0max ( B( s) ) 及 δ( t ) =
≤ s≤ t ≤ s≤ t
M( t) - B( t) 的概率密度函数 .
t
8 .6 　求 S( t) = ∫ B( s) d s 的协方差、方差及 ( S( t ) S( t ) ) 的
0
1 2
联合概率密度函数 .
8 .7 　证明 P{ M( t) > x | B( t) = M( t) } = exp( - x2 / 2 t) .
( 提示 : 求在给定 δ( t) = M( t) - B( t) = 0 下 M( t) 的条件
分布 .)
8 .8 　设 μ > 0, M = max X( t) , 证明: α > 0 , P( M > α) =
t≥ 0
exp (2μα) .
练习题　 319
x2 2
1 - p 1 p
8 .9 　设 p( x, t) = e , 证明
2t
= 2 .
2πt t 2 x
8 .10 　求 P( T1 < T - 1 < T2 ) .提示 : 利用全概率公式及布朗
运动的对称性 .
8 .11 　 V ( t) 同题 8 .4 , 求 :
V ( t + h) - V( t) V( t)
(1 ) lim E ;
h→0 h
( V ( t + h) - V ( t) ) 2
(2 ) lim E V( t) .
h→0 h
8 .12 　设 0 < t1 < t2 , 记
A( t1 , t2 ) = {ω: ｖ t ∈ ( t1 , t2 ) , B( t) = 0} ,
A( t1 , t2 ) = {ω: ＂ t ∈ ( t1 , t2 ) , B( t) ≠ 0 } .
证明 P( A( t1 , t2 ) ) = ( 2/ π) arcsin t1 / t2 .( 提示 : 利用首中时及全
概率公式 .上式即为著名的过零点的反正弦定理 .)
8 .13 　设 τ0 = sup { t: 0 < t < a, B( t) = 0 } ( a > 0 ) .试证明 :
＂ 0 < t0 < a, P(τ0 ≤ t0 ) = (2/ π) ar csin t0/ a .
8 .14 　设 τ0 同上题 .记 τ1 = inf{ t: t > a, B( t) = 0 } ( a > 0 ) , 试
证明 : ( 1) P(τ1 < t1 ) = ( 2/ π) a rccos a/ t1 , t1 > a; ( 2) ＂ 0 < t0 <
a < t1 , P(τ0 < t0 ,τ1 > t1 ) = ( 2/ π) a rcsin t0 / t1 .
8 .15 　设 U ( t) = e - t B ( e2 t ) , ＂ 0 < s, t, 求 U ( s) , U ( t) 的联合概
率密度 .
8 .16 　设 W ( t) = e B( t ) 为几何布朗运动 .试求下列系数 :
μ( x) = lim+ E[ W ( t + h) - W ( t) | W ( t) = x]/ h, x > 0 ( 漂移
h→0
系数 ) ;
2 2
σ ( x ) = lim+ E[ ( W ( t + h) - W ( t) ) | W ( t) = x]/ h, x > 0 ( 扩散
h→ 0
系数 ) .
8 .17 　设 T (λ) = inf{ t: t > 0 , B( 0) = 0 , B( t) =λ} (λ> 0) .证明
T (λ1 +λ2 ) 与 T(λ1 ) + T (λ2 ) 同分布 (λi > 0 ( i = 1 , 2) ) .

8 .18 　设 a, b > 0 , 试证 : P{ ＂ u∈[ 0 , t] , B( u) ≠ 0 | B( 0) = a,
- 2 ab/ t
B( t) = b} = 1 - e .
k k - 1 n
8 .19 　记 Δnk = B - B ( n ≥ 1 , 1 ≤ k ≤ 2 ) , Sn =
2n n
2
2n
∑Δ
2
nk .求 :
k= 1
2 2 2
(1 ) E(Δnk | Δnk ) 及 E(Δnk ・Δnk + 1 | Δnk ,Δnk + 1 ) ;
(2 ) ES2 及 ES22 ;
(3 ) ES n 及 E S 2n .
8 .20 　 Δnk , Sn 同上 .
(1 ) 求 E( S2 | S1 ) ;
(2 ) 试证 : E [Δ2n + 1 , 2 k - 1 + Δ2n + 1 , 2 k | B ( 1/ 2 n ) , … , B ( 2 n/ 2 n ) ] =
(Δ2nk + 1)/ 2 ;
1
(3 ) 证明 : E( S n + 1 | Sn ) = ( Sn + 1 ) .
2
8 .21 　 Δnk , Sn 同 8 .1 9 题 .
(1 ) 证明 : E( S1 | S2 ) = S2 ;
(2 ) 证明 : E[Δ2nk | Δ2n + 1 , 2 k - 1 , Δ2n + 1 , 2 k ] = Δ2n + 1 , 2 k - 1 + Δ2n + 1 , 2 k ;
(3 ) 试证 : E( S n | Sn + 1 ) = Sn + 1 .
第9章
参数估计
9 .1 　数理统计的研究对象及基本概念
通过前几章的介绍可知 , 很多随机现象的规律性可以用随机
变量和随机过程来描述 , 而要刻画它们需要知道相应的概率分布 ,
或它们的某些数字特征和参数 .然而 , 在许多实际问题中对这些往
往知之甚少 , 或只知部分信息 .对此 , 用什么方法才能确定该随机
变量的分布或其参数呢 ? 这就需要掌握数理统计的基本理论与
方法 .
1 　数理统计的研究对象
从本章起 , 简要介绍数理统计的两个基本内容 : 估计与检验 .

数理统计是随机数学的重要组成部分 , 它和概率论联系非常密切 ,
可以说 : 概率论是数理统计的重要基础 , 而数理统计是概率论的
重要应用 .本书力求对蕴含在数理统计中的那些独特的思维方式
与推断依据作一些粗浅介绍 , 并给出一些典型的例子 , 而不去罗列
一大堆各种不同形式的具体做法 .务必请读者重点放在领略思路
及举一反三能力的训练上 .
数理统计应用范围极为广泛 , 至今已渗透到人类社会生活的
各个领域 .例如 , 在一大堆杂乱无章的信息与数据面前 , 如何分析
处理 , 去伪存真 , 找出其数据中反映的规律与模型 .又如要研制一
种新的药品 ( 或新产品 ) , 而影响药品的功能与质量的因素非常繁
多 ( 不仅有成分的配比还有工艺条件等 ) , 如何全面与科学地安排
322 　第 9 章参数估计
试验 , 以便在较短时间内找出疗效好的药品配方与工艺条件 , 如何
找出影响性能的主要因素以及它们的数量关系 ? 又如 , 一个工厂
每天生产一大批产品 , 如何进行质量管理与控制 , 如何预测未来产
品的销售量 ? 又如 , 面对天花乱坠的股票波动与金融风险 , 如何作
出较有把握的预测 , 抓住机遇作出明智的决策 ? 等等 .数理统计将
为这些问题提供富有启发性的思维方法与强有力的工具 .下面举
几个具体例子 :
(1 ) 如何估计产品的寿命 ? 这是工业品质量管理中极重要的
问题 .为了评价某批电子设备的使用寿命 , 随机抽取了 18 台做试
验 , 测得寿命数据如下 ( 单位 : 小时 ) : 17 , 29 , 50 , 68 , 100 , 130 ,
140 , 270 , 280 , 340 , 410 , 450 , 520 , 620 , 190 , 210 , 800 , 1100 .假设使
用寿命服从指数分布 .问 : 整批电子设备中 , 寿命超过 200 小时的
占多大比例 ? ( 由本章随后要介绍的参数估计方面的知识可知 , 这
- 200/ 318
个比例大约是 e = 0． 533 .)
(2 ) 为了探讨吸烟与患慢性支气管炎是否关联 , 调查了 339
人 , 情况如下表 :
人数患慢性支气管炎未患慢性支气管炎合计
吸烟 43 162 205
不吸烟 13 121 134
合计 56 283 339
　　问 : 从这批数据能否断定患慢性支气管炎与吸烟有关 ? ( 答
案是肯定的 , 这是一个统计推断问题 .)
数理统计的主要内容是 : 应用概率论和数学方法 , 研究怎样
收集 ( 通过试验或观察 ) 带有随机误差的信息与数据 , 建立适当的
随机数学模型 , 并在设定的模型 ( 称为统计模型 ) 之下 , 对这种信息
与数据进行分析 ( 称为统计分析 ) .以对所研究的问题作出推断 ( 称
为统计推断 ) 与决策 .下面再举一例来说明数理统计研究的两个基
9 .1 数理统计的研究对象及基本概念　 323
本内容 .
例 1 .1 　某工厂每月生产大批电子元件 .按以往的试验数据
- λx
分析结果认为元件的寿命服从指数分布 , 即 f ( x ) = λe I( x > 0 ) , 但
每月生产元件的参数 λ并不知道 , 那么 : ( 1 ) 该月生产元件的平均
寿命如何估计 ? (2 ) 如果你是使用单位 , 要求平均寿命能达到某个
指定的数 , 例如 5000 小时 .问这批元件可否被接受 ?
如果该分布中的参数 λ已知 , 则可知其平均寿命为 1/ λ, 于是
上面两个问题马上就可以得到回答 .但现在 λ是未知的 , 于是需要
从一大批元件中随机抽取若干个 , 例如 n 个 , 并测出其寿命分别为
X1 , … , Xn .然后将得到的部分信息 , 经过一定的加工 , 便能较好地
估计未知参数λ与平均寿命 .例如用其算术平均值珡
X = ( X1 + … +
Xn )/ n 去估计未知的平均寿命 1/ λ.
问题 (1 ) 称为参数估计问题 .这时考虑使用 1/ 珡
X 作为未知参
数λ的估计 .显然由于随机抽取 , 自然珡
X 亦是随机的 , 那么①这种
估计的精度与误差有多大 ? ②估计量与 λ之差不超过给定的允许
误差有多大把握 ( 概率可信度 ) ? ③为要保证满足给定的“精度”和
“可信度”, 至少要多大样本容量 n 才能达到目的 ? ④ 有没有更好
的估计方法 ? 这些都是参数估计研究的主要内容 .参数估计是数
理统计中的基本问题之一 .
问题 (2 ) 与 ( 1 ) 不同 , 问题 ( 2 ) 是要判断总体的均值是否达到
5000 .通常把对总体的某种要求作为对总体的一个假设 ( 记为
H0 ) 提出 , 然后用样本的观察结果对总体的假设 H0 进行检验 , 最
后作出接受或拒绝 H0 的决择 .显而易见 , 当珡
X 取值珚
x 比 5000 大
很多 , 就应该接受 H0 , 且珡
X 越大就越有理由与把握接受 H 0 ; 反
之 , 就应拒绝 H0 .那么 ① 对给定的假定 H0 , 如何制定检验 H0 成
立的检验准则 ? ②给定一检验法 , 通过检验 , 接受与拒绝 H0 的概
率各有多大 ? ③如何比较与衡量不同检验法的优劣 ? ④为了减少
推断失误的概率 , 该选择多大的 n 才能达到目的 ? 这类问题称为
假设检验问题 , 也是最重要的统计问题之一 .
2 　总体和样本
总体是指所研究对象全体构成的集合 .总体的元素 , 称为个
体 .如在例 1． 1 中一大批元件就是问题的总体 , 而每一单个元件就
是一个个体 .在数理统计中 , 主要关心的是对象的某些数量指标的
统计规律性 .因此可用随机变量 X 的取值全体作为总体 , 简称 X
为总体 ( 或母体 ) .X 的全部统计规律性可用 X 的分布函数 F ( x)
来刻画 , 称 F( x) 为总体分布 , 记为 X～ F( x ) .有时 , 总体 X 的分布
也用 f ( x) 表示 , 当总体 X 为离散型随机变量时 , 它表示分布律 ;
当总体 X 为连续型随机变量时 , 它表示概率密度函数 ( 简称密度
函数 ) .
为了研究总体的性质 , 最好是把每个个体的指标都加以观测 ,
但这往往是不必要的 , 有时甚至是不可能的 , 怎么办呢 ? 一个主要
的方法 , 即从总体中选取少量个体作为代表 , 即随机抽样法 .然后
对抽取的部分个体进行观测与研究 , 从而推断总体的性质 .从总体
中抽取的部分个体称为样本 .从总体 X 中抽取的 n 个个体记为
X1 , … , X n , 这 n 个个体 X 1 , … , X n 称为总体 X 的一个容量为 n 的
样本 ( 或称子样 ) .本书中的样本通常是按“简单抽样”抽取一部分
个体 .所谓“ 简单抽样”是指总体中的每个个体每次被抽出是等可
能的 .为了使样本更具代表性 , 且能从有限的样本中包含与提取更
多的信息 , 要求抽取 ( 观测 ) 是彼此独立的且与总体同分布 .由此引
进下面的定义 .
定义 1 .1 　称 X1 , … , Xn 是来自总体 X 的一个容量为 n 的样
本 ( 子样 ) , 若 X1 , … , X n 独立同分布 , 且每个 Xi 均与 X 同分布 , n
称为样本容量 , X1 , … , X n 的全体称为一组样本 , 而 X i ( 1 ≤ i≤ n)
称为其中的第 i 个样本 .
显然 , 若总体 X 的分布为 f ( x ) , 则其样本 X1 , … , X n 的分布
为 ∏ f ( xk ) .
k= 1
3 　统计量
X1 , … , Xn 作为来自总体 X 的一组样本 , 包含了总体分布的
信息 , 利用它对 X 的分布规律进行统计推断 , 但因为样本是 n 维
的 , 这些信息是分散到样本的每个分量上的 .因此 , 直接从样本出
发来推断总体分布是不方便的 .为此 , 需要对样本进行加工 , 将样
本中分散的信息通过适当的变换 , 浓缩起来 , 以便更加突出地显示
出总体某一侧面的特性 .所谓统计量 , 就是不含未知参数的样本的
函数 .特别地 , 统计量只依赖于样本 , 而不依赖未知参数 .要根据不
同的需要 , 对样本进行不同的加工与提炼 , 从而把样本中蕴含的总
体的不同侧面的特性突出反映出来 , 就可以对总体的某些参数与
性质作出尽可能高精度的估计与可靠的推断 .
2
例如 , 设 X1 , … , X n 是从正态总体 X ～ N (μ,σ ) 中抽出的样
本, 则珡 X = ( X1 + … + Xn )/ n 是统计量 , 因为它完全由样本
X1 , … , Xn 决定 .而当参数 μ未知时 , 珡 X - μ就不是统计量 .同理 ,
n
1
∑( X - 珡
X ) 2 也是统计量 .通常称珡
X 为样本均值 , 称 S2
2
S = i
n-1 i=1
2
为样本方差 .显然统计量珡
X 与 S 是对样本的不同加工 , 它们各自
2
显露出总体不同侧面 ( 例如 μ与σ ) 的性态 .常用的统计量是样本
均值与样本方差等 .
定义 1 .2 　设总体 X～ F( x ) , X1 , X2 , … , Xn 为其样本 , E X =
θ, D X =σ2 , 则分别称
n n
∑ X/ ∑( X
2 2
珡
X = i n, 　　 S = i - 珡
X) / ( n - 1 )
i=1 i= 1
为样本均值与样本方差 ; 称
n n
∑X/ n, 　　 ∑ ( Xi - 珡
k k
i X) / n
i =1 i= 1
为样本 k 阶原点矩与样本 k 阶中心矩 .

2 2 2
命题 1 .1 　 E珡
X = θ, D珡
X = σ/ n, E S =σ . ( 1 .1)
证明留给读者作为练习 .
统计量的分布称为抽样分布 , 其中常用的分布有正态分布 , 卡
方分布 χ2 ( n) , t 分布 t ( n) , F 分布 F( m, n) .下面简要给出后 3 种
分布的定义、密度函数及其一些性质 .
(1 ) 自由度为 n 的卡方分布
2
定义 1 .3 　设 X1 , … , X n 独立同分布 , X i ～ N ( 0 , 1 ) , 则称随
n
机变量 χ ( n) = ∑X 的分布是自由度为 n 的卡方分布 , 简记为
2 2
i
i= 1
χ2 ( n) .即 χ2 ( n) 分布就是相互独立的标准正态分布的 n 个随机变

量平方和的分布 .
命题 1 .2 　 χ2 ( n) 分布的密度函数为
1 - x/ 2 ( n - 2 )/ 2
Kn ( x ) = n/ 2 e x , ( 1 .2)
Γ( n/ 2) 2
其中 Γ(α) 为伽玛函数 .
证明梗概　先求 X21 的概率密度函数 ( 见第 2 章例题 ) , 然后
利用和的卷积公式 ( 见第 3 章 ) 与数学归纳法即得 .有兴趣的读者
可作为练习补上 .
2
χ ( n) 分布的密度函数如图 9 －1 .
卡方分布有如下重要性质 :
2 2
① 设 X1 , X2 独立 , X1 ～χ ( m) , X2 ～χ ( n) , 则 X1 + X2 ～
2
χ ( m + n) .
证明　设 Y1 , … , Y m , Y m + 1 , … , Y m + n 独立同分布且 Y i ～
m m
∑Y ∑Y
2 2 2
N (0 , 1 ) . 令 X1 = i , X2 = m+ j , 则 X1 ～ χ ( m) , X2 ～
i= 1 j= 1
2
χ ( n) , 且 X1 , X2 独立 ( 见第 3 章随机变量的独立性质 ) , X1 + X2 =
m+ n
∑Y
2 2
i 为 m + n 个标准正态随机变量的平方和 .按 χ 分布的定义
i=1
图　 9－1
知其分布为 χ2 ( m + n) , 即得证 .
② 若 X1 , … , X n 独立且都服从指数分布 f ( x ) =
- λx
λe I( x > 0 ) , 则
n
X = 2λ∑ X i ～ χ2 ( 2 n) .
i= 1
　　证明　首先 , 由 X i 的概率密度函数可推出 2λX i 的概率密度
1 - x/ 2 2
函数为 e I( x > 0 ) .但由式 (1． 1 ) , 当 n = 2 时可知正好是 χ ( 2) 的
2
2
概率密度函数 , 即 2λX i ～χ (2 ) .再因 X1 , … , Xn 独立 , 利用刚才证
明的性质 , 即得所要的结果 .
(2 ) 自由度为 n 的 t 分布
2
定义 1 .4 　设 X1 , X2 独立 , X1 ～ N( 0 , 1) , X2 ～χ ( n) , 则称
T( n) = X1 / X2 / n
的分布是自由度为 n 的 t 分布 , 简记为 t( n) , 亦称为学生 ( st udent )
分布 .这种分布是英国人戈塞特 ( W .S .Gosset ) 在 1908 年以笔名
“st uden t”发表的 , 它是数理统计中最重要的分布之一 .
命题 1 .3 　设 T ( n) 是自由度为 n 的 t 分布 , 则它的概率密度
函数为
Γ( ( n + 1)/ 2 ) 2 - ( n + 1 )/ 2
tn ( y) = ( 1 + y / 2) . ( 1 .3)
nπΓ( n/ 2 )
　　证明　这里只给出证明梗概　为证式 ( 1． 3 ) , 由 X2 的概率密
度函数先求 X2 / n的概率密度函数 , 再利用第 3 章推广的全概率
公式 , 求随机变量商 X1/ X2/ n的概率密度函数 , 命题可得证 .
这个密度函数关于 y 轴对称 , 其图形与标准正态分布 N( 0 , 1 )
的密度函数的图形类似 , 见图 9－2 .由中心极限定理易知 : 当 n→
∞时 , t 分布的极限分布是标准正态分布 .
图　 9－2
(3 ) F 分布
定义 1 .5 　设 X1 , X2 独立 , X1 ～χ2 ( n) , X2 ～χ2 ( m) , 则称
m- 1 X2
F = -1
n X1
的分布是自由度为 ( m, n) 的 F 分布 , 简记为 F( m, n) .
m - 1 X2
命题 1 .4 　设 F = - 1 如上定义 , 则 F 的概率密度函数为
n X1
m/ 2 n/ 2 Γ( ( m + n)/ 2 ) m/ 2 - 1 - ( m+ n)/ 2
f m, n ( y) = m n y ( my + n) I( y > 0 ) .
Γ( m/ 2)Γ( n/ 2 )
( 1 .4)
　　证明　直接由定义应用推广的全概率公式于随机变量商的情
形 , 即可证得 ( 1． 4) 式 .
F( m, n) 分布的图形见图 9 －3 .
图　 9－3
性质　如 X～ F( m, n) , 则 1/ X～ F( n, m) .
通常把 χ2 , t 和 F 这 3 个分布合称“统计上的 3 大分布”, 这是
因为它们在统计学中有广泛的应用 .
下面给出正态总体的样本均值与样本方差的重要定理 .
2
定理 1 .1 　设 X1 , … , Xn 是来自总体 X ～ N (μ,σ ) 的样本 ,μ,
n n
∑ X/ ∑( X
2 2 2
σ 均未知 .记珡
X= i n, S = i - 珡
X ) / ( n - 1) , U =
i= 1 i= 1
X - μ)
(珡 n/ σ.则
①珡
X ～ N(μ,σ2 / n) , U = (珡
X - μ) n/ σ～ N( 0 , 12 ) ;
n
∑( X
2 2 2 2 2
② ( n - 1) S/ σ = i - 珡
X) / σ ～ χ ( n - 1 ) ;
i= 1
2
③ (珡
X - μ) 与 S 相互独立 ;
④ X - μ)/ S ～ t( n - 1 ) .
n(珡
2 2
证明　 ①因为 E珡
X = μ, 且 D珡
X = σ/ n, 故珡
X ～ N (μ,σ/ n) , 且
U～ N (0 , 12 ) .下证②与③ .令 X = ( X i , 1≤ i≤ n) T , Y = ( Y i , 1 ≤ i≤
T
n) , 设 A 为 n 阶正交方阵 , 其中第一行元素均为 1/ n, 而 Y =
n
∑X
2
AX .因为 A 为正交变换 , 故其平方和保持不变 , 即 i =
i=1
n
∑Y
2 T
i , 又 det A = 1 , 而 X = ( X i , 1 ≤ i ≤ n) 的概率密度函数为
i=1
n
∑ ( xi - μ) / 2σ
- n 2 2
( 2πσ) exp -
i= 1
n n
2πσ) exp - ∑x - 2μ∑ x i + nμ2 / 2σ2

- n 2
= ( i .
i =1 i= 1
n
注意到 A 的第一行元素均为 1/ n, 因而 y1 = ∑ x/
i= 1
i n= x,其
n珚
n
中珚
x = ∑ x/
i=1
i n, 故由第 3 章随机向量变换前后概率密度函数的
关系式知 Y = ( Y i , 1≤ i≤ n) T 的概率密度函数为
n
2πσ) ∑y
- n 2
( exp - i - 2μ n y1 + nμ2 / 2σ2
i=1
= ( 2πσ) - 1 exp[ - ( y1 - nμ) 2/ 2σ2 ] ・

n
∏[ (
-1 2 2
2πσ) exp( - yi / (2σ ) ) ] .
i =2
易知 ( Y1 , … , Y n ) 为正态分布 , 且概率密度函数的表达式是由 n 个

2
概率密度函数相乘而来 , 故 Y1 , … , Y n 独立 , 且 Y1 ～ N ( nμ,σ ) ,
Y i ～ N( 0 ,σ2 ) ( i = 2 , … , n) . 再由独立随机变量的性质知 Y1 与
n n n n n
2
∑ Y 相互独立 .而∑ Y = ∑Y - Y = ∑ X - ∑
2 2 2 2 2
i i i 1 i Xi / n=
i=2 i =2 i=1 i= 1 i=1
9 .2 点估计 : 极大似然估计与贝叶斯估计　 331
∑( X
i=1
i - 珡
X ) 2 = ( n - 1) S2 , 从而③得证 .又注意到
Y i/ σ～ N( 0 , 12 ) ( i = 2 , … , n) ,
n
故 ( n - 1) S / σ = ∑ ( Y / σ) ～ χ2 ( n - 1) , 即 ② 得证 .下证 ④ .
2 2 2
i
i =2
由 ③ 知 U = (珡
X - μ) n/ σ与 ( n - 1 ) S2/ σ2 独立 , 又由 U ～ N( 0 ,
2 2 2 2
1 ) , ( n - 1) S / σ ～ χ( n - 1) , 故
2 2 1/ 2
U/ [ ( ( n - 1) S / σ )/ ( n - 1) ] ～ t( n - 1 ) ,
即 n(珡
X - μ)/ S～ t( n - 1 ) .证毕 .
9 .2 　点估计 : 极大似然估计与贝叶斯估计
统计估计是数理统计基本的研究内容之一 .统计估计包括参

数估计与非参数估计 .在参数估计中又分为点估计与区间估计 .本
节给出有关点估计的一些重要概念与 3 种基本方法 .
这里指的参数是指总体 X 的分布中的未知参数 .所得参数估
计是指用其样本的统计量对总体的 ( 未知 ) 参数作出估计 .例如 X
2 2
为正态总体 , 其分布 N(μ,σ ) 中的μ,σ 未知 , 则可用其样本 X1 , … ,
n n
1 1
X = ∑ Xi 及 S = ∑
2 2
Xn 的统计量珡 ( Xi - 珡
X) 分别作为
n i= 1 n - 1 i= 1
未知参数 μ,σ2 的估计 .由于未知参数是 n 维空间的一个点 , 统计量
的取值也是一个点 , 用后者的点去估计未知参数的点 , 这种估计称
之为参数点估计 .
一般地 , 设总体 X 的分布 f ( x,θ) , 其中θ= (θi , 1 ≤ i ≤ n) 为
未知参数 , 它的可能取值全体记为 Θ, 称 Θ为参数空间 .记 X 的样
本为 X 1 , … , Xn , 若取样本的统计量 g( X1 , … , X n ) 作为参数θ的估
计 , 记作珘
θ = g( X1 , … , X n ) , 称 g( X1 , … , Xn ) 为 θ的估计量 .若样
本的观测值为 x1 , … , xn , 称珘
θ = g( x1 , … , xn ) 为 θ的估计值 .
参数点估计的方法具体有很多 , 本节仅介绍最基本的 3 种 .
注意 : 本书在数理统计部分 , 仅限于讨论离散型与连续型的
两种总体 .总体 X 的分布用 f ( x ,θ) 表示 , 如总体 X 为离散型随机
变量 , 则 f ( x, θ) 表示分布律 ; 如总体 X 为连续型随机变量 , 则
f ( x,θ) 表示概率密度函数 , 简称 f ( x,θ) 为总体分布 .
1 　极大似然估计
极大似然估计在历史上最早由高斯在研究误差理论中提出 ,

到 1912 年由著名的统计学家费希尔 ( R .A .Fis her ) 在一篇论文中
把它作为一般参数估计方法提出来 .随后他又与其他许多统计学
家对该方法不断探索 , 至今已成为统计估计中最重要的方法 .为了
了解极大似然估计的直观依据与思想 , 先举几个例子 .
例 2 .1 　甲、乙两人射击 , 已知甲击中目标的概率为 p1 = 0． 1 ,
乙击中目标的概率为 p2 = 0． 95 , 假定在射击时 , 观察者只能看到
射击结果是否击中目标 , 而且只知道有甲、乙两射手 , 但无法看到
每次究竟是谁射击 .现射击一枪 , 结果击中 , 试推断或估计这一枪
来自哪位射手 .
显然 , 若射击结果击中 , 则观察者估计这一枪来自乙射手较为
合理 , 因为这一结果更像是乙似然 .那么如何将这种直观的合理的
推断提炼为一个估计的原理呢 ?
可以将上述由实验结果作出直观估计 ( 猜测 ) 的依据用数理统
计的语言描述如下 :
令总体 X～ B( 1 , p) 服从二点分布 , 以 ( X = 1 ) 表示击中 , ( X =
0) 表示未击中 , 且相应的概率为 P( X = 1 ) = p , P( X = 0 ) = 1 - p,
则 X 的分布律为
L( X , p) = p X (1 - p) 1 - X , 　　 X = 0 , 1 ,
其中 p 是未知参数 , 如何用抽样结果来估计 p 是多少呢 ?
当实验结果 ( X = i) 发生时 , L ( i, p) ( i = 0 , 1 ) 看作是 p 的函
数 .于是 L( i, p) 可理解为 , 当参数 p 不同时 , 事件 ( X = i) 发生的可

能性就不同 .现在 , 事件 ( X = 1 ) 发生 , 由 L (1 , p2 ) = p2 > p1 = L( 1 ,
p1 ) , 表明是乙射手使 ( X = 1) 发生的可能性要比甲射手使 ( X = 1)
发生的可能性要大很多 .因此 , 取 p 的估计珟
p = p2 = 0． 95 较为
合理 .
更进一步将上例一般化 .设总体 X ～ B ( 1 , p ) , 未知参数
p∈[ 0 , 1] .若取一个样本是事件 ( X = i) ( i = 0 , 1) 发生 , 则未知参
数 p 的估计珟
p 应满足
L( i,珟
p) = p ∈max L( i, p) , 　　 i = 0 , 1 ,
[0 , 1]
或
L( X ,珟
p) = p∈max L( X , p) .
[0 , 1]
若取容量是 n 的样本 X1 , … , Xn , 其分布为

n n n
∏[ p ] = pk∑ ( 1 - p) k∑
X 1 - X X n - X
L( X1 , … , X n ; p) = k
(1 - p) k
=1
k
=1
k
.
k= 1
如由试验结果 X1 = i1 , … , Xn = in , 来估计未知参数 p, 则应取珟
p
满足　
L( i1 , … , in ;珟
p) = p∈max L( i1 , … , in ; p) ,
[0 , 1]
或
L( X1 , … , X n ;珟
p) = p∈max L( X1 , … , X n ; p) .
[0 , 1]
这种使已发生的抽样结果达到最大的参数珟
p 作为对 p 的估计 , 就
是极大似然估计原理 .
例 2 .2 　一个袋子里有 5 个球 , 既有红球也有白球 , 已知它们
的数目之比是 4∶ 1 , 但不知是红球多还是白球多 , 即随机抽取一
个红球的概率是 p1 = 1/ 5 或者 p2 = 4/ 5 .现在有放回地从袋子里
抽取 3 个球 , 试用抽取的红球数来估计红球的比例是 p1 还是 p2 .
解　记抽取的红球数为 X , 易知 X～ B ( 3 , p) .当 X = k( 0 ≤
k≤3 ) 时 , 记它的概率为
k k 3- k
L( k, p) = C3 p (1 - p) ,
它是 p 的函数 , 下表给出了 p = p1 = 1/ 5 与 p = p2 = 4/ 5 时 P( X = k)
的值 :
X 0 1 2 3
p = 1/ 5 时 P( X = k)的值 64/ 125 48/ 125 12/ 125 1/ 125
p = 4/ 5 时 P( X = k)的值 1/ 125 12/ 125 48/ 125 64/ 125
可知 : 当 k = 0 , 1 时 , L( k, p1 ) > L( k, p2 ) , 故应取珟
p = p1 = 1/ 5 ; 当
k = 2 , 3 时 , L( k, p1 ) < L( k, p2 ) , 故应取珟
p = p2 = 4/ 5 .即说明应取
使得事件 ( X = k) 发生的可能性最大的参数作为我们的估计较为
合理 , 符合客观推理 , 即应取珟
p 满足
p) = m pax L ( k, p) , 　　 0 ≤ k ≤ 3 ,
L( k,珟
或
L( X ,珟
p) = max L ( X , p) .
p
2
　　例 2 .3 　已知一批零件的直径 X～ N (μ, 1 ) , 其中 σ= 1 已知 .
1 2
其概率密度是 f ( x;μ) = exp ( - ( x - μ) / 2) , 其中 μ未知 , 但
2π
设 μ有两种取值 : μ1 = 1 或 μ2 = 5 , 现抽取一个样本 , 若抽取的结
果为 1． 1 , 则估计总体的参数 μ是 1 还是 5 ?
解　记 L( x ,μ) = f ( x,μ) , 当给定 x 时 , L ( x,μ) 看作是 μ的
函数 .现在抽样结果是 x = 1． 1 , 在此条件下 , 比较两个参数 μ=
μ1 = 1 与 μ= μ2 = 5 , 则不难得出 L( 1． 1 , 1 ) > L ( 1． 1 , 5 ) .这表明在
x = 1． 1 的前提下 , 未知参数 μ取μ= 1 的可能性要比取 μ= 5 的可
能性大 , 故选取珘
μ= 1 作为 μ的估计较为合理 .
以上 3 例估计参数的直观依据是 : 选取参数 p( 或 μ) 的估计
珟
p( 或珘
μ) 满足 : 使已观测到的样本出现的可能性最大的参数作为
未知参数 p ( 或 μ) 的估计 , 这种估计方法称为极大似然估计
( maximum likelihood estima te, M L E) .一般情形叙述如下 :

设总体的分布为 f ( x,θ) , 未知参数 θ= (θ1 , … ,θm ) ∈Θ, 其样
n
本 X1 , … , Xn 的分布为 L ( x;θ) = L( x1 , … , xn ;θ) = ∏ f( x

k=1
k ,θ) ,
其中 x = ( x1 , … , xn ) ,θ = (θ1 , … ,θm ) ∈ Θ .显然 , 若 L( X;θ) >

L( X′;θ) , 意味着给定 θ, 出现 X 要比出现 X′的可能性大 .若已观
测到样本 x1 , x2 , … , xn , 且对不同的参数 θ′与 θ″有 L ( x1 , … , xn ;
θ′) > L( x1 , … , xn ;θ″) , 则意味着未知参数 θ取θ′的可能性要比θ
取 θ″的可能性要大 .因此 , 用样本 ( X1 , … , X n ) 来估计未知参数 θ
θ＊满足
时 , 应取珘
θ＊ ) = max
L( X1 , … , X n ;珘 L ( X1 , … , X n ;θ) , ( 2 .1)
θ∈ Θ
＊
称珘
θ 为 θ的极大似然估计 , 称 θ的函数 L ( x1 , … , xn ;θ) 为似然
函数 .
θ＊是 ( X1 , … , X n ) 的函数 , 记为珘
显然 , 满足 ( 2 .1 ) 式的珘 θ＊ =
珘＊ ( X1 , … , Xn ) , 称珘
θ θ＊ ( X1 , … , X n ) 为 θ的极大似然估计量 , 称
珘＊ ( x1 , … , xn ) 为 θ的极大似然估计值 .
θ
θ＊ ) 为
注　若要估计的是未知参数 θ的函数 g (θ) , 则取 g(珘
g(θ) 的极大似然估计 .
如何求极大似然估计呢 ? 下面先介绍似然函数 L( x;θ) 关于
θ有连续的一阶 ( 偏 ) 导数的情形 .
＊
此时 , 由于 L( x;θ) 与 ln L( x;θ) 有相同的极值点 , 因此 , 若珘
θ
是 θ的极大似然估计 , 则它应满足方程组
l n L( x;θ) = 0 , 　　 1 ≤ i ≤ m, ( 2 .2)
θi
求解方程组 (2． 2 ) , 且与边界值比较 , 其中达到 L( x;θ) 最大值对应
＊
的 θ就是珘
θ .称 (2． 2 ) 为似然方程 .
例 2 .4 　设样本 X1 , … , Xn 取自总体 X ～ N(μ, 12 ) , 其中σ= 1
μ＊ .
已知 ,μ为未知参数 .试求 μ的极大似然估计珘
解　 X1 , … , Xn 的似然函数为
n
1 e- 1
( X - μ) 2
L( X1 , … , X n ;μ) = ∏
k= 1 2π
2 k .
取对数 , 得
n
ln L( X1 , … , X n ;μ) = - n ln (2π) - 1 ∑ ( X i - μ) 2 ,
2 2 i=1
对 ln L 关于μ求导 , 并令它为 0 , 得
n
d ln L =
dμ ∑( X
k= 1
k - μ) = 0 .
n n
dln L
不难验证 , 当 μ< 珡
X = ∑
k= 1
X k/ n 时 ,
dμ
> 0; 当μ> 珡
X= ∑ X/
k= 1
k n
时 , dln L < 0 .故 μ= 珡
X 为 L ( X1 , … , Xn ;μ) 的极大点 , 亦是最大值
dμ
＊
点 .故珘
μ = 珡
X 是μ的极大似然估计 .
例 2 .5 　 ( 均匀分布 ) 　设样本 X1 , … , Xn 取自总体 X ～ U ( 0 ,
θ) (θ> 0 为未知参数 ) , 则似然函数
n
∏I
- n
L( X1 , … , X n ;μ) = θ ( 0 < X < θ)
k
.
k= 1
此时无法利用 ( 2． 2 ) 式求极大似然估计 .但注意到由于 θ> X k
＊
( ＂ 1 ≤ k≤ n) , 为使 L 达最大 , 当且仅当取珓
θ = 1m ax X k .
≤ k≤ n
以下是总体为离散型随机变量的例子 .
例 2 .6 　设样本 X1 , … , Xn 取自总体 X ～P o(λ) , 其中λ> 0 为
＊
未知参数 .试求其极大似然估计珘
λ .
解　 X 的分布律为
i -λ
P( X = i) = (λ/ i !) e ( i = 0 , 1 , … ) ,
故似然函数为
n
∏ (λ /
X -λ
L( X1 , … , Xn ;λ) = k
Xk !) e ,
k= 1
dln L
由 λ＊ = 珡
= 0 , 可得珘 X .
dλ
下面对几类常见的分布 , 找出它们的参数的极大似然估计 .
- λx
(1 ) 指数分布 : X ～ Ex(λ) . f ( x ) = λe I ( x > 0 ) , 参数 λ> 0 .
当样本取值 ( x1 , … , xn ) 时 , 它的似然函数为 L( x1 , … , xn ; λ) =
n n
λ∏ e = λ e ∑ , 对数似然函数记为
n - λx n -λ x
i i
i =1
i= 1
n n
ln Ln n
l n L = nlnλ - λ∑ xi , = - ∑x , i
i=1 λ λ i= 1
λ＊ = 1/ 珡
故珘 X 就是λ的极大似然估计 .
1 1 2
(2 ) 正态分布 : 分布密度 f ( x ; μ,δ) = e - 2δ( x - μ) ( 其中
2πδ
δ= σ2 > 0) , 样本的似然函数为
n n
1 1 2
　 ∏ e 2δ i
( x - μ)
L( x1 , … , xn ;μ,δ) = -
2πδ i=1
n
1 2
= ( 2π) - n/ 2 δn/ 2 e - 2δ∑ ( x - μ)
i= 1
i ,
故
n
ln L = - n ln( 2π) - n lnδ - 1 ∑ ( x i - μ) 2 ,

2 2 2δi = 1
则似然方程组为
n
ln Ln 1
δ∑
= ( xi - μ) = 0 ,
μ i= 1
n
ln Ln n 1
+ 2 ∑ ( xi - μ) = 0 .
2
= -
δ 2δ 2δ i = 1
n n
1 1
∑ ∑
2
解得 μ= xi = 珚
x ,δ= ( xi - 珚
x) .
n i= 1 n i=1
n
1
∑
＊
故μ
珘 = 珡 σ = ( Xi - 珡
X ) 2 分别为 μ与σ2 的极大似然估
2
X ,珓
n i= 1
计量 . 　
2 　矩估计
考察常用的总体分布中 , 许多未知参数与它们的矩有密切的
关系 .例如正态总体 X～ N (μ,σ2 ) 中的参数 μ,σ2 本身就是 X 的一
阶原点矩和二阶中心矩 .又如 X ～ Po (λ) , 则 λ= E X .又如 X ～
- 1
Ex(λ) , 此时 E X = λ , 可知参数 λ是一阶矩的函数 .由此 , 一种很
自然的估计方法是用样本的矩作为总体相应矩的估计 , 再利用未
知参数与总体矩的函数关系 , 可得未知参数的估计量 , 称这种方法
为矩估计 .
n
1
X = ∑ Xk 为
设 X1 , … , X n 是总体 X ～ F( x,θ) 的样本 , 称珡
n k=1
n n
样本均值 , S = 1 ∑ ( Xk - 珡
X) 2 为样本方差 , 1 ∑ Xki 为样本
2
n - 1 i= 1 n i= 1
n
1
k 阶原点矩 , ∑ ( Xi - 珡
k
X ) 为样本 k 阶中心矩 .
n i= 1
2 2
例 2 .7 　设样本 X1 , … , Xn 来自总体 X ～ N (μ,σ ) , 其中 μ,σ
为未知参数 .试求 μ,σ2 的矩估计 .
解　由样本矩和总体矩的定义可知 ,μ = E X , 故珘
μ=
n n
1 1
∑ σ = ∑ ( Xk - 珡
2 2 2
Xk = 珡
X 为μ的矩估计 .同理 ,珓 X) = S1 为
n k= 1 n i= 1
σ2 的矩估计 .又由 σ= DX 可知 ,珓
σ = S1 是 σ的矩估计 .
例 2 .8 　设总体 X ～ B( n, p) , 其中 n 已知 , 求 p 的矩估计 .
解　由 E X = np , 可得珡
X =珟
p n, 故珟
p=珡
X/ n 是 p 的矩估计 .
例 2 .9 　设总体 X 是 Γ 分布 ( 参看第 2 章 ) , 即概率密度函数
1 α α- 1 - βx
为 f ( x) = β x e I ( x≥ 0 ) , 其中 α,β为未知参数 .试求 α,β
Γ(α)
的矩估计量 .
解　经计算可知: E X = α
/ β, D X = α/ β2 , 故应取珡
X =珘
α/ 珓
β,
2 2 2 2 2
α/ 珓
S =珘 β , 解之得珘
α= 珡 β= 珡
X / S ,珓 X/ S .
3 　贝叶斯估计
本小节简要讨论贝叶斯估计的基本思想 .
设总体的分布为 f ( x,θ) , 其中 θ∈Θ为未知参数 , 问题是用
样本 X1 , … , Xn 对参数 θ作出估计 .前面所讨论的极大似然估
计 , 矩估计等方法中 , 假设未知参数 θ只是简单的一些未知数 ,
在抽取样本之前 , 我们对 θ没有任何了解 , 所有的信息完全来自
样本 .
而贝叶斯估计法的出发点是 : 首先 , 把未知参数 θ看作是随
机变量 ( 或随机向量 ) , 且在抽样之前 , 对 θ已有一定的知识 ( 包括
合理的猜想与准则 ) , 称其为先验知识 .这种先验知识用 θ的某种
概率分布表达出来 , 记为 h(θ) .这种概率分布叫做 θ的“ 先验分
布”或“ 验前分布”.这个分布反映了在试验之前对未知参数 θ所把
握的信息 .其次 , 将原来含有参数 θ的样本 X 1 , … , Xn 分布 f ( x1 ,
θ) … f ( xn ,θ) 定义为在给定 θ值时 , ( X1 , … , X n ) 的条件分布 .因而
(θ, X1 , … , X n ) 的联合密度为 h (θ) f ( X1 , θ) … f ( X n ,θ) , 于是 ,
( X1 , … , X n ) 的边缘密度为
p( X1 , … , Xn ) = ∫h(θ) f ( X
θ∈ Θ
1 ,θ) … f ( Xn ,θ) dθ.
　　第三 , 由此 , 贝叶斯提出在给定 X1 , … , X n 的条件下 ,θ的条
件密度为
h(θ| X1 , … , X n ) = h(θ) f ( X1 ,θ) … f ( X n ,θ)/ p( X1 , … , Xn ) .
( 2 .3)
　　称 (2． 3 ) 式为 θ的“后验密度”.这个条件密度代表了我们现在
( 即在取得样本 X1 , … , Xn 后 ) 对 θ的知识 , 它综合了 θ的先验信
息 ( h(θ) 所反映的信息 ) 与由样本带来的信息 .读者不难看出
(2． 3 ) 式在形式上与第 1 章的贝叶斯公式相类似 .
最后利用后验分布 h(θ| X1 , … , X n ) 作出对 θ的推断 ( 估计 θ

或对θ作检验 ) .
贝叶斯学派认为 : 在有了后验分布 ( 2． 3 ) 式后 , 对参数的估
计 , 必须建立在这个后验分布的基础上推出 , 具体可结合使用者的
某种要求 ( 准则 ) 处理 .此处给出较常用的两种方法 : ( 1) 若取后验
分布 (2． 3 ) 式的 ( 条件 ) 均值作为 θ的估计 , 则称此为贝叶斯条件期
望估计 ; ( 2) 若取后验分布 ( 2． 3 ) 式达最大的 θ作为珘
θ0 , 称珘
θ0 为贝
叶斯最大后验估计 .
例 2 .10 　某射手进行独立重复射击试验 , 设每次射击击中的
概率为 p( 未知 ) , 现射击 n 次 , 击中 r 次 .试给出 p 的贝叶斯条件
期望估计 .
解　由题意设总体 X～ B(1 , p) , 记 X i 表示第 i 次射击 , ( Xi =
1) 表示击中 , ( X i = 0 ) ( i = 1 , … , n) 表示没有击中 , P( X i = 1 ) = p,
x n- x
P( X i = 0 ) = 1 - p .因此 X1 , … , X n 的分布律为 p ( 1 - p) (x=
n
0 , 1) , 其中 X = ∑X
i=1
i = x 表击中次数 .取 p 的先验密度 h( p) , 则
p 的后验密度为
n n
h( p) pi∑ ∑
X n- X
i ( 1 - p) i
h( p | X1 , … , Xn ) = , 　 0 ≤ p≤ 1,
=1 i= 1
1 n n
∫ h( p) p∑ (1 - p) ∑
X n- X
i i d p
i= 1 i= 1
0
( 2 .4)
若对该射手射击水平很不了解 , 可假设他的命中概率 p 在 [ 0 , 1 ]
上取每个值是等可能的 , 此时 h( p) = I[ 0 , 1 ] 是 [0 , 1 ]上的均匀分布 .
代入 (2． 4 ) 式有
1
∫p
X n - X X n- X
h( p | X1 , … , X n ) = p ( 1 - p) (1 - p) d p,
0
即 h( p| X1 , … , Xn ) 为贝塔分布 .如用后验分布的期望值 , 即 p 对
X1 , … , Xn 的条件期望 E ( p| X1 , … , Xn ) 作为 p 的估计量 , 即得
珟
p= 珟
p( X1 , … , X n ) = ∫ ph ( p |
0
X1 , … , X n ) d p
= ( X + 1)/ ( n + 2 ) , ( 2 .5)
珟
p 即为 p 的贝叶斯估计 .
现比较上例 p 的 3 个不同估计 .n 次射击 , 命中 X 次 .用极大
似然估计和矩估计都是用 n 次射击命中的频率 X/ n = 珟
p 去估计
p .这种估计有它的不足之处 , 例如 , 当 n = X = 1 时 , 估计珟
p = 1; 而
当 n = X = 100 时 , 此估计还是珟
p = 1 .再有一种极端情形 , 对 n = 1 ,
而 X = 0,得珟
p = 0; 对 n = 100 , X = 0 , 仍是珟
p = 0 .射击 100 次每次
都命中 , 直觉上此射手命中概率相当大 , 此时估计珟
p = 1 合情合
理 ; 倘若仅射一次 , 命中了 , 但此时该射手命中概率不应与射击
100 次每次命中相提并论 , 遗憾的是 ,珟
p = X/ n 作为 p 的估计其结
果都是一样的 .然而 , 用贝叶斯估计量 p 的估计是珟
p = ( X + 1 )/
( n + 2 ) .当 n = X = 1 时 ,珟
p = 2/ 3; 而当 n = X = 100 时 , 珟
p = 101/
102 .显然 , 这个估计比用 X/ n 要合理 , 更符合多数人的直观估计 .
2
例 2 .11 　设总体 X ～ N (μ,σ ) , 其中 σ已知 , 而 μ为未知参
数 ,μ的先验分布为 N (μ0 ,σ20 ) , 其中 μ0 ,σ20 > 0 为已知常数 , X1 , … ,
Xn 为 X 的样本 .试求 μ的贝叶斯条件期望估计 .
- 1 2 2
解　此时 h(μ) = ( 2πσ0 ) exp ( - (μ- μ0 ) / 2σ0 ) ,
f ( x ,μ) = ( 2πσ) - 1 exp( - ( x - μ) 2/ 2σ2 ) .
由 (2 .3 ) 式知 ,μ的后验密度 ( 即 μ关于 X1 , … , X n 的条件密度 ) 经
整理后为
h(μ| X1 , … , X n )
n
1
∑( X
2 2 2 2
= Kexp - (μ - μ0 ) / σ + 0 k - μ) / σ ,
2 k=1
其中 K 是一个与μ无关 , 只与 μ0 ,σ0 , X1 , … , X n 有关的数 .记珡

X =
n
∑X/
k= 1
k n, 将上式右端方括号的式子化简为
n 2 2
( X k - μ) (μ - μ0 )
∑ k= 1 σ
2 +
σ0
2
-1 2
n 1 X μ0
n珡 n 1
= 2 + μ- + 2 2 + + c,
σ σ20 σ σ0 σ σ20
2
其中 c 是一个与 μ 无关 , 只与 σ, μ0 , σ0 , X1 , … , X n 及 n 有关的
数 .故
h(μ| X1 , … , X n )
2
n珡
X μ0 -1
1 n + 1 n 1
= Kexp - μ- + 2 2 + + c.
2 σ σ20 σ σ20
2 2
σ σ0
( 2 .6)
注意上式说明 h(μ| X1 , … , Xn ) 是正态分布 , 且条件期望为
n珡
X μ0 -1
n 1
+ 2 2 + ,
σ σ20
2
σ σ0
故得 μ的贝叶斯的条件期望估计为
- 1
X μ0
n珡 n 1
珘
μ= + 2 2 + 2 ,
σ2 σ0 σ σ0
即
n / σ0 ) 2
(σ
μ=
珘 2 2 珡
X+ μ0 . ( 2 .7)
n + (σ/ σ0 ) n + (σ2 / σ20 )
将 μ的贝叶斯条件期望估计珘
μ 分解成 (2． 7 ) 式颇有意味 .考虑两种
极端情形下的估计 : 若仅有实验样本结果的信息 , 而毫无先验信
息 , 则此同于以往矩估计与极大似然估计用样本均值去估计 μ.另
一种是若仅有先验信息 h(μ) ～ N (μ0 ,σ20 ) , 而无取样本的信息 , 则
只好用先验分布的均值 μ0 作为 μ的估计 .而当同时掌握了两种信
息 , 则贝叶斯的条件期望估计是上述两种极端情形的“ 加权”平均 ,
2
“权”的比值为 n∶ (σ
/ σ0 ) .当 σ= σ0 时 , 权之比为 n∶ 1 , 即如果先
验知识中 μ的方差与总体的方差一样时 , 则样本信息与先验信息
对 μ的估计所占比例为 n∶ 1 .当 σ
/ σ0 = n 时 , 权之比为 1 ∶1 , 此
时样本信息与先验信息对 μ的估计占同等重要地位 ! 足见贝叶斯
9 .3 估计的优良性准则　 343
估计的合理性 !
再从例 2． 11 来看对同一参数的贝叶斯估计与极大似然估计
2
的关系 : 注意 σ0 是以往“经验值”μ0 的方差 , 它是刻画 μ0 的“ 精
2
度”的 .若 σ0 →∞ , 则意味着对 μ而言 , 已没有任何先前经验可言 .
此时 , 由 ( 2． 7) 式 , 当 σ20 →∞时 ,μ的贝叶斯估计珘
μ 就等于 μ的极大
似然估计 ! 这说明 , 对这一问题而言 , 前者的结果包含了后者 .
另外 , 还要强调一点的是 : 贝叶斯统计首先把被估计参数 θ
看作是随机变量是否恰当 , 是否合理 ? 在许多具体问题中 , 把参数
θ看作是随机变量更加符合客观实际 .例如 , 大批量生产的某一元
件 , 设次品率为 p, 将这批元件打包成箱销售 , 每箱 1000 个 .显而
易见 , 此时各箱的次品率 θ就是一个随机变量 .同时 , 在理论上 , 假
设参数 θ是一个随机变量 , 这个观点本身并无不妥 .当然 , 与任何
其他数理统计一样 , 贝叶斯统计理论还有待进一步完善、改进与发
展 .从应用的角度看 , 在没有先验资料与数据的条件下 , 如何恰当
选取其先验分布 , 这是关键 , 值得进一步深入探讨 .
9 .3 　估计的优良性准则
同一未知参数的估计量有许多不同的方法 , 如何衡量与比较

估计量的好坏呢 ? 什么样的估计量是较好的 ? 这就涉及估计量的
优良性标准 .粗略地说 , 估计量与被估计量越“ 接近”越好 , 即“ 误
差”越小越好 .
设 X 的密度函数为 f ( x,θ) , 其中 θ= (θ1 , … ,θm ) ∈Θ, Θ 是
m
R 的非空集合 .设 g(θ) 是 θ的函数 , X1 , … , X n 是 X 的样本 .所
谓 g(θ) 的估计量 , 是指样本函数 φ( X1 , … , Xn ) 的不同选择可得到
不同的估计量 .直观上看 , |φ( X1 , … , Xn ) - g(θ) | 越小 ,φ就越好 .
但 φ( X1 , … , X n ) 的值是依赖于样本值的 , 它本身是随机变量 , 而
g(θ) 是未知的 , 所以评价估计量的优劣需要衡量优良性的标准 .
为简化记号 , 以下只讨论对参数 θ= (θ1 , … ,θm ) 的估计问题 ,

这是因为对 θ的函数θ′= g(θ) 的估计问题完全可化为对参数 θ′的
估计 , 且简记珘
θ= φ( X1 , … , X n ) 取为 θ的估计量 .我们从估计量的
几个不同侧面的概率特性及估计量所产生的效果来刻画估计量的
优劣 .
1 　无偏估计
定义 3 .1 　称珘
θ = φ( X1 , … , Xn ) 是参数 θ 的无偏估计
( unbiased estim ate ) , 若
θ = θ, 　　 θ∈ Θ .
E珘
　　对估计量的无偏性要求在通常情形下是合理的要求 , 但对某
些情形下不见得是必要的 .
例 3 .1 　设 ( X1 , …, Xn ) 为总体 X 的样本, 记 μ= E X .若 D X =
n
σ 存在, 则样本均值珡 ∑ X/ n 是 μ的无偏估计 , 样本方差 S2 =

2
X = i
i=1
n
∑( X
2 2
i - 珡
X ) / ( n - 1) 是 σ 的无偏估计 .
i=1
n
证明　因 E珡
X = E ∑X i= 1
i / n = μ, 故珡
X 是μ的无偏估计 , 而
n
∑( X - 珡
2
ES = E i X) 2/ ( n - 1 )
i=1
∑ [( X
2
= E i - μ) - (珡
X - μ) ] / ( n - 1)
i=1
= E ∑( X
i=1
i - μ) 2 - n(珡
X - μ) 2 / ( n - 1 )
n
∑ DX
2
= i X / ( n - 1) = σ
- nD珡
i= 1
( 注 D珡
X = σ2/ n) , 故 S2 是 σ2 的无偏估计 .
无偏性只有在估计量重复使用时才有意义 .例如 , 估计量珘

θ独
(1) ( m)
立地重复利用 m 次珘
θ , … ,珘
θ 作为 θ的估计 .若 E珘
θ= θ, 则由大
m
1 P
∑珘
( i)
数定律知其平均值 θ θ( m → ∞ ) ( 依概率收敛 ) .这意
m i= 1
味着多次反复利用估计量珘
θ与真值 θ没有系统偏差 , 因而无偏性
刻画了多次使用估计量珘
θ的“平均”效果 .
无偏性的要求有时不见得是必要的 , 见本章练习题 9． 10 .
2 　有效估计与最小方差无偏估计
一个参数估计可以有许多不同的无偏估计量 .例如在例 3． 1
中, X1 , αX2 + ( 1 - α) X3 ( 其中 0 ≤ α ≤ 1 ) , 珡
X 及
n n
∑α X
i=1
i i 其中 ∑αi = 1 均是 μ的无偏估计 .在众多的 μ的无偏估
i=1
计中 , 如何选择较好的 ?
定义 3 .2 　设珘
θ1 与珘
θ2 均是 θ的无偏估计 , 若对于任意样本容
量都有
θ1 < D珘
D珘 θ2 ,
则称珘
θ1 比珘
θ2 有效 .
定义 3 .3 　设珘
θ0 是 θ的无偏估计 , 若对 θ的任何一个无偏估
计珘
θ 都有
θ0 < D珘
D珘 θ, 　　＂ θ∈ Θ,
则称珘
θ0 是 θ的最小方差无偏估计量 ( minimum variance unbiased
estima te, 简记为 M VU 估计 ) .
用以上定义验算一个估计量是否为最小方差无偏估计量是难
于实现的 .若要深入讨论最小方差无偏估计量的求法 , 涉及数理统
计其他许多内容 , 故本书不作介绍 .下面仅给出它的下界 , 即著名
的克拉默－拉奥 ( H .Cra mer－C .R .Rao) 不等式 .
定理 3 .1 　设总体 X 是连续型随机变量 , 其概率密度函数为
f ( x,θ) ,θ∈Θ, 其中 Θ是R 上的一个开区间 , X1 , … , X n 是 X 的简

单样本珓
θ
. =珓
θ( X1 , … , Xn ) 是 θ的无偏估计 .记 x = ( x1 , … , xn ) ,
n
L( x;θ) = ∏ i=1
f ( xi ,θ) ,
2
f ( u,θ)
I(θ) = ∫ R θ
/ f ( u,θ) d u . ( 3 .1)
若满足 :
(1 ) 集合 Sθ = { xi , f ( x i ,θ) ≠0 }与 θ无关 ;
f ( x i ,θ)
(2 ) 存在 , 且对＂ θ∈Θ有
θ
f
∫
θ
f ( x ,θ) d x =∫
R
i i
R θ
d xi ,
θ Rn∫
θ( x) L( x;θ) d x
珓
L
∫珓
=θ( x) Rn θ
d x;
　　 (3 ) I(θ) > 0 , ＂ θ∈Θ, 则

1
θ≥
D珓 . ( 3 .2)
nI (θ)
　　证明　从略 .可参看[ 3] 第 2 册或[8 ] .
不等式 (3． 2 ) 右边称为克拉默－拉奥下界 .而
2 2
ln f ( X ,θ) ln f ( u,θ)
I(θ) = E
θ
= ∫ R θ
f ( u,θ) d u
2
f ( u,θ)
=∫ R θ
/ f ( u,θ) d u,
最早是由费希尔在 20 世纪 20 年代提出的 , 故称 I(θ) 为费希尔信

息量 .I(θ) 越大 , θ的无偏估计越有可能达到更精确些 .而珓
θ=
珓
θ( X1 , … , X n ) 是样本 X1 , … , X n 的函数 θ
. 能估的越准 , 表明其样
本所含参数 θ的信息量越大 .当样本容量为 n 时 , ( 3． 2 ) 式右边分
母是 nI(θ) , 因此每个样本提供的信息量为 I(θ) .
若总体 X 为离散型随机变量 , 分布律为 : p( i;θ) = P( X = i;
2
ln P( X ,θ)
θ)θ∈Θ, 则 I(θ) = E , 若满足定理 3． 1 中类似条件 ,
θ
则 (3． 2 ) 式仍成立 .
1
定义 3 .4 　若珓
θ0 是 θ的无偏估计 , 且 D珓
θ0 = , 则称珓
θ0 是 θ
n I(θ)
的有效估计 .
例 3 .2 　设 X1 , … , X n 是来自总体 X ～ N (θ,σ2 ) 的样本 ,θ,σ2
2 2
未知 .试问珡
X 与 S 是否分别是 θ与σ 的最小方差无偏估计 ?
2
解　须分别计算 θ与σ 的克拉默－拉奥下界 .本题中 ,
2
2πσ) exp - ( x 2- θ)
2 -1
f ( x,θ,σ ) = (
2σ
2 2
ln f ( X ,θ,σ )
I(θ) = E
θ
+∞
1 - ( x - θ) 2
∫
-1 2
= ( 2πσ) ( x - θ) exp dx
-∞ σ4 2σ2
= 12 ,
σ
2
σ 1
E珡
X =θ, D珡
X= = ,故珡
X 是θ的最小方差无偏估计量 .对于
n nI(θ)
2 2
ln f ( X,θ,σ )
σ , ES =σ , S 是 σ 的无偏估计 , 又 I(σ ) = E
2 2 2 2 2 2
2 =
σ
1 2 2 4 2 4 1 2 2
4 , 但 DS = σ> σ= , 故 S 不是 σ 的最小方差无
2σ n-1 n nI(θ)
偏估计 .
1
例 3 .3 　设总体 X～ Ex ,θ> 0 未知 .试问珡
X 是否是θ的
θ
最小方差无偏估计量 ?
解　显然 , 由于 E珡
X = E X = θ, 知珡
X 是θ的无偏估计 .又 D珡
X=
2
1 θ
DX = ,而
n n
+∞ 2
ln f ( x,θ)
∫
I(θ) =
0 θ
f ( x,θ) d x
+∞
1 -
∫
2 x/ θ 2
= ( - 1/ n + x/ n ) - e d x = 1/ θ
0 θ
2
1 θ
D珡
X = = ,
nI (θ) n
故珡
X 是θ的最小方差无偏估计量 .
例 3 .4 　设总体 X～ B( 1 , p) , p∈ ( 0 , 1 ) 未知 .试问珡
X 是否是
p 的最小方差无偏估计量 ?
解　 E珡
X = p,故珡
X 是 p 的无偏估计 .又 X 的分布律为 p X (1 -
1 - X
p) , 从而
2 2
l n( 1 - p) ln p 1
I( p) = (1 - p) + p = ,
p p p( 1 - p)
p( 1 - p) 1
D珡
X = = ,
n nI ( p)
故珡
X 是 p 的最小方差无偏估计量 .
3 　相合估计
由于估计量珓
θ= φ( X1 , … , X n ) 是样本的函数 , 因而它依赖于
样本容量 n .自然有兴趣也有必要考虑 n→∞ 时估计量珓
θ的性态 .
下面为突出珓
θ与 n 的关系 , 故记珓
θn = φ( X1 , … , Xn ) .显然 , 当 n→∞
时 ,珓
θn 是否以概率收敛到θ至关重要 .
P
定义 3 .5 　设珓
θn =φ( X1 , … , Xn ) 是 θ的一个估计量, 若 n→
lim 珓
θn =
∞
θ, 即＂ ε> 0 , 有 li θn - θ| <ε) = 1 , 则称珓
m P( |珓 θn 是 θ的相合估计量
n→ ∞
( consistan t estimat e) , 或称一致估计量 .

显然 , 对于任意分布的总体 X , 若 D X < ∞ , 则珡
X 是 EX 的相
合估计 , S2 是 D X 的相合估计 .相合性对于大样本的估计是最重
要的衡量标准之一 .
在贝叶斯统计的估计中 , 更多的是以估计产生的“ 效果”( 可以

是性能方面的 , 也可以是经济上的 ) 来衡量估计与决策的优良性准
则 , 这就是损失函数与风险函数 .
4 　损失函数与风险函数
(1 ) 损失函数
设珓
θ为参数θ∈Θ的一个估计量 , 称非负二元函数 L (θ,珓
θ) 为
损失函数 .例如 L(θ,珓
θ) = (θ- 珓
θ) 2 , 或 L(θ,珓
θ) = |θ- 珓
θ| .它们表示若
用珓
θ去估计θ的效果越差 ,其损失就越大 .注意由于θ与珓
θ=φ( X1 , … ,
Xn ) 是随机变量 , 故 L(θ,珓
θ) 也是随机变量 .
(2 ) 风险函数
风险 ( ris k) 函数是评价估计的一个准则 , 风险小估计的效果
越好 .称 R(θ,珓
θ) = E L(θ,珓
θ) 为估计量珓
θ的风险函数 .
(3 ) 后验风险函数
给定样本 X1 , X2 , … , Xn , 称 rθ ( X1 , … , Xn ) = E( L(θ,珓
θ) | X1 , … ,
Xn ) 为估计量珓
θ的后验风险函数 .后验风险是估计量珓
θ的条件平均
损失 .
由条件期望的性质易知 R(θ,珓
θ) = E( rθ ( X1 , … , Xn ) ) .为求风
险 R(θ,珓
θ) 可先求在给定样本 X1 , … , X n 下 , L (θ,珓
θ) 对 X1 , … , X n
的条件数学期望 rθ ( X1 , … , Xn ) , 其次对 rθ ( X1 , … , X n ) 关于样本
X1 , … , Xn 求期望即得 R (θ,珓
θ) .
在贝叶斯统计中 , 如何从后验分布出发进而给出该参数的估
计 ? 在上一节已给出了两种较常用的办法 , 其中一个是从直观定
义出发构造参数的估计量 , 如通常可用来刻画后验分布的数字特
征 , 如后验分布的条件数学期望 ( 均值 ) 或后验分布的中位数
M(θ| X1 , … , Xn ) 来估计θ( 设随机变量 X, 若存在 M , 满足 : P( X >
1
M) = P( X≤ M) = , 称 M 为 X 的中位数 ) .这里再给出另一办
2
法 , 就是从估计产生的效果出发提出适当的准则 .这就是最小风险
估计 .
定义 3 .6 　设珓
θ为参数θ的一个估计量 , L(θ,珓
θ) 为损失函数 ,
θ) = E L(θ,珓
R(θ,珓 θ) 为估计风险 .若珓
θb 为θ的一个估计量 , 满足 : 对
θ的任一估计珓
θ有
θb ) ≤ R(θ,珓
R(θ,珓 θ) ,
则称珓
θb 为θ的最小风险估计 .通常把最小风险估计称为贝叶斯
估计 .
可以证明 , 后验风险最小估计等于风险最小估计 .因此 , 上述
定义的贝叶斯估计就是后验风险最小估计 .若取 L (θ,珓
θ) = (珓
θ-
2
θ) , 则贝叶斯估计珓
θb = E(θ| X1 , … , Xn ) .
例 3 .5 　设 X～ B( 1 , p) , 其中参数 p 未知 , 样本 X1 , X2 , … ,
Xn , 取 p 的先验估计为[0 , 1 ]上的均匀分布 , 损失函数取 L(θ,珓
θ) =
(θ- 珓
θ) 2 , 求 θ的贝叶斯估计 .
n
解　由 θ与 X 1 , … , X n 的联合概率密度函数为 p ∑ x
i (1 -
i= 1
n n
∑ i , p ∈ [ 0 , 1] .记 X =
∑ X , 则后验分布为
n - x
p) i= 1 i
i= 1
Γ( n + 1 )
h( p | X1 , … , X n ) = pX (1 - p) n - X .
Γ( X + 1 )Γ( n - X + 1)
因而 ^pb = E( p | X1 , … , Xn ) = ( X + 1)/ ( n + 2 ) = ( n X + 1)/ ( n + 2 ) .
9 .4 　区间估计
前面几节介绍的参数点估计使用一个点 ( 即一个数 ) 去估计未

知参数 , 然而在应用中常常要对某未知参数估计它的范围 , 这就是
区间估计 , 顾名思义 , 区间估计是用一个区间去估计未知参数 , 即
把未知参数值估计在某两界限之间 .有时参数的区间估计比点估
计更有意义 .
9 .4 区间估计　 351
例如 , 某一地区天气预报下周平均气温在 22℃ 到 30℃ 之间 ;

洪水期间长江某检测站预报下周水位在 17～ 22m 之间 .这种区间
估计是人们生活中更需要了解的信息 .
区间估计粗略地说是用两个估计量珓
θ1 ,珓
θ2 (珓
θ1 ≤珓
θ2 ) 为端点的区
间[珓
θ1 ,珓
θ2 ]作为参数 θ取值范围的估计 .显然 , 这种估计有两个基本
要求 : 首先 “
, 精度”要求 , 即珓
θ2 - 珓
θ1 要尽量小 , 太大没有意义 ; 其
次 , 这个估计要有尽可能高的可信程度 ( 即可靠度 ) .因此珓
θ2 - 珓
θ1
不能太小 .我们希望既能得到较高的精度 , 又能得到较高的可靠
度 .但在样本密度 n 给定时 , 这两方面要求相互矛盾 , J・奈曼 ( J .
N eym an) 在 20 世纪 30 年代提出至今仍广泛应用的原则是 : 首先
保证可靠度 , 在此前提下使精度尽量高 .
定义 4 .1 　对于参数θ, 如果有两个统计量珓
θ1 =珓
θ1 ( X1 , X2 , … ,
θ2 =珓
Xn ) ,珓 θ2 ( X1 , X2 , … , Xn ) 满足对给定的 α∈ (0 , 1 ) , 有
θ1 ≤ θ≤珓
P(珓 θ2 ) = 1 - α,
则称[珓
θ1 ,珓
θ2 ]是 θ的一个区间估计 ( 或置信区间 ) ,珓
θ1 ,珓
θ2 分别称为置
信下限和置信上限 , 1 - α称为置信水平 .
这里的置信水平 , 就是对可信程度的度量 .如取置信水平 1 -
α= 95 % , 就是说若对某一参数 θ取 100 个容量为 n 的样本 , 用相
( k) ( k)
同方法做 100 个置信区间 (珓
θ1 ,珓
θ2 ) ( k = 1 , 2 , … , 100 ) , 则其中约
有 95 个区间包含了真参数 θ.因此 , 当只做一次区间估计时 , 有理
由认为它包含了真参数 .这样判断当然有可能犯错误 , 但犯错误的
概率只有 5 % .
1 　正态总体均值的区间估计
(1 ) 标准差 σ已知的情形
设正态总体 X ～ N (μ,σ2 ) , σ已知 .从总体抽得简单样本
X1 , … , Xn , 试求置信水平为 ( 1 - α) 的 μ的置信区间 .
由前面的讨论可知, 可用珡
X 作为 μ的估计 , 易知珡
X ～ N (μ,
2 2
σ / n) , 故 U = (珡
X - μ) n/ σ～ N ( 0 , 1 ) , 当给定 α( 0 < α< 1 ) 时 , 存
在 uα/ 2 ( uα/ 2 可用标准正态分布表查出 ) 满足 : P{ | U | < uα/ 2 } = 1 -
α, 即 P{ | (珡
X - μ) n/ σ| < uα/ 2 } = 1 - α.从而得
σ σ
P 珡
X - uα/ 2 < μ< 珡
X + uα/ 2 = 1 - α, ( 4 .1)
n n
因此可取
σ σ
珡
X - uα/ 2 ,珡
X + uα/ 2 ( 4 .2)
n n
σ σ
作为 μ的 ( 1 - α) 置信水平的置信区间 .珡
X - uα/ 2 与珡
X + uα/ 2 分
n n
别称为μ的置信上限与置信下限 .
通常取 α= 0． 01 , 0． 05 或 0． 10 等 . ( 4． 1 ) 式表明 , 随机区间
σ σ
珡
X - uα/ 2 ,珡
X + uα/ 2 套住 ( 覆盖 ) 参数 μ的概率为 ( 1 - α) .
n n
注　给定 α(0 < α< 1 ) , 满足 (4． 1 ) 式的置信区间不唯一 .
(2 ) 标准差 σ未知的情形
由于 σ未知 , 需选用 ( 珡
X - μ) n/ S 作为解决这种情形的基础 .
由本章定理 1． 1 知 , T = ( X - μ) n/ S～ t( n - 1 ) , 则给定 α( 0 <
α< 1) , 查 t 分布分位表得 tα/ 2 ( n - 1 ) 满足 P { | ( 珡
X - μ) n/ S | <
tα/ 2 ( n - 1 ) } = 1 - α, 得
S S
P 珡
X - tα/ 2 ( n - 1 ) < μ< 珡
X + tα/ 2 ( n - 1) = 1 - α,
n n
( 4 .3)
因此可取
X - tα/ 2 ( n - 1 ) S , 珡
珡 X + tα/ 2 ( n - 1 ) S ( 4 .4)
n n
作为 μ的置信区间 , 对应的置信水平为 ( 1 - α) .
9 .4 区间估计　 353
2 　正态总体方差的区间估计
设正态总体 X～ N(μ,σ2 ) , 其中 μ,σ2 均为未知 , X1 , … , Xn 为

2
其简单样本 , 给定 α( 0 < α< 1) , 试对方差 σ 或标准差 σ给出置信
水平为 (1 - α) 的置信区间 .
( n - 1 ) S2
由本章定理 1． 1 知 , 令 χ ( n - 1) = , 则它是自由度
2
σ2
为 ( n - 1 ) 的卡方分布 .若给定水平 (1 - α) , 可查 χ2 ( n - 1 ) 表 , 存在
两侧的分位数 χ21 - α/ 2 ( n - 1 ) 及 χα2/ 2 ( n - 1 ) 满足
2 2 α
P χ ( n - 1) ≥ χα/ 2 ( n - 1 ) = ,
2
P χ2 ( n - 1 ) < χ21 - α/ 2 ( n - 1 ) = α ,
2
则 P χ21 - α/ 2 ( n - 1) < ( n - 1 ) S2/ σ2 < χα2/ 2 ( n - 1 ) = 1 - α, 即
2 2 2 2 2
P ( n - 1) S / χα/ 2 ( n - 1 ) < σ < ( n - 1) S / χ1 - α/ 2 ( n - 1 )
= 1 - α, ( 4 .5)
故可取
( ( n - 1 ) S2/ χα2/ 2 ( n - 1) , ( n - 1 ) S2/ χ21 - α/ 2 ( n - 1) ) ( 4 .6)
2
作为 σ 的置信区间 .取
n - 1 S/
2
χα/ 2 ( n - 1) , n - 1 S/
2
χ1 - α/ 2 ( n - 1 ) 　　
(4 .6a)
作为 σ的置信区间 .
3 　两个正态总体方差比的区间估计

2 2 2
设两个正态总体 X ～ N (μ1 ,σ1 ) , Y ～ N (μ2 ,σ2 ) , 其中 μ1 ,σ1 ,
μ2 ,σ22 为未知参数 , X1 , … , X n1 与 Y1 , … , Y n2 分别是 X 与 Y 的样
n n
1 2
∑( X ∑(Y
2 2 2 2
本 , 记 S1 = i - 珡
X ) / ( n1 - 1) 与 S2 = i - 珚
Y) / ( n2 -
i=1 i= 1
1) 分别为它们的样本方差 .给定置信水平 (1 - α) , 试求方差比
σ21/ σ22 的置信区间 .
2 2 2 2 2 2
为求 σ1/ σ2 的置信区间 , 注意到 ( n1 - 1 ) S1/ σ1 与 ( n2 - 1 ) S2/ σ2
分别服从自由度为 ( n1 - 1 ) 和 ( n2 - 1 ) 的卡方分布 , 且相互独立 ( 由
取样相互独立 ) , 于是由 F 分布定义知
2 2 2 2 2 2
( n2 - 1 ) S2 / [σ2 ( n2 - 1) ] S2/ σ2 σ1 / σ2
F = = 2 2 = 2 2 ( 4 .7)
S1/ σ1
2 2
( n1 - 1 ) S1 / [σ1 ( n1 - 1) ] S1 / S2
服从自由度为 ( n2 - 1 , n1 - 1) 的 F 分布 .
对给定 α, 查 F 分布表 , 可得
P{ F > Fα/ 2 ( n2 - 1 , n1 - 1) } = P{ F < F1 - α/ 2 ( n2 - 1 , n1 - 1 ) }
α
= ,
2
则 P{ F1 - α/ 2 ( n2 - 1 , n1 - 1 ) < F < Fα/ 2 ( n2 - 1 , n1 - 1) } = 1 - α, 即得
2 2 2
S1 σ1 S1
P F1 - α/ 2 ( n2 - 1 , n1 - 1) 2 < 2 < Fα/ 2 ( n2 - 1 , n1 - 1 ) 2
S2 σ2 S2
= 1 - α, ( 4 .8)
2 2
故得 σ/ σ 的置信水平为 (1 - α) 的置信区间为
1 2
S21 S21
F1 - α/ 2 ( n2 - 1 , n1 - 1) 2 , Fα/ 2 ( n2 - 1 , n1 - 1) 2 .　　
S2 S2
( 4 .9)
　　请读者思考 : 设总体 X～ N (μ1 ,σ21 ) , Y ～ N (μ2 ,σ22 ) , 若 σ21 ,σ22
已知 , 而 μ1 ,μ2 未知 , 给定 α( 0 < α< 1 ) , 试给出均值差 μ1 - μ2 的区
间估计 .
4 　大样本对总体均值的区间估计

4
以下讨论总体 X～ F( x ) 是一般分布 , 但 E X < ∞ 存在 , 且均
2
值 E X =θ, 方差 D X = σ 均未知时 , 用大样本 X1 , … , X n ( 即 n 充分
大 ) 对总体均值的区间估计问题 .
由本章第 2 节矩估计方法知 , 可用样本均值珡
X 作为总体均值
9 .4 区间估计　 355
θ的点估计, 且珡
X 是 θ的无偏估计与相合估计 , 即 E珡
X =θ, 且 n→
lim 珡
X =
∞
θ.又 D珡
X =σ2/ n, 故由中心极限定理知 , 当 n→ ∞ 时 , ( 珡
X - θ) n/ σ
的分布函数趋向标准正态概率分布 N ( 0 , 12 ) .另一方面 , 注意到
2 2 4 2
E S = σ , 在 E X < ∞存在的条件下 , 可以证明当 n→∞ 时 , D S →
P
0 , 见文献[ 3 ]第 2 册 .故由大数定律有 nlim σ .这样 , 在 n→ ∞

2 2
S =
→∞
时统计量 (珡
X - θ) n/ σ与统计量 ( 珡
X - θ) n/ S 的极限分布均是标
准正态分布 N (0 , 12 ) , 即当 n 充分大时
X - θ)
U = (珡 n/ S
渐近标准正态分布 .给定置信水平 α, 查标准正态分位数 uα/ 2 , 在 n
充分大时 , 有
P{ | 珡
X - θ| n/ S < uα/ 2 } ≈ 1 - α,
即
S S
P 珡
X - uα/ 2 < θ< 珡
X + uα/ 2 ≈ 1 - α.
n n
于是 θ的水平 (1 - α) 的置信区间为
S S
珡
X - uα/ 2 ,珡
X + uα/ 2 . (4 .1 0)
n n
　　例 4 .1 　从一大批钢筋中随机抽取 100 件进行测试 , 结果有 4
件次品 .试以水平为 95 % 的概率估计整批钢筋次品率的范围 ( 置
信区间 ) .
解　设总体 X～ B( 1 , p) 为两点分布 , 次品率为 p . X = 0 表示
合格品 , X = 1 表示次品 .由题意样本容量 n = 100 , 次品数 k = 4 , 取
1
k n- k 2
S= = 0 .04×0 .96 , 而后利用 ( 4． 10 ) 式可得
n n
k - uα/ 2 S = 0 .04 - 1 .96 × 0 .04 × 0 .9 6/ 10 = 0 .002 ,
n n
k S
+ uα/ 2 = 0 .04 + 1 .96 × 0 .04 × 0 .9 6/ 10 = 0 .078 ,
n n
故整批钢筋次品率的置信区间为 (0． 002 , 0． 078 ) .
5 　贝叶斯区间估计
设总体 X～ f ( x,θ) , 其中 θ∈Θ为未知参数 , 先验分布为 h(θ) ,

给定样本 X1 , …, Xn ,θ的后验分布为 h(θ| X1 , … , Xn ) .当 ( X1 , … ,
Xn ) = ( x1 , … , xn ) 时 , 对给定水平 1 - α, 若区间[珓
θ1 ( x) ,珓
θ2 ( x) ]满足
珓
θ ( x)
∫
2
h(θ| x ) dθ= 1 - α,
珓
θ ( x)
1
则称[珓
θ1 ( x ) ,珓
θ2 ( x) ]为置信水平 1 - α参数θ的贝叶斯区间估计 .
例 4 .2 　设总体 X～ N (μ,σ2 ) ,μ的先验分布为 N (μ0 ,σ20 ) , 其
中 σ,μ0 ,σ20 均为已知常数 , X1 , … , X n 为 X 的样本 , 试求 μ的贝叶
斯区间估计 .
解　由前面例 2． 11 的讨论 , 可知 μ的后验分布 h (θ| x1 , … ,
xn ) ～ N( a, b2 ) , 其中
- 1 - 1
n 1 2 2 2 n 1
a= 2 + x/ σ + μ0 / σ ) , b =
( n珚 0 2 + ,
σ σ20 σ σ20
2 μ- a 2
由 h(θ| x1 , … , xn ) ～ N ( a, b ) , 则关于 x 的分布为 N ( 0 , 1 ) ,
b
故而
μ- a
P - uα/ 2 < < uα/ 2 | x = 1 - α,
b
于是 μ的贝叶斯 (1 - α) 水平的区间估计为[ a - uα/ 2 b, a + uα/ 2 b] .
置信区间是下一章假设检验的基础 , 同时有广泛的应用背景 .
9 .5 　非参数估计
以上讨论的是参数估计问题 , 本小节讨论非参数估计问题 , 主
要讨论总体分布函数的估计问题 .
练习题　 357
设总体 X ～ F ( x ) , 其样本为 X1 , X2 , … , Xn , ＂ x ∈ R , 记
n
Fn ( x) = 1 ∑ I( X k ≤ x ) , 称珟
珟 Fn ( x ) 为 X 的经验分布 , 若用珟
Fn ( x)
n k=1
作为总体分布函数的估计 , 则由第 3 , 4 章内容可知 : ＂ x∈ R 有 :
(1 ) E珟
Fn ( x) = F( x ) , D珟
Fn ( x ) = F( x ) ( 1 - F( x ) )/ n;
(2 ) ＂ ε> 0 , lim P( |珟
Fn ( x ) - F( x) | <ε) = 1 .
n→ ∞
事实上 , 有更强的结果 :
＊
(3 ) P n→
lim 珟
Fn ( x) = F( x) = 1 .
∞
可见珟
F n ( x) 是 F( x) 的无偏估计与 ( 强 ) 相合估计 .( 所指强相合 , 即
当 n→∞时 ,珟
Fn ( x ) 以概率 1 收敛到 F( x) .)
练　习　题
9 .1 　设 x1 , … , xn 是来自正态分布 N (μ,σ2 ) 的样本值 ,μ已
2
知 , 求 σ 的极大似然估计量 .
9 .2 　设 x1 , … , xn 是来自正态分布 N (μ, 1) 的样本值 , 求 μ的
极大似然估计量 .
9 .3 　设 X 服从区间[ 0 ,λ] (λ> 0 ) 上的均匀分布 ,λ是未知参
数 , 而 x1 , … , xn 是 X 的样本值 , 试求出 λ的极大似然估计量和矩
估计量 .
9 .4 　设 X1 , … , X n 是来自均匀分布 U (θ, 2θ) 的样本 , 试求出
θ的最大似然估计量和矩估计量 .
9 .5 　设 X 服从区间[ a, b] 上的均匀分布 , 这里 a, b 是两个未
知参数 .若 x1 , … , xn ( 不全相等 ) 是 X 的样本值 , 试求出 a, b 的最
大似然估计量 .
- λ
9 .6 　设 X～P o(λ) , 参数 λ有先验密度 h(λ) = e I (λ≥ 0 ) .试分
别求出 λ的贝叶斯最大后验估计及贝叶斯条件期望估计 .
9 .7 　设 X1 , … , X n 是来自指数分布的样本 .分布中的参数 λ

-λ
有先验密度 h (λ) = e I (λ> 0 ) .试分别求出 λ的贝叶斯最大后验估
计及贝叶斯条件期望估计 .
9 .8 　设 X 是来自二项分布 B ( n, p) 的样本 , n 已知 , p 为未
知参数 .证明 : 对任何常数 c, d , 可找到 p 的先验分布 , 使 p 的贝
叶斯估计为 ( X + c)/ ( n + d) .
9 .9 　设 X 是来自泊松分布 Po (λ) 的样本 .( 1 ) 证明 : g(λ) =
^( X) 为 : 当 X 为偶数 ,θ
e - 2λ 的唯一的无偏估计θ ^( X) = 1; 当 X 为
^( X) = 0 .( 2 ) 你认为 ( 1 ) 中的估计是否合理 ? 如不合理 , 试
奇数 ,θ
提出一个合理的估计 .
2
9 .10 　设 X1 , … , X n 是来自正态总体 N ( a,σ ) 的样本 , 则已
n
^ ( x) 1 ^2 =
∑
2 2
知θ 1 = ( Xi - 珡
X) 为 σ 之一无偏估计 .证明 : θ
n - 1 i= 1
n - 1^ 2 ^2 的均方误差较小, 即 E(θ
^2 - σ2 ) 2 <
θ1 虽非σ 的无偏估计, 但θ
n+1
^1 - σ ) .本题说明 : 无偏估计不一定是最好的选择 .
E(θ
2 2
9 .11 　设 X1 , … , X n 是来自某一个具有均值θ而方差有限的
n
总体中抽出的样本 .证明 : 对任何常数 c1 , … , cn , 只要 ∑ ci = 1 , 则

i =1
n
∑c X
i=1
i i 必是θ的无偏估计 .但是 , 只有在 c1 = … = cn = 1/ n 时方
差达到最小 ( 指在上述形式的估计类中达到最小 .实际可以证明 :

珡
X 在θ的一切无偏估计类中也达到最小 ) .
9 .12 　设 X1 , … , X n 是来自均匀分布 U (0 ,θ) 的样本 .证明 :
对任给的 1 - α(0 < 1 - α< 1) , 可找到常数 cn , 使[ m ax ( X1 , … ,
Xn ) , cn m ax ( X1 , … , Xn ) ] 为 θ的一个置信系数 1 - α的区间估计 .
9 .13 　设 X1 , … , Xn 和 Y1 , … , Y m 分别是来自正态总体 N (θ,
练习题　 359
⌒
2 2 2 2
σ1 ) 和 N(θ,σ2 ) 的样本 ,σ1 和 σ2 都已知 .( 1) 找常数 c, d , 使θ =
c珡
X + d珚
Y 为θ的无偏估计 , 并使其方差最小 ( 在所有形如 c珡
X + d珚
Y
⌒
的无偏估计类中最小 ) ; ( 2) 基于θ, 作出θ的置信系数为 1 - α的置
信区间 .
9 .14 　测量铝的相对体积质量 16 次 , 测得珚
x = 2． 705 , S =
0． 029 , 试求铝的相对体积质量的置信区间 ( 设测量值服从正态分
布 , 置信度为 0． 95) .
2 2
9 .15 　设 X～ N(μ,σ ) , x1 , … , xn 是其样本值 .如果σ 已知 ,
问 n 取多大时方能保证 μ的置信度为 0． 95 的置信区间的长度不
大于给定的 L ?
2 2
9 .16 　设 X1 , … , Xn 是来自正态总体 N (θ,σ ) 的样本 ,θ和σ
都未知 .证明珡
X 仍为θ的最小方差无偏估计量估计 .
9 .17 　设总体 X 为离散型随机变量 , 其分布律为 P( X = - 1) =
(1 - θ)/ 2 , P( X = 0 ) = 1/ 2 , P( X = 1) = θ
/ 2 , X1 , … , X n 为其样本 .
(1 ) 求 θ的极大似然估计珓
θ1 , 问珓
θ1 是否是 θ的无偏估计 ;
(2 ) 求 θ的矩估计珓
θ2 ;
(3 ) 计算 θ的无偏估计的方差克拉默－拉奥下界 .
1 θ1 - 1
9 .18 　设总体 X 的概率密度函数为 f ( x,θ) = x I( 0 < x<1)
θ
(θ> 0) , X1 , … , Xn 为其样本 .
(1 ) 求 θ的极大似然估计珓
θ1 , E珓
θ1 及 D珓
θ1 ;
(2 ) 求 θ的最小方差无偏估计珓
θ2 .
9 .19 　设总体 X 是服从参数为 p 的负二项分布 , 即
r -1 k- r r
P( X = k) = C k - 1 (1 - p) p , 　　 k ≥ r, r ≥ 1 为整数 ,
X1 , … , Xn 为其样本 .求 :
(1 ) p 的极大似然估计珟
p 1 ; (2 ) p 的矩估计珟
p2 .
9 .20 　设总体 X～ U (θ1 ,θ2 ) (θ1 < θ2 ) , X1 , … , Xn 为其样本 ,
X( 1 ) , … , X ( n) 为其顺序统计量 .
(1 ) 求 θ1 与 θ2 的最小方差无偏估计 ;
(2 ) 取θ2 = 2θ1 , 求θ1 的极大似然估计 , 问它是否是θ1 的无偏
估计 , 说明理由 ;
(3 ) 当 θ2 = 2θ1 时 , 令 T = ( n + 1 ) ( 2 X ( n) + X( 1 ) )/ (5 n + 4 ) ,
试证 T 是θ1 的无偏估计 , 且 DT ≤ D珓
θ1 .
9 .21 　设总体 X ～ U ( kθ, ( k + 1)θ) ( k > 0 已知 ) .X1 , … , X n
为其样本 , X ( 1 ) , … , X( n) 为其顺序统计量 .
(1 ) 求 θ的极大似然估计 , 记为珓
θ;
⌒ ⌒
(2 ) 令θ = X ( 1 ) / k, Tα = α珓
θ + (1 - α) θ, 求使 DTα 达最小的
α＊ , 并计算 DTα＊ / D珓
θ.
9 .22 　设总体 X 的概率密度函数为 f ( x,μ,σ) =
(1/ 2σ) exp { - | x - μ| / σ} ,μ∈ R ,σ> 0 , X1 , … , X n 为其样本 .
(1 ) 求 μ,σ的矩估计 ;
(2 ) 求 μ,σ的极大似然估计 .
9 .23 　设 X1 , … , Xn 独立同分布 , E X 1 = μ, D X 1 < ∞ .证明
n
2
n( n + 1) ∑
珘
μ= i X i 是 μ的相合估计 .
i= 1
9 .24 　设 X1 , … , Xn 是来自总体 X ～ U ( 0 , nλ) 的一个样本 ,

X( 1 ) , … , X ( n) 为其顺序统计量 .
(1 ) 证明 nλ - X ( 1 ) 的分布收敛于 exp(1/ λ) ;
(2 ) 用 ( 1) 中的结果给出 λ的一个相合估计 .
θ- 1
9 .25 　设总体 X 的概率密度函数为 f ( x,θ) = θ(1 +θ) x (1 -
x ) I( 0 < x < 1 ) (θ> 0 ) , X1 , … , Xn 为其样本 .
(1 ) 求 θ的矩估计珓
θn ;
(2 ) 求 n(珓
θn - E珓
θn ) 的渐近分布 ;
(3 ) 珓
θn 是否是θ的渐近有效估计 ?
9 .26 　从一批电子元件中抽取 100 件 , 若抽取的元件的平均
2
强度为 1000 , 标准差为 40 , 假设该批元件强度 X ～ N (μ,σ ) , 试求
练习题　 361
μ的置信区间 ( 设 α= 0． 05) .
2
9 .27 　设某厂每天生产的一批钢筋强度 X ～ N (μ,σ ) .现从
中抽取 20 件 , 测得抗拉强度为 : 45． 20 , 44． 90 , 45． 11 , 45． 20 ,
45． 54 , 45． 38 , 44． 77 , 45． 35 , 45． 15 , 45． 11 , 45． 00 , 45． 61 , 44． 88 ,
45． 27 , 45． 38 , 45． 46 , 45． 27 , 45． 23 , 44． 96 , 45． 35 .给定 α = 0． 05 ,
试求 μ与σ的置信区间 .
9 .28 　设某一钢厂生产的大批量钢材 , 每根强度 X ～ N (μ,
2
σ ) , 其中σ= 10 ( kg) 为已知 .均值 μ为未知参数 .但由以往生产的
记录知 , 每天生产的每批钢材的期望强度 μ～ N( 1150 , 202 ) .现从
某一天生产的一批钢材中任取 5 根 , 测得每根钢材的强度为 1145 ,
1150 , 1147 , 1151 , 1155 .试用贝叶斯条件期望估计法 , 对该批钢材
的条件期望强度作出估计 .
9 .29 　设总体 X ～ B( 1 , p) , 其中 p 为未知参数 , p ∈ [0 , 1 ] .
n
X1 , … , X n 为 X 的样本 , 记 X = ∑ X ,若
i= 1
i p 的先验分布 h( p) 取为
参数是 (α,β) 的贝塔分布 , 即 h( p) ～ Be (α,β) ( 详见第 2 章定义 ) .

若试验结果为 X = r( 0 ≤ r ≤ n) , 试求 p 的贝叶斯最大后验估
计值 . 　
9 .30 　设总体 X ～ Po(θ) ( 即参数为θ的泊松分布 ) ,θ> 0 为
未知参数 .按已知历史资料 , 选取 θ的先验分布 h(θ) 为参数是 (α,
r) 的伽玛分布 ( 详见第 2 章伽玛分布的定义 ) .现有样本 X1 , … , X n
n
取值为 x1 , … , xn , 记珚
x = ∑ x/
i=1
i n, 试求 θ的最大后验估计值 .
9 .31 　定数截尾寿命试验 .设总体 X ～ F( x,θ) , 密度函数为

f ( x,θ) (θ∈Θ) , x ≥ 0 为非负随机变量 .若 X 表示一批元件的工作
寿命 , 现从中抽取 n 个样本进行寿命测试 .为克服获得完全的寿命
数据所需时间过长的缺陷 , 采取定个数截尾寿命试验如下 : 即事
先指定一个数 k(1 ≤ k ≤ n) , 设抽取的 n 个元件从 t = 0 开始工作 ,
当实验进行到有 k 个样品失效就停止观测 .这时 , 仍有 ( n - k) 个样

品尚未失效 .若记前 k 个先后失效时间为 X ( 1 ) , X( 2 ) , … , X ( k) , 此
X( 1 ) , X( 2 ) , … , X ( k) 为 n 个样品定数截尾寿命试验数据 .记 Tn, k =
k
∑X
i=1
( i) θn , k = Tn, k / k 　 (1 ≤ k ≤ n) .若 f ( x,θ) =
+ ( n - k) X ( k) ,珓
- 1 - θ- 1 x
θ e I ( x > 0 ) ,θ∈ Θ未知 .
(1 ) 给定 X ( 1 ) , X ( 2 ) , … , X( k) , 试求 θ的极大似然估计量珓
θL ;
(2 ) 证明珓
θn, k (1 ≤ k ≤ n) 是 θ的无偏估计 ;
(3 ) 证明珓
θn, k (1 ≤ k ≤ n) 是 θ的相合估计 .
9 .32 　同上题定数截尾寿命试验 , 但总体 X 是参数为 (α,γ)
的伽玛分布 , 即 X ～ G(α,γ) .若 γ = 2 已知 , 取 n 个样本 , 给定
X( 1 ) , X( 2 ) , … , X ( k) , 试求 α的极大似然估计量珘
αL .
第 10 章
假设检验
本章简要介绍假设检验的基本概念与推断的直观依据 , 介绍

简单的假设检验的基本方法和一般步骤 , 重要参数的检验方法及
分布函数的检验方法 .
10 .1 　问题的提法与基本概念
所谓假设检验是指根据样本提供的信息来推断 ( 检验 ) 总体特
性的某些假设是否可信 ( 是否成立 ) .
例 1 .1 　某厂生产一大批元件 , 按质量标准规定 , 次品率要低
于 1 % , 并须经抽样检验合格才能出厂 , 现从其中任抽取 5 件 , 发
现 5 件中含有次品 , 问这批产品能否出厂 ?
从直观上判断 , 这批元件是不能出厂的 .那么理由何在 ? 记这
批元件的次品率为 p , 若记假设 ( 或命题 ) H0 = { p < 0． 01} , X 为抽
取的次品个数 .则问题可转化为 : 如何根据抽样结果检验假设 H0
是否成立呢 ? 可以这样来推断 : 如果假设 H0 成立 , 即 p < 0． 01 , 那
么抽取 5 个抽到次品的概率为 P ( X ≥ 1 ) = 1 - P ( X = 0 ) < 1 -
(0． 99) 5 < 0． 05 , 即事件 ( X≥1) 是一小概率事件 .而小概率事件在
一次试验中是难以发生的 .但一次试验结果竟然发生 , 于是我们可
以有把握断言 , 原来假设 H0 难以置信 , 应拒绝 H0 这一原先假设 .
这就是根据样本结果检验总体原先假设 H0 是否成立的直观依
据 .称这种推断依据为小概率事件推断原理 .
显然 , 抽取的样品中次品的个数越大 , 假设 H0 就越不可信 ,
364 　第 10 章假设检验
就越应该被拒绝 .通常对于一次的简单抽样 , 对样品中的次品数事

先要规定一个临界值 K .例如上例中 , 若规定 K = 0 , 当 ( X = 0 ) 时
接受假设 H0 , 当 ( X > 0 ) 时拒绝 H0 假设 .
一般地 , 若厂方规定每次抽取 n 个元件进行检验 , 仍记 X 为
抽验中的次品数 , 规定临界值为 K .当 ( X ≤ K ) 时 , 接受原假设
H0 , 即认为 H0 成立 , 允许该批元件出厂 ; 当 ( X > K) 时 , 拒绝 H0 假
设 , 即认为 H0 不成立 , 不允许该批元件出厂 .称 ( X ≤ K ) 为接受区
域 ( 即接受 H0 假设的区域 ) , ( X > K ) 为拒绝域 .
给定 H0 与 n, 如何确定拒绝域或临界值 K 呢 ? 确定 K 的基
本依据是 : 当 H0 成立时 , 选取 K , ( X > K) 应是一个小概率事件 .
确切地说 , 预先给定小概率 α( 0 < α< 1 , 一般取为 0． 05 或 0． 01
等 ) , 选取 K 满足 : 当 H0 成立时 , P( X > K) ≤α, 即确定临界值 K
应保证 H 0 成立时 , X 落在拒绝域的概率是不超过α的小概率 .
由上例可知 , 所谓假设检验就是 , 根据研究问题的需要 , 对总
体的某些性质提出假设 , 如假设 H0 : p < 0． 01 , 称 H0 假设为原假
设或零假设 .为判断原假设 H0 是否成立 , 采用类似于“反证法”的
思想方法 .我们先假定这个“ 假设 H0 ”成立 , 然而 H0 是否成立要
由试验结果来验证 : 如果由假定 H0 成立条件下的某一个小概率
事件 , 竟然在一次试验中发生 , 我们就有理由拒绝假设 H0 ( 起码
不能轻易接受 H0 ) , 如果必须在拒绝与接受之间二者选择之一 ,
那么此时选择拒绝 H0 比选择接受 H0 更合理 .相反 , 若在一次试
验中发生的是一大概率事件 ( 在原假设 H0 成立的条件下 ) , 那么 ,
这时选择接受原假设 H0 比拒绝 H0 更合理更明智 .这种推断方法
我们称之为小概率事件统计推断原理 .
那么 , 事件的概率小到什么程度才算“小概率事件”呢 ? 这要
视实际具体问题的需要而定 .一般把概率不超过 0． 05 的事件当作
“小概率事件”.例如 , 普通的产品抽验 , 通常取 α= 0． 05 ,α= 0． 01;
若对降落伞这一类产品通常要求 α小于 0． 001 , 而对飞机航天器
10 .1 问题的提法与基本概念　 365
就更要小的多了 .
例 1 .2 　某奶粉厂用自动打包机打包 , 规定每包奶粉标准重
为 500 克 , 已知每包重量服从正态分布 , 其均方差 σ= 0． 9 克长期
保持不变 .每天开工后需抽样检验打包机工作是否正常 ( 即有无系
统偏差 ) .某日开工后测得 9 包重量 ( 单位 : 克 ) 如下 :
500． 7 , 500． 5 , 499． 7 , 501． 0 , 500． 8 , 499． 8 , 501． 2 , 502． 0 , 500． 6 .
给定 α= 0． 05 , 问该日打包机工作是否正常 ?
解　对抽样数据的初步直观分析 : 设每包重为 X , 按规定 , 若
2
打包机工作正常 , 则应有 X～ N ( 500 , 0． 9 ) .那么在正常情况下 ,
样本数据应该大体是 : ( 1) 数据应围绕 500 左右波动 , 且大于和小
于 500 的数目应各占 1/ 2 左右 ; ( 2 ) 样本数应有约 95 % 左右落在
区间 (500 - 2×0． 9 , 500 + 2 × 0． 9 ) 上 .而抽样结果是 : ( 1 ) 9 个数
据只有 2 个小于 500 , 而有 7 个大于 500 ; ( 2) 且 9 个数据已有一个
落在区间 (500 - 2× 0． 9 , 500 + 2× 0． 9 ) 之外 .初步印象 , 打包机的
平均重量可能偏重 ! 不正常 , 应进一步分析检验 .以下介绍 U－检
验法 .
2
依题意 X～ N(μ,σ ) , 且 σ= 0． 9 已知 .为检验打包机工作是
否正常 , 我们先提出假设 H0 : μ= μ0 = 500 , 然后用抽验结果检验
H0 是否成立 .若 H0 成立的 , 则 U = ( 珡
X - μ0 ) n/ σ～ N ( 0 , 12 ) , 因
此 , 可以用 U 的取值来判断 H 0 是否成立 .给定 α= 0． 05 , 取 uα/ 2 =
u0 .02 5 = 1． 96 使 P{ | U | < 1． 96 } = 1 - α= 0． 95 .因此 , 若 H0 成立 , 则
{ | U | > 1． 96 } 是小概率事件 .而小概率事件在一次试验中基本不
会发生 .但是计算珡
X 的取值珔
x = 500． 7 及统计量 U 的取值 u = (珔
x-
μ0 ) n/ σ= ( 500． 7 - 500 ) × 9/ 0． 9 = 2． 33 > 1． 96 , 这意味着小概率
事件{ | U | > 1． 96} 竟然在一次试验中发生了 , 这是不合理的 .究其
源是因为原假设 H0 不可信 .因而应拒绝 H0 , 即认为不能讲该日
打包机工作正常 , 应先调整之后再生产 .
2 2
设总体 X～ N(μ,σ ) ,σ 已知 , 检验均值 μ的一般步骤如下 :
(1 ) 根据问题要求 , 提出原假设 H0 : μ= μ0 , 对立假设 H1 :
μ≠μ0 ;
(2 ) 根据 H0 , 选取统计量 U = (珡
X - μ0 ) n/ σ, 在 H0 成立条件
下 U～ N (0 , 12 ) ;
(3 ) 给定 α( 称 α为显著水平 ) , 查表定出临界值 uα/ 2 , 从而使
H0 成立时 , 事件{ | U | > uα/ 2 }是一小概率事件 ;
(4 ) 计算珡
X 的取值珚
x 及统计量 U 的取值 u = (珚
x - μ0 ) n/ σ,
当 | u | > uα/ 2 时 , 拒绝 H0 , 当 | u| < uα/ 2 时 , 接受 H0 .
通过以上诸例 , 可初步了解到假设检验问题的提法 , 以及用于
检验假设的直观依据 , 即小概率事件统计推断原理 .在此 , 对若干
常用名词与概念补充如下 .
(1 ) 原假设与对立假设
在假设检验中 , 常把一个被检验的“ 重要”假设叫作原假设 , 用
H0 表示 , 或叫作零假设 .而与原假设不同的另一假设 , 称为备择假
设 , 用 H1 表示 , 有时也叫作对立假设 .如例 1． 2 中 , 原假设为 H0 :
μ= μ0 = 100 , 而对立假设或备择假设为 H1 : μ≠μ0 .
(2 ) 检验统计量 , 接受域 , 拒绝域
为检验一个假设 H0 所选择的样本统计量称为检验统计量 .
使 H0 得到接受的所有样本点 X1 , … , X n 所在区域全体 , 称为该检
验的接受域 , 记为 W0 .而使 H0 被拒绝的所有样本点 X1 , … , X n 所
在区域全体 , 称为该检验的拒绝域 , 记为 W1 .如例 1． 2 中 , H0 的接
受域为
W0 = (μ0 - uα/ 2σ
/ n,μ0 + uα/ 2σ
/ n) ,
H0 的拒绝域为
W1 = ( - ∞ ,μ0 - uα/ 2σ
/ n) ∪ (μ0 + uα/ 2σ
/ n, + ∞) ,
点 μ0 ± uα/ 2 σ
/ n称为临界点 .
10 .2 两类错误与功效函数　 367
(3 ) 单式检验 , 复式检验与序贯抽样检验
根据抽取一回容量为 n 的样本就作出或者接受 H 0 , 或者拒绝
H0 的决定的检验称为单式检验 .对复式检验 , 以例 1． 1 的情形为
例 , 若要检验 H0 : p < 0． 01 是否成立 , 规定抽样方案如下 : 第一回
抽取 5 个 , 记其中红球个数为 X1 , 若 X1 = 0 , 则接受 H0 ; 若 X1 ≥
2 , 则拒绝 H0 ; 若 X1 = 1 , 则再抽第二回 , 例如再抽取 10 个 .记 X2
为其中红球数 , 若 X2 = 0 , 则接受 H0 , 否则拒绝 H0 .这种抽验方式
称为复式抽验 .而第 2 章练习题 2． 31 题所叙述的抽样检验就是一
种序贯抽验 .
10 .2 　两类错误与功效函数
1 　检验法
　　由前面的例子可知 , 在假设检验中 , 对给定的假设 H0 作出接

受或拒绝的决断 , 这要根据样本的取值情况事先规定一个规则 , 我
们称之为检验法 .确切地说 , 记 S 为样本取值 x = ( x1 , … , xn ) 全体
构成的集合 ( 样本空间 ) , 那么一个检验 Φ是指对 S 的一个划分 :
W0 , W1 , 满足 : W0 ∪ W1 = S, W0 ∩ W1 = .当样本值 x = ( x1 , … ,
xn ) ∈ W0 时就接受 H0 ( 拒绝 H1 ) ; 当样本值 x = ( x1 , … , xn ) ∈ W1
时就拒绝 H0 ( 接受 H1 ) .简记检验 Φ= ( W0 , W1 ) .
例如例 1． 2 中 , H0 : μ= μ0 , 一个检验 Φ: W0 = (μ0 - uα/ 2 σ
/ n,
μ0 + uα/ 2σ
/ n) , W1 = ( - ∞ ,μ0 - uα/ 2 σ
/ n) ∪ (μ0 + uα/ 2 σ
/ n, + ∞) .
2 　两类错误
由于假设检验是根据一次抽样所得的检验统计量的取值是落
在拒绝域或接受域而作出决定是否拒绝或接受 H0 .这种由部分
信息判断总体的结果有可能发生两种错误 :
(1 ) 当 H0 成立时 , 而经检验被拒绝的错误 , 称为第一类错误 ,

犯第一类错误的概率记为 α;
(2 ) 当 H0 不成立时 , 而经检验被接受的错误称为第二类错
误 , 犯第二类错误的概率记为 β.
如何求 α与 β呢 ? 以例 1． 2 说明 .当 H0 : μ= μ0 = 500 成立
时 , 若取 α= 0． 05 , 则在 H0 成立条件下统计量落在拒绝域 { | U | >
u0． 02 5 }的概率即为 α; 当 μ≠μ0 = 500 时 , 即 H0 不成立时 , 不妨设
μ= μ1 ≠μ0 时 , 求统计量 U 落在接受域的概率 .此时 , 珡
X ～ N (μ1 ,
2
σ/ n) , 于是 , 珡
X 落在接受域的概率为
β= Pμ1 (μ0 - uα/ 2 σ
/ n < 珡
X < μ0 + uα/ 2σ
/ n)
μ + u σ
/ n
α
∫
0 / 2
2πσ/ exp[ - ( u - μ1 ) 2 n/ 2σ2 ] d u .
-1
= ( n)
μ - u σ
/ n
0 α/ 2
令 t = ( u - μ1 ) n/ σ代入上式 , 得
β= Φ( (μ0 - μ1 ) n/ σ+ uα/ 2 ) - Φ( (μ0 - μ1 ) n/ σ - uα/ 2 ) .
( 2 .1)
由 (2 .1 ) 式易知 , 当 n 给定时 , | μ0 - μ1 | 越大 , 则 β越小 .若给定
μ= μ1 固定 , 则当 n→∞时 , (μ0 - μ1 ) n/ σ趋于正无穷 ( 若 μ0 > μ1 )
或负无穷大 ( 若 μ0 < μ1 ) , 故 n→∞时 ,β→0 .
通常在检验一个假设 H0 ( 及 H1 ) 时 , 希望犯两类错误的概率
都尽可能小 , 但这两者的要求往往是矛盾的 .仍以例 1． 2 为例来
看 .当犯第一类错误的概率 α减小时 , 则由 P( | U | > uα/ 2 ) = α知 ,
对应 uα/ 2 的就增大 , 又由 ( 2． 1) 式易看出 , 当 uα/ 2 增大时 , 对应的 β
( 犯第二类错误的概率 ) 就增大 , 反之亦然 .因此需要建立适当的准
则以权衡与协调二者的利害得失 .下面仅介绍在假设检验中如何
区分不同检验法的一个基本依据和一种较为流行的处理方法 .
3 　功效函数 ( 势函数)
同一原假设 H0 : θ∈Θ0 ( 其中 Θ0 Θ是 Θ 的非空真子集 ) , 可
10 .2 两类错误与功效函数　 369
以用不同的检验法对 H0 进行检验 , 那么 , 根据什么来区分不同检

验法的优劣呢 ? 引进以下定义 .
定义 2 .1 　设对总体 X 的分布 f ( x ,θ) 提出原假设 H0 : θ∈Θ0
( 其中 Θ0 Θ是 Θ 的非空真子集 ) , 对立假设 H1 : θ∈Θ - Θ0 .记其
样本为 ( X1 , … , X n ) , 若采用检验 Φ= ( W0 , W1 ) 对 H0 进行检
验,称
βΦ (θ) = Pθ ( ( X1 , … , X n ) ∈ W1 ) ( 2 .2)
为检验 Φ的功效函数 ( po wer function) , 又称为势函数 .
易知 , 当且仅当事件{ ( X1 , … , X n ) ∈ W1 }发生时 , 拒绝原假设
H0 , 而这事件的概率显然与参数θ有关 , 即它是定义在参数空间 Θ
上的函数 .
不难看出 , 当 θ∈Θ0 时 ,βΦ (θ) 表示犯第一类错误的概率 ; 当
θ∈Θ1 时 , 1 - βΦ (θ) 表示犯第二类错误的概率 .换言之 , 当 θ∈Θ0
时 , 要求 βΦ (θ) 尽量小 ( 即当 H0 成立时 , 我们要求不要轻易拒绝
它 ) ; 而当 θ∈Θ1 时 , 要求 βΦ (θ) 尽量大 ( 即当 H0 不成立时 , 希望能
严格把好关 , 拒绝它 ) .这说明一个检验的功效函数确实反应该检
验法的优劣水平 .
如何协调和解决两类错误的利害得失呢 ? 目前在理论上较为
流行的办法是沿用奈曼－皮尔逊提出的假设检验的基本思想 , 就
是首先确保犯第一类错误的概率限制在不超过一给定值 α的前提
下 , 然后寻找使犯第二类错误的概率尽可能小的检验 .在这种准则
下 , 寻找一个好的检验法 , 就是事先约定的一个小的正数 α( 0 <
α< 1) , 在满足
　 βΦ (θ) = Pθ ( ( X1 , … , X n ) ∈ W1 ) ≤ α, 　　＂ θ∈ Θ0 　 (2 .3 )
的检验法中 , 寻找检验 Φ, 使得当 θ∈Θ1 时 ,βΦ (θ) 尽可能的大 .
在 θ∈Θ0 时 , 满足 βΦ (θ) ≤α的检验 Φ 称为水平为 α的检验 .
简记为 (α, Θ0 , Θ1 ) 检验 .称 α 为检验的显著性水平 ( evidence
level ) , 简称为水平 .
10 .3 　常用的参数检验
本节将讨论几个常用的参数检验 , 以及在奈曼－皮尔逊假设
检验的基本准则下 , 如何选择与构造在直观上看来较为合理的
检验 .
1 　正态总体均值的检验及推广
设总体 X～ N (μ,σ2 ) , 对均值 μ的假设检验仅介绍以下 3 种

典型形式 .
(1 ) H0 : μ= μ0 , H1 : μ≠μ0 ( 双侧 ( 边 ) 假设检验 ) ;
(2 ) H0′: μ≥μ0 , H1′: μ< μ0 ( 单侧假设检验 ) ;
(3 ) H0″: μ≤μ0 , H1″: μ> μ0 ( 单侧假设检验 ) .
下面分别讨论 .
(1 ) 方差 σ2 已知时 , 检验 H0 , H0′, H0″
对检验 H0 : μ= μ0 , H1 : μ≠μ0 , 可见例 1． 2 , 已作讨论 , 这里
不重复 .在此例 1． 2 中所用的检验统计量为 U = ( 珡
X - μ0 ) n/ σ, 因
此称之为 U－检验法 .
这里只对检验 H0′: μ≥μ0 , H1′: μ< μ0 作讨论 .记珡
X 为样本均
值,以珡
X 作为μ的估计 .故若珡
X 越大 , 直观上与原假设 H0′: μ≥μ0
越吻合 ; 反之 , 若珡
X 越小 , 则与 H1′: μ< μ0 更贴近 .因此 , 在直觉上
一个较为合理的检验 Φ应是 : 选取检验量为 U = ( 珡
X - μ0 ) n/ σ,
对给定的 α, 确定 uα .务请注意在这种情形 , 应使 P( U < - uα ) = α.
于是当 H0′成立时 , 事件 ( U < - uα ) = ( ( 珡
X - μ0 ) n/ σ< - uα ) 应是
小概率事件 .因此 , 当{ ( 珡
X - μ0 ) n/ σ< - uα } 发生时 , 应拒绝 H0′;
反之 , 则接受 H0′.所以 Φ的接受域与拒绝域应分别为
Φ: W0 = (μ0 - uασ/ n , + ∞ ) , 　 W1 = ( - ∞ ,μ0 - uασ/ n) ,
10 .3 常用的参数检验　 371
称上述检验法为单边 U－检验 .而例 1． 2 中的检验法称为双边 U－检

验法 .
在许多实际检验问题中 , 会遇到原假设 H0′: μ≥μ0 的单侧
( 边 ) 假设检验问题 .例如 , 某工厂每天生产的一批钢筋的质量指标
之一是它的平均抗拉强度 μ越大越好 .按出厂的质量标准 , 要求
μ≥μ0 才可出厂 , 因此提出原假设为 H0′: μ≥μ0 .这时制定的抽样
检验法 , 自然希望对 H0′: μ≥μ0 成立的钢筋 , 经检验尽可能通过
( 接受 H0′) .而且 μ越大 , 通过检验后接受的概率应越大越好 ; 反
之 , 对于 μ< μ0 的钢筋 , 经检验不让轻易通过 ( 即拒绝 H0′) 的概率
应越大越好 .这时用原假设 H0′: μ≥μ0 , 采用上述单侧拒绝域
W1′= ( - ∞ ,μ0 - uασ/ n) 就能达到这个目的 .这要比用双侧拒绝
域 W1 = ( - ∞ ,μ0 - uα/ 2 σ/ n) ∪ (μ0 + uα/ 2 σ
/ n, ∞ ) 的检验法更为
优良 , 即更为合理 .
请读者举出单侧假设检验的其他例子 .
对于检验 H0″: μ≤μ0 , H1″: μ> μ0 的情形的检验与上述类似 ,
从略 .读者可作为练习 , 讨论并给出检验 H0″的较为合理的检验
法 .对于这种单侧假设检验 H0″: μ≤μ0 , 在质量检验中也会遇到 .
例如 , 衡量大批量生产的电子元件的质量指标是每批元件的次品
率 p(0 ≤ p≤1 ) , 显而易见 , p 越小 , 质量越好 .这时可采用单侧假
设检验 H0″: p≤ p0 较为合适 .
对于 σ已知 , 对 μ的其他形式的假设检验问题可参照以上 3
种典型 , 给出适当的检验法 .
上述讨论的是当方差已知时 , 一个正态总体均值检验的方法 .
所采用的检验统计量均是 U－检验统计量 U = ( 珡
X - μ0 ) n/ σ.事实
上 , 采用 U－检验法还可应用于其他的参数估计 .
在方差已知的条件下两个正态总体均值差的检验　设两个总
2 2
体 X～ N(μ1 ,σ1 ) , Y ～ N (μ2 ,σ2 ) , ( X1 , … , Xm ) , ( Y1 , … , Y n ) 分别
2 2
是 X 与 Y 的样本 .在 σ1 ,σ2 已知条件下 , 讨论两个正态总体均值差
δ= μ1 - μ2 的检验 , 其中常见的假设 : ① H0 : δ= 0 , H1 : δ≠ 0;
② H0′: δ≥0 , H1′: δ< 0 ; ③ H0″: δ≤0 , H1″: δ> 0 .对这几种假设
的检验方法完全类似于上面讨论的方法 , 所不同的是 , 此时采用的
检验统计量可取为
X - 珚
U = (珡 Y - δ)/ (σ21/ m + σ22 / n) 1/ 2 ,
其中珡 Y 分别是 X , Y 的样本均值 .这里只要注意当 H0 : δ= 0
X ,珚
2
时 , U～ N( 0 , 1 ) 就足以明白 .
对总体非正态分布的大样本情况下均值的检验　这时亦可采
2
用 U－检验法 , 例如 , 总体 X～ F( x,θ) 为一般随机变量 , 若 D X = σ
已知 , E X =θ未知 , 要检验假设 H0 : θ= θ0 , H1 : θ≠θ0 , 在大样本
的情况下 , 可用 U n = (珡
X - θ0 ) n/ σ作为检验统计量 .这是因为 , 在
2
H0 成立时 , 由中心极限定理 , Un 依分布收敛于 N (0 , 1 ) , 即 H0 成
立时 , Un 的分布趋向于 U 的分布 ( 即标准正态分布 ) .故当 n 充分
大时 , 可用 U 作为 Un 的近似 .
2
注　上例中 , 若 D X = σ 未知 , 可将 Un 中的 σ换成 S , 即取
X - θ0 ) n/ S 作为检验统计量 , 可以证明 , 当 n 充分大时 , 有
U n = (珡
类似的结论 .
2
(2 ) 当方差 σ 未知时 , 均值的检验
设总体 X～ N(μ,σ2 ) , X1 , … , Xn 为其样本 , 珡
X , S2 分别为样本
2
均值与样本方差 .若 σ 未知 , 要对如同上面 (1 ) 中的 3 种假设进行
检验如下 :
① 检验 H0 : μ= μ0 , H1 : μ≠μ0 ;
由于 σ2 未知 , 故而此时的检验统计量选为 T ( n - 1 ) = ( 珡
X -
μ0 ) n/ S, 由本章第 1 节易知 , 当 H0 : μ= μ0 成立时 , T ( n - 1 ) =
X - μ0 ) n/ S～ t( n - 1 ) , 于是 , 当 | T ( n - 1 ) | 取得很小时 , 应接受
(珡
H0 ; 反之当 | T ( n - 1) | 取得很大时 , 应拒绝 H0 .若给定水平 α, 可
查 t 分布表分位数 tα/ 2 ( n - 1 ) , 使得 P{ | T( n - 1) | ≤ tα/ 2 ( n - 1 ) } =
10 .3 常用的参数检验　 373
1 - α, 故取
接受域　 W0 = (μ0 - tα/ 2 ( n - 1) S/ n,μ0 + tα/ 2 ( n - 1 ) S/ n) .
拒绝域　 W1 = ( - ∞ ,μ0 - tα/ 2 ( n - 1 ) S/ n) ∪ (μ0 + tα/ 2 ( n -
1) S/ n, + ∞) .
当 T ( n - 1 ) ∈ W0 时 , 接受 H0 , 否则拒绝之 .若检验统计量 φ在
H 0 成立时服从 t 分布 , 称为 t 检验 .
② H0′: μ≥μ0 , H1′: μ< μ0 ;
检验统计量同①取为 T = (珡
X - μ0 ) n/ S .显见 , 当 T ( n - 1 ) 取
充分大时 , 应接受 H0′, 否则拒绝 H0′.给定 α时 , 可取
Φ: W0′= (μ0 - tα ( n - 1) S/ n, + ∞ ) ,
W1′= ( - ∞ ,μ0 - tα ( n - 1) S/ n) ,
当 T ( n - 1) ∈ W0′时 , 接受 H0′, 否则拒绝之 .
③ H0″: μ≤μ0 , H1″: μ> μ0 .
请读者给出一个适当的检验法 .
不难看到 , 对于两个正态总体 X～ N (μ1 ,σ21 ) , Y ～ N (μ2 ,σ22 ) ,
X 与 Y 的样本为 ( X1 , … , X m ) 及 ( Y1 , … , Y n ) .若 σ21 ,σ22 未知 , 但
σ21 =σ22 时 , 要检验其均值差 δ= μ1 - μ2 是否为 0 , ≥ 0 , ≤ 0 三种情
况 , 均可应用 t 检验法 , 此时检验统计量可选为
1
nm 2
T = X - 珚
(珡 Y - δ)/ S ,
m+ n
m n
1
其中 S = ∑( X - 珡 ∑( Y - 珚
2 2
i X) + j Y )2 .
m+ n - 2 i= 1 j= 1
2 　正态总体方差的检验
(1 ) 一个正态总体方差的检验
设总体 X～ N(μ,σ2 ) , 其中 μ,σ2 未知 , 试由样本 X1 , … , X n 检
验以下问题 :
2 2 2 2
① H0 : σ = σ0 , H1 : σ ≠σ0 ;
2 2 2 2
② H0′: σ ≥σ0 , H1′: σ < σ0 ;
③ H0″: σ2 ≤σ20 , H1″: σ2 > σ20 .
def
2 2 2 2 2
对① H0 : σ =σ , 已知可取 S 作为σ 的估计,因而采取 K0 n- 1 =
( n - 1 ) S2/ σ20 作为检验 H0 的统计量 , 当 H0 : σ2 =σ20 成立时 , 易知
2 2
检验统计量 K n - 1 ～χ ( n - 1 ) , 对给定的水平 α( 0 < α< 1 ) , 查卡方
分布表定出下分位数 χ21 - α/ 2 ( n - 1 ) 与上分位数 χα2/ 2 ( n - 1 ) , 可定出
2 2
Φ: W0 = (χ1 - α/ 2 ( n - 1 ) ,χα/ 2 ( n - 1) ) ,
2 2
W1 = (0 ,χ1 - α/ 2 ( n - 1) ) ∪ (χα/ 2 ( n - 1) , + ∞ ) .
　　当 K2n - 1 ∈W0 时 , 接受 H0 ; 否则拒绝 H0 .
以上方法称为卡方检验法 .
2 2 2
对② H0′: σ ≥σ0 , Φ: W0′= (χ1 - α ( n - 1 ) , + ∞ ) , W1′= ( 0 ,
χ21 - α ( n - 1) ) .
2
当 K n - 1 ∈W0′时 , 接受 H0′; 否则拒绝 H0′.
对③请读者给出一个类似于②的合理的检验法 .
问题　某电工厂每天生产一批保险丝 , 保险丝质量要求之一 ,
2
是它的熔化时间 ( 单位 : 小时 ) 的方差 σ 越小越好 , 且规定它不超
2 2
过 400 .对此可提出假设 H0″: σ ≤ 400 , H1″: σ > 400 , 请读者给该
厂提出一个合理的检验方案 .
(2 ) 两个正态总体方差比的检验
2 2 2 2
设 X～ N(μ1 ,σ1 ) , Y～ N (μ2 ,σ2 ) , 若 μ1 ,σ1 ,μ2 ,σ2 均未知 .试
由 X 与 Y 的样本 ( X1 , … , X m ) 及 ( Y1 , … , Y n ) 检验以下问题 :
① H0 : σ2/ σ20 = 1 , H1 : σ2 / σ20 ≠1;
2 2 2 2
② H0′: σ / σ0 ≥1 , H1′: σ / σ0 < 1 .
对① H0 : σ2/ σ20 = 1 , 取检验统计量为 F = S21 σ22 / S22 σ21 , 则当 σ2 =
2
σ0 时 , F～ F( n - 1 , m - 1 ) .给定水平 α, 取 F1 - α/ 2 ( n - 1 , m - 1 ) 与
Fα/ 2 ( n - 1 , m - 1) 分别为下、上分位数 , 定出 Φ: W0 = ( F1 - α/ 2 ( n -
1 , m - 1 ) , Fα/ 2 ( n - 1 , m - 1 ) ) .当 F ∈ W0 时 , 接受 H0 , 否则拒
10 .4 总体分布的假设检验　 375
绝 H0 .
2 2
对② H0′: σ/ σ0 ≥ 1 , 检验统计量同上 .Φ: W0′= ( F1 - α ( n - 1 ,
m - 1) , + ∞ ) , W1′= ( 0 , F1 - α ( n - 1 , m - 1 ) ) .当 F∈ W0′时 , 接受
H0′, 否则拒绝 H0′.
3 　指数分布参数的检验
设总体 X～ Ex (λ) , 试用样本 X1 , … , X n 检验下列问题 :

(1 ) H0 : λ= λ0 , H1 : λ≠λ0 ;
(2 ) H0′: λ≥λ0 , H1′: λ< λ0 ;
(3 ) H0″: λ≤λ0 , H1″: λ> λ0 .
( 1) 检验 H0 : λ= λ0 , H1 : λ≠λ0 .注意到在参数估计中 , 样本
n
X 是 1/ λ的无偏估计, 且当 X ～ Ex(λ) 时, 2λ ∑ Xi = 2 nλ珚

均值珚 X～
i=1
2
χ ( 2 n) , 故取 K2 n = 2 nλ珡
X 作为检验统计量 .给定水平α, 查卡方分
2 2 2
布表 ,χ1 - α/ 2 ( 2 n) 与 χα/ 2 ( 2 n) , 定出检验法 Φ: W0 = (χ1 - α/ 2 ( 2 n) ,
2 2 2
χα/ 2 ( 2 n) ) , W1 = ( 0 ,χ1 - α/ 2 (2 n) ) ∪ (χα/ 2 ( 2 n) , + ∞ ) .当 K2 n ∈ W0
时 , 接受 H0 , 否则拒绝 H0 .
(2 ) 检验 H0′: λ≥λ0 , H1′: λ< λ0 .取检验统计量同上 , Φ:
W0 = (χ21 - α (2 n) , + ∞ ) , W1 = ( 0 ,χ21 - α ( 2 n) ) .当 K2 n ∈ W0 时 , 接受
H0 , 否则拒绝之 .
(3 ) 检验 H0″: λ≤λ0 , H1″: λ> λ0 .请读者自己给出一个检
验法 .
10 .4 　总体分布的假设检验
本节简要讨论总体分布的假设检验问题 .
怎么知道一个总体 X 的分布函数是某个给定的分布函数 F( x)
呢 ? 这是个在具体应用中经常要遇到的问题 , 因为许多工程技术、
经济管理中的问题所引出的随机变量 X , 往往不能根据概率论或
有关专业理论推出 X 的 ( 理论 ) 分布函数 .只能从得到大样本观测
值 ( X1 , … , X n ) = ( x1 , … , xn ) 的一大堆数据中 , 用统计推断的方法
初步找出统计规律 , 进而提出总体分布可能是什么样子的猜想或
假设 .然后 , 再利用样本观测值对提出的假设进行验证、修改、再验
证 , 以得到较为可靠、满足需要的分布函数 .
一般情形大致分为两步 .首先对取得的大样本数据作初步整
理 ( 包括求珚
x , s2 , 作直方图等 ) , 由此推断出总体可能服从的分布
函数 F( x) ( 或密度函数 f ( x) ) , 其次 , 利用本节介绍的常用非参数
检验法检验总体是否就是原假设的分布函数 F( x) .
1 　数据初步整理 , 分布的近似求法
设总体 X 是随机变量 , 怎样根据样本观测值 ( x1 , … , xn ) 近似

求出 X 的密度函数 ( 或分布函数 ) 呢 ? 通常可以通过对数据的初
步整理与分析 , 求出 X 的经验分布函数珟
F n ( x ) , 作为对 X 的理论
分布 F( x) 的一个近似 ( 估计 ) ; 亦可直接用图解法 , 例如画直方图
( 频率图 ) , 作为对密度函数的近似 ( 估计 ) .
数据初步整理与画直方图大致步骤如下 :
(1 ) 对样本值 x1 , … , xn 进行分组 :
① 找出 x1 , … , xn 的最小值与最大值 , 记为 x( 1 ) 与 x( 2 ) ;
② 取 a = x( 1 ) ( 或略小于 x( 1 ) ) , b = x( 2 ) ( 或略大于 x( 2 ) ) , 并等
分区间[ a, b] 为 m 个小区间 , 分点记为 a = t0 < t1 < … < tm = b, 其
中 ti + 1 - ti = ( b - a)/ m( 分组数 m 取多大无确切要求 .通常样本容
量 n 小时 , m 也应小些 , 但 m≥ 5 .n 很大时 , m 应取大些 , 例如当
n≥50 时 , 可取 10 ≤ m≤20 .) ;
③ 数出样本值落在区间 ( ti - 1 , ti ]上的个数, 记为 vi (1≤ i≤ m) .
(2 ) 计算样本点落在小区间上的频率 , 即 f i = vi/ n, 表样本值
落在区间 ( ti - 1 , ti ]上的频率 .由大数定律可知 , 当 n 足够大时

t
∫
i
p i = P( ti - 1 < X ≤ ti ) = f ( x) d x ≈ f ( t′
i ) ( ti - ti - 1 ) ,
t
i- 1
其中 ti - 1 ≤ t′
i ≤ ti .故 n 充分大时 , 可取 f ( t′
i ) ≈ pi/ ( ti - ti - 1 ) 作为
f ( x) 在区间 ( ti - 1 , ti ] 上的近似 .
(3 ) 画直方图 , 即在 x －y 坐标平面上 , 画一排小长方形 , 对于
区间 ( ti - 1 , ti ] , 画以 ( ti - 1 , ti ] 为底 , 以 yi = f i/ ( ti - ti - 1 ) ( 1≤ i≤ m)
为高的长方形 .如此作出的图叫作直方图 .从直方图的形状推测 X
的密度函数 f ( x) 可能是什么样子 .
n
(4 ) 记珟
F n ( x) = ∑I
i= 1
( X ≤ x)
i
/ n, ＂ x ∈ R , 称珟
Fn ( x ) 为 F( x ) 的
经验分布 , 或称为样本的累积频率 .由第 4 , 5 章可知 , E珟
Fn ( x ) =
P a .s .
F( x) , 且 n→
lim 珟n ( x) = F( x)( 事实上有更强的结果: n→
F lim 珟n ( x) =
F
∞ ∞
F( x ) ) . 因此珟
Fn ( x) 可作为 F( x ) 的估计量 ( 试验前 ) 和估计值 ( 试
验后 ) .
2 　总体分布的假设检验之一———拟合优度检验
本节讨论如何由总体 X 的样本观测值去检验它是否与某一
理论分布相符合 , 即总体分布函数的假设检验 , 即 H0 : P( X ≤ x)
= F( x ) .
设总体 X 的样本 X 1 , … , Xn 的观测值为 x 1 , … , xn , 按前数据
初步整理记号 , 取 a = mii n x i , b = max x i .把 ( a, b] 用分点 a = t0 <
i
t1 < … < t m = b 分 ( a, b]为 m 个小区间 , vi 表 X1 , … , X n 的观察值

落在 ( ti - 1 , ti ] ( 1≤ i≤ m) 上的个数 , 则 f i = vi/ n 表事件 ( ti - 1 < X≤
ti ) 在 n 次独立试验中出现的频率 .记 pi = P( ti - 1 < X≤ ti ) 表示事
件 ( ti - 1 < X≤ ti ) 的概率 .若 H0 成立时 , 则 pi = F( ti ) - F( ti - 1 ) 就是
2
事件 ( ti - 1 < X≤ ti ) 的概率 , 因此如果 H0 成立 , 那么 ( f i - pi ) =
2
( vi/ n - p i ) 理应比较小 .于是
m 2 m m
vi n ( vi - np i ) 2 1 v2i
∑ ∑ n∑
2
K m- 1 = - pi ・ = = - n.
i=1 n pi i=1 np i i=1 pi
( 4 .1)
当 H0 成立时 , 也应该取值较小才符合原假设 H0 .换言之 , 如上
式右边每项差异越小 , 则原假设 H0 越是可信 , 也就更加愿意去
接受它 ( 式中的因子 p i/ n 在一定程度上起到平衡的作用 ) .基于
上述直观分析 , 我们可以考虑用上式统计量 K2m - 1 取值的大小作
为拒绝或接受 H0 的推断依据 , 这个统计量 K2m - 1 称为皮尔逊的
拟合优度检验统计量 .这是因为皮尔逊在 1900 年证明了以下重
要定理 .
定理 4 .1 　若原假设 H0 ( X 以 F ( x ) 为分布函数 ) 成立 , 则当
2 2
样本容量 n→ ∞时 , K m - 1 的分布趋向于自由度为 ( m - 1 ) 的 χ 分
2
布,即 χ( m - 1) .
2
这样 , 当样本容量 n 很大时 , 可以用 K m - 1 作为检验 H0 的检验
2
统计量 .下面给出 χ 检验法的基本步骤 :
(1 ) 原假设 H0 : X 以 F( x ) 为分布函数 ;
m 2 m 2
( vi - np i ) 1 vi
∑ = ∑
2
(2 ) 检验统计量为 K m- 1 = - n;
i=1 np i n i= 1 pi
2 2 2
(3 ) 给定 α, 查表 χ ( m - 1 ) , 使得 P( K m - 1 > χα ( m - 1 ) ) = α,
α
定出拒绝域 W1 = (χα2 ( m - 1) , + ∞ ) , 接受域 W0 = ( 0 ,χα2 ( m - 1) ) ;

(4 ) 计算 K2m - 1 值 , 当 K2m - 1 ≥χα2 ( m - 1 ) 时 , 拒绝 H0 ; 当 K2m - 1 <
2
χα ( m - 1 ) 时 , 接受 H0 .
例 4 .1 ( 本例是遗传学上有名的例子 ) 　遗传学家孟德尔
( Mendel ) 根据对豌豆的大量观测发现豌豆的两对特性———圆与
皱 , 黄与绿所出现的 4 种组合记录 , 其频率如下 ( n = 556 ) :
组合 1 圆黄 2 皱黄 3 圆绿 4 皱绿
vi 315 101 108 32
pi 9/ 16 3/ 16 3/ 16 1/ 16
另一方面 , 根据他的遗传学理论 , 孟德尔认为豌豆的上述 4 种组合

的理论推导上的概率为 p1 = 9/ 16 , p2 = p3 = 3/ 16 , p4 = 1/ 16 .现
用统计量来检验孟德尔的理论与实测数据的拟合优度 .由 ( 4． 1) 式
K2m - 1 = 16 (3152/ 9 + 1012 / 3 + 1082 / 3 + 322 ) - 556 = 0 .47 .

556
2 2 2
若给定 α= 0． 05 , 查表 χ0 .05 ( 3 ) = 7． 8 , 而 K m - 1 = 0． 47 < χ0 .05 ( 3 ) =
7． 8 , 故接受 H0 .可知孟德尔的理论分布与实际数据拟合的好 .
3 　总体分布的假设检验之二———柯尔莫哥洛夫检验
我们在前面介绍了一个总体的经验分布以概率收敛到其理论
分布 .但事实上 , 还有更强的结果 .只要注意到对固定的 x ∈ R ,
n
F( x ) 是表示事件 ( X≤ x) 的概率 , 而珟
Fn ( x ) = i∑ I( X i ≤ x) / n ( ＂ x ∈
=1
R ) 可看作是 n 次独立重复试验中出现事件 ( X≤ x ) 的频率 ( 注意

X1 , … , Xn 独立与 X 同分布 ) .故由伯努利强大数定律 , ＂ x∈R 固
定,有
P{ n→
lim 珟
Fn ( x ) = F( x) } = 1 , ( 4 .2)
∞
a .s .
即珟
F n ( x) 以概率 1 收敛到 F( x) (珟
Fn ( x ) F( x ) ) .
然而上述结果是针对每一个固定的 x∈R 而言的 , 因而它的
收敛性是局部性态 .下面介绍格里文科 ( W .Glivenko) 在 1953 年
证明的一个重要定理 .
定理 4 .2 ( 格里文科定理 ) 　设样本 X1 , … , Xn 独立同分
布～ F( x ) ,珟
Fn ( x) 为其经验分布函数 , 则
P{lim sup | 珟
Fn ( x) - F( x) | = 0} = 1 , ( 4 .3)
n→ ∞ x∈ R
即当 n→∞时 , 经验分布珟
Fn ( x ) 关于 x 均匀地以概率 1 收敛到理
论分布 F( x) .
以下介绍柯尔莫哥洛夫检验 .
上面介绍利用分布检验总体分布 , 需将数据进行分组 , 而分组
具有很大的随意性 , 一方面导致样本信息的无法充分利用 .另一方
面 , 所拟合的优度实际上是分组导出的分布 , 而不是拟合所假设的
分布 .这里给出柯尔莫哥洛夫检验法是利用基于经验分布函数的
检验统计量 .其基本依据是 : 由上面的格里文科定理 , n→∞ 时 , 经
验分布珟
F n ( x) 以概率 1 一致收敛到总体理论分布 F( x) .故可定义
珟
Fn ( x) 到 F 的“距离”为
Dn (珟
Fn ( x ) , F) = sup |珟
Fn ( x ) - F( x ) | . ( 4 .4)
x∈R
　　现设 X～ F( x) , X1 , … , X n 为其样本 ,珟
Fn ( x ) 为其经验分布函
数 .要检验原假设 H0 : 总体 X 的分布 F ( x) = F0 ( x) , 其中 F0 ( x)
为某一已知分布函数 .由 ( 4． 3 ) 式知 , 当 H0 成立 , n → ∞ 时 ,
Fn ( x) , F) 以概率 1 收敛到 0 , 故而 Dn (珟
Dn (珟 Fn ( x ) , F) 的大小可以
显示珟
F n ( x) 对总体 F( x ) 的拟合程度 . Dn 越大 , 反映拟合越差 ; 反
之 , Dn 越小 , 反映拟合越好 .因此 , 可以用 Dn 作为检验 H0 的检验
统计量 .为此还需要导出当 H0 成立时 , Dn 的极限分布 .因 n→ ∞
时 , Dn 以概率 1 收敛到 0 .故考虑极限性态时 , 需把 Dn 适当放大 n
倍 , 从而考虑 nD n 的极限分布 .柯氏在 20 世纪 30 年代证明了以
下著名定理 .
定理 4 .3 　设总体分布 F( x ) = F0 ( x ) 为连续函数 , 记 Dn =
F n , F0 ) , ＂ d > 0 , 则有
Dn (珟
+∞
∑ (-
k 2 2
lim P{ nD n < d} = 1 ) exp( - 2 k d ) . ( 4 .5)
n→ ∞
k= - ∞
　　证明已超出本书范围 , 从略 .
利用上述结果可以用检验水平为 α 的检验 . 取 d, 使
练习题　 381
li m P{ nD n > d} = α, 列表如下 :
n→ ∞
nDn 的临界值 ( nlim P{ nD n > d} = α)

→∞
α 0． 9 0． 75 0． 50 0． 25 0． 10 0． 05 0． 01
d 0． 575 0． 678 0． 830 1． 02 1． 23 1． 36 1． 63
Dn 的计算如下 : 设样本观测值的顺序统计量为 x1 , n ≤ x2 , n ≤ … ≤
xn , n , 计算
k - 1 k
dk1 = F0 ( xk, n ) - , 　 dk2 = F0 ( xk, n ) - ,
n n
k = 1 , … , n, 　　 Dn = m ax{ dk1 , dk2 , k = 1 , … , n} .
当 nD n > d 时 , 拒绝 H0 ; 否则接受 H0 .
在各种分布函数检验中 , 柯尔莫哥洛夫检验的灵敏度高 , 与分
组无关 , 效果比较好 .但此法只能在 F( x) 为连续函数下可用 .
有兴趣的读者可参见[8 , 12] .
练　习　题
2 2
10 .1 　由经验知某零件重量 X～ N(μ,σ ) ,μ= 15 , σ = 0． 05 .
技术革新后 , 抽了 6 个样品 , 测得重量为 ( 单位 : 克 ) : 14． 7 , 15． 1 ,
14． 8 , 15． 0 , 15． 2 , 14． 6 .已知方差不变 , 问平均重量是否仍为
15 ? (α= 0． 05)
10 .2 　糖厂用自动打包机打包 , 每包标准重量为 100 斤 .每天
开工后需要检验一次打包机工作是否正常 , 即检查打包机是否有
系统偏差 .某日开工后测得几包重量为 ( 单位 : 斤 ) 如下 :
99． 3 , 98． 7 , 100． 5 , 101． 2 , 98． 3 , 99． 7 , 99． 5 , 102． 1 , 100． 5 .
问 : 该日打包机工作是否正常 ? (α= 0． 05 , 已知包重服从正态
分布 .)
10 .3 　正常人的脉搏平均为 72 次/ 分 , 现某医生测得 10 例慢
性四乙基铅中毒患者的脉搏 ( 次/ 分 ) 如下 :
54 , 　 67 , 　 68 , 　 78 , 　 70 , 　 66 , 　 67 , 　 70 , 　 65 , 　 69 .
问 : 四乙基铅中毒患者和正常人的脉搏有无显著性差异 ( 已知四
乙基铅中毒患者的脉搏服从正态分布 ) .
10 .4 　用热敏电阻测温仪间接测量地热勘探井底温度 , 重复
测量 7 次 , 测得温度 ( ℃ ) : 112． 0 , 113． 4 , 111． 2 , 112． 0 , 114． 5 ,
112． 9 , 113． 6 , 而用某精确办法测得温度为 112． 6 ( 可看作温度真
值 ) , 试问用热敏电阻测温仪间接测温有无系统偏差 ? (α= 0． 05 .)
10 .5 　某种导线 , 要求其电阻的标准差不得超过 0． 005 (Ω) .
今在生产的一批导线中抽取样品 9 根 , 测得 S = 0． 007 (Ω) , 设总体
为正态分布 .问在水平 α= 0． 05 下能认为这批导线的标准差显著
地偏大吗 ?
10 .6 　机床厂某日从两台机器所加工的同一零件中 , 分别抽
若干个样测量零件尺寸 , 得 : 第一台机器的为 6． 2 , 5． 7 , 6． 5 ,
6． 0 , 6． 3 , 5． 8 , 5． 7 , 6． 0 , 6． 0 , 5． 8 , 6． 0; 第二台机器的为 5． 6 ,
5． 9 , 5． 6 , 5． 7 , 5． 8 , 6． 0 , 5． 5 , 5． 7 , 5． 5 .问 : 这两台机器的加工
精度是否有显著性差异 ? (α= 0． 05 .)
10 .7 　某工厂采用新法处理废水 , 对处理后的水测量所含某
种有毒物质的浓度 , 得到 10 个数据 ( 单位 : 毫克/ 升 ) :
22 , 　 14 , 　 17 , 　 13 , 　 21 , 　 16 , 　 15 , 　 16 , 　 19 , 　 18 ,
而以往用老法处理废水后 , 该种有毒物质的平均浓度为 19 .
问 : 新法是否比老法效果好 ? ( 检验水平 α= 0． 05 .)
10 .8 　从正态母体 N ( μ, 1 ) 中取 100 个样品 , 计算得
珚
x = 10． 32 .
(1 ) 试检验 H0 : μ= 10 是否成立 (α= 0． 01 ) ?
(2 ) 计算上述检验在 μ= 9． 8 时犯第二类错误的概率 .
10 .9 　某电器零件的平均电阻一直保持在 2． 64Ω .改变加工
练习题　 383
工艺后 , 测得 100 个零件的平均电阻为 2． 62Ω, 电阻标准差 ( S) 为

0． 06Ω, 问新工艺对此零件的电阻有无显著影响 (α= 0． 01 ) ?
10 .10 　某产品的次品率为 0． 17 .现对此产品进行新工艺试
验 , 从中抽取 400 件检验 , 发现有次品 56 件 .能否认为这项新工艺
显著的影响产品的质量 (α= 0． 05) ?
10 .11 　某切割机正常工作时 , 切割每段金属棒的平均长度为
10． 5cm .仅在某段时间内随机地抽取 15 段进行测量 , 其结果如
下 ( c m) : 10． 4 , 10． 6 , 10． 1 , 10． 4 , 10． 5 , 10． 3 , 10． 2 , 10． 9 , 10． 6 ,
10． 8 , 10． 5 , 10． 7 , 10． 2 , 10． 7 .问该段时间内该机工作是否正常
(α= 5 % ) ? 假定金属棒长度服从正态分布 .
10 .12 　从某种试验物中取出 24 个样品 , 测量其发热量 , 计算
x = 11958 , 子样标准差 S ＊ = 323 , 问以 5 % 的显著水平是否可认
得珚
为发热量的期望值是 12100( 假定发热量服从正态分布 ) ?
10 .13 　有一种新安眠药 , 据说在一定剂量下 , 能比某种旧安
眠药平均增加睡眠时间 3 小时 .根据资料用旧安眠药睡眠时间平
均为 20． 8 小时 , 标准差为 1． 6 小时 .为了检验这个说法是否正确 ,
收集到一组使用新安眠药的睡眠时间为
26． 7 , 　 22． 0 , 　 24． 1 , 　 21． 0 , 　 27． 2 , 　 25． 0 , 　 23． 4 .
试问 : 从这组数据能否说明新安眠药已达到新的疗效 ( 假定睡眠时
间服从正态分布 , 取 α= 0． 05) .
10 .14 　为了比较两种枪弹的速度 ( 单位 : 米/ 秒 ) , 在相同条件
下进行速度测定 .算得子样平均数和子样标准差
枪弹甲　 n1 = 110 ,珚
x1 = 2805 , S1 = 120 .41 ,
枪弹乙　 n2 = 100 ,珚
x2 = 2680 , S2 = 105 .00 ,
在显著水平 α= 0． 05 下 , 这两种枪弹的 ( 平均 ) 速度有无显著差异 ?
10 .15 　有甲、乙两台机床加工同样产品 , 从这两台机床加工
的产品中随意地抽取若干件 , 测得产品直径 ( 单位 : mm) 为 :
机床甲　 20． 5 , 19． 8 , 19． 7 , 20． 4 , 20． 1 , 10． 0 , 19． 0 , 19． 9

机床乙　 19． 7 , 20． 8 , 20． 5 , 19． 8 , 19． 4 , 20． 6 , 19． 2 , 19． 6
试比较甲、乙两台机床加工产品直径有无显著差异 (α= 5 % ) ? 假
定两台机床加工产品的直径都服从正态分布 , 且母体方差相等 .
10 .16 　在两个工厂生产的蓄电池中 , 分别取 10 个测量蓄电
池的电容量 ( 单位 : 安培小时 ) , 数据如下 :
A 厂　 146 , 141 , 135 , 142 , 140 , 143 , 138 , 137 , 142 , 137 ,
B 厂　 141 , 143 , 139 , 139 , 140 , 141 , 138 , 140 , 142 , 138 .
(1 ) 试检验两厂蓄电池的性能有无显著差异 (α= 5 % ) ?
(2 ) 说明检验要作哪些假定 .
10 .17 　用大子样 ( n > 45 ) 检验在正态母体上作的假设 H0 :
2 2
σ =σ0 .试证下面检验方法成立 : 依据一次抽样后的子样值算得
2 s2
χ = ( n - 1 ) 2 的数值 ; 若
σ
χ2 ≥ ( n - 1) + 2 ( n - 1) uα/ 2 　　或
χ2 ≤ ( n - 1 ) - 2( n - 1 ) uα/ 2 ,
则拒绝 H0 ; 若
2
( n - 1) - 2( n - 1 ) uα/ 2 < χ < ( n - 1) + 2 ( n - 1 ) uα/ 2 ,
则接受 H0 .
10 .18 　测的两批电子器材的电阻的子样值为 :
A 批 x ( 欧姆 ) : 　 0． 140 , 0． 138 , 0． 143 , 0． 142 , 0． 144 , 0． 137 ,
B 批 y ( 欧姆 ) : 　 0． 135 , 0． 140 , 0． 142 , 0． 136 , 0． 138 , 0． 140 .
设这两批器材的电阻分别服从分布 N (μ1 ,σ21 ) 与 N (μ2 ,σ22 ) .
2 2
(1 ) 检验假设 H0 : σ1 =σ2 ,α= 5 % ;
(2 ) 检验假设 H0 : μ1 = μ2 ,α= 5 % .
10 .19 　设总体 X ～ N (μ, σ2 ) , 其中 σ2 已知常数 , μ 未知 ,
X1 , … , Xn 为其样本 .假设 H0 : μ= μ0 , H1 : μ= μ0 + δ(μ0 ,δ> 0 为
已知常数 ) , 给定水平 α= 0． 05 .
练习题　 385
(1 ) 给出适当的检验 ;
(2 ) 求检验在 H1 的功效函数及犯第二类错误的概率 ;
(3 ) σ= 1 ,δ= 1 , 问 n 应取多大 , 才能保证第二类错误的概率
不超过 0． 10 .
10 .20 　设总体 X ～ N ( μ, σ2 ) , 其中 μ, σ2 均为未知参数 ,
X1 , … , Xn 是 X 的样本 , 水平 α= 0． 05 .
(1 ) 若 H0 : μ= μ0 , H1 : μ= μ0 - δ, 其中 δ> 0 已知 , 试给出适
当的检验 ;
(2 ) 设 δ= 1 , S = 2 , 求检验在 H1 的功效函数及犯第二类错误
的概率 .
10 .21 　设总体 X ～ N (μ,σ2 ) , 其中 σ2 已知 , μ为未知参数 ,
X1 , … , Xn 为其样本 .给定水平 α, 任取 αi > 0( i = 1 , 2 ) ,α1 + α2 = α,
记 uαi 分别为αi 的分位数 , 即 P{ u > uαi } = αi ( i = 1 , 2 ) , 易知
P{ - uα1 ≤ (珡
X - μ) n/ σ≤ uα2 } = 1 - α. (＊ )
试证明在满足 ( ＊ ) 式的所有置信度为 ( 1 - α) 的置信区间 ( - uα1 ,
uα2 ) 中 , 当取 α1 =α2 = α
/ 2 时 , 其置信区间长度最小 .
10 .22 　某车床生产一大批滚珠 , 随机的抽取 100 个产品 , 测
其直径为 ( 单位 : mm) :
{23 .9023 , 24 .3544 , 23 .9233 , 24 .0445 , 23 .4364 ,
23 .9464 , 25 .1536 , 23 .758 , 24 .0031 , 23 .8884 , 24 .0987 ,
23 .0127 , 24 .5685 , 23 .5493 , 23 .757 , 22 .7177 , 23 .8448 ,
22 .6404 , 24 .3034 , 24 .1123 , 23 .9506 , 23 .6562 ,
24 .1476 , 23 .4952 , 22 .7377 , 24 .5511 , 23 .6283 , 24 .3536 ,
24 .5179 , 23 .7127 , 23 .5198 , 24 .2968 , 24 .291 , 24 .4918 ,
23 .5824 , 23 .4544 , 23 .8727 , 24 .9305 , 24 .6421 , 23 .6771 ,
23 .0525 , 23 .7584 , 24 .3758 , 23 .5969 , 24 .2726 , 23 .3415 ,
24 .111 , 24 .0558 , 23 .4708 , 24 .5098 , 23 .7647 , 23 .3443 ,
23 .7184 , 24 .075 , 23 .9409 , 24 .2786 , 23 .7967 , 24 .7233 ,
23 .5952 , 23 .5276 , 24 .9612 , 24 .1335 , 23 .7452 , 22 .9702 ,

22 .3605 , 24 .1839 , 24 .2938 , 23 .5494 , 23 .7727 , 23 .588 ,
24 .0573 , 23 .4904 , 23 .7993 , 24 .7465 , 24 .7903 , 24 .3881 ,
24 .3117 , 23 .4593 , 24 .1746 , 23 .3089 , 23 .0311 , 23 .7536 ,
24 .1319 , 24 .1867 , 23 .9091 , 23 .9899 , 23 .6849 , 24 .1231 ,
24 .1003 , 24 .0227 , 23 .3076 , 23 .505 , 23 .5098 , 24 .5512 ,
24 .2285 , 23 .5902 , 25 .1617 , 24 .5817 , 24 .0338 , 23 .3527 } .
(1 ) 用第 4 节中的数据整理办法对数据进行整理 , 并画出直
方图 .
(2 ) 试猜想它服从什么分布 ? 并用拟合优度检验法进行检验
你的猜想 , 同时求出该分布的均值 , 方差 .
附录 1 　标准正态分布表
z
1 - u 2/ 2
Φ( z) = ∫ - ∞
2π
e du
= P( Z ≤ z)
z 0 1 2 3 4 5 6 7 8 9
0 .0 0 .5000 0 .5040 0 .5 080 0 .5120 0 .5160 0 .5199 0 .5239 0 .5279 0 .5319 0 .5359
0 .1 0 .5398 0 .5438 0 .5 478 0 .5517 0 .5557 0 .5596 0 .5636 0 .5675 0 .5714 0 .5753
0 .2 0 .5793 0 .5832 0 .5 871 0 .5910 0 .5948 0 .5987 0 .6026 0 .6064 0 .6103 0 .6141
0 .3 0 .6179 0 .6217 0 .6 255 0 .6293 0 .6331 0 .6368 0 .6406 0 .6443 0 .6480 0 .6517
0 .4 0 .6554 0 .6591 0 .6 628 0 .6664 0 .6700 0 .6736 0 .6772 0 .6808 0 .6844 0 .6879
0 .5 0 .6915 0 .6950 0 .6 985 0 .7019 0 .7054 0 .7088 0 .7123 0 .7157 0 .7190 0 .7224
0 .6 0 .7257 0 .7291 0 .7 324 0 .7357 0 .7389 0 .7422 0 .7454 0 .7486 0 .7517 0 .7549
0 .7 0 .7580 0 .7611 0 .7 642 0 .7673 0 .7703 0 .7734 0 .7764 0 .7794 0 .7823 0 .7852
0 .8 0 .7881 0 .7910 0 .7 939 0 .7967 0 .7995 0 .8023 0 .8051 0 .8078 0 .8106 0 .8133
0 .9 0 .8159 0 .8186 0 .8 212 0 .8238 0 .8264 0 .8289 0 .8315 0 .8340 0 .8365 0 .8389
1 .0 0 .8413 0 .8438 0 .8 461 0 .8485 0 .8508 0 .8531 0 .8554 0 .8577 0 .8599 0 .8621
1 .1 0 .8643 0 .8665 0 .8 686 0 .8708 0 .8729 0 .8749 0 .8770 0 .8790 0 .8810 0 .8830
1 .2 0 .8849 0 .8869 0 .8 888 0 .8907 0 .8925 0 .8944 0 .8962 0 .8980 0 .8997 0 .9015
1 .3 0 .9032 0 .9049 0 .9 066 0 .9082 0 .9099 0 .9115 0 .9131 0 .9147 0 .9162 0 .9177
1 .4 0 .9192 0 .9207 0 .9 222 0 .9236 0 .9251 0 .9265 0 .9278 0 .9292 0 .9306 0 .9319
1 .5 0 .9332 0 .9345 0 .9 357 0 .9370 0 .9382 0 .9394 0 .9406 0 .9418 0 .9430 0 .9441
1 .6 0 .9452 0 .9463 0 .9 474 0 .9484 0 .9495 0 .9505 0 .9515 0 .9525 0 .9535 0 .9545
388 　附录 1 标准正态分布表
续表
z 0 1 2 3 4 5 6 7 8 9
1 .7 0 .9554 0 .9564 0 .9 573 0 .9582 0 .9591 0 .9599 0 .9608 0 .9616 0 .9625 0 .9633
1 .8 0 .9641 0 .9648 0 .9 656 0 .9664 0 .9671 0 .9678 0 .9686 0 .9693 0 .9700 0 .9706
1 .9 0 .9713 0 .9719 0 .9 726 0 .9732 0 .9738 0 .9744 0 .9750 0 .9756 0 .9762 0 .9767
2 .0 0 .9772 0 .9778 0 .9 783 0 .9788 0 .9793 0 .9798 0 .9803 0 .9808 0 .9812 0 .9817
2 .1 0 .9821 0 .9826 0 .9 830 0 .9834 0 .9838 0 .9842 0 .9846 0 .9850 0 .9854 0 .9857
2 .2 0 .9861 0 .9864 0 .9 868 0 .9871 0 .9874 0 .9878 0 .9881 0 .9884 0 .9887 0 .9890
2 .3 0 .9893 0 .9896 0 .9 898 0 .9901 0 .9904 0 .9906 0 .9909 0 .9911 0 .9913 0 .9916
2 .4 0 .9918 0 .9920 0 .9 922 0 .9925 0 .9927 0 .9929 0 .9931 0 .9932 0 .9934 0 .9936
2 .5 0 .9938 0 .9940 0 .9 941 0 .9943 0 .9945 0 .9946 0 .9948 0 .9949 0 .9951 0 .9952
2 .6 0 .9953 0 .9955 0 .9 956 0 .9957 0 .9959 0 .9960 0 .9961 0 .9962 0 .9963 0 .9964
2 .7 0 .9965 0 .9966 0 .9 967 0 .9968 0 .9969 0 .9970 0 .9971 0 .9972 0 .9973 0 .9974
2 .8 0 .9974 0 .9975 0 .9 976 0 .9977 0 .9977 0 .9978 0 .9979 0 .9979 0 .9980 0 .9981
2 .9 0 .9981 0 .9982 0 .9 982 0 .9983 0 .9984 0 .9984 0 .9985 0 .9985 0 .9986 0 .9986
3 .0 0 .9987 0 .9990 0 .9 993 0 .9995 0 .9997 0 .9698 0 .9998 0 .9999 0 .9999 1 .0000
　　注 : 表中末行系函数值 Φ( 3 .0 ) , Φ( 3 .1) , … , Φ( 3 .9 )
附录 2 　泊松分布表
r= ∞
e - λλr
1 - F( x - 1 ) = ∑
r= x r!
x λ= 0 .2 λ= 0 .3 λ= 0 .4 λ= 0 .5 λ= 0 .6
0 1 .0000000 1 .0000000 1 .0000000 1 .0000000 1 .0000000
1 0 .1812692 0 .2591818 0 .3296800 0 .323469 0 .451188
2 0 .0175231 0 .0369363 0 .0615519 0 .090204 0 .121901
3 0 .0011485 0 .0035995 0 .0079263 0 .014388 0 .023115
4 0 .0000568 0 .0002658 0 .0007763 0 .001752 0 .003358
5 0 .0000023 0 .0000158 0 .0000612 0 .000172 0 .000394

6 0 .0000001 0 .0000008 0 .0000040 0 .000014 0 .000039
7 0 .0000002 0 .000001 0 .000003
x λ= 0 .7 λ= 0 .8 λ= 0 .9 λ= 1 .0 λ= 1 .2
0 1 .0000000 1 .0000000 1 .0000000 1 .0000000 1 .0000000
1 0 .503415 0 .550671 0 .593430 0 .632121 0 .698806
2 0 .155805 0 .191208 0 .227518 0 .264241 0 .337373
3 0 .034142 0 .047423 0 .062857 0 .080301 0 .120513
4 0 .005753 0 .009080 0 .013459 0 .018988 0 .033769
5 0 .000786 0 .001411 0 .002344 0 .003660 0 .007746

6 0 .000090 0 .000184 0 .000343 0 .000594 0 .001500
7 0 .000009 0 .000021 0 .000043 0 .000083 0 .000251
8 0 .000001 0 .000002 0 .000005 0 .000010 0 .000037
9 0 .000001 0 .000005
10 0 .000001
390 　附录 2 泊松分布表
续表
r= ∞
e - λλr
1 - F( x - 1 ) = ∑r= x r!
x λ= 1 .4 λ= 1 .6 λ= 1 .8
0 1 .000000 1 .000000 1 .000000
1 0 .753403 0 .798103 0 .834701
2 0 .408167 0 .475069 0 .537163
3 0 .166502 0 .216642 0 .269379
4 0 .053725 0 .078813 0 .108708
5 0 .014253 0 .023682 0 .036407

6 0 .003201 0 .006040 0 .010378
7 0 .000622 0 .001336 0 .002569
8 0 .000107 0 .000260 0 .000562
9 0 .000016 0 .000045 0 .000110
10 0 .000002 0 .000007 0 .000019

11 0 .000001 0 .000003
x λ= 2 .5 λ= 3 .0 λ= 3 .5 λ= 4 .0 λ= 4 .5 λ= 5 .0
0 1 .000000 1 .000000 1 .000000 1 .000000 1 .000000 1 .000000
1 0 .917915 0 .950213 0 .969803 0 .981684 0 .988891 0 .993262
2 0 .712703 0 .800852 0 .864112 0 .908422 0 .938901 0 .959572
3 0 .456187 0 .576810 0 .679153 0 .761897 0 .826422 0 .875348
4 0 .242424 0 .352768 0 .463367 0 .566530 0 .657704 0 .734974
5 0 .108822 0 .184737 0 .274555 0 .371163 0 .467896 0 .559507

6 0 .042021 0 .083918 0 .142386 0 .214870 0 .297070 0 .384039
7 0 .014187 0 .033509 0 .065288 0 .110674 0 .168949 0 .237817
8 0 .004247 0 .011905 0 .026739 0 .051134 0 .086586 0 .133372
9 0 .001140 0 .003803 0 .009874 0 .021363 0 .040257 0 .068094
附录 2 泊松分布表　 391
续表
r= ∞
e - λλr
1 - F( x - 1 ) = ∑r= x r!
x λ= 2 .5 λ= 3 .0 λ= 3 .5 λ= 4 .0 λ= 4 .5 λ= 5 .0
10 0 .000277 0 .001102 0 .003315 0 .008132 0 .017093 0 .031828
11 0 .000062 0 .000292 0 .001019 0 .002840 0 .006669 0 .013695
12 0 .000013 0 .000071 0 .000289 0 .000915 0 .002404 0 .005453
13 0 .000002 0 .000016 0 .000076 0 .000274 0 .000805 0 .002019
14 0 .000003 0 .000019 0 .000076 0 .000252 0 .000698
15 0 .000001 0 .000004 0 .000020 0 .000074 0 .000226

16 0 .000001 0 .000005 0 .000020 0 .000069
17 0 .000001 0 .000005 0 .000020
18 0 .000001 0 .000005
19 0 .000001
附录 3 　 t 分布表
P{ t( n) > tα ( n) } = α
n\α 0 .25 0 .10 0 .05 0 .025 0 .01 0 .005

1 1 .0000 3 .0777 6 .3138 12 .7062 31 .8207 63 .6574
2 0 .8165 1 .8856 2 .9200 4 .3027 6 .9646 9 .9248
3 0 .7649 1 .6377 2 .3534 3 .1824 4 .5407 5 .8409
4 0 .7407 1 .5332 2 .1318 2 .7764 3 .7469 4 .6041
5 0 .7267 1 .4759 2 .0150 2 .5706 3 .3349 4 .0322
6 0 .7176 1 .4398 1 .9432 2 .4469 3 .1427 3 .7074
7 0 .7111 1 .4149 1 .8946 2 .3646 2 .9980 3 .4995
8 0 .7064 1 .3968 1 .8595 2 .3060 2 .8965 3 .3554
9 0 .7027 1 .3830 1 .8331 2 .2622 2 .8214 3 .2498
10 0 .6998 1 .3722 1 .8125 2 .2281 2 .7638 3 .1693
11 0 .6974 1 .3634 1 .7959 2 .2010 2 .7181 3 .1058
12 0 .6955 1 .3562 1 .7823 2 .1788 2 .6810 3 .0545
13 0 .6938 1 .3502 1 .7709 2 .1604 2 .6503 3 .0123
14 0 .6924 1 .3450 1 .7613 2 .1448 2 .6245 2 .9768
15 0 .6912 1 .3406 1 .7531 2 .1315 2 .6025 2 .9467
16 0 .6901 1 .3368 1 .7459 2 .1199 2 .5835 2 .9208
17 0 .6892 1 .3334 1 .7396 2 .1098 2 .5669 2 .8982
18 0 .6884 1 .3304 1 .7341 2 .1009 2 .5524 2 .8784
附录 3 t 分布表　 393
续表
n\α 0 .25 0 .10 0 .05 0 .025 0 .01 0 .005

19 0 .6876 1 .3277 1 .7291 2 .0930 2 .5395 2 .8609
20 0 .6870 1 .3253 1 .7247 2 .0860 2 .5280 2 .8453
21 0 .6864 1 .3232 1 .7207 2 .0796 2 .5177 2 .8314
22 0 .6858 1 .3212 1 .7171 2 .0739 2 .5083 2 .8188
23 0 .6853 1 .3195 1 .7139 2 .0687 2 .4999 2 .8073
24 0 .6848 1 .3178 1 .7109 2 .0639 2 .4922 2 .7969
25 0 .6844 1 .3163 1 .7081 2 .0595 2 .4851 2 .7874
26 0 .6840 1 .3150 1 .7056 2 .0555 2 .4786 2 .7787
27 0 .6837 1 .3137 1 .7033 2 .0518 2 .4727 2 .7707
28 0 .6834 1 .3125 1 .7011 2 .0484 2 .4671 2 .7633
29 0 .6830 1 .3114 1 .6991 2 .0452 2 .4620 2 .7564
30 0 .6828 1 .3104 1 .6973 2 .0423 2 .4573 2 .7500
31 0 .6825 1 .3095 1 .6955 2 .0395 2 .4528 2 .7440
32 0 .6822 1 .3086 1 .6939 2 .0369 2 .4487 2 .7385
33 0 .6820 1 .3077 1 .6924 2 .0345 2 .4448 2 .7333
34 0 .6818 1 .3070 1 .6909 2 .0322 2 .4411 2 .7284
35 0 .6816 1 .3062 1 .6896 2 .0301 2 .4377 2 .7238
36 0 .6814 1 .3055 1 .6883 2 .0281 2 .4345 2 .7195
37 0 .6812 1 .3049 1 .6871 2 .0262 2 .4314 2 .7154
38 0 .6810 1 .3042 1 .6860 2 .0244 2 .4286 2 .7116
39 0 .6808 1 .3036 1 .6849 2 .0227 2 .4258 2 .7079
40 0 .6807 1 .3031 1 .6839 2 .0211 2 .4233 2 .7045
41 0 .6805 1 .3025 1 .6829 2 .0195 2 .4208 2 .7012
42 0 .6804 1 .3020 1 .6820 2 .0181 2 .4185 2 .6981
43 0 .6802 1 .3016 1 .6811 2 .0167 2 .4163 2 .6951
44 0 .6801 1 .3011 1 .6802 2 .0154 2 .4141 2 .6923
45 0 .6800 1 .3006 1 .6794 2 .014 2 .6886
2
附录 4 　 χ 分布表
P{χ2 ( n) > χα2 ( n) } = α
n\α 0 .995 0 .99 0 .975 0 .95 0 .90 0 .75

1 —　 —　 0 .001 0 .004 0 .016 0 .102
2 0 .010 0 .020 0 .051 0 .103 0 .211 0 .575
3 0 .072 0 .115 0 .216 0 .352 0 .584 1 .213
4 0 .207 0 .297 0 .484 0 .711 1 .064 1 .923
5 0 .412 0 .554 0 .831 1 .145 1 .610 2 .675
6 0 .676 0 .872 1 .237 1 .635 2 .204 3 .455
7 0 .989 1 .239 1 .690 2 .167 2 .833 4 .255
8 1 .344 1 .646 2 .180 2 .733 3 .490 5 .071
9 1 .735 2 .088 2 .700 3 .325 4 .168 5 .899
10 2 .156 2 .558 3 .247 3 .940 4 .865 6 .737
11 2 .603 3 .053 3 .816 4 .575 5 .578 7 .584
12 3 .074 3 .571 4 .404 5 .226 6 .304 8 .438
13 3 .565 4 .107 5 .009 5 .892 7 .042 9 .299
14 4 .075 4 .660 5 .629 6 .571 7 .790 10 .165
15 4 .601 5 .229 6 .262 7 .261 8 .547 11 .037
16 5 .142 5 .812 6 .908 7 .962 9 .312 11 .912
17 5 .697 6 .408 7 .564 8 .672 10 .085 12 .792
18 6 .265 7 .015 8 .231 9 .390 10 .865 13 .675
附录 4 χ2 分布表　 395
续表
n\α 0 .995 0 .99 0 .975 0 .95 0 .90 0 .75

19 6 .844 7 .633 8 .907 10 .117 11 .651 14 .562
20 7 .434 8 .260 9 .591 10 .851 12 .443 15 .452
21 8 .034 8 .897 10 .283 11 .591 13 .240 16 .344
22 8 .643 9 .542 10 .982 12 .338 14 .042 17 .240
23 9 .260 10 .196 11 .689 13 .091 14 .848 18 .137
24 9 .886 10 .856 12 .401 13 .848 15 .659 19 .037
25 10 .520 11 .524 13 .120 14 .611 16 .473 19 .939
26 11 .160 12 .198 13 .844 15 .379 17 .292 20 .843
27 11 .808 12 .879 14 .573 16 .151 18 .114 21 .749
28 12 .461 13 .565 15 .308 16 .928 18 .939 22 .657
29 13 .121 14 .257 16 .047 17 .708 19 .768 23 .567
30 13 .787 14 .954 16 .791 18 .493 20 .599 24 .478
31 14 .458 15 .655 17 .539 19 .281 21 .434 25 .390
32 15 .134 16 .362 18 .291 20 .072 22 .271 26 .304
33 15 .815 17 .074 19 .047 20 .867 23 .110 27 .219
34 16 .501 17 .789 19 .806 21 .664 23 .952 28 .136
35 17 .192 18 .509 20 .569 22 .465 24 .797 29 .054
36 17 .887 19 .233 21 .336 23 .269 25 .643 29 .973
37 18 .586 19 .960 22 .106 24 .075 26 .492 30 .893
38 19 .289 20 .691 22 .878 24 .884 27 .343 31 .815
39 19 .996 21 .426 23 .654 25 .695 28 .196 32 .737
40 20 .707 22 .164 24 .433 26 .509 29 .051 33 .660
41 21 .421 22 .906 25 .215 27 .326 29 .907 34 .585
42 22 .138 23 .650 25 .999 28 .144 30 .765 35 .510
43 22 .859 24 .398 26 .785 28 .965 31 .625 36 .436
44 23 .584 25 .148 27 .575 29 .787 32 .487 37 .363
45 24 .311 25 .901 28 .366 30 .612 33 .350 38 .291
396 　附录 4 χ2 分布表
续表
n\α 0 .25 0 .10 0 .05 0 .025 0 .01 0 .005

1 1 .323 2 .706 3 .841 5 .024 6 .635 7 .879
2 2 .773 4 .605 5 .991 7 .378 9 .210 10 .597
3 4 .108 6 .251 7 .815 9 .348 11 .345 12 .838
4 5 .385 7 .779 9 .488 11 .143 13 .277 14 .860
5 6 .626 9 .236 11 .071 12 .833 15 .086 16 .750
6 7 .841 10 .645 12 .592 14 .449 16 .812 18 .548

7 9 .037 12 .017 14 .067 16 .013 18 .475 20 .278
8 10 .219 13 .362 15 .507 17 .535 20 .090 21 .955
9 11 .389 14 .684 16 .919 19 .023 21 .666 23 .589
10 12 .549 15 .987 18 .307 20 .483 23 .209 25 .188
11 13 .701 17 .275 19 .675 21 .920 24 .725 26 .757

12 14 .845 18 .549 21 .026 23 .337 26 .217 28 .299
13 15 .984 19 .812 22 .362 24 .736 27 .688 29 .819
14 17 .117 21 .064 23 .685 26 .119 29 .141 31 .319
15 18 .245 22 .307 24 .996 27 .488 30 .578 32 .801
16 19 .369 23 .542 26 .296 28 .845 32 .000 34 .267

17 20 .489 24 .769 27 .587 30 .191 33 .409 35 .718
18 21 .605 25 .989 28 .869 31 .526 34 .805 37 .156
19 22 .718 27 .204 30 .144 32 .852 36 .191 38 .582
20 23 .828 28 .412 31 .410 34 .170 37 .566 39 .997
21 24 .935 29 .615 32 .671 35 .479 38 .932 41 .401

22 26 .039 30 .813 33 .924 36 .781 40 .289 42 .796
23 27 .141 32 .007 35 .172 38 .076 41 .638 44 .181
24 28 .241 33 .196 36 .415 39 .364 42 .980 45 .559
25 29 .339 34 .382 37 .652 40 .646 44 .314 46 .928
26 30 .435 35 .563 38 .885 41 .923 45 .642 48 .290

27 31 .528 36 .741 40 .113 43 .194 46 .963 49 .645
附录 4 χ2 分布表　 397
续表
n\α 0 .25 0 .10 0 .05 0 .025 0 .01 0 .005

28 32 .620 37 .916 41 .337 44 .461 48 .278 50 .993
29 33 .711 39 .087 42 .557 45 .722 49 .588 52 .336
30 34 .800 40 .256 43 .773 46 .979 50 .892 53 .672
31 35 .887 41 .422 44 .985 48 .232 52 .191 55 .003

32 36 .973 42 .585 46 .194 49 .480 53 .486 56 .328
33 38 .058 43 .745 47 .400 50 .725 54 .776 57 .648
34 39 .141 44 .903 48 .602 51 .966 56 .061 58 .964
35 40 .223 46 .059 49 .802 53 .203 57 .342 60 .275
36 41 .304 47 .212 50 .998 54 .437 58 .619 61 .581

37 42 .383 48 .363 52 .192 55 .668 59 .892 62 .883
38 43 .462 49 .513 53 .384 56 .896 61 .162 64 .181
39 44 .539 50 .660 54 .572 58 .120 62 .428 65 .476
40 45 .616 51 .805 55 .758 59 .342 63 .691 66 .766
41 46 .692 52 .949 56 .942 60 .561 64 .950 68 .053

42 47 .766 54 .090 58 .124 61 .777 66 .206 69 .336
43 48 .840 55 .230 59 .304 62 .990 67 .459 70 .616
44 49 .913 56 .369 60 .481 64 .201 68 .710 71 .893
45 50 .985 57 .505 61 .656 65 .410 69 .957 73 .166
附录 5 F 分布表　 399
400 　附录 5 F 分布表
参考书目
1 　王梓坤 .概率论基础及其应用 .北京 : 科学出版社 , 1978

2 　陈希孺 .概率论与数理统计 .合肥 : 中国科技大学出版社 , 1992
3 　复旦大学数学系编 .概率论基础 .北京 : 人民教育出版社 , 1979
4 　汪仁官 .概率论引论 .北京 : 北京大学出版社 , 1994
5 　 Felle r W 概率论及其应用 ( 第一、二卷 ) .刘文 , 李志阐等译 .北京 : 科学出
版社 , 1994
6 　 Ross S M 随机过程 .何声武等译 .北京 : 中国统计出版社 , 1997
7 　 Karlin S and T aylor H M . A Fi rst Course in Stochastic P roces ses ( Second
E dition) . New York : Academic Press , 1975
8 　 Ke ndall M G and St uar t A . T he Advanced T heory of Statistics
( Volu me2) . Ch arles Criffin X . Company Limited , 1979
9 　严士健等 .概率论基础 .北京 : 科学出版社 , 1988
10 　严加安 .测度论讲义 .北京 : 科学出版社 , 1998
11 　汪荣鑫 .随机过程 .西安 : 西安交通大学出版社 , 1987
12 　陆璇 .应用数理统计 .北京 : 清华大学出版社 , 1999
13 　钱敏平、龚光鲁 .应用随机过程 .北京 : 北京大学出版社 , 1998
14 　何声武 .随机过程导论 .北京 : 高等教育出版社 , 1998
15 　 Shiryayev A N Probability . Springer －Verlag , 1984
16 　钟开莱 .初等概率论 ( 附随机过程 ) .北京 : 人民教育出版社 , 1979
17 　张尧庭、陈汉峰 .贝叶斯统计推断 .北京 : 科学出版社 , 1994
18 　 Cramer H ( 克拉美 ) .统计学数学方法 .魏宗舒等译 .上海 : 上海科学技术
出版社 , 1966
19 　 Pfeiffer P E P robability for Applications . Springer －Ve rlag World P ubli－
shing Corp .1990
20 　 Resnick S I A Proba bilit y Pat h . Birkha user Boston , 1999
21 　 Neu ts M F Mat rix－Geomet ric Solu tions in Stochastic Models . Th e Johns
Hopkins University Press , 1981
22 　林元烈 .应用随机过程 .北京 : 清华大学出版社 , 2002

随机数学引论 PDF

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

随机数学引论 PDF

Uploaded by

Copyright:

Available Formats

随 机 数 学 引 论

随机数学引论/ 林元烈 , 梁宗霞编著 .—北京 : 清华大学出版社 , 2003

Ⅰ .随… Ⅱ .① 林… ② 梁… Ⅲ .① 随机过程 ② 概率论 Ⅳ .O211

中国版本图书馆 CIP 数据核字( 2003) 第 010099 号

出 版 者 : 清华大学出版社( 北京清华大学学研大厦 , 邮编 100084)

随机数学涉及 4 个主要 部分 : 概率 论、随机 过程、数理 统计 与

3 .3 联合分布函数 ……………………………………… 101

第 4 章 数字特征 ……………………………………………… 137

第 5 章 独立随机变量序列的极限定理 ……………………… 189

第 6 章 泊松信号流 …………………………………………… 222

6 .4 相继到达时刻的条件分布 ………………………… 236

第 7 章 随机游动与马尔可夫链 ……………………………… 251

第 8 章 布朗运动 ……………………………………………… 299

第 9 章 参数估计 ……………………………………………… 321

练习题 ……………………………………………………… 357

第 10 章 假设检验 …………………………………………… 363

附录 1 标准正态分布表 ……………………………………… 387

参考书目 ………………………………………………………… 407

自然界中有许多现象在一定条件下必然会发生 .例如 : 同性电

直观地讲 , 观察 ( 或量测 ) 在一定条件下随机现象出现的结果 ,

若用 ωk ( 1≤ k≤ 6) 表示上面第 k 个 样本点 , 记 : A = 至少有 一

从集合论的观点看 , 事件既然是一些集合 , 就必然存在着事件

的可列交 , 即 k∩ Ak = {ω| ω∈ Ak , k≥1 } .

推广到 n 个事件 : 记∪ Ak 为事件 A k ( k = 1 , … , n) 至少有一 个

同样 , 定义 k∪ Ak 为事件 A1 , A2 , … , An , … 至少有一 个发生 ,

称li m An 为{ An , n≥1 }的极限 .若 ＂ n = 1 , 2 , … , An An + 1 , 则称 之

为单调减序列 , 定义 lim An ∩ An , 称 lim An 为 { An , n≥ 1 } 的 极

限 .单调增 ( 事件 ) 序列和单调减 ( 事件 ) 序列统称为单调事件序列 .

然 Bn Bn + 1 , Cn Cn + 1 , 因此 { Bn , n≥1 }和{ Cn , n≥1} 有极限 .

令li m An lim sup An = k∩ ∪ A n 称 之为 { An , n≥ 1 } 的 上 极

令li m An lim inf A n = k∪ ∩ A n , 称 之 为 { An , n≥ 1 } 的 下 极

限 , 它由自某个 m 后属于所有 A n ( n≥ m) 的样本点构成 , 易证恒 有

当li m An = lim An 时 , 称lim An = n→

对于随机试验 , 人们不仅仅关心实验出现的可能结果 , 更关心

定义 2 .1 若随机试验 E 及其样本空间 Ω 有下列两个特性 :

(1 ) 样本空间 Ω= {ω1 ,ω2 , … ,ωn }只有有限个样本点 ;

对于属于古典概型的随 机事件 , 我 们利 用等可 能 性在 有限 样

长度有关 , 而与区间的 形状与 位置 无关 .简而 言之 , 我 们把 古典 概

这样我们的模型等价于向 Ω中等 可能地投 点的 几何 模型 , 求点 落

De morgan( 德・摩根 ) 2048 1061 0 .5181

Buffon( 布丰 ) 4040 2048 0 .5069

Pearson(皮尔逊 ) 12000 6019 0 .5016

Pearson(皮尔逊 ) 24000 12012 0 .5005

抽取件数 n 10 60 150 600 900 1200 1800

合格件数 μn ( A ) 7 53 131 548 820 1091 1631

合格频率 f n ( A ) 0 .7 0 .883 0 .8730 0 .913 0 .911 0 .909 0 .906

随着每次抽取件数的增多 , 抽到是合格品的频率 ( 即合格品件数与

在概率论发展早期 , 所研究的随机现象比较简单 , 大部分可以

则称 F 为 σ－代数 , 称 (Ω, F ) 为可测空间 .

定义 2 .5 若 F 是包含 C 的最小 σ－域 , 其中 C 2Ω , 称 F 是由

可证明 (Ω, F , P) = ( R , B, P) 是一概 率空间 .通常 称 P 为 一维 标

例 2 .17 (1 ) [ 0 , 1]上的 博雷尔 概率 空间 .设 Ω= [ 0 , 1] , F =

例 3 .1 箱中有 10 个球 , 其中 6 个白球 , 4 个红球 , 任取 3 个 ;

本空间 Ω .Ω 的每一个样本对应于从 10 个元素中取 3 个考虑次 序

例 3 .7 从 1 , 2 , … , 10 这 10 个数字中任 取一个 ( 假定每个 数

从以上几类事件概率的计算 , 可以总结出 , 在求解有关古典概

在实际问题中 , 有时不仅要知道事件 A 发生的概率 P ( A) ; 而

定义 4 .1 设 (Ω, F, P) 为 概率 空间 , A, B∈F, 设 P( B) > 0 ,

为了区别 P( A| B) , 称 P( A) 为事件 A 发生的无条件概率 .

这里给出条件概率的 3 个基本公式 : 乘法公式 , 全概率公式和

∪ Bi = Ω, 则称{ B i , i≥1} 为样本空间 Ω的一个分解 .

定理 4 .2 若 { Bi , 1 ≤ i≤ n}为样本空间 Ω的一个分解 , A∈F,

将事件 A 分解成若干互不相 容的事 件 A B i 的和 , 从而 将复 杂

随机数学引论

Ⅰ .随… 　 Ⅱ .① 林… 　 ② 梁… 　 Ⅲ .① 随机过程　 ② 概率论　 Ⅳ .O211

出版者 : 清华大学出版社( 北京清华大学学研大厦 , 邮编 100084)

随机数学涉及 4 个主要部分 : 概率论、随机过程、数理统计与

3 .3 　联合分布函数 ……………………………………… 101

第 4 章　数字特征 ……………………………………………… 137

第 5 章　独立随机变量序列的极限定理 ……………………… 189

第 6 章　泊松信号流 …………………………………………… 222

6 .4 　相继到达时刻的条件分布 ………………………… 236

第 7 章　随机游动与马尔可夫链 ……………………………… 251

第 8 章　布朗运动 ……………………………………………… 299

第 9 章　参数估计 ……………………………………………… 321

第 10 章　假设检验 …………………………………………… 363

附录 1 　标准正态分布表 ……………………………………… 387

　　自然界中有许多现象在一定条件下必然会发生 .例如 : 同性电

若用 ωk ( 1≤ k≤ 6) 表示上面第 k 个样本点 , 记 : A = 至少有一

推广到 n 个事件 : 记∪ Ak 为事件 A k ( k = 1 , … , n) 至少有一个

　　同样 , 定义 k∪ Ak 为事件 A1 , A2 , … , An , … 至少有一个发生 ,

称li m An 为{ An , n≥1 }的极限 .若＂ n = 1 , 2 , … , An An + 1 , 则称之

为单调减序列 , 定义 lim An ∩ An , 称 lim An 为 { An , n≥ 1 } 的极

令li m An lim sup An = k∩ ∪ A n 称之为 { An , n≥ 1 } 的上极

令li m An lim inf A n = k∪ ∩ A n , 称之为 { An , n≥ 1 } 的下极

限 , 它由自某个 m 后属于所有 A n ( n≥ m) 的样本点构成 , 易证恒有

定义 2 .1 　若随机试验 E 及其样本空间 Ω 有下列两个特性 :

对于属于古典概型的随机事件 , 我们利用等可能性在有限样

长度有关 , 而与区间的形状与位置无关 .简而言之 , 我们把古典概

这样我们的模型等价于向 Ω中等可能地投点的几何模型 , 求点落

定义 2 .5 　若 F 是包含 C 的最小 σ－域 , 其中 C 2Ω , 称 F 是由

可证明 (Ω, F , P) = ( R , B, P) 是一概率空间 .通常称 P 为一维标

例 2 .17 　 (1 ) [ 0 , 1]上的博雷尔概率空间 .设 Ω= [ 0 , 1] , F =

例 3 .1 　箱中有 10 个球 , 其中 6 个白球 , 4 个红球 , 任取 3 个 ;

本空间 Ω .Ω 的每一个样本对应于从 10 个元素中取 3 个考虑次序

例 3 .7 　从 1 , 2 , … , 10 这 10 个数字中任取一个 ( 假定每个数

定义 4 .1 　设 (Ω, F, P) 为概率空间 , A, B∈F, 设 P( B) > 0 ,

定理 4 .2 　若 { Bi , 1 ≤ i≤ n}为样本空间 Ω的一个分解 , A∈F,

　　将事件 A 分解成若干互不相容的事件 A B i 的和 , 从而将复杂

　　 ( 证明提示 : 利用概率的可列可加性 .与定理 4 .2 证明类似 .)

　　全概率公式 : A∈F, 若 A ∪ Bi , Bi ∈F, ＂ i≠ j, Bi B j = ,

　　上述形式的乘法公式和全概率公式 , 仍是无条件下相应公式

　　由此可见 , P( Bn ) 的概率与 n 及 c 均无关 .不爆发传染病的概

3 　试验的独立性和独立重复试验序列

　　在前一章 , 我们已经讨论了随机数学中一些最基本的概念和

2 　博雷尔 σ－域与概率空间

(1 ) (ω: X(ω) ≤ a) 是指所有满足 X (ω) ≤ a 的样本点 ω 的集

注意　＂ a∈R , {ω: X(ω) ≤ a}∈F .可见随机变量的概念 , 是

附　以下命题初学者看时只需了解结论即可 , 证明可先略去

　　定义 2 .1 　如果随机变量 X(ω) 所有可能取值是有限个或可

可以这样理解分布律 , 将质量 1 分布在各个质点上 , xk 点处的

2 　几种重要的离散型随机变量的概率分布

常情况下一台设备的故障可由一个人来处理 .问至少需要多少人

30 = 153 天 .每次暴雨以 1 天计算 , 每天发生暴雨的概率则为 p =

　　 (4 ) 几何分布 ( geomet ric dist ribution)

3 　离散型随机变量的分解与表示

(4 ) 如果随机变量 X(ω) 有概率密度 f ( x ) , 则 P{ω: X (ω) =

2 　几种连续型随机变量的分布

则称 X 在区间[ a, b]上服从均匀分布 ( uniform dist ribution) , 记作

例 3 .2 　设电阻 R 是一随机变量 , 均匀分布在 900Ω～ 1100Ω,

证明　充分性 : 设 X～ Ex(λ) 为工作寿命 .

以上我们介绍了离散型和连续型两类随机变量 , 又分别介绍

(3 ) 由第 1 章可知给定 ( Ω, F, P) , P 是定义于 F 上的集函数 .

{ bn } , b1 > b2 > … > bn > a, bn → a, 证明当 bn → a 时 , 有 nlim F X ( bn ) =

于是由 ( X(ω) ≤ bn ) = ( X(ω) ≤ a) ∪ ( a < X(ω) ≤ bn ) 及第 1 章连续

在实际问题中 , 我们往往会对某些随机变量的函数比对该随

g( ・ ) , g( X(ω) ) 还是随机变量呢 ? 事实上 , 要求 g( x) 为博雷尔可

以上 3 例都是直接求其分布律或分布函数 .这种解法可简称

　　上一章 , 我们研究了单一的随机变量 , 引出了刻画它的概率特

例 1 .1( 多项分布 polynomial dist ribu tion) 　设有 n 次独立重

两个离散型随机变量 ( X (ω) , Y (ω) ) , 那么它们的和、差、积、

则称 X(ω) 为 n 维连续型随机变量 , f ( x1 , … , xn ) 为 X (ω) 的联合

基于上述分析 , ( X , Y ) 落于矩形区域 ( 如图 3 －2 所示 ) , [ x1 <

　　证明　注意到＂ y∈R , 若 x2 > x1 , 有

3 　分布函数与密度函数的关系

本小节讨论随机变量序列的上确界 ( 下确界 ) 上极限 , 下极限

(2 ) 若＂ ω∈Ω, 有 nlim i nf X n (ω) = n→

5 　随机变量的离散化逼近问题

注　这里定义的简单函数 X(ω) 即为取值有限个的离散型随

　　更一般地 , 可以证明 , 任意有限个正态随机变量 ( 可以不独立 )

　　证明　＂ D′ G′, D′∈ B2 , 记 D = { x: x = h( y) , y∈ D′} , 则

由联合概率密度函数的定义知 , 可取 f Y ( y) = f X ( h( y) ) | J | ( y∈