ch2 随机变量

第二章随机变量及其分布
案例1 某线上订餐网站，希望对平台上注册的饭店建立评价机制，
以调查顾客对饭店的服务质量、菜品质量、价格、环境等综合评价.
目前平台对饭店的综合评价设有“非常差、差、一般、好，非常好”
五个等级，显然这不足以获得量化评价效果，该如何为平台设计一种
量化评价方案呢？
解：这个问题对应的样本空间为：
Ω={“非常差”，“差”，“一般”，“好”，“非常好”}，
0 2 3 4 5
样本空间中的样本点和实数显然可以建立下面的一个对应关系：
0 ω =“非常差”

2 ω =“差”
X (ω ) = 3 ω =“一般”
4 ω =“好”

5 ω =“非常好”
为了更好的揭示随机现象的规律性并利用数学工具描述
其规律，引入随机变量来描述随机试验的不同结果.
2.1 随机变量及其分布函数
定义设 W 是随机试验E的样本空间, 若
按一定法则
∀ω ∈ Ω ∃ 实数 X (ω )
则称W上的单值实值函数X (ω)为随机变量.
随机变量一般用大写字母 X, Y , Z , ¼表示，
或者用带下标的大写字母𝑿𝑿𝟏𝟏 , 𝑿𝑿𝟐𝟐 , 𝒀𝒀𝟏𝟏 , 𝒀𝒀𝟐𝟐 , ⋯表示
随机变量是 Ω → R 上的映射,
此映射具有如下特点
定义域事件域 W
随机性随机变量 X 的可能取值不止一
个, 试验前只能预知它可能的取值，但不能
预知取哪个值
概率特性 X 以一定的概率取某个值
例 1. 𝑿𝑿𝟏𝟏 表示某超市在9:00~10:00使用支付宝付款的人数；
2. 𝑿𝑿𝟐𝟐 表示某城市的每周发生交通事故数;
3. 𝑿𝑿𝟑𝟑 表示某高校大一学生晚上的深度睡眠时间；
4. 𝑿𝑿𝟒𝟒 表示某地区人的寿命
注：随机事件可用随机变量的等式或不等式表达
例如：{𝑿𝑿𝟏𝟏 > 𝟏𝟏𝟏𝟏𝟏𝟏}表示该超市9:00 ~ 10:00使用支付宝付

款的人数超过100人这个随机事件
在同一个样本空间可以同时定义多个
随机变量, 例如
W = {儿童的发育情况 w }
X(w) — 身高,
Y(w) — 体重,
Z(w) — 视力.
各随机变量之间可能有一定的关系, 也
可能没有关系—— 即相互独立
离散型
随机变量分类
非离散型
其中一种重要的类型为
连续型随机变量
◇ 任何随机现象可
引入随机变量被随机变量描述
重要意义 ◇ 借助微积分方法
进一步讨论
随机变量的分布函数
定义设X 为随机变量，x 是任意实数,称函数
F ( x) = P( X ≤ x), − ∞ < x < +∞
为 X 的分布函数，记为𝑭𝑭(𝒙𝒙).有时候为强调
对随机变量X的依赖性，也可表示为𝑭𝑭𝑿𝑿 (𝒙𝒙).
案例2 （续案例 1）假设平台根据目前已有的数据，对某饭店综合
评价的比例是非常差10%、差10%、一般20%、好50%、非常好
10%. 按照案例1的各级别的得分，求该饭店综合评价得分𝑿𝑿的分
布函数.
解：由上述给出的评价结果，该饭店综合评价得分𝑿𝑿的概率如下
𝑃𝑃 𝑋𝑋 = 0 = 0.1, 𝑃𝑃 𝑋𝑋 = 2 = 0.1, 𝑃𝑃 𝑋𝑋 = 3 = 0.2,
𝑃𝑃 𝑋𝑋 = 4 = 0.5, 𝑃𝑃 𝑋𝑋 = 5 = 0.1
则𝑿𝑿的分布函数为
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 )
0 2 3 4 5 𝑥𝑥
即，𝑿𝑿的分布函数为
0 𝑥𝑥 < 0
𝑃𝑃(𝑋𝑋 = 0) = 0.1 0 ≤ 𝑥𝑥 < 2
𝑃𝑃(𝑋𝑋 = 0) + 𝑃𝑃(𝑋𝑋 = 2) = 0.2 2 ≤ 𝑥𝑥 < 3
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 ) =
0.4 3 ≤ 𝑥𝑥 < 4
0.9 4 ≤ 𝑥𝑥 < 5
1 𝑥𝑥 ≥ 5
分布函数的性质
 0 ≤ F ( x) ≤ 1 且 lim F ( x) = 1, lim F ( x) = 0
x→+∞ x→−∞
（或者𝑭𝑭 +∞ = 𝟏𝟏, 𝑭𝑭 −∞ = 𝟎𝟎）
 F ( x ) 单调不减，即 ∀ x1 < x2 , F ( x1 ) ≤ F ( x2 )
 F ( x ) 右连续，即 lim F (t ) = F ( x)
t → x+0
（或者𝑭𝑭 𝒙𝒙 + 𝟎𝟎 = 𝑭𝑭(𝒙𝒙)）
分布函数在概率计算中的用途
事实上，如果一个随机变量的分布函数已知时，可以由分布
函数计算该随机变量确定的任何随机事件的概率，例如，
用分布函数计算 X 落在( a ,b ] 里的概率：
P ( a < X ≤ b) = P ( X ≤ b) − P ( X ≤ a )
= F (b) − F (a)
（
] ]
a b 𝒙𝒙
P ( X > a ) =−
1 P ( X ≤ a ) =−
1 F (a)
= x0=
P( X ) lim+ P( x0 − ∆x < X ≤ x0 )
∆x → 0
= lim+ ( F ( x0 ) − F ( x0 − ∆x)) = F ( x0 ) − F ( x0 − 0)
∆x → 0
利用这几个表达式我们可以用分布函数计算随机变量确定的
任何随机事件的概率.
P ( a ≤ X ≤ b) = F (b) − F (a − 0)
请
填 P ( a < X < b) = F (b − 0) − F (a)
空 P(a ≤ X < b) = F (b − 0) − F (a − 0)
例判断下面的一个反正切函数F(x)
能否成为某随机变量X的分布函数？
1 π
=F ( x)  arctan x +  , x ∈ (−∞, +∞)
π 2
2.2 离散型随机变量及其概率分布
离散随机变量及分布律
定义若随机变量 X 的可能取值是有限多个或无穷
可列多个，则称 X 为离散型随机变量
描述离散型随机变量的概率特性常用它的概率分布或
分布律，即
P( X = xk ) = pk , k = 1,2,
或
X x1 x2 … xK …
P p1 p2 … pk …
或
x1 x2  xk 
X ~
p1 p2  pk 
概率分布的性质
 pk ≥ 0, k = 1,2, 非负性
∞
 ∑ pk = 1 规范性
k =1
例设一汽车在开往目的地的途中需经过 4 盏信号灯，每盏
信号灯独立地以概率 p 允许汽车通过。令 X 表示首次停下
时已通过的信号灯的盏数，求 X 的概率分布与 p = 0.4 时
的分布函数。
出发地目的地
解 P ( X ==
k ) p k (1 − p ), k =
0,1, 2, 3
P ( X= 4)
= p4 , k= 4
当 p = 0.4
k 0 1 2 3 4
pk 0.6 0.4´0.6 0.42´0.6 0.43´0.6 0.44

•
] ]••
0
] •1• ] •2 •
3 4 x
x
0, x<0
0.6, 0≤ x<1
0.6 + 0.6 × 0.4, 1≤ x < 2
F ( x) =
0.6 + 0.6 × 0.4 + 0.6 × 0.42 , 2≤ x< 3
0.6(1 + 0.4 + 0.42 + 0.43 ) 3≤ x<4
1 x≥4
F( x)
1 • o•
• o
• o
0.6 • o
•o • • • •
0 1 2 3 4 x
离散随机变量及分布函数
F ( x ) = P ( X ≤ x ) = P (  ( X = xk ) )
xk ≤ x
= ∑ P( X = x
xk ≤ x
k )= ∑p
xk ≤ x
k
pk = P( X = xk ) = F ( xk ) − F ( xk −1 )
其中 xk −1 < xk .
F(x) 是分段阶梯函数, 在 X 的可能取值 xk 处发生间断. 间
断点为第一类跳跃间断点，在间断点处有跃度 pk
注：对离散型随机变量用概率分布(或分布律)比用分布函数计算这
些概率更方便，所以描述离散性随机变量通常用概率分布(或分布
律)
例对一目标进行射击，且各次射击相互独立，若每次击中
目标的概率为p (0 < p < 1), 一次一次地射击直到击中
目标为止.求所需射击次数 X 的概率分布.
k −1
P( X ==
k) p(1 − p )
k = 1, 2, 
注：此分布称为几何分布
例一门大炮对目标进行射击，假定此目标必须被击中r 次
才能被摧毁.若每次击中目标的概率为p (0 < p < 1),且各次射
击相互独立，一次一次地射击直到摧毁目标为止.求所需射
击次数 X 的概率分布.
解 P ( X = k ) = P ( 前 k –1次击中 r – 1次，
第 k 次击中目标)
= C kr −−11 p r −1 (1 − p )k − r ⋅ p
= C kr −−11 p r (1 − p )k − r
=
k r , r + 1,
注：此分布称为帕斯卡分布
常见离散r.v.的分布
(1) 0 – 1 分布
X = xk 1 0 0<p<1
Pk p 1-p
1− k
或 P( X = k ) = p (1 − p) , k = 0, 1
k
应用凡试验只有两个结果, 常用0 – 1
场合分布描述, 如产品是否合格、人
口性别统计、系统是否正常、电力消耗是否
超标等等.
(2) 二项分布-Bernoulli概型
伯努利试验概型
n 重伯努利 (Bernoulli) 试验概型：
试验可重复 n 次
每次试验只有两个可能的结果：
且 P( A) = p, 0 < p < 1
每次试验的结果与其他次试验无关——
称为这 n 次试验是相互独立的
n重Bernoulli试验中事件
A 出现 k 次的概率记为
Pn (k )
n 重Bernoulli 试验中, X 是事件A 在 n 次试
验中发生的次数 , P (A) = p ,若
Pn (k ) = P ( X = k ) = Cnk p k (1 − p ) n − k , k = 0,1,  , n
则称 X 服从参数为n, p 的二项分布，记作
X ~ B ( n, p )
0–1 分布是 n = 1 的二项分布

二项分布的取值情况设 X ~ B( 8, 13 )
8− k
P8 (k ) = P ( X = k ) = C ( 3 ) (1 − 3 )
k
8
1 k 1 , k = 0,1,  ,8
0 1 2 3 4 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000
P
P8 (2) = P8 (3) = 0.273
0.273•
( n + 1)p =3
• • • • • • • • •
1 2 3 4 5 6 7 8 x
0
设 X ~ B ( 20,0.2)
0 1 2 3 4 5 6 7 8 9 10 11 ~ 20
.01 .06 .14 .21 .22 .18 .11 .06 .02 .01 .002 < .001
P P20 (4) = 0.22
0.22 • ( n + 1)p = 4.2
• • • •• •• • • • • • • • • • • • • • •
x
0 1 2 3 4 5 6 7 8 9 10 20
二项分布中最可能的成功次数的定义与推导
若 P( X =
k ) ≥ P( X =j ), j =X 可取的一切值
则称 k 为最可能出现的次数
n−k
记 pk = P( X = k ) = C p (1 − p)
k
n
k
, k = 0,1,, n
pk −1 (1 − p )k
= ≤1
pk p (n − k + 1)
pk (1 − p)( k + 1)
= ≥1
pk +1 p(n − k )
(n + 1) p − 1 ≤ k ≤ (n + 1) p
当( n + 1) p = 整数时,在 k = ( n + 1) p
与 ( n + 1) p – 1 处的概率取得最大值
当( n + 1) p ¹ 整数时, 在 k = [( n + 1) p ]
处的概率取得最大值
对固定的 n、p, P ( X = k) 的取值呈不

对称分布
固定 p, 随着 n 的增大，其取值的分布
趋于对称
例独立射击5000次, 命中率为0.001,
求 (1) 最可能命中次数及相应的概率；
(2) 命中次数不少于1 次的概率.

解 (1) k = [( n + 1)p ]
= [( 5000+ 1)0.001] =5
P5000 (5) = C 5
5000
5
(0.001) (0.999) 4995
≈ 0.1756
(2) 令X 表示命中次数,则 X ~ B(5000,0.001)
P( X ≥ 1) =1 − P( X < 1) =1 − P( X =0)
= 1− C 0
5000
0
(0.001) (0.999) 5000
= 0.9934.
问题如何计算 P ( X ≥ 2000) ？
例某高校教育超市每天12:00-13:00期间某种盒装饮料需求
量的概率分布问题.
解析（1）如果我们把12:00-13:00这段时间等分为100个时间区间，
第一，在每小段时间内需求一盒的概率为
λ
(λ 为常数，
0 < λ < 20)
100
需求是零盒的概率为 λ
1−
100
第二，12:00-13:00期间该盒装饮料的需求量X服从二项分布，即
λ
X ~ B (100, )
100
（2）类似（1），如果我们把12:00-13:00这段时间等分为 n (n ≥ 100)
个时间区间，则12:00-13:00间该盒装饮料的需求量Xn服从
λ
X n ~ B (n, )
n
（3）可以证明（2）中随机变量概率分布的极限，即，当 n → +∞ 时，
n−k
λ  λ λ
k k
−λ
lim P( X n == k
k ) lim C  
n 1 −  = e ,
n →∞ n →∞
n  n k!
k = 0,1, 2, n
Possion定理
设 npn = λ > 0 , 则对固定的 k
n−k −λ λk
lim C p (1 − pn )
k
n
k
n =e
n →∞ k!
k = 0,1,2,
Poisson定理说明若X ~ B( n, p), 则当n 较大，

p 较小, 而 np = λ 适中, 则可以用近似公式
n−k λ −λ
k
C p (1 − p )
k
n
k
≈e , k = 0,1,2,
k!
利用Poisson定理再求前例中 (2)
解令X 表示命中次数, 则
X ~ B( 5000,0.001 )
令 λ = np = 5
−5
P ( X ≥ 1) ≈ 1 − e = 0.9933.
此结果也可直接查 P.299 泊松分布表得到，它与

用二项分布算得的结果0.9934仅相差万分之一.
在实际计算中，当 n ³ 20, p £0.05时，可用上述公式近似计
算；而当n ³ 100, np £10时, 精度更好
按二项分布按Possion
公式
n=10 n=20 n=40 n=100 l=np=1
k
p=0.1 p=0.05 p=0.025 p=0.01
0 0.349 0.358 0.369 0.366 0.368

1 0.305 0.377 0.372 0.370 0.368
2 0.194 0.189 0.186 0.185 0.184
3 0.057 0.060 0.060 0.061 0.061
4 0.011 0.013 0.014 0.015 0.015
在Poisson 定理中，
−λ λk
e >0
k!
∞
λ k ∞
λ
k
∑e −λ
k!
=e −λ
∑ k!
k =0 k =0
 λ λ  2 3
= e 1 + λ + + +  
−λ
 2! 3! 
−λ λ
= e ⋅e =1
由此产生了一种离散型随机变量的概率分布
— Poisson 分布
(3) Poisson 分布
−λ λk
若 P( X = k ) = e , k = 0,1,2,
k!
其中 λ > 0 是常数，则称 X 服从参数为 λ
的Poisson 分布. 记作𝑿𝑿~𝑷𝑷(𝝀𝝀)
注: −λ λ k
e >0
k!
+∞
λk
∑ e
k =0
−λ
k!
=1
例设有同类型设备90台，每台工作相互独立，每台设备发
生故障的概率都是0.01. 在通常情况下，一台设备发生故
障可由一个人独立维修，每人同时也只能维修一台设备.
(1)问至少要配备多少维修工人，才能保证当设备发生故障
时不能及时维修的概率小于0.01?
(2)问3个人共同负责90台还是3个人各自独立负责30台设备
发生故障不能及时维修的概率低？
解 (1) 设需要配备 N 个维修工人
设 X 为90 台设备中发生故障的台数
X ~ B( 90, 0.01)
90
P( X > N ) =∑ C (0.01) (0.99)
k= N +1
k
90
k 90− k
令 λ =90 × 0.01 =0.9

90 k
0.9
则 P( X > N ) ≈
∑
k= N +1
e −0.9
k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
k= N +1 k ! k= 91 k!
∞ k
0.9
≈ ∑
k= N +1
e −0.9
k!
< 0.01
查附表2得 N = 4
(2) 三个人共同负责90台设备发生故障不能及时维修的概率为
90 k
0.9
P ( X > 3) ≈ ∑ e −0.9
k =4 k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
= k 4= k ! k 91 k!
∞ k
0.9
≈∑ e −0.9
k =4 k!
= 0.013459
设30台设备中发生故障的台数为 Y ~ B ( 30,0.01)
设每个人独立负责30台设备，第 i 个人负责的30台设备发生故障不
能及时维修为事件 Ai
∞ k
则 0.3
P ( Ai )= P (Y ≥ 2) ≈ ∑ e −0.3
k =2 k!
= 0.0369 i = 1, 2, 3
三个人各独立负责30台设备发生故障不能及时维修为事件
A1 ∪ A2 ∪ A3
3
P ( A1 ∪ A2 ∪ A3 ) =1 − ∏ P ( Ai )
i =1
=1 − (1 − 0.0369) ≈ 0.1067 > 0.0369
3
故三个人共同负责90 台设备好！
注：泊松分布（Poisson distribution），由法国数学家
西莫恩·德尼·泊松（Siméon-Denis Poisson）提出，
并由此命名.
在实际问题中，当一个随机事件，以固定的平均瞬时速率
λ（或称密度）随机且独立地出现时，那么这个事件在单
位时间（面积或体积）内出现的次数或个数的概率分布就
服从、或者说可以近似地服从泊松分布.
例如：
1. 保险公司某段时间某个保险品种所遇到的索赔
次数；
2. 某电话交换台一段时间收到的呼叫次数；
3. 一段时间内来到某公共汽车站的乘客数；
4. 一段时间内某放射性物质发射出的粒子；
5. 显微镜下某区域中的白血球数目等等.
例设我国某地区每年新生儿染色体异常发生数𝑿𝑿（例）（𝑿𝑿 =
𝟎𝟎, 𝟏𝟏, 𝟐𝟐, ⋯），据以往经验𝑿𝑿服从参数𝝀𝝀 = 𝟏𝟏的Poisson分布，请写出
新生儿染色体异常例数的概率分布；并求该地区没有新生儿发生染
色体异常的概率；以及多于一例新生儿发生染色体异常的概率.
解：由题设知新生儿染色体异常数的概率分布：
1 −1
P( X= k=
) e , =
k 0,1, 2,
k!
该地区没有新生儿发生染色体异常的概率为
−1
e
P( X= 0)= = e−1 ≈ 0.36788
0!
该地区多于一个新生儿发生染色体异常的概率
+∞
P( X =
> 1) P(
= X k)
k =2
+∞
= ∑=
P( X
k =2
k)
=1 − P( X =
0) − P( X =
1)
e −1 e −1
= 1− −
0! 1!
≈ 0.264
例设某电子产品销售商承销某品牌笔记本电脑，大数据预测该品牌
笔记本电脑每周的销售量𝑿𝑿~𝑷𝑷(𝝀𝝀) . 三八妇女节期间该销售商希望
给女性顾客提供一周折扣优惠，根据调查顾客中女性顾客的比例为
𝒑𝒑 . 请给出本周女性顾客销售量𝒀𝒀的概率分布.
λ k
解：由已知条件知 ) e−λ , =
P( X= k= k 0,1, 2,
k!
假设本周女性顾客销售量为𝒎𝒎，则要求的问题即为
P(Y =
mX= Ckm p m (1 − p ) k − m , m =
k) = 0,1, 2, , k
∞
而 (Y =⊂
m)  ( X =
k ), m =
0,1, 2, ( X =∩
k) (X =
l) =
∅, k ≠ l
k =m
由全概率公式
∞
P(=
Y m=
) ∑ P( X=
k =0
k )P(= = k)
Y mX
𝑘𝑘!
𝐶𝐶𝑘𝑘𝑚𝑚 =
=
又𝒎𝒎 > 𝒌𝒌时 P (Y m=
X k )=0，所以 𝑚𝑚! 𝑘𝑘 − 𝑚𝑚 !
λ ∞
k
P(= ) ∑ e − λ Ckm p m (1 − p ) k − m
Y m=
k =m k!
(λ p ) m ∞
λ k −m
= e−λ
m!
∑
k = m ( k − m)!
(1 − p ) k −m
−λ p ( λ p ) m
=e , m = 0,1, 2,
m!
即𝒀𝒀~𝑷𝑷 𝝀𝝀𝝀𝝀 .
2.3 连续型随机变量及其概率分布
案例某制造商为给其所生产的某种型号的晶体管打寿命标签，对该
型号的晶体管的使用寿命进行了抽查，下表是10000只的使用寿命
𝑿𝑿(千时：kh)的抽查资料：
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761
能否根据这个抽查资料刻画随机变量𝑿𝑿的分布呢，如何刻画？
频率直方图，频率直方图是统计学中表示频率分布的图形，该图形在
直角坐标系中，用横轴表示随机变量的取值，横轴上的每个小区间对
应一个组的组距，作为小矩形的底边；纵轴表示频率与组距的比值，
并用它作小矩形的高，以这种小矩形构成的一组图称为频率直方图.
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761
c
 2 , x >1
f ( x) =  x
 0, 其他

因此，从这次的抽查结果，我们认为这批晶体管的寿命的可以用这个
函数、或者近似可以用这个函数刻画概率分布.
定义设 X 是一随机变量， F ( x )是它的分布函数，若存在
一个非负可积函数 f ( x ), 使得
x
F ( x) = ∫−∞ f (t ) dt − ∞ < x < +∞
则称 X 是连续型随机变量，f ( x )是它的概率密度函数，
简称为密度函数或概率密度.
注：连续型随机变量的分布函数连续.
分布函数F ( x )与密度函数 f ( x )的几何意义
f ( x)
0.08 y = f (x)
F(x) 0.06
0.04
0.02
-10 -5 5
x x
概率密度函数 f ( x )的性质
1、 f ( x) ≥ 0
+∞
2、 ∫−∞ f ( x) d x = F (+∞) = 1
常利用这两个性质检验一个函数能否作为连续性
随机变量的密度函数，或求其中的未知参数
3、在 f ( x ) 的连续点处， f ( x) = F ′( x)
f ( x ) 描述了X 在 x 附近单位长度的区间内
取值的概率
f ( x0 ) ∆ x ≈ P ( x0 < X ≤ x0 + ∆ x )
注：对于连续型随机变量X , P ( X = a) = 0
（这里 a 可以是随机变量 X 的一个可能的取值）
事实上 ( X = a ) ⊂ (a − ∆x < X ≤ a ) ∆x > 0

0 ≤ P ( X = a ) ≤ P (a − ∆x < X ≤ a ) = ∫
a
a − ∆x
f ( x )d x
a
0 ≤ P ( X = a ) ≤ lim ∫
∆x→+0 a − ∆x
f ( x ) d x =0
P( X = a) = 0
命题连续型随机变量取任一常数的概率为零
强调概率为0 (1) 的事件未必不发生(发生)
对于连续型随机变量X
P ( a < X ≤ b) = P ( a ≤ X ≤ b)
= P ( a < X < b)
= P ( a ≤ X < b)
f ( x)
b
= ∫ f ( x)d x = F (b) − F (a)
0.08
a
0.06
0.04
0.02
-10 -5 5
a b x
P ( X ≤ b) = P ( X < b) = F (b)
P( X > a) = P( X ≥ a) = 1 − F (a)
f ( x)
0.08
0.06
0.04
0.02
-10 -5 5
a x
例设随机变量 X 具有概率密度函数
 Ae −3 x , x ≥ 0; 试确定常数A，
f ( x) = 
 0 , x < 0 . 以及 X 的分布函数.
+∞ +∞ 1
解由 1 = ∫− ∞ f ( x )dx = ∫0 Ae −3 x
dx = A,
3
 3e − 3 x , x ≥ 0;
知A=3，即 f ( x ) = 
 0, x < 0.
而 X 的分布函数为
1 − e −3 x , x ≥ 0;
F ( x) = ∫
x
f ( t )dt = 
−∞
 0, x < 0.
例有一批晶体管，已知每只的使用寿命 X 为
连续型随机变量，其概率密度函数为
 c
 x2 , x > 1000
f ( x) =  ( c 为常数)

 0, 其他
(1) 求常数 c.
(2) 已知一只收音机上装有3只这样的晶体管，每
只晶体管能否正常工作相互独立，求在使用的最初
1500小时三只晶体管中损坏的只数所服从的分布.
(3) 这样的晶体管, 使用的最初1500小时只有一个
损坏的概率.
+∞ +∞c 令
解 (1)
∫−∞=
f ( x )d x ∫=
1000 x 2
dx 1
c = 1000
(2) 设事件 A 表示一只晶体管的寿命小于
1500小时
P ( A) = P (0 ≤ X < 1500)
1500 1000 1
= ∫= 2
dx
1000 x 3
设在使用的最初1500小时三只晶体管中
 1
损坏的只数为 Y ~ B  3, 
 3
2
 1  2  4
(3) P (Y= 1)= C   =
1
3
 3  3  9
例一个靶子是半径为2米的圆盘，设击中靶上
任一同心圆盘上的点的概率与该圆盘的面积成
正比，并设射击都能中靶，以 X 表示弹着点与
圆心的距离，试求随机变量 X 的分布函数．
解 : 若x < 0, 则( X ≤ x)是不可能事件, 于是
F ( x) = P( X ≤ x) = 0
若0 ≤ x < 2,由题意, P(0 ≤ X < x) =kx 2 , k是某一常数.
取x = 2, 有
1
P(0 ≤ X < 2) = k 2 = 1, k =
2
4
x2
即P(0 ≤ X < x) = , 于是
4
2
F ( x ) = P ( X ≤ x ) = P ( X < 0) + P ( 0 ≤ X ≤ x ) = x
4
若x ≥ 2,由题意, 是必然事件, 于是
F ( x) = P( X ≤ x) = 1
综上所述，随机变量 X 的分布函数为
0 x<0
 x 2
F ( x) =  0≤ x<2
4
 1 x≥2
常见的连续性随机变量的分布
(1) 均匀分布
 1
b − a , a < x < b
若 X 的密度函数为 f ( x) = 

 0, 其他
则称 X 服从区间( a , b)上的均匀分布
记作 X ~ U ( a, b)
 0, x < a,

x − a
X 的分布函数为 F ( x) =  , a ≤ x < b,
b − a
 1 x≥b
f ( x)
1
。 b−a 。
a b x
F( x)
1
a b x
∀(c, d ) ⊂ (a, b)
d 1 d −c
P (c < X < d ) = ∫ dx =
c b−a b−a
即 X 的取值在(a,b)内任何长为 d – c 的小区间
的概率与小区间的位置无关, 只与其长度成正
比. 这正是几何概型的情形.
(2) 指数分布
若 X 的密度函数为
λ e − λ x , x ≥ 0
f ( x) =  λ > 0 为常数
 0, 其他
则称 X 服从参数为λ的指数分布
记作 X ~ Exp (λ )
X 的分布函数为  0, x≤0
F ( x) =  −λ x
1 − e , x>0
f ( x)
λ
0 x
F( x)
1
0 x
例假定一大型设备在任何长为t的时间内发生故
障的次数X(t)服从参数为 λ t 的泊松分布.求：
（1）相继两次故障时间间隔T的概率分布；
（2）设备已经无故障运行8小时的情况下，再
无故障运行10小时的概率.
解 (1) FT=
( t ) P (T ≤ t )
 0, t<0
=
1 − P (T > t ), t > 0
0 −λt
(λ t ) e −λt
P (T = =
> t ) P ( N= ( t ) 0) = e
0!
 0, t<0  0, t<0
F (t ) =  −λt
f (t ) =  − λt
1 − e , t > 0 λ e , t > 0
即 T ~ E (λ )
P (T > 18) 1
(2) P (T > 18 T > 8) = = = e −10 λ
− F (18)
P (T > 8) 1 − F (8)
指数分布具有无记忆性：
X ~ Exp (λ ), 则
P( X > s + t | X > s=
) P( X > t )
例（常识）
（0,t）内的保险公司索赔次数 N(t) 服从poisson分布
即 N(t) ～P(λt)；
其两次索赔之间的时间间隔服从指数分布。
例（常识）
(0,t)内某柜台需要服务的顾客数N(t)服从poisson分布
即 N(t) ～P(λt)；
先后两个顾客到达柜台的时间间隔服从指数分布。
例某美容厅顾客到达后需要等候的服务时间服
从参数为0.1 的指数分布，若顾客等候时间超过
X
20分钟就会离开.
（1）请给出该美容厅在营业时间内50个顾客中
因等候时间超过20分钟，没有等到服务而离开人
数的分布律;
（2）50个顾客中没有等到服务而离开的人数大
于1的概率.
解设 Y 表示50个顾客中因等候时间超过20分钟，没有
等到服务而离开的人数，根据题意每个顾客等待时间
X 超过20分钟的概率为
+∞
∫
−0.1 x −2
P (=
X ≥ 20) =
0.1e dx e
10
−2
Y 可以看成是 p = e 的50重Bernoulli试验中顾客
离开发生次数，因此
−2
Y ~ B (50, e )
−2 50 − k
P(Y =
k) =
C p (1 − e )
k
50
k
，k =
0,1, 2, ,50
（2）没有等到服务而离开的次数大于1的概率为
P (Y > 1) =
1 − p (Y =−
0) p (Y =
1)
=1 − (1 − e −2 )50 − 50e −2 (1 − e −2 ) 49
(3) 正态分布(Gauss 分布)
若X 的密度函数为
( x− µ )2
1 −
f ( x) = e 2σ 2
− ∞ < x < +∞
2π σ
µ ,σ 为常数，σ > 0
则称 X 服从参数为 m , s 2 的正态分布
记作 X ~ N ( m , s 2 )
N (-3 , 1.2 )
0.3
0.25
0.2
0.15
0.1
0.05
-6 -5 -4 -3 -2 -1
µ = −3
f (x) 的性质：
 图形关于直线 x = µ 对称： f (µ + x) = f (µ - x)
在 x = µ 时, f (x) 取得最大值
1
2π σ
在 x = µ±σ 时, 曲线 y = f (x) 在对应的点处有
拐点
曲线 y = f (x) 以 x 轴为渐近线
曲线 y = f (x) 的图形呈单峰状
P( X ≤ µ ) = F ( µ )
= 1 − F ( µ ) = P( X > µ )
1
=
2
0.3
0.25
0.2
0.15
0.1
0.05
-6 -5 -4 -3 -2 -1
 f (x) 的两个参数：
µ — 位置参数
即固定 σ , 对于不同的 µ , 对应的 f (x)
的形状不变化，只是位置不同
σ — 形状参数
固定 µ ，对于不同的σ ，f ( x) 的形状不同.
1 1
若 σ1< σ2 则 2π σ > 2π σ 2 前者取 µ
1
附近值的概率更大. x = µ ± σ1 所对应的拐点
比x = µ ± σ2 所对应的拐点更靠近直线 x = µ
Show[fn1,fn3]
σ小
0.5
0.4
σ大 0.3
0.2
0.1
-6 -5 -4 -3 -2 -1
几何意义 σ 大小与曲线陡峭程度成反比
数据意义 σ 大小与数据分散程度成正比
一种重要的正态分布：N (0,1) — 标准正态分布
标准正态分布的计算：
如果随机变量 X ~ N ( 0， 1) ，则其密度函数为
x2
1 −
=ϕ ( x) e 2
( −∞, +∞ )
2π
其分布函数为
x x t2
1 −
Φ ( x)
= ϕ ( t ) dt
∫= ∫e 2
dt ( −∞ < x < +∞ )
−∞ 2π −∞
教科书上都附有标准正态分布表,由此可得Φ ( x)值.
Φ (0) = 0.5 Φ (− x) = 1 − Φ ( x)
P (| X |< a ) = 2Φ (a ) − 1
0.4
0.3
0.2
0.1
-3 -2 -1 1 2 3
Φ (0) = 0.5
Φ (− x) = 1 − Φ ( x)
0.4
0.3
0.2
0.1
-3 -2 -x -1 1 x 2 3
P (| X |< a ) = 2Φ (a ) − 1
对一般的正态分布：X ~ N ( µ ,σ 2)
( t − µ )2
1 x −
其分布函数 F ( x) = ∫
2π σ −∞
e 2σ 2
d t
t −µ  x−µ
作变量代换 s = F ( x) = Φ  
σ  σ 
P(a < X ≤ b)= F (b) − F (a )
b−µ  a−µ 
= Φ −Φ 
 σ   σ 
P( X > a) = 1 − F (a)
 a−µ
= 1−Φ  
 σ 
定理若X ~ N ( µ , σ ), 则
2
X −µ
~ N (0,1).
σ
例假定某人群血液中总胆固醇含量𝑿𝑿~𝑵𝑵(𝟒𝟒. 𝟐𝟐, 𝟎𝟎. 𝟖𝟖𝟐𝟐 )(𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦/𝐋𝐋) ，如
果总胆固醇超过5.6被认为是偏高的，求总胆固醇偏高的概率.
解 P( X > 5.6) =
1 − P( X ≤ 5.6)
 5.6 − 4.2 
= 1− Φ  
 0.8 
= 1 − Φ (1.75)
= 1 − 0.95994 = 0.04006
例假设公共汽车车门的高度是按男子与车门顶碰头机会在1%以
下来设计的，假设成年男子身高𝑿𝑿~𝑵𝑵(𝟏𝟏𝟏𝟏𝟏𝟏, 𝟔𝟔𝟐𝟐 )(𝒄𝒄𝒄𝒄)，问如何设计
车门的高度？
解设车门的高度为𝒉𝒉(𝒄𝒄𝒄𝒄)，按设计要求解满足𝑷𝑷(𝑿𝑿 ≥ 𝒉𝒉) ≤ 𝟎𝟎. 𝟎𝟎𝟎𝟎

或𝑷𝑷(𝑿𝑿 ≤ 𝒉𝒉) ≥ 𝟎𝟎. 𝟗𝟗𝟗𝟗的最小值𝒉𝒉.
𝒉𝒉 − 𝟏𝟏𝟏𝟏𝟏𝟏
𝑷𝑷 𝑿𝑿 ≤ 𝒉𝒉 = 𝚽𝚽 ≥ 𝟎𝟎. 𝟗𝟗𝟗𝟗
𝟔𝟔
查表得𝚽𝚽 𝟐𝟐. 𝟑𝟑𝟑𝟑 = 𝟎𝟎. 𝟗𝟗𝟗𝟗𝟗𝟗𝟗𝟗 > 𝟎𝟎. 𝟗𝟗𝟗𝟗，所以取
𝒉𝒉 − 𝟏𝟏𝟏𝟏𝟏𝟏
= 𝟐𝟐. 𝟑𝟑𝟑𝟑，解得 𝒉𝒉 ≈ 𝟏𝟏𝟏𝟏𝟏𝟏
𝟔𝟔
例已知 X ~ N (2,σ ) 且 P( 2 < X < 4 ) = 0.3,
2
求 P ( X < 0 ).
 0 − 2  2
解一 P ( X < 0) = Φ   = 1−Φ  
 σ  σ 
 4 − 2  2 − 2
P ( 2 < X < 4) = Φ   −Φ  
 σ   σ 
 2
= Φ   − Φ (0) = 0.3
σ 
 2
Φ   = 0.8
σ 
P ( X < 0) = 0.2
解二图解法
0.2
0.3
0.15
0.1
0.05
0.2
-2 2 4 6
由图
P ( X < 0) = 0.2
例 3σ 原则
设 X ~ N ( µ , σ 2), 求 P(| X − µ |< 3σ )
解 P(| X − µ |< 3σ ) = P( µ − 3σ < X < µ + 3σ )
 µ + 3σ − µ   µ − 3σ − µ 
=Φ  −Φ  
 σ   σ 
= Φ (3) − Φ (− 3)
= 2Φ (3) − 1 = 2 × 0.9987 − 1 = 0.9974
一次试验中, X 落入区间( µ - 3σ , µ +3σ )
的概率为 0.9974, 而超出此区间可能性很小
由3σ 原则知，
当 a < −3 时 Φ (a ) ≈ 0 , b > 3 时 Φ (b) ≈ 1
例设测量的误差 X ～ N(7.5, 100)(单位：米), 问要进行多少次
独立测量，才能使至少有一次误差的绝对值不超过10米的概
率大于0.9 ?
 10 − 7.5   − 10 − 7.5 
解 P(| X |≤ 10) = Φ   −Φ  
 10   10 
= Φ (0.25) − Φ (− 1.75)
= Φ (0.25) − [1 − Φ (1.75)]
= 0.5586
设 A 表示进行 n 次独立测量至少有一次误差的绝对值不超过10米
P ( A) = 1 − (1 − 0.5586) n > 0.9 n > 3
所以至少要进行 4 次独立测量才能满足要求.

ch2 随机变量

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

ch2 随机变量

Uploaded by

Copyright:

Available Formats

第二章随机变量及其分布

例如：{𝑿𝑿𝟏𝟏 > 𝟏𝟏𝟏𝟏𝟏𝟏}表示该超市9:00 ~ 10:00使用支付宝付

（或者𝑭𝑭 +∞ = 𝟏𝟏, 𝑭𝑭 −∞ = 𝟎𝟎）

用分布函数计算 X 落在( a ,b ] 里的概率：

pk 0.6 0.4´0.6 0.42´0.6 0.43´0.6 0.44

0–1 分布是 n = 1 的二项分布

P P20 (4) = 0.22

0.22 • ( n + 1)p = 4.2

对固定的 n、p, P ( X = k) 的取值呈不

(2) 命中次数不少于1 次的概率.

Poisson定理说明若X ~ B( n, p), 则当n 较大，

此结果也可直接查 P.299 泊松分布表得到，它与

0 0.349 0.358 0.369 0.366 0.368

令 λ =90 × 0.01 =0.9

事实上 ( X = a ) ⊂ (a − ∆x < X ≤ a ) ∆x > 0

若0 ≤ x < 2,由题意, P(0 ≤ X < x) =kx 2 , k是某一常数.

解设车门的高度为𝒉𝒉(𝒄𝒄𝒄𝒄)，按设计要求解满足𝑷𝑷(𝑿𝑿 ≥ 𝒉𝒉) ≤ 𝟎𝟎. 𝟎𝟎𝟎𝟎

You might also like

ch2 随机变量

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

ch2 随机变量

Uploaded by

Copyright:

Available Formats

第二章 随机变量及其分布

例如：{𝑿𝑿𝟏𝟏 > 𝟏𝟏𝟏𝟏𝟏𝟏}表示该超市9:00 ~ 10:00使用支付宝付

（或者𝑭𝑭 +∞ = 𝟏𝟏, 𝑭𝑭 −∞ = 𝟎𝟎）

用分布函数计算 X 落在( a ,b ] 里的概率：

pk 0.6 0.4´0.6 0.42´0.6 0.43´0.6 0.44

0–1 分布是 n = 1 的二项分布

P P20 (4) = 0.22

0.22 • ( n + 1)p = 4.2

对固定的 n、p, P ( X = k) 的取值呈不

(2) 命中次数不少于1 次的概率.

Poisson定理说明若X ~ B( n, p), 则当n 较大，

此结果也可直接查 P.299 泊松分布表得到，它与

0 0.349 0.358 0.369 0.366 0.368

令 λ =90 × 0.01 =0.9

事实上 ( X = a ) ⊂ (a − ∆x < X ≤ a ) ∆x > 0

若0 ≤ x < 2,由题意, P(0 ≤ X < x) =kx 2 , k是某一常数.

解 设车门的高度为𝒉𝒉(𝒄𝒄𝒄𝒄)，按设计要求解满足𝑷𝑷(𝑿𝑿 ≥ 𝒉𝒉) ≤ 𝟎𝟎. 𝟎𝟎𝟎𝟎

You might also like

第二章随机变量及其分布

解设车门的高度为𝒉𝒉(𝒄𝒄𝒄𝒄)，按设计要求解满足𝑷𝑷(𝑿𝑿 ≥ 𝒉𝒉) ≤ 𝟎𝟎. 𝟎𝟎𝟎𝟎