You are on page 1of 96

第二章 随机变量及其分布

案例1 某线上订餐网站,希望对平台上注册的饭店建立评价机制,
以调查顾客对饭店的服务质量、菜品质量、价格、环境等综合评价.
目前平台对饭店的综合评价设有“非常差、差、一般、好,非常好”
五个等级,显然这不足以获得量化评价效果,该如何为平台设计一种
量化评价方案呢?

解:这个问题对应的样本空间为:

Ω={“非常差”,“差”,“一般”,“好”,“非常好”},

0 2 3 4 5

样本空间中的样本点和实数显然可以建立下面的一个对应关系:
0 ω =“非常差”

2 ω =“差”
X (ω ) = 3 ω =“一般”
4 ω =“好”

5 ω =“非常好”

为了更好的揭示随机现象的规律性并利用数学工具描述
其规律,引入随机变量来描述随机试验的不同结果.
2.1 随机变量及其分布函数

定义 设 W 是随机试验E的样本空间, 若
按一定法则
∀ω ∈ Ω ∃ 实数 X (ω )
则称W上的单值实值函数X (ω)为随机变量.

随机变量一般用大写字母 X, Y , Z , ¼表示,
或者用带下标的大写字母𝑿𝑿𝟏𝟏 , 𝑿𝑿𝟐𝟐 , 𝒀𝒀𝟏𝟏 , 𝒀𝒀𝟐𝟐 , ⋯表示
随机变量是 Ω → R 上的映射,
此映射具有如下特点
定义域 事件域 W
随机性 随机变量 X 的可能取值不止一
个, 试验前只能预知它可能的取值,但不能
预知取哪个值
概率特性 X 以一定的概率取某个值
例 1. 𝑿𝑿𝟏𝟏 表示某超市在9:00~10:00使用支付宝付款的人数;
2. 𝑿𝑿𝟐𝟐 表示某城市的每周发生交通事故数;
3. 𝑿𝑿𝟑𝟑 表示某高校大一学生晚上的深度睡眠时间;
4. 𝑿𝑿𝟒𝟒 表示某地区人的寿命

注:随机事件可用随机变量的等式或不等式表达

例如:{𝑿𝑿𝟏𝟏 > 𝟏𝟏𝟏𝟏𝟏𝟏}表示该超市9:00 ~ 10:00使用支付宝付


款的人数超过100人这个随机事件
在同一个样本空间可以同时定义多个
随机变量, 例如
W = {儿童的发育情况 w }
X(w) — 身高,
Y(w) — 体重,
Z(w) — 视力.

各随机变量之间可能有一定的关系, 也
可能没有关系—— 即 相互独立
离散型
随机变量分类
非离散型

其中一种重要的类型为
连续型随机变量

◇ 任何随机现象可
引入随机变量 被随机变量描述
重要意义 ◇ 借助微积分方法
进一步讨论
随机变量的分布函数
定义 设X 为随机变量,x 是任意实数,称函数
F ( x) = P( X ≤ x), − ∞ < x < +∞
为 X 的分布函数,记为𝑭𝑭(𝒙𝒙).有时候为强调
对随机变量X的依赖性,也可表示为𝑭𝑭𝑿𝑿 (𝒙𝒙).
案例2 (续案例 1) 假设平台根据目前已有的数据,对某饭店综合
评价的比例是非常差10%、差10%、一般20%、好50%、非常好
10%. 按照案例1的各级别的得分,求该饭店综合评价得分𝑿𝑿的分
布函数.
解:由上述给出的评价结果,该饭店综合评价得分𝑿𝑿的概率如下
𝑃𝑃 𝑋𝑋 = 0 = 0.1, 𝑃𝑃 𝑋𝑋 = 2 = 0.1, 𝑃𝑃 𝑋𝑋 = 3 = 0.2,
𝑃𝑃 𝑋𝑋 = 4 = 0.5, 𝑃𝑃 𝑋𝑋 = 5 = 0.1
则𝑿𝑿的分布函数为
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 )

0 2 3 4 5 𝑥𝑥
即,𝑿𝑿的分布函数为

0 𝑥𝑥 < 0
𝑃𝑃(𝑋𝑋 = 0) = 0.1 0 ≤ 𝑥𝑥 < 2
𝑃𝑃(𝑋𝑋 = 0) + 𝑃𝑃(𝑋𝑋 = 2) = 0.2 2 ≤ 𝑥𝑥 < 3
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 ) =
0.4 3 ≤ 𝑥𝑥 < 4
0.9 4 ≤ 𝑥𝑥 < 5
1 𝑥𝑥 ≥ 5
分布函数的性质

 0 ≤ F ( x) ≤ 1 且 lim F ( x) = 1, lim F ( x) = 0
x→+∞ x→−∞

(或者𝑭𝑭 +∞ = 𝟏𝟏, 𝑭𝑭 −∞ = 𝟎𝟎)

 F ( x ) 单调不减,即 ∀ x1 < x2 , F ( x1 ) ≤ F ( x2 )

 F ( x ) 右连续,即 lim F (t ) = F ( x)
t → x+0

(或者𝑭𝑭 𝒙𝒙 + 𝟎𝟎 = 𝑭𝑭(𝒙𝒙))
分布函数在概率计算中的用途
事实上,如果一个随机变量的分布函数已知时,可以由分布
函数计算该随机变量确定的任何随机事件的概率,例如,

用分布函数计算 X 落在( a ,b ] 里的概率:

P ( a < X ≤ b) = P ( X ≤ b) − P ( X ≤ a )
= F (b) − F (a)

] ]
a b 𝒙𝒙
P ( X > a ) =−
1 P ( X ≤ a ) =−
1 F (a)

= x0=
P( X ) lim+ P( x0 − ∆x < X ≤ x0 )
∆x → 0

= lim+ ( F ( x0 ) − F ( x0 − ∆x)) = F ( x0 ) − F ( x0 − 0)
∆x → 0

利用这几个表达式我们可以用分布函数计算随机变量确定的
任何随机事件的概率.
P ( a ≤ X ≤ b) = F (b) − F (a − 0)

填 P ( a < X < b) = F (b − 0) − F (a)
空 P(a ≤ X < b) = F (b − 0) − F (a − 0)
例 判断下面的一个反正切函数F(x)
能否成为某随机变量X的分布函数?

1 π
=F ( x)  arctan x +  , x ∈ (−∞, +∞)
π 2
2.2 离散型随机变量及其概率分布
离散随机变量及分布律
定义 若随机变量 X 的可能取值是有限多个或无穷
可列多个,则称 X 为离散型随机变量
描述离散型随机变量的概率特性常用它的概率分布或
分布律,即
P( X = xk ) = pk , k = 1,2,

X x1 x2 … xK …

P p1 p2 … pk …

x1 x2  xk 
X ~
p1 p2  pk 

概率分布的性质
 pk ≥ 0, k = 1,2, 非负性


 ∑ pk = 1 规范性
k =1
例 设一汽车在开往目的地的途中需经过 4 盏信号灯,每盏
信号灯独立地以概率 p 允许汽车通过。令 X 表示首次停下
时已通过的信号灯的盏数,求 X 的概率分布与 p = 0.4 时
的分布函数。

出发地 目的地
解 P ( X ==
k ) p k (1 − p ), k =
0,1, 2, 3
P ( X= 4)
= p4 , k= 4
当 p = 0.4
k 0 1 2 3 4

pk 0.6 0.4´0.6 0.42´0.6 0.43´0.6 0.44



] ]••
0
] •1• ] •2 •
3 4 x
x

0, x<0
0.6, 0≤ x<1
0.6 + 0.6 × 0.4, 1≤ x < 2
F ( x) =
0.6 + 0.6 × 0.4 + 0.6 × 0.42 , 2≤ x< 3
0.6(1 + 0.4 + 0.42 + 0.43 ) 3≤ x<4
1 x≥4
F( x)
1 • o•
• o
• o

0.6 • o

•o • • • •
0 1 2 3 4 x
离散随机变量及分布函数
F ( x ) = P ( X ≤ x ) = P (  ( X = xk ) )
xk ≤ x

= ∑ P( X = x
xk ≤ x
k )= ∑p
xk ≤ x
k

pk = P( X = xk ) = F ( xk ) − F ( xk −1 )
其中 xk −1 < xk .
F(x) 是分段阶梯函数, 在 X 的可能取值 xk 处发生间断. 间
断点为第一类跳跃间断点,在间断点处有跃度 pk
注:对离散型随机变量用概率分布(或分布律)比用分布函数计算这
些概率更方便,所以描述离散性随机变量通常用概率分布(或分布
律)

例 对一目标进行射击,且各次射击相互独立,若每次击中
目标的概率为p (0 < p < 1), 一次一次地射击直到击中
目标为止.求所需射击次数 X 的概率分布.

k −1
P( X ==
k) p(1 − p )
k = 1, 2, 
注:此分布称为几何分布
例 一门大炮对目标进行射击,假定此目标必须被击中r 次
才能被摧毁.若每次击中目标的概率为p (0 < p < 1),且各次射
击相互独立,一次一次地射击直到摧毁目标为止.求所需射
击次数 X 的概率分布.

解 P ( X = k ) = P ( 前 k –1次击中 r – 1次,
第 k 次击中目标)
= C kr −−11 p r −1 (1 − p )k − r ⋅ p
= C kr −−11 p r (1 − p )k − r
=
k r , r + 1,
注:此分布称为帕斯卡分布
常见离散r.v.的分布
(1) 0 – 1 分布
X = xk 1 0 0<p<1
Pk p 1-p
1− k
或 P( X = k ) = p (1 − p) , k = 0, 1
k

应用 凡试验只有两个结果, 常用0 – 1
场合 分布描述, 如产品是否合格、人
口性别统计、系统是否正常、电力消耗是否
超标等等.
(2) 二项分布-Bernoulli概型
伯努利试验概型
n 重伯努利 (Bernoulli) 试验概型:
试验可重复 n 次
每次试验只有两个可能的结果:
且 P( A) = p, 0 < p < 1
每次试验的结果与其他次试验无关——
称为这 n 次试验是相互独立的
n重Bernoulli试验中事件
A 出现 k 次的概率 记为
Pn (k )
n 重Bernoulli 试验中, X 是事件A 在 n 次试
验中发生的次数 , P (A) = p ,若
Pn (k ) = P ( X = k ) = Cnk p k (1 − p ) n − k , k = 0,1,  , n

则称 X 服从参数为n, p 的二项分布,记作
X ~ B ( n, p )

0–1 分布是 n = 1 的二项分布


二项分布的取值情况 设 X ~ B( 8, 13 )
8− k
P8 (k ) = P ( X = k ) = C ( 3 ) (1 − 3 )
k
8
1 k 1 , k = 0,1,  ,8
0 1 2 3 4 5 6 7 8
.039 .156 .273 .273 .179 .068 .017 .0024 .0000

P
P8 (2) = P8 (3) = 0.273
0.273•
( n + 1)p =3

• • • • • • • • •
1 2 3 4 5 6 7 8 x
0
设 X ~ B ( 20,0.2)

0 1 2 3 4 5 6 7 8 9 10 11 ~ 20
.01 .06 .14 .21 .22 .18 .11 .06 .02 .01 .002 < .001

P P20 (4) = 0.22

0.22 • ( n + 1)p = 4.2

• • • •• •• • • • • • • • • • • • • • •
x
0 1 2 3 4 5 6 7 8 9 10 20
二项分布中最可能的成功次数的定义与推导
若 P( X =
k ) ≥ P( X =j ), j =X 可取的一切值
则称 k 为最可能出现的次数
n−k
记 pk = P( X = k ) = C p (1 − p)
k
n
k
, k = 0,1,, n
pk −1 (1 − p )k
= ≤1
pk p (n − k + 1)
pk (1 − p)( k + 1)
= ≥1
pk +1 p(n − k )

(n + 1) p − 1 ≤ k ≤ (n + 1) p
当( n + 1) p = 整数时,在 k = ( n + 1) p
与 ( n + 1) p – 1 处的概率取得最大值
当( n + 1) p ¹ 整数时, 在 k = [( n + 1) p ]
处的概率取得最大值

对固定的 n、p, P ( X = k) 的取值呈不


对称分布
固定 p, 随着 n 的增大,其取值的分布
趋于对称
例 独立射击5000次, 命中率为0.001,

求 (1) 最可能命中次数及相应的概率;

(2) 命中次数不少于1 次的概率.


解 (1) k = [( n + 1)p ]
= [( 5000+ 1)0.001] =5

P5000 (5) = C 5
5000
5
(0.001) (0.999) 4995

≈ 0.1756
(2) 令X 表示命中次数,则 X ~ B(5000,0.001)
P( X ≥ 1) =1 − P( X < 1) =1 − P( X =0)
= 1− C 0
5000
0
(0.001) (0.999) 5000

= 0.9934.

问题 如何计算 P ( X ≥ 2000) ?
例 某高校教育超市每天12:00-13:00期间某种盒装饮料需求
量的概率分布问题.
解析(1)如果我们把12:00-13:00这段时间等分为100个时间区间,
第一,在每小段时间内需求一盒的概率为
λ
(λ 为常数,
0 < λ < 20)
100
需求是零盒的概率为 λ
1−
100
第二,12:00-13:00期间该盒装饮料的需求量X服从二项分布,即
λ
X ~ B (100, )
100
(2)类似(1),如果我们把12:00-13:00这段时间等分为 n (n ≥ 100)
个时间区间,则12:00-13:00间该盒装饮料的需求量Xn服从
λ
X n ~ B (n, )
n

(3)可以证明(2)中随机变量概率分布的极限,即,当 n → +∞ 时,
n−k
λ  λ λ
k k
−λ
lim P( X n == k
k ) lim C  
n 1 −  = e ,
n →∞ n →∞
n  n k!
k = 0,1, 2, n
Possion定理
设 npn = λ > 0 , 则对固定的 k
n−k −λ λk
lim C p (1 − pn )
k
n
k
n =e
n →∞ k!
k = 0,1,2,

Poisson定理说明若X ~ B( n, p), 则当n 较大,


p 较小, 而 np = λ 适中, 则可以用近似公式
n−k λ −λ
k
C p (1 − p )
k
n
k
≈e , k = 0,1,2,
k!
利用Poisson定理再求前例中 (2)

解 令X 表示命中次数, 则
X ~ B( 5000,0.001 )
令 λ = np = 5
−5
P ( X ≥ 1) ≈ 1 − e = 0.9933.

此结果也可直接查 P.299 泊松分布表得到,它与


用二项分布算得的结果0.9934仅相差万分之一.
在实际计算中,当 n ³ 20, p £0.05时,可用上述公式近似计
算;而当n ³ 100, np £10时, 精度更好

按二项分布 按Possion
公式
n=10 n=20 n=40 n=100 l=np=1
k
p=0.1 p=0.05 p=0.025 p=0.01

0 0.349 0.358 0.369 0.366 0.368


1 0.305 0.377 0.372 0.370 0.368
2 0.194 0.189 0.186 0.185 0.184
3 0.057 0.060 0.060 0.061 0.061
4 0.011 0.013 0.014 0.015 0.015
在Poisson 定理中,

−λ λk
e >0
k!

λ k ∞
λ
k

∑e −λ

k!
=e −λ
∑ k!
k =0 k =0

 λ λ  2 3
= e 1 + λ + + +  
−λ

 2! 3! 
−λ λ
= e ⋅e =1
由此产生了一种离散型随机变量的概率分布
— Poisson 分布
(3) Poisson 分布
−λ λk
若 P( X = k ) = e , k = 0,1,2,
k!
其中 λ > 0 是常数,则称 X 服从参数为 λ
的Poisson 分布. 记作𝑿𝑿~𝑷𝑷(𝝀𝝀)

注: −λ λ k
e >0
k!
+∞
λk
∑ e
k =0
−λ

k!
=1
例 设有同类型设备90台,每台工作相互独立,每台设备发
生故障的概率都是0.01. 在通常情况下,一台设备发生故
障可由一个人独立维修,每人同时也只能维修一台设备.
(1)问至少要配备多少维修工人,才能保证当设备发生故障
时不能及时维修的概率小于0.01?
(2)问3个人共同负责90台还是3个人各自独立负责30台设备
发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人
设 X 为90 台设备中发生故障的台数
X ~ B( 90, 0.01)
90
P( X > N ) =∑ C (0.01) (0.99)
k= N +1
k
90
k 90− k

令 λ =90 × 0.01 =0.9


90 k
0.9
则 P( X > N ) ≈

k= N +1
e −0.9

k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
k= N +1 k ! k= 91 k!
∞ k
0.9
≈ ∑
k= N +1
e −0.9
k!
< 0.01

查附表2得 N = 4
(2) 三个人共同负责90台设备发生故障不能及时维修的概率为
90 k
0.9
P ( X > 3) ≈ ∑ e −0.9
k =4 k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
= k 4= k ! k 91 k!
∞ k
0.9
≈∑ e −0.9
k =4 k!
= 0.013459
设30台设备中发生故障的台数为 Y ~ B ( 30,0.01)
设每个人独立负责30台设备,第 i 个人负责的30台设备发生故障不
能及时维修为事件 Ai
∞ k
则 0.3
P ( Ai )= P (Y ≥ 2) ≈ ∑ e −0.3

k =2 k!
= 0.0369 i = 1, 2, 3
三个人各独立负责30台设备发生故障不能及时维修为事件
A1 ∪ A2 ∪ A3
3
P ( A1 ∪ A2 ∪ A3 ) =1 − ∏ P ( Ai )
i =1
=1 − (1 − 0.0369) ≈ 0.1067 > 0.0369
3

故 三个人共同负责90 台设备好!
注:泊松分布(Poisson distribution),由法国数学家
西莫恩·德尼·泊松(Siméon-Denis Poisson)提出,
并由此命名.

在实际问题中,当一个随机事件,以固定的平均瞬时速率
λ(或称密度)随机且独立地出现时,那么这个事件在单
位时间(面积或体积)内出现的次数或个数的概率分布就
服从、或者说可以近似地服从泊松分布.
例如:

1. 保险公司某段时间某个保险品种所遇到的索赔
次数;
2. 某电话交换台一段时间收到的呼叫次数;
3. 一段时间内来到某公共汽车站的乘客数;
4. 一段时间内某放射性物质发射出的粒子;
5. 显微镜下某区域中的白血球数目等等.
例 设我国某地区每年新生儿染色体异常发生数𝑿𝑿(例)(𝑿𝑿 =
𝟎𝟎, 𝟏𝟏, 𝟐𝟐, ⋯),据以往经验𝑿𝑿服从参数𝝀𝝀 = 𝟏𝟏的Poisson分布,请写出
新生儿染色体异常例数的概率分布;并求该地区没有新生儿发生染
色体异常的概率;以及多于一例新生儿发生染色体异常的概率.

解:由题设知新生儿染色体异常数的概率分布:
1 −1
P( X= k=
) e , =
k 0,1, 2,
k!
该地区没有新生儿发生染色体异常的概率为

−1
e
P( X= 0)= = e−1 ≈ 0.36788
0!
该地区多于一个新生儿发生染色体异常的概率
+∞
P( X =
> 1) P(
= X k)
k =2
+∞
= ∑=
P( X
k =2
k)

=1 − P( X =
0) − P( X =
1)
e −1 e −1
= 1− −
0! 1!
≈ 0.264
例 设某电子产品销售商承销某品牌笔记本电脑,大数据预测该品牌
笔记本电脑每周的销售量𝑿𝑿~𝑷𝑷(𝝀𝝀) . 三八妇女节期间该销售商希望
给女性顾客提供一周折扣优惠,根据调查顾客中女性顾客的比例为
𝒑𝒑 . 请给出本周女性顾客销售量𝒀𝒀的概率分布.
λ k
解:由已知条件知 ) e−λ , =
P( X= k= k 0,1, 2,
k!

假设本周女性顾客销售量为𝒎𝒎,则要求的问题即为

P(Y =
mX= Ckm p m (1 − p ) k − m , m =
k) = 0,1, 2, , k

而 (Y =⊂
m)  ( X =
k ), m =
0,1, 2, ( X =∩
k) (X =
l) =
∅, k ≠ l
k =m
由全概率公式

P(=
Y m=
) ∑ P( X=
k =0
k )P(= = k)
Y mX
𝑘𝑘!
𝐶𝐶𝑘𝑘𝑚𝑚 =
=
又𝒎𝒎 > 𝒌𝒌时 P (Y m=
X k )=0, 所以 𝑚𝑚! 𝑘𝑘 − 𝑚𝑚 !
λ ∞
k
P(= ) ∑ e − λ Ckm p m (1 − p ) k − m
Y m=
k =m k!

(λ p ) m ∞
λ k −m
= e−λ
m!

k = m ( k − m)!
(1 − p ) k −m

−λ p ( λ p ) m
=e , m = 0,1, 2,
m!
即𝒀𝒀~𝑷𝑷 𝝀𝝀𝝀𝝀 .
2.3 连续型随机变量及其概率分布
案例 某制造商为给其所生产的某种型号的晶体管打寿命标签,对该
型号的晶体管的使用寿命进行了抽查,下表是10000只的使用寿命
𝑿𝑿(千时:kh)的抽查资料:
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761

能否根据这个抽查资料刻画随机变量𝑿𝑿的分布呢,如何刻画?

频率直方图,频率直方图是统计学中表示频率分布的图形,该图形在
直角坐标系中,用横轴表示随机变量的取值,横轴上的每个小区间对
应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,
并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图.
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761

c
 2 , x >1
f ( x) =  x
 0, 其他

因此,从这次的抽查结果,我们认为这批晶体管的寿命的可以用这个
函数、或者近似可以用这个函数刻画概率分布.
定义 设 X 是一随机变量, F ( x )是它的分布函数,若存在
一个非负可积函数 f ( x ), 使得
x
F ( x) = ∫−∞ f (t ) dt − ∞ < x < +∞

则称 X 是连续型随机变量,f ( x )是它的概率密度函数,
简称为密度函数或概率密度.

注:连续型随机变量的分布函数连续.
分布函数F ( x )与密度函数 f ( x )的几何意义

f ( x)

0.08 y = f (x)
F(x) 0.06

0.04

0.02

-10 -5 5

x x
概率密度函数 f ( x )的性质
1、 f ( x) ≥ 0
+∞
2、 ∫−∞ f ( x) d x = F (+∞) = 1
常利用这两个性质检验一个函数能否作为连续性
随机变量的密度函数,或求其中的未知参数

3、 在 f ( x ) 的连续点处, f ( x) = F ′( x)

f ( x ) 描述了X 在 x 附近单位长度的区间内
取值的概率
f ( x0 ) ∆ x ≈ P ( x0 < X ≤ x0 + ∆ x )
注:对于连续型随机变量X , P ( X = a) = 0
(这里 a 可以是随机变量 X 的一个可能的取值)

事实上 ( X = a ) ⊂ (a − ∆x < X ≤ a ) ∆x > 0


0 ≤ P ( X = a ) ≤ P (a − ∆x < X ≤ a ) = ∫
a

a − ∆x
f ( x )d x
a
0 ≤ P ( X = a ) ≤ lim ∫
∆x→+0 a − ∆x
f ( x ) d x =0
P( X = a) = 0

命题 连续型随机变量取任一常数的概率为零
强调 概率为0 (1) 的事件未必不发生(发生)
对于连续型随机变量X
P ( a < X ≤ b) = P ( a ≤ X ≤ b)
= P ( a < X < b)
= P ( a ≤ X < b)
f ( x)
b
= ∫ f ( x)d x = F (b) − F (a)
0.08
a
0.06

0.04

0.02

-10 -5 5

a b x
P ( X ≤ b) = P ( X < b) = F (b)

P( X > a) = P( X ≥ a) = 1 − F (a)

f ( x)

0.08

0.06

0.04

0.02

-10 -5 5

a x
例 设随机变量 X 具有概率密度函数
 Ae −3 x , x ≥ 0; 试确定常数A,
f ( x) = 
 0 , x < 0 . 以及 X 的分布函数.
+∞ +∞ 1
解 由 1 = ∫− ∞ f ( x )dx = ∫0 Ae −3 x
dx = A,
3
 3e − 3 x , x ≥ 0;
知A=3,即 f ( x ) = 
 0, x < 0.
而 X 的分布函数为
1 − e −3 x , x ≥ 0;
F ( x) = ∫
x
f ( t )dt = 
−∞
 0, x < 0.
例 有一批晶体管,已知每只的使用寿命 X 为
连续型随机变量,其概率密度函数为
 c
 x2 , x > 1000
f ( x) =  ( c 为常数)

 0, 其他
(1) 求常数 c.
(2) 已知一只收音机上装有3只这样的晶体管,每
只晶体管能否正常工作相互独立,求在使用的最初
1500小时三只晶体管中损坏的只数所服从的分布.
(3) 这样的晶体管, 使用的最初1500小时只有一个
损坏的概率.
+∞ +∞c 令
解 (1)
∫−∞=
f ( x )d x ∫=
1000 x 2
dx 1
c = 1000
(2) 设事件 A 表示一只晶体管的寿命小于
1500小时
P ( A) = P (0 ≤ X < 1500)
1500 1000 1
= ∫= 2
dx
1000 x 3
设在使用的最初1500小时三只晶体管中
 1
损坏的只数为 Y ~ B  3, 
 3
2
 1  2  4
(3) P (Y= 1)= C   =
1
3
 3  3  9
例 一个靶子是半径为2米的圆盘,设击中靶上
任一同心圆盘上的点的概率与该圆盘的面积成
正比,并设射击都能中靶,以 X 表示弹着点与
圆心的距离,试求随机变量 X 的分布函数.
解 : 若x < 0, 则( X ≤ x)是不可能事件, 于是

F ( x) = P( X ≤ x) = 0

若0 ≤ x < 2,由题意, P(0 ≤ X < x) =kx 2 , k是某一常数.

取x = 2, 有
1
P(0 ≤ X < 2) = k 2 = 1, k =
2

4
x2
即P(0 ≤ X < x) = , 于是
4
2
F ( x ) = P ( X ≤ x ) = P ( X < 0) + P ( 0 ≤ X ≤ x ) = x
4
若x ≥ 2,由题意, 是必然事件, 于是

F ( x) = P( X ≤ x) = 1

综上所述,随机变量 X 的分布函数为

0 x<0
 x 2
F ( x) =  0≤ x<2
4
 1 x≥2
常见的连续性随机变量的分布
(1) 均匀分布
 1
b − a , a < x < b
若 X 的密度函数为 f ( x) = 

 0, 其他
则称 X 服从区间( a , b)上的均匀分布

记作 X ~ U ( a, b)
 0, x < a,

x − a
X 的分布函数为 F ( x) =  , a ≤ x < b,
b − a
 1 x≥b
f ( x)
1
。 b−a 。

a b x

F( x)
1

a b x
∀(c, d ) ⊂ (a, b)
d 1 d −c
P (c < X < d ) = ∫ dx =
c b−a b−a
即 X 的取值在(a,b)内任何长为 d – c 的小区间
的概率与小区间的位置无关, 只与其长度成正
比. 这正是几何概型的情形.
(2) 指数分布
若 X 的密度函数为

λ e − λ x , x ≥ 0
f ( x) =  λ > 0 为常数
 0, 其他

则称 X 服从 参数为λ的指数分布

记作 X ~ Exp (λ )

X 的分布函数为  0, x≤0
F ( x) =  −λ x
1 − e , x>0
f ( x)
λ

0 x

F( x)
1

0 x
例 假定一大型设备在任何长为t的时间内发生故
障的次数X(t)服从参数为 λ t 的泊松分布.求:
(1)相继两次故障时间间隔T的概率分布;
(2)设备已经无故障运行8小时的情况下,再
无故障运行10小时的概率.
解 (1) FT=
( t ) P (T ≤ t )
 0, t<0
=
1 − P (T > t ), t > 0
0 −λt
(λ t ) e −λt
P (T = =
> t ) P ( N= ( t ) 0) = e
0!
 0, t<0  0, t<0
F (t ) =  −λt
f (t ) =  − λt
1 − e , t > 0 λ e , t > 0
即 T ~ E (λ )

P (T > 18) 1
(2) P (T > 18 T > 8) = = = e −10 λ
− F (18)
P (T > 8) 1 − F (8)
指数分布具有无记忆性:

X ~ Exp (λ ), 则
P( X > s + t | X > s=
) P( X > t )
例 (常识)
(0,t) 内的保险公司索赔次数 N(t) 服从poisson分布
即 N(t) ~P(λt);
其两次索赔之间的时间间隔服从指数分布。

例 (常识)
(0,t)内某柜台需要服务的顾客数N(t)服从poisson分布
即 N(t) ~P(λt);
先后两个顾客到达柜台的时间间隔服从指数分布。
例 某美容厅顾客到达后需要等候的服务时间服
从参数为0.1 的指数分布,若顾客等候时间超过
X
20分钟就会离开.
(1)请给出该美容厅在营业时间内50个顾客中
因等候时间超过20分钟,没有等到服务而离开人
数的分布律;
(2)50个顾客中没有等到服务而离开的人数大
于1的概率.
解 设 Y 表示50个顾客中因等候时间超过20分钟,没有
等到服务而离开的人数,根据题意每个顾客等待时间
X 超过20分钟的概率为
+∞

−0.1 x −2
P (=
X ≥ 20) =
0.1e dx e
10

−2
Y 可以看成是 p = e 的50重Bernoulli试验中顾客
离开发生次数,因此
−2
Y ~ B (50, e )
−2 50 − k
P(Y =
k) =
C p (1 − e )
k
50
k
,k =
0,1, 2, ,50
(2)没有等到服务而离开的次数大于1的概率为

P (Y > 1) =
1 − p (Y =−
0) p (Y =
1)
=1 − (1 − e −2 )50 − 50e −2 (1 − e −2 ) 49
(3) 正态分布(Gauss 分布)
若X 的密度函数为
( x− µ )2
1 −
f ( x) = e 2σ 2
− ∞ < x < +∞
2π σ
µ ,σ 为常数,σ > 0

则称 X 服从参数为 m , s 2 的正态分布

记作 X ~ N ( m , s 2 )
N (-3 , 1.2 )
0.3
0.25
0.2
0.15
0.1
0.05

-6 -5 -4 -3 -2 -1

µ = −3
f (x) 的性质:

 图形关于直线 x = µ 对称: f (µ + x) = f (µ - x)
在 x = µ 时, f (x) 取得最大值

1
2π σ
在 x = µ±σ 时, 曲线 y = f (x) 在对应的点处有
拐点

曲线 y = f (x) 以 x 轴为渐近线

曲线 y = f (x) 的图形呈单峰状
P( X ≤ µ ) = F ( µ )
= 1 − F ( µ ) = P( X > µ )
1
=
2
0.3
0.25
0.2
0.15
0.1
0.05

-6 -5 -4 -3 -2 -1
 f (x) 的两个参数:
µ — 位置参数
即固定 σ , 对于不同的 µ , 对应的 f (x)
的形状不变化,只是位置不同
σ — 形状参数
固定 µ ,对于不同的σ ,f ( x) 的形状不同.
1 1
若 σ1< σ2 则 2π σ > 2π σ 2 前者取 µ
1

附近值的概率更大. x = µ ± σ1 所对应的拐点
比x = µ ± σ2 所对应的拐点更靠近直线 x = µ
Show[fn1,fn3]
σ小
0.5

0.4
σ大 0.3

0.2

0.1

-6 -5 -4 -3 -2 -1

几何意义 σ 大小与曲线陡峭程度成反比
数据意义 σ 大小与数据分散程度成正比
一种重要的正态分布:N (0,1) — 标准正态分布
标准正态分布的计算:
如果随机变量 X ~ N ( 0, 1) ,则其密度函数为
x2
1 −
=ϕ ( x) e 2
( −∞, +∞ )

其分布函数为
x x t2
1 −
Φ ( x)
= ϕ ( t ) dt
∫= ∫e 2
dt ( −∞ < x < +∞ )
−∞ 2π −∞

教科书上都附有标准正态分布表,由此可得Φ ( x)值.
Φ (0) = 0.5 Φ (− x) = 1 − Φ ( x)
P (| X |< a ) = 2Φ (a ) − 1
0.4

0.3

0.2

0.1

-3 -2 -1 1 2 3

Φ (0) = 0.5
Φ (− x) = 1 − Φ ( x)
0.4

0.3

0.2

0.1

-3 -2 -x -1 1 x 2 3

P (| X |< a ) = 2Φ (a ) − 1
对一般的正态分布 :X ~ N ( µ ,σ 2)
( t − µ )2
1 x −
其分布函数 F ( x) = ∫
2π σ −∞
e 2σ 2
d t
t −µ  x−µ
作变量代换 s = F ( x) = Φ  
σ  σ 
P(a < X ≤ b)= F (b) − F (a )
b−µ  a−µ 
= Φ −Φ 
 σ   σ 
P( X > a) = 1 − F (a)
 a−µ
= 1−Φ  
 σ 
定理 若X ~ N ( µ , σ ), 则
2

X −µ
~ N (0,1).
σ
例 假定某人群血液中总胆固醇含量𝑿𝑿~𝑵𝑵(𝟒𝟒. 𝟐𝟐, 𝟎𝟎. 𝟖𝟖𝟐𝟐 )(𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦/𝐋𝐋) ,如
果总胆固醇超过5.6被认为是偏高的,求总胆固醇偏高的概率.

解 P( X > 5.6) =
1 − P( X ≤ 5.6)
 5.6 − 4.2 
= 1− Φ  
 0.8 
= 1 − Φ (1.75)
= 1 − 0.95994 = 0.04006
例 假设公共汽车车门的高度是按男子与车门顶碰头机会在1%以
下来设计的,假设成年男子身高𝑿𝑿~𝑵𝑵(𝟏𝟏𝟏𝟏𝟏𝟏, 𝟔𝟔𝟐𝟐 )(𝒄𝒄𝒄𝒄),问如何设计
车门的高度?

解 设车门的高度为𝒉𝒉(𝒄𝒄𝒄𝒄),按设计要求解满足𝑷𝑷(𝑿𝑿 ≥ 𝒉𝒉) ≤ 𝟎𝟎. 𝟎𝟎𝟎𝟎


或𝑷𝑷(𝑿𝑿 ≤ 𝒉𝒉) ≥ 𝟎𝟎. 𝟗𝟗𝟗𝟗的最小值𝒉𝒉.
𝒉𝒉 − 𝟏𝟏𝟏𝟏𝟏𝟏
𝑷𝑷 𝑿𝑿 ≤ 𝒉𝒉 = 𝚽𝚽 ≥ 𝟎𝟎. 𝟗𝟗𝟗𝟗
𝟔𝟔
查表得𝚽𝚽 𝟐𝟐. 𝟑𝟑𝟑𝟑 = 𝟎𝟎. 𝟗𝟗𝟗𝟗𝟗𝟗𝟗𝟗 > 𝟎𝟎. 𝟗𝟗𝟗𝟗,所以取

𝒉𝒉 − 𝟏𝟏𝟏𝟏𝟏𝟏
= 𝟐𝟐. 𝟑𝟑𝟑𝟑, 解得 𝒉𝒉 ≈ 𝟏𝟏𝟏𝟏𝟏𝟏
𝟔𝟔
例 已知 X ~ N (2,σ ) 且 P( 2 < X < 4 ) = 0.3,
2

求 P ( X < 0 ).
 0 − 2  2
解一 P ( X < 0) = Φ   = 1−Φ  
 σ  σ 
 4 − 2  2 − 2
P ( 2 < X < 4) = Φ   −Φ  
 σ   σ 
 2
= Φ   − Φ (0) = 0.3
σ 
 2
Φ   = 0.8
σ 
P ( X < 0) = 0.2
解二 图解法
0.2
0.3
0.15

0.1

0.05
0.2

-2 2 4 6

由图
P ( X < 0) = 0.2
例 3σ 原则
设 X ~ N ( µ , σ 2), 求 P(| X − µ |< 3σ )
解 P(| X − µ |< 3σ ) = P( µ − 3σ < X < µ + 3σ )
 µ + 3σ − µ   µ − 3σ − µ 
=Φ  −Φ  
 σ   σ 
= Φ (3) − Φ (− 3)
= 2Φ (3) − 1 = 2 × 0.9987 − 1 = 0.9974
一次试验中, X 落入区间( µ - 3σ , µ +3σ )
的概率为 0.9974, 而超出此区间可能性很小
由3σ 原则知,
当 a < −3 时 Φ (a ) ≈ 0 , b > 3 时 Φ (b) ≈ 1
例 设测量的误差 X ~ N(7.5, 100)(单位:米), 问要进行多少次
独立测量,才能使至少有一次误差的绝对值不超过10米的概
率大于0.9 ?
 10 − 7.5   − 10 − 7.5 
解 P(| X |≤ 10) = Φ   −Φ  
 10   10 
= Φ (0.25) − Φ (− 1.75)
= Φ (0.25) − [1 − Φ (1.75)]
= 0.5586
设 A 表示进行 n 次独立测量至少有一次误差的绝对值不超过10米
P ( A) = 1 − (1 − 0.5586) n > 0.9 n > 3
所以至少要进行 4 次独立测量才能满足要求.

You might also like