Professional Documents
Culture Documents
案例1 某线上订餐网站,希望对平台上注册的饭店建立评价机制,
以调查顾客对饭店的服务质量、菜品质量、价格、环境等综合评价.
目前平台对饭店的综合评价设有“非常差、差、一般、好,非常好”
五个等级,显然这不足以获得量化评价效果,该如何为平台设计一种
量化评价方案呢?
解:这个问题对应的样本空间为:
Ω={“非常差”,“差”,“一般”,“好”,“非常好”},
0 2 3 4 5
样本空间中的样本点和实数显然可以建立下面的一个对应关系:
0 ω =“非常差”
2 ω =“差”
X (ω ) = 3 ω =“一般”
4 ω =“好”
5 ω =“非常好”
为了更好的揭示随机现象的规律性并利用数学工具描述
其规律,引入随机变量来描述随机试验的不同结果.
2.1 随机变量及其分布函数
定义 设 W 是随机试验E的样本空间, 若
按一定法则
∀ω ∈ Ω ∃ 实数 X (ω )
则称W上的单值实值函数X (ω)为随机变量.
随机变量一般用大写字母 X, Y , Z , ¼表示,
或者用带下标的大写字母𝑿𝑿𝟏𝟏 , 𝑿𝑿𝟐𝟐 , 𝒀𝒀𝟏𝟏 , 𝒀𝒀𝟐𝟐 , ⋯表示
随机变量是 Ω → R 上的映射,
此映射具有如下特点
定义域 事件域 W
随机性 随机变量 X 的可能取值不止一
个, 试验前只能预知它可能的取值,但不能
预知取哪个值
概率特性 X 以一定的概率取某个值
例 1. 𝑿𝑿𝟏𝟏 表示某超市在9:00~10:00使用支付宝付款的人数;
2. 𝑿𝑿𝟐𝟐 表示某城市的每周发生交通事故数;
3. 𝑿𝑿𝟑𝟑 表示某高校大一学生晚上的深度睡眠时间;
4. 𝑿𝑿𝟒𝟒 表示某地区人的寿命
注:随机事件可用随机变量的等式或不等式表达
各随机变量之间可能有一定的关系, 也
可能没有关系—— 即 相互独立
离散型
随机变量分类
非离散型
其中一种重要的类型为
连续型随机变量
◇ 任何随机现象可
引入随机变量 被随机变量描述
重要意义 ◇ 借助微积分方法
进一步讨论
随机变量的分布函数
定义 设X 为随机变量,x 是任意实数,称函数
F ( x) = P( X ≤ x), − ∞ < x < +∞
为 X 的分布函数,记为𝑭𝑭(𝒙𝒙).有时候为强调
对随机变量X的依赖性,也可表示为𝑭𝑭𝑿𝑿 (𝒙𝒙).
案例2 (续案例 1) 假设平台根据目前已有的数据,对某饭店综合
评价的比例是非常差10%、差10%、一般20%、好50%、非常好
10%. 按照案例1的各级别的得分,求该饭店综合评价得分𝑿𝑿的分
布函数.
解:由上述给出的评价结果,该饭店综合评价得分𝑿𝑿的概率如下
𝑃𝑃 𝑋𝑋 = 0 = 0.1, 𝑃𝑃 𝑋𝑋 = 2 = 0.1, 𝑃𝑃 𝑋𝑋 = 3 = 0.2,
𝑃𝑃 𝑋𝑋 = 4 = 0.5, 𝑃𝑃 𝑋𝑋 = 5 = 0.1
则𝑿𝑿的分布函数为
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 )
0 2 3 4 5 𝑥𝑥
即,𝑿𝑿的分布函数为
0 𝑥𝑥 < 0
𝑃𝑃(𝑋𝑋 = 0) = 0.1 0 ≤ 𝑥𝑥 < 2
𝑃𝑃(𝑋𝑋 = 0) + 𝑃𝑃(𝑋𝑋 = 2) = 0.2 2 ≤ 𝑥𝑥 < 3
𝐹𝐹(𝑥𝑥) = 𝑃𝑃(𝑋𝑋 ≤ 𝑥𝑥 ) =
0.4 3 ≤ 𝑥𝑥 < 4
0.9 4 ≤ 𝑥𝑥 < 5
1 𝑥𝑥 ≥ 5
分布函数的性质
0 ≤ F ( x) ≤ 1 且 lim F ( x) = 1, lim F ( x) = 0
x→+∞ x→−∞
F ( x ) 单调不减,即 ∀ x1 < x2 , F ( x1 ) ≤ F ( x2 )
F ( x ) 右连续,即 lim F (t ) = F ( x)
t → x+0
(或者𝑭𝑭 𝒙𝒙 + 𝟎𝟎 = 𝑭𝑭(𝒙𝒙))
分布函数在概率计算中的用途
事实上,如果一个随机变量的分布函数已知时,可以由分布
函数计算该随机变量确定的任何随机事件的概率,例如,
P ( a < X ≤ b) = P ( X ≤ b) − P ( X ≤ a )
= F (b) − F (a)
(
] ]
a b 𝒙𝒙
P ( X > a ) =−
1 P ( X ≤ a ) =−
1 F (a)
= x0=
P( X ) lim+ P( x0 − ∆x < X ≤ x0 )
∆x → 0
= lim+ ( F ( x0 ) − F ( x0 − ∆x)) = F ( x0 ) − F ( x0 − 0)
∆x → 0
利用这几个表达式我们可以用分布函数计算随机变量确定的
任何随机事件的概率.
P ( a ≤ X ≤ b) = F (b) − F (a − 0)
请
填 P ( a < X < b) = F (b − 0) − F (a)
空 P(a ≤ X < b) = F (b − 0) − F (a − 0)
例 判断下面的一个反正切函数F(x)
能否成为某随机变量X的分布函数?
1 π
=F ( x) arctan x + , x ∈ (−∞, +∞)
π 2
2.2 离散型随机变量及其概率分布
离散随机变量及分布律
定义 若随机变量 X 的可能取值是有限多个或无穷
可列多个,则称 X 为离散型随机变量
描述离散型随机变量的概率特性常用它的概率分布或
分布律,即
P( X = xk ) = pk , k = 1,2,
或
X x1 x2 … xK …
P p1 p2 … pk …
或
x1 x2 xk
X ~
p1 p2 pk
概率分布的性质
pk ≥ 0, k = 1,2, 非负性
∞
∑ pk = 1 规范性
k =1
例 设一汽车在开往目的地的途中需经过 4 盏信号灯,每盏
信号灯独立地以概率 p 允许汽车通过。令 X 表示首次停下
时已通过的信号灯的盏数,求 X 的概率分布与 p = 0.4 时
的分布函数。
出发地 目的地
解 P ( X ==
k ) p k (1 − p ), k =
0,1, 2, 3
P ( X= 4)
= p4 , k= 4
当 p = 0.4
k 0 1 2 3 4
0, x<0
0.6, 0≤ x<1
0.6 + 0.6 × 0.4, 1≤ x < 2
F ( x) =
0.6 + 0.6 × 0.4 + 0.6 × 0.42 , 2≤ x< 3
0.6(1 + 0.4 + 0.42 + 0.43 ) 3≤ x<4
1 x≥4
F( x)
1 • o•
• o
• o
0.6 • o
•o • • • •
0 1 2 3 4 x
离散随机变量及分布函数
F ( x ) = P ( X ≤ x ) = P ( ( X = xk ) )
xk ≤ x
= ∑ P( X = x
xk ≤ x
k )= ∑p
xk ≤ x
k
pk = P( X = xk ) = F ( xk ) − F ( xk −1 )
其中 xk −1 < xk .
F(x) 是分段阶梯函数, 在 X 的可能取值 xk 处发生间断. 间
断点为第一类跳跃间断点,在间断点处有跃度 pk
注:对离散型随机变量用概率分布(或分布律)比用分布函数计算这
些概率更方便,所以描述离散性随机变量通常用概率分布(或分布
律)
例 对一目标进行射击,且各次射击相互独立,若每次击中
目标的概率为p (0 < p < 1), 一次一次地射击直到击中
目标为止.求所需射击次数 X 的概率分布.
k −1
P( X ==
k) p(1 − p )
k = 1, 2,
注:此分布称为几何分布
例 一门大炮对目标进行射击,假定此目标必须被击中r 次
才能被摧毁.若每次击中目标的概率为p (0 < p < 1),且各次射
击相互独立,一次一次地射击直到摧毁目标为止.求所需射
击次数 X 的概率分布.
解 P ( X = k ) = P ( 前 k –1次击中 r – 1次,
第 k 次击中目标)
= C kr −−11 p r −1 (1 − p )k − r ⋅ p
= C kr −−11 p r (1 − p )k − r
=
k r , r + 1,
注:此分布称为帕斯卡分布
常见离散r.v.的分布
(1) 0 – 1 分布
X = xk 1 0 0<p<1
Pk p 1-p
1− k
或 P( X = k ) = p (1 − p) , k = 0, 1
k
应用 凡试验只有两个结果, 常用0 – 1
场合 分布描述, 如产品是否合格、人
口性别统计、系统是否正常、电力消耗是否
超标等等.
(2) 二项分布-Bernoulli概型
伯努利试验概型
n 重伯努利 (Bernoulli) 试验概型:
试验可重复 n 次
每次试验只有两个可能的结果:
且 P( A) = p, 0 < p < 1
每次试验的结果与其他次试验无关——
称为这 n 次试验是相互独立的
n重Bernoulli试验中事件
A 出现 k 次的概率 记为
Pn (k )
n 重Bernoulli 试验中, X 是事件A 在 n 次试
验中发生的次数 , P (A) = p ,若
Pn (k ) = P ( X = k ) = Cnk p k (1 − p ) n − k , k = 0,1, , n
则称 X 服从参数为n, p 的二项分布,记作
X ~ B ( n, p )
P
P8 (2) = P8 (3) = 0.273
0.273•
( n + 1)p =3
• • • • • • • • •
1 2 3 4 5 6 7 8 x
0
设 X ~ B ( 20,0.2)
0 1 2 3 4 5 6 7 8 9 10 11 ~ 20
.01 .06 .14 .21 .22 .18 .11 .06 .02 .01 .002 < .001
• • • •• •• • • • • • • • • • • • • • •
x
0 1 2 3 4 5 6 7 8 9 10 20
二项分布中最可能的成功次数的定义与推导
若 P( X =
k ) ≥ P( X =j ), j =X 可取的一切值
则称 k 为最可能出现的次数
n−k
记 pk = P( X = k ) = C p (1 − p)
k
n
k
, k = 0,1,, n
pk −1 (1 − p )k
= ≤1
pk p (n − k + 1)
pk (1 − p)( k + 1)
= ≥1
pk +1 p(n − k )
(n + 1) p − 1 ≤ k ≤ (n + 1) p
当( n + 1) p = 整数时,在 k = ( n + 1) p
与 ( n + 1) p – 1 处的概率取得最大值
当( n + 1) p ¹ 整数时, 在 k = [( n + 1) p ]
处的概率取得最大值
求 (1) 最可能命中次数及相应的概率;
P5000 (5) = C 5
5000
5
(0.001) (0.999) 4995
≈ 0.1756
(2) 令X 表示命中次数,则 X ~ B(5000,0.001)
P( X ≥ 1) =1 − P( X < 1) =1 − P( X =0)
= 1− C 0
5000
0
(0.001) (0.999) 5000
= 0.9934.
问题 如何计算 P ( X ≥ 2000) ?
例 某高校教育超市每天12:00-13:00期间某种盒装饮料需求
量的概率分布问题.
解析(1)如果我们把12:00-13:00这段时间等分为100个时间区间,
第一,在每小段时间内需求一盒的概率为
λ
(λ 为常数,
0 < λ < 20)
100
需求是零盒的概率为 λ
1−
100
第二,12:00-13:00期间该盒装饮料的需求量X服从二项分布,即
λ
X ~ B (100, )
100
(2)类似(1),如果我们把12:00-13:00这段时间等分为 n (n ≥ 100)
个时间区间,则12:00-13:00间该盒装饮料的需求量Xn服从
λ
X n ~ B (n, )
n
(3)可以证明(2)中随机变量概率分布的极限,即,当 n → +∞ 时,
n−k
λ λ λ
k k
−λ
lim P( X n == k
k ) lim C
n 1 − = e ,
n →∞ n →∞
n n k!
k = 0,1, 2, n
Possion定理
设 npn = λ > 0 , 则对固定的 k
n−k −λ λk
lim C p (1 − pn )
k
n
k
n =e
n →∞ k!
k = 0,1,2,
解 令X 表示命中次数, 则
X ~ B( 5000,0.001 )
令 λ = np = 5
−5
P ( X ≥ 1) ≈ 1 − e = 0.9933.
按二项分布 按Possion
公式
n=10 n=20 n=40 n=100 l=np=1
k
p=0.1 p=0.05 p=0.025 p=0.01
−λ λk
e >0
k!
∞
λ k ∞
λ
k
∑e −λ
k!
=e −λ
∑ k!
k =0 k =0
λ λ 2 3
= e 1 + λ + + +
−λ
2! 3!
−λ λ
= e ⋅e =1
由此产生了一种离散型随机变量的概率分布
— Poisson 分布
(3) Poisson 分布
−λ λk
若 P( X = k ) = e , k = 0,1,2,
k!
其中 λ > 0 是常数,则称 X 服从参数为 λ
的Poisson 分布. 记作𝑿𝑿~𝑷𝑷(𝝀𝝀)
注: −λ λ k
e >0
k!
+∞
λk
∑ e
k =0
−λ
k!
=1
例 设有同类型设备90台,每台工作相互独立,每台设备发
生故障的概率都是0.01. 在通常情况下,一台设备发生故
障可由一个人独立维修,每人同时也只能维修一台设备.
(1)问至少要配备多少维修工人,才能保证当设备发生故障
时不能及时维修的概率小于0.01?
(2)问3个人共同负责90台还是3个人各自独立负责30台设备
发生故障不能及时维修的概率低?
解 (1) 设 需要配备 N 个维修工人
设 X 为90 台设备中发生故障的台数
X ~ B( 90, 0.01)
90
P( X > N ) =∑ C (0.01) (0.99)
k= N +1
k
90
k 90− k
k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
k= N +1 k ! k= 91 k!
∞ k
0.9
≈ ∑
k= N +1
e −0.9
k!
< 0.01
查附表2得 N = 4
(2) 三个人共同负责90台设备发生故障不能及时维修的概率为
90 k
0.9
P ( X > 3) ≈ ∑ e −0.9
k =4 k!
∞ k ∞ k
0.9 0.9
= ∑ e −0.9 − ∑ e −0.9
= k 4= k ! k 91 k!
∞ k
0.9
≈∑ e −0.9
k =4 k!
= 0.013459
设30台设备中发生故障的台数为 Y ~ B ( 30,0.01)
设每个人独立负责30台设备,第 i 个人负责的30台设备发生故障不
能及时维修为事件 Ai
∞ k
则 0.3
P ( Ai )= P (Y ≥ 2) ≈ ∑ e −0.3
k =2 k!
= 0.0369 i = 1, 2, 3
三个人各独立负责30台设备发生故障不能及时维修为事件
A1 ∪ A2 ∪ A3
3
P ( A1 ∪ A2 ∪ A3 ) =1 − ∏ P ( Ai )
i =1
=1 − (1 − 0.0369) ≈ 0.1067 > 0.0369
3
故 三个人共同负责90 台设备好!
注:泊松分布(Poisson distribution),由法国数学家
西莫恩·德尼·泊松(Siméon-Denis Poisson)提出,
并由此命名.
在实际问题中,当一个随机事件,以固定的平均瞬时速率
λ(或称密度)随机且独立地出现时,那么这个事件在单
位时间(面积或体积)内出现的次数或个数的概率分布就
服从、或者说可以近似地服从泊松分布.
例如:
1. 保险公司某段时间某个保险品种所遇到的索赔
次数;
2. 某电话交换台一段时间收到的呼叫次数;
3. 一段时间内来到某公共汽车站的乘客数;
4. 一段时间内某放射性物质发射出的粒子;
5. 显微镜下某区域中的白血球数目等等.
例 设我国某地区每年新生儿染色体异常发生数𝑿𝑿(例)(𝑿𝑿 =
𝟎𝟎, 𝟏𝟏, 𝟐𝟐, ⋯),据以往经验𝑿𝑿服从参数𝝀𝝀 = 𝟏𝟏的Poisson分布,请写出
新生儿染色体异常例数的概率分布;并求该地区没有新生儿发生染
色体异常的概率;以及多于一例新生儿发生染色体异常的概率.
解:由题设知新生儿染色体异常数的概率分布:
1 −1
P( X= k=
) e , =
k 0,1, 2,
k!
该地区没有新生儿发生染色体异常的概率为
−1
e
P( X= 0)= = e−1 ≈ 0.36788
0!
该地区多于一个新生儿发生染色体异常的概率
+∞
P( X =
> 1) P(
= X k)
k =2
+∞
= ∑=
P( X
k =2
k)
=1 − P( X =
0) − P( X =
1)
e −1 e −1
= 1− −
0! 1!
≈ 0.264
例 设某电子产品销售商承销某品牌笔记本电脑,大数据预测该品牌
笔记本电脑每周的销售量𝑿𝑿~𝑷𝑷(𝝀𝝀) . 三八妇女节期间该销售商希望
给女性顾客提供一周折扣优惠,根据调查顾客中女性顾客的比例为
𝒑𝒑 . 请给出本周女性顾客销售量𝒀𝒀的概率分布.
λ k
解:由已知条件知 ) e−λ , =
P( X= k= k 0,1, 2,
k!
假设本周女性顾客销售量为𝒎𝒎,则要求的问题即为
P(Y =
mX= Ckm p m (1 − p ) k − m , m =
k) = 0,1, 2, , k
∞
而 (Y =⊂
m) ( X =
k ), m =
0,1, 2, ( X =∩
k) (X =
l) =
∅, k ≠ l
k =m
由全概率公式
∞
P(=
Y m=
) ∑ P( X=
k =0
k )P(= = k)
Y mX
𝑘𝑘!
𝐶𝐶𝑘𝑘𝑚𝑚 =
=
又𝒎𝒎 > 𝒌𝒌时 P (Y m=
X k )=0, 所以 𝑚𝑚! 𝑘𝑘 − 𝑚𝑚 !
λ ∞
k
P(= ) ∑ e − λ Ckm p m (1 − p ) k − m
Y m=
k =m k!
(λ p ) m ∞
λ k −m
= e−λ
m!
∑
k = m ( k − m)!
(1 − p ) k −m
−λ p ( λ p ) m
=e , m = 0,1, 2,
m!
即𝒀𝒀~𝑷𝑷 𝝀𝝀𝝀𝝀 .
2.3 连续型随机变量及其概率分布
案例 某制造商为给其所生产的某种型号的晶体管打寿命标签,对该
型号的晶体管的使用寿命进行了抽查,下表是10000只的使用寿命
𝑿𝑿(千时:kh)的抽查资料:
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761
能否根据这个抽查资料刻画随机变量𝑿𝑿的分布呢,如何刻画?
频率直方图,频率直方图是统计学中表示频率分布的图形,该图形在
直角坐标系中,用横轴表示随机变量的取值,横轴上的每个小区间对
应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,
并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图.
寿命组段 1∼1.5 ∼2 ∼2.5 ∼3 ∼3.5 ∼4 ∼4.5 ∼5 ∼5.5 5.5∼
频数 3353 1667 1015 679 456 367 268 236 198 1761
c
2 , x >1
f ( x) = x
0, 其他
因此,从这次的抽查结果,我们认为这批晶体管的寿命的可以用这个
函数、或者近似可以用这个函数刻画概率分布.
定义 设 X 是一随机变量, F ( x )是它的分布函数,若存在
一个非负可积函数 f ( x ), 使得
x
F ( x) = ∫−∞ f (t ) dt − ∞ < x < +∞
则称 X 是连续型随机变量,f ( x )是它的概率密度函数,
简称为密度函数或概率密度.
注:连续型随机变量的分布函数连续.
分布函数F ( x )与密度函数 f ( x )的几何意义
f ( x)
0.08 y = f (x)
F(x) 0.06
0.04
0.02
-10 -5 5
x x
概率密度函数 f ( x )的性质
1、 f ( x) ≥ 0
+∞
2、 ∫−∞ f ( x) d x = F (+∞) = 1
常利用这两个性质检验一个函数能否作为连续性
随机变量的密度函数,或求其中的未知参数
3、 在 f ( x ) 的连续点处, f ( x) = F ′( x)
f ( x ) 描述了X 在 x 附近单位长度的区间内
取值的概率
f ( x0 ) ∆ x ≈ P ( x0 < X ≤ x0 + ∆ x )
注:对于连续型随机变量X , P ( X = a) = 0
(这里 a 可以是随机变量 X 的一个可能的取值)
a − ∆x
f ( x )d x
a
0 ≤ P ( X = a ) ≤ lim ∫
∆x→+0 a − ∆x
f ( x ) d x =0
P( X = a) = 0
命题 连续型随机变量取任一常数的概率为零
强调 概率为0 (1) 的事件未必不发生(发生)
对于连续型随机变量X
P ( a < X ≤ b) = P ( a ≤ X ≤ b)
= P ( a < X < b)
= P ( a ≤ X < b)
f ( x)
b
= ∫ f ( x)d x = F (b) − F (a)
0.08
a
0.06
0.04
0.02
-10 -5 5
a b x
P ( X ≤ b) = P ( X < b) = F (b)
P( X > a) = P( X ≥ a) = 1 − F (a)
f ( x)
0.08
0.06
0.04
0.02
-10 -5 5
a x
例 设随机变量 X 具有概率密度函数
Ae −3 x , x ≥ 0; 试确定常数A,
f ( x) =
0 , x < 0 . 以及 X 的分布函数.
+∞ +∞ 1
解 由 1 = ∫− ∞ f ( x )dx = ∫0 Ae −3 x
dx = A,
3
3e − 3 x , x ≥ 0;
知A=3,即 f ( x ) =
0, x < 0.
而 X 的分布函数为
1 − e −3 x , x ≥ 0;
F ( x) = ∫
x
f ( t )dt =
−∞
0, x < 0.
例 有一批晶体管,已知每只的使用寿命 X 为
连续型随机变量,其概率密度函数为
c
x2 , x > 1000
f ( x) = ( c 为常数)
0, 其他
(1) 求常数 c.
(2) 已知一只收音机上装有3只这样的晶体管,每
只晶体管能否正常工作相互独立,求在使用的最初
1500小时三只晶体管中损坏的只数所服从的分布.
(3) 这样的晶体管, 使用的最初1500小时只有一个
损坏的概率.
+∞ +∞c 令
解 (1)
∫−∞=
f ( x )d x ∫=
1000 x 2
dx 1
c = 1000
(2) 设事件 A 表示一只晶体管的寿命小于
1500小时
P ( A) = P (0 ≤ X < 1500)
1500 1000 1
= ∫= 2
dx
1000 x 3
设在使用的最初1500小时三只晶体管中
1
损坏的只数为 Y ~ B 3,
3
2
1 2 4
(3) P (Y= 1)= C =
1
3
3 3 9
例 一个靶子是半径为2米的圆盘,设击中靶上
任一同心圆盘上的点的概率与该圆盘的面积成
正比,并设射击都能中靶,以 X 表示弹着点与
圆心的距离,试求随机变量 X 的分布函数.
解 : 若x < 0, 则( X ≤ x)是不可能事件, 于是
F ( x) = P( X ≤ x) = 0
取x = 2, 有
1
P(0 ≤ X < 2) = k 2 = 1, k =
2
4
x2
即P(0 ≤ X < x) = , 于是
4
2
F ( x ) = P ( X ≤ x ) = P ( X < 0) + P ( 0 ≤ X ≤ x ) = x
4
若x ≥ 2,由题意, 是必然事件, 于是
F ( x) = P( X ≤ x) = 1
综上所述,随机变量 X 的分布函数为
0 x<0
x 2
F ( x) = 0≤ x<2
4
1 x≥2
常见的连续性随机变量的分布
(1) 均匀分布
1
b − a , a < x < b
若 X 的密度函数为 f ( x) =
0, 其他
则称 X 服从区间( a , b)上的均匀分布
记作 X ~ U ( a, b)
0, x < a,
x − a
X 的分布函数为 F ( x) = , a ≤ x < b,
b − a
1 x≥b
f ( x)
1
。 b−a 。
a b x
F( x)
1
a b x
∀(c, d ) ⊂ (a, b)
d 1 d −c
P (c < X < d ) = ∫ dx =
c b−a b−a
即 X 的取值在(a,b)内任何长为 d – c 的小区间
的概率与小区间的位置无关, 只与其长度成正
比. 这正是几何概型的情形.
(2) 指数分布
若 X 的密度函数为
λ e − λ x , x ≥ 0
f ( x) = λ > 0 为常数
0, 其他
则称 X 服从 参数为λ的指数分布
记作 X ~ Exp (λ )
X 的分布函数为 0, x≤0
F ( x) = −λ x
1 − e , x>0
f ( x)
λ
0 x
F( x)
1
0 x
例 假定一大型设备在任何长为t的时间内发生故
障的次数X(t)服从参数为 λ t 的泊松分布.求:
(1)相继两次故障时间间隔T的概率分布;
(2)设备已经无故障运行8小时的情况下,再
无故障运行10小时的概率.
解 (1) FT=
( t ) P (T ≤ t )
0, t<0
=
1 − P (T > t ), t > 0
0 −λt
(λ t ) e −λt
P (T = =
> t ) P ( N= ( t ) 0) = e
0!
0, t<0 0, t<0
F (t ) = −λt
f (t ) = − λt
1 − e , t > 0 λ e , t > 0
即 T ~ E (λ )
P (T > 18) 1
(2) P (T > 18 T > 8) = = = e −10 λ
− F (18)
P (T > 8) 1 − F (8)
指数分布具有无记忆性:
X ~ Exp (λ ), 则
P( X > s + t | X > s=
) P( X > t )
例 (常识)
(0,t) 内的保险公司索赔次数 N(t) 服从poisson分布
即 N(t) ~P(λt);
其两次索赔之间的时间间隔服从指数分布。
例 (常识)
(0,t)内某柜台需要服务的顾客数N(t)服从poisson分布
即 N(t) ~P(λt);
先后两个顾客到达柜台的时间间隔服从指数分布。
例 某美容厅顾客到达后需要等候的服务时间服
从参数为0.1 的指数分布,若顾客等候时间超过
X
20分钟就会离开.
(1)请给出该美容厅在营业时间内50个顾客中
因等候时间超过20分钟,没有等到服务而离开人
数的分布律;
(2)50个顾客中没有等到服务而离开的人数大
于1的概率.
解 设 Y 表示50个顾客中因等候时间超过20分钟,没有
等到服务而离开的人数,根据题意每个顾客等待时间
X 超过20分钟的概率为
+∞
∫
−0.1 x −2
P (=
X ≥ 20) =
0.1e dx e
10
−2
Y 可以看成是 p = e 的50重Bernoulli试验中顾客
离开发生次数,因此
−2
Y ~ B (50, e )
−2 50 − k
P(Y =
k) =
C p (1 − e )
k
50
k
,k =
0,1, 2, ,50
(2)没有等到服务而离开的次数大于1的概率为
P (Y > 1) =
1 − p (Y =−
0) p (Y =
1)
=1 − (1 − e −2 )50 − 50e −2 (1 − e −2 ) 49
(3) 正态分布(Gauss 分布)
若X 的密度函数为
( x− µ )2
1 −
f ( x) = e 2σ 2
− ∞ < x < +∞
2π σ
µ ,σ 为常数,σ > 0
则称 X 服从参数为 m , s 2 的正态分布
记作 X ~ N ( m , s 2 )
N (-3 , 1.2 )
0.3
0.25
0.2
0.15
0.1
0.05
-6 -5 -4 -3 -2 -1
µ = −3
f (x) 的性质:
图形关于直线 x = µ 对称: f (µ + x) = f (µ - x)
在 x = µ 时, f (x) 取得最大值
1
2π σ
在 x = µ±σ 时, 曲线 y = f (x) 在对应的点处有
拐点
曲线 y = f (x) 以 x 轴为渐近线
曲线 y = f (x) 的图形呈单峰状
P( X ≤ µ ) = F ( µ )
= 1 − F ( µ ) = P( X > µ )
1
=
2
0.3
0.25
0.2
0.15
0.1
0.05
-6 -5 -4 -3 -2 -1
f (x) 的两个参数:
µ — 位置参数
即固定 σ , 对于不同的 µ , 对应的 f (x)
的形状不变化,只是位置不同
σ — 形状参数
固定 µ ,对于不同的σ ,f ( x) 的形状不同.
1 1
若 σ1< σ2 则 2π σ > 2π σ 2 前者取 µ
1
附近值的概率更大. x = µ ± σ1 所对应的拐点
比x = µ ± σ2 所对应的拐点更靠近直线 x = µ
Show[fn1,fn3]
σ小
0.5
0.4
σ大 0.3
0.2
0.1
-6 -5 -4 -3 -2 -1
几何意义 σ 大小与曲线陡峭程度成反比
数据意义 σ 大小与数据分散程度成正比
一种重要的正态分布:N (0,1) — 标准正态分布
标准正态分布的计算:
如果随机变量 X ~ N ( 0, 1) ,则其密度函数为
x2
1 −
=ϕ ( x) e 2
( −∞, +∞ )
2π
其分布函数为
x x t2
1 −
Φ ( x)
= ϕ ( t ) dt
∫= ∫e 2
dt ( −∞ < x < +∞ )
−∞ 2π −∞
教科书上都附有标准正态分布表,由此可得Φ ( x)值.
Φ (0) = 0.5 Φ (− x) = 1 − Φ ( x)
P (| X |< a ) = 2Φ (a ) − 1
0.4
0.3
0.2
0.1
-3 -2 -1 1 2 3
Φ (0) = 0.5
Φ (− x) = 1 − Φ ( x)
0.4
0.3
0.2
0.1
-3 -2 -x -1 1 x 2 3
P (| X |< a ) = 2Φ (a ) − 1
对一般的正态分布 :X ~ N ( µ ,σ 2)
( t − µ )2
1 x −
其分布函数 F ( x) = ∫
2π σ −∞
e 2σ 2
d t
t −µ x−µ
作变量代换 s = F ( x) = Φ
σ σ
P(a < X ≤ b)= F (b) − F (a )
b−µ a−µ
= Φ −Φ
σ σ
P( X > a) = 1 − F (a)
a−µ
= 1−Φ
σ
定理 若X ~ N ( µ , σ ), 则
2
X −µ
~ N (0,1).
σ
例 假定某人群血液中总胆固醇含量𝑿𝑿~𝑵𝑵(𝟒𝟒. 𝟐𝟐, 𝟎𝟎. 𝟖𝟖𝟐𝟐 )(𝐦𝐦𝐦𝐦𝐦𝐦𝐦𝐦/𝐋𝐋) ,如
果总胆固醇超过5.6被认为是偏高的,求总胆固醇偏高的概率.
解 P( X > 5.6) =
1 − P( X ≤ 5.6)
5.6 − 4.2
= 1− Φ
0.8
= 1 − Φ (1.75)
= 1 − 0.95994 = 0.04006
例 假设公共汽车车门的高度是按男子与车门顶碰头机会在1%以
下来设计的,假设成年男子身高𝑿𝑿~𝑵𝑵(𝟏𝟏𝟏𝟏𝟏𝟏, 𝟔𝟔𝟐𝟐 )(𝒄𝒄𝒄𝒄),问如何设计
车门的高度?
𝒉𝒉 − 𝟏𝟏𝟏𝟏𝟏𝟏
= 𝟐𝟐. 𝟑𝟑𝟑𝟑, 解得 𝒉𝒉 ≈ 𝟏𝟏𝟏𝟏𝟏𝟏
𝟔𝟔
例 已知 X ~ N (2,σ ) 且 P( 2 < X < 4 ) = 0.3,
2
求 P ( X < 0 ).
0 − 2 2
解一 P ( X < 0) = Φ = 1−Φ
σ σ
4 − 2 2 − 2
P ( 2 < X < 4) = Φ −Φ
σ σ
2
= Φ − Φ (0) = 0.3
σ
2
Φ = 0.8
σ
P ( X < 0) = 0.2
解二 图解法
0.2
0.3
0.15
0.1
0.05
0.2
-2 2 4 6
由图
P ( X < 0) = 0.2
例 3σ 原则
设 X ~ N ( µ , σ 2), 求 P(| X − µ |< 3σ )
解 P(| X − µ |< 3σ ) = P( µ − 3σ < X < µ + 3σ )
µ + 3σ − µ µ − 3σ − µ
=Φ −Φ
σ σ
= Φ (3) − Φ (− 3)
= 2Φ (3) − 1 = 2 × 0.9987 − 1 = 0.9974
一次试验中, X 落入区间( µ - 3σ , µ +3σ )
的概率为 0.9974, 而超出此区间可能性很小
由3σ 原则知,
当 a < −3 时 Φ (a ) ≈ 0 , b > 3 时 Φ (b) ≈ 1
例 设测量的误差 X ~ N(7.5, 100)(单位:米), 问要进行多少次
独立测量,才能使至少有一次误差的绝对值不超过10米的概
率大于0.9 ?
10 − 7.5 − 10 − 7.5
解 P(| X |≤ 10) = Φ −Φ
10 10
= Φ (0.25) − Φ (− 1.75)
= Φ (0.25) − [1 − Φ (1.75)]
= 0.5586
设 A 表示进行 n 次独立测量至少有一次误差的绝对值不超过10米
P ( A) = 1 − (1 − 0.5586) n > 0.9 n > 3
所以至少要进行 4 次独立测量才能满足要求.