You are on page 1of 81

离散型随机变量的分布

目录

2 离散型随机变量的分布
常见离散型随机变量

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 16 / 106
离散型随机变量的分布

离散型随机变量和概率函数

定义 10 (离散型随机变量和概率函数)
如果随机变量 X 只取有限个或可数个值,则称 X 是离散型随机变量,定义 X 的概率函数为

f(x) = P(X = x).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 17 / 106
离散型随机变量的分布

分布律

定义 11
设离散型随机变量 X 的一切可能取值为 x1 , x2 , . . . , xn , . . . , 则称

P(X = xk ) = pk , k = 1, 2, . . .

为离散型随机变量 X 的分布律. 分布律也可以用表格的形式表示:

X x1 x2 ··· xn ···
pk p1 p2 ··· pn ···

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 18 / 106
离散型随机变量的分布

分布律 (续)

分布律 {pk , k = 1, 2, . . .} 的性质:



X
pk ≥ 0, k = 1, 2, . . . ; pk = 1.
k=1

分布律与分布函数之间的关系:对 ∀x ∈ R, 有
X X
F(x) = fX (xk ) = pk .
xk ≤x xk ≤x

对任意可测集 A ⊂ R, 有 X
P(X ∈ A) = P(X = xk ).
xk ∈A

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 19 / 106
离散型随机变量的分布 常见离散型随机变量

单点分布 X ∼ δa

定义 12
若随机变量 X 的分布律为
P(X = a) = 1,
则称 X 服从单点分布,又名退化分布,记为 X ∼ δa .

分布函数: (
0 x<a
F(x) =
1 x ≥ a.
概率函数: (
1 x=a
f(x) =
0 其它.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 20 / 106
离散型随机变量的分布 常见离散型随机变量

离散均匀分布

定义 13
设整数 k > 1,如果随机变量 X 的分布律为

X a1 a2 ··· ak
1 1 1
P K K ··· K

其中 ai ̸= aj (i ̸= j), 则称 X 在 {a1 , a2 , . . . , ak } 上服从离散均匀分布.

例 14
抛掷骰子并记出现的点数为随机变量 X, 给出其分布律.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 21 / 106
离散型随机变量的分布 常见离散型随机变量

0-1 分布 X ∼ b(1, p)

定义 15
若随机变量 X 的分布律为

X 0 1
P 1−p p

其中 0 < p < 1,则称 X 服从 0-1 分布,又名两点分布或伯努利 (Bernoulli) 分布,记为


X ∼ b(1, p).

概率函数:
f(x) = px (1 − p)1−x , x = 0或1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 22 / 106
离散型随机变量的分布 常见离散型随机变量

例 16
举例 0-1 分布描述的随机现象.

例 17
在试验中仅考虑事件 A 是否发生,定义随机变量
(
1 如果 ω ∈ A,
IA (ω) = I(ω ∈ A) =
0 如果 ω ∈ Ac .

则 IA 服从 0-1 分布 b(1, P(A)).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 23 / 106
离散型随机变量的分布 常见离散型随机变量

二项分布 X ∼ b(n, p)

定义 18
若随机变量 X 所有可能的取值为 0, 1, . . . , n, 其分布律为

P(X = k) = Ckn pk (1 − p)n−k , k = 0, 1, 2, . . . , n

则称 X 服从二项分布,记为 X ∼ b(n, p).

0-1 分布是二项分布的特例:n = 1
二项分布描述的是 n 重伯努利试验中事件 A 发生的次数 X, 因此
X
n
iid
X= Xi , Xi ∼ b(1, p)
i=1

可加性:X1 ∼ b(n1 , p) ⨿ X2 ∼ b(n2 , p),则 X1 + X2 ∼ b(n1 + n2 , p) . . . . . . . . . . . . . . . . . . . .


. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 24 / 106
离散型随机变量的分布 常见离散型随机变量

例 19
按规定, 某种型号电子元件的使用寿命超过 1500 小时的为一级品. 已知某一大批产品的一
级品率为 0.2, 现在从中随机地抽查 20 只. 问 20 只元件中恰有 k 只 (k = 0, 1, , 20) 一级品
的概率是多少?

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 25 / 106
离散型随机变量的分布 常见离散型随机变量

例 19
按规定, 某种型号电子元件的使用寿命超过 1500 小时的为一级品. 已知某一大批产品的一
级品率为 0.2, 现在从中随机地抽查 20 只. 问 20 只元件中恰有 k 只 (k = 0, 1, , 20) 一级品
的概率是多少?

P(X = k) = Ck20 0.2k 0.820−k , k = 0, 1, . . . , 20.


易证当 k = np = 20 × 0.2 = 4 时,P(X = k) 取到最大值.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 25 / 106
离散型随机变量的分布 常见离散型随机变量

例 20
为了保证设备正常工作,需配备适量的维修工人。现有同类设备 300 台,各台工作是相互
独立的,发生故障的概率为 0.001,在通常情况下,一台设备的故障由一个工人来处理。问
至少要配备多少工人,才能保证设备发生故障后不能及时维修的概率小于 0.01?

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 26 / 106
离散型随机变量的分布 常见离散型随机变量

例 20
为了保证设备正常工作,需配备适量的维修工人。现有同类设备 300 台,各台工作是相互
独立的,发生故障的概率为 0.001,在通常情况下,一台设备的故障由一个工人来处理。问
至少要配备多少工人,才能保证设备发生故障后不能及时维修的概率小于 0.01?

定理 21 (泊松逼近定理)
如果当 n → ∞ 时, npn → λ > 0,则对固定的 k, 有

λk −λ
lim Ckn pkn (1 − pn )n−k = e , k = 0, 1, 2, . . .
n→∞ k!

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 26 / 106
离散型随机变量的分布 常见离散型随机变量

泊松分布 X ∼ P(λ)

定义 22
若随机变量 X 的分布律为

λk −λ
P(X = k) = e , k = 0, 1, 2, . . . , λ > 0
k!
则称 X 服从泊松分布,记为 X ∼ P(λ).

泊松分布常用于描述稀有事件发生的次数,在生物学、医学、工业统计等问题中,十
分常见
泊松逼近定理表明,当 np → λ 时,二项分布可以由泊松分布来近似
可加性:X1 ∼ P(λ1 ) ⨿ X2 ∼ P(λ2 ),则 X1 + X2 ∼ P(λ1 + λ2 )
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 27 / 106
离散型随机变量的分布 常见离散型随机变量

例 23
一家商店采用科学管理,由该商店过去的销售记录知道,某种商品每月的销售数可以用参
数 λ = 5 的泊松分布来描述,为了以 95% 以上的把握保证不脱销,问商店在月底至少应进
某种商品多少件?

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 28 / 106
离散型随机变量的分布 常见离散型随机变量

负二项分布 X ∼ NB(r, p)

定义 24
设随机变量 X 取正整数值,其分布律为

P(X = k) = Cr−1 r
k−1 p (1 − p)
k−r
, k = r, r + 1, . . . ,

其中 r 为正整数,0 < p < 1, 则称 X 服从负二项分布,又名帕斯卡分布,记为 X ∼ NB(r, p).

负二项分布描述的是独立重复的伯努利试验中, 第 r 次试验成功发生时的试验次数 X
当 r = 1 时,X 表示首次成功时的试验次数,其分布称为几何分布,记为 X ∼ G(p), 概
率函数为
f(x) = p(1 − p)x−1 , x = 1, 2, . . .

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 29 / 106
离散型随机变量的分布 常见离散型随机变量

几何分布 X ∼ G(p)

定理 25 (无记忆性)
X 服从几何分布,当且仅当对任何正整数 m, n 都有

P(X > m + n|X > m) = P(X > n).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 30 / 106
连续型随机变量的分布

目录

3 连续型随机变量的分布
常见连续型随机变量

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 31 / 106
连续型随机变量的分布

连续型随机变量和概率密度函数

定义 26 (连续型随机变量和概率密度函数)
设随机变量 X 的分布函数为 F(x), 如果存在一个非负函数 f(x) ≥ 0, 满足对 ∀x ∈ R,
Z x
F(x) = f(t)dt,
−∞

则称 X 是连续型随机变量,f(x) 为其密度函数 (probability density function; pdf), 记为


X ∼ f(x).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 32 / 106
连续型随机变量的分布

概率密度函数的性质

(1) f(x) ≥ 0, ∀x ∈ R;
R∞
(2) −∞ f(x)dx = 1;
(3) 对于任意实数 a < b, 有
Z b
P(a < X ≤ b) = f(x)dx.
a

特别地,对任意 A ⊂ R,有 Z
P(X ∈ A) = f(x)dx.
A
(4) 若 f(x) 在 x0 连续,则
F′ (x0 ) = f(x0 ).
(5) 对任一实数 a, P(X = a) = 0.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 33 / 106
连续型随机变量的分布

例 27
判断下列函数是否为概率密度函数:
(1) f(x) = 5, ∀x ∈ (0, 1/5);
(2) f(x) = (2/3)x−1/3 , ∀x ∈ (0, 1);
(3) f(x) = (1 + x)−1 , ∀x ≥ 0.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 34 / 106
连续型随机变量的分布

例 27
判断下列函数是否为概率密度函数:
(1) f(x) = 5, ∀x ∈ (0, 1/5);
(2) f(x) = (2/3)x−1/3 , ∀x ∈ (0, 1);
(3) f(x) = (1 + x)−1 , ∀x ≥ 0.

注:
不同于离散型随机变量的概率函数,pdf 值可以大于 1;
pdf 值可以是无界的.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 34 / 106
连续型随机变量的分布

例 28
设随机变量 X 具有密度函数


 kx 0≤x<3
x
f(x) = 2− 3≤x≤4

 0
2
其它

(1) 确定常数 k;
(2) 求 X 的分布函数 F(x);
(3) 求 P(1 < X ≤ 7/2).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 35 / 106
连续型随机变量的分布 常见连续型随机变量

均匀分布 X ∼ U(a, b)
定义 29
设随机变量 X 在有限区间 (a, b) 内取值 (−∞ < a < b < ∞),且概率密度函数为

1
f(x) = I(a < x < b),
b−a
则称 X 服从区间 (a, b) 上的均匀分布 (uniform distribution), 记为 X ∼ U(a, b).

X 的分布函数为 

 0 x<a
x−a
F(x) = P(X ≤ x) = a≤x<b
 b−a
 1 x≥b
对于任意长度为 d 的区间 (c, c + d), a ≤ c < c + d ≤ b, 有
d
P(c < X < c + d) = . . . . . . . . . . . . . . . . . . . . .

b−a . . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 36 / 106
连续型随机变量的分布 常见连续型随机变量

例 30
某公共汽车站从上午 7 起,每 15 分钟来一班车,即 7:00,7:15,7:30 等时刻有汽车到达此
站,如果乘客到达此站时间 X 是 7:00 到 7:30 之间的均匀随机变量, 试求他候车时间少于 5
分钟的概率.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 37 / 106
连续型随机变量的分布 常见连续型随机变量

正态分布 X ∼ N(µ, σ 2 )
定义 31
设随机变量 X 的密度函数为
( )
1 (x − µ)2
f(x) = √ exp − , x∈R
2πσ 2σ 2

其中 µ ∈ R, σ > 0 为参数,则称 X 服从参数为 µ, σ 2 的正态分布 (normal distribution), 记为


X ∼ N(µ, σ 2 ).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 38 / 106
连续型随机变量的分布 常见连续型随机变量

正态分布的图形特点
“钟形” 曲线,两头小,中间大,关于 x = µ 对称
1
最大值在 x = µ 处取得,f(x) = √2πσ
µ 称为位置参数, 决定了图形的中心位置
σ > 0 称为尺度参数,决定了图形中峰的陡峭程度
正态分布由它的两个参数 µ 和 σ 唯一确定,当 µ 和 σ 不同时,是不同的正态分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 39 / 106
连续型随机变量的分布 常见连续型随机变量

标准正态分布 N(0, 1)
µ = 0, σ = 1 的正态分布称为标准正态分布,其密度函数和分布函数分别为
Z x
1 x2 1 t2
ϕ(x) = √ e− 2 , Φ(x) = √ e− 2 dt, x ∈ R
2π 2π −∞

特点:
ϕ(−x) = ϕ(x), Φ(−x) = 1 − Φ(x)
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 40 / 106
连续型随机变量的分布 常见连续型随机变量

正态分布的性质

若 X ∼ N(µ, σ 2 ), 则
X−µ
Z= ∼ N(0, 1),
σ
称为 X 的标准化变换. 因而,
     
a−µ b−µ b−µ a−µ
P(a < X < b) = P <Z< =Φ −Φ
σ σ σ σ
ind
可加性:如果 Xi ∼ N(µi , σi2 ), i = 1, . . . , n,则

X
n X
n X
n
Xi ∼ N( µi , σi2 ).
i=1 i=1 i=1

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 41 / 106
连续型随机变量的分布 常见连续型随机变量

标准正态分布的上 α 分位数

定义 32
设 X ∼ N(0, 1), 若数 zα 满足

P(Z > zα ) = α, 0 < α < 1,

则称点 zα 为标准正态分布的上 α 分位数.

特点:P(X < −zα ) = α, z1−α = −zα .


.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

许佩蓉 (SJTU) 第二章 42 / 106


连续型随机变量的分布 常见连续型随机变量

例 33
某班数学统考成绩近似服从正态分布 N(66.5, 152 ), 第 100 名的成绩为 60 分,问
(1) 不及格的人数有多少?
(2) 第 10 名的成绩约为多少分?

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 43 / 106
连续型随机变量的分布 常见连续型随机变量

指数分布 X ∼ Exp(λ)

定义 34
设随机变量 X 的密度函数为
f(x) = λe−λx I(x > 0),
其中 λ > 0 为参数,则称 X 服从参数为 λ 的指数分布 (exponential distribution), 记为
X ∼ Exp(λ).

指数分布常用于可靠性统计研究,如描述元件的寿命
分布函数为
F(x) = 1 − e−λx , x > 0

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 44 / 106
连续型随机变量的分布 常见连续型随机变量

指数分布的性质

例 35
设某类日光灯管的使用寿命 X 服从参数为 λ = 1/2000 的指数分布 (单位: 小时).
(1) 任取一只这种灯管, 求能正常使用 1000 小时以上的概率;
(2) 有一只这种灯管已经正常使用了 1000 小时以上, 求还能使用 1000 小时以上的概率.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 45 / 106
连续型随机变量的分布 常见连续型随机变量

指数分布的性质

例 35
设某类日光灯管的使用寿命 X 服从参数为 λ = 1/2000 的指数分布 (单位: 小时).
(1) 任取一只这种灯管, 求能正常使用 1000 小时以上的概率;
(2) 有一只这种灯管已经正常使用了 1000 小时以上, 求还能使用 1000 小时以上的概率.

定理 36 (无记忆性)
X 服从指数分布,则对任意 m, n > 0 都有

P(X > m + n|X > m) = P(X > n).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 45 / 106
连续型随机变量的分布 常见连续型随机变量

伽马分布 X ∼ G(α, λ)

定义 37
对 α > 0, 伽马函数定义为 Z ∞
Γ(α) = yα−1 e−y dy.
0

设随机变量 X 的密度函数为
λα α−1 −λx
f(x) = x e , x > 0,
Γ(α)

其中 α > 0, λ > 0 为参数,则称 X 服从参数为 α, λ 的伽马分布 (Gamma distribution), 记为


X ∼ G(α, λ).

指数分布 Exp(λ) 是伽马分布的特例:α = 1


可加性:X1 ∼ G(α1 , λ) ⨿ X2 ∼ G(α2 , λ),则 X1 + X2 ∼ G(α1 + α2 , λ)
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 46 / 106
连续型随机变量的分布 常见连续型随机变量

卡方分布 (χ2 分布)


定义 38
设随机变量 X 的密度函数为
1 n
f(x) = x 2 −1 e−x/2 , x > 0
Γ(n/2)2n/2

则称 X 服从自由度为 n 的 χ2 分布,记为 X ∼ χ2 (n).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 47 / 106
连续型随机变量的分布 常见连续型随机变量

χ2 分布的性质

(1) χ2 分布是由正态分布派生出来的一种分布:
iid
χ2 = X21 + X22 + · · · + X2n ∼ χ2 (n), Xi ∼ N(0, 1)

(2) 若 Xi iid N(µ, σ 2 ), i = 1, . . . , n, 则

1 X n
χ2 = (Xi − µ)2 ∼ χ2 (n)
σ 2 i=1

(3) 可加性:X1 ∼ χ2 (n1 ) ⨿ X2 ∼ χ2 (n2 ),则 X1 + X2 ∼ χ2 (n1 + n2 )

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 48 / 106
连续型随机变量的分布 常见连续型随机变量

χ2 分布的上 α 分位数
定义 39
设 X ∼ χ2 (n), 若数 χ2α (n) 满足

P(X > χ2α (n)) = α, 0 < α < 1,

则称点 χ2α (n) 为 χ2 (n) 分布的上 α 分位数.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 49 / 106
连续型随机变量的分布 常见连续型随机变量

t 分布
定义 40
设随机变量 X 的密度函数为

Γ( n+1
2 ) 1
f(x) = n √  (n+1)/2 , x ∈ R
Γ( 2 ) nπ x2
1+ n

则称 X 服从自由度为 n 的 t 分布,记为 X ∼ t(n).


设 X ∼ N(0, 1), Y ∼ χ2 (n) 且相互独立,则
X
T= p ∼ t(n)
Y/n
Cauchy 分布是 t 分布的特例 (n = 1):
1
f(x) = , x∈R . . . . . . . . . . . . . . . . . . . .
π(1 + x2 ) . . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 50 / 106
连续型随机变量的分布 常见连续型随机变量

t 分布的性质
t 分布的密度函数关于 t = 0 对称;
t 分布是重尾分布,随着自由度 n 逐渐增大,t 分布逐渐接近标准正态分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 51 / 106
连续型随机变量的分布 常见连续型随机变量

t 分布的上 α 分位数
定义 41
设 X ∼ t(n), 若数 tα (n) 满足

P(X > tα (n)) = α, 0 < α < 1,

则称点 tα (n) 为 t 分布的上 α 分位数.

特点:t1−α (n) = −tα (n); 当 n ≥ 45 时,tα (n) ≈ zα .


.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

许佩蓉 (SJTU) 第二章 52 / 106


连续型随机变量的分布 常见连续型随机变量

F 分布
定义 42
设随机变量 X 的密度函数为
 
n1 n1 /2 n1 /2−1
Γ( n1 +n2
2 ) n2 x
f(x) = h i n1 +n2 , x > 0
Γ( n21 )Γ( n22 ) 1+ n1 x
n2
2

则称 X 服从自由度为 n1 , n2 的 F 分布,记为 X ∼ F(n1 , n2 ).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 53 / 106
连续型随机变量的分布 常见连续型随机变量

F 分布的上 α 分位数
定义 43
设 X ∼ F(n1 , n2 ), 若数 Fα (n1 , n2 ) 满足

P(X > Fα (n1 , n2 )) = α, 0 < α < 1,

则称点 Fα (n1 , n2 ) 为 F 分布的上 α 分位数.

F1−α (n1 , n2 ) = 1/Fα (n2 , n1 ) . . . . . . . . . . . . . . . . . . . .


. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 54 / 106
随机变量函数的分布

目录

4 随机变量函数的分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 55 / 106
随机变量函数的分布

问题的提出

例 44
已知 t = t0 时刻噪声电压 V 的分布, 求功率 W = V2 /R(R 为电阻) 的分布.

已知圆轴截面直径 d 的分布, 求截面面积 A = πd2 /4 的分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 56 / 106
随机变量函数的分布

离散型随机变量函数的分布
定理 45
假设离散型随机变量 X 的分布律为

X x1 x2 ··· xn ···
P p1 p2 ··· pn ···

则 Y = g(X) 的分布律为

Y g(x1 ) g(x2 ) ··· g(xn ) ···


P p1 p2 ··· pn ···

其中 g(xi ) 相同时把对应的 pi 相加,即


X
P(Y = g(xk )) = pi .
. . . . . . . . . . . . . . . . . . . .
i:g(xi )=g(xk ) . . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 57 / 106
随机变量函数的分布

连续型随机变量函数的分布

定理 46 (分布函数法)
设随机变量 X ∼ f(x), Y = g(X), 则随机变量 Y 的分布函数 FY (y) 为
Z
FY (y) = P(Y ≤ y) = P(g(X) ≤ y) = f(x)dx.
{x:g(x)≤y}

例 47
设随机变量 X 的概率密度函数为
(
2x/π 2 , 0 < x < π
f(x) =
0, 其它

求 Y = sin(X) 的概率密度函数.
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 58 / 106
随机变量函数的分布

定理 48 (密度函数变换公式)
设 X 是取值于区间 [a, b] 的连续型随机变量, 具有概率密度函数 f(x),Y = g(X), 如果 g(x)
处处可导,且对于任意 x, 恒有 g′ (x) > 0 或恒有 g′ (x) < 0,则 Y 仍为连续型随机变量,它
的概率密度函数为 (
f[h(y)] dh(y)
dy , α < y < β
fY (y) =
0, 其它
其中α = mina≤x≤b g(x), β = maxa≤x≤b g(x), x = h(y) 是 y = g(x) 的反函数.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 59 / 106
随机变量函数的分布

例 49
设随机变量 X ∼ N(µ, σ 2 ), 证明 Y = aX + b 也服从正态分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 60 / 106
随机变量函数的分布

例 49
设随机变量 X ∼ N(µ, σ 2 ), 证明 Y = aX + b 也服从正态分布.

此例说明:正态变量的线性函数仍是正态变量
例 50
设 X ∼ U(−1, 3),求 Y = X2 的概率密度函数.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 60 / 106
二维随机变量

目录

5 二维随机变量

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 61 / 106
二维随机变量

二维随机变量的分布函数

定义 51
设 (X, Y) 是二维随机变量,对于任意实数 x, y, 二元函数

F(x, y) = P(X ≤ x, Y ≤ y).

称为二维随机变量 (X, Y) 的分布函数,或者 (X, Y) 的联合分布函数(joint cdf).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 62 / 106
二维随机变量

二维随机变量的分布函数

定义 51
设 (X, Y) 是二维随机变量,对于任意实数 x, y, 二元函数

F(x, y) = P(X ≤ x, Y ≤ y).

称为二维随机变量 (X, Y) 的分布函数,或者 (X, Y) 的联合分布函数(joint cdf).

二维随机变量 (X, Y) 落在矩形区域 (x1 , x2 ] × (y1 , y2 ] 内的概率为

P(x1 < X ≤ x2 , y1 < Y ≤ y2 ) = F(x2 , y2 ) − F(x2 , y1 ) − F(x1 , y2 ) + F(x1 , y1 )

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 62 / 106
二维随机变量

二维离散型随机变量

定义 52
假设二维随机变量 (X, Y) 所有可能的取值为 {(xi , yj ), i = 1, 2, · · · , j = 1, 2, · · · }, 记

P(X = xi , Y = yj ) = pij , i, j = 1, 2, · · ·

称之为二维离散型随机变量 (X, Y) 的联合分布律(joint pmf).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 63 / 106
二维随机变量

联合分布律

性质:

pij ≥ 0, i, j = 1, 2, · · ·
XX
pij = 1
i j

二维离散型随机变量 (X, Y) 的联合分布函数为


XX
F(x, y) = pij ,
xi ≤x yj ≤y

其中和式是对一切满足 xi ≤ x, yj ≤ y 的 i, j 求和.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 64 / 106
二维随机变量

例 53
设随机变量 X 在 1,2,3,4 四个整数中等可能地取值, 另一个随机变量 Y 在 1 ∼ X 中等可能
地取一整数值. 试求 (X, Y) 分布律.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 65 / 106
二维随机变量

二维连续型随机变量

定义 54
设 (X, Y) ∼ F(x, y), 如果存在非负函数 f(x, y),使得对于任意 (x, y) ∈ R2 有
Z x Z y
F(x, y) = f(u, v)dudv,
−∞ −∞

则称 (X, Y) 是二维连续型随机变量, f(x, y) 称为其联合概率密度函数(joint pdf),简称联合


联合密度函数.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 66 / 106
二维随机变量

联合概率密度函数的性质
非负性:
∀(x, y) ∈ R2 , f(x, y) ≥ 0
全平面上积分为 1: ZZ
f(x, y)dxdy = 1
R2
设 G 是平面上的一个区域,则
ZZ
P((X, Y) ∈ G) = f(x, y)dxdy
(x,y)∈G

若 f(x, y) 在 (x0 , y0 ) 处连续,则


∂ 2 F(x, y)
f(x0 , y0 ) =
∂x∂y (x0 ,y0 ) . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 67 / 106
二维随机变量

例 55
设 (X, Y) 的概率密度为 (
cx2 y, x2 ≤ y ≤ 1
f(x, y) =
0, 其它

(1) 求常数 c;
(2) 求概率 P(X ≥ Y).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 68 / 106
二维随机变量

二维均匀分布

定义 56
设 G 为平面上的一个有界区域,其面积记为 |G|. 若二维随机变量 (X, Y) 的联合概率密度
函数为
1
f(x, y) = IG (x, y),
|G|
则称 (X, Y) 在 G 上服从均匀分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 69 / 106
二维随机变量

二元正态分布
定义 57
若二维随机变量 (X, Y) 的联合概率密度函数为
1
f(x, y) = p
2πσ1 σ2 1 − ρ2
  
1 (x − µ1 )2 (x − µ1 )(y − µ2 ) (y − µ2 )2
· exp − − 2ρ + , x ∈ R, y ∈ R
2(1 − ρ2 ) σ12 σ1 σ2 σ22

其中 µ1 , µ2 , σ12 , σ22 , ρ 是常数且

−∞ < µ1 , µ2 < ∞, σ1 > 0, σ2 > 0, −1 ≤ ρ ≤ 1.

则称 (X, Y) 服从参数为 µ1 , µ2 , σ12 , σ22 , ρ 的二元正态分布, 记作

(X, Y) ∼ N(µ1 , σ12 ; µ2 , σ22 ; ρ). . . . . . . . . . . . . . . . . . . . .


. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 70 / 106
边际 (缘) 分布

目录

6 边际 (缘) 分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 71 / 106
边际 (缘) 分布

边际 (缘) 分布函数

定义 58
设二维随机变量 (X, Y) 的联合分布函数为 F(x, y),其分量 X 和 Y 的分布函数分别
为FX (x), FY (y), 称为 (X, Y) 的边际 (缘) 分布函数 (marginal distribution).

由定义可知,联合分布可以唯一确定边际 (缘) 分布:

FX (x) = P(X ≤ x) = P(X ≤ x, Y < ∞) = lim F(x, y) ≜ F(x, ∞)


y→+∞

FY (y) = P(Y ≤ y) = P(X < ∞, Y ≤ y) = lim F(x, y) ≜ F(∞, y).


x→+∞

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 72 / 106
边际 (缘) 分布

二维离散型随机变量的边际分布
假设二维离散型随机变量 (X, Y) 联合分布为:
X
P(X = xi , Y = yj ) = pij ≥ 0, pij = 1,
i,j

则边际分布律为: X X
P(X = xi ) = P(X = xi , Y = yj ) = pij ≜ pi· ,
j j
X X
P(Y = yj ) = P(X = xi , Y = yj ) = pij ≜ p·j .
i i
边际分布函数为

XX X
FX (x) = F(x, ∞) = pij = pi·
xi ≤x j=1 xi ≤x
X∞ X X
FY (y) = F(∞, y) = pij = p·j .
i=1 yi ≤y yi ≤y . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 73 / 106
边际 (缘) 分布

例 59
已知下列分布律求其边缘分布律:

X
0 1
Y
0 16/49 12/49
1 12/49 9/49

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 74 / 106
边际 (缘) 分布

二维连续型随机变量的边际分布
假设二维连续型随机变量 (X, Y) 的联合密度函数为 f(x, y),由于
Z x Z y
F(x, y) = f(u, v)dudv,
−∞ −∞
Z x Z ∞
P(X ≤ x) = P(X ≤ x, Y ≤ ∞) = f(u, v)dudv,
−∞ −∞
Z ∞ Z y
P(Y ≤ y) = P(X ≤ ∞, Y ≤ y) = f(u, v)dudv,
−∞ −∞


Z ∞
fX (x) = f(x, y)dy,
−∞
Z ∞
fY (y) = f(x, y)dx,
−∞

称为随机变量 (X, Y) 的边际密度函数. .


.
.
.
.
. . . . .
. . . .
. . . .
. . . .
. . . .
. . . . .
.
.
.
.
.
.
.
.
.

许佩蓉 (SJTU) 第二章 75 / 106


边际 (缘) 分布

例 60
设 (X, Y) 的概率密度为 (
21 2
4 x y, x2 ≤ y ≤ 1
f(x, y) =
0, 其它
求边际概率密度 fX (x), fY (y).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 76 / 106
边际 (缘) 分布

例 60
设 (X, Y) 的概率密度为 (
21 2
4 x y, x2 ≤ y ≤ 1
f(x, y) =
0, 其它
求边际概率密度 fX (x), fY (y).

注:在求连续型随机变量的边际密度函数时,往往要求联合密度函数在某区域上的积分. 当
联合密度函数是分片表示的时候,在计算积分时应特别注意积分限.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 76 / 106
边际 (缘) 分布

例 61
试求二维正态随机变量的边缘概率密度.
1
f(x, y) = p
2πσ1 σ2 1 − ρ2
  
1 (x − µ1 )2 (x − µ1 )(y − µ2 ) (y − µ2 )2
· exp − − 2ρ + , x ∈ R, y ∈ R
2(1 − ρ2 ) σ12 σ1 σ2 σ22

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 77 / 106
边际 (缘) 分布

例 61
试求二维正态随机变量的边缘概率密度.
1
f(x, y) = p
2πσ1 σ2 1 − ρ2
  
1 (x − µ1 )2 (x − µ1 )(y − µ2 ) (y − µ2 )2
· exp − − 2ρ + , x ∈ R, y ∈ R
2(1 − ρ2 ) σ12 σ1 σ2 σ22

小结:
二维正态分布的两个边际分布都是一维正态分布, 并且不依赖于参数ρ;
由边际分布一般不能确定联合分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 77 / 106
条件分布

目录

7 条件分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 78 / 106
条件分布

条件分布

条件概率:
P(AB)
P(A|B) =
P(B)

条件分布:在给定 r.vY 取某个或某些值的条件下,求 r.vX 的概率分布

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 79 / 106
条件分布

条件分布律

定义 62
设 (X, Y) 是二维离散型随机变量,对于固定的 j,若 P(Y = yj ) > 0,则称

P(X = xi , Y = yj ) pij
P(X = xi |Y = yj ) = = , i = 1, 2, · · ·
P(Y = yj ) p·j

为在 Y = yj 条件下随机变量 X 的条件分布律. 即当 fY (y) > 0,则条件概率函数为

P(X = x, Y = y) fX,Y (x, y)


fX|Y (x|y) = P(X = x|Y = y) = = .
P(Y = y) fY (y)

注: 作为条件的那个 r.v, 认为取值是给定的,在此条件下求另一 r.v 的概率分布


. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 80 / 106
条件分布

例 63
一射手进行射击,击中目标的概率为 p(0 < p < 1), 射击进行到击中目标两次为止. 以 X 表
示首次击中目标所进行的射击次数,以 Y 表示总共进行的射击次数. 试求 X 和 Y 的联合分
布及条件分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 81 / 106
条件分布

例 63
一射手进行射击,击中目标的概率为 p(0 < p < 1), 射击进行到击中目标两次为止. 以 X 表
示首次击中目标所进行的射击次数,以 Y 表示总共进行的射击次数. 试求 X 和 Y 的联合分
布及条件分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 81 / 106
条件分布

条件概率密度函数

定义 64
设 (X, Y) 是二维连续型随机变量, 联合密度函数为 f(x, y), 若 fY (y) > 0,则在 Y = y 条件下
随机变量 X 的条件概率密度函数为

fX,Y (x, y)
fX|Y (x|y) = ,
fY (y)

从而 Z x Z x
fX,Y (x, y)
fX|Y (x|y)dx = dx
−∞ −∞ fY (y)
为 Y = y 条件下随机变量 X 的条件分布函数,记为FX|Y (x|y) 或 P(X ≤ x|Y = y). 因此,
Z
P(X ∈ A|Y = y) = fX|Y (x|y)dx.
A . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 82 / 106
条件分布

例 65
设 X ∼ U(0, 1), Y|X = x ∼ U(x, 1), 求 Y 的边际分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 83 / 106
条件分布

例 66
设 (X, Y) 的联合概率密度为
(
21 2
4 x y, x2 ≤ y ≤ 1
f(x, y) =
0, 其它

对于任意给定的 x(x2 ≤ y ≤ 1), 求 fY|X (y|x);


求 P(Y ≥ 3/4|X = 1/2).

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 84 / 106
条件分布

例 67 (二维正态随机变量的条件分布)
若 (X, Y) ∼ N(µ1 , σ12 ; µ2 , σ22 ; ρ). (σ1 > 0, σ2 > 0, −1 < ρ < 1). 求在 X = x 的条件下, Y 的条
件分布及在 Y = y 的条件下, X 的条件分布.

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 85 / 106
条件分布

二维正态随机变量的条件分布
解: 由前面的例子知道, X ∼ N(µ1 , σ12 ), Y ∼ N(µ2 , σ22 ). 所以

f(x, y)
fX|Y (x|y) =
fY (y)
 σ1 

 (x − µ1 − ρ (y − µ2 )) 
2

1 σ2
=√ p exp − ,
2πσ1 1 − ρ2 
 2σ12 (1− ρ2 ) 

f(x, y)
fY|X (y|x) =
fX (x)
 σ2 

 (y − µ2 − ρ (x − µ1 )) 
2

1 σ1
=√ p exp − .
2πσ2 1 − ρ2 
 2σ22 (1 − ρ2 ) 

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 86 / 106
条件分布

二维正态随机变量的条件分布 (续)

即在 X = x 的条件下, Y 的条件分布为
σ2
N(µ2 + ρ (x − µ1 ), σ22 (1 − ρ2 ));
σ1

在 Y = y 的条件下, X 的条件分布为
σ1
N(µ1 + ρ (y − µ2 ), σ12 (1 − ρ2 )).
σ2

. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . .
许佩蓉 (SJTU) 第二章 87 / 106

You might also like