You are on page 1of 41

§5.

4 区间估计

前面,我们讨论了参数点估计. 它是用样
华东师范大学

本算得的一个值去估计未知参数(矩法估计,
极大似然估计). 但是,点估计值仅仅是未知
参数的一个近似值,它没有反映出这个近似值
的误差范围,使用起来把握不大. 区间估计正
金融与统计学院

好弥补了点估计的这个缺陷 .

汤银才 yctang@stat.ecnu.edu.cn 第 1页
华东师范大学 5.4.1 区间估计的概念

设θ 是总体的一个未知参数 , X1, X2,…, Xn


为来自该总体的样本,对给定的 0 <α <1,
如果能够找到两个统计量θˆL , θˆU 使得
Pθ (θˆL ≤ θ ≤ θˆU ) ≥ 1 − α ,
金融与统计学院

则称随机区间 (θˆL , θˆU ) 是θ 的置信水平或


置信度为1−α 置信区间。
分别称 θˆL 和 θˆU 为置信下限和置信上限.

汤银才 yctang@stat.ecnu.edu.cn 第 2页
华东师范大学 注 意 点 (1)

¾ 点估计给出的是未知参数的一个近似值;
区间估计给出的是未知参数的一个近似范围,
并且这个范围包含未知参数值的可信度为 1−α .
金融与统计学院

¾ 点估计有使用方便、直观等优点,但并没有
提供关于估计精度的任何信息。

汤银才 yctang@stat.ecnu.edu.cn 第 3页
华东师范大学 注 意 点 (2)

置信水平1-α 的含义是指:
在大量使用该置信区间时,
至少有100(1- α)%的区间含有θ。
金融与统计学院

汤银才 yctang@stat.ecnu.edu.cn 第 4页
注 意 点 (3)

1. 要求 θ 以很大的可能被包含在区间[θˆ1 , θˆ2 ]
华东师范大学

内,就是说,概率 P{θˆL ≤ θ ≤ θˆU } 要尽可能大.


即要求估计尽量可靠.
2. 估计的精度要尽可能的高. 如要求区间
金融与统计学院

长度θˆU − θˆL 尽可能短,或能体现该要求的其它准则.

可靠度与精度是一对矛盾,
一般是在保证可靠度的条件下
尽可能提高精度

汤银才 yctang@stat.ecnu.edu.cn 第 5页
例1 设 x1 , …, x10 是来自N(μ,σ 2)的样本,
华东师范大学

则μ 的置信水平为1-α 的置信区间为

( x −t
1−α 2
(9) s 10 , x + t1−α 2 (9) s 10 )
金融与统计学院

若取α =0.10,则t0..95(9)=1.8331,上式化

( x − 0.5797 s, x + 0.5797 s )

汤银才 yctang@stat.ecnu.edu.cn 第 6页
¾ 现假定μ =15,σ 2 =4,有一个容量为10的样本:
华东师范大学

14.85 13.01 13.50 14.93 16.97 13.80


17.9533 13.37 16.29 12.38
由该样本可以算得μ 的一个区间估计为
(13.6427, 15.7679)
金融与统计学院

该区间包含μ 的真值——15。

¾ 若有100个样本,也就得到100个区间,我们将
这100个区间画在下图上。

汤银才 yctang@stat.ecnu.edu.cn 第 7页
这100个
华东师范大学

区间中
有91个
包含参
数真值
15,另
金融与统计学院

外9个不
包含参
数真值。

图 μ 的置信水平为0.90的置信区间
汤银才 yctang@stat.ecnu.edu.cn 第 8页
若取
α=0.50,我
华东师范大学

们也可以给
出100个这样
的区间,可
以看出,这
金融与统计学院

100个区间中
有50个包含
参数真值
15,另外50
个不包含参
数真值。
图 μ 的置信水平为0.50的置信区间
汤银才 yctang@stat.ecnu.edu.cn 第 9页
置信区间的求法---例解

例2 设X1,…Xn是取自 N ( μ , σ 2 ) 的样本, σ 2已知,


华东师范大学

求参数 μ的置信水平为1 − α 的置信区间.


解:选 μ 的点估计为X 寻找未知参数的
明确问题,是求什么参数的置信区间?
X −μ 一个良好估计.
取 U= 置信水平是多少?
~N(0, 1)
σ
金融与统计学院

有了分布,就可以
寻找一个待估参数和 求出U取值于任意
估计量的函数 ,要求 区间的概率.
其分布为已知.
汤银才 yctang@stat.ecnu.edu.cn 第10页
对于给定的置信水平(大概率), 根据U的分布,
华东师范大学

确定一个区间, 使得U取值于该区间的概率为
置信水平.

对给定的置信水平1 − α ,
为什么
金融与统计学院

查正态分布表得u1−α 2 , 这样取?

X −μ
使 P{| |≤ u1−α 2 } = 1 − α
σ n

汤银才 yctang@stat.ecnu.edu.cn 第11页


对给定的置信水平1 − α ,
华东师范大学

查正态分布表得u1−α 2 ,

X −μ
使 P{| |≤ u1−α 2 } = 1 − α
σ n
金融与统计学院

从中解得
σ σ
P{ X − u1−α 2 ≤ μ ≤ X + u1−α 2 } = 1 − α
n n

汤银才 yctang@stat.ecnu.edu.cn 第12页


σ σ
P{ X − u1−α 2 ≤ μ ≤ X + u1−α 2 } = 1 − α
华东师范大学

n n

于是所求 μ 的 置信区间为
金融与统计学院

σ σ
[X − u1−α 2 , X + u1−α 2 ]
n n
σ
也可简记为 X± u1−α 2
n
汤银才 yctang@stat.ecnu.edu.cn 第13页
华东师范大学 5.4.2 枢轴量法

从例1解题的过程,归纳出求未知参数θ的置信
区间的最常用的方法:枢轴量法,其步骤可以
概括为如下三步:
1. 明确问题, 是求什么参数的置信区间?
金融与统计学院

置信水平 1 − α 是多少?

2. 寻找参数 θ 的一个良好的点估计

θ ( X1 , X 2 ,..., X n )

汤银才 yctang@stat.ecnu.edu.cn 第14页


3. 寻找一个待估参数 θ 和估计量 θ 的函数 G (θ , θ )
华东师范大学

其分布为已知. 称 G (θ , θ ) 为枢轴量.

4. 对于给定的置信水平 1 − α`,根据 G (θ , θ )的分布,


确定常数c, d (分位数),使得
P(c≤ G (θ , θ ) ≤d)= 1 − α
金融与统计学院

5. 对“c≤ G (θ , θ ) ≤d” 作等价变形,得到如下形式:

P{θˆ1 ≤ θ ≤ θˆ2 } = 1 − α
则[θˆ1 , θˆ2 ] 就是 θ 的100( 1 − α )%的置信区间.

汤银才 yctang@stat.ecnu.edu.cn 第15页


华东师范大学 枢轴量法之例

例3 设总体 X ~ N(μ, σ2),其中σ2已知。X1, X2, …,


Xn 为X 的 一个样本,求 μ 的区间估计。
X −μ
解: 因为 U = ~ N (0,1) U为枢轴量
σ/ n
金融与统计学院

⎛ X −μ ⎞
由 P ⎜ −u1−α / 2 < < u1−α / 2 ⎟ = 1 − α
⎝ σ/ n ⎠
⎛ σ σ ⎞
变形得 P ⎜ X − u1−α / 2 < μ < X + u1−α / 2 ⎟ = 1−α
⎝ n n⎠

汤银才 yctang@stat.ecnu.edu.cn 第16页


例4 设总体 X ~ N(μ, 0.92),X1, X2, …, X9 为X 的
华东师范大学

一个样本,样本均值为5,求 μ 的95%的置信区
间。
解: 因为μ 的1−α 置信区间为
⎛ σ σ ⎞
⎜ X − u1−α / 2 , X + u1−α / 2 ⎟
金融与统计学院

⎝ n n⎠
所以由 u0.975 = 1.96,得
σ σ
X − u1−α / 2 = 4.412, X + u1−α / 2 = 5.588,
n n
所求置信区间为 (4.412, 5.588)
汤银才 yctang@stat.ecnu.edu.cn 第17页
华东师范大学 注意点

¾ 置信区间不是唯一的。

¾ 置信度相同时,置信区间越短越好。
金融与统计学院

¾ 一般对称取(等尾--尾部对称)。

汤银才 yctang@stat.ecnu.edu.cn 第18页


5.4.3 单正态总体参数的置信区间

共分四种情况:
华东师范大学

(1) σ 已知,μ 的置信区间


(2) σ 未知,μ 的置信区间
(3) μ 已知,σ 2的置信区间
金融与统计学院

(4) μ 未知,σ 2的置信区间

汤银才 yctang@stat.ecnu.edu.cn 第19页


(1) σ2 已知,μ 的置信区间

X −μ
华东师范大学

枢轴量 U = ~ N (0,1)
σ/ n
⎛ X −μ ⎞
由 P ⎜ −u1−α / 2 < < u1−α / 2 ⎟ = 1 − α
⎝ σ/ n ⎠
金融与统计学院

⎛ σ σ ⎞
得 ⎜ X − u1−α /2 , X + u1−α / 2 ⎟
⎝ n n⎠

汤银才 yctang@stat.ecnu.edu.cn 第20页


(2) σ2 未知,μ 的置信区间

X −μ
华东师范大学

枢轴量 t= ~ t (n − 1)
S/ n
⎛ X −μ ⎞
由 P ⎜ −t1−α / 2 ( n − 1) < < t1−α / 2 ( n − 1) ⎟ = 1 − α
⎝ S/ n ⎠
金融与统计学院

⎛ S S ⎞
得 ⎜ X − t1−α / 2 ( n − 1) , X + t1−α / 2 ( n − 1) ⎟
⎝ n n⎠

汤银才 yctang@stat.ecnu.edu.cn 第21页


(3) μ 已知, σ2的置信区间

⎛ Xi − μ ⎞ n 2

枢轴量 χ = ∑ ⎜ χ 2 (n)
华东师范大学

2
⎟ ~
i =1 ⎝ σ ⎠

⎛ 1 n ⎞ = 1−α
2 ∑
P χ
由 ⎜ α /2 2
( n ) < ( i )
X − μ
2
< χ
2
( n ) ⎟
⎝ ⎠
1− α / 2
σ i =1
金融与统计学院

⎛ n n

⎜∑ ( − μ ) ∑ ( − μ )
2 2
X i
X i⎟
得 ⎜ i =1
, i =1

⎜⎜ χ α ( n ) χα (n) ⎟
2 2
1− / 2 /2

⎝ ⎠

汤银才 yctang@stat.ecnu.edu.cn 第22页


(4) μ未知, σ2的置信区间
2
⎛ Xi − X ⎞ n
枢轴量 χ = ∑ ⎜ 2
⎟ ~ χ (n − 1)
2
华东师范大学

i =1 ⎝ σ ⎠

( 1
)
n

由 P χ ( n − 1) < ∑(X −X ) <χ ( n − 1) = 1 − α


2 2 2

α /2 1−α / 2
σ
2 i
i =1

⎛ n n

⎜ ∑ (Xi − X ) ∑ (Xi − X ) ⎟
金融与统计学院

2 2

得 ⎜ i =1 2 , i =1

⎜⎜ χ 1− α / 2 ( n − 1) χ α / 2 ( n − 1) ⎟
2


⎝ ⎠
(n − 1) S 2 (n − 1) S 2
[ 2 , 2 ]
χ1−α 2 (n − 1) χα 2 (n − 1)

汤银才 yctang@stat.ecnu.edu.cn 第23页


例5 用天平秤某物体的重量9次,得平均值为
华东师范大学

x = 15.4(克),已知天平秤量结果为正态分
布,其标准差为0.1克。试求该物体重量的0.95
置信区间。
解:此处1-α=0.95,α=0.05,查表知u0.975=1.96,
金融与统计学院

于是该物体重量μ 的0.95置信区间为
⎛ σ σ ⎞
⎜ x − u1−α / 2 , x + u1−α / 2 ⎟
⎝ n n⎠
= (15.3347,15.4653)
汤银才 yctang@stat.ecnu.edu.cn 第24页
例6 设轮胎的寿命服从正态分布。随机地抽12只轮
华东师范大学

胎试用,测得它们的寿命(单位:万公里)如下:
4.68 4.85 4.32 4.85 4.61 5.02
5.20 4.60 4.58 4.72 4.38 4.70
求平均寿命的置信区间。
金融与统计学院

解:经计算有 =4.7092,s =0.0615。取α =0.05,


x 2

查表知t0.975(11)=2.2010,于是平均寿命的0.95
置信区间为(单位:万公里)
⎛ S ⎞
⎜ X ± t1−α / 2 ( n − 1) ⎟ = (4.5516, 4.8668)
⎝ n⎠
汤银才 yctang@stat.ecnu.edu.cn 第25页
单侧置信限(5.5)

在某些实际问题中,只需求置信下限,或
华东师范大学

置信上限,例:
¾ 产品的寿命越长越好,因此希望知道
平均寿命的单侧置信下限。
金融与统计学院

¾ 产品的次品率越低越好,因此希望知
道次品率的单侧置信上限。

汤银才 yctang@stat.ecnu.edu.cn 第26页


¾单侧置信下限 满足以下式子的 θˆL
华东师范大学

Pθ (θˆL ≤ θ ) = 1 − α ,

¾单侧置信上限 满足以下式子的 θˆU


金融与统计学院

Pθ (θ ≤ θˆU ) = 1 − α ,

汤银才 yctang@stat.ecnu.edu.cn 第27页


华东师范大学 单侧置信限的求法

¾ 在双侧置信区间公式中,取区间的
下端点,且将α/2 改成 α ,即可得
单侧置信下限。

¾ 在双侧置信区间公式中,取区间的
金融与统计学院

上端点,且将α/2 改成 α ,即可得
单侧置信上限。

汤银才 yctang@stat.ecnu.edu.cn 第28页


例7 前面轮胎平均寿命的双侧置信区间为
华东师范大学

⎛ S ⎞
⎜ X ± t1−α / 2 ( n − 1) ⎟ = (4.5516, 4.8668)
⎝ n⎠

所以轮胎平均寿命的单侧置信下限为
金融与统计学院

S
X − t1−α ( n − 1) = 4.5806.
n
其中α =0.05,查表知 t0.95(11)=1.7959

汤银才 yctang@stat.ecnu.edu.cn 第29页


5.4.4 两正态总体下的置信区间

设总体 X ~ N(μ1, σ12),Y ~ N(μ2, σ22),从中分别


华东师范大学

抽取容量为 n 和 m 的独立样本,样本均值和样
本方差分别记为
X , Y , S X2 , SY2 ,
金融与统计学院

下面讨论
1) 两个均值差
2) 两个方差比
的置信区间。
汤银才 yctang@stat.ecnu.edu.cn 第30页
华东师范大学 一、两个正态总体均值差的置信区间

⎛ σ 12 σ 22 ⎞
X − Y ∼ N ⎜ μ1 − μ2 , + ⎟
金融与统计学院

⎝ n m⎠

汤银才 yctang@stat.ecnu.edu.cn 第31页


σ12与 σ22已知时

( X − Y ) − ( μ1 − μ2 )
华东师范大学

U= ∼ N (0, 1)
σ 2
σ 2
1
+ 2
n m

所以 μ1−μ2 的置信区间为:
金融与统计学院

⎛ σ 12 σ 22 σ 12 σ 22 ⎞
⎜ X − Y − u1−α /2 + , X − Y + u1−α /2 + ⎟
⎜ n m n m ⎟⎠

汤银才 yctang@stat.ecnu.edu.cn 第32页


σ12与 σ22未知时

(1) σ1= σ2 = σ 时:
华东师范大学

因为 X Y 都是 σ2 的无偏估计,
2 2
S , S
( n − 1) S 2
+ ( m − 1) S 2
SW2 = X Y
也是 σ2 的无偏估计,
n+m−2
金融与统计学院

X − Y − ( μ1 − μ2 )
T= ∼ t ( n + m - 2) 所以
1 1
SW +
n m
1 1
μ1−μ2 的置信区间为: X − Y ± t1−α /2 (n + m − 2) +
n m
汤银才 yctang@stat.ecnu.edu.cn 第33页
华东师范大学

(2) n 与 m 充分大时:

( X − Y ) − ( μ1 − μ2 )
T= ∼ N (0, 1)
2 2
S S
X
+ Y
金融与统计学院

n m

S X2 SY2
所以 μ1−μ2 的置信区间为: X − Y ± u1−α /2 +
n m

汤银才 yctang@stat.ecnu.edu.cn 第34页


(3) n = m 时(成对数据):
华东师范大学

令 Zi = Xi−Yi , i = 1, 2, …, n
则 Zi = Xi−Yi ∼ N ( μ1 − μ2 , σ 1 + σ 2 ) ,所以
2 2
金融与统计学院

Z − ( μ1 − μ2 )
T= ∼ t (n − 1)
SZ / n
SZ
所以 μ1−μ2 的置信区间为: Z ± t1−α /2 (n − 1)
n

汤银才 yctang@stat.ecnu.edu.cn 第35页


二、 σ12/σ22 的置信区间(μ1,μ2 未知)

由于(n-1) sx /σ 12∼ χ2(n-1),


2
华东师范大学

(m-1) sy /σ 22∼ χ2(m-1),


2
2 2
且sx 与sy 相互独立,故
s x2 σ 12
F = 2 2 ~ F ( n − 1, m − 1)
sy σ 2
金融与统计学院

⎛ sx2 σ 22 ⎞
由 P ⎜⎜ Fα 2 ( n −1, m −1) ≤ 2 ⋅ 2 ≤ F1−α 2 ( n −1, m −1) ⎟⎟ = 1 − α
⎝ s y σ1 ⎠

⎛ s x2 1 s x2 1 ⎞
⎜⎜ 2 , ⎟⎟
得 ⎝ s y F1−α 2 ( n − 1, m − 1) s y2 Fα 2 ( n − 1, m − 1) ⎠

汤银才 yctang@stat.ecnu.edu.cn 第36页


例 某车间有两台自动机床加工一类套筒,假设套筒直径服
华东师范大学

从正态分布。现在从二个班次的产品中分别检查了5个
和6个套筒,得其直径数据如下(单位:厘米):
甲班:5.06 5.08 5.03 5.00 5.07
乙班:4.98 5.03 4.97 4.99 5.02 4.95
试求两班加工套筒直径的方差比σ 甲2/σ 乙2的0.95置信区
金融与统计学院

间。
2 2
解:由数据算得 sx =0.00037, sy =0.00092,而且
1 1
F0.025 ( 4,5) = = = 0.1068, F0.975 ( 4,5) = 7.39
F0.975 ( 5,4) 9.36

故置信区间 (0.0544,3.7657)
汤银才 yctang@stat.ecnu.edu.cn 第37页
5.6 比率p的置信区间

z 比率:
华东师范大学

1. 具有某种性质的个体数目在全部总体中所占的比率
2. 一定条件下某事件发生的概率
z 举例
– 产品的不合格品率
金融与统计学院

– 某电视节目的收视率
– 对某领导的支持率
– 某武器射弹的命中率
– 掷一硬币出现正面向上的概率

汤银才 yctang@stat.ecnu.edu.cn 第38页


z 问题描述
华东师范大学

– X服从二点分布b(1,p), p为上面据说的比率
– X1,X2,……,Xn为来自b(1,p)的一个样本
– 求p的区间估计
z 方法
1. 小样下的精确区间估计(P338-341)
金融与统计学院

2. 大样本下的近似区间估计

汤银才 yctang@stat.ecnu.edu.cn 第39页



华东师范大学

得p的置信水平为1-α的近似置信区间
金融与统计学院

汤银才 yctang@stat.ecnu.edu.cn 第40页


华东师范大学

习 题(P324)
习题5.4 1,3,7,9,12, 15.
金融与统计学院

汤银才 yctang@stat.ecnu.edu.cn 第41页

You might also like