You are on page 1of 23

粒子物理与核物理实验中的

数据分析
陈少敏
清华大学

第十一讲:置信区间
本讲要点
„ 统计误差中的标准误差问题

„ 经典置信区间问题

„ 利用似然函数或二乘函数确定置信区间

2
测量结果的表述与含义
实验目的:估计θˆobs
实验数据:x1 ,..., xn
并且还应给出 θˆ 的方差,即 σmθ2ˆ 。结果应该报告成下述形式

θˆobs ± σˆθˆ = 5.73 ± 0.21

其真正的含义是什么呢?

如果我们知道 θˆ 将服从某一概率密度函数分布 g (θˆ;θ ),那么上述


结果的正确表述应该是
θ 的估计值为 5.73
σ θˆ 的估计值为 0.21 σ θˆ测量了g (θˆ;θ )的分布宽度
3
参数估计值的分布
通常参数估计值服从的概率密度分布函数 g (θˆ;θ )是多维高斯分布
Gˆ Gˆ G
ˆ m
θ 和 V = cov[θi ,θ j ] 综合了我们对g (θ ;θ )的了解或估计
ˆ ˆ

可以用来作误差传递的输入参量,
以及用最小二乘法求平均值等等。
我们可以此约定来报告误差,而不管概率密度函数 g(θˆ;θ )的形式。
唯一例外的是当我们要对不同实验求平均值时,它的形式就会发挥作用。
如果 g (θˆ;θ ) 是高斯形式的话,置信区间可以表述为

[θˆobs − σˆθˆ , θˆobs + σˆθˆ ] 给出了对应于 68.3% 置信区间范围。

如果 g (θˆ;θ ) 不是服从高斯分布
中心置信区间应给出不对称的误差 4
经典置信区间
假设我们对参数 θ 有估计量 θˆ,并且有估计值 θˆobs ,
为了正确表述结果,对于所有的θ 我们仍需要知道 g(θˆ;θ )的形式。
首先需要指定“上下分布尾部的概率”,例如:α = β = 0.05
然后找出 uα (θ ),ν β (θ ), 使得
α = P (θˆ ≥ uα (θ ))

= ∫
uα ( θ )
g (θˆ; θ ) d θˆ
= 1 − G ( uα (θ ); θ ),
β = P (θˆ ≤ ν β (θ ))
ν β (θ )
= ∫ −∞
g (θˆ; θ ) d θˆ
= G (ν β (θ ); θ )
5
经典置信区间(续一)
无论θ 为何值,在置信带找到 θˆ 的概率为

P (vβ (θ ) ≤ θˆ ≤ uβ (θ )) = 1 − α − β
假设 uα (θ ), vβ (θ ) 是单调变化的,那么

a (θˆ) ≡ uα−1 (θˆ), b(θˆ) ≡ vβ−1 (θˆ)


不等式
θˆ ≥ uα (θ ), θˆ ≤ vβ (θ )
等价于 在uα (θ ),υ β (θ )之间的区域称为置信带。

a (θˆ) ≥ θ , b(θˆ) ≤ θ P(a (θˆ) ≥ θ ) = α , P(b(θˆ) ≤ θ ) = β .


或者合并成
在不知道真值θ 的情况下,通过估计
P(a (θˆ) ≤ θ ≤ b(θˆ)) = 1 − α − β 值θˆ与函数 a, b 给出θ 的置信区间。 6
经典置信区间(续二)
区间[a (θˆ), b(θˆ)]称为具有置信水平或覆盖概率 1 − α − β 的置信区间。
它的深刻含义是 包含真实参数的概率为1- α -β
注意,该区间是随机的,真值 θ 是一个未知常数。
通常情况下,将区间 [a, b] 报告为θˆ−+cd , 即 c = θˆ − a, d = b − θˆ。
那么 θˆ = 80.25+−0.31
0.25 意味着什么呢?它并不意味着任意一次实验:

P (80.00 < θ < 80.56) = 1 − α − β


而是意味着:重复同样样本大小的实验多次,每次按同样的描述构造置信
区间,有1- α -β 部分的实验,置信区间将覆盖θ。
有时,只有指定的 α 或 β 单边区间(极限)
通常,取α=β=γ /2 覆盖概率为1-γ 中心置信区间
注意:中心置信区间并不意味着区间对于θˆ 是对称的,它仅因为α =β。
粒子物理与核物理的误差惯例是:68.3%的中心置信区间。 7
经典置信区间(续三)
通常,我们并不构造置信带,而是解下列方程

α = ∫ˆ g (θˆ; a )dθˆ = 1 − G (θˆobs ; a)
θ obs
θˆobs
β =∫ g (θˆ; b)dθˆ = G (θˆobs ; b)
−∞

得到a与b的区间极限。
a是θ 的假设值使得:P (θˆ > θˆobs ) = α
b是θ 的假设值使得:P(θˆ < θˆ ) = β
obs

8
高斯分布估计量的置信区间
如果存在

1 ⎛ − (θˆ − θ ) 2 ⎞
g (θˆ;θ ) = exp⎜ ⎟
2πσ θ2ˆ ⎜ 2σ ˆ ⎟ 2
⎝ θ ⎠
为了找到 θ 置信区间,解下列方程

⎛ θˆobs − a ⎞
α = 1 − G (θˆobs ; a, σ θˆ ) = 1 − Φ⎜ ⎟,
⎜ σˆ ⎟
⎝ θ ⎠
⎛ θˆobs − b ⎞
β = G (θˆobs ; b, σ θˆ ) = Φ⎜ ⎟,
⎜ σˆ ⎟
⎝ θ ⎠
得到a与b的解
9
高斯分布估计量的置信区间(续)
前面的函数 G 是对于θˆ 的累积分布,且
x 1 − x '2 / 2
Φ ( x) = ∫ e dx'
−∞

是标准高斯的累积函数,可以证明

a = θˆobs − σ θˆ Φ −1 (1 − α ),
b = θˆobs + σ θˆ Φ −1 (1 − β )
这里Φ −1给出标准高斯的分位点(累积分布的倒数,可以调用CERNLIB
的程序GAUSIN计算)。

Φ −1 (1 − α ), Φ −1 (1 − β ) 给出 a 与 b 离 θˆ 有多少标准偏差。
10
标准高斯的分位点
为了找到服从高斯分布的一个参数估计量的置信区间,需要下列分位点

通常对分位点取整 有时对概率覆盖率取整
中心 单边 中心 单边
Φ −1 (1 − γ / 2) 1− γ Φ −1 (1 − α ) 1−α 1− γ Φ −1 (1 − γ / 2) 1 − α Φ −1 (1 − α )
1 0.6827 1 0.8413 0.90 1.645 0.90 1.282
2 0.9544 2 0.9772 0.95 1.960 0.95 1.645
3 0.9973 3 0.9987 0.99 2.576 0.99 2.326 11
泊松分布均值的置信区间
假设 n是泊松量,νˆ = n,估计值 νˆobs = nobs ,

νn
P(n;ν ) = e −ν , n = 0,1,...
n!
虽然对于固定的 α,β,置信带对所有的 ν 并不存在,但依然可以解方程
nobs −1
a n −a
α = P(νˆ ≥ νˆobs ; a) = 1 − ∑n =0 n!
e ,
nobs
b n −b
β = P(νˆ ≤ νˆobs ; b) = ∑ e ,
n = 0 n!

得出a与b
12
泊松分布均值的置信区间(续一)
利用
m
νn
∑ n!
n =0
e −ν = 1 − Fχ 2 (2ν ; nd = 2(m + 1))

这里 Fχ 2 是 nd 自由度下最小二乘分布的累积形式。
nobs −1
an −a
α = 1− ∑ n!
e , 1 −1
a = Fχ 2 (α ; nd = 2nobs ),
n =0 2
nobs
bn −b 1 −1
β =∑ e , b = Fχ 2 (1 − β ; nd = 2(nobs + 1)),
n =0 n ! 2
这里 Fχ−21 是最小二乘分布的分位点(可以调用CERNLIB的程序CHISIN
进行计算)。 13
泊松分布均值的置信区间(续二)
重要特例: nobs = 0
0
bn e−b
β =∑ = e−b b = − log β
n =0 n!
对于置信水平 1-β=95%
的上限,

b = − log(0.05)
= 2.996 ≈ 3.

14
例子:稀有衰变分支比
已知实验对稀有衰变 K + → π +νν 的单个事例灵敏度为
1 1
灵敏度 = =
N 观测总数 × ε 效率 3.93 ×109
如果实验上没有观察到一个事例,要给出90%的置信水平,需计算
分支比上限
e− μ μ n
P(n = 0; μ ) = = 10% μ = 2.30259 ≤
2.30259
= 0.59 × 10−9
n!
3.93 × 10 9

如果实验上观察到一个事例,要给出68%的置信区间的分支比,需要给
出重复实验在(1-0.68)/2=0.16范围内观察到至少一个事例的均值下限

∑ P(n; μ ) = 1 − P(0; μ ) = 0.16 μ = 0.17435 1+−2.28852


n =1 BR = 0.82565

以及不多于一个事例的均值上限 3.93 × 109


1
= (2.54+−5.82 ) × 10 −10

∑ P(n; μ ) = 0.16 μ = 3.28852 2.10


15
n =0
从log L或 χ2 近似给出置信区间
若 log L(θ ) 呈抛物线状,通过将log L(θ )展开, 则可得到
(θ − θˆ) 2 N 2
log L(θ ) = log Lmax − log L(θˆ ± Nσ θˆ ) = log Lmax − .
2σm2 ˆ
θ 2
即使 log L(θ )并不呈抛物线状,上式也可以给出置信区间的近似值,即
2
N
log L(θˆ−+cd ) = log Lmax − , χ 2 (θˆ−+cd ) = χ min
2
+ N 2,
2
这里 N = Φ −1 (1 − γ / 2) 是标准高斯对应于
置信水平 1-γ 的分位点,例如:
N =1 ⇒ 1 − γ = 0.683
例如在指数函数例子中,有n=5个观测值

τ = 0.85−0.30
ˆ +0.52
16
例子:激光球位置定位
在布置的 Project 练习中,为了确定发光
点(激光球)的位置,我们利用了假设:
光的传输均为直线到达各光电倍增管

因此, ti
TOFi
N
(t − TOF ) 2 tj
χ2 = ∑ i 2 i ,
i =1 σ t (qi ) TOFj

TOFi = ( xi − x0 ) 2 + ( yi − y0 ) 2 + ( zi − z0 ) 2 / v光速 ,
拟合参数:
( x0 , y0 , z0 ),
qi =第i个光电倍增管所测量的电荷。

利用MINUIT求χ 2的最小值,给出拟合参数估计值。
17
激光球位置定位(续一)
** 3 **MIGRAD MINUIT 给出正常信息

MIGRAD MINIMIZATION HAS CONVERGED.
MIGRAD WILL VERIFY CONVERGENCE AND ERROR MATRIX.
COVARIANCE MATRIX CALCULATED SUCCESSFULLY
FCN=12173 FROM MIGRAD STATUS=CONVERGED 42 CALLS 149 TOTAL
EDM=4.63375e-07 STRATEGY= 1 ERROR MATRIX ACCURATE

** 4 **HESSE
COVARIANCE MATRIX CALCULATED SUCCESSFULLY
FCN=12173 FROM HESSE STATUS=OK 16 CALLS 165 TOTAL
EDM=4.634e-07 STRATEGY= 1 ERROR MATRIX ACCURATE
EXT PARAMETER INTERNAL INTERNAL
NO. NAME VALUE ERROR STEP SIZE VALUE
1 x_ball 1.19248e+02 5.18328e-01 5.53129e-03 1.19248e+02
2 y_ball 2.00654e+02 5.16683e-01 5.51239e-03 2.00654e+02
3 z_ball 2.04621e+02 4.87005e-01 5.24468e-03 2.04621e+02

18
激光球位置定位(续二)
NO. NAME VALUE ERROR STEP SIZE VALUE
1 x_ball 1.19248e+02 5.18328e-01 5.53129e-03 1.19248e+02
2 y_ball 2.00654e+02 5.16683e-01 5.51239e-03 2.00654e+02
3 z_ball 2.04621e+02 4.87005e-01 5.24468e-03 2.04621e+02
EXTERNAL ERROR MATRIX. NDIM= 25 NPAR= 3 ERR DEF=1
2.687e-01 3.683e-02 4.735e-03
3.683e-02 2.670e-01 7.282e-03 方差矩阵
4.735e-03 7.282e-03 2.372e-01
PARAMETER CORRELATION COEFFICIENTS
NO. GLOBAL 1 2 3
1 0.13832 1.000 0.138 0.019
2 0.14003 0.138 1.000 0.029 相关系数矩阵
3 0.03256 0.019 0.029 1.000

19
激光球位置定位(续三)
报告结果
在假设光的传输均为直线到达各光电倍增管,测量误差仅考虑光电倍增
管对时间测量的标准误差情况下,拟合结果为:

xˆ0 = (119.25 ± 0.52)cm ⎛ 1.000 0.138 0.019 ⎞


⎜ ⎟
yˆ 0 = (200.65 ± 0.52)cm 相关系数 = ⎜ 0.138 1.000 0.029 ⎟
zˆ0 = (204.62 ± 0.49)cm ⎜ 0.019 0.029 1.000 ⎟
⎝ ⎠
χ 2 /( N − 3) = 1.82

上述误差均为统计误差,拟合的χ2/ndf值偏离期待值1较大。

20
激光球位置定位(续四)
为了确认真值有68.3%
的可能性出现所给出的
置信区间内,重复10次
实验,得到平均值

x0 = (120.3 ± 0.4)cm
真值
y0 = (201.5 ± 0.3)cm
z0 = (204.3 ± 0.4)cm
注意:由于 χ2/ndf 大于
1,误差均含修正因子。

多次测量的结果均相符
多次测量的结果均相符

但是与真值有偏差… 21
激光球位置定位(续五)
如果把一些偏离期望值太大的测量
去除,将有什么样结果?
例如:要求 Δti < 2.5ns
xˆ0 yˆ 0 zˆ0
119.25 200.65 204.62 (所有测量)
116.41 198.06 202.55 (第一次迭代) 不好的观测
115.94 197.58 202.31 (第二次迭代)
115.92 197.55 202.29 (第三次迭代)
110.39 199.42 196.13 (真值) Δt (ns)

去掉不好的测量,使得结果更靠近真值。
第三次迭代的结果比最初的结果更靠近真值,但是与真值之间的差距依
然较大。这是因为有系统误差的影响(以后有专门的讨论)。因此,正确
的置信区间还应该包含系统误差的贡献。 22
小结
1. 统计误差中的标准偏差问题
讲述了如果实验多次重复的情况下,估计量θˆ 如何分布。该分布在用
最小二乘法求平均是非常有用,而且有时需要给出非对称误差。
2. 经典置信区间
很复杂!随机区间在给定概率条件下包含真实参数值。
(a) 对于服从高斯分布的估计量:
[θˆ-σ , θˆ + σ ]是68.3%的中心置信区间。
θˆ θˆ

(b) 对于泊松分布的均值:
观测 n 个事例,设定ν 的极限。如果没有观察到事例,95%的上限为3。

3. 利用似然函数或二乘函数给出近似的置信区间
取 log L在其最大值的变化1/2处定出68.3%的置信区间。
23

You might also like