Professional Documents
Culture Documents
1 引言
王成
chengwang@sjtu.edu.cn
上海交通大学数学科学学院
3.1.1 参数估计问题
3.1.2 点估计
3.1.3 点估计的优良性准则
估计方法引例
Section 1
3.1.1 参数估计问题
基本问题
统计学的基本任务是通过样本推断总体或者总体的某个特征.
参数估计
假设样本X1 , · · · , Xn 来源于某一个总体F , 通过样本来推断总体的某个
特征θ = θ(F ).
需要估计的参数
社会生活中有很多地方需要估计参数,例如
I 估计均值µ 或者标准差σ- θ = θ(F ) = xdF (x)µ 或者 θ(F ) = σ;
R
I 3-σ准则我们需要估计θ(F ) = µ ± 3σ;
I 中位数θ(F ) = F −1 (1/2);
I 新的观察值大于1的概率:
Z ∞
θ(F ) = P(X > 1) = dF (x).
1
点估计和区间估计
参数估计问题本质上需要构造合适的统计量来描述感兴趣的参
数θ = θ(F ).
I 点估计(point estimation): 构造一个统计量θ̂ = θ̂(X1 , . . . , Xn )来估
计θ.(第三章主要内容)
I 区间估计(interval estimation): 构造一个区间(或域)[θ̂1 , θ̂2 ]来估
计θ. (第四章主要内容)
Section 2
3.1.2 点估计
问题
假设样本X1 , · · · , Xn 来源于某一个总体F , 哪些统计量可以估计总体的
均值θ = θ(F )?
潜在的统计量:
1
Pn
I 样本均值:θ̂1 = X̄ = n i=1 Xi .
I 样本中位数:θ̂2 = X(n/2) 或θ̂2 = 1/2X((n−1)/2) + 1/2X((n+1)/2) .
I 最大最小值平均:θ̂3 = 1/2X(1) + 1/2X(n) .
I 去除最大最小的各5个样本之后的样本均
Pn−5
值:θ̂5 = X̄ = n−10
1
i=6 X(i) .
分布族与点估计
例如对于上述正态总体,如果我们可以构造出µ和σ很好的估计µ̂, σ̂, 那
么感兴趣的参数一律可以用ĝ = g (µ̂, σ̂)来估计.
同样的一组样本如果假定来自于指数分布族Exp(λ), 其中参数
为θ = λ ∈ {λ > 0}. 感兴趣的问题为:
I 估计均值g (θ) = 1/λ或标准差g (θ) = 1/λ.
I 3-σ准则我们需要估计g (θ) = 4/λ;
I 中位数g (θ) = log (2)/λ;
I 大于1的概率:
通过上述正态分布族与指数分布族可以看出,假定不同的分布族可以
得到完全不同的估计问题以及很不一样的估计方法。
如何判断分布族?
在实际问题中,分布族的选取是至关重要的,对于参数估计也是如
此。 应该如何选取合适的分布族?
library(ACSWR)
data(nerve)
set.seed(123)
hist(nerve,breaks =10,freq =FALSE,main = "Histogram of nerve Dataset")
Histogram of nerve Dataset
3
Density
2
1
0
Density
E θ̂ = θ.
无偏性逻辑
I 无偏估计表明构造出的估计没有系统偏差;
I 无偏性意味着估计方法大量多次使用时,给出的结果接近于真实
参数θ.
I 数学上无偏性是基于随机变量的一阶矩(几乎是最弱的条件);
I 在没有其他合理准则可循时,人们心理上觉得: 一个具有无偏性的
估计,总比没有这种性质的估计要好些.
无偏性例1
是总体方差的无偏估计.
无偏性例2
无偏性关注的是估计的一阶矩,进一步的我们可以关注二阶矩–对应的
是均方损失(Mean Squared Error, MSE)
且至少存在一个θ使得不等号严格成立,则称估计方法ĝ1 (X )比ĝ2 (X )有
效.
相合性
无偏性与均方损失考察的是估计的一阶矩和二阶矩,相合性关注的是
统计量的大
大样 本 性 质 .
估计的相合性
主要研究当样本大小n → ∞时候,估计量如何收敛到真实参数:
?
ĝn (X ) = ĝn (X1 , . . . , Xn ) → g (θ).
估计方法引例
引例
思考
抛一枚硬币1000次,513次正面,我们估计该硬币正面向上的概
率p̂ = 0.513. 这背后的逻辑是什么?
逻辑1
我们知道抛硬币是一个Bernoulli分布随机变量,
P(X = 1) = 1 − P(X = 0) = p.
期望E (X ) = p. 抛很多次的均值
n
1X
X̄ = Xi → E (X ), (大数定律)
n
i=1
所以我们可以用平均值0.513来估计p,理论上抛的次数很多时候这个估
计应该是很好的。
逻辑2
我们计算抛出513次的概率
513 513
P(抛1000次出现513次正面) = C1000 p (1 − p)487 .
我们反过来思考什么样的p可以使得上述概率最大:
513 513
p̂ = arg max C1000 p (1 − p)487 = 0.513.
p