You are on page 1of 66

数理统计知识结构

概率论与数理统计的区别
在概率论中,我们所研究的随机变量,它的分布
都是假设已知的,在这一前提下去研究它的性质、特
点和规律性,例如求出它的数字特征,讨论随机变量
函数的分布,介绍常用的各种分布等。
在数理统计中,我们研究的随机变量,它的分布
是未知的,或者是不完全知道的,人们是通过对所研
究的随机变量进行重复独立的观察,得到许多观察值,
对这些数据进行分析,从而对所研究的随机变量的分
布作出种种推断的.
数理统计知识结构
统计推断的一般过程是, 首先从总体中抽取样本, 构造样
本统计量, 用统计量来描述样本的分布特征, 并对总体的
分布或数字特征做出统计推断.
本章知识结构图
总体、样本、统计量、描述性统计、正态总体下的常用统
计量等.
实际问题 总体

代表性
描述性统计 样本
独立性

Excel 统计量

三大抽样分布
应用

正态总体下常用统计量
本章知识结构图
☆实际问题中把研究对象的全体称为总体, 从总体中抽取
的部分对象就是样本, 统计推断是用样本提供的信息来推
断总体的特征.
☆ 常用的样本是简单随机样本, 它满足代表性和独立性.
样本的代表性和独立性是构造统计量的基础, 也是统计推
断的基础.
☆ 统计量的分布称为抽样分布.
☆ 在样本代表性和独立性的基础上, 利用三大抽样分布
可以构造正态总体下的常用统计量
数理统计方法在各个领域的应用
1.农业--对田间试验进行适当的设计和统计分析。
2.工业生产--用统计方法改革工艺流程、使用代用原材料和寻求
适当的配方等。
3.医学--确定一种药物对治疗某种疾病是否有用,用处多大,以
及比较几种药物或治疗方法的效力。
4.抽样调查--抽取样本推断总体情况。 请同学们举例……
§4.1 样本与统计量
在数理统计中, 把研究对象的全体称为总体, 总体中
的每个元素称为个体
例如,在研究某高校学生生活消费状况时,该校全体
学生就是一个总体,其中每一个学生是一个个体
在人口普查中,总体是某地区的全体人口,个体就是
该地区的每一个人
§4.1 样本与统计量
为了研究总体X(有限总体、无限总体)的特性,总
是从总体中抽出部分个体进行观察和试验,根据观察或
试验得到的数据推断总体的性质.
从总体中抽出的部分个体称为样本(X1,X2,...,Xn)
把样本中包含个体的数量称为样本容量n
把对样本的观察或试验的过程称为抽样
把观察或试验得到的数据称为样本观测值(观测数
据),简称样本值x1,x2,...,xn.
请举例说明以上概念?
§4.1 样本与统计量——抽样方法
抽样方法可分为概率抽样和非概率抽样.
概率抽样是按随机原则进行的抽样.
随机原则是指在抽样时排除主观上有意识地抽取个
体, 使每个个体都有一定的机会被抽到, 每个个体被抽
到的概率是已知的, 或是可以计算出来的.
概率抽样可分为放回抽样、无放回抽样
§4.1 样本与统计量——抽样方法
概率抽样需要抽样框, 抽样框是包含总体中每个个体
特征的个体名册, 如学生花名册. 抽样框用以确定总体的
抽样范围和结构.
常用的概率抽样有简单随机抽样、分层抽样、整群抽
样、系统抽样、多阶段抽样等.
§4.1 样本与统计量——抽样方法
简单随机抽样是从抽样框中随机地、一个一个地抽取
的个体, 每个个体入样的概率是相等的.
分层抽样是先将总体按某种规则划分为若干不同的“
层”, 然后在每一层内进行简单随机抽样.
§4.1 样本与统计量——抽样方法
整群抽样是先将总体按某种规则分为若干不同的“群
”, 以群为抽样单位进行简单随机抽样, 被抽中的群作为
样本.
§4.1 样本与统计量——抽样方法
系统抽样是将总体按某一标志排序, 然后每隔一定距
离抽取一个个体构成样本. 典型的做法是先从数字1~k中
随机抽取一个数字r作为初始个体, 然后依次抽取第个r+k
个体、第个r+2k个体、第个r+3k个体、…, 组成样本.
多阶段抽样是先抽取一个样本, 再在抽取的样本中抽
取样本.
§4.1 样本与统计量——抽样方法
非概率抽样是指不按随机原则, 而是根据方便原则或
研究人员的主观判断选择样本的抽样方法.
非概率抽样有方便抽样、判断抽样、配额抽样、志愿
者入样、滚雪球抽样等形式
§4.1 样本与统计量
定义 一种抽样方法若满足下面两点,称其为简单随机抽
样:
(1) 总体中每个个体被抽到的机会是均等的;
(2) 样本中的个体相互独立.
由简单随机抽样得到的样本称为简单随机样本.

如果没有特殊说明,以后所说样本均指简单随机样本.
§4.1 样本与统计量——简单随机样本
设X1,X2,...,Xn是从总体X中抽出的简单随机样本,
有下面两个特性:
(1)代表性:X1,X2,...,Xn均与X同分布,即若X
 F(x),则对每一个Xi都有
Xi  F(xi),i = 1,2,…,n
(2) 独立性:X1,X2,...,Xn相互独立.
由这两个特性可知,若X的分布函数为 F(x),则X1 ,
X2,...,Xn的联合分布函数为
F(x1,x2,…,xn) = F(x1)F(x2)…F(xn)
总体分布往往是未知或不完全知道的,是需要通过样
本来进行研究和推断的.
§4.1 样本与统计量——简单随机样本
设总体X的分布函数为F(x), X1, X2,…, Xn是来自总体容
量为n的样本, 则样本的联合分布函数为
n
F ( x1 , x 2 ,, x n ) =  F ( xi )
i =1
若总体为离散型随机变量X, 其分布列为 P{ X = xi }= p( xi ) =
i =1, 2 ,  则样本的联合分布列为
n
p( x1 , x 2 ,, x n ) =  p( xi )
i =1
若总体为连续型随机变量X, 其密度函数为f(x), 则样本的
联合密度函数为 n
f ( x1 , x 2 ,, x n ) =  f ( xi )
i =1
§4.1 样本与统计量——简单随机样本
例 设X1, X2,…, Xn是来自总体——某小商店一小时内到达
的顾客数X~P(5)的样本. 试求E(Xi), D(Xi), E(2X1+3X2),
D(2X2-3Xn).
解 总体 X~P(5), E(X)=D(X)=5.
由于简单随机样本中个体与总体服从相同的分布, 且
相互独立, 所以
Xi~P(5), E(Xi)=D(Xi)=5, i=1,2,…,n.
E(2X1+3X2)= 2E(X1)+3E(X2)=2*5+3*5=25
D(2X2-3Xn)=4D(X2)+9D(Xn)=4*5+9*5=65
§4.1 样本与统计量——简单随机样本
例 设有一大批产品, 其废品率p未知, 现从中随机抽取容
量为n的样本X1, X2,…, Xn进行检验, 求样本的联合分布.
解 将这批产品视作一个总体X, X~B(1,p), 其分布列为
p(x)=px(1-p)1-x, x=0,1.
由样本的代表性可知, Xi ~ B(1,p), i=1,2,…,n, 其分布列为
1− xi
p( xi ) = p (1 − p)
xi
, xi = 0 ,1
由样本的独立性可知, 样本的联合分布列为
n
p( x1 , x2 ,, xn ) =  P( X i = xi )
i =1
xi n −xi
= p (1 − p)
§4.1 样本与统计量——简单随机样本
例 设X1, X2,…, Xn是来自总体X~Exp()的样本, 试求样本
的联合分布.
0 , x  0,
解 总体X ~ Exp(), 则X的密度函数为f ( x) = e −x , x  0 ,

由样本的代表性可知, Xi ~ Exp(), xi的密度函数为
0 , xi  0,
f ( xi ) =  −  x
 e i , xi  0,
由样本的独立性可知, 样本的联合密度为
n 0 , 至少有一个xi  0 ,
f ( x1 , x2 ,, xn ) =  f ( xi ) =  n −x
i =1   e i
, xi  0 .
§4.1 样本与统计量
对样本加工,主要就是构造统计量.
定义 设X1,X2,…,Xn为来自总体X的样本,称不含
未知参数的样本的函数g(X1,X2,…,Xn)为统计量。
若x1,x2,...,xn为样本观测值,则称g(x1,x2,...,xn)
为统计量g(X1,X2,…,Xn)的观测值.

描述总体特征的数值为参数,通常是未知的, 用μ、σ、π
等表示。
描述样本特征的数值为统计量,是已知的或可计算获得的,
用 X、S、p等表示。
§4.1 样本与统计量
例设X1,X2,…,Xn是来自总体X的样本,X~N(,2),
其中 、2为未知参数,判断是否为统计量:
X1, 1 1
X1 + X 2 , min{ X1,X2,…,Xn }
2 3
1 n

X1
( X −  ) 2
,

i
n i =1
§4.1 样本与统计量
用样本去推断总体的特征, 需要构造合适的统计量, 自然希
望在构造统计量尽可能地保留样本中有关总体的全部信息.
统计量加工过程中一点信息都不损失的统计量称为充分
统计量
假如某质检员从一大批某种产品中依次随机地抽取了10
个产品X1,X2,…,X10, 结果发现抽出的前3个产品都是合格品,
后7个产品都是不合格品,则X1=X2 =X3=1,
X4=X5=X6=X7=X8=X9=X10=0, 记统计量
10 3
T1 =  xi , T2 =  xi
i =1 i =1
则T1是充分统计量, T2不是充分统计量.
§4.1 样本与统计量
常用的统计量是样本均值, 样本方差, 样本标准差等.
n
1
x   xi
(1)样本均值:
n i =1
n
1
(2)样本方差: s 
2

n −1 i =1
( xi − x ) 2

n
1
(3)样本标准差: s  n −1  ( xi − x ) 2
i =1

(4)样本成数: P=n1/n (n1是具有某种特征的样本单位的


个数)
§4.1 样本与统计量
定理 设总体X的期望E(X) =  ,方差D(X) =  2,X1,
X2 ,…,Xn为总体X的样本, X,S2 分别为样本均值和
样本方差,则
D( X )  2
(1)E(X) = E(X) =  D( X ) = =
n n

1 n  1 n 1 n
1 E[ X ] = E   X i  =  E[ X i ] =   = 
证明:()
 n i =1  n i =1 n i =1

1 n 1 n 1 n 2 2
Var[ X ] = Var[  X i ] = Var[ X i ] = 2   =
n i =1 n i =1 n i =1 n
§4.1 样本与统计量
(2)E(S ) = D(X) = 
2 2

证明:
了解
§4.1 样本与统计量
例 设X1,X2,…,X20是来自总体X~Exp(0.001)的样本, 试求
2
E ( x ), D( x ), E (s ).
解 X ~ Exp(0.001), E ( X ) = 1 =1000 ,
0.001
1
D( X ) = 2
= 1000000,
0.001
由样本均值和样本方差的性质知

E ( x ) = E ( X ) = 1000,
D( X ) 1000000
D( x ) = = = 50000,
20 20
E (s ) = D( X ) = 1000000.
2
作业
习题4.1:3、6、7

注:
1.写清题目号、解答步骤即可。
2.作业提交截止时间:周日晚22:00前。
3. 学习指导上的题目多练习。
§4.2 样本的描述性统计——样本数字特征
样本的描述性统计是用数字特征、表格或图形来描述样本
分布的统计方法.
设X1,X2,…,Xn 是来自总体X的一个样本值, 以下是描述样
本的一些数字特征.
(1) 极差:样本值中的最大值与最小值之差, 也称全距.
(2) 众数:样本中出现次数最多的样本值. 可能不唯一.
(3) 中位数:样本值排序后处于中间位置上的数.
若样本容量为奇数, 则中位数为排序后, 中间的那个样本
值;若样本容量为偶数, 则中位数为排序后处于中间位置
上的两个样本值的平均数.
§4.2 样本的描述性统计
4.2.1 样本数字特征
n
1
x   xi
(4)均值: n i =1
n
1
(5)方差: s 
2

n −1 i =1
( xi − x ) 2

n
1
n −1 
(6)标准差: s ( xi − x ) 2

i =1

n
1
a k   xi k
(7)k阶原点矩:
n i =1
n
1
bk   ( xi − x ) k
(8)k阶中心矩:
n i =1
§4.2 样本的描述性统计
n
4.2.1 样本数字特征 1
bk   ( xi − x ) k
b3 n i =1
(9) 偏度系数: 1 
(b2 ) 3 2
偏度系数用来描述了样本值分布的对称性.
(10) 峰度系数:   b4 − 3
2
(b2 ) 2

 1 =0
(β>0)
 1 0 1 0 (β=0)
(β<0)

不同偏态的分布曲线 不同峰度的分布曲线
§4.2 样本的描述性统计
(11) 样本协方差与相关系数
设(X1,Y1),(X2,Y2),…,(Xn,Yn)为二维总体(X,Y)
的样本,其观测值为(x1,y1),(x2,y2),…,(xn,yn),
1 n
样本协方差 S XY = 
n − 1 i =1
( X i − X )(Yi − Y )

S XY
RXY =
样本相关系数 S X SY
其中 1 n 1 n
2
SX =  i
n − 1 i =1
( X − X ) 2
, SY
2
=  i
n − 1 i =1
(Y − Y ) 2

SXY和RXY常分别用来作为总体X和Y的协方差Cov(X,Y)
与相关系数XY的估计量.
§4.2 样本的描述性统计
例 下列数据是来自某总体的一个样本值,
1.5 3.1 2.6 3.4 3.1 3.0 2.8 3.6 3.5 3.3

试求其样本众数、样本中位数、样本均值、样本方差
、样本标准差、样本偏态系数、样本峰态系数.
解 利用Excel-数据分析-描述统计 计算得:
平均 中位数 众数 标准差 方差 峰度 偏度
2.9900 3.1000 3.1000 0.6082 0.3699 3.9513 –1.7985
§4.2 样本的描述性统计
例 下列数据分别是来自两个总体的样本值,
样本1 5 1 6 4 2 3
样本2 2 3 3 3 5 8

试求两样本的协方差与相关系数.
1 n S XY
S XY = 
n − 1 i =1
( X i − X )(Yi − Y ) RXY =
S X SY
解 将样本值代入公式计算得,
Cov( x, y )  −1.1667, =COVARIANCE.s(G6:L6,G7:L7)

 xy  −0.3416 =CORREL(G6:L6,G7:L7)

样本1和样本2负相关
§4.2 样本的描述性统计——频率分布与直方图
样本值分组是将全部样本值依次划分为若干个区间, 并将
这一区间的样本值作为一组.一个组的最小值称为下限,
最大值称为上限, 上限与下限之差称为组距.
样本值组距式分组方法的一般步骤:
步骤1 确定是等距分组, 还是异距分组.
步骤2 确定组数(5≤K≤15),组距, 组上限和下限.
最大值 − 最小值
若用公式 组距 =
组数 25

得出的组距可调整, 得到理想的组距.
20
15
10
5
0

140
150
160
170
180
190
200
210
220
230
240
§4.2 样本的描述性统计——频率分布与直方图
步骤3 各组内的样本值的个数称为频数. 组频数占样本容
量的比例称为频率。
步骤4 绘制直方图.横轴表示数据分组区间, 纵轴表示
频数或频率÷组距.
如果 高:频率÷组距,宽:组距,则面积=(频率÷组距)
*组距=频率,将直方图顶点连线则可作为总体密度函数的
近似
§4.2 样本的描述性统计——频率分布与直方图
例 下列数据是来自某总体的一个容量为120的样本值, 试将数
据等距分为10组, 计算累积频率并画出直方图.
141 159 166 172 177 182 188 196 203 214
193 160 167 173 194 183 189 196 203 215
168 163 217 184 219 231 205 218 144 160
178 225 189 196 206 193 149 161 168 174
150 161 168 164 188 186 190 196 207 225
162 170 174 179 146 190 197 208 226 152
194 187 191 197 209 228 153 221 171 175
171 175 179 187 192 188 210 203 163 163
152 175 180 187 194 181 210 205 154 164
175 180 187 194 200 187 167 155 216 172
156 165 152 176 181 188 195 201 211 234
165 172 176 182 188 195 202 213 237 158

解 样本数据的最小值为141, 最大值为237. 为了计算方便, 将


数据范围扩至140~240, 分成10个组, 分组上限分别为:
150 160 170 180 190 200 210 220 230 240
按“下限不在组内”, 计算得频数、频率、累积频率见表
EXCEL操作:数据分析——直方图
§4.2 样本的描述性统计——频率分布与直方图
表4.2.1 频率分布表
分组 组频数 组频率 累积频率
(140,150] 5 0.0417 4.17%
(150,160] 11 0.0833 13.33%
(160,170] 17 0.1250 27.50%
(170,180] 20 0.2333 44.17%
(180,190] 21 0.1667 61.67%
(190,200] 17 0.1333 75.83%
(200,210] 13 0.0917 86.67%
(210,220] 8 0.0500 93.33%
(220,230] 5 0.0333 97.50%
(230,240] 3 0.0417 100.00%
25
20
15
10
5
0
140
150
160
170
180
190
200
210
220
230
240
作业
习题4.2:1、2、4

注:
1.用EXCLE计算后截图。
2.作业提交截止时间:周日晚22:00前。
3. 学习指导上的题目多练习。
§4.2 样本的描述性统计
一、基本概念:数理统计、总体、个体、样本、样本容量、抽样、
样本观测值
二、简单随机抽样(抽取个体时:等可能、独立)
简单随机样本两个特性: (1) 代表性 (2) 独立性
三、统计量
1. 一维总体的常见统计量
(1)样本均值 (2) 样本方差 (3)样本标准差
(4)样本k阶原点矩 (5) 样本k阶中心矩 等
性质:
D(X)  2
(1)E(X) = E(X) =  D(X) = = (2)E(S ) = D(X) = 
2 2
n n
2. 二维总体的常见统计量
(1) 样本协方差 (2) 样本相关系数
四、直方图(推断总体X分布特征)
§4.3 抽样分布与正态总体下的常用统计量
4.3.1 三大抽样分布
4.3.2 正态总体下的常用统计量
§4.3 抽样分布与正态总体下的常用统计量
统计量的分布称为抽样分布。
为了研究抽样分布,先研究数理统计中三种重要的
分布.
§4.3 抽样分布与正态总体下的常用统计量
1. 2分布
定义 设X1,X2,…,Xn为相互独立的随机变量,
它们都服从标准正态N(0,1)分布,则称随机变量
n
 2 =  X i2
i =1

服从自由度为n的2分布,记为2 ~ 2(n).
此处自由度指2中包含独立变量的个数.
2(n)分布的偏度系数大于0,
是右偏态分布,
自由度越小分布形态越往右偏.
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.1 设随机变量X~2(m),Y~2(n), X和Y独立, 则
X+Y~2(m+n).
定义4.3.2 称满足条件P{2(n)>2(n)}= (0<<1)的
数2(n)为2(n)的右尾分位数或左尾1-a分位数.
§4.3 抽样分布与正态总体下的常用统计量
卡方分布的密度函数比较复杂, 人们编制了卡方分布表(见
本书附表), 供计算卡方分布的概率或分位数时参考.
例4.3.2 查2分布表求右尾分位数0.0252(15).
解 右尾分位数0.0252(15)即左尾0.9752(15), 查表得
0.0252(15)≈27.4884.
§4.3 抽样分布与正态总体下的常用统计量
P123练习:2题(1)、(2)

3题(1)、(2)

方法一:查表 P278
方法二:EXCEL: *.DIST(x)=p, *.INV(p)=x
§4.3 抽样分布与正态总体下的常用统计量
设 ( X1 , X 2 , , X10 ) 为 来 自 总 体 X ~ N ( ,0.5 2 ) 的 一 个 样

10
本,计算 P{  i
( X
i =1
−  ) 2
 1.68} .

1 10
2 
解 由于  = 2
10
( X i −  ) 2
~  2
(10) ,
0.51 i =1
解 由于  2 = 1  (
10 X −  ) 2
~  2
(10) ,
解 由于  2 2=0.5 2i =1 ( X i −1 ) 2 ~  2 (10) ,
10 2 i 10
1.68
故 P{10( X i −  ) 01.5 .68}i =1= P{ 2  −   =   6.72}
2 2
10 ( X i ) 2
} P{
15 i =1 10.68
故 P{= −   = 0 .
 −   .5} = P{ 2  6.72}
2 2
i 1
10 ( X i ) 1 .68 } P{ 21
( X
10 i )
20.5 1.68
故 P{ 2 (
2
i =1
2 ( X i −  )  1.68} = P{
2 0. 5 10i =1
−   =  2
 6.7
查表得  (10) 0.75 = 6.737 ,所以 P0{. X ( X
−  )
i )  1.68} =0.75.
2
2
} P {
5 i =1 i
10 0.5
查表得  (10) 0.75 = 6.737 ,所以 P{
i =1 2
i =1 ( X −  )  1.68} =0.75.
2
10 i
查表得  2
( 10 ) 0.75 = 6 .737 ,所以
i =1
P {
i =1
 i ( X −  ) 2
 1.68} =0.75.
§4.3 抽样分布与正态总体下的常用统计量
设随机变量X~N(0,1),y ~N(0,4),相互独立,设
,则当C=_ 4 _时,Z~ 2(2).
§4.3 抽样分布与正态总体下的常用统计量
2. t分布
定义 设X ~ N(0,1),Y ~ 2(n),X与Y独立,则称
X
随机变量 T = 服从自由度为n的t分布,又称为
Y n
学生氏分布(Student distribution),记为T ~ t(n).

t(n)分布的密度函数关于原点
对称, 与标准正态分布的密度函数
形状类似, 只是峰比标准正态分布
低一些, 尾部概率比标准正态分布 图 t分布的概率密度曲线
的大一些. 当自由度充分大(一般大
于30)时, 分布接近于标准正态分布.
§4.3 抽样分布与正态总体下的常用统计量
定义 称满足条件P{t(n)>t(n)}=(0<a<1)的数t(n)为t(n)的
右尾分位数或左尾1-分位数.
t分布表(见本书附表), 供计算t分布的概率或分位数时参考.
例4.3.3 查t分布表求P{t(10)>2.2281}和P{|t(10)|>2.2281}.
解 查表得 P{t(10)>2.2281}=1-P{t(10)≤2.2281}
=1-0.975=0.025 .
由t 分布的对称性,
P{|t(10)|>2.2281}=2P{t(10)>2.2281}=0.05 .
例4.3.4 查t分布表求右尾分位数t0.05(10).
解 右尾t0.05(10)等于左尾t0.95(10) , 查表得 t0.05(10)=1.8125 .
§4.3 抽样分布与正态总体下的常用统计量
P123练习:7题(1) =T.DIST.RT(-2.1314,15)

8题(1)

方法一:查表 P276
方法二:EXCEL: *.DIST(x)=p, *.INV(p)=x
§4.3 抽样分布与正态总体下的常用统计量
3. F分布
F分布是现代统计科学的奠基人之一费歇尔(1890-
1962)首先提出的.
定义 设X~2(m), Y~2(n), 且X与Y相互独立, 则随机变量
X m
F=
Y n
服从第一自由度为m, 第二自由度为n的F分布,
记作F~F(m,n).
F分布是右偏态分布.
§4.3 抽样分布与正态总体下的常用统计量

1   1   1 
 = P   F (n, m)  = P  F   , P F   = 1−
F   F (n, m)   F (n, m) 
1
F1− (m, n) = ,
F (n , m)
𝟏
如𝑭𝟎. 𝟏 𝟐, 𝟑 =
𝑭𝟎 𝟗 𝟑,𝟐
.

X m
F=
Y n
§4.3 抽样分布与正态总体下的常用统计量
例 查F分布表求P{F(10,16)>2.99}和右尾分位数F0.05(10,16).
解 查表 , P{F(10,16)>2.99}=1-P{F(10,16)<2.99}=1-0.975=0.025 .
右尾分位数F0.05(10,16)等于左尾F0.95(10,16), 查表F0.05(10,16)=2.49

方法一:查表 P280(只能查部分)
方法二:EXCEL: *.DIST(x)=p, *.INV(p)=x
§4.3 抽样分布与正态总体下的常用统计量
正态分布是常用分布, 下面介绍正态总体下的一些常用统计量, 这
些统计量在区间估计, 假设检验, 方差分析等方面有着重要应用.
定理4.3.2 设X1,X2,…,Xn是来自总体X的样本, x 是样本均值.
(1) 若总体X~(,2) , 则

x ~ N (  , 2 n )
(2) 若总体分布未知或不是正态分布, 但E(X)=, D(X)=2, 则n充分
大时 x 的渐近分布为正态分布, 记作

x ~ N (  , n )
2

这里的渐近分布是指n充分大时的近似分布.
§4.3 抽样分布与正态总体下的常用统计量
例某厂生产的灯泡寿命近似服从正态分布N(800,402),
抽取16个灯泡的样本,求平均寿命小于775小时的概率.
解:设灯泡寿命总体为X,
因为X~N(800,402),n=16,
所以样本均值 x ~ N (  ,  2
n)
402
故 X ~ N (800, ), 即 X ~ N (800,100)
16
 X − 800 775 − 800 
P{ X  775} = P   
 10 10 
 X − 800 
= P  −2.5 = 1 − ( 2.5) = 0.0062
 10 
§4.3 抽样分布与正态总体下的常用统计量
例 在天平上重复称量一质量为a的物品, 假设各次称得结果相互独
立, 且都服从正态分布N(a,0.22), 若以 x 表示n次称重结果的算术平
均值, 为使 P{ x − a  0.1}  0.95 , n的最小值应取多少?x ~ N (  ,  2 n )
解 将n次称重结果X1,X2,…,Xn 视作一个样本, 则Xi ~ N(a,0.04)
x −a
Z= ~ N (0,1) P{-c<Z<c}=(c)−(− c) =2(c)−1
0.04 n
 x − a 0.1   0.1 
P{ x − a  0.1}= P    = 2Φ0   − 1  0.95
 0.04 n 0.04 n   0.04 n 
 0.1  0.1
Φ0  
 0.04 n 
 0.975,  1.645,
1.96 n  15.37
查表得
  0.04 n
所以n的最小值应取16.
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.3 设X1,X2,…,Xn是来自总体X~N(,2)的一个样本,
x 和s2分别是样本均值和方差, 则
(1) x 和s2相互独立;
(n −1) s 2
(2) ~  2 (n −1)
2
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.4 设X1,X2,…,Xn是来自总体X~N(,2)的样本, 则
x −
T= ~ t (n −1)
s n
x −
证明 由定理4.3.2知, Z = ~ N (0,1), 由定理4.3.3知,
 n X
(n − 1) s 2 T=
~  (n − 1)
2
Y n
 2
x −  ( n − 1) s 2
且 x 和2相互独立, 所以 与 也相互独立. 由t分布
的定义知,
 n  2

x− x− (n − 1) s 2
T= = (n − 1) ~ t ( n − 1)
s n  n  2
§4.3 抽样分布与正态总体下的常用统计量

X
T=
Y n

n n n

 i i  i i  i i )
k X
i =1
~ N ( k
i =1
 , k 2 2

i =1
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.5 设总体X~N(1,12), Y~N(2,22), X1,X2,…,Xm和Y1, Y2,…,
Yn是分别来自总体X和Y的样本, 且两样本相互独立, 两个样本的均
2 2
值与方差分别为 x , y , sx , s y, 则
X m
s x2  12 F=
F= ~ F (m −1, n −1) Y n
2
sy  2
2

(m − 1) sx2 (n −1) s x2
~  2 (m − 1), ~  2 (n −1)
证明 由定理4.3.3知,  12  22
(m − 1) sx2 (n − 1) sx2
由于两样本相互独立,  12 与 独立. 由F分布的定义可
 22
知, 2 2
sx 1
F= ~ F (m −1, n −1)
s 2y  2
2
§4.3 抽样分布与正态总体下的常用统计量

s x2  12
F= ~ F (m −1, n −1)
s 2y  2
2
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.6 在定理4.3.5的记号下,
( x − y ) − ( 1 −  2 )
Z= .2 ~ N (0 , 1)
 12 m + 2 n
证明 由定理4.3.2知,   12    22 
x ~ N  1 ,  , y ~ N  2 , 
 n   n 
由于两个样本相互独立, 所以 x , y 也独立, 所以,
   
n n n

 k X.~ N ( k  ,  k 
2 2
x − y ~ N  1 − 2 , + 
2 2
1 2
i i i i i i )
 m n  i =1 i =1 i =1

( x − y ) − ( 1 −  2 )
Z= ~ N (0 , 1)
 2
1 m + 2
2 n
§4.3 抽样分布与正态总体下的常用统计量

( x − y ) − ( 1 −  2 )
Z= ~ N (0 , 1)
 2
1 m + 2
2 n

s x2  12
F= ~ F (m −1, n −1)
s 2y  2
2
§4.3 抽样分布与正态总体下的常用统计量
定理4.3.7 在定理4.3.5的记号下, 若 12=22= 2 , 记,
(m −1) sx + (n −1) s y
2 2
sw =
2
m+n−2
( x − y ) − ( 1 −  2 )
则 T= ~ t (m + n − 2)
s w 1 m +1 n

证明(可自行尝试).
作业
习题4.3:5、13、15 、16

注:
1.写清题目号、解答步骤即可。
2.作业提交截止时间:周日晚22:00前。
3. 学习指导上的题目多练习。

You might also like