Professional Documents
Culture Documents
第八章 假设检验
第八章 假设检验
统计方法 参数估计
推论统计
假设检验
参数 点估计
估计 区间估计
Z 检验
推 t 检验
论 参数检验 F 检验
统 q 检验…
计 假设 计数资料—— χ2 检验
内 检验
容 符号检验 相关
非参数
检验 计量 符号秩次检验 样本
资料 秩和检验 独立
中位数检验 样本
参数估计和假设检验是统计推断的两个
组成部分,都是利用样本对总体进行某
种推断,但推断的角度不同。参数估计
讨论的是用样本统计量估计总体参数的
方法。假设检验讨论的是用样本信息去
检验对总体参数的某种假设是否成立的
程序和方法。
—— 总体参数之间确实存在差异。
在统计学中,进行这种推论的过程称作
假设检验。
讨论统计值之间差异的问题时,
有两种情况:
两个样本统计
量之间的差异
显 著
该样本已基本不属 各自代表的两个总
于已知总体 体的参数之间确实
存在差异
包括参数和非参数检验:
参数假设检验(parametric test):总体的
分布形式已知,需要对总体的未知参数进行
假设检验。
非参数假设检验(non-parametric test):对
总体分布形式所知甚少,需对未知分布函数
的形式及其他特征进行假设检验。
例1: 根据1989年的统计资料,某地女性新生儿的平均体重为3190
克。为判断该地1990年的女性新生儿体重与1989年相比有无显
著差异,从该地1990年的女性新生儿中随机抽取30人,测得其
平均体重为3210克。从样本数据看,1990年女新生儿体重比
1989年略高,但这种差异可能是由于抽样的随机性带来的,也
许这两年新生儿的体重并没有显著差异。究竟是否存在显著差
异?可以先假设这两年新生儿的体重没有显著差异,然后利用
样本信息检验这个假设能否成立。这是一个关于总体均值的假
设检验问题。
例2:某种大量生产的袋装食品,按规定每袋重量不得
少于250克,现从一批该种食品中任意抽取50袋,发
现有6袋重量低于250克。若规定食品不符合标准的
比例达到5%就不得出厂,问该批食品能否出厂。
可以先假设该批食品的不合格率不超过5%,然后
用样本不合格率来检验假设是否正确。这是一个关
于总体比例的假设检验问题。
假设检验的原理
平均数的显著性检验
平均数差异的显著性检验
方差的差异检验
相关系数的显著性检验
比率的显著性检验
假设检验的原理:小概率原理。假设检验
的基本思想是概率性质的反证法。(不同于纯数
学中的反证法)
什么是小概率?
概率是0~1之间的一个数,因此小概率就是接近0的一个
数
著名的英国统计家Ronald Fisher 把20分之1作为标准,也
就是0.05,从此0.05或比0.05小的概率都被认为是小概率
Fisher没有任何深奥的理由解释他为什么选择0.05,只是
说他忽然想起来的
小概率原理——发生概率很小的随机事件(小概率事件)
在一次实验中几乎是不可能发生的。
根据这一原理,可以先假设总体参数的某项取值为真,
也就是假设其发生的可能性很大,然后抽取一个样本
进行观察,如果样本信息显示出现了与事先假设相反
的结果且与原假设差别很大,则说明原来假定的小概
率事件在一次实验中发生了,这是一个违背小概率原
理的不合理现象,因此有理由怀疑和拒绝原假设;否
则不能拒绝原假设。
检验中使用的小概率是检验前人为指定的。
某工厂质检部门规定该厂产品次品率不超过4%方能
出厂。今从1000件产品中抽出10件,经检验有4件次
品,问这批产品是否能出厂?
如果假设这批产品的次品率P≤4%,则可计算事件
“抽10件产品有4件次品”的出现概率为:
P10 (4) = C104 (0.04) 4 (1 − 0.04) 6 = 0.00042
可见,概率是相当小的,1万次实验中可能出现4次,
然而概率如此小的事件,在一次实验中居然发生了,
这是不合理的,而不合理的根源在于假设次品率
P≤4% ,因而认为假设次品率P≤4%是不能成立的,
故按质检部门的规定,这批产品不能出厂。
抽样分布
这个值不像我 ... 因此我们拒
们应该得到的 绝假设 X = 50
样本均值 ...
... 如果这是总
体的真实均值
20 X = 50 样本均值
H0
第一,假设检验采用逻辑上的反证法,即为了检验
一个假设是否成立,首先假设它是真的,然后对
样本进行观察,如果发现出现了不合理现象,则
可以认为假设是不合理的,拒绝假设。否则可以
认为假设是合理的,接受假设。
第二,假设检验采用的反证法带有概率性质。所谓假
设的不合理不是绝对的,而是基于实践中广泛采用的
小概率事件几乎不可能发生的原则。至于事件的概率
小到什么程度才算是小概率事件,并没有统一的界定
标准,而是必须根据具体问题而定。如果一旦判断失
误,错误地拒绝原假设会造成巨大损失,那么拒绝原
假设的概率就应定的小一些;如果一旦判断失误,错
误地接受原假设会造成巨大损失,那么拒绝原假设的
概率就应定的大一些。
小概率通常用α表示,又称为检验的显著性水平。通
常取α=0.05或α=0.01,即把概率不超过0.05或0.01的事
件当作小概率事件。
假设检验中,我们称作为检验对象的待检验假
设为原假设或零假设,用H0表示。原假设的对
立假设称为备择假设或备选假设,用H1表示。
例如,设X0为总体均值X的某一确定值。
(1)对于总体均值是否等于某一确定值的原假
设可以表示为:
H0: X=X0 (如H0: X = 3190克)
其对应的备择假设则表示为:
H1: X≠X0 (如H1:X ≠3190克)
(2)对于总体均值X是否大于某一确定值X0
的原假设可以表示为:
H0:X≥X0 (如H0:X≥2000克)
其对应的备择假设则表示为:
H1:X<X0 (如H1: X <2000克)
(3)对于总体均值X是否小于某一确定值X0
的原假设可以表示为:
H0:X≤X0 (如H0:X≤ 5%)
其对应的备择假设则表示为:
H1:X>X0 (如H1:X>5%)
注意:原假设总是有等号: =或≤ 或 ≥。
根据假设的形式不同,假设检验可以分为双侧假设检验和单
侧假设检验。
若原假设是总体参数等于某一数值,如H0: X = X0 ,即
备择假设H1: X ≠ X 0,那么只要X< X 0和X> X 0 二者
中有一个成立,就可以否定原假设。这种假设检验称为双侧
检验。
若原假设是总体参数大于等于或小于等于某一数值,如H0:
X ≥ X 0 (即H1:X<X0);或H0 :X≤X0 (即H1:X>
X0),那么对于前者当X<X0时,对于后者当X>X0 时
,可以否定原假设。这种假设检验称为单侧检验。可以分为
左侧检验和右侧检验。
研究的问题(总体均值检验)
假设
双侧检验 左侧检验 右侧检验
X0
双侧检验示意图
抽样分布 置信水平
拒绝域 拒绝域
1-α
α/2 α/2
接受域
H0值 样本统计量
临界值 临界值
抽样分布 置信水平
拒绝域 拒绝域
1-α
α/2
α/2
接受域
H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平
拒绝域 拒绝域
1-α
α/2 α/2
接受域
H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平
拒绝域 拒绝域
1-α
α/2 α/2
接受域
H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平
拒绝域
1-α
α
接受域
H0值 样本统计量
临界值
设H0:X≥X0 ,H1:X<X0;临界值和拒
绝域均在左侧。也称下限检验。
X0
抽样分布 置信水平
拒绝域
1-α
α
接受域
H0值 样本统计量
临界值
观察到的样本统计量
抽样分布 置信水平
拒绝域
1-α
α
接受域
H0值 样本统计量
临界值
观察到
的样本
统计量
设H0 :X≤X0 ,H1:X>X0; 临界值和拒
绝域均在右侧。也称上限检验。
X0
抽样分布 置信水平
拒绝域
1-α
α
接受域
H0值 样本统计量
临界值
观察到的样本统计量
抽样分布 置信水平
拒绝域
1-α
α
接受域
H0值 样本统计量
临界值
观察到
的样本
统计量
根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确;
2、原假设不真实,且拒绝原假设,判断正确;
3、原假设真实, 但拒绝原假设,判断错误;
4、原假设不真实,却接受原假设,判断错误。
假设检验是依据样本提供的信息进行判断,有犯错误的可能。所
犯错误有两种类型:
第一类错误是原假设H0为真时,检验结果把它当成不真而
拒绝了。犯这种错误的概率用α表示,也称作α型错误或弃
真错误。
第二类错误是原假设H0不为真时,检验结果把它当成真而
接受了。犯这种错误的概率用β表示,也称作β型错误或取
伪错误。
假设检验中各种可能结果的概率
拒绝H0
接受H0
审判过程:H0: 无罪 接受H1
裁 实际情况
决 无罪 有罪 H0 为 1-α
α(弃真错误)
无罪 正确 错误 真 (正确决策)
有罪 错误 正确
β
H0 为
(取伪错误) 1-β(正确决策)
伪
图(a)
X≤X0
H0为真
图(b)
X=X1>X0
H0为伪
从上图可以看出,如果临界值沿水平方向右移,α将变小而β变
大,即若减小α错误,就会增大犯β错误的机会;如果临界值沿
水平方向左移,α将变大而β变小,即若减小β错误,也会增大
犯α错误的机会。
两类错误的控制
⑴利用已知的实际总体参数值与假设参数值之间的大
小关系,合理安排拒绝区域的位置
①若弃真的后果较大,则将α定小一点,β就大。
②若存伪的后果较大,则将β定小一点,α就大。
⑵使样本容量增大,可以同时减少两类错误,或减少
其中一种错误而不致于增大另一种错误(如在α 和其
他条件不变时, β 会减小)。(因为样本容量增大
,抽样误差越小,样本分布就越高狭,两侧的面积
就越小。)
在样本容量n一定的情况下,假设检验不能同时做到犯α
和β两类错误的概率都很小。若减小α错误,就会增大犯β
错误的机会;若减小β错误,也会增大犯α错误的机会。
要使α和β同时变小只有增大样本容量。但样本容量增加
要受人力、经费、时间等很多因素的限制,无限制增加
样本容量就会使抽样调查失去意义。因此假设检验需要
慎重考虑对两类错误进行控制的问题。
α和β的关系就像翘翘板, 你不能同时减
α小β就大, α大β就小
少两类错误!
β
α
假设检验中人们普遍执行同一准则:首先控制弃真错误(α错
误)。假设检验的基本法则以α为显著性水平就体现了这一原则。
两个理由:
统计推断中大家都遵循统一的准则,讨论问题会比较方便。
更重要的是: 原假设常常是明确的,而备择假设往往是模糊的。
如H0:X=X0很清楚, 而H1:X≠X0则不太清楚,是X<
X0还是X>X0 ?大多少小多少都不清楚。对含义清晰的数
量标准进行检验更容易被接受。
因此,第一类错误成为控制两类错误的重点。
α错误:控制显著性水平。
实验条件控制较好:α=0.05
实验条件难于控制:α=0.01,或更高
P227 统计检验力 1- β
β错误的影响因素与控制
实际值与假设值相差越大,β越小。
α越小,β越大。同时控制,增加n。
α、n固定时,适当的检验类型可减小β。
㈠根据研究需要提出原假设H0和备择假设H1
㈡确定适当的检验统计量
㈢确定显著性水平α和临界值及拒绝域
㈣根据样本数据计算检验统计量的值(或P值)
㈤将检验统计量值与临界值比较,作出拒绝或
接受原假设的决策
应该注意:
⑴对任一假设检验问题,其所有可能结果均
应包括在所提出的两个对立假设中,原假
设与对立假设总有一个、也只能有一个成
立。
⑵原假设一定要有等号: =或≤ 或 ≥。
原假设不是随意提出的,应该本着“不轻
易拒绝原假设”的原则。
双侧检验属于决策中的假设检验。即不论是
拒绝H0 还是接受H0,都必需采取相应的行动
措施。
例如,某种零件的尺寸,要求其平均长度为
10厘米,大于或小于10厘米均属于不合格。
待检验问题是该企业生产的零件平均长度是
10厘米吗?(属于决策中的假设)则建立的原假
设与备择假设应为
例如,某灯泡制造商声称,该企业生产的灯泡平均
使用寿命在1000小时以上。通常除非样本能提供证
据表明使用寿命在1000小时以下,否则就应认为厂
商的声称是正确的。建立的原假设与备择假设应为:
H0: X≥ 1000 H1: X < 1000
对于上述问题还可以结合不同背景建立假设。
同样的问题背景不同可以采用不同的原假设。
例如,一商店经常从某工厂购进某种商品,该商品质
量指标为X,X值愈大商品质量愈好。商店提出的进
货条件是按批验收,只有通过假设“X≥X0 ”检验的
批次才能接受。有两种可能情况:
⑴如果根据过去较长时间购货记录,商店相信该厂产品
质量好,于是同意把原假设定为X≥X0 ,而且选择较
低的检验显著性水平。这对工厂是有利的,使得达到质
量标准的产品以很小的概率被拒收。虽然这会使商店面
临接受不合标准产品的风险,但历史记录显示出现这种
情况的可能性很小,而且商店也可因此获得较好的货源。
⑵如果过去一段时期的记录表明,该厂产品质量并不理
想,商店则会坚持以X≤X0为原假设,并选定较小的
检验显著性水平。这对商店是有利的,不会轻易地拒绝
原假设,有 1-α的可能把劣质产品拒之门外。
⒈双侧检验:只强调差异而不强调方向性的
检验称为双侧检验。
⒉单侧检验:强调某一方向的检验称为单侧
检验。又分左侧检验和右侧检验。
通常适用于检验某一参数是否“大于”或
“优于”、“快于”及“小于”、“劣
于”、“慢于”另一参数等一类问题。
在实际研究中何时用单侧检验何时用双侧检
验,一定要根据研究目的所规定的方向性来确
定。
应该用单侧检验的问题,若使用双侧检验,
其结果一方面可能使结论由“显著”变为“不
显著”,另一方面也增大了β错误。
反之,若使用双侧检验的问题若用单侧来检
验,虽然减小了β错误,但是使无方向性的问题
人为地成为单方向问题,这也有悖于研究目的。
假设检验根据检验内容和条件不同需要采用不同的检验
统计量。
在一个正态总体的参数检验中,Z统计量和t统计量常用
于均值和比例的检验,χ2统计量用于方差的检验。选择统
计量需考虑的因素有被检验的参数类型、总体方差是否
已知、用于检验的样本量大小等。
一个总体
均值 方差
⒈单总体平均数差异显著性检验,也
叫平均数的显著性检验。
⒉双总体平均数差异显著性检验,也
叫平均数差异的显著性检验。
⒈建立假设:
双侧检验的假设 : H 0 : µ = µ 0, H1 : µ ≠ µ 0
或者(双总体) H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
单侧检验的假设 : H 0 : µ ≤ µ 0 , H1 : µ > µ 0
或者(双总体) H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2
⒉根据给定条件确定抽样分布的形态,确定相应的检
验方法,并计算出统计量的值。
⒊确定α,查出理论值,从而确定出H0拒绝和接受区域。
⒋作出判断。如Z>Z临,即p<α,则拒绝H0,接受H1。
㈠总体分布为正态分布,且总体方差已知时
X − µ0 σ0
Z= (8 − 1), 其中SE X =
SE X n
例1 某地区统考数学,假设该统考数学成绩服从正
态分布,已知其总平均分为50分,标准差为12分。
从该地区随机选择一个班作为样本,该班有学
生50人,经计算该班平均成绩为53分,试问该
班成绩与总成绩的差异是否显著。
解:①建立假设: H 0 : µ = µ 0 , H1 : µ ≠ µ 0
σ012 12
②计算统计量: SE X = = = = 1.7
n 50 7.07
X − µ 0 53 − 50
Z= = = 1.76
SE X 1.7
③判断结果:因为1.76<1.96,所以P>0.05
差异不显著,接受H0,拒绝H1。
故该班数学成绩与总平均成绩的差异不显著。
例2 对某专业课在全国同类高校内进行统一测试,
已知全体考生成绩服从正态分布,其总平均分
为64分,总标准差为8.6分,从某高校随机抽
取20份试卷,经计算得到这20份试卷的平均成
绩为70分,问该校学生的平均成绩是否 显著地
优于全体学生的平均水平?
解:①建立假设:H 0 : µ ≤ µ 0 , H1 : µ > µ 0
②计算统计量: σ 8.6 8.6
SE X = 0
= = = 1.92
n 20 4.47
X − µ 0 70 − 64
Z= = = 3.125
SE 1.92
③查正态表(单侧)得:
当 α = 0.01时, Z 0.01 = 2.33
④判断结果:因为3.125>2.33,所以P<0.01。
差异极其显著,拒绝H0。故该校学生的平均
成绩极显著地优于全体学生的平均水平。
㈡总体分布为正态,总体方差未知
当总体分布为正态分布,总体方差未知时,样本平均数的
抽样分布服从自由度为n-1 的t分布,此时可用t检验方法进
行检验。在检验中,计算统计量的值的公式为:
X − µ0 Sn S n −1
t= (8 − 2), 其中SE X = =
SE X n −1 n
例3 已知4岁正常男童平均体重为15.6公斤,从某幼儿园中随机
抽取20名4岁男童,经测量计算出这20名男童平均体重为16
公斤,标准差为1.76公斤,试问该幼儿园4岁男童的体重与4岁
正常男童平均体重有无显著性差异?
解:①建立假设: H 0 : µ = µ 0 , H1 : µ ≠ µ 0
②计算统计量: S 1.76
SE X = n
= = 0.4
n −1 20 − 1
X − µ 0 16 − 15.6
t= = =1
SE X 0.4
③判断结果:当α = 0.05时, df = 20 − 1 = 19时,
t(19)0.05 2 = 2.093
因为1<2.093,所以,P>0.05,差异不显著。
故该幼儿园4岁男童平均体重与正常男童平均体
重无显著差异。
例4 某实验组随机选择了40名儿童作提高儿童智
力水平实验,实验结束后,对参加实验的儿童
进行韦氏儿童智力测验,结果得到这40名儿童
的智商平均值为105,标准差为12,已知韦氏
儿童智力测验的平均值为100,试问该实验是
否成功?
解:①建立假设: H 0 : µ ≤ µ 0 , H1 : µ > µ 0
S 12 12
②计算统计量: SE X = = = = 1.92
n −1 40 − 1 6.24
X − µ 0 105 − 100
t= = = 2.6
SE X 1.92
③判断结果: 当α = 0.01, df = 39时, t(39 )0.01 = 2.423
因为2.6 > 2.423, 所以P < 0.01
故实验后的儿童智力水平极明显高于同龄儿童一
般水平,实验取得了成功。
㈢总体为非正态分布
当总体为非正态分布时,根据中心极限定理,样本容
量足够大时(n≥30,也有认为n≥50),样本平均数的抽
样分布趋于正态分布,在平均数差异显著性检验中,
也可近似地采用Z检验方法进行检验。
当总体方差已知时,其检验公式为:
X − µ0 σ0
Z′ = 其中 SE X =
SE X n
当总体方差未知时,上式中的σ0可用它的无偏估计量
Sn-1代替, S n −1
SE X =
当样本量足够大时,也可以用S代替σ0 n
注意:这种采用近似Z检验的方法只能适用n>30时的情
况,当n<30时不适用这种方法,也不能用t检验方法,只
能采用非参数检验方法进行检验。
例5 某县进行物理竞赛,结果分数的分布不是正
态,总平均成绩为55分。其中某重点学校参加
竞赛60人,其平均成绩为62分,标准差为14
分,试问该校平均成绩是否明显优于全县一般
水平。
当两个变量间的相关系数为r时,两变量的方差为:
(P118) σ (2X −Y ) = σ X2 + σ Y2 − 2rσ xσ y
当两个变量相互独立时,其和(或差)的方差等于各
自方差的和:
σ (2X ±Y ) = σ X2 + σ Y2
因此有:
σ 12 σ 22 σ1 σ 2
SE D = SE + SE =
1
2 2
2 + − 2r
X
n1 n2 n1 n2
当两个样本独立时,r=0,这时上述公式为
σ 12 σ 22
SE D = SE12 + SE 22 = +
X
n1 n2
4.1 两总体分布为正态,且方差已知
当两样本相互独立或相关
两平均数之差的标准误为:
S DX σ 12 + σ 22 − 2rσ 1σ 2
SEDX = =
n n
= SE12 + SE22 − 2rSE1SE2 (8 − 4 )
检验统计量公式为
( X 1 − X 2 ) − (µ1 − µ 2 ) DX − µ D
Z= = X
(8 − 5)
SE D SE D
X X
4.1 两总体分布为正态,且方差已知
(4.1.1) 两样本相互独立
例6: 从某科高考成绩中,从甲省抽取80名考生,计
算平均成绩为84分,从乙省抽取100名考生,计算
平均成绩为80分,已知甲乙两省该科高考成绩
均呈正态分布,甲省标准差为12.4分,乙省标准
差为11.2分,试问甲乙两省该科高考成绩是否有
显著性差异?
解:⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
⒉计算检验的统计量:
σ 12 σ 22 12.4 2 11.2 2
SE D X = + = +
n1 n2 80 100
= 1.922 + 1.2544 = 1.7822
X 1 − X 2 84 − 80
Z= = = 2.2444
SE D X 1.7822
σ 12 σ 22 1.852 1.782
SE DX = + = +
n1 n2 30 25
= 0.114 + 0.127 = 0.49
X 1 − X 2 20.15 − 18.25
Z= = = 3.87
SE DX 0.49
⒊判断结果:查表得, Z 0.01 2 = 2.58 因为3.87>2.58,所以
P<0.01,差异极其显著。
故根据这次抽样,可以推断出该市郊区5岁男童平均体
重有极其显著的差异。
4.1 两总体分布为正态,且方差已知
(4.1.2) 两样本相关
例8 某实验组选择20名儿童作智力发展实验在
实验前和实验后对实验儿童进行一次韦氏儿
童智力测验, 在实验前得到平均智商为102,
实验后所得平均智商为107,已知韦氏儿童智
力测验标准差为15,两次测验相关系数为0.7,
试问该实验是否取得了成功。
解:⒈建立假设: H 0 : µ1 ≥ µ 2 , H1 : µ1 µ 2
⒉计算检验的统计量:
σ 12 + σ 22 − 2rσ 1σ 2
SE DX =
n
152 + 152 − 2 × 0.7 × 15 × 15
= = 2.6
20
X 1 − X 2 102 − 107
Z= = = −1.92
SE D X 2.6
⒊判断结果:
⒉计算检验的统计量:
σ 12 + σ 22 − 2rσ 1σ 2
SEDX =
n
12 2 + 14 2 − 2 × 0.76 ×12 ×14
= = 2.91
10
X 1 − X 2 72 − 70
Z= = = 0.6875
⒊判断结果: SED X 2.91
4.2.1 两样本容量不等,且为独立样本
σ 2
σ
根据公式(8-5)则标准误的计算公式为:SED = 1 + 2
2
在该式中,σ12与σ22都未知, n1 n2 X
此时可用无偏方差来代替
S n21 −1 S n22 −1
SEDX = + (8 − 7 )
n1 n2
4.2 两总体都是正态分布,且方差未知
4.2.1 两样本容量不等,且为独立样本
第一,当总体方差相等时,
其检验公式为: DX − µ DX X1 − X 2
t= = (8 − 8)
SEDX SEDX
df = n1+n2-2 n1S12 + n2 S 22 n1 + n2
其中 SEDX = ⋅
n1 + n2 − 2 n1n2
联合方差sp2
= =
2 1 n1 2 n2
s p
(n1 − 1) + (n2 − 1) (n1 − 1) + (n2 − 1)
2 1 1 n1 S12 + n2 S 22 n1 + n2
SE D = s p + = ⋅
X
n1 n2 n1 + n2 − 2 n1 n2
精确合成参见P90 公式4-13
例10 某校进行速度测验,共选择40名参加,其
中男生22人,女生18人,男生测验的平均分为
72分,标准差为8分,女生测验的平均分为70
分,标准差为7.6分。已知该速度测验结果服
从正态分布,试问男女生速度测验的平均结果
有无显著性差异。
解:①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验的统计量:
n1S12 + n2 S 22 n1 + n2
SE D X = ⋅
n1 + n2 − 2 n1n2
22 × 8 2 + 18 × 7.6 2 22 + 18
= × = 2.55
22 + 18 − 2 22 × 18
X − X 2 72 − 70
t= 1 = = 0.78
SE D X 2.55
③判断结果:当α=0.05,df=n1+n2-2 = 22+18-2=38时,
t(38)0.05/2=2.021。
因为0.78<2.021,所以P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
4.2.1 两样本容量不等,且为独立样本
第二,当总体方差不等时,
此时的样本平均数之差不再服从t分布,不能再运用
t检验方法来检验了。这时常用柯克兰—柯克斯检验
方法。
标准误的计算公式为:
t1(α) 为样本1的自由度df1=n1-1对应的临界值
t2(α) 为样本1的自由度df2=n2-1对应的临界值
例10 某校进行速度测验,共选择40名参加
,其中男生22人,女生18人,男生测验的
平均分为72分,标准差为8分,女生测验的
平均分为70 分,标准差为7.6分。已知该速
度测验结果服从正态分布,试问男女生速
度测验的平均结果有无显著性差异。
解:①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验统计量: 2 2
8 7. 6
SE D X = + = 2.54
22 − 1 18 − 1
X 1 − X 2 72 − 70
′
t = = = 0.79
SE D X 2.54
8 7.6
SE X = = 1.75, SE X = = 1.84
1
22 − 1 2
18 − 1
1.752 × 2.08 + 1.84 2 × 2.11
t0.05 2 = = 2.09
1.75 + 1.84
2 2
③判断结果:因为0.79<2.09,所以P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本容量相等
①独立样本:
a. 方差不等 S +S S +S
2
n1 −1
2
n2 −1
2 2
SE = = 1 2
其标准误计算公式为: n
DX
n −1
其检验公式还是: t ′ = D X − µ D = X 1 − X 2 (8 − 12) X
SE D SE D
X X
SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )
t (′α ) = 1 2
= t1(α ) = t 2(α )
df = n-1 SE 2
X1
+ SE 2
X2
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本容量相等
①独立样本:
a. 方差相等 DX − µ DX X1 − X 2
t= = (8 − 8)
其检验公式还是(与样本量无关): SE D X
SEDX
其标准误计算公式为: S n2 −1 + S n2 −1 S2 + S2
SE DX = 1 2
= 1 2
df = 2n-2 n n −1
因为2.024<2.10<2.712,所以0.05>P>0.01, α=0.05时差异
显著。故该市AB两校在该次物理统考中的平均成绩
差异显著。
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本(X1i, X2i)容量相等
②相关样本 (t检验一般不需要事先进行方差齐性检验,见P242说明)
令di=X1i - X2i 为每一对数据之差,则对d的显著性检
验就等同于对两样本均值差异的显著性检验:
T检验 t = X 1 − X 2 (8 − 17 )
自由度为 df = n-1 SE D
X
其标准误计算公式为: (∑ d)
2
s 2 ∑d − n
2
1. 相关系数未知, SED x
= SEd = d
n −1
=
n(n − 1)
P88 sd公式 4-9
s12 + s22 − 2rs12 s22
2. 相关系数已知, SEDx =
n −1
例13 某实验小组进行一项学习方法实验,在实验前,经
过精心匹配,分成两小组,一为实验组,一为对照组,各
组均为20人。实验结束后,对两组均进行智力测验,
经计算,其智商成绩分别为:实验组平均智商为
106,标准差为16;对照组平均智商为104,标准差
为15,两组测验的相关系数为0.75,试问该学习方法
对提高智力是否有显著影响。
解:①建立假设: H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2 (单侧检验 )
②计算统计量:
16 2 + 152 − 2 × 0.75 × 16 × 15
SE D = = 2.52
X
20 − 1
106 − 104
t= = 0.79
2.52
③判断结果:查表得: t(19 )0.05 = 2.093
因为0.79<2.093,所以P>0.05,差异不显著。
故该学习方法实验对学生智力提高没有显著影响。
例8-10 对9个被试进行两种夹角(150,300)的缪勒-莱
依尔错觉实验结果如下,问两种夹角的情况下错觉
量是否显著差异。
例8-11 用相关系数已知的公式来计算本题。
被试 1 2 3 4 5 6 7 8 9
150 14.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.3
300 10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9
di
解:
8-10: 先计算di , X1 ,X2 , 接着计算sd , 然后计算t统计量(t1=4.6248)
8-11:计算积差相关 0.7451 (t2=4.6248),Spearman相关0.7029 (t3=4.32)
t1=t2
随机从某总体选取10名被试,分别实施两
次数学测验,两次测验的成绩见下表,问
被试在两次测验的平均数是否有显著差异
?试对结果进行解释(α=0.05,df=9,
t=2.262;df=18,t=2.552)
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 独立样本
①当总体方差已知时,其检验公式为:
DX − µ DX
Z′ = (8 − 19 )
σ 2
σ 2
1
+ 2
n1 n2
②当总体方差未知时,其检验公式为:
DX − µ DX DX − µ DX
Z′ = = (8 − 20)
2 2 2 2
S S S S
n1 −1
+
n2 −1 1
+ 2
n1 n2 n1 − 1 n2 − 1
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 相关样本:
①当总体方差已知时,其检验公式为:
X1 − X 2
Z′ = (8 − 21)
σ + σ − 2rσ 1σ 2
2
1
2
2
n
②当总体方差未知时,其检验公式为:
X1 − X 2 X1 − X 2
Z′ = = (8 − 22)
S n21 −1 + S n22 −1 − 2rS n1−1S n2 −1 S12 + S 22 − 2rS1S 2
n n −1
一、单总体方差的显著性检验
单总体方差的差异检验也称为样本方差与总体方差的
差异显著性检验。由抽样分布的讨论知,从正态分布
的总体中随机抽取容量为n的样本,其样本方差与总体
方差比值的分布为自由度为n-1 的χ2 分布。其检验公式
为:
χ2 = S
2
2 2 小概率事件
nSn σ
χ =
2
σ2
当χ2 > χ2α/2 或χ2 < χ2 (1-α/2 )时, S2与σ2差异显著,
当χ2 (1-α/2 )< χ2 < χ2α/2时, S2与σ2差异不显著。
例14 已知某省化学高考成绩服从正态分布,标准差为
15分,从某校抽取35名学生,测其化学高考成绩标
准差为13分,试问该校化学高考成绩与全省方差有
无显著性差异。
解:①建立假设: 0 1
H : σ 2
= σ 2
0 , H 1 : σ 2
1 ≠ σ 2
0
S n2
(df1 = n1 − 1, df 2 = n2 − 1)
2
2 −1 2 −1
为了方便查F值表而不用计算倒数,在方差的齐性
检验时,其检验公式为: S2
F= 大
2
S 小
例15 某区幼儿园对幼儿进行健康检查,从中随
机抽取20名4 岁幼儿,其中男生12名,女生8
名,经计算得男生体重标准差为1.75公斤,女生
体重的标准差为1.73公斤,试问该区4岁男女幼
儿体重的方差差异是否显著。
解:①建立假设: H 0 : σ 12 = σ 22 , H1 : σ 12 ≠ σ 22
②计算统计量: 2 n 12
S n1 −1 =
2 1 2
S1 = × 1.75 = 3.34
n1 − 1 11
n2 8
S n22 −1 = S 2 = × 1.732 = 3.42
2
n2 − 1 7
S n22 −1 3.42
F= = = 1.02
③判断结果: S n21 −1 3.34
40 − 2
③判断结果:查t值表得:
t(38 ).01 2 = 2.704
− 3.38 > 2.704,∴ p < 0.01
故两班成绩的方差差异极显著.
一、单总体相关系数差异显著性检验
㈠当ρ=0时
当ρ=0时,样本积差相关系数的抽样分布服从自由度为
n-2的 t 分布,检验公式
r − ρ r −0
t= = (8 − 26 )
SEr SEr
其中,标准误为: 1− r 2
n−2
SEr = t=r
n−2 1− r 2
其他类型相关系数的显著性检验见p250-251
例20 某校对各门学科进行统考,统考后从该校
抽取42 名学生,计算他们语文与化学成绩的
积差相关系数为0.34,试问语文与化学成绩是否
真实存在相关。
解: 提出假设 H0 : ρ=0, H1: ρ≠0
统计决断:根据df=42-2=40,查t值表得
t(40)0.01=2.704, t(40)0.05=2.021.
在0.01显著性水平拒绝零假设,而在0.05显著性
水平下接受零假设
根据df=40,查附表7,
从α=0.01一列找到对应的积差相关系数临界值
为0.393
从α=0.05一列找到对应的积差相关系数临界值
为0.304
而计算得到的r=0.34,大于表中α=0.05的临界值,
因此该接受该相关系数显著的结论。而它小于
α=0.01的临界值,因此该拒绝该相关系数显著的
结论。
斯皮尔曼等级相关系数的检验就是查表做判断
(附表9)
㈡ ρ≠0时
当ρ≠0时,相关系数呈不同程度的偏态分布,只有样本
足够大(n>500)时,相关系数的抽样分布才渐进正态分
布。这一条件在实际中很难达到。这时,则需要用费
舍法。检验的公式为
Zr − Zρ
Z= (8 − 27 )
SEr
Zr的标准误为:
Z = (Z r − Z ρ ) n − 3
1
SEr =
n−3
例21有人估计,3~6岁儿童身高与体重的相关系数为
0.80,从某幼儿园随机抽取3~6岁儿童40名,经测量,
计算出他们的身高与体重的相关系数为0.68,试
问在该幼儿园的测查结果能否推翻上述对身高与
体重关系的估计。
解 H0: ρ=0, H1: ρ≠0
0.8 的Zr为1.099
0.68 的Zr为0.829
α=0.05, Zα/2=1.96
Z = (Z r − Z ρ ) n − 3 = (1.099 − 0.829) 40 − 3 = 1.6423 < 1.96
α=0.05下,接受H0,拒绝H1
㈠两样本相关系数分别由两组相互独立的被试得到
根据费舍Z函数进行转换,由于Zr的分布近似正态,同样
Zr1-Zr2的分布也是近似正态,检验的公式为:
Z=
(Z r1 ) (
− Z r2 − Z ρ1 − Z ρ 2 )(8 − 32)
SEDr
其中标准误为:
1 1
SEDr = +
n1 − 3 n2 − 3
例22 从某重点中学中抽取学生30名,从一般中
学中抽取35名学生,分别计算他们的数学成绩
与瑞文测验分数的相关系数为0.72和0.51,试问
能否认为重点中学学生在数学成绩与瑞文推理
能力之间比一般中学学生有更高的相关。
解 H0: r1≤r2, H1: r1>r2
0.72 的Zr为0.908
0.51 的Zr为0.563
SE2 = 1/27+1/32 , SE = 0.2613, α=0.05, Zα=1.64
0.908 − 0.563
Z= = 2.4683 > 1.64
0.2613
α=0.05下,拒绝H0,接受H1
㈡两样本相关系数由同一组被试求得
设r12,r23,r13是由三列变量计算出的两两相关系数,若
对r12和r13进行差异显著性检验时,样本相关系数的抽样
分布服从自由度为n-3的t分布。其检验公式为:
确定检验形式:双侧,单侧
进行统计推断——查表寻找相应的临界值,比较
Z与Zα,从而确定该样本的p是否为小概率。
例题24 已知某年某区高考升学率为75%,某校在
这一年有300名学生参加了高考,最后有210人被
高校录取,问该校的升学率与全区的升学率是否
相同?
解:np>5, 提出假设 H0: P’=0.75, H1: p’≠0.75
计算
p ' -p0 210 / 300-0.75
Z= = = 2.00
p0 q0 0.75 × 0.25
n 300
统计决断:因为Z=2>1.96=Z0.05/2,p<0.05,所
以拒绝零假设,接受备择假设,即该校这
一年的高考升学率与全区的升学率有显著
差异,由实际数据来看,该校的这一年的
升学率低于全区。
一、单总体比率的显著性检验
(1)当np ≤ 5 (p<q)时,可直接查附表13(1,2),若p̂
落入p0置信区间之外,可认为差异显著,否则不
显著。
例题25 已知某区学习障碍儿童的比率为8%,通
过调查得知某班45名学生中有学习障碍的学生有
3人,问该班的学习障碍学生的比率与全区是否
有差异?
np<5
通过查表得,比率为0.08所属总体比率0.95
置信区间为2%~19%,包含了6.67%,所以
要保留零假设,拒绝备择假设,也就是说
该班学习障碍学生的比率与全区没有显著
差异。
总体比率差异的显著性检验是根据两个样
本的比率来检验两个相应总体的比率是否
存在显著性差异。由于样本性质不同,其
检验方法也不同。
当n1 p1 ≥ 5,n2 p2 ≥ 5时,统计量pˆ 1 - pˆ 2 = D p的分布为正态分布。
1.若统计假设为: H 0 : p1-p2 = pD , H1 : p1-p2 ≠ pD
临界比率CR为:
Z=
( pˆ 1 - pˆ 2 ) − pD
σ p −p =
p1q1 p2 q2
+
σ pˆ - pˆ
1 2
1 2
n1 n2
2.若统计假设为: H 0 : p1 = p2 = p, H1 : p1 ≠ p2
临界比率CR为:
Z=
( pˆ 1 - pˆ 2 ) − 0
=
pˆ 1 - pˆ 2 σ p −p =
(n1qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 )
σ pˆ - pˆ σ pˆ - pˆ n1n( 2 n1 + n2)
1 2
1 2 1 2
通过比较单、双侧,来判断比率差异是否显著。
例26 研究者在两所学校随机各抽取一个班
学生进行一项视力检查,结果发现,甲校
46名学生中患近视的有20人,乙校48名学
生中患近视的有33人,问两校学生患近视
的比率是否有显著性差异?
pˆ 1 - pˆ 2 0.4348-0.6875
Z= = = 2.47
(n1 qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 ) (20 + 33)(26 + 15)
n1 n(2 n1 + n 2) 46 × 48(46 + 48)
例27 某厂质量检验人员认为该厂一车间的
产品一级品的比率比二车间产品一级品的
比率大5%,现从一车间和二车间分别抽出2
个独立随机样本,得到如下数据: n1=150,其
中一级品为113;n2 = 160,其中一级品为104.
试根据这些数据检验质量研究人员的观点
。(设α=0.05)
建立假设 H0: p1-p2≤0.05 H1: p1-p2>0.05
p1=113/150=0.753, p2 = 104/160=0.650
( pˆ 1 - pˆ 2 ) − 0.05
Z= = 1.034
pˆ 1 qˆ1 pˆ 2 qˆ 2
+
n1 n2
这个是右侧检验,α=0.05, Z 0.05=1.645>1.034,
故不能否定原假设,也就是说,不支持该厂
质量检测人员的观点是正确的。
当 n1 p1 5, n2 p2 5
差异显著性检验应用精确概率检验法。具体
见第十章
当两样本相关时,同一组被试在前后两次
实验中,观察的两个项目又相同,这样便
可得到前后两个项目的结果,据这两个结
果所计算出来的两样本比率,就称作相关
样本比率。
例28 某校120名学生期末代数测验之后,让他们在寒假
里独立完成教师编选的代数练习题,开学初进行同类题
目的测验,两次测验结果见下面频数表,问学生独立完
成教师编选的代数练习题,对提高代数成绩是否有显著
效果?
第二次测验 合计
良 非良
第一次 良 48 (a) 14 (b) 62 (a+b)
测验 非良 22 (c) 36 (d) 58 (c+d)
合计 70 (a+c) 50 (b+d) 120 (n)
根据表中的符号,可以把两次测验成绩良好
的比率之差表示为
p1-p2 = (a+b)/n – (a+c)/n = (b-c)/n
也就是两次成绩良好比率之差只涉及两次不
同成绩b和c的差异是否显著。
设两次测验中成绩不一致的数量为K=b+c,
实验结果b、c可视为二项分布(b可称为成
功的次数,c视为失败的次数)。
若b=c,则p=q=0.5 (即两次实验结果的比率
差异各为0.5,无差异),若Kp≥5,按二项分
布可知(近似正态分布):
µ=Kp= (b+c)/2, σ2=Kpq = (b+c)/4
如果每次取样,b和c落入b(b,K,0.5)的置信区
间内,则可推论说两次实验结果的比率差异
不显著;否则,则说明不是来自于p=q=0.5
的总体,而是取自p≠q≠0.5的总体,即比率
差异显著。
根据显著性检验公式
p − p0 K ( p − p 0 ) K ( p − 0.5)
Z= = =
p0 q0 Kp 0 q 0 Kp 0 q 0
K
b − 12 (b + c) b−c 14 − 22
= = = = −1.33
(b + c ) 12 × 12 b+c 14 + 22
因为|Z|=1.33<1.96, p>0.05, 所以保留零假设
,即寒假里独立完成教师编选的代数练习题
对提高代数成绩无显著效果。
例29 有研究者通过在一年前后对同一群学生各
进行了一次调查来了解某校图书馆服务质量的
改善情况。两次调查的结果如下,问两次调查
所获得的满意率是否有显著差异?
第二次调查 合计
满意 不满意
第一次 满意 18 10 28
调查 不满意 32 12 44
合计 50 22 72
根据表中的数据得知: b=10, c=32
将它们代入公式中,
b−c 10 − 32
Z= = = −3.40
b+c 10 + 32
因为|Z|=3.4>2.58, p<0.01, 所以拒绝零假设,
得出结论:一年后学生们对该校图书馆服
务的满意率有了极显著的提高。
观察次数 戒烟前
吸烟 不吸烟
戒烟后 吸烟 65 15
不吸烟 25 55
不能用正态分布概率计算,需按二项分布
计算p(x>b) (或p(x>c))以上的概率和来得到
临界比率,然后按照单双侧来判断差异是
否显著。
举例: P259 例题