第八章假设检验

描述统计
统计方法参数估计
推论统计
假设检验
参数点估计
估计区间估计
Z 检验
推 t 检验
论参数检验 F 检验
统 q 检验…
计假设计数资料—— χ2 检验
内检验
容符号检验相关
非参数
检验计量符号秩次检验样本
资料秩和检验独立
中位数检验样本
 参数估计和假设检验是统计推断的两个
组成部分，都是利用样本对总体进行某
种推断，但推断的角度不同。参数估计
讨论的是用样本统计量估计总体参数的
方法。假设检验讨论的是用样本信息去
检验对总体参数的某种假设是否成立的
程序和方法。
—— 总体参数之间确实存在差异。
在统计学中，进行这种推论的过程称作
假设检验。
讨论统计值之间差异的问题时，
有两种情况：
两个样本统计
量之间的差异
显著
该样本已基本不属各自代表的两个总
于已知总体体的参数之间确实
存在差异
 包括参数和非参数检验：
 参数假设检验（parametric test）：总体的
分布形式已知，需要对总体的未知参数进行
假设检验。
 非参数假设检验（non-parametric test）：对
总体分布形式所知甚少，需对未知分布函数
的形式及其他特征进行假设检验。
例1: 根据1989年的统计资料，某地女性新生儿的平均体重为3190
克。为判断该地1990年的女性新生儿体重与1989年相比有无显
著差异，从该地1990年的女性新生儿中随机抽取30人，测得其
平均体重为3210克。从样本数据看，1990年女新生儿体重比
1989年略高，但这种差异可能是由于抽样的随机性带来的，也
许这两年新生儿的体重并没有显著差异。究竟是否存在显著差
异？可以先假设这两年新生儿的体重没有显著差异，然后利用
样本信息检验这个假设能否成立。这是一个关于总体均值的假
设检验问题。
例2：某种大量生产的袋装食品，按规定每袋重量不得
少于250克，现从一批该种食品中任意抽取50袋，发
现有6袋重量低于250克。若规定食品不符合标准的
比例达到5％就不得出厂，问该批食品能否出厂。
可以先假设该批食品的不合格率不超过5％，然后
用样本不合格率来检验假设是否正确。这是一个关
于总体比例的假设检验问题。
假设检验的原理
平均数的显著性检验
平均数差异的显著性检验
方差的差异检验
相关系数的显著性检验
比率的显著性检验
 假设检验的原理：小概率原理。假设检验
的基本思想是概率性质的反证法。(不同于纯数
学中的反证法)
 什么是小概率？
 概率是0～1之间的一个数，因此小概率就是接近0的一个
数
 著名的英国统计家Ronald Fisher 把20分之1作为标准，也
就是0.05，从此0.05或比0.05小的概率都被认为是小概率
 Fisher没有任何深奥的理由解释他为什么选择0.05，只是
说他忽然想起来的
 小概率原理——发生概率很小的随机事件（小概率事件）
在一次实验中几乎是不可能发生的。
 根据这一原理，可以先假设总体参数的某项取值为真，
也就是假设其发生的可能性很大，然后抽取一个样本
进行观察，如果样本信息显示出现了与事先假设相反
的结果且与原假设差别很大，则说明原来假定的小概
率事件在一次实验中发生了，这是一个违背小概率原
理的不合理现象，因此有理由怀疑和拒绝原假设；否
则不能拒绝原假设。
 检验中使用的小概率是检验前人为指定的。
 某工厂质检部门规定该厂产品次品率不超过4％方能
出厂。今从1000件产品中抽出10件，经检验有4件次
品，问这批产品是否能出厂?
 如果假设这批产品的次品率P≤4％，则可计算事件
“抽10件产品有4件次品”的出现概率为：
P10 (4) = C104 (0.04) 4 (1 − 0.04) 6 = 0.00042
可见，概率是相当小的，1万次实验中可能出现4次，
然而概率如此小的事件，在一次实验中居然发生了，
这是不合理的，而不合理的根源在于假设次品率
P≤4％，因而认为假设次品率P≤4％是不能成立的，
故按质检部门的规定，这批产品不能出厂。
抽样分布
这个值不像我 ... 因此我们拒
们应该得到的绝假设 X = 50
样本均值 ...
... 如果这是总
体的真实均值
20 X = 50 样本均值
H0
第一，假设检验采用逻辑上的反证法，即为了检验
一个假设是否成立，首先假设它是真的，然后对
样本进行观察，如果发现出现了不合理现象，则
可以认为假设是不合理的，拒绝假设。否则可以
认为假设是合理的，接受假设。
第二，假设检验采用的反证法带有概率性质。所谓假
设的不合理不是绝对的，而是基于实践中广泛采用的
小概率事件几乎不可能发生的原则。至于事件的概率
小到什么程度才算是小概率事件，并没有统一的界定
标准，而是必须根据具体问题而定。如果一旦判断失
误，错误地拒绝原假设会造成巨大损失，那么拒绝原
假设的概率就应定的小一些；如果一旦判断失误，错
误地接受原假设会造成巨大损失，那么拒绝原假设的
概率就应定的大一些。
小概率通常用α表示，又称为检验的显著性水平。通
常取α＝0.05或α＝0.01，即把概率不超过0.05或0.01的事
件当作小概率事件。
 假设检验中，我们称作为检验对象的待检验假
设为原假设或零假设，用H0表示。原假设的对
立假设称为备择假设或备选假设，用H1表示。
 例如，设X0为总体均值X的某一确定值。
（1）对于总体均值是否等于某一确定值的原假
设可以表示为：
H0： X=X0 （如H0： X = 3190克）
其对应的备择假设则表示为：
H1： X≠X0 （如H1：X ≠3190克)
（2）对于总体均值X是否大于某一确定值X0
的原假设可以表示为：
H0：X≥X0 （如H0：X≥2000克）
H1：X＜X0 （如H1： X ＜2000克)
（3）对于总体均值X是否小于某一确定值X0
的原假设可以表示为：
H0：X≤X0 （如H0：X≤ 5％）
H1：X＞X0 （如H1：X＞5％）
注意：原假设总是有等号： =或≤ 或 ≥。
 根据假设的形式不同，假设检验可以分为双侧假设检验和单
侧假设检验。
 若原假设是总体参数等于某一数值，如H0： X ＝ X0 ，即
备择假设H1： X ≠ X 0，那么只要X＜ X 0和X＞ X 0 二者
中有一个成立，就可以否定原假设。这种假设检验称为双侧
检验。
 若原假设是总体参数大于等于或小于等于某一数值，如H0：
X ≥ X 0 （即H1：X＜X0）；或H0 ：X≤X0 （即H1：X＞
X0），那么对于前者当X＜X0时，对于后者当X＞X0 时
，可以否定原假设。这种假设检验称为单侧检验。可以分为
左侧检验和右侧检验。
研究的问题（总体均值检验）
假设
双侧检验左侧检验右侧检验
H0 X=X0 X ≥X 0 X ≤X 0
H1 X ≠X 0 X <X 0 X >X 0

 在规定了检验的显著性水平α后，根据容量
为n的样本，按照统计量的理论概率分布规
律，可以确定据以判断拒绝和接受原假设的
检验统计量的临界值。
 临界值将统计量的所有可能取值区间分为两
个互不相交的部分，即原假设的拒绝域和接
受域。
 对于正态总体，总体均值的假设检验可有如
下图示：
设H0：X＝X0 ， H1：X≠X0，有两个临界值，两个拒绝域，
每个拒绝域的面积为α/2。也称双尾检验。
X0
双侧检验示意图
抽样分布置信水平
拒绝域拒绝域
1-α
α/2 α/2
接受域
H0值样本统计量
临界值临界值
拒绝域拒绝域
1-α
α/2
α/2
接受域
临界值临界值
观察到
的样本
统计量
拒绝域拒绝域
1-α
α/2 α/2
接受域
临界值临界值
观察到
的样本
统计量
拒绝域拒绝域
1-α
α/2 α/2
接受域
临界值临界值
观察到
的样本
统计量
拒绝域
1-α
α
接受域
临界值
设H0：X≥X0 ，H1：X＜X0；临界值和拒
绝域均在左侧。也称下限检验。
X0
拒绝域
1-α
α
接受域
临界值
观察到的样本统计量
拒绝域
1-α
α
接受域
临界值
观察到
的样本
统计量
设H0 ：X≤X0 ，H1：X＞X0；临界值和拒
绝域均在右侧。也称上限检验。
X0
拒绝域
1-α
α
接受域
临界值
观察到的样本统计量
拒绝域
1-α
α
接受域
临界值
观察到
的样本
统计量
 根据假设检验做出判断无非下述四种情况：
1、原假设真实，并接受原假设，判断正确；
2、原假设不真实，且拒绝原假设，判断正确；
3、原假设真实，但拒绝原假设，判断错误；
4、原假设不真实，却接受原假设，判断错误。
 假设检验是依据样本提供的信息进行判断，有犯错误的可能。所
犯错误有两种类型：
 第一类错误是原假设H0为真时，检验结果把它当成不真而
拒绝了。犯这种错误的概率用α表示，也称作α型错误或弃
真错误。
 第二类错误是原假设H0不为真时，检验结果把它当成真而
接受了。犯这种错误的概率用β表示，也称作β型错误或取
伪错误。
假设检验中各种可能结果的概率
拒绝H0
接受H0
审判过程：H0: 无罪接受H1
裁实际情况
决无罪有罪 H0 为 1-α
α(弃真错误）
无罪正确错误真 (正确决策)
有罪错误正确
β
H0 为
(取伪错误) 1-β(正确决策)
伪
图(a)
X≤X0
H0为真
图(b)
X＝X1＞X0
H0为伪
从上图可以看出，如果临界值沿水平方向右移，α将变小而β变
大，即若减小α错误，就会增大犯β错误的机会；如果临界值沿
水平方向左移，α将变大而β变小，即若减小β错误，也会增大
犯α错误的机会。
两类错误的控制
⑴利用已知的实际总体参数值与假设参数值之间的大
小关系，合理安排拒绝区域的位置
①若弃真的后果较大，则将α定小一点，β就大。
②若存伪的后果较大，则将β定小一点，α就大。
⑵使样本容量增大，可以同时减少两类错误，或减少
其中一种错误而不致于增大另一种错误（如在α 和其
他条件不变时， β 会减小）。（因为样本容量增大
，抽样误差越小，样本分布就越高狭，两侧的面积
就越小。）
 在样本容量n一定的情况下，假设检验不能同时做到犯α
和β两类错误的概率都很小。若减小α错误，就会增大犯β
错误的机会；若减小β错误，也会增大犯α错误的机会。
要使α和β同时变小只有增大样本容量。但样本容量增加
要受人力、经费、时间等很多因素的限制，无限制增加
样本容量就会使抽样调查失去意义。因此假设检验需要
慎重考虑对两类错误进行控制的问题。
α和β的关系就像翘翘板，你不能同时减
α小β就大， α大β就小
少两类错误!
β
α
 假设检验中人们普遍执行同一准则：首先控制弃真错误（α错
误）。假设检验的基本法则以α为显著性水平就体现了这一原则。
 两个理由:
 统计推断中大家都遵循统一的准则，讨论问题会比较方便。
 更重要的是: 原假设常常是明确的，而备择假设往往是模糊的。
如H0：X＝X0很清楚，而H1：X≠X0则不太清楚，是X＜
X0还是X＞X0 ？大多少小多少都不清楚。对含义清晰的数
量标准进行检验更容易被接受。
因此，第一类错误成为控制两类错误的重点。
 α错误：控制显著性水平。
 实验条件控制较好：α=0.05
 实验条件难于控制：α=0.01，或更高
P227 统计检验力 1- β
 β错误的影响因素与控制
 实际值与假设值相差越大，β越小。
 α越小，β越大。同时控制，增加n。
 α、n固定时，适当的检验类型可减小β。
㈠根据研究需要提出原假设H0和备择假设H1
㈡确定适当的检验统计量
㈢确定显著性水平α和临界值及拒绝域
㈣根据样本数据计算检验统计量的值（或P值）
㈤将检验统计量值与临界值比较，作出拒绝或
接受原假设的决策
 应该注意：
⑴对任一假设检验问题，其所有可能结果均
应包括在所提出的两个对立假设中，原假
设与对立假设总有一个、也只能有一个成
立。
⑵原假设一定要有等号： =或≤ 或 ≥。
 原假设不是随意提出的，应该本着“不轻
易拒绝原假设”的原则。
 双侧检验属于决策中的假设检验。即不论是
拒绝H0 还是接受H0，都必需采取相应的行动
措施。
 例如，某种零件的尺寸，要求其平均长度为
10厘米，大于或小于10厘米均属于不合格。
待检验问题是该企业生产的零件平均长度是
10厘米吗?(属于决策中的假设)则建立的原假
设与备择假设应为
H0: X = 10 H1: X≠ 10

 应区别不同情况采取不同的建立假设方法。
对于检验某项研究是否达到了预期效果
 一般是将研究的预期效果（希望、想要证明的假设）
作为备择假设H1，将认为研究结果无效作为原假设
H0。先确立备择假设H1。因为只有当检验结果与原
假设有明显差别时才能拒绝原假设而接受备择假设，
原假设不会轻易被拒绝，就使得希望得到的结论不
会轻易被接受，从而减少结论错误。
 例如，有研究预计，采用新技术生产后将会使某产品的使用
寿命明显延长到1500小时以上。则建立的原假设与备择假设
应为： H0: X≤ 1500 H1: X> 1500
 例如，有研究预计，改进生产工艺后会使某产品的废品率降
低到2%以下。则建立的原假设与备择假设应为：
H0: X ≥ 2% H1: X < 2%
对于检验某项声明的有效性
• 一般可将所作的声明作为原假设。将对该声明的质
疑作为备择假设。先确立原假设H0。因为除非有证
据表明“声明”无效，否则就应认为该“声明”是
有效的。
 例如，某灯泡制造商声称，该企业生产的灯泡平均
使用寿命在1000小时以上。通常除非样本能提供证
据表明使用寿命在1000小时以下，否则就应认为厂
商的声称是正确的。建立的原假设与备择假设应为：
H0: X≥ 1000 H1: X < 1000
对于上述问题还可以结合不同背景建立假设。
同样的问题背景不同可以采用不同的原假设。
 例如，一商店经常从某工厂购进某种商品，该商品质
量指标为X，X值愈大商品质量愈好。商店提出的进
货条件是按批验收，只有通过假设“X≥X0 ”检验的
批次才能接受。有两种可能情况：
⑴如果根据过去较长时间购货记录，商店相信该厂产品
质量好，于是同意把原假设定为X≥X0 ，而且选择较
低的检验显著性水平。这对工厂是有利的，使得达到质
量标准的产品以很小的概率被拒收。虽然这会使商店面
临接受不合标准产品的风险，但历史记录显示出现这种
情况的可能性很小，而且商店也可因此获得较好的货源。
⑵如果过去一段时期的记录表明，该厂产品质量并不理
想，商店则会坚持以X≤X0为原假设，并选定较小的
检验显著性水平。这对商店是有利的，不会轻易地拒绝
原假设，有 1－α的可能把劣质产品拒之门外。
⒈双侧检验：只强调差异而不强调方向性的
检验称为双侧检验。
⒉单侧检验：强调某一方向的检验称为单侧
检验。又分左侧检验和右侧检验。
通常适用于检验某一参数是否“大于”或
“优于”、“快于”及“小于”、“劣
于”、“慢于”另一参数等一类问题。
在实际研究中何时用单侧检验何时用双侧检
验，一定要根据研究目的所规定的方向性来确
定。
应该用单侧检验的问题，若使用双侧检验，
其结果一方面可能使结论由“显著”变为“不
显著”，另一方面也增大了β错误。
反之，若使用双侧检验的问题若用单侧来检
验，虽然减小了β错误，但是使无方向性的问题
人为地成为单方向问题，这也有悖于研究目的。
 假设检验根据检验内容和条件不同需要采用不同的检验
统计量。
 在一个正态总体的参数检验中，Z统计量和t统计量常用
于均值和比例的检验，χ2统计量用于方差的检验。选择统
计量需考虑的因素有被检验的参数类型、总体方差是否
已知、用于检验的样本量大小等。
一个总体
均值方差
Z 检验（单尾 t 检验（单尾和 χ2检验（单尾

和双尾）双尾）和双尾）
 显著性水平α是当原假设为正确时被拒绝的概率，
是由研究者事先确定的。
 显著性水平的大小应根据研究需要的精确度和可
靠性而定。通常取α＝0.05或α＝0.01，即接受原
假设的决定是正确的可能性（概率）为95％或99
％。
 根据给定的显著性水平α，查表得出相应的临界
值，同时指定拒绝域。
 例如，总体标准差σ已知时根据样本均值计算统计
量Z的公式为 x−X
Z=
σ/ n
 如果检验统计量的值落入拒绝域，则拒绝原
假设，接受备择假设；如果检验统计量的值
落入接受域，则接受原假设，拒绝备择假设。
一、平均数差异显著性检验的类型
⒈单总体平均数差异显著性检验，也
叫平均数的显著性检验。
⒉双总体平均数差异显著性检验，也
叫平均数差异的显著性检验。
⒈建立假设：
双侧检验的假设 : H 0 : µ = µ 0, H1 : µ ≠ µ 0
或者(双总体) H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
单侧检验的假设 : H 0 : µ ≤ µ 0 , H1 : µ > µ 0
或者(双总体) H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2
⒉根据给定条件确定抽样分布的形态，确定相应的检
验方法，并计算出统计量的值。
⒊确定α，查出理论值，从而确定出H0拒绝和接受区域。
⒋作出判断。如Z>Z临,即p<α,则拒绝H0,接受H1。
㈠总体分布为正态分布,且总体方差已知时
X − µ0 σ0
Z=  (8 − 1), 其中SE X =
SE X n
例1 某地区统考数学,假设该统考数学成绩服从正
态分布,已知其总平均分为50分,标准差为12分。
从该地区随机选择一个班作为样本，该班有学
生50人，经计算该班平均成绩为53分，试问该
班成绩与总成绩的差异是否显著。
解：①建立假设： H 0 : µ = µ 0 , H1 : µ ≠ µ 0
σ012 12
②计算统计量： SE X = = = = 1.7
n 50 7.07
X − µ 0 53 − 50
Z= = = 1.76
SE X 1.7
③判断结果:因为1.76<1.96,所以P>0.05
差异不显著,接受H0,拒绝H1。
故该班数学成绩与总平均成绩的差异不显著。
例2 对某专业课在全国同类高校内进行统一测试，
已知全体考生成绩服从正态分布，其总平均分
为64分，总标准差为8.6分，从某高校随机抽
取20份试卷，经计算得到这20份试卷的平均成
绩为70分，问该校学生的平均成绩是否显著地
优于全体学生的平均水平？
解：①建立假设：H 0 : µ ≤ µ 0 , H1 : µ > µ 0
②计算统计量： σ 8.6 8.6
SE X = 0
= = = 1.92
n 20 4.47
X − µ 0 70 − 64
Z= = = 3.125
SE 1.92
③查正态表（单侧）得：
当 α = 0.01时, Z 0.01 = 2.33
④判断结果:因为3.125>2.33,所以P<0.01。
差异极其显著，拒绝H0。故该校学生的平均
成绩极显著地优于全体学生的平均水平。
㈡总体分布为正态,总体方差未知
当总体分布为正态分布,总体方差未知时,样本平均数的
抽样分布服从自由度为n-1 的t分布,此时可用t检验方法进
行检验。在检验中，计算统计量的值的公式为：
X − µ0 Sn S n −1
t=  (8 − 2), 其中SE X = =
SE X n −1 n
例3 已知4岁正常男童平均体重为15.6公斤,从某幼儿园中随机
抽取20名4岁男童,经测量计算出这20名男童平均体重为16
公斤,标准差为1.76公斤,试问该幼儿园4岁男童的体重与4岁
正常男童平均体重有无显著性差异?
解:①建立假设： H 0 : µ = µ 0 , H1 : µ ≠ µ 0
②计算统计量： S 1.76
SE X = n
= = 0.4
n −1 20 − 1
X − µ 0 16 − 15.6
t= = =1
SE X 0.4
③判断结果：当α = 0.05时, df = 20 − 1 = 19时,
t(19)0.05 2 = 2.093
因为1<2.093,所以,P>0.05，差异不显著。
故该幼儿园4岁男童平均体重与正常男童平均体
重无显著差异。
例4 某实验组随机选择了40名儿童作提高儿童智
力水平实验，实验结束后，对参加实验的儿童
进行韦氏儿童智力测验，结果得到这40名儿童
的智商平均值为105，标准差为12，已知韦氏
儿童智力测验的平均值为100，试问该实验是
否成功？
解：①建立假设: H 0 : µ ≤ µ 0 , H1 : µ > µ 0
S 12 12
②计算统计量: SE X = = = = 1.92
n −1 40 − 1 6.24
X − µ 0 105 − 100
t= = = 2.6
SE X 1.92
③判断结果: 当α = 0.01, df = 39时, t(39 )0.01 = 2.423
因为2.6 > 2.423, 所以P < 0.01
故实验后的儿童智力水平极明显高于同龄儿童一
般水平,实验取得了成功。
㈢总体为非正态分布
当总体为非正态分布时，根据中心极限定理，样本容
量足够大时（n≥30，也有认为n≥50)，样本平均数的抽
样分布趋于正态分布，在平均数差异显著性检验中，
也可近似地采用Z检验方法进行检验。
当总体方差已知时,其检验公式为:
X − µ0 σ0
Z′ = 其中 SE X =
SE X n
当总体方差未知时，上式中的σ0可用它的无偏估计量
Sn-1代替， S n −1
SE X =
当样本量足够大时，也可以用S代替σ0 n
注意:这种采用近似Z检验的方法只能适用n>30时的情
况,当n<30时不适用这种方法,也不能用t检验方法,只
能采用非参数检验方法进行检验。
例5 某县进行物理竞赛，结果分数的分布不是正
态，总平均成绩为55分。其中某重点学校参加
竞赛60人，其平均成绩为62分，标准差为14
分，试问该校平均成绩是否明显优于全县一般
水平。
当两个变量间的相关系数为r时，两变量的方差为：
(P118) σ (2X −Y ) = σ X2 + σ Y2 − 2rσ xσ y
当两个变量相互独立时，其和（或差）的方差等于各
自方差的和：
σ (2X ±Y ) = σ X2 + σ Y2
因此有：
σ 12 σ 22 σ1 σ 2
SE D = SE + SE =
1
2 2
2 + − 2r
X
n1 n2 n1 n2
当两个样本独立时，r=0，这时上述公式为
σ 12 σ 22
SE D = SE12 + SE 22 = +
X
n1 n2
4.1 两总体分布为正态,且方差已知
当两样本相互独立或相关
两平均数之差的标准误为：
S DX σ 12 + σ 22 − 2rσ 1σ 2
SEDX = =
n n
= SE12 + SE22 − 2rSE1SE2  (8 − 4 )
检验统计量公式为
( X 1 − X 2 ) − (µ1 − µ 2 ) DX − µ D
Z= = X
 (8 − 5)
SE D SE D
X X
(4.1.1) 两样本相互独立
例6: 从某科高考成绩中,从甲省抽取80名考生,计
算平均成绩为84分,从乙省抽取100名考生,计算
平均成绩为80分,已知甲乙两省该科高考成绩
均呈正态分布,甲省标准差为12.4分,乙省标准
差为11.2分,试问甲乙两省该科高考成绩是否有
显著性差异?
解：⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
⒉计算检验的统计量:
σ 12 σ 22 12.4 2 11.2 2
SE D X = + = +
n1 n2 80 100
= 1.922 + 1.2544 = 1.7822
X 1 − X 2 84 − 80
Z= = = 2.2444
SE D X 1.7822
⒊判断结果:查表得, Z 0.05 2 = 1.96 因为2.24>1.96,所以

P<0.05,差异极其显著。
故根据这次抽样，可以推断出甲乙两省该科高考成绩
有显著性差异。
例7从某市城区随机抽取5岁男童30名,测得其平
均体重为20.15公斤,从该市郊区随机抽取25名5
岁男童,测得其平均体重为18.25公斤,已知该市
城区5岁男童体重的标准差为1.85公斤,郊区5岁
男童体重的标准差为1.78公斤.能否根据这次抽
样推断出该市城区与郊区5岁男童平均体重的
差异是否显著。
解：⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
σ 12 σ 22 1.852 1.782
SE DX = + = +
n1 n2 30 25
= 0.114 + 0.127 = 0.49
X 1 − X 2 20.15 − 18.25
Z= = = 3.87
SE DX 0.49
⒊判断结果:查表得, Z 0.01 2 = 2.58 因为3.87>2.58,所以
P<0.01,差异极其显著。
故根据这次抽样，可以推断出该市郊区5岁男童平均体
重有极其显著的差异。
(4.1.2) 两样本相关
例8 某实验组选择20名儿童作智力发展实验在
实验前和实验后对实验儿童进行一次韦氏儿
童智力测验，在实验前得到平均智商为102，
实验后所得平均智商为107，已知韦氏儿童智
力测验标准差为15，两次测验相关系数为0.7,
试问该实验是否取得了成功。
解：⒈建立假设： H 0 : µ1 ≥ µ 2 , H1 : µ1  µ 2
σ 12 + σ 22 − 2rσ 1σ 2
SE DX =
n
152 + 152 − 2 × 0.7 × 15 × 15
= = 2.6
20
X 1 − X 2 102 − 107
Z= = = −1.92
SE D X 2.6
⒊判断结果:
查表得 : Z 0.05 = 1.645, Z 0.01 = 2.33

因为1.645 < − 1.92 < 2.33, 所以,0.05 > P > 0.01,
例9 某地两年内进行了物理竞赛,已知两次竞赛成
绩均服从正态分布, 两次竞赛的标准差分别为
12分和14分,某校有10 名学生先后两次参加了
竞赛,根据他们的竞赛成绩计算出他们的平均
成绩分别为72分和70分,这10 名学生竞赛成绩
的相关系数为0.76,试问该地两次竞赛成绩有无
显著性差异。
解：⒈建立假设： H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
σ 12 + σ 22 − 2rσ 1σ 2
SEDX =
n
12 2 + 14 2 − 2 × 0.76 ×12 ×14
= = 2.91
10
X 1 − X 2 72 − 70
Z= = = 0.6875
⒊判断结果: SED X 2.91
判断结果:查表得,Z 0.05 2 = 1.96 因为0.6875<1.96,所以

P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
当两总体为正态分布,两总体方差均未知,从两总体所抽
出两样本平均数的差数服从df=n-1的t分布,可用t检验
方法进行检验。
4.2.1 两样本容量不等，且为独立样本
σ 2
σ
根据公式(8-5)则标准误的计算公式为：SED = 1 + 2
2
在该式中，σ12与σ22都未知， n1 n2 X
此时可用无偏方差来代替
S n21 −1 S n22 −1
SEDX = +  (8 − 7 )
n1 n2
第一，当总体方差相等时，
其检验公式为： DX − µ DX X1 − X 2
t= =  (8 − 8)
SEDX SEDX
df = n1+n2-2 n1S12 + n2 S 22 n1 + n2
其中 SEDX = ⋅
n1 + n2 − 2 n1n2
联合方差sp2
(n1 − 1)s + (n2 − 1)s

2
n1 −1
2
n2 −1 n s +n s
2 2
= =
2 1 n1 2 n2
s p
(n1 − 1) + (n2 − 1) (n1 − 1) + (n2 − 1)
2 1 1  n1 S12 + n2 S 22 n1 + n2
SE D = s p  +  = ⋅
X
 n1 n2  n1 + n2 − 2 n1 n2
精确合成参见P90 公式4-13
例10 某校进行速度测验，共选择40名参加，其
中男生22人，女生18人，男生测验的平均分为
72分，标准差为8分，女生测验的平均分为70
分，标准差为7.6分。已知该速度测验结果服
从正态分布，试问男女生速度测验的平均结果
有无显著性差异。
解：①建立假设： H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验的统计量:
n1S12 + n2 S 22 n1 + n2
SE D X = ⋅
n1 + n2 − 2 n1n2
22 × 8 2 + 18 × 7.6 2 22 + 18
= × = 2.55
22 + 18 − 2 22 × 18
X − X 2 72 − 70
t= 1 = = 0.78
SE D X 2.55
③判断结果：当α=0.05，df=n1+n2-2 = 22+18-2=38时，
t(38)0.05/2=2.021。
因为0.78<2.021,所以P>0.05,差异不显著。
第二，当总体方差不等时，
此时的样本平均数之差不再服从t分布，不能再运用
t检验方法来检验了。这时常用柯克兰—柯克斯检验
方法。
标准误的计算公式为：
S n21 −1 S n22 −1 S12 S 22

SE D = + = +  (8 − 11)
X
n1 n2 n1 − 1 n2 − 1
第二，当总体方差不等时，
DX − µ D X1 − X 2
检验的统计量公式为： t′ = X
=  (8 − 12 )
SE D SE D
X X
t’的分布理论值为： SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )

t(′α ) = 1 2
 (8 − 13)
SE + SE
2
X1
2
X2
t1(α) 为样本1的自由度df1=n1-1对应的临界值
t2(α) 为样本1的自由度df2=n2-1对应的临界值
 例10 某校进行速度测验，共选择40名参加
，其中男生22人，女生18人，男生测验的
平均分为72分，标准差为8分，女生测验的
平均分为70 分，标准差为7.6分。已知该速
度测验结果服从正态分布，试问男女生速
度测验的平均结果有无显著性差异。
解：①建立假设： H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验统计量： 2 2
8 7. 6
SE D X = + = 2.54
22 − 1 18 − 1
X 1 − X 2 72 − 70
′
t = = = 0.79
SE D X 2.54
8 7.6
SE X = = 1.75, SE X = = 1.84
1
22 − 1 2
18 − 1
1.752 × 2.08 + 1.84 2 × 2.11
t0.05 2 = = 2.09
1.75 + 1.84
2 2
③判断结果：因为0.79<2.09,所以P>0.05,差异不显著。
4.2.2 两样本容量相等
①独立样本:
a. 方差不等 S +S S +S
2
n1 −1
2
n2 −1
2 2
SE = = 1 2
其标准误计算公式为: n
DX
n −1
其检验公式还是： t ′ = D X − µ D = X 1 − X 2  (8 − 12) X
SE D SE D
X X
SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )
t (′α ) = 1 2
= t1(α ) = t 2(α )
df = n-1 SE 2
X1
+ SE 2
X2
4.2.2 两样本容量相等
①独立样本:
a. 方差相等 DX − µ DX X1 − X 2
t= =  (8 − 8)
其检验公式还是(与样本量无关)： SE D X
SEDX
其标准误计算公式为: S n2 −1 + S n2 −1 S2 + S2
SE DX = 1 2
= 1 2
df = 2n-2 n n −1
(n1 − 1)s n2 −1 + (n2 − 1)s n2 −1 (s 2

n1 −1 + s n22 −1 ) n1 s n21 + n2 s n22 (
n s n21 + s n22 )
s 2
= 1 2
= = =
p
(n1 − 1) + (n2 − 1) 2 (n1 − 1) + (n2 − 1) 2(n − 1)
1 1 S n21 −1 + S n22 −1 2 S n21 −1 + S n22 −1 (

n S n21 + S n22 ) 2 S n21 + S n22
SE D = s 2p  +  = ⋅ = = ⋅ =
X
n n 2 n n 2(n − 1) n n −1
例12 某市进行一次物理统考, 已知统考成绩服从正态
分布,从该市A校和B校各抽取20名学生,经计算两校
的物理统考平均成绩分别为82分和77分,标准差分别
为7.2分和7.5分,试问A、B两校在该次物理统考中的
平均成绩差异是否显著。
解：①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验统计量: 2 2
7.2 + 7.5
SE D = = 2.38
X
20 − 1
82 − 77
t= = 2.10
2.38
③判断结果:查表得: t (38 )0.05 2 = 2.024, t (38 )0.01 2 = 2.712
因为2.024<2.10<2.712,所以0.05>P>0.01, α=0.05时差异
显著。故该市AB两校在该次物理统考中的平均成绩
差异显著。
4.2.2 两样本(X1i, X2i)容量相等
②相关样本（t检验一般不需要事先进行方差齐性检验，见P242说明）
令di=X1i - X2i 为每一对数据之差，则对d的显著性检
验就等同于对两样本均值差异的显著性检验：
T检验 t = X 1 − X 2  (8 − 17 )
自由度为 df = n-1 SE D
X
其标准误计算公式为: (∑ d)
2
s 2 ∑d − n
2
1. 相关系数未知， SED x
= SEd = d
n −1
=
n(n − 1)
P88 sd公式 4-9
s12 + s22 − 2rs12 s22
2. 相关系数已知, SEDx =
n −1
例13 某实验小组进行一项学习方法实验,在实验前,经
过精心匹配,分成两小组,一为实验组,一为对照组,各
组均为20人。实验结束后，对两组均进行智力测验，
经计算，其智商成绩分别为：实验组平均智商为
106，标准差为16；对照组平均智商为104，标准差
为15，两组测验的相关系数为0.75,试问该学习方法
对提高智力是否有显著影响。
解：①建立假设: H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2 (单侧检验 )
②计算统计量:
16 2 + 152 − 2 × 0.75 × 16 × 15
SE D = = 2.52
X
20 − 1
106 − 104
t= = 0.79
2.52
③判断结果:查表得: t(19 )0.05 = 2.093
因为0.79<2.093,所以P>0.05,差异不显著。
故该学习方法实验对学生智力提高没有显著影响。
例8-10 对9个被试进行两种夹角（150,300）的缪勒-莱
依尔错觉实验结果如下，问两种夹角的情况下错觉
量是否显著差异。
例8-11 用相关系数已知的公式来计算本题。
被试 1 2 3 4 5 6 7 8 9
150 14.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.3
300 10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9
di
解：
8-10：先计算di , X1 ,X2 , 接着计算sd , 然后计算t统计量(t1=4.6248)
8-11：计算积差相关 0.7451 (t2=4.6248)，Spearman相关0.7029 (t3=4.32)
t1=t2
 随机从某总体选取10名被试，分别实施两
次数学测验，两次测验的成绩见下表，问
被试在两次测验的平均数是否有显著差异
？试对结果进行解释（α=0.05，df=9，
t=2.262；df=18，t=2.552）
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 独立样本
①当总体方差已知时,其检验公式为:
DX − µ DX
Z′ =  (8 − 19 )
σ 2
σ 2
1
+ 2
n1 n2
②当总体方差未知时,其检验公式为:
DX − µ DX DX − µ DX
Z′ = =  (8 − 20)
2 2 2 2
S S S S
n1 −1
+
n2 −1 1
+ 2
n1 n2 n1 − 1 n2 − 1
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 相关样本:
①当总体方差已知时,其检验公式为:
X1 − X 2
Z′ =  (8 − 21)
σ + σ − 2rσ 1σ 2
2
1
2
2
n
②当总体方差未知时,其检验公式为:
X1 − X 2 X1 − X 2
Z′ = =  (8 − 22)
S n21 −1 + S n22 −1 − 2rS n1−1S n2 −1 S12 + S 22 − 2rS1S 2
n n −1
一、单总体方差的显著性检验
单总体方差的差异检验也称为样本方差与总体方差的
差异显著性检验。由抽样分布的讨论知，从正态分布
的总体中随机抽取容量为n的样本，其样本方差与总体
方差比值的分布为自由度为n-1 的χ2 分布。其检验公式
为：
χ2 = S
2
2 2 小概率事件
nSn σ
χ =
2
σ2
当χ2 > χ2α/2 或χ2 < χ2 (1-α/2 )时, S2与σ2差异显著，
当χ2 (1-α/2 )< χ2 < χ2α/2时, S2与σ2差异不显著。
例14 已知某省化学高考成绩服从正态分布，标准差为
15分，从某校抽取35名学生，测其化学高考成绩标
准差为13分，试问该校化学高考成绩与全省方差有
无显著性差异。
解：①建立假设: 0 1
H : σ 2
= σ 2
0 , H 1 : σ 2
1 ≠ σ 2
0
②计算统计量: χ = nS 2 35 × 132 5915

2
= = = 26.29
σ2 15 2
225
③判断结果:查χ2值表,当α=0.05, df=35-1=34, 得
χ2 0.05/2 = χ2 0.025 = 53 (用内插法近似求)， χ2 1-0.05/2 =20.6，
因为20.6<26.69<53,所以p>0.05,差异不显著
两样本方差的差异显著性检验的目的是想了解样本抽自
的两个总体的方差的一致情况，或两个总体方差是否相
等，因此也称为方差的齐性检验。
㈠独立样本
设有两个正态总体X和Y, X~N(µ1, σ12), Y~N(µ2, σ22), 且X
和Y相互独立,从X和Y两总体中抽取样本容量分别为n1,n2
的两个样本,计算其方差分别为S12 和S22, 假如σ12 = σ22
那么σ12 / σ22 =1。当两样本的总体方差未知，则可用总
体方差的无偏估计Sn1-12 和Sn2-12来代替σ12 和 σ22 。这两
个估计量的比的抽样分布服从df1=n1-1，df2=n2-1的 F分布。
即（假如σ12 = σ22 根据公式6-14推导出6-15）
S n2 −1 / σ 12 S n2 −1
F= 1
2
Sn /σ 2 = 1
S n2
(df1 = n1 − 1, df 2 = n2 − 1)
2
2 −1 2 −1
当F> Fα/2 或F< F (1-α/2 )时, σ12 和 σ22差异显著，

当F (1-α/2 )< F < Fα/2时, σ12 和 σ22差异不显著。
F (1-α/2) 与Fα/2互为倒数，即 Fα/2= 1/ F (1-α/2)
为了方便查F值表而不用计算倒数，在方差的齐性
检验时，其检验公式为： S2
F= 大
2
S 小
例15 某区幼儿园对幼儿进行健康检查，从中随
机抽取20名4 岁幼儿，其中男生12名，女生8
名，经计算得男生体重标准差为1.75公斤,女生
体重的标准差为1.73公斤,试问该区4岁男女幼
儿体重的方差差异是否显著。
解：①建立假设: H 0 : σ 12 = σ 22 , H1 : σ 12 ≠ σ 22
②计算统计量: 2 n 12
S n1 −1 =
2 1 2
S1 = × 1.75 = 3.34
n1 − 1 11
n2 8
S n22 −1 = S 2 = × 1.732 = 3.42
2
n2 − 1 7
S n22 −1 3.42
F= = = 1.02
③判断结果: S n21 −1 3.34
查F值得 : F(7,10 ).05 2 = 3.95, F(7,12 ).05 2 = 3.61

由内插法得 : F(7,11).05 2 = 3.78,1.02 < 3.78,
∴ P > 0.05, 差异不显著.
例16 本章第一节例10进行方差的差异显著性检验。
解：①建立假设: H 0 : σ 12 = σ 22 , H1 : σ 12 ≠ σ 22
②计算统计量:
n1 22
S n21 −1 = S12 = × 82 = 67.05
n1 − 1 21
n2 18
S n22 −1 = S 22 = × 7.6 2 = 61.16
n2 − 1 17
S n21 −1 67.05
F= = = 1.10
S n22 −1 61.16
③判断结果:
查F值表得 : F(20,15 )0.05 2 = 2.76, F(24,15 )0.05 2 = 2.70
F(20, 20 )0.05 2 = 2.46, F(24, 20 )0.05 2 = 2.41, 由内插法得 :
F(21,17 )0.05 2 = 2.58,1.1 < 2.58,∴ P > 0.05, 差异不显著.
(二) 相关样本
当两个样本相关时，两样本方差的比值就不再服从F分布，
不能用F检验对方差的差异情况进行检验。但统计量：
S −S
2 2
t= 1 2
 (8 − 25)
4S S 1 − r
1
2 2
2 ( 2
)
n−2
服从自由度为n-2的t分布。因此可以对相关样本方差进
行t检验。
例19 在某次教学方法改革实验结束后，实验班与对照班
（各班均为40人）的成绩的标准差分别为8.4分和12.6分,
两班的相关系数为0.65,试问两班成绩的方差的差异是否
显著。
解：①建立假设: H 0 : σ 12 = σ 22 ; H1 : σ 12 ≠ σ 22
②计算统计量: 2
S1 − S 2
2
t=
( )
4 S12 S 22 1 − r 2
n−2
8.42 − 12.62
= = −3.38
2
(
4 × 8.4 × 12.6 × 1 − 0.65
2
)
2
40 − 2
③判断结果:查t值表得:
t(38 ).01 2 = 2.704
 − 3.38 > 2.704,∴ p < 0.01
故两班成绩的方差差异极显著.
一、单总体相关系数差异显著性检验
㈠当ρ=0时
当ρ=0时，样本积差相关系数的抽样分布服从自由度为
n-2的 t 分布，检验公式
r − ρ r −0
t= =  (8 − 26 )
SEr SEr
其中，标准误为： 1− r 2
n−2
SEr = t=r
n−2 1− r 2
其他类型相关系数的显著性检验见p250-251
例20 某校对各门学科进行统考，统考后从该校
抽取42 名学生，计算他们语文与化学成绩的
积差相关系数为0.34,试问语文与化学成绩是否
真实存在相关。
解：提出假设 H0 ： ρ=0， H1： ρ≠0
选择检验统计量 t = r n − 2 = 0.34 40 = 2.2866

1− r
2
1 − 0.34
2
统计决断：根据df=42-2=40,查t值表得
t(40)0.01=2.704, t(40)0.05=2.021.
在0.01显著性水平拒绝零假设，而在0.05显著性
水平下接受零假设
 根据df=40，查附表7，
 从α=0.01一列找到对应的积差相关系数临界值
为0.393
 从α=0.05一列找到对应的积差相关系数临界值
为0.304
 而计算得到的r=0.34，大于表中α=0.05的临界值，
因此该接受该相关系数显著的结论。而它小于
α=0.01的临界值，因此该拒绝该相关系数显著的
结论。
 斯皮尔曼等级相关系数的检验就是查表做判断
(附表9)
㈡ ρ≠0时
当ρ≠0时，相关系数呈不同程度的偏态分布，只有样本
足够大（n>500)时,相关系数的抽样分布才渐进正态分
布。这一条件在实际中很难达到。这时，则需要用费
舍法。检验的公式为
Zr − Zρ
Z=  (8 − 27 )
SEr
Zr的标准误为：
Z = (Z r − Z ρ ) n − 3
1
SEr =
n−3
例21有人估计,3~6岁儿童身高与体重的相关系数为
0.80,从某幼儿园随机抽取3~6岁儿童40名,经测量,
计算出他们的身高与体重的相关系数为0.68,试
问在该幼儿园的测查结果能否推翻上述对身高与
体重关系的估计。
解 H0: ρ=0, H1: ρ≠0
0.8 的Zr为1.099
0.68 的Zr为0.829
α=0.05, Zα/2=1.96
Z = (Z r − Z ρ ) n − 3 = (1.099 − 0.829) 40 − 3 = 1.6423 < 1.96
α=0.05下，接受H0，拒绝H1
㈠两样本相关系数分别由两组相互独立的被试得到
根据费舍Z函数进行转换，由于Zr的分布近似正态，同样
Zr1-Zr2的分布也是近似正态，检验的公式为：
Z=
(Z r1 ) (
− Z r2 − Z ρ1 − Z ρ 2 )(8 − 32)
SEDr
其中标准误为：
1 1
SEDr = +
n1 − 3 n2 − 3
例22 从某重点中学中抽取学生30名，从一般中
学中抽取35名学生，分别计算他们的数学成绩
与瑞文测验分数的相关系数为0.72和0.51,试问
能否认为重点中学学生在数学成绩与瑞文推理
能力之间比一般中学学生有更高的相关。
解 H0: r1≤r2, H1: r1>r2
0.72 的Zr为0.908
0.51 的Zr为0.563
SE2 = 1/27+1/32 ， SE = 0.2613, α=0.05, Zα=1.64
0.908 − 0.563
Z= = 2.4683 > 1.64
0.2613
α=0.05下，拒绝H0，接受H1
㈡两样本相关系数由同一组被试求得
设r12，r23，r13是由三列变量计算出的两两相关系数，若
对r12和r13进行差异显著性检验时，样本相关系数的抽样
分布服从自由度为n-3的t分布。其检验公式为：
(r12 − r13 ) ⋅ (n − 3)(1 − r23 )

t=  (8 − 34 )
(
2 1 − r122 − r132 − r232 + 2 ⋅ r12 ⋅ r13 ⋅ r23 )
例23 某市统考结束后，随机抽取80名学生，分
别计算出他们的数学成绩与物理成绩的相关系
数为0.75,数学成绩与化学成绩的相关系数为
0.54,物理成绩与化学成绩的相关为0.6,试问数
学与物理和数学与化学的相关的差异是否显著。
解：①建立假设：H 0 : ρ12 = ρ13 , H1 : ρ12 ≠ ρ13
②计算统计量：
(r12 − r13 ) ⋅ (n − 3)(1 − r23 )
t=
2(1 − r12 − r13 − r23 + 2 ⋅ r12 ⋅ r13 ⋅ r23 )
(0.75 − 0.54 ) (80 − 3)(1 − 0.6 )
=
(
2 1 − 0.752 − 0.54 2 − 0.6 2 + 2 × 0.75 × 0.54 × 0.6 )
1.165
= = 1.59
0.54
③判断结果:
查t值表得 : t(77 ).05 2 = 1.99,1.59 < 1.99,
∴ P > 0.05, 差异不显著.
一、单总体比率的显著性检验
对样本比率与总体比率直接是否存在显著差异进
行检验。
(1)当np ≥ 5或nq ≥ 5时，样本比率 p̂ 的分布为渐近
正态分布。检验的公式为
pˆ -p0 p0 q0
Z= , SE p =  (8 − 36)
SE p n
确定检验形式：双侧，单侧
进行统计推断——查表寻找相应的临界值，比较
Ｚ与Ｚα，从而确定该样本的ｐ是否为小概率。
例题24 已知某年某区高考升学率为75%，某校在
这一年有300名学生参加了高考，最后有210人被
高校录取，问该校的升学率与全区的升学率是否
相同？
 解：np>5, 提出假设 H0: P’=0.75, H1: p’≠0.75
 计算
p ' -p0 210 / 300-0.75
Z= = = 2.00
p0 q0 0.75 × 0.25
n 300
 统计决断：因为Z=2>1.96=Z0.05/2,p<0.05，所
以拒绝零假设，接受备择假设，即该校这
一年的高考升学率与全区的升学率有显著
差异，由实际数据来看，该校的这一年的
升学率低于全区。
一、单总体比率的显著性检验
(1)当np ≤ 5 (p<q)时，可直接查附表13(1,2)，若p̂
落入p0置信区间之外，可认为差异显著，否则不
显著。
例题25 已知某区学习障碍儿童的比率为8%，通
过调查得知某班45名学生中有学习障碍的学生有
3人，问该班的学习障碍学生的比率与全区是否
有差异？
 np<5
 通过查表得，比率为0.08所属总体比率0.95
置信区间为2%~19%，包含了6.67%，所以
要保留零假设，拒绝备择假设，也就是说
该班学习障碍学生的比率与全区没有显著
差异。
 总体比率差异的显著性检验是根据两个样
本的比率来检验两个相应总体的比率是否
存在显著性差异。由于样本性质不同，其
检验方法也不同。
当n1 p1 ≥ 5，n2 p2 ≥ 5时，统计量pˆ 1 - pˆ 2 = D p的分布为正态分布。
1.若统计假设为： H 0 : p1－p2 = pD , H1 : p1－p2 ≠ pD
临界比率CR为：
Z=
( pˆ 1 - pˆ 2 ) − pD
σ p −p =
p1q1 p2 q2
+
σ pˆ - pˆ
1 2
1 2
n1 n2
2.若统计假设为： H 0 : p1 = p2 = p, H1 : p1 ≠ p2
临界比率CR为：
Z=
( pˆ 1 - pˆ 2 ) − 0
=
pˆ 1 - pˆ 2 σ p −p =
(n1qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 )
σ pˆ - pˆ σ pˆ - pˆ n1n（ 2 n1 + n2）
1 2
1 2 1 2
通过比较单、双侧，来判断比率差异是否显著。
 例26 研究者在两所学校随机各抽取一个班
学生进行一项视力检查，结果发现，甲校
46名学生中患近视的有20人，乙校48名学
生中患近视的有33人，问两校学生患近视
的比率是否有显著性差异？

pˆ 1 - pˆ 2 0.4348-0.6875
Z= = = 2.47
(n1 qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 ) (20 + 33)(26 + 15)
n1 n（2 n1 + n 2） 46 × 48（46 + 48）
 例27 某厂质量检验人员认为该厂一车间的
产品一级品的比率比二车间产品一级品的
比率大5%，现从一车间和二车间分别抽出2
个独立随机样本，得到如下数据: n1=150,其
中一级品为113；n2 = 160,其中一级品为104.
试根据这些数据检验质量研究人员的观点
。（设α=0.05）
 建立假设 H0: p1-p2≤0.05 H1: p1-p2>0.05
 p1=113/150=0.753, p2 = 104/160=0.650
( pˆ 1 - pˆ 2 ) − 0.05
Z= = 1.034
pˆ 1 qˆ1 pˆ 2 qˆ 2
+
n1 n2
 这个是右侧检验，α=0.05, Z 0.05=1.645>1.034,
故不能否定原假设，也就是说，不支持该厂
质量检测人员的观点是正确的。
当 n1 p1  5, n2 p2  5
差异显著性检验应用精确概率检验法。具体
见第十章
 当两样本相关时，同一组被试在前后两次
实验中，观察的两个项目又相同，这样便
可得到前后两个项目的结果，据这两个结
果所计算出来的两样本比率，就称作相关
样本比率。
 例28 某校120名学生期末代数测验之后，让他们在寒假
里独立完成教师编选的代数练习题，开学初进行同类题
目的测验，两次测验结果见下面频数表，问学生独立完
成教师编选的代数练习题，对提高代数成绩是否有显著
效果？
第二次测验合计
良非良
第一次良 48 (a) 14 (b) 62 (a+b)
测验非良 22 (c) 36 (d) 58 (c+d)
合计 70 (a+c) 50 (b+d) 120 (n)
 根据表中的符号，可以把两次测验成绩良好
的比率之差表示为
 p1-p2 = (a+b)/n – (a+c)/n = (b-c)/n
 也就是两次成绩良好比率之差只涉及两次不
同成绩b和c的差异是否显著。
 设两次测验中成绩不一致的数量为K=b+c，
实验结果b、c可视为二项分布（b可称为成
功的次数，c视为失败的次数）。
 若b=c，则p=q=0.5 (即两次实验结果的比率
差异各为0.5，无差异)，若Kp≥5，按二项分
布可知（近似正态分布）：
µ=Kp= (b+c)/2, σ2=Kpq = (b+c)/4
 如果每次取样，b和c落入b(b,K,0.5)的置信区
间内，则可推论说两次实验结果的比率差异
不显著；否则，则说明不是来自于p=q=0.5
的总体，而是取自p≠q≠0.5的总体，即比率
差异显著。
 根据显著性检验公式
p − p0 K ( p − p 0 ) K ( p − 0.5)
Z= = =
p0 q0 Kp 0 q 0 Kp 0 q 0
K
b − 12 (b + c) b−c 14 − 22
= = = = −1.33
(b + c ) 12 × 12 b+c 14 + 22
 因为|Z|=1.33<1.96, p>0.05, 所以保留零假设
，即寒假里独立完成教师编选的代数练习题
对提高代数成绩无显著效果。
 例29 有研究者通过在一年前后对同一群学生各
进行了一次调查来了解某校图书馆服务质量的
改善情况。两次调查的结果如下，问两次调查
所获得的满意率是否有显著差异？
第二次调查合计
满意不满意
第一次满意 18 10 28
调查不满意 32 12 44
合计 50 22 72
 根据表中的数据得知： b=10, c=32
 将它们代入公式中，
b−c 10 − 32
Z= = = −3.40
b+c 10 + 32
 因为|Z|=3.4>2.58, p<0.01, 所以拒绝零假设，
得出结论：一年后学生们对该校图书馆服
务的满意率有了极显著的提高。
观察次数戒烟前
吸烟不吸烟
戒烟后吸烟 65 15
不吸烟 25 55
 不能用正态分布概率计算，需按二项分布
计算p(x>b) (或p(x>c))以上的概率和来得到
临界比率，然后按照单双侧来判断差异是
否显著。
 举例： P259 例题

第八章假设检验

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第八章假设检验

Uploaded by

Copyright:

Available Formats

描述统计

H0 X=X0 X ≥X 0 X ≤X 0

H1 X ≠X 0 X <X 0 X >X 0

H0: X = 10 H1: X≠ 10

Z 检验（单尾 t 检验（单尾和 χ2检验（单尾

⒊判断结果:查表得, Z 0.05 2 = 1.96 因为2.24>1.96,所以

查表得 : Z 0.05 = 1.645, Z 0.01 = 2.33

判断结果:查表得,Z 0.05 2 = 1.96 因为0.6875<1.96,所以

(n1 − 1)s + (n2 − 1)s

S n21 −1 S n22 −1 S12 S 22

t’的分布理论值为： SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )

(n1 − 1)s n2 −1 + (n2 − 1)s n2 −1 (s 2

1 1 S n21 −1 + S n22 −1 2 S n21 −1 + S n22 −1 (

②计算统计量: χ = nS 2 35 × 132 5915

当F> Fα/2 或F< F (1-α/2 )时, σ12 和 σ22差异显著，

F (1-α/2) 与Fα/2互为倒数，即 Fα/2= 1/ F (1-α/2)

查F值得 : F(7,10 ).05 2 = 3.95, F(7,12 ).05 2 = 3.61

选择检验统计量 t = r n − 2 = 0.34 40 = 2.2866

(r12 − r13 ) ⋅ (n − 3)(1 − r23 )

You might also like

第八章 假设检验

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

第八章 假设检验

Uploaded by

Copyright:

Available Formats

描述统计

H0 X=X0 X ≥X 0 X ≤X 0

H1 X ≠X 0 X <X 0 X >X 0

H0: X = 10 H1: X≠ 10

Z 检验（单尾 t 检验（单尾和 χ2检验（单尾

⒊判断结果:查表得, Z 0.05 2 = 1.96 因为2.24>1.96,所以

查表得 : Z 0.05 = 1.645, Z 0.01 = 2.33

判断结果:查表得,Z 0.05 2 = 1.96 因为0.6875<1.96,所以

(n1 − 1)s + (n2 − 1)s

S n21 −1 S n22 −1 S12 S 22

t’的分布理论值为： SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )

(n1 − 1)s n2 −1 + (n2 − 1)s n2 −1 (s 2

1 1 S n21 −1 + S n22 −1 2 S n21 −1 + S n22 −1 (

②计算统计量: χ = nS 2 35 × 132 5915

当F> Fα/2 或F< F (1-α/2 )时, σ12 和 σ22差异显著，

F (1-α/2) 与Fα/2互为倒数，即 Fα/2= 1/ F (1-α/2)

查F值得 : F(7,10 ).05 2 = 3.95, F(7,12 ).05 2 = 3.61

选择检验统计量 t = r n − 2 = 0.34 40 = 2.2866

(r12 − r13 ) ⋅ (n − 3)(1 − r23 )

You might also like

第八章假设检验

第八章假设检验