You are on page 1of 136

描述统计

统计方法 参数估计
推论统计
假设检验
参数 点估计
估计 区间估计
Z 检验
推 t 检验
论 参数检验 F 检验
统 q 检验…
计 假设 计数资料—— χ2 检验
内 检验
容 符号检验 相关
非参数
检验 计量 符号秩次检验 样本
资料 秩和检验 独立
中位数检验 样本
 参数估计和假设检验是统计推断的两个
组成部分,都是利用样本对总体进行某
种推断,但推断的角度不同。参数估计
讨论的是用样本统计量估计总体参数的
方法。假设检验讨论的是用样本信息去
检验对总体参数的某种假设是否成立的
程序和方法。
—— 总体参数之间确实存在差异。

在统计学中,进行这种推论的过程称作
假设检验。
讨论统计值之间差异的问题时,
有两种情况:
两个样本统计
量之间的差异

显 著

该样本已基本不属 各自代表的两个总
于已知总体 体的参数之间确实
存在差异
 包括参数和非参数检验:
 参数假设检验(parametric test):总体的
分布形式已知,需要对总体的未知参数进行
假设检验。
 非参数假设检验(non-parametric test):对
总体分布形式所知甚少,需对未知分布函数
的形式及其他特征进行假设检验。
例1: 根据1989年的统计资料,某地女性新生儿的平均体重为3190
克。为判断该地1990年的女性新生儿体重与1989年相比有无显
著差异,从该地1990年的女性新生儿中随机抽取30人,测得其
平均体重为3210克。从样本数据看,1990年女新生儿体重比
1989年略高,但这种差异可能是由于抽样的随机性带来的,也
许这两年新生儿的体重并没有显著差异。究竟是否存在显著差
异?可以先假设这两年新生儿的体重没有显著差异,然后利用
样本信息检验这个假设能否成立。这是一个关于总体均值的假
设检验问题。
例2:某种大量生产的袋装食品,按规定每袋重量不得
少于250克,现从一批该种食品中任意抽取50袋,发
现有6袋重量低于250克。若规定食品不符合标准的
比例达到5%就不得出厂,问该批食品能否出厂。
可以先假设该批食品的不合格率不超过5%,然后
用样本不合格率来检验假设是否正确。这是一个关
于总体比例的假设检验问题。
假设检验的原理

平均数的显著性检验

平均数差异的显著性检验

方差的差异检验

相关系数的显著性检验

比率的显著性检验
 假设检验的原理:小概率原理。假设检验
的基本思想是概率性质的反证法。(不同于纯数
学中的反证法)
 什么是小概率?
 概率是0~1之间的一个数,因此小概率就是接近0的一个

 著名的英国统计家Ronald Fisher 把20分之1作为标准,也
就是0.05,从此0.05或比0.05小的概率都被认为是小概率
 Fisher没有任何深奥的理由解释他为什么选择0.05,只是
说他忽然想起来的
 小概率原理——发生概率很小的随机事件(小概率事件)
在一次实验中几乎是不可能发生的。
 根据这一原理,可以先假设总体参数的某项取值为真,
也就是假设其发生的可能性很大,然后抽取一个样本
进行观察,如果样本信息显示出现了与事先假设相反
的结果且与原假设差别很大,则说明原来假定的小概
率事件在一次实验中发生了,这是一个违背小概率原
理的不合理现象,因此有理由怀疑和拒绝原假设;否
则不能拒绝原假设。
 检验中使用的小概率是检验前人为指定的。
 某工厂质检部门规定该厂产品次品率不超过4%方能
出厂。今从1000件产品中抽出10件,经检验有4件次
品,问这批产品是否能出厂?
 如果假设这批产品的次品率P≤4%,则可计算事件
“抽10件产品有4件次品”的出现概率为:
P10 (4) = C104 (0.04) 4 (1 − 0.04) 6 = 0.00042
可见,概率是相当小的,1万次实验中可能出现4次,
然而概率如此小的事件,在一次实验中居然发生了,
这是不合理的,而不合理的根源在于假设次品率
P≤4% ,因而认为假设次品率P≤4%是不能成立的,
故按质检部门的规定,这批产品不能出厂。
抽样分布
这个值不像我 ... 因此我们拒
们应该得到的 绝假设 X = 50
样本均值 ...

... 如果这是总
体的真实均值

20 X = 50 样本均值
H0
第一,假设检验采用逻辑上的反证法,即为了检验
一个假设是否成立,首先假设它是真的,然后对
样本进行观察,如果发现出现了不合理现象,则
可以认为假设是不合理的,拒绝假设。否则可以
认为假设是合理的,接受假设。
第二,假设检验采用的反证法带有概率性质。所谓假
设的不合理不是绝对的,而是基于实践中广泛采用的
小概率事件几乎不可能发生的原则。至于事件的概率
小到什么程度才算是小概率事件,并没有统一的界定
标准,而是必须根据具体问题而定。如果一旦判断失
误,错误地拒绝原假设会造成巨大损失,那么拒绝原
假设的概率就应定的小一些;如果一旦判断失误,错
误地接受原假设会造成巨大损失,那么拒绝原假设的
概率就应定的大一些。
小概率通常用α表示,又称为检验的显著性水平。通
常取α=0.05或α=0.01,即把概率不超过0.05或0.01的事
件当作小概率事件。
 假设检验中,我们称作为检验对象的待检验假
设为原假设或零假设,用H0表示。原假设的对
立假设称为备择假设或备选假设,用H1表示。
 例如,设X0为总体均值X的某一确定值。
(1)对于总体均值是否等于某一确定值的原假
设可以表示为:
H0: X=X0 (如H0: X = 3190克)
其对应的备择假设则表示为:
H1: X≠X0 (如H1:X ≠3190克)
(2)对于总体均值X是否大于某一确定值X0
的原假设可以表示为:
H0:X≥X0 (如H0:X≥2000克)
其对应的备择假设则表示为:
H1:X<X0 (如H1: X <2000克)
(3)对于总体均值X是否小于某一确定值X0
的原假设可以表示为:
H0:X≤X0 (如H0:X≤ 5%)
其对应的备择假设则表示为:
H1:X>X0 (如H1:X>5%)
注意:原假设总是有等号: =或≤ 或 ≥。
 根据假设的形式不同,假设检验可以分为双侧假设检验和单
侧假设检验。
 若原假设是总体参数等于某一数值,如H0: X = X0 ,即
备择假设H1: X ≠ X 0,那么只要X< X 0和X> X 0 二者
中有一个成立,就可以否定原假设。这种假设检验称为双侧
检验。
 若原假设是总体参数大于等于或小于等于某一数值,如H0:
X ≥ X 0 (即H1:X<X0);或H0 :X≤X0 (即H1:X>
X0),那么对于前者当X<X0时,对于后者当X>X0 时
,可以否定原假设。这种假设检验称为单侧检验。可以分为
左侧检验和右侧检验。
研究的问题(总体均值检验)
假设
双侧检验 左侧检验 右侧检验

H0 X=X0 X ≥X 0 X ≤X 0

H1 X ≠X 0 X <X 0 X >X 0


 在规定了检验的显著性水平α后,根据容量
为n的样本,按照统计量的理论概率分布规
律,可以确定据以判断拒绝和接受原假设的
检验统计量的临界值。
 临界值将统计量的所有可能取值区间分为两
个互不相交的部分,即原假设的拒绝域和接
受域。
 对于正态总体,总体均值的假设检验可有如
下图示:
设H0:X=X0 , H1:X≠X0,有两个临界值,两个拒绝域,
每个拒绝域的面积为α/2。也称双尾检验。

X0
双侧检验示意图
抽样分布 置信水平

拒绝域 拒绝域
1-α
α/2 α/2
接受域

H0值 样本统计量
临界值 临界值
抽样分布 置信水平

拒绝域 拒绝域
1-α
α/2
α/2
接受域

H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平

拒绝域 拒绝域
1-α
α/2 α/2
接受域

H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平

拒绝域 拒绝域
1-α
α/2 α/2
接受域

H0值 样本统计量
临界值 临界值
观察到
的样本
统计量
抽样分布 置信水平

拒绝域
1-α
α
接受域

H0值 样本统计量
临界值
设H0:X≥X0 ,H1:X<X0;临界值和拒
绝域均在左侧。也称下限检验。

X0
抽样分布 置信水平

拒绝域
1-α
α

接受域

H0值 样本统计量
临界值
观察到的样本统计量
抽样分布 置信水平

拒绝域
1-α
α

接受域

H0值 样本统计量
临界值
观察到
的样本
统计量
设H0 :X≤X0 ,H1:X>X0; 临界值和拒
绝域均在右侧。也称上限检验。

X0
抽样分布 置信水平

拒绝域
1-α
α
接受域

H0值 样本统计量
临界值
观察到的样本统计量
抽样分布 置信水平

拒绝域
1-α
α

接受域

H0值 样本统计量
临界值
观察到
的样本
统计量
 根据假设检验做出判断无非下述四种情况:
1、原假设真实, 并接受原假设,判断正确;
2、原假设不真实,且拒绝原假设,判断正确;
3、原假设真实, 但拒绝原假设,判断错误;
4、原假设不真实,却接受原假设,判断错误。
 假设检验是依据样本提供的信息进行判断,有犯错误的可能。所
犯错误有两种类型:
 第一类错误是原假设H0为真时,检验结果把它当成不真而
拒绝了。犯这种错误的概率用α表示,也称作α型错误或弃
真错误。
 第二类错误是原假设H0不为真时,检验结果把它当成真而
接受了。犯这种错误的概率用β表示,也称作β型错误或取
伪错误。
假设检验中各种可能结果的概率
拒绝H0
接受H0
审判过程:H0: 无罪 接受H1
裁 实际情况
决 无罪 有罪 H0 为 1-α
α(弃真错误)
无罪 正确 错误 真 (正确决策)
有罪 错误 正确
β
H0 为
(取伪错误) 1-β(正确决策)

图(a)
X≤X0
H0为真

图(b)
X=X1>X0
H0为伪

从上图可以看出,如果临界值沿水平方向右移,α将变小而β变
大,即若减小α错误,就会增大犯β错误的机会;如果临界值沿
水平方向左移,α将变大而β变小,即若减小β错误,也会增大
犯α错误的机会。
两类错误的控制
⑴利用已知的实际总体参数值与假设参数值之间的大
小关系,合理安排拒绝区域的位置
①若弃真的后果较大,则将α定小一点,β就大。
②若存伪的后果较大,则将β定小一点,α就大。
⑵使样本容量增大,可以同时减少两类错误,或减少
其中一种错误而不致于增大另一种错误(如在α 和其
他条件不变时, β 会减小)。(因为样本容量增大
,抽样误差越小,样本分布就越高狭,两侧的面积
就越小。)
 在样本容量n一定的情况下,假设检验不能同时做到犯α
和β两类错误的概率都很小。若减小α错误,就会增大犯β
错误的机会;若减小β错误,也会增大犯α错误的机会。
要使α和β同时变小只有增大样本容量。但样本容量增加
要受人力、经费、时间等很多因素的限制,无限制增加
样本容量就会使抽样调查失去意义。因此假设检验需要
慎重考虑对两类错误进行控制的问题。
α和β的关系就像翘翘板, 你不能同时减
α小β就大, α大β就小
少两类错误!

β
α
 假设检验中人们普遍执行同一准则:首先控制弃真错误(α错
误)。假设检验的基本法则以α为显著性水平就体现了这一原则。
 两个理由:
 统计推断中大家都遵循统一的准则,讨论问题会比较方便。
 更重要的是: 原假设常常是明确的,而备择假设往往是模糊的。
如H0:X=X0很清楚, 而H1:X≠X0则不太清楚,是X<
X0还是X>X0 ?大多少小多少都不清楚。对含义清晰的数
量标准进行检验更容易被接受。
因此,第一类错误成为控制两类错误的重点。
 α错误:控制显著性水平。
 实验条件控制较好:α=0.05
 实验条件难于控制:α=0.01,或更高

P227 统计检验力 1- β

 β错误的影响因素与控制
 实际值与假设值相差越大,β越小。
 α越小,β越大。同时控制,增加n。
 α、n固定时,适当的检验类型可减小β。
㈠根据研究需要提出原假设H0和备择假设H1
㈡确定适当的检验统计量

㈢确定显著性水平α和临界值及拒绝域

㈣根据样本数据计算检验统计量的值(或P值)

㈤将检验统计量值与临界值比较,作出拒绝或
接受原假设的决策
 应该注意:
⑴对任一假设检验问题,其所有可能结果均
应包括在所提出的两个对立假设中,原假
设与对立假设总有一个、也只能有一个成
立。
⑵原假设一定要有等号: =或≤ 或 ≥。
 原假设不是随意提出的,应该本着“不轻
易拒绝原假设”的原则。
 双侧检验属于决策中的假设检验。即不论是
拒绝H0 还是接受H0,都必需采取相应的行动
措施。
 例如,某种零件的尺寸,要求其平均长度为
10厘米,大于或小于10厘米均属于不合格。
待检验问题是该企业生产的零件平均长度是
10厘米吗?(属于决策中的假设)则建立的原假
设与备择假设应为

H0: X = 10 H1: X≠ 10


 应区别不同情况采取不同的建立假设方法。
对于检验某项研究是否达到了预期效果
 一般是将研究的预期效果(希望、想要证明的假设)
作为备择假设H1,将认为研究结果无效作为原假设
H0。先确立备择假设H1。因为只有当检验结果与原
假设有明显差别时才能拒绝原假设而接受备择假设,
原假设不会轻易被拒绝,就使得希望得到的结论不
会轻易被接受,从而减少结论错误。
 例如,有研究预计,采用新技术生产后将会使某产品的使用
寿命明显延长到1500小时以上。则建立的原假设与备择假设
应为: H0: X≤ 1500 H1: X> 1500
 例如,有研究预计,改进生产工艺后会使某产品的废品率降
低到2%以下。则建立的原假设与备择假设应为:
H0: X ≥ 2% H1: X < 2%
对于检验某项声明的有效性
• 一般可将所作的声明作为原假设。将对该声明的质
疑作为备择假设。先确立原假设H0。因为除非有证
据表明“声明”无效,否则就应认为该“声明”是
有效的。

 例如,某灯泡制造商声称,该企业生产的灯泡平均
使用寿命在1000小时以上。通常除非样本能提供证
据表明使用寿命在1000小时以下,否则就应认为厂
商的声称是正确的。建立的原假设与备择假设应为:
H0: X≥ 1000 H1: X < 1000
对于上述问题还可以结合不同背景建立假设。
同样的问题背景不同可以采用不同的原假设。
 例如,一商店经常从某工厂购进某种商品,该商品质
量指标为X,X值愈大商品质量愈好。商店提出的进
货条件是按批验收,只有通过假设“X≥X0 ”检验的
批次才能接受。有两种可能情况:
⑴如果根据过去较长时间购货记录,商店相信该厂产品
质量好,于是同意把原假设定为X≥X0 ,而且选择较
低的检验显著性水平。这对工厂是有利的,使得达到质
量标准的产品以很小的概率被拒收。虽然这会使商店面
临接受不合标准产品的风险,但历史记录显示出现这种
情况的可能性很小,而且商店也可因此获得较好的货源。
⑵如果过去一段时期的记录表明,该厂产品质量并不理
想,商店则会坚持以X≤X0为原假设,并选定较小的
检验显著性水平。这对商店是有利的,不会轻易地拒绝
原假设,有 1-α的可能把劣质产品拒之门外。
⒈双侧检验:只强调差异而不强调方向性的
检验称为双侧检验。
⒉单侧检验:强调某一方向的检验称为单侧
检验。又分左侧检验和右侧检验。
通常适用于检验某一参数是否“大于”或
“优于”、“快于”及“小于”、“劣
于”、“慢于”另一参数等一类问题。
在实际研究中何时用单侧检验何时用双侧检
验,一定要根据研究目的所规定的方向性来确
定。
应该用单侧检验的问题,若使用双侧检验,
其结果一方面可能使结论由“显著”变为“不
显著”,另一方面也增大了β错误。
反之,若使用双侧检验的问题若用单侧来检
验,虽然减小了β错误,但是使无方向性的问题
人为地成为单方向问题,这也有悖于研究目的。
 假设检验根据检验内容和条件不同需要采用不同的检验
统计量。
 在一个正态总体的参数检验中,Z统计量和t统计量常用
于均值和比例的检验,χ2统计量用于方差的检验。选择统
计量需考虑的因素有被检验的参数类型、总体方差是否
已知、用于检验的样本量大小等。
一个总体

均值 方差

Z 检验(单尾 t 检验(单尾和 χ2检验(单尾


和双尾) 双尾) 和双尾)
 显著性水平α是当原假设为正确时被拒绝的概率,
是由研究者事先确定的。
 显著性水平的大小应根据研究需要的精确度和可
靠性而定。通常取α=0.05或α=0.01,即接受原
假设的决定是正确的可能性(概率)为95%或99
%。
 根据给定的显著性水平α,查表得出相应的临界
值,同时指定拒绝域。
 例如,总体标准差σ已知时根据样本均值计算统计
量Z的公式为 x−X
Z=
σ/ n
 如果检验统计量的值落入拒绝域,则拒绝原
假设,接受备择假设;如果检验统计量的值
落入接受域,则接受原假设,拒绝备择假设。
一、平均数差异显著性检验的类型

⒈单总体平均数差异显著性检验,也
叫平均数的显著性检验。
⒉双总体平均数差异显著性检验,也
叫平均数差异的显著性检验。
⒈建立假设:
双侧检验的假设 : H 0 : µ = µ 0, H1 : µ ≠ µ 0
或者(双总体) H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
单侧检验的假设 : H 0 : µ ≤ µ 0 , H1 : µ > µ 0
或者(双总体) H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2

⒉根据给定条件确定抽样分布的形态,确定相应的检
验方法,并计算出统计量的值。
⒊确定α,查出理论值,从而确定出H0拒绝和接受区域。
⒋作出判断。如Z>Z临,即p<α,则拒绝H0,接受H1。
㈠总体分布为正态分布,且总体方差已知时
X − µ0 σ0
Z=  (8 − 1), 其中SE X =
SE X n

例1 某地区统考数学,假设该统考数学成绩服从正
态分布,已知其总平均分为50分,标准差为12分。
从该地区随机选择一个班作为样本,该班有学
生50人,经计算该班平均成绩为53分,试问该
班成绩与总成绩的差异是否显著。
解:①建立假设: H 0 : µ = µ 0 , H1 : µ ≠ µ 0
σ012 12
②计算统计量: SE X = = = = 1.7
n 50 7.07
X − µ 0 53 − 50
Z= = = 1.76
SE X 1.7

③判断结果:因为1.76<1.96,所以P>0.05
差异不显著,接受H0,拒绝H1。
故该班数学成绩与总平均成绩的差异不显著。
例2 对某专业课在全国同类高校内进行统一测试,
已知全体考生成绩服从正态分布,其总平均分
为64分,总标准差为8.6分,从某高校随机抽
取20份试卷,经计算得到这20份试卷的平均成
绩为70分,问该校学生的平均成绩是否 显著地
优于全体学生的平均水平?
解:①建立假设:H 0 : µ ≤ µ 0 , H1 : µ > µ 0
②计算统计量: σ 8.6 8.6
SE X = 0
= = = 1.92
n 20 4.47
X − µ 0 70 − 64
Z= = = 3.125
SE 1.92
③查正态表(单侧)得:
当 α = 0.01时, Z 0.01 = 2.33
④判断结果:因为3.125>2.33,所以P<0.01。
差异极其显著,拒绝H0。故该校学生的平均
成绩极显著地优于全体学生的平均水平。
㈡总体分布为正态,总体方差未知
当总体分布为正态分布,总体方差未知时,样本平均数的
抽样分布服从自由度为n-1 的t分布,此时可用t检验方法进
行检验。在检验中,计算统计量的值的公式为:

X − µ0 Sn S n −1
t=  (8 − 2), 其中SE X = =
SE X n −1 n
例3 已知4岁正常男童平均体重为15.6公斤,从某幼儿园中随机
抽取20名4岁男童,经测量计算出这20名男童平均体重为16
公斤,标准差为1.76公斤,试问该幼儿园4岁男童的体重与4岁
正常男童平均体重有无显著性差异?
解:①建立假设: H 0 : µ = µ 0 , H1 : µ ≠ µ 0
②计算统计量: S 1.76
SE X = n
= = 0.4
n −1 20 − 1
X − µ 0 16 − 15.6
t= = =1
SE X 0.4
③判断结果:当α = 0.05时, df = 20 − 1 = 19时,

t(19)0.05 2 = 2.093
因为1<2.093,所以,P>0.05,差异不显著。
故该幼儿园4岁男童平均体重与正常男童平均体
重无显著差异。
例4 某实验组随机选择了40名儿童作提高儿童智
力水平实验,实验结束后,对参加实验的儿童
进行韦氏儿童智力测验,结果得到这40名儿童
的智商平均值为105,标准差为12,已知韦氏
儿童智力测验的平均值为100,试问该实验是
否成功?
解:①建立假设: H 0 : µ ≤ µ 0 , H1 : µ > µ 0
S 12 12
②计算统计量: SE X = = = = 1.92
n −1 40 − 1 6.24
X − µ 0 105 − 100
t= = = 2.6
SE X 1.92
③判断结果: 当α = 0.01, df = 39时, t(39 )0.01 = 2.423
因为2.6 > 2.423, 所以P < 0.01

故实验后的儿童智力水平极明显高于同龄儿童一
般水平,实验取得了成功。
㈢总体为非正态分布
当总体为非正态分布时,根据中心极限定理,样本容
量足够大时(n≥30,也有认为n≥50),样本平均数的抽
样分布趋于正态分布,在平均数差异显著性检验中,
也可近似地采用Z检验方法进行检验。
当总体方差已知时,其检验公式为:
X − µ0 σ0
Z′ = 其中 SE X =
SE X n
当总体方差未知时,上式中的σ0可用它的无偏估计量
Sn-1代替, S n −1
SE X =
当样本量足够大时,也可以用S代替σ0 n
注意:这种采用近似Z检验的方法只能适用n>30时的情
况,当n<30时不适用这种方法,也不能用t检验方法,只
能采用非参数检验方法进行检验。

例5 某县进行物理竞赛,结果分数的分布不是正
态,总平均成绩为55分。其中某重点学校参加
竞赛60人,其平均成绩为62分,标准差为14
分,试问该校平均成绩是否明显优于全县一般
水平。
当两个变量间的相关系数为r时,两变量的方差为:
(P118) σ (2X −Y ) = σ X2 + σ Y2 − 2rσ xσ y
当两个变量相互独立时,其和(或差)的方差等于各
自方差的和:
σ (2X ±Y ) = σ X2 + σ Y2
因此有:
σ 12 σ 22 σ1 σ 2
SE D = SE + SE =
1
2 2
2 + − 2r
X
n1 n2 n1 n2
当两个样本独立时,r=0,这时上述公式为

σ 12 σ 22
SE D = SE12 + SE 22 = +
X
n1 n2
4.1 两总体分布为正态,且方差已知
当两样本相互独立或相关
两平均数之差的标准误为:
S DX σ 12 + σ 22 − 2rσ 1σ 2
SEDX = =
n n
= SE12 + SE22 − 2rSE1SE2  (8 − 4 )
检验统计量公式为

( X 1 − X 2 ) − (µ1 − µ 2 ) DX − µ D
Z= = X
 (8 − 5)
SE D SE D
X X
4.1 两总体分布为正态,且方差已知
(4.1.1) 两样本相互独立

例6: 从某科高考成绩中,从甲省抽取80名考生,计
算平均成绩为84分,从乙省抽取100名考生,计算
平均成绩为80分,已知甲乙两省该科高考成绩
均呈正态分布,甲省标准差为12.4分,乙省标准
差为11.2分,试问甲乙两省该科高考成绩是否有
显著性差异?
解:⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
⒉计算检验的统计量:
σ 12 σ 22 12.4 2 11.2 2
SE D X = + = +
n1 n2 80 100
= 1.922 + 1.2544 = 1.7822
X 1 − X 2 84 − 80
Z= = = 2.2444
SE D X 1.7822

⒊判断结果:查表得, Z 0.05 2 = 1.96 因为2.24>1.96,所以


P<0.05,差异极其显著。
故根据这次抽样,可以推断出甲乙两省该科高考成绩
有显著性差异。
例7从某市城区随机抽取5岁男童30名,测得其平
均体重为20.15公斤,从该市郊区随机抽取25名5
岁男童,测得其平均体重为18.25公斤,已知该市
城区5岁男童体重的标准差为1.85公斤,郊区5岁
男童体重的标准差为1.78公斤.能否根据这次抽
样推断出该市城区与郊区5岁男童平均体重的
差异是否显著。
解:⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
⒉计算检验的统计量:

σ 12 σ 22 1.852 1.782
SE DX = + = +
n1 n2 30 25
= 0.114 + 0.127 = 0.49
X 1 − X 2 20.15 − 18.25
Z= = = 3.87
SE DX 0.49
⒊判断结果:查表得, Z 0.01 2 = 2.58 因为3.87>2.58,所以
P<0.01,差异极其显著。
故根据这次抽样,可以推断出该市郊区5岁男童平均体
重有极其显著的差异。
4.1 两总体分布为正态,且方差已知
(4.1.2) 两样本相关

例8 某实验组选择20名儿童作智力发展实验在
实验前和实验后对实验儿童进行一次韦氏儿
童智力测验, 在实验前得到平均智商为102,
实验后所得平均智商为107,已知韦氏儿童智
力测验标准差为15,两次测验相关系数为0.7,
试问该实验是否取得了成功。
解:⒈建立假设: H 0 : µ1 ≥ µ 2 , H1 : µ1  µ 2
⒉计算检验的统计量:
σ 12 + σ 22 − 2rσ 1σ 2
SE DX =
n
152 + 152 − 2 × 0.7 × 15 × 15
= = 2.6
20
X 1 − X 2 102 − 107
Z= = = −1.92
SE D X 2.6
⒊判断结果:

查表得 : Z 0.05 = 1.645, Z 0.01 = 2.33


因为1.645 < − 1.92 < 2.33, 所以,0.05 > P > 0.01,
例9 某地两年内进行了物理竞赛,已知两次竞赛成
绩均服从正态分布, 两次竞赛的标准差分别为
12分和14分,某校有10 名学生先后两次参加了
竞赛,根据他们的竞赛成绩计算出他们的平均
成绩分别为72分和70分,这10 名学生竞赛成绩
的相关系数为0.76,试问该地两次竞赛成绩有无
显著性差异。
解:⒈建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2

⒉计算检验的统计量:
σ 12 + σ 22 − 2rσ 1σ 2
SEDX =
n
12 2 + 14 2 − 2 × 0.76 ×12 ×14
= = 2.91
10
X 1 − X 2 72 − 70
Z= = = 0.6875
⒊判断结果: SED X 2.91

判断结果:查表得,Z 0.05 2 = 1.96 因为0.6875<1.96,所以


P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
当两总体为正态分布,两总体方差均未知,从两总体所抽
出两样本平均数的差数服从df=n-1的t分布,可用t检验
方法进行检验。

4.2.1 两样本容量不等,且为独立样本
σ 2
σ
根据公式(8-5)则标准误的计算公式为:SED = 1 + 2
2

在该式中,σ12与σ22都未知, n1 n2 X

此时可用无偏方差来代替
S n21 −1 S n22 −1
SEDX = +  (8 − 7 )
n1 n2
4.2 两总体都是正态分布,且方差未知
4.2.1 两样本容量不等,且为独立样本
第一,当总体方差相等时,
其检验公式为: DX − µ DX X1 − X 2
t= =  (8 − 8)
SEDX SEDX

df = n1+n2-2 n1S12 + n2 S 22 n1 + n2
其中 SEDX = ⋅
n1 + n2 − 2 n1n2
联合方差sp2

(n1 − 1)s + (n2 − 1)s


2
n1 −1
2
n2 −1 n s +n s
2 2

= =
2 1 n1 2 n2
s p
(n1 − 1) + (n2 − 1) (n1 − 1) + (n2 − 1)
2 1 1  n1 S12 + n2 S 22 n1 + n2
SE D = s p  +  = ⋅
X
 n1 n2  n1 + n2 − 2 n1 n2

精确合成参见P90 公式4-13
例10 某校进行速度测验,共选择40名参加,其
中男生22人,女生18人,男生测验的平均分为
72分,标准差为8分,女生测验的平均分为70
分,标准差为7.6分。已知该速度测验结果服
从正态分布,试问男女生速度测验的平均结果
有无显著性差异。
解:①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验的统计量:
n1S12 + n2 S 22 n1 + n2
SE D X = ⋅
n1 + n2 − 2 n1n2
22 × 8 2 + 18 × 7.6 2 22 + 18
= × = 2.55
22 + 18 − 2 22 × 18
X − X 2 72 − 70
t= 1 = = 0.78
SE D X 2.55
③判断结果:当α=0.05,df=n1+n2-2 = 22+18-2=38时,
t(38)0.05/2=2.021。
因为0.78<2.021,所以P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
4.2.1 两样本容量不等,且为独立样本
第二,当总体方差不等时,
此时的样本平均数之差不再服从t分布,不能再运用
t检验方法来检验了。这时常用柯克兰—柯克斯检验
方法。
标准误的计算公式为:

S n21 −1 S n22 −1 S12 S 22


SE D = + = +  (8 − 11)
X
n1 n2 n1 − 1 n2 − 1
4.2 两总体都是正态分布,且方差未知
4.2.1 两样本容量不等,且为独立样本
第二,当总体方差不等时,
DX − µ D X1 − X 2
检验的统计量公式为: t′ = X
=  (8 − 12 )
SE D SE D
X X

t’的分布理论值为: SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )


t(′α ) = 1 2
 (8 − 13)
SE + SE
2
X1
2
X2

t1(α) 为样本1的自由度df1=n1-1对应的临界值
t2(α) 为样本1的自由度df2=n2-1对应的临界值
 例10 某校进行速度测验,共选择40名参加
,其中男生22人,女生18人,男生测验的
平均分为72分,标准差为8分,女生测验的
平均分为70 分,标准差为7.6分。已知该速
度测验结果服从正态分布,试问男女生速
度测验的平均结果有无显著性差异。
解:①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验统计量: 2 2
8 7. 6
SE D X = + = 2.54
22 − 1 18 − 1
X 1 − X 2 72 − 70

t = = = 0.79
SE D X 2.54

8 7.6
SE X = = 1.75, SE X = = 1.84
1
22 − 1 2
18 − 1
1.752 × 2.08 + 1.84 2 × 2.11
t0.05 2 = = 2.09
1.75 + 1.84
2 2

③判断结果:因为0.79<2.09,所以P>0.05,差异不显著。
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本容量相等
①独立样本:
a. 方差不等 S +S S +S
2
n1 −1
2
n2 −1
2 2
SE = = 1 2

其标准误计算公式为: n
DX
n −1

其检验公式还是: t ′ = D X − µ D = X 1 − X 2  (8 − 12) X

SE D SE D
X X

SE X2 ⋅ t1(α ) + SE X2 ⋅ t 2(α )
t (′α ) = 1 2
= t1(α ) = t 2(α )
df = n-1 SE 2
X1
+ SE 2
X2
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本容量相等
①独立样本:
a. 方差相等 DX − µ DX X1 − X 2
t= =  (8 − 8)
其检验公式还是(与样本量无关): SE D X
SEDX
其标准误计算公式为: S n2 −1 + S n2 −1 S2 + S2
SE DX = 1 2
= 1 2
df = 2n-2 n n −1

(n1 − 1)s n2 −1 + (n2 − 1)s n2 −1 (s 2


n1 −1 + s n22 −1 ) n1 s n21 + n2 s n22 (
n s n21 + s n22 )
s 2
= 1 2
= = =
p
(n1 − 1) + (n2 − 1) 2 (n1 − 1) + (n2 − 1) 2(n − 1)

1 1 S n21 −1 + S n22 −1 2 S n21 −1 + S n22 −1 (


n S n21 + S n22 ) 2 S n21 + S n22
SE D = s 2p  +  = ⋅ = = ⋅ =
X
n n 2 n n 2(n − 1) n n −1
例12 某市进行一次物理统考, 已知统考成绩服从正态
分布,从该市A校和B校各抽取20名学生,经计算两校
的物理统考平均成绩分别为82分和77分,标准差分别
为7.2分和7.5分,试问A、B两校在该次物理统考中的
平均成绩差异是否显著。
解:①建立假设: H 0 : µ1 = µ 2 , H1 : µ1 ≠ µ 2
②计算检验统计量: 2 2
7.2 + 7.5
SE D = = 2.38
X
20 − 1
82 − 77
t= = 2.10
2.38
③判断结果:查表得: t (38 )0.05 2 = 2.024, t (38 )0.01 2 = 2.712

因为2.024<2.10<2.712,所以0.05>P>0.01, α=0.05时差异
显著。故该市AB两校在该次物理统考中的平均成绩
差异显著。
4.2 两总体都是正态分布,且方差未知
4.2.2 两样本(X1i, X2i)容量相等
②相关样本 (t检验一般不需要事先进行方差齐性检验,见P242说明)
令di=X1i - X2i 为每一对数据之差,则对d的显著性检
验就等同于对两样本均值差异的显著性检验:
T检验 t = X 1 − X 2  (8 − 17 )
自由度为 df = n-1 SE D
X

其标准误计算公式为: (∑ d)
2

s 2 ∑d − n
2

1. 相关系数未知, SED x
= SEd = d
n −1
=
n(n − 1)
P88 sd公式 4-9
s12 + s22 − 2rs12 s22
2. 相关系数已知, SEDx =
n −1
例13 某实验小组进行一项学习方法实验,在实验前,经
过精心匹配,分成两小组,一为实验组,一为对照组,各
组均为20人。实验结束后,对两组均进行智力测验,
经计算,其智商成绩分别为:实验组平均智商为
106,标准差为16;对照组平均智商为104,标准差
为15,两组测验的相关系数为0.75,试问该学习方法
对提高智力是否有显著影响。
解:①建立假设: H 0 : µ1 ≤ µ 2 , H1 : µ1 > µ 2 (单侧检验 )
②计算统计量:
16 2 + 152 − 2 × 0.75 × 16 × 15
SE D = = 2.52
X
20 − 1
106 − 104
t= = 0.79
2.52
③判断结果:查表得: t(19 )0.05 = 2.093
因为0.79<2.093,所以P>0.05,差异不显著。
故该学习方法实验对学生智力提高没有显著影响。
例8-10 对9个被试进行两种夹角(150,300)的缪勒-莱
依尔错觉实验结果如下,问两种夹角的情况下错觉
量是否显著差异。
例8-11 用相关系数已知的公式来计算本题。
被试 1 2 3 4 5 6 7 8 9
150 14.7 18.9 17.2 15.4 15.3 13.9 20.0 16.2 15.3
300 10.6 15.1 16.2 11.2 12.0 14.7 18.1 13.8 10.9
di

解:
8-10: 先计算di , X1 ,X2 , 接着计算sd , 然后计算t统计量(t1=4.6248)
8-11:计算积差相关 0.7451 (t2=4.6248),Spearman相关0.7029 (t3=4.32)

t1=t2
 随机从某总体选取10名被试,分别实施两
次数学测验,两次测验的成绩见下表,问
被试在两次测验的平均数是否有显著差异
?试对结果进行解释(α=0.05,df=9,
t=2.262;df=18,t=2.552)
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 独立样本
①当总体方差已知时,其检验公式为:
DX − µ DX
Z′ =  (8 − 19 )
σ 2
σ 2
1
+ 2
n1 n2
②当总体方差未知时,其检验公式为:
DX − µ DX DX − µ DX
Z′ = =  (8 − 20)
2 2 2 2
S S S S
n1 −1
+
n2 −1 1
+ 2

n1 n2 n1 − 1 n2 − 1
4.3 两总体为非正态分布
当样本容量都大于30(或都大于50时)
4.3.1 相关样本:
①当总体方差已知时,其检验公式为:
X1 − X 2
Z′ =  (8 − 21)
σ + σ − 2rσ 1σ 2
2
1
2
2
n
②当总体方差未知时,其检验公式为:
X1 − X 2 X1 − X 2
Z′ = =  (8 − 22)
S n21 −1 + S n22 −1 − 2rS n1−1S n2 −1 S12 + S 22 − 2rS1S 2
n n −1
一、单总体方差的显著性检验
单总体方差的差异检验也称为样本方差与总体方差的
差异显著性检验。由抽样分布的讨论知,从正态分布
的总体中随机抽取容量为n的样本,其样本方差与总体
方差比值的分布为自由度为n-1 的χ2 分布。其检验公式
为:
χ2 = S
2

2 2 小概率事件
nSn σ
χ =
2
σ2
当χ2 > χ2α/2 或χ2 < χ2 (1-α/2 )时, S2与σ2差异显著,
当χ2 (1-α/2 )< χ2 < χ2α/2时, S2与σ2差异不显著。
例14 已知某省化学高考成绩服从正态分布,标准差为
15分,从某校抽取35名学生,测其化学高考成绩标
准差为13分,试问该校化学高考成绩与全省方差有
无显著性差异。
解:①建立假设: 0 1
H : σ 2
= σ 2
0 , H 1 : σ 2
1 ≠ σ 2
0

②计算统计量: χ = nS 2 35 × 132 5915


2
= = = 26.29
σ2 15 2
225
③判断结果:查χ2值表,当α=0.05, df=35-1=34, 得
χ2 0.05/2 = χ2 0.025 = 53 (用内插法近似求), χ2 1-0.05/2 =20.6,
因为20.6<26.69<53,所以p>0.05,差异不显著
两样本方差的差异显著性检验的目的是想了解样本抽自
的两个总体的方差的一致情况,或两个总体方差是否相
等,因此也称为方差的齐性检验。
㈠独立样本
设有两个正态总体X和Y, X~N(µ1, σ12), Y~N(µ2, σ22), 且X
和Y相互独立,从X和Y两总体中抽取样本容量分别为n1,n2
的两个样本,计算其方差分别为S12 和S22, 假如σ12 = σ22
那么σ12 / σ22 =1。当两样本的总体方差未知,则可用总
体方差的无偏估计Sn1-12 和Sn2-12来代替σ12 和 σ22 。这两
个估计量的比的抽样分布服从df1=n1-1,df2=n2-1的 F分布。
即(假如σ12 = σ22 根据公式6-14推导出6-15)
S n2 −1 / σ 12 S n2 −1
F= 1
2
Sn /σ 2 = 1

S n2
(df1 = n1 − 1, df 2 = n2 − 1)
2
2 −1 2 −1

当F> Fα/2 或F< F (1-α/2 )时, σ12 和 σ22差异显著,


当F (1-α/2 )< F < Fα/2时, σ12 和 σ22差异不显著。

F (1-α/2) 与Fα/2互为倒数,即 Fα/2= 1/ F (1-α/2)

为了方便查F值表而不用计算倒数,在方差的齐性
检验时,其检验公式为: S2
F= 大
2
S 小
例15 某区幼儿园对幼儿进行健康检查,从中随
机抽取20名4 岁幼儿,其中男生12名,女生8
名,经计算得男生体重标准差为1.75公斤,女生
体重的标准差为1.73公斤,试问该区4岁男女幼
儿体重的方差差异是否显著。
解:①建立假设: H 0 : σ 12 = σ 22 , H1 : σ 12 ≠ σ 22
②计算统计量: 2 n 12
S n1 −1 =
2 1 2
S1 = × 1.75 = 3.34
n1 − 1 11
n2 8
S n22 −1 = S 2 = × 1.732 = 3.42
2
n2 − 1 7
S n22 −1 3.42
F= = = 1.02
③判断结果: S n21 −1 3.34

查F值得 : F(7,10 ).05 2 = 3.95, F(7,12 ).05 2 = 3.61


由内插法得 : F(7,11).05 2 = 3.78,1.02 < 3.78,
∴ P > 0.05, 差异不显著.
例16 本章第一节例10进行方差的差异显著性检验。
解:①建立假设: H 0 : σ 12 = σ 22 , H1 : σ 12 ≠ σ 22
②计算统计量:
n1 22
S n21 −1 = S12 = × 82 = 67.05
n1 − 1 21
n2 18
S n22 −1 = S 22 = × 7.6 2 = 61.16
n2 − 1 17
S n21 −1 67.05
F= = = 1.10
S n22 −1 61.16
③判断结果:
查F值表得 : F(20,15 )0.05 2 = 2.76, F(24,15 )0.05 2 = 2.70
F(20, 20 )0.05 2 = 2.46, F(24, 20 )0.05 2 = 2.41, 由内插法得 :
F(21,17 )0.05 2 = 2.58,1.1 < 2.58,∴ P > 0.05, 差异不显著.
(二) 相关样本
当两个样本相关时,两样本方差的比值就不再服从F分布,
不能用F检验对方差的差异情况进行检验。但统计量:
S −S
2 2
t= 1 2
 (8 − 25)
4S S 1 − r
1
2 2
2 ( 2
)
n−2
服从自由度为n-2的t分布。因此可以对相关样本方差进
行t检验。
例19 在某次教学方法改革实验结束后,实验班与对照班
(各班均为40人)的成绩的标准差分别为8.4分和12.6分,
两班的相关系数为0.65,试问两班成绩的方差的差异是否
显著。
解:①建立假设: H 0 : σ 12 = σ 22 ; H1 : σ 12 ≠ σ 22
②计算统计量: 2
S1 − S 2
2
t=
( )
4 S12 S 22 1 − r 2
n−2
8.42 − 12.62
= = −3.38
2
(
4 × 8.4 × 12.6 × 1 − 0.65
2
)
2

40 − 2
③判断结果:查t值表得:
t(38 ).01 2 = 2.704
 − 3.38 > 2.704,∴ p < 0.01
故两班成绩的方差差异极显著.
一、单总体相关系数差异显著性检验
㈠当ρ=0时
当ρ=0时,样本积差相关系数的抽样分布服从自由度为
n-2的 t 分布,检验公式
r − ρ r −0
t= =  (8 − 26 )
SEr SEr
其中,标准误为: 1− r 2
n−2
SEr = t=r
n−2 1− r 2

其他类型相关系数的显著性检验见p250-251
例20 某校对各门学科进行统考,统考后从该校
抽取42 名学生,计算他们语文与化学成绩的
积差相关系数为0.34,试问语文与化学成绩是否
真实存在相关。
解: 提出假设 H0 : ρ=0, H1: ρ≠0

选择检验统计量 t = r n − 2 = 0.34 40 = 2.2866


1− r
2
1 − 0.34
2

统计决断:根据df=42-2=40,查t值表得
t(40)0.01=2.704, t(40)0.05=2.021.
在0.01显著性水平拒绝零假设,而在0.05显著性
水平下接受零假设
 根据df=40,查附表7,
 从α=0.01一列找到对应的积差相关系数临界值
为0.393
 从α=0.05一列找到对应的积差相关系数临界值
为0.304
 而计算得到的r=0.34,大于表中α=0.05的临界值,
因此该接受该相关系数显著的结论。而它小于
α=0.01的临界值,因此该拒绝该相关系数显著的
结论。
 斯皮尔曼等级相关系数的检验就是查表做判断
(附表9)
㈡ ρ≠0时
当ρ≠0时,相关系数呈不同程度的偏态分布,只有样本
足够大(n>500)时,相关系数的抽样分布才渐进正态分
布。这一条件在实际中很难达到。这时,则需要用费
舍法。检验的公式为
Zr − Zρ
Z=  (8 − 27 )
SEr
Zr的标准误为:
Z = (Z r − Z ρ ) n − 3
1
SEr =
n−3
例21有人估计,3~6岁儿童身高与体重的相关系数为
0.80,从某幼儿园随机抽取3~6岁儿童40名,经测量,
计算出他们的身高与体重的相关系数为0.68,试
问在该幼儿园的测查结果能否推翻上述对身高与
体重关系的估计。
解 H0: ρ=0, H1: ρ≠0
0.8 的Zr为1.099
0.68 的Zr为0.829
α=0.05, Zα/2=1.96
Z = (Z r − Z ρ ) n − 3 = (1.099 − 0.829) 40 − 3 = 1.6423 < 1.96

α=0.05下,接受H0,拒绝H1
㈠两样本相关系数分别由两组相互独立的被试得到
根据费舍Z函数进行转换,由于Zr的分布近似正态,同样
Zr1-Zr2的分布也是近似正态,检验的公式为:

Z=
(Z r1 ) (
− Z r2 − Z ρ1 − Z ρ 2 )(8 − 32)
SEDr
其中标准误为:
1 1
SEDr = +
n1 − 3 n2 − 3
例22 从某重点中学中抽取学生30名,从一般中
学中抽取35名学生,分别计算他们的数学成绩
与瑞文测验分数的相关系数为0.72和0.51,试问
能否认为重点中学学生在数学成绩与瑞文推理
能力之间比一般中学学生有更高的相关。
解 H0: r1≤r2, H1: r1>r2
0.72 的Zr为0.908
0.51 的Zr为0.563
SE2 = 1/27+1/32 , SE = 0.2613, α=0.05, Zα=1.64
0.908 − 0.563
Z= = 2.4683 > 1.64
0.2613
α=0.05下,拒绝H0,接受H1
㈡两样本相关系数由同一组被试求得
设r12,r23,r13是由三列变量计算出的两两相关系数,若
对r12和r13进行差异显著性检验时,样本相关系数的抽样
分布服从自由度为n-3的t分布。其检验公式为:

(r12 − r13 ) ⋅ (n − 3)(1 − r23 )


t=  (8 − 34 )
(
2 1 − r122 − r132 − r232 + 2 ⋅ r12 ⋅ r13 ⋅ r23 )
例23 某市统考结束后,随机抽取80名学生,分
别计算出他们的数学成绩与物理成绩的相关系
数为0.75,数学成绩与化学成绩的相关系数为
0.54,物理成绩与化学成绩的相关为0.6,试问数
学与物理和数学与化学的相关的差异是否显著。
解:①建立假设:H 0 : ρ12 = ρ13 , H1 : ρ12 ≠ ρ13
②计算统计量:
(r12 − r13 ) ⋅ (n − 3)(1 − r23 )
t=
2(1 − r12 − r13 − r23 + 2 ⋅ r12 ⋅ r13 ⋅ r23 )
(0.75 − 0.54 ) (80 − 3)(1 − 0.6 )
=
(
2 1 − 0.752 − 0.54 2 − 0.6 2 + 2 × 0.75 × 0.54 × 0.6 )
1.165
= = 1.59
0.54
③判断结果:
查t值表得 : t(77 ).05 2 = 1.99,1.59 < 1.99,
∴ P > 0.05, 差异不显著.
一、单总体比率的显著性检验
对样本比率与总体比率直接是否存在显著差异进
行检验。
(1)当np ≥ 5或nq ≥ 5时,样本比率 p̂ 的分布为渐近
正态分布。检验的公式为
pˆ -p0 p0 q0
Z= , SE p =  (8 − 36)
SE p n

确定检验形式:双侧,单侧
进行统计推断——查表寻找相应的临界值,比较
Z与Zα,从而确定该样本的p是否为小概率。
例题24 已知某年某区高考升学率为75%,某校在
这一年有300名学生参加了高考,最后有210人被
高校录取,问该校的升学率与全区的升学率是否
相同?
 解:np>5, 提出假设 H0: P’=0.75, H1: p’≠0.75
 计算
p ' -p0 210 / 300-0.75
Z= = = 2.00
p0 q0 0.75 × 0.25
n 300

 统计决断:因为Z=2>1.96=Z0.05/2,p<0.05,所
以拒绝零假设,接受备择假设,即该校这
一年的高考升学率与全区的升学率有显著
差异,由实际数据来看,该校的这一年的
升学率低于全区。
一、单总体比率的显著性检验
(1)当np ≤ 5 (p<q)时,可直接查附表13(1,2),若p̂
落入p0置信区间之外,可认为差异显著,否则不
显著。

例题25 已知某区学习障碍儿童的比率为8%,通
过调查得知某班45名学生中有学习障碍的学生有
3人,问该班的学习障碍学生的比率与全区是否
有差异?
 np<5
 通过查表得,比率为0.08所属总体比率0.95
置信区间为2%~19%,包含了6.67%,所以
要保留零假设,拒绝备择假设,也就是说
该班学习障碍学生的比率与全区没有显著
差异。
 总体比率差异的显著性检验是根据两个样
本的比率来检验两个相应总体的比率是否
存在显著性差异。由于样本性质不同,其
检验方法也不同。
当n1 p1 ≥ 5,n2 p2 ≥ 5时,统计量pˆ 1 - pˆ 2 = D p的分布为正态分布。
1.若统计假设为: H 0 : p1-p2 = pD , H1 : p1-p2 ≠ pD
临界比率CR为:
Z=
( pˆ 1 - pˆ 2 ) − pD
σ p −p =
p1q1 p2 q2
+
σ pˆ - pˆ
1 2
1 2
n1 n2

2.若统计假设为: H 0 : p1 = p2 = p, H1 : p1 ≠ p2
临界比率CR为:

Z=
( pˆ 1 - pˆ 2 ) − 0
=
pˆ 1 - pˆ 2 σ p −p =
(n1qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 )
σ pˆ - pˆ σ pˆ - pˆ n1n( 2 n1 + n2)
1 2

1 2 1 2

通过比较单、双侧,来判断比率差异是否显著。
 例26 研究者在两所学校随机各抽取一个班
学生进行一项视力检查,结果发现,甲校
46名学生中患近视的有20人,乙校48名学
生中患近视的有33人,问两校学生患近视
的比率是否有显著性差异?

pˆ 1 - pˆ 2 0.4348-0.6875
Z= = = 2.47
(n1 qˆ1 + n2 qˆ 2 )(n1 pˆ 1 + n2 pˆ 2 ) (20 + 33)(26 + 15)
n1 n(2 n1 + n 2) 46 × 48(46 + 48)
 例27 某厂质量检验人员认为该厂一车间的
产品一级品的比率比二车间产品一级品的
比率大5%,现从一车间和二车间分别抽出2
个独立随机样本,得到如下数据: n1=150,其
中一级品为113;n2 = 160,其中一级品为104.
试根据这些数据检验质量研究人员的观点
。(设α=0.05)
 建立假设 H0: p1-p2≤0.05 H1: p1-p2>0.05
 p1=113/150=0.753, p2 = 104/160=0.650
( pˆ 1 - pˆ 2 ) − 0.05
Z= = 1.034
pˆ 1 qˆ1 pˆ 2 qˆ 2
+
n1 n2

 这个是右侧检验,α=0.05, Z 0.05=1.645>1.034,
故不能否定原假设,也就是说,不支持该厂
质量检测人员的观点是正确的。
当 n1 p1  5, n2 p2  5
差异显著性检验应用精确概率检验法。具体
见第十章
 当两样本相关时,同一组被试在前后两次
实验中,观察的两个项目又相同,这样便
可得到前后两个项目的结果,据这两个结
果所计算出来的两样本比率,就称作相关
样本比率。
 例28 某校120名学生期末代数测验之后,让他们在寒假
里独立完成教师编选的代数练习题,开学初进行同类题
目的测验,两次测验结果见下面频数表,问学生独立完
成教师编选的代数练习题,对提高代数成绩是否有显著
效果?
第二次测验 合计
良 非良
第一次 良 48 (a) 14 (b) 62 (a+b)
测验 非良 22 (c) 36 (d) 58 (c+d)
合计 70 (a+c) 50 (b+d) 120 (n)
 根据表中的符号,可以把两次测验成绩良好
的比率之差表示为
 p1-p2 = (a+b)/n – (a+c)/n = (b-c)/n
 也就是两次成绩良好比率之差只涉及两次不
同成绩b和c的差异是否显著。
 设两次测验中成绩不一致的数量为K=b+c,
实验结果b、c可视为二项分布(b可称为成
功的次数,c视为失败的次数)。
 若b=c,则p=q=0.5 (即两次实验结果的比率
差异各为0.5,无差异),若Kp≥5,按二项分
布可知(近似正态分布):
µ=Kp= (b+c)/2, σ2=Kpq = (b+c)/4
 如果每次取样,b和c落入b(b,K,0.5)的置信区
间内,则可推论说两次实验结果的比率差异
不显著;否则,则说明不是来自于p=q=0.5
的总体,而是取自p≠q≠0.5的总体,即比率
差异显著。
 根据显著性检验公式
p − p0 K ( p − p 0 ) K ( p − 0.5)
Z= = =
p0 q0 Kp 0 q 0 Kp 0 q 0
K
b − 12 (b + c) b−c 14 − 22
= = = = −1.33
(b + c ) 12 × 12 b+c 14 + 22
 因为|Z|=1.33<1.96, p>0.05, 所以保留零假设
,即寒假里独立完成教师编选的代数练习题
对提高代数成绩无显著效果。
 例29 有研究者通过在一年前后对同一群学生各
进行了一次调查来了解某校图书馆服务质量的
改善情况。两次调查的结果如下,问两次调查
所获得的满意率是否有显著差异?
第二次调查 合计
满意 不满意
第一次 满意 18 10 28
调查 不满意 32 12 44
合计 50 22 72
 根据表中的数据得知: b=10, c=32
 将它们代入公式中,
b−c 10 − 32
Z= = = −3.40
b+c 10 + 32
 因为|Z|=3.4>2.58, p<0.01, 所以拒绝零假设,
得出结论:一年后学生们对该校图书馆服
务的满意率有了极显著的提高。
观察次数 戒烟前
吸烟 不吸烟
戒烟后 吸烟 65 15
不吸烟 25 55
 不能用正态分布概率计算,需按二项分布
计算p(x>b) (或p(x>c))以上的概率和来得到
临界比率,然后按照单双侧来判断差异是
否显著。
 举例: P259 例题

You might also like