You are on page 1of 69

第 5 章 平均指标和标志变异指标

5.1 平均指标

5.2 标志变异指标
5.1 平均指标

5.1.1 平均指标的概念和作用
5.1.2 算术平均数
5.1.3 调和平均数的计算
5.1.4 几何平均数
5.1.5 众数
5.1.6 中位数
5.1.1 平均指标的概念和作用
( 一 ) 平均指标的含义
( 二 ) 平均指标的特点
( 三 ) 平均指标的作用
( 四 ) 平均指标的种类
( 一 ) 平均指标的含义
 平均指标又称统计平均数,指同质总体某一标志值在
一定的时间、地点、条件下所达到的一般水平,是总
体的代表值,反映了总体分布的集中趋势。例如,平
均成绩、平均工资、工人平均劳动生产率等都属于平
均指标。
 所谓“平均”,实质上是对总体分布 ( 变量数列 ) 的均
匀化。最基本的解释是,对总体内的全部标志值进行
“截长补短”,使得总体各单位拥有同一水平的数量
表现。
 平均指标是总体分布的特征值之一。它是总体某一变
量数列的代表值,是事物发展变化在数量上的共同表
现,它依赖于总体各单位的实际数量水平,是对各数
量标志值进行抽象概括的结果。
( 二 ) 平均指标的特点
由于平均指标是反映各总体单位的一般
水平,抽象概括总体数量特征的指标,
因此它具有以下几个特点:
(1) 总体同质性。
(2) 一般代表性。
(3) 数量抽象性。
(1) 总体同质性。
 平均指标只能就同类现象计算,也就是平均指标的各
个单位必须具有同类性质,这是计算平均指标的基本
前提。如果把不同类现象混同起来计算平均数,就会
掩盖现象间本质的差别,所得出的结论,必然不符合
客观实际的真实情况。例如,在研究全国职工工资收
入时,不能把农民收入和个体经营者收入包括在内加
以计算,否则就会夸大或缩小全国职工工资收入水平
,以致做出错误的判断和结论。又如在计算住校大学
生平均每月支出时,便不能将走读学生混入期内,否
则会掩盖二者的区别,使平均数失去代表性。
(2) 一般代表性。
 平均指标以一般水平代表总体各单位数量标志
值的具体表现,反映总体某一数量标志的典型
水平或代表性水平。例如某车间某班组有 6 名
工人,他们某天在正常条件下的日产量 ( 单位
:件 ) 分别为:
20 、 22 、 23 、 23 、 24 、 26 ,他们的平均
日产量为 (21+22+23+23+24+26)÷6=23( 件 ) 。
这个 23 件平均日产量虽然不能说明任何一个
工人日产量的实际产量,但却把高产量和低产
量拉平了,能够说明总体的一般水平,所以,
平均日产量可作为全组每个工人日产量的代表
值。
(3) 数量抽象性。
 统计平均指标将总体各单位某一数量标志的各
个差异数值进行抽象,概括地反映这—数量标
志在具体时间、地点、条件下达到的一般水平
,使人们看不到先进与落后的差别。例如,某
企业职工的平均工资为 960 元,但各个职工的
工工资水平有高有低,高于 960 元和低于 960
元的工资相互抵消、截长补短,得出平均工资
960 元。由此可见,平均数将被研究对象总体
各单位的标志值的数量差异抽象化了。
( 三 ) 平均指标的作用
(1) 利用平均指标可以将同类现象的一般
水平在不同的空间和时间上进行比较。
(2) 利用平均指标可以分析现象之间的依
存关系。
(3) 平均指标是统计推断的一个重要参数

( 四 ) 平均指标的种类
 平均指标有多种不同的计算方法,因而也有不同的类别。平均指
标从反映的时间状况看,分为静态平均指标和动态平均指标:
 静态平均指标是根据分配数列计算得到的,它主要是反映总体各
单位在某一时间内或时点上标志值的一般水平。
 动态平均指标是根据时间数列计算得到的,它主要是反映同一总
体在一段时间内发展变化的一般水平。本章主要研究的是静态平
均指标。静态平均指标主要有算术平均指标、调和平均指标、几
何平均指标、中位数和众数等。其中前三种平均指标都是根据各
单位标志值计算求得,因而称为数值平均数。而中位数和众数却
是根据标志值所在的位置来确定,所以又称为位置平均数。
5.1.2 算术平均数
( 一 ) 算术平均指标的基本形式
( 二 ) 算术平均数与强度相对数的区别
( 三 ) 简单算术平均数
( 四 ) 加权算术平均数
( 一 ) 算术平均指标的基本形式
算术平均指标是统计中最基本最常用的
一种综合指标。它是将总体各单位的标
志值相加求其算术总和,然后除以总体
单位个数而得。其基本公式为:
算术平均数 = 总体标志总量 ÷ 总体单位
总量
 利用公式计算平均数时应注意:
 (1) 公式的分子和分母存在着密切的关系,其分
子 ( 标志总量 ) 是由分母中总体单位本身所具
有的某种标志值加总而得到的。这是平均指标
与强度相对指标最本质的区别;
 (2) 总体标志总量是数量标志值之和,由于品质
标志不能相加,因而不能计算算术平均数;
 (3) 算术平均数是一个有名数,计量单位和标志
值的计量单位一致。
( 二 ) 算术平均数与强度相对数的区别
 在实际社会经济生活中,某些强度相对指标会被误认为平均指标
,如“人均粮食占有量”、“人均钢产量”等,虽然这类指标有
“人均”二字,有“平均”的含义,但它们不是平均指标,而是
强度相对指标,必须弄清二者的区别。
 算术平均数与强度相对数的区别主要表现在以下两点:
 (1) 分子、分母资料是否属于同一总体范围。平均指标的分母、分
子是同一总体的单位总量和某一标志总量,且分子直接依附于分
母;强度相对数的分子与分母本质上分别属于两种性质不同但有
联系的现象总体;
 (2) 分子与分母数值是否具有一一对应关系。平均指标中分子的标
志总量就是分母的单位总量中每一单位的标志值之和,且各个标
志值与各个单位一一对应。
( 三 ) 简单算术平均数
 在计算算术平均数时,若掌握的资料是总体
各单位的标志值,那么就可以将总体各单位
的标志值简单相加求得标志总量,然后除以
总体单位总量,即得平均数。这种方法通常
称为简单算术平均法。用公式表示:
x1  x 2  ...  xn  x
x 
n n
 式中,x 代表算术平均数; x 代表各单位标
志值; n 代表总体单位数;∑ x 为求和符号

( 四 ) 加权算术平均数
 加权算术平均数一般用来计算分组资料的算术平均数
,它是用标志值乘以相应的各组单位数求出各组的标
志总量,并加总求得总体标志总量,再除以总体单位
总数即得。
 设有 n 个标志值 x1,x2 ,…, xn, 如果以 f1,f2 ,
…, fn 为各标志值的权数或次数,则 x 的加权算术
平均数计算公式为:

x
x1 f 1  x 2 f 2  ... xnfn.

 xf
f 1  f 2  ... fn f
 式中, x 代表各组标志值; f 代表各组单位数。
计算加权算术平均数时有两种情况:
一是单项式变量数列计算;
二是组距式数列计算。
1. 根据单项式变量数列计算算术平均

 由单项式变量数列计算算术平均数,是
将各组的标志值乘以相应的各组的单位
数,求出各组标志总量,并加总得出总
体的标志总量,同时把各组单位数相加
求出总体单位总数,然后,再用总体单
位总数去除总体标志总量,即得算术平
均数。
2. 根据组距式变量数列计算算术平均

 如果掌握的是组距数列资料,其计算方法与上
述方法基本相同,有一点不同的是,组距数列
以各组的组中值作为变量值。利用组中值计算
平均数有一定的假定性,首先假定各个组的标
志值在组内的分布式均匀的,但实际上各组内
的标志值分布不会绝对均匀。其次如果组距数
列上下两组是开口组,还假定他们与同临组组
距相仿,这与实际也有出入,所以根据组距数
列计算出的加权算术平均数只是近似值。
( 五 ) 算术平均数的数学性质和应用

1. 算术平均数的数学性质
2. 算术平均数的简便运算
1. 算术平均数的数学性质
 (1) 算术平均数与变量值个数的乘积等于各变
量值之和。
 简单算术平均数: n x  x 
 (2) 若将各变量值 x 均加减上一常数 A ,则
新平均数等于原平均数加减 A 。
 简单算术平均数:

(x  A)  x  A
n
 (3) 若将各变量值 x 均乘以某一常数 i ,则新
的平均数等于原平均数乘以 i 。
 简单算术平均数: i  x  i  x
 n
 (4) 各变量值 x 对算术平均数 x 的离差之和等
于0。
 简单算术平均数 :  (x  x) 0
 加权算术平均数:
 (x  x) f  0
 (5) 各变量值与平均数离差的平方和最小。

(x  x)  (x  A)
2 2

(x  x) f  (x  A)
2 2
2. 算术平均数的简便运算
 在计算算术平均数时,有时由于被平均的标志
值较大,计算繁琐,有必要采用简捷法计算。
其基本上思路是:通过变量值的线性变换,将
原变量数列的标志值简化,由此简化算术平均
数的计算过程。
 根据数学性质 (2) ,可把原来较大的数值运算
变为简单的数值运算,所得结果再变换为数据
的平均数。
x
 ( x  A)
A
f
 以上数学性质也可以综合运用,使计算过程更
加简化。根据数学性质 (2) 、 (3) ,推导出算
术平均数的简算公式:

x A
( i ) f
i  A  x
f
( 六 ) 简单算术平均数与加权算术平均
数的关系
 简单算术平均数与加权算术平均数均为计算算术平均
数的基本形式。
 二者的区别:
 一是,二者掌握总体单位资料的详尽程度不同。如果
掌握了每一个总体单位的标志值 , 计算平均数时 , 用简
单算术平均数 ; 如果掌握了总体单位分组的标志值及
各组的单位数 , 计算平均数时 , 用加权算术平均数 ;
 二是,二者的计算精确程度不同。用简单算术平均数
计算的平均数是精确值 , 而用加权算术平均数计算的平
均数是近似值。二者的联系是 , 当各组的权数相同时,
加权算术平均数就变成了简单算术平均数。
5.1.3 调和平均数的计算
( 一 ) 调和平均数的概念
( 二 ) 简单调和平均数
( 三 ) 加权调和平均数
( 四 ) 加权调和平均数与加权算术平均数
的关系
( 五 ) 运用调和平均数应注意的问题
( 一 ) 调和平均数的概念
 调和平均数也叫调和平均指标,是根据标志值的倒数
计算的,它是标志值倒数的算术平均数的倒数,所以
,亦称为倒数平均数,用 xH 来表示。在统计实践中 ,
由于只有各组标志总量和各组变量值 , 而缺乏总体单位
数资料 , 不能直接采用算术平均数计算 , 这时就需要将
算术平均数的形式加以改变 , 按照算术平均数基本算式
的需要 , 算出所需总体单位数,继而再计算平均数 , 这
样就得到另一种平均数的计算方法,这就是调和平均
数。
 调和平均数分为简单调和平均数和加权调和平均数两
种。
( 二 ) 简单调和平均数
 这种方法适用于未分组资料或资料虽分组 ,但
各组标志总量均相等的情况。
 根据上述计算,可以得出简单算术平均数的计
算公式: 1  1  ...  1 n
xH  
1 1 1 1
  ... 
x1 x2 xn
x
xH 为调和平均数; x 为各标志值; n
 式中:
为变量值的个数。
( 三 ) 加权调和平均数
 这种方法适用于资料已分组,且各组标志总量
不相等的情况。其计算公式为:

xH 
m1  m2  ...  mn

m
m1 m2 mn m

x1 x2
 ... 
xn
x
 式中: m 代表各组标志总量。
( 四 ) 加权调和平均数与加权算术平均
数的关系
 从形式上说,加权算术平均数与加权调和平均数的原
式存在两点区别:一是加权算术平均数以 x 为变量,
加权调和平均数则以 1x 为变量:二是加权算术平均数
的权数是 f ,代表次数 ( 单位数 ) ,而加权调和平均数
的权数却是 xf ,代表标志总量。但两者实质上都是标
志总量与总体单位数之比。调和平均数可以称为算术
平均数的变形。
 在对算术平均数与调和平均数的介绍当中,可以发现
这样的特点:在计算平均指标时,若缺少分子资料时
,既缺少总体的标志总量,则适宜采用加权算术平均
数;若缺少分母资料时 , 既缺少总体的单位总量,则适
宜采用加权调和平均数的方法。
( 五 ) 运用调和平均数应注意的问题

 (1) 当变量数列有一变量 x 为零时,调和平均数


公式的分母将等于无穷大,因而无法求出一确
定的平均值。
 (2) 调和平均数与算术平均数一样,易受极端变
量值的影响,当数列存在极端大的数值时,调
和平均数增大;当数列存在极端小的数值时,
调和平均数减小。
 (3) 要注意调和平均数和算术平均数的使用条件
,因事制宜。
5.1.4 几何平均数
 几何平均数也叫几何平均指标,是计算平均比
率和平均速度最适用的一种方法 , 用 xG 表示
,它也有简单几何平均数和加权几何平均数之
分。它适合于各变量值之间存在环比关系的事
物,例如,各年发展速度之间、流水生产线各
车间的产品合格率之间、各年银行存款利率之
间等都存在这种关系。
 ( 一 ) 简单几何平均数
 ( 二 ) 加权几何平均数
( 一 ) 简单几何平均数
n 个标志值连乘积的 n 次方
 简单几何平均数是
根,其计算公式为:
xG  n x1  x2  ...  xn  n x
 简单几何平均数适用于各组变量值出现的次数
都为一次的情况。
( 二 ) 加权几何平均数
 对于分组资料 x1,x2,…,xn ,若其相应的次数
为 f1,f2,…,fn ,则必须以指数形式给各变量值
加权,然后求其平均数。其计算公式为:


f1  f 2 ... f n
x
f1 f2 fn
xG  x1 x2 ...xn  f f
 综上分析,由于几何平均数是一种特殊的平均
数,所以,在运用几何平均数时应注意以下问
题:
 (1) 在数列的标志中,若有一个变量数值为 0 ,
则几何平均数等于 0 ;
 (2) 用等比级数数列计算几何平均数不会受极端
值的影响,而用环比数列计算几何平均数,则
受最初水平和最末水平的影响;
 (3) 在我国统计实务中,几何平均法主要用于计
算平均发展速度,属于动态平均数。而计算静
态数列时,使用较少。
5.1.5 众数
( 一 ) 众数的概念
( 二 ) 众数的确定
( 一 ) 众数的概念
 众数是指总体中出现次数最多的标志值,用
MO 表示。它能够鲜明地反映数据分布的集中
趋势。它既不受极端变量值大小的影响,也不
受极端变量值位置的影响。在总体单位数多且
有明显集中趋势时,确定众数既方便且意义明
确。如总体单位数较少,或虽多但无明显集中
趋势,就不存在众数。变量数列中有两个或几
个变量值的次数都比较集中时,就可能有两个
或几个众数,这时称为复众数,在实际工作中
应用较为普遍,如服装、鞋帽的尺码。
( 二 ) 众数的确定
1. 单项式数列确定众数
2. 组距式数列确定众数
1. 单项式数列确定众数
对于单项式数列,可以根据定义直接求
出。
2. 组距式数列确定众数
 对于组距式数列,应先根据定义确定众数所在的组,然
后用众数的上限或下限公式求出众数的具体数值。
 下限公式: M  L  1  d
0
1   2
1
 上限公式: M 0  U  d
1   2

 式中: L 为众数所在组的下限; U 为众数所在组的上


限;
 Δ1 为众数所在组次数与下一组次数之差;
 Δ2 为众数所在组次数与上一组次数之差; d 为组距。
5.1.6 中位数
( 一 ) 中位数的概念
( 二 ) 中位数的确定方法
( 一 ) 中位数的概念
(Me) 是指位于总体分布中点位置上的
 中位数
标志值。所谓分布中点,意味着有一半单位的
标志值小于该点的标志值,而另—半单位的标
志值必定大于该点的标志值。由此可见,中位
数的大小不受两端值的影响,也不受各变量变
动大小的影响,仅受所处位置的影响。由于许
多事物的分布均呈正态分布或近似正态分布,
因此,中位数可以从另一侧面反映次数分布的
集中趋势。
( 二 ) 中位数的确定方法
1. 根据未分组资料确定中位数
2. 根据分组资料确定中位数
1. 根据未分组资料确定中位数
对于未分组的资料 x1,x2,…,xn 进行排序
后,按下列公式确定众位数的位置。
中位数位置 = ( n+1 ) ÷2
式中, n 代表数列的项数。
如果项数是奇数,则居于中间位置的那
个变量值就是中位数。
2. 根据分组资料确定中位数
分组资料可以分为单项式变量数列和组
距式变量数列。
(1) 对于单项式变量数列。
首先,要确定中位点∑ f/2 所在的组,即
累计次数的半值;
其次,找出中位数所在的组,即含累计
次数半值的组,该组的变量值就是中位
数。
 (2)
对于组距式变量数列。
 由组距数列确定中位数,同样要先按中位
点的公式∑ f2, 确定中位数所在的组,然
后按照下限公式或上限公式来计算中位数
的近似值。  f S
 中位数的下限公式: M  L  2
m 1
d
e
fm
 f
 S m 1
 中位数的上限公式: M  U  2 d
e
fm
式中: L 为中位数所在组的下限;
Sm-1 为中位数所在组前一组的累计次数
( 其累计次数按向上累计计算 ) ;
fm 为中位数所在组的次数;
d 为中位数所在组的组距;
U 为中位数所在组的上限;
Sm+1 为中位数组后一组的累计次数 ( 累
计次数按向下累计计算 ) 。
5.2 标志变异指标

5.2.1 标志变异指标概述
5.2.2 标志变异指标的计算
5.2.1 标志变异指标概述
( 一 ) 标志变异指标的概念
( 二 ) 标志变异指标的作用
( 三 ) 标志变异指标的种类
( 一 ) 标志变异指标的概念
 标志变异指标是用来说明总体各单位的标志值之间差异程度的综
合指标,也称为标志变动度。
 平均指标是将总体各单位某一数量标志值的差异抽象化,只反映
总体的一般水平与共性,反映的是总体的集中趋势,同时,也掩
盖了总体各单位的数量差异,不能全面描述总体分布的特征。标
志变异度指标弥补了这个不足,反映了总体各单位的标志值之间
的差异性,从另一方面说明总体分布的特征,反映的是总体分布
的离中趋势。因此,两者紧密联系,分别从不同角度分析现象的
特征。
 平均指标与标志变异指标的区别主要是:
 (1) 前者是抽象变量值之间的差异而成的结果,后者则是反映变量
之间差异而成的结果;
 (2) 前者反映了总体分布的集中趋势,后者反映了总体分布的离中
趋势。
( 二 ) 标志变异指标的作用
1. 标志变异指标是衡量平均指标代表性
大小的重要尺度
2. 标志变异指标是反映社会经济活动过
程的均衡性与协调性的重要指标
3. 标志变异指标是抽样方案设计的依据
之一
( 三 ) 标志变异指标的种类
根据比较的标准不同,可将标志变异指
标分为三类:
 1. 以标志值之间相互比较的方式来说明
变异情况
 2. 以平均数为比较标准来说明标志变异
情况
 3. 以正态分布为标准来说明分配数列的
偏离情况
5.2.2 标志变异指标的计算
( 一 ) 全距的概念和特点
( 二 ) 平均差的概念、特点及计算
( 三 ) 标准差的概念、特点及计算
( 四 ) 变异系数的意义和计算
( 一 ) 全距的概念和特点
 全距也叫极差,通常用 R 表示。它是测定标志
变动度最简单的方法,计算总体各单位标志值
中最大值与最小值之差。它表示总体各单位标
志变动度的大小,也反映了总体分散与集中的
程度。一般说来,全距大,总体各单位变异程
度大;全距小,总体各单位变异程度小。
 全距 = 最大的标志值 - 最小标志值
 全距反映总体标志变动度比较直观,且计算简
单,但其反映总体标志变动度不是太准确。
( 二 ) 平均差的概念、特点及计算
 平均差是指各标志值与其算术平均数离差的绝对值的
算术平均数。常用 A.D 表示。其计量单位与标志值的
计量单位相同。
 由于各个标志值对算术平均数的离差有正有负,其和
为零。因此需采用离差的绝对值来计算。平均差仅反
映总体各单位的标志值对其平均数的平均离差量。平
均差愈大,表明标志变异程度愈大;反之,则表明标
志变异程度愈小。
 1. 对未分组资料,采用简单算术平均式
 A.D=∑x-xn
 2. 对分组资料,采用加权算术平均式
 A.D=∑x-xf∑f
平均差综合了总体各单位的数量差异,
因此,能全面地反映总体分布的变异程
度。但是,它采用绝对值的方式来消除
离差的正负号,不便于代数运算,在数
学处理上也不够严密。
( 三 ) 标准差的概念、特点及计算
1. 标准差 (σ) 的概念
2. 标准差的计算方法
3. 标准差的数学性质与简捷计算
4. 是非标志标准差
1. 标准差 (σ) 的概念
 所谓标准差就是总体各单位的标志值与其算术
平均数离差平方的算术平均数的平方根,故又
称为均方根差,简称均方差。标准差的平方称
为方差。标准差的意义与平均差相同,它也是
各个标志值对其算术平均数的平均离差。但在
数学处理上与平均差有所不同,它是采用平方
的方法来消除离差的正负号的,因此,它比平
均差更能准确地反映变量数列之间的离中程度
,是统计中最常用的标志变异度指标。
2. 标准差的计算方法
 根据标准差的定义,标准差的计算步骤为:
 首先,求总体各标志值的算术平均数;
 其次,求总体各标志值与其算术平均数的离差

 第三,求离差的平方;
 第四,求各项离差平方的算术平均数;
 第五,对离差平方的算术平均数开平方。
 根据所掌握的资料不同,标准差的计算可分为
简单平均法与加权平均法两种:
 (1)
简单平均法
(x  x)
2
 在资料未分组的情况下:

n
 (2)
加权平均法
(x  x)
2
f
 在资料分组的情况下:  
f
3. 标准差的数学性质与简捷计算
(1)标准差的数学性质
 ① 各变量值 x 与其算术平均数 x 计算的
方差小于各变量值 x 与任意数 A 计算的
方差。
 ② 变量的方差等于变量平方的平均数减
变量平均数的平方。
(2) 标准差的简捷计算
 根据标准差的性质,可以得出标准差的简捷计算
公式:
在资料未分组的情况下:

 ( x  A)2

[
(x  A)
] 2

n n
在资料已分组,且为单项式资料的情况下:

 (x  A )2

[
(x  A)f
]2
f f
 在资料已分组,且为等距式资料的情况下:

x A 2 x A
(  ) (  )f 2
  [ ]
f f
A 为个接近于平均数的常数; Δ
式中:
为等距数列的组距。
4. 是非标志标准差
 所谓是非标志 ( 又称交替标志 ) ,是指仅有两种标志表现的品质
标志。例如,产品的合格与不合格、人口的男性与女性等,这种
用“是”与“非”或“有”与“无”来表示的标志。要测定这类
标志的变动程度,也需要计算标准差,其原理与前述的内容一致
,但在计算形式上有区别。所以应首先将是非标志的具体表现数
量化。即将所研究现象标志表现 (x) 分别用“ 1” 和“ 0” 来表示
,然后计算其平均数和标准差。
 设全部总体单位数为 N ,具有某种性质的单位数为 N1 ,其比重
为 P ;不具有某种性质的单位数为 N0 ,其比重为 Q 。则:
 具有某种性质的单位数的比重: P=N1N
 不具有某种性质的单位数的比重: Q=N0N
 所以, P+Q=1
 是非标志的算术平均数

x
 xf

N1
P
f N
 是非标志的标准差

 ( x  x ) 2

 p (1  p )
f
( 四 ) 变异系数的意义和计算
 以上所介绍的变异度指标,都是有计量单位的名数。
它们是从绝对量上反映数列的变异程度,其数值的大
小除了受总体内部标志值的差异程度影响外,还受标
志本身水平高低的影响,若直接用上面指标比较不同
水平数列的变异程度显然不合适,因而需要消除平均
水平高低的影响,消除的办法就是用标准差指标与其
自身的算术平均数对比,计算标准差系数 (Vσ) ,即变
异系数。这是实际工作中最常用的一个统计指标。现
仅以标准差为例,介绍变异系数的计算。其计算公式
为:
 V =σx×100%

You might also like