You are on page 1of 30

现代质量管理统计方法

韩直能   李喜军   郑志宏   编著

北 京
内 容 简 介

本书主要介绍如何用统计方法解决企业管理 、国民经济管理 、社会管理


中经常遇到的实际问题 .本书共有 17 章 ,分若干阶段叙 述了数据的 收集与
处理 、描述性统计分析 、抽样调查 、管理图 、回归分析和方差分析 、实验设 计 、
可靠性 、数量化方法等 . 本书浅显易懂 ,特别强调实 用性 ,给 出专题研究 ,有
助于学生的创新能力培养 .
本书可用作理工科各专业 、经济管理各专业本科生的教材和参考书 ,也
可供从事质量管理工作的工程技术人员和相关学科的研究人员使用 .

  图书在版编目(CIP)数据

  现代质量管理统计方法/韩直能 ,李喜军 ,郑志宏 编著 . — 北京 :科 学出版


社 ,2007
  IS B N   978唱7唱03唱018646唱1

  Ⅰ 畅 现 …   Ⅱ 畅 ① 韩 … ② 李 … ③ 郑 …   Ⅲ 畅 质量管理 统计方法
Ⅳ 畅 F273 .2

  中国版本图书馆 C IP 数据核字(2007)第 024879 号

责任编辑 :陈玉琢/责任校对 : 刘亚琦


责任印制 :赵德静/封面设计 : 王   浩

科 学 出版 社 发行   各地 新 华 书店 经 销

200 7 年 3 月第   一   版     开本 : B5( 720 × 1 0 00)
200 7 年 3 月第 一次 印 刷     印张 : 28
印数 : 1 — 3 000           字 数 : 535 00 0

定价 :49 .00 元
(如有印装质量问题 ,我社负责调换枙环伟枛)
前   言

在世界经济一体化的时代 ,对大学生开展质量管理教育 ,特别是统计质量管理


教育是非常必要的 . 近年来许多企业提高了对质量管理的 认识 ,因此 ,为实现质 量
管理而编写一本有指导意义的 、详细而系统的书是非常有必要的 .
本书以作者多年来给学生授课的讲义为基础 ,收集 、整理了在对企业的咨询活
动中所遇到的实际质量管理问题 . 本书注重应用 ,读者只要具备 高等数学 、概率 统
计 、线 性代 数的 基 本知 识就 可以 阅读 . 本书 可作 为 理工 科各 专业 、经济 管理 各 专
业 、统计专业本科生的教材和参考书 ,也可供从事质量管理工作的工程技术人员和
相关学科的研究人员使用 .
本书以作者所著的枟现代质量管理 统计 枠 为基础 ,增 加了 抽样 调查 、回归 分析 、
试验设 计和 方差 分析 、可靠 性 、数 量化 方法 及成 绩 管理 等内 容 . 整 体内 容比 较 新
颖 、实用性强 . 根据不同专业的需要 ,可以挑选书中某些章节授课 .
参加编著的人还有赵瑛 、孙王 杰 、赵树 魁等 同志 ,他们 编写 了部 分章 节 . 特 别
要提到的是靳芳芳 、丁芳 、傅冬梅 、刘玉 娇 、季建 花同 学 ,他们为 此书 按期完 稿做 了
大量细致的工作 ,在此表示真挚的谢意 .
由于作者水平有限 ,书中难免有不妥之处 ,恳请广大读者指教 .

作 者
2006 年 10 月于龙潭山脚下
目   录

前言
第 1 章   质量管理的基本概念 … … … … … … … … … … … … … … … … … … … … … 1
    1 .1   质量管理简史 … … … … … … … … … … … … … … … … … … … … … … … 1
    1 .2   质量与管理 … … … … … … … … … … … … … … … … … … … … … … … … 3
    1 .3   质量管理和统计质量管理 … … … … … … … … … … … … … … … … … … 4
    1 .4   统计质量管理的范围 … … … … … … … … … … … … … … … … … … … … 5
    1 .5   统计质量管理活动体系和统计方法的应用 … … … … … … … … … … … 5
    1 .6   全面质量管理( T Q M) … … … … … … … … … … … … … … … … … … … … 7
第 2 章   数据的初步整理方法 … … … … … … … … … … … … … … … … … … … … … 9
    2 .1   母体和样本 … … … … … … … … … … … … … … … … … … … … … … … … 9
    2 .2   数据的分类 … … … … … … … … … … … … … … … … … … … … … … … … 10
    2 .3   经验分布 … … … … … … … … … … … … … … … … … … … … … … … … … 10
    2 .4   均值和散布 … … … … … … … … … … … … … … … … … … … … … … … … 17
    2 .5   按区间划分的数据的统计 … … … … … … … … … … … … … … … … … … 21
    2 .6   7 种 Q C 基础方法 … … … … … … … … … … … … … … … … … … … … … 24
    习题 2 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 30
第 3 章   估计和检验概念 … … … … … … … … … … … … … … … … … … … … … … 31
    3 .1   样本分布 … … … … … … … … … … … … … … … … … … … … … … … … … 31
    3 .2   参数估计的概念 … … … … … … … … … … … … … … … … … … … … … … 37
    3 .3   总体均值的估计 … … … … … … … … … … … … … … … … … … … … … … 39
    3 .4   假设检验的概念 … … … … … … … … … … … … … … … … … … … … … … 43
    3 .5   总体均值的检验 … … … … … … … … … … … … … … … … … … … … … … 47
    习题 3 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 52
第 4 章   计量值的估计和检验 … … … … … … … … … … … … … … … … … … … … 54
    4 .1   均值差的估计和检验 … … … … … … … … … … … … … … … … … … … … 54
    4 .2   3 个以上母体均值差的检验 … … … … … … … … … … … … … … … … … 63
    4 .3   方差的估计和检验 … … … … … … … … … … … … … … … … … … … … … 66
    4 .4   方差比的估计和检验 … … … … … … … … … … … … … … … … … … … … 68
    4 .5   3 个以上母体方差的检验 … … … … … … … … … … … … … … … … … … 71
    习题 4 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 76
  · iv ·                                                                   目   录

第 5 章   计数值的估计和检验 … … … … … … … … … … … … … … … … … … … … 79
    5 .1   总体比率的估计和检验 … … … … … … … … … … … … … … … … … … … 79
    5 .2   总体比率差的估计和检验 … … … … … … … … … … … … … … … … … … 84
    5 .3   总体缺陷数的估计和检验 … … … … … … … … … … … … … … … … … … 87
    5 .4   拟合度的检验 … … … … … … … … … … … … … … … … … … … … … … … 89
    5 .5   独立性检验 … … … … … … … … … … … … … … … … … … … … … … … … 95
    习题 5 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 101
第 6 章   相关分析 … … … … … … … … … … … … … … … … … … … … … … … … … 104
    6畅 1   散点图 … … … … … … … … … … … … … … … … … … … … … … … … … 104
    6畅 2   样本相关系数 … … … … … … … … … … … … … … … … … … … … … … 105
    6畅 3   相关系数的检验 … … … … … … … … … … … … … … … … … … … … … 110
    6畅 4   相关系数的估计 … … … … … … … … … … … … … … … … … … … … … 113
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 115
    习题 6 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 115
第 7 章   简易分析法 … … … … … … … … … … … … … … … … … … … … … … … … 119
    7畅 1   关于范围 … … … … … … … … … … … … … … … … … … … … … … … … 119
    7畅 2   关于顺序的方法 … … … … … … … … … … … … … … … … … … … … … 123
    7畅 3   符号检验 … … … … … … … … … … … … … … … … … … … … … … … … 130
    7畅 4   正态性检验 … … … … … … … … … … … … … … … … … … … … … … … 132
    习题 7 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 134
第 8 章   抽样调查 … … … … … … … … … … … … … … … … … … … … … … … … … 136
    8畅 1   抽样的基本概念 … … … … … … … … … … … … … … … … … … … … … 136
    8畅 2   误差 … … … … … … … … … … … … … … … … … … … … … … … … … … 137
    8畅 3   简单随机抽样 … … … … … … … … … … … … … … … … … … … … … … 141
    8畅 4   多阶段抽样 … … … … … … … … … … … … … … … … … … … … … … … 144
    8畅 5   分层抽样 … … … … … … … … … … … … … … … … … … … … … … … … 151
    8畅 6   整群抽样 … … … … … … … … … … … … … … … … … … … … … … … … 155
    8畅 7   系统抽样 … … … … … … … … … … … … … … … … … … … … … … … … 156
    8畅 8   方差成分的估计 … … … … … … … … … … … … … … … … … … … … … 157
    习题 8 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 167
第 9 章   计数型抽样调查 … … … … … … … … … … … … … … … … … … … … … … 169
    9畅 1   抽样调查的基本概念 … … … … … … … … … … … … … … … … … … … 169
    9畅 2   调查特性曲线 … … … … … … … … … … … … … … … … … … … … … … 170
    9畅 3   计数规范型抽样调查 … … … … … … … … … … … … … … … … … … … 175
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 195
目   录                                                                  · v ·  

    习题 9 … … … … … … … … … … … … … … … … … … … … … … … … … … … … 195
第 10 章   计量型抽样调查 … … … … … … … … … … … … … … … … … … … … … 196
    10 .1   计量型抽样调查的基本概念 … … … … … … … … … … … … … … … … 196
    10 .2   已知标准偏差 σ 的抽样调查 … … … … … … … … … … … … … … … … 196
    10 .3   未知标准偏差 σ 的抽样调查 … … … … … … … … … … … … … … … … 209
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 213
    习题 10 … … … … … … … … … … … … … … … … … … … … … … … … … … … 213
第 11 章   计数型管理图 … … … … … … … … … … … … … … … … … … … … … … 214
    11 .1   管理的基本概念 … … … … … … … … … … … … … … … … … … … … … 214
    11 .2   不合格品率( p)管理图 … … … … … … … … … … … … … … … … … … 220
    11 .3   不合格品个数( p n) 管理图 … … … … … … … … … … … … … … … … 225
    11 .4   缺陷个数( C)管理图 … … … … … … … … … … … … … … … … … … … 227
    11 .5   每单位缺陷数( u)管理图 … … … … … … … … … … … … … … … … … 230
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 233
    习题 11 … … … … … … … … … … … … … … … … … … … … … … … … … … … 233
第 12 章   计量型管理图 … … … … … … … … … … … … … … … … … … … … … … 235
    12 .1   计量型管理图概念 … … … … … … … … … … … … … … … … … … … … 235
    12 .2   平均值与范围( 珚x唱R)管理图 … … … … … … … … … … … … … … … … 237
    12 .3   每个观测值 x 的管理图 … … … … … … … … … … … … … … … … … 245
    12 .4   中值( 珚x ) 管理图 … … … … … … … … … … … … … … … … … … … … … 249
    12 .5   其他的计量型管理图 … … … … … … … … … … … … … … … … … … … 250
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 255
    习题 12 … … … … … … … … … … … … … … … … … … … … … … … … … … … 255
第 13 章   工程能力及工程管理 … … … … … … … … … … … … … … … … … … … 257
    13 .1   工程管理的概念 … … … … … … … … … … … … … … … … … … … … … 257
    13 .2   工程能力 … … … … … … … … … … … … … … … … … … … … … … … … 259
    13 .3   使用管理图的工程管理 … … … … … … … … … … … … … … … … … … 263
    13 .4   规格与公差 … … … … … … … … … … … … … … … … … … … … … … … 264
    13 .5   专题研究 ——— 摩托罗拉的 6σ 准则 … … … … … … … … … … … … … 267
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 271
    习题 13 … … … … … … … … … … … … … … … … … … … … … … … … … … … 271
第 14 章   回归分析 … … … … … … … … … … … … … … … … … … … … … … … … 272
    14 .1   回归分析的概念 … … … … … … … … … … … … … … … … … … … … … 272
    14 .2   一元回归分析 … … … … … … … … … … … … … … … … … … … … … … 274
    14 .3   一元回归的估计与检验 … … … … … … … … … … … … … … … … … … 281
  · vi ·                                                                   目   录

    14 .4   非线性回归分析 … … … … … … … … … … … … … … … … … … … … … 283
    14 .5   多元回归分析 … … … … … … … … … … … … … … … … … … … … … … 286
    14 .6   曲线回归分析 … … … … … … … … … … … … … … … … … … … … … … 295
    14 .7   回归诊断 … … … … … … … … … … … … … … … … … … … … … … … … 299
    14 .8   变量选择 … … … … … … … … … … … … … … … … … … … … … … … … 306
    14 .9   专题研究 … … … … … … … … … … … … … … … … … … … … … … … … 308
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 318
    习题 14 … … … … … … … … … … … … … … … … … … … … … … … … … … … 318
第 15 章   试验设计和方差分析 … … … … … … … … … … … … … … … … … … … 322
    15 .1   试验设计的概念 … … … … … … … … … … … … … … … … … … … … … 322
    15 .2   方差分析的概念 … … … … … … … … … … … … … … … … … … … … … 324
    15 .3   等重复单因子方差分析 … … … … … … … … … … … … … … … … … … 325
    15 .4   重复数不相等的单因子方差分析 … … … … … … … … … … … … … … 334
    15 .5   没有重复的两因子方差分析 … … … … … … … … … … … … … … … … 336
    15 .6   有重复的双因子方差分析 … … … … … … … … … … … … … … … … … 345
    15 .7   三因子方差分析 … … … … … … … … … … … … … … … … … … … … … 351
    15 .8   专题研究 … … … … … … … … … … … … … … … … … … … … … … … … 359
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 367
    习题 15 … … … … … … … … … … … … … … … … … … … … … … … … … … … 367
第 16 章   可靠性 … … … … … … … … … … … … … … … … … … … … … … … … … 371
    16畅 1   可靠性的概念 … … … … … … … … … … … … … … … … … … … … … … 371
    16畅 2   可靠度与故障率 … … … … … … … … … … … … … … … … … … … … … 372
    16畅 3   故障率的基本型 … … … … … … … … … … … … … … … … … … … … … 374
    16畅 4   指数分布的应用 … … … … … … … … … … … … … … … … … … … … … 378
    16畅 5   威布尔分布的应用 … … … … … … … … … … … … … … … … … … … … 382
    16畅 6   可靠性的模型 … … … … … … … … … … … … … … … … … … … … … … 388
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 391
    习题 16 … … … … … … … … … … … … … … … … … … … … … … … … … … … 391
第 17 章   数量化方法及学生成绩管理 … … … … … … … … … … … … … … … … 393
    17畅 1   数量化方法( Ⅰ ) … … … … … … … … … … … … … … … … … … … … … 393
    17畅 2   教学管理 … … … … … … … … … … … … … … … … … … … … … … … … 407
    17畅 3   专题研究 … … … … … … … … … … … … … … … … … … … … … … … … 412
    参考文献 … … … … … … … … … … … … … … … … … … … … … … … … … … … 416
    习题 17 … … … … … … … … … … … … … … … … … … … … … … … … … … … 417
附录   统计分布表 … … … … … … … … … … … … … … … … … … … … … … … … … 418
第 1 章   质量 管理 的基 本概 念

随着中国改革开放的逐步深入 ,人 们越来 越意 识到 质量管 理对 经济建 设的 保


证作用 . 在当今的世界里 ,中国的 经济 不能 孤立存 在 ,而出 口创 汇能 力 的大 小 ,在
很大程度上决定着中国对外开放的程度和 范围 ,影 响着 国内经 济建 设的规 模和 进
程 . 因此 ,必须根据国际市场的需要和中国的优势 ,积极发 展具有竞 争力 、见效快 、
效益高的出口产业和产品 ,大力提高 出口成 品的 质量 ,合理 安排 出口 产品的 结构 ,
多方位地开拓国际市场 ,以争取出口贸易较快地持续增长 ,从而推动中国经济建设
的快速发 展 . 当今 世界 ,经济 竞争 愈演 愈烈 ,其核 心是 质量 竞争 . 在国 内 ,随着 人
们生活水平的不断提高 ,人们的质量意识也不断增强 ,消费者对产品的质量提出了
许多新的要求 . 这就告诉我 们 ,要 多方 位开 拓国际 市场 ,发 展社 会主 义 市场 经济 ,
关键在于抓好质量目标管理 .
质量管理学是研究质量的产生 、形成和实现过程规律的知识体系 ,是一门实用
性很强的学科 ,其内容具有理论性和应用性相结合的特点 .
大学生学习本课程 ,可以比较系 统地掌 握质 量管理 的基 本理 念 、过程和 方法 ,
其中包括顾客满意的理念 、持续改进的哲学和方法 、全员参与的工作方式和基于过
程的方法 . 理解通过建立和改进质量体系 ,提高质量和劳动生产 率的思想 ,把握 质
量产生 、形成和实现的规律 ,掌握统计技术 在质 量管 理中的 应用 ,形 成市场 经济 条
件下质量管理的理念和框架 .
本章首先回顾质量管理历史 ,然后介绍质量 、管理 、统计质量管理等概念 .

1 .1   质量管理简史

质量管理的基础是统计学 ,20 世纪初英国统计学家 K .Pearso n 学 派不通过 母


体全体的观测 ,只通过许多样本的观测判 断出母体 的分 类状 态 . 20 年代英 国统 计
学家 R .A .Fish er 学派通过小样本对母体进行估 计和检 验 ,确 定了推 测统计 学 ,从
而奠定了 SQ C 的基础(即总和的质量管理 ) .
S QC 的创始人是 1924 年在贝尔电话实验室工作的 W .A .P h ew h ar t .他认为 ,
在同样条件下制造的产品具有 不同 的质量 特征 性值 ,对此 应当 进行 管 理 . 为加 强
质量特征值的分布管 理 ,Sh e whar t 提 出了 管理 图 法( co n tr ol ch ar t m et ho d) ,用 统
计方法解决了生产中的问题 .1931 年出版的 他的著 作中第一 次用到了 Q C(quali唱
t y con t r ol)这个词 .
· 2 · 第 1 章   质量管理的基本概念

到了 1928 年 ,H .F .Do dg e 以及 H .F .Do dg e 和 H .G .Ro mig (1929 年)发表了


抽样调查(sam pli ng in spection) 理论 ,对 S QC 做出了划时 代的贡献 . 1941 年出 版
的 Dod ge唱 Ro mig 的 抽样调查 表至今 被广泛使 用 . She w ha r t 和 Dod y Romig 是 统
计质量管理的奠基人 .1939 年第二次世界大战 爆发 而需要 大量 的军 需物资 ,为 此
美国政府做出了产品质量管理的努力促使用统计方法的质量 管理进入 轨道 . 1941
年美陆军部根据 A S A ( Am erican St anda rds A ssociation)公布了 She w ha rt 的管 理
图法 ,并在军需产业制定和使用了美国战时规格 .
1946 年成立的美国 质 量 管理 学 会 ,为 美 国 企 业 的质 量 管 理 做 出了 巨 大 的 贡
献 .1950 年美国防部制定的抽样检查方 法之 一的 M IL唱S T D唱105 A ,发展到 现在 成
为 M IL唱S T D唱105 D . 目前在世界上仍广泛地使用着 1957 年制定的 M I唱S T D唱414 .
英国的统计质量管理是从 20 世纪 30 年代 开始的 . 首先在 1933 年发表了 E .
S .Pearso n 的论文 “ 统 计 手 法 在 质 量 管 理 及 标 准 化 中 的 应 用 ” ,接 着 发 表 了 许 多
S QC 论文 . 英国在第二次世界大战中同美国一样在军用产业中广泛采用质量管理
规划 .
质量管理方法从美国 、英国 发展到 欧洲 许多国 家 以及 加拿 大等 国 . 特 别在 欧
洲成立了欧洲质量管理机构 ,为普及 QC 起了指导作用 .
日本的质量管理是与美国学者 Demin g 和 Jura n 的帮助分不 开的 . 在 1950 ~
1953 年期间 ,这两位学 者 多 次 访 问日 本 ,通 过 S Q C 的讲 习 在 日 本 产业 界 普 及 了
Q C . 为了纪念 1951 年以来 De min g 的业绩 ,日本设立了“Demin g 奖” ,对普及和实
现 Q C 做出杰出贡献的个人和 公司 授 予此 奖 . 到了 20 世 纪 60 年代 ,发展 到全 社
会的质量管理( T QC)(即企业全体人员都参加质量管理) . 日本的规格协会和日 本
科学技术联盟为普及 、深化质量管理起了主导作用 .
质量管理在历史的不同变革时期根据 当时 的时 代一起 形成 质量管 理运 动 ,为
产品质量的提高起了重大作用 . 下面介绍几个典型运动 .
统计的质量管理 :美国贝 尔电 话实 验室 的 W .A .Sh e wh ar t 在 1924 年 提出 的
管理图法报告书及 Dod ge 和 Ro mig 的样本调查 开始的 以统计 方法 为基础 的质 量
管理运动 .
综合质量管理 :从 1950 年 开 始 F eignba u m 提 出的 企业 全 体 人员 若 不参 加 就
不能实现质量管理的认识 ,从 而开 始这个 运动 . 这 个运动 认为 产品 受 企业 全部 活
动的影响 ,故质量 管 理应 包 括 设 计管 理 、资 料管 理 及 售 后 服务 管 理 (af ter ser vice
co nt r ol) .
可靠性 :此运动是第二次世界大战 期间美 国为 延长 军事中 使用 的电子 装备 寿
命而发展的 . 这个运动的特点是特别重视复杂的电子制品在 设计阶段 出现的质 量
问题 .1950 年 美 国 国 防 部 建 立 了 电 子 装 备 可 靠 性 咨 询 委 员 会 ,1957 年 发 表 的
A GR EE 报告书为可靠性运动做出了贡献 .
1 .2   质量与管理 · 3 ·

产品保证 :20 世纪 60 年代 初产 生 了消 费者 第一 、一切 为消 费者 的意 识 ,当 消


费者受害时追究生产者的责任 ,这就是产品保证运动 ,这里强调了维护能力 ( main唱
tain a bility) ,可靠性 、各种质量保证运动 .
无缺陷 :此运动 是 从 生 产产 品 时 消 灭 缺 陷 的精 神 动 机 出 发 的 . 1962 年 美 国
M ar tin唱M arietta 率先开始 . 这个运动强调在生产过程中每个企业人员连续作业也
可以达到无缺陷的目的 ,每个职员为此目的在精神上做不断努力 .
社会的质量管理 :20 世纪 70 年 代开 始大 量 发现 许多 产品 造成 了 公害 和社 会
安全问题 . 从此重视了产品对社会的影响 及企业本 身的社会 责任 . 所以这 个运 动
是充分考虑了产品的社会影响 ,建立了产品责任( P L)的对策 .

1 .2   质量与管理

质量的概念可分为如下三个方面 :
(1) 设计质量(qualit y o f desig n)
设计质量指的是为生产产品而规定的 产品 规格 、性 能以及 外观 等表示 质量 规
格的概念 . 确定设计质量时 考虑到 消费 者要求 的质 量( 也叫 做市 场质 量) ,本企 业
的工程能力 、技术水平 、产品的经济性等 ,这也叫目标质量 .
(2) 制造质量(qualit y o f co n fo r ma nce)
也叫适合质量 ,表示生产过 程中制 造的 产品适 应 设计 质量 的程 度 . 生 产同 样
的产品在制造过程中会产生质 量区 别 ,从 而发 生质 量的分 布 . 工厂 所 说的 提高 质
量指的是制造质量 ,在精神上和经济上 可能范 围内 与设 计质量 保持 一致的 一种 制
造领域的产品质量管理活动 .
(3) 服务质量(qualit y o f ser vice)
产品具有较好的质量 ,这是必需的 . 但重要的是消费者学会 正确使用 产品 ,并
在出现故障或使用中发生困难 时得 到保修 ,才 能使 消费者 对产 品感 兴 趣 . 服务 质
量指的是能够使消费者正确使用产品的有效措施及产品中出现问题时得到的必要
帮助 .
质量管理领域的权威 J uran 说质量就是 “使用适合性 ”( fit ness fo r use) . 要 满
足为消费者设计和制造 ,同时服务质量也要提高 ,因此使用适合性包含上述的三个
质量定义 .
确定产品特性的要素或评价一个产品时的指标要素叫做质 量特性 . 质量特 性
是衡量产品有用性的尺度 ,如化学药 品的纯 度 、金属 材料 的强度 、产品尺 寸 、性能 、
寿命等 . 确定产品特性的值 ,简称特性值 . 产 品质量管 理中使 用的数 据 、资 料一 般
指的就是质量特性 .
质量管理中的管理 (co n tr ol) 一 词包 含英 语中 manag emen t 和 co nt r ol 两种 意
· 4 · 第 1 章   质量管理的基本概念

思.
质量管理中管理的含义随着时代的变化内容也不同 . 过 去强调了 控制质量 的
co nt r ol 含义 ,近来强调 的是 以 控制 质 量 计划 、组织 活 动为 重 点的 manag eme nt 含
义 . Jur an 在自己的著作中说“ 管理就是指确定标准并未达到这个标准而进行的 各
种社会 活动 ” . Demin g 把 管理 的 机 能 表 为图 1 .1 ,并叫 做 Demin g 循 环 ( Dem nig
cycle) . Dem nig 循环是以质量为重心 、以对质量的责任感为基础 ,经过设计计划 阶
段 、制造阶段 、产品的检验和出售的检讨阶 段 ,最后 达到 消费者 对产 品的意 见的 调
查阶段 . 通过调查和为消费者服务结果 ,进行再设计 ,改变 制造方法 ,改善 检查 、出
售方法 . 不断进行这种循环 ,形成了不断的管理活动 .

图 1 .1   Demin g 循环 图 1 .2   管理循环

    De m nig 循环概念可简 记为 计划 — 实施 — 检 查 — 措施 ,如 图 1 .2 所 示 ,称它 为


管理循环(co n tr ol cycle) ,简记成 P DC A .
管理循环的要素是 :
(1) 确定为达到目的而必需的计划( 或标准) ;
(2) 按计划实施 ;
(3) 评价实施结果 ;
(4) 评价结果与原计划若有差距 ,则进行必要的修正措施 .
在这里重要的部分是集体决定对产品 特性 值的 分析 、评价 所进 行的统 计质 量
管理活动 .

1 .3   质量管理和统计质量管理

为了保持和维持消费者所要求的质量 ,企业设立质量目标 ,合理而经济地达到


此目的所进行的一切活动的体系叫做质量管理 .
为了保持和维持消费者所要求的质量 ,企业设立质量目标 ,合理而经济地达到
此目的所进行的一切应用统计手法的活动体系叫做统计的质量 管理 . 统计的质 量
管理是质量管理的核心 .
1 .5   统计质量管理活动体系和统计方法的应用 · 5 ·

下面再看国际上的权威人士是如何定义质量管理的 .
J .M .Jura n :所谓质量管理指的是能确定 质量特性 并与标准 作比 较 ,对 生产 的
差异采取措施的控制体系 .
W .E .Demin g :统计的质量管理 指的 是为最 经济 地生 产出 最有 用 最富 有市 场
性的产品 ,在生产的全过程中用统计手法 .
A . V . Feig enbau m :全面质量管理指的是为最经济地生产出消费 者满意的 产
品 ,调整统一在社会内各部门努力进行 质量 开发 、维 持质量 、提 高质 量的有 效活 动
体系 .
显然上述定义之间有所差别 . Demin g 的 SQ C 是最基本的质量管理活动 . Ju唱
r an 的 Q C 是较宽的意义上设立质量标准 ,为达到这个标准所进 行的控制 活动 . 而
Feigenbau m 的 T Q C 是一个最广泛意义上通过经营全过程实施质量管理的组织体
系.
质量管理的意义 有 如 此 的 差别 ,但 近 几年 来 比 较 普 遍 的 是 在 经 营 手 段 上 用
T Q C 的思考方式 ,而具体实施方案上用 S Q C 的思考方式 . 在欧洲常用 I QC(int er唱
ated quality con tr ol)代替 T Q C ,在日 本一 般用 “ 综 合质 量管 理” 或 “ 全 社的 质量 管
理” .

1 .4   统计质量管理的范围

正如前面的定义 ,统计质量管理指 的是为 达到 质量 管理所 使用 的一切 统计 手


法的活动体系 . 随着 质 量管 理 的 概念 在 不同 时 期的 变 化而 其 含 义也 逐 渐广 泛 起
来.
S QC 的发展初 期多用管理图法 和样本检验法 ,而目前在 实验室和研究部 门多
用检验 、估计 、相关 、回归分析 、方差分析 、实验设计等 . 在产品的 设计 、质量保证 等
范围内主要用到可靠性 . S QC 本身 几乎 包括 所 有统 计方 法 ,反 应表 面分 析 ,Ev op
法(e volu tion ar y o pe ration) ,混合物实验数据分析也包括在其中 .

1 .5   统计质量管理活动体系和统计方法的应用

在图 1 .3 中图示了质量管理 活动体 系 . 显然 ,质 量管 理活 动与 企 业内 部一 切
组织有联系 . 现在考虑这些活动中用到哪些统计手法及其必要性 .
在市场质量调查中 ,最重要的是抽样调查方法 ,以及对得到的数据进行确切的
解析方法(即检验 、估计等) .
在研究和开发中进行实验室研究 、新产 品开 发研究 ,这 时多 用到 实验设 计法 、
方差分析 、回归分析 .
· 6 · 第 1 章   质量管理的基本概念

图 1 .3   质量管理活动体系

质量设计 中 常 用 的 是 可 靠 性 (r eliability ) 、工 程 能 力 指 数 ( CP ) 、公 差 ( t oler唱


ance)等 . 没有这些定量数据 ,就不可能有具体的质量设计 .
标准质量表示产品的质量目标 ,确 定了 它就确 定了 标准 作业 ,即技 术标 准 、作
业标准 、检验标准和管理标准 .
在标准确定的前提下制造时不断检查 是否 合乎 标准 ,用管 理图 法及各 种统 计
手法进行工程分析 ,从而修改标准 ,达到提高质量的目的 .
在检查阶段通过抽样检查评价 质量 ,必 要时修 改 质量 标准 . 抽 样 调查 是通 过
样本得到全体母体的质量情报 ,常用到统计检验 、估计等 .
从上述的结果可以看到一切质量管理 活动 中都 要用到 统计 方法 ,没有 它就 不
可能得到满意的效果 . 在质量管理活动中 始终以事 实为根据 . 所 谓事实就 是数 据
(data) . 收集数据 、分析 、解释都是统计活动 ,故 S Q C 方 法是质 量管 理活动 的核 心
要素 .
1 .6   全面质量管理( T Q M ) · 7 ·

1 .6   全面质量管理(T Q M)

20 世纪 60 年代开始 ,科学技术的发展突飞 猛进 ,人造卫 星 、第三代集 成电路 、


电子计算机相继出现 ,并相应出现了 强调全 面观 点的系 统科 学 ;在国 际贸易 方面 ,
二次大战后美国的独霸 优势 逐渐 减退 ,国际 贸易 竞争 加 剧 ,时 代 急需 提 高商 品 质
量 ;这些因素促成了全面质量管理( T Q M) 的诞生 . 提 出 T Q M 的代 表人物 是美 国
的费根堡姆( A .V .Feige nba u m)与朱兰( J .M .Juran)等 ,全面质量管理就 是“ 三全”
管理 . 什么是“ 三全” ?
(1) 全面的质量 ,即不限于产品质量 ,而且包括工作质量 .
(2) 全过程 ,即不限于生产过程 ,而且包括调研 、设计 、产 品售后等 质量环节 的
全过程 .
(3) 全员参加 ,即不限于领导 和管 理干 部 ,而 是全 体工 作人 员都 要 参加 ,为 质
量第一 ,人人有责 .
实质上 ,上述“ 三全”就是 系统科 学全 面观点 的反 映 . 故专 家学 者 称全 面质 量
管理为质量系统过程 .
全面质量管理的主要理论是 :
(1) 质量保证理论
朱兰指出 ,质量保证就是对产品的质量实行担保和保 证 . 在 卖方市场 条件下 ,
不可能存在真正意义上的质量保证 ,在买方市场形成初期 ,质量保证也只停留在产
品质量的“三包”(即包退 、包 修 、包换 ) ,用户 得到的 补偿 还很有 限 . 在 成熟 的买 方
市场条件下 ,质量保证的内容和范围发生了质的变化 ,质量保证已从传统的只限于
流通领域的范围扩展到生产经营的全过程 ,供 方向 需方 提供的 不仅 是产品 和服 务
本身的信誉 ,而且能够保证长期 、稳定生产 、满足需方全面质量要求的质量体系 .
(2) 质量改进理论
质量改进是质量体系运动的驱动力 ,是实施质量保证的有力手段 ,日本的田口
玄一在七八十年代提出质量损失概念和三次设计理论正是质量改进理论的一个重
要内容 .
(3) 产品质量责任理论
为了制止企业和个体经营者的不正当竞争行为 ,减少质量事故的发生 ,保护消
费者利益 ,进行质量监 督和 制 定相 应的 质量 法规 是 十分 必要 的 . 国 外 20 世纪 80
年代兴起的产品责任理论属于这方面 .
(4) 质量经济学
这是 20 世纪 80 年代兴起的新的 质量 学科 . 从 宏 观上 看 ,质量 经 济学 研究 质
量形成的经济规律 ,分析价格 、税收等经济 杠杆 对促 进产品 质量 的提高 ,对 实施 质
· 8 · 第 1 章   质量管理的基本概念

量政策的经济评价等 . 德国的冯 · 考拉尼( Elat t V o n Colla ni)就是代表人物 .


质量经济学的研究虽已取得相当大的 成果 ,但 作为 一门完 整的 学科尚 有待 进
一步完善和开拓 .
(5) 质量文化
质量文化是指企业在生 产经 营 活动 中 所形 成 的 质量 意 识 、质 量精 神 、质 量 行
为 、质量价值观和质量对象以 及企 业所提 供的 产品 或服务 质量 等的 总 和 . 企业 质
量文化是企业文化的核心 ,而 企业 文化又 是社 会文 化的重 要组 成部 分 . 企 业质 量
文化的形成和发展反映了企业文化及社会文化的成熟程度 .
(6) 质量管理和电子计算机的结合
近年来 ,国外发展出 一种 应用 电 子计 算机 的集 成制 造 系 统 (CIM C) 把一 个 企
业市场调研 、确定产量 、制造 、运输 、销售等各个环节全部用电子计算机进行控制和
优化 ,并且第一个试验性工厂 已在 美国获 得成 功 . 这里需 要解 决的 是 质量 控制 与
自动控制如何结合的问题 .
(7) 质量控制理论
传统的休哈特质量控制理论对于生产用车只能显示异常而不能指出异常方式
在何处 ,换言之 ,不能进行诊断 .20 世纪 80 年代提出质量诊断概念和理论 .
(8) 质量检验理论
随着生产过程的自动化和自动检验技 术的 广泛 应用 ,检验 环节 的集成 化程 度
明显提高 . 自动生产 、自动检验 、自动判断以及自动反馈可以 在很短时 间内一气 呵
成 ,具有很高的时效性 ,大大简化 了管 理工 作 . 此 外 ,许多 发达 国家 在 生产 过程 中
还推行无检验方式 ,在这方 面 ,统计过 程控 制( S PC)的 贯彻 、销 售服 务 的完 善和 工
人自主管理活动的推广提供了可靠保证 .
第 2 章   数据 的初 步整 理方 法

在质量管理过程中不能直接来判断问 题 ,而是 通过 合理的 方法 得到代 表实 际


的客观数据 ,并通过统计方法进行整理 ,用得到的信息来判断问题 .
本章将介绍母体和样本 、数 据的 分类 、统计 量等 概念 ,最后 介绍 7 种 Q C 基 本
方法 .

2 .1   母体和样本

无论怎样的数据 ,都有自己的集团 ,我们称这个集团的全体 为母体或 总体 . 一


般地 ,母体是较大的 ,故对母体的每一个单 元进 行逐 个检查 是不 可能的 ,所 以我 们
不观察母体全体 ,而从母体中抽出代表母体的样本( sa m ple)或试料进行观测 .
统计的质量管理就是从我们所研究的对 象( 即母 体 )中 抽出 样本 ,通过 观测 得
到数据 ,在对数据进行整理 、分析后 ,获 得对 母体的 信息 ,最 后对 信息进 行检 验 ,并
根据检验结果采取必要的措施(如图 2 .1) .

图 2 .1   解决质量问题的循环

母体按所含有的基本单元的个 数 ,可分 为无限 母 体和 有限 母体 . 一个 工程 制


造的能力 ,在某种意义上是有限的 ,但从无 限地 生产 产品这 一点 上讲 ,一般 地把 这
个工程看成是无限总体 . 例 如 ,从北京 市人 口中 抽样 1000 人进 行身 体 检查 ,这 时
· 10 · 第 2 章   数据的初步整理方法

北京市人口全体为总体 ,抽样 1000 个人是样本 ,样本大小是 1000 .

2 .2   数据的分类
一 、 按使用目的分类

    收集数据时要明确使用的目的 . 在统计的质量管理中使 用的数据 按使用目 的


可作如下分类 :
(1) 以了解现象为目的的数据
在质量管理活动中带着问题了 解现 象 ,找出和 明 确问 题是 重要 的 . 有 目的 地
整理出过去和现在的数据 .
(2) 以统计解析为目的的数据
为了改善或维持质量特性 ,有必要 系统地 了解 与质 量特性 有关 的因子 之间 的
因果关系 ,这就是以统计解析活动为目的所收集的数据 .
(3) 以检验为目的的数据
为判定产品的好坏 、合格与不合格而收集的数据 .
(4) 以管理为目的的数据
测定工程的主要质量特性 ,判断工程是否有问题 ,为工程的正常进行而采取措
施为目的所收集的数据 .
(5) 以记录为目的的数据
根据今后的需要 ,认为重要的数据进行收集 、整理 ,为此目的所收集的数据 .

二 、 按尺度的分类

为客观地确定质量特性 ,要定出基 本尺 度 ,并用 数量表 达 ,表示 质量特 征的 数


据以尺度构成的方法可分为 :
(1) 计量值
长度 、重量 、压力等连续的量可以 表示 质量 特征 . 即使 不是 连续 的量 ,如学 生
的成绩 、人的体重等离散数据也可认为是计量值 .
(2) 计数值
不合格品数 、缺陷数等以个数计数的质 量特性 的值 . 一 般用 0 ,1 ,2 ,… 等零 和
正整数表达 . 此外优劣数据 、顺序数据等也认为是计数值 .

2 .3   经 验 分 布
一 、 总体分布

    在生产过程中尽管在同样的条件下生产产品 ,但它的质量特性依然存在散布 .
2 .3   经验分布 · 11 ·

以标准化进行管理 ,统一原材料的质量 、作业方法 、使用机器的条件 ,严格管理使用


仪器 ,可以缩小散布 ,但不可能完全消灭散布 .
产生散布的原因很多 ,主要有以下几种 :

1 . 偶然原因

(1) 确定了原材料和设备的特性 ,但一定范围内有变动 .


(2) 仪器的精度及使用中产生的误差 .
(3) 确定了作业标准 ,但在许可范围内有变动 .

2 . 必然原因

(1) 事先没有准备标准而无法统一作业内容所造成的变化 .
(2) 作业者不按标准作业而发生的变动 .
(3) 设备不良或有故障而造成的变动 .
(4) 作业过程中有错误而造成的变动 .
上述两种原因中必然原因是可以克服的 ,而偶然原因是无法克服的 .
想获得总体的信息 ,首先要了解总体分布的类型 、中心位置及散布 ,因此 ,首先
了解能反映总体分布形态的经验分布 .

二 、 经验分布表

经验分布表指的是按照一定的准则对 数据 大小 的范围 划分 成许多 小区 间 ,然


后把数据按照小区间进行分类 .如表 2 .2 .
例 2 .1   某灯泡工厂为 了检验产品的寿 命 ,抽出 了 40 W(110 V) 的灯泡 64 个 ,
如表 2 .1 所示 .
表 2 .1   灯泡寿命数据
1310 1262 1234 1104 1105 1234 1204 1103
944 1343 932 1055 1303 1185 759 1404
1248 1324 1000 984 1381 816 1067 1252
数 1093 1358 1024 1240 1220 972 1022 956
据 1690 1302 1233 1331 1157 1415 1385 824
1229 1079 1176 1173 1109 827 1209 1202
609 985 1233 985 769 905 1490 918
1028 1122 872 826 985 1075 1240 985
各列数中
1690 1358 1234 1331 1381 1415 1490 1404
最 大 值
各列数中
609 985 872 826 769 816 759 824
最 小 值
· 12 · 第 2 章   数据的初步整理方法

    从表 2 .1 中看到最大值为 1690 ,最 小值 为 609 ,这些数 据是 原始数 据 ,故未 经


过整理的数据不能给出有用的信息 .
从表 2 .1 中要了解的是 :
(1) 生产灯泡的工程( 这是无穷总体)中 ,寿命的特性分布是什么 ?
(2) 平均寿命是多少 ,散布程度如何 ?
(3) 灯泡的寿命是否达到了工厂制定的标准规格 ,不合格率有多少 ?
对上述的问题 ,通过表 2 .1 的数据 ,大体上通过如下 3 步可以得到解决 :
第 1 步 ,制作频数分布表 .
第 2 步 ,求样本数据的均值与方差 .
第 3 步 ,检查样本数据是否合乎标 准规 格 .数一 数不合 格品 ,从 而估计 出不 合
格率 .
先制作频数分布表 .从表 2 .1 中看到 最大 值为 1690 ,最 小值 为 609 ,样 本容 量
为 64 ,故划分为 8 个区间 ,每个区间长 度为 136 .在这 8 个等距 离区 间中数 一数 含
有多少个样本值 ,把这些列在表 2 .2 中 .

表 2 .2   灯泡寿命数据的频数表

区间号 区间范围 中值 频数 频数分布率

1 605 .5 ~ 741 .5 673 .5 1 1 .6 %


2 741 .5 ~ 877 .5 809 .5 7 10 .9 %
3 877 .5 ~ 1013 .5 945 .5 12 18 .7 %
4 1013 .5 ~ 1149 .5 1081 .5 13 20 .3 %
5 1149 .5 ~ 1285 .5 1217 .5 18 28 .1 %
6 1285 .5 ~ 1421 .5 1353 .5 11 17 .2 %
7 1421 .5 ~ 1557 .5 1489 .5 1 1 .6 %
8 1557 .5 ~ 1693 .5 1625 .5 1 1 .6 %

用表 2 .2 的数据 ,画成频数分布图( 图 2 .2) .


若规定寿命规格为 800 ~ 1400 小时 ,则包 含在 这个 规格的 数据 为 43 个 ,还 有
2 2
18 个数据以 的程度包含 在这个 规格 内 ,故大 约 有 43 + × 18 = 55 个数 据含 在
3 3
规格内 ,占全体数据的百分比为
55
× 100 % = 86 % .
64

三 、 经验分布表的制作技巧

画频数分布图时 ,如果不合理选取区间长度 ,就会失去实际应用价值 .


2 .3   经验分布 · 13 ·

图 2 .2   灯泡寿命数据频数分布图

选取区间长度没有统一的标准 ,但一般按大小顺序制作较好 .
(1) 数一数数据总数 ,记为 n ,n = 64 .
(2) 求数据的最大值与最小值 .
xm a x = 1690 ,  xm in = 609 .
    (3) 确定数据的最小单位 ,最小单位为 1 .
(4) 求最大值和最小值之间存在的可能的最大数 :
范围 1081
+ 1 = + 1 = 1082 .
数据的最小单位 1
    (5) 确定区间个数 .一般按下述方法做 :

数据数 区间个数

1 ~ 100 5~ 9
100 ~ 200 8 ~ 12
200 以上 10 ~ 16

前面例中 n = 64 ,故取了 8 个区间 .


(6) 包含在一个区间上的数据的最大个数 :
可能的数据的最大数 1082
= = 135 .3 ≈ 136 ,
区间数 8
这里若计算结果不是整数时加 1 取整得整数 .
· 14 · 第 2 章   数据的初步整理方法

    (7) 求区间长度 :
区间长度 = (数据的最小单位) × (包含在一个区间上的数据的最大个数)
= 1 × 136 = 136 .
    (8) 备好频数 分布 表 用 纸 ,如 表 2 .2 那 样能 记 录 区间 号 、区 间 范围 、中值 、计
数 、频数 、频率的专用纸 .
(9) 确定区间 ,记录在这个纸上 ,第一个区间的左端点值用如下公式计算 :

左端点值 = xm a x - [(区间个数) × ( 包含在一个区间上的数据的最大个数)

  - ( 可能的数据的最大值)] × (数据的最小单位值)

= 609 - (8 × 136 - 1082) × 1

= 609 - 3 = 606 .
    若左端点数据不是数据最小单位的 1/2 ,则用如下公式计算 :

左端点值 = 609 - × (数据的最小单位值)

= 606 - 0 .5 = 605 .5 .
然后用区间长度 136 去分别定出
605 .5 ~ 741 .5 ,741 .5 ~ 877 .5 ,… , 1557 .5 ~ 1697 .5
等区间 .
(10) 区间中值用如下公式计算 :
中值( 珟x i ) = 区间端点值和 /2 .
    (11) 计算频数 ,并记在用纸上 .
(12) 计算频率 ,并记在用纸上 .
频率 = (频数 / n) × 100 % .

四 、 分布图

用经验分布图不但能看到数据的分布状况 ,而且能了解总体分布 ,在产品质量


规格已确定的情形下 ,图 2 .2 与质量规格直接对比 ,通过图 2 .3 可以大体了解总体
的分布曲线 ,通过图 2 .4 可以对比了解质量规格与总体分布之间的拟合程度 .

五 、 累计频数

了解某质量特性范围内的数据个数时用到累计频数 ,到第 k 个区间端点为止 ,


fi fi
k
钞 i= 1
这里频数为 f i , 相 对频 数 为 , 累计 频 数 = 钞 f i . 累 计 相对 频 数 =
k
×
n n
i= 1

100 % .
对表 2 .2 ,求相对频数 、累计频数 、累计相对频数 ,列为表 2 .3 .
2 .3   经验分布 · 15 ·

图 2 .3   某总体的分布曲线

图 2 .4   规格和总体分布曲线
· 16 · 第 2 章   数据的初步整理方法

表 2 .3   累计频数分布表

区间序号 区间范围 中值 频数 相对频数 累计频数 累计相对频数


1 605 .5 ~ 741 .5 673 .5 1 0 .016 1 0 .016
2 741 .5 ~ 877 .5 809 .5 7 0 .109 8 0 .125
3 877 .5 ~ 1013 .5 945 .5 12 0 .187 20 0 .312
4 1013 .5 ~ 1149 .5 1081 .5 13 0 .203 33 0 .515
5 1149 .5 ~ 1285 .5 1217 .5 18 0 .281 51 0 .796
6 1285 .5 ~ 1421 .5 1353 .5 11 0 .172 62 0 .968
7 1421 .5 ~ 1557 .5 1489 .5 1 0 .016 63 0 .984
8 1557 .5 ~ 1693 .5 1625 .5 1 0 .016 64 1 .000
合计 64 1 .000 64 1 .000

称表 2 .3 为累计频数分布表 .制作 好这个 表就 很容 易了解 含在 某质量 特性 内


的数据个数 .如 灯 泡寿 命在 1013 .5 以内 的 有 20 个 ,占全 体的 31 .2 % ,在 1285 .5
以上的有 64 - 51 = 13 个 ,占全体的 1 - 0 .796 = 0 .204 ,即 20 .4 % .
图 2 .2 是频数直方图 .有时也可用频数多角形来表示频数的大小 ,求各区间的
中值 ,然后把频数坐标连起来 ,如图 2 .5 . 要 注意的 是第 一个区 间的 左侧和 最后 一
个区间的右侧作出频数为 0 的区间 ,使 整个 图形与 横轴 相接 .求 各区间 的中 值 ,然
后把累计频数坐标连起来 ,得到图 2 .6 ,我们称它为累计频数曲线 .
图 2 .5 中的纵坐标轴换为相对频数 ,得相对频数多角形 .
图 2 .6 中的纵坐标轴换为累计相对频数 ,得累计相对频数多角形 .

图 2 .5   灯泡寿命数据的频数多角形
2 .4   均值和散布 · 17 ·

图 2 .6   灯泡寿命数据的累计频数多角形

2 .4   均值和散布

从总体中得到的信息除了总体 的分 布曲线 ,还 有 均值 和散 布 . 总 体的 中心 位
置由表达中心倾向的测度而获得 ,散布由散布测度而获得 .

一 、 中心倾向的测度

估计总体分布的均值 μ 的方法有以下几方面 :
(1) 样本平均
从 n 个样本中得到的样本平均
n
( x1 + x2 + … + xn ) xi
珚x = = 钞 .
n i= 1 n
    (2) 几何平均 G
几何平均是指从 n 个正数据用公式
G = ( x1 · x2 · … · xn ) n

得到 .
(3) 中值( media n) 珟x
把 n 个数据按顺序大小排列 ,当 n 为奇数时取中间位置的数定为中值 ,当 n 为
偶数时取中间位置的两个数的平均值定 为中值 .它 的优 点是 直观 、简单 ,个 别数 据
特大时不受它的影响 ,但只用中 间的 值 ,故不 能得 到全 体数 据 给出 的信 息 ,n 很 大
时使用也不方便 .
· 18 · 第 2 章   数据的初步整理方法

(4) 范围的中值( min唱ran g e) M


xm a x + x m in
M = .

    此方法比用中值简单 ,但只用两个数 ,故效率低 ,特别对极端的数据过于敏感 ,
因此分布为偏态时最好不用它 .
例 2 .2   根据如下 8 个数据 ,计算 上述 4 个中 心倾 向 的测 度值 :3 ,9 ,6 ,15 ,5 ,
3 ,5 ,5 .
解   算术平均
xi

钞 i= 1 3 + 9 + 6 + 15 + 5 + 3 + 5 + 5
珚x = = = 6 .375 ,
b 8
    几何平均
G = (3 · 9 · 6 · 15 · 5 · 3 · 5 · 5) 8 = 5 .558 .

    为了求中值 ,把 上述数按 大小排 列为 3 ,3 ,5 ,5 ,5 ,6 ,9 ,15 ,故 珚x 值 是第 4 个 和


第 5 个数据的平均值 ,即
5 + 5
珚x = = 5.

求范围的中值时 ,因 xm a x 15 ,xm in = 3 ,故
15 + 3
M = = 9.

    (5) 样本中位数
样本中位数是常见的统计量 ,设 x( 1 ) ,… ,x( n) 是 有序 样本 ,则 样 本中 位数 m0 .5
定义为
x n+ 1

,            n 为奇数 ,
m0 .5 = 1
x n

+ x n+ 1

,  n 为偶数 .


例如 ,n = 5 ,则 m0 .5 = x ( 3 ) ,若 n = 6 ,则 m0 .5 = ( x( 3 ) + x( 4 ) ) .

(6) 样本 p 位数 m p
可定义
x( [ n p + 1 ] ) ,          若 np 不是整数 ,
mp = 1
( x( n p ) + x( n p + 1 ) ) ,  若 n p 是整数 .

    例如 ,n = 10 ,p = 0 .35 ,则 m0 .3 5 = x( 4 ) ,若 n = 20 ,p = 0 .45 ,则

m0 .4 5 = 1 ( x( 9 ) + x( 1 0 ) ) .

2 .4   均值和散布 · 19 ·

可以证明 ,设总体密度函数为 f( x) ,x p 为其 p 位数 , f ( x) 在 x p 处连 续 ,且 p( x p )
> 0 ,则当 n → + ∞ 时 ,样本 p 位数 m p 渐近分布为
p(1 - p)
mp ~ N x p , ,
n · p2 ( x p )
特别

m0 .5 ~ N x0 .5 , .
4 n · p2 ( x0 .5 )

二 、 散布的测度

为了解数据分散程度 ,常用以下几个统计量 :
(1) 样本平方和 S( su m of squar es)
n

S = 钞 ( x - 珚x )2 .
i= 1

常用的公式为
n
n
钞 xi n

S = x - x i - CT ,
2 i= 1 2
钞 i = 钞
i= 1 n i= 1

其中
n
xi

CT = 钞 i= 1
= n( 珚x)2 ,
n
称 C T 为修正项( co rr ectio n ter m ) .
证明 :

S= 钞 i
( xi - 珚x)2 = 钞 i
x 2i - 2 钞 x i 珚x + n(珚x )2
i

xi xi

= 钞 x - 2

i
钞 xi 钞 i
+ n 钞 i

i i n n

x i) xi )
2 2
2( 钞 ( 钞
x - 2 i i
= 钞 i +
i n n

( 钞 x i )2
x - 2 i
= 钞 i .
i n
    (2) 无偏样本方差
S S
V = = ,  矱 = n - 1 . (2 .1)
n - 1 矱
    有时用 S/ n 定义样本方差 ,但这 不是 母体 方差 σ2 的无 偏估 计 ,故常用 无偏 样
· 20 · 第 2 章   数据的初步整理方法

s s
本方差 ,但 n 很大时 与 差别不大 .
n n-1
(3) 样本标准差
n

S 钞 i= 1
( xi - 珚x)2
s = V = = , (2 .2)
n - 1 n- 1
其中 s ≥ 0 ,单位与数据的单位一致 ,但 V ≥ 0 ,单位是数据单位的平方 .
(4) 范围( ran g e)
R = xm a x - xm i n .
    (5) 变异系数( coefficie nt of v ariatio n)
S
VC = × 100 %
x
    上述 散布 的测度 ,如 果单 位( m m ,cm ,m ) 不同 ,即 使是同 样的 数据 ,散 布也 不
相同 . 因此对不同的单 位很 难作 比 较 . 故 用变 异 系 数比 较 好 . 这 时 ,即 使单 位 不
同 ,只要数据相同则得到相同的散布测度 .
例 2 .3   求 上 述 5 个 统 计 量的 散 布测 度 值 . 数 据 :3 ,9 ,6 ,15 ,5 ,3 ,5 ,5( 单 位
cm) .
解 

xi )

( 钞
S= 钞 x -

i
n
(3 + 9 + … + 5)2
= 32 + 9 2 + 62 + … + 52 -

(51)2
= 435 - = 109 .875 ,

S 109 .875
V= = = 15 .696 ,
n - 1 7
S= V = 15 .696 = 3 .962 ,
R = xm a x - x m in = 15 - 3 = 12 ,

Vc = s × 100 % = 3 .962 × 100 % = 62 .149 % .


珚x 6 .375
若把单位换成 m m ,则数据为 30 ,90 ,60 ,… ,50 mm ,这时
S = 10987 .5 ,
V = 1569 .6 ,
s = 39 .62 ,
R = 120 ,
V c = 62 .149 % .
2 .5   按区间划分的数据的统计 · 21 ·

    故数据增大了 ,但变异系数没有变 .

三 、 数值变换

为了计算上方便 ,常进行数值变换 .
对原观测值 xi 进行变换 ,
X i = ( xi - x0 ) × h , (2 .3)
其中 ,x0 为 x i ( i = 1 ,2 ,… ,n)的近似平均 ,h 是为计算方便给出的系数 .

珡X = ( 珚x - x0 ) × h ,  珚x = x0 + X
珡 ,
h
1 1
Sx = 2 S X ,  V x = VX ,
h h2
其中 S x ,S X ,V x ,V X 分别为关于 x i 及 x i 的平方和方差 .
例 2 .4   设有数据 100 .17 ,100 .18 ,100 .17 ,100 .19 ,100 .18 ,利 用适当 的数 据
变换计算 珚x ,Sx ,V x .
解   取 x0 = 100 .17 ,h = 100 ,则 X i = ( xi - 100 .17) × 100 ,得 X i 各值 0 ,1 ,0 ,
2 ,1 .
于是

珡X i = = 0 .8 ,

( 钞 x i )2
SX = x -

钞 i
n
2 2 42 2 2 2
  = 0 + 1 + 0 + 2 + 1 - ≈ 2 .8 ,

SX 2 .8
VX = = = 0 .7 ,
n - 1 4
珡X 0 .8
珚x = x0 + = 100 .17 + = 100 .178 ,
h 100
SX 2 .8
Sx = = = 0 .00028 ,
h
2 2
100
Vx
Vx = = 0 .72 = 0 .00007 .
h

100

2 .5   按区间划分的数据的统计
一 、 算术平均

    与表 2 .2 一样 ,设第 i 区间的中值为 珟x i ,频数为 f i ,共有 q 个区间 ,则算术平均


· 22 · 第 2 章   数据的初步整理方法


q

钞 i= 1 f i 珚x i
珚x = .
n
    表 2 .2 中 ,8 个区间 64 个数据的算术平均为
q

钞 f i 珚x i
珚x =
i= 1

n

= [(1)(673 .5) + (7)(809 .5) + … + (1)(1625 .5)]
64

= 1 (71664) = 1119 .75 .


64

二 、 中央值

先把数据按大小排一排 ,求出所含有第 k 个数据 的中央区 间 ,不妨设 它为第 k


区间 ,则求中央值的公式为
n - k- 1
fi
2 钞 i= 1
珟x = L + × c, (2 .4)
fk
其中 L 为中央区间的左端点值 ,c 为区间长度 .
n 64
从表 2 .3 中 ,第 32 个数据( = = 32) 在第 1 区间 ,故中央 区间为 1013 .5 ~
2 2
1149 .5 ,而且
k = 4 ,  L = 1013 .5 ,  c = 136 ,  f 4 = 13 ,
k= 1 3

钞 fi = 钞 f i = 20 .
i= 1 i= 1

故中央值为
32 - 20
珟x = 1013 .5 + × 136
13
= 1139 .04 .

三 、 标准偏差

样本方差为
q
f i ( 珟x i - 珚x)

V =
钞 i= 1 1 q
f i 珟x i - n珚x
2 2

n- 1

n- 1 钞 i= 1 , (2 .5)

故标准差为
2 .5   按区间划分的数据的统计 · 23 ·

S = V.

四 、 数值变换

因数据太大或有小数点而计算感到困难时 ,用数值变换较方便 .
珦X i = ( 珟x i - x0 )/ c , (2 .6)
这里 c 为区间长度 ,珟x i 为第 i 区间的中央值 ,x0 取频数较大的中央值 .

钞 f i 珦X i
珚x = x0 + × c, (2 .7)
n
于是

c

( 钞 f i 珦X i )2
V = fiX 2
. (2 .8)
n- 1 钞 珦 i -
n
    表 2 .2 中第 5 个中央值为 x0 = 1217 .5 ,为计算 珔x 与 V ,列表 2 .4 .我们可以算出

钞 fiX
珦i
珚x = x 0 + × c
n
- 46
= 1217 .5 + × 136 = 1119 .75 ,
64

c2 f i 珦X i )

V= f i 珦X 2
( 钞
n- 1 钞 -
n

(136)2 164 - ( - 46)
= = 38441 .59 .
63 64

表 2 .4   在数值变换下算术平均和标准偏差的计算表

区间号 区间中央值( 珟x i ) 频数( f i ) 珦X i f i 珦X i f i 珦X 2i

1 673 .5 1 -4 -4 16
2 809 .5 7 -3 - 21 63
3 945 .5 12 -2 - 24 48
4 1081 .5 13 -1 - 13 13
5 1217 .5 18 0 0 0
6 1353 .5 11 1 11 11
7 1489 .5 1 2 2 4
8 1625 .5 1 3 3 9

合计 64 - 46 164

You might also like