You are on page 1of 3

格 拉 布斯 法检 出异 常数 据

李 文 钧

, ,
在 分析试 验 或测定 中 有 时在 某 样 本 的 分 析 结 果 里 会 发 现 个 别 过 大 或 过 小 的 数 据 与其
, , 。
它 数据 偏 离 较 远 这 些 偏 离 的 数据 通 常 叫做 异 常 数 据 又 称 可 疑 数 据 或 极 端 数据 有 些 分析
, ,
主 人 员 根 据 观 的判 定 对 这 种 异 常 数 据 随 意 加 以 取 舍 以 图 获 得 精 密 度较 好 的 分 析 结 果 这样
, 。 ,
做 往 往 带有 主 观 性 是 极 不妥 当的 对 于 我 们 所 怀疑 的 异 常 数 据 最 好 能 对 相 应 的试 样 及 试
, , 。 ,
验 过 程 进 行 检 查 只 有 确 系 由于 实 验 过 程 中 存 在 错 误 时 才 能 取 舍 一旦检 查 不出 任何原 因

要 用 就 需 数 理 统 计 中的 异 常 数 据 处 理 法 则 来 决 定 取 舍

现 仅 介 绍 异 常数据 检 出 效 果 较 好 的 格拉布斯 法
, ,
假设测定 值 服 从均值为拼 方 差为 护 的 正 态 分布 即 拼,

设 的 一个 随机 样 本数据 为
……
, , ,
· · · · · · · · ·

将 上述 样 本 数 据 按 其 大 小 从 小 到 大 排 列 成
……
, , · · ·
, 。
· ·


假 定 我 们 怀 疑 其 中最 小 数 据 和最大数据 是 异 常数据 用 格拉 布斯 法检 出 异

常 数 据 的方 法 如 下
〔第一步〕 计算 统计量 值
一 、


‘ 、
设 是可疑数据 令 旦土







……

丁 二 一 五 二兰
设 是可 疑 数据 令

, ,
式中 了 和 分 别表示 样本 的平均 值 和标 准偏 差 其 表达式 如下




丫 二

〔 第二 步 〕 选定危 险率
, , ,

和 式 表 明 如 果 统 计 量 很 大 说 明可 疑 直 与 平 均 值 相 差 很 大 则 有 可 能
。 , 。

要 舍去 究 竟 值 多大 才 能 确 定 该 可 疑 值 取 舍 这 要 看 对 置 信 变的 要 求 是按 格拉 布 斯 方

法 判 定 为 异 常 数据 的 错 判 率 这 神错 判 概 率 比 较 小 然而 在统 计 意 义 上 却 不 能 忽 略 通
, , 。

常 可选 定为 肠 肠和 肠
〔 第三步 〕 查 表 找 出 格拉 布斯 检 验 的 临 介 值
, 。

见 附表
〔 第 四 步 〕 决 定取 舍
取 舍的 判据为
。 , ,


当 时 舍 弃 所 怀 疑数 据 当 时 保 留上 述 数 据
〔例 〕 测定 某 煤 粉 中 含 硫 量

肠 得 到 分 析 结果 从小 到大排 列 如下
, , , , 。 , , , , , 。

试 分 析其 中有 无 异 常 数 据
假定我 们 怀疑其 中 的 二
· 。
二 “
及 是 异 常数据

一 计 算样 本 均值又 标 准 偏差 及 统 计 量
、 、 ,
一 ·

一 一 一 二
资霆 飞乳


一 艺
一 盖

一一下 二 万了 玄 一 。


了 二 了 一
。 ,
,。 ·
, · , ,

现 在有 两 个可 疑 数 据 及 但 一又 而 一又一 所 以
, 。

应 当首 先 加 以 怀 疑
文一 一

一 一

二 选定 危险 率 一 。 肠
, · , 、 。 , 。 。 。 ·
·

三 查相 应 于 二 肠的 值表 见附 录表 得 二
。 , 。 。 。
四 由于
, , 。

故 一 为 异 常数 据 应 予 舍去
, , ,。 , 。

去掉 之后 还有 一 个可 疑的数据 再 重复 上 述 步 骤 但 注意此时 一

一 一

。 “ 。

一 一

。 ,
。 。 。
查 附表 得 二
。 ,
。 。 。 ,
,。 。

由于 夕 故 二 应予保留
, , , ,

值得 注 意 的 是 由 的 检 出可 看 出 如 果 我 们 选 定 危险 率 二 肠 则 为异 常 数
。 ,
。 。 。 」 , ‘

据 如果 选 定 危险 值 肠 查 附表 得 值恰好 与 相 等 即都是 价
, 。 。 。
。 , ,

然 也 应 当 舍弃 但如果 肠 则 位 很 可能 小 于 那末 扰 不 是 一个

可 能把 确 实 棍 入 的 异 常 数 据 〔 如 〕 判定
。 , , ,

异 常数据 了 所以 值不 宜 选得 太小 否则

为 正 常 的 数据 从 而 增 大 了 犯 错 误 的概 率 日

最后 应 该指 出 异 常 数 据 的 取 舍 对 分 析 人 员 来讲 是 一 项 十 分 重 要 的 工 作 数理 统 计 学 处
, , 。

理 异 常数 据 的方 法 远 不 止 格 拉 布 斯 一 种 还有 江 四 倍法 检验法等 方 法 但 是在

判 定异 常数据 的过程 中 格 拉 布 斯 法 将 正 态 分 布 中 的两 个 最 重 要 的 样 本 参 数 又 和 引 入进
, ,

来 相 对来讲 试 法 的准确 性较 高 汉 年徐 中秀先 主在他的学术报告 异 常数 据 判 断 方 法


” 、

的 比较 中 用 蒙 特 一 卡 罗 法 对 若 干 种 混 入 另 一 总 李牧 据 的情 况 各 进行 了 万次 以上疾 位试
, 一 , 。 ,

验 证 实 了格 拉 布 斯 法 检 出 率最 高 检 出 率果 最 好 因此 到 目前 为 止 格 拉 布 斯 法 检 出异

常 数据 是 一 种 较 理 想 的方 法


咐表 格 拉 布 斯 检 验 的 临介 值 芡


万二二口 一


· · · · · · · · · ·

’ 。 。

。 。 土


一 一
扣 介 竺份 创
‘ 一 ’ “
一 ‘


一 一 一

一 一
二几
只 “
少 ‘
一 “
一一
之 亿。 ‘。 一一



、 ,

甘 一

二上 ‘


一几 一 一一
一 一一 一一 一
一 一 一 … 一 一
一 一 一

一竺 二 竺 全竺一生竺 兰 里止生 竺旦 少 一里竺 少竺 竺


一 生竺 二 一 一 全竺一 上 二
一 一
· 二
一 兰 三
二 竺 兰 生 三
竺 三兰兰一 少 上 兰
卜 · · · ·

·

You might also like