Professional Documents
Culture Documents
com
物种敏感性分布:数据和模型选择
⼩惠勒⼀个,*, EPM 格⾥斯特⼀个, 梁家美⼀个,⼄, D.莫⾥特⼀个, M. 克兰⼀个
⼀个伦敦⼤学皇家霍洛威学院⽣物科学学院,英国萨⾥埃格姆 TW20 OEX
b⾹港⼤学太古海洋科学研究所及⽣态与⽣物多样性学系,
⾹港⽯澳
抽象的
关键词:⽣态⻛险评估;物种敏感性分布;数据量;数据质量;模型拟合
⼀、简介 超过 5% 的物种影响⽔平,通常基于慢性未观察到的影响
浓度 (NOEC)。有⼈提议使⽤ HC5 的较低置信区间(可能
物种敏感性分布 (SSD) 越来越多地⽤于⽣态⻛险评估程 带有⾼达 10 的额外安全系数)来推导⽤于⻛险评估的预
序(例如,Solomon 等⼈,1996 年;Steen 等⼈,1999 测⽆影响浓度 (PNEC)(Feibicke 和 Ahlers,2001 年)。
年)和⽔质指南的制定(ANZECC 和 ARMCANZ,2000 SSD 是使⽤对数变换的 NOEC 的累积图针对每个值的排名
年)。这是因为,如果使⽤得当,与传统的商数和评估因 指定百分位数构建的,统计分布拟合到该值。在欧洲和美
⼦⽅法相⽐,它们可以为⻛险评估过程带来更⼤的统计信 国,这通常是对数正态(Wagner 和 Lokke,1991 年)或
⼼。在欧洲,欧盟委员会、欧盟成员国和欧洲化学⼯业制 对数逻辑(Aldenberg 和 Slob,1993 年)模型,⽽在澳
定的技术指导⽂件 (TGD) 中描述了新化学品和现有化学品 ⼤利亚和新西兰则使⽤ Burr Type III ⽅法(Shao,2000
的⻛险评估⽅法(Crane 等⼈,2001 年)。TGD ⽬前正 年) ). 从这些模型中的每⼀个模型中推断出 HC5 端点。
在修订中,很可能会采⽤使⽤ SSD 的统计外推⽅法。
对整体结果有影响,以及不同的⽅法是否更适合分析较⼩ · 未测量有毒浓度(但根据测试物质的物理和化学特
的数据集。 性,预计不会有损失)
· ⽅法描述不完整
2. 数据数量和质量 · 未报告对照死亡率
· 使⽤溶剂时⽆溶剂控制
SSD 分析的有⽤性可能⾄少部分取决于输⼊数据的质
量。包含不良数据会加剧解释“⾃然”⽅差的问题,并且 QA3 有限可靠性研究
可能会产⽣错误的预测。但有多糟糕?SSD 是有效的统计 得分为 3 的研究可靠性有限,但仍包含在数据库中。
外推技术,需要最少(尽管未知)的数据量以产⽣可靠的 它们具有以下特点:
估计,监管决策可能以此为基础。我们扩⼤了 ECETOC
(欧洲⽣态毒理学和化学品毒理学中⼼)数据库
(Solbeetal., 1998)并进⾏了调整以包括数据质量标准 · ⽅法部分显⽰实验程序中的弱点
分类。根据框 1 中的标准对数据进⾏质量评估。然后使⽤
急性数据构建 SSD 以检查数据集⼤⼩的影响。 · 不可接受的控制(和/或溶剂)死亡率
· 作为经验法则,应遵循以下评估控制死亡率的可接受
性:
) 卵⼦或早期⽣命阶段测试——接受控制死亡率 6个
40%
) > 10个⽣物体/浓度:接受6个10%控制死亡率(根
据经合组织标准)
专栏 1. ⽤于评估 ECETOC 数据库中数据的数据质量标 · 6个10 种⽣物(最少 7 种/浓度):接受 1 例死亡(根
准。 据经合组织标准)。或者,根据科学判断,测试因任何
其他原因被分类为不可接受
QA1 最⾼可靠性研究
可靠性得分为 1 的研究满⾜以下所有标准: QA4 研究不可靠
评分为 4 分的研究不符合可靠性标准,因此未包含在数
据库中。它们可能具有以下特征:
· 引⽤的已发布或记录完备的程序
) 如果给出了“标准”⽅法,除⾮另有说明,否则应
假定已遵循该⽅法。当引⽤“⾮标准”⽅法时,应获取 · 毒性浓度未测量,根据测试物质的物理和化学特性,预
参考⽂献进⾏评估 计会损失
· 报告的控制性能(包括溶剂控制)令⼈满意 · 终点外推超出测试的浓度范围
使⽤重采样⽅法评估数据量的影响,其中重采样是随机
QA2 (a) 中等可靠性研究 抽取的(从均匀分布中)⽽不放回,⼤⼩从四个到原始样
得分为 2 (a) 的研究具有以下特征: 本⼤⼩不等名词对于每个重新采样,⽣成 100 次重复,并
使⽤对数逻辑和对数正态分布拟合曲线。回归参数、它们
的平均值和相关的标准偏差被记录在每个重采样⼤⼩。两
· 仅测量储备溶液的浓度(但根据测试物质的物理和化学 种模型描述的结果相当。此处,为简洁起⻅,给出了对数
性质,预计不会有损失) 逻辑分布的结果。对数逻辑回归参数图,⼀个值(位
置),b值(散点)和决定系数(r2个) ⽤于确定出现相应
参数值稳定的最⼩数据数。稳定是
· ⽅法描述不完整
· 未报告对照死亡率
· 使⽤溶剂时⽆溶剂控制
在参数标准偏差随着样本量的增加⽽收敛的情况下实现。 种。这是因为某些类型的毒性实验,例如⼤型溞遵循标准
图 1 显⽰了铜的急性数据结果。这些图表明稳定发⽣在 ⽅案的 48 ⼩时 LC50 测试⼏乎总是属于质量类别 1,⽽相
10-15 个数据点的样本量下。还使⽤⾄少 10 个数据点获得 ⽐之下,使⽤⾮标准测试⽅法进⾏的测试往往属于质量较
了五氯苯酚的稳定性曲线。低于 10 个数据点的参数值变 低的类别。为了说明这⼀点,我们根据存在的物种数量⽣
化很⼤,并且不会产⽣对特定终点(例如 HC5)的可靠估 成了预期的 HC5 值。这是通过采⽤ Vega 等⼈描述的⽅法
计。⾄少对于这些⽰例数据集,10-15 个随机选择的数据 实现的。(1999) 由此重新计算 SSD 输出(例如 HC5),
点⾜以获得对我们可⽤数据⼦群的有效估计(我们认为代 并逐步增加每个分析中包含的数据数量。随机删除数据可
表总⼈⼝)。此处建议的⾄少 10 个物种的数据也与其他 以计算新物种数量的⼀系列值(由于质量原因删除后)。
作者⾮常⼀致,⽤于⽔⽣⻛险评估(Solomon 等⼈, 采⽤这种⽅法,我们检查了数据质量对急性淡⽔铜数据
1996 年)和⼟壤质量⽬标(Vega 等⼈,1999 年)。虽然 SSD 输出的影响,并表明在使⽤所有质量的数据与仅使⽤
较⼩的数据集(ñ <10) 经常使⽤(Aldenberg 和 Slob, QA 1(最佳质量)之间,HC5 值有两倍的变化,分别产⽣
1993 年;Hakanson,1995 年),这将处于模型输出的 0.0068 和 0.011 mg/l 的 HC5 值(表 1)。尽管差异的意
最⼤可变性点,并且很可能对指定的效果⽔平产⽣不可靠 义不⼤,但它不太可能是物种数量的函数,因为预期的
的估计。 HC5 为 0.007 mg/l。因此,我们可以得出结论,更严格的
数据包含标准会导致
通过从分析中去除某些质量的数据,研究了数据质量对
所得 HC5 值的影响。根据质量移除块中的数据具有移除粒
⼦的混杂效果
JR 惠勒等⼈。/ 海洋污染公报 45 (2002) 192‒202 195
表格1
删除不同质量数据的影响(源⾃质量保证标准)
质量检查 1、2(a)、2(b)、3 质量保证 1、2(a)、2(b) 质量检查 1、2(a) 质量保证 1
铜
n 45 40 29 29
⼀个 - 0.5572 - 0.5934 - 0.7386 - 0.6965
标清 0.9954 1.0317 0.8210 0.7755
b 0.54747 0.567435 0.45155 0.426525
r2个 0.9493 0.9414 0.9446 0.9500
HC5(毫克/升) 0.0068 0.0054 0.0086 0.011
预期 HC5 ‒ 0:0062 - 0:0009 0:0070 - 0:0014 0:0070 - 0:0014
五氯苯酚
n 39 36 ‒ 31
⼀个 - 0.8184 - 0.9852 ‒ - 1.1202
标清 1.1158 1.1336 ‒ 1.1517
b 0.61369 0.62348 ‒ 0.633435
r2个 0.8929 0.8496 ‒ 0.8490
HC5(毫克/升) 0.0024 0.0015 ‒ 0.0010
预期 HC5 ‒ 0:0021 - 0:0003 ‒ 0:0025 - 0:0003
n是物种的数量,⼀个 (位置)和b (散点图)对数逻辑回归参数,对数毒性值的 SD 标准差,HC5(mg/l)。预期 HC5 表⽰来⾃相同数量物种的值,包
括所有数据质量,重复五种不同的随机数据组合,加上或减去这些值的标准偏差。
在这⾥,我们研究了这些多个物种摘要中每⼀个的影
响。从 US-EPA AQUIRE ⽔⽣毒理学数据库中提取了六种
物质的急性盐⽔致死率数据(http://www. epa.gov/
ecotox/)。在所有情况下,log-logistic 分布都被证明是
3、配电建设 ⼀个很好的模型拟合,并且为了⼀致性⽽始终使⽤。使⽤
最敏感的端点、所有数据以及⼏何或算术平均值为每种物
⽣态毒理学数据库通常包含同⼀物种和化学品的多个条 质构建四个 SSD。我们使⽤ HC5 点估计值和相关的较低
⽬,因为已经进⾏了多项毒性测试。然后,⻛险评估⼈员 95% 置信区间(单尾)总结和⽐较了这些分析的结果(表
必须选择在构建 SSD 时如何最好地汇总此类多个数据。使 2)。正如我们所料,HC5 及其左侧置信区间存在总体趋
⽤物种反应的累积图,并且由于存在⼀个物种的多个数 势:最敏感的终点
据,“总”物种反应通常通过计算可靠测试结果的平均值
来估计 -
表2
HC5值(升g/l) 从盐⽔ SSD 计算得出,具有物种的四个多重数据摘要
物质 最敏感 ⼏何平均数 算术平均值 所有值
镉 6.592 (0.978) 8.220 (1.070) 8.337 (1.102) 16.56 (8.476)
氯丹 0.532 (0.041) 0.562 (0.036) 0.570 (0.039) 0.638 (0.134)
狄⽒剂 0.200 (0.039) 0.817 (0.060) 0.931 (0.222) 0.783 (0.481)
硫丹 0.007 (0.0005) 0.014 (0.001) 0.017 (0.001) 0.040 (0.017)
镍 375.0 (15.01) 529.7 (25.20) 563.6 (35.56) 615.2 (63.66)
甲苯 2818 (95.31) 4271 (180.2) 4519 (189.4) 2864 (718.0)
个⼈数据点。然⽽,这使分析的解释变得复杂,并且需要
对 HC5 进⾏新的定义,因为此类措施不再处于物种⽔平。
这与 SSD 的⽬的相反,即为特定百分⽐的物种得出保护⽔
平(Toll 等,2001)。因此,我们留下了更传统的数据摘
要,这些摘要⾄少受到每个数据点的影响,但仍然保持物
种反应的流通性。尽管最近受到批评(Parkhurst,1998
年),但⼏何平均数通常⽤作⽔⽣毒性数据的汇总统计量
(Stephan 等⼈,1985 年)。它是对数变换变量的反变
换均值,由于对数函数的曲率,它给出了保守估计。
www.epa.gov/oppefed1/eco- ⻛险/aquareport.pdf)。
⼏何平均值总是⼩于或等于算术平均值 (Streiner, 2000)。
算术平均值假定值之间的差异是线性的,⽽不是⼏何平均
值中的⾮线性函数。此外,已经证明,⾄少对于对数正态
数据,与⼏何平均值相⽐,算术的均⽅误差(估计量的偏
差和⽅差的度量)更⼤(Smothers 等,1999)。
图 2. 氯丹的物种敏感性分布说明了曲线的不同位置,具体取决于使⽤的
数据摘要。插⼊的数字放⼤了较低的百分位数区域。在符号重叠的地⽅,
图形顺序是:闭合圆、空⼼三⻆形、空⼼正⽅形、闭合正⽅形。
4.型号选择
仅使⽤数据集中最敏感的值进⾏分析是⼀种有吸引⼒的
监管选择,因为根据定义,它们⾮常保守。然⽽,这种⽅
法并没有使⽤所有可⽤数据,因此更有可能受到异常值的
影响。最敏感的物种值也可能会阻碍进⼀步的数据⽣成, 4.1. 参数⽅法
因为数据集越⼤,它包含极端(低)值的可能性就越⼤
(Smith 和 Cairns,1993)。包括所有可⽤数据,在⼀次 线性化对数正态法已成为监管机构暂时采⽤的⽅法,因
分析中捕获物种间和物种内对物质的反应,可以解决这个 为它已⽤于农药的⼏个重要概率⻛险评估(Solomon 等
问题。在操作上,这将需要分配⼀个百分位数 ⼈,1996 年;Giesy 等⼈,1999 年;Hall 等⼈,2000
年)。它的主要优点是数学简单,因为简单的最⼩⼆乘回
归可以应⽤于 probit 和对数转换数据,并且
JR 惠勒等⼈。/ 海洋污染公报 45 (2002) 192‒202 197
可以根据正态分布的假设来计算置信区间。此外,如果可 在新闻)。当数据很少且不能充分符合其中⼀种标准分布
以获得化学监测数据或暴露估计,则可以构建超标曲线或 时,具有适当基础模型的⾃举回归提供了合适的替代⽅
联合概率曲线 (JPC)(例如,Giesy 等⼈,1999 年)。简 案。
单的线性曲线使 JPC 组合能够清楚地传达⻛险,并允许对
不同环境管理决策的影响进⾏相当简单的评估。然⽽,对
数正态分布也可能因其简单性⽽受到限制,因为已经表 4.4. ⽅法⽐较
明,30 个数据集中有 15 个测试未通过对数正态分布的⼀
致性测试(Newman 等⼈,2000 年)。也有⼈建议数据 在这⾥,我们从 AQUIRE 数据库中提取了 15 个盐⽔数
集可能包含⼏个⼦分布,可能与敏感性的分类学差异有关 据集(涵盖各种作⽤模式)。同⼀物种的多个数据汇总为
(Newman 等⼈, ⼏何平均值。使⽤以下⽅法分析数据集:
1. 对数正态模型;
2.对数逻辑模型,⼤号HC5使⽤ Aldenberg 和 Slob (1993)
的⽅法计算;
3. 标准⾮参数⾃举法(Grist 等,出版中);和
如前所述,对数逻辑分布通常可以很好地拟合 SSD 数
据。对数 logistic 函数具有扩展的尾部,因此具有内在的 4. 基于对数逻辑回归模型的⾃举回归(Grist 等⼈,出版
保守性(Aldenberg 和 Slob,1993)。从数学上讲,它 中)。
⽐对数正态模型更复杂,尤其是在计算置信区间时。⽤于
计算置信区间的外推因⼦已通过蒙特卡洛模拟得出,并制 我们计算了 HC5 值和置信下限 (⼤号HC5; 95% 单尾)以
成表格(Aldenberg 和 Slob,1993 年)。然⽽,这些因 及每种化学品的适当回归参数(表 3)。通过较低百分位
素仅限于单尾 95% 区间(相当于双尾 90% 区间),⽽我 数区域的“曲线拟合”优度以及 HC5 和⼤号HC5值。
们通常对双尾 95% ⽔平的置信度感兴趣。此外,对于列
表值之间的样本⼤⼩,必须使⽤线性插值来确定因⼦的近
似值。
⼀般来说,不同的⽅法产⽣不同的 HC5 和⼤号HC5值
(表 3)。例如,标准引导程序是将模型分布拟合到镉数
据集的最佳⽅法(图 3C),它产⽣的 HC5 显着降低⾄
0.511升克/升(表 3)。相⽐之下,传统对数逻辑⽅法产
⽣的镉的 HC5 估计值⽐标准⾃举法产⽣的值⾼约 16 倍
(表 3)。然⽽,在⼤多数情况下,HC5 和⼤号HC5值在 2
的因数内。
4.2. ⾮参数⾃举法
原⽊物流
⼀个 4.460 3.083 0.837 2.333 1.458 0.604 3.820 1.909 2.287 4.093 2.767 4.549 4.178 4.831 4.767
b 0.402 0.737 0.367 0.332 0.525 0.830 0.490 0.738 0.679 0.465 0.358 0.360 0.324 0.177 0.386
r2个 0.979 0.940 0.947 0.971 0.913 0.897 0.901 0.914 0.955 0.970 0.973 0.977 0.942 0.771 0.887
HC5 1892年 8.22 0.570 22.67 0.817 0.014 238.2 0.545 1.941 529.7 51.52 3083 1675 20417 4271
⼤号HC5 442.4 1.07 0.039 6.842 0.060 0.001 62.01 0.072 0.167 25.24 19.34 834.8 691.0 8110 180.2
基本引导程序
HC5 ⽆损检测 0.511 ⽆损检测 25.10 2.795 0.049 314.1 0.178 2.780 ⽆损检测 49.79 1495 1796 ⽆损检测 ⽆损检测
⼤号HC5 ⽆损检测 0.200 ⽆损检测 24.00 2.356 0.040 20.70 0.170 2.047 ⽆损检测 37.00 510.0 1700 ⽆损检测 ⽆损检测
基于对数逻辑模型的 Bootstrap 回归 HC5
1819 12.96 0.480 13.07 0.863 0.008 795.9 0.546 1.448 321.7 30.14 2670 919.7 16375 1605
⼤号HC5 238.9 0.983 0.034 5.652 0.384 0.001 120.7 0.087 0.327 33.04 13.97 1261 520.8 8354 330.0
注意:对数正态模型:是¼斧头þb在哪⾥是是概率尺度的百分位数,X是对数刻度的浓度,⼀个是斜率和b是⼀个y-截距。对数逻辑模型:是¼1=½1个þ
expð-ðX-⼀个Þ=bÞ,在哪⾥是是受影响物种的百分⽐,X是对数刻度的浓度,⼀个和b是常数。
⼀个两个值都表⽰为升克/升。还提供了对数正态和对数逻辑模型的模型参数。ND:未定义,由于样本量⼩(ñ <20).
JR 惠勒等⼈。/ 海洋污染公报 45 (2002) 192‒202 199
图 4. 使⽤不同⽅法的镍 SSD:(A) 对数正态分布(y-概率轴);(B) log-logistic 和 (C) bootstrap 回归。实线表⽰ HCp,⽽虚线是双尾 90% 置信区间。插
⼊的数字放⼤了较低的百分位数区域。对于这么⼩的数据集,两种参数化⽅法(r2个¼0:98 [log-normal] 和 0.97 [log-logistic]) (A, B)。与对数逻辑⽅法
(C) 相⽐,⾃举回归在下尾给出了更好的拟合曲线(因此 HCp 估计)。
表4
应⽤于 SSD 分析的已发布概率⻛险评估数据摘要和分布
物质 媒体 数据汇总 模型 参考
阿特拉津 淡⽔ 最敏感 对数正常 所罗⻔等。(1996) 坎⻉
双季铵盐 淡⽔ 最敏感 对数正常 尔等⼈。(2000) van
邻苯⼆甲酸盐 淡⽔、咸⽔、⼟壤 淡⽔ ⼏何的 原⽊物流 Wezel 等⼈。(2000) 所
拟除⾍菊酯 ⼏何平均数 对数正常 罗⻔等⼈。(2001) 霍尔
三丁基锡 淡⽔和盐⽔ 最敏感 对数正常 等⼈。(2000)
Crane, M., Sorokin, N., Wheeler, JR, Grosso, A., Whitehouse, P.,
Morritt, D., 2001。欧洲沿海和河⼝⻛险评估⽅法。载于:Newman,
有多种不同的模型可⽤作⻛险评估⼯具。每种⽅法在不 MC, Roberts Jr., MH, Hale, RC (Eds.),沿海和河⼝⻛险评估。刘易斯
同情况下会更合适。例如,如果有⾜够的数据并且对数正 出版社,伦敦,第 15-39 ⻚。
态模型拟合良好(尤其是在下尾),它将充分描述⻛险并
Durda, JL, Preziosi, DV, 2000。毒物的数据质量评估-
传达对管理策略的影响。然⽽,在某些情况下,对数逻辑 ⽤于得出⽣态毒理学基准的逻辑研究。⼈类和⽣态⻛险评估 6 (5),
分布会更好地拟合数据并产⽣更真实、因此更有⽤的结 747‒765。
果。如果这两个参数描述符都不能充分描述数据(⽆法拟 Efron, B., Tibshirani, RJ, 1993。Bootstrap 简介。
合较低百分位数区域的数据),那么评估者可能希望转向 查普曼和霍尔,纽约,美国。
Feibicke, M., Ahlers, J., 2001. 环境影响评估
引导技术,如果有⾜够的数据可⽤(n >20 HC5 或n >10
具有⼤型数据库的物质有⼀些更详细的解释。为 EU-ECB 特别技术会
对于 HC10),可以应⽤正常的重采样⽅法(Grist 等⼈, 议准备:数据丰富物质的 PNEC 推导。Umwelt Bundes Amt,柏
出版中)。或者,如果数据有限,⾃举回归程序将提供点 林。
估计 (HC5) 和相关的置信区间,由于样本量不⾜,⽆法使 Forbes, TL, Forbes, VE, 1993。对分配使⽤的批评-
⽤标准⾃举确定这些置信区间。 基于⽣态毒理学的外推模型。功能⽣态学 7, 249‒254。
Newman、MC、Ownby、DR、Mezin、LCA、Powell、DC、Chris-
tensen, TRL, Lerberg, SB, Anderson, B.-A., 2000。在⽣态⻛险评估
致谢 中应⽤物种敏感性分布:分布类型和⾜够数量物种的假设。环境毒理
学与化学 19 (2), 508‒515。Parkhurst, DF, 1998。算术与⼏何⽅法
Solbe, JF, Buyle, B., Guhl, W., Hutchinson, T., Kloepper-Sams, P., van Straalen, NM, van Rijn, JP, 1998。⽣态毒理学⻛险
⼤号€ange, R.、Munk, R.、Scholz, N.、Bontinck, W.、Niessen, 评估施⽤杀⾍剂后⼟壤动物群的恢复情况。环境污染和毒理学综述
H.,1998 年。ECETOC ⽔⽣毒性 (EAT) 数据库分析。⼀、总体介绍。 154、85‒141。
化学圈 36 (1), 99‒113。
所罗⻔、KR、⻉克、DB、理查兹、RP、狄克逊、KR、克莱恩、 van Wezel, AP, van Vlaardingen, P., Posthumus, R., Crommentuijn,
SJ、La Point、TW、Kendall、RJ、Weisskopf、LW、Giddings、 GH、Sijm、DTHM,2000 年。两种邻苯⼆甲酸酯的环境⻛险限制,
JM, Giesy, JP, Hall, LW, Williams, WM, 1996。北美地表⽔中阿特拉 特别强调内分泌⼲扰特性。⽣态毒理学和环境安全 46 (3), 305‒321。
津的⽣态⻛险评估。环境毒理学和化学 15 (1), 31‒76。Solomon, KR, Vega, MM, Urzelai, A., Angulo, E., 1999。所需的最少数据
Giddings, JM, Maund, SJ, 2001。概率⻛险
从⽆脊椎动物⽣态毒性实验中得出⼟壤质量标准。环境毒理学与化学
棉花拟除⾍菊酯的评估。⼀、实验室⽔⽣毒性数据的分布分析。环境 18 (6), 1304‒1310。
毒理学与化学 20 (3), 652‒659。
Wagner, C., Lokke, H., 1991。
Steen, RJCA, Leonards, PEG, Brinkman, UAT, Barcelo, D., NOEC 毒性数据中的化⽔平。⽔研究 25, 1237‒1242。
Tronczynski, J., Albanis, TA, Cofino, WP, 1999。⽣态⻛险