Professional Documents
Culture Documents
关键词
环境温度,自动响应,在线可用性,分类,物理隔离,同时维护,可同时维护的,不间断供冷,关键输配电,数据中心,干球,
双电源,电力中枢,容错性,容错的,功能,基础设施,公制/指标,运行的可持续性,性能结果,冗余的,可靠性,Tier,Tier 等
级,Tiers,拓扑,湿球
版权
此文档版权归 Uptime Institute, LLC 所有。Uptime Institute 在为政府机构、事业单位和私人用户提供此文档作为参考时
并未放弃此文档的任何版权权利。
1
介绍
此介绍不属于 Uptime Institute 数据中心现场基础设施 Tier Standard(Tier 的标准): Topology(拓扑)。它为读者提供了
本标准的应用背景。
Tier 的分级的创立是为了统一描述数据中心可持续运行所需的现场级的基础设施,而不是基于单个系统或子系统的特征。
数据中心是依托于成功地集电气、机械和建筑物系统为一体的运行。每一个子系统和系统都必须采用和现场在线 (uptime)
目标一致的部署以满足相对应的 Tier 的要求。在进行不可避免的权衡时,业主和设计师必须考虑的最关键决策方面,是该
决策对于计算机房内信息技术 (IT) 环境的生命周期集成运行有什么样的影响。大多数成功的业主都会将数据中心现场基
础设施的投资与以在线可用性或选定的势在必行的任务为要求的商业活动相结合。这些公司将会了解中断所带来的成本,
通常是体现在实际金钱成本、对市场股价的影响,以及持续不断的迫切性任务。中断成本使高在线可用性的基础设施的投
资成为简单明了的业务决策。
这一极为严格的定义是由曾审批过数百万美元投资的高级管理人员决定的,其目的是得出机房实际性能的客观报告。获批
文档脚注中的任何例外和排除条款将很快丢失和遗忘。如果在公司内宣传某机房能够容错 (Tier IV),这将与未来任何时候
不得不计划关闭该机房相矛盾 — 不管任何努力甄别风险的“印刷精美”的除外条款。基于这个原因,没有所谓局部或部分
的 Tier 评级。一个现场的 Tier 评级也并非关键现场基础设施子系统的评级平均值。该现场的 Tier 评级是基于所有个别子
系统评级中的最低值。
最后,本标准关注的是现场的拓扑和性能结果。高程度的终端用户在线可用性可以通过集成复杂的 IT 架构和网络配置,利
用在多个现场运行的同步应用程序来实现。但是,本标准 是独立于现场内的 IT 系统运行。
2
附加的因素和风险
Uptime Institute Tier Standard(Tier 的标准): Topology(拓扑)和 Tier Standard(Tier 的标准): Operational
Sustainability (可持续性运行) 建立了一套可在全球范围内使用和评判的统一性能指标。要成功进行数据中心设计、实施
和持续运行,业主和项目团队还需要考虑其他因素和风险。这其中许多项取决于现场的位置,以及当地、所在国家/地区或区
域的相应考虑事项和/或规章条例。例如,建筑法规和拥有司法管辖权的机构 (AHJ);地震;极端天气状况(大风、龙卷风);
洪水;相邻产业的用途;工会或其他劳工组织;和/或人身安全(作为公司政策或由周边环境所决定)。
由于许多设计和管理选项可能由业主指定、由当地政府调控、行业团体推荐,或作为一般实践而遵循,因此,使用Tier
Standard(Tier 的标准): Topology(拓扑)和 Tier Standard(Tier 的标准): Operational Sustainability ( 运行的可持续性 )
来为这些附加的因素和风险确定一个全球指标是不可行的。而且,Uptime Institute 不希望替代或混淆当地专家的指导,这
对于实现项目按时交付、法规遵从以及实施最佳实践起到关键作用。
3
目录
1.0 概述 .....................................................................................................................................................................5
1.1 范围 ............................................................................................................................................................5
1.2 目标 ............................................................................................................................................................ 5
1.3 参考文献 .....................................................................................................................................................5
1.4 相关出版物...................................................................................................................................................5
2.5 引擎式发电机系统 ....................................................................................................................................... 8
2.6 环境温度设计要点........................................................................................................................................ 8
2.7 通信 ............................................................................................................................................................. 9
2.8 补充水 ........................................................................................................................................................ 9
2.10 公用市政设施............................................................................................................................................... 9
3.2 环境设计工况的影响 ................................................................................................................................. 10
3.4 通信路由..................................................................................................................................................... 11
3.7 不合规趋势................................................................................................................................................. 12
修改 .............................................................................................................................................................................. 12
4
1. 概述
1.1 范围
本标准确立了数据中心现场基础设施四类 Tier 的分级定义(Tier I、Tier II、Tier III、Tier IV)
,以及用结果实效测
试来确定是否符合这些定义。Tier 的分级描述了维持数据中心可持续运行所需的现场级的基础设施拓扑,而
不是基于单个系统或子系统的特征。 本标准依据的事实基础是,数据中心依赖于多个单独现场基础设施子系
统成功且一体化的运行,而子系统的数量取决于为维持运行所选的个别技术(例如发电、制冷、不间断电源)。
每一个整合到数据中心现场基础设施中的子系统和系统都必须采用和现场在线 (uptime) 目标一致的部署以
满足相对应的 Tier 的要求。
是否符合各 Tier 的要求,根据基于结果实效测试和运行的影响来衡量。
这种衡量方法不同于规定性设计方法
或所需设备清单。
针对本标准的评注属于独立部分,为设计和配置各 Tier 拓扑级别的设施系统提供了实例。 评注部分也提供了
Tier 定义的应用和实施方面的指导。
此外,评注部分还包括帮助理解 Tier 概念的讨论和实例,以及关于常见设
计拓扑缺陷的信息。
1.2 目的
本 Standard(标准)的目的是为专业设计人员、数据中心运维人员和非技术管理人员提供一个客观有效的方
法, 以确定不同数据中心机房基础设施设计拓扑的预期性能。
1.3 参考文献
《ASHRAE 手册 – 基础》
美国采暖、制冷与空调工程师学会, (最新版)。
《ASHRAE 数据处理环境传热指南》
,第三版
1.4 相关出版物
认证 Tier 设计师技术论文系列
更多信息可从以下网站找到 www.uptimeinstitute.com。
a) Tier I 基本的数据中心没有冗余容量组件,且只有一个单一的非冗余分配路径来为关键环境提供
服务。 Tier I 基础设施包括:一个IT 系统的专用空间;一套不间断电源系统 (UPS) 用来滤除输入功
率尖峰、电压骤降和瞬间电力中断的影响;专用供冷设备;以及避免 IT 功能受长期断电影响的现
场发电系统(例如引擎式发电机、燃料电池)。
b) 用于现场发电(例如引擎式发电机、燃料电池)的 12 小时现场燃料储存。
2.1.2 结果实效测试:
a) 有足够的容量来满足现场需求。
b) 计划内工作将会关闭大多数或所有现场基础设施系统,从而会影响关键环境、系统和终端用户。
5
2.1.3 对运行操作的影响:
a) 计划内和计划外的活动都容易使现场运行中断。
现场基础设施组件的运行(人为)错误会造成数据
中心中断。
b) 任何容量系统、容量组件或分配元件的计划外停机或故障都将影响到关键环境。
c) 每年都必须完全关停现场基础设施,以便能安全地执行必要的预防性维护和维修工作。 紧急情况
可能需要更频繁的关停。如果未能定期进行维护,则会显著增加计划外中断的风险,以及继发故障
的严重性。
a) Tier II 数据中心拥有冗余容量组件,以及单一的非冗余分配路径来为关键环境提供服务。
冗余组
件是指额外的现场发电系统(例如引擎式发电机、燃料电池)、不间断电源(UPS) 模块和能量储存、
冷水机组、排热设备、泵、冷却装置和燃料储存罐。
b) 支持‘N’容量的 12 小时现场燃料储存。
2.2.2 结果实效测试:
a) 冗余容量组件可以按计划关停并移除,而不会导致任何关键环境关停。
b) 由于维护或其他活动需将分配路径从系统中移除时,关键环境则需要关停。
c) 以任何理由移除冗余组件时,现场仍具有足够的永久安装容量来满足需求。
2.2.3 对运行操作的影响:
a) 计划内和计划外的活动都容易使现场运行中断。
机房基础设施组件的运行(人为)错误会造成数据
中心中断。
b) 计划外的容量组件故障可能会影响到关键环境。
任何容量系统或分配元件的计划外关停或故障都
将影响到关键环境。
c) 每年都必须完全关停现场基础设施,以便能安全地执行必要的预防性维护和维修工作。 紧急情况
可能需要更频繁的关停。如果未能定期进行维护,则会显著增加计划外中断的风险,以及继发故障
的严重性。
a) 一个可同时维护的数据中心拥有冗余容量组件,以及多个独立分配路径来为关键系统提供服务。
对于电力中枢和机械分配路径,只需要一条分配路径来随时为关键环境服务。
电力中枢是指从现场发电系统(例如,引擎式发电机、燃料电池)的输出到 IT 不间断电源 (UPS) 的
输入的电力分配路径以及为关键机械设备服务的电力分配路径。 机械分配路径是指将热量从关键
空间移除到室外环境的分配路径。例如,冷冻水管路、冷却水管路、制冷剂管路等等。
b) 所有 IT 设备都具有双电源且正确安装,与现场架构的拓扑相匹配。
如不满足该要求则须使用转换
装置如小型机架式转换开关。
c) 支持‘N’容量的 12 小时现场燃料储存。
6
2.3.2 结果实效测试:
a) 所有单一容量组件和分配路径的元件都可以有计划地从系统中移除,而且不会对任何关键环境造
成影响。
b) 以任何理由将冗余组件和分配路径从系统中移除时,应有足够的永久安装容量来满足现场需求。
2.3.3 对运行操作的影响:
a) 计划外的活动易导致现场运行中断。
现场基础设施组件的运行错误可能会造成计算机运行中断。
b) 任何容量系统的计划外关停或故障都有可能会影响到关键环境。
c) 容量组件或分配元件的计划外关停或故障可能会影响到关键环境。
d) 可以利用冗余容量组件和分配路径来支持计划内现场基础设施维护工作,以便安全地在剩余设备
上工作。
e) 在维护活动期间,中断的风险可能会提高。
(这一维护条件不会降低正常运行下获得的 Tier 评级。
)
a) 一个容错的数据中心同时具有多个、独立的、物理隔离的系统来提供冗余容量组件以及多个、独立
的、多种不同的、主用的分配路径同时为关键环境服务。冗余容量组件和多种不同的分配路径的配
置应使‘N’容量在任何基础设施故障后能继续为关键环境提供电力和冷却。
b) 所有 IT 设备都具有双电源,装置内部带有容错电力设计,且正确安装,与现场架构的拓扑相匹配。
如不满足该要求则须使用转换装置如小型机架式转换开关。
c) 互为备份的系统和分配路径必须相互之间进行物理隔离(分隔)
,以防止任意单一事件同时对两套
系统或两路分配路径造成影响。
d) 要求连续供冷。 连续供冷依据《数据处理环境传热指南, 第三版》为所有关键空间提供一个满足IT
设备 ASHRAE 最大温度变化范围的稳定环境工况。另外,连续供冷的持续时间应该能保证持续
供冷至机械系统恢复在极端环境条件下运行所提供的额定制冷量。
e) 支持‘N’容量的 12 小时现场燃料储存。
2.4.2 结果实效测试:
a) 任何容量系统、容量组件或分配元件的单一故障都不会影响关键环境。
b) 基础设施的控制系统展现出对故障的自动响应的同时又能维持关键环境的正常运行。
c) 所有单一 容量组件和分配路径的元件都可以有计划地从系统中移除,而且不会对任何关键环境
造成影响。
d) 以任何理由将冗余组件和分配路径从系统中移除时,应有足够的容量来满足现场需求。
e) 任何潜在的故障都必须能被检测、被隔离并被有效控制在一定的区域范围,同时又能维持处理关
键负载的 N 容量。
7
2.4.3 对运行操作的影响:
a) 单一的计划外事件不易导致现场运行中断。
b) 任何计划内的工作活动都不易导致现场运行中断。
c) 可以利用冗余容量组件和分配路径来执行计划内现场基础设施维护,以便安全地在剩余设备上工作。
d) 在关停冗余容量组件或分配路径以进行维护活动的期间,如果剩余路径发生故障,关键环境所面
临的中断风险将会提高。这一维护配置不会降低正常运行下获得的 Tier 评级。
e) 消防火警、火灾扑救或紧急断电 (EPO) 功能性的操作可能会造成数据中心运行中断。
2.5 引擎式发电机系统
现场发电系统(例如,引擎式发电机、燃料电池)被视为数据中心的主用电源。当地公共市电只是一种经济性的
替代。公共市电的中断不能被视为故障,而是现场必须为其做好准备的可预见的运行工况。 相应地,现场发电
系统必须能够自动启动并承担失去市电后的负载。 另外,所有不具备不间断电源 (UPS)支持 的关键设备都必
须在恢复电力后能够自动重新启动。 虽然引擎式发电机只是现场发电的一种解决方案,但是评级的细微差别
所指出的额外评论描述了在使用引擎式发电机系统进行现场发电时所必须满足的具体要求。
2.5.1 使用引擎式发电机的现场
2.5.2 制造商的运行时间限制
2.5.3 监管运行时间限制
受排放量影响,引擎式发电机系统通常会有年度监管运行时数的限制。
这些环境限制不影响本节所
确立的连续运行时数。
2.6 环境温度设计要点
数据中心基础设施设备的有效容量应在峰值工况下确定,该工况是基于数据中心所在地的气候条件和稳态运
行的设定值。所有制造商的设备容量均应根据该设备运行所在地的极端观测温度和对应海拔高度进行调整。
2.6.1 极端年度设计工况
所有向大气环境中散热的设备容量均应在最新版《ASHRAE 手册 – 基础》中所述的最能代表数据
中心位置的极端年度设计工况下确定。 (每个《ASHRAE 手册》的修订和发布时间间隔为 4 年)。 设
计湿球温度 (WB) 应为所列的极端最高 WB 值,而设计干球温度 (DB) 应为 n=20 年的温度值。
另
外,所有系统都必须能在极端最低温度条件下全面运行。 这一点必须考虑 n=20 年的极端最低干球
温度 (DB)。
8
2.6.2 计算机房设定值
计算机房供冷设备的容量应由业主为实现数据中心稳态工况下所确立的回风温度和相对湿度来决定。
2.6.3 其他影响
任何能影响容量、负载或设备运行的都必须考虑极端环境工况。
2.7 通信
如果支持通信分界点的设备是数据中心功能的重要支持,则它们也必须根据 Tier 的目标提供对应冷却和电力
系统。相应地,Tier IV 数据中心的关键设备还必须满足物理分隔的要求。
2.8 补充水
对于所有使用蒸发式冷却的 Tier 数据中心而言,根据 Tier 目标,需要满足 12 小时的现场备用补充水存储。 相
应地,对于 Tier III 和 Tier IV 数据中心,在保证至少 12 小时补水量时,补充水系统还必须是满足可同时维护
的和容错的要求。
支持 IT 负载的最小容量组件 N
在任意故障后
N N+1 N+1
可同时维护的 否 否 是 是
容错性 否 否 否 是
区域分隔 否 否 否 是
连续供冷 否 否 否 是
表 1:Tier 的要求汇总
2.10 公用市政设施
来自数据中心建筑红线以外,并非由数据中心组织完全控制的服务被视为公用市政设施系统。这些包括但不
限于电源、市政供水、天然气供应、区域供冷等等。
这些设施对于数据中心而言被认为不是可靠的服务供应,而
且不被视为满足现场的 Tier 的要求。
满足 Tier 的要求的设施服务必须完全涵盖在数据中心建筑红线以内,且由数据中心组织完全控制。
另外,在将
公共市政设施系统作为一个经济性的替代选择时,数据中心的关键系统必须能在这些设施服务中断时自动检
测并与现场的系统进行响应以提供服务。 这也要求现场的系统能在现场服务恢复后自动重新启动。例如,在失
去市电后,引擎式发电机系统必须能检测到接入市电的中断,从而启动引擎式发电机系统,将负载转移至现场
引擎式发电机系统,并在没有操作人员介入的情况下重新启动任何经历临时电力中断的其他系统。
9
3. 针对应用 Tier Standard(Tier 的标准): Topology(拓扑)的评述
此评述不属于数据中心现场基础设施 Tier Standard(Tier 的标准): Topology(拓扑 )。
它为读者提供了本 Standard
(标准)应用的上下文参考。
3.2 环境设计工况的影响
多数冷却和发电设备的可持续的有效容量受到其运行实际环境条件的影响。
随着海拔高度和环境气温的上
升,这些组件一般需要更多能源来运转,并且会提供较少可用容量。
常规设施的一种常见做法是选择满足大多数,但并不是全部预期运行时数的设计值。 其结果是,选择符合大多
数运行时数要求的经济型设备。对于希望 24 小时无间断永久运行的数据中心,这种做法并不合适。
使用不包含 2% 时间的干球 (DB) 设计温度,也就是所选择的组件会出现每年有 175 个小时容量不足。
虽然这
似乎意味着业主只会在每年有一周多一点的时间内会面临运行操作风险,但是这些时数实际上会逐渐蔓延到
许多天。2% 的设计值可能导致一到两个月期间每天下午都存在几小时的时间实际工况超出设备的设计参数。
许多专业设计人士认为是保守的 0.4% 设计值仍会导致设备每年大约有 35 个小时的运行低于要求。
当为分体式直接膨胀 (DX) 式冷却系统选择散热系统时,另一个关于环境工况的实例出现了。 许多制造商基于
95°F/35°C 的外部环境工况提供产品选型表。 这些组件只有在最高 95°F/35°C 的室外温度运行时,才具备选
型表所列的额定容量。 当室外温度超过 95°F/35°C 时,这些组件容量必须向下调整以提供所需的容量。
可预见的最低温度是一个经常被忽视的影响环境工况。风冷冷水机通常有一个最低温度要求,在该温度下,设
备可能无法启动或运行。许多常见的风冷冷水机的额定运行温度可低至 0°C,在低于该温度点运行时必须采
取相关额外措施。
10
c) 根据定义,备用功率级引擎式发电机有年度运行小时数限制。此限制未达到第 2.5 节的要求。
对于
引擎式发电机可以不限小时数连续运行的前提条件,某些制造商在产品规格中或通过单独的函件
给出了一个不同的容量减少。制造商的不限小时数连续运行容量证明将用于判定是否符合 Tier 的
要求。
3.4 通信路由
Uptime Institute 建议从数据中心建筑红线外到数据中心通信分界的光纤输送或通信连接路由应按照可同时
维护的要求(针对 Tier III)以及容错的、物理分隔的要求(针对 Tier IV)。
3.5.1 Tier I
3.5.2 Tier II
Tier II 解决方案包括冗余关键电力和供冷容量组件来提高安全系数,以应对因现场基础设施设备
故障而造成的 IT 流程中断。 冗余组件一般是额外的不间断电源 (UPS) 模块、冷水机组、排热设备、
泵、冷却装置和现场发电系统(例如,引擎式发电机、燃料电池)。 一个故障或正常维护将会导致容量
组件减少。
11
3.5.4 Tier IV
3.7 不合规趋势
多数现场中与 Tier Standard(Tier 的标准)最大的偏离可以总结为解决方案的不一致性。
经常性的,一个现场
拥有遵照 Tier IV 解决方案模式的强大容错的电气系统,不过使用的是必须中断计算机房运行才能进行维护
的 Tier II 机械系统。
这种情况下,该现场的整体评级为 Tier II。
最常见的情况是,由于冷冻水分配路径中的关断阀门数量和位置之间协调不充分,机械系统无法满足同时维
护的指标。另一个经常疏忽的问题是机械组件的供电分支回路,这会导致不得不关停整个机械系统来进行电
气部分的维护。如果超过冗余数量的冷水机组、冷却塔或水泵要断电进行电气维护,那么计算机房的供冷会受
到影响。
12
电气系统常常因为不间断电源 (UPS) 和关键配电路径方面的设计选择,而无法满足 Tier III 或 Tier IV 的指
标。配置使用公共输入和输出开关柜的不间断电源 (UPS) 几乎永远要中断关键环境才能进行维护,并且即使
在花费数十万美元后也无法满足 Tier III 的要求。
在关键电力路径中包含有静态转换开关用于单电源 IT 设备
的拓扑可能即无法满足容错性指标也无法满足同时维护的指标。
对于一个数据中心而言,要提供集成的解决方案,一致性地应用标准是必要的。 显然,IT 组织会在较新关键环
境技术提供的功能方面大量投入。 通常,由于电气和机械基础设施已定义,并且设施运行也已确立,因此现场
采用的解决方案会出现一定程度上增加的不一致性。 对某一部分进行投资时,必须对其他所有相关部分进行
类似投资,以便组合解决方案中的所有元件都在 IT 可用性方面达到预期效果。执行良好的数据中心主计划或
策略应一致地解决所有相关 IT 和设施要求的全部涵盖。
修改
本 Standard(标准)并入了 2010 年业主咨询委员会的投票结果。
现场发电燃料储存要求于 2010 年 5 月 1 日生效。
加入的更改基于 2012 年业主咨询委员会的讨论和投票结果。针对此版本的所有更新于 2012 年 8 月 1 日生效。
所包含的更改是根据行业反馈进行的说明。针对此版本的所有更新于 2018 年 1 月 1 日生效。
关于 Uptime Institute
Uptime Institute 是一家公正的咨询组织,致力于通过创新、协作和独立认证提升企业关键基础设施的性能、效率和可用
性。Uptime Institute 为企业组织及第三方运维操作者、制造商和供应商提供业界领先的标准、教育、同行间交流、咨询和
奖励计划,服务于负责 IT 服务可用性的所有利益相关者。在针对数据中心设计、构建和运行可持续性的 Tier Standards &
Certifications(Tier 的标准和认证),以及 Management & Operations(管理和运行)的审核、FORCSS ® 方法和 Efficient
IT Stamp of Approval(Efficient IT 的认可印章)的创建和管理方面,Uptime Institute 获得了全球认可。
问题?
请在线联系您所在的区域代表:http://uptimeinstitute.com/contact-us,
或发送邮件至:info@uptimeinstitute.com,联系我们
访问 www.uptimeinstitute.com,了解更多信息。