Professional Documents
Culture Documents
EMC 解决方案
概要
2014 年 12 月
版权所有 © 2014 EMC Corporation。保留所有权利。
EMC 确信本出版物在发布之日内容准确无误。本出版物中的信息可随时更改
而不另行通知。
此处使用的所有商标均为其各自所有者的财产。
部件号 H13731
配置详细信息和建议 ........................................................................................................................ 12
前提条件 ....................................................................................................................................... 12
网络配置 ....................................................................................................................................... 13
VLAN ......................................................................................................................................... 14
绑定 .......................................................................................................................................... 15
安装 ScaleIO 组件 .......................................................................................................................... 16
安装步骤 ................................................................................................................................... 17
配置存储 ....................................................................................................................................... 18
设置 ScaleIO 群集 .......................................................................................................................... 18
使用 SCLI 登录 .......................................................................................................................... 19
在 MDM 群集中安装 ScaleIO 许可证 ......................................................................................... 19
准备 MDM ................................................................................................................................. 19
创建容量 ................................................................................................................................... 19
调整 ScaleIO 群集 .......................................................................................................................... 22
缓存设置 ................................................................................................................................... 22
XtremSF PCIe 闪存卡设置 .......................................................................................................... 22
LSI 控制器和 SAS HDD 设置 ...................................................................................................... 23
ScaleIO 存储池配置 .................................................................................................................. 25
数据保护和业务连续性 .................................................................................................................... 32
结论 ................................................................................................................................................. 33
摘要 ............................................................................................................................................... 33
参考资料 .......................................................................................................................................... 34
EMC 文档 ....................................................................................................................................... 34
SAP 文档 ........................................................................................................................................ 34
Web 资源 .................................................................................................................................. 34
注意:部署选项 ........................................................................................................................ 34
注意:虚拟化 ........................................................................................................................... 34
附录 ................................................................................................................................................. 35
尽管传统上仅部署为应用装置,但是利用预先集成的服务器、存储和网络,SAP
还定义了一个备用部署选项,名为定制的数据中心集成 (TDI)。TDI 为企业提供了
更大的灵活性,使其可以选择运行 HANA 的硬件组件。
通过遵循本白皮书中的指导和建议,任何规模的企业都可以做好充分的准备,
从而成功将 ScaleIO 部署为适用于 SAP HANA 的 TDI 解决方案。
EMC 和 VCE 测试
EMC 和 VCE 对 ScaleIO 是否可作为适用于 SAP HANA 的 TDI 解决方案进行了广泛
的测试。根据测试,我们确定了可达到 SAP 为 HANA 设定的关键性能指标 (KPI)
的最佳系统配置。我们使用 SAP 硬件配置检查工具 (HWCCT) 对这些结果进行了
验证。
此外,本白皮书还提供详细的配置信息和部署建议,旨在帮助企业成功实施
ScaleIO 作为其 SAP HANA 环境的 TDI 解决方案。
范围 本白皮书包括以下信息:
• 介绍关键解决方案技术
• 介绍 EMC 和 VCE 构建用来评估采用 SAP HANA 的 ScaleIO 的总体测试环境
• 提供详细的配置信息和测试做法,用于设置和微调用于 HANA 的 ScaleIO
环境
• 提供有关如何从 SAP HANA 节点访问 EMC ScaleIO 存储的建议
• 包含资源以提供其他详细信息
目标读者 本白皮书的目标读者包括系统集成商、系统或存储管理员、客户、合作伙伴以及
EMC 全球服务团队中需要在 TDI 环境中为 SAP HANA 配置 EMC ScaleIO 的成员。
计算
• 4 个 Cisco UCS C460 M4 架装服务器(HANA 节点) 1
1 TB RAM
3 个 Cisco 虚拟接口卡 (VIC) 1225T(10 Gbps 双端口 PCIe 网卡)
• 2 个 Cisco UCS C240 架装服务器(ScaleIO 管理节点)
96 GB RAM
2 个 UCS VIC 1225T 10 Gbps 双端口 PCIe 网卡
• 操作环境
在裸机服务器上运行的 SUSE Linux Enterprise Server (SLES) 11 SP3
(第一次构建)
在裸机上运行的 Red Hat Enterprise Linux (RHEL) 6.5(第二次构建)
网络
• 2 个 Cisco Nexus 3064-T
存储
• 每台 C460 服务器 8 个 1.2 TB 10K SAS 驱动器,配备 2 个可选的 EMC
XtremSF™ 多层单元 (MLC) PCIe 闪存卡
每台 C240 服务器可使用多达 24 个 1.2 TB 10K SAS 驱动器
• 可选的 VNXe 3300 用于集中启动卷、HANA 共享、备份
1
本文介绍了在物理服务器上执行的测试。EMC 和 VCE 计划在 VMware 虚拟化环境中执
行其他测试。
ScaleIO 提供灵活的部署选项,可通过完全融合的方式安装在现有应用程序服务
器上,也可安装在专用服务器上。
(1 x 1 TB 数据 + 1 x 1 TB 日志 + 1 x 1 TB 共享 FS + 0.1 TB 其他) x
2 + 15% = 7.13 TB
对于此配置,我们将备用值设置为 15%。各个企业应根据其各自的配置要求来
调整该设置。
4 x (1 x 1 TB 数据 + 1 x 1 TB 日志 + 1 x 1 TB 共享 FS + 0.1 TB 其
他) x 2 + 15% = 28.52 TB
我们将备用值设置为 15%。各个企业应根据其各自的配置要求来调整该设置。
前提条件 在为每个组件配置特定设置之前,应完成以下任务:
• 构建物理群集
• 建立以下网络配置:
所有组件之间具有 10 GB 的网络连接
所有节点之间具有可接受的网络带宽和延迟
支持网络节点之间所需带宽的以太网交换机
在所有服务器和交换机之间采用一致的最大传输单位 (MTU) 设置。对
于 巨 型 帧 支 持 , 将 服 务 器 、 交 换 机 和 虚 拟 交 换 机 的 MTU 设 置 为
9000 字节。
打开服务器本地防火墙中的端口:
o MDM — 6611 和 9011
o SDS — 7072
o 绑定断路器 — 9011
图 4. 用于 ScaleIO 构建的网络配置
图 5. C460 网络接口
图 6. VLAN
图 7. 使用 scli 命令查看分配的 IP
绑定
为了最大限度提高每台服务器的带宽和高可用性,EMC 和 VCE 绑定了每个接
口。通过绑定可创建逻辑接口,通常为 BONDx,它将关联到两个物理接口。我
们在 SLES 和 RHEL 操作环境中测试了绑定。
图 8. SLES 中的从配置文件
/etc/sysconfig/network/ifcfg-bond0
/etc/sysconfig/network/ifcfg-eth4
/etc/sysconfig/network/ifcfg-eth5
图 9. 显示了一个物理从接口的配置文件。
在 加 载 Bond0 的 驱 动 程 序 时 引 用 了 BONDING_MODULE_OPTS 。 ( 请 参 见 图
9. 。)miimon=100 值告诉驱动程序使用毫秒级监控,每隔 100 微秒观察一次链
路故障。mode 参数指定了四个绑定策略中的一个。
可能的模式值包括:
• 0 Round-robin policy(默认值)— 从第一个可用的从接口到最后一个从接
口按顺序进行传输。此模式提供负载平衡和容错能力。
• 1 Active-backup policy — 绑定中仅有一个从接口处于活动状态。当且仅当
活动的从接口出现故障时,另一个从接口才会变为活动状态。绑定的 MAC
地址仅对外部的一个端口(网络适配器)可见,以免交换机出现混乱。该
模式提供容错能力。
• 2 XOR policy — 根据 [(通过目标 MAC 地址进行 XOR 运算得到的源 MAC 地
址) 模块从接口计数] 传输。该模式为每个目标 MAC 地址选择相同的从接
口。此模式提供负载平衡和容错能力。
• 3 Broadcast policy — 在所有从接口上传输所有内容。该模式提供容错能力。
EMC 和 VCE 针对以上所有选项执行了测试,并测量了带宽。默认的循环调度配
置实现了最佳性能。
安装步骤
以下步骤提供了有关安装 ScaleIO 的一般指导原则。我们建议同时也参考 EMC
在线支持上提供的完整《ScaleIO User Guide》(ScaleIO 用户指南)。
安装 ScaleIO 的步骤:
1. 在管理服务器上安装第一个 MDM。
例如:
rpm -i EMC-ScaleIO-mdm-1.30-
0.InstallationManager.el6.x86_64.rpm
2. 在另一台管理服务器上安装第二个 MDM,然后在第三台服务器上安装绑
定断路器。
例如:
rpm –i EMC-ScaleIO-tb-1.30-
0.InstallationManager.el6.x86_64.rpm
rpm –i EMC-ScaleIO-sds-1.30-
0.InstallationManager.el6.x86_64.rpm
rpm –i EMC-ScaleIO-sdc-1.30-
0.InstallationManager.el6.x86_64.rpm
rpm –i EMC-ScaleIO-lia-1.30-
0.InstallationManager.el6.x86_64.rpm
6. 根据需要安装 GUI。
例如:
rpm -U scaleio-gui-1.30.0-InstallationManager.noarch.rpm
添加新节点时,ScaleIO 会在节点间重新分布数据以提高网络性能。ScaleIO 在存
储或网络中检测到故障时,会在其他位置创建新的数据拷贝以确保数据完整性。
• 使用 CLI 登录
• 在 MDM 群集上安装 ScaleIO 许可证
使用 SCLI 登录
登录到管理系统,然后执行 SCLI 命令:
默认的用户密码为 admin。
注意:为增强流程的安全性,我们建议不要添加密码参数,而是提交仅包含用户名的命
令,并交由系统提示输入密码。系统不会显示密码,并且不会记录在命令历史记录中。
准备 MDM
键入以下命令以准备 MDM:
4. 切换到群集模式:
scli --switch_to_cluster_mode --mdm_ip <MIP_CLUSTER>
注意:在我们的实验室环境中,我们在专用的管理服务器上设置了 MDM。MDM 还可
在 HANA 服务器上运行。
创建容量
在 ScaleIO 中配置容量时,执行以下操作。所有管理任务都由主 MDM 使用 SCLI
命令执行。
以下说明提供了有关在创建容量时执行每个步骤的指导。有关详细信息,请参
阅《ScaleIO User Guide 》(ScaleIO 用户指南)。
添加保护域
保护域由一系列 SDS 组成。通过键入以下命令创建命名为 SAP_HANA_PROD1 的
保护域:
scli --add_protection_domain
--mdm_ip <IP_CLUSTER> --protection_domain_name SAP_HANA_PROD1
添加存储池
存储池是给定保护域中的 SDS 子集。数据卷在组成存储池的设备中进行分配。
创建卷并将卷映射到 SDC
借助 ScaleIO,用户可以轻松地定义卷,并只需指定哪些 SDC 可访问给定的卷,
即可在许多 SDC 之间共享这些卷。这会执行以下操作:
• 对每个卷公开访问控制
• 明确将卷映射到群集中的 HANA 节点
以下步骤提供了有关创建和映射卷的指导。
检测卷
ScaleIO 定期扫描系统来检测映射到 SDC 的新卷。要了解特定 SDC 节点的最新
状态,还可以启动扫描。
缓存设置
我们 ScaleIO 测试环境中使用的 SAS 驱动器配置达到了针对生产性 HANA 系统的
SAP KPI。为了进一步提高性能,企业可以使用 EMC XtremSF MLC PCIe 闪存卡或
SSD 为日志卷添加池。我们使用以下设置成功地优化了这些磁盘类型。
• XtremSF 写入缓存设置:
在 P320h (SLC) 和 P420m (MLC) 内部的写入缓存设置可仅在使用 RealSSD
Manager 的 P320h 上启用或禁用。务必要记住,如果启用了该设置,意外
断电可能导致写入缓存中的数据丢失。默认情况下,P420m 上的内部驱
动器设置处于启用状态,无法更改。P420m 支持供电保持保护,可在意
外断电情况下保护数据。
• ScaleIO SSD 配置优化:
要提高 SSD 性能,请在每个 SDS 节点上的
/opt/scaleio/ecs/sds/cfg/conf.txt 文件中键入以下设置:
tgt_net__recv_buffer=4096
tgt_net__send_buffer=4096
tgt_cache__size_mult=3
tgt_thread__ini_io=500
tgt_thread__tgt_io_main=500
tgt_umt_num=1200
tgt_umt_os_thrd=6
tgt_net__worker_thread=6
tgt_asyncio_max_req_per_file=400
通过在每个节点上键入以下命令重新启动 SDS:
# pkill sds
图 12. 中断合并
具体更改包括:
原始 修订后
NR — 无预读 RW — 读写
WT — 直写 B — 已阻止
D — 直接 D — 直接
2
请参考《LSI 9361-8i MegaRAID Manual》(LSI 9361-8i MegaRAID 手册)
3
《MegaRAID SAS Software User Guide》(MegaRAID SAS 软件用户指南)提供有关如何
管理控制器和 HDD 的更多详细信息。
4
所有 LSI 命令都在 SLES 中运行
ScaleIO 存储池配置
EMC 和 VCE 使用 SAP HWCCT 测试了各种池配置。除其他配置外,我们还评估了不
同的池大小、池数量、HDD 设置以及 HDD 数量。我们的目标是查找最佳配置来满
足 SAP 的 KPI,并为更改广泛的社区提供有关 ScaleIO 最佳做法配置的指导。
我们使用了以下公式来调整此配置中的 HANA:
• 数据设备 1 x RAM
• 日志设备 1 x RAM
5
3+1 包含一个 HANA 备用服务器,尽管其对于 ScaleIO 来说完全可正常运行。
注意:任何给定存储池中的性能仅与最慢组件的速度相当,而且混合驱动器类型或添
加更快和更慢服务器中的驱动器可能无法实现所需的结果。
6
3+1 包含一台备用服务器,即 +1 (HANA)。
KERNEL=="scini*[!0-9]", SUBSYSTEM=="block",
PROGRAM="/bin/emc/scaleio/drv_cfg --query_block_device_id --
block_device $tempnode", SYMLINK+="disk/by-id/scsi-%c",
ENV{ID_BUS}="scsi", ENV{ID_SERIAL}="%c"
2. 创建配置文件后,重新启动多路径守护程序以激活设置并重新扫描新设备:
# rescan-scsi-bus.sh
# service multipathd stop
# service scini restart
# service multipathd start
HANA 持久性设备现在应当可见。
键入以下命令并确保所有 ScaleIO 设备都可见:
# ls -l /dev/mapper/*
# ls -l /dev/dm-*
# cat /proc/partitions,
# dmsetup table –v
以下输出显示了设备的状态:
25e8b72d4664fcaeceb8c222800000007 dm-7 ,
size=500G features='0' hwhandler='0' wp=rw
`-+- policy='round-robin 0' prio=1 status=active
`- #:#:#:# scinia 251:0 active ready running
25e8b72d4664fcaeceb8c222600000006 dm-9 ,
size=600G features='0' hwhandler='0' wp=rw
`-+- policy='round-robin 0' prio=1 status=active
`- #:#:#:# scinib 251:16 active ready running
$ mkfs.xfs /dev/mapper/25e8b72d4664fcaeceb8c222800000007
[storage]
ha_provider = hdb_ha.fcClient
partition_*_*__prType = 5
partition_*_data__mountOptions = -o relatime,inode64
partition_*_log__mountOptions = -o relatime,inode64,nobarrier
partition_1_data__wwid = 25e8b72d4664fcaeceb8c222300000003
partition_1_log__wwid = 25e8b72d4664fcaeceb8c222600000006
partition_2_data__wwid = 25e8b72d4664fcaeceb8c222400000004
partition_2_log__wwid = 25e8b72d4664fcaeceb8c222800000007
partition_3_data__wwid = 25e8b72d4664fcaeceb8c222400000005
partition_3_log__wwid = 25e8b72d4664fcaeceb8c222800000008
数据保护和业务连续性
您可以使用多个选项来保护用于 SAP HANA 的 ScaleIO 群集中的数据。一个选项
是使用标准的 SAP 工具和过程(例如 HANA Studio),以在共享备份文件系统
或 EMC Data Domain® 重复数据消除存储系统上保存数据。
根据本白皮书中提供的建议和最佳做法进行配置时,ScaleIO 可以轻松应用具有
TDI 配置的 SAP HANA。要了解其他专业知识,EMC 全球服务部门可提供全面的
一系列咨询、安装和支持功能,从而最大限度降低风险并提高该解决方案的投
资回报。
注意:部署选项
• 说明 800326 — 适用于 Linux 环境的 EMC 认证解决方案
注意:虚拟化
• 说明 1788665 — 在 VMware vSphere 虚拟机上运行的 SAP HANA
预测故障轮询间隔:300 秒
中断调节活动计数:16
中断调节完成:50 微秒
重构速率:30%
PR 速率:30%
BGI 速率:30%
检查一致性速率:30%
重建速率:30%
缓存刷新间隔:4 秒
一次启动的最大驱动器数:2
启动组之间的延迟:12 秒
物理驱动器强制模式:1 GB
群集模式:已禁用
警报:已启用
自动重构:已启用
电池警告:已启用
ECC 存储区大小:15
ECC 存储区泄漏速率:1440 分钟
插入时恢复热备盘:已禁用
公开机箱设备:已启用
维护 PD 故障历史记录:已禁用
主机请求重新排序:已启用
启用自动检测底板:SGPIO/i2c SEP
负载平衡模式:自动
仅使用 PDE:是
分配安全密钥:否
安全密钥失败:否
安全密钥未备份:否
默认 LD 节能策略:定义的控制器
在 1 分钟内启动的最大直接连接驱动器数:10
自动增强导入:是
允许通过保留的缓存启动:否
禁用在线控制器充值:否
NVRAM 中的 PFK:否
使用磁盘活动进行定位:否
POST 延迟:90 秒
BIOS 错误处理:忽略错误
当前启动模式:正常
功能
================
支持的驱动器:SAS、SATA
限制
================
每个 VD 的最大臂数:32
每个 VD 的最大跨越数:8
最大阵列数:128
最大 VD 数:64
最大并行命令数:928
最大 SGE 计数:60
最大数据传输大小:8192 个扇区
每次 IO 的最大条带数:42
每个阵列的最大 LD 数:64
最小条带大小:64 KB
文件条带大小:1.0 MB
CacheCade 的当前大小:0 GB
FW 缓存的当前大小:837 MB
支持的适配器操作
================
重构速率:是
CC 速率:是
重建速率:是
Patrol 读取比率:是
警报控制:是
群集支持:否
BBU:是
跨越:是
专用热备盘:是
可恢复的热备盘:是
外部配置导入:是
自我诊断:是
在阵列上允许混合冗余:否
全局热备盘:是
拒绝 SCSI 通过:否
拒绝 SMP 通过:否
拒绝 STP 通过:否
支持安全:是
启用快照:否
无需添加驱动器便可支持 OCE:是
支持 PFK:是
支持 PI:是
支持 LDPI 类型 1:否
支持 LDPI 类型 2:否
支持 LDPI 类型 3:否
剩余 PFK 跟踪时间:0 天 0 小时
支持防御状态:是
阻止 SSD 写入磁盘缓存更改:是
支持在线 FW 更新:是
支持的 VD 操作
================
读取策略:是
写入策略:是
访问策略:是
磁盘缓存策略:是
重建:是
拒绝定位:否
拒绝 CC:否
允许控制加密:否
启用 LDBBM:否
支持中断镜像:否
节能:否
默认设置
================
Phy Polarity:0
Phy PolaritySplit:0
后台速率:30
条带大小:64 kB
刷新时间:4 秒
写入策略:WT
读取策略:无
BBU 出错时缓存:已禁用
缓存 IO:否
SMART 模式:模式 6
禁用警报:是
强制模式:1 GB
ZCR 配置:未知
脏 LED 显示驱动器活动:否
BIOS 在出错时继续运行:2
降速模式:无
允许的设备类型:SAS/SATA 混合
允许在机箱中混合:是
在群集中允许 SATA:否
禁用 Ctrl-R:否
启用 Web BIOS:否
直接 PD 映射:否
BIOS 枚举 VD:是
在插入时恢复热备盘:否
公开机箱设备:是
维护 PD 故障历史记录:否
禁用刺穿功能:否
基于零的机箱枚举:否
启用预引导 CLI:否
LED 显示驱动器活动:否
禁用群集:是
禁用 SAS:否
启用自动检测背板:SGPIO/i2c SEP
仅使用 PDE:是
启用 LED 头:否
POST 期间延迟:0
启用崩溃转储:否
禁用在线控制器充值:否
启用 LDBBM:否
未认证的硬盘驱动器:允许
每个阵列的最大 LD 数量:64
节能选项:不自动降速配置的驱动器
默认降速时间(以分钟为单位):30
启用 JBOD:是
TTY 登录刷新:是
自动增强导入:是
禁用联结镜像:是
启用防御状态:是
检测 CME 所用的时间:60 秒