You are on page 1of 12

*****有限责任公司

核心数据库系统容灾项目
Vision Solutions
Double-Take Availably for AIX 容灾方案

Vision solutions
Mars Zhang
Solutions Architect
mars .zhang@ visionsolutions .com
Version Date: January 27, 2013
Double-Take Availably for AIX 容灾方案

文档信息
项目名称: *****公司核心数据库系统容灾项目 Opportunity ID:
文档提供: Mars Zhang 文档版本: 1.0
标 题: *****公司核心数据库系统容灾项目 文档日期: Jan 27, 2013
Double-Take Availably for AIX 容灾方案
文档审核: Mars Zhang 审核日期: Jan 27, 2013

分发人员列表
From Date Phone/Fax/Email
Mars Zhang August 16, 2012 Mars.zhang@visionsolutions.com

To Action* Due Date Phone/Fax/Email

* Action Types: Approve, Review, Inform, File, Action Required, Attend Meeting, Other (please specify)

文档历史
Ver. No. Ver. Date Revised By Description Filename
1.0 Jan 27, 2012 Mars Zhang Initial Draft version. Double-Take Availably for AIX 容灾方

2
Double-Take Availably for AIX 容灾方案

目录
1 综述.............................................................................................................................................................. 4
1.1 系统环境...................................................................................................................................................... 4
1.2 客户需求...................................................................................................................................................... 4
1.2.1 生产中心—容灾中心的应用级容灾................................................................................................... 4
1.2.2 容灾中心的查询功能......................................................................................................................... 4
2 容灾系统设计............................................................................................................................................... 5
2.1 容灾系统设计原则....................................................................................................................................... 5
2.2 容灾系统设计目标....................................................................................................................................... 5
2.2.1 数据的实时增量备份......................................................................................................................... 6
2.2.2 数据的安全性:................................................................................................................................ 6
3 容灾系统方案............................................................................................................................................... 7
3.1 系统总体方案............................................................................................................................................... 7
3.2 系统总体架构............................................................................................................................................... 7
3.2.1 系统架构及配置................................................................................................................................ 7
3.2.2 系统实现原理.................................................................................................................................... 9
3.2.3 容灾方案特点.................................................................................................................................. 10
3.3 容灾系统要求............................................................................................................................................. 10
3.3.1 数据生产主机.................................................................................................................................. 10
3.3.2 数据备份主机(CDP 的实现)....................................................................................................... 10
4 解决方案及产品简介.................................................................................................................................. 11
4.1 Double Take RecoverNow for AIX 产品简介............................................................................................11
4.1.1 产品概述.......................................................................................................................................... 11
4.1.2 产品具体说明.................................................................................................................................. 11
4.1.3 产品关键特性.................................................................................................................................. 11
4.1.4 Double Take RecoverNow for AIX 的数据恢复.............................................................................12
4.1.5 数据捕获,关键的技术特点.............................................................................................................. 13

3
Double-Take Availably for AIX 容灾方案

1 综述

1.1 系统环境
目前*****核心数据库系统,运行在两台 IBM p690 服务器上,共 10 个分区,配置为
1.9GHz 8C/32G 和 9C/32G 。上面运行 IBM DB2 数据库,其余分区则运行 CTM、HIS、WAS
等系统,主机操作系统为 IBM AIX 5.3,具体情况还要再进行详细了解。
这些服务器通过 SAN Switch 与 IBM DS8000 存储连接,该系统使用的存储容量为
1.7TB。

1.2 客户需求

1.2.1 生产中心—容灾中心的应用级容灾

*****核心数据库系统的数据,需要在容灾中心形成应用级容灾,以实现在生产中心出现问
题的时候,可以保证在容灾中心可以有一份完整的数据保留,RPO 的时间为 8 小时,RTO 为 36
小时。

1.2.2 容灾中心的查询功能

容灾中心在保存一份生产中心的数据外,还需要满足的部分查询功能,以减少生产系统主
机的压力。

4
Double-Take Availably for AIX 容灾方案

2 容灾系统设计
“*****核心数据库系统容灾及数据保护管理方案”的最终目标是建设一个将目前*****核心数
据库系统的业务数据和应用日志实时的备份起来,确保数据的安全性。同时备份中心的数据在
一定程度上可以满足历史数据的查询、拷贝等对数据库和应用程序日志读操作的需求。

2.1 容灾系统设计原则

经过反复调研和论证,系统采用如下设计原则:

1. 学习目前国际容灾领域先进技术、设计思路和实现方式,汲取其成功经验,服务于***
**。
2. 系统按数据信息流程进行设计,同时考虑现有业务系统的特点,既满足中心数据备份
管理的需要,又不影响目前系统和应用的运行模式,使备份系统的运行对生产系统的
影响最小化。
3. 采用通用的技术标准。在充分利用贵行现有资源的前提下,考虑利用各种公共通讯资
源,以节省投资,加快建设进度。
4. 以数据为中心,采用成熟的新技术,使备份系统具备先进性和高的起点,在同行业中
处于领先水平。
5. 采用多种安全技术和多层安全机制保障数据的可靠性、安全性。
6. 作为新一代数据实时备份系统,实时性数据复制是容灾系统的灵魂,确保数据减少丢
失是系统设计的目标。
7. 该系统和现有业务系统相对独立,不影响已有的业务运行。
8. 在兼顾现状同时,充分考虑到数据的扩展和新应用的增加,以适应未来的需要,使系
统有极大的伸缩性和扩展性。
9. 总体布局,统一设计,分步实施,全面推进。

2.2 容灾系统设计目标

根据以上的设计原则,对数据实时备份系统所要实现的各阶段目标归纳为:

2.2.1 数据的实时增量备份
目前,*****核心数据库系统的数据物理上位于数据中心机房内。数据备份策略是
每天用磁带备份,再数据恢复数据时,用磁带进行前滚数据恢复。

5
Double-Take Availably for AIX 容灾方案

从目前状况来说,容灾系统决乏实时性。遇有主机故障, 亦需时在备机前滚数据及
检测数据可用性。这对恢复时间目标 (Recovery Time Objective) 和恢复数据点目标
(Recovery Point Objective) 都有不足之处。
所以能把数据和日志的增量实时备份下来,才能改善恢复时间及恢复数据点。这也成
为我们系统设计的目标。

2.2.2 数据的安全性:
由于目前*****核心数据库系统的数据实现了集中的数据管理,对数据的备份系统提出了更
高的要求。具体表现在:
 数据备份系统不仅可以防止物理失败(例如硬盘损坏等故障),还可以防止逻辑失败
(例如删除数据可以找回)。
 具有灾难备份功能。为了确保系统的连续运行,应该制定一系列的备份策略。其中灾
难备份是非常关键的,在灾难发生时,即使是在最极端的情况下,即生产中心的主机 、
存储、网络系统全部瘫痪的情况下,备份中心应该使数据的丢失减少到了最小,并能
够确保快速的启动备份系统,保证对客户继续提供服务。

我公司在该容灾系统的规划上,宗旨是,以发展的眼光分析和设计*****核心数据库容灾系
统,以坚实的技术实力使该系统在短时间内成为可容灾的实时可用系统。

6
Double-Take Availably for AIX 容灾方案

3 容灾系统方案
*****核心数据库系统容灾项目是为了确保数据的安全性、准确性,实时性和可用性,建
立数据备份中心。并为下一步开发全行数据决策与分析系统,实时监控系统等应用提供准确、
安全的平台。是为整个*****电子信息化迈上一个新的台阶,需要围绕这些因素设计整个系统
架构。

3.1 系统总体方案
*****的应用系统中心生产机上产生的数据,做统一的实时的数据备份,从而确保整个系
统的安全性、完整性与可用性。我们系统应该是面向服务的、灵活的、提供高可用性的系统。
针对目前的特点,该系统提供给了简单、易用、简化的安装配置,减少各个方面的维护和培训,
降低将来系统运营费用。同时随着业务需求增加,系统有很大扩展性,以满足不断增长的需求。
根据上述系统特点分析,我们建议使用 Double Take RecoverNow for AIX 软件,将目前中心
机房的 IBM p690 主机为源生产系统,同时在异地建立灾难备份中心,我们分别称之为本地源
生产系统和异地容灾目标系统。通过逻辑转换和网络数据传输,使源生产系统产生的数据变化
传送到异地容灾目标系统中,容灾目标系统根据源生产系统的变化情况改变自己的数据,使烦
的生活系统的数据和容灾目标系统的数据保持一致。同时在容灾目标系统中设置相应的功能,
保存以前的数据,以便随时恢复数据到以前的某时间点的系统状态。

3.2 系统总体架构
根据上述选择的结构模式,整个系统可以认为是*****核心数据库系统灾备模式。该系统划
分为数据生产系统和数据备份系统。根据系统的处理流程以及功能实现,我们设计了以下方案。

3.2.1 系统架构及配置
该系统划生产端的两台 p690 服务器,配置为 1.9GHz 8C/32G 和 9C/32G 系统为 AIX 5.3,
容灾端服务器推荐配置为 P740 3.3GHz 8C/64G,分为六个分区(硬件环境可以按照需要进
行调整)
容灾系统为 6 个 IBM 的微分区,其中有两个是做的 HACMP 的热备系统,其它为单机。
共有 6 个应用需要做容灾,按 CPU 计算,源端 15C + 目标端 8C , 共 23C
 WAS(HACMP) 源端 4C(HA 主备 2C+2C)+ 目标端 2C , 共 6C
 DB2 PROD (HACMP) 源端 6C (HA 主备 4C+2C)+ 目标端 2C , 共 8C
 CTM SERVER 源端 1C + 目标端 1C , 共 2C

7
Double-Take Availably for AIX 容灾方案

 CTM AGENT 源端 2C + 目标端 1C , 共 3C


 HIS 源端 1C + 目标端 1C , 共 2C
 TSM SERVER 源端 1C + 目标端 1C , 共 2C

如上图所示,与生产系统建立一一对应的复制关系,许可配置如下:
生产系统 应用 源端、目标端 产品方案 License 统计
CXISH01P WAS 源端 DT-A-AIX 2C
CXISH01P WAS 源端 DT-A-AIX 2C
DB2 PRID DB2 源端 DT-A-AIX 4C
DB2 PRID 备机(STAGING 主机) DB2 源端 DT-A-AIX 2C
CTM SERVER CTM 源端 DT-A-AIX 1C
HIS 系统 CXISH07P HIS 源端 DT-A-AIX 1C
CTM Agent(如需要) CTM 源端 DT-A-AIX 2C
TSM SERVER(如需要) TSM 源端 DT-A-AIX 1C
WAS 容灾机 WAS 目标端 DT-A-AIX 2C
DB2 容灾机 DB2 目标端 DT-A-AIX 2C
CTM SERVER 容灾机 CTM 目标端 DT-A-AIX 1C
HIS 系统 容灾机 HIS 目标端 DT-A-AIX 1C
CTM Agent(如需要)容灾机 CTM 目标端 DT-A-AIX 2C
TSM SERVER(如需要)容灾机 TSM 目标端 DT-A-AIX 1C

3.2.2 系统实现原理
该系统由生产系统、灾难备份系统与两部分构成。其中生产系统从物理上到逻辑上保持不
变。只是在生产系统 IBM p690 主机上安装 Double Take RecoverNow for AIX 软件,在存储系统
上建立 Double Take RecoverNow for AIX 用来传送数据的 LFC。在数据中心建立数据备份系统,
实时的将生产系统的数据备份到备份数据中。其中主机用于和生产主机通信、接受传输的数据、
保存日志、启动恢复进程等工作。存储系统中存放生产主机的数据的映像和日志文件。
其逻辑关系图如下:

8
Double-Take Availably for AIX 容灾方案

生产系统和备份系统通过中心机房的千兆以太网连接,和灾难备份中心通过内部广域网络
连接。
整个备份系统是相对独立的一个系统,和目前已有的系统可以无缝连接,不会影响到目前
其他系统的运行。如果其他系统需要今后做数据保护,也可以的连接到目前的备份系统上来,
从而确保了系统的稳定性和延展性。

3.2.3 容灾方案特点
 消耗网络带宽比少很多。
 对生产系统性能的影响小
 备份自动化,无需人工制定、干预与定制
 恢复速度快
 当灾难发生时,数据仅有极少量的丢失
 当灾难发生时,备份系统能够直接接替应用。

3.3 容灾系统要求

3.3.1 数据生产主机
由于一方面目前生产中心的主服务器性能强大,另一方面 Double Take RecoverNow for

9
Double-Take Availably for AIX 容灾方案

AIX 软件对系统的系统影响非常小,所以根据目前*****核心数据库的状况,我们认为在目前生
产主机中无须再为了 Double Take RecoverNow for AIX 软件做任何提高性能的硬件升级。简而
言之,目前的主机已经可以满足备份的需求。
在存储方面,为了确保目前的性能不受影响,我们建议将目前数据存放的物理位置和
Double Take RecoverNow for AIX 软件 LFC 的物理位置分开。这样既提高了数据的安全性,又
可以使备份对系统的影响降到最低。
在网络方面,为了使 Double Take RecoverNow for AIX 备份软件对应用系统的影响降到最
低。我们建议在两台主机上个增加网卡一块。类型不限,致于带宽需求, 要视乎每天平均及峰
值变量而定, 这个会在软件测试前做好分析。

3.3.2 数据备份主机(CDP 的实现)


Double Take RecoverNow for AIX 对系统效能有很微小的影响,在 IBM 北美实验室的测试
报告,备份中心主机的性能只要生产系统的 40%性能就可以满足要求。所以备份机主机和不
需要和生产机性能相同的主机,可以比生产主机的性能低一些。
我们建议在备份中心保留最近一至两天的日志,以便可回滚 24 小时或 48 小时内任何一个
时间点的数据。请统计有 CDP 需求的系统,以便规划存储容量的使用。

4 解决方案及产品简介

4.1 Double Take RecoverNow for AIX 产品简介

4.1.1 产品概述
Double Take RecoverNow for AIX 提供了对关键数据的保护功能。根据我公司的经验,
在复杂的数据库中,对关键数据进行镜像备份是十分必要的。在数据保护和恢复的工程
中,以下三个过程是一定要考虑的:
 关于数据的写入过程
 确保自动的数据镜像
 在数据重新同步的时候记录写顺序

10
Double-Take Availably for AIX 容灾方案

4.1.2 产品具体说明
Double Take RecoverNow for AIX 实现了通过虚拟设备对数据的全保护,不仅是物理数据
的丢失,对逻辑数据的丢失也可以实现保护。Double Take RecoverNow for AIX 的概念非常简
单,对逻辑卷的功能进行了强大的扩充,在操作系统层对存储系统的数据进行进行了有效的保
护。
Double Take RecoverNow for AIX 虚拟实现了所有对数据的复制、克隆、备份和恢复,数
据库和文件系统以及应用交易的分析。在 Raid 的数据保护的基础上,采用了其他的虚拟技术,
如镜像和快照技术。
Double Take RecoverNow for AIX 可以被看成在每次写操作的时候的一个同步镜像,而且
不需要大量的数据空间,也不会对主机的性能造成严重的影响。.

4.1.3 产品关键特性

 连续的数据捕获能力 Double Take RecoverNow for AIX 可以在不影响应用的情况下,


连续的捕获数据的变化,从而可以实现对任何一时间点的数据恢复。

 缓冲和数据传输对系统和网络的影响非常小 通过使用 LFC 保存数据,Double Take


RecoverNow for AIX 将网络传输压力降到了最低的限度。

 单一界面的自动化的 备份与恢复 管理器有一个非常友好的客户界面,通过他可以对


数据备份、恢复和验校。

 通过虚拟拷贝对数据进行分析的虚拟拷贝特性使用户可以在不增加硬盘空间的前提下
对数据的拷贝可以进行写操作。在虚拟拷贝建立后,用户可以对进行数据挖掘、测试数据和灾
难恢复。这些工作可以在不影响生产机运行和增加磁盘镜像成本的前提下实现。

 验校备份的过程 通过在备份机上创建一个虚拟拷贝,用户可以在不影响生产环境的前
提下备份数据、恢复生产机某一时间点的情况。

 连续的数据保护,以防止数据丢失 不同于其他的复制和快照备份技术,Double Take


RecoverNow for AIX 的用户可以恢复任何一时间点的数据的备份与恢复。

4.1.4 Double Take RecoverNow for AIX 的数据恢复


1. Double Take RecoverNow for AIX 的 Archive 进程提供了独特的数据恢复过程。在数据进行

11
Double-Take Availably for AIX 容灾方案

恢复之前,Double Take RecoverNow for AIX 软件通过注册表建立一个可恢复的时间点,然


后从那个时间点开始回滚数据。数据既可以恢复到备份机上,有可以恢复到生产机上。
2. 数据恢复包含了全恢复、部分恢复和灾难恢复:
 全恢复
通过数据可用的时间点在回滚数据,实现数据的恢复,数据同步地恢复到生产机上。
 部分恢复
允许同样的过程在备份机上实现。用户从备份机上找到需要的数据恢复到生产机上来。
 灾难恢复
是在备份机上建立一个虚拟拷贝,将所写入的数据恢复到生产机上来。

4.1.5 数据捕获,关键的技术特点
1. 备份产品通常在文件层进行备份,这样对当前打开的文件和激活的数据库进行备份将变得
非常困难。产品复制技术(像 IBM 公司 ESS 用的 PPRC)在物理层上捕获数据。
2. Double Take RecoverNow for AIX 软件使用一个 Agent 代替了传统的 I/O 操作。
 在文件系统和裸设备之下。
 在逻辑和物理卷之上
3. 这个位置是在 I/O 路径中唯一能够确保写秩序一致性的点是先进先出并且跨所有的存储平
台。在操作系统层上捕获写操作的能力使 Double Take RecoverNow for AIX 软件能够独立
于软件和存储设备。也就是说,Double Take RecoverNow for AIX 软件支持任何的存储设备
和任何应用软件,在操作系统层捕获数据使应用和打开文件的管理变得容易。

当数据写到存储设备时,同步的截取驱动程序的写操作,并发的发送相同的数据到一个
连续的日志中。当日志满了或者指定的时间到了之后,将数据传送到备份机上。在备份机中重
建数据的映像,并记录了数据的修改过程。

12

You might also like