
远程容灾拓扑图
随着社会的发展和科技的进步,企业所面临的风险和威胁也越来越大,保证企业的业务连续运营也是所有IT人员在建设企业IT架构中首先要考虑的问题。
业务连续是核心
为保证7×24全天候运行,企业需要一个全面的业务连续性计划,可以支持高可用性、连续运营和灾难恢复。实施这样一个计划可以帮助组织获得弹性,通过更有效、更经济高效的风险管理,支持全面的工作;有助于根据商业价值,获得关键业务应用和数据可用性;促进遵从政府规则和法规;防御内部和外部威胁,即使在灾难发生的过程中依然能够提供不间断的运营。
绝大多数企业都无法承担由于计划内或计划外系统中断而造成的停机时间代价。虽然间接的、更长期的停机时间影响(包括流失市场份额、降低生产力、不能遵从法规、降低竞争力、影响品牌信誉和有损客户忠诚度)很难测量,但是它们也同样重要。
什么样的威胁能够导致企业业务的中断?
2005年4月出台的《重要信息系统灾难恢复规划指南》中明确定义:灾难是由于人为或自然的原因,造成信息系统运行严重故障或瘫痪,使信息系统支持的业务功能停顿或服务水平不可接受达到特定时间的突发性事件,通常导致信息系统需要切换到备用场地运行。
由此可见,灾难不仅有自然的原因,也包括人为的原因。对于信息系统的连续性运行来说,灾难的范围很宽泛,因为自然灾害或其他原因造成的数据丢失案例经常发生。
事实上,企业要保持业务连续性,最大的威胁并不是来自于火灾、地震等小概率、大影响的灾难,相反,企业的业务更多地受到诸如人员错误、流程缺陷等事件的威胁。虽然它们对经济的影响力远不如那些重大灾难,但是它们却时刻潜伏在企业的周围,随时一触即发,同样会对企业造成致命的打击。
灾难范围的扩大,对企业的IT建设提出了新的挑战。为了保证企业7×24连续运营,仅仅依靠传统的灾难备份/恢复已经满足不了业务的需求。以IT为业务服务的思想,业界提出了业务连续性的概念。业务连续性涵盖面超出了IT灾备方案的范畴,是一个包含了保证业务连续运行的各组成环节的管理流程。
业务连续性的三个方面
业务连续性是指企业有应对风险,自动调整和快速反应的能力,以保证企业业务的连续运转。为企业重要应用和流程提供业务连续性应该包括以下三个方面。
高可用性(High availability):是指提供在本地故障情况下,能继续访问应用的能力,无论这个故障是业务流程、物理设施、IT软/硬件的故障。
连续操作(Continuous operations): 是指当所有设备无故障时保持业务连续运行的能力。用户不需要仅仅因为正常的备份或维护而需要停止应用的能力。
灾难恢复(Disaster Recovery): 是指当灾难破坏生产中心时,在不同的地点恢复数据的能力。
上述三个方面不是相互孤立的,而是相互关联且有交叉的。
针对业务连续性,IBM首先利用一套系统的方法来了解用户独特的业务连续性和可用性需求。IBM可以帮助用户构思和架构一套连续性规划。该规划可以使中断的威胁降到最低或消除中断威胁,充分考虑最关键需求的优先级,并将恢复时间降到最低。IBM连续性解决方案采用了基础架构管理方面(存储管理方面领先的自动化软件、服务器供应和端到端的可用性管理)的先进技术和最佳实践经验。
IBM使用自动化、前瞻性和适应性功能,将现场和非现场的备份功能相结合,以满足用户的独特需求。
本地数据冗余结合远程容灾
我国北方某大型保险公司,目前本地系统的所有数据都存放在一台高端存储ESS800上,同时本地也有磁带库备份。随着公司业务的发展,该保险公司对数据的安全性要求逐步提高,要求实现本地数据冗余和远程容灾。
根据IBM与用户的相关技术人员及应用软件厂商的交流,IBM为用户生产中心的灾备系统推荐的容灾方式为基于本地背对背的同步复制(Metro Mirror),以实现本地的数据冗余,同时远端采用虚拟磁带库的远程备份方案(距离1500公里),软件采用Tivoli的增量备份方式。
如图所示,本地新增加了一台DS8300,连接到光纤导向器上,灾备中心整体采用SAN结构,LTO3584磁带库做本地数据备份,主中心和灾备中心通过IBM提供的的USD设备连接广域的SDH。
在建立了双机集群的运行环境后,系统的可靠性得到大幅提高。但是,作为后端的数据存储,目前仍然集中在一套存储系统上。虽然存储系统的设计从控制器、数据通道、I/O接口,到磁盘环路都采用冗余结构,不存在系统本身的单点故障问题,但是考虑到数据存储系统是整个业务系统的关键所在,数据安全性和整个系统的可靠性都集中到惟一的磁盘系统,一旦磁盘存储系统发生故障导致业务不能顺利进行,将会对正常的生产造成不可挽回的损失。
因此,IBM建议,在通常的双机集群的基础上,建立完全冗余的数据存储系统。这种双磁盘系统数据同步复制机制,是基于IBM存储同步复制技术(Metro Mirror)的数据复制和容灾方式,是目前技术成熟度高、实施快速简便、应用行之有效的数据容灾方式,保证了本地的数据冗余。同时为应对地区的灾难,用户采用了在不同城市间的远程备份,即通过SDH,应用虚拟磁带库和备份软件相结合,实施数据的异地备份,当主中心出现自然灾难时,还可以在远程保留一份完整的数据。
通过本地的数据冗余保证了高可用性和连续操作,同时通过远程的容灾实现了灾难恢复,此案例涵盖了业务连续性的三个方面。同时配合IBM业务连续性和灾难恢复方法论——分析评估、设计实施和维护管理组成一个循环往复的闭合系统,推动企业业务连续和灾难恢复能力的不断提升。这个方法论将贯穿于IBM所有的业务连续性和灾难恢复服务当中。循环前进的方案体现了IBM对客户长期技术支持的承诺。IBM提供的服务将始终与环境变迁保持同步,根据最新的技术、客户的需求及时进行服务升级及补充,以确保企业的连续运作,实现企业的灾难恢复能力的螺旋形上升,使业务连续性计划与外界环境变同步发展。
总之,IBM希望通过完善的解决方案,可以帮助企业的业务系统适应各种破坏以及灾难所带来的挑战,同时能实时响应新机遇和新变化,从而确保企业业务的持续运转。
方案供应商:IBM公司
IBM为用户生产中心灾备系统推荐的容灾方式是基于本地背对背的同步复制,以实现本地的数据冗余,同时远端采用虚拟磁带库的远程备份方案(距离1500公里),软件采用Tivoli的增量备份方式。在建立了双机集群的运行环境后,系统的可靠性得到大幅度提高。
基于IBM存储同步复制技术的数据复制和容灾方式,是目前技术成熟度高、实施快速简便、应用行之有效的数据容灾方式。通过本地的数据冗余保证了系统的高可用性和连续操作,同时通过远程的容灾实现了灾难恢复。 |