摘要:本文概述了整个灾难恢复行业的发展历程,回顾国内外灾难恢复体系建设从无到有,由简到繁,深入浅出的过程,提出了灾难恢复行业未来的发展趋势
关键词:灾难恢复;业务连续性;灾难恢复供应商
中图分类号:TP309.3 文献标识码:A
0、 引言
灾难恢复(Disaster Recovery)是指将信息系统从灾难造成的故障或瘫痪状态恢复到可正常运行状态,并将其支持的业务功能从灾难造成的不正常状态恢复到可接受状态而设计的活动和流程。它的目的是减轻灾难对企业和社会带来的不良影响,保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作。灾难恢复行业的起源是在20世纪70年代,在美国中西部地区开始建立有关灾备方面的工作,但当时主要是应对自然的灾害,保护自己的重要数据和重要的系统。灾难恢复的发展经历了三个发展阶段:第一个阶段是在90年代之前,人们最关注的是如何恢复自己的数据和信息系统,也就是IT的灾难备份;第二个阶段是从90年代到2000年左右,人们逐步从恢复灾后后台的IT系统发展到恢复支撑业务,并从业务的角度评估业务的关键程度,以及业务恢复的范围和恢复指标;2000年后,灾难恢复的发展进入第三阶段,人们以保障机构长期、持续、稳定地运行为目的,从管理的角度来看待灾难恢复和业务连续。
本文主要从三个角度来看灾难恢复在国内外的发展趋势,第一个是监管机构政策发展,第二个是行业建设发展,第三个是灾难恢复服务商。
1、 监管机构政策发展
1.1 国际上的成熟体系——国际标准组织/权威机构
在国际上,灾难恢复的监管机构的建立和政策发布最多的是美国。1988年,国际灾难备份和业务连续性管理(业务连续性管理(Business Continuity Management,“BCM”是对企业的潜在风险加以评估分析,确定其可能造成的威胁,并建立一个完善的管理机制来防止或减少灾难事件给企业带来的损失)的专业权威机构之一的DRI International(DRII)成立,它拥有遍布全球的DR/BC业务领域专家(CBCP,MBCP),致力于提高行业专业水平的业务标准和商业规范的开发和维护,发布了《业务连续性计划操作实务》等文件。美国国家标准和技术学会(NIST)在2002年发布了多项指南,包括SP 800-34 《信息技术系统的应急计划指南》(该指南为制定和维护IT应急计划提供了基本的计划原则和实务)、SP800-30《信息技术系统风险管理的指南》(该指南为制定有效的风险管理项目提供了基础信息,包括评估和消减IT系统风险所需的定义和实务指导)、SP 800-18《制定信息技术系统安全计划的指南》(该指南提供了与制定安全计划相关的知识,其中包括计划中可能涉及到的各种管理、运作和技术性控制措施的介绍),这些指南从信息技术的角度他们开始提出应急风险管理和灾难恢复。
英国金融服务管理局(FSA)制定了很多关于灾备方面的行业政策,如《The Financial Services Authority Incident management: A generic guide》(概括金融服务管理局制定业务连续性管理计划的方法的文件)、《Senior Management Arrangements, Systems and Controls》(对金融机构的业务连续性做出了规定)。澳大利亚国家审计署(ANAO)在“9.11”事件后,发布了《更佳业务连续管理实践指南 Business Continuity Management Better practice》和《业务连续性审计Business Continuity Management Follow-on Audit》,这两个指南成为“9.11”之后的最佳实践指南。在亚洲,灾难恢复体系建设比较完善的是新加坡和香港。新加坡金融管理局和香港的金融管理局,这两个金融管理单位都提出了相应的内控环节,以及在审计环节的灾难恢复和业务延续的规划和标准。此外,目前在国际上还有BS-7799、25999,ISO/IEC 27001、20000,以及新加坡SPRING等体系。从以上可以看出,灾难恢复监管的体系是有国家范畴的,比如联邦范畴,行业范畴等,标准非常多,但没有进一步统一。
1.2 国内相关灾难恢复的政策
国内的有关灾难恢复的政策,最早一份是由中共中央办公厅颁布的《国家信息化领导小组关于加强信息安全保障工作的意见》,提出了各基础网络和重要信息系统的建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。2004年,原国家网络与信息安全协调小组办公室下发了《关于做好重要信息系统灾难备份工作的通知》,2005年原国务院信息化工作办公室下发了《关于印发“重要信息系统灾难恢复指南”的通知》。
表1 国内灾难恢复有关的文件
|
发布部门
|
发布时间
|
名称
|
要 点
|
|
中共中央办公厅
|
2003年
|
《国家信息化领导小组关于加强信息安全保障工作的意见》
|
l 各基础信息网络和重要信息系统建设要充分考虑抗毁性与灾难恢复,制定和不断完善信息安全应急处置预案。
l “谁主管谁负责,谁运营谁负责”
|
|
国家网络与信息安全协调小组办公室
|
2004年
|
《关于做好重要信息系统灾难备份工作的通知》
|
l 提高抵御灾难和重大事故的能力,减少灾难打击和重大事故造成的损失、确保重要信息系统的数据安全和作业连续性,避免引起社会重要服务功能的严重中断,保障社会经济的稳定。
l 统筹规划、资源共享、平战结合。
l 灾难备份建设要从实际出发,提倡资源共享,可以采用自建、共建和利用社会化服务等模式,鼓励社会力量参与灾难备份设施建设,提倡使用社会化灾难备份服务,走专业化服务道路。
|
|
国务院信息化工作办公室
|
2005年
|
《关于印发“重要信息系统灾难恢复指南”的通知》
|
l 指明了灾难恢复工作的流程
l 灾难恢复的等级划分(六个等级)
l 灾难恢复预案的制订框架
|
|
全国信息安全标准化技术委员会
|
2007年
|
GB/T 20988-2007《信息系统灾难恢复规范》
|
l 规定了指明了灾难恢复工作的流程
l 规定了灾难恢复等级
l 规定了灾难恢复方案设计、预案、演练等框架
|
随着国家灾难恢复相关政策、标准的出台,银行业首先出台了相关的行业政策和标准。2006年4月,中国人民银行颁布了《关于进一步加强银行业金融机构信息安全保障工作的指导意见》(银发[2006]123号文),要求全国性大型银行,原则上应同时采用同城和异地灾难备份和恢复策略;区域性银行可采用同城或异地灾难备份和恢复策略;对于核心业务系统,应实施应用级备份,对于其他应用系统,可实施系统级或数据级备份;已建立灾备系统的,原则上备份与生产系统的切换至少每年演练一次。2006年8月,银监会发布的《银行业金融机构信息系统风险管理指引》(银监发[2006]63号),明确地提出金融机构应制定信息系统应急预案,并定期演练、评审和修订,省域以下数据中心至少实现数据备份异地保存。省域数据中心至少实现异地数据实时备份,全国性数据中心实现异地灾备。2007年,银监会发布的《关于开展信息科技风险自我评估系统数据填报工作的通知》(银监办通〔2007〕15号)中明确提出的业务连续性建设责任要求是“被监管机构的董事会和高级管理层对业务连续性规划及其实施效果负最终责任”。2008年2月,中国人民银行下发了《中国人民银行关于发布《银行业信息系统灾难恢复管理规范》行业标准的通知》(银发[2008]48号 ),正式发布和实施JR/T0044-2008 《银行业信息系统灾难恢复管理规范》。在2008年北京奥运期间,银监会关于应对奥运风险也连续下发的几个文件,其中有两个显著的特点,一个是从关注于全国性大型金融机构,延伸到区域性地方商业银行;二是从关注灾难恢复体系建设,延伸到突发事件管理、风险控制、内部控制。
2009年7月l日起实施,由财政部、证监会、审计署、银监会、保监会共同发布的《企业内部控制基本规范》中指出,对于上市企业要实施企业内部控制规范,其中有很多与业务连续和灾难恢复相关的内容。
总结整个灾难恢复行业发展是从全国IT信息集中过程中的安全保障,发展到数据集中当中的系统运行和安全运行,再发展至面向重要信息系统的灾备的建设,制定了整个灾备体系和指标的具体要求,以及应急体系的建设、突发事件的应对,从而有了现在的风险内控、联合应急、审计要求、媒体公关,运行安全和IT安全要求等。
2、 行业建设发展
2.1 业务连续性建设总体目标和范围的拓展
1) 形成覆盖全机构范围及重要外部利益相关机构的业务持续性管理体系,从公司治理层面建立统一的业务持续性政策、组织架构、规划活动、职责分工、流程、制度和资源等管理框架;
2) 在总体业务连续管理框架下逐步建立各业务条线、分支机构和外联单位的业务持续性计划,最终形成覆盖全面的完整的业务持续管理体系;
3) 建设能在基础设施、人员、信息数据、品牌声誉等遭受破坏性突发事件时的迅速响应能力,并将损失和影响降至最低,保障关键业务的持续运作;
4) 通过日常维护和周期性演练验证机制不断完善和改进业务持续性管理体系,提升业务持续性能力,以适应未来业务持续性管理需求。

2.2 服务体系架构的变革
过去在建立业务连续性管理或灾难备份时,需前期做调研、分析,然后规划建设范围和目标,制定建设方案,按照建设方案进行具体的灾备建设和运维。现实情况是企业认为随着企业内部的业务、流程和IT系统的不断变更,再不断的更新灾备建设,效率太低。根据实际需要,整个服务架构体系在不断进行变革。万国数据服务有限公司(简称万国数据)提供了一种面向所有的服务界面、面向最终需求的基于服务的快速架构服务。比如现在整个灾备体系中的需求有了变化:
1) 按照资源需求清单,分别参照资产配置规则、服务编排规则,启动灾备资源服务;
2) 根据需求清单,对比现有灾备资源,按照灾备资产配置清单大于或者等于灾备需求清单的原则,得到灾备资产清单;
3) 按照服务请求规则,启动灾备服务,如制定响应的人员培训、灾备预案、演练等;
4) 同时,根据服务编排规则,制定各项工作的先后顺序,并且规定各项工作标准的输入、输出的接口。
2.3 各行业灾难恢复建设
从各行业的建设上来看,银行、证券、保险、基金等金融单位这类大型机构,灾难恢复建设已初具规模,中小型机构的灾备建设刚开始起步,业务建设相对滞后;国有大型企业相对重视,已经开始规划和建立灾难恢复设施;政府机构在建设的时,信息化依赖程度高的部门会先行建设,如国税等大型行业在全国建立了统一的备份中心。政府机构的灾难恢复建设更加重视统一规划和资源共享,重视公共事件的应急体系建设。
3 、灾难恢复供应商发展趋势
传统的提供灾难恢复服务的供应商分为:软硬件提供商、存储介质厂商、备份软件提供商和数据库厂商。随着灾难恢复行业的不断发展,灾难恢复供应商的服务内容和服务能力向更广更深的领域逐渐演变。
经过多年来的发展,像万国数据这样从2000年到现在一直紧随整个行业成长起来的企业,他的服务能力有了长足进步,整个业务已经向综合化方向发展,不仅拥有了一整套业务连续性咨询体系和规划体系,包括调研、评估、策略制定、体系开发、合规等,还有一支专业的系统设计和实施团队,支持各种主流平台和通讯网络,实行全国联网的备份中心,目前万国数据全国有八个中心,能够随时提供有力保障的灾备运营和应急管理团队,有业务恢复场所,支持多种网络形式,有收单中心这样复杂的业务服务。归纳起来,未来的灾难恢复供应商的发展方向应该具有以下几个方面:
1) 成熟的业务连续性咨询服务体系;
2) 富有经验的灾难备份系统设计与实施团队;
3) 全国综合联网分布运营的灾备中心;
4) 成熟的灾备中心运营与灾难应急团队;
5) 配套的、完善的业务恢复场所;
6) 承载互联网、物理专线、卫星专线等多种网络形式;
7) 共享服务Call center、信用卡收单中心、Saas等复杂业务环境。
4 、总结
监管机构的政策发展,经历了从最初要求运行安全,到要求信息系统进行灾难恢复,最终要求整个业务的连续、应急和保障,完善整个体系的业务连续管理体系。行业的建设发展也从最基础的数据备份,到建设灾备系统,最后建设业务连续性管理体系,并且要在未来不断发展的过程中,以快速的变化和适应的能力,保证整个业务的可持续性。灾难恢复服务商从纯粹的数据复制的厂商和硬件的提供商,发展到专业化服务商,最终成为能够提供各种业务连续性综合性的服务商。这些发展和变革,表明了整个灾难恢复行业无论是监管层还是服务商都在向全面而深入的方向发展。
作者简介:汪琪(1972年生-),男,万国数据服务有限公司副总裁、首席灾备专家,硕士研究生。主要从事为国家及重点行业提供灾难恢复政策咨询,为多家银行、保险、基金、证券、政府等机构提供应急管理、灾难恢复和业务连续管理咨询和外包服务。