首页

华盛论文咨询网

当前位置:首页>>科技论文

医药物流企业的容灾备份建设实践

来源:华盛论文咨询网时间:2018-08-03所属栏目:科技论文

  

  摘要:为加强企业信息安全基础设施建设,有效防范灾难引起的业务连续性中断的风险,需要进行企业容灾备份建设。本文以医药物流企业为背景,基于《信息系统灾难恢复规范》中定义的等级三的要求,进行容灾备份建设,保障数据的完整性及业务系统连续性。

  关键词:数据级灾备;应急响应;切换预案;应用级灾备

  0引言

  随着建设方企业业务规模的发展,应用业务系统越来越依赖信息系统的服务支持。信息数据越来越突出地成为企业正常运作的核心。信息数据甚至已经成为了企业发展的命脉,数据安全的重要性也不言而喻。尽管在系统设计与建设时已考虑了系统的本地高可用性,但仍然存在一些可能导致系统不能正常运转的风险(如:意外断电故障、火灾事故、漏水事故、水淹事故、电缆盗割事故、恐怖事件事故、人为误操作等因素),而一旦风险爆发引起系统无法对外提供服务时,造成的影响将是毁灭性的,除直接和间接巨大的经济损失外,对企业形象、竞争优势、客户满意度等各方面也将造成难以估量的影响。

  为加强企业信息安全基础设施建设,有效防范灾难引起的业务连续性中断的风险,需要进行企业信息化基础平台优化整合及灾备项目建设。

  通过灾备系统的建设,可提高企业主中心信息系统的安全性、可靠性,确保在所评估的灾难发生时,可通过灾备中心远程数据备份将重要数据进行恢复,在灾难发生时最大限度降低数据丢失,将企业遭受的损失尽量降低。

  1建设目标

  根据国家标准《信息系统灾难恢复规范》,将灾难恢复能力划分为6级。等级三要求为:电子传输和设备支持[1],要求每天至少进行1次完全数据备份,备份介质场外存放,同时每天多次利用通信网络将关键数据定时批量传送至备用场地。配备灾难恢复所需的部分数据处理设备、通信线路和相应的网络设备。灾备系统允许有一定的数据丢失,一般不超过24h。

  综合考虑建设方核心系统对生产经营的制约关系和重要级别,本次灾备系统建设目标为:参考灾备国家标准三级建设要求,采用远程数据复制技术,实现核心系统数据库的数据级灾备。

  在本次灾备项目建设完成后的远期项目中可基于本项目建设成果,通过新增设备和专业化设计,将灾备级别进一步提升至等级四,实现核心系统的应用级灾备。

  2建设方案

  根据前期建设方现场调研的结果,确认项目容灾备份建设需求,并按照各个系统的特点进行分类,分期、分批次进行灾备建设,项目优先对重要性高的核心业务系统建设数据级灾备;后期可在本期项目基础上进行扩展,实现应用级灾备。

  本次项目在信息化基础平台优化整合的基础上,参照国家信息系统灾难恢复规范等级三的要求,建立医药物流企业数据级容灾备份平台。系统总体架构如图1所示。

图1

  2.1主中心

  核心业务系统数据库服务器基于ORACLESUN(甲骨文,太阳微系统公司)小型机服务器和SOLARIS操作系统(SOLARIS是太阳微系统公司研发的计算机操作系统)。应用服务器基于X86服务器(采用型号以“86”结尾的处理器作为中央处理器的服务器)及WINDOWS(WINDOWS是美国微软公司研发的一套操作系统)、LINUX操作系统(LINUX是一种免费使用和自由传播的、支持多用户、多任务、支持多线程和多处理器操作系统)。通过新购的威睿虚拟化管理软件及小型机虚拟化管理软件分别构建X86虚拟化资源池及小型机资源池。

  小型机虚拟化资源池重点用以运

  行核心系统的数据库,应对大业务量访问的数据库服务需求。结合小型机虚拟池化技术与操作系统集群技术,实现主机高可用。X86服务器虚拟化资源池重点用以运行应用服务、通信服务、报表服务等,结合中间件负载均衡技术、X86虚拟池化技术,实现主机高可用及快速扩展;服务器资源池中按照系统功能分担,划分虚拟机,供新建业务系统和可迁移的老系统迁移使用。

  本项目中,通过虚拟化存储控制设备构建虚拟化存储资源池,对现有存储设备进行统一管理,完成包括日立存储设备在内的整合工作,并在项目中采购IBM(InternationalBusinessMachinesCorporation,国际商业机器公司)磁盘阵列,并扩容日立存储,满足项目实施过程中数据迁移所需要的磁盘空间并进行适当的存储扩容。

  建立本地备份管理平台,结合专业备份软件,优化现有备份策略,建立1套覆盖物理机和虚拟机的统一备份系统。

  2.2备中心

  主机设备:灾备中心采用新购的SUN服务器作为需要Solaris操作系统的灾备服务器,采用将主中心系统置换下来的X86服务器作为需要Linux、Windows操作系统的灾备服务器。

  存储设备:采用主中心利旧使用的4台日立磁盘阵列作为灾备中心的存储阵列,结合虚拟化存储控制设备用于远程存放主中心拟灾备核心系统的数据库数据。

  2.3主备中心

  网络传输根据前期调研情况,财务系统高峰2h内需要传输20GB(Gigabyte,是一种十进制的信息计量单位)数据,作为参考,假设20GB数据在2h内均匀产生,即每5min产生1GB数据计算,考虑到数据不可能均匀产生,例如数据集中在某一小段时间内大量产生,以及传输存在失败重传率、专线带宽可能存在波动、财务系统传输过程中还会存在其他业务及数据的传输等因素,根据建设方要求的RPO(RecoveryPointObject,即恢复点目标,是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据)小于5min时,测算至少需专线带宽100Mb/s。

  根据各电信运营商报价情况,结合本次项目需求,综合考虑,确认主、备中心之间网络采用裸光纤实现两地互联。主中心2台核心交换机上分别配置万兆板卡及万兆模块,用于实现与波分复用设备万兆连接。灾备中心机房配置万兆防火墙实现与波分复用设备互联,这样主、备中心两网通过利旧设备和新增设备实现裸光纤万兆互联,互联示意见图2。

图2

  2.4主备中心数据复制

  在灾备建设中针对核心业务数据系统实现数据级灾备,采用专业数据复制软件进行数据复制。数据复制软件的捕获进程会实时收集源系统中数据,并通过专用网络协议将源端变化的数据传输到目标端系统中。复制软件专用进程确保网络数据包的正确顺序,目标端的应用进程将接收的信息转化为SQL(StructuredQueryLanguage,结构化查询语言)语句,然后将SQL语句发送给数据库执行。

  该软件支持增量复制方式,并对队列信息进行压缩,节约网络传输带宽,并实时将主中心核心数据库中变化的数据复制到灾备中心的数据库服务器中。由于采用的是软件级数据复制,备份中心的数据库一直处于可用状态,在将来建设应用级灾备时,核心业务系统的数据库能在很短时间内完成灾备系统的切换。

  3灾备应急响应及切换预案

  针对主中心不同的故障场景,由主中心的系统冗余设计进行灾备应对,其中针对主中心个别设备单点故障场景主要由主中心内部冗余架构进行应对;当主中心出现机房级别故障或其他导致数据丢失的故障发生时,由备中心的灾备系统提供数据恢复,在远期实现应用级灾备后可直接由远程灾备系统对外继续提供服务;当主、备中心复制过程及链路出现故障时,针对不同故障场景指定不同的应对策略。主要故障场景的应急响应处理及切换预案设计如下。

  3.1核心系统个别设备硬件故障

  主中心核心系统设备的冗余配置可应对硬件单点故障,继续对外服务;

  3.2个别核心系统应用系统故障

  主中心系统的高可用性架构可实现自动切换、继续对外服务;如果出现数据丢失情况通过本地备份系统实现数据恢复;

  3.3主中心数据丢失

  通过本地备份系统实现数据恢复;

  3.4主中心机房级别故障

  主中心停电时,由UPS(UninterruptiblePowerSupply,即不间断电源)提供临时电力供应保障,在判断短期机房外部供电无法恢复时,在UPS电力保障下采取紧急关机流程以保护系统硬件不受损害;当火灾等主中心机房级别灾故障造成核心系统数据丢失时,通过灾备中心恢复数据,在本项目完成后的远期应用级灾备项目建设完成后,对于该场景下可切换至备中心开启应用服务,恢复核心业务系统的运行及对外服务;

  3.5远程数据复制链路中断故障

  当远程数据复制链路中断,按照对应场景的策略进行应对。根据引起中断的原因的不同故障场景,采用不同处理方法。

  (1)网络失败:当灾备中心暂停或传输异常中断导致复制停止时,数据复制软件会将数据库的变化内容存储在源系统或目标系统的队列中,当系统恢复后,会自动识别复制环境,并从断点处开始复制工作。在上述过程中,主中心的业务不受任何影响。数据的一致性不会破坏;

  (2)主中心数据库手工关闭:主中心数据库恢复时可从断点继续复制,主、备中心间没有数据损失;

  (3)主中心服务器故障:主中心服务器故障修复后,当数据库和操作系统重新启动后,可以从断点继续进行数据复制;

  (4)主中心数据库故障:当主中心数据库故障修复后,当数据库重新启动后,可以从断点继续进行复制工作;

  (5)远程数据复制软件故障:远程数据复制在源系统有3个进程,目标系统有2个进程。当复制软件的进程遇到问题时,将自动重启相关进程;同时如建设方方具有第三方监控工具,可设置对相关进程进行监控,一旦发现进程异常且未自动恢复时,进行人工干预;

  (6)网络故障:当网络恢复后可以自动从断点进行复制工作;

  (7)备中心服务器故障:数据存储在复制队列中,当备中心服务器故障修复后,从断点继续进行复制工作;

  (8)备中心数据库故障:数据存储在复制队列中,当备中心数据库修复后,从断点继续进行复制工作。灾备故障处理除技术方案外,还涉及灾备管理组织与流程的建立。在项目建设过程中,承建方将协助建设方建立灾备故障处理管理组织架构,制定应急响应流程。

  4实施进度管理

  根据项目建设需求,灾备建设主要实施进度情况如下。

  4.1项目启动

  合同签订后,承建方成立实施项目组,成员包括系统工程师,存储工程师,数据库工程师,网络工程师等,明确项目组各成员的职责。项目组制定详细的项目实施计划,为项目的顺利运行奠定基础。

  4.2项目实施方案

  设计项目组针对项目需求进行现场确认,并编制详细的实施方案并经过建设方审核。同步进行设备采购,并配合建设方一同完成设备到货验收工作;配合设备供货商完成采购设备的上架、上电、连接测试等工作。

  4.3项目集成实施

  本阶段主要任务是按照项目实施计划进行所有设备的集成实施工作,主要包括:服务器、存储、网络等设备的集成实施;磁盘存储空间规划及实施;迁移方案验证及测试(联合建设方业务部门人员进行调试);主、备中心的数据实时复制的实现。在集成实施的同时,完成建设方相关技术人员培训工作。

  4.4项目集成测试(含灾备系统演练)

  本阶段主要任务是编制集成设备的集成测试方案;联合建设方业务部门人员完成集成测试及联调,确保系统可用;编制灾备演习计划;制定灾备演习场景;灾备演练时,组织相关人员对验证步骤、数据复制效果等进行验证;验证完成后重新同步数据。

  4.5系统试运行

  本阶段主要任务是系统试运行。集成测试结束后进入1个月的系统试运行期,检查系统运行的可靠性,调整完善系统性能。

  4.6系统终验

  在系统完成系统试运行后即进入项目的最后验收阶段,终验过程中承建方与建设方相关部门按项目验收方案对整个系统进行验证,并由双方负责人签字确认,在全部达到要求时,验收通过。

  4.7质保服务

  系统验收之后,正式进入质保服务阶段。

  5远期应用级灾备建设方案

  在本项目建设完成后在远期项目中将对核心业务系统进行应用级灾备建设。应用级灾备在数据级之上,进一步提供业务接管和恢复能力。应用级灾备可在灾难发生时进行网络切换和应用切换,实现应用接管。远期项目建设参考国家信息系统灾难恢复规范等级四进行建设,灾难发生时,备中心具备接管主中心核心业务的条件。针对远期项目的应用接管要求,届时需在备中心根据选定进行灾备业务系统的数量与级别,参照主中心业务系统IT基础平台配置,在灾备中心补充性能相当或低于主中心配置的IT基础平台(包括小型机服务器、X86服务器、存储等),并提供备用网络线路。新增服务器、存储资源,与本项目设备一起,采用虚拟化架构构建灾备中心的系统平台。

  正常情况下,客户端通过主中心的业务网络访问主中心的应用服务器;在发生灾难时,通过网络切换,客户端能够访问到灾备中心的备用服务器。在远期应用级灾备建设时,为保障故障发生时的快捷、稳定切换,降低对周边的影响,对目前采用IP(InternetProtocolAddress,互联网协议地址)地址访问的系统,建议首先将其访问方式优化为域名访问,优化完成后,应用级灾备切换将基于DNS(DomainNameSystem,域名系统)服务器的切换实现,所有客户端不是直接根据主机的IP地址来访问,而是根据域名来访问。基于域名访问方式,在主中心和备中心各自部署1台DNS服务器,负责各自服务器的域名解析。对于每个应用服务器的域名,DNS服务器中记录主IP地址指向主中心应用服务器的IP地址,备IP地址指向灾备中心应用服务器的IP地址。

  在所有的客户端上设置这两个DNS服务器(主中心的为主DNS服务器,备中心的为备份DNS服务器,可通过DHCP(DynamicHostConfigurationProtocol,动态主机配置协议)服务器自动分配)。系统首先查询主DNS服务器,如果没有应答,就查询备份DNS服务器。当主中心的主服务器出现故障,客户端会自动将DNS请求解析至备中心服务器的IP地址,从而实现业务系统应用的切换。

  参考文献:

  [1]中国国家标准化管理委员会,国家质量监督检验检疫总局.GB/T20988—2007信息安全技术-信息系统灾难恢复规范[S].北京:中国标准出版社,2007.

论文发表问题咨询

回到顶部