“巨无霸”们怎么给关键业务数据做站点级灾备?存储与灾备

2015-06-25    来源:IDCUN    编辑:IDCUN
数据集中带来了风险的集中,单中心模式的数据中心伴随着较高的业务风险。硬件故障、运维人员误操作、不可抗力等诸多因素都有可能导致关键业务中断或数据丢失,如何构建关键业
  导读:数据集中带来了风险的集中,单中心模式的数据中心伴随着较高的业务风险。硬件故障、运维人员误操作、不可抗力等诸多因素都有可能导致关键业务中断或数据丢失,如何构建关键业务的多站点灾备方案,已经被摆上企业高管的“案头”。浪潮AS18000可提供多站点远程复制、级联站点远程复制等形式的多站点灾备方案,实现数据及应用在一个/多个地理位置的备份,帮助企业降低站点级灾难的影响。
 
  单中心模式下,关键数据面临风险

  尽管灾备技术已经出现了数十年,受制于投资和认知的限制或出于侥幸心理,仍有相当数量的企业级数据中心基于单中心模式构建,而这种模式显然无法抵御站点级的灾难。
可以想象,当遇到网络切断、宕机事故或不可抗力时,企业IT工作人员将不得不一边与机房和设备共存亡,一边祈祷业务中断期间的损失不要太大。
 
  单数据中心面临站点级风险
 
  还不止如此,对于总部-多分支的组织架构而言,独立建设的数据中心会形成一个个信息“孤岛”,造成IT布局分散,无法统一管理,信息资源缺乏共享,严重影响企业工作效率。
那么,如何避免单中心风险呢?

  在现阶段,各个行业都非常关注容灾系统的建设,纷纷出台针对行业自身的容灾要求,用户遵循行业要求和自身需求建设容灾系统。

  而浪潮提出的策略是:构建以AS18000为核心的多站点灾备方案。

  这是一套系统的容灾建设工程,包含需求分析、策略制定、方案实施、运维管理和增值服务等多项措施,帮助企业建立多站点远程复制或级联站点远程复制形式的关键业务数据灾备体系。

  在技术层面,数据复制技术是容灾技术的基础,高效、可靠的复制技术才能保证产生正确的数据副本,减少数据丢失量,获得更好的RPO。

  这样一来,企业数据中心的两中心、两地三中心、多分支机构、共享式等多形式的灾备需求都可以通过浪潮多站点容灾方案得到很好的满足,即使在毁灭性的站点级灾难下,也能确保业务正常持续运行。

  浪潮的多站点灾备怎么实现?

  通过AS18000的同步/异步远程复制功能,可实现两地三中心多站点容灾方案(一对多站点、一对一对一级联站点)。

  AS18000支持一对多站点容灾方式(A-B、A-C;1:2;一对多),同时支持级联站点容灾方式(A-B-C;1:1:1,一对一对一)。值得一提的是,一对多站点容灾,保证了同一份数据是从主站点存储同时复制两份过去到两个备站点,提高了数据安全性,缺点是生产存储压力大,消耗很大的生产存储资源;而一对一对一级联站点容灾,把生产存储的一部分压力转到第2个备站点存储,有效减轻生产存储的压力,保证生产中心存储业务的连续性,所以1:1:1级联站点容灾方式更易受到企业认可。
  通过AS18000的同步复制功能实现前端业务数据写入时,使数据保存到两套存储,从而保证一套存储宕机的情况下,数据保持完整性。当主存储宕机时,只需将业务切换到备存储上,就可以恢复过来,而不会损失任何数据。当备存储宕机时,不会影响前端业务。(同步:两地距离最好不超过30KM)

  同步远程复制分为四个步骤:1.前端主机发出写操作命令,数据先写到主存储的Buffer中;2.数据从主存储的Buffer中复制到备存储的Buffer中;3.当数据成功写到镜像卷中,备存储向主存储返回成功消息;4.主存储收到备存储的写确认消息后,向前端主机发送写完成确认。

  通过AS18000 的FC/IP协议的远程异步复制功能,安全构建灾备中心,将数据从主存储复制到备存储。当主机房发生灾难时,只需将业务切换到灾备机房的存储上,便可从灾难中恢复过来。AS18000的异步复制周期可灵活调整(1~120秒)。
异步远程复制需要两个步骤:1.数据写入主存储的生产卷时,复制一份在备存储的Buffer(单独划分出的一个Buffer用于异步传输)中;2.定期将数据从主存储传输到备存储的备份卷中。
   
  有读者朋友可能会问,浪潮多站点容灾方案是自动切换还是手动切换呢?一般是手动的。对于关键业务来说,数据的价值很大,数据一致性至关重要,容灾站点切换需要执行严格的审批流程, 因此在产品设计的时候,将容灾切换功能设置为手动切换。
  除了基于同步复制和异步复制机制的容灾方案,浪潮AS18000还可以提供存储层级的双活解决方案,通过双活功能模块保证存储系统层故障的零秒切换,确保零数据风险和零资源浪费,当单台存储发生故障时确保前端应用无感知的切换,切换时间近乎零秒。双活存储意味着两个存储设备同时工作,均衡业务负载,有效提升存储资源利用率,避免传统阵列缓存同步镜像所采用的一主一备模式的资源浪费。
 
   三副本技术,提升数据一致性保证

  浪潮高端存储AS18000作为面向用户核心业务的存储系统,承载着客户最关键数据,生产中心和灾备中心的数据一致性是衡量灾备系统的一个重要指标。
 
浪潮AS18000
 
  数据一致性是指关联数据之间的逻辑关系的正确性和完整性。当某种异常情况发生时, 数据并没有按照应用程序规定的逻辑关系完整的写入磁盘,应用程序读入的数据无法按照原有的逻辑进行解析,导致应用程序无法启动。数据一致性是容灾系统业务 恢复的关键。

  相比其他厂商的两副本技术(生产系统缓存一份,灾备系统一份),在业务高峰期或数据链路不好的情况下,由于生产系统缓存有限,一旦灾备系统来不及保存生产系统缓存中的数据,就可能造成生产系统缓存溢出的情况。

  浪潮高端存储AS18000具备独特的三副本技术,在生产系统的缓存、硬盘和灾备系统中各保存一份数据的副本,也就是具有2层buffer,一层是cache buffer,一层是disk pool buffer,平常链路状态好的时候,数据能及时传输到备存储的cache buffer,但是当链路状态不好的时候,数据不能及时传输过去,传统的远程复制就会导致主存储的缓存数据积压,从而引起主存储IO性能下降的现象,通过创新性的disk pool buffer机制,可以在链路延迟增加时,及时把cache buffer数据下刷到disk pool buffer,当链路延迟减小时,再由disk pool buffer提升到cache buffer再向备存储复制,真正解决了缓存空间不足导致的IO性能下降问题,同时保证数据灾备RPO=0,避免传统存储灾备依靠缓存镜像技术的性能下降问题。AS18000存储系统的三副本数据同步机制,提升了关键业务数据的处理效率和可靠性。
 
  打铁还需自身硬,AS18000具有丰富的数据保护高级功能

  高端存储AS18000具有全共享交换架构iMatrix和KB级逻辑卷技术iRAID,提高了系统自身的数据安全性。对于站点级事故而言,高端存储AS18000拥有快照、卷复制、多站点级联卷镜像等高级软件功能和容灾解决方案,确保用户数据和应用在灾备中心重现,可靠性达到99.99999%。也就是说,在多站点容灾中,AS18000可保证年均系统中断时间小于3秒,前端业务零感知。
 
  明天和意外哪个先来?不必再纠结

  从定义上看,容灾系统是为小概率事件准备,但对于企业而言,容灾系统就相当于人身保险,只有充分做好风险预估、防患于未然,才能在面临灾难时临危不惧。

  为了让容灾系统在小概率事件中能够真正发挥作用,浪潮坚持“打铁还需自身硬”的原则,在AS18000产品的日常数据一致性保障、丰富的数据保护高级功能上下足工夫,保障数据完整性。同时,领先的多站点容灾设计,更可全面满足两中心、两地三中心、多分支机构、共享式等多种灾备场景,为企业业务免除后顾之忧。
1
3