金融企业两地三中心演进多地多中心思路

1. RTO/RPO/NRO
? RTO: Recovery Time Object,恢复时间目标,指信息系统从灾难状态恢复到可运行状态所需要的时间,用来衡量容灾系统的业务恢复能力;通俗讲就是业务系统中断到重启生效的中间经历的时间,越短越好。
? RPO: Recovery Point Object,恢复点目标,是指灾难发生后,容灾系统能把数据恢复到灾难发生前时间点的数据。在实际应用中,业务数据库与灾备数据库的一致性是有时间差的,通俗讲RPO就是指灾难发生后通过灾备数据库恢复业务所丢失的数据,即灾备数据与生产数据的时间差。
? NRO: Network Recovery Objcet,网络恢复时间目标,指灾难发生后网络恢复或切换到备中心所花费的时间,NRO小于RTO才有意义。
2. 双活数据中心
典型的双活数据中心分为运营级双活和业务级双活,双活中心距离一般小于50KM。
? 运营级双活:通过运营手段实现业务的交叉容灾,具体为不同业务部署在不同的中心,互为主备

? 业务级双活:两中心同时提供一项业务,一般需要部署SLB/GLSB

2.1 运营级双活
运营级双活的两种方式
集中式网关
? 主备数据中心VRRP二层互通,业务切换网关不变。
? 部署简单,网络切换业务无感知,整网路由无变化,互联网出口单边。

  1. 二层网络网关路由注入(学习ARP),网关感知主机变化,注入32位路由,如上图;
  2. 二层网络LB健康检查路由注入,负载健康检查,注入32位路由,同上图;
  3. 三层LB路由注入,两端SLB都将VIP发布到网络中,设置路由的优先级,客户端(外部)只能看到一条路由,当某一中心DOWN后,停止发布路由,次优路由生效,如下图。
  4. 部署GSLB与本地LB联动,各数据中心LB的VIP不一样,通过GLSB联动发布不同的VIP,实现不同源访问调到不同数据中心。