AWS Elastic Disaster Recovery

将本地或其他云的服务器持续复制到 AWS,实现数分钟内故障转移的灾难恢复服务

概述

AWS Elastic Disaster Recovery (DRS) 是一项灾难恢复服务,通过持续的块级数据复制将源服务器的数据实时同步到 AWS。发生灾难时,可在数分钟内在 AWS 上启动恢复实例,实现 RPO 秒级、RTO 分钟级的灾难恢复目标。

持续数据复制的架构

DRS 在源服务器上安装轻量级复制代理,持续捕获块级变更并通过加密通道传输到 AWS 的暂存区域。暂存区域使用低成本的 EBS 卷存储复制数据,不消耗生产级资源。复制是异步的,对源服务器的性能影响最小(通常 CPU 增加不超过 5%)。支持 Windows 和 Linux 操作系统,以及物理服务器、VMware、Hyper-V 和其他云平台的虚拟机。

恢复演练与故障回切运营

DRS 支持非破坏性的恢复演练(Drill),可以在不影响源服务器复制的情况下启动恢复实例验证 DR 计划。演练完成后删除测试实例,复制继续进行。建议每季度执行一次演练确保 DR 计划有效。故障回切(Failback)在灾难恢复后将工作负载从 AWS 迁回原始站点。DRS 提供反向复制功能,将 AWS 上运行期间的数据变更同步回源站点,确保回切时数据完整。

启动模板与网络设计

启动设置定义恢复实例的配置:实例类型、子网、安全组、IAM 角色等。可以为不同服务器设置不同的恢复配置,例如数据库服务器使用大内存实例,Web 服务器使用通用实例。网络设计需要确保恢复后的实例能够相互通信并对外提供服务。推荐预先配置好 VPC、子网和安全组,并通过 Route 53 的 DNS 故障转移实现自动流量切换。

共有するXB!