通过 Amazon EVS 运营混合云 - DR 站点构建与突发容量应对

介绍利用 Amazon EVS 进行混合云运营的方法,包括 DR 站点构建、按需容量突发以及与 AWS 服务的集成模式。

利用 EVS 的混合云设计模式

Amazon EVS 作为本地 VMware 环境的延伸,非常适合构建混合云。代表性的设计模式有 3 种。(1) DR 站点模式:以本地为主站点、EVS 为辅站点,通过 VMware SRM 配置自动故障转移。本地发生故障时在 EVS 上启动 VM,恢复后进行故障回切。(2) 突发模式:平时在本地运行,繁忙期或容量不足时将工作负载扩展到 EVS。通过 HCX vMotion 实时迁移 VM,高峰过后再迁回本地。(3) 开发测试模式:生产环境在本地,开发测试环境按需部署在 EVS 上,不需要时连同集群一起删除以优化成本。

DR 站点的构建与 RTO/RPO 设计

将 EVS 用作 DR 站点时,需结合 VMware SRM (Site Recovery Manager) 和 vSphere Replication。vSphere Replication 将本地 VM 异步复制到 EVS,RPO(目标恢复时间点)最短可设置为 5 分钟。SRM 定义恢复计划,自动化故障转移时的 VM 启动顺序、IP 地址重映射和 DNS 更新。RTO(目标恢复时间)取决于 VM 数量和启动顺序,数十台规模大约为 15 至 30 分钟。与本地 DR 站点相比,EVS 的优势在于无需预先采购硬件,且可在不影响生产的情况下进行 DR 测试(故障转移演练)。如果不需要 DR 站点常时运行,可采用先导灯配置(以最小配置待机,故障时扩展)来降低成本。

通过 AWS 服务集成强化运维

EVS 在 VPC 内运行,因此可直接与 AWS 托管服务集成。在备份方面,AWS Backup 支持 EVS 上的 VM,可基于策略自动化 VM 级别的备份和恢复。备份数据保存在 S3 中,通过生命周期策略自动迁移到 Glacier 以降低长期存储成本。在监控方面,可将 EVS 主机的指标(CPU、内存、存储使用率)发送到 CloudWatch,结合 vCenter 告警进行统一监控。在安全方面,GuardDuty 分析 VPC 流日志检测对 EVS 环境的可疑访问,Security Hub 统一管理安全态势。通过这些集成,可实现 VMware 运维工具与 AWS 托管服务相结合的高效运维。 关于灾难恢复 DR 从基础到应用的知识,可通过书籍 (Amazon)系统学习。

EVS 混合运营的成本

在 EVS 的 DR 站点模式中,平时以最小 3 主机配置(月费约 23,544 美元)待机,灾难时添加主机接收工作负载。在突发应对模式中,仅在高峰时添加 EVS 主机,高峰后删除,将成本转化为可变费用。通过 HCX 的实时迁移(vMotion)可在本地和 EVS 之间移动 VM,灵活调整工作负载的部署位置。将本地 VMware 环境的年度运营成本(硬件更新、数据中心费用、人工成本)与 EVS 成本进行比较,评估混合配置的经济合理性。

总结 - EVS 混合运营指南

Amazon EVS 可实现 DR 站点、容量突发、开发测试环境按需部署等多种混合云模式。VPC 集成实现与 AWS 服务的联动、SRM 实现自动故障转移、AWS Backup 实现 VM 级别的保护,这些是运维的支柱。建议从 DR 站点构建开始,在熟悉运维后逐步扩展到突发和开发环境部署的渐进式方法。