Amazon EBS 卷设计与运维 - gp3 和 io2 的选型标准与快照策略
明确 gp3 和 io2 的卷类型选型标准,介绍 IOPS 和吞吐量的设计指南以及基于快照的备份策略。
EBS 卷类型选型标准
EBS 有通用 SSD(gp3/gp2)、预置 IOPS SSD(io2/io2 Block Express)、吞吐量优化 HDD(st1)和冷 HDD(sc1)四个类别。选型的起点是 gp3。gp3 基线提供 3,000 IOPS 和 125 MiB/s,无需额外费用,可根据需要独立扩展至最大 16,000 IOPS 和 1,000 MiB/s。gp2 的 IOPS 与卷大小成正比,要增加 IOPS 需要增大卷,而 gp3 消除了这一限制。io2 Block Express 面向数据库工作负载,单卷最高可达 256,000 IOPS。它是唯一提供 99.999% 年度持久性 SLA 的卷类型,适用于 Oracle 或 SAP HANA 等关键任务工作负载。st1 适合大数据和日志处理等以顺序读取为主的工作负载,以低成本提供最高 500 MiB/s 的吞吐量。
IOPS 与吞吐量设计
要估算 IOPS 需求,需要了解应用的 I/O 模式。数据库等随机 I/O 较多的工作负载以 IOPS 为瓶颈,ETL 和日志分析等顺序 I/O 以吞吐量为瓶颈。通过 CloudWatch 的 VolumeReadOps、VolumeWriteOps 指标测量实际 IOPS,如果 VolumeQueueLength 持续超过 1,说明卷已成为 I/O 瓶颈。为 gp3 添加 IOPS 时,每 IOPS 约 0.006 USD/月(东京区域)。仅当需求超过 16,000 IOPS 时才应考虑迁移到 io2。io2 每 IOPS 约 0.074 USD/月,约为 gp3 的 12 倍,因此准确估算所需 IOPS 是成本优化的关键。
快照策略与备份设计
EBS 快照采用增量方式,仅将上次快照以来变更的块保存到 S3。首次复制全部数据,第二次起仅保存差异,大幅减少存储成本和创建时间。快照自动化使用 Amazon Data Lifecycle Manager(DLM)。通过 DLM 策略定义基于标签的计划,可自动化每日和每周快照的创建与代际管理。生产环境中,通常配置 DLM 保留 7 代每日快照和 4 代每周快照。启用跨区域复制可应对区域故障的灾难恢复。Fast Snapshot Restore(FSR)消除从快照恢复的卷首次访问时的延迟惩罚。对于数据库等无法容忍首次访问延迟的工作负载,建议启用 FSR。 从基础到应用,可通过书籍 (Amazon)系统学习 EBS。
EBS 费用
gp3 每 GB 月费约 0.08 美元,包含 3,000 IOPS 和 125 MB/s 吞吐量。比 gp2(约 0.10 美元/GB)便宜 20%,且可独立设置 IOPS 和吞吐量。io2 每 GB 月费约 0.125 美元,加上每预置 IOPS 约 0.065 美元。st1(吞吐量优化 HDD)约 0.045 美元/GB,sc1(冷 HDD)约 0.015 美元/GB。以 gp3 为默认选择,仅在需要高 IOPS 时选择 io2 来优化成本。
总结 - EBS 设计最佳实践
EBS 卷设计的基本方针是从 gp3 开始,通过 CloudWatch 指标实测,按需扩展。利用 gp3 可独立调整 IOPS 和吞吐量的灵活性,避免过度预置。通过 DLM 自动化快照,并使用跨区域复制为灾难恢复做准备。卷类型变更可在线执行,无需一开始就追求最优解,基于实测数据逐步优化的方法更为有效。