Amazon S3 的存储设计 - 存储类别的选择与生命周期策略
通过 6 种存储类别和生命周期规则自动优化成本。介绍版本控制、复制、Object Lock 的设计方法。
S3 概述
S3 是可扩展的对象存储服务,提供 99.999999999% (11 个 9) 的耐久性。作为静态网站托管、数据湖、备份、归档等所有存储用例的基础。通过 6 种存储类别和生命周期规则,根据访问模式实现成本优化。
存储类别与生命周期
Standard 最适合频繁访问的数据,提供最低延迟。Standard-IA 适合每月访问约 1 次的数据,存储单价约为 Standard 的 45%。Glacier Instant Retrieval 适合需要毫秒级访问的归档数据,Glacier Flexible Retrieval 适合可接受数小时检索的归档数据,Glacier Deep Archive 适合每年访问 1-2 次的数据。通过生命周期策略定义「创建后 30 天迁移到 Standard-IA、90 天迁移到 Glacier、365 天迁移到 Deep Archive」等规则,自动优化成本。
版本控制与复制
启用 S3 版本控制后,对象被覆盖或删除时会保留之前的版本。通过生命周期规则在一定期间后删除旧版本,控制存储成本的增长。S3 Replication (CRR/SRR) 在存储桶之间自动复制对象,满足灾难恢复和合规要求。S3 Object Lock 实现 WORM (Write Once Read Many),用于法规要求禁止删除对象的场景。S3 Access Points 按用途分离对存储桶的访问,简化访问控制。 要全面学习存储设计的存储策略,可参考相关技术书籍 (Amazon)。
S3 的成本优化
S3 Standard 每 GB 月费约 0.023 美元,Glacier Instant Retrieval 约 0.004 美元,Glacier Deep Archive 约 0.00099 美元。通过生命周期规则设置根据访问模式自动迁移存储类别。S3 Storage Lens 可视化每个存储桶的成本明细和访问模式,识别优化机会。通过自动删除不完整的分段上传规则,防止不必要的存储消耗。请求费用因 GET (每 1,000 次约 0.0004 美元) 和 PUT (约 0.005 美元) 而异,因此根据访问模式选择存储类别很重要。
总结
S3 是对象存储的基础,通过 6 种存储类别和生命周期规则优化成本。版本控制保留对象的变更历史,复制满足灾难恢复和合规要求。Object Lock 实现 WORM,Access Points 按用途分离对存储桶的访问,提升安全性和运维效率。