Amazon S3 Glacier 的归档策略 - 存储类的选择与检索选项
明确 Instant Retrieval、Flexible Retrieval 和 Deep Archive 的选择标准,介绍通过生命周期策略实现自动分层和通过 Vault Lock 实现合规性保障。
Glacier 存储类全貌
S3 Glacier 是面向长期归档的低成本存储,有 3 个类别。Glacier Instant Retrieval 提供毫秒级访问,比 S3 Standard-IA 最多便宜 68%。适用于每季度访问一次左右的医疗影像和新闻照片归档。Glacier Flexible Retrieval(原 S3 Glacier)提供标准检索(3-5 小时)和快速检索(1-5 分钟),适用于灾难恢复和合规性归档。Glacier Deep Archive 是最低成本的存储类,检索需要 12 小时,适用于 7-10 年以上的法规合规数据保留。
通过生命周期策略实现自动分层
通过 S3 生命周期策略,可根据对象的经过天数自动迁移存储类。典型设计为创建后 30 天迁移到 Standard-IA,90 天迁移到 Glacier Flexible Retrieval,365 天迁移到 Deep Archive。生命周期策略可通过前缀和标签进行过滤,实现桶内不同数据集的差异化管理。S3 Intelligent-Tiering 根据访问模式自动在频繁访问层和不频繁访问层之间移动对象,无需预先定义策略。
合规性与 Vault Lock
Glacier Vault Lock 将 WORM 策略应用于保管库,防止已写入数据的删除或修改。可构建符合 SEC Rule 17a-4 和 FINRA 等金融法规的防篡改归档。Vault Lock 策略一旦锁定即不可更改,建议在设置前通过测试模式进行验证。S3 Object Lock 也提供类似的 WORM 功能,可在对象级别设置保留期限和法律保留。两者的区别在于 Vault Lock 是保管库级别的策略,Object Lock 是对象级别的控制。
Glacier 的价格比较
Glacier Instant Retrieval 每 GB 每月约 0.004 美元,可毫秒级检索。Glacier Flexible Retrieval 约 0.0036 美元,标准检索(3-5 小时)每 GB 约 0.01 美元,快速检索(1-5 分钟)约 0.03 美元。Glacier Deep Archive 约 0.00099 美元,标准检索(12 小时)每 GB 约 0.02 美元。根据访问频率和检索时间要求选择最具成本效益的类别。
总结
Glacier 是以极低成本保存低访问频率数据的归档存储。根据访问频率和检索时间要求,区分使用 Instant Retrieval(毫秒检索)、Flexible Retrieval(数小时检索)和 Deep Archive(12 小时检索)三个类别。通过 S3 生命周期规则设置自动迁移,通过 Vault Lock 实现 WORM 合规性保护。