Amazon S3 Glacier のアーカイブ戦略 - ストレージクラスの選定と取り出しオプション
S3 Glacier Instant Retrieval、Flexible Retrieval、Deep Archive の選定基準、ライフサイクルポリシーによる自動階層化を解説します。
Glacier ストレージクラスの全体像
この記事は約 3 分で読めます。 S3 Glacier は長期アーカイブ向けの低コストストレージで、3 つのクラスがあります。Glacier Instant Retrieval はミリ秒単位のアクセスを提供し、S3 Standard-IA と比較して最大 68% 安価です。四半期に 1 回程度アクセスする医療画像や報道写真のアーカイブに適しています。Glacier Flexible Retrieval (旧 S3 Glacier) は迅速取り出し (1-5 分)、標準取り出し (3-5 時間)、大容量取り出し (5-12 時間) の 3 つの取り出しオプションを提供します。年に 1-2 回アクセスするバックアップデータに適しています。Glacier Deep Archive は最安のストレージクラスで、標準取り出しに 12 時間、大容量取り出しに 48 時間かかります。規制要件で 7-10 年の保持が求められるコンプライアンスデータに最適です。
この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
ライフサイクルポリシーによる自動階層化
S3 ライフサイクルポリシーで、オブジェクトの経過日数に基づいてストレージクラスを自動的に移行できます。典型的な設計として、作成後 30 日で Standard-IA に移行、90 日で Glacier Flexible Retrieval に移行、365 日で Deep Archive に移行するポリシーが挙げられます。ライフサイクルポリシーはプレフィックスやタグでフィルタリングでき、バケット内のオブジェクトを種類ごとに異なるポリシーで管理できます。S3 Intelligent-Tiering の Archive Access 層と Deep Archive Access 層を有効にすると、アクセスパターンに基づいて自動的に Glacier 相当の階層に移行されます。日数ベースのライフサイクルポリシーと異なり、実際のアクセス頻度に基づく判断のため、予測困難なアクセスパターンのデータに適しています。
コンプライアンスと Vault Lock
Glacier Vault Lock は WORM ポリシーをボールトに適用し、一度書き込んだデータの削除や変更を防止する機能です。SEC Rule 17a-4 や FINRA などの金融規制に対応した改ざん防止アーカイブを構築できます。Vault Lock ポリシーは一度ロックすると変更不可能になるため、設定前にテストモードで検証することを推奨します。S3 Object Lock も同様の WORM 機能を提供しますが、オブジェクト単位での制御が可能で、Governance モード (特権ユーザーは解除可能) と Compliance モード (誰も解除不可) を選択できます。
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。
まとめ
Glacier はアクセス頻度の低いデータを極めて低コストで保存するアーカイブストレージです。3 つのクラスをアクセス頻度と取り出し時間の要件に応じて選定し、ライフサイクルポリシーで自動階層化を設定することで、手動管理なしにコスト最適化を実現できます。
AWS の優位点
- Glacier Deep Archive は 1 GB あたり月額約 0.002 USD で、AWS の全ストレージクラス中最安のアーカイブストレージを提供する
- Glacier Instant Retrieval はミリ秒単位のアクセスを提供し、四半期に 1 回程度アクセスするデータに最適
- S3 ライフサイクルポリシーで日数ベースの自動階層化を設定し、手動操作なしでコスト最適なストレージクラスに移行できる
- S3 Intelligent-Tiering の Archive Access 層を有効にすると、アクセスパターンに基づいて自動的に Glacier 相当の階層に移行される
- Vault Lock ポリシーで WORM (Write Once Read Many) を強制し、コンプライアンス要件に対応した改ざん防止アーカイブを構築できる