AWS Resilience Hub
アプリケーションの耐障害性を評価し、復旧目標の達成状況を可視化するサービス
何ができるか
AWS Resilience Hub は、アプリケーションの耐障害性 (レジリエンス) を評価するサービスです。RTO (目標復旧時間) と RPO (目標復旧時点) を定義し、現在のアーキテクチャがこれらの目標を達成できるかを自動評価します。改善推奨と運用手順 (SOP) も生成します。
どのような場面で使うか
本番アプリケーションの耐障害性評価、DR (災害復旧) 計画の検証、コンプライアンス要件としての RTO/RPO 達成証明、アーキテクチャ変更後の耐障害性への影響評価に利用されます。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
身近な例え
建物の防災診断に例えられます。「地震 (障害) が起きたとき、何時間で業務再開 (RTO) できるか」「どの時点のデータまで復旧 (RPO) できるか」を診断し、耐震補強 (改善推奨) を提案します。
Resilience Hub とは
この記事は約 2 分で読めます。 AWS Resilience Hub は、アプリケーションの耐障害性を定量的に評価するサービスです。CloudFormation スタックや Terraform の状態ファイルからアプリケーションのリソース構成を自動検出し、各コンポーネントの障害シナリオ (AZ 障害、リージョン障害、アプリケーション障害) に対する復旧能力を評価します。
評価と改善推奨
Resilience Hub はアプリケーションの各コンポーネントに対して、推定 RTO と推定 RPO を算出します。定義した目標 RTO/RPO と比較し、目標を達成できないコンポーネントを特定します。改善推奨として、マルチ AZ 構成への変更、バックアップの追加、Auto Scaling の設定などが提示されます。運用手順 (SOP) として、障害発生時の復旧手順も自動生成されます。
はじめかた
Resilience Hub コンソールでアプリケーションを追加し、CloudFormation スタックを指定してリソースを検出します。耐障害性ポリシー (目標 RTO/RPO) を設定し、評価を実行します。評価結果のダッシュボードで、目標達成状況と改善推奨を確認できます。
Azure・オンプレミスとの比較
AWS の優位点
- RTO/RPO の目標達成状況を自動評価し、定量的な耐障害性レポートを生成
- 障害シナリオ (AZ 障害、リージョン障害) ごとの復旧能力を個別に評価
- 運用手順 (SOP) の自動生成で、障害発生時の復旧手順を事前に準備
注意点
- 評価対象のリソース数に応じた月額課金。評価を実行しない月は課金されない
- CloudFormation または Terraform で管理されたリソースが対象。手動作成のリソースは手動でインポートが必要
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。