AWS Resilience Hub でアプリケーションの耐障害性を評価 - RTO/RPO 目標の達成状況を可視化

Resilience Hub によるアプリケーションの耐障害性評価、RTO/RPO ポリシーの設定、改善推奨事項の活用を解説します。

Resilience Hub の概要

Resilience Hub はアプリケーションの耐障害性を評価し、RTO (例: 30 分以内の復旧) と RPO (例: 1 時間以内のデータ損失) の達成状況を可視化するサービスです。CloudFormation スタックからリソース構成を自動検出し、AZ 障害、リージョン障害、アプリケーション障害、インフラ障害の 4 つのシナリオに対する耐障害性を評価します。

評価と改善推奨

耐障害性ポリシーで各シナリオの RTO/RPO 目標を定義します。評価を実行すると、現在のアーキテクチャが目標を達成しているかが判定され、未達の場合は具体的な改善推奨事項が提示されます。マルチ AZ 構成の追加、バックアップの有効化、クロスリージョンレプリケーションの設定など、優先度付きの改善アクションが生成されます。FIS と連携して実際の障害シナリオをテストし、改善の効果を検証します。

テストと運用統合

Resilience Hub はアプリケーションの耐障害性テスト推奨を生成し、 Fault Injection Service (FIS) と連携して実際の障害シナリオをテストします。 AZ 障害、 EC2 インスタンスの停止、 RDS フェイルオーバーなどのシナリオで、アプリケーションが RTO/RPO 目標を達成できるかを検証します。評価結果のスコアカードで、各コンポーネントの耐障害性レベルを可視化し、改善の優先順位を明確にします。 SOP (Standard Operating Procedure) の自動生成で、障害発生時の対応手順を標準化します。定期的な再評価をスケジュールし、インフラ変更後の耐障害性の変化を追跡します。 Resilience Hub について体系的に学びたい方は、関連書籍 (Amazon)も参考になります。

Resilience Hub の料金

Resilience Hub の料金はアプリケーションの評価回数で課金されます。1 アプリケーションの評価あたり約 1.50 ドルで、月次の定期評価を設定した場合は月額約 1.50 ドル/アプリケーションです。FIS のテスト実行は別途 FIS の料金が発生します。評価対象のアプリケーションを重要度に基づいて選定し、全アプリケーションを一律に評価するのではなく、ビジネスクリティカルなアプリケーションから優先的に導入することでコストを管理します。

まとめ

Resilience Hub はアプリケーションの耐障害性を定量的に評価し、RTO/RPO 目標の達成状況を可視化するサービスです。CloudFormation スタックや Terraform 状態ファイルからアーキテクチャを自動検出し、AZ 障害やリージョン障害のシナリオで評価を実行します。FIS との連携で障害テストを自動化し、定期的な再評価で耐障害性の継続的な改善を実現します。