Amazon Lookout for Metrics
機械学習でメトリクスの異常を自動検出するサービス
何ができるか
Amazon Lookout for Metrics は、ビジネスメトリクスや運用メトリクスの異常を機械学習で自動検出するサービスです。売上、Web トラフィック、エラー率などの時系列データを監視し、通常のパターンから逸脱した異常を検出して根本原因の分析を支援します。
どのような場面で使うか
EC サイトの売上異常の検出、Web サイトのトラフィック急変の検知、アプリケーションのエラー率スパイクの検出、広告キャンペーンのパフォーマンス異常の検知に利用されます。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
身近な例え
経験豊富な監視員に例えられます。ダッシュボードの数値 (メトリクス) を 24 時間監視し、「いつもと違う」パターンを検出すると、何が原因かを分析して報告します。
Lookout for Metrics とは
この記事は約 2 分で読めます。 Amazon Lookout for Metrics は、メトリクスの異常検出に特化した機械学習サービスです。データソースを接続すると、機械学習モデルが自動的にメトリクスの正常パターンを学習し、異常を検出します。静的なしきい値ではなく、季節性やトレンドを考慮した動的な異常検出を行います。
データソースとアラート
Lookout for Metrics は S3、CloudWatch、RDS、Redshift などのデータソースに対応しています。異常が検出されると、重要度スコアとともに影響を受けたディメンション (地域、製品カテゴリなど) が表示されます。SNS や Lambda と連携してアラート通知や自動対応を設定できます。
はじめかた
Lookout for Metrics コンソールで異常検出器を作成し、データソースを接続します。メトリクスとディメンションを指定すると、モデルのトレーニングが自動的に開始されます。トレーニング完了後、継続的な異常検出が開始されます。
Azure・オンプレミスとの比較
AWS の優位点
- 機械学習モデルが自動的に正常パターンを学習し、季節性やトレンドを考慮した動的な異常検出を実現
- 異常の根本原因分析として、影響を受けたディメンション (地域、カテゴリなど) を自動特定
- S3、CloudWatch、RDS など多様なデータソースに対応し、既存のデータインフラとの統合が容易
注意点
- 異常検出の精度はデータの量と質に依存する。最低でも数週間分のデータが推奨される
- メトリクス数とデータポイント数に応じた従量課金
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。