Amazon Macie のアイコン

Amazon Macie

S3 バケット内の機密データを機械学習で自動検出・分類するデータセキュリティサービス

何ができるか

Amazon Macie は、Amazon S3 に保存されたデータの中から個人情報 (PII)、財務データ、認証情報などの機密データを機械学習とパターンマッチングで自動的に検出・分類するセキュリティサービスです。S3 バケットのセキュリティ態勢を継続的に評価し、暗号化されていないバケットやパブリックアクセスが許可されたバケットなどのリスクを可視化します。検出結果は詳細なレポートとして提供され、データ保護規制への準拠を支援します。

どのような場面で使うか

GDPR や個人情報保護法への準拠のためのデータ監査、S3 バケットに意図せず保存された機密データの発見、データレイク内の個人情報の棚卸し、セキュリティインシデント発生時の影響範囲の特定、クラウド移行時のデータ分類と保護方針の策定など、データガバナンスとコンプライアンスの場面で活用されています。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。

身近な例え

空港の手荷物検査に例えるとわかりやすいでしょう。空港では X 線検査装置がスーツケースの中身をスキャンし、危険物を自動的に検出します。Macie は同じように、S3 バケットという「スーツケース」の中身をスキャンし、機密データという「危険物」を自動的に見つけ出します。検査員 (管理者) は、検出結果に基づいて適切な対処を行えます。

Macie とは

Amazon Macie は、S3 に保存されたデータのセキュリティとプライバシーを保護するためのフルマネージドサービスです。組織が保有するデータ量は年々増加しており、その中に含まれる機密データの所在を把握し続けることは困難になっています。Macie は機械学習とパターンマッチングを組み合わせて、クレジットカード番号、マイナンバー、パスポート番号、API キーなど 100 種類以上の機密データタイプを自動的に検出します。

S3 バケットのセキュリティ評価

Macie は、AWS アカウント内の S3 バケットのセキュリティ態勢を継続的に評価します。パブリックアクセスが許可されたバケット、暗号化が設定されていないバケット、他の AWS アカウントと共有されているバケットなどを自動的に検出し、ダッシュボードで一覧表示します。バケットレベルのインベントリにより、各バケットに格納されているオブジェクトの数、サイズ、暗号化状態、パブリックアクセス設定などを一目で把握できます。これにより、データ漏洩のリスクがあるバケットを迅速に特定し、対処できます。

検出結果の活用と自動化

Macie の検出結果は、Security Hub に自動的に集約され、他のセキュリティサービスの検出結果と統合的に管理できます。EventBridge との統合により、機密データが検出された際に自動的に通知を送信したり、Lambda 関数で自動修復アクションを実行したりすることが可能です。例えば、パブリックアクセスが許可されたバケットで機密データが検出された場合に、自動的にパブリックアクセスをブロックするといったワークフローを構築できます。Organizations との統合により、マルチアカウント環境でも一元的にデータセキュリティを管理できます。

Azure・オンプレミスとの比較

Azure の対応サービス Azure Purview (データ分類)
オンプレミスでの対応手段 Varonis、Spirion

AWS の優位点

  • S3 バケットのセキュリティ態勢を継続的に自動評価し、パブリックアクセスや暗号化の設定不備をリアルタイムで検出できるため、データ漏洩リスクの早期発見が可能
  • 100 種類以上の機密データタイプを機械学習とパターンマッチングで自動検出でき、カスタムデータ識別子の定義も可能なため、組織固有の機密データにも対応できる
  • Security Hub、EventBridge、Organizations との統合により、検出から通知、自動修復までの一連のワークフローをサーバーレスで構築でき、マルチアカウント環境でも一元管理が容易

注意点

  • Macie のスキャン対象は S3 バケットに限定されるため、RDS や DynamoDB などの他のデータストアの機密データ検出には別のアプローチが必要
  • 大量のオブジェクトをスキャンする場合はコストが増加するため、スキャン対象のバケットやプレフィックスを適切に絞り込むことが重要

さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。