責任ある AI のガイドライン
このドメインで学ぶこと
このドメインでは、AI システムを社会や利用者に対して責任ある形で開発・運用するためのガイドラインを学びます。AWS が掲げる「責任ある AI」の 6 つの観点 (公平性、説明可能性、プライバシー、セキュリティ、堅牢性、ガバナンス) と、SageMaker Clarify、SageMaker Model Monitor などの実装ツールを把握することがゴールです。
重要ポイント
- 責任ある AI の 6 観点 - 公平性 (Fairness)、説明可能性 (Explainability)、プライバシー、安全性 / セキュリティ、堅牢性 (Robustness)、ガバナンス
- バイアス - 訓練データや設計の偏りでモデルが特定属性 (性別、人種等) に不公平な予測をする問題
- 説明可能性 (Explainability) - モデルの予測根拠を人間が理解できる形で示す能力。判断の納得感に関わる
- SageMaker Clarify - データやモデルのバイアスを検出し、特徴量の重要度で説明可能性を提供するツール
- SageMaker Model Monitor - 本番運用中のモデルが訓練時と異なる挙動 (データドリフト) を示していないか監視
- プライバシー - 個人情報を訓練データに混入させない、推論時に出力させない設計が重要
- AWS AI Service Cards - AWS の各 AI サービスについて意図された用途と制限を文書化したカード
用語と概念
責任ある AI の 6 つの観点
AWS は責任ある AI を 6 つの観点で整理しています。公平性 (差別の排除)、説明可能性 (判断根拠の説明)、プライバシー (個人情報の保護)、安全性 / セキュリティ (悪意ある利用の防止)、堅牢性 (異常入力への耐性)、ガバナンス (組織的管理) です。すべての AI 開発で意識すべき指針です。
バイアスと公平性
訓練データに偏りがあると、モデルが特定属性 (性別、人種、年齢等) に対して不公平な予測をする「バイアス」が発生します。例えば過去の採用データに男性比率が高ければ、モデルが男性を有利に評価する恐れがあります。データのリバランス、フェアネス指標による評価、訓練データのレビューで防ぎます。
説明可能性 (Explainability)
モデルがなぜその予測をしたかを人間が理解できる形で示す能力です。融資審査や医療診断では「なぜ拒否されたか / なぜその診断か」を説明できないと納得感が得られません。SHAP 値や特徴量重要度で説明することが多く、SageMaker Clarify が AWS の主要ツールです。
SageMaker Clarify と Model Monitor
Clarify は訓練前のデータバイアス検出、訓練後のモデルバイアス検出、特徴量重要度による説明可能性を提供します。Model Monitor は本番運用中のモデルが訓練時と異なる挙動 (データドリフトや予測ドリフト) を示していないかを継続監視します。両者は責任ある AI の実装の中核ツールです。
AWS AI Service Cards
AWS は各 AI サービスについて、意図された用途、制限事項、責任ある使用のガイドラインを記載した「AI Service Card」を公開しています。例えば Rekognition の顔比較機能には「法執行への利用は推奨しない」などの制限が明記されています。サービスを採用する前に確認すべき重要なドキュメントです。
理解度チェック
学んだ内容を 5 問で確認しましょう