Amazon Rekognition で構築する動画コンテンツモデレーション - UGC プラットフォームの安全性確保
Rekognition Video API による動画のコンテンツモデレーション、顔検索、セグメント検出の実装パターンを解説します。
Rekognition Video API の概要
Rekognition の Video API は S3 に保存された動画ファイルを非同期で分析します。StartContentModeration、StartLabelDetection、StartFaceSearch などの Start API で分析を開始し、SNS トピックに完了通知が送信されます。完了後に対応する Get API で結果を取得します。結果にはフレームごとのタイムスタンプが含まれるため、動画のどの時点で何が検出されたかを正確に把握できます。対応する動画形式は H.264 エンコードの MOV と MP4 で、最大ファイルサイズは 10 GB、最大動画長は 6 時間です。
この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
コンテンツモデレーションの実装
UGC (ユーザー生成コンテンツ) プラットフォームでは、ユーザーがアップロードした動画に不適切なコンテンツが含まれていないかを自動チェックする必要があります。S3 への動画アップロードをトリガーに Lambda で StartContentModeration を呼び出し、SNS 通知で完了を検知して結果を評価するパイプラインを構築します。検出結果には不適切コンテンツのカテゴリ (Explicit Nudity、Violence、Visually Disturbing など) と信頼度スコアが含まれます。信頼度の閾値を設定し、閾値以上の検出があった動画を自動的に非公開にするか、人間のレビューキューに送るワークフローを設計します。
顔検索とセグメント検出
顔コレクションに事前に顔画像を登録しておくと、StartFaceSearch で動画内に登録済みの顔が出現するシーンを検出できます。メディア企業での出演者の出演シーン検索、セキュリティ用途での特定人物の追跡に活用できます。セグメント検出 (StartSegmentDetection) は動画の構造を分析する機能で、ショット境界 (カメラカットの切り替わり)、黒フレーム、カラーバー、スレート、スタジオロゴ、エンドクレジットを自動識別します。放送局やストリーミングサービスでの動画編集の自動化、広告挿入ポイントの検出に有効です。
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。
まとめ
Rekognition Video API は動画コンテンツの自動分析をサーバーレスで実現するサービスです。コンテンツモデレーションで UGC プラットフォームの安全性を確保し、顔検索とセグメント検出でメディアワークフローを自動化できます。S3 と Lambda を組み合わせたイベント駆動アーキテクチャで、動画アップロードから分析完了までを完全に自動化できます。
AWS の優位点
- StartContentModeration API で動画内の不適切コンテンツ (暴力、成人向け、薬物) をフレーム単位で検出し、タイムスタンプ付きの結果を返す
- 顔コレクションに登録した顔と動画内の顔を照合し、特定人物の出現シーンを自動検出できる
- セグメント検出でショット境界、黒フレーム、カラーバー、エンドクレジットを自動識別し、動画の構造分析が可能
- 非同期処理で数時間の長尺動画にも対応し、SNS 通知で完了を検知するイベント駆動アーキテクチャを構築できる
- Streaming Video Events で Kinesis Video Streams からのリアルタイム顔検出に対応し、監視カメラの映像分析に活用できる