Amazon Rekognition
画像や動画の分析を API で手軽に実現できる機械学習ベースの画像認識サービス
何ができるか
Amazon Rekognition は、画像や動画の分析を API 呼び出しで実現できる機械学習ベースのサービスです。物体やシーンの検出、顔の検出と分析、テキストの読み取り、不適切なコンテンツの検出、有名人の認識など、多彩な画像分析機能を提供します。機械学習の専門知識は不要で、画像を API に送信するだけで分析結果が JSON 形式で返されます。S3 に保存された画像や動画を直接分析することも可能です。
どのような場面で使うか
ユーザーがアップロードした画像の自動タグ付けとカテゴリ分類、本人確認のための顔照合、SNS やコミュニティサイトでの不適切コンテンツの自動検出、製造ラインでの外観検査の自動化、動画内の特定シーンやオブジェクトの検出とインデックス化など、画像・動画の分析が必要な場面で利用されています。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
身近な例え
熟練の鑑定士に例えるとわかりやすいでしょう。写真を見せるだけで、写っている物体、人物の表情や年齢、文字、場所の特徴を瞬時に読み取って報告してくれます。何千枚の写真でも疲れることなく、一定の精度で分析を続けられます。
Rekognition とは
Amazon Rekognition は、AWS が提供する画像・動画分析サービスです。AWS が長年にわたって蓄積した機械学習の技術を基盤としており、事前学習済みのモデルを API 経由で利用できます。開発者は機械学習モデルの構築やトレーニングを行う必要がなく、API にリクエストを送信するだけで高精度な画像分析結果を取得できます。画像分析 (Image) と動画分析 (Video) の 2 つの API セットが提供されています。
主な機能
Rekognition は多彩な分析機能を提供します。ラベル検出は画像内の物体、シーン、アクティビティを識別します。顔検出・分析は顔の位置、表情、年齢範囲、性別を推定します。顔比較は 2 つの顔が同一人物かを判定します。テキスト検出は画像内の文字を読み取ります。コンテンツモデレーションは不適切な画像を検出します。Custom Labels 機能を使えば、独自のオブジェクト検出モデルを少量の学習データで構築することも可能です。
動画分析
Rekognition Video は、保存された動画やライブストリーミング映像を分析できます。動画内の人物の追跡、シーンの変化の検出、特定のオブジェクトの出現タイミングの特定などが可能です。Kinesis Video Streams と連携すれば、監視カメラのライブ映像をリアルタイムで分析し、特定の人物の検出や不審な行動の検知を自動化できます。分析結果にはタイムスタンプが付与されるため、動画内の特定シーンへの直接アクセスが容易です。
料金体系
Rekognition の料金は分析する画像・動画の数量に基づく従量課金です。画像分析は 1,000 画像あたりの料金が設定されており、月間の処理量に応じた段階的な割引があります。動画分析は処理した動画の分数に基づいて課金されます。無料枠として、最初の 12 ヶ月間は月間 5,000 画像の分析と 1,000 分の動画分析が無料で利用できます。Custom Labels のトレーニングと推論には別途料金がかかります。
Azure・オンプレミスとの比較
AWS の優位点
- 事前学習済みモデルを API 呼び出しだけで利用でき、機械学習の専門知識やモデルのトレーニング環境なしで高精度な画像分析を即座に開始できる
- Custom Labels 機能により、少量の学習データ (数十枚程度) から独自のオブジェクト検出モデルを構築でき、製造業の外観検査など業界固有のユースケースに対応できる
- S3 や Lambda とネイティブに統合されており、画像アップロードをトリガーとした自動分析パイプラインを最小限のコードで構築できる
注意点
- 顔認識技術の利用にはプライバシーや倫理面の配慮が必要。利用目的と対象者への通知について、各国の法規制を確認すること
- 分析精度は画像の品質 (解像度、明るさ、角度) に依存するため、入力画像の品質要件を事前に定義し、前処理で品質を担保すること
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。