Amazon SageMaker
機械学習モデルの構築・トレーニング・デプロイを行う統合プラットフォーム
何ができるか
Amazon SageMaker は、機械学習 (ML) モデルのライフサイクル全体を管理する統合プラットフォームです。データの準備、モデルの構築・トレーニング、チューニング、デプロイ、モニタリングまでを 1 つのサービスで完結できます。Jupyter ノートブック環境、組み込みアルゴリズム、分散トレーニング、自動モデルチューニングなどの機能を提供します。
どのような場面で使うか
画像分類、自然言語処理、レコメンデーション、不正検知、需要予測、異常検知など、あらゆる機械学習ワークロードに利用されます。ML エンジニアからデータサイエンティストまで幅広いスキルレベルに対応しています。 この分野について体系的に学びたい方は、関連書籍 (Amazon) も参考になります。
身近な例え
料理教室付きのプロ仕様キッチンに例えられます。食材の下ごしらえ (データ準備) から調理 (トレーニング)、味見 (評価)、盛り付け (デプロイ) まで、すべての工程に必要な道具と場所が揃っています。初心者向けのレシピ (組み込みアルゴリズム) も用意されています。
SageMaker とは
Amazon SageMaker は、機械学習の開発から運用までをカバーする統合サービスです。SageMaker Studio という IDE (統合開発環境) を中心に、データラベリング (Ground Truth)、特徴量ストア (Feature Store)、実験管理 (Experiments)、モデルレジストリ、パイプラインなどの機能が統合されています。
トレーニングとデプロイ
SageMaker のトレーニングジョブは、指定したインスタンスタイプでモデルをトレーニングし、完了後にインスタンスを自動終了します。分散トレーニングにも対応し、大規模なデータセットでも効率的にトレーニングできます。トレーニング済みモデルはリアルタイム推論エンドポイント、バッチ変換、サーバーレス推論のいずれかの方式でデプロイできます。
SageMaker Canvas と JumpStart
SageMaker Canvas はコードを書かずに ML モデルを構築できるノーコードツールです。CSV データをアップロードして予測対象の列を選択するだけで、AutoML がモデルを自動構築します。SageMaker JumpStart は事前トレーニング済みの基盤モデル (Foundation Model) や ML ソリューションのカタログで、数クリックでデプロイできます。
はじめかた
SageMaker コンソールで SageMaker Studio を起動し、Jupyter ノートブックを開きます。サンプルノートブックが多数用意されており、画像分類や自然言語処理のチュートリアルをすぐに試せます。コードを書かない場合は SageMaker Canvas から始めるのが最も簡単です。
注意点
- トレーニングインスタンスとノートブックインスタンスは時間課金のため、使用後は必ず停止すること
- リアルタイム推論エンドポイントは常時稼働で課金が発生する。トラフィックが少ない場合はサーバーレス推論を検討する
- SageMaker Studio のドメイン作成時に VPC 設定を適切に行わないと、後から変更が困難になる
さらに詳しく知りたい方は、関連書籍 (Amazon) で理解を深められます。