Amazon SageMaker 人気2017年〜
機械学習モデルの構築・トレーニング・デプロイを行う統合プラットフォーム
何ができるか
Amazon SageMaker は、機械学習 (ML) モデルのライフサイクル全体を管理する統合プラットフォームです。データの準備、モデルの構築・トレーニング、チューニング、デプロイ、モニタリングまでを 1 つのサービスで完結できます。Jupyter ノートブック環境、組み込みアルゴリズム、分散トレーニング、自動モデルチューニングなどの機能を提供します。
どのような場面で使うか
画像分類、自然言語処理、レコメンデーション、不正検知、需要予測、異常検知など、あらゆる機械学習ワークロードに利用されます。ML エンジニアからデータサイエンティストまで幅広いスキルレベルに対応しています。
身近な例え
料理教室付きのプロ仕様キッチンに例えられます。食材の下ごしらえ (データ準備) から調理 (トレーニング)、味見 (評価)、盛り付け (デプロイ) まで、すべての工程に必要な道具と場所が揃っています。初心者向けのレシピ (組み込みアルゴリズム) も用意されています。
SageMaker とは
Amazon SageMaker は、機械学習の開発から運用までをカバーする統合サービスです。SageMaker Studio という IDE (統合開発環境) を中心に、データラベリング (Ground Truth)、特徴量ストア (Feature Store)、実験管理 (Experiments)、モデルレジストリ、パイプラインなどの機能が統合されています。
トレーニングとデプロイ
SageMaker のトレーニングジョブは、指定したインスタンスタイプでモデルをトレーニングし、完了後にインスタンスを自動終了します。分散トレーニングにも対応し、大規模なデータセットでも効率的にトレーニングできます。トレーニング済みモデルはリアルタイム推論エンドポイント、バッチ変換、サーバーレス推論のいずれかの方式でデプロイできます。
SageMaker Canvas と JumpStart
SageMaker Canvas はコードを書かずに ML モデルを構築できるノーコードツールです。CSV データをアップロードして予測対象の列を選択するだけで、AutoML がモデルを自動構築します。SageMaker JumpStart は事前トレーニング済みの基盤モデル (Foundation Model) や ML ソリューションのカタログで、数クリックでデプロイできます。 SageMaker Canvas と JumpStart の知見を広げたい場合は 関連する書籍 (Amazon) も活用できます。
はじめかた
SageMaker コンソールで SageMaker Studio を起動し、Jupyter ノートブックを開きます。サンプルノートブックが多数用意されており、画像分類や自然言語処理のチュートリアルをすぐに試せます。コードを書かない場合は SageMaker Canvas から始めるのが最も簡単です。
注意点
- トレーニングインスタンスとノートブックインスタンスは時間課金のため、使用後は必ず停止すること
- リアルタイム推論エンドポイントは常時稼働で課金が発生する。トラフィックが少ない場合はサーバーレス推論を検討する
- SageMaker Studio のドメイン作成時に VPC 設定を適切に行わないと、後から変更が困難になる