Amazon SageMaker Canvas でノーコード ML - ビジュアルインターフェースで予測モデルを構築
コーディング不要で ML モデルを構築するビジュアルツール。CSV をアップロードして予測対象を選ぶだけでモデルが完成し、Studio との双方向共有も可能です。
SageMaker Canvas の概要
SageMaker Canvas はコーディング不要で ML モデルを構築・予測できるビジュアルインターフェースです。SageMaker Studio がデータサイエンティスト向けの IDE であるのに対し、Canvas はビジネスアナリストや非エンジニアが ML を活用するためのツールです。CSV ファイルをアップロードし、予測対象の列を選択するだけでモデルが構築されます。
モデル構築と予測
データセットをインポートし、予測対象の列 (ターゲット) を選択すると、Canvas が自動的にデータの分析、特徴量エンジニアリング、アルゴリズムの選択、ハイパーパラメータの最適化を実行します。Quick Build は 2-15 分で概算精度のモデルを構築し、Standard Build は 2-4 時間で高精度のモデルを構築します。構築したモデルで新しいデータの予測を実行し、結果を CSV でダウンロードできます。Ready-to-use モデルは事前トレーニング済みの Bedrock モデルを Canvas から直接利用する機能で、感情分析やテキスト要約を即座に実行できます。
モデル共有と自動再トレーニング
Canvas で構築したモデルは SageMaker Studio に共有し、データサイエンティストが Python コードで詳細なチューニングや評価を行えます。逆に、 Studio で構築した高度なモデルを Canvas にインポートし、ビジネスアナリストが GUI で予測を実行することも可能です。自動再トレーニングをスケジュール設定すると、新しいデータが追加されるたびにモデルが自動的に更新され、予測精度の劣化を防止します。 Canvas は時系列予測、分類、回帰、画像分類、テキスト分類の問題タイプに対応し、データセットのターゲット列を選択するだけで適切なアルゴリズムが自動選択されます。 SageMaker Canvas のモデル設計を理解するうえで関連書籍 (Amazon)が参考になります。
Canvas の料金
Canvas のセッション料金はワークスペースの使用時間で課金され、1 時間あたり約 1.90 ドルです。モデルのトレーニングはトレーニング時間とインスタンスタイプで別途課金されます。クイックビルド (2-15 分) は探索的な分析に適し、スタンダードビルド (2-4 時間) はより高精度なモデルを構築します。クイックビルドで十分な精度が得られる場合は、スタンダードビルドを省略してコストを削減します。Canvas のセッションを使用しない時間帯はログアウトして課金を停止します。Ready-to-use モデル (感情分析、テキスト抽出) は追加トレーニングなしで利用でき、トレーニングコストが不要です。
まとめ
SageMaker Canvas はノーコードで ML モデルを構築するビジュアルツールです。ビジネスアナリストが自らデータ分析と予測を実行し、Studio との双方向のモデル共有でデータサイエンティストとの協業を実現します。時系列予測、分類、回帰、画像分類に対応し、自動再トレーニングで予測精度の劣化を防止します。Ready-to-use モデルで追加トレーニングなしに感情分析やテキスト抽出を利用できます。