AWS Certified AI Practitioner ・ 出題 20%

AI と ML の基礎

このドメインで学ぶこと

このドメインでは、人工知能 (AI)、機械学習 (ML)、深層学習 (DL) の関係、教師あり学習・教師なし学習・強化学習の違い、そして ML プロジェクトを進める一般的なライフサイクルを学びます。AIF-C01 の出題比率 20% を占める基礎ドメインで、後のすべての内容の土台になります。

重要ポイント

  • AI ⊃ ML ⊃ DL の包含関係 - AI は最も広い概念、ML は AI の一手法、DL はニューラルネットワークによる ML の一手法
  • 教師あり学習 - 入力と正解 (ラベル) のペアから学習。分類 (categorical) と回帰 (numerical) に分かれる
  • 教師なし学習 - 正解ラベルなしでデータの構造を発見する。クラスタリング、次元削減、異常検知が代表例
  • 強化学習 - エージェントが環境と相互作用し、報酬を最大化する行動を学習する
  • ML ライフサイクル - データ収集 → 前処理 → 学習 → 評価 → デプロイ → モニタリングの繰り返し
  • 過学習 (overfitting) - 訓練データには合うがテストデータで性能が落ちる現象。汎化性能を保つ工夫が必要
  • 推論 (inference) - 学習済みモデルに新しい入力を与えて予測を得る処理。リアルタイム推論とバッチ推論がある

用語と概念

AI、機械学習、深層学習の関係

AI は「人間の知的振る舞いを模倣する技術」全般を指す広い概念です。ML は「データから自動的にルールを学習する」AI の一手法、DL は「多層ニューラルネットを使う」ML の一手法です。生成 AI のほとんどは DL の応用です。

教師あり学習と教師なし学習

教師あり学習はラベル付きデータから学び、画像分類や売上予測に使います。教師なし学習はラベルなしデータから構造を見つけ、顧客セグメンテーションや異常検知に使います。半教師あり学習は両者の中間です。

強化学習 (Reinforcement Learning)

エージェント (学習者) が環境に対して行動を選び、その結果として得る報酬を最大化するように戦略を学ぶ手法です。ゲーム AI、ロボット制御、レコメンドの最適化、生成 AI の RLHF (人間のフィードバックによる強化学習) で使われます。

過学習と汎化

過学習は訓練データに合わせすぎて未知のデータで性能が落ちる現象です。データ量を増やす、正則化、ドロップアウト、交差検証などで防ぎます。逆に学習不足 (underfitting) はモデルが単純すぎて訓練データすら学べない状態です。

推論 (Inference) の方式

リアルタイム推論は API リクエストごとに即座に予測を返す方式 (例: チャットボット)。バッチ推論はまとまったデータをまとめて処理する方式 (例: 夜間に全顧客の購買予測)。リアルタイムは低レイテンシ、バッチは大量データのコスト効率が利点です。

理解度チェック

学んだ内容を 5 問で確認しましょう