AI と ML の基礎
What you will learn
このドメインでは、人工知能 (AI)、機械学習 (ML)、深層学習 (DL) の関係、教師あり学習・教師なし学習・強化学習の違い、そして ML プロジェクトを進める一般的なライフサイクルを学びます。AIF-C01 の出題比率 20% を占める基礎ドメインで、後のすべての内容の土台になります。
Key points
- AI ⊃ ML ⊃ DL の包含関係 - AI は最も広い概念、ML は AI の一手法、DL はニューラルネットワークによる ML の一手法
- 教師あり学習 - 入力と正解 (ラベル) のペアから学習。分類 (categorical) と回帰 (numerical) に分かれる
- 教師なし学習 - 正解ラベルなしでデータの構造を発見する。クラスタリング、次元削減、異常検知が代表例
- 強化学習 - エージェントが環境と相互作用し、報酬を最大化する行動を学習する
- ML ライフサイクル - データ収集 → 前処理 → 学習 → 評価 → デプロイ → モニタリングの繰り返し
- 過学習 (overfitting) - 訓練データには合うがテストデータで性能が落ちる現象。汎化性能を保つ工夫が必要
- 推論 (inference) - 学習済みモデルに新しい入力を与えて予測を得る処理。リアルタイム推論とバッチ推論がある
Terms and concepts
AI、機械学習、深層学習の関係
AI は「人間の知的振る舞いを模倣する技術」全般を指す広い概念です。ML は「データから自動的にルールを学習する」AI の一手法、DL は「多層ニューラルネットを使う」ML の一手法です。生成 AI のほとんどは DL の応用です。
教師あり学習と教師なし学習
教師あり学習はラベル付きデータから学び、画像分類や売上予測に使います。教師なし学習はラベルなしデータから構造を見つけ、顧客セグメンテーションや異常検知に使います。半教師あり学習は両者の中間です。
強化学習 (Reinforcement Learning)
エージェント (学習者) が環境に対して行動を選び、その結果として得る報酬を最大化するように戦略を学ぶ手法です。ゲーム AI、ロボット制御、レコメンドの最適化、生成 AI の RLHF (人間のフィードバックによる強化学習) で使われます。
過学習と汎化
過学習は訓練データに合わせすぎて未知のデータで性能が落ちる現象です。データ量を増やす、正則化、ドロップアウト、交差検証などで防ぎます。逆に学習不足 (underfitting) はモデルが単純すぎて訓練データすら学べない状態です。
推論 (Inference) の方式
リアルタイム推論は API リクエストごとに即座に予測を返す方式 (例: チャットボット)。バッチ推論はまとまったデータをまとめて処理する方式 (例: 夜間に全顧客の購買予測)。リアルタイムは低レイテンシ、バッチは大量データのコスト効率が利点です。
Check your understanding
Check what you have learned with 5 questions