AWS Certified AI Practitioner ・ 出題 24%

生成 AI の基礎

このドメインで学ぶこと

このドメインでは、生成 AI の基盤モデル (Foundation Model) の概念、Transformer や LLM の特徴、プロンプトエンジニアリングの基本、Retrieval-Augmented Generation (RAG)、ファインチューニングなどの中核技術を学びます。AIF-C01 で出題比率 24% を占める頻出ドメインで、現代 AI 活用の中心テーマです。

重要ポイント

  • 基盤モデル (Foundation Model) - 大規模データで事前学習され、多様なタスクに転用できる汎用モデル
  • 大規模言語モデル (LLM) - テキストを扱う基盤モデル。GPT、Claude、Llama などが代表例
  • Transformer - 自己注意機構 (self-attention) を使うアーキテクチャで、現在の LLM の標準構造
  • プロンプトエンジニアリング - LLM に望む出力を引き出す指示文 (プロンプト) を設計する技術
  • ゼロショット / フューショット - 例示なし / 数例の例示で LLM にタスクを実行させる手法
  • RAG (Retrieval-Augmented Generation) - 外部知識ベースから関連情報を取得し、LLM のプロンプトに加えて回答精度を上げる
  • ファインチューニングと事前学習の違い - 事前学習は大規模データで一から学習、ファインチューニングは既存モデルを特定用途向けに追加学習
  • ハルシネーション - LLM が事実でない内容をもっともらしく生成してしまう現象。RAG や検証で抑制する

用語と概念

基盤モデル (Foundation Model)

大量の汎用データで事前学習され、ファインチューニングやプロンプトで多様なタスクに応用できる大規模モデルです。テキスト用の LLM、画像生成、音声、マルチモーダルなど用途は広がっています。Bedrock では複数の基盤モデルを API 経由で使えます。

プロンプトエンジニアリング

LLM に望む出力を引き出す指示文を工夫する技術です。役割の指定 (「あなたは医師です」)、出力形式の指定 (「JSON で答えて」)、例示の付与 (フューショット)、ステップバイステップ思考の促し (Chain-of-Thought) などのテクニックがあります。

RAG (Retrieval-Augmented Generation)

外部の知識ベース (社内ドキュメント、データベース等) から質問に関連する情報を検索し、その情報を LLM のプロンプトに加えてから回答を生成する手法です。LLM の知識が古い・存在しない情報を補い、ハルシネーションを抑制できます。Bedrock Knowledge Bases や Kendra と組み合わせて実装します。

ファインチューニングと事前学習

事前学習 (pre-training) は基盤モデルを大規模データで一から学習させる工程で、莫大な計算リソースが必要です。ファインチューニングは事前学習済みのモデルに、特定領域 (法律、医療等) の少量データで追加学習させる工程で、コストを抑えつつ専門性を高められます。

ハルシネーション (Hallucination)

LLM が訓練データにない情報や事実と異なる内容をもっともらしく生成してしまう現象です。原因はモデルが「最も自然に続きそうな文字」を生成する性質によります。RAG での根拠提示、ガードレールでの出力検証、人間レビューなどで影響を抑えます。

理解度チェック

学んだ内容を 5 問で確認しましょう