← 機械学習テキスト 一覧

🎓 Phase 12 大規模言語モデル(ドメイン目次)

Phase 12 大規模言語モデル(LLM)目次

大規模言語モデル(LLM)は、Transformerを大規模化し、次トークン予測で膨大なテキストから学んだモデルです。この Phase は LLM 固有の仕組みを、廃れにくい原理を中心に扱います。モデル固有のスペックや最新手法は移り変わりが速いので、随所に**「要最新確認」**を置きます。

LLM のライフサイクルに沿って積み上がります。

トピック一覧

  1. LLMの全体像(基礎)— トークン化・埋め込み・自己回帰生成・推論の流れ
  2. 事前学習とスケーリング則(標準)— causal LM・データと計算と規模の関係
  3. ファインチューニング(標準)— SFT・指示チューニング・LoRA/PEFT
  4. アラインメント(発展)— RLHF・DPO・人間の選好に合わせる
  5. プロンプティングとIn-context learning(基礎)— few-shot・Chain-of-Thought
  6. 検索拡張生成(標準)— RAG・外部知識の接続・埋め込み検索
  7. 推論の実務(標準)— デコーディング・量子化・KVキャッシュ・コンテキスト長
  8. ツール使用とエージェント(発展)— 関数呼び出し・エージェント(要最新確認)
  9. 評価・ハルシネーション・安全性(標準)— ベンチマーク・幻覚・ガードレール

関連ドメイン