Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🎓 レベル:基礎 | 重要度:B(推奨) 📎 前提:OpenAI互換API | 原理:推論の実務(機械学習)

要点(結論先出し)

概念 ── 主要パラメータの役割

原理(サンプリングの数理)は機械学習へ → 推論の実務

仕組み ── 「絞ってから引く」

flowchart LR
  LOGITS["次トークンの分布"] --> T["temperatureで鋭さ調整"]
  T --> P["top-p・top-kで候補を絞る"]
  P --> PEN["繰り返しペナルティを適用"]
  PEN --> PICK["1トークンをサンプリング"]

温度で分布の形を決め、top-p/top-kで裾を切り、ペナルティでループを防ぎ、最後に1つ引く——この順で出力の性格が決まります。

用途別の目安(要最新確認)

用途temperature補足
事実回答・要約低め(例 0.0〜0.3)再現性・正確さ重視
コード生成低め構文の安定
一般対話中(例 0.4〜0.7)自然さと安定の両立
創作・ブレスト高め(例 0.8〜1.0+)多様性重視

top-p は 0.9 前後を起点に、繰り返しが出るなら repeat penalty を少し上げる、が定番(要最新確認)。

運用の勘所

なぜそうするか

モデルを変えなくても、サンプリングの設定だけで「堅い/柔らかい」を切り替えられる。用途ごとに既定値を決めておけば、毎回同じ品質で回せます。逆に既定のまま使うと、事実回答が無駄に揺れたり創作が単調になったりします。

⚠️ よくある落とし穴

対応lab

関連