Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🎓 レベル:標準 | 重要度:B(推奨) 📎 前提:微調整の選択肢(フル・LoRA・QLoRA) | 原理:ファインチューニング(機械学習)

要点(結論先出し)

概念 ── データはチャット形式で揃える

近年のモデルはチャットテンプレート(system/user/assistant)に沿って学習・推論します。微調整データもこの形に揃えるのが自然です。

{"messages": [
  {"role": "system", "content": "あなたは簡潔に答える日本語アシスタントです。"},
  {"role": "user", "content": "ローカルLLMの利点は?"},
  {"role": "assistant", "content": "プライバシー・コスト・オフライン・制御の4点です。"}
]}

1行1サンプル(JSONL)が扱いやすい。応答の質と一貫性がそのままモデルの癖になります。

主要ハイパーパラメータ(要最新確認)

パラメータ役割起点の目安
rank (r)アダプタの表現力小さめ(例 8〜16)
alphaアダプタの効き(スケール)r と同程度〜2倍
学習率更新の大きさ小さめ(過学習防止)
エポック数データを何周するか1〜3周から
最大系列長1サンプルの上限トークンデータに合わせ最小限

ralpha、学習率は相互に効く。まず小さく回して損失と出力を見るのが安全(→ 対応lab)。

仕組み ── 学習ループの俯瞰

flowchart LR
  DATA["チャット形式データ(JSONL)"] --> TMPL["チャットテンプレート適用"]
  TMPL --> TRAIN["QLoRAで学習(アダプタ更新)"]
  TRAIN --> EVAL["検証データで確認(過学習を監視)"]
  EVAL --> CKPT["アダプタを保存"]

運用の勘所

なぜそうするか

LoRA系は更新パラメータが少ないぶん、雑なデータや過剰な学習で簡単に偏ります。小さく始めて検証を見ることで、「狙った様式だけ」を学ばせられる。データの一貫性に投資するほうが、ハイパラ探索より効くことが多いです。

⚠️ よくある落とし穴

対応lab

関連