Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🗺️ 第2章の目次です(ローカルLLM 全体目次 へ戻る)。 ⚠️ 量子化の命名(Q4_K_M・IQ系等)はツール側で進化が速い。「要最新確認」。

第2章 ── モデル形式と量子化

ローカルで動かす鍵は「重みをどう保存し、どこまで圧縮するか」。まず重みの入れ物(safetensors と GGUF)を押さえ、次に量子化が精度をどう下げてサイズを稼ぐかを原理から理解し、代表的な方式(k-quants・GPTQ・AWQ)を比べ、最後にVRAMと品質のトレードオフを計算で詰めます。

トピック一覧

この章のゴール

隣接分野