Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🗺️ 第4章の目次です(ローカルLLM 全体目次 へ戻る)。 ⚠️ GPU/メモリ帯域の世代・価格は更新が速い。原理(式)に寄せ、製品は「要最新確認」。

第4章 ── ハードウェアとサイジング

「載るか、載らないか」を計算で決める章です。VRAM所要を 重み + KVキャッシュ + オーバーヘッド で見積もり、デバイス別(GPU/CPU/Apple Silicon)の特性を押さえ、コンテキスト長がメモリを食う仕組みを理解し、最後にオフロードと量子化で「足りないVRAMに収める」実務をまとめます。

トピック一覧

この章のゴール

隣接分野