Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🗺️ 第3章の目次です(ローカルLLM 全体目次 へ戻る)。 ⚠️ エンジンのコマンド名・対応状況は更新が速い。「要最新確認」。

第3章 ── 推論エンジン

重みを実際に計算するのが推論エンジンです。何で動かすかで速度・対応ハード・手軽さが決まります。基盤の llama.cpp、その上の体験層 Ollama、サーバ向けの vLLM/TGI を押さえ、最後に「自分のハードと用途でどれを選ぶか」を整理します。

トピック一覧

この章のゴール

隣接分野