Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🎓 レベル:標準 | 重要度:A(必須) 📎 前提:ローカルRAGの構成 | 原理:検索拡張生成(機械学習)

要点(結論先出し)

概念 ── 全部入りをローカルで閉じる

これまでの部品を1台(または社内LAN)に閉じます:

一度モデルと依存を揃えれば、ネットを切っても動くのが完全ローカルの強みです。

仕組み ── 閉じた構成図

flowchart LR
  UI["ローカルUI・アプリ"] --> API["OpenAI互換API(手元)"]
  API --> GEN["生成モデル(Ollama・llama.cpp)"]
  UI --> RAG["RAG層"]
  RAG --> EMB["埋め込みモデル(手元)"]
  RAG --> DB["ベクトルDB(手元・永続化)"]
  DB --> API

すべての矢印が手元の中で閉じる。外向きの通信が無いので、エアギャップでも成立します。

構築の段取り

  1. モデル・埋め込み・依存パッケージをオンラインで先に揃える(エアギャップ前に)
  2. ベクトルDBに文書をインデックス(→ ローカルRAGの構成
  3. OpenAI互換APIでアプリと接続(→ OpenAI互換API
  4. ネットを遮断して動作確認(本当に外部依存が無いか)

なぜそうするか

クラウドAPIは便利でも「データが外に出る」のが本質的制約。機密・個人情報・規制データを扱うなら、その制約自体が採用不可の理由になります。完全ローカルは**「速いから」ではなく「出せないから」選ぶ**構成。要件が”データを外に出さない”なら、これが唯一解になり得ます。

⚠️ よくある落とし穴(残るリスク)

対応lab

関連