Mímisbrunnr知恵の泉

← ローカルLLM 一覧

🎓 レベル:標準 | 重要度:B(推奨) 📎 前提:ローカルRAGの構成 | 原理:検索拡張生成(機械学習)

要点(結論先出し)

概念 ── 「近いベクトルを速く探す」

RAGの検索段は「質問ベクトルに最も近いチャンクベクトルを取る」処理。件数が少なければ全ベクトルとの距離を総当たり(厳密)で十分。増えると遅くなるので、**ANN(近似最近傍)**で速度を稼ぎます。

選択肢(要最新確認):

仕組み ── 保存と検索

flowchart LR
  EMB["チャンクのベクトル+メタデータ"] --> STORE["ベクトルDBに保存(永続化)"]
  Q["質問ベクトル"] --> SEARCH["近傍検索(厳密 or ANN)"]
  STORE --> SEARCH
  SEARCH --> TOPK["上位k件のチャンクを返す"]

メタデータ(出典・章)も一緒に保存し、検索結果に根拠を付けられるようにします。

選択の目安(要最新確認)

規模・用途目安
数百〜数千件・学習用numpy総当たり or Chroma
数千〜十万件Chroma / FAISS(ANN)
大規模・多人数・本番サーバ型(ローカル特化の範囲外)

運用の勘所

なぜそうするか

ローカルRAGの肝は「検索対象の文書も手元に置く」こと。組み込み型ベクトルDBはサーバを立てずに永続検索を実現し、完全オフラインのアプリと相性が良い。最初から大規模DBを入れるのは過剰で、規模が要求してから移行するのが堅実です。

⚠️ よくある落とし穴

対応lab

関連