🎓 第8章:モデル評価と選択
第8章 モデル評価と選択
モデルを組んだら、それが良いかを確かめます。本章は3つの問いに道具を与えます——「このモデルはデータの特徴を再現できるか(診断)」「複数のモデルのどれが予測に優れるか(予測比較)」「どちらの仮説をデータが支持するか(証拠比較)」。それぞれ事後予測チェック、WAIC/LOO、ベイズファクターが対応し、目的で使い分けます。
トピック一覧
- 事後予測チェック — 標準
- 情報量規準WAICとDIC — 発展
- 交差検証とLOO — 発展
- ベイズファクターとモデル平均化 — 発展
この章の骨格
- 事後予測チェック:複製データと検定統計量でモデルの欠陥を探す。ベイズ p 値が から外れたら不適合。
- WAIC:当てはまり − 有効パラメータの罰。事後全体を使う予測性能の規準。
- LOO-CV / PSIS-LOO:一個抜き予測。再フィットなしの重点サンプリング、 診断。WAIC と漸近一致。
- ベイズファクター:周辺尤度の比。オッカムの剃刀を内蔵するが事前依存(リンドリーの逆説)。BMA でモデル不確実性を平均。
使い分け
| 目的 | 道具 |
|---|---|
| モデルの欠陥診断(絶対評価) | 事後予測チェック |
| 予測の良いモデル選択 | WAIC / LOO |
| 意味ある事前での仮説比較 | ベイズファクター |
| モデル不確実性の取り込み | ベイズモデル平均化 |
関連章
- 第1章 信用区間と事後予測分布 — 事後予測分布(PPC の土台)
- 第4章 第4章 MCMC 目次 — WAIC/LOO の入力となる事後サンプル
- 第7章 第7章 ベイズ回帰とGLM 目次 — 評価対象の回帰モデル
- 第9章 確率的プログラミング — 評価まで含めた実装