🎓 第8章:ブートストラップとリサンプリング
第8章 ブートストラップとリサンプリング
これまでは「モデルや分布から乱数を生成」してきました。本章は逆に、手元のデータそのものを乱数の供給源にします。データを復元抽出で再標本(リサンプリング)すれば、解析的な公式がない統計量(中央値・相関・分位点…)でも、その誤差・分布・信頼区間を数値的に求められます。これは「シミュレーションに基づく推測」——理論分布の仮定を最小化し、データに語らせる手法です。ブートストラップの推定論(一致性・なぜ機能するか)は統計の本拠なので、ここはリサンプリングの手法そのものと数値挙動に集中し、統計へ wikilink します。
トピック一覧
- ブートストラップ法 — 標準
- ジャックナイフ法 — 標準
- 並べ替え検定(permutation test) — 標準
- ブートストラップ信頼区間 — 発展
この章の要点
- ブートストラップ:経験分布から 個を復元抽出して統計量を再計算、これを多数回繰り返してその分布(=標準誤差・信頼区間)を得る。
- ジャックナイフ:データを1個ずつ抜いて再計算。標準誤差とバイアスの推定に強い。分散の 補正を自動で復元します。
- 並べ替え検定:群のラベルをシャッフルして帰無分布を作る。分布を仮定しないノンパラメトリック検定。
- ブートストラップ信頼区間:パーセンタイル法・BCa 法。歪んだ分布ではパーセンタイル法が過小被覆になり、BCa で補正。
関連章
- 統計:ブートストラップ・ジャックナイフ・区間推定(母平均・母比率・母分散の信頼区間)・仮説検定の枠組み(帰無仮説・対立仮説・p値・有意水準)・ノンパラメトリック検定(符号・順位和・Wilcoxon)(推定・検定の理論)
- 第3章 推定量の信頼区間 — 解析的な信頼区間との対比
- 第1章 大数の法則と中心極限定理の役割 — リサンプリングが機能する土台