Mímisbrunnr知恵の泉

bayesian statistics // 統計の第4分野

ベイズ統計

ベイズ統計は、ひとことで言えば「データを見て、信じる度合いを更新していく」統計学です。はじめに持っている見当(=事前)に、観測したデータの証拠を掛け合わせて、更新後の結論(=事後)を確率の分布として得ます。新しい事実を知るたびに考えを改めていく——人が自然にやっている学び方を、そのまま数式にしたものです。

なぜ学ぶのか

  • 少ないデータでも戦える。手持ちの知識(事前)を活かせるので、サンプルが少なくても結論を出せます。
  • 「わからなさ」を正直に扱える。答えを1つの値でなく分布で返すので、「どれくらい確かか」がそのまま分かり、意思決定に直結します。
  • AI・機械学習の土台になる。ベイズ最適化・VAE・不確実性の定量化など、現代の機械学習はベイズの考え方の上に立っています。

こんな場面で役立つ

  • A/Bテスト少ないクリック数でも「Bが勝っている確率は92%」と言える。
  • スパム判定単語の証拠を掛け合わせ「迷惑メールである確率」を更新(ナイーブベイズ)。
  • 医療・故障診断検査や観測の結果から「病気・故障の確率」を更新する。
  • AIの安全性自動運転などでモデルが「自信がない」と表明できる(不確実性の定量化)。

ふつうの統計(頻度論)が「データだけ」で答えるのに対し、ベイズは「事前の知識 + データ」で考え、答えを分布で返すのが強みです。ここでは、その考え方を数式で確かめ、コピペで動く Python コードで実際に動かしながら、ベイズ推論の枠組みから確率的プログラミングまでを全52ノートで一段ずつ体系化します。各トピックのレベル(基礎/標準/発展)はバッジで表示。基礎は統計検定サイトへ、変分推論やVAEは機械学習サイトへ相互リンクしています。

カリキュラム(全10章)

目次・インデックス

Phase 1 ── ベイズ推論の枠組み

Phase 2 ── 共役事前分布

Phase 3 ── 事後分布の解析と要約

Phase 4 ── MCMC

Phase 5 ── 階層ベイズモデル

Phase 6 ── 変分推論

Phase 7 ── ベイズ回帰とGLM

Phase 8 ── モデル評価と選択

Phase 9 ── 確率的プログラミング

Phase 10 ── 発展トピック