🎓 第3章 バックドア調整(章ハブ)
第3章 バックドア調整 目次
ランダム化実験では割り当てを物理的にコイン投げにして交絡を断ち切った。しかし観察データでは割り当てを操作できない。第3章のテーマは「観測した共変量 で交絡を統計的に塞ぐ」こと。前提となる識別の仮定はバックドア基準と識別と識別の仮定――すなわち、調整集合 がバックドア基準を満たし、条件付き交換可能性 と正値性 が成り立つこと。これらが成り立つという前提のうえで、「ではどう推定するか」を4つの道具で深める。
この章の流れ
道具は「結果をモデル化する」か「処置をモデル化する」かで大別でき、最後にそれらを融合する。
- 結果をモデル化 → 回帰調整(03-01)。手軽だが結果の関数形に依存。
- 処置をモデル化 → 傾向スコア(03-02)とIPW(03-03)。結果の関数形を仮定しない。
- 両者を融合 → AIPW(03-04)。どちらか一方が正しければよい二重頑健。
各ノートでは、真の効果を仕込んだ擬似データを作り、素朴な推定が外れ、正しく調整すると真値が戻ることを必ず数値で確認する。
トピック一覧
- 回帰による調整とその限界 — 共変量を回帰に入れれば交絡を塞げる(g公式)。だが線形回帰は関数形の正しさと効果の均一性を暗黙に仮定し、交絡が非線形に効くと調整しても素朴比較と変わらない。破綻と正しい関数形での回復を実証。【標準・A】
- 傾向スコア — は1次元のバランシングスコア。高次元共変量の代わりに で条件づければバランスが揃う。ロジスティック回帰で推定し、層別・最近傍マッチングで共変量バランスを改善して効果を回収。【標準・A】
- 逆確率重み付けIPW — 傾向スコアの逆数で重み付けし疑似母集団を再構成。Horvitz–Thompson推定量の不偏性、安定化重みによる分散低減、そして正値性が破れると重みが爆発し分散が発散することを実証。【標準・B】
- 二重頑健推定AIPW — 回帰調整とIPWを融合。アウトカムモデルか傾向スコアのどちらか一方が正しければ一致する二重頑健性を、導出と「片方ずつ誤特定」の数値実験で示す。次章のDouble MLへの橋渡し。【発展・B】
前提と次章への接続
- 前提(第1章):バックドア基準と識別(調整集合の選び方)/識別の仮定(交換可能性・正値性・SUTVA)。本章はこれらが成り立つ前提での推定の話。識別が崩れていれば、どの推定量も等しく誤る。
- 次章(第4章)への接続:アウトカムモデル や傾向スコア を機械学習で柔軟に推定したくなる。だが素朴にMLを使うと正則化バイアスが乗る(MLをそのまま使うと因果を誤る理由)。AIPWの二重頑健構造とクロスフィッティングを組み合わせて、それを克服するのがDouble/Debiased Machine Learning(DML)。本章はその古典的原型にあたる。
- 土台(他サイト):回帰の基礎は重回帰分析(統計)、傾向スコア推定はロジスティック回帰(機械学習)。