Mímisbrunnr知恵の泉

← 因果推論 一覧

🎓 第3章 バックドア調整(章ハブ)

第3章 バックドア調整 目次

ランダム化実験では割り当てを物理的にコイン投げにして交絡を断ち切った。しかし観察データでは割り当てを操作できない。第3章のテーマは「観測した共変量 CC で交絡を統計的に塞ぐ」こと。前提となる識別の仮定はバックドア基準と識別識別の仮定――すなわち、調整集合 CCバックドア基準を満たし、条件付き交換可能性 (Y(1),Y(0))XC(Y(1),Y(0))\perp X\mid C正値性 0<e(C)<10<e(C)<1 が成り立つこと。これらが成り立つという前提のうえで、「ではどう推定するか」を4つの道具で深める。

この章の流れ

道具は「結果をモデル化する」か「処置をモデル化する」かで大別でき、最後にそれらを融合する。

各ノートでは、真の効果を仕込んだ擬似データを作り、素朴な推定が外れ、正しく調整すると真値が戻ることを必ず数値で確認する。

トピック一覧

  1. 回帰による調整とその限界 — 共変量を回帰に入れれば交絡を塞げる(g公式)。だが線形回帰は関数形の正しさと効果の均一性を暗黙に仮定し、交絡が非線形に効くと調整しても素朴比較と変わらない。破綻と正しい関数形での回復を実証。【標準・A】
  2. 傾向スコアe(x)=P(X=1x)e(x)=P(X{=}1\mid x) は1次元のバランシングスコア。高次元共変量の代わりに ee で条件づければバランスが揃う。ロジスティック回帰で推定し、層別・最近傍マッチングで共変量バランスを改善して効果を回収。【標準・A】
  3. 逆確率重み付けIPW — 傾向スコアの逆数で重み付けし疑似母集団を再構成。Horvitz–Thompson推定量の不偏性、安定化重みによる分散低減、そして正値性が破れると重みが爆発し分散が発散することを実証。【標準・B】
  4. 二重頑健推定AIPW — 回帰調整とIPWを融合。アウトカムモデルか傾向スコアのどちらか一方が正しければ一致する二重頑健性を、導出と「片方ずつ誤特定」の数値実験で示す。次章のDouble MLへの橋渡し。【発展・B】

前提と次章への接続