Mímisbrunnr知恵の泉

← 因果推論 一覧

🎓 レベル:基礎 | 重要度:A(必須)

この章のねらい

ランダム化実験(なぜRCTが黄金律か)が黄金律でも、現実には実験できないことが多い。かといって交絡をすべて観測して調整する(二重頑健推定AIPW)のも、未観測交絡があると破綻する。

そこで使うのが 準実験(自然実験)デザイン――制度・閾値・時間・地理が生み出す「あたかもランダムな変動」を実験の代わりにする一群の方法だ。共通する問いはひとつ:

処置を、結果の交絡から切り離して動かす変動はどこにあるか?

この章では各デザインが「どの識別の仮定のもとで因果を取り出すか」を明示し、毎回真の効果を仕込んだ擬似データで、素朴推定が外れ・正しいデザインが当てることを Python で実証する。

トピック一覧

  1. 操作変数法と2SLS 未観測交絡で処置が内生でも、関連性・除外制約・独立性を満たす操作変数と2段階最小二乗法で効果(LATE)を取り出す。OLSの偏りを2SLSが回収する様子と弱い操作変数の害を実証。

  2. 差分の差分と並行トレンド 処置群×事後の交互作用で因果を測るDID。識別の心臓は並行トレンド仮定。回帰での回収、仮定が破れたときの偏り、イベントスタディでのプレトレンド点検を実証。

  3. 回帰不連続デザイン 割当変数の閾値で処置が決まる状況を使うRDD。閾値での連続性仮定のもと局所線形回帰でジャンプ=LATEを回収。バンド幅依存性を数値と図で確認。

  4. 合成コントロール法 処置ユニットが1つの政策評価で、ドナーの凸結合で反実仮想を作るSCM。scipyで重みを最適化して効果を回収し、プラセボ検定で偽陽性でないかを確認。

  5. デザインの選び方 RCT・調整・IV・DID・RDD・SCMを「使える変動源」と「必要な識別仮定」で整理。データ状況から推奨デザインへ至る意思決定フローと、観測できるものに応じて勝つ手法が変わることを実証。

識別仮定の早見表

デザイン賭ける(多くは検証不能な)識別仮定
操作変数・2SLS除外制約・独立性(+関連性・単調性)
差分の差分並行トレンド
回帰不連続閾値での連続性(操作なし)
合成コントロール干渉なし+凸包・良好な事前フィット

どれも観察データを扱う以上、検証できない仮定に賭けている。だからこそ結論は仮定とセットで述べ、その崩れに対する頑健性(第7章の感度分析)まで報告して初めて誠実な因果主張になる。

前後のつながり