🎓 レベル:基礎 | 重要度:A(必須)
この章のねらい
ランダム化実験(なぜRCTが黄金律か)が黄金律でも、現実には実験できないことが多い。かといって交絡をすべて観測して調整する(二重頑健推定AIPW)のも、未観測交絡があると破綻する。
そこで使うのが 準実験(自然実験)デザイン――制度・閾値・時間・地理が生み出す「あたかもランダムな変動」を実験の代わりにする一群の方法だ。共通する問いはひとつ:
処置を、結果の交絡から切り離して動かす変動はどこにあるか?
この章では各デザインが「どの識別の仮定のもとで因果を取り出すか」を明示し、毎回真の効果を仕込んだ擬似データで、素朴推定が外れ・正しいデザインが当てることを Python で実証する。
トピック一覧
-
操作変数法と2SLS 未観測交絡で処置が内生でも、関連性・除外制約・独立性を満たす操作変数と2段階最小二乗法で効果(LATE)を取り出す。OLSの偏りを2SLSが回収する様子と弱い操作変数の害を実証。
-
差分の差分と並行トレンド 処置群×事後の交互作用で因果を測るDID。識別の心臓は並行トレンド仮定。回帰での回収、仮定が破れたときの偏り、イベントスタディでのプレトレンド点検を実証。
-
回帰不連続デザイン 割当変数の閾値で処置が決まる状況を使うRDD。閾値での連続性仮定のもと局所線形回帰でジャンプ=LATEを回収。バンド幅依存性を数値と図で確認。
-
合成コントロール法 処置ユニットが1つの政策評価で、ドナーの凸結合で反実仮想を作るSCM。scipyで重みを最適化して効果を回収し、プラセボ検定で偽陽性でないかを確認。
-
デザインの選び方 RCT・調整・IV・DID・RDD・SCMを「使える変動源」と「必要な識別仮定」で整理。データ状況から推奨デザインへ至る意思決定フローと、観測できるものに応じて勝つ手法が変わることを実証。
識別仮定の早見表
| デザイン | 賭ける(多くは検証不能な)識別仮定 |
|---|---|
| 操作変数・2SLS | 除外制約・独立性(+関連性・単調性) |
| 差分の差分 | 並行トレンド |
| 回帰不連続 | 閾値での連続性(操作なし) |
| 合成コントロール | 干渉なし+凸包・良好な事前フィット |
どれも観察データを扱う以上、検証できない仮定に賭けている。だからこそ結論は仮定とセットで述べ、その崩れに対する頑健性(第7章の感度分析)まで報告して初めて誠実な因果主張になる。
前後のつながり
- 前提:バックドア基準と識別・識別の仮定(識別の言葉)、なぜRCTが黄金律か(黄金律)、回帰による調整とその限界(調整の限界)
- 数理の土台:フィッシャーの3原則(統計)・重回帰分析(統計)
- 次章へ:第6章 ベイズと構造的因果(効果の事後分布・構造方程式)