Mímisbrunnr知恵の泉

← 因果推論 一覧

🎓 第2章:ランダム化実験

第2章 ランダム化実験

第1章で「観察データを因果と読むには交換可能性などの仮定が要る」ことを見ました(識別の仮定)。本章はその仮定をデータ収集の設計段階で保証する方法=ランダム化実験(RCT)を扱います。ランダム割り当ては処置を潜在結果から独立にし、交絡を断つので、素朴な群間差がそのまま平均処置効果(ATE)の不偏推定になります。

そのうえで実務の3論点へ進みます。精度を上げる(共変量調整・層別・ブロック化で分散を下げる)、設計する(A/Bテストで必要サンプルサイズを検出力から逆算する)、理想が崩れたとき(非遵守があるとITTは希釈され、遵守者効果LATEはWald推定で回収する)。一貫して識別(どんな仮定なら因果か)と推定(どう測るか)を分け、真の効果を仕込んだ擬似データで推定量の当たり外れをコードで確かめます。

統計検定サイトの フィッシャーの3原則(反復・無作為化・局所管理)・乱塊法・ラテン方格(ブロック化)・第一種の過誤・第二種の過誤・検出力(2種類の誤りとトレードオフ・サンプルサイズ設計)(検出力設計)・母比率・母分散の検定(A/Bの分析)が数理的な土台です。

トピック一覧

  1. なぜRCTが黄金律か — 基礎・ランダム化が処置を潜在結果から独立にし交換可能性を設計で保証する。同一母集団の観察データ(素朴差は偏る)とRCT(不偏)を擬似データで対比し、共変量バランスも数値で確認。
  2. 共変量調整と層別とブロック化 — 標準・フィッシャーの3原則を因果で読み直す。調整・層別・ブロック化は不偏性を変えず分散だけ下げる。回帰調整とブロック化で標準誤差が縮むことを多数反復で実証。
  3. ABテストの設計と分析 — 標準・A/BテストはWebのRCT。有意水準・検出力・MDEから必要nを逆算し、2標本比率の検定で分析。第一種の過誤と検出力が設計通りになることをシミュレーションで検証、CUPEDも。
  4. 非遵守とITT — 標準・割り当てと実際の処置が食い違う非遵守。ITTは希釈・as-treatedは偏り、遵守者効果LATEをWald推定(ITT効果÷遵守率)で回収。操作変数法への橋渡し。

学びの順序

02-01(なぜランダム化で因果が言えるか=偏りを断つ)→ 02-02(同じ不偏推定でも精度を上げる=ばらつきを下げる)→ 02-03(実務での設計=何人集めるか)→ 02-04(理想が崩れる現実=非遵守とLATE)の順に、識別の根拠から実装・破れへ積み上がります。

関連章