操作変数の考え方｜計量経済学

Mímisbrunnr知恵の泉

← 計量経済学一覧

🎓 レベル：標準　|　重要度：A（必須） 📎 土台：操作変数法と2SLS（因果推論・IVの識別）・識別の仮定（因果推論）・内生性とは（バイアスの源の地図）

要点（BLUF）

操作変数（IV） ＝内生変数 $x$ には効くが、結果 $y$ には $x$ を通してしか効かない外生的な変動 $z$ 。これで $x$ の「外生部分」だけを取り出して回帰します。
満たすべきは3条件：関連性（ $z$ が $x$ に効く）・除外制約（ $z$ は $y$ に直接効かない）・独立性（ $z$ が交絡と無相関＝あたかもランダム）。
直観は「 $x$ の動きのうち、交絡と無関係な部分だけを使う」。交絡まみれの $x$ の変動を捨て、 $z$ が動かした分だけで効果を測ります。

1. 問題設定：内生変数の「汚れた変動」を捨てたい

教育 $x$ →賃金 $y$ を考えます。 $x$ の変動には、(a) たまたま近所に大学があった等の外生的な理由と、(b) 能力が高いから長く学んだ等の交絡由来の理由が混ざっています。OLSは両方を使うので、(b) のぶんだけ係数が偏ります（内生性とは（バイアスの源の地図））。

操作変数の発想は明快です——(a) の外生的な変動だけを取り出して効果を測る。そのために、(a) を動かすが (b) とは無関係な変数 $z$ （例：大学までの距離）を借りてきます。

2. 3条件：なぜこれで識別できるか

flowchart LR
    Z["操作変数 z（大学までの距離）"] -->|"関連性: z→x"| X["内生変数 x（教育年数）"]
    U["未観測交絡 u（能力）"] -->|"x を汚す"| X
    U -->|"y も汚す"| Y["結果 y（賃金）"]
    X -->|"知りたい因果 β"| Y
    Z -.->|"除外制約: この矢印は無い"| Y

関連性 $\mathrm{Cov}(z,x)\neq 0$ ： $z$ が $x$ を実際に動かす。これはデータで検証できる（第1段回帰の $F$ 値）。弱いと推定が不安定に（操作変数法と2SLS）。
除外制約 $z$ は $y$ に $x$ を通してのみ効く：図で $z\to y$ の直接の矢印が無いこと。データで検証できず、経済学の論証で正当化するしかない最重要かつ最難の条件。
独立性 $\mathrm{Cov}(z,u)=0$ ： $z$ が未観測交絡と無相関＝あたかもランダムに割り当てられている。

関連性が「使える強さ」を、除外制約と独立性が「使ってよい正しさ」を保証します。後者2つは因果のIV（操作変数法と2SLS）と同じ仮定で、ここでの新しさは経済の制度・地理・政策から $z$ を探すという実装面です。

3. 経済学でよく使う操作変数

地理・距離：大学までの距離（教育の収益）、病院までの距離（医療の効果）。
制度・政策の外生変動：徴兵のくじ（軍役→所得、Angrist）、最低賃金改定のタイミング、税制改正。
天候・自然条件：降雨（農業所得→紛争）、地質（土壌→作物）。
過去の構造：歴史的な人口構成（Bartik型の需要シフト）。

いずれも「結果に直接は効かないが、内生変数を外生的に動かす」という物語が立つかが勝負。操作変数の説得力は統計でなく経済学的な論証で決まります。

⚠️ よくある誤解・落とし穴

「相関が強い変数なら操作変数になる」ではない：関連性（ $z$ - $x$ ）が強くても、除外制約が破れていれば（ $z$ が $y$ に直接効く）推定は偏ります。強さと正しさは別。
「除外制約は検定で確かめられる」ではない：過剰識別検定（Sargan/Hansen）は複数の操作変数が互いに整合的かを見るだけで、除外制約そのものは検証不能。論証が要。
「操作変数を増やせば精度が上がる」ではない：弱い操作変数を足すと弱操作変数バイアスが悪化することがあります（操作変数法と2SLS）。
「IVの係数はATE」ではない：効果が個体で異なるとき、IVが拾うのは操作変数に反応した層の効果（LATE・操作変数法と2SLS）。

関連ノート

操作変数法と2SLS（推定の実装・弱操作変数）
同時方程式モデル（外生変数を操作変数に使う同時性の文脈）
内生性とは（バイアスの源の地図）（外す対象）
操作変数法と2SLS・識別の仮定（因果推論・識別の論理）
内生性と操作変数目次
計量経済学全体目次