← 統計検定テキスト 一覧

📊 対象級:1級 | 重要度:A(頻出)

要点(BLUF)

説明変数が誤差項と相関する(内生性 Cov(x,u)0\mathrm{Cov}(x,u)\ne 0)と、OLS は標本をいくら増やしても真の値に収束しません(不一致)。これを救うのが**操作変数法(IV)と、その一般形である2段階最小二乗法(2SLS)**です。社会科学分野では最頻出の道具立てなので、不一致の証明から識別条件まで一気に押さえます。

1級(統計応用・社会科学)では内生性の判定・操作変数の2条件・2SLSの手順・識別条件(次数/階数)が問われます(範囲・配点は改訂されうるため要最新確認)。

graph TD
  ROOT["内生性<br/>Cov(x,u) ≠ 0"] --> SRC["3つの源泉"]
  SRC --> SIM["同時性<br/>x と y が相互決定"]
  SRC --> OMIT["欠落変数<br/>交絡因子が u に紛れ x と相関"]
  SRC --> MEAS["測定誤差<br/>x の観測値に雑音"]
  ROOT --> PROB["OLS が不一致<br/>plim β̂ = β + Cov(x,u)/V(x)"]
  PROB --> SOL["解決策"]
  SOL --> IV["操作変数法 IV<br/>関連性 + 外生性を満たす z"]
  IV --> TSLS["2段階最小二乗法 2SLS<br/>x̂ で内生変動を除去<br/>過剰識別にも対応"]
  TSLS --> SEM["同時方程式モデル<br/>構造形→誘導形・識別条件"]

1. 内生性問題 — なぜOLSが壊れるのか

1.1 OLSが一致するための核心条件

単回帰 yi=β0+β1xi+uiy_i = \beta_0 + \beta_1 x_i + u_i を考えます。OLS が一致推定量(標本を増やすと真値に収束)であるための核心条件は、説明変数と誤差が無相関であること、すなわち

Cov(x,u)=0(外生性)\mathrm{Cov}(x,u)=0\quad(\text{外生性})

です。要するに「xxuu に含まれる『その他の要因』とは無関係に動いていなければならない」。これが破れる(Cov(x,u)0\mathrm{Cov}(x,u)\ne0)状態を内生性、その xx内生変数と呼びます。

1.2 内生性でOLSが不一致になることの証明

OLS 推定量(傾き)の標本表現から出発します。

β^1OLS=Cov^(x,y)V^(x)\hat\beta_1^{OLS}=\frac{\widehat{\mathrm{Cov}}(x,y)}{\widehat{V}(x)}

ここに真のモデル yi=β0+β1xi+uiy_i=\beta_0+\beta_1 x_i+u_i を代入します。共分散は定数 β0\beta_0 には反応せず、β1x\beta_1 xuu に分解できるので

Cov^(x,y)=Cov^(x, β0+β1x+u)=β1V^(x)+Cov^(x,u)\widehat{\mathrm{Cov}}(x,y)=\widehat{\mathrm{Cov}}(x,\ \beta_0+\beta_1 x+u)=\beta_1\,\widehat{V}(x)+\widehat{\mathrm{Cov}}(x,u)

要するに「xxyy の共分散は、傾き β1\beta_1 ぶんの『xx 自身のばらつき』と、『xx と誤差の共分散』に分かれる」。これを上の式に入れて整理すると

β^1OLS=β1+Cov^(x,u)V^(x)\hat\beta_1^{OLS}=\beta_1+\frac{\widehat{\mathrm{Cov}}(x,u)}{\widehat{V}(x)}

標本を大きくすると標本モーメントは母モーメントに確率収束する(大数の法則)ので、両辺の確率極限(plim)を取って

  β^1OLSpβ1+Cov(x,u)V(x)  \boxed{\;\hat\beta_1^{OLS}\xrightarrow{p}\beta_1+\frac{\mathrm{Cov}(x,u)}{V(x)}\;}

要するに「OLS が収束する先は、真値 β1\beta_1 に『Cov(x,u)/V(x)\mathrm{Cov}(x,u)/V(x)』というズレを足した値」。ここがこの分野で最も重要な一行です。読み取るべきことは2つ:

バイアスの向きもこの式が教えてくれます。Cov(x,u)>0\mathrm{Cov}(x,u)>0 なら OLS は β1\beta_1過大評価Cov(x,u)<0\mathrm{Cov}(x,u)<0 なら過小評価します(V(x)>0V(x)>0 は常に正なので符号は分子で決まる)。

⚠️ 「バイアス(有限標本のズレ)」と「不一致(漸近のズレ)」は概念上は別ですが、内生性は両方を引き起こします。試験では「標本を増やせば直るか?」が問われ、答えは「直らない(不一致だから)」です。これが内生性が深刻な理由です。

1.3 内生性の3つの源泉

Cov(x,u)0\mathrm{Cov}(x,u)\ne0 が現実に生じる典型は3つです。

flowchart TD
  A["内生性 Cov(x,u)≠0 の源泉"] --> S["① 同時性<br/>simultaneity"]
  A --> O["② 欠落変数<br/>omitted variable"]
  A --> M["③ 測定誤差<br/>measurement error"]
  S --> S1["y が x を決め返す<br/>例:価格と需要量が市場で同時決定"]
  O --> O1["交絡因子を入れ忘れ u に残る<br/>例:能力を落とすと教育年数と u が相関"]
  M --> M1["x を雑音つきで観測<br/>観測 x* = x + 測定誤差"]

① 同時性(連立性). xxyy が互いに相手を決める関係。例:価格 pp と需要量 qq。需要関数 q=α0+α1p+uq=\alpha_0+\alpha_1 p+u を推定したいが、市場では需要ショック uu(流行など)が価格 pp をも押し上げる。すると Cov(p,u)0\mathrm{Cov}(p,u)\ne0pp は内生。これが同時方程式モデル(第3節)の動機です。

② 欠落変数(交絡). 本来モデルに入れるべき変数を落とすと、それが誤差項 uu に紛れ込む。落とした変数が xx と相関していれば Cov(x,u)0\mathrm{Cov}(x,u)\ne0。例:賃金 =β0+β1(教育年数)+u=\beta_0+\beta_1(\text{教育年数})+u能力を観測できず落とすと、能力は uu に入り、能力の高い人ほど教育年数も長いので Cov(教育,u)>0\mathrm{Cov}(\text{教育},u)>0。教育のリターンが過大評価されます。

③ 測定誤差. 真の xx ではなく雑音つきの x=x+ex^\ast=x+e を観測。真のモデル y=β0+β1x+uy=\beta_0+\beta_1 x+uxx^\ast で回した式は誤差が uβ1eu-\beta_1 e になり、これが xx^\ast と(ee を通じて)相関する。結果は減衰バイアス(attenuation bias)β^1\hat\beta_1 が0に向かって縮む。古典的測定誤差では係数が必ず縮小方向に偏ります。

要するに「同時性・欠落変数・測定誤差のどれも、説明変数を誤差項と相関させてOLSを不一致にする。そして3つとも、後述の操作変数法で同時に対処できる」。


2. 操作変数法(IV)

2.1 操作変数の2条件

内生変数 xx を、誤差と無相関な「外からの押し」で動かしたい。その役を果たすのが操作変数(instrumental variable) zz です。zz は次の2条件を満たさねばなりません。

  (1) 関連性(relevance): Cov(z,x)0(2) 外生性(exogeneity / 除外制約): Cov(z,u)=0  \boxed{\; \text{(1) 関連性(relevance):}\ \mathrm{Cov}(z,x)\ne0 \qquad \text{(2) 外生性(exogeneity / 除外制約):}\ \mathrm{Cov}(z,u)=0 \;}
graph LR
  Z["操作変数 z"] -->|"関連性 Cov(z,x)≠0"| X["内生変数 x"]
  X --> Y["結果 y"]
  U["誤差 u(交絡)"] -->|"内生性 Cov(x,u)≠0"| X
  U --> Y
  Z -. "外生性 Cov(z,u)=0<br/>(この破線の矢印が無いこと)" .-> U
  Z -. "除外制約<br/>(この直接矢印が無いこと)" .-> Y

図の読み方:zz から yy への影響は**xx を経由する1本だけ**。zz から uuyy への直接の矢印がないこと(破線が存在しないこと)が外生性・除外制約です。

良い操作変数の例.

2.2 単純IV推定量とその一致性の証明

操作変数が1つで内生変数が1つのちょうど識別の場合、IV 推定量は

  β^1IV=Cov^(z,y)Cov^(z,x)  \boxed{\;\hat\beta_1^{IV}=\frac{\widehat{\mathrm{Cov}}(z,y)}{\widehat{\mathrm{Cov}}(z,x)}\;}

です。OLS の式 Cov^(x,y)/V^(x)\widehat{\mathrm{Cov}}(x,y)/\widehat V(x) と比べると、分母・分子の片方の xxzz に置き換えた形になっています(V^(x)=Cov^(x,x)\widehat V(x)=\widehat{\mathrm{Cov}}(x,x) なので「xx の代わりに zz で測る」と読める)。

一致性の証明. 真のモデル yi=β0+β1xi+uiy_i=\beta_0+\beta_1 x_i+u_i を分子に代入します。zz と定数 β0\beta_0 の共分散は0なので

Cov^(z,y)=Cov^(z, β0+β1x+u)=β1Cov^(z,x)+Cov^(z,u)\widehat{\mathrm{Cov}}(z,y)=\widehat{\mathrm{Cov}}(z,\ \beta_0+\beta_1 x+u)=\beta_1\,\widehat{\mathrm{Cov}}(z,x)+\widehat{\mathrm{Cov}}(z,u)

要するに「zzyy の共分散は、傾きぶんの『zzxx の共分散』+『zz と誤差の共分散』に分かれる」。これを推定量に入れると

β^1IV=β1+Cov^(z,u)Cov^(z,x)\hat\beta_1^{IV}=\beta_1+\frac{\widehat{\mathrm{Cov}}(z,u)}{\widehat{\mathrm{Cov}}(z,x)}

ここで確率極限を取ります。大数の法則で標本共分散は母共分散に収束し、

したがって第2項は0に潰れ、

  β^1IVpβ1+Cov(z,u)Cov(z,x)=β1+0Cov(z,x)=β1  \boxed{\;\hat\beta_1^{IV}\xrightarrow{p}\beta_1+\frac{\mathrm{Cov}(z,u)}{\mathrm{Cov}(z,x)}=\beta_1+\frac{0}{\mathrm{Cov}(z,x)}=\beta_1\;}

要するに「外生性が分子を消し、関連性が分母を生かすから、IV は真値 β1\beta_1 に収束する(一致)」。OLS の不一致 β1+Cov(x,u)/V(x)\beta_1+\mathrm{Cov}(x,u)/V(x) と並べると、xxzz に置き換えた瞬間にバイアス項の分子が Cov(z,u)=0\mathrm{Cov}(z,u)=0 となって消える——これが IV が効く理屈の全てです。2条件がそれぞれ「分子を消す(外生性)」「分母を生かす(関連性)」役割に対応している点を押さえてください。

⚠️ IV は一致であって不偏ではありません。β^1IV\hat\beta_1^{IV} は分母・分子とも確率変数で、有限標本では真値からずれます(しかも分母が小さいと暴れる、第5節)。「IV は不偏」は誤り。一致性が成り立つには十分大きな標本が要ります。


3. 同時方程式モデル — 構造形・誘導形・識別

3.1 構造形と誘導形(需要供給の例)

内生性の源泉①「同時性」を正面から扱うのが同時方程式モデルです。複数の内生変数が複数の方程式で同時に決まります。古典例は需要供給:

需要:q=α0+α1p+α2yinc+ud\text{需要:}\quad q = \alpha_0 + \alpha_1 p + \alpha_2 y_{\text{inc}} + u_d 供給:q=γ0+γ1p+γ2wcost+us\text{供給:}\quad q = \gamma_0 + \gamma_1 p + \gamma_2 w_{\text{cost}} + u_s

ここで qq(数量)と pp(価格)が内生変数(モデル内で同時決定)、yincy_{\text{inc}}(所得)と wcostw_{\text{cost}}(コスト)が外生変数(モデルの外から与えられる)です。この「変数の真の関係をそのまま書いた」連立式を**構造形(structural form)**と呼びます。構造形のパラメータ α1,γ1\alpha_1,\gamma_1(需要・供給の価格感応度)が知りたいものです。

なぜOLSではダメか. 需要式を pp について OLS で回しても、pp は供給ショック usu_s を通じて需要ショック udu_d とは別経路で決まり、ppudu_d が相関する(Cov(p,ud)0\mathrm{Cov}(p,u_d)\ne0)。つまり pp は内生で、OLS は需要曲線の傾きを一致推定できません。観測される価格・数量の散らばりは需要曲線と供給曲線の交点の集まりなので、片方の曲線だけを取り出せないのです。

誘導形(reduced form). 構造形を内生変数 (q,p)(q,p) について解き、内生変数を外生変数だけの関数に書き直したものを誘導形と呼びます。上の2式を p,qp,q について連立して解くと

p=π10+π11yinc+π12wcost+vpp = \pi_{10} + \pi_{11}\,y_{\text{inc}} + \pi_{12}\,w_{\text{cost}} + v_p q=π20+π21yinc+π22wcost+vqq = \pi_{20} + \pi_{21}\,y_{\text{inc}} + \pi_{22}\,w_{\text{cost}} + v_q

要するに「構造形=変数同士の生の関係(内生変数が右辺にも出る)/誘導形=内生変数を外生変数だけで表した『解いた後』の式」。誘導形の右辺は外生変数だけなので、各式は OLS で一致推定できます(Cov(外生変数,v)=0\mathrm{Cov}(\text{外生変数}, v)=0)。問題は「誘導形の係数 π\pi から構造形の係数 α,γ\alpha,\gamma逆算して取り出せるか」——これが**識別問題(identification)**です。

graph LR
  SF["構造形<br/>需要 q=α0+α1 p+α2 y+ud<br/>供給 q=γ0+γ1 p+γ2 w+us"] -->|内生変数 p,q について解く| RF["誘導形<br/>p=π10+π11 y+π12 w+vp<br/>q=π20+π21 y+π22 w+vq"]
  RF -->|OLSで一致推定できる| PI["π̂(誘導形係数)"]
  PI -->|識別条件を満たせば逆算可| ALPHA["構造形係数 α,γ(知りたい量)"]

3.2 識別 — 次数条件と階数条件

「誘導形から構造形を一意に復元できるか」を判定するのが識別条件です。系の方程式数(=内生変数の数)を GG、系全体の変数の総数を KK、いま注目している1本の方程式に含まれる変数の数を kk とします。

次数条件(order condition/必要条件). ある方程式が識別されるための必要条件

  KkG1  \boxed{\;K-k \ge G-1\;}

要するに「注目する式から除外されている変数の数(KkK-k)が、系の内生変数の数より1少ない数(G1G-1)以上であること」。等価な言い換えとして「その式から除外された外生変数の数が、その式に含まれる内生変数の数 1-1 以上」。直観は「構造係数を逆算するには方程式(情報)が足りていないといけない。除外された外生変数が操作変数の供給源になり、内生変数1つにつき最低1つの操作変数が要る」ということです。結果で3分類します。

次数条件識別の状態意味
Kk<G1K-k < G-1過少識別(under-identified)操作変数が足りず、構造係数を復元できない。推定不能
Kk=G1K-k = G-1ちょうど識別(just-identified)操作変数の数=内生変数の数。単純IVで一意に推定可
Kk>G1K-k > G-1過剰識別(over-identified)操作変数が余る。2SLS(情報を最適に集約)で推定。余りで外生性を検定可(Sargan/J)

階数条件(rank condition/必要十分条件). 次数条件は数を数えるだけの必要条件にすぎません。実際に識別されるための必要十分条件が階数条件です。

その式から除外された変数が、他の方程式に現れるときの係数で作る行列の階数(rank)が G1G-1 に等しいこと。

要するに「除外した変数たちが他式で『十分に異なる効き方』をしていて、(G1)(G-1) 本ぶんの独立な情報を提供していること」。G=2G=2(2式)なら、行列は実質スカラーで「除外変数の他式での係数が0でない」ことに帰着します。需要供給の例では、需要式から供給シフト要因 wcostw_{\text{cost}} が除外され、それが供給式で γ20\gamma_2\ne0 なら需要曲線が識別される——コストショックが供給曲線を動かしてくれるおかげで、価格・数量の散布が需要曲線をなぞる、という第2.1節の操作変数の話と完全に符合します。

⚠️ 次数条件は必要だが十分でない。次数条件を満たしても階数条件が落ちれば識別不能です。試験では「次数条件OKだから識別される」は誤り、と問われます。順序は「次数で当たりをつけ、階数で確定」。


4. 2段階最小二乗法(2SLS)

4.1 アイデア — 内生変数を「外生的な影」に置き換える

過剰識別(操作変数が複数)でも単純IVと内生変数1つの場合でも統一的に使えるのが**2段階最小二乗法(two-stage least squares, 2SLS / TSLS)**です。名前のとおり最小二乗を2回行います。内生変数 xx、操作変数 z1,,zmz_1,\dots,z_m、(あれば)他の外生説明変数 ww がある状況を考えます。

第1段階(first stage). 内生変数 xx を、すべての外生変数(操作変数 zz と外生説明変数 ww)に OLS 回帰し、予測値 x^\hat x を得ます。

xi=π0+π1z1i++πmzmi+(外生 w の項)+vix^i=π^0+π^1z1i+x_i = \pi_0 + \pi_1 z_{1i} + \dots + \pi_m z_{mi} + (\text{外生 }w\text{ の項}) + v_i \quad\Longrightarrow\quad \hat x_i = \hat\pi_0 + \hat\pi_1 z_{1i}+\dots

第2段階(second stage). 結果 yy を、xx の代わりに予測値 x^\hat x(と外生説明変数 ww)に OLS 回帰する。

yi=β0+β1x^i+(外生 w の項)+誤差y_i = \beta_0 + \beta_1 \hat x_i + (\text{外生 }w\text{ の項}) + \text{誤差}

ここで得た β^1\hat\beta_12SLS 推定量です。

flowchart LR
  subgraph S1["第1段階:内生変動の分離"]
    Z["操作変数 z(+外生 w)"] --> REG1["x を z,w に OLS 回帰"]
    REG1 --> XHAT["x̂ = x の予測値<br/>(外生変数で説明できる部分)"]
    REG1 --> V["残差 v<br/>(u と相関する内生的部分)→ 捨てる"]
  end
  subgraph S2["第2段階:きれいな x̂ で推定"]
    XHAT --> REG2["y を x̂ に OLS 回帰"]
    REG2 --> BETA["β̂(2SLS 推定量)"]
  end

4.2 なぜ x^\hat x なら一致するのか(直観と論理)

核心は第1段階の分解です。OLS の性質により、xx は「外生変数で説明できる部分 x^\hat x」と「残差 vv」に直交分解されます。

xi=x^i外生変数の線形結合+vi残差x_i=\underbrace{\hat x_i}_{\text{外生変数の線形結合}}+\underbrace{v_i}_{\text{残差}}

ここで決定的なのは:

要するに「xx を『誤差と相関するヤバい部分 vv』と『外生変数由来のきれいな部分 x^\hat x』に割り、きれいな x^\hat x だけで yy を説明する」。捨てた vv に内生性が閉じ込められているので、第2段階の説明変数 x^\hat x は外生となり、OLS が一致します。

ちょうど識別なら単純IVと一致. 操作変数が1つ(m=1m=1、内生変数1つ)のとき、2SLS 推定量は第2節の単純IV β^IV=Cov^(z,y)/Cov^(z,x)\hat\beta^{IV}=\widehat{\mathrm{Cov}}(z,y)/\widehat{\mathrm{Cov}}(z,x)完全に一致します。2SLS は単純IVの一般化(操作変数が余るときの最適な集約法)だと理解してください。

過剰識別での意味. 操作変数が複数あると、第1段階は「複数の操作変数を最適に1本の予測値 x^\hat x に合成」します。これは利用可能な外生情報を最も効率的に使う合成で、過剰な操作変数を1つずつ使うより分散が小さくなります。

4.3 標準誤差の注意(手で2回回すと間違う)

⚠️ 2SLS を「文字どおり OLS を2回」手で実行して第2段階の標準誤差をそのまま使うと誤りになります。第2段階は xx ではなく推定値 x^\hat x を使うため、x^\hat x の推定の不確実性(第1段階の誤差)が第2段階の標準誤差に正しく伝播しないからです。正しい 2SLS 標準誤差は、真の構造誤差 ui=yiβ0β1xiu_i=y_i-\beta_0-\beta_1 x_ix^\hat x ではなく元の xx で計算した残差)に基づいて補正します。実務では2SLS専用の手続き(ivregIV2SLS 等)を使えば自動で正しい標準誤差が出ます。「OLSを2回回せば終わり」と覚えると標準誤差で足をすくわれます。


5. 弱操作変数の問題

操作変数の条件 (1) 関連性は「Cov(z,x)0\mathrm{Cov}(z,x)\ne0」でしたが、ゼロでなければ何でもよいわけではありませんzzxx の相関が弱い(first stage が弱い)と、IV/2SLS は深刻に壊れます。これを**弱操作変数(weak instruments)**問題と呼びます。

何が起きるか.

診断(要最新確認). 第1段階回帰における操作変数の同時有意性のF統計量が広く使われ、経験則として first stage の F が 10 未満なら弱操作変数を疑う(Staiger–Stock の目安)。ただし操作変数が多い場合などこの「F>10」基準は万能でなく、より精密な基準(実効F・条件付き手法)が提案されています。この閾値や手法は研究の進展で更新されるため要最新確認です。

過剰識別の検定(Sargan / Hansen の J 検定). 操作変数が余る(過剰識別)と、「余った操作変数も外生か」を検定できます(Sargan検定/過剰識別制約の検定)。帰無仮説は「すべての操作変数が外生(除外制約を満たす)」。棄却されたらどれかの操作変数が外生性を破っている疑い。ただしちょうど識別だと検定できず(余りがない)、外生性は依然として検証不能なまま残ります。さらに弱操作変数があると Sargan 検定の検出力も落ちます。

要するに「関連性は『ゼロでないこと』では足りず『十分強いこと』が要る。弱いと分散爆発とバイアスで2SLSが信用できなくなる。第1段階のFで関連性の強さを、過剰識別なら Sargan で余り操作変数の外生性を点検する」。


6. 試験での問われ方(1級)

社会科学分野での1級の典型的な問われ方を、論点ごとに整理します(出題範囲・配点は要最新確認)。


7. 引っかけ・頻出論点


よくある疑問(Q&A)

Q1. 「バイアス」と「不一致」はどう違うのですか? 内生性はどちらを起こすのですか?

バイアスは有限標本で推定量の期待値が真値からずれること(E[β^]βE[\hat\beta]\ne\beta)、不一致は標本を無限に増やしても真値に収束しないこと(β^̸pβ\hat\beta\not\xrightarrow{p}\beta)です。内生性は両方を起こします。式 β^OLSpβ+Cov(x,u)/V(x)\hat\beta_{OLS}\xrightarrow{p}\beta+\mathrm{Cov}(x,u)/V(x) が示すのは「収束先そのものがズレている」ことで、これは不一致。実務的に深刻なのは不一致の方です——バイアスだけなら大標本で軽減を期待できますが、不一致だとどれだけデータを集めても直らないからです。だから内生性には IV のような構造的な対処が要ります。

Q2. なぜ操作変数を1つ通すだけで内生性が消えるのですか? 魔法のようで腑に落ちません。

魔法ではなく「情報の出どころを変える」操作です。OLS は xx の全変動を使いますが、その中には「誤差 uu と一緒に動いてしまう汚れた変動」が混じっています。IV/2SLS は xx の変動のうち「操作変数 zz に駆動された部分(x^\hat x)だけ」を使います。zz は外生(Cov(z,u)=0\mathrm{Cov}(z,u)=0)なので、その部分は uu と無関係——汚れていません。教育の例なら、「本人の意思(能力と絡む)で選んだ教育年数の変動」は使わず、「生まれ月という制度由来の、能力と無関係な教育年数の変動」だけを使って賃金との関係を測る、ということです。汚れた変動を捨てるから内生性が消えます。

Q3. ちょうど識別の単純IVと2SLSは、結局同じものですか?

操作変数が1つ・内生変数が1つのちょうど識別なら、2SLS 推定量は単純IV Cov^(z,y)/Cov^(z,x)\widehat{\mathrm{Cov}}(z,y)/\widehat{\mathrm{Cov}}(z,x)数値的に完全一致します。2SLS は単純IVの一般化で、操作変数が**余る(過剰識別)**ときに真価を発揮します。そのとき第1段階は複数の操作変数を1本の予測値 x^\hat x に最適合成し、利用可能な外生情報を最も効率よく使います。だから「2SLS=操作変数が複数あっても使える IV」と理解すれば、両者の関係はすっきりします。

Q4. 構造形と誘導形、どちらを推定すればいいのですか?

知りたいのはたいてい構造形の係数(需要の価格弾力性 α1\alpha_1 など、変数間の因果的な関係)です。しかし構造形は右辺に内生変数を含むため、そのまま OLS で推定できません。一方誘導形は右辺が外生変数だけなので OLS で一致推定できますが、得られるのは混ざった係数 π\pi で、それ自体は解釈しにくい。そこで「誘導形を推定し、識別条件を満たすなら構造係数を逆算する」か、同じことを直接やる2SLSを使います。要するに、推定の足場は誘導形(OLSが効く)、欲しいのは構造形(解釈できる)、橋渡しが識別条件と2SLS、という関係です。

Q5. 操作変数が見つかれば内生性は完全に解決ですか?

いいえ、2つの落とし穴が残ります。第一に外生性は検証不能で、Cov(z,u)=0\mathrm{Cov}(z,u)=0 が成り立つかはデータからは確かめられません(理論・制度的論拠で守るしかなく、これが破れていれば IV も不一致)。過剰識別なら Sargan 検定で部分的に点検できますが、ちょうど識別では不可能です。第二に弱操作変数の問題で、関連性が弱い(第1段階が弱い)と分散爆発とバイアスで 2SLS が信用できなくなります。だから IV は「妥当でかつ十分強い操作変数」が手に入って初めて機能する道具で、見つけること自体が研究の核心になります。

Q6. 測定誤差まで操作変数で直せるのですか? 同時性や欠落変数と原因が違う気がします。

直せます。原因(同時性・欠落変数・測定誤差)は違っても、症状はすべて同じ「Cov(x,u)0\mathrm{Cov}(x,u)\ne0(説明変数が誤差と相関)」だからです。IV の一致性の証明は原因を問わず「zz が誤差と無相関・内生変数と相関」しさえすれば成り立ちます。測定誤差の場合、真の xx と相関するが測定誤差とは独立な別の観測(例:同じ量の2回目の独立な測定)を操作変数に使えば、減衰バイアスを除いて一致推定できます。「3つの源泉を1つの道具(IV)で同時に扱える」ことが、操作変数法が計量経済学の中心に居座る理由です。


まとめ


関連ノート