Mímisbrunnr知恵の泉

← 計量経済学 一覧

🎓 レベル:標準 | 重要度:A(必須) 📎 土台:残差分析・回帰診断(統計・残差と分散)・ガウス・マルコフ仮定のおさらい

要点(BLUF)

1. 問題:標準誤差の公式が前提を失う

通常の OLS 標準誤差は等分散 Var(ux)=σ2\mathrm{Var}(u\mid x)=\sigma^2 を前提に Var^(β^)=σ2(XX)1\widehat{\mathrm{Var}}(\hat\beta)=\sigma^2(X^\top X)^{-1} を使います。不均一分散だとこの式が成り立たず、標準誤差が過大にも過小にもなります(多くは過小→偽の有意)。

ロバスト(サンドイッチ)分散推定は等分散を仮定せず、残差の二乗で分散構造を直接推定します:

Var^HC(β^)=(XX)1(iu^i2xixi)(XX)1\widehat{\mathrm{Var}}_{\mathrm{HC}}(\hat\beta)=(X^\top X)^{-1}\Big(\sum_i \hat u_i^2\, x_i x_i^\top\Big)(X^\top X)^{-1}

中央の u^i2xixi\sum \hat u_i^2 x_i x_i^\top が「パン2枚に挟まれた具」なのでサンドイッチ推定量と呼ばれます。HC0〜HC3 は小標本補正の違いで、実務では HC1 や HC3 が標準。statsmodels なら fit(cov_type="HC1") の一行です。

2. クラスタ頑健標準誤差:グループ内の相関も束ねる

経済データはグループ構造を持つことが多い——同じ学校の生徒、同じ企業の年次、同じ州の家計。同一グループ内では誤差が相関し、しかも分散も不均一です。これをクラスタ頑健標準誤差で扱います:分散の和をグループ単位でまとめ、グループ内の任意の相関を許します(cov_type="cluster")。

flowchart LR
    A["残差 û_i"] --> B["HC: 観測ごとの分散を許す(不均一分散)"]
    A --> C["クラスタ: グループ内の相関も許す(同一企業・州など)"]
    B --> D["t値・信頼区間を正しく"]
    C --> D

パネルデータ(第4章)では個体クラスタが事実上の標準。クラスタ数が少ない(数十未満)と過小推定が起きるので、その場合はワイルドブートストラップ等を併用します。

3. 経済データでの実務

賃金回帰・需要推定・企業財務のクロスセクションでは、まず HC1/HC3 を既定にし、サンプリングや政策がグループ単位ならそのグループでクラスタします。検定(Breusch–Pagan・White検定)で不均一分散を「確認してから」ではなく、最初から頑健標準誤差を使うのが現代の作法です(検定で見つからなくても害がないため)。

⚠️ よくある誤解・落とし穴

関連ノート