不均一分散と頑健標準誤差

🎓 レベル：標準　|　重要度：A（必須） 📎 土台：残差分析・回帰診断（統計・残差と分散）・ガウス・マルコフ仮定のおさらい

要点（BLUF）

不均一分散 ＝誤差分散 $\mathrm{Var}(u_i\mid x_i)$ が観測ごとに違う状態。経済データ（所得が高い人ほど消費のばらつきが大きい等）では常態です。
害は限定的：OLS係数は一致したまま、標準誤差だけが誤る。だから $t$ 値・信頼区間がウソになる。点推定は直す必要なし。
処方箋は軽い：係数はOLSのまま、White（HC）頑健標準誤差に差し替える。グループ構造があればクラスタ頑健標準誤差。実務ではほぼ既定で使います。

1. 問題：標準誤差の公式が前提を失う

通常の OLS 標準誤差は等分散 $\mathrm{Var}(u\mid x)=\sigma^2$ を前提に $\widehat{\mathrm{Var}}(\hat\beta)=\sigma^2(X^\top X)^{-1}$ を使います。不均一分散だとこの式が成り立たず、標準誤差が過大にも過小にもなります（多くは過小→偽の有意）。

ロバスト（サンドイッチ）分散推定は等分散を仮定せず、残差の二乗で分散構造を直接推定します：

\widehat{\mathrm{Var}}_{\mathrm{HC}}(\hat\beta)=(X^\top X)^{-1}\Big(\sum_i \hat u_i^2\, x_i x_i^\top\Big)(X^\top X)^{-1}

中央の $\sum \hat u_i^2 x_i x_i^\top$ が「パン2枚に挟まれた具」なのでサンドイッチ推定量と呼ばれます。HC0〜HC3 は小標本補正の違いで、実務では HC1 や HC3 が標準。statsmodels なら fit(cov_type="HC1") の一行です。

2. クラスタ頑健標準誤差：グループ内の相関も束ねる

経済データはグループ構造を持つことが多い——同じ学校の生徒、同じ企業の年次、同じ州の家計。同一グループ内では誤差が相関し、しかも分散も不均一です。これをクラスタ頑健標準誤差で扱います：分散の和をグループ単位でまとめ、グループ内の任意の相関を許します（cov_type="cluster"）。

flowchart LR
    A["残差 û_i"] --> B["HC: 観測ごとの分散を許す（不均一分散）"]
    A --> C["クラスタ: グループ内の相関も許す（同一企業・州など）"]
    B --> D["t値・信頼区間を正しく"]
    C --> D

パネルデータ（第4章）では個体クラスタが事実上の標準。クラスタ数が少ない（数十未満）と過小推定が起きるので、その場合はワイルドブートストラップ等を併用します。

3. 経済データでの実務

賃金回帰・需要推定・企業財務のクロスセクションでは、まず HC1/HC3 を既定にし、サンプリングや政策がグループ単位ならそのグループでクラスタします。検定（Breusch–Pagan・White検定）で不均一分散を「確認してから」ではなく、最初から頑健標準誤差を使うのが現代の作法です（検定で見つからなくても害がないため）。

⚠️ よくある誤解・落とし穴

「不均一分散があるとOLSはダメ」ではない：係数は一致。直すのは標準誤差だけ。GLS/WLSで効率を上げる手もありますが、分散構造を誤指定するとかえって悪化するので、まず頑健標準誤差が安全。
「頑健標準誤差は常に大きくなる」ではない：小さくなることもある。要は「正しくなる」のであって「保守的になる」のではありません。
「クラスタの粒度は細かいほど安全」ではない：粗すぎても細かすぎても誤る。相関が生じる処置・サンプリングの単位でクラスタするのが原則。
検定の有意性だけ報告して頑健標準誤差を使わないのは危険：不均一分散下の通常 $t$ 値は信用できません。

要点（BLUF）

1. 問題：標準誤差の公式が前提を失う

2. クラスタ頑健標準誤差：グループ内の相関も束ねる

3. 経済データでの実務

⚠️ よくある誤解・落とし穴

関連ノート