🎓 レベル:標準 | 重要度:A(必須) 📎 土台:残差分析・回帰診断(統計・残差と分散)・ガウス・マルコフ仮定のおさらい
要点(BLUF)
- 不均一分散 = 誤差分散 が観測ごとに違う状態。経済データ(所得が高い人ほど消費のばらつきが大きい等)では常態です。
- 害は限定的:OLS係数は一致したまま、標準誤差だけが誤る。だから 値・信頼区間がウソになる。点推定は直す必要なし。
- 処方箋は軽い:係数はOLSのまま、White(HC)頑健標準誤差に差し替える。グループ構造があればクラスタ頑健標準誤差。実務ではほぼ既定で使います。
1. 問題:標準誤差の公式が前提を失う
通常の OLS 標準誤差は等分散 を前提に を使います。不均一分散だとこの式が成り立たず、標準誤差が過大にも過小にもなります(多くは過小→偽の有意)。
ロバスト(サンドイッチ)分散推定は等分散を仮定せず、残差の二乗で分散構造を直接推定します:
中央の が「パン2枚に挟まれた具」なのでサンドイッチ推定量と呼ばれます。HC0〜HC3 は小標本補正の違いで、実務では HC1 や HC3 が標準。statsmodels なら fit(cov_type="HC1") の一行です。
2. クラスタ頑健標準誤差:グループ内の相関も束ねる
経済データはグループ構造を持つことが多い——同じ学校の生徒、同じ企業の年次、同じ州の家計。同一グループ内では誤差が相関し、しかも分散も不均一です。これをクラスタ頑健標準誤差で扱います:分散の和をグループ単位でまとめ、グループ内の任意の相関を許します(cov_type="cluster")。
flowchart LR
A["残差 û_i"] --> B["HC: 観測ごとの分散を許す(不均一分散)"]
A --> C["クラスタ: グループ内の相関も許す(同一企業・州など)"]
B --> D["t値・信頼区間を正しく"]
C --> D
パネルデータ(第4章)では個体クラスタが事実上の標準。クラスタ数が少ない(数十未満)と過小推定が起きるので、その場合はワイルドブートストラップ等を併用します。
3. 経済データでの実務
賃金回帰・需要推定・企業財務のクロスセクションでは、まず HC1/HC3 を既定にし、サンプリングや政策がグループ単位ならそのグループでクラスタします。検定(Breusch–Pagan・White検定)で不均一分散を「確認してから」ではなく、最初から頑健標準誤差を使うのが現代の作法です(検定で見つからなくても害がないため)。
⚠️ よくある誤解・落とし穴
- 「不均一分散があるとOLSはダメ」ではない:係数は一致。直すのは標準誤差だけ。GLS/WLSで効率を上げる手もありますが、分散構造を誤指定するとかえって悪化するので、まず頑健標準誤差が安全。
- 「頑健標準誤差は常に大きくなる」ではない:小さくなることもある。要は「正しくなる」のであって「保守的になる」のではありません。
- 「クラスタの粒度は細かいほど安全」ではない:粗すぎても細かすぎても誤る。相関が生じる処置・サンプリングの単位でクラスタするのが原則。
- 検定の有意性だけ報告して頑健標準誤差を使わないのは危険:不均一分散下の通常 値は信用できません。
関連ノート
- 系列相関と一般化最小二乗(時間方向の相関版)
- ガウス・マルコフ仮定のおさらい(等分散の破れの位置づけ)
- 固定効果と変量効果(パネルでの個体クラスタ)
- 残差分析・回帰診断(統計・残差プロットと分散)
- 古典的回帰と仮定の破れ 目次
- 計量経済学 全体目次