Mímisbrunnr知恵の泉

← 計量経済学 一覧

🎓 レベル:発展 | 重要度:B(推奨) 📎 土台:質的選択・切断回帰モデル(統計・切断回帰)・ロジット・プロビット(潜在変数モデル)

要点(BLUF)

1. 問題:0に積み上がるデータとOLSの偏り

潜在変数 yi=xiβ+εiy_i^*=x_i\beta+\varepsilon_i があり、観測されるのは

yi=max(0,yi)(負の潜在値はすべて 0 として観測)y_i=\max(0,\,y_i^*)\quad(\text{負の潜在値はすべて 0 として観測})

という形(下側打ち切り)。例えば「買いたい量」がマイナスの人は「購入額0」と記録されます。このデータにOLSを当てると、0の観測群を「本当に y=0y=0 の連続値」と誤認し、回帰直線が寝てしまって係数が0方向へ縮みます。0だけ捨てて正の観測だけで回帰しても、今度は切断バイアスで偏ります。

2. トービット:打ち切りを尤度に書く

flowchart LR
    A["潜在変数 y* = xβ + ε"] --> B{"y* > 0 か?"}
    B -->|"Yes"| C["y = y*(連続値を観測)"]
    B -->|"No"| D["y = 0(打ち切り・束になる)"]
    C --> E["尤度: 連続部分は密度 f(y)"]
    D --> F["尤度: 0の部分は確率 P(y*≤0)"]

トービットは尤度を2部構成にします——正の観測には連続分布の密度を、0の観測には「潜在変数が閾値以下になる確率」を割り当て、最尤推定します。プロビット(ロジット・プロビット)の潜在変数モデルを「閾値以下は0、以上は連続値」に拡張したものと見ると分かりやすい。これで打ち切りの構造を正しく扱い、β\beta を一致推定できます。

なお、トービットは「選択するか(0か正か)」と「いくらか(正の額)」を同じ β\beta で説明する強い仮定を置きます。両者が別メカニズムなら、選択と量を分ける**二段階モデル(ハードル/クラッグ・モデル)**の方が柔軟です。

3. 打ち切りと切断の違い

3つとも「観測の制限が偏りを生む」点は共通ですが、制限の入り方が違うので使うモデルが変わります。データのどこがどう欠けているかを見極めるのが先決です。

⚠️ よくある誤解・落とし穴

関連ノート