Mímisbrunnr知恵の泉

← 計量経済学 一覧

🎓 レベル:標準 | 重要度:A(必須) 📎 土台:ロジスティック回帰(機械学習・ロジスティック回帰)・質的選択・切断回帰モデル(統計)

要点(BLUF)

1. 機械はMLへ、意味づけは効用最大化

ロジスティック回帰の最尤推定・シグモイド・損失関数は機械学習(ロジスティック回帰)に委ね、ここでは経済学的な導出を押さえます。個人 ii が選択肢を選ぶときの潜在的な効用差 yi=xiβ+εiy_i^*=x_i\beta+\varepsilon_i を考え、

yi=1    yi>0(効用が閾値を超えたら選択)y_i=1 \iff y_i^*>0 \quad(\text{効用が閾値を超えたら選択})

とします。誤差 ε\varepsilon の分布をロジスティックと置けばロジット、標準正規と置けばプロビットになります。つまり両者は「観測されない効用が閾値を超えたら行動する」というランダム効用モデルの表現違い。McFaddenがこの枠組みで離散選択理論を確立しました。これは単なる曲線あてはめではなく、経済主体の意思決定の構造を表しています。

flowchart LR
    A["潜在効用 y* = xβ + ε"] --> B{"y* > 0 か?"}
    B -->|"Yes"| C["選択 y=1"]
    B -->|"No"| D["非選択 y=0"]
    A --> E["εがロジスティック→ロジット / 正規→プロビット"]

2. なぜ係数を直読みできないのか

非線形リンクのため、xx が確率に与える影響は xx の水準に依存します(同じβ\betaでも、確率0.5付近では効果大、端では小)。よって係数 β\beta

までしか直接は語れません。確率への効果を知るには限界効果を計算します:平均的な個人での限界効果(MEM)か、全個人の限界効果の平均(AME=平均限界効果、実務の標準)。ロジットならオッズ比 eβe^{\beta} も解釈に便利(「xx が1増えるとオッズが eβe^\beta 倍」)。

3. ロジットとプロビットの使い分け

実用上、両者の予測確率や限界効果はほぼ同じで、どちらを使っても結論は大きく変わりません。慣例として、計量経済学(特に構造推定や多項選択の入れ子ロジット)ではロジット系、医学・心理ではプロビットが好まれる傾向。多肢選択なら多項ロジット、順序のある選択(格付け・満足度)なら順序プロビット/ロジットへ拡張します。選択肢間の独立性(IIA)の仮定が問題になる場合は入れ子ロジットや混合ロジットを使います。

⚠️ よくある誤解・落とし穴

関連ノート