ロジット・プロビット

🎓 レベル：標準　|　重要度：A（必須） 📎 土台：ロジスティック回帰（機械学習・ロジスティック回帰）・質的選択・切断回帰モデル（統計）

要点（BLUF）

ロジット／プロビット ＝確率を非線形リンク（ロジスティック関数／正規分布の累積）で0-1に収める二値選択モデル。LPM（線形確率モデルの限界）の範囲外予測を解消します。
計量経済での意味づけは効用最大化——観測されない効用が閾値を超えたら選択する、という潜在変数モデルから自然に導かれます。これが機械学習の「分類器」との視点の違い。
解釈の注意：係数 $\beta$ は符号と相対的な大きさしか直読みできない。限界効果（確率の変化）やオッズ比に変換して初めて経済的に意味を持ちます。

1. 機械はMLへ、意味づけは効用最大化

ロジスティック回帰の最尤推定・シグモイド・損失関数は機械学習（ロジスティック回帰）に委ね、ここでは経済学的な導出を押さえます。個人 $i$ が選択肢を選ぶときの潜在的な効用差 $y_i^*=x_i\beta+\varepsilon_i$ を考え、

y_i=1 \iff y_i^*>0 \quad(\text{効用が閾値を超えたら選択})

とします。誤差 $\varepsilon$ の分布をロジスティックと置けばロジット、標準正規と置けばプロビットになります。つまり両者は「観測されない効用が閾値を超えたら行動する」というランダム効用モデルの表現違い。McFaddenがこの枠組みで離散選択理論を確立しました。これは単なる曲線あてはめではなく、経済主体の意思決定の構造を表しています。

flowchart LR
    A["潜在効用 y* = xβ + ε"] --> B{"y* > 0 か？"}
    B -->|"Yes"| C["選択 y=1"]
    B -->|"No"| D["非選択 y=0"]
    A --> E["εがロジスティック→ロジット / 正規→プロビット"]

2. なぜ係数を直読みできないのか

非線形リンクのため、 $x$ が確率に与える影響は $x$ の水準に依存します（同じ $\beta$ でも、確率0.5付近では効果大、端では小）。よって係数 $\beta$ は

符号：その変数が選択確率を上げるか下げるか（これは直読み可）、
相対的大きさ：他の変数との比較（プロビットとロジットで係数のスケールが約1.6倍違うことに注意）

までしか直接は語れません。確率への効果を知るには限界効果を計算します：平均的な個人での限界効果（MEM）か、全個人の限界効果の平均（AME＝平均限界効果、実務の標準）。ロジットならオッズ比 $e^{\beta}$ も解釈に便利（「 $x$ が1増えるとオッズが $e^\beta$ 倍」）。

3. ロジットとプロビットの使い分け

実用上、両者の予測確率や限界効果はほぼ同じで、どちらを使っても結論は大きく変わりません。慣例として、計量経済学（特に構造推定や多項選択の入れ子ロジット）ではロジット系、医学・心理ではプロビットが好まれる傾向。多肢選択なら多項ロジット、順序のある選択（格付け・満足度）なら順序プロビット/ロジットへ拡張します。選択肢間の独立性（IIA）の仮定が問題になる場合は入れ子ロジットや混合ロジットを使います。

⚠️ よくある誤解・落とし穴

「係数の大きさをそのまま効果として読む」は誤り：限界効果かオッズ比に変換する。生の係数の数値は確率の変化量ではない。
「ロジットとプロビットの係数を直接比べる」は誤り：スケールが約1.6倍違う。比べるなら限界効果で。
「分類精度が高ければ良いモデル」ではない：計量では確率・限界効果の解釈が目的。予測性能（評価指標（分類）とROC・AUC）とは目的が異なる。
内生性は別問題：説明変数が内生なら、ロジット/プロビットでも係数は偏る。非線形での内生性対処（コントロール関数法など）が必要で、線形のLPM＋2SLSが選ばれることも。

要点（BLUF）

1. 機械はMLへ、意味づけは効用最大化

2. なぜ係数を直読みできないのか

3. ロジットとプロビットの使い分け

⚠️ よくある誤解・落とし穴

関連ノート