期待値原理とその限界（サンクトペテルブルクの逆説）

🎓 レベル：基礎　|　重要度：A（必須）

📎 前提：意思決定問題の構造（行動・状態・結果・利得表）　|　関連：期待効用と効用関数（逆説の解決）

要点（BLUF）

期待値原理＝「期待値（金額の平均）が最大の選択肢を選ぶ」という素朴な規範は、多くの場面で有効ですが万能ではありません。
反例がサンクトペテルブルクの逆説：期待値が無限大のくじなのに、誰も大金を払ってまで参加しようとしません。
解決は「金額そのものではなく、金額の効用（嬉しさ）で評価する」こと。効用が逓減（お金が増えるほど追加の嬉しさが小さくなる）するなら、期待”効用”は有限になります。これが期待効用と効用関数の出発点です。

1. 期待値原理：素朴だが強力

くじ（不確実な選択肢）を、もらえる金額の期待値で評価して、最大のものを選ぶ——これが**期待値原理（expected value principle）**です。

\mathbb{E}[X] = \sum_j p_j\, x_j

多くの実務（保険の保険料計算、反復のある投資）ではこれで十分機能します。同じ賭けを何度も繰り返せるなら、大数の法則で平均は期待値に近づくからです。問題は、一回限りで・金額が極端にばらつくときに起きます。

2. サンクトペテルブルクの逆説

次のくじを考えます。公正なコインを表が出るまで投げ続け、 $k$ 回目で初めて表が出たら $2^k$ 円もらえる。 $k$ 回目に初めて表が出る確率は $1/2^k$ です。期待賞金は

\mathbb{E}[X] = \sum_{k=1}^{\infty} \frac{1}{2^k}\cdot 2^k = \sum_{k=1}^{\infty} 1 = \infty

各項がきっかり1で、足し続けると無限大に発散します。期待値原理に従えば「いくら払ってでも参加すべき」——ところが現実には、ほとんどの人は数百円も払いません。これがサンクトペテルブルクの逆説（Daniel Bernoulli, 1738）です。

import numpy as np

# 賞金 2^k（確率 1/2^k）。各項の寄与は (1/2^k)*2^k = 1 でずっと一定 -> 発散
n_terms = 30
contrib = np.array([(0.5**k) * (2.0**k) for k in range(1, n_terms+1)])
print("各項の寄与（最初の5項）:", contrib[:5])
print(f"{n_terms}項までの期待値（部分和）= {contrib.sum():.1f}")

出力：

各項の寄与（最初の5項）: [1. 1. 1. 1. 1.]
30項までの期待値（部分和）= 30.0

出力の意味：各項の寄与がずっと 1 のまま——項を増やすほど部分和は際限なく増えます（30項で30、100項で100）。数学的には期待値は無限大。にもかかわらず人が大金を払わないのは、「莫大だがほぼ起きない賞金」の寄与を、人はそれほど重く感じないから。期待値はこの心理を捉えられません。

3. 解決：効用の期待値で評価する

Bernoulli の解決は「人が評価するのは金額そのものではなく、金額がもたらす効用（嬉しさ）だ」というものでした。効用が逓減する（例： $u(w)=\log w$ ）なら、巨額の賞金の効用は頭打ちになり、期待効用は有限に収まります。

底2の対数効用 $u(w)=\log_2 w$ で、このくじの期待効用を計算してみます。

import numpy as np

# 対数効用なら有限：E[log2(賞金)] = sum (1/2^k)*log2(2^k) = sum k/2^k
exp_log = np.sum([(0.5**k) * np.log2(2.0**k) for k in range(1, 200)])
print(f"対数効用（底2）の期待効用 = {exp_log:.4f}")
# 確実性等価：この期待効用と同じ効用を与える確実な金額
print(f"確実性等価 = 2^(期待効用) = {2**exp_log:.2f} 円")

出力：

対数効用（底2）の期待効用 = 2.0000
確実性等価 = 2^(期待効用) = 4.00 円

出力の意味：効用で評価すると、無限大だった価値が期待効用 2.0（確実な4円ぶんの嬉しさ）にまで縮みます。 $\sum k/2^k = 2$ という収束級数のおかげです。「逆説の正体は、無限大の金額を有限の効用に変換しなかったこと」だった——これが、結果ではなく結果の効用の期待値で選ぶべきという、期待効用と効用関数の動機です。

数式の直観的意味：発散の止め方

$\sum (1/2^k) \cdot 2^k$ が発散するのは、賞金 $2^k$ が確率の減り $1/2^k$ とちょうど打ち消し合うからです。効用 $u$ が**凹（逓減）**なら、 $u(2^k)$ は $2^k$ ほど速く増えません。例えば $\log_2(2^k)=k$ は $k$ について線形でしかなく、 $\sum k/2^k$ は収束します。効用関数の凹性が、賞金の爆発を抑えて期待値を有限化する——リスク回避（リスク選好と効用の凹凸）の数理的な核心がここに既に現れています。

⚠️ よくある誤解

「期待値原理は間違い」ではない：反復できる・金額が穏やかな状況では期待値で十分です。限界が出るのは一回限りで裾が極端なとき。道具の適用範囲の問題です。
「対数効用を使えば全部解決」ではない：賞金を $2^{2^k}$ のように増やせば、対数効用でも期待効用は発散します（超サンクトペテルブルク）。どんな非有界効用も破れる賭けを作れるため、効用は有界とする立場もあります。効用の選択は経験的・公理的な問題です。
「効用＝お金の対数」ではない：対数は一例にすぎません。効用関数の形は人によって違い、リスク選好を反映します（次ノート）。

対応シミュレーション

本文のコードで、項数を増やすと期待値（金額）が発散する一方、対数効用の期待効用が 2.0 に収束する対比を確かめられます。効用関数を $\sqrt{w}$ など他の凹関数に変えても収束を保つことを試せます。