マルチンゲールの定義と例

🎓 レベル：発展　|　重要度：A（必須） 📎 前提：条件付き期待値とフィルトレーション

要点（BLUF）

マルチンゲール： $\mathbb{E}[X_{n+1}\mid\mathcal{F}_n]=X_n$ 。次の期待値が今の値に等しい「公平な賭け」。 $\le$ なら優マルチンゲール（不利）、 $\ge$ なら劣マルチンゲール（有利）。
直ちに $\mathbb{E}[X_n]=\mathbb{E}[X_0]$ （期待値が時間で一定）が従います。
代表例：ランダムウォーク $S_n$ 、補正二乗 $S_n^2-n$ 、ポリアの壺の色割合、指数マルチンゲール。多くは「ドリフトを引いて公平化」して作ります。

概念

賭けの公平性とは「過去の結果をすべて知っても、次の一手の期待損益がゼロ」ということ。これを過程の言葉にしたのがマルチンゲールです。マルコフ性（マルコフ連鎖とは・遷移行列）が「未来は現在だけに依存」だったのに対し、マルチンゲール性は「未来の期待値が現在に等しい」。依存の構造ではなく、期待の保存を主張します。

数式による定式化

フィルトレーション $\{\mathcal{F}_n\}$ に適合し $\mathbb{E}|X_n|<\infty$ な過程 $\{X_n\}$ がマルチンゲールとは

\mathbb{E}[X_{n+1}\mid\mathcal{F}_n] = X_n \qquad (\forall n)

タワー則より $\mathbb{E}[X_{n+1}]=\mathbb{E}[\mathbb{E}[X_{n+1}\mid\mathcal{F}_n]]=\mathbb{E}[X_n]$ 、帰納的に

\mathbb{E}[X_n] = \mathbb{E}[X_0] \quad (\text{一定})

優マルチンゲール $\mathbb{E}[X_{n+1}\mid\mathcal{F}_n]\le X_n$ 、劣マルチンゲール $\ge X_n$ 。代表例（ $\xi_i$ は平均0・独立）：

S_n=\sum_{i=1}^n \xi_i\ (\text{マルチンゲール}),\quad S_n^2 - n\sigma^2\ (\text{補正二乗}),\quad M_n=\frac{e^{\theta S_n}}{\mathbb{E}[e^{\theta\xi}]^n}\ (\text{指数})

直観

要するに「今の持ち金が、将来の持ち金の最良予測」。ランダムウォークは各歩の期待が0だから持ち金の期待は動かない（公平）。 $S_n^2$ は二乗なので平均的に $n$ ずつ増える（劣マルチンゲール）が、増分 $n$ を差し引いて $S_n^2-n$ にすれば公平に戻る — この「予測可能な増加分（補償子）を引いて公平化する」操作が、後の伊藤積分や二次変分の核心です。

具体例

ランダムウォーク $S_n$ 、補正二乗 $S_n^2-n$ 、ポリアの壺（赤1青1から引いた色を1個足す）の赤割合 — 3つのマルチンゲールで期待値が時間に依らず一定であることを確認します。

import numpy as np
rng = np.random.default_rng(2)
n_paths, T = 200000, 100
steps = rng.choice([-1, 1], size=(n_paths, T))
S = np.cumsum(steps, axis=1)
print("E[S_n]       (n=10,50,100):", [round(S[:, k-1].mean(), 3) for k in [10, 50, 100]])
print("E[S_n^2 - n] (n=10,50,100):", [round((S[:, k-1]**2 - k).mean(), 3) for k in [10, 50, 100]])

# ポリアの壺：有界マルチンゲール（赤の割合、初期0.5）
rng = np.random.default_rng(5)
red = np.ones(n_paths); total = np.full(n_paths, 2.0); rec = {}
for step in range(1, 201):
    frac = red/total
    red += (rng.random(n_paths) < frac).astype(float); total += 1.0
    if step in (10, 50, 200):
        rec[step] = (red/total).mean()
print("ポリア壺 赤割合 E (n=10,50,200):", [round(rec[k], 4) for k in [10, 50, 200]])
# E[S_n]       (n=10,50,100): [0.007, 0.026, 0.041]
# E[S_n^2 - n] (n=10,50,100): [-0.023, 0.129, 0.195]
# ポリア壺 赤割合 E (n=10,50,200): [0.4999, 0.4999, 0.4998]

$\mathbb{E}[S_n]\approx0$ 、 $\mathbb{E}[S_n^2-n]\approx0$ （モンテカルロ誤差の範囲。 $S_n^2$ の分散が大きいぶん揺れます）、ポリアの壺の赤割合は $n$ に依らず $0.5$ で釘付け — いずれも期待値が時間で動かない公平な過程です。

他過程との関係

ランダムウォークと再帰性の中心化ウォークは最も基本的なマルチンゲール。ブラウン運動の定義と性質は連続時間版で、 $B_t$ と $B_t^2-t$ がともにマルチンゲールです（補正二乗の連続版）。
マルコフ連鎖とは・遷移行列とは独立な概念で、マルコフだがマルチンゲールでない過程（ドリフトのある連鎖）も、マルチンゲールだがマルコフでない過程（履歴依存）も存在します。

数式の直観的意味

補正二乗 $S_n^2-n$ の「 $-n$ 」は、 $S_n^2$ の予測可能な増加（各ステップで平均 $+\sigma^2$ ）を打ち消す補償子です。一般に劣マルチンゲールは「マルチンゲール＋増加する予測可能過程」に一意分解できます（ドゥーブ分解）。これは伊藤の公式で「確率積分（マルチンゲール部）＋ドリフト（有界変動部）」という分解として再登場します。指数マルチンゲールは測度変換（ギルサノフ）の主役で、金融の無裁定価格付けの土台です。

⚠️ よくある誤解

マルチンゲールでも破産する。乗法的マルチンゲール $M_n=\prod Y_i$ （ $Y$ は平均1）は $\mathbb{E}[M_n]=1$ を保ちますが、 $\mathbb{E}[\log Y]<0$ なら $M_n\to0$ がほぼ確実。「期待値が一定」と「ほぼ確実に増える/減る」は両立します（期待値はまれな大当たりが支える）。だから上の乗法的例の標本平均は $n$ が大きいと過小評価になりがちで、有界なポリアの壺の方が数値的に安定します。
公平＝勝てない、ではない。任意停止（次ノート）で「いつ止めるか」を工夫しても、条件が揃えば期待値は変わらない、というのが任意停止定理の主張です。
マルチンゲール性はフィルトレーション依存。どの情報 $\mathcal{F}_n$ に対する条件付けかで成否が変わります。

対応シミュレーション

本文の3例に加え、指数マルチンゲール $e^{\theta S_n}/\cosh(\theta)^n$ も stochastic-processes-study/simulations/ で期待値1を確認できます。