🎓 レベル:発展 | 重要度:A(必須) 📎 前提:条件付き期待値とフィルトレーション
要点(BLUF)
- マルチンゲール:。次の期待値が今の値に等しい「公平な賭け」。 なら優マルチンゲール(不利)、 なら劣マルチンゲール(有利)。
- 直ちに (期待値が時間で一定)が従います。
- 代表例:ランダムウォーク 、補正二乗 、ポリアの壺の色割合、指数マルチンゲール。多くは「ドリフトを引いて公平化」して作ります。
概念
賭けの公平性とは「過去の結果をすべて知っても、次の一手の期待損益がゼロ」ということ。これを過程の言葉にしたのがマルチンゲールです。マルコフ性(マルコフ連鎖とは・遷移行列)が「未来は現在だけに依存」だったのに対し、マルチンゲール性は「未来の期待値が現在に等しい」。依存の構造ではなく、期待の保存を主張します。
数式による定式化
フィルトレーション に適合し な過程 がマルチンゲールとは
タワー則より 、帰納的に
優マルチンゲール 、劣マルチンゲール 。代表例( は平均0・独立):
直観
要するに「今の持ち金が、将来の持ち金の最良予測」。ランダムウォークは各歩の期待が0だから持ち金の期待は動かない(公平)。 は二乗なので平均的に ずつ増える(劣マルチンゲール)が、増分 を差し引いて にすれば公平に戻る — この「予測可能な増加分(補償子)を引いて公平化する」操作が、後の伊藤積分や二次変分の核心です。
具体例
ランダムウォーク 、補正二乗 、ポリアの壺(赤1青1から引いた色を1個足す)の赤割合 — 3つのマルチンゲールで期待値が時間に依らず一定であることを確認します。
import numpy as np
rng = np.random.default_rng(2)
n_paths, T = 200000, 100
steps = rng.choice([-1, 1], size=(n_paths, T))
S = np.cumsum(steps, axis=1)
print("E[S_n] (n=10,50,100):", [round(S[:, k-1].mean(), 3) for k in [10, 50, 100]])
print("E[S_n^2 - n] (n=10,50,100):", [round((S[:, k-1]**2 - k).mean(), 3) for k in [10, 50, 100]])
# ポリアの壺:有界マルチンゲール(赤の割合、初期0.5)
rng = np.random.default_rng(5)
red = np.ones(n_paths); total = np.full(n_paths, 2.0); rec = {}
for step in range(1, 201):
frac = red/total
red += (rng.random(n_paths) < frac).astype(float); total += 1.0
if step in (10, 50, 200):
rec[step] = (red/total).mean()
print("ポリア壺 赤割合 E (n=10,50,200):", [round(rec[k], 4) for k in [10, 50, 200]])
# E[S_n] (n=10,50,100): [0.007, 0.026, 0.041]
# E[S_n^2 - n] (n=10,50,100): [-0.023, 0.129, 0.195]
# ポリア壺 赤割合 E (n=10,50,200): [0.4999, 0.4999, 0.4998]
、(モンテカルロ誤差の範囲。 の分散が大きいぶん揺れます)、ポリアの壺の赤割合は に依らず で釘付け — いずれも期待値が時間で動かない公平な過程です。
他過程との関係
- ランダムウォークと再帰性の中心化ウォークは最も基本的なマルチンゲール。ブラウン運動の定義と性質は連続時間版で、 と がともにマルチンゲールです(補正二乗の連続版)。
- マルコフ連鎖とは・遷移行列とは独立な概念で、マルコフだがマルチンゲールでない過程(ドリフトのある連鎖)も、マルチンゲールだがマルコフでない過程(履歴依存)も存在します。
数式の直観的意味
補正二乗 の「」は、 の予測可能な増加(各ステップで平均 )を打ち消す補償子です。一般に劣マルチンゲールは「マルチンゲール+増加する予測可能過程」に一意分解できます(ドゥーブ分解)。これは伊藤の公式で「確率積分(マルチンゲール部)+ドリフト(有界変動部)」という分解として再登場します。指数マルチンゲールは測度変換(ギルサノフ)の主役で、金融の無裁定価格付けの土台です。
⚠️ よくある誤解
- マルチンゲールでも破産する。乗法的マルチンゲール ( は平均1)は を保ちますが、 なら がほぼ確実。「期待値が一定」と「ほぼ確実に増える/減る」は両立します(期待値はまれな大当たりが支える)。だから上の乗法的例の標本平均は が大きいと過小評価になりがちで、有界なポリアの壺の方が数値的に安定します。
- 公平=勝てない、ではない。任意停止(次ノート)で「いつ止めるか」を工夫しても、条件が揃えば期待値は変わらない、というのが任意停止定理の主張です。
- マルチンゲール性はフィルトレーション依存。どの情報 に対する条件付けかで成否が変わります。
対応シミュレーション
本文の3例に加え、指数マルチンゲール も stochastic-processes-study/simulations/ で期待値1を確認できます。
関連
- 前提:条件付き期待値とフィルトレーション
- 次に読む:停止時刻と任意停止定理
- 発展:ブラウン運動の定義と性質、伊藤の公式