モンテカルロ積分の原理｜シミュレーション

🎓 レベル：基礎　|　重要度：A（必須）

📎 前提：大数の法則と中心極限定理の役割　|　関連：収束率と誤差（√n則）

要点（BLUF）

モンテカルロ積分：積分 $\int_a^b g(x)\,dx$ を期待値 $(b-a)\,E[g(U)]$ と見なし、一様乱数での標本平均で近似します。
推定量は不偏（期待値が真の積分に一致）。 $\int_0^1 e^x dx$ を100万標本で 1.71968 と推定、真値 $e-1 = 1.71828$ と一致。
一般の密度 $p(x)$ からサンプリングする形 $E_p[g(X)]$ に拡張でき、これが期待値推定・重点サンプリングの土台です。

1. 積分を期待値として書く

定積分 $I = \int_a^b g(x)\,dx$ を考えます。区間 $[a,b]$ 上の一様分布 $U \sim \mathcal{U}(a,b)$ の密度は $\frac{1}{b-a}$ なので、

E[g(U)] = \int_a^b g(x)\,\frac{1}{b-a}\,dx = \frac{I}{b-a} \quad\Longrightarrow\quad I = (b-a)\,E[g(U)]

つまり積分は、一様乱数で評価した $g$ の期待値を $(b-a)$ 倍したもの。期待値は大数の法則で標本平均に置き換えられるので、独立な $U_1,\dots,U_n \sim \mathcal{U}(a,b)$ を引いて

\hat{I}_n = (b-a)\,\frac{1}{n}\sum_{i=1}^{n} g(U_i)

が推定量になります。これがモンテカルロ積分です。

flowchart LR
    A["積分 I = ∫g dx"] -->|"期待値に翻訳"| B["I = (b-a)・E(g(U))"]
    B -->|"大数の法則"| C["標本平均で近似"]

2. 不偏性

$\hat{I}_n$ の期待値を取ると

E[\hat{I}_n] = (b-a)\,\frac{1}{n}\sum_{i=1}^{n} E[g(U_i)] = (b-a)\,E[g(U)] = I

サンプル数 $n$ によらず、推定の期待値は真の積分 $I$ にぴったり一致します。これが不偏性。バイアスがゼロなので、誤差は分散（ばらつき）だけの問題になり、 $n$ を増やせば[[03-02_収束率と誤差| $1/\sqrt{n}$ で縮む]]、という綺麗な構図になります。

3. 具体例：∫₀¹ eˣ dx を推定する

真値は $\int_0^1 e^x dx = e - 1 = 1.71828\ldots$ 。一様乱数で $e^{U}$ の平均を取ります（ $b-a=1$ ）。

import numpy as np

# 乱数シードを固定
rng = np.random.default_rng(20)

n = 1_000_000
x = rng.random(n)             # Uniform(0,1)
estimate = np.exp(x).mean()   # (b-a)=1 なので平均そのもの

print(f"モンテカルロ推定 = {estimate:.5f}")
print(f"真値 (e-1)       = {np.e - 1:.5f}")
print(f"絶対誤差         = {abs(estimate - (np.e-1)):.5f}")

出力：

モンテカルロ推定 = 1.71968
真値 (e-1)       = 1.71828
絶対誤差         = 0.00139

出力の意味：100万標本で $e-1 = 1.71828$ を 1.71968 と推定、誤差 0.0014。一般区間でも同じで、 $\int_0^\pi \sin x\,dx$ （真値2）は $(b-a)=\pi$ 倍して推定できます。「積分を平均に翻訳する」——たったこれだけで、解析解のない積分も数値化できるのがモンテカルロの威力です。

4. 一般の密度への拡張

一様分布に限らず、任意の密度 $p(x)$ からサンプリングする期待値

\theta = E_p[g(X)] = \int g(x)\,p(x)\,dx \;\approx\; \frac{1}{n}\sum_{i=1}^n g(X_i),\quad X_i \sim p

も同じ枠組みです。ベイズの事後期待値、金融のオプション価格、信頼性の故障確率——応用上の「期待値を計算したい」はすべてこの形。 $p$ をわざと変えて分散を下げるのが重点サンプリング、 $p$ から直接引けないときに連鎖で引くのがMCMCです。

積分を期待値に書き換えるとき、被積分関数を「 $g(x)\cdot p(x)$ 」のどこで切るか（何を密度と見るか）には自由度があり、その選択が推定の効率（分散）を左右します。

数式の直観的意味

モンテカルロ積分は「関数の平均の高さ × 区間の幅 = 面積」という小学校の長方形近似を、乱数で実行しているだけです。決定的な数値積分（台形則）が「等間隔の格子で高さを測る」のに対し、モンテカルロは「ランダムな点で高さを測り、その平均を取る」。等間隔だと次元 $d$ で格子点が $N^d$ に爆発しますが、ランダムサンプリングなら点の数は次元と独立に選べる——だから高次元で逆転します。不偏性は「ランダムに測っても、平均の高さは正しく当たる」ことの保証です。

⚠️ よくある誤解・落とし穴

「 $(b-a)$ 倍を忘れる」：一様区間が $[0,1]$ 以外なら $(b-a)$ を掛けないと積分になりません。 $[0,1]$ だから不要なだけ。
「不偏なら誤差ゼロ」ではない：不偏は「平均的に当たる」だけ。1回の推定は分散ぶんブレます。誤差を消すには $n$ を増やす（収束率と誤差（√n則））。
「低次元でもモンテカルロが最善」ではない：1〜3次元なら台形則・シンプソン則が圧倒的に速く正確。モンテカルロが効くのは高次元です。
「無限区間でも一様で引ける」ではない： $[a,b]$ が無限だと一様分布が定義できません。変数変換するか、適切な密度 $p$ からサンプリングします。
「被積分関数が発散しても平気」ではない： $g$ の分散が無限だと $1/\sqrt{n}$ 則が崩れ、推定が不安定になります。

対応シミュレーション参照

本文の $\int_0^1 e^x dx$ 推定（default_rng(20)）。収束の速さは収束率と誤差（√n則）へ。