収束率と誤差（√n則）｜シミュレーション

🎓 レベル：標準　|　重要度：A（必須）

📎 前提：モンテカルロ積分の原理　|　関連：推定量の信頼区間　|　第4章分散減少法目次

要点（BLUF）

モンテカルロ推定の誤差（標準偏差）は $\sigma/\sqrt{n}$ 。サンプル $n$ を100倍にして、誤差はやっと10分の1。
この $1/\sqrt{n}$ 則は積分の次元に依らない——ここが格子型数値積分（台形則・シンプソン則）に対する決定的優位（次元の呪いを回避）。
RMSE を実測すると $\text{RMSE}\times\sqrt{n}$ がほぼ一定（約0.49〜0.54）で、理論の $\sigma = 0.4921$ に収束することを確かめます。

1. 誤差の大きさ：標準誤差

モンテカルロ推定量 $\hat{I}_n = \frac{1}{n}\sum g(U_i)$ （モンテカルロ積分の原理）の分散は、独立標本なので

\text{Var}(\hat{I}_n) = \frac{\sigma^2}{n},\qquad \sigma^2 = \text{Var}(g(U))

標準偏差（＝標準誤差）はその平方根 $\sigma/\sqrt{n}$ 。中心極限定理より $\hat{I}_n$ は近似的に正規分布なので、誤差の典型的な大きさはこの標準誤差で測れます。

|\hat{I}_n - I| \;\sim\; \frac{\sigma}{\sqrt{n}}

重要な含意：精度を1桁（10倍）上げるには、サンプルを100倍にする必要がある。モンテカルロが「遅い」と言われる理由です。改善の方向は2つ—— $n$ を増やす（力技）か、 $\sigma$ を下げる（分散減少法、賢い）。

2. 実測：RMSE×√n は一定になる

$\int_0^1 e^x dx$ の推定を各 $n$ で200回繰り返し、二乗平均平方根誤差（RMSE）を測ります。理論が正しければ $\text{RMSE} \approx \sigma/\sqrt{n}$ なので、 $\text{RMSE}\times\sqrt{n} \approx \sigma$ （一定）になるはずです。

import numpy as np

# 乱数シードを固定
rng = np.random.default_rng(21)
true = np.e - 1

for n in [100, 1000, 10000, 100000, 1000000]:
    errs = []
    for rep in range(200):                 # 各 n で200回繰り返し
        x = rng.random(n)
        errs.append(np.exp(x).mean() - true)
    rmse = np.sqrt(np.mean(np.array(errs)**2))
    print(f"n={n:>7}: RMSE={rmse:.5f}  RMSE x sqrt(n)={rmse*np.sqrt(n):.4f}")

# 理論的な sigma = sd of e^U on U(0,1)
xx = rng.random(2_000_000)
print(f"理論 sigma (e^U の標準偏差) = {np.exp(xx).std():.4f}")

出力：

n=    100: RMSE=0.05373  RMSE x sqrt(n)=0.5373
n=   1000: RMSE=0.01664  RMSE x sqrt(n)=0.5262
n=  10000: RMSE=0.00494  RMSE x sqrt(n)=0.4943
n= 100000: RMSE=0.00159  RMSE x sqrt(n)=0.5018
n=1000000: RMSE=0.00051  RMSE x sqrt(n)=0.5106

理論 sigma (e^U の標準偏差) = 0.4921

出力の意味： $n$ が100倍になるたび RMSE はおよそ10分の1（0.0537 → 0.00494 → 0.00051）。一方 $\text{RMSE}\times\sqrt{n}$ は 0.49〜0.54 でほぼ一定、理論の $\sigma = 0.4921$ の周りに収まります。これが $1/\sqrt{n}$ 則の実証です。 $\sqrt{n}$ で割ると一定になる＝誤差は $\sigma/\sqrt{n}$ だと数値が裏付けています。

3. 次元に依らない——最大の長所

格子型の数値積分は、 $d$ 次元で各軸を $N$ 分割すると点数 $N^d$ 、誤差は $O(N^{-k/d})$ （台形則は $k=2$ ）と、次元 $d$ が上がるほど収束が劇的に悪化します（次元の呪い）。

モンテカルロの誤差 $\sigma/\sqrt{n}$ には次元 $d$ がどこにも出てきません。サンプル点はランダムなので「軸ごとに分割」という発想自体が無く、 $n$ 点で測れば次元が10でも100でも誤差は $1/\sqrt{n}$ 。

手法	誤差オーダー	次元の影響
台形則	$O(n^{-2/d})$	次元で激減
シンプソン則	$O(n^{-4/d})$	次元で激減
モンテカルロ	$O(n^{-1/2})$	なし

だから低次元では決定的手法に負けますが、おおむね $d \ge 4$ あたりからモンテカルロが逆転します。高次元積分（ベイズの周辺尤度、金融の多資産オプション）でモンテカルロが標準になるのはこのためです。

数式の直観的意味

$\sigma/\sqrt{n}$ の $\sqrt{n}$ は「独立な誤差は打ち消し合うが、完全には消えない」ことの表現です。 $n$ 個の独立な揺らぎを足すと、和の標準偏差は $\sqrt{n}$ 倍（分散が $n$ 倍）。平均はそれを $n$ で割るので $\sqrt{n}/n = 1/\sqrt{n}$ だけ残る。ランダムウォークが $\sqrt{n}$ で広がるのと同じ算術です。次元に依らないのは、誤差が「 $g(U)$ という1次元の確率変数のばらつき $\sigma$ 」だけで決まり、 $U$ が何次元空間の点かは $\sigma$ の値に影響しても収束の指数 $1/2$ には影響しないから。改善するなら指数は動かせない（ $1/2$ のまま）ので、係数 $\sigma$ を削る——それが分散減少法の戦略です。

⚠️ よくある誤解・落とし穴

「 $n$ を2倍で誤差半分」ではない： $1/\sqrt{n}$ なので半分にするには4倍。10分の1にするには100倍。
「モンテカルロはいつでも優れている」ではない：低次元（1〜3）では台形則・シンプソン則が桁違いに速い。優位は高次元限定。
「 $\sigma$ は固定で変えられない」ではない：被積分関数の表し方（重点サンプリング・制御変量）で $\sigma$ は下げられます。それが第4章の主題。
「収束が見えないのはバグ」ではない： $\sigma$ が無限（重い裾）だと $1/\sqrt{n}$ 則が成り立たず収束が異常に遅い／見えない。分散の有限性を確認します。
「準モンテカルロも $1/\sqrt{n}$ 」ではない：低食い違い列を使う準モンテカルロ法は条件下で $O((\log n)^d/n)$ とより速くなります（乱数ではなく決定的な敷き詰め）。

対応シミュレーション参照

本文の RMSE×√n 一定性の実測（default_rng(21)）。