📊 対象級：2級・準1級　|　重要度：A（頻出）

中心極限定理（CLT）── MGFによる証明／ド・モアブル＝ラプラス／連続性補正

要点（BLUF）

中心極限定理（CLT）：独立同分布 $X_1,\dots,X_n$ （平均 $\mu$ 、分散 $0<\sigma^2<\infty$ 、母分布の形は問わない）に対し、標準化した標本平均は標準正規分布に分布収束する。 $Z_n=\frac{\bar X_n-\mu}{\sigma/\sqrt n}=\frac{\sqrt n(\bar X_n-\mu)}{\sigma}\ \xrightarrow{d}\ N(0,1).$ 要するに「どんな母分布でも、標本平均を標準化すれば $n$ を増やすほど標準正規の形になる」。
証明の山＝MGF（確率変数の変換・モーメント母関数・積率の集大成）： $Y_i=(X_i-\mu)/\sigma$ （ $E[Y]=0,V[Y]=1$ ）の和で $Z_n=\frac1{\sqrt n}\sum Y_i$ 。独立和はMGFの積なので $M_{Z_n}(t)=[M_Y(t/\sqrt n)]^n$ 。 $M_Y(s)=1+\frac{s^2}{2}+o(s^2)$ （1次項 $E[Y]=0$ が消える）を入れて $[1+\frac{t^2}{2n}+o(1/n)]^n\to e^{t^2/2}$ ＝標準正規のMGF。一意性より $Z_n\xrightarrow{d}N(0,1)$ 。**「1次が消えて2次だけ残るから正規になる」**のが核心。
大数の法則との対比（大数の法則（弱法則・強法則）の続き）：大数の法則＝ $\bar X_n$ が点 $\mu$ に潰れる（収束先は点）／CLT＝ $\sqrt n$ で拡大した $\sqrt n(\bar X_n-\mu)$ の揺らぎの形が正規（収束先は分布）。同じ標本平均の別側面。
ド・モアブル＝ラプラス：二項分布 $\mathrm{Bin}(n,p)\approx N(np,\,np(1-p))$ （CLTの歴史的特殊例＝独立ベルヌーイ和）。離散→連続の近似では連続性補正 $\pm0.5$ を入れる。

本文

0. まず日常のイメージ：身長の平均

クラス1人の身長は、低い人も高い人もいてバラバラ（母集団の分布は別に正規とは限らない）。ところが「ランダムに30人選んでその平均身長」を何度も計算してみると、その平均値たちの分布は、きれいな左右対称の釣鐘型（正規分布）になる。

ポイントは2つ。

元の1人ひとりがどんな分布でも、平均をとると正規になる（CLTの普遍性）。
平均値のばらつきは元のばらつきより小さい（ $\sigma/\sqrt{30}$ に縮む）。だから「平均」は1人の値より安定する。

選挙の出口調査や工場の品質管理が「平均」を見て少ない標本から全体を語れるのは、この定理のおかげ。

1. 中心極限定理は何を言っているか

直観：「たくさんの独立な確率変数を足して平均すると、元が何であろうと、その平均は正規分布の形になる」。サイコロの目（一様）でも、待ち時間（指数で右に歪む）でも、コインの表裏（ベルヌーイ）でも、十分多く集めて平均すれば、その標本平均の分布は釣鐘型（正規）になる。これがCLTで、統計学が正規分布を主役に据える最大の理由。

設定は大数の法則（大数の法則（弱法則・強法則））と同じ 独立同分布（i.i.d.） $X_1,X_2,\dots$ で、母平均 $\mu=E[X_i]$ と母分散 $\sigma^2=V[X_i]$ がともに有限（ $0<\sigma^2<\infty$ ）。

大数の法則は「 $\bar X_n$ が $\mu$ に収束する（散らばりが消えて1点に潰れる）」までしか言わない。CLTはその先を述べる——潰れていく途中の「揺らぎの形」が正規だ、と。だから「収束」ではなく「分布収束（distribution convergence）」がCLTの結論。

2. CLTの3つの同値な表現

主張は次のどれで書いても同じ（ $n$ が大きいときの近似形）。試験ではこの使い分けが問われる。

表現	式	何を近似しているか	主な使い所
標準化形（収束の本体）	$\dfrac{\bar X_n-\mu}{\sigma/\sqrt n}\xrightarrow{d}N(0,1)$	標準化した標本平均 → 標準正規	証明・確率計算（ $z$ 値）
標本平均の形	$\bar X_n\ \approx\ N\!\left(\mu,\ \dfrac{\sigma^2}{n}\right)$	標本平均そのものの分布	区間推定・標準誤差
総和の形	$\displaystyle\sum_{i=1}^n X_i\ \approx\ N(n\mu,\ n\sigma^2)$	合計値の分布	合計の確率（二項など）

3つは $\bar X_n=\frac1n\sum X_i$ の平均・分散（ $E[\bar X_n]=\mu,\ V[\bar X_n]=\sigma^2/n$ 、期待値・分散の性質（線形性・和の分散・共分散））で互いに変換できる。標準偏差 $\sigma/\sqrt n$ を標準誤差（standard error, SE）と呼び、Phase 4 の推定・検定で中心的役割を果たす。

flowchart LR
    A["i.i.d. の和<br/>X1, X2, ..., Xn"] --> B["標準化<br/>(平均ひいて σ/√n で割る)"]
    B --> C["n を大きくする<br/>(n → ∞)"]
    C --> D["標準正規分布<br/>N(0, 1)"]

注意：CLTが述べるのは標準化した $Z_n$ が $N(0,1)$ に収束すること。 $\bar X_n$ 自身は $\mu$ に潰れる（大数の法則）ので「 $\bar X_n$ が正規分布に収束する」という言い方は不正確。正しくは「 $\bar X_n$ は近似的に $N(\mu,\sigma^2/n)$ に従う」。

3. MGFによるCLTの証明 ── 本トピックの山

ここは数式が続きます。証明の流れだけ知りたい方は、各ステップの太字の一言を拾って読み飛ばしてOKです。

確率変数の変換・モーメント母関数・積率で用意した道具（MGF、独立和はMGFの積、一意性）がここで全部使われる。これがPhase 2の数理の集大成。

【設定】標準化してから足す まず各 $X_i$ を標準化した $Y_i$ を作る：

Y_i=\frac{X_i-\mu}{\sigma}\quad\Longrightarrow\quad E[Y_i]=0,\ \ V[Y_i]=E[Y_i^2]=1.

（ $Y_i$ は i.i.d.、平均0・分散1。 $V[Y]=E[Y^2]-(E[Y])^2=E[Y^2]=1$ 。）すると目標の $Z_n$ は

Z_n=\frac{\bar X_n-\mu}{\sigma/\sqrt n}=\frac{\sqrt n(\bar X_n-\mu)}{\sigma} =\frac{1}{\sqrt n}\sum_{i=1}^n \frac{X_i-\mu}{\sigma} =\frac{1}{\sqrt n}\sum_{i=1}^n Y_i.

要するに**「標準化した変数を $n$ 個足して $\sqrt n$ で割る」**のが $Z_n$ 。

【道具1】独立和のMGFは積（確率変数の変換・モーメント母関数・積率）独立な確率変数の和のMGFは各MGFの積。さらに定数倍 $aY$ のMGFは $M_{aY}(t)=M_Y(at)$ 。これを $Z_n=\sum (Y_i/\sqrt n)$ に適用：

M_{Z_n}(t)=E\!\left[e^{t Z_n}\right] =E\!\left[\exp\!\Big(\tfrac{t}{\sqrt n}\textstyle\sum_i Y_i\Big)\right] =\prod_{i=1}^n E\!\left[e^{(t/\sqrt n)Y_i}\right] =\Big[M_Y\!\Big(\tfrac{t}{\sqrt n}\Big)\Big]^{n}.

（ $Y_i$ が i.i.d. なので各因子が同じ $M_Y(t/\sqrt n)$ になり、 $n$ 乗にまとまる。）

【道具2】 $M_Y$ をテイラー展開すると1次が消える MGFのテイラー展開は $M_Y(s)=\sum_k \frac{s^k}{k!}E[Y^k]$ （確率変数の変換・モーメント母関数・積率）。 $Y$ は平均0・分散1なので $E[Y^0]=1,\ E[Y]=0,\ E[Y^2]=1$ 。よって $s\to0$ で

M_Y(s)=1+\underbrace{E[Y]}_{=0}\,s+\frac{E[Y^2]}{2}s^2+o(s^2) =1+\frac{s^2}{2}+o(s^2).

ここが核心：標準化したおかげで1次の項 $E[Y]\,s$ が消え、最低次の情報が「2次の $\frac{s^2}{2}$ 」になる。正規分布のMGF $e^{t^2/2}$ の指数部が $t^2$ なのは、ここで2次が生き残ることに由来する。

【合流】 $s=t/\sqrt n$ を代入して $n$ 乗の極限をとる $s=t/\sqrt n$ とおくと $s^2=t^2/n$ なので

M_Y\!\Big(\tfrac{t}{\sqrt n}\Big)=1+\frac{t^2}{2n}+o\!\Big(\frac1n\Big).

これを $n$ 乗する：

M_{Z_n}(t)=\Big[\,1+\frac{t^2}{2n}+o\!\big(\tfrac1n\big)\Big]^{n}\ \xrightarrow[n\to\infty]{}\ e^{t^2/2}.

極限の根拠は $\big(1+\frac{a}{n}\big)^n\to e^{a}$ （ $a=t^2/2$ ）。 $o(1/n)$ の項は $n$ 乗しても消える（ $n\cdot o(1/n)\to0$ ）。

【結論】一意性で締める（確率変数の変換・モーメント母関数・積率） $e^{t^2/2}$ は標準正規 $N(0,1)$ のMGF。MGFが（0の近傍で）一致すれば分布が一致する（一意性）ので

\boxed{\ Z_n\ \xrightarrow{d}\ N(0,1).\ }\qquad\blacksquare

要するに証明の骨は3行：「独立和でMGFが $[M_Y(t/\sqrt n)]^n$ に → 標準化で1次が消え2次の $\frac{t^2}{2n}$ だけ残る → $n$ 乗の極限が $e^{t^2/2}$ 」。母分布の形（3次以上のモーメント）は $o(1/n)$ に押し込まれて消えるので、結論が母分布によらない。これがCLTの普遍性の数理的な理由。

厳密には「MGFが存在する」前提が要る（裾の重い分布だとMGFが無い）。MGFを使わず特性関数 $\varphi_Y(t)=E[e^{itY}]$ （確率変数の変換・モーメント母関数・積率、常に存在）で同じ計算をすれば、分散有限という条件だけで証明できる（リンドバーグ＝レヴィの定理）。準1級ではMGF版で筋を理解すれば十分。

4. 大数の法則 vs 中心極限定理（潰す vs 拡大する）

同じ i.i.d. の標本平均 $\bar X_n$ を扱うのに、2つの定理は見る倍率が違う。大数の法則（弱法則・強法則）で予告した対比をここで確定させる。

	大数の法則（LLN）	中心極限定理（CLT）
主張	$\bar X_n\to\mu$	$\dfrac{\bar X_n-\mu}{\sigma/\sqrt n}\to N(0,1)$
収束の種類	確率収束 / 概収束	分布収束 $\xrightarrow{d}$
収束先	点 $\mu$ （散らばりが消える）	分布の形（正規）
何を見ているか	$\bar X_n$ そのもの（虫眼鏡なし）→ 1点に潰れる	$\sqrt n$ 倍に拡大した揺らぎ → 形が正規
倍率	拡大しない	$\sqrt n$ 倍
必要な仮定	$\mu$ 存在（弱法則の証明は $\sigma^2<\infty$ ）	$\mu,\sigma^2$ ともに有限
役割	「平均は真の値に近づく」	「近づくときの速さと揺らぎの形」

直観： $\bar X_n$ をそのまま見ると散らばり $\sigma/\sqrt n$ で点 $\mu$ に潰れる（LLN）。潰れた後は形が見えない。そこで $\sqrt n$ 倍に拡大して見ると、 $\sqrt n(\bar X_n-\mu)$ の分散は $n\cdot\frac{\sigma^2}{n}=\sigma^2$ で一定に保たれ、その分布が $N(0,\sigma^2)$ という形に落ち着く（CLT）。さらに $\sigma$ で割れば $N(0,1)$ 。LLNは「点に潰れる」を、CLTは「 $\sqrt n$ の虫眼鏡で見た揺らぎの形が正規」を見ている。

5. ド・モアブル＝ラプラスの定理（二項分布の正規近似）

CLTの歴史的に最初の特殊例（1733年ド・モアブル $p=1/2$ 、1812年ラプラス一般 $p$ ）。

二項分布 $X\sim\mathrm{Bin}(n,p)$ は「成功確率 $p$ の独立試行を $n$ 回くりかえした成功回数」。これは独立な指示変数（ベルヌーイ）の和 $X=\sum_{i=1}^n X_i$ （ $X_i\in\{0,1\},\ P(X_i=1)=p$ ）だから、まさにCLTの適用対象。ベルヌーイは $E[X_i]=p,\ V[X_i]=p(1-p)$ （期待値・分散の性質（線形性・和の分散・共分散））なので、総和の形（第2節）より

X=\sum_{i=1}^n X_i\ \approx\ N\big(np,\ np(1-p)\big)\qquad(n\ \text{大}).

要するに**「二項分布は $n$ が大きいと平均 $np$ ・分散 $np(1-p)$ の正規分布で近似できる」**。これがド・モアブル＝ラプラスの定理。確率計算は標準化して

P(a\le X\le b)\ \approx\ \Phi\!\left(\frac{b-np}{\sqrt{np(1-p)}}\right)-\Phi\!\left(\frac{a-np}{\sqrt{np(1-p)}}\right)

（ $\Phi$ は標準正規の累積分布関数）。ただし離散を連続で近似するので、次の連続性補正が要る。

6. 連続性補正（continuity correction）

離散分布（二項・ポアソンなど）を連続分布（正規）で近似するとき、区間の端を外側に $\pm0.5$ ずらす補正。

なぜ要るか：二項分布は $X=a,a+1,\dots,b$ という棒の集まり。各棒を「幅1の長方形」とみなすと、 $k$ の棒は区間 $[k-0.5,\ k+0.5]$ を占める。だから「 $a$ から $b$ までの棒の確率」を正規曲線の面積で拾うには、 $[a,b]$ ではなく両端の半分の棒まで含めた $[a-0.5,\ b+0.5]$ を積分しないと、端の棒を取りこぼす。

P(a\le X\le b)\ \approx\ \Phi\!\left(\frac{b+0.5-np}{\sqrt{np(1-p)}}\right)-\Phi\!\left(\frac{a-0.5-np}{\sqrt{np(1-p)}}\right).

要するに**「棒の幅1を区間で拾うための ±0.5」**。不等号の向きで補正の向きが変わる（下表）。

求めたい確率（離散）	連続性補正した区間
$P(X=k)$	$[\,k-0.5,\ k+0.5\,]$
$P(a\le X\le b)$	$[\,a-0.5,\ b+0.5\,]$
$P(X\le b)$	$(-\infty,\ b+0.5\,]$
$P(X\ge a)$	$[\,a-0.5,\ \infty)$
$P(X<b)=P(X\le b-1)$	$(-\infty,\ b-0.5\,]$ （等号なしは先に整数へ直す）

補正の効果は数値で大きい。本ノートのシミュ②では $\mathrm{Bin}(40,0.5)$ の $P(18\le X\le 22)$ で、補正なしの誤差が補正ありの約155倍になる。

7. 正規近似の実用と注意（ $n\ge30$ は目安）

「 $n\ge30$ で正規とみなしてよい」はあくまで目安。母分布が対称・なだらかなら小さい $n$ でも十分近いが、母分布が強く歪んでいるほど大きな $n$ が要る（シミュ①で偏ったコイン $p=0.1$ が最も遅く正規化する）。
二項では $p$ が0や1に近いと近似が悪い。経験則として $np\ge5$ かつ $n(1-p)\ge5$ （より厳しくは $\ge10$ ）を満たすと正規近似が妥当とされる。 $p=0.01$ のように偏ると、分布が非対称で正規近似は崩れる（このときはポアソン近似の出番）。
標準誤差 $\sigma/\sqrt n$ がCLTの実用の核。 $n$ を100倍にしても精度（SE）は $1/10$ にしかならない（ $\sqrt n$ スケール、期待値・分散の性質（線形性・和の分散・共分散））。
CLTは Phase 4 の区間推定・仮説検定の正規近似の土台。標本平均の信頼区間 $\bar X\pm z\cdot\frac{\sigma}{\sqrt n}$ 、母比率の検定、二項検定の正規近似などはすべてCLT（とド・モアブル＝ラプラス）に依拠する。

8. 試験での問われ方

2級（中核）：CLTの主張（母分布の形によらず標本平均が正規に近づく）、 $\bar X_n\approx N(\mu,\sigma^2/n)$ の標準化して確率計算（ $z=\frac{\bar X-\mu}{\sigma/\sqrt n}$ で正規分布表を引く）、標準誤差 $\sigma/\sqrt n$ 、二項分布の正規近似 $N(np,np(1-p))$ 。「 $n$ を増やすと標本平均の分布はどうなるか」の正誤・計算。
2級の発展／準1級：連続性補正 $\pm0.5$ を入れた二項の確率計算、ド・モアブル＝ラプラスの位置づけ、大数の法則との区別（点への収束 vs 分布への収束）、分布収束の意味。
準1級（応用）：MGFによるCLTの証明（標準化和のMGF $[M_Y(t/\sqrt n)]^n\to e^{t^2/2}$ 、1次が消えて2次が残る論法）、収束の精緻化（リンドバーグ＝レヴィ、特性関数版）、デルタ法（ $g(\bar X_n)$ の漸近正規性）への接続、近似の妥当条件。
※公式の出題範囲表は改訂されうる。とくに2級の「発展的事項」の扱い・準1級範囲は受験前に最新の範囲表で要最新確認。

数式の直観的意味

なぜ「1次が消えて2次だけ残る」と正規になるのか

正規分布 $N(0,1)$ のMGFは $e^{t^2/2}$ で、指数部が $t$ の2次。一方、任意の平均0・分散1の分布のMGFは $M_Y(s)=1+\frac{s^2}{2}+(\text{3次以上})$ と、最低次の生きた項が2次（1次は平均0で消える）。 $Z_n=\frac1{\sqrt n}\sum Y_i$ のスケーリング $s=t/\sqrt n$ は、 $s^2=t^2/n$ を作って2次項をちょうど $n$ で割る——これを $n$ 乗すると $(1+\frac{t^2/2}{n})^n\to e^{t^2/2}$ で2次項だけが指数に上がる。3次以上は $s^3=t^3/n^{3/2}$ のように $n$ の高い冪で割られ、 $n$ 乗しても消える（ $n\cdot n^{-3/2}=n^{-1/2}\to0$ ）。だから**「2次のモーメント（分散）だけが生き残り、3次以上（歪度・尖度）は薄まって消える」**。正規分布は2次のモーメントで決まる分布なので、結果が正規になる——これがCLTが母分布の細部を忘れて正規に収束する仕組み。

なぜ $\sqrt n$ で拡大するのか（倍率の必然性）

$\bar X_n-\mu$ の標準偏差は $\sigma/\sqrt n$ （期待値・分散の性質（線形性・和の分散・共分散））。これを「形が見える一定サイズ」に保つには、 $\sqrt n$ 倍に拡大して標準偏差を $\sqrt n\cdot\frac{\sigma}{\sqrt n}=\sigma$ にすればよい。 $\sqrt n$ より小さい倍率（例 $n^{1/3}$ ）だと拡大が足りず点に潰れたまま、大きい倍率（例 $n$ ）だと拡大しすぎて散らばりが発散する。 $\sqrt n$ はちょうど揺らぎを一定に保つ唯一の倍率で、これがCLTのスケーリングが $\sqrt n$ である理由。大数の法則（拡大なし→潰れる）とCLT（ $\sqrt n$ 拡大→形が出る）が連続的につながる。

なぜ連続性補正は $0.5$ なのか（半分の必然性）

整数 $k$ の棒を「幅1の長方形」で表すと、隣の整数 $k-1,k+1$ との中点が境界になる。 $k$ と $k+1$ の中点は $k+0.5$ 、 $k$ と $k-1$ の中点は $k-0.5$ 。だから $k$ の棒の縄張りは $[k-0.5,k+0.5]$ で、幅がちょうど1。 $0.5$ は「隣との中点までの距離＝棒の幅の半分」。だから補正値は分布によらず常に $0.5$ （幅1の整数格子の場合）。要するに**「離散の点を幅1の区間に展開したときの“のりしろ”が片側0.5」**。

⚠️ 引っかけポイント・頻出論点・級ごとの差

「 $\bar X_n$ が正規分布に収束する」は不正確（最頻出）： $\bar X_n$ は大数の法則で点 $\mu$ に潰れる。正規に収束するのは標準化した $\frac{\bar X_n-\mu}{\sigma/\sqrt n}$ 。正しい言い方は「 $\bar X_n$ は近似的に $N(\mu,\sigma^2/n)$ に従う」。「収束先が分布」なのは標準化形だけ。
CLT ≠ 大数の法則（収束先が点か形か）：大数の法則＝点 $\mu$ への収束（確率/概収束）、CLT＝分布の形への収束（分布収束）。「 $n$ を増やすと正規になる＝大数の法則」は誤り（大数の法則は形を言わない）。
母分布の分散が無いとCLTは成り立たない： $\sigma^2=\infty$ の分布（コーシーなど、確率変数の変換・モーメント母関数・積率）ではCLTは適用できない（コーシーの標本平均はまたコーシーで、正規に近づかない）。「どんな分布でも標本平均は正規に近づく」は誤り——分散有限が前提。
$n\ge30$ は十分条件ではなく目安：母分布が強く歪むと $n=30$ でも正規近似は不十分（シミュ①の $p=0.1$ ）。逆に対称なら $n$ が小さくても近い。「 $n\ge30$ なら常に正規でよい」と断定しない。
連続性補正の向きを間違える： $P(a\le X\le b)$ は外側に広げて $[a-0.5,b+0.5]$ 。 $P(X\le b)$ は $b+0.5$ まで、 $P(X\ge a)$ は $a-0.5$ から。等号の有無で整数がずれる（ $P(X<b)=P(X\le b-1)$ なので $b-0.5$ ）。連続変数の正規近似（標本平均など）には補正は不要（補正は離散を連続で近似するときだけ）。
二項の正規近似 vs ポアソン近似： $n$ 大・ $p$ 中庸（ $np,n(1-p)\ge5$ ）なら正規近似。 $n$ 大・ $p$ 小（ $np$ が小さいまま、 $\lambda=np$ 一定）ならポアソン近似。 $p$ が0/1に近いと正規近似は崩れる。
標準化の分母は $\sigma/\sqrt n$ （標準誤差）であって $\sigma$ ではない：標本平均の確率計算で $z=\frac{\bar X-\mu}{\sigma}$ と書くのは誤り。標本平均の散らばりは $\sigma/\sqrt n$ なので分母は $\sigma/\sqrt n$ 。1個の値 $X$ の標準化（分母 $\sigma$ ）と取り違えない。
証明で1次項を残してしまう（準1級）：MGF証明の肝は標準化で $E[Y]=0$ となり1次項が消えること。標準化せずに $\frac1n\sum X_i$ のMGFを展開すると1次項（ $\mu$ ）が残り、 $e^{t^2/2}$ に行かない（行くのは $\mu$ への退化＝大数の法則側）。必ず $Y_i=(X_i-\mu)/\sigma$ で標準化してから足す。
級差：2級＝主張・ $N(\mu,\sigma^2/n)$ で標準化計算・二項の正規近似／2級発展・準1級＝連続性補正・大数の法則との区別・分布収束／準1級＝MGFによる証明・収束の精緻化・デルタ法への接続。

よくある疑問

Q. 「標本平均が正規分布に収束する」と覚えていたのですが、違うのですか？

不正確です。 $\bar X_n$ そのものは大数の法則で点 $\mu$ に潰れます。正規分布に収束するのは標準化した $\frac{\bar X_n-\mu}{\sigma/\sqrt n}$ です。実用上は「 $\bar X_n$ は近似的に $N(\mu,\sigma^2/n)$ に従う」と言います。試験では「 $\bar X_n$ が $N(0,1)$ に収束する」のような選択肢はバツです。

Q. 大数の法則とCLTは何が違うのですか？両方「標本平均」の話に見えます。

収束先が違います。 大数の法則は「標本平均が点 $\mu$ に近づく」（散らばりが消える）。CLTは「 $\sqrt n$ で拡大して見た揺らぎが正規分布の形になる」（散らばりの形が分かる）。大数の法則は形を言わず、CLTはその先の形まで言う、という関係です。

Q. 「どんな分布でも」と言いますが、本当に例外はないのですか？

母分散が有限であることが必要です。コーシー分布のように分散が無限大（確率変数の変換・モーメント母関数・積率）だとCLTは成り立ちません（コーシーの標本平均はまたコーシーで、正規に近づきません）。「分散が有限な i.i.d. なら」という条件付きの「どんな分布でも」です。

Q. なぜ補正値は $0.5$ なのですか？

整数 $k$ の棒を「幅1の長方形」で表すと、隣の整数との中点が境界になります。 $k$ と $k+1$ の中点は $k+0.5$ 。だから棒の縄張りは $[k-0.5,k+0.5]$ で幅1になり、片側の「のりしろ」が $0.5$ です。値がとびとびで間隔が1の離散分布なら、補正は常に $0.5$ です。

Q. 標準化の分母は $\sigma$ ではないのですか？

標本平均の確率計算では分母は $\sigma/\sqrt n$ （標準誤差） です。標本平均の散らばりは $\sigma$ ではなく $\sigma/\sqrt n$ に縮んでいるからです。1個の値 $X$ の標準化（分母 $\sigma$ ）と取り違えやすいので注意してください。

まとめ

CLT：分散が有限な i.i.d. なら、標準化した標本平均は $n\to\infty$ で $N(0,1)$ に分布収束する。実用形は $\bar X_n\approx N(\mu,\sigma^2/n)$ 。
大数の法則との違い：大数の法則＝点 $\mu$ への収束、CLT＝分布の形への収束。「潰す vs $\sqrt n$ で拡大する」。
証明（準1級）：標準化和のMGFが $[M_Y(t/\sqrt n)]^n\to e^{t^2/2}$ 。標準化で1次が消え2次だけ残るから正規になる。
ド・モアブル＝ラプラス： $\mathrm{Bin}(n,p)\approx N(np,np(1-p))$ 。離散→連続の近似には連続性補正 $\pm0.5$ 。
$n\ge30$ は目安。歪みが強い母分布や $p$ が0/1に近い二項では大きい $n$ が要る。標準誤差は $\sigma/\sqrt n$ で、Phase 4 の推定・検定の土台になる。

対応するシミュレーション

simulations/chuushin_kyokugen.py
- 何を示すか：正規分布ではない3つの母分布（一様 $U(0,1)$ ・指数（右に歪む）・偏ったコイン $\mathrm{Bernoulli}(0.1)$ ）から、標本平均を標準化した $Z=\frac{\bar X-\mu}{\sigma/\sqrt n}$ を2万個ずつ作り、 $n=1,2,5,30$ のヒストグラムに $N(0,1)$ の理論曲線（自前の密度 $\frac1{\sqrt{2\pi}}e^{-z^2/2}$ ）を重ねる。**収束ではなく「分布の形が正規になる」**ことが主題（大数の法則のシミュとの差別化）。
- 実行結果（seed=0）：どの母分布でも $n=1$ では母分布の形がそのまま（一様＝平ら、指数＝右に歪む、コイン＝棒）だが、 $n=30$ で $N(0,1)$ に重なる。偏ったコイン（最も非対称）は $n=5$ でまだ歪み、 $n=30$ で近づく＝「歪みが強いほど大きな $n$ が要る」の実例。標準出力では全12マスで実測平均がほぼ0・実測分散がほぼ1（例：指数 $n=30$ で平均0.0012・分散1.0106、コイン $n=30$ で平均0.0117・分散0.9885）。平均・分散は $n$ が小さくても合うのに“形”が正規になるのは $n$ が大きいときだけ——CLTが「平均・分散の話」ではなく「分布収束の話」であることを対比で示す。

どんな母分布でも標本平均は正規になる

simulations/chuushin_kyokugen_nikou_seiki.py
- 何を示すか：二項分布 $\mathrm{Bin}(40,0.5)$ を正規 $N(np,np(1-p))=N(20,10)$ で近似（ド・モアブル＝ラプラス）。 $P(18\le X\le 22)$ を①二項で厳密計算、②補正なしの正規 $[18,22]$ 、③連続性補正ありの正規 $[17.5,22.5]$ の3通りで求め、補正の効果を数値で比較。
- 実行結果：厳密値 0.570409／補正なし 0.473117（誤差 0.097292）／補正あり 0.571036（誤差 0.000626）。補正ありの誤差は補正なしの約155分の1。連続性補正を入れるべきことを数値で裏づけ。左の図では二項の棒が正規曲線にほぼ一致（ド・モアブル＝ラプラス）。

二項の正規近似と連続性補正の効果