📊 対象級：2級　|　重要度：A（頻出）

正規分布（標準正規・標準化）

要点（BLUF）

正規分布 $N(\mu,\sigma^2)$ ：平均 $\mu$ （山の中心）・分散 $\sigma^2$ （広がり）を持つ、左右対称・釣鐘型の連続分布。確率密度関数（PDF）は $\boxed{\,f(x)=\dfrac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)\,}\quad(-\infty<x<\infty).$ 要するに「中心 $\mu$ から離れるほど指数関数的に確率が薄くなる山」。 $E[X]=\mu$ 、 $V[X]=\sigma^2$ 。
標準化（z変換）：どんな $N(\mu,\sigma^2)$ も、次の線形変換で平均0・分散1の標準正規分布 $N(0,1)$ に揃う。 $\boxed{\,Z=\dfrac{X-\mu}{\sigma}\sim N(0,1)\,}$ 要するに「中心を0にずらし、ものさしを $\sigma$ で割って単位を揃える」。これでただ1枚の標準正規分布表であらゆる正規分布の確率が読める。
68-95-99.7則： $\pm1\sigma$ に約68%、 $\pm2\sigma$ に約95%、 $\pm3\sigma$ に約99.7%。2級で最頻出の暗算ルール。

本文

まず日常のイメージ：身長の分布

ある集団の成人男性の身長が、平均 $\mu=170$ cm、標準偏差 $\sigma=6$ cm の正規分布にしたがうとします。

多くの人は170cm付近に集まり、中心から離れるほど人数が減る → 釣鐘型。
170cmを中心に左右対称（160cmの人と180cmの人はだいたい同じくらいいる）→ 左右対称。
「182cmより高い人は何%いるか？」のような問いに、標準化と分布表で数値で答えられる。

身長・測定誤差・テスト得点・製品寸法のばらつき── 「中心の周りにランダムに散らばる量」は、近似的に正規分布にしたがうことが非常に多い。なぜそうなるのかは中心極限定理（CLT）が答えます（独立な誤差がたくさん足し合わさると正規に近づく）。だから正規分布は統計学の中心にいます。

1. 確率密度関数（PDF）の形を読む

$f(x)=\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)$

式を3つの部品に分けて読みます。

部品	役割	要するに
$-(x-\mu)^2$	中心 $\mu$ からの「ずれの2乗」にマイナス	$\mu$ で最大、離れるほど小さい
$\exp(\,\cdot\,)$	そのずれを指数で減衰	裾が指数的に薄くなる（外れ値が出にくい）
$\dfrac{1}{\sqrt{2\pi}\,\sigma}$	全体の面積を1にするための定数	確率分布として成立させる「正規化定数」

$x=\mu$ で指数の中身が0になり $f$ は最大 → 山の頂点は $\mu$ 。
$(x-\mu)$ を $-(x-\mu)$ に変えても式は不変 → $\mu$ を軸に左右対称。よって平均=中央値=最頻値が一致。
$\sigma$ が大きいほど指数の減衰がゆるく、山は低く広くなる。 $\sigma$ が小さいと高く狭くなる（全面積1は保たれる）。

⚠️ $\sigma$ （標準偏差）と $\sigma^2$ （分散）を取り違えない。PDFの分母は $\sigma$ 、指数の分母は $2\sigma^2$ 。表記 $N(\mu,\sigma^2)$ は第2引数が分散（標準偏差ではない）。 $N(170,36)$ なら $\sigma=6$ 。

標準正規 $N(0,1)$ のPDFの値（密度）を $z$ ごとに並べると、左右対称の釣鐘型になります：

$z$	$-3$	$-2$	$-1$	$0$	$1$	$2$	$3$
密度 $\varphi(z)$	0.004	0.054	0.242	0.399	0.242	0.054	0.004

$z=0$ で最大（約 0.399）、両側へなだらかに減衰します。面積で見ると、中央 $\pm1\sigma$ に約 68%、 $\pm2\sigma$ に約 95%、 $\pm3\sigma$ に約 99.7% が入ります（68-95-99.7則）。

標準正規分布のPDFと68-95-99.7則。釣鐘型で z=0 が密度最大（約0.399）、±1σ≒68.3%・±2σ≒95.4%・±3σ≒99.7%が内側に入る

上の曲線は数値表を滑らかにつないだもの。塗り分けた面積が確率に対応し、内側ほど濃い領域が $\pm1\sigma$ （約68%）・ $\pm2\sigma$ （約95%）・ $\pm3\sigma$ （約99.7%）です。図は simulations/seiki_bunpu_keijou.py で生成しています。

2. 標準化：なぜ $Z=(X-\mu)/\sigma$ で $N(0,1)$ になるのか

正規分布は $\mu,\sigma$ の組み合わせだけ無限種類あります。全部に分布表を用意するのは不可能。そこでただ1つの基準分布に変換します。それが標準正規分布 $N(0,1)$ （平均0・分散1）で、そのPDFは

$\phi(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right).$

変換は $Z=\dfrac{X-\mu}{\sigma}$ 。要するに「中心を引いて（平行移動）、 $\sigma$ で割る（拡大縮小）」だけの線形変換です。この $Z$ が本当に $N(0,1)$ になることを、(A) 期待値・分散、(B) 分布の形（PDF）、の2段階で確かめます。

(A) 期待値0・分散1（線形変換の公式から一発）

期待値・分散の性質（線形性・和の分散・共分散）の $E[aX+b]=aE[X]+b$ 、 $V[aX+b]=a^2V[X]$ を使います。 $Z=\frac1\sigma X-\frac\mu\sigma$ なので（ $a=1/\sigma,\ b=-\mu/\sigma$ ）：

$E[Z]=\frac{1}{\sigma}E[X]-\frac{\mu}{\sigma}=\frac{\mu}{\sigma}-\frac{\mu}{\sigma}=0,$ $V[Z]=\frac{1}{\sigma^2}V[X]=\frac{\sigma^2}{\sigma^2}=1.$

要するに：平均を引けば中心が0に、 $\sigma$ で割れば分散が1に揃う。ここまでは $X$ が正規でなくても（平均 $\mu$ ・分散 $\sigma^2$ を持つ任意の分布で）成り立つ。「平均0・分散1」は標準化の効果であって、正規性とは無関係── これが後述の「標準化≠正規化」の核心です。

(B) 形まで $N(0,1)$ になる（変数変換でPDFを計算）

(A) は数値（平均・分散）の話。「形まで標準正規になる」のは $X$ がもともと正規だからです。連続確率変数の変数変換の公式（確率変数の変換・モーメント母関数・積率）を使います。単調変換 $z=g(x)$ に対し

$f_Z(z)=f_X\big(g^{-1}(z)\big)\left|\frac{dx}{dz}\right|.$

⚠️ コードが読めない読者向けに言い換えると「変換後の密度＝変換前の密度に、伸び縮みの倍率 $|dx/dz|$ を掛けたもの」。面積（確率）を保つための補正がこの倍率です。

いま $z=\dfrac{x-\mu}{\sigma}$ なので逆変換は $x=\mu+\sigma z$ 、ヤコビアン $\dfrac{dx}{dz}=\sigma$ 。これを正規のPDFに代入します：

f_Z(z)=f_X(\mu+\sigma z)\cdot|\sigma| =\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(\mu+\sigma z-\mu)^2}{2\sigma^2}\right)\cdot\sigma.

指数の中身は $\dfrac{(\sigma z)^2}{2\sigma^2}=\dfrac{z^2}{2}$ 、外の $\dfrac{1}{\sigma}\cdot\sigma=1$ 。よって

$f_Z(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right)=\phi(z).$

要するに： $\sigma$ で割ったぶん（ヤコビアン $\sigma$ ）が、PDFの分母の $\sigma$ をちょうど打ち消す。残ったのは紛れもなく $N(0,1)$ のPDF。だから「正規→標準化→標準正規」が厳密に成り立つ。逆に、 $X$ が正規でなければ (B) のPDFは標準正規にならず、(A) の「平均0・分散1」だけが残ります。

3. 標準正規分布表の読み方

標準正規分布表は「 $Z$ がある値 $z$ より大きく（または小さく）なる確率＝曲線下の面積」を一覧にしたものです。確率は面積なので、まず図を描いて「どの面積を読むのか」を確定させるのが鉄則。

⚠️ 表には2種類の慣習がある。上側確率の表（ $P(Z\ge z)$ を載せる）と下側確率の表（ $P(Z\le z)$ を載せる）。統計検定2級の配布表は上側確率 $P(Z\ge z)$ を載せる形式が標準（要最新確認：年度・配布版で体裁が変わりうるので、本番の表が上側か下側かを最初に確認する）。

対称性（ $\phi(-z)=\phi(z)$ ）を使えば、上側確率の表1枚で全部読めます。 $I(z)=P(Z\ge z)$ とおくと：

求めたい確率	表（上側）からの読み替え	図のイメージ
上側 $P(Z\ge z)$	$I(z)$ そのまま	右の裾
下側 $P(Z\le z)$	$1-I(z)$	左から $z$ まで
左の裾 $P(Z\le -z)$	$I(z)$ （対称性）	左の裾＝右の裾と同面積
区間 $P(a\le Z\le b)$	$I(a)-I(b)$ （ $a<b$ ）	2つの上側確率の差
両側 $P(	Z	\ge z)$

要するに：表は「右の裾の面積」だけ。あとは「全体は1」「左右対称」の2つで、欲しい面積を足し引きするだけです。

覚えておく代表値（2級頻出）

$z$	上側確率 $P(Z\ge z)$	用途
1.645	0.05	上側5%点（片側検定・90%CI の片側）
1.96	0.025	上側2.5%点（95%信頼区間の係数）
2.576	0.005	上側0.5%点（99%信頼区間の係数）
2.33	0.01	上側1%点

これらは区間推定（母平均・母比率・母分散の信頼区間）や仮説検定でそのまま使う「定数」です。 $\pm1.96$ （95%）は最優先で暗記。

4. 具体例：標準化して確率を読む

例：身長 $X\sim N(170,\,6^2)$ 。「身長182cm以上の人の割合」は？

標準化： $z=\dfrac{182-170}{6}=\dfrac{12}{6}=2.0$ 。
求めるのは上側確率 $P(X\ge182)=P(Z\ge2.0)$ 。
表より $P(Z\ge2.0)\approx0.0228$ → 約2.3%。

68-95-99.7則でも検算できます。 $182$ は $\mu+2\sigma$ ちょうど。 $\pm2\sigma$ の内側に約95%なので、外側は約5%、その片側（上側）は約2.5%。表の0.0228とほぼ一致します。

例（パーセント点を逆に求める）：「上位5%に入るのは何cm以上か？」上側5%点は $z=1.645$ 。逆変換 $x=\mu+\sigma z=170+6\times1.645=179.87$ → 約180cm以上。

5. 正規分布の再生性（加法性）

2級では「独立な正規どうしの和も正規」という事実と、平均・分散の足し算ができれば十分。

独立な $X\sim N(\mu_1,\sigma_1^2)$ 、 $Y\sim N(\mu_2,\sigma_2^2)$ に対し、

$X+Y\sim N(\mu_1+\mu_2,\ \sigma_1^2+\sigma_2^2),\qquad X-Y\sim N(\mu_1-\mu_2,\ \sigma_1^2+\sigma_2^2).$

要するに：和でも差でも平均は足し引き、分散は必ず足す（分散は引かない。期待値・分散の性質（線形性・和の分散・共分散）の $V[X-Y]=V[X]+V[Y]$ ）。しかも結果がまた正規になる── この「同じ分布族に閉じる」性質を再生性と呼びます。

MGFによる証明

正規分布のモーメント母関数（確率変数の変換・モーメント母関数・積率）は

$M_X(t)=\exp\!\left(\mu t+\frac{\sigma^2 t^2}{2}\right).$

独立なら和のMGFは積（ $M_{X+Y}(t)=M_X(t)M_Y(t)$ ）なので：

$M_{X+Y}(t)=\exp\!\left(\mu_1 t+\frac{\sigma_1^2 t^2}{2}\right)\exp\!\left(\mu_2 t+\frac{\sigma_2^2 t^2}{2}\right)=\exp\!\left((\mu_1+\mu_2)t+\frac{(\sigma_1^2+\sigma_2^2)t^2}{2}\right).$

これは平均 $\mu_1+\mu_2$ ・分散 $\sigma_1^2+\sigma_2^2$ の正規分布のMGFそのもの。MGFが一致すれば分布も一致するので、和は正規分布。要するに：MGFが「指数の肩で平均と分散を足すだけ」の形だから、独立和も同じ形に閉じる。標準化 $Z=(X-\mu)/\sigma$ も $a=1/\sigma,\ b=-\mu/\sigma$ の線形変換なので、 $M_Z(t)=e^{bt}M_X(at)=e^{t^2/2}$ （= $N(0,1)$ のMGF）として再導出できます。

6. 68-95-99.7則の根拠

この「経験則」は標準正規分布表から直接出る厳密な値です。標準化すれば $\pm k\sigma$ は $\pm k$ に対応するので：

$P(|Z|\le 1)=1-2P(Z\ge1)=1-2(0.1587)=0.6826\approx68\%,$ $P(|Z|\le 2)=1-2(0.0228)=0.9544\approx95\%,$ $P(|Z|\le 3)=1-2(0.00135)=0.9973\approx99.7\%.$

要するに：表の上側確率を2倍して1から引いただけ。「ルール」と呼ばれるが暗記の便宜であって、出どころは分布表の積分値です。なお95%の係数を厳密に取ると $z=1.96$ （ $\pm2\sigma$ の $z=2.0$ は近似）。区間推定で1.96を使うのはこのため。

7. 試験での問われ方（2級）

flowchart TD
    A["正規分布の問題"] --> B{"何を求める?"}
    B -->|確率| C["X を標準化 z＝（X−μ）÷σ"]
    C --> D["図を描き上側か下側か確定"]
    D --> E["分布表で面積を読む"]
    B -->|パーセント点| F["表から z を引く"]
    F --> G["逆変換 x＝μ＋σz"]
    B -->|和差の分布| H["再生性: 平均は足し引き 分散は足す"]
    H --> I["新しい正規を再び標準化"]

2級での典型出題は次の4パターン。

確率計算： $N(\mu,\sigma^2)$ で $P(X\ge a)$ や $P(a\le X\le b)$ を、標準化＋分布表で求める。
パーセント点（逆問題）：「上位○%の境界値」を、表で $z$ を引いてから $x=\mu+\sigma z$ で戻す。
和・差の分布：独立な正規変数の和差の分布を再生性で求め、さらに確率計算へつなぐ（標本平均 $\bar X\sim N(\mu,\sigma^2/n)$ の話の前段。中心極限定理（CLT））。
68-95-99.7則の暗算： $\pm1\sigma,\pm2\sigma$ で大まかな割合を即答させる。

⚠️ 引っかけポイント

標準化 ≠ 正規化（最重要）。「標準化」は平均0・分散1に揃える線形変換（z変換）。機械学習で言う「正規化（normalization）」は最小0・最大1に揃える min-max スケーリングで別物。さらに「正規化」という語は確率を1にする正規化定数を指すこともあり多義的。試験文脈の標準化はz変換を指す。
標準化しても分布の形は変わらない。標準化は平行移動＋拡大縮小の線形変換なので、もとが正規でないものは標準化しても正規にならない。「平均0・分散1になった」と「正規分布になった」は別。 $Z=(X-\mu)/\sigma$ が $N(0,1)$ になるのは $X$ がもともと正規のときだけ（本文2-(B)）。歪んだデータを標準化しても歪んだまま。
確率＝面積。正規分布は連続分布なので $P(X=a)=0$ （1点の面積は0）。 $P(X\le a)$ と $P(X<a)$ は同じ。「以上/より大きい」を区別する離散分布（ベルヌーイ分布・二項分布）との違いに注意。
上側確率と下側確率の取り違え。配布される分布表が上側 $P(Z\ge z)$ か下側 $P(Z\le z)$ かを最初に確認する。「以上」を聞かれて下側を読む（またはその逆）が最頻ミス。必ず図を描いて、塗る面積を目で確認してから表を引く。
$N(\mu,\sigma^2)$ の第2引数は分散。 $N(170,36)$ は $\sigma=6$ 。 $\sigma=36$ と誤読しない。標準化の分母は $\sigma$ （=6）であって $\sigma^2$ （=36）ではない。
負の $z$ は対称性で処理。多くの表は $z\ge0$ しか載せない。 $P(Z\le-1.5)=P(Z\ge1.5)$ のように折り返す。

よくある疑問

Q1. 標準化と正規化、どう違うんですか？ A. 標準化（standardization）は $Z=(X-\mu)/\sigma$ で平均0・分散1に揃える変換。正規化（normalization）は文脈で2つの意味があり、(1) 機械学習では min-max で最小0・最大1に揃える変換、(2) 確率論では密度の面積を1にする正規化定数で割る操作。統計検定で「標準化」と言えば必ず z変換のこと。名前が似ているだけで操作も目的も違うので、混同は致命的です。

Q2. データを標準化すれば正規分布になりますか？ A. なりません。標準化は線形変換（ずらして・割るだけ）なので分布の形は一切変えません。歪んだデータは標準化しても歪んだまま、平均0・分散1になるだけです。「z変換すると正規分布になる」は誤解。正規分布になるのは「もともと正規だったものを標準化したとき」だけ（本文2-(B)の証明）。データを正規に近づけたいなら対数変換やBox-Cox変換など非線形変換が要ります（標準化では無理）。

Q3. なぜわざわざ標準化するんですか？元の分布のまま計算できないのですか？ A. 原理的には元の $N(\mu,\sigma^2)$ で直接積分すれば確率は出ます。が、正規分布のPDFは初等関数で積分できない（不定積分が閉じた式で書けない）ため、数値表（分布表）に頼るしかありません。 $\mu,\sigma$ の組ごとに表を作るのは無限に必要で不可能。そこで全部を $N(0,1)$ に標準化し、ただ1枚の標準正規分布表で済ませる── これが標準化の実利です。

Q4. 「確率」と「確率密度」は同じものですか？ $f(x)$ の値が確率ですか？ A. 違います。連続分布では $f(x)$ は確率密度であって確率そのものではありません。確率は「密度を区間で積分した面積」 $P(a\le X\le b)=\int_a^b f(x)\,dx$ です。1点の確率は $P(X=a)=0$ （幅0の面積）。 $N(0,1)$ の頂点 $f(0)=1/\sqrt{2\pi}\approx0.399$ は密度であり、「0になる確率が0.399」という意味ではありません。「確率＝面積」を徹底してください。

Q5. 標準正規分布表で、表に載っていない負の $z$ （例 $z=-1.96$ ）の確率はどう読むのですか？ A. 左右対称性 $\phi(-z)=\phi(z)$ を使います。多くの表は $z\ge0$ しか載せていませんが、 $P(Z\le-1.96)=P(Z\ge1.96)$ のように、負の側は正の側へ折り返して同じ値を読めます。たとえば $P(-1.96\le Z\le1.96)=1-2\,P(Z\ge1.96)=1-2(0.025)=0.95$ 。これが95%信頼区間の根拠です。図を描いて「どの裾と同じ面積か」を確認すれば間違えません。

まとめ

正規分布 $N(\mu,\sigma^2)$ は平均 $\mu$ ・分散 $\sigma^2$ の左右対称な釣鐘型。PDFは $\dfrac{1}{\sqrt{2\pi}\,\sigma}\exp\!\big(-\frac{(x-\mu)^2}{2\sigma^2}\big)$ 。
標準化 $Z=(X-\mu)/\sigma$ で $N(0,1)$ に揃う。平均0・分散1は線形変換の効果（任意の分布で成立）だが、形まで標準正規になるのは元が正規のときだけ（変数変換でヤコビアン $\sigma$ が分母の $\sigma$ を打ち消す）。
確率は面積。標準正規分布表（上側/下側の慣習に注意）と対称性で、足し引きして読む。 $\pm1.96$ ＝95%、 $1.645$ ＝上側5%点は暗記。
68-95-99.7則は表の積分値そのもの。再生性により独立な正規の和差も正規（平均は足し引き・分散は足す）。
引っかけの筆頭は標準化≠正規化と非正規データは標準化しても正規にならない。次いで上側/下側の取り違えと「確率＝面積」。