← 統計検定テキスト 一覧

📊 対象級:2級 | 重要度:A(頻出)

正規分布(標準正規・標準化)

要点(BLUF)


本文

まず日常のイメージ:身長の分布

ある集団の成人男性の身長が、平均 μ=170\mu=170 cm、標準偏差 σ=6\sigma=6 cm の正規分布にしたがうとします。

身長・測定誤差・テスト得点・製品寸法のばらつき── 「中心の周りにランダムに散らばる量」は、近似的に正規分布にしたがうことが非常に多い。なぜそうなるのかは 中心極限定理(CLT) が答えます(独立な誤差がたくさん足し合わさると正規に近づく)。だから正規分布は統計学の中心にいます。

1. 確率密度関数(PDF)の形を読む

f(x)=12πσexp ⁣((xμ)22σ2)f(x)=\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right)

式を3つの部品に分けて読みます。

部品役割要するに
(xμ)2-(x-\mu)^2中心 μ\mu からの「ずれの2乗」にマイナスμ\mu で最大、離れるほど小さい
exp()\exp(\,\cdot\,)そのずれを指数で減衰裾が指数的に薄くなる(外れ値が出にくい)
12πσ\dfrac{1}{\sqrt{2\pi}\,\sigma}全体の面積を1にするための定数確率分布として成立させる「正規化定数」

⚠️ σ\sigma(標準偏差)と σ2\sigma^2(分散)を取り違えない。PDFの分母は σ\sigma、指数の分母は 2σ22\sigma^2。表記 N(μ,σ2)N(\mu,\sigma^2)第2引数が分散(標準偏差ではない)。N(170,36)N(170,36) なら σ=6\sigma=6

標準正規 N(0,1)N(0,1) のPDFの値(密度)を zz ごとに並べると、左右対称の釣鐘型になります:

zz3-32-21-100112233
密度 φ(z)\varphi(z)0.0040.0540.2420.3990.2420.0540.004

z=0z=0 で最大(約 0.399)、両側へなだらかに減衰します。面積で見ると、中央 ±1σ\pm1\sigma に約 68%±2σ\pm2\sigma に約 95%±3σ\pm3\sigma に約 99.7% が入ります(68-95-99.7則)。

標準正規分布のPDFと68-95-99.7則。釣鐘型で z=0 が密度最大(約0.399)、±1σ≒68.3%・±2σ≒95.4%・±3σ≒99.7%が内側に入る

上の曲線は数値表を滑らかにつないだもの。塗り分けた面積が確率に対応し、内側ほど濃い領域が ±1σ\pm1\sigma(約68%)・±2σ\pm2\sigma(約95%)・±3σ\pm3\sigma(約99.7%)です。図は simulations/seiki_bunpu_keijou.py で生成しています。

2. 標準化:なぜ Z=(Xμ)/σZ=(X-\mu)/\sigmaN(0,1)N(0,1) になるのか

正規分布は μ,σ\mu,\sigma の組み合わせだけ無限種類あります。全部に分布表を用意するのは不可能。そこでただ1つの基準分布に変換します。それが標準正規分布 N(0,1)N(0,1)(平均0・分散1)で、そのPDFは

ϕ(z)=12πexp ⁣(z22).\phi(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right).

変換は Z=XμσZ=\dfrac{X-\mu}{\sigma}。要するに「中心を引いて(平行移動)、σ\sigma で割る(拡大縮小)」だけの線形変換です。この ZZ が本当に N(0,1)N(0,1) になることを、(A) 期待値・分散、(B) 分布の形(PDF)、の2段階で確かめます。

(A) 期待値0・分散1(線形変換の公式から一発)

期待値・分散の性質(線形性・和の分散・共分散)E[aX+b]=aE[X]+bE[aX+b]=aE[X]+bV[aX+b]=a2V[X]V[aX+b]=a^2V[X] を使います。Z=1σXμσZ=\frac1\sigma X-\frac\mu\sigma なので(a=1/σ, b=μ/σa=1/\sigma,\ b=-\mu/\sigma):

E[Z]=1σE[X]μσ=μσμσ=0,E[Z]=\frac{1}{\sigma}E[X]-\frac{\mu}{\sigma}=\frac{\mu}{\sigma}-\frac{\mu}{\sigma}=0, V[Z]=1σ2V[X]=σ2σ2=1.V[Z]=\frac{1}{\sigma^2}V[X]=\frac{\sigma^2}{\sigma^2}=1.

要するに:平均を引けば中心が0に、σ\sigma で割れば分散が1に揃う。ここまでは XX が正規でなくても(平均 μ\mu・分散 σ2\sigma^2 を持つ任意の分布で)成り立つ。「平均0・分散1」は標準化の効果であって、正規性とは無関係── これが後述の「標準化≠正規化」の核心です。

(B) 形まで N(0,1)N(0,1) になる(変数変換でPDFを計算)

(A) は数値(平均・分散)の話。「形まで標準正規になる」のは XXもともと正規だからです。連続確率変数の変数変換の公式(確率変数の変換・モーメント母関数・積率)を使います。単調変換 z=g(x)z=g(x) に対し

fZ(z)=fX(g1(z))dxdz.f_Z(z)=f_X\big(g^{-1}(z)\big)\left|\frac{dx}{dz}\right|.

⚠️ コードが読めない読者向けに言い換えると「変換後の密度=変換前の密度に、伸び縮みの倍率 dx/dz|dx/dz| を掛けたもの」。面積(確率)を保つための補正がこの倍率です。

いま z=xμσz=\dfrac{x-\mu}{\sigma} なので逆変換は x=μ+σzx=\mu+\sigma z、ヤコビアン dxdz=σ\dfrac{dx}{dz}=\sigma。これを正規のPDFに代入します:

fZ(z)=fX(μ+σz)σ=12πσexp ⁣((μ+σzμ)22σ2)σ.f_Z(z)=f_X(\mu+\sigma z)\cdot|\sigma| =\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(\mu+\sigma z-\mu)^2}{2\sigma^2}\right)\cdot\sigma.

指数の中身は (σz)22σ2=z22\dfrac{(\sigma z)^2}{2\sigma^2}=\dfrac{z^2}{2}、外の 1σσ=1\dfrac{1}{\sigma}\cdot\sigma=1。よって

fZ(z)=12πexp ⁣(z22)=ϕ(z).f_Z(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right)=\phi(z).

要するにσ\sigma で割ったぶん(ヤコビアン σ\sigma)が、PDFの分母の σ\sigma をちょうど打ち消す。残ったのは紛れもなく N(0,1)N(0,1) のPDF。だから「正規→標準化→標準正規」が厳密に成り立つ。逆に、XX が正規でなければ (B) のPDFは標準正規にならず、(A) の「平均0・分散1」だけが残ります。

3. 標準正規分布表の読み方

標準正規分布表は「ZZ がある値 zz より大きく(または小さく)なる確率=曲線下の面積」を一覧にしたものです。確率は面積なので、まず図を描いて「どの面積を読むのか」を確定させるのが鉄則。

⚠️ 表には2種類の慣習がある。上側確率の表P(Zz)P(Z\ge z) を載せる)と下側確率の表P(Zz)P(Z\le z) を載せる)。統計検定2級の配布表は上側確率 P(Zz)P(Z\ge z) を載せる形式が標準(要最新確認:年度・配布版で体裁が変わりうるので、本番の表が上側か下側かを最初に確認する)。

対称性(ϕ(z)=ϕ(z)\phi(-z)=\phi(z))を使えば、上側確率の表1枚で全部読めます。I(z)=P(Zz)I(z)=P(Z\ge z) とおくと:

求めたい確率表(上側)からの読み替え図のイメージ
上側 P(Zz)P(Z\ge z)I(z)I(z) そのまま右の裾
下側 P(Zz)P(Z\le z)1I(z)1-I(z)左から zz まで
左の裾 P(Zz)P(Z\le -z)I(z)I(z)(対称性)左の裾=右の裾と同面積
区間 P(aZb)P(a\le Z\le b)I(a)I(b)I(a)-I(b)a<ba<b2つの上側確率の差
両側 $P(Z\ge z)$

要するに:表は「右の裾の面積」だけ。あとは「全体は1」「左右対称」の2つで、欲しい面積を足し引きするだけです。

覚えておく代表値(2級頻出)

zz上側確率 P(Zz)P(Z\ge z)用途
1.6450.05上側5%点(片側検定・90%CI の片側)
1.960.025上側2.5%点(95%信頼区間の係数)
2.5760.005上側0.5%点(99%信頼区間の係数)
2.330.01上側1%点

これらは 区間推定(母平均・母比率・母分散の信頼区間) や仮説検定でそのまま使う「定数」です。±1.96\pm1.96(95%)は最優先で暗記

4. 具体例:標準化して確率を読む

:身長 XN(170,62)X\sim N(170,\,6^2)。「身長182cm以上の人の割合」は?

  1. 標準化:z=1821706=126=2.0z=\dfrac{182-170}{6}=\dfrac{12}{6}=2.0
  2. 求めるのは上側確率 P(X182)=P(Z2.0)P(X\ge182)=P(Z\ge2.0)
  3. 表より P(Z2.0)0.0228P(Z\ge2.0)\approx0.0228約2.3%

68-95-99.7則でも検算できます。182182μ+2σ\mu+2\sigma ちょうど。±2σ\pm2\sigma の内側に約95%なので、外側は約5%、その片側(上側)は約2.5%。表の0.0228とほぼ一致します。

例(パーセント点を逆に求める):「上位5%に入るのは何cm以上か?」 上側5%点は z=1.645z=1.645。逆変換 x=μ+σz=170+6×1.645=179.87x=\mu+\sigma z=170+6\times1.645=179.87約180cm以上

5. 正規分布の再生性(加法性)

2級では「独立な正規どうしの和も正規」という事実と、平均・分散の足し算ができれば十分。

独立な XN(μ1,σ12)X\sim N(\mu_1,\sigma_1^2)YN(μ2,σ22)Y\sim N(\mu_2,\sigma_2^2) に対し、

X+YN(μ1+μ2, σ12+σ22),XYN(μ1μ2, σ12+σ22).X+Y\sim N(\mu_1+\mu_2,\ \sigma_1^2+\sigma_2^2),\qquad X-Y\sim N(\mu_1-\mu_2,\ \sigma_1^2+\sigma_2^2).

要するに:和でも差でも平均は足し引き、分散は必ず足す(分散は引かない。期待値・分散の性質(線形性・和の分散・共分散)V[XY]=V[X]+V[Y]V[X-Y]=V[X]+V[Y])。しかも結果がまた正規になる── この「同じ分布族に閉じる」性質を再生性と呼びます。

MGFによる証明

正規分布のモーメント母関数(確率変数の変換・モーメント母関数・積率)は

MX(t)=exp ⁣(μt+σ2t22).M_X(t)=\exp\!\left(\mu t+\frac{\sigma^2 t^2}{2}\right).

独立なら和のMGFは積(MX+Y(t)=MX(t)MY(t)M_{X+Y}(t)=M_X(t)M_Y(t))なので:

MX+Y(t)=exp ⁣(μ1t+σ12t22)exp ⁣(μ2t+σ22t22)=exp ⁣((μ1+μ2)t+(σ12+σ22)t22).M_{X+Y}(t)=\exp\!\left(\mu_1 t+\frac{\sigma_1^2 t^2}{2}\right)\exp\!\left(\mu_2 t+\frac{\sigma_2^2 t^2}{2}\right)=\exp\!\left((\mu_1+\mu_2)t+\frac{(\sigma_1^2+\sigma_2^2)t^2}{2}\right).

これは平均 μ1+μ2\mu_1+\mu_2・分散 σ12+σ22\sigma_1^2+\sigma_2^2 の正規分布のMGFそのもの。MGFが一致すれば分布も一致するので、和は正規分布。要するに:MGFが「指数の肩で平均と分散を足すだけ」の形だから、独立和も同じ形に閉じる。標準化 Z=(Xμ)/σZ=(X-\mu)/\sigmaa=1/σ, b=μ/σa=1/\sigma,\ b=-\mu/\sigma の線形変換なので、MZ(t)=ebtMX(at)=et2/2M_Z(t)=e^{bt}M_X(at)=e^{t^2/2}(=N(0,1)N(0,1) のMGF)として再導出できます。

6. 68-95-99.7則の根拠

この「経験則」は標準正規分布表から直接出る厳密な値です。標準化すれば ±kσ\pm k\sigma±k\pm k に対応するので:

P(Z1)=12P(Z1)=12(0.1587)=0.682668%,P(|Z|\le 1)=1-2P(Z\ge1)=1-2(0.1587)=0.6826\approx68\%, P(Z2)=12(0.0228)=0.954495%,P(|Z|\le 2)=1-2(0.0228)=0.9544\approx95\%, P(Z3)=12(0.00135)=0.997399.7%.P(|Z|\le 3)=1-2(0.00135)=0.9973\approx99.7\%.

要するに:表の上側確率を2倍して1から引いただけ。「ルール」と呼ばれるが暗記の便宜であって、出どころは分布表の積分値です。なお95%の係数を厳密に取ると z=1.96z=1.96±2σ\pm2\sigmaz=2.0z=2.0 は近似)。区間推定で1.96を使うのはこのため。

7. 試験での問われ方(2級)

flowchart TD
    A["正規分布の問題"] --> B{"何を求める?"}
    B -->|確率| C["X を標準化 z=(X−μ)÷σ"]
    C --> D["図を描き上側か下側か確定"]
    D --> E["分布表で面積を読む"]
    B -->|パーセント点| F["表から z を引く"]
    F --> G["逆変換 x=μ+σz"]
    B -->|和差の分布| H["再生性: 平均は足し引き 分散は足す"]
    H --> I["新しい正規を再び標準化"]

2級での典型出題は次の4パターン。

  1. 確率計算N(μ,σ2)N(\mu,\sigma^2)P(Xa)P(X\ge a)P(aXb)P(a\le X\le b) を、標準化+分布表で求める。
  2. パーセント点(逆問題):「上位○%の境界値」を、表で zz を引いてから x=μ+σzx=\mu+\sigma z で戻す。
  3. 和・差の分布:独立な正規変数の和差の分布を再生性で求め、さらに確率計算へつなぐ(標本平均 XˉN(μ,σ2/n)\bar X\sim N(\mu,\sigma^2/n) の話の前段。中心極限定理(CLT))。
  4. 68-95-99.7則の暗算±1σ,±2σ\pm1\sigma,\pm2\sigma で大まかな割合を即答させる。

⚠️ 引っかけポイント


よくある疑問

Q1. 標準化と正規化、どう違うんですか? A. 標準化(standardization)は Z=(Xμ)/σZ=(X-\mu)/\sigma平均0・分散1に揃える変換。正規化(normalization)は文脈で2つの意味があり、(1) 機械学習では min-max で最小0・最大1に揃える変換、(2) 確率論では密度の面積を1にする正規化定数で割る操作。統計検定で「標準化」と言えば必ず z変換のこと。名前が似ているだけで操作も目的も違うので、混同は致命的です。

Q2. データを標準化すれば正規分布になりますか? A. なりません。標準化は線形変換(ずらして・割るだけ)なので分布の形は一切変えません。歪んだデータは標準化しても歪んだまま、平均0・分散1になるだけです。「z変換すると正規分布になる」は誤解。正規分布になるのは「もともと正規だったものを標準化したとき」だけ(本文2-(B)の証明)。データを正規に近づけたいなら対数変換やBox-Cox変換など非線形変換が要ります(標準化では無理)。

Q3. なぜわざわざ標準化するんですか?元の分布のまま計算できないのですか? A. 原理的には元の N(μ,σ2)N(\mu,\sigma^2) で直接積分すれば確率は出ます。が、正規分布のPDFは初等関数で積分できない(不定積分が閉じた式で書けない)ため、数値表(分布表)に頼るしかありません。μ,σ\mu,\sigma の組ごとに表を作るのは無限に必要で不可能。そこで全部を N(0,1)N(0,1) に標準化し、ただ1枚の標準正規分布表で済ませる── これが標準化の実利です。

Q4. 「確率」と「確率密度」は同じものですか?f(x)f(x) の値が確率ですか? A. 違います。連続分布では f(x)f(x)確率密度であって確率そのものではありません。確率は「密度を区間で積分した面積」P(aXb)=abf(x)dxP(a\le X\le b)=\int_a^b f(x)\,dx です。1点の確率は P(X=a)=0P(X=a)=0(幅0の面積)。N(0,1)N(0,1) の頂点 f(0)=1/2π0.399f(0)=1/\sqrt{2\pi}\approx0.399 は密度であり、「0になる確率が0.399」という意味ではありません。「確率=面積」を徹底してください。

Q5. 標準正規分布表で、表に載っていない負の zz(例 z=1.96z=-1.96)の確率はどう読むのですか? A. 左右対称性 ϕ(z)=ϕ(z)\phi(-z)=\phi(z) を使います。多くの表は z0z\ge0 しか載せていませんが、P(Z1.96)=P(Z1.96)P(Z\le-1.96)=P(Z\ge1.96) のように、負の側は正の側へ折り返して同じ値を読めます。たとえば P(1.96Z1.96)=12P(Z1.96)=12(0.025)=0.95P(-1.96\le Z\le1.96)=1-2\,P(Z\ge1.96)=1-2(0.025)=0.95。これが95%信頼区間の根拠です。図を描いて「どの裾と同じ面積か」を確認すれば間違えません。


まとめ


関連ノート