← 統計検定テキスト 一覧
📊 対象級:2級 | 重要度:A(頻出)
正規分布(標準正規・標準化)
要点(BLUF)
正規分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) :平均 μ \mu μ (山の中心)・分散 σ 2 \sigma^2 σ 2 (広がり)を持つ、左右対称・釣鐘型の連続分布。確率密度関数(PDF)は
f ( x ) = 1 2 π σ exp ( − ( x − μ ) 2 2 σ 2 ) ( − ∞ < x < ∞ ) . \boxed{\,f(x)=\dfrac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\dfrac{(x-\mu)^2}{2\sigma^2}\right)\,}\quad(-\infty<x<\infty). f ( x ) = 2 π σ 1 exp ( − 2 σ 2 ( x − μ ) 2 ) ( − ∞ < x < ∞ ) .
要するに「中心 μ \mu μ から離れるほど指数関数的に確率が薄くなる山」。E [ X ] = μ E[X]=\mu E [ X ] = μ 、V [ X ] = σ 2 V[X]=\sigma^2 V [ X ] = σ 2 。
標準化(z変換) :どんな N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) も、次の線形変換で平均0・分散1の標準正規分布 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) に揃う。
Z = X − μ σ ∼ N ( 0 , 1 ) \boxed{\,Z=\dfrac{X-\mu}{\sigma}\sim N(0,1)\,} Z = σ X − μ ∼ N ( 0 , 1 )
要するに「中心を0にずらし、ものさしを σ \sigma σ で割って単位を揃える」。これでただ1枚の標準正規分布表 であらゆる正規分布の確率が読める。
68-95-99.7則 :± 1 σ \pm1\sigma ± 1 σ に約68%、± 2 σ \pm2\sigma ± 2 σ に約95%、± 3 σ \pm3\sigma ± 3 σ に約99.7%。2級で最頻出の暗算ルール。
本文
まず日常のイメージ:身長の分布
ある集団の成人男性の身長が、平均 μ = 170 \mu=170 μ = 170 cm、標準偏差 σ = 6 \sigma=6 σ = 6 cm の正規分布にしたがうとします。
多くの人は170cm付近に集まり、中心から離れるほど人数が減る → 釣鐘型 。
170cmを中心に左右対称(160cmの人と180cmの人はだいたい同じくらいいる)→ 左右対称 。
「182cmより高い人は何%いるか?」のような問いに、標準化と分布表で数値で答えられる 。
身長・測定誤差・テスト得点・製品寸法のばらつき── 「中心の周りにランダムに散らばる量」は、近似的に正規分布にしたがうことが非常に多い。なぜそうなるのかは 中心極限定理(CLT) が答えます(独立な誤差がたくさん足し合わさると正規に近づく)。だから正規分布は統計学の中心にいます。
1. 確率密度関数(PDF)の形を読む
f ( x ) = 1 2 π σ exp ( − ( x − μ ) 2 2 σ 2 ) f(x)=\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(x-\mu)^2}{2\sigma^2}\right) f ( x ) = 2 π σ 1 exp ( − 2 σ 2 ( x − μ ) 2 )
式を3つの部品に分けて読みます。
部品 役割 要するに − ( x − μ ) 2 -(x-\mu)^2 − ( x − μ ) 2 中心 μ \mu μ からの「ずれの2乗」にマイナス μ \mu μ で最大、離れるほど小さいexp ( ⋅ ) \exp(\,\cdot\,) exp ( ⋅ ) そのずれを指数で減衰 裾が指数的に 薄くなる(外れ値が出にくい) 1 2 π σ \dfrac{1}{\sqrt{2\pi}\,\sigma} 2 π σ 1 全体の面積を1にするための定数 確率分布として成立させる「正規化定数」
x = μ x=\mu x = μ で指数の中身が0になり f f f は最大 → 山の頂点は μ \mu μ 。
( x − μ ) (x-\mu) ( x − μ ) を − ( x − μ ) -(x-\mu) − ( x − μ ) に変えても式は不変 → μ \mu μ を軸に左右対称 。よって平均=中央値=最頻値が一致。
σ \sigma σ が大きいほど指数の減衰がゆるく、山は低く広く なる。σ \sigma σ が小さいと高く狭く なる(全面積1は保たれる)。
⚠️ σ \sigma σ (標準偏差)と σ 2 \sigma^2 σ 2 (分散)を取り違えない。PDFの分母は σ \sigma σ 、指数の分母は 2 σ 2 2\sigma^2 2 σ 2 。表記 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) は第2引数が分散 (標準偏差ではない)。N ( 170 , 36 ) N(170,36) N ( 170 , 36 ) なら σ = 6 \sigma=6 σ = 6 。
標準正規 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) のPDFの値(密度)を z z z ごとに並べると、左右対称の釣鐘型になります:
z z z − 3 -3 − 3 − 2 -2 − 2 − 1 -1 − 1 0 0 0 1 1 1 2 2 2 3 3 3 密度 φ ( z ) \varphi(z) φ ( z ) 0.004 0.054 0.242 0.399 0.242 0.054 0.004
z = 0 z=0 z = 0 で最大(約 0.399)、両側へなだらかに減衰します。面積で見ると、中央 ± 1 σ \pm1\sigma ± 1 σ に約 68% 、± 2 σ \pm2\sigma ± 2 σ に約 95% 、± 3 σ \pm3\sigma ± 3 σ に約 99.7% が入ります(68-95-99.7則)。
上の曲線は数値表を滑らかにつないだもの。塗り分けた面積が確率に対応し、内側ほど濃い領域が ± 1 σ \pm1\sigma ± 1 σ (約68%)・± 2 σ \pm2\sigma ± 2 σ (約95%)・± 3 σ \pm3\sigma ± 3 σ (約99.7%)です。図は simulations/seiki_bunpu_keijou.py で生成しています。
2. 標準化:なぜ Z = ( X − μ ) / σ Z=(X-\mu)/\sigma Z = ( X − μ ) / σ で N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) になるのか
正規分布は μ , σ \mu,\sigma μ , σ の組み合わせだけ無限種類あります。全部に分布表を用意するのは不可能。そこでただ1つの基準分布 に変換します。それが標準正規分布 N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) (平均0・分散1)で、そのPDFは
ϕ ( z ) = 1 2 π exp ( − z 2 2 ) . \phi(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right). ϕ ( z ) = 2 π 1 exp ( − 2 z 2 ) .
変換は Z = X − μ σ Z=\dfrac{X-\mu}{\sigma} Z = σ X − μ 。要するに「中心を引いて(平行移動)、σ \sigma σ で割る(拡大縮小) 」だけの線形変換です。この Z Z Z が本当に N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) になることを、(A) 期待値・分散、(B) 分布の形(PDF)、の2段階で確かめます。
(A) 期待値0・分散1(線形変換の公式から一発)
期待値・分散の性質(線形性・和の分散・共分散) の E [ a X + b ] = a E [ X ] + b E[aX+b]=aE[X]+b E [ a X + b ] = a E [ X ] + b 、V [ a X + b ] = a 2 V [ X ] V[aX+b]=a^2V[X] V [ a X + b ] = a 2 V [ X ] を使います。Z = 1 σ X − μ σ Z=\frac1\sigma X-\frac\mu\sigma Z = σ 1 X − σ μ なので(a = 1 / σ , b = − μ / σ a=1/\sigma,\ b=-\mu/\sigma a = 1/ σ , b = − μ / σ ):
E [ Z ] = 1 σ E [ X ] − μ σ = μ σ − μ σ = 0 , E[Z]=\frac{1}{\sigma}E[X]-\frac{\mu}{\sigma}=\frac{\mu}{\sigma}-\frac{\mu}{\sigma}=0, E [ Z ] = σ 1 E [ X ] − σ μ = σ μ − σ μ = 0 ,
V [ Z ] = 1 σ 2 V [ X ] = σ 2 σ 2 = 1. V[Z]=\frac{1}{\sigma^2}V[X]=\frac{\sigma^2}{\sigma^2}=1. V [ Z ] = σ 2 1 V [ X ] = σ 2 σ 2 = 1.
要するに :平均を引けば中心が0に、σ \sigma σ で割れば分散が1に揃う。ここまでは X X X が正規でなくても(平均 μ \mu μ ・分散 σ 2 \sigma^2 σ 2 を持つ任意の分布で)成り立つ。「平均0・分散1」は標準化の効果であって、正規性とは無関係 ── これが後述の「標準化≠正規化」の核心です。
(B) 形まで N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) になる(変数変換でPDFを計算)
(A) は数値(平均・分散)の話。「形まで標準正規になる」のは X X X がもともと正規だから です。連続確率変数の変数変換の公式(確率変数の変換・モーメント母関数・積率 )を使います。単調変換 z = g ( x ) z=g(x) z = g ( x ) に対し
f Z ( z ) = f X ( g − 1 ( z ) ) ∣ d x d z ∣ . f_Z(z)=f_X\big(g^{-1}(z)\big)\left|\frac{dx}{dz}\right|. f Z ( z ) = f X ( g − 1 ( z ) ) d z d x .
⚠️ コードが読めない読者向けに言い換えると「変換後の密度=変換前の密度に、伸び縮みの倍率 ∣ d x / d z ∣ |dx/dz| ∣ d x / d z ∣ を掛けたもの」。面積(確率)を保つための補正がこの倍率です。
いま z = x − μ σ z=\dfrac{x-\mu}{\sigma} z = σ x − μ なので逆変換は x = μ + σ z x=\mu+\sigma z x = μ + σ z 、ヤコビアン d x d z = σ \dfrac{dx}{dz}=\sigma d z d x = σ 。これを正規のPDFに代入します:
f Z ( z ) = f X ( μ + σ z ) ⋅ ∣ σ ∣ = 1 2 π σ exp ( − ( μ + σ z − μ ) 2 2 σ 2 ) ⋅ σ . f_Z(z)=f_X(\mu+\sigma z)\cdot|\sigma|
=\frac{1}{\sqrt{2\pi}\,\sigma}\exp\!\left(-\frac{(\mu+\sigma z-\mu)^2}{2\sigma^2}\right)\cdot\sigma. f Z ( z ) = f X ( μ + σ z ) ⋅ ∣ σ ∣ = 2 π σ 1 exp ( − 2 σ 2 ( μ + σ z − μ ) 2 ) ⋅ σ .
指数の中身は ( σ z ) 2 2 σ 2 = z 2 2 \dfrac{(\sigma z)^2}{2\sigma^2}=\dfrac{z^2}{2} 2 σ 2 ( σ z ) 2 = 2 z 2 、外の 1 σ ⋅ σ = 1 \dfrac{1}{\sigma}\cdot\sigma=1 σ 1 ⋅ σ = 1 。よって
f Z ( z ) = 1 2 π exp ( − z 2 2 ) = ϕ ( z ) . f_Z(z)=\frac{1}{\sqrt{2\pi}}\exp\!\left(-\frac{z^2}{2}\right)=\phi(z). f Z ( z ) = 2 π 1 exp ( − 2 z 2 ) = ϕ ( z ) .
要するに :σ \sigma σ で割ったぶん(ヤコビアン σ \sigma σ )が、PDFの分母の σ \sigma σ をちょうど打ち消す。残ったのは紛れもなく N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) のPDF。だから「正規→標準化→標準正規」が厳密に成り立つ 。逆に、X X X が正規でなければ (B) のPDFは標準正規にならず、(A) の「平均0・分散1」だけが残ります。
3. 標準正規分布表の読み方
標準正規分布表は「Z Z Z がある値 z z z より大きく(または小さく)なる確率=曲線下の面積」を一覧にしたものです。確率は面積 なので、まず図を描いて「どの面積を読むのか」を確定させるのが鉄則。
⚠️ 表には2種類の慣習がある。上側確率の表 (P ( Z ≥ z ) P(Z\ge z) P ( Z ≥ z ) を載せる)と下側確率の表 (P ( Z ≤ z ) P(Z\le z) P ( Z ≤ z ) を載せる)。統計検定2級の配布表は上側確率 P ( Z ≥ z ) P(Z\ge z) P ( Z ≥ z ) を載せる形式が標準(要最新確認:年度・配布版で体裁が変わりうるので、本番の表が上側か下側かを最初に確認する)。
対称性(ϕ ( − z ) = ϕ ( z ) \phi(-z)=\phi(z) ϕ ( − z ) = ϕ ( z ) )を使えば、上側確率の表1枚で全部読めます。I ( z ) = P ( Z ≥ z ) I(z)=P(Z\ge z) I ( z ) = P ( Z ≥ z ) とおくと:
求めたい確率 表(上側)からの読み替え 図のイメージ 上側 P ( Z ≥ z ) P(Z\ge z) P ( Z ≥ z ) I ( z ) I(z) I ( z ) そのまま右の裾 下側 P ( Z ≤ z ) P(Z\le z) P ( Z ≤ z ) 1 − I ( z ) 1-I(z) 1 − I ( z ) 左から z z z まで 左の裾 P ( Z ≤ − z ) P(Z\le -z) P ( Z ≤ − z ) I ( z ) I(z) I ( z ) (対称性)左の裾=右の裾と同面積 区間 P ( a ≤ Z ≤ b ) P(a\le Z\le b) P ( a ≤ Z ≤ b ) I ( a ) − I ( b ) I(a)-I(b) I ( a ) − I ( b ) (a < b a<b a < b )2つの上側確率の差 両側 $P( Z \ge z)$
要するに :表は「右の裾の面積」だけ。あとは「全体は1」「左右対称」の2つで、欲しい面積を足し引きするだけです。
覚えておく代表値(2級頻出)
z z z 上側確率 P ( Z ≥ z ) P(Z\ge z) P ( Z ≥ z ) 用途 1.645 0.05 上側5%点(片側検定・90%CI の片側) 1.96 0.025 上側2.5%点(95%信頼区間 の係数) 2.576 0.005 上側0.5%点(99%信頼区間の係数) 2.33 0.01 上側1%点
これらは 区間推定(母平均・母比率・母分散の信頼区間) や仮説検定でそのまま使う「定数」です。± 1.96 \pm1.96 ± 1.96 (95%)は最優先で暗記 。
4. 具体例:標準化して確率を読む
例 :身長 X ∼ N ( 170 , 6 2 ) X\sim N(170,\,6^2) X ∼ N ( 170 , 6 2 ) 。「身長182cm以上の人の割合」は?
標準化:z = 182 − 170 6 = 12 6 = 2.0 z=\dfrac{182-170}{6}=\dfrac{12}{6}=2.0 z = 6 182 − 170 = 6 12 = 2.0 。
求めるのは上側確率 P ( X ≥ 182 ) = P ( Z ≥ 2.0 ) P(X\ge182)=P(Z\ge2.0) P ( X ≥ 182 ) = P ( Z ≥ 2.0 ) 。
表より P ( Z ≥ 2.0 ) ≈ 0.0228 P(Z\ge2.0)\approx0.0228 P ( Z ≥ 2.0 ) ≈ 0.0228 → 約2.3% 。
68-95-99.7則でも検算できます。182 182 182 は μ + 2 σ \mu+2\sigma μ + 2 σ ちょうど。± 2 σ \pm2\sigma ± 2 σ の内側に約95%なので、外側は約5%、その片側(上側)は約2.5%。表の0.0228とほぼ一致します。
例(パーセント点を逆に求める) :「上位5%に入るのは何cm以上か?」
上側5%点は z = 1.645 z=1.645 z = 1.645 。逆変換 x = μ + σ z = 170 + 6 × 1.645 = 179.87 x=\mu+\sigma z=170+6\times1.645=179.87 x = μ + σ z = 170 + 6 × 1.645 = 179.87 → 約180cm以上 。
5. 正規分布の再生性(加法性)
2級では「独立な正規どうしの和も正規」という事実と、平均・分散の足し算ができれば十分。
独立な X ∼ N ( μ 1 , σ 1 2 ) X\sim N(\mu_1,\sigma_1^2) X ∼ N ( μ 1 , σ 1 2 ) 、Y ∼ N ( μ 2 , σ 2 2 ) Y\sim N(\mu_2,\sigma_2^2) Y ∼ N ( μ 2 , σ 2 2 ) に対し、
X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) , X − Y ∼ N ( μ 1 − μ 2 , σ 1 2 + σ 2 2 ) . X+Y\sim N(\mu_1+\mu_2,\ \sigma_1^2+\sigma_2^2),\qquad X-Y\sim N(\mu_1-\mu_2,\ \sigma_1^2+\sigma_2^2). X + Y ∼ N ( μ 1 + μ 2 , σ 1 2 + σ 2 2 ) , X − Y ∼ N ( μ 1 − μ 2 , σ 1 2 + σ 2 2 ) .
要するに :和でも差でも平均は足し引き、分散は必ず足す (分散は引かない。期待値・分散の性質(線形性・和の分散・共分散) の V [ X − Y ] = V [ X ] + V [ Y ] V[X-Y]=V[X]+V[Y] V [ X − Y ] = V [ X ] + V [ Y ] )。しかも結果がまた正規になる── この「同じ分布族に閉じる」性質を再生性 と呼びます。
MGFによる証明
正規分布のモーメント母関数(確率変数の変換・モーメント母関数・積率 )は
M X ( t ) = exp ( μ t + σ 2 t 2 2 ) . M_X(t)=\exp\!\left(\mu t+\frac{\sigma^2 t^2}{2}\right). M X ( t ) = exp ( μ t + 2 σ 2 t 2 ) .
独立なら和のMGFは積(M X + Y ( t ) = M X ( t ) M Y ( t ) M_{X+Y}(t)=M_X(t)M_Y(t) M X + Y ( t ) = M X ( t ) M Y ( t ) )なので:
M X + Y ( t ) = exp ( μ 1 t + σ 1 2 t 2 2 ) exp ( μ 2 t + σ 2 2 t 2 2 ) = exp ( ( μ 1 + μ 2 ) t + ( σ 1 2 + σ 2 2 ) t 2 2 ) . M_{X+Y}(t)=\exp\!\left(\mu_1 t+\frac{\sigma_1^2 t^2}{2}\right)\exp\!\left(\mu_2 t+\frac{\sigma_2^2 t^2}{2}\right)=\exp\!\left((\mu_1+\mu_2)t+\frac{(\sigma_1^2+\sigma_2^2)t^2}{2}\right). M X + Y ( t ) = exp ( μ 1 t + 2 σ 1 2 t 2 ) exp ( μ 2 t + 2 σ 2 2 t 2 ) = exp ( ( μ 1 + μ 2 ) t + 2 ( σ 1 2 + σ 2 2 ) t 2 ) .
これは平均 μ 1 + μ 2 \mu_1+\mu_2 μ 1 + μ 2 ・分散 σ 1 2 + σ 2 2 \sigma_1^2+\sigma_2^2 σ 1 2 + σ 2 2 の正規分布のMGFそのもの。MGFが一致すれば分布も一致するので、和は正規分布。要するに :MGFが「指数の肩で平均と分散を足すだけ」の形だから、独立和も同じ形に閉じる。標準化 Z = ( X − μ ) / σ Z=(X-\mu)/\sigma Z = ( X − μ ) / σ も a = 1 / σ , b = − μ / σ a=1/\sigma,\ b=-\mu/\sigma a = 1/ σ , b = − μ / σ の線形変換なので、M Z ( t ) = e b t M X ( a t ) = e t 2 / 2 M_Z(t)=e^{bt}M_X(at)=e^{t^2/2} M Z ( t ) = e b t M X ( a t ) = e t 2 /2 (=N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) のMGF)として再導出できます。
6. 68-95-99.7則の根拠
この「経験則」は標準正規分布表から直接出る厳密な値です。標準化すれば ± k σ \pm k\sigma ± k σ は ± k \pm k ± k に対応するので:
P ( ∣ Z ∣ ≤ 1 ) = 1 − 2 P ( Z ≥ 1 ) = 1 − 2 ( 0.1587 ) = 0.6826 ≈ 68 % , P(|Z|\le 1)=1-2P(Z\ge1)=1-2(0.1587)=0.6826\approx68\%, P ( ∣ Z ∣ ≤ 1 ) = 1 − 2 P ( Z ≥ 1 ) = 1 − 2 ( 0.1587 ) = 0.6826 ≈ 68% ,
P ( ∣ Z ∣ ≤ 2 ) = 1 − 2 ( 0.0228 ) = 0.9544 ≈ 95 % , P(|Z|\le 2)=1-2(0.0228)=0.9544\approx95\%, P ( ∣ Z ∣ ≤ 2 ) = 1 − 2 ( 0.0228 ) = 0.9544 ≈ 95% ,
P ( ∣ Z ∣ ≤ 3 ) = 1 − 2 ( 0.00135 ) = 0.9973 ≈ 99.7 % . P(|Z|\le 3)=1-2(0.00135)=0.9973\approx99.7\%. P ( ∣ Z ∣ ≤ 3 ) = 1 − 2 ( 0.00135 ) = 0.9973 ≈ 99.7%.
要するに :表の上側確率を2倍して1から引いただけ。「ルール」と呼ばれるが暗記の便宜であって、出どころは分布表の積分値です。なお95%の係数を厳密に取ると z = 1.96 z=1.96 z = 1.96 (± 2 σ \pm2\sigma ± 2 σ の z = 2.0 z=2.0 z = 2.0 は近似)。区間推定で1.96を使うのはこのため。
7. 試験での問われ方(2級)
flowchart TD
A["正規分布の問題"] --> B{"何を求める?"}
B -->|確率| C["X を標準化 z=(X−μ)÷σ"]
C --> D["図を描き上側か下側か確定"]
D --> E["分布表で面積を読む"]
B -->|パーセント点| F["表から z を引く"]
F --> G["逆変換 x=μ+σz"]
B -->|和差の分布| H["再生性: 平均は足し引き 分散は足す"]
H --> I["新しい正規を再び標準化"]
2級での典型出題は次の4パターン。
確率計算 :N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) で P ( X ≥ a ) P(X\ge a) P ( X ≥ a ) や P ( a ≤ X ≤ b ) P(a\le X\le b) P ( a ≤ X ≤ b ) を、標準化+分布表で求める。
パーセント点(逆問題) :「上位○%の境界値」を、表で z z z を引いてから x = μ + σ z x=\mu+\sigma z x = μ + σ z で戻す。
和・差の分布 :独立な正規変数の和差の分布を再生性で求め、さらに確率計算へつなぐ(標本平均 X ˉ ∼ N ( μ , σ 2 / n ) \bar X\sim N(\mu,\sigma^2/n) X ˉ ∼ N ( μ , σ 2 / n ) の話の前段。中心極限定理(CLT) )。
68-95-99.7則の暗算 :± 1 σ , ± 2 σ \pm1\sigma,\pm2\sigma ± 1 σ , ± 2 σ で大まかな割合を即答させる。
⚠️ 引っかけポイント
標準化 ≠ 正規化(最重要) 。「標準化」は平均0・分散1に揃える線形変換(z変換)。機械学習で言う「正規化(normalization)」は最小0・最大1に揃える min-max スケーリングで別物 。さらに「正規化」という語は確率を1にする正規化定数を指すこともあり多義的。試験文脈の標準化はz変換 を指す。
標準化しても分布の形は変わらない 。標準化は平行移動+拡大縮小の線形変換なので、もとが正規でないものは標準化しても正規にならない 。「平均0・分散1になった」と「正規分布になった」は別。Z = ( X − μ ) / σ Z=(X-\mu)/\sigma Z = ( X − μ ) / σ が N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) になるのは X X X がもともと正規のときだけ(本文2-(B))。歪んだデータを標準化しても歪んだまま。
確率=面積 。正規分布は連続分布なので P ( X = a ) = 0 P(X=a)=0 P ( X = a ) = 0 (1点の面積は0)。P ( X ≤ a ) P(X\le a) P ( X ≤ a ) と P ( X < a ) P(X<a) P ( X < a ) は同じ。「以上/より大きい」を区別する離散分布(ベルヌーイ分布・二項分布 )との違いに注意。
上側確率と下側確率の取り違え 。配布される分布表が上側 P ( Z ≥ z ) P(Z\ge z) P ( Z ≥ z ) か下側 P ( Z ≤ z ) P(Z\le z) P ( Z ≤ z ) かを最初に確認する。「以上」を聞かれて下側を読む(またはその逆)が最頻ミス。必ず図を描いて、塗る面積を目で確認してから表を引く 。
N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) の第2引数は分散 。N ( 170 , 36 ) N(170,36) N ( 170 , 36 ) は σ = 6 \sigma=6 σ = 6 。σ = 36 \sigma=36 σ = 36 と誤読しない。標準化の分母は σ \sigma σ (=6)であって σ 2 \sigma^2 σ 2 (=36)ではない。
負の z z z は対称性で処理 。多くの表は z ≥ 0 z\ge0 z ≥ 0 しか載せない。P ( Z ≤ − 1.5 ) = P ( Z ≥ 1.5 ) P(Z\le-1.5)=P(Z\ge1.5) P ( Z ≤ − 1.5 ) = P ( Z ≥ 1.5 ) のように折り返す。
よくある疑問
Q1. 標準化と正規化、どう違うんですか?
A. 標準化(standardization)は Z = ( X − μ ) / σ Z=(X-\mu)/\sigma Z = ( X − μ ) / σ で平均0・分散1 に揃える変換。正規化(normalization)は文脈で2つの意味があり、(1) 機械学習では min-max で最小0・最大1 に揃える変換、(2) 確率論では密度の面積を1にする正規化定数 で割る操作。統計検定で「標準化」と言えば必ず z変換のこと。名前が似ているだけで操作も目的も違うので、混同は致命的です。
Q2. データを標準化すれば正規分布になりますか?
A. なりません。標準化は線形変換(ずらして・割るだけ)なので分布の形は一切変えません 。歪んだデータは標準化しても歪んだまま、平均0・分散1になるだけです。「z変換すると正規分布になる」は誤解。正規分布になるのは「もともと正規だったものを標準化したとき」だけ(本文2-(B)の証明)。データを正規に近づけたいなら対数変換やBox-Cox変換など非線形 変換が要ります(標準化では無理)。
Q3. なぜわざわざ標準化するんですか?元の分布のまま計算できないのですか?
A. 原理的には元の N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) で直接積分すれば確率は出ます。が、正規分布のPDFは初等関数で積分できない(不定積分が閉じた式で書けない)ため、数値表(分布表)に頼る しかありません。μ , σ \mu,\sigma μ , σ の組ごとに表を作るのは無限に必要で不可能。そこで全部を N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) に標準化し、ただ1枚の標準正規分布表 で済ませる── これが標準化の実利です。
Q4. 「確率」と「確率密度」は同じものですか?f ( x ) f(x) f ( x ) の値が確率ですか?
A. 違います。連続分布では f ( x ) f(x) f ( x ) は確率密度 であって確率そのものではありません。確率は「密度を区間で積分した面積」P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x P(a\le X\le b)=\int_a^b f(x)\,dx P ( a ≤ X ≤ b ) = ∫ a b f ( x ) d x です。1点の確率は P ( X = a ) = 0 P(X=a)=0 P ( X = a ) = 0 (幅0の面積)。N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) の頂点 f ( 0 ) = 1 / 2 π ≈ 0.399 f(0)=1/\sqrt{2\pi}\approx0.399 f ( 0 ) = 1/ 2 π ≈ 0.399 は密度であり、「0になる確率が0.399」という意味ではありません 。「確率=面積」を徹底してください。
Q5. 標準正規分布表で、表に載っていない負の z z z (例 z = − 1.96 z=-1.96 z = − 1.96 )の確率はどう読むのですか?
A. 左右対称性 ϕ ( − z ) = ϕ ( z ) \phi(-z)=\phi(z) ϕ ( − z ) = ϕ ( z ) を使います。多くの表は z ≥ 0 z\ge0 z ≥ 0 しか載せていませんが、P ( Z ≤ − 1.96 ) = P ( Z ≥ 1.96 ) P(Z\le-1.96)=P(Z\ge1.96) P ( Z ≤ − 1.96 ) = P ( Z ≥ 1.96 ) のように、負の側は正の側へ折り返して同じ値を読めます。たとえば P ( − 1.96 ≤ Z ≤ 1.96 ) = 1 − 2 P ( Z ≥ 1.96 ) = 1 − 2 ( 0.025 ) = 0.95 P(-1.96\le Z\le1.96)=1-2\,P(Z\ge1.96)=1-2(0.025)=0.95 P ( − 1.96 ≤ Z ≤ 1.96 ) = 1 − 2 P ( Z ≥ 1.96 ) = 1 − 2 ( 0.025 ) = 0.95 。これが95%信頼区間の根拠です。図を描いて「どの裾と同じ面積か」を確認すれば間違えません。
まとめ
正規分布 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) は平均 μ \mu μ ・分散 σ 2 \sigma^2 σ 2 の左右対称な釣鐘型。PDFは 1 2 π σ exp ( − ( x − μ ) 2 2 σ 2 ) \dfrac{1}{\sqrt{2\pi}\,\sigma}\exp\!\big(-\frac{(x-\mu)^2}{2\sigma^2}\big) 2 π σ 1 exp ( − 2 σ 2 ( x − μ ) 2 ) 。
標準化 Z = ( X − μ ) / σ Z=(X-\mu)/\sigma Z = ( X − μ ) / σ で N ( 0 , 1 ) N(0,1) N ( 0 , 1 ) に揃う。平均0・分散1は線形変換の効果(任意の分布で成立)だが、形まで標準正規になるのは元が正規のときだけ (変数変換でヤコビアン σ \sigma σ が分母の σ \sigma σ を打ち消す)。
確率は面積 。標準正規分布表(上側/下側の慣習に注意)と対称性で、足し引きして読む。± 1.96 \pm1.96 ± 1.96 =95%、1.645 1.645 1.645 =上側5%点は暗記。
68-95-99.7則 は表の積分値そのもの。再生性により独立な正規の和差も正規(平均は足し引き・分散は足す)。
引っかけの筆頭は標準化≠正規化 と非正規データは標準化しても正規にならない 。次いで上側/下側の取り違えと「確率=面積」。
関連ノート