← 統計検定テキスト 一覧
📊 対象級:2級 | 重要度:A(頻出)
標本平均・標本比率の標本分布(標準誤差)
要点(BLUF)
標本平均 X ˉ \bar X X ˉ の標本分布 :母平均 μ \mu μ ・母分散 σ 2 \sigma^2 σ 2 の母集団から大きさ n n n の無作為標本をとると、
E [ X ˉ ] = μ , V [ X ˉ ] = σ 2 n , S E ( X ˉ ) = σ n \boxed{\,E[\bar X]=\mu,\qquad V[\bar X]=\dfrac{\sigma^2}{n},\qquad \mathrm{SE}(\bar X)=\dfrac{\sigma}{\sqrt n}\,} E [ X ˉ ] = μ , V [ X ˉ ] = n σ 2 , SE ( X ˉ ) = n σ
要するに「X ˉ \bar X X ˉ の中心は母平均のまま、ばらつきは n \sqrt n n 分の1に縮む」。この σ / n \sigma/\sqrt n σ / n を**標準誤差(standard error, SE)**と呼ぶ。
標本比率 p ^ \hat p p ^ の標本分布 :母比率 p p p の母集団から大きさ n n n をとると、
E [ p ^ ] = p , V [ p ^ ] = p ( 1 − p ) n , S E ( p ^ ) = p ( 1 − p ) n \boxed{\,E[\hat p]=p,\qquad V[\hat p]=\dfrac{p(1-p)}{n},\qquad \mathrm{SE}(\hat p)=\sqrt{\dfrac{p(1-p)}{n}}\,} E [ p ^ ] = p , V [ p ^ ] = n p ( 1 − p ) , SE ( p ^ ) = n p ( 1 − p )
要するに「比率も中心は母比率のまま、n \sqrt n n 分の1に縮む」。これは X ˉ \bar X X ˉ の式で各データを0/1(ベルヌーイ)にした特殊ケース。
正規近似 :中心極限定理(中心極限定理(CLT) )により、n n n が大きいと
X ˉ ≈ N ( μ , σ 2 n ) , p ^ ≈ N ( p , p ( 1 − p ) n ) . \bar X \approx N\!\Big(\mu,\ \tfrac{\sigma^2}{n}\Big),\qquad \hat p \approx N\!\Big(p,\ \tfrac{p(1-p)}{n}\Big). X ˉ ≈ N ( μ , n σ 2 ) , p ^ ≈ N ( p , n p ( 1 − p ) ) .
この正規近似が、区間推定(区間推定(母平均・母比率・母分散の信頼区間) )と仮説検定すべての出発点。
最重要の区別 :標準偏差 σ \sigma σ は「データ1個1個のばらつき」、標準誤差 σ / n \sigma/\sqrt n σ / n は「推定量(X ˉ \bar X X ˉ )のばらつき」。両者は別物で、n \sqrt n n だけ違う。
本文
なぜこのテーマが要なのか
統計学の中心的な仕事は「手元の標本から、見えない母集団を推測する 」ことです。その推測の主役が標本平均 X ˉ \bar X X ˉ (母平均 μ \mu μ の推定)と標本比率 p ^ \hat p p ^ (母比率 p p p の推定)。
ところが標本は無作為に選ぶたびに違う顔ぶれになるので、X ˉ \bar X X ˉ や p ^ \hat p p ^ も標本ごとに揺れる確率変数 です。「その揺れがどんな分布で、どれくらい大きいのか」を記述するのが標本分布(sampling distribution)であり、揺れの大きさ(標準偏差)が 標準誤差 です。
このノートが効いてくる場所を地図にすると:
graph LR
A["母集団<br/>μ, σ², p(未知)"] -->|無作為標本 n| B["標本"]
B --> C["標本平均 X̄<br/>標本比率 p̂"]
C -->|標本分布| D["E·V·標準誤差<br/>(このノート)"]
D -->|正規近似 CLT| E["区間推定<br/>仮説検定"]
E -->|推測| A
要するに、標本分布は「標本という入口」と「推定・検定という出口」をつなぐ橋です。ここを曖昧にすると、後ろの推定・検定がすべて砂上の楼閣になります。
1. 標本平均 X ˉ \bar X X ˉ の標本分布
設定(前提を正確に)
母平均 μ \mu μ 、母分散 σ 2 \sigma^2 σ 2 の母集団から、大きさ n n n の無作為標本 X 1 , X 2 , … , X n X_1, X_2, \dots, X_n X 1 , X 2 , … , X n をとります。前提は次の2つ:
各 X i X_i X i は同じ母集団から取るので同分布 :E [ X i ] = μ E[X_i]=\mu E [ X i ] = μ 、V [ X i ] = σ 2 V[X_i]=\sigma^2 V [ X i ] = σ 2 (全 i i i 共通)。
互いに独立 (無作為抽出・復元抽出、または母集団が十分大きい非復元抽出で近似的に成立。後述の有限母集団修正を参照)。
標本平均は
X ˉ = 1 n ∑ i = 1 n X i = X 1 + X 2 + ⋯ + X n n . \bar X = \frac{1}{n}\sum_{i=1}^{n} X_i = \frac{X_1+X_2+\cdots+X_n}{n}. X ˉ = n 1 ∑ i = 1 n X i = n X 1 + X 2 + ⋯ + X n .
これは「データの和を n n n で割る」ただの計算式ですが、X i X_i X i が確率変数なので X ˉ \bar X X ˉ も確率変数です。その期待値と分散を導きます。
(A) 期待値の導出 E [ X ˉ ] = μ E[\bar X]=\mu E [ X ˉ ] = μ (中間式を省略しない)
期待値の線形性 E [ a X + b Y ] = a E [ X ] + b E [ Y ] E[aX+bY]=aE[X]+bE[Y] E [ a X + bY ] = a E [ X ] + b E [ Y ] (期待値・分散の性質(線形性・和の分散・共分散) )を使います。これは独立でなくても 成り立つ性質です。
E [ X ˉ ] = E [ 1 n ∑ i = 1 n X i ] = 1 n E [ ∑ i = 1 n X i ] (定数 1 / n を外に出す) = 1 n ∑ i = 1 n E [ X i ] (期待値の線形性:和の期待値=期待値の和) = 1 n ∑ i = 1 n μ (各 E [ X i ] = μ ) = 1 n ⋅ n μ = μ . \begin{aligned}
E[\bar X]
&= E\!\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right] \\
&= \frac{1}{n}\,E\!\left[\sum_{i=1}^{n} X_i\right] && \text{(定数 }1/n\text{ を外に出す)}\\
&= \frac{1}{n}\sum_{i=1}^{n} E[X_i] && \text{(期待値の線形性:和の期待値=期待値の和)}\\
&= \frac{1}{n}\sum_{i=1}^{n} \mu && \text{(各 }E[X_i]=\mu\text{)}\\
&= \frac{1}{n}\cdot n\mu = \mu.
\end{aligned} E [ X ˉ ] = E [ n 1 i = 1 ∑ n X i ] = n 1 E [ i = 1 ∑ n X i ] = n 1 i = 1 ∑ n E [ X i ] = n 1 i = 1 ∑ n μ = n 1 ⋅ n μ = μ . (定数 1/ n を外に出す) (期待値の線形性:和の期待値=期待値の和) (各 E [ X i ] = μ )
要するに :μ \mu μ を n n n 個足して n n n で割れば μ \mu μ 。X ˉ \bar X X ˉ の中心(期待値)は母平均 μ \mu μ にぴったり一致 します。標本サイズ n n n には依存しません。この性質を「X ˉ \bar X X ˉ は μ \mu μ の不偏推定量 」と呼びます(中心がズレない=偏りがない。推定量の評価(MSE・フィッシャー情報量・クラメール・ラオの不等式) )。
(B) 分散の導出 V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n (独立性がここで効く)
分散には2つの公式を使います(期待値・分散の性質(線形性・和の分散・共分散) ):
定数倍:V [ a X ] = a 2 V [ X ] V[aX]=a^2V[X] V [ a X ] = a 2 V [ X ] (分散は2乗で外に出る)。
和の分散:独立なら V [ X + Y ] = V [ X ] + V [ Y ] V[X+Y]=V[X]+V[Y] V [ X + Y ] = V [ X ] + V [ Y ] (共分散項が0になる)。
V [ X ˉ ] = V [ 1 n ∑ i = 1 n X i ] = 1 n 2 V [ ∑ i = 1 n X i ] (定数倍: 1 / n は2乗されて 1 / n 2 に) = 1 n 2 ∑ i = 1 n V [ X i ] (独立性:和の分散=分散の和) = 1 n 2 ∑ i = 1 n σ 2 (各 V [ X i ] = σ 2 ) = 1 n 2 ⋅ n σ 2 = σ 2 n . \begin{aligned}
V[\bar X]
&= V\!\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right] \\
&= \frac{1}{n^2}\,V\!\left[\sum_{i=1}^{n} X_i\right] && \text{(定数倍:}1/n\text{ は2乗されて }1/n^2\text{ に)}\\
&= \frac{1}{n^2}\sum_{i=1}^{n} V[X_i] && \text{(独立性:和の分散=分散の和)}\\
&= \frac{1}{n^2}\sum_{i=1}^{n} \sigma^2 && \text{(各 }V[X_i]=\sigma^2\text{)}\\
&= \frac{1}{n^2}\cdot n\sigma^2 = \frac{\sigma^2}{n}.
\end{aligned} V [ X ˉ ] = V [ n 1 i = 1 ∑ n X i ] = n 2 1 V [ i = 1 ∑ n X i ] = n 2 1 i = 1 ∑ n V [ X i ] = n 2 1 i = 1 ∑ n σ 2 = n 2 1 ⋅ n σ 2 = n σ 2 . (定数倍: 1/ n は 2 乗されて 1/ n 2 に) (独立性:和の分散=分散の和) (各 V [ X i ] = σ 2 )
要するに :和の分散は n σ 2 n\sigma^2 n σ 2 まで増えるが、1 / n 1/n 1/ n 倍したぶんが 1 / n 2 1/n^2 1/ n 2 で効くので、差し引き σ 2 / n \sigma^2/n σ 2 / n に縮む 。ここで独立性が決定的 です。もし X i X_i X i どうしに相関があれば共分散項が残り、この式は崩れます(だから無作為抽出が要る)。
(C) 標準誤差の定義
V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n の正の平方根が標準誤差 :
S E ( X ˉ ) = V [ X ˉ ] = σ 2 n = σ n . \mathrm{SE}(\bar X)=\sqrt{V[\bar X]}=\sqrt{\frac{\sigma^2}{n}}=\frac{\sigma}{\sqrt n}. SE ( X ˉ ) = V [ X ˉ ] = n σ 2 = n σ .
要するに :X ˉ \bar X X ˉ という推定量の「標準偏差」。n n n が4倍になると n \sqrt n n は2倍、SEは半分。精度を2倍にするにはサンプルを4倍 集める必要がある── これが「n \sqrt n n の壁」です。
母集団が歪んだ指数分布でも、n=1→5→30→100 と増やすと標本平均X̄の分布は正規(青曲線 N(μ, σ²/n))に近づき、μ周りに標準誤差σ/√nで収縮する。図は simulations/hyohon_heikin_clt_keijou.py で生成。
μ = 50 , σ = 10 \mu=50,\ \sigma=10 μ = 50 , σ = 10 の母集団での標準誤差の数値表:
標本サイズ n n n n \sqrt n n S E = σ / n \mathrm{SE}=\sigma/\sqrt n SE = σ / n X ˉ \bar X X ˉ がほぼ収まる範囲 μ ± 2 S E \mu\pm 2\,\mathrm{SE} μ ± 2 SE 1 1.00 10.00 30.0 〜 70.0 4 2.00 5.00 40.0 〜 60.0 25 5.00 2.00 46.0 〜 54.0 100 10.00 1.00 48.0 〜 52.0 400 20.00 0.50 49.0 〜 51.0
n n n を増やすほど X ˉ \bar X X ˉ は μ = 50 \mu=50 μ = 50 に向かって締まっていく(大数の法則 大数の法則(弱法則・強法則) の定量版)。ただし n n n を4倍にしてやっとSEが半分、という縮み方の鈍さに注目。
(D) 形まで正規になるのは? — 中心極限定理
(A)(B) は期待値と分散(数値)の話で、母集団がどんな形でも 成り立ちます。では X ˉ \bar X X ˉ の分布の形 はどうなるか。
母集団がもともと正規 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) なら、正規の再生性(正規分布(標準正規・標準化) )により X ˉ \bar X X ˉ は厳密に N ( μ , σ 2 / n ) N(\mu,\sigma^2/n) N ( μ , σ 2 / n ) 。
母集団が正規でなくても、n n n が大きければ中心極限定理 (中心極限定理(CLT) )により X ˉ \bar X X ˉ は近似的に N ( μ , σ 2 / n ) N(\mu,\sigma^2/n) N ( μ , σ 2 / n ) 。
X ˉ ≈ N ( μ , σ 2 n ) ⟺ Z = X ˉ − μ σ / n ≈ N ( 0 , 1 ) . \bar X \approx N\!\left(\mu,\ \frac{\sigma^2}{n}\right) \quad\Longleftrightarrow\quad Z=\frac{\bar X-\mu}{\sigma/\sqrt n}\approx N(0,1). X ˉ ≈ N ( μ , n σ 2 ) ⟺ Z = σ / n X ˉ − μ ≈ N ( 0 , 1 ) .
要するに :標準化の分母が「標準偏差 σ \sigma σ 」ではなく「標準誤差 σ / n \sigma/\sqrt n σ / n 」になる。この Z Z Z の式が、母平均の区間推定・検定でそのまま使う中核式です。
2. 標本比率 p ^ \hat p p ^ の標本分布
設定と「比率は平均の特殊ケース」
母集団のうち「ある性質を持つ割合」が p p p (母比率)。大きさ n n n の標本中で性質を持つ個数を Y Y Y とすると、Y ∼ B ( n , p ) Y\sim B(n,p) Y ∼ B ( n , p ) (二項分布 ベルヌーイ分布・二項分布 )。標本比率は
p ^ = Y n . \hat p = \frac{Y}{n}. p ^ = n Y .
ここで鍵になる見方:各個体が性質を持つかどうかを X i X_i X i (持てば1、持たなければ0)とおくと、X i X_i X i はベルヌーイ試行 で
E [ X i ] = p , V [ X i ] = p ( 1 − p ) . E[X_i]=p,\qquad V[X_i]=p(1-p). E [ X i ] = p , V [ X i ] = p ( 1 − p ) .
すると Y = ∑ X i Y=\sum X_i Y = ∑ X i 、p ^ = 1 n ∑ X i = X ˉ \hat p = \frac1n\sum X_i = \bar X p ^ = n 1 ∑ X i = X ˉ 。つまり標本比率は「0/1データの標本平均」にすぎません 。だから前節の X ˉ \bar X X ˉ の公式に μ → p \mu\to p μ → p 、σ 2 → p ( 1 − p ) \sigma^2\to p(1-p) σ 2 → p ( 1 − p ) を代入すれば、比率の式が自動的に出ます。
(A) 期待値 E [ p ^ ] = p E[\hat p]=p E [ p ^ ] = p の導出
E [ p ^ ] = E [ Y n ] = 1 n E [ Y ] (定数 1 / n を外へ) = 1 n ⋅ n p (二項分布の期待値 E [ Y ] = n p ) = p . \begin{aligned}
E[\hat p]
&= E\!\left[\frac{Y}{n}\right]
= \frac{1}{n}E[Y] && \text{(定数 }1/n\text{ を外へ)}\\
&= \frac{1}{n}\cdot np && \text{(二項分布の期待値 }E[Y]=np\text{)}\\
&= p.
\end{aligned} E [ p ^ ] = E [ n Y ] = n 1 E [ Y ] = n 1 ⋅ n p = p . (定数 1/ n を外へ) (二項分布の期待値 E [ Y ] = n p )
要するに :p ^ \hat p p ^ の中心は母比率 p p p にぴったり。p ^ \hat p p ^ は p p p の不偏推定量です。
(B) 分散 V [ p ^ ] = p ( 1 − p ) / n V[\hat p]=p(1-p)/n V [ p ^ ] = p ( 1 − p ) / n の導出
V [ p ^ ] = V [ Y n ] = 1 n 2 V [ Y ] (定数倍は2乗で外へ: 1 / n 2 ) = 1 n 2 ⋅ n p ( 1 − p ) (二項分布の分散 V [ Y ] = n p ( 1 − p ) ) = p ( 1 − p ) n . \begin{aligned}
V[\hat p]
&= V\!\left[\frac{Y}{n}\right]
= \frac{1}{n^2}V[Y] && \text{(定数倍は2乗で外へ:}1/n^2\text{)}\\
&= \frac{1}{n^2}\cdot np(1-p) && \text{(二項分布の分散 }V[Y]=np(1-p)\text{)}\\
&= \frac{p(1-p)}{n}.
\end{aligned} V [ p ^ ] = V [ n Y ] = n 2 1 V [ Y ] = n 2 1 ⋅ n p ( 1 − p ) = n p ( 1 − p ) . (定数倍は 2 乗で外へ: 1/ n 2 ) (二項分布の分散 V [ Y ] = n p ( 1 − p ) )
要するに :X ˉ \bar X X ˉ の σ 2 / n \sigma^2/n σ 2 / n に、ベルヌーイの分散 σ 2 = p ( 1 − p ) \sigma^2=p(1-p) σ 2 = p ( 1 − p ) を入れただけ。標準誤差は
S E ( p ^ ) = p ( 1 − p ) n . \mathrm{SE}(\hat p)=\sqrt{\frac{p(1-p)}{n}}. SE ( p ^ ) = n p ( 1 − p ) .
(C) 比率の標準誤差は p = 0.5 p=0.5 p = 0.5 で最大
p ( 1 − p ) p(1-p) p ( 1 − p ) は p = 0.5 p=0.5 p = 0.5 で最大値 0.25 0.25 0.25 をとる上に凸の放物線です。よってSEも p = 0.5 p=0.5 p = 0.5 で最大:
母比率 p p p p ( 1 − p ) p(1-p) p ( 1 − p ) n = 100 n=100 n = 100 での S E ( p ^ ) \mathrm{SE}(\hat p) SE ( p ^ ) 0.1 0.09 0.030 0.3 0.21 0.046 0.5 0.25 0.050 0.7 0.21 0.046 0.9 0.09 0.030
要するに :「半々(p = 0.5 p=0.5 p = 0.5 )が一番ばらつく=一番推定しにくい」。世論調査で必要標本サイズを見積もるとき、最悪ケースとして p = 0.5 p=0.5 p = 0.5 を仮定するのはこのため(このとき S E = 0.5 / n \mathrm{SE}=0.5/\sqrt n SE = 0.5/ n で最大になる)。
(D) 正規近似とその条件
p ^ = X ˉ \hat p = \bar X p ^ = X ˉ なので中心極限定理がそのまま効き、n n n が大きいと
p ^ ≈ N ( p , p ( 1 − p ) n ) , Z = p ^ − p p ( 1 − p ) / n ≈ N ( 0 , 1 ) . \hat p \approx N\!\left(p,\ \frac{p(1-p)}{n}\right),\qquad Z=\frac{\hat p - p}{\sqrt{p(1-p)/n}}\approx N(0,1). p ^ ≈ N ( p , n p ( 1 − p ) ) , Z = p ( 1 − p ) / n p ^ − p ≈ N ( 0 , 1 ) .
ただし p ^ \hat p p ^ はもとが二項分布(離散・p p p が0や1に近いと歪む)なので、正規近似が使える目安 があります(二項分布の正規近似 ):
n p ≥ 5 かつ n ( 1 − p ) ≥ 5 ( 文献により ≥ 10 とするものもある。要最新確認 ) \boxed{\,np\ge 5 \ \text{かつ}\ n(1-p)\ge 5\,}\quad(\text{文献により }\ge 10\ \text{とするものもある。要最新確認}) n p ≥ 5 かつ n ( 1 − p ) ≥ 5 ( 文献により ≥ 10 とするものもある。要最新確認 )
要するに :「成功も失敗も最低5個ずつは期待される」くらい n n n が大きく、p p p が極端でないこと。p = 0.5 p=0.5 p = 0.5 なら n ≥ 10 n\ge 10 n ≥ 10 程度から、p = 0.05 p=0.05 p = 0.05 なら n p ≥ 5 np\ge5 n p ≥ 5 に n ≥ 100 n\ge100 n ≥ 100 が要る、という具合に p p p が偏るほど大きな n n n が必要です。
3. 標準偏差と標準誤差の違い(最重要・暗記)
ここが2級で最も混同されるポイントです。名前が似ているだけで測っている対象が違う 。
標準偏差 SD 標準誤差 SE 何のばらつきか データ1個1個 X i X_i X i のばらつき推定量 X ˉ \bar X X ˉ (や p ^ \hat p p ^ )のばらつき記号・式 σ \sigma σ (母)/ s s s (標本)σ / n \sigma/\sqrt n σ / n (や p ( 1 − p ) / n \sqrt{p(1-p)/n} p ( 1 − p ) / n )n n n を増やすと変わらない(母集団の性質) 1 / n 1/\sqrt n 1/ n で小さくなる 何に使うか データの散らばりの記述 推定の精度 ・信頼区間の幅 関係 S E = S D n \mathrm{SE}=\dfrac{\mathrm{SD}}{\sqrt n} SE = n SD
graph TD
A["母標準偏差 σ<br/>=データ1個のばらつき<br/>(n に依存しない)"] -->|÷√n| B["標準誤差 σ/√n<br/>=標本平均 X̄ のばらつき<br/>(n を増やすと縮む)"]
要するに :「データの散らばり」と「平均値の信頼できなさ」は別物。n n n を増やしてもデータ1個の散らばり σ \sigma σ は変わらない(母集団の性質だから)が、平均の信頼できなさ σ / n \sigma/\sqrt n σ / n は縮む(たくさん平均すれば安定するから)。
⚠️ 母 σ \sigma σ が未知のときは、標本標準偏差 s s s (不偏分散の平方根、1 n − 1 ∑ ( X i − X ˉ ) 2 \sqrt{\frac{1}{n-1}\sum(X_i-\bar X)^2} n − 1 1 ∑ ( X i − X ˉ ) 2 )で代用して S E ^ = s / n \widehat{\mathrm{SE}}=s/\sqrt n SE = s / n とします。すると標準化量は標準正規ではなく自由度 n − 1 n-1 n − 1 の t t t 分布 にしたがう(t分布・カイ二乗分布・F分布(標本分布の三役) )。σ \sigma σ 既知なら z z z 、未知なら t t t ── この分岐は区間推定・検定で必ず問われます。
4. 有限母集団修正(参考・2級では軽め)
ここまでの V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n は「各 X i X_i X i が独立」を前提にしました。これは復元抽出 (同じ個体を選び直しうる)か、母集団 N N N が標本 n n n に対して十分大きい場合に成り立ちます。
母集団が有限 N N N で非復元抽出 (同じ個体は二度取らない)だと、取るほど残りの選択肢が減って X i X_i X i どうしがわずかに負の相関を持ち、ばらつきが少し小さく なります。これを補正するのが有限母集団修正係数(fpc) :
V [ X ˉ ] = σ 2 n ⋅ N − n N − 1 ⏟ fpc , S E ( X ˉ ) = σ n N − n N − 1 . V[\bar X]=\frac{\sigma^2}{n}\cdot\underbrace{\frac{N-n}{N-1}}_{\text{fpc}},\qquad \mathrm{SE}(\bar X)=\frac{\sigma}{\sqrt n}\sqrt{\frac{N-n}{N-1}}. V [ X ˉ ] = n σ 2 ⋅ fpc N − 1 N − n , SE ( X ˉ ) = n σ N − 1 N − n .
状況 fpc = N − n N − 1 =\frac{N-n}{N-1} = N − 1 N − n 効果 n = N n=N n = N (全数調査)0 SE=0(全部調べたので誤差なし) n ≪ N n \ll N n ≪ N (標本が母集団に比べ小さい)≒1 補正ほぼ不要 n n n が N N N の5%超明確に1未満 SEを下げる補正が効く
要するに :「母集団のかなりの割合を調べたなら、推定はその分だけ正確になる」。n / N n/N n / N が小さい(目安5%未満)なら fpc≒1 で無視できるので、通常の σ / n \sigma/\sqrt n σ / n を使います。2級では「n / N n/N n / N が小さければ無視してよい」と知っていれば十分(要最新確認:出題範囲表での扱いは版により変動)。
5. 具体例
例1:標本平均の確率(正規母集団)
ある工場の製品重量が N ( μ = 200 g , σ 2 = 8 2 ) N(\mu=200\,\text{g},\ \sigma^2=8^2) N ( μ = 200 g , σ 2 = 8 2 ) にしたがう。n = 16 n=16 n = 16 個を無作為抽出したとき、標本平均 X ˉ \bar X X ˉ が 203g 以上になる確率は?
X ˉ \bar X X ˉ の分布:母集団が正規なので X ˉ ∼ N ( 200 , 8 2 16 ) = N ( 200 , 4 ) \bar X\sim N\!\big(200,\ \frac{8^2}{16}\big)=N(200,\ 4) X ˉ ∼ N ( 200 , 16 8 2 ) = N ( 200 , 4 ) 。標準誤差 S E = 8 16 = 8 4 = 2 \mathrm{SE}=\frac{8}{\sqrt{16}}=\frac{8}{4}=2 SE = 16 8 = 4 8 = 2 。
標準化:z = 203 − 200 2 = 3 2 = 1.5 z=\dfrac{203-200}{2}=\dfrac{3}{2}=1.5 z = 2 203 − 200 = 2 3 = 1.5 。分母は σ = 8 \sigma=8 σ = 8 ではなく S E = 2 \mathrm{SE}=2 SE = 2 (ここが最頻ミス)。
上側確率:P ( X ˉ ≥ 203 ) = P ( Z ≥ 1.5 ) ≈ 0.0668 P(\bar X\ge 203)=P(Z\ge 1.5)\approx 0.0668 P ( X ˉ ≥ 203 ) = P ( Z ≥ 1.5 ) ≈ 0.0668 → 約6.7% 。
比較:もし「製品1個」が203g以上の確率なら分母は σ = 8 \sigma=8 σ = 8 で z = 3 / 8 = 0.375 z=3/8=0.375 z = 3/8 = 0.375 、P ≈ 0.354 P\approx0.354 P ≈ 0.354 (約35%)。平均は1個より 16 = 4 \sqrt{16}=4 16 = 4 倍安定するので、同じ「203g以上」でも確率がぐっと下がります。
例2:標本比率の確率(正規近似)
母比率 p = 0.4 p=0.4 p = 0.4 の母集団から n = 100 n=100 n = 100 を抽出。標本比率 p ^ \hat p p ^ が 0.5 以上になる確率は?
近似条件:n p = 100 × 0.4 = 40 ≥ 5 np=100\times0.4=40\ge5 n p = 100 × 0.4 = 40 ≥ 5 、n ( 1 − p ) = 60 ≥ 5 n(1-p)=60\ge5 n ( 1 − p ) = 60 ≥ 5 。OK、正規近似可。
p ^ \hat p p ^ の分布:p ^ ≈ N ( 0.4 , 0.4 × 0.6 100 ) = N ( 0.4 , 0.0024 ) \hat p\approx N\!\big(0.4,\ \frac{0.4\times0.6}{100}\big)=N(0.4,\ 0.0024) p ^ ≈ N ( 0.4 , 100 0.4 × 0.6 ) = N ( 0.4 , 0.0024 ) 。標準誤差 S E = 0.0024 = 0.04899 ≈ 0.049 \mathrm{SE}=\sqrt{0.0024}=0.04899\approx0.049 SE = 0.0024 = 0.04899 ≈ 0.049 。
標準化:z = 0.5 − 0.4 0.049 = 0.1 0.049 ≈ 2.04 z=\dfrac{0.5-0.4}{0.049}=\dfrac{0.1}{0.049}\approx2.04 z = 0.049 0.5 − 0.4 = 0.049 0.1 ≈ 2.04 。
P ( p ^ ≥ 0.5 ) = P ( Z ≥ 2.04 ) ≈ 0.0207 P(\hat p\ge 0.5)=P(Z\ge 2.04)\approx 0.0207 P ( p ^ ≥ 0.5 ) = P ( Z ≥ 2.04 ) ≈ 0.0207 → 約2.1% 。
要するに :比率の問題も「E E E ・V V V を出す → 標準誤差で標準化 → 分布表」という X ˉ \bar X X ˉ と全く同じ流れ。分母が S E ( p ^ ) = p ( 1 − p ) / n \mathrm{SE}(\hat p)=\sqrt{p(1-p)/n} SE ( p ^ ) = p ( 1 − p ) / n になるだけ。
6. 試験での問われ方(2級)
flowchart TD
A["標本分布の問題"] --> B{"平均か比率か"}
B -->|平均 X̄| C["E=μ V=σ²÷n を立てる"]
B -->|比率 p̂| D["E=p V=p(1−p)÷n を立てる"]
C --> E["標準誤差で標準化<br/>z=(X̄−μ)÷(σ÷√n)"]
D --> F["近似条件 np≥5 n(1−p)≥5 を確認"]
F --> G["標準化 z=(p̂−p)÷√(p(1−p)÷n)"]
E --> H["分布表で面積を読む"]
G --> H
H --> I["区間推定・検定へ接続"]
2級での典型出題:
標準誤差の計算 :σ \sigma σ (または s s s )と n n n から σ / n \sigma/\sqrt n σ / n を求めさせる。σ \sigma σ そのものと取り違えさせる引っかけが定番。
標本平均の確率 :X ˉ ∼ N ( μ , σ 2 / n ) \bar X\sim N(\mu,\sigma^2/n) X ˉ ∼ N ( μ , σ 2 / n ) で P ( X ˉ ≥ a ) P(\bar X\ge a) P ( X ˉ ≥ a ) を標準化+分布表。分母をSEにできるかが勝負。
標本比率の確率・近似条件 :p ^ \hat p p ^ の正規近似で確率計算。近似が使えるか(n p , n ( 1 − p ) np,n(1-p) n p , n ( 1 − p ) )を判断させる。
n n n と精度の関係 :「SEを半分にするには n n n を何倍にするか」→ 4倍(n \sqrt n n の壁)。
推定・検定への接続 :この標準誤差が信頼区間 X ˉ ± 1.96 σ / n \bar X\pm 1.96\,\sigma/\sqrt n X ˉ ± 1.96 σ / n の幅そのもの(区間推定(母平均・母比率・母分散の信頼区間) )、検定統計量の分母そのもの(母平均の検定(1標本・2標本t検定) 母比率・母分散の検定 )になる。
⚠️ 引っかけポイント
標準誤差 ≠ 標準偏差(最重要) 。標準偏差 σ \sigma σ は「データ1個のばらつき」、標準誤差 σ / n \sigma/\sqrt n σ / n は「標本平均のばらつき」。X ˉ \bar X X ˉ を標準化するときの分母は**必ず S E = σ / n \mathrm{SE}=\sigma/\sqrt n SE = σ / n **であって σ \sigma σ ではない。「X ˉ \bar X X ˉ が203g以上」を σ \sigma σ で割るのが最頻ミス。
V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n の σ 2 \sigma^2 σ 2 は母分散、σ \sigma σ ではない 。標準誤差は σ / n \sigma/\sqrt n σ / n であって σ 2 / n \sigma^2/\sqrt n σ 2 / n でも σ / n \sigma/n σ / n でもない。σ 2 / n = σ / n \sqrt{\sigma^2/n}=\sigma/\sqrt n σ 2 / n = σ / n の平方根を取り違えない。
n n n を増やすと縮むのは標準誤差だけ 。母標準偏差 σ \sigma σ (データ1個の散らばり)は n n n に依存せず一定。「標本を増やせばデータのばらつきが減る」は誤り。減るのは平均値の ばらつき(SE)。
比率の正規近似には条件がある 。n p ≥ 5 np\ge5 n p ≥ 5 かつ n ( 1 − p ) ≥ 5 n(1-p)\ge5 n ( 1 − p ) ≥ 5 (文献により ≥ 10 \ge10 ≥ 10 。要最新確認)。p p p が0や1に近いと二項分布が歪み、n n n が小さいと正規近似が崩れる。無条件に p ^ ≈ \hat p\approx p ^ ≈ 正規としない。
独立性(無作為抽出)が分散の式の前提 。V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n は X i X_i X i が独立だから共分散項が消えて成立する。相関のある標本(クラスター抽出など)ではこの式は過小評価になる。非復元・小母集団では有限母集団修正が要る。
σ \sigma σ 既知か未知かで標準化先が変わる 。σ \sigma σ 既知なら z = ( X ˉ − μ ) / ( σ / n ) ∼ N ( 0 , 1 ) z=(\bar X-\mu)/(\sigma/\sqrt n)\sim N(0,1) z = ( X ˉ − μ ) / ( σ / n ) ∼ N ( 0 , 1 ) 。σ \sigma σ 未知で s s s を使うなら t = ( X ˉ − μ ) / ( s / n ) ∼ t n − 1 t=(\bar X-\mu)/(s/\sqrt n)\sim t_{n-1} t = ( X ˉ − μ ) / ( s / n ) ∼ t n − 1 (t分布・カイ二乗分布・F分布(標本分布の三役) )。σ \sigma σ 未知なのに z z z を使うのは誤り(小標本で特に差が出る)。
「標本分散」と「標本平均の分散」は別物 。標本分散 s 2 s^2 s 2 はデータの散らばりの指標(σ 2 \sigma^2 σ 2 の推定)。標本平均の分散 V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n は推定量のばらつき。日本語が紛らわしいが指すものが違う。
よくある疑問
Q1. 標準偏差と標準誤差、結局どう違うんですか?
A. 「何のばらつきを測っているか」が違います。標準偏差 σ \sigma σ はデータ1個1個 の散らばり(母集団そのものの性質)。標準誤差 σ / n \sigma/\sqrt n σ / n は、そのデータを n n n 個平均して作った推定量 X ˉ \bar X X ˉ の散らばりです。たとえば身長データなら、標準偏差は「人によって身長がどれだけ違うか」、標準誤差は「100人の平均身長を何度も測り直したらその平均値がどれだけブレるか」。後者は平均する人数 n n n を増やすほど安定するので n \sqrt n n で割って小さくなります。データの散らばり(SD)と推定の精度(SE)は別の概念です。
Q2. なぜ分散が σ 2 / n \sigma^2/n σ 2 / n で、σ 2 n \sigma^2 n σ 2 n や σ 2 \sigma^2 σ 2 じゃないんですか?
A. 平均は「足して n n n で割る」操作だからです。和 ∑ X i \sum X_i ∑ X i の分散は独立性により n σ 2 n\sigma^2 n σ 2 まで増えます (n n n 個分のばらつきが積み上がる)。しかし X ˉ \bar X X ˉ はそれを n n n で割るので、分散の定数倍公式 V [ a X ] = a 2 V [ X ] V[aX]=a^2V[X] V [ a X ] = a 2 V [ X ] により 1 n 2 \frac{1}{n^2} n 2 1 が掛かります。差し引き 1 n 2 ⋅ n σ 2 = σ 2 n \frac{1}{n^2}\cdot n\sigma^2=\frac{\sigma^2}{n} n 2 1 ⋅ n σ 2 = n σ 2 。直観的には「たくさんの値を平均すると、大きい外れと小さい外れが打ち消し合って安定する」ので、平均のばらつきは n n n で割って小さくなる、と理解できます。
Q3. 標本サイズ n n n を2倍にすれば誤差は半分になりますか?
A. なりません。標準誤差は σ / n \sigma/\sqrt n σ / n で、n n n ではなく n \sqrt n n に反比例します。n n n を2倍にしても 2 ≈ 1.41 \sqrt 2\approx1.41 2 ≈ 1.41 倍しか縮まないので、SEは約 1 / 1.41 ≈ 0.71 1/1.41\approx0.71 1/1.41 ≈ 0.71 倍(約29%減)にしかなりません。SEを半分にするには n n n を4倍 、1 / 3 1/3 1/3 にするには9倍必要です。これが「n \sqrt n n の壁」で、調査の精度を上げるコストが急激に増える理由です。世論調査の標本が数千人で頭打ちになるのも、これ以上増やしても精度がほとんど上がらないためです。
Q4. 標本比率 p ^ \hat p p ^ はいつでも正規分布で近似していいんですか?
A. いつでもではありません。p ^ \hat p p ^ のもとは二項分布で、p p p が0や1に近いと分布が片側に歪み、n n n が小さいと飛び飛び(離散)の影響が残ります。目安として n p ≥ 5 np\ge5 n p ≥ 5 かつ n ( 1 − p ) ≥ 5 n(1-p)\ge5 n ( 1 − p ) ≥ 5 (厳しめに ≥ 10 \ge10 ≥ 10 とする文献もある。要最新確認)を満たすとき正規近似が妥当です。「成功も失敗も最低5回ずつは期待される」程度に n n n が大きく、p p p が極端でないこと。たとえば p = 0.02 p=0.02 p = 0.02 (2%)の珍しい事象を n = 50 n=50 n = 50 で調べると n p = 1 < 5 np=1<5 n p = 1 < 5 なので、正規近似は不適切でポアソン分布や二項分布そのもので扱うべきです(ポアソン分布 )。
Q5. 母分散 σ 2 \sigma^2 σ 2 が分からないとき、標準誤差はどう計算するんですか?
A. 標本から推定します。標本標準偏差 s = 1 n − 1 ∑ ( X i − X ˉ ) 2 s=\sqrt{\frac{1}{n-1}\sum(X_i-\bar X)^2} s = n − 1 1 ∑ ( X i − X ˉ ) 2 (不偏分散の平方根)で σ \sigma σ を代用し、S E ^ = s / n \widehat{\mathrm{SE}}=s/\sqrt n SE = s / n とします。ただし σ \sigma σ を s s s で置き換えた瞬間、標準化量は標準正規ではなく自由度 n − 1 n-1 n − 1 の t t t 分布 にしたがいます(s s s 自体がばらつく分、裾が少し重くなる)。σ \sigma σ 既知なら z z z 、未知なら t t t ── 実務ではほぼ常に σ \sigma σ 未知なので t t t を使います。n n n が大きい(目安30以上)と t t t 分布は正規分布にほぼ一致するので、大標本では z z z でも実害は小さくなります。詳細は t分布・カイ二乗分布・F分布(標本分布の三役) で扱います。
まとめ
標本平均 X ˉ \bar X X ˉ :E [ X ˉ ] = μ E[\bar X]=\mu E [ X ˉ ] = μ (中心は母平均・不偏)、V [ X ˉ ] = σ 2 / n V[\bar X]=\sigma^2/n V [ X ˉ ] = σ 2 / n 、標準誤差 σ / n \sigma/\sqrt n σ / n 。導出は期待値の線形性(E E E )と独立性+定数倍公式(V V V )。
標本比率 p ^ \hat p p ^ :X ˉ \bar X X ˉ で各データを0/1にした特殊ケース。E [ p ^ ] = p E[\hat p]=p E [ p ^ ] = p 、V [ p ^ ] = p ( 1 − p ) / n V[\hat p]=p(1-p)/n V [ p ^ ] = p ( 1 − p ) / n 、標準誤差 p ( 1 − p ) / n \sqrt{p(1-p)/n} p ( 1 − p ) / n 。p = 0.5 p=0.5 p = 0.5 でばらつき最大。
正規近似 :CLT(中心極限定理(CLT) )により X ˉ ≈ N ( μ , σ 2 / n ) \bar X\approx N(\mu,\sigma^2/n) X ˉ ≈ N ( μ , σ 2 / n ) 、p ^ ≈ N ( p , p ( 1 − p ) / n ) \hat p\approx N(p,p(1-p)/n) p ^ ≈ N ( p , p ( 1 − p ) / n ) 。比率は n p ≥ 5 , n ( 1 − p ) ≥ 5 np\ge5,\ n(1-p)\ge5 n p ≥ 5 , n ( 1 − p ) ≥ 5 が近似の目安。
標準偏差 ≠ 標準誤差 :SDはデータ1個のばらつき(n n n 不変)、SEは推定量のばらつき(σ / n \sigma/\sqrt n σ / n 、n n n で縮む)。両者は n \sqrt n n だけ違う。標準化の分母は必ずSE。
精度は n \sqrt n n でしか上がらない(n \sqrt n n の壁 )。σ \sigma σ 未知なら s s s で代用し t t t 分布へ。この標準誤差が区間推定の幅(区間推定(母平均・母比率・母分散の信頼区間) )・検定統計量の分母そのものになる。
関連ノート