← 統計検定テキスト 一覧

📊 対象級:2級 | 重要度:A(頻出)

標本平均・標本比率の標本分布(標準誤差)

要点(BLUF)


本文

なぜこのテーマが要なのか

統計学の中心的な仕事は「手元の標本から、見えない母集団を推測する」ことです。その推測の主役が標本平均 Xˉ\bar X(母平均 μ\mu の推定)と標本比率 p^\hat p(母比率 pp の推定)。

ところが標本は無作為に選ぶたびに違う顔ぶれになるので、Xˉ\bar Xp^\hat p標本ごとに揺れる確率変数です。「その揺れがどんな分布で、どれくらい大きいのか」を記述するのが標本分布(sampling distribution)であり、揺れの大きさ(標準偏差)が標準誤差です。

このノートが効いてくる場所を地図にすると:

graph LR
    A["母集団<br/>μ, σ², p(未知)"] -->|無作為標本 n| B["標本"]
    B --> C["標本平均 X̄<br/>標本比率 p̂"]
    C -->|標本分布| D["E·V·標準誤差<br/>(このノート)"]
    D -->|正規近似 CLT| E["区間推定<br/>仮説検定"]
    E -->|推測| A

要するに、標本分布は「標本という入口」と「推定・検定という出口」をつなぐ橋です。ここを曖昧にすると、後ろの推定・検定がすべて砂上の楼閣になります。

1. 標本平均 Xˉ\bar X の標本分布

設定(前提を正確に)

母平均 μ\mu、母分散 σ2\sigma^2 の母集団から、大きさ nn の無作為標本 X1,X2,,XnX_1, X_2, \dots, X_n をとります。前提は次の2つ:

標本平均は

Xˉ=1ni=1nXi=X1+X2++Xnn.\bar X = \frac{1}{n}\sum_{i=1}^{n} X_i = \frac{X_1+X_2+\cdots+X_n}{n}.

これは「データの和を nn で割る」ただの計算式ですが、XiX_i が確率変数なので Xˉ\bar X も確率変数です。その期待値と分散を導きます。

(A) 期待値の導出 E[Xˉ]=μE[\bar X]=\mu(中間式を省略しない)

期待値の線形性 E[aX+bY]=aE[X]+bE[Y]E[aX+bY]=aE[X]+bE[Y]期待値・分散の性質(線形性・和の分散・共分散))を使います。これは独立でなくても成り立つ性質です。

E[Xˉ]=E ⁣[1ni=1nXi]=1nE ⁣[i=1nXi](定数 1/n を外に出す)=1ni=1nE[Xi](期待値の線形性:和の期待値=期待値の和)=1ni=1nμ(各 E[Xi]=μ=1nnμ=μ.\begin{aligned} E[\bar X] &= E\!\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right] \\ &= \frac{1}{n}\,E\!\left[\sum_{i=1}^{n} X_i\right] && \text{(定数 }1/n\text{ を外に出す)}\\ &= \frac{1}{n}\sum_{i=1}^{n} E[X_i] && \text{(期待値の線形性:和の期待値=期待値の和)}\\ &= \frac{1}{n}\sum_{i=1}^{n} \mu && \text{(各 }E[X_i]=\mu\text{)}\\ &= \frac{1}{n}\cdot n\mu = \mu. \end{aligned}

要するにμ\munn 個足して nn で割れば μ\muXˉ\bar X の中心(期待値)は母平均 μ\mu にぴったり一致します。標本サイズ nn には依存しません。この性質を「Xˉ\bar Xμ\mu不偏推定量」と呼びます(中心がズレない=偏りがない。推定量の評価(MSE・フィッシャー情報量・クラメール・ラオの不等式))。

(B) 分散の導出 V[Xˉ]=σ2/nV[\bar X]=\sigma^2/n(独立性がここで効く)

分散には2つの公式を使います(期待値・分散の性質(線形性・和の分散・共分散)):

  1. 定数倍:V[aX]=a2V[X]V[aX]=a^2V[X](分散は2乗で外に出る)。
  2. 和の分散:独立なら V[X+Y]=V[X]+V[Y]V[X+Y]=V[X]+V[Y](共分散項が0になる)。
V[Xˉ]=V ⁣[1ni=1nXi]=1n2V ⁣[i=1nXi](定数倍:1/n は2乗されて 1/n2 に)=1n2i=1nV[Xi](独立性:和の分散=分散の和)=1n2i=1nσ2(各 V[Xi]=σ2=1n2nσ2=σ2n.\begin{aligned} V[\bar X] &= V\!\left[\frac{1}{n}\sum_{i=1}^{n} X_i\right] \\ &= \frac{1}{n^2}\,V\!\left[\sum_{i=1}^{n} X_i\right] && \text{(定数倍:}1/n\text{ は2乗されて }1/n^2\text{ に)}\\ &= \frac{1}{n^2}\sum_{i=1}^{n} V[X_i] && \text{(独立性:和の分散=分散の和)}\\ &= \frac{1}{n^2}\sum_{i=1}^{n} \sigma^2 && \text{(各 }V[X_i]=\sigma^2\text{)}\\ &= \frac{1}{n^2}\cdot n\sigma^2 = \frac{\sigma^2}{n}. \end{aligned}

要するに:和の分散は nσ2n\sigma^2 まで増えるが、1/n1/n 倍したぶんが 1/n21/n^2 で効くので、差し引き σ2/n\sigma^2/n縮む。ここで独立性が決定的です。もし XiX_i どうしに相関があれば共分散項が残り、この式は崩れます(だから無作為抽出が要る)。

(C) 標準誤差の定義

V[Xˉ]=σ2/nV[\bar X]=\sigma^2/n の正の平方根が標準誤差

SE(Xˉ)=V[Xˉ]=σ2n=σn.\mathrm{SE}(\bar X)=\sqrt{V[\bar X]}=\sqrt{\frac{\sigma^2}{n}}=\frac{\sigma}{\sqrt n}.

要するにXˉ\bar X という推定量の「標準偏差」。nn が4倍になると n\sqrt n は2倍、SEは半分。精度を2倍にするにはサンプルを4倍集める必要がある── これが「n\sqrt n の壁」です。

非正規母集団でも標本平均はnとともに正規へ収束し収縮する

母集団が歪んだ指数分布でも、n=1→5→30→100 と増やすと標本平均X̄の分布は正規(青曲線 N(μ, σ²/n))に近づき、μ周りに標準誤差σ/√nで収縮する。図は simulations/hyohon_heikin_clt_keijou.py で生成。

μ=50, σ=10\mu=50,\ \sigma=10 の母集団での標準誤差の数値表:

標本サイズ nnn\sqrt nSE=σ/n\mathrm{SE}=\sigma/\sqrt nXˉ\bar X がほぼ収まる範囲 μ±2SE\mu\pm 2\,\mathrm{SE}
11.0010.0030.0 〜 70.0
42.005.0040.0 〜 60.0
255.002.0046.0 〜 54.0
10010.001.0048.0 〜 52.0
40020.000.5049.0 〜 51.0

nn を増やすほど Xˉ\bar Xμ=50\mu=50 に向かって締まっていく(大数の法則 大数の法則(弱法則・強法則) の定量版)。ただし nn を4倍にしてやっとSEが半分、という縮み方の鈍さに注目。

(D) 形まで正規になるのは? — 中心極限定理

(A)(B) は期待値と分散(数値)の話で、母集団がどんな形でも成り立ちます。では Xˉ\bar X分布の形はどうなるか。

XˉN ⁣(μ, σ2n)Z=Xˉμσ/nN(0,1).\bar X \approx N\!\left(\mu,\ \frac{\sigma^2}{n}\right) \quad\Longleftrightarrow\quad Z=\frac{\bar X-\mu}{\sigma/\sqrt n}\approx N(0,1).

要するに:標準化の分母が「標準偏差 σ\sigma」ではなく「標準誤差 σ/n\sigma/\sqrt n」になる。この ZZ の式が、母平均の区間推定・検定でそのまま使う中核式です。

2. 標本比率 p^\hat p の標本分布

設定と「比率は平均の特殊ケース」

母集団のうち「ある性質を持つ割合」が pp(母比率)。大きさ nn の標本中で性質を持つ個数を YY とすると、YB(n,p)Y\sim B(n,p)(二項分布 ベルヌーイ分布・二項分布)。標本比率は

p^=Yn.\hat p = \frac{Y}{n}.

ここで鍵になる見方:各個体が性質を持つかどうかを XiX_i(持てば1、持たなければ0)とおくと、XiX_iベルヌーイ試行

E[Xi]=p,V[Xi]=p(1p).E[X_i]=p,\qquad V[X_i]=p(1-p).

すると Y=XiY=\sum X_ip^=1nXi=Xˉ\hat p = \frac1n\sum X_i = \bar X。つまり標本比率は「0/1データの標本平均」にすぎません。だから前節の Xˉ\bar X の公式に μp\mu\to pσ2p(1p)\sigma^2\to p(1-p) を代入すれば、比率の式が自動的に出ます。

(A) 期待値 E[p^]=pE[\hat p]=p の導出

E[p^]=E ⁣[Yn]=1nE[Y](定数 1/n を外へ)=1nnp(二項分布の期待値 E[Y]=np=p.\begin{aligned} E[\hat p] &= E\!\left[\frac{Y}{n}\right] = \frac{1}{n}E[Y] && \text{(定数 }1/n\text{ を外へ)}\\ &= \frac{1}{n}\cdot np && \text{(二項分布の期待値 }E[Y]=np\text{)}\\ &= p. \end{aligned}

要するにp^\hat p の中心は母比率 pp にぴったり。p^\hat ppp の不偏推定量です。

(B) 分散 V[p^]=p(1p)/nV[\hat p]=p(1-p)/n の導出

V[p^]=V ⁣[Yn]=1n2V[Y](定数倍は2乗で外へ:1/n2=1n2np(1p)(二項分布の分散 V[Y]=np(1p)=p(1p)n.\begin{aligned} V[\hat p] &= V\!\left[\frac{Y}{n}\right] = \frac{1}{n^2}V[Y] && \text{(定数倍は2乗で外へ:}1/n^2\text{)}\\ &= \frac{1}{n^2}\cdot np(1-p) && \text{(二項分布の分散 }V[Y]=np(1-p)\text{)}\\ &= \frac{p(1-p)}{n}. \end{aligned}

要するにXˉ\bar Xσ2/n\sigma^2/n に、ベルヌーイの分散 σ2=p(1p)\sigma^2=p(1-p) を入れただけ。標準誤差は

SE(p^)=p(1p)n.\mathrm{SE}(\hat p)=\sqrt{\frac{p(1-p)}{n}}.

(C) 比率の標準誤差は p=0.5p=0.5 で最大

p(1p)p(1-p)p=0.5p=0.5 で最大値 0.250.25 をとる上に凸の放物線です。よってSEも p=0.5p=0.5 で最大:

母比率 ppp(1p)p(1-p)n=100n=100 での SE(p^)\mathrm{SE}(\hat p)
0.10.090.030
0.30.210.046
0.50.250.050
0.70.210.046
0.90.090.030

要するに:「半々(p=0.5p=0.5)が一番ばらつく=一番推定しにくい」。世論調査で必要標本サイズを見積もるとき、最悪ケースとして p=0.5p=0.5 を仮定するのはこのため(このとき SE=0.5/n\mathrm{SE}=0.5/\sqrt n で最大になる)。

(D) 正規近似とその条件

p^=Xˉ\hat p = \bar X なので中心極限定理がそのまま効き、nn が大きいと

p^N ⁣(p, p(1p)n),Z=p^pp(1p)/nN(0,1).\hat p \approx N\!\left(p,\ \frac{p(1-p)}{n}\right),\qquad Z=\frac{\hat p - p}{\sqrt{p(1-p)/n}}\approx N(0,1).

ただし p^\hat p はもとが二項分布(離散・pp が0や1に近いと歪む)なので、正規近似が使える目安があります(二項分布の正規近似):

np5 かつ n(1p)5(文献により 10 とするものもある。要最新確認)\boxed{\,np\ge 5 \ \text{かつ}\ n(1-p)\ge 5\,}\quad(\text{文献により }\ge 10\ \text{とするものもある。要最新確認})

要するに:「成功も失敗も最低5個ずつは期待される」くらい nn が大きく、pp が極端でないこと。p=0.5p=0.5 なら n10n\ge 10 程度から、p=0.05p=0.05 なら np5np\ge5n100n\ge100 が要る、という具合に pp が偏るほど大きな nn が必要です。

3. 標準偏差と標準誤差の違い(最重要・暗記)

ここが2級で最も混同されるポイントです。名前が似ているだけで測っている対象が違う

標準偏差 SD標準誤差 SE
何のばらつきかデータ1個1個 XiX_i のばらつき推定量 Xˉ\bar X(や p^\hat p)のばらつき
記号・式σ\sigma(母)/ ss(標本)σ/n\sigma/\sqrt n(や p(1p)/n\sqrt{p(1-p)/n}
nn を増やすと変わらない(母集団の性質)1/n1/\sqrt n小さくなる
何に使うかデータの散らばりの記述推定の精度・信頼区間の幅
関係SE=SDn\mathrm{SE}=\dfrac{\mathrm{SD}}{\sqrt n}
graph TD
    A["母標準偏差 σ<br/>=データ1個のばらつき<br/>(n に依存しない)"] -->|÷√n| B["標準誤差 σ/√n<br/>=標本平均 X̄ のばらつき<br/>(n を増やすと縮む)"]

要するに:「データの散らばり」と「平均値の信頼できなさ」は別物。nn を増やしてもデータ1個の散らばり σ\sigma は変わらない(母集団の性質だから)が、平均の信頼できなさ σ/n\sigma/\sqrt n は縮む(たくさん平均すれば安定するから)。

⚠️ 母 σ\sigma が未知のときは、標本標準偏差 ss(不偏分散の平方根、1n1(XiXˉ)2\sqrt{\frac{1}{n-1}\sum(X_i-\bar X)^2})で代用して SE^=s/n\widehat{\mathrm{SE}}=s/\sqrt n とします。すると標準化量は標準正規ではなく自由度 n1n-1tt 分布にしたがう(t分布・カイ二乗分布・F分布(標本分布の三役))。σ\sigma 既知なら zz、未知なら tt── この分岐は区間推定・検定で必ず問われます。

4. 有限母集団修正(参考・2級では軽め)

ここまでの V[Xˉ]=σ2/nV[\bar X]=\sigma^2/n は「各 XiX_i が独立」を前提にしました。これは復元抽出(同じ個体を選び直しうる)か、母集団 NN が標本 nn に対して十分大きい場合に成り立ちます。

母集団が有限 NN非復元抽出(同じ個体は二度取らない)だと、取るほど残りの選択肢が減って XiX_i どうしがわずかに負の相関を持ち、ばらつきが少し小さくなります。これを補正するのが有限母集団修正係数(fpc)

V[Xˉ]=σ2nNnN1fpc,SE(Xˉ)=σnNnN1.V[\bar X]=\frac{\sigma^2}{n}\cdot\underbrace{\frac{N-n}{N-1}}_{\text{fpc}},\qquad \mathrm{SE}(\bar X)=\frac{\sigma}{\sqrt n}\sqrt{\frac{N-n}{N-1}}.

状況fpc =NnN1=\frac{N-n}{N-1}効果
n=Nn=N(全数調査)0SE=0(全部調べたので誤差なし)
nNn \ll N(標本が母集団に比べ小さい)≒1補正ほぼ不要
nnNN の5%超明確に1未満SEを下げる補正が効く

要するに:「母集団のかなりの割合を調べたなら、推定はその分だけ正確になる」。n/Nn/N が小さい(目安5%未満)なら fpc≒1 で無視できるので、通常の σ/n\sigma/\sqrt n を使います。2級では「n/Nn/N が小さければ無視してよい」と知っていれば十分(要最新確認:出題範囲表での扱いは版により変動)。

5. 具体例

例1:標本平均の確率(正規母集団)

ある工場の製品重量が N(μ=200g, σ2=82)N(\mu=200\,\text{g},\ \sigma^2=8^2) にしたがう。n=16n=16 個を無作為抽出したとき、標本平均 Xˉ\bar X が 203g 以上になる確率は?

  1. Xˉ\bar X の分布:母集団が正規なので XˉN ⁣(200, 8216)=N(200, 4)\bar X\sim N\!\big(200,\ \frac{8^2}{16}\big)=N(200,\ 4)。標準誤差 SE=816=84=2\mathrm{SE}=\frac{8}{\sqrt{16}}=\frac{8}{4}=2
  2. 標準化:z=2032002=32=1.5z=\dfrac{203-200}{2}=\dfrac{3}{2}=1.5分母は σ=8\sigma=8 ではなく SE=2\mathrm{SE}=2(ここが最頻ミス)。
  3. 上側確率:P(Xˉ203)=P(Z1.5)0.0668P(\bar X\ge 203)=P(Z\ge 1.5)\approx 0.0668約6.7%

比較:もし「製品1個」が203g以上の確率なら分母は σ=8\sigma=8z=3/8=0.375z=3/8=0.375P0.354P\approx0.354(約35%)。平均は1個より 16=4\sqrt{16}=4 倍安定するので、同じ「203g以上」でも確率がぐっと下がります。

例2:標本比率の確率(正規近似)

母比率 p=0.4p=0.4 の母集団から n=100n=100 を抽出。標本比率 p^\hat p が 0.5 以上になる確率は?

  1. 近似条件:np=100×0.4=405np=100\times0.4=40\ge5n(1p)=605n(1-p)=60\ge5。OK、正規近似可。
  2. p^\hat p の分布:p^N ⁣(0.4, 0.4×0.6100)=N(0.4, 0.0024)\hat p\approx N\!\big(0.4,\ \frac{0.4\times0.6}{100}\big)=N(0.4,\ 0.0024)。標準誤差 SE=0.0024=0.048990.049\mathrm{SE}=\sqrt{0.0024}=0.04899\approx0.049
  3. 標準化:z=0.50.40.049=0.10.0492.04z=\dfrac{0.5-0.4}{0.049}=\dfrac{0.1}{0.049}\approx2.04
  4. P(p^0.5)=P(Z2.04)0.0207P(\hat p\ge 0.5)=P(Z\ge 2.04)\approx 0.0207約2.1%

要するに:比率の問題も「EEVV を出す → 標準誤差で標準化 → 分布表」という Xˉ\bar X と全く同じ流れ。分母が SE(p^)=p(1p)/n\mathrm{SE}(\hat p)=\sqrt{p(1-p)/n} になるだけ。

6. 試験での問われ方(2級)

flowchart TD
    A["標本分布の問題"] --> B{"平均か比率か"}
    B -->|平均 X̄| C["E=μ V=σ²÷n を立てる"]
    B -->|比率 p̂| D["E=p V=p(1−p)÷n を立てる"]
    C --> E["標準誤差で標準化<br/>z=(X̄−μ)÷(σ÷√n)"]
    D --> F["近似条件 np≥5 n(1−p)≥5 を確認"]
    F --> G["標準化 z=(p̂−p)÷√(p(1−p)÷n)"]
    E --> H["分布表で面積を読む"]
    G --> H
    H --> I["区間推定・検定へ接続"]

2級での典型出題:

  1. 標準誤差の計算σ\sigma(または ss)と nn から σ/n\sigma/\sqrt n を求めさせる。σ\sigma そのものと取り違えさせる引っかけが定番。
  2. 標本平均の確率XˉN(μ,σ2/n)\bar X\sim N(\mu,\sigma^2/n)P(Xˉa)P(\bar X\ge a) を標準化+分布表。分母をSEにできるかが勝負。
  3. 標本比率の確率・近似条件p^\hat p の正規近似で確率計算。近似が使えるか(np,n(1p)np,n(1-p))を判断させる。
  4. nn と精度の関係:「SEを半分にするには nn を何倍にするか」→ 4倍(n\sqrt n の壁)。
  5. 推定・検定への接続:この標準誤差が信頼区間 Xˉ±1.96σ/n\bar X\pm 1.96\,\sigma/\sqrt n の幅そのもの(区間推定(母平均・母比率・母分散の信頼区間))、検定統計量の分母そのもの(母平均の検定(1標本・2標本t検定) 母比率・母分散の検定)になる。

⚠️ 引っかけポイント


よくある疑問

Q1. 標準偏差と標準誤差、結局どう違うんですか? A. 「何のばらつきを測っているか」が違います。標準偏差 σ\sigmaデータ1個1個の散らばり(母集団そのものの性質)。標準誤差 σ/n\sigma/\sqrt n は、そのデータを nn 個平均して作った推定量 Xˉ\bar X の散らばりです。たとえば身長データなら、標準偏差は「人によって身長がどれだけ違うか」、標準誤差は「100人の平均身長を何度も測り直したらその平均値がどれだけブレるか」。後者は平均する人数 nn を増やすほど安定するので n\sqrt n で割って小さくなります。データの散らばり(SD)と推定の精度(SE)は別の概念です。

Q2. なぜ分散が σ2/n\sigma^2/n で、σ2n\sigma^2 nσ2\sigma^2 じゃないんですか? A. 平均は「足して nn で割る」操作だからです。和 Xi\sum X_i の分散は独立性により nσ2n\sigma^2 まで増えますnn 個分のばらつきが積み上がる)。しかし Xˉ\bar X はそれを nn で割るので、分散の定数倍公式 V[aX]=a2V[X]V[aX]=a^2V[X] により 1n2\frac{1}{n^2} が掛かります。差し引き 1n2nσ2=σ2n\frac{1}{n^2}\cdot n\sigma^2=\frac{\sigma^2}{n}。直観的には「たくさんの値を平均すると、大きい外れと小さい外れが打ち消し合って安定する」ので、平均のばらつきは nn で割って小さくなる、と理解できます。

Q3. 標本サイズ nn を2倍にすれば誤差は半分になりますか? A. なりません。標準誤差は σ/n\sigma/\sqrt n で、nn ではなく n\sqrt n に反比例します。nn を2倍にしても 21.41\sqrt 2\approx1.41 倍しか縮まないので、SEは約 1/1.410.711/1.41\approx0.71 倍(約29%減)にしかなりません。SEを半分にするには nn を4倍1/31/3 にするには9倍必要です。これが「n\sqrt n の壁」で、調査の精度を上げるコストが急激に増える理由です。世論調査の標本が数千人で頭打ちになるのも、これ以上増やしても精度がほとんど上がらないためです。

Q4. 標本比率 p^\hat p はいつでも正規分布で近似していいんですか? A. いつでもではありません。p^\hat p のもとは二項分布で、pp が0や1に近いと分布が片側に歪み、nn が小さいと飛び飛び(離散)の影響が残ります。目安として np5np\ge5 かつ n(1p)5n(1-p)\ge5(厳しめに 10\ge10 とする文献もある。要最新確認)を満たすとき正規近似が妥当です。「成功も失敗も最低5回ずつは期待される」程度に nn が大きく、pp が極端でないこと。たとえば p=0.02p=0.02(2%)の珍しい事象を n=50n=50 で調べると np=1<5np=1<5 なので、正規近似は不適切でポアソン分布や二項分布そのもので扱うべきです(ポアソン分布)。

Q5. 母分散 σ2\sigma^2 が分からないとき、標準誤差はどう計算するんですか? A. 標本から推定します。標本標準偏差 s=1n1(XiXˉ)2s=\sqrt{\frac{1}{n-1}\sum(X_i-\bar X)^2}(不偏分散の平方根)で σ\sigma を代用し、SE^=s/n\widehat{\mathrm{SE}}=s/\sqrt n とします。ただし σ\sigmass で置き換えた瞬間、標準化量は標準正規ではなく自由度 n1n-1tt 分布にしたがいます(ss 自体がばらつく分、裾が少し重くなる)。σ\sigma 既知なら zz、未知なら tt── 実務ではほぼ常に σ\sigma 未知なので tt を使います。nn が大きい(目安30以上)と tt 分布は正規分布にほぼ一致するので、大標本では zz でも実害は小さくなります。詳細は t分布・カイ二乗分布・F分布(標本分布の三役) で扱います。


まとめ


関連ノート