母比率・母分散の検定｜統計検定テキスト

📊 対象級：2級　|　重要度：A（頻出）

要点（BLUF）

母平均以外の代表的な検定。比率は正規近似でz検定、分散はカイ二乗検定・F検定。検定統計量を覚えるだけでなく「帰無仮説を真と仮定して分布を作る」という発想が分母の形を決めます。

z=\frac{\hat p-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}},\qquad \chi^2=\frac{(n-1)s^2}{\sigma_0^2},\qquad F=\frac{s_1^2}{s_2^2}

母比率： $z$ 統計量。分母は帰無の $p_0$ を使う（標本 $\hat p$ ではない）
母分散： $\chi^2$ 統計量、自由度 $n-1$ 。カイ二乗分布が非対称なので両側は上下で別々の臨界値
分散比： $F$ 統計量、自由度 $(n_1-1,\,n_2-1)$ 。2標本の等分散性を見る

1. 母比率の検定（1標本）

概念

「コインの表が出る確率は本当に 0.5 か」「不良率は仕様の 3% を超えていないか」のように、母比率 $p$ がある基準値 $p_0$ に等しいかを判定します。データは各試行が成功/失敗のベルヌーイ試行で、成功回数 $X$ は二項分布 $\text{Bin}(n,p)$ に従います（ベルヌーイ分布・二項分布）。

数式による定式化

標本比率を $\hat p = X/n$ とします。帰無仮説 $H_0:\ p=p_0$ の下で、 $n$ が十分大きければ中心極限定理により $\hat p$ は近似的に正規分布に従います（標本平均・標本比率の標本分布（標準誤差））：

\hat p \overset{\text{近似}}{\sim} N\!\left(p_0,\ \frac{p_0(1-p_0)}{n}\right)

要するに：成功割合 $\hat p$ の平均は $p_0$ 、ばらつき（分散）は $p_0(1-p_0)/n$ という正規分布で近似できる、ということです。

これを標準化したものが検定統計量です：

\boxed{\ z=\frac{\hat p-p_0}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}\ \overset{H_0}{\sim}\ N(0,1)\ }

棄却域は標準正規分布から取ります。有意水準 5% なら両側で $\lvert z\rvert > 1.96$ 、右片側で $z > 1.645$ 。

なぜ分母が $p_0(1-p_0)$ なのか（導出の核）

ベルヌーイ分布の1試行の分散は $p(1-p)$ です。独立な $n$ 試行の標本比率 $\hat p=\frac{1}{n}\sum X_i$ の分散は

\mathrm{Var}(\hat p)=\frac{1}{n^2}\sum_{i=1}^{n}\mathrm{Var}(X_i)=\frac{1}{n^2}\cdot n\,p(1-p)=\frac{p(1-p)}{n}

ここで $p$ に何を代入するかが要点です。検定は「帰無仮説が真である世界」で統計量の分布を作るので、 $p=p_0$ を代入します。だから分母は $\sqrt{p_0(1-p_0)/n}$ になります。

要するに：検定統計量の「物差し（標準誤差）」は、帰無仮説が正しいと仮定した世界の数値 $p_0$ で作る、ということです。データから推定した $\hat p$ は分子（差を測る側）に置き、物差しには使いません。

連続修正（補足）

二項分布は離散、正規分布は連続なので、近似精度を上げるために分子に $\pm \frac{1}{2n}$ を足し引きする**連続修正（半整数補正）**を入れることがあります：

z=\frac{\lvert \hat p-p_0\rvert-\dfrac{1}{2n}}{\sqrt{\dfrac{p_0(1-p_0)}{n}}}

2級では連続修正なしの素の式が基本ですが、「修正を入れると $\lvert z\rvert$ が小さくなる（棄却しにくくなる）」という方向だけ押さえておけば十分です。

数値例

ある製品の不良率は従来 5%。新ラインで 200 個調べたら不良が 4 個（ $\hat p = 0.02$ ）。不良率が下がったと言えるか（有意水準 5%、左片側）。

z=\frac{0.02-0.05}{\sqrt{\dfrac{0.05\times 0.95}{200}}}=\frac{-0.03}{\sqrt{0.0002375}}=\frac{-0.03}{0.01541}\approx -1.95

左片側の棄却限界は $-1.645$ 。 $-1.95 < -1.645$ なので帰無仮説を棄却し、「不良率は下がった」と判断します。

2. 母比率の差の検定（2標本）

概念

「A群とB群で支持率に差があるか」のように、2つの母比率 $p_1,p_2$ が等しいかを判定します。データは独立な2つの二項標本です。

数式による定式化（プール比率がカギ）

帰無仮説 $H_0:\ p_1=p_2$ の下で、検定統計量は

\boxed{\ z=\frac{\hat p_1-\hat p_2}{\sqrt{\hat p(1-\hat p)\left(\dfrac{1}{n_1}+\dfrac{1}{n_2}\right)}}\ \overset{H_0}{\sim}\ N(0,1)\ },\qquad \hat p=\frac{x_1+x_2}{n_1+n_2}

ここで $\hat p$ は2群をまとめたプール（統合）比率です。

なぜプール比率を使うのか（導出の核）

差 $\hat p_1-\hat p_2$ の分散は、独立性から

\mathrm{Var}(\hat p_1-\hat p_2)=\frac{p_1(1-p_1)}{n_1}+\frac{p_2(1-p_2)}{n_2}

帰無仮説 $H_0:\ p_1=p_2$ は「両群が同じ母比率 $p$ から来ている」と主張しています。ならば $p_1=p_2=p$ を代入でき、分散は

\mathrm{Var}(\hat p_1-\hat p_2)=p(1-p)\left(\frac{1}{n_1}+\frac{1}{n_2}\right)

この共通の $p$ を両群のデータを全部合わせて最も精度よく推定したものがプール比率 $\hat p=\dfrac{x_1+x_2}{n_1+n_2}$ です。

要するに：「2群は同じ比率」という帰無仮説を信じるなら、別々に $\hat p_1,\hat p_2$ を使うより、全データをまとめた1つの $\hat p$ で物差しを作る方が筋が通る、ということです。

⚠️ 注意：帰無仮説が $H_0:\ p_1-p_2=0$ （差ゼロ）のときだけプール比率が使えます。 $H_0:\ p_1-p_2=0.1$ のように差がゼロでない値を検定するときは「共通の $p$ 」が存在しないので、プールできず各群の $\hat p_1,\hat p_2$ を別々に分母へ入れます（2級では差ゼロが基本）。

3. 母分散の検定（カイ二乗検定）

概念

「測定のばらつき（分散）が規格 $\sigma_0^2$ に収まっているか」を判定します。前提は母集団が正規分布であること。比率の検定と違い、こちらは近似ではなく正規母集団なら厳密に成り立つ分布を使います。

数式による定式化

正規母集団 $N(\mu,\sigma^2)$ から大きさ $n$ の標本を取り、不偏分散を $s^2=\dfrac{1}{n-1}\sum(x_i-\bar x)^2$ とします。帰無仮説 $H_0:\ \sigma^2=\sigma_0^2$ の下で

\boxed{\ \chi^2=\frac{(n-1)s^2}{\sigma_0^2}=\frac{\sum_{i=1}^n (x_i-\bar x)^2}{\sigma_0^2}\ \overset{H_0}{\sim}\ \chi^2_{n-1}\ }

自由度 $n-1$ のカイ二乗分布に従います。

なぜ自由度が $n-1$ なのか（導出の核）

これは t分布・カイ二乗分布・F分布（標本分布の三役）で出た標本分散の分布そのものです。流れを追います。

(1) もし母平均 $\mu$ が既知なら、各 $\dfrac{x_i-\mu}{\sigma}$ は独立に $N(0,1)$ に従うので、その2乗和は自由度 $n$ のカイ二乗分布：

\sum_{i=1}^n\left(\frac{x_i-\mu}{\sigma}\right)^2\sim \chi^2_{n}

要するに：標準正規変数を $n$ 個2乗して足すと自由度 $n$ のカイ二乗、というカイ二乗分布の定義そのものです。

(2) ところが実際は $\mu$ が未知なので、標本平均 $\bar x$ で代用します。ここで偏差平方和は次のように分解できます（フィッシャーの定理／コクランの定理の特別な場合）：

\sum_{i=1}^n (x_i-\mu)^2 = \sum_{i=1}^n (x_i-\bar x)^2 + n(\bar x-\mu)^2

両辺を $\sigma^2$ で割ると、左辺は自由度 $n$ のカイ二乗、右辺第2項 $\dfrac{n(\bar x-\mu)^2}{\sigma^2}=\left(\dfrac{\bar x-\mu}{\sigma/\sqrt n}\right)^2$ は自由度 1 のカイ二乗です。さらに $\bar x$ と $\sum(x_i-\bar x)^2$ は（正規母集団では）独立であることが示せます。独立なカイ二乗の自由度は加算的なので：

\underbrace{\chi^2_{n}}_{\text{自由度 }n}=\underbrace{\frac{\sum(x_i-\bar x)^2}{\sigma^2}}_{?}+\underbrace{\chi^2_{1}}_{\text{自由度 }1} \ \Longrightarrow\ \frac{\sum(x_i-\bar x)^2}{\sigma^2}\sim\chi^2_{n-1}

要するに：「平均を未知としてデータから推定した $\bar x$ を使った」ぶん、自由度を1つ消費して $n-1$ になる、ということです。 $\bar x$ を1個推定したぶんだけ自由に動ける情報が1減ったと解釈できます。

(3) $\sigma^2=\sigma_0^2$ （帰無仮説）を代入し、 $\sum(x_i-\bar x)^2=(n-1)s^2$ を使えば、冒頭の検定統計量 $\chi^2=\dfrac{(n-1)s^2}{\sigma_0^2}$ が得られます。

棄却域（非対称に注意）

カイ二乗分布は左右非対称（0以上の正の値のみ、右に裾を引く）なので、棄却限界は上側と下側で別々の値を分布表から読みます。有意水準 $\alpha$ の両側検定なら：

\chi^2 < \chi^2_{n-1,\,1-\alpha/2}\quad\text{または}\quad \chi^2 > \chi^2_{n-1,\,\alpha/2}

を棄却域とします。片側検定の使い分け：

対立仮説	棄却する向き	棄却限界
$\sigma^2 > \sigma_0^2$ （ばらつき過大）	$\chi^2$ が大きいとき	$\chi^2 > \chi^2_{n-1,\,\alpha}$ （上側）
$\sigma^2 < \sigma_0^2$ （ばらつき過小）	$\chi^2$ が小さいとき	$\chi^2 < \chi^2_{n-1,\,1-\alpha}$ （下側）

数値例

正規母集団から $n=10$ 標本、不偏分散 $s^2=12$ 。母分散は 5 を超えていると言えるか（有意水準 5%、右片側、 $H_0:\sigma^2=5$ ）。

\chi^2=\frac{(10-1)\times 12}{5}=\frac{108}{5}=21.6

自由度 9 の上側 5% 点は $\chi^2_{9,\,0.05}=16.92$ 。 $21.6 > 16.92$ なので棄却し、「母分散は 5 より大きい」と判断します。

4. 2標本の分散比の検定（F検定）

概念

「2つの正規母集団の分散が等しいか（等分散性）」を判定します。母平均の差の検定で「等分散を仮定してよいか」を事前に確かめる用途でよく使われます（母平均の検定（1標本・2標本t検定））。

数式による定式化

2つの正規母集団から独立に標本を取り、不偏分散を $s_1^2,\,s_2^2$ とします。帰無仮説 $H_0:\ \sigma_1^2=\sigma_2^2$ の下で

\boxed{\ F=\frac{s_1^2}{s_2^2}\ \overset{H_0}{\sim}\ F_{n_1-1,\,n_2-1}\ }

第1自由度 $n_1-1$ 、第2自由度 $n_2-1$ の F 分布に従います。

なぜ F 分布になるのか（導出の核）

F 分布は「独立な2つのカイ二乗をそれぞれの自由度で割った比」として定義されます（t分布・カイ二乗分布・F分布（標本分布の三役））。3節より各群で

\frac{(n_1-1)s_1^2}{\sigma_1^2}\sim\chi^2_{n_1-1},\qquad \frac{(n_2-1)s_2^2}{\sigma_2^2}\sim\chi^2_{n_2-1}

これを自由度で割って比を取ると

F=\frac{\dfrac{1}{n_1-1}\cdot\dfrac{(n_1-1)s_1^2}{\sigma_1^2}}{\dfrac{1}{n_2-1}\cdot\dfrac{(n_2-1)s_2^2}{\sigma_2^2}}=\frac{s_1^2/\sigma_1^2}{s_2^2/\sigma_2^2}

帰無仮説 $\sigma_1^2=\sigma_2^2$ の下では $\sigma_1^2,\sigma_2^2$ が約分されて消え、 $F=s_1^2/s_2^2$ になります。

要するに：分散の検定（カイ二乗）を2つ用意して比を取ったものが F、ということです。だから F検定はカイ二乗検定の2標本版だと捉えられます。

試験テクニック

分布表は上側確率しか載っていないことが多いので、大きい方の不偏分散を分子に置くと $F\ge 1$ になり、上側の臨界値だけで判定できます。下側臨界値が必要なときは $F_{a,b,\,1-\alpha}=\dfrac{1}{F_{b,a,\,\alpha}}$ （自由度を入れ替えて逆数）の関係を使います。

検定手法の選び方（全体マップ）

graph TD
    A["何を検定する？"] --> B["比率 p"]
    A --> C["分散 σ²"]
    B --> B1["1標本：z検定<br/>分母は p₀(1-p₀)/n"]
    B --> B2["2標本の差：z検定<br/>プール比率 p̂ を使う"]
    C --> C1["1標本：カイ二乗検定<br/>χ²=(n-1)s²/σ₀²<br/>自由度 n-1・非対称"]
    C --> C2["2標本の比：F検定<br/>F=s₁²/s₂²<br/>自由度(n₁-1, n₂-1)"]

flowchart TD
    S["母分散の検定の手順"] --> S1["1. 正規母集団を確認"]
    S1 --> S2["2. 不偏分散 s² を計算"]
    S2 --> S3["3. χ²=(n-1)s²/σ₀² を計算"]
    S3 --> S4["4. 自由度 n-1 の<br/>カイ二乗分布表を引く"]
    S4 --> S5{"対立仮説の向きは？"}
    S5 -->|"σ²>σ₀²"| S6["上側 χ²_{α} と比較"]
    S5 -->|"σ²<σ₀²"| S7["下側 χ²_{1-α} と比較"]
    S5 -->|"両側"| S8["上下 χ²_{α/2}, χ²_{1-α/2}<br/>両方と比較"]
    S6 --> R["棄却 / 採択を判断"]
    S7 --> R
    S8 --> R

⚠️ 引っかけポイント・頻出論点

母比率検定の分母は $p_0$ ：信頼区間では $\hat p$ を使うのに検定では $p_0$ を使う。混同が最頻出ミス（→ Q1）
カイ二乗分布は非対称：母平均や母比率のように「対称だから両側は $\pm$ 同じ値」とやると下側を誤る。上下で別の臨界値を引く
自由度を間違える：母分散は $n-1$ 、分散比は $(n_1-1,\,n_2-1)$ の2つ。 $n$ や $n_1+n_2-2$ と取り違えない
正規性の前提：母分散のカイ二乗検定・分散比のF検定は正規母集団が前提。外れ値や歪みに非常に弱い（→ Q2）。比率のz検定は近似なので正規性は不要だが $n$ が小さいと精度が落ちる
プール比率の条件：差ゼロの検定 $H_0:p_1=p_2$ のときだけプール。差が特定値の検定では使わない（→ Q4）
F検定で分子分母の置き方：大きい方を分子に置けば上側臨界値だけで済む

よくある疑問（Q&A）

Q1. 母比率の「検定」では分母が $p_0(1-p_0)$ 、「信頼区間」では $\hat p(1-\hat p)$ なのはなぜ？

問題設定が逆だからです。

検定は「帰無仮説 $p=p_0$ が真の世界」を仮定し、その世界での統計量の分布を作ります。だから物差し（標準誤差）も $p_0$ で作る。 $p_0$ という具体的な数値が手元にあるので、それを使えます。
信頼区間には帰無仮説がありません。真の $p$ は未知のままなので、物差しを作るには実測した $\hat p$ で代用するしかありません。

理論的には、 $n\to\infty$ で $\hat p \to p_0$ （帰無が真なら）なので、

\frac{\hat p-p_0}{\sqrt{\hat p(1-\hat p)/n}}=\frac{\hat p-p_0}{\sqrt{p_0(1-p_0)/n}}\cdot\sqrt{\frac{p_0(1-p_0)}{\hat p(1-\hat p)}}

の後ろの $\sqrt{\cdots}$ が 1 に確率収束します（スルツキーの定理）。つまり漸近的には両者は同じ標準正規分布に収束します。それでも有限標本では値が変わるので、検定では $p_0$ 、区間では $\hat p$ と使い分けるのが標準です。

Q2. 母分散のカイ二乗検定は「正規性に敏感」と言われるのはなぜ？

検定統計量 $\dfrac{(n-1)s^2}{\sigma_0^2}\sim\chi^2_{n-1}$ という分布は、母集団が正規分布であることに強く依存して導かれたものだからです。3節の導出は「各 $x_i$ が正規 → 標準化2乗和がカイ二乗」「 $\bar x$ と $s^2$ が独立」という正規分布固有の性質を使っています。母集団が正規からずれる（外れ値・歪み・厚い裾）と、 $s^2$ の分布はカイ二乗から大きく外れ、有意水準が設計どおりにならず壊れます。

対照的に、母平均の検定（母平均の検定（1標本・2標本t検定））は中心極限定理に支えられているため正規性のずれに比較的ロバストです。「平均の検定はロバスト、分散の検定は正規性に脆い」と覚えておくとよいです。

Q3. 母分散の「カイ二乗検定」と、次に学ぶ「カイ二乗検定（適合度・独立性）」は同じもの？

名前は同じでも別物です。 共通点は「検定統計量がカイ二乗分布に従う」という1点だけ。

	母分散の検定（このノート）	適合度・独立性の検定（カイ二乗検定（適合度・独立性））
検定統計量	$\dfrac{(n-1)s^2}{\sigma_0^2}$	$\displaystyle\sum\frac{(\text{観測}-\text{期待})^2}{\text{期待}}$
何を見る	連続データのばらつき	度数（カテゴリの個数）の偏り
自由度	$n-1$	(カテゴリ数−1) や (行−1)(列−1)
前提	正規母集団	期待度数が十分大きい

統計量の形も自由度の決め方もまったく違うので、「カイ二乗＝どちらか一方」と早合点しないこと。

Q4. 2標本の比率検定で、プール比率を使う場合と使わない場合の見分けは？

帰無仮説が「差ゼロ」かどうかで決まります。

$H_0:\ p_1=p_2$ （差ゼロ）→ 「両群は同じ母比率 $p$ から来た」と仮定できる → 全データをまとめてプール比率 $\hat p=\dfrac{x_1+x_2}{n_1+n_2}$ で分散を推定（2級はほぼ全部これ）
$H_0:\ p_1-p_2=d_0$ （ $d_0\ne 0$ 、例：差が 0.1）→ 共通の $p$ が存在しない → プールできず、各群の $\hat p_1,\hat p_2$ を別々に分母へ入れる

信頼区間を作るときも帰無仮説がないので、プールせず各群の $\hat p_1,\hat p_2$ を使います。

Q5. 連続修正（半整数補正）は2級でも必要？

素の式が基本で、連続修正は補足という位置づけです。二項分布（離散）を正規分布（連続）で近似するときの誤差を減らすための微調整で、分子の差から $\frac{1}{2n}$ を引きます。効果の方向は「 $\lvert z\rvert$ を小さくする＝棄却しにくくなる（保守的になる）」です。問題文に「連続修正を行う」と指定があれば使い、なければ素の式で計算すれば問題ありません。年度や問題集により扱いが異なる点は要最新確認です。

まとめ

母平均以外の3本柱：母比率（z検定）／母分散（カイ二乗検定）／分散比（F検定）。いずれも2級で計算問題として頻出
検定統計量を丸暗記せず、**「帰無仮説を真と仮定して分布を作る」**という原理から導けるようにする。これが母比率の分母 $p_0$ 、プール比率、自由度 $n-1$ のすべての根拠
カイ二乗分布・F分布は非対称。両側・片側で臨界値の取り方が母平均と違う点に最も注意
分散系（カイ二乗・F）は正規母集団が前提で正規性のずれに脆い。比率系（z）は近似だが正規性は不要

要点（BLUF）

1. 母比率の検定（1標本）

概念

数式による定式化

なぜ分母が p0(1−p0)p_0(1-p_0)p0​(1−p0​) なのか（導出の核）

連続修正（補足）

数値例

2. 母比率の差の検定（2標本）

概念

数式による定式化（プール比率がカギ）

なぜプール比率を使うのか（導出の核）

3. 母分散の検定（カイ二乗検定）

概念

数式による定式化

なぜ自由度が n−1n-1n−1 なのか（導出の核）

棄却域（非対称に注意）

数値例

4. 2標本の分散比の検定（F検定）

概念

数式による定式化

なぜ F 分布になるのか（導出の核）

試験テクニック

検定手法の選び方（全体マップ）

⚠️ 引っかけポイント・頻出論点

よくある疑問（Q&A）

Q1. 母比率の「検定」では分母が p0(1−p0)p_0(1-p_0)p0​(1−p0​)、「信頼区間」では p^(1−p^)\hat p(1-\hat p)p^​(1−p^​) なのはなぜ？

Q2. 母分散のカイ二乗検定は「正規性に敏感」と言われるのはなぜ？

Q3. 母分散の「カイ二乗検定」と、次に学ぶ「カイ二乗検定（適合度・独立性）」は同じもの？

Q4. 2標本の比率検定で、プール比率を使う場合と使わない場合の見分けは？

Q5. 連続修正（半整数補正）は2級でも必要？

まとめ

関連ノート

なぜ分母が $p_0(1-p_0)$ なのか（導出の核）

なぜ自由度が $n-1$ なのか（導出の核）

Q1. 母比率の「検定」では分母が $p_0(1-p_0)$ 、「信頼区間」では $\hat p(1-\hat p)$ なのはなぜ？