📊 対象級：2級　|　重要度：A（頻出）

区間推定（母平均・母比率・母分散の信頼区間）

要点（BLUF）

区間推定：母数 $\theta$ （母平均・母比率・母分散など）を1つの値ではなく幅のある区間 $[L,\ U]$ で見積もること。点推定（点推定（推定量の良さ：不偏性・一致性・有効性・十分性））が「母平均は52.3」と言い切るのに対し、区間推定は「母平均は $[50.1,\ 54.5]$ の範囲にありそう」と不確かさを区間の幅で表現します。この区間を**信頼区間（confidence interval, CI）**と呼びます。
信頼係数 $1-\alpha$ の正しい意味（最重要・最頻出の誤解）：信頼係数95%とは「同じ手順で標本抽出と区間計算を何度も繰り返すと、作られる区間の95%が母数を含む」という頻度論的な意味です。「母数が区間に入る確率が95%」は誤り。母数 $\theta$ は未知だが定数で、ランダムに動くのは区間の方。これをⓆ&Aと⚠️で徹底的に潰します。
3つの基本ケースの公式：

推定対象	条件	信頼区間（信頼係数 $1-\alpha$ ）	使う分布
母平均 $\mu$	$\sigma$ 既知	$\bar X\pm z_{\alpha/2}\dfrac{\sigma}{\sqrt n}$	標準正規 $N(0,1)$
母平均 $\mu$	$\sigma$ 未知	$\bar X\pm t_{\alpha/2,\,n-1}\dfrac{s}{\sqrt n}$	$t$ 分布（自由度 $n-1$ ）
母比率 $p$	$n$ 大（正規近似）	$\hat p\pm z_{\alpha/2}\sqrt{\dfrac{\hat p(1-\hat p)}{n}}$	標準正規 $N(0,1)$
母分散 $\sigma^2$	母集団が正規	$\dfrac{(n-1)s^2}{\chi^2_{\alpha/2,\,n-1}}\le\sigma^2\le\dfrac{(n-1)s^2}{\chi^2_{1-\alpha/2,\,n-1}}$	カイ二乗分布（非対称）

共通の骨格：すべて「点推定値 ± （臨界値）×（標準誤差）」の形（母分散だけ非対称なので例外）。標準誤差 $\mathrm{SE}=\sigma/\sqrt n$ 等が推定量のばらつきを表し、臨界値が信頼係数を決めます。
検定との双対性：信頼区間に含まれない値は、対応する両側検定で有意水準 $\alpha$ で棄却される。区間推定と仮説検定（仮説検定の枠組み（帰無仮説・対立仮説・p値・有意水準））はコインの裏表です。

本文

1. 区間推定とは何か：点推定の不確かさを区間で表す

点推定（点推定（推定量の良さ：不偏性・一致性・有効性・十分性））は母数 $\theta$ を1つの値で言い当てます。標本平均 $\bar X=52.3$ 、標本比率 $\hat p=0.35$ など。しかし点推定値は標本ごとに変わる確率変数の実現値なので、「ピッタリ当たっている保証」はどこにもありません。標本を取り直せば違う値が出る。

そこで「真値はこの範囲にありそうだ」と、幅のある区間で見積もるのが区間推定です。

点推定： $\theta\approx52.3$ （1点。当たり外れの不確かさが見えない）
区間推定： $\theta\in[50.1,\ 54.5]$ （区間。幅が不確かさの大きさを表す）

区間が狭いほど精密な推定、広いほど不確かさが大きい。区間推定の値打ちは、点推定が捨ててしまう「どれくらい確からしいか」を区間の幅と信頼係数という形で定量化するところにあります。

graph LR
    A["標本<br/>X₁,…,Xₙ"] --> B["点推定<br/>θ̂ = 52.3<br/>1つの値"]
    A --> C["区間推定<br/>θ ∈ [50.1, 54.5]<br/>幅のある区間"]
    B -.->|不確かさが<br/>見えない| D["?"]
    C -->|幅 = 不確かさ<br/>信頼係数 = 確からしさ| E["不確かさを<br/>定量化"]
    style B fill:#fff0e8
    style C fill:#e8f4ff
    style E fill:#e8f4ff

2. 信頼区間と信頼係数の定義

95%信頼区間を100本作ると約95%が真値を含む

μ=50・σ=10既知・n=25 で95%区間を100本作ると約95%が真値 μ を含む（赤=外し）。ランダムに動くのは区間の方で μ は固定。図は simulations/shinrai_kukan_hifuku.py で生成。

定義：母数 $\theta$ の 信頼係数（confidence level） $1-\alpha$ の信頼区間とは、標本から計算される2つの統計量 $L=L(X_1,\dots,X_n)$ 、 $U=U(X_1,\dots,X_n)$ で作る区間 $[L,\ U]$ であって、 $\boxed{\,P\big(L\le\theta\le U\big)=1-\alpha\,}$ を満たすもの。 $\alpha$ を 有意水準（または危険率）と呼び、典型的には $\alpha=0.05$ （信頼係数95%）や $\alpha=0.01$ （99%）。

要するに：「区間が母数 $\theta$ を捕まえる確率が $1-\alpha$ 」になるように、区間の端 $L,\ U$ を標本から作る。ここで確率の意味を正確に読む必要があります（次節）。

2.1 確率は「区間の方」にかかっている（決定的に重要）

上の式 $P(L\le\theta\le U)=1-\alpha$ でランダムなのはどれか。これが区間推定の最大の急所です。

$\theta$ （母数）：未知だが定数。ランダムではない。
$L,\ U$ （区間の端）：標本 $X_1,\dots,X_n$ の関数なので確率変数。標本を取り直せば値が変わる。

つまり $P(L\le\theta\le U)=1-\alpha$ は、**「ランダムに動く区間 $[L,U]$ が、固定された的 $\theta$ を捕まえる確率」**です。的（ $\theta$ ）は動かず、投げる輪（区間）の方が標本ごとに飛び散る。輪投げで、的は固定・輪の落ちる場所がランダム、というイメージです。

graph TD
    T["母数 θ（固定された的・定数）"]
    S1["標本①→区間 [49,53] ○含む"] -.-> T
    S2["標本②→区間 [50,54] ○含む"] -.-> T
    S3["標本③→区間 [55,59] ✕外す"] -.-> T
    S4["標本④→区間 [48,52] ○含む"] -.-> T
    S5["…多数回繰り返すと…"] -.-> T
    R["作った区間の 100(1-α)% が θ を含む"]
    style T fill:#ffe8e8
    style S3 fill:#ffd0d0
    style R fill:#e8f4ff

2.2 信頼係数95%の正しい解釈（試験で最も狙われる）

信頼係数95%の正しい読み：「母集団から標本を取り、95%信頼区間を作る」という作業を多数回（例：100回）繰り返すと、作られた区間のうち約95回（95%）が母数 $\theta$ を含む。

逆に約5回（5%）は外す。どの1つの区間も、母数を含むか含まないかの2択（確率ではなく、含むか含まないかが既に決まっている）であって、特定の1区間について「95%の確率で母数が入る」とは言えません。この「95%」は確率ではなく信頼率（または被覆確率）と呼ばれます。

⚠️ 最頻出の誤答：「母平均が、求めた区間 $[50.1,\ 54.5]$ に95%の確率で入る」── これは誤り。母平均は定数なので、この特定の区間に入っているか・いないかのどちらかで、確率は0か1（既に決まっている、人間が知らないだけ）。確率95%が言えるのは区間を作る手順に対してであって、出来上がった1つの区間に対してではありません。試験では選択肢でこの違いを突いてきます。

3. 母平均の区間推定（σ既知）：標準正規分布を使う

最もシンプルなケースから組み立てます。母分散 $\sigma^2$ が既知（=値が分かっている）とき。

3.1 出発点：標本平均の標準化

母平均 $\mu$ ・母分散 $\sigma^2$ の母集団から無作為標本 $X_1,\dots,X_n$ （i.i.d.）を取ると、標本平均 $\bar X$ は（標本平均・標本比率の標本分布（標準誤差））

$E[\bar X]=\mu,\qquad V[\bar X]=\frac{\sigma^2}{n}.$

母集団が正規分布なら $\bar X\sim N(\mu,\ \sigma^2/n)$ がそのまま成り立ち、正規でなくても $n$ が大きければ中心極限定理（中心極限定理（CLT））で近似的に成り立ちます。これを標準化すると：

$Z=\frac{\bar X-\mu}{\sigma/\sqrt n}\sim N(0,1).$

要するに：標本平均 $\bar X$ から真の中心 $\mu$ を引き、ばらつきの尺度 $\sigma/\sqrt n$ で割れば、標準正規分布に従う変数 $Z$ になる。分母の $\sigma/\sqrt n$ を 標準誤差（standard error, SE） と呼びます。

3.2 標準誤差 $\sigma/\sqrt n$ の意味

標準誤差 $\mathrm{SE}=\sigma/\sqrt n$ は「標本平均 $\bar X$ がどれくらいばらつくか」を表す標準偏差です。母集団の標準偏差 $\sigma$ をそのまま使わず $\sqrt n$ で割るのがポイント。

要するに：個々のデータは $\sigma$ だけばらつくが、 $n$ 個平均すると打ち消し合ってばらつきが $1/\sqrt n$ に縮む。 $n$ を4倍にすれば標準誤差は半分、 $n$ を100倍にすれば $1/10$ になる。標本を増やすほど標本平均は安定し、信頼区間も狭くなる根拠がこの $\sqrt n$ です。

3.3 区間の組み立て

標準正規分布で、中央に確率 $1-\alpha$ が入るように両側を $\alpha/2$ ずつ切ります。その境界を 臨界値 $z_{\alpha/2}$ とすると（上側 $\alpha/2$ 点。例： $\alpha=0.05$ なら $z_{0.025}=1.96$ ）：

$P\!\left(-z_{\alpha/2}\le Z\le z_{\alpha/2}\right)=1-\alpha.$

$Z=\dfrac{\bar X-\mu}{\sigma/\sqrt n}$ を代入して、不等式を $\mu$ について解きます：

-z_{\alpha/2}\le\frac{\bar X-\mu}{\sigma/\sqrt n}\le z_{\alpha/2} \;\Longleftrightarrow\; \bar X-z_{\alpha/2}\frac{\sigma}{\sqrt n}\le\mu\le\bar X+z_{\alpha/2}\frac{\sigma}{\sqrt n}.

よって母平均の信頼区間（ $\sigma$ 既知）：

$\boxed{\ \bar X\pm z_{\alpha/2}\,\frac{\sigma}{\sqrt n}\ }$

要するに：点推定値 $\bar X$ を中心に、左右へ「臨界値 × 標準誤差」だけ広げた区間。この $z_{\alpha/2}\cdot\sigma/\sqrt n$ を 誤差の限界（margin of error） と呼びます。信頼係数を上げる（ $\alpha$ を小さくする）と $z_{\alpha/2}$ が大きくなり区間が広がる ── 確実性と狭さはトレードオフです。

3.4 数値例（σ既知）

ある製品の重量が母標準偏差 $\sigma=4$ g と分かっている。 $n=64$ 個を測ったら標本平均 $\bar X=102$ g だった。母平均の95%信頼区間は？

標準誤差： $\sigma/\sqrt n=4/\sqrt{64}=4/8=0.5$ 。
臨界値： $z_{0.025}=1.96$ 。
誤差の限界： $1.96\times0.5=0.98$ 。
信頼区間： $102\pm0.98=[101.02,\ 102.98]$ 。

「母平均は95%信頼区間 $[101.0,\ 103.0]$ 」と結論します（同じ手順を繰り返せば95%の区間が真の母平均を含む、の意味）。

4. 母平均の区間推定（σ未知）：なぜ t 分布・自由度 n−1 なのか

現実には母分散 $\sigma^2$ が分かっていることはまずありません。 $\sigma$ を標本から推定した不偏分散 $s^2$ で置き換えるのが自然な発想ですが、ここで分布が正規から $t$ 分布に変わります。なぜか ── ここが2級の理論的山場です。

4.1 $\sigma$ を $s$ に置き換えると何が起きるか

$\sigma$ 既知のときの標準化変数は $Z=\dfrac{\bar X-\mu}{\sigma/\sqrt n}\sim N(0,1)$ でした。 $\sigma$ を不偏分散の平方根 $s=\sqrt{\frac{1}{n-1}\sum(X_i-\bar X)^2}$ で置き換えた量を $T$ とします：

$T=\frac{\bar X-\mu}{s/\sqrt n}.$

この $T$ は標準正規分布には従いません。なぜなら分母の $s$ 自体が標本ごとに変動する確率変数だから。 $Z$ では分母 $\sigma$ が定数だったのに対し、 $T$ では分子 $\bar X$ も分母 $s$ も両方ランダム。分母が小さめに出た標本では $T$ が大きく振れるため、 $T$ の分布は $N(0,1)$ より裾が重く（外れ値が出やすく）なります。これが $t$ 分布です。

4.2 t 分布の構成と自由度 n−1 の出どころ（完全導出）

$T$ が従う分布を厳密に特定します。母集団が正規 $N(\mu,\sigma^2)$ のとき、次の2つの事実が鍵です（t分布・カイ二乗分布・F分布（標本分布の三役））。

事実1：標準化した標本平均は標準正規。 $Z=\frac{\bar X-\mu}{\sigma/\sqrt n}\sim N(0,1).$

事実2：不偏分散を母分散で割って自由度倍した量はカイ二乗分布に従う。 $W=\frac{(n-1)s^2}{\sigma^2}\sim\chi^2_{n-1}\quad(\text{自由度 }n-1).$ （この自由度 $n-1$ は、点推定で見た「不偏分散の自由度」── 拘束条件 $\sum(X_i-\bar X)=0$ が1本かかるため $n-1$ ── と同じ出どころです。点推定（推定量の良さ：不偏性・一致性・有効性・十分性）参照。）

事実3：正規母集団では $\bar X$ と $s^2$ は独立（正規分布に固有の性質）。

ここで $t$ 分布の定義：「標準正規 $Z$ 」を「独立なカイ二乗 $W$ を自由度 $k$ で割って平方根を取ったもの」で割った量は、自由度 $k$ の $t$ 分布に従う：

$t_k=\frac{Z}{\sqrt{W/k}}.$

これに $k=n-1$ を当てはめて計算します：

\frac{Z}{\sqrt{W/(n-1)}} =\frac{\dfrac{\bar X-\mu}{\sigma/\sqrt n}}{\sqrt{\dfrac{(n-1)s^2/\sigma^2}{n-1}}} =\frac{\dfrac{\bar X-\mu}{\sigma/\sqrt n}}{\sqrt{s^2/\sigma^2}} =\frac{\dfrac{\bar X-\mu}{\sigma/\sqrt n}}{s/\sigma}.

分子分母の $\sigma$ がきれいに消えて：

$=\frac{\bar X-\mu}{s/\sqrt n}=T.$

したがって

$\boxed{\ T=\frac{\bar X-\mu}{s/\sqrt n}\sim t_{n-1}\ (\text{自由度 }n-1\text{ の }t\text{ 分布})\ }$

要するに： $\sigma$ を $s$ で置き換えた量 $T$ は、計算すると「標準正規 $Z$ ÷ √(カイ二乗/自由度)」の形になり、定義どおり自由度 $n-1$ の $t$ 分布に従う。途中で $\sigma$ が約分で消えるので、 $\sigma$ が未知でも計算できるようになったのが本質的な利得です。自由度 $n-1$ は不偏分散 $s^2$ の自由度をそのまま引き継いだもの。

4.3 区間の組み立て

$\sigma$ 既知の場合とまったく同じ要領で、 $N(0,1)$ を $t_{n-1}$ に、 $\sigma$ を $s$ に、 $z_{\alpha/2}$ を $t_{\alpha/2,\,n-1}$ に置き換えるだけ：

$P\!\left(-t_{\alpha/2,\,n-1}\le T\le t_{\alpha/2,\,n-1}\right)=1-\alpha$

を $\mu$ について解いて：

$\boxed{\ \bar X\pm t_{\alpha/2,\,n-1}\,\frac{s}{\sqrt n}\ }$

要するに：構造は $\sigma$ 既知のときと同じ「 $\bar X$ ± 臨界値 × 標準誤差」。違いは (1) 標準誤差が $s/\sqrt n$ （推定した $s$ を使う）、(2) 臨界値が $t_{\alpha/2,\,n-1}$ （ $z$ より少し大きい）の2点だけ。 $t$ の臨界値が $z$ より大きいぶん、 $\sigma$ 未知の区間は既知のときより広くなる── これは「 $\sigma$ も推定している不確かさ」が区間に上乗せされた結果で、理にかなっています。

4.4 $t$ 分布と正規分布の関係（自由度で繋がる）

$t$ 分布は正規分布より裾が重いですが、自由度 $n-1$ が大きくなる（標本が増える）と $s$ が $\sigma$ に近づいて変動しなくなり、 $t$ 分布は標準正規分布に収束します。

xychart-beta
    title "t分布（自由度小）は正規分布より裾が重い"
    x-axis "標準化した値" [-4, -3, -2, -1, 0, 1, 2, 3, 4]
    y-axis "確率密度" 0 --> 0.45
    line "標準正規 N(0,1)" [0.0001, 0.004, 0.054, 0.242, 0.399, 0.242, 0.054, 0.004, 0.0001]
    line "t分布（自由度3）" [0.009, 0.023, 0.067, 0.201, 0.368, 0.201, 0.067, 0.023, 0.009]

中央が低く・両裾が高いのが $t$ 分布（自由度3）。だから同じ信頼係数でも臨界値が大きくなる（より外側まで取らないと95%入らない）。実務の目安として自由度30程度で両者はほぼ一致します。

⚠️ 試験での使い分け：「母分散 $\sigma^2$ （または母標準偏差 $\sigma$ ）が与えられている」→ $z$ （正規）。「標本から $s$ を計算する／ $\sigma$ が不明」→ $t$ （自由度 $n-1$ ）。問題文がどちらを与えているかで一意に決まります。 $n$ が大きいからと $\sigma$ 未知でも $z$ を使う近似は、2級では問題文の指示に従うのが安全（指示がなければ $\sigma$ 未知は $t$ ）。

4.5 数値例（σ未知）

ある成分の含有率を $n=9$ 個測ったら、標本平均 $\bar X=50.0$ 、不偏分散 $s^2=4.0$ （ $s=2.0$ ）だった。母平均の95%信頼区間は？

標準誤差： $s/\sqrt n=2.0/\sqrt 9=2.0/3\approx0.667$ 。
臨界値：自由度 $n-1=8$ の $t$ 分布の上側2.5%点 $t_{0.025,\,8}=2.306$ （ $t$ 分布表より）。
誤差の限界： $2.306\times0.667\approx1.54$ 。
信頼区間： $50.0\pm1.54=[48.46,\ 51.54]$ 。

もし同じ数値で $\sigma=2.0$ が既知なら臨界値は $z_{0.025}=1.96$ となり、区間は $50.0\pm1.96\times0.667=[48.69,\ 51.31]$ 。 $t$ を使う方（ $\sigma$ 未知）が広いことが確認できます。

5. 母比率の区間推定：正規近似を使う

母集団における「ある属性を持つ割合」 $p$ （支持率・不良率など）を区間推定します。

5.1 出発点：標本比率の標本分布

$n$ 個の標本のうち成功（該当）が $X$ 個なら、 $X\sim B(n,p)$ （二項分布）。標本比率 $\hat p=X/n$ は（標本平均・標本比率の標本分布（標準誤差））

$E[\hat p]=p,\qquad V[\hat p]=\frac{p(1-p)}{n}.$

$n$ が十分大きいとき、二項分布は正規分布で近似でき（中心極限定理、中心極限定理（CLT））：

Z=\frac{\hat p-p}{\sqrt{p(1-p)/n}}\ \dot\sim\ N(0,1).$$ （$\dot\sim$ は「近似的に従う」の意味。） #### 5.2 分母の $p$ を $\hat p$ で置き換える 標準誤差 $\sqrt{p(1-p)/n}$ には未知の $p$ が入っています。母平均の $\sigma$ 未知のときは $t$ 分布で厳密に処理しましたが、母比率では**標準誤差の $p$ を一致推定量 $\hat p$ で置き換える**近似を使います（$n$ が大きければ $\hat p\approx p$ なので近似誤差は小さい）。すると標準誤差は $\sqrt{\hat p(1-\hat p)/n}$ となり、$\sigma$ 既知の母平均とまったく同じ形（$z$ を使う）に持ち込めます： $$\boxed{\ \hat p\pm z_{\alpha/2}\sqrt{\frac{\hat p(1-\hat p)}{n}}\ }$$ **要するに**：母比率の信頼区間も「点推定値 $\hat p$ ± 臨界値 $z_{\alpha/2}$ × 標準誤差」の形。標準誤差の中の未知の $p$ を観測した $\hat p$ で埋めるのがポイント（これを **Wald 信頼区間** と呼びます）。 #### 5.3 適用条件（正規近似が使える目安） 正規近似は $n$ が大きく、$p$ が極端でない（0や1に近すぎない）ときに妥当です。実務の目安： $$n\hat p\ge5\quad\text{かつ}\quad n(1-\hat p)\ge5$$ （文献により $\ge10$ とする流儀もある ── **要最新確認**）。この条件が満たされないとき（$n$ が小さい・$\hat p$ が0や1に近い）は、二項分布の正確な信頼区間（Clopper–Pearson 法など）を使うべきですが、これは2級の範囲外です。 > ⚠️ 標準誤差の中身は **$\hat p(1-\hat p)$** であって $\hat p$ 単独ではない。$\hat p(1-\hat p)$ は $\hat p=0.5$ のとき最大（=0.25）になるため、**同じ $n$ でも比率が50%付近のとき区間が最も広く**なります。世論調査の「誤差±◯%」は最悪ケースの $\hat p=0.5$ で見積もることが多いのはこのため。 #### 5.4 数値例（母比率） 200人にアンケートし、70人が「賛成」と回答した。母比率（賛成率）の95%信頼区間は？ - 標本比率：$\hat p=70/200=0.35$。 - 適用条件：$n\hat p=200\times0.35=70\ge5$、$n(1-\hat p)=200\times0.65=130\ge5$。OK。 - 標準誤差：$\sqrt{\hat p(1-\hat p)/n}=\sqrt{0.35\times0.65/200}=\sqrt{0.0011375}\approx0.0337$。 - 臨界値：$z_{0.025}=1.96$。 - 誤差の限界：$1.96\times0.0337\approx0.066$。 - 信頼区間：$0.35\pm0.066=[0.284,\ 0.416]$。 「賛成率の95%信頼区間は約28.4%〜41.6%」と結論します。 --- ### 6. 母分散の区間推定：カイ二乗分布で非対称になる 母集団のばらつき（母分散 $\sigma^2$）そのものを区間推定します。**母集団が正規分布に従う**ことが前提です。 #### 6.1 出発点：不偏分散のカイ二乗分布 正規母集団 $N(\mu,\sigma^2)$ から標本を取ると、4.2の事実2より： $$W=\frac{(n-1)s^2}{\sigma^2}\sim\chi^2_{n-1}\quad(\text{自由度 }n-1\text{ のカイ二乗分布}).$$ **要するに**：不偏分散 $s^2$ を母分散 $\sigma^2$ で割って $(n-1)$ 倍した量が、自由度 $n-1$ のカイ二乗分布に従う。これを使って $\sigma^2$ を挟み込みます。 #### 6.2 区間の組み立て（非対称になる理由） カイ二乗分布は**左右非対称**（0以上の値しか取らず、右に裾を引く）。だから上側・下側の臨界値を別々に取ります。上側 $\alpha/2$ 点を $\chi^2_{\alpha/2,\,n-1}$、下側 $\alpha/2$ 点（=上側 $1-\alpha/2$ 点）を $\chi^2_{1-\alpha/2,\,n-1}$ として： $$P\!\left(\chi^2_{1-\alpha/2,\,n-1}\le W\le\chi^2_{\alpha/2,\,n-1}\right)=1-\alpha.$$ $W=\dfrac{(n-1)s^2}{\sigma^2}$ を代入し、$\sigma^2$ について解きます。各辺の逆数を取ると不等号の向きが反転する点に注意：

\chi^2_{1-\alpha/2,,n-1}\le\frac{(n-1)s^2}{\sigma^2}\le\chi^2_{\alpha/2,,n-1} ;\Longleftrightarrow; \frac{(n-1)s^2}{\chi^2_{\alpha/2,,n-1}}\le\sigma^2\le\frac{(n-1)s^2}{\chi^2_{1-\alpha/2,,n-1}}.