📊 対象級：2級・準1級　|　重要度：A（頻出）

t分布・カイ二乗分布・F分布（標本分布の三役）

要点（BLUF）

この3分布は正規母集団から標本を取ったときに、検定統計量が従う分布です。すべて標準正規 $Z\sim N(0,1)$ $Z \sim N (0, 1)$ から組み立てられます。
- カイ二乗分布 $\chi^2_k$ ：標準正規を $k$ 個独立にとって2乗和したもの。 $\chi^2_k=Z_1^2+\cdots+Z_k^2$ 。自由度 $k$ ＝足した個数。分散・適合度・独立性の検定に使う。
- t分布 $t_k$ ：標準正規を「カイ二乗を自由度で割って平方根を取ったもの」で割る。 $\displaystyle t_k=\frac{Z}{\sqrt{\chi^2_k/k}}$ 。**母平均の検定（母分散 $\sigma^2$ 未知のとき）**に使う。
- F分布 $F_{k_1,k_2}$ ：独立な2つのカイ二乗を各々の自由度で割り、その比を取る。 $\displaystyle F_{k_1,k_2}=\frac{\chi^2_{k_1}/k_1}{\chi^2_{k_2}/k_2}$ 。分散比の検定・分散分析に使う。
要するに： $Z$ が「素材」。2乗和すると $\chi^2$ 、 $Z$ を $\sqrt{\chi^2/k}$ で割ると $t$ 、2つの $\chi^2$ の比が $F$ 。3つとも自由度というパラメータで形が決まります。
試験での要点：2級は分布表を読んで検定値と比較するところまで（定義は使える程度に）。準1級は3分布の定義・導出・相互関係・平均分散まで問われます。

本文

0. なぜ3つも分布が必要なのか（全体像）

統計の検定は「データから作った統計量が、帰無仮説のもとでどんな分布に従うか」を知って初めて成立します。正規母集団 $N(\mu,\sigma^2)$ から $n$ 個の標本 $X_1,\dots,X_n$ を取ったとき、何を推定・検定したいかで必要な分布が変わります。

知りたいこと	使う統計量	従う分布	主な検定
母分散 $\sigma^2$	$\dfrac{(n-1)S^2}{\sigma^2}$	$\chi^2_{n-1}$	母分散の検定、適合度、独立性
母平均 $\mu$ （ $\sigma$ 既知）	$\dfrac{\bar X-\mu}{\sigma/\sqrt n}$	$N(0,1)$	z検定
母平均 $\mu$ （ $\sigma$ 未知）	$\dfrac{\bar X-\mu}{S/\sqrt n}$	$t_{n-1}$	t検定
2つの母分散の比	$\dfrac{S_1^2}{S_2^2}$	$F_{n_1-1,\,n_2-1}$	等分散性の検定、分散分析

要するに、「分散を見たい→χ²」「平均を見たい（σ未知）→t」「分散を比べたい→F」。そしてこの3つは独立した発明ではなく、すべて標準正規 $Z$ から派生する一族です。下の関係図がこのノートの背骨になります。

graph TD
    Z["標準正規 Z ~ N(0,1)<br/>（すべての素材）"]
    Z -->|"k個を2乗して足す"| CHI["カイ二乗分布<br/>χ²_k = Z₁²+...+Z_k²"]
    Z -->|"Z を √(χ²/k) で割る"| T["t分布<br/>t_k = Z ÷ √(χ²_k/k)"]
    CHI -.->|"分母に使う"| T
    CHI -->|"2つの χ² の比 ÷ 自由度"| F["F分布<br/>F = (χ²₁/k₁) ÷ (χ²₂/k₂)"]
    GAMMA["ガンマ分布<br/>Γ(k/2, 1/2)"] -.->|"χ²はガンマの特別な場合"| CHI
    T -->|"自由度 k→∞"| Z
    T -.->|"t を2乗すると F(1,k)"| F

図の読み方：実線は「この変換で作る」、点線は「内部で使う／極限で一致する」関係。 $\chi^2$ は $t$ の分母にも $F$ の分子分母にも現れる「ハブ」です。

1. カイ二乗分布 $\chi^2_k$

1-1. 定義

$Z_1,Z_2,\dots,Z_k$ が独立に標準正規分布 $N(0,1)$ に従うとき、その2乗和

$\boxed{\;\chi^2_k = Z_1^2 + Z_2^2 + \cdots + Z_k^2\;}$

が従う分布を、自由度 $k$ のカイ二乗分布といいます。要するに「標準正規を $k$ 本そろえて、それぞれ2乗して足したもの」。2乗和なので必ず非負（ $\chi^2\ge0$ ）で、左に0という壁がある非対称な分布です。

1-2. PDF（準1級）

$f(x;k)=\frac{1}{2^{k/2}\,\Gamma(k/2)}\,x^{k/2-1}\,e^{-x/2}\qquad(x>0)$

これはガンマ分布 $\mathrm{Ga}(\text{形状}=k/2,\ \text{率}=1/2)$ そのものです（指数分布・ガンマ分布・ベータ分布）。要するに：カイ二乗分布はガンマ分布の特別な場合（形状 $\alpha=k/2$ 、率 $\lambda=1/2$ ）に過ぎません。だからガンマの性質（再生性・平均・分散）がそのまま流用できます。

1-3. 「 $Z^2$ が $\chi^2_1$ になる」ことの導出（準1級）

最小単位 $k=1$ 、つまり $Y=Z^2$ の分布が自由度1のカイ二乗になることを変数変換で示します（確率変数の変換・モーメント母関数・積率）。 $y>0$ に対し $Z=\pm\sqrt y$ の2つの枝があるので、累積分布関数から攻めます。

$F_Y(y)=P(Z^2\le y)=P(-\sqrt y\le Z\le \sqrt y)=2\!\int_0^{\sqrt y}\!\frac{1}{\sqrt{2\pi}}e^{-z^2/2}\,dz.$

両辺を $y$ で微分（ライプニッツ則、 $\frac{d}{dy}\sqrt y=\frac{1}{2\sqrt y}$ ）すると：

$f_Y(y)=2\cdot\frac{1}{\sqrt{2\pi}}e^{-y/2}\cdot\frac{1}{2\sqrt y}=\frac{1}{\sqrt{2\pi}}\,y^{-1/2}\,e^{-y/2}.$

$\Gamma(1/2)=\sqrt\pi$ を使うと $\frac{1}{\sqrt{2\pi}}=\frac{1}{2^{1/2}\Gamma(1/2)}$ なので、これは上のPDFで $k=1$ とした形にぴったり一致します。要するに：標準正規を1つ2乗しただけで、もう自由度1のカイ二乗が出来上がる。

1-4. 再生性で自由度が足し算される（準1級）

$\chi^2_k$ は「 $\chi^2_1$ を $k$ 個足したもの」です。独立なガンマ（同じ率）は形状が足し算される再生性を持つので、

$\chi^2_{k_1}+\chi^2_{k_2}\sim\chi^2_{k_1+k_2}\qquad(\text{独立なら})$

要するに：カイ二乗どうしを足すと自由度が足される。これが「2乗和の個数＝自由度」という直観の数理的裏付けです。

1-5. 平均・分散（準1級）

ガンマ分布 $\mathrm{Ga}(\alpha,\lambda)$ の平均は $\alpha/\lambda$ 、分散は $\alpha/\lambda^2$ 。 $\alpha=k/2,\ \lambda=1/2$ を代入して：

$\boxed{\;E[\chi^2_k]=k,\qquad V[\chi^2_k]=2k\;}$

別証（定義から直接）： $E[Z^2]=V[Z]=1$ なので $E[\chi^2_k]=\sum E[Z_i^2]=k$ 。また $V[Z^2]=E[Z^4]-(E[Z^2])^2=3-1=2$ （標準正規の4次モーメントは3）なので、独立和で $V[\chi^2_k]=\sum V[Z_i^2]=2k$ 。要するに：平均は自由度そのもの、分散はその2倍。

1-6. 自由度が形に与える効果（文章＋数値表）

カイ二乗分布：自由度kが大きいほど山が右へ動き対称に近づく

図は simulations/chi2_bunpu_keijou.py で生成。

$k=1,2$ ：原点付近で密度が無限大に発散・単調減少（右肩下がり）。
$k\ge3$ ：山ができ、ピーク（最頻値）は $k-2$ の位置。右に長い裾を引く非対称形。
$k$ が大きい：平均 $k$ のあたりに山が移り、左右対称に近づく。実際 $\chi^2_k$ は $k\to\infty$ で平均 $k$ ・分散 $2k$ の正規分布に近づきます（中心極限定理。2乗和は独立変数の和だから）。

代表的な上側確率の臨界値（試験の分布表で引く値の感覚）：

自由度 $k$	平均 $k$	上側5%点 $\chi^2_{0.05}(k)$	上側1%点 $\chi^2_{0.01}(k)$
1	1	3.84	6.63
5	5	11.07	15.09
10	10	18.31	23.21
20	20	31.41	37.57

自由度1の上側5%点 $3.84$ は $1.96^2$ に一致します（ $\chi^2_1=Z^2$ だから、 $P(\chi^2_1\ge1.96^2)=P(|Z|\ge1.96)=0.05$ ）。

1-7. なぜ「標本分散」がカイ二乗に化けるのか（準1級・最重要）

検定で実際に使うのは「 $Z$ を $k$ 個足す」形ではなく、標本分散 $S^2=\frac{1}{n-1}\sum(X_i-\bar X)^2$ です。正規母集団 $N(\mu,\sigma^2)$ からの標本に対し、

$\boxed{\;\frac{(n-1)S^2}{\sigma^2}=\frac{1}{\sigma^2}\sum_{i=1}^n (X_i-\bar X)^2\sim\chi^2_{n-1}\;}$

が成り立ちます。自由度が $n$ ではなく $n-1$ になるのが急所。導出の骨子（コクランの定理の特別な場合）：

恒等式 $\displaystyle\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}=\underbrace{\frac{(n-1)S^2}{\sigma^2}}_{?}+\underbrace{\left(\frac{\bar X-\mu}{\sigma/\sqrt n}\right)^2}_{=\,Z_{\bar X}^2}$ を考えます。

左辺は $\frac{X_i-\mu}{\sigma}\sim N(0,1)$ を $n$ 個2乗和したものなので $\chi^2_n$ （自由度 $n$ ）。
右辺第2項は標本平均を標準化した $Z_{\bar X}=\frac{\bar X-\mu}{\sigma/\sqrt n}\sim N(0,1)$ の2乗なので $\chi^2_1$ （自由度1）。
正規分布のもとでは標本平均 $\bar X$ と標本分散 $S^2$ は独立（正規母集団特有の性質）。よって右辺の2項も独立。
再生性は逆向きにも使える： $\chi^2_n=(?)+\chi^2_1$ で右の2項が独立なら、 $(?)$ は自由度 $n-1$ のカイ二乗でなければ自由度が合いません（ $n=(n-1)+1$ ）。

要するに：データの散らばり $\sum(X_i-\mu)^2$ （自由度 $n$ ）のうち、 $\bar X$ という1個の量を推定に使った分（自由度1）が引かれ、残り $n-1$ が分散の情報として $\chi^2_{n-1}$ になる。「平均を1つ推定したから自由度が1減る」── これが自由度 $n-1$ の正体です。

⚠️ ステップ3「 $\bar X$ と $S^2$ の独立」は正規分布だからこそ成り立つ特殊性質。一般の分布では成り立ちません。

1-8. 用途

母分散の検定・区間推定： $\frac{(n-1)S^2}{\sigma^2}\sim\chi^2_{n-1}$ を使う。
適合度検定（goodness of fit）：観測度数と期待度数のズレ $\sum\frac{(O_i-E_i)^2}{E_i}$ が近似的に $\chi^2$ 。
独立性の検定（分割表）：カイ二乗検定（適合度・独立性）。

2. t分布 $t_k$

2-1. 定義

$Z\sim N(0,1)$ と $W\sim\chi^2_k$ が独立のとき、

$\boxed{\;t_k=\frac{Z}{\sqrt{W/k}}=\frac{Z}{\sqrt{\chi^2_k/k}}\;}$

が従う分布を自由度 $k$ のt分布といいます。要するに「標準正規 $Z$ を、カイ二乗を自由度で割って平方根を取ったもの $\sqrt{\chi^2_k/k}$ で割る」。分母は「ばらつきの推定値（標準偏差の推定）」に対応します。

2-2. なぜこの形が「σ未知のときの母平均検定」になるのか（準1級・核心）

$\sigma$ が既知なら $\frac{\bar X-\mu}{\sigma/\sqrt n}\sim N(0,1)$ （正規分布表で検定できる）。しかし実際は $\sigma$ が分からないので、 $\sigma$ を標本標準偏差 $S$ で置き換えます。すると分布が正規からズレる。そのズレを正確に表すのがt分布です。