📊 対象級：2級・準1級　|　重要度：A（頻出）

第一種の過誤・第二種の過誤・検出力（2種類の誤りとトレードオフ・サンプルサイズ設計）

要点（BLUF）

仮説検定は「真実」と「判断」の食い違いで2種類の誤りを犯しうる。真実（ $H_0$ が真／ $H_1$ が真）と判断（棄却／非棄却）を掛け合わせた 2×2の表が出発点です。

	$H_0$ を棄却（差ありと判断）	$H_0$ を非棄却（差なしと判断）
$H_0$ が真（本当は差なし）	第一種の過誤確率 $\alpha$ （あわてんぼう）	正しい判断確率 $1-\alpha$
$H_1$ が真（本当は差あり）	正しい判断＝検出力確率 $1-\beta$	第二種の過誤確率 $\beta$ （ぼんやり）

第一種の過誤 $\alpha$ ： $H_0$ が真なのに棄却してしまう（無い差を「ある」と言う）。確率は有意水準 $\alpha$ そのもの。
第二種の過誤 $\beta$ ： $H_1$ が真なのに棄却できない（有る差を見逃す）。
検出力（power） $1-\beta$ ： $H_1$ が真のとき正しく棄却できる確率。「有る差をちゃんと検出する力」。
最重要のトレードオフ：棄却域を広げると $\alpha\uparrow$ かつ $\beta\downarrow$ 、狭めるとその逆。 $\alpha$ と $\beta$ を同時に下げる唯一の方法は標本サイズ $n$ を増やすこと。
検出力 $1-\beta$ を上げる4要因：効果量 $|\mu_1-\mu_0|$ が大・ $n$ が大・ $\alpha$ が大・ $\sigma$ が小。準1級では目標検出力（例 $0.8$ ）から必要 $n$ を逆算します。

本文

1. 仮説検定は必ず誤りうる：2×2の枠組み

仮説検定（仮説検定の枠組み（帰無仮説・対立仮説・p値・有意水準））は、標本という有限の偶然の産物から母集団について白黒つける手続きです。標本はばらつくので、正しい手続きを踏んでも一定確率で結論を間違えます。間違い方は真実と判断の組み合わせで4通り、うち誤りは2種類です。

graph TD
    R["検定の結論を出す"] --> H0T["真実：H0が真<br/>（本当は差なし）"]
    R --> H1T["真実：H1が真<br/>（本当は差あり）"]
    H0T --> A1["H0を棄却 → 第一種過誤 α<br/>無い差を『ある』と誤認"]
    H0T --> A2["H0を非棄却 → 正解 1−α"]
    H1T --> B1["H0を棄却 → 正解＝検出力 1−β"]
    H1T --> B2["H0を非棄却 → 第二種過誤 β<br/>有る差を見逃す"]
    style A1 fill:#ffe0e0
    style B2 fill:#fff0d0
    style B1 fill:#e0ffe0

赤＝第一種の過誤（あわてて誤検出）、黄＝第二種の過誤（ぼんやり見逃し）、緑＝検出力（正しく検出）。
真実は1列（ $H_0$ 真なら左列、 $H_1$ 真なら右列）しか起きていない点に注意。 $\alpha$ は「 $H_0$ が真という前提のもとでの」棄却確率、 $\beta$ は「 $H_1$ が真という前提のもとでの」非棄却確率で、条件付き確率です。だから $\alpha$ と $\beta$ は足して1にはなりません（別々の前提のもとの確率）。各列の中でだけ和が1になります（ $\alpha+(1-\alpha)=1$ 、 $\beta+(1-\beta)=1$ ）。

📊 級差：2級は上の2×2の表・ $\alpha,\beta$ の定義・トレードオフ・検出力の概念まで（4節まで）。準1級は検出力の計算・効果量・サンプルサイズ設計まで（5〜7節）。迷ったら本文の節冒頭の注記に従ってください。

2. 第一種の過誤 $\alpha$ ：あわてんぼうの誤り

定義：第一種の過誤（Type I error） とは、帰無仮説 $H_0$ が真であるのに棄却してしまうこと。その確率を $\alpha$ と書く。 $\boxed{\,\alpha=P(\text{$H_0$ を棄却}\mid \text{$H_0$ が真})\,}$

要するに：「本当は差が無い」のに「差がある」と早とちりする誤り。無実の人を有罪にするタイプのミスです。

この $\alpha$ は検定の有意水準そのものです。検定では「 $H_0$ が真なら検定統計量がこの値より極端になる確率は $\alpha$ 以下」となるように棄却域を決めます。つまり $\alpha$ はこちらが事前に設定するもので、慣例は $0.05$ や $0.01$ 。設定した瞬間に第一種の過誤の確率が決まる、というのが検定の設計思想です。

⚠️ $\alpha$ は「 $H_0$ が真」という前提つきの確率。実際に $H_0$ が真かどうかは分からないまま、「もし真なら誤って棄却する確率はこれだけに抑える」と宣言しているだけです。 $\alpha=0.05$ は「 $H_0$ が真の世界を100回検定したら平均5回は誤って棄却する」という意味で、「いま手元の結論が95%正しい」ではありません（後者は事後確率でベイズの領域）。

3. 第二種の過誤 $\beta$ と検出力 $1-\beta$ ：ぼんやりの誤りとその裏返し

定義：第二種の過誤（Type II error） とは、対立仮説 $H_1$ が真であるのに $H_0$ を棄却しないこと。その確率を $\beta$ と書く。 $\boxed{\,\beta=P(\text{$H_0$ を非棄却}\mid \text{$H_1$ が真})\,}$ 検出力（power） はその裏返しで、 $H_1$ が真のとき正しく棄却できる確率： $\boxed{\,\text{検出力}=1-\beta=P(\text{$H_0$ を棄却}\mid \text{$H_1$ が真})\,}$

要するに： $\beta$ は「本当は差があるのに見逃す」誤り（真犯人を無罪放免にするミス）。検出力 $1-\beta$ はその逆で「有る差をちゃんと拾える力」。検定の感度（センサーの鋭さ）に当たります。

$\alpha$ と決定的に違うのは、 $\beta$ は1つの数に決まらない点です。 $\beta$ を計算するには「 $H_1$ が真」だけでは足りず、 $H_1$ の中の具体的な値（例：母平均が $\mu_0$ ではなく $\mu_1=\mu_0+3$ ）を指定しないといけません。差が大きいほど見逃しにくく $\beta$ は小さくなる。だから**検出力は「対立値 $\mu_1$ の関数」**であり、これを描いたものが検出力曲線（5.3）です。

graph LR
    A["α（有意水準）"] -->|事前に設定する1つの値| A2["検定の設計で決まる"]
    B["β・検出力1−β"] -->|対立値 μ₁ に依存する関数| B2["μ₁ を決めて初めて計算できる"]
    style A fill:#ffe0e0
    style B fill:#e0ffe0

4. $\alpha$ と $\beta$ のトレードオフ：片方を下げると片方が上がる

過誤の重なりと検出力曲線

左：H0/H1 の重なり（青=α、赤=β、棄却点 c=1.645）。c を動かすと α と β はトレードオフ。右：検出力曲線（効果0で 0.05、効果が増すと S字で1へ）。図は simulations/kago_kasanari_kenshutsuryoku.py で生成。

ここが本トピックの心臓です。第一種の過誤と第二種の過誤は同時には下げられない（ $n$ を固定する限り）。

4.1 なぜトレードオフが起きるのか（重なる2分布で考える）

母平均の検定（母平均の検定（1標本・2標本t検定））を例に、検定統計量（ここでは標本平均 $\bar X$ ）の分布を2つ描きます。

$H_0$ の分布： $H_0$ が真（母平均 $=\mu_0$ ）のときの $\bar X$ の分布。中心 $\mu_0$ 。
$H_1$ の分布：対立値（母平均 $=\mu_1>\mu_0$ ）が真のときの $\bar X$ の分布。中心 $\mu_1$ 。

両分布は標準誤差 $\sigma/\sqrt n$ の幅を持ち、 $\mu_0$ と $\mu_1$ が近ければ裾が重なります。棄却域の境目（臨界値） $c$ を1本引くと、面積が次のように対応します（右片側検定の場合）。

面積	どちらの分布	領域	意味
$\alpha$	$H_0$ の分布	$c$ より右	$H_0$ 真なのに棄却＝第一種過誤
$\beta$	$H_1$ の分布	$c$ より左	$H_1$ 真なのに非棄却＝第二種過誤
$1-\beta$	$H_1$ の分布	$c$ より右	$H_1$ 真で正しく棄却＝検出力

臨界値 $c$ を1本の同じ線で共有しているのがポイント。だから $c$ を動かすと両方が連動します。

graph TD
    C["臨界値 c を右へ動かす<br/>（棄却域を狭める）"] --> A["H0分布の右側面積↓<br/>→ α 減る"]
    C --> B["H1分布の左側面積↑<br/>→ β 増える（検出力↓）"]
    D["臨界値 c を左へ動かす<br/>（棄却域を広げる）"] --> A2["α 増える"]
    D --> B2["β 減る（検出力↑）"]
    style A fill:#e0ffe0
    style B fill:#ffe0e0
    style A2 fill:#ffe0e0
    style B2 fill:#e0ffe0

要するに：臨界値という1本の仕切りを右へ動かせば $H_0$ 分布の右裾（ $\alpha$ ）は痩せるが、同じ線の左側に入る $H_1$ 分布の面積（ $\beta$ ）は太る。1本の線で2つの分布を仕切っているから、片方を減らせば必然的に片方が増える ── これがトレードオフの正体です。

4.2 トレードオフを式で確認（右片側・ $\sigma$ 既知）

母分散 $\sigma^2$ 既知、 $H_0:\mu=\mu_0$ vs $H_1:\mu=\mu_1\ (>\mu_0)$ 、 $\bar X$ を統計量とする右片側検定で確認します。 $\bar X$ の標準誤差は $\sigma/\sqrt n$ （標本平均・標本比率の標本分布（標準誤差））。

臨界値は、 $H_0$ のもとで右側確率が $\alpha$ になる点。 $\bar X\sim N(\mu_0,\ \sigma^2/n)$ （正規分布（標準正規・標準化））なので、 $z_\alpha$ を標準正規分布の上側 $\alpha$ 点（ $P(Z>z_\alpha)=\alpha$ ）として

$c=\mu_0+z_\alpha\frac{\sigma}{\sqrt n}.\qquad(\text{棄却域は }\bar X>c)$

第一種過誤：定義どおり $P(\bar X>c\mid \mu=\mu_0)=\alpha$ （ $c$ をそう決めたので当然）。

検出力： $H_1$ （ $\mu=\mu_1$ ）が真なら $\bar X\sim N(\mu_1,\ \sigma^2/n)$ 。棄却域 $\bar X>c$ に入る確率が検出力です。 $\bar X$ を標準化して

1-\beta=P(\bar X>c\mid \mu=\mu_1) =P\!\left(Z>\frac{c-\mu_1}{\sigma/\sqrt n}\right).

ここに $c=\mu_0+z_\alpha\,\sigma/\sqrt n$ を代入すると、

\frac{c-\mu_1}{\sigma/\sqrt n} =\frac{\mu_0-\mu_1}{\sigma/\sqrt n}+z_\alpha =z_\alpha-\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}.

よって（ $\Phi$ を標準正規分布の累積分布関数とし、 $P(Z>x)=1-\Phi(x)=\Phi(-x)$ を使うと）

$\boxed{\,1-\beta=\Phi\!\left(\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}-z_\alpha\right)\,}$

要するに：検出力は $\Phi$ （増加関数）の中身が大きいほど大きい。中身は $(\mu_1-\mu_0)$ （効果）と $\sqrt n$ に比例し、 $\sigma$ に反比例し、 $z_\alpha$ を引く形になっている。この1本の式に、検出力を動かす全要因が詰まっています（次節で要因分解）。

⚠️ $\beta=\Phi\!\big(z_\alpha-\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}\big)$ で、 $1-\beta$ とは符号が逆。「 $\beta$ と検出力どちらを問われているか」を必ず確認。検出力＝棄却域側（ $H_1$ 分布の右裾）、 $\beta$ ＝非棄却側（ $H_1$ 分布の左裾）です。

5. 検出力を上げる4要因（準1級）

ここからは主に準1級。2級では「効果量が大きいほど・ $n$ が大きいほど検出力が上がる」という方向感までで十分です。

4.2の検出力の式 $1-\beta=\Phi\!\left(\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}-z_\alpha\right)$ から、 $\Phi$ は増加関数なので「中身が大きくなる操作はすべて検出力を上げる」。中身を見れば4要因が読めます。

5.1 効果量 $|\mu_1-\mu_0|$ が大きいほど（分子↑）

真の差 $\mu_1-\mu_0$ が大きいほど中身が大きく、検出力が上がる。標準化した差

$d=\frac{|\mu_1-\mu_0|}{\sigma}$

を 効果量（effect size） と呼びます（コーエンの $d$ ）。 $\sigma$ を単位にした差の大きさで、単位に依らない指標。要するに：差が大きい（＝2分布が大きく離れている）ほど見逃しにくい。当然のことを式が裏づけています。

5.2 標本サイズ $n$ が大きいほど（分子に $\sqrt n$ ）

$n$ を増やすと中身が $\sqrt n$ に比例して増え、検出力が上がる。理由は標準誤差 $\sigma/\sqrt n$ が縮み、2つの分布が痩せて重なりが減るから（同じ $\mu_0,\mu_1$ でも分布が細くなれば臨界値の右側に $H_1$ 分布がより多く入る）。要するに：データを増やせば小さな差でも検出できる。検出力を上げる最も実務的なレバーです。

5.3 有意水準 $\alpha$ が大きいほど（ $z_\alpha$ ↓）

$\alpha$ を大きくすると上側 $\alpha$ 点 $z_\alpha$ が小さくなり、 $-z_\alpha$ が大きくなって検出力が上がる。これは4節のトレードオフそのもの：棄却域を広げる（ $\alpha\uparrow$ ）と $\beta\downarrow$ （検出力↑）。要するに：誤検出を許すほど見逃しは減る。ただし $\alpha$ を上げるのは第一種過誤を増やす代償つきで、タダで検出力を買えるわけではありません。

5.4 母標準偏差 $\sigma$ が小さいほど（分母↓）

$\sigma$ が小さいほど中身（ $\propto 1/\sigma$ ）が大きく検出力が上がる。母集団のばらつきが小さい＝分布が細い＝重なりが少ない。要するに：もともとブレが小さい現象は小さな差でも検出しやすい。 $\sigma$ は普通こちらで操作できないので、実務で動かすのは主に $n$ と $\alpha$ 、そして設計段階で見込む効果量です。

5.5 検出力曲線

検出力は対立値 $\mu_1$ （または効果量 $d$ ）の関数。横軸に $\mu_1$ 、縦軸に検出力を取った曲線が 検出力曲線（power curve） です。式から形が読めます：

$\mu_1=\mu_0$ （差なし、効果量0）のとき中身は $-z_\alpha$ なので検出力 $=\Phi(-z_\alpha)=\alpha$ 。真に差が無いとき、検出力は $\alpha$ に一致します（このとき棄却＝第一種過誤なので当然）。
$\mu_1$ が $\mu_0$ から離れるほど検出力は単調に増加し、 $1$ に漸近する。
$n$ を大きくすると曲線全体が急峻になる（小さな差でも素早く検出力が1へ立ち上がる）。

$\mu_1$ の位置	検出力 $1-\beta$
$\mu_1=\mu_0$ （差なし）	$\alpha$ （最小。例 $0.05$ ）
$\mu_1$ がやや離れる	$\alpha$ から増加
$\mu_1$ が大きく離れる	$1$ に漸近

要するに：検出力は「1つの値」ではなく、想定する差 $\mu_1$ ごとに決まる曲線。差が無ければ $\alpha$ から始まり、差が開くほど $1$ へ近づきます。

6. サンプルサイズ設計：目標検出力から必要 $n$ を逆算（準1級）

準1級の頻出。「検出したい効果量 $\Delta$ 」と「目標検出力（例 $0.8$ ）」を決めて、必要な標本サイズ $n$ を求めます。

6.1 4因子は「3つ決めれば1つ決まる」

検定の設計には4つの因子があり、3つを固定すると残り1つが決まる関係にあります：

有意水準 $\alpha$
検出力 $1-\beta$
効果量 $d=|\mu_1-\mu_0|/\sigma$ （または検出したい差 $\Delta=\mu_1-\mu_0$ と $\sigma$ ）
標本サイズ $n$

実験計画では「 $\alpha=0.05$ 、検出力 $0.8$ 、見込む効果量 $d$ 」を決めて $n$ を逆算するのが定石です。

6.2 サンプルサイズ式の導出

4.2の検出力の式で、目標検出力を $1-\beta$ にしたい。 $z_\beta$ を上側 $\beta$ 点（ $\Phi(z_{1-\beta})=1-\beta$ すなわち中身 $=z_{1-\beta}=-z_\beta$ … ここで $z_\beta$ は $P(Z>z_\beta)=\beta$ の上側点）とします。検出力の式

$1-\beta=\Phi\!\left(\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}-z_\alpha\right)$

が成り立つには、 $\Phi$ の中身が $1-\beta$ 点に等しければよい。 $\Phi^{-1}(1-\beta)=z_\beta$ （対称性 $\Phi^{-1}(1-\beta)=-\Phi^{-1}(\beta)=z_\beta$ ）なので

$\frac{(\mu_1-\mu_0)\sqrt n}{\sigma}-z_\alpha=z_\beta.$

$\Delta=\mu_1-\mu_0$ と置いて $\sqrt n$ について解くと

第一種の過誤・第二種の過誤・検出力（2種類の誤りとトレードオフ・サンプルサイズ設計）

要点（BLUF）

本文

1. 仮説検定は必ず誤りうる：2×2の枠組み

2. 第一種の過誤 α\alphaα：あわてんぼうの誤り

3. 第二種の過誤 β\betaβ と検出力 1−β1-\beta1−β：ぼんやりの誤りとその裏返し

4. α\alphaα と β\betaβ のトレードオフ：片方を下げると片方が上がる