📊 対象級：準1級　|　重要度：B（標準）

指数分布・ガンマ分布・ベータ分布

要点（BLUF）

連続型の重要3分布をまとめて扱います。3行でいうと：

指数分布 $\mathrm{Exp}(\lambda)$ ：ポアソン過程で「次の事象が起きるまでの待ち時間」。連続分布で唯一の無記憶性を持つ。 $E[X]=1/\lambda,\ V[X]=1/\lambda^2$ 。
ガンマ分布 $\mathrm{Ga}(\alpha,\beta)$ ：独立な指数分布の和（ $\alpha$ 個分）。 $\alpha$ =形状、 $\beta$ =尺度。 $\chi^2$ 分布はその特殊ケース。
ベータ分布 $\mathrm{Beta}(a,b)$ ： $[0,1]$ 上の分布。割合・確率そのものをモデル化し、二項分布の共役事前分布かつ順序統計量の分布。

\boxed{\;f_{\mathrm{Exp}}(x)=\lambda e^{-\lambda x}\quad f_{\mathrm{Ga}}(x)=\frac{1}{\Gamma(\alpha)\beta^{\alpha}}x^{\alpha-1}e^{-x/\beta}\quad f_{\mathrm{Beta}}(x)=\frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1}\;}

（要するに）3つとも「ガンマ関数 $\Gamma$ 」を骨格に持つ親戚で、指数 ⊂ ガンマ、 $\chi^2$ ⊂ ガンマ、そしてガンマからベータが作れる、という階層関係にあります。

分布間の関係（全体地図）

指数・ガンマ・ベータ分布のパラメータ別の形

左：指数（率λ）は右下がり／中：ガンマ（形状k）はkで山が右へ／右：ベータ(a,b)はU字〜山型〜偏りと多彩。図は simulations/shisuu_gamma_beta_keijou.py で生成。

まず全体像を掴んでおくと、個々の証明が「地図のどこの話か」見失わずに済みます。

flowchart TD
    P["ポアソン過程<br/>（単位時間あたり λ 回）"] -->|"事象間の待ち時間"| E["指数分布 Exp(λ)<br/>= Ga(1, 1/λ)"]
    E -->|"独立な α 個の和<br/>（再生性）"| G["ガンマ分布 Ga(α, β)<br/>α 整数ならアーラン分布"]
    N["標準正規 N(0,1)"] -->|"2乗の和<br/>Z₁²+…+Zₙ²"| C["カイ二乗分布 χ²(n)<br/>= Ga(n/2, 2)"]
    G -->|"α=n/2, β=2"| C
    G -->|"X/(X+Y) を作る<br/>X,Y は独立ガンマ"| B["ベータ分布 Beta(a, b)<br/>[0,1] 上"]
    B -->|"a=b=1"| U["一様分布 U(0,1)"]
    B -->|"二項の共役事前 / 順序統計量"| BAYES["ベイズ推論・順序統計量"]

（要するに）指数分布は最も単純なガンマ分布（ $\alpha=1$ ）であり、カイ二乗分布もガンマ分布の特殊ケース（ $\alpha=n/2,\ \beta=2$ ）。ベータ分布は2つの独立なガンマから比を取ると現れます。すべての中心にガンマ関数があります。

1. 指数分布 $\mathrm{Exp}(\lambda)$

重要度はこの3分布の中で指数分布が最も高い（A寄り）。準1級では「無記憶性の証明」「待ち時間との対応」「中央値計算」が頻出です。

1.1 定義（PDF・CDF）

事象が単位時間あたり平均 $\lambda$ 回のペースでランダムに起こるとき、ある事象から次の事象までの待ち時間 $X$ が従う分布です。rate型（パラメータ $\lambda$ ）で書くと：

f(x)=\lambda e^{-\lambda x}\quad(x>0),\qquad F(x)=P(X\le x)=1-e^{-\lambda x}

生存関数（その時刻まで「まだ起きていない」確率）が指数の本体です：

\bar F(x)=P(X>x)=e^{-\lambda x}

（要するに） $\lambda$ が大きい＝事象が頻繁＝待ち時間は短い。CDF が $1-e^{-\lambda x}$ という形を覚えておけば、無記憶性も中央値も全部ここから出ます。

1.2 期待値 $E[X]=1/\lambda$ の導出

部分積分で計算します。各ステップに意味を添えます。

E[X]=\int_0^\infty x\cdot\lambda e^{-\lambda x}\,dx

部分積分 $\int u\,dv = uv-\int v\,du$ で、 $u=x,\ dv=\lambda e^{-\lambda x}dx$ （よって $v=-e^{-\lambda x}$ ）とおくと：

E[X]=\Big[-x e^{-\lambda x}\Big]_0^\infty+\int_0^\infty e^{-\lambda x}\,dx =0+\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^\infty=\frac{1}{\lambda}

（要するに）境界項 $-xe^{-\lambda x}$ は $x\to\infty$ で $0$ （指数が多項式に勝つ）、 $x=0$ でも $0$ 。残った積分が $1/\lambda$ 。平均待ち時間はレートの逆数という直観そのままです。

1.3 分散 $V[X]=1/\lambda^2$ の導出

まず $E[X^2]$ を同様に部分積分（または $\Gamma$ 関数）で：

E[X^2]=\int_0^\infty x^2\lambda e^{-\lambda x}\,dx=\frac{2}{\lambda^2}

よって

V[X]=E[X^2]-(E[X])^2=\frac{2}{\lambda^2}-\frac{1}{\lambda^2}=\frac{1}{\lambda^2}

（要するに）標準偏差 $=1/\lambda=$ 平均と等しい。指数分布は変動係数 CV $=\sigma/\mu=1$ が常に成り立つのが特徴です。

1.4 積率母関数（MGF）

M_X(t)=E[e^{tX}]=\int_0^\infty e^{tx}\lambda e^{-\lambda x}\,dx =\lambda\int_0^\infty e^{-(\lambda-t)x}\,dx=\frac{\lambda}{\lambda-t}\quad(t<\lambda)

（要するに） $t<\lambda$ でしか収束しません。この MGF はガンマ分布の MGF の $\alpha=1$ ケースで、後で「指数の和＝ガンマ」を MGF で示すときの部品になります。

1.5 無記憶性（memoryless property）の証明

指数分布の最重要性質。「すでに $s$ だけ待った」という情報が、その先の待ち時間の分布を一切変えません：

P(X>s+t \mid X>s)=P(X>t)\qquad(s,t>0)

証明：条件付き確率の定義から。 $\{X>s+t\}\subset\{X>s\}$ なので分子の同時事象は $\{X>s+t\}$ そのもの：

P(X>s+t\mid X>s) =\frac{P(X>s+t,\ X>s)}{P(X>s)} =\frac{P(X>s+t)}{P(X>s)} =\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}} =e^{-\lambda t}=P(X>t)

（要するに）生存関数が指数関数だから $e^{-\lambda(s+t)}/e^{-\lambda s}=e^{-\lambda t}$ と指数法則できれいに約分される。「電球が10年もった、では残り寿命は？→新品と同じ」という性質です。経年劣化を表せないのが裏返しの弱点。

逆も真：連続型分布で無記憶性を持つのは指数分布のみです。生存関数 $g(x)=P(X>x)$ が $g(s+t)=g(s)g(t)$ （コーシーの関数方程式の指数版）を満たし、単調かつ右連続なら $g(x)=e^{-\lambda x}$ に限られるため。

（要するに）「連続で無記憶 ⇒ 指数」は一意。離散版では幾何分布が唯一の無記憶分布で、指数分布はその連続極限です。

1.6 ポアソン過程との関係（待ち時間）

ポアソン分布と表裏一体です。単位時間あたり平均 $\lambda$ 回のポアソン過程を考えると：

区間 $[0,t]$ での事象回数 $N(t)\sim \mathrm{Poisson}(\lambda t)$
「時刻 $t$ までに1回も起きない」 $\iff$ 次事象までの待ち時間 $X>t$

これを使って指数分布の CDF が直接出ます：

P(X>t)=P(N(t)=0)=\frac{(\lambda t)^0 e^{-\lambda t}}{0!}=e^{-\lambda t}

（要するに）回数を数えればポアソン、間隔を測れば指数。同じ現象の2つの見方です。 $\lambda$ の意味（rate）が両者で共有されているのがポイント。

2. ガンマ分布 $\mathrm{Ga}(\alpha,\beta)$

準1級では「指数の和＝ガンマ」「再生性」「カイ二乗との対応」が問われます。パラメータ化の流派に注意（後述）。

2.1 ガンマ関数の準備

ガンマ分布の前に、正規化に使うガンマ関数を確認します：

\Gamma(\alpha)=\int_0^\infty t^{\alpha-1}e^{-t}\,dt\qquad(\alpha>0)

重要な性質：

$\Gamma(\alpha+1)=\alpha\,\Gamma(\alpha)$ （部分積分で出る漸化式）
$\Gamma(n)=(n-1)!$ （ $n$ が自然数のとき＝階乗の連続版）
$\Gamma(1/2)=\sqrt{\pi}$ （カイ二乗・正規との橋渡しで効く）

（要するに）ガンマ関数は階乗を実数に拡張したもの。これが分布の「分母（正規化定数）」になります。

2.2 定義（scale型のPDF）── 本ノートの採用流派

本ノートでは $\alpha$ =形状（shape）、 $\beta$ =尺度（scale）の scale型を主に使います：

f(x)=\frac{1}{\Gamma(\alpha)\,\beta^{\alpha}}\,x^{\alpha-1}e^{-x/\beta}\quad(x>0),\qquad \alpha>0,\ \beta>0

このとき：

E[X]=\alpha\beta,\qquad V[X]=\alpha\beta^2

指数分布との接続： $\alpha=1$ とおくと $\Gamma(1)=1$ なので $f(x)=\frac{1}{\beta}e^{-x/\beta}$ 、これは scale $=\beta=1/\lambda$ の指数分布そのもの。つまり

\mathrm{Exp}(\lambda)=\mathrm{Ga}\!\left(1,\ \tfrac{1}{\lambda}\right)

（要するに）形状 $\alpha$ が「指数を何個足したか」、尺度 $\beta$ が「1個あたりの平均待ち時間」。 $\alpha$ を整数に限ったガンマ分布がアーラン分布です。

2.3 期待値・分散の導出（scale型）

$n$ 次モーメントをガンマ関数で一気に出します。 $y=x/\beta$ と置換すると：

E[X^n]=\int_0^\infty x^n\frac{x^{\alpha-1}e^{-x/\beta}}{\Gamma(\alpha)\beta^\alpha}dx =\frac{\beta^n}{\Gamma(\alpha)}\int_0^\infty y^{\alpha+n-1}e^{-y}\,dy =\frac{\beta^n\,\Gamma(\alpha+n)}{\Gamma(\alpha)}

漸化式 $\Gamma(\alpha+1)=\alpha\Gamma(\alpha)$ を使って：

E[X]=\frac{\beta\,\Gamma(\alpha+1)}{\Gamma(\alpha)}=\alpha\beta,\qquad E[X^2]=\frac{\beta^2\,\Gamma(\alpha+2)}{\Gamma(\alpha)}=\alpha(\alpha+1)\beta^2

V[X]=\alpha(\alpha+1)\beta^2-(\alpha\beta)^2=\alpha\beta^2

（要するに）置換でガンマ関数の積分（値は $\Gamma(\alpha+n)$ ）に化け、漸化式で階乗的に展開されるだけ。 $\alpha=1$ を代入すれば指数分布の $E=\beta,\ V=\beta^2$ に戻ります。

2.4 「指数の和＝ガンマ」の証明（MGF）

主張： $X_1,\dots,X_\alpha$ が独立同分布で各 $X_i\sim\mathrm{Exp}(\lambda)=\mathrm{Ga}(1,1/\lambda)$ のとき、和 $S=\sum_{i=1}^{\alpha}X_i$ は $\mathrm{Ga}(\alpha,\,1/\lambda)$ に従う。

証明：MGF は独立なら積になる性質を使います。指数分布の MGF は §1.4 より $M_{X_i}(t)=\dfrac{\lambda}{\lambda-t}=\dfrac{1}{1-\beta t}$ （ $\beta=1/\lambda$ ）。よって

M_S(t)=\prod_{i=1}^{\alpha}M_{X_i}(t)=\left(\frac{1}{1-\beta t}\right)^{\alpha}=(1-\beta t)^{-\alpha}\quad(t<1/\beta)

一方、scale型ガンマ $\mathrm{Ga}(\alpha,\beta)$ の MGF を計算すると $\int_0^\infty e^{tx}f(x)dx=(1-\beta t)^{-\alpha}$ で一致。MGF が一致すれば分布が一致するので、 $S\sim\mathrm{Ga}(\alpha,\beta)$ 。∎

（要するに）独立な指数の和は MGF がべき乗になり、それがちょうどガンマの MGF。「待ち時間を $\alpha$ 個積み重ねた総時間」がガンマ分布、というポアソン過程の直観と一致します（ $\alpha$ 回目の事象までの待ち時間）。

2.5 再生性

ガンマ分布は尺度 $\beta$ が共通なら和について閉じています：

X\sim\mathrm{Ga}(\alpha_1,\beta),\ Y\sim\mathrm{Ga}(\alpha_2,\beta),\ \text{独立} \ \Longrightarrow\ X+Y\sim\mathrm{Ga}(\alpha_1+\alpha_2,\beta)

MGF で $(1-\beta t)^{-\alpha_1}\cdot(1-\beta t)^{-\alpha_2}=(1-\beta t)^{-(\alpha_1+\alpha_2)}$ から即座に出ます。

（要するに）形状パラメータが足し算される。§2.4 の「指数の和」はこの再生性の特殊例（ $\alpha_i=1$ を $\alpha$ 個）です。ただし $\beta$ が違うガンマ同士は再生性を持たない（後述の引っかけ）。

2.6 カイ二乗分布との関係

カイ二乗分布はガンマ分布の特殊ケースです（t分布・カイ二乗分布・F分布（標本分布の三役）へ接続）：

\chi^2(n)=\mathrm{Ga}\!\left(\frac{n}{2},\ 2\right)

scale型の PDF に $\alpha=n/2,\ \beta=2$ を代入すると、確かに自由度 $n$ のカイ二乗分布の PDF $\dfrac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}$ になります。これより：

$E[\chi^2(n)]=\alpha\beta=\frac{n}{2}\cdot 2=n$
$V[\chi^2(n)]=\alpha\beta^2=\frac{n}{2}\cdot 4=2n$

（要するに）カイ二乗の「平均＝自由度 $n$ 、分散＝ $2n$ 」はガンマの $\alpha\beta,\ \alpha\beta^2$ から自動的に出ます。標準正規 $Z\sim N(0,1)$ の2乗 $Z^2\sim\chi^2(1)=\mathrm{Ga}(1/2,2)$ という橋も覚えておくと、正規→カイ二乗→ガンマが一本の線でつながります。

3. ベータ分布 $\mathrm{Beta}(a,b)$

準1級では「ベイズの共役事前分布」「事後分布の計算」「順序統計量との関係」「期待値・分散の公式」が問われます。

3.1 定義（PDF・定義域）

$[0,1]$ 上の連続分布。 $a>0,\ b>0$ に対して：

f(x)=\frac{1}{B(a,b)}\,x^{a-1}(1-x)^{b-1}\quad(0<x<1)

ここで $B(a,b)$ はベータ関数で、ガンマ関数と次の関係を持ちます（これがガンマとベータの接続点）：

B(a,b)=\int_0^1 x^{a-1}(1-x)^{b-1}\,dx=\frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}

統計量は：

E[X]=\frac{a}{a+b},\qquad V[X]=\frac{ab}{(a+b)^2(a+b+1)}

（要するに） $x$ が確率や割合そのもの（0〜1の値）を取るときに使う分布。 $a=b=1$ なら一様分布 $U(0,1)$ 。 $a,b$ を動かすと左寄り・右寄り・U字・山型と自在に形が変わります。

3.2 期待値の導出

ベータ関数とガンマ関数の関係 $B(a,b)=\dfrac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}$ を使います：

E[X]=\int_0^1 x\cdot\frac{x^{a-1}(1-x)^{b-1}}{B(a,b)}dx =\frac{1}{B(a,b)}\int_0^1 x^{a}(1-x)^{b-1}dx =\frac{B(a+1,b)}{B(a,b)}

$B(a+1,b)=\dfrac{\Gamma(a+1)\Gamma(b)}{\Gamma(a+b+1)}$ と $\Gamma(a+1)=a\Gamma(a)$ を代入すると：

E[X]=\frac{\Gamma(a+1)\Gamma(b)/\Gamma(a+b+1)}{\Gamma(a)\Gamma(b)/\Gamma(a+b)} =\frac{a\,\Gamma(a)\,\Gamma(a+b)}{\Gamma(a)\,(a+b)\Gamma(a+b)}=\frac{a}{a+b}

（要するに）積分が「形状を1つずらしたベータ関数」になり、 $\Gamma$ の漸化式で約分すると $a/(a+b)$ 。「成功 $a$ 回・失敗 $b$ 回」の割合の期待値が $a/(a+b)$ と読めて直観的です。

3.3 用途その1：二項分布の共役事前分布（ベイズ）

ベータ分布の最重要用途。二項分布（コイン投げ等）の成功確率 $p$ の事前分布をベータ分布にすると、事後分布もベータ分布になる（共役性）。

成功確率 $p$ に事前分布 $p\sim\mathrm{Beta}(a,b)$ を置き、 $n$ 回中 $k$ 回成功（二項分布の尤度）を観測したとします。ベイズの定理（事後 $\propto$ 尤度 $\times$ 事前）より：

\pi(p\mid k)\ \propto\ \underbrace{p^{k}(1-p)^{n-k}}_{\text{尤度}}\cdot\underbrace{p^{a-1}(1-p)^{b-1}}_{\text{事前}} = p^{(a+k)-1}(1-p)^{(b+n-k)-1}

右辺は $\mathrm{Beta}(a+k,\ b+n-k)$ の核（カーネル）。よって：

p\mid \text{data}\ \sim\ \mathrm{Beta}(a+k,\ b+n-k)

（要するに）事前の $a,b$ に「成功数 $k$ 」「失敗数 $n-k$ 」をそのまま足すだけで事後分布が得られる。 $a,b$ は「観測前に仮想的に持っていた成功・失敗のカウント（擬似観測数）」と解釈できます。これがベータ＝二項の共役のうれしさで、ベイズ計算が紙の上で完結します。

3.4 用途その2：順序統計量の分布

互いに独立で一様分布 $U(0,1)$ に従う $n$ 個の標本を小さい順に並べたとき、第 $k$ 番目の順序統計量 $X_{(k)}$ は次に従います：

X_{(k)}\sim\mathrm{Beta}(k,\ n-k+1)

期待値は §3.2 より $E[X_{(k)}]=\dfrac{k}{n+1}$ 。

（要するに）一様乱数を $n$ 個ばらまいて $k$ 番目に小さい値の位置は、平均すると区間を $n+1$ 等分した $k$ 番目（ $k/(n+1)$ ）。ベータ分布が「順序・順位の理論」とつながる入口です。最小値は $\mathrm{Beta}(1,n)$ 、最大値は $\mathrm{Beta}(n,1)$ 。

4. 試験での問われ方（準1級）

トピック	典型的な問われ方
指数分布	無記憶性の証明・適用、中央値 $\ln 2/\lambda$ の計算、ポアソン過程の待ち時間としての対応
ガンマ分布	指数の和であることの証明（MGF）、 $E=\alpha\beta,\ V=\alpha\beta^2$ 、 $\chi^2(n)=\mathrm{Ga}(n/2,2)$ の対応
ベータ分布	ベイズ事後分布の計算（共役）、 $E=a/(a+b)$ 、順序統計量との対応、形状の解釈

出題範囲・配点の細部は年度で変わるため要最新確認。ワークブックの章立て（連続型分布・ベイズ法の章）では3分布がまとめて扱われる傾向があります。

5. 数式の直観的意味（まとめ）

指数の無記憶性：生存関数が $e^{-\lambda x}$ だから、条件付けても指数法則で「過去」が消える。連続分布で唯一。
指数の和＝ガンマ：MGF が $(1-\beta t)^{-\alpha}$ とべき乗になり、 $\alpha$ が「足した個数」。ポアソン過程の $\alpha$ 回目までの待ち時間。
ガンマ⊃カイ二乗： $\alpha=n/2,\ \beta=2$ を入れるだけ。だから $\chi^2$ の平均 $n$ ・分散 $2n$ はガンマの公式の特殊例。
ベータの共役性：尤度（二項）と事前（ベータ）が同じ $p^{\bullet}(1-p)^{\bullet}$ の形だから、指数部が足し算され事後もベータ。

⚠️ 引っかけポイント・頻出論点

無記憶性は「故障率一定」と同義。指数分布は経年劣化（時間が経つほど壊れやすい／壊れにくい）を表現できない。ワイブル分布など他分布が必要。「使い込んだ部品の残り寿命＝新品と同じ」は反直観なので狙われます。
ガンマのパラメータ化は2流派あり。混同が最大の落とし穴：
- scale型（本ノート）： $\mathrm{Ga}(\alpha,\beta)$ 、 $\beta$ =尺度、 $E=\alpha\beta$ 、PDF に $e^{-x/\beta}$ 。
- rate型： $\mathrm{Ga}(\alpha,\lambda)$ 、 $\lambda$ =率（ $=1/\beta$ ）、 $E=\alpha/\lambda$ 、PDF に $e^{-\lambda x}$ 。問題文・教科書がどちらの $\beta$ を指すか必ず確認。期待値が $\alpha\beta$ か $\alpha/\beta$ かで逆になります（要最新確認：使用テキストの定義に合わせること）。
カイ二乗との対応は $\beta=2$ の scale型でのみ $\mathrm{Ga}(n/2,2)$ 。rate型なら $\mathrm{Ga}(n/2,\,1/2)$ 。流派で形が変わる典型例。
ガンマの再生性は「尺度 $\beta$ が共通」が条件。 $\beta$ が異なるガンマの和はガンマにならない。指数で言えば「同じ $\lambda$ の指数の和」だけがきれいなガンマ（アーラン）になる。
ベータ分布の定義域は $[0,1]$ 。確率・割合のモデルであり、待ち時間（ $[0,\infty)$ ）には使えない。指数・ガンマと役割が全く違う。混同しないこと。
ベータの $a,b$ と二項の成功・失敗の対応：事後は $a\to a+k$ （成功）、 $b\to b+n-k$ （失敗）。 $a$ に総試行 $n$ を足すミスが頻出。

よくある疑問

Q1. 「無記憶性」って結局どういう状態を指すの？

A. **「これまでどれだけ待ったかが、これから先の待ち時間の分布に一切影響しない」**状態です。式で言えば $P(X>s+t\mid X>s)=P(X>t)$ 。バスがランダムに来る（時刻表なし）状況で「もう10分待った」という事実が「あと何分で来るか」の見込みを変えない、というイメージ。逆に時刻表どおりのバスは無記憶ではありません（待つほど到着が近づく）。連続分布でこの性質を持つのは指数分布だけです。

Q2. ガンマ分布の $\beta$ が、本によって「尺度」だったり「率」だったりするのはなぜ？

A. パラメータ化の流派が2つあるためで、数学的にはどちらも正しいです。scale型は $\beta$ =尺度（平均待ち時間の1個分、 $E=\alpha\beta$ ）、rate型は $\beta$ （または $\lambda$ ）=率（単位時間あたり頻度、 $E=\alpha/\beta$ ）。両者は互いに逆数 $\beta_{\text{scale}}=1/\lambda_{\text{rate}}$ 。Python の scipy.stats.gamma は scale 引数、R の dgamma は rate と scale の両方を受けるなど実装でも分かれます。試験では問題文の PDF の指数部（ $e^{-x/\beta}$ なら scale、 $e^{-\beta x}$ なら rate）で判別してください。

Q3. ベータ分布は何を表す分布だと思えばいい？

A. 「割合・確率そのもの」の分布です。指数・ガンマが「時間（ $0$ 以上の実数）」を表すのに対し、ベータは必ず $0$ 〜 $1$ の値を取ります。だから「コインの表が出る確率 $p$ がどれくらいか」「不良率がどの辺か」といった確率の確率を表現するのにぴったりで、ベイズ統計で二項分布の事前分布として多用されます。形状も $a,b$ 次第で一様・山型・U字・偏りと自在です。

Q4. なぜベータ分布が二項分布の「共役」事前分布になるの？

A. 尤度と事前が同じ関数形 $p^{\bullet}(1-p)^{\bullet}$ をしているからです。二項分布の尤度は $p^k(1-p)^{n-k}$ 、ベータ事前は $p^{a-1}(1-p)^{b-1}$ 。掛け合わせると指数部が足し算されて $p^{(a+k)-1}(1-p)^{(b+n-k)-1}$ となり、これは再びベータ分布の形。「事前と事後が同じ分布族に留まる」これが共役の定義で、計算が紙の上で閉じるのが利点です（数値積分が要らない）。

Q5. 指数・ガンマ・カイ二乗・ベータ、頭の中でどう整理すればいい？

A. **「ガンマ分布を親に置く」と整理できます。指数分布は $\alpha=1$ のガンマ、カイ二乗は $\alpha=n/2,\beta=2$ のガンマ。つまり指数とカイ二乗は同じ親（ガンマ）の兄弟です。さらに独立な2つのガンマ $X,Y$ から比 $X/(X+Y)$ を作るとベータ分布が現れる（→ F分布や順序統計量にもつながる）。だから「ガンマ関数を骨格に持つ一族」**として束ねるのが、暗記でなく理解で覚えるコツです。

まとめ

指数分布 $\mathrm{Exp}(\lambda)$ ：ポアソン過程の待ち時間。 $E=1/\lambda,\ V=1/\lambda^2$ 、CV $=1$ 。連続分布で唯一の無記憶性（証明は生存関数の指数法則）。
ガンマ分布 $\mathrm{Ga}(\alpha,\beta)$ ：独立な指数の和（ $\alpha$ 個）。 $E=\alpha\beta,\ V=\alpha\beta^2$ 。尺度共通で再生性。 $\chi^2(n)=\mathrm{Ga}(n/2,2)$ 。パラメータ化の流派（scale / rate）に最大注意。
ベータ分布 $\mathrm{Beta}(a,b)$ ： $[0,1]$ 上で割合をモデル化。 $E=a/(a+b)$ 。二項分布の共役事前分布（事後は $\mathrm{Beta}(a+k,b+n-k)$ ）、順序統計量 $X_{(k)}\sim\mathrm{Beta}(k,n-k+1)$ 。
3分布すべてガンマ関数を骨格に持つ親戚で、ガンマを中心に階層的につながっている。