← 統計検定テキスト 一覧

📊 対象級:2級 ・ 準1級 | 重要度:A(頻出)

ポアソン分布

要点(BLUF)

本文

0. ポアソン分布が活躍する場面

ポアソン分布が当てはまるのは、次のような状況です。

共通点は「起こる確率は低いが、機会(試行)は非常に多い」こと。1回あたりの確率 pp は小さくても、機会 nn が多いので「起きた回数」はそれなりにばらつきます。この「回数」を表すのがポアソン分布です。

二項分布との関係(おさらい)ベルヌーイ分布・二項分布(二項分布)は「成功確率 pp の試行を nn 回くりかえした成功回数」でした。ポアソン分布は、その特別な極限です。

「1日に何人来店するか」を考えるとき、「1日の中に試行が何回あるか(nn)」「1回あたり来店確率はいくつか(pp)」を分けて考えるのは不自然ですよね。nnpp をまとめて「平均 λ\lambda」1つにしたのがポアソン分布、と捉えると腑に落ちます。

1. ポアソン分布とは ── 稀な事象の回数

適用条件:起こる確率 pp は小さいが、機会(試行)nn は非常に多い。「平均は分かるが個々はランダム」な計数データ。例:1日の交通事故件数、1時間の来客数、製品1000個あたりの不良品数、単位面積あたりの粒子数。

二項分布 ベルヌーイ分布・二項分布 が「nn 回中 kk 回成功」だったのに対し、ポアソンは n,pn,p を個別に意識せず平均 λ=np\lambda=np の1パラメータだけで考える。kk に上限がない(回数はいくらでも大きくなれる)のも二項との違い。「来客数」に理論上の上限がないのと同じです。

PMF:

P(X=k)=λkeλk!(k=0,1,2,).P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}\qquad(k=0,1,2,\dots).

総和=1の確認(指数関数のテイラー展開):

k=0λkeλk!=eλk=0λkk!=eλeλ=1.\sum_{k=0}^{\infty}\frac{\lambda^k e^{-\lambda}}{k!}=e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}=e^{-\lambda}\cdot e^{\lambda}=1.

kλk/k!=eλ\sum_k \lambda^k/k!=e^\lambdaex=kxk/k!e^x=\sum_k x^k/k! そのもの。eλe^{-\lambda} は合計を1にする調整役(PMFに eλe^{-\lambda} が付く理由)。

2. 二項分布からの極限導出(山場・準1級)

ポアソン分布の式は天下りに見えますが、二項分布から自然に導けます

主張Bin(n,p)\mathrm{Bin}(n,p)p=λ/np=\lambda/nλ=np\lambda=np 一定)として nn\to\infty にすると P(X=k)λkeλk!P(X=k)\to\dfrac{\lambda^k e^{-\lambda}}{k!}。これをポアソンの少数の法則(law of rare events)と呼びます。

二項PMFに p=λ/np=\lambda/n を代入:

P(X=k)=n!k!(nk)!(λn)k(1λn)nk.P(X=k)=\frac{n!}{k!\,(n-k)!}\left(\frac{\lambda}{n}\right)^{k}\left(1-\frac{\lambda}{n}\right)^{n-k}.

kk 固定で nn\to\infty を取るため4つに分解(λ/n)k=λk/nk(\lambda/n)^k=\lambda^k/n^k を A と B に分け、(1λ/n)nk(1-\lambda/n)^{n-k} を指数 nnk-k に分けて C・D に):

P(X=k)=λkk!(A)n!(nk)!nk(B)(1λn)n(C)(1λn)k(D).P(X=k)=\underbrace{\frac{\lambda^k}{k!}}_{(A)}\cdot\underbrace{\frac{n!}{(n-k)!\,n^k}}_{(B)}\cdot\underbrace{\left(1-\frac{\lambda}{n}\right)^{n}}_{(C)}\cdot\underbrace{\left(1-\frac{\lambda}{n}\right)^{-k}}_{(D)}.

掛けて

P(X=k)λkk!1eλ1=λkeλk!.P(X=k)\to\frac{\lambda^k}{k!}\cdot1\cdot e^{-\lambda}\cdot1=\frac{\lambda^k e^{-\lambda}}{k!}.\qquad\blacksquare

何が起きたか(核心):二項分布の3パーツ(組合せ・pkp^k(1p)nk(1-p)^{n-k})のうち、組合せの「巨大な n!n! 部分」が (B) で1に潰れ、(1p)nk(1-p)^{n-k} の主要部が (C) で eλe^{-\lambda} になり、残った λk/k!\lambda^k/k! と合体してポアソンPMFになります。eλe^{-\lambda}(1λ/n)neλ(1-\lambda/n)^n\to e^{-\lambda} から来ている、というのがこの導出の核心です。ベルヌーイ分布・二項分布 で「pp が小さく稀な事象なら二項はポアソンで近似できる」と書いた、その近似先がこれです。

3. 期待値・分散:どちらも λ

E[X]=λ,V[X]=λ\boxed{\,E[X]=\lambda,\qquad V[X]=\lambda\,}

平均も分散も λ\lambda で等しい。これがポアソン分布の指紋です。

導出(1):二項の極限から(最速・一番速い理解)

二項分布では E[X]=npE[X]=npV[X]=np(1p)V[X]=np(1-p) でした(ベルヌーイ分布・二項分布)。p=λ/np=\lambda/n を入れて nn\to\infty にすると、

E[X]=np=nλn=λ,V[X]=np(1p)=λ(1λn)nλ.E[X]=np=n\cdot\frac{\lambda}{n}=\lambda,\qquad V[X]=np(1-p)=\lambda\Big(1-\frac{\lambda}{n}\Big)\xrightarrow[n\to\infty]{}\lambda.

要するに「二項の分散 np(1p)np(1-p)(1p)(1-p) が、p0p\to011 になるから、分散が平均 λ\lambda と同じになる」。これがポアソンで平均と分散が一致する最も直観的な理由です。

導出(2):MGF(積率母関数)から(確率変数の変換・モーメント母関数・積率

確率変数の変換・モーメント母関数・積率 のMGFを使うと、高次モーメントもまとめて出せます。ポアソン分布のMGFは

MX(t)=E[etX]=eλ(et1).\boxed{\,M_X(t)=E[e^{tX}]=e^{\lambda(e^t-1)}\,}.

MGFの導出:定義に従って計算します。

MX(t)=k=0etkλkeλk!=eλk=0(λet)kk!.M_X(t)=\sum_{k=0}^{\infty}e^{tk}\cdot\frac{\lambda^k e^{-\lambda}}{k!} =e^{-\lambda}\sum_{k=0}^{\infty}\frac{(\lambda e^t)^k}{k!}.

ここで etkλk=(λet)ke^{tk}\lambda^k=(\lambda e^t)^k とまとめました。和の部分は再びテイラー展開 kxk/k!=ex\sum_k x^k/k!=e^xx=λetx=\lambda e^t を入れた形なので k(λet)k/k!=eλet\sum_k (\lambda e^t)^k/k!=e^{\lambda e^t}。したがって

MX(t)=eλeλet=eλetλ=eλ(et1).M_X(t)=e^{-\lambda}\cdot e^{\lambda e^t}=e^{\lambda e^t-\lambda}=e^{\lambda(e^t-1)}.

要するに「確率の合計が1になったのと同じテイラー展開のトリックを、λ\lambda の代わりに λet\lambda e^t で使っただけ」。

MGFから E[X]E[X](1階微分、t=0t=0:合成関数の微分で ddteλ(et1)=eλ(et1)λet\dfrac{d}{dt}e^{\lambda(e^t-1)}=e^{\lambda(e^t-1)}\cdot\lambda e^t

MX(t)=λeteλ(et1),E[X]=MX(0)=λ1e0=λ.M_X'(t)=\lambda e^t\, e^{\lambda(e^t-1)},\qquad E[X]=M_X'(0)=\lambda\cdot1\cdot e^{0}=\lambda.

MGFから E[X2]E[X^2](2階微分、t=0t=0:積の微分で

MX(t)=λeteλ(et1)+λetλeteλ(et1)=(λet+λ2e2t)eλ(et1).M_X''(t)=\lambda e^t\,e^{\lambda(e^t-1)}+\lambda e^t\cdot\lambda e^t\,e^{\lambda(e^t-1)} =\big(\lambda e^t+\lambda^2 e^{2t}\big)e^{\lambda(e^t-1)}.

t=0t=0 を代入して E[X2]=MX(0)=λ+λ2E[X^2]=M_X''(0)=\lambda+\lambda^2。よって分散は

V[X]=E[X2](E[X])2=(λ+λ2)λ2=λ. V[X]=E[X^2]-(E[X])^2=(\lambda+\lambda^2)-\lambda^2=\lambda.\ \checkmark

2通り(二項の極限・MGF)が同じ E=V=λE=V=\lambda に到達します。導出(1)は速く、導出(2)は歪度・尖度まで同じ枠組みで出せます(ポアソンの歪度は 1/λ1/\sqrt{\lambda}λ\lambda が大きいほど0に近づき対称化 ── これが正規近似の前触れ)。

4. 再生性(足し算しても同じ仲間)

独立な XPoisson(λ1)X\sim\mathrm{Poisson}(\lambda_1)YPoisson(λ2)Y\sim\mathrm{Poisson}(\lambda_2) の和は X+YPoisson(λ1+λ2)X+Y\sim\mathrm{Poisson}(\lambda_1+\lambda_2) になります。これを**再生性(加法性)**と呼びます。準1級で出題実績があります。

直観:A店に平均 λ1\lambda_1 人、B店に平均 λ2\lambda_2 人来るなら、2店合計の来客数は平均 λ1+λ2\lambda_1+\lambda_2 人のポアソン分布。当たり前に聞こえますが、これがきちんと成り立つのがポアソンの便利なところです。

MGFで証明確率変数の変換・モーメント母関数・積率、独立和のMGFは各MGFの積):

MX+Y(t)=MX(t)MY(t)=eλ1(et1)eλ2(et1)=e(λ1+λ2)(et1).M_{X+Y}(t)=M_X(t)\,M_Y(t)=e^{\lambda_1(e^t-1)}\cdot e^{\lambda_2(e^t-1)} =e^{(\lambda_1+\lambda_2)(e^t-1)}.

これは Poisson(λ1+λ2)\mathrm{Poisson}(\lambda_1+\lambda_2) のMGFそのもの。MGFの一意性より X+YPoisson(λ1+λ2)X+Y\sim\mathrm{Poisson}(\lambda_1+\lambda_2)\blacksquare

要するに「指数の肩の λ\lambda が足し算で合体する」。二項分布の再生性が「pp が同じときだけ」だったのに対し、ポアソンは無条件(独立でさえあれば)で足せるのが強みです。λ\lambda という1パラメータしかないので、揃える条件がないのです。

5. ポアソン過程との関係(準1級)

ポアソン分布を「時間軸」に拡張したのがポアソン過程です。準1級ではこちらも問われます。

P(Nt=k)=(λt)keλtk!,E[Nt]=λt.P(N_t=k)=\frac{(\lambda t)^k e^{-\lambda t}}{k!},\qquad E[N_t]=\lambda t.

要するに「平均 λt\lambda t 回(時間が2倍なら平均も2倍)のポアソン分布」。

待ち時間が指数分布になる

ポアソン過程のもう一つの顔が「事象と事象の間隔(待ち時間)は指数分布に従う」ことです。

なぜか:「次の事象までの待ち時間 TTtt より長い」=「時間 tt までに1回も起きない」なので、

P(T>t)=P(Nt=0)=(λt)0eλt0!=eλt.P(T>t)=P(N_t=0)=\frac{(\lambda t)^0 e^{-\lambda t}}{0!}=e^{-\lambda t}.

したがって待ち時間の累積分布は P(Tt)=1eλtP(T\le t)=1-e^{-\lambda t} となり、これは平均 1/λ1/\lambda の指数分布そのものです。要するに「1時間に平均 λ\lambda 回起きるなら、次までの平均待ち時間は 1/λ1/\lambda 時間」。

この「ポアソン分布(回数)」と「指数分布(待ち時間)」は表裏一体です。詳しくは 指数分布・ガンマ分布・ベータ分布(指数分布)で扱います。準1級ではポアソン過程・M/M/1待ち行列・非定常ポアソン過程まで問われうる(要最新確認)。

6. 分布どうしの使い分け(二項・ポアソン・正規)

「いつどれを使うか」を表に整理します。λ\lambda が大きいとポアソンも正規分布に近づくので、二項→ポアソン→正規という流れで理解すると見通しが良いです。

分布使う場面パラメータ平均分散
二項 Bin(n,p)\mathrm{Bin}(n,p)回数 nn が決まった成功回数n, pn,\ pnpnpnp(1p)np(1-p)p=0.5p=0.5 で対称
ポアソン Poisson(λ)\mathrm{Poisson}(\lambda)nn 大・pp 小・稀な事象の回数λ\lambdaλ\lambdaλ\lambdaλ\lambda 小で右歪み
正規 N(μ,σ2)N(\mu,\sigma^2)連続量、または λ\lambda 大・npnp 大の近似μ, σ2\mu,\ \sigma^2μ\muσ2\sigma^2左右対称

3つの関係を図にすると次の通りです(条件で乗り換えていく)。

flowchart LR
    B["二項分布<br/>Bin(n, p)"] -->|"p 小・n 大<br/>np=λ 一定"| P["ポアソン分布<br/>Poisson(λ)"]
    B -->|"p 中庸・n 大<br/>np と n(1-p) が大"| N["正規分布<br/>N(np, np(1-p))"]
    P -->|"λ 大"| N2["正規分布<br/>N(λ, λ)"]

要するに「pp が小さければポアソンへ、pp が中庸で nn が大きければ正規へ、ポアソンも λ\lambda が大きければ正規へ」。判定の勘どころは「分散が大きい(pp 中庸)→正規/pp 小で npnp が小さいまま→ポアソン」です。

ポアソンの性質まとめ

項目内容
PMFP(X=k)=λkeλk! (k=0,1,2,)P(X=k)=\dfrac{\lambda^k e^{-\lambda}}{k!}\ (k=0,1,2,\dots)
期待値E[X]=λE[X]=\lambda
分散V[X]=λV[X]=\lambda平均=分散が特徴)
MGFMX(t)=eλ(et1)M_X(t)=e^{\lambda(e^t-1)}
再生性独立和 Poisson(λ1)+Poisson(λ2)=Poisson(λ1+λ2)\mathrm{Poisson}(\lambda_1)+\mathrm{Poisson}(\lambda_2)=\mathrm{Poisson}(\lambda_1+\lambda_2)(無条件)
由来二項 Bin(n,λ/n)\mathrm{Bin}(n,\lambda/n)nn\to\infty 極限
過程版時間 tt までの回数 NtPoisson(λt)N_t\sim\mathrm{Poisson}(\lambda t)、待ち時間は指数分布

7. 試験での問われ方(級ごとの差)

数式の直観的意味

なぜPMFに eλe^{-\lambda} が付くのか

二項の極限 (1λ/n)neλ(1-\lambda/n)^n\to e^{-\lambda} から自然に出る(2節C)。同時に、kλk/k!=eλ\sum_k \lambda^k/k!=e^\lambda を打ち消して確率の総和を1にする規格化定数でもある。ee は天下りでなく極限の産物。

なぜ平均=分散なのか

二項の分散 np(1p)np(1-p)p0p\to0 にすると (1p)1(1-p)\to1 となり、分散が平均 np=λnp=\lambda に一致する。**「稀な事象では失敗確率がほぼ1で、(1p)(1-p) の引き下げ効果が消える」**から平均と分散が揃う。これがポアソンの指紋。実データで分散≫平均なら過分散でポアソン不適のサイン(負の二項などへ、幾何分布・超幾何分布・負の二項分布)。

なぜ再生性が無条件なのか

ポアソンはパラメータが λ\lambda 1個だけ。MGF eλ(et1)e^{\lambda(e^t-1)} の積で肩の λ\lambda がそのまま足し算になり、揃えるべき他のパラメータがない。二項は底 (1p+pet)(1-p+pe^t) を揃える必要から「同じ pp 限定」だったが、ポアソンにはその制約がない。

なぜ待ち時間が指数分布になるのか

「次まで tt 超かかる」=「[0,t][0,t] で0回」。ポアソン過程で0回の確率は P(Nt=0)=eλtP(N_t=0)=e^{-\lambda t}。よって P(T>t)=eλtP(T>t)=e^{-\lambda t}=指数分布の生存関数そのもの。回数のポアソンと間隔の指数は同じ過程の2つの見方

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. なぜ確率の式に ee(ネイピア数)が出てくるの?

二項分布の極限を取るときに (1λn)neλ\left(1-\dfrac{\lambda}{n}\right)^n\to e^{-\lambda} という有名な極限が現れるからです(2節の (C))。eλe^{-\lambda} は「確率の合計を1にするための調整役」でもあります(kλk/k!=eλ\sum_k \lambda^k/k!=e^{\lambda} をちょうど打ち消す)。ee は天下りではなく、極限から自然に出てきます。

Q2. λ\lambda は整数じゃなくてもいいの?

はい。λ\lambda平均回数なので、λ=2.5\lambda=2.5 のように小数でもOKです(「1日平均0.5件の事故」など)。一方で、起きる回数 kk は必ず0以上の整数(事象が2.5回起きることはない)。λ\lambda は連続値・kk は離散値、と区別しましょう。

Q3. 二項分布とポアソン分布、結局どっちを使えばいいの?

nn がはっきり決まっていて pp もそこそこあるなら二項分布。nn が非常に大きい(または数えにくい)うえ pp が小さい稀な事象ならポアソン分布。目安は「n50n\ge50 かつ p0.1p\le0.1λ=np\lambda=np が小〜中)」あたりでポアソン近似が実用的になります。「1時間の来客数」のように n,pn,p を分けにくい現象は最初からポアソンで考えます。

Q4. 平均と分散が等しいって、本当に成り立つの?実データでズレてたら?

理論上は厳密に E[X]=V[X]=λE[X]=V[X]=\lambda です(シミュ②で確認)。逆に、実データで分散が平均よりかなり大きい場合は「過分散(overdispersion)」と呼ばれ、ポアソン分布が不適なサインです(負の二項分布などを使う)。「平均≒分散か?」はポアソンが妥当かを診断する目安になり、準1級ではこの妥当性判断が問われた例があります。

Q5. ポアソン分布に正規近似はできる?連続性補正は?

λ\lambda が大きい(目安 λ10\lambda\ge10 程度)と Poisson(λ)N(λ,λ)\mathrm{Poisson}(\lambda)\approx N(\lambda,\lambda) で正規近似できます(シミュ②で λ=10\lambda=10 が対称になるのが前触れ)。ポアソン(離散)を正規(連続)で近似するときは、二項のときと同じく連続性補正 ±0.5\pm0.5 を入れます。2級でポアソンの正規近似を使う問題が出た実績があります。

Q6. 再生性は二項と何が違うの?

二項の再生性は「pp が同じときだけ」足せました(ベルヌーイ分布・二項分布)。ポアソンは λ\lambda という1パラメータしかないので、揃える条件がなく独立でさえあれば無条件で足せますλ1+λ2\lambda_1+\lambda_2 になるだけ、とシンプルです。

まとめ

対応するシミュレーション

二項分布がポアソン分布に収束する様子(n増加で誤差減少)

ポアソン分布のPMF形状(λによる歪み・対称化)

ポアソン乱数のヒストグラムと理論PMFの一致

関連ノート