← 統計検定テキスト 一覧
📊 対象級:2級 ・ 準1級 | 重要度:A(頻出)
ポアソン分布
要点(BLUF)
ポアソン分布 P o i s s o n ( λ ) \mathrm{Poisson}(\lambda) Poisson ( λ ) :単位時間・空間あたり平均 λ \lambda λ 回起きる稀な事象の回数 の分布。PMF
P ( X = k ) = λ k e − λ k ! ( k = 0 , 1 , 2 , … ) . \boxed{\,P(X=k)=\dfrac{\lambda^k e^{-\lambda}}{k!}\,}\quad(k=0,1,2,\dots). P ( X = k ) = k ! λ k e − λ ( k = 0 , 1 , 2 , … ) .
総和1は指数のテイラー展開 ∑ k λ k / k ! = e λ \sum_k \lambda^k/k!=e^\lambda ∑ k λ k / k ! = e λ より e − λ e λ = 1 e^{-\lambda}e^\lambda=1 e − λ e λ = 1 。パラメータは λ \lambda λ 1つ。
二項からの極限 (本トピックの山):B i n ( n , p ) \mathrm{Bin}(n,p) Bin ( n , p ) で λ = n p \lambda=np λ = n p 一定・n → ∞ , p → 0 n\to\infty,p\to0 n → ∞ , p → 0 (p = λ / n p=\lambda/n p = λ / n )とすると PMF が λ k e − λ k ! \dfrac{\lambda^k e^{-\lambda}}{k!} k ! λ k e − λ に収束(ポアソンの少数の法則)。e − λ e^{-\lambda} e − λ は ( 1 − λ / n ) n → e − λ (1-\lambda/n)^n\to e^{-\lambda} ( 1 − λ / n ) n → e − λ 由来。ベルヌーイ分布・二項分布 の「p p p 小・稀な事象」の近似先。
期待値・分散 :E [ X ] = λ , V [ X ] = λ \boxed{E[X]=\lambda,\ V[X]=\lambda} E [ X ] = λ , V [ X ] = λ (平均=分散 がポアソンの指紋)。二項極限(n p → λ , n p ( 1 − p ) → λ np\to\lambda,\ np(1-p)\to\lambda n p → λ , n p ( 1 − p ) → λ )またはMGF M X ( t ) = e λ ( e t − 1 ) M_X(t)=e^{\lambda(e^t-1)} M X ( t ) = e λ ( e t − 1 ) の微分で導出(確率変数の変換・モーメント母関数・積率 )。
再生性 :独立な P o i s s o n ( λ 1 ) + P o i s s o n ( λ 2 ) = P o i s s o n ( λ 1 + λ 2 ) \mathrm{Poisson}(\lambda_1)+\mathrm{Poisson}(\lambda_2)=\mathrm{Poisson}(\lambda_1+\lambda_2) Poisson ( λ 1 ) + Poisson ( λ 2 ) = Poisson ( λ 1 + λ 2 ) (無条件 、λ \lambda λ が足し算)。MGFの積で示す。二項(同じ p p p 限定)より強い。
ポアソン過程(準1級) :単位時間平均 λ \lambda λ 回 → 時間 t t t までの回数 N t ∼ P o i s s o n ( λ t ) N_t\sim\mathrm{Poisson}(\lambda t) N t ∼ Poisson ( λ t ) 。待ち時間は平均 1 / λ 1/\lambda 1/ λ の指数分布 (P ( T > t ) = P ( N t = 0 ) = e − λ t P(T>t)=P(N_t=0)=e^{-\lambda t} P ( T > t ) = P ( N t = 0 ) = e − λ t 、指数分布・ガンマ分布・ベータ分布 へ)。
本文
0. ポアソン分布が活躍する場面
ポアソン分布が当てはまるのは、次のような状況です。
1時間あたり平均3人が来店する店で、ある1時間にちょうど5人 来る確率は?
1日平均0.5件の事故が起きる交差点で、ある1日に事故が0件 の確率は?
不良率が非常に低い製造ラインで、製品1000個中に不良品が2個 含まれる確率は?
共通点は「起こる確率は低いが、機会(試行)は非常に多い 」こと。1回あたりの確率 p p p は小さくても、機会 n n n が多いので「起きた回数」はそれなりにばらつきます。この「回数」を表すのがポアソン分布です。
二項分布との関係(おさらい) :ベルヌーイ分布・二項分布 (二項分布)は「成功確率 p p p の試行を n n n 回くりかえした成功回数」でした。ポアソン分布は、その特別な極限 です。
二項分布:n n n が分かっていて、p p p もそこそこある。「n n n 回中 k k k 回成功」。
ポアソン分布:n n n が非常に大きく(あるいは数えきれず)、p p p が非常に小さい。n n n と p p p を個別に意識せず、平均回数 λ = n p \lambda=np λ = n p だけで考える 。
「1日に何人来店するか」を考えるとき、「1日の中に試行が何回あるか(n n n )」「1回あたり来店確率はいくつか(p p p )」を分けて考えるのは不自然ですよね。n n n と p p p をまとめて「平均 λ \lambda λ 」1つにしたのがポアソン分布 、と捉えると腑に落ちます。
1. ポアソン分布とは ── 稀な事象の回数
適用条件 :起こる確率 p p p は小さいが、機会(試行)n n n は非常に多い。「平均は分かるが個々はランダム」な計数データ 。例:1日の交通事故件数、1時間の来客数、製品1000個あたりの不良品数、単位面積あたりの粒子数。
二項分布 ベルヌーイ分布・二項分布 が「n n n 回中 k k k 回成功」だったのに対し、ポアソンは n , p n,p n , p を個別に意識せず平均 λ = n p \lambda=np λ = n p の1パラメータだけ で考える。k k k に上限がない(回数はいくらでも大きくなれる)のも二項との違い。「来客数」に理論上の上限がないのと同じです。
PMF:
P ( X = k ) = λ k e − λ k ! ( k = 0 , 1 , 2 , … ) . P(X=k)=\frac{\lambda^k e^{-\lambda}}{k!}\qquad(k=0,1,2,\dots). P ( X = k ) = k ! λ k e − λ ( k = 0 , 1 , 2 , … ) .
総和=1の確認 (指数関数のテイラー展開):
∑ k = 0 ∞ λ k e − λ k ! = e − λ ∑ k = 0 ∞ λ k k ! = e − λ ⋅ e λ = 1. \sum_{k=0}^{\infty}\frac{\lambda^k e^{-\lambda}}{k!}=e^{-\lambda}\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}=e^{-\lambda}\cdot e^{\lambda}=1. k = 0 ∑ ∞ k ! λ k e − λ = e − λ k = 0 ∑ ∞ k ! λ k = e − λ ⋅ e λ = 1.
∑ k λ k / k ! = e λ \sum_k \lambda^k/k!=e^\lambda ∑ k λ k / k ! = e λ は e x = ∑ k x k / k ! e^x=\sum_k x^k/k! e x = ∑ k x k / k ! そのもの。e − λ e^{-\lambda} e − λ は合計を1にする調整役 (PMFに e − λ e^{-\lambda} e − λ が付く理由)。
2. 二項分布からの極限導出(山場・準1級)
ポアソン分布の式は天下りに見えますが、二項分布から自然に導けます 。
主張 :B i n ( n , p ) \mathrm{Bin}(n,p) Bin ( n , p ) で p = λ / n p=\lambda/n p = λ / n (λ = n p \lambda=np λ = n p 一定)として n → ∞ n\to\infty n → ∞ にすると P ( X = k ) → λ k e − λ k ! P(X=k)\to\dfrac{\lambda^k e^{-\lambda}}{k!} P ( X = k ) → k ! λ k e − λ 。これをポアソンの少数の法則 (law of rare events)と呼びます。
二項PMFに p = λ / n p=\lambda/n p = λ / n を代入:
P ( X = k ) = n ! k ! ( n − k ) ! ( λ n ) k ( 1 − λ n ) n − k . P(X=k)=\frac{n!}{k!\,(n-k)!}\left(\frac{\lambda}{n}\right)^{k}\left(1-\frac{\lambda}{n}\right)^{n-k}. P ( X = k ) = k ! ( n − k )! n ! ( n λ ) k ( 1 − n λ ) n − k .
k k k 固定で n → ∞ n\to\infty n → ∞ を取るため4つに分解 (( λ / n ) k = λ k / n k (\lambda/n)^k=\lambda^k/n^k ( λ / n ) k = λ k / n k を A と B に分け、( 1 − λ / n ) n − k (1-\lambda/n)^{n-k} ( 1 − λ / n ) n − k を指数 n n n と − k -k − k に分けて C・D に):
P ( X = k ) = λ k k ! ⏟ ( A ) ⋅ n ! ( n − k ) ! n k ⏟ ( B ) ⋅ ( 1 − λ n ) n ⏟ ( C ) ⋅ ( 1 − λ n ) − k ⏟ ( D ) . P(X=k)=\underbrace{\frac{\lambda^k}{k!}}_{(A)}\cdot\underbrace{\frac{n!}{(n-k)!\,n^k}}_{(B)}\cdot\underbrace{\left(1-\frac{\lambda}{n}\right)^{n}}_{(C)}\cdot\underbrace{\left(1-\frac{\lambda}{n}\right)^{-k}}_{(D)}. P ( X = k ) = ( A ) k ! λ k ⋅ ( B ) ( n − k )! n k n ! ⋅ ( C ) ( 1 − n λ ) n ⋅ ( D ) ( 1 − n λ ) − k .
(A) λ k k ! \dfrac{\lambda^k}{k!} k ! λ k :n n n を含まずそのまま残る(ポアソンPMFの本体)。
(B) n ! ( n − k ) ! n k → 1 \dfrac{n!}{(n-k)!\,n^k}\to1 ( n − k )! n k n ! → 1 :分子 n ! ( n − k ) ! = n ( n − 1 ) ⋯ ( n − k + 1 ) \dfrac{n!}{(n-k)!}=n(n-1)\cdots(n-k+1) ( n − k )! n ! = n ( n − 1 ) ⋯ ( n − k + 1 ) は k k k 個の積。n k n^k n k で割ると n n n − 1 n ⋯ n − k + 1 n = 1 ⋅ ( 1 − 1 n ) ⋯ ( 1 − k − 1 n ) → 1 \dfrac{n}{n}\dfrac{n-1}{n}\cdots\dfrac{n-k+1}{n}=1\cdot(1-\tfrac1n)\cdots(1-\tfrac{k-1}{n})\to1 n n n n − 1 ⋯ n n − k + 1 = 1 ⋅ ( 1 − n 1 ) ⋯ ( 1 − n k − 1 ) → 1 (各因子が 1 1 1 、k k k 固定)。要するに「k k k 個の n − i n \frac{n-i}{n} n n − i はどれも n n n が大きければほぼ 1 1 1 」。
(C) ( 1 − λ n ) n → e − λ \left(1-\dfrac{\lambda}{n}\right)^{n}\to e^{-\lambda} ( 1 − n λ ) n → e − λ :有名な極限 lim n ( 1 + x / n ) n = e x \lim_n(1+x/n)^n=e^x lim n ( 1 + x / n ) n = e x に x = − λ x=-\lambda x = − λ を入れた形。ここで e − λ e^{-\lambda} e − λ が出る (PMFの e − λ e^{-\lambda} e − λ の出どころ)。
(D) ( 1 − λ n ) − k → 1 \left(1-\dfrac{\lambda}{n}\right)^{-k}\to1 ( 1 − n λ ) − k → 1 :中身 1 − λ / n → 1 1-\lambda/n\to1 1 − λ / n → 1 、指数 − k -k − k 固定なので 1 − k = 1 1^{-k}=1 1 − k = 1 。
掛けて
P ( X = k ) → λ k k ! ⋅ 1 ⋅ e − λ ⋅ 1 = λ k e − λ k ! . ■ P(X=k)\to\frac{\lambda^k}{k!}\cdot1\cdot e^{-\lambda}\cdot1=\frac{\lambda^k e^{-\lambda}}{k!}.\qquad\blacksquare P ( X = k ) → k ! λ k ⋅ 1 ⋅ e − λ ⋅ 1 = k ! λ k e − λ . ■
何が起きたか(核心) :二項分布の3パーツ(組合せ・p k p^k p k ・( 1 − p ) n − k (1-p)^{n-k} ( 1 − p ) n − k )のうち、組合せの「巨大な n ! n! n ! 部分」が (B) で1に潰れ、( 1 − p ) n − k (1-p)^{n-k} ( 1 − p ) n − k の主要部が (C) で e − λ e^{-\lambda} e − λ になり、残った λ k / k ! \lambda^k/k! λ k / k ! と合体してポアソンPMFになります。e − λ e^{-\lambda} e − λ は ( 1 − λ / n ) n → e − λ (1-\lambda/n)^n\to e^{-\lambda} ( 1 − λ / n ) n → e − λ から来ている 、というのがこの導出の核心です。ベルヌーイ分布・二項分布 で「p p p が小さく稀な事象なら二項はポアソンで近似できる」と書いた、その近似先がこれです。
3. 期待値・分散:どちらも λ
E [ X ] = λ , V [ X ] = λ \boxed{\,E[X]=\lambda,\qquad V[X]=\lambda\,} E [ X ] = λ , V [ X ] = λ
平均も分散も λ \lambda λ で等しい 。これがポアソン分布の指紋です。
導出(1):二項の極限から(最速・一番速い理解)
二項分布では E [ X ] = n p E[X]=np E [ X ] = n p 、V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) でした(ベルヌーイ分布・二項分布 )。p = λ / n p=\lambda/n p = λ / n を入れて n → ∞ n\to\infty n → ∞ にすると、
E [ X ] = n p = n ⋅ λ n = λ , V [ X ] = n p ( 1 − p ) = λ ( 1 − λ n ) → n → ∞ λ . E[X]=np=n\cdot\frac{\lambda}{n}=\lambda,\qquad
V[X]=np(1-p)=\lambda\Big(1-\frac{\lambda}{n}\Big)\xrightarrow[n\to\infty]{}\lambda. E [ X ] = n p = n ⋅ n λ = λ , V [ X ] = n p ( 1 − p ) = λ ( 1 − n λ ) n → ∞ λ .
要するに「二項の分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) の ( 1 − p ) (1-p) ( 1 − p ) が、p → 0 p\to0 p → 0 で 1 1 1 になるから、分散が平均 λ \lambda λ と同じになる 」。これがポアソンで平均と分散が一致する最も直観的な理由です。
確率変数の変換・モーメント母関数・積率 のMGFを使うと、高次モーメントもまとめて出せます。ポアソン分布のMGFは
M X ( t ) = E [ e t X ] = e λ ( e t − 1 ) . \boxed{\,M_X(t)=E[e^{tX}]=e^{\lambda(e^t-1)}\,}. M X ( t ) = E [ e tX ] = e λ ( e t − 1 ) .
MGFの導出 :定義に従って計算します。
M X ( t ) = ∑ k = 0 ∞ e t k ⋅ λ k e − λ k ! = e − λ ∑ k = 0 ∞ ( λ e t ) k k ! . M_X(t)=\sum_{k=0}^{\infty}e^{tk}\cdot\frac{\lambda^k e^{-\lambda}}{k!}
=e^{-\lambda}\sum_{k=0}^{\infty}\frac{(\lambda e^t)^k}{k!}. M X ( t ) = k = 0 ∑ ∞ e t k ⋅ k ! λ k e − λ = e − λ k = 0 ∑ ∞ k ! ( λ e t ) k .
ここで e t k λ k = ( λ e t ) k e^{tk}\lambda^k=(\lambda e^t)^k e t k λ k = ( λ e t ) k とまとめました。和の部分は再びテイラー展開 ∑ k x k / k ! = e x \sum_k x^k/k!=e^x ∑ k x k / k ! = e x に x = λ e t x=\lambda e^t x = λ e t を入れた形なので ∑ k ( λ e t ) k / k ! = e λ e t \sum_k (\lambda e^t)^k/k!=e^{\lambda e^t} ∑ k ( λ e t ) k / k ! = e λ e t 。したがって
M X ( t ) = e − λ ⋅ e λ e t = e λ e t − λ = e λ ( e t − 1 ) . M_X(t)=e^{-\lambda}\cdot e^{\lambda e^t}=e^{\lambda e^t-\lambda}=e^{\lambda(e^t-1)}. M X ( t ) = e − λ ⋅ e λ e t = e λ e t − λ = e λ ( e t − 1 ) .
要するに「確率の合計が1になったのと同じテイラー展開のトリックを、λ \lambda λ の代わりに λ e t \lambda e^t λ e t で使っただけ 」。
MGFから E [ X ] E[X] E [ X ] (1階微分、t = 0 t=0 t = 0 ) :合成関数の微分で d d t e λ ( e t − 1 ) = e λ ( e t − 1 ) ⋅ λ e t \dfrac{d}{dt}e^{\lambda(e^t-1)}=e^{\lambda(e^t-1)}\cdot\lambda e^t d t d e λ ( e t − 1 ) = e λ ( e t − 1 ) ⋅ λ e t 。
M X ′ ( t ) = λ e t e λ ( e t − 1 ) , E [ X ] = M X ′ ( 0 ) = λ ⋅ 1 ⋅ e 0 = λ . M_X'(t)=\lambda e^t\, e^{\lambda(e^t-1)},\qquad
E[X]=M_X'(0)=\lambda\cdot1\cdot e^{0}=\lambda. M X ′ ( t ) = λ e t e λ ( e t − 1 ) , E [ X ] = M X ′ ( 0 ) = λ ⋅ 1 ⋅ e 0 = λ .
MGFから E [ X 2 ] E[X^2] E [ X 2 ] (2階微分、t = 0 t=0 t = 0 ) :積の微分で
M X ′ ′ ( t ) = λ e t e λ ( e t − 1 ) + λ e t ⋅ λ e t e λ ( e t − 1 ) = ( λ e t + λ 2 e 2 t ) e λ ( e t − 1 ) . M_X''(t)=\lambda e^t\,e^{\lambda(e^t-1)}+\lambda e^t\cdot\lambda e^t\,e^{\lambda(e^t-1)}
=\big(\lambda e^t+\lambda^2 e^{2t}\big)e^{\lambda(e^t-1)}. M X ′′ ( t ) = λ e t e λ ( e t − 1 ) + λ e t ⋅ λ e t e λ ( e t − 1 ) = ( λ e t + λ 2 e 2 t ) e λ ( e t − 1 ) .
t = 0 t=0 t = 0 を代入して E [ X 2 ] = M X ′ ′ ( 0 ) = λ + λ 2 E[X^2]=M_X''(0)=\lambda+\lambda^2 E [ X 2 ] = M X ′′ ( 0 ) = λ + λ 2 。よって分散は
V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 = ( λ + λ 2 ) − λ 2 = λ . ✓ V[X]=E[X^2]-(E[X])^2=(\lambda+\lambda^2)-\lambda^2=\lambda.\ \checkmark V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 = ( λ + λ 2 ) − λ 2 = λ . ✓
2通り(二項の極限・MGF)が同じ E = V = λ E=V=\lambda E = V = λ に到達 します。導出(1)は速く、導出(2)は歪度・尖度まで同じ枠組みで出せます(ポアソンの歪度は 1 / λ 1/\sqrt{\lambda} 1/ λ 、λ \lambda λ が大きいほど0に近づき対称化 ── これが正規近似の前触れ)。
4. 再生性(足し算しても同じ仲間)
独立な X ∼ P o i s s o n ( λ 1 ) X\sim\mathrm{Poisson}(\lambda_1) X ∼ Poisson ( λ 1 ) と Y ∼ P o i s s o n ( λ 2 ) Y\sim\mathrm{Poisson}(\lambda_2) Y ∼ Poisson ( λ 2 ) の和は X + Y ∼ P o i s s o n ( λ 1 + λ 2 ) X+Y\sim\mathrm{Poisson}(\lambda_1+\lambda_2) X + Y ∼ Poisson ( λ 1 + λ 2 ) になります。これを**再生性(加法性)**と呼びます。準1級で出題実績があります。
直観 :A店に平均 λ 1 \lambda_1 λ 1 人、B店に平均 λ 2 \lambda_2 λ 2 人来るなら、2店合計の来客数は平均 λ 1 + λ 2 \lambda_1+\lambda_2 λ 1 + λ 2 人のポアソン分布。当たり前に聞こえますが、これがきちんと成り立つのがポアソンの便利なところです。
MGFで証明 (確率変数の変換・モーメント母関数・積率 、独立和のMGFは各MGFの積):
M X + Y ( t ) = M X ( t ) M Y ( t ) = e λ 1 ( e t − 1 ) ⋅ e λ 2 ( e t − 1 ) = e ( λ 1 + λ 2 ) ( e t − 1 ) . M_{X+Y}(t)=M_X(t)\,M_Y(t)=e^{\lambda_1(e^t-1)}\cdot e^{\lambda_2(e^t-1)}
=e^{(\lambda_1+\lambda_2)(e^t-1)}. M X + Y ( t ) = M X ( t ) M Y ( t ) = e λ 1 ( e t − 1 ) ⋅ e λ 2 ( e t − 1 ) = e ( λ 1 + λ 2 ) ( e t − 1 ) .
これは P o i s s o n ( λ 1 + λ 2 ) \mathrm{Poisson}(\lambda_1+\lambda_2) Poisson ( λ 1 + λ 2 ) のMGFそのもの。MGFの一意性より X + Y ∼ P o i s s o n ( λ 1 + λ 2 ) X+Y\sim\mathrm{Poisson}(\lambda_1+\lambda_2) X + Y ∼ Poisson ( λ 1 + λ 2 ) 。■ \blacksquare ■
要するに「指数の肩の λ \lambda λ が足し算で合体する 」。二項分布の再生性が「p p p が同じときだけ」だったのに対し、ポアソンは無条件(独立でさえあれば)で足せる のが強みです。λ \lambda λ という1パラメータしかないので、揃える条件がないのです。
5. ポアソン過程との関係(準1級)
ポアソン分布を「時間軸」に拡張したのがポアソン過程 です。準1級ではこちらも問われます。
単位時間あたり平均 λ \lambda λ 回 起きる稀な事象を考えます(λ \lambda λ を強度 または到着率 と呼ぶ)。
このとき、時間 t t t までに起きる回数 N t N_t N t は P o i s s o n ( λ t ) \mathrm{Poisson}(\lambda t) Poisson ( λ t ) に従います :
P ( N t = k ) = ( λ t ) k e − λ t k ! , E [ N t ] = λ t . P(N_t=k)=\frac{(\lambda t)^k e^{-\lambda t}}{k!},\qquad E[N_t]=\lambda t. P ( N t = k ) = k ! ( λ t ) k e − λ t , E [ N t ] = λ t .
要するに「平均 λ t \lambda t λ t 回(時間が2倍なら平均も2倍)のポアソン分布」。
待ち時間が指数分布になる
ポアソン過程のもう一つの顔が「事象と事象の間隔(待ち時間)は指数分布に従う 」ことです。
なぜか:「次の事象までの待ち時間 T T T が t t t より長い」=「時間 t t t までに1回も起きない 」なので、
P ( T > t ) = P ( N t = 0 ) = ( λ t ) 0 e − λ t 0 ! = e − λ t . P(T>t)=P(N_t=0)=\frac{(\lambda t)^0 e^{-\lambda t}}{0!}=e^{-\lambda t}. P ( T > t ) = P ( N t = 0 ) = 0 ! ( λ t ) 0 e − λ t = e − λ t .
したがって待ち時間の累積分布は P ( T ≤ t ) = 1 − e − λ t P(T\le t)=1-e^{-\lambda t} P ( T ≤ t ) = 1 − e − λ t となり、これは平均 1 / λ 1/\lambda 1/ λ の指数分布 そのものです。要するに「1時間に平均 λ \lambda λ 回起きるなら、次までの平均待ち時間は 1 / λ 1/\lambda 1/ λ 時間 」。
この「ポアソン分布(回数)」と「指数分布(待ち時間)」は表裏一体です。詳しくは 指数分布・ガンマ分布・ベータ分布 (指数分布)で扱います。準1級ではポアソン過程・M/M/1待ち行列・非定常ポアソン過程まで問われうる(要最新確認)。
6. 分布どうしの使い分け(二項・ポアソン・正規)
「いつどれを使うか」を表に整理します。λ \lambda λ が大きいとポアソンも正規分布に近づく ので、二項→ポアソン→正規という流れで理解すると見通しが良いです。
分布 使う場面 パラメータ 平均 分散 形 二項 B i n ( n , p ) \mathrm{Bin}(n,p) Bin ( n , p ) 回数 n n n が決まった成功回数 n , p n,\ p n , p n p np n p n p ( 1 − p ) np(1-p) n p ( 1 − p ) p = 0.5 p=0.5 p = 0.5 で対称ポアソン P o i s s o n ( λ ) \mathrm{Poisson}(\lambda) Poisson ( λ ) n n n 大・p p p 小・稀な事象の回数λ \lambda λ λ \lambda λ λ \lambda λ λ \lambda λ 小で右歪み正規 N ( μ , σ 2 ) N(\mu,\sigma^2) N ( μ , σ 2 ) 連続量、または λ \lambda λ 大・n p np n p 大の近似 μ , σ 2 \mu,\ \sigma^2 μ , σ 2 μ \mu μ σ 2 \sigma^2 σ 2 左右対称
3つの関係 を図にすると次の通りです(条件で乗り換えていく)。
flowchart LR
B["二項分布<br/>Bin(n, p)"] -->|"p 小・n 大<br/>np=λ 一定"| P["ポアソン分布<br/>Poisson(λ)"]
B -->|"p 中庸・n 大<br/>np と n(1-p) が大"| N["正規分布<br/>N(np, np(1-p))"]
P -->|"λ 大"| N2["正規分布<br/>N(λ, λ)"]
要するに「p p p が小さければポアソンへ、p p p が中庸で n n n が大きければ正規へ、ポアソンも λ \lambda λ が大きければ正規へ 」。判定の勘どころは「分散が大きい(p p p 中庸)→正規/p p p 小で n p np n p が小さいまま→ポアソン 」です。
ポアソンの性質まとめ
項目 内容 PMF P ( X = k ) = λ k e − λ k ! ( k = 0 , 1 , 2 , … ) P(X=k)=\dfrac{\lambda^k e^{-\lambda}}{k!}\ (k=0,1,2,\dots) P ( X = k ) = k ! λ k e − λ ( k = 0 , 1 , 2 , … ) 期待値 E [ X ] = λ E[X]=\lambda E [ X ] = λ 分散 V [ X ] = λ V[X]=\lambda V [ X ] = λ (平均=分散 が特徴)MGF M X ( t ) = e λ ( e t − 1 ) M_X(t)=e^{\lambda(e^t-1)} M X ( t ) = e λ ( e t − 1 ) 再生性 独立和 P o i s s o n ( λ 1 ) + P o i s s o n ( λ 2 ) = P o i s s o n ( λ 1 + λ 2 ) \mathrm{Poisson}(\lambda_1)+\mathrm{Poisson}(\lambda_2)=\mathrm{Poisson}(\lambda_1+\lambda_2) Poisson ( λ 1 ) + Poisson ( λ 2 ) = Poisson ( λ 1 + λ 2 ) (無条件) 由来 二項 B i n ( n , λ / n ) \mathrm{Bin}(n,\lambda/n) Bin ( n , λ / n ) の n → ∞ n\to\infty n → ∞ 極限 過程版 時間 t t t までの回数 N t ∼ P o i s s o n ( λ t ) N_t\sim\mathrm{Poisson}(\lambda t) N t ∼ Poisson ( λ t ) 、待ち時間は指数分布
7. 試験での問われ方(級ごとの差)
2級(中核) :PMF λ k e − λ k ! \dfrac{\lambda^k e^{-\lambda}}{k!} k ! λ k e − λ での確率計算 (「平均3人の店に5人来る確率」「平均0.5件の事故が0件の確率=e − 0.5 e^{-0.5} e − 0.5 」)、E = V = λ E=V=\lambda E = V = λ の利用、λ = n p \lambda=np λ = n p による二項のポアソン近似 、λ \lambda λ 大での正規近似 (連続性補正 ± 0.5 \pm0.5 ± 0.5 、出題実績あり)。
準1級 :二項からの極限導出 、再生性 (出題実績あり)、ポアソン過程 (N t ∼ P o i s s o n ( λ t ) N_t\sim\mathrm{Poisson}(\lambda t) N t ∼ Poisson ( λ t ) ・待ち時間が指数分布・待ち行列)、MGF e λ ( e t − 1 ) e^{\lambda(e^t-1)} e λ ( e t − 1 ) からの E , V E,V E , V 、「平均≒分散」によるポアソン妥当性の判断 (過去問あり)。
※出題範囲表は改訂されうる。ポアソン過程・再生性・MGFの級の線引きは受験前に最新の範囲表で要最新確認 。
数式の直観的意味
なぜPMFに e − λ e^{-\lambda} e − λ が付くのか
二項の極限 ( 1 − λ / n ) n → e − λ (1-\lambda/n)^n\to e^{-\lambda} ( 1 − λ / n ) n → e − λ から自然に出る(2節C)。同時に、∑ k λ k / k ! = e λ \sum_k \lambda^k/k!=e^\lambda ∑ k λ k / k ! = e λ を打ち消して確率の総和を1にする規格化定数 でもある。e e e は天下りでなく極限の産物。
なぜ平均=分散なのか
二項の分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) で p → 0 p\to0 p → 0 にすると ( 1 − p ) → 1 (1-p)\to1 ( 1 − p ) → 1 となり、分散が平均 n p = λ np=\lambda n p = λ に一致する。**「稀な事象では失敗確率がほぼ1で、( 1 − p ) (1-p) ( 1 − p ) の引き下げ効果が消える」**から平均と分散が揃う。これがポアソンの指紋。実データで分散≫平均なら過分散でポアソン不適のサイン(負の二項などへ、幾何分布・超幾何分布・負の二項分布 )。
なぜ再生性が無条件なのか
ポアソンはパラメータが λ \lambda λ 1個だけ。MGF e λ ( e t − 1 ) e^{\lambda(e^t-1)} e λ ( e t − 1 ) の積で肩の λ \lambda λ がそのまま足し算になり、揃えるべき他のパラメータがない。二項は底 ( 1 − p + p e t ) (1-p+pe^t) ( 1 − p + p e t ) を揃える必要から「同じ p p p 限定」だったが、ポアソンにはその制約がない。
なぜ待ち時間が指数分布になるのか
「次まで t t t 超かかる」=「[ 0 , t ] [0,t] [ 0 , t ] で0回」。ポアソン過程で0回の確率は P ( N t = 0 ) = e − λ t P(N_t=0)=e^{-\lambda t} P ( N t = 0 ) = e − λ t 。よって P ( T > t ) = e − λ t P(T>t)=e^{-\lambda t} P ( T > t ) = e − λ t =指数分布の生存関数そのもの。回数のポアソンと間隔の指数は同じ過程の2つの見方 。
⚠️ 引っかけポイント・頻出論点・級ごとの差
λ \lambda λ は小数OK・k k k は非負整数 :λ \lambda λ は平均回数なので 2.5 2.5 2.5 でも可(「1日平均0.5件の事故」など)。回数 k k k は 0 , 1 , 2 , … 0,1,2,\dots 0 , 1 , 2 , … (2.5回はない)。λ \lambda λ 連続/k k k 離散。
「ちょうど」「以上」「少なくとも1回」 :P ( X = k ) P(X=k) P ( X = k ) と P ( X ≥ k ) P(X\ge k) P ( X ≥ k ) を混同しない。「少なくとも1回」= 1 − P ( X = 0 ) = 1 − e − λ =1-P(X=0)=1-e^{-\lambda} = 1 − P ( X = 0 ) = 1 − e − λ (頻出)。「2回以下」= P ( 0 ) + P ( 1 ) + P ( 2 ) =P(0)+P(1)+P(2) = P ( 0 ) + P ( 1 ) + P ( 2 ) 。
二項のどっちの近似か :p p p 中庸で n p , n ( 1 − p ) ≥ 5 np,n(1-p)\ge5 n p , n ( 1 − p ) ≥ 5 →正規。p p p 小で稀(n p np n p が小〜中)→ポアソン。p = 0.5 p=0.5 p = 0.5 にポアソン近似は不適、p = 0.001 p=0.001 p = 0.001 に正規近似は不適(ベルヌーイ分布・二項分布 と対)。
ポアソン近似に連続性補正は不要/正規近似には必要 :二項→ポアソンは離散→離散で補正なし。二項→正規・ポアソン→正規は離散→連続で ± 0.5 \pm0.5 ± 0.5 補正。
再生性は無条件(独立だけ) :二項は同じ p p p 限定だが、ポアソンは λ \lambda λ が違っても独立なら足せて λ 1 + λ 2 \lambda_1+\lambda_2 λ 1 + λ 2 。混同注意。
平均=分散はポアソンの診断基準 :実データで分散が平均と大きくズレ(特に分散≫平均=過分散)ならポアソン不適。準1級でこの妥当性判断が問われた(負の二項分布などを使う)。
ポアソン過程の時間スケール :時間 t t t では平均が λ t \lambda t λ t (λ \lambda λ ではない)。N t ∼ P o i s s o n ( λ t ) N_t\sim\mathrm{Poisson}(\lambda t) N t ∼ Poisson ( λ t ) 。t t t を変えたら λ t \lambda t λ t を使う。
級差 :2級=PMF計算・E = V = λ E=V=\lambda E = V = λ ・ポアソン近似(・λ大正規近似)。準1級=極限導出・再生性・ポアソン過程・MGF・妥当性判断。
よくある疑問
Q1. なぜ確率の式に e e e (ネイピア数)が出てくるの?
二項分布の極限を取るときに ( 1 − λ n ) n → e − λ \left(1-\dfrac{\lambda}{n}\right)^n\to e^{-\lambda} ( 1 − n λ ) n → e − λ という有名な極限が現れるからです(2節の (C))。e − λ e^{-\lambda} e − λ は「確率の合計を1にするための調整役」でもあります(∑ k λ k / k ! = e λ \sum_k \lambda^k/k!=e^{\lambda} ∑ k λ k / k ! = e λ をちょうど打ち消す)。e e e は天下りではなく、極限から自然に出てきます。
Q2. λ \lambda λ は整数じゃなくてもいいの?
はい。λ \lambda λ は平均回数 なので、λ = 2.5 \lambda=2.5 λ = 2.5 のように小数でもOKです(「1日平均0.5件の事故」など)。一方で、起きる回数 k k k は必ず0以上の整数 (事象が2.5回起きることはない)。λ \lambda λ は連続値・k k k は離散値、と区別しましょう。
Q3. 二項分布とポアソン分布、結局どっちを使えばいいの?
n n n がはっきり決まっていて p p p もそこそこある なら二項分布。n n n が非常に大きい(または数えにくい)うえ p p p が小さい稀な事象 ならポアソン分布。目安は「n ≥ 50 n\ge50 n ≥ 50 かつ p ≤ 0.1 p\le0.1 p ≤ 0.1 (λ = n p \lambda=np λ = n p が小〜中)」あたりでポアソン近似が実用的になります。「1時間の来客数」のように n , p n,p n , p を分けにくい現象は最初からポアソンで考えます。
Q4. 平均と分散が等しいって、本当に成り立つの?実データでズレてたら?
理論上は厳密に E [ X ] = V [ X ] = λ E[X]=V[X]=\lambda E [ X ] = V [ X ] = λ です(シミュ②で確認)。逆に、実データで分散が平均よりかなり大きい 場合は「過分散(overdispersion)」と呼ばれ、ポアソン分布が不適なサインです(負の二項分布などを使う)。「平均≒分散か?」はポアソンが妥当かを診断する目安 になり、準1級ではこの妥当性判断が問われた例があります。
Q5. ポアソン分布に正規近似はできる?連続性補正は?
λ \lambda λ が大きい(目安 λ ≥ 10 \lambda\ge10 λ ≥ 10 程度)と P o i s s o n ( λ ) ≈ N ( λ , λ ) \mathrm{Poisson}(\lambda)\approx N(\lambda,\lambda) Poisson ( λ ) ≈ N ( λ , λ ) で正規近似できます(シミュ②で λ = 10 \lambda=10 λ = 10 が対称になるのが前触れ)。ポアソン(離散)を正規(連続)で近似するときは、二項のときと同じく連続性補正 ± 0.5 \pm0.5 ± 0.5 を入れます。2級でポアソンの正規近似を使う問題が出た実績があります。
Q6. 再生性は二項と何が違うの?
二項の再生性は「p p p が同じときだけ 」足せました(ベルヌーイ分布・二項分布 )。ポアソンは λ \lambda λ という1パラメータしかないので、揃える条件がなく独立でさえあれば無条件で足せます 。λ 1 + λ 2 \lambda_1+\lambda_2 λ 1 + λ 2 になるだけ、とシンプルです。
まとめ
ポアソン分布は「稀な事象が一定の時間・空間で何回起きるか 」を表す。PMFは P ( X = k ) = λ k e − λ k ! P(X=k)=\dfrac{\lambda^k e^{-\lambda}}{k!} P ( X = k ) = k ! λ k e − λ 、パラメータは λ \lambda λ ただ1つ。
二項 B i n ( n , λ / n ) \mathrm{Bin}(n,\lambda/n) Bin ( n , λ / n ) で n → ∞ , p → 0 n\to\infty,p\to0 n → ∞ , p → 0 の極限 がポアソン。e − λ e^{-\lambda} e − λ は ( 1 − λ / n ) n → e − λ (1-\lambda/n)^n\to e^{-\lambda} ( 1 − λ / n ) n → e − λ から来る。
E [ X ] = V [ X ] = λ E[X]=V[X]=\lambda E [ X ] = V [ X ] = λ (平均=分散)が最大の特徴。MGFは M X ( t ) = e λ ( e t − 1 ) M_X(t)=e^{\lambda(e^t-1)} M X ( t ) = e λ ( e t − 1 ) 。
再生性 :独立なポアソンの和はポアソン(無条件、λ \lambda λ が足し算)。
ポアソン過程 :時間 t t t までの回数は P o i s s o n ( λ t ) \mathrm{Poisson}(\lambda t) Poisson ( λ t ) 、待ち時間は指数分布 (次の 指数分布・ガンマ分布・ベータ分布 へ)。
級の目安:2級 =PMF計算・E = V = λ E=V=\lambda E = V = λ ・二項のポアソン近似(・λ大の正規近似)。準1級 =極限導出・再生性・ポアソン過程・MGF。出題範囲は要最新確認 。
対応するシミュレーション
simulations/poisson_bunpu_nikou_shuusoku.py
何を示すか :λ = 3 \lambda=3 λ = 3 を固定し B i n ( n , 3 / n ) \mathrm{Bin}(n,3/n) Bin ( n , 3/ n ) を n = 5 , 20 , 100 n=5,20,100 n = 5 , 20 , 100 と増やすと PMF が P o i s s o n ( 3 ) \mathrm{Poisson}(3) Poisson ( 3 ) に重なる様子。二項PMF・ポアソンPMFとも math.factorial+math.exp で手計算(scipy不使用)。最大誤差を出力。
結論(seed=0) :最大誤差は n = 5 n=5 n = 5 (p = 0.6 p=0.6 p = 0.6 )で 0.12156 、n = 20 n=20 n = 20 (p = 0.15 p=0.15 p = 0.15 )で 0.01879 、n = 100 n=100 n = 100 (p = 0.03 p=0.03 p = 0.03 )で 0.00343 と単調減少。グラフでも n = 100 n=100 n = 100 でほぼ完全に重なる。二項→ポアソン極限を誤差の数値で裏づけ 。
simulations/poisson_bunpu_keijou.py
何を示すか :λ = 1 , 4 , 10 \lambda=1,4,10 λ = 1 , 4 , 10 でPMF形状を描き(小λ右歪み・大λ対称化=正規近似の前触れ)、P o i s s o n ( 4 ) \mathrm{Poisson}(4) Poisson ( 4 ) 乱数(np.random.poisson)20万個で平均・分散が λ \lambda λ に一致することを確認。理論PMFとヒストグラムの重なりも図示。
結論(seed=0) :P o i s s o n ( 4 ) \mathrm{Poisson}(4) Poisson ( 4 ) 乱数20万個で標本平均 4.0018・標本分散 3.9983 (理論 λ = 4 \lambda=4 λ = 4 に一致)。λ = 1 \lambda=1 λ = 1 は右歪み、λ = 10 \lambda=10 λ = 10 は左右対称。E [ X ] = V [ X ] = λ E[X]=V[X]=\lambda E [ X ] = V [ X ] = λ を数値で確認 。
関連ノート
ベルヌーイ分布・二項分布 (二項分布 ── ポアソンは B i n ( n , λ / n ) \mathrm{Bin}(n,\lambda/n) Bin ( n , λ / n ) の n → ∞ n\to\infty n → ∞ 極限。p p p 小・稀な事象の近似先。後方リンク・Phase 3①)
確率変数の変換・モーメント母関数・積率 (変換・モーメント母関数 ── ポアソンMGF e λ ( e t − 1 ) e^{\lambda(e^t-1)} e λ ( e t − 1 ) 、E , V E,V E , V 導出、再生性をMGFの積で。後方リンク)
確率変数(離散・連続)と期待値・分散 (確率変数・期待値・分散 ── E , V E,V E , V の定義。ポアソンは両方 λ \lambda λ 。後方リンク)
中心極限定理(CLT) (中心極限定理 ── λ \lambda λ 大でポアソンが正規 N ( λ , λ ) N(\lambda,\lambda) N ( λ , λ ) に近づく根拠。後方リンク)
幾何分布・超幾何分布・負の二項分布 (幾何・負の二項・超幾何分布 ── 過分散時の負の二項など他の離散分布。前方リンク・Phase 3③)
指数分布・ガンマ分布・ベータ分布 (指数分布 ── ポアソン過程の待ち時間。回数=ポアソン/間隔=指数の表裏。前方リンク・Phase 3⑥)