← 統計検定テキスト 一覧

📊 対象級:2級 | 重要度:A(頻出)

ベルヌーイ分布・二項分布

要点(BLUF)

本文

まず日常のイメージ:10回のくじ引き

当たる確率が p=0.3p=0.3 のくじを10回引いて、当たりが何回出るかを考えます。0回かもしれないし、3回かもしれない。この「当たりの回数」がしたがうのが二項分布 Bin(10,0.3)\mathrm{Bin}(10,\,0.3) です。

製品の良品率、コインの表裏、アンケートの「はい/いいえ」── 「2通りのことを何回もくりかえして、片方が何回出るか」はすべて二項分布です。

1. ベルヌーイ分布 ── 二項分布の構成単位

ベルヌーイ試行=結果が「成功(1)か失敗(0)」の2通りしかない1回の試行(コインの表裏、製品の良品/不良)。その結果を表す確率変数 XX が従うのがベルヌーイ分布 Bernoulli(p)\mathrm{Bernoulli}(p)

P(X=1)=p,P(X=0)=1p(0p1).P(X=1)=p,\qquad P(X=0)=1-p\qquad(0\le p\le1).

PMFを1本の式で書くと P(X=x)=px(1p)1xP(X=x)=p^x(1-p)^{1-x}x{0,1}x\in\{0,1\}x=1x=1ppx=0x=01p1-p になる)。

期待値・分散確率変数(離散・連続)と期待値・分散 で導出済み、ここで再確認):

E[X]=0(1p)+1p=p,V[X]=E[X2](E[X])2.E[X]=0\cdot(1-p)+1\cdot p=p,\qquad V[X]=E[X^2]-(E[X])^2.

ここで X{0,1}X\in\{0,1\} なら X2=XX^2=X02=0, 12=10^2=0,\ 1^2=1)だから E[X2]=E[X]=pE[X^2]=E[X]=p。よって

V[X]=pp2=p(1p).V[X]=p-p^2=p(1-p).

要するに**「ベルヌーイの分散は p(1p)p(1-p)p=0.5p=0.5 で最大 0.250.25p=0p=0 または 1100」**(結果が確定する両端でばらつき0)。

MGF確率変数の変換・モーメント母関数・積率):

MX(t)=E[etX]=et0(1p)+et1p=(1p)+pet.M_X(t)=E[e^{tX}]=e^{t\cdot0}(1-p)+e^{t\cdot1}p=(1-p)+pe^t.

このMGFが二項分布のMGFの土台(後述、独立和でこれの nn 乗になる)。

要するにベルヌーイ分布は「1回ぶんの成功/失敗」。これを nn 回ぶん足したものが二項分布です。

flowchart LR
    A["ベルヌーイ分布<br/>1回の成功/失敗<br/>E=p, V=p(1-p)"] -->|"独立にn回足す"| B["二項分布<br/>n回中の成功回数<br/>E=np, V=np(1-p)"]
    B -->|"n大・p中庸"| C["正規分布<br/>N(np, np(1-p))"]
    B -->|"n大・p小"| D["ポアソン分布<br/>平均λ=np"]

この図の流れ(ベルヌーイ → 足して二項 → 大きくすると正規かポアソン)が、確率分布の章ぜんたいの骨組みです。

2. 二項分布 ── ベルヌーイを nn 回足す

二項分布 Bin(n,p)\mathrm{Bin}(n,p)=成功確率 pp のベルヌーイ試行を独立に nnくりかえしたときの成功回数 XX の分布。適用条件は4つ:(i) 試行回数 nn が固定、(ii) 各試行は成功/失敗の2値、(iii) 成功確率 pp が毎回一定、(iv) 各試行が独立。

PMF(確率質量関数):

P(X=k)=nCkpk(1p)nk(k=0,1,,n).P(X=k)={}_nC_k\,p^k(1-p)^{n-k}\qquad(k=0,1,\dots,n).

式の意味(3パーツに分解)

パーツ意味
pkp^k成功 kk 回ぶんの確率(独立なので掛ける)
(1p)nk(1-p)^{n-k}失敗 nkn-k 回ぶんの確率
nCk{}_nC_knn 回のうちどの kk 回が成功かの場所の選び方(場合の数・順列・組合せ

たとえば n=3,k=2n=3,k=2 なら、成功2回の並びは「○○×」「○×○」「×○○」の 3C2=3{}_3C_2=3 通りで、どれも確率 p2(1p)p^2(1-p)。足して 3C2p2(1p){}_3C_2\,p^2(1-p)。これが**「1つの並びの確率 ×\times 並びの数」**という二項分布PMFの構造。

総和が1になること(確率分布の定義の確認、二項定理):

k=0nnCkpk(1p)nk=(p+(1p))n=1n=1.\sum_{k=0}^{n}{}_nC_k\,p^k(1-p)^{n-k}=\big(p+(1-p)\big)^n=1^n=1.

二項定理 (a+b)n=knCkakbnk(a+b)^n=\sum_k {}_nC_k a^k b^{n-k}a=p, b=1pa=p,\ b=1-p を入れただけ。二項定理がそのまま「確率の総和=1」を保証する場合の数・順列・組合せ の二項展開)。これが「二項分布」という名前の由来。

3. 期待値 E[X]=npE[X]=np・分散 V[X]=np(1p)V[X]=np(1-p) の2通りの導出

本トピックの数理の山。Phase 2 で用意した2つの道具(独立和・MGF)で同じ答えに到達する。数式が苦手なら結論「E=np, V=np(1p)E=np,\ V=np(1-p)」だけ覚えればOKです。

導出(1):独立ベルヌーイ nn 個の和として(期待値・分散の性質(線形性・和の分散・共分散)・一番速い)

ii 回目の試行を指示変数 Xi{0,1}X_i\in\{0,1\}(成功で1)とすると、成功回数は

X=X1+X2++Xn=i=1nXi,Xii.i.d.Bernoulli(p).X=X_1+X_2+\cdots+X_n=\sum_{i=1}^n X_i,\qquad X_i\overset{\text{i.i.d.}}{\sim}\mathrm{Bernoulli}(p).

期待値は線形性(独立不要、常に成立、期待値・分散の性質(線形性・和の分散・共分散)):

E[X]=i=1nE[Xi]=i=1np=np.E[X]=\sum_{i=1}^n E[X_i]=\sum_{i=1}^n p=np.

分散は独立和(共分散0)なので加法的:

V[X]=i=1nV[Xi]=i=1np(1p)=np(1p).V[X]=\sum_{i=1}^n V[X_i]=\sum_{i=1}^n p(1-p)=np(1-p).

XiX_i が独立 ⟹ 無相関 ⟹ Cov(Xi,Xj)=0\mathrm{Cov}(X_i,X_j)=0 なので和の分散に交差項が出ない(期待値・分散の性質(線形性・和の分散・共分散) の「分散の加法性は無相関が必要」)。要するに**「ベルヌーイ1個の E=p,V=p(1p)E=p,V=p(1-p)nn 個足しただけ」**。これが最も速い導出。

ポイント:期待値の足し算は独立でなくても成り立ちますが、分散の足し算は独立(無相関)のときだけです。二項分布は「各試行が独立」が前提なので分散がきれいに np(1p)np(1-p) になります(期待値・分散の性質(線形性・和の分散・共分散))。

導出(2):MGFの微分から(確率変数の変換・モーメント母関数・積率

独立和のMGFは各MGFの積(確率変数の変換・モーメント母関数・積率)。X=XiX=\sum X_i で各 XiX_i のMGFが 1p+pet1-p+pe^t だから

MX(t)=i=1nMXi(t)=(1p+pet)n.M_X(t)=\prod_{i=1}^n M_{X_i}(t)=\big(1-p+pe^t\big)^n.

要するに**「二項のMGF=ベルヌーイMGFの nn 乗」**(独立同分布の和の積)。これを微分してモーメントを取り出す(M(0)=E[X], M(0)=E[X2]M'(0)=E[X],\ M''(0)=E[X^2])。

1階微分(合成関数、ddt(1p+pet)=pet\frac{d}{dt}(1-p+pe^t)=pe^t):

MX(t)=n(1p+pet)n1pet.M_X'(t)=n(1-p+pe^t)^{n-1}\cdot pe^t.

t=0t=0 を代入(e0=1, 1p+p=1e^0=1,\ 1-p+p=1):

E[X]=MX(0)=n1n1p=np. E[X]=M_X'(0)=n\cdot1^{n-1}\cdot p=np.\ \checkmark

2階微分(積の微分):

MX(t)=n(n1)(1p+pet)n2(pet)2+n(1p+pet)n1pet.M_X''(t)=n(n-1)(1-p+pe^t)^{n-2}(pe^t)^2+n(1-p+pe^t)^{n-1}pe^t.

t=0t=0

E[X2]=MX(0)=n(n1)p2+np.E[X^2]=M_X''(0)=n(n-1)p^2+np.

よって

V[X]=E[X2](E[X])2=n(n1)p2+np(np)2=npnp2=np(1p). V[X]=E[X^2]-(E[X])^2=n(n-1)p^2+np-(np)^2 =np-np^2=np(1-p).\ \checkmark

n(n1)p2n2p2=np2n(n-1)p^2-n^2p^2=-np^2、これに +np+np を足して npnp2=np(1p)np-np^2=np(1-p)。)

2つの道筋が一致することで、「独立和」「MGF」という Phase 2 の2系統の道具が同じ結論に至ることを確認できる。導出(1)は速く、導出(2)は高次モーメント(歪度・尖度)も同じ枠組みで出せる汎用性がある。

4. 分布の形状とパラメータ

PMFの形(棒グラフの形)は ppnn で決まる。

pp の値
p=0.5p=0.5左右対称(山が真ん中、P(X=k)=P(X=nk)P(X=k)=P(X=n-k)
p<0.5p<0.5右に裾を引く(右に歪む、ピークが左寄り。失敗が出やすいので小さい kk に山)
p>0.5p>0.5左に裾を引く(左に歪む、ピークが右寄り)

歪みの符号は歪度 12pnp(1p)\dfrac{1-2p}{\sqrt{np(1-p)}} で測れる(p<0.5p<0.5 で正=右歪み、p=0.5p=0.5 で0、p>0.5p>0.5 で負)。nn\to\infty で歪度 0\to0 =対称化(確率変数の変換・モーメント母関数・積率 の歪度)。

5. 再生性(加法性)── 同じ pp のときだけ足せる

独立な XBin(n1,p)X\sim\mathrm{Bin}(n_1,p)YBin(n2,p)Y\sim\mathrm{Bin}(n_2,p)(成功確率 pp が同じ)の和は X+YBin(n1+n2,p)X+Y\sim\mathrm{Bin}(n_1+n_2,p)

直観:n1n_1 回の試行と n2n_2 回の試行を合わせれば n1+n2n_1+n_2 回の試行で、成功確率は同じ pp。だから合計成功回数は Bin(n1+n2,p)\mathrm{Bin}(n_1+n_2,p)

MGFで証明確率変数の変換・モーメント母関数・積率、独立和はMGFの積):

MX+Y(t)=MX(t)MY(t)=(1p+pet)n1(1p+pet)n2=(1p+pet)n1+n2.M_{X+Y}(t)=M_X(t)M_Y(t)=(1-p+pe^t)^{n_1}(1-p+pe^t)^{n_2}=(1-p+pe^t)^{n_1+n_2}.

これは Bin(n1+n2,p)\mathrm{Bin}(n_1+n_2,p) のMGFそのもの。MGFの一意性より X+YBin(n1+n2,p)X+Y\sim\mathrm{Bin}(n_1+n_2,p)\blacksquare

要するに「同じ pp なら指数が足し算で合体」。pp が違うと底 (1p+pet)(1-p+pe^t) が揃わず、積が二項分布のMGFにならない ── だから**pp が異なる二項分布の和は二項分布にならない**(再生性は同じ pp が必須)。

6. 近似の2方向 ── 次トピックへの布石

二項分布の確率計算は nn が大きいと nCk{}_nC_k が巨大で大変。そこで近似を使う。どちらに近似するかは pp で決まる

近似先条件近似式補正
正規分布nn 大・pp 中庸(np5np\ge5 かつ n(1p)5n(1-p)\ge5 が目安)Bin(n,p)N(np,np(1p))\mathrm{Bin}(n,p)\approx N(np,\,np(1-p))連続性補正 ±0.5\pm0.5
ポアソン分布nn 大・pp 小(λ=np\lambda=np 一定、n,p0n\to\infty,p\to0Bin(n,p)Poisson(λ=np)\mathrm{Bin}(n,p)\approx \mathrm{Poisson}(\lambda=np)補正不要(離散→離散)

判定の勘どころ:分散 np(1p)np(1-p) が大きい(pp が中庸)→ 正規/pp が小さく npnp が小さいまま → ポアソン

7. 試験での問われ方(級ごとの差)

数式の直観的意味

なぜ P(X=k)=nCkpk(1p)nkP(X=k)={}_nC_k p^k(1-p)^{n-k} なのか(場所×並びの確率)

二項分布の確率を作る手順を分解すると2段階。(段1) 1つの具体的な並びの確率:たとえば「成功・成功・…(kk 回)・失敗・…(nkn-k 回)」という1つの順番が起こる確率は、独立だから各試行の確率の積で pk(1p)nkp^k(1-p)^{n-k}。順番が違っても成功 kk 回・失敗 nkn-k 回なら同じ値(掛け算は順序によらない)。(段2) そういう並びが何通りあるかnn 個の枠から成功が入る kk 個を選ぶ選び方で nCk{}_nC_k 通り(場合の数・順列・組合せ の組合せ。順序は問わず「どの枠が成功か」だけ)。確率はどれも同じ pk(1p)nkp^k(1-p)^{n-k} なので、足すと「11 並びの確率 ×\times 並びの数」=nCkpk(1p)nk{}_nC_k\,p^k(1-p)^{n-k}。**「組合せ(場所の数)× 1つの並びの確率」**が二項分布PMFの正体。

なぜ E[X]=npE[X]=np なのか(足し算の期待値)

期待値の線形性 E[X+Y]=E[X]+E[Y]E[X+Y]=E[X]+E[Y]独立を一切仮定せず常に成立する(期待値・分散の性質(線形性・和の分散・共分散))。成功回数 XX は指示変数の和 X=XiX=\sum X_i で、各 XiX_i の期待値は「1回の成功確率」pp。だから nn 個足して npnp。**「1回あたり平均 pp 回成功するのを nn 回くりかえせば平均 npnp 回」**という素直な話。期待値だから独立性は要らない(仮に試行が従属でも E[X]=npE[X]=np は成り立つ)。

なぜ V[X]=np(1p)V[X]=np(1-p) には独立が要るのか

分散の加法性 V[X+Y]=V[X]+V[Y]V[X+Y]=V[X]+V[Y]無相関(独立)のときだけ成立する(一般には +2Cov+2\mathrm{Cov} が付く、期待値・分散の性質(線形性・和の分散・共分散))。二項分布は各試行が独立という前提があるので Cov(Xi,Xj)=0\mathrm{Cov}(X_i,X_j)=0、よって交差項が消えて V[X]=V[Xi]=np(1p)V[X]=\sum V[X_i]=np(1-p)もし試行が独立でなければ(例:くじを戻さず引く=超幾何分布)、分散は np(1p)np(1-p) にならない(共分散が負に効いて分散が小さくなる)。だから「二項分布の分散 np(1p)np(1-p)」は独立性に支えられた式。これが二項分布(復元)と超幾何分布(非復元)の分散の違いの根。

なぜ V[X]V[X]p=0.5p=0.5 で最大なのか

V[X]=np(1p)V[X]=np(1-p)pp の関数 f(p)=p(1p)=pp2f(p)=p(1-p)=p-p^2 と見ると、f(p)=12p=0f'(p)=1-2p=0 より p=0.5p=0.5 で極大、f(0.5)=0.25f(0.5)=0.25「結果が五分五分のときが最も予測しづらい(ばらつき最大)、確率が0や1に寄るほど結果が確定してばらつき0」。標本比率の標準誤差 p(1p)/n\sqrt{p(1-p)/n}p=0.5p=0.5 で最大になるのも同じ理由で、Phase 4 の比率の区間推定で「最も保守的な誤差は p=0.5p=0.5」として使われる。

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. nCk{}_nC_k を掛けるのを忘れがちです。なぜ必要?

「ちょうど kk 回成功」の確率は pk(1p)nkp^k(1-p)^{n-k} だけでは足りません。これは「1回目から kk 回目までが成功、残りが失敗」という特定の1つの順番の確率にすぎないからです。成功する回の組合せが nCk{}_nC_k 通りあって、どれも同じ確率なので、その通り数 nCk{}_nC_k を掛けます。3級でいちばん多いミスなので、二項分布の確率を出すときは必ず組合せを掛ける、と意識してください。

Q2. 「3回以上成功」の確率はどう求める?

P(X3)=P(X=3)+P(X=4)++P(X=n)P(X\ge3)=P(X=3)+P(X=4)+\cdots+P(X=n) ですが、項が多いときは余事象を使うと速いです。P(X3)=1P(X2)=1{P(X=0)+P(X=1)+P(X=2)}P(X\ge3)=1-P(X\le2)=1-\{P(X=0)+P(X=1)+P(X=2)\}。とくに「少なくとも1回成功」は P(X1)=1P(X=0)=1(1p)nP(X\ge1)=1-P(X=0)=1-(1-p)^n が定番です。「以上・以下・ちょうど」を読み間違えないことが大事です。

Q3. 「袋から戻さずに引く」場合も二項分布ですか?

いいえ、それは超幾何分布になります。二項分布は「毎回 pp が一定で、各試行が独立」が前提です(=復元抽出)。袋から玉を戻さずに引くと、引くたびに残りの比率が変わって pp が一定でなくなり、試行が独立でなくなります。このとき分散は np(1p)np(1-p) より小さくなります(幾何分布・超幾何分布・負の二項分布)。「箱から不良品を取り出す」系の問題は、戻すのか戻さないのかを必ず確認してください。

Q4. 正規近似とポアソン近似、どっちを使えばいい?

pp で決めます。pp が中庸で np5np\ge5 かつ n(1p)5n(1-p)\ge5 くらいなら正規近似pp が小さくて稀な事象(npnp が小さいまま)ならポアソン近似です。p=0.5p=0.5 にポアソン近似は不適、p=0.001p=0.001 に正規近似は不適、と覚えておけば十分です。判断に迷ったら「分散 np(1p)np(1-p) が大きいか小さいか」を見ます。

Q5. 二項分布どうしは足せますか?

成功確率 pp が同じなら足せますBin(n1,p)+Bin(n2,p)=Bin(n1+n2,p)\mathrm{Bin}(n_1,p)+\mathrm{Bin}(n_2,p)=\mathrm{Bin}(n_1+n_2,p)(再生性・加法性)。直観的には「n1n_1 回の試行と n2n_2 回の試行を合わせれば n1+n2n_1+n_2 回の試行」だからです。ただし**pp が違うと足せません**(二項分布になりません)。pp が同じことが条件です。

まとめ

対応するシミュレーション

二項分布のPMF形状(p と n による歪み・対称化)

二項乱数のヒストグラムと理論PMFの一致

二項分布の正規近似とポアソン近似の使い分け

関連ノート