← 統計検定テキスト 一覧
📊 対象級:2級 | 重要度:A(頻出)
ベルヌーイ分布・二項分布
要点(BLUF)
ベルヌーイ分布 :成功/失敗の1回試行。X ∈ { 0 , 1 } X\in\{0,1\} X ∈ { 0 , 1 } 、P ( X = 1 ) = p P(X=1)=p P ( X = 1 ) = p 。E [ X ] = p E[X]=p E [ X ] = p 、V [ X ] = p ( 1 − p ) V[X]=p(1-p) V [ X ] = p ( 1 − p ) (X 2 = X X^2=X X 2 = X より一発、確率変数(離散・連続)と期待値・分散 既出)。MGF M X ( t ) = 1 − p + p e t M_X(t)=1-p+pe^t M X ( t ) = 1 − p + p e t 。二項分布の構成単位 。
二項分布 :成功確率 p p p の独立試行を n n n 回くりかえした成功回数 X ∼ B i n ( n , p ) X\sim\mathrm{Bin}(n,p) X ∼ Bin ( n , p ) 。
P ( X = k ) = n C k p k ( 1 − p ) n − k ( k = 0 , 1 , … , n ) . \boxed{\,P(X=k)={}_nC_k\,p^k(1-p)^{n-k}\,}\quad(k=0,1,\dots,n). P ( X = k ) = n C k p k ( 1 − p ) n − k ( k = 0 , 1 , … , n ) .
n C k {}_nC_k n C k =n n n 回中どの k k k 回が成功かの場所の選び方 (場合の数・順列・組合せ )、p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k =1つの並びが起こる確率(独立反復試行、条件付き確率・独立性・全確率の定理 )。総和1は二項定理 ∑ k n C k p k ( 1 − p ) n − k = ( p + ( 1 − p ) ) n = 1 \sum_k {}_nC_k p^k(1-p)^{n-k}=(p+(1-p))^n=1 ∑ k n C k p k ( 1 − p ) n − k = ( p + ( 1 − p ) ) n = 1 。
E [ X ] = n p E[X]=np E [ X ] = n p 、V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) を2通りで導出 :(1) 独立ベルヌーイ n n n 個の和 X = ∑ X i X=\sum X_i X = ∑ X i から(期待値・分散の性質(線形性・和の分散・共分散) の独立和、共分散0)、(2) MGF M X ( t ) = ( 1 − p + p e t ) n M_X(t)=(1-p+pe^t)^n M X ( t ) = ( 1 − p + p e t ) n の微分から(確率変数の変換・モーメント母関数・積率 、ベルヌーイMGFの n n n 乗=独立和の積)。
再生性(加法性) :独立な B i n ( n 1 , p ) + B i n ( n 2 , p ) = B i n ( n 1 + n 2 , p ) \mathrm{Bin}(n_1,p)+\mathrm{Bin}(n_2,p)=\mathrm{Bin}(n_1+n_2,p) Bin ( n 1 , p ) + Bin ( n 2 , p ) = Bin ( n 1 + n 2 , p ) (p p p が同じときだけ 、MGFの積で示す)。
2方向の近似 :n n n 大・p p p 中庸 → 正規近似 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N ( n p , n p ( 1 − p )) (中心極限定理(CLT) のド・モアブル=ラプラス)。n n n 大・p p p 小(λ = n p \lambda=np λ = n p 一定) → ポアソン近似 (ポアソン分布 へ)。
本文
まず日常のイメージ:10回のくじ引き
当たる確率が p = 0.3 p=0.3 p = 0.3 のくじを10回引いて、当たりが何回出るか を考えます。0回かもしれないし、3回かもしれない。この「当たりの回数」がしたがうのが二項分布 B i n ( 10 , 0.3 ) \mathrm{Bin}(10,\,0.3) Bin ( 10 , 0.3 ) です。
平均すると何回当たる? → n p = 10 × 0.3 = 3 np=10\times0.3=3 n p = 10 × 0.3 = 3 回(期待値 n p np n p )。
ちょうど3回当たる確率は? → 10 C 3 ( 0.3 ) 3 ( 0.7 ) 7 {}_{10}C_3\,(0.3)^3(0.7)^7 10 C 3 ( 0.3 ) 3 ( 0.7 ) 7 (PMFの式 )。
なぜ 10 C 3 {}_{10}C_3 10 C 3 を掛ける? → 「1回目と4回目と7回目が当たり」「2回目と5回目と9回目が当たり」…と、当たる回の組合せが 10 C 3 {}_{10}C_3 10 C 3 通り あり、どれも同じ確率 ( 0.3 ) 3 ( 0.7 ) 7 (0.3)^3(0.7)^7 ( 0.3 ) 3 ( 0.7 ) 7 だからです。
製品の良品率、コインの表裏、アンケートの「はい/いいえ」── 「2通りのことを何回もくりかえして、片方が何回出るか」はすべて二項分布 です。
1. ベルヌーイ分布 ── 二項分布の構成単位
ベルヌーイ試行 =結果が「成功(1)か失敗(0)」の2通りしかない1回の試行(コインの表裏、製品の良品/不良)。その結果を表す確率変数 X X X が従うのがベルヌーイ分布 B e r n o u l l i ( p ) \mathrm{Bernoulli}(p) Bernoulli ( p ) :
P ( X = 1 ) = p , P ( X = 0 ) = 1 − p ( 0 ≤ p ≤ 1 ) . P(X=1)=p,\qquad P(X=0)=1-p\qquad(0\le p\le1). P ( X = 1 ) = p , P ( X = 0 ) = 1 − p ( 0 ≤ p ≤ 1 ) .
PMFを1本の式で書くと P ( X = x ) = p x ( 1 − p ) 1 − x P(X=x)=p^x(1-p)^{1-x} P ( X = x ) = p x ( 1 − p ) 1 − x (x ∈ { 0 , 1 } x\in\{0,1\} x ∈ { 0 , 1 } 。x = 1 x=1 x = 1 で p p p 、x = 0 x=0 x = 0 で 1 − p 1-p 1 − p になる)。
期待値・分散 (確率変数(離散・連続)と期待値・分散 で導出済み、ここで再確認):
E [ X ] = 0 ⋅ ( 1 − p ) + 1 ⋅ p = p , V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 . E[X]=0\cdot(1-p)+1\cdot p=p,\qquad
V[X]=E[X^2]-(E[X])^2. E [ X ] = 0 ⋅ ( 1 − p ) + 1 ⋅ p = p , V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 .
ここで X ∈ { 0 , 1 } X\in\{0,1\} X ∈ { 0 , 1 } なら X 2 = X X^2=X X 2 = X (0 2 = 0 , 1 2 = 1 0^2=0,\ 1^2=1 0 2 = 0 , 1 2 = 1 )だから E [ X 2 ] = E [ X ] = p E[X^2]=E[X]=p E [ X 2 ] = E [ X ] = p 。よって
V [ X ] = p − p 2 = p ( 1 − p ) . V[X]=p-p^2=p(1-p). V [ X ] = p − p 2 = p ( 1 − p ) .
要するに**「ベルヌーイの分散は p ( 1 − p ) p(1-p) p ( 1 − p ) 、p = 0.5 p=0.5 p = 0.5 で最大 0.25 0.25 0.25 、p = 0 p=0 p = 0 または 1 1 1 で 0 0 0 」**(結果が確定する両端でばらつき0)。
MGF (確率変数の変換・モーメント母関数・積率 ):
M X ( t ) = E [ e t X ] = e t ⋅ 0 ( 1 − p ) + e t ⋅ 1 p = ( 1 − p ) + p e t . M_X(t)=E[e^{tX}]=e^{t\cdot0}(1-p)+e^{t\cdot1}p=(1-p)+pe^t. M X ( t ) = E [ e tX ] = e t ⋅ 0 ( 1 − p ) + e t ⋅ 1 p = ( 1 − p ) + p e t .
このMGFが二項分布のMGFの土台 (後述、独立和でこれの n n n 乗になる)。
要するにベルヌーイ分布は「1回ぶんの成功/失敗」 。これを n n n 回ぶん足したものが二項分布です。
flowchart LR
A["ベルヌーイ分布<br/>1回の成功/失敗<br/>E=p, V=p(1-p)"] -->|"独立にn回足す"| B["二項分布<br/>n回中の成功回数<br/>E=np, V=np(1-p)"]
B -->|"n大・p中庸"| C["正規分布<br/>N(np, np(1-p))"]
B -->|"n大・p小"| D["ポアソン分布<br/>平均λ=np"]
この図の流れ(ベルヌーイ → 足して二項 → 大きくすると正規かポアソン)が、確率分布の章ぜんたいの骨組みです。
2. 二項分布 ── ベルヌーイを n n n 回足す
二項分布 B i n ( n , p ) \mathrm{Bin}(n,p) Bin ( n , p ) =成功確率 p p p のベルヌーイ試行を独立に n n n 回 くりかえしたときの成功回数 X X X の分布。適用条件は4つ:(i) 試行回数 n n n が固定、(ii) 各試行は成功/失敗の2値、(iii) 成功確率 p p p が毎回一定、(iv) 各試行が独立。
PMF(確率質量関数):
P ( X = k ) = n C k p k ( 1 − p ) n − k ( k = 0 , 1 , … , n ) . P(X=k)={}_nC_k\,p^k(1-p)^{n-k}\qquad(k=0,1,\dots,n). P ( X = k ) = n C k p k ( 1 − p ) n − k ( k = 0 , 1 , … , n ) .
式の意味(3パーツに分解) :
パーツ 意味 p k p^k p k 成功 k k k 回ぶんの確率(独立なので掛ける) ( 1 − p ) n − k (1-p)^{n-k} ( 1 − p ) n − k 失敗 n − k n-k n − k 回ぶんの確率 n C k {}_nC_k n C k n n n 回のうちどの k k k 回が成功か の場所の選び方(場合の数・順列・組合せ )
たとえば n = 3 , k = 2 n=3,k=2 n = 3 , k = 2 なら、成功2回の並びは「○○×」「○×○」「×○○」の 3 C 2 = 3 {}_3C_2=3 3 C 2 = 3 通りで、どれも確率 p 2 ( 1 − p ) p^2(1-p) p 2 ( 1 − p ) 。足して 3 C 2 p 2 ( 1 − p ) {}_3C_2\,p^2(1-p) 3 C 2 p 2 ( 1 − p ) 。これが**「1つの並びの確率 × \times × 並びの数」**という二項分布PMFの構造。
総和が1になること (確率分布の定義の確認、二項定理):
∑ k = 0 n n C k p k ( 1 − p ) n − k = ( p + ( 1 − p ) ) n = 1 n = 1. \sum_{k=0}^{n}{}_nC_k\,p^k(1-p)^{n-k}=\big(p+(1-p)\big)^n=1^n=1. k = 0 ∑ n n C k p k ( 1 − p ) n − k = ( p + ( 1 − p ) ) n = 1 n = 1.
二項定理 ( a + b ) n = ∑ k n C k a k b n − k (a+b)^n=\sum_k {}_nC_k a^k b^{n-k} ( a + b ) n = ∑ k n C k a k b n − k に a = p , b = 1 − p a=p,\ b=1-p a = p , b = 1 − p を入れただけ。二項定理がそのまま「確率の総和=1」を保証する (場合の数・順列・組合せ の二項展開)。これが「二項分布」という名前の由来。
3. 期待値 E [ X ] = n p E[X]=np E [ X ] = n p ・分散 V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) の2通りの導出
本トピックの数理の山。Phase 2 で用意した2つの道具(独立和・MGF)で同じ答えに到達する。数式が苦手なら結論「E = n p , V = n p ( 1 − p ) E=np,\ V=np(1-p) E = n p , V = n p ( 1 − p ) 」だけ覚えればOKです。
i i i 回目の試行を指示変数 X i ∈ { 0 , 1 } X_i\in\{0,1\} X i ∈ { 0 , 1 } (成功で1)とすると、成功回数は
X = X 1 + X 2 + ⋯ + X n = ∑ i = 1 n X i , X i ∼ i.i.d. B e r n o u l l i ( p ) . X=X_1+X_2+\cdots+X_n=\sum_{i=1}^n X_i,\qquad X_i\overset{\text{i.i.d.}}{\sim}\mathrm{Bernoulli}(p). X = X 1 + X 2 + ⋯ + X n = i = 1 ∑ n X i , X i ∼ i.i.d. Bernoulli ( p ) .
期待値 は線形性(独立不要、常に成立、期待値・分散の性質(線形性・和の分散・共分散) ):
E [ X ] = ∑ i = 1 n E [ X i ] = ∑ i = 1 n p = n p . E[X]=\sum_{i=1}^n E[X_i]=\sum_{i=1}^n p=np. E [ X ] = i = 1 ∑ n E [ X i ] = i = 1 ∑ n p = n p .
分散 は独立和(共分散0)なので加法的:
V [ X ] = ∑ i = 1 n V [ X i ] = ∑ i = 1 n p ( 1 − p ) = n p ( 1 − p ) . V[X]=\sum_{i=1}^n V[X_i]=\sum_{i=1}^n p(1-p)=np(1-p). V [ X ] = i = 1 ∑ n V [ X i ] = i = 1 ∑ n p ( 1 − p ) = n p ( 1 − p ) .
X i X_i X i が独立 ⟹ 無相関 ⟹ C o v ( X i , X j ) = 0 \mathrm{Cov}(X_i,X_j)=0 Cov ( X i , X j ) = 0 なので和の分散に交差項が出ない(期待値・分散の性質(線形性・和の分散・共分散) の「分散の加法性は無相関が必要」)。要するに**「ベルヌーイ1個の E = p , V = p ( 1 − p ) E=p,V=p(1-p) E = p , V = p ( 1 − p ) を n n n 個足しただけ」**。これが最も速い導出。
ポイント:期待値の足し算は独立でなくても成り立ちますが、分散の足し算は独立(無相関)のときだけ です。二項分布は「各試行が独立」が前提なので分散がきれいに n p ( 1 − p ) np(1-p) n p ( 1 − p ) になります(期待値・分散の性質(線形性・和の分散・共分散) )。
独立和のMGFは各MGFの積(確率変数の変換・モーメント母関数・積率 )。X = ∑ X i X=\sum X_i X = ∑ X i で各 X i X_i X i のMGFが 1 − p + p e t 1-p+pe^t 1 − p + p e t だから
M X ( t ) = ∏ i = 1 n M X i ( t ) = ( 1 − p + p e t ) n . M_X(t)=\prod_{i=1}^n M_{X_i}(t)=\big(1-p+pe^t\big)^n. M X ( t ) = i = 1 ∏ n M X i ( t ) = ( 1 − p + p e t ) n .
要するに**「二項のMGF=ベルヌーイMGFの n n n 乗」**(独立同分布の和の積)。これを微分してモーメントを取り出す(M ′ ( 0 ) = E [ X ] , M ′ ′ ( 0 ) = E [ X 2 ] M'(0)=E[X],\ M''(0)=E[X^2] M ′ ( 0 ) = E [ X ] , M ′′ ( 0 ) = E [ X 2 ] )。
1階微分(合成関数、d d t ( 1 − p + p e t ) = p e t \frac{d}{dt}(1-p+pe^t)=pe^t d t d ( 1 − p + p e t ) = p e t ):
M X ′ ( t ) = n ( 1 − p + p e t ) n − 1 ⋅ p e t . M_X'(t)=n(1-p+pe^t)^{n-1}\cdot pe^t. M X ′ ( t ) = n ( 1 − p + p e t ) n − 1 ⋅ p e t .
t = 0 t=0 t = 0 を代入(e 0 = 1 , 1 − p + p = 1 e^0=1,\ 1-p+p=1 e 0 = 1 , 1 − p + p = 1 ):
E [ X ] = M X ′ ( 0 ) = n ⋅ 1 n − 1 ⋅ p = n p . ✓ E[X]=M_X'(0)=n\cdot1^{n-1}\cdot p=np.\ \checkmark E [ X ] = M X ′ ( 0 ) = n ⋅ 1 n − 1 ⋅ p = n p . ✓
2階微分(積の微分):
M X ′ ′ ( t ) = n ( n − 1 ) ( 1 − p + p e t ) n − 2 ( p e t ) 2 + n ( 1 − p + p e t ) n − 1 p e t . M_X''(t)=n(n-1)(1-p+pe^t)^{n-2}(pe^t)^2+n(1-p+pe^t)^{n-1}pe^t. M X ′′ ( t ) = n ( n − 1 ) ( 1 − p + p e t ) n − 2 ( p e t ) 2 + n ( 1 − p + p e t ) n − 1 p e t .
t = 0 t=0 t = 0 で
E [ X 2 ] = M X ′ ′ ( 0 ) = n ( n − 1 ) p 2 + n p . E[X^2]=M_X''(0)=n(n-1)p^2+np. E [ X 2 ] = M X ′′ ( 0 ) = n ( n − 1 ) p 2 + n p .
よって
V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 = n ( n − 1 ) p 2 + n p − ( n p ) 2 = n p − n p 2 = n p ( 1 − p ) . ✓ V[X]=E[X^2]-(E[X])^2=n(n-1)p^2+np-(np)^2
=np-np^2=np(1-p).\ \checkmark V [ X ] = E [ X 2 ] − ( E [ X ] ) 2 = n ( n − 1 ) p 2 + n p − ( n p ) 2 = n p − n p 2 = n p ( 1 − p ) . ✓
(n ( n − 1 ) p 2 − n 2 p 2 = − n p 2 n(n-1)p^2-n^2p^2=-np^2 n ( n − 1 ) p 2 − n 2 p 2 = − n p 2 、これに + n p +np + n p を足して n p − n p 2 = n p ( 1 − p ) np-np^2=np(1-p) n p − n p 2 = n p ( 1 − p ) 。)
2つの道筋が一致 することで、「独立和」「MGF」という Phase 2 の2系統の道具が同じ結論に至ることを確認できる。導出(1)は速く、導出(2)は高次モーメント(歪度・尖度)も同じ枠組みで出せる汎用性がある。
4. 分布の形状とパラメータ
PMFの形(棒グラフの形)は p p p と n n n で決まる。
p p p の値形 p = 0.5 p=0.5 p = 0.5 左右対称(山が真ん中、P ( X = k ) = P ( X = n − k ) P(X=k)=P(X=n-k) P ( X = k ) = P ( X = n − k ) ) p < 0.5 p<0.5 p < 0.5 右に裾を引く(右に歪む、ピークが左寄り。失敗が出やすいので小さい k k k に山) p > 0.5 p>0.5 p > 0.5 左に裾を引く(左に歪む、ピークが右寄り)
n n n を増やすと :(p p p 固定でも)相対的に対称に近づく ── これが正規近似(CLT)の前触れ(中心極限定理(CLT) )。
最頻値(モード) :⌊ ( n + 1 ) p ⌋ \lfloor(n+1)p\rfloor ⌊( n + 1 ) p ⌋ 付近(( n + 1 ) p (n+1)p ( n + 1 ) p が整数なら2つの最頻値)。期待値 n p np n p の近く。
歪みの符号は歪度 1 − 2 p n p ( 1 − p ) \dfrac{1-2p}{\sqrt{np(1-p)}} n p ( 1 − p ) 1 − 2 p で測れる(p < 0.5 p<0.5 p < 0.5 で正=右歪み、p = 0.5 p=0.5 p = 0.5 で0、p > 0.5 p>0.5 p > 0.5 で負)。n → ∞ n\to\infty n → ∞ で歪度 → 0 \to0 → 0 =対称化(確率変数の変換・モーメント母関数・積率 の歪度)。
5. 再生性(加法性)── 同じ p p p のときだけ足せる
独立な X ∼ B i n ( n 1 , p ) X\sim\mathrm{Bin}(n_1,p) X ∼ Bin ( n 1 , p ) と Y ∼ B i n ( n 2 , p ) Y\sim\mathrm{Bin}(n_2,p) Y ∼ Bin ( n 2 , p ) (成功確率 p p p が同じ)の和は X + Y ∼ B i n ( n 1 + n 2 , p ) X+Y\sim\mathrm{Bin}(n_1+n_2,p) X + Y ∼ Bin ( n 1 + n 2 , p ) 。
直観:n 1 n_1 n 1 回の試行と n 2 n_2 n 2 回の試行を合わせれば n 1 + n 2 n_1+n_2 n 1 + n 2 回の試行で、成功確率は同じ p p p 。だから合計成功回数は B i n ( n 1 + n 2 , p ) \mathrm{Bin}(n_1+n_2,p) Bin ( n 1 + n 2 , p ) 。
MGFで証明 (確率変数の変換・モーメント母関数・積率 、独立和はMGFの積):
M X + Y ( t ) = M X ( t ) M Y ( t ) = ( 1 − p + p e t ) n 1 ( 1 − p + p e t ) n 2 = ( 1 − p + p e t ) n 1 + n 2 . M_{X+Y}(t)=M_X(t)M_Y(t)=(1-p+pe^t)^{n_1}(1-p+pe^t)^{n_2}=(1-p+pe^t)^{n_1+n_2}. M X + Y ( t ) = M X ( t ) M Y ( t ) = ( 1 − p + p e t ) n 1 ( 1 − p + p e t ) n 2 = ( 1 − p + p e t ) n 1 + n 2 .
これは B i n ( n 1 + n 2 , p ) \mathrm{Bin}(n_1+n_2,p) Bin ( n 1 + n 2 , p ) のMGFそのもの。MGFの一意性より X + Y ∼ B i n ( n 1 + n 2 , p ) X+Y\sim\mathrm{Bin}(n_1+n_2,p) X + Y ∼ Bin ( n 1 + n 2 , p ) 。■ \blacksquare ■
要するに 「同じ p p p なら指数が足し算で合体」。p p p が違うと底 ( 1 − p + p e t ) (1-p+pe^t) ( 1 − p + p e t ) が揃わず、積が二項分布のMGFにならない ── だから**p p p が異なる二項分布の和は二項分布にならない**(再生性は同じ p p p が必須)。
6. 近似の2方向 ── 次トピックへの布石
二項分布の確率計算は n n n が大きいと n C k {}_nC_k n C k が巨大で大変。そこで近似を使う。どちらに近似するかは p p p で決まる 。
近似先 条件 近似式 補正 正規分布 n n n 大・p p p 中庸(n p ≥ 5 np\ge5 n p ≥ 5 かつ n ( 1 − p ) ≥ 5 n(1-p)\ge5 n ( 1 − p ) ≥ 5 が目安)B i n ( n , p ) ≈ N ( n p , n p ( 1 − p ) ) \mathrm{Bin}(n,p)\approx N(np,\,np(1-p)) Bin ( n , p ) ≈ N ( n p , n p ( 1 − p )) 連続性補正 ± 0.5 \pm0.5 ± 0.5 ポアソン分布 n n n 大・p p p 小(λ = n p \lambda=np λ = n p 一定、n → ∞ , p → 0 n\to\infty,p\to0 n → ∞ , p → 0 )B i n ( n , p ) ≈ P o i s s o n ( λ = n p ) \mathrm{Bin}(n,p)\approx \mathrm{Poisson}(\lambda=np) Bin ( n , p ) ≈ Poisson ( λ = n p ) 補正不要(離散→離散)
正規近似(ド・モアブル=ラプラス) :中心極限定理(CLT) で詳述済み。二項=独立ベルヌーイ和だからCLTで N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N ( n p , n p ( 1 − p )) 。p p p が0や1に近いと非対称で崩れる。離散→連続なので連続性補正 が要る。
ポアソン近似 :p p p が小さく稀な事象(レアイベント)のとき。n p = λ np=\lambda n p = λ を一定に保って n → ∞ , p → 0 n\to\infty,p\to0 n → ∞ , p → 0 にすると P o i s s o n ( λ ) \mathrm{Poisson}(\lambda) Poisson ( λ ) に収束(ポアソン分布 で導出)。離散→離散なので補正不要。
判定の勘どころ:分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) が大きい(p p p が中庸)→ 正規/p p p が小さく n p np n p が小さいまま → ポアソン 。
7. 試験での問われ方(級ごとの差)
3級(確率計算) :二項分布のPMF P ( X = k ) = n C k p k ( 1 − p ) n − k P(X=k)={}_nC_k p^k(1-p)^{n-k} P ( X = k ) = n C k p k ( 1 − p ) n − k を使った具体的な確率計算 (「コインを8回投げて表がちょうど3回」「不良率0.1で5個中2個が不良」など)。ベルヌーイ試行の意味、二項分布の適用条件の判定。
2級(中核) :期待値 n p np n p ・分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) の計算と利用 、n p ( 1 − p ) \sqrt{np(1-p)} n p ( 1 − p ) (標準偏差)、二項分布の正規近似 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N ( n p , n p ( 1 − p )) で確率を求める、標本比率 p ^ = X / n \hat p=X/n p ^ = X / n の期待値 p p p ・分散 p ( 1 − p ) / n p(1-p)/n p ( 1 − p ) / n (Phase 4 推定の土台)。確率分布分野の中心トピック。
2級の発展/準1級 :連続性補正 ± 0.5 \pm0.5 ± 0.5 を入れた確率計算(中心極限定理(CLT) )、再生性 (同じ p p p の和)、MGFからの E , V E,V E , V 導出、ポアソン近似との使い分け(ポアソン分布 )。
※公式の出題範囲表は改訂されうる。二項分布は3級(確率計算)と2級(期待値・分散・正規近似)にまたがるが、級ごとの深さの線引き・連続性補正や再生性の扱いは受験前に最新の範囲表で要最新確認 。
数式の直観的意味
なぜ P ( X = k ) = n C k p k ( 1 − p ) n − k P(X=k)={}_nC_k p^k(1-p)^{n-k} P ( X = k ) = n C k p k ( 1 − p ) n − k なのか(場所×並びの確率)
二項分布の確率を作る手順を分解すると2段階。(段1) 1つの具体的な並びの確率 :たとえば「成功・成功・…(k k k 回)・失敗・…(n − k n-k n − k 回)」という1つの順番が起こる確率は、独立だから各試行の確率の積で p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k 。順番が違っても成功 k k k 回・失敗 n − k n-k n − k 回なら同じ値 (掛け算は順序によらない)。(段2) そういう並びが何通りあるか :n n n 個の枠から成功が入る k k k 個を選ぶ選び方で n C k {}_nC_k n C k 通り(場合の数・順列・組合せ の組合せ。順序は問わず「どの枠が成功か」だけ)。確率はどれも同じ p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k なので、足すと「1 1 1 並びの確率 × \times × 並びの数」=n C k p k ( 1 − p ) n − k {}_nC_k\,p^k(1-p)^{n-k} n C k p k ( 1 − p ) n − k 。**「組合せ(場所の数)× 1つの並びの確率」**が二項分布PMFの正体。
なぜ E [ X ] = n p E[X]=np E [ X ] = n p なのか(足し算の期待値)
期待値の線形性 E [ X + Y ] = E [ X ] + E [ Y ] E[X+Y]=E[X]+E[Y] E [ X + Y ] = E [ X ] + E [ Y ] は独立を一切仮定せず常に成立 する(期待値・分散の性質(線形性・和の分散・共分散) )。成功回数 X X X は指示変数の和 X = ∑ X i X=\sum X_i X = ∑ X i で、各 X i X_i X i の期待値は「1回の成功確率」p p p 。だから n n n 個足して n p np n p 。**「1回あたり平均 p p p 回成功するのを n n n 回くりかえせば平均 n p np n p 回」**という素直な話。期待値だから独立性は要らない(仮に試行が従属でも E [ X ] = n p E[X]=np E [ X ] = n p は成り立つ)。
なぜ V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) には独立が要るのか
分散の加法性 V [ X + Y ] = V [ X ] + V [ Y ] V[X+Y]=V[X]+V[Y] V [ X + Y ] = V [ X ] + V [ Y ] は無相関(独立)のときだけ 成立する(一般には + 2 C o v +2\mathrm{Cov} + 2 Cov が付く、期待値・分散の性質(線形性・和の分散・共分散) )。二項分布は各試行が独立 という前提があるので C o v ( X i , X j ) = 0 \mathrm{Cov}(X_i,X_j)=0 Cov ( X i , X j ) = 0 、よって交差項が消えて V [ X ] = ∑ V [ X i ] = n p ( 1 − p ) V[X]=\sum V[X_i]=np(1-p) V [ X ] = ∑ V [ X i ] = n p ( 1 − p ) 。もし試行が独立でなければ(例:くじを戻さず引く=超幾何分布)、分散は n p ( 1 − p ) np(1-p) n p ( 1 − p ) にならない (共分散が負に効いて分散が小さくなる)。だから「二項分布の分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) 」は独立性に支えられた式。これが二項分布(復元)と超幾何分布(非復元)の分散の違いの根。
なぜ V [ X ] V[X] V [ X ] は p = 0.5 p=0.5 p = 0.5 で最大なのか
V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) を p p p の関数 f ( p ) = p ( 1 − p ) = p − p 2 f(p)=p(1-p)=p-p^2 f ( p ) = p ( 1 − p ) = p − p 2 と見ると、f ′ ( p ) = 1 − 2 p = 0 f'(p)=1-2p=0 f ′ ( p ) = 1 − 2 p = 0 より p = 0.5 p=0.5 p = 0.5 で極大、f ( 0.5 ) = 0.25 f(0.5)=0.25 f ( 0.5 ) = 0.25 。「結果が五分五分のときが最も予測しづらい(ばらつき最大)、確率が0や1に寄るほど結果が確定してばらつき0」 。標本比率の標準誤差 p ( 1 − p ) / n \sqrt{p(1-p)/n} p ( 1 − p ) / n が p = 0.5 p=0.5 p = 0.5 で最大になるのも同じ理由で、Phase 4 の比率の区間推定で「最も保守的な誤差は p = 0.5 p=0.5 p = 0.5 」として使われる。
⚠️ 引っかけポイント・頻出論点・級ごとの差
n C k {}_nC_k n C k の付け忘れ(3級最頻出) :「ちょうど k k k 回成功」の確率は p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k だけでは不足 。場所の選び方 n C k {}_nC_k n C k を必ず掛ける。p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k は「特定の1つの並び」の確率にすぎない。
「以上・以下・ちょうど」の取り違え :「3回以上成功」は P ( X ≥ 3 ) = ∑ k ≥ 3 P ( X = k ) P(X\ge3)=\sum_{k\ge3}P(X=k) P ( X ≥ 3 ) = ∑ k ≥ 3 P ( X = k ) で、余事象 1 − P ( X ≤ 2 ) 1-P(X\le2) 1 − P ( X ≤ 2 ) を使うと速い。「ちょうど3回」P ( X = 3 ) P(X=3) P ( X = 3 ) と混同しない。「少なくとも1回」= 1 − P ( X = 0 ) = 1 − ( 1 − p ) n =1-P(X=0)=1-(1-p)^n = 1 − P ( X = 0 ) = 1 − ( 1 − p ) n 。
分散と標準偏差の混同 :V [ X ] = n p ( 1 − p ) V[X]=np(1-p) V [ X ] = n p ( 1 − p ) 、標準偏差は n p ( 1 − p ) \sqrt{np(1-p)} n p ( 1 − p ) 。正規近似の標準化 z = X − n p n p ( 1 − p ) z=\frac{X-np}{\sqrt{np(1-p)}} z = n p ( 1 − p ) X − n p で分母は標準偏差(分散の平方根)。
再生性は同じ p p p のときだけ :B i n ( n 1 , p ) + B i n ( n 2 , p ) = B i n ( n 1 + n 2 , p ) \mathrm{Bin}(n_1,p)+\mathrm{Bin}(n_2,p)=\mathrm{Bin}(n_1+n_2,p) Bin ( n 1 , p ) + Bin ( n 2 , p ) = Bin ( n 1 + n 2 , p ) は p p p が等しい場合のみ。p p p が違う2つの二項分布の和は二項分布にならない。
独立性の前提を忘れる(超幾何との混同) :二項分布は「復元抽出 (毎回 p p p 一定・独立)」。袋から戻さず引く(非復元 )と p p p が変わり独立でなくなる ── それは超幾何分布で、分散は n p ( 1 − p ) np(1-p) n p ( 1 − p ) より小さい(幾何分布・超幾何分布・負の二項分布 )。「箱から不良品を取り出す」系は復元か非復元かを必ず確認。
正規近似 vs ポアソン近似の選択(2級) :p p p が中庸で n p , n ( 1 − p ) ≥ 5 np,n(1-p)\ge5 n p , n ( 1 − p ) ≥ 5 なら正規近似。p p p が小さく稀な事象なら(n p np n p が小さいまま)ポアソン近似。p = 0.5 p=0.5 p = 0.5 にポアソン近似は不適、p = 0.001 p=0.001 p = 0.001 に正規近似は不適。
正規近似に連続性補正(2級発展) :二項(離散)を正規(連続)で近似するときは ± 0.5 \pm0.5 ± 0.5 の連続性補正を入れる(中心極限定理(CLT) )。ポアソン近似(離散→離散)には補正不要。
n p np n p は期待値であって確率ではない :「平均 n p np n p 回成功」は回数の期待値。n p > 1 np>1 n p > 1 でも特定回数の確率は1を超えない(当たり前だが計算で混乱しやすい)。
級差 :3級=PMFでの確率計算 (n C k p k ( 1 − p ) n − k {}_nC_k p^k(1-p)^{n-k} n C k p k ( 1 − p ) n − k )・ベルヌーイ試行の意味。2級=E = n p , V = n p ( 1 − p ) E=np,V=np(1-p) E = n p , V = n p ( 1 − p ) ・正規近似・標本比率 。2級発展/準1級=連続性補正・再生性・MGF導出・ポアソン近似との使い分け 。
よくある疑問
Q1. n C k {}_nC_k n C k を掛けるのを忘れがちです。なぜ必要?
「ちょうど k k k 回成功」の確率は p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k だけでは足りません 。これは「1回目から k k k 回目までが成功、残りが失敗」という特定の1つの順番 の確率にすぎないからです。成功する回の組合せが n C k {}_nC_k n C k 通りあって、どれも同じ確率なので、その通り数 n C k {}_nC_k n C k を掛けます。3級でいちばん多いミス なので、二項分布の確率を出すときは必ず組合せを掛ける、と意識してください。
Q2. 「3回以上成功」の確率はどう求める?
P ( X ≥ 3 ) = P ( X = 3 ) + P ( X = 4 ) + ⋯ + P ( X = n ) P(X\ge3)=P(X=3)+P(X=4)+\cdots+P(X=n) P ( X ≥ 3 ) = P ( X = 3 ) + P ( X = 4 ) + ⋯ + P ( X = n ) ですが、項が多いときは余事象 を使うと速いです。P ( X ≥ 3 ) = 1 − P ( X ≤ 2 ) = 1 − { P ( X = 0 ) + P ( X = 1 ) + P ( X = 2 ) } P(X\ge3)=1-P(X\le2)=1-\{P(X=0)+P(X=1)+P(X=2)\} P ( X ≥ 3 ) = 1 − P ( X ≤ 2 ) = 1 − { P ( X = 0 ) + P ( X = 1 ) + P ( X = 2 )} 。とくに「少なくとも1回成功」は P ( X ≥ 1 ) = 1 − P ( X = 0 ) = 1 − ( 1 − p ) n P(X\ge1)=1-P(X=0)=1-(1-p)^n P ( X ≥ 1 ) = 1 − P ( X = 0 ) = 1 − ( 1 − p ) n が定番です。「以上・以下・ちょうど」を読み間違えないことが大事です。
Q3. 「袋から戻さずに引く」場合も二項分布ですか?
いいえ、それは超幾何分布 になります。二項分布は「毎回 p p p が一定で、各試行が独立」が前提です(=復元抽出 )。袋から玉を戻さずに 引くと、引くたびに残りの比率が変わって p p p が一定でなくなり、試行が独立でなくなります。このとき分散は n p ( 1 − p ) np(1-p) n p ( 1 − p ) より小さくなります(幾何分布・超幾何分布・負の二項分布 )。「箱から不良品を取り出す」系の問題は、戻すのか戻さないのか を必ず確認してください。
Q4. 正規近似とポアソン近似、どっちを使えばいい?
p p p で決めます。p p p が中庸で n p ≥ 5 np\ge5 n p ≥ 5 かつ n ( 1 − p ) ≥ 5 n(1-p)\ge5 n ( 1 − p ) ≥ 5 くらいなら正規近似 、p p p が小さくて稀な事象(n p np n p が小さいまま)ならポアソン近似 です。p = 0.5 p=0.5 p = 0.5 にポアソン近似は不適、p = 0.001 p=0.001 p = 0.001 に正規近似は不適、と覚えておけば十分です。判断に迷ったら「分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) が大きいか小さいか」を見ます。
Q5. 二項分布どうしは足せますか?
成功確率 p p p が同じなら足せます 。B i n ( n 1 , p ) + B i n ( n 2 , p ) = B i n ( n 1 + n 2 , p ) \mathrm{Bin}(n_1,p)+\mathrm{Bin}(n_2,p)=\mathrm{Bin}(n_1+n_2,p) Bin ( n 1 , p ) + Bin ( n 2 , p ) = Bin ( n 1 + n 2 , p ) (再生性・加法性)。直観的には「n 1 n_1 n 1 回の試行と n 2 n_2 n 2 回の試行を合わせれば n 1 + n 2 n_1+n_2 n 1 + n 2 回の試行」だからです。ただし**p p p が違うと足せません**(二項分布になりません)。p p p が同じことが条件です。
まとめ
ベルヌーイ分布 =1回の成功/失敗。E = p , V = p ( 1 − p ) E=p,\ V=p(1-p) E = p , V = p ( 1 − p ) 。これを n n n 個足したのが二項分布。
二項分布 B i n ( n , p ) \mathrm{Bin}(n,p) Bin ( n , p ) の確率は P ( X = k ) = n C k p k ( 1 − p ) n − k P(X=k)={}_nC_k\,p^k(1-p)^{n-k} P ( X = k ) = n C k p k ( 1 − p ) n − k 。組合せ n C k {}_nC_k n C k の掛け忘れに注意。
期待値 n p np n p ・分散 n p ( 1 − p ) np(1-p) n p ( 1 − p ) 。ベルヌーイの足し算で導けます(分散の足し算には独立が必要)。p = 0.5 p=0.5 p = 0.5 で分散最大。
確率の合計が1になるのは二項定理 から。これが名前の由来。
n n n が大きいとき、p p p 中庸なら正規近似 、p p p 小ならポアソン近似 。p p p で使い分けます。
再生性 は同じ p p p のときだけ。非復元抽出は二項でなく超幾何。
対応するシミュレーション
simulations/nikou_bunpu_keijou.py
何を示すか :二項分布のPMF n C k p k ( 1 − p ) n − k {}_nC_k p^k(1-p)^{n-k} n C k p k ( 1 − p ) n − k を複数の ( n , p ) (n,p) ( n , p ) で棒グラフに描き、p = 0.5 p=0.5 p = 0.5 の左右対称・p ≠ 0.5 p\neq0.5 p = 0.5 の歪み(p < 0.5 p<0.5 p < 0.5 右裾/p > 0.5 p>0.5 p > 0.5 左裾)・n n n を増やすと対称に近づく様子を可視化。さらに二項乱数(np.random.binomial)のヒストグラムが理論PMFに重なること、標本平均 ≈ n p \approx np ≈ n p ・標本分散 ≈ n p ( 1 − p ) \approx np(1-p) ≈ n p ( 1 − p ) を数値で確認。
結論(seed=0) :PMF形状は p = 0.2 p=0.2 p = 0.2 (右に歪む)・p = 0.5 p=0.5 p = 0.5 (対称)・p = 0.8 p=0.8 p = 0.8 (左に歪む)で予想通り。n = 10 → 50 n=10\to50 n = 10 → 50 で p = 0.2 p=0.2 p = 0.2 でも対称化が進む。乱数10万個の検証では B i n ( 20 , 0.3 ) \mathrm{Bin}(20,0.3) Bin ( 20 , 0.3 ) で標本平均 5.9972 (理論 n p = 6.0 np=6.0 n p = 6.0 )・標本分散 4.2065 (理論 n p ( 1 − p ) = 4.2 np(1-p)=4.2 n p ( 1 − p ) = 4.2 )と一致。ヒストグラムが理論PMFの棒にぴたりと重なる。
simulations/nikou_bunpu_kinji.py
何を示すか :近似の2方向を1枚で対比。左=B i n ( 50 , 0.5 ) \mathrm{Bin}(50,0.5) Bin ( 50 , 0.5 ) (p p p 中庸)に正規近似 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N ( n p , n p ( 1 − p )) がよく合う/右=B i n ( 50 , 0.04 ) \mathrm{Bin}(50,0.04) Bin ( 50 , 0.04 ) (λ = n p = 2 \lambda=np=2 λ = n p = 2 一定相当の p p p 小)にポアソン近似 P o i s s o n ( λ = n p ) \mathrm{Poisson}(\lambda=np) Poisson ( λ = n p ) がよく合うことを重ね描き。各 k k k での近似誤差(絶対値の最大)を出力して、p p p 中庸では正規が、p p p 小ではポアソンが優れることを数値で示す。
結論(scipy不使用、正規PDF・ポアソンPMFは自前計算) :B i n ( 50 , 0.5 ) \mathrm{Bin}(50,0.5) Bin ( 50 , 0.5 ) では正規近似の最大誤差 0.00056 に対しポアソン近似は 0.03275 (正規が約58倍精確)。B i n ( 50 , 0.04 ) \mathrm{Bin}(50,0.04) Bin ( 50 , 0.04 ) では逆にポアソン近似の最大誤差 0.00556 に対し正規近似は 0.04869 (ポアソンが約9倍精確、p p p 小で正規が崩れる)。**「p p p で近似先が変わる」**を誤差の数値で裏づけ。
関連ノート
場合の数・順列・組合せ (場合の数・順列・組合せ ── PMFの n C k {}_nC_k n C k (成功の場所の選び方)、総和=1を保証する二項定理 ( p + ( 1 − p ) ) n (p+(1-p))^n ( p + ( 1 − p ) ) n 。後方リンク)
条件付き確率・独立性・全確率の定理 (条件付き確率・独立性 ── 独立反復試行 p k ( 1 − p ) n − k p^k(1-p)^{n-k} p k ( 1 − p ) n − k の根拠、二項分布の独立性前提。後方リンク)
確率変数(離散・連続)と期待値・分散 (確率変数・期待値・分散 ── ベルヌーイの E [ X ] = p , V [ X ] = p ( 1 − p ) E[X]=p,\ V[X]=p(1-p) E [ X ] = p , V [ X ] = p ( 1 − p ) (X 2 = X X^2=X X 2 = X )の導出元。後方リンク)
期待値・分散の性質(線形性・和の分散・共分散) (期待値・分散の性質 ── E , V E,V E , V を独立ベルヌーイ和で導く土台(線形性は独立不要・分散加法性は無相関必要)。後方リンク)
確率変数の変換・モーメント母関数・積率 (変換・モーメント母関数 ── ベルヌーイMGF 1 − p + p e t 1-p+pe^t 1 − p + p e t 、その n n n 乗 = = = 二項MGF、再生性をMGFの積で。後方リンク)
中心極限定理(CLT) (中心極限定理 ── 二項の正規近似 N ( n p , n p ( 1 − p ) ) N(np,np(1-p)) N ( n p , n p ( 1 − p )) (ド・モアブル=ラプラス)・連続性補正。後方リンク)
ポアソン分布 (ポアソン分布 ── 二項の λ = n p \lambda=np λ = n p 一定・n → ∞ , p → 0 n\to\infty,p\to0 n → ∞ , p → 0 極限。p p p 小・稀な事象の近似先。前方リンク・Phase 3②)
幾何分布・超幾何分布・負の二項分布 (幾何・負の二項・超幾何分布 ── 非復元抽出の超幾何は「独立でない二項」、分散が n p ( 1 − p ) np(1-p) n p ( 1 − p ) より小。前方リンク・Phase 3③)