← 統計検定テキスト 一覧

📊 対象級:4級 ・ 3級 | 重要度:A(頻出)

確率の定義・加法定理・乗法定理 ── 3つの確率の定義/包除原理/余事象/乗法定理

要点(BLUF)

本文

標本空間と事象

確率を考える土台は 標本空間 Ω\Omega(起こりうる結果すべての集合)と、その部分集合である 事象 AΩA\subseteq\Omega。確率は「事象という集合に、0011 の数を割り当てる関数」だと思えばよい。

用語記号意味
全事象Ω\Omega起こりうる結果すべて。例:サイコロなら {1,2,3,4,5,6}\{1,2,3,4,5,6\}
空事象\varnothing何も起こらない(決して起きない)事象
和事象ABA\cup BAA または BB(少なくとも一方)が起こる
積事象ABA\cap BAA かつ BB(両方同時)が起こる
余事象AcA^cAˉ\bar{A}AA起こらないΩ\Omega から AA を除いた残り
排反AB=A\cap B=\varnothingAABB同時には起こらない(互いに素)

集合演算(,,c\cup, \cap, {}^c)がそのまま事象の演算になっている、という対応がすべての出発点。

確率の3つの定義

確率という言葉には、歴史的に異なる3つの定義がある。試験では使い分けの理解が問われる。

定義式・考え方いつ使う弱点
古典的確率(数学的確率)$P(A)=\dfrac{\text{事象 }A\text{ の場合の数}}{\text{全事象の場合の数}}=\dfrac{A}{
統計的確率(経験的確率)NN 回試して AArr 回起きたとき P(A)rNP(A)\approx\dfrac{r}{N}、極限 limNrN\displaystyle\lim_{N\to\infty}\dfrac{r}{N}前提が立てにくい現象(実際の打率・故障率・天気)をデータで測るとき有限回では誤差がある。極限の存在を仮定している
公理的確率(現代的定義)コルモゴロフの3公理を満たす関数 PP なら何でも確率と認める(後述)理論の一般的土台。連続分布など場合の数で数えられないものも扱える抽象的で直観が薄い

「要するに何が違うの?」を一言で言うと、古典的=理屈で数える、統計的=実際に試して測る、公理的=数学的なルールだけで定義する

3者の関係

graph LR
  K["公理的確率<br/>コルモゴロフの3公理<br/>(一般の土台)"]
  C["古典的確率<br/>場合の数の比"]
  S["統計的確率<br/>頻度 r/N の極限"]
  K -->|"各結果が等確率<br/>(一様分布)の特殊例"| C
  K -->|"頻度→確率を<br/>大数の法則が保証"| S

要するに、実用では古典的確率・統計的確率を使い、それらを数学的に正当化する屋台骨が公理的確率

コルモゴロフの3公理(公理的確率の中身)

確率 PP とは、次の3つを満たす関数のことだ、と定める(1933年、コルモゴロフ)。

公理1(非負性)P(A)0\textbf{公理1(非負性)}\quad P(A)\ge 0 公理2(全確率)P(Ω)=1\textbf{公理2(全確率)}\quad P(\Omega)=1 公理3(完全加法性)A1,A2, が互いに排反なら  P ⁣(iAi)=iP(Ai)\textbf{公理3(完全加法性)}\quad A_1,A_2,\dots \text{ が互いに排反なら }\ P\!\left(\bigcup_{i} A_i\right)=\sum_{i} P(A_i)

要するに「①確率はマイナスにならない ②全部の確率を足すと1 ③重ならない事象は足し算でつなげる」。この3つだけから、後で使う性質(P(Ac)=1P(A)P(A^c)=1-P(A)0P10\le P\le1、加法定理…)がすべて導ける(暗記ではなく、公理からの帰結)。

加法定理

和事象 ABA\cup B(少なくとも一方が起こる)の確率:

P(AB)=P(A)+P(B)P(AB)\boxed{\,P(A\cup B)=P(A)+P(B)-P(A\cap B)\,}

要するに「両方の確率を足して、重なり P(AB)P(A\cap B) を1回引く」。重なりを足し算で二重に数えてしまうのを補正する式(理由は後述の包除原理)。

排反のときAB=A\cap B=\varnothingP(AB)=0P(A\cap B)=0)は引く分がなく、

P(AB)=P(A)+P(B)P(A\cup B)=P(A)+P(B)

3事象の包除原理(足す→ペアを引く→3つ重なりを足す、と符号が交互):

P(ABC)=P(A)+P(B)+P(C)P(AB)P(BC)P(CA)+P(ABC)P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(A\cap B)-P(B\cap C)-P(C\cap A)+P(A\cap B\cap C)

余事象

P(Ac)=1P(A)\boxed{\,P(A^c)=1-P(A)\,}

要するに「起こる確率と起こらない確率を足すと1」。「少なくとも1つ〜」を直接数えると場合分けが爆発するときに、余事象「1つも〜ない」を数えると一瞬で済むことが多い(後述の威力)。

乗法定理

積事象 ABA\cap B(両方同時に起こる)の確率:

P(AB)=P(A)P(BA)=P(B)P(AB)\boxed{\,P(A\cap B)=P(A)\,P(B\mid A)=P(B)\,P(A\mid B)\,}

ここで P(BA)P(B\mid A) は「AA が起きたという条件のもとで BB が起きる確率」(条件付き確率)。要するに「まず AA が起こり(確率 P(A)P(A))、その後 AA が起きた世界で BB が起こる(確率 P(BA)P(B\mid A))」を掛ける。

独立のときAABB に影響しない、P(BA)=P(B)P(B\mid A)=P(B))は、

P(AB)=P(A)P(B)P(A\cap B)=P(A)\,P(B)

条件付き確率・独立性の本格論は次トピック 条件付き確率・独立性・全確率の定理 へ。

具体例

どの定義・どの定理を使う?(判断フロー)

確率の問題に出会ったとき、何を使えばいいかの道筋。

flowchart TD
  Q1{"各結果は<br/>同様に確からしい?"}
  Q1 -->|はい| KOTEN["古典的確率<br/>P=場合の数の比"]
  Q1 -->|いいえ・データで測る| TOKEI["統計的確率<br/>頻度 r/N"]

  KIND{"求めるのは<br/>どんな確率?"}
  KIND -->|"AまたはB(和)"| WA["加法定理<br/>排反なら足すだけ<br/>重なりあり→引く"]
  KIND -->|"AかつB(積)"| SEKI["乗法定理<br/>独立なら P(A)P(B)<br/>従属なら P(A)・P(B given A)"]
  KIND -->|"少なくとも1つ"| YOJI["余事象<br/>1-P(起きない)"]

「同様に確からしいか?」でまず古典/統計を分け、次に「和・積・少なくとも」で加法/乗法/余事象を選ぶ、という2段構え。

試験での問われ方

数式の直観的意味

なぜ加法定理は重なりを引くのか(包除原理)

確率を「面積」だと思うと一目瞭然。P(A)P(A) は領域 AA の面積、P(B)P(B) は領域 BB の面積。ABA\cup B(合併)の面積を求めたいのに、単純に P(A)+P(B)P(A)+P(B) と足すと、重なり部分 ABA\cap BAA の分と BB の分で2回数えてしまう。だから1回分を引いて辻褄を合わせる:

P(AB)=P(A)+P(B)重なりを2回数えたP(AB)1回分を返すP(A\cup B)=\underbrace{P(A)+P(B)}_{\text{重なりを2回数えた}}-\underbrace{P(A\cap B)}_{\text{1回分を返す}}

(ベン図で2つの重なる円を描き、重なり部分を「2回数えるので1回引く」と注記するとさらに腹落ちする。重なりの幾何が本質なので、紙やExcalidrawで2つの重なる円を描くのが一番わかりやすい。)

公理から厳密にABA\cup B排反な3つに分解する。「AA だけ」=ABc=A\cap B^c、「BB だけ」=AcB=A^c\cap B、「両方」=AB=A\cap B。この3つは互いに排反なので公理3(加法性)から

P(AB)=P(ABc)+P(AcB)+P(AB).P(A\cup B)=P(A\cap B^c)+P(A^c\cap B)+P(A\cap B).

一方 A=(ABc)(AB)A=(A\cap B^c)\cup(A\cap B)(これも排反)だから P(A)=P(ABc)+P(AB)P(A)=P(A\cap B^c)+P(A\cap B)、同様に P(B)=P(AcB)+P(AB)P(B)=P(A^c\cap B)+P(A\cap B)。この2式を上に代入して整理すると

P(AB)=[P(A)P(AB)]+[P(B)P(AB)]+P(AB)=P(A)+P(B)P(AB).P(A\cup B)=\big[P(A)-P(A\cap B)\big]+\big[P(B)-P(A\cap B)\big]+P(A\cap B)=P(A)+P(B)-P(A\cap B).

排反なら AB=A\cap B=\varnothingP(AB)=0P(A\cap B)=0。すると重なりがそもそも無いので引く必要がなく、P(AB)=P(A)+P(B)P(A\cup B)=P(A)+P(B)(これは公理3そのもの)。

3事象の包除も同じ「重複補正」の発想:ペアの重なり(ABA\cap B 等)を引きすぎると、今度は3つの共通部分 ABCA\cap B\cap C を引きすぎる(足し2回・引き3回で 1-1 回多い)ので最後に1回足し戻す。これが交互符号の正体。

なぜ乗法定理は P(A)P(BA)P(A)P(B\mid A) か(縮んだ標本空間)

条件付き確率の定義そのものから出る。P(BA)P(B\mid A) は「AA が起きたとわかった世界に話を限定し、その中で BB が起きる割合」:

P(BA)=P(AB)P(A)(P(A)>0).P(B\mid A)=\frac{P(A\cap B)}{P(A)}\qquad(P(A)>0).

要するに「標本空間を Ω\Omega から AA に縮め、その縮んだ世界で ABA\cap B の割合を測る」(分母が全体 Ω\Omega ではなく AA になる)。この定義の両辺に P(A)P(A) を掛けるだけで乗法定理が出る:

P(AB)=P(A)P(BA).P(A\cap B)=P(A)\,P(B\mid A).

独立とは「AA が起きても BB の起こりやすさが変わらない」、つまり P(BA)=P(B)P(B\mid A)=P(B) のこと。これを代入すると

P(AB)=P(A)P(B)(独立の定義式).P(A\cap B)=P(A)\,P(B)\qquad(\text{独立の定義式}).

縮んだ標本空間で測っても割合が変わらない、という独立の意味がそのまま式に出ている。詳細は 条件付き確率・独立性・全確率の定理、応用(原因の確率の逆算)は ベイズの定理 へ。

コルモゴロフの公理から導かれる帰結

3公理だけから、試験で使う性質が次々に出る。

(1) P(Ac)=1P(A)P(A^c)=1-P(A)AAAcA^c は排反で、合わせると Ω\OmegaAAc=ΩA\cup A^c=\Omega)。公理3より P(A)+P(Ac)=P(Ω)P(A)+P(A^c)=P(\Omega)、公理2より P(Ω)=1P(\Omega)=1。よって

P(A)+P(Ac)=1  P(Ac)=1P(A).P(A)+P(A^c)=1\ \Longrightarrow\ P(A^c)=1-P(A).

(2) P()=0P(\varnothing)=0:(1) で A=ΩA=\Omega とおくと Ωc=\Omega^c=\varnothing なので P()=1P(Ω)=11=0P(\varnothing)=1-P(\Omega)=1-1=0

(3) 0P(A)10\le P(A)\le 1:公理1で P(A)0P(A)\ge0。さらに P(A)1P(A)\le1 は、P(Ac)=1P(A)0P(A^c)=1-P(A)\ge0P(Ac)P(A^c) も公理1で非負)より P(A)1P(A)\le1確率が必ず0〜1に収まることすら、公理から導かれる定理であって、勝手に決めた範囲ではない。

(4) 単調性 ABP(A)P(B)A\subseteq B \Rightarrow P(A)\le P(B)B=A(BAc)B=A\cup(B\cap A^c)(排反)なので P(B)=P(A)+P(BAc)P(A)P(B)=P(A)+P(B\cap A^c)\ge P(A)

このように、3つの素朴な公理が確率計算の全ルールを生む。「なぜ確率は0〜1なのか」「なぜ P(Ac)=1P(A)P(A^c)=1-P(A) なのか」は暗記ではなく公理からの帰結、というのが公理的確率の威力。

余事象の威力(「少なくとも1つ」は裏から数える)

「少なくとも1回〜が起こる」を正面から数えると、ちょうど1回・2回・…・nn 回の場合をすべて足す必要があり、組合せが膨れ上がる。だがその余事象は「1回も起こらない」のたった1通りのパターンで済む。

例:サイコロを nn 回振り「少なくとも1回6が出る」確率。

P(少なくとも1回6)=1(56)n.P(\text{少なくとも1回6})=1-\left(\frac{5}{6}\right)^n.

n=1n=1160.167\frac16\approx0.167n=4n=40.518\approx0.518(4回振れば半々を超える)、n=10n=100.838\approx0.838「少なくとも」を見たら余事象を疑うのが定石。

⚠️ 引っかけポイント・頻出論点・級ごとの差

よくある疑問

Q1. 排反と独立は何が違うんですか?

これが一番混同される論点です。

決定的なのは、両方の確率が正(P(A)>0P(A)>0 かつ P(B)>0P(B)>0)なら、排反な2事象は独立になれないという点です。排反だと P(AB)=0P(A\cap B)=0 なのに、独立なら P(AB)=P(A)P(B)>0P(A\cap B)=P(A)P(B)>0 で、矛盾してしまうからです。「排反だから独立」「独立だから排反」はどちらも誤りなので注意してください。

Q2. 古典的確率と統計的確率、どちらを使えばいいですか?

「各結果が同様に確からしいか」で決めます。サイコロ・コイン・くじのように対称で等確率と仮定できるなら古典的確率(場合の数の比)。実際の打率・機械の故障率・天気のように前提が立てにくいものは、データの頻度(統計的確率)で測ります。歪んだサイコロに 16\frac16 を使うのは誤りです。

Q3. なぜ確率は0〜1に収まるんですか?「決まり」だからですか?

決まりではなく、コルモゴロフの公理から導かれる定理です。公理1で P(A)0P(A)\ge0、そして P(Ac)=1P(A)0P(A^c)=1-P(A)\ge0 から P(A)1P(A)\le1 が出ます。同じく P(Ac)=1P(A)P(A^c)=1-P(A)P()=0P(\varnothing)=0 も、3つの公理だけから証明できます。だから1を超えたり負になったりする答えが出たら、計算ミスです。

まとめ

対応するシミュレーション

統計的確率が古典的確率1/6に収束

加法定理と余事象がモンテカルロ値と一致

関連ノート