📊 対象級：4級・ 3級　|　重要度：A（頻出）

確率の定義・加法定理・乗法定理 ── 3つの確率の定義／包除原理／余事象／乗法定理

要点（BLUF）

確率には3つの定義がある：①古典的確率 $P(A)=\dfrac{|A|}{|\Omega|}$ （同様に確からしい場合の数の比）②統計的確率（試行回数 $\to\infty$ での相対頻度の極限。大数の法則が「頻度→確率」を保証）③公理的確率（コルモゴロフの3公理）。公理的確率が一般の土台で、前2者を特殊例として含む。
加法定理 $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ （重なり $P(A\cap B)$ を二重に数えるので1回引く＝包除原理）。排反なら $A\cap B=\varnothing$ で引く分がなく $P(A)+P(B)$ 。
乗法定理 $P(A\cap B)=P(A)\,P(B\mid A)$ （Aが起きた後の縮んだ標本空間でBを測る）。独立なら $P(B\mid A)=P(B)$ で $P(A)P(B)$ 。「少なくとも1つ」は余事象 $P(A^c)=1-P(A)$ で解くのが速い。

本文

標本空間と事象

確率を考える土台は 標本空間 $\Omega$ （起こりうる結果すべての集合）と、その部分集合である 事象 $A\subseteq\Omega$ 。確率は「事象という集合に、 $0$ 〜 $1$ の数を割り当てる関数」だと思えばよい。

用語	記号	意味
全事象	$\Omega$	起こりうる結果すべて。例：サイコロなら $\{1,2,3,4,5,6\}$
空事象	$\varnothing$	何も起こらない（決して起きない）事象
和事象	$A\cup B$	$A$ または $B$ （少なくとも一方）が起こる
積事象	$A\cap B$	$A$ かつ $B$ （両方同時）が起こる
余事象	$A^c$ （ $\bar{A}$ ）	$A$ が起こらない。 $\Omega$ から $A$ を除いた残り
排反	$A\cap B=\varnothing$	$A$ と $B$ は同時には起こらない（互いに素）

集合演算（ $\cup, \cap, {}^c$ ）がそのまま事象の演算になっている、という対応がすべての出発点。

確率の3つの定義

確率という言葉には、歴史的に異なる3つの定義がある。試験では使い分けの理解が問われる。

定義	式・考え方	いつ使う	弱点
古典的確率（数学的確率）	$P(A)=\dfrac{\text{事象 }A\text{ の場合の数}}{\text{全事象の場合の数}}=\dfrac{	A	}{
統計的確率（経験的確率）	$N$ 回試して $A$ が $r$ 回起きたとき $P(A)\approx\dfrac{r}{N}$ 、極限 $\displaystyle\lim_{N\to\infty}\dfrac{r}{N}$	前提が立てにくい現象（実際の打率・故障率・天気）をデータで測るとき	有限回では誤差がある。極限の存在を仮定している
公理的確率（現代的定義）	コルモゴロフの3公理を満たす関数 $P$ なら何でも確率と認める（後述）	理論の一般的土台。連続分布など場合の数で数えられないものも扱える	抽象的で直観が薄い

「要するに何が違うの？」を一言で言うと、古典的＝理屈で数える、統計的＝実際に試して測る、公理的＝数学的なルールだけで定義する。

3者の関係：

graph LR
  K["公理的確率<br/>コルモゴロフの3公理<br/>（一般の土台）"]
  C["古典的確率<br/>場合の数の比"]
  S["統計的確率<br/>頻度 r/N の極限"]
  K -->|"各結果が等確率<br/>（一様分布）の特殊例"| C
  K -->|"頻度→確率を<br/>大数の法則が保証"| S

古典的確率は公理的確率の特殊例：「各結果が等確率（一様分布）」という前提を置いた公理的確率に他ならない。
統計的確率は公理的確率に裏打ちされる：相対頻度 $r/N$ が真の確率 $P(A)$ に近づくこと自体を、公理から導かれる大数の法則が保証する（大数の法則（弱法則・強法則））。だから「たくさん試せば頻度は確率に収束する」と安心して言える。

要するに、実用では古典的確率・統計的確率を使い、それらを数学的に正当化する屋台骨が公理的確率。

コルモゴロフの3公理（公理的確率の中身）

確率 $P$ とは、次の3つを満たす関数のことだ、と定める（1933年、コルモゴロフ）。

\textbf{公理1（非負性）}\quad P(A)\ge 0

\textbf{公理2（全確率）}\quad P(\Omega)=1

\textbf{公理3（完全加法性）}\quad A_1,A_2,\dots \text{ が互いに排反なら }\ P\!\left(\bigcup_{i} A_i\right)=\sum_{i} P(A_i)

要するに「①確率はマイナスにならない ②全部の確率を足すと1 ③重ならない事象は足し算でつなげる」。この3つだけから、後で使う性質（ $P(A^c)=1-P(A)$ 、 $0\le P\le1$ 、加法定理…）がすべて導ける（暗記ではなく、公理からの帰結）。

加法定理

和事象 $A\cup B$ （少なくとも一方が起こる）の確率：

\boxed{\,P(A\cup B)=P(A)+P(B)-P(A\cap B)\,}

要するに「両方の確率を足して、重なり $P(A\cap B)$ を1回引く」。重なりを足し算で二重に数えてしまうのを補正する式（理由は後述の包除原理）。

排反のとき（ $A\cap B=\varnothing$ 、 $P(A\cap B)=0$ ）は引く分がなく、

P(A\cup B)=P(A)+P(B)

3事象の包除原理（足す→ペアを引く→3つ重なりを足す、と符号が交互）：

P(A\cup B\cup C)=P(A)+P(B)+P(C)-P(A\cap B)-P(B\cap C)-P(C\cap A)+P(A\cap B\cap C)

余事象

\boxed{\,P(A^c)=1-P(A)\,}

要するに「起こる確率と起こらない確率を足すと1」。「少なくとも1つ〜」を直接数えると場合分けが爆発するときに、余事象「1つも〜ない」を数えると一瞬で済むことが多い（後述の威力）。

乗法定理

積事象 $A\cap B$ （両方同時に起こる）の確率：

\boxed{\,P(A\cap B)=P(A)\,P(B\mid A)=P(B)\,P(A\mid B)\,}

ここで $P(B\mid A)$ は「 $A$ が起きたという条件のもとで $B$ が起きる確率」（条件付き確率）。要するに「まず $A$ が起こり（確率 $P(A)$ ）、その後 $A$ が起きた世界で $B$ が起こる（確率 $P(B\mid A)$ ）」を掛ける。

独立のとき（ $A$ が $B$ に影響しない、 $P(B\mid A)=P(B)$ ）は、

P(A\cap B)=P(A)\,P(B)

条件付き確率・独立性の本格論は次トピック条件付き確率・独立性・全確率の定理へ。

具体例

加法定理：1〜30 の整数から1つ引く。「2の倍数 $A$ または 3の倍数 $B$ 」の確率。 $P(A)=\dfrac{15}{30},\ P(B)=\dfrac{10}{30}$ 、重なり「6の倍数」 $P(A\cap B)=\dfrac{5}{30}$ 。よって $P(A\cup B)=\dfrac{15+10-5}{30}=\dfrac{20}{30}=\dfrac{2}{3}$ 。重なり（6の倍数）を引かないと $\frac{25}{30}$ と過大になる（一番ありがちなミス）。
乗法定理（復元 vs 非復元）：10本中4本が当たりのくじを2回引いて2回とも当たる確率。**戻す（復元・独立）**なら2回目も同じ条件で $\dfrac{4}{10}\cdot\dfrac{4}{10}=\dfrac{4}{25}$ 。**戻さない（非復元・従属）**なら1回目で当たりを1本引いたので2回目は残り9本中3本、 $\dfrac{4}{10}\cdot\dfrac{3}{9}=\dfrac{2}{15}$ 。戻すか否かで $P(B\mid A)$ が変わるのがポイント。
余事象：サイコロを $n$ 回振って「少なくとも1回6が出る」確率。直接だと「ちょうど1回・2回…」を全部足す羽目になるが、余事象「1回も6が出ない」 $=\left(\dfrac{5}{6}\right)^n$ を使えば $1-\left(\dfrac{5}{6}\right)^n$ で一発。

どの定義・どの定理を使う？（判断フロー）

確率の問題に出会ったとき、何を使えばいいかの道筋。

flowchart TD
  Q1{"各結果は<br/>同様に確からしい？"}
  Q1 -->|はい| KOTEN["古典的確率<br/>P=場合の数の比"]
  Q1 -->|いいえ・データで測る| TOKEI["統計的確率<br/>頻度 r/N"]

  KIND{"求めるのは<br/>どんな確率？"}
  KIND -->|"AまたはB（和）"| WA["加法定理<br/>排反なら足すだけ<br/>重なりあり→引く"]
  KIND -->|"AかつB（積）"| SEKI["乗法定理<br/>独立なら P(A)P(B)<br/>従属なら P(A)・P(B given A)"]
  KIND -->|"少なくとも1つ"| YOJI["余事象<br/>1-P(起きない)"]

「同様に確からしいか？」でまず古典/統計を分け、次に「和・積・少なくとも」で加法/乗法/余事象を選ぶ、という2段構え。

試験での問われ方

4級：標本空間・事象（和/積/余/排反）の意味、加法定理（特に排反）、余事象 $1-P(A)$ 。樹形図・数え上げと組み合わせた基本計算。
3級：3つの確率の区別（特に古典的 vs 統計的）、加法定理（重なりを引く一般形）、乗法定理、独立な試行・余事象の活用。場合の数（場合の数・順列・組合せ）で分母分子を数えて確率にする。
2級：公理的確率・コルモゴロフの公理の理解、乗法定理→条件付き確率→ベイズへの接続、独立と排反の厳密な区別。
※出題範囲は改訂されうるため受験前に公式最新版で要最新確認（4級「場合の数・確率の基礎」、3級「確率：独立な試行・条件付き確率」がキーワード）。

数式の直観的意味

なぜ加法定理は重なりを引くのか（包除原理）

確率を「面積」だと思うと一目瞭然。 $P(A)$ は領域 $A$ の面積、 $P(B)$ は領域 $B$ の面積。 $A\cup B$ （合併）の面積を求めたいのに、単純に $P(A)+P(B)$ と足すと、重なり部分 $A\cap B$ を $A$ の分と $B$ の分で2回数えてしまう。だから1回分を引いて辻褄を合わせる：

P(A\cup B)=\underbrace{P(A)+P(B)}_{\text{重なりを2回数えた}}-\underbrace{P(A\cap B)}_{\text{1回分を返す}}

（ベン図で2つの重なる円を描き、重なり部分を「2回数えるので1回引く」と注記するとさらに腹落ちする。重なりの幾何が本質なので、紙やExcalidrawで2つの重なる円を描くのが一番わかりやすい。）

公理から厳密に： $A\cup B$ を排反な3つに分解する。「 $A$ だけ」 $=A\cap B^c$ 、「 $B$ だけ」 $=A^c\cap B$ 、「両方」 $=A\cap B$ 。この3つは互いに排反なので公理3（加法性）から

P(A\cup B)=P(A\cap B^c)+P(A^c\cap B)+P(A\cap B).

一方 $A=(A\cap B^c)\cup(A\cap B)$ （これも排反）だから $P(A)=P(A\cap B^c)+P(A\cap B)$ 、同様に $P(B)=P(A^c\cap B)+P(A\cap B)$ 。この2式を上に代入して整理すると

P(A\cup B)=\big[P(A)-P(A\cap B)\big]+\big[P(B)-P(A\cap B)\big]+P(A\cap B)=P(A)+P(B)-P(A\cap B).

排反なら $A\cap B=\varnothing$ で $P(A\cap B)=0$ 。すると重なりがそもそも無いので引く必要がなく、 $P(A\cup B)=P(A)+P(B)$ （これは公理3そのもの）。

3事象の包除も同じ「重複補正」の発想：ペアの重なり（ $A\cap B$ 等）を引きすぎると、今度は3つの共通部分 $A\cap B\cap C$ を引きすぎる（足し2回・引き3回で $-1$ 回多い）ので最後に1回足し戻す。これが交互符号の正体。

なぜ乗法定理は $P(A)P(B\mid A)$ か（縮んだ標本空間）

条件付き確率の定義そのものから出る。 $P(B\mid A)$ は「 $A$ が起きたとわかった世界に話を限定し、その中で $B$ が起きる割合」：

P(B\mid A)=\frac{P(A\cap B)}{P(A)}\qquad(P(A)>0).

要するに「標本空間を $\Omega$ から $A$ に縮め、その縮んだ世界で $A\cap B$ の割合を測る」（分母が全体 $\Omega$ ではなく $A$ になる）。この定義の両辺に $P(A)$ を掛けるだけで乗法定理が出る：

P(A\cap B)=P(A)\,P(B\mid A).

独立とは「 $A$ が起きても $B$ の起こりやすさが変わらない」、つまり $P(B\mid A)=P(B)$ のこと。これを代入すると

P(A\cap B)=P(A)\,P(B)\qquad(\text{独立の定義式}).

縮んだ標本空間で測っても割合が変わらない、という独立の意味がそのまま式に出ている。詳細は条件付き確率・独立性・全確率の定理、応用（原因の確率の逆算）はベイズの定理へ。

コルモゴロフの公理から導かれる帰結

3公理だけから、試験で使う性質が次々に出る。

(1) $P(A^c)=1-P(A)$ ： $A$ と $A^c$ は排反で、合わせると $\Omega$ （ $A\cup A^c=\Omega$ ）。公理3より $P(A)+P(A^c)=P(\Omega)$ 、公理2より $P(\Omega)=1$ 。よって

P(A)+P(A^c)=1\ \Longrightarrow\ P(A^c)=1-P(A).

(2) $P(\varnothing)=0$ ：(1) で $A=\Omega$ とおくと $\Omega^c=\varnothing$ なので $P(\varnothing)=1-P(\Omega)=1-1=0$ 。

(3) $0\le P(A)\le 1$ ：公理1で $P(A)\ge0$ 。さらに $P(A)\le1$ は、 $P(A^c)=1-P(A)\ge0$ （ $P(A^c)$ も公理1で非負）より $P(A)\le1$ 。確率が必ず0〜1に収まることすら、公理から導かれる定理であって、勝手に決めた範囲ではない。

(4) 単調性 $A\subseteq B \Rightarrow P(A)\le P(B)$ ： $B=A\cup(B\cap A^c)$ （排反）なので $P(B)=P(A)+P(B\cap A^c)\ge P(A)$ 。

このように、3つの素朴な公理が確率計算の全ルールを生む。「なぜ確率は0〜1なのか」「なぜ $P(A^c)=1-P(A)$ なのか」は暗記ではなく公理からの帰結、というのが公理的確率の威力。

余事象の威力（「少なくとも1つ」は裏から数える）

「少なくとも1回〜が起こる」を正面から数えると、ちょうど1回・2回・…・ $n$ 回の場合をすべて足す必要があり、組合せが膨れ上がる。だがその余事象は「1回も起こらない」のたった1通りのパターンで済む。

例：サイコロを $n$ 回振り「少なくとも1回6が出る」確率。

余事象「1回も6が出ない」＝毎回6以外（確率 $\frac56$ ）が $n$ 回続く（独立）＝ $\left(\dfrac56\right)^n$ 。
よって求める確率は

P(\text{少なくとも1回6})=1-\left(\frac{5}{6}\right)^n.

$n=1$ で $\frac16\approx0.167$ 、 $n=4$ で $\approx0.518$ （4回振れば半々を超える）、 $n=10$ で $\approx0.838$ 。「少なくとも」を見たら余事象を疑うのが定石。

⚠️ 引っかけポイント・頻出論点・級ごとの差

排反と独立の混同（最頻出）：
- 排反＝同時に起こらない＝ $P(A\cap B)=0$ （事象の関係）。
- 独立＝一方が他方の起こりやすさに影響しない＝ $P(A\cap B)=P(A)P(B)$ （確率の関係。試行に対して使うことも多い）。
- 両方の確率が正（ $P(A)>0,\ P(B)>0$ ）なら、排反な2事象は独立になり得ない。なぜなら排反だと $P(A\cap B)=0$ なのに、独立なら $P(A\cap B)=P(A)P(B)>0$ で矛盾するから。「排反だから独立」「独立だから排反」はどちらも誤り。
加法定理で重なりを引き忘れる： $A\cup B$ なのに $P(A)+P(B)$ で済ませると過大になる（重なりがあるとき）。排反が明示されていない限り $-P(A\cap B)$ を必ず確認。上の「2の倍数 or 3の倍数」で $\frac{25}{30}$ と答えるのが典型ミス。
「同様に確からしい」が成り立たない場面で古典的確率を誤用：歪んだサイコロ・実際の打率・故障率などは各結果が等確率でないので、 $\frac{|A|}{|\Omega|}$ は使えない。これらは統計的確率（データの頻度）で扱う。
余事象の使いどころを逃す：「少なくとも1つ」「1つ以上」「最低1回」を見たら、まず余事象「1つも〜ない」で解けないか考える。
確率は必ず $0\le P\le1$ ： $1$ を超える・負になる答えが出たら計算ミス。公理から導かれる絶対の制約。
乗法定理の条件付き確率の向き：非復元（戻さない）抽出では $P(B\mid A)$ の分母が「 $A$ の後に減った全体」になる。くじ2回引きで $\frac{4}{10}\cdot\frac{4}{10}$ （復元）と $\frac{4}{10}\cdot\frac{3}{9}$ （非復元）を取り違えない。
級差：4級＝事象の意味＋加法（排反）＋余事象 → 3級＝3定義の区別＋加法の一般形＋乗法＋独立な試行 → 2級＝公理的確率の理解＋条件付き確率・ベイズへの接続。同じ加法定理でも、4級は排反の単純加法、3級以上は重なりを引く一般形と、深さが上がる。

よくある疑問

Q1. 排反と独立は何が違うんですか？

これが一番混同される論点です。

排反＝AとBが同時に起こらないこと。式では $P(A\cap B)=0$ 。（事象どうしの関係）
独立＝Aが起きてもBの起こりやすさが変わらないこと。式では $P(A\cap B)=P(A)P(B)$ 。

決定的なのは、両方の確率が正（ $P(A)>0$ かつ $P(B)>0$ ）なら、排反な2事象は独立になれないという点です。排反だと $P(A\cap B)=0$ なのに、独立なら $P(A\cap B)=P(A)P(B)>0$ で、矛盾してしまうからです。「排反だから独立」「独立だから排反」はどちらも誤りなので注意してください。

Q2. 古典的確率と統計的確率、どちらを使えばいいですか？

「各結果が同様に確からしいか」で決めます。サイコロ・コイン・くじのように対称で等確率と仮定できるなら古典的確率（場合の数の比）。実際の打率・機械の故障率・天気のように前提が立てにくいものは、データの頻度（統計的確率）で測ります。歪んだサイコロに $\frac16$ を使うのは誤りです。

Q3. なぜ確率は0〜1に収まるんですか？「決まり」だからですか？

決まりではなく、コルモゴロフの公理から導かれる定理です。公理1で $P(A)\ge0$ 、そして $P(A^c)=1-P(A)\ge0$ から $P(A)\le1$ が出ます。同じく $P(A^c)=1-P(A)$ や $P(\varnothing)=0$ も、3つの公理だけから証明できます。だから1を超えたり負になったりする答えが出たら、計算ミスです。

まとめ

確率の定義は3つ。古典的（場合の数の比）・統計的（頻度の極限）・公理的（3公理）。公理的が一番おおもとで前2つを含み、統計的確率の正しさは大数の法則が支えます。
加法定理 $P(A\cup B)=P(A)+P(B)-P(A\cap B)$ ：「または」は重なりを1回引く。排反なら引かない。
乗法定理 $P(A\cap B)=P(A)P(B\mid A)$ ：「かつ」は条件付き確率を掛ける。独立なら $P(A)P(B)$ 。
余事象 $P(A^c)=1-P(A)$ ：「少なくとも1つ」は裏から数えると速い。
排反（同時に起きない）と独立（影響しない）は別物。両方の確率が正なら排反は独立になれません。

対応するシミュレーション

simulations/kakuritsu_toukeiteki_shuusoku.py
- 何を示すか：サイコロを少ない回数から数万回まで振り、「6が出た相対頻度 $r/N$ 」が試行を重ねるごとに理論値 $1/6\approx0.1667$ に収束していくのを折れ線で可視化する。統計的確率（頻度）が古典的確率（理論値）に近づく＝大数の法則の入口を数値で実証する。
- 結論：序盤は頻度が大きく振れるが、 $N$ が大きくなるほど $1/6$ に張り付く（10回 0.200 → 1,000回 0.171 → 50,000回 0.1681）。「確率＝無限回試したときの頻度の極限」という統計的確率の定義が目で見える。

統計的確率が古典的確率1/6に収束

simulations/kakuritsu_kahou_yojishou.py
- 何を示すか：(1) サイコロ2個で「目の和が偶数 $A$ または 8以上 $B$ 」の確率を、たくさんの試行で実際に数えたモンテカルロ値と、加法定理 $P(A)+P(B)-P(A\cap B)$ の理論値が一致することを確認。(2) 「サイコロを $n$ 回振って少なくとも1回6」の試行値が余事象公式 $1-(5/6)^n$ と一致することを確認。
- 結論：直接数えた $P(A\cup B)=0.6663$ と加法定理の値 0.6663 が一致（理論 $24/36\approx0.6667$ ）。重なりを引かないと $0.5+0.417=0.917$ と過大になり実測と合わないので、重なりを引く必要があることが数値でわかる。余事象も $n=4$ で実測0.5177・理論0.5177、 $n=10$ で実測0.8392・理論0.8385と一致。

加法定理と余事象がモンテカルロ値と一致