効果の指標｜統計検定テキスト

📊 対象級：1級　|　重要度：A（頻出）

要点（BLUF）

「曝露があると疾病はどれだけ起きやすくなるか」を数値化するのが効果の指標です。比で測るか差で測るか、そして元になる量がリスクかオッズか時間あたり率かで、指標が分かれます。医薬生物学分野では2×2表からこれらを計算・解釈し、信頼区間まで作るのが定番の出題です。

2系統 ×（リスク／オッズ／ハザード）：比で測る相対指標（リスク比 RR・オッズ比 OR・ハザード比 HR）と、差で測る絶対指標（リスク差 RD＝寄与危険、治療必要数 $\mathrm{NNT}=1/\mathrm{RD}$ ）。オッズ比は2×2表の対角の積の比 $\mathrm{OR}=\dfrac{ad}{bc}$ 。
デザインが指標を決める：前向き（コホート）なら発生リスクが測れるので RR・RD が使える。後ろ向き（ケースコントロール）は発生リスクを推定できないので OR のみ。時間を伴う生存解析は HR。デザインを無視して指標を選ぶと誤りです。
OR は RR の近似（まれな疾病のときだけ）：疾病がまれなら $\mathrm{OR}\approx\mathrm{RR}$ 。逆にありふれた疾病では OR は RR より関連を過大に見せます。RR・OR の信頼区間は対数スケールで正規近似して作り、 $\mathrm{Var}(\ln\mathrm{OR})=\frac1a+\frac1b+\frac1c+\frac1d$ を使います。

1級（統計応用・医薬生物学）では2×2表からの各指標の計算・OR と RR の使い分け・対数スケールでの信頼区間の構成が問われ、Mantel–Haenszel 法や積二項尤度と絡めて出ることもあります（範囲・配点は改訂されうるため要最新確認）。

graph TD
  ROOT["効果の指標<br/>曝露と疾病の関連を数値化"] --> BASE["基本量"]
  BASE --> RISK["リスク（累積発生割合）<br/>p = 発症/全体"]
  BASE --> ODDS["オッズ<br/>p/(1−p)"]
  ROOT --> REL["相対指標（比）"]
  REL --> RR["リスク比 RR<br/>コホート"]
  REL --> OR["オッズ比 OR = ad/bc<br/>全デザイン"]
  REL --> HR["ハザード比 HR<br/>生存解析"]
  ROOT --> ABS["絶対指標（差）"]
  ABS --> RD["リスク差 RD（寄与危険）<br/>コホート"]
  ABS --> NNT["治療必要数 NNT = 1/RD"]
  ROOT --> CI["信頼区間は対数スケールで<br/>正規近似（Var ln OR = 1/a+1/b+1/c+1/d）"]

1. 基本量 — リスクとオッズ

効果の指標はすべて「リスク」か「オッズ」か「ハザード」の比または差です。まず土台のリスクとオッズを区別します。

1.1 リスク（累積発生割合）

リスク（risk）は、ある一定の追跡期間内に、対象集団のうち何割がイベント（発症など）を起こすかの割合です。**累積発生割合（cumulative incidence）**とも呼びます。

\text{リスク}\quad p = \frac{\text{期間内に発症した人数}}{\text{追跡開始時の対象者数}}

要するに「何人中何人が発症したか」。 $0\le p\le 1$ の確率（割合）で、単位はありません。リスクを計算するには「発症していない人も含めた分母（at risk の集団全体）」が分かっていなければなりません。ここが後でデザインの話につながります。

1.2 オッズ

**オッズ（odds）**は、起こる確率を起こらない確率で割った比です。

\text{オッズ}\quad \mathrm{odds} = \frac{p}{1-p}

要するに「起こる見込みと起こらない見込みの比」。競馬・賭けの「オッズ」と同じ発想です。 $p$ が割合（0〜1）なのに対し、オッズは0から無限大までの値を取ります。 $p=0.5$ ならオッズは1、 $p=0.9$ ならオッズは9（起こる方が9倍ありそう）。

リスクとオッズの違いを一覧にすると：

量	定義	範囲	必要な情報
リスク（累積発生割合）	$p$ ＝発症者 / 全体	0〜1	分母（発症しない人も含む集団全体）
オッズ	$p/(1-p)$ ＝発症 / 非発症	0〜∞	発症者と非発症者の比だけでよい

最後の列が決定的です。オッズは「発症者と非発症者の比」だけで計算でき、集団全体の分母を知る必要がありません。だから「発症者と非発症者を別々に集めてくる」ケースコントロール研究でも計算できます（第4節）。リスクは集団全体の分母が要るので、ケースコントロールでは推定できません。

1.3 2×2表の記法

効果の指標はすべて2×2分割表から計算します。本ノートを通じて次の記号を使います。

	発症あり	発症なし	合計
曝露あり	$a$	$b$	$a+b$
曝露なし	$c$	$d$	$c+d$

曝露群のリスク： $p_1 = \dfrac{a}{a+b}$ （曝露ありのうち発症した割合）
非曝露群のリスク： $p_0 = \dfrac{c}{c+d}$ （曝露なしのうち発症した割合）
曝露群のオッズ： $\dfrac{a}{b}$ （発症 $a$ 対非発症 $b$ ）
非曝露群のオッズ： $\dfrac{c}{d}$

この $a,b,c,d$ を使って、以降の指標を全部書き下します。

2. 相対指標（比で測る）

「曝露群は非曝露群の何倍起きやすいか」を測るのが相対指標です。RR・OR・HR の3つを順に定義します。

2.1 リスク比 RR（相対危険度・relative risk / risk ratio）

曝露群のリスクを非曝露群のリスクで割ったものです。

\boxed{\;\mathrm{RR}=\frac{p_1}{p_0}=\frac{a/(a+b)}{c/(c+d)}\;}

要するに「曝露があると発症リスクが何倍になるか」。 $\mathrm{RR}=2$ なら曝露群は非曝露群の2倍発症しやすい、 $\mathrm{RR}=1$ なら曝露は発症と無関係（リスクが等しい）、 $\mathrm{RR}<1$ なら曝露が予防的（リスクを下げる）。直観的で解釈しやすい指標です。ただし各群のリスク $p_1,p_0$ が計算できる＝集団全体の分母が分かるデザイン（コホート）でしか使えません。

2.2 オッズ比 OR（odds ratio）

曝露群のオッズを非曝露群のオッズで割ったものです。定義どおり書くと

\mathrm{OR}=\frac{p_1/(1-p_1)}{p_0/(1-p_0)}=\frac{a/b}{c/d}

これを整理すると、2×2表の対角の積の比という覚えやすい形になります。

\boxed{\;\mathrm{OR}=\frac{ad}{bc}\;}

要するに「曝露があると発症の『見込み（オッズ）』が何倍になるか」で、計算は表の左上×右下を右上×左下で割るだけ。 $\mathrm{OR}=1$ が「関連なし」、 $\mathrm{OR}>1$ が「曝露が発症と正の関連」です。

OR には RR にない強力な性質が2つあります。

(1) 対称性（行と列を入れ替えても同じ）. 「曝露群の発症オッズ比」と「発症群の曝露オッズ比」が同じ値になります。実際、発症群の曝露オッズは $a/c$ 、非発症群の曝露オッズは $b/d$ なので、その比は $\dfrac{a/c}{b/d}=\dfrac{ad}{bc}$ で同じ $\dfrac{ad}{bc}$ です。だから「結果から原因を見る」後ろ向き研究でも、「原因から結果を見る」前向き研究でも、同じ OR が出ます。これがケースコントロール研究で OR が使える数学的根拠です。

(2) 分母（集団全体）を知らなくてよい. OR は $a,b,c,d$ の比だけで決まり、集団全体の発生割合を知る必要がありません。ケースコントロールでは発症者と非発症者を別々の比率で集めますが、それでも OR は不変です。

2.3 ハザード比 HR（hazard ratio）

RR・OR は「追跡終了時点でイベントが起きたか否か」という有無だけを見ます。これに対し**ハザード（hazard）**は「その瞬間まで生存していた人が、次の一瞬にイベントを起こす率」＝単位時間あたりの瞬間発生率です。ハザード比 HR はこのハザードの比です。

\boxed{\;\mathrm{HR}=\frac{\lambda_1(t)}{\lambda_0(t)}\;}\qquad \lambda(t)=\lim_{\Delta t\to0}\frac{P(t\le T<t+\Delta t \mid T\ge t)}{\Delta t}

要するに「ある瞬間の発症の起きやすさが、曝露群で何倍か」。RR・OR との決定的な違いは、HR が時間（いつ起きたか）と打ち切り（追跡途中で脱落・観察終了した人）を扱えることです。比例ハザードモデル（Cox 回帰）では HR が時間によらず一定と仮定し、 $\mathrm{HR}=\exp(\beta)$ という形で回帰係数から得られます（→ 生存時間解析）。

graph LR
  subgraph INFO["扱う情報量"]
    direction TB
    RR2["RR・OR<br/>イベントの『有無』だけ"]
    HR2["HR<br/>有無 ＋『時間』＋『打ち切り』"]
  end
  RR2 -->|時間を加味| HR2

3指標の比較を一覧にします。

指標	比べるもの	扱う情報	主なデザイン
リスク比 RR	リスク $p$ （累積発生割合）	イベントの有無	コホート
オッズ比 OR	オッズ $p/(1-p)$	イベントの有無	全デザイン（特にケースコントロール）
ハザード比 HR	ハザード $\lambda(t)$ （瞬間率）	有無＋時間＋打ち切り	生存解析

3. 絶対指標（差で測る）

比は「何倍」を教えますが、「絶対的にどれだけリスクが増えたか／何人治療すれば1人救えるか」は教えません。それを担うのが差の指標です。臨床的な意思決定では絶対指標の方が重要なことが多いです。

3.1 リスク差 RD（寄与危険・attributable risk）

曝露群のリスクから非曝露群のリスクを引いたものです。**寄与危険（attributable risk）**とも呼びます。

\boxed{\;\mathrm{RD}=p_1-p_0=\frac{a}{a+b}-\frac{c}{c+d}\;}

要するに「曝露によって増えたリスクの絶対量」。 $\mathrm{RD}=0.05$ なら「曝露で発症割合が5パーセントポイント増えた」。曝露を取り除けば理論上この $\mathrm{RD}$ ぶんの発症を減らせる、という解釈ができます。比（RR）と違い、もとのリスクの大きさを保ったまま影響を測れるのが利点です。RR が同じ「2倍」でも、リスクが0.001→0.002の2倍と、0.3→0.6の2倍では絶対的な重みがまるで違い、それを区別できるのが RD です。

3.2 寄与危険割合・人口寄与危険割合

寄与危険割合（attributable risk percent, ARP）. 曝露群のリスクのうち、曝露が原因で増えた分の割合です。

\mathrm{ARP}=\frac{p_1-p_0}{p_1}=\frac{\mathrm{RR}-1}{\mathrm{RR}}

要するに「曝露群の発症のうち、何割が曝露のせいか」。 $\mathrm{ARP}=0.6$ なら「曝露群の発症の6割は曝露を取り除けば防げた」。右側の $(\mathrm{RR}-1)/\mathrm{RR}$ は、分子・分母を $p_0$ で割れば $\mathrm{RR}=p_1/p_0$ だけで書けることを示しています（リスクの絶対値が分からなくても RR から計算できる）。

人口寄与危険割合（population attributable risk percent, PARP）. 集団全体（曝露者・非曝露者が混在）の発症のうち、曝露に帰せられる割合です。集団の発症リスクを $p$ （全体のリスク）とすると

\mathrm{PARP}=\frac{p-p_0}{p}

要するに「集団全体の発症のうち、何割が曝露のせいか」。ARP が「曝露した人だけ」を見るのに対し、PARP は「集団全体への公衆衛生的なインパクト」を測ります。曝露がいくら強力（RR が大きい）でも、集団に曝露者がほとんどいなければ PARP は小さい——曝露の有害さ（ARP）と集団へのインパクト（PARP）を分けて評価するのが要点です。

3.3 治療必要数 NNT（number needed to treat）

リスク差の逆数です。介入（治療）によってリスクが下がる文脈で使います。

\boxed{\;\mathrm{NNT}=\frac{1}{|\mathrm{RD}|}=\frac{1}{|p_1-p_0|}\;}

要するに「1人の発症（または死亡など）を防ぐために、何人を治療すればよいか」。例えば治療で発症割合が $0.20\to0.15$ に下がるなら $\mathrm{RD}=0.05$ 、 $\mathrm{NNT}=1/0.05=20$ で「20人治療すれば1人救える」。NNT が小さいほど治療の効率が良いことを意味します。RD の逆数なので、RD が小さい（差がわずか）ほど NNT は大きく（たくさん治療しないと1人救えない）なります。臨床現場で治療効果を直感的に伝える指標として広く使われます。

graph TD
  RDNODE["リスク差 RD = p1 − p0"] --> NNTNODE["NNT = 1/|RD|<br/>1人救うのに必要な治療人数"]
  RDNODE --> ARPNODE["ARP = (RR−1)/RR<br/>曝露群の発症のうち曝露由来の割合"]
  POP["集団全体のリスク p"] --> PARPNODE["PARP = (p − p0)/p<br/>集団の発症のうち曝露由来の割合"]

4. どの指標がどのデザインで使えるか

指標の選択は研究デザインで決まる——これが医薬生物学で最も問われる論点です。理由は「そのデザインで発生リスクが推定できるか」に尽きます。

flowchart TD
  START["研究デザインは？"] --> COHORT{"集団全体を<br/>追跡したか<br/>（分母が分かるか）"}
  COHORT -->|"はい（コホート/RCT）"| TIME{"イベントの<br/>時間を扱うか"}
  TIME -->|"いいえ（有無だけ）"| C1["RR・RD・NNT が使える<br/>（OR も計算可だが普通RR）"]
  TIME -->|"はい（時間あり・打ち切りあり）"| C2["HR（生存解析）"]
  COHORT -->|"いいえ（症例対照）"| CC["発生リスクを推定できない<br/>→ OR のみ"]

4.1 コホート研究（前向き）→ RR・RD（・HR）

曝露あり群・なし群を追跡し、集団全体（分母）が分かるので、各群のリスク $p_1,p_0$ を直接推定できます。したがって RR・RD・NNT がすべて使え、最も解釈しやすい RR が主役になります。ランダム化比較試験（RCT）も構造はコホートと同じです。イベント発生までの時間と打ち切りを扱うなら HR（Cox 回帰）に進みます。

4.2 ケースコントロール研究（後ろ向き）→ OR のみ

発症した人（症例）と発症していない人（対照）を別々に集めてから、過去の曝露を調べます。この設計では症例と対照を研究者が任意の比率で集めるため、集団全体の発生リスク $p_1,p_0$ を推定できません。リスクが出せないので RR・RD は計算できません。

しかし OR は使えます。第2.2節の対称性により、OR は「発症群の曝露オッズ比」としても計算でき（ $ad/bc$ は行・列を入れ替えても不変）、症例と対照の集め方の比率に依存しないからです。だからケースコントロールでは OR が唯一の妥当な相対指標になります。そして「OR は RR の近似として解釈してよいか」を保証するのが、次節のまれな疾病の仮定です。

4.3 生存解析 → HR

イベント発生までの時間を観察し、追跡途中の打ち切り（脱落・観察終了）がある状況です。Kaplan–Meier やログランク検定、Cox 比例ハザードモデルで扱い、群間比較の指標は HR です（→ 生存時間解析）。

デザイン	推定できる量	使える効果指標
コホート・RCT（前向き）	各群のリスク $p_1,p_0$	RR・RD・NNT（時間ありなら HR）
ケースコントロール（後ろ向き）	オッズの比だけ	OR のみ
生存解析	ハザード $\lambda(t)$	HR

5. OR が RR を近似する条件 — まれな疾病の仮定

OR は計算しやすく全デザインで使えますが、解釈は RR ほど直感的ではありません（「見込みの比」より「リスクの比」の方が分かりやすい）。そこで「疾病がまれなら $\mathrm{OR}\approx\mathrm{RR}$ なので、OR を RR とみなして解釈してよい」という近似が使われます。これを**まれな疾病の仮定（rare disease assumption）**と呼びます。式で導出します。

5.1 導出

OR と RR を、各群のリスク $p_1,p_0$ で書き並べます。

\mathrm{RR}=\frac{p_1}{p_0},\qquad \mathrm{OR}=\frac{p_1/(1-p_1)}{p_0/(1-p_0)}=\frac{p_1}{p_0}\cdot\frac{1-p_0}{1-p_1}

右の式から、OR は RR に補正項 $\dfrac{1-p_0}{1-p_1}$ を掛けたものだと分かります。

\boxed{\;\mathrm{OR}=\mathrm{RR}\cdot\frac{1-p_0}{1-p_1}\;}

要するに「OR は RR に『非発症割合の比』を掛けた値」。ここで疾病がまれ、つまり両群でリスクが小さい（ $p_1\approx0,\ p_0\approx0$ ）とすると、 $1-p_1\approx1$ かつ $1-p_0\approx1$ なので補正項は

\frac{1-p_0}{1-p_1}\approx\frac{1}{1}=1

に近づきます。したがって

\boxed{\;p_1,p_0\to0\ \text{のとき}\quad \mathrm{OR}\to\mathrm{RR}\;}

要するに「発症がまれだと『発症しない確率』はどちらの群でもほぼ1なので、補正項が1になり、OR と RR が一致する」。これがまれな疾病の仮定の数学的中身です。同じことを「オッズ＝リスク」の観点でも言えます。 $p$ が小さければ $1-p\approx1$ なので $\mathrm{odds}=p/(1-p)\approx p$ （オッズがリスクとほぼ等しくなる）、よってオッズの比 OR がリスクの比 RR とほぼ等しくなる、という見方です。

5.2 まれでないとどうなるか — OR は関連を過大に見せる

$p_1>p_0$ （曝露が有害）で $\mathrm{RR}>1$ のとき、補正項 $\dfrac{1-p_0}{1-p_1}$ は 1より大きくなります（ $p_1>p_0$ なら $1-p_1<1-p_0$ で分子＞分母）。したがって

\mathrm{OR}=\mathrm{RR}\cdot\underbrace{\frac{1-p_0}{1-p_1}}_{>1}>\mathrm{RR}

要するに「ありふれた疾病では OR は RR より大きい＝関連を過大に見せる」。疾病がまれでないのに OR を「リスクが何倍」と読むと、効果を誇張してしまいます。経験則として有病割合が10%以下なら近似は実用上許容、という目安が知られますが、固定した閾値ではなく効果の大きさにも依存するため要最新確認です。RR が1未満（予防的）のときは逆に OR が RR より0方向に離れ、やはり関連を過大に見せます（1からの距離が広がる）。

6. 信頼区間 — なぜ対数スケールで作るのか

RR・OR の点推定値だけでなく、ばらつき（信頼区間）も問われます。鍵は「比の指標は対数を取ってから正規近似する」ことです。

6.1 なぜ log を取るのか

RR・OR は比なので0から無限大の値を取り、1を中心に非対称です（「2倍」と「半分＝0.5倍」が同じ強さの関連なのに、1からの距離は1と0.5で違う）。この非対称な量に正規分布（左右対称・実数全体）を直接当てると当てはまりが悪く、下限が負になるなどの不都合が起きます。

ところが対数を取ると、 $\ln(\text{比})$ は実数全体に広がり、1倍は $\ln1=0$ 、2倍は $\ln2\approx0.69$ 、半分は $\ln0.5\approx-0.69$ と0を中心に対称になります。さらに $\ln\mathrm{OR}$ や $\ln\mathrm{RR}$ は、 $a,b,c,d$ が大きくなると中心極限定理的に正規分布に近づくことがデルタ法で示せます。だから「対数スケールで正規近似して区間を作り、最後に指数を取って元のスケールに戻す」のが標準手順です（戻すと区間は元のスケールで非対称になる＝それが正しい）。

flowchart LR
  A["OR・RR<br/>（0〜∞・1中心で非対称）"] -->|"ln を取る"| B["ln OR・ln RR<br/>（実数全体・0中心で対称・正規近似可）"]
  B -->|"正規近似で<br/>± 1.96・SE"| C["ln スケールの<br/>信頼区間"]
  C -->|"exp で戻す"| D["元スケールの<br/>信頼区間（非対称）"]

6.2 lnOR の分散（Woolf の方法）

$\ln\mathrm{OR}$ の分散は、2×2表のセル度数の逆数の和という非常に簡潔な形になります。

\boxed{\;\widehat{\mathrm{Var}}(\ln\mathrm{OR})=\frac1a+\frac1b+\frac1c+\frac1d\;}

要するに「4つのマスの人数の逆数を全部足したものが lnOR の分散」。導出の筋道は次の通りです。 $\ln\mathrm{OR}=\ln a-\ln b-\ln c+\ln d$ と分解できます（ $\ln\frac{ad}{bc}=\ln a+\ln d-\ln b-\ln c$ ）。各セル度数を二項的な計数とみなし、 $\ln(\text{度数})$ の分散をデルタ法で近似します。デルタ法では関数 $g$ に対し $\mathrm{Var}(g(X))\approx \{g'(\mu)\}^2\mathrm{Var}(X)$ で、 $g=\ln$ なら $g'(x)=1/x$ 、計数 $X$ の分散をおおよそ $X$ 自身（ポアソン近似）とみなすと

\mathrm{Var}(\ln a)\approx\left(\frac1a\right)^2\cdot a=\frac1a

となり、各項について同様。4つの対数が（近似的に）独立として分散を足し合わせると $\frac1a+\frac1b+\frac1c+\frac1d$ が得られます。これが Woolf の方法の核心です。要するに「対数を取ると積・商が和・差になり、各 $\ln(\text{度数})$ の分散がデルタ法で $1/\text{度数}$ になるから、それらを足すだけ」。

各セルが小さい（人数が少ない）ほど逆数が大きく、分散が大きく＝区間が広くなる、という直観とも合います。どこかのセルが0だと逆数が発散するので、実務では各セルに $0.5$ を足す Haldane–Anscombe 補正を併用します。

6.3 信頼区間の構成手順

95%信頼区間は次の3ステップです。

対数スケールの中心と幅： $\ln\widehat{\mathrm{OR}}$ を中心に、 $\pm 1.96\times\sqrt{\widehat{\mathrm{Var}}(\ln\mathrm{OR})}$ を取る。

\ln\widehat{\mathrm{OR}}\ \pm\ 1.96\sqrt{\frac1a+\frac1b+\frac1c+\frac1d}

指数で元スケールに戻す：上で得た下限・上限をそれぞれ $\exp(\cdot)$ する。

\Big[\ \widehat{\mathrm{OR}}\cdot e^{-1.96\,\mathrm{SE}},\ \ \widehat{\mathrm{OR}}\cdot e^{+1.96\,\mathrm{SE}}\ \Big]

1を跨ぐかを見る：得た区間が1を含めば「関連なし（ $\mathrm{OR}=1$ ）」を棄却できない、含まなければ統計的に有意な関連、と読む。

要するに「lnスケールで対称な区間を作り、expで戻すと元スケールで非対称な区間になる」。RR の信頼区間も同じ枠組みで、分散は $\widehat{\mathrm{Var}}(\ln\mathrm{RR})=\dfrac{1}{a}-\dfrac{1}{a+b}+\dfrac{1}{c}-\dfrac{1}{c+d}$ （＝各群で「発症数の逆数−群計の逆数」を足す）を使います。OR と RR で分散式が違う点に注意してください。

7. 試験での問われ方（1級）

医薬生物学分野での1級の典型的な問われ方を、論点ごとに整理します（出題範囲・配点は要最新確認）。

2×2表からの計算：与えられた表の $a,b,c,d$ から RR・OR・RD・NNT を計算させる。 $\mathrm{OR}=ad/bc$ 、 $\mathrm{RR}=\frac{a/(a+b)}{c/(c+d)}$ 、 $\mathrm{NNT}=1/|\mathrm{RD}|$ を正確に。数値の桁・割り算のミスに注意。
デザインと指標の対応：「このケースコントロール研究で RR を求めよ」ができないこと（OR のみ）を理由とともに説明させる。「なぜケースコントロールでリスクが推定できないか（分母＝集団全体が分からない）」が核心。
OR と RR の使い分け・近似： $\mathrm{OR}=\mathrm{RR}\cdot\frac{1-p_0}{1-p_1}$ を導き、まれな疾病で $\mathrm{OR}\approx\mathrm{RR}$ となる条件、まれでないと OR が関連を過大評価することを説明させる。
信頼区間の構成： $\ln\mathrm{OR}\pm1.96\sqrt{1/a+1/b+1/c+1/d}$ を作り、 $\exp$ で戻して1を跨ぐか判定させる。「なぜ対数スケールか」（比が非対称・正規近似のため）を言語化させる。 $\mathrm{Var}(\ln\mathrm{OR})$ の導出（デルタ法）まで問われることもある。
層別解析との接続：交絡を調整するため層ごとに2×2表を作り、Mantel–Haenszel 法で共通 OR・RR を統合する流れ（→ カテゴリカルデータ解析の応用）。過去には積二項尤度・Cochran 検定・Peto 法と絡めた出題実績あり。
HR との区別：生存時間データでは有無だけの RR・OR でなく時間と打ち切りを扱う HR を使うこと、Cox 回帰で $\mathrm{HR}=\exp(\beta)$ となること（→ 生存時間解析）。

8. 引っかけ・頻出論点

⚠️ OR を「リスクが何倍」と読むのは誤り：OR は「オッズ（見込み）の比」であって、リスク（発生割合）の比ではありません。「 $\mathrm{OR}=3$ だから発症リスクが3倍」と言えるのはまれな疾病のときだけ。ありふれた疾病では OR は RR を過大評価します。
⚠️ ケースコントロールで RR・RD を出すのは誤り：症例と対照を別々に集めるデザインでは集団全体の分母が分からず、リスク $p_1,p_0$ を推定できません。だから RR・RD・NNT は計算してはいけない。出せるのは OR のみ。「ケースコントロールの表から $a/(a+b)$ を計算した」は典型的な誤り。
⚠️ OR は関連を過大に見せがち： $\mathrm{OR}=\mathrm{RR}\cdot\frac{1-p_0}{1-p_1}$ の補正項は、有害な曝露（ $\mathrm{RR}>1$ ）で必ず1より大きい。だから OR は常に RR より1から遠い（過大評価方向）。論文の OR を RR と取り違えると効果を誇張して受け取る。
⚠️ 信頼区間を元スケールで対称に作るのは誤り： $\widehat{\mathrm{OR}}\pm1.96\cdot\mathrm{SE}$ のように元のスケールで対称区間を作ってはいけない。比は非対称なので、対数スケールで対称区間を作り $\exp$ で戻す。戻した区間は元スケールで非対称（点推定値が幾何平均的に中央）になるのが正しい。
⚠️ lnOR と lnRR の分散式は違う： $\mathrm{Var}(\ln\mathrm{OR})=\frac1a+\frac1b+\frac1c+\frac1d$ （4セル全部）だが、 $\mathrm{Var}(\ln\mathrm{RR})=\frac1a-\frac1{a+b}+\frac1c-\frac1{c+d}$ 。OR の式を RR に流用しない。
⚠️ NNT は RD の逆数（RR の逆数ではない）： $\mathrm{NNT}=1/|\mathrm{RD}|=1/|p_1-p_0|$ 。リスク比ではなくリスク差の逆数。RR が同じでもベースラインのリスクが違えば NNT は変わる。
⚠️ RR は「1からの距離」で関連の強さを読む： $\mathrm{RR}=1$ が無関連。 $\mathrm{RR}=2$ と $\mathrm{RR}=0.5$ は逆向きで同じ強さ（対数で $\pm\ln2$ ）。「 $\mathrm{RR}=0.5$ は弱い、 $\mathrm{RR}=2$ は強い」は誤り。

よくある疑問（Q&A）

Q1. リスクとオッズはどう違うのですか？似たような値に見えるのですが。

リスクは「全体のうち何割が発症したか」（分母に発症しない人も含む）、オッズは「発症した人と発症しない人の比」です。 $p=0.1$ ならリスクは0.1、オッズは $0.1/0.9\approx0.11$ でほぼ同じ——疾病がまれだと両者は近いです。しかし $p=0.5$ ならリスク0.5に対しオッズは $0.5/0.5=1$ 、 $p=0.9$ ならリスク0.9に対しオッズは9と、ありふれた事象では大きく乖離します。両者が近いのは「まれなとき」だけ、というのがまれな疾病の仮定の土台です。最も実務的な違いは「オッズは分母（集団全体）を知らずに計算できる」点で、これがケースコントロール研究で OR が使える理由です。

Q2. なぜケースコントロール研究ではオッズ比しか使えないのですか？

ケースコントロールは「発症した人（症例）」と「発症していない人（対照）」を別々に集める設計だからです。例えば症例100人と対照100人を集めたとき、この1:1という比率は研究者が決めたもので、現実の集団での発症割合を反映していません。だから表から $a/(a+b)$ のようにリスクを計算しても、それは「研究者が決めた集め方」を映すだけで、母集団の発症リスクにはなりません。リスクが推定できないので RR・RD は計算できない。一方 OR ＝ $ad/bc$ は対角の積の比で、症例と対照をどんな比率で集めても不変（第2.2節の対称性）。だから OR だけが集め方に左右されない妥当な指標として残ります。

Q3. オッズ比とリスク比、結局どちらを使えばいいのですか？

デザインで決まります。コホート・RCT なら発生リスクが直接測れるので、解釈しやすい RR（と絶対指標の RD・NNT） を使うのが基本です。ケースコントロールでは RR が計算できないので OR を使い、疾病がまれなら OR を RR の近似として読みます。ロジスティック回帰の出力も OR なので、交絡を調整した解析では OR が前面に出ます。注意は「ありふれた疾病で OR を RR のように読むと過大評価になる」こと。近年は common outcome のとき OR を避けて RR を直接推定すべきという議論もありますが、後ろ向き研究では OR が依然として中心です（このあたりの実務的推奨は要最新確認）。

Q4. ハザード比はリスク比とどう違うのですか？どちらも「比」ですよね。

扱う情報量が違います。RR は「追跡終了時点でイベントが起きたか否か」の有無だけを見ます。HR は「各瞬間の発生率（ハザード）」を見るので、いつ起きたか（時間）と、追跡途中で脱落・観察打ち切りになった人を正しく扱えます。例えば「2年後の発症割合は両群同じだが、曝露群は早期に集中して発症する」ような状況では、RR は1（差なし）でも HR は1から離れます。生存時間データのように打ち切りがある状況では RR・OR は使えず（打ち切りを無視することになる）、HR が適切です。比例ハザードモデルでは HR が時間によらず一定と仮定し、 $\mathrm{HR}=\exp(\beta)$ で得られます。

Q5. NNT が「20」だと、なぜ「20人治療すれば1人救える」になるのですか？

NNT はリスク差の逆数だからです。治療で発症割合が $0.20\to0.15$ に下がるなら、リスク差は $\mathrm{RD}=0.05$ ＝「1人あたり0.05人ぶん発症が減る」。これを「1人の発症を防ぐには何人必要か」に裏返すと $1/0.05=20$ 人。直観的には「100人治療すると発症が5人減る（0.05×100）ので、1人減らすには100/5＝20人」と同じ計算です。NNT が小さいほど少ない治療で効果が出る＝効率的。RD が小さい（治療効果がわずか）ほど NNT は大きく、たくさん治療しないと1人救えないことになります。

Q6. 信頼区間をなぜわざわざ対数にして作るのですか？直接 OR で作ってはダメですか？

比の指標は0〜無限大の値を取り、1を中心に非対称だからです。「2倍」と「0.5倍（半分）」は逆向きで同じ強さの関連なのに、1からの距離は1.0と0.5で非対称。この非対称な量に左右対称の正規分布を当てて $\widehat{\mathrm{OR}}\pm1.96\cdot\mathrm{SE}$ とすると、下限が負になりうる（OR は負を取れないのに）など破綻します。対数を取れば1倍は0、2倍は $+\ln2$ 、半分は $-\ln2$ と0を中心に対称になり、しかも $\ln\mathrm{OR}$ がデルタ法で正規分布に近づく。だから対数スケールで対称な区間を作り、 $\exp$ で戻す。戻した区間は元スケールで非対称になりますが、それが比の指標として正しい姿です。

まとめ

基本量：リスク（累積発生割合 $p$ ＝発症/全体・0〜1）とオッズ（ $p/(1-p)$ ・0〜∞）。オッズは分母を知らずに計算でき、これがケースコントロールで OR が使える土台。
相対指標（比）：リスク比 $\mathrm{RR}=\frac{p_1}{p_0}$ 、オッズ比 $\mathrm{OR}=\frac{ad}{bc}$ （対角の積の比・対称性あり・全デザインで計算可）、ハザード比 $\mathrm{HR}=\lambda_1/\lambda_0$ （時間と打ち切りを扱う）。
絶対指標（差）：リスク差 $\mathrm{RD}=p_1-p_0$ （寄与危険）、寄与危険割合 $\mathrm{ARP}=\frac{\mathrm{RR}-1}{\mathrm{RR}}$ 、人口寄与危険割合 $\mathrm{PARP}=\frac{p-p_0}{p}$ 、治療必要数 $\mathrm{NNT}=1/|\mathrm{RD}|$ 。
デザインが指標を決める：コホート・RCT は RR・RD・NNT（時間ありなら HR）、ケースコントロールは OR のみ（リスク推定不能）、生存解析は HR。
OR ≈ RR はまれな疾病のときだけ： $\mathrm{OR}=\mathrm{RR}\cdot\frac{1-p_0}{1-p_1}$ 。 $p_1,p_0\to0$ で補正項が1になり一致。まれでないと OR は RR を過大評価。
信頼区間は対数スケール：比は非対称なので $\ln$ を取り正規近似。 $\widehat{\mathrm{Var}}(\ln\mathrm{OR})=\frac1a+\frac1b+\frac1c+\frac1d$ （デルタ法・Woolf）。 $\ln\widehat{\mathrm{OR}}\pm1.96\cdot\mathrm{SE}$ を作り $\exp$ で戻す。1を跨げば関連なしを棄却できない。lnRR の分散式は別物。