疫学研究デザイン｜統計検定テキスト

📊 対象級：1級　|　重要度：A（頻出）

要点（BLUF）

疫学は「集団における健康事象（病気の発生など）と、その原因候補（曝露）との関連」を測る学問で、どう関連を測るかは研究デザインで決まる。デザインは大きく観察研究（研究者が介入せず眺める）と介入研究（研究者が曝露を割り当てる＝RCT）に分かれ、医薬生物学分野（1級）では「与えられた状況でどのデザインが妥当か」「そのデザインで計算できる指標は何か」「どのバイアスが入りうるか」が頻出します。

デザインで測れる指標が決まる：コホート研究は集団を追跡して発生率がわかるのでリスク比（RR）が計算できる。ケースコントロール研究は発症者と非発症者を別々に集めるので発生率が出せず、計算できるのはオッズ比（OR）だけ。横断研究は一時点なので有病率しか出せず、原因と結果の時間順序が不明。
ケースコントロールでORしか出せない理由：結果（発症の有無）でサンプリングするため、母集団での発症率を再現できず、リスク（発症確率）が計算不能。一方ORは**「曝露で測ろうが疾患で測ろうが同じ値」という対称性**を持つので、結果でサンプリングしても歪まない。だからORだけが妥当。
介入研究（RCT）が最強の理由：曝露を無作為に割り当てることで、既知・未知の交絡因子まで含めて両群で確率的に均一化される。さらに盲検化・プラセボ・割付の隠蔽でバイアスを潰す。観察研究では未知の交絡を消せないので、エビデンス階層では系統的レビュー＞RCT＞コホート＞ケースコントロール＞症例報告となる。

1級（統計応用・医薬生物学）ではデザインの選択理由・各デザインで計算可能な指標・バイアスの同定が問われます（出題範囲・配点は改訂されうるため要最新確認）。

flowchart TD
  ROOT["疫学研究デザイン<br/>集団の健康事象と要因の関連を測る"] --> OBS["観察研究<br/>研究者は介入せず眺める"]
  ROOT --> INT["介入研究<br/>研究者が曝露を割り当てる"]
  OBS --> COH["コホート研究<br/>曝露で群分け→追跡<br/>→発生率・リスク比 RR"]
  OBS --> CC["ケースコントロール研究<br/>結果で群分け→曝露を遡る<br/>→オッズ比 OR のみ"]
  OBS --> CS["横断研究<br/>一時点で曝露と疾患を同時観察<br/>→有病率（時間順序不明）"]
  INT --> RCT["ランダム化比較試験 RCT<br/>無作為割付＋盲検化＋プラセボ<br/>→未知の交絡まで均す"]

1. 疫学デザインの全体像 — 観察か介入か

疫学が知りたいのは「ある曝露（喫煙・薬剤・生活習慣など）が、ある疾患の発生にどれだけ関連するか」です。これを測る枠組みが研究デザインで、最初の分岐は「研究者が曝露を割り当てるかどうか」です。

観察研究（observational study）：研究者は曝露の有無に介入せず、現実に曝露された人・されなかった人をそのまま観察する。コホート・ケースコントロール・横断の3つが基本。
介入研究（interventional study）：研究者が曝露（治療）を能動的に割り当てる。代表がランダム化比較試験（RCT）。

この分岐が決定的なのは、後で見るように「割り当てを研究者が制御できると、交絡を無作為化で消せる」からです。観察研究では曝露を受けるかどうかが本人や環境の事情で決まる（＝交絡が入りうる）のに対し、介入研究は割り当てを研究者がコントロールできます。

まずは観察研究の3デザインを、時間の向きと何を基準に対象を集めるかで整理します。

flowchart LR
  subgraph COH["コホート研究：曝露で集めて未来へ追う"]
    direction LR
    E1["曝露あり群"] --> D1["発症を観察"]
    E0["曝露なし群"] --> D0["発症を観察"]
  end
  subgraph CC["ケースコントロール研究：結果で集めて過去を遡る"]
    direction RL
    CA["症例（発症あり）"] --> EA["過去の曝露を調査"]
    CO["対照（発症なし）"] --> EO["過去の曝露を調査"]
  end

2. コホート研究 — 曝露で群分けして追跡する

コホート研究（cohort study）は、ある集団（コホート）を曝露の有無で群分けし、時間に沿って追跡して、各群で疾患がどれだけ発生するかを数えるデザインです。「曝露 → 発症」という原因から結果への自然な時間の流れで観察します。

2.1 前向きと後ろ向き

時間軸の取り方で2種類あります。ここは1級の頻出引っかけなので定義を厳密に押さえます。

前向きコホート（prospective）：研究を今始め、曝露で群分けし、これから発症を追跡する。データを未来に向かって集める。
後ろ向きコホート（retrospective／historical cohort）：過去の記録（健診データ等）を使い、過去のある時点での曝露を起点に、そこから現在までの発症を追う。データ収集は過去にさかのぼるが、論理は曝露→発症のまま（コホートである）。

重要なのは「後ろ向きコホート」と「ケースコントロール（次節）」が別物だという点です。後ろ向きコホートも曝露で群分けして発症を数えるのでコホート（リスク比が出せる）。ケースコントロールは結果で群分けするので根本的に違います。「後ろ向き＝ケースコントロール」と早合点しないこと。

2.2 何が測れるか — 発生率とリスク比

コホートでは各群の人数（分母）と発症者数（分子）が両方わかるので、**発症リスク（累積発生率）**が計算できます。2×2表で書きます。

	発症あり	発症なし	計
曝露あり	a	b	a+b
曝露なし	c	d	c+d

曝露群のリスク： $R_1 = \dfrac{a}{a+b}$ （曝露した人のうち発症した割合）
非曝露群のリスク： $R_0 = \dfrac{c}{c+d}$

これらの比が**リスク比（relative risk, RR）**です。

\boxed{\;\mathrm{RR}=\frac{R_1}{R_0}=\frac{a/(a+b)}{c/(c+d)}\;}

要するに「曝露した人は、しない人の何倍発症しやすいか」。RR=2なら曝露でリスクが2倍。コホートは分母（各群の総数 $a+b$ , $c+d$ ）を知っているからこそ、この「割合の比」が計算できます。この分母が手に入ることがコホートの強みで、次節のケースコントロールとの決定的な違いです。

コホートは発生率の差（リスク差 $R_1-R_0$ ）やオッズ比も計算できます。RRもORも両方出せるのがコホート、ORしか出せないのがケースコントロール、という非対称をまず頭に入れてください。

3. ケースコントロール研究 — 結果で群分けして曝露を遡る

**ケースコントロール研究（case-control study／症例対照研究）**は、**すでに発症した人（症例＝ケース）と発症していない人（対照＝コントロール）**を別々に集め、それぞれで過去の曝露率を比較するデザインです。コホートと逆で、「結果から原因へ」遡ります。まれな疾患や、発症までが長い疾患に有効です（コホートだと莫大な人数を長期間追わねばならないため）。

3.1 なぜオッズ比しか計算できないのか（論理の核心）

ケースコントロールの最大の特徴は、計算できるのがオッズ比（OR）だけで、リスク比は計算してはいけないことです。1級ではこの理由を論理で説明させます。順に詰めます。

(1) リスクが計算できない理由 — 分母を研究者が決めてしまう. リスク $R_1=a/(a+b)$ を出すには「曝露群の総数 $a+b$ 」が母集団を正しく反映している必要があります。ところがケースコントロールでは、研究者が症例を何人・対照を何人集めるかを恣意的に決めています（例：症例100人に対し対照を100人、あるいは200人）。つまり表の列（発症あり・なしの人数）を結果で固定して標本を作っている。

このとき表のセル $a, b, c, d$ の縦の比率（症例の中での曝露割合、対照の中での曝露割合）は母集団を反映しますが、横の比率（曝露群の中での発症割合 $a/(a+b)$ ）は研究者が決めた対照の人数でいくらでも変わってしまう。対照を倍集めれば $b, d$ が倍になり $a/(a+b)$ が変わる——これは母集団の発症リスクとは無関係な、設計上の数字です。だからリスク（発症確率）も、その比であるリスク比も計算不能。

要するに「結果（発症の有無）でサンプリングしているから、発症の『率』を母集団から復元できない。だからリスク比は出せない」。

(2) ではなぜオッズ比なら出せるのか — ORの対称性. オッズ比は「結果でサンプリングしても値が変わらない」という特別な性質を持ちます。これがケースコントロールの理論的支柱です。

まず2つのORを定義します。コホートで使う疾患オッズ比（曝露群の発症オッズ ÷ 非曝露群の発症オッズ）：

\mathrm{OR}_{\text{疾患}}=\frac{a/b}{c/d}=\frac{ad}{bc}

ケースコントロールで実際に計算する曝露オッズ比（症例の曝露オッズ ÷ 対照の曝露オッズ）：

\mathrm{OR}_{\text{曝露}}=\frac{a/c}{b/d}=\frac{ad}{bc}

両者は同じ $ad/bc$ になります。 これがORの対称性です。要するに「疾患の側からオッズ比を測っても、曝露の側から測っても、答えは同じ $ad/bc$ 」。

なぜこれが効くか。ケースコントロールでは「症例から測った曝露オッズ」と「対照から測った曝露オッズ」が計算できます（縦の比率は保たれるから）。その比 $\mathrm{OR}_{\text{曝露}}$ は、いま示した対称性により、本当に知りたい $\mathrm{OR}_{\text{疾患}}$ （曝露が疾患のオッズを何倍にするか）と数値的に一致します。結果でサンプリングして列の総数をいじっても、 $a,b,c,d$ を縦に定数倍するだけならORは不変（分子分母で約分されて消える）——だからORだけがサンプリング設計に対して頑健なのです。

リスク比 $\frac{a/(a+b)}{c/(c+d)}$ には $a+b$ という「列の総数」が入るので、列の人数を研究者がいじると変わる＝頑健でない。オッズ比 $ad/bc$ には列の総数が入らない（個々のセルの積の比だけ）＝列の人数を定数倍しても不変。この一行が「ケースコントロール＝ORのみ」の数学的な核心です。

3.2 まれな疾患の仮定 — OR が RR に近づく

ORは「曝露がオッズを何倍にするか」であって、直接にはリスク比ではありません。しかし**疾患がまれ（rare disease）**なら、ORはRRの良い近似になります。

リスク $R$ が小さいとき、発症しない確率 $1-R \approx 1$ なので、オッズ $\frac{R}{1-R}\approx R$ 。したがって

\mathrm{OR}=\frac{R_1/(1-R_1)}{R_0/(1-R_0)}\;\xrightarrow[\;R_1,R_0\to 0\;]{}\;\frac{R_1}{R_0}=\mathrm{RR}

要するに「疾患がまれだとオッズ ≈ リスクになるので、オッズ比 ≈ リスク比」。目安として有病率がおよそ10%以下ならこの近似が妥当とされます（Greenland）。ただし近似の精度は有病率だけでなく効果の大きさにも依存するため、まれでない疾患でケースコントロールのORをRRと読み替えるのは誤りです。これも頻出論点（要最新確認：閾値や精度の評価は文献で更新されうる）。

graph LR
  A["疾患がまれ<br/>R が小さい"] --> B["1 - R ≈ 1"]
  B --> C["オッズ R/(1-R) ≈ R"]
  C --> D["オッズ比 OR ≈ リスク比 RR"]

4. 横断研究 — 一時点のスナップショット

横断研究（cross-sectional study）は、ある一時点で集団を調べ、曝露と疾患の両方を同時に測るデザインです。アンケート調査などが典型。

測れるのは有病率（prevalence）：その時点で疾患を持っている人の割合。発生率（新たに発症した割合）ではない点に注意。有病率は「発生率 × 平均罹病期間」に依存するので、治りにくい病気ほど有病率が高く出る、というバイアスを含みます。
因果の時間順序が不明：曝露と疾患を同時に観測するため、「曝露が先か、疾患が先か」がわからない。例：「運動量が少ない人ほど膝が痛い」という横断データから「運動不足が膝痛を起こす」とは言えない（膝が痛いから運動を控えている、という逆向きの可能性が排除できない）。これを**逆因果（reverse causation）**といいます。

要するに「横断研究は手早く有病率や相関を見るには良いが、時間順序が取れないので因果を主張できない」。1級では「横断データから因果を結論するのは誤り」が定番の引っかけです。

5. 介入研究（RCT）— 無作為化が交絡を均す

ランダム化比較試験（randomized controlled trial, RCT）は、研究者が対象者を無作為に介入群（治療あり）と対照群（治療なし／プラセボ）に割り当てて結果を比較するデザインです。エビデンス階層で個別研究の最上位に立ちます。その理由を理屈で押さえます。

5.1 無作為化がなぜ交絡を均すのか（論理の核心）

**交絡（confounding）**とは、曝露と結果の両方に影響する第3の因子（交絡因子）が、見かけの関連を作る／歪める現象です（詳しくは交絡の調整）。観察研究では、曝露を受ける人と受けない人で交絡因子の分布が違う（例：薬を飲む人は重症者が多い）ため、関連が歪みます。

無作為化（randomization）はこれを根こそぎ解決します。論理はこうです。

割り当てをコインの裏表（乱数）だけで決めると、割り当ては対象者のいかなる特性とも統計的に独立になる。したがって年齢・重症度・遺伝・生活習慣といったあらゆる交絡因子の分布が、両群で確率的に等しくなる（標本が十分大きければ）。

ここで決定的なのは「測定していない・気づいてもいない交絡因子まで均される」ことです。観察研究での交絡調整（層別・回帰・傾向スコア、統計的因果推論・傾向スコア）は「観測した交絡因子」しか調整できません。未知・未測定の交絡因子が残れば歪みは消えない。これに対し無作為化は、割り当てが乱数なので因子を測っているかどうかに関係なく、すべての因子を均等に振り分けます。未知の交絡を消せることが、RCTが観察研究より上位に立つ唯一にして最大の理由です。

要するに「乱数で割り当てる → 割り当てが全特性と独立 → 既知も未知も交絡因子の分布が両群で揃う → 群間の差は介入の効果だけに帰せる」。これが因果効果を不偏に推定できる仕組みです。

flowchart TD
  R["対象者を乱数で割り当て"] --> IND["割り当てが対象者の全特性と独立"]
  IND --> BAL["既知・未知すべての交絡因子の分布が<br/>両群で確率的に均一化"]
  BAL --> CAUSE["群間の結果の差 = 介入の因果効果<br/>（交絡で歪まない）"]
  OBS["観察研究の交絡調整<br/>（層別・回帰・傾向スコア）"] -.->|観測した交絡しか消せない| LIM["未知の交絡が残る"]

5.2 盲検化・プラセボ・割付の隠蔽

無作為化だけでは「割り当て後」に入るバイアスを防げません。RCTはさらに次の仕掛けで情報バイアスを潰します。それぞれ防ぐバイアスが違うので区別が問われます。

プラセボ（placebo）：見た目が同じ偽薬。対照群にこれを与えることで、「薬を飲んでいるという心理的安心で症状が改善する」プラセボ効果を両群に等しく載せ、真の薬効だけを差として取り出す。
盲検化（blinding／マスキング）：誰が治療群か対照群かを伏せる。
- 単盲検（single-blind）：被験者だけが自分の割り当てを知らない。被験者側の心理バイアス（自覚症状の報告が割り当てに引きずられる）を防ぐ。
- 二重盲検（double-blind）：被験者も評価者（医師・効果判定者）も知らない。評価者が割り当てを知っていると、効果を無意識に都合よく判定する**観察者バイアス（評価バイアス）**が入る。二重盲検はこれを防ぐ。
割付の隠蔽（allocation concealment）：次にどちらへ割り当てられるかを、登録の時点で研究者・被験者に知らせない仕組み。盲検化（割り当て後に伏せる）とは別物。隠蔽が破れると、研究者が「この患者は重症だから治療群に入れたい」と予後で選択的に組み入れてしまい、せっかくの無作為化が壊れる。選択バイアスを入り口で防ぐのが隠蔽の役割。

⚠️ 盲検化と割付の隠蔽は別物。隠蔽は「割り当てが決まる前〜瞬間」に次の割り当てを隠して選択バイアスを防ぐ。盲検化は「割り当てが決まった後」に誰がどちらかを隠して情報（観察者）バイアスを防ぐ。タイミングも防ぐバイアスも違う。1級では混同させる問題が出ます。

6. エビデンス階層

研究デザインは「因果関係をどれだけ確からしく示せるか」で序列がつきます。これが**エビデンス階層（hierarchy of evidence）**です。

flowchart TB
  L1["① 系統的レビュー・メタアナリシス<br/>複数のRCTを統合（最も確実）"]
  L2["② ランダム化比較試験 RCT<br/>未知の交絡まで均す"]
  L3["③ コホート研究<br/>時間順序◯・未知の交絡が残る"]
  L4["④ ケースコントロール研究<br/>結果から遡る・各種バイアスを受けやすい"]
  L5["⑤ 症例報告・症例集積<br/>対照群なし（最も弱い）"]
  L1 --> L2 --> L3 --> L4 --> L5

序列の根拠は一貫しています。未知の交絡を消せるRCTが個別研究では最強、それを束ねて精度と一般性を上げた系統的レビュー／メタアナリシス（効果の指標で扱う統合の話につながる）が最上位。観察研究の中では、時間順序が明確で発生率も測れるコホートが、結果から遡りバイアスを受けやすいケースコントロールより上。対照群のない症例報告は関連すら測れず最下位です。

⚠️ 階層は目安であって絶対ではありません。質の低いRCT（小規模・脱落多数）より、よく設計された大規模コホートのほうが信頼できることもある。「RCTだから無条件に正しい」は誤りで、各研究の実施の質（バイアス管理）まで見るのが正しい読み方です。

7. バイアスと妥当性

疫学の結論を歪める誤差（系統誤差）がバイアスです。偶然誤差（標本のばらつき）と違い、標本を増やしても消えません。大きく3種類に整理します。

7.1 3つのバイアス

flowchart TD
  B["バイアス（系統誤差）"] --> SEL["選択バイアス<br/>対象の選び方の偏り"]
  B --> INF["情報（測定）バイアス<br/>曝露・結果の測り方の偏り"]
  B --> CONF["交絡<br/>第3因子による見かけの関連"]
  SEL --> SEL1["例：脱落が群で偏る／対照の選び方"]
  INF --> INF1["例：思い出しバイアス・観察者バイアス"]
  CONF --> CONF1["例：年齢が曝露と結果の両方に影響"]

選択バイアス（selection bias）：研究対象の選び方が偏ることで生じる。例：ケースコントロールで対照を不適切な集団から選ぶ、コホートで特定の群から脱落（追跡不能）が多い。RCTの割付の隠蔽が防ぐのはこれ。
情報バイアス／測定バイアス（information bias）：曝露や結果の測り方が偏ることで生じる。代表例が思い出しバイアス（recall bias）——ケースコントロールで症例（病気の人）のほうが過去の曝露を熱心に思い出すため、曝露率が見かけ上高く出る。また観察者バイアス——評価者が割り当てを知っていて判定が歪む（盲検化が防ぐ）。
交絡（confounding）：曝露と結果の両方に影響する第3因子による見かけの関連（第5節・交絡の調整）。無作為化・層別・回帰・傾向スコアで対処する。選択／情報バイアスはデザイン段階で防ぐしかないが、交絡は解析段階でも調整できる点が3者の違いです。

7.2 内的妥当性と外的妥当性

内的妥当性（internal validity）：その研究内部で、観測された関連が真の因果を正しく反映しているか。バイアス（選択・情報・交絡）がないほど高い。RCTは内的妥当性が高い。
外的妥当性（external validity／一般化可能性, generalizability）：その研究結果を**研究対象の外（他の集団・現実の診療）**に当てはめられるか。

両者はしばしばトレードオフします。RCTは厳しい組み入れ基準（高齢者や合併症のある人を除く）で内的妥当性を高めますが、その結果現実の多様な患者に当てはまりにくく外的妥当性が下がることがあります。要するに「内的妥当性＝この研究内で正しいか／外的妥当性＝外の世界に持ち出せるか」。1級では「RCTで効いた薬が現場で効くとは限らない（外的妥当性の限界）」といった論点で問われます。

8. 各デザインで「何が測れるか」対応表

デザイン	集め方（基準）	時間の向き	測れる主な指標	因果の強さ
コホート（前向き／後ろ向き）	曝露で群分け	曝露→発症	発生率・リスク比 RR・リスク差・OR	中（時間順序◯、未知交絡が残る）
ケースコントロール	結果（発症）で群分け	発症→曝露を遡る	オッズ比 OR のみ（まれな疾患でOR≈RR）	やや低（バイアス受けやすい）
横断	一時点で同時観察	なし（同時）	有病率・有病オッズ比（時間順序不明）	低（逆因果を排除できない）
RCT（介入）	無作為に割り当て	割付→結果	リスク比・リスク差・ハザード比など（交絡なし）	高（未知の交絡まで均す）

この表が本ノートの実用上の要です。**「コホート→RR、ケースコントロール→OR、横断→有病率」**を即答できるようにしてください。

9. 試験での問われ方（1級）

医薬生物学分野での1級の典型的な問われ方を論点ごとに整理します（出題範囲・配点は要最新確認）。

デザインの選択理由：与えられた状況（まれな疾患か／追跡が長いか／倫理的に割付できるか）から、最適なデザインを選ばせる。例「発症がまれで長期追跡が困難 → ケースコントロールが適切」「曝露を割り当てられる新薬の効果検証 → RCT」。逆に「喫煙を割り当てるRCTは倫理的に不可能 → 観察研究」も問われる。
各デザインで計算可能な指標：2×2表を与え、「このデザインで計算してよいのはRRかORか」を判定させる。ケースコントロールでRRを計算したら誤り、コホートならどちらも可、という対応を答えさせる。ORの対称性（ $ad/bc$ が疾患側でも曝露側でも同じ）を示させる場合もある。
オッズ比の計算と解釈： $\mathrm{OR}=ad/bc$ を計算させ、まれな疾患の仮定でRRに近似できる条件（有病率が低い）まで問う。
バイアスの同定：研究の記述からどのバイアス（選択・情報・交絡）が入っているかを特定させる。例「症例のほうが曝露をよく思い出す → 思い出しバイアス（情報バイアス）」「重症者ほど治療群に入れた → 選択バイアス（割付の隠蔽の欠如）」。
無作為化・盲検化の役割：無作為化が未知の交絡まで均すことを説明させる。盲検化と割付の隠蔽の区別（後者は選択バイアス、前者は情報バイアスを防ぐ）を問う。
妥当性：内的妥当性と外的妥当性を区別させ、RCTの厳しい組み入れ基準が外的妥当性を下げるトレードオフを論じさせる。
エビデンス階層：複数の研究結果が食い違うとき、どれを重視すべきかをデザインの序列で判断させる（ただし「質」も考慮する点まで）。

10. 引っかけ・頻出論点

⚠️ 後ろ向きコホート ≠ ケースコントロール：後ろ向きコホートも曝露で群分けして発症を数えるのでコホート（RRが出せる）。ケースコントロールは結果で群分けする別物。「後ろ向き＝ケースコントロール」は誤り。判別は「時間の向き」ではなく「何で群分けしたか（曝露か結果か）」で行う。
⚠️ ケースコントロールでリスク比を計算するのは誤り：結果でサンプリングするため分母（曝露群の総数）が母集団を反映せず、リスクが計算不能。計算してよいのはオッズ比だけ。RRを出していたら即誤り。
⚠️ 横断研究で因果を語るのは誤り：曝露と疾患を同時に測るので時間順序が取れず、逆因果を排除できない。「横断データで○○が△△の原因」は不可。横断が出せるのは有病率であって発生率ではない。
⚠️ オッズ比はそのままではリスク比でない：OR≈RRが成り立つのはまれな疾患のとき（有病率おおむね10%以下）。よくある疾患でORをそのままリスク比と読むと過大評価になる（ORはRRより1から遠い）。
⚠️ 無作為化が均すのは「未知の交絡まで」：観察研究の交絡調整（層別・回帰・傾向スコア）は観測した交絡しか消せない。無作為化の固有の価値は未測定の交絡まで均すこと。ここを「無作為化も観察研究の調整も同じ」と混同しない。
⚠️ 盲検化と割付の隠蔽は別物：隠蔽は割り当て前に次を隠して選択バイアスを防ぐ。盲検化は割り当て後に誰がどちらかを隠して情報（観察者）バイアスを防ぐ。タイミングも目的も別。
⚠️ バイアスは標本を増やしても消えない：バイアス（系統誤差）は偶然誤差と違い、 $n$ を増やしても残る。「サンプルを増やせばバイアスが減る」は誤り（減るのは偶然誤差だけ）。
⚠️ エビデンス階層は絶対ではない：質の低いRCTより良質なコホートが信頼できることもある。「RCTだから無条件に最良」は誤り。デザインの序列＋各研究の実施の質の両方で評価する。

よくある疑問（Q&A）

Q1. ケースコントロールでオッズ比しか出せないのが、まだ腑に落ちません。一言でいうと?

「研究者が列の人数（症例と対照を何人集めるか）を自分で決めてしまうから」です。リスク比 $\frac{a/(a+b)}{c/(c+d)}$ には $a+b$ （曝露群の総数）が入りますが、対照を倍集めれば $b,d$ が倍になりこの数字が動く——母集団の発症率とは無関係な、研究者の決めた数字です。だからリスクは復元できない。一方オッズ比 $ad/bc$ は個々のセルの積の比なので、列を定数倍しても分子分母で約分されて不変。さらに「疾患側で測ったOR」と「曝露側で測ったOR」が同じ $ad/bc$ になる対称性があるので、症例・対照から測った曝露オッズ比が、知りたい疾患のオッズ比と一致します。列をいじっても動かないのがORだけ、これが理由です。

Q2. それならコホートでもオッズ比を使えばいいのでは? なぜリスク比を好むのですか?

コホートではORもRRも両方計算できますが、解釈のしやすさでRRが好まれます。RRは「リスクが何倍」と直感的ですが、ORは「オッズが何倍」で日常感覚から遠い。しかもよくある疾患ではORはRRより1から離れた値になり、効果を誇張して見せてしまう。コホートはリスク（分母つきの率）を直接測れるのだから、わざわざ解釈の難しいORを使う理由がない、というわけです。ORの出番は「リスクが原理的に測れないケースコントロール」と「ロジスティック回帰の係数」です。

Q3. 無作為化すれば交絡を調整する解析（傾向スコアなど）は不要ですか?

理論上は不要です。無作為化が成功していれば交絡因子は両群で均衡しているので、単純な群間比較で因果効果が不偏推定できます。これがRCTの美点です。ただし実務では、(1) 標本が小さいと偶然の不均衡が残る、(2) 脱落（追跡不能）で均衡が崩れる、ため、ベースライン共変量で調整した解析を併用することがあります。あくまで「念のための精度向上」であり、観察研究のように「未知の交絡を消すため必須」ではない点が違います。

Q4. 「まれな疾患の仮定」はどのくらいまれならよいのですか?

目安は有病率おおむね10%以下（Greenland）とされますが、これは絶対基準ではありません。近似の精度は有病率だけでなく効果の大きさ（ORが1から離れるほどズレが拡大）にも依存します。だから「10%以下なら常にOR≈RR」と機械的に当てはめるのは危険で、まれでない疾患や強い関連ではORとRRの乖離が無視できなくなります（この閾値や評価は文献で更新されうるので要最新確認）。試験では「まれだから近似できる」という論理が言えれば十分なことが多いです。

Q5. 観察研究でも交絡を調整すれば、RCTと同じくらい信頼できますか?

いいえ。決定的な差は「未知・未測定の交絡」です。層別・回帰・傾向スコアといった調整は、すべて「データで測った交絡因子」しか消せません。測っていない、あるいは存在に気づいてすらいない交絡因子が結果に効いていれば、どれだけ精緻に調整しても歪みは残ります。RCTはこの問題を無作為化で原理的に回避します（割り当てが乱数なので、因子を測っているかに関係なくすべて均す）。だから観察研究は「測った交絡を消した上での最善の推定」であって、RCTの代替にはなりません。これが階層でRCTが上位にある根拠です（観察研究固有の交絡対策は統計的因果推論・傾向スコアを参照）。

まとめ

デザインで測れる指標が決まる：コホート（曝露で群分け→追跡）は発生率がわかりリスク比 RR。ケースコントロール（結果で群分け→曝露を遡る）はオッズ比 OR のみ。横断（一時点）は有病率で時間順序不明。RCT（無作為割付）は交絡なしで因果効果。
ケースコントロールでORしか出せない理由：結果でサンプリングし列の人数を研究者が決めるため発症率が復元できずRR不能。ORは $ad/bc$ で列を定数倍しても不変＝サンプリングに頑健（疾患側でも曝露側でも同じ値という対称性）。まれな疾患（有病率≲10%）なら OR≈RR。
無作為化が交絡を均す論理：乱数割り当て→割り当てが全特性と独立→既知も未知も交絡因子の分布が両群で揃う→群差は介入効果だけ。観察研究の調整は観測した交絡しか消せず、未知の交絡を消せるのは無作為化のみ。これがRCTを最強たらしめる。
RCTの仕掛けの区別：プラセボ（プラセボ効果を相殺）／盲検化（割り当て後に伏せて情報・観察者バイアスを防ぐ、単盲検は被験者・二重盲検は評価者も）／割付の隠蔽（割り当て前に伏せて選択バイアスを防ぐ）。隠蔽と盲検化は別物。
エビデンス階層：系統的レビュー＞RCT＞コホート＞ケースコントロール＞症例報告。根拠は「未知の交絡をどれだけ消せるか」。ただし目安で、質も込みで評価する。
バイアスと妥当性：選択・情報（測定）・交絡の3バイアスは系統誤差で標本を増やしても消えない。内的妥当性（研究内で因果が正しいか）と外的妥当性（外に一般化できるか）はトレードオフしうる。