← 統計検定テキスト 一覧

📊 対象級:1級 | 重要度:A(頻出)

要点(BLUF)

疫学は「集団における健康事象(病気の発生など)と、その原因候補(曝露)との関連」を測る学問で、どう関連を測るかは研究デザインで決まる。デザインは大きく観察研究(研究者が介入せず眺める)と介入研究(研究者が曝露を割り当てる=RCT)に分かれ、医薬生物学分野(1級)では「与えられた状況でどのデザインが妥当か」「そのデザインで計算できる指標は何か」「どのバイアスが入りうるか」が頻出します。

1級(統計応用・医薬生物学)ではデザインの選択理由・各デザインで計算可能な指標・バイアスの同定が問われます(出題範囲・配点は改訂されうるため要最新確認)。

flowchart TD
  ROOT["疫学研究デザイン<br/>集団の健康事象と要因の関連を測る"] --> OBS["観察研究<br/>研究者は介入せず眺める"]
  ROOT --> INT["介入研究<br/>研究者が曝露を割り当てる"]
  OBS --> COH["コホート研究<br/>曝露で群分け→追跡<br/>→発生率・リスク比 RR"]
  OBS --> CC["ケースコントロール研究<br/>結果で群分け→曝露を遡る<br/>→オッズ比 OR のみ"]
  OBS --> CS["横断研究<br/>一時点で曝露と疾患を同時観察<br/>→有病率(時間順序不明)"]
  INT --> RCT["ランダム化比較試験 RCT<br/>無作為割付+盲検化+プラセボ<br/>→未知の交絡まで均す"]

1. 疫学デザインの全体像 — 観察か介入か

疫学が知りたいのは「ある曝露(喫煙・薬剤・生活習慣など)が、ある疾患の発生にどれだけ関連するか」です。これを測る枠組みが研究デザインで、最初の分岐は「研究者が曝露を割り当てるかどうか」です。

この分岐が決定的なのは、後で見るように「割り当てを研究者が制御できると、交絡を無作為化で消せる」からです。観察研究では曝露を受けるかどうかが本人や環境の事情で決まる(=交絡が入りうる)のに対し、介入研究は割り当てを研究者がコントロールできます。

まずは観察研究の3デザインを、時間の向き何を基準に対象を集めるかで整理します。

flowchart LR
  subgraph COH["コホート研究:曝露で集めて未来へ追う"]
    direction LR
    E1["曝露あり群"] --> D1["発症を観察"]
    E0["曝露なし群"] --> D0["発症を観察"]
  end
  subgraph CC["ケースコントロール研究:結果で集めて過去を遡る"]
    direction RL
    CA["症例(発症あり)"] --> EA["過去の曝露を調査"]
    CO["対照(発症なし)"] --> EO["過去の曝露を調査"]
  end

2. コホート研究 — 曝露で群分けして追跡する

コホート研究(cohort study)は、ある集団(コホート)を曝露の有無で群分けし、時間に沿って追跡して、各群で疾患がどれだけ発生するかを数えるデザインです。「曝露 → 発症」という原因から結果への自然な時間の流れで観察します。

2.1 前向きと後ろ向き

時間軸の取り方で2種類あります。ここは1級の頻出引っかけなので定義を厳密に押さえます。

重要なのは「後ろ向きコホート」と「ケースコントロール(次節)」が別物だという点です。後ろ向きコホートも曝露で群分けして発症を数えるのでコホート(リスク比が出せる)。ケースコントロールは結果で群分けするので根本的に違います。「後ろ向き=ケースコントロール」と早合点しないこと。

2.2 何が測れるか — 発生率とリスク比

コホートでは各群の人数(分母)と発症者数(分子)が両方わかるので、**発症リスク(累積発生率)**が計算できます。2×2表で書きます。

発症あり発症なし
曝露ありaba+b
曝露なしcdc+d

これらの比が**リスク比(relative risk, RR)**です。

  RR=R1R0=a/(a+b)c/(c+d)  \boxed{\;\mathrm{RR}=\frac{R_1}{R_0}=\frac{a/(a+b)}{c/(c+d)}\;}

要するに「曝露した人は、しない人の何倍発症しやすいか」。RR=2なら曝露でリスクが2倍。コホートは分母(各群の総数 a+ba+b, c+dc+d)を知っているからこそ、この「割合の比」が計算できます。この分母が手に入ることがコホートの強みで、次節のケースコントロールとの決定的な違いです。

コホートは発生率の差(リスク差 R1R0R_1-R_0)やオッズ比も計算できます。RRもORも両方出せるのがコホート、ORしか出せないのがケースコントロール、という非対称をまず頭に入れてください。


3. ケースコントロール研究 — 結果で群分けして曝露を遡る

**ケースコントロール研究(case-control study/症例対照研究)**は、**すでに発症した人(症例=ケース)発症していない人(対照=コントロール)**を別々に集め、それぞれで過去の曝露率を比較するデザインです。コホートと逆で、「結果から原因へ」遡ります。まれな疾患や、発症までが長い疾患に有効です(コホートだと莫大な人数を長期間追わねばならないため)。

3.1 なぜオッズ比しか計算できないのか(論理の核心)

ケースコントロールの最大の特徴は、計算できるのがオッズ比(OR)だけで、リスク比は計算してはいけないことです。1級ではこの理由を論理で説明させます。順に詰めます。

(1) リスクが計算できない理由 — 分母を研究者が決めてしまう. リスク R1=a/(a+b)R_1=a/(a+b) を出すには「曝露群の総数 a+ba+b」が母集団を正しく反映している必要があります。ところがケースコントロールでは、研究者が症例を何人・対照を何人集めるかを恣意的に決めています(例:症例100人に対し対照を100人、あるいは200人)。つまり表の列(発症あり・なしの人数)を結果で固定して標本を作っている

このとき表のセル a,b,c,da, b, c, d縦の比率(症例の中での曝露割合、対照の中での曝露割合)は母集団を反映しますが、横の比率(曝露群の中での発症割合 a/(a+b)a/(a+b))は研究者が決めた対照の人数でいくらでも変わってしまう。対照を倍集めれば b,db, d が倍になり a/(a+b)a/(a+b) が変わる——これは母集団の発症リスクとは無関係な、設計上の数字です。だからリスク(発症確率)も、その比であるリスク比も計算不能

要するに「結果(発症の有無)でサンプリングしているから、発症の『率』を母集団から復元できない。だからリスク比は出せない」。

(2) ではなぜオッズ比なら出せるのか — ORの対称性. オッズ比は「結果でサンプリングしても値が変わらない」という特別な性質を持ちます。これがケースコントロールの理論的支柱です。

まず2つのORを定義します。コホートで使う疾患オッズ比(曝露群の発症オッズ ÷ 非曝露群の発症オッズ):

OR疾患=a/bc/d=adbc\mathrm{OR}_{\text{疾患}}=\frac{a/b}{c/d}=\frac{ad}{bc}

ケースコントロールで実際に計算する曝露オッズ比(症例の曝露オッズ ÷ 対照の曝露オッズ):

OR曝露=a/cb/d=adbc\mathrm{OR}_{\text{曝露}}=\frac{a/c}{b/d}=\frac{ad}{bc}

両者は同じ ad/bcad/bc になります。 これがORの対称性です。要するに「疾患の側からオッズ比を測っても、曝露の側から測っても、答えは同じ ad/bcad/bc」。

なぜこれが効くか。ケースコントロールでは「症例から測った曝露オッズ」と「対照から測った曝露オッズ」が計算できます(縦の比率は保たれるから)。その比 OR曝露\mathrm{OR}_{\text{曝露}} は、いま示した対称性により、本当に知りたい OR疾患\mathrm{OR}_{\text{疾患}}(曝露が疾患のオッズを何倍にするか)と数値的に一致します。結果でサンプリングして列の総数をいじっても、a,b,c,da,b,c,d を縦に定数倍するだけならORは不変(分子分母で約分されて消える)——だからORだけがサンプリング設計に対して頑健なのです。

リスク比 a/(a+b)c/(c+d)\frac{a/(a+b)}{c/(c+d)} には a+ba+b という「列の総数」が入るので、列の人数を研究者がいじると変わる=頑健でない。オッズ比 ad/bcad/bc には列の総数が入らない(個々のセルの積の比だけ)=列の人数を定数倍しても不変。この一行が「ケースコントロール=ORのみ」の数学的な核心です。

3.2 まれな疾患の仮定 — OR が RR に近づく

ORは「曝露がオッズを何倍にするか」であって、直接にはリスク比ではありません。しかし**疾患がまれ(rare disease)**なら、ORはRRの良い近似になります。

リスク RR が小さいとき、発症しない確率 1R11-R \approx 1 なので、オッズ R1RR\frac{R}{1-R}\approx R。したがって

OR=R1/(1R1)R0/(1R0)    R1,R00    R1R0=RR\mathrm{OR}=\frac{R_1/(1-R_1)}{R_0/(1-R_0)}\;\xrightarrow[\;R_1,R_0\to 0\;]{}\;\frac{R_1}{R_0}=\mathrm{RR}

要するに「疾患がまれだとオッズ ≈ リスクになるので、オッズ比 ≈ リスク比」。目安として有病率がおよそ10%以下ならこの近似が妥当とされます(Greenland)。ただし近似の精度は有病率だけでなく効果の大きさにも依存するため、まれでない疾患でケースコントロールのORをRRと読み替えるのは誤りです。これも頻出論点(要最新確認:閾値や精度の評価は文献で更新されうる)。

graph LR
  A["疾患がまれ<br/>R が小さい"] --> B["1 - R ≈ 1"]
  B --> C["オッズ R/(1-R) ≈ R"]
  C --> D["オッズ比 OR ≈ リスク比 RR"]

4. 横断研究 — 一時点のスナップショット

横断研究(cross-sectional study)は、ある一時点で集団を調べ、曝露と疾患の両方を同時に測るデザインです。アンケート調査などが典型。

要するに「横断研究は手早く有病率や相関を見るには良いが、時間順序が取れないので因果を主張できない」。1級では「横断データから因果を結論するのは誤り」が定番の引っかけです。


5. 介入研究(RCT)— 無作為化が交絡を均す

ランダム化比較試験(randomized controlled trial, RCT)は、研究者が対象者を無作為に介入群(治療あり)と対照群(治療なし/プラセボ)に割り当てて結果を比較するデザインです。エビデンス階層で個別研究の最上位に立ちます。その理由を理屈で押さえます。

5.1 無作為化がなぜ交絡を均すのか(論理の核心)

**交絡(confounding)**とは、曝露と結果の両方に影響する第3の因子(交絡因子)が、見かけの関連を作る/歪める現象です(詳しくは 交絡の調整)。観察研究では、曝露を受ける人と受けない人で交絡因子の分布が違う(例:薬を飲む人は重症者が多い)ため、関連が歪みます。

無作為化(randomization)はこれを根こそぎ解決します。論理はこうです。

割り当てをコインの裏表(乱数)だけで決めると、割り当ては対象者のいかなる特性とも統計的に独立になる。したがって年齢・重症度・遺伝・生活習慣といったあらゆる交絡因子の分布が、両群で確率的に等しくなる(標本が十分大きければ)。

ここで決定的なのは「測定していない・気づいてもいない交絡因子まで均される」ことです。観察研究での交絡調整(層別・回帰・傾向スコア、統計的因果推論・傾向スコア)は「観測した交絡因子」しか調整できません。未知・未測定の交絡因子が残れば歪みは消えない。これに対し無作為化は、割り当てが乱数なので因子を測っているかどうかに関係なく、すべての因子を均等に振り分けます。未知の交絡を消せることが、RCTが観察研究より上位に立つ唯一にして最大の理由です。

要するに「乱数で割り当てる → 割り当てが全特性と独立 → 既知も未知も交絡因子の分布が両群で揃う → 群間の差は介入の効果だけに帰せる」。これが因果効果を不偏に推定できる仕組みです。

flowchart TD
  R["対象者を乱数で割り当て"] --> IND["割り当てが対象者の全特性と独立"]
  IND --> BAL["既知・未知すべての交絡因子の分布が<br/>両群で確率的に均一化"]
  BAL --> CAUSE["群間の結果の差 = 介入の因果効果<br/>(交絡で歪まない)"]
  OBS["観察研究の交絡調整<br/>(層別・回帰・傾向スコア)"] -.->|観測した交絡しか消せない| LIM["未知の交絡が残る"]

5.2 盲検化・プラセボ・割付の隠蔽

無作為化だけでは「割り当て後」に入るバイアスを防げません。RCTはさらに次の仕掛けで情報バイアスを潰します。それぞれ防ぐバイアスが違うので区別が問われます。

⚠️ 盲検化と割付の隠蔽は別物。隠蔽は「割り当てが決まる前〜瞬間」に次の割り当てを隠して選択バイアスを防ぐ。盲検化は「割り当てが決まった」に誰がどちらかを隠して情報(観察者)バイアスを防ぐ。タイミングも防ぐバイアスも違う。1級では混同させる問題が出ます。


6. エビデンス階層

研究デザインは「因果関係をどれだけ確からしく示せるか」で序列がつきます。これが**エビデンス階層(hierarchy of evidence)**です。

flowchart TB
  L1["① 系統的レビュー・メタアナリシス<br/>複数のRCTを統合(最も確実)"]
  L2["② ランダム化比較試験 RCT<br/>未知の交絡まで均す"]
  L3["③ コホート研究<br/>時間順序◯・未知の交絡が残る"]
  L4["④ ケースコントロール研究<br/>結果から遡る・各種バイアスを受けやすい"]
  L5["⑤ 症例報告・症例集積<br/>対照群なし(最も弱い)"]
  L1 --> L2 --> L3 --> L4 --> L5

序列の根拠は一貫しています。未知の交絡を消せるRCTが個別研究では最強、それを束ねて精度と一般性を上げた系統的レビュー/メタアナリシス効果の指標で扱う統合の話につながる)が最上位。観察研究の中では、時間順序が明確で発生率も測れるコホートが、結果から遡りバイアスを受けやすいケースコントロールより上。対照群のない症例報告は関連すら測れず最下位です。

⚠️ 階層は目安であって絶対ではありません。質の低いRCT(小規模・脱落多数)より、よく設計された大規模コホートのほうが信頼できることもある。「RCTだから無条件に正しい」は誤りで、各研究の実施の質(バイアス管理)まで見るのが正しい読み方です。


7. バイアスと妥当性

疫学の結論を歪める誤差(系統誤差)がバイアスです。偶然誤差(標本のばらつき)と違い、標本を増やしても消えません。大きく3種類に整理します。

7.1 3つのバイアス

flowchart TD
  B["バイアス(系統誤差)"] --> SEL["選択バイアス<br/>対象の選び方の偏り"]
  B --> INF["情報(測定)バイアス<br/>曝露・結果の測り方の偏り"]
  B --> CONF["交絡<br/>第3因子による見かけの関連"]
  SEL --> SEL1["例:脱落が群で偏る/対照の選び方"]
  INF --> INF1["例:思い出しバイアス・観察者バイアス"]
  CONF --> CONF1["例:年齢が曝露と結果の両方に影響"]

7.2 内的妥当性と外的妥当性

両者はしばしばトレードオフします。RCTは厳しい組み入れ基準(高齢者や合併症のある人を除く)で内的妥当性を高めますが、その結果現実の多様な患者に当てはまりにくく外的妥当性が下がることがあります。要するに「内的妥当性=この研究内で正しいか/外的妥当性=外の世界に持ち出せるか」。1級では「RCTで効いた薬が現場で効くとは限らない(外的妥当性の限界)」といった論点で問われます。


8. 各デザインで「何が測れるか」対応表

デザイン集め方(基準)時間の向き測れる主な指標因果の強さ
コホート(前向き/後ろ向き)曝露で群分け曝露→発症発生率・リスク比 RR・リスク差・OR中(時間順序◯、未知交絡が残る)
ケースコントロール結果(発症)で群分け発症→曝露を遡るオッズ比 OR のみ(まれな疾患でOR≈RR)やや低(バイアス受けやすい)
横断一時点で同時観察なし(同時)有病率・有病オッズ比(時間順序不明)低(逆因果を排除できない)
RCT(介入)無作為に割り当て割付→結果リスク比・リスク差・ハザード比など(交絡なし)高(未知の交絡まで均す)

この表が本ノートの実用上の要です。**「コホート→RR、ケースコントロール→OR、横断→有病率」**を即答できるようにしてください。


9. 試験での問われ方(1級)

医薬生物学分野での1級の典型的な問われ方を論点ごとに整理します(出題範囲・配点は要最新確認)。


10. 引っかけ・頻出論点


よくある疑問(Q&A)

Q1. ケースコントロールでオッズ比しか出せないのが、まだ腑に落ちません。一言でいうと?

研究者が列の人数(症例と対照を何人集めるか)を自分で決めてしまうから」です。リスク比 a/(a+b)c/(c+d)\frac{a/(a+b)}{c/(c+d)} には a+ba+b(曝露群の総数)が入りますが、対照を倍集めれば b,db,d が倍になりこの数字が動く——母集団の発症率とは無関係な、研究者の決めた数字です。だからリスクは復元できない。一方オッズ比 ad/bcad/bc は個々のセルの積の比なので、列を定数倍しても分子分母で約分されて不変。さらに「疾患側で測ったOR」と「曝露側で測ったOR」が同じ ad/bcad/bc になる対称性があるので、症例・対照から測った曝露オッズ比が、知りたい疾患のオッズ比と一致します。列をいじっても動かないのがORだけ、これが理由です。

Q2. それならコホートでもオッズ比を使えばいいのでは? なぜリスク比を好むのですか?

コホートではORもRRも両方計算できますが、解釈のしやすさでRRが好まれます。RRは「リスクが何倍」と直感的ですが、ORは「オッズが何倍」で日常感覚から遠い。しかもよくある疾患ではORはRRより1から離れた値になり、効果を誇張して見せてしまう。コホートはリスク(分母つきの率)を直接測れるのだから、わざわざ解釈の難しいORを使う理由がない、というわけです。ORの出番は「リスクが原理的に測れないケースコントロール」と「ロジスティック回帰の係数」です。

Q3. 無作為化すれば交絡を調整する解析(傾向スコアなど)は不要ですか?

理論上は不要です。無作為化が成功していれば交絡因子は両群で均衡しているので、単純な群間比較で因果効果が不偏推定できます。これがRCTの美点です。ただし実務では、(1) 標本が小さいと偶然の不均衡が残る、(2) 脱落(追跡不能)で均衡が崩れる、ため、ベースライン共変量で調整した解析を併用することがあります。あくまで「念のための精度向上」であり、観察研究のように「未知の交絡を消すため必須」ではない点が違います。

Q4. 「まれな疾患の仮定」はどのくらいまれならよいのですか?

目安は有病率おおむね10%以下(Greenland)とされますが、これは絶対基準ではありません。近似の精度は有病率だけでなく効果の大きさ(ORが1から離れるほどズレが拡大)にも依存します。だから「10%以下なら常にOR≈RR」と機械的に当てはめるのは危険で、まれでない疾患や強い関連ではORとRRの乖離が無視できなくなります(この閾値や評価は文献で更新されうるので要最新確認)。試験では「まれだから近似できる」という論理が言えれば十分なことが多いです。

Q5. 観察研究でも交絡を調整すれば、RCTと同じくらい信頼できますか?

いいえ。決定的な差は「未知・未測定の交絡」です。層別・回帰・傾向スコアといった調整は、すべて「データで測った交絡因子」しか消せません。測っていない、あるいは存在に気づいてすらいない交絡因子が結果に効いていれば、どれだけ精緻に調整しても歪みは残ります。RCTはこの問題を無作為化で原理的に回避します(割り当てが乱数なので、因子を測っているかに関係なくすべて均す)。だから観察研究は「測った交絡を消した上での最善の推定」であって、RCTの代替にはなりません。これが階層でRCTが上位にある根拠です(観察研究固有の交絡対策は 統計的因果推論・傾向スコア を参照)。


まとめ


関連ノート