← 統計検定テキスト 一覧

📊 対象級:1級 | 重要度:C(低頻度)

要点(BLUF)

このノートは統計検定の公式出題範囲表には明記されていません(範囲表外)が、1級・統計応用(医薬生物学)で出題実績のある発展トピックです(範囲・配点は改訂されうるため要最新確認)。生存時間解析と反復測定の自然な延長として、2つの道具を押さえます。

graph TD
  ROOT["このノートの2トピック<br/>(範囲表外・出題実績あり)"] --> A["A. 競合リスク<br/>生存時間解析の発展"]
  ROOT --> B["B. 線形混合モデル LMM<br/>分散分析・回帰の発展"]
  A --> A1["原因別ハザード(rate)"]
  A --> A2["累積発生関数 CIF(risk)"]
  A1 -. 1対1でない .-> A2
  A --> A3["1-KM は CIF を過大推定<br/>→ Fine-Gray で対処"]
  B --> B1["固定効果 Xβ(共通の傾向)"]
  B --> B2["変量効果 Zb(個体・群差)"]
  B --> B3["周辺分散 Var(y)=ZGZᵀ+R<br/>→ REMLで分散成分を推定"]

A. 競合リスク(competing risks)

A-1. 何が問題か — 排他的イベントと「打ち切り」の誤用

生存時間解析では「イベント(死亡など)」は1種類で、観測が途中で切れる**打ち切り(censoring)**は「その人はまだイベントを起こしていない」ことを意味しました。ところが医薬の現場では、互いに排他的な複数の死因がよくあります。

例:がん患者の追跡で、注目するイベントが「がんによる死亡」だとします。しかし「他病死(心疾患などでの死亡)」も起こりえます。一方が起きると、もう一方はもう永遠に観測できません(死んだ人にがん死は起こらない)。このように、あるイベントの発生が別のイベントの観測を妨げるとき、それらを**競合リスク(競合イベント)**と呼びます。

ここでやってはいけないのが、「他病死を単なる打ち切りとして扱う」ことです。打ち切りの本来の意味は「まだイベントが起こりうる人を、追跡の都合で見失った」ですが、他病死した人はもうがん死を起こしえない。両者は意味が違います。この取り違えが、後述の過大推定を生みます。

stateDiagram-v2
    [*] --> 生存中
    生存中 --> がん死: 原因別ハザード h₁(t)
    生存中 --> 他病死: 原因別ハザード h₂(t)
    がん死 --> [*]
    他病死 --> [*]
    note right of 他病死
      他病死すると
      もうがん死は起こらない
      (排他的・吸収状態)
    end note

要するに「競合リスクとは、複数の出口が排他的に存在し、どれか1つから出ると他の出口にはもう行けない状況」。各出口(死因)が吸収状態になっているのがポイントです。

A-2. 原因別ハザードと累積発生関数(CIF)

競合リスクを記述する2つの量を定義します。イベントの種類を j=1,2,j=1,2,\dots とします(例:j=1j=1 がん死、j=2j=2 他病死)。

原因別ハザード(cause-specific hazard) hj(t)h_j(t):いま時刻 tt までどのイベントも起きずに生存している人が、次の瞬間に原因 jjイベントを起こす瞬間発生率。

hj(t)=limΔt0Pr(tT<t+Δt, J=jTt)Δth_j(t)=\lim_{\Delta t\to 0}\frac{\Pr(t\le T<t+\Delta t,\ J=j\mid T\ge t)}{\Delta t}

ここで TT はイベントまでの時間、JJ はどのイベントが起きたかを表します。要するに「原因 jj だけに注目した瞬間死亡率。ただし分母は『まだ誰のイベントも起きていない生存者』全員」。

全ハザード(all-cause hazard) h(t)h(t) は、どれか1つでもイベントが起きる瞬間率なので、原因別ハザードの単純な和です。

h(t)=jhj(t)h(t)=\sum_j h_j(t)

要するに「全体の瞬間死亡率は、死因ごとの瞬間死亡率を足したもの」。これは「どの死因も同じ生存者集団から起こる」ことから直ちに従います。

全イベント生存関数 S(t)S(t)(どの死因でもまだ死んでいない確率)は、生存時間解析の標準公式どおり全ハザードから決まります。

S(t)=exp ⁣(0th(u)du)=exp ⁣(0tjhj(u)du)S(t)=\exp\!\left(-\int_0^t h(u)\,du\right)=\exp\!\left(-\int_0^t \sum_j h_j(u)\,du\right)

要するに「生き残る確率は、全死因を合わせた累積ハザードの指数マイナス」。ここまでは1種類イベントの素直な拡張です。

累積発生関数(CIF, cumulative incidence function) Fj(t)F_j(t):時刻 tt までに原因 jjイベントを起こしてしまった人の割合。これが競合リスク特有の量で、定義は

  Fj(t)=Pr(Tt, J=j)=0thj(u)S(u)du  \boxed{\;F_j(t)=\Pr(T\le t,\ J=j)=\int_0^t h_j(u)\,S(u)\,du\;}

です。この積分の中身に注目してください。 原因 jj で死ぬには、時刻 uu の直前までどの死因でも死なずに生き残っていて(S(u)S(u)、ちょうどその瞬間に**原因 jj で死ぬ(hj(u)duh_j(u)\,du)**必要があります。この2つの積を 00 から tt まで足し上げたものが Fj(t)F_j(t) です。

A-3. CIF と原因別ハザードが「1対1対応しない」ことの導出

ここがこのトピックの最重要点です。Fj(t)F_j(t) の式をもう一度見ます。

Fj(t)=0thj(u)原因 j だけS(u)全死因に依存duF_j(t)=\int_0^t \underbrace{h_j(u)}_{\text{原因 }j\text{ だけ}}\cdot\underbrace{S(u)}_{\text{全死因に依存}}\,du

被積分関数には hj(u)h_j(u) だけでなく S(u)=exp(0ukhk)S(u)=\exp(-\int_0^u \sum_k h_k) が掛かっています。そして S(u)S(u)全死因のハザード {hk}\{h_k\} 全部に依存します。つまり——

原因 jj の CIF Fj(t)F_j(t) は、原因 jj のハザード hjh_j だけでは決まらず、競合相手 h2,h3,h_2,h_3,\dots にも依存する。

具体的に言うと、競合イベント(他病死 h2h_2)が増えると S(u)S(u) が速く下がり、被積分関数の S(u)S(u) が小さくなるので、たとえ h1h_1(がん死のハザード)が同じでも F1(t)F_1(t)(がん死の発生割合)は小さくなります。「他の死因で先に死んでしまう人が増えれば、がんで死ぬ人の割合は下がる」という、考えてみれば当たり前の現象です。

要するに「ハザード(rate, 瞬間率)と CIF(risk, 累積発生割合)は1対1対応しない。CIF は競合相手のハザードにも引きずられる」。1種類イベントなら F(t)=1S(t)F(t)=1-S(t) で両者は1対1でしたが、競合リスクではこの単純な対応が壊れます。これが「rate と risk を混同してはいけない」と言われる理由です。

なお、全 CIF の和は全イベント確率に一致します。

jFj(t)=j0thj(u)S(u)du=0t(jhj(u))S(u)du=0th(u)S(u)du=1S(t)\sum_j F_j(t)=\sum_j\int_0^t h_j(u)S(u)\,du=\int_0^t\Big(\sum_j h_j(u)\Big)S(u)\,du=\int_0^t h(u)S(u)\,du=1-S(t)

最後の等号は dduS(u)=h(u)S(u)\frac{d}{du}S(u)=-h(u)S(u)(生存関数の定義微分)から 0th(u)S(u)du=[S(u)]0t=1S(t)\int_0^t h(u)S(u)\,du=-[S(u)]_0^t=1-S(t) となることによります。要するに「各死因で死んだ割合を全部足すと、(どれかで)死んだ割合 1S(t)1-S(t) にちゃんと一致する」。CIF はこの 1S(t)1-S(t) を死因ごとに正しく分割したものになっているわけです。

A-4. カプラン・マイヤー(1-KM)が CIF を過大推定する理屈

競合リスクを無視して「他病死を打ち切り扱い」し、がん死だけを対象に生存時間解析のカプラン・マイヤー(KM)法を当て、1S^KM(t)1-\hat S_{\text{KM}}(t) でがん死の累積割合を出す——これがよくある誤りで、真の CIF F1(t)F_1(t) を過大推定します。理屈を2段階で説明します。

ステップ1:KM で出てくる「生存関数」は何を推定しているか。 他病死を打ち切りにしてがん死だけにKMを適用すると、その KM 推定量は「他病死が一切起きなかったと仮定したときの、がん死だけによる仮想的な生存関数」を推定します。これを S1(t)S_1^\ast(t) と書きましょう。対応するハザードは原因別ハザード h1h_1 で、

S1(t)=exp ⁣(0th1(u)du)S_1^\ast(t)=\exp\!\left(-\int_0^t h_1(u)\,du\right)

ここが競合リスク無視の罠です。指数の中が全ハザード h(t)=khkh(t)=\sum_k h_k ではなく、原因別ハザード h1h_1 だけになっています。打ち切りにした他病死の分(h2h_2)が指数から抜け落ちています。

ステップ2:1S11-S_1^\ast と真の CIF を比べる。 この仮想生存関数から作る「過大推定版」を

F~1(t)=1S1(t)=0th1(u)S1(u)du\widetilde F_1(t)=1-S_1^\ast(t)=\int_0^t h_1(u)\,S_1^\ast(u)\,du

と書きます(最後の等号は前と同じく dduS1=h1S1\frac{d}{du}S_1^\ast=-h_1 S_1^\ast から)。これを真の CIF と並べます。

F~1(t)=0th1(u)S1(u)duvsF1(t)=0th1(u)S(u)du\widetilde F_1(t)=\int_0^t h_1(u)\,S_1^\ast(u)\,du \qquad\text{vs}\qquad F_1(t)=\int_0^t h_1(u)\,S(u)\,du

両者の違いは被積分関数に掛かる生存関数だけです。S1S_1^\asth1h_1 しか含まないのに対し、真の SS は全死因 khkh1\sum_k h_k\ge h_1 を含むので、競合イベントが存在する(h2>0h_2>0 となる区間がある)限り

S(u)=exp ⁣( ⁣0u ⁣khk)  exp ⁣( ⁣0uh1)=S1(u)S(u)=\exp\!\Big(-\!\int_0^u\!\textstyle\sum_k h_k\Big)\ \le\ \exp\!\Big(-\!\int_0^u h_1\Big)=S_1^\ast(u)

が成り立ちます。被積分関数の h1(u)h_1(u) は共通・非負なので、生存関数が大きいほど積分も大きく、

  F~1(t)=1SKM(t)  F1(t)  \boxed{\;\widetilde F_1(t)=1-S_{\text{KM}}(t)\ \ge\ F_1(t)\;}

すなわち 1KM1-\text{KM} は真の CIF を必ず過大推定(競合があれば真に大きく) します。要するに「1KM1-\text{KM} は『他病死が一度も起きない世界』のがん死割合を測ってしまう。現実には他病死で先に抜ける人がいるぶん、がん死割合はもっと小さいはずなのに、それを無視するから上振れする」。

直観的な言い換え:他病死した人を「打ち切り」としてリスク集合に残し続けると、KM は「その人もいずれがん死しうる」と勘定してしまう。実際にはもうがん死しえないのに。この死ねない人を母数に数える誤りが過大推定の正体です。

なお、競合イベントが存在しないh20h_2\equiv0、単一イベント)場合は S=S1S=S_1^\ast なので 1KM=F1(t)1-\text{KM}=F_1(t) となり、両者は一致します。だから単一イベントなら 1KM1-\text{KM} で問題ありません。過大推定は競合がある場合だけの現象です。

xychart-beta
    title "1-KM(過大推定)と真のCIF(時刻に対する累積発生割合の概念図)"
    x-axis "時刻 t" [0, 1, 2, 3, 4, 5]
    y-axis "原因1の累積発生割合" 0 --> 0.6
    line "1-KM(他病死を打ち切り=過大)" [0, 0.12, 0.24, 0.36, 0.46, 0.54]
    line "真のCIF F1(競合を考慮)" [0, 0.08, 0.16, 0.24, 0.30, 0.34]

(上図は概念図です。競合イベントがあると 1KM1-\text{KM} は常に真の CIF より上に来ます。)

A-5. Fine-Gray の部分分布ハザードモデル(概念)

CIF に対して、共変量(治療群など)の効果を回帰の形でモデル化したいとき使うのが Fine-Gray の部分分布ハザードモデルです。原因別ハザードの Cox 回帰(生存時間解析の比例ハザードを死因別に当てる)とは狙いが違う点が重要です。

⚠️ Fine-Gray モデルの注意点として、複数の死因それぞれに部分分布ハザードモデルを当てて CIF を足すと、合計が 1 を超えうることが知られています(各モデルが独立に推定され、jFj1S1\sum_j F_j\le 1-S\le1 の制約を自動では守らないため)。因果的な問い(治療の効果のメカニズム)には Fine-Gray は不向き、という指摘もあります。1級では概念(CIF と直接対応するハザードである、という点)を押さえれば十分です。


B. 線形混合モデル(LMM, linear mixed model)

B-1. 動機 — 反復測定・階層データの「独立でない」観測

通常の回帰(分散分析や重回帰)は観測が互いに独立であることを前提にします。ところが医薬では、同じ被験者を何度も測る(反復測定・経時測定)、同じ病院の患者をまとめて測る(階層・マルチレベル)データが普通です。

例:高血圧の薬の効果を見るため、各患者の血圧を投与後 0・4・8・12 週で測る。同じ患者の4測定は互いに相関します(もともと血圧が高い人は4回とも高めに出る)。この相関を無視して全観測を独立として回帰すると、標準誤差を誤り、検定が不正になります。

LMM は、この相関を「患者ごとの個人差を表す変量効果」として明示的にモデルに入れることで解決します。要するに「全員に共通の効果(固定効果)と、個体・群ごとに違う効果(変量効果)を分けて、観測間の相関を変量効果から自然に発生させる」のが LMM です。

graph TD
  POP["集団全体の平均的な傾向<br/>固定効果 β(薬の平均効果など)"] --> P1["患者1の軌跡 = 共通傾向 + 患者1の個人差 b₁"]
  POP --> P2["患者2の軌跡 = 共通傾向 + 患者2の個人差 b₂"]
  POP --> P3["患者3の軌跡 = 共通傾向 + 患者3の個人差 b₃"]
  P1 --> M1["週0,4,8,12 の測定<br/>(同一患者なので相関)"]
  P2 --> M2["週0,4,8,12 の測定"]
  P3 --> M3["週0,4,8,12 の測定"]

B-2. モデルの定式化

LMM の一般形は次のとおりです。

  y=Xβ+Zb+ε  \boxed{\;\boldsymbol y = X\boldsymbol\beta + Z\boldsymbol b + \boldsymbol\varepsilon\;}

各記号の意味は:

そして分布の仮定が LMM の心臓部です。

bN(0,G),εN(0,R),bε\boldsymbol b\sim N(\boldsymbol 0,\,G),\qquad \boldsymbol\varepsilon\sim N(\boldsymbol 0,\,R),\qquad \boldsymbol b\perp\boldsymbol\varepsilon

要するに「固定効果 XβX\boldsymbol\beta で集団共通の平均的な形を、変量効果 ZbZ\boldsymbol b で個体ごとのずれを、誤差 ε\boldsymbol\varepsilon で測定レベルの雑音を表す。変量効果は『平均 0・分散 GG の正規分布から1個体ごとに引いてくる確率変数』」。

B-3. 変量切片と変量傾き

変量効果の典型は2種類です。患者 ii の時刻 tijt_{ij} における血圧 yijy_{ij} を例にします。

変量切片(random intercept)モデル:患者ごとにベースラインの高さだけが違う。

yij=(β0+β1tij)固定効果:共通の直線+b0i患者 i の高さのずれ+εij,b0iN(0,σ02)y_{ij}=\underbrace{(\beta_0+\beta_1 t_{ij})}_{\text{固定効果:共通の直線}}+\underbrace{b_{0i}}_{\text{患者 }i\text{ の高さのずれ}}+\varepsilon_{ij},\qquad b_{0i}\sim N(0,\sigma_0^2)

要するに「全員が同じ傾きの直線を持つが、上下の位置(切片)だけ患者ごとに違う」。b0ib_{0i} が患者 ii 固有の上げ下げです。

変量傾き(random slope)モデル:切片に加えて、時間に対する反応の傾きも患者ごとに違う。

yij=(β0+β1tij)+(b0i+b1itij)患者 i の切片・傾きのずれ+εij,(b0ib1i)N ⁣(0, G=(σ02σ01σ01σ12))y_{ij}=(\beta_0+\beta_1 t_{ij})+\underbrace{(b_{0i}+b_{1i}t_{ij})}_{\text{患者 }i\text{ の切片・傾きのずれ}}+\varepsilon_{ij},\qquad \begin{pmatrix}b_{0i}\\ b_{1i}\end{pmatrix}\sim N\!\left(\boldsymbol 0,\ G=\begin{pmatrix}\sigma_0^2 & \sigma_{01}\\ \sigma_{01} & \sigma_1^2\end{pmatrix}\right)

要するに「患者ごとに直線そのものの位置と傾き(薬の効きの速さ)が違う。σ02\sigma_0^2 が切片の個人差、σ12\sigma_1^2 が傾きの個人差、σ01\sigma_{01} が両者の相関」。GG2×22\times2 行列になり、切片と傾きの共分散まで持つのがポイントです。

B-4. 周辺分散 Var(y)=ZGZ+R\mathrm{Var}(\boldsymbol y)=ZGZ^\top+R の導出

LMM の最重要公式です。変量効果 b\boldsymbol b を**積分消去(周辺化)**したときの y\boldsymbol y の分散を求めます。β,X,Z\boldsymbol\beta,X,Z は定数(または与えられた計画)、b,ε\boldsymbol b,\boldsymbol\varepsilon が確率変数であることに注意します。

平均b,ε\boldsymbol b,\boldsymbol\varepsilon は平均 0 なので、

E[y]=Xβ+ZE[b]+E[ε]=Xβ\mathrm{E}[\boldsymbol y]=X\boldsymbol\beta+Z\,\mathrm{E}[\boldsymbol b]+\mathrm{E}[\boldsymbol\varepsilon]=X\boldsymbol\beta

要するに「平均的な応答は固定効果だけで決まる(変量効果と誤差は平均すると消える)」。

分散:分散の線形変換則 Var(Au)=AVar(u)A\mathrm{Var}(A\boldsymbol u)=A\,\mathrm{Var}(\boldsymbol u)\,A^\top と、bε\boldsymbol b\perp\boldsymbol\varepsilon(独立なので共分散項が消える)を使います。定数 XβX\boldsymbol\beta は分散に効きません。

Var(y)=Var(Xβ+Zb+ε)=Var(Zb)+Var(ε)+2Cov(Zb,ε)\mathrm{Var}(\boldsymbol y)=\mathrm{Var}(X\boldsymbol\beta+Z\boldsymbol b+\boldsymbol\varepsilon) =\mathrm{Var}(Z\boldsymbol b)+\mathrm{Var}(\boldsymbol\varepsilon)+2\,\mathrm{Cov}(Z\boldsymbol b,\boldsymbol\varepsilon)

ここで bε\boldsymbol b\perp\boldsymbol\varepsilon より Cov(Zb,ε)=0\mathrm{Cov}(Z\boldsymbol b,\boldsymbol\varepsilon)=0。残る2項に線形変換則を当てて Var(Zb)=ZVar(b)Z=ZGZ\mathrm{Var}(Z\boldsymbol b)=Z\,\mathrm{Var}(\boldsymbol b)\,Z^\top=ZGZ^\topVar(ε)=R\mathrm{Var}(\boldsymbol\varepsilon)=R。よって

  Var(y)=ZGZ+R    V  \boxed{\;\mathrm{Var}(\boldsymbol y)=ZGZ^\top+R\;\equiv\;V\;}

要するに「y\boldsymbol y の全分散は『変量効果由来の分散 ZGZZGZ^\top』+『残差分散 RR』。変量効果を消し去る代わりに、その散らばりが ZGZZGZ^\top という形で観測の分散・共分散に染み出す」。

この V=ZGZ+RV=ZGZ^\top+R がなぜ重要かというと、観測間の相関を生み出しているのがこの ZGZZGZ^\top だからです。例えば変量切片モデルで同一患者 ii の2測定 yij,yiky_{ij},y_{ik}jkj\ne k)の共分散を計算すると、共通の b0ib_{0i} を通じて

Cov(yij,yik)=Cov(b0i+εij, b0i+εik)=Var(b0i)=σ02>0\mathrm{Cov}(y_{ij},y_{ik})=\mathrm{Cov}(b_{0i}+\varepsilon_{ij},\ b_{0i}+\varepsilon_{ik})=\mathrm{Var}(b_{0i})=\sigma_0^2>0

となり、同じ患者の測定が正の相関を持つことが自然に出てきます(ε\varepsilon は独立なので消え、共通の b0ib_{0i} だけが残る)。これがまさに B-1 で問題にした「反復測定の相関」を、変量効果が表現している姿です。要するに「周辺化すると、y\boldsymbol y は平均 XβX\boldsymbol\beta・分散 V=ZGZ+RV=ZGZ^\top+R の多変量正規 yN(Xβ,V)\boldsymbol y\sim N(X\boldsymbol\beta,\,V) になり、相関は全部 VV に畳み込まれる」。

B-5. 反復測定分散分析の一般化・パネルデータとの関係

LMM はいくつかの古典的手法を特殊ケースとして含む一般化です。

B-6. 分散成分の推定 — REML の考え方

β\boldsymbol\beta(固定効果)と G,RG,R の中の分散成分σ02,σ12,σ2\sigma_0^2,\sigma_1^2,\sigma^2 など)をどう推定するか。素直には周辺分布 yN(Xβ,V)\boldsymbol y\sim N(X\boldsymbol\beta,V) の対数尤度を最大化する最尤推定(ML)ですが、分散成分の ML 推定には下方バイアス(過小推定)があります。

なぜ ML がバイアスを持つか:ML は分散成分を推定するとき、固定効果 β\boldsymbol\beta同じデータから推定して使い切ってしまい、β\boldsymbol\beta の推定で消費した自由度を勘定に入れないためです。最も簡単な例で言えば、通常の分散の最尤推定量 1n(yiyˉ)2\frac1n\sum(y_i-\bar y)^2 が母分散を過小推定し、不偏推定には n1n-1 で割る必要があるのと同じ構図です(平均 yˉ\bar y を推定したぶん自由度が1減る)。LMM では固定効果が pp 個あるので、このズレが効きます。

**REML(制限付き最尤法 / 残差最尤法, restricted maximum likelihood)**は、この自由度の消費を補正します。アイデアは「固定効果 β\boldsymbol\beta に依存しない方向(残差のコントラスト)だけを使って尤度を作り、それを最大化する」こと。β\boldsymbol\beta を消去した尤度で分散成分を推定するため、固定効果推定による自由度の損失が正しく勘定され、分散成分のバイアスが軽減されます。要するに「REML は『β\boldsymbol\beta を推定したぶん自由度が減る』ことを織り込んで分散成分を推定する方法。n1n-1 で割る不偏分散の、混合モデル版の一般化」。

実務的な注意(要点だけ):固定効果の構造(XX)が異なるモデル同士を尤度比検定で比べるときは、REML の尤度ではなく ML の尤度を使う必要があります。REML 尤度は XX に依存するため、固定効果が違うモデル間では直接比較できないからです。分散成分の推定値そのものは REML を使う、というのが標準です。


⚠️ 引っかけ・頻出論点


よくある疑問(Q&A)

Q1. 競合イベントをなぜ普通の打ち切りとして扱ってはいけないのですか? どちらも「その後がわからない」点は同じに見えます。

「その後がわからない」理由が決定的に違います。普通の打ち切り(追跡終了・転院)は「この人は将来まだイベント(がん死)を起こしうるが、観測の都合で見失った」を意味し、KM はその人を「いずれ起こす可能性のある母集団」として正しく扱います。一方、他病死した人は「もう絶対にがん死を起こさない」。なのに打ち切り扱いするとリスク集合に残り続け、KM は「この人もいずれがん死しうる」と勘定してしまう。死ねない人を分母に数えるこの誤りが、1KM1-\text{KM} がCIFを過大推定する正体です。競合イベントは打ち切りではなく**別の出口(吸収状態)**として扱わねばなりません。

Q2. では競合リスクがあるとき、各死因の「リスク」はどう報告すればいいのですか?

累積発生関数(CIF)Fj(t)F_j(t) を報告します。Fj(t)=0thj(u)S(u)duF_j(t)=\int_0^t h_j(u)S(u)\,du で、これは「時刻 tt までに原因 jj で実際に死んだ人の割合」を、競合の存在を織り込んで正しく出した量です。推定にはノンパラメトリックな CIF 推定量(Aalen-Johansen 推定量。KM の競合リスク版)を使い、1KM1-\text{KM} は使いません。群間で CIF を比べたいなら Gray 検定、共変量の効果を見たいなら Fine-Gray モデルです。要するに「競合があるなら 1KM1-\text{KM} ではなく CIF(とその専用推定量)で報告する」。

Q3. 原因別ハザードの Cox 回帰と Fine-Gray モデル、どちらを使えばいいのですか?

問いの種類で決まります。「なぜそのイベントが起きるのか(生物学的メカニズム・病因)」を知りたいなら、原因別ハザードの Cox 回帰です。これは「いま生存している人の中での瞬間発生率」に共変量がどう効くかを見るので、メカニズムの解釈に向きます。一方、「ある治療群でそのイベントが結局どれだけ起きるか(絶対リスク・予後予測)」を知りたいなら、CIF に直接対応する **Fine-Gray(部分分布ハザード)**です。要するに「メカニズム=原因別ハザード、結果としての発生確率の予測=Fine-Gray」。両者は別の量を推定しているので、どちらが正しいというより目的次第です。

Q4. LMM で、ある効果を固定にするか変量にするかはどう決めるのですか?

原則は「興味の対象で、水準が固定的に意味を持つものは固定効果たまたまサンプリングされた繰り返しの単位で、その個々の値より散らばりに興味があるものは変量効果」です。例えば薬の用量(0/低/高)や時間は、その水準自体に関心があり全体に共通の効果を見たいので固定効果。一方、被験者ID・施設・実験日のような「母集団からたまたま選ばれた繰り返しの単位」は、個々の被験者の値そのものより「被験者間でどれだけばらつくか」に関心があるので変量効果にします。要するに「結論を一般化したい対象は固定、繰り返しの『容れ物』は変量」。

Q5. 周辺分散 V=ZGZ+RV=ZGZ^\top+R の式は、結局何のためにあるのですか?

観測間の相関構造を1つの行列に表現するためです。LMM は b\boldsymbol b を積分消去すると yN(Xβ,V)\boldsymbol y\sim N(X\boldsymbol\beta,V) という多変量正規になり、推定(一般化最小二乗や尤度最大化)はこの VV を使って行われます。VV の非対角成分(共分散)が「同じ患者の測定どうしは相関する」という構造を担っており、ZGZZGZ^\top がそれを生み出します。要するに「V=ZGZ+RV=ZGZ^\top+R は、変量効果モデルが暗に仮定している『観測どうしの相関の地図』。推定も検定もこの VV の上で行う」。これがないと反復測定の相関を無視した誤った標準誤差になります。

Q6. REML はなぜ ML より分散成分が「正確」なのですか? 最尤法が最良ではないのですか?

最尤法は漸近的には優れますが、有限標本では分散成分を過小推定するという既知の欠点があります。原因は「分散を推定するとき、固定効果 β\boldsymbol\beta を同じデータから推定して使い、そのぶん減った自由度を勘定に入れない」ことです。最も単純な例が標本分散で、1n(yiyˉ)2\frac1n\sum(y_i-\bar y)^2 は母分散を過小推定し、平均を推定したぶん自由度が1減るので不偏には n1n-1 で割ります。REML はこの考えを混合モデルに一般化し、「固定効果に依存しない残差の情報だけで分散成分を推定する」ことで自由度の損失を正しく補正します。要するに「REML は不偏分散が nn でなく n1n-1 で割るのと同じ補正を、pp 個の固定効果ぶんに対して行う」。だから分散成分の点推定では REML が標準です。


まとめ


関連ノート