構造方程式モデル・パス解析｜統計検定テキスト

📊 対象級：1級　|　重要度：A（頻出）

要点（BLUF）

構造方程式モデル（SEM）＝共分散構造分析は、「観測変数だけの連立回帰（パス解析）」を潜在変数まで含めて一般化した枠組みです。人文・社会科学（心理・教育・社会調査）で「直接は測れない構成概念（態度・能力・満足度）の間の因果構造」を、複数の観測指標から推定するために使われ、1級・人文科学分野では**頻出（重要度A）**です。

パス解析：観測変数のみで、複数の回帰式を連立させた因果モデル。矢印（パス）に付くパス係数は標準化偏回帰係数。直接効果・間接効果・総効果を分解できる。
SEM：パス解析に潜在変数を加えた一般枠組み。測定方程式（潜在変数→観測指標。検証的因子分析（CFA）と同じ構造）と構造方程式（潜在変数間の回帰）の2層からなる。
推定の原理（共分散構造分析）：モデルが含意する共分散行列 $\Sigma(\theta)$ を、データの標本共分散行列 $S$ に最もよく当てはめる $\theta$ を、適合関数（最尤 $F_{ML}$ など）の最小化で求める。当てはまりは平均ではなく共分散（相関）構造で測るのが最大の特徴。

範囲・配点は改訂されうるため要最新確認ですが、パス図の読み取り・自由度（識別性）の計算・ $\chi^2$ 適合度検定の向き（棄却されない方が当てはまり良）・因子分析との違いが定番の問われ方です。

graph TD
  ROOT["構造方程式モデル（SEM）<br/>＝共分散構造分析"] --> PATH["パス解析<br/>観測変数のみの連立回帰"]
  ROOT --> LATENT["潜在変数を含むフルSEM"]
  LATENT --> MEAS["測定方程式<br/>潜在 → 観測指標<br/>（＝検証的因子分析 CFA）"]
  LATENT --> STRUCT["構造方程式<br/>潜在変数間の回帰<br/>（＝パス解析の潜在版）"]
  PATH -.->|潜在変数を足すと| LATENT
  ROOT --> FIT["推定：Σ(θ) を S に当てはめ<br/>適合関数 F を最小化"]
  FIT --> IDENT["識別性・自由度<br/>df = p(p+1)/2 − 推定パラメータ数"]
  FIT --> GOF["適合度<br/>χ²検定・CFI・RMSEA・GFI・AIC"]

1. パス解析 — 観測変数だけの連立回帰

1.1 何をするものか — 重回帰との違い

重回帰分析（重回帰分析）は「1つの目的変数を複数の説明変数で説明する」モデルでした。パス解析はこれを拡張し、複数の式を連立させて、変数間の因果の連鎖（経路）全体をモデル化します。

パス解析：観測変数のみを使い、研究者が立てた因果の向き（どの変数がどの変数に影響するか）を矢印（パス）の図で表し、各矢印の強さを連立回帰で推定する手法。

要するに「重回帰を何本も束ね、ある変数が別の式では説明変数に、また別の式では目的変数になる、という入れ子の因果構造を一度に推定する」。例えば「親の学歴 → 本人の学歴 → 本人の収入」という連鎖では、本人の学歴は**親の学歴に対しては結果（目的変数）**だが、**収入に対しては原因（説明変数）**です。重回帰1本ではこの二役を同時に扱えませんが、パス解析なら扱えます。

1.2 パス図の記法

SEMの図はパス図で表します。記法は厳密に決まっています。

記号	意味
長方形 □	観測変数（実際に測定したデータ）
楕円 ○	潜在変数（直接は測れない構成概念。因子）
単方向矢印 →	因果・影響（回帰）。元から先への効果
双方向矢印 ↔	相関（無向。原因の方向を仮定しない関連）
矢印に付く数値	パス係数（→）／相関係数（↔）

要するに「四角は測ったもの、丸は測れないもの、一本矢印は『○○が△△に効く』、両矢印は『ただ相関している』」。

flowchart LR
  X1["親の学歴<br/>（観測）"] -->|a| X2["本人の学歴<br/>（観測）"]
  X1 -->|c| Y["本人の収入<br/>（観測）"]
  X2 -->|b| Y
  E2(("誤差 e2")) -.-> X2
  EY(("誤差 ey")) -.-> Y

この図は次の連立回帰式（測定変数を標準化した形）に対応します。

\begin{aligned} \text{本人の学歴} &= a\cdot(\text{親の学歴}) + e_2\\ \text{本人の収入} &= b\cdot(\text{本人の学歴}) + c\cdot(\text{親の学歴}) + e_y \end{aligned}

要するに「矢印1本＝回帰係数1個、式の本数＝矢印の刺さっている被説明変数の数」。

1.3 パス係数＝標準化偏回帰係数

パス図の矢印に付くパス係数は、変数をすべて標準化（平均0・分散1）したうえでの標準化偏回帰係数です。これが定番の論点です。

パス係数＝標準化偏回帰係数：他のパス（説明変数）の影響を一定にしたうえでの、その経路だけの効果を、単位に依存しない標準化スケールで表したもの。

要するに「パス係数は、各変数をものさしの単位から解放（標準化）したうえでの偏回帰係数」。単位に依存しないので、 $a$ と $b$ と $c$ を直接比較して「どの経路の効果が強いか」を論じられます（非標準化のままだと単位が違って比較できません）。係数の絶対値が大きいほど、その経路の影響が強いと読みます。

1.4 直接効果・間接効果・総効果（媒介）

パス解析の真価は、ある変数が別の変数に及ぼす効果を経路ごとに分解できる点です。上の例で「親の学歴 → 収入」の効果を考えます。

直接効果（direct effect）：親の学歴から収入へ直接刺さる矢印の係数。上図では $c$ 。間に何も挟まない「じかの効果」。
間接効果（indirect effect）：媒介変数（ここでは本人の学歴）を経由する経路の効果。経路上の係数の積で計算する。上図では $a\times b$ （親の学歴 → 本人の学歴 → 収入）。
総効果（total effect）：直接効果と間接効果の和。上図では $c + a b$ 。

\boxed{\;\text{総効果} = \underbrace{c}_{\text{直接効果}} + \underbrace{a\,b}_{\text{間接効果}}\;}

なぜ間接効果は係数の「積」なのか。 変数が標準化されていると、各パス係数は「元の変数が1標準偏差動いたとき、先の変数が何標準偏差動くか」を表します。親の学歴が1SD上がると本人の学歴は $a$ SD上がり（1本目の係数）、本人の学歴が $a$ SD上がると収入は $b\times a$ SD上がる（2本目の係数）。経路を直列にたどると効果が掛け算で伝わるので、間接効果は $a\times b$ です。要するに「矢印を直列にたどるときは係数の積、複数経路を合わせるときは和」。

媒介（mediation）の分析とは、まさにこの「総効果のうち、どれだけが媒介変数を経由した間接効果か」を調べることです。直接効果がほぼ0で間接効果が大きければ「完全媒介」、両方あれば「部分媒介」と解釈します。

2. SEM — 潜在変数を含む一般枠組み

2.1 潜在変数を入れる動機

人文・社会科学で扱いたい概念の多くは直接測れません。「学力」「不安」「顧客満足」「権威主義的態度」などは、それ自体を1つの数値で観測できず、複数のテスト項目・質問項目という観測指標を通じてしか測れません。

SEMは、こうした測れない構成概念を潜在変数（因子）として明示的にモデルに入れ、各潜在変数を複数の観測指標で測りつつ、潜在変数どうしの因果関係を同時に推定します。

潜在変数を入れる利点：観測指標には必ず測定誤差が混じる。潜在変数を介在させると、測定誤差を分離したうえで「真の構成概念どうしの関係」を推定できる。観測変数だけのパス解析（測定誤差が係数に混入する）より、概念間の関係を歪みなく評価できる。

要するに「測れないものを丸（潜在変数）で表し、その丸を複数の四角（指標）で測り、丸どうしの矢印で因果を引く。誤差を切り分けられるのが強み」。

2.2 2層構造 — 測定方程式と構造方程式

フルSEMは2つの層からなります。これがSEMの基本構造で、ここを問う問題が多いです。

flowchart TB
  subgraph SEM2["② 構造方程式（潜在変数間の回帰＝パス解析の潜在版）"]
    direction LR
    F1(("学力<br/>η1")) -->|γ| F2(("進学意欲<br/>η2"))
  end
  subgraph SEM1["① 測定方程式（潜在 → 観測指標＝検証的因子分析）"]
    direction TB
    F1 --> X1["国語<br/>x1"]
    F1 --> X2["数学<br/>x2"]
    F1 --> X3["理科<br/>x3"]
    F2 --> Y1["相談<br/>y1"]
    F2 --> Y2["志望校<br/>y2"]
  end

① 測定方程式（measurement model）：潜在変数（因子）が、観測指標を生み出している部分。検証的因子分析（CFA）とまったく同じ構造です。観測指標 $x$ を、因子 $\xi$ と測定誤差 $\delta$ で表します。

x = \Lambda\,\xi + \delta

ここで $\Lambda$ は因子負荷量（潜在→観測の矢印に付く係数）の行列、 $\delta$ は各指標固有の測定誤差。要するに「各指標＝共通の因子 × 負荷量＋その指標だけの誤差」。これは因子分析（因子分析）そのもので、SEMの測定層は「あらかじめ仮説した因子構造を当てはめて検証する」検証的因子分析に当たります。

② 構造方程式（structural model）：潜在変数どうしの回帰。パス解析の潜在変数版です。内生潜在変数 $\eta$ を、他の潜在変数 $\xi,\eta$ で説明します。

\eta = B\,\eta + \Gamma\,\xi + \zeta

$B$ は内生潜在変数どうしの係数行列、 $\Gamma$ は外生潜在変数からの係数行列、 $\zeta$ は構造方程式の撹乱項（潜在レベルの残差）。要するに「潜在変数どうしの因果を、観測変数のパス解析と同じ形（ただし丸どうし）で書いた層」。

層	何を表すか	既存手法でいうと
測定方程式 $x=\Lambda\xi+\delta$	潜在変数 → 観測指標	検証的因子分析（CFA）
構造方程式 $\eta=B\eta+\Gamma\xi+\zeta$	潜在変数 ↔ 潜在変数	パス解析（の潜在版）

SEM ＝検証的因子分析＋パス解析。測定層で「測れないものを測り」、構造層で「測れたものどうしの因果を引く」。この2層を同時推定するのがSEMです。

パス解析は「測定方程式を持たない（潜在変数がない）SEMの特殊ケース」、検証的因子分析は「構造方程式を持たない（因子間に因果を引かない）SEMの特殊ケース」と位置づけられます。

3. 共分散構造分析 — 推定の原理

3.1 中心アイデア：共分散行列を当てはめる

SEMが「共分散構造分析」とも呼ばれる理由がここにあります。SEMは個々のデータ点ではなく、変数間の共分散（相関）構造にモデルを当てはめます。

中心アイデア：モデル（パス係数・負荷量・誤差分散などのパラメータ $\theta$ の集合）が正しいとすると、観測変数間の共分散行列が理論的にどうなるか計算できる。これをモデル含意共分散行列 $\Sigma(\theta)$ と呼ぶ。これがデータの標本共分散行列 $S$ に最もよく一致するよう $\theta$ を決める。

要するに「モデルが正しければ共分散行列はこうなるはず（ $\Sigma(\theta)$ ）。それを実際の共分散行列（ $S$ ）にできるだけ近づける $\theta$ を探す」。

なぜ共分散で当てはめるのか。 パス図の各係数（直接効果・負荷量）は、突き詰めると「2変数がどれだけ一緒に動くか＝共分散」を生み出す要因です。直列パスは共分散に積で、並列パスは和で寄与します（パス追跡規則）。したがって観測変数間のすべての共分散には、モデルのパラメータ $\theta$ が関数として埋め込まれている。逆に、観測された共分散 $S$ を再現できる $\theta$ を逆算すれば、図の中の係数が推定できる——これが共分散構造分析の論理です。

3.2 最尤適合関数 $F_{ML}$ の導出

観測変数が多変量正規分布に従うと仮定すると、 $\theta$ の推定には最尤法を使います。最小化する最尤適合関数は

\boxed{\;F_{ML}(\theta) = \log\lvert\Sigma(\theta)\rvert + \operatorname{tr}\!\big(S\,\Sigma(\theta)^{-1}\big) - \log\lvert S\rvert - p\;}

です（ $p$ は観測変数の数、 $\operatorname{tr}$ はトレース、 $\lvert\cdot\rvert$ は行列式）。これをステップごとに理解します。

ステップ1：多変量正規の対数尤度から出発する。 平均を共分散に集約して考える共分散構造分析では、 $N$ 個の標本に対する多変量正規の対数尤度は（定数を除き）標本共分散 $S$ とモデル共分散 $\Sigma(\theta)$ だけで書けて、本質的に次に比例します。

\log L(\theta) \propto -\frac{N}{2}\Big[\log\lvert\Sigma(\theta)\rvert + \operatorname{tr}\big(S\,\Sigma(\theta)^{-1}\big)\Big]

要するに「正規分布の尤度は、共分散行列の行列式 $\log\lvert\Sigma\rvert$ と、データとモデルのズレを測る $\operatorname{tr}(S\Sigma^{-1})$ の2項で決まる」。第1項はモデル共分散の「広がりの大きさ」、第2項は「観測共分散 $S$ をモデル共分散 $\Sigma(\theta)$ で割った（標準化した）残差の総量」のイメージです。

ステップ2：尤度最大化を、ズレの最小化に符号反転する。 対数尤度を最大化することは、上の角括弧の中身を最小化することと同じ（係数 $-N/2$ が負なので符号が反転）。そこで最小化すべき量を

\log\lvert\Sigma(\theta)\rvert + \operatorname{tr}\big(S\,\Sigma(\theta)^{-1}\big)

とします。要するに「尤度を最大にする＝この2項の和を最小にする」。

ステップ3：完全適合で0になるよう基準点を引く（定数項の付加）。 このままだと最小値がモデルに依存して比較しにくいので、**「モデルが完全にデータに一致した場合」を基準（0点）**にします。完全適合とは $\Sigma(\theta)=S$ 、すなわち推定共分散が標本共分散にぴったり一致する場合です。そのとき上の式は $\log\lvert S\rvert + \operatorname{tr}(S\,S^{-1}) = \log\lvert S\rvert + p$ になります（ $\operatorname{tr}(I_p)=p$ ）。これを引き去ると

F_{ML}(\theta) = \Big[\log\lvert\Sigma(\theta)\rvert + \operatorname{tr}\big(S\,\Sigma(\theta)^{-1}\big)\Big] - \Big[\log\lvert S\rvert + p\Big]

要するに「完全適合のときの値を引いて、ズレが無ければちょうど0、ズレるほど正に大きくなる『ズレの指標』にした」。これを並べ替えたものが冒頭の $F_{ML}$ です。

ステップ4： $F_{ML}\ge 0$ かつ $=0 \iff \Sigma(\theta)=S$ 。 この関数は常に0以上で、0になるのは $\Sigma(\theta)=S$ （モデルがデータの共分散を完全再現）のときに限られます。要するに「 $F_{ML}$ はモデル含意共分散 $\Sigma(\theta)$ と標本共分散 $S$ の『距離』のようなもので、小さいほど当てはまりが良い」。これを最小化する $\hat\theta$ が最尤推定値です。

\hat\theta_{ML} = \arg\min_{\theta}\, F_{ML}(\theta)

正規性が疑わしい場合は、**一般化最小二乗（GLS）や重み付き最小二乗（WLS／ADF）**といった別の適合関数を使います。GLSの適合関数は残差 $S-\Sigma(\theta)$ を標本共分散で重み付けした2乗和の形で、

F_{GLS}(\theta) = \frac{1}{2}\operatorname{tr}\!\Big[\big\{(S-\Sigma(\theta))\,S^{-1}\big\}^2\Big]

要するに「最尤が使えない（非正規）ときは、共分散行列の残差を重み付き2乗和で測る別の物差し（GLS・WLS）に切り替える」。いずれも「 $\Sigma(\theta)$ を $S$ に当てはめる」という発想は共通です。

3.3 識別性と自由度

$\theta$ を一意に推定できるかは**識別性（identification）**の問題です。鍵は「情報の数（観測共分散の数）と、推定したいパラメータの数のバランス」です。

情報の数。 観測変数が $p$ 個あるとき、標本共分散行列 $S$ は対称なので、独立な要素（非冗長な情報）の数は対角＋上三角で

\frac{p(p+1)}{2}

個です。要するに「手元にある『当てはめ先』の数は、分散 $p$ 個と共分散 $\binom{p}{2}$ 個を合わせて $p(p+1)/2$ 個」。

自由度。 推定するパラメータ（パス係数・因子負荷量・誤差分散・外生変数間の共分散など）の総数を $q$ とすると、モデルの自由度は

\boxed{\;df = \frac{p(p+1)}{2} - q\;}

要するに「自由度＝持っている情報の数 − 推定したいパラメータの数＝情報の余り」。この $df$ の符号で識別状態が3つに分かれます。

状態	自由度	意味	推定・適合度評価
過小識別（under-identified）	$df < 0$	情報よりパラメータが多い	推定不能（解が一意に定まらない）
丁度識別（just-identified / 飽和）	$df = 0$	情報とパラメータが同数	推定はできるが $\Sigma(\theta)=S$ を完全再現し、適合度を評価できない
過剰識別（over-identified）	$df > 0$	情報がパラメータより多い	推定でき、かつ適合度を評価できる（SEMで目指す状態）

核心：適合度を検証できるのは過剰識別（ $df>0$ ）のモデルだけ。丁度識別（ $df=0$ 、飽和モデル）は情報をすべて使い切ってパラメータを決めるので、 $\Sigma(\theta)$ は必ず $S$ に一致してしまい、「当てはまりが良いか」を問う余地がない。だからSEMでは、意味のあるパス（仮説）を立てて自由度を稼ぎ、 $df>0$ にしたうえで適合度を検定する。

要するに「パラメータを盛りすぎると（ $df<0$ ）解けない。盛り切ると（ $df=0$ ）必ずピッタリ当たるので検証できない。少し余白を残して（ $df>0$ ）初めて『仮説した構造がデータと整合するか』を検定できる」。重回帰で説明変数を増やすと当てはまりが必ず上がる（飽和に近づく）のと同じ理屈で、SEMでも自由パラメータを増やすほど適合は良くなるが、それは「モデルが正しい」ことを意味しないという注意につながります。

なお、自由度がプラスでも個別パラメータが識別されない（局所識別不能）こともあり、潜在変数のスケール固定（負荷量の1つを1に固定 or 因子分散を1に固定）など、識別のための制約が別途必要です。これも頻出の注意点です。

4. 適合度の評価 — χ²検定と適合度指標

過剰識別モデル（ $df>0$ ）では、「モデルが含意する共分散構造 $\Sigma(\theta)$ が、母共分散構造と一致するか」を統計的に評価できます。

4.1 χ²適合度検定 — 向きに注意

最も基本的な適合度の検定が** $\chi^2$ 適合度検定**です。最小化した適合関数の値からつくる検定統計量は

\chi^2 = (N-1)\,F_{ML}(\hat\theta)

で、帰無仮説のもとで自由度 $df = p(p+1)/2 - q$ の $\chi^2$ 分布に近似的に従います。仮説の立て方が通常の検定と逆である点が最大の引っかけです。

H_0:\ \Sigma = \Sigma(\theta)\quad(\text{母共分散構造はモデルの含意する構造に一致する})

H_1:\ \Sigma \ne \Sigma(\theta)\quad(\text{一致しない＝モデルは誤り})

向きの核心：帰無仮説 $H_0$ が「モデルは正しい（ $\Sigma=\Sigma(\theta)$ ）」。だから——

$\chi^2$ が小さく $p$ 値が大きい（棄却されない） → $H_0$ を否定できない → モデルの当てはまりが良い。

$\chi^2$ が大きく $p$ 値が小さい（棄却される） → $H_0$ を否定 → モデルとデータの共分散構造がズレている＝当てはまりが悪い。

要するに「普通の検定は『棄却されると嬉しい（差が出た）』が、SEMの $\chi^2$ 適合度検定は逆。棄却されない（ $p>0.05$ ）方がモデルにとって良い知らせ」。 $F_{ML}$ が0に近い（ $\Sigma(\theta)$ が $S$ に近い）ほど $\chi^2$ も小さくなり、棄却されにくくなる、という流れも押さえます。

$\chi^2$ 検定の弱点（だから他の指標も併用する）。 $\chi^2 = (N-1)F_{ML}$ には標本サイズ $N$ が掛かっています。そのため** $N$ が大きいと、わずかな不適合 $F_{ML}>0$ でも $\chi^2$ が大きくなり、ほぼ確実に棄却されてしまいます。「本質的に良いモデルでも、サンプルが大きいと必ず棄却される」という弱点があるため、実務では $\chi^2$ だけでなく以下の適合度指標**を併用します。

4.2 主な適合度指標

複数の指標を組み合わせて総合的に判断します（良い値の目安はあくまで慣例で、絶対基準ではなく要最新確認）。

指標	何を測るか	良い値の目安	性質
$\chi^2$ ／df	$\chi^2$ を自由度で割った値（標本サイズ依存を緩和）	2〜3以下なら良好	$\chi^2$ の $N$ 依存を一部補正
GFI	共分散の当てはまり度合い（回帰の決定係数 $R^2$ に相当）	0.90以上（0.95以上が望ましい）	0〜1。1に近いほど良い
CFI	独立モデル（最悪）と比べてどれだけ改善したか（比較適合度）	0.90以上、0.95以上が望ましい	0〜1。1に近いほど良い。標本サイズに頑健
RMSEA	自由度あたりの近似誤差（モデルの近似的なズレ）	0.05以下が良好、0.08以下が許容、0.10超は不可	0以上。小さいほど良い
AIC	当てはまり＋パラメータ数の罰則（モデル比較用）	小さいほど良い（絶対基準なし）	モデル間の相対比較に使う

それぞれの読み筋を要点で。

GFI（Goodness of Fit Index）：「観測共分散のうちモデルで説明できた割合」で、回帰の $R^2$ に相当。1に近いほど良い。ただし $N$ に依存しやすく近年は重視されない傾向。
CFI（Comparative Fit Index）：「変数間に一切関係がない最悪のモデル（独立モデル）」を基準に、当てはめたモデルがそこからどれだけ改善したかを0〜1で表す。標本サイズに頑健で広く使われる。
RMSEA（Root Mean Square Error of Approximation）：自由度1あたりの近似的なズレの大きさ。小さいほど良い（ $\le0.05$ 良好）。「モデルは近似に過ぎない」前提で不適合を測るため、 $\chi^2$ より実務的。
AIC：「適合（ $\chi^2$ ）＋パラメータ数のペナルティ」。異なるモデルどうしの比較（どちらが倹約的に良く当てはまるか）に使い、単独の値の大小には意味がない。小さい方を選ぶ。

総合判断： $\chi^2$ は参考にしつつ、CFI（0.95以上が望ましい）・RMSEA（0.05以下）・GFI などを併せ見る。1つの指標だけで「良い／悪い」を断じない、というのが実務・試験での標準的な姿勢です。

flowchart TD
  START["過剰識別モデル df>0 を推定<br/>F_ML を最小化して θ̂ を得る"] --> CHI["χ² = (N−1)·F_ML を計算<br/>H0: Σ = Σ(θ)（モデルは正しい）"]
  CHI --> Q{"χ² 検定<br/>p 値は?"}
  Q -->|p > 0.05<br/>棄却されない| GOOD["当てはまり良の方向<br/>（H0 を否定できない）"]
  Q -->|p < 0.05<br/>棄却| WARN["不適合の疑い<br/>ただし N 大では必ず棄却される弱点"]
  GOOD --> IDX["適合度指標で確認<br/>CFI≥0.95 / RMSEA≤0.05 / GFI≥0.90"]
  WARN --> IDX
  IDX --> JUDGE["複数指標を総合して採否を判断<br/>モデル比較は AIC 最小"]

5. 試験での問われ方（1級）

人文科学分野では、SEMの概念構造・パス図の読み取り・適合度の論理が中心に問われます。計算（自由度・間接効果）と概念（χ²の向き・因子分析との違い）の両方が出ます。

パス図 → 効果の分解：パス図と各パス係数の値を与えられ、「親 → 収入」の**間接効果（経路の係数の積）・総効果（直接＋間接の和）**を計算させる。媒介の概念（完全媒介／部分媒介）の判定も。
自由度の計算：観測変数 $p$ 個・推定パラメータ $q$ 個から $df = p(p+1)/2 - q$ を計算し、過剰識別／丁度識別／過小識別を判定させる。「丁度識別（飽和モデル）では適合度を評価できない理由」を説明させることも。
$\chi^2$ 適合度検定の向き：「 $\chi^2$ 検定が棄却されないことがモデルにとって良い」という、通常の検定と逆の論理。 $H_0:\Sigma=\Sigma(\theta)$ が「モデルは正しい」である点を理解しているかを問う。
適合度指標の意味と方向：CFI・GFIは大きいほど良い（1に近い）、RMSEAは小さいほど良い（ $\le0.05$ ）、AICは小さいほど良い（比較用）。指標ごとの良い方向を取り違えないか。
因子分析・パス解析との関係：SEMが「検証的因子分析（測定方程式）＋パス解析（構造方程式）」であること。探索的因子分析（因子分析）との違い（探索的は因子構造をデータから探す、SEMの測定層は因子構造を仮説して検証する）。
共分散構造分析の原理：SEMが個々のデータでなく共分散行列の当てはめ（ $\Sigma(\theta)$ を $S$ に）で推定すること。最尤適合関数 $F_{ML}$ が何を最小化しているか。

6. 引っかけ・頻出論点

⚠️ $\chi^2$ 適合度検定は棄却されない方が良い： $H_0:\Sigma=\Sigma(\theta)$ （モデルは正しい）なので、 $p>0.05$ （棄却されない）＝当てはまり良。通常の検定（棄却されると差が出て嬉しい）と逆向き。ここを反対に覚えるミスが最頻。
⚠️ $\chi^2$ は標本サイズに弱い： $\chi^2=(N-1)F_{ML}$ なので $N$ 大では微小な不適合でも必ず棄却される。「 $\chi^2$ で棄却された＝必ずダメなモデル」ではない。だからCFI・RMSEAなどを併用する。
⚠️ 丁度識別（ $df=0$ ）では適合度を評価できない：飽和モデルは $\Sigma(\theta)=S$ を完全再現するので、 $\chi^2=0$ で常に「完璧に当てはまる」が、それは検証になっていない。適合度を問えるのは過剰識別（ $df>0$ ）のみ。
⚠️ 自由度は「変数の数」でなく「共分散の数」から数える：情報量は $p(p+1)/2$ （分散＋共分散の総数）であって $p$ や $n$ （標本サイズ）ではない。 $df = p(p+1)/2 - q$ 。 $n$ と混同しない。
⚠️ パス係数は標準化偏回帰係数：単なる相関係数でも、非標準化の回帰係数でもない。他のパスの影響を統制した（偏）うえで標準化したもの。だからパス間で大小比較ができる。
⚠️ 間接効果は係数の「積」、総効果は「和」：直列の経路をたどるときは掛け算（ $a\times b$ ）、複数経路を合算するときは足し算（直接 $c$ ＋間接 $ab$ ）。積と和を取り違えない。
⚠️ SEMの測定層は「検証的」因子分析：因子構造をデータから探す探索的因子分析とは別物。SEMでは「この指標群はこの因子を測る」という構造を事前に仮説して当てはめ、適合度で検証する。
⚠️ 適合度指標の方向を取り違えない：CFI・GFIは大きいほど良い（上限1）、RMSEAは小さいほど良い、AICは小さいほど良い（比較用）。「良い値＝大きい」と一律に覚えると RMSEA・AIC で逆になる。
⚠️ 潜在変数にはスケール固定が必要：潜在変数は単位が未定なので、負荷量の1つを1に固定するか因子分散を1に固定しないと識別されない。自由度がプラスでも、この固定を忘れると推定できない。

よくある疑問（Q&A）

Q1. パス解析とSEMはどう違うのですか? 同じものとして語られることがありますが。

パス解析は「観測変数だけを使う連立回帰の因果モデル」で、SEMの特殊ケースです。SEMはこれに潜在変数を加えて一般化したもので、「測れない構成概念（態度・能力など）を複数の観測指標で測りつつ、構成概念どうしの因果を引く」ことができます。整理すると、SEM ＝測定方程式（潜在→観測指標）＋構造方程式（潜在→潜在）の2層で、パス解析は測定方程式を持たない（潜在変数がない）SEM、検証的因子分析は構造方程式を持たない（因子間に因果を引かない）SEM と位置づけられます。「SEM＝共分散構造分析」と呼ぶときは、潜在変数を含む一般枠組み全体を指すのが普通です。

Q2. なぜSEMは「個々のデータ」でなく「共分散行列」を当てはめるのですか?

パス図の各係数（直接効果・因子負荷量）は、突き詰めると「2つの変数がどれだけ一緒に動くか＝共分散」を生み出す要因だからです。直列のパスは共分散に係数の積で寄与し、並列のパスは和で寄与します（パス追跡規則）。つまり観測変数間のすべての共分散の中に、モデルのパラメータ $\theta$ が関数として埋め込まれているので、観測された共分散 $S$ を再現できる $\theta$ を逆算すれば、パス図の中の見えない係数を推定できます。これが「共分散構造分析」という名前の由来で、推定は $\Sigma(\theta)$ （モデルが含意する共分散）を $S$ （標本共分散）にできるだけ近づける作業になります。なお平均構造を加える拡張（切片・潜在平均を扱う）もありますが、基本は共分散の当てはめです。

Q3. χ²適合度検定が「棄却されない方が良い」というのが直感に反します。なぜですか?

通常の検定（例：母平均の差の検定）では帰無仮説 $H_0$ が「差はない」で、これを棄却して「差がある」と言いたい——だから棄却されると嬉しい。SEMの適合度検定は仮説の中身が逆で、 $H_0:\Sigma=\Sigma(\theta)$ が「モデルが含意する共分散構造が母構造と一致する＝モデルは正しい」です。研究者は「自分のモデルは正しい」と主張したいので、この $H_0$ を棄却したくない。よって $\chi^2$ が小さく $p$ 値が大きい（棄却されない）方が、「モデルとデータが整合している」良い知らせになります。ポイントは「何を $H_0$ に置いているか」で、SEMでは『モデルは正しい』を $H_0$ に置いているので向きが反転します。

Q4. 自由度はどう数えるのですか? 重回帰のように「標本サイズ − パラメータ数」ではないのですか?

SEMの自由度は標本サイズ $n$ とは無関係で、「情報の数 − 推定パラメータ数」で数えます。情報の数とは標本共分散行列の独立な要素数 $p(p+1)/2$ （観測変数 $p$ 個の分散 $p$ 個と共分散 $\binom{p}{2}$ 個の合計）です。推定パラメータ $q$ はパス係数・因子負荷量・誤差分散・外生変数間の共分散などの総数。よって $df = p(p+1)/2 - q$ 。これは「当てはめ先（共分散）がいくつあり、そのうちいくつをパラメータ推定に使い切ったか」という考え方で、標本サイズではなく共分散行列の大きさで決まる点が、重回帰の自由度の数え方と大きく違います。

Q5. 丁度識別（飽和モデル）が「適合度を評価できない」のはなぜですか?

丁度識別（ $df=0$ ）は、情報（共分散）の数とパラメータの数がちょうど等しい状態です。このときパラメータは情報をすべて使い切って決まるので、モデルが含意する共分散 $\Sigma(\hat\theta)$ は必ず標本共分散 $S$ に完全一致します。 $\Sigma(\theta)=S$ なら $F_{ML}=0$ 、したがって $\chi^2=0$ で「完璧な適合」になりますが、これはどんなデータでも自動的にそうなるので、「このモデルがデータと整合する」という検証にはなっていません。意味のある検証には、いくつかのパス（仮説）を置かないことで自由度を $df>0$ に残し、「省いた制約がデータと矛盾しないか」を $\chi^2$ で問う必要があります。だから適合度を評価できるのは過剰識別モデルだけです。

Q6. CFIやRMSEAなど指標がたくさんありますが、どれを見ればいいのですか?

1つの指標だけで判断しないのが標準です。実務でよく報告されるのは、 $\chi^2$ （と自由度・ $p$ 値）、CFI（0.95以上が望ましい、標本サイズに頑健）、RMSEA（0.05以下が良好、近似誤差を測る）、加えてSRMR（残差の標準化指標）やGFIです。 $\chi^2$ は標本サイズが大きいとほぼ確実に棄却されてしまう弱点があるため、CFIやRMSEAのような「不適合の程度」や「最悪モデルからの改善度」を測る指標で補います。複数の指標が概ね良好な値を示し、かつ理論的にもモデルが妥当であれば採用、というのが総合判断の作法です。指標ごとに良い方向（CFI・GFIは大きいほど、RMSEA・AICは小さいほど良い）が違う点だけは取り違えないようにします。

まとめ

パス解析：観測変数のみの連立回帰による因果モデル。矢印（パス）に付くパス係数＝標準化偏回帰係数で、パス間の大小比較ができる。ある変数の効果は**直接効果（じか）＋間接効果（媒介経路の係数の積）＝総効果（和）**に分解できる。
SEM ＝共分散構造分析：パス解析に潜在変数を加えた一般枠組み。**測定方程式 $x=\Lambda\xi+\delta$ （潜在→観測指標、＝検証的因子分析）と構造方程式 $\eta=B\eta+\Gamma\xi+\zeta$ （潜在間の回帰、＝パス解析の潜在版）**の2層を同時推定する。測定誤差を分離して構成概念どうしの関係を歪みなく評価できるのが利点。
推定の原理：モデル含意共分散 $\Sigma(\theta)$ を標本共分散 $S$ に当てはめ、最尤適合関数 $F_{ML}=\log\lvert\Sigma(\theta)\rvert+\operatorname{tr}(S\Sigma(\theta)^{-1})-\log\lvert S\rvert-p$ を最小化して $\hat\theta$ を得る（ $F_{ML}\ge0$ 、 $=0\iff\Sigma(\theta)=S$ ）。正規性が崩れるならGLS・WLSへ。
識別性と自由度： $df = p(p+1)/2 - q$ （情報の数 − 推定パラメータ数）。 $df<0$ 過小識別（推定不能）／ $df=0$ 丁度識別（飽和・適合度評価不能）／ $df>0$ 過剰識別（推定でき適合度も評価できる、目指す状態）。
適合度： $\chi^2$ 適合度検定は $H_0:\Sigma=\Sigma(\theta)$ （モデルは正しい）なので棄却されない方が良い。 $\chi^2=(N-1)F_{ML}$ は $N$ に弱いため、CFI（大きいほど良い、 $\ge0.95$ ）・RMSEA（小さいほど良い、 $\le0.05$ ）・GFI・AIC（比較用、小さいほど良い）を併用して総合判断。
引っかけ：χ²は棄却されない方が良い／丁度識別は適合度評価不能／自由度は共分散の数 $p(p+1)/2$ から数える（ $n$ でない）／パス係数は標準化偏回帰係数／間接効果は積・総効果は和／適合度指標は方向（大小どちらが良いか）が指標ごとに違う。