← 統計検定テキスト 一覧

📊 対象級:準1級 | 重要度:B(標準)

要点(BLUF)

因子分析は「観測される複数の変数の裏に、少数の見えない共通因子がある」と仮定し、その因子が観測変数を生成すると考えるモデルです。準1級では「共通因子モデルの定式化」「共分散構造の分解」「主成分分析(PCA)との違い」「因子回転がなぜ必要か」が問われます。モデルの核はこの一行です。

  Σ=ΛΛ+Ψ  \boxed{\;\Sigma=\Lambda\Lambda^\top+\Psi\;}

要するに「観測変数の分散共分散行列 Σ\Sigma は、共通因子で説明される部分 ΛΛ\Lambda\Lambda^\top と、各変数固有のばらつき Ψ\Psi の和に分解できる」ということです。この一本が因子分析のすべての土台になります。


1. 共通因子モデルの定式化

1.1 モデル式

観測変数が pp 個、その背後に共通因子が mm 個(m<pm<p)あるとします。観測ベクトル xRp\mathbf x\in\mathbb R^p を次のように表します。

x=Λf+ε\mathbf x=\Lambda\mathbf f+\boldsymbol\varepsilon

各記号の中身は次の通りです(簡単のため各変数は平均0に中心化済みとします)。

x=(x1xp),Λ=(λ11λ1mλp1λpm),f=(f1fm),ε=(ε1εp)\mathbf x=\begin{pmatrix}x_1\\ \vdots\\ x_p\end{pmatrix},\quad \Lambda=\begin{pmatrix}\lambda_{11} & \cdots & \lambda_{1m}\\ \vdots & & \vdots\\ \lambda_{p1} & \cdots & \lambda_{pm}\end{pmatrix},\quad \mathbf f=\begin{pmatrix}f_1\\ \vdots\\ f_m\end{pmatrix},\quad \boldsymbol\varepsilon=\begin{pmatrix}\varepsilon_1\\ \vdots\\ \varepsilon_p\end{pmatrix}

成分で書くと1本ずつは回帰式のように見えます。

xj=λj1f1+λj2f2++λjmfm+εjx_j=\lambda_{j1}f_1+\lambda_{j2}f_2+\dots+\lambda_{jm}f_m+\varepsilon_j

要するに「各観測変数は、共通因子の重みつき和(共通部分)+その変数だけの固有成分(独自部分)でできている」というモデルです。重回帰 重回帰分析 と式の形は似ていますが、**説明変数にあたる f\mathbf f が観測できない(潜在変数である)**点が決定的に違います。回帰では XX はデータとして与えられますが、因子分析では f\mathbf fΛ\Lambda も推定対象です。

1.2 モデルの仮定

共分散構造を導くために、次の仮定を置きます。これが因子分析の前提のすべてです。

仮定数式意味(要するに)
共通因子の平均はゼロE[f]=0\mathbb E[\mathbf f]=\mathbf 0因子は中心化されている
共通因子は分散1・無相関Cov(f)=Im\mathrm{Cov}(\mathbf f)=I_m各因子は標準化され、互いに直交(直交モデル)
独自因子の平均はゼロE[ε]=0\mathbb E[\boldsymbol\varepsilon]=\mathbf 0誤差は中心化されている
独自因子は互いに無相関Cov(ε)=Ψ\mathrm{Cov}(\boldsymbol\varepsilon)=\Psi(対角行列)変数固有のばらつきは変数間で相関しない
共通因子と独自因子は無相関Cov(f,ε)=O\mathrm{Cov}(\mathbf f,\boldsymbol\varepsilon)=O共通部分と固有部分は独立に働く

ここで Ψ=diag(ψ1,,ψp)\Psi=\mathrm{diag}(\psi_1,\dots,\psi_p)対角行列です。これは「独自因子どうしは相関を持たない」という最重要の仮定を表します。要するに「観測変数どうしの相関は、すべて共通因子 f\mathbf f を通じてのみ生まれる」と仮定しているわけです。この「対角である」という制約こそが、後述の通り因子分析とPCAを分ける本質になります。


2. 共分散構造の分解(省略しない)

2.1 導出

仮定からモデルの共分散行列 Σ=Cov(x)\Sigma=\mathrm{Cov}(\mathbf x) を計算します。中心化してあるので Σ=E[xx]\Sigma=\mathbb E[\mathbf x\mathbf x^\top] です。モデル式 x=Λf+ε\mathbf x=\Lambda\mathbf f+\boldsymbol\varepsilon を代入します。

Σ=E ⁣[(Λf+ε)(Λf+ε)]=E ⁣[ΛffΛ+Λfε+εfΛ+εε]=ΛE[ff]=IΛ+ΛE[fε]=O+E[εf]=OΛ+E[εε]=Ψ\begin{aligned} \Sigma &=\mathbb E\!\left[(\Lambda\mathbf f+\boldsymbol\varepsilon)(\Lambda\mathbf f+\boldsymbol\varepsilon)^\top\right]\\[2pt] &=\mathbb E\!\left[\Lambda\mathbf f\mathbf f^\top\Lambda^\top+\Lambda\mathbf f\boldsymbol\varepsilon^\top+\boldsymbol\varepsilon\mathbf f^\top\Lambda^\top+\boldsymbol\varepsilon\boldsymbol\varepsilon^\top\right]\\[2pt] &=\Lambda\,\underbrace{\mathbb E[\mathbf f\mathbf f^\top]}_{=\,I}\,\Lambda^\top +\Lambda\,\underbrace{\mathbb E[\mathbf f\boldsymbol\varepsilon^\top]}_{=\,O} +\underbrace{\mathbb E[\boldsymbol\varepsilon\mathbf f^\top]}_{=\,O}\,\Lambda^\top +\underbrace{\mathbb E[\boldsymbol\varepsilon\boldsymbol\varepsilon^\top]}_{=\,\Psi} \end{aligned}

各下中括弧で仮定を1つずつ使っています。

中央の2項が消えるので、

  Σ=ΛΛ+Ψ  \boxed{\;\Sigma=\Lambda\Lambda^\top+\Psi\;}

要するに「観測変数の分散共分散は、共通因子由来の ΛΛ\Lambda\Lambda^\top と、独自因子由来の対角 Ψ\Psi の和にきれいに分かれる」ということです。中央2項が消えたのは、ひとえに「共通因子と独自因子が無相関」という仮定のおかげです。

2.2 対角成分の分解:共通性と独自性

Σ\Sigma の対角成分は各観測変数の分散です。Σ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi(j,j)(j,j) 成分を見ると、変数 xjx_j の分散が2つに分かれます。

Var(xj)=k=1mλjk2共通性 hj2+ψj独自性\mathrm{Var}(x_j)=\underbrace{\sum_{k=1}^{m}\lambda_{jk}^2}_{\text{共通性}\ h_j^2}+\underbrace{\psi_j}_{\text{独自性}}

観測変数を標準化して Var(xj)=1\mathrm{Var}(x_j)=1 とした場合(相関行列を分析する場合)には、特にすっきりした関係になります。

hj2+ψj=1h_j^2+\psi_j=1

要するに「各変数のばらつき(=1)を、共通因子で説明できる割合(共通性)と、説明できない割合(独自性)に100%分割している」ということです。共通性は回帰でいう決定係数 R2R^2 に相当する量で、0hj210\le h_j^2\le 1 です。

2.3 非対角成分:相関は共通因子だけで生まれる

非対角成分 (j,j)(j,j')jjj\ne j')を見ると、Ψ\Psi は対角なので寄与せず、

Cov(xj,xj)=k=1mλjkλjk\mathrm{Cov}(x_j,x_{j'})=\sum_{k=1}^{m}\lambda_{jk}\lambda_{j'k}

これが因子分析の思想を端的に示します。2つの観測変数の共分散(相関)は、共通因子の負荷の積の和だけで決まるのです。独自因子 ε\boldsymbol\varepsilon は対角にしか寄与しないので、変数間の相関には一切関与しません。要するに「観測変数どうしが相関するのは、共通の見えない原因(因子)を共有しているからだ」というのが因子分析の世界観です。

graph TD
  F1((共通因子 f₁)) --> X1[観測 x₁]
  F1 --> X2[観測 x₂]
  F1 --> X3[観測 x₃]
  F2((共通因子 f₂)) --> X3
  F2 --> X4[観測 x₄]
  F2 --> X5[観測 x₅]
  E1[独自 ε₁] --> X1
  E2[独自 ε₂] --> X2
  E3[独自 ε₃] --> X3
  E4[独自 ε₄] --> X4
  E5[独自 ε₅] --> X5

矢印が「因子 → 観測変数」へ向いている点に注目してください。これが因子分析の生成の方向です(PCAでは逆向きになります。第4節)。


3. 因子負荷・因子得点・共通性の意味

3つの用語を整理します。準1級ではそれぞれの「何を表す量か」が問われます。

用語記号何を表すか求め方
因子負荷λjk\lambda_{jk}因子 fkf_k が観測変数 xjx_j に効く強さΣ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi を満たす Λ\Lambda を推定
共通性hj2=kλjk2h_j^2=\sum_k\lambda_{jk}^2変数 xjx_j の分散のうち共通因子が説明する割合因子負荷の二乗和
因子得点f^k\hat f_k(各個体ごと)各個体が因子 fkf_k をどれだけ持つか推定した Λ,Ψ\Lambda,\Psi から個体の観測値を使って推定

因子負荷の解釈

標準化された変数の場合(相関行列を分析する場合)、因子負荷 λjk\lambda_{jk} は「観測変数 xjx_j と共通因子 fkf_k の相関係数」と解釈できます(直交モデルのとき)。負荷が大きい(絶対値が1に近い)ほど、その因子がその変数を強く支配しているという意味です。

因子得点の難しさ(不定性)

因子得点は、Λ\LambdaΨ\Psi と違って一意に決まりません。観測変数の本数 pp より因子の本数 mm の方が少ないため、方程式 x=Λf+ε\mathbf x=\Lambda\mathbf f+\boldsymbol\varepsilonf\mathbf f について不定(未知数の方が多い)になります。そのため回帰推定法(トムソン法)やバートレット法などで推定するしかなく、推定法によって値が変わります。要するに「因子得点は近似的に推定する量であって、観測値から確定的に計算できる主成分得点とは性質が違う」という点が重要です。

因子負荷の推定法

Λ\LambdaΨ\Psi の推定には 最尤法(maximum likelihood)、最小二乗法、主因子法などがあります。最尤法は x\mathbf x の多変量正規性を仮定して Σ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi のもとで尤度を最大化する方法で、因子数の検定(適合度のカイ二乗検定)が使える利点があります。尤度に基づく推定の一般論は 最尤法・モーメント法(推定量の作り方と最尤推定量の漸近論) を参照してください。


4. 主成分分析(PCA)との違い(最重要論点)

ここが準1級で最も問われる論点です。両者は「多数の変数を少数にまとめる」点で似ていますが、変数を生成する方向が正反対です。

4.1 生成の方向が逆

graph LR
  subgraph PCA["主成分分析(合成)"]
    direction TB
    PX1[観測 x₁] --> PC[主成分 z]
    PX2[観測 x₂] --> PC
    PX3[観測 x₃] --> PC
  end
  subgraph FA["因子分析(生成)"]
    direction TB
    F[共通因子 f] --> FX1[観測 x₁]
    F --> FX2[観測 x₂]
    F --> FX3[観測 x₃]
  end

要するに「PCAは観測変数の合成(結果としての主成分)、因子分析は観測変数の原因(潜在因子)」です。「主成分は観測変数から作られる結果」「共通因子は観測変数を生む原因」と覚えると混同しません。PCAの詳細は 主成分分析(PCA) を参照してください。

4.2 何を説明するか:分散 vs 共分散

4.3 独自因子(誤差項)の有無

これが数式上の決定的な違いです。

PCA:Σ=WΛeigW(固有値分解。誤差項なし)\text{PCA}:\quad \Sigma=W\Lambda_{\text{eig}}W^\top\quad(\text{固有値分解。誤差項なし}) 因子分析:Σ=ΛΛ+Ψ(Ψ という独自因子=誤差項がある)\text{因子分析}:\quad \Sigma=\Lambda\Lambda^\top+\Psi\quad(\Psi\ \text{という独自因子=誤差項がある})

PCAは Σ\Sigma を誤差なしで完全に再現する分解(全成分を使えば Σ\Sigma そのもの)ですが、因子分析は独自性 Ψ\Psi を明示的にモデルに含め、共通因子では「相関する部分だけ」を説明します。要するに「因子分析は『各変数には共通因子で説明できない固有のノイズがある』と最初から認めている」のに対し、PCAはそういう区別をしません。

4.4 対比表

観点主成分分析(PCA)因子分析(FA)
生成の方向観測 → 主成分(合成)因子 → 観測(生成)
潜在量の位置づけ結果(観測の合成変数)原因(観測を生む潜在変数)
主目的分散を最大に説明変数間の共分散を説明
共分散構造Σ=WΛeigW\Sigma=W\Lambda_{\text{eig}}W^\top(固有値分解)Σ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi
独自因子(誤差項)なしあり(Ψ\Psi
潜在量の値確定的に計算(主成分得点)推定するしかない(因子得点は不定)
解の一意性一意(固有ベクトル)回転の不定性あり(次節)

5. 因子回転

5.1 なぜ回転が必要か(解の不定性)

因子負荷行列 Λ\Lambda一意に決まりません。任意の m×mm\times m 直交行列 TTTT=ITT^\top=I)を取って Λ=ΛT\Lambda^\ast=\Lambda T と置くと、

Λ(Λ)=ΛTTΛ=ΛΛ\Lambda^\ast(\Lambda^\ast)^\top=\Lambda T T^\top\Lambda^\top=\Lambda\Lambda^\top

となり、共分散構造 Σ=ΛΛ+Ψ=Λ(Λ)+Ψ\Sigma=\Lambda\Lambda^\top+\Psi=\Lambda^\ast(\Lambda^\ast)^\top+\Psiまったく同じです。つまり Λ\LambdaΛT\Lambda T はデータへの当てはまりが完全に等しく、区別できません。これを 因子の回転不定性(rotational indeterminacy) と呼びます。

要するに「データだけからは因子負荷を1つに決められない。直交行列でいくらでも回転させた解がすべて同じ当てはまりを与える」ということです。この自由度を逆手に取り、解釈しやすい負荷パターンになるように Λ\Lambda を回転させるのが因子回転です。

5.2 単純構造を目指す

回転の目標は 単純構造(simple structure) です。理想は「各観測変数が、ただ1つの因子にだけ大きな負荷を持ち、他の因子への負荷はほぼ0」という状態です。こうなると「この変数群はこの因子を測っている」と因子に意味を与えやすくなります。

5.3 直交回転と斜交回転

flowchart TD
  R["因子回転"] --> O["直交回転<br/>(因子間の無相関を保つ)"]
  R --> Q["斜交回転<br/>(因子間の相関を許す)"]
  O --> O1["バリマックス回転<br/>負荷の二乗の分散を最大化"]
  Q --> Q1["プロマックス回転<br/>バリマックス解を斜交に近似"]
  Q --> Q2["オブリミン回転"]

⚠️ 斜交回転では因子間に相関があるため、「因子負荷」と「因子と変数の相関(因子構造)」が一致しなくなります。直交回転ではこの2つは一致します。準1級では「直交か斜交か」で何が変わるかが論点になります。

5.4 回転は当てはまりを変えない

重要な確認です。回転は「同じ当てはまり(同じ Σ\Sigma の再現)の中で解釈しやすい表現を選ぶ」操作にすぎません。共通性 hj2h_j^2 の総和(共通因子が説明する分散の総量)は直交回転で不変です。回転で変わるのは「どの因子がどの変数を担うか」という割り当てだけで、モデルの説明力そのものは変わりません。要するに「回転は中身の説明力を増やすのではなく、見やすく並べ替えるだけ」です。


6. 因子数の決定

因子数 mm は分析者が事前に決める必要があります(探索的因子分析の場合)。代表的な基準は次の通りです(基準値は分野・文献で異なるため要最新確認)。

基準内容注意
カイザー基準(ガットマン基準)相関行列の固有値が 1以上 の因子を採用機械的で因子を多く取りすぎる傾向
スクリープロット固有値を大きい順に並べた折れ線で、傾きが急に緩やかになる点(エルボー)の手前まで採用判断が主観的
累積寄与率累積寄与率が一定(例:80%程度)に達するまで閾値は分野依存
適合度検定最尤法で因子数ごとにカイ二乗適合度検定x\mathbf x の正規性を仮定
xychart-beta
  title "スクリープロット(固有値の減衰とエルボー)"
  x-axis "因子の番号" [1, 2, 3, 4, 5, 6]
  y-axis "固有値" 0 --> 4
  line [3.5, 2.2, 0.9, 0.6, 0.4, 0.3]

上のスクリープロットでは、固有値が因子3あたりで急に小さくなり、その後はゆるやかに減衰しています。この「折れ曲がり(エルボー)」の手前、すなわち因子2までを採用する、という読み方をします。要するに「大きな固有値(重要な因子)と小さな固有値(ノイズ的因子)の境目を、グラフの折れ曲がりで見つける」わけです。固有値・固有ベクトルの基礎は 分散共分散行列・相関行列 が下地になります。

なお「固有値1以上」のカイザー基準は、相関行列を使う場合「平均的な1変数分(標準化済みなので分散1)より多く説明する因子だけ残す」という意味づけです。ただし因子を取りすぎる傾向が知られており、スクリープロットや解釈可能性と併用するのが実務的です。


7. 探索的因子分析と確証的因子分析

因子分析には2つの立場があります。準1級ワークブックでも区別されます。

確証的因子分析は、観測変数間・潜在変数間の関係を図と方程式で表す枠組み(パス解析や構造方程式モデリング)へと一般化されます。これらは Phase 9 で別途扱う予定です(このノートではリンクを張らず名称のみ言及)。


8. 試験での問われ方(準1級)

準1級では因子分析は 標準的頻度(重要度B) で出題されます。準1級ワークブックでは「1因子モデル/多因子モデル/構造方程式/グラフィカルモデル」として扱われ、軸の回転にも触れられます。問われ方は次の角度です。

  1. 共分散構造の理解Σ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi の各項が何を表すか。導出に使う仮定(独自因子が対角・共通因子と無相関)を選ばせる。
  2. 共通性と独自性:標準化したとき hj2+ψj=1h_j^2+\psi_j=1。共通性が因子負荷の二乗和であること。
  3. PCAとの違い(最頻出):生成の方向(合成 vs 生成)、独自因子の有無、分散 vs 共分散のどちらを説明するか。
  4. 因子回転:回転不定性 ΛT\Lambda T がなぜ生じるか、直交回転(バリマックス)と斜交回転(プロマックス)の違い、回転が当てはまりを変えないこと。
  5. 因子数の決定:固有値1以上・スクリープロットの読み方。

固有値・固有ベクトルの基礎は 分散共分散行列・相関行列、PCAは 主成分分析(PCA)、推定法の土台は 最尤法・モーメント法(推定量の作り方と最尤推定量の漸近論) が前提です。


よくある疑問(Q&A)

Q1. 結局、主成分分析と因子分析は何が違うのですか?

一言でいえば 「生成の方向」が逆です。PCAは観測変数を合成して主成分を作る(観測 → 主成分)のに対し、因子分析は潜在因子が観測変数を生み出すと考えます(因子 → 観測)。数式でも、PCAは Σ\Sigma をそのまま固有値分解する(誤差項なし)のに対し、因子分析は Σ=ΛΛ+Ψ\Sigma=\Lambda\Lambda^\top+\Psi独自因子 Ψ\Psi を明示的に含め、変数間の相関だけを共通因子で説明します。要するに「PCAは分散の要約、因子分析は相関を生む隠れた原因のモデル化」です。目的が違うので、結果として得られる『まとめた軸』の意味も違います。

Q2. なぜ因子を回転させてよいのですか。回転すると別のモデルになりませんか?

なりません。任意の直交行列 TT について (ΛT)(ΛT)=ΛΛ(\Lambda T)(\Lambda T)^\top=\Lambda\Lambda^\top なので、回転後の負荷 ΛT\Lambda T もまったく同じ Σ\Sigma を再現します。つまりデータへの当てはまりは回転で変わりません。当てはまりが同じ解が無数にある(回転不定性)ので、その中から**人間が解釈しやすい負荷パターン(単純構造)**を選ぶのが回転です。要するに「回転は説明力を上げる操作ではなく、同じ説明力のまま見やすく並べ替える操作」です。

Q3. 共通性と決定係数 R2R^2 は同じものですか?

考え方は同じです。共通性 hj2h_j^2 は「観測変数 xjx_j の分散のうち、共通因子で説明できる割合」で、これは回帰でいう決定係数 R2R^2yy の分散のうち説明変数で説明できる割合)に対応します。標準化した変数なら hj2+ψj=1h_j^2+\psi_j=1 で、ψj\psi_j(独自性)が「説明できなかった残り」にあたります。違いは、回帰の説明変数は観測されるのに対し、因子分析の共通因子は潜在変数である点です。

Q4. 因子得点は主成分得点のように計算できないのですか?

確定的には計算できません。観測変数 pp 本に対し共通因子 mm 本(m<pm<p)で、独自因子 ε\boldsymbol\varepsilon もあるため、x=Λf+ε\mathbf x=\Lambda\mathbf f+\boldsymbol\varepsilonf\mathbf f について解くと不定(解が一意に定まらない)になります。そのため回帰推定法やバートレット法などで推定するしかなく、推定法によって値が変わります。一方PCAの主成分得点は z=wxz=\mathbf w^\top\mathbf x と観測値の重みつき和で確定的に求まります。これも両手法の性質の違いの一例です。

Q5. 独自因子 ε\boldsymbol\varepsilon はただの測定誤差ですか?

測定誤差を含みますが、それだけではありません。独自因子 εj\varepsilon_j は「変数 xjx_j に固有で、共通因子では説明されないばらつき全体」です。測定の誤差(信頼性の低さ)に加えて、その変数だけが持つ本質的な固有変動(他の変数と共有しない部分)も含みます。重要なのは「独自因子どうしは無相関(Ψ\Psi が対角)」という仮定で、これにより観測変数間の相関はすべて共通因子経由で生じる、という因子分析の世界観が成り立ちます。


まとめ


関連ノート