📊 対象級:準1級 | 重要度:B(標準)
要点(BLUF)
因子分析は「観測される複数の変数の裏に、少数の見えない共通因子がある」と仮定し、その因子が観測変数を生成すると考えるモデルです。準1級では「共通因子モデルの定式化」「共分散構造の分解」「主成分分析(PCA)との違い」「因子回転がなぜ必要か」が問われます。モデルの核はこの一行です。
要するに「観測変数の分散共分散行列 は、共通因子で説明される部分 と、各変数固有のばらつき の和に分解できる」ということです。この一本が因子分析のすべての土台になります。
1. 共通因子モデルの定式化
1.1 モデル式
観測変数が 個、その背後に共通因子が 個()あるとします。観測ベクトル を次のように表します。
各記号の中身は次の通りです(簡単のため各変数は平均0に中心化済みとします)。
- は 因子負荷行列(factor loading matrix)。 行列で、成分 は「共通因子 が観測変数 にどれだけ効くか」を表します。
- は 共通因子(common factor)。 個の観測変数すべてに共通して影響する潜在変数です。
- は 独自因子(unique factor)。各観測変数 だけが固有に持つ、共通因子では説明できないばらつき(測定誤差を含む)です。
成分で書くと1本ずつは回帰式のように見えます。
要するに「各観測変数は、共通因子の重みつき和(共通部分)+その変数だけの固有成分(独自部分)でできている」というモデルです。重回帰 重回帰分析 と式の形は似ていますが、**説明変数にあたる が観測できない(潜在変数である)**点が決定的に違います。回帰では はデータとして与えられますが、因子分析では も も推定対象です。
1.2 モデルの仮定
共分散構造を導くために、次の仮定を置きます。これが因子分析の前提のすべてです。
| 仮定 | 数式 | 意味(要するに) |
|---|---|---|
| 共通因子の平均はゼロ | 因子は中心化されている | |
| 共通因子は分散1・無相関 | 各因子は標準化され、互いに直交(直交モデル) | |
| 独自因子の平均はゼロ | 誤差は中心化されている | |
| 独自因子は互いに無相関 | (対角行列) | 変数固有のばらつきは変数間で相関しない |
| 共通因子と独自因子は無相関 | 共通部分と固有部分は独立に働く |
ここで は 対角行列です。これは「独自因子どうしは相関を持たない」という最重要の仮定を表します。要するに「観測変数どうしの相関は、すべて共通因子 を通じてのみ生まれる」と仮定しているわけです。この「対角である」という制約こそが、後述の通り因子分析とPCAを分ける本質になります。
2. 共分散構造の分解(省略しない)
2.1 導出
仮定からモデルの共分散行列 を計算します。中心化してあるので です。モデル式 を代入します。
各下中括弧で仮定を1つずつ使っています。
- (因子は分散1・無相関)
- および (共通因子と独自因子は無相関)
- (独自因子の分散、対角)
中央の2項が消えるので、
要するに「観測変数の分散共分散は、共通因子由来の と、独自因子由来の対角 の和にきれいに分かれる」ということです。中央2項が消えたのは、ひとえに「共通因子と独自因子が無相関」という仮定のおかげです。
2.2 対角成分の分解:共通性と独自性
の対角成分は各観測変数の分散です。 の 成分を見ると、変数 の分散が2つに分かれます。
- 第1項 を 共通性(communality) と呼びます。共通因子が変数 の分散をどれだけ説明するかです。
- 第2項 を 独自性(uniqueness) と呼びます。共通因子では説明できない、 固有のばらつきです。
観測変数を標準化して とした場合(相関行列を分析する場合)には、特にすっきりした関係になります。
要するに「各変数のばらつき(=1)を、共通因子で説明できる割合(共通性)と、説明できない割合(独自性)に100%分割している」ということです。共通性は回帰でいう決定係数 に相当する量で、 です。
2.3 非対角成分:相関は共通因子だけで生まれる
非対角成分 ()を見ると、 は対角なので寄与せず、
これが因子分析の思想を端的に示します。2つの観測変数の共分散(相関)は、共通因子の負荷の積の和だけで決まるのです。独自因子 は対角にしか寄与しないので、変数間の相関には一切関与しません。要するに「観測変数どうしが相関するのは、共通の見えない原因(因子)を共有しているからだ」というのが因子分析の世界観です。
graph TD F1((共通因子 f₁)) --> X1[観測 x₁] F1 --> X2[観測 x₂] F1 --> X3[観測 x₃] F2((共通因子 f₂)) --> X3 F2 --> X4[観測 x₄] F2 --> X5[観測 x₅] E1[独自 ε₁] --> X1 E2[独自 ε₂] --> X2 E3[独自 ε₃] --> X3 E4[独自 ε₄] --> X4 E5[独自 ε₅] --> X5
矢印が「因子 → 観測変数」へ向いている点に注目してください。これが因子分析の生成の方向です(PCAでは逆向きになります。第4節)。
3. 因子負荷・因子得点・共通性の意味
3つの用語を整理します。準1級ではそれぞれの「何を表す量か」が問われます。
| 用語 | 記号 | 何を表すか | 求め方 |
|---|---|---|---|
| 因子負荷 | 因子 が観測変数 に効く強さ | を満たす を推定 | |
| 共通性 | 変数 の分散のうち共通因子が説明する割合 | 因子負荷の二乗和 | |
| 因子得点 | (各個体ごと) | 各個体が因子 をどれだけ持つか | 推定した から個体の観測値を使って推定 |
因子負荷の解釈
標準化された変数の場合(相関行列を分析する場合)、因子負荷 は「観測変数 と共通因子 の相関係数」と解釈できます(直交モデルのとき)。負荷が大きい(絶対値が1に近い)ほど、その因子がその変数を強く支配しているという意味です。
因子得点の難しさ(不定性)
因子得点は、 や と違って一意に決まりません。観測変数の本数 より因子の本数 の方が少ないため、方程式 は について不定(未知数の方が多い)になります。そのため回帰推定法(トムソン法)やバートレット法などで推定するしかなく、推定法によって値が変わります。要するに「因子得点は近似的に推定する量であって、観測値から確定的に計算できる主成分得点とは性質が違う」という点が重要です。
因子負荷の推定法
と の推定には 最尤法(maximum likelihood)、最小二乗法、主因子法などがあります。最尤法は の多変量正規性を仮定して のもとで尤度を最大化する方法で、因子数の検定(適合度のカイ二乗検定)が使える利点があります。尤度に基づく推定の一般論は 最尤法・モーメント法(推定量の作り方と最尤推定量の漸近論) を参照してください。
4. 主成分分析(PCA)との違い(最重要論点)
ここが準1級で最も問われる論点です。両者は「多数の変数を少数にまとめる」点で似ていますが、変数を生成する方向が正反対です。
4.1 生成の方向が逆
graph LR
subgraph PCA["主成分分析(合成)"]
direction TB
PX1[観測 x₁] --> PC[主成分 z]
PX2[観測 x₂] --> PC
PX3[観測 x₃] --> PC
end
subgraph FA["因子分析(生成)"]
direction TB
F[共通因子 f] --> FX1[観測 x₁]
F --> FX2[観測 x₂]
F --> FX3[観測 x₃]
end
- PCA:観測変数を合成して主成分を作る。矢印は「観測 → 主成分」。主成分 は観測変数の重みつき和 で、観測値から確定的に計算できる。
- 因子分析:潜在因子が観測変数を生成する。矢印は「因子 → 観測」。観測変数 が因子 の重みつき和+独自成分で表される。
要するに「PCAは観測変数の合成(結果としての主成分)、因子分析は観測変数の原因(潜在因子)」です。「主成分は観測変数から作られる結果」「共通因子は観測変数を生む原因」と覚えると混同しません。PCAの詳細は 主成分分析(PCA) を参照してください。
4.2 何を説明するか:分散 vs 共分散
- PCAは 分散 を最大限説明することが目的です。データの分散共分散行列 をそのまま 固有値分解し、分散の大きい方向(第1主成分、第2主成分…)を順に取り出します。 をすべて(対角も非対角も区別せず)説明しにいきます。
- 因子分析は 共分散(変数間の相関) を説明することが目的です。 のうち、変数間の相関(非対角)は共通因子 が担い、各変数固有のばらつき(対角の一部 )は独自因子に押し出します。
4.3 独自因子(誤差項)の有無
これが数式上の決定的な違いです。
PCAは を誤差なしで完全に再現する分解(全成分を使えば そのもの)ですが、因子分析は独自性 を明示的にモデルに含め、共通因子では「相関する部分だけ」を説明します。要するに「因子分析は『各変数には共通因子で説明できない固有のノイズがある』と最初から認めている」のに対し、PCAはそういう区別をしません。
4.4 対比表
| 観点 | 主成分分析(PCA) | 因子分析(FA) |
|---|---|---|
| 生成の方向 | 観測 → 主成分(合成) | 因子 → 観測(生成) |
| 潜在量の位置づけ | 結果(観測の合成変数) | 原因(観測を生む潜在変数) |
| 主目的 | 分散を最大に説明 | 変数間の共分散を説明 |
| 共分散構造 | (固有値分解) | |
| 独自因子(誤差項) | なし | あり() |
| 潜在量の値 | 確定的に計算(主成分得点) | 推定するしかない(因子得点は不定) |
| 解の一意性 | 一意(固有ベクトル) | 回転の不定性あり(次節) |
5. 因子回転
5.1 なぜ回転が必要か(解の不定性)
因子負荷行列 は一意に決まりません。任意の 直交行列 ()を取って と置くと、
となり、共分散構造 はまったく同じです。つまり と はデータへの当てはまりが完全に等しく、区別できません。これを 因子の回転不定性(rotational indeterminacy) と呼びます。
要するに「データだけからは因子負荷を1つに決められない。直交行列でいくらでも回転させた解がすべて同じ当てはまりを与える」ということです。この自由度を逆手に取り、解釈しやすい負荷パターンになるように を回転させるのが因子回転です。
5.2 単純構造を目指す
回転の目標は 単純構造(simple structure) です。理想は「各観測変数が、ただ1つの因子にだけ大きな負荷を持ち、他の因子への負荷はほぼ0」という状態です。こうなると「この変数群はこの因子を測っている」と因子に意味を与えやすくなります。
5.3 直交回転と斜交回転
flowchart TD R["因子回転"] --> O["直交回転<br/>(因子間の無相関を保つ)"] R --> Q["斜交回転<br/>(因子間の相関を許す)"] O --> O1["バリマックス回転<br/>負荷の二乗の分散を最大化"] Q --> Q1["プロマックス回転<br/>バリマックス解を斜交に近似"] Q --> Q2["オブリミン回転"]
- 直交回転(orthogonal rotation):回転後も因子どうしの無相関(直交)を保ちます。代表は **バリマックス回転(varimax)**で、各因子について「因子負荷の二乗の分散」を最大化し、負荷を0付近か大きい値かの両極端に寄せて単純構造に近づけます。因子が互いに独立だと仮定したいときに使います。
- 斜交回転(oblique rotation):因子どうしに相関を許します。代表は **プロマックス回転(promax)**で、バリマックス解を出発点に斜交解へ近似します。現実の心理的概念などは互いに相関することが多いため、近年は最尤法+プロマックス回転が主流とされます(手法の主流は分野・年代で変わるため要最新確認)。
⚠️ 斜交回転では因子間に相関があるため、「因子負荷」と「因子と変数の相関(因子構造)」が一致しなくなります。直交回転ではこの2つは一致します。準1級では「直交か斜交か」で何が変わるかが論点になります。
5.4 回転は当てはまりを変えない
重要な確認です。回転は「同じ当てはまり(同じ の再現)の中で解釈しやすい表現を選ぶ」操作にすぎません。共通性 の総和(共通因子が説明する分散の総量)は直交回転で不変です。回転で変わるのは「どの因子がどの変数を担うか」という割り当てだけで、モデルの説明力そのものは変わりません。要するに「回転は中身の説明力を増やすのではなく、見やすく並べ替えるだけ」です。
6. 因子数の決定
因子数 は分析者が事前に決める必要があります(探索的因子分析の場合)。代表的な基準は次の通りです(基準値は分野・文献で異なるため要最新確認)。
| 基準 | 内容 | 注意 |
|---|---|---|
| カイザー基準(ガットマン基準) | 相関行列の固有値が 1以上 の因子を採用 | 機械的で因子を多く取りすぎる傾向 |
| スクリープロット | 固有値を大きい順に並べた折れ線で、傾きが急に緩やかになる点(エルボー)の手前まで採用 | 判断が主観的 |
| 累積寄与率 | 累積寄与率が一定(例:80%程度)に達するまで | 閾値は分野依存 |
| 適合度検定 | 最尤法で因子数ごとにカイ二乗適合度検定 | の正規性を仮定 |
xychart-beta title "スクリープロット(固有値の減衰とエルボー)" x-axis "因子の番号" [1, 2, 3, 4, 5, 6] y-axis "固有値" 0 --> 4 line [3.5, 2.2, 0.9, 0.6, 0.4, 0.3]
上のスクリープロットでは、固有値が因子3あたりで急に小さくなり、その後はゆるやかに減衰しています。この「折れ曲がり(エルボー)」の手前、すなわち因子2までを採用する、という読み方をします。要するに「大きな固有値(重要な因子)と小さな固有値(ノイズ的因子)の境目を、グラフの折れ曲がりで見つける」わけです。固有値・固有ベクトルの基礎は 分散共分散行列・相関行列 が下地になります。
なお「固有値1以上」のカイザー基準は、相関行列を使う場合「平均的な1変数分(標準化済みなので分散1)より多く説明する因子だけ残す」という意味づけです。ただし因子を取りすぎる傾向が知られており、スクリープロットや解釈可能性と併用するのが実務的です。
7. 探索的因子分析と確証的因子分析
因子分析には2つの立場があります。準1級ワークブックでも区別されます。
- 探索的因子分析(EFA, exploratory factor analysis):因子の数や「どの変数がどの因子に効くか」について事前の仮説を持たず、データから因子構造を探る。本ノートで扱ってきたのは主にこちら。
- 確証的因子分析(CFA, confirmatory factor analysis):因子の数や負荷のパターンについて事前に仮説があり、その仮説がデータに合うかを検証する。一部の因子負荷を0に固定するなど、 に構造を課す。
確証的因子分析は、観測変数間・潜在変数間の関係を図と方程式で表す枠組み(パス解析や構造方程式モデリング)へと一般化されます。これらは Phase 9 で別途扱う予定です(このノートではリンクを張らず名称のみ言及)。
8. 試験での問われ方(準1級)
準1級では因子分析は 標準的頻度(重要度B) で出題されます。準1級ワークブックでは「1因子モデル/多因子モデル/構造方程式/グラフィカルモデル」として扱われ、軸の回転にも触れられます。問われ方は次の角度です。
- 共分散構造の理解: の各項が何を表すか。導出に使う仮定(独自因子が対角・共通因子と無相関)を選ばせる。
- 共通性と独自性:標準化したとき 。共通性が因子負荷の二乗和であること。
- PCAとの違い(最頻出):生成の方向(合成 vs 生成)、独自因子の有無、分散 vs 共分散のどちらを説明するか。
- 因子回転:回転不定性 がなぜ生じるか、直交回転(バリマックス)と斜交回転(プロマックス)の違い、回転が当てはまりを変えないこと。
- 因子数の決定:固有値1以上・スクリープロットの読み方。
固有値・固有ベクトルの基礎は 分散共分散行列・相関行列、PCAは 主成分分析(PCA)、推定法の土台は 最尤法・モーメント法(推定量の作り方と最尤推定量の漸近論) が前提です。
よくある疑問(Q&A)
Q1. 結局、主成分分析と因子分析は何が違うのですか?
一言でいえば 「生成の方向」が逆です。PCAは観測変数を合成して主成分を作る(観測 → 主成分)のに対し、因子分析は潜在因子が観測変数を生み出すと考えます(因子 → 観測)。数式でも、PCAは をそのまま固有値分解する(誤差項なし)のに対し、因子分析は と独自因子 を明示的に含め、変数間の相関だけを共通因子で説明します。要するに「PCAは分散の要約、因子分析は相関を生む隠れた原因のモデル化」です。目的が違うので、結果として得られる『まとめた軸』の意味も違います。
Q2. なぜ因子を回転させてよいのですか。回転すると別のモデルになりませんか?
なりません。任意の直交行列 について なので、回転後の負荷 もまったく同じ を再現します。つまりデータへの当てはまりは回転で変わりません。当てはまりが同じ解が無数にある(回転不定性)ので、その中から**人間が解釈しやすい負荷パターン(単純構造)**を選ぶのが回転です。要するに「回転は説明力を上げる操作ではなく、同じ説明力のまま見やすく並べ替える操作」です。
Q3. 共通性と決定係数 は同じものですか?
考え方は同じです。共通性 は「観測変数 の分散のうち、共通因子で説明できる割合」で、これは回帰でいう決定係数 ( の分散のうち説明変数で説明できる割合)に対応します。標準化した変数なら で、(独自性)が「説明できなかった残り」にあたります。違いは、回帰の説明変数は観測されるのに対し、因子分析の共通因子は潜在変数である点です。
Q4. 因子得点は主成分得点のように計算できないのですか?
確定的には計算できません。観測変数 本に対し共通因子 本()で、独自因子 もあるため、 を について解くと不定(解が一意に定まらない)になります。そのため回帰推定法やバートレット法などで推定するしかなく、推定法によって値が変わります。一方PCAの主成分得点は と観測値の重みつき和で確定的に求まります。これも両手法の性質の違いの一例です。
Q5. 独自因子 はただの測定誤差ですか?
測定誤差を含みますが、それだけではありません。独自因子 は「変数 に固有で、共通因子では説明されないばらつき全体」です。測定の誤差(信頼性の低さ)に加えて、その変数だけが持つ本質的な固有変動(他の変数と共有しない部分)も含みます。重要なのは「独自因子どうしは無相関( が対角)」という仮定で、これにより観測変数間の相関はすべて共通因子経由で生じる、という因子分析の世界観が成り立ちます。
まとめ
- 因子分析は共通因子モデル 。潜在因子 が観測変数を生成すると考える。
- 仮定(、 対角、)から共分散構造 が導かれる。
- 各変数の分散は 共通性 + 独自性 に分解。標準化なら 。変数間の相関は共通因子だけで生じる。
- PCAとの違い(最重要):PCAは観測の合成(観測→主成分、分散を説明、固有値分解、誤差項なし)、因子分析は潜在因子の生成(因子→観測、共分散を説明、、独自因子あり)。生成の方向が逆。
- には回転不定性( が同じ当てはまり)があり、解釈のため単純構造を狙って回転する。直交(バリマックス)と斜交(プロマックス)。回転は当てはまりを変えない。
- 因子数は固有値1以上・スクリープロット・累積寄与率・適合度検定で決める(基準値は要最新確認)。仮説の有無で探索的/確証的に分かれる。
関連ノート
- 主成分分析(PCA) 観測変数の合成。生成の方向が因子分析と逆になる対比相手
- 分散共分散行列・相関行列 ・固有値分解・スクリープロットの基礎
- 重回帰分析 成分式が回帰に似るが説明変数が観測できる点が違う
- 最尤法・モーメント法(推定量の作り方と最尤推定量の漸近論) 因子負荷の最尤推定・適合度検定の土台