直交表｜統計検定テキスト

📊 対象級：準1級・ 1級　|　重要度：B（標準）

要点（BLUF）

直交表（orthogonal array）は、全組合せ（完全実施）を試さずに、少ない実験回数で多数の要因の主効果を評価するための一部実施要因計画の道具です。たとえば $L_8(2^7)$ は「8回の実験」で「2水準の要因を最大7個」割り付けられます。完全実施なら $2^7=128$ 回かかるところを8回で済ませる、という劇的な節約です。

この節約を可能にするのが直交性です。

\boxed{\;\text{直交性：任意の2列について、水準の全組合せが同数回ずつ現れる}\;}

要するに「どの要因の効き目を測るときも、他の要因はちょうど半々（あるいは均等）に混ざって打ち消し合うので、各要因の主効果を他と切り離して独立に推定できる」――これが直交表の心臓部です。ただしタダではなく、実験を間引いた代償として**高次の交互作用が主効果と区別できなくなる（交絡・エイリアス）**という制約が付きます。この節約と交絡のトレードオフを理解することが、本トピックの核心です。

準1級：直交表の読み方・要因の割付・主効果の推定（列ごとの平方和を計算し分散分析表を作る）。
1級：一部実施計画の理論、交絡（エイリアス）構造と分解能（resolution）まで。

1. 完全実施 vs 一部実施 ―― なぜ間引くのか

要因が増えると、完全実施（全組合せ）の実験回数は指数的に爆発します。2水準の要因が $k$ 個あれば $2^k$ 通りです。

2水準の要因数 $k$	完全実施の回数 $2^k$	代表的な直交表	直交表での回数
3	8	$L_8$ （3要因＋交互作用も見られる）	8
4	16	$L_8$ （主効果のみ）	8
7	128	$L_8$ （主効果のみ）	8
15	32768	$L_{16}$ （主効果のみ）	16

要するに「要因が7個でも、それぞれの主効果（単独で効くか）だけを知りたいなら、128回も実験しなくても8回で足りる」という発想です。完全実施では交互作用や高次の組合せ効果まで全部測れますが、現実には主効果さえ分かれば十分な場面が多く、高次交互作用はほぼ無視できるほど小さいことが経験的に知られています。そこを思い切って間引くのが一部実施要因計画であり、その間引き方を体系化したのが直交表です。

2. 直交表の記法 $L_N(s^k)$ の読み方

直交表は $L_N(s^k)$ という記法で表します。記号の意味は次の通りです。

記号	意味	$L_8(2^7)$ の場合
$L$	ラテン方格（Latin square）に由来する直交表の記号	$L$
$N$	行数＝実験回数	8 回
$s$	各列の水準数	2 水準
$k$	列数＝割り付けられる要因の最大数（交互作用を見ない場合）	最大 7 列

代表的な直交表は次の2つです。

$L_8(2^7)$ ：8回の実験で、2水準の要因を最大7個。2水準系の基本。
$L_9(3^4)$ ：9回の実験で、3水準の要因を最大4個。3水準系の基本。

⚠️ $L_8$ の「7列」は「7要因まで主効果を割り付けられる」という上限であって、「常に7要因使う」という意味ではありません。交互作用も見たい場合は、後述するように一部の列を交互作用に取っておく必要があり、割り付けられる主効果の数はその分減ります。

下の図は $L_8$ の構造です。行が「1回ごとの実験」、列が「要因（または交互作用）」を表します。

graph TD
    subgraph "L8 直交表の構造"
    direction LR
    R["行 = 実験回（全8回）<br/>各行が1つの実験条件"]
    C["列 = 要因または交互作用<br/>最大7列を割付可能"]
    CELL["セル = その実験での水準<br/>2水準系なら 1 か 2"]
    R --- CELL
    C --- CELL
    end

実際の $L_8$ は次のような表です（1, 2 は水準。たとえば 1＝低水準、2＝高水準）。

実験番号	列1	列2	列3	列4	列5	列6	列7
1	1	1	1	1	1	1	1
2	1	1	1	2	2	2	2
3	1	2	2	1	1	2	2
4	1	2	2	2	2	1	1
5	2	1	2	1	2	1	2
6	2	1	2	2	1	2	1
7	2	2	1	1	2	2	1
8	2	2	1	2	1	1	2

各列を縦に見ると、どの列も水準1が4回・水準2が4回ずつ現れます（水準が均等）。これが直交性の出発点です。

3. 直交性の定式化 ―― なぜ効果が独立に測れるのか

直交性とは、任意の2列について、水準の全組合せが同数回ずつ現れることです。 $L_8$ の列1と列2を例に、組合せ $(1,1),(1,2),(2,1),(2,2)$ がそれぞれ何回出るか数えてみます。

(列1, 列2) の組合せ	出現回数
(1, 1)	2
(1, 2)	2
(2, 1)	2
(2, 2)	2

どの組合せもちょうど2回ずつです。要するに「列1の水準を1に固定して列2を見ても、2に固定して見ても、列2は1と2がきっちり半々」になっています。これがどの2列の組でも成り立つのが直交性です。

内積による定式化

2水準を $-1, +1$ （あるいは $\pm\frac12$ ）で符号化すると、直交性は列ベクトルの内積がゼロとして表せます。第 $p$ 列のベクトルを $\mathbf{c}_p=(c_{1p},\dots,c_{Np})^\top$ （各成分は $\pm1$ ）とすると、

\boxed{\;\mathbf{c}_p^\top \mathbf{c}_q=\sum_{i=1}^{N} c_{ip}\,c_{iq}=0\quad(p\neq q)\;}

要するに「2つの列が直交ベクトルになっている」――線形代数の直交そのものです。 $L_8$ の列1を $(-,-,-,-,+,+,+,+)$ 、列2を $(-,-,+,+,-,-,+,+)$ と書くと、対応する成分の積を足すと $(+1)+(+1)+(-1)+(-1)+(-1)+(-1)+(+1)+(+1)=0$ となり、確かに直交します。

なぜ内積ゼロだと効果が独立に推定できるのか

ここが理論の要です。要因 $A$ の主効果は「列 $A$ が高水準のときの応答の和 − 低水準のときの応答の和」、すなわち応答ベクトル $\mathbf{y}$ と列ベクトル $\mathbf{c}_A$ の内積 $\mathbf{c}_A^\top \mathbf{y}$ に比例します。いま応答が複数の要因効果の重ね合わせ $\mathbf{y}=\beta_A \mathbf{c}_A+\beta_B \mathbf{c}_B+\cdots+\boldsymbol\varepsilon$ で表せると仮定すると、

\mathbf{c}_A^\top \mathbf{y}=\beta_A\underbrace{\mathbf{c}_A^\top\mathbf{c}_A}_{=N}+\beta_B\underbrace{\mathbf{c}_A^\top\mathbf{c}_B}_{=0}+\cdots+\mathbf{c}_A^\top\boldsymbol\varepsilon

直交性 $\mathbf{c}_A^\top\mathbf{c}_B=0$ により、他の要因 $B,C,\dots$ の項がすべて消えます。残るのは要因 $A$ 自身の項だけなので、 $A$ の効果が他要因に汚されずに取り出せます。

\hat\beta_A=\frac{\mathbf{c}_A^\top \mathbf{y}}{N}

要するに「列が直交しているおかげで、ある要因の効果を計算するとき他の要因はきれいに相殺され、その要因単独の効き目だけが残る」。これが「少ない実験でも主効果を独立に推定できる」ことの数学的な正体です。回帰の言葉でいえば、計画行列 $X$ の列が直交しているので、 $X^\top X$ が対角行列になり、各回帰係数 $\hat\beta_p=\mathbf{c}_p^\top\mathbf y / N$ が他の係数と無関係に求まる、ということです（重回帰分析の正規方程式の特殊で理想的なケース）。

4. 要因の割付と線点図

直交表を使うには、どの列にどの要因を割り当てるか（割付）を決めます。主効果は好きな列に置けますが、交互作用は自動的に特定の列に現れるため、割付には注意が必要です。

交互作用は別の列に現れる

要因 $A$ を列1、要因 $B$ を列2に割り付けると、 $L_8$ では $A$ と $B$ の交互作用 $A\times B$ は列3に自動的に現れます。この対応関係をまとめたのが交互作用表です。

ここで決定的に重要なのは次の点です。

⚠️ 交互作用が現れる列（この例では列3）に、別の主効果 $C$ をうっかり割り付けると、 $C$ の主効果と $A\times B$ の交互作用が同じ列で混ざってしまい区別できなくなる（交絡する）。

要するに「交互作用が出る列は予約席。そこに他の主効果を座らせると相席になって誰の効果か分からなくなる」ということです。

線点図（線形図）

どの列にどの要因・交互作用を割り付ければ衝突しないかを、視覚的に示したのが**線点図（linear graph、線形図とも）**です。

点（〇）：主効果を割り付ける列
点を結ぶ線：その2点（2要因）の交互作用が現れる列

graph LR
    P1((列1<br/>要因A)) ---|"列3<br/>= A×B"| P2((列2<br/>要因B))
    P1 ---|"列5<br/>= A×C"| P4((列4<br/>要因C))
    P2 ---|"列6<br/>= B×C"| P4

この図の読み方は「列1に $A$ 、列2に $B$ を割り付けるなら、両者を結ぶ線（列3）は $A\times B$ で埋まるから、列3には他の主効果を置かない」です。交互作用を見たい要因の組は線で結ばれた配置にし、交互作用を見なくてよい要因は空いている列に自由に割り付けます。線点図は直交表ごとに用意されており、見たい交互作用の構造に合う線点図を選んで割付するのが実務の流れです。

flowchart TD
    START["評価したい要因と<br/>見たい交互作用を列挙"] --> SIZE["必要な列数から<br/>直交表の大きさを選ぶ<br/>（L8 / L16 / L9 …）"]
    SIZE --> GRAPH["その直交表の線点図を見る"]
    GRAPH --> ASSIGN["主効果を点（〇）の列へ割付"]
    ASSIGN --> INTER["見たい交互作用を<br/>線（結合）の列へ割付"]
    INTER --> CHECK{"空き列に主効果を<br/>追加できるか?"}
    CHECK -->|"はい・交互作用列でない"| ADD["残りの要因を空き列へ"]
    CHECK -->|"いいえ・交互作用列"| AVOID["その列は使わない<br/>（交絡を避ける）"]
    ADD --> RUN["実験実施 → 分散分析"]
    AVOID --> RUN

5. 平方和と自由度 ―― 分散分析表への接続

実験が終わったら、列ごとに平方和を計算し、分散分析表にまとめます。直交性のおかげで、総平方和が列（要因）ごとにきれいに分解されます。分散分析そのものの枠組みは分散分析の通りで、直交表はそれを一部実施計画に乗せたものです。

列ごとの平方和

2水準系で、第 $p$ 列について「水準2の応答の合計 $T_{p2}$ 」と「水準1の応答の合計 $T_{p1}$ 」を作ります。各水準は $N/2$ 回ずつ現れるので、その列の平方和は次式です。

S_p=\frac{(T_{p2}-T_{p1})^2}{N}

要するに「その列で高水準にしたときと低水準にしたときの応答合計の差」を2乗して実験回数で割ったもので、その要因が応答をどれだけ動かしたかを表します。差が大きい列ほど、その要因の効果（または割り付けた交互作用の効果）が大きいということです。

直交性による平方和の完全分解

直交表では、総平方和が各列の平方和の単純な和に分解されます。

\boxed{\;S_T=\sum_{p}S_p+S_E\;}

これは分散分析でクロス項が消えて $S_T=S_A+S_E$ になったのと同じ原理です。列が互いに直交している（内積ゼロ）ため、列どうしのクロス項がすべて消え、各列の寄与が重ならずに足し算で分離されます。要するに「直交しているから平方和が要因ごとに重複なくきれいに割り振れる」わけです。割り付けなかった（要因も交互作用も置かなかった）列の平方和は、まとめて誤差 $S_E$ に算入します。

自由度

2水準系では、各列（各主効果・各交互作用）の自由度は $1$ （水準数 $-1=2-1$ ）です。3水準系（ $L_9$ など）では各列の自由度は $2$ （ $3-1$ ）になります。誤差自由度は「総自由度 $N-1$ から、割り付けた要因・交互作用の自由度を引いた残り」です。

要因	平方和	自由度（2水準系）
列に割付けた要因 $A$	$S_A=\dfrac{(T_{A2}-T_{A1})^2}{N}$	1
列に割付けた要因 $B$	$S_B$	1
交互作用 $A\times B$ （割付けた列）	$S_{A\times B}$	1
誤差 $E$ （空き列をまとめたもの）	$S_E=S_T-\sum_p S_p$	$N-1-\sum(\text{割付自由度})$
全体 $T$	$S_T$	$N-1$

ここでも検算は同じで、平方和も自由度も縦に足すと全体に一致します。各要因は自分の平均平方を誤差平均平方 $V_E$ で割ったFで検定します（右片側）。

6. 一部実施計画と交絡（エイリアス）【1級】

実験を間引いた以上、タダでは済みません。完全実施で測れていた効果のいくつかが、互いに区別できなくなります。これが**交絡（confounding）／エイリアス（aliasing）**です。

交絡とは何か

交絡とは、2つ以上の効果が同じ列（同じ対比）に現れ、観測値からは分離できない状態です。 $L_8$ で7列すべてに主効果を割り付けると、各列の主効果は実は「主効果＋ある交互作用」の和になっています。たとえば、

\hat\beta_{\text{列3}}=\beta_C+\beta_{A\times B}+\cdots

のように、列3で推定した量は「要因 $C$ の主効果」と「 $A\times B$ の交互作用」を足したものです。両者を切り離す情報は8回の実験には含まれていません。要するに「実験を間引いた分、見分けがつかなくなる効果のペアが必ず生じる」ということです。

なぜ交絡が避けられないのか（定義関係）

一部実施計画は、完全実施の全組合せから一部だけを選ぶ計画です。 $2^{7-4}$ 計画（ $L_8$ に7要因を割り付けるケース）なら、完全実施 $2^7=128$ 通りのうち $1/16$ の8通りだけを選びます。この「選び方のルール」を**生成元（generator）で決め、その結果として効果のエイリアス構造が定義関係（defining relation）**として一意に定まります。たとえば生成元 $E=ABC$ という選び方をすると、 $E$ と $ABC$ は同じ列に乗り、 $E$ の主効果と $ABC$ の3因子交互作用が交絡します。要するに「どの組合せを選ぶかを決めた瞬間、どの効果とどの効果が混ざるかも自動的に決まる」のです。

分解能（resolution）

交絡の質を表す指標が**分解能（resolution）**で、ローマ数字で表します。「主効果がどこまでクリーンか」を示します。

分解能	主効果は…	2因子交互作用は…
III	互いに交絡しない。ただし2因子交互作用と交絡	主効果と交絡
IV	互いに交絡せず、2因子交互作用とも交絡しない。3因子交互作用と交絡	別の2因子交互作用と交絡
V	2因子交互作用とも交絡しない（高分解能）	3因子交互作用と交絡

要するに「分解能が高いほど、低次の効果（主効果や2因子交互作用）どうしのエイリアスが少なく、解釈しやすい」。 $L_8$ に7要因を詰め込むと分解能IIIで、主効果が2因子交互作用と交絡します。

交絡を逆手に取る ―― 設計の知恵

交絡は厄介ですが、割付の自由度を使って「重要な効果」を「無視できる効果」と交絡させることで実害を避けられます。

一部実施計画の腕の見せどころは、「効きそうな主効果」を「ほぼゼロとみなせる高次交互作用」とわざと交絡させること。

3因子以上の交互作用は実際にはほとんどゼロで、しかも仮にあっても技術的に解釈しづらいため、主効果をそこへぶつけてしまえば、観測された効果は実質「主効果そのもの」と読めます。要するに「区別がつかなくなるなら、片方が確実に無視できるペアを選んで混ぜる」という戦略です。本当に主効果と交絡したのが大きな交互作用でないかは、確認実験（直交表とは別にその組合せを実際に試す）で検証します。

⚠️ 引っかけポイント・頻出論点

(1) 直交表は交互作用を「限定的にしか」見られない。 直交表は主効果の評価が主目的です。交互作用も見られますが、見たい交互作用の数だけ列を消費し、その分割り付けられる主効果が減ります。 $L_8$ に7要因を詰め込めば交互作用は1つも独立に見られず、すべて主効果と交絡します。「直交表ならどんな交互作用も自動で全部分かる」と思うのは誤りです。

(2) 実験回数削減と交絡はトレードオフ。 完全実施を間引くほど実験は楽になりますが、その代償として交絡が増え、分解能が下がります。「回数を減らしたのに何でも分かる」うまい話はありません。何を犠牲にして（どの高次交互作用を無視して）回数を減らしたのかを常に意識します。

(3) 交互作用が現れる列に主効果を割り付けてはいけない。 $A$ を列1、 $B$ を列2に置いたら、 $A\times B$ は列3に出ます。ここに $C$ を割り付けると $C$ と $A\times B$ が交絡します。線点図・交互作用表を見て、交互作用列を空けておくのが割付の鉄則です。

(4) 水準数と直交表の対応を間違えない。 2水準の要因には2水準系（ $L_8, L_{16}$ ）、3水準の要因には3水準系（ $L_9, L_{27}$ ）を使います。 $L_8$ に3水準の要因はそのまま割り付けられません（多水準作成法などの工夫が要る）。記法 $L_N(s^k)$ の $s$ が水準数であることを押さえます。

(5) 列数は「主効果の上限」であって「交互作用込みの容量」ではない。 $L_8$ の「7列」は、交互作用を一切見ない場合に主効果を置ける最大数です。交互作用を見るなら、その分は主効果に使えません。自由度で言えば、 $L_8$ の総自由度は $8-1=7$ で、これを主効果と交互作用と誤差で分け合います。

よくある疑問（Q&A）

Q1. 直交表を使うと、なぜ実験を間引いても各要因の効果が分かるのですか？

各列（要因）が互いに直交している（列ベクトルの内積がゼロ）からです。ある要因の効果を計算するとき、他の要因は高水準と低水準がちょうど均等に混ざって相殺されるため、その要因単独の効き目だけが残ります。要するに「他の要因がきれいに打ち消し合うように水準を配置してある」から、間引いても主効果が独立に読める、ということです。これは回帰でいえば計画行列の列が直交していて、各係数が他と無関係に求まる理想状態です。

Q2. 直交表があれば、もう完全実施（全組合せ）は要らないのですか？

いいえ。直交表（一部実施）は主効果が主目的で、交互作用は限定的にしか見られません。すべての交互作用まで詳しく知りたい、あるいは高次交互作用が無視できない場合は、完全実施が必要です。一部実施は「主効果さえ分かればよく、高次交互作用は無視できる」という前提が成り立つ場面で威力を発揮します。前提が崩れる場面では交絡が実害になります。

Q3. 交絡（エイリアス）とは結局どういう状態ですか？

2つ以上の効果が同じ列に現れて区別できない状態です。たとえば $L_8$ のある列で推定した量が「要因 $C$ の主効果」と「 $A\times B$ の交互作用」の和になっていて、8回の実験データだけでは両者を分離できません。完全実施を間引いた代償として必ず生じます。対策は、無視できる高次交互作用とわざと交絡させること、そして必要なら確認実験で検証することです。

Q4. 3因子以上の交互作用は無視してよいのですか？

実務上はほとんどの場合に無視します。理由は2つで、(1) 経験的に高次交互作用は主効果や2因子交互作用に比べて非常に小さいこと、(2) 仮に存在しても「要因A・B・Cが三つ揃ったときだけ特有に効く」という現象は技術的に解釈しづらく対策に結びつきにくいことです。だからこそ、主効果をあえて3因子交互作用と交絡させる割付が合理的になります。ただし「無視できる」という前提が妥当かは個別判断が要ります。

Q5. 線点図は何のためにあるのですか？

どの列に何を割り付ければ交絡を避けられるかを一目で示す地図です。点（〇）が主効果を置ける列、点を結ぶ線がその2要因の交互作用が現れる列を表します。見たい交互作用は線の列に割り付け、その列には他の主効果を置かない――この割付ルールを視覚化したのが線点図です。直交表ごとに複数の線点図が用意されており、評価したい交互作用の構造に合うものを選びます。

Q6. $L_8$ で7要因を割り付けたのに、なぜ「交互作用が見られない」のですか？

$L_8$ の独立な自由度は $8-1=7$ しかなく、これを7つの主効果が使い切ってしまうからです。交互作用を独立に推定するには別の列（別の自由度）が要りますが、もう空きがありません。結果として、各列の主効果は対応する交互作用と交絡した状態になります（分解能III）。交互作用を見たければ、割り付ける主効果の数を減らして列を空ける必要があります。

まとめ

直交表（ $L_N(s^k)$ ）は、完全実施 $s^k$ 回を間引いて、少ない実験回数 $N$ で多要因の主効果を独立に評価する一部実施要因計画。 $L_8(2^7)$ ＝8回で2水準7要因、 $L_9(3^4)$ ＝9回で3水準4要因。
直交性＝任意の2列で水準の全組合せが同数回出る。内積 $\mathbf{c}_p^\top\mathbf{c}_q=0$ で定式化され、これにより各要因の効果計算で他要因が相殺し、主効果が独立に推定できる（ $\hat\beta_p=\mathbf{c}_p^\top\mathbf{y}/N$ ）。
割付：主効果は列に置くが、交互作用は別の列に自動的に現れる。交互作用列に主効果を置くと交絡する。これを避ける地図が線点図（点＝主効果列、線＝交互作用列）。
平方和：列ごとに $S_p=(T_{p2}-T_{p1})^2/N$ 。直交性により $S_T=\sum_p S_p+S_E$ と要因ごとに完全分解。空き列は誤差にまとめる。2水準系の各列自由度は1。
交絡（エイリアス）【1級】：間引いた代償として、ある効果が他の効果（多くは高次交互作用）と同じ列に乗り区別できなくなる。生成元と定義関係で構造が決まり、**分解能（III/IV/V）**でクリーンさを表す。重要な主効果を無視できる高次交互作用とわざと交絡させるのが設計の知恵。
引っかけ：交互作用は限定的にしか見られない／回数削減と交絡はトレードオフ／水準数と直交表の対応／列数は主効果の上限。

試験での問われ方（級ごとの差）

直交表は準1級・1級ともに実験計画法の出題範囲（要最新確認）。同じ直交表でも、準1級は「読んで主効果を出す」運用、1級は「間引きの理論（交絡・分解能）」まで踏み込む点が違います。

準1級：直交表の読み方・要因の割付・主効果の推定が中心です。

与えられた $L_8$ や $L_9$ の表で、各列に割り付けられた要因の主効果を計算する（水準ごとの応答合計の差から $S_p$ を求める）。
列ごとの平方和を分散分析表にまとめ、自由度・平均平方・F値を埋めてF検定する（分散分析の手続きを直交表に乗せる）。
線点図・交互作用表を読んで、どの列に交互作用が出るかを判断し、主効果と交互作用を正しく割り付ける。
二元配置分散分析（分散分析）が実験計画の主軸で、直交表はその効率化として記述問題で問われることがある。

1級：一部実施計画の理論、交絡（エイリアス）構造まで踏み込みます。

$2^{k-p}$ 型の一部実施計画について、生成元・定義関係から交絡（エイリアス）構造を導く。「この主効果はどの交互作用と交絡するか」を答える。
**分解能（resolution III/IV/V）**の意味を理解し、与えられた計画の分解能を判定する／必要な分解能を満たす計画を選ぶ。
実験回数削減と交絡のトレードオフを定量的に論じ、どの高次交互作用を無視すれば主効果がクリーンに推定できるかを設計の観点から説明する（論述）。
直交性を計画行列 $X$ の直交（ $X^\top X$ が対角）として線形モデルの枠組み（重回帰分析）で捉え、推定量の分散構造まで議論する。

要するに「準1級は与えられた直交表を運用して主効果を取り出す、1級はなぜその間引きでそう交絡するのかという計画の理論を扱う」という深さの差です。

実験番号	列1	列2	列3	列4	列5	列6	列7
1	1	1	1	1	1	1	1
2	1	1	1	2	2	2	2
3	1	2	2	1	1	2	2
4	1	2	2	2	2	1	1
5	2	1	2	1	2	1	2
6	2	1	2	2	1	2	1
7	2	2	1	1	2	2	1
8	2	2	1	2	1	1	2

実験番号	列1	列2	列3	列4	列5	列6	列7
1	1	1	1	1	1	1	1
2	1	1	1	2	2	2	2
3	1	2	2	1	1	2	2
4	1	2	2	2	2	1	1
5	2	1	2	1	2	1	2
6	2	1	2	2	1	2	1
7	2	2	1	1	2	2	1
8	2	2	1	2	1	1	2