← 統計検定テキスト 一覧

📊 対象級:準1級 ・ 1級 | 重要度:B(標準)

要点(BLUF)

直交表(orthogonal array)は、全組合せ(完全実施)を試さずに、少ない実験回数で多数の要因の主効果を評価するための一部実施要因計画の道具です。たとえば L8(27)L_8(2^7) は「8回の実験」で「2水準の要因を最大7個」割り付けられます。完全実施なら 27=1282^7=128 回かかるところを8回で済ませる、という劇的な節約です。

この節約を可能にするのが直交性です。

  直交性:任意の2列について、水準の全組合せが同数回ずつ現れる  \boxed{\;\text{直交性:任意の2列について、水準の全組合せが同数回ずつ現れる}\;}

要するに「どの要因の効き目を測るときも、他の要因はちょうど半々(あるいは均等)に混ざって打ち消し合うので、各要因の主効果を他と切り離して独立に推定できる」――これが直交表の心臓部です。ただしタダではなく、実験を間引いた代償として**高次の交互作用が主効果と区別できなくなる(交絡・エイリアス)**という制約が付きます。この節約と交絡のトレードオフを理解することが、本トピックの核心です。


1. 完全実施 vs 一部実施 ―― なぜ間引くのか

要因が増えると、完全実施(全組合せ)の実験回数は指数的に爆発します。2水準の要因が kk 個あれば 2k2^k 通りです。

2水準の要因数 kk完全実施の回数 2k2^k代表的な直交表直交表での回数
38L8L_8(3要因+交互作用も見られる)8
416L8L_8(主効果のみ)8
7128L8L_8(主効果のみ)8
1532768L16L_{16}(主効果のみ)16

要するに「要因が7個でも、それぞれの主効果(単独で効くか)だけを知りたいなら、128回も実験しなくても8回で足りる」という発想です。完全実施では交互作用や高次の組合せ効果まで全部測れますが、現実には主効果さえ分かれば十分な場面が多く、高次交互作用はほぼ無視できるほど小さいことが経験的に知られています。そこを思い切って間引くのが一部実施要因計画であり、その間引き方を体系化したのが直交表です。


2. 直交表の記法 LN(sk)L_N(s^k) の読み方

直交表は LN(sk)L_N(s^k) という記法で表します。記号の意味は次の通りです。

記号意味L8(27)L_8(2^7) の場合
LLラテン方格(Latin square)に由来する直交表の記号LL
NN行数=実験回数8 回
ss各列の水準数2 水準
kk列数=割り付けられる要因の最大数(交互作用を見ない場合)最大 7 列

代表的な直交表は次の2つです。

⚠️ L8L_8 の「7列」は「7要因まで主効果を割り付けられる」という上限であって、「常に7要因使う」という意味ではありません。交互作用も見たい場合は、後述するように一部の列を交互作用に取っておく必要があり、割り付けられる主効果の数はその分減ります。

下の図は L8L_8 の構造です。行が「1回ごとの実験」、列が「要因(または交互作用)」を表します。

graph TD
    subgraph "L8 直交表の構造"
    direction LR
    R["行 = 実験回(全8回)<br/>各行が1つの実験条件"]
    C["列 = 要因または交互作用<br/>最大7列を割付可能"]
    CELL["セル = その実験での水準<br/>2水準系なら 1 か 2"]
    R --- CELL
    C --- CELL
    end

実際の L8L_8 は次のような表です(1, 2 は水準。たとえば 1=低水準、2=高水準)。

実験番号列1列2列3列4列5列6列7
11111111
21112222
31221122
41222211
52121212
62122121
72211221
82212112

各列を縦に見ると、どの列も水準1が4回・水準2が4回ずつ現れます(水準が均等)。これが直交性の出発点です。


3. 直交性の定式化 ―― なぜ効果が独立に測れるのか

直交性とは、任意の2列について、水準の全組合せが同数回ずつ現れることです。L8L_8 の列1と列2を例に、組合せ (1,1),(1,2),(2,1),(2,2)(1,1),(1,2),(2,1),(2,2) がそれぞれ何回出るか数えてみます。

(列1, 列2) の組合せ出現回数
(1, 1)2
(1, 2)2
(2, 1)2
(2, 2)2

どの組合せもちょうど2回ずつです。要するに「列1の水準を1に固定して列2を見ても、2に固定して見ても、列2は1と2がきっちり半々」になっています。これがどの2列の組でも成り立つのが直交性です。

内積による定式化

2水準を 1,+1-1, +1(あるいは ±12\pm\frac12)で符号化すると、直交性は列ベクトルの内積がゼロとして表せます。第 pp 列のベクトルを cp=(c1p,,cNp)\mathbf{c}_p=(c_{1p},\dots,c_{Np})^\top(各成分は ±1\pm1)とすると、

  cpcq=i=1Ncipciq=0(pq)  \boxed{\;\mathbf{c}_p^\top \mathbf{c}_q=\sum_{i=1}^{N} c_{ip}\,c_{iq}=0\quad(p\neq q)\;}

要するに「2つの列が直交ベクトルになっている」――線形代数の直交そのものです。L8L_8 の列1を (,,,,+,+,+,+)(-,-,-,-,+,+,+,+)、列2を (,,+,+,,,+,+)(-,-,+,+,-,-,+,+) と書くと、対応する成分の積を足すと (+1)+(+1)+(1)+(1)+(1)+(1)+(+1)+(+1)=0(+1)+(+1)+(-1)+(-1)+(-1)+(-1)+(+1)+(+1)=0 となり、確かに直交します。

なぜ内積ゼロだと効果が独立に推定できるのか

ここが理論の要です。要因 AA の主効果は「列 AA が高水準のときの応答の和 − 低水準のときの応答の和」、すなわち応答ベクトル y\mathbf{y} と列ベクトル cA\mathbf{c}_A の内積 cAy\mathbf{c}_A^\top \mathbf{y} に比例します。いま応答が複数の要因効果の重ね合わせ y=βAcA+βBcB++ε\mathbf{y}=\beta_A \mathbf{c}_A+\beta_B \mathbf{c}_B+\cdots+\boldsymbol\varepsilon で表せると仮定すると、

cAy=βAcAcA=N+βBcAcB=0++cAε\mathbf{c}_A^\top \mathbf{y}=\beta_A\underbrace{\mathbf{c}_A^\top\mathbf{c}_A}_{=N}+\beta_B\underbrace{\mathbf{c}_A^\top\mathbf{c}_B}_{=0}+\cdots+\mathbf{c}_A^\top\boldsymbol\varepsilon

直交性 cAcB=0\mathbf{c}_A^\top\mathbf{c}_B=0 により、他の要因 B,C,B,C,\dots の項がすべて消えます。残るのは要因 AA 自身の項だけなので、AA の効果が他要因に汚されずに取り出せます。

β^A=cAyN\hat\beta_A=\frac{\mathbf{c}_A^\top \mathbf{y}}{N}

要するに「列が直交しているおかげで、ある要因の効果を計算するとき他の要因はきれいに相殺され、その要因単独の効き目だけが残る」。これが「少ない実験でも主効果を独立に推定できる」ことの数学的な正体です。回帰の言葉でいえば、計画行列 XX の列が直交しているので、XXX^\top X が対角行列になり、各回帰係数 β^p=cpy/N\hat\beta_p=\mathbf{c}_p^\top\mathbf y / N が他の係数と無関係に求まる、ということです(重回帰分析 の正規方程式の特殊で理想的なケース)。


4. 要因の割付と線点図

直交表を使うには、どの列にどの要因を割り当てるか(割付)を決めます。主効果は好きな列に置けますが、交互作用は自動的に特定の列に現れるため、割付には注意が必要です。

交互作用は別の列に現れる

要因 AA を列1、要因 BB を列2に割り付けると、L8L_8 では AABB の交互作用 A×BA\times B列3に自動的に現れます。この対応関係をまとめたのが交互作用表です。

ここで決定的に重要なのは次の点です。

⚠️ 交互作用が現れる列(この例では列3)に、別の主効果 CC をうっかり割り付けると、CC の主効果と A×BA\times B の交互作用が同じ列で混ざってしまい区別できなくなる(交絡する)。

要するに「交互作用が出る列は予約席。そこに他の主効果を座らせると相席になって誰の効果か分からなくなる」ということです。

線点図(線形図)

どの列にどの要因・交互作用を割り付ければ衝突しないかを、視覚的に示したのが**線点図(linear graph、線形図とも)**です。

graph LR
    P1((列1<br/>要因A)) ---|"列3<br/>= A×B"| P2((列2<br/>要因B))
    P1 ---|"列5<br/>= A×C"| P4((列4<br/>要因C))
    P2 ---|"列6<br/>= B×C"| P4

この図の読み方は「列1に AA、列2に BB を割り付けるなら、両者を結ぶ線(列3)は A×BA\times B で埋まるから、列3には他の主効果を置かない」です。交互作用を見たい要因の組は線で結ばれた配置にし、交互作用を見なくてよい要因は空いている列に自由に割り付けます。線点図は直交表ごとに用意されており、見たい交互作用の構造に合う線点図を選んで割付するのが実務の流れです。

flowchart TD
    START["評価したい要因と<br/>見たい交互作用を列挙"] --> SIZE["必要な列数から<br/>直交表の大きさを選ぶ<br/>(L8 / L16 / L9 …)"]
    SIZE --> GRAPH["その直交表の線点図を見る"]
    GRAPH --> ASSIGN["主効果を点(〇)の列へ割付"]
    ASSIGN --> INTER["見たい交互作用を<br/>線(結合)の列へ割付"]
    INTER --> CHECK{"空き列に主効果を<br/>追加できるか?"}
    CHECK -->|"はい・交互作用列でない"| ADD["残りの要因を空き列へ"]
    CHECK -->|"いいえ・交互作用列"| AVOID["その列は使わない<br/>(交絡を避ける)"]
    ADD --> RUN["実験実施 → 分散分析"]
    AVOID --> RUN

5. 平方和と自由度 ―― 分散分析表への接続

実験が終わったら、列ごとに平方和を計算し、分散分析表にまとめます。直交性のおかげで、総平方和が列(要因)ごとにきれいに分解されます。分散分析そのものの枠組みは 分散分析 の通りで、直交表はそれを一部実施計画に乗せたものです。

列ごとの平方和

2水準系で、第 pp 列について「水準2の応答の合計 Tp2T_{p2}」と「水準1の応答の合計 Tp1T_{p1}」を作ります。各水準は N/2N/2 回ずつ現れるので、その列の平方和は次式です。

Sp=(Tp2Tp1)2NS_p=\frac{(T_{p2}-T_{p1})^2}{N}

要するに「その列で高水準にしたときと低水準にしたときの応答合計の差」を2乗して実験回数で割ったもので、その要因が応答をどれだけ動かしたかを表します。差が大きい列ほど、その要因の効果(または割り付けた交互作用の効果)が大きいということです。

直交性による平方和の完全分解

直交表では、総平方和が各列の平方和の単純な和に分解されます。

  ST=pSp+SE  \boxed{\;S_T=\sum_{p}S_p+S_E\;}

これは 分散分析 でクロス項が消えて ST=SA+SES_T=S_A+S_E になったのと同じ原理です。列が互いに直交している(内積ゼロ)ため、列どうしのクロス項がすべて消え、各列の寄与が重ならずに足し算で分離されます。要するに「直交しているから平方和が要因ごとに重複なくきれいに割り振れる」わけです。割り付けなかった(要因も交互作用も置かなかった)列の平方和は、まとめて誤差 SES_E に算入します。

自由度

2水準系では、各列(各主効果・各交互作用)の自由度は 11(水準数 1=21-1=2-1)です。3水準系(L9L_9 など)では各列の自由度は 22313-1)になります。誤差自由度は「総自由度 N1N-1 から、割り付けた要因・交互作用の自由度を引いた残り」です。

要因平方和自由度(2水準系)
列に割付けた要因 AASA=(TA2TA1)2NS_A=\dfrac{(T_{A2}-T_{A1})^2}{N}1
列に割付けた要因 BBSBS_B1
交互作用 A×BA\times B(割付けた列)SA×BS_{A\times B}1
誤差 EE(空き列をまとめたもの)SE=STpSpS_E=S_T-\sum_p S_pN1(割付自由度)N-1-\sum(\text{割付自由度})
全体 TTSTS_TN1N-1

ここでも検算は同じで、平方和も自由度も縦に足すと全体に一致します。各要因は自分の平均平方を誤差平均平方 VEV_E で割ったFで検定します(右片側)。


6. 一部実施計画と交絡(エイリアス)【1級】

実験を間引いた以上、タダでは済みません。完全実施で測れていた効果のいくつかが、互いに区別できなくなります。これが**交絡(confounding)/エイリアス(aliasing)**です。

交絡とは何か

交絡とは、2つ以上の効果が同じ列(同じ対比)に現れ、観測値からは分離できない状態です。L8L_8 で7列すべてに主効果を割り付けると、各列の主効果は実は「主効果+ある交互作用」の和になっています。たとえば、

β^列3=βC+βA×B+\hat\beta_{\text{列3}}=\beta_C+\beta_{A\times B}+\cdots

のように、列3で推定した量は「要因 CC の主効果」と「A×BA\times B の交互作用」を足したものです。両者を切り離す情報は8回の実験には含まれていません。要するに「実験を間引いた分、見分けがつかなくなる効果のペアが必ず生じる」ということです。

なぜ交絡が避けられないのか(定義関係)

一部実施計画は、完全実施の全組合せから一部だけを選ぶ計画です。2742^{7-4} 計画(L8L_8 に7要因を割り付けるケース)なら、完全実施 27=1282^7=128 通りのうち 1/161/16 の8通りだけを選びます。この「選び方のルール」を**生成元(generator)で決め、その結果として効果のエイリアス構造が定義関係(defining relation)**として一意に定まります。たとえば生成元 E=ABCE=ABC という選び方をすると、EEABCABC は同じ列に乗り、EE の主効果と ABCABC の3因子交互作用が交絡します。要するに「どの組合せを選ぶかを決めた瞬間、どの効果とどの効果が混ざるかも自動的に決まる」のです。

分解能(resolution)

交絡の質を表す指標が**分解能(resolution)**で、ローマ数字で表します。「主効果がどこまでクリーンか」を示します。

分解能主効果は…2因子交互作用は…
III互いに交絡しない。ただし2因子交互作用と交絡主効果と交絡
IV互いに交絡せず、2因子交互作用とも交絡しない。3因子交互作用と交絡別の2因子交互作用と交絡
V2因子交互作用とも交絡しない(高分解能)3因子交互作用と交絡

要するに「分解能が高いほど、低次の効果(主効果や2因子交互作用)どうしのエイリアスが少なく、解釈しやすい」。L8L_8 に7要因を詰め込むと分解能IIIで、主効果が2因子交互作用と交絡します。

交絡を逆手に取る ―― 設計の知恵

交絡は厄介ですが、割付の自由度を使って「重要な効果」を「無視できる効果」と交絡させることで実害を避けられます。

一部実施計画の腕の見せどころは、「効きそうな主効果」を「ほぼゼロとみなせる高次交互作用」とわざと交絡させること。

3因子以上の交互作用は実際にはほとんどゼロで、しかも仮にあっても技術的に解釈しづらいため、主効果をそこへぶつけてしまえば、観測された効果は実質「主効果そのもの」と読めます。要するに「区別がつかなくなるなら、片方が確実に無視できるペアを選んで混ぜる」という戦略です。本当に主効果と交絡したのが大きな交互作用でないかは、確認実験(直交表とは別にその組合せを実際に試す)で検証します。


⚠️ 引っかけポイント・頻出論点

(1) 直交表は交互作用を「限定的にしか」見られない。 直交表は主効果の評価が主目的です。交互作用も見られますが、見たい交互作用の数だけ列を消費し、その分割り付けられる主効果が減ります。L8L_8 に7要因を詰め込めば交互作用は1つも独立に見られず、すべて主効果と交絡します。「直交表ならどんな交互作用も自動で全部分かる」と思うのは誤りです。

(2) 実験回数削減と交絡はトレードオフ。 完全実施を間引くほど実験は楽になりますが、その代償として交絡が増え、分解能が下がります。「回数を減らしたのに何でも分かる」うまい話はありません。何を犠牲にして(どの高次交互作用を無視して)回数を減らしたのかを常に意識します。

(3) 交互作用が現れる列に主効果を割り付けてはいけない。 AA を列1、BB を列2に置いたら、A×BA\times B は列3に出ます。ここに CC を割り付けると CCA×BA\times B が交絡します。線点図・交互作用表を見て、交互作用列を空けておくのが割付の鉄則です。

(4) 水準数と直交表の対応を間違えない。 2水準の要因には2水準系(L8,L16L_8, L_{16})、3水準の要因には3水準系(L9,L27L_9, L_{27})を使います。L8L_8 に3水準の要因はそのまま割り付けられません(多水準作成法などの工夫が要る)。記法 LN(sk)L_N(s^k)ss が水準数であることを押さえます。

(5) 列数は「主効果の上限」であって「交互作用込みの容量」ではない。 L8L_8 の「7列」は、交互作用を一切見ない場合に主効果を置ける最大数です。交互作用を見るなら、その分は主効果に使えません。自由度で言えば、L8L_8 の総自由度は 81=78-1=7 で、これを主効果と交互作用と誤差で分け合います。


よくある疑問(Q&A)

Q1. 直交表を使うと、なぜ実験を間引いても各要因の効果が分かるのですか?

各列(要因)が互いに直交している(列ベクトルの内積がゼロ)からです。ある要因の効果を計算するとき、他の要因は高水準と低水準がちょうど均等に混ざって相殺されるため、その要因単独の効き目だけが残ります。要するに「他の要因がきれいに打ち消し合うように水準を配置してある」から、間引いても主効果が独立に読める、ということです。これは回帰でいえば計画行列の列が直交していて、各係数が他と無関係に求まる理想状態です。

Q2. 直交表があれば、もう完全実施(全組合せ)は要らないのですか?

いいえ。直交表(一部実施)は主効果が主目的で、交互作用は限定的にしか見られません。すべての交互作用まで詳しく知りたい、あるいは高次交互作用が無視できない場合は、完全実施が必要です。一部実施は「主効果さえ分かればよく、高次交互作用は無視できる」という前提が成り立つ場面で威力を発揮します。前提が崩れる場面では交絡が実害になります。

Q3. 交絡(エイリアス)とは結局どういう状態ですか?

2つ以上の効果が同じ列に現れて区別できない状態です。たとえば L8L_8 のある列で推定した量が「要因 CC の主効果」と「A×BA\times B の交互作用」のになっていて、8回の実験データだけでは両者を分離できません。完全実施を間引いた代償として必ず生じます。対策は、無視できる高次交互作用とわざと交絡させること、そして必要なら確認実験で検証することです。

Q4. 3因子以上の交互作用は無視してよいのですか?

実務上はほとんどの場合に無視します。理由は2つで、(1) 経験的に高次交互作用は主効果や2因子交互作用に比べて非常に小さいこと、(2) 仮に存在しても「要因A・B・Cが三つ揃ったときだけ特有に効く」という現象は技術的に解釈しづらく対策に結びつきにくいことです。だからこそ、主効果をあえて3因子交互作用と交絡させる割付が合理的になります。ただし「無視できる」という前提が妥当かは個別判断が要ります。

Q5. 線点図は何のためにあるのですか?

どの列に何を割り付ければ交絡を避けられるかを一目で示す地図です。点(〇)が主効果を置ける列、点を結ぶ線がその2要因の交互作用が現れる列を表します。見たい交互作用は線の列に割り付け、その列には他の主効果を置かない――この割付ルールを視覚化したのが線点図です。直交表ごとに複数の線点図が用意されており、評価したい交互作用の構造に合うものを選びます。

Q6. L8L_8 で7要因を割り付けたのに、なぜ「交互作用が見られない」のですか?

L8L_8 の独立な自由度は 81=78-1=7 しかなく、これを7つの主効果が使い切ってしまうからです。交互作用を独立に推定するには別の列(別の自由度)が要りますが、もう空きがありません。結果として、各列の主効果は対応する交互作用と交絡した状態になります(分解能III)。交互作用を見たければ、割り付ける主効果の数を減らして列を空ける必要があります。


まとめ


試験での問われ方(級ごとの差)

直交表は準1級・1級ともに実験計画法の出題範囲(要最新確認)。同じ直交表でも、準1級は「読んで主効果を出す」運用、1級は「間引きの理論(交絡・分解能)」まで踏み込む点が違います。

準1級:直交表の読み方・要因の割付・主効果の推定が中心です。

1級:一部実施計画の理論、交絡(エイリアス)構造まで踏み込みます。

要するに「準1級は与えられた直交表を運用して主効果を取り出す、1級はなぜその間引きでそう交絡するのかという計画の理論を扱う」という深さの差です。


関連ノート