← 統計検定テキスト 一覧

📊 対象級:2級 | 重要度:A(頻出)

要点(BLUF)

実験計画法の目的は、処理(要因)の効果を誤差から分離して推定・検定することです。その土台となるのがフィッシャーの3原則です。

原則解決する問題誤差への働き
反復(replication)誤差の大きさが不明偶然誤差を測定可能にする
無作為化(randomization)未知の系統的要因が偏る系統誤差を偶然誤差に変換する
局所管理(local control)既知の変動源が結果に紛れ込む系統誤差を分離・除去する

3原則は補完関係にあります。無作為化だけでは既知の変動源に対処しきれず、局所管理だけでは未知の偏りを断てない。反復がなければ誤差の大きさ自体が推定できず、検定が成り立ちません。


1. 実験計画法が解く問題

処理(たとえば肥料の種類)を変えたとき、観測される差が「処理の本物の効果」なのか「たまたまのばらつき」なのかを区別したい。これが実験計画法の出発点です。

観測値を次のように分解するのが基本的な見取り図です。

観測値=全体平均+処理効果+誤差\text{観測値} = \text{全体平均} + \text{処理効果} + \text{誤差}

この分解が分散分析(分散分析)の出発点でもあります。処理効果を正確に推定するには、誤差を適切に扱う実験デザインが必要で、そのための設計指針がフィッシャーの3原則です。

flowchart LR
    OBS["観測値"] --> MU["全体平均 μ"]
    OBS --> TAU["処理効果 τ"]
    OBS --> ERR["誤差 ε"]

    ERR --> E1["偶然誤差\n(ランダムなばらつき)"]
    ERR --> E2["系統誤差\n(特定方向への偏り)"]

    PRINC["フィッシャーの3原則"] --> P1["反復\n→偶然誤差を測る"]
    PRINC --> P2["無作為化\n→系統誤差を偶然誤差に変換"]
    PRINC --> P3["局所管理\n→系統誤差を分離・除去"]

2. 反復(Replication)

何のためか

同一条件で2回以上観測を繰り返すことです。「実験を繰り返す」というシンプルな操作ですが、目的は明確です。誤差の大きさを推定できるようにすることです。

1回しか観測しなければ、「処理Aで得た値10」が「処理Bで得た値12」より小さいとき、この差2が処理の効果なのか、偶然のばらつきなのかを区別する手がかりがありません。処理内でのばらつきの大きさ(=誤差分散)を推定するには、同一処理のもとで複数回観測した値の散らばりが必要です。

なぜ有効か

分散分析のF統計量の構造がその理由を示しています。

F=V処理V誤差F = \frac{V_{\text{処理}}}{V_{\text{誤差}}}

分母 V誤差V_{\text{誤差}}(誤差分散の推定量)は、反復があってはじめて計算できます。反復なしでは V誤差V_{\text{誤差}} の自由度がゼロになり、F検定自体が成立しません。また反復数 nn が増えるほど誤差分散の推定精度が上がり、処理効果の検出力(第一種の過誤・第二種の過誤・検出力(2種類の誤りとトレードオフ・サンプルサイズ設計))が向上します。

検出力    n    誤差分散の推定精度\text{検出力} \uparrow \iff n \uparrow \iff \text{誤差分散の推定精度} \uparrow

要するに、反復は「偶然のばらつきの物差し」を作るための操作です。物差しなしに処理効果の大小を語ることはできません。


3. 無作為化(Randomization)

何のためか

処理の割り付けや実験の順序を**無作為(ランダム)**に決めることです。

実験には、処理以外にも結果に影響しうる要因(ヌイサンス変数)が潜んでいます。たとえば農場実験なら「区画の日当たり」「実験者の操作の慣れ(順序効果)」などです。これらが特定の処理に系統的に偏ると、処理効果と混同されます(交絡)。無作為化はこの偏りを防ぐための操作です。

なぜ有効か

割り付けをランダムにすると、未知のヌイサンス変数が特定の処理に集中する可能性が低くなります。より正確に言えば、系統的な偏り(系統誤差)を偶然誤差に変換するのが無作為化の役割です。

系統誤差は推定を不偏でなくする方向に働きます(バイアス)。偶然誤差に変換されれば、期待値の意味でバイアスがなくなり、推定量が不偏になります。これが「無作為化が推定を不偏にする根拠」です。

系統誤差(偏り)無作為化偶然誤差(ランダムなばらつき)\text{系統誤差(偏り)} \xrightarrow{\text{無作為化}} \text{偶然誤差(ランダムなばらつき)}

注意すべきは、無作為化で偶然誤差が消えるわけではない点です。偶然誤差は反復と統計的推定によって初めて制御できます。無作為化が担うのはあくまで「偏りを断つ」役割です。

flowchart TD
    UNK["未知の変動要因\n(交絡候補)"]
    UNK --> RAND["無作為化"]
    RAND --> RANDOM_ERR["偶然誤差に変換\n(どの処理にも均等に分散)"]
    RANDOM_ERR --> UNBIASED["推定が不偏になる"]

4. 局所管理(Local Control)/ブロック化

何のためか

「既知の変動要因」をあらかじめ識別し、その影響をデザインの段階で制御することです。具体的には、変動要因が均一とみなせる実験単位のまとまり(ブロック)を作り、ブロック内で処理を比較します。

局所管理の典型的な実装が**乱塊法(randomized block design)**です。たとえば「圃場の土壌条件」が変動要因と分かっているなら、土壌条件が似た区画をひとまとめにしてブロックとし、各ブロック内にすべての処理を一組ずつ割り付けます。

なぜ有効か

ブロック内だけで処理を比較するため、ブロック間の系統的な差は比較から除かれます。これにより誤差分散が小さくなり、同じ反復数でも検出力が上がります。

無作為化との役割分担を整理します。

要するに、「どんな要因が影響するか分からない」ときは無作為化で対処し、「影響する要因は分かっているが制御しきれない」ときは局所管理でブロック化して分析から切り出す、という使い分けです。

誤差=ブロック差局所管理で除去+残差(純粋な誤差)反復で推定\text{誤差} = \underbrace{\text{ブロック差}}_{\text{局所管理で除去}} + \underbrace{\text{残差(純粋な誤差)}}_{\text{反復で推定}}
flowchart LR
    KNOWN["既知の変動要因\n(例:日当たり、時間帯)"]
    KNOWN --> BLOCK["ブロック化\n(均一なまとまりに分割)"]
    BLOCK --> COMPARE["ブロック内で処理を比較"]
    COMPARE --> REMOVED["ブロック間差が誤差から除去される"]
    REMOVED --> PRECISE["推定精度が向上"]

5. 3原則の役割分担まとめ

graph TD
    subgraph 誤差の種類
        RE["偶然誤差\n(ランダムなばらつき)"]
        SE_KNOWN["系統誤差(既知)\n例:時間帯・区画の違い"]
        SE_UNKNOWN["系統誤差(未知)\n例:実験者の無意識な操作の差"]
    end

    subgraph フィッシャーの3原則
        REP["反復\n→偶然誤差を測定可能にする"]
        RAND["無作為化\n→未知の系統誤差を偶然誤差に変換"]
        LC["局所管理\n→既知の系統誤差を分離・除去"]
    end

    RE -->|"大きさを推定"| REP
    SE_UNKNOWN -->|"偏りを断つ"| RAND
    SE_KNOWN -->|"ブロックで制御"| LC

3原則はセットで機能します。1つでも欠けると推定・検定の妥当性が損なわれます。


⚠️ 引っかけポイント・頻出論点

(1)無作為化と局所管理の役割混同(最頻出)

「ランダム化すれば既知の変動要因も除ける」という誤解が多いです。無作為化が対処するのは主に未知の変動要因です。「日当たりが異なる区画で実験する」のように変動要因がすでに分かっているなら、無作為化(ランダムに割り付ける)よりも局所管理(区画をブロックにして分離する)の方が精度向上に直接有効です。逆に「何が影響するか分からない」状況では局所管理ができないので無作為化で対処します。

(2)反復と疑似反復(pseudoreplication)の違い

反復は「独立した実験単位を複数用意する」ことです。同一の実験単位(同じ個体・同じ区画)から繰り返し測定した値を「反復」として扱うのは疑似反復(pseudoreplication)であり、データの独立性が成り立たず誤差分散を過小評価します。具体例:1本の植物から10枚の葉を採取して10回の反復とするのは疑似反復。10本の植物から各1枚が本物の反復。

(3)無作為化しても偶然誤差は消えない

「無作為に割り付ければばらつきはなくなる」は誤解です。無作為化は偶然誤差を消すのではなく、系統誤差を偶然誤差に変換するだけです。残った偶然誤差に対処するのは反復です。

(4)局所管理はブロック内の無作為化とセットで使う

局所管理だけでブロック内の割り付けをランダムにしなければ、ブロック内に系統誤差が残ります。乱塊法は「ブロック化(局所管理)+ブロック内無作為化」の組み合わせです。

(5)3原則と分散分析の接続

試験では「3原則のうちどれが分散分析の○○平方和と対応するか」という問い方もあります。反復→誤差平方和の推定、局所管理→ブロック平方和の分離、という対応を押さえておくと整理しやすいです(分散分析 参照)。


よくある疑問(Q&A)

Q1. 反復と「繰り返し測定」は同じですか?

同じではありません。フィッシャーの意味の反復は「独立した実験単位を複数用意する」ことです。同じ被験者・同じ区画から複数回測定するのは繰り返し測定(repeated measures)であり、データ間に相関が生じます。これを反復として扱うと疑似反復(pseudoreplication)になり、誤差分散を過小評価して第一種の過誤が膨らみます(第一種の過誤・第二種の過誤・検出力(2種類の誤りとトレードオフ・サンプルサイズ設計) 参照)。

Q2. 無作為化さえすれば局所管理は不要ですか?

不要ではありません。無作為化は「どの要因が偏るか予測できない」状況での保険です。「日当たりが異なる区画を使う」のように変動要因が特定できているなら、ブロック化(局所管理)でその変動を誤差から直接除去する方が精度向上の効果が大きいです。局所管理の方が「分かっている分だけ的確に対処できる」点で無作為化より直接的です。

Q3. 局所管理(ブロック化)するとどれだけ精度が上がるのですか?

ブロック変動が大きいほど恩恵が大きいです。もしブロック間の差が小さい(均質な実験環境)なら、ブロック化で自由度を消費する分だけかえって検出力が下がることもあります。局所管理の効果は「ブロック間の系統的な変動の大きさ」に比例します。

Q4. 無作為化で系統誤差が「偶然誤差に変換される」とはどういう意味ですか?

たとえば「実験者が気づかず、処理Aを午前に、処理Bを午後に実施する」という状況を考えます。この時間帯の差は系統的な偏り(系統誤差)として推定に入り込みます。処理の割り付け順をランダムにすれば、午前・午後がどちらの処理に割り当てられるかは確率的になります。結果として、時間帯の影響はどの処理にも平均的に分散し、特定の処理を有利にも不利にもしなくなります。これが「系統誤差を偶然誤差に変換する」の意味です。偏りが消えるのではなく、方向性のある偏りがランダムなばらつきに変わります。

Q5. 乱塊法(randomized block design)はどの原則を使っていますか?

3原則すべてを統合した設計です。ブロック化が局所管理、ブロック内での割り付けのランダム化が無作為化、各処理を各ブロックで繰り返すことが反復に対応します。フィッシャーの3原則すべてを盛り込んだ実験デザインの代表例が乱塊法です。ラテン方格・直交表はさらに局所管理を多次元に拡張した設計法です(Phase 7で別途扱います)。


まとめ


関連ノート