空間統計｜統計検定テキスト

📊 対象級：1級　|　重要度：C（低頻度）

要点（BLUF）

この分野は公式範囲表外です（ただし1級・統計応用で出題実績あり）。 範囲表に明記されないため優先度は低いですが、過去に出ているので、モランのIの計算とバリオグラムの読み取りができる程度には押さえておきます（範囲・配点は改訂されうるため要最新確認）。

空間統計は「近いものは似る」（トブラーの第一法則）を統計量に落とし込む分野です。時系列の自己相関を「時間軸」から「空間（地図上の位置）」へ拡張したもの、と思えば全体像がつかめます。

空間自己相関：データが空間的にどれだけ「近いもの同士似ているか」を測る。代表がモランのI。期待値は $0$ ではなく $-\dfrac{1}{n-1}$ 、これより大きければ正の自己相関（似たものが固まる）。
バリオグラム：「2地点の距離 $h$ が離れるほど値の差はどれだけ大きくなるか」を表す関数 $\gamma(h)=\tfrac12\mathrm{Var}[Z(s+h)-Z(s)]$ 。ナゲット・シル・レンジの3要素で空間構造を要約する。
クリギング：観測のない地点の値を、周りの観測の重み付き和で予測する最良線形不偏予測（BLUP）。重みはバリオグラムから決まり、その正体はガウス・マルコフ／GLSの空間版。

graph TD
  ROOT["トブラーの第一法則<br/>近いものは似る"] --> AUTO["空間自己相関<br/>似ている度合いを測る"]
  ROOT --> STRUCT["空間構造のモデル化<br/>距離と非類似度の関係"]
  AUTO --> MORAN["モランのI<br/>期待値 -1/(n-1)"]
  AUTO --> GEARY["ギアリーのc<br/>差の2乗で測る別指標"]
  STRUCT --> VARIO["バリオグラム γ(h)<br/>ナゲット・シル・レンジ"]
  VARIO --> KRIG["クリギング<br/>最良線形不偏予測 BLUP<br/>＝GLSの空間版"]

1. 空間自己相関 — 「近いものは似る」を測る

1.1 トブラーの第一法則と空間的重み行列

空間統計の出発点はトブラーの地理学第一法則（Tobler’s first law）——「すべてのものは互いに関連するが、近いものほど強く関連する」です。これを統計的に検証・定量化したいわけです。

そのために、まず「どの地点とどの地点が近いか（隣接か）」を行列で表します。これが空間的重み行列（spatial weight matrix） $W=(w_{ij})$ です。 $w_{ij}$ は地点 $i$ と地点 $j$ の空間的な近さ・隣接の強さを表す重みで、定義の仕方はいくつかあります。

隣接（contiguity）ベース： $i$ と $j$ が境界を接していれば $w_{ij}=1$ 、そうでなければ $0$ （都道府県・市区町村など面データで使う）。
距離ベース：距離が一定以内なら $1$ 、または距離の逆数 $1/d_{ij}$ など（点データで使う）。
慣例として自分自身との重みは $w_{ii}=0$ とします。

要するに「 $W$ は地図上の『隣り合っている関係』を数値化した行列」。空間自己相関の統計量は、この $W$ を使って「隣同士の値が似ているか」を集計します。

重要な注意：空間的重み行列の定義は分析者が選ぶものであり、結果（モランのIの値）は $W$ の取り方に依存します。「隣接で定義したか、距離で定義したか」で答えが変わる——これが空間統計の一つの引っかけです（第6節）。

1.2 モランのI — 定義と読み方

最も広く使われる空間自己相関の指標が**モランのI（Moran’s I）**です。 $n$ 個の地点の観測値 $x_1,\dots,x_n$ 、平均 $\bar x$ 、空間的重み $w_{ij}$ に対して

\boxed{\; I=\frac{n}{\displaystyle\sum_{i}\sum_{j} w_{ij}}\cdot \frac{\displaystyle\sum_{i}\sum_{j} w_{ij}\,(x_i-\bar x)(x_j-\bar x)} {\displaystyle\sum_{i}(x_i-\bar x)^2} \;}

要するに「モランのIは『相関係数の空間版』」。式を分解すると見えてきます。

分子の核 $\sum_i\sum_j w_{ij}(x_i-\bar x)(x_j-\bar x)$ は、隣り合う地点同士の偏差の積を足し上げたものです。隣同士が「同じ向きにずれている」（両方とも平均より上、または両方とも下）と積が正になり、合計が大きくなります。普通の相関の分子 $\sum(x_i-\bar x)(y_i-\bar y)$ で、 $y$ を「自分の隣の値」に置き換えたものだと思えばよいです。
分母 $\sum_i(x_i-\bar x)^2$ は分散の $n$ 倍（全体のばらつき）。
先頭の $n/\sum_{i,j}w_{ij}$ は、重みの総和で割って基準化する係数です。

値の読み方：

$I$ の値	意味
$I > E[I]$ （正）	正の空間自己相関。似た値が近くに固まる（高い所の隣は高い、低い所の隣は低い）。クラスター状
$I \approx E[I]$	空間的にランダム（自己相関なし）
$I < E[I]$ （負）	負の空間自己相関。高い所の隣は低い、という市松模様（チェッカーボード）状

ここで肝心なのが「基準 $E[I]$ がいくつか」です。次でこれを導きます。

1.3 モランのIの期待値が $0$ でなく $-1/(n-1)$ である理由（導出）

直観では「相関係数の空間版なら、無相関のとき期待値は $0$ では?」と思いますが、違います。空間的にランダム（自己相関なし）という帰無仮説のもとで、モランのIの期待値は

\boxed{\;E[I]=-\frac{1}{\,n-1\,}\;}

です。 $0$ ではなく、わずかに負の値。導出の骨子を追います。

帰無仮説は「 $n$ 個の観測値 $x_1,\dots,x_n$ のラベル（どの値がどの地点に付くか）が完全にランダム」とする並べ替え（ランダム化）モデルです。 $n$ 個の値は固定で、それを $n$ 地点へランダムに割り当てたとき、 $I$ の期待値を計算します。

偏差を $z_i = x_i-\bar x$ と置くと、定義から $\sum_i z_i = 0$ （偏差の和はゼロ）です。モランのIの分子の核は $\sum_{i\ne j} w_{ij}\,z_i z_j$ （ $w_{ii}=0$ なので $i\ne j$ の和）。ここで決定的に効くのが次の恒等式です。

\Big(\sum_i z_i\Big)^2 = \sum_i z_i^2 + \sum_{i\ne j} z_i z_j = 0 \quad\Longrightarrow\quad \sum_{i\ne j} z_i z_j = -\sum_i z_i^2

要するに「偏差の総和がゼロだから、異なるペアの偏差の積を全部足すと、二乗和の符号を反転したものに等しくなる」。これがマイナスの出どころです。

ランダム割り当てのもとで $i\ne j$ のペア $(z_i z_j)$ はどのペアも対等（交換可能）なので、その期待値はすべて等しく、上の総和 $-\sum z_i^2$ をペアの個数 $n(n-1)$ で割った値になります。

E[z_i z_j] = \frac{-\sum_k z_k^2}{n(n-1)}\qquad(i\ne j)

これをモランのIの分子に代入すると、 $\sum_{i\ne j} w_{ij}$ が重みの総和 $\sum_{i,j}w_{ij}$ （対角は0）として括り出され、分子の核の期待値は

E\Big[\sum_{i\ne j} w_{ij}\,z_i z_j\Big] = \Big(\sum_{i\ne j} w_{ij}\Big)\cdot\frac{-\sum_k z_k^2}{n(n-1)}

これをモランのI全体（先頭の $n/\sum w_{ij}$ と分母 $\sum z_i^2$ ）に戻すと、重みの総和 $\sum w_{ij}$ と二乗和 $\sum z_k^2$ がきれいに約分され、

E[I]=\frac{n}{\sum w_{ij}}\cdot\frac{1}{\sum z_i^2}\cdot\Big(\sum w_{ij}\Big)\cdot\frac{-\sum z_k^2}{n(n-1)} =\frac{n}{n(n-1)}\cdot(-1)=-\frac{1}{n-1}

要するに「偏差の和がゼロという制約のせいで、無相関時でもわずかに負（ $-1/(n-1)$ ）に押し下げられる」。重み $w_{ij}$ の値そのものは期待値には残らず（約分で消える）、 $n$ だけで決まる点がポイントです。 $n\to\infty$ で $E[I]\to 0$ なので、サンプルが大きければ「ほぼ0が基準」と思ってよいですが、有限標本では $-1/(n-1)$ が正しい基準です。

検定への接続. モランのIの分散 $\mathrm{Var}(I)$ も（正規性仮定または並べ替え仮定のもとで）導出されており、標準化して

Z = \frac{I-E[I]}{\sqrt{\mathrm{Var}(I)}}

を漸近的に標準正規とみなして「空間自己相関なし（ $I=E[I]$ ）」を帰無仮説に検定します。試験では $E[I]=-1/(n-1)$ を使って「観測された $I$ が基準より大きい→正の自己相関」と判断させるところまでが中心です。

1.4 ギアリーのc（対比）

モランのIと並ぶもう一つの指標が**ギアリーのc（Geary’s c）**です。違いは「何で似ている度合いを測るか」です。

c=\frac{(n-1)\displaystyle\sum_{i}\sum_{j} w_{ij}\,(x_i-x_j)^2}{2\Big(\displaystyle\sum_{i}\sum_{j} w_{ij}\Big)\displaystyle\sum_{i}(x_i-\bar x)^2}

要するに「モランのIは隣同士の偏差の『積』で測り、ギアリーのcは隣同士の値の『差の2乗』で測る」。

	モランのI	ギアリーのc
測り方	偏差の積 $(x_i-\bar x)(x_j-\bar x)$	値の差の2乗 $(x_i-x_j)^2$
期待値（無相関時）	$-1/(n-1)$	$1$
正の自己相関	$I > -1/(n-1)$ （大きい）	$c < 1$ （小さい）
負の自己相関	$I < -1/(n-1)$ （小さい）	$c > 1$ （大きい）
性格	大域的（全体の傾向）を見やすい	局所的な差に敏感

両者は逆向きに動く点に注意（正の自己相関でIは大きく、cは小さい）。ギアリーのcの基準は $1$ であって $0$ ではないことも、Iの $-1/(n-1)$ と並んで間違えやすいところです。

2. バリオグラム（セミバリオグラム）

2.1 定義 — 距離と非類似度の関係

モランのIが「全体で自己相関があるか・ないか」を1つの数で要約するのに対し、**バリオグラム（variogram）**は「距離 $h$ ごとに、どれだけ値が違ってくるか」を関数として描きます。地点 $s$ の確率場（ランダムな場）を $Z(s)$ とし、距離（ラグ） $h$ だけ離れた2点の値の差の分散の半分として定義します。

\boxed{\;\gamma(h)=\frac12\,\mathrm{Var}\big[Z(s+h)-Z(s)\big]\;}

正確にはこれをセミバリオグラム（semivariogram）と呼び、その2倍 $2\gamma(h)$ をバリオグラムと呼びます（実務では両者を区別せず「バリオグラム」と言うことが多い）。

なぜ「差の分散の半分」なのか。差をとる定式化には大きな利点があります——平均が未知でも（場所によって緩く変わっていても）計算できること。値そのものの分散ではなく「差」を見るので、一定の平均が前後で打ち消し合い、平均を知らなくても空間構造（距離依存性）だけを取り出せます。これが次の「固有定常性」という弱い仮定で済む理由です。

要するに「バリオグラムは『 $h$ だけ離れた2点はどれくらい違うか』を $h$ の関数で表したもの。 $h$ が小さい（近い）ほど $\gamma$ は小さく（似ている）、 $h$ が大きいほど $\gamma$ は大きくなる（似なくなる）」。トブラーの第一法則を関数の形で表現したものです。

2.2 ナゲット・シル・レンジの3要素

典型的なバリオグラムは、距離 $h$ が増えるとともに立ち上がり、ある距離で頭打ちになる形をします。この曲線を3つのパラメータで要約します。

xychart-beta
    title "バリオグラム γ(h) の典型形（ナゲット・シル・レンジ）"
    x-axis "距離 h（ラグ）" 0 --> 10
    y-axis "セミバリアンス γ(h)" 0 --> 10
    line [1.5, 4.0, 6.0, 7.5, 8.3, 8.5, 8.5, 8.5, 8.5, 8.5, 8.5]

ナゲット（nugget） $c_0$ ： $h\to 0$ での $\gamma$ の切片（上のグラフで $h=0$ 付近の立ち上がりの高さ）。理論上は $\gamma(0)=0$ のはずですが、現実には測定誤差や「レンジより細かいスケールの変動」によって、ごく近い2点でも値が食い違う。その分を表すのがナゲットです。「ゼロ距離でも残る非類似度」。
シル（sill）： $\gamma$ が頭打ちになる上限値（プラトーの高さ、上のグラフの $8.5$ ）。これは確率場の全分散に対応します。 $h$ が十分離れると2点は無相関になり、差の分散は「独立な2つの分散の和」に達するため、ここで平らになります。ナゲットを除いた立ち上がり分（シル $-$ ナゲット）を**部分シル（partial sill）**と呼びます。
レンジ（range）： $\gamma$ がシルに到達する距離（上のグラフで $h\approx 5$ ）。これより近い2点は空間的に相関し、これより遠い2点は実質的に無相関になります。「空間相関が及ぶ範囲」。

要するに「ナゲット＝ゼロ距離でも残る食い違い（測定誤差など）、シル＝頭打ちの高さ（全分散）、レンジ＝相関が消える距離」。この3つでバリオグラムの形（＝空間構造）が決まり、クリギングの重みもこの形から決まります。

2.3 固有定常性と2次定常性

バリオグラムやクリギングが成り立つには、確率場 $Z(s)$ に何らかの**定常性（stationarity）**が要ります。空間統計では2つのレベルがあり、この区別が理論問題で問われます。

2次定常性（second-order stationarity / 弱定常）. 次の2つを仮定します。

E[Z(s)]=\mu\ (\text{一定})\qquad\text{かつ}\qquad \mathrm{Cov}\big[Z(s),\,Z(s+h)\big]=C(h)\ (\text{$h$ だけの関数})

要するに「平均がどこでも一定で、共分散が2点の『相対位置 $h$ 』だけで決まる（絶対位置によらない）」。時系列の弱定常性の空間版です。このとき共分散関数（コバリオグラム） $C(h)$ が定義でき、 $C(0)$ は分散になります。

固有定常性（intrinsic stationarity）. より弱い仮定で、

E\big[Z(s+h)-Z(s)\big]=0\qquad\text{かつ}\qquad \mathrm{Var}\big[Z(s+h)-Z(s)\big]=2\gamma(h)

要するに「値そのものではなく『差』について、平均ゼロかつ分散が $h$ だけで決まればよい」。差をとるので $Z(s)$ の分散が有限でなくても（発散していても）バリオグラムは定義できます。

両者の関係（重要）. 2次定常なら固有定常も成り立ち、このとき

\boxed{\;\gamma(h)=C(0)-C(h)\;}

という関係が出ます（次節で導出）。逆は必ずしも成り立たない——固有定常性のほうが緩く、2次定常性を含む。バリオグラムが共分散関数より好まれるのは、このより弱い仮定（固有定常性）で済むからです。

graph LR
  A["2次定常性<br/>平均一定＋共分散C(h)が定義できる<br/>（強い仮定）"] -->|含む| B["固有定常性<br/>差の平均0＋差の分散2γ(h)<br/>（弱い仮定）"]
  A -.->|"γ(h)=C(0)-C(h)"| C["バリオグラム γ(h)"]
  B -->|常に定義可| C

3. クリギング — 最良線形不偏予測（BLUP）

3.1 目的と予測の形

クリギング（kriging）は、観測のない地点 $s_0$ の値 $Z(s_0)$ を、周りの観測値 $Z(s_1),\dots,Z(s_n)$ の重み付き和で予測する手法です（南アフリカの鉱山技師 Krige に由来、Matheron が理論化）。予測値は

\hat Z(s_0)=\sum_{i=1}^{n}\lambda_i\,Z(s_i)

の形をとります。要するに「未知地点の値を、近くの観測値の加重平均で当てる。重み $\lambda_i$ をどう決めるかがクリギングの中身」。

ここで決定的なのは、重み $\lambda_i$ を「距離が近いほど大きく」と素朴に決めるのではなく、バリオグラム（＝空間構造）に基づいて、予測誤差が最小になるように決める点です。これが逆距離加重などの単純な内挿法との違いです。クリギングは次の意味で「最良」です。

線形（linear）：予測は観測値の線形結合に限る。
不偏（unbiased）：予測の期待値が真値に等しい $E[\hat Z(s_0)]=E[Z(s_0)]$ 。
最良（best）：上の制約のもとで予測分散（平均二乗予測誤差）を最小にする。

この3つを満たすので**最良線形不偏予測（Best Linear Unbiased Predictor, BLUP）**と呼ばれます。

3.2 普通クリギング — 不偏制約のもとで予測分散を最小化（ラグランジュ）

平均 $\mu$ が未知だが一定という設定（最も標準的なケース）の**普通クリギング（ordinary kriging）**を導きます。導出の流れは「①不偏性が課す制約を出す → ②予測分散を書く → ③制約付き最小化をラグランジュで解く」です。

① 不偏性が課す制約. 平均一定 $E[Z(s_i)]=\mu$ のもとで予測の期待値は

E[\hat Z(s_0)]=\sum_{i}\lambda_i\,E[Z(s_i)]=\mu\sum_i\lambda_i

これが真値の期待値 $E[Z(s_0)]=\mu$ に等しくあるためには、 $\mu$ が未知（任意の値をとりうる）なので、 $\mu$ の係数が合っていなければなりません。すなわち

\boxed{\;\sum_{i=1}^{n}\lambda_i=1\;}

要するに「重みの和は1。これが普通クリギングの不偏性制約」。 $\mu$ がいくつであっても予測がバイアスを持たないために必要です（加重『平均』になっていることを保証する）。

② 予測分散. 予測誤差 $\hat Z(s_0)-Z(s_0)$ の分散（平均二乗予測誤差）を、固有定常性のもとでバリオグラム $\gamma$ で書くと、

\sigma_E^2=\mathrm{Var}\big[\hat Z(s_0)-Z(s_0)\big] =2\sum_{i}\lambda_i\,\gamma(s_i,s_0)-\sum_{i}\sum_{j}\lambda_i\lambda_j\,\gamma(s_i,s_j)

ここで $\gamma(s_i,s_0)$ は予測地点と観測地点の距離に対応するバリオグラム値、 $\gamma(s_i,s_j)$ は観測地点同士のバリオグラム値です。要するに「予測の不確かさは、バリオグラムで測った『予測点と観測点の離れ具合』と『観測点同士の離れ具合』だけで書ける」。

③ ラグランジュで制約付き最小化. 「 $\sum\lambda_i=1$ のもとで $\sigma_E^2$ を最小化」する制約付き最適化を、ラグランジュ乗数 $m$ を導入して解きます。

L(\lambda_1,\dots,\lambda_n,\,m)=\sigma_E^2-2m\Big(\sum_i\lambda_i-1\Big)

（ $2m$ と置くのは後で式がきれいになるため。符号・係数は流儀によります。）各 $\lambda_k$ で偏微分してゼロと置き、制約も併せると、次の**クリギング方程式系（kriging system）**が得られます。

\boxed{\; \begin{cases} \displaystyle\sum_{j=1}^{n}\lambda_j\,\gamma(s_i,s_j)+m=\gamma(s_i,s_0) & (i=1,\dots,n)\\[2mm] \displaystyle\sum_{j=1}^{n}\lambda_j=1 \end{cases} \;}

要するに「 $n$ 本の最適性条件（各重みでの微分＝0）＋1本の不偏制約、合わせて $(n+1)$ 元連立1次方程式を解けば、重み $\lambda_i$ とラグランジュ乗数 $m$ が一気に求まる」。右辺はすべてバリオグラム $\gamma$ の値なので、バリオグラムさえ推定できれば重みが機械的に決まる——ここがクリギングの肝です。乗数 $m$ は単なる計算上の補助量に見えますが、予測分散の最終式にも現れ、不偏制約のぶんだけ分散が増える「コスト」を表します。

得られた重みを使った最小予測分散（クリギング分散）は

\sigma_{OK}^2=\sum_i\lambda_i\,\gamma(s_i,s_0)+m

となり、予測値だけでなく予測の不確かさ（誤差分散）も同時に出るのがクリギングの大きな利点です。観測の密な所では小さく、疎な所では大きくなります。

flowchart LR
  D["観測データ<br/>Z(s1),…,Z(sn)"] --> V["バリオグラム γ(h) を推定<br/>ナゲット・シル・レンジ"]
  V --> SYS["クリギング方程式系を解く<br/>Σλj γ(si,sj)+m = γ(si,s0)<br/>Σλj = 1"]
  SYS --> W["最適重み λi と乗数 m"]
  W --> PRED["予測値 Ẑ(s0)=Σλi Z(si)"]
  W --> VAR["クリギング分散 σ²<br/>（予測の不確かさ）"]

3.3 GLS（一般化最小二乗）の空間版という位置づけ

クリギングの正体は、ガウス・マルコフの定理／GLS（一般化最小二乗法）の空間への応用です。ここが1級らしい接続点です。

通常の回帰では、誤差が等分散・無相関なら OLS が最良線形不偏推定量（BLUE）になります（ガウス・マルコフの定理）。誤差に相関や不等分散があるときは、その分散共分散構造 $\Omega$ を使って重み付けし直した GLS が BLUE になります。

空間データでは、観測値が空間的に相関している——まさに「誤差が無相関でない」状況です。クリギングは、この空間的な相関構造を共分散関数（＝バリオグラムから決まる $C(h)$ ）で表し、それを使って最良線形不偏予測を構成する手続きにほかなりません。式の上でも、クリギング方程式系は GLS の正規方程式と同じ構造（共分散行列の逆を介した重み付け）をしています。

	ガウス・マルコフ／GLS（通常の回帰）	クリギング（空間）
何を	母数 $\beta$ を推定（BLUE）	未知地点の値 $Z(s_0)$ を予測（BLUP）
相関構造	誤差の分散共分散行列 $\Omega$	空間共分散 $C(h)$ （バリオグラム由来）
重み	$\Omega$ の逆を介して決定	クリギング方程式系（ $\gamma$ ）で決定
最良の意味	不偏のもとで分散最小	不偏のもとで予測分散最小

要するに「クリギング＝『近いものは似る』という相関構造を $\Omega$ （共分散）に入れた GLS の予測版」。だから「線形・不偏・分散最小（BLUP）」という性質が出てくるのは GLS と同じ理屈です。

補足：平均 $\mu$ を既知とする場合は単純クリギング（simple kriging）、未知だが一定とするのが普通クリギング（ordinary kriging）、平均が座標の関数で変化する（トレンドあり）とするのが**普遍クリギング（universal kriging）**です。試験で問われやすいのは普通クリギングの考え方（不偏制約 $\sum\lambda=1$ ）です。

4. 時系列の自己相関との対応（位置づけ）

空間統計は、時系列の道具立てを「1次元の時間軸」から「2次元の空間」へ拡張したもの、と見ると全体がすっきりします。対応表で押さえます。

時系列（時間）	空間統計	共通の考え方
自己相関（ACF）	モランのI／ギアリーのc	「近い観測ほど似る」を測る
ラグ $k$ （時間差）	距離 $h$ （ラグ）	どれだけ離れた観測同士を比べるか
定常性（弱定常）	2次定常性／固有定常性	平均一定・相関が相対位置だけで決まる
自己共分散関数 $\gamma_k$	共分散関数 $C(h)$ ／バリオグラム $\gamma(h)$	距離（ラグ）と相関の関係
過去から予測（AR等）	クリギング	周囲の観測から線形予測

要するに「時間方向の依存を扱う時系列を、向き・距離のある空間に一般化したのが空間統計」。ただし違いもあります。時間は一方向（過去→未来）ですが、空間は全方位に広がり、向きによって相関の強さが違うこともある（異方性 anisotropy：バリオグラムが距離だけでなく方向にも依存する）。この点が時系列にない空間特有の難しさです。

graph TD
  TS["時系列<br/>1次元の時間軸"] -->|次元と方向を一般化| SP["空間統計<br/>2次元・全方位"]
  TS --> ACF["自己相関 ACF"]
  ACF -->|空間版| MORAN["モランのI"]
  TS --> COV["自己共分散 γk"]
  COV -->|空間版| VARIO["バリオグラム γ(h)"]
  TS --> PRED["AR予測"]
  PRED -->|空間版| KRIG["クリギング"]

5. 試験での問われ方（1級・範囲表外）

繰り返しますが空間統計は1級の公式範囲表には明記されていません。それでも理工学分野で出題実績があり、問われるとすれば次のあたりです（範囲・出題傾向は要最新確認）。

モランのIの計算と解釈：小さな地図（数地点）と空間的重み行列 $w_{ij}$ を与え、 $I$ を計算させる、または計算済みの $I$ と $E[I]=-1/(n-1)$ を比べて「正の自己相関か負か」を判定させる。期待値が0でなく $-1/(n-1)$ であることを押さえているかが分かれ目。
ギアリーのcとの対比：「正の自己相関のとき I は大きく c は小さい」「c の基準は1」という逆向きの関係を問う。
バリオグラムの読み取り：与えられたバリオグラムのグラフからナゲット・シル・レンジを読み取らせる。「レンジは相関が及ぶ距離」「ナゲットは測定誤差等」の意味を答えさせる。
バリオグラムと共分散の関係： $\gamma(h)=C(0)-C(h)$ を使って一方から他方を求めさせる。
クリギングの考え方：「クリギングは最良線形不偏予測（BLUP）」「重みは $\sum\lambda_i=1$ の不偏制約のもとで予測分散を最小化して決まる」「重みはバリオグラムから決まる」という骨子を説明させる。詳細な方程式系を手で解かせるより、考え方・GLSとの関係を問うレベルが想定される。
定常性の区別：固有定常性と2次定常性の違い、バリオグラムがより弱い固有定常性で済む理由。

優先度は低い（重要度C・範囲表外）ので、モランのIの期待値・バリオグラムの3要素・クリギング＝BLUPという3点を押さえれば、出題されたときの最低限の得点は確保できます。

6. 引っかけ・頻出論点

⚠️ モランのIの期待値は $0$ ではなく $-\dfrac{1}{n-1}$ ：偏差の和がゼロという制約から、無相関時でもわずかに負に偏る。「I が0より大きいから正の自己相関」と判定するのは（厳密には）誤り。基準は $-1/(n-1)$ 。 $n$ が大きいときだけ「ほぼ0」と近似できる。
⚠️ ギアリーのcの基準は $1$ 、しかもIと逆向き：正の自己相関で I は大きく、c は小さく（ $<1$ ）なる。「c も大きいほど正の自己相関」と覚えると逆。c の無相関時の期待値は $1$ 。
⚠️ バリオグラムとコバリオグラム（共分散）の関係 $\gamma(h)=C(0)-C(h)$ ：バリオグラムは距離とともに増加（離れるほど似ない）、共分散は減少（離れるほど無相関）。両者は上下逆。 $\gamma(0)=0$ 、 $h\to\infty$ で $\gamma\to C(0)$ （＝シル＝全分散）。符号と向きを取り違えない。
⚠️ 空間的重み行列の定義に結果が依存する： $w_{ij}$ を隣接で定義するか距離で定義するかでモランのIの値は変わる。「モランのIは一意に決まる客観量」ではなく、 $W$ の選択という主観が入る。
⚠️ クリギングの不偏制約は $\sum\lambda_i=1$ （普通クリギング）：重みの和を1にするのは、平均 $\mu$ が未知でも予測がバイアスを持たないため。「重みは距離の逆数で決める」のは逆距離加重であってクリギングではない——クリギングの重みはバリオグラムから、予測分散最小化で決まる。
⚠️ クリギングは一致や不偏の「推定」でなく「予測（BLUP）」：母数 $\beta$ を当てる推定（BLUE）ではなく、未観測の確率変数 $Z(s_0)$ を当てる予測。E（estimator）でなく P（predictor）。GLS の予測版という位置づけ。
⚠️ 固有定常性 ⊃ 2次定常性ではなく、2次定常性 ⊂ 固有定常性：固有定常性のほうが**弱い（緩い）**仮定で、2次定常性を含む。バリオグラムが共分散より好まれるのは、より弱い固有定常性で定義できるから。包含の向きを逆にしない。

よくある疑問（Q&A）

Q1. モランのIの期待値はなぜ $0$ ではなく $-1/(n-1)$ なのですか? 相関係数の空間版なら0が自然では?

偏差の総和がゼロ（ $\sum_i (x_i-\bar x)=0$ ）という制約が効くからです。普通の相関係数は2つの別変数 $x,y$ の積で測るので無相関なら0が基準ですが、モランのIは同じ変数を自分の隣と比べるため、 $\sum z_i=0$ から $\sum_{i\ne j} z_i z_j = -\sum z_i^2$ という恒等式が成り立ちます（第1.3節の導出）。異なるペアの偏差の積を全部足すと、二乗和の符号を反転した負の値になる——この「強制的な負」が割り算後に $-1/(n-1)$ として残ります。直観的には「平均を中心にすると、誰かが平均より上なら他の誰かは下、と互いに引っ張り合う」ため、ランダムでもごくわずかに負へ偏る、ということです。 $n$ が大きければ $-1/(n-1)\to 0$ なので、実用上は「ほぼ0が基準」で問題ありません。

Q2. バリオグラムと共分散関数（コバリオグラム）はどちらを使えばいいのですか? 同じものですか?

同じ情報を表しますが、向きが逆で、必要な仮定が違います。関係は $\gamma(h)=C(0)-C(h)$ 。共分散 $C(h)$ は「距離 $h$ で値がどれだけ一緒に動くか」で、距離とともに減少します（離れるほど無相関）。バリオグラム $\gamma(h)$ は「距離 $h$ でどれだけ違うか」で、距離とともに増加します（離れるほど似ない）。実務でバリオグラムが好まれる理由は2つ。第一に、 $C(h)$ の定義には2次定常性（平均一定で分散が有限）が要りますが、 $\gamma(h)$ は差をとるのでより弱い固有定常性で済み、平均が場所で緩く変わっても・分散が発散していても定義できます。第二に、バリオグラムは平均を推定せずに「差」だけから直接計算でき、実データから推定しやすい。だから地球統計では「まずバリオグラムを推定し、必要なら $C(h)=C(0)-\gamma(h)$ で共分散に変換」という流れが標準です。

Q3. クリギングは逆距離加重（近いほど重みを大きく）と何が違うのですか?

「重みの決め方」が根本的に違います。逆距離加重（IDW）は「距離が近いほど重みを大きく」とあらかじめ決めた関数（距離の逆数など）で重みを置きます。データの空間構造は見ません。クリギングはデータから推定したバリオグラム（＝その場の空間構造）に基づき、予測誤差（予測分散）が最小になるように重みを最適化します。だからクリギングは「どのくらいの距離で相関が消えるか（レンジ）」「測定誤差はどれくらいか（ナゲット）」を反映した重みを使い、しかも予測の不確かさ（クリギング分散）も同時に出力します。IDWは誤差の大きさを教えてくれません。要するに、IDWは決め打ちの内挿、クリギングは空間構造を学習した最良線形不偏予測（BLUP）、という違いです。

Q4. クリギングが「GLSの空間版」とはどういう意味ですか?

通常の回帰では、誤差が等分散・無相関なら OLS が最良（BLUE）ですが、誤差に相関や不等分散があるとその共分散構造 $\Omega$ を使って重み付けし直した GLS が最良になります。空間データは「観測値が空間的に相関している」＝「誤差が無相関でない」状況そのものです。クリギングは、この空間相関を共分散関数 $C(h)$ （バリオグラムから決まる）で $\Omega$ として表し、それを使って最良線形不偏予測を作ります。式の上でもクリギング方程式系は GLS の正規方程式と同じ「共分散の逆を介した重み付け」の構造をしています。違いは目的だけ——GLSは母数 $\beta$ の推定（BLUE）、クリギングは未知地点の値の予測（BLUP）。だから「線形・不偏・分散最小」という性質が両者で共通します。詳しくはガウス・マルコフの定理とGLS と対応づけてください。

Q5. ナゲットがゼロでない（ $\gamma(0)\ne 0$ ）のはおかしくないですか? 同じ地点なら差はゼロのはずでは?

理論上は同一地点の差はゼロ（ $\gamma(0)=0$ ）です。しかし実データのバリオグラムは、 $h\to 0$ に外挿すると正の切片（ナゲット）を持つことが多い。原因は2つ。第一に測定誤差——同じ地点を2回測っても観測値は微妙に食い違うので、その分が「ゼロ距離でも残る差」として現れます。第二にレンジより細かいスケールの空間変動——観測点間隔より短い距離で起きる変動は捉えきれず、近接2点でも差が残る。だからナゲットは「観測の精度＋微細スケールの変動」を表す量で、ゼロでないのは自然です。ナゲットが大きいほど、ごく近い観測でも当てにならない（クリギングでも近接点の重みが下がる）ことを意味します。

Q6. 異方性（anisotropy）とは何ですか? 時系列にはない話ですか?

異方性とは「空間相関の強さが方向によって違う」ことです。バリオグラムが距離 $h$ だけでなく向きにも依存する状態を指します。例：地下水位は地層の走向に沿った方向では遠くまで似ているが、直交方向ではすぐ似なくなる、など。等方的（isotropic）なら相関は距離だけで決まり向きによらない。時系列は時間軸が一方向（過去→未来）の1次元なので、この「向きによる違い」という概念がそもそもありません。空間が2次元・全方位であることから生じる、空間特有の論点です。実務では方向ごとにバリオグラムを推定して異方性を確認し、必要なら座標変換で等方化してからクリギングします。試験（範囲表外）で深く問われる可能性は低いですが、「バリオグラムは距離だけでなく方向の関数にもなりうる」ことは知っておくと安全です。

まとめ

位置づけ：空間統計は1級・統計応用の公式範囲表外（ただし理工学分野で出題実績あり）。「近いものは似る」（トブラーの第一法則）を統計量にした分野で、時系列の自己相関の空間版。
空間自己相関：モランのI $I=\dfrac{n}{\sum w_{ij}}\cdot\dfrac{\sum_{i,j}w_{ij}(x_i-\bar x)(x_j-\bar x)}{\sum_i(x_i-\bar x)^2}$ は相関係数の空間版。期待値は $0$ でなく $-\dfrac{1}{n-1}$ （偏差の和がゼロの制約から導出）。ギアリーのcは差の2乗で測り、基準は $1$ 、I とは逆向き。
バリオグラム $\gamma(h)=\tfrac12\mathrm{Var}[Z(s+h)-Z(s)]$ ：距離と非類似度の関係。ナゲット（ゼロ距離でも残る差・測定誤差）、シル（頭打ちの高さ・全分散）、レンジ（相関が消える距離）の3要素。共分散との関係は $\gamma(h)=C(0)-C(h)$ 。差で測るので固有定常性（2次定常性より弱い）で定義できる。
クリギング：未知地点を $\hat Z(s_0)=\sum\lambda_i Z(s_i)$ で当てる最良線形不偏予測（BLUP）。普通クリギングは不偏制約 $\sum\lambda_i=1$ のもとで予測分散をラグランジュ最小化し、クリギング方程式系（右辺がすべてバリオグラム $\gamma$ ）を解いて重みを決める。予測値と同時にクリギング分散（予測の不確かさ）も出る。正体はガウス・マルコフ／GLSの空間版。
試験（範囲表外・要最新確認）：モランのIの計算・ $-1/(n-1)$ との比較、バリオグラムのナゲット/シル/レンジの読み取り、 $\gamma(h)=C(0)-C(h)$ 、クリギング＝BLUPの考え方。優先度は低いが3点（I の期待値・バリオグラム3要素・クリギング＝BLUP）を押さえる。