時系列解析（定常性・ACF/PACF・AR・MA・ARMA・ARIMA）

📊 対象級：準1級・ 1級　|　重要度：A（頻出）

要点（BLUF）

時系列解析の核心は「どのモデルがデータを生成したかを、ACFとPACFのパターンから読み取ること」。非定常ならば差分で定常化し、定常化後にAR(p)かMA(q)かARMA(p,q)かをACF/PACFの打ち切れ（カットオフ）パターンで同定する。AR(1)なら $\rho_k = \varphi^k$ （ラグが増えるほど指数減衰）が定常条件 $\lvert\varphi\rvert < 1$ の証明と一体で問われる。

1. 時系列データの構成要素

観測値 $X_t$ はふつう複数の成分の和（または積）に分解できます。

X_t = T_t + S_t + C_t + I_t

成分	記号	内容
トレンド成分	$T_t$	長期的な増減傾向（人口増・技術進歩など）
季節成分	$S_t$	一定周期で繰り返すパターン（月次・四半期など）
循環成分	$C_t$	景気循環のような数年単位の波。トレンドと混同されやすい
不規則成分	$I_t$	上記3つを除いた残差。ランダムな変動

要するに「時系列 = 決定論的なパターン3つ + ランダムな残り」です。確率的モデル（AR・MA・ARIMA）は主に不規則成分をモデル化しますが、ARIMAの差分はトレンド（漸近的非定常）を除去する操作でもあります。

2. 定常性

2.1 弱定常（Wide-Sense Stationary / Covariance Stationary）

時系列 $\{X_t\}$ が**弱定常（広義定常）**であるとは、次の3条件がすべて成り立つことです。

\boxed{ \begin{aligned} &(1)\quad E[X_t] = \mu \quad (\text{すべての }t\text{ で一定})\\ &(2)\quad \mathrm{Var}(X_t) = \sigma^2 < \infty \quad (\text{すべての }t\text{ で一定})\\ &(3)\quad \mathrm{Cov}(X_t, X_{t+k}) = \gamma_k \quad (t\text{ に依存せず、ラグ }k\text{ だけの関数}) \end{aligned} }

要するに「平均・分散が時点によらず一定で、自己共分散はラグ差だけで決まる」。株価の水準や気温の年間トレンドを含む原系列はふつう非定常ですが、差分を取ると定常になることが多いです。

⚠️ 強定常（分布全体が時間シフト不変）と弱定常は別概念。正規過程では同値ですが、一般には強定常 → 弱定常のみが成立します。試験では「弱定常」「共分散定常」が主題。

2.2 ホワイトノイズ

$\{\varepsilon_t\}$ がホワイトノイズであるとは

E[\varepsilon_t] = 0, \quad \mathrm{Var}(\varepsilon_t) = \sigma^2, \quad \mathrm{Cov}(\varepsilon_t, \varepsilon_s) = 0 \; (t \neq s)

要するに「無相関・等分散・平均ゼロの過程」。正規ホワイトノイズ（ $\varepsilon_t \sim N(0, \sigma^2)$ かつ独立）はその特殊ケースです。AR・MA・ARMAモデルの誤差項はすべてホワイトノイズを仮定します。

2.3 自己共分散関数と自己相関関数（ACF）

ラグ $k$ の自己共分散は

\gamma_k = \mathrm{Cov}(X_t, X_{t+k}) = E[(X_t - \mu)(X_{t+k} - \mu)]

自己相関係数（ACF） $\rho_k$ は分散 $\gamma_0$ で標準化したもの：

\rho_k = \frac{\gamma_k}{\gamma_0}

要するに「 $X_t$ と $k$ 期ずれた $X_{t+k}$ の相関。 $-1$ から $1$ の間」。

2.4 偏自己相関関数（PACF）

$\rho_k$ は $X_t$ と $X_{t+k}$ の相関を測りますが、間に挟まる $X_{t+1}, \ldots, X_{t+k-1}$ の影響を含みます。これを取り除いた純粋な直接相関が偏自己相関（PACF） $\alpha_k$ です。

\alpha_k = \mathrm{Corr}(X_t - \hat{X}_t, \; X_{t+k} - \hat{X}_{t+k})

ここで $\hat{X}_t$ は $X_{t+1}, \ldots, X_{t+k-1}$ を所与として $X_t$ を線形回帰した予測値（同様に $\hat{X}_{t+k}$ ）です。要するに「ラグ $k$ までの影響を制御した後に残る $X_t$ — $X_{t+k}$ 直接相関」。

3. AR(p)モデル — 自己回帰モデル

3.1 定義

X_t = c + \varphi_1 X_{t-1} + \varphi_2 X_{t-2} + \cdots + \varphi_p X_{t-p} + \varepsilon_t

要するに「今期の値 = 定数 + 過去 $p$ 期の値の線形和 + 誤差」。名前の”自己回帰”は「 $X$ を過去の $X$ 自身で回帰する」という意味。

ラグ演算子 $B$ （ $B X_t = X_{t-1}$ ）を使うと

\varphi(B) X_t = c + \varepsilon_t, \quad \varphi(B) = 1 - \varphi_1 B - \varphi_2 B^2 - \cdots - \varphi_p B^p

3.2 AR(1)の平均・分散・自己相関 — 完全導出

AR(1)の標本路と自己相関

左：AR(1)の標本路（|φ|<1は定常、φ=1のランダムウォークは非定常）。右：自己相関 ρ_k=φ^k は指数的に減衰。図は simulations/ar1_acf_jikkeiretsu.py で生成。

AR(1) $X_t = c + \varphi X_{t-1} + \varepsilon_t$ を対象とします（ $\varepsilon_t \sim WN(0, \sigma^2)$ ）。

平均の導出

定常性を仮定すると $E[X_t] = E[X_{t-1}] = \mu$ と置けます：

\mu = c + \varphi \mu \;\Longrightarrow\; \mu = \frac{c}{1-\varphi}

要するに「定常なら平均はどの時点でも同じ $\mu$ 」という自己無撞着な条件から決まります。以下では簡単のため $c=0$ 、つまり $\mu=0$ として進めます。

分散の導出

$X_t = \varphi X_{t-1} + \varepsilon_t$ を2乗して期待値を取ります。定常性より $\mathrm{Var}(X_t) = \mathrm{Var}(X_{t-1}) = \gamma_0$ と置くと：

\gamma_0 = E[X_t^2] = E[(\varphi X_{t-1} + \varepsilon_t)^2] = \varphi^2 E[X_{t-1}^2] + 2\varphi E[X_{t-1} \varepsilon_t] + E[\varepsilon_t^2]

$X_{t-1}$ は $\varepsilon_t$ と無相関（過去の $X$ と今の誤差は独立）なので $E[X_{t-1}\varepsilon_t]=0$ ：

\gamma_0 = \varphi^2 \gamma_0 + \sigma^2 \;\Longrightarrow\; \gamma_0(1 - \varphi^2) = \sigma^2 \;\Longrightarrow\; \boxed{\gamma_0 = \frac{\sigma^2}{1 - \varphi^2}}

要するに「定常性の仮定自体が $1 - \varphi^2 > 0$ 、すなわち $\lvert\varphi\rvert < 1$ を要求します」。 $\lvert\varphi\rvert \ge 1$ では $\gamma_0$ が発散（または負）になり定常性が破綻します。

定常条件の特性方程式による言い換え

AR(p)の特性多項式は $\varphi(z) = 1 - \varphi_1 z - \cdots - \varphi_p z^p$ 。特性方程式 $\varphi(z)=0$ の根（特性根）がすべて単位円の外側（ $\lvert z\rvert > 1$ ）にあることが、定常性の必要十分条件です。

AR(1)の場合、特性方程式は $1 - \varphi z = 0$ 、解は $z = 1/\varphi$ 。これが単位円外というのは $\lvert 1/\varphi \rvert > 1$ 、つまり $\lvert\varphi\rvert < 1$ と同値です。

⚠️ 「特性根が単位円外」という条件は「特性根の絶対値が1より大きい」という意味。「単位円内」と書かれたら誤りです。

自己相関の導出（Yule-Walker 方程式の基礎）

$\gamma_k = E[X_t X_{t-k}]$ （ $\mu=0$ のとき）を求めます。AR(1)式の両辺に $X_{t-k}$ をかけて期待値：

E[X_t X_{t-k}] = \varphi E[X_{t-1} X_{t-k}] + E[\varepsilon_t X_{t-k}]

$k \ge 1$ なら $\varepsilon_t$ （時点 $t$ の誤差）と $X_{t-k}$ （過去の値）は無相関なので $E[\varepsilon_t X_{t-k}]=0$ ：

\gamma_k = \varphi \gamma_{k-1}

この漸化式はYule-Walker方程式の最も単純な形です。 $\gamma_0$ を初期値として解くと：

\gamma_k = \varphi^k \gamma_0

自己相関は $\rho_k = \gamma_k / \gamma_0$ なので

\boxed{\rho_k = \varphi^k}

要するに「AR(1)の自己相関はラグ $k$ の指数関数。 $\varphi > 0$ なら正の値で単調減衰、 $\varphi < 0$ なら交互符号で振動しながら減衰」。

xychart-beta
  title "AR(1)のACF比較（φ=0.7 vs φ=−0.7）"
  x-axis "ラグ k" [0, 1, 2, 3, 4, 5, 6, 7, 8]
  y-axis "自己相関 ρ_k" -1 --> 1
  bar [1, 0.7, 0.49, 0.343, 0.24, 0.168, 0.118, 0.082, 0.057]
  line [1, -0.7, 0.49, -0.343, 0.24, -0.168, 0.118, -0.082, 0.057]

（棒： $\varphi=0.7$ 、線： $\varphi=-0.7$ ）

AR(1)のACFはラグが増えるにつれてゼロに向かって徐々に減衰します（打ち切れない）。一方、PACFはラグ1のみ $\varphi$ に等しい値を持ち、ラグ2以降はゼロ（ラグ1で打ち切れる）。

4. MA(q)モデル — 移動平均モデル

4.1 定義

X_t = \mu + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \theta_2 \varepsilon_{t-2} + \cdots + \theta_q \varepsilon_{t-q}

要するに「今期の値 = 定数 + 現在の誤差 + 過去 $q$ 期の誤差の線形和」。“移動平均”は過去の誤差の加重平均です。

4.2 MA(q)の性質（導出）

$\mu=0$ として $X_t = \sum_{j=0}^{q} \theta_j \varepsilon_{t-j}$ （ $\theta_0=1$ ）。

分散（ラグ0の自己共分散）：

\gamma_0 = \mathrm{Var}(X_t) = \sum_{j=0}^{q} \theta_j^2 \sigma^2 = \sigma^2 \sum_{j=0}^{q} \theta_j^2

自己共分散（ $1 \le k \le q$ ）：

\gamma_k = E[X_t X_{t-k}] = E\!\left[\sum_{i=0}^{q}\theta_i \varepsilon_{t-i} \cdot \sum_{j=0}^{q}\theta_j \varepsilon_{t-k-j}\right] = \sigma^2 \sum_{j=0}^{q-k} \theta_j \theta_{j+k}

（ $\varepsilon$ は異なる時点で無相関なので、添字が一致する項のみ残ります。）

$k > q$ なら $\gamma_k = 0$ ：共通する添字の組が存在しないためです。

\boxed{\rho_k = 0 \quad (k > q)}

要するに「MA(q)のACFはラグ $q$ を超えるとゼロに打ち切れる」。これがMA(q)次数 $q$ の同定に使える特徴です。

4.3 MA(q)は常に定常

MA(q)は有限個のホワイトノイズの線形和なので、平均・分散・自己共分散はすべて有限かつ時間に依存しません。次数によらず MA は常に定常です。

4.4 反転可能性（Invertibility）

MA過程が「AR(∞)の形に書き換えられる」条件を反転可能性と言います。MA(q)の反転可能性は特性多項式 $\theta(z) = 1 + \theta_1 z + \cdots + \theta_q z^q$ の根がすべて単位円外にあること（AR定常条件と同じ形）。識別性のために通常は反転可能性を仮定します。

5. ARMA(p,q)モデル

AR(p)とMA(q)を組み合わせたモデルです。

X_t = c + \varphi_1 X_{t-1} + \cdots + \varphi_p X_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}

ラグ演算子で書くと $\varphi(B) X_t = c + \theta(B)\varepsilon_t$ 。

定常条件： $\varphi(z)=0$ の根がすべて単位円外（AR部分の条件）。
反転可能条件： $\theta(z)=0$ の根がすべて単位円外（MA部分の条件）。

ARMA(p,q)のACFもPACFも、どちらも**ラグが増えるにつれて指数的に減衰（打ち切れない）**します。これがARMAを他のモデルと区別する特徴です。

6. ARIMA(p,d,q)— 和分・差分・非定常への対応

6.1 和分過程と差分

AR(1)で $\varphi = 1$ のとき $X_t = X_{t-1} + \varepsilon_t$ （ランダムウォーク）。分散が時間とともに無限に発散し、非定常です。この系列は**単位根過程（I(1) 過程）**と呼ばれます。

1階差分 $\nabla X_t = X_t - X_{t-1}$ を取ると $\nabla X_t = \varepsilon_t$ （定常）になります。

一般に、 $d$ 回差分して初めて定常になる系列を** $d$ 次和分過程 $I(d)$ ** と呼びます。

\nabla^d X_t = (1-B)^d X_t \sim \text{定常 ARMA}(p,q)

6.2 ARIMA(p,d,q)の定義

\boxed{\varphi(B)(1-B)^d X_t = c + \theta(B)\varepsilon_t}

$p$ ：AR次数（自己回帰の項数）
$d$ ：差分の階数（定常化のために取る差分の回数）
$q$ ：MA次数（移動平均の項数）

要するに「差分で定常化してからARMAを当てる」というモデルです。 $d=0$ ならARMA(p,q)そのもの。

6.3 季節差分と SARIMA

季節性（周期 $s$ ）がある場合、季節差分 $\nabla_s X_t = X_t - X_{t-s}$ を加えます。これを組み込んだSARIMA(p,d,q)(P,D,Q)_s では、通常の差分と季節差分の両方で定常化します。概念として理解していれば準1級には十分です（1級ではモデル式の展開も問われる）。

7. モデル同定：ACF・PACFによる次数の決定

ACF/PACFによるARMA同定

上＝AR(1)：ACFは減衰・PACFがラグ1で切れる／下＝MA(1)：ACFがラグ1で切れPACFは減衰。この非対称性が次数同定の決め手。図は simulations/acf_pacf_doutei.py で生成。

ARIMAのモデリングはBox-Jenkinsの手順に従います。

flowchart TD
  A[原系列の観察] --> B{単位根・非定常?}
  B -- "はい" --> C["差分を取る<br/>d 回繰り返す"]
  C --> D{定常になったか?}
  D -- "いいえ" --> C
  D -- "はい" --> E[ACF と PACF を計算]
  B -- "いいえ" --> E
  E --> F{ACF の形状}
  F -- "ラグ q で打ち切れ" --> G["MA(q)候補"]
  F -- "指数的に減衰" --> I{PACF の形状}
  I -- "ラグ p で打ち切れ" --> H["AR(p)候補"]
  I -- "指数的に減衰" --> J["ARMA(p,q)候補<br/>AIC等で次数選択"]
  G --> K[残差診断：白色化を確認]
  H --> K
  J --> K
  K -- "OK" --> L["ARIMA(p,d,q)確定"]
  K -- "NG" --> E

7.1 同定の核心表

モデル	ACF（自己相関）	PACF（偏自己相関）
AR(p)	ラグが増えるにつれ徐々に減衰（打ち切れない）	ラグ p で打ち切れる
MA(q)	ラグ q で打ち切れる	ラグが増えるにつれ徐々に減衰（打ち切れない）
ARMA(p,q)	徐々に減衰（打ち切れない）	徐々に減衰（打ち切れない）

要するに「ARはPACFを見てpを決め、MAはACFを見てqを決める」。ARMAはどちらも打ち切れないので、AICなどの情報量基準で次数を選びます。

⚠️ 最頻出の誤解：「ARモデルの次数はACFで決める」「MAモデルはPACFで決める」と逆に覚えること。正しくは「AR→PACF、MA→ACF」。理由は「AR(p)は $p$ 期前までの直接影響があり、それ以上の直接相関がゼロ（PACFが $p$ で切れる）」「MA(q)は $q$ 期前の誤差まで伝わり、それ以上の自己相関がゼロ（ACFが $q$ で切れる）」。

8. Yule-Walker方程式（1級の核心）

AR(p)のパラメータ $\varphi_1, \ldots, \varphi_p$ と自己相関 $\rho_1, \ldots, \rho_p$ の間にはYule-Walker方程式が成立します。

AR(p)式の両辺に $X_{t-k}$ （ $k=1,\ldots,p$ ）をかけて期待値を取り、 $\gamma_k = \varphi_1 \gamma_{k-1} + \cdots + \varphi_p \gamma_{k-p}$ （誤差項は過去の $X$ と無相関）、両辺を $\gamma_0$ で割ると：

\rho_k = \varphi_1 \rho_{k-1} + \varphi_2 \rho_{k-2} + \cdots + \varphi_p \rho_{k-p}, \quad k = 1, 2, \ldots, p

行列形式にまとめると：

\begin{pmatrix} \rho_1 \\ \rho_2 \\ \vdots \\ \rho_p \end{pmatrix} = \begin{pmatrix} 1 & \rho_1 & \cdots & \rho_{p-1}\\ \rho_1 & 1 & \cdots & \rho_{p-2}\\ \vdots & & \ddots & \vdots\\ \rho_{p-1} & \rho_{p-2} & \cdots & 1 \end{pmatrix} \begin{pmatrix} \varphi_1 \\ \varphi_2 \\ \vdots \\ \varphi_p \end{pmatrix}

要するに「ACFのデータさえあれば、AR係数が線形方程式を解くだけで推定できる」。この推定量をYule-Walker推定量と呼びます。係数行列はToeplitz行列（各対角線上の要素が同じ）であり効率的に解けます。

AR(1)では $\rho_1 = \varphi$ （そのまま）。AR(2)では

\varphi_1 = \frac{\rho_1(1-\rho_2)}{1-\rho_1^2}, \quad \varphi_2 = \frac{\rho_2 - \rho_1^2}{1-\rho_1^2}

1級では上記の行列方程式を立てて $\varphi$ を求める計算が出題されます。

9. 単位根検定 — ADF検定の概念

$X_t$ が単位根を持つ（ $I(1)$ である）かどうかを検定するのが単位根検定です。

AR(1)モデルを変形します。 $X_t = \varphi X_{t-1} + \varepsilon_t$ から $\nabla X_t = X_t - X_{t-1} = (\varphi - 1) X_{t-1} + \varepsilon_t$ 。 $\delta = \varphi - 1$ と置くと

\nabla X_t = \delta X_{t-1} + \varepsilon_t

帰無仮説： $H_0: \delta = 0$ （単位根あり $= \varphi = 1$ ）
対立仮説： $H_1: \delta < 0$ （定常 $= \varphi < 1$ ）

通常のt検定の分布ではなくDickey-Fuller分布（非標準）が使われます。これを一般化してAR(p)に拡張したものがADF（Augmented Dickey-Fuller）検定。

\nabla X_t = \delta X_{t-1} + \sum_{j=1}^{p-1} \gamma_j \nabla X_{t-j} + \varepsilon_t

要するに「単位根検定は $\delta=0$ のt統計量を、Dickey-Fuller分布と照合する」。通常のt分布より左裾が厚いため、有意性の棄却域も通常の検定と違います。検定統計量が十分に負なら帰無仮説（単位根）を棄却し「定常」と判断します。

試験での問われ方（級ごとの差）

準1級での出題傾向

AR(1)の定常条件・平均・分散・自己相関の公式と、ACF/PACFによるモデル同定の表が中心。差分・ARIMAの枠組みと季節性の概念。

定常性の3条件の定義（平均一定・分散一定・自己共分散がラグのみに依存）を答えさせる。
AR(1)の定常条件： $\lvert\varphi\rvert < 1$ 、または特性根が単位円外であることを示す。 $\gamma_0 = \sigma^2/(1-\varphi^2)$ の計算。
AR(1)の自己相関 $\rho_k = \varphi^k$ を計算し、具体的な数値（ $\varphi=0.8$ なら $\rho_2=0.64$ など）を求める。
同定の表（上表）を使い、与えられたACF・PACFのコレログラムからモデルを特定する択一問題。
ARIMA(p,d,q)の意味（ $p,d,q$ それぞれが何を指すか）。
MA(q)は常に定常であることの理由の説明。

1級での出題傾向

Yule-Walker方程式の行列形式・AR推定量の導出・予測の理論・スペクトル密度（範囲表改訂の可能性があるため要最新確認）。

Yule-Walker方程式を導出（両辺に $X_{t-k}$ をかけて期待値を取る手順を明示）し、行列方程式を立てて $\varphi$ を求める（計算問題）。
AR(2)の Yule-Walker 推定量の計算（上式を代入して数値を求める）。
最小2乗推定・尤度推定との対比、各推定量の大標本性質（一致性・漸近正規性）。
$h$ ステップ先予測： $\hat{X}_{t+h\mid t} = E[X_{t+h}\mid X_t, X_{t-1},\ldots]$ の計算（AR(1)なら $\hat{X}_{t+h} = \varphi^h X_t$ ）。
ADF検定の検定統計量と棄却域（通常t分布との違い）。
スペクトル密度とACFのフーリエ変換による対応（Wiener-Khinchinの定理）の概念。

10. 引っかけ・頻出論点

⚠️ ARとMAのACF/PACFを逆に覚える：「ARはPACFが切れ、MAはACFが切れる」。「ACFが $p$ で切れる → MA(p)」「PACFが $q$ で切れる → AR(q)」と暗記するのが安全。語呂は「PACF = AR、ACF = MA → PA=AM（“パ”と”AM”で覚える）」。
⚠️ 定常条件の方向の混乱：「特性根が単位円外」＝ $\lvert z\rvert > 1$ 、「 $\lvert\varphi\rvert < 1$ 」の2つは同値。「 $\lvert\varphi\rvert > 1$ が定常条件」「特性根が単位円内が定常」はどちらも誤り。
⚠️ MA過程の分散にAR次数を代入：MA(q)の分散は $\sigma^2 \sum_{j=0}^{q} \theta_j^2$ 。AR(1)の $\sigma^2/(1-\varphi^2)$ と混同しないこと。
⚠️ $\rho_k$ は $\varphi^k$ だが、 $\gamma_k = \varphi^k \gamma_0$ ：自己相関係数と自己共分散は別物。 $\gamma_0$ をかけ忘れると数値問題で間違えます。
⚠️ ARIMAの $d$ と定常性： $d=1$ は「1回差分すれば定常」であり、原系列は非定常。分析は必ず差分後の定常系列に対して行う。差分前の原系列にARMAを当ててはいけない。
⚠️ 単位根検定は通常t分布ではない： $H_0$ のもとで検定統計量は非標準分布（Dickey-Fuller分布）に従う。t分布表で判定すると間違い。

よくある疑問（Q&A）

Q1. 「弱定常」と「強定常」はどう違いますか？どちらを使えばよいですか？

強定常は「任意の時点の集合 $(t_1,\ldots,t_k)$ について、 $(X_{t_1},\ldots,X_{t_k})$ の同時分布が時間シフト $\tau$ で不変」という条件で、分布全体の不変性を要求します。弱定常は平均・分散・自己共分散というモーメント（1次・2次）のみに条件を課します。実用上は弱定常が主に使われます。正規過程（任意有限次元分布が正規）では2次モーメントが分布全体を決めるので、弱定常と強定常が同値になります。試験で「定常」と言われたら、文脈がなければ弱定常を指します。

Q2. AR(1)で $\varphi = 1$ のとき（ランダムウォーク）、なぜ非定常なのですか？

$\varphi=1$ を分散の式に代入すると $\gamma_0 = \sigma^2/(1-1^2)$ が分母ゼロで発散します。直観的には $X_t = X_{t-1} + \varepsilon_t$ を繰り返し代入すると $X_t = X_0 + \sum_{s=1}^{t}\varepsilon_s$ 。分散は $\mathrm{Var}(X_t) = t\sigma^2$ で時間とともに無限に大きくなり、定常性の条件（分散一定）が破れます。

Q3. ACFのラグ $q$ で「打ち切れる」とはどういう意味ですか？目でどう判断しますか？

コレログラム（棒グラフ形式のACFプロット）を見て、**ラグ $q$ までは有意（棒が95%信頼帯の外）、ラグ $q+1$ 以降はゼロ付近（有意でない）**という状態です。統計的には $\rho_k = 0$ の検定で、目安として $\pm 1.96/\sqrt{n}$ の信頼帯が使われます。ただし現実データは理論ほど綺麗に切れないので、「ラグ数個で急激に落ちる」という傾向で判断します。

Q4. ARMA(p,q)はACFもPACFも打ち切れないとすると、どうやって次数を決めるのですか？

ARMAの場合は情報量基準（AICやBIC）で決めます。 $\mathrm{AIC} = -2\log L + 2(p+q+1)$ （ $L$ は最尤値）を $p,q$ を変えながら計算し、最小値を与える組み合わせを採用します。BIC（Bayesian Information Criterion）はペナルティが $\log n \cdot (p+q+1)$ で、サンプルサイズが大きいとより少ないパラメータを好む傾向があります。

Q5. ARIMA(0,1,0)とランダムウォークは同じですか？

はい、同じです。 $\nabla X_t = \varepsilon_t$ 、つまり $X_t = X_{t-1} + \varepsilon_t$ です。ARIMA(0,1,0)は「AR項もMA項もなく、1回差分で定常になる」モデル。株価・為替レートはしばしばこのモデルで近似されます。なお、定数項（ドリフト）を加えると $X_t = X_{t-1} + c + \varepsilon_t$ （ランダムウォーク with ドリフト）になり、線形トレンドを持ちます。

まとめ

定常性の3条件：平均一定・分散一定・自己共分散はラグのみに依存。これが崩れるときは差分で定常化する（ $d$ 回 → ARIMA）。
AR(1)の基礎： $\mu = c/(1-\varphi)$ 、 $\gamma_0 = \sigma^2/(1-\varphi^2)$ 、 $\rho_k = \varphi^k$ 。定常条件 $\lvert\varphi\rvert < 1$ （特性根が単位円外と同値）。3つすべて導出できるようにする。
モデル同定の鉄則：AR → PACFが $p$ で打ち切れ、MA → ACFが $q$ で打ち切れ、ARMA → どちらも減衰。
Yule-Walker方程式（1級）：ACFからARパラメータを求める線形方程式系。 $k=1,\ldots,p$ に対して $\rho_k = \sum_{i=1}^{p}\varphi_i \rho_{k-i}$ を行列形式で解く。
ADF単位根検定： $H_0$ が単位根（非定常）、棄却したら定常。通常t分布ではなくDickey-Fuller分布を使う。