← 統計検定テキスト 一覧

📊 対象級:1級 | 重要度:B(標準)

要点(BLUF)

状態空間モデルは、時系列を「見えない状態 xtx_t の時間発展」と「その状態をノイズ越しに観測した結果 yty_t」の二段構えで書く枠組みです。前者を状態方程式、後者を観測方程式と呼びます。

  状態方程式(時間発展):xt=Fxt1+vt,vtN(0,Q)観測方程式(観測の仕組み):yt=Hxt+wt,wtN(0,R)  \boxed{\; \begin{aligned} \text{状態方程式(時間発展):}&\quad x_t = F\,x_{t-1} + v_t,\qquad v_t\sim\mathcal N(0,Q)\\[2pt] \text{観測方程式(観測の仕組み):}&\quad y_t = H\,x_t + w_t,\qquad w_t\sim\mathcal N(0,R) \end{aligned} \;}

要するに「真の状態は裏で勝手に動いていて(状態方程式)、我々はそれを雑音まみれで覗いているだけ(観測方程式)」。この xtx_t潜在変数で、直接は見えません。

雑音がすべて正規分布なら線形ガウス状態空間モデルと呼び、このとき状態を逐次推定する最適アルゴリズムがカルマンフィルタです。カルマンフィルタの正体は「予測(事前分布を作る)→ 更新(観測でベイズ更新して事後分布にする)」を1ステップずつ繰り返すだけ——つまり 事前分布・事後分布・ベイズ更新多変量正規版を毎時刻やっているものです。状態空間表現はARIMAも局所水準モデルも一つの形に統一でき(時系列解析(定常性・ACF/PACF・AR・MA・ARMA・ARIMA) の手法群を包含する)、1級(統計応用)では式の意味の理解が問われます(範囲・配点は改訂されうるため要最新確認)。


1. 状態空間表現とは(状態方程式+観測方程式)

時系列モデリングの発想を一段抽象化します。観測される系列 yty_t を直接モデル化するのではなく、その背後に見えない状態 xtx_t(状態ベクトル)を想定し、

の2本に分けて書きます。線形・時不変な書き方は次の通りです(係数行列 F,HF,H は時刻に依存してもよいが、ここでは固定とします)。

xt=Fxt1+vt,vtN(0,Q)(システム雑音)yt=Hxt+wt,wtN(0,R)(観測雑音)\begin{aligned} x_t &= F\,x_{t-1} + v_t, &\quad v_t&\sim\mathcal N(0,Q)\quad(\text{システム雑音})\\ y_t &= H\,x_t + w_t, &\quad w_t&\sim\mathcal N(0,R)\quad(\text{観測雑音}) \end{aligned}

各記号の役割:

記号名前意味
xtx_t状態ベクトル見えない真の状態(潜在変数)。次元は kk
yty_t観測ベクトル実際に手に入るデータ。次元は mm
FF状態遷移行列状態が1ステップでどう動くか
HH観測行列状態を観測へ写す変換(観測されるのは状態の一部 or 一次結合)
QQシステム雑音の共分散状態発展の不確かさ
RR観測雑音の共分散観測の不確かさ(測定誤差)
vt,wtv_t,\,w_t雑音互いに独立・時間方向に独立な平均0の雑音

要するに「状態は FF で転がりながら雑音 vtv_t でブレ、それを HH 越しに雑音 wtw_t 込みで観測する」。状態 xtx_t が直接見えない以上、データ y1:ty_{1:t} から xtx_t を推し量るのが本質的な課題になります。状態の時間発展(マルコフ性)の土台は 確率過程(マルコフ連鎖・ポアソン過程) のマルコフ過程です。

1.1 なぜわざわざ潜在状態を立てるのか

利点が3つあります。

  1. 統一性:ARIMA・季節成分・トレンド・回帰を、状態ベクトルの設計だけで一つの枠組みに書ける(後述)。
  2. 逐次性:データが1点増えるたびに、過去を全部見直さず前回の結果を1ステップ更新するだけで最新の状態推定が得られる(カルマンフィルタ)。リアルタイム処理に向く。
  3. 欠測・非定常への強さ:欠測時は更新ステップを飛ばせばよく、トレンドのような非定常成分も状態として自然に扱える。

2. 線形ガウス状態空間モデル

上の式で、初期状態と全雑音が正規分布であると仮定したものが線形ガウス状態空間モデルです。

x0N(μ0,Σ0),vtN(0,Q),wtN(0,R)x_0\sim\mathcal N(\mu_0,\Sigma_0),\qquad v_t\sim\mathcal N(0,Q),\qquad w_t\sim\mathcal N(0,R)

このガウス仮定が決定的に効きます。正規分布は線形変換とベイズ更新(条件付け)に対して閉じている——線形変換しても正規、条件付き分布も正規——ので、状態に関する分布は時刻が進んでもずっと正規分布のままです(多変量正規分布 の性質)。正規分布は平均ベクトルと共分散行列だけで完全に決まるので、状態推定は「平均と共分散をどう更新するか」という有限個の量の計算に帰着します。これがカルマンフィルタが閉じた形(解析解)を持つ理由です。

雑音が正規でない・式が非線形だと、分布は正規でなくなり閉形式が壊れます。その場合は拡張カルマンフィルタ(線形近似)や粒子フィルタ(モンテカルロ近似)に進みますが、本ノートの主役は線形ガウスです(発展は 計量時系列の発展(単位根・共和分・ARCH/GARCH))。


3. カルマンフィルタ(予測→更新の逐次ベイズ推定)

カルマンフィルタは、線形ガウス状態空間モデルで「時刻 tt までの観測 y1:ty_{1:t} をすべて使ったときの状態 xtx_t の分布」(フィルタ分布 p(xty1:t)p(x_t\mid y_{1:t}))を逐次的に求めるアルゴリズムです。各時刻で2ステップを回します。

flowchart LR
  A["前時刻のフィルタ分布<br/>p(x_{t-1} &#124; y_{1:t-1})<br/>= N(状態の事後)"] --> B
  B["予測ステップ<br/>状態方程式 x_t = F x_{t-1} + v_t で1歩先へ<br/>→ 事前分布 p(x_t &#124; y_{1:t-1})"] --> C
  C{"新しい観測<br/>y_t が到着"} --> D
  D["更新ステップ<br/>観測 y_t でベイズ更新<br/>(カルマンゲイン K_t で補正)<br/>→ 事後分布 p(x_t &#124; y_{1:t})"] --> E["今時刻のフィルタ分布<br/>p(x_t &#124; y_{1:t})"]
  E -.->|次の時刻 t+1 へ| A

記号を整理します。x^ts\hat x_{t\mid s} を「時刻 ss までの観測を使った xtx_t の平均推定値」、PtsP_{t\mid s} をその共分散とします。x^tt1\hat x_{t\mid t-1}事前(観測前)、x^tt\hat x_{t\mid t}事後(観測後)です。

3.1 予測ステップ(事前分布を作る)

前時刻の事後 p(xt1y1:t1)=N(x^t1t1,Pt1t1)p(x_{t-1}\mid y_{1:t-1})=\mathcal N(\hat x_{t-1\mid t-1},\,P_{t-1\mid t-1}) を、状態方程式 xt=Fxt1+vtx_t=Fx_{t-1}+v_t で1ステップ先へ送ります。正規分布の線形変換則(平均は線形変換、共分散は F()FF(\cdot)F^\top に雑音 QQ を足す)から、

  x^tt1=Fx^t1t1,Ptt1=FPt1t1F+Q  \boxed{\; \hat x_{t\mid t-1}=F\,\hat x_{t-1\mid t-1}, \qquad P_{t\mid t-1}=F\,P_{t-1\mid t-1}\,F^\top + Q \;}

要するに「状態を FF で1歩進め、不確かさは FF で引き伸ばしたうえにシステム雑音 QQ ぶん増やす」。観測する前の予想なので、これが時刻 tt の状態に関する事前分布になります。

3.2 更新ステップ(観測でベイズ更新して事後分布へ)

新しい観測 yty_t が来たら、事前分布 N(x^tt1,Ptt1)\mathcal N(\hat x_{t\mid t-1},P_{t\mid t-1})事前、観測方程式 yt=Hxt+wty_t=Hx_t+w_t が与える尤度 p(ytxt)=N(Hxt,R)p(y_t\mid x_t)=\mathcal N(Hx_t,R)尤度として、ベイズの定理で事後分布を求めます。結果は次の更新式です。

まずイノベーション(観測の予測誤差)とカルマンゲイン KtK_t を定義します。

et=ytHx^tt1(イノベーション),St=HPtt1H+R(イノベーション共分散)e_t = y_t - H\,\hat x_{t\mid t-1}\quad(\text{イノベーション}),\qquad S_t = H\,P_{t\mid t-1}\,H^\top + R\quad(\text{イノベーション共分散})   Kt=Ptt1HSt1=Ptt1H(HPtt1H+R)1  \boxed{\;K_t = P_{t\mid t-1}\,H^\top\,S_t^{-1}=P_{t\mid t-1}\,H^\top\big(H\,P_{t\mid t-1}\,H^\top + R\big)^{-1}\;}

これを使って事後の平均と共分散を更新します。

  x^tt=x^tt1+Ktet,Ptt=(IKtH)Ptt1  \boxed{\; \hat x_{t\mid t}=\hat x_{t\mid t-1}+K_t\,e_t, \qquad P_{t\mid t}=(I-K_tH)\,P_{t\mid t-1} \;}

要するに「予測 x^tt1\hat x_{t\mid t-1} を、外れ具合 ete_t に応じて KtK_t だけ引っ張って補正する。補正したぶん不確かさ PP も減る」。これが時刻 tt事後分布=フィルタ分布で、次の時刻の予測ステップの入力になります。


4. 更新式の導出(多変量正規のベイズ更新そのもの)

カルマンゲインの式は天下りに見えますが、その正体は 「正規事前 × 正規尤度 → 正規事後」という 多変量正規分布 の条件付き分布の公式です。1級ではこの「なぜそうなるか」が問われうるので、骨子を省略せず示します。

4.1 使う補題:正規事前+線形ガウス観測の事後分布

次の補題が核心です(事前分布・事後分布・ベイズ更新 の正規-正規共役の多変量版)。

補題:状態の事前分布が xN(m,P)x\sim\mathcal N(m,P)、観測が yxN(Hx,R)y\mid x\sim\mathcal N(Hx,R) のとき、事後分布 xyx\mid y もまた正規分布で、

xy  N(m+K(yHm), (IKH)P),K=PH(HPH+R)1.x\mid y\ \sim\ \mathcal N\big(m + K(y-Hm),\ (I-KH)P\big),\qquad K = P H^\top (H P H^\top + R)^{-1}.

この mm を予測ステップの事前平均 x^tt1\hat x_{t\mid t-1}PP を事前共分散 Ptt1P_{t\mid t-1} と読み替えれば、§3.2 の更新式そのものです。つまり更新ステップ=この補題の適用です。

4.2 補題の導出(同時分布を作って条件付ける)

多変量正規分布 の「正規分布の条件付き分布は再び正規」を使います。状態 xx と観測 yy を縦に積んだベクトル \begin{psmallmatrix}x\\ y\end{psmallmatrix} の同時分布を作り、yy で条件付ければ xyx\mid y が出ます。

ステップ1:同時分布のモーメントを計算する。 xN(m,P)x\sim\mathcal N(m,P)y=Hx+wy=Hx+wwN(0,R)w\sim\mathcal N(0,R)xx と独立)から、各モーメントは

E[y]=Hm,Cov(y)=HPH+R  (=S),Cov(x,y)=E[(xm)(Hx+wHm)]=E[(xm)(xm)]H=PH.\begin{aligned} E[y] &= H m,\\ \mathrm{Cov}(y) &= H P H^\top + R \;(=S),\\ \mathrm{Cov}(x,y) &= E\big[(x-m)(Hx+w-Hm)^\top\big]=E\big[(x-m)(x-m)^\top\big]H^\top = P H^\top . \end{aligned}

よって同時分布は

(xy)N ⁣((mHm),  (PPHHPHPH+R)).\begin{pmatrix} x\\ y\end{pmatrix}\sim \mathcal N\!\left( \begin{pmatrix} m\\ Hm\end{pmatrix},\; \begin{pmatrix} P & P H^\top\\ H P & \,H P H^\top + R\,\end{pmatrix} \right).

要するに「xxyy をまとめた正規分布の平均と共分散ブロックを、観測方程式から計算しただけ」。

ステップ2:条件付き分布の公式を当てはめる。 多変量正規 \begin{psmallmatrix}x\\ y\end{psmallmatrix}\sim\mathcal N\!\left(\begin{psmallmatrix}\mu_x\\ \mu_y\end{psmallmatrix},\begin{psmallmatrix}\Sigma_{xx}&\Sigma_{xy}\\ \Sigma_{yx}&\Sigma_{yy}\end{psmallmatrix}\right) における条件付き分布の公式(多変量正規分布

xy  N(μx+ΣxyΣyy1(yμy),  ΣxxΣxyΣyy1Σyx)x\mid y\ \sim\ \mathcal N\big(\mu_x+\Sigma_{xy}\Sigma_{yy}^{-1}(y-\mu_y),\ \ \Sigma_{xx}-\Sigma_{xy}\Sigma_{yy}^{-1}\Sigma_{yx}\big)

に、ステップ1の各ブロック(μx=m, μy=Hm, Σxx=P, Σxy=PH, Σyy=HPH+R\mu_x=m,\ \mu_y=Hm,\ \Sigma_{xx}=P,\ \Sigma_{xy}=PH^\top,\ \Sigma_{yy}=HPH^\top+R)を代入します。

事後平均=m+PH(HPH+R)1=K(yHm)=m+K(yHm),事後共分散=PPH(HPH+R)1HP=PKHP=(IKH)P.\begin{aligned} \text{事後平均} &= m + \underbrace{P H^\top (H P H^\top + R)^{-1}}_{=\,K}\,(y - Hm) = m + K(y-Hm),\\ \text{事後共分散} &= P - P H^\top (H P H^\top + R)^{-1} H P = P - K H P = (I-KH)P. \end{aligned}

要するに「条件付き分布の一般公式に観測方程式のブロックを入れたら、ΣxyΣyy1\Sigma_{xy}\Sigma_{yy}^{-1} の部分がそっくりカルマンゲイン KK になった」。これで補題が示せ、更新ステップがベイズ更新の帰結であることが確定します。

4.3 イノベーションの直交性(最小分散の意味)

別の見方として、カルマンフィルタの推定量 x^tt\hat x_{t\mid t} は「y1:ty_{1:t} の線形関数の中で平均二乗誤差を最小にする推定量」(線形最小分散推定量)でもあります。導出の要はイノベーション et=ytHx^tt1e_t=y_t-H\hat x_{t\mid t-1} が過去の観測と直交すること——ete_t は「過去から予測できなかった真に新しい情報」だけを含む——で、これを使うと射影定理から同じ更新式が出ます。ガウス性を仮定すれば線形最小分散推定量が条件付き期待値 E[xty1:t]E[x_t\mid y_{1:t}] と一致するため、§4.2 のベイズ導出と§4.3 の射影導出は同じ答えになります。1級では「カルマンフィルタは線形最小分散推定」と「ガウス下では条件付き期待値(=ベイズ最適)」が一致する、という対応関係を押さえると強いです。


5. カルマンゲイン KtK_t の意味

カルマンゲインは「観測をどれだけ信用して予測を修正するか」の重み(010\sim1 の行列版)です。スカラー(1次元)で見ると直観が明快です。Ptt1=pP_{t\mid t-1}=p(予測の分散)、H=1H=1R=rR=r(観測雑音の分散)なら

Kt=pp+r.K_t=\frac{p}{p+r}.

要するに「予測の不確かさ pp と観測の不確かさ rr を秤にかけ、確かな方を重く採る加重平均の重み」。これは精度(分散の逆数)で重みづけた合成そのもので、x^tt\hat x_{t\mid t} は予測と観測を精度で加重平均した点になります(事後分散 Ptt=(1Kt)p=prp+rP_{t\mid t}=(1-K_t)p=\tfrac{pr}{p+r} は両者の精度の和の逆数)。ベイズ更新で2つの正規情報を統合するときの標準的な振る舞いです。


6. ARIMAの状態空間表現

状態空間表現の強みは、多くの時系列モデルを一つの形に書けることです。代表例として ARMA/ARIMA を状態空間に落とせます(時系列解析(定常性・ACF/PACF・AR・MA・ARMA・ARIMA) の ARIMA を統一的に扱う)。

例として AR(2)   yt=ϕ1yt1+ϕ2yt2+εt\;y_t=\phi_1 y_{t-1}+\phi_2 y_{t-2}+\varepsilon_t を考えます。状態ベクトルを x_t=\begin{psmallmatrix}y_t\\ y_{t-1}\end{psmallmatrix} と取れば、

(ytyt1)xt=(ϕ1ϕ210)F(yt1yt2)xt1+(εt0),yt=(10)Hxt.\underbrace{\begin{pmatrix}y_t\\ y_{t-1}\end{pmatrix}}_{x_t} =\underbrace{\begin{pmatrix}\phi_1 & \phi_2\\ 1 & 0\end{pmatrix}}_{F} \underbrace{\begin{pmatrix}y_{t-1}\\ y_{t-2}\end{pmatrix}}_{x_{t-1}} +\begin{pmatrix}\varepsilon_t\\ 0\end{pmatrix}, \qquad y_t=\underbrace{\begin{pmatrix}1 & 0\end{pmatrix}}_{H}x_t.

要するに「過去のラグを状態ベクトルに詰め込めば、AR の漸化式が状態方程式 xt=Fxt1+vtx_t=Fx_{t-1}+v_t の形になる」。一般の ARMA(p,qp,q) も次元を増やせば同様に書け、差分 dd 階の I(和分)は状態に和分成分を加えることで ARIMA も表現できます。こうして ARIMA を状態空間に書けば、尤度評価・欠測処理・パラメータ推定をすべてカルマンフィルタで統一的に行えます(尤度は §7 のイノベーションから組み立てる)。これが状態空間表現を経由する実務上の最大の利点です。


7. 構造時系列モデル(局所水準・ローカルトレンド)

状態空間のもう一つの使い方は、時系列を意味のある成分(水準・傾き・季節)に分解する構造時系列モデルです。代表が局所水準モデルとローカルトレンドモデルです。

7.1 局所水準モデル(ローカルレベルモデル)

カルマンフィルタ(ローカルレベル)

ノイズだらけの観測(灰)から、カルマンフィルタ(青)が背後の真の水準(緑)を逐次推定して滑らかに追従する(予測→更新の逐次ベイズ)。図は simulations/kalman_local_level.py で生成。

最も単純な構造モデル。水準 μt\mu_t(状態)がランダムウォークし、それを雑音込みで観測します。

観測方程式:yt=μt+wt,wtN(0,R)状態方程式:μt=μt1+vt,vtN(0,Q)\begin{aligned} \text{観測方程式:}&\quad y_t=\mu_t+w_t, &\quad w_t&\sim\mathcal N(0,R)\\ \text{状態方程式:}&\quad \mu_t=\mu_{t-1}+v_t, &\quad v_t&\sim\mathcal N(0,Q) \end{aligned}

要するに「真の水準 μt\mu_t はゆっくり漂い(ランダムウォーク)、観測 yty_t はそれに測定誤差が乗ったもの」。F=H=1F=H=1 の最小の状態空間モデルで、移動平均的な平滑化を確率モデルとして正当化したものと見られます。Q/RQ/R の比が「水準をどれだけ機敏に追従させるか」を決めます。

7.2 ローカルトレンドモデル(局所線形トレンドモデル)

水準 μt\mu_t に加えて傾き(トレンド) νt\nu_t も状態として持たせ、両方がランダムウォークするモデルです。

yt=μt+wt,wtN(0,R)μt=μt1+νt1+ξt,ξtN(0,Qμ)νt=νt1+ζt,ζtN(0,Qν)\begin{aligned} y_t &= \mu_t + w_t, &\quad w_t&\sim\mathcal N(0,R)\\ \mu_t &= \mu_{t-1} + \nu_{t-1} + \xi_t, &\quad \xi_t&\sim\mathcal N(0,Q_\mu)\\ \nu_t &= \nu_{t-1} + \zeta_t, &\quad \zeta_t&\sim\mathcal N(0,Q_\nu) \end{aligned}

要するに「水準は前の水準に傾きを足して進み、その傾き自体もゆっくり変化する」。状態ベクトル x_t=\begin{psmallmatrix}\mu_t\\ \nu_t\end{psmallmatrix} で書けば F=\begin{psmallmatrix}1&1\\0&1\end{psmallmatrix}H=\begin{psmallmatrix}1&0\end{psmallmatrix} の線形ガウスモデルになり、カルマンフィルタがそのまま使えます。さらに季節成分を状態に足せば季節調整モデルになり、トレンド・季節・回帰を部品の足し算で組めるのが構造時系列の柔軟さです。


8. フィルタリングと平滑化(推定の3タイプ)

状態推定は「どの時点までの観測を使って、どの時点の状態を推定するか」で3つに分かれます。ここは1級で区別を問われやすい論点です。

種類推定対象使う観測分布
予測(prediction)未来 or 現在の状態 xt+kx_{t+k}現在まで y1:ty_{1:t}p(xt+ky1:t)p(x_{t+k}\mid y_{1:t})
フィルタリング(filtering)現在の状態 xtx_t現在まで y1:ty_{1:t}p(xty1:t)p(x_t\mid y_{1:t})
平滑化(smoothing)過去の状態 xtx_t全期間 y1:Ty_{1:T}(未来も含む)p(xty1:T)p(x_t\mid y_{1:T})

要するに「フィルタ=逐次・リアルタイム、平滑化=全データを使った過去の精緻化」。時系列を後から分析する(成分分解・トレンド抽出)目的なら平滑化、オンラインで状態を追う目的ならフィルタリングを使います。


9. 引っかけ・頻出論点


試験での問われ方(1級)

1級(統計応用、とくに「理工学」「経済」分野の時系列)で、状態空間モデルは標準的な論点です(範囲・配点は改訂されうるため要最新確認)。典型的な問われ方:

前提として多変量正規分布の条件付き分布(多変量正規分布)、ベイズ更新(事前分布・事後分布・ベイズ更新)、ARIMA(時系列解析(定常性・ACF/PACF・AR・MA・ARMA・ARIMA))が使えることが要求されます。


よくある疑問(Q&A)

Q1. 状態 xtx_t と観測 yty_t は何が違うのですか? 同じ時系列に見えます。

役割がまったく違います。xtx_t真の・見えない状態(潜在変数)で、システムの中で FF に従って勝手に時間発展します。yty_tそれを雑音越しに観測した結果で、yt=Hxt+wty_t=Hx_t+w_t と「状態の一次変換+測定誤差」になっています。手に入るのは yty_t だけで、xtx_t は推定するしかない——この「見えないものを観測から推し量る」構造が状態空間モデルの本質です。例えば xtx_t=真の景気、yty_t=雑音まみれの景気指標、と考えると分かりやすいです。

Q2. カルマンフィルタの更新式(特にカルマンゲイン)は暗記するしかないのですか?

暗記不要です。更新ステップは「正規事前 N(m,P)\mathcal N(m,P) × 正規尤度 yxN(Hx,R)y\mid x\sim\mathcal N(Hx,R) → 正規事後」というベイズ更新そのもので、多変量正規の条件付き分布の公式 μxy=μx+ΣxyΣyy1(yμy)\mu_{x\mid y}=\mu_x+\Sigma_{xy}\Sigma_{yy}^{-1}(y-\mu_y) に観測方程式のブロックを代入すると、ΣxyΣyy1=PH(HPH+R)1\Sigma_{xy}\Sigma_{yy}^{-1}=PH^\top(HPH^\top+R)^{-1} がそのままカルマンゲイン KK として出てきます(§4.2)。導出の流れさえ押さえれば、式は再構成できます。

Q3. フィルタリングと平滑化、どちらが「良い」推定なのですか?

目的次第ですが、精度(分散の小ささ)では平滑化が必ず勝ちます。平滑化は未来も含む全データ y1:Ty_{1:T} を使って過去の状態を推定し直すので、現在までしか使わないフィルタリングより情報が多く、分散が小さくなります。ただし平滑化は全データが揃ってから後ろ向きに計算するため、リアルタイムには使えません。オンラインで「今」を追うならフィルタリング、後から腰を据えて時系列を分解・分析するなら平滑化、という使い分けです。

Q4. なぜガウス(正規分布)の仮定がそんなに重要なのですか?

正規分布が線形変換とベイズ更新(条件付け)に対して閉じているからです。状態を FF で線形変換しても正規、観測でベイズ更新しても(条件付き分布も)正規——だから状態に関する分布は時刻が進んでも正規のまま保たれます。正規分布は平均と共分散だけで完全に決まるので、無限次元の関数(確率分布)の更新が、有限個の数(平均ベクトルと共分散行列)の更新に圧縮できます。これがカルマンフィルタが閉じた解析解を持つ理由です。非ガウスだと分布が複雑化し、この圧縮が効きません。

Q5. ARIMAで足りるのに、わざわざ状態空間で書く意味は?

統一性と汎用性です。状態空間に書けば、ARIMA・トレンド・季節・回帰・欠測を一つの枠組みとカルマンフィルタという単一のエンジンで扱えます。具体的な利点として、(1) 欠測があってもその時刻の更新ステップを飛ばすだけで自然に対応でき、(2) 尤度をイノベーションから組み立てて最尤推定でき、(3) トレンドや季節のような非定常成分を状態として直接モデル化できます。ARIMA単体では面倒な「欠測・成分分解・時変パラメータ」が、状態ベクトルの設計だけで統一的に書けるのが状態空間表現の強みです。

Q6. カルマンゲインが「大きい」とは、結局どういう状況ですか?

観測を信用して、予測を大きく修正する」状況です。Kt=PH(HPH+R)1K_t=PH^\top(HPH^\top+R)^{-1} なので、観測雑音 RR が小さい(観測が正確)か、予測の不確かさ PP が大きい(予測が当てにならない)ときに KtK_t は大きくなります。スカラーなら Kt=p/(p+r)K_t=p/(p+r) で、r0r\to0 なら Kt1K_t\to1(観測をほぼ丸ごと採用)、rr\to\infty なら Kt0K_t\to0(観測を無視して予測を維持)。要は予測と観測の確からしさを秤にかけた重みで、確かな方を重く採ります。


まとめ


関連ノート