🎓 第8章：機械学習予測

第8章機械学習予測

本テキスト最終章。これまでの章は「自己相関・分解・状態空間・分散・ベイズ」という構造を仮定して依存をモデル化してきました。本章は逆の発想——構造を仮定せず、過去から作った特徴量から次を学ぶ機械学習予測です。柱は3つ。まず ラグ特徴量と木モデル——時系列をラグ・移動統計・カレンダー特徴で教師あり回帰に変換し、勾配ブースティング等の木モデルで当てる。ウォークフォワードで素朴・季節素朴と比較し特徴量重要度を読む一方、木はトレンドを外挿できない（生値の再帰予測は訓練最大値に頭打ち）ので差分・トレンド除去で対処すること、多段予測の再帰 vs 直接の使い分けまで数値で確かめます（ラグ特徴量と木モデル）。次に 系列モデルとニューラル予測——スライディング窓を入力に次を出す発想を、本環境で動くフィードフォワードNN（MLP）で実演。線形・木とホールドアウト比較し標準化の必須性を示し、RNN/LSTM のゲートや Transformer の注意・基盤モデルは機械学習テキストへリンクします（系列モデルとニューラル予測、要最新確認）。最後に バックテストと予測の評価——ウォークフォワード（拡大窓/固定窓）・複数ホライズン・再学習・漏洩排除という設計のもと、素朴・季節素朴・SARIMA・ETS・木ML を横並び比較し、予測区間を被覆率・ピンボール損失・区間スコアで採点。最後にテキスト全8章の地図を描いて締めます（バックテストと予測の評価）。いずれも真の構造を仕込んだ擬似系列で、復元・比較・評価を検証します。

トピック一覧

ラグ特徴量と木モデル — 標準
系列モデルとニューラル予測 — 標準
バックテストと予測の評価 — 標準（テキスト全体のまとめ）

この章の要点

ラグ特徴量と木モデル：ラグ（1,2,3,12）・移動統計（shift(1)で漏洩防止）・月の sin/cos を特徴に GradientBoostingRegressor をウォークフォワード——1期先 RMSE 木ML $1.802$ vs 素朴 $3.282$ ・季節素朴 $2.201$ （季節素朴比 $18.1\%$ 改善）、重要度は lag12 が $0.878$ と支配的。木はトレンドを外挿できない：生値の再帰予測は訓練最大値 $77.1$ に対し最大 $72.4$ で頭打ち・RMSE $22.40$ 、1階差分で学習し累積すると RMSE $2.42$ 。多段予測は $h=1$ で再帰（ $1.042$ vs 直接 $1.150$ ）、長期は直接が有利（平均再帰 $1.217$ vs 直接 $1.161$ ）。
系列モデルとニューラル予測：スライディング窓 $W=12$ を入力に MLP（フィードフォワードNN＝TDNN）。非線形（しきい値AR）系列で RF $0.629$ ・Ridge $0.650$ ・MLP $0.693$ と三者競合（小・中規模では MLP が最良とは限らない）・MLP 区間カバレッジ $95/100$ 。標準化は必須：水準 100 では標準化なし MLP が RMSE $3.939$ で行き詰まり、標準化ありは $0.746$ 。RNN/LSTM のゲート・Transformer の注意・基盤モデル（TimesFM/Chronos 等）は機械学習テキストへ（要最新確認）。深層が活きるのは大規模・多系列・長期依存のとき。
バックテストと予測の評価（テキストのまとめ）：ウォークフォワード（拡大窓/固定窓）・複数ホライズン・再学習・漏洩排除の設計。トレンド+季節をホールドアウトし ETS $1.437$ ≒ 木ML $1.458$ ≒ SARIMA $1.472$ が三つ巴で季節素朴 $3.244$ ・素朴 $6.555$ を圧倒（勝者はデータ構造次第）。予測区間は被覆率だけでなく鋭さも——SARIMA $95\%$ 区間は被覆 $96\%$ ・幅 $5.55$ ・区間スコア $6.463$ 、幅 $1.8$ 倍は被覆 $100\%$ でもピンボール $0.250$ ・区間スコア $9.981$ と悪化。全8章の地図（依存のモデル化・不確実性の出し方・未来の検証）で完結。

機械学習サイトとの関係

木モデルの基礎（バギングとランダムフォレスト・勾配ブースティング・XGBoostとLightGBM）、深層系列モデル（再帰型ニューラルネットワーク・注意機構・Transformer）、特徴量設計（特徴量エンジニアリングと前処理）、評価とCV（訓練・検証・テストと交差検証・評価指標（回帰）・汎化と過学習・バイアスバリアンス分解）は機械学習テキストへ。時系列側は「特徴を時点 $t$ までで作る・木は外挿不可・時系列CV はシャッフル禁止・予測に区間を添える」という時系列固有の差分に絞ります。

上位ハブ

時系列分析・予測テキスト全体目次

第8章 機械学習予測

トピック一覧

この章の要点

関連章

機械学習サイトとの関係

上位ハブ

第8章機械学習予測