🎓 第8章:機械学習予測
第8章 機械学習予測
本テキスト最終章。これまでの章は「自己相関・分解・状態空間・分散・ベイズ」という構造を仮定して依存をモデル化してきました。本章は逆の発想——構造を仮定せず、過去から作った特徴量から次を学ぶ機械学習予測です。柱は3つ。まず ラグ特徴量と木モデル——時系列をラグ・移動統計・カレンダー特徴で教師あり回帰に変換し、勾配ブースティング等の木モデルで当てる。ウォークフォワードで素朴・季節素朴と比較し特徴量重要度を読む一方、木はトレンドを外挿できない(生値の再帰予測は訓練最大値に頭打ち)ので差分・トレンド除去で対処すること、多段予測の再帰 vs 直接の使い分けまで数値で確かめます(ラグ特徴量と木モデル)。次に 系列モデルとニューラル予測——スライディング窓を入力に次を出す発想を、本環境で動くフィードフォワードNN(MLP)で実演。線形・木とホールドアウト比較し標準化の必須性を示し、RNN/LSTM のゲートや Transformer の注意・基盤モデルは機械学習テキストへリンクします(系列モデルとニューラル予測、要最新確認)。最後に バックテストと予測の評価——ウォークフォワード(拡大窓/固定窓)・複数ホライズン・再学習・漏洩排除という設計のもと、素朴・季節素朴・SARIMA・ETS・木ML を横並び比較し、予測区間を被覆率・ピンボール損失・区間スコアで採点。最後にテキスト全8章の地図を描いて締めます(バックテストと予測の評価)。いずれも真の構造を仕込んだ擬似系列で、復元・比較・評価を検証します。
トピック一覧
- ラグ特徴量と木モデル — 標準
- 系列モデルとニューラル予測 — 標準
- バックテストと予測の評価 — 標準(テキスト全体のまとめ)
この章の要点
- ラグ特徴量と木モデル:ラグ(1,2,3,12)・移動統計(shift(1)で漏洩防止)・月の sin/cos を特徴に
GradientBoostingRegressorをウォークフォワード——1期先 RMSE 木ML vs 素朴 ・季節素朴 (季節素朴比 改善)、重要度は lag12 が と支配的。木はトレンドを外挿できない:生値の再帰予測は訓練最大値 に対し最大 で頭打ち・RMSE 、1階差分で学習し累積すると RMSE 。多段予測は で再帰( vs 直接 )、長期は直接が有利(平均 再帰 vs 直接 )。 - 系列モデルとニューラル予測:スライディング窓 を入力に MLP(フィードフォワードNN=TDNN)。非線形(しきい値AR)系列で RF ・Ridge ・MLP と三者競合(小・中規模では MLP が最良とは限らない)・MLP 区間カバレッジ 。標準化は必須:水準 100 では標準化なし MLP が RMSE で行き詰まり、標準化ありは 。RNN/LSTM のゲート・Transformer の注意・基盤モデル(TimesFM/Chronos 等)は機械学習テキストへ(要最新確認)。深層が活きるのは大規模・多系列・長期依存のとき。
- バックテストと予測の評価(テキストのまとめ):ウォークフォワード(拡大窓/固定窓)・複数ホライズン・再学習・漏洩排除の設計。トレンド+季節をホールドアウトし ETS ≒ 木ML ≒ SARIMA が三つ巴で季節素朴 ・素朴 を圧倒(勝者はデータ構造次第)。予測区間は被覆率だけでなく鋭さも——SARIMA 区間は被覆 ・幅 ・区間スコア 、幅 倍は被覆 でもピンボール ・区間スコア と悪化。全8章の地図(依存のモデル化・不確実性の出し方・未来の検証)で完結。
関連章
- 第1章 時系列の基礎 — 本章の土台。時系列CV はシャッフル禁止・ウォークフォワード・ベースライン(予測の評価指標と時系列CV)
- 第2章 ARIMA系モデル — 比較相手(自己相関で予測)。差分=I は木のトレンド除去と同じ役割(ARMA・ARIMAモデル・季節ARIMA(SARIMA))
- 第3章 指数平滑と分解 — 比較相手(分解で予測・区間)。トレンド除去は STL/ETS と地続き(ETSモデルと状態空間表現・STL分解)
- 第7章 ベイズ時系列 — Prophet のホールドアウト比較の作法(Prophet(分解+ベイズ))
機械学習サイトとの関係
- 木モデルの基礎(バギングとランダムフォレスト・勾配ブースティング・XGBoostとLightGBM)、深層系列モデル(再帰型ニューラルネットワーク・注意機構・Transformer)、特徴量設計(特徴量エンジニアリングと前処理)、評価とCV(訓練・検証・テストと交差検証・評価指標(回帰)・汎化と過学習・バイアスバリアンス分解)は機械学習テキストへ。時系列側は「特徴を時点 までで作る・木は外挿不可・時系列CV はシャッフル禁止・予測に区間を添える」という時系列固有の差分に絞ります。