🎓 第4章:デプロイとサービング
第4章 デプロイとサービング
レジストリの Production モデル(モデルレジストリとモデルのライフサイクル)を、実際に予測を返す形にするのがこの章です。用途に応じたデプロイパターン(バッチ/オンライン/ストリーミング)を選び、低遅延 API としてモデルを公開し、新モデルを安全に切り替える(シャドー/カナリア/A-Bテスト)。そしてモデルと依存をコンテナに固めて「どこでも同じに動く」状態にします。汎用のコンテナ/オーケストレーション基盤はクラウド分野へ、A/Bテストの統計的評価は因果推論分野へ wikilink します。
トピック一覧
- デプロイパターン(バッチ・オンライン・ストリーミング) — 標準
- オンライン推論サービング — 標準
- リリース戦略(シャドー・カナリア・A-Bテスト) — 発展
- モデルのパッケージングとコンテナ化 — 標準
この章の要点
- デプロイパターン:バッチ(定期一括)/オンライン(リクエスト毎・低遅延)/ストリーミング(イベント駆動)を要件で使い分ける。
- オンラインサービング:モデルを REST/gRPC API として公開。遅延・スループット・スケールを設計する。
- リリース戦略:シャドー(影で並走)→カナリア(少数に先行)→A-Bテスト(効果測定)で、本番影響を抑えて安全に切り替える。
- パッケージング:モデル+変換器+依存をコンテナイメージに固め、環境差をなくす。
関連章
- 第3章 実験管理とモデル管理 — モデルレジストリとモデルのライフサイクル(配信元)
- 第5章 推論の最適化 — サービングの性能を詰める
- 第6章 監視と継続的学習 — デプロイ後の監視
- クラウド:クラウド・インフラ/SRE・DevOps 全体目次(汎用コンテナ基盤)
- 因果推論:A/Bテストの効果測定