Mímisbrunnr知恵の泉

← MLOps 一覧

🎓 第2章:データと特徴量の基盤

第2章 データと特徴量の基盤

モデルの性能の大半は、アルゴリズムよりもデータと特徴量で決まります。この章は「MLを運用・実装する」視点から、データと特徴量を本番で安定供給する基盤に集中します。データのバージョニング、特徴量変換のパイプライン化、学習と推論で同じ特徴量を一貫して出す特徴量ストア、そして最も多い本番事故である学習/推論スキューの防止——MLの燃料供給ラインを設計します。汎用のデータ基盤理論はデータエンジニアリング分野、特徴量の作り方そのものは機械学習分野へ wikilink します。

トピック一覧

  1. 学習データの管理とデータバージョニング — 標準
  2. 特徴量エンジニアリングのパイプライン化 — 標準
  3. 特徴量ストア — 発展
  4. 学習推論スキューの防止 — 標準

この章の要点

関連章

上位ハブ