🎓 Phase 5 教師なし学習(ドメイン目次)
Phase 5 教師なし学習 目次
教師あり学習(回帰・分類)が「入力 から正解ラベル への対応」を学ぶのに対し、教師なし学習はラベル を使わず、データ そのものに潜む構造を取り出す枠組みです。正解がない分、「何をもって良い構造とするか」を自分で決める(目的関数を置く)ことが核心になります。大きく3つに分かれます。
- クラスタリング:似たサンプルどうしをグループにまとめる(k-meansクラスタリング・階層的クラスタリング・混合ガウスモデルとEM)
- 次元削減:多数の特徴を、情報を保ちながら少数の軸へ圧縮する(主成分分析と次元削減・カーネルPCAと多様体学習)
- 異常検知:「正常な構造」から外れたサンプルを見つける(異常検知)
数理的な土台の多くは統計サイトの多変量解析にあります。重複は書かず、クラスター分析・主成分分析(PCA)・欠測データ・EMアルゴリズム へ wikilink で繋ぎ、ML側は ラベルなしの「学習問題」としてどう定式化し、非線形・大規模へどう一般化するか の差分に集中します。
- 前提:次元の呪い(高次元での距離の振る舞い)、距離と分散共分散の感覚(分散共分散行列・相関行列 統計)
- この後の土台:次元削減・表現学習は深層学習の表現学習へ、混合ガウスなどの潜在変数モデルは生成モデル(VAE)へ繋がります
トピック一覧
- k-meansクラスタリング(基礎)— 重心ベースの最も基本的なクラスタリング・Lloydアルゴリズム・初期値依存とk-means++
- 階層的クラスタリング(標準)— 樹形図(デンドログラム)・凝集型/分割型・連結法とウォード法
- 混合ガウスモデルとEM(発展)— 確率分布の混合による「柔らかい」クラスタリング・潜在変数・EMアルゴリズム
- 主成分分析と次元削減(標準)— 分散最大化/再構成誤差最小化による線形次元削減・固有値分解
- カーネルPCAと多様体学習(発展)— カーネル化による非線形次元削減・t-SNE/UMAPによる可視化
- 異常検知(標準)— 密度・距離・再構成誤差にもとづく外れ値の検出
関連ドメイン
- 機械学習の基礎枠組み 目次(評価・次元の呪いなどの土台)
- 最適化と学習理論 目次(k-means・EM・PCAはいずれも最適化問題として読める)
- 生成モデル 目次(混合ガウス・潜在変数モデルの発展先)
- 統計サイト:クラスター分析・主成分分析(PCA)・欠測データ・EMアルゴリズム・分散共分散行列・相関行列
- 機械学習テキスト 全体目次