← 機械学習テキスト 一覧

🎓 Phase 5 教師なし学習(ドメイン目次)

Phase 5 教師なし学習 目次

教師あり学習(回帰分類)が「入力 xx から正解ラベル yy への対応」を学ぶのに対し、教師なし学習はラベル yy を使わず、データ xx そのものに潜む構造を取り出す枠組みです。正解がない分、「何をもって良い構造とするか」を自分で決める(目的関数を置く)ことが核心になります。大きく3つに分かれます。

数理的な土台の多くは統計サイトの多変量解析にあります。重複は書かず、クラスター分析主成分分析(PCA)欠測データ・EMアルゴリズム へ wikilink で繋ぎ、ML側は ラベルなしの「学習問題」としてどう定式化し、非線形・大規模へどう一般化するか の差分に集中します。

トピック一覧

  1. k-meansクラスタリング(基礎)— 重心ベースの最も基本的なクラスタリング・Lloydアルゴリズム・初期値依存とk-means++
  2. 階層的クラスタリング(標準)— 樹形図(デンドログラム)・凝集型/分割型・連結法とウォード法
  3. 混合ガウスモデルとEM(発展)— 確率分布の混合による「柔らかい」クラスタリング・潜在変数・EMアルゴリズム
  4. 主成分分析と次元削減(標準)— 分散最大化/再構成誤差最小化による線形次元削減・固有値分解
  5. カーネルPCAと多様体学習(発展)— カーネル化による非線形次元削減・t-SNE/UMAPによる可視化
  6. 異常検知(標準)— 密度・距離・再構成誤差にもとづく外れ値の検出

関連ドメイン