🎓 レベル:標準 | 重要度:A(必須)
📎 前提:局所最適と大域最適・凸性の役割 | 関連:不等式制約とKKT条件
要点(BLUF)
- 1次条件(勾配ゼロ )は局所最適の 必要条件。極小・極大・鞍点を区別しない。
- 2次条件(ヘッセ行列 の正定値性)で極小かどうかを判定する。
- 制約が付くと、勾配ゼロは KKT 条件(勾配=制約勾配の線形結合)に一般化される。これが第4章の主役。
概念 ── 「最適なら必ず成り立つ式」を探す
最適性条件とは「ここが最適解なら、必ずこの式が成り立つ」という関係。これがあれば、最適解の候補を方程式を解いて絞り込むことができる。必要条件(最適なら成り立つ)と十分条件(成り立てば最適)を区別するのが肝心。
無制約の最適性条件
1次の必要条件(停留点)
が微分可能で が局所最適なら、
これを満たす点を 停留点という。直観:どの方向に少し動かしても1次の変化がゼロ(坂がフラット)でなければ、改善できてしまう。ただし停留点には 極小・極大・鞍点の3種が混じる。
2次の条件(極小の判定)
ヘッセ行列 を使う:
- 2次の必要条件: が局所極小 (半正定値)。
- 2次の十分条件: かつ (正定値) は 狭義局所極小。
| ヘッセ | 停留点の種類 |
|---|---|
| 正定値 | 局所極小 |
| 負定値 | 局所極大 |
| 不定(正と負の固有値) | 鞍点 |
| 半定値(境界) | 判定不能(高次が必要) |
要するに:1次条件で「坂がフラットな点」を見つけ、2次条件で「お椀型か山型か鞍か」を見分ける。
制約付きへの拡張 ── KKT 条件の予告
制約があると「勾配ゼロ」では不十分。最適点が制約境界上にあると、目的を下げたい方向が制約に阻まれて打ち消される。この釣り合いを表すのが KKT(Karush–Kuhn–Tucker)条件。問題
に対し、最適点では乗数 が存在して
直観:「目的を下げる力 」が「効いている制約の壁の法線方向 」の重ね合わせとちょうど釣り合っている。詳しい導出は 等式制約とラグランジュ乗数・不等式制約とKKT条件。
凸性で必要が十分に変わる
一般には KKT は 必要条件にすぎない。だが問題が 凸( と各 が凸、 が線形)で適切な制約想定(Slater 条件など)を満たすと、KKT は十分条件にもなり、KKT 点=大域最適になる(凸最適化問題と双対理論)。これが「凸だと嬉しい」のもう一つの顔。
graph LR A["1次条件 grad f = 0"] --> B["2次条件 ヘッセの正定値性"] A --> C["制約付き: KKT条件"] C --> D["凸なら KKT は十分条件 = 大域最適"]
数式の直観的意味
なぜ「勾配=制約勾配の線形結合」なのか。無制約なら最適点で (下げる力ゼロ)。制約があると、下げる力 がまだ残っていても、それが実行可能領域の外を向いていれば動けない。「外を向く力」は効いている制約の法線 の非負結合で表せる(凸錐)。だから ()が成り立つ。相補性 は「効いていない制約()の乗数はゼロ」を意味する。乗数 は後に 影の価格(感度分析)として経済的意味を持つ。
⚠️ よくある誤解・落とし穴
- 停留点=最適ではない。鞍点・極大も を満たす。2次条件で必ず確認する。
- 端点最適を見落とさない。制約境界(端点)では でも最適があり得る。だから KKT が要る。
- KKT は無条件に十分ではない。凸性+制約想定が無いと、KKT 点が大域最適とは限らない。
- ヘッセが半定値(境界ケース)のときは2次条件で判定不能。より高次の項を見る必要がある。
関連ノート
- 前提:局所最適と大域最適・凸性の役割
- 1次条件を使う手法:無制約最適化
- 2次情報を使う手法:ニュートン法・準ニュートン法
- KKT の本体:不等式制約とKKT条件
- 章のハブ:最適化の基礎 章目次