マクシミン・マクシマックス基準

← 意思決定分析一覧

🎓 レベル：基礎　|　重要度：A（必須）

📎 前提：確実性・リスク・不確実性・意思決定問題の構造（行動・状態・結果・利得表）　|　関連：ハーヴィッツ基準

要点（BLUF）

状態の確率が分からないとき、マクシミン基準は各行動の最悪利得を最大化します（悲観的・最悪に備える）。
マクシマックス基準は各行動の最良利得を最大化します（楽観的・最良を狙う）。
両者は意思決定態度の両極端。マクシミンは「起こりうる最悪を最善に」、マクシマックスは「夢を最大に」。間を埋めるのがハーヴィッツ基準です。

1. 確率がないときの素朴な2つの態度

確率が分からない（確実性・リスク・不確実性の不確実性下）と、期待値が計算できません。利得表の各行から取り出せる情報は、せいぜい最悪値と最良値。ここから2つの正反対の態度が生まれます。

悲観的：「どうせ最悪の状態が来る」と身構え、その最悪をできるだけマシにする → マクシミン
楽観的：「うまくいけば最高」と夢を見て、最良の可能性が一番大きい行動を取る → マクシマックス

利益（大きいほど良い）の利得表で定義します。

\text{マクシミン}:\ \max_{a}\ \min_{s} f(a,s), \qquad \text{マクシマックス}:\ \max_{a}\ \max_{s} f(a,s)

マクシミンは「min を取ってから max」、マクシマックスは「max を取ってから max」。内側の min/max が態度（悲観/楽観）、外側の max が行動選択です。

2. 計算してみる

確率不明の投資判断（拡張／維持／縮小、状態は好況／普通／不況）で両基準を適用します。

import numpy as np

actions = ["拡張", "維持", "縮小"]
payoff = np.array([
    [100,  40, -40],   # 拡張
    [ 60,  50,  10],   # 維持
    [ 20,  25,  30],   # 縮小
])

row_min = payoff.min(axis=1)   # 各行動の最悪利得
row_max = payoff.max(axis=1)   # 各行動の最良利得
for a, mn, mx in zip(actions, row_min, row_max):
    print(f"{a}: 最悪={mn:4d}  最良={mx:4d}")

print(f"マクシミン（悲観）   -> {actions[int(np.argmax(row_min))]}（最悪を最大化 {row_min.max()}）")
print(f"マクシマックス（楽観）-> {actions[int(np.argmax(row_max))]}（最良を最大化 {row_max.max()}）")

出力：

拡張: 最悪= -40  最良= 100
維持: 最悪=  10  最良=  60
縮小: 最悪=  20  最良=  30
マクシミン（悲観）   -> 縮小（最悪を最大化 20）
マクシマックス（楽観）-> 拡張（最良を最大化 100）

出力の意味：マクシミンは縮小を選びます。各行動の最悪（拡張−40・維持10・縮小20）のうち、いちばんマシなのが縮小の20だから。「最悪でも+20」を保証する守りの選択です。一方マクシマックスは拡張。最良（拡張100・維持60・縮小30）でいちばん大きいのが拡張の100だから。「当たれば+100」を狙う攻めの選択。同じ利得表で、悲観と楽観が正反対の結論——確率がないと、態度がそのまま結論を決めます。

3. それぞれが映す態度と適用場面

マクシミン（Wald 基準）：最悪を直視する保守的な基準。破滅的損失が許されない場面（事業の存続がかかる、安全に関わる）で妥当。「起こりうる最悪に耐えられる選択肢だけを残す」発想は、リスク管理の整合的リスク測度の公理の最悪期待損失（最悪シナリオを考える）と親戚です。
マクシマックス：最良だけを見る攻撃的な基準。下方リスクを取れる・失敗のコストが低い場面（小さな賭けを数多く打つ、アップサイドが青天井）に向く。ただし最悪を完全に無視するので、破滅シナリオがある問題では危険です。

両基準の弱点は共通して1つの状態（最悪 or 最良）しか見ないこと。他の状態の利得をまったく使いません。拡張の「普通なら40」も縮小の「不況でも30」も評価に入らない。この情報の捨てすぎを緩めるのが、最悪と最良を混ぜるハーヴィッツ基準、全状態を平均するラプラス基準・基準の比較、後悔に注目するミニマックスリグレット基準です。

数式の直観的意味：min/max の順序が態度を作る

$\max_a \min_s$ と $\max_a \max_s$ は、内側の演算だけが違います。 $\min_s$ は「自然が敵で、自分にとって最悪の状態を選んでくる」と想定する——ゲーム理論で言えば、自然を敵対的プレイヤーと見なす保守的な仮定です（ただし相手は戦略的に動かないので、これは過度に悲観的とも言える）。 $\max_s$ は逆に「自然が味方で最良を選んでくれる」という楽観。現実の自然はどちらでもなく確率的に振る舞うので、両者は両極端。確率が分かればこの min/max は期待値 $\mathbb{E}_s$ に置き換わり、決定木と後ろ向き帰納の偶然ノードになります。マクシミン・マクシマックスは、確率という情報を失ったときに、それを「最悪/最良の決め打ち」で代用した姿だと見ると、リスク下の意思決定との連続性が見えます。

⚠️ よくある誤解

「マクシミンは常に安全で正しい」ではない：最悪だけを見るので、わずかな最悪値の差のために大きなアップサイドを捨てることがあります。破滅リスクがない問題では保守的すぎます。
「利益とコストで同じ式」ではない：コスト（小さいほど良い）表ではマクシミンは「最大コストを最小化」（ミニマックス）になります。利益かコストかで min/max が入れ替わるので注意。
「最悪/最良以外の情報は不要」ではない：両基準は1状態しか使わず、分布の形を無視します。中間状態の利得が効く問題では情報を捨てすぎています。
「楽観＝マクシマックスが積極経営」と単純化しない：マクシマックスは最悪を無視するだけで、期待値を最大化しているわけではありません。破滅シナリオがあれば無謀になります。

対応シミュレーション

本文のコードで、利得表を変えるとマクシミン・マクシマックスの結論が動きます。ある行動の最悪値だけをわずかに上げると、他の状態の利得は変わらないのにマクシミンの結論が切り替わる——1状態しか見ない基準の脆さを観察できます。