Mímisbrunnr知恵の泉

← 意思決定分析 一覧

🎓 レベル:標準 | 重要度:A(必須)

📎 前提:マクシミン・マクシマックス基準ハーヴィッツ基準ミニマックスリグレット基準 | 関連:決定木と後ろ向き帰納

要点(BLUF)

1. ラプラス基準:分からないなら等確率

確率が分からないとき、「どの状態も特に起こりやすいと考える理由がない」なら、いっそ全状態を等確率 1/n1/n とみなそう——これがラプラスの理由不十分の原則(principle of insufficient reason) です。すると不確実性下の問題が、等確率のリスク下の問題に変わり、期待値で評価できます。

L(a)=1nsf(a,s)L(a) = \frac{1}{n}\sum_{s} f(a,s)

各行動の利得の単純平均(決定木と後ろ向き帰納の期待値で確率を 1/n1/n にしたもの)。最大の行動を選びます。

import numpy as np

actions = ["拡張", "維持", "縮小"]
payoff = np.array([[100, 40, -40], [60, 50, 10], [20, 25, 30]])

laplace = payoff.mean(axis=1)        # 等確率(1/3)での平均
for a, l in zip(actions, laplace):
    print(f"{a}: ラプラス平均 = {l:.2f}")
print(f"ラプラス -> {actions[int(np.argmax(laplace))]}")

出力:

拡張: ラプラス平均 = 33.33
維持: ラプラス平均 = 40.00
縮小: ラプラス平均 = 25.00
ラプラス -> 維持

出力の意味:等確率平均は拡張33.3・維持40・縮小25で、維持が最大。マクシミン系と違い、ラプラスは全状態の利得を平等に使うので、中間状態(普通)の利得も効きます。維持は好況60・普通50・不況10とどれも悪くないので平均が高い。「分からないなら全部同じ重み」という割り切りが、バランス型を選ばせます。

2. 5基準の総合比較

同じ利得表に、これまでの全基準を並べます。

import numpy as np

actions = ["拡張", "維持", "縮小"]
payoff = np.array([[100, 40, -40], [60, 50, 10], [20, 25, 30]])
row_min = payoff.min(axis=1); row_max = payoff.max(axis=1)
regret = payoff.max(axis=0) - payoff
max_regret = regret.max(axis=1)
laplace = payoff.mean(axis=1)

print("基準ごとの推奨行動:")
print(f"  マクシミン(悲観)       -> {actions[int(np.argmax(row_min))]}")
print(f"  マクシマックス(楽観)   -> {actions[int(np.argmax(row_max))]}")
print(f"  ハーヴィッツ(α=0.5)    -> {actions[int(np.argmax(0.5*row_max+0.5*row_min))]}")
print(f"  ミニマックスリグレット   -> {actions[int(np.argmin(max_regret))]}")
print(f"  ラプラス(等確率)       -> {actions[int(np.argmax(laplace))]}")

出力:

基準ごとの推奨行動:
  マクシミン(悲観)       -> 縮小
  マクシマックス(楽観)   -> 拡張
  ハーヴィッツ(α=0.5)    -> 維持
  ミニマックスリグレット   -> 維持
  ラプラス(等確率)       -> 維持

出力の意味:5基準が縮小・拡張・維持・維持・維持とばらけました。悲観のマクシミンだけ守りの縮小、楽観のマクシマックスだけ攻めの拡張、残り3つはバランスの維持。「正解」は1つに決まらない——基準の選択そのものが、意思決定者の価値観の表明です。逆に言えば、複数基準で同じ行動(維持)が推されるなら、その行動は態度に対して頑健で、説得力を持ちます。

基準何を最適化態度この例の推奨
マクシミン最悪利得の最大化悲観・守り縮小
マクシマックス最良利得の最大化楽観・攻め拡張
ハーヴィッツ最良・最悪の加重折衷(α依存)維持(α=0.5)
ミニマックスリグレット最大後悔の最小化後悔回避維持
ラプラス等確率の期待値中立・平均維持

3. ラプラス基準の論点:等確率は中立か

ラプラスの「分からないなら等確率」は便利ですが、無害ではありません。最大の問題は状態の切り方に依存すること。「好況/不況」の2状態なら各1/2、「好況/普通/不況」の3状態なら各1/3——同じ現実を何状態に分けるかで確率が変わり、結論が動きます。「等確率」は中立に見えて、実は「状態をどう定義したか」という強い仮定を含みます。

これはベイズ統計の無情報事前分布の難しさと同根です。情報がないことを「等確率」で表すのが本当に無情報なのか——変数変換で等確率が崩れる(確実性・リスク・不確実性のナイトの不確実性、曖昧性)。だからラプラス基準を使うなら、状態の切り方を変えて結論が安定するか、感度分析(重み付けと感度分析)で確かめるのが安全です。

数式の直観的意味:基準は「情報の使い方」の違い

5基準は、利得表という同じ情報から何を抽出して集約するかが違うだけです。

情報の使い方が態度を作ります。最悪だけ見れば悲観、全部平均すれば中立、後悔を見れば後悔回避。確率という決定的な情報が欠けているからこそ、「欠けた情報をどう補うか」の流儀が分かれる。確率が手に入れば、これら全部が決定木と後ろ向き帰納の期待値最大化に収束します——不確実性下の基準の乱立は、リスク下の期待効用という1点へ向かう、情報不足下の代替策の束なのです。

⚠️ よくある誤解

対応シミュレーション

本文のコードで、利得表や状態数を変えると5基準の推奨がどう分かれるかを一覧できます。状態を統合・分割してラプラスの結論が動くこと(状態定義への依存)も実験できます。

関連ノート