Mímisbrunnr知恵の泉

← 意思決定分析 一覧

🎓 レベル:発展 | 重要度:A(必須)

📎 前提:ベイズ更新と意思決定完全情報の価値(EVPI) | 関連:ベイズ統計(予測分布)

要点(BLUF)

1. 不完全情報の価値をどう測るか

完全情報(EVPI, 完全情報の価値(EVPI))は理想です。現実の調査・テストは、状態を確定はせず確率を動かすだけ(ベイズ更新と意思決定)。その不完全な情報の価値が EVSI です。

考え方は EVPI と同じ「情報ありの期待利得 − 情報なし」ですが、「情報あり」の中身が変わります。完全情報は状態そのものを教えますが、標本情報は**シグナル(好感触/不感触)**を教える。だから、

  1. 各シグナルが出る確率 P(シグナル)P(\text{シグナル}) を求め、
  2. 各シグナルのもとで事後確率による最適行動の価値を計算し(ベイズ更新+後ろ向き帰納)、
  3. それをシグナルの確率で平均する。
E[標本情報あり]=sigP(sig)maxasP(ssig)f(a,s)\mathbb{E}[\text{標本情報あり}] = \sum_{\text{sig}} P(\text{sig}) \,\max_a \sum_s P(s\mid\text{sig})\, f(a,s)

2. EVSI の計算

ベイズ更新と意思決定で、好感触なら投入(EV=92)、不感触なら見送り(EV=0)と分かっています。各シグナルの確率はともに0.5でした。

import numpy as np

p_high, p_low = 0.4, 0.6
best_no_info = max(p_high*200 + p_low*(-100), 0.0)   # 情報なしの最適 = 20

# 各シグナルの確率と事後確率(03-02 の結果)
p_signal = {"好感触": 0.5, "不感触": 0.5}
post = {"好感触": {"高": 0.64, "低": 0.36},
        "不感触": {"高": 0.16, "低": 0.84}}

ev_with_sample = 0.0
for sig in ["好感触", "不感触"]:
    ev_launch = post[sig]["高"]*200 + post[sig]["低"]*(-100)
    best_sig = max(ev_launch, 0.0)                    # 投入 vs 見送り
    act = "投入" if ev_launch > 0 else "見送り"
    print(f"{sig}(P={p_signal[sig]}): 最適 {act}、価値 {best_sig:.1f}")
    ev_with_sample += p_signal[sig] * best_sig

EVSI = ev_with_sample - best_no_info
EVPI = 60.0   # 03-03 で計算済み
print(f"標本情報下の期待利得 = {ev_with_sample:.1f} 万円")
print(f"EVSI = {EVSI:.1f} 万円")
print(f"情報効率 EVSI/EVPI = {EVSI/EVPI:.3f}")

出力:

好感触(P=0.5): 最適 投入、価値 92.0
不感触(P=0.5): 最適 見送り、価値 0.0
標本情報下の期待利得 = 46.0 万円
EVSI = 26.0 万円
情報効率 EVSI/EVPI = 0.433

出力の意味:テストを使うと期待利得は 46万。情報なしの 20万 を引いて EVSI=26万。つまり、この市場テストには最大26万まで払う価値があります。EVPI(60万)の 43.3% を取れている——完全情報の半分弱の価値しかないのは、テストが不完全(好感触でも36%は低需要)だからです。テスト費用が26万より安ければ実施、高ければ見送り、という具体的な意思決定ができます。

3. なぜ 0EVSIEVPI0 \le \mathrm{EVSI} \le \mathrm{EVPI}

EVSI は2つの不等式に挟まれます。

情報効率 EVSI/EVPI[0,1]\mathrm{EVSI}/\mathrm{EVPI} \in [0, 1] は、その情報源の「鋭さ」の指標。尤度比(ベイズ更新と意思決定)が1から離れるほど効率は1に近づき、テストが無情報(尤度0.5/0.5)なら効率0です。

数式の直観的意味:情報の価値は「行動を変えた分」だけ

EVSI が生まれるのは、シグナルによって最適行動が変わるときだけです。この例では、情報なしなら常に投入でしたが、不感触のシグナルで見送りに切り替え、低需要での −100 を回避できた。EVSI の26万は、この「不感触のとき撤退できた」ことの価値に他なりません。

実際、不感触(確率0.5)で投入を回避した効果を直接計算すると、不感触下で投入なら EV=−52、見送りなら0で、差は52。これを不感触の確率0.5で重みづけると 0.5×52=260.5\times52 = 26=EVSI。情報の価値は、情報がなければ取っていた行動を、情報のおかげで変えた分の改善幅——シグナルが行動を一切変えないなら EVSI=0、という完全情報の価値(EVPI)の「max を後に回す」話の、不完全情報版です。

⚠️ よくある誤解

対応シミュレーション

本文のコードで、尤度(テスト性能)を 0.5/0.5(無情報)から 1.0/0.0(完全)へ動かすと、EVSI が0からEVPI(60万)まで連続的に上がる——情報効率が0→1に変化するのを確認できます。

関連ノート