Mímisbrunnr知恵の泉

← 意思決定分析 一覧

🎓 レベル:基礎 | 重要度:A(必須)

📎 前提:意思決定問題の構造(行動・状態・結果・利得表)確実性・リスク・不確実性 | 関連:完全情報の価値(EVPI)逐次意思決定と動的計画

要点(BLUF)

1. 決定木の構成要素

決定木は3種類の部品でできています。

新製品を投入するかの判断を木にします。投入すれば需要次第で +200 か −100、見送れば 0。

flowchart LR
    D["□ 決定<br/>投入する?"] -->|投入| C["○ 需要"]
    D -->|見送り| S["利得 0"]
    C -->|"高需要 (0.4)"| H["利得 +200"]
    C -->|"低需要 (0.6)"| L["利得 -100"]

左から右に時間が流れ、まず自分が決め(□)、次に自然が需要を決める(○)。この向きで描いておくと、評価は逆向き(右から左)に畳み込みます。

2. 後ろ向き帰納:末端から畳み込む

評価は末端から根へ進めます。ルールは2つだけ。

なぜ後ろからか。先(未来)の最適行動が決まらないと、手前(現在)の枝の価値が評価できないからです。未来から確定させて現在へ戻る——これは逐次意思決定と動的計画の動的計画と同じ発想です。

import numpy as np

# 事前確率
p_high, p_low = 0.4, 0.6

# 偶然ノード(投入後の需要)の期待値
EV_launch = p_high*200 + p_low*(-100)
# 見送りは確実に 0
EV_skip = 0.0

print(f"○ 偶然ノード EV(投入) = {EV_launch:.1f} 万円")
print(f"  EV(見送り)         = {EV_skip:.1f} 万円")

# 決定ノード:最大化
value = max(EV_launch, EV_skip)
best = "投入" if EV_launch > EV_skip else "見送り"
print(f"□ 決定ノードの値 = max = {value:.1f} 万円 -> 最適行動:{best}")

出力:

○ 偶然ノード EV(投入) = 20.0 万円
  EV(見送り)         = 0.0 万円
□ 決定ノードの値 = max = 20.0 万円 -> 最適行動:投入

出力の意味:偶然ノードで投入の期待値は 0.4×200+0.6×(100)=200.4\times200 + 0.6\times(-100) = 20。見送りは 0。決定ノードでは大きい方(20)を取り、最適行動は投入、決定の価値は20万と確定します。木全体が「20万・投入」という1つの値と方針に畳み込まれました。この「決定の価値20」が、第3章でこのあと情報の価値を測るときの基準(情報なしのベースライン)になります。

3. 利得表との対応:時間軸への展開

決定木は意思決定問題の構造(行動・状態・結果・利得表)の利得表と同じ情報を持ちますが、時間の流れと情報の到着順を明示できる点が違います。

この「流れ」が効くのは、途中で情報が入る場合です。市場テストをしてから投入を決める、という2段階の判断は、決定木なら自然に表せます(ベイズ更新と意思決定で、テスト結果による枝分かれを足します)。利得表のままでは、この「情報の到着」を描けません。

数式の直観的意味:なぜ max と E が交互か

後ろ向き帰納の値は、ノードの種類に応じて

V(決定ノード)=maxaV(a),V(偶然ノード)=sp(s)V(s)V(\text{決定ノード}) = \max_{a} V(\text{子}_a), \qquad V(\text{偶然ノード}) = \sum_{s} p(s)\, V(\text{子}_s)

を交互に適用したものです。max\max は「自分の自由(最良を選べる)」、E\mathbb{E} は「自然への従属(確率に従うしかない)」 を表します。コントロールできる軸では最大化し、できない軸では平均する——意思決定問題の構造(行動・状態・結果・利得表)で分けた「動かせる軸/動かせない軸」が、そのまま演算の違いになっています。この max\maxE\mathbb{E} の交替が、第7章の逐次意思決定と動的計画ではベルマン方程式 V(s)=maxaE[r+V(s)]V(s)=\max_a \mathbb{E}[r + V(s')] という1本の式に統合されます。

⚠️ よくある誤解

対応シミュレーション

本文のコードがそのまま最小の後ろ向き帰納です。利得や確率を変えると最適行動が切り替わる閾値(例:高需要確率が何%を割ると見送りになるか)を探れます。

関連ノート