完全ベイジアン均衡
均衡は { 戦略の組み合わせ、各プレイヤーの belief} で決 まる。
• (逐次合理性)これまで起こったことを belief で予想 し、今後のことは戦略の続きで予想したとき、各情報 集合において、各プレイヤーの今後の戦略は最適
• (整合性)各プレイヤーの belief は、可能な限り、戦略 の組み合わせからベイズルールを使って導いた意思決 定点の確率と整合する
2人シグナリングゲーム
P1 (Sender) vs. P2 (Receiver) の展開形ゲーム プレイヤー1 (Sender):
プレイヤー2の利得に影響を及ぼす「性質」(タイプ)を 持つ
プレイヤー2は事前にはこれを完全には知らない。
先に行動する(シグナルを送る)ことができる。シグナ ルはプレイヤー2の利得に 影響しない。
プレイヤー2 (Receiver):プレイヤー1のタイプに依存し た利得関数を持っている。
プレイヤー1のシグナルだけを観察して行動する。
プレイヤー2の行動はプレイヤー1の利得に影響する。
応用例:P1 労働者(能力がタイプ)vs P2 雇用者 シグナルは学歴、資格など
P1 メーカー(製品の品質がタイプ) vs P2 消費者 シグナルは品質保証など
「評判を作る行動」
Beer-Quiche ゲーム
P1: 朝食に何をオーダーするかを選ぶ
P2: P1 の行動を観察した後、決闘を申し込むかどうかを
選ぶ
P1 は Strong か Weak かのどちらかであるが P2 はそれが わからない (事前確率は Strong を 0.9 とする。)
Strong とは戦いたくない
P1 はどちらのタイプであっても戦いは好まない
定式化
まず Nature が P1 のタイプを選び、P1 のみがそれを知る
µ´
¶³ N
6
?
Weak (0.1)
Strong (0.9)
次に P1 がタイプ別に行動を選ぶ
µ´
¶³ N
6
?
Weak (0.1)
Strong (0.9)
µ´
¶³
Sw Quiche-
¾ Beer
µ´
¶³
Ss Quiche’-
¾ Beer’
P2 は P1 の行動だけを区別できる
情報集合内に belief の確率を q と r としておく
これは均衡戦略とセットで決まるので、今は決められないことに注意
µ´
¶³ N
6
?
Weak (0.1)
Strong (0.9)
µ´
¶³
Sw Quiche-
¾ Beer ®
©
ª (r)
µ´
¶³
Ss Quiche’-
¾ Beer’
®
©
ª (q)
完成図
µ´
¶³ N
6
?
Weak (0.1)
Strong (0.9)
µ´
¶³
Sw Quiche-
¾ Beer ¡¡¡¡µ
@@
@@R
@@
@@ I
¡¡
¡¡ ª
®
©
ª (r)
R
Fight’
Not’
Fight’
Not’
(1, 1)
(3, 0)
(0, 0)
(2, 1) µ´
¶³
Ss Quiche’-
¾ Beer’ ¡¡¡¡µ
@@
@@R
@@
@@ I
¡¡
¡¡ ª
®
©
ª (q)
R Fight
Not
Fight
Not (0, 1)
(2, 0)
(1, 0)
(3, 1)
シグナリングゲームの戦略の 集合
• Sender: タイプに依存して行動を選ぶのが戦略
Beer-Quiche のケース
{(B, B0), (B, Q0), (Q, B0), (Q, Q0)}
• Receiver: Sender の行動に依存して行動を選ぶのが 戦略
Beer-Quiche のケース
{(F, F0), (F, N0), (N, F0), (N, N0)}
Belief (信念)
Sender の戦略と事前確率がわかると
Receiver の各情報集合において、node の事後確率が計算 できる。
これを信念 (Belief) と呼ぶ。
例:(B,Q’) のとき、Beer を見たら Weak を確率1、
Quiche を見たら Strong を確率1とする。
(B,B’) のとき、Beer を見たら事前確率をそのまま適用す
る。Quiche を見たら?どんな信念でもよい。
分離均衡 (Separating Equilibria)
Sender の戦略が、タイプごとに異なる行動をするもの
• (Q,B’) をする均衡はあるか?(好きなものを食べる)
Receiver の信念:q = 0, r = 1 なので Q を見たら Fight、 B を見たら Not が最適。
しかし、これでは、Weak タイプは戦略を変えたくなる
→ 均衡でない
• (B,Q’) をする均衡はあるか?(反対のものを食べる)
Receiver の信念:q = 1, r = 0 なので B を見たら Fight、 Q を見たら Not が最適。
しかし、これでは、Weak タイプは戦略を変えたくなる
→ 均衡でない
一括均衡 (Pooling Equilibria)
Sender はタイプによって行動を変えない均衡
• (B,B’) をする均衡は?
q = 0.1 のまま、r は何でもいいので場合分けして
Receiver の最適戦略を考える
(a) r ≥ 12:Weak である確率が高いので、Q を見たら Fight,B をみたら Not→ Weak タイプは Q には変えな
い、Strong タイプも、もちろん変えない → 均衡!
(b) r < 12:B、Q どちらを見ても Not が最適。→Weak タイプはそれなら Q に変えたくなる → 均衡でない
• (Q,Q’) をする均衡?
r = 0.1、q で場合分け
(a) q ≥ 12:B を見たら Fight,Q をみたら Not。
→Strong タイプでも、B には変えない → 均衡!
(b) q < 12:B、Q どちらを見ても Not。→Strong タイ プが B にしたくなる → 均衡でない。
まとめて:Beer-Quiche ゲームには以下の(無数の)一括 均衡だけが存在する
{(B, B0), (N, F0), q = 0.1, r ≥ 12} {(Q, Q0), (F, N0), q ≥ 12, r = 0.1}
完全シグナリングの不可能性
Crawford & Sobel (Econometrica, 1982) :
sender が送るシグナルにまったくコストがかからなく
ても
分離均衡が存在するとは限らない。
逆に、一括均衡は存在する 情報は完全には伝わらない
この例では、たまたま分離均衡が存在しなかったが、一 般にはもちろん存在するゲームも多数ある。
例:教育モデル(スペンス)
また、この例では、複数の一括均衡が存在したが、さら に『信念の合理性』まで考えて
{(Q,Q’),(F,N’), q ≥ 12, r = 0.1 } 均衡はあり得ない、とい う議論もある。
Cho-Kreps の Intuitive Criterion: Weak タイプは Q に
よって最大利得3を得ているので、B にするはずがない。
だから B を見たら、Strong タイプが逸脱したと考えるべ きで、そうすると q ≥ 12 はおかしい。