完全ベイジアン均衡

(1)

完全ベイジアン均衡

均衡は { 戦略の組み合わせ、各プレイヤーの belief} ^で決まる。

• (逐次合理性）これまで起こったことを belief で予想し、今後のことは戦略の続きで予想したとき、各情報集合において、各プレイヤーの今後の戦略は最適

• (整合性）各プレイヤーの belief は、可能な限り、戦略の組み合わせからベイズルールを使って導いた意思決定点の確率と整合する

(2)

２人シグナリングゲーム

P1 (Sender) vs. P2 (Receiver) の展開形ゲームプレイヤー１ (Sender)：

プレイヤー２の利得に影響を及ぼす「性質」(タイプ）を持つ

プレイヤー２は事前にはこれを完全には知らない。

先に行動する（シグナルを送る）ことができる。シグナルはプレイヤー２の利得に影響しない。

(3)

プレイヤー２ (Receiver)：プレイヤー１のタイプに依存した利得関数を持っている。

プレイヤー１のシグナルだけを観察して行動する。

プレイヤー２の行動はプレイヤー１の利得に影響する。

(4)

応用例：P1 労働者（能力がタイプ）vs P2 雇用者シグナルは学歴、資格など

P1 メーカー（製品の品質がタイプ） vs P2 消費者シグナルは品質保証など

「評判を作る行動」

(5)

Beer-Quiche ゲーム

P1: 朝食に何をオーダーするかを選ぶ

P2: P1 の行動を観察した後、決闘を申し込むかどうかを

選ぶ

P1 は Strong か Weak かのどちらかであるが P2 はそれがわからない (事前確率は Strong を 0.9 とする。）

Strong とは戦いたくない

P1 はどちらのタイプであっても戦いは好まない

(6)

定式化

まず Nature が P1 のタイプを選び、P1 のみがそれを知る

µ´

¶³ N

6

?

Weak (0.1)

Strong (0.9)

(7)

次に P1 がタイプ別に行動を選ぶ

µ´

¶³ N

6

?

Weak (0.1)

Strong (0.9)

µ´

¶³

S_w Quiche-

¾ Beer

µ´

¶³

S_s Quiche’-

¾ Beer’

(8)

P2 は P1 の行動だけを区別できる

情報集合内に belief の確率を q と r としておく

これは均衡戦略とセットで決まるので、今は決められないことに注意

µ´

¶³ N

6

?

Weak (0.1)

Strong (0.9)

µ´

¶³

S_w Quiche-

¾ Beer ®

©

ª (r)

µ´

¶³

S_s Quiche’-

¾ Beer’

®

©

ª (q)

(9)

完成図

µ´

¶³ N

6

?

Weak (0.1)

Strong (0.9)

µ´

¶³

S_w Quiche-

¾ Beer ¡¡¡¡µ

@@

@@R

@@

@@ I

¡¡

¡¡ ª

®

©

ª (r)

R

Fight’

Not’

Fight’

Not’

(1, 1)

(3, 0)

(0, 0)

(2, 1) µ´

¶³

S_s Quiche’-

¾ Beer’ ¡¡¡¡µ

@@

@@R

@@

@@ I

¡¡

¡¡ ª

®

©

ª (q)

R Fight

Not

Fight

Not (0, 1)

(2, 0)

(1, 0)

(3, 1)

(10)

シグナリングゲームの戦略の集合

• Sender: タイプに依存して行動を選ぶのが戦略

Beer-Quiche のケース

{(B, B⁰), (B, Q⁰), (Q, B⁰), (Q, Q⁰)}

• Receiver: Sender の行動に依存して行動を選ぶのが戦略

Beer-Quiche のケース

{(F, F⁰), (F, N⁰), (N, F⁰), (N, N⁰)}

(11)

Belief _（信念）

Sender の戦略と事前確率がわかると

Receiver の各情報集合において、node の事後確率が計算できる。

これを信念 (Belief) と呼ぶ。

(12)

例：(B,Q’) のとき、Beer を見たら Weak を確率１、

Quiche を見たら Strong を確率１とする。

（B,B’) のとき、Beer を見たら事前確率をそのまま適用す

る。Quiche を見たら？どんな信念でもよい。

(13)

分離均衡 (Separating Equilibria)

Sender の戦略が、タイプごとに異なる行動をするもの

• (Q,B’) をする均衡はあるか？（好きなものを食べる）

Receiver の信念：q = 0, r = 1 なので Q を見たら Fight、 B を見たら Not が最適。

しかし、これでは、Weak タイプは戦略を変えたくなる

→ ^{均衡でない}

(14)

• (B,Q’) をする均衡はあるか？（反対のものを食べる）

Receiver の信念：q = 1, r = 0 なので B を見たら Fight、 Q を見たら Not が最適。

しかし、これでは、Weak タイプは戦略を変えたくなる

→ ^{均衡でない}

(15)

一括均衡 (Pooling Equilibria)

Sender はタイプによって行動を変えない均衡

• (B,B’) をする均衡は？

q = 0.1 のまま、r は何でもいいので場合分けして

Receiver の最適戦略を考える

(a) r ≥ ¹₂^：Weak である確率が高いので、Q を見たら Fight,B をみたら Not→ Weak タイプは Q には変えな

い、Strong タイプも、もちろん変えない → ^均衡！

(b) r < ¹₂：B、Q どちらを見ても Not が最適。→Weak タイプはそれなら Q に変えたくなる → ^{均衡でない}

(16)

• (Q,Q’) をする均衡？

r = 0.1、q で場合分け

(a) q ≥ ¹₂^：B を見たら Fight,Q をみたら Not。

→Strong タイプでも、B には変えない → ^均衡！

(b) q < ¹₂：B、Q どちらを見ても Not。→Strong タイプが B にしたくなる → ^{均衡でない。}

まとめて：Beer-Quiche ゲームには以下の（無数の）一括均衡だけが存在する

{(B, B⁰), (N, F⁰), q = 0.1, r ≥ ¹₂} {(Q, Q⁰), (F, N⁰), q ≥ ¹₂, r = 0.1}

(17)

完全シグナリングの不可能性

Crawford & Sobel (Econometrica, 1982) ：

sender が送るシグナルにまったくコストがかからなく

ても

分離均衡が存在するとは限らない。

逆に、一括均衡は存在する情報は完全には伝わらない

(18)

この例では、たまたま分離均衡が存在しなかったが、一般にはもちろん存在するゲームも多数ある。

例：教育モデル（スペンス）

(19)

また、この例では、複数の一括均衡が存在したが、さらに『信念の合理性』まで考えて

{(Q,Q’),(F,N’), q ≥ ¹₂, r = 0.1 } 均衡はあり得ない、という議論もある。

Cho-Kreps の Intuitive Criterion: Weak タイプは Q に

よって最大利得３を得ているので、B にするはずがない。

だから B を見たら、Strong タイプが逸脱したと考えるべきで、そうすると q ≥ ¹₂ ^{はおかしい。}

完全ベイジアン均衡