• Tidak ada hasil yang ditemukan

2015年度 ゲームの理論 a 演習第3回解答

N/A
N/A
Protected

Academic year: 2024

Membagikan "2015年度 ゲームの理論 a 演習第3回解答"

Copied!
2
0
0

Teks penuh

(1)

2015 年度 ゲームの理論 a 演習第 3 回解答

グレーヴァ香子

1. これは授業でちょっと説明したがちゃんと分析しなかった「最後通牒ゲーム」(Ultimatum Games)の一つである。

(a) 兄は先手で情報集合は1つしかない。ゆえに、純戦略の集合は選べる行動の集合と同 じで、S1= [0,1]とかS1 ={x∈R|0≦x≦1}とか、0と1の間の全ての実数である ことがわかればよい。

弟の純戦略の集合を考えるのには、情報集合が兄の提案一つ一つに対応して無限個存 在するのがポイント。ゆえに、S2={s|s: [0,1]→ { Yes, No}}のように、兄の提案 の関数で、値はYes, Noの2つのどちらかになるもの全体。

(b) 兄の提案が、弟が0.2より多くもらえるもの(すなわちx <0.8)だったら問題なくYes である。ちょうどx= 0.8の部分ゲームで、弟はYes, Noどちらも最適なので、以下の 2通りの最適戦略BR2(·)とBR2(·)がある。

BR2(x) = {

Yes if x≦0.8 No if x >0.8.

BR2(x) = {

Yes if x <0.8 No if x≧0.8.

(c) 弟が上のどちらかの最適戦略をしているときに、兄の最適戦略を考える。兄はxを大 きくすればするほど利得が高まるが、BR2 だと0.8より下の範囲では最大値が存在し ない。したがって、弟がBR2を取っているときだけ均衡があり、兄はx= 0.8が最適 戦略である。

ゆえに、このゲームにはただ一つの純戦略による後ろ向きの帰納法の解(あるいは部 分ゲーム完全均衡)があり、それは(0.8, BR2(·))というものである。

(0.8,0.2)が均衡と書いたら減点。これは均衡経路あるいは均衡利得の組み合わせである。

(おまけ:均衡でもらえる兄の利得は弟がNoのとき最低限もらえる利得に依存する。

これがはっきりするようにNoの後の利得を異なるものにしたのである。また、よくや る最後通牒ゲームだとNoの後2人とも0をもらうという最悪の想定になっている。) 2. (a) (B,b)と(C,c)。

(b) 各プレイヤーの情報集合は1期目は1つ(同時だから)、2期目は前期の9通りの行動の 組み合わせのどれかが観察されるので、9つそれぞれが別々な情報集合であり相手の行 動はわからないからそれだけ。ゆえにこれら10の情報集合について行動を{A, B, C}

あるいは{a, b, c}の中から選ぶ関数となる。10の情報集合それぞれについて何をする

かという関数の集合を書く、という手もあるが、たとえばaitをプレイヤーit期目 の行動計画とすると少し簡単に書けて

S1={(a11, a12)|a11∈ {A, B, C}, a12 :{A, B, C} × {a, b, c} → {A, B, C}}

S2={(a21, a22)|a21∈ {a, b, c}, a22:{A, B, C} × {a, b, c} → {a, b, c}}.

1

(2)

(c) アメとムチを使う。

P1はa11=A,1期目の行動の組み合わせをh∈ {A, B, C} × {a, b, c}と書くと

a12(h) = {

B if h= (A, a) C otherwise.

P2はa21=a,

a22(h) = {

b if h= (A, a) c otherwise

とすると、部分ゲーム完全均衡になることを示そう。まず、2期目は9つの部分ゲーム がh∈ {A, B, C} × {a, b, c}に対応してあるが、h= (A, a)のときはその部分ゲームに 制限した2人の戦略の組み合わせは(B, b)、他のときは(C, c)なのでいずれも段階ゲー ムGのナッシュ均衡であるからこれらの部分ゲームのナッシュ均衡である。

あとはゲームの最初から始まる(部分)ゲームにおいてナッシュ均衡、即ちお互いに最 適であればよい。

P2の戦略(a21, a22)を所与として、P1は2期間の利得を最大にするように考える。これ は後ろ向きに解けばよく、第2期についてはP2がbを行うケースではBを、cを行う ケースではCをするのが最適であるから、a12に従うのが最適ということになる。

これを踏まえて、P1にとって第1期の3つの行動のどれが最適かを考える。

Aをすると、総利得は5 + 3 = 8, Bをすると6 + 1 = 7、Cをすると0 + 1 = 1である からAをするのが最適である。ゆえに(a11, a12)は(a21, a22)に対して最適反応である。

同様にしてP1の戦略を所与として、P2の第2期は対応するGのナッシュ均衡の行動 を取ればよい。これを踏まえて第1期の最適行動を考えると

aをすると5 + 4 = 9、bをすると0 + 1 = 1、cをすると7 + 1 = 8であるからaが最適 である。つまり(a21, a22)は(a11, a12)に対して最適反応である。

ゆえに、全ての部分ゲームにおいて、そこに制限した戦略の組み合わせはナッシュ均衡 である。

2

Referensi

Dokumen terkait

/ very useful 〔問題Ⅲ〕 (配点 20) この部分は、著作権法上の都合により掲載いたしません。 〔問題Ⅳ〕 (配点 20) (1)私もそうです。その代わりに国内旅行を楽しみたいと思います。 (2)目標を達成するために、集中力だけでなく、計画も必要だと思います。 (3)この地図で道を教えてくれませんか。ここからどれくらい離れていますか。

あいさんが家を出発してから x 分後にみきさん に追い着くとすると,次のような方程式をつくるこ ともできる。.. 7⑴ 自動車工場に行く人数は2x-3人と表すことがで

乱数表,乱数さい,カードなどを使って,標本と して 10 人のスコアを無作為に抽出する。 なお,35 人のスコアの平均値は 103.8 点である。 最初に入っていた白い碁石の個数を x 個とすると,.. このときの母集団は「最初の袋の中の白い碁石に 100 個の黒い碁石を加えたもの」であり,標本は「抽 出した 80 個の碁石」である。 製品 A を 400

熊本大学 数理科学総合教育センター であるから辺々引いて ∥a+b∥2− ∥a−b∥2 = 4a,b とわかるので,両辺4で割って a,b = 1 4∥a+b∥2− ∥a−b∥2 とわかる. 補足 より一般に各a∈Rnに対し,∥a∥ ∈Rがただ1つ定まっていて,問2のi,ii, ivの 性質が成り立つとき,∥ ·

熊本大学 数理科学総合教育センター 不偏推定量,一致推定量,最尤推定量 演習問題2 解答例 母数θの母集団からの標本をX1, X2,.. , Xn とする.ここでは統計量,推定量,推定量の不偏 性,一致性を次の意味で用いる.

V をK上のベクトル空間とする.以下の問に答えよ. i o′ ∈V は,どんなx∈V に対してもo′+x=xをみたすとする.このとき,o′ =oとな ることを示せ(すなわちベクトル空間V に対して,零ベクトルはただ1つである). 解答.. ii x∈V とする.また,y∈V はx+y=oをみたすとする.このとき,y=−x となるこ とを示せ(すなわちx∈V

上の図は重りが板の中央にあります。このとき、ばねばかり A が示す数 値とばねばかりBが示す数値は同じになります。よって、中央の位置⑤につ るしたときはばねばかり A とばねばかり B の値は同じになります。図3と 図4でぴったりと重なる直線があります。ウとエです。よって、位置⑤のグ ラフはウとエになります。 下の図は重りが Aに近づきます。このとき、重りが

確率論では,確率変数Xに対してボレル集合Bに対してX∈Bと記すことで元々の確率 空間Ω,F, Pのσ集合体Fの要素{ω∈Ω| Xω∈B}を表すことがある.同様に,a≤X ≤b によって,[a, b]∈ Bであるから{ω∈Ω| Xω∈[a, b}]]をあらわす.これにより, P{ω∈Ω| Xω∈B} あるいは P{ω∈Ω| Xω∈[a, b}] は,PX