Presentation is loading. Please wait.

Presentation is loading. Please wait.

10.Private Strategies in Games with Imperfect Public Monitoring

Similar presentations


Presentation on theme: "10.Private Strategies in Games with Imperfect Public Monitoring"— Presentation transcript:

1 10.Private Strategies in Games with Imperfect Public Monitoring
北木 真

2 アウトライン Sequential Equilibrium A Reduced-Form Example
Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

3 公的戦略と私的戦略 行動:E(Effort),S(Shirk) {y,y}:公的シグナル - Public strategies:σ,σ -
公的シグナルによってのみ定まる Private strategies:σ シグナルyに続く2期の行動は,1期の行動に依存 - - -

4 Sequential Equilibrium
定義 任意の行動aに対するシグナルyの観測確率ρ(y|a)は正であると仮定 任意の自分の履歴  に対して,   が に対して最適反応 ⇒戦略プロファイルσはsequential equilibrium (但し,                            )

5 アウトライン Sequential Equilibrium A Reduced-Form Example
Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

6 A Reduced-Form Example
1期目は左,2期目は右のゲームを行う シグナルyの観測確率ρ a:行動,y,y:シグナル p=9/10,q=4/5,r=1/5と仮定 2回のゲームにおける利得:(1-δ)u1+δu2 δ=25/27と仮定 - - -

7 各戦略の期待利得 Pure Strategies - Public Correlation - -
1期はEE,2期ではyのときはRR,それ以外はPP 左辺の式より期待利得は1.4815 Public Correlation 1期はE,次はyの観測後はR,yの観測後は確率ΦでRを選択 Φ=0.5かつ期待利得は1.5556 - - -

8 各戦略の期待利得 Mixed Public Strategies - -
1期は確率αでE,2期はyの観測後はR,yの観測後は確率ΦでRを選択            より,期待利得は1.5566(α=0.969, Φ=0.567) - -

9 各戦略の期待利得 Private Strategies - 1期は確率αでEを選択
2期は1期でSが選ばれ,yを観測した後は確率ξでRを選択,それ以外の場合は必ずRを選択        より,期待利得は1.5864(α=0.916,ξ=0) -

10 アウトライン Sequential Equilibrium A Reduced-Form Example
Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

11 Two-Period Examples ただ一つのナッシュ均衡を持つゲーム 右のナッシュ均衡 公的シグナルY={y,y}のうち,
プレイヤ1:r1かr2を等確率 プレイヤ2:c1かc2を等確率 公的シグナルY={y,y}のうち, yが観測される確率ρ(y|r c ): - - - - i j

12 PPEと重複しない均衡 1期の各プレイヤーの行動: 2期のプレイヤ1の行動: 2期のプレイヤ2の行動:

13 PPEと重複しない均衡 何故,1期でプレイヤ1はr3を選択? 均衡戦略がpublic
r2を選択すると,2期でプレイヤ2は確率0.1でc1,0.9でc2を選択 プレイヤ1の期待利得は,r3の選択より減少 均衡戦略がpublic 1期の行動は2期の行動に影響を与えないため,最適反応から外れた戦略を取る誘因が発生しない⇒PPE 一方,プレイヤ2のprivate strategyは2期のゲームにおいてcorrelated equilibriumを構成 2期においてナッシュ均衡を構成する必要はない

14 Correlationによる利得 右のゲームにおける均衡 各シグナルy1,y2,y3の観測確率: Nash:(1,1)

15 Correlationによる利得 1期は3つの行動を等確率で1つ選択 各プレイヤの2期の行動:
r4=r1,c4=c1,r0=r3,c0=c3とする 2期の戦略はcorrelated equilibirumを構成

16 複数のナッシュ均衡があるゲーム プレイヤ1は縦,2は横,3は左か右の表から行動を選択 ナッシュ均衡 プレイヤ3にとってRはLを支配
LRRかRLRを選択:利得(1,1,12) プレイヤー1と2が1/3でLを選択:利得(1/3,1/3,74/9)

17 さらに大きな利得を得る シグナルY={y0,y1,y2,y3}を考える 各プレイヤの1期の行動: l:1期でLを選択したプレイヤの人数
ylの観測確率は1-3ε(ym(m≠l)の観測確率はε) 各プレイヤの1期の行動: 1期では比較的LLLが選択される

18 さらに大きな利得を得る 各プレイヤの2期の行動 εが十分に小さければ,2期はほぼナッシュ均衡となる

19 さらに大きな利得を得る プレイヤ1と2の 2期の期待利得: プレイヤ3の2期の期待利得 ε→0のとき,利得は(6,6,26.22)に近づく
1期でLを選択:高確率でy3が観測され,利得は12 Rを選択:高確率でy2が観測され,利得は0 ε→0のとき,利得は(6,6,26.22)に近づく ナッシュ均衡による利得より大きい

20 アウトライン Sequential Equilibrium A Reduced-Form Example
Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

21 Public Transitions 右の囚人のジレンマを 無限回繰り返す 2つの公的シグナルy,yの うち,yの観測確率ρ: -
ここではp>0,q=0と仮定 戦略のオートマトン表現 wR:確率αでEを選択 wP:Sを選択 各プレイヤは常に   同じ状態 - - -

22 Public Transitions wRにおける期待利得V(wR) wRにおける行動が無差別⇒ Eを選択した場合: Sを選択した場合:
wPにおける期待利得は0 wRにおける行動が無差別⇒ このとき, 各プレイヤが辛抱強い(δが1に近い)とき,αは1に近づき,V(wR)は2に近づく この場合,PPEによって達成可能な利得2-(1-p)/pより大きい

23 q>0のとき q=0のときと同じ戦略は均衡ではない プレイヤ1の履歴Ey,(Ey)kを考える - Ey観測後,プレイヤ2が
状態wRである確率β0(q) β0(0)=1 同様にして次の確率βk(q) を考える: k→∞のとき,βk(q)は0に近づく プレイヤ1はプレイヤ2がほぼ確実にwPの状態であると考え,Eの選択をやめる - - -

24 Belief-free Equilibrium
右の囚人のジレンマにおける Belief-free equilibrium (14章で述べられる)を示す 2つの公的シグナルy,yのうち, yの観測確率ρ: - - -

25 Belief-free Equilibrium
戦略のオートマトン表現 wR:確率αRでE を選択 WP:Sを選択 Vxi(ai):プレイヤjの状態がwxで,プレイヤiがai選択をした場合のプレイヤiの利得 VRi(E)=Vri(S)≡VR,VPi(E)=Vpi(S)≡VP

26 Belief-free Equilibrium
VRについて: VPについて: これらの等式を解くことにより,確率βが求められる

27 Belief-free Equilibrium
βによって,次の等式が導かれる δ=1,αR=1は等式を満たす p=1/2,q=1/2-ε,r=ε,bは2に近い場合を考える このとき,1に近いδ<1について,1に近いαR<1が存在し,それは上の等式を満たす


Download ppt "10.Private Strategies in Games with Imperfect Public Monitoring"

Similar presentations


Ads by Google