10.Private Strategies in Games with Imperfect Public Monitoring

Slides:



Advertisements
Similar presentations
Chapter 6 Applications Taiki Todo March 29, 2012 Repeated Games and Reputations Long-Run Relationships.
Advertisements

新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
人工知能概論 第4回 探索(3) ゲームの理論.
合理的な秘密分散における 不可能性とその回避方法
第八回  シンプレックス表の経済的解釈 山梨大学.
Law and Economics 2 (7) Bargaining Game and Nash Bargaining Solution
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
独占と寡占.
ゲーム理論・ゲーム理論Ⅰ (第8回) 第5章 不完全競争市場の応用
16 寡占.
© Yukiko Abe 2014 All rights reserved
河内亮周(東工大) 岡本吉央(電通大) 田中圭介(東工大) 安永憲司(九州先端研)
上級価格理論II 第3回 2011年後期 中村さやか.
Chapter 18: Modeling reputations
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
新ゲーム理論ゼミ 第5章 「繰り返しゲーム」 M1 松村 草也.
Probabilistic Method.
上坂吉則 尾関和彦 文一総合出版 宮崎大輔2003年6月28日(土)
寡占理論(Oligopoly Theory) 第11講 Collusion
初級ミクロ経済学 -ゲーム理論入門- 2014年12月19日 古川徹也 2014/12/19.
法と経済学(file 6) ゲーム理論2 今日の講義の目的 (1)展開型ゲームという考え方を理解する (2)後方帰納法の考え方を理解する
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
ゲーム理論・ゲーム理論Ⅰ(第3回) 第2章 戦略形ゲームの基礎
第05回 2009年11月04日 今日の資料=A4・5枚 社会の認識 「社会科学的発想・法」 第05回 2009年11月04日 今日の資料=A4・5枚
「データ学習アルゴリズム」 第2章 学習と統計的推測 報告者 佐々木 稔 2003年5月21日 2.1 データと学習
マクロ経済学初級II タイプIIクラス 白井義昌
データ構造と アルゴリズム 知能情報学部 新田直也.
Probabilistic Method 6-3,4
統計解析 第10回 12章 標本抽出、13章 標本分布.
ネットワーク上を拡散する 技術革新のシミュレーション 日本大学文理学部 情報システム解析学科 谷研究室 安藤勇希 帆苅裕貴
計算量理論輪講 岩間研究室 照山順一.
Patent Licensing, Bargaining, and Product Positioning
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
第13章 フォンノイマン/モルゲンシュテイン解
シミュレーション論Ⅰ 第11回 意思決定とシミュレーション.
パソコンでゲームの理論 第1,2章 ゼロ和2人ゲーム ゼミ合宿 東京理科大学理学部第2部数学科・統計学ゼミ
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
ボンドの効果 ―法と経済学による分析― 桑名謹三 法政大学政策科学研究所
第2章 「有限オートマトン」.
シミュレーション論 Ⅱ 第15回 まとめ.
論文紹介 Query Incentive Networks
Oligopoly Theory 4. Endogenous Timing in Oligopoly
7.4 Two General Settings D3 杉原堅也.
ミクロ経済学第9回 企業と費用2:費用最小化.
第Ⅱ部 協力ゲームの理論 第10章 コア 2008/07/01(火) ゲーム理論合宿.
1. 集合 五島 正裕.
On the Robustness of Private Leadership in Mixed Duopoly
§ , How Bad Is Selfish Routing?
計算量理論輪講 chap5-3 M1 高井唯史.
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
電機情報工学専門実験 6. 強化学習シミュレーション
協力性の進化 社会心理学特殊講義(高木)
4. システムの安定性.
Oligopoly Theory 5. Endogenous Timing in Mixed Oligopoly
Selfish Routing 4章前半 岡本 和也.
Max Cut and the Smallest Eigenvalue 論文紹介
第Ⅱ部 協力ゲームの理論 第14章 交渉集合.
比較政治学における パレスチナ研究 ~交渉ゲーム理論を中心に~
人工知能特論II 第8回 二宮 崇.
7.8 Kim-Vu Polynomial Concentration
Additive Combinatorics輪講 6章
契約法の経済分析 麻生良文.
囚人のジレンマ ―― 裏切りのインセンティブ ――
計算の理論 I NFAとDFAの等価性 火曜3校時 大月 美佳 平成16年5月18日 佐賀大学理工学部知能情報システム学科.
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
人工知能概論 第4回 探索(3) ゲームの理論.
第5回講義 文、法 経済学 白井義昌.
Presentation transcript:

10.Private Strategies in Games with Imperfect Public Monitoring 北木 真

アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

公的戦略と私的戦略 行動:E(Effort),S(Shirk) {y,y}:公的シグナル - Public strategies:σ,σ - 公的シグナルによってのみ定まる Private strategies:σ シグナルyに続く2期の行動は,1期の行動に依存 - - ^ ~ -

Sequential Equilibrium 定義 任意の行動aに対するシグナルyの観測確率ρ(y|a)は正であると仮定 任意の自分の履歴  に対して,   が に対して最適反応 ⇒戦略プロファイルσはsequential equilibrium (但し,                            )

アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

A Reduced-Form Example 1期目は左,2期目は右のゲームを行う シグナルyの観測確率ρ a:行動,y,y:シグナル p=9/10,q=4/5,r=1/5と仮定 2回のゲームにおける利得:(1-δ)u1+δu2 δ=25/27と仮定 - - -

各戦略の期待利得 Pure Strategies - Public Correlation - - 1期はEE,2期ではyのときはRR,それ以外はPP 左辺の式より期待利得は1.4815 Public Correlation 1期はE,次はyの観測後はR,yの観測後は確率ΦでRを選択 Φ=0.5かつ期待利得は1.5556 - - -

各戦略の期待利得 Mixed Public Strategies - - 1期は確率αでE,2期はyの観測後はR,yの観測後は確率ΦでRを選択            より,期待利得は1.5566(α=0.969, Φ=0.567) - -

各戦略の期待利得 Private Strategies - 1期は確率αでEを選択 2期は1期でSが選ばれ,yを観測した後は確率ξでRを選択,それ以外の場合は必ずRを選択        より,期待利得は1.5864(α=0.916,ξ=0) -

アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

Two-Period Examples ただ一つのナッシュ均衡を持つゲーム 右のナッシュ均衡 公的シグナルY={y,y}のうち, プレイヤ1:r1かr2を等確率 プレイヤ2:c1かc2を等確率 公的シグナルY={y,y}のうち, yが観測される確率ρ(y|r c ): - - - - i j

PPEと重複しない均衡 1期の各プレイヤーの行動: 2期のプレイヤ1の行動: 2期のプレイヤ2の行動:

PPEと重複しない均衡 何故,1期でプレイヤ1はr3を選択? 均衡戦略がpublic r2を選択すると,2期でプレイヤ2は確率0.1でc1,0.9でc2を選択 プレイヤ1の期待利得は,r3の選択より減少 均衡戦略がpublic 1期の行動は2期の行動に影響を与えないため,最適反応から外れた戦略を取る誘因が発生しない⇒PPE 一方,プレイヤ2のprivate strategyは2期のゲームにおいてcorrelated equilibriumを構成 2期においてナッシュ均衡を構成する必要はない

Correlationによる利得 右のゲームにおける均衡 各シグナルy1,y2,y3の観測確率: Nash:(1,1)

Correlationによる利得 1期は3つの行動を等確率で1つ選択 各プレイヤの2期の行動: r4=r1,c4=c1,r0=r3,c0=c3とする 2期の戦略はcorrelated equilibirumを構成

複数のナッシュ均衡があるゲーム プレイヤ1は縦,2は横,3は左か右の表から行動を選択 ナッシュ均衡 プレイヤ3にとってRはLを支配 LRRかRLRを選択:利得(1,1,12) プレイヤー1と2が1/3でLを選択:利得(1/3,1/3,74/9)

さらに大きな利得を得る シグナルY={y0,y1,y2,y3}を考える 各プレイヤの1期の行動: l:1期でLを選択したプレイヤの人数 ylの観測確率は1-3ε(ym(m≠l)の観測確率はε) 各プレイヤの1期の行動: 1期では比較的LLLが選択される

さらに大きな利得を得る 各プレイヤの2期の行動 εが十分に小さければ,2期はほぼナッシュ均衡となる

さらに大きな利得を得る プレイヤ1と2の 2期の期待利得: プレイヤ3の2期の期待利得 ε→0のとき,利得は(6,6,26.22)に近づく 1期でLを選択:高確率でy3が観測され,利得は12 Rを選択:高確率でy2が観測され,利得は0 ε→0のとき,利得は(6,6,26.22)に近づく ナッシュ均衡による利得より大きい

アウトライン Sequential Equilibrium A Reduced-Form Example Two-Period Examples An Infinitely Repeated Prisoners’ Dilemma

Public Transitions 右の囚人のジレンマを 無限回繰り返す 2つの公的シグナルy,yの うち,yの観測確率ρ: - ここではp>0,q=0と仮定 戦略のオートマトン表現 wR:確率αでEを選択 wP:Sを選択 各プレイヤは常に   同じ状態 - - -

Public Transitions wRにおける期待利得V(wR) wRにおける行動が無差別⇒ Eを選択した場合: Sを選択した場合: wPにおける期待利得は0 wRにおける行動が無差別⇒ このとき, 各プレイヤが辛抱強い(δが1に近い)とき,αは1に近づき,V(wR)は2に近づく この場合,PPEによって達成可能な利得2-(1-p)/pより大きい

q>0のとき q=0のときと同じ戦略は均衡ではない プレイヤ1の履歴Ey,(Ey)kを考える - Ey観測後,プレイヤ2が 状態wRである確率β0(q) β0(0)=1 同様にして次の確率βk(q) を考える: k→∞のとき,βk(q)は0に近づく プレイヤ1はプレイヤ2がほぼ確実にwPの状態であると考え,Eの選択をやめる - - -

Belief-free Equilibrium 右の囚人のジレンマにおける Belief-free equilibrium (14章で述べられる)を示す 2つの公的シグナルy,yのうち, yの観測確率ρ: - - -

Belief-free Equilibrium 戦略のオートマトン表現 wR:確率αRでE を選択 WP:Sを選択 Vxi(ai):プレイヤjの状態がwxで,プレイヤiがai選択をした場合のプレイヤiの利得 VRi(E)=Vri(S)≡VR,VPi(E)=Vpi(S)≡VP

Belief-free Equilibrium VRについて: VPについて: これらの等式を解くことにより,確率βが求められる

Belief-free Equilibrium βによって,次の等式が導かれる δ=1,αR=1は等式を満たす p=1/2,q=1/2-ε,r=ε,bは2に近い場合を考える このとき,1に近いδ<1について,1に近いαR<1が存在し,それは上の等式を満たす