囚人のジレンマ ―― 裏切りのインセンティブ ――

Slides:



Advertisements
Similar presentations
第 2 章 なぜ政府は貿易に介入する のか. 1貿易政策の 実態 貿易を制限する政策 輸入関税(従量税・従価税) 輸出税 輸入数量制限 動植物検疫 輸入関税と非関税障壁 貿易を促進するような政策 輸出補助金 非関税障壁.
Advertisements

検索エンジンが 日本にないのはなぜか  なんで検索エンジン? 2006 年 10 月 9 日、「 Google 」が「 YouTube 」を買収した。 16 億 5 千万ドル相当の株式交換で買収、という形になって いる。  そもそもなんでそんな疑問が? 政府の知的財産戦略本部は 2008 年 6.
~不正を抑止するために~ 中京大学 風神ゼミナール 1. 1.はじめに 2.動機 3.生活保護とは 4.不正受給問題 5.不正受給増加の対策 6.囚人のジレンマ 7.実証 8.まとめ 2.
ゲーム理論の誕生と発展 von Neumann & Morgenstern The Theory of Games and Economic Behavior.
制度経済学Ⅰ ①. 制度経済学とは何か 制度 institutions 最も根本的な制度は・・・・ 言語、法、貨幣 いずれも経済、そして経済学に関係する それらなしに、経済は成立しない.
MOBAゲーム 2FG4172  らく.
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
人工知能概論 第4回 探索(3) ゲームの理論.
2013年5月11日 東京国際大学オープンキャンパス 経済学部体験授業 古川徹也
内容 部分ゲーム完全均衡点 -部分ゲーム -部分ゲーム完全均衡点 -2段階完全情報ゲーム シュタッケルベルク均衡点
確率と統計 平成23年12月8日 (徐々に統計へ戻ります).
ゲーム理論・ゲーム理論Ⅰ (第4回) 第3章 完全情報の展開形ゲーム
所属集団の変更可能な SDゲームにおける 協力行動の規定因
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
独占と寡占.
ゲーム理論・ゲーム理論Ⅰ (第8回) 第5章 不完全競争市場の応用
16 寡占.
4章 競争条件と企業の行動 渡辺真世.
© Yukiko Abe 2014 All rights reserved
(1)行動分析学の基礎 「実験する」ことの意味
上級価格理論II 第3回 2011年後期 中村さやか.
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
ミクロ経済学の基礎 経済学A 第1回 畑農鋭矢.
「生き残り競争」から抜け出したい! -ゲーム理論入門- 東京国際大学オープンキャンパス (2014年8月23日) 経済学部体験授業
新ゲーム理論ゼミ 第5章 「繰り返しゲーム」 M1 松村 草也.
私たちはどうして虐待をしてしまうのか? 誰もが利用者の生活が豊かになることや社会参加を願って福祉の仕事に就いていると 思います。初めから虐待しようなんて思って仕事に就いている人はいないはずです。 ○愛情というエネルギーはとても大きい →自分の思うようにいかないと怒りになります。 ○自己欲・支配欲のエネルギーはとても大きい.
感情移入に基づく 共感性と信頼行動: 囚人のジレンマゲームによる検証
初級ミクロ経済学 -ゲーム理論入門- 2014年12月19日 古川徹也 2014/12/19.
法と経済学(file 6) ゲーム理論2 今日の講義の目的 (1)展開型ゲームという考え方を理解する (2)後方帰納法の考え方を理解する
10.Private Strategies in Games with Imperfect Public Monitoring
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
ゲーム理論・ゲーム理論Ⅰ(第3回) 第2章 戦略形ゲームの基礎
第05回 2009年11月04日 今日の資料=A4・5枚 社会の認識 「社会科学的発想・法」 第05回 2009年11月04日 今日の資料=A4・5枚
第5回 人間関係の中で生きるということ 社会心理学.
正規性の検定 ● χ2分布を用いる適合度検定 ●コルモゴロフ‐スミノルフ検定
特殊講義(経済理論)B/初級ミクロ経済学
集団における適応 知識構造論講座 下嶋研究室          M1 関本 和弘.
『企業と市場のシミュレーション』 井庭 崇 第12回: 貨幣の自生と自壊モデル
ネットワーク上を拡散する 技術革新のシミュレーション 日本大学文理学部 情報システム解析学科 谷研究室 安藤勇希 帆苅裕貴
『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル
OR手法「ゲームの理論」 社会情報特講Ⅲ 大堀隆文(非常勤).
慶應義塾大学経済学部 グレーヴァ香子 Takako Fujiwara-Greve
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
第13章 フォンノイマン/モルゲンシュテイン解
シミュレーション論Ⅰ 第11回 意思決定とシミュレーション.
パソコンでゲームの理論 第1,2章 ゼロ和2人ゲーム ゼミ合宿 東京理科大学理学部第2部数学科・統計学ゼミ
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
第Ⅱ部 協力ゲームの理論 第7章 交渉問題 2008/07/01(火) ゲーム理論合宿 M1 北川直樹.
一橋大学大学院経済学研究科 岡田 章(おかだ あきら)
シミュレーション論 Ⅱ 第14回 まとめ.
シミュレーション論 Ⅱ 第15回 まとめ.
6.大人数クラスの運営法 ゲーム理論 出席の取り方 まわし方(4通り) →出席表を2回まわす 1回目10:50~ 2回目11:20~
Important Information
第Ⅱ部 協力ゲームの理論 第10章 コア 2008/07/01(火) ゲーム理論合宿.
意外と身近なゲーム理論 へなちょこ研究室 p.
第Ⅱ部 協力ゲームの理論 第16章 破産問題 2008/07/02(水) ゲーム理論合宿 M1 浦田淳司.
中級ミクロ経済(2004) 授業予定.
『組織の限界』 第1章 個人的合理性と社会的合理性 前半
信頼の構造 原 謙治 2004/10/13.
第Ⅱ部 協力ゲームの理論 第7章 提携形ゲームと配分 2008/07/01(火) ゲーム理論合宿 M1 藤井敬士.
第Ⅱ部 協力ゲームの理論 第14章 交渉集合.
法と経済学(Law and Economics)
契約法の経済分析 麻生良文.
or-8. ゲーム理論 (オペレーションズリサーチを Excel で実習するシリーズ)
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
ゲーム理論 ー 駆け引きの科学 - (1) 戦略形のゲーム
図15-1 教師になる人が学ぶべき知識 子どもについての知識 教授方法についての知識 教材内容についての知識.
人工知能概論 第4回 探索(3) ゲームの理論.
Presentation transcript:

囚人のジレンマ ―― 裏切りのインセンティブ ―― 囚人のジレンマ ―― 裏切りのインセンティブ ―― 宮野 哲史 平野研究室 2009年度 夏合宿

今日お話しすること ゲーム理論 複数の行為主体が各自の目的のために行動を起こすとき、利害の対立と協力が生ずる(ゲーム的状況) ゲーム的状況において、どのような意思決定をすることが合理的であるか? 囚人のジレンマ 本日のメイントピック ゲーム理論における、ひとつの重要な帰結 個々の最適な選択が、全体としての最適な選択とはならない状況のこと

以下では、プレイヤーが2人の場合についてみていく。 「ゲーム」の構成要素 プレイヤー(Player)  合理的であり、自己の利得を最大化することを前提とする 戦略(Strategy)  プレイヤーがとる行動のこと 利得(Payoff)  ある戦略を実行したときに得られる結果を数値化 以下では、プレイヤーが2人の場合についてみていく。

「ゲーム」の例 AliceとBobは、トランプのKとQを一枚ずつもっています。 出したカードに応じて、お金がもらえるゲームです。 ^o^ ^ω^ K Q K Q 出したカードに応じて、お金がもらえるゲームです。 プレイヤー → 「Aさん」と「Bさん」 戦略    → 「K」か「Q」か 利得    →もらえる金額

「ゲーム」の例 AliceとBobは、トランプのKとQを一枚ずつもっています。 出したカードに応じて、お金がもらえるゲームです。 ^o^ ^ω^ K Q K Q 出したカードに応じて、お金がもらえるゲームです。 A=K, B=K → Aは5000円、Bは2000円もらえる A=K, B=Q → Aは7000円、Bは4000円もらえる A=Q, B=K → Aは4000円、Bは7000円もらえる A=Q, B=Q → Aは3000円、Bは8000円もらえる なんだか わかりづらい。。。

いまの例から利得行列をつくると、上記のようになる。 A,Bの戦略と、利得の関係を行列として表す 行はAの戦略、列はBの戦略 各成分は (Aの利得, Bの利得) Bの戦略 K Q Aの戦略 K (5000, 2000) (7000, 4000) Q (4000, 7000) (3000, 8000) いまの例から利得行列をつくると、上記のようになる。

例)利得行列を使った分析 ――Aの立場に立って Bの戦略 K Q Aの戦略 K (5000,2000) (7000,4000) Q (4000,7000) (3000,8000) 相手(B)の出方を予測 Bはクイーンを出したほうが利得が高い 自分以外のすべてのプレイヤーの戦略が与えられたとき, これに対して自分の利得が最大になるような戦略を最適反応という. 他のプレイヤーがとる戦略の組のすべてに対して最適反応となっているような戦略を支配戦略という. 自分(A)の利得を高める戦略を考える Aはキングを出したほうが利得が高い 相手の出方に対して、最も利得を高める戦略を選ぶ・・・最適反応

例)利得行列を使った分析 ――Bの立場に立って K Q Aの戦略 K (5000,2000) (7000,4000) Q (4000,7000) (3000,8000) 相手(A)の出方を予測 Aはキングを出したほうが利得が高い 自分以外のすべてのプレイヤーの戦略が与えられたとき, これに対して自分の利得が最大になるような戦略を最適反応という. 他のプレイヤーがとる戦略の組のすべてに対して最適反応となっているような戦略を支配戦略という. 自分(B)の利得を高める戦略を考える Bはクイーンを出したほうが利得が高い この場合の支配戦略は、Alice:K, Bob:Q 最適反応が一致 →

ゲームの分類 各プレーヤーが事前に話し合いを持たずに、各自の戦略を自ら決定する 非協力ゲーム 協力ゲーム ある1人の利益が、必ずしも他者の損失にならない (Aの利得+Bの利得≠0) 非zero-sumゲーム zero-sumゲーム プレーヤーは同時に戦略を決定する 同時進行ゲーム 交互進行ゲーム

強盗を犯した二人組(AliceとBob)が逮捕され、 囚人のジレンマ 問題設定 強盗を犯した二人組(AliceとBob)が逮捕され、 別々の部屋で尋問されている。 アタシ 黙秘 ていうか やってないし みたいな わたしが やりました 戦略・・・「自白」or「黙秘」のふたつ それぞれの戦略をとったときに、 二人とも黙秘・・・二人とも懲役2年 どちらかが自白・・・自白したほうは懲役1年、黙秘したほうは20年 二人とも自白・・・二人とも懲役5年 いま支配戦略は何だろうか?

囚人のジレンマ (-5, -5) (-1, -20) (-20, -1) (-2, -2) 利得行列 (懲役は損だからマイナスとして書いた) Bの戦略 自白 黙秘 Aの戦略 (-5, -5) (-1, -20) 自白 (-20, -1) (-2, -2) 黙秘 Bobが自白を選ぶと仮定  →Aliceは自白したほうが得 支配戦略は ふたりとも自白 Bobが黙秘を選ぶと仮定  →Aliceは自白したほうがやっぱり得

自分の利得のみを追求した結果たがいに損をしてしまう! 囚人のジレンマ 利得行列 (懲役は損だからマイナスとして書いた) Bの戦略 自白 黙秘 Aの戦略 (-5, -5) (-1, -20) 自白 和=-10 (-20, -1) (-2, -2) 黙秘 和=-4 支配戦略にしたがって、結果はふたりとも懲役5年 しかし、ふたりとも黙秘していれば懲役2年で済んだ 全体の利得を最大にする方法があるのに、 自分の利得のみを追求した結果たがいに損をしてしまう!

S < P < R < T, 2 R > S + T 囚人のジレンマ 問題を一般化 Bの戦略 裏切り 協調 Aの戦略 (P, P) (T, S) 裏切り (S, T) (R, R) 協調 利得の条件 S < P < R < T, 2 R > S + T S : 裏切られて俺だけ大損 P : 裏切りあってみんな損 R : 信じあってみんな得 T : 裏切って俺だけウハウハ

結局、各国は軍拡を選択し、国際緊張に陥ってしまう 例)軍拡競争における「囚人のジレンマ」 適用例 プレイヤー S P R T 軍拡競争 国家 弱小化 軍拡    国際緊張 軍縮協定 協定違反 強大化 自国は軍縮せず、相手国は協定に誠実に軍縮している状態がもっともいい(T) それに次ぐのは両国が軍縮している状態(R)、その次は両国が軍縮しない状態である(P) 最悪はその国は誠実に軍縮しているのに相手国はしていない状態である(S) 結局、各国は軍拡を選択し、国際緊張に陥ってしまう

誰もが裏切りのインセンティブ(動機、誘因)を持ち、 まとめ 「自分だけ裏切れば得をする」という状況では、 誰もが裏切りのインセンティブ(動機、誘因)を持ち、 そして実行してしまう こういった状況は現実社会にもよく見られる 適用例 プレイヤー S P R T 軍拡競争 国家 弱小化 軍拡    国際緊張 軍縮協定 協定違反 強大化 環境問題 企業 競争力低下 環境悪化 環境保護 競争力上昇 秩序問題 ヒト 生命の危機 自然状態 社会状態 優越 表の出典:計量社会科学ワークショップ(http://www.qmss.jp/qmss/)

参考文献 J. von Neumann et.al. , “Theory of Games and Economic Behavior”, 1944 まじめに勉強したい方はフォンノイマンの本を読んでみよう! ぼくもいつか読んでみたいです THE END