ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎 ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎 2014年4月18日 担当 古川徹也 2014/04/18
今日の講義 教科書第2章「戦略形ゲームの基礎」より, 2.1 戦略形ゲームと利得行列 2.2 戦略形ゲームを解く 2.1 戦略形ゲームと利得行列 2.2 戦略形ゲームを解く の2つの節の大事な点を説明する。 2014/04/18
2.1.1 プレイヤー・戦略・利得 戦略形ゲームは,プレイヤー,戦略,利得の3つを明らかにすることによって表現できる。 2.1.1 プレイヤー・戦略・利得 戦略形ゲームは,プレイヤー,戦略,利得の3つを明らかにすることによって表現できる。 これらをゲームの基本3要素と呼ぶことがある。 与えられた状況をゲームとして表現する場合,最低この3つは定義されていなければならない。 2014/04/18
プレイヤー・戦略・利得(続き) プレイヤー 意思決定を行う主体(個人,企業等) 戦略 プレイヤーが選択可能な行動。複雑なゲームでは,行動スケジュールを指す 利得 戦略の組として表現される結果に対して,プレイヤーの好みを表す数値 2014/04/18
モデル1 I市コンビニ戦争PART 1 戦略 利得 セレブとファミモ A駅 400 800 B駅 1200 300 100 200 セレブ プレイヤー セレブとファミモ 戦略 セレブ A駅に出店する,B駅に出店する ファミモ 利得 A駅 1200 B駅 300 セレブの戦略 ファミモの戦略 セレブの利得 ファミモの利得 A駅 400 800 B駅 1200 300 100 200 2014/04/18
モデル2 I市コンビニ戦争PART 2 戦略 利得 セレブとファミモ A駅 200 400 B駅 600 300 100 セレブ プレイヤー セレブとファミモ 戦略 セレブ A駅に出店する,B駅に出店する ファミモ 利得 A駅 600 B駅 300 セレブの戦略 ファミモの戦略 セレブの利得 ファミモの利得 A駅 200 400 B駅 600 300 100 2014/04/18
2.1.2 利得行列を作って考えよう モデル1の利得行列 ファミモ セレブ A駅 B駅 (400,800) (1200,300) (300,1200) (100,200) 左がセレブ,右がファミモの利得 2014/04/18
モデル2の利得行列 A駅 B駅 (200,400) (600,300) (300,600) (100,200) ファミモ セレブ A駅 B駅 (200,400) (600,300) (300,600) (100,200) 左がセレブ,右がファミモの利得 2014/04/18
2.2 戦略形ゲームを解く 2.2.1 ゲームを解く ゲームを用いて分析することの最終目的は,モデル化されたゲームでどのプレイヤーがどのような行動をとるかを予想すること。 予想される結果をゲームの解と呼ぶ。 ゲームの解を求めることをゲームを解くと言う。 2014/04/18
ゲームを解く思考方法 第1ステップ まずゲームの中のプレイヤーごとの視点に立ち,そのプレイヤーの立場になって考える。 第1ステップ まずゲームの中のプレイヤーごとの視点に立ち,そのプレイヤーの立場になって考える。 第2ステップ 自分が考えているプレイヤー以外が選択したすべての戦略に対して,どの戦略が一番高い利得を与えるか考える。 第3ステップ すべての戦略に対して検討したら,次に別のプレイヤーの視点に立ち,第2ステップを続ける。すべてのプレイヤーに対してこれを検討する。 2014/04/18
2.2.2 支配戦略を探せ 定義(支配戦略) あるプレイヤーのある戦略が,他のプレイヤーのすべての戦略に対して,他のどんな戦略よりも高い利得を与えるとき,その戦略はそのプレイヤーの支配戦略と呼ばれる。 自分に支配戦略があるときは,それを選択する。相手に支配戦略があるときは,相手は間違いなくその戦略を選ぶはずである。 支配戦略均衡:支配戦略の組み合わせ。 →もっとも簡単で明快なゲームの解である。 2014/04/18
モデル1とモデル2 モデル1には,両プレイヤーに支配戦略が存在するので,支配戦略均衡も存在する。 モデル2には,両プレイヤーに支配戦略が存在するわけではないので,支配戦略均衡も存在しない。 →確認せよ! 2014/04/18
図2.7 成果主義のジレンマ 協力する 協力しない (4,4) (-6,10) (10,-6) (0,0) A君 左がA君,右がB君の利得 図2.7 成果主義のジレンマ B君 A君 協力する 協力しない (4,4) (-6,10) (10,-6) (0,0) 左がA君,右がB君の利得 2014/04/18
図2.9 囚人のジレンマ 黙秘 自白 (-10, 0) (0,-10) (-5, -5) (-1, -1) 左が囚人1,右が囚人2の利得 図2.9 囚人のジレンマ 囚人2 囚人1 黙秘 自白 (-1, -1) (-10, 0) (0,-10) (-5, -5) 左が囚人1,右が囚人2の利得 2014/04/18
2.2.4 最適反応戦略を考える 定義(最適反応戦略) 他のプレイヤーの戦略に対して,自分の利得を最大にする戦略を,(その戦略に対する)最適反応戦略と呼ぶ。 2014/04/18
モデル2の利得行列 A駅 B駅 (200,400) (600,300) (300,600) (100,200) ファミモ セレブ A駅 B駅 (200,400) (600,300) (300,600) (100,200) 左がセレブ,右がファミモの利得 2014/04/18
モデル2について セレブについては ファミモについては → 「A駅」が支配戦略 ファミモの「A駅」に対する最適反応戦略は「B駅」 ファミモの「B駅」に対する最適反応戦略は「A駅」 → 支配戦略はない ファミモについては セレブの「A駅」に対する最適反応戦略は「A駅」 セレブの「B駅」に対する最適反応戦略は「A駅」 → 「A駅」が支配戦略 このとき,ファミモが「A駅」,セレブが「B駅」という組み合わせがゲームの解 2014/04/18
2.2.5 小国の交渉力 大国の利得 小国の利得 1 2 4 3 カッコ内は,左が大国,右が小国の選択 交渉決裂 (強硬,強硬) 2.2.5 小国の交渉力 大国の利得 小国の利得 交渉決裂 (強硬,強硬) 1 2 大国がすべて負担 (妥協,強硬) 4 大国と小国が負担等分 (強硬,妥協) 大国が負担80% (妥協,妥協) 3 カッコ内は,左が大国,右が小国の選択 2014/04/18
図2.12 「小国」の利得行列 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 左が大国,右が小国の利得 大国 小国 図2.12 「小国」の利得行列 小国 大国 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 左が大国,右が小国の利得 2014/04/18
図2.12 「小国モデル」の利得行列 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 小国にとっては「強硬」が支配戦略 図2.12 「小国モデル」の利得行列 小国 大国 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 小国にとっては「強硬」が支配戦略 2014/04/18
図2.12 「小国」の利得行列 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 図2.12 「小国」の利得行列 小国 大国 強硬 妥協 (1, 2) (4, 1) (2, 4) (3, 3) 大国は「妥協」を選び,小国は最良の結果を得る→瀬戸際戦略 2014/04/18
弱い方が最良の結果? 小国は自らの弱い立場を利用して,相手に「妥協しない」というコミットメントを大国に与えることができる。 大国は,小国が「妥協しない」ことを前提として自らの利得を最大にするから,「妥協」を選ばざるをえなくなる。 2014/04/18