新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡 新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡 M1 北川直樹
内容 ナッシュ均衡点 ミニマックス均衡点 寡占市場の均衡 混合戦略による均衡点 非協力n人ゲーム 非協力ゲーム理論の性格 混合戦略 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
内容 ナッシュ均衡点 ミニマックス均衡点 寡占市場の均衡 混合戦略による均衡点 非協力n人ゲーム 非協力ゲーム理論の性格 混合戦略 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
このゲームでは、2人のプレイヤーの持つ戦略間に ナッシュ均衡点 例1)非協力2人ゲームを考える 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ 8 , 8 0 , 9 5 , 4 0 , 3 5 , 5 4 , 4 2 , 5 4 , 3 3 , 6 B A < < < < このゲームでは、2人のプレイヤーの持つ戦略間に 支配関係がない.
ナッシュ均衡点 各プレーヤーは、自分が取った戦略に対する相手の反応を考える プレイヤーAの戦略:ⅰ プレーヤーBの戦略: j 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ 8 , 8 0 , 9 5 , 4 0 , 3 5 , 5 4 , 4 2 , 5 4 , 3 3 , 6 B A
ナッシュ均衡点 プレイヤーAの考え プレイヤーBの考え 均衡点 ⅰ=1のとき ⅰ=2のとき ⅰ=3のとき j=1のとき j=2のとき max(8,9,4)=9、 j=2 ⅰ=2のとき max(3,5,4)=5、 j=2 ⅰ=3のとき max(5,3,6)=6、 j=3 プレイヤーBの考え j=1のとき max(8,0,2)=8、 ⅰ=1 j=2のとき max(0,5,4)=5、 ⅰ=2 j=3のとき max(5,4,3)=5、 ⅰ=1 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ 8 , 8 0 , 9 5 , 4 0 , 3 5 , 5 4 , 4 2 , 5 4 , 3 3 , 6 B A 均衡点
ナッシュ均衡点 最適反応戦略の均衡点 プレイヤーAが戦略Ⅱ、プレーヤーBも戦略Ⅱのとき、どちらのプレーヤーも自分の戦略を変えても利得は増加しない。 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ 8 , 8 0 , 9 5 , 4 0 , 3 5 , 5 4 , 4 2 , 5 4 , 3 3 , 6 B A 均衡点/ナッシュ均衡点 (ⅰ, j )=(2 , 2)
ナッシュ均衡点 最適反応原理 最適反応戦略の均衡点(ナッシュ均衡点) 相手がある戦略をとったときに、その戦略のもとで自分の利得を最大にするように行動する 最適反応戦略の均衡点(ナッシュ均衡点) 2人のとる戦略が互いに相手の戦略の最適反応戦略になっている
ナッシュ均衡点 非協力2人ゲームの戦略形
ナッシュ均衡点 ナッシュ均衡点/均衡点 次の条件をみたすSの点を均衡点という 前回の「支配される戦略は使わない」という戦略原理によって到達 した均衡点や支配戦略均衡点は、ナッシュ均衡点の特別な場合
ナッシュ均衡点 最適反応戦略の集合
ナッシュ均衡点 最適反応集合 プレーヤー1の最適反応集合 プレイヤー2の最適反応集合 プレイヤー2の戦略s2とそれに対するプレーヤー1の最適反応戦略の組の集合(D1) プレイヤー2の最適反応集合 プレイヤー1の戦略s1とそれに対するプレーヤー2の最適反応戦略の組の集合(D2)
ナッシュ均衡点 ナッシュ均衡点の集合(D) 例1の場合 戦略Ⅰ 戦略Ⅱ 戦略Ⅲ 8 , 8 0 , 9 5 , 4 0 , 3 5 , 5 4 , 4 2 , 5 4 , 3 3 , 6 B A
内容 ミニマックス均衡点 ナッシュ均衡点 寡占市場の均衡 混合戦略による均衡点 非協力n人ゲーム 非協力ゲーム理論の性格 混合戦略 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
ミニマックス均衡点 例2)ゼロ和2人ゲーム(立地ゲーム) ・ A社は、各町について、もしA社がB社よりその町に近ければその町の需要の80%、B社より遠ければ40%、同じ距離ならば60%を得ることができる ・ ともに、ある道路に沿って等間隔に位置している4つの町の中の1つに、 新しい店を出したいと思っている。 ・ 全体の需要を100とすると各町の需要は、20、40、20、20である。 同じ製品を販売する2つの会社A、Bがある A社 B社 プレイヤー 需要 20人 40人 1町 2町 3町 4町 戦略
ミニマックス均衡点 A社がⅰ町に、B社が j 町に出店したときのA社の利得をaij、B社の利得をbijとすると bij =100- aij 企業Bの利得をbij ´=- aijと置き換えると(ゼロ和ゲーム)、企業Aの利得行列をA=[aij]とすると利得行列Gは
ミニマックス均衡点 非協力ゼロ和2人ゲームでは A社は、利得aijを最大にしようと行動する B社は、利得aijを最小にしようと行動する 最大化プレイヤー 最大化戦略 B社は、利得aijを最小にしようと行動する 最小化プレイヤー 最小化戦略
ミニマックス均衡点 マックスミニ戦略 Aの戦略ⅰに対抗するBの最小化戦略 j Bが最適反応戦略である最小化戦略をとるとすると Aは、
ミニマックス均衡点 ミニマックス戦略 Bの戦略 j に対抗するAの最小化戦略 i Aが最適反応戦略である最大化戦略をとるとするとBは、
※相手のとる戦略に対して最適反応戦略なのでこのゲームのナッシュ均衡点 ミニマックス均衡点 最大化プレイヤーAがマックスミニ戦略(i=2)、 最小化プレイヤーBがミニマックス戦略(j=2)のとき 均衡点 : (ⅰ, j )=(2 , 2) ミニマックス均衡点 ※相手のとる戦略に対して最適反応戦略なのでこのゲームのナッシュ均衡点
ミニマックス均衡点 ミニマックス原理 ミニマックス戦略 ミニマックス均衡点 問題点 最大化プレイヤーがマックスミニ戦略ととり、最小化プレイヤーがミニマックス戦略をとる行動原理。 ミニマックス戦略 マックスミニ戦略とミニマックス戦略をまとめて呼ぶ。 ミニマックス均衡点 マックスミニ戦略とミニマックス戦略との組。 問題点 非ゼロ和ゲームの場合、ミニマックス原理は合理的な行動原理ではない。
内容 寡占市場の均衡 ナッシュ均衡点 ミニマックス均衡点 混合戦略による均衡点 非協力n人ゲーム 非協力ゲーム理論の性格 混合戦略 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
※今までと違うのは、戦略が連続量ってこと 寡占市場の均衡 例3)クールノーの複占市場 2つの企業をプレイヤー1、プレイヤー2とする。 両者は、無差別な財を市場に供給している。 プレイヤー1の戦略S1、供給量x1 プレイヤー2の戦略S2、供給量x2 ※今までと違うのは、戦略が連続量ってこと
寡占市場の均衡 例3)クールノーの複占市場 財の価格をpとし、x1、x2で表すと 2つの企業の費用関数をC1、C2とすると 2つの企業の利得関数をy1,y2とすると、p>0のとき 総売上 総費用
寡占市場の均衡 相手の供給量に対する最適反応戦略を求める 企業1の企業2の戦略に対する最適反応戦略 企業2の企業1の戦略に対する最適反応戦略 ここを探す感じ
寡占市場の均衡 均衡点
寡占市場の均衡 クールノー/ナッシュ均衡点
寡占市場の均衡 クールノー均衡点 企業が交互に自分の戦略を市場に提示し、相手が提示した戦略に対する次々と最適反応戦略を提示し、どちらも戦略を変えようとしない戦略の組 次々と戦略を提示する過程をプレイヤーが頭の中で考え、それぞれの均衡した戦略をとると考えると、到達する均衡点はナッシュ均衡点 クールノー型複占市場の均衡点は、結果的にナッシュ均衡点に一致する。
内容 混合戦略による均衡点 ナッシュ均衡点 ミニマックス均衡点 寡占市場の均衡 混合戦略 非協力n人ゲーム 非協力ゲーム理論の性格 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
混合戦略 例4)2つの企業の販売戦略 利得行列 1 2 8, 0 0, 6 0, 4 6, 0 プレイヤー1の最適反応戦略 プレイヤー2の最適反応戦略 プレイヤー2 1 2 8, 0 0, 6 0, 4 6, 0 プレイヤー1 最適反応戦略の共通部分がない
混合戦略 くじ引きで確率的に決断する。 プレイヤー1が戦略1をとる確率 : p1 戦略2をとる確率 : p2 プレイヤー1の混合戦略 : p=(p1, p2) 本来の戦略1、2を混合戦略と区別して純戦略と呼ぶ
混合戦略 プレーヤー1の期待値E1 プレイヤー1が混合戦略p(p1,p2) 、 プレイヤー2が純戦略1か2のとき プレイヤー2も混合戦略q(q1,q2)のとき
混合戦略 プレーヤー2の期待値E2 プレイヤー2が混合戦略q(q1,q2) 、 プレイヤー1が純戦略1か2のとき プレイヤー1も混合戦略p(p1,p2)のとき
混合戦略 利得関数E1(p,q)、E2(p,q)をもつ新ゲームと定義 ⇒前のゲームの混合拡大ゲーム ⇒前のゲームの混合拡大ゲーム 混合戦略を考慮した混合拡大ゲームの利得行列 p1 q1 1 4/7 3/7 2/7 8.0 , 0.0 4.6 , 2.6 3.4 , 3.4 2.3 , 4.3 0.0 , 6.0 3/5 4.8 , 1.6 3.8 , 2.5 3.4 , 2.7 3.1 , 3.0 2.4 , 3.6 2/5 3.2 , 2.4 3.4 , 2.4 3.5 , 2.4 3.6 , 2.4 1/5 1.6 , 3.2 3.0 , 2.3 3.4 , 2.1 3.9 , 1.8 4.8 , 1.2 0.0 , 4.0 2.6 , 2.3 3.4 . 1.7 4.3 , 1.1 6.0 , 0.0
混合戦略 最適混合戦略の組 均衡利得 (3.4 , 2.4) 1 4/7 3/7 2/7 8.0 , 0.0 4.6 , 2.6 8.0 , 0.0 4.6 , 2.6 3.4 , 3.4 2.3 , 4.3 0.0 , 6.0 3/5 4.8 , 1.6 3.8 , 2.5 3.4 , 2.7 3.1 , 3.0 2.4 , 3.6 2/5 3.2 , 2.4 3.4 , 2.4 3.5 , 2.4 3.6 , 2.4 1/5 1.6 , 3.2 3.0 , 2.3 3.4 , 2.1 3.9 , 1.8 4.8 , 1.2 0.0 , 4.0 2.6 , 2.3 3.4 . 1.7 4.3 , 1.1 6.0 , 0.0
その後…. 企業1の社長は、2/5の確率で純戦略1、3/5の確率で純戦略2、が出るクジを引いて決断し、 企業2の社長は、3/7の確率で純戦略1、4/7の確率で純戦略2、が出るクジを引いて決断した。 大事な決定をクジで決めることは、奇妙な方法にみえるかもしれないが、 これ以外のいかなる方法も、社長にとっても、スタッフにとっても十分に納得できなかったのである。 めでたし、めでたし
混合戦略による均衡点
混合戦略の均衡点
内容 非協力n人ゲーム ナッシュ均衡点 ミニマックス均衡点 寡占市場の均衡 混合戦略による均衡点 非協力ゲーム理論の性格 混合戦略 ナッシュ均衡点の性格 ナッシュ均衡理論の性格
非協力n人ゲーム 無限の戦略をもつ非協力ゲーム
非協力n人ゲーム 有限の戦略をもつ非協力ゲーム
内容 非協力ゲーム理論の性格 ナッシュ均衡点 ミニマックス均衡点 寡占市場の均衡 混合戦略による均衡点 非協力n人ゲーム ナッシュ均衡点の性格 ナッシュ均衡理論の性格
となる田舎まちに、仲の良いカップルがいました。 ナッシュ均衡点の性質 例6)面会ゲーム 2人がとることのできる行動は、以下の2つです。 (a)相手が来るのをその場で待つ (b)こちらから相手のいるところに出掛ける すると、突然の大地震が起こり、2人は離ればなれになってしまいました。 通信網も途切れてしまい、連絡が取れません。 2人は、今すぐに会いたいです。 となる田舎まちに、仲の良いカップルがいました。 会いたいよ ステファニー! ジョン!
ナッシュ均衡の性質 このゲームの利得行列は、 a 待つ b 出掛ける 0 , 0 10 , 6 6 , 10 ー6 , -6
ナッシュ均衡の性質 このゲームの均衡点 は ここで、(a,b)と(b,a)は、純戦略による均衡点である。 それぞれの均衡利得は、 a 待つ このゲームの均衡点 は ここで、(a,b)と(b,a)は、純戦略による均衡点である。 それぞれの均衡利得は、 a 待つ b 出掛ける 0 , 0 10 , 6 6 , 10 -6 , -6
ナッシュ均衡の性質 最適反応戦略とにミニマックス戦略の関係 ミニマックス戦略 純戦略のみの場合 混合戦略の場合 2人とも、その場で待つ、を選択する そのときの利得の組 : (0, 0) 混合戦略の場合 ミニマックス戦略 : p=q=(6/11, 5/11) そのときの利得の組 : (30/11, 30/11) 3つの均衡利得は、いずれも2人がともにミニマックス原理 に従って行動したときに得られる利得の30/11以上 一般に、マックスミニ利得は均衡利得の下限になる。
ナッシュ均衡の性格 戦略の交換性と最適性の不成立 均衡戦略の交換可能 2つの均衡戦略を交換してできる戦略の組も、同じく均衡点になるもの 非ゼロ和2人ゲームでは、複数個の均衡点の均衡戦略は必ずしも交換可能ではないが、ゼロ和2人ゲームでは、常に均衡戦略は交換可能である。
ナッシュ均衡点の性格 複数のナッシュ均衡点の意味 起こりうる可能性 予備知識がある場合 通報可能な場合 純戦略で表現される状態と混合戦略で表現される状態が存在 予備知識がある場合 「彼は、いつも行動的な人である」などの、経験の積み重ねによる情報の累積によって、均衡点が限定される。 ゲームで表現できるのは現実の一部であり、他の情報を補うべき。 通報可能な場合 彼が戦略を通報することができれば、彼女の戦略は決定する 均衡点は、外からの強制力なしで自立的な安定性をもっている。 予備知識もなく、通報の可能性もない場合 ゲームとして表現された情報のみでは、確定的な行動ができないため、混合戦略を基に行動の指針を決定する。
ナッシュ均衡点の性格 状況のより深い理解を与えるための均衡点 それぞれの均衡点の意味を考えることによって、ゲームとして表現することのできなかった背後にある状況に対して深い理解をもつことが可能となる。
ナッシュ均衡理論の性格 例7)友情原理 プレイヤー1、2にとって、戦略A、Bは同等の戦略 しかし、得られる利得は異なる 均衡点(A , A) : 利得(8 , 8) 均衡点(B , B) : 利得(4 , 4) A B 8 , 8 4 , 8 8 , 4 4 , 4
ナッシュ均衡理論の性格 友情ルール 例7)において、友情ルールが成立すると利得は (8 , 8)になる。 ある与えられた相手の戦略に対して、自分の利得が同じになる戦略が複数個あるときには、相手の利得が大きくなる戦略を選択する。 例7)において、友情ルールが成立すると利得は (8 , 8)になる。 社会がある程度成熟してくると、特別な会話なくとも友情ルールのような“慣習”が成り立ってくる。 らしい…... ほんとかよー!?
ナッシュ均衡論の性格 筆者の熱き思い ゲーム理論を学ぶ意義とは、 ある状況のもとでのプレイヤー相互依存関係を明確に認識し、起こりうる事態を明らかにすることによって、より深く社会を認識することである。 そして、個々のプレイヤーにとっては、いかに行動するかを学びとることであり、政策立案者にとっては、いかなるルールを設計すべきかを学びとることである。