上級価格理論II 第3回 2011年後期 中村さやか
今日やること 2. 完備情報の動学ゲーム 2.1 完備完全情報の動学ゲーム 2.1.A 理論:逆向き推論法 2. 完備情報の動学ゲーム 2.1 完備完全情報の動学ゲーム 2.1.A 理論:逆向き推論法 2.2.B シュタッケルベルクの複占モデル 2.2.D 逐次的交渉
完全情報の動学ゲームの例 2手番ゲーム (two-stage game) i=1,2 プレーヤー1がプレーヤー2に1000ドル渡すか渡さないか決める プレーヤー2はプレーヤー1の選択を見たうえで、手りゅう弾を爆発させるか決める 手りゅう弾を爆発させるとプレーヤー1,2とも死亡 完全情報 (perfect information) 各プレーヤーが自分の手番になったとき、それまでのゲームの歴史を完全に知っている 歴史 (history): 各プレーヤーの選択の記録
信頼性のない脅し プレーヤー1がプレーヤー2に1000ドル渡すか渡さないか決める プレーヤー2はプレーヤー1の選択を見たうえで、手りゅう弾を爆発させるか決める 手りゅう弾を爆発させるとプレーヤー1,2とも死亡 ナッシュ均衡は2つ プレーヤー1は「渡さない」、プレーヤー2は「プレーヤー1が渡しても渡さなくても爆発させない」をそれぞれ選択 プレーヤー1は「渡す」、プレーヤー2は「プレーヤー1が渡すなら爆発させない、プレーヤー2が渡さないなら爆発させる」をそれぞれ選択 ⇒信憑性のない脅し (ハッタリが効いている) こういうもっともらしくない均衡を除外する均衡概念は?
完備完全情報の動学ゲーム 次に扱う完備完全情報の動学ゲーム: プレーヤー1が実行可能な行動の集合A1から行動a1を選ぶ プレーヤー2はa1を見たうえで実行可能な行動の集合A2から行動a2を選ぶ それぞれの利得 u1 (a1, a2), u2 (a1, a2) が決まる 特徴: 手番が逐次的に回ってくる 次の手番の前にそれまでの手番でどういう行動が選ばれたか全員にわかっている 実行可能な行動の組み合わせで決まる各プレーヤーの利得が共有知識
逆向き推論法 (backward induction) ゲームを後ろから解いていく 第二段階でプレーヤー2はプレーヤー1が取った行動a1を所与として自分の行動を選ぶので、プレーヤー2の問題は: Max u2 (a1, a2) a2∊A2 A1に属する度の行動a1についても上の最大化問題が1つだけの解を持つとすると仮定し、その解を反応(最適反応)と呼び、 R2 (a1)と書く プレーヤー1はプレーヤー2の反応を正しく予測して行動するので、第一段階におけるプレーヤー1の問題は Max u1 (a1, R2 (a1)) a1∊A1 上の問題の解をa*1で表し、(a*1, R2 (a*1))を逆向き推論法による結果(backward induction outcome)と定義する
3手番ゲーム プレーヤー1はLまたはRを選ぶ Lならゲームは終わり、利得は(2,0) プレーヤー2はプレーヤー1の選択を見て、RならばL’かR’のどちらかを選ぶ L’ならゲームは終わり、利得は(1,1) プレーヤー1はプレーヤー2の選択を見て(かつ自分の第1段階での選択も念頭に置いて)、もしそれらがR, R’ならばL’’かR’’のどちらかを選ぶ どちらの場合もゲームは終わり L’’なら利得は(3,0)、R’’なら利得は(0,2)
Game Tree 1 L R 2 (2,0) L’ R’ 1 (1,1) L’’ R’’ (3,0) (0,2)
逆向き推論法の前提: プレーヤーの合理性が共有知識 プレーヤーが二人とも合理的であるにもかかわらず、プレーヤー1がLではなくRを選ぶことはありうるか? ケース1: プレーヤー1が合理的であることは共有知識であるが、プレーヤー2が合理的であることは共有知識でない ⇒プレーヤー2がL’でなくR’を選ぶかもしれないとプレーヤー1が予測 ケース2: プレーヤー2が合理的であることは共有知識であるが、プレーヤー1が合理的であることは共有知識でない ⇒プレーヤー1がL’’でなくR’’を選ぶかもしれないとプレーヤー2が予測するとプレーヤー1が予測
シュタッケルベルク・モデル Stackelberg, 1934 寡占市場: 1つの巨大企業とその他の企業 寡占市場: 1つの巨大企業とその他の企業 支配的(先導的)企業が先に生産量/価格を決め、それを見て次に従属的(追従的)企業が生産量/価格を決める (ここでは複占市場で生産量を決めるモデルを紹介) 例: GMとフォード・クライスラー コカコーラとサントリー・キリン
シュタッケルベルク・モデル: 仮定 企業が逐次的に行動する以外はクールノー・モデルと同じ 複占(duopoly): 企業1,2 シュタッケルベルク・モデル: 仮定 企業が逐次的に行動する以外はクールノー・モデルと同じ 複占(duopoly): 企業1,2 qi =企業iの生産量, i =1,2 ⇒ 総生産量: Q= q1 + q2 P(Q) = a - Q (a > 0) = 総生産量Qのもとで需給が一致する価格 企業iの総費用 = Ci(qi) = cqi, (0 < c < a) ⇒ 固定費用ゼロ、限界費用はcで一定 企業1が最初に生産量を決定し、企業2がそれを見てから次に生産量を決定
企業2の反応関数 企業2の最適化問題: Max π2(q1, q2) = Max q2 (a - q1 - q2 - c) 注意: 企業1の生産量は企業2にとって所与(定数) 1階の条件(π2(q1, q2)をq2について偏微分して0とおく): a - q1 - 2q2 - c=0 これをq2について解くと q2 = (a - c - q1 )/2 ⇒ 企業2の反応関数は R2 (q1) = (a - c - q1 )/2 企業1の生産量によって企業2の生産量が決定 ⇒企業1はこれを正しく予想して行動する
企業1の行動 企業1の最適化問題: Max π1(q1, R2 (q1)) π1(q1, R2 (q1)) = q1 (a - q1 - R2 (q1) - c) = q1 (a – c - q1 - (a - c - q1 )/2 ) = q1 (a - c - q1 )/2 注意: 企業2の生産量は企業1にとって所与ではない 1階の条件(π1(q1)をq1について微分して0とおく): a - c - 2q*1 =0 これをq1について解くと q*1 = (a - c)/2 ⇒ 企業2の供給量は q*2 = R2 (q*1) = (a - c - q*1 )/2 = (a - c - (a - c)/2 )/2 =(a-c)/4
クールノー・モデルとの比較 クールノー (C) シュタッケル ベルク (S) 企業1の生産量 (a-c)/3 (a-c)/2 企業2の生産量 総生産量 2(a-c)/3 3(a-c)/4 (S)のほうが(C)より総生産量が多い⇒価格が低い 企業1は(S)で(C)と同じ生産量を選んで(C)と同じ利潤を得ることもできたがそうしなかった ⇒企業1は(S)では(C)より多くの利潤を得ている (S)では(C)より価格が低い & 企業2の生産量が少ない ⇒企業2は(S)では(C)より少ない利潤を得ている
クールノー・モデルとの比較 続き もし企業2が企業1の生産量を知らずに生産量を選ぶ(そしてそれを企業1も分かっている)ならば、シュタッケルベルク・モデルではなくクールノー・モデルになる 企業2が企業1の生産量を知っており、さらにそのことを企業1に知られていることが企業2を不利にしている 1人の意思決定問題では情報を持つことでより不利になることはありえないが、ゲーム理論では「より多くの情報を持っていると相手に知られること」で不利になることがある
3期間の逐次的交渉ゲーム 2人のプレーヤー i=1,2: 2人とも危険中立的 プレーヤーiの割引率はδi (0<δi<1) 1(万円)の分け方(1の取り分、2の取り分)を決める ルール: t=1: 1が(1の取り分、2の取り分)=(s1, 1- s1)を提案する 2が提案を受け入れるか拒否するか決める 受け入れ ⇒ (s1, 1- s1)で分ける 拒否 ⇒ 2が分け方(s2, 1-s2)を提案する t=2: 1が提案を受け入れるか拒否するか決める 受け入れ ⇒ (s2, 1-s2)で分ける 拒否 ⇒ t=3に続く t=3: (s, 1-s)で分ける (sの値は外生的に決まっている)
ナッシュ均衡はたくさんある 例) 2は自分の取り分が1/2以上なら受け入れ、1/2未満なら拒否 1は(1/2, 1/2)を提案 実は、どんな分け方もナッシュ均衡になる
逆向き推論法: 最終段階の意思決定 t=2: 1が提案を受け入れるか拒否するか決める 受け入れ ⇒ (s2, 1-s2)で分ける t=3: (s, 1-s)で分ける (sの値は外生的に決まっている) 仮定: 無差別ならば受諾する 受諾した場合の1の取り分の割引価値: s2 拒否した場合の1の取り分の割引価値: δ1s 1は s2≧δ1s ならば受諾し、 s2<δ1s ならば拒否する
逆向き推論法: プレーヤー2の提案 2が分け方(s2, 1-s2)を提案する s2≧δ1s ならば1が受諾し、(s2, 1-s2)で分ける 「交渉力の原理」 提案する側は、相手が受け入れても拒否してもちょうど無差別になる水準まで相手の取り分を下げることができる
逆向き推論法: プレーヤー2の受諾/拒否 仮定: 無差別ならば受諾する 1が提案した(s1, 1- s1)を受け入れるか拒否するか 仮定: 無差別ならば受諾する 1が提案した(s1, 1- s1)を受け入れるか拒否するか 受け入れ ⇒ 取り分の割引価値は 1- s1 拒否 ⇒ 2が分け方(δ1s, 1-δ1s)を提案し、1はそれを受諾 ⇒ 取り分の割引価値は δ2 (1-δ1s) 1- s1 ≧ δ2 (1-δ1s) ならば受け入れ 1- s1 < δ2 (1-δ1s) ならば拒否 s1 ≦ 1 - δ2 (1-δ1s) ならば受け入れ s1 > 1 - δ2 (1-δ1s) ならば拒否
逆向き推論法: 最初の意思決定 仮定: 無差別ならば受諾する 1が(s1, 1- s1)をどのように提案するか? 仮定: 無差別ならば受諾する 1が(s1, 1- s1)をどのように提案するか? s1 ≦ 1 - δ2 (1-δ1s) ならば2が受け入れ⇒ (s1, 1- s1)で分ける ⇒ 1の取り分の割引価値はs1 s1 > 1 - δ2 (1-δ1s) ならば2が拒否 ⇒ (δ1s, 1- δ1s)で分ける ⇒ 1の取り分の割引価値はδ12s s1 =1 - δ2 (1-δ1s) にするか、2に拒否される提案をするか δ1とδ2が十分近いならば、2に拒否される提案をした場合の 取り分の割引価値 δ12s より s1=1-δ2(1-δ1s) を提案した場の 取り分の割引価値 1-δ2(1-δ1s) の方が大きい ⇒ 1は(1-δ2(1-δ1s), δ2(1-δ1s))を提案、2は受け入れ
無限期の逐次的交渉ゲーム 2人のプレーヤー i=1,2: 2人とも危険中立的 プレーヤーiの割引率はδi (0<δi<1) 1(万円)の分け方(1の取り分、2の取り分)を決める ルール: t=1: 1が(1の取り分、2の取り分)=(s1, 1- s1)を提案する 2が提案を受け入れるか拒否するか決める 受け入れ ⇒ (s1, 1- s1)で分ける 拒否 ⇒ 2が分け方(s2, 1-s2)を提案する t=2: 1が提案を受け入れるか拒否するか決める 受け入れ ⇒ (s2, 1-s2)で分ける 拒否 ⇒ 1が分け方(s’1, 1- s’1)を提案する t=3: ・・・これを無限に繰り返す
ナッシュ均衡はたくさんある 例) 1は(1, 0)を必ず提案し、それ以外の分け方は拒否 2は1の提案は何でも受け入れる 自分も(1, 0)を提案 ⇒ 0時点では互いに最適反応
逆向き推論法 逆向き推論法によって最後から解いていくには最後の手番が必要だが、無限期だと最後は存在しない 第3期から始まるゲームはゲーム全体(第1期から始まるゲーム)と全く同じ 第3期から始まるゲームでの分け方が(s,1-s)であると仮定 ⇒ このゲームは3期間のゲームとして解くことができる ⇒ 1は最初に(1-δ2(1-δ1s), δ2(1-δ1s))を提案、2は受け入れ 定常性を持つ均衡を仮定すると、第1期から始まるゲームの分け方は第3期から始まるゲームの分け方 と同じはず ⇒ s=1-δ2(1-δ1s), 1-s=δ2(1-δ1s) ⇒ s=(1-δ2)/(1-δ1δ2), 1-s=δ2(1-δ1)/(1-δ1δ2) 1は最初に((1-δ2)/(1-δ1δ2), δ2(1-δ1)/(1-δ1δ2))を提案、2は受け入れ
割引率と交渉力 (s, 1-s)=((1-δ2)/(1-δ1δ2), δ2(1-δ1)/(1-δ1δ2))で分配 ⇒ 先に提案するほうが有利 ⇒ δ→1のとき(我慢強くなる、もしくは提案と再提案の間の時間が短くなる)、 (s, 1-s)→(1/2, 1/2) δ2が一定で δ1→1のとき、 (s, 1-s) →(1, 0) δ1が一定で δ2→1のとき、 (s, 1-s) →(0, 1) ⇒ 我慢強いほうが多くの分け前を得る