『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル

Slides:



Advertisements
Similar presentations
2016/7/21 情報経済システム論 情報経済システム論:第1回 担当教員 黒田敏史 1. 教員の紹介 黒田 敏史(くろだ としふみ) – 略歴 1978年2月10日生まれ 1996年 神奈川県立藤沢西高校卒業 1997年 東京理科大学理学部物理学科中退 1999年 京都大学経済学部入学 2005年.
Advertisements

社会システム論 第 1 回 システムとは何か 大野正英 経済学部准教授. この授業のねらい 現代社会をシステムという視点から捉 える。 社会の複雑さをシステムというツール を用いることによって、理解する。
経済の仕組みと経済学. 経済学とは 「経世済民」経済 世の中を治め、民の苦しみを救うこと 人々が幸せに暮らすためのしくみでありその活動 = 経済学とは: 「希少な資源を競合する目的のために, 選択・配分 を考える学問」 2.
『モデリング・シミュレーション入門』 井庭 崇 第5回 オートマトン(状態機械)
入門B・ミクロ基礎 (第4回) 第2章 2014年10月13日 2014/10/13.
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
自己重力多体系の 1次元シミュレーション 物理学科4年 宇宙物理学研究室  丸山典宏.
甲南大学『ミクロ経済学』 特殊講義 新旧産業組織論と ネットワーク・エコノミックス 2Kyouikukatudou/3Hijyoukin/2000/Konan2000.html 依田高典.
15分で読む「貨幣の複雑性」 HPO:個人的な意見 ひでき.
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
ゲーム理論・ゲーム理論Ⅰ (第8回) 第5章 不完全競争市場の応用
© Yukiko Abe 2014 All rights reserved
消費者行動 堀 啓造 香川大学経済学部.
協創とシステム 前野 隆司.
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
第三章要約 りんご.
エージェントモデル シミュレーション.
5.チューリングマシンと計算.
5.チューリングマシンと計算.
情報は人の行為に どのような影響を与えるか
Boxed Economy Foundation Model: 社会・経済のエージェントベースモデリング のためのフレームワーク
『コラボレーション技法』 井庭 崇 第3回 創造的思考②:収束思考 慶應義塾大学総合政策学部 専任講師
グループ研究1班 第一章 経営戦略とは何か 雨森 彩 大嶋 健夫 小沢 博之.
イントロダクション.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月19日 古川徹也 2014/12/19.
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
意見形成の場としての SNS、ブログ、ネット論壇
『企業と市場のシミュレーション』 井庭 崇 第4回: シミュレーション作成プロセスとUML
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
第1回応用物理学科セミナー 日時: 5月19日(月) 15:00ー 場所:葛飾キャンパス研究棟8F第2セミナー室 Speaker:鹿野豊氏
エージェントベース経済シミュレーション におけるフレームワークデザイン
集団における適応 知識構造論講座 下嶋研究室          M1 関本 和弘.
『企業と市場のシミュレーション』 井庭 崇 第12回: 貨幣の自生と自壊モデル
マクロ経済学初級I (春学期) 2006年 白井 義昌 4月11日 マクロ経済学初級I.
『企業と市場のシミュレーション』 井庭 崇 第13回: 企業競争の進化的シミュレーションモデル
慶應義塾大学経済学部 グレーヴァ香子 Takako Fujiwara-Greve
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
シミュレーション論Ⅰ 第11回 意思決定とシミュレーション.
退出可能な 社会的ジレンマ実験 小林盾(シカゴ大学) 大浦宏邦(帝京大学) 石原英樹(立教大学) 2003年10月12
箱庭経済シミュレーションの基礎モデル、および政策分析への可能性
『モデリング・シミュレーション入門』 井庭 崇 第1回 イントロダクション
シミュレーション論 Ⅱ 第14回 まとめ.
シミュレーション論 Ⅱ 第15回 まとめ.
経済学とは 経済学は、経済活動を研究対象とする学問。 経済活動とは? 生産・取引・消費 等 なぜ、経済活動を行うのか?
『モデリング・シミュレーション入門』 井庭 崇 第9回 自律分散協調システムと自己組織化のシミュレーション
『モデリング・シミュレーション入門』 井庭 崇 第10回 成長するネットワークのシミュレーション
『モデリング・シミュレーション入門』 井庭 崇 第3回 数理モデリング
『企業と市場のシミュレーション』 井庭 崇 第9回: 成長するネットワークモデル
社会シミュレーションのための モデル作成環境
マクロ経済学初級I (春学期) 2005年 白井 義昌 4月19日 マクロ経済学初級I.
『企業と市場のシミュレーション』 井庭 崇 第6回:シミュレーション作成演習①
意外と身近なゲーム理論 へなちょこ研究室 p.
管理的側面 管理者に必要な経営知識 経営学の基本 ②環境と戦略と競争優位.
『モデリング・シミュレーション入門』 井庭 崇 第8回 シミュレーションによる分析
『企業と市場のシミュレーション』 井庭 崇 第1回 イントロダクション
中級ミクロ経済(2004) 授業予定.
日韓比較労使関係論 2 労使関係論.
『コラボレーション技法』 最終回 魅力的な場としてのSFCをつくる ※今日の配布資料1枚 (最終レポートと宿題について) 井庭 崇
『モデリング・シミュレーション入門』 井庭 崇 第4回 非線形とカオス
理論研究:言語文化研究 担当:細川英雄.
担当 兵庫県立大学大学院 応用情報科学研究科 神戸商科大学 商経学部管理化学科 教授 有馬 昌宏
囚人のジレンマ ―― 裏切りのインセンティブ ――
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
マーケティング.
社会情報学系 研究室ごとの履修モデル (履修推奨科目).
『企業と市場のシミュレーション』 井庭 崇 第7回:シミュレーション作成演習② 第8回:シミュレーション作成演習③
情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター 安田豊.
経済学入門 ミクロ経済学とマクロ経済学 ケインズ経済学と古典派マクロ経済学 経済学の特徴 経済学の基礎概念 部分均衡分析の応用.
第2回 情報科学技術フォーラム Forum on Information Technology (FIT2003)
Presentation transcript:

『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』 第11回: 繰り返し囚人のジレンマモデル いば  たかし 井庭 崇 慶應義塾大学総合政策学部 専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

スケジュール 第 1 回 (4/ 9 金) イントロダクション 第 2 回 (4/16 金) 複雑系と進化の社会システム論 第 1 回 (4/ 9 金) イントロダクション 第 2 回 (4/16 金) 複雑系と進化の社会システム論 第 3 回 (4/30 金) シミュレーションによる分析 第 4 回 (5/ 7 金) シミュレーション作成プロセスとUML 第 5 回 (5/14 金) 概念モデリングとシミュレーションデザイン 第 6 回 (5/21 金) シミュレーション作成演習① 第 7 回 (5/22 土) シミュレーション作成演習② ※補講日(土曜) 第 8 回 (5/22 土) シミュレーション作成演習③ ※補講日(土曜) ※5/29の授業は休講 第 9 回 (6/ 4 金) 成長するネットワークモデル 第10回 (6/11 金) 規格競争のシミュレーションモデル 第11回 (6/18 金) 繰り返し囚人のジレンマモデル 第12回 (6/25 金) 貨幣の自生と自壊モデル 第13回 (7/ 2 金) 企業競争の進化的シミュレーションモデル

配布資料 「マルチエージェントモデルによるバーチャル・マーケットと消費者行動」 復習 配布資料 「マルチエージェントモデルによるバーチャル・マーケットと消費者行動」 井庭崇, 竹中平蔵 第2回進化経済学会 1998年3月 「人工市場アプローチによる家庭用VTRの規格競争シミュレーション」 井庭崇, 竹中平蔵, 武藤佳恭 情報処理学会論文誌:数理モデル化と応用 Vol.42, No.SIG14 (TOM5), 2001年12月発行

復習 事例:家庭用VTRの規格競争 本研究では規格競争の具体的な事例として,日本における家庭用ビデオテープレコーダー(VTR)の規格競争を取り上げる. 家庭用VTRは,1975年にBeta方式,1976年にVHS方式の二つの異なる方式の製品が発売されて以降,多くの企業を巻き込み激しい規格競争が繰り広げられた 結果はVHSが圧勝

復習 仮説の思考実験 複雑系経済学やネットワークの経済学では、「家庭用VTRの規格競争は、規格の互換性の影響で、ポジティブ・フィードバックがはたらき、一人勝ち現象が起こった」という話(仮説)が頻繁に言われる。 その仮説が起こり得ることを示すために、シミュレーションによる分析を行った。 現実的な設定以外のことも含めて試すことにより、地域性の発生や、逆転現象についての示唆が得られた。 また、現実のシェア推移データと合うパラメータセットを推計した。 2規格ではなく3規格の場合の仮想実験も行っている(論文には記載していないが)。

消費者エージェントの意思決定フェーズ 欲求認識 情報探索 購買前代替案評価 購買 処分 復習 消費 購買後代替案評価 ←EBMモデルの基本フェーズに基づく 処分 Engel, J.F., Blackwell, R.D., and Miniard, P.W., Consumer behavior (8th ed.), The Dryden Press, 1995

他者からの影響 復習 人々は孤立しているわけではなく、他の人の影響を受けて意思決定を行う。 孤立した個人 ネットワークのなかの個人 C A B A A

復習 消費者間の相互作用が全くない場合 消費者間の局所的な相互作用がある場合

『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』 第11回: 繰り返し囚人のジレンマモデル いば  たかし 井庭 崇 慶應義塾大学総合政策学部 専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

1 2 3 企業と市場のシミュレーション(第11回) 複雑系と進化のモデル表現 繰り返し囚人のジレンマモデルの紹介 繰り返し囚人のジレンマモデルの改造

1 2 3 企業と市場のシミュレーション(第11回) 複雑系と進化のモデル表現 繰り返し囚人のジレンマモデルの紹介 繰り返し囚人のジレンマモデルの改造

複雑系(Complex System) 自己革新するシステム 広義の定義 狭義の定義 生命、知能、社会 内部状態をもつ構成要素が相互作用するシステム 狭義の定義 構成要素の振舞いのルールが動的に変化するシステム 相互作用 構成要素

複雑系の全体像

複雑系の構成要素

「広義の複雑系」のモデル表現 内部状態によって反応が異なるというモデル このエージェントは、Behaviorのそのときの状態によって、同じイベントに対して異なる反応をする。つまり、State AのときにはAction Aを行い、State BのときにはAction Bを行う。

「狭義の複雑系」のモデル表現 行動のルールが動的に変化するというモデル エージェントは、Behaviorを動的に追加・交換することができ、また、Behaviorを削除したり、Behaviorの状態遷移が完了すると自動的に消滅するようにすることもできる。これらによって、エージェントの振舞いの変化を表現できる。

「進化」のモデル表現 変異を伴う複製が行われるモデル BehaviorやInformationは複製子として扱うことができる。その進化のメカニズムはふつうBehaviorとして記述するが、その一部をInformationとして記述し、保持・交換させることもできる。

1 2 3 企業と市場のシミュレーション(第11回) 複雑系と進化のモデル表現 繰り返し囚人のジレンマモデルの紹介 繰り返し囚人のジレンマモデルの改造

「囚人のジレンマ」モデル? 1950年頃、心理学研究のなかでM.FloodとM.Dresherによって提唱 A.W.Tuckerが「囚人のジレンマ」というストーリー仕立てで広めた 政治学や経済学、社会学など幅広い分野で、利己的な主体間で利害が対立する状況の中で、どのように協調が形成されるのかを調べる枠組みとしてしばしば用いられている。 冷戦時代の米ソの核軍拡競争 会社内の出世競争 技術開発委託先選定 企業合併後の組織統合 Cf. 『MBAゲーム理論』(グロービス・マネジメント・インスティテュート (編), ダイヤモンド社, 1999) Cf. 『ゲーム理論で解く』(中山幹夫, 武藤滋夫, 船木由喜彦 (編), 有斐閣, 2000)

囚人のジレンマ 囚人のジレンマゲームでは、二人のプレイヤーがそれぞれ独立に協調(Cooperation)か裏切り(Defection)かのどちらかの行動をとる。 選択の組合せによって、異なる利得が得られる。 両者が協調すれば3点ずつ 裏切りあえば1点ずつ 片方だけ協調し他方が裏切れば、それぞれ0点と5点 プレイヤーBの行動 3, 3 0, 5 5, 0 1, 1 協調 裏切り プレイヤーAの行動

繰り返し囚人のジレンマゲーム 囚人のジレンマゲームを反復的に行う。 それぞれの試合では決められた回数の対戦が行われ、試合が終了すると最終的な得点が記録される。 すべてのプレイヤーは総当りで他のすべてのプレイヤーと試合を行っていき、総当りが実現するとそのコンテストが終了する。 あらかじめわかっている有限回の対戦であれば、裏切る方がより高い利得を得られることがわかっている。 しかし、いつまで続くかわからない場合には、必ずしもそのような結果にはならず、万能の戦略がないといわれている。

第1回繰り返し囚人のジレンマゲーム大会 1970年代 R. Axelrod 「複雑な戦略で構成される多彩な環境では、どのようなタイプの戦略が成功するかを知るために、私は囚人のジレンマに関するコンピュータ・トーナメントを主催した。」 「選手権の出場者は、経済学者、心理学、社会学、政治学および数学の各分野で活躍するゲーム理論の研究者であり、これらのべ一四人の応募作に、『でたらめ』(RANDOM)というプログラムを加えて、総当りのリーグ戦方式で競わせてみた」。 勝者は『しっぺ返し』(TIT FOR TAT) 最初は協調し、次からは相手が前回とった行動を真似するという戦略である。 『対立と協調の科学:エージェント・ベース・モデルによる複雑系の解明』(ロバート・アクセルロッド, ダイヤモンド社, 2003) 『つきあい方の科学: バクテリアから国際関係まで』 (ロバート・アクセルロッド, HBJ出版局, 1987)

第2回繰り返し囚人のジレンマゲーム大会 第一回の結果を踏まえて、第二回の大会も行われた。 「今度は六つの国から六二人の応募者があった。その大半はコンピュータ愛好家であったが、中には進化生物学者、物理学者、コンピュータ・サイエンスの各教授、それと前回の参加者も五人含まれていた」 またしても勝者は『しっぺ返し』(TFT) 『つきあい方の科学: バクテリアから国際関係まで』 (ロバート・アクセルロッド, HBJ出版局, 1987)

「繰り返し囚人のジレンマゲーム」の位置 「2人プレイヤーの「繰り返し囚人のジレンマゲーム」は、生物学における「大腸菌」のような共通の素材である。この社会科学の「大腸菌」を使うと、共通の枠組みのなかで非常に広範囲な研究が可能である。 実際、「繰り返し囚人のジレンマゲーム」は、進化生物学、コンピュータ・ネットワーク・システムといった多様な分野の問題を研究する標準的なパラダイムとさえなった。 この問題は、非常にわかりやすいために、政治学者、経済学者、社会学者、哲学者、数学者、コンピュータ科学の研究者、進化生物学者をはじめとする多くの人びとがそれについて話しあうことができる。」(ロバート・アクセルロッド) 『対立と協調の科学:エージェント・ベース・モデルによる複雑系の解明』(ロバート・アクセルロッド, ダイヤモンド社, 2003)

今日紹介する簡単な拡張モデル 戦略の模倣を組み込んだモデル 井庭崇, 『社会・経済シミュレーションの基盤構築:複雑系と進化の理論に向けて』, 博士論文, 2003年 井庭崇, 「複雑系と進化のモデル・フレームワーク」, 『進化経済学のフロンティア』, 西部忠(編), 日本評論社, 2004年夏出版予定

戦略(行動ルール) 各プレイヤーは、過去の手を踏まえて次の自分の手を決めるための「戦略」(行動ルール)をもっている。

今回用意した戦略 ALL-C ALL-D RANDOM TFT TF2T FRIEDMAN JOSS PER-CD PER-CCD 相手の手に関係なく、必ず協調する ALL-D 相手の手に関係なく、必ず裏切る RANDOM 相手の手に関係なく、協調と裏切りをランダムに選択する TFT 最初は協調し、次からは相手が前回とった行動を真似する TF2T 最初は協調し、2回連続して相手が裏切ったときに、裏切る FRIEDMAN 最初は協調し、相手が裏切らないかぎり協調を続ける。相手が一度でも裏切ると、それ以降はずっと裏切り続ける JOSS TFTと同様に、最初は協調し、相手に裏切られると裏切り返す。相手が協調した場合には、9割協調して、1割裏切る PER-CD 協調、裏切り、協調、裏切り・・・・を繰り返す PER-CCD 協調、協調、裏切り、協調、協調、裏切り・・・・を繰り返す

戦略(行動ルール)の状態遷移 ALL-C戦略 相手の手に関係なく、必ず協調する

戦略(行動ルール)の状態遷移 ALL-D戦略 相手の手に関係なく、必ず裏切る

戦略(行動ルール)の状態遷移 RANDOM戦略 相手の手に関係なく、協調と裏切りをランダムに選択する

戦略(行動ルール)の状態遷移 TFT戦略 最初は協調(C)し、次からは相手が前回とった行動を真似する

戦略(行動ルール)の状態遷移 TF2T戦略 最初は協調し、2回連続して相手が裏切ったときに、裏切る

戦略(行動ルール)の状態遷移 FRIEDMAN戦略 最初は協調し、相手が裏切らないかぎり協調を続ける。相手が一度でも裏切ると、それ以降はずっと裏切り続ける

戦略(行動ルール)の状態遷移 JOSS戦略

戦略(行動ルール)の状態遷移 PER-CD戦略 協調、裏切り、協調、裏切り・・・・を繰り返す

戦略(行動ルール)の状態遷移 PERCCD戦略

1回のコンテストの結果

戦略の変更

戦略模倣メカニズムの導入 各コンテスト終了後に、それぞれのPlayerエージェントが自分より強い相手の戦略を模倣し、コンテストを繰り返していく。 模倣相手の候補選択は、シミュレーションの設定によって、次のいずれかの方法で行うことにする。 試合結果による選択 コンテスト結果による選択 候補が複数の場合には、その中からランダムに選択することにする。

試合結果による戦略模倣 個別対戦において、自分に勝ったプレイヤーの戦略を採用する。すなわち、個別対戦というミクロ的な結果に基づく。

コンテスト結果による戦略模倣 コンテストにおける総得点が、自分よりも高いプレイヤーの戦略を採用する。すなわち、コンテスト総得点というマクロ的な結果に基づく。

試合結果による戦略模倣のシミュレーション結果 1試合200対戦で、各戦略ごとに2人ずつPlayerエージェント 数ステップで「ALL-D」戦略のみになる。 平均得点は初期状態よりも低い水準になる。最終的に「ALL-D」戦略のみになった状況では全員が裏切りあうため、社会的にみて得点が低い水準になる。

コンテスト結果による戦略模倣のシミュレーション結果 1試合200対戦で、各戦略ごとに2人ずつPlayerエージェント 「FRIEDMAN」戦略や「TFT」戦略が広まる。 平均得点は初期状態よりも高い水準になる。平均得点が高いのは、広まった戦略における協調の効果である。最終的に「FRIEDMAN」戦略や「TFT」戦略のみになったときには、すべての対戦で協調するため、社会的にみて得点が高い水準になるのである。

複雑系と進化のモデルとしての側面 広義の複雑系 狭義の複雑系 進化 Playerエージェントは、同じ戦略を持っている場合でも、それまでの経緯によって(選択の履歴によって)、協調することもあれば裏切ることもある。自分の内部状態によって反応が異なるという点において、広義の複雑系のモデルになっている。 狭義の複雑系 それぞれのPlayerエージェントが戦略の変更を行うが、これは行動のルールが変化するという意味で、狭義の複雑系のモデルになっている。 進化 戦略が模倣されて受け継がれることから、進化的なモデルといえる。

1 2 3 企業と市場のシミュレーション(第11回) 複雑系と進化のモデル表現 繰り返し囚人のジレンマモデルの紹介 繰り返し囚人のジレンマモデルの改造

『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』 第11回: 繰り返し囚人のジレンマモデル いば  たかし 井庭 崇 慶應義塾大学総合政策学部 専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

囚人のジレンマに関する文献 『対立と協調の科学:エージェント・ベース・モデルによる複雑系の解明』(ロバート・アクセルロッド, ダイヤモンド社, 2003) 『つきあい方の科学: バクテリアから国際関係まで』(ロバート・アクセルロッド, HBJ出版局, 1987)