『企業と市場のシミュレーション』井庭崇第１１回：繰り返し囚人のジレンマモデル

Slides:

Advertisements

Similar presentations

2016/7/21 情報経済システム論情報経済システム論：第１回担当教員黒田敏史 1. 教員の紹介黒田敏史（くろだとしふみ） – 略歴１９７８年２月１０日生まれ１９９６年神奈川県立藤沢西高校卒業１９９７年東京理科大学理学部物理学科中退１９９９年京都大学経済学部入学２００５年.

Advertisements

社会システム論第 1 回システムとは何か大野正英経済学部准教授. この授業のねらい現代社会をシステムという視点から捉える。社会の複雑さをシステムというツールを用いることによって、理解する。

経済の仕組みと経済学. 経済学とは「経世済民」経済世の中を治め、民の苦しみを救うこと人々が幸せに暮らすためのしくみでありその活動＝経済学とは：「希少な資源を競合する目的のために, 選択・配分を考える学問」 2.

『モデリング・シミュレーション入門』井庭崇第５回オートマトン（状態機械）

入門B・ミクロ基礎（第４回）第2章 2014年10月13日 2014/10/13.

ゲーム理論・ゲーム理論Ⅰ（第２回）第2章戦略形ゲームの基礎

自己重力多体系の１次元シミュレーション物理学科４年宇宙物理学研究室　丸山典宏.

甲南大学『ミクロ経済学』特殊講義新旧産業組織論とネットワーク・エコノミックス 2Kyouikukatudou/3Hijyoukin/2000/Konan2000.html 依田高典.

１５分で読む「貨幣の複雑性」 HPO:個人的な意見ひでき.

シミュレーション論Ⅰ 第13回意思決定とシミュレーション.

ゲーム理論・ゲーム理論Ⅰ （第８回）第５章不完全競争市場の応用

© Yukiko Abe 2014 All rights reserved

消費者行動堀啓造香川大学経済学部.

協創とシステム前野　隆司.

ゲーム理論・ゲーム理論Ⅰ （第６回）第４章戦略形ゲームの応用

第三章要約りんご.

エージェントモデルシミュレーション.

5．チューリングマシンと計算.

5．チューリングマシンと計算.

情報は人の行為にどのような影響を与えるか

Boxed Economy Foundation Model: 社会・経済のエージェントベースモデリングのためのフレームワーク

『コラボレーション技法』井庭崇第３回創造的思考②：収束思考慶應義塾大学総合政策学部専任講師

グループ研究１班第一章　経営戦略とは何か雨森彩大嶋健夫小沢博之.

イントロダクション.

初級ミクロ経済学－ゲーム理論入門－ 2014年12月19日古川徹也 2014/12/19.

A班ランダム選択に一言加えたら･･･成田幸弘橋本剛嶌村都.

政策決定のプロセス政策過程論公共選択ゲームの理論.

意見形成の場としての SNS、ブログ、ネット論壇

『企業と市場のシミュレーション』井庭崇第４回：シミュレーション作成プロセスとＵＭＬ

初級ミクロ経済学－ゲーム理論入門－ 2014年12月15日古川徹也 2014年12月15日初級ミクロ経済学.

第１回応用物理学科セミナー日時： 5月19日（月） 1５:00ー場所：葛飾キャンパス研究棟８Ｆ第２セミナー室 Speaker：鹿野豊氏

エージェントベース経済シミュレーションにおけるフレームワークデザイン

集団における適応知識構造論講座　下嶋研究室　　　　　　　　　Ｍ１　関本　和弘.

『企業と市場のシミュレーション』井庭崇第１２回：貨幣の自生と自壊モデル

マクロ経済学初級I　（春学期） 2006年白井　義昌 4月11日マクロ経済学初級I.

『企業と市場のシミュレーション』井庭崇第１３回：企業競争の進化的シミュレーションモデル

慶應義塾大学経済学部グレーヴァ香子 Takako Fujiwara-Greve

新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

シミュレーション論Ⅰ 第11回意思決定とシミュレーション.

退出可能な社会的ジレンマ実験小林盾（シカゴ大学）大浦宏邦（帝京大学）石原英樹（立教大学） 2003年10月12

箱庭経済シミュレーションの基礎モデル、および政策分析への可能性

『モデリング・シミュレーション入門』井庭崇第１回イントロダクション

シミュレーション論 Ⅱ 第１４回まとめ.

シミュレーション論 Ⅱ 第１５回まとめ.

経済学とは経済学は、経済活動を研究対象とする学問。経済活動とは？生産・取引・消費等なぜ、経済活動を行うのか？

『モデリング・シミュレーション入門』井庭崇第９回自律分散協調システムと自己組織化のシミュレーション

『モデリング・シミュレーション入門』井庭崇第１０回成長するネットワークのシミュレーション

『モデリング・シミュレーション入門』井庭崇第3回数理モデリング

『企業と市場のシミュレーション』井庭崇第９回：成長するネットワークモデル

社会シミュレーションのためのモデル作成環境

マクロ経済学初級I　（春学期） 2005年白井　義昌 4月19日マクロ経済学初級I.

『企業と市場のシミュレーション』井庭崇第６回：シミュレーション作成演習①

意外と身近なゲーム理論へなちょこ研究室 p.

管理的側面管理者に必要な経営知識経営学の基本 ②環境と戦略と競争優位.

『モデリング・シミュレーション入門』井庭崇第８回シミュレーションによる分析

『企業と市場のシミュレーション』井庭崇第１回イントロダクション

中級ミクロ経済(2004) 授業予定.

日韓比較労使関係論２労使関係論.

『コラボレーション技法』最終回魅力的な場としてのSFCをつくる ※今日の配布資料１枚（最終レポートと宿題について）井庭崇

『モデリング・シミュレーション入門』井庭崇第４回非線形とカオス

理論研究：言語文化研究担当：細川英雄.

担当兵庫県立大学大学院応用情報科学研究科神戸商科大学商経学部管理化学科教授有馬昌宏

囚人のジレンマ ―― 裏切りのインセンティブ ――

第Ⅰ部　非協力ゲームの理論第6章　情報の価値 2008/07/01(火) ゲーム理論合宿Ｍ２　渡辺美穂.

マーケティング.

社会情報学系研究室ごとの履修モデル（履修推奨科目）.

『企業と市場のシミュレーション』井庭崇第７回：シミュレーション作成演習② 第８回：シミュレーション作成演習③

情報処理の概念 #0 概説 / 2002 (秋) 一般教育研究センター安田豊.

経済学入門ミクロ経済学とマクロ経済学ケインズ経済学と古典派マクロ経済学経済学の特徴経済学の基礎概念部分均衡分析の応用.

第２回情報科学技術フォーラム Forum on Information Technology (FIT2003)

Presentation transcript:

『企業と市場のシミュレーション』井庭崇第１１回：繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』第１１回：繰り返し囚人のジレンマモデルいば　　たかし井庭崇慶應義塾大学総合政策学部専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

スケジュール第１回 (4/ 9 金) イントロダクション第２回 (4/16 金) 複雑系と進化の社会システム論第１回 (4/ 9 金)　イントロダクション第２回 (4/16 金)　複雑系と進化の社会システム論第３回 (4/30 金)　シミュレーションによる分析第４回 (5/ 7 金)　シミュレーション作成プロセスとＵＭＬ第５回 (5/14 金)　概念モデリングとシミュレーションデザイン第６回 (5/21 金)　シミュレーション作成演習① 第７回 (5/22 土)　シミュレーション作成演習② ※補講日（土曜）第８回 (5/22 土)　シミュレーション作成演習③ ※補講日（土曜） ※5/29の授業は休講第９回 (6/ 4 金)　成長するネットワークモデル第１０回 (6/11 金)　規格競争のシミュレーションモデル第１１回 (6/18 金)　繰り返し囚人のジレンマモデル第１２回 (6/25 金)　貨幣の自生と自壊モデル第１３回 (7/ 2 金)　企業競争の進化的シミュレーションモデル

配布資料「マルチエージェントモデルによるバーチャル・マーケットと消費者行動」復習配布資料「マルチエージェントモデルによるバーチャル・マーケットと消費者行動」井庭崇, 竹中平蔵第2回進化経済学会 1998年3月「人工市場アプローチによる家庭用VTRの規格競争シミュレーション」井庭崇, 竹中平蔵, 武藤佳恭情報処理学会論文誌：数理モデル化と応用 Vol.42, No.SIG14 (TOM5), 2001年12月発行

復習事例：家庭用VTRの規格競争本研究では規格競争の具体的な事例として，日本における家庭用ビデオテープレコーダー（VTR）の規格競争を取り上げる．家庭用VTRは，1975年にBeta方式，1976年にVHS方式の二つの異なる方式の製品が発売されて以降，多くの企業を巻き込み激しい規格競争が繰り広げられた結果はVHSが圧勝

復習仮説の思考実験複雑系経済学やネットワークの経済学では、「家庭用VTRの規格競争は、規格の互換性の影響で、ポジティブ・フィードバックがはたらき、一人勝ち現象が起こった」という話（仮説）が頻繁に言われる。その仮説が起こり得ることを示すために、シミュレーションによる分析を行った。現実的な設定以外のことも含めて試すことにより、地域性の発生や、逆転現象についての示唆が得られた。また、現実のシェア推移データと合うパラメータセットを推計した。２規格ではなく３規格の場合の仮想実験も行っている（論文には記載していないが）。

消費者エージェントの意思決定フェーズ欲求認識情報探索購買前代替案評価購買処分復習消費購買後代替案評価 ←EBMモデルの基本フェーズに基づく処分 Engel, J.F., Blackwell, R.D., and Miniard, P.W., Consumer behavior (8th ed.), The Dryden Press, 1995

他者からの影響復習人々は孤立しているわけではなく、他の人の影響を受けて意思決定を行う。孤立した個人ネットワークのなかの個人 C A B A A

復習消費者間の相互作用が全くない場合消費者間の局所的な相互作用がある場合

『企業と市場のシミュレーション』井庭崇第１１回：繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』第１１回：繰り返し囚人のジレンマモデルいば　　たかし井庭崇慶應義塾大学総合政策学部専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

1 2 3 企業と市場のシミュレーション（第１１回）複雑系と進化のモデル表現繰り返し囚人のジレンマモデルの紹介繰り返し囚人のジレンマモデルの改造

1 2 3 企業と市場のシミュレーション（第１１回）複雑系と進化のモデル表現繰り返し囚人のジレンマモデルの紹介繰り返し囚人のジレンマモデルの改造

複雑系（Complex System）自己革新するシステム広義の定義狭義の定義生命、知能、社会内部状態をもつ構成要素が相互作用するシステム狭義の定義構成要素の振舞いのルールが動的に変化するシステム相互作用構成要素

複雑系の全体像

複雑系の構成要素

「広義の複雑系」のモデル表現内部状態によって反応が異なるというモデルこのエージェントは、Behaviorのそのときの状態によって、同じイベントに対して異なる反応をする。つまり、State AのときにはAction Aを行い、State BのときにはAction Bを行う。

「狭義の複雑系」のモデル表現行動のルールが動的に変化するというモデルエージェントは、Behaviorを動的に追加・交換することができ、また、Behaviorを削除したり、Behaviorの状態遷移が完了すると自動的に消滅するようにすることもできる。これらによって、エージェントの振舞いの変化を表現できる。

「進化」のモデル表現変異を伴う複製が行われるモデル BehaviorやInformationは複製子として扱うことができる。その進化のメカニズムはふつうBehaviorとして記述するが、その一部をInformationとして記述し、保持・交換させることもできる。

1 2 3 企業と市場のシミュレーション（第１１回）複雑系と進化のモデル表現繰り返し囚人のジレンマモデルの紹介繰り返し囚人のジレンマモデルの改造

「囚人のジレンマ」モデル？ 1950年頃、心理学研究のなかでM.FloodとM.Dresherによって提唱 A.W.Tuckerが「囚人のジレンマ」というストーリー仕立てで広めた政治学や経済学、社会学など幅広い分野で、利己的な主体間で利害が対立する状況の中で、どのように協調が形成されるのかを調べる枠組みとしてしばしば用いられている。冷戦時代の米ソの核軍拡競争会社内の出世競争技術開発委託先選定企業合併後の組織統合 Cf. 『MBAゲーム理論』（グロービス・マネジメント・インスティテュート (編), ダイヤモンド社, 1999） Cf. 『ゲーム理論で解く』（中山幹夫, 武藤滋夫, 船木由喜彦 (編), 有斐閣, 2000）

囚人のジレンマ囚人のジレンマゲームでは、二人のプレイヤーがそれぞれ独立に協調(Cooperation)か裏切り(Defection)かのどちらかの行動をとる。選択の組合せによって、異なる利得が得られる。両者が協調すれば3点ずつ裏切りあえば1点ずつ片方だけ協調し他方が裏切れば、それぞれ0点と5点プレイヤーＢの行動 3, 3 0, 5 5, 0 1, 1 協調裏切りプレイヤーＡの行動

繰り返し囚人のジレンマゲーム囚人のジレンマゲームを反復的に行う。それぞれの試合では決められた回数の対戦が行われ、試合が終了すると最終的な得点が記録される。すべてのプレイヤーは総当りで他のすべてのプレイヤーと試合を行っていき、総当りが実現するとそのコンテストが終了する。あらかじめわかっている有限回の対戦であれば、裏切る方がより高い利得を得られることがわかっている。しかし、いつまで続くかわからない場合には、必ずしもそのような結果にはならず、万能の戦略がないといわれている。

第１回繰り返し囚人のジレンマゲーム大会 1970年代 R. Axelrod 「複雑な戦略で構成される多彩な環境では、どのようなタイプの戦略が成功するかを知るために、私は囚人のジレンマに関するコンピュータ・トーナメントを主催した。」「選手権の出場者は、経済学者、心理学、社会学、政治学および数学の各分野で活躍するゲーム理論の研究者であり、これらのべ一四人の応募作に、『でたらめ』(RANDOM)というプログラムを加えて、総当りのリーグ戦方式で競わせてみた」。勝者は『しっぺ返し』(TIT FOR TAT) 最初は協調し、次からは相手が前回とった行動を真似するという戦略である。『対立と協調の科学：エージェント・ベース・モデルによる複雑系の解明』（ロバート・アクセルロッド, ダイヤモンド社, 2003）『つきあい方の科学: バクテリアから国際関係まで』（ロバート・アクセルロッド, HBJ出版局, 1987）

第２回繰り返し囚人のジレンマゲーム大会第一回の結果を踏まえて、第二回の大会も行われた。「今度は六つの国から六二人の応募者があった。その大半はコンピュータ愛好家であったが、中には進化生物学者、物理学者、コンピュータ・サイエンスの各教授、それと前回の参加者も五人含まれていた」またしても勝者は『しっぺ返し』(TFT) 『つきあい方の科学: バクテリアから国際関係まで』（ロバート・アクセルロッド, HBJ出版局, 1987）

「繰り返し囚人のジレンマゲーム」の位置「２人プレイヤーの「繰り返し囚人のジレンマゲーム」は、生物学における「大腸菌」のような共通の素材である。この社会科学の「大腸菌」を使うと、共通の枠組みのなかで非常に広範囲な研究が可能である。実際、「繰り返し囚人のジレンマゲーム」は、進化生物学、コンピュータ・ネットワーク・システムといった多様な分野の問題を研究する標準的なパラダイムとさえなった。この問題は、非常にわかりやすいために、政治学者、経済学者、社会学者、哲学者、数学者、コンピュータ科学の研究者、進化生物学者をはじめとする多くの人びとがそれについて話しあうことができる。」（ロバート・アクセルロッド）『対立と協調の科学：エージェント・ベース・モデルによる複雑系の解明』（ロバート・アクセルロッド, ダイヤモンド社, 2003）

今日紹介する簡単な拡張モデル戦略の模倣を組み込んだモデル井庭崇, 『社会・経済シミュレーションの基盤構築：複雑系と進化の理論に向けて』, 博士論文, 2003年井庭崇, 「複雑系と進化のモデル・フレームワーク」, 『進化経済学のフロンティア』, 西部忠（編）, 日本評論社, 2004年夏出版予定

戦略（行動ルール）各プレイヤーは、過去の手を踏まえて次の自分の手を決めるための「戦略」(行動ルール)をもっている。

今回用意した戦略 ALL-C ALL-D RANDOM TFT TF2T FRIEDMAN JOSS PER-CD PER-CCD 相手の手に関係なく、必ず協調する ALL-D 相手の手に関係なく、必ず裏切る RANDOM 相手の手に関係なく、協調と裏切りをランダムに選択する TFT 最初は協調し、次からは相手が前回とった行動を真似する TF2T 最初は協調し、2回連続して相手が裏切ったときに、裏切る FRIEDMAN 最初は協調し、相手が裏切らないかぎり協調を続ける。相手が一度でも裏切ると、それ以降はずっと裏切り続ける JOSS TFTと同様に、最初は協調し、相手に裏切られると裏切り返す。相手が協調した場合には、9割協調して、1割裏切る PER-CD 協調、裏切り、協調、裏切り・・・・を繰り返す PER-CCD 協調、協調、裏切り、協調、協調、裏切り・・・・を繰り返す

戦略（行動ルール）の状態遷移 ALL-C戦略相手の手に関係なく、必ず協調する

戦略（行動ルール）の状態遷移 ALL-D戦略相手の手に関係なく、必ず裏切る

戦略（行動ルール）の状態遷移 RANDOM戦略相手の手に関係なく、協調と裏切りをランダムに選択する

戦略（行動ルール）の状態遷移 TFT戦略最初は協調（Ｃ）し、次からは相手が前回とった行動を真似する

戦略（行動ルール）の状態遷移 TF2T戦略最初は協調し、2回連続して相手が裏切ったときに、裏切る

戦略（行動ルール）の状態遷移 FRIEDMAN戦略最初は協調し、相手が裏切らないかぎり協調を続ける。相手が一度でも裏切ると、それ以降はずっと裏切り続ける

戦略（行動ルール）の状態遷移 JOSS戦略

戦略（行動ルール）の状態遷移 PER-CD戦略協調、裏切り、協調、裏切り・・・・を繰り返す

戦略（行動ルール）の状態遷移 PERCCD戦略

１回のコンテストの結果

戦略の変更

戦略模倣メカニズムの導入各コンテスト終了後に、それぞれのPlayerエージェントが自分より強い相手の戦略を模倣し、コンテストを繰り返していく。模倣相手の候補選択は、シミュレーションの設定によって、次のいずれかの方法で行うことにする。試合結果による選択コンテスト結果による選択候補が複数の場合には、その中からランダムに選択することにする。

試合結果による戦略模倣個別対戦において、自分に勝ったプレイヤーの戦略を採用する。すなわち、個別対戦というミクロ的な結果に基づく。

コンテスト結果による戦略模倣コンテストにおける総得点が、自分よりも高いプレイヤーの戦略を採用する。すなわち、コンテスト総得点というマクロ的な結果に基づく。

試合結果による戦略模倣のシミュレーション結果 1試合200対戦で、各戦略ごとに2人ずつPlayerエージェント数ステップで「ALL-D」戦略のみになる。平均得点は初期状態よりも低い水準になる。最終的に「ALL-D」戦略のみになった状況では全員が裏切りあうため、社会的にみて得点が低い水準になる。

コンテスト結果による戦略模倣のシミュレーション結果 1試合200対戦で、各戦略ごとに2人ずつPlayerエージェント「FRIEDMAN」戦略や「TFT」戦略が広まる。平均得点は初期状態よりも高い水準になる。平均得点が高いのは、広まった戦略における協調の効果である。最終的に「FRIEDMAN」戦略や「TFT」戦略のみになったときには、すべての対戦で協調するため、社会的にみて得点が高い水準になるのである。

複雑系と進化のモデルとしての側面広義の複雑系狭義の複雑系進化 Playerエージェントは、同じ戦略を持っている場合でも、それまでの経緯によって(選択の履歴によって)、協調することもあれば裏切ることもある。自分の内部状態によって反応が異なるという点において、広義の複雑系のモデルになっている。狭義の複雑系それぞれのPlayerエージェントが戦略の変更を行うが、これは行動のルールが変化するという意味で、狭義の複雑系のモデルになっている。進化戦略が模倣されて受け継がれることから、進化的なモデルといえる。

1 2 3 企業と市場のシミュレーション（第１１回）複雑系と進化のモデル表現繰り返し囚人のジレンマモデルの紹介繰り返し囚人のジレンマモデルの改造

『企業と市場のシミュレーション』井庭崇第１１回：繰り返し囚人のジレンマモデル Keio University SFC 2004 『企業と市場のシミュレーション』第１１回：繰り返し囚人のジレンマモデルいば　　たかし井庭崇慶應義塾大学総合政策学部専任講師 iba@sfc.keio.ac.jp http://www.sfc.keio.ac.jp/~iba/lecture/

囚人のジレンマに関する文献『対立と協調の科学：エージェント・ベース・モデルによる複雑系の解明』（ロバート・アクセルロッド, ダイヤモンド社, 2003）『つきあい方の科学: バクテリアから国際関係まで』（ロバート・アクセルロッド, HBJ出版局, 1987）