3.2.1. 協力性の進化 社会心理学特殊講義(高木) 2000.07.06.

Slides:



Advertisements
Similar presentations
最上 亮.  近年標的型と呼ばれるサイバー攻撃が増え、大 企業や、政府機関が情報窃取型の標的型メール 攻撃の被害を受けている。  標的型メール攻撃による個人情報漏えいは、企 業に莫大な損失を与えるとともに、信頼を失う。  現在サイバー攻撃における攻撃者、防御者の戦 略をゲーム理論的にモデル化する研究がおこな.
Advertisements

07/11/211 7. 不確実性の処理 期待値、感度分析、情報の価値. 07/11/ 期待値分析 ( expected value ) 7.2 感度分析 ( sensitivity analysis ) 7.3 情報と準オプション価値 ( value of information )
IS-LM 分析 マクロ経済分析 畑農鋭矢. 貨幣の範囲 通貨対象 M1M2M3 広義流動性 現金通貨(日銀券 +補助通貨) 預金通貨 (普通預金・当座 預金など) 主要銀行・信 用金庫など ゆうちょ銀 行・信用組合 など 準通貨 (定期預金など) 主要銀行・信 金など ゆうちょ銀 行・信用組合 など.
ゲーム理論の誕生と発展 von Neumann & Morgenstern The Theory of Games and Economic Behavior.
制度経済学Ⅰ ①. 制度経済学とは何か 制度 institutions 最も根本的な制度は・・・・ 言語、法、貨幣 いずれも経済、そして経済学に関係する それらなしに、経済は成立しない.
6章 7章 インセンティブ. モラルハザード よくある誤解(誤訳):倫理の欠如 私の好きな意訳:倫理の落とし穴 よくある定義 情報の非対称性があり、代理人の 行動が観察できない がゆ えに、代理人が 依頼人の意に即した行動を取らず 、自ら の利得を最大化する問題。 例:保険、負債を背負った経営者.
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第2章 戦略形ゲームのナッシュ均衡
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
人工知能概論 第4回 探索(3) ゲームの理論.
15分で読む「貨幣の複雑性」 HPO:個人的な意見 ひでき.
経営戦略は 本当に必要か? 経営戦略班.
シミュレーション論Ⅰ 第13回 意思決定とシミュレーション.
16 寡占.
© Yukiko Abe 2014 All rights reserved
河内亮周(東工大) 岡本吉央(電通大) 田中圭介(東工大) 安永憲司(九州先端研)
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
第1章 費用便益分析への入門 政策評価(06,09,29)三井.
エージェントモデル シミュレーション.
スケールフリーネットワークにおける 経路制御のためのフラッディング手法の提案と評価
新ゲーム理論ゼミ 第5章 「繰り返しゲーム」 M1 松村 草也.
神奈川大学大学院工学研究科 電気電子情報工学専攻
東京経営短期大学 経営総合学科 准教授 玉田 和恵
社会心理学のStudy -集団を媒介とする適応- (仮)
10.Private Strategies in Games with Imperfect Public Monitoring
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
第05回 2009年11月04日 今日の資料=A4・5枚 社会の認識 「社会科学的発想・法」 第05回 2009年11月04日 今日の資料=A4・5枚
エージェントベース経済シミュレーション におけるフレームワークデザイン
確率モデルによる 画像処理技術入門 --- ベイズ統計と確率的画像処理 ---
集団における適応 知識構造論講座 下嶋研究室          M1 関本 和弘.
『企業と市場のシミュレーション』 井庭 崇 第12回: 貨幣の自生と自壊モデル
ネットワーク上を拡散する 技術革新のシミュレーション 日本大学文理学部 情報システム解析学科 谷研究室 安藤勇希 帆苅裕貴
『企業と市場のシミュレーション』 井庭 崇 第11回: 繰り返し囚人のジレンマモデル
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
© Yukiko Abe 2014 All rights reserved
第13章 フォンノイマン/モルゲンシュテイン解
シミュレーション論Ⅰ 第11回 意思決定とシミュレーション.
退出可能な 社会的ジレンマ実験 小林盾(シカゴ大学) 大浦宏邦(帝京大学) 石原英樹(立教大学) 2003年10月12
パソコンでゲームの理論 第1,2章 ゼロ和2人ゲーム ゼミ合宿 東京理科大学理学部第2部数学科・統計学ゼミ
ボンドの効果 ―法と経済学による分析― 桑名謹三 法政大学政策科学研究所
東京経営短期大学 経営総合学科 准教授 玉田 和恵
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
ネットワーク上での社会的効用と個人的効用の対立問題に対するアルゴリズム的研究
Bridge It と Connections の 必勝法について
間接互恵性の成立 ー進化シミュレーションを用いた選別的利他戦略の検討ー
卒論進捗発表(1) 10/ 山崎孝裕.
第Ⅱ部 協力ゲームの理論 第10章 コア 2008/07/01(火) ゲーム理論合宿.
ゲノム科学概論 ~ゲノム科学における統計学の役割~ (遺伝統計学)
意外と身近なゲーム理論 へなちょこ研究室 p.
日本認知科学会第29回大会 仙台国際センター 構成論的研究の 方法論的基盤について 大谷卓史 吉備国際大学 2012年12月15日.
Bridge It と Connections の 必勝法について
相互調整によるエージェントのクラスタ化: コンピュータシミュレーションによる検討
サンクションの進化モデル 大浦宏邦 (帝京大学).
第7章 不確実性の処理 :期待値、感度分析、情報の価値
色塗りゲームとゲームカラーリング数 慶應義塾大学大学院 理工学研究科   関口 陽介.
『組織の限界』 第1章 個人的合理性と社会的合理性 前半
Analysis for Marketing Planning
第Ⅱ部 協力ゲームの理論 第7章 提携形ゲームと配分 2008/07/01(火) ゲーム理論合宿 M1 藤井敬士.
ヒューマン・インターフェースとしてのGIS —空間データ変換から地図表現へ—
2011 行動分析学特論 (1)行動分析学と 対人援助(学)
契約法の経済分析 麻生良文.
囚人のジレンマ ―― 裏切りのインセンティブ ――
寡占理論(Oligopoly Theory) 第13講 Competition in Quality
コストのついたグラフの探索 分枝限定法 A*アルゴリズム.
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
原口和也 高橋隆一 丸岡章 石巻専修大学 理工学部 情報電子工学科
人工知能概論 第4回 探索(3) ゲームの理論.
経済学入門 ミクロ経済学とマクロ経済学 ケインズ経済学と古典派マクロ経済学 経済学の特徴 経済学の基礎概念 部分均衡分析の応用.
Detecting Software Modularity Violations
Presentation transcript:

3.2.1. 協力性の進化 社会心理学特殊講義(高木) 2000.07.06

Axelrod(1984) の分析 一種の進化ゲーム状況 戦略間のトーナメント 解析 TFT の頑健性 限界 tit-for-tat戦略(TFT)の優越 解析 TFT を取り合う(→CC)ことが Nash 均衡解になる。 Collective Stable Starategy ≒ESS) TFT の頑健性 限界 どの戦略が勝つかは戦略分布による。 ノイズを考えない。 多数の戦略が競い合う状況ではない。

Axelrod(1984) 以後の展開(1) :ノイズのある状況 ノイズがある状況では TFT より「寛容な」戦略が有利である可能性 右図の p : C 返礼確率 右図の q : D に C を返す確率 厳密な TFT :協力の優越への触媒作用

Axelrod(1984) 以後の展開(2) パブロフ戦略(Win-stay Lose-change): TFT より成績が良い、という結果(Nowak, M. & Sigmund, K., 1993) 非寛容な Gradual が強いという説( Beaufils, Delahaye & Mathieu, 1996):相手が裏切った全回数を、相手が裏切るたびに裏切り返す。 Open end な進化(Lindgren, 1991) ノイズの存在+遺伝子操作によって戦略の次元が増加できる 何らかのESSに到達 - 9割 open end な進化    - 1割 ESSの1種 Pavlov TFT

セルオートマトンの適用例 (Hegselmann, 1996a,b) エージェントをセルで表現 エージェントはリスクを抱える。 サポート関係の成立のシミュレーション 結果 サポートのネットワークが出現 近隣間でサポート関係が生じる。 リスク水準が似通ったエージェント間でサポート関係が生じやすい。

参考文献 Axelrod, R., 1984, The Evolution of Cooperation. NY: Basic Books. アクセルロッド 松田裕之(訳) 『つきあい方の科学』、1987、HBJ出版局. Beaufils, B., Delahaye, J-P., Mathieu, P. (1996) Our meeting with Gradual. Artificial-Life-V, MIT Press, Pp.202-209. Hegselmann, R., 1996a, Understanding social dynamics. See Troitzsch et al. (1996), Pp.282-306. Hegselmann, R., 1996b, Cellular automata in the social sciences. In R. Hegselmann, U. Mueller & K.G. Troitzsch (Eds.), Modelling and Simulation in the Social Sciences from the Philosophy of Science Point of View. Dordrecht: Kluwer Academic Publishers, Pp.209-233. Lindgren, K. (1991) Evolutionary phenomena in simple dynamics. Artificial Life-II. Addison-Wesley, Pp.295-312. Nowak, M. & May, R.M., 1992, Evolutionary games and spatial chaos. Nature, 359, 29, 826-9. Nowak, M., May, R.M. & Sigmund, K., 1995, The arithmetics of mutual help. Scientific American, June, 50-55. Nowak, M. & Sigmund, K., 1992, Tit for tat in heterogeneous populations. Nature, 355, 16, 250-3. Nowak, M. & Sigmund, K., 1993, A strategy of win-stay, lose-shift that outperforms tit-for-tat in the Prisoner's Dilemma game. Nature, 364, 1, 568-3. Suleiman, R., 1996, Simulating cooperation and competition: Present state and future objectives. See Troitzsch et al. (1996), Pp.264-281.

余談:社会的交換ゲーム ゲーム(シミュレーション)のルール 囚人のジレンマのシミュレーションとの違い 100人のプレイヤー ゲームの1ラウンド = 試行の繰返し プレイヤーは各試行で資源を保有する。 資源を自由に分割し、他者ないし自分に与える。 各試行でのプレイヤーの利得=その試行で受け取った資源量の和 他者から得た資源は自分の資源より価値がある。 囚人のジレンマ ラウンドでのプレイヤーの利得は試行ごとの利得和。ただし後の試行の利得は割引かれる。 ラウンドごとに、利得の下位者の戦略は上位者の戦略と入代わる(進化)。 囚人のジレンマのシミュレーションとの違い 予算制約:協力の範囲を無制限に拡張することはできない。 与える量を自由に調節できる。

限定交換戦略 NonCoop:孤立主義者 決して他者に与えない。 Saint:聖人 すべてを無条件に他者に与える。 Recp:お返し戦略 ~ 返報規範 最初のうちは自発的に他者に資源を与える。 自分と相手との差し引き勘定を計算、負債の2倍返しをする。 → 交換の永続 TFT:仲間作り戦略 ~ tit for tat 資源をくれる相手を「仲間」と認定する。仲間には常に与える。 2度裏切った(資源をくれない)相手は2度と仲間とは認めない。 →同類を識別 情報構造 - 自分の交換履歴の情報だけを利用

返報戦略(Recp) 仲間作り戦略(TFT)

分析:4戦略の比較 相手が NonCoop だけなら、Recp、TFT は勝利できる。 TFT が4戦略中最強。 Recp 8 vs NonCoop 92 → Recp 100 TFT 7 vs NonCoop 93 → TFT 100 TFT が4戦略中最強。 Recp は Saint に弱い。 同類識別能力の欠如

分析:改良返報戦略 Recp2:改良型返報戦略 保有資源の不確実性 シミュレーション 同類を識別できる 。 得点能力は TFT にせまる(図3)。 保有資源の不確実性 TFT は不確実なほど得点が低下 Recp2 は不確実性の影響を受けない(図3-1)。 シミュレーション 条件 確実:毎試行資源 10 低不確実: 15/5 高不確実: 20/0 確実条件 → TFT が勝利 低/高不確実条件 → Recp2 が勝利