意外と身近なゲーム理論 へなちょこ研究室 p
2005年にゲーム理論の先駆者がノーベル賞を受賞 ゲーム理論って難しい? 2005年にゲーム理論の先駆者がノーベル賞を受賞 ロバート・オーマン トーマス・シェリング 冷戦下の安全保障 人種の棲み分け理論 経済学賞 ゲーム理論は 人間の経済行動に密接に関係 身近な例にゲーム理論を適用
非協力ゲーム理論 3\3 0\5 5\0 1\1 P1 P2 エージェント :利己的な組織・個人 ゲーム :エージェント間の利害関係 エージェント :利己的な組織・個人 ゲーム :エージェント間の利害関係 非協力ゲーム :エージェント間に提携がない 囚人のジレンマゲーム P1 P2 Cooperate(協調) Defect(裏切り) 3\3 0\5 5\0 1\1 パレート最適解
戦略 各エージェントは 戦略 を持つ 1 →今回自分が協調する確率 …非協調 …協調 …厳格 …寛容 常に 逆しっぺ返し 非協調 しっぺ返し 戦略 を持つ …前回相手が協調 …前回相手が裏切り →今回自分が協調する確率 1 常に 非協調 逆しっぺ返し しっぺ返し 協調 …非協調 …協調 …厳格 …寛容
(0.4,0) (0.2,0.6) 5 対戦 3 3 D (0.8,0.4) C C C (1,0.8) (0.3,0.3)
スケールフリーネットワーク 頂点の数と他の頂点と接続している数が べき法則に従うネットワーク 80:20の法則・パレートの法則・ロングテール理論 売り上げの8割は 2割の商品で占められる 文章で使われる単語の 8割は全単語の2割である オークション出品物の8割は 2割のユーザーの出品である
実験アルゴリズム 対戦 正規化 進化 エラー パラメータ コピーエラーやノイズ 対戦可能な相手と規定回数対戦 エージェント数 255 総利得を対戦回数で除算 進化 対戦可能なエージェントの中で最も高い利得を獲得したエージェントの戦略をコピー エラー コピーエラーやノイズ パラメータ エージェント数 255 対戦回数 4 対戦期間 2500 エラー発生率 0.1 繰り返し回数 100 協調達成閾値 2.3 協調崩壊閾値 1.7
結果1 協調の崩壊 平均利得2.61 協調の崩壊20回
Hubエージェント・EtoHエージェントが 全エージェント 結果2 Hubエージェント・EtoHエージェントが 高いAqを持つHubエージェントを搾取 ↓ 協調が崩壊?? Hub EtoH EtoE
検証実験 5人のHubエージェントの戦略を固定された値に操作する 操作 平均利得 協調の崩壊 なし 2.52 20 2.23 63 2.55 2.61 2.00 237
結果
まとめ 中心人物が寛容になることに対し 脆弱性を持つ スケールフリーネットワークにおいても協調は達成される が、脆弱であり崩壊しやすい 崩壊の原因は、接続次数の高いハブエージェントが非協調に対して寛容になることである 現実社会では 中心人物が寛容になることに対し 脆弱性を持つ