単貧民と偶然手番感度 電気通信大学 西野順二 ○ 西野哲朗. 研究の背景 多人数 [sturvant2000 〜 ] ポーカー(不完全情報 [bowling2007] The University of Alberta GAMES Group 多人数不完全情報ゲームはまだ未開拓の困難対象である §1.

Slides:



Advertisements
Similar presentations
Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:
Advertisements

授業展開#12 コンピュータの扱いにくい問 題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣 を比較するためには、標準的なコン ピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモ デルとして、チューリングマシンを考え、
坊さんと妖怪(仮) 企画書. ・概要 タイトル:「坊さんと妖怪( 仮)」 ジャンル:妖怪退治カードゲ ーム プレイ人数:2人~5人 キャッチコピー:「日本のファンタジー」 修行僧の妖怪退治をイメージしたゲーム。 他の修行僧と妖怪の山から下山するために 協力(時には手柄の横取り?)しながら ふもとを目指します。
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
リーダー 辻元健照 プログラム 北川泰士 アルゴリズム 水野雄太 ユーザー 松田邦久 プレゼン 戸所風士
人工知能概論 第4回 探索(3) ゲームの理論.
UECコンピュータ大貧民大会 参加後の考察
耐故障アルゴリズム.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
高度情報演習1A “テーマC” 実践 画像処理プログラミング 〜画像認識とCGによる画像生成〜 第四回 演習課題 画像中からの物体抽出処理(背景情報を手がかりとして) 芝浦工業大学 工学部 情報工学科 青木 義満 2006/05/15.
数当てゲーム (「誤り訂正符号」に関連した話題)
セキュアネットワーク符号化構成法に関する研究
Problem A: ねこかわいがり♪ 問題作成: 山本 解法作成: 山本・高橋 解説: 山本.
Bipartite Permutation Graphの ランダム生成と列挙
シミュレーション論Ⅰ 第6回 待ち行列のシミュレーション.
ゲーム理論・ゲーム理論Ⅰ (第4回) 第3章 完全情報の展開形ゲーム
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
ある最適化問題 スポーツスケジューリング スポーツスケジューリングとは? 生成方法 プログラムと問題点 2001年2月7日(水)
コンピュータ囲碁の仕組み ~ 将棋との違い ~
ブロック運びゲーム.
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
アルゴリズムイントロダクション第5章( ) 確率論的解析
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
9.NP完全問題とNP困難問題.
マイクロシミュレーションにおける 可変属性セル問題と解法
単位 おねだり ☆オセロ おねだり隊☆D班.
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
データ構造とアルゴリズム論 第7章 探索のアルゴリズム
慶應義塾大学経済学部 グレーヴァ香子 Takako Fujiwara-Greve
新ゲーム理論 第Ⅰ部 非協力ゲームの理論 第1章 非協力ゲームの戦略形
IPv6アドレスによる RFIDシステム利用方式
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
スマホゲームとお金について ~課金のしくみ~
シミュレーション論 Ⅱ 第15回 まとめ.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
栗原正純 UEC Tokyo 電気通信大学 電気通信学部 情報通信工学科 2009/4/15
BLACK JACKの作成 ブラックジャックのルール 概要 勝敗の判定 開発中の問題点 Aの扱いについて 配り直し(DEAL) 工夫した点
計算量理論輪講 chap5-3 M1 高井唯史.
2009年12月4日 ○ 前田康成(北見工業大学) 吉田秀樹(北見工業大学) 鈴木正清(北見工業大学) 松嶋敏泰(早稲田大学)
ロボットの協調動作の研究: マップ作成とマップ情報を利用した行動計画
スマホゲームとお金について ~課金のしくみ~
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
建築模型制作支援のための ソフトウェア研究開発
モンテカルロ法を用いた 立体四目並べの対戦プログラム
麻雀ゲームにおけるAIの開発    日高大地   近畿大学理工学部情報学科  
数値解析   大富豪 佐藤玲子 堀智恵実 高山明秀 西田直毅 春田常典.
第4章 識別部の設計 4-5 識別部の最適化 発表日:2003年5月16日 発表者:時田 陽一
ナップサック問題 クマさん人形をめぐる熱いドラマの結末.
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
情報経済システム論:第13回 担当教員 黒田敏史 2019/5/7 情報経済システム論.
Leader;平尾 仲達 Programmer;古川 智啓 Player , Algorithmer; 長畑 弘樹,吉村 達也,河本 拓哉
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
データ構造とアルゴリズム論 第6章 探索のアルゴリズム
『shockwave.com リバーシ』コンテンツスポンサーシップの仕組み
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
栗原正純 UEC Tokyo 電気通信大学 情報通信工学科 2007/5/2(修正2008/08/21)
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
Othello G班         山崎 木下 山本 上手      .
Presentation transcript:

単貧民と偶然手番感度 電気通信大学 西野順二 ○ 西野哲朗

研究の背景 多人数 [sturvant2000 〜 ] ポーカー(不完全情報 [bowling2007] The University of Alberta GAMES Group 多人数不完全情報ゲームはまだ未開拓の困難対象である §1 囲碁 将棋 バックギャモン ダイヤモンド ゲーム 情報の不完全さ 完全情報不完全情報 2人 3人 以上 プレイヤー人数 ブリッジ ハーツ 社会現象 大貧民 ポーカー ソーシャルゲーム 多数

目的 多人数不完全情報ゲームの新たな指標である 偶然手番感度の提案 「単貧民」を対象に全探索を行い その偶然手番感度の計測と検討を行う

大貧民型ゲーム 不完全情報の源泉と遷移 多人数による情報の不完全性 偶然手番による情報の不完全性 徐々に情報が開示される ポーカーと違う 以上の組み合わせ → 大貧民 §2 最もシンプルにした形 → 単貧民

5/84 第 7 回 UEC コンピュータ大貧民 大会 UECda-2012 主催: UEC (電気通信大学) 共催: 情報オリンピック日本委員会 会場: 電気通信大学 東3号館 5階 日時: 2012 年 11 月 24 日(土) 10:30 より (シンポジウムは 12:00 開始) 対象: どなたでも御参加頂けます 参加費: 無料

6/84 情報系の学問に馴染みのない皆さん には... 頭の中にある大貧民のプレイの仕方を、アルゴリズム (問題解決手順)として正確に書き下していただき、 プログラム化していただくことで、 情報系の学問の基礎に親しんでいただきたい。

7/84 プログラミングの腕に覚えのある皆さ ん には... 会場で、ハイレベルな戦いを繰り広げていただきたい。 本大会ではプログラム同士の高速対戦を行う。 配布されたカードの善し悪しに左右されない、プレイ のアルゴリズム本来の優劣を競うことができる。

8/84 大貧民とは?(1) 大貧民はトランプで遊ぶカードゲームのひとつ。 「ど貧民」、「大富豪」、「階級闘争」などとも 呼ばれる。 カードを参加者にすべて配り、手持ちのカードを 順番に場に出して早く手札をなくすことを競うゲ ーム。 1ゲームでの順位が次ゲーム開始時の有利不利に 影響する点が特徴で、勝者をより有利にするゲー ム性から大富豪との名称がついた。

9/84 大貧民とは?(2) 地方ルールが数多く存在することも大きな特徴である。地 方ルールには、一度負け出すとなかなか逆転できないとい う欠点を補正する方向に働くものが多い。 順位は、手持ちのカードのなくなった順に、大富豪、富豪、 平民、貧民、大貧民(ど貧民)となる(平民は複数存在し うるが、存在しない場合もある)。

10/84 大貧民とは?(3) 第 2 ゲーム以降は、カードを配った後のゲーム開始時まで に、大貧民は大富豪に 2 枚、貧民は富豪に 1 枚、手持ちの最 も強いカードを差し出さなければならない。このカード交 換を「税金」または「献上」という。

11/84 大貧民のルール(1) ゲームの開始: ゲームはダイアの3を持ってい る人から始まる。 必ずしもダイアの3を出さな くてもよい。 パスについて: 場のカードと手札の関係上、カ ードを出せない場合はパスとなる。 カードが出 せる場合でも戦略上パスすることができるが、 いったんパスすると、場が流れるまで自分に順番 が回ってくることはない。 スペードの3: スペードの3はジョーカーより も強い。 ジョーカーが一枚で出された場合、ス ペードの3で切ることができる。

12/84 大貧民のルール(2) 場の流れ方: 全員がパスしたら場が流れ、最後 にカードを出した人が 場にカードがない状態か らカードを出すことができる。 仮に自分以外が パスした時、自分がカードを出すことができれば 連続してカードを出すことができる。 8切り: 8を含んだ手を出した場合、場のカー ドがクリアされ カードを出した人が任意のカー ドを出すことができる。 (権利をとることがで きる) 革命: 同じ番号のカードを4枚、もしくはジョ ーカーを含んだ 5枚をセットで出すと、革命が おこる。 革命後はカードの強さが逆転する。

13/84 大貧民のルール(3) 階段(シークエンス):同一マークの連番が 3 枚 以上ある場合は、同時に出すことができる。 5 枚 以上同時に出すと革命がおこる。 しばり(ロック): 場にあるカードと同じマー クのカードを出すと「しばり」状態となり、以後 同じマークしか出せない。 あがり方: どんなカードでもあがることができ る。 カードの交換: 大富豪は2枚、カードをもらう。 富豪は1枚。 選び方は任意。強いカードをあげ てもよい。 大貧民は2枚、貧民は1枚強いカー ドを献上する。 カードは自動的に選ばれ、選択 できない。

14/84 本大会で使用したプログラム カードの配布や場の管理を行うサーバ・プログラ ム。 プレイヤーに対応するクライアント・プログラム。 5 人のプレイヤーに対応する 5 つのクライアン ト・プログラムを、サーバ・プログラムにつない で対戦を行う。 上記プログラムのソース・コードは、大会サイト からダウンロード可能。

15/84 サーバー – クライアント シス テム ①送信 クライアント ②処理 ③返信 サーバーに やって貰お う サーバー クライアントは、サーバーに処理を依頼します。 サーバーは、クライアントの依頼を受け、結果を返信します。

16/84 システム構成図 大富豪サーバー 場の管理 状況のクライアントへの通知 提出されたカードの判定 クライアント 1 クライアント 2クライアント 3 クライアント 4 クライアント 5 通信 カードの 選択

単貧民 大貧民型ゲームの最小形で多人数不完全情報ゲーム 大貧民の基本ルールを継承している カード順位を線形化 ( マーク、重複カードの省略 ) 1 枚出しのみ、ペア、階段など役出しは無し 1〜 12 の整数でカード強さを表す (2が強いわけではない) 例 [[1 4 5] [2 3 6]] ← 2人に3枚ずつ配布、初手は?

不完全情報ゲームの解法 モンテカルロサンプリング 52 枚 5 つに配布 10^33 多人数なので 不完全知覚 自手おなじ 情報集合 様々な可能性 U §2 状態を仮定して シミュレーションや探索 のちに統合 ( 期待利得最大化 )

偶然手番感度とは (1) 偶然手番と期待利得 偶然手番 利得 G 実現確率 偶 A B 情報集合 §3.2 b = +0.4 a = -0.4

偶然手番感度とは (2) 期待利得 G G j j A B §3.2

偶然手番感度とは (3) 偶然手番感度 利得の偶然手番変化に対する 標本分散と同型 CNS=0 : p に関わらず 期待利得が一定 §3.2 正規化 CNS CNS/Range CNS Σp = 1

偶然手番感度高い 偶然手番 G 未知 偶 A B A か B か 推定が 重要 §3.2

偶然手番感度低い 偶然手番 A B モンテカルロ サンプリングで A, B の どちらの状態を選んでも 最良着手 b が見つかる 1 §3.2

単貧民の偶然手番感度 2〜5名 計2〜12枚 完全探索 最大36万通り §3.5 例 [ [145] [268] [379] ] どの手?

例) 3人3枚ゲーム ( 計9枚 ) 84種の自手 各20種の情報集合 ( 相手パターン ) § 種の木を全て探索し 自手ごとに統合 [] [] [] [] [] [] [] [] []

計12枚までの14種 最大36万通り §3.5

まとめ 単貧民 最小化した大貧民の全探索を行った 単貧民の偶然手番感度が低いことを示した 多人数不完全情報ゲームの性質を計る 新たな指標として偶然手番感度を提案した §3.5

29/31 Thank You!