単貧民と偶然手番感度電気通信大学西野順二 ○ 西野哲朗. 研究の背景多人数 [sturvant2000 〜 ] ポーカー（不完全情報 [bowling2007] The University of Alberta GAMES Group 多人数不完全情報ゲームはまだ未開拓の困難対象である §1.

Slides:

Advertisements

Similar presentations

Maxent model への挑戦 - 驚きとドキドキ感の理論 - 大野ゆかり Phillips et al. (2006) Maximum entropy modeling of species geographic distributions. Ecological Modeling 190:

Advertisements

授業展開＃１２コンピュータの扱いにくい問題. 扱いにくい問題  処理時間がかかる。  メモリを大量に必要とする。  プログラムの優劣、アルゴリズムの優劣を比較するためには、標準的なコンピュータで比較する必要がある。  処理時間を計るのに、コンピュータのモデルとして、チューリングマシンを考え、

坊さんと妖怪（仮）企画書. ・概要タイトル：「坊さんと妖怪（仮）」ジャンル：妖怪退治カードゲームプレイ人数：２人～５人キャッチコピー：「日本のファンタジー」修行僧の妖怪退治をイメージしたゲーム。他の修行僧と妖怪の山から下山するために協力（時には手柄の横取り？）しながらふもとを目指します。

 C 川船美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーション作成 o スマートフォン向けアプリケーション.

リーダー辻元健照プログラム北川泰士アルゴリズム水野雄太ユーザー松田邦久プレゼン戸所風士

人工知能概論第4回探索（３）ゲームの理論.

UECコンピュータ大貧民大会参加後の考察

耐故障アルゴリズム.

Ibaraki Univ. Dept of Electrical & Electronic Eng.

高度情報演習1A　“テーマＣ” 実践画像処理プログラミング〜画像認識とＣＧによる画像生成〜第四回　演習課題画像中からの物体抽出処理（背景情報を手がかりとして）芝浦工業大学工学部　情報工学科青木　義満 2006/05/15.

数当てゲーム（「誤り訂正符号」に関連した話題）

セキュアネットワーク符号化構成法に関する研究

Problem A: ねこかわいがり♪ 問題作成：山本解法作成：山本・高橋解説：山本.

Bipartite Permutation Graphのランダム生成と列挙

シミュレーション論Ⅰ 第6回待ち行列のシミュレーション.

ゲーム理論・ゲーム理論Ⅰ （第４回）第3章完全情報の展開形ゲーム

近似アルゴリズム第１０章終了時刻最小化スケジューリング

ある最適化問題スポーツスケジューリングスポーツスケジューリングとは？生成方法プログラムと問題点 2001年2月7日（水）

コンピュータ囲碁の仕組み～将棋との違い～

ブロック運びゲーム.

データ構造とアルゴリズム論第６章探索のアルゴリズム

ゲーム理論・ゲーム理論Ⅰ （第６回）第４章戦略形ゲームの応用

四路の碁アプリ開発情報論理工学研究所高倉秀斗.

アルゴリズムイントロダクション第５章( ) 確率論的解析

人工知能第3回探索法（教科書21ページ～30ページ）

A班ランダム選択に一言加えたら･･･成田幸弘橋本剛嶌村都.

政策決定のプロセス政策過程論公共選択ゲームの理論.

モンテカルロ法によるミニ囲碁増井拓視情報理論工学研究所.

初級ミクロ経済学－ゲーム理論入門－ 2014年12月15日古川徹也 2014年12月15日初級ミクロ経済学.

９．ＮＰ完全問題とNP困難問題.

マイクロシミュレーションにおける可変属性セル問題と解法

単位おねだり ☆オセロおねだり隊☆D班.

モンテカルロ碁電気通信大学村松研究室下川和也.

UCB+ 法を用いた Big Two AI の研究

JAVAでつくるオセロ伊東飛鳥、宮島雄一長畑弘樹、ソギ原直人.

データ構造とアルゴリズム論第７章探索のアルゴリズム

慶應義塾大学経済学部グレーヴァ香子 Takako Fujiwara-Greve

新ゲーム理論第Ⅰ部非協力ゲームの理論第1章非協力ゲームの戦略形

IPｖ６アドレスによる RFIDシステム利用方式

第Ⅱ部　協力ゲームの理論第9章　シャープレイ値.

MPIによる行列積計算情報論理工学研究室渡邉伊織情報論理工学研究室渡邉伊織です。

スマホゲームとお金について～課金のしくみ～

シミュレーション論 Ⅱ 第１５回まとめ.

Ibaraki Univ. Dept of Electrical & Electronic Eng.

シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて

二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法

４人版リバーシYoninの解析情報論理研究室藤本侑花

栗原正純 UEC Tokyo 電気通信大学電気通信学部情報通信工学科 2009/4/15

BLACK JACKの作成ブラックジャックのルール概要勝敗の判定開発中の問題点 Aの扱いについて配り直し（DEAL) 工夫した点

計算量理論輪講　chap5-3 M1　高井唯史.

2009年12月4日 ○ 前田康成（北見工業大学）吉田秀樹（北見工業大学）鈴木正清（北見工業大学）松嶋敏泰（早稲田大学）

ロボットの協調動作の研究：マップ作成とマップ情報を利用した行動計画

スマホゲームとお金について～課金のしくみ～

近畿大学理工学部情報学科情報論理工学研究室赤井隆純

建築模型制作支援のためのソフトウェア研究開発

モンテカルロ法を用いた立体四目並べの対戦プログラム

麻雀ゲームにおけるAIの開発　　日高大地　　近畿大学理工学部情報学科　　

数値解析　　大富豪佐藤玲子　堀智恵実　高山明秀西田直毅　春田常典.

第4章識別部の設計 4－5 識別部の最適化発表日：2003年5月16日発表者：時田陽一

ナップサック問題クマさん人形をめぐる熱いドラマの結末.

★C++/オブジェクト指向実践企画★ Othelloゲーム作成

情報経済システム論：第13回担当教員　黒田敏史 2019/5/7 情報経済システム論.

Leader；平尾仲達 Programmer；古川智啓 Player , Algorithmer; 長畑弘樹,吉村達也，河本拓哉

近畿大学理工学部情報学科情報論理工学部研究室潘小月

データ構造とアルゴリズム論第６章探索のアルゴリズム

『shockwave.com リバーシ』コンテンツスポンサーシップの仕組み

近畿大学理工学部情報学科情報論理工学研究室段野健太

栗原正純 UEC Tokyo 電気通信大学情報通信工学科 2007/5/2（修正2008/08/21）

第Ⅰ部　非協力ゲームの理論第6章　情報の価値 2008/07/01(火) ゲーム理論合宿Ｍ２　渡辺美穂.

Othello Ｇ班　　　　　　　　　山崎　木下　山本　上手　　　　　　.

Presentation transcript:

単貧民と偶然手番感度電気通信大学西野順二 ○ 西野哲朗

研究の背景多人数 [sturvant2000 〜 ] ポーカー（不完全情報 [bowling2007] The University of Alberta GAMES Group 多人数不完全情報ゲームはまだ未開拓の困難対象である §1 囲碁将棋バックギャモンダイヤモンドゲーム情報の不完全さ完全情報不完全情報２人３人以上プレイヤー人数ブリッジハーツ社会現象大貧民ポーカーソーシャルゲーム多数

目的多人数不完全情報ゲームの新たな指標である偶然手番感度の提案「単貧民」を対象に全探索を行いその偶然手番感度の計測と検討を行う

大貧民型ゲーム不完全情報の源泉と遷移多人数による情報の不完全性偶然手番による情報の不完全性徐々に情報が開示されるポーカーと違う以上の組み合わせ → 大貧民 §2 最もシンプルにした形 → 単貧民

5/84 第 7 回 UEC コンピュータ大貧民大会 UECda-2012 主催： UEC （電気通信大学）共催：情報オリンピック日本委員会会場：電気通信大学東３号館５階日時： 2012 年 11 月 24 日（土） 10:30 より（シンポジウムは 12:00 開始）対象：どなたでも御参加頂けます参加費：無料

6/84 情報系の学問に馴染みのない皆さんには... 頭の中にある大貧民のプレイの仕方を、アルゴリズム（問題解決手順）として正確に書き下していただき、プログラム化していただくことで、情報系の学問の基礎に親しんでいただきたい。

7/84 プログラミングの腕に覚えのある皆さんには... 会場で、ハイレベルな戦いを繰り広げていただきたい。本大会ではプログラム同士の高速対戦を行う。配布されたカードの善し悪しに左右されない、プレイのアルゴリズム本来の優劣を競うことができる。

8/84 大貧民とは？（１）大貧民はトランプで遊ぶカードゲームのひとつ。「ど貧民」、「大富豪」、「階級闘争」などとも呼ばれる。カードを参加者にすべて配り、手持ちのカードを順番に場に出して早く手札をなくすことを競うゲーム。１ゲームでの順位が次ゲーム開始時の有利不利に影響する点が特徴で、勝者をより有利にするゲーム性から大富豪との名称がついた。

9/84 大貧民とは？（２）地方ルールが数多く存在することも大きな特徴である。地方ルールには、一度負け出すとなかなか逆転できないという欠点を補正する方向に働くものが多い。順位は、手持ちのカードのなくなった順に、大富豪、富豪、平民、貧民、大貧民（ど貧民）となる（平民は複数存在しうるが、存在しない場合もある）。

10/84 大貧民とは？（３）第 2 ゲーム以降は、カードを配った後のゲーム開始時までに、大貧民は大富豪に 2 枚、貧民は富豪に 1 枚、手持ちの最も強いカードを差し出さなければならない。このカード交換を「税金」または「献上」という。

11/84 大貧民のルール（１）ゲームの開始：ゲームはダイアの３を持っている人から始まる。必ずしもダイアの３を出さなくてもよい。パスについて：場のカードと手札の関係上、カードを出せない場合はパスとなる。カードが出せる場合でも戦略上パスすることができるが、いったんパスすると、場が流れるまで自分に順番が回ってくることはない。スペードの３：スペードの３はジョーカーよりも強い。ジョーカーが一枚で出された場合、スペードの３で切ることができる。

12/84 大貧民のルール（２）場の流れ方：全員がパスしたら場が流れ、最後にカードを出した人が場にカードがない状態からカードを出すことができる。仮に自分以外がパスした時、自分がカードを出すことができれば連続してカードを出すことができる。８切り：８を含んだ手を出した場合、場のカードがクリアされカードを出した人が任意のカードを出すことができる。（権利をとることができる）革命：同じ番号のカードを４枚、もしくはジョーカーを含んだ５枚をセットで出すと、革命がおこる。革命後はカードの強さが逆転する。

13/84 大貧民のルール（３）階段（シークエンス）：同一マークの連番が 3 枚以上ある場合は、同時に出すことができる。 5 枚以上同時に出すと革命がおこる。しばり（ロック）：場にあるカードと同じマークのカードを出すと「しばり」状態となり、以後同じマークしか出せない。あがり方：どんなカードでもあがることができる。カードの交換：大富豪は２枚、カードをもらう。富豪は１枚。選び方は任意。強いカードをあげてもよい。大貧民は２枚、貧民は１枚強いカードを献上する。カードは自動的に選ばれ、選択できない。

14/84 本大会で使用したプログラムカードの配布や場の管理を行うサーバ・プログラム。プレイヤーに対応するクライアント・プログラム。 5 人のプレイヤーに対応する 5 つのクライアント・プログラムを、サーバ・プログラムにつないで対戦を行う。上記プログラムのソース・コードは、大会サイトからダウンロード可能。

15/84 サーバー – クライアントシステム ①送信クライアント ②処理 ③返信サーバーにやって貰おうサーバークライアントは、サーバーに処理を依頼します。サーバーは、クライアントの依頼を受け、結果を返信します。

16/84 システム構成図大富豪サーバー場の管理状況のクライアントへの通知提出されたカードの判定クライアント１クライアント２クライアント３クライアント４クライアント５通信カードの選択

単貧民大貧民型ゲームの最小形で多人数不完全情報ゲーム大貧民の基本ルールを継承しているカード順位を線形化 ( マーク、重複カードの省略 ) 1 枚出しのみ、ペア、階段など役出しは無し１〜 12 の整数でカード強さを表す（２が強いわけではない）例 [[1 4 5] [2 3 6]] ← ２人に３枚ずつ配布、初手は？

不完全情報ゲームの解法モンテカルロサンプリング 52 枚 5 つに配布 10^33 多人数なので不完全知覚自手おなじ情報集合様々な可能性 U §2 状態を仮定してシミュレーションや探索のちに統合 ( 期待利得最大化 )

偶然手番感度とは (1) 偶然手番と期待利得偶然手番利得 G 実現確率偶 A B 情報集合 §3.2 b = +0.4 a = -0.4

偶然手番感度とは (2) 期待利得 G G j j A B §3.2

偶然手番感度とは (3) 偶然手番感度利得の偶然手番変化に対する標本分散と同型 CNS=0 : p に関わらず期待利得が一定 §3.2 正規化 CNS CNS/Range CNS Σp = 1

偶然手番感度高い偶然手番 G 未知偶 A B A か B か推定が重要 §3.2

偶然手番感度低い偶然手番 A B モンテカルロサンプリングで A, B のどちらの状態を選んでも最良着手 b が見つかる 1 §3.2

単貧民の偶然手番感度２〜５名計２〜１２枚完全探索最大３６万通り §3.5 例 [ [145] [268] [379] ] どの手？

例）３人３枚ゲーム ( 計９枚 ) ８４種の自手各２０種の情報集合 ( 相手パターン ) § 種の木を全て探索し自手ごとに統合 [] [] [] [] [] [] [] [] []

計１２枚までの１４種最大３６万通り §3.5

まとめ単貧民最小化した大貧民の全探索を行った単貧民の偶然手番感度が低いことを示した多人数不完全情報ゲームの性質を計る新たな指標として偶然手番感度を提案した §3.5

29/31 Thank You!