麻雀ゲームにおけるAIの開発 08-1-037-0153   日高大地   近畿大学理工学部情報学科  

Slides:



Advertisements
Similar presentations
1 プリミティブ Web サービスの 入出力データに関する一考察 2005 年 3 月 21 日 松江工業高等専門学校 情報工学科 奈良先端科学技術大学院大学 情報科学研究科 越田高志 電子情報通信学会 2005年総合 大会.
Advertisements

コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Othello Let us cling together. メンバー 班長 杉本友宏 プログラマー 京谷貴平 アルゴリズム 佐野祐之 パワーポイント 菊澤遼平 発表 川本敏和.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
単貧民と偶然手番感度 電気通信大学 西野順二 ○ 西野哲朗. 研究の背景 多人数 [sturvant2000 〜 ] ポーカー(不完全情報 [bowling2007] The University of Alberta GAMES Group 多人数不完全情報ゲームはまだ未開拓の困難対象である §1.
リーダー 辻元健照 プログラム 北川泰士 アルゴリズム 水野雄太 ユーザー 松田邦久 プレゼン 戸所風士
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
ゲーム理論・ゲーム理論Ⅰ(第2回) 第2章 戦略形ゲームの基礎
人工知能概論 第4回 探索(3) ゲームの理論.
UECコンピュータ大貧民大会 参加後の考察
ゲーム理論・ゲーム理論Ⅰ (第4回) 第3章 完全情報の展開形ゲーム
ゲーム理論・ゲーム理論Ⅰ (第8回) 第5章 不完全競争市場の応用
コンピュータ囲碁の仕組み ~ 将棋との違い ~
ゲーム理論・ゲーム理論Ⅰ (第6回) 第4章 戦略形ゲームの応用
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
リバーシの並列化 並列化するときに起こる問題を定義しろ おぷてぃまいざー SSAIとMSAIは比較しろ  前田昂寛.
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
ツッパリ生徒と泣き虫先生 〜伏見工業ラグビー部 ・日本一への挑戦〜
インタラクティブ・ゲーム制作 <プログラミングコース>
1DS04168E 梅根綾花 1DS04184E 清 泰裕 1DS04197P 福井千尋
スコアによるキューブアクションの違い なにが“学会”発表にふさわしいのか考える。結論自体は分かっていた。そこに至るまでのプロセスが新しい。(かもしれない) 少なくとも整理されていて、わかりやすい。また、視覚的に覚えやすい。
初級ミクロ経済学 -ゲーム理論入門- 2014年12月19日 古川徹也 2014/12/19.
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
政策決定のプロセス 政策過程論 公共選択 ゲームの理論.
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
初級ミクロ経済学 -ゲーム理論入門- 2014年12月15日 古川徹也 2014年12月15日 初級ミクロ経済学.
モンテカルロ法と囲碁・将棋ソフトの人知超え
岩井 儀雄 コンピュータ基礎演習  ー探索、整列ー 岩井 儀雄
単位 おねだり ☆オセロ おねだり隊☆D班.
近畿大学理工学部情報学科 情報論理研究室 井藤 雄太
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
s a b f c e d 2016年度 有限幾何学 期末試験 問1:15点
ML 演習 第 7 回 新井淳也、中村宇佑、前田俊行 2011/05/31.
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
第Ⅱ部 協力ゲームの理論 第9章 シャープレイ値.
ボンドの効果 ―法と経済学による分析― 桑名謹三 法政大学政策科学研究所
~ 「スポーツにおけるゲーム分析」について ~
決定木とランダムフォレスト 和田 俊和.
情報論理工学 研究室 第10回 完全解析されたゲーム.
第5章:特徴の評価とベイズ誤り確率 5・3:ベイズ誤り確率とは
人工知能特論 9.パーセプトロン 北陸先端科学技術大学院大学 鶴岡 慶雅.
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
強化学習を用いたバックギャモンプレイヤーの生成 TD-Gammon
第4回 統計処理(1) 表計算ソフトの基本操作 塩浦 昭義 東北大学全学教育科目 情報基礎 A 1セメスター 木曜1,3講時
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
BLACK JACKの作成 ブラックジャックのルール 概要 勝敗の判定 開発中の問題点 Aの扱いについて 配り直し(DEAL) 工夫した点
配牌時の役満和了率 を考慮した麻雀AIの開発
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
アクションゲームにおけるプレイヤのレベルに応じたマップの自動生成手法の研究
近畿大学理工学部情報学科 情報論理研究室 松浦 美里
第Ⅱ部 協力ゲームの理論 第16章 破産問題 2008/07/02(水) ゲーム理論合宿 M1 浦田淳司.
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
モンテカルロ法を用いた 立体四目並べの対戦プログラム
理工学部情報学科 情報論理研究室 野中章宏 2016年2月5日
21  ~ぜったい負けたくない君へ~ 8班.
ベイズ最適化 Bayesian Optimization BO
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
アスペクト指向言語のための視点に応じた編集を可能にするツール
執筆者:難波和明 授業者:寺尾 敦 atsushi [at] si.aoyama.ac.jp
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
戦術的観点からの  変形碁盤間の   類似度評価 佐藤 真史(早稲田大学).
Othello G班         山崎 木下 山本 上手      .
人工知能概論 第4回 探索(3) ゲームの理論.
Presentation transcript:

麻雀ゲームにおけるAIの開発 08-1-037-0153   日高大地   近畿大学理工学部情報学科  

1.研究の目的 2.麻雀についての概要 3.戦略概要 4.捨て牌についての戦略 5.戦略決定 6.結果・考察 7.結論と今後の課題 目次 1.研究の目的 2.麻雀についての概要 3.戦略概要 4.捨て牌についての戦略 5.戦略決定 6.結果・考察 7.結論と今後の課題

研究の目的 チェスやオセロ、囲碁や将棋に代表される 「二人零和有限確定完全情報ゲーム」での 人工知能=AIは数多く存在するが・・・ 麻雀や花札・大富豪、バックギャモンに代表される 「零和有限不確定非完全情報ゲーム」 その中から麻雀のAIについて開発研究をする

なぜ強いAIを作るのが難しいのか 二人零和有限確定完全情報ゲーム 零和:全プレイヤーの点数の合計が0 損得が常に一致している 有限:可能な着手・行動が有限である 確定:偶然の要素が入り込まない 完全情報:ゲーム開始からこれまでの全ての情報 選択が各プレイヤーが知ることが出来る 不確定:偶然の要素がある 非完全情報:一部の情報しか与えられていない 二人零和有限不確定非完全情報ゲーム

なぜ強いAIを作るのが難しいのか 不確定:偶然の要素がある 非完全情報:一部の情報しか与えられていない ランダム要素・一部の情報 最適解を求められない 「確率・統計」で勝率を上げるしかない

4人でランダムに13枚の牌が配られ 順番に1枚づつ牌を引いていき 不要な牌を捨てる事を繰り返して 一番早くに和了形にするゲーム 麻雀について 4人でランダムに13枚の牌が配られ 順番に1枚づつ牌を引いていき 不要な牌を捨てる事を繰り返して 一番早くに和了形にするゲーム 左から数牌の筒子・索子・萬子 字牌の白・發・中 東南西北

4つの「面子」と1つの「雀頭」で構成される 面子は「順子」「刻子」「槓子」 雀頭は「対子」 麻雀の和了形 4つの「面子」と1つの「雀頭」で構成される 面子は「順子」「刻子」「槓子」 雀頭は「対子」 順子 刻子 槓子 対子

麻雀の定石 ・浮いている字牌や老頭牌を優先的に捨てた方がよい ・両面待ちが有効 ・全ての面子を順子で構成する平和が有効 ・他プレイヤーからのリーチは放銃を避けた戦略を採る

戦略的クラスの概要 麻雀における思考は大きく分けて2つ ・自分の手番での行動(リーチするか・カン・流局をするか・捨 て牌を考える) ・相手の手番での行動(ポン・チー・カン・ロンをする) 評価関数及び手牌の評価値を導入! 基本的には牌効率を重視

捨て牌の戦略 自分が狙っている役を揃える 面子や対子ができている牌の組み合わせを残す ドラは持っておく 相手の危険牌を捨てない 自分の狙っている役をバレないようにする

捨て牌の評価 Ejust : 現在の手牌の評価値 i : 次のツモ牌 pi : 次に牌iが来る確率 Ei : 次に牌iが来た時の手牌の評価値

捨て牌の評価 手牌の一例 待ち牌 一種4枚 面子が出来る! 待ち牌 二種8枚 面子が出来る!

捨て牌の評価 手牌の一例 待ち牌 二種6枚 待ち牌 二種4枚

捨て牌の評価 手牌の一例 捨てたほうが手牌の価値は高くなる 浮いてしまう牌 待ち牌 38枚 浮いてしまう牌 待ち牌 31枚

勝ち・負け戦略の選択 麻雀の戦略は、勝ちを狙う戦略と負けを避ける戦略に分けら れる 勝ちを狙う戦略 負けを避ける戦略 勝ちを狙う戦略  負けを避ける戦略  自分が和了する確率を上げることを目指す できるだけ放銃による失点をしない 狙っている手役の点数の高さ 現在の順目 リーチの有無

自分以外の手番での戦略 自分以外の手番において思考を要する行為は「手番プレイヤ ーの捨て牌に対してポン・チー・カンをするか」である 現在の状況(点差や狙っている手、形式テンパイのみを狙う) 評価関数を満たしていれば鳴くようにする

麻雀AIプログラム 本研究で作成するAIは、「まうじゃん for Java」プログラムをベ ースとしている。インターフェイス(麻雀をする上で最低限の 状況や牌を読み取るクラス)より情報を取得し、得られた情 報を元に複合的に条件指定をすることによりAIを作成した インターフェイス 作成した AIプログラム ベースプログラム (まうじゃん for Java)

結果 作成したAI および比較用に3つのAI AI1:鳴かずに手作りする AI2:平和役を最速で目指す 指標1 : 2.63 - 2.40×和了率 + 2.69×放銃率 指標2 : 2.52 - 1.62×1位率 + 1.52×4位率

結果・考察 対戦成績(対戦局数300) 予想平均順位 指標1 : 2.63 – 2.40×和了率 + 2.69×放銃率 AI AI1 AI2 AI3 和了率 26.4% 17.9% 20.4% 放銃率 13.7% 17.8% 16.8% 10.8% 1位率 38.2% 19.6% 20.9% 21.3% 4位率 15.6% 33.2% 28.6% 22.3% 指標1 : 2.63 – 2.40×和了率 + 2.69×放銃率 指標2 : 2.52 - 1.62×1位率 + 1.52×4位率 予想平均順位 AI AI1 AI2 AI3 指標1 2.36(±0.12) 2.68(±0.12) 2.59(±0.12) 2.49(±0.12) 指標2 2.14(±0.22) 2.71(±0.22) 2.61(±0.22) 2.51(±0.22)

結論と今後の課題 結果 非常に強いAIの開発が出来たことが示される。しかし麻雀は不確定非完全情報ゲームであり、ランダム要素が絡むので結果的にどの局面において必ずしも正しい判断が出来ているとは言いきれない 今後の課題 データベースとして癖やタイプを読み込ませ、相手の行動を察知した上で相手に合わせた戦略を採る 統計より強化 数試合程度では強さは測れず数百、数千試合をこなして ある程度の強さが測れる プログラムの簡略化

参考文献 1) 石畑恭平 : コンピュータ麻雀のアルゴリズム,IO BOOKS,工学社(2007) 2) 石畑恭平,まうじゃん的空間,「まうじゃん for java」http://www.amy.hi- ho.ne.jp/ishihata/maujong/ 3) とつげき東北 : 科学する麻雀,講談社現代新書(2004) 4)人工知能学会 : 人工知能の話題 TDギャモン (TD-Gammon) http://www.ai-gakkai.or.jp/whatsai/AItopics4.html 5)Gerald Tesauro,TD-Gammon,Communications of the ACM(1995)http://www.research.ibm.com/massive/tdl.html 6) 松原仁, ゲーム情報学の中の不完全情報ゲームの位置づけと現状, パネ ル討論「不完全情報ゲームにおける競技性について」, 第6 回エンターテイ メントと認知科学シンポジウム, (2012),http://entcog.c.ooco.jp/entcog/event/20120318/matsubara.pdf