近畿大学理工学部情報学科 情報論理工学研究室 滝口 直

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
2行+αチョンプに関する考察 京都大学 ○後藤順一 伊藤大雄.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
人工知能概論 第4回 探索(3) ゲームの理論.
5路盤の完全解析の結果 論文名:Solving Go on Small Boards 著者: Eric C.D. van der Werf
Problem H: Queen’s case
データ構造と アルゴリズム 第十二回 知能情報学部 知能情報学科 新田直也.
ML 演習 第 8 回 2007/07/17 飯塚 大輔, 後藤 哲志, 前田 俊行
コンピュータ囲碁の仕組み ~ 将棋との違い ~
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
リバーシの並列化 並列化するときに起こる問題を定義しろ おぷてぃまいざー SSAIとMSAIは比較しろ  前田昂寛.
2004年度JAVAゼミコンテスト作品 「Othello」
第2回電王戦 プロ棋士とコンピュータによる対局 2013年3月23日〜4月20日 5週 持ち時間4時間 ニコニコ生放送で生中継
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
インタラクティブ・ゲーム制作 <プログラミングコース>
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
15パズルの解法について 北海道情報大学 情報メディア学部 情報メディア学科 新井山ゼミ  大石 貴弘.
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
クロスワードゲームの 作り方を学ぼう/やってみよう ‐ボードゲームの動作機構‐
モンテカルロ法と囲碁・将棋ソフトの人知超え
単位 おねだり ☆オセロ おねだり隊☆D班.
碁石ゲームに関する考察 4目並べ講座 パターン生成ゲームの楽しみ 徳山 豪 (東北大学) .
近畿大学理工学部情報学科 情報論理研究室 井藤 雄太
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
情報論理工学 研究室 第6回: リバーシの合法手生成.
研究集会「組合せゲーム・パズル」,豊橋技術科学大学
~オセロゲーム~ アルゴリズムとそのプログラム
シャノンのスイッチングゲームにおけるペアリング戦略について
シャノンのスイッチングゲームにおけるペアリング戦略の複雑さについて
情報論理工学 研究室 第5回: 局面・駒石・手の表現.
情報論理工学 研究室 第10回 完全解析されたゲーム.
米山研究室紹介 -システム制御工学研究室-
佐藤のゲーム とその仲間たち (完全可解ゲームの話) 関西学院大学  川中 宣明 数理科学研究センター談話会    2011年6月29日.
テトリスにおけるAI の開発 情報論理工学研究室 13— 川原 翔太.
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
リーダー 亀山奈央 プレゼンター 橘貴志 アルゴリズム 古森愛美 プログラマー 中島宏基 パワーポイント 公文ゆい
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
三次元チェスアプリケーションの開発 およびUIの機能向上
近畿大学理工学部情報学科 情報論理研究室 松浦 美里
数独の解生成と 解に対する番号付け 理学部 情報科学科 渡辺研究室 戸神星也.
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
シューティングゲームにおける 未経験者と経験者の差異の解析
モンテカルロ法を用いた 立体四目並べの対戦プログラム
情報論理工学 研究室 第7回: 強い手の選択.
3次元Nクイーン問題の 解の存在の検証 07-1-037-0106 前波 大貴 情報論理工学研究室 宜しくお願いします。
理工学部情報学科 情報論理研究室 野中章宏 2016年2月5日
麻雀ゲームにおけるAIの開発    日高大地   近畿大学理工学部情報学科  
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
指導教員 石水 隆 講師 情報論理工学研究室 木ノ下 翔大
飛び駒を考慮した逆算法に基づく詰将棋問題の列挙
飛び駒を考慮した逆算法に基づく詰将棋問題の列挙
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
戦術的観点からの  変形碁盤間の   類似度評価 佐藤 真史(早稲田大学).
Othello G班         山崎 木下 山本 上手      .
情報論理工学 研究室 第8回: ミニマックス法.
原口和也 高橋隆一 丸岡章 石巻専修大学 理工学部 情報電子工学科
人工知能概論 第4回 探索(3) ゲームの理論.
C.岩崎雅哉 大須賀佑介 杉原雄太 中野武重 日名啓吾
P2Pによる協調学習システム 唐澤 信介   北海道工業大学 電気工学専攻.
京都大学 情報学研究科 通信情報システム専攻 高田智史 joint work with 伊藤大雄 中村義作
Presentation transcript:

近畿大学理工学部情報学科 情報論理工学研究室 08-1-037-0094 滝口 直 アンパンマン将棋 の 完全解析 近畿大学理工学部情報学科 情報論理工学研究室 08-1-037-0094 滝口 直

目次-1(発表の流れ) アンパンマン将棋とは ゲーム理論研究 盤と駒 初期配置 進行とゲーム目標 一般的なゲームの総局面数 本研究の目的 どうぶつしょうぎの完全解析手法 アンパンマン将棋の総局面数

目次-2(発表の流れ) アンパンマン将棋のプログラム AI対戦の結果 部分解析 結論 今後の課題 参考文献 コンピューターAIの手法 評価値計算 クラス説明 AI対戦の結果 部分解析 結論 今後の課題 参考文献

「アンパンマンはじめてしょうぎ」とは 2012年6月28日発売 女流棋士の北尾まどか初段が考案 子供向けの将棋 アンパンマンというキャラクター性により、人気商品 イベント開催 Official websiteより

駒と盤 「アンパンマン、バイキンマン」 前、斜め前、横の5方向 「カレーパンマン、どきんちゃん」 前、斜め前の3方向   前、斜め前、横の5方向 「カレーパンマン、どきんちゃん」   前、斜め前の3方向 「食パンマン、ホラーマン」   縦、横の3方向 3×5の盤 Oficial websiteより

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

初期配置 5行目は、アンパンマンの陣地 1行目は、バイキンマンの陣地 アンパンマン、バイキンマンを リーダーとする リーダーを中央           リーダーとする リーダーを中央 カレーパンマン、どきんちゃん    →リーダーの左側 食パンマン、ホラーマン →リーダーの右側

進行とゲーム目標 手番をじゃんけんで決める 先手から交互に1手ずつ駒を動かす。パスは許されない ゲーム目標 チェスと同じゲーム進行 ゲーム目標 相手チームのリーダーを取る(捕まえる) 相手チームの陣地にリーダーが入る(トライ) 千日手(スリーフォールド・レピティション) 同じ局面が3回でた時点で引き分け 「連続王手の千日手」の概念はなし

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

ゲーム理論研究 アンパンマン将棋は二人零和有限確定完全情報ゲーム 二人零和有限確定完全情報ゲーム=最も単純なゲーム 理論上完全な先読み可能 アンパン将棋、囲碁、五目並べ、オセロなど 零和=ゲーム終了時プレイヤー全員の利得合計が一定(0) 有限=各プレイヤーの可能な手の組み合わせが有限 確定=不確定要素がない 完全情報=非公開領域がない 理論上完全な先読み可能

一般的なゲームの 総局面数 リバーシ 1028通り、 チェス 1050通り、 将棋 1069通り、 囲碁 10170通り リバーシ 1028通り、 チェス 1050通り、 将棋 1069通り、 囲碁 10170通り 現在のコンピュータでは解析は不可能

簡略化したゲーム サイズ 6x6 のリバーシ 16 対 20 で後手勝ち サイズ 4x4 の囲碁 持碁(引き分け) Joel Feinstein, Amenor Wins World 6x6 Championships!, Forty billion noted under the tree (July 1993), サイズ 4x4 の囲碁 持碁(引き分け) 清慎一, 川嶋俊, 探索プログラムによる四路盤囲碁の解, 情報処理学会研究報告, Vol. 2000-GI-004, サイズ 5x5 の囲碁 黒の 25 目勝ち Eric C.D. van der Welf, H.Jaap van den Herik, and Jos W.H.M.Uiterwijk, Solving Go on Small Boards,

本研究の目的 アンパンマン将棋はどちらが必勝か、引き分けか 将棋、チェス等の研究に役立つ アンパンマン将棋は千日手が多く発生する 本将棋 倉庫番ゲーム(コンピューターパズルゲーム)など ループを多く持つ木の探索研究に役立つ アンパン将棋のアプリケーションを作成し、研究の土台を作る AI対戦を可能にし、一人でもゲームをすることができるようにする

どうぶつしょうぎ ルール考案者が同じ 幼児用将棋 3×4の盤 4種類の駒 捕まえた駒は持ち駒になる 後ろ方へ進める どうぶつしょうぎ official website より

どうぶつしょうぎの 完全解析の手法 田中哲郎氏, 「どうぶつしょうぎ」の完全解析, 情報処理学会研究報告 Vol.2009-GI-22 No.3, 後手78目で勝利 手法 全ての局面を列挙 初期局面から到達可能な全局面を含んだソート済み配列を作る 後退解析(retrograde analysis) により必勝法を導き出す 末端局面集合から始めて、勝敗判定済みの局面集合を増やしていく

総局面数の見積もり アンパンマン 15通り バイキンマン 11通り(アンパンマンの隣接におけない) 食パンマン 16通り(盤外+1) アンパンマン  15通り バイキンマン  11通り(アンパンマンの隣接におけない) 食パンマン   16通り(盤外+1) ホラーマン   16通り(盤外+1) カレーパンマン 13通り(到達できない升が3つ) ドキンちゃん  13通り(到達できない升が3つ) 15*11*16*16*13*13*2 /2= 7,138,560 総局面数    7,138,560通り 動物将棋  1,567,925,964通り

アンパンマン将棋の プログラム 着手可能手の発見 王手の発見 勝敗の判定 千日手の判定 局面の評価値計算 各自駒が各升へいけるか リーダーの自殺手を除く 王手の発見 リーダーが相手のリーダー以外の駒に次の手番で捕られる状況か 王手をかけられているなら王手から抜け出す手を探す 勝敗の判定 相手リーダーが盤上にいない場合 リーダーが相手ゴールにいる場合 千日手の判定 盤上の駒の位置を覚え、前から順番に比較、3回現れたら引き分け 局面の評価値計算

コンピューターAIの手法 局面の評価値計算 定跡データベース(将棋) 一定手数の先読み 終盤での必勝読み、完全読み モンテカルロ法(オセロ)など

局面の評価値計算 リーダーは前にいるほうが評価は高い 盤面上の駒の数が多いほど高い 着手可能手が多いほど評価は高い 勝利条件を満たすと評価値を無限大 敗北条件を満たすと評価値を無限小 引き分け条件を満たすと評価値を0

クラス説明 クラスAnpanman クラスBoard クラスPiece クラスNextMove 実行クラス 将譜の出力 盤を管理 駒を実際に移動、駒を取り除くなど クラスPiece 駒ためのクラス 移動方向、初期位置、移動可能な座標など クラスNextMove データクラス 駒の種類、座標位置、評価をセットし返す。

実験の結果 AI同士の対戦を 100 回行った 先手の 33 勝 53 負 14 引き分け

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンB2 3:カレーパンマンA4 A3 B3にきく駒がない

アンパンマン将棋の部分解析* 初手カレーパンマンA4の場合も同じ事が言える 1:カレーパンマンB4 2:バイキンマンB2

アンパンマン将棋の部分解析* 初手カレーパンマンA4の場合も同じ事が言える 1:カレーパンマンA4 2:バイキンマンB2

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 ドキンちゃんが前へ進むと

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC2

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンB4 2:バイキンマンA4 3:カレーパンマンA4 4:ドキンちゃんB2 5:食パンマンC4

アンパンマン将棋の部分解析 1:アンパンマンC4 2:バイキンマンB2 3:カレーパンマンB4 4:ドキンちゃんC2 5:食パンマンB5 6:ホラーマンA2 7:食パンマンA5 8:ホラーマンA3

アンパンマン将棋の部分解析 1:アンパンマンC4 2:バイキンマンB2 3:カレーパンマンB4 4:ドキンちゃんC2 5:食パンマンB5 6:ホラーマンA2 7:食パンマンA5 8:ホラーマンA3

結論 AI同士の対戦結果から後手有利と推測する。 部分解析から両者最善手を指すと千日手と推測する。 アンパンマン将棋のプログラムを作成することができ、完全解析の骨組みを完成させることができた。

今後の課題 全ての局面を列挙 後退解析(retrograde analysis) により必勝法を導き出す 初期局面から到達可能な全局面を含んだソート済み配列を作る 後退解析(retrograde analysis) により必勝法を導き出す 末端局面集合から始めて、勝敗判定済みの局面集合を増やしていく アプレットを使用したアプリケーション開発

参考文献 [1] アンパンマンはじめてしょうぎ, セガトイズ(2012), http://www.segatoys.co.jp/anpan/product/popup/_legacy/learn/06.html [2] 岸本章宏, 柴原一友, 鈴木 豪, 小谷善行, ゲーム計算メカニズム-将棋・囲碁・オセロ・チェスのプログラ ムはどう動く-:pp2-20, コロナ社,(2010). [3] 池泰弘, Java 将棋のアルゴリズム:工学社(2007). [4] 池 泰弘, コンピュータ将棋のアルゴリズム―最強アルゴリズムの探求とプログラミング,工学社 (2005) [5] 田中哲郎, 「どうぶつしょうぎ」の完全解析, 情報処理学会研究報告 Vol.2009-GI-22 No.3, pp.1-8(2009), http://id.nii.ac.jp/1001/00062415/ [6] Janos Wagner and Istvan Virag, Solving renju, ICGA Journal, Vol.24, No.1, pp.30-35 (2001), http://www.sze.hu/~gtakacs/download/wagnervirag_2001.pdf [7] Jonathan Schaeffer, Neil Burch, Yngvi Bjorsson, Akihiro Kishimoto, Martin Muller, Robert Lake, Paul Lu, and Steve Suphen, Checkers is solved, Science Vol.317, No,5844, pp.1518-1522 (2007). http://www.sciencemag.org/content/317/5844/1518.full.pdf

参考文献 [8] Joel Feinstein, Amenor Wins World 6x6 Championships!, Forty billion noted under the tree (July 1993), pp.6-8, British Othello Federation's newsletter., (1993), http://www.britishothello.org.uk/fbnall.pdf [9] 清慎一, 川嶋俊, 探索プログラムによる四路盤囲碁の解, 情報処理学会研究報告, Vol. 2000-GI-004, pp.69-76, (2000), http://id.nii.ac.jp/1001/00058633/ [10] Eric C.D. van der Welf, H.Jaap van den Herik, and Jos W.H.M.Uiterwijk, Solving Go on Small Boards, ICGA Journal, Vol.26, No.2, pp.92-107 (2003). [11] 日本 5 五将棋連盟, http://www.geocities.co.jp/Playtown-Spade/8662/ [12] 「ごろごろどうぶつしょうぎ」発売開始!, お知らせ, 日本将棋連盟, 2012 年 11 月 26 日, (2012), http://www.shogi.or.jp/topics/2012/11/post-652.html [13] 北尾まどか, 藤田麻衣子, どうぶつしょうぎねっと, (2010), http://dobutsushogi.net/ [14] IBM100 – Deep Blue, IBM, (1997), http://www-03.ibm.com/ibm/history/ibm100/us/en/icons/deepblue/ [15] Michael Khodarkovsky and Leonid Shamkvoich, 人間対機械-チェス世界チャンピオンとスーパーコ ンピューターの闘いの記録, 毎日コミュニケーションズ, (1998) [16] 伊藤英紀, A 級リーグ差し手 1 号, (2013), http://aleag.cocolog-nifty.com/ [17] 米長邦雄, われ敗れたり コンピュータ棋戦のすべてを語る, 中央公論社, (2012)

参考文献 [18] 日本囲碁規約逐条解説 第十二条 http://www.nihonkiin.or.jp/joho/kiyaku/kiyaku.htm [19] 岸本章宏, 柴原一友, 鈴木 豪, 小谷善行, ゲーム計算メカニズム-将棋・囲碁・オセロ・チェスのプログラム はどう動く-:pp.21-22, コロナ社, (2010) [20] 田中哲郎,ボードゲーム「シンペイ」の完全解析情報処理学会研究報告 vol. 2006(23), pp.65-72(2006) http://ci.nii.ac.jp/naid/110004683809 [21] 高橋 大介, 佐藤 佳州, 2U-4 モンテカルロ法によるコンピュータ将棋の実現(ゲーム・知識ベース, 学生セッション,人工知能と認知科学) 全国大会講演論文集 第 70 回平成 20 年(2), "2-123"-"2-124", 2008-03-13 http://ci.nii.ac.jp/naid/110006865370 [22] オセロプログラムと人間はどっちが強いのか?ロジステロとの戦い http://uguisu.skr.jp/othello/7-2.html [23] Michael Buro , LOGISTELLO, 2002, https://skatgame.net/mburo/log.html