モンテカルロ法によるミニ囲碁 09-1-037-0193 増井拓視 情報理論工学研究所.

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

強豪囲碁ソフト「彩」について 山下 宏 2009 年 9 月 11 日 機械振興会館 ※彩(あや)と読みま す.
Othello Let us cling together. メンバー 班長 杉本友宏 プログラマー 京谷貴平 アルゴリズム 佐野祐之 パワーポイント 菊澤遼平 発表 川本敏和.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
5路盤の完全解析の結果 論文名:Solving Go on Small Boards 著者: Eric C.D. van der Werf
囲碁プログラミングの探索における小目標間の依存関係解決に向けて
データ構造とアルゴリズム論 第5章 整列(ソート)のアルゴリズム
ML 演習 第 8 回 2007/07/17 飯塚 大輔, 後藤 哲志, 前田 俊行
懐かしき日の思ひで Aチーム リーダー 福島則行 吉武優一郎 水谷聡 石松孝之 近藤悠介
近畿大学理工学部情報学科 情報論理工学研究室 滝口 直
コンピュータ囲碁の仕組み ~ 将棋との違い ~
ブロック運びゲーム.
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
2016/05/30 駒澤大学 経営学部 市場戦略学科 Mr4026 ばーちー
群論とルービックキューブ 白柳研究室  水野貴裕.
リバーシの並列化 並列化するときに起こる問題を定義しろ おぷてぃまいざー SSAIとMSAIは比較しろ  前田昂寛.
卒業論文のタイトルをここに (発表時間は5分です。 PPTスライドは10枚程度にまとめる事)
インタラクティブ・ゲーム制作 <プログラミングコース>
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
モーツァルトの手法に着想を得た ランダム作曲法
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
モンテカルロ法と囲碁・将棋ソフトの人知超え
単位 おねだり ☆オセロ おねだり隊☆D班.
碁石ゲームに関する考察 4目並べ講座 パターン生成ゲームの楽しみ 徳山 豪 (東北大学) .
近畿大学理工学部情報学科 情報論理研究室 井藤 雄太
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
情報論理工学 研究室 第6回: リバーシの合法手生成.
~オセロゲーム~ アルゴリズムとそのプログラム
リアル卓球 B2 Ryo.
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
情報論理工学 研究室 第10回 完全解析されたゲーム.
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
前回の練習問題.
リーダー 亀山奈央 プレゼンター 橘貴志 アルゴリズム 古森愛美 プログラマー 中島宏基 パワーポイント 公文ゆい
強化学習を用いたバックギャモンプレイヤーの生成 TD-Gammon
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
BLACK JACKの作成 ブラックジャックのルール 概要 勝敗の判定 開発中の問題点 Aの扱いについて 配り直し(DEAL) 工夫した点
配牌時の役満和了率 を考慮した麻雀AIの開発
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
京都大学大学院情報学研究科 宮川博光 伊藤大雄
三次元チェスアプリケーションの開発 およびUIの機能向上
近畿大学理工学部情報学科 情報論理研究室 松浦 美里
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
JavaScript プログラミング演習 - じゃんけんゲーム - 「ホームページを動的に制御したい…」
モンテカルロ法を用いた 立体四目並べの対戦プログラム
情報論理工学 研究室 第7回: 強い手の選択.
理工学部情報学科 情報論理研究室 野中章宏 2016年2月5日
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
麻雀ゲームにおけるAIの開発    日高大地   近畿大学理工学部情報学科  
超短期トレードで生き残るためのテクニックと考え方
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
数値解析ⅡーI ~オセロゲームのプログラム~
指導教員 石水 隆 講師 情報論理工学研究室 木ノ下 翔大
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
精密工学科プログラミング基礎 第7回資料 (11/27実施)
第Ⅰ部 非協力ゲームの理論 第6章 情報の価値 2008/07/01(火) ゲーム理論合宿 M2 渡辺美穂.
戦術的観点からの  変形碁盤間の   類似度評価 佐藤 真史(早稲田大学).
Othello G班         山崎 木下 山本 上手      .
情報論理工学 研究室 第8回: ミニマックス法.
精密工学科プログラミング基礎Ⅱ 第2回資料 今回の授業で習得してほしいこと: 配列の使い方 (今回は1次元,次回は2次元をやります.)
Presentation transcript:

モンテカルロ法によるミニ囲碁 09-1-037-0193 増井拓視 情報理論工学研究所

目次 囲碁について 二人零和有限確定完全情報ゲーム 研究内容 結果・結論 今後の課題 参考文献

囲碁について 二人零和有限確定完全情報ゲーム 地の多少で勝敗を判定

二人零和有限確定完全情報ゲーム 零和:勝敗の合計が常に0 有限:そのゲームにおける可能な手の組み合わせが有限 確定:プレイヤーの着手以外に偶然がゲームに影響を与えるといった事が無い 完全情報ゲーム:各プレイヤーがこれまでに行った選択についてすべての情報を完全に知ることができる

囲碁のルール 周りを別の石で囲めばその石を取ることができる 地を多く取った方の勝ち 呼吸点が無くなる所には打てない 一手前と同じ状況になる所へは打てない

地 自分が持っている陣地 基本的に囲っている場所

呼吸点 石が連続して繋がる事が出来る場所 呼吸点が無い場所、置いた場合その石に呼吸点が無くなる場所には打てない

コウ 一手前と同じ状況の盤面になってはいけないので一度別の場所に打たなければならない

二人零和有限確定完全情報ゲームに対する手法 先読みと局面の評価値 数手先の局面まで先読み 先読み手数に応じて処理時間が非常に長くなる場合がある 定石・対戦データベース 定石をデータベース化し、有効な局面があればそれに従って打つ データベースが存在しない手には使用できない

5×5路盤囲碁の完全解析について 5路盤を用いた囲碁については完全解析が完了しており、黒の25目勝ちという結果となる モンテカルロ法のみを用いて完全解析の結果とどのような違いがでるか検証する

モンテカルロ法 昨今の囲碁プログラムにて勢いのある手法 乱数を用いてランダム配置し終局まで対局、それを複数回繰り返し一番勝率の高い手を選択する

ミニ囲碁のAI モンテカルロ法のみを使用 自殺手の判定 コウの判定 勝敗判定

結果・考察 ランダムCPUとの対戦を100回行った結果 完全解析との違いについては勝敗判定にあると考えられる 83勝17敗 平均5目勝ちとなった 完全解析との違いについては勝敗判定にあると考えられる

今後の課題 勝利判定等の調整 データベースや評価値等の参照による手法の組み合わせを行うことにより勝率を上げる

参考文献 ハウコレ、写真付きで解説!「地」ってなに?囲碁の対局の流れ(前半の打ち方)、http://howcollect.jp/article/881 とりあえず遊ぶための囲碁ルール(基礎)、http://www.geocities.co.jp/Playtown-King/9806/igo/igo01.html 石の生死を見分けよう - 棋聖戦 : 囲碁将棋 : YOMIURI ONLINE(読売新聞)、http://kisei.yomiuri.co.jp/column/shinan_igoamigo/02.htm