モンテカルロ碁電気通信大学村松研究室下川和也.

Slides:

Advertisements

Similar presentations

コンピュータ囲碁における Root 並列化について発表者副島佑介. 目次研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究提案手法 – Root 並列化における合議制実験結果まとめ.

Advertisements

G 問題コードアートオンライン原案：西出ライタ：伊藤テスタ：西出. 問題概要 0 大きさのさまざまな n 個の円に多角形 m 個を入れられるか判定する問題 0 ただし、同じ円に複数の多角形を入れることはできない 0 もし、入れられる場合は、辞書順最小の入れ方を出力 ① ② ③ ① ②.

A Simple Constant Time Enumeration Algorithm for Free Trees 中野眞一宇野毅明群馬大学情報学研究所 2003 年 9 月 19 日アルゴリズム研究会.

強豪囲碁ソフト「彩」について山下宏 2009 年 9 月 11 日機械振興会館 ※彩（あや）と読みます.

 C 川船美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーション作成 o スマートフォン向けアプリケーション.

区間グラフにおける区間表現からMPQ-treeを効率よく構成するアルゴリズム

５路盤の完全解析の結果論文名：Solving Go on Small Boards 著者： Eric C.D. van der Werf

囲碁プログラミングの探索における小目標間の依存関係解決に向けて

2009/12/4 グラフ (2) 第１０講: 平成21年12月4日 (金) 4限 E252教室コンピュータアルゴリズム.

データ構造とアルゴリズム論第５章整列（ソート）のアルゴリズム

コンピュータ囲碁の仕組み～将棋との違い～

四路の碁アプリ開発情報論理工学研究所高倉秀斗.

群論とルービックキューブ白柳研究室　水野貴裕.

リバーシの並列化並列化するときに起こる問題を定義しろおぷてぃまいざー SSAIとMSAIは比較しろ　前田昂寛.

モンテカルロ法によるミニ囲碁増井拓視情報理論工学研究所.

整数計画法を用いたペグソリティアの解法 ver. 2.1

モンテカルロ法と囲碁・将棋ソフトの人知超え

数独パズルの難易度判定～解法ロジックを用いた数値化の提案～

単位おねだり ☆オセロおねだり隊☆D班.

VI-7　連続分布（面データ）を分析する方法

碁石ゲームに関する考察 4目並べ講座パターン生成ゲームの楽しみ徳山　豪　(東北大学）　.

近畿大学理工学部情報学科情報論理研究室井藤雄太

UCB+ 法を用いた Big Two AI の研究

JAVAでつくるオセロ伊東飛鳥、宮島雄一長畑弘樹、ソギ原直人.

回帰モデル・クラス分類モデルを評価・比較するためのモデルの検証 Model validation

情報論理工学研究室第6回：リバーシの合法手生成.

プログラミング基礎ａ第８回プログラムの設計アルゴリズムとデータ構造

MPIによる行列積計算情報論理工学研究室渡邉伊織情報論理工学研究室渡邉伊織です。

～オセロゲーム～アルゴリズムとそのプログラム

計算機実験の計画 References 研究目的囲碁・将棋での強化学習高信頼性人工知能システムへの展望大規模な強化学習技術の実証と応用

決定木とランダムフォレスト和田　俊和.

情報論理工学研究室第10回完全解析されたゲーム.

Copyright (C) 2011 Hideki Kato

1. MC/UCT アルゴリズムの並列化に伴う挙動の変化 2. 探索木共有型並列とマスタスレーブ型並列 ― プラットフォームとの関係 ―

前回の練習問題.

４人版リバーシYoninの解析情報論理研究室藤本侑花

BLACK JACKの作成ブラックジャックのルール概要勝敗の判定開発中の問題点 Aの扱いについて配り直し（DEAL) 工夫した点

データ構造とアルゴリズム論第６章整列（ソート）のアルゴリズム

近畿大学理工学部情報学科情報論理研究室松浦美里

決定木 Decision Tree DT 明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

A Simple Algorithm for Generating Unordered Rooted Trees

連続領域におけるファジィ制約充足問題の反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.

近畿大学理工学部情報学科情報論理工学研究室赤井隆純

プログラミング基礎ａ第８回プログラムの設計アルゴリズムとデータ構造

データ構造とアルゴリズム論第５章整列（ソート）のアルゴリズム

JavaScript プログラミング演習－じゃんけんゲーム－「ホームページを動的に制御したい…」

スポーツの最適化優勝決定可能性問題スポーツスケジュール問題.

データ構造とアルゴリズム論第５章整列（ソート）のアルゴリズム

モンテカルロ法を用いた立体四目並べの対戦プログラム

情報論理工学研究室第7回：強い手の選択.

疑似乱数，モンテカルロ法によるシミュレーション

Hoffman符号 2011/05/23.

研究背景と目的局面対による学習の高速化学習器の説明今後大規模な強化学習技術の実証と応用一方で、強化学習手法の台頭

コミュニケーションとネットワークを探索する

超短期トレードで生き残るためのテクニックと考え方

ベイズ最適化 Bayesian Optimization BO

Data Clustering: A Review

自己組織化マップ Self-Organizing Map SOM

遺伝的アルゴリズム (GA) を活用したスペクトルの波長選択および時系列データにおけるプロセス変数かつその時間遅れ (ダイナミクス) の選択明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

全体ミーティング (5/23) 村田雅之.

数値解析ⅡーI ~オセロゲームのプログラム~

Advanced Data Structure 第3回

囲碁プログラム彩の仕組み山下宏 2008年9月4日 FIT2008.

数値解析Ⅱ ～五目並べのプログラミング～Ｃ班.

実験計画法 Design of Experiments (DoE)

戦術的観点からの　変形碁盤間の　　類似度評価佐藤　真史（早稲田大学）.

Othello Ｇ班　　　　　　　　　山崎　木下　山本　上手　　　　　　.

情報論理工学研究室第8回：ミニマックス法.

原口和也高橋隆一丸岡章石巻専修大学理工学部情報電子工学科

Q q 情報セキュリティ第７回：２００５年５月２７日（金） q q.

Presentation transcript:

モンテカルロ碁電気通信大学村松研究室下川和也

モンテカルロ碁とはモンテカルロ法を囲碁に応用したものプレイアウトを繰り返し、最も勝率の高い着手を選ぶ 2006年、Crazy Stoneがコンピュータオリンピアード9路盤で優勝

プレイアウトある局面から、ランダムに着手して、終局までプレイすること互いに自分の「眼」を埋める以外の合法手がなくなれば終局中国ルールで勝敗を計算

プレイアウトの例終局面

考え方 … … … 各候補手の着手後の局面でプレイアウト：局面：着手：プレイアウト：黒の勝ち：白の勝ち勝率 30% 勝率 60% 勝率 10%

問題点明らかに悪い手にもプレイアウトを均等に実行してしまう有望な候補手により多くのプレイアウトを割り当てたい

UCB(Upper Confidence Bound) 選択回数が少ないものほど高く勝率が高いものほど高く UCB値が最も高い候補手に対してプレイアウト

最もUCB値が高い候補手に対してプレイアウト：局面 … … … ：着手：プレイアウト：黒の勝ち：白の勝ち UCB値：0.8 UCB値：0.9 UCB値：0.7

着手選択の基準勝率が高いものを選ぶ UCB値が高いものを選ぶプレイアウト回数が高いものを選ぶ ―勝率の信頼性が低い可能性 ―勝率が低い可能性プレイアウト回数が高いものを選ぶ ―通常はこれを用いる

まとめプレイアウトはランダムに着手していき、中国ルールで勝敗を判定する UCB値を用いることで効率的にプレイアウトを割り当てることができる現在のコンピュータ囲碁は、UCB値を用いて木探索を行うUCT(UCB for Tree)が主流である