コンピュータ囲碁の仕組み ~ 将棋との違い ~

Slides:



Advertisements
Similar presentations
コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
Advertisements

強豪囲碁ソフト「彩」について 山下 宏 2009 年 9 月 11 日 機械振興会館 ※彩(あや)と読みま す.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
UECコンピュータ大貧民大会 参加後の考察
囲碁プログラミングの探索における小目標間の依存関係解決に向けて
プログラマのレベルアップ.
Problem A: ねこかわいがり♪ 問題作成: 山本 解法作成: 山本・高橋 解説: 山本.
将棋名人のレーティングと棋譜分析 山下 宏 2014年11月7日 GPW 箱根.
ML 演習 第 8 回 2007/07/17 飯塚 大輔, 後藤 哲志, 前田 俊行
人間の対戦相手としての ゲームアルゴリズム, 話題提供
HSPでのミニゲーム作成 早稲田実業学校PC班 Y氏.
四路の碁アプリ開発 情報論理工学研究所 高倉秀斗.
代表値と散らばり.
将棋プログラム「激指」  鶴岡 慶雅.
リバーシの並列化 並列化するときに起こる問題を定義しろ おぷてぃまいざー SSAIとMSAIは比較しろ  前田昂寛.
2004年度JAVAゼミコンテスト作品 「Othello」
第2回電王戦 プロ棋士とコンピュータによる対局 2013年3月23日〜4月20日 5週 持ち時間4時間 ニコニコ生放送で生中継
人 工 知 能 第3回 探索法 (教科書21ページ~30ページ)
インタラクティブ・ゲーム制作 <プログラミングコース>
A班 ランダム選択に一言加えたら・・・ 成田幸弘 橋本剛 嶌村都.
シミュレーション論Ⅰ 第4回 基礎的なシミュレーション手法.
15パズルの解法について 北海道情報大学 情報メディア学部 情報メディア学科 新井山ゼミ  大石 貴弘.
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
ランダムウォークに関するいくつかの話題 ・ランダムウォークの破産問題 ・ランダムウォークの鏡像原理 1 小暮研究会Ⅰ 11月12日
モンテカルロ法と囲碁・将棋ソフトの人知超え
単位 おねだり ☆オセロ おねだり隊☆D班.
第7回 卒研進行状況 04A2029           古賀慎也.
建物周辺気流の予測手法としての 数値シミュレーション・風洞実験の検証
碁石ゲームに関する考察 4目並べ講座 パターン生成ゲームの楽しみ 徳山 豪 (東北大学) .
近畿大学理工学部情報学科 情報論理研究室 井藤 雄太
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
春の統計学・計量経済学勉強会 第1回:2017年2月21日(火) 市野泰和
JAVAでつくるオセロ 伊東飛鳥、宮島雄一 長畑弘樹、ソギ原直人.
~オセロゲーム~ アルゴリズムとそのプログラム
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
東京大学大学院情報理工学系研究科 Y.Sawa
情報論理工学 研究室 第10回 完全解析されたゲーム.
Copyright (C) 2011 Hideki Kato
二人零和不完全情報ゲームであるジャンケンにおけるゲームの洗練法
前回の練習問題.
4人版リバーシYoninの解析 情報論理研究室 藤本 侑花
G班メンバー リーダー 橋本望 SE 北本理紗と服部友哉 PPT作成 橋本望と山田侑加
近畿大学理工学部情報学科 情報論理工学研究室 赤井 隆純
モンテカルロ法を用いた 立体四目並べの対戦プログラム
疑似乱数, モンテカルロ法によるシミュレーション
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
ベイジアンネットワーク概説 Loopy Belief Propagation 茨城大学工学部 佐々木稔
21  ~ぜったい負けたくない君へ~ 8班.
超短期トレードで生き残るためのテクニックと考え方
★C++/オブジェクト指向実践企画★ Othelloゲーム作成
シミュレーション論Ⅰ 第7回 シミュレーションの構築と実施.
代表値と散らばり.
近畿大学 理工学部 情報学科 情報論理工学部研究室 潘小月
数値解析ⅡーI ~オセロゲームのプログラム~
Othelloのプログラム 班長:佐々木 悠二 班員:石黒 護     井上 雄滋     齊藤 良裕     清水 裕亮.
リバーシ 06a1056 藤田将義.
F班 メンバー 班長 雨堤 智宏 アルゴリズム解析 角田 泰彬 竹林 秀高 ppt作成 清水 貴史
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
数値解析Ⅱ ~五目並べのプログラミング~ C班.
近畿大学理工学部情報学科 情報論理工学研究室 段野健太
or-8. ゲーム理論 (オペレーションズリサーチを Excel で実習するシリーズ)
第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日
ネット時代のセキュリティ3(暗号化) 2SK 情報機器工学.
戦術的観点からの  変形碁盤間の   類似度評価 佐藤 真史(早稲田大学).
Othello G班         山崎 木下 山本 上手      .
cp-15. 疑似乱数とシミュレーション (C プログラミング演習,Visual Studio 2019 対応)
野球自慢  皆さんこんにちは。甲南大学経営学部の東野 壮汰です。今回私が選んだタイトルは野球についての自慢です。 経営学部経営学科              東野 壮汰.
Presentation transcript:

コンピュータ囲碁の仕組み ~ 将棋との違い ~ コンピュータ囲碁の仕組み ~ 将棋との違い ~ 山下 宏 2014年6月21日 歌舞伎座.tech#4

私について 電王戦で豊島さんとYSSで対戦しました。 将棋だけでなく囲碁も作っています。 コンピュータ囲碁の大会(UEC杯、2014年3月開催、全16チーム) 1位 Zen (天頂の囲碁) 日本 2位 CrazyStone (最強の囲碁) フランス 3位 Aya → 私のプログラム 世界トップクラスではないが、そこそこ上位。 というわけで囲碁のお話です。

将棋の局面評価 局面を直接数値に変換 +286

囲碁の局面評価 将棋と同じく直接変換 黒の13目勝ち 2006年まではこの手法だった

コンピュータの棋力の推移

2006年に囲碁は何が起こったか? モンテカルロ法を利用した囲碁ソフトが登場

モンテカルロ法とは? 乱数を使って数値計算を行う手法 何度も繰り返すことで正解に近づく 円周率(π)の計算など

モンテカルロ法を使った囲碁の仕組み 1.乱数で黒石、白石を交互に置く 2.打つ場所がなくなったら終了 3.点数を計算する 4.1. - 3. を何度も繰り返す (実際のサンプルを表示)

モンテカルロ法での局面評価 乱数で最後まで打ってみる 黒の45目勝ち 1000回繰り返すと675回黒が勝つ

9路でのシミュレーション 初期局面 30手目 終局図

19路でも基本は同じ 初期局面 100手目 終局図

シミュレーションの精度を上げる 囲碁知識を利用 アタリを逃げる、石を取る 直前の相手の手の近くに打つ 石のパターン(3x3など) プロの棋譜から着手確率を調べる アタリ 高確率 低確率

黒石の着手確率 数値が大きいほど着手確率が高い

パターンを利用したサンプル サンプルを再生

単純乱数(上)と囲碁っぽい乱数 単純乱数(上)は途中図がひどい。最後はどちらも同じ感じ

シミュレーションが強さを決める 1手に10000回のシミュレーション シミュレーション = 評価関数 純粋乱数 ・・・ 15級 純粋乱数 ・・・ 15級 囲碁知識を利用 ・・・ 2段 シミュレーション = 評価関数 将棋 ・・・ 評価関数の正確さ 囲碁 ・・・ シミュレーションの正確さ

将棋の木探索 深さ1、2、3と順番に深く読んでいく

囲碁の木探索 開始局面から最終局面へ、を何度も繰り返す

将棋と囲碁の手の選択(木探索) 将棋 囲碁 平均可能手数、80手(最大593手) すべての可能な手を読む 見込みのない手は浅い読みで打ち切り 平均可能手数、250手(最大361手) 木探索では上位30手程度しか調べない 読みぬけの危険あり

モンテカルロ法+探索は応用範囲が広い ルールだけの実装で評価関数を作れる 囲碁以外でも 多人数ゲームでも リアルタイムゲームでも有効 アマゾン、Lines of Action、さめがめ 多人数ゲームでも カタンの開発者たち、ハーツ リアルタイムゲームでも有効 Ms. Pac-Man

Ms. Pac-Man 一番高得点になる行動を選ぶ 知識ベースのソフトを破り最高得点を取得

現在のコンピュータ囲碁の棋力 アマチュアの県代表レベル プロとは4子でいい勝負 将棋に比べて10年遅れている感じ 98%以上のアマチュアはもう勝てない プロとは4子でいい勝負 将棋だと飛香落ち程度に相当 将棋に比べて10年遅れている感じ

まとめ 囲碁はモンテカルロ法で壁を超えた。 将棋も囲碁もプロ(人間のエキスパート)の手を真似することで強くなった。 意味は分からずとも上級者の真似をするのは大事 将棋は全幅探索。囲碁は選択探索。 モンテカルロ法+木探索は応用範囲が広い ゲームによって向き不向きがある 将棋では初段程度でうまくいってない

ご静聴ありがとうございました