第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日

Slides:



Advertisements
Similar presentations
G ゼミ 2010/5/14 渡辺健人. パフォーマンスの測定 CUDA Visual Profiler CUDA の SDK に標準でついているパフォーマン ス測定用のツール 使い方: exe ファイルのパスと作業ディレクトリ指定して実 行するだけ 注意点 : GPU のコード実行後にプログラム終了前に,
Advertisements

コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
1 なんとなく Ajax ~新しくて古い XMLHttp 川合孝典 (Kansai.pm) 2005/5/22.
 C 川船 美帆.  強い人工知能の作成 o 「遺伝的アルゴリズム」  「どうぶつしょうぎ」のアプリケーショ ン作成 o スマートフォン向けアプリケーション.
寺尾 敦 青山学院大学社会情報学部 atsushi [at] si.aoyama.ac.jp
関西Ruby会議01 Lightning Talk
情報処理実習 第05回 Excelマクロ機能入門 操作マクロ入門.
技術トピックス 2014/10.
ML 演習 第 8 回 2007/07/17 飯塚 大輔, 後藤 哲志, 前田 俊行
知識情報演習Ⅲ(後半第1回) 辻 慶太(水)
コンピュータ囲碁の仕組み ~ 将棋との違い ~
稲葉 一浩 (k.inaba) Python と プログラミングコンテスト 稲葉 一浩 (k.inaba)
2008/03/01 D-BOF k.inaba はじめての initial D 2008/03/01 D-BOF k.inaba
JavaによるCAI学習ソフトウェアの開発
C#によるWindowsFormApplication入門
前期総合(CMを作ろう) 情報科教育法 13 回目 2005/7/9 太田 剛.
卒研:データベースチーム 第4回 JSP、サーブレット
報告 (2006/9/6) 高橋 慧.
学校の コンピュータ 発表者 Miho Harusawa.
オブジェクト指向プログラミング(2) OOPの三大要素 「クラス」「ポリモーフィズム」「継承」
応用情報処理V 第1回 プログラミングとは何か 2004年9月27日.
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
コンピュータ将棋におけるカーネル法を用いた静的評価関数の学習
SWAT I18N 概要 付け足した機能(実行時に言語の切り替え-i18nの範囲で) 問題点(細かい技術的問題、根本的問題) 今後
単位 おねだり ☆オセロ おねだり隊☆D班.
応用情報処理V 第1回 プログラミングとは何か 2003年9月29日.
発表者 2011/01/08 楽しい256バイトイントロの 世界 発表者 2011/01/08.
C#とC++とオブジェクト指向 上甲 健史.
京都大学 ○太田圭亮 川原純 伊藤大雄 堀山貴史
パスファインダーの作成 slis. tsukuba. ac. jp/~fuyuki/cje2/CJE161018
第2回 FLIP FLOP杯 どうしてこの大会をひらくのか? 大会の目的はなにか?.
基礎プログラミング演習 第1回.
慶應義塾大学経済学部 グレーヴァ香子 Takako Fujiwara-Greve
平成22年6月15日 図書系職員のための アプリケーション開発講習会
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
岩村雅一 知能情報工学演習I 第8回(後半第2回) 岩村雅一
情報通信システム(13) plala. or 情報通信システム(13) 年7月24日 火曜日  午後4時10分~5時40分 NTT-TX Corp. 加藤 洋一.
Windows 2000 拡張カーネルの技術紹介 2018年6月10日 黒翼猫.
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
C言語でスレッド (Pthread) 2007年1月11日 海谷 治彦.
東京海洋大産学官連携研究員/技術コンサルタント 高須 知二 Tomoji TAKASU
Java Bytecode Modification and Applet Security
人工知能を動かしてみる(Keras を用いたニューラルネットワークの定義,コンパイル,学習,評価,予測)
岩村雅一 知能情報工学演習I 第8回(C言語第2回) 岩村雅一
東京海洋大産学官連携研究員/技術コンサルタント 高須 知二 Tomoji TAKASU
卒論の書き方: 参考文献について 2017年9月27日 小尻智子.
データ構造とアルゴリズム論 終章 専門科目におけるプログラミング
中京大学 工学部 電気電子工学科 白井研究室 4年 T 為房直人
岩村雅一 知能情報工学演習I 第13回(後半第7回) 岩村雅一
情報システムの基礎概念 (1) 情報システムとは
数量分析 第2回 データ解析技法とソフトウェア
C#言語ソースプログラムの原型 C言語 C#言語 Hello World! Hello Students! オマジナイ! 適当なクラス名
・タイプ別のフレームワーク ・デジタルTips(小技テクニック情報)
TCP/IPとプロセス間通信 2007年1月12日 海谷 治彦.
第2回課題 配布した通り.氏名・学生番号を忘れないこと.
RDFの生産工程管理システムへの適用 情報処理学会 第74回全国大会 2012年3月6日 松江工業高等専門学校  情報工学科 越田 高志.
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
インスタンスの型を考慮したJavaプログラムの実行経路の列挙手法の提案
統計ソフトウエアRの基礎.
Introduction to Soft Computing
地理情報システム論(総)/ 国民経済計算論(商)
統合開発環境によって表現された 言語機構によるコードのモジュール化
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
試行錯誤を重視した数学教育    群馬県立 吉井高等学校           大 塚 道 明.
岩村雅一 知能情報工学演習I 第8回(後半第2回) 岩村雅一
岩村雅一 知能情報工学演習I 第8回(C言語第2回) 岩村雅一
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
「速さ」で学んだことを用いて 課題を解決しよう
第6分科会 商品コンセプト開発の研究 要旨 2013年度テーマ 商品開発手法「キーニーズ法」(ニーズアプローチ)の有効性検証 1.研究の目的
ZendFrameworkで使うためにFilemakerクラスをスクラッチから作ってみる
Presentation transcript:

第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日 Windfall 第28回世界コンピュータ将棋選手権アピール文章 作成:井本 康宏 作成日:2018/3/吉日

忙しい人のためのキーワード一覧 これさえあれば、1分で全てわかる 今回のWindfallは以下の要素で成り立っています 評価関数:deep neural networkに変更 ゲーム木探索:なくても何とかなる 仕様:脱ビットボード, 合法手の計算をニューラルネットで実行 プログラミング:Python, Tensorflow, sonnet, 今回はC++のコードはなし その他:なぜか後退した進捗 わからなかった方は、次項以降をどうぞ

開発者自己紹介 開発者 職業 棋力 開発のきっかけ 井本 康宏 エンジニア 測ったことがないのでわかりませんが、すごく弱いです 学生時代に囲碁・将棋部だったなんて言えない 開発のきっかけ 趣味、好奇心、研究スキル、プログラミングスキルの向上を目的として、当時、話題 だったこともあり開発を始めました

開発コンセプト 「せっかく作るのだったら、独創性にあふれるソフトにしたい」 直近の半年は評価関数を重点的に作成 (少なくとも開発を開始した当時の)既存のソフトの抱える多くの理論的な疑問点・問 題点の解決 例えば、どの局面を探索するか 探索の深さ、消費時間 枝刈り 水平線効果 bias-varianceを考慮しない評価値 理論的に有効性が確かめられた手法を取り入れれば、簡単に強いソフトが作れるはず 直近の半年は評価関数を重点的に作成

評価関数の開発 2駒関係を行列演算で表現するものからDNNに変更 しかし、学習は思う様に進まず 内部表現が全く学習できていなかった 仕方がないので、end-to-endでの学習をあきらめて特徴量を作り込むことに計 画を変更 そして なぜか、Tensorflowで差し手を生成するライブラリの開発が始まるのであった

差し手生成ライブラリ Tensorflow(ラッパーにsonnet)を利用して将棋の差し手を生成 たぶん世界初 つい、カッとなって作った。公開はしていない。 そのうち公開する予定 C++との連携を考えたくなかったので作りました 大量の局面を同時にGPUで計算すれば早いと信じています しかし、大会に持参するPCにGPUはないのだよ

その他 半年前の電王トーナメントで利用したC++のコードは利用しない予定です PythonからC++を呼び出しに謎のバグがあることがわかったので、今回はPythonの コードだけで参加します スレッドの主な制御がC++側にあるので複雑怪奇で手に負えなくなりました バグの原因はおそらくスレッド関係 その煽りを受けて、探索ルーチンもなくなりました 使用するライブラリもPythonから利用できるということで、python-shogiを利 用します やねうら王は多分使いません