Download presentation
Presentation is loading. Please wait.
1
Copyright (C) 2011 Hideki Kato
2011/10/8 コンピュータ囲碁 /10/8 CGF 加藤英樹 現状 有段ソフト 2011 KGS コンピュータ囲碁大会年間チャンピオン 最近の対人戦績 技術 CLOP (Confident Local Optimization for Noisy Black-Box Parameter Tuning) by Rémi Coulom LGR (Last-Good-Reply policy) by Peter Drake ルート並列は難しい? 2011/10/8 Copyright (C) 2011 Hideki Kato (C) 2007 Hideki Kato
2
Copyright (C) 2011 Hideki Kato
有段ソフト 2011 プログラム KGS ランク ハードウェア規模 備考 Zen Zen19D 5.8d 26 コア(6 PC) 9x15s Zen19 4.7d 8 x 2.26 GHz Crazy Stone CrazyStone 4.8d 24 コア MoGo 3~4d? 数十~数百コア Pachi pachi2 3.7d 5x15s Erica EricaBot 3.1d 8 コア 5x20s Fuego 3d? 数十~数千コア 銀星 GinseiIgo 2.8d ? 10x15s (J) 彩 AyaMC4? 2.4d 6 x 3.33 GHz 1m+10x15s Steenvreter stv 2~3d? 4 x 2.4 GHz Many Faces of Go Manyfaces1 2.3d 4~数百コア 2011/10/8 Copyright (C) 2011 Hideki Kato
3
KGS コンピュータ囲碁大会年間チャンピオン
プログラム 1 2 s1 3 4 5 s2 6 7 8 s3 9 10 11 s4 12 計 Zen 92 Pachi 6.5 63.5 Many Faces of Go 28.5 彩 17 Erica 14 MoGo (Czebot) Steenvreter StoneGrid Fuego (Puego) Valkyria gomorra oakfoam 2011/10/8 Copyright (C) 2011 Hideki Kato
4
最近の対人戦績 日付 人間 プログラム 盤 置石 結果 イベント 備考 2010-10-01 藤澤里奈初段 Erica 19 六子 1-0
Computer Olympiad 金沢 青葉かおり四段 Zen 0-1 第4回 UEC 杯, 電通大 鄭銘コウ九段 Fuego , 29 John Tromp アマ二段 Many Faces of Go 互先 4-0 七番勝負, ロンドン 初段ベット 台湾のプロ棋士 3人 MoGoTW 9 7-1 台南大学 10人 白 14-7 台湾 コミ七目半 or 八目半 周俊勲九段 1-1 Human vs. Computer Go Competition, パリ (続く) 盲目碁 周平強五段 0-2 MoGo 13 二子 三子 逆コミ三目半 2011/10/8 Copyright (C) 2011 Hideki Kato
5
最近の対人戦績(続き) 日付 人間 プログラム 盤 置石 結果 イベント 備考 2011-05-04 周俊勲九段 & 周平強五段
MoGoTW & Pachi 19 六子 1-0 (続き) 連碁 周俊勲九段 MoGoTW 七子 Pachi 0-1 金榮三八段 MyGoFriend 9 互先 0-2 Showmatch +2-0 , 28 周俊勲九段, 周平強五段, 黑嘉嘉五段, 張凱馨四段 Fuego, MoGoTW, Many Faces of Go, Zen 6-2 FUZZ-IEEE 2011, 台北 3-1 13 二子 4-4 コミ三目半 コミ七目半 台湾のプロ棋士 10人 21-9 7 0-20 コミ九目半 林耕三六段 Zen 五子 European Go Congress, ボルドー 野口基樹アマ 七段 先 2-0 2011/10/8 Copyright (C) 2011 Hideki Kato
6
Q & A
7
Copyright (C) 2011 Hideki Kato
CLOP (Confident Local Optimization for Noisy Black-Box Parameter Tuning) 複数のパラメタを同時に最適化 二次曲面で近似 ノイズに強い 良くできた GUI (Qt4) ポータブル (Linux, Windows) 2011/10/8 Copyright (C) 2011 Hideki Kato
8
Copyright (C) 2011 Hideki Kato
2011/10/8 Copyright (C) 2011 Hideki Kato
9
Copyright (C) 2011 Hideki Kato
2011/10/8 Copyright (C) 2011 Hideki Kato
10
Copyright (C) 2011 Hideki Kato
2011/10/8 Copyright (C) 2011 Hideki Kato
11
LGR (Last-Good-Reply policy)
“The Last-Good-Reply Policy for Monte-Carlo Go”, Peter Drake, ICGA Journal, 2009 シミュレーションで勝った時の手 (reply move) を覚えておき, 後のシミュレーションで利用 Adaptive simulation, or dynamic policy の一種 19路の 16k playout/move 以上で効果あり Orego のランクが 11k から 8k (KGS) に向上 手番×手 → 応手 (LGR1), 手番×手×手 → 応手 (LGR2) 2011/10/8 Copyright (C) 2011 Hideki Kato
12
ルート並列は難しい? コマンド 探索木の情報 Master Node 0 Slave 1 Slave n Node 1 Node n
各ノードは自律的に一定間隔で前回との差分をブロードキャストする Node 0 Slave 1 Slave n Node 1 Node n 2011/10/8 Copyright (C) 2011 Hideki Kato
Similar presentations
© 2024 slidesplayer.net Inc.
All rights reserved.