1. MC/UCT アルゴリズムの 並列化に伴う挙動の変化 2. 探索木共有型並列と マスタスレーブ型並列 ― プラットフォームとの関係 ―

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

コンピュータ囲碁における Root 並列化について 発表者 副島 佑介. 目次 研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究 提案手法 – Root 並列化における合議制 実験結果 まとめ.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
第3回 並列計算機のアーキテクチャと 並列処理の実際
Webプロキシサーバにおける 動的資源管理方式の提案と実装
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
キャッシュ付PRAM上の 並列クィックソートと 並列マージソート
Chapter11-4(前半) 加藤健.
最新ファイルの提供を保証する代理FTPサーバの開発
ラベル付き区間グラフを列挙するBDDとその応用
全体ミーティング (4/25) 村田雅之.
ASE 2011 Software Model Checking
分散コンピューティング環境上の Webリンク収集システムの実装
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法
AllReduce アルゴリズムによる QR 分解の精度について
時空間データからのオブジェクトベース知識発見
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
全体ミーティング (6/13) 村田雅之.
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
ファイルシステムキャッシュを 考慮した仮想マシン監視機構
OSが乗っ取られた場合にも機能するファイルアクセス制御システム
モンテカルロ法によるミニ囲碁 増井拓視 情報理論工学研究所.
大きな仮想マシンの 複数ホストへのマイグレーション
複数CPU間のための共有メモリ 小島 隆史(中央大学大学院理工学研究科 國井研究室)
ネストした仮想化を用いた VMの安全な帯域外リモート管理
同期的にアドバイスを活性化できる分散動的アスペクト指向システム
モンテカルロ碁 電気通信大学 村松研究室 下川和也.
UCB+ 法を用いた Big Two AI の研究
帯域外リモート管理の継続を 実現可能なVMマイグレーション手法
ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装
SAP & SQL Server テクニカルアーキテクチャ概要 マイクロソフト株式会社 SAP/Microsoft コンピテンスセンター
ブロック線図とシグナルフォローグラフ 1. ブロック線図と信号の流れ キーワード : 直列系、並列系、フィードバック系、 伝達関数
演算/メモリ性能バランスを考慮した マルチコア向けオンチップメモリ貸与法
過負荷時のWebアプリケーションの 性能劣化を改善する Page-level Queue Scheduling
型付きアセンブリ言語を用いた安全なカーネル拡張
大阪市立大学 学術情報総合センター 大西克実
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
C言語でスレッド (Pthread) 2007年1月11日 海谷 治彦.
ソケットプログラム(TCP,UDP) EasyChat開発
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
MPIとOpenMPを用いた Nクイーン問題の並列化
梅澤威志 隣の芝は茶色いか 梅澤威志
Copyright (C) 2011 Hideki Kato
ユーザ毎にカスタマイズ可能な Webアプリケーションの 効率の良い実装方法
各種ルータに対応する P2P通信環境に関する研究
第7回 授業計画の修正 中間テストの解説・復習 前回の補足(クロックアルゴリズム・PFF) 仮想記憶方式のまとめ 特別課題について
通信機構合わせた最適化をおこなう並列化ンパイラ
決定木 Decision Tree DT 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
複数ホストにまたがって動作する仮想マシンの障害対策
目的:高速QR分解ルーチンのGPUクラスタ実装
ウェブアプリケーションサーバの Degradation Schemeの 制御に向けて
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
福岡工業大学 情報工学部 情報工学科 種田研究室 于 聡
秘匿リストマッチングプロトコルとその応用
全体ミーティング (5/23) 村田雅之.
囲碁プログラム 彩の仕組み 山下 宏 2008年9月4日 FIT2008.
BSPモデルを用いた 並列計算の有用性の検証
理工学部情報学科 情報論理工学研究室 延山 周平
強制パススルー機構を用いた VMの安全な帯域外リモート管理
SMP/マルチコアに対応した 型付きアセンブリ言語
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
分散メモリ型並列計算機上での行列演算の並列化
アーキテクチャパラメータを利用した並列GCの性能予測
インセンティブにより自律ユーザに 高品質なオーバーレイマルチキャスト木を 構築させるプロトコルの提案
強制パススルー機構を用いた VMの安全な帯域外リモート管理
Presentation transcript:

1. MC/UCT アルゴリズムの 並列化に伴う挙動の変化 2. 探索木共有型並列と マスタスレーブ型並列 ― プラットフォームとの関係 ― 並列 MC/UCT アルゴリズムの実装 東京大学大学院創造情報学専攻 加藤英樹,竹内郁雄 (gg@neu.ci.i.u-tokyo.ac.jp)  1. MC/UCT アルゴリズムの 並列化に伴う挙動の変化  2. 探索木共有型並列と マスタスレーブ型並列 ― プラットフォームとの関係 ― 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 研究の位置づけ 時系列連想記憶の工学的応用 フィードバックのあるニューラルネット 小脳 ⇔ パーセプトロン(静的) 大脳新皮質 ⇔ 時系列連想記憶(動的) 大脳基底核 ⇔ 強化学習 囲碁ソフトに時系列連想記憶を組み込む 面白い,分かり易い 小規模,完全情報 ⇒ 一人でできる 用途: 定石,手筋など(手順) 時系列連想記憶をシミュレーション部に組み込む 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) イメージ(持ち運び重視) UCT part (server) Socket tcp/udp MC part (client) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) プラットフォーム Cell Sony Playstation 3 Linux(Fedora Core 5 & Cell SDK 2.1) メモリ 256 MiB; ユーザが使えるのは 200 MiB 強 ユーザが使える SPU は 6個 / 3.18 GHz x86 自作 PC Linux(Fedora Core 5) メモリ 4 GiB 4 コア(Intel Q6600 / 3 GHz) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

UCT アルゴリズム(L. Kocsis, et al. 2006) UCT(Upper confidence bounds applied to trees) Upper confidence bound(UCB)= 平均 + 偏差 探索木のルートから UCB が最大の手を辿り降り,末端で未展開の手を展開し,シミュレーションにより評価値(勝敗)を求め,木を遡りながら各ノードの値を更新する. あるノードの値 = 下位ノードの値の “通った回数” による重み付き平均 木はインクリメンタル & 非対称に成長する(ベストファースト的) ある枝を永久に切り捨てることはない 木目細かい時間制御可能 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) UCT の探索木 0.0 0/1 0.85 51/60 0.83 40/48 0.67 2/3 1.0 8/8 1 0/8 15/15 25/25 2/2 0.75 3/4 0.86 48/56 40/40 ルート 局面 1/1 探索木 ランダム シミュレーション 1: 勝 0: 負 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 並列化に伴う課題 探索木共有方式(探索木を共有し排他制御)を例に 挙動の変化: UCT は直列アルゴリズム 木を降る → 展開 → シミュレーション → 更新 をループ ロック → 木を降る → 展開 → 解放 → シミュレーション → ロック → 更新 ロック → 木を降る → 展開 → 解放 → シミュレーション 同じノードを展開する 排他制御(クライアント・サーバ方式では不要) オーバーヘッド: ex. mutex vs. spinlock 公平性: Spinlock は NUMA(non-uniform memory access)システムでは不公平になる可能性がある. ⇒ Fairlock 並列度 メモリ共有並列(並列度~1桁) ⇒ LAN 接続並列(~2桁?) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 実装方式 探索木共有方式 単一スレッド用のプログラムをそのままマルチスレッド化 探索木を共有,アクセスする時はスレッド間で排他制御 シンプル 共有記憶システム限定 クライアント・サーバ(マスタ・スレーブ)方式 サーバが探索木を,クライアントがシミュレーションを担当 分散記憶システムや LAN 接続にも使える 実行速度は? 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 両方式のタイムチャート D: Descend Tree U: Update Tree 探索木共有 クライアント・サーバ 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) UCT の並列化に伴う勝率の低下 改善前: max -35 ELO,改善後: max -20 ELO(4並列) 勝率は確かに低下するが,大したことはない 方式 備考 勝率(vs GNU Go) ELO 探索木共有 1スレッド 50.4 ± 1.1% +2 4スレッド 46.7 ± 1.1% -23 fpu 修正法 47.4 ± 1.1% -18 クライアント・サーバ 45.3 ± 1.1% -33 flag 法 48.9 ± 1.1% -8 48.2 ± 1.1% -13 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 実装方式と playout 速度 CPU 方式 並列数 時間(μs) 速度(kpo/s) 比 直/全 Cell 探索木共有 1 830 1.2 0.09 6 400 2.5 2 0.28 クラ・サバ 850 140 7.1 0.08 x86 160 6.1 5 0.05 4 39 26 22 159 6.3 0.06 43 23 19 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) まとめと今後 並列化に伴う挙動の変化 勝率で評価 大したことはない(4並列) 探索木共有方式とクライアント・サーバ方式 2種類のプラットフォーム上で実行速度を測定した. x86 ではクライアント・サーバ方式が1割強遅かった. Cell ではクライアント・サーバ方式が3倍速かった. 今後 遅延時間の影響の定量的な評価 遅延時間を有効に利用する手法の定量的な評価 先出し,冗長,投機,予測実行など 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)