1. MC/UCT アルゴリズムの並列化に伴う挙動の変化 2. 探索木共有型並列とマスタスレーブ型並列 ― プラットフォームとの関係 ―

Slides:

Advertisements

Similar presentations

1 広島大学理学研究科尾崎裕介石川健一. 1. Graphic Processing Unit (GPU) とは？ 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.

Advertisements

コンピュータ囲碁における Root 並列化について発表者副島佑介. 目次研究背景 – 囲碁の難しさ – モンテカルロ木探索について – 並列化手法の先行研究提案手法 – Root 並列化における合議制実験結果まとめ.

MPIを用いたグラフの並列計算情報論理工学研究室藤本　涼一.

第3回並列計算機のアーキテクチャと並列処理の実際

Webプロキシサーバにおける動的資源管理方式の提案と実装

計算理工学基礎「ハイパフォーマンスコンピューティングの基礎」

キャッシュ付ＰＲＡＭ上の並列クィックソートと並列マージソート

Chapter11-4(前半) 加藤健.

最新ファイルの提供を保証する代理FTPサーバの開発

ラベル付き区間グラフを列挙するBDDとその応用

全体ミーティング (4/25) 村田雅之.

ASE 2011 Software Model Checking

分散コンピューティング環境上の Webリンク収集システムの実装

研究集会「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日完全パイプライン化シフト QR 法による実対称三重対角行列の固有値並列計算宮田考史　　山本有作　　張紹良　名古屋大学　大学院工学研究科　計算理工学専攻.

Finger patternのブロック化による陰的wavelet近似逆行列前処理の高速化

対角マトリックスを用いた３次元剛塑性有限要素法の並列計算対角マトリックスを用いた剛塑性有限要素法

AllReduce アルゴリズムによる QR 分解の精度について

時空間データからのオブジェクトベース知識発見

仮想マシンの並列処理性能に対するCPU割り当ての影響の評価

全体ミーティング (6/13) 村田雅之.

P,Q比が変更可能なScaLAPACKのコスト見積もり関数の開発

ファイルシステムキャッシュを考慮した仮想マシン監視機構

OSが乗っ取られた場合にも機能するファイルアクセス制御システム

モンテカルロ法によるミニ囲碁増井拓視情報理論工学研究所.

大きな仮想マシンの複数ホストへのマイグレーション

複数CPU間のための共有メモリ小島隆史（中央大学大学院理工学研究科國井研究室）

ネストした仮想化を用いた VMの安全な帯域外リモート管理

同期的にアドバイスを活性化できる分散動的アスペクト指向システム

モンテカルロ碁電気通信大学村松研究室下川和也.

UCB+ 法を用いた Big Two AI の研究

帯域外リモート管理の継続を実現可能なVMマイグレーション手法

ユーザ毎にカスタマイズ可能な Web アプリケーション用のフレームワークの実装

SAP & SQL Server テクニカルアーキテクチャ概要マイクロソフト株式会社 SAP/Microsoft コンピテンスセンター

ブロック線図とシグナルフォローグラフ 1. ブロック線図と信号の流れキーワード：直列系、並列系、フィードバック系、伝達関数

演算/メモリ性能バランスを考慮したマルチコア向けオンチップメモリ貸与法

過負荷時のWebアプリケーションの性能劣化を改善する Page-level Queue Scheduling

型付きアセンブリ言語を用いた安全なカーネル拡張

大阪市立大学学術情報総合センター大西克実

過負荷時の分散ソフトウェアの性能劣化を改善するスケジューリングの提案

C言語でスレッド (Pthread) 2007年1月11日海谷治彦.

ソケットプログラム(TCP,UDP) EasyChat開発

2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散

MPIとOpenMPを用いた Nクイーン問題の並列化

梅澤威志隣の芝は茶色いか梅澤威志

Copyright (C) 2011 Hideki Kato

ユーザ毎にカスタマイズ可能な Webアプリケーションの効率の良い実装方法

各種ルータに対応する P2P通信環境に関する研究

第7回授業計画の修正中間テストの解説・復習前回の補足（クロックアルゴリズム・PFF) 仮想記憶方式のまとめ特別課題について

通信機構合わせた最適化をおこなう並列化ンパイラ

決定木 Decision Tree DT 明治大学理工学部応用化学科データ化学工学研究室金子弘昌.

未使用メモリに着目した複数ホストにまたがる仮想マシンの高速化

複数ホストにまたがって動作する仮想マシンの障害対策

目的：高速QR分解ルーチンのGPUクラスタ実装

ウェブアプリケーションサーバの Degradation Schemeの制御に向けて

VMが利用可能なCPU数の変化に対応した並列アプリケーション実行の最適化

研究背景と目的局面対による学習の高速化学習器の説明今後大規模な強化学習技術の実証と応用一方で、強化学習手法の台頭

Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化

福岡工業大学情報工学部情報工学科種田研究室于聡

秘匿リストマッチングプロトコルとその応用

全体ミーティング (5/23) 村田雅之.

囲碁プログラム彩の仕組み山下宏 2008年9月4日 FIT2008.

BSPモデルを用いた並列計算の有用性の検証

理工学部情報学科情報論理工学研究室延山周平

強制パススルー機構を用いた VMの安全な帯域外リモート管理

SMP/マルチコアに対応した型付きアセンブリ言語

IPmigrate：複数ホストに分割されたVMのマイグレーション手法

分散メモリ型並列計算機上での行列演算の並列化

アーキテクチャパラメータを利用した並列GCの性能予測

インセンティブにより自律ユーザに高品質なオーバーレイマルチキャスト木を構築させるプロトコルの提案

強制パススルー機構を用いた VMの安全な帯域外リモート管理

Presentation transcript:

1. MC/UCT アルゴリズムの並列化に伴う挙動の変化 2. 探索木共有型並列とマスタスレーブ型並列 ― プラットフォームとの関係 ― 並列 MC/UCT アルゴリズムの実装東京大学大学院創造情報学専攻　加藤英樹，竹内郁雄 (gg@neu.ci.i.u-tokyo.ac.jp) 　1. MC/UCT アルゴリズムの並列化に伴う挙動の変化　2. 探索木共有型並列とマスタスレーブ型並列 ― プラットフォームとの関係 ― 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 研究の位置づけ時系列連想記憶の工学的応用フィードバックのあるニューラルネット小脳 ⇔ パーセプトロン（静的）大脳新皮質 ⇔ 時系列連想記憶（動的）大脳基底核 ⇔ 強化学習囲碁ソフトに時系列連想記憶を組み込む面白い，分かり易い小規模，完全情報 ⇒ 一人でできる用途: 定石，手筋など（手順）時系列連想記憶をシミュレーション部に組み込む 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) イメージ（持ち運び重視） UCT part (server) Socket tcp/udp MC part (client) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) プラットフォーム Cell Sony Playstation 3 Linux（Fedora Core 5 & Cell SDK 2.1）メモリ 256 MiB; ユーザが使えるのは 200 MiB 強ユーザが使える SPU は 6個 / 3.18 GHz x86 自作 PC Linux（Fedora Core 5）メモリ 4 GiB 4 コア（Intel Q6600 / 3 GHz） 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

UCT アルゴリズム（L. Kocsis, et al. 2006） UCT（Upper confidence bounds applied to trees） Upper confidence bound（UCB）= 平均 + 偏差探索木のルートから UCB が最大の手を辿り降り，末端で未展開の手を展開し，シミュレーションにより評価値（勝敗）を求め，木を遡りながら各ノードの値を更新する．あるノードの値 = 下位ノードの値の “通った回数” による重み付き平均木はインクリメンタル & 非対称に成長する（ベストファースト的）ある枝を永久に切り捨てることはない木目細かい時間制御可能 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) UCT の探索木 0.0 0/1 0.85 51/60 0.83 40/48 0.67 2/3 1.0 8/8 1 0/8 15/15 25/25 2/2 0.75 3/4 0.86 48/56 40/40 ルート局面 1/1 探索木ランダムシミュレーション 1: 勝 0: 負 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 並列化に伴う課題探索木共有方式（探索木を共有し排他制御）を例に挙動の変化: UCT は直列アルゴリズム木を降る → 展開 → シミュレーション → 更新　をループロック → 木を降る → 展開 → 解放 → シミュレーション → ロック → 更新ロック → 木を降る → 展開 → 解放 → シミュレーション同じノードを展開する排他制御（クライアント・サーバ方式では不要）オーバーヘッド: ex. mutex vs. spinlock 公平性: Spinlock は NUMA（non-uniform memory access）システムでは不公平になる可能性がある． ⇒ Fairlock 並列度メモリ共有並列（並列度~1桁） ⇒ LAN 接続並列（~2桁？） 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 実装方式探索木共有方式単一スレッド用のプログラムをそのままマルチスレッド化探索木を共有，アクセスする時はスレッド間で排他制御シンプル共有記憶システム限定クライアント・サーバ（マスタ・スレーブ）方式サーバが探索木を，クライアントがシミュレーションを担当分散記憶システムや LAN 接続にも使える実行速度は？ 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 両方式のタイムチャート D: Descend Tree U: Update Tree 探索木共有クライアント・サーバ 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) UCT の並列化に伴う勝率の低下改善前: max -35 ELO，改善後: max -20 ELO（4並列）勝率は確かに低下するが，大したことはない方式備考勝率（vs GNU Go） ELO 探索木共有 1スレッド 50.4 ± 1.1% +2 4スレッド 46.7 ± 1.1% -23 fpu 修正法 47.4 ± 1.1% -18 クライアント・サーバ 45.3 ± 1.1% -33 flag 法 48.9 ± 1.1% -8 48.2 ± 1.1% -13 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) 実装方式と playout 速度 CPU 方式並列数時間（μs）速度（kpo/s）比直/全 Cell 探索木共有 1 830 1.2 0.09 6 400 2.5 2 0.28 クラ・サバ 850 140 7.1 0.08 x86 160 6.1 5 0.05 4 39 26 22 159 6.3 0.06 43 23 19 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)

(C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp) まとめと今後並列化に伴う挙動の変化勝率で評価大したことはない（4並列）探索木共有方式とクライアント・サーバ方式 2種類のプラットフォーム上で実行速度を測定した． x86 ではクライアント・サーバ方式が1割強遅かった． Cell ではクライアント・サーバ方式が3倍速かった．今後遅延時間の影響の定量的な評価遅延時間を有効に利用する手法の定量的な評価先出し，冗長，投機，予測実行など 2007-11-08 (C) 2007 H. Kato (gg@nue.ci.i.u-tokyo.ac.jp)