Ｒを用いたブートストラップ法の大規模並列計算

Ｒを用いたブートストラップ法の大規模並列計算
東京工業大学・情報理工下平英寿統計連合大会

概要東工大のスパコン TSUBAME の紹介 Rの並列化ライブラリ snow の紹介
大規模並列計算の体験談： pvclust, scaleboot

東工大のスパコン TSUBAME

TSUBAME @ Tokyo Tech TSUBAME: 10000 cpu くらいらしいですが混雑しています
TSUBASA: さいきん，GCOE（計算世界観）が700cpu くらい調達しました

Sun Fire X4600 Enterprise-Class Data Center Compute Engine
大規模分散並列型演算サーバ高性能密結合分散並列型演算サーバ (合計: 639台) CPU : 8ソケット800 シリーズAMD Opteron 2.4GHz メモリ : 32GB (32x DIMM スロット) OS : SuSE Enterprise Linux 9 SP3 　IB card : Voltaire HCA 400Ex-D single port 4X x 2 (latency/ 3.5μs) メモリ共有型演算サーバ群 (合計: 16台) CPU : 8ソケット800 シリーズAMD Opteron 2.6GHz メモリ : 64GB (32x DIMM スロット) OS : SuSE Enterprise Linux 9 SP3 合算ピーク性能 : 50.4 Tera Flops 合算メモリ容量 : 21.4 Tera Bytes Full performance Opteron processor modules (8 -total) Dual-Core Available CPU Module 6 PCI-Express slots - 4 – x8-lane slots - 2 – x4-lane slots Redundant, hot- plug fans 2 PCI-X slots (133MHz/64-bit) 24” deep

東京工業大学学術国際情報センター TSUBAME Grid Cluster
大規模分散並列型演算サーバ高性能密結合分散並列型演算サーバメモリ共有型演算サーバ群 Sun Fire X4600 655nodes 16CPU/node 10480CPU Memory: 21.4TB type nodes CPU clock MEM/node A 639 2.4GHz 32GB B 16 2.6GHz 64GB ClearSpeed 360枚・・・655nodes InfiniBand Network Voltaire ISR 9288 ×8 100ギガビット級ネットワーク装置 200bps (片方向) 24Gbps (片方向) SuperTitanet ・・・ 42台 500GB 48disks 500GB 48disks 500GB 48disks ストレッジサーバA Sun Thumper (Code Name) 物理容量 1PB ストレッジサーバB NEC iStorage S1800AT 物理容量 96TB RAID6 ペタバイト級ストレッジサーバ

TSUBASA GCOE（計算世界観） Sun Blade X6250 ×90ノード以下ノードあたり
* Quad core Xeon E GHz × 2 (8コア) * メモリ DDR2 8GB (ただし，うち25ノードは16GB) * HDD 80GB SATA * InfiniBand (10GBps) * SUSE Enterprise Linux 9

ふつうにログインして使います

Rの並列化ライブラリ snow

Rとは？データ解析を主目的に開発された，オープンソースのプラットフォーム
C-likeなプログラミングのインタープリターで，いちおうオブジェクト指向 2000年ころからメジャー化したが，前身はAT&Tのベル研で1984年ころ開発されたＳ CRANに登録された「公式ライブラリ」だけで1008 個(2007/03/05)　すごい勢いで増殖！特に，バイオインフォマティクスとか機械学習などの最新手法は，Ｒで実装されることが多い．（バイオスタットの定型業務は昔からＳＡＳ）

Rにおける並列化 CRANのsnowライブラリを使うのが簡単． snowは内部でRmpiライブラリを利用します．
ＯＳでlambootをあらかじめ実行しておきます．

Using snow library: parLapply
y[[1]] <- myfunc(x[[1]]) y[[2]] <- myfunc(x[[2]]) … y[[1000]] <- myfunc(x[[1000]]) ### multiple CPUs ### ## cluster initialization library(snow) cl <- makeCluster(100) ## computation y <- parLapply(cl, x, myfunc) ### single CPU ### ## computation y <- lapply(x, myfunc) cpu cpus

Simple Example @ Shimodaira-lab

pvclust @ Shimodaira-lab

ブートストラップリサンプリング法複製データ n’=5 2 5 1 2 4 データ n=5 重複をゆるして要素を選ぶ 1 2 3 4 5
ブートストラップ　リサンプリング法複製データ n’=5 2 5 1 2 4 データ n=5 重複をゆるして要素を選ぶ 1 2 3 4 5 4 3 3 5 1 10,000回繰り返す 1 5 2 5 4 ３０年くらい前に提案され，広く利用されている．

pvclust (鈴木了太くんの修論) 並列版のparPvclust関数シングルＣＰＵ版 pvclust関数
ブートストラップ法では乱数で数値をかえて１００００回くらいの繰り返し計算を行う．そこでR標準の繰り返し関数「lapply」をsnowで実装されてる「parLapply」におきかえている

snowにおける並列化と問題点データx[1],...,x[10000]に関数fをクラスタclで計算するとき，parLapply(cl,x,f)とやる．Ｒ標準ではlapply(x,f)とやることを単純に並列化する． length(cl)=10なら，ベクトルxを１０分割してノードに割り振るだけ．そしてparLapplyは仕事をclusterApplyに投げる．粒度がそろわないときや，スレーブ能力にバラツキがあるとき，効率が悪い．計算をある程度まとまった固まりにする（粒度を調整）すると，効率がよくなる．分枝限定法のような高度な並列化はできない．デバッグも困難．snowにかわるライブラリの必要性．

snowにおけるロードバランシングの努力（あまり効果ない?）
標準のclusterApplyを改良？したのがclusterApplyLB．ためしに使ってみたら，スレーブのジョブ終了確認をポーリングでやっていて，すごく遅い．使わないほうがマシ．(ブートストラップは粒度がだいたいそろっているという事情もあります）

大規模並列計算の体験談

TSUBAME 704 cpu でも 20秒足らずＯＳレベルでジョブの投入に時間がかかります

利用例：ピクセルごとに数値計算してアルゴリズムのパフォーマンスを視覚化
263 sec * pixels / (60*60) = cpu cpus クラスタがなければ，やろうとは思わないような計算 bootstrap probability one-sided p-value two-sided p-value

CPU数を変化させて計算時間を測定マルチスケール・ブートストラップ法（スケールは13コにした） B=10,000回の反復
pvclust: 階層型クラスタリング　（マイクロアレイデータの分析につかった） scaleboot: 新たらしいマルチスケール法の実装　（系統樹推定につかった） RELL法：　対数尤度を直接リサンプリングするため，ブートストラップ法は行列計算だけ

CPU数 vs 計算速度７分＠ 704 cpus ８０時間＠１ cpu 並列化による改善

まとめ： snowによる並列計算単純な反復計算ならば，既存のコードを簡単に並列化できる．
ブートストラップ法のように相互通信のない計算ならば，ＣＰＵ数（コア数）にほぼ比例して速くなる．CPUが 200個くらいまでなら，ほとんどリニアに増える．いろいろ問題もあります．

Ｒを用いたブートストラップ法の大規模並列計算

Similar presentations

Presentation on theme: "Ｒを用いたブートストラップ法の大規模並列計算"— Presentation transcript:

Similar presentations

About project

フィードバック

ログインする

Auth with social network:

Ｒを用いたブートストラップ法の 大規模並列計算

Similar presentations

Presentation on theme: "Ｒを用いたブートストラップ法の 大規模並列計算"— Presentation transcript:

Similar presentations

About project

フィードバック

Ｒを用いたブートストラップ法の大規模並列計算

Presentation on theme: "Ｒを用いたブートストラップ法の大規模並列計算"— Presentation transcript: