Presentation is loading. Please wait.

Presentation is loading. Please wait.

分散遺伝的アルゴリズムによる各種クラスタのベンチマーク

Similar presentations


Presentation on theme: "分散遺伝的アルゴリズムによる各種クラスタのベンチマーク"— Presentation transcript:

1 分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
廣安 知之(同志社大学・工) 三木 光範(同志社大学・工) 谷村 勇輔(同志社大学・大学院) 吉田 純一(同志社大学・大学院) 佐野 正樹(同志社大学)

2 DEEP BLUE BLUE GENE (1PetaFLOPs) IBMのチャレンジ チェスの世界チャンピオン,カスパロフを破った
他の分野でもこれに比肩する偉業が達成される可能性 BLUE GENE (1PetaFLOPs) “タンパク質の構造解析”にチャレンジ!! コンピュータの設計およびアーキテクチャに対して従来とはまったく異なるタンパク質に適したアプローチをとる

3 ハードウエアとソフトウエアの進化 頭を使うよりも力技? 頭を使う場合も道具をよく知って... 道具を磨くと性能50%UP

4 システムの性能を左右する要因 CPU,メモリ ネットワークハードウエア ネットワークソフトウエア(ドライバ,NFSその他) OS コンパイラ
並列ライブラリ コンパイルオプション その他

5 ベンチマークの分類 ・コンピュータの性能評価の難しさ コンピュータの挙動はプログラムによってさまざま 比較の指標を一意に決めることは困難
用途に応じたさまざまなベンチマークが存在

6 LINPACK / ScaLAPACK 世界のスーパーコンピュータのランキング 「TOP500 SUPER COMPUTER」
で用いられる由緒あるベンチマーク LU分解を行うためのサブルーチンを ベンチマークに利用 数値演算能力(浮動小数点演算)を測定 するのに適している

7 姫野ベンチマーク ポアソン方程式をヤコビの反復法 で解く場合の主要なループの処理速度 を計測 → 流体計算の性能測定に向く
コードが非常に小さく,実行が容易 WindowsやMac用のバイナリもある → 手軽にベンチマークが可能 理化学研究所の 姫野龍太郎氏が開発

8 NAS Parallel Benchmark
NASA Ames Research Center で開発 された並列計算機のためのベンチマーク 8種類の対象問題と5種類のクラスによる 多角的な性能の評価が可能 並列コンピュータの実行性能を知る上で 権威あるベンチマークの一つ

9 使用クラスタ Fraulein P3 500MHz ○(2Procs) 8+1 18 128MB Linux 2.2.15
gcc 100BASE-T +Switching Hub Jupiter P3 600MHz × 8+1 9 128MB Linux gcc Myrinet ruins P2 400MHz × 16 128MB Linux gcc 100BASE-T +Switching Hub sequence P3 850MHz × 8+1 9 256MB Linux 2.2.? gcc 100BASE-T +Switching Hub cluso P3 700MHz ○(2Procs) 32+1 65 128MB Linux gcc 100BASE-T +Switching Hub CPU SMP #Node #Proc Memory OS Compiler Network

10 姫野ベンチマークの結果 MPICH(1.2.0)

11 姫野ベンチマークの結果 Sequence cluster Pentium 3 850MHz + 100BASE-T (TCP/IP)
Jupiter cluster Pentium 3 600MHz + Myrinet (GM) 並列計算機の性能はCPUにだけに依存しない

12 NPBの結果 MPICH(1.2.0)

13 分散GA 通常のGA 分散GA 分散GAでは母集団を複数に分割して解探索を行う 各島でそれぞれ独立に遺伝的操作を行う
選択 交叉 突然変異 評価 移住 分散GAでは母集団を複数に分割して解探索を行う 各島でそれぞれ独立に遺伝的操作を行う 一定間隔で移住を行い,個体の交換をする

14 GAPPAベンチマーク (分散GAのベンチマーク)
計算負荷,ネットワーク負荷(移住間隔)はパラメータによって設定 個体数 640 移住率 0.3 交叉率 0.8 ビット列の長さ 100 終了世代 2000

15 計算負荷とトラス構造解析との比較 1× 5× 10× 50× 10段~12段 100× 500× 20段~24段 100段~120段

16 GAによる最適化で早いネットワークが必要なのか?
ノード数 32 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux Network Fast Ethernet,TCP/IP Switching HUB 通信ライブラリ MPICH 1.2.1 Cluso コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

17 オプション:-O2 –funroll-loops
MPICHとLAMの比較(SMP) ノード数 32 × 2 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux Network Fast Ethernet,TCP/IP Switching HUB Cluso 移住間隔1 コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

18 オプション:-O2 –funroll-loops
MPICHとLAMの比較(SMP) ノード数 32 × 2 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux Network Fast Ethernet,TCP/IP Switching HUB Cluso 移住間隔5 コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

19 オプション:-O2 –funroll-loops
MPICHとLAMの比較 (プロセス数) ノード数 8 プロセッサ PentiumⅢ 850MHz メモリ 256 Mbytes OS Linux Network Fast Ethernet,TCP/IP Switching HUB sequence 移住間隔1 コンパイラ: gcc(2.95.2), mpiCC オプション:-O2 –funroll-loops

20 オプション:-O2 –funroll-loops
MPICHとLAMの比較 (プロセス数) ノード数 8 プロセッサ PentiumⅢ 850MHz メモリ 256 Mbytes OS Linux Network Fast Ethernet,TCP/IP Switching HUB Sequence コンパイラ: gcc(2.95.2), mpiCC オプション:-O2 –funroll-loops

21 システムの性能を左右する要因 CPU,メモリ ネットワークハードウエア ネットワークソフトウエア(ドライバ,NFSその他) OS コンパイラ
並列ライブラリ コンパイルオプション その他


Download ppt "分散遺伝的アルゴリズムによる各種クラスタのベンチマーク"

Similar presentations


Ads by Google