各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔
日給 \5,000だったら 1ヶ月も働くと... DSO/VパラダイスMagnate SDX 81,800円 Pentium 4 1.6GHz Memory 256MB HDD 40GB Pentium 4 1.7GHz 89,800円 パソコン工房 AMPHIS-1700M4R TWO-TOP ViP 84N-SP1500 90,800円 Pentium 4 1.5GHz HDD 20GB 1ヶ月も働くと...
コモディティハードウエア CPU ハードウエア ネットワーク 性能の向上 価格の急激な下落 COTS (Commodity-off-the-Shelf)-based scalable parallel systems
PCクラスタ Hardware CPU memory motherboard hard disc case network card cable hub
Super Computer TOP 500 http://www.top500.org Ranking Name # Proc 1 Rmax (Gflops) 1 ASCI White 8192 7226 2 AlphaServer SC ES45/1 GHz 3024 4059 3 Power3 375 MHz 16 way 3228 3052 4 ASCI Red 9632 2379 5 ASCI Blue-Pacific 5808 2144
Super Computer TOP 500(self made) http://www.top500.org Ranking Name # Proc Rmax (Gflops) 30 CPlant/Ross Cluster 1369 706.70 40 SCore IIIe/PIII 933 MHz 1024 618.30 86 Presto III Athlon 1.2 GHz 256 331.70 137 CLIC PIII 800 MHz 530 221.60 184 Netfinity Cluster PIII 1 GHz 320 184.40
同志社大学 クラスタシステム 知能情報センター Cambriaシステム Cambriaシステム 複数のアプリケーションによる 同志社大学 クラスタシステム 知能情報センター Cambriaシステム Cambriaシステム 複数のアプリケーションによる PCクラスタ特性の比較
Cambriaシステム仕様 CPU PentiumIII 800MHz 256CPU Memory 256MB(計 65.536GB) Network Fast Ethernet OS Debian/GNU Linux Compiler gcc Communication Lam-6.6b1
Gregorシステム仕様 CPU PentiumIII 1GHz 128CPU (64 Nodes dual processor) Memory 512MB(計 32.768GB) Network Myrinet2000 OS Kondara HPC(Red Hat系) Compiler gcc , g77 Communication MPICH1.2/GM1.3 Peak性能 128GFlops
Myrinet Myricom社が開発 最大転送速度が2Gbpsの高速通信 PCクラスタコンピューティングのデファクト・スタンダードとして期待 ー Ethernetより優れた性能, コストパフォーマンスを発揮
Linpack Benchmark Top500などをはじめ広く使用 密行列の線形代数問題 ガウスの消去法 問題のサイズなどはユーザが指定 密行列の線形代数問題 ガウスの消去法 問題のサイズなどはユーザが指定 HPLを利用の際にはATLASを使用する 高速なCPU 多ノード 膨大なメモリ 高速なネットワーク 適切な放熱,電源処理 コンパイラに依存しない 並列計算機の総合的な評価に向いている
Linpack Benchmarkはネットワークに依存する Myrinet2000とEthernetの比較 Linpack Benchmarkはネットワークに依存する
78.62GFlops Linpack 結果 Cambria 67.03/204.8 Gflops (N=80000) Gregor 69.94/128.0 Gflops (N=40000) 78.62GFlops (84.58GFlops) 公式記録
カットオフのある粒子シミュレーション 比較的,通信量が 大きくなるプログラム 領域をどう分割するか? カットオフ半径内に収まる粒子との相互作用を考える
結 果
最適化における並列化 GAの並列化など 感度の並列化など
Distributed Genetic Algorithms (Island GAs) subpopulation migration
DGA Benchmark 乱数発生の繰り返し
DGAによる処理速度の向上
PCクラスタの性能 CPU メモリ ネットワーク 放熱問題 まとめ PCクラスタの性能 CPU メモリ ネットワーク 放熱問題 最適化問題 感度の並列 分散遺伝的アルゴリズム