各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.

Slides:



Advertisements
Similar presentations
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
Advertisements

1 Layout Utilities の紹介 Layout Utilities とは、お客様のプログラムに 流し込み印刷を簡単に組み込めるソフトウエア開発ツールです 無償 流し込み印刷の例.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
インターネット構成法 最終課題 環境情報学部3年 平野大輔 環境情報学部3年 小原知博 環境情報学部3年 野崎沙織.
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
第3回 並列計算機のアーキテクチャと 並列処理の実際
ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
情報検索概説II 第8回 パソコン組み立てと記憶装置 1999/11/25.
2001/10/10 PSEC-KEM NTT 小林 鉄太郎 CRYPTREC 2001
2000年 3月 10日 日本電信電話株式会社 三菱電機株式会社
三重対角化アルゴリズムの性能評価 早戸拓也・廣田悠輔.
超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.
全体ミーティング (4/25) 村田雅之.
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
同志社大学 知識工学科 知的システムデザイン研究室 廣安 知之
対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法
AllReduce アルゴリズムによる QR 分解の精度について
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
マルチパスイーサネットにおける省電力 On/Off リンクアクティベーション法
廣安 知之 同志社大学 工学部 知識工学科 PCクラスタを作ろう!! 廣安 知之 同志社大学 工学部 知識工学科
PCクラスタ上での 連立一次方程式の解の精度保証
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
スパコンとJLDG HEPの計算環境 HEPnet-J
パソコンの歴史 ~1970年 1970年代 1980年代 1990年~ ▲1946 ENIAC(世界最初の計算機、1,900加算/秒, 18,000素子) ▲1947 UNIVACⅠ(最初の商用計算機) ▲1964 IBM System/360(5.1MHz, 1MB, 2億円) ▲1974 インテル8080(8.
CMCスーパーコンピューティング環境 現状と将来
正方行列向け特異値分解の CUDAによる高速化
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
アクセラレータを用いた 大規模へテロ環境における Linpack
ギガビットネットワークに対応する ネットワークべンチマークテスト機の試作と ギガビットルータの性能評価
文献名 “Performance Tuning of a CFD Code on the Earth Simulator”
並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究 同志社大学大学院 小掠真貴 同志社大学工学部 廣安知之
2001/10/10 PSEC-KEM NTT 小林 鉄太郎 CRYPTREC 2001
大阪市立大学 学術情報総合センター 大西克実
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
MPIとOpenMPを用いた Nクイーン問題の並列化
近況: Phoenixモデル上の データ並列プログラム
コンピュータの歴史 〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
Andrew Brzezinski, Gil Zussman, and Eytan Modiano
九州大学情報基盤研究開発センター長 青柳 睦
実行時情報に基づく OSカーネルのコンフィグ最小化
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ
J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発
スーパーコンピュータ「京」 理化学研究所 計算科学研究センター
可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化
目的:高速QR分解ルーチンのGPUクラスタ実装
同志社大学工学研究科 知的システムデザイン研究室 修士2年 中尾昌広
レイドのドレイ 安物RAIDの誘惑 加速器センター 木村 博美.
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
BSPモデルを用いた 並列計算の有用性の検証
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
高度プログラミング演習 (11).
東大素セ 松本浩,田中純一, 上田郁夫,坂本宏,真下哲郎
分散メモリ型並列計算機上での行列演算の並列化
Presentation transcript:

各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔

日給 \5,000だったら 1ヶ月も働くと... DSO/VパラダイスMagnate SDX 81,800円 Pentium 4 1.6GHz Memory 256MB HDD 40GB Pentium 4 1.7GHz 89,800円 パソコン工房 AMPHIS-1700M4R TWO-TOP ViP 84N-SP1500   90,800円 Pentium 4 1.5GHz HDD 20GB 1ヶ月も働くと...

コモディティハードウエア CPU ハードウエア ネットワーク 性能の向上 価格の急激な下落 COTS (Commodity-off-the-Shelf)-based scalable parallel systems

PCクラスタ Hardware CPU memory motherboard hard disc case network card cable hub

Super Computer TOP 500 http://www.top500.org Ranking Name # Proc 1 Rmax (Gflops) 1 ASCI White 8192 7226 2 AlphaServer SC ES45/1 GHz 3024 4059 3 Power3 375 MHz 16 way 3228 3052 4 ASCI Red 9632 2379 5 ASCI Blue-Pacific 5808 2144

Super Computer TOP 500(self made) http://www.top500.org Ranking Name # Proc Rmax (Gflops) 30 CPlant/Ross Cluster 1369 706.70 40 SCore IIIe/PIII 933 MHz 1024 618.30 86 Presto III Athlon 1.2 GHz 256 331.70 137 CLIC PIII 800 MHz 530 221.60 184 Netfinity Cluster PIII 1 GHz 320 184.40

同志社大学 クラスタシステム 知能情報センター Cambriaシステム Cambriaシステム 複数のアプリケーションによる 同志社大学 クラスタシステム 知能情報センター Cambriaシステム Cambriaシステム 複数のアプリケーションによる PCクラスタ特性の比較

Cambriaシステム仕様 CPU PentiumIII 800MHz 256CPU Memory 256MB(計 65.536GB) Network Fast Ethernet OS Debian/GNU Linux Compiler gcc Communication Lam-6.6b1

Gregorシステム仕様 CPU PentiumIII 1GHz 128CPU (64 Nodes dual processor) Memory 512MB(計 32.768GB) Network Myrinet2000 OS Kondara HPC(Red Hat系) Compiler gcc , g77 Communication MPICH1.2/GM1.3 Peak性能 128GFlops

Myrinet Myricom社が開発 最大転送速度が2Gbpsの高速通信 PCクラスタコンピューティングのデファクト・スタンダードとして期待 ー Ethernetより優れた性能,    コストパフォーマンスを発揮

Linpack Benchmark Top500などをはじめ広く使用 密行列の線形代数問題 ガウスの消去法 問題のサイズなどはユーザが指定 密行列の線形代数問題 ガウスの消去法 問題のサイズなどはユーザが指定 HPLを利用の際にはATLASを使用する 高速なCPU 多ノード 膨大なメモリ 高速なネットワーク 適切な放熱,電源処理 コンパイラに依存しない 並列計算機の総合的な評価に向いている

Linpack Benchmarkはネットワークに依存する Myrinet2000とEthernetの比較 Linpack Benchmarkはネットワークに依存する

78.62GFlops Linpack 結果 Cambria 67.03/204.8 Gflops (N=80000) Gregor 69.94/128.0 Gflops (N=40000) 78.62GFlops (84.58GFlops) 公式記録

カットオフのある粒子シミュレーション 比較的,通信量が 大きくなるプログラム 領域をどう分割するか? カットオフ半径内に収まる粒子との相互作用を考える

結 果

最適化における並列化 GAの並列化など 感度の並列化など

Distributed Genetic Algorithms (Island GAs) subpopulation migration

DGA Benchmark 乱数発生の繰り返し

DGAによる処理速度の向上

PCクラスタの性能 CPU メモリ ネットワーク 放熱問題 まとめ PCクラスタの性能 CPU メモリ ネットワーク 放熱問題 最適化問題 感度の並列 分散遺伝的アルゴリズム