各種PC クラスタの性能評価同志社大学　工学部廣安　知之三木　光範谷村　勇輔.

Slides:

Advertisements

Similar presentations

専修大学情報科学センターのパソコンを使ったグリッドコンピューティング ― ＳＰＡＣＥ計画－森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び専修大学情報科学センター及び専修大学情報科学センター 1 専修大学法学部／自然科学研究所 1 専修大学法学部／自然科学研究所 2 専修大学.

Advertisements

1 Layout Utilities の紹介 Layout Utilities とは、お客様のプログラムに流し込み印刷を簡単に組み込めるソフトウエア開発ツールです無償流し込み印刷の例.

三木光範（同志社大学工学部）廣安知之（同志社大学工学部）花田良子（同志社大学工学部学部生）水田伯典（同志社大学大学院）ジョブショップスケジューリング問題への分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.

遺伝的アルゴリズムにおけるランドスケープによる問題のクラス分類

MPIを用いたグラフの並列計算情報論理工学研究室藤本　涼一.

インターネット構成法最終課題環境情報学部3年　平野大輔環境情報学部3年　小原知博環境情報学部3年　野崎沙織.

グローバルコンピューティング環境における遺伝的アルゴリズムの検討

第3回並列計算機のアーキテクチャと並列処理の実際

ATLAS実験データ解析に向けた、長距離広帯域ネットワークにおけるデータ転送

CPUとGPUの性能比較－行列計算およびN体問題を用いて－

計算理工学基礎「ハイパフォーマンスコンピューティングの基礎」

情報検索概説II 第8回パソコン組み立てと記憶装置 1999/11/25.

2001/10/10 PSEC-KEM NTT 小林鉄太郎 CRYPTREC 2001

２０００年３月１０日日本電信電話株式会社三菱電機株式会社

三重対角化アルゴリズムの性能評価早戸拓也・廣田悠輔.

超並列計算研究会 PCクラスタにおけるベンチマークと並列ツールの紹介廣安知之三木光範大向一輝吉田純一.

全体ミーティング (4/25) 村田雅之.

ＰＣクラスタにおける２個体分散遺伝的アルゴリズムの高速化

谷村勇輔（同志社大学大学院）廣安知之（同志社大学）三木光範（同志社大学）青井桂子（同志社大学大学院）

DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価

同志社大学知識工学科知的システムデザイン研究室廣安知之

対角マトリックスを用いた３次元剛塑性有限要素法の並列計算対角マトリックスを用いた剛塑性有限要素法

AllReduce アルゴリズムによる QR 分解の精度について

仮想マシンの並列処理性能に対するCPU割り当ての影響の評価

P,Q比が変更可能なScaLAPACKのコスト見積もり関数の開発

分散遺伝的アルゴリズムによる各種クラスタのベンチマーク

マルチパスイーサネットにおける省電力 On/Off リンクアクティベーション法

廣安知之同志社大学工学部知識工学科 PCクラスタを作ろう！！廣安　知之同志社大学　工学部　知識工学科

PCクラスタ上での連立一次方程式の解の精度保証

制約条件の確率的選択に基づく資源追加削減法の改良三木光範（同志社大工）廣安知之（同志社大工） ○小林繁（同志社大院）

ネットワーク性能に合わせた分散遺伝的アルゴリズムにおける最適な移住についての検討

スパコンとJLDG HEPの計算環境 HEPnet-J

パソコンの歴史～1970年 1970年代 1980年代 1990年～ ▲1946 ＥＮＩＡＣ（世界最初の計算機、1,900加算/秒, 18,000素子） ▲1947 ＵＮＩＶＡＣⅠ（最初の商用計算機） ▲1964 IBM System/360（5.1MHz, 1MB, 2億円） ▲1974 インテル8080（8.

CMCスーパーコンピューティング環境現状と将来

正方行列向け特異値分解の CUDAによる高速化

京都大学大学院医学研究科画像応用治療学・放射線腫瘍学石原佳知

アクセラレータを用いた大規模へテロ環境における Linpack

ギガビットネットワークに対応するネットワークべンチマークテスト機の試作とギガビットルータの性能評価

文献名 “Performance Tuning of a CFD Code on the Earth Simulator”

並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究同志社大学大学院小掠真貴同志社大学工学部廣安知之

2001/10/10 PSEC-KEM NTT 小林鉄太郎 CRYPTREC 2001

大阪市立大学学術情報総合センター大西克実

計算理工学基礎「ハイパフォーマンスコンピューティングの基礎」

応用数理工学特論　第6回計算理工学専攻　張研究室山本有作.

MPIとOpenMPを用いた Nクイーン問題の並列化

近況: Phoenixモデル上のデータ並列プログラム

コンピュータの歴史〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀

Jh NAHI 横田　理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景　H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法

Andrew Brzezinski, Gil Zussman, and Eytan Modiano

九州大学情報基盤研究開発センター長青柳睦

実行時情報に基づく OSカーネルのコンフィグ最小化

アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化

通信機構合わせた最適化をおこなう並列化ンパイラ

進化的計算手法の並列計算機への実装三木光範

実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ

J-PARC E16実験におけるDAQ-Middleware を用いたDAQソフトウェアの開発

スーパーコンピュータ「京」理化学研究所計算科学研究センター

可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化

目的：高速QR分解ルーチンのGPUクラスタ実装

同志社大学工学研究科知的システムデザイン研究室修士２年中尾昌広

レイドのドレイ安物RAIDの誘惑加速器センター木村　博美.

Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化

遺伝的交叉を用いた並列シミュレーテッドアニーリングによるタンパク質立体構造予測

環境分散遺伝的アルゴリズムの多目的最適化問題への適用

表紙分散遺伝的アルゴリズムのための新しい交叉法.

BSPモデルを用いた並列計算の有用性の検証

MPIを用いた並列処理計算情報論理工学研究室金久英之

高度プログラミング演習（11）.

東大素セ松本浩，田中純一，上田郁夫，坂本宏，真下哲郎

分散メモリ型並列計算機上での行列演算の並列化

Presentation transcript:

各種PC クラスタの性能評価同志社大学　工学部廣安　知之三木　光範谷村　勇輔

日給 \5,000だったら 1ヶ月も働くと．．． DSO/VパラダイスMagnate SDX 81,800円 Pentium 4 1.6GHz Memory 256MB HDD 40GB Pentium 4 1.7GHz 89,800円パソコン工房 AMPHIS-1700M4R TWO-TOP ViP 84N-SP1500 　 90,800円 Pentium 4 1.5GHz HDD 20GB 1ヶ月も働くと．．．

コモディティハードウエア CPU ハードウエアネットワーク性能の向上価格の急激な下落 COTS (Commodity-off-the-Shelf)-based scalable parallel systems

PCクラスタ Hardware CPU memory motherboard hard disc case network card cable hub

Super Computer TOP 500 http://www.top500.org Ranking Name # Proc 1 Rmax (Gflops) 1 ASCI White 8192 7226 2 AlphaServer SC ES45/1 GHz 3024 4059 3 Power3 375 MHz 16 way 3228 3052 4 ASCI Red 9632 2379 5 ASCI Blue-Pacific 5808 2144

Super Computer TOP 500(self made) http://www.top500.org Ranking Name # Proc Rmax (Gflops) 30 CPlant/Ross Cluster 1369 706.70 40 SCore IIIe/PIII 933 MHz 1024 618.30 86 Presto III Athlon 1.2 GHz 256 331.70 137 CLIC PIII 800 MHz 530 221.60 184 Netfinity Cluster PIII 1 GHz 320 184.40

同志社大学クラスタシステム知能情報センター Cambriaシステム Cambriaシステム複数のアプリケーションによる同志社大学　クラスタシステム知能情報センター Cambriaシステム Cambriaシステム複数のアプリケーションによる PCクラスタ特性の比較

Cambriaシステム仕様 CPU PentiumIII 800MHz 256CPU Memory 256MB（計 65.536GB） Network Fast Ethernet OS Debian/GNU Linux Compiler gcc Communication Lam-6.6b1

Gregorシステム仕様 CPU PentiumIII 1GHz 128CPU （64 Nodes dual processor） Memory 512MB（計 32.768GB） Network Myrinet2000 OS Kondara HPC（Red Hat系） Compiler gcc　， g77 Communication MPICH1.2/GM1.3 Peak性能 128GFlops

Myrinet Myricom社が開発最大転送速度が2Gbpsの高速通信 PCクラスタコンピューティングのデファクト・スタンダードとして期待ｰ Ethernetより優れた性能，　　コストパフォーマンスを発揮

Linpack Benchmark Top５００などをはじめ広く使用密行列の線形代数問題ガウスの消去法問題のサイズなどはユーザが指定密行列の線形代数問題　ガウスの消去法問題のサイズなどはユーザが指定 HPLを利用の際にはATLASを使用する高速なCPU 多ノード膨大なメモリ高速なネットワーク適切な放熱，電源処理コンパイラに依存しない並列計算機の総合的な評価に向いている

Linpack Benchmarkはネットワークに依存する Myrinet2000とEthernetの比較 Linpack Benchmarkはネットワークに依存する

78.62GFlops Linpack 結果 Cambria 67.03/204.8 Gflops (N=80000) Gregor 69.94/128.0 Gflops (N=40000) 78.62GFlops （84.58GFlops）公式記録

カットオフのある粒子シミュレーション比較的，通信量が大きくなるプログラム領域をどう分割するか？カットオフ半径内に収まる粒子との相互作用を考える

結果

最適化における並列化 GAの並列化など感度の並列化など

Distributed Genetic Algorithms (Island GAs) subpopulation migration

DGA Benchmark 乱数発生の繰り返し

DGAによる処理速度の向上

PCクラスタの性能 CPU メモリネットワーク放熱問題まとめ PCクラスタの性能 CPU メモリネットワーク放熱問題最適化問題感度の並列分散遺伝的アルゴリズム