超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

並列分散遺伝的アルゴリズムの有効 性 学績番号 畠中 一幸 知的システムデザイン研究室 Intelligent Systems Design Laboratory.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
世帯マイクロデータの適合度評価における 重みの決定手法
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
キャッシュヒント自動付加を用いたソフトウェア高速化
クラスタの構成技術と クラスタによる並列処理
遺伝的アルゴリズム  新川 大貴.
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
AllReduce アルゴリズムによる QR 分解の精度について
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
PCクラスタ上での 連立一次方程式の解の精度保証
分散確率モデル遺伝的アルゴリズムにおける解探索メカニズムの検討
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
ギガビットネットワークに対応する ネットワークべンチマークテスト機の試作と ギガビットルータの性能評価
並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究 同志社大学大学院 小掠真貴 同志社大学工学部 廣安知之
大阪市立大学 学術情報総合センター 大西克実
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
RT-Linuxを用いた 多入力パルス波高分析システムの開発
MPIを用いた並列処理 ~GAによるTSPの解法~
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
蛋白質立体構造の進化的解析のための Ninf版並列MGGとその性能評価
MPIとOpenMPを用いた Nクイーン問題の並列化
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ
導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化
グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
目的:高速QR分解ルーチンのGPUクラスタ実装
Genetic Algorithm-based Partial Least Squares GAPLS Genetic Algorithm-based Support Vector Regression GASVR 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
適応的近傍を持つ シミュレーテッドアニーリングの性能
同志社大学工学研究科 知的システムデザイン研究室 修士2年 中尾昌広
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
Introduction to Soft Computing
Data Clustering: A Review
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
遺伝アルゴリズムによる NQueen解法 ~問題特性に着目した突然変異方法の改善~
遺伝的アルゴリズム (GA) を活用した スペクトルの波長選択および時系列 データにおけるプロセス変数かつその時間 遅れ (ダイナミクス) の選択 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
ビット空間における GAの解探索モニタリングシステム
「マイグレーションを支援する分散集合オブジェクト」
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
理工学部情報学科 情報論理工学研究室 延山 周平
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
分散遺伝的アルゴリズムにおけるパラメータの検討
渡邉 真也, 廣安 知之, 三木 光範 同志社大学 工学部 Faculty of Engineering,Doshisha Univ
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
分散メモリ型並列計算機上での行列演算の並列化
遺伝的交叉を用いた 並列シミュレーテッドアニーリングの検討 小掠 真貴 廣安 知之 三木 光範 角 美智子 岡本 祐幸 同志社大学大学院
Presentation transcript:

超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一

発表の概要 ベンチマークの必要性 PCクラスタのためのベンチマーク 他の並列計算機との比較 並列ツール

Benchmark 背景 「安価で高速」とされているPCクラスタ CPU性能・メモリ容量の向上 価格の低下 実際の性能は?   価格の低下 実際の性能は?   汎用並列計算機との比較   コストパフォーマンス PCクラスタの性能を正確に知るためのベンチマーク

ScaLAPACK, 姫野ベンチ, NASPara... Benchmark さまざまなベンチマーク CPUベンチマーク I/Oベンチマーク グラフィックスベンチマーク アプリケーションベンチマーク ・・・ PCクラスタに要求される性能 並列計算ベンチマーク ScaLAPACK, 姫野ベンチ, NASPara... 並列計算性能 ネットワーク性能 ネットワークベンチマーク Netperf

CPU Pentium III 500MHz *2 (Dual) Mikilab Linux Cluster Mikilab Linux Cluster 2台故障中... マスター*1  スレーブ*8 CPU Pentium III 500MHz *2 (Dual) Memory 128MB OS    Debian / Gnu Linux 2.2.12 並列ライブラリ     MPICH / PVM3

ScaLAPACK http://www.top500.org/ 世界のスーパーコンピュータ ランキング 「TOP500 SUPERCOMPUTER」 で用いられるベンチマーク 「LINPACK」の並列版 http://www.top500.org/

ScaLAPACK 1 2 3 4 N N N * N行列に対してLU分解を行う 行列を複数に分割し,それぞれを 1つのプロセスが担当する プロセス間通信には並列ライブラリ MPI / PVMを用いる process 1 process 2 MPI / PVM process 3 process 4

NAS Parallel Benchmark(1) 特徴 NASA Ames Research Centerで開発された 並列コンピュータのためのベンチマーク 8種類の対象問題と5種類のクラスによる 多角的な性能測定が可能 並列コンピュータの実効性能を知る上で、 権威あるベンチマークの1つ

NAS Parallel Benchmark(2) 対象問題 Kernel EP 乗算合同法による一様乱数、正規乱数の生成 MG 簡略化されたマルチグリッド法のカーネル CG 正値対称な大規模疎行列の最小固有値を求めるための共役勾配法 FT FFTを用いた3次元偏微分方程式の解法 IS 大規模整数ソート Simulated CFD Application Benchmarks LU Synmetric SOR iterationによるCFDアプリケーション SP Scalar ADI iterationによるCFDアプリケーション BT 5x5 block size ADI iterationによるCFDアプリケーション サイズ 問題のサイズの異なる5つのクラス:S(ample), W(orkstation), A, B, C

HIMENO BENCHMARK 姫野ベンチマーク 特徴 ポアッソン方程式解法を ヤコビの反復法で解く場合の, 主要なループの処理速度を計測 流体計算結果に比較的近い値が出る コードが非常に短く,即座に 実測速度が求められる 並列計算機のサポート (MPI)

HIMENO BENCHMARK - result Mikilab Linux Clusterでの実行結果

HIMENO BENCHMARK - result 他の並列計算機との比較

HIMENO BENCHMARK - result コストパフォーマンス  Fujitsu VPP5000 4137.30 MFLOPS ¥ 4,400,000 (月額レンタル料)  Mikilab Linux Cluster 400 MFLOPS(8node) ¥ 1,000,000 ~ ¥ 1,600,000 ベンチマークによって,コストパフォーマンスがわかる VPP5000を4ヶ月借りる金額で,同等の性能のLinux Clusterが 手に入る(?)

Genetic Algorithms Benchmark 遺伝的アルゴリズム(GA) 生物の適応進化を工学的に模倣した 確率的最適化アルゴリズム 評価 選択 環境に適応できた個体(良い解)は生き残りやすく,適応できない個体(悪い解)は生き残りにくい 評価 このように進化を繰り返し,最適解にたどりつく 複数の個体=解候補による多点探索 選択 個体はそれぞれ染色体を持ち,交叉や突然変異に よって染色体を変化させていく 交叉 突然変異 交叉 突然変異 終了判定

Genetic Algorithms Benchmark 分散遺伝的アルゴリズム(DGA)と並列化 母集団を複数のサブ母集団に分割,独立にGAを実行 定期的に個体を交換する=移住 特徴: より早くより高品質な解を求めることが可能 並列実装しやすいモデル 各ノードがそれぞれサブ母集団を担当

Genetic Algorithms Benchmark GAベンチマーク 同志社大学工学部知的システムデザイン研究室 で開発中のPDC汎用GAコード(GAPPA)を応用 したベンチマーク 対象問題   : 10次元Rastrigin関数の最小化 並列ライブラリ:  MPI 世代数とサブ母集団数を指定して分散GAを実行 実行時間で計算機の性能を測定 Rastrigin関数(2変数)

Network Performance Benchmark ネットワークベンチマークの目的 実ネットワークの性能評価 ネットワーク・スタックの性能評価 ネットワークの性能の決定要因 スプールネット : 単位時間における処理量を示す指標 遅延       : レイテンシ(待ち時間)とRTT(往復時間) PCクラスタのパフォーマンスに 大きな影響を与える

Netperf Benchmark ネットワークに接続された2ノード間におけるTCPおよびUDPを 利用した通信のスプールネットおよび,ネットワーク遅延を計測 TCP STREAM TEST to localhost Recv Send Send Socket Socket Message Elapsed Size Size Size Time Throughput bytes bytes bytes secs. 10^6bits/sec 65535 65535 65535 10.00 530.89

並列ツール PCクラスタを利用する上での要望 ・多数のノードの状態を把握するのは困難 全ノードの状態が一覧表示できるツールがあると便利 ・並列プログラムはどのように実行されているかが分かりにくい 実行の様子を視覚的に表示してくれるツールがあると便利 PCクラスタのをもっと有効に使うための 便利なフリーウェアが開発されている

Beowulf Watch bWatch クラスタの各ノードのメモリやプロセスを一覧表示 Tcl/tk を利用した簡単なプログラム インストールや設定が簡単 全ユーザーが利用可能

XPVM XPVM PVMのためのグラフィカルなコンソールとモニタ PVMのプログラムの実行状況を簡単に確認 PVMの操作をGUIで行える 並列プログラムのデバッグなどをサポート

デモンストレーション ・姫野ベンチマーク ・NAS Parallel Benchmark ・GA Benchmark デモをご覧ください(予定) ・姫野ベンチマーク ・NAS Parallel Benchmark ・GA Benchmark ・Beowulf Watch

おわりに http://is.doshisha.ac.jp/SMPP/ 補足資料 本日紹介したベンチマークやツールの ・入手先 ・インストール方法 ・利用方法 などは・・・ 超並列計算研究会ホームページ http://is.doshisha.ac.jp/SMPP/