分散遺伝的アルゴリズムによる各種クラスタのベンチマーク

Slides:



Advertisements
Similar presentations
多目的GAに対する パレート最適個体の分布制御 九州大学大学院工学府知能機械システム専攻徳井 宏司.
Advertisements

並列分散遺伝的アルゴリズムの有効 性 学績番号 畠中 一幸 知的システムデザイン研究室 Intelligent Systems Design Laboratory.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
三木 光範 (同志社大学工学部) 廣安 知之 (同志社大学工学部) 花田 良子 (同志社大学工学部学部 生) 水田 伯典 (同志社大学大学院) ジョブショップスケジューリング問 題への 分散遺伝的アルゴリズムの適用 Distributed Genetic Algorithm for Job-shop.
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
リフレッシュ型分散遺伝的アルゴリズムの 組み合わせ最適化問題への適用
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
第3回 並列計算機のアーキテクチャと 並列処理の実際
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
クラスタの構成技術と クラスタによる並列処理
超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.
対話型遺伝的アルゴリズムを用いた室内レイアウトシステムの開発
遺伝的アルゴリズム概説 An Outline of Parallel Distributed Genetic Algorithms
クラスタコンピューティングの 並列環境と性能
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
谷村 勇輔 (同志社大学大学院) 廣安 知之 (同志社大学) 三木 光範 (同志社大学) 青井 桂子 (同志社大学大学院)
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
同志社大学 知識工学科 知的システムデザイン研究室 廣安 知之
対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法
AllReduce アルゴリズムによる QR 分解の精度について
遺伝アルゴリズムによる NQueen解法 ~遺伝補修飾を用いた解探索の性能評価~
コンピュータの主役はCPU(Central Processing Unit)
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
PCクラスタ上での 連立一次方程式の解の精度保証
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
スパコンとJLDG HEPの計算環境 HEPnet-J
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
並列計算技術によるタンパク質の構造解析 IBM RS/6000SPを用いた研究 同志社大学大学院 小掠真貴 同志社大学工学部 廣安知之
大阪市立大学 学術情報総合センター 大西克実
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
MPIを用いた並列処理 ~GAによるTSPの解法~
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
遺伝的アルゴリズムへの 統計力学的アプローチ 大阪大学 大学院理学研究科 鈴木譲 CISJ2005 於早稲田大学理工学部
序章 第2節 教育機器とコンピュータ 1 パーソナルコンピュータ
#6 性能向上、ブレイクスルー、集中と分散 Yutaka Yasuda.
近況: Phoenixモデル上の データ並列プログラム
コンピュータの歴史 〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
遺伝的アルゴリズムを用いた 構造物の最適形状探索の プログラムの作成
通信機構合わせた最適化をおこなう並列化ンパイラ
進化的計算手法の並列計算機への実装 三木 光範
実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ
グリッド向け実行環境Jojo を用いた遺伝的アルゴリズムによる蛋白質構造決定
遺伝的交叉を用いた 並列シミュレーテッドアニーリング 同志社大学工学部/大学院 廣安知之,三木光範,○小掠真貴
スーパーコンピュータ「京」 理化学研究所 計算科学研究センター
目的:高速QR分解ルーチンのGPUクラスタ実装
同志社大学工学研究科 知的システムデザイン研究室 修士2年 中尾昌広
Virtualizing a Multiprocessor Machine on a Network of Computers
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
Data Clustering: A Review
遺伝的交叉を用いた 並列シミュレーテッドアニーリングによる タンパク質立体構造予測
ビット空間における GAの解探索モニタリングシステム
環境分散遺伝的アルゴリズムの 多目的最適化問題への適用
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
計算機アーキテクチャ1 (計算機構成論(再)) 第二回 命令の種類と形式
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
理工学部情報学科 情報論理工学研究室 延山 周平
第4回 CPUの役割と仕組み2 命令の解析と実行、クロック、レジスタ
情報工学科 05A2301 樽美 澄香 (Tarumi Sumika)
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
分散遺伝的アルゴリズムにおけるパラメータの検討
渡邉 真也, 廣安 知之, 三木 光範 同志社大学 工学部 Faculty of Engineering,Doshisha Univ
遺伝的交叉を用いた 並列シミュレーテッドアニーリングの検討 小掠 真貴 廣安 知之 三木 光範 角 美智子 岡本 祐幸 同志社大学大学院
Presentation transcript:

分散遺伝的アルゴリズムによる各種クラスタのベンチマーク 廣安 知之(同志社大学・工) 三木 光範(同志社大学・工) 谷村 勇輔(同志社大学・大学院) 吉田 純一(同志社大学・大学院) 佐野 正樹(同志社大学)

DEEP BLUE BLUE GENE (1PetaFLOPs) IBMのチャレンジ チェスの世界チャンピオン,カスパロフを破った 他の分野でもこれに比肩する偉業が達成される可能性 BLUE GENE (1PetaFLOPs) “タンパク質の構造解析”にチャレンジ!! コンピュータの設計およびアーキテクチャに対して従来とはまったく異なるタンパク質に適したアプローチをとる

ハードウエアとソフトウエアの進化 頭を使うよりも力技? 頭を使う場合も道具をよく知って... 道具を磨くと性能50%UP

システムの性能を左右する要因 CPU,メモリ ネットワークハードウエア ネットワークソフトウエア(ドライバ,NFSその他) OS コンパイラ 並列ライブラリ コンパイルオプション その他

ベンチマークの分類 ・コンピュータの性能評価の難しさ コンピュータの挙動はプログラムによってさまざま 比較の指標を一意に決めることは困難 用途に応じたさまざまなベンチマークが存在

LINPACK / ScaLAPACK 世界のスーパーコンピュータのランキング 「TOP500 SUPER COMPUTER」 で用いられる由緒あるベンチマーク LU分解を行うためのサブルーチンを ベンチマークに利用 http://www.top500.org 数値演算能力(浮動小数点演算)を測定 するのに適している

姫野ベンチマーク ポアソン方程式をヤコビの反復法 で解く場合の主要なループの処理速度 を計測 → 流体計算の性能測定に向く コードが非常に小さく,実行が容易 WindowsやMac用のバイナリもある → 手軽にベンチマークが可能 理化学研究所の 姫野龍太郎氏が開発

NAS Parallel Benchmark NASA Ames Research Center で開発 された並列計算機のためのベンチマーク 8種類の対象問題と5種類のクラスによる 多角的な性能の評価が可能 並列コンピュータの実行性能を知る上で 権威あるベンチマークの一つ

使用クラスタ Fraulein P3 500MHz ○(2Procs) 8+1 18 128MB Linux 2.2.15 gcc 2.95.2 100BASE-T +Switching Hub Jupiter P3 600MHz × 8+1 9 128MB Linux 2.2.14 gcc 2.95.2 Myrinet ruins P2 400MHz × 16 128MB Linux 2.2.12 gcc 2.95.2 100BASE-T +Switching Hub sequence P3 850MHz × 8+1 9 256MB Linux 2.2.? gcc 2.95.2 100BASE-T +Switching Hub cluso P3 700MHz ○(2Procs) 32+1 65 128MB Linux 2.2.16 gcc 2.95.2 100BASE-T +Switching Hub CPU SMP #Node #Proc Memory OS Compiler Network

姫野ベンチマークの結果 MPICH(1.2.0)

姫野ベンチマークの結果 Sequence cluster Pentium 3 850MHz + 100BASE-T (TCP/IP) Jupiter cluster Pentium 3 600MHz + Myrinet (GM) 並列計算機の性能はCPUにだけに依存しない

NPBの結果 MPICH(1.2.0)

分散GA 通常のGA 分散GA 分散GAでは母集団を複数に分割して解探索を行う 各島でそれぞれ独立に遺伝的操作を行う 選択 交叉 突然変異 評価 移住 分散GAでは母集団を複数に分割して解探索を行う 各島でそれぞれ独立に遺伝的操作を行う 一定間隔で移住を行い,個体の交換をする

GAPPAベンチマーク (分散GAのベンチマーク) 計算負荷,ネットワーク負荷(移住間隔)はパラメータによって設定 個体数 640 移住率 0.3 交叉率 0.8 ビット列の長さ 100 終了世代 2000

計算負荷とトラス構造解析との比較 1× 5× 10× 50× 10段~12段 100× 500× 20段~24段 100段~120段

GAによる最適化で早いネットワークが必要なのか? ノード数 32 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux 2.2.16 Network Fast Ethernet,TCP/IP Switching HUB 通信ライブラリ MPICH 1.2.1 Cluso コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

オプション:-O2 –funroll-loops MPICHとLAMの比較(SMP) ノード数 32 × 2 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux 2.2.16 Network Fast Ethernet,TCP/IP Switching HUB Cluso 移住間隔1 コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

オプション:-O2 –funroll-loops MPICHとLAMの比較(SMP) ノード数 32 × 2 プロセッサ PentiumⅢ 700MHz メモリ 128 Mbytes OS Linux 2.2.16 Network Fast Ethernet,TCP/IP Switching HUB Cluso 移住間隔5 コンパイラ:gcc(2.95.3), mpiCC オプション:-O2 –funroll-loops

オプション:-O2 –funroll-loops MPICHとLAMの比較 (プロセス数) ノード数 8 プロセッサ PentiumⅢ 850MHz メモリ 256 Mbytes OS Linux 2.2.17 Network Fast Ethernet,TCP/IP Switching HUB sequence 移住間隔1 コンパイラ: gcc(2.95.2), mpiCC オプション:-O2 –funroll-loops

オプション:-O2 –funroll-loops MPICHとLAMの比較 (プロセス数) ノード数 8 プロセッサ PentiumⅢ 850MHz メモリ 256 Mbytes OS Linux 2.2.17 Network Fast Ethernet,TCP/IP Switching HUB Sequence コンパイラ: gcc(2.95.2), mpiCC オプション:-O2 –funroll-loops

システムの性能を左右する要因 CPU,メモリ ネットワークハードウエア ネットワークソフトウエア(ドライバ,NFSその他) OS コンパイラ 並列ライブラリ コンパイルオプション その他