同志社大学 知識工学科 知的システムデザイン研究室 廣安 知之

Slides:



Advertisements
Similar presentations
Windows HPC 講習会 2009/9/25 Windows HPC コンソーシアム 1 - MS-MPIプログラミング演習 - 同志社大学生命医科学部 廣安 知之 同志社大学工学研究科 中尾 昌広.
Advertisements

1 広島県立広島国泰寺高校 科学部物理班 3年 箱崎 亮太 2年 浜田 浩二 平野 敬純 岡本 潤一 KNOPPIX クラスタ 情 報交換会 事例紹介 1.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
Virtual Editionのご紹介 2012年12月12日.
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
クラスタの構成技術と クラスタによる並列処理
榮樂 英樹 LilyVM と仮想化技術 榮樂 英樹
並列処理実用? 並列処理により、 現在時間がかかって実用しづらい処理を、 早くして実用にする 1時間 =1/10⇒ 6分
ブロック線図に基づく システム制御学習環境における リアルタイム制御実験
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
Virtual Editionのご紹介 (株)ネットジャパン 法人営業部 2012年7月18日 1.
超並列計算研究会 PCクラスタにおける ベンチマークと並列ツールの紹介 廣安 知之 三木 光範 大向 一輝 吉田 純一.
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
クラスタコンピューティングの 並列環境と性能
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
DNASシステム上のアプリケーション起動シーケンスのための基盤であるdsh部分の性能評価
AllReduce アルゴリズムによる QR 分解の精度について
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
コンピュータの主役はCPU(Central Processing Unit)
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
スパコンとJLDG HEPの計算環境 HEPnet-J
パソコンの製作 ~はじめての自作パソコン~
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
Virtual Editionのご紹介 2012年7月26日.
大阪市立大学 学術情報総合センター 大西克実
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
MPIを用いた並列計算 情報論理工学研究室 清水周.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
グリッド M1 kawai.
#6 性能向上、ブレイクスルー、集中と分散 Yutaka Yasuda.
MPIとOpenMPを用いた Nクイーン問題の並列化
コンピュータの歴史 〜計算速度の進歩〜 1E15M009-3 伊藤佳樹 1E15M035-2 柴田将馬 1E15M061-1 花岡沙紀
IaaS型クラウドにおける インスタンス構成の動的最適化手法
リモートホストの異常を検知するための GPUとの直接通信機構
九州大学情報基盤研究開発センター長 青柳 睦
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
私の立場 OSカーネルを手がけるエンジニア 大阪市立大学 創造都市研究科の学生
通信機構合わせた最適化をおこなう並列化ンパイラ
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
スーパーコンピュータ「京」 理化学研究所 計算科学研究センター
Intel SGXを用いた仮想マシンの 安全な監視機構
軽量な仮想マシンを用いたIoT機器の安全な監視
複数ホストにまたがって動作する仮想マシンの障害対策
仮想ネットワークを考慮した SoftIRQ制御によるCPU割当ての手法
VMMのソフトウェア若化を考慮した クラスタ性能の比較
目的:高速QR分解ルーチンのGPUクラスタ実装
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
適応的近傍を持つ シミュレーテッドアニーリングの性能
同志社大学工学研究科 知的システムデザイン研究室 修士2年 中尾昌広
InTriggerクラスタ環境の構築 i-explosion 支援班 クラスタ環境の概要 研究に使える「共有資源」を提供
Peer-to-Peerシステムにおける動的な木構造の生成による検索の高速化
広島大学におけるHEPnet-J 利用状況
仮想マシンと物理マシンを一元管理するための仮想AMT
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
α decay of nucleus and Gamow penetration factor ~原子核のα崩壊とGamowの透過因子~
理工学部情報学科 情報論理工学研究室 延山 周平
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
知識ベースの試作計画 ●●●研究所 ●●●技術部 稲本□□ 1997年1月.
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
背景 粒子法(SPH・MPSなど)は大規模流体シミュレーションなどで幅広く利用.一方で,手法の数学的正当化(数値解析)が不十分
ベイジアンネットワークと クラスタリング手法を用いたWeb障害検知システムの開発
Presentation transcript:

同志社大学 知識工学科 知的システムデザイン研究室 廣安 知之 PCクラスタの概要 同志社大学 知識工学科 知的システムデザイン研究室 廣安 知之

PCクラスタ誕生の背景 コモディティハードウエアの性能向上 飛躍的な性能向上 各種パーツの低価格化 高速ネットワークの開発と普及 これらのPCをネットワークケーブルで結合して 使用すれば高性能な計算機になるのでは?

PCクラスタとは何か? ぶどうなどの房、同種類のものの群れ ネットワーク結合されたPC群 並行・並列・分散処理

PCクラスタ PCクラスタとは 最低限構築に必要な部品 スイッチングハブ ネットワークケーブル OS(Linuxがよく用いられる) ソフトウェア(MPI,GNUコンパイラ等)

Beowulf クラスタ NASAのプロジェクト名 1998年末でほぼ終了 単一ホストからログインするクラスタ コモディティハードウエア CPU Intel AMD ネットワーク Fast Ethernet Myrinet スイッチングハブ オープンソースソフトウエア Linux MPI コストの削減が可能(?)

Avalonクラスタ Los Alamos National Laboratory アルファ(140)+Myrinet 最初のTop 500 ランキング(2000年 364位) Beowulf

RWCPクラスタ 経済産業省リアルワールドコンピューティングプロジェクトを推進した技術研究組合 新情報処理開発機構 日本のクラスタのさきがけ Score, Open MP Myrinet PCクラスタコンソーシアム(PC Cluster Consortium)

計算機の利用方法 1 気象予測、地球環境予測、地質探査 天体力学、素粒子、原子核物理 物質シミュレーション 構造解析、流体解析 計算機の利用方法 1 気象予測、地球環境予測、地質探査 大気モデルと経験パラメータによる現象予測、地質調査による石油埋蔵予測 天体力学、素粒子、原子核物理 銀河形成シミュレーション、素粒子・原子核物理論のシミュレーション 物質シミュレーション 原子100個レベルの第一原理シミュレーションにより、物質の構造や特性を解析 構造解析、流体解析 自動車衝突の仮想実験。自動車、航空機の空気抵抗の解析など産業応用が盛ん。

計算機の利用方法 2 バイオインフォマティックス データマイニング 経済予測・金融工学 核融合シミュレーション 計算機の利用方法 2 バイオインフォマティックス 遺伝子解析、たんぱく質構造解析 データマイニング Web検索、顧客情報・売れ筋商品分析 経済予測・金融工学 マクロ経済予測、株価予測 核融合シミュレーション 実験による知見と理論モデルに基づき核融合プラズマをシミュレーション

計算機の能力評価方法 ベンチマークプログラム コンピュータの演算性能 計算機の処理速度を計測するソフトウェア 客観的な数値としてハードウェア性能の指標になる コンピュータの演算性能 FLOPS(フロップス)という単位で表される 一秒間に何回浮動小数点演算が行えるかの値 世界で一番高速な計算機は 約70TFlops(テラフロップス) Tは1兆という単位なので, 一秒間に70兆回計算できる

Top500 SuperComputer Site 世界のコンピュータのランキング http://www.top500.org/ 順位 コンピュータ名 CPU数 性能 1 Blue Gene/L 32768 70.72 TFlops 2 Columbia 10160 51.87 TFlops 3 地球シミュレータ 5120 35.86 TFlops 4 MareNostrum 3564 20.53 TFlops 5 Thunder 4096 19.94 TFlops 6 ASCI Q 8192 13.88 TFlops 7 System X 2200 12.25 TFlops 8 BlueGene/L 11.68 TFlops 9 eServer pSeries 655 2944 10.31 TFlops 10 Tungsten 2500 9.819 TFlops

Top500 SuperComputer Site 世界のコンピュータのランキング http://www.top500.org/ 順位 コンピュータ名 CPU数 性能 1 Blue Gene/L 32768 70.72 TFlops 2 Columbia 10160 51.87 TFlops 3 地球シミュレータ 5120 35.86 TFlops 4 MareNostrum 3564 20.53 TFlops 5 Thunder 4096 19.94 TFlops 6 ASCI Q 8192 13.88 TFlops 7 System X 2200 12.25 TFlops 8 BlueGene/L 11.68 TFlops 9 eServer pSeries 655 2944 10.31 TFlops 10 Tungsten 2500 9.819 TFlops

米バージニア州立工科大学 - System X - 世界のPCクラスタ 米バージニア州立工科大学 - System X - System Apple XServe G5 2.3 GHz Processors 2,200 Network InfiniBand + Gigabitether Performance 12,25TFlops(7位) Apple Computerの1UサーバXserve G5 をクラスタ化したもの 導入コストは地球シミュレータが 2億5千万ドルに対し, 初期System Xはわずか520万ドル

日本のPCクラスタ RIKEN Super Combined Cluster(理化学研究所) System Intel Xeon 3.06GHz Processors 2,048 Network InfiniBand + Myrinet Performance 8,029TFlops(14位) AIST Super Cluster P-32(産業技術総合研究所) System AMD Opteron 2.0 GHz Processors 2,200 Network Myrinet Performance 6,115TFlops(28位)

同志社大学のPCクラスタ(1/2) Supernova Cluster 1.169 TFlops 達成 世界:93位,国内:6位 System AMD Opteron 1.8 GHz Processors 512 Memory PC2700 Registered ECC 2GB OS Turbolinux 8 for AMD64 Network Gigabit Ethernet 1.169 TFlops 達成 世界:93位,国内:6位 PCクラスタ:1位(2003/11 時点)

同志社大学のPCクラスタ(2/2) Core Cluster 1.009 TFlops 達成 IBM PowerPC 970 1.6 GHz System IBM PowerPC 970 1.6 GHz Processors 252 Memory ECC DDR SDRAM 2.5 GB OS SuSE Linux Enterprise Server Network Myrinet 1.009 TFlops 達成 (2004年11月) 世界392位,日本22位 PCクラスタ7位

大規模PCクラスタの構成図 PCクラスタを構成するノード ユーザー・ノード 管理ノード 計算ノード(最も数が多い) リポジトリノード 小規模な場合は1台のノードが, 複数のサービスを提供し, 構成を簡略化する場合がある

共有メモリ型と分散メモリ型

メッセージパッシング

メッセージ通信ライブラリ 並列アプリケーションで通信を行うソフトウェア かつては各社が独自に提供 可搬性のあるプログラムを書きたい ネットワークに依存しない通信がしたい いちいちソケットを使って書くのは大変 ネットワークプロトコルがTCP/IPとは限らない かつては各社が独自に提供 IBM: MPL 可搬性のあるプログラムを書きたい 標準規格が欲しい MPI Forum: MPI

MPI Message Passing Interface 1992年 MPI Forum 仕様のみ策定。実装は各ベンダーに任せる 並列計算機ベンダーと学術組織 仕様のみ策定。実装は各ベンダーに任せる ベンダーがそれぞれの計算機固有の方式を用いて実装 MPICH, LAM 1997年 MPI-2 動的プロセス生成、並列I/Oなどの仕様を追加

MPIの実装 MPICH LAM CHIMP アルゴンヌ国立研究所・ミシシッピ州立大 現在の主流 オハイオ スーパーコンピューティングセンター CHIMP エジンバラ並列計算センター

MPIプログラミング SPMD (Single Program Multiple Data)モデル 基本的には6つの関数で書ける MPI_Init() MPI_Comm_size() MPI_Comm_rank() MPI_Send() MPI_Recv() MPI_Finalize()

サンプルMPIプログラム #include <mpi.h> int main(int argc, char *argv[]) { int rank; MPI_Status status; char buf[256]; char data[] = "Hello"; MPI_Init(&argc, &argv); MPI_Comm_rank(MPI_COMM_WORLD, &rank); if (rank == 0) { MPI_Send(data, 5, MPI_CHAR, 1, 0, MPI_COMM_WORLD); } else if (rank == 1) { MPI_Recv(buf, 5, MPI_CHAR, 0, 0, MPI_COMM_WORLD, &status); printf("%s\n", buf); } MPI_Finalize();

大規模PCクラスタの構成図 PCクラスタを構成するノード ユーザー・ノード 管理ノード 計算ノード(最も数が多い) リポジトリノード 小規模な場合は1台のノードが, 複数のサービスを提供し, 構成を簡略化する場合がある

PCクラスタを設置するときの問題点 電源の確保 空調の整備 PCクラスタの維持費 ノード数に比例した構築,管理コストが発生 1ノード当たり500Wとすると1000ノードで5000A必要 導入前に電源の工事が必要 空調の整備 適切に熱処理を行わないと,故障の原因になる PCクラスタの維持費 電気代,故障ハードウェアの取替,メンテナンス費 予算に組み込めない? ノード数に比例した構築,管理コストが発生 すべてのマシンにOSとソフトウェアの設定を行う

無料でPCクラスタを作る 100ノードのPCクラスタを作る場合 大学のPCを利用する 1ノード20万円とすると2000万円かかる・・ 無料で手に入らないか? 大学のPCを利用する 昼は学生が使用しているから,夜のみ研究に利用 広島大学が遊休PCを利用したキャンパスグリッド を構築(2004年11月) 医療画像の利用に向けた大量の計算処理 地域の製造業に対するCAEの計算資源として提供

KNOPPIXクラスタ(1/2) KNOPPIX CDのみでブート可能な Linuxディストリビューション ドイツのKnopper氏によって開発 Debian GNU/Linuxがベース カスタマイズが容易であるため,様々な構成の KNOPPIXが存在する 日本語版は産業技術総合研究所が開発 須崎 有康(産業技術総合研究所 情報技術研究部門)

KNOPPIXクラスタ(2/2) KNOPPIXクラスタ KNOPPIXを用いてハードディスクにOSやソフトウェアを インストールすることなくPCクラスタが構築する 【事例紹介】 広島国泰寺高校科学部物理班 柴田 良一(岐阜工業高等専門学校 建築学科) 小西 史一(理化学研究所 ゲノム科学総合研究センター) PCクラスタをハードディスクにインストールして構築したい けど,マスタノードやソフトウェアのインストールが面倒 中尾 昌広(同志社大学工学部知識工学科 修士2年)