MPIを用いた最適な分散処理 情報論理工学研究室 05-1-037-0136 角 仁志 05-1-037-0136 角 仁志 MPIを用いた最適な分散処理について発表さしていただきます。(5秒)
目次 並列処理 仮想並列計算機 目的 MPI (Message Passing Interface) 並列JPEGエンコーダ 検証方法 結果・考察 結論・今後の課題 この順番で説明さしていただきます。(5秒)10秒
並列処理 処理速度の向上 データの分割 機能の分割 信頼性の向上 耐故障性 機能の分割 信頼性の向上 耐故障性 まず、本研究を説明するにあたり、並列処理について説明さしていただきます。(10秒)20秒 並列処理とは単一の処理を、複数のプロセッサで解決するという考え方です。(10秒)30秒 その目的は次の二つです。(5秒)35秒 処理速度の向上。その方法としてはデータを分けて計算を行うことで、処理速度を向上させることができます。(10秒)45秒 また処理の内容により、使われる計算機を変えることで処理速度を向上させることができます。(10秒)55秒 信頼性の向上とは複数の計算機で同じプログラムを実行させているので、 1台が止まってしまっても他の計算機が負担し、システム全体の停止を引き起こさない(20秒)1分15秒
仮想並列計算機 えっ、まだなの! 仕方が無いから待つよ 処理が完了したよ 手伝います ただ、並列計算機は非常に高価なものであり、並列計算機を持っているのは一部の大学、研究機関、企業ぐらいでしかなく、一般に普及しているとは言えません。そこで本研究では、並列計算機の代用として、仮想並列計算機を使用しています。では、次に仮想並列計算機について説明をさせていただきます。 (20秒)1分35秒 先ほども行ったとおり並列計算機は非常に高価なものです。 そして、近年計算機の性能の向上著しく、少し古いものなら安価で手に入れることができます。(15)1分50 仮想並列計算機とは、無料のソフトウェアを使用し、複数の計算機をネットワークで接続することで仮想的に一台の並列計算機を構成する考え方です。 (15)2分5 すいません まだ処理の途中です
目的 仮想並列計算機を用いて処理を行なう時、各計算機へのデータ割り当ての配分を性能により変動させることで、処理速度の向上をさせる。 先ほどのデメリットを踏まえて、本研究の目的を説明させていただきます。(15秒)3分15
MPI(Message Passing Interface) 世界標準を目的に作成されたAPIの規格 プログラムの移植性が高い 異機種間の通信が考慮されていない (20)3分35
並列JPEGエンコーダ 次に使用した並列JPEGエンコーダについて説明させていただきます。(20)4分5秒
検証方法 BMP画像を50枚 24bit・14MB 計算機は4台 OSはWindowsXPで統一 全て違う性能 分割する割合 均等・CPUのクロック数・メインメモリのバイト数・バイト数×クロック数、計四種類 では、検証方法について説明さしていただきます。 画像は50枚、24bit・約14MBのBMP画像を使用します。 計算機は4台、MPIを使用するためWindowsXPで統一しています。 そして、目的のため性能は全て違うものを用意しました。 分割する割合は計算機の性能から割り出すためわかりやすくしました。(30)4分35秒
仮想並列計算機の構成図
使用した各計算機の性能 OS CPU メインメモリ 計算機 F8 Windows XP 1.5GHz 504MB 計算機 FM 3.2GHz これが使用した計算機の性能表です。(5)4分40
各計算機の性能比較 こちらがバイト数×クロック数の比です
実際の割り当て画像比 10/64 8/64 4/64 23/64 31/64 38/64 17/64 15/64 14/64 7/64 1 CPU比 MM比 MM×CPU比 F8 10/64 8/64 4/64 FM 23/64 31/64 38/64 M2 17/64 15/64 I5 14/64 7/64 合計 1 しかし、JPEGの構造を考え、縦横8×8を割り込めば処理時間が増加してしまう可能性があるので、実際には合計が64になるように近似比を取り、分割しました。(25)5分5秒
例:CPUのクロック数の比
検証結果・演算時間(秒) こちらを見てもらえばわかりやすいと思いますが、やはりCPUのクロック数が一番処理時間が短くなっています。(10)5分30秒
考察 CPUのクロック数の比 :処理速度向上 メインメモリのバイト数の比:処理速度低下 バイト数×クロック数の比 :処理速度低下 バイト数×クロック数の比 :処理速度低下 今回の結果はメインメモリに負担をかけるほどの大規模な処理ではなかったため、メインメモリの性能が関係なかったためだと考えられる (25)5分55秒
結論・今後の課題 計算機の性能により、データ量の割り当てを変動させる手段は有効的である ただし、その分割方法によっては、反対に処理が遅くなることも考慮しなければならない 処理内容により最適な分割例を求める必要がある 計算機の性能によるデータの分割を動的に行なうことが求められる (25)6分20秒