MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志

Slides:



Advertisements
Similar presentations
HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太.
Advertisements

専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
インターネット構成法 最終課題 環境情報学部3年 平野大輔 環境情報学部3年 小原知博 環境情報学部3年 野崎沙織.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
グローバルコンピューティング環境における遺伝的アルゴリズムの検討
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
キャッシュ付PRAM上の 並列クィックソートと 並列マージソート
クラスタの構成技術と クラスタによる並列処理
コンピュータプラクティス I 再現性 水野嘉明
Ibaraki Univ. Dept of Electrical & Electronic Eng.
パネル型クエリ生成インタフェース画像検索システムの改良
クラウドにおける ネストした仮想化を用いた 安全な帯域外リモート管理
北海道大学 理学院 宇宙理学専攻 惑星物理学研究室 M 2 齊藤 大晶
Xenを用いたクラウドコンピュー ティングにおける情報漏洩の防止
全体ミーティング (4/25) 村田雅之.
AllReduce アルゴリズムによる QR 分解の精度について
神奈川大学大学院工学研究科 電気電子情報工学専攻
仮想マシンの並列処理性能に対するCPU割り当ての影響の評価
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
福盛 秀雄, 浜中 征志郎, 菅原 健一, 吉川 潤, 中山 周平 早稲田大学 村岡研究室
モバイルエージェントの応用 概要 モーバイルエージェントの応用分野 AgentSpaceシステム エージェント移動 応用:ソフトウェアの配信
リンクパワーオフによる光ネットワークの省電力化
医療支援診断のためのコンピュータ分散システムの検討
帯域外リモート管理を継続可能な マイグレーション手法
Towards Commercial Mobile Ad Hoc Network Applications: A Radio Dispatch System ECN M1 sada.
CSP記述によるモデル設計と ツールによる検証
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
 データベースによる並列処理 情報論理工学研究室  三宅健太.
Ibaraki Univ. Dept of Electrical & Electronic Eng.
物流への興味向上のためのVRを用いた近未来流通センターの構築
大規模アドホックネットワークにおける 階層的な名前解決法
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
Occam言語による マルチプリエンプティブシステムの 実装と検証
CPUの仕組み 1E16M002-5 阿部知也 1E16M007-3 伊藤達哉 1E16M026-9 小島祥太郎 1E16M069-8 峰晴晃優 1E16M070-0 宮路暁久 1E14M070-5 南元喜.
オペレーティングシステムJ/K (実時間処理システム)
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
ソフトを用いた動画の並列変換処理 情報論理工学研究室 中村勇介.
MPIを用いた並列計算 情報論理工学研究室 清水周.
高速剰余算アルゴリズムとそのハードウェア実装についての研究
コンピュータを知る 1E16M009-1 梅津たくみ 1E16M017-8 小沢あきら 1E16M035-0 柴田かいと
1.コンピュータと情報処理 p.18 第1章第1節 2.コンピュータの動作のしくみ CPUと論理回路
2009年度卒業論文発表 CDNコンテンツサーバの動的負荷分散
MPIとOpenMPを用いた Nクイーン問題の並列化
IPアドレスについて      発表者  M3KI.
リモートホストの異常を検知するための GPUとの直接通信機構
実行時情報に基づく OSカーネルのコンフィグ最小化
通信機構合わせた最適化をおこなう並列化ンパイラ
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
複数ホストにまたがって動作する仮想マシンの障害対策
VMが利用可能なCPU数の変化に対応した 並列アプリケーション実行の最適化
Virtualizing a Multiprocessor Machine on a Network of Computers
設計情報の再利用を目的とした UML図の自動推薦ツール
「マイグレーションを支援する分散集合オブジェクト」
卒業研究 JCSPを用いたプログラム開発  池部理奈.
BSPモデルを用いた 並列計算の有用性の検証
理工学部情報学科 情報論理工学研究室 延山 周平
衛星回線を含むネットワークにおける 動的経路制御に関する研究
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
nチャネルメッセージ伝送方式のためのjailによる経路制御
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
情報論理工学 研究室 第1回:並列とは.
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
分散メモリ型並列計算機上での行列演算の並列化
アーキテクチャパラメータを利用した並列GCの性能予測
自動車ホイールのディスク成形に おける肉厚分布を持つ円環の加工 加工能率低下 図 ディスク成形 塑性加工研究室 中川原 大助 スピニング
Ibaraki Univ. Dept of Electrical & Electronic Eng.
Presentation transcript:

MPIを用いた最適な分散処理 情報論理工学研究室 05-1-037-0136 角 仁志 05-1-037-0136  角 仁志 MPIを用いた最適な分散処理について発表さしていただきます。(5秒)

目次 並列処理 仮想並列計算機 目的 MPI (Message Passing Interface) 並列JPEGエンコーダ 検証方法 結果・考察 結論・今後の課題 この順番で説明さしていただきます。(5秒)10秒

並列処理 処理速度の向上 データの分割 機能の分割 信頼性の向上 耐故障性 機能の分割     信頼性の向上 耐故障性 まず、本研究を説明するにあたり、並列処理について説明さしていただきます。(10秒)20秒 並列処理とは単一の処理を、複数のプロセッサで解決するという考え方です。(10秒)30秒 その目的は次の二つです。(5秒)35秒 処理速度の向上。その方法としてはデータを分けて計算を行うことで、処理速度を向上させることができます。(10秒)45秒 また処理の内容により、使われる計算機を変えることで処理速度を向上させることができます。(10秒)55秒 信頼性の向上とは複数の計算機で同じプログラムを実行させているので、 1台が止まってしまっても他の計算機が負担し、システム全体の停止を引き起こさない(20秒)1分15秒

仮想並列計算機 えっ、まだなの! 仕方が無いから待つよ 処理が完了したよ 手伝います ただ、並列計算機は非常に高価なものであり、並列計算機を持っているのは一部の大学、研究機関、企業ぐらいでしかなく、一般に普及しているとは言えません。そこで本研究では、並列計算機の代用として、仮想並列計算機を使用しています。では、次に仮想並列計算機について説明をさせていただきます。 (20秒)1分35秒 先ほども行ったとおり並列計算機は非常に高価なものです。 そして、近年計算機の性能の向上著しく、少し古いものなら安価で手に入れることができます。(15)1分50 仮想並列計算機とは、無料のソフトウェアを使用し、複数の計算機をネットワークで接続することで仮想的に一台の並列計算機を構成する考え方です。 (15)2分5 すいません まだ処理の途中です

目的 仮想並列計算機を用いて処理を行なう時、各計算機へのデータ割り当ての配分を性能により変動させることで、処理速度の向上をさせる。 先ほどのデメリットを踏まえて、本研究の目的を説明させていただきます。(15秒)3分15

MPI(Message Passing Interface) 世界標準を目的に作成されたAPIの規格 プログラムの移植性が高い 異機種間の通信が考慮されていない (20)3分35

並列JPEGエンコーダ 次に使用した並列JPEGエンコーダについて説明させていただきます。(20)4分5秒

検証方法 BMP画像を50枚 24bit・14MB 計算機は4台 OSはWindowsXPで統一 全て違う性能 分割する割合 均等・CPUのクロック数・メインメモリのバイト数・バイト数×クロック数、計四種類 では、検証方法について説明さしていただきます。 画像は50枚、24bit・約14MBのBMP画像を使用します。 計算機は4台、MPIを使用するためWindowsXPで統一しています。 そして、目的のため性能は全て違うものを用意しました。 分割する割合は計算機の性能から割り出すためわかりやすくしました。(30)4分35秒

仮想並列計算機の構成図

使用した各計算機の性能 OS CPU メインメモリ 計算機 F8 Windows XP 1.5GHz 504MB 計算機 FM 3.2GHz これが使用した計算機の性能表です。(5)4分40

各計算機の性能比較 こちらがバイト数×クロック数の比です

実際の割り当て画像比 10/64 8/64 4/64 23/64 31/64 38/64 17/64 15/64 14/64 7/64 1 CPU比 MM比 MM×CPU比 F8 10/64 8/64 4/64 FM 23/64 31/64 38/64 M2 17/64 15/64 I5 14/64 7/64 合計 1 しかし、JPEGの構造を考え、縦横8×8を割り込めば処理時間が増加してしまう可能性があるので、実際には合計が64になるように近似比を取り、分割しました。(25)5分5秒

例:CPUのクロック数の比

検証結果・演算時間(秒) こちらを見てもらえばわかりやすいと思いますが、やはりCPUのクロック数が一番処理時間が短くなっています。(10)5分30秒

考察 CPUのクロック数の比 :処理速度向上 メインメモリのバイト数の比:処理速度低下 バイト数×クロック数の比 :処理速度低下 バイト数×クロック数の比 :処理速度低下 今回の結果はメインメモリに負担をかけるほどの大規模な処理ではなかったため、メインメモリの性能が関係なかったためだと考えられる (25)5分55秒

結論・今後の課題 計算機の性能により、データ量の割り当てを変動させる手段は有効的である ただし、その分割方法によっては、反対に処理が遅くなることも考慮しなければならない 処理内容により最適な分割例を求める必要がある 計算機の性能によるデータの分割を動的に行なうことが求められる (25)6分20秒