HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 06-1-037-0142 吉岡健太.

Slides:



Advertisements
Similar presentations
1 エクセル (3) の目次 ②参照演算子と演算子参照演算子と演算子 ③参照セルの表示法参照セルの表示法 ④セルの参照方法セルの参照方法 ⑤エラーについてエラーについて ⑥シグマ( Σ )関数シグマ( Σ )関数 ⑦条件付書式条件付書式 ⑧問題 (1)問題 (1) ⑨問題 (2)問題 (2) ⑩問題.
Advertisements

1 高速フーリエ変換 (fast Fourier transform). 2 高速フーリエ変換とは? – 簡単に言うとフーリエ変換を効率よく計算 する方法 – アルゴリズムの設計技法は分割統治法に基 づいている 今回の目的は? – 多項式の積を求める問題を取り上げ、高速 フーリエ変換のアルゴリズムを用いた解法.
G 問題 コードアート オンライン 原案:西出 ライタ:伊藤 テスタ:西出. 問題概要 0 大きさのさまざまな n 個の円に多角形 m 個を入れら れるか判定する問題 0 ただし、同じ円に複数の多角形を入れることはでき ない 0 もし、入れられる場合は、辞書順最小の入れ方を出 力 ① ② ③ ① ②.
利用者のプライバシを保護す る協調フィルタリング方式の 提案 7adrm011 木澤寛厚. 背景 商品の量が多い 見つからな い orz ネットショップ.
1 線形代数学. 2 履修にあたって 電子情報システム学科 必修 2005 年度1セメスタ開講 担当 草苅良至 (電子情報システム学科) 教官室: G I 511 内線: 2095 質問等は上記のいずれかに行なうこと。 注意計算用のノートを準備すること。
0章 数学基礎.
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
3次元nクイーン問題の 解に関する研究 論理工学研究室 伊藤精一
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
キャッシュ付PRAM上の 並列クィックソートと 並列マージソート
クラスタの構成技術と クラスタによる並列処理
点対応の外れ値除去の最適化によるカメラの動的校正手法の精度向上
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
セキュアネットワーク符号化構成法に関する研究
離散システム特論 整列(sorting)アルゴリズム 2.
C言語 配列 2016年 吉田研究室.
近似アルゴリズム 第10章 終了時刻最小化スケジューリング
全体ミーティング (4/25) 村田雅之.
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
Extremal Combinatorics 14.1 ~ 14.2
Bassモデルにおける 最尤法を用いたパラメータ推定
1. アルゴリズムと計算量.
AllReduce アルゴリズムによる QR 分解の精度について
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
香川大学工学部 富永浩之 情報数学1 第2-2章 合同式の逆元と応用 香川大学工学部 富永浩之
リンクパワーオフによる光ネットワークの省電力化
線形代数学 4.行列式 吉村 裕一.
高山建志 五十嵐健夫 テクスチャ合成の新たな応用と展開 k 情報処理 vol.53 No.6 June 2012 pp
10.通信路符号化手法2 (誤り検出と誤り訂正符号)
 データベースによる並列処理 情報論理工学研究室  三宅健太.
論理回路 第7回
論理回路 第8回
2.2.1 ブラベー格子 単位格子:原子が配列している周期的な配列の中で最も     単純で最小な単位    
精密工学科プログラミング基礎Ⅱ 第3回資料 今回の授業で習得してほしいこと: 2次元配列の使い方 (前回の1次元配列の復習もします.)
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
発表日:平成15年4月25日 担当者:時田 陽一 担当箇所:第3章 誤差評価に基づく学習 3.1 Widrow-Hoffの学習規則
情報処理3 第5回目講義         担当 鶴貝 達政 11/8/2018.
Mathematicaによる固有値計算の高速化 Eigenvalue calculation speed by Mathematica
MPIによるwavからmp3圧縮の検証 情報論理工学研究室 04‐1‐47‐200 木村 惇一.
MPIを用いた最適な分散処理 情報論理工学研究室 角 仁志
MPIとOpenMPを用いた Nクイーン問題の並列化
混合ガウスモデルによる回帰分析および 逆解析 Gaussian Mixture Regression GMR
 2 文字の式 1章 文字を使った式 §4 式の計算         (4時間).
線 形 代 数 (linear algebra) linear ・・・ line(直線)の形容詞形 直線的な、線形の、一次の
通信機構合わせた最適化をおこなう並列化ンパイラ
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
サポートベクターマシンを用いた タンパク質スレッディングの ためのスコア関数の学習 情報科学科4年 81025G 蓬来祐一郎.
電気回路学I演習 2012/11/16 (金) I1 I2 問1 Z0 V1 V2 問2 I1 I2 V1 Z0 V2 Z,Y,K行列の計算
秘匿リストマッチングプロトコルとその応用
第4回 メモリ管理 主記憶(メインメモリ)の管理 固定区画方式と可変区画方式 空き領域の管理 スワッピング.
第16章 動的計画法 アルゴリズムイントロダクション.
全体ミーティング (5/23) 村田雅之.
8方向補間ブロックマッチングの実装 福永研究室 数理科学コース 学部4年 能城 真幸.
「マイグレーションを支援する分散集合オブジェクト」
クローン検出ツールを用いた ソフトウェアシステムの類似度調査
論理回路 第5回
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
BSPモデルを用いた 並列計算の有用性の検証
理工学部情報学科 情報論理工学研究室 延山 周平
アルゴリズムとデータ構造 --- 理論編 --- 山本 真基
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
ヒープソート.
情報論理工学 研究室 第1回:並列とは.
割り当て問題(assignment problem)
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
線形符号(10章).
分散メモリ型並列計算機上での行列演算の並列化
Presentation transcript:

HBSP モデル上での 行列積を求めるアルゴリ ム 情報論理工学 吉岡健太

あらまし 背景 研究内容 結果 結論・今後の課題

背景 膨大な計算量を必要とする問題を高速かつ 短時間で解きたい 複雑な問題を解きたい ( 例 ) 画像処理、気象シミュレーション、コンピュータ グラフィック、天体の軌道計算など プロセッサの性能の向上 複数のプロセッサを持つ並列計算機 による並列処理

HBSP ( Heterogeneous Bulk- Synchronous Parallel )モデル ネットワーク メモ リ プロセッサ …………… HBSPモデルの概念図

HBSP モデルのパラメタと特徴 p 2 :プロセッサ数 g :通信コスト L:バリア同期時間 s i :プロセッサ P i の速度 s 0 ≧ s 1 ≧ ……… ≧ s p 2 -1 =1 s :プロセッサの速度合計 s=∑s i 計算量の小さい処理 最も早いプロセッサ1台で行う 計算量の大きい処理 プロセッサの能力差によって処理を割り当て

研究内容 n*n の行列積 C=A*B に対して各行列 A,B,C を それぞれ s 個の部分行列に分割し 速度 s i (0 ≦ i < p 2 ) であるプロセッサ p i に対して s i 個の部分 行 列を割り当てる 本研究では簡単のために通信コストと各プロセッサ の処理速度が比例すると仮定する。 g 0 :s 0 =g 1 :s 1 ==g p 2 -1 :s p 2 -1 この式よりプロセッサ P i はプロセッサ P p 2 -1 に比べて 内部計算命令および送信命令は s i 倍高速に実行でき る

データの割り当て方 入力行列 A,B の各プロセッサへのデータの割り当て方は以 下の3通り α :それぞれサイズ n/s 0.5 *n/s 0.5 個の部分行列に分割し、各プロセッサに1つ の部分行列を割り当てる β :それぞれサイズ n/s*n 個の部分行列に分割し、各プロセッサに1つの部 分行列を割り当てる γ :それぞれサイズ n*n/s 個の部分行列に分割し、各プロセッサに1つの部 分行列を割り当てる αβ γ

割り当て方の組み合わせ方は 3 3 =27 通りある 入力行列 B :送信に必要なデータ数は行列 A を縦横 入れ替えたものと等しい 解行列 C : β と γ の向きが異なるだけ よって、割り当て方の組み合わせは A と C について 考慮すればいいので 3 2 =9 通りの組み合わせに ついて求める

組み合わせの9通り ① A の割り当て方 α C の割り当て方 α ② A の割り当て方 α C の割り当て方 α ③ A の割り当て方 α C の割り当て方 α ④ A の割り当て方 α C の割り当て方 α ⑤ A の割り当て方 α C の割り当て方 α ⑥ A の割り当て方 α C の割り当て方 α ⑦ A の割り当て方 α C の割り当て方 α ⑧ A の割り当て方 α C の割り当て方 α ⑨ A の割り当て方 α C の割り当て方 α

A のデータ送信については①から⑨より C の割り当て方が α の時の全体の通信計算量 は O(g*{n 2 /s 0.5 }+L) C の割り当て方が β の時の全体の通信計算量は O(g*n 2 +L) C の割り当て方が γ の時の全体の通信計算量は O(g*{n 2 /s}+L)

B のデータ送信については A を縦横入れ替えたものと等しいので C の割り当て方が α の時の全体の通信計算量 は O(g*{n 2 /s 0.5 }+L) C の割り当て方が β の時の全体の通信計算量は O(g*{n 2 /s}+L) C の割り当て方が γ の時の全体の通信計算量は O(g*n 2 +L)

結果 よって、通信計算量が最小となるのは C=A*B に対して α=α*α の分割パターンにした時 であり、通信計算量は O(g*{n 2 /s 0.5 }+L) また、解行列の計算は O(n 3 /s) で行うことが 出来 るので、 HBSP モデル上での行列積を求めるア ル ゴリズム計算量は O(n 3 /s+n 2 /s 0.5 +L) となる。

結論と今後の課題 各プロセッサへの最適なデータの割り当て方 は行列積 C=A*B に対して各行列を s 0.5 *s 0.5 個 の部分行列に分割し、プロセッサ P i に s i 個の 部分行列を割り当てた場合である。 データを送信する最適な分割パターンは各部 分行列が正方形になる場合である。 行列以外にも2次元配列になっているデータ が存在するような問題に対する各プロセッサ へのデータの割り当て方を求めていくことが 必要