Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化

Slides:



Advertisements
Similar presentations
Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
Advertisements

Division of Process Control & Process Systems Engineering Department of Chemical Engineering, Kyoto University
大規模な三角 Toeplitz 線形方 程式の高速解法とその応用 ○ 安村 修一(法政大学 4 年) 李 磊(法政大学) 日本応用数理学会「行列・固有値の解法とその応用」研究部会 第6回研究会.
1 線形代数学. 2 履修にあたって 電子情報システム学科 必修 2005 年度1セメスタ開講 担当 草苅良至 (電子情報システム学科) 教官室: G I 511 内線: 2095 質問等は上記のいずれかに行なうこと。 注意計算用のノートを準備すること。
2. 数値微分法. 数値微分が必要になる場合として、次の 2 つが考えられる。 関数が与えられていて、その微分を近似的に計算する。 (数値微分の精度が十分で、かつ、計算速度が数値微分の方が 早い場合など。) 離散的な点の上で離散的なデータしかわかっていない関数の微 分を近似的に計算する。(偏微分方程式の数値解を求めたい時.
陰関数定理と比較静学 モデルの連立方程式体系で表されるとき パラメータが変化したとき 如何に変数が変化するか 至るところに出てくる.
Computational Fluid Dynamics(CFD) 岡永 博夫
遺伝的アルゴリズムにおける ランドスケープによる問題のクラス分類
MPIを用いたグラフの並列計算 情報論理工学研究室 藤本 涼一.
高精度画像マッチングを用いた SAR衛星画像からの地表変位推定
有限差分法による 時間発展問題の解法の基礎
CPUとGPUの 性能比較 -行列計算およびN体問題を用いて-
Fill-in LevelつきIC分解による 前処理について
HOG特徴に基づく 単眼画像からの人体3次元姿勢推定
一般化Bi-CGSTAB(s, L) (=一般化IDR(s, L))
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
Fortran と有限差分法の 入門の入門の…
ラベル付き区間グラフを列挙するBDDとその応用
全体ミーティング (4/25) 村田雅之.
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
局所探索に基づく 原子炉燃料装荷パターンの最適化
4.3 連立1次方程式   Ax = b   (23) と書くことができる。
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
AllReduce アルゴリズムによる QR 分解の精度について
時空間データからのオブジェクトベース知識発見
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
東京工業大学 機械制御システム専攻 山北 昌毅
PCクラスタ上での 連立一次方程式の解の精度保証
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
理学部情報科学科 金田研究室 指導教官 金田 康正 工藤 誠
応用数理工学特論 第5回 計算理工学専攻 張研究室 山本有作.
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
計算アルゴリズム 計算理工学専攻 張研究室 山本有作.
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
応用数学 計算理工学専攻 杉原研究室 山本有作.
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
Level-3 BLASに基づく二重対角化 アルゴリズムとその性能評価
スペクトル法の一部の基礎の初歩への はじめの一歩
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
仮想メモリを用いた VMマイグレーションの高速化
確率的学習アルゴリズムを用いた有限状態オートマトンの抽出に関する研究
仮想計算機を用いたサーバ統合に おける高速なリブートリカバリ
デザイン情報学科 メディア情報設計 河原英紀
システム制御基礎論 システム工学科2年後期.
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
通信機構合わせた最適化をおこなう並列化ンパイラ
変換されても変換されない頑固ベクトル どうしたら頑固になれるか 頑固なベクトルは何に使える?
連続領域におけるファジィ制約充足問題の 反復改善アルゴリズムによる解法 Solving by heuristic repair Algorithm of the Fuzzy Constraint Satisfaction Problems with Continuous Domains 北海道大学.
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
GPUを用いた疎行列の格納形式による行列ベクトル積の評価
適応的近傍を持つ シミュレーテッドアニーリングの性能
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
Wavelet係数の局所テクスチャ特徴量を用いたGraph Cutsによる画像セグメンテーション
Bottom-UpとTop-Down アプローチの組み合わせによる 単眼画像からの人体3次元姿勢推定
第3章 線形回帰モデル 修士1年 山田 孝太郎.
秘匿リストマッチングプロトコルとその応用
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
情報科学 第6回 数値解析(1).
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
メモリ使用量の少ないGCR法の提案 東京大学理学部情報科学科 工藤 誠 東京大学情報基盤センター 黒田 久泰
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
最小二乗法による線形重回帰分析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
密行列固有値解法の最近の発展 (I) - Multiple Relatively Robust Representation アルゴリズム - 2004年11月26日 名古屋大学 計算理工学専攻 山本有作 日立製作所の山本有作です。 「~」について発表いたします。
パターン認識特論 カーネル主成分分析 和田俊和.
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
Presentation transcript:

Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化 今倉 暁  曽我部 知広  張 紹良 名古屋大学 大学院工学研究科 計算理工学専攻

Outline 近似逆行列前処理 Wavelet近似逆行列前処理 Finger patternのブロック化 [提案法] 数値実験 ・ 結果 まとめ ・ 今後の課題

近似逆行列前処理

近似逆行列前処理 偏微分方程式を離散化した際の線形方程式 を前処理付きKrylov部分空間法で解くことを考える. 本研究では, 前処理として以下の近似逆行列前処理を扱う. M の計算. 最小二乗問題 完全独立・並列化が容易 :M の j 番目の列ベクトル : I の j 番目の列ベクトル

M の非零構造を考える. → A-1の構造を参考にする. 近似逆行列前処理 実際に解く上で, M に要求される性質 疎行列である.        が小さい. ・・・計算コスト ・・・近似逆行列の精度 M の非零構造を考える. → A-1の構造を参考にする. 疎性と精度を両立させたい フィルタリングを行う 閾値 : 小 閾値 : 大 値 値 大 小 大 小 疎性 : × 精度 : ○ 疎性 : ○ 精度 : ×

Wavelet近似逆行列前処理

Wavelet近似逆行列前処理 ~離散wavelet変換(DWT)~ L : 任意パラメータ Wの非零構造 4 L = 2 L = 1

Wavelet近似逆行列前処理 W 同値 疎性と精度の両立が可能 Finger pattern Finger pattern (S. C. Hawkins and K. Chen, 2006) Finger pattern (T. F. Chan et al., 1997) 同値 W 疎性と精度の両立が可能

Wavelet近似逆行列前処理 近似逆行列前処理 Finger pattern 陰的wavelet近似逆行列前処理

Wavelet近似逆行列前処理 ~wavelet依存性~ DWTの精度に影響 近似逆行列の疎性に影響 1.2 116 128 0.4 Time[s] 近似逆行列の疎性に影響 Watt 1 (n=1856) 1.2 116 128 Sherman 4 (n=1104) 0.4 前処理行列 の構築時間 反復法にかかる 時間 影響が少ない Daubechies 4 精度が高い 疎性が低い 計算コストが高い 本研究では WaveletをHaarに限定する Haar 精度が低い 疎性が高い 計算コストが低い 反復回数 85 87 Daubechies4 Haar

Finger patternのブロック化

Finger patternのブロック化 ~従来法の問題点~ 近似逆行列の計算 問題点 近似逆行列の非零構造が   近似逆行列の非零構造が   列ごとに異なる為, 異なる   部分行列に対して, QR分解   を合計n 回行う必要がある. 陰的法を例に・・・ 最小二乗問題 QR分解の結果を再利用する為に, Finger patternのブロック化を提案する. 本研究では, 陰的法に対してブロック化を行った. QR分解 後退代入

Finger patternのブロック化 従来法 提案法 A(:,Sj) mj(Sj) A(:,Sj) mj(Sj)

Finger patternのブロック化 ~精度比較~ の非零構造 Theorem 1. Proof. 従来法  提案法

数値実験・結果

数値実験 Test行列 Poisson3Da (electromagnetics problem) 前処理 dw8192 (computational fluid dynamics problem) n = 13514, Nnz = 352726 n = 8192, Nnz = 41746 T b = (1,…,1) 前処理 陰的wavelet近似逆行列前処理[従来法] 提案法 ILU(0) 解法 GMRES 初期近似解 停止条件 T x = (0,…,0) |r |/|r | < 10 -8 n 計算環境 CPU : PowerPC G5 2.5GHz メモリ : 4.0GB コード : Fortran77 コンパイラ : g77 –O5

結果 poisson3Da QR分解 後退代入 ILU(0)の分解 GMRES 12 Time[s] 3.5倍 3.0倍 2.2倍 1.8倍 反復回数 158  158 159  159 160  160 57 Time[s] 3.5倍 3.0倍 2.2倍 1.8倍 1.7倍 1.5倍 L= 3 4 5 従来法 提案法 従来法 提案法 従来法 提案法 ILU(0)

結果 dw8192 ― 前処理なし ― 従来法 L=8 ― 提案法 L=6 ― 提案法 L=7 ― 提案法 L=8 ― ILU(0) 相 対 残 差 ― 前処理なし ― 従来法 L=8 ― 提案法 L=6 ― 提案法 L=7 ― 提案法 L=8 ― ILU(0) 0 反復回数 500

結果 dw8192 QR分解 後退代入 ILU(0)の分解 GMRES 25 指数関数的に 計算時間が増大 指数関数的に 計算時間が増大 計算時間は減少 Time[s] 449 316 230 449 316 230 484 反復回数 0 L= 6 7 8 提案法       ILU(0)

まとめ・今後の課題

まとめ ・ 今後の課題 陰的wavelet近似逆行列前処理に対して, finger pattern のブロック化を行った. 最小二乗問題でのQR分解の結果を再利用すること により, 全体で約1.5倍高速化された. また, 従来法では収束しない問題に対しても収束す る場合もみられた. 提案法は従来法に代わる有効な解法になり得る. 今後の課題 前処理行列の構築の更なる高速化 アルゴリズムの並列化及び実装