一般化Bi-CGSTAB(s, L) (=一般化IDR(s, L))

Slides:



Advertisements
Similar presentations
1 高速フーリエ変換 (fast Fourier transform). 2 高速フーリエ変換とは? – 簡単に言うとフーリエ変換を効率よく計算 する方法 – アルゴリズムの設計技法は分割統治法に基 づいている 今回の目的は? – 多項式の積を求める問題を取り上げ、高速 フーリエ変換のアルゴリズムを用いた解法.
Advertisements

大規模な三角 Toeplitz 線形方 程式の高速解法とその応用 ○ 安村 修一(法政大学 4 年) 李 磊(法政大学) 日本応用数理学会「行列・固有値の解法とその応用」研究部会 第6回研究会.
素数判定の効率性について 東邦大学理学部情報科学科卒業研究発表会 指導教員 白柳 潔 提出者 後藤 雄大.
List decoding for Reed-Muller codes and its application to polar codes 安永 憲司 東京工業大学 大学院情報理工学研究科 数理・計算科学専攻 1.
A Simple Constant Time Enumeration Algorithm for Free Trees 中野 眞一 宇野 毅明 群馬大学 情報学研究所 2003 年 9 月 19 日 アルゴリズム研究会.
特異値分解とその応用 2009年5月12日 計算理工学専攻 張研究室 山本有作.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Fill-in LevelつきIC分解による 前処理について
パノラマ動画像モデルによる 仮想空間表現システムの研究
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
セキュアネットワーク符号化構成法に関する研究
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
Extremal Combinatorics 14.1 ~ 14.2
AllReduce アルゴリズムによる QR 分解の精度について
「データ学習アルゴリズム」 第3章 複雑な学習モデル 3.1 関数近似モデル ….. … 3層パーセプトロン
Semantics with Applications
IT入門B2 ー 連立一次方程式 ー.
PCクラスタ上での 連立一次方程式の解の精度保証
線形代数学 4.行列式 吉村 裕一.
      線形写像  線形写像 U,V:R上のベクトル空間 T:UからVへの写像 (1)T(u+v)=T(u)+T(v)  (u,v∈U),
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
理学部情報科学科 金田研究室 指導教官 金田 康正 工藤 誠
応用数理工学特論 第5回 計算理工学専攻 張研究室 山本有作.
3次元剛体運動の理論と シミュレーション技法
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
サポートベクターマシン によるパターン認識
応用数学 計算理工学専攻 杉原研究室 山本有作.
高次元データの解析 -平均ベクトルに関する検定統計量の 漸近分布に対する共分散構造の影響-
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
第25章 単一始点最短路 3節 Bellman-Fordのアルゴリズム
正規分布における ベーテ近似の解析解と数値解 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
CG特論 論文読破 04ki104 松原 典子.
情報理工学系研究科 数理情報学専攻 数理第四研究室 博士三年 指導教員: 駒木 文保 准教授 鈴木 大慈 2008年8月14日
確率伝搬法と量子系の平均場理論 田中和之 東北大学大学院情報科学研究科
デザイン情報学科 メディア情報設計 河原英紀
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
量子系における 確率推論の平均場理論 田中和之 東北大学大学院情報科学研究科
主成分分析 Principal Component Analysis PCA
Extractor D3 川原 純.
Additive Combinatrics 7
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
盗聴・改ざんに対して耐性を持つ ネットワーク符号化について
速度ポテンシャルと 流線関数を ベクトルで理解する方法
長さの制限付きギャップと 文字クラスを含むパタンに対する 照合アルゴリズムの改善
文化財のデジタル保存のための 偏光を用いた透明物体形状計測手法
資料 線型変換のイメージ 固有値、固有ベクトル 平賀譲(209研究室) 資料
生物情報ソフトウェア特論 (2)たたみ込みとハッシュに 基づくマッチング
「データ学習アルゴリズム」 第3章 複雑な学習モデル 報告者 佐々木 稔 2003年6月25日 3.1 関数近似モデル
曲がった時空上の場の理論の熱的な性質と二次元CFT
用例とそのコンピューター上での実行に重点を置く
Lecture 8 Applications: Direct Product Theorems
「ICAによる顔画像特徴量抽出とSVMを用いた表情認識」
ガイダンス 電子計算機 電気工学科 山本昌志 1E
``Exponentiated Gradient Algorithms for Log-Linear Structured Prediction’’ A.Globerson, T.Y.Koo, X.Carreras, M.Collins を読んで 渡辺一帆(東大・新領域)
ガウス分布における ベーテ近似の理論解析 東京工業大学総合理工学研究科 知能システム科学専攻 渡辺研究室    西山 悠, 渡辺澄夫.
東北大学 大学院情報科学研究科 応用情報科学専攻 田中 和之(Kazuyuki Tanaka)
メモリ使用量の少ないGCR法の提案 東京大学理学部情報科学科 工藤 誠 東京大学情報基盤センター 黒田 久泰
統計力学と情報処理 ---自由エネルギーの生み出す新しい情報処理技術--- 2003年8月14日前半
◎小堀 智弘,菊池 浩明(東海大学大学院) 寺田 真敏(日立製作所)
行列 一次変換,とくに直交変換.
制約付き非負行列因子分解を用いた 音声特徴抽出の検討
密行列固有値解法の最近の発展 (I) - Multiple Relatively Robust Representation アルゴリズム - 2004年11月26日 名古屋大学 計算理工学専攻 山本有作 日立製作所の山本有作です。 「~」について発表いたします。
パターン認識特論 カーネル主成分分析 和田俊和.
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
ランダムプロジェクションを用いた音響モデルの線形変換
逆運動学(Inverse Kinematics) 2007.5.15
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
グラフの帯域幅連続多重彩色 を求めるアルゴリズム (Bandwidth Consective Multicolorings of Graphs) 西関研究室 西川和秀.
Presentation transcript:

一般化Bi-CGSTAB(s, L) (=一般化IDR(s, L)) 東京大学大学院 情報理工学系研究科 数理情報学専攻 谷尾 真明 杉原 正顯

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

Krylov部分空間法 Bi-CG GMRES CGS FOM Bi-CGSTAB GCR Bi-CGSTAB(L) Orthomin 概要 Krylov部分空間法 Bi-CG GMRES CGS FOM Bi-CGSTAB Bi-CGSTAB(L) GCR Orthomin GP-BiCG Lanczos原理 (短い漸化式) Arnoldi原理 (長い漸化式) IDR(induced dimension reduction)(s)[1](2007) [1]P. Sonneveld and M. B. van Gijzen, IDR(s): A Family of Simple and Fast Algorithms for Solving Large Nonsymmetric Systems of Linear Equations, Reports Depart. Appl. Math. Anal., REPORT 07-07, Delft Univ., Tech., 2007. (短い漸化式)

Lanczos原理に基づくKrylov部分空間法 vs IDR(s)法 概要 一番重たい計算=行列とベクトルの積 Krylov部分空間法 高々2N回行えば収束(理論) IDR(s)法 高々N+N/s回行えば収束(理論) A u v 行列ベクトル積 s>1の時、既存の方法より少ない 1回 実際の数値計算においても 早く収束する!

IDR(s)法の一般化 IDR(s)法 GIDR(s,L)法[2] 1 L 計算量 N+N/s N+N/s 加速多項式 の次数 概要 歪対称に近い係数行列と相性が良くない [2]谷尾真明 杉原正顯, GIDR(s,L): 一般化IDR(s), 応用数理学会2008年度年会, pp. 411—412, 千葉.

既存のKrylov部分空間法と IDR(s), GIDR(s,L)の関係図 概要 IDR(1) = Bi-CGSTAB GIDR(1,L) = Bi-CGSTAB(L) 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s IDR(s) GIDR(s,L) 拡張 ? 拡張

既存研究 Bi-CG(s)⇒Bi-CGSTAB(s)(=IDR(s)) (Sleijpen, 2008) 概要 加速多項式の次数 1 L 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s Bi-CG(s) IDR(s) =Bi-CGSTAB(s) GIDR(s,L) 拡張

本研究 GBi-CG(s)⇒GBi-CGSTAB(s,1)(=IDR(s)) ⇒GBi-CGSTAB(s,L)(=GIDR(s,L)) 概要 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s Bi-CG(s) GBi-CG(s) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) GIDR(s,L) GBi-CGSTAB(s,L) 拡張

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

IDR定理(1/2) IDR(s)法 定義: : span{ } と直交する空間 : N次元ベクトル空間 (注意) は非ゼロのスカラー量

IDR定理(2/2) IDR(s)法 定理 (genericな条件の下で) -s次元 -s次元 ・

IDR(s)法の概要 N+N/sMATVECsで0に到達 IDR(s)法 残差ベクトルが入れ子になっている空間列   の中を            と潜っていくように更新. 残差ベクトル N+N/sMATVECsで0に到達

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS) GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

IDR(s)法の不満点 係数行列が歪対称行列に近いと収束性悪化. IDR定理自身が持つ問題点. GIDR(s,L)法 加速多項式に相当 →高次にしたい!

数値実験による確認 IDR(3) (1次の加速多項式) vs Bi-CGSTAB(3) (3次の加速多項式) GIDR(s,L)法 3次元対流問題 離散化 ・125000×125000 ・歪対称行列に近い Bi-CGSTAB(3) IDR(3)

一般化IDR定理(1/2) GIDR(s,L)法 一般化 定義: : span{ } : N次元ベクトル空間 高次   :                

一般化IDR定理(2/2) GIDR(s,L)法 定理 (genericな条件の下で) -sL次元 -sL次元 ・

GIDR(s,L)のアルゴリズム GIDR(s,L)法 1. repeat until 14. end 2. For i = 0,1,…,L-1 15. Select 3. For j = 1,…,s 16. For i=1,…,L 4. Solve for 17. 5. 18. 19. 6. Compute 7. 20. end 8. end 21. 9. Solve for 22. 10. 23. end repeat 11. 12. 13. (k=0,…,i) 残差の更新の際に 補助ベクトルを導入している

数値実験による確認 IDR(3) (1次の加速多項式) vs GIDR(3,3) (3次の加速多項式) GIDR(s,L)法 3次元対流問題 離散化 ・125000×125000 ・歪対称行列に近い GIDR(3,3) IDR(3)

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

関係図 =IDR(1) =GIDR(1,L) =GBi-CG(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) M = : Mathematically equivalent 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

GBi-CG(s) Bi-CG法 Krylov 部分空間 反復 条件 shadow residual

GBi-CG(s) Bi-CG法の1反復 s. t. s. t. 残差が満たす性質

Bi-CG法の一般化 shadow residualの高次化 GBi-CG(s) Bi-CG法の一般化 shadow residualの高次化 Bi-CG GBi-CG(s) shadow residual N ・・・ N 1 s 条件 span

Bi-CG法の一般化 shadow residualの高次化 GBi-CG(s) Bi-CG法の一般化  shadow residualの高次化 ML(s)BiCG(Yeung and Chan, 1999) Bi-CG(s) (Sleijpen, 2008) GBi-CG(s) 加速多項式の次数 1 L Bi-CG Bi-CGSTAB Bi-CGSTAB(L) s Bi-CG(s) GBi-CG(s) ML(s)BiCG shadow residual

GBi-CG(s)の1反復 GBi-CG(s) s. t. For j = 1,…,s set s. t. 残差が満たす性質 end

GBi-CG(s)法の計算量 total 2s × N/s = 2N MATVECs 1反復あたりの行列ベクトル積の演算 shadow residual ・・・・・・s 収束するのに必要な反復回数 ×s (genericな条件下で) total 2s × N/s = 2N MATVECs (Bi-CG法, Bi-CGSTAB法などと同じ)

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

拡張のアイデア =IDR(1) =GIDR(1,L) =GBi-CG(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) GBi-CGSTAB(s,L) Bi-CG⇒Bi-CGSTAB(L)と同じ構造を利用することによりGBi-CG(s)⇒GBi-CGSTAB(s,L)を達成! 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

加速多項式の仕組み (Bi-CG) (1/3) =IDR(1) =GIDR(1,L) =GBi-CG(s) =Bi-CGSTAB(s) GBi-CGSTAB(s,L) 加速多項式の仕組み (Bi-CG) (1/3) Bi-CG⇒Bi-CGSTAB      ⇒Bi-CGSTAB(L) 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

GBi-CGSTAB(s,L) 加速多項式の仕組み (Bi-CG) (2/3) ・Bi-CG法における任意性 s. t. s. t.

加速多項式の仕組み (Bi-CG) (3/3) 残差 shadow residual GBi-CGSTAB(s,L) Bi-CG Bi-CG + 加速多項式 加速多項式 (fixed)

加速多項式の仕組み (GBi-CG(s)) (1/3) GBi-CGSTAB(s,L) 加速多項式の仕組み (GBi-CG(s)) (1/3) GBi-CG(s)⇒GBi-CGSTAB(s,1)(=IDR(s))         ⇒GBi-CGSTAB(s,L)(=GIDR(s,L)) M 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

加速多項式の仕組み (GBi-CG(s)) (2/3) GBi-CGSTAB(s,L) 加速多項式の仕組み (GBi-CG(s)) (2/3) ・GBi-CG(s)における任意性 For i = 1,…,s set s. t. 残差が満たす性質 end 35

加速多項式の仕組み (GBi-CG(s)) (3/3) GBi-CGSTAB(s,L) 加速多項式の仕組み (GBi-CG(s)) (3/3) 残差 shadow residual GBi-CG(s) GBi-CG(s) + 加速多項式 (fixed) 加速多項式

GBi-CGSTAB(s,L)=GIDR(s,L) 加速多項式の次数 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

GIDR(s,L)のアルゴリズム GBi-CGSTAB(s,L) 再掲 GBi-CGSTAB(s,L) 1. repeat until 14. end 2. For i = 0,1,…,L-1 15. Select 3. For j = 1,…,s 16. For i=1,…,L 4. Solve for 17. 5. 18. 19. 6. Compute 7. 20. end 8. end 21. 9. Solve for 22. 10. 23. end repeat 11. 12. 13. (k=0,…,i) 補助ベクトル ⇔ GBi-CG(s)における補助ベクトル

GBi-CGSTAB(s,L)の計算量 2N N+N/s k反復後の k反復後の残差 shadow residual Matvec ks k = [N/s]で収束 GBi-CG(s) + 加速多項式 (fixed) Matvec 0 計算量 Matvec ks + k N+N/s

発表の流れ 概要 IDR(s)法, GIDR(s,L)法の導出 (応用数理年会) GBi-CGSTAB(s,L)法の導出 (RIMS研究集会) GBi-CG(s)法 GBi-CGSTAB(s,L)法(=GIDR(s,L)法) まとめ

結論 =IDR(1) =GIDR(1,L) =GBi-CG(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) GIDR(s,L)法を, Bi-CG法の拡張として解釈出来た(GBi-CGSTAB(s,L)法) 1 L Bi-CG Bi-CGSTAB =IDR(1) Bi-CGSTAB(L) =GIDR(1,L) s =Bi-CG(s) =GBi-CG(s) (ML(s)BiCG) IDR(s) =Bi-CGSTAB(s) =GBi-CGSTAB(s,1) (ML(s)BiCGSTAB) GIDR(s,L) GBi-CGSTAB(s,L) M M M M M

今後の課題 前処理を含めたGBi-CGSTAB(s, L)法の提案. パラメータsとLの決定法. 加速多項式の次数 1 L Bi-CG 1 L Bi-CG Bi-CGSTAB Bi-CGSTAB(L) s Bi-CG(s) GBi-CG(s) ML(s)BiCG IDR(s) Bi-CGSTAB(s) GBi-CGSTAB(s,1) ML(s)BiCGSTAB GIDR(s,L) GBi-CGSTAB(s,L) shadow residual

実験環境 MATLAB7.30 で反復終了 加速多項式の次数 1 2 3 4 shadow residual IDR(1) Bi-CGSTAB(1) GBi-CGSTAB(1,1) Bi-CGSTAB(2) Bi-CGSTAB(3) Bi-CGSTAB(4) IDR(2) GBi-CG STAB(2,2) IDR(3) STAB(3,3) IDR(4) STAB(4,4) shadow residual

実験その1 3次元対流問題 離散化 ・125000×125000 ・歪対称に近い

実験その1 Bi-CGSTAB(L) Bi-CGSTAB(1) shadow residual Bi-CGSTAB(2) 加速多項式の次数 shadow residual 1 2 3 4 Bi-CGSTAB(2) Bi-CGSTAB(3) Bi-CGSTAB(4)

実験その1 IDR(s) IDR(1) shadow residual IDR(2) IDR(4) IDR(3) 加速多項式の次数 1 2

実験その1 GBi-CGSTAB(s, L) GBi-CGSTAB(1,1) shadow residual GBi-CGSTAB(2,2) 加速多項式の次数 shadow residual 1 2 3 4 GBi-CGSTAB(2,2) GBi-CGSTAB(3,3) GBi-CGSTAB(4,4)

実験その1 s = L = 3 shadow residual GBi-CGSTAB(3,3) IDR(3) Bi-CGSTAB(3) 加速多項式の次数 shadow residual 1 2 3 4 GBi-CGSTAB(3,3) IDR(3) Bi-CGSTAB(3)

実験その2  raefsky2 (matrix market より) x b A 3242×3242

実験その2 Bi-CGSTAB(L) Bi-CGSTAB(1) shadow residual shadow residual 加速多項式の次数 shadow residual shadow residual 1 2 3 4 Bi-CGSTAB(2) Bi-CGSTAB(3) Bi-CGSTAB(4)

実験その2 IDR(s) shadow residual IDR(4) IDR(3) IDR(2) IDR(1) 加速多項式の次数 1 2

実験その2 GBi-CGSTAB(s,L) GBi-CGSTAB(1,1) shadow residual GBi-CGSTAB(4,4) 加速多項式の次数 shadow residual 1 2 3 4 GBi-CGSTAB(4,4) GBi-CGSTAB(3,3) GBi-CGSTAB(2,2)

実験その2 s = L = 3 shadow residual IDR(3) GBi-CGSTAB(3,3) Bi-CGSTAB(3) 加速多項式の次数 shadow residual 1 2 3 4 IDR(3) GBi-CGSTAB(3,3) Bi-CGSTAB(3)

IDR定理の空間列 に関する定理(2008, Sleijpen)

一般化IDR定理の空間列 に関する定理

IDR(s)法に対する 2つの解釈 (2008, Sleijpen) 加速多項式を取り払った 空間と残差 IDR定理 -s次元 -s次元

GIDR(s,L)に対する 2つの解釈 加速多項式を取り払った 残差の動き 一般化IDR定理 -sL次元 -sL次元