導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

Absolute Orientation. Absolute Orientation の問題 二つの座標系の間における剛体 (rigid body) 変換を復元す る問題である。 例えば: 2 台のステレオカメラから得られた3次元情報の間の関 係を推定する問題。 2 台のステレオカメラから得られた3次元情報の間の関.
大規模な三角 Toeplitz 線形方 程式の高速解法とその応用 ○ 安村 修一(法政大学 4 年) 李 磊(法政大学) 日本応用数理学会「行列・固有値の解法とその応用」研究部会 第6回研究会.
在庫管理問題の動的計画法による 解法とCUDA を用いた高速化
Computational Fluid Dynamics(CFD) 岡永 博夫
到着時刻と燃料消費量を同時に最適化する船速・航路計画
有限差分法による 時間発展問題の解法の基礎
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Fill-in LevelつきIC分解による 前処理について
A Q R QR分解とは? → × ◆QR分解 QTQ = I (単位行列) ◆応用例 ◆主な計算方法 n m 今回はこの方法に注目
全体ミーティング (4/25) 村田雅之.
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
4.3 連立1次方程式   Ax = b   (23) と書くことができる。
連立一次方程式 a11x1+a12x2+a13x3+...+a1nxn= b1
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
AllReduce アルゴリズムによる QR 分解の精度について
IT入門B2 ー 連立一次方程式 ー.
第二回 連立1次方程式の解法 内容 目標 連立1次方程式の掃出し法 初期基底を求める 連立1次方程式を掃出し法を用いてExcelで解析する
PCクラスタ上での 連立一次方程式の解の精度保証
半正定値計画問題に対する 行列補完理論の高速実装
理学部情報科学科 金田研究室 指導教官 金田 康正 工藤 誠
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
応用数理工学特論 第5回 計算理工学専攻 張研究室 山本有作.
3次元剛体運動の理論と シミュレーション技法
シミュレーション演習 G. 総合演習 (Mathematica演習) システム創成情報工学科
正方行列向け特異値分解の CUDAによる高速化
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
計算アルゴリズム 計算理工学専攻 張研究室 山本有作.
研究背景 研究目的 手法 研究計画 分散型プラズマアクチュエータと物体形状の統合最適設計による 仮想空力形状の実現 jh NAH
© Yukiko Abe 2014 All rights reserved
高速CFDコードを用いた次世代空力応用研究プラットフォーム構築に 向けた実証研究
第6章 連立方程式モデル ー 計量経済学 ー.
現実の有限密度QCDの定性的な振る舞いに
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
ひび割れ面の摩擦接触を考慮した損傷モデル
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
電磁流体力学乱流の高精度・高並列LESシミュレーションコード開発研究
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
HPC基盤における大量データ転送のためのデータ転送ツールの評価
通信機構合わせた最適化をおこなう並列化ンパイラ
Poisson Image Editing SIGGRAPH 2003
航空エンジンの翼列周り流れ解析のメニーコアシステム向け最適化
ポリゴンメッシュ (2) - 変形と簡略化- 東京大学 精密工学専攻 大竹豊 資料および授業の情報は :
GPUを用いた疎行列の格納形式による行列ベクトル積の評価
GW space-timeコードの大規模な有機-金属界面への適用に向けた高効率化
目的:高速QR分解ルーチンのGPUクラスタ実装
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
○○○○○○○○○○○○○○○○○○ の要素技術開発
情報科学演習III --- 計算代数とその応用 ---
連立一次方程式 a11x1+a12x2+a13x3+...+a1nxn= b1
水素の室温大量貯蔵・輸送を実現する多孔性材料の分子ダイナミクスに基づく解明と先導的デザイン
プラズモニック構造付シリコン光検出器のHPC援用設計に関する研究
社会の情報インフラストラクチャとして、高性能コンピュータおよびネットワークの重要性はますます増大しています。本研究室では、コンピュータおよびネットワークの高速化を狙いとする並列・分散情報処理の科学と技術に関する研究に取り組んでいます。効率のよいシステムの実現を目指して、下記の項目を追求しています。 ◇コンピュータアーキテクチャ.
P4 通信システム P4.1 ディジタルフィルタの設計とその応用 P4.2 伝送線路のFDTD解析 P4.2 H4.1 P4.1 H4.1
Poisson Image Editing SIGGRAPH 2003
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(Nlog2N)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似
メモリ使用量の少ないGCR法の提案 東京大学理学部情報科学科 工藤 誠 東京大学情報基盤センター 黒田 久泰
BSPモデルを用いた 並列計算の有用性の検証
理工学部情報学科 情報論理工学研究室 延山 周平
密行列固有値解法の最近の発展 (I) - Multiple Relatively Robust Representation アルゴリズム - 2004年11月26日 名古屋大学 計算理工学専攻 山本有作 日立製作所の山本有作です。 「~」について発表いたします。
情報論理工学 研究室 第1回:並列とは.
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
3 一次関数 1章 一次関数とグラフ §4 方程式とグラフ         (3時間).
MPIを用いた 並列処理 情報論理工学研究室 06‐1‐037‐0246 杉所 拓也.
分散メモリ型並列計算機上での行列演算の並列化
背景 粒子法(SPH・MPSなど)は大規模流体シミュレーションなどで幅広く利用.一方で,手法の数学的正当化(数値解析)が不十分
応用数学 計算理工学専攻 張研究室 山本有作.
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
Presentation transcript:

導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化 jh170053-NAJ 深谷 猛 (北海道大学) 導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化 概要  導電性高分子材料の電子状態計算に現れる連立一次方程式をone-way dissection orderingを用いた行列分 解により解くことを考える。本研究課題では,先行研究(山本,横川 ほか)で開発されたプロトタイプ実装をベー スに,マルチコア(メニーコア)CPU上での性能評価とその結果を踏まえたプログラムの高性能化を主に実施す る。 メンバー構成:深谷 猛(北海道大学),横川 三津夫,熊沢 賢一郎,松崎 継生(神戸大学),山本 有作,工藤 周平(電気通信大学) 導電性高分子材料の電子状態計算に現れる連立一次方程式 1 (行列サイズ:3,594 x 3,594 非ゼロ要素数:41,781 帯幅:29) 高分子の一次元的構造に由来する特徴的な非ゼロ構造 電子状態計算で現れる係数行列の例 ◆ 導電性高分子材料(π共役ポリマー) 電気伝導性を持つ高分子化合物 → ウェアラブルデバイス等への工学的応用 ベンゼン環などに存在するπ電子の移動に由来 → シミュレーションによる電子状態の把握が必要 時間発展シュレーディンガー方程式をCrank-Nicolson法で離散化 高速化の 必要性 同じ行列を係数とする連立一次方程式を繰り返し求解 (参考文献:星健夫 ほか,「高分子上を走る電子の波 〜京スーパーコンピュータで目指す、21 世紀のものづくり〜」,http://main.spsj.or.jp/koho/24p/24p_9.pdf) One-way dissection orderingを用いた行列分解に基づくアプローチ 2 並列に分解可能 置換 並列行列分解の例(コレスキー分解) ※2次元ポアソン方程式を5点中心差分で離散化した場合に現れる行列の場合 ◆ 基本方針(山本,横川 ほか) 係数行列が変化しない → 直接法の活用の可能性 CPUのマルチコア/メニーコア化 → 並列性の確保は必須 one-way dissection orderingを用いた行列分解に基づく手法 分解と求解(前進・後退代入)部分における並列計算が可能 (参考文献:横川三津夫 ほか,「π共役ポリマーの電子状態計算に現れる連立一次方程式の並列解法」,研究会「計算物質科学における時空間アップスケーリングと数理手法」,2016/11/28-29,東京) 現状と今後の計画 3 先行研究の成果: プロトタイプ実装(スレッド並列化)の開 発 テスト問題を用いた簡単な性能評価 ◆ H29年度の具体的な研究計画 プロトタイプ実装に関する詳細な性能評価と課題の発見(深谷) マルチコア(メニーコア)CPU向けのチューニング(深谷) 実問題を考慮したアルゴリズム・実装方法の改良(横川,山本) マルチコア(メニーコア)CPU向けの汎用的な高性能実装技術の調査・評価 (山本,工藤) 利用予定の計算機資源: SR16000(北大),Xeon Broadwell(東大),Xeon Phi KNL(京大) 本研究課題の目的: マルチコアCPUを想定したプログラムの高性能 化 実問題における効果の検証(マルチコアCPU上) 将来的な展望: プロセス並列化(分散並列計算機向け実装) 他のアプリケーションへの応用の検討 実際の時間発展計算における開発プログラムの性能を検証