対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法

Slides:



Advertisements
Similar presentations
1 広島大学 理学研究科 尾崎 裕介 石川 健一. 1. Graphic Processing Unit (GPU) とは? 2. Nvidia CUDA programming model 3. GPU の高速化 4. QCD with CUDA 5. 結果 6. まとめ 2.
Advertisements

大規模な三角 Toeplitz 線形方 程式の高速解法とその応用 ○ 安村 修一(法政大学 4 年) 李 磊(法政大学) 日本応用数理学会「行列・固有値の解法とその応用」研究部会 第6回研究会.
専修大学情報科学センターのパソコンを 使ったグリッドコンピューティング ― SPACE計画 - 森正夫 1 、水崎高浩 1 、内藤豊昭 2 、中村友保 2 及び 専修大学情報科学センター 及び 専修大学情報科学センター 1 専修大学 法学部/自然科学研究所 1 専修大学 法学部/自然科学研究所 2 専修大学.
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
Fill-in LevelつきIC分解による 前処理について
概要 基礎理論 1.応力とひずみおよび平衡方程式 2.降伏条件式 3.構成式(応力-ひずみ関係式)
研究集会 「超大規模行列の数理的諸問題とその高速解法」 2007 年 3 月 7 日 完全パイプライン化シフト QR 法による 実対称三重対角行列の 固有値並列計算 宮田 考史  山本 有作  張 紹良   名古屋大学 大学院工学研究科 計算理工学専攻.
Finger patternのブロック化による 陰的wavelet近似逆行列前処理の 高速化
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
スペクトル法による数値計算の原理 -一次元線形・非線形移流問題の場合-
1 次方程式 直線   と 軸が交わる点 解ける! 解析的に解ける(解析解)   または 厳密に解ける (厳密解)
AllReduce アルゴリズムによる QR 分解の精度について
ソシオン理論における 三者関係のシミュレーション
Korteweg-de Vries 方程式のソリトン解 に関する考察
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
分散遺伝的アルゴリズムによる各種クラスタのベンチマーク
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
大阪工業大学 情報科学部 情報システム学科 宇宙物理研究室 B 木村悠哉
ブロック線図によるシミュレーション ブロック線図の作成と編集 ブロック線図の保存と読込み ブロック線図の印刷 グラフの印刷
PCクラスタ上での 連立一次方程式の解の精度保証
4.2 連立非線形方程式 (1)繰返し法による方法
制約条件の確率的選択に基づく 資源追加削減法の改良 三木 光範(同志社大工) 廣安 知之(同志社大工) ○小林 繁(同志社大院)
応用数理工学特論 第5回 計算理工学専攻 張研究室 山本有作.
応用数理工学特論 線形計算と ハイパフォーマンスコンピューティング
正方行列向け特異値分解の CUDAによる高速化
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
塑性加工の有限要素シミュレーション 豊橋技術科学大学  森 謙一郎 有限要素法の基礎 鍛造,押出し,深絞り加工への応用.
文献名 “Performance Tuning of a CFD Code on the Earth Simulator”
サポートベクターマシン によるパターン認識
第6章 連立方程式モデル ー 計量経済学 ー.
領域分割手法について 2008年2月26日 中島研吾.
応用数理工学特論 第6回 計算理工学専攻 張研究室 山本有作.
ひび割れ面の摩擦接触を考慮した損傷モデル
Level-3 BLASに基づく二重対角化 アルゴリズムとその性能評価
第9章 混合モデルとEM 修士2年 北川直樹.
MPIとOpenMPを用いた Nクイーン問題の並列化
1. MC/UCT アルゴリズムの 並列化に伴う挙動の変化 2. 探索木共有型並列と マスタスレーブ型並列 ― プラットフォームとの関係 ―
HLとEHLモデルでの圧力分布と軸受の変形分布
カオス水車のシミュレーションと その現象解析
応力-ひずみ関係 断面積A,長さLの物体に,(軸)力Pが作用した際,ΔLだけ伸びた(あるいは縮んだ).
知能システム論I(13) 行列の演算と応用(Matrix) 2008.7.8.
エレベータの振動解析 (ロープ・かご) 富山大学 大学院理工学研究部(工学) 木村弘之 台北101国際金融センター.
可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化
FEM勉強会 (第3回).
リングの回転成形の 近似3次元有限要素シミュレーション 塑性加工研究室 平松直登 一般化平面ひずみを用い た近似3次元FEM
目的:高速QR分解ルーチンのGPUクラスタ実装
背景 課題 目的 手法 作業 期待 成果 有限体積法による汎用CFDにおける 流体構造連成解析ソルバーの計算効率の検証
知識科学研究科 知識システム構築論講座 林研究室 佛明 智
金属加工学 “材料に形を与える” 材料プロセス工学専攻 材料加工工学講座 湯川伸樹.
環境モデリングによるモデル検査スクリプトの自動生成
円管の口絞り加工におけるカーリング現象の 有限要素シミュレーション
高精細計算を実現するAMR法フレームワークの高度化 研究背景と研究目的 複数GPU間での袖領域の交換と効率化
第9章 学習アルゴリズムとベイズ決定側 〔3〕最小2乗法とベイズ決定側 発表:2003年7月4日 時田 陽一
パターン認識 ークラスタリングとEMアルゴリズムー 担当:和田 俊和 部屋 A513
対象:せん断補強筋があるRCはり(約75万要素)
原子核物理学 第7講 殻模型.
乗用車用スチールホイールディスクの 多段プレス成形における加工条件の決定
メモリ使用量の少ないGCR法の提案 東京大学理学部情報科学科 工藤 誠 東京大学情報基盤センター 黒田 久泰
表紙 分散遺伝的アルゴリズムのための 新しい交叉法.
BSPモデルを用いた 並列計算の有用性の検証
半正定値計画問題(SDP)の 工学的応用について
軸対称近似を用いたしごきスピニングの 有限要素シミュレーション
大型ホイールのディスク成形における 有限要素シミュレーション 有限要素 シミュレーション 工具と素材形状の最適化 材料の歩留り向上
力覚インタラクションのための 物理ベースモデリング
確率的フィルタリングを用いた アンサンブル学習の統計力学 三好 誠司 岡田 真人 神 戸 高 専 東 大, 理 研
BSPモデルを用いた 最小スパニング木 情報論理工学研究室 02-1-47-134 小林洋亮.
目次 はじめに 収束性理論解析 数値実験 まとめ 特異値計算のための dqds 法 シフトによる収束の加速
分散メモリ型並列計算機上での行列演算の並列化
大規模粒子法による大型クルーズ船の浸水解析
2008年 7月17日 応用数理工学特論 期末発表 鈴木綾華,程飛
Presentation transcript:

対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法 塑性加工研究室 大友勇司 3次元大規模シミュレーション ・計算時間 ・メモリ容量 O 対角マトリックスを用いた剛塑性有限要素法 節点ごとの釣合い式を解く 従来法 3次元大規模問題に適している 計算時間 対角マトリックス法 収束性,並列化効率の向上 節点数

対角マトリックスを用いた3次元剛塑性有限要素法 釣合い式 従来法 非線形連立方程式 [A(v)] {v} = {F} O v = F 1節点あたりの不釣合い節点力 [A(v)]i{v} - {F}i = {DP}i O 速度場の修正ベクトル {v} = {v0}+{Dv}i 対角マトリックス法 O [A(v0)]ii{Dv}i = -{DP0}i Dv = - DP0 3×3 O 計算時間は節点数にほぼ比例

共有メモリ型ワークステーションによる並列計算 CPU 1 CPU 2 メモリ ・[B]の計算 65.7% 34.1% サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i  の計算 並列 計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 不釣合い応力? Alpha Server 全ステップ? CPU : 731MHz×16

並列計算におけるCPUの振分け CPU 1 CPU 2 (a) 領域 (b) 節点 負荷バランス ; 困難 容易 対角マトリックス

非線形性の間欠更新による収束性の向上 非線形連立方程式 [A(v)]ii {Dv}i = {DP}i [A]=∫[B] [D][B]dV T サブルーチン1 繰返し2 ・{DP0}i の計算 ・釣合い式[A]ii{Dv}i={DP}iの計算 線形 繰返し1 全節点? 解 間欠数ni? サブルーチン2 ・加速係数 a の計算 ・[D]の計算 ・不釣合い節点応力の計算 非線形 初期値 v0 繰返し3 不釣合い応力? 繰返し4 全ステップ?

15 3 10 2 5 1 5 10 20 30 40 50 間欠数の影響 1CPU 計算時間 /ksec 繰返し数 /k 傾斜工具によるすえ込み加工 15 3 x y z 30 ° 10 2 繰返し数 繰返し数 /k 計算時間 /ksec 5 1 計算時間 5 10 20 30 40 50 1/8 対称モデル 間欠数 ni

4 3 2 1 1 2 3 4 並列計算におけるスピードアップ率 スピードアップ率 スピードアップ率 t1 = tn CPU数 ni=5 理想 スピードアップ率 1 t1 スピードアップ率 2 = tn 1 1 2 3 4 CPU数

10 10 10 10 10 10 10 10 10 10 10 10 10 総計算時間と要素数の関係 従来法は約2乗に比例 7 1CPU: a=0.045 10 6 2CPU: a=0.028 10 5 4CPU: a=0.019 総計算時間 T /sec 4 10 10 3 1.46 T=aN 10 2 10 1 1.25×105 10 10 2 10 3 10 4 10 5 10 6 要素数 N

メモリサイズと要素数の関係 従来法は約2乗に比例 400 300 M=0.0028N メモリサイズ M /Mbytes 200 100 50 1.00 M=0.0028N メモリサイズ M /Mbytes 200 100 50 100 125 150 要素数 N /k

クランクシャフト3次元鍛造加工の並列計算 4 理想 3 スピードアップ率 2 1 1 2 3 4 CPU数

分散メモリ型PCクラスタによる並列計算 PCクラスタ メモリ 1 メモリ 2 CPU 1 CPU 2 CPU 1 CPU 2 ・[B]の計算 データ転送 サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i  の計算 並列 計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 並列 計算 不釣合い応力? PCクラスタ CPU : 2.4GHz×4 ネットワーク:100Mbps 全ステップ?

領域分割による並列計算 1 2 3 4 CPU数 スピードアップ率 1 2 3 4 0.5 1.0 1.5 CPU数 総繰返し数 /k CPU数 スピードアップ率 理想 1 2 3 4 0.5 1.0 1.5 CPU数 総繰返し数 /k CPU 2 CPU 1

非線形性の間欠更新により解の収束性,並列化効率 を向上させた まとめ 対角マトリックスを用いた3次元剛塑性有限要素法に おいて並列計算を行い,計算時間の低減を図った 共有メモリ型ワークステーション 非線形性の間欠更新により解の収束性,並列化効率 を向上させた 並列計算により更に大規模な問題も計算可能となった 分散メモリ型PCクラスタ 領域分割による並列計算では収束性が低下した