対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法 塑性加工研究室 大友勇司 3次元大規模シミュレーション ・計算時間 ・メモリ容量 O 対角マトリックスを用いた剛塑性有限要素法 節点ごとの釣合い式を解く 従来法 3次元大規模問題に適している 計算時間 対角マトリックス法 収束性,並列化効率の向上 節点数
対角マトリックスを用いた3次元剛塑性有限要素法 釣合い式 従来法 非線形連立方程式 [A(v)] {v} = {F} O v = F 1節点あたりの不釣合い節点力 [A(v)]i{v} - {F}i = {DP}i O 速度場の修正ベクトル {v} = {v0}+{Dv}i 対角マトリックス法 O [A(v0)]ii{Dv}i = -{DP0}i Dv = - DP0 3×3 O 計算時間は節点数にほぼ比例
共有メモリ型ワークステーションによる並列計算 CPU 1 CPU 2 メモリ ・[B]の計算 65.7% 34.1% サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 並列 計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 不釣合い応力? Alpha Server 全ステップ? CPU : 731MHz×16
並列計算におけるCPUの振分け CPU 1 CPU 2 (a) 領域 (b) 節点 負荷バランス ; 困難 容易 対角マトリックス
非線形性の間欠更新による収束性の向上 非線形連立方程式 [A(v)]ii {Dv}i = {DP}i [A]=∫[B] [D][B]dV T サブルーチン1 繰返し2 ・{DP0}i の計算 ・釣合い式[A]ii{Dv}i={DP}iの計算 線形 繰返し1 全節点? 解 間欠数ni? サブルーチン2 ・加速係数 a の計算 ・[D]の計算 ・不釣合い節点応力の計算 非線形 初期値 v0 繰返し3 不釣合い応力? 繰返し4 全ステップ?
15 3 10 2 5 1 5 10 20 30 40 50 間欠数の影響 1CPU 計算時間 /ksec 繰返し数 /k 傾斜工具によるすえ込み加工 15 3 x y z 30 ° 10 2 繰返し数 繰返し数 /k 計算時間 /ksec 5 1 計算時間 5 10 20 30 40 50 1/8 対称モデル 間欠数 ni
4 3 2 1 1 2 3 4 並列計算におけるスピードアップ率 スピードアップ率 スピードアップ率 t1 = tn CPU数 ni=5 理想 スピードアップ率 1 t1 スピードアップ率 2 = tn 1 1 2 3 4 CPU数
10 10 10 10 10 10 10 10 10 10 10 10 10 総計算時間と要素数の関係 従来法は約2乗に比例 7 1CPU: a=0.045 10 6 2CPU: a=0.028 10 5 4CPU: a=0.019 総計算時間 T /sec 4 10 10 3 1.46 T=aN 10 2 10 1 1.25×105 10 10 2 10 3 10 4 10 5 10 6 要素数 N
メモリサイズと要素数の関係 従来法は約2乗に比例 400 300 M=0.0028N メモリサイズ M /Mbytes 200 100 50 1.00 M=0.0028N メモリサイズ M /Mbytes 200 100 50 100 125 150 要素数 N /k
クランクシャフト3次元鍛造加工の並列計算 4 理想 3 スピードアップ率 2 1 1 2 3 4 CPU数
分散メモリ型PCクラスタによる並列計算 PCクラスタ メモリ 1 メモリ 2 CPU 1 CPU 2 CPU 1 CPU 2 ・[B]の計算 データ転送 サブルーチン 1 サブルーチン 1 ・{DP0}iの計算 ・釣合い式[A]ii{Dv}i={DP}i の計算 並列 計算 CPU 1 CPU 2 全節点? 全節点? サブルーチン 2 サブルーチン 2 ・加速係数a の計算 ・[D]の計算 ・不釣合い応力の計算 並列 計算 不釣合い応力? PCクラスタ CPU : 2.4GHz×4 ネットワーク:100Mbps 全ステップ?
領域分割による並列計算 1 2 3 4 CPU数 スピードアップ率 1 2 3 4 0.5 1.0 1.5 CPU数 総繰返し数 /k CPU数 スピードアップ率 理想 1 2 3 4 0.5 1.0 1.5 CPU数 総繰返し数 /k CPU 2 CPU 1
非線形性の間欠更新により解の収束性,並列化効率 を向上させた まとめ 対角マトリックスを用いた3次元剛塑性有限要素法に おいて並列計算を行い,計算時間の低減を図った 共有メモリ型ワークステーション 非線形性の間欠更新により解の収束性,並列化効率 を向上させた 並列計算により更に大規模な問題も計算可能となった 分散メモリ型PCクラスタ 領域分割による並列計算では収束性が低下した