可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化

Slides:



Advertisements
Similar presentations
核融合研究グリッドへ向けたITBLの適用
Advertisements

Webプロキシサーバにおける 動的資源管理方式の提案と実装
計算理工学基礎 「ハイパフォーマンスコンピューティングの基礎」
動画像品質調整機能を組み込んだ プロキシキャッシングシステムの 実装と評価
北大における Super-SINET 接続と利用: 2004 年度報告
PCクラスタにおける2個体分散遺伝的アルゴリズムの高速化
スケールフリーネットワークにおける 経路制御のためのフラッディング手法の提案と評価
インターネットにおける オーケストラ演奏同期機構の 設計と実装
報告 (2006/9/6) 高橋 慧.
対角マトリックスを用いた3次元剛塑性有限要素法の並列計算 対角マトリックスを用いた剛塑性有限要素法
神奈川大学大学院工学研究科 電気電子情報工学専攻
P,Q比が変更可能なScaLAPACKの コスト見積もり関数の開発
データベースとストレージ の最新動向 12.MAR.2015.
クロストーク成分の相互相関に 着目した音場再生システム
各種PC クラスタの性能評価 同志社大学 工学部 廣安 知之 三木 光範 谷村 勇輔.
多数の遊休PC上での 分散ゲーム木探索 導入 ゲーム木探索 ⇒遊休PCを利用して高速化 例)コンピュータ将棋における次手の計算
異種センサを用いた人の行動検知 研究概要 研究の独自性 isi担当 高汐グループ成果 スライド到着待ち yasu担当.
大きな仮想マシンの 複数ホストへのマイグレーション
デバイスからの異常注入が指定可能なCPUエミュレータ
ネットワーク性能に合わせた 分散遺伝的アルゴリズムにおける 最適な移住についての検討
MPIによる行列積計算 情報論理工学研究室 渡邉伊織 情報論理工学研究室 渡邉伊織です。
京都大学大学院医学研究科 画像応用治療学・放射線腫瘍学 石原 佳知
研究背景 研究目的 手法 研究計画 分散型プラズマアクチュエータと物体形状の統合最適設計による 仮想空力形状の実現 jh NAH
研究背景・目的 研究組織 実施内容 適用手法 提案研究により期待されること
高速CFDコードを用いた次世代空力応用研究プラットフォーム構築に 向けた実証研究
過負荷時の分散ソフトウェアの 性能劣化を改善する スケジューリングの提案
COTTRIボードの通信テストについて 頼俊 12/28.
計算機実験の計画 References 研究目的 囲碁・将棋での強化学習 高信頼性人工知能システムへの展望 大規模な強化学習技術の実証と応用
ひび割れ面の摩擦接触を考慮した損傷モデル
AMR法フレームワークの様々なアーキテクチャへ向けた発展 研究背景と研究目的 Xeon Phi対応に向けた拡張
電磁流体力学乱流の高精度・高並列LESシミュレーションコード開発研究
Jh ISJ 渡場 康弘 (大阪大学) Software-Defined IT インフラストラクチャにおける オーケストレーションに向けた資源管理システム 背景 Information-as-a-Service (InfaaS): 災害管理(Disaster Management)を支援するアプリケーション基盤を実現する上で重要なコンセプト.
IaaS型クラウドにおける インスタンス構成の動的最適化手法
リモートホストの異常を検知するための GPUとの直接通信機構
モデルの逆解析 明治大学 理工学部 応用化学科 データ化学工学研究室 金子 弘昌.
Jh NAHI 横田 理央 (東京工業大学) Hierarchical low-rank approximation methods on distributed memory and GPUs 背景  H行列、H2行列、HSS行列などの階層的低ランク近似法はO(N2)の要素を持つ密行列をO(N)の要素を持つ行列に圧縮することができる。圧縮された行列を用いることで、行列積、LU分解、固有値計算をO(NlogN)で行うことができるため、従来密行列の解法が用いられてきた分野では階層的低ランク近似法
実行時情報に基づく OSカーネルのコンフィグ最小化
仮想メモリを用いた VMマイグレーションの高速化
複数ホストに分割されたメモリを用いる仮想マシンの監視機構
HPC基盤における大量データ転送のためのデータ転送ツールの評価
仮想計算機を用いたサーバ統合に おける高速なリブートリカバリ
アンテナ最適化技術と電波伝搬シミュレーション技術の高速化と高精度化
ネットワークの性能 牧野ゼミ3年 足立龍哉.
進化的計算手法の並列計算機への実装 三木 光範
オープンソース開発支援のための リビジョン情報と電子メールの検索システム
実行時情報を用いて通信を最適化するPCクラスタ上の並列化コンパイラ
導電性高分子材料の電子状態計算に現れる連立一次方程式に対する 並列直接解法の高性能化
東京工業大学 情報理工学研究科 数理・計算科学専攻 千葉研究室 栗田 亮
航空エンジンの翼列周り流れ解析のメニーコアシステム向け最適化
未使用メモリに着目した 複数ホストにまたがる 仮想マシンの高速化
複数ホストにまたがって動作する仮想マシンの障害対策
目的:高速QR分解ルーチンのGPUクラスタ実装
研究背景と目的 局面対による学習の高速化 学習器の説明 今後 大規模な強化学習技術の実証と応用 一方で、 強化学習手法の台頭
各種プログラム、検索サーバー、鍵サーバーのご利用 クライアントサイド暗号などセキュリティの評価
岩澤全規 理化学研究所 計算科学研究機構 粒子系シミュレータ研究チーム 2015年7月22日 AICS/FOCUS共催 FDPS講習会
研究背景・目的 研究組織 実施内容 適用手法 提案研究により期待されること
高精細計算を実現するAMR法フレームワークの高度化 研究背景と研究目的 複数GPU間での袖領域の交換と効率化
低剛性・高慣性比の二慣性系の 外乱抑制制御問題に対して 任意の制御性能を達成する 不安定な補償器
対象:せん断補強筋があるRCはり(約75万要素)
Cソースコード解析による ハード/ソフト最適分割システムの構築
計算機アーキテクチャ1 (計算機構成論(再)) 第二回 命令の種類と形式
東京都心1m解像度10km四方気流計算の可視化
MPIを用いた並列処理計算 情報論理工学研究室 金久 英之
格子ボルツマン法によるリアルタイム物質拡散シミュレーション手法の開発
IPmigrate:複数ホストに分割されたVMの マイグレーション手法
複数ホストにまたがるVMの メモリ使用状況に着目した高速化
SD-WAN-インターネットブレイクアウト-
核融合プラズマ研究のための超並列粒子シミュレーションコード開発と その可視化
大規模粒子法による大型クルーズ船の浸水解析
第8章 データベースシステムの発展 8.1 オブジェクトリレーショナルデータベース 8.2 分散データベース 8.3 インターネットとデータベース.
Presentation transcript:

可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化 jh180076-NWH 河村 拓馬 (国立研究開発法人 日本原子力研究開発機構) 可視化用粒子データを用いたIn−Situ可視化システムのSIMD最適化 大規模シミュレーションと可視化 計算性能とストレージ性能のギャップが増大し、 ストレージに対する計算結果の“シミュレーション ソルバによる書き出し”・“可視化プログラムによ る読み込み”が I/Oボトルネック として顕在化し た。その結果、従来可視化手法の適用が困難に なり、新しい In-Situ可視化 が注目されている。 In-Situ可視化の課題 可視化処理のコスト(計算領域再構成やデータ探索に伴う大域的通信)がシミュレーション処理のコストを圧迫 バッチ処理投入前に視点位置、色、不透明度等の可視化パラメータを設定するため、可視化の失敗が頻発 シミュレーションリアリティの増加に対応できる、多変量向けの可視化技術が必要 In-Situ PBVR スーパーコンピュータ クライアント(PC) Particle-Based Volume Rendering [1] 可視化パラメータ ビューワ シミュレーションコード(数10TB,コスト90%>) インターネット経由の 遠隔In-Situ可視化 可視化パラメータ 粒子計算モジュール (数10MB,コスト<10%) In-Situ可視化 デーモン In-Situ可視化 クライアント 粒子データ 可視化パラメータ ファイルの更新 可視化用粒子データ 粒子データ集約 領域分割形状を変更することなく並列化 対話的制御機構と自由な視点変更 数式処理による変数と伝達関数の合成 ストレージ 前年度 In−Situ PBVR を開発し、Oakforest-PACS に移植した。性能測定の結果、可視化コストを計 算コストの10%以下に抑え、シミュレーション性能を圧迫しない強スケーリング性能を達成し た。粒子データの集約は3456ファイルでも3.4秒であり、ソルバの計算時間に隠蔽される。 30Mbpsのインターネットを介して粒子データを約7秒で転送、PC上で約10fpsの対話的速度 で可視化し、バッチ処理されるシミュレーションの実時間解析を可能にした。[2] しかし数式処理がボトルネックとなりKNLの性能を十分に引き出すことができず、ソルバが KNL向けに最適化された際に処理速度が不足すると考えられる。 Oakforest-PACSでの性能 本年度の研究目的 SIMD並列化可能な、数式処理アルゴリズムを構 築し、Xeon PhiおよびFX100上での最適化を実施 する。開発システムをCPUやXeonPhiアーキテク チャに最適化された燃料溶融複雑系シミュレーシ ョンJupiterコード[3]および木星磁気圏MHDコード [4]に適用し、シミュレーションの性能を劣化させ ること無く対話的な大規模可視化が可能なことを 実証する。 [1] T. Kawamura, N. Sakamoto, K. Koyamada, J. of Visualization, 2010. [2] T. Kawamura, T. Noda, Y. Idomura, J. of Superfri, 2017. [3] S. Yamashita, H. Yoshida, K. Takase, ICONE-21, 2013. [4] K. Fukazawa, T. Nanri, T. Umeda, CSE, 2014.